عامل ايه يا كتكوت يا اخويا كلت كنافة بالبستاشيو ولا لسه
امبارح فهمنا ليه BigQuery مهم وازاي هنستخدمه والنهاردة هنحط الاساس اللي هنبني عليه ونتعرف عليه واحدة واحدة هنفهم ازاي BigQuery بيشتغل وإيه هي المكونات الرئيسة اللي لازم نعرفها قبل ما نبدا نستخدمه لحد منوصل اننا ندلعه ونقول عليه BQ زي بنقول علي GA4
أول حاجة … BigQuery عبارة عن إيه اصلا؟
ال BigQuery هو Database قوي جدا وسحابي تابع لـ Google
فكر فيه كأنه Google Sheets بس على استرويدات يعني جوجل شيت بقوة خارقة بس بدل ما تتعامل مع ملفات Excel بتتعامل مع جداول وقواعد بيانات ضخمة تقدر تربطها ببعض وتستخرج منها معلومات بشكل متقدم جدا باستخدام SQL ميقدرش GA4 يعملها ولا انت تقدر تحصل عليها بالسرعة اللي هتاخدها من BQ
دلوقتي خلينا نفهم اول اهم 4 مكونات أساسية في BigQuery:
ال Project
اي حاجة بتعملها في BigQuery لازم تكون جوه (Project) والـ Project بيكون هو المكان اللي بيضم كل الـ Datasets والجداول اللي بتشتغل عليها لما تفتح Google Cloud Console لأول مرة هتلاقي لازم تختار او تعمل Project جديد

ازاي نعمل Project جديد؟
بنفتح Google Cloud Console ونسجل حسابنا عليه ومن التلت شرط اللي علي الشمال بتنزل تحت تختار bigquery

وياما بتلاقي جوجل مجهز بروجكت اتوماتيك افتراضي كا اول بروجكت او بتدوس على My first project دي وبعدين تختار تعمل New Project
وقول هنسميه مثلا: ads_analysis_project وندوس Create ونستنى البروجكت يتعمل
البروجكت ده هو اللي هيضم كل الداتا اللي هنشتغل عليها للبراند x
ال Dataset – المكان اللي بنحفظ فيه الجداول
في واجهة BigQuery خانة الاكسبلور اللي عالشمال شايفها؟ في تلت نقط جمب اسم البروجكت كده دوس عليهم

جوه كل Project لازم يكون عندك Dataset وهو أشبه بـ Folder بيضم الجداول بتاعتك جواه وكل الداتا بتتحفظ جوه Dataset معين وده بيخليك تنظم الداتا صح وتبعد عن العشوائية
سمي ال Dataset وسيب باقي الإعدادات زي ما هي واضغط Create Dataset

دلوقتي عندنا Dataset جاهزة هنحفظ فيه كل الجداول اللي هنشتغل عليها
ال Table – الجداول اللي فيها البيانات
شوفت ال dataset اللي عملناها نورت ازاي تحت البروجكت؟ فيه جنب ال dataset تلت نقط هي كمان دوس عليهم هتلاقي اوبشن انك تعمل Table دوس عليه خلينا نشوف ال Table ده

كل Dataset بيكون جواها جداول Tables وكل Table فيه بيانات متقسمة على أعمدة (Columns) وصفوف (Rows) بتتسمي schema
اهو أي بيانات هنرفعها على BigQuery سواء من CSV أو من API هتتحول لجداول جوه الـ Dataset
خليني اوضح بمثال على Table ممكن يكون عندنا:
جدول اسمه facebook_ads_data فيه بيانات كامبينز لفيسبوك بالشكل ده:
campaign_id = 123456
campaign_name = Ramadan
spend = 500
clicks = 1200
impressions = 50,000
conversions = 30
revenue = 1500
كل CSV هنرفعه او Api هنعمله في BigQuery هيكون جوا BigQuery على شكل جداول زي دي
ال Schema – هيكلة البيانات اللي جوا ال Table
ال Schema هو مجرد تعريف بس للداتا اللي جوه كل Table وبيحدد نوع الداتا اللي بيستقبلها طبعا هنتعامل api وهنثبت مكتبات علي google colab تخص BigQuery مش هتحتاج اكيد تعمل الداتا دي بشكل يدوي بس انا مهتم افهمهالك كده عشان مهم جدا تفهم أنواع الداتا دي برضو عشان تشتغل صح من البداية وتكون جاهزة في ال mindset عندك

أنواع البيانات الأساسية في BigQuery:
ال STRING وده بيتعامل مع نصوص حروف وارقام
فتلاقي BQ بيقسم الداتا اللي زي campaign_name, ad_set_name من اي CSV بترفعه كا STRING
ال INTEGER وده بيتعامل مع الارقام الصحيحة بس
فتلاقي BQ بيقسم الداتا اللي زي clicks, impressions, conversions من اي CSV بترفعه كا INTEGER
ال FLOAT وده بيتعامل مع الارقام اللي فيها كسور عشرية
فتلاقي BQ بيقسم الداتا اللي زي spend, revenue, ctr من اي CSV بترفعه كا FLOAT
لو قررت تتعامل ب CSV بس ومجرد انك ترفع CSV لداتا حملات فيسبوك مثلا خلال مدة معينة لازم تكون عارف انواع الداتا دي عشان لو رفعت الملف وفي اي خطأ في الاعمدة تختار نوع الداتا بتاعه مظبوط

مثال على Schema لجدول حملات الفيسبوك:
campaign_id
STRING
لأنه مجرد ID
campaign_name
STRING
لأنه نص
spend
FLOAT
لأنه قيمة مالية ممكن يكون فيها كسور
clicks
INTEGER
لأنه عدد صحيح
impressions
INTEGER
لأنه عدد صحيح
conversions
INTEGER
لأنه عدد صحيح
revenue
FLOAT
لأنه قيمة مالية بكسور
وهكذا
لو فهمت الـ Schema كويس قدام هتعرف تبني Queries مظبوطة من غير مشاكل
خلاصة انهاردا :
ان ال BigQuery بيتكون من Projects, Datasets, Tables, و Schema
ال Project هو المكان الرئيسي اللي بيتخزن فيه كل حاجة
ال Dataset هو الفولدر اللي بيضم ال Tables اللي فيها الداتا
ال Table هو المكان اللي بيتخزن فيه الداتا بشكل منظم
ال Schema هي بتحدد أنواع الداتا اللي BQ بيستقبلها وده مهم عشان زي مقلت التحليل يكون دقيق قدام وميحصلش Error في داشبورد المستقبل اللي حطينا فيها اول طوبة انهاردا
بكرا نبدأ نكلم بقا علي رفع اول داتا جوا BigQuery واللي هتكون مبدئيا باستخدام CSV … عشان انا هفضل ماشي تاتا تاتا كده في ال simple منه عشان مفيش حد يحس بتعقيد المهم بس الكتكوت اخويا جاهز ولا إيه؟
اترك تعليقاً