اساسيات BigQuery الاولي

عامل ايه يا كتكوت يا اخويا ♥️🐤كلت كنافة بالبستاشيو ولا لسه

امبارح فهمنا ليه BigQuery مهم وازاي هنستخدمه والنهاردة هنحط الاساس اللي هنبني عليه ونتعرف عليه واحدة واحدة هنفهم ازاي BigQuery بيشتغل وإيه هي المكونات الرئيسة اللي لازم نعرفها قبل ما نبدا نستخدمه لحد منوصل اننا ندلعه ونقول عليه BQ زي بنقول علي GA4 🐥

🐤 أول حاجة … BigQuery عبارة عن إيه اصلا؟

ال BigQuery هو Database قوي جدا وسحابي تابع لـ Google

فكر فيه كأنه Google Sheets بس على استرويدات يعني جوجل شيت بقوة خارقة بس بدل ما تتعامل مع ملفات Excel بتتعامل مع جداول وقواعد بيانات ضخمة تقدر تربطها ببعض وتستخرج منها معلومات بشكل متقدم جدا باستخدام SQL ميقدرش GA4 يعملها ولا انت تقدر تحصل عليها بالسرعة اللي هتاخدها من BQ

دلوقتي خلينا نفهم اول اهم 4 مكونات أساسية في BigQuery:

1️⃣ ال Project 🏗️

اي حاجة بتعملها في BigQuery لازم تكون جوه (Project) والـ Project بيكون هو المكان اللي بيضم كل الـ Datasets والجداول اللي بتشتغل عليها لما تفتح Google Cloud Console لأول مرة هتلاقي لازم تختار او تعمل Project جديد

✅ ازاي نعمل Project جديد؟

بنفتح Google Cloud Console ونسجل حسابنا عليه ومن التلت شرط اللي علي الشمال بتنزل تحت تختار bigquery

وياما بتلاقي جوجل مجهز بروجكت اتوماتيك افتراضي كا اول بروجكت او بتدوس على My first project دي وبعدين تختار تعمل New Project

وقول هنسميه مثلا: ads_analysis_project وندوس Create ونستنى البروجكت يتعمل

🐣 البروجكت ده هو اللي هيضم كل الداتا اللي هنشتغل عليها للبراند x

2️⃣ ال Dataset – المكان اللي بنحفظ فيه الجداول 📂

في واجهة BigQuery خانة الاكسبلور اللي عالشمال شايفها؟ 🐤 في تلت نقط جمب اسم البروجكت كده دوس عليهم

جوه كل Project لازم يكون عندك Dataset وهو أشبه بـ Folder بيضم الجداول بتاعتك جواه وكل الداتا بتتحفظ جوه Dataset معين وده بيخليك تنظم الداتا صح وتبعد عن العشوائية

سمي ال Dataset وسيب باقي الإعدادات زي ما هي واضغط Create Dataset

دلوقتي عندنا Dataset جاهزة هنحفظ فيه كل الجداول اللي هنشتغل عليها

3️⃣ ال Table – الجداول اللي فيها البيانات 📊

شوفت ال dataset اللي عملناها نورت ازاي تحت البروجكت؟ فيه جنب ال dataset تلت نقط هي كمان دوس عليهم هتلاقي اوبشن انك تعمل Table دوس عليه خلينا نشوف ال Table ده 🐤

كل Dataset بيكون جواها جداول Tables وكل Table فيه بيانات متقسمة على أعمدة (Columns) وصفوف (Rows) بتتسمي schema 🐥

اهو أي بيانات هنرفعها على BigQuery سواء من CSV أو من API هتتحول لجداول جوه الـ Dataset

خليني اوضح بمثال على Table ممكن يكون عندنا:

📌 جدول اسمه facebook_ads_data فيه بيانات كامبينز لفيسبوك بالشكل ده:

campaign_id = 123456

campaign_name = Ramadan

spend = 500

clicks = 1200

impressions = 50,000

conversions = 30

revenue = 1500

🚀 كل CSV هنرفعه او Api هنعمله في BigQuery هيكون جوا BigQuery على شكل جداول زي دي

4️⃣ ال Schema – هيكلة البيانات اللي جوا ال Table 🏗️

ال Schema هو مجرد تعريف بس للداتا اللي جوه كل Table وبيحدد نوع الداتا اللي بيستقبلها طبعا هنتعامل api وهنثبت مكتبات علي google colab تخص BigQuery مش هتحتاج اكيد تعمل الداتا دي بشكل يدوي بس انا مهتم افهمهالك كده عشان مهم جدا تفهم أنواع الداتا دي برضو عشان تشتغل صح من البداية وتكون جاهزة في ال mindset عندك

أنواع البيانات الأساسية في BigQuery:

ال STRING وده بيتعامل مع نصوص حروف وارقام

فتلاقي BQ بيقسم الداتا اللي زي campaign_name, ad_set_name من اي CSV بترفعه كا STRING

ال INTEGER وده بيتعامل مع الارقام الصحيحة بس

فتلاقي BQ بيقسم الداتا اللي زي clicks, impressions, conversions من اي CSV بترفعه كا INTEGER

ال FLOAT وده بيتعامل مع الارقام اللي فيها كسور عشرية

فتلاقي BQ بيقسم الداتا اللي زي spend, revenue, ctr من اي CSV بترفعه كا FLOAT

لو قررت تتعامل ب CSV بس ومجرد انك ترفع CSV لداتا حملات فيسبوك مثلا خلال مدة معينة لازم تكون عارف انواع الداتا دي عشان لو رفعت الملف وفي اي خطأ في الاعمدة تختار نوع الداتا بتاعه مظبوط

✅ مثال على Schema لجدول حملات الفيسبوك:

campaign_id

STRING

لأنه مجرد ID

campaign_name

STRING

لأنه نص

spend

FLOAT

لأنه قيمة مالية ممكن يكون فيها كسور

clicks

INTEGER

لأنه عدد صحيح

impressions

INTEGER

لأنه عدد صحيح

conversions

INTEGER

لأنه عدد صحيح

revenue

FLOAT

لأنه قيمة مالية بكسور

وهكذا

لو فهمت الـ Schema كويس قدام هتعرف تبني Queries مظبوطة من غير مشاكل

خلاصة انهاردا :

✅ ان ال BigQuery بيتكون من Projects, Datasets, Tables, و Schema

✅ ال Project هو المكان الرئيسي اللي بيتخزن فيه كل حاجة

✅ ال Dataset هو الفولدر اللي بيضم ال Tables اللي فيها الداتا

✅ ال Table هو المكان اللي بيتخزن فيه الداتا بشكل منظم

✅ ال Schema هي بتحدد أنواع الداتا اللي BQ بيستقبلها وده مهم عشان زي مقلت التحليل يكون دقيق قدام وميحصلش Error في داشبورد المستقبل اللي حطينا فيها اول طوبة انهاردا ♥️🐤

بكرا نبدأ نكلم بقا علي رفع اول داتا جوا BigQuery واللي هتكون مبدئيا باستخدام CSV … عشان انا هفضل ماشي تاتا تاتا كده في ال simple منه عشان مفيش حد يحس بتعقيد المهم بس الكتكوت اخويا جاهز ولا إيه؟ ♥️🐥

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *