دليل كامل لنمذجة الأبعاد

By |2022-01-12T07:52:23+00:00فبراير شنومكست، شنومكس|

تتضمن النمذجة الأبعاد استخدام جداول الحقائق والأبعاد للاحتفاظ بسجل للبيانات التاريخية في مستودعات البيانات. تم تحسين أنواع مختلفة من تقنيات نمذجة البيانات لتطبيقات مختلفة. تم تصميم نماذج علاقة الكيانات المُطابقة (نماذج التقارير الإلكترونية) للتخلص من تكرار البيانات وتنفيذ عمليات الإدراج والتحديث والحذف بسرعة ، والحصول على البيانات داخل قاعدة البيانات.

على النقيض من ذلك ، فإن النماذج ذات الأبعاد أو نماذج kimball الأبعاد - نماذج البيانات القائمة على التقنية التي قدمها Ralph Kimball - هي هياكل غير منسقة مصممة لاسترداد البيانات من مستودع البيانات. تم تحسينها لأداء اختار التشغيل ويتم استخدامها في إطار التصميم الأساسي لبناء مستودعات بيانات وظيفية ومحسّنة للغاية.

في هذه المقالة سوف نغطي أساسيات النمذجة ذات الأبعاد والمفاهيم المتعلقة بها. سنناقش أيضًا الأدوات المختلفة وطرق التنفيذ لتصميم نماذج بيانات الأبعاد بنجاح.

فوائد النمذجة الأبعاد

لا تزال النمذجة الأبعاد هي أكثر تقنيات نمذجة البيانات شيوعًا لتصميم مستودعات بيانات المؤسسة بسبب الفوائد التي تنتجها. وتشمل هذه:

استرجاع أسرع للبيانات

تدمج النمذجة الأبعاد الجداول في النموذج نفسه ، مما يمكّن المستخدمين من استرداد البيانات بشكل أسرع من مصادر البيانات المختلفة عن طريق تشغيل استعلامات الصلة. تم تحسين المخطط غير المنسق لمستودع بيانات نموذج الأبعاد لتشغيل استعلامات مخصصة. نتيجة لذلك ، فإنه يكمل إلى حد كبير أهداف ذكاء الأعمال (BI) للمؤسسة.

فهم أفضل لعمليات الأعمال

تستند مبادئ النمذجة الأبعاد إلى جداول الحقائق والأبعاد. سنغطي الحقائق والأبعاد الموجودة في الأقسام التالية. يقدم هذا التصنيف للبيانات إلى حقائق وأبعاد ، وهيكل علاقة الكيان لنموذج الأبعاد ، عمليات تجارية معقدة بطريقة سهلة الفهم للمحللين.

مرن للتغيير

إطار عمل النمذجة الأبعاد يجعل عملية تخزين البيانات قابلة للتوسيع. يمكن تعديل التصميم بسهولة لدمج أي متطلبات عمل جديدة أو إجراء أي تعديلات على المستودع المركزي. يمكن إضافة كيانات جديدة في النموذج أو يمكن تغيير تخطيط الكيانات الحالية لتعكس عمليات الأعمال المعدلة.

عناصر نموذج بيانات الأبعاد

جداول الحقائق أو إجراءات العمل

تخزن جداول البيانات الفعلية المعلومات الرقمية حول مقاييس العمل والمفاتيح الخارجية لجداول الأبعاد. يمكن أن تكون الحقائق التجارية مضافة أو شبه مضافة أو غير مضافة. يوضح الجدول 1 الأنواع الثلاثة لجداول الحقائق.

نوع الحقائق الوصف
حقائق مضافة مقاييس الأعمال التي يمكن تجميعها عبر جميع الأبعاد
حقائق شبه مضافة مقاييس الأعمال التي يمكن تجميعها عبر بعض الأبعاد وليس عبر أخرى (عادةً أبعاد التاريخ والوقت)
حقائق غير مضافة مقاييس الأعمال التي لا يمكن تجميعها عبر أي بُعد

الجدول 1: أنواع الحقائق في جدول الحقائق

شرح أنواع الحقائق بمثال

يحتفظ متجر الملابس بالبيانات التالية لمعاملة المبيعات:

التاريخ موقع المتجر نوع المنتج الكمية سعر الوحدة حجم المبيعات المخزون ضريبة المبيعات
6 / 3 / 2018 CA نايلون 5 100 500 30 7.75%
6 / 3 / 2018 CA بوليستر 7 250 1750 50 7.75%
6 / 3 / 2018 PA نايلون 6 100 600 65 6.00%
6 / 3 / 2018 PA بوليستر 3 250 750 25 6.00%
6 / 4 / 2018 CA نايلون 7 100 700 36 7.75%
6 / 4 / 2018 CA بوليستر 6 250 1500 17 7.75%
/ 4 / 2018 PA نايلون 9 100 900 14 6.00%
6 / 4 / 2018 PA بوليستر 10 250 2500 20 6.00%

الجدول 2: جدول المعاملات الذي يحتفظ به متجر ملابس

الأعمدة التي تحتوي على معلومات رقمية حول عملية الأعمال هي حقائق أعمالنا. في هذا المثال، الكمية , سعر الوحدة, حجم المبيعات, المخزونو ضريبة المبيعات هي حقائق. وباقي الكيانات (التاريخ, المتجرو نوع المنتج) أبعاد.

حجم المبيعات يمكن إضافتها عبر جميع الأبعاد وبالتالي فهي حقيقة مضافة. علاوة على ذلك ، مضيفا المخزون عبر المعلومات المتجر يوفر البعد معلومات تجارية مفيدة ولكن نظرًا لأن هذه مجرد لقطة كمية البضائع في نقطة معينة ، فإن إضافتها عبر التاريخ البعد لا يعطي أي رؤى تجارية مفيدة. منذ المخزون مضافة عبر بعض الأبعاد وغير مضافة عبر البعض الآخر ، إنها حقيقة شبه مضافة. فكر الآن ضريبة المبيعات. مضيفا ضريبة المبيعات عبر أي بُعد سيثير مشاكل أثناء المعالجة التحليلية. ضريبة المبيعات هي ، بالتالي ، حقيقة غير مضافة.

جداول الأبعاد

تخزن جداول الأبعاد معلومات وصفية حول حقائق العمل للمساعدة في فهم البيانات وتحليلها بشكل أفضل. في المثال المعروض في الجدول 2 ، التاريخ, موقع المتجرو نوع المنتج هي كيانات أبعاد ، وتوفر مزيدًا من المعلومات حول حقائق العمل. يُعد المبلغ الإجمالي للمبيعات مقياسًا مهمًا للتسجيل ، ولكن بدون الأبعاد ، لا يمكن للشركة تقييم موقع المتجر أو نوع المنتج الذي يحقق المزيد من المبيعات.

نمذجة الأبعاد - جداول الحقائق والأبعاد

الشكل 1: مخطط النجوم مع جداول البيانات الواقعية والأبعاد

المفتاح الأساسي

المفتاح الأساسي هو عمود في جداول الأبعاد يحدد السجلات الفريدة. بالنسبة للأبعاد المتغيرة ببطء ، سيكون المفتاح البديل هو المفتاح الأساسي.

مفتاح غريب

تُستخدم المفاتيح الخارجية لربط جدولين (عادةً جداول البيانات الفعلية والأبعاد). المفتاح الأساسي في جدول الأبعاد هو مفتاح خارجي في جدول الحقائق المرتبط ويتم استخدامه للإشارة إلى هذا البعد المعين.

تصميم نموذج بيانات الأبعاد

لفهم عملية تصميم نماذج الأبعاد، دعنا نفكر في مثال خط الملابس الذي يبيع نوعين من سترات واقية - النايلون والبوليستر في متجرين عبر كاليفورنيا وبنسلفانيا. يتم عرض بيانات العينة للمثال في الجدول 2.

الخطوة 1: تحديد العمليات التجارية

قبل نمذجة البيانات ، يجب أن تكون أنواع النمذجة الأبعاد مناسبة لنموذج البيانات الخاص بك. تبدأ عملية النمذجة الأبعاد (أو أي نوع من نماذج البيانات) بتحديد عملية الأعمال التي تريد تتبعها. في هذه الحالة ، نريد تتبع المبيعات لنوعين من سترات الريح.

الخطوة الثانية: تحديد الحقائق والأبعاد

يتم تصنيف المعلومات في نموذج الأبعاد إلى نوعين من الجداول - حقائق و الأبعاد. الخطوة التالية هي تحديد حقائق العمل التي تريد قياسها والأبعاد المرتبطة بها. في مثالنا ، بيع سترة واقية هو حقيقة أننا نريد القياس. التاريخ وموقع المتجر (كاليفورنيا وبنسلفانيا) ونوع المنتج (سترات واقية من النايلون وسترات واقية من البوليستر) هي الأبعاد التي تعطينا مزيدًا من الأفكار حول عملية البيع.

الخطوة 3: تحديد سمات الأبعاد

بعد تحديد الحقائق والأبعاد لعملية الأعمال الخاصة بك ، فإن الخطوة التالية هي تحديد السمات وإنشاء جدول أبعاد منفصل لكل من الأبعاد. يجب أن يكون لكل سجل في جدول الأبعاد مفتاح فريد. سيتم استخدام هذا المفتاح لتعريف السجلات في جدول الأبعاد بشكل فريد وسيتم استخدامه كمفتاح خارجي في جدول الحقائق للإشارة إلى البعد المعين وربطه بجدول الحقائق. توضح الجداول 3-5 جدول الأبعاد لكل من الأبعاد في مثال خط الملابس لدينا.

البعد التاريخ
مفتاح التاريخ التاريخ يوم
10201 6 / 3 / 2018 الأحد
10202 6 / 4 / 2018 الإثنين

الجدول 3: جدول الأبعاد للتاريخ

أبعاد المتجر
مفتاح المتجر اسم المتجر المدينة الولايه او المحافظه
151 ملابس انجي لوس أنجلوس كاليفورنيا
152 ملابس انجي بيتسبرغ ولاية بنسلفانيا

الجدول 4: جدول أبعاد المتجر

البعد المنتج
رمز المنتج المجموعة القماش المستخدم: اللون
131620 سترة واقية - مجموعة الخريف نايلون برتقالي
131571 سترة واقية - مجموعة الخريف بوليستر اسود

الجدول 5: جدول أبعاد المنتج

الخطوة 4: تحديد درجة التفصيل لحقائق العمل

تشير الدقة إلى مستوى المعلومات المخزنة في أي جدول. على سبيل المثال ، في مثالنا ، يتم تسجيل مبلغ المبيعات على أساس يومي ، وبالتالي فإن الدقة ، في هذه الحالة ، تكون يومية. يجب أن تكون جداول الحقائق في نموذج الأبعاد متسقة مع الدقة المحددة مسبقًا.

الخطوة 5: تخزين المعلومات التاريخية (الأبعاد المتغيرة ببطء)

من السمات المهمة لنماذج الأبعاد أنه يمكن تعديل سمات الأبعاد بسهولة دون تغيير معلومات المعاملة الكاملة. على سبيل المثال ، قرر خط الملابس الاستمرار في سترة واقية من النايلون من Fall Collection إلى Spring Collection وتحديث الاسم في المجموعة ينسب. إجراء التحديث عملية سهلة في جدول الأبعاد ، لكن مع التحديث ، سنفقد بياناتنا السابقة. إذا كان الهدف من إنشاء نماذج البيانات ومستودع البيانات هو الحفاظ على السجل وتخزينه ، فقد تكون هذه مشكلة. تسمى الأبعاد التي تتغير ببطء بمرور الوقت "الأبعاد المتغيرة ببطء". بالإضافة إلى ذلك ، يتم إنشاء جدول أبعاد الوقت في مستودع البيانات تلقائيًا ويلتقط الوقت الذي تحدث فيه المعاملات المختلفة. يمكنك الاحتفاظ بالبيانات التاريخية وتخزينها عن طريق تتبع الأبعاد المتغيرة ببطء.

اقرأ المزيد عن حالات الاستخدام المختلفة للأبعاد المتغيرة ببطء.

الأتمتة - مغير قواعد اللعبة لتصميم النماذج ذات الأبعاد

يعد تصميم نماذج الأبعاد خطوة أساسية في بناء إطار عمل مستودع بيانات المؤسسة. يمكن تبسيط العملية بمساعدة أداة قوية لأتمتة مستودع البيانات مثل Astera منشئ مستودع البيانات.

مع Astera DW Builder، يمكنك إنشاء نماذج ذات أبعاد بسرعة في بيئة تطوير متكاملة خالية من الرموز المرئية. يمكن إلغاء تسوية الكيانات باستخدام السحب والإفلات والدمج البسيط. يمكن تعيين أدوار الكيانات (الحقائق والأبعاد) بشكل مجمّع ، مما يوفر لك وقتًا ثمينًا عند العمل مع مئات الكيانات. بالإضافة إلى ذلك ، يمكّنك المنتج من إدارة الأبعاد المتغيرة ببطء مع دعم مدمج لأنواع SCD 1 و 2 و 3 و 6.

Astera DW Builder عبارة عن نظام أساسي لأتمتة مستودع البيانات من البداية إلى النهاية يأتي مع إمكانات نمذجة البيانات المضمنة ، ودعم مجموعة واسعة من قواعد البيانات وتطبيقات CRM ، وميزات الخرائط الآلية وتحميل البيانات ، والتكامل الأصلي مع منصات ذكاء الأعمال مثل مثل Tableau و Power BI.

يرى Astera عرض DW Builder or حدد موعدًا للاتصال الاستكشافي معنا اليوم لتجربة قوة أتمتة مستودعات البيانات بشكل مباشر.