المدونة

الصفحة الرئيسية / المدونة / إتقان نمذجة الأبعاد لنجاح تخزين البيانات

جدول المحتويات
الآلي, لا كود مكدس البيانات

تعلم كيف Astera يمكن لـ Data Stack تبسيط وتبسيط إدارة بيانات مؤسستك.

إتقان نمذجة الأبعاد لنجاح تخزين البيانات

16 يناير، 2024

الشركات تتجه بشكل متزايد نحو مستودعات البيانات للاستفادة من الحجم الكبير من البيانات التي يولدونها كل يوم. تخزين البيانات هو الحل الأفضل للتحليلات. ومع ذلك، لم يكن لدى الشركات دائمًا هذا الخيار. تم تصميم قواعد البيانات المبكرة في المقام الأول لمعالجة المعاملات وكانت تفتقر إلى الكفاءة اللازمة لإعداد التقارير التحليلية، مما أدى إلى ظهور نماذج الأبعاد.

في أوائل التسعينيات، كان رالف كيمبال شخصية بارزة عندما يتعلق الأمر نهج مستودع البيانات، طور مبادئ نمذجة الأبعاد. كتابه "مجموعة أدوات مستودع البيانات"، الذي نشر لأول مرة في عام 1996، أوجز المفاهيم وأفضل الممارسات لنمذجة الأبعاد. ركز نهج Kimball على نمذجة البيانات بطريقة تتوافق مع العمليات التجارية ومتطلبات المستخدم، مع التركيز على البساطة وسهولة الاستخدام.

في هذه المقالة سوف نتعمق في مفاهيم الأبعاد نمذجة البيانات وفهم عملياتها وفوائدها وقيودها.

ما هو نموذج البيانات الأبعاد؟

نموذج الأبعاد

نموذج البيانات الأبعاد هو وسيلة لتنظيم البيانات وهيكلتها في قاعدة بيانات أو مستودع بيانات لتسهيل قيام الشركات بتحليل بياناتها والحصول على رؤى منها. وهي مفيدة بشكل خاص عند التعامل مع كميات كبيرة من البيانات وعندما يحتاج المستخدمون إلى استكشاف البيانات من زوايا أو أبعاد مختلفة.

تتطلب التطبيقات المختلفة تقنيات مختلفة لنمذجة الأبعاد. هناك في المقام الأول أسلوبان للنمذجة: نماذج العلاقة بين الكيانات (نماذج ER) والنمذجة الأبعاد.

من ناحية أخرى، تم تصميم نماذج علاقات الكيانات المقيسة (نماذج ER) للتخلص من تكرار البيانات، وتنفيذ عمليات الإدراج والتحديث والحذف بسرعة، والحصول على البيانات داخل قاعدة البيانات.

في المقابل، نماذج الأبعاد أو نماذج بيانات كيمبال الأبعاد هي هياكل غير طبيعية مصممة لاسترداد البيانات من ملف مستودع البيانات. يستخدمون جداول الحقائق والأبعاد للاحتفاظ بسجل للبيانات التاريخية في مستودعات البيانات. علاوة على ذلك، فقد تم تحسينها لأداء أختار التشغيل ويتم استخدامها في إطار التصميم الأساسي لبناء مستودعات بيانات وظيفية ومحسّنة للغاية.

العناصر المشاركة في النمذجة الأبعاد

جداول الحقائق أو إجراءات العمل

تخزن جداول البيانات الفعلية المعلومات الرقمية حول مقاييس العمل والمفاتيح الخارجية لجداول الأبعاد. يمكن أن تكون الحقائق التجارية مضافة أو شبه مضافة أو غير مضافة. يوضح الجدول 1 الأنواع الثلاثة لجداول الحقائق.

نوع الحقائق الوصف
حقائق مضافة مقاييس الأعمال التي يمكن تجميعها عبر جميع الأبعاد
حقائق شبه مضافة مقاييس الأعمال التي يمكن تجميعها عبر بعض الأبعاد وليس عبر أخرى (عادةً أبعاد التاريخ والوقت)
حقائق غير مضافة مقاييس الأعمال التي لا يمكن تجميعها عبر أي بُعد

الجدول 1: أنواع الحقائق في جدول الحقائق

شرح أنواع الحقائق بنموذج بيانات الأبعاد

يحتفظ متجر الملابس بالبيانات التالية في صفوف جدول الحقائق لحركة المبيعات:

التاريخ موقع المتجر نوع المنتج كمية سعر الوحدة حجم المبيعات المعرض ضريبة المبيعات
6/3/2018 CA نايلون 5 100 500 30 7.75%
6/3/2018 CA بوليستر 7 250 1750 50 7.75%
6/3/2018 PA نايلون 6 100 600 65 6.00%
6/3/2018 PA بوليستر 3 250 750 25 6.00%
6/4/2018 CA نايلون 7 100 700 36 7.75%
6/4/2018 CA بوليستر 6 250 1500 17 7.75%
/ 4 / 2018 PA نايلون 9 100 900 14 6.00%
6/4/2018 PA بوليستر 10 250 2500 20 6.00%

الجدول 2: جدول المعاملات الذي يحتفظ به متجر ملابس

الأعمدة التي تحتوي على معلومات رقمية حول عملية الأعمال هي حقائق أعمالنا. في هذا المثال، كمية , سعر الوحدة, حجم المبيعات, المعرضو ضريبة المبيعات هي حقائق. وباقي الكيانات (التاريخ, المتجرو نوع المنتج) أبعاد.

حجم المبيعات يمكن إضافتها عبر جميع الأبعاد. لذلك ، إنها حقيقة مضافة. علاوة على ذلك ، مضيفا المعرض المعلومات عبر المتجر يوفر البعد معلومات تجارية مفيدة. ومع ذلك ، نظرًا لأن هذه مجرد لقطة لعدد البضائع في نقطة معينة ، فإن إضافتها عبر ملف التاريخ البعد لا يعطي أي رؤى تجارية مفيدة. منذ المعرض مضافة عبر بعض الأبعاد وغير مضافة عبر البعض الآخر ، إنها حقيقة شبه مضافة. فكر الآن ضريبة المبيعات. مضيفا ضريبة المبيعات عبر أي بُعد سيثير مشاكل أثناء المعالجة التحليلية. ضريبة المبيعات هي ، بالتالي ، حقيقة غير مضافة.

جداول الأبعاد

تخزن جداول الأبعاد معلومات وصفية حول حقائق العمل للمساعدة في فهم البيانات وتحليلها بشكل أفضل. في المثال المعروض في الجدول 2 ، التاريخ, موقع المتجرو نوع المنتج هي كيانات أبعاد ، توفر مزيدًا من المعلومات حول حقائق العمل. يُعد المبلغ الإجمالي للمبيعات مقياسًا مهمًا للتسجيل ، ولكن بدون الأبعاد ، لا يمكن للشركة تقييم موقع المتجر أو نوع المنتج الذي ينتج عنه المزيد من المبيعات.

نمذجة الأبعاد - جداول الحقائق والأبعاد

الشكل 1: مخطط النجوم مع جداول البيانات الواقعية والأبعاد

المفتاح الأساسي

المفتاح الأساسي هو عمود في جداول الأبعاد يحدد السجلات الفريدة. سيكون المفتاح البديل هو المفتاح الأساسي للأبعاد المتغيرة ببطء.

مفتاح غريب

تربط المفاتيح الخارجية جدولين (عادةً جداول البيانات الواقعية والأبعاد). المفتاح الأساسي في جدول الأبعاد هو مفتاح خارجي في جدول الحقائق المرتبط ويستخدم للإشارة إلى هذا البعد المعين.

مثال لنمذجة البيانات الأبعاد

دعونا نفكر في مثال واقعي لنمذجة الأبعاد لأعمال البيع بالتجزئة. تخيل سلسلة من المتاجر التي ترغب في تحليل بيانات مبيعاتها للحصول على نظرة ثاقبة حول أدائها. في هذا السيناريو، يمكن تطبيق نموذج بيانات الأبعاد على النحو التالي:

  1. حقائق: الحقائق الأساسية في هذا السيناريو ستكون معاملات البيع. وتشمل هذه الحقائق بيانات مثل:
  • إيرادات المبيعات
  • كمية المنتجات المباعة
  • تم تطبيق الخصومات
  • هوامش الربح
  1. الأبعاد: ستوفر الأبعاد المختلفة سياقًا لبيانات المبيعات:
  • البعد الزمني: يمكن أن يتضمن هذا البعد سمات مثل السنة وربع السنة والشهر واليوم وحتى الوقت من اليوم. على سبيل المثال، يمكن أن يساعد في الإجابة على أسئلة مثل: "ما هي مبيعاتنا لكل ربع سنة من العام الماضي؟"
  • البعد المنتج: يمكن أن يصف المنتجات التي تباع في المتاجر. وقد تتضمن سمات مثل فئة المنتج والعلامة التجارية واسم المنتج. على سبيل المثال، يمكن أن يساعد في الإجابة على أسئلة مثل "ما هي فئة المنتج التي حققت أكبر قدر من الإيرادات؟"
  • أبعاد المتجر: يمكن أن يحتوي هذا على معلومات حول مواقع المتجر الفردية، مثل اسم المتجر والمدينة والولاية ومدير المتجر. يمكن أن يجيب على أسئلة مثل "ما المتجر الذي حقق أعلى مبيعات الشهر الماضي؟"
  • البعد العميل: يمكن أن توفر رؤى حول التركيبة السكانية للعملاء، مثل العمر والجنس والموقع. يمكن أن يساعد في الإجابة على أسئلة مثل "ما هو متوسط ​​مبلغ الشراء لكل شريحة من العملاء؟"
  1. العلاقات بين الحقائق والأبعاد: يحتوي جدول الحقيقة، الذي يحتوي على معاملات البيع، على مفاتيح خارجية تربطه بجداول الأبعاد. على سبيل المثال، قد يحتوي كل سجل حركة مبيعات على مفاتيح خارجية تشير إلى الوقت والمنتج والمتجر والعميل المقابل في جداول الأبعاد الخاصة بهم.
  2. التسلسلات الهرمية: تساعد التسلسلات الهرمية ضمن الأبعاد المستخدمين على التنقل وتحليل البيانات على مستويات مختلفة من الدقة. على سبيل المثال، قد يشتمل البعد الزمني على تسلسل هرمي يمتد من سنة إلى ربع سنة إلى شهر إلى يوم.
  3. الربحية : سيتم حساب المقاييس من حقائق المبيعات لتوفير رؤى قيمة. على سبيل المثال:
  • إجمالي مبلغ المبيعات
  • متوسط ​​نسبة الخصم
  • نسبة هامش الربح

مع وجود نموذج البيانات الأبعاد هذا، يمكن لأعمال البيع بالتجزئة استخدامه للإجابة على مجموعة واسعة من الأسئلة، مثل:

  • "ما هو إجمالي مبيعاتنا لكل فئة من فئات المنتجات في الربع الأخير؟"
  • "ما المتجر الذي حقق أعلى نمو في المبيعات مقارنة بنفس الفترة من العام الماضي؟"
  • "ما هو متوسط ​​هامش الربح للمنتجات في كل فئة من فئات المنتجات؟"

تصميم نموذج بيانات الأبعاد

لفهم عملية تصميم نماذج الأبعاد، دعنا نفكر في مثال خط الملابس الذي يبيع نوعين من سترات واقية - النايلون والبوليستر في متجرين عبر كاليفورنيا وبنسلفانيا. يتم عرض بيانات العينة للمثال في الجدول 2.

الخطوة 1: تحديد العمليات التجارية

قبل نمذجة البيانات ، يجب أن تجد أنواع النمذجة الأبعاد المناسبة لنموذج البيانات الخاص بك. تبدأ عملية النمذجة الأبعاد (أو أي نمذجة بيانات) بتحديد عملية الأعمال التي تريد تتبعها. في هذه الحالة ، نريد تتبع المبيعات لنوعين من سترات الريح.

الخطوة 2: تحديد الحقائق والأبعاد في نموذج بيانات الأبعاد الخاص بك

يتم تصنيف المعلومات الموجودة في نموذج الأبعاد إلى نوعين من الجداول - حقائق و الأبعاد. الخطوة التالية هي تحديد حقائق العمل التي تريد قياسها والأبعاد المرتبطة بها. في مثالنا ، بيع سترة واقية هو حقيقة أننا نريد القياس. التاريخ وموقع المتجر (كاليفورنيا وبنسلفانيا) ونوع المنتج (سترات واقية من النايلون وسترات واقية من البوليستر) هي الأبعاد التي تعطينا مزيدًا من الأفكار حول عملية البيع.

الخطوة 3: تحديد سمات الأبعاد

بعد تحديد الأبعاد والحقائق لعملية الأعمال الخاصة بك ، فإن الخطوة التالية هي تحديد السمات وإنشاء جدول أبعاد منفصل لكل بُعد. هناك أنواع مختلفة من جداول الأبعاد لكل نوع من أنواع البيانات. يجب أن يكون لكل سجل في جدول الأبعاد مفتاح فريد. سيتم استخدام هذا المفتاح لتحديد السجلات في جدول الأبعاد وكمفتاح خارجي في جدول الحقائق للإشارة إلى البعد المعين وربطه بجدول الحقائق. توضح الجداول 3-5 الأنواع المختلفة للأبعاد في مستودع البيانات في مثال خط الملابس الخاص بنا.

البعد التاريخ
مفتاح التاريخ التاريخ يوم
10201 6/3/2018 الأحد
10202 6/4/2018 الإثنين

الجدول 3: جدول الأبعاد للتاريخ

أبعاد المتجر
مفتاح المتجر اسم المتجر المدينة الولايه او المحافظه
151 AngAngie'sparel لوس أنجلوس كاليفورنيا
152 AngAngie'sparel بيتسبرغ ولاية بنسلفانيا

الجدول 4: جدول أبعاد المتجر

البعد المنتج
رمز المنتج مجموعة الخامة لون
131620 سترة واقية - مجموعة الخريف نايلون برتقال
131571 سترة واقية - مجموعة الخريف بوليستر اسود

الجدول 5: جدول أبعاد المنتج

الخطوة 4: تحديد درجة التفصيل لحقائق العمل

تشير الدقة إلى مستوى المعلومات المخزنة في أي جدول. على سبيل المثال ، في مثالنا ، يتم تسجيل مبلغ المبيعات يوميًا ؛ لذلك ، التقسيم ، في هذه الحالة ، يكون يوميًا. يجب أن تكون جداول الحقائق في نموذج الأبعاد متسقة مع الدقة المحددة مسبقًا.

الخطوة 5: تخزين المعلومات التاريخية (الأبعاد المتغيرة ببطء)

من السمات المهمة لنماذج الأبعاد أنه يمكن تعديل سمات الأبعاد بسهولة دون تغيير معلومات المعاملة الكاملة. على سبيل المثال ، قرر خط الملابس الاستمرار في سترة واقية من النايلون من Fall Collection إلى Spring Collection وتحديث الاسم في مجموعة يصف. إجراء التحديث أمر سهل في جدول الأبعاد ، لكننا سنفقد بياناتنا السابقة مع التحديث. إذا كان الهدف من إنشاء نماذج البيانات ومستودع البيانات هو الحفاظ على السجل وتخزينه ، فقد تكون هذه مشكلة. تسمى الأبعاد التي تتغير ببطء بمرور الوقت "الأبعاد المتغيرة ببطء". بالإضافة إلى ذلك ، يتم إنشاء جدول أبعاد الوقت في مستودع البيانات تلقائيًا ويلتقط الوقت الذي تحدث فيه المعاملات المختلفة. يمكنك الاحتفاظ بالبيانات التاريخية وتخزينها عن طريق تتبع الأبعاد المتغيرة ببطء.

تعرف على المزيد حول تصميم نماذج الأبعاد الآلية من خلال دليلنا خطوة بخطوة

ما هو نموذج البيانات متعدد الأبعاد في مستودع البيانات؟

نموذج البيانات متعدد الأبعاد هو تطبيق محدد لنمذجة البيانات الأبعاد المصممة خصيصًا لتلبية الاحتياجات التحليلية وإعداد التقارير الأكثر تقدمًا. إنه يوسع مفاهيم نمذجة البيانات ذات الأبعاد العادية لتوفير قدرات إضافية. فيما يلي بعض العوامل المهمة التي يجب ملاحظتها حول نموذج البيانات الأبعاد:

  • يضيف التعقيد من خلال تقديم مفهوم مكعبات البيانات. تقوم مكعبات البيانات بتخزين البيانات المجمعة مسبقًا، مما قد يؤدي إلى بنية أكثر تعقيدًا ولكن أكثر كفاءة للتحليل متعدد الأبعاد.
  • لا يزال سهل الاستخدام ولكنه يوفر المزيد من الإمكانيات للمستخدمين للتفاعل مع البيانات باستخدام أدوات OLAP. يمكن للمستخدمين تحليل البيانات من أبعاد متعددة في وقت واحد والتعمق فيها وتحليلها.
  • غالبًا ما يتضمن جداول أبعاد غير طبيعية وبيانات مجمعة مسبقًا في مكعبات البيانات. على الرغم من أن هذا قد يزيد من احتياجات التخزين للبيانات المجمعة، إلا أنه يمكن أن يقلل التكرار في جداول الأبعاد، مما يؤدي إلى تخزين أكثر كفاءة.
  • وهو مثالي للتحليلات المتقدمة وإعداد التقارير المعقدة والسيناريوهات التي يكون فيها الأداء أمرًا بالغ الأهمية، مثل مستودعات البيانات واسعة النطاق ذات البيانات التاريخية الشاملة.

فوائد النمذجة الأبعاد

لا تزال النمذجة الأبعاد هي تقنية نمذجة البيانات الأكثر استخدامًا لتصميم مستودعات بيانات المؤسسة بسبب الفوائد التي توفرها. وتشمل هذه:

الأمثل لأداء الاستعلام: تم تصميم نماذج الأبعاد خصيصًا للاستعلام وإعداد التقارير، مما يؤدي إلى أداء أسرع للاستعلام، خاصة بالنسبة للاستعلامات التحليلية المعقدة.

استرجاع أسرع للبيانات: تدمج نمذجة البيانات ذات الأبعاد الجداول في النموذج نفسه ، مما يمكّن المستخدمين من استرداد البيانات بشكل أسرع من مصادر البيانات المختلفة عن طريق تشغيل استعلامات الصلة. تم تحسين المخطط غير المنسق لمستودع بيانات نموذج الأبعاد ، بدلاً من المخطط العادي في مخطط ندفة الثلج ، لتشغيل الاستعلامات المخصصة. ونتيجة لذلك ، فإنه يكمل إلى حد كبير أهداف ذكاء الأعمال للمؤسسة (BI).

Flقابلة للتغيير: إطار عمل النمذجة الأبعاد يجعل عملية تخزين البيانات قابلة للتوسيع. يمكن تعديل التصميم بسهولة ليشمل متطلبات العمل الجديدة أو ضبط المستودع المركزي. يمكن إضافة كيانات جديدة إلى النموذج أو يمكن تغيير تخطيط الكيانات الموجودة لتعكس عمليات الأعمال المعدلة.

التحليل متعدد الأبعاد: تدعم نماذج الأبعاد التحليل متعدد الأبعاد، بحيث يمكن للمستخدمين استكشاف البيانات من مختلف الأبعاد والتسلسلات الهرمية في وقت واحد.

تقليل تكرار البيانات: غالبًا ما تشتمل نماذج الأبعاد على إزالة التطبيع، مما يقلل من تكرار البيانات وبالتالي تحسين أداء الاستعلام مقارنةً بالنماذج عالية التطبيع.

حدود نمذجة الأبعاد

في حين أن النمذجة الأبعاد هي تقنية قوية لتلبية الاحتياجات التحليلية وإعداد التقارير، إلا أنها تحتوي أيضًا على بعض القيود، وهناك سيناريوهات قد لا تكون فيها النهج الأكثر ملاءمة. لذلك، من الضروري تقييم ما إذا كانت تتوافق مع خصائص ومتطلبات بياناتك وحالات الاستخدام. فيما يلي بعض القيود المفروضة على النمذجة الأبعاد والمواقف التي قد تفكر فيها في تقنيات النمذجة البديلة:

  1. العلاقات المعقدة: تفترض النمذجة الأبعادية أن العلاقات بين الأبعاد والحقائق بسيطة نسبيًا. إذا كانت بياناتك تتضمن علاقات معقدة للغاية لا يمكن تمثيلها بسهولة في مخطط نجمة أو ندفة الثلج، فقد لا تكون نمذجة الأبعاد هي الخيار الأفضل.
  2. تغييرات البيانات المتكررة: تم تصميم نماذج الأبعاد للتحليل التاريخي وقد لا تتعامل بشكل جيد مع البيانات التي تتغير بشكل متكرر أو تتطلب تحديثات في الوقت الفعلي. في مثل هذه الحالات، قد يكون نموذج المعاملات أو التطبيع أكثر ملاءمة.
  3. بيانات متفرقة: عندما تتعامل مع بيانات حيث لا تحتوي العديد من مجموعات الأبعاد على حقائق مرتبطة بها (بيانات متفرقة)، يمكن أن تؤدي نماذج الأبعاد إلى تخزين غير فعال وأداء استعلام.
  4. البيانات الكبيرة وغير المنظمة: إذا كانت بياناتك تتضمن كميات كبيرة من البيانات غير المنظمة أو شبه المنظمة (على سبيل المثال، المستندات النصية وخلاصات الوسائط الاجتماعية)، فقد لا تكون نماذج الأبعاد وحدها كافية. قد تحتاج إلى دمج تقنيات مثل قواعد بيانات NoSQL أو قواعد البيانات الموجهة نحو المستندات.

الأتمتة - لعبة مغيرة للنمذجة الأبعاد

يعد تصميم نماذج الأبعاد خطوة أساسية في بناء إطار عمل مستودع بيانات المؤسسة. يمكن تبسيط العملية بمساعدة أداة قوية لأتمتة مستودع البيانات مثل Astera منشئ مستودع البيانات.

بدافع Astera منشئ DW، يمكنك إنشاء نماذج ذات أبعاد بسرعة في بيئة تطوير متكاملة خالية من الرموز المرئية. يمكن إلغاء تسوية الكيانات باستخدام السحب والإفلات والدمج البسيط. يمكن تعيين أدوار الكيانات (الحقائق والأبعاد) بشكل مجمّع ، مما يوفر لك وقتًا ثمينًا عند العمل مع مئات الكيانات. بالإضافة إلى ذلك ، يمكّنك المنتج من إدارة الأبعاد المتغيرة ببطء مع دعم مدمج لأنواع SCD 1 و 2 و 3 و 6.

Astera DW Builder عبارة عن منصة أتمتة لمستودعات البيانات من البداية إلى النهاية مع إمكانات نمذجة بيانات الأبعاد المضمنة ، ودعم مجموعة واسعة من قواعد البيانات وتطبيقات CRM ، وميزات رسم الخرائط الآلية وتحميل البيانات ، والتكامل الأصلي مع منصات ذكاء الأعمال مثل Tableau و Power BI.

يرى Astera DW BuiBuilder'smo أو قم بالتسجيل للحصول على تجربة مجانية لتجربة قوة أتمتة مستودعات البيانات بشكل مباشر.

تقليل وقت تطوير مستودع البيانات بنسبة تصل إلى 80٪
دعوة جديدة إلى العمل
ربما يعجبك أيضا
مخزن البيانات 101: دليل شامل لتخزين البيانات القابلة للتطوير
أسواق المعلومات: تمكين ذكاء الأعمال المرن والقابل للتطوير والدقيق
مع مراعاة Astera لتلبية احتياجات إدارة البيانات الخاصة بك؟

أنشئ اتصالاً خاليًا من التعليمات البرمجية مع تطبيقات مؤسستك وقواعد البيانات والتطبيقات السحابية لدمج جميع بياناتك.

دعونا نتواصل الآن!
يتيح الاتصال