المدونة

الرئيسية / المدونة / مفاهيم مستودع البيانات: نهج Kimball مقابل Inmon

جدول المحتويات
الآلي, لا كود مكدس البيانات

تعلم كيف Astera يمكن لـ Data Stack تبسيط وتبسيط إدارة بيانات مؤسستك.

مفاهيم مستودع البيانات: Kimball vs. Inmon Approach

مسيرة 21st، 2024

عندما يتعلق الأمر مستودع البيانات (DWH)، اثنان من أكثر أساليب تخزين البيانات التي تمت مناقشتها وشرحها على نطاق واسع هما منهجية Inmon وKimball. لسنوات، ناقش الناس أي نهج مستودع البيانات هو الأفضل والأكثر فعالية للشركات. ومع ذلك، لا توجد حتى الآن إجابة محددة لأن كلا الطريقتين لهما فوائدهما وعيوبهما.

في هذه المدونة ، سنناقش أساسيات مستودع البيانات وخصائصه ونقارن بين طريقتين شائعتين لمستودعات البيانات - Kimball مقابل Inmon.

يسمح مفهوم مستودع البيانات الرئيسي للمستخدمين بالوصول إلى نسخة موحدة من الحقيقة لاتخاذ القرارات التجارية في الوقت المناسب وإعداد التقارير والتنبؤ. يعمل DWH كنظام معلومات يحتوي على جميع البيانات السابقة والتبادلية المخزنة من مصدر واحد أو أكثر.

نماذج مستودع البيانات

نماذج مستودع البيانات الرجوع إلى التصميمات والهياكل المعمارية المستخدمة لتنظيم وإدارة البيانات داخل بيئة تخزين البيانات. تملي هذه النماذج كيفية تخزين البيانات والوصول إليها واستخدامها لأغراض تحليلية. تشمل الأقسام الرئيسية ما يلي:

  • المستودع الافتراضي: تشتمل على قواعد بيانات منفصلة يمكن الاستعلام عنها بشكل جماعي، مما يسمح للمستخدمين بالوصول إلى البيانات كما لو كانت مخزنة في مستودع واحد.
  • مارت البيانات: تركز على وظائف أو أقسام عمل محددة، وتحتوي على مجموعات فرعية من البيانات المصممة للتحليل.
  • مستودع بيانات المؤسسة: مستودع شامل يدمج البيانات من مصادر مختلفة عبر المؤسسة، ويدعم التحليلات وإعداد التقارير على مستوى المؤسسة.

خصائص مستودع البيانات

فيما يلي الخصائص الأربع لمستودع البيانات:

  • موجه نحو الموضوع: يستخدم مستودع البيانات سمة ، ويقدم معلومات حول موضوع معين بدلاً من عمليات الشركة الحالية. بمعنى آخر ، تكون عملية تخزين البيانات أكثر تجهيزًا للتعامل مع موضوع معين. تتضمن أمثلة الموضوعات أو الموضوعات المبيعات والتوزيعات والتسويق وما إلى ذلك.
  • متكامل: يتم تعريف التكامل على أنه إنشاء اتصال بين كمية كبيرة من البيانات من قواعد بيانات أو مصادر متعددة. ومع ذلك ، من الضروري أيضًا تخزين البيانات في مستودع البيانات بطريقة موحدة. تدمج عملية تخزين البيانات البيانات من مصادر متعددة ، مثل الحاسوب المركزي ، وقواعد البيانات العلائقية ، والملفات الثابتة ، وما إلى ذلك. علاوة على ذلك ، فهي تساعد في الحفاظ على رموز متسقة ، ومقاييس السمات ، واصطلاحات التسمية ، والتنسيقات.
  • تغير الوقت: يعتبر متغير الوقت في DW أكثر شمولاً مقارنة بأنظمة التشغيل الأخرى. يتم استدعاء البيانات المخزنة في مستودع البيانات خلال فترة زمنية محددة وتوفر معلومات من منظور تاريخي.
  • غير متطاير: في مستودع البيانات غير المتطايرة ، تكون البيانات دائمة ، أي عند إدخال بيانات جديدة ، لا يتم استبدال البيانات السابقة أو حذفها أو حذفها. في مستودع البيانات هذا ، تكون البيانات للقراءة فقط ويتم تحديثها فقط على فترات زمنية معينة. عمليتا البيانات التي يتم إجراؤها في مستودع البيانات هما الوصول إلى البيانات وتحميل البيانات.
مناهج تخزين البيانات

خصائص ووظائف مستودع البيانات (المصدر: GeeksforGeeks)

وظائف مستودع البيانات

يعمل مستودع البيانات كمستودع. يساعد المؤسسات على تجنب تكلفة أنظمة التخزين وبيانات النسخ الاحتياطي على مستوى المؤسسة. الوظائف البارزة لمستودع البيانات هي:

التطبيع مقابل نهج عدم التطابق

يتم تعريف التطبيع على أنه وسيلة لإعادة تنظيم البيانات. يساعد هذا في تلبية متطلبين رئيسيين في ملف مستودع بيانات المؤسسة أي القضاء على تكرار البيانات وحماية تبعية البيانات. من ناحية أخرى، يؤدي إلغاء التسوية إلى زيادة وظائف البنية التحتية لنظام قاعدة البيانات.

مستودع البيانات مقابل قاعدة البيانات

يتم تلخيص الاختلافات الرئيسية بين مستودع البيانات وقاعدة البيانات في الجدول أدناه:

قاعدة البيانات مستودع البيانات
قاعدة البيانات هي دمج للبيانات ذات الصلة. يعمل مستودع البيانات كنظام معلومات يحتوي على بيانات تاريخية وتبادلية من مصدر واحد أو عدة مصادر.
تستخدم قاعدة البيانات لتسجيل البيانات. يتم استخدام مستودع البيانات لتحليل البيانات.
قاعدة البيانات هي مجموعة من البيانات موجهة للتطبيق. مستودع البيانات هو تجميع البيانات الموضوعي.
تستخدم قاعدة البيانات معالجة المعاملات عبر الإنترنت (OLTP). يستخدم مستودع البيانات المعالجة التحليلية عبر الإنترنت (OLAP).
يتم تسوية جداول قاعدة البيانات والصلات ، وبالتالي ، أكثر تعقيدًا.  تم إلغاء تسوية جداول وروابط مستودع البيانات ، وبالتالي فهي أبسط.
تستخدم تقنيات نمذجة ER للتصميم. تستخدم تقنيات نمذجة البيانات للتصميم.

مفهوما مستودع البيانات: Kimball مقابل Inmon

كل من منهجيات تصميم مستودع البيانات لها مزاياها وعيوبها. دعنا نذهب من خلالهم بالتفصيل لمعرفة أيهما أفضل.

منهجية كيمبال

بدأ نموذج بيانات Kimball بمبادرة من Ralph Kimball ، ويتبع نهجًا تصاعديًا لـ تصميم معمارية مستودع البيانات التي يتم فيها تشكيل مجموعات البيانات أولاً بناءً على متطلبات العمل.

ثم يتم تقييم مصادر البيانات الأولية، و أداة الاستخراج والتحويل والتحميل (ETL). يتم استخدامه لجلب البيانات من عدة مصادر وتحميلها إلى منطقة التدريج لخادم قاعدة البيانات العلائقية. بمجرد تحميل البيانات في منطقة التدريج لمستودع البيانات، تتضمن المرحلة التالية تحميل البيانات إلى نموذج مستودع بيانات الأبعاد الذي تم إلغاء تسويته بطبيعته. يقوم هذا النموذج بتقسيم البيانات إلى جدول الحقائق، وهو عبارة عن بيانات المعاملات الرقمية أو جدول الأبعاد، وهو المعلومات المرجعية التي تدعم الحقائق.

المخطط النجمي هو العنصر الأساسي في نموذج مستودع بيانات الأبعاد. غالبًا ما يُطلق على مجموعة جدول الحقائق مع العديد من جداول الأبعاد اسم المخطط النجمي. تتيح نمذجة Kimball الأبعاد للمستخدمين إنشاء العديد من المخططات النجمية لتلبية احتياجات إعداد التقارير المختلفة. تتمثل ميزة المخطط النجمي في أن استعلامات جدول الأبعاد الصغيرة تعمل على الفور.

لدمج البيانات ، يقترح نهج Kimball لدورة حياة مستودع البيانات فكرة أبعاد البيانات المتوافقة. إنه موجود كجدول أبعاد أساسي مشترك عبر جداول حقائق مختلفة (مثل العميل والمنتج) داخل مستودع البيانات أو كجداول الأبعاد نفسها في العديد من مجموعات بيانات Kimball. يضمن هذا استخدام عنصر بيانات واحد بطريقة مماثلة عبر جميع الحقائق.

من أدوات التصميم المهمة في منهجية مستودع بيانات رالف كيمبال مصفوفة ناقل المؤسسة أو بنية حافلات كيمبال التي تسجل الحقائق عموديًا وتسجيل الأبعاد المتوافقة أفقيًا. تعرض مصفوفة Kimball ، وهي جزء من هندسة الحافلات ، كيفية إنشاء مخططات النجوم. يتم استخدامه من قبل فرق إدارة الأعمال كمدخل لتحديد أولويات أي صف من مصفوفة كيمبال يجب تنفيذه أولاً.

يعتمد نهج Kimball لدورة حياة مستودع البيانات أيضًا على الحقائق المطابقة ، أي مجموعات البيانات التي يتم تنفيذها بشكل منفصل جنبًا إلى جنب مع بنية قوية.

أسلوب كيمبل هندسة مستودع البيانات

الشكل 2. شرح هندسة مستودع بيانات Kimball الأساسية (المصدر: Zentut)

مزايا منهجية كيمبال

تتضمن بعض الفوائد الرئيسية لمفهوم تخزين بيانات Kimball ما يلي:

  • النمذجة الأبعاد لـ Kimball سريعة في البناء نظرًا لعدم وجود تطبيع ، مما يعني التنفيذ السريع للمرحلة الأولية من تخزين البيانات عملية التصميم.
  • تتمثل إحدى ميزات مخطط النجوم في أن معظم مشغلي البيانات يمكنهم فهمه بسهولة بسبب هيكله غير الطبيعي ، مما يبسط الاستعلام والتحليل.
  • تعد بصمة نظام مستودعات البيانات تافهة لأنها تركز على مجالات وعمليات العمل الفردية بدلاً من المؤسسة بأكملها. لذلك ، فإنها تأخذ مساحة أقل في قاعدة البيانات ، مما يبسط إدارة النظام.
  • يتيح استرجاع البيانات بسرعة من مستودع البيانات ، حيث يتم فصل البيانات إلى جداول وأبعاد واقعية. على سبيل المثال ، قد يتضمن جدول الحقائق والأبعاد الخاص بصناعة التأمين معاملات البوليصة ومعاملات المطالبات.
  • يعد وجود فريق أصغر من المصممين والمخططين كافيًا لإدارة مستودعات البيانات لأن أنظمة مصدر البيانات مستقرة ، ومستودع البيانات موجه نحو العمليات. أيضًا ، يعد تحسين الاستعلام مباشرًا ويمكن التنبؤ به ويمكن التحكم فيه.
  • هيكل الأبعاد المطابقة ل جودة البيانات نطاق. يُشار أيضًا إلى نهج Kimball لدورة حياة مستودع البيانات باسم نهج نمط حياة الأعمال ذي الأبعاد لأنه يسمح لأدوات ذكاء الأعمال بالتعمق عبر العديد من المخططات النجمية ويولد رؤى موثوقة.
منهجية دورة حياة Kimball DW / BI - مجموعة Kimball

نهج Kimball لدورة حياة مستودع البيانات (المصدر: مجموعة Kimball)

عيوب منهجية Kimball

بعض عيوب الكيمبال تخزين البيانات مفهوم التصميم يشمل:

  • لم يتم دمج البيانات بالكامل قبل إعداد التقارير ؛ ضاعت فكرة "مصدر واحد للحقيقة".
  • يمكن أن تحدث المخالفات عند تحديث البيانات في بنية Kimball DW. هذا لأنه في تقنية إلغاء التطابق ، تتم إضافة البيانات المكررة إلى جداول قاعدة البيانات.
  • في بنية Kimball DW ، قد تحدث مشكلات في الأداء بسبب إضافة أعمدة في جدول الحقائق ، حيث إن هذه الجداول متعمقة تمامًا. يمكن أن تؤدي إضافة أعمدة جديدة إلى توسيع أبعاد جدول الحقائق ، مما يؤثر على أدائه. أيضًا ، يصبح من الصعب تغيير نموذج مستودع بيانات الأبعاد مع أي تغيير في احتياجات العمل.
  • نظرًا لأن نموذج Kimball موجه نحو العمليات التجارية ، فبدلاً من التركيز على المؤسسة ككل ، لا يمكنه التعامل مع جميع متطلبات إعداد تقارير ذكاء الأعمال.
  • تعتبر عملية دمج كميات كبيرة من البيانات القديمة في مستودع البيانات عملية معقدة.

طريقة إنمون

توصل بيل إنمون ، مؤسس تخزين البيانات ، إلى مفهوم تطوير مستودع بيانات يحدد المجالات والكيانات الرئيسية التي تعمل معها المؤسسة ، مثل العملاء والمنتج والبائع وما إلى ذلك. تعريف بيل إنمون لمستودع البيانات هو أنه "مجموعة بيانات موجهة نحو الموضوع ، وغير متطايرة ، ومتكاملة ، ومتغيرة زمنيًا لدعم قرارات الإدارة."

ثم ينشئ النموذج نموذجًا شاملاً ومنطقيًا لكل كيان أساسي. على سبيل المثال ، يتم إنشاء نموذج منطقي للمنتجات مع جميع السمات المرتبطة بهذا الكيان. يمكن أن يشتمل هذا النموذج المنطقي على عشرة كيانات متنوعة ضمن المنتج ، بما في ذلك جميع التفاصيل ، مثل محركات الأعمال ، والجوانب ، والعلاقات ، والتبعيات ، والانتماءات.

نهج تصميم بيل إنمون يستخدم النموذج المعياري لبناء هيكل الكيان، مع تجنب تكرار البيانات قدر الإمكان. ويؤدي ذلك إلى تحديد متطلبات العمل بوضوح ومنع أي مخالفات في تحديث البيانات. علاوة على ذلك، فإن ميزة هذا النهج من أعلى إلى أسفل في تصميم قاعدة البيانات هو أنه قوي لتغيرات الأعمال ويحتوي على منظور الأبعاد للبيانات عبر سوق البيانات.

بعد ذلك ، يتم إنشاء النموذج المادي ، الذي يتبع الهيكل الطبيعي. يخلق نموذج Bill Inmon هذا مصدرًا واحدًا للحقيقة للشركة بأكملها. يصبح تحميل البيانات أقل تعقيدًا بسبب البنية الطبيعية للنموذج. ومع ذلك ، فإن استخدام هذا الترتيب للاستعلام يمثل تحديًا لأنه يتضمن العديد من الجداول والروابط.

تقترح منهجية مستودع بيانات Inmon هذه إنشاء مجموعات بيانات منفصلة لكل قسم ، مثل التمويل والتسويق والمبيعات وما إلى ذلك. تم دمج جميع البيانات التي تدخل مستودع البيانات. يعمل مستودع البيانات كمصدر بيانات واحد لمختلف مجموعات البيانات لضمان النزاهة والاتساق عبر المؤسسة.

مفاهيم مستودع البيانات: Kimball vs. Inmon Approach 2

الشكل 3. شرح الهندسة المعمارية الأساسية لتخزين بيانات بيل إنمون (المصدر: جامعة ستانفورد)

مزايا طريقة Inmon

يقدم نهج تصميم Bill Inmon الفوائد التالية:

  • يعمل مستودع البيانات كمصدر موحد للحقيقة للأعمال التجارية بأكملها ، حيث يتم دمج جميع البيانات.
  • هذا النهج يحتوي على تكرار منخفض جدًا في البيانات. لذلك ، هناك احتمال أقل لحدوث مخالفات في تحديث البيانات ، مما يجعل عملية مستودع البيانات القائمة على مفهوم ETL أكثر وضوحًا وأقل عرضة للفشل.
  • إنه يبسط العمليات التجارية ، حيث يمثل النموذج المنطقي كائنات العمل التفصيلية.
  • يوفر هذا النهج قدرًا أكبر من المرونة ، حيث يسهل تحديث مستودع البيانات في حالة حدوث أي تغيير في متطلبات العمل أو بيانات المصدر.
  • يمكنه التعامل مع متطلبات إعداد التقارير المتنوعة على مستوى المؤسسة.

عيوب طريقة Inmon

العيوب المحتملة لهذا النهج هي كما يلي:

  • يزداد التعقيد مع إضافة جداول متعددة إلى نموذج البيانات مع مرور الوقت.
  • الموارد الماهرة في نمذجة بيانات مستودع البيانات مطلوبة ، والتي قد تكون باهظة الثمن ويصعب العثور عليها.
  • تستغرق عملية الإعداد والتسليم الأولية وقتًا طويلاً.
  • مطلوب عملية معالجة ETL إضافية حيث يتم إنشاء مجموعات البيانات بعد إنشاء مستودع البيانات.
  • يتطلب هذا النهج خبراء لإدارة مستودع البيانات بشكل فعال.

ما هو نهج مستودع البيانات الذي يجب اختياره؟

الآن بعد أن قمنا بتقييم نهج Kimball مقابل Inmon ورأينا مزايا وعيوب كلتا الطريقتين ، فإن السؤال الذي يطرح نفسه: أي من مفاهيم مستودع البيانات هذه ستخدم عملك بشكل أفضل؟

كلا هذين النهجين النظر مستودع البيانات كمستودع مركزي يدعم تقارير الأعمال. أيضًا ، يستخدم كلا النوعين من الأساليب مفاهيم ETL لتحميل البيانات. ومع ذلك ، يكمن الاختلاف الرئيسي في نمذجة البيانات وتحميلها في مستودع البيانات.

يؤثر النهج المستخدم لبناء مستودع البيانات على وقت التسليم الأولي لمشروع التخزين والقدرة على تحمل الاختلافات المحتملة في تصميم ETL.

هل مازلت غير متأكد من نتيجة معضلة كيمبال ضد إنمون؟ يمكننا مساعدتك في تحديد أي من أساليب مستودع البيانات هذه سيساعد في تحسين عملك إدارة جودة البيانات الإطار بأفضل طريقة؟

لقد قمنا بتضييق بعض الجوانب التي يمكن أن تساعدك على الاختيار بين النهجين.

  • احتياجات إعداد التقارير: إذا كنت بحاجة إلى إعداد تقارير متكاملة على مستوى المؤسسة ، فإن نهج Bill Inmon هو الأنسب. ولكن إذا كنت تريد إعداد تقارير تركز على عملية العمل أو الفريق ، فاختر طريقة Kimball.
  • الموعد النهائي للمشروع: يعد تصميم نموذج البيانات المعيارية أكثر تعقيدًا نسبيًا من تصميم نموذج غير معدل. وهذا يجعل Inmon نهجًا يستغرق وقتًا طويلاً. لذلك ، إذا كان لديك وقت أقل للتسليم ، فاختر طريقة Kimball.
  • خطة التوظيف المرتقبة: يتطلب التعقيد الأكبر لإنشاء نموذج البيانات في نهج مستودع بيانات Inmon فريقًا أكبر من المحترفين لإدارة مستودعات البيانات. لذلك ، اختر وفقًا لذلك.
  • التغييرات المتكررة: إذا كان من المحتمل أن تتغير احتياجات التقارير الخاصة بك بسرعة أكبر وكنت تتعامل مع أنظمة مصادر متقلبة ، فاختر طريقة Inmon لأنها توفر المزيد من المرونة. ومع ذلك ، إذا كانت احتياجات التقارير وأنظمة المصدر مستقرة نسبيًا ، فمن الأفضل استخدام طريقة Kimball.
  • المبادئ التنظيمية: إذا أدرك أصحاب المصلحة في مؤسستك ومديرو الشركة الحاجة إلى تخزين البيانات وكانوا على استعداد لتحمل النفقات ، فإن طريقة مستودع البيانات Bill Inmon ستكون رهانًا أكثر أمانًا. من ناحية أخرى ، إذا لم يكن صانعو القرار قلقين بشأن التفاصيل الجوهرية للنهج ، وكانوا يبحثون فقط عن حل لتحسين إعداد التقارير ، فعندئذٍ يكفي اختيار طريقة مستودع بيانات Kimball.

الحد الأدنى

يمكن استخدام مفهومي مستودع البيانات Kimball مقابل Inmon لتصميم نماذج مستودعات البيانات بنجاح. في الواقع ، تستخدم العديد من المؤسسات مزيجًا من هذين النهجين (يسمى نموذج البيانات المختلط).

في نموذج البيانات المختلط ، تُنشئ طريقة Inmon نموذج مستودع بيانات الأبعاد لمستودع البيانات. في المقابل ، يتم اتباع طريقة Kimball لتطوير مجموعات البيانات باستخدام مخطط النجوم.

من المستحيل ادعاء أي نهج أفضل لأن كلا الطريقتين لهما مزايا وعيوب ، ويعملان بشكل جيد في مواقف مختلفة. يجب على مصمم مستودع البيانات اختيار طريقة ، اعتمادًا على العوامل المختلفة التي تمت مناقشتها في هذه المقالة.

أخيرًا ، لكي تكون أي طريقة فعالة ، يجب أن تكون مدروسة جيدًا ، وأن يتم استكشافها بعمق ، وتطويرها لإرضاء شركتك ذكاء الأعمال متطلبات تقديم التقارير.

Astera منشئ مستودع البيانات - حل تخزين البيانات الآلي

Astera منشئ مستودع البيانات تقدم منصة متكاملة لتصميم ونشر واختبار الحجم الكبير مستودعات البيانات و أتمتة العمليات للوصول إلى رؤى ذات مغزى بسرعة ، دون عناء كتابة أكواد ETL.

المنظمات تتجه نحو أتمتة مستودع البيانات لتوفير التكاليف وزيادة الإنتاجية والحصول على رؤى قابلة للتنفيذ بشكل أسرع. تسمح لك أتمتة تخزين البيانات ببناء مجموعات بيانات عالية الجودة بسرعة ، وإنشاء خطوط بيانات ذاتية التنظيم ، وتقديم رؤى ذات صلة إلى صانعي القرار عبر أدوات تحليل المعلومات والاستخبارات.

تعمل أتمتة تخزين البيانات على التخلص من الجزء الأكثر استهلاكا للوقت في ملء مستودع البيانات: كتابة كود ETL / ELT. نظرًا لعدم الحاجة إلى ترميز يدوي لـ SQL ، يمكن للمطورين تركيز طاقتهم على العمل على مستوى منطقي (مستوى التصميم) لإنشاء تدفقات تكامل أكثر كفاءة.

بالإضافة إلى ذلك ، تساعدك الأتمتة في تصميم ملف بنية تحتية مستودعات البيانات الرشيقة. والنتيجة هي مستودع بيانات أكثر قابلية للتكيف واستجابة يمكن الاستعلام عنه بكفاءة ، مما ينتج عنه رؤى قيمة في ثوانٍ ويسمح لك باستخراج رؤى قيمة.

باختصار ، تتيح لك إزالة التدخل اليدوي في خطوات التخطيط والنمذجة والنشر القيام بذلك بناء مستودع بيانات بجودة أفضل بالنجاح - هذا أيضًا في غضون أسابيع أو حتى أيام.

ربما يعجبك أيضا
ما هو كتالوج البيانات؟ الميزات وأفضل الممارسات والفوائد
مخطط النجمة مقابل. مخطط ندفة الثلج: 4 اختلافات رئيسية
كيفية تحميل البيانات من AWS S3 إلى Snowflake
مع مراعاة Astera لتلبية احتياجات إدارة البيانات الخاصة بك؟

أنشئ اتصالاً خاليًا من التعليمات البرمجية مع تطبيقات مؤسستك وقواعد البيانات والتطبيقات السحابية لدمج جميع بياناتك.

دعونا نتواصل الآن!
يتيح الاتصال