المدونة

الصفحة الرئيسية / المدونة / استخدامات بناء مستودع بيانات SCD في Astera منشئ DW

جدول المحتويات
الآلي, لا كود مكدس البيانات

تعلم كيف Astera يمكن لـ Data Stack تبسيط وتبسيط إدارة بيانات مؤسستك.

استخدامات بناء مستودع بيانات SCD في Astera منشئ DW

نوفمبر 11th، 2022

الأبعاد المتغيرة ببطء

مستودع بيانات SCD هو جوهر تتبع التغييرات في البيانات. التغيير موجود دائمًا في كل عمل. من منظور الموارد البشرية ، تتم ترقية الموظفين والحصول على ألقاب جديدة ، بينما تتم إعادة كتابة سياسات المكافآت والتأمين مع مرور كل عام. في التسويق ، تتم إعادة تسمية خطوط الإنتاج أو دمجها أو إطلاقها في ضجة كبيرة. في قسم المبيعات ، يصل العملاء الجدد ، ويتم نقل الحسابات الرئيسية من وكيل إلى آخر.

والسؤال هو ، هل تمثل تقاريرك هذا التطور المستمر؟ هل تم تصميم بنية BI الخاصة بك لتوفير عرض حالي وتاريخي لبياناتك ، أم أنك تحصل فقط على لقطات دورية لكل نظام مصدر؟

بالنسبة لشخص بناء أ مستودع البيانات، فإن أفضل طريقة للتعامل مع السمات المتغيرة هي من خلال أبعاد تتغير ببطء. تغيير الأبعاد ببطء في مستودع البيانات يخزن المعلومات الحالية والسابقة بمرور الوقت. تعكس هذه الجداول التغييرات فور حدوثها في السمات المحددة في كل بُعد. بناءً على متطلباتك ، يمكنهم الكتابة فوق الإدخالات الموجودة ، أو إنشاء حقول إضافية لإظهار الإصدارات السابقة من السجل.

Asteraالجديد منشئ مستودع البيانات (ADWB) يوفر مصمم نموذج بيانات كاملًا يجعل من السهل إعداد جداول الأبعاد الخاصة بك وتعيين مختلف أنواع SCD على السمات المختارة. دعنا نلقي نظرة على بعض حالات الاستخدام التي يمكن أن يساعدك منتجنا في معالجتها.

تصحيح السجلات الخاطئة في مستودع بيانات SCD

أي نظام مصدر يعتمد على الإدخال اليدوي للبيانات عرضة للخطأ البشري. من الأسماء والعناوين إلى عروض الأسعار والتقديرات ، هناك سجلات متنوعة عبر أنظمة المصدر الخاصة بك والتي قد تحتاج إلى الإصلاح من أجل الدقة. في مثل هذه الحالات ، لن يؤدي الاحتفاظ بإصدار سابق من السجل في مستودع البيانات إلا إلى إضافة تعقيد عديم الفائدة إلى بياناتك. أفضل حل هو معاملة الإدخالات في هذه الحقول كسمات SCD-1 ، حيث تحل القيم الحالية محل البيانات السابقة.

مستودع بيانات scd

تم إنشاء Sales Data Mart باستخدام مصمم نموذج بيانات DWB

لنفترض أنك استخدمت DWB لتصميم نموذج الأبعاد لنظام المبيعات لديك ، ولاحظت بعض أسماء العملاء غير الصحيحة في أحدث مجموعة من التحديثات. ما عليك سوى فتح بُعد العميل في مصمم نموذج البيانات وتعيين اسم العميل كـ SCD1 - تحديث من القائمة المنسدلة.

أنواع الأبعاد المتغيرة ببطء

إعداد نوع SCD لسمة اسم العميل

الآن ، عند إجراء التصحيحات في قاعدة البيانات المصدر ، سيتم تحديث السجل المقابل في مستودع البيانات ، كما هو موضح أدناه. يسمى هذا البعد من النوع 1 في مستودع البيانات.

جدول أبعاد العميل قبل التصحيح

مستودع بيانات scd 2

تم تطبيق جدول أبعاد العميل مع SCD1 على حقل اسم العميل

مستودع بيانات scd 3

مقارنة البيانات الحالية مقابل البيانات السابقة في مستودع بيانات الأبعاد

تتمثل إحدى الوظائف الرئيسية لمستودع بيانات المؤسسة في دعم التحليل الاستراتيجي طويل المدى ، والذي يتطلب إجراء تغييرات في إحدى السمات ليتم الاحتفاظ بها وتعقبها بمرور الوقت.

لنفترض أن شركتك قد دمجت مؤخرًا عدة فروع في المنطقة وأنشأت مناطق جديدة لمنافذ متاجرها. إذا كنت تريد تتبع كيفية تأثر أداء المبيعات بإعادة التنظيم ، فيمكنك التعامل مع حقل المنطقة كبُعد من النوع 2 يتغير ببطء. سيضمن ذلك عرض التغييرات على مناطق التخزين كسجلات جديدة داخل الجدول.

في DWB ، يمكنك تطبيق خيار SCD2 - تحديث وإدراج لحقل المقاطعة في جدول أبعاد المتجر. أثناء إجراء التغييرات على سمة المصدر ، سيتم إنشاء إصدارات جديدة من السجل وإدراجها في جدول الأبعاد ، مع تعيين مفتاح بديل فريد لكل منها. استنادًا إلى نوع التحليل الذي تريد الشركة تنفيذه ، يمكنك أيضًا تحديد خيارات تاريخ السريان وتاريخ انتهاء الصلاحية بحيث يمكن تتبع أي تغييرات في مناطق المتجر إلى فترة محددة.

يوضح الجدول أدناه كيف ستؤثر هذه التكوينات على إخراج جدول الأبعاد الخاص بك.

الجدول الموجود

أنواع scd

الجدول المحدث - SCD2 (تاريخ السريان وتاريخ انتهاء الصلاحية)

تتبع التغييرات في الحالة

تتوقع أقسام معينة ، مثل الموارد البشرية ، تغييرات متكررة في السجلات داخل أنظمتها. على سبيل المثال ، يمكن أن يتغير تعيين الموظف عدة مرات في السنة. في هذه الحالات ، تريد الشركات عمومًا أن تكون قادرة على الاحتفاظ بتاريخ البيانات مع الاستمرار في القدرة على الاستعلام عنها بسرعة بناءً على قيمة السمة الأحدث.
في DWB ، يمكنك اختيار التعامل مع هذا الموقف عن طريق إعداد عنوان الوظيفة كحقل SCD6. هذا يعني أن الجدول سيستخدم عناصر SCD1 و SCD2 و SCD3 لتسجيل التغييرات في هذه السمة. هذه العناصر هي كما يلي:

  • يتم إضافة صف لتتبع التغييرات في السمة عند حدوثها (SCD2)
  • يظهر عمود إضافي القيمة الحالية للسمة (SCD3)
  • سيتم الكتابة فوق حقل القيمة الحالية لإظهار قيمة السمة المحدثة (SCD1)

يوضح المثال أدناه كيف ستظهر التغييرات في حقل Job_Title إذا تم تنفيذ SCD6.

الجدول الحالي

الأبعاد المتغيرة ببطء في مستودع البيانات

الجدول المحدث - SCD6 (العلم النشط وتاريخ السريان وتاريخ انتهاء الصلاحية)

أتمتة مستودع بيانات SCD الخاص بمؤسستك

Asteraيمكن أن تساعدك أداة Data Warehouse Builder التي تعتمد على البيانات الوصفية في تصميم مشروع مستودع البيانات وإنشائه ونشره في غضون أيام. من خلال مجموعة كاملة من ميزات النمذجة الأبعاد ومنصة ETL القوية لتتبع خرائط البيانات وتحميلها وإعدادها بسرعة ، نقدم لك نظامًا أساسيًا واحدًا به جميع الأدوات التي تحتاجها لإنجاح تنفيذ EDW.

ألق نظرة على الكيفية التي يمكن أن يساعدك بها منتجنا في حل حالة الاستخدام اليوم. انقر هنا للتواصل مع فريقنا الفني.

الأسئلة الشائعة
كما يوحي الأمر نفسه ، يتم استخدام أنواع الأبعاد المتغيرة ببطء (SCD) لالتقاط التغييرات البطيئة داخل مستودع البيانات بمرور الوقت ، بدلاً من الجدول الزمني المستمر. يساعد مستودع بيانات SCD في الإبلاغ عن البيانات التاريخية وربط سمات الأبعاد بأي بيانات معينة.

هناك ستة أنواع من الأبعاد المتغيرة ببطء (SCD):

  • اكتب 0 أو بعد ثابت: في هذا البُعد الثابت ، لا يُسمح بإجراء أي تغييرات لأن البُعد لا يتغير أبدًا
  • اكتب 1 أو لا يوجد محفوظات: يتم تحديث السجلات مباشرة دون وجود سجلات للقيم التاريخية في هذا النوع.
  • النوع 2 أو إصدار الصف: يمكن إنشاء سجلات إضافية جديدة في هذا النوع ، ويمكن تتبع السجلات التي تم تغييرها باستخدام العلامات والبيانات التشغيلية. 
  • اكتب 3 أو عمود القيمة السابقة: يمكن إضافة عمود جديد في هذا النوع ، ويمكن تتبع التغييرات إلى سمة معينة. 
  • اكتب 4 أو جدول التاريخ: يستخدم الجدول التاريخي لتسجيل جميع التغييرات مع إظهار القيمة الحالية في جدول الأبعاد. 
  • النوع 6 أو الهجين SCD: فهو يجمع بين تقنيات من أنواع SCD (الأبعاد المتغيرة ببطء) 1 و 2 و 3 لتتبع التغيير

بعض الأمثلة والاستخدامات الشائعة لوسائل التحقق من الصحة العقلية في مستودع البيانات هي:

  • إصلاح السجلات الخاطئة
  • مقارنة الحالي مقابل. البيانات السابقة 
  • تتبع التغييرات في الحالة  

ربما يعجبك أيضا
إدارة المعلومات مقابل إدارة البيانات: تحليل مقارن
إطار جودة البيانات: ما هو وكيفية تنفيذه
كل ما تحتاج لمعرفته حول اكتمال البيانات 
مع مراعاة Astera لتلبية احتياجات إدارة البيانات الخاصة بك؟

أنشئ اتصالاً خاليًا من التعليمات البرمجية مع تطبيقات مؤسستك وقواعد البيانات والتطبيقات السحابية لدمج جميع بياناتك.

دعونا نتواصل الآن!
يتيح الاتصال