Die dimensionale Modellierung ist nach wie vor der zuverlässigste Modellierungsansatz für den Entwurf eines Data Warehouse für die Berichterstattung über Anwendungsfälle. Seine denormalisierte Struktur verbessert die Abfrageleistung erheblich und ermöglicht eine schnelle und nahtlose Datennutzung und Berichterstellung. Die Dimensionen in einem modellzentrierten Data Warehouse verwenden Langsam veränderliche Dimension (SCDs) um historische Daten für die Aufzeichnung und Berichterstattung zu pflegen. Alle Änderungen an bestehenden oder neuen Datensätzen werden durch SCDs identifiziert und in Ihren Data-Warehouse-Tabellen verwaltet. Aber mehr über SCDs in Kürze.
Erfahren Sie mehr über das Generieren von Datenbankschemata mit automatisiertem Forward Engineering
SCDs sind ein wichtiges Merkmal Ihrer Dimensionstabellen, da sie die Pflege historischer Datensätze in Dimensionszeilen bestimmen. Das Hinzufügen mehrerer SCDs zu verschiedenen Feldern würde jedoch mehrere Zeilen erfordern komplizierter SQL-Code.
Aber wie wir immer sagen, wo es einen komplizierten Weg gibt, gibt es auch einen AsteraWeg. Im Astera DW Builder-Umgebung können Sie SCDs in wenigen Minuten hinzufügen – ohne Code schreiben zu müssen.
In diesem Blog erfahren Sie, wie Sie Slowly Changing Dimension (SCDs) zu Ihrem Dimensionsmodell hinzufügen und dieses Modell mit nur wenigen Klicks überprüfen und bereitstellen Astera DW-Builder.
Konfigurieren Langsam wechselnde Dimensionen:
Hier ist unser Beispiel für ein dimensionales Datenmodell – entworfen mit Astera DW Builder – basierend auf einer fiktiven World Wide Importers-Datenbank.
Bei diesem Modell, eine Faktentabelle (Rechnungszeilen) ist verbunden durch mehrere Dimensionen (Lagerartikel, Kundendetails, Lieferanten und Städte). Dies ist zwar ein automatisiertes Dimensionsmodell, aber wir können es immer nochmals besuchen einzelne Entitäten, um Dimensionsrollen zu konfigurieren, zB SCDs.
Schritt 1: Greifen Sie in den Dimensionseigenschaften auf die Spalte Dimensionsrolle zu
Sprechen Sie XNUMXh geöffnet der Layoutersteller für eine Dimension indem Sie hineingehen seine Eigenschaften. Der Layoutbauer enthält ein separates Spalte für Rollen manuell definieren für jeder Dimensionsfeld.
Dimension SCD-Rollen für jedes Feld in einer Dimensionstabelle.
Schritt 2: Wählen Sie die gewünschten sich langsam ändernden Dimensionen aus
Weisen Sie jedem Feld den gewünschten SCD-Typ aus den vier verfügbaren Optionen (SCDs 1, 2, 3 und 6) zu, je nachdem, wie Sie Daten in Ihrem Data Warehouse verwalten möchten.
In diesem Beispiel wählen wir SCD-Typ 2 – Aktualisieren und Einfügen – als Dimensionsrolle für das Feld „StockItemName“ aus. Nun würde logischerweise jede Änderung des StockItemName als neue Zeile mit dem aktualisierten Namen widergespiegelt werden. Darüber hinaus würde das automatisierte Bezeichnungsfeld für den aktuellen Datensatz sicherstellen, dass der neueste Datensatz oder „StockItemName“ in diesem Fall identifizierbar ist.
SCD 2 einem Dimensionsfeld zuweisen.
Ab hier würde jede Änderung des StockItemName in der Quelle als aktualisierter Datensatz in der Dimensionstabelle erscheinen.
So sehen beispielsweise die Vorschaudaten für StockItemName aus, nachdem wir einen Datensatz zweimal in den Quelldaten geändert haben. Das Feld CurrentRecordDesignator zeigt den neuesten Datensatz.
Vorschaudaten nach Änderungen im StockItemName. Der „USB-Raketenwerfer (Grün – neuer Name)“ ist die neueste Änderung auf dem Gebiet.
Schritt 3: Rechts markieren Rollen für die erforderliche Dimension Felder
Wir weisen bestimmte SCDs zu in der Dimensionsrollenspalte jeder Entität bwie am so unterstützen Plan beim Aktualisieren die Datenerfassung im Datawarehouse.
Langsam wechselnde Dimensionstypen (SCD).
Lassen Sie uns SCD 6 dem Feld „Einheitspreis“ zuweisen und einen Feldwert in der Quelltabelle mehrmals ändern.
So werden die Vorschaudaten für das ausgefüllte Feld (Einheitspreis) nach einigen Änderungen in der Quelle angezeigt:
Die Änderungen des Stückpreises spiegeln sich in zwei Spalten wider – neue und alte Stückpreise – und in einer neuen Zeile mit aktualisierten Datensätzen.
Nachdem die spezifischen Dimensionsrollen zugewiesen wurden gemäß unseren Data-Warehousing-Anforderungen, Der nächste Schritt besteht darin, das Modell für den Verbrauch zu überprüfen und bereitzustellen.
Verifying und Bereitstellung das Dimensionsmodell:
We sollen überprüfen Sie unser Modell vor seinen Einsatz. Astera hat eine eingebaute Datenmodellverifizierung Modulen die das Modell automatisch auf Fehler scannt beeinflussen die physische Einsatz.
Datenmodellüberprüfung für Lese- und Schreibbereitstellung
Hier ist, ein Beispiel dafür, wie die Überprüfung Modulen identifiziert verbreitet .
Dieser Fehler zeigt, dass in unserem StockItem kein Geschäftsschlüssel definiert ist. Weisen Sie einfach der StockItemID in der StockItem-Dimension einen Business Key zu, um den Fehler zu beheben.
Nach der Verifizierung des Datenmodells auf unserem Server Verwendung von das 'Datenmodell bereitstellen' Schaltfläche in der Symbolleiste. Vor der Bereitstellung müssen wir den Namen des Datenmodells und den Pfad zur Konfigurationsdatei angeben, die verwendet werden kann ändern Datenmodellparameter.
Drücken Sie die Bereitstellungsschaltfläche und identifizieren Sie den Pfad zur Datenmodell-Konfigurationsdatei.
Schließlich, t Form von Astera Datenmodell – kann mehreren Zwecken dienen. Beispielsweise können wir es in ETL-Pipelines verwenden, um das dimensionale Modell zu füllen, oder es für BI und Analysen nutzen.
Konfigurieren und Bereitstellen von Dimensionsmodellen mit Astera DW-Builder
Das Konfigurieren von Dimensionsmodellen mit SCDs und deren Bereitstellung für den Verbrauch kann nicht einfacher sein. Sie müssen kein manuelles Scripting oder komplexe Abfragen durchführen, um Dimensionsrollen zuzuweisen oder Data Warehousing-Modelle bereitzustellen. Hier ist alles, was Sie tun müssen:
- Weisen Sie Entitäten im Dimensionsmodell über eine Drag-and-Drop-Schnittstelle SCD-Rollen zu.
- Überprüfen Sie die Modelle, um mögliche Fehler auszuschließen.
- Stellen Sie die Modelle mit nur einem Klick bereit.
Genau so verkürzen Sie den Design- und Entwicklungslebenszyklus des Data Warehouse um bis zu 80 %.
Weitere Ressourcen
Willst du wissen wie Astera automatisiert sonst komplex dimensionales Modelling? Lesen Sie unsere How-to blog on Entwerfen eines automatisierten Dimensionsmodells.
Lernen wie man automatisch generieren ein physisches Schema von Ihnen Design von Datenmodellen HIER.
Autoren:
- Haris Azeem