Blogs

Startseite / Blogs / Konfigurieren und Bereitstellen von SCD-fähigen Dimensionsmodellen für optimales Data Warehousing

Inhaltsverzeichnis
Die automatisierte, Kein Code Datenstapel

Erfahren Sie, wie Astera Data Stack kann die Datenverwaltung Ihres Unternehmens vereinfachen und rationalisieren.

Konfigurieren und Bereitstellen von SCD-fähigen Dimensionsmodellen für optimales Data Warehousing

August 24th, 2023

Die dimensionale Modellierung ist nach wie vor der zuverlässigste Modellierungsansatz für den Entwurf eines Data Warehouse für die Berichterstattung über Anwendungsfälle. Seine denormalisierte Struktur verbessert die Abfrageleistung erheblich und ermöglicht eine schnelle und nahtlose Datennutzung und Berichterstellung. Die Dimensionen in einem modellzentrierten Data Warehouse verwenden Langsam veränderliche Dimension (SCDs) um historische Daten für die Aufzeichnung und Berichterstattung zu pflegen. Alle Änderungen an bestehenden oder neuen Datensätzen werden durch SCDs identifiziert und in Ihren Data-Warehouse-Tabellen verwaltet. Aber mehr über SCDs in Kürze.  

Erfahren Sie mehr über das Generieren von Datenbankschemata mit automatisiertem Forward Engineering

SCDs sind ein wichtiges Merkmal Ihrer Dimensionstabellen, da sie die Pflege historischer Datensätze in Dimensionszeilen bestimmen. Das Hinzufügen mehrerer SCDs zu verschiedenen Feldern würde jedoch mehrere Zeilen erfordern komplizierter SQL-Code.  

Aber wie wir immer sagen, wo es einen komplizierten Weg gibt, gibt es auch einen AsteraWeg. Im Astera DW Builder-Umgebung können Sie SCDs in wenigen Minuten hinzufügen – ohne Code schreiben zu müssen. 

In diesem Blog erfahren Sie, wie Sie Slowly Changing Dimension (SCDs) zu Ihrem Dimensionsmodell hinzufügen und dieses Modell mit nur wenigen Klicks überprüfen und bereitstellen Astera DW-Builder. 

Konfigurieren Langsam wechselnde Dimensionen:

Hier ist unser Beispiel für ein dimensionales Datenmodell – entworfen mit Astera DW Builder – basierend auf einer fiktiven World Wide Importers-Datenbank.

Bei diesem Modell, eine Faktentabelle (Rechnungszeilen) ist verbunden durch mehrere Dimensionen (Lagerartikel, Kundendetails, Lieferanten und Städte). Dies ist zwar ein automatisiertes Dimensionsmodell, aber wir können es immer nochmals besuchen einzelne Entitäten, um Dimensionsrollen zu konfigurieren, zB SCDs.  

Schritt 1: Greifen Sie in den Dimensionseigenschaften auf die Spalte Dimensionsrolle zu 

Sprechen Sie XNUMXh geöffnet der Layoutersteller für eine Dimension indem Sie hineingehen seine Eigenschaften. Der Layoutbauer enthält ein separates Spalte für Rollen manuell definieren für jeder Dimensionsfeld. 

Auswahl von SCDs in DW Buildee

Dimension SCD-Rollen für jedes Feld in einer Dimensionstabelle.

Schritt 2: Wählen Sie die gewünschten sich langsam ändernden Dimensionen aus 

Weisen Sie jedem Feld den gewünschten SCD-Typ aus den vier verfügbaren Optionen (SCDs 1, 2, 3 und 6) zu, je nachdem, wie Sie Daten in Ihrem Data Warehouse verwalten möchten.  

In diesem Beispiel wählen wir SCD-Typ 2 – Aktualisieren und Einfügen – als Dimensionsrolle für das Feld „StockItemName“ aus. Nun würde logischerweise jede Änderung des StockItemName als neue Zeile mit dem aktualisierten Namen widergespiegelt werden. Darüber hinaus würde das automatisierte Bezeichnungsfeld für den aktuellen Datensatz sicherstellen, dass der neueste Datensatz oder „StockItemName“ in diesem Fall identifizierbar ist.  

Auswahl des richtigen SCD im DW Builder

SCD 2 einem Dimensionsfeld zuweisen.

Ab hier würde jede Änderung des StockItemName in der Quelle als aktualisierter Datensatz in der Dimensionstabelle erscheinen.   

So sehen beispielsweise die Vorschaudaten für StockItemName aus, nachdem wir einen Datensatz zweimal in den Quelldaten geändert haben. Das Feld CurrentRecordDesignator zeigt den neuesten Datensatz. 

Vorschaudaten nach Änderungen im StockItemName. Der „USB-Raketenwerfer (Grün – neuer Name)“ ist die neueste Änderung auf dem Gebiet.

Schritt 3: Rechts markieren Rollen für die erforderliche Dimension Felder 

Wir weisen bestimmte SCDs zu in der Dimensionsrollenspalte jeder Entität bwie am so unterstützen Plan beim Aktualisieren technische Daten im Datawarehouse.

Arten sich langsam ändernder Dimensionen

Langsam wechselnde Dimensionstypen (SCD).

Lassen Sie uns SCD 6 dem Feld „Einheitspreis“ zuweisen und einen Feldwert in der Quelltabelle mehrmals ändern.  

So werden die Vorschaudaten für das ausgefüllte Feld (Einheitspreis) nach einigen Änderungen in der Quelle angezeigt: 

Die Änderungen des Stückpreises spiegeln sich in zwei Spalten wider – neue und alte Stückpreise – und in einer neuen Zeile mit aktualisierten Datensätzen.

Nachdem die spezifischen Dimensionsrollen zugewiesen wurden gemäß unseren Data-Warehousing-Anforderungen, Der nächste Schritt besteht darin, das Modell für den Verbrauch zu überprüfen und bereitzustellen.  

Verifying und Bereitstellung das Dimensionsmodell: 

We sollen überprüfen Sie unser Modell vor seinen Einsatz. Astera hat eine eingebaute Datenmodellverifizierung Modulen die das Modell automatisch auf Fehler scannt beeinflussen die physische Einsatz. 

Überprüfen des Datenmodells in Astera Data Warehouse Builder

Datenmodellüberprüfung für Lese- und Schreibbereitstellung

Hier ist, ein Beispiel dafür, wie die Überprüfung Modulen identifiziert verbreitet Fehler, die sich auf die Bereitstellung auswirken 

Zuweisen eines Geschäftsschlüssels

Dieser Fehler zeigt, dass in unserem StockItem kein Geschäftsschlüssel definiert ist. Weisen Sie einfach der StockItemID in der StockItem-Dimension einen Business Key zu, um den Fehler zu beheben.

Nach der Verifizierung des Datenmodells Wir setzen das Data Warehouse ein auf unserem Server Verwendung von das 'Datenmodell bereitstellen' Schaltfläche in der Symbolleiste. Vor der Bereitstellung müssen wir den Namen des Datenmodells und den Pfad zur Konfigurationsdatei angeben, die verwendet werden kann ändern Datenmodellparameter. 

Bereitstellung des Datenmodells in Astera Data Warehouse Builder

Drücken Sie die Bereitstellungsschaltfläche und identifizieren Sie den Pfad zur Datenmodell-Konfigurationsdatei.

Schließlich, tDas Modell wird als virtuelle Datenbank auf dem Server bereitgestellt. Diese Bereitstellung – in Form von Astera Datenmodell – kann mehreren Zwecken dienen. Beispielsweise können wir es in ETL-Pipelines verwenden, um das dimensionale Modell zu füllen, oder es für BI und Analysen nutzen.

Konfigurieren und Bereitstellen von Dimensionsmodellen mit Astera DW-Builder 

Das Konfigurieren von Dimensionsmodellen mit SCDs und deren Bereitstellung für den Verbrauch kann nicht einfacher sein. Sie müssen kein manuelles Scripting oder komplexe Abfragen durchführen, um Dimensionsrollen zuzuweisen oder Data Warehousing-Modelle bereitzustellen. Hier ist alles, was Sie tun müssen: 

  • Weisen Sie Entitäten im Dimensionsmodell über eine Drag-and-Drop-Schnittstelle SCD-Rollen zu.
  • Überprüfen Sie die Modelle, um mögliche Fehler auszuschließen.
  • Stellen Sie die Modelle mit nur einem Klick bereit.  

Genau so verkürzen Sie den Design- und Entwicklungslebenszyklus des Data Warehouse um bis zu 80 %. 

Weitere Ressourcen

Willst du wissen wie Astera automatisiert sonst komplex dimensionales Modelling? Lesen Sie unsere How-to blog on Entwerfen eines automatisierten Dimensionsmodells.

Lernen wie man automatisch generieren ein physisches Schema von Ihnen Design von Datenmodellen hier.  

Sie können auch mögen
Die Top 7 Datenaggregationstools im Jahr 2024
Data Governance Framework: Was ist das? Bedeutung, Säulen und Best Practices
Die besten Tools zur Datenerfassung im Jahr 2024
In Anbetracht Astera Für Ihre Datenverwaltungsanforderungen?

Stellen Sie eine codefreie Konnektivität mit Ihren Unternehmensanwendungen, Datenbanken und Cloud-Anwendungen her, um alle Ihre Daten zu integrieren.

Lassen Sie uns jetzt eine Verbindung herstellen!
Lass uns verbinden