Verwendungsmöglichkeiten für den Aufbau eines SCD Data Warehouse in Astera DW-Builder

By |2022-05-10T10:56:39+00:004. Februar 2021|

Langsam wechselnde Dimensionen

Ein SCD Data Warehouse ist der Schlüssel zum Nachverfolgen von Datenänderungen. Veränderungen sind in jedem Unternehmen allgegenwärtig. Aus HR-Sicht werden Mitarbeiter befördert und erhalten neue Titel, während Vergütungs- und Versicherungspolicen jedes Jahr neu geschrieben werden. Im Marketing werden Produktlinien umbenannt, zusammengelegt oder mit großem Tamtam eingeführt. Im Vertrieb kommen neue Kunden hinzu und Großkunden werden von einem Agenten zum anderen transferiert.

Die Frage ist, erklären Ihre Berichte diese ständige Entwicklung? Ist Ihre BI-Architektur so aufgebaut, dass sie sowohl eine aktuelle als auch eine historische Ansicht Ihrer Daten bietet, oder erhalten Sie nur regelmäßige Schnappschüsse von jedem Quellsystem?

Für jemanden, der eine baut Data Warehouse, der beste Weg, mit sich ändernden Attributen umzugehen, ist durch langsam wechselnde Dimensionen. Diese Tabellen spiegeln Änderungen wider, die innerhalb ausgewählter Attribute in jeder Dimension auftreten. Je nach Ihren Anforderungen können sie vorhandene Einträge überschreiben oder zusätzliche Felder erstellen, um frühere Versionen eines Datensatzes anzuzeigen.

Astera'S neue Data Warehouse Builder (ADWB) bietet einen vollständigen Datenmodell-Designer, mit dem Sie Ihre Dimensionstabellen einfach einrichten und unterschiedliche zuweisen können SCD-Typen zu ausgewählten Attributen. Werfen wir einen Blick auf einige der Anwendungsfälle, bei denen unser Produkt Ihnen helfen kann.

Korrigieren fehlerhafter Datensätze in einem SCD Data Warehouse

Jedes Quellsystem, das auf manueller Dateneingabe beruht, ist anfällig für menschliches Versagen. Von Namen und Adressen bis hin zu Angeboten und Schätzungen gibt es verschiedene Datensätze in Ihren Quellsystemen, die möglicherweise aus Gründen der Genauigkeit korrigiert werden müssen. In solchen Fällen würde die Pflege einer früheren Version eines Datensatzes im Data Warehouse Ihre Daten nur unnötig komplex machen. Die beste Lösung besteht darin, Einträge in diesen Feldern als SCD-1-Attribute zu behandeln, wobei aktuelle Werte die vorherigen Daten überschreiben.

scd datawarehouse

Sales Data Mart, erstellt mit dem DWB Data Model Designer

Angenommen, Sie haben DWB verwendet, um ein Maßmodell Ihres Verkaufssystems zu erstellen, und Sie haben in den letzten Aktualisierungen einige falsche Kundennamen festgestellt. Öffnen Sie einfach die Kundendimension im Datenmodelldesigner und legen Sie den Kundennamen im Dropdown-Menü als SCD1 - Update fest.

langsam wechselnde Bemaßungstypen

Festlegen des SCD-Typs für das CustomerName-Attribut

Wenn nun Korrekturen in der Quelldatenbank vorgenommen werden, wird der entsprechende Datensatz im Data Warehouse aktualisiert, wie unten gezeigt. Dies wird in einem Data Warehouse als Typ-1-Dimension bezeichnet.

Kundendimensionstabelle vor der Korrektur

scd datawarehouse 2

Kundendimensionstabelle mit SCD1 auf Feld Kundenname angewendet

scd datawarehouse 3

Vergleich von aktuellen und vergangenen Daten in einem dimensionalen Data Warehouse

Eine der Schlüsselfunktionen des Enterprise Data Warehouse ist die Unterstützung einer langfristigen strategischen Analyse, bei der Änderungen innerhalb eines Attributs beibehalten und über einen längeren Zeitraum verfolgt werden müssen.

Angenommen, Ihr Unternehmen hat kürzlich mehrere Bezirksniederlassungen zusammengelegt und neue Regionen für seine Filialen geschaffen. Wenn Sie verfolgen möchten, wie sich die Umstrukturierung auf die Vertriebsleistung auswirkt, können Sie das Feld "Distrikt" als eine sich langsam ändernde Dimension des Typs 2 behandeln. Dadurch wird sichergestellt, dass Änderungen an Geschäftsbezirken als neue Datensätze in der Tabelle angezeigt werden.

In DWB können Sie die Option SCD2 - Aktualisieren und Einfügen für das Feld Distrikt in der Dimensionstabelle Speichern anwenden. Wenn Änderungen am Quellattribut vorgenommen werden, werden neue Versionen des Datensatzes erstellt und in die Dimensionstabelle eingefügt, wobei jedem ein eindeutiger Ersatzschlüssel zugewiesen wird. Basierend auf der Art der Analyse, die das Unternehmen durchführen möchte, können Sie auch die Optionen Datum des Inkrafttretens und des Ablaufdatums auswählen, damit Änderungen in Geschäftsregionen für einen bestimmten Zeitraum nachverfolgt werden können.

Die folgende Tabelle zeigt, wie sich diese Konfigurationen auf die Ausgabe Ihrer Dimensionstabelle auswirken würden.

Bestehende Tabelle

scd-Typen

Aktualisierte Tabelle - SCD2 (Datum des Inkrafttretens und Ablaufdatum)

Verfolgen von Statusänderungen

Bestimmte Abteilungen, wie z. B. die Personalabteilung, erwarten häufige Änderungen an Datensätzen in ihren Systemen. Beispielsweise kann sich die Bezeichnung eines Mitarbeiters mehrmals im Jahr ändern. In diesen Fällen möchten Unternehmen im Allgemeinen in der Lage sein, den Datenverlauf zu pflegen und ihn dennoch schnell auf der Grundlage des aktuellsten Attributwerts abzufragen.
In DWB können Sie diese Situation beheben, indem Sie den Jobtitel als SCD6-Feld einrichten. Dies bedeutet, dass die Tabelle Elemente von SCD1, SCD2 und SCD3 verwendet, um Änderungen in diesem Attribut aufzuzeichnen. Diese Elemente sind wie folgt:

  • Eine Zeile wird hinzugefügt, um Änderungen im Attribut zu verfolgen, sobald sie auftreten (SCD2).
  • Eine zusätzliche Spalte zeigt den aktuellen Wert für das Attribut (SCD3).
  • Das aktuelle Wertefeld wird überschrieben, um den aktualisierten Attributwert (SCD1) anzuzeigen.

Das folgende Beispiel zeigt, wie Änderungen am Feld Job_Title angezeigt werden, wenn SCD6 implementiert wird.

Aktuelle Tabelle

langsam ändernde Dimension im Datenlager

Aktualisierte Tabelle - SCD6 (aktives Flag, Datum des Inkrafttretens und Ablaufdatum)

Automatisieren Sie Ihr Enterprise SCD Data Warehouse

AsteraMit dem metadatengesteuerten Data Warehouse Builder können Sie Ihr Data Warehouse-Projekt in wenigen Tagen entwerfen, erstellen und bereitstellen. Mit einer umfassenden Palette an Funktionen zur dimensionalen Modellierung und einer robusten ETL-Plattform für die schnelle Zuordnung, das Laden und die Vorbereitung von Daten bieten wir Ihnen eine einzige Plattform mit allen Tools, die Sie für den Erfolg Ihrer EDW-Implementierung benötigen.

Sehen Sie sich an, wie unser Produkt Ihnen heute bei der Lösung Ihres Anwendungsfalls helfen kann. Klicken um mit unserem technischen Team in Kontakt zu treten.

FAQs
Wie das Gleiche andeutet, werden langsam veränderliche Dimensionstypen (SCD) verwendet, um die langsamen Änderungen innerhalb eines Data Warehouse im Laufe der Zeit zu erfassen, anstatt nach einem kontinuierlichen Zeitplan. Die SCD in einem Data Warehouse hilft bei der Berichterstellung historischer Daten und der Zuordnung von Dimensionsattributen zu beliebigen Daten.

Es gibt sechs Arten von sich langsam ändernden Dimensionen (SCD):

  • Typ 0 oder feste Abmessung: In dieser festen Dimension sind keine Änderungen erlaubt, da sich die Dimension nie ändert
  • Typ 1 oder keine Historie: Die Datensätze werden direkt ohne Datensätze mit historischen Werten dieses Typs aktualisiert.
  • Typ-2- oder Zeilenversionierung: In diesem Typ können neue Zusatzsätze angelegt und die geänderten Sätze mit Merkern und Betriebsdaten nachverfolgt werden.
  • Geben Sie 3 oder Spalte "Vorheriger Wert" ein: In diesem Typ können neue Spalten hinzugefügt und Änderungen an einem bestimmten Attribut verfolgt werden.
  • Typ 4 oder Verlaufstabelle: Es verwendet eine historische Tabelle, um alle Änderungen aufzuzeichnen, während der aktuelle Wert in einer Dimensionstabelle angezeigt wird.
  • Typ 6 oder Hybrid-SCD: Es kombiniert Techniken aus den SCD-Typen (Slowly Changing Dimension) 1, 2 und 3, um Veränderungen zu verfolgen

Einige der gängigen SCD-Beispiele und Anwendungsfälle im Data Warehouse sind:

  • Beheben von fehlerhaften Datensätzen
  • Vergleichen von Current Vs. Vergangene Daten 
  • Verfolgen von Statusänderungen