Ein automatisierter Ansatz für die Modellierung Ihrer sich langsam ändernden Dimensionen

By |2022-04-26T09:39:35+00:00April 13th, 2018|

Geschäftsdaten sind von Natur aus anfällig für Änderungen im Laufe der Zeit und wirken sich auf unterschiedliche Weise auf das Geschäft aus. In Data Warehouses erfordert die Auswirkung der Zeit auf unsere Dimensionsaufzeichnungen und Fakten eine sorgfältige Untersuchung des Repositorys, um das Ziel der Business Intelligence zu erfüllen, Entscheidungsträgern aktuelle Informationen bereitzustellen.

Die Frage ist, wie man am besten mit diesen Änderungen umgehen kann.

Die Entwicklung einer Dimensionstabelle oder eines Modells, das die unterschiedlichen Zustände Ihrer Daten in Bezug auf die Zeit erfasst, ist ein Hauptziel eines Enterprise Data Warehouse. Für Kennzahlen in unseren Faktentabellen können wir Datumsdimensionen verwenden und diese mit Fremdschlüsseln verknüpfen. Bei Dimensionen nimmt die Komplexität der Handhabung von Änderungen stark zu. Jeder Schritt des SCD-Flusses (Slowly Changing Dimension) muss mithilfe mehrerer komplexer SQL-Anweisungen manuell codiert werden. Die Implementierung ist langwierig und komplex und beeinträchtigt die Fähigkeit des Unternehmens, seine Daten schnell und zuverlässig zu pflegen – was immer ein kritischer Aspekt ist.

Maße langsam ändern in Astera Centerprise

Verglichen mit dem traditionellen, handcodierten Ansatz für den sich langsam ändernden Dimensionsfluss Astera bietet eine automatisierte Implementierung mit einer vollständig Drag-and-Drop-Oberfläche. Quellsystemdaten werden einem SCD-Objekt in zugeordnet Centerprise, die vom System generierte SQL-Anweisungen direkt an das Zieldatenspeicher weiterleitet (Lesen: Pushdown-Optimierungsmodus in Centerprise) basierend auf den vom Benutzer definierten Feldlayouts. Jede Spalte in der Tabelle des Benutzers kann als Ersatzschlüssel, Business Key, SCD1, SCD2 usw. (siehe unten) innerhalb der Eigenschaften der Komponente in angegeben werden Centerprise. Die Plattform verarbeitet die Aktualisierungsstrategie, Leistungsüberlegungen, Routing und komplexe Joins automatisch im Back-End, solange die SCD-Feldtypen richtig definiert sind.

Automatisierung der Implementierung von sich langsam ändernden Dimensionen von Typ 1 und 2

Centerprise unterstützt langsam veränderliche Dimensionen vom Typ 1 und Typ 2, um Datensätze mit und ohne Beibehaltung des Verlaufs zu aktualisieren.

SCD-Typ 1

Bei diesem Typ handelt es sich um Aktualisierungen in der Dimensionstabelle. In Fällen, in denen die Erhaltung des Verlaufs keine Rolle spielt, müssen Sie die alten Werte in Ihrer Tabelle durch die letzten ersetzen.

Um die langsam veränderliche Bemaßung zu verwenden, geben Sie 1 Zoll ein Centerprisekönnen Sie Ihre Spalte als "SCD1 - Update" im Menü Layoutfelder des SCD-Objekts in markieren Centerprise.

SCD-Typ 2

Dieser Typ behandelt die Änderungen in Ihrer Dimension, die verfolgt werden müssen. Bei jeder Änderung wird ein neuer Datensatz eingefügt, und der vorhandene Datensatz wird nach Datum, Version oder Status als abgelaufen markiert.

Um die langsam veränderliche Bemaßung zu verwenden, geben Sie 2 Zoll ein Centerprise, markieren Sie die ausgewählte Spalte als „SCD2 – Update and Insert“.

Push-Down-Optimierung

Sobald das Layout definiert und der Ablauf ausgeführt wurde, wird die Astera Die SCD-Umwandlung generiert den SQL-Code, der zum Vergleichen, Verbinden, Weiterleiten und Einfügen von Daten in Ihrer Zieldimension erforderlich ist, und überträgt die Umwandlungslogik zur Verarbeitung an eine Datenbank wie SQL Server.

Mit diesem Ansatz ist die Verwaltung von Attributen für große Dimensionen erheblich schneller, da die gesamte Verarbeitung von der Datenbank und nicht von der Datenbank durchgeführt wird Centerprise Server, der die Operationen ausführt und zwischen der Datenbank hin und her wechselt, um die Daten zu lesen, zu vergleichen und zu schreiben.

Weitere Informationen über die automatisierte Komponente für langsam ändernde Dimensionen in Centerprise Laden Sie das Whitepaper herunter, und wie Sie es verwenden, um Ihre Abmessungen zu verwalten. Verwalten langsam ändernder Bemaßungen mit Centerprise.

Verwandte Artikel

ETL: Was es bedeutet und warum ist es wichtig?

IDC prognostiziert, dass die Summe der globalen Daten bis 33 von 175 Zettabyte auf 2025 Zettabyte anwachsen wird. Diese enorme...
Mehr Infos or weiterlesen

Verwenden Sie Daten, um eine 360-Grad-Kundensicht zu erstellen

In der heutigen schnelllebigen Geschäftswelt müssen Unternehmen gute Kundenbeziehungen aufbauen, um der Konkurrenz einen Schritt voraus zu sein. Ein großer Teil...
Mehr Infos or weiterlesen

Erstellen und Orchestrieren eines ETL-Prozesses für das Partner-Onboarding

Das moderne Geschäftsumfeld hat sich in ein wettbewerbsorientiertes Schlachtfeld verwandelt. Ein starkes Netzwerk von Lieferanten, Wiederverkäufern und Anbietern ist unerlässlich ...
Mehr Infos or weiterlesen