Blogs

Home / Blogs / Ein automatisierter Ansatz zur Modellierung Ihrer sich langsam ändernden Dimensionen

Inhaltsverzeichnis
Die automatisierte, Kein Code Datenstapel

Erfahren Sie, wie Astera Data Stack kann die Datenverwaltung Ihres Unternehmens vereinfachen und rationalisieren.

Ein automatisierter Ansatz für die Modellierung Ihrer sich langsam ändernden Dimensionen

March 24th, 2023

Geschäftsdaten sind von Natur aus anfällig für Änderungen im Laufe der Zeit und wirken sich auf unterschiedliche Weise auf das Geschäft aus. In Data Warehouses erfordert die Auswirkung der Zeit auf unsere Dimensionsaufzeichnungen und Fakten eine sorgfältige Untersuchung des Repositorys, um das Ziel der Business Intelligence zu erfüllen, Entscheidungsträgern aktuelle Informationen bereitzustellen.

Die Frage ist, wie man am besten mit diesen Änderungen umgehen kann.

Die Entwicklung einer Dimensionstabelle oder eines Modells, das die unterschiedlichen Zustände Ihrer Daten in Bezug auf die Zeit erfasst, ist ein Hauptziel eines Enterprise Data Warehouse. Für Kennzahlen in unseren Faktentabellen können wir Datumsdimensionen verwenden und diese mit Fremdschlüsseln verknüpfen. Bei Dimensionen nimmt die Komplexität der Handhabung von Änderungen stark zu. Jeder Schritt des SCD-Flusses (Slowly Changing Dimension) muss mithilfe mehrerer komplexer SQL-Anweisungen manuell codiert werden. Die Implementierung ist langwierig und komplex und beeinträchtigt die Fähigkeit des Unternehmens, seine Daten schnell und zuverlässig zu pflegen – was immer ein kritischer Aspekt ist.

Maße langsam ändern in Astera Centerprise

Verglichen mit dem traditionellen, handcodierten Ansatz für den sich langsam ändernden Dimensionsfluss Astera bietet eine automatisierte Implementierung mit einer vollständig Drag-and-Drop-Oberfläche. Quellsystemdaten werden einem SCD-Objekt in zugeordnet Centerprise, die vom System generierte SQL-Anweisungen direkt an das Zieldatenspeicher weiterleitet (Lesen: Pushdown-Optimierungsmodus in Centerprise) basierend auf den vom Benutzer definierten Feldlayouts. Jede Spalte in der Tabelle des Benutzers kann als Ersatzschlüssel, Business Key, SCD1, SCD2 usw. (siehe unten) innerhalb der Eigenschaften der Komponente in angegeben werden Centerprise. Die Plattform verarbeitet die Aktualisierungsstrategie, Leistungsüberlegungen, Routing und komplexe Joins automatisch im Back-End, solange die SCD-Feldtypen richtig definiert sind.

Automatisierung der Implementierung von sich langsam ändernden Dimensionen von Typ 1 und 2

Centerprise unterstützt langsam veränderliche Dimensionen vom Typ 1 und Typ 2, um Datensätze mit und ohne Beibehaltung des Verlaufs zu aktualisieren.

SCD-Typ 1

Bei diesem Typ handelt es sich um Aktualisierungen in der Dimensionstabelle. In Fällen, in denen die Erhaltung des Verlaufs keine Rolle spielt, müssen Sie die alten Werte in Ihrer Tabelle durch die letzten ersetzen.

Um die langsam veränderliche Bemaßung zu verwenden, geben Sie 1 Zoll ein Centerprisekönnen Sie Ihre Spalte als "SCD1 - Update" im Menü Layoutfelder des SCD-Objekts in markieren Centerprise.

SCD-Typ 2

Dieser Typ behandelt die Änderungen in Ihrer Dimension, die verfolgt werden müssen. Bei jeder Änderung wird ein neuer Datensatz eingefügt, und der vorhandene Datensatz wird nach Datum, Version oder Status als abgelaufen markiert.

Um die langsam veränderliche Bemaßung zu verwenden, geben Sie 2 Zoll ein Centerprise, markieren Sie die ausgewählte Spalte als „SCD2 – Update and Insert“.

Push-Down-Optimierung

Sobald das Layout definiert und der Ablauf ausgeführt wurde, wird die Astera Die SCD-Umwandlung generiert den SQL-Code, der zum Vergleichen, Verbinden, Weiterleiten und Einfügen von Daten in Ihrer Zieldimension erforderlich ist, und überträgt die Umwandlungslogik zur Verarbeitung an eine Datenbank wie SQL Server.

Mit diesem Ansatz ist die Verwaltung von Attributen für große Dimensionen erheblich schneller, da die gesamte Verarbeitung von der Datenbank und nicht von der Datenbank durchgeführt wird Centerprise Server, der die Operationen ausführt und zwischen der Datenbank hin und her wechselt, um die Daten zu lesen, zu vergleichen und zu schreiben.

Weitere Informationen über die automatisierte Komponente für langsam ändernde Dimensionen in Centerprise Laden Sie das Whitepaper herunter, und wie Sie es verwenden, um Ihre Abmessungen zu verwalten. Verwalten langsam ändernder Bemaßungen mit Centerprise.

Reduzieren Sie die Data-Warehouse-Entwicklungszeit um bis zu 80 %
Neuer Handlungsaufruf
Sie können auch mögen
Was ist ein Datenkatalog? Funktionen, Best Practices und Vorteile
Sternschema Vs. Snowflake-Schema: 4 Hauptunterschiede
So laden Sie Daten von AWS S3 in Snowflake
In Anbetracht Astera Für Ihre Datenverwaltungsanforderungen?

Stellen Sie eine codefreie Konnektivität mit Ihren Unternehmensanwendungen, Datenbanken und Cloud-Anwendungen her, um alle Ihre Daten zu integrieren.

Lassen Sie uns jetzt eine Verbindung herstellen!
Lass uns verbinden