Bevorstehendes Webinar

Nehmen Sie an einem KOSTENLOSEN Webinar teil Automatisierte Verarbeitung von EDI-Dateien im Gesundheitswesen mit Astera

27. Juni 2024 – 11:1 Uhr PT / 2:XNUMX Uhr CT / XNUMX:XNUMX Uhr ET

Blogs

Startseite / Blogs / Was ist die beste Data Warehouse-Architektur für die Berichterstellung?

Inhaltsverzeichnis
Die automatisierte, Kein Code Datenstapel

Erfahren Sie, wie Astera Data Stack kann die Datenverwaltung Ihres Unternehmens vereinfachen und rationalisieren.

Was ist die beste Data Warehouse-Architektur für die Berichterstellung?

May 29th, 2024

Die meisten Unternehmen verlassen sich auf ein Data Warehouse als Single Source of Truth – ein konsolidiertes Datenrepository, das Unternehmen als Berichtsebene dient, um Trends zu erkennen und wertvolle Geschäftseinblicke zu gewinnen. Um jedoch die Leistung zu maximieren und das Beste aus einem Data Warehouse herauszuholen, ist es wichtig, die richtige Architektur zu wählen und ein gut definiertes Datenmodell zu erstellen.

Erfahren Sie mehr über die Data Warehouse-Architektur: Typen, Komponenten und Konzepte

Wenn wir über Data-Warehousing-Architekturen sprechen, haben Sie viele Optionen, darunter 3NF, Data Vault, dimensionale Modelle (Stern- und Schneeflockenschema) und One Big Table (OBT). Allerdings sind nicht alle davon für die Berichterstattung geeignet.

Ein wichtiger zu berücksichtigender Faktor ist der Grad der Normalisierung/Denormalisierung im Modell. Eine stark normalisierte Architektur ist aufgrund der höheren Anzahl von Tabellen und Beziehungen oft schwer zu konsumieren. Die für den Verbrauch erstellten Abfragen sind aufgrund einer großen Anzahl von Verknüpfungen zwischen den Entitäten ebenfalls sehr komplex. Werfen wir einen Blick auf all diese Data-Warehousing-Architekturen, um herauszufinden, welche die beste Berichtsoption ist.

3NF und Data Vault

Auf Anhieb ist klar, dass 3NF- und Data Vault-Modelle nicht als Berichtsebenen geeignet sind, da diese Modelle stark normalisiert sind. Diese Architekturen konzentrieren sich auf die Reduzierung der Datenredundanz, was natürlich zu einer erhöhten Anzahl von Tabellen führt. 3NF-Modelle werden hauptsächlich als ODS-Schicht (Operational Data Store) verwendet, die Daten aus mehreren Quellen in ein zentrales Repository zieht.

DatentresorAndererseits ist es auf Skalierbarkeit und Anpassungsfähigkeit im Hinblick auf das Hinzufügen neuer Datenquellen bei reduzierter Komplexität optimiert. Data Marts im Kimball-Stil basieren normalerweise auf einem Datentresor, da die direkte Verwendung des Tresors für die Berichterstellung aufgrund des Normalisierungsfaktors unpraktisch ist. Es kann jedoch zu Prüfzwecken verwendet werden.

Dimensionsmodelle

Dimensionsmodelle sind speziell dafür ausgelegt, als Berichtsebenen zu fungieren. Die denormalisierten Strukturen dieser Modelle führen zu einer verbesserten Abfrageleistung und einer einfacheren Nutzung. Es gibt zwei Arten von Schemas in dimensionalen Modellen: Sternschema und Schneeflockenschema. Der Hauptunterschied zwischen diesen beiden besteht darin, dass ein Schneeflockenschema normalisierte Dimensionen enthält, während ein Sternschema denormalisierte Dimensionen enthält.

Obwohl Snowflake verschiedene Vorteile bietet, einschließlich reduzierter Datenredundanz und einfacherer Navigation, ist ein Sternschema der klare Gewinner, wenn es ausschließlich um den Verbrauch für die Berichterstellung geht. Das liegt einfach daran, dass letztere denormalisierte Dimensionen enthält, was bedeutet, dass die Abfragen weniger kompliziert sind.

Darüber hinaus kann das Nachverfolgen historischer Daten mit sich langsam ändernden Dimensionen (SCDs) aufgrund von Eltern-Kind-Abhängigkeiten zwischen Dimensionen im Snowflake-Schema mühsam sein. Dieses Problem ist in einem Sternschema nicht vorhanden.

OBT (Ein großer Tisch)

Bisher haben wir festgestellt, dass der Grad der Normalisierung/Denormalisierung der Schlüssel zur Identifizierung ist, ob eine Architektur für die Berichterstellung geeignet ist. Nach dieser Logik bleibt das Star-Schema die bevorzugte Option. OBT geht jedoch noch einen Schritt weiter, indem es den höchstmöglichen Grad an Denormalisierung bietet. Es kombiniert alle Tabellen, um eine große Tabelle zu erstellen, die alle Daten enthält.

Wenn die Denormalisierung wirklich das Geheimnis einer soliden Berichtsschicht ist, sollte die OBT-Architektur eine offensichtliche Wahl für BI-Experten sein. Aber ist es wirklich so einfach?

Nicht wirklich. Hier ist, was dem Star-Schema den Vorteil gegenüber OBT verschafft: Star-Schemas sind optimiert, um historische Daten zu verfolgen, was eine unverzichtbare Voraussetzung für Analysezwecke ist. Darüber hinaus enthalten sie oft wiederverwendbare angepasste Dimensionen, die einfach zu warten und zu skalieren sind, um unternehmensübergreifende Berichte und Analysen zu unterstützen.

Obwohl OBT beim Abfragen von Daten eine hervorragende Leistung bietet, insbesondere bei einer spaltenorientierten Datenbank, hat die Architektur einige eigene Probleme. Da alles in eine Tabelle gepackt wird, ist die Datenredundanz hoch, was die Wartung der Architektur erschwert. Auch die Aufbewahrung historischer Daten durch SCDs ist, obwohl nicht unmöglich, eine weitaus komplexere Aufgabe.

Das Erstellen von Berichten basierend auf aktuellen Daten ist mit OBT einfach, aber wenn es um historische Berichte geht, kann es kompliziert werden, was für viele BI-Experten ein Dealbreaker sein kann.

Zusammenfassung

Basierend auf der obigen Analyse kann man mit Sicherheit zu dem Schluss kommen, dass ein Sternschema wirklich die am besten geeignete Architektur für die Berichterstellung ist. Während andere Architekturen ihre eigenen Vorteile haben, bietet ein Sternschema die perfekte Balance zwischen dem Grad der Denormalisierung, der für weniger komplexe Abfragen erforderlich ist.

Ein Sternschema bietet auch strukturelle Vorteile, wie z. B. die Verwaltung historischer Daten und Benutzerfreundlichkeit, wodurch es sich von den anderen Architekturen abhebt. Das Erstellen eines Sternschemas von Grund auf mit einem OLTP-System als Ausgangspunkt kann eine Herausforderung und zeitaufwändig sein. Gott sei Dank, Astera DWB Builder bietet die ideale Lösung für dieses Problem.

Astera DW Builder verfügt über einen integrierten Datenmodelldesigner, eine Click-and-Point-Oberfläche und die Möglichkeit, Entitäten zu normalisieren oder zu denormalisieren, ohne Code schreiben zu müssen. Mit dem intuitiven Designer können Sie neue Tabellen/Felder hinzufügen und bestehende Strukturen mit nur wenigen Drag-and-Drop-Operationen ändern.

Darüber hinaus können Sie mit der Automatisierungsfunktion für dimensionale Modelle mit nur wenigen Klicks ein Sternschema direkt aus einer vorhandenen Architektur erstellen. Das Erstellen und Verwenden von Sternschemata für die Berichterstellung war noch nie so einfach!

Wenn Sie den agilen Weg zum Aufbau Ihres Data Warehouse erkunden möchten, erreichen Sie uns unter [E-Mail geschützt] heute.

Erfahren Sie mehr über dimensionale Modellierung: Übersicht, Vorteile und Designtipps

Sie können auch mögen
Data Science vs. Data Analytics: Hauptunterschiede
Was ist die beste Data Warehouse-Architektur für die Berichterstellung?
Was ist OLAP (Online Analytical Processing)?
In Anbetracht Astera Für Ihre Datenverwaltungsanforderungen?

Stellen Sie eine codefreie Konnektivität mit Ihren Unternehmensanwendungen, Datenbanken und Cloud-Anwendungen her, um alle Ihre Daten zu integrieren.

Lassen Sie uns jetzt eine Verbindung herstellen!
Lass uns verbinden