Was ist ein Data-Mart? Design, Beispiele und Implementierung erklärt

By |2022-03-28T11:35:51+00:00Oktober 21st, 2019|

Im Gegensatz zu einem Data Warehouse, das unternehmensweite Daten speichert, enthält ein Data Mart Informationen zu einer bestimmten Abteilung oder einem bestimmten Themenbereich. Ein Sales-Datamart kann beispielsweise nur Daten zu Produkten, Kunden und Verkäufen enthalten. Lesen Sie diesen Blog, um ein besseres Verständnis dieser Abteilungsdaten-Repositorys zu entwickeln.

Was sind Data Marts?

Data Marts sind eine Teilmenge des Data Warehouse, die sich mit einer einzigen Angelegenheit befasst. Sie werden oft von einer einzigen Geschäftsabteilung aufgebaut und verwaltet. Da sie subjektorientiert sind, beziehen sie in der Regel nur Daten aus einer kleinen Anzahl von Quellen, bei denen es sich um interne Betriebssysteme, Data Lakes, ein zentrales Datenrepository oder externe Quellen handeln kann. Sie sind normalerweise komprimiert und weniger kompliziert als Data Warehouses, wodurch sie einfacher zu erstellen und zu warten sind.

Nachdem wir nun verstanden haben, was sie sind, werden wir uns die drei verschiedenen Arten von Data Mart-Beispielen, ihre Verwendung und die Vereinfachung der Datenverwaltung ansehen. Wir veranschaulichen auch eine Schritt-für-Schritt-Anleitung zur Implementierung eines abteilungsspezifischen Datenspeichers für Ihr spezifisches Unternehmen.

Arten von Data Marts

Quelle: Study.com

Wie profitieren Data Marts von der Datenbankverwaltung?

Bevor wir ihre verschiedenen Typen besprechen, lassen Sie uns kurz die Vorteile von Data Marts betrachten und warum sie für ein datengesteuertes Geschäft notwendig sind:

  • Ermöglichen Sie einen schnelleren Datenzugriff, indem Sie einen bestimmten Datensatz für BI und Berichterstellung abrufen. Infolgedessen trägt es zur Beschleunigung von Business Intelligence bei.
  • Sie sind einfacher zu implementieren und kostengünstiger als der Aufbau eines Unternehmens Data Warehouse.
  • Entwickelt nach den Anforderungen einer bestimmten Benutzergruppe, die in einer bestimmten Abteilung arbeitet.
  • Sie sind vergleichsweise anpassungsfähiger als ein Data Warehouse. Jede Änderung im Datenmodell kann aufgrund seiner geringeren Größe einfach und schnell in den Data Mart übernommen werden.
  • Erlauben Sie granulare Zugriffskontrollrechte aufgrund umfassender Partitionierung und Segmentierung.

Kurz gesagt, Data Marts sind viel schneller, anpassungsfähiger und kostengünstiger zu warten als ein Data Warehouse. Im Gegensatz dazu werden Data Warehouses erstellt, um Daten aus einer Vielzahl von Quellen (oftmals nicht in einem strukturierten Format) zu konsolidieren.

Arten von Data Marts

Data Marts können in drei Haupttypen eingeteilt werden:

1. Abhängiger Datenmarkt

Mit einem abhängigen Datamart können Sie alle Ihre Geschäftsdaten in einem einzigen zusammenfassen Data Warehouseund geben Ihnen die typischen Vorteile der Zentralisierung.

In diesem Data-Mart-Beispiel werden abteilungsbezogene Datenspeicher benötigt, die Sie als abhängige Entitäten erstellen müssen, um Konsistenz und Integration über alle Datenspeichersysteme hinweg sicherzustellen.

Abhängige Data Marts können mit zwei unterschiedlichen Ansätzen aufgebaut werden. Im ersten Ansatz werden Enterprise Data Warehouses und Data Marts aufgebaut, damit der Bediener bei Bedarf auf beide zugreifen kann. Beim zweiten Ansatz, der auch als föderierter Ansatz bekannt ist, werden die Ergebnisse des ETL-Prozesses in einem temporären Speicherbereich wie einem gemeinsamen Datenbus anstelle eines physikalischen Speicherbereichs gespeichert Datenbank so kann der Operator nur auf die Abteilungsdaten zugreifen.

Letztere Methode ist nicht ideal, da sie gelegentlich zu einem Datenschrottplatz führt, auf dem alle Daten aus einer gemeinsamen Quelle stammen, aber meistens verworfen werden.

2. Unabhängiger Data Mart

Ein unabhängiger Data Mart kann ohne Verwendung des zentralen Data Warehouse erstellt werden. Es wird meistens für kleinere Einheiten oder Gruppen innerhalb einer Organisation empfohlen. Wie der Name schon sagt, ist diese Art von Repository weder mit dem Enterprise Data Warehouse noch mit einer anderen Entität verbunden. Es gibt Daten separat ein, und die Analysen werden auch unabhängig durchgeführt.

Da immer mehr unabhängige Data Marts aufgebaut werden, steigt auch die Datenredundanz im gesamten Unternehmen. Dies liegt daran, dass jeder unabhängige Datenspeicher eine eigene, in der Regel ein Duplikat der umfassenden Geschäftsinformationen benötigt. Da diese unabhängigen Datenspeicher direkt auf Dateien und/oder Tabellen des Betriebssystems zugreifen, sind sie erheblich Einschränkung der Skalierbarkeit der Decision Support Systeme (DSS).

3. Hybrider Data Mart

Durch den Einsatz eines hybriden Data Marts können Sie neben einem Data Warehouse auch Daten aus mehreren operativen Quellsystemen zusammenführen. Diese sind besonders nützlich, wenn Sie eine Ad-hoc-Integration benötigen, z. B. um eine neue Gruppe oder neue Produkte zum Unternehmen hinzuzufügen.

Wie der Name schon sagt, ist ein hybrider Data Mart eine Mischung aus dem abhängigen und dem unabhängigen Typ. Es eignet sich für Unternehmen, die über mehrere Datenbanken verfügen und eine schnelle Bearbeitung benötigen. Beispiele für Data Marts dieser Art erfordern eine geringfügige Datenbereinigung, unterstützen riesige Speicherstrukturen und sind flexibel, da sie die Vorteile von abhängigen und unabhängigen Systemen kombinieren.

Entwerfen von Data Marts für Data Warehousing

So können Sie einen Data Mart für Ihre Unternehmensanforderungen entwerfen:

1. Formular Design

Der erste Schritt besteht darin, ein robustes Design zu erstellen. Einige kritische Prozesse in dieser Phase umfassen das Sammeln der Unternehmens- und technischen Anforderungen, das Identifizieren von Datenquellen, das Auswählen einer geeigneten Datenuntermenge und das Entwerfen des logischen Layouts (Datenbankschema) und der physischen Struktur.

2. Bauen / Konstruieren

Der nächste Schritt ist, es zu konstruieren. Dazu gehört das Erstellen der physischen Datenbank und der logischen Strukturen. In dieser Phase erstellen Sie die Faktentabellen, Dimensionstabellen, Felder, Indizes und Zugriffssteuerungen.

3. Auffüllen / Datenübertragung

Der nächste Schritt besteht darin, den Mart zu bevölkern, was bedeutet, dass Daten hinein übertragen werden. In dieser Phase können Sie auch die Häufigkeit der Datenübertragung einstellen, beispielsweise täglich oder wöchentlich. Dies beinhaltet normalerweise das Extrahieren von Quellinformationen, das Bereinigen und Transformieren der Daten und das Laden in das Abteilungsrepository.

4. Datenzugriff

In diesem Schritt werden die in den Data Mart geladenen Daten zum Abfragen, Generieren von Berichten, Diagrammen und Veröffentlichen verwendet. Die Hauptaufgabe in dieser Phase besteht darin, eine Meta-Schicht einzurichten und Datenbankstrukturen und Elementnamen in Unternehmensausdrücke zu übersetzen, damit nicht-technische Bediener den Data Mart problemlos verwenden können. Bei Bedarf können Sie auch APIs und Schnittstellen einrichten, um den Datenzugriff zu vereinfachen.

5. Verwalten

Der letzte Schritt umfasst Management und Beobachtung, die Folgendes umfasst:

  • Kontrolle des laufenden Benutzerzugriffs.
  • Optimierung und Verfeinerung des Zielsystems zur Leistungssteigerung.
  • Hinzufügen und Verwalten neuer Daten in das Repository.
  • Konfigurieren von Wiederherstellungseinstellungen und Sicherstellen der Systemverfügbarkeit im Fehlerfall.

Fazit

Ein Data Mart umfasst einen Unterabschnitt unternehmensweiter Daten, die für eine bestimmte Benutzergruppe in der Organisation wertvoll sind. Im Gegensatz zu einem teuren und komplex zu erstellenden Data Warehouse bietet es eine kostengünstige Alternative. Es ermöglicht zudem einen schnelleren Datenzugriff und ist einfach zu bedienen, da es genau auf die Anforderungen der Betreiber zugeschnitten ist und sich auf einen einzigen Fachbereich/Fachbereich konzentriert.

Ein Data Mart kann Ihnen dabei helfen, Ihre Unternehmensprozesse zu beschleunigen, da die Implementierung weniger Zeit in Anspruch nimmt als ein Data Warehouse. Es enthält auch frühere Daten, sodass Ihre Datenanalysten leicht Datentrends ermitteln können.