Im Gegensatz zu einem Data Warehouse, das unternehmensweite Daten speichert, enthält ein Data Mart Informationen zu einer bestimmten Abteilung oder einem bestimmten Themenbereich. Ein Sales-Datamart kann beispielsweise nur Daten zu Produkten, Kunden und Verkäufen enthalten. Lesen Sie diesen Blog, um ein besseres Verständnis dieser Abteilungsdaten-Repositorys zu entwickeln.
Was sind Data Marts?
Data Marts sind eine Teilmenge des Data Warehouse, die sich mit einem einzigen Sachverhalt befasst. Sie werden oft von einer einzigen Fachabteilung erstellt und verwaltet. Da sie themenorientiert sind, beziehen sie in der Regel nur Daten aus einer kleinen Anzahl von Quellen, bei denen es sich um interne Betriebssysteme handeln kann. Daten See, eine zentralisierte Daten-Repository, oder externe Quellen. Sie sind in der Regel kompakter und weniger komplex als Data Warehouses, wodurch sie einfacher aufzubauen und zu warten sind.
Nachdem wir nun verstanden haben, was sie sind, werden wir uns die drei verschiedenen Arten von Data Mart-Beispielen, ihre Verwendung und die Vereinfachung der Datenverwaltung ansehen. Wir veranschaulichen auch eine Schritt-für-Schritt-Anleitung zur Implementierung eines abteilungsspezifischen Datenspeichers für Ihr spezifisches Unternehmen.
Quelle: Study.com
Wie profitieren Data Marts von der Datenbankverwaltung?
Bevor wir ihre verschiedenen Typen besprechen, lassen Sie uns kurz die Vorteile von Data Marts betrachten und warum sie für ein datengesteuertes Geschäft notwendig sind:
- Ermöglichen Sie einen schnelleren Datenzugriff, indem Sie einen bestimmten Datensatz für BI und Berichterstellung abrufen. Infolgedessen trägt es zur Beschleunigung von Business Intelligence bei.
- Sie sind einfacher zu implementieren und kostengünstiger als der Aufbau eines Unternehmens Data Warehouse.
- Entwickelt nach den Anforderungen einer bestimmten Benutzergruppe, die in einer bestimmten Abteilung arbeitet.
- Sie sind vergleichsweise anpassungsfähiger als ein Data Warehouse. Jede Änderung im Datenmodell kann aufgrund seiner geringeren Größe einfach und schnell in den Data Mart übernommen werden.
- Erlauben Sie granulare Zugriffskontrollrechte aufgrund umfassender Partitionierung und Segmentierung.
Kurz gesagt, sie sind viel schneller, anpassungsfähiger und kostengünstiger in der Wartung als ein Data Warehouse. Im Gegensatz dazu werden Data Warehouses erstellt, um Daten aus einer Vielzahl von Quellen (oftmals nicht in einem strukturierten Format) zu konsolidieren.
Arten von Data Marts
Data Marts können in drei Haupttypen eingeteilt werden:
1. Abhängig
Mit einem abhängigen Datamart können Sie alle Ihre Geschäftsdaten in einem einzigen zusammenfassen Data Warehouseund geben Ihnen die typischen Vorteile der Zentralisierung.
In diesem Beispiel werden abteilungsbezogene Datenspeicher benötigt, die Sie als abhängige Entitäten erstellen müssen, um Konsistenz und Integration über alle Datenspeichersysteme hinweg sicherzustellen.
Abhängige Data Marts können mit zwei unterschiedlichen Ansätzen aufgebaut werden. Im ersten Ansatz werden Enterprise Data Warehouses und Data Marts aufgebaut, damit der Bediener bei Bedarf auf beide zugreifen kann. Beim zweiten Ansatz, der auch als föderierter Ansatz bekannt ist, werden die Ergebnisse des ETL-Prozesses in einem temporären Speicherbereich wie einem gemeinsamen Datenbus anstelle eines physikalischen Speicherbereichs gespeichert Datenbank so kann der Operator nur auf die Abteilungsdaten zugreifen.
Letztere Methode ist nicht ideal, da sie gelegentlich zu einem Datenschrottplatz führt, auf dem alle Daten aus einer gemeinsamen Quelle stammen, aber meistens verworfen werden.
2. Unabhängig
Ein unabhängiger Data Mart kann ohne Verwendung des zentralen Data Warehouse erstellt werden. Es wird meistens für kleinere Einheiten oder Gruppen innerhalb einer Organisation empfohlen. Wie der Name schon sagt, ist diese Art von Repository weder mit dem Enterprise Data Warehouse noch mit einer anderen Entität verbunden. Es gibt Daten separat ein, und die Analysen werden auch unabhängig durchgeführt.
Da immer mehr unabhängige Data Marts aufgebaut werden, steigt auch die Datenredundanz im gesamten Unternehmen. Dies liegt daran, dass jeder unabhängige Datenspeicher eine eigene, in der Regel ein Duplikat der umfassenden Geschäftsinformationen benötigt. Da diese unabhängigen Datenspeicher direkt auf Dateien und/oder Tabellen des Betriebssystems zugreifen, sind sie erheblich Einschränkung der Skalierbarkeit der Decision Support Systeme (DSS).
3. Hybrid
Durch den Einsatz eines hybriden Data Marts können Sie neben einem Data Warehouse auch Daten aus mehreren operativen Quellsystemen zusammenführen. Diese sind besonders nützlich, wenn Sie eine Ad-hoc-Integration benötigen, z. B. um eine neue Gruppe oder neue Produkte zum Unternehmen hinzuzufügen.
Wie der Name schon sagt, ist ein hybrider Data Mart eine Mischung aus dem abhängigen und dem unabhängigen Typ. Es eignet sich für Unternehmen, die über mehrere Datenbanken verfügen und eine schnelle Bearbeitung benötigen. Beispiele für Data Marts dieser Art erfordern eine geringfügige Datenbereinigung, unterstützen riesige Speicherstrukturen und sind flexibel, da sie die Vorteile von abhängigen und unabhängigen Systemen kombinieren.
Entwerfen von Data Marts für Data Warehousing
So können Sie einen Data Mart für Ihre Unternehmensanforderungen entwerfen:
1. Formular Design
Der erste Schritt besteht darin, ein robustes Design zu erstellen. Einige kritische Prozesse in dieser Phase sind:
- Erfassung der betrieblichen und technischen Anforderungen.
- Datenquellen identifizieren.
- Auswahl einer geeigneten Teildatenmenge.
- Entwerfen des logischen Layouts (Datenbankschema) und der physischen Struktur.
2. Bauen / Konstruieren
Der nächste Schritt in diesem Prozess besteht darin, den Data Mart zu erstellen. Dazu gehört das Erstellen der physischen Datenbank und der logischen Strukturen. In dieser Phase erstellen Sie die Faktentabellen, Dimensionstabellen, Felder, Indizes und Zugriffssteuerungen.
3. Auffüllen / Datenübertragung
Der nächste Schritt besteht darin, den Mart zu füllen, was bedeutet, dass Daten hinein übertragen werden. In dieser Phase können Sie auch die Häufigkeit der Datenübertragung festlegen, z. B. täglich oder wöchentlich. Dieser Schritt beinhaltet normalerweise:
- Quelleninformationen extrahieren.
- Bereinigen und Transformieren der Daten.
- Laden der Daten in das Facharchiv.
- Erstellen der Metadaten und Speichern.
4. Datenzugriff
In diesem Schritt werden die in den Datamart geladenen Daten zum Abfragen, Generieren von Berichten, Diagrammen und Veröffentlichen verwendet. Die Hauptaufgaben in dieser Phase sind:
- Einrichten einer Metaschicht und Übersetzen von Datenbankstrukturen und Elementnamen in Unternehmensausdrücke, damit technisch nicht versierte Bediener den Data Mart problemlos verwenden können.
- Aufbau und Pflege von Datenbankstrukturen.
- Bei Bedarf können Sie auch API und Schnittstellen einrichten, um den Datenzugriff zu vereinfachen.
5. Verwalten
Der letzte Schritt umfasst Management und Beobachtung, die Folgendes umfasst:
- Kontrolle des laufenden Benutzerzugriffs.
- Optimierung und Verfeinerung des Zielsystems zur Leistungssteigerung.
- Hinzufügen und Verwalten neuer Daten in das Repository.
- Konfigurieren von Wiederherstellungseinstellungen und Sicherstellen der Systemverfügbarkeit im Fehlerfall.
Blick in die Zukunft – Data Marts und die Cloud
Data Marts bieten einen effizienten, flexiblen und skalierbaren Ansatz zum Speichern von Daten. On-Premise-Lösungen werden jedoch aufgrund der wachsenden Menge an eingehenden Daten schnell obsolet. Infolgedessen verlagern viele Unternehmen ihre Datenspeicherlösungen in die Cloud.
Eine Cloud-basierte Architektur ermöglicht es Unternehmen, ihre Daten online zu erstellen und zu speichern. Die Geschwindigkeit und Flexibilität dieses Ansatzes schaffen eine Gelegenheit für Analysen in der Cloud. Die Durchführung von Analysen in der Cloud ermöglicht eine größere Skalierbarkeit und Kosteneffizienz im Vergleich zu On-Premise-Optionen. Das ist nicht alles. Cloud-basierte Data Marts bieten darüber hinaus zahlreiche weitere Vorteile:
- Datenanalyse in Echtzeit.
- On-Demand-Zugriff auf Daten.
- Eine einheitliche Ansicht aller Data Marts.
- Zugriff auf Cloud-native Quellen und Ziele.
Fazit
Ein Data Mart umfasst einen Unterabschnitt unternehmensweiter Daten, die für eine bestimmte Benutzergruppe in der Organisation wertvoll sind. Im Gegensatz zu einem teuren und komplex zu erstellenden Data Warehouse bietet es eine kostengünstige Alternative. Es ermöglicht zudem einen schnelleren Datenzugriff und ist einfach zu bedienen, da es genau auf die Anforderungen der Betreiber zugeschnitten ist und sich auf einen einzigen Fachbereich/Fachbereich konzentriert.
Ein Data Mart kann Ihnen dabei helfen, Ihre Unternehmensprozesse zu beschleunigen, da die Implementierung weniger Zeit in Anspruch nimmt als ein Data Warehouse. Es enthält auch frühere Daten, sodass Ihre Datenanalysten leicht Datentrends ermitteln können.
Autoren:
- Tehreem Naeem