Probleme bei der Kombination von Daten aus mehreren verschiedenen Quellen sind immer geblieben. Daher entwarfen Wissenschaftler der University of Minnesota 1991 das erste Datenintegrationssystem. Diese Big-Data-Integrationsplattformtechnik verwendete den ETL-Ansatz, der Daten aus mehreren Systemen und Quellen extrahiert, transformiert und in eine einheitliche Ansicht lädt.

In diesem Blog werden der Datenintegrationsprozess und die verschiedenen Datenintegrationstechniken und -technologien erörtert.

Datenintegrationstechniken

Was ist Datenintegration?

Das Konsolidieren von Daten aus mehreren Anwendungen und das Erstellen einer einheitlichen Ansicht wird als Datenintegration bezeichnet. Die Datenintegration wird zu einer wichtigen Strategie, da Unternehmen Informationen in verschiedenen Datenbanken speichern. Es hilft Geschäftsanwendern, Daten aus mehreren Quellen zu integrieren.

Ein E-Commerce-Unternehmen möchte beispielsweise Kundeninformationen aus mehreren Datenströmen oder Datenbanken wie Marketing, Vertrieb und Finanzen extrahieren. In diesem Fall würde eine Datenintegration helfen, die Daten aus verschiedenen Abteilungsdatenbanken zu konsolidieren. Datenanalysten können die resultierenden einheitlichen Daten für Berichte und Analysen verwenden.

Die Datenintegration ist eine Kernkomponente mehrerer wichtiger Datenmanagementprojekte. Zu solchen Projekten gehören:

  • Aufbau eines Enterprise Data Warehouse.
  • Migrieren von Daten von einer oder mehreren Datenbanken zu einer anderen.
  • Synchronisieren von Daten zwischen Anwendungen.

Infolgedessen verwenden Unternehmen Datenintegrationstools mit einer Vielzahl von Anwendungen, Technologien und Techniken Daten aus unterschiedlichen integrieren Quellen und erstellen Sie eine einzige Version der Wahrheit. Nachdem Sie nun den Datenintegrationsprozess verstanden haben, lassen Sie uns in die verschiedenen Datenintegrationsansätze, -techniken und -technologien eintauchen.

Arten von Datenintegrationstechniken

Datenintegrationsansätze entstehen, wenn Daten aus verschiedenen internen und externen Quellen eingehen. Dies wird durch eine der drei Arten von Datenintegrationstechniken erreicht. Der Ansatz hängt von der Ungleichheit, Komplexität und Anzahl der beteiligten Datenquellen ab.

Lassen Sie uns diese Datenintegrationstechniken einzeln betrachten und sehen, wie sie zur Verbesserung von Geschäftsprozessen beitragen können.

Datenkonsolidierung

Datenkonsolidierung

Wie der Name andeutet, Datenkonsolidierung kombiniert Daten aus verschiedenen Quellen, um ein zentrales Datenrepository oder einen Datenspeicher zu erstellen. Datenanalysten können dieses Repository für verschiedene Zwecke verwenden, z. B. für die Berichterstellung und Datenanalyse. Darüber hinaus kann es auch als Datenquelle für nachgelagerte Anwendungen dienen.

Die Datenlatenz ist ein Schlüsselfaktor, der die Datenkonsolidierung von anderen Datenintegrationstechniken unterscheidet. Unter Datenlatenz versteht man die Zeit, die benötigt wird, um Daten aus Datenquellen abzurufen und in den Datenspeicher zu übertragen. Je kürzer die Latenzzeit, desto aktuellere Daten stehen für Business Intelligence und Analysen im Datenspeicher zur Verfügung.

Im Allgemeinen gibt es normalerweise eine gewisse Latenz zwischen dem Zeitpunkt, zu dem Aktualisierungen mit den in Quellsystemen gespeicherten Daten erfolgen, und dem Zeitpunkt, zu dem diese Aktualisierungen im Data Warehouse oder in der Datenquelle widergespiegelt werden. Diese Latenz kann je nach Datenintegrationstechnologien und den spezifischen Anforderungen des Unternehmens variieren. Mit Fortschritten bei integrierten Big-Data-Technologien ist es jedoch möglich, Daten zu konsolidieren und Änderungen nahezu in Echtzeit oder in Echtzeit an das Ziel zu übertragen.

Datenföderation

Die Datenföderation konsolidiert Daten und vereinfacht den Zugriff für konsumierende Benutzer und Front-End-Anwendungen. Bei der Datenföderationstechnik werden verteilte Daten mit unterschiedlichen Modellen in eine virtuelle Datenbank mit einem einheitlichen Datenmodell integriert.

Hinter einer föderierten virtuellen Datenbank findet keine physische Datenverschiebung statt. Stattdessen schafft die Datenabstraktion eine einheitliche Benutzeroberfläche für den Datenzugriff und -abruf. Daher wird die Abfrage jedes Mal, wenn ein Benutzer oder eine Anwendung die föderierte virtuelle Datenbank abfragt, zerlegt und an die relevante zugrunde liegende Datenquelle gesendet. Mit anderen Worten, die Daten werden im Datenverbund auf Abrufbasis bereitgestellt, im Gegensatz zum Echtzeit-Datenintegrationsansatz, bei dem Daten integriert werden, um einen separaten zentralisierten Datenspeicher aufzubauen.

Middleware-Integration

Unter Middleware-Integrationstechniken versteht man Methoden, die einen reibungslosen Datenaustausch zwischen verschiedenen Systemen ermöglichen. Diese Software fungiert als Brücke zwischen verschiedenen Systemen und ermöglicht es ihnen, effektiv zu kommunizieren und Informationen auszutauschen. Zu den gängigen Techniken gehören nachrichtenorientierte Middleware (MOM), serviceorientierte Architektur (SOA), Enterprise Service Bus (ESB), Extrahieren, Transformieren, Laden (ETL) und Anwendungsprogrammierschnittstellen (APIs). Diese Techniken ermöglichen eine nahtlose Kommunikation, Datentransformation und Integration zwischen unterschiedlichen Systemen.

Datenweitergabe

Die Datenweitergabe ist eine weitere Technik zur Datenintegration. Dabei werden Daten aus einem Enterprise Data Warehouse nach den erforderlichen Transformationen in verschiedene Data Marts übertragen. Da die Daten im Data Warehouse weiterhin aktualisiert werden, werden Änderungen synchron oder asynchron an den Quell-Data-Mart weitergegeben. Zu den beiden gängigen Datenintegrationstechnologien für die Datenweitergabe gehören Enterprise Application Integration (EAI) und Enterprise Data Replication (EDR). Lassen Sie uns diese Datenintegrationstechnologien im Folgenden besprechen.

Unterschiedliche Datenintegrationstechnologien

Die Datenintegrationstechnologie hat sich in den letzten zehn Jahren rasant weiterentwickelt. Ursprünglich war Extract, Transform, Load (ETL) die einzige verfügbare Technologie für die Stapeldatenintegration. Als Unternehmen jedoch immer mehr Quellen zu ihrem Datenökosystem hinzufügten, entstand der Bedarf an Echtzeit-Datenintegrationstechnologien. Daher wurden neue Fortschritte und Technologien eingeführt:

Hier finden Sie eine Zusammenfassung der heute am häufigsten verwendeten Datenintegrationstechnologien:

Extrahieren, Transformieren, Laden (ETL)

Die bekannteste Datenintegrationstechnologie, ETL bzw Extrahieren, transformieren, laden, ist ein Datenintegrationsprozess, bei dem Daten aus einem Quellsystem extrahiert und nach der Transformation in ein Ziel geladen werden.

Der Haupteinsatzbereich von ETL ist die Datenkonsolidierung. Es kann stapelweise oder mithilfe von Change Data Capture (CDC) nahezu in Echtzeit durchgeführt werden. Der Hauptanwendungsfall für Batch-ETL-Massenbewegungen großer Datenmengen ist die Datenmigration. Andererseits ist der CDC eine geeignetere Wahl für die Übertragung von Änderungen oder aktualisierten Daten an das Ziel.

Der ETL-Prozess beinhaltet das Extrahieren von Daten aus einer Datenbank, einer ERP-Lösung, einer Cloud-Anwendung oder einem Dateisystem und deren Übertragung in eine andere Datenbank oder ein Datenrepository. Die an den Daten durchgeführten Transformationen variieren je nach Anwendungsfall der Datenverwaltung. Zu den gängigen Transformationen gehören jedoch Datenbereinigung, Qualität, Aggregation und Abgleich.

Integration von Unternehmensinformationen (EII)

Enterprise Information Integration (EII) ist eine Datenintegrationstechnologie, die kuratierte Datensätze nach Bedarf bereitstellt. EII wird auch als eine Art Datenföderationstechnologie angesehen und beinhaltet die Erstellung einer virtuellen Ebene oder einer Geschäftsansicht der zugrunde liegenden Datenquellen.

Diese Ebene schützt die verbrauchenden Anwendungen und Geschäftsbenutzer vor der Komplexität der Verbindung zu mehreren Quellsystemen mit unterschiedlichen Formaten, Schnittstellen und Semantiken. Mit anderen Worten, EII ist ein Datenintegrationsansatz, der es Entwicklern und Geschäftsanwendern ermöglicht, eine Reihe von Datenquellen so zu behandeln, als wären sie eine einzige Datenbank. Diese Technologie ermöglicht es ihnen, eingehende Daten auf neue Weise zu präsentieren.

Im Gegensatz zu Batch-ETL EII kann problemlos Echtzeit verarbeiten Anwendungsfälle für Datenintegration und -bereitstellung, die es Geschäftsanwendern ermöglichen, aktuelle Daten für die Datenanalyse und Berichterstellung zu verwenden.

Enterprise Data Replication (EDR)

Enterprise Data Replication (EDR) wird als Datenweitergabetechnik eingesetzt und ist eine Datenkonsolidierungsmethode in Echtzeit. Dabei werden Daten von einem Speichersystem auf ein anderes verschoben. In seiner einfachsten Form besteht EDR darin, einen Datensatz von einer Datenbank in eine andere mit demselben Schema zu verschieben. In letzter Zeit ist der Prozess komplexer geworden und umfasst unterschiedliche Quell- und Zieldatenbanken. Die Daten werden außerdem in regelmäßigen Abständen, in Echtzeit oder sporadisch repliziert, je nach den Anforderungen des Unternehmens.

Während EDR und ETL Massenbewegungen von Daten beinhalten, ist EDR anders, da es keine Datentransformation oder -manipulation beinhaltet.

Zusätzlich zu diesen drei wichtigen Datenintegrationstechnologien verwenden Unternehmen mit komplexen Datenverwaltungsarchitekturen auch Enterprise Application Integration (EAI), Datenerfassung ändern (CDC)und andere ereignisbasierte und Echtzeit-Technologien, um mit den Datenanforderungen ihrer Geschäftsbenutzer Schritt zu halten.

Datenintegration mit Astera Centerprise

Möchten Sie eine automatisierte Datenintegrationsplattform für Ihr Unternehmen implementieren? Erfahren Sie im Detail, wie Astera Wenn Sie diese Datenintegrationstechniken nutzen und ein agiles Datenökosystem erstellen möchten, wenden Sie sich an unsere Supportabteilung unter [E-Mail geschützt] und finden Sie heraus, welcher Datenintegrationsansatz für Ihren Anwendungsfall geeignet ist, oder Laden Sie eine kostenlose Testversion von herunter Centerprise und gleich loslegen!

Weitere verwandte Artikel

Anmeldung für Newsletter!