A Studie von IDC prognostiziert, dass das weltweite Datenvolumen bis 175 auf enorme 2025 Zettabyte (ZB) anwachsen wird. Die Verwaltung wachsender Datenmengen aus unterschiedlichen Quellen kann eine knifflige Aufgabe sein. Aus diesem Grund nutzen viele Unternehmen Datenintegrationstools mit Workflow-Automatisierungsfunktionen, um ihre Datenprozesse zu beschleunigen und die Integration zu optimieren.
Ganz gleich, ob Sie Transaktionsdaten konsolidieren, Daten aus Altsystemen migrieren oder Partner- oder Lieferantendaten integrieren möchten, die Workflow-Komponente in Astera Centerprise Automatisiert die Ausführung einer Abfolge von Aufgaben, seriell oder parallel, auf mehreren Servern. Dies hilft, die Fehlerwahrscheinlichkeit zu minimieren, Geschäftsprozesse zu optimieren und die Wertschöpfungszeit zu verbessern, indem die manuellen Schritte zum Entwerfen und Bereitstellen von Datenintegrationsflüssen entfallen.
Integrieren Sie Daten in Workflow Automation in Centerprise
Die Workflow-Komponente ist benutzerfreundlich und flexibel und ermöglicht die Visualisierung und Automatisierung des gesamten Prozesses, von der Erfassung der Daten in einer Organisation bis zur Bereinigung, Validierung und dem Laden in das bevorzugte Ziel.
Zur Veranschaulichung der Datenintegrationsfunktionen von Astera Centerprise Betrachten wir bei der Workflow-Automatisierung ein Szenario, in dem ein Unternehmen jeden Monat Kundendaten in einer Tabelle erhält. Die Anforderung besteht darin, eingehende Daten zu bereinigen und die verarbeiteten Daten für eine einheitliche Ansicht in das CRM des Unternehmens, Salesforce.com, zu laden.
Der Screenshot unten zeigt, wie die Workflow-Funktionalität in Astera Centerprise half bei der Erfüllung dieser Aufgabe durch Automatisierung des ETL-Prozessesund Senden von E-Mail-Benachrichtigungen an Informationsbenutzer nach erfolgreichem Abschluss des Auftrags.
Abbildung 1: Verwenden einer Workflowkomponente
Schauen wir uns die einzelnen Schritte des Workflows genauer an.
Schritt 1: Durchlaufen des Quellverzeichnisses
Zuerst wird ein Dateisystemobjekt zum Durchlaufen des Quellverzeichnisses verwendet, um den Quelldateipfad abzurufen.
Abbildung 2: Angeben des Quellverzeichnisses
Schritt 2: Durchführen von ETL
Die Task "Datenfluss ausführen" wird zum Aufrufen eines Datenflusses innerhalb eines Workflows verwendet. In diesem Szenario rufen wir einen vorhandenen Datenfluss zum Ausführen des ETL-Prozesses auf.
Abbildung 3: Datenflussobjekteigenschaften ausführen
Abbildung 4: Orchestrieren des ETL-Prozesses in einem Workflow
Der Datenfluss wird verwendet, um Daten aus Quelldateien zu extrahieren, die Rohdaten zu bereinigen, um eine standardisierte Struktur zu erstellen, sie gemäß den Geschäftsanforderungen zu verarbeiten und die transformierten Daten in das CRM des Unternehmens, Salesforce.com, zu laden, wie in Abbildung 5 dargestellt.
Darüber hinaus werden die Eingabe- und Ausgabevariablen im Variablenvariablen definiert. Ersteres wird verwendet, um den Quelldateipfad zum Excel-Quellobjekt bereitzustellen, und letzteres wird verwendet, um den Auftragsstatuswert zur Entscheidungsfindung an den enthaltenen Workflow zu übergeben, wie in der folgenden Abbildung dargestellt.
Abbildung 5: ETL-Prozess zur Optimierung von Arbeitsabläufen
Schritt 3: E-Mail-Benachrichtigung senden
Eine Entscheidungsaufgabe ruft einen der beiden Pfade im Workflow auf, je nachdem, ob der logische Ausdruck im Entscheidungsobjekt Ja (Wahr) oder Nein (Falsch) zurückgibt. In diesem Szenario wird der Wert der Ausgabevariable 'Auftragsstatus' vom Datenfluss zur Entscheidungsfindung an den Workflow übergeben. Ein Decision-Objekt wird zum Senden einer E-Mail verwendet, um die Benutzer zu benachrichtigen, wenn der Auftrag abgeschlossen ist, oder um die Datei in ein Verzeichnis zu kopieren, wenn der Auftrag beendet wird.
Abbildung 6: Entscheidungseigenschaften
Abbildung 7: Verwenden eines Entscheidungsobjekts im Workflow
Schritt 4: Automatisieren des ETL-Flusses
Astera Centerprise hat eine eingebauter Job Scheduler Auf diese Weise können Sie ETL-Flows automatisieren und die Datenbankintegration optimieren, indem Sie die Auftragshäufigkeit angeben. Dadurch muss der Flow nicht mehr jedes Mal manuell ausgeführt werden, wenn eine Datei empfangen wird.
In diesem Fall wird der Ablauf jedes Mal ausgeführt, wenn eine Datei im Quellverzeichnis abgelegt wird (siehe unten).
Abbildung 8: Job einplanen
Optimieren Sie die Integration mit Centerprise
Datenintegrationsjobs umfassen komplexe Workflows, die strukturierte und unstrukturierte Daten extrahieren, bereinigen und validieren. Die Automatisierung spielt beim Streaming von Datenereignissen eine entscheidende Rolle, da sie den Durchsatz und die Produktivität erhöht.
Die richtigen AsteraMit der Workflow-Komponente können Sie Workflows beliebiger Komplexität visuell zusammenfügen und den gesamten Echtzeit-Datenintegrationsprozess skalieren und automatisieren - von der Extraktion der Quelldaten bis zur Transformation und dem Laden im Data Warehouse. Beim Echtzeit-Streaming können diese Daten dann gleichzeitig durch Berichte angezeigt werden.
Erfahren Sie mehr über Datenintegration und Workflow-Automatisierung von Astera Centerprise. Laden Sie eine kostenlose Testversion verfügbar Version und erleben Sie es aus erster Hand!
Autoren:
- Iqbal Ahmed