Blogs

Startseite / Blogs / Astera Centerprise Optimiert die Konnektivität zur Amazon Redshift-Datenbank mit Astera

Inhaltsverzeichnis
Die automatisierte, Kein Code Datenstapel

Erfahren Sie, wie Astera Data Stack kann die Datenverwaltung Ihres Unternehmens vereinfachen und rationalisieren.

Astera Centerprise Optimiert die Konnektivität zur Amazon Redshift-Datenbank mit Astera

March 9th, 2023

Amazon Redshift ist eine Cloud-basierte Lösung unter dem Dach von Amazon Web Services. Die geringen Wartungsanforderungen, Skalierbarkeit, Geschwindigkeit und effizienten Komprimierungsfunktionen machen es zu einer beliebten Datenspeicheroption für Unternehmen, die mit großen Datenmengen zu tun haben. Zu machen Datenintegration mit der Redshift-Datenbank (DB) einfacher, Astera Centerprise hat einen vorgefertigten Konnektor gestartet. Der integrierte Konnektor kann als Quell- und Zielobjekt zum Zugreifen auf und Speichern von Daten verwendet werden. Benutzer können sich auch mit der Redshift-Datenbank verbinden und sie für die DB-Suche und die Suche nach SQL-Anweisungen verwenden.

So stellen Sie eine Verbindung zur Redshift-Datenbank her Astera Centerprise

Astera Centerprise bietet eine Drag-and-Drop-Umgebung, mit der Geschäftsbenutzer eine Verbindung zur Redshift-Datenbank herstellen können, ohne lange Codestücke eingeben oder Verbindungszeichenfolgen angeben zu müssen. Konfigurieren Sie die Redshift-Konnektivität einfach, um Daten zu verarbeiten oder Datenbanksuchen durchzuführen, indem Sie Amazon Redshift aus der Dropdown-Liste der unterstützten Datenbanken auswählen.

Konnektor für die Redshift-Datenbank

Abbildung 1: Blättern Sie durch die Liste der von unterstützten Anbieter Astera Centerprise und verbinden Sie sich mit Redshift

Redshift-Datenbank als Quelle

Ziehen Sie die Datenbanktabellenquelle Objekt aus der Toolbox und legen Sie es im Designerfenster ab, um eine Verbindung zur Redshift-Datenbank herzustellen und es als Quellobjekt zu verwenden. Als Nächstes können Sie es konfigurieren, indem Sie Redshift als Datenanbieter aus der Dropdown-Liste auswählen.

Im nächsten Schritt müssen wir die Tabelle auswählen, aus der die Daten bezogen werden sollen. In diesem Fall wählen wir eine Tabelle mit den genannten Mitarbeiterdetails aus öffentliche.bestellungen. Wir können auf die Partitionstabelle für die Leseoption klicken, um die Tabelle in kleinere Segmente aufzuteilen, die einzeln gelesen werden. Diese Option kann ausgewählt werden, um die Belastung der Datenbank zu verringern und die Leistung zu verbessern. Hier können wir auch das Schlüsselfeld auswählen, um die Tabelle in Partitionen zu unterteilen.

Eine weitere Option in der Datenbankeigenschaften-Tabelle ist die Angabe der Lesestrategie. Hier können wir entscheiden, ob wir die vollständigen Daten (Volllast) oder nur aktualisierte Datensätze (Inkrementelle Last basierend auf Überwachungsfeldern) lesen möchten.

Tabelle auswählen und Strategie für Rotverschiebungstabelle lesen

Abbildung 2: Auswahl der Tabelle und Lesestrategie für unsere Datenbankquelle

Der nächste Bildschirm zeigt den Layout Builder für die Datenbankquelltabelle. Hier sehen wir die Datentypen und Längen der einzelnen Felder sowie einige andere Details.

Redshift Datenbanktabellen-Layout-Builder

Abbildung 3: Der Layout Builder der Redshift-Datenbanktabelle mit Details zum Datentyp und zur Länge der einzelnen Felder.

Die Daten aus dieser Redshift-Tabelle können auf verschiedene Weise mithilfe verschiedener integrierter Transformationen verarbeitet werden, die in verfügbar sind Centerprise und in eine Datei, Datenbank oder ein anderes verfügbares Ziel geladen.

Filtertransformation wird auf die Redshift-Tabelle angewendet

Abbildung 4: Ein Datenfluss, der einen Filter zeigt, der auf Daten angewendet wird, die aus einer Redshift-Tabelle stammen und einem Excel-Zielobjekt zugeordnet werden

Der obige Screenshot zeigt einen Datenfluss, der Daten aus der Orders-Tabelle mithilfe einer Filtertransformation filtert und einer Excel-Zieldatei mit dem Namen FilteredRedshiftData zugeordnet wird.

Redshift-Datenbank als Ziel

Benutzer können auch eine Verbindung zur Amazon Redshift-Datenbank herstellen und diese als Zielobjekt konfigurieren. Dafür ist die Ziel der Datenbanktabelle Das Objekt muss aus der Toolbox gezogen und auf dem Designer abgelegt werden. Als nächstes müssen wir das Zielobjekt wie folgt auf die Redshift-Datenbank verweisen:

Amazon Redshift-Datenbank

Abbildung 5: Konfigurieren eines Datenbanktabellen-Zielobjekts mit Redshift als Datenprovider

Das Bild zeigt auch eine Option, mit der Benutzer ihre Anmeldeinformationen für Amazon Simple Storage Service (S3) hinzufügen können, um Daten in großen Mengen in die Redshift-Datenbank zu laden.

Nachdem Redshift als Datenprovider ausgewählt wurde, muss der Benutzer entscheiden, ob er eine vorhandene Tabelle auswählen, eine neue erstellen oder die auf einer vorhandenen Tabelle vorhandenen Daten überschreiben möchte. In diesem Fall haben wir eine neue Tabelle in der Datenbank erstellt und sie WebAggregate genannt.

 

Erstellen Sie eine neue Redshift-Tabelle

Abbildung 6: Eine neue Datenbanktabelle mit dem Namen WebAggregate wird erstellt, um Daten in großen Mengen zu laden.

In diesem Beispiel werden Daten von a Datenbankquellobjekt Der Name WebConnectionRegistration wird aggregiert und an die WebAggregate-Datenbanktabelle übergeben. Der vollständige Datenfluss ist wie folgt:

Zuordnen aggregierter Daten zu einer Redshift-Zieltabelle

Abbildung 7: Daten aus einer Datenbanktabelle werden aggregiert und einer Redshift-Zieltabelle zugeordnet.

Machen Sie das Beste aus der bidirektionalen Konnektivität für Rotverschiebung mit Astera Centerprise

Daten in der Redshift-Datenbank können weitaus effizienter komprimiert werden als in zeilenbasierten Datenbanken, wodurch die Verarbeitungszeit und die Zeit bis zur Einsicht reduziert werden. Aufgrund der Vorteile von Redshift gegenüber lokalen Datenbanken suchen Unternehmen, die große Datenmengen speichern und verarbeiten müssen, nach Wegen, um durch die Verbindung mit Redshift ein gut vernetztes Unternehmensökosystem zu schaffen. Im Gegensatz zu Steckverbindern, die viel manuelle Konfiguration erfordern, Astera CenterpriseDer Redshift-Connector macht den Zugriff auf und das Speichern von Daten in der Datenbank sehr einfach und bequem.

Hier sind einige Vorteile der Verwendung Astera CenterpriseDer native Redshift-Anschluss:

Ununterbrochene Konnektivität

Benutzer müssen keinen langen und komplizierten Konfigurationsprozess durchlaufen, um sich mit Redshift zu verbinden. Das Herstellen einer Verbindung ist so einfach wie das Auswählen des richtigen Datenanbieters aus einer Dropdown-Liste und das Verweisen des Datenbankobjekts auf die richtige Tabelle.

Einfache Zugang

Verbindung zu Redshift herstellen mit Astera CenterpriseMit dem integrierten Connector können Benutzer Daten mit minimalem IT-Eingriff abrufen, transformieren und in das erforderliche Zielsystem laden.

Workflow-Automatisierung

Mit Hilfe von Astera Centerprisekönnen Benutzer Automatisieren Sie die Redshift-Integrationsworkflows Reduzierung der für die Analyse erforderlichen Zeit und Steigerung der Prozesseffizienz.

Die effiziente Datenspeicherung, Parallelverarbeitung und einfache Abfragefunktionen von Amazon Redshift machen es zu einer beliebten Wahl für Unternehmen, die an Datenanalysen interessiert sind. Mit Astera CenterpriseMit dem nativen Konnektor von können Unternehmen die Redshift-Datenbankkonnektivität optimieren und mehr Zeit damit verbringen, datengesteuerte Entscheidungen zu treffen.

Sie können auch mögen
Die Top 7 Datenaggregationstools im Jahr 2024
Data Governance Framework: Was ist das? Bedeutung, Säulen und Best Practices
Die besten Tools zur Datenerfassung im Jahr 2024
In Anbetracht Astera Für Ihre Datenverwaltungsanforderungen?

Stellen Sie eine codefreie Konnektivität mit Ihren Unternehmensanwendungen, Datenbanken und Cloud-Anwendungen her, um alle Ihre Daten zu integrieren.

Lassen Sie uns jetzt eine Verbindung herstellen!
Lass uns verbinden