Blogs

Accueil / Blogs / Astera Centerprise Rationalise la connectivité à la base de données Amazon Redshift avec Astera

Table des matières
L'automatisé, Pas de code Pile de données

Apprener comment Astera Data Stack peut simplifier et rationaliser la gestion des données de votre entreprise.

Astera Centerprise Rationalise la connectivité à la base de données Amazon Redshift avec Astera

9 mars 2023

Amazon Redshift est une solution basée sur le cloud sous l'égide d'Amazon Web Services. Les faibles exigences de maintenance, l'évolutivité, la vitesse et les fonctionnalités de compression efficaces en font une option de stockage de données populaire pour les entreprises traitant de grandes quantités de données. Faire intégration de données avec la base de données Redshift (DB) plus facile, Astera Centerprise a lancé un connecteur pré-construit. Le connecteur intégré peut être utilisé comme objet source et destination pour accéder aux données et les stocker. Les utilisateurs peuvent également se connecter à la base de données Redshift et l'utiliser pour la recherche de bases de données et la recherche d'instructions SQL.

Comment se connecter à la base de données Redshift avec Astera Centerprise

Astera Centerprise dispose d'un environnement glisser-déposer, permettant aux utilisateurs professionnels de se connecter à la base de données Redshift sans taper de longs morceaux de code ni spécifier de chaînes de connexion. Configurez facilement la connectivité Redshift pour traiter les données ou effectuer des recherches de base de données en sélectionnant Amazon Redshift dans la liste déroulante des bases de données prises en charge.

Connecteur de base de données Redshift

Figure 1: Faites défiler la liste des fournisseurs de données pris en charge par Astera Centerprise et connectez-vous à Redshift

Base de données Redshift comme source

Faites glisser le source de table de base de données objet de la boîte à outils et déposez-le dans la fenêtre du concepteur pour vous connecter à la base de données Redshift et l'utiliser comme objet source. Ensuite, vous pouvez le configurer en sélectionnant Redshift comme fournisseur de données dans la liste déroulante.

À l'étape suivante, nous devons sélectionner la table à partir de laquelle les données seront extraites. Dans ce cas, nous sélectionnons une table avec les détails des employés nommés commandes.publiques. Nous pouvons cliquer sur la table de partition pour l'option de lecture pour diviser la table en segments plus petits qui seront lus individuellement. Cette option peut être sélectionnée pour réduire la charge sur la base de données et améliorer les performances. Ici, nous pouvons également sélectionner le champ clé pour diviser la table en partitions.

Une autre option dans le tableau des propriétés de la base de données consiste à spécifier la stratégie de lecture. Ici, nous pouvons décider si nous voulons lire les données complètes (Full Load) ou simplement les enregistrements mis à jour (Incremental Load Based on Audit Fields).

Choisir la table et lire la stratégie pour la table Redshift

Figure 2: Sélection de la table et de la stratégie de lecture pour notre source de base de données

L'écran suivant affiche le Layout Builder pour la table source de la base de données. Ici, nous pouvons voir les types de données et les longueurs de chaque champ, ainsi que quelques autres détails.

Générateur de disposition de table de base de données Redshift

Figure 3: Le Layout Builder de la table de base de données Redshift avec des détails sur le type de données et la longueur de chaque champ.

Les données de cette table Redshift peuvent être traitées de plusieurs manières à l'aide de diverses transformations intégrées disponibles dans Centerprise et chargé dans un fichier, une base de données ou toute autre destination disponible.

Transformation de filtre appliquée à la table Redshift

Figure 4 : Un flux de données montrant un filtre appliqué aux données provenant d'une table Redshift et mappé sur un objet de destination Excel

La capture d'écran ci-dessus montre un flux de données qui filtre les données de la table Commandes à l'aide d'une transformation Filtre et mappé sur un fichier de destination Excel nommé FilteredRedshiftData.

Base de données Redshift comme destination

Les utilisateurs peuvent également se connecter à la base de données Amazon Redshift et la configurer en tant qu'objet de destination. Pour cela, le destination de la table de base de données l'objet doit être glissé de la boîte à outils et déposé sur le concepteur. Ensuite, nous devons pointer l'objet de destination vers la base de données Redshift comme suit:

base de données amazon redshift

Figure 5: Configuration d'un objet de destination de table de base de données avec Redshift comme fournisseur de données.

L'image montre également une option dans laquelle les utilisateurs peuvent ajouter leurs informations d'identification Amazon Simple Storage Service (S3) pour charger des données en masse dans la base de données Redshift.

Une fois que Redshift a été sélectionné comme fournisseur de données, l'utilisateur doit décider s'il souhaite choisir une table existante, en créer une nouvelle ou écraser les données présentes sur une table existante. Dans ce cas, nous avons créé une nouvelle table dans la base de données et l'avons nommée WebAggregate.

 

Créer une nouvelle table Redshift

Figure 6: Une nouvelle table de base de données nommée WebAggregate est créée pour charger des données en bloc.

Dans cet exemple, les données d'un Objet source de la base de données nommé WebConnectionRegistration est agrégé et transmis à la table de base de données WebAggregate. Le flux de données complet est le suivant:

Mappage de données agrégées à une table de destination Redshift

Figure 7: Les données d'une table de base de données sont agrégées et mappées à une table de destination Redshift.

Tirez le meilleur parti de la connectivité bidirectionnelle à Redshift avec Astera Centerprise

Les données de la base de données Redshift peuvent être compressées beaucoup plus efficacement que celles des bases de données basées sur des lignes, ce qui réduit le temps de traitement et le temps de recherche. En raison des avantages de Redshift par rapport aux bases de données sur site, les entreprises qui ont besoin de stocker et de traiter de grandes quantités de données recherchent des moyens de créer un écosystème d'entreprise bien connecté en se connectant à Redshift. Contrairement aux connecteurs qui nécessitent beaucoup de configuration manuelle, Astera CenterpriseLe connecteur Redshift rend l'accès et le stockage des données sur la base de données très simples et pratiques.

Voici quelques avantages de l'utilisation Astera CenterpriseConnecteur Redshift natif de:

Connectivité ininterrompue

Les utilisateurs n'ont pas à passer par un processus de configuration long et compliqué pour se connecter à Redshift. L'établissement d'une connexion est aussi simple que de sélectionner le bon fournisseur de données dans une liste déroulante et de pointer l'objet de base de données vers la bonne table.

Facilité d'accès

Connexion à Redshift en utilisant Astera CenterpriseLe connecteur intégré permet aux utilisateurs de récupérer, transformer et charger des données sur le système de destination requis avec une intervention informatique minimale.

Automatisation du flux de travail

Avec l'aide d' Astera Centerprise, les utilisateurs peuvent automatiser leurs workflows d'intégration Redshift pour réduire le temps nécessaire à l'analyse et augmenter l'efficacité des processus.

Le stockage efficace des données, le traitement parallèle et les capacités de requête simples d'Amazon Redshift en font un choix populaire pour les entreprises intéressées par l'analyse de données. Avec Astera CenterpriseGrâce au connecteur natif de Redshift, les entreprises peuvent rationaliser la connectivité de la base de données Redshift et passer plus de temps à prendre des décisions basées sur les données.

Tu pourrais aussi aimer
Les 7 meilleurs outils d'agrégation de données en 2024
Cadre de gouvernance des données : qu’est-ce que c’est ? Importance, piliers et meilleures pratiques
Les meilleurs outils d'ingestion de données en 2024
Considérant Astera Pour vos besoins en gestion de données ?

Établissez une connectivité sans code avec vos applications d'entreprise, vos bases de données et vos applications cloud pour intégrer toutes vos données.

Connectons-nous maintenant !
connectons-nous