Blogs

Accueil / Blogs / Une approche automatisée pour modéliser vos dimensions en évolution lente

Table des matières
L'automatisé, Pas de code Pile de données

Apprener comment Astera Data Stack peut simplifier et rationaliser la gestion des données de votre entreprise.

Une approche automatisée de la modélisation de vos dimensions à évolution lente

24 mars 2023

Les données d'entreprise sont intrinsèquement susceptibles de changer avec le temps et ont un impact sur l'entreprise de différentes manières. Dans les entrepôts de données, l'effet du temps sur nos enregistrements et faits dimensionnels nécessite une étude approfondie du référentiel afin d'atteindre l'objectif d'informatique décisionnelle consistant à fournir des informations à jour aux décideurs.

La question est de savoir comment gérer au mieux ces changements.

Développer une table de dimension ou un modèle qui capture les différents états de vos données par rapport au temps est un objectif clé d'un entrepôt de données d'entreprise. Pour les mesures de nos tables de faits, nous pouvons utiliser des dimensions de date et les lier à l'aide de clés étrangères. Pour les dimensions, la complexité de la manipulation change fortement. Chaque étape du flux SCD (Slowly Changing Dimension) doit être codée manuellement à l'aide de plusieurs instructions SQL complexes. La mise en œuvre est longue et complexe, et affecte la capacité de l'entreprise à maintenir ses données rapidement et de manière fiable, ce qui est toujours un facteur critique.

Dimensions changeant lentement dans Astera Centerprise

Par rapport à l’approche traditionnelle codée à la main pour le flux de dimension qui change lentement, Astera propose une implémentation automatisée à l'aide d'une interface entièrement en glisser-déposer. Les données du système source sont mappées à un objet SCD dans Centerprise, qui envoie les instructions SQL générées par le système directement à l’entrepôt de données cible (Lire: Mode d'optimisation du refoulement dans Centerprise) en fonction de la disposition des champs définie par l'utilisateur. Chaque colonne de la table de l'utilisateur peut être désignée comme Clé de substitution, Clé commerciale, SCD1, SCD2, etc. (voir ci-dessous) dans les propriétés du composant dans Centerprise. La plate-forme gère automatiquement la stratégie de mise à jour, les considérations de performances, le routage et les jointures complexes sur le backend, tant que les types de champs SCD sont définis correctement.

Automatisation de la mise en œuvre des dimensions à évolution lente de type 1 et 2

Centerprise prend en charge les types 1 et 2 de dimension à changement lent pour mettre à jour les enregistrements avec et sans conserver l'historique.

SCD Type 1

Ce type traite des mises à jour dans la table dimensionnelle, dans les cas où la préservation de l'historique n'est pas une considération et que vous devez remplacer les anciennes valeurs de votre table par des valeurs récentes.

Pour utiliser le type de cote à variation lente 1 dans Centerprise, vous pouvez marquer votre colonne comme "SCD1 - Mise à jour" dans le menu Champs de présentation de l'objet SCD dans Centerprise.

SCD Type 2

Ce type traite des modifications de votre dimension qui doivent être suivies. Un nouvel enregistrement est inséré à chaque modification et l'enregistrement existant est marqué comme expiré, par date, version ou statut.

Pour utiliser le type de cote à variation lente 2 dans Centerprise, marquez la colonne choisie comme "SCD2 - Mettre à jour et insérer".

Optimisation Par Push-Down

Une fois la mise en page définie et le flux exécuté, le Astera La transformation SCD génère le code SQL nécessaire pour comparer, joindre, acheminer et insérer des données dans votre dimension cible et pousse la logique de transformation vers une base de données, telle que SQL Server, pour le traitement.

Avec cette approche, la maintenance des attributs de grande dimension est nettement plus rapide car tout le traitement est effectué par la base de données plutôt que par le Centerprise Le serveur effectue les opérations et va et vient entre la base de données pour lire, comparer et écrire les données.

Pour en savoir plus sur le composant automatisé Dimensions en évolution lente dans Centerprise et comment l'utiliser pour gérer vos dimensions, téléchargez le livre blanc: Comment gérer des dimensions à changement lent à l'aide de Centerprise.

Réduisez le temps de développement de l'entrepôt de données jusqu'à 80 %
Nouvel appel à l'action
Tu pourrais aussi aimer
Qu'est-ce qu'un catalogue de données ? Fonctionnalités, meilleures pratiques et avantages
Schéma en étoile contre. Schéma en flocon de neige : 4 différences clés
Comment charger des données d'AWS S3 vers Snowflake
Considérant Astera Pour vos besoins en gestion de données ?

Établissez une connectivité sans code avec vos applications d'entreprise, vos bases de données et vos applications cloud pour intégrer toutes vos données.

Connectons-nous maintenant !
connectons-nous