Blogs

Accueil / Blogs / Utilisations de la création d'un entrepôt de données SCD dans Astera Constructeur DW

Table des matières
L'automatisé, Pas de code Pile de données

Apprener comment Astera Data Stack peut simplifier et rationaliser la gestion des données de votre entreprise.

Utilisations de la construction d'un entrepôt de données SCD dans Astera Constructeur DW

Novembre 11th, 2022

Des dimensions qui changent lentement

Un entrepôt de données SCD est au cœur du suivi des modifications des données. Le changement est omniprésent dans toutes les entreprises. D'un point de vue RH, les employés sont promus et gagnent de nouveaux titres, tandis que les politiques de rémunération et d'assurance sont réécrites chaque année. Dans le marketing, les gammes de produits sont renommées, fusionnées ou lancées en grande pompe. Dans les ventes, de nouveaux clients arrivent et les grands comptes sont transférés d'un agent à un autre.

La question est: vos rapports rendent-ils compte de cette évolution constante? Votre architecture BI est-elle conçue pour fournir à la fois une vue actuelle et historique de vos données, ou n'obtenez-vous que des instantanés périodiques de chaque système source?

Pour quelqu'un qui construit un entrepôt de données, la meilleure façon de gérer les changements d'attributs est de dimensions qui changent lentement. Les dimensions qui changent lentement dans un entrepôt de données stockent les informations actuelles et précédentes au fil du temps. Ces tableaux reflètent les changements au fur et à mesure qu'ils se produisent dans les attributs sélectionnés dans chaque dimension. Selon vos besoins, ils peuvent écraser les entrées existantes ou créer des champs supplémentaires pour afficher les versions précédentes d'un enregistrement.

AsteraDe neuf constructeur d'entrepôt de données (ADWB) fournit un concepteur de modèle de données complet qui facilite la configuration de vos tables de dimension et l'affectation de différents Types de SCD aux attributs sélectionnés. Jetons un coup d'œil à certains des cas d'utilisation que notre produit peut vous aider à résoudre.

Correction d'enregistrements erronés dans un entrepôt de données SCD

Tout système source qui repose sur la saisie manuelle de données est sujet aux erreurs humaines. Des noms et adresses aux devis et estimations, il existe divers enregistrements dans vos systèmes source qui peuvent devoir être corrigés pour plus de précision. Dans de tels cas, la gestion d'une version précédente d'un enregistrement dans l'entrepôt de données ne ferait qu'ajouter une complexité inutile à vos données. La meilleure solution consiste à traiter les entrées de ces champs comme des attributs SCD-1, où les valeurs actuelles écrasent les données précédentes.

entrepôt de données scd

Sales Data Mart construit à l'aide du DWB Data Model Designer

Supposons que vous ayez utilisé DWB pour concevoir un modèle dimensionnel de votre système de vente et que vous ayez remarqué des noms de clients incorrects dans le dernier lot de mises à jour. Ouvrez simplement la dimension Client dans le concepteur de modèle de données et définissez le nom du client sur SCD1 - Mise à jour dans le menu déroulant.

types de cotes changeant lentement

Définition du type SCD pour l'attribut CustomerName

Désormais, lorsque des corrections sont apportées dans la base de données source, l'enregistrement correspondant sera mis à jour dans l'entrepôt de données, comme indiqué ci-dessous. C'est ce qu'on appelle la dimension de type 1 dans un entrepôt de données.

Tableau des dimensions du client avant correction

entrepôt de données scd 2

Table de dimension client avec SCD1 appliqué au champ de nom de client

entrepôt de données scd 3

Comparaison des données actuelles et passées dans un entrepôt de données dimensionnel

L'une des principales fonctions de l'entrepôt de données d'entreprise est la prise en charge de l'analyse stratégique à long terme, qui nécessite que les modifications d'un attribut soient préservées et suivies au fil du temps.

Supposons que votre entreprise ait récemment fusionné plusieurs succursales de district et créé de nouvelles régions pour ses magasins. Si vous souhaitez suivre l'incidence de la réorganisation sur les performances des ventes, vous pouvez traiter le champ District comme une dimension de type 2 à évolution lente. Cela garantira que les modifications apportées aux districts de stockage sont affichées comme de nouveaux enregistrements dans le tableau.

Dans DWB, vous pouvez appliquer l'option SCD2 - Mettre à jour et insérer pour le champ District dans la table de dimension Store. Au fur et à mesure que des modifications sont apportées à l'attribut source, de nouvelles versions de l'enregistrement sont créées et insérées dans la table de dimension, avec une clé de substitution unique attribuée à chacun. En fonction du type d'analyse que l'entreprise souhaite effectuer, vous pouvez également sélectionner les options Date d'entrée en vigueur et Date d'expiration afin que tout changement dans les régions de magasin puisse être suivi jusqu'à une période spécifique.

Le tableau ci-dessous illustre comment ces configurations affectent la sortie de votre table de dimension.

Table existante

types de dc

Tableau mis à jour - SCD2 (date d'entrée en vigueur et date d'expiration)

Suivi des changements de statut

Certains départements, tels que les RH, s'attendent à des modifications fréquentes des enregistrements dans leurs systèmes. Par exemple, la désignation d'un employé peut changer plusieurs fois par an. Dans ces cas, les entreprises souhaitent généralement pouvoir conserver l'historique des données tout en étant en mesure de les interroger rapidement en fonction de la valeur d'attribut la plus récente.
Dans DWB, vous pouvez choisir de gérer cette situation en définissant l'intitulé du poste en tant que champ SCD6. Cela signifie que la table utiliserait des éléments de SCD1, SCD2 et SCD3 pour enregistrer les modifications de cet attribut. Ces éléments sont les suivants:

  • Une ligne est ajoutée pour suivre les modifications de l'attribut au fur et à mesure qu'elles se produisent (SCD2)
  • Une colonne supplémentaire affiche la valeur actuelle de l'attribut (SCD3)
  • Le champ de la valeur actuelle sera écrasé pour afficher la valeur d'attribut mise à jour (SCD1)

L'exemple ci-dessous montre comment les modifications apportées au champ Job_Title apparaîtront si SCD6 est implémenté.

Table actuelle

dimension changeant lentement dans l'entrepôt de données

Tableau mis à jour - SCD6 (indicateur actif, date d'entrée en vigueur et date d'expiration)

Automatisez votre entrepôt de données SCD d'entreprise

AsteraData Warehouse Builder basé sur les métadonnées peut vous aider à concevoir, construire et déployer votre projet d'entrepôt de données en quelques jours. Avec une gamme complète de fonctionnalités de modélisation dimensionnelle et une plate-forme ETL robuste pour accélérer le mappage, le chargement et la préparation des données, nous vous offrons une plate-forme unique avec tous les outils dont vous avez besoin pour réussir votre implémentation EDW.

Découvrez comment notre produit peut vous aider à résoudre votre cas d'utilisation dès aujourd'hui. Cliquez sur ici pour entrer en contact avec notre équipe technique.

FAQ
Comme le suggère la même chose, les types de dimension à évolution lente (SCD) sont utilisés pour capturer les changements lents au sein d'un entrepôt de données au fil du temps, plutôt que selon un calendrier continu. L'entrepôt de données SCD permet de rapporter des données historiques et d'associer des attributs dimensionnels à des données données.

Il existe six types de dimensions à évolution lente (SCD) :

  • Type 0 ou Dimension fixe: Dans cette dimension fixe, aucun changement n'est autorisé car la dimension ne change jamais
  • Type 1 ou Pas d'historique: les enregistrements sont mis à jour directement sans aucun enregistrement de valeurs historiques de ce type.
  • Versionnement de type 2 ou de ligne : De nouveaux enregistrements supplémentaires peuvent être créés dans ce type, et les enregistrements modifiés peuvent être suivis avec des indicateurs et des données opérationnelles.
  • Colonne Type 3 ou Valeur précédente : Une nouvelle colonne peut être ajoutée dans ce type et les modifications peuvent être suivies pour un attribut particulier.
  • Type 4 ou Table d'historique : Il utilise une table historique pour enregistrer toutes les modifications tout en affichant la valeur actuelle dans une table dimensionnelle.
  • SCD de type 6 ou hybride : Il combine les techniques des types 1, 2 et 3 de SCD (dimension à changement lent) pour suivre le changement

Certains des exemples courants de SCD et des cas d'utilisation dans l'entrepôt de données sont :

  • Correction des enregistrements erronés
  • Comparaison des Vs actuels. Données antérieures 
  • Suivi des changements de statut  

Tu pourrais aussi aimer
Les 7 meilleurs outils d'agrégation de données en 2024
Cadre de gouvernance des données : qu’est-ce que c’est ? Importance, piliers et meilleures pratiques
Les meilleurs outils d'ingestion de données en 2024
Considérant Astera Pour vos besoins en gestion de données ?

Établissez une connectivité sans code avec vos applications d'entreprise, vos bases de données et vos applications cloud pour intégrer toutes vos données.

Connectons-nous maintenant !
connectons-nous