La modélisation dimensionnelle reste l'approche de modélisation la plus fiable pour concevoir un entrepôt de données permettant de rapporter des cas d'utilisation. Sa structure dénormalisée améliore considérablement les performances des requêtes, permettant une consommation de données et des rapports rapides et transparents. Les dimensions d'un entrepôt de données centré sur le modèle utilisent Dimension à évolution lente (SCD) pour conserver des données historiques pour l'enregistrement et la création de rapports. Toute modification apportée aux enregistrements existants ou nouveaux est identifiée par les SCD et conservée dans les tables de votre entrepôt de données. Mais plus sur les SCD dans un instant.
En savoir plus sur la génération de schéma de base de données à l'aide de l'ingénierie avancée automatisée
Les SCD sont une caractéristique importante de vos tables de dimension car ils déterminent la maintenance des enregistrements historiques dans les lignes de dimension. Cependant, l'ajout de plusieurs SCD à différents champs nécessiterait plusieurs lignes de code SQL compliqué.
Mais comme on dit toujours, là où il y a un chemin compliqué, il y a aussi Astera'se balancer. Dans le Astera DW Builder, vous pouvez ajouter des SCD en quelques minutes, sans écrire de code.
Ce blog vous expliquera comment ajouter des dimensions à évolution lente (SCD) à votre modèle dimensionnel et vérifier et déployer ce modèle en quelques clics à l'aide de Astera Constructeur DW.
Configuration le Dimensions changeant lentement :
Voici notre exemple de modèle de données dimensionnelles, conçu avec Astera DW Builder—basé sur une base de données fictive World Wide Importers.
Dans ce modèle, une table de faits (Lignes de facture) est reliés par plusieurs dimensions (articles en stock, détails des clients, fournisseurs et villes). Bien qu'il s'agisse d'un modèle dimensionnel automatisé, nous pouvons toujours revisiter entités individuelles pour configurer les rôles de dimension, par exemple, les SCD.
Étape 1: Accéder à la colonne Rôle de dimension dans les propriétés de dimension
Vous n’avez qu’à vous ouvert le constructeur de mise en page pour une dimension en se dirigeant vers ses propriétés. Le constructeur de mise en page contient un séparé colonne pour définition manuelle des rôles pour chacun champ dimension.
Rôles SCD de dimension pour chaque champ d'une table de dimension.
Étape 2: Choisissez les dimensions souhaitées qui changent lentement
Attribuez le type SCD souhaité parmi les quatre options disponibles (SCD 1, 2, 3 et 6) à chaque champ en fonction de la manière dont vous souhaitez conserver les données dans votre entrepôt de données.
Dans cet exemple, nous sélectionnerons SCD Type 2—Mettre à jour et Insérer—comme rôle de dimension pour le champ 'StockItemName'. Maintenant, logiquement parlant, tout changement dans StockItemName serait reflété comme une nouvelle ligne avec le nom mis à jour. De plus, le champ de désignateur d'enregistrement actuel automatisé garantirait que le dernier enregistrement, ou StockItemName,' est identifiable dans ce cas.
Affectation de SCD 2 à un champ de dimension.
Désormais, toute modification du StockItemName dans la source apparaîtra sous la forme d'un enregistrement mis à jour dans la table de dimension.
Par exemple, voici à quoi ressemblent les données prévisualisées pour StockItemName après avoir modifié un enregistrement deux fois dans les données source. Le champ CurrentRecordDesignator affiche le dernier enregistrement.
Prévisualisation des données après modification de StockItemName. Le "lanceur de missiles USB (vert - nouveau nom)" est le dernier changement dans le domaine.
Étape 3: Marquez la droite rôles pour la dimension requise des champs
Nous attribuons des SCD spécifiques dans la colonne de rôle de dimension de chaque entité bsur Comment nous plan sur la mise à jour données dans l'entrepôt de données.
Types de dimension à variation lente (SCD)
Attribuons SCD 6 au champ 'Prix unitaire' et modifions plusieurs fois une valeur de champ dans la table source.
Voici comment les données prévisualisées pour le champ renseigné (Prix unitaire) apparaîtront après quelques modifications dans la source :
Les changements de prix unitaire sont reflétés dans deux colonnes - indiquant les nouveaux et anciens prix unitaires - et une nouvelle ligne montrant les enregistrements mis à jour.
Une fois les rôles de dimension spécifiques attribués selon nos besoins d'entreposage de données, l'étape suivante consiste à vérifier et à déployer le modèle pour la consommation.
Vérifiering et déploiement le modèle dimensionnel :
We must vérifier notre modèle avant son déploiement. Astera a une vérification de modèle de données intégrée module qui scanne automatiquement le modèle pour toutes les erreurs affectant le physique déploiement.
Vérification du modèle de données pour le déploiement en lecture et en écriture
Voici un exemple de la façon dont la vérification module identifie commun .
Cette erreur montre qu'il n'y a pas de clé métier définie dans notre StockItem. Attribuez simplement une clé métier au StockItemID dans la dimension StockItem pour corriger l'erreur.
Après vérification du modèle de données, sur notre serveur en utilisant le "Déployer le modèle de données" bouton dans la barre d'outils. Avant le déploiement, nous devons spécifier le nom du modèle de données et le chemin d'accès au fichier de configuration, qui peut être utilisé pour modifier paramètres du modèle de données.
Appuyez sur le bouton de déploiement et identifiez le chemin d'accès au fichier de configuration du modèle de données.
Enfin, t le forme d' Astera Modèle de données — peut servir à plusieurs fins. Par exemple, nous pouvons l'utiliser dans les pipelines ETL pour remplir le modèle dimensionnel ou le consommer pour la BI et l'analyse.
Configuration et déploiement de modèles dimensionnels avec Astera Constructeur DW
Configurer des modèles dimensionnels avec des SCD et les déployer pour la consommation ne peut pas être plus simple que cela. Vous n'avez pas besoin d'exécuter des scripts manuels ou des requêtes complexes pour attribuer des rôles de dimension ou déployer des modèles d'entreposage de données. Voici tout ce que vous devez faire :
- Attribuez des rôles SCD aux entités du modèle dimensionnel via une interface glisser-déposer.
- Vérifiez les modèles pour éliminer toute erreur potentielle.
- Déployez les modèles en un seul clic.
C'est exactement ainsi que vous réduisez jusqu'à 80 % le cycle de vie de la conception et du développement de l'entrepôt de données.
Plus de ressources
Voulez-vous savoir comment Astera automatise sinon complexe modélisation dimensionnelleg? Lire notre comment faire blog on Conception d'un modèle dimensionnel automatisé.
Apprenez à générer automatiquement un schéma physique de votre conception du modèle de données ici.
Auteurs:
- Haris Azem