Pour commencer notre exploration de la modélisation dimensionnelle automatisée, il est essentiel de commencer par acquérir une compréhension de la modélisation dimensionnelle. Modélisation dimensionnelle is parmi le (en fait, presque toutes) préféré approches de conception pour construire un entrepôt de données. Introduit pour la première fois en 1996, Kimball»s dimensional modèles de données avoir maintenant become pierres angulaires de la modernité conception et développement d'un entrepôt de données. Votre dénormalisé schéma en étoile réduires complexité et optimisers la maintenance des données historiques, les performances des requêtes, la récupération et consommation pour rapports.
En savoir plus sur modélisation dimensionnelle.
En un coup d'oeilune axé sur le sujet dimensional modèle consiste en fait et le tables de dimensions dénormalisées Contacted via des clés étrangères. Les faits cArry informations numériques sur une mesure/transaction commerciale spécifique, par exemple : a vente facture. Dimensions portent des attributs descriptifs pour le fait, qui permettent finalement le intelligence économique (BI) laie à facilement filtrer et interroger les données pour les rapports.
Concevoir le bon modèle de données dimensionnelles pour votre entrepôt de donnéesCependant, peuvent être un défi! Maintenir à jour modèle a besoin scripts longs et complexes régulièrement. Mais il existe une manière difficile de faire du mod dimensionneléling, et alors il existe un moyen simple et sans code-le Astera way.
Qu’est-ce que la modélisation dimensionnelle automatisée ?
La modélisation dimensionnelle automatisée est une technique utilisée dans l'entreposage de données qui utilise des outils pour rationaliser le processus de création de modèles dimensionnels. La modélisation dimensionnelle automatisée vous permet de :
- Découvrez et comprenez automatiquement la structure de vos données
- Organisez vos données en faits et dimensions en fonction des meilleures pratiques et des caractéristiques des données
- Créez automatiquement le code nécessaire pour implémenter le modèle dimensionnel dans votre entrepôt de données
La modélisation dimensionnelle traditionnelle implique la conception manuelle de la structure d'un entrepôt de données pour Analyse des données. Le processus comprend la définition de tables de faits pour stocker des données mesurables et de tables de dimensions pour fournir un contexte aux faits. Cela peut être un processus long et complexe.
Automatisation de la modélisation dimensionnelle avec Astera
Astera's solution d'entreposage de données exploite l'automatisation de bout en bout et le développement sans code pour rationaliser la modélisation dimensionnelle. À l'aide de générateurs de code avancés, Astera Constructeur DW automatisers Manuel tâches de conception et reconduires modèle dimensionnel le temps de conception de près % 80.
Laisser nous's sur le lien how Astera simplifie complexe la modélisation des données tdemande des développeurs, par exemple, définir et le configuration des dimensions et des faits dans un schéma en étoile.
, nous avons un modèle source comprenant plusieurs tableaux de a transactionnel Système basé sur la fiction Importateur mondials base de donnéess pour MicrosoftSQL. Alternativement, il peut s'agir d'un mise en scène/Base de données ODS également.
Fig 1. Modèle source
Étape 1: Identifier les faits et les dimensions
Vous n’avez qu’à vous du déposerdown menu et marque entités concernées as faits et dimensions pour le schéma en étoile.
Fig 2. Construire une fonctionnalité de modèle de dimension
Ce que vous choisissez comme faits ou dimensions dépend principalement de OLAP cas d’utilisation du reporting et type d’entité. Vous pouvez également détecter automatiquement les entités pour les détecter automatiquement déformalisez les tables de schéma pour des résultats de requête plus rapides dans la couche BI. Avec cette option, vous n'avez pas besoin de passer du temps à dénormaliser manuellement les tables associées.
Dans ce cas d'utilisation, les transactions de facturation ont été marquées comme des faits, tandis que les attributs descriptifs, par exemple, les fournisseurs, les clients, les articles en stock et les informations sur la ville, ont été marqués comme des dimensions de support.
Fig 3. Fenêtre de configuration "Créer un modèle de dimension"
Étape 2 : Configurer les faits et les dimensions
Les autres options prédéfinies de la fenêtre incluent les identificateurs de ligne, les options d'entité de fait enfant et la liste déroulante Ajouter des relations date/heure.
Si vous souhaitez utiliser des identifiants de ligne pour conserver les données historiques, vous disposez de nombreuses options dans les dimensions. Ici, l'identifiant de ligne peut être l'un des éléments suivants : désignations d'enregistrement actuelles, numéro de version, dates d'effet et d'expiration et plage d'expiration effective.
De même, dans la fenêtre du générateur, vous pouvez ajouter des dimensions de date ou d'heure pour incorporer des attributs spécifiques au temps dans le modèle.
Passez par la fenêtre et voilà : votre schéma de modèle dimensionnel est pratiquement prêt.
Fig 4. Modèle de données dimensionnelles
Étape 3: Autres configurations
Astera est autant une question de flexibilité que d’automatisation.
Le modèle dimensionnel automatisé élimine tous les tracas liés aux configurations manuelles. Cependant, cela ne signifie pas que notre modèle de données dimensionnelles est gravé dans le marbre. Avant son déploiement, vous pouvez également ajuster le modèle manuellement pour répondre aux exigences de votre cas d'utilisation d'entrepôt de données.
Par exemple, vous pouvez ajouter de nouvelles entités, redéfinir des relations, reconfigurer des faits et des dimensions individuels, ajouter des clés de substitution et des identifiants de ligne.
De même, créez de nouvelles relations en sélectionnant des entités de lien identifiantes ou non dans la barre d'outils et en joignant vos entités.
Les liens ou relations individuels peuvent être configurés plus en détail via la fenêtre "Modifier la relation".
Fig 5. Modifier les types de relations, les noms d'alias ou ajouter différentes clés étrangères
De plus, si vous prévoir de faire modifications apportées aux entités, vous pouvez accéder à un diverses Options en faisant simplement un clic droit sur entité d'intérêt.
Vous pouvez reconfigurer les entités en ajoutant des identifiants de clé/ligne de substitution, en modifiant les schémas ou en modifiant les noms et types d'éléments, etc.
Enfin, en sélectionnant les propriétés, vous pouvez ouvrir le générateur de mise en page d'une entité et accéder aux paramètres des colonnes individuelles.
C'est ce que le générateur de mise en page pour une dimension (sjetons) ressemble à:
Fig 7. Générateur de mise en page pour les entités individuelles
Le générateur de mise en page est utilisé reconfigurer champs spécifiques et attribuer fait ou dimension spécifique rôle (en le forme d' SCD) pour des performances de requête et une maintenance de l'historique optimales.
Enfin, sur le champ des index d'entité, vous pouvez ajouter des index pour augmenter la vitesse de récupération en fonction des champs d'entité.
Fig 8. Index des entités
La figure ci-dessus contient un index existant, « PK_Sales_Customers », qui est un index de clé primaire présent dans le base de données. Pour les optimisations d'index, vous pouvez ajouter, supprimer ou générer automatiquement des index en fonction des caractéristiques des champs en un seul clic.
Y a-t-il d'autres étapes ? Non, c'est ça. Le schéma en étoile de votre modèle de données dimensionnelles automatisé est prêt. Cependant, il est important de noter que ce modèle existe actuellement à un niveau logique. Nous pouvons créer une couche physique dans la base de données de notre choix en utilisant le ingénierie avancée caractéristique, qui encore une fois is très simple à travers Astera.
Modélisation dimensionnelle automatisée avec Astera
AsteraLa modélisation dimensionnelle automatisée de transforme votre approche de l'entreposage de données. En automatisant l'ensemble du processus et en fournissant un environnement 100 % sans code pour les optimisations de modèles, Astera Constructeur DW réduit considérablement le temps de conception et de développement. En plus de cela, il ne perd pas le flexibilité, étant donné la pléthore de paramétrage options disponibles jen notre da de niveau entrepriseune solution d’automatisation d’entrepôt.
En savoir plus sur la génération de schéma de base de données à l'aide de l'ingénierie avancée automatisée.
Auteurs:
- Haris Azem