Qu'est-ce qu'un Data Mart ? Conception, exemples et mise en œuvre expliqués

By |2022-03-28T11:35:51+00:00Octobre 21st, 2019|

Contrairement à un entrepôt de données qui stocke des données à l'échelle de l'entreprise, un magasin de données comprend des informations relatives à un service ou à un domaine particulier. Par exemple, un magasin de données de vente peut contenir uniquement des données relatives aux produits, aux clients et aux ventes. Lisez ce blog pour développer une meilleure compréhension de ces référentiels de données départementaux.

Que sont les Data Marts?

Les magasins de données sont un sous-ensemble de l'entrepôt de données qui traite d'un seul sujet. Ils sont souvent construits et gérés par un seul département métier. Puisqu'ils sont orientés sujet, ils ne prennent généralement des données qu'à partir d'un petit nombre de sources, qui peuvent être des systèmes opérationnels internes, un lac de données, un référentiel de données centralisé ou des sources externes. Ils sont généralement condensés et moins complexes que les entrepôts de données, ce qui les rend plus faciles à construire et à entretenir.

Maintenant que nous avons compris ce qu'ils sont, nous allons examiner les trois différents types d'exemples de datamart, leurs utilisations et la manière dont ils simplifient la gestion des données. Nous illustrerons également un guide étape par étape sur la façon de mettre en œuvre un référentiel de données spécifique au service pour votre entreprise spécifique.

Types de data marts

Source: Study.com

Comment les datamarts profitent-ils à la gestion des bases de données ?

Avant de discuter de leurs différents types, examinons brièvement les avantages des magasins de données et pourquoi ils sont nécessaires pour une entreprise axée sur les données :

  • Activez un accès plus rapide aux données en récupérant un ensemble spécifique de données pour la BI et le reporting. En conséquence, il contribue à accélérer l'intelligence d'affaires.
  • Ils sont plus faciles à mettre en œuvre et plus rentables que la création d'une entreprise entrepôt de données.
  • Conçu selon les exigences d'un groupe particulier d'utilisateurs travaillant dans un département spécifique.
  • Ils sont comparativement plus adaptables qu'un entrepôt de données. Toute modification du modèle de données peut être facilement et rapidement intégrée au magasin de données en raison de sa taille réduite.
  • Autorisez des droits de contrôle d'accès granulaires en raison d'un partitionnement et d'une segmentation étendus.

En bref, les magasins de données sont beaucoup plus rapides, adaptables et rentables à entretenir qu'un entrepôt de données. En revanche, les entrepôts de données sont créés pour consolider les données provenant d'une myriade de sources (souvent pas dans un format structuré).

Types de Data Marts

Les bases de données peuvent être classées en trois types principaux:

1. Magasin de données dépendant

Un magasin de données dépendant vous permet de combiner toutes vos données commerciales en un seul entrepôt de données, vous donnant les avantages typiques de la centralisation.

Dans cet exemple de magasin de données, des magasins de données départementaux sont nécessaires et vous devrez les créer en tant qu'entités dépendantes pour assurer la cohérence et l'intégration dans tous les systèmes de stockage de données.

Des magasins de données dépendants peuvent être construits en utilisant deux approches différentes. Dans la première approche, les entrepôts de données d'entreprise et les magasins de données sont construits afin que l'opérateur puisse accéder aux deux en cas de besoin. Dans la deuxième approche, également connue sous le nom d'approche fédérée, les résultats du processus ETL sont stockés dans une zone de stockage temporaire telle qu'un bus de données commun au lieu d'un base de données l'opérateur ne peut donc accéder qu'aux données départementales.

Cette dernière méthode n’est pas idéale, car elle génère parfois une clé de stockage dans laquelle toutes les données proviennent d’une source partagée, mais sont en grande partie ignorées.

2. Data Mart indépendant

Un magasin de données indépendant peut être créé sans utiliser l'entrepôt de données central. Il est principalement recommandé pour les unités ou les groupes plus petits au sein d'une organisation. Comme son nom l'indique, ce type de référentiel n'est lié ni à l'entrepôt de données d'entreprise ni à aucune autre entité. Il saisit les données séparément et les analyses sont également exécutées indépendamment.

À mesure que de plus en plus de magasins de données indépendants sont construits, la redondance des données augmente également dans l'ensemble de l'organisation. En effet, chaque magasin de données indépendant a besoin du sien, généralement une copie des informations commerciales complètes. Comme ces magasins de données indépendants accèdent directement aux fichiers et/ou aux tables du système d'exploitation, ils limiter l'évolutivité des systèmes d'aide à la décision (DSS).

3. Magasin de données hybride

En utilisant un data mart hybride, vous pouvez combiner les données de plusieurs systèmes sources opérationnels en plus d'un entrepôt de données. Ceux-ci sont particulièrement utiles lorsque vous avez besoin d'une intégration ad hoc, telle que l'ajout d'un nouveau groupe ou de nouveaux produits à l'entreprise.

Comme son nom l'indique, un magasin de données hybride est un mélange des types dépendant et indépendant. Il convient aux entreprises qui ont plusieurs bases de données et qui ont besoin d'un délai d'exécution rapide. Les exemples de magasins de données de ce type nécessitent un léger nettoyage des données, prennent en charge d'énormes structures de stockage et sont flexibles car ils combinent les avantages des systèmes dépendants et indépendants.

Conception de Data Marts pour l'entreposage de données

Voici comment concevoir un magasin de données pour les besoins de votre entreprise :

1. Conception

La première étape consiste à créer une conception robuste. Certains processus critiques impliqués dans cette phase comprennent la collecte des exigences d'entreprise et techniques, l'identification des sources de données, le choix d'un sous-ensemble de données approprié et la conception de la disposition logique (schéma de base de données) et de la structure physique.

2. Construire / Construire

La prochaine étape consiste à le construire. Cela inclut la création de la base de données physique et des structures logiques. Au cours de cette phase, vous allez créer les tables de faits, les tables de dimension, les champs, les index et les contrôles d'accès.

3. Remplir / Transfert de données

L'étape suivante consiste à remplir le marché, ce qui signifie y transférer des données. Dans cette phase, vous pouvez également définir la fréquence de transfert de données, par exemple quotidienne ou hebdomadaire. Cela implique généralement d'extraire les informations sources, de nettoyer et de transformer les données et de les charger dans le référentiel ministériel.

4. Accès aux données

Dans cette étape, les données chargées dans le magasin de données sont utilisées pour interroger, générer des rapports, des graphiques et publier. La tâche principale impliquée dans cette phase est la mise en place d'une méta-couche et la traduction des structures de base de données et des noms d'éléments en expressions d'entreprise afin que les opérateurs non techniques puissent facilement utiliser le data mart. Si nécessaire, vous pouvez également configurer une API et des interfaces pour simplifier l'accès aux données.

5. Gérer

La dernière étape implique la gestion et l'observation, qui comprend :

  • Contrôle de l'accès des utilisateurs en cours.
  • Optimisation et raffinement du système cible pour de meilleures performances.
  • Ajout et gestion de nouvelles données dans le référentiel.
  • Configuration des paramètres de récupération et garantie de la disponibilité du système en cas de panne.

Conclusion

Un magasin de données comprend une sous-section de données à l'échelle de l'entreprise, qui sont précieuses pour un groupe d'utilisateurs particulier dans l'organisation. Contrairement à un entrepôt de données coûteux et complexe à créer, il offre une alternative rentable. Il permet également un accès plus rapide aux données et est simple à utiliser, car il est précisément conçu selon les exigences des opérateurs et se concentre sur un seul département/domaine.

Un data mart peut vous aider à accélérer vos processus d'entreprise, car sa mise en œuvre prend moins de temps qu'un data warehouse. Il renferme également les données passées afin que vos analystes de données puissent facilement déterminer les tendances des données.