Si vous avez eu une discussion avec un ingénieur ou un architecte de données sur la création d'une conception d'entrepôt de données agile ou sur la maintenance d'un architecture d'entrepôt de données, vous les entendrez probablement dire qu’il s’agit d’un processus continu et qu’il n’a pas vraiment de fin définitive. Et cela, en substance, est à peu près la vérité.
Une conception réussie d'un entrepôt de données utilise généralement une approche agile et des méthodes de développement itératives qui garantissent la fourniture d'informations de qualité aux utilisateurs finaux sur la base des données commerciales actuelles.
Heureusement, entrepôt de données cloud les fournisseurs, comme Microsoft Azure et Amazon Redshift, offrent des options de flexibilité et d'évolutivité rapides qui rendent l'adoption de cette approche relativement plus facile que les cadres traditionnels rigides. Par conséquent, disposer d’une architecture en constante évolution signifie que vous aurez accès à des données précises et à jour pour alimenter vos analyses, permettant ainsi aux équipes et aux services d’atteindre leurs objectifs respectifs.
Comme Geoffrey Moore l'a dit à juste titre :
«Sans analyse de Big Data, les entreprises sont aveugles et sourdes, errant sur le Web comme un cerf sur une autoroute.»
Alors, comment pouvez-vous créer votre propre conception d'entrepôt de données agile, comment cette approche itérative entreposage de données solution fonctionne, et quels résultats une équipe d'ingénieurs et d'analystes commerciaux d'un entrepôt de données peut-elle en attendre ?
Créer une infrastructure d'entrepôt de données plus adaptable et plus réactive
Dans un modèle de développement itératif, l'entrepôt de données est dans un état constant d'amélioration et d'évolution. Au lieu de créer une architecture qui répond à toutes les requêtes dès le premier jour, votre équipe se concentre sur les informations qui comptent le plus pour les utilisateurs de votre entreprise. Vous devez hiérarchiser ce qui est important, les répartir dans de petits segments gérables, puis effectuer plusieurs tours pour modifier l'architecture de votre entrepôt de données en fonction des besoins de votre entreprise.
Pour ce faire, les équipes de données travaillent dans plusieurs sprints et cycles, apportant des modifications aux ETL les flux, modèles dimensionnelset d'autres processus de données après avoir pris connaissance des commentaires des analystes commerciaux et d'autres parties prenantes. Après chaque cycle, un retour d'information continu garantit que ces implémentations fournissent une image fidèle des performances de l'entreprise et résolvent efficacement les points faibles et les lacunes.
De quoi avez-vous besoin pour créer un entrepôt de données agile?
Outre une équipe dédiée d’architectes et d’analystes de données, vous aurez essentiellement besoin d’un outil d'entreposage de données qui offre un environnement de développement sans code pour faciliter les changements rapides, vous permettant ainsi d'éliminer la rigidité de l'architecture.
Principaux composants de AsteraData Warehouse Builder de
Cela dit, presque toutes les organisations peuvent déployer une solution d’entreposage de données agile, à condition qu’elles disposent de la pile technologique appropriée pour alimenter l’initiative. Essentiellement, un outil d'entreposage de données doit fournir :
- Capacités de modélisation des données source qui peut facilement mapper et établir des relations entre vos sources de données
- Fonctionnalité de modélisation dimensionnelle qui peuvent aider à déterminer les faits et les dimensions en fonction des données source et à générer le schéma et les tables qui s'intégreraient dans votre entrepôt de destination
- A moteur ETL hautes performances pour simplifier et accélérer l'agrégation des données et offrir un éventail d'options de transformation, telles que la normalisation, la dénormalisation, la fusion, la jointure, etc.
- La possibilité de passer à ELT ou mode pushdown pour réduire le temps de transformation et accéder rapidement aux données d'entreprise
- Modules de qualité des données pour vous assurer que chaque octet de données répond aux normes de qualité de votre organisation
- Une large gamme d'applications Web, de bases de données et de cloud connecteurs pour vous connecter et apporter vos données d'entreprise à votre entrepôt de données
- Dimensions qui changent lentement (Types 1 à 6) pour contrôler la façon dont les différents champs de données sont remplis dans les tables de base de données
- Support pour Service OData fournir aux utilisateurs finaux des moyens sécurisés d'accéder aux données pour les rapports et les analyses
Ceci n'est pas une liste exhaustive mais juste un aperçu des principales caractéristiques et fonctionnalités requises. Désormais, vous pouvez trouver de nombreux fournisseurs de solutions qui associent plusieurs outils et créent un package personnalisé pour combler les lacunes de fonctionnalités. Cependant, la méthode recommandée est d'opter pour un plate-forme unifiée qui coche toutes ces cases pour répondre à vos besoins d'entreposage de données.
D'accord, ça a l'air génial. Mais pourquoi devrais-je envisager cette approche?
Eh bien, voici pourquoi:
L'objectif principal de toute implémentation de conception d'entrepôt de données agile est de fournir des réponses étayées par des données fiables basées sur le scénario commercial actuel.
Mais le problème est que les entreprises en croissance acquièrent de nouvelles sources de données et modifient le flux d'informations au sein des applications et des bases de données pour s'adapter au rythme de leurs besoins commerciaux croissants. Toutes ces nouvelles sources et mises à jour structurelles doivent naturellement être prises en compte dans les modèles de données existants et reflétées dans le référentiel centralisé pour fournir des données précises et fiables aux utilisateurs finaux.
En tant que telle, l'approche itérative suit la méthodologie agile qui vous permet de concevoir, développer et déployer l'architecture la plus flexible et axée sur les résultats pour construire votre entrepôt de données d'entreprise. Vous pouvez facilement inclure de nouveaux flux de données sans avoir à revoir ou à réécrire les scripts ETL, et cela en quelques heures, voire quelques minutes. C'est en grande partie parce que les outils d'entreposage de données modernes fournissent un environnement de développement sans code et une automatisation des processus de bout en bout, ce qui vous permet d'apporter des modifications rapides à vos flux et de créer de meilleurs processus ETL.
Non seulement cela, vous pouvez également profiter des avantages dans divers scénarios. Qu'il s'agisse de planifier et d'élaborer des stratégies pour le processus d'entreposage de données, de déployer des prototypes pour tester sa faisabilité ou d'effectuer des tests ETL pour garantir des résultats cohérents, cette méthodologie agile facilite le processus de développement à chaque étape.
Peut-être que la valeur réelle de cette approche est perçue dans les avantages commerciaux que les organisations peuvent tirer de sa mise en œuvre. Ceux-ci incluent, mais sans s'y limiter:
- Des résultats plus rapides pour répondre aux exigences de l'utilisateur final en matière de Business Intelligence (DW BI) et d'analyse
- Meilleur alignement avec les besoins évolutifs de l'entreprise
- Capacité à accélérer le prototypage et l'analyse de faisabilité
- TCO réduit grâce à des processus de développement rationalisés
- Des informations de meilleure qualité et à jour sur une prise de décision robuste
- Réduction de la complexité du projet grâce à des cycles plus petits et plus faciles à gérer
- La capacité d'identifier les lacunes plus rapidement, conduisant à une meilleure gestion des risques
- Une plus grande transparence dans les progrès, les performances et les défis à chaque itération
Une solution qui convient à la facture
«L'architecture traditionnelle est beaucoup trop lente. Nous n'avons plus le luxe de deux à trois mois. Nous devons être en mesure de dire aux utilisateurs: "Nous pouvons l'avoir pour vous - dans deux à trois jours". » - Rick van der Lans
De la source aux informations – 7 étapes
Et c'est là que les solutions modernes d'entreposage de données, comme Astera Constructeur DW, sont connus pour réduire considérablement le temps de développement grâce à l'automatisation de bout en bout. Il fournit un cadre d'entreposage de données unifié qui permet à une entreprise de passer de la collecte des exigences à l'analyse via une intégration directe avec un logiciel de visualisation de données.
Vous souhaitez créer votre propre entrepôt de données basé sur une méthode de développement agile et itérative? Faites le premier pas et obtenez un démo en direct personnalisée de Astera Constructeur DW.
Auteurs:
- Junaïd Baig