Blogs

Accueil / Blogs / Krish Krishnan, leader d'opinion en matière de données, sur la modélisation automatisée des données

Table des matières
L'automatisé, Pas de code Pile de données

Apprener comment Astera Data Stack peut simplifier et rationaliser la gestion des données de votre entreprise.

Le leader d'opinion sur les données, Krish Krishnan, sur la modélisation automatisée des données

Ammar Ali

Reseaux Sociaux

3 Janvier 2022

Nous avons récemment présenté notre plate-forme d'automatisation d'entrepôt de données (DWA) de nouvelle génération, Astera Constructeur DW, qui offre une approche agile et axée sur les métadonnées pour créer des entrepôts de données. Notre solution s'adresse aux organisations qui souhaitent accélérer le cycle de vie de leur projet et simplifier le processus de conception et de développement de l'entrepôt de données.

At Astera, nous nous concentrons toujours sur l'innovation et l'amélioration de notre technologie pour offrir la meilleure expérience à nos utilisateurs. Pour mieux comprendre la modélisation des données pour les entreprises modernes, nous avons contacté des experts et des leaders de l'industrie pour connaître leurs réflexions sur le sujet.

Nous avons eu une opportunité fantastique d'avoir une conversation avec Krish Krishnan - un leader d'opinion visionnaire sur les données qui est classé parmi les meilleurs consultants en entrepôt de données au monde. Il est l'auteur de trois livres électroniques et de nombreux articles, livres blancs, études de cas et autres publications sur les appliances et les architectures d'entrepôt de données.

Au cours de notre discussion, il a partagé ses réflexions sur le rôle essentiel de la modélisation des données dans la construction d'architectures BI et le potentiel de transformation de la modélisation automatisée des données dans le monde d'aujourd'hui. Il a également mis en lumière l'importance d'une approche axée sur les métadonnées. Examinons quelques points clés de la discussion :

Quelle est l'importance de la modélisation des données dans la mise en œuvre efficace d'un entrepôt de données ?

Un entrepôt de données est un référentiel de tous les comportements transactionnels qui se produisent dans le système. Sans modélisation des données, une solution efficace ne peut pas être construite du point de vue de la consommation. [Donc], il est essentiel de créer un modèle avant de passer à la consommation de données. Cela signifie convertir des données semi-structurées et non structurées au format structuré. La recommandation est « ne modélisez pas lorsque le modèle arrive, mais modélisez lorsque les données sont extraites ».

Les modèles de données doivent-ils être construits autour de vos données existantes ou conçus pour refléter le processus métier sous-jacent ?

Les données sont générées pour satisfaire les résultats du processus, de sorte que le modèle de données doit être construit autour des exigences de l'utilisateur final. Cela signifie que vous devez disposer d'un modèle lorsque les données quittent l'entrepôt de données. Le modèle de consommation commerciale doit être placé entre l'atterrissage des données et une série de transformations doit être construite autour du processus. C'est donc une combinaison des deux.

Mais jusqu'où vous voudriez aller, c'est là qu'intervient l'automatisation. Dans le monde d'aujourd'hui axé sur les données, il est nécessaire d'automatiser le processus. L'atterrissage des données dans l'entrepôt devrait être plus proche du processus. Les données sortant pour servir une analyse devraient être plus centrées sur les données. Entre les deux, vous pouvez introduire l'automatisation pour exécuter des transformations et maximiser l'efficacité.

Est-ce une bonne idée de créer un modèle de données d'entreprise en amont ?

Une solution privilégiée est un modèle centré sur l'entreprise qui prendrait les données logiques brutes recueillies. Par conséquent, les données brutes sont [présentes dans] une seule source centrale mais peuvent servir à plusieurs fins d'état final. Cela permettrait aux utilisateurs de faire tourner et de faire tourner des modèles selon leurs besoins.

C'est là que la centricité des données entre en jeu. Cela exige que chaque personne dans une organisation comprenne qui produit des données, ce qui entre dans les données, qui utilisera ces données et comment ils prévoient d'utiliser ces données.

"DAta centricity signifie que vous n'êtes pas aligné sur la technologienologie mais le processus qui peut être modélisé et étudié à l'aide de la couche technologique. »

Une approche plus itérative de la modélisation des données devrait-elle être le choix préféré ?

L'approche conventionnelle 'Inmon' consistait à construire un mastodonte et à le remplir. Une approche plus itérative est une approche de modélisation dimensionnelle 'Kimball' qui donne la possibilité de démarrer à la demande et d'avoir un ensemble de points d'intégration par lesquels vous pouvez connecter chaque spin-off. Par conséquent, il n'est pas essentiel de construire un schéma en étoile à chaque fois.

Auparavant, la conception du schéma était principalement pilotée par un système de gestion de base de données relationnelle. C'est parce que le schéma doit suivre la conception. Le système transactionnel exige cette discipline. Mais il est important de comprendre qu'un entrepôt de données n'est pas transactionnel mais stocke tout ce qui s'est passé dans plusieurs systèmes transactionnels.

An approche itérative de la modélisation des données qui mettrait l'accent sur l'orientation commerciale devrait être un choix privilégié.

Que sont les coffres-forts de données ?

« Les coffres-forts de données ont été introduits vers 2010 par Dan Linstedt et Hans Hallgren, mais ils ont été remarqués et sont devenus populaires ces dernières années alors que de plus en plus d'entreprises migrent vers le cloud. Des géants de la technologie comme Amazon, Google et Microsoft et une multitude d'autres fournisseurs qui proposent des services avec eux travaillent sur le stockage des données en raison des avantages qu'il apporte.

C'est une méthodologie par laquelle vous pouvez prendre des données critiques qui sont maîtres de vos systèmes. Vous pouvez les mettre [les données] dans un coffre-fort et les sécuriser. Ensuite, vous pouvez y accéder à partir d'un portefeuille sur une dernière base native grâce à laquelle vous pouvez importer différents types de données provenant de plusieurs domaines.

Quel est le potentiel de transformation de la modélisation automatisée des données ?

Krish pense qu'une modélisation des données plus automatisée signifie que vous pouvez gérer les données plus efficacement. Par exemple, il y a une table client prête dans le système. Vous pouvez ajouter des métadonnées, y compris le nom du client, les adresses, la ville, l'état, le pays, le code postal, les coordonnées, etc. Les champs définis permettent d'accélérer l'ensemble du processus de documentation de ces informations.

"Que fait cette automatisation pour vous ? Il accélère la nécessité d'essayer de documenter chaque exigencet. UNEtout ce qui est supprimé. GUN. TC'est le niveau auquel nous devons automatiser. »

C'est tout à fait vrai. Le processus automatisé de modélisation des données facilite grandement la création d'un méta-référentiel qui établit des relations, minimise les écarts et intègre des systèmes disparates. Il élimine également les incohérences et les inexactitudes des données, augmentant ainsi la valeur des analyses et des rapports.

Pensées d'adieu ?

"Nous devons commencer à adopter ce changement, et le changement signifie le chaos. Le chaos est la seule constante dans le monde dans lequel nous vivons.

Vous pouvez le voir littéralement dans le monde dans lequel nous vivons aujourd'hui. Alors, prenez du recul pour passer la semaine. faites un peu de lecture, écoutez des podcasts sérieux de plusieurs fournisseurs et comprenez quels problèmes sont résolus.

[Et] ensuite, essayez de réfléchir et voyez comment vous faites la même chose avec un nouvel outil dans votre main. ce sont mes derniers commentaires pour la discussion d'aujourd'hui.

Si vous voulez prendre Astera DW Builder pour un essai routier, cliquez ici . Ou, si vous souhaitez discuter de votre cas d'utilisation d'entreposage de données avec notre équipe technique, contactez-nous à ce lien.

Tu pourrais aussi aimer
Les 7 meilleurs outils d'agrégation de données en 2024
Cadre de gouvernance des données : qu’est-ce que c’est ? Importance, piliers et meilleures pratiques
Les meilleurs outils d'ingestion de données en 2024
Considérant Astera Pour vos besoins en gestion de données ?

Établissez une connectivité sans code avec vos applications d'entreprise, vos bases de données et vos applications cloud pour intégrer toutes vos données.

Connectons-nous maintenant !
connectons-nous