Blogs

Accueil / Blogs / Extraction intelligente de données avec ReportMiner: Automatisation de la création de modèles d'extraction

Table des matières
L'automatisé, Pas de code Pile de données

Apprener comment Astera Data Stack peut simplifier et rationaliser la gestion des données de votre entreprise.

Smart Data Extraction avec ReportMiner: Automatisation de la création de modèles d'extraction

Novembre 30th, 2023

Un modèle d’extraction est au cœur de l’extraction de données à partir de données non structurées en utilisant ReportMiner. Le modèle consiste essentiellement en un ensemble de modèles de correspondance de données. Ces modèles sont utilisés pour identifier les données souhaitées dans le document.

Généralement, ces modèles de mise en correspondance de données sont construits après avoir soigneusement observé les modèles dans les données, puis appliqué les identificateurs de modèle appropriés. Le modèle est utilisé pour identifier le bloc de données souhaité. L'étape suivante nécessite l'identification des champs de données en les marquant dans une région de données exemple.

Astera reconnu très tôt que la création manuelle régions et champs de données peut prendre du temps et être source d'erreurs, nous avons donc décidé de développer une solution qui automatise les étapes nécessaires à la création d'un modèle d'extraction. Cela élimine le besoin d'observer les données et de trouver manuellement un modèle correspondant.

Comme le montre la figure ci-dessous, une fois que vous avez chargé votre rapport, tout ce que vous avez à faire est de sélectionner quelques exemples de lignes qui appartiennent à votre région et vous verrez un marqueur positif (vert) apparaître à côté de votre sélection.

ReportMiner analyse automatiquement le texte à la recherche d'un motif, met en surbrillance la zone et crée la région pour vous. Si vous souhaitez effectuer des ajustements, cliquez simplement sur le marqueur vert ou cliquez à gauche d'une ligne qui est mise en surbrillance sans marqueur, et un marqueur négatif (rouge) apparaîtra, ce qui mettra cette ligne en surbrillance et l'exclura de la région .

Comme pour les régions, la nouvelle fonctionnalité automatisée de ReportMiner vous permet également de créer des champs automatiquement en analysant l'échantillon de la région pour rechercher des modèles de données répétitifs.

Tout ce que vous avez à faire est de cliquer avec le bouton droit de la souris dans la zone de données et de sélectionner "Créer automatiquement des champs".

ReportMiner analysera le fichier source et créera des champs automatiquement, comme indiqué ci-dessous.

Avec la nouvelle création intelligente de capacités de régions et de champs au sein de ReportMiner 6.4, vous n’avez plus besoin de passer des heures fastidieuses à créer manuellement des régions et des champs afin d’extraire les données dont vous avez besoin. En quelques clics de souris, vous pouvez commencer rapidement la partie la plus importante de votre projet: exploiter les données extraites pour accroître l'efficacité de votre entreprise.

Tu pourrais aussi aimer
Les 7 meilleurs outils d'agrégation de données en 2024
Cadre de gouvernance des données : qu’est-ce que c’est ? Importance, piliers et meilleures pratiques
Les meilleurs outils d'ingestion de données en 2024
Considérant Astera Pour vos besoins en gestion de données ?

Établissez une connectivité sans code avec vos applications d'entreprise, vos bases de données et vos applications cloud pour intégrer toutes vos données.

Connectons-nous maintenant !
connectons-nous