Blogs

Inicio / Blogs / Extracción de datos inteligente con ReportMiner: Automatización de la creación de modelos de extracción

Tabla de Contenido
El automatizado, Sin código Pila de datos

Aprende cómo Astera Data Stack puede simplificar y agilizar la gestión de datos de su empresa.

Extracción inteligente de datos con ReportMiner: Automatización de la creación de modelos de extracción

30th noviembre, 2023

Un modelo de extracción es el núcleo de la extracción de datos de datos no estructurados usando ReportMiner. El modelo consiste esencialmente en un conjunto de patrones de coincidencia de datos. Estos patrones se utilizan para identificar los datos deseados dentro del documento.

Normalmente, estos patrones de coincidencia de datos se crean después de observar cuidadosamente los patrones en los datos y luego aplicar los identificadores de patrones apropiados. El patrón se utiliza para identificar el bloque de datos deseado. El siguiente paso requiere identificar los campos de datos marcándolos dentro de una región de datos de muestra.

Astera reconoció desde el principio que la creación manual regiones y campos de datos puede llevar mucho tiempo y ser propenso a errores, por lo que nos propusimos desarrollar una solución que automatice los pasos necesarios para construir un modelo de extracción. Esto elimina la necesidad de observar los datos y crear manualmente un patrón coincidente.

Como se muestra en la siguiente figura, una vez que haya cargado su informe, todo lo que necesita hacer es seleccionar un par de líneas de muestra que pertenezcan a su región y verá aparecer un marcador positivo (verde) junto a su selección.

ReportMiner escanea automáticamente el texto en busca de un patrón, resalta el área y crea la región para usted. Si desea realizar ajustes, simplemente haga clic en el marcador verde o haga clic a la izquierda de una línea que esté resaltada sin marcador y aparecerá un marcador negativo (rojo), que quitará el resaltado de esa línea y la excluirá de la región. .

Al igual que con las regiones, la nueva característica automatizada en ReportMiner También le permite crear campos automáticamente al escanear la muestra de la región para repetir patrones de datos.

Todo lo que necesita hacer es hacer clic con el botón derecho en el área de datos y seleccionar "Crear campos automáticamente".

ReportMiner escaneará el archivo fuente y creará campos automáticamente, como se muestra a continuación.

Con la nueva creación inteligente de regiones y capacidades de campos dentro de ReportMiner 6.4, ya no tienes que pasar horas tediosas creando manualmente regiones y campos para extraer los datos que necesitas. Con unos pocos clics del ratón, puede comenzar rápidamente la parte más importante de su proyecto: aprovechar los datos extraídos para aumentar la eficiencia de su negocio.

También te puede interesar
¿Qué es un catálogo de datos? Características, mejores prácticas y beneficios
Esquema de estrella vs. Esquema de copo de nieve: 4 diferencias clave
Cómo cargar datos desde AWS S3 a Snowflake
Considerando Astera ¿Para sus necesidades de gestión de datos?

Establezca conectividad sin códigos con sus aplicaciones empresariales, bases de datos y aplicaciones en la nube para integrar todos sus datos.

¡Conectémonos ahora!
conectemos