Extracción inteligente de datos con ReportMiner: Automatización de la creación de modelos de extracción

By |2022-03-10T11:35:15+00:004 de junio de 2015.|

Un modelo de extracción es el núcleo de la extracción de datos de datos no estructurados usando ReportMiner. El modelo consiste esencialmente en un conjunto de patrones de coincidencia de datos. Estos patrones se utilizan para identificar los datos deseados dentro del documento.

Normalmente, estos patrones de coincidencia de datos se crean después de observar cuidadosamente los patrones en los datos y luego aplicar los identificadores de patrones apropiados. El patrón se utiliza para identificar el bloque de datos deseado. El siguiente paso requiere identificar los campos de datos marcándolos dentro de una región de datos de muestra.

Astera reconoció desde el principio que la creación manual regiones y campos de datos puede llevar mucho tiempo y ser propenso a errores, por lo que nos propusimos desarrollar una solución que automatice los pasos necesarios para construir un modelo de extracción. Esto elimina la necesidad de observar los datos y crear manualmente un patrón coincidente.

Como se muestra en la siguiente figura, una vez que haya cargado su informe, todo lo que necesita hacer es seleccionar un par de líneas de muestra que pertenezcan a su región y verá aparecer un marcador positivo (verde) junto a su selección.

ReportMiner escanea automáticamente el texto en busca de un patrón, resalta el área y crea la región para usted. Si desea realizar ajustes, simplemente haga clic en el marcador verde o haga clic a la izquierda de una línea que esté resaltada sin marcador y aparecerá un marcador negativo (rojo), que quitará el resaltado de esa línea y la excluirá de la región. .

Al igual que con las regiones, la nueva característica automatizada en ReportMiner También le permite crear campos automáticamente al escanear la muestra de la región para repetir patrones de datos.

Todo lo que necesita hacer es hacer clic con el botón derecho en el área de datos y seleccionar "Crear campos automáticamente".

ReportMiner escaneará el archivo fuente y creará campos automáticamente, como se muestra a continuación.

Con la nueva creación inteligente de regiones y capacidades de campos dentro de ReportMiner 6.4, ya no tienes que pasar horas tediosas creando manualmente regiones y campos para extraer los datos que necesitas. Con unos pocos clics del ratón, puede comenzar rápidamente la parte más importante de su proyecto: aprovechar los datos extraídos para aumentar la eficiencia de su negocio.

Artículos Relacionados

Por qué la automatización de extracción de datos es esencial para el crecimiento empresarial

El mundo moderno depende de los datos. Hay una gran cantidad de datos que se ejecutan a través de una organización con cada proceso,...
LEER MÁS

Automatización de procesos de extracción de datos para el sector energético con Astera ReportMiner

El sector energético se encuentra en medio de la mayor disrupción tecnológica. La gestión eficiente de datos se ha convertido en uno de los...
LEER MÁS

Gestione datos sanitarios no estructurados con Astera ReportMiner

Los datos de atención médica están creciendo en velocidad, volumen y variedad. Debe centrarse en la gestión eficaz de los datos para enriquecerse,...
LEER MÁS