Блог

Главная / Блог / Интеллектуальное извлечение данных с помощью ReportMiner: Автоматизация создания моделей извлечения

Содержание
Автоматизированный, Без кода Стек данных

Научиться Astera Data Stack может упростить и оптимизировать управление данными вашего предприятия.

Интеллектуальное извлечение данных с ReportMiner: Автоматизация создания моделей извлечения

Ноябрь 30th, 2023

Модель извлечения лежит в основе извлечения данных из неструктурированных данных с использованием ReportMiner. Модель по существу состоит из набора шаблонов сопоставления данных. Эти шаблоны используются для идентификации нужных данных в документе.

Обычно эти шаблоны сопоставления данных создаются после тщательного наблюдения за любыми шаблонами в данных и последующего применения соответствующих идентификаторов шаблонов. Шаблон используется для идентификации желаемого блока данных. Следующий шаг требует идентификации полей данных путем их маркировки внутри выборочной области данных.

Astera сразу осознал, что создание вручную области и поля данных может занять много времени и привести к ошибкам, поэтому мы решили разработать решение, которое автоматизирует шаги, необходимые для построения модели извлечения. Это избавляет от необходимости наблюдать за данными и вручную находить соответствующий шаблон.

Как показано на рисунке ниже, после загрузки отчета все, что вам нужно сделать, это выбрать пару строк выборки, принадлежащих вашему региону, и рядом с вашим выбором появится положительный маркер (зеленый).

ReportMiner автоматически сканирует текст на предмет шаблона, выделяет область и создает ее для вас. Если вы хотите внести изменения, просто щелкните зеленый маркер или щелкните слева от линии, которая выделена без маркера, и появится отрицательный маркер (красный), который отменит выделение этой линии и исключит ее из региона. .

Как и в случае с регионами, новая автоматизированная функция в ReportMiner также позволяет автоматически создавать поля путем сканирования выборки региона на предмет повторяющихся шаблонов данных.

Все, что вам нужно сделать, это щелкнуть правой кнопкой мыши в области данных и выбрать «Автоматически создавать поля».

ReportMiner просканирует исходный файл и автоматически создаст поля, как показано ниже.

Благодаря новым интеллектуальным возможностям создания регионов и полей внутри ReportMiner 6.4 вам больше не придется тратить утомительные часы на создание регионов и полей вручную для извлечения необходимых данных. С помощью нескольких щелчков мыши вы можете быстро приступить к самой важной части вашего проекта — использованию извлеченных данных для повышения эффективности вашего бизнеса.

Вам также может понравиться
7 лучших инструментов агрегирования данных в 2024 году
Структура управления данными: что это такое? Важность, основные принципы и передовой опыт
Лучшие инструменты приема данных в 2024 году
принимая во внимание Astera Для ваших потребностей в управлении данными?

Установите соединение без кода с вашими корпоративными приложениями, базами данных и облачными приложениями для интеграции всех ваших данных.

Давайте соединимся сейчас!
давайте соединимся