Smart Data Extraction mit ReportMiner: Automatisierung der Erstellung von Extraktionsmodellen

By |2022-03-10T11:35:15+00:00June 4th, 2015|

Ein Extraktionsmodell steht im Mittelpunkt der Datenextraktion aus unstrukturierten Daten mit ReportMiner. Das Modell besteht im Wesentlichen aus einem Satz von Datenabgleichmustern. Diese Muster werden verwendet, um die gewünschten Daten im Dokument zu identifizieren.

Normalerweise werden diese Datenübereinstimmungsmuster erstellt, nachdem alle Muster in den Daten sorgfältig beobachtet und dann geeignete Musteridentifizierer angewendet wurden. Das Muster wird verwendet, um den gewünschten Datenblock zu identifizieren. Im nächsten Schritt müssen Sie die Datenfelder identifizieren, indem Sie sie innerhalb eines Beispieldatenbereichs markieren.

Astera früh das manuelle Erstellen erkannt Datenregionen und -felder kann zeitaufwändig und fehleranfällig sein, daher haben wir uns vorgenommen, eine Lösung zu entwickeln, die die Schritte automatisiert, die zum Erstellen eines Extraktionsmodells erforderlich sind. Dadurch entfällt die Notwendigkeit, die Daten zu beobachten und manuell ein passendes Muster zu finden.

Wie in der folgenden Abbildung gezeigt, müssen Sie nach dem Laden Ihres Berichts lediglich einige Beispielzeilen auswählen, die zu Ihrer Region gehören. Neben Ihrer Auswahl wird eine positive Markierung (grün) angezeigt.

ReportMiner scannt den Text automatisch nach einem Muster, hebt den Bereich hervor und erstellt den Bereich für Sie. Wenn Sie Anpassungen vornehmen möchten, klicken Sie einfach auf die grüne Markierung oder klicken Sie links neben eine Linie, die ohne Markierung hervorgehoben ist, und eine negative Markierung (rot) wird angezeigt, wodurch diese Linie nicht mehr hervorgehoben und aus der Region ausgeschlossen wird .

Wie bei den Regionen ist die neue automatisierte Funktion in ReportMiner Außerdem können Sie Felder automatisch erstellen, indem Sie das Sample der Region nach sich wiederholenden Datenmustern scannen.

Alles, was Sie tun müssen, ist mit der rechten Maustaste in den Datenbereich zu klicken und „Felder automatisch erstellen“ auszuwählen.

ReportMiner scannt die Quelldatei und erstellt automatisch Felder (siehe unten).

Mit der neuen intelligenten Erstellung von Regionen und Feldern innerhalb ReportMiner Mit 6.4 müssen Sie nicht mehr mühsam manuell Regionen und Felder erstellen, um die benötigten Daten zu extrahieren. Mit wenigen Mausklicks können Sie schnell mit dem wichtigsten Teil Ihres Projekts beginnen, indem Sie Ihre extrahierten Daten zur Steigerung Ihrer Geschäftseffizienz nutzen.

Verwandte Artikel

Warum die Automatisierung der Datenextraktion für das Unternehmenswachstum unerlässlich ist

Die moderne Welt ist auf Daten angewiesen. Es gibt eine riesige Menge an Daten, die mit jedem Prozess durch eine Organisation laufen, ...
Mehr Infos or weiterlesen

Automatisierung von Datenextraktionsprozessen für den Energiesektor mit Astera ReportMiner

Der Energiesektor befindet sich mitten im größten technologischen Umbruch. Effizientes Datenmanagement ist zu einem der...
Mehr Infos or weiterlesen

Verwalten Sie unstrukturierte Gesundheitsdaten mit Astera ReportMiner

Gesundheitsdaten nehmen an Geschwindigkeit, Volumen und Vielfalt zu. Sie müssen sich auf effektives Datenmanagement konzentrieren, um reich zu werden, ...
Mehr Infos or weiterlesen