Erstellen eines Berichtsmodells mit ReportMiner 6.2 - Teil 1

By |2020-11-05T15:49:44+00:00Dezember 16th, 2014|

ReportMiner gibt Geschäftsdaten frei, die in gedruckten Dokumenten wie Berichten, Kontoauszügen und Rechnungen in gängigen Formaten wie PDF, PRN, TXT, XLS und XLSX enthalten sind. Diese elektronischen Daten können dann in Unternehmensdatenbanken integriert und für Operationen und Business-Intelligence-Anwendungen genutzt werden. ReportMiner Die benutzerfreundliche Umgebung von 6.2 ermöglicht es Benutzern, das zu durchsuchende Dokument anzuzeigen und eine Logik zum Extrahieren von Datenblöcken und Feldern innerhalb dieser Blöcke zu definieren.

Um Daten aus einem gedruckten Dokument zu extrahieren, das als Data Mining oder Report Mining bezeichnet wird, müssen Sie zuerst ein Berichtsmodell erstellen, das die Definition der Berichtsstruktur enthält, und es anschließend an das gewünschte Ziel exportieren. Sie können Ihren Bericht auch als Quellobjekt in einem Datenfluss verwenden, in dem Sie die erweiterten Umwandlungs- und Konvertierungsfunktionen von nutzen können ReportMiner.

Ein Berichtsmodell hat normalerweise einen Datenbereich und Felder, die zu diesem Bereich gehören. Je nach Struktur der Daten können Sie eine eigene Kopf- und Fußzeile erstellen und Bereiche mit eigenen Feldern anhängen. ReportMiner unterstützt eine echte hierarchische Datenextraktion, sodass ein Datenbereich untergeordnete Datenbereiche haben kann und die untergeordneten Bereiche ihre eigenen untergeordneten Daten haben können und so weiter. Diese Woche lernen wir das Extrahieren von Header-Daten und nächste Woche lernen wir die Details zum Erstellen der Felder, aus denen der Header besteht.

Um ein neues Berichtslayout zu erstellen, gehen Sie zu Datei -> Neu und wählen Sie Berichtsmodell (Abbildung 1).

Abbildung 1ReportMiner unterstützt das Extrahieren unstrukturierter Daten aus Text-, EDI-, Excel-, PRN- und PDF-Dateien. Alle Dateitypen fallen unter den Inhaltstyp Report, mit Ausnahme von Excel, das über einen eigenen Inhaltstyp verfügt (Abbildung 2).

Abbildung 2

Wählen Sie die Datendatei aus, die als Beispieldatei verwendet werden soll. Wir werden Daten aus dieser Datei verwenden, um unser Berichtsmodell zu erstellen. Je nach Inhaltstyp Ihrer Daten ändern sich die Leseoptionen. Wenn Sie beispielsweise über eine PDF-Datei verfügen, können Sie den Skalierungsfaktor, die Schriftart, die Größe der Registerkarten und die Kennwörter auswählen.

Wir haben eine Beispieldatendatei für Bestellungen ausgewählt (siehe Abbildung unten). Die ausgewählte Datei wird in den Berichtsdefinitionseditor geladen (Abbildung 3).

Abbildung 3

Hinweis: Sie können auch eine andere Datendatei zu einem späteren Zeitpunkt im Berichtsdefinitions-Editor laden.

Klicken Sie in der Symbolleiste auf das Dateisymbol und navigieren Sie zu der Datei, die Sie laden möchten.

Schauen wir uns diesen Bericht an. Am oberen Ende unseres Musters befinden sich allgemeine Bestellinformationen, z. B. Name des Unternehmens, Datum und Uhrzeit der Bestellung, Kundenname, Kontonummer und andere. Es folgen die detaillierten Bestellinformationen, beispielsweise die Bestellpositionen der Bestellung.

Extrahieren von PDF-Dateikopfdaten mit ReportMiner

Unser Beispielbericht umfasst zwei logische Bereiche, den Kopfbereich und den Datenbereich. Im Gegensatz zu einigen anderen allgemeinen Berichten hat dieser Bericht keinen Fußzeilenbereich.

Die Kopfzeile befindet sich ganz oben im Bericht und umfasst drei Zeilen, beginnend mit der Zeile mit dem Bestelldatum (Abbildung 4).

Abbildung 4

Der erste Schritt bei der Erstellung unseres Berichtsmodells besteht also darin, die Kopfzeile für unseren Bericht zu definieren.

Wählen Sie im Berichtsdefinitionseditor die oberen drei Zeilen aus. Dies ist der Bereich, der den Header abdeckt. Klicken Sie mit der rechten Maustaste auf Ihre Auswahl, und wählen Sie im Kontextmenü eine der folgenden Optionen aus, die im Kontextmenü in Abbildung 5 angezeigt wird.

Abbildung 5Wenn Sie die Kopfzeile erstellen, wählen Sie Seitenkopfbereich hinzufügen aus.

Der Berichtsbrowser auf der linken Seite zeigt jetzt einen neuen Knoten mit dem Namen Header (Abbildung 6).

Abbildung 6Now, schauen wir uns den Header genauer an. Der Header in unserem Beispiel beginnt immer mit einem Datum, das in der ersten Zeile und in der ersten Zeichenposition des Headers angezeigt wird. Wir können das Datum als Identifikationsmuster für die Kopfzeile verwenden.

Jedes Mal, wenn das Muster in der Datei auftritt, ReportMiner wird es als Anfang der Kopfzeile behandeln. Geben Sie die Platzhalterzeichen für Ziffern ein, wie in Abbildung 7 dargestellt.

Abbildung 7

Jedes Mal, wenn dieses Muster in der Datei auftritt, ReportMiner behandelt es als Startpunkt der Kopfzeile.

Beachten Sie, dass der Berichtsdefinitions-Editor die Überschrift jetzt lila hervorhebt. Die Kopfzeile umfasst drei Zeilen, wie im violetten Block im Editor dargestellt. Die Höhe der Kopfzeile oder eines anderen Bereichs (dh die Anzahl der Zeilen, die die Kopfzeile überspannt) wird durch die Eingabe der Zeilenanzahl unterhalb der Berichtssymbolleiste gesteuert.

Der nächste Schritt besteht darin, die Felder zu erstellen, aus denen die Kopfzeile besteht. Wie das geht, zeigen wir Ihnen in der nächsten Woche.

Erfahren Sie mehr über ReportMiner 6.2 bei www.astera.com / Report-Miner.