استخراج البيانات الذكية مع ReportMiner: أتمتة إنشاء نماذج الاستخراج

By |2020-11-04T14:16:35+00:00نوفمبر 4th، 2020|

نموذج الاستخراج هو في صميم استخراج البيانات من البيانات غير المهيكلة باستخدام ReportMiner. يتكون النموذج بشكل أساسي من مجموعة من أنماط مطابقة البيانات. تُستخدم هذه الأنماط لتحديد البيانات المطلوبة داخل المستند.

عادةً ، يتم إنشاء أنماط مطابقة البيانات هذه بعد ملاحظة أي أنماط في البيانات بعناية ثم تطبيق معرفات الأنماط المناسبة. يستخدم النمط لتحديد كتلة البيانات المطلوبة. تتطلب الخطوة التالية تحديد حقول البيانات من خلال وضع علامة عليها داخل منطقة بيانات نموذجية.

 

Astera يتم التعرف في وقت مبكر على أن إنشاء مناطق البيانات وحقولها يدويًا يمكن أن يستغرق وقتًا طويلاً وعرضة للخطأ ، وبالتالي شرعنا في تطوير حل يقوم بأتمتة الخطوات المطلوبة لبناء نموذج استخراج. هذا يلغي الحاجة إلى مراقبة البيانات والخروج يدويًا بنمط مطابق.

كما هو موضح في الشكل أدناه ، بمجرد تحميل تقريرك ، كل ما عليك فعله هو تحديد سطرين من العينة ينتميان إلى منطقتك وسترى علامة إيجابية (خضراء) تظهر بجوار اختيارك.

ReportMiner يقوم تلقائيًا بمسح النص بحثًا عن نمط ، ويميز المنطقة ، وينشئ المنطقة لك. إذا كنت ترغب في إجراء تعديلات ، فما عليك سوى النقر فوق العلامة الخضراء أو النقر على يسار الخط الذي تم تمييزه بدون علامة ، وستظهر علامة سلبية (حمراء) ، والتي ستؤدي إلى إلغاء تمييز هذا الخط واستبعاده من المنطقة .

كما هو الحال مع المناطق ، فإن الميزة التلقائية الجديدة في ReportMiner يمكنك أيضًا من إنشاء الحقول تلقائيًا عن طريق مسح عينة المنطقة لتكرار أنماط البيانات.

كل ما عليك فعله هو النقر بزر الماوس الأيمن في منطقة البيانات وتحديد "إنشاء الحقول تلقائيًا".

ReportMiner سيقوم بفحص الملف المصدر وإنشاء الحقول تلقائيًا ، كما هو موضح أدناه.

مع إنشاء ذكي جديد للمناطق والحقول القدرة داخل ReportMiner 6.4 ، لم يعد عليك قضاء ساعات شاقة في إنشاء المناطق والحقول يدويًا لاستخراج البيانات التي تحتاجها. من خلال بضع نقرات بالماوس ، يمكنك البدء بسرعة بأهم جزء من مشروعك - الاستفادة من البيانات المستخرجة لزيادة كفاءة عملك.