ハンブルクのアカウントによると

先日、ABBYY FlexiCapture for Invoicesをリリースしました。これは、ヨーロッパのアカウントのエントリをEDMS(電子文書管理システム)にストリーミングするためのソリューションです。 厳密に言えば、「大きな」 ABBYY FlexiCaptureは請求書を処理することもでき、それに基づいて新しいソリューションが作成されます。 ただし、アカウントを操作するためのすべての設定を個別に設定する必要があり、多くのお客様は、既に構成されているソリューションを好みます。 まあ、あなたは理解しています-箱から出してプログラムを取得し、Maryをコンピューターにインストールし(現在ヨーロッパでのみ販売されています)、EDMSに接続し、それを機能させます。







このソリューションは、請求書という1種類のドキュメントのみを処理するように特別に設計されています。 これにより、これらのドキュメント専用のテクノロジを改善および「シャープ」にできました(ただし、他のドキュメントを処理できます)。



最も重要なことは、ABBYY FlexiCapture for Invoicesには、さまざまな国のアカウントから情報を正確に抽出できる汎用的な柔軟な説明が用意されていることです。 このプログラムは、アカウントの発行元の国を「理解」し、その国に請求に関する基準が存在することを「認識」します。 これにより、仕入先会社の名前など、請求書のどこで、請求書の合計金額がどこに示されているかを正しく判断できます。







このソリューションは、さまざまなサプライヤからの多数のアカウントから作成された「柔軟な説明」の高度な技術に基づいています。 言い換えると、さまざまな国から多くのアカウントを取得し、プログラムをトレーニングして、それらを区別し、どこに何が示されているかを正しく判断するだけでなく、受信した文書を受け入れることができるかどうかを判断するようにしました。



ここで 、柔軟な説明がどのように機能するかについて詳しく説明しので、簡単に説明します。柔軟な説明は、FlexiLayout Studioツールを使用して作成された弱構造化文書の構造の正式な説明です。 このタイプのすべてのドキュメントの構造が同じであるハードテンプレートとは異なり、不十分な構造のドキュメントの場合、フィールドの場所はかなり異なります。 柔軟な説明では、見出しのキーワード、すでに見つかった他のフィールドなどに基づいて、そのようなフィールドを探します。



各国には、税金と法的規則、データ形式、フィールドの場所など、独自の請求明細があります。 たとえば、スイスでは、アカウントの税金を計算するとき、その値は0.05に丸められます。 これは、スイスで最小のコインが5セント(Santim-スイスフランから0.01)であるためです。 また、たとえばスペインでは、同じ会社の名前を6つの異なる方法で綴ることができますが、これらはすべて標準的な略語です。



そのような違いは、一方で、普遍的な柔軟な記述を作成するタスクを多少複雑にし、他方で助けます。 また、アカウントの残りのフィールドの検索を支援します。 ただし、フィールドを検索して認識する前に、最初に認識言語を決定する必要があります。 このためには、最初に請求書の発行元の国を決定する必要があります。 これは、ユーザーが接続したデータベースに役立ちます。 データベースには、サプライヤーのリストと、サプライヤーに関する必要な情報(名前、住所、銀行の詳細、そして最も重要な国)が含まれています。 国を決定すると、プログラムは、この国のアカウントに固有の設定(税、指定、削減など)を確認し、その後、残りのフィールドを検索します。 このようにして、柔軟な記述が適用され、必要なデータが抽出されます。







ソリューションはすぐに使用できますが、ユーザーはそれを改善し、目標、ドキュメント、およびビジネスプロセスに合わせて修正することができます。 FlexiCapture for Invoicesは、プログラム管理者とドキュメント検証オペレーター(オペレーターメアリー-覚えていますか?)の両方が柔軟な説明を調整できるようにするトレーニングテクノロジーを使用しています。



特定のサプライヤーの文書の特性を考慮して、汎用の柔軟な説明を変更するには、オペレーターは特別な知識とスキルを持っていてはなりません。 柔軟な説明は、ドキュメントの処理中に確定されます。オペレータがドキュメント上でフィールドが見つからない、または誤って検出されたことに気づいた場合、マウスでフィールドの周りのフレームを変更し、Trainボタンを押します。 Trainボタンを押すと、プログラムは特定のプロバイダーについて、このフィールドがアカウントの特定の場所にあることを示すシグナルを送信し、プログラムはフィールドの内容、その直接の環境、このフィールドと画像内の他のオブジェクトの幾何学的関係などの要因を考慮してこれを記憶します。 さらに、柔軟な説明は新しいプロパティを考慮して変更され、柔軟な説明の新しいバージョンがこのサプライヤ専用に形成されます。 このサプライヤからの以下の文書は、柔軟な説明の新しいプロパティを考慮して処理されます。











トレーニングの結果(プログラム内での見方)は、いくつかのオプション(ブランチ)で構成される柔軟な記述であり、各オプションは特定のプロバイダーからのドキュメントのサブタイプを記述します。 学習プロセスでは、プログラムは学習プロセスで取得した新しいプロパティをドキュメントの特定のサブタイプに「接続」します。 一般的な柔軟な説明を重ね合わせた結果は、トレーニングされたバージョンの結果と比較され、個々のフィールドごとに最適な結果が選択されます。



プログラム管理者には、Maryよりもテンプレートをファイナライズするためのオプションがいくつかあります。 彼は柔軟な説明オプションのリスト全体にアクセスでき、これらの各オプションをトレーニングすることもできます。 各オプションの名前は、サプライヤー会社の名前です。 それぞれ「内部」-トレーニングが行われた基礎となる文書の選択。







管理者が特定のプロバイダーからのドキュメントがプログラムによって十分に処理されると判断した場合、オペレーターがこのプロバイダーからドキュメントを学習する可能性を無効にして、Maryが学習結果を誤って損なわないようにすることができます。

自動トレーニングに加えて、プログラムには特定の企業のニーズに合わせてカスタマイズする機会がたくさんあります。 プログラム管理者は、柔軟な説明が設定されているすべての国のリストを見ることができます。 各国にはそれぞれ独自の設定リストがあります。言語のセット、法律と税のルール、フィールドのセットと配置です。 これらの設定とプロパティはすべて編集できます(結局、ヨーロッパでも税法が変わることがあります:))。また、標準リストにない新しい国を追加し、独自の設定を指定します。







認識および検証されたドキュメントは、次の3つのフラグ(ステータス)のいずれかでエクスポートできます。有効-すべてのチェックに成功したドキュメント、例外-検証(検証)が必要なドキュメント、および拒否-チェック後にドキュメントに重大なエラーがあるドキュメント異なるステータスのドキュメントは、異なる設定でエクスポートできます。 プログラムはチェックの結果としてステータスを自動的に設定し、オペレータはドキュメントのステータスを変更できますが、ドキュメントごとにコメントを書き込む必要があります-ステータス変更の理由。







このような業務の配置が、たとえば会社のビジネスプロセスの観点から、管理者に合わない場合、オペレータはステータスフィールドの値を変更することを禁止できます。



こちらがそのような製品です。 欧州のユーザーがABBYY FlexiCapture for Invoicesをお楽しみください。



アナスタシア・エヴストラトヴァ

企業プロジェクト部



All Articles