当社のデータ抽出技術に基づく製品は、世界中のさまざまなプロジェクトで使用されており、個々の産業(教育、銀行、保険、電気通信など)の高度に専門化されたタスクと、国家規模のプロジェクト(ロシアの統一国家試験、多くの国での国勢調査、 チリでの大統領選挙、ウクライナ国家雇用センターの報告システム)。
ABBYY FlexiCaptureは、既製のカスタマイズ可能なソリューションの形式とSDKの形式の両方で存在します。 多くの場合、既製のソリューションを使用して、データ入力サブシステムを顧客の情報システムに深く統合することはできません。 この場合、SDKが役に立ちます。次に、SDKの仕組みと使用されているプロジェクトについて説明します。
確かにほとんどの人はSDKが何であるかを知っています、残りについては言うでしょう:SDKは、開発者が彼らが作成するソリューションに既製の技術(私たちの場合、フォームを認識して処理するための技術)を埋め込むことを可能にする関数の既製ライブラリのセットです このブログではABBYY FlexiCapture Engineの以前のバージョンについてはまだ説明していませんので、投稿の冒頭でこの製品で何ができるかについていくつかの言葉をお伝えし、新しいバージョンに移ります。
Windows用ABBYY FlexiCaptureエンジンの機能:
1.ドキュメントの自動分類。
2.構造に関係なく、あらゆるタイプのドキュメントの処理:
- 厳格な構造化/構造化文書:アンケート、試験テスト、フォーム、保険フォーム、健康保険の支払い要求、確定申告など
- 不十分な構造の文書:請求書、注文書、納品書など
- 非構造化文書:手紙、契約書、記事など
3.複数ページのドキュメントとテーブルの処理。
文書は、認識された文書を一連の事前定義済みテンプレートと比較することにより処理されます。 さらに、ドキュメントテンプレートには2つのタイプがあります-リジッド(ドキュメント内のフィールドの所定の場所)とフレキシブル(フィールドの場所は指定された要素、データ、またはさまざまな種類の関係とルールに基づいて決定されます)。
便利で迅速なテンプレート開発のために、特別な視覚モデリングツールが提供されています。 テンプレートは、構造化されていないドキュメントも含め、あらゆる種類のドキュメントに対して個別に作成できます。これは非常に簡単です。 以下は、請求書を処理するために作成および使用されるテンプレートの例です(請求書は構造が弱い文書のカテゴリに属します)。また、申請書のテンプレート(構造が硬い文書の例)です。
![](https://habrastorage.org/storage/896b0a41/9516fcf8/a49fcfb8/fc880f89.png)
![](https://habrastorage.org/storage/ecf8074e/a0a26a1b/bd367420/8ea1ac85.png)
ABBYY FlexiCapture Engineの特別な検証APIを使用すると、ユーザーによる検証用のフィールド/文字のリストを取得できます。 さらに、認識されたフィールドに関する追加情報、たとえば、座標、フィールドタイプ、エラーリスト、自信を持って認識された文字の割合を取得することができます。これにより、認識された文字のチェックの品質を構成し、ドキュメントの処理およびアセンブリ中に発生するエラーを追跡できます。
処理後、ドキュメントは構造化データの形式で、さらにPDFまたはPDF / A形式の電子ドキュメントの形式でターゲット情報システムにエクスポートできます。 この機能により、後続の処理のためのデータ抽出とともに、電子文書のアーカイブを同時に作成し、その内容で文書を検索することができます。 たとえば、このシナリオで請求書を処理すると、財務データがERPシステムに自動的にアップロードされ、PDF形式の請求書の電子コピーが電子アーカイブに保存されます。
これは古典的な製品シナリオですが、もっと珍しいものもあります。 そのため、ABBYY FlexiCapture Engineは、電話や領収書の支払いを行うセルフサービス端末にインストールできます。製品は、身分証明書(パスポートなど)からデータを認識する必要があるセキュリティシステムまたはアクセス制御システムで使用できます。
また、スキャナーからではなく、携帯電話からデータを取得し、会社のデータベースではなく、たとえば税務署に転送することもできます。 このシナリオは、アメリカの会社Intuitによって考案および実装されました。 モバイルアプリケーションを使用すると、アメリカ人は誰でも自分の所得明細書(フォームW-2、ロシアの個人所得税2に類似)を写真に撮ることができます。プログラムは、データを処理した後、FlexiCaptureエンジンがインストールされているサーバーに画像を送信し、IRS(米国税務当局)に送信します。
![](https://habrastorage.org/storage/f4673ff1/18962e2e/b78b2d07/9b61bdda.png)
次の投稿の1つで、このプロジェクトについて詳しく説明します。
そして今-私たちの製品の新バージョンについて。
ABBYY FlexiCapture Engine 9.0の新機能
このバージョンには、 ABBYY FlexiCapture製品の9番目のバージョンに登場したほとんどすべての改善が含まれています。 これらは、新しい認識言語(中国語、日本語、韓国語)、新しいマルチレベル分類子、ドキュメントからカラーシールとスタンプを削除して認識品質を向上させる、または逆に、エクスポート中に個々のフィールドを非表示にする技術です。
そのため、ドキュメントからカラースタンプが削除されます。 それは:
![](https://habrastorage.org/storage/89cb1ecb/8aafdf36/2b9aad48/c3a53762.png)
次のようになりました:
![](https://habrastorage.org/storage/85525e8e/d955f208/98535ae9/b49fbd91.png)
これが、個々のフィールドを非表示にする機能の仕組みです。 それは:
![](https://habrastorage.org/storage/f6562aa3/3f6fd3fc/8739804e/04df0395.png)
次のようになりました:
![](https://habrastorage.org/storage/4e88de68/edb8c435/d553f960/4f8dd343.png)
技術の改善に加えて、APIは大幅に改善されました。 新しいバージョンでは、開発者はコードを介して処理プロセスを直接制御できます-画像のアップロード、処理パラメーターの設定、重複するテンプレートのリストの作成、データのアップロード(エクスポート)。
ソースイメージと処理テンプレートは、ディスク上のファイルシステムだけでなく、任意のストレージ(データベース、ネットワークストレージ)にも保存できます。 製品の以前のバージョンでは、そのようなリポジトリにアクセスする場合、一時ファイルを作成する必要があり、さらに、処理を開始する前にこれらのファイルをすべて事前にロードする必要がありました。 新しいバージョンには、リモートリポジトリのファイルを直接操作して、メモリ内のバイトストリームの形式でデータにアクセスする機能があります。 これにより、画像の並列処理と読み込みを整理できます(最初の画像を読み込み、認識を開始し、同時に残りの画像を読み込みます)。 多くのシナリオでは、これによりプログラムが大幅に高速化され、
たとえば、開発者はPicasaウェブアルバムに保存されているユーザーの写真を処理するアプリケーションを作成できます。 さらに、これらの画像を処理するためのテンプレートは中央に保存でき、テンプレートデータベースを最新の状態に保つのに便利です。
![](https://habrastorage.org/storage/19be47de/62c73cb2/b00c931d/e0746a9b.png)
さらに、ABBYY FlexiCapture Engine 9.0は、マルチスレッドモードでの使用に合わせて特別に最適化されており、マルチコアプロセッサシステムの異なるコアにタスクを分散でき、ドキュメント処理がはるかに高速になります。
![](https://habrastorage.org/storage/74b92253/e88aae16/cba8f49f/3342192a.png)
新しいバージョンでも、コードサンプルライブラリを更新および拡張しました。FCEスクリプトのリストには、特定のスクリプトを実装できるコードの作成方法に関するヒントと、このスクリプトの動作方法のデモが含まれています。
![](https://habrastorage.org/storage/51a77076/ab403151/f9bac68b/caae0cdb.png)
今後のリリースの1つでは、別の重要なコンポーネント(ビジュアルコンポーネント)が追加されます。つまり、開発者がアプリケーションに挿入できるインターフェイス要素です。
出力には、より多くの認識言語、使いやすいAPI、テンプレートを作成するための視覚的なツール、コード例のライブラリ、さまざまな開発環境のサポート、そしてもちろん認識精度など、さまざまな機能を含むユニバーサル開発者ツールキットが用意されています。 質問を予想して、Linuxバージョンはすでに開発中であるとしましょう。
ABBYY Webサイトで、ABBYY FlexiCapture 9.0 for Windowsの詳細をご覧ください 。
マキシムボッホレフ
開発者製品部