FineReader 9.0:革新的な新しいハードコピーソフトナー

スライドプレゼンテーションFineReader 9.0を開く 月曜日、モスクワのArteFAQクラブで、 ABBYYは 、国内のソフトウェアエンジニアリングの伝説の1つと呼ぶにふさわしい、その伝説的な製品であるFineReader光学式テキスト認識システムの新しい9番目のバージョンを発表しました。 開発者の2年間の努力がもたらしたものについて、FineReaderラインと業界全体の歴史と開発の見通しについて、



まず、主力製品であるABBYY-FineReader 8.0の以前の具体化について少し話しましょう。 オフィスワーカーのコンピューターでは、電子的に行う必要のある大量の紙のドキュメントを使用することを余儀なくされた運命の意思により、このプログラムは2005年9月に登場し始めました。 それ以来、ロシアではProおよびG8のコーポレートバージョンの両方で46,000ライセンスが販売されており、これは合法的なFineReaders 7.0の人口の2倍です。 ABBYYロシアのCEOであるGrigory Lipichが述べたように、これは主に、近年ロシアのビジネスを受け入れてきたソフトウェアを合法化するという一般的な要望によるものです。 そして、どうやら、この会社は非常に満足しているので、心から喜ぶことを心から喜んでいます。



Box FineReader 9.0 かなり長い間、ABBYYはロシアと多くの外国(たとえば、会社のシェアが最も近い競合他社のシェアの2倍であるドイツ)の両方でOCRシステム市場の最大の部分をしっかりと保持してきました。 それでは、古いバージョンがバタンと売られているのに、なぜ新しいバージョンをリリースするのでしょうか? 第一に、もちろん、過去数世紀にわたって進歩に基づくものとして広く受け入れられてきた世界支配に対する健全な欲求のためです。 しかし、もっとありふれた理由があります-古いバージョンは単にユーザーのすべてのニーズを満たしていません。 バージョン9.0の基盤となるのは、彼らと協力し、彼らの願いと推奨事項を分析するために費やす無数の時間です。マルチページドキュメントの本格的な作業、再設計されたインターフェイス、マルチスレッドの優れたサポートです。



FineReaderの以前のバージョンとその競合製品はすべて、ドキュメントの論理構造(ヘッダーとフッター、番号付け、イラストと表のキャプション、脚注など)の影響をまったく受けませんでした。 その結果、たとえば、最新のハリー・ポッターの本(もちろん個人アーカイブ専用)をスキャンした後、受信したテキストをPDAで読むのに便利な形式にするために、各ページから番号とヘッダーを手動で削除する必要がありました! このアクションにマクロを使用する可能性にもかかわらず、全体のプロセスはまだ少し不自然に見えました。 FineReader 9.0で最初に使用された新しいAdaptive Document RecognitionADRTテクノロジーは 、このような問題を取り除くために呼び出されます。 開発には約5年かかりましたが、結果は間違いなく価値があります。



ソースドキュメントの論理構造を定義することにより、ADRTはテキストエディタで既にそれを再現することを可能にします。 フォント、スタイル、画像の周囲のテキストのラッピング、ヘッダー、フッターはすべて、対応するWord要素としてその場所でスキャンした後も残り、ドキュメントが最初から作成されたかのように簡単に編集できます。 同時に、出口では、一貫性のない一連の個別のページではなく、本当に単一のドキュメントを取得します:段落または表が改ページによって2つの部分に分割されている場合、それらは要素全体としてエディターに転送されます。 このすべてにより、改善されたアルゴリズムは、構造および設計の要素を平均25%より正確に認識します。



したがって、ユーザーは多数の日常的なアクションを取り除き、より興味深いこと(またはアイドル状態)のために時間を解放します。 システム設定とほとんどの場合に十分な標準スクリプトのセットに基づいて、ドキュメント言語の自動認識システムによって同じタスクが実行されます。 あらゆる種類のウィザードの熱心な相手でさえ、これらのシナリオを選択して開始ウィンドウをオフにしたいとは思わないでしょう。



時代のトレンド-デジタルカメラはますますスキャナーの役割を果たしています。 気付かれることはありませんでしたが、FineReader 9.0では特別なスクリプト「 MS Wordでの写真 」が登場し、ワンクリックで写真付きドキュメントを処理できるようになりました。 内蔵の小さなグラフィカルエディターで写真を処理(回転、切り抜き、解像度の変更など)できるようになりました。



開発者によると、アルゴリズムの技術的改善に基づくインターフェースの改善により、ユーザーがドキュメントを操作する際に実行する必要のある操作の数が平均40%削減されました(ドキュメントの種類に応じて、クリックが20%から80%削減されます)。 はい、 トピックを閉じることができますが、非常に便利なインストーラーではありません-現在は通常のプログラムメニューの形式で作成されています。



最初のデュアルコアプロセッサが市場に登場して以来、適応の必要性について話し始めたマルチスレッドは、FineReader 9.0で完全に使用されています。 文書の最初のページが認識された場合でも、他のページの処理をバックグラウンドのままにして、作業を開始できます。 さらに、マルチコアはパフォーマンスを大幅に向上させるため、肉眼で見ることができます。シングルコアのプロセッサと比較して、デュアルプロセッサで1.6倍、クアッドコアプロセッサで3.2倍です。 しかし、それにもかかわらず、画像認識が遅くなり始めたように感じました。 これは、認識プロセスでより多くの段階が実行され、結果が古いバージョンよりもはるかに優れているという事実によって説明されます。



マイクロソフト製品との互換性は依然としてトップです。 Redmondのゴールドパートナーとして、ABBYYは最初からFineReader 9.0のCertified for Windows Vistaバッジを受け取り、MS Office 2007でサポートされるDOCXおよびXLSX形式のサポートを導入しました。さらに、承認済みPDF / A ISO形式のサポートが作成されました。アーカイブファイル用。 Open Documentとの互換性やOpen Officeとの統合はありません。市場が明白な関心を表明するまではそうではありません。



永遠の質問「Linux用FineReader」は、リピッチ氏から予想と予想外の両方の回答を受け取りました。 まず、FineReaderはすでに* NIXの下に存在し、開発者VNIINSによってMSVS OS(軍隊のモバイルシステム)に移植されています。 しかし、ABBYYは通常のLinuxディストリビューションのバージョンをリリースする予定はありません。 しかし、同社は国家プロジェクト、特に教育機関のコンピュータークラスに無料のオペレーティングシステムをインストールするNP「教育」の開発を注意深く監視しています。 このプログラムが本当に期待される範囲を獲得した場合、ABBYYはLinuxでのOCRシステムの内部ニーズをカバーする準備ができています。



同社の今日の計画には、オリエンタル言語(中国語、タイ語など)のサポートの拡大、9.0エンジンに基づくHomeバージョンのリリース(多くの場合、8.0ではなく)が含まれます。 OCR向けのサーバーソリューションの作成、およびオンラインテキスト認識サービスの作成。 プロトタイプには、スマートフォン自体のスマートフォンのカメラでキャプチャされたテキストを認識できるスマートフォン用のアプリケーションが含まれています。



ABBYYオンラインストアでは、古いバージョンと同じ価格で、Professional Editionの3,750ルーブルで、プログラムの新しいバージョンが利用可能になりました。 それが付いている箱は地域で、1-2週間以内にモスクワ店で現われます-2-3週間。 Corporate Editionの販売は11月に開始されます。



All Articles