Mac用ABBYY FineReaderの新バージョン:複雑な機能のジャングルを離れることなく

最近、Mac用の新しいFineReaderをリリースしました。それについて少し説明します。 私は認めます、私は2006年に仕事で完全にMacに切り替えることにした会社の最初の人でした。 それ以前は、ABBYYは主にWindows専用の製品を製造しており、他のプラットフォーム用の製品はほとんど製造していませんでした。 その後、私は定期的にFineReader部門に行き、Mac用の通常のFineReader(PowerPCには古いバージョンしかありませんでした)がないと叫びましたが、しつこく停止してプログラムに座っていました。 それ以来、たくさんの水が流れましたが、私の努力は無駄ではなく、FineReader for Macの更新バージョンを作成するプロセスを開始しました。 だからこそ、私はこの製品のために非常に不均一に呼吸します。



幸いなことに、現在リリースされているFineReader for Macは、私が当時プログラミングしたこととはほとんど関係ありません。 スタイリッシュで高速、快適です。 これは、これまでのMac用FineReader Expressよりもはるかに機能的です。 製品の詳細なレビューは行いません。なぜなら、優れたプログラムは、従来のレビューのジャンルでは慣例であるように、断片化することから利益を得られないからです。 私の観点から、この製品がWindowsの名前とどのように異なるかを書きます。



それは、それがより単純であるという事実とは異なります(そして、私の好みでは、よりエレガントです)。 FineReader for Windowsには文字通り機能が満載されています。 全体として、それらは高度なユーザーのみが必要とします。 しかし、編集のためにドキュメントのテキストを取得する必要がある場合があるこれらの上級ユーザーは、ほんの一部です。 これは最も成熟した製品の運命です:それらは長年にわたって成長し、逃げることができなくなり、あまり使用されない可能性のある機能で満たされていますが、それらを必要とする専用ユーザーがいます。これらの機能をサポートする必要があります。



Macバージョンでは、複雑な機能のジャングルに深く入り込むことなく、問題を新鮮な外観で見て、ほとんどのユーザーが必要とする機能に集中する機会がありました。 その結果、最小限の便利で直感的にシンプルなコントロールを備えた軽量の製品が完成しました。 それは非常にMakovskyに見え、Windowsプラットフォームの彼の兄弟に少し似ています。



最初のアイデアは次のとおりでした。 それ自体、最新のドキュメントのOCRの品質は、元の画像が実際に悪いものでない限り、テキストストリーム自体の認識エラーが非常にまれであるほどです。 ただし、複雑なレイアウトでは、あらゆる種類のトリッキーなテーブル、複雑な輪郭の画像の場合、出力で修正が困難な欠陥につながるドキュメント分析エラーが発生します。 したがって、まず、ユーザーは、画像に問題がある場合は画像自体を改善するツールと、ページ上の情報の場所の分析結果を修正するツールが必要です。







FineReaderで主に追加されたのは、これら2つのコンポーネントです。 さて、ドキュメントを操作するための便利なツールがあります:ページの削除と追加、ページの再配置など。



その結果、複雑なドキュメント内でテキストがどのように配置されているかをシステムが推測しなくても、わずかな労力で高品質の結果を得ることができます。



ただし、私はまだ新製品の1つの重要な機能を欠いています。 そして、私だけでなく、ユーザーレビューで判断します。 製品内で受信したテキストを操作する十分な能力がありません。 確かに、この機能をどのように実装するかという問題では、意見が分かれていました。 FineReaderのWindowsバージョンで行われているように、組み込みエディターを使用して、従来の実装があります。 このアプローチは太古から存在していました。 私はこの考えがあまり好きではないので、その理由を説明しようとします。



事実、組み込みのエディターは、どんなに完璧であっても、テキスト表示の完全性に関して同じMicrosoft WordやLibreOfficeと競合することはできません。 そしてこれは、テキストに多少複雑な編集を加えることで、最終的にテキストを壊すリスクを冒すことを意味します。外部エディターにロードされると、テキストが浮いてしまい、元のエディターとはまったく異なり、フォーマットを復元するためにかなりの努力が必要になる場合があります。 そして、一般的に言って、FineReader自体でこのような複雑な編集を行う必要があるのはなぜですか? OCR製品内のテキストを編集する唯一の理由は、特定の単語をソーステキストの画像とすばやく比較して、エラーがないことを確認できるためです。 複雑なフォーマットの変更は、最終ドキュメントを準備する場所で行うのが最適です。



したがって、私の観点からは、FineReader for Macに本格的なエディターは必要ありません。 必要なのは、元の画像でチェックされている単語の近隣の画像とともに、ユーザーの疑わしい単語や非辞書の単語を表示する便利なスペラーです。 しかし、これは私の見解です。 普及している場合、そのような機能はMac用FineReaderに比較的迅速に表示される可能性があります。



コメントであなたの意見を聞きたいです。



アラム・パフチャニャン、

データ入力製品部門のディレクター



All Articles