OCR CuneiFormは、装飾および手書きのものを除く、すべてのスタイルの印刷、タイプライターの書体、およびプリンターから受け取ったフォントを認識できます。 このシステムには、ドットマトリックスプリンターからのテキスト、ファックスの貧しいコピー、およびタイプライティングを認識するための特別なアルゴリズムが組み込まれています。
OCR CuneiFormは次のとおりです。
- 高品質の認識;
- 作業の高速化;
- ロシア語、英語、ロシア語と英語の混合、ウクライナ語、ドイツ語、フランス語、スペイン語、イタリア語、スウェーデン語などのテキストの認識(合計20以上);
- 自動断片化モードで動作して、テキストブロック、表、画像、および手動および半自動の断片化のための強力なツールを検索します。
- グリッド線を表示しないことを含む、あらゆる構造と複雑さのテーブルの認識。
- 結果のドキュメントのイラスト(白黒とカラー)および表の自動保存。
- ページトポロジの完全保存。
- バッチスキャンおよび認識のサポート。
- 使いやすさと直感的なインターフェース、プログラムで動作する組み込みヘルパー。
- 認識されたテキストを操作するための組み込みのテキストエディター。
- 画像と認識結果の組み合わせ表示。
このシステムは、適応認識、ニューラルネットワーク、認識代替の認知分析などを含む、多くのユニークなテクノロジーを使用しています。
しかし、私たちにとって、それは
はい、これはオープンソースです。 プログラムのウェブサイトでフォーラムが開始され、オープンソースプロジェクトの作業を調整しています。
現時点では、プログラムには2つの欠点があります。
- マイクロウィンドウ(これまではウィンドウのみ。ただし、つるの下で試したことはありません)
- 眺めの下で行かなかった
プログラムのウェブサイト: http : //www.cuneiform.ru/ 。
UPD:
ALT Linux 4.0 Desktopのボックスからwineの下で獲得し、すべて(タブレットとテキスト)を認識し、rtfに保存しました。 Openoffice.orgにコピーできます
発見者ありがとうございます。