修道士には共通点、OCR、ヤギのチーズは何ですか?

「ABBYY FineReader」と答えれば、あなたは正しいでしょう。 しばらく前、聖グレゴリーパラマス修道院の修道院長であるグレゴリー神父は、修道院が直面している異常な問題の解決を支援するためにABBYYアメリカ事務所に頼りました。 修道院には、デジタル化が必要な政治弁証法システムを備えたギリシャの古い文書のアーカイブがあります。 このことを知ると、アメリカの同僚は修道院長にABBYY FineReader 10 Professional Editionの箱をプレゼントしました。 これはどのようなシステムであり、なぜグリゴリー神父はFineReaderを必要としていたのですか?



ギリシャ語は世界で最も古い記述言語の1つであり、豊かな歴史があります(詳細は少なくともWikipediaで読むことができます)。 1982年まで、ギリシャ語で書かれたポリトニックシステムが採用されました。アクセントと下付き文字(発音区別記号と呼ばれる)は、アクセントと願望を示すために使用されました。 次のようになります。







現代のギリシャ語の口頭では、願望はなく、ストレスの種類は区別されていません。1982年以来、1つのストレスマークを持つ単調なシステムも公式に書面で使用されています。



政治的なギリシャ語の文書を認識することは、原則として難しいことではありません。現代のほとんどのフォントには発音区別記号の付いた文字が含まれているからです。 グレゴリー神父にとっての主なことは、修道士ができるだけデジタル化の作業を簡素化できる便利なプログラムを見つけることでした。 ABBYY FineReader 10は、アクセント記号が1つ付いた現代の単調なギリシャ語をサポートします。 さらに、FineReaderでは、非標準のダイアクリティカルストレスを認識するために、ABBYY FineReader 10 Professional Editionのテンプレートエディターを使用できます。これは、プログラムに非標準の文字を認識するように指示します(この機能については、 ここで詳しく説明しました )。



ギリシャ語のポリトニックシステムでは、7つの発音区別アクセント。 それらのほとんどとそれらのさまざまな組み合わせは、ギリシャ語の母音で使用できます。 合計で、発音区別符号付きの文字の200以上の可能な組み合わせが取得されます。 個々のポリトニックストレスとその組み合わせを認識するために、FineReaderをトレーニングする必要がありました。 これでプログラムがトレーニングされ、修道士は仕事を始める準備ができました。



FineReader 10のおかげで、僧ksたちは修道院の主要な資産の1つである古代ギリシャ語のテキストを保存できるようになり、祈り、教え、仕事で通常の生活を続けることができることを願っています。 感謝の気持ちで、ABBYYの従業員は修道院の敷地で栽培され、修道士が注意深く集めた果物、最高のヤギのチーズ、これまで味わったスモークサーモンを受け取りました。



アリサ・ラフマノワ、

テキスト認識製品部



All Articles