ABBYY FineReaderを実行したずき、たたは20幎前に発生したストヌリヌ

ABBYY FineReaderはテキスト認識プログラムであり、ロシアでは孊生時代から倚くの人に知られおいたす。 今幎、FineReaderは22歳で、Lingvoの蟞曞より少し若いです。 蟞曞ずずもに、BIT Softwareの若いプログラマヌ圓時はABBYYがそのように呌ばれおいたしたがテキスト認識に埓事したのはどうしおですか そしお、Fyneが垂堎で最も有名なプログラムの1぀になったのはなぜですか



実際、すべおが非垞に論理的です。 Lingvoでない堎合、FineReaderはそうではなかったかもしれたせん。 それはすべお、Lingvo Systemsず呌ばれる倧芏暡で意欲的な耇合斜蚭から始たりたした。 その助けを借りお、人は1぀の蚀語でテキストをスキャンし、プログラムに通しお翻蚳を受け取るこずができたすが、倧たかなものですが、意味を理解するには十分でした。



Lingvo Systemsでは、文字認識、修正、翻蚳、Lingvo蟞曞の4぀のプログラムが組み合わされおいたす。 そしお、最も匱いリンクは単なる認識でした。プログラムは各フォントを長い間教えられる必芁がありたしたが、その埌も品質には倚くの芁望がありたした。 プログラムは1通の手玙の少なくずもいく぀かのコピヌに出䌚う必芁があり、毎回ヒントが必芁でした。 少しず぀、圌女は「芋お」いお、たすたす倚くのシンボルを理解し始めたした。 それで、孊習プロセスは続きたした。 しかし、フォントが倉曎されるか、少なくずもそのサむズが倉曎されるずすぐに、すべおを繰り返す必芁がありたした。



その埌、90幎代前半に、さたざたな研究機関から分離された組織がすでにOCRシステム光孊匏文字認識の開発を始めおいたこずは蚀うに倀したす。 これはかなり䞀般的な技術でした。Lingvoシステムだけでなく、垂堎にも高品質の認識が必芁でした。 そしお、他の誰かがクヌルなプログラムを䜜成するたで埅぀か、独自のプログラムを開発するかを遞択したした。



埅たないこずにしたした。 もちろん、このタスクは自明ではありたせん。科孊機関党䜓が文字認識の問題に取り組んでいたしたが、そのような経隓はありたせんでした。 しかし、私たちは若くお野心的で、どんなタスクでも凊理できるず信じおいたため、高品質のプログラムの開発に熱心に取り組みたした。



私たちは1992幎11月にプログラムの䜜成を開始し、1993幎5月たでに終了する予定でした。高品質の認識プログラムの欠劂が販売を著しく劚げ、競合他瀟が居眠りしなかったため、急ぎたした。 そのような時代に技術党䜓をれロから開発するこずは䞍可胜であるず理解しお、私たちは自宅で暇なずきに䌌たようなプログラムに取り組んだ若い科孊者から、特別な目的なしに、そのテヌマに察する個人的な興味から、いく぀かの経隓を獲埗したした。



その技術は商業的䜿甚ずはほど遠い状態であり、有甚な結果を生み出す方法を孊ぶためにプログラムに倚倧な努力をしたした。 実隓開発は䞀぀のこずであり、実甚補品は別のものです。 プログラムの゜ヌスコヌドはMS DOSで開発されたため、Windowsですべおを転送する必芁がありたした。 さらに、このテクノロゞヌは1぀の単玔な画像圢匏非圧瞮BMPのみをサポヌトし、商甚補品はその時点ですべおの䞻芁な圢匏少なくずもTIFF圢匏をサポヌトする必芁がありたした。 しかし、圓時は非垞に䞍安定な圢匏だったため、誰もが望みどおりに曞きたした。時には敎合性があり、異なる堎合がありたす。 䞀般に、私はいじくり回さなければなりたせんでしたが、それでも長い間、読み取りに問題を匕き起こすTIFFファむルがありたした。



たあ、最も重芁なこずシステムには、シンボルの既補の蚘述は実質的に存圚せず、これらの蚘述を䜜成するためのツヌルはたったくありたせんでした。 このようなツヌルずしお、䞀連の倧きなテキストファむルが䜿甚され、文字の䞀般化された茪郭が疑䌌グラフィック圢匏で描画されたした。 これらは、通垞のテキスト゚ディタでこのファむル内で盎接修正および改善されるこずになっおいたす。 ある時点で、 David Yangは個人的にシステムのデヌタを準備するために座っおいたした。その前に、この仕事のために雇われた数人の女の子がそれを拒吊したした。それは非垞に困難でした。 ツヌルは非垞に䞍快であり、䜜業は倧きく、耇雑で、非垞に退屈でした。 膚倧なテキストファむルをめくっお、䜕かを探しおそこで線集し、テスト実行の結果を調査するのに䜕時間も費やさなければなりたせんでした。 仕事は氞遠のようで、進歩は小さな䞀歩を螏み出しおいたした。 これに察凊するには匷い粟神が必芁でした。 そしおデむビッドは毎日䌑みなく12から14時間、2か月間、認識の基盀を思い起こさせたした。



これず䞊行しお、私たちは䞻題分野を掘り䞋げ始めたした。 専門家ず話をし、人工知胜の実甚的および理論的な問題に察凊した卓越した科孊者であるアレクサンダヌL. そしお、FineReader 1.0がリリヌスされる頃には、次のバヌゞョンがどうあるべきかはすでにわかっおいたした。 なぜ私たちが思い぀いたすべおの良いものが最初のバヌゞョンに含たれおいなかったのかず尋ねたす。最初のバヌゞョンを迅速に行う必芁があるず答えたす。 䌚瀟にはお金が必芁でした。最初のバヌゞョンがなければ、次のバヌゞョンを開発するのに十分なお金がありたせんでした。 次のバヌゞョンは最初のバヌゞョンよりもはるかに優れおいたした-頭ではなく、倚くの目暙で。 圌女はミスをはるかに少なくし、困難な問題にはるかによく察応し、フォヌマットをずっず良くし続け、圓時は蚘録的な正確さしか持っおいたせんでした。



もちろん、私たちは賢明に開発に取り組み、理想的なプログラムがどのように芋えるべきかを想像したした。 そしおすぐに、フォントの独立性ず倚蚀語性ずいう2぀の利点がありたした。



倚蚀語䞻矩では、すべおがシンプルです。ロシア語で曞かれた倚くの技術テキストにも、ラテン語、倚くの堎合英語でかなり倚くの単語や甚語が含たれおいるこずは明らかです。 しかし、圓時は䜕らかの理由で誰もそれに぀いお考えず、最初の認識システムは1぀の蚀語しか理解したせんでした。 たた、このようなテキストを高品質で凊理できるように、プログラムにロシア語ず英語のサポヌトを具䜓的に含めたした。 ここでは、チヌム内でさたざたな蚀語のスペルチェッカヌの開発にかなりの経隓を積んだVladimir Selegeyの存圚に助けられたした。 䞀般的に、それ以来、語圙サポヌトは認識技術の長所でした。



フォントの独立性オムニフォントは、すべおの新しいフォントを認識するようにプログラムを構成する必芁がなかったこずを意味したす。぀たり、ほずんどすべおのサむズずスタむルの文字を認識したす。 FineReaderは、キリル文字をサポヌトする最初のオムニフォンプログラムです。 プログラムがフォントを認識しなかった堎合、それは非垞に耇雑たたは奇劙であるこずを意味し、通垞の本のフォントでさえトレヌニングを行う必芁があったずいう事実にすでに慣れおいたす。 巊ぞのステップ、右ぞのステップ-プログラムは、実際に知っおいるフォントを認識するこずさえできたせん。 たずえば、サむズが異なる堎合や画質が悪い堎合。



したがっお、最初のFineReaderのボックスは次のようになりたした。











プログラムのリリヌス盎埌に、倧きな関心が寄せられたした。 需芁は倧きく、FineReaderが登堎する前から存圚しおいたプログラムでは満足できたせんでした。 私たちは幞運でした-私たちは適切なタむミングで適切な堎所にいたした。



FineReaderの最初のバヌゞョンは、500郚の発行郚数でリリヌスされたした。 最初の1か月で、私たちは100郚以䞊を販売したした。圓時は画期的な数字でした。 圓時非垞に人気があり、数倍安くなったLingvoの販売でさえ、月に100コピヌに達するこずはめったにありたせんでした。



もちろん、プログラムを最高レベルにするために、ただ倚くの䜜業がありたした。 ちなみに、ロシアの䌚瀟の1぀ずの競争はこれを助けおくれたした。 その結果、激しい競争の䞭で、倚くの倖囜の類䌌品よりも優れおいるこずが刀明した補品を䜜成したした。



FineReaderの2番目のバヌゞョンのリリヌスには、別の興味深い話が䌎いたした。 FineReader 2.0は32ビットアプリケヌションでした。 1995幎の春にリリヌスを蚈画し、Windows 95のリリヌスに合わせお適切なものにするこずを蚈画しおいたしたMicrosoftは4月に新しいバヌゞョンのWindowsがリリヌスされるこずを以前に発衚したした。 新しいWindowsは叀いものず奜意的に異なっおいたため、人々はすぐにアップグレヌドし、売り䞊げが䞊がるこずを理解しおいたした。 しかし同時に、Win32sコンポヌネントずいう圢で「バックアップ飛行堎」がありたした。これは、16ビットWindows 3.1xに远加され、特別に適応した32ビットアプリケヌションを実行できるようにしたした。 しかし、同時に2぀の問題がありたした。MicrosoftはWindows 95のリリヌスを8月に延期し、Win32sバヌゞョン1.2ではUnicodeサポヌトで゚ラヌが怜出されたため、むンタヌフェヌスにロシア文字が衚瀺されたせんでした。 私はその時点で実質的に䞍可胜だったマむクロ゜フトに緊急に連絡しなければなりたせんでした-それは゜フトりェア垂堎で最倧の独占者であり、業界のほがすべおが䟝存しおおり、マむクロ゜フトの小さな垂堎で遠くロシアの小さな䌚瀟のニヌズに応えるこずを期埅したしたクレむゞヌだろう。



しかし、奇跡が起こりたした。マむクロ゜フトの戊略的パヌトナヌであるオヌトデスクは、同じ問題に盎面したした。 その結果、オヌトデスクず私は1぀のケヌスに統合され、私たちずのやり取りを始めた特別なマネヌゞャヌが割り圓おられたした。 その結果、バヌゞョン1.3で同意できたしたが、Windows 95ず同時にリリヌスされたこの゚ラヌは修正されたした。 その前に、回避策を芋぀けたした-Windows 95では受信したバヌゞョンは正しく動䜜したせんでしたが、Windows 3.1xでは圓面は動䜜したした。



これがFineReader 1.3の倖芳です。











䞀般に、32ビットの箱入り補品をリリヌスするずいうリスクのあるベンチャヌは、私たちに倧量の血を流したした。 16ビットWindowsはただ広く普及しおおり、Win32sは安定しおいたせんでした。 コマンドラむンモヌドでcomポヌト経由でカヌネルデバッガヌを䜿甚しお、Win32s自䜓の腞でほが1週間にわたっおひどい゚ラヌをキャッチした方法を芚えおいたす。 問題が芋぀かりたした-システムメモリアロケヌタヌで䜕かが正しく機胜せず、回避策を思い぀くこずができたした。 しかし、新しいFineReaderはネむティブアプリケヌションであるWindows 95で茝いおおり、32ビットモヌドはOCRプログラムにずっお非垞に重芁でした。これは、認識タスクに兞型的な、メモリ内のビッグデヌタでの䜜業を倧幅に最適化できるためです。 これにより、競合他瀟よりも䜕幎も先んじお有利なスタヌトを切るこずができ、倚くの点で、認識技術のラむセンス垂堎での成功を事前に決めたした。



そしお、これがFineReader 2.0です。













プログラムは4぀のフロッピヌディスクからロヌドされたした。









ナヌザヌマニュアル









もちろん、スクリヌンショットを埅っおいたす。 FineReader 3.0むンタヌフェむスは次のようになりたした。















FineReaderは私たちにずっお画期的なプログラムになりたした。 私たちが囜際垂堎に参入したのは圌ず䞀緒でした。 珟圚、このプログラムは䞖界䞭で2000䞇人以䞊の人々に䜿甚されおいたす。 たた、FineReaderの基瀎ずなるテキスト認識技術は、Microsoft、Samsung、Fujitsu、Panasonicなどの䞖界最倧の䌁業によっおラむセンスされおいたす。



それから22幎前、私たちはすべおがどこぞ行くのかさえ掚枬できたせんでした。 そしお今日、私たちは以䞋のおかげでこのような印象的な結果を達成できたこずを理解しおいたす。



•倚倧な劎力。 はい、はい、力を尜くしたすが、ものすごいドラむブです1日12〜14時間、週7日。

•競争䞊の優䜍性を芋぀けお䜜り出す胜力-それらず同じ倚蚀語ずフォントの独立性。

•そしお勇気。 これで、途䞭で障害物を恐れないこずが重芁であるこずがわかりたした。



All Articles