ウクライナ人が効果的なジェスチャー翻訳者を獲得できないのはなぜですか?

耳の不自由な人や愚かな人のための発明に関する興味深い出版物( 「ウクライナの学生が手話をスピーチに翻訳する手袋を作成した」を参照)の後、私は心からうれしく思った著者に対して、そのような革新の実際的な利点についてのコメントに疑問を表明しました。今日では、手話を理解するのに本当に役立つような効果的なツールになることはまずありません。



しかし、高品質の自然言語機械翻訳機の作成を妨げるのとまったく同じ理由でうまくいきません。 そして、この理由は、コンピューターが言語メッセージの意味を理解するように訓練されていないという事実に正確にあります。それは、少なくとも言葉の形で、少なくとも表象的な(テキストの)形で、あるいはジェスチャーの形でさえ提示されます。



機械は、例えば、言語学の分野のいくつかのルールなど、アルゴリズム的なものしか知覚できません。 しかし、彼らの助けを借りて、セマンティックスペースを閉じることは不可能です。セマンティックスペースは、言語的であるため、言語規則の枠組みの中で正式化されていません。



手話を含む言語メッセージから受信者(見る、聞く、読む...)の音声、テキスト、ジェスチャーへの意味を理解(抽出)するためには、特定の数の行動モデルの特定のベース(記憶)が必要です画像(MPO)。これは、著者がこの言語メッセージ(音声、テキスト、ジェスチャーなど)に定めた意図を認識するのに十分なはずです。 したがって、これらのMPOは人々の知識ベース(BZ)を構成します。 同時に、異なる言語グループのMPO(英語版の画像の動作=> MIB)の品質と量は大きく異なるため、異なる言語文化の人々はお互いを理解していません。



手話も例外ではありません。 普通の人が耳の聞こえない人や口のきけない人のコミュニケーションを見ていると、まったく同じ理由で理解できません。手話での会話の参加者が持っているIGOの記憶がないためです。



そして、これらのIGOはどのようにして生まれたのでしょうか? はい、学習プロセスで。 たとえば、子供の頃、私たちの母親を見せて「母」と発音します。 Image [mother]とその言語的対応を覚えています。 その後、彼らは私たちに歩いているおじさんを見せて、「おじさんが来ている」と言い、私たちはこの行動モデルを仮想記憶に覚えています。 これが私たちの心の中でMPOが形成される方法です。 したがって、任意の言語のメッセージを理解するには、それらのメッセージ(MPOがこれらのメッセージで形成されるグラフィック、サウンド、触覚、またはジェスチャー)を介して理解する必要があります。 IGOがなければ、理解も、感覚の抽出もありません。 そして、適合性がなければ、それ以上に、理解することはできません。



ここで、「言語メッセージから意味を抽出できるようにするためにマシンは何を必要としますか?」という質問に戸惑うかもしれません。答えは非常に簡単です-あなたは人とまったく同じものが必要です-ナレッジベース。



そして、BZを使用すると思われるさまざまなプログラムについて常に読んでおり、そこから何かの感覚と知識を抽出することさえあるため、現代のコンピューターには知識ベースがありませんか? いいえ、残念ながら、「知識ベース」が意味するものは、実際にはそうではありません。 これらはすべて同じ2次元の表形式のデータベースです。 そこの知識は匂いがしませんでした。



それでは、そのようなナレッジベースを作成するために何が必要か、またはこれらのナレッジベースが満たすべき基準条件は何ですか? ここでの答えは次のようになります。



まず、Model of the Universe(MM)が必要です。これがないと、言語メッセージから意味を抽出できません。



第二に、MPOの形式を決定する必要があります-動的でなければなりません。 たとえば、IGOはここで説明されているように表示されます



第三に、マシンは言語メッセージからIGOを認識しなければなりません。 そのためには、ジェスチャ(テキスト、音声など)のヒューリスティックセマンティック処理の技術が必要です。



リストされているものから、今日は3番目のポジションしかありませんが、それでも開発中です。



第1条件と第2条件については、それらへのアプローチが新たに生まれたばかりです。



しかし、今、これらの3つの条件が複合体で満たされると、素晴らしいウクライナの発明に再び戻ることができます。



All Articles