テキストを理解するコンピューターについて

思慮深く天井を見つめている少女翻訳者は、「コンピューターは人間のようなテキストを理解できるでしょうか?」と尋ねました。それから私はこの質問に答えることができませんでしたが、今、テキストの記号論の分野でいくつかの知識を持っている、私は人間と同じように、コンピューターもテキストを理解できないと確信しています。



この記事では、人にとってはまったく困難ではないが、コンピューターにとっては実際には解決できない困難のいくつかの例を検討します。



(コンピューターとは、抽象的な人工知能ではなく、特定のコンピューティングプロセスを実行するコンピューティングデバイスを意味します。これは重要です。)







最初に、テキストの意味を理解しましょう。 かつて、多くの人が信じているように、テキストには固有の意味しかありません。 これは明らかなようですが、そうではありません。 センスとは、メッセージが適用されたときにインタープリターの内部状態が変化することです。 したがって、意味はメッセージだけでなく、インタプリタとメッセージの機能です。 インタープリターまたはその初期状態を変更すると、意味も変わります。 [1]



「まず、ニコライがソーニャからの手紙を印刷した」というフレーズを考えてみてください。 この場合、「印刷」という言葉を理解するにはどうすればよいですか? これが小説「戦争と平和」からの抜粋であることを知っているなら、意味は「発見」、「封印の除去」であるはずですが、なぜですか? アクションはXIX世紀に行われ、その後プリンタはなく、封筒で手紙が送信されたため、封筒を開けるには封印を取り除く必要がありました。 しかし、同じ言葉、同じフレーズ、最新のテキストでは、「印刷して送信」という意味を持つことができます。 したがって、テキストの起源を知っており、技術の歴史についてある程度の知識を持っている通訳者は、このテキストのすべてを持っている人とは異なる方法でこのテキストを理解します。



(面白いことに、上記のフレーズのGoogle翻訳者は「正しく」という単語を翻訳しますが、これは「文字」という単語と組み合わせて「印刷」という単語が常に「オープン」に翻訳されるためです。したがって、「彼は手紙を印刷し、プリンターが壊れた」というフレーズがGoogleは間違って翻訳します。)



芸術的なテキストについて話している場合、ほとんどの場合、著者は読者の特定の知識セット-文化的コンテキスト-に依存していますが、現代のポストモダンのテキストは、異なるが、同じように正しい、異なる文化的コンテキストの持ち主による理解のために非常にうまく設計できます。 [1]



人が文化的背景(または知識ベース)に目を向けるのはごく自然なことなので、彼はこれに気付かないことがよくあります。 しかし、誰にとっても明らかなことを証明するために複雑な論理構造が必要であることは驚くべきことであり、コンピューターはこれらの論理構造を正確に処理する必要があります。 コンピューターの速度と理解は、これらの構造の数と複雑さに依存します。 もちろん、軽量の言語を思い付くことができます。そのためには、テキストで使用されている単語の知識以上の理解は必要ありません。 ただし、そのような言語には自然言語の多くの特性がありません。 そのような言語は通訳者に何を要求するべきではありませんか?



デフォルトについて



かつて、ある日本人の代表団がアメリカに飛びました。 代表団の代表は、朝の7時にホテルにバスを送るように依頼する手紙を受け取り側に送りました。 翌日、午前7時にホテルにバスがありましたが、運転手はいませんでした。 この場合、日本人はアメリカ人がデフォルトを理解することを期待していました。 実際、バスを送信する要求には、状況に応じてデフォルトがある場合とない場合があり、通訳者は知識ベースを使用して状況を分析するときにこれを考慮する必要があります。



メタファーを理解する



メタファーは、プロパティの類似性に従って選択された別のオブジェクトの名前によるオブジェクトの指定です。 したがって、インタプリタは両方のオブジェクトのプロパティを知っている必要があるだけでなく、一般的なオブジェクトとそれらを区別できる必要があり、さらに大きな知識、つまりプロパティのプロパティの知識が必要です。



ユーモアの理解



ユーモアは複雑なものなので、チューリングテストで使用すると、すべての人が合格するとは限りません。 ばかげたことには厳しい基準がありますが、多くの場合、これらの基準によって声明をテストするには、文化的な文脈を使用した自明でない結論が必要です。 したがって、誰もがユーモアを理解しているわけではありません。



「行間」を読む



多くの場合、テキスト、特にアートのテキストには、一見すると思われる以上の情報が含まれています。たとえば、この記事の最初の文を取り上げてください。 しかし、そのような隠された意味を認識するためには、ユーモア、隠meta、デフォルトの理解が必要です。



これらすべての性質を自然に持っている言語を考えることは可能ですか? ほとんどない。 むしろ、通常のプログラミング言語、つまりPrologのように見え、AIを作成する目的ではない他のプログラミング言語を学習するよりも学習するのに手間がかかりません。



AIがテキストを理解していると言えば、テキスト分析の問題をAIが解決することを期待する必要があります。 たとえば、次のような







AIはこれらの問題を解決できる必要があるだけでなく、人間よりも迅速または迅速に解決する必要があります。 さらに、AIトレーニングには、人間の学習と同じかそれよりも短い時間が必要です。 そうでなければ、AIの使用は不適切です。



セマンティックネットワークまたは一連の述語の形で人間の通訳者のすべての知識を単に提示することがなぜ不可能なのですか? 理論的には可能ですが、この知識ベースの量は膨大です。 各フレーズの各単語は定義を生成します。これは、単語からのフレーズでもあり、それぞれが定義も生成します。 そして、定義がそれ自体で閉じられるまで。 そして、これは、名詞動詞、動詞副詞、イディオムなどの組み合わせを考慮せずに、それぞれが独自の定義を持つことができます。 したがって、知識ベースの量は、通訳者の語彙に関して指数関数的に増加します。 このようなボリュームでは、コンピューターを基本粒子のスケールの要素ベースに転送しても(可能な場合)、十分なメモリとパフォーマンスが得られません。 実際、これは今日のテキストの分析に反しています。



確かに、人間の脳は既知の方法を使用して知識を表現しません。 さらに、脳は根本的にアルゴリズム的に機能しないため、計算プロセスではモデル化できないと考える多くの理由があります[2]。 英国の著名な数学者ロジャー・ペンローズは、脳の働きは量子効果なしでは完全ではないと考えています。 いずれにせよ、脳がどのように機能するかは誰も知らず、この分野ではまだ多くの発見が可能です。 現代の意味でのコンピューターに関しては、テキストを決して理解しないと言っても安全です。



  1. 読者の役割。 / W.エコ。
  2. 王の新しい心。 / R.ペンローズ。



All Articles