マインドアルゴリズム、または新機能





「科学はしばしばテクノロジーに追随します。なぜなら、発見は世界を理解する新しい方法と、説明を必要とする新しい現象をもたらすからです。」



マサチューセッツ工科大学の物理学教授であるアラム・ハローは、「 なぜ今が量子コンピューティングを勉強するのにふさわしいのか 」という記事で述べています。



彼は、エントロピーの科学的概念は、蒸気エンジン技術の熱力学がそれを必要とするまで完全に理解されないと信じています。 同様に、量子コンピューティングは、従来のコンピューターで量子力学をシミュレートする試みから生まれました。



では、これはすべて機械学習と何の関係があるのでしょうか?



蒸気エンジンのように、機械学習は特定のクラスの問題を解決するために設計された技術です。 それにもかかわらず、この分野で得られた結果は、人間の脳がどのように機能し、周囲の世界をどのように認識し、学習するかについて、興味深い-おそらく基本的な-科学的な仮定を与えてくれます。 機械学習テクノロジーは、人間の思考の科学と想像力について考える新しい方法を提供します。



機械認識ではなく、コンピューターイメージング





5年前、現在トロント大学での仕事とGoogleでの仕事を兼ね備えているディープラーニングのパイオニアであるジェフヒントンは、次のビデオを公開しました。







ヒントンは、ビットマップから手書きの数字を認識するために5層のニューラルネットワークを訓練しました。 手書きを機械読み取りに適したものにしたのは、オブジェクトの機械認識の形式でした。



しかし、同じ分野での以前の研究(主な目標は単に数字を認識することでした)とは異なり、ヒントンニューラルネットワークは逆の順序でプロセスを実行することもできます。 つまり、シンボルの概念に基づいて、彼女はこの概念に対応するイメージを再作成できます。







文字通りの意味での機械が「8」の概念を持つイメージをどのように想像するかがわかります。



マジックは、入力と出力の間のレイヤーにエンコードされます。 これらの層は、単一​​のニューラルネットワーク内で両方向(画像から概念へ、およびその逆)で比較を実行する一種の連想メモリです。



人間の想像力はそのように機能しますか?



しかし、人間の脳のモデルに基づいて作成された単純化された技術の背後には、より広い科学的疑問があります。人間の想像力は機能します(視覚画像の作成、視覚化)。 もしそうなら、これは重要な発見です。



結局のところ、これは私たちの脳が完全に自然な方法で行っていることではありませんか? 4という数字を見たとき、「4」の概念について考えます。 逆もまた同様です。誰かが「8」と言うと、私たちの想像の中で8番のイメージを想像できます。



このすべてが、レイヤーに埋め込まれた情報を介して、心が概念からイメージ(または音、匂い、感情など)に移行する一種の「逆プロセス」ではありませんか? このネットワークが新しいイメージを作成した方法を目撃したことはありませんでした。おそらく、改善されたバージョンでは新しい内部接続を作成できたのでしょうか。



コンセプトと熟考



視覚認識と想像力が本当に画像と概念の間の相互関係にすぎない場合、これらの層間で何が起こるのでしょうか? ディープニューラルネットワークは、熟考または同様のプロセスを通じて知覚を実現できますか?



過去を振り返ってみましょう。234年前、イマヌエル・カントの哲学的作品である「純粋な理性の批評」が出版されました。彼は、熟考は現象の表現に過ぎないと主張しています。







カントは、人間の知識はもっぱら経験的かつ合理的な思考の結果であり得るという考えに反対しました。 彼は熟考による認識を考慮に入れなければならないと主張しました。 「熟考」の定義により、彼は感覚的知覚を通じて得られた表現を理解します。そこでは、経験的オブジェクトまたは感覚の記述は「概念」として機能します。 一緒になって、人間の知識を形成します。



2世紀後、カリフォルニア大学バークレー校のコンピューターサイエンス学部のAlyosha Efros教授は、視覚的理解に特化して、次のように述べています。 「。 Efrosによると、モデルを教えるために単語を使用すると、テクノロジに言語の制限が課せられます。 名前のない熟考された現象は、言葉以上のものです。



ここでは、機械学習におけるマークと人間の概念の間、および機械学習におけるコーディングと人間の熟考の間の興味深い対応を観察します。







ディープネットワークの学習では、Googleとスタンフォード大学のQuoc Leが率いる猫認識調査で示されているように、連続した層の活性化は、概念の低い概念レベルから高いレベルにまで及ぶことがわかります。 画像認識ネットワークは、最下層のビットマップをエンコードし、次に可視角度とエッジが次のレイヤーにエンコードされ、単純な形状が次のレイヤーにエンコードされます。 これらの中間層は、高レベルの概念(「猫」や「犬」など)に対応するアクティベーションを持つ必要はありませんが、入力感覚情報の分散表現をエンコードします。 最後の出力レイヤーのみが、ユーザーが指定したラベルに対応します。これは、これらのラベルに対応しなければならないという制限が適用されるためです。



これは熟考ではありませんか?



その結果、上記で説明したコーディングとラベルは、「熟考」および「概念」と呼ばれるカントと同じように見えます。

これは、機械学習技術が人間の思考の原則を理解するのにどのように役立つかの別の例です。 上記のネットワーク図は、それが熟考の大幅に単純化されたアーキテクチャではないかと思います。



Sepir-Whorfコンセプトをめぐる論争



エフロスは次のように述べています。もし世界にそれらを説明する言葉よりもはるかに多くの現象があるなら、私たちの考えは言葉に限定されますか? この質問は、言語が私たちの認識の境界を完全に定義するかどうか、または話す言語に関係なく自然に何らかの現象を理解できるかどうかについてのセピル・ワーフ言語相対性仮説と論争の中心にあります。



その強い形で、この仮説は、言語の構造と語彙が世界の認識と理解に影響を与えると主張しています。



ここに表示されているカラーテキストのおかげで、最も印象的な結果が得られます。 最も印象的な結果は、色分類テストによって得られます。 他のすべてとは異なる色合いの広場、ナミビア北部のヒンバ民族グループの代表者、これらの2つの色合いの明確な名前を持つ言語を見つけるように求めると、彼らはすぐにそれを見つけます。







同時に、私たち全員がこれに苦労しています。



理論では、異なる色合いを説明する言葉があれば、私たちの脳自体がそれらを区別することを学ぶので、時間の経過とともに、これらの違いはより「明白」になります。 私たちの目ではなく、脳の助けを借りた視覚で、言語が私たちの知覚を決定します。



目ではなく、脳の助けを借りて見る。



機械学習では、同様のことが観察されます。 教師と一緒に教える場合、対応するラベルまたは画像のカテゴリ(またはテキスト、音声などのその他の要素)をできる限り正確に決定するようにモデルをトレーニングします。 定義により、これらのモデルは、ラベルが提供されていない他のカテゴリよりもラベルのあるカテゴリをより効果的に区別するようにトレーニングされます。 機械制御学習の観点から見ると、この効果は驚くべきことではありません。 したがって、おそらく、上記で検討したテストの結果に驚くことはないはずです。 言語は、機械制御学習のラベルがカテゴリを区別するモデルの能力に影響を与えるのと同じように、世界の認識に実際に影響します。



しかし、同時に、ラベルはカテゴリを区別するための前提条件ではないことを知っています。 Googleの「猫認識」プロジェクトでは、ニューラルネットワークはラベルのアルゴリズムを学習することなく、最終的に完全に独立して「猫」、「犬」などの概念を検出します。 適切な制御なしでこのようなトレーニングを行った後、ネットワークが特定のカテゴリ(「猫」など)から画像を受信すると、対応する同じニューロンセットがアクティブになります。 多数のトレーニング画像を確認した後、このネットワークは各カテゴリに特徴的な兆候と、異なるカテゴリ間の違いを発見しました。



同様に、紙コップを繰り返し見せられた幼児は、画像と名前を関連付けるために「紙コップ」という言葉を学習する前であっても、すぐにその視覚画像を認識することができます。 この意味で、セフィール・ワーフ仮説の強力な形式は完全に有効ではありません。なぜなら、言葉を使わずに概念を形成して、それを説明できるからです。



この論争の中で、制御下にある機械学習は、同じコインの両面であることが判明しました。 そして、それらをそのように認識すれば、Sapir-Whorfの概念は論争の対象ではなく、むしろ教師の有無による人間の学習の反映になります。



この類推は信じられないほど魅力的だと思います-そして、私たちはこの問題について何かを理解し始めました。 哲学者、心理学者、言語学者、神経生理学者はこのトピックを長年研究してきました。 膨大な量のテキスト、画像、または音声を処理する場合、最新のディープラーニングアーキテクチャは、画像分類、言語翻訳、音声認識において人間に匹敵するか、より良い結果を示します。



機械学習の分野での新しい発見はそれぞれ、人間の脳で起こっているプロセスについて何か新しいことを学ぶ機会を与えてくれます。 私たち自身の心といえば、機械学習を参照する理由が増えています。



PSどの広場が他の広場と違うかわかりますか? コメントにバージョンを記述します。「認識」の明確な画像と下の画像を使用して、平方数を決定します。







PPS異なるモニターが視覚的に異なる正方形を「指す」ことができるバージョンがあり、私(翻訳者)はそれに同意します。 最も興味をそそられる人のために、私は彼らの仮定をテストするための純粋に技術的な手段があることを思い出します。



All Articles