理想的な孊生、たたは機械孊習で圌らが沈黙しおいるこず

以前のhabrahabr.ru/post/145309では 、ナニバヌサル人工知胜AIぞのアプロヌチを怜蚎したした。 しかし、ナニバヌサルAIずは䜕ですか ナニバヌサルず呌ばれる珟代の実甚的なAIシステムに正確に欠けおいるものは䜕ですか この問題のより具䜓的な説明に぀いおは、機械孊習をAIの必須コンポヌネントずしお䜿甚しお芋おみたしょう。



機械孊習は、孊術的な人工知胜の分野の境界をはるかに超えお成長し、「普通のプログラマヌ」になりたした。 適甚されるタスクの倚くは、デヌタマむニング、パタヌン認識、統蚈的掚論などの実甚的な方法を䜿甚したす。 倧䌁業は、自動デヌタ分析に関するさたざたなコヌスや孊校を線成し、基本的な郚門を䜜成し、䌚議の開催に参加し、機械孊習の分野で蓄積された知識の光を䞖界にもたらしたす。 科孊者もそれほど遅れをずっおいない圌らは新しい方法を思い぀き、今流行の転送トレヌニングのような新しいサブドメむンを考え出す。



しかし、この分野の広範な開発は、内陞郚の開発には特に貢献しおいたせん。 それどころか、機械孊習の基瀎の単玔化された解釈が広たっおいたすこれらの解釈はしばしばかなり耇雑な理論によっお裏付けられおいるずいう事実にもかかわらず、特定の実甚的な解決策を埗るこずができたす。 埌者はもちろん悪いこずではありたせんが、機械孊習の普遍的な方法の問題は未解決のたたですそしお無芖されたす。 同時に、䞀方では、実際にはそうではない機械孊習の普遍的な方法ニュヌラルネットワヌクなどに぀いおの神話が「応募者」の間で広たりたした。 䞀方、「理論家」の䞭には、機械孊習の普遍的な方法を䜜成する可胜性に察する信頌がありたせんでした。぀たり、新しい普遍的な方法を提案しようずする詊みは、「Yet Another Classifier」たたは「No Free Lunch」定理。



最も顕著なこずは、真に普遍的な機械孊習の理論が半䞖玀にわたっお存圚しおおり、この理論の文脈における珟代の研究者の議論の倚くが非垞に玠朎に芋えるこずです。 この理論は䜕ですか 機械孊習の問題をどのように解決したすか なぜこれほど倚くの配垃を受けおいないのですか そしお、普遍的な機械孊習システムを䜜るこずは可胜ですか これらの質問ぞの回答に近づきたすが、最初に匷力なAIの普遍的なトレヌニングの必芁性を瀺したす。



機械孊習の䞻な問題は、関数近䌌や倖挿などの「単玔な」問題の䟋で実蚌できたす。 最終的に、むンテリゞェント゚ヌゞェントは、センサヌ入力ずモヌタヌ出力の間の接続を確立するか、実行されたアクションに応じお環境から匷化の倧きさを掚定するこずを孊習する必芁があるため、このタスクずAIの接続は吊定できたせん。



図に瀺されおいるポむントのシヌケンスを芋おみたしょう。 1.続行方法 最初は、この問題を解決するには、利甚可胜なポむントに最も近い関数を遞択する必芁があり、この関数が最適な゜リュヌションになるこずは絶察に自然に思えたす。



画像

図 1.ポむントを継続するには



数孊には、圢匏が重芁な制限おそらく、連続性ず埮分可胜性を陀くの圱響を受けない任意の関数を、任意の粟床で特定のタむプの関数で近䌌できるさたざたな定理がありたす。 特に、たさにそのような定理のために、人工ニュヌラルネットワヌクANNは普遍的な近䌌法で定評がありたす。 このような評刀がANNによっお正確に開発されたのは面癜いこずです。たずえば、倚項匏ではなく、類䌌の定理がはるかに早く蚌明されたした。



しかし、これらの定理は機械孊習に関しお䜕を意味するのでしょうか 他の関数によるいく぀かの関数の近䌌が原則ずしお可胜であるずいう事実は、それが実際に実行できるこずを意味するものではありたせん。 実際、実際には垞に有限サむズのトレヌニングサンプルがあり、さらに、ノむズが倚い堎合がありたす。 そのような条件䞋で近䌌がどのように機胜するかを芋おみたしょう。 そのため、倚項匏の結果がより透過的に解釈されるため、倚項匏を䜿甚したす。



次数の異なる倚項匏のパラメヌタヌを遞択しお、これらの倚項匏がトレヌニングサンプルのポむントに最も近く通過するようにしたす。぀たり、最小二乗法を䜿甚したす。この堎合は非垞に単玔な実装です。 図 図2は、線圢関数、攟物線、および3次関数の解を瀺しおいたす。 最埌の赀ポむントはトレヌニングセットに含たれおおらず、真の䟝存関係に察応しおいたす。



画像

図 2. 1次、2次、および3次の倚項匏を構築した結果。



すべおが良いようです。倚項匏の次数を増やすこずで、トレヌニングサンプルのポむントからの偏差を枛らし、予枬の粟床を向䞊させるこずができたす。 しかし、孊䜍をさらに䞊げ続けるようにしおください。 図 図3は、4、7、10床の倚項匏の解を瀺しおいたす。



画像

図 3. 4、7、および10次の倚項匏を構築した結果。



ご芧のずおり、トレヌニングセットの粟床は向䞊し、10次の倚項匏はすべおのポむントを理想的に通過したすが、予枬の粟床は壊滅的に䜎䞋したす。 これは、過剰適合のよく知られた効果です。 䞀郚の人にずっお、この効果は完党に神秘的なように思えるかもしれたせん。「デヌタがない堎合を陀き、既存のサンプルの近䌌倀を改善しおいたす 本圓に悪化しおいるのはなぜですか」 そしお、誰かにずっおは「圓たり前のように思えたす。「モデルをデヌタのノむズに適合させようずした堎合、䜕を期埅したしたか」 ただし、この問題に察する態床に関係なく、どこにも消えるこずはありたせん。 ANNの堎合、それは自然に珟れたす。 機械孊習の分野におけるこの問題は遍圚しおいたす。近䌌ず倖挿だけでなく、パタヌン認識、セグメンテヌション、クラスタリングなどにも特城的です。 どうすれば察凊できたすか



ここでは異なるアプロヌチが可胜です。 ニュヌラルネットワヌクの䞀郚のクラスの堎合、ANNがデヌタにあたりにも倚くの時間を調敎するたでトレヌニングは特に䞭断されたす孊習を停止する最適な瞬間を決定する特別なヒュヌリスティック基準も開発されおいたす。 この点で、この珟象には2番目の名前がありたす-過剰孊習。 簡単に蚀えば、これは詰め蟌みであり、システムは特定の䟋に集䞭したす。 この欠点は、生埒の孊習の特性でもあり、同じテストに埓っおトレヌニングずその品質の評䟡が行われる堎合です。



この効果に察抗する別の簡単な方法は、亀差怜蚌、たたは亀差怜蚌を䜿甚するこずです。その考え方は、トレヌニングサンプルからコントロヌルを遞択するこずです。 さらに、トレヌニングはサンプルの䞀郚で実行され、トレヌニングの品質は別の郚分で評䟡されたす。 ぀たり、゜リュヌションをトレヌニングしたデヌタではなく、新しいデヌタでうたく機胜させたいので、そのように確認したしょう。 このアプロヌチには欠点がありたす。 たず、トレヌニングサンプルのサむズが小さくなり、したがっお、構築䞭のモデルの品質が䜎䞋したす。 第二に、このアプロヌチは匱くはありたすが、再トレヌニングする傟向がありたす察照サンプルに関しお間接的に過床に近い適合が発生したすトレヌニングに特別な利益を䞎えずに孊童がどのようにUSEでトレヌニングされたかを思い出すだけで十分です。 この効果を匱めるために、トレヌニングサンプルは倚くの郚分たずえば10に分割され、゜リュヌションの品質はそれらの異なる郚分で亀互にテストされたすが、蚈算時間が長くなり、最初の欠点が悪化したす。 そしお第䞉に、このアプロヌチは、教垫なしで孊習する堎合に適甚するのが容易ではありたせん。



いずれにせよ、トレヌニングの早期䞭断もクロスバリデヌションも再トレヌニングの性質に関する質問に答えず、奇劙に芋えたす長期間勉匷するこずや利甚可胜なすべおの情報を䜿甚するこずが悪い堎合、孊習プロセス自䜓に䜕かが間違っおいるはずです。 それを理解しおみたしょう。 再蚓緎は、モデル空間が倧きすぎる堎合に発生したす。たずえば、任意の次数の倚項匏たたは任意の数のニュヌロンを含むニュヌラルネットワヌクが䜿甚されたすこのため、実際にはそのような空間は無意味であるこずが瀺唆されたす-それらはあたりにも「創造的な自由」を持ち、人々に教えるずきは今流行ではありたせん。 したがっお、問題は、倚数のモデルから最適なモデルを遞択するこずです。 これを解決するには、少なくずもモデルの品質に関する適切な基準が必芁です。



確率論は、再蚓緎の性質に察する答えにヒントを䞎えたす。 ベむズの芏則によれば、デヌタDの最適なモデルMは 、最倧事埌確率PM | Dを持぀モデルであり、このモデルのデヌタの尀床PD | Mに、モデルPの事前確率PMを掛けたものに比䟋したす



PM | D〜PD | MPM。



ここで、モデルがデヌタを蚘述する粟床は尀床に察応したす。尀床は、゚ラヌの正芏分垃デヌタからのモデルの偏差の仮定の䞋で、暙準偏差で明瀺的に衚されたす。 それだけを最倧化する぀たり、最尀法を䜿甚するず、再トレヌニングの効果が生じたす。 したがっお、ベむゞアン芏則に埓っお、より正確ではないが再孊習の傟向がないモデルを遞択する可胜性は、事前確率PMでのみ提䟛できたす。



統蚈的導出におけるアプリオリ確率の問題は基本です。 結局のずころ、これらの確率はアプリオリです。぀たり、デヌタを受信する前に奇跡的に決定する必芁がありたす。 倚くのデヌタセットがある堎合、モデルのアプリオリ確率は、特定のモデルが任意のセットに察しお最適であるこずが刀明する確率です。 しかし、これはタスクを耇雑にするだけです。結局のずころ、倚くのデヌタセットからアプリオリ確率を決定するずき、再トレヌニングが行われないように、アプリオリ確率を再び必芁ずしたす。 などなど。 再蚓緎の問題は先隓的確率を蚭定する問題に関連しおいるこずがわかりたしたが、これはただ簡単ではありたせん。



ただし、ベむズ芏則を前眮し、事埌確率自䜓を最倧化する代わりに、その負の察数を最小化するず、興味深い芳枬を行うこずができたす。



–Log 2 PM | D〜–log 2 PD | M-log 2 PM。



マむナスの確率の察数は、単に情報量です。 –log 2 PMはモデル内の情報量ビット単䜍の蚘述の長さ、– log 2 PD | Mはデヌタ内の远加情報量です。既存のモデル実際、その粟床を特城付ける、モデルからのデヌタの偏差の蚘述の長さ。 確率を通じお情報量を蚈算する方法から泚意をそらすず、次のこずがわかりたす。 モデルの情報量はその耇雑さです。 たずえば、ANNの倚項匏たたはニュヌロンのメンバヌずそれらの間の接続が倚いほど、そのようなモデルのコヌディングにより倚くのビットが費やされたす。



モデルの耇雑さずその粟床の間の劥協点を芋぀ける必芁性は、最小蚘述長の原則で衚珟されたす。これは、最良のモデルは、モデルからのデヌタたたはモデルを䜿甚しお゚ンコヌドされたデヌタの偏差の最小蚘述長が達成されるモデルであるこずを瀺しおいたす。 この原則は、Occamのカミ゜リルヌルの圢匏化ず呌ばれるこずもありたす。これは、゚ンティティが必芁以䞊に䜜成されるべきではないこずを長い間瀺しおいたす。



ここで重芁なのは、モデルの耇雑さを、事前の確率ではなく盎接考慮できるこずです。 実際、情報量の抂念を確率の抂念に導入しそしお情報理論から確率理論を導き、逆もたた成り立ちたせん、それによっお確率理論ずそれに基づく叀兞的シャノン理論の䞡方に固有の倚くの基本的な問題を解決する正しい機䌚がありたす情報理論。 しかし、これは別の議論のトピックです。



したがっお、モデルのアプリオリ確率が䜎いほど、耇雑床が高くなりたす。 実際の耇雑さのためのこのような现かいモデルは、再蚓緎の効果を排陀する他の方法の良い代甚品です。 耇雑すぎるモデルを遞択するず、再トレヌニングが発生したす。 モデルが単玔であるほど、より䞀般的です。 明らかに、再蚓緎は䞍十分な䞀般化ず関連しおいたす。 䞀般化の欠劂が、トレヌニングをテストに詰め蟌んだり、フィッティングする際の指導の質の䜎さの理由です。 もちろん、別の極端な䟋がありたす。1぀の単玔なモデルを䜿甚する堎合、゚ラヌや、モデルがデヌタを単玔化しない「圧瞮しない」にもかかわらず、蚘述しすぎたす。 情報基準により、適切な劥協点を芋぀けるこずができたす。



ただし、機械孊習の䞀般的な問題はただ解決されおいたせん。 正しい䞀般化が䞍可胜であるこずは、䜿甚されたモデル空間に目的のモデルが単に存圚しないずいう事実による可胜性がありたす。

倚項匏近䌌を䜿甚した䟋に戻りたしょう。 倚項匏が私たちにずっお真のモデルである堎合、すべおがうたくいきたす-蚘述の長さの基準により、最適な数のパラメヌタヌを持぀倚項匏を遞択し、最適な利甚可胜なデヌタで予枬を提䟛できたす。 しかし、他の関数を䜿甚しおデヌタが生成されるずどうなりたすか この関数は、原則ずしお、いく぀かの倚項匏で近䌌できるこずを節玄できたすか



たずえば、指数を考えおみたしょう。 これは、 xn / nずいう圢匏の倚数の甚語で蚘述されたす。 しかし、このシリヌズには無数のメンバヌがいたす。 たた、ポむントの遞択は有限であるため、再構築された倚項匏も有限次数になりたす。 これは、倖挿䞭に゚ラヌがずにかく非垞に急速に蓄積し、基準がこれ以䞊圹立たないこずを意味したす。 同様に、デヌタに高調波䟝存性が含たれおいる堎合、有限シリヌズが呚期的ではない倚項匏たたは指数関数によっおデヌタが適切に倖挿されたせん。 もちろん、いく぀かのタむプの䟝存関係は、他のタむプによっお良くも悪くも掚定できたすが、モデル空間にデヌタに含たれる䟝存関係のタむプが正確にない堎合、最良の予枬は埗られないず蚀えたす。



同じこずは予枬だけでなく、たずえば認識に぀いおも蚀えたす。 認識の堎合、この問題は䞍倉量の問題で最も明確に珟れたす。 特定のクラスの䞀郚の画像が特定の䞍倉匏を満たす堎合、この䞍倉匏を正確に孊習できない堎合、認識システムの䜜業は十分ではありたせん。 特に、これが画像認識のニュヌラルネットワヌクが画像の幟䜕孊的倉換に䞍倉な兆候を即座に提瀺するこずを芁求するか、巚倧なサむズのサンプルを必芁ずする理由です。 そのため、トレヌニング䞭のパヌセプトロンが画像の䞀郚に認識可胜なオブゞェクトを提瀺した堎合、画像の別の郚分にそれらが提瀺された堎合、圌はそれらを認識できたせん。



ミンスキヌずペヌパヌの有名な本に含たれおいたのは、たさにこの皮のパヌセプトロンの批刀でした。圌らは非局所䞍倉量を構築するこずができず適切な䞀般化を実行したす、すべおの圢匏の画像を認識するこずを孊ぶために指数関数的に倧きなサむズの蚓緎サンプルを必芁ずしたす。 パヌセプトロンが同時に再蚓緎しなくおも、効果的な蚓緎の䞻な目暙である、これたでに芋たこずのない画像の予枬たたは認識を可胜にする基瀎パタヌンを特定するこずはできたせん。



もちろん、任意の皮の法則を衚珟できないこずは、特定のANNアヌキテクチャだけでなく、他の機械孊習方法にも特城的です。 それらはすべお、たずえば、分解が実行される基底関数の特定のファミリヌの圢匏で、パタヌンを衚すいく぀かの限定された方法を䜿甚したす。 たずえば、決定朚たたはルヌルセットを䜿甚する堎合の蚘号孊習に぀いおも同じこずが蚀えたす。 知識に基づく耇雑なシステムでは、この問題は芆い隠されたすが、たったく解決されたせん。



デヌタ内のさたざたなパタヌンを考慮に入れたさたざたな方法を組み合わせようずするのは自然なこずです。 そしお、このアプロヌチは珟圚非垞に人気がありたす。 ただし、非普遍的な方法の単玔な組み合わせは、手動で開発者がパタヌンの比范的少数の異なるファミリのみを配眮できるため、機胜をわずかに向䞊させるだけです。

しかし、機械孊習システムに可胜な芏則性を識別する機胜を組み蟌むこずは可胜ですか 開発者によっお前もっお特別に提䟛されおいない任意のパタヌンが建蚭的に蚘述されるようなスペヌスはありたすか そのようなスペヌスはそこだけではありたせん。 それもよく知られおいたす。 これがアルゎリズムの空間です。



指数䟝存性を再珟したいですか そのようなアルゎリズムを構築するこずは難しくありたせん。 倚項匏、調和関数、フィボナッチ数列、階乗をお探しですか そのようなアルゎリズムがありたす。 偶数ず奇数のクラスを認識する必芁がありたすか 適切なアルゎリズムを䜿甚するのは簡単です ここで、ANNの助けを借りお、これらすべおの問題を同時に解決するこずがいかに簡単かを考えおください。圓然、比范を正確にするために、察応するトレヌニングサンプルの提瀺時にこれらのアルゎリズムをすべお構築する方法が必芁です。しかし、ここで私たちにずっお䞻なこずは、アルゎリズムの分野では、少なくずも、すべおのそのような問題に察する適切な解決策があるずいうこずです。



, , , . , , . « » . , , (, , , habrahabr.ru/post/145929 ). , . « » , .



, . . , , ( , «» ), , , .



, ( ) . 1964- . , , . , . , , , , . , ( ) . , , , . – .



All Articles