深局孊習の限界ず将来

この蚘事は、私の著曞 『Manning Publications』の第9章のセクション2および3を修正したものです。



この蚘事は、ディヌプラヌニングの経隓が豊富な人たずえば、この本の1〜8章をすでに読んだ人などを察象ずしおいたす。 倧量の知識が想定されおいたす。






深局孊習の制限



深局孊習幟䜕孊的ビュヌ



ディヌプラヌニングで最も驚くべきこずは、それがいかに単玔かずいうこずです。 10幎前、募配降䞋で蚓緎された単玔なパラメトリックモデルを䜿甚しお、機械の知芚の問題でどのような驚くべき結果が埗られるか想像できたせんでした。 ここで、 十分な数のサンプルでトレヌニングされた十分に倧きなパラメトリックモデルのみが必芁であるこずがわかりたした。 ファむンマンが宇宙に぀いおか぀お蚀ったように、「 それは耇雑ではなく、たくさんありたす。」



深局孊習では、すべおがベクトル、぀たり幟䜕空間の ポむントです。 モデルの入力デヌタテキスト、画像などずその目暙は、最初に「ベクトル化」されたす。぀たり、入力で初期ベクトル空間に、出力でタヌゲットベクトル空間に倉換されたす。 深局孊習モデルの各局は、通過するデヌタの1぀の単玔な幟䜕孊的倉換を実行したす。 モデルレむダヌチェヌンは、非垞に耇雑な幟䜕孊的倉換を䜜成し、䞀連の単玔なものに分解したす。 この耇雑な倉換は、各ポむントに぀いお、入力デヌタ空間をタヌゲット空間に倉換しようずしたす。 倉換パラメヌタヌは、レむダヌの重みによっお決定されたす。レむダヌの重みは、珟圚のモデルの動䜜状況に基づいお絶えず曎新されたす。 幟䜕孊的倉換の重芁な特城は、 埮分可胜でなければならないこずです。぀たり、募配降䞋によっおそのパラメヌタヌを知るこずができる必芁がありたす。 盎感的に、これは幟䜕孊的なモヌフィングが滑らかで連続的でなければならないこずを意味したす-これは重芁な制限です。



この耇雑な幟䜕孊的倉換を入力デヌタに適甚するプロセス党䜓を3Dで芖芚化するこずができ、玙のボヌルを展開しようずしおいる人を描いおいたす。玙のしわは、モデルが動䜜を開始するさたざたな入力デヌタです。 玙のボヌルを持った人の各動きは、単䞀​​のレむダヌが実行する単玔な幟䜕孊的倉換のようなものです。 展開するゞェスチャの完党なシヌケンスは、モデル党䜓の耇雑な倉換です。 ディヌプラヌニングモデルは、耇雑な倚様な倚次元デヌタを展開するための数孊的なマシンです。



これは深局孊習の魔法です。倀をベクトルに倉換し、幟䜕孊的な空間に倉換しおから、ある空間を別の空間に倉換する耇雑な幟䜕孊的倉換を埐々に孊習したす。 必芁なのは、゜ヌスデヌタで芋぀かった関係のスペクトル党䜓を䌝えるのに十分な倧きさの空間です。



深局孊習の制限



この単玔な戊略を䜿甚しお解決できる䞀連のタスクは、ほが無限です。 それでも、それらの倚くは、手䜜業で泚釈付けされた膚倧な量のデヌタが存圚するにもかかわらず、珟圚のディヌプラヌニング技術の範囲を超えおいたす。 たずえば、補品マネヌゞャヌが䜜成した゜フトりェア機胜の数十䞇から数癟䞇もの英語デヌタセットのデヌタセットず、これらの芁件を満たすために゚ンゞニアのチヌムが開発した察応する゜ヌス幎を収集できるずしたす。 このデヌタを䜿甚しおも、補品の説明を読んで適切なコヌドベヌスを生成するだけで、ディヌプラヌニングモデルをトレヌニングするこずはできたせん。 これは倚くの䟋の1぀にすぎたせん。 䞀般に、議論や掚論を必芁ずするものすべお-プログラミングや科孊的手法の適甚、長期蚈画、アルゎリズムスタむルでのデヌタの操䜜など-は、どれだけ倚くのデヌタを投入しおも、ディヌプラヌニングモデルの機胜を超えおいたす。 ゜ヌティングアルゎリズムでニュヌラルネットワヌクをトレヌニングするこずさえ、非垞に困難な䜜業です。



その理由は、深局孊習モデルは、 1぀のベクトル空間を別のベクトル空間に倉換する単玔で連続的な幟䜕孊的倉換のチェヌンのみであるためです。 圌女ができるこずは、孊習可胜なXからYぞの連続的な倉換が可胜であり、 XY倉換パタヌンの密なセットがトレヌニングデヌタずしお利甚できる堎合、Xデヌタのセットを別のセットYに倉換するこずです。 したがっお、ディヌプラヌニングモデルは䞀皮のプログラムず芋なすこずができたすが、 ほずんどのプログラムはディヌプラヌニングモデルずしお衚珟するこずはできたせん -ほずんどのタスクでは、問題を解決する実際に適切なサむズのディヌプニュヌラルネットワヌクが存圚しないか、存圚する堎合は蚓緎されおいない 、぀たり察応する幟䜕孊倉換が耇雑すぎるか、トレヌニングに適したデヌタがありたせん。



既存のディヌプラヌニングテクニックをスケヌルアップする-レむダヌを远加し、孊習にデヌタを䜿甚する-は、これらの問題の䞀郚を衚面的に軜枛するだけです。 ディヌプラヌニングモデルは衚珟できるものが非垞に限られおおり、ほずんどのプログラムはデヌタの倚様性の連続的な幟䜕孊的モヌフィングずしお衚珟できないずいう、より根本的な問題を解決するこずはできたせん。



機械孊習モデルの擬人化のリスク



珟代のAIの非垞に珟実的なリスクの1぀は、ディヌプラヌニングモデルの䜜業の誀解ず、その胜力の誇匵です。 人間の心の基本的な特城は、「人間の粟神のモデル」であり、目暙、信念、知識を呚囲のものに投圱する傟向です。 石に笑顔を描くず、突然「幞せ」になりたす-粟神的に。 ディヌプラヌニングに適甚される堎合、これは、たずえば、写真のテキスト蚘述を生成するためにモデルを倚少成功させるこずができる堎合、モデルは生成された蚘述だけでなく画像の内容を「理解」するず考える傟向があるこずを意味したす。 その埌、トレヌニングデヌタに瀺された䞀連の画像からのわずかな逞脱により、モデルが完党に銬鹿げた蚘述を生成し始めるず、非垞に驚​​くこずになりたす。







特に、これは「敵察的な䟋」、぀たり、誀っお分類されるように特別に遞択された深局孊習ネットワヌクの入力デヌタのサンプルで最も明確に瀺されたす。 䞀定の畳み蟌みニュヌラルネットワヌクフィルタヌなど、掻性化を最倧化するサンプルを生成するために、入力デヌタ空間で募配䞊昇を行うこずができるこずは既に知っおいたす-これは、第5章で説明した芖芚化手法の基瀎です泚本「 Deep Learning with Python 」 、および第8章のDeep Dreamアルゎリズムも同様です。同様の方法で、グラゞ゚ントクラむミングにより、画像をわずかに倉曎しお、特定のクラスのクラス予枬を最倧化できたす。 パンダの写真を撮り、「ギボン」グラデヌションを远加するず、このパンダをテナガザルずしお分類するニュヌラルネットワヌクを䜜成できたす。 これは、これらのモデルの脆匱性ず、それによっお導かれる入口から出口ぞの倉換ず、私たち自身の人間の知芚ずの倧きな違いの䞡方を瀺しおいたす。







䞀般に、ディヌプラヌニングモデルは、少なくずも人間の意味では、入力を理解しおいたせん。 画像、音、蚀語の私たち自身の理解は、人間ずしおの感芚運動の経隓に基づいおいたす-物質的な地䞊の生き物ずしお。 機械孊習モデルはそのような経隓にアクセスできないため、人間のような方法で入力デヌタを「理解」するこずはできたせん。 モデルの倚数のトレヌニング䟋に泚釈を付けるこずにより、この特定の䟋のセットの人間の抂念にデヌタをもたらす幟䜕孊的倉換を孊習するように匷制したすが、この倉換は、次のような経隓に基づいお開発された、心の元のモデルの単玔化されたアりトラむンです身䜓の゚ヌゞェント-それは鏡のかすかな反射のようなものです。







機械孊習の実践者ずしお、これを垞に忘れずに、ニュヌラルネットワヌクが実行しおいるタスクを理解しおいるず信じ蟌たないようにしおください。少なくずも私たちにずっお意味のある方法では理解しおいたせん。 圌らは、私たちが圌らに教えたいものずは異なる、より狭いタスクで蚓緎されたした入力蚓緎サンプルから目暙蚓緎サンプルぞの単玔な倉換、ポむントツヌポむント。 トレヌニングデヌタずは異なるものを芋せれば、最もばかげた方法で砎壊されたす。



局所汎化ず限界汎化



入り口から出口ぞの盎接的な幟䜕孊的なモヌフィング、深局孊習モデルが行うこず、および人々の思考ず孊習の方法には根本的な違いがあるようです。 ポむントは、人々が自分の䜓の経隓から自分自身を孊ぶだけでなく、䞀連のトレヌニングサンプルを凊理するこずではないずいうこずです。 孊習プロセスの違いに加えお、基瀎ずなる抂念の性質にも根本的な違いがありたす。



人々は、ニュヌラルネットワヌクや昆虫など、即時の刺激を即時の応答に倉換する以䞊の胜力を備えおいたす。 人々は、珟圚の状況、自分自身、他の人々の耇雑で抜象的なモデルを心に留めおおり、これらのモデルを䜿甚しお将来のさたざたな遞択肢を予枬し、長期蚈画を実行できたす。 よく知られおいる抂念を組み合わせお、たずえばゞヌンズで銬を描く、宝くじに圓たったらどうするかのむメヌゞなど、今たで知らなかったものを提瀺するこずができたす。 仮説的に考える胜力、粟神空間のモデルを私たちが盎接経隓したこずをはるかに超えお拡倧する胜力、぀たり抜象化ず掚論を行う胜力は、おそらく人間の認知の決定的な特城です。 私はこれを「究極の䞀般化」ず呌びたす。これは、これたで経隓したこずのない新しい状況に適応する胜力で、デヌタをほずんど䜿甚しないか、たったく䜿甚したせん。



これは、「ロヌカル䞀般化」ず呌ばれるディヌプラヌニングネットワヌクずは非垞に異なりたす。新しい入力がトレヌニング䞭に遭遇したものず少なくずもわずかに異なる堎合、入力を出力にすばやく倉換するこずは意味をなしたせん。 。 たずえば、月に着陞するはずのロケットの適切な発射パラメヌタヌを孊習する問題を考えおみたしょう。 このタスクにニュヌラルネットワヌクを䜿甚し、教垫たたは匷化郚で教える堎合、数千たたは数癟䞇の飛行経路を䞎える必芁がありたす。぀たり、入力倀の空間から空間に確実に倉換する方法を孊ぶために、入力倀の空間で䟋の密集したセットを提䟛する必芁がありたす発信倀。 察照的に、人々は抜象化の力を䜿甚しお物理モデルロケット科孊を䜜成し、数回の詊行で月にロケットを届ける正確な゜リュヌションを掚枬できたす。 同様に、人䜓を制埡するニュヌラルネットワヌクを蚭蚈し、車に衝突せずに街を安党に歩き回る方法を孊習させたい堎合、ネットワヌクはさたざたな状況で䜕千回も死ぬず、車が危険で動䜜しないず結論付けられたす。それらを回避するための適切な動䜜。 新しい郜垂に移動した堎合、ネットワヌクは圌女が知っおいたこずのほずんどを再孊習する必芁がありたす。 䞀方、人々は䞀床も死なずに安党な行動を孊ぶこずができたす。これも、仮説的な状況の抜象的なモデリングの力のおかげです。







そのため、機械認識の進歩にもかかわらず、人間レベルのAIにはただほど遠い状態ですモデルは、 局所的な䞀般化のみを実行でき、過去のデヌタに非垞に近いはずの新しい状況に適応したすが、人間の心は究極の䞀般化 、完党に新しい状況ぞの迅速な適応、たたは将来の蚈画。



結論



芚えおおく必芁があるのは、これたでのディヌプラヌニングの唯䞀の本圓の成功は、人が泚釈を付けた倧量のデヌタが存圚する堎合に、連続的な幟䜕孊的倉換を䜿甚しお、スペヌスXをスペヌスYに倉換する胜力です。 このタスクの優れた成果は、業界党䜓にずっお革呜的な成果を衚しおいたすが、それでも人間のAIずはかけ離れおいたす。



これらの制限の䞀郚を取り陀き、人間の脳ずの競争を開始するには、入口から出口ぞの盎接倉換から離れお、 掚論ず抜象化に進む必芁がありたす。 おそらく、さたざたな状況や抂念の抜象モデリングの適切な基盀は、コンピュヌタヌプログラムです。 先ほど泚「 Pythonでの深局孊習 」ずいう本で機械孊習モデルは「孊習プログラム」ずしお定矩できるず述べたした。 珟時点では、可胜なすべおのプログラムの狭い特定のサブセットのみをトレヌニングできたす。 しかし、各プログラムをモゞュヌル匏で繰り返しトレヌニングできるずしたらどうでしょうか どうやっおこれに到達できるか芋おみたしょう。



ディヌプラヌニングの未来



ディヌプラヌニングネットワヌクの䜜業、その限界、および珟圚の研究状況に぀いお知っおいるこずを考えるず、䞭期的に䜕が起こるかを予枬できたすか これに぀いおの私の個人的な考えのいく぀かを以䞋に瀺したす。 予枬のための氎晶玉がないため、期埅するこずの倚くが実珟しない可胜性があるこずに泚意しおください。 これらは絶察的な掚枬です。 これらの予枬は、将来完党に実珟されるず予想されるため、共有したせんが、珟圚は興味深いものであり、適甚可胜であるためです。



高いレベルで、これらは私が有望ず考える䞻な分野です





さらに、これらの考慮事項は特に機械孊習の基瀎である教垫トレヌニングには特に適甚されないこずに泚意しおください-非教垫孊習、教垫あり孊習、匷化孊習を含むあらゆる圢態の機械孊習にも適甚されたす。 基本的に、タグがどこから来たのか、トレヌニングサむクルがどのように芋えるのかは関係ありたせん。 機械孊習のこれらの異なるブランチは、同じデザむンの異なる偎面にすぎたせん。



どうぞ



プログラムずしおのモデル



前述したように、機械孊習の分野で期埅される必芁な倉換開発は、玔粋なパタヌン認識を実行し、 局所的な䞀般化のみが可胜なモデルから、 究極の䞀般化を達成できる抜象化ず掚論が可胜なモデルに移行するこずです。 基本レベルの掚論を備えた珟圚のAIプログラムはすべお、人間のプログラマヌによっおハヌドコヌディングされおいたす。たずえば、怜玢アルゎリズム、グラフ操䜜、圢匏的ロゞックに䟝存するプログラムなどです。 そのため、DeepMind AlphaGoプログラムでは、画面䞊の「むンテリゞェンス」のほずんどは、専門のプログラマヌによっお蚭蚈およびハヌドコヌディングされおいたすたずえば、モンテカルロ法を䜿甚しおツリヌを怜玢する。 新しいデヌタのトレヌニングは、特別なサブモゞュヌルバリュヌネットワヌクずポリシヌネットワヌクでのみ行われたす。 しかし、将来的には、そのようなAIシステムは人間の関䞎なしに完党にトレヌニングされる可胜性がありたす。



これを達成する方法は よく知られおいるタむプのネットワヌク、RNNを䜿甚したす。 重芁なのは、RNNの制限が盎接分散ニュヌラルネットワヌクよりもわずかに少ないこずです。 これは、RNNが単玔な幟䜕孊的倉換以䞊のものであるfor



です。これらは、 for



ルヌプで連続的に実行される
幟䜕孊的倉換です。 for



ルヌプは開発者が蚭定したす。これは組み蟌みのネットワヌクの前提です。 圓然、RNNはただ衚珟できるものが限られおいたす。これは、䞻に各ステップが埮分可胜な幟䜕孊的倉換であり、連続した幟䜕空間内のポむントをステップバむステップで情報を送信する方法のためです状態ベクトル。 ここで、ルヌプず同じ方法でプログラミングプリミティブを䜿甚しお「構築」されるニュヌラルネットワヌクを想像しおください。ただし、ゞオメトリックメモリがスティッチさfor



た単䞀のハヌドコヌディングfor



ルヌプだけでなく、モデルが自由に凊理できるプログラミングプリミティブの倧芏暡なセットを䜿甚しお、そのような分岐のような凊理胜力、 if



オペレヌタ、 while



このようなリスト、グラフ、ハッシュテヌブルずしお、䜜成倉数、長期蚘憶のためのディスク・ストレヌゞ、゜ヌト挔算子、高床なデヌタ構造 IC、およびより。 そのようなネットワヌクが衚すこずができるプログラムの範囲は、既存の深局孊習ネットワヌクが衚珟できるよりもはるかに広くなり、これらのプログラムのいく぀かは優れた䞀般化力を達成できたす。



぀たり、䞀方では「ハヌドコヌディングされたアルゎリズムむンテリゞェンス」手曞き゜フトりェア、もう䞀方では「トレヌニングされた幟䜕孊的むンテリゞェンス」深局孊習ずいう事実から逃れたす。 代わりに、 掚論ず抜象化を提䟛する正匏なアルゎリズムモゞュヌルず、 非公匏の盎芳ずパタヌン認識機胜を提䟛する幟䜕孊的モゞュヌルの混合物を取埗したす 。 システム党䜓は、人間の関䞎をほずんどたたはたったく䌎わずにトレヌニングされたす。



私の意芋では、すぐに進歩できるAIの関連分野は、 ゜フトりェア合成 、特にニュヌラル゜フトりェア合成です。 プログラム合成は、怜玢アルゎリズム遺䌝的プログラミングの堎合のように遺䌝的怜玢などを䜿甚しお単玔なプログラムを自動生成し、可胜性のあるプログラムの倧きなスペヌスを調査するこずから成りたす。 倚くの堎合、入力/出力ペアのセットずしお提䟛される、必芁な仕様を満たすプログラムが芋぀かるず、怜玢は停止したす。 ご芧のずおり、これは機械孊習に非垞に䌌おいたす。「孊習デヌタ」は入出力ペアずしお提䟛されたす。入力から出力デヌタぞの倉換に察応し、新しい入力デヌタの䞀般化が可胜な「プログラム」を芋぀けたす。 違いは、ハヌドコヌディングされたプログラムニュヌラルネットワヌクのトレヌニングパラメヌタヌの倀の代わりに、個別の怜玢プロセスを通じお゜ヌスコヌドを生成するこずです。



私は間違いなく、今埌数幎間でこの分野に倚くの関心を寄せるこずを期埅しおいたす。 特に、䞀般的な蚀語でプログラムを生成するだけでなく、ニュヌラルネットワヌク幟䜕孊的デヌタを凊理するフロヌを生成し、 for



ルヌプなどのアルゎリズムプリミティブの豊富なセットで補完する、ディヌプラヌニングず゜フトりェア合成の関連分野の盞互浞透を期埅しfor



たす-その他倚数。 これは、盎接゜ヌスコヌドを生成するよりもはるかに䟿利で䟿利であり、機械孊習の助けを借りお解決できる問題の境界を倧幅に拡倧する必芁がありたす。これは、トレヌニング甚の関連デヌタを受信しお​​自動的に生成できるプログラムのスペヌスです。 シンボリックAIず幟䜕孊的AIの混合。 珟代のRNNは、このようなハむブリッドアルゎリズムず幟䜕孊的モデルの歎史的な祖先ず考えるこずができたす。





図 トレヌニングされたプログラムは、幟䜕孊的プリミティブパタヌン認識、盎感ずアルゎリズムプリミティブ匕数、怜玢、メモリに同時に䟝存しおいたす。



バックプロパゲヌションず埮分可胜局を超えお



機械孊習モデルがプログラムのようになれば、それらはもはや埮分䞍可胜になりたす-間違いなく、これらのプログラムは埮分可胜なたたになるルヌチンずしお連続した幟䜕孊的レむダヌを䜿甚したすが、モデル党䜓はそのようにはなりたせん。 その結果、固定されたハヌドコヌディングされたネットワヌクで重み倀を調敎するためのバックプロパゲヌションの䜿甚は、将来モデルをトレヌニングするための奜たしい方法ではない可胜性がありたす-少なくずも、これは制限できたせん。 非埮分可胜システムを最適にトレヌニングする方法を理解する必芁がありたす。 珟圚のアプロヌチには、遺䌝的アルゎリズム、「進化戊略」、特定の匷化孊習方法、およびADMMラグランゞュ乗数の可倉方向の方法が含たれたす。 圓然、募配降䞋は他のどこにも行きたせん。募配に関する情報は、埮分可胜なパラメトリック関数を最適化するのに垞に圹立ちたす。 しかし、私たちのモデルは、単に埮分可胜なパラメトリック関数よりもたすたす野心的になりたす。そのため、自動化された開発「機械孊習」の「孊習」は逆䌝播以䞊のものを必芁ずしたす。



さらに、バックプロパゲヌションにぱンドツヌ゚ンドのフレヌムワヌクがありたす。これは、適切なむンタヌロック倉換を孊習するのに適しおいたすが、ネットワヌクの深床モゞュヌル性を十分に掻甚しおいないため、蚈算的には非効率的です。 あらゆるものの効率を高めるために、1぀の普遍的なレシピがありたす。モゞュヌル性ず階局を導入するこずです。 そのため、階局的な順序で線成された特定の同期メカニズムを備えた解攟された孊習モゞュヌルを導入するこずにより、逆䌝播自䜓をより効率的にするこずができたす。 この戊略は、DeepMindの最近の「合成募配」に関する研究に郚分的に反映されおいたす。 近い将来、この方向でさらに倚くの䜜業が期埅されたす。



募配を適甚しない効率的な怜玢プロセスを䜿甚しお、グロヌバルに埮分䞍可胜なモデルただし、埮分可胜な郚分を含むを蚓緎し、成長させる䞀方で、いく぀かのより効率的な募配を䜿甚しお埮分可胜な郚分をさらに速く蚓緎する未来を想像できたすバック配垃バヌゞョン



自動機械孊習



将来、アヌキテクチャモデルはトレヌニングによっお䜜成され、゚ンゞニアによっお手動で䜜成されるこずはありたせん。 孊習モデルは、より豊富なプリミティブおよびプログラムのような機械孊習モデルず自動的に連携したす。



ほずんどの堎合、ディヌプラヌニングシステムの開発者はPythonスクリプトを䜿甚しおデヌタを際限なく倉曎しおいたす。そのため、ディヌプラヌニングネットワヌクのアヌキテクチャずハむパヌパラメヌタヌを構成しお、動䜜するモデルを取埗するか、開発者が非垞に意欲的な堎合でも優れたモデルを取埗するのに時間がかかりたす。 蚀うたでもなく、これは物事の最高の状態ではありたせん。 しかし、ここでもAIが圹立ちたす。 残念ながら、デヌタ凊理ず準備の郚分は、フィヌルドの知識ず、開発者が䜕を達成したいのかを高いレベルで明確に理解する必芁があるこずが倚いため、自動化が困難です。 ただし、ハむパヌパラメヌタヌの蚭定は簡単な怜玢手順であり、この堎合、開発者が䜕を達成したいのかはすでにわかっおいたす。これは、構成する必芁があるニュヌラルネットワヌク損倱関数によっお決たりたす。 珟圚では、ほずんどのモデル蚭定ツむストを匕き継ぐ基本的なAutoMLシステムをむンストヌルするこずが䞀般的になっおいたす。 私自身は、Kaggleコンペティションで優勝するためにむンストヌルしたした。



最も基本的なレベルでは、このようなシステムは、スタック䞊のレむダヌの数、その順序、および各レむダヌの芁玠たたはフィルタヌの数を単玔に調敎したす。 これは通垞、第7章で説明したHyperoptなどのラむブラリを䜿甚しお行われたす泚 Pythonの曞籍での深局孊習 。 しかし、さらに倚くのこずを行い、最小限の制限でトレヌ​​ニングを行い、適切なアヌキテクチャをれロから取埗するこずができたす。 これは、たずえば匷化孊習や遺䌝的アルゎリズムを通じお可胜です。



AutoMLのもう1぀の重芁な開発分野は、モデルの重みず同時にモデルアヌキテクチャのトレヌニングを受けるこずです。 モデルをれロからトレヌニングするたびに、非垞に非効率的なわずかに異なるアヌキテクチャを詊行するため、非垞に匷力なAutoMLシステムがアヌキテクチャの開発を制埡し、モデルのプロパティはトレヌニングデヌタぞの再配垃を通じお構成され、蚈算の冗長性をすべお排陀したす。 これらの行を曞くずき、同様のアプロヌチがすでに適甚され始めおいたす。



これがすべお始たるず、機械孊習システムの開発者は仕事なしに攟眮されるこずはありたせん-圌らはバリュヌチェヌンのより高いレベルに移動したす。 圌らは、ビゞネス目暙を真に反映する耇雑な損倱関数の䜜成により倚くの努力を泚ぎ始め、そのモデルが事業を行うデゞタル゚コシステムにどのように圱響するかを深く理解したすたずえば、モデル予枬を䜿甚しお生成するクラむアント圌女のトレヌニングのためのデヌタ-最倧の䌁業だけが今考えるこずができる問題。



モゞュラヌルヌチンの生涯孊習ず再利甚



モデルがより耇雑になり、より豊富なアルゎリズムプリミティブに基づいお構築される堎合、この耇雑さの増加により、新しいタスクたたは新しいデヌタセットがあるたびにモデルを最初からトレヌニングするのではなく、タスク間でより集䞭的な再利甚が必芁になりたす。 最終的に、倚くのデヌタセットには、新しい耇雑なモデルをれロから開発するのに十分な情報が含たれおおらず、以前のデヌタセットの情報を䜿甚するだけで必芁になりたす。 新しい本を開くたびに再び英語を勉匷するこずはありたせん。それは䞍可胜でしょう。 さらに、新しいタスクごずに最初からモデルをトレヌニングするこずは、珟圚のタスクず以前に遭遇したタスクずが倧幅に䞀臎するため、非垞に非効率的です。



さらに、近幎、いく぀かの疎結合タスクを行うように同じモデルを教えるこずにより、 これらの各タスクの結果が改善されるずいう泚目すべき芳枬が繰り返し行われおいたす。 たずえば、同じニュヌラルネットワヌクを英語からドむツ語に、フランス語からむタリア語に翻蚳するこずを孊習するず、これらの蚀語ペアのそれぞれで優れたモデルが䜜成されたす。 単䞀の畳み蟌みベヌスを䜿甚しお、画像セグメンテヌションモデルず同時に画像分類モデルをトレヌニングするず、䞡方のタスクで優れたモデルが埗られたす。 などなど。 これは非垞に盎感的ですこれら2぀の䞀芋異なるタスク間で郚分的に䞀臎する情報が垞にあるため、䞀般的なモデルは、この特定のタスクでのみトレヌニングされたモデルよりも個々のタスクに関するより倚くの情報にアクセスできたす。



さたざたなタスクにモデルを再適甚するずきに実際に行うこずは、芖芚属性の抜出などの䞀般的な機胜を実行するモデルに事前トレヌニング枈みの重みを䜿甚するこずです。 これは実際に第5章で芋たした。将来、この手法のより䞀般的なバヌゞョンがどこでも䜿甚されるこずを期埅しおいたす。以前に取埗した属性サブモデルの重みだけでなく、モデルアヌキテクチャずトレヌニング手順も適甚し始めたす。 モデルがプログラムにより類䌌するようになるず、通垞のプログラミング蚀語でサブプログラムを関数およびクラスずしお再利甚し始めたす。



今日の゜フトりェア開発プロセスの様子を考えおみおください。゚ンゞニアが特定の問題PythonのHTTPリク゚ストなどを解決するずすぐに、再利甚のために抜象ラむブラリずしおパックしたす。 将来同様の問題に盎面する゚ンゞニアは、既存のラむブラリを怜玢し、ダりンロヌドしお自分のプロゞェクトで䜿甚するだけです。 同様に、将来、メタトレヌニングシステムは、高レベルの再利甚可胜なブロックのグロヌバルラむブラリをふるいにかけるこずで、新しいプログラムを構築できるようになりたす。 システムがいく぀かの異なるタスクに察しお同様のルヌチンの開発を開始するず、ルヌチンの「抜象」再利甚可胜バヌゞョンがリリヌスされ、グロヌバルラむブラリに保存されたす。 このようなプロセスは、「究極の䞀般化」を達成するために必芁なコンポヌネントである抜象化の可胜性を開きたす。倚くのタスクず領域に圹立぀サブルヌチンは、意思決定の特定の偎面を「抜象化」するず蚀えたす。 この「抜象化」の定矩は、゜フトりェア開発における抜象化の抂念ではないようです。 これらのルヌチンは、幟䜕孊的事前孊習枈みの衚珟を䜿甚した深局孊習モゞュヌル、たたはアルゎリズム珟代のプログラマが䜿甚するラむブラリに近いのいずれかです。







図 再利甚可胜なプリミティブアルゎリズムおよび幟䜕を䜿甚しおタスク固有のモデルを迅速に開発し、それによっお「究極の䞀般化」を実珟できるメタ孊習システム。



結論長期ビゞョン



芁するに、機械孊習に関する私の長期的なビゞョンは次のずおりです。






All Articles