Andrew Eunの「機械孊習の枇き」のドラフト、1〜7ç« 

昚幎12月、アメリカのデヌタサむ゚ンスの同僚ずのやりずりで、埅望の新しい機械孊習の第䞀人者であるAndrew Ngの 「機械孊習の枇きディヌプラヌニング時代の゚ンゞニアのための戊略」に぀いおの議論の波がありたした。 この本は2016幎の倏に発衚され、今ではようやくいく぀かの章が登堎したした。



画像






Habraコミュニティの泚目に、珟圚利甚可胜な14の最初の7章の翻蚳を提瀺したす。 これは本の最終版ではなく、ドラフト版であるこずに泚意しおください。 これには倚くの䞍正確さがありたす。 アンドリュヌりンはここに圌のコメントずコメントを曞くこずを提案したす 。 著者は、明癜に思えるものから始めたす。 さらに耇雑な抂念が予想されたす。



1.機械孊習戊略はなぜですか



機械孊習MLは、むンタヌネット怜玢、スパム察策、音声認識、掚奚システムなど、無限の数の重芁な補品ずサヌビスの基盀です。 あなたずあなたのチヌムは機械孊習アルゎリズムを備えた補品に取り組んでおり、開発を迅速に進めたいず考えおいたす。 この本はこれに圹立ちたす。



猫奜きの人に猫の写真の連続ストリヌムを提䟛するスタヌトアップを䜜成するずしたしょう。 ニュヌラルネットワヌクを䜿甚しおコンピュヌタヌビゞョンシステムを䜜成し、スマヌトフォンで撮圱した写真の䞭の猫を怜出したす。



画像








しかし、残念ながら、アルゎリズムの粟床は十分に高くありたせん。 倚倧なプレッシャヌにさらされおいるため、「猫怜知噚」を改善する必芁がありたす。 どうする



あなたのチヌムにはたくさんのアむデアがありたす。䟋えば



•より倚くのデヌタを収集する猫の画像をより倚く撮圱したす。

•より倚様なトレヌニングサンプルを収集したす。たずえば、珍しいポヌズの猫、珍しい色の猫、さたざたなカメラ蚭定で撮圱した写真などです。

•モデルをより長くトレヌニングし、募配降䞋の反埩をより倚く䜿甚したす。

•より倧きなニュヌラルネットワヌクを詊しおください。より倚くのレむダヌ/リンク/パラメヌタヌ。

•小芏暡なネットワヌクを詊しおください。

•L2などの正芏化を远加したす。

•ネットワヌクアヌキテクチャの倉曎アクティベヌション機胜、非衚瀺レむダヌの数など。

•...



可胜な遞択肢の䞭から遞択が成功した堎合、猫の写真を怜玢するための䞻芁なシステムを䜜成するこずが可胜になり、これが䌚瀟を成功に導きたす。 遞択が倱敗した堎合、あなたは月を倱いたす。 そのような状況で行動する方法は

この本はその方法を説明したす。 ほずんどの機械孊習タスクでは、詊行するのが良いこずずそうでないこずを瀺す重芁な手がかりが残されおいたす。 このようなヒントを芋るこずができるず、数か月から数幎の開発時間を節玄できたす。



2.この本を䜿甚しおチヌムを支揎する方法は



この本を読んだ埌、機械孊習アルゎリズムを䜿甚しおプロゞェクトの開発方向を蚭定する方法がわかりたす。 ただし、同僚は、この方向たたはその方向を遞択した理由を理解できない堎合がありたす。 チヌムに品質メトリックを単䞀の数倀パラメヌタヌずしお定矩させたい堎合がありたすが、同僚は1぀のむンゞケヌタヌのみを䜿甚するこずに同意したせん。 圌らを説埗する方法は だからこそ、この本の章を短くしたした。ただ印刷しお、同僚が有甚だず思う重芁な情報を1〜2ペヌゞ読むこずができるようにしたす。



タスクの優先順䜍を少し倉曎するず、チヌムのパフォヌマンスに倧きな圱響を䞎える可胜性がありたす。 チヌムがそのような倉曎を行うのを手䌝うなら、あなたがスヌパヌヒヌロヌになれるこずを願っおいたす。



3.䜕を知っおおくべきですか



Courseraで「機械孊習」コヌスを孊んだか、教垫付き孊習アルゎリズムを䜿甚した経隓がある堎合は、本のテキストを理解するのに十分です。 教垫による指導方法に粟通しおいるこずを前提ずしおいたす。xの倀によっお、すべおのxに぀いおyを取埗できる関数を芋぀け、䞀郚x、yのラベル付きトレヌニングサンプルを取埗したす。 この皮のアルゎリズムには、たずえば、線圢回垰、ロゞスティック回垰、ニュヌラルネットワヌクが含たれたす。 機械孊習には倚くの分野がありたすが、実際の結果のほずんどは教垫孊習アルゎリズムを䜿甚しお達成されおいたす。



ニュヌラルネットワヌクNNずディヌプラヌニングに぀いおよく話したす。 抂念の䞀般的な理解のみが必芁です。 䞊蚘の抂念に慣れおいない堎合は、たずCourseraの機械孊習コヌスに関する講矩のビデオをご芧ください。



4.どのような倧きな倉曎が機械孊習の進歩に貢献しおいたすか



倚くのディヌプラヌニング/ニュヌラルネットワヌクのアむデアが長幎にわたっお空䞭にありたした。 なぜ今、それらを適甚し始めたのですか 近幎の進歩に最も貢献したのは、次の2぀の芁因です。



•デヌタのアクセス可胜性珟圚、人々は垞にデゞタルデバむスラップトップ、スマヌトフォンなどを䜿甚しおおり、圌らのデゞタルアクティビティは膚倧な量のデヌタを生成したす。

•蚈算胜力ほんの数幎前、珟圚利甚可胜な膚倧なデヌタセットを利甚するのに十分な倧きさのニュヌラルネットワヌクを倧量にトレヌニングするこずが可胜になりたした。



通垞、トレヌニング甚のデヌタを蓄積しおいおも、ロゞスティック回垰などの「叀い」アルゎリズムの品質指暙は䞀定レベルに達したす。 䞀定の制限から、アルゎリズムの品質は、トレヌニングサンプルの増加ずずもに改善しなくなりたす。 同じタスクで小さなニュヌラルネットワヌクをトレヌニングするず、結果が少し良くなりたす。 ここで、「小さな」ニュヌラルネットワヌクずは、少数の隠れ局、リンク、およびパラメヌタヌを持぀ネットワヌクを意味したす。 最終的に、より倧きなネットワヌクをトレヌニングするず、より良い結果を埗るこずができたす。



画像








著者泚このグラフは、NNが埓来のMLアルゎリズムよりも優れおいるこずを瀺しおいたす少量のトレヌニングデヌタの堎合を含む。 これは、倧量のデヌタの堎合ほど正確ではありたせん。 小さなサンプルの堎合、手動で蚭蚈された機胜に応じお、埓来のアルゎリズムの方が良い堎合も悪い堎合もありたす。 たずえば、トレヌニング甚のサンプル/ナヌスケヌスが20個しかない堎合、ロゞスティック回垰を䜿甚するかニュヌラルネットワヌクを䜿甚するかは重芁ではありたせん。䞀連の蚘号は、アルゎリズムの遞択に比べおはるかに倧きな効果をもたらしたす。 しかし、トレヌニング甚のサンプルが100䞇個ある堎合は、ニュヌラルネットワヌクを䜿甚するこずを奜みたす。



したがっお、最良の結果が埗られたす。



1.非垞に倧きなニュヌラルネットワヌクがトレヌニングされるずき図の緑の曲線䞊にあるように;

2.トレヌニングに倧量のデヌタが䜿甚される堎合。



たた、倚くの革新が絶えず珟れるネットワヌクアヌキテクチャなど、他の倚くの詳现も重芁です。 ただし、アルゎリズムの品質を向䞊させる最も信頌性の高い方法の1぀は、1倧きなNNをトレヌニングするこず、および2トレヌニングにより倚くのデヌタを䜿甚するこずです。 実際には、パラグラフ1および2に埓うこずは非垞に困難です。 この本では、このプロセスの詳现に぀いお説明したす。 たず、埓来のMLアルゎリズムずNNアルゎリズムの䞡方に圹立぀䞀般的なアプロヌチから始め、次に、深局孊習システムを構築するための最も効果的な戊略を遞択したす。



5.サンプルはどうあるべきですか



翻蚳者泚Andrew Eunは、「開発セット」ずいう甚語を䜿甚しお、モデルパラメヌタヌが蚭定されおいるサンプルを指したす。 珟圚、このサンプルはしばしば「怜蚌セット」ず呌ばれる怜蚌サンプルです。 実際、「怜蚌」ずいう甚語は、このサンプルが適甚されるさたざたなタスクに察応しおおらず、「開発セット」ずいう名前は珟状ずの䞀貫性がありたす。 しかし、「開発セット」の適切な翻蚳が芋぀からなかったため、「開発遞択」たたは「開発遞択」ず曞きたす。 このサンプルを「チュヌニング」ず呌ぶのが賢明かもしれたせん kfmnに感謝。



猫の写真を䜿っお䟋に戻りたしょう。 したがっお、モバむルアプリケヌションを開発しおいる堎合、ナヌザヌはさたざたな写真をアプリケヌションにアップロヌドし、猫の写真を自動的に芋぀けたす。 あなたのチヌムは、Webサむトから猫陜性サンプルず「非猫」陰性サンプルの写真をダりンロヌドするこずにより、倧きなデヌタセットを䜜成したした。 次に、このデヌタセットをトレヌニング70ずテスト30のサンプルに分割したした。 サンプルデヌタを䜿甚しお、テストおよびトレヌニングサンプルのオブゞェクトに察しお適切に機胜する「猫怜出噚」が䜜成されたした。 しかし、この分類子がモバむルアプリケヌションに実装されたずき、その䜜業の品質が非垞に䜎いこずがわかりたした。 どうしたの



ナヌザヌがアプリケヌションにアップロヌドする写真は、トレヌニングセットを構成するWebサむトの画像ずは異なるように芋えたす。ナヌザヌは、スマヌトフォンで撮圱した写真をアップロヌドしたす。これらの画像は解像床が異なり、鮮明床が䜎く、シヌンは完党に照らされたせん。 トレヌニングサンプルずテストサンプルはWebサむトの画像で構成されおいるため、アルゎリズムは、アルゎリズムが開発されたデヌタの実際の分垃に䞀般化されおいたせん。 スマヌトフォンの写真には芁玄されおいたせん。



「ビッグデヌタ」の時代以前は、機械孊習の䞀般的なルヌルは、70/ 30のデヌタセットをトレヌニングサンプルずテストサンプルにランダムに分割するこずでした。 このようなアプロヌチは機胜する可胜性がありたすが、トレヌニングセット内のデヌタの分垃が問題が最終的に解決されるデヌタの分垃ず異なる堎合、タスクの数を増やすこずは悪い考えです。



通垞、3぀のサンプルを定矩したす。



•孊習、孊習アルゎリズムを実行したす。

•パラメヌタの構成、機胜の遞択、および孊習アルゎリズムに関するその他の決定に䜿甚される開発開発セットの堎合、このようなサンプルはホヌルドアりト盞互怜蚌セットず呌ばれるこずがありたす。

•テスト。アルゎリズムの品質が評䟡されたすが、それに基づいお、䜿甚するトレヌニングアルゎリズムたたはパラメヌタヌに぀いお決定を行いたせん。



テストサンプルず開発甚サンプルを䜜成するずすぐに、チヌムはトレヌニングアルゎリズムのさたざたなパラメヌタヌなど、倚くのアむデアを詊しお、䜕がより効果的かを確認し始めたす。 これらのサンプルを䜿甚するず、モデルがどの皋床うたく機胜しおいるかをすばやく評䟡できたす。 ぀たり、テストおよび開発サンプルの目暙は、機械孊習の開発における最も重芁な倉曎にチヌムを向けるこずです。 したがっお、以䞋を実行する必芁がありたす。䜜業サンプルずテストサンプルを䜜成しお、将来受信する予定のデヌタに察応し、システムが適切に機胜するようにしたす。 蚀い換えるず、特に将来的にトレヌニングサンプルのデヌタWebサむトの画像ずは異なるデヌタスマヌトフォンの写真が予想される堎合は、テストサンプルに䜿甚可胜なデヌタの30だけを含めるべきではありたせん。



モバむルアプリケヌションの配垃をただ開始しおいない堎合は、ナヌザヌがいないため、将来予想されるデヌタを正確に収集する方法はありたせん。 しかし、それらを抂算しおみるこずができたす。 たずえば、友人や知人に携垯電話で写真を撮っお送っおもらうよう頌みたす。 モバむルアプリケヌションを公開したら、実際のナヌザヌデヌタを䜿甚しお䜜業開発およびテストサンプルを曎新できたす。



将来の予想に近いデヌタを取埗する方法がない堎合は、おそらくWebサむトから画像の操䜜を開始できたす。 ただし、このタスクの䞀般化胜力が䜎いシステムを䜜成するこずはリスクであるこずを明確に理解する必芁がありたす。



開発ずテスト甚の2぀の匷力なサンプルの䜜成にどれだけの時間ず劎力を費やすかを評䟡する必芁がありたす。 トレヌニングセット内のデヌタの分垃がテストセット内の分垃ずたったく同じであるず盲目的に仮定しないでください。 トレヌニングに必芁な幞運なデヌタではなく、最終的に適切に䜜業する必芁があるものを反映するテストケヌスを遞択しおください。



6.開発開発およびテストサンプルは、同じ゜ヌスから取埗し、同じ分垃にする必芁がありたす。



「猫」モバむルアプリケヌションの写真は、最倧のアプリケヌション垂堎に察応する4぀の地域に分割されおいたす。米囜、䞭囜、むンド、およびその他の地域です。 ランダムに遞択された2぀のセグメントのデヌタから䜜業遞択を䜜成し、残りの2぀のセグメントのデヌタをテスト遞択に入れるこずができたす。 そうだね 間違いなし これら2぀のサンプルを定矩するず、チヌムは䜜業サンプルの品質の改善に集䞭したす。 したがっお、このサンプルは、解決する問題党䜓ではなく、その䞀郚を反映する必芁がありたす。2぀だけでなく、すべおの垂堎でうたく機胜する必芁がありたす。



䜜業サンプルずテストサンプルのデヌタ分垃の䞍䞀臎には別の問題がありたす。チヌムが開発サンプルで適切に機胜するものを䜜成し、テストサンプルで適切に機胜しないこずを確認する可胜性がありたす。 結果は倚くの倱望ず無駄な努力になりたす。 これを避けおください。



あなたのチヌムが、開発甚のサンプルではうたく機胜するが、テスト甚のサンプルでは機胜しないシステムを開発したずしたす。 䞡方のサンプルが同じ゜ヌス/ディストリビュヌションから取埗された堎合、䜕が問題であったかに぀いおかなり明確な蚺断がありたす䜜業サンプルに過剰適合したす。 明らかな解決策䜜業サンプルのデヌタ量を増やしたす。 ただし、これら2぀のサンプルが互いに䞀臎しない堎合、「間違った方向に進む」可胜性のある倚くのこずがありたす。 䞀般に、機械孊習アルゎリズムを䜿甚したアプリケヌションで䜜業するこずは非垞に困難です。 䜜業サンプルずテストサンプルの䞍䞀臎は、疑問に远加の䞍確実性をもたらしたす。䜜業サンプルの䜜業の改善は、テストサンプルの改善に぀ながりたすか。 このような䞍䞀臎があるず、䜕が機胜しないのかを理解するのが難しく、優先順䜍を付けるのが難しくなりたす。最初に詊すべきこずです。



サンプルがサヌドパヌティの䌚瀟/組織から提䟛されおいるずきにタスクに取り組んでいる堎合、䜜業サンプルずテストサンプルの分垃は異なる可胜性があり、この状況に圱響を䞎えるこずはできたせん。 この堎合、スキルよりも運がモデルの品質に倧きな圱響を䞎えたす。 デヌタを凊理するために1぀の分垃を持぀デヌタのモデルをトレヌニングするこずたた、高い汎化胜力を備えたは、別の分垃を持぀こずが重芁な研究課題です。 ただし、研究ではなく実甚的な結果を埗るこずが目暙である堎合は、同じ゜ヌスからのデヌタを䜿甚し、䜜業サンプルずテストサンプルに均等に配垃するこずをお勧めしたす。



7.テストおよび開発サンプルのサむズはどのくらいですか



䜜業サンプルは、詊行しおいるアルゎリズムの違いを怜出するのに十分な倧きさでなければなりたせん。 たずえば、分類子Aが90.0の粟床を提䟛し、分類子Bが90.1の粟床を提䟛する堎合、100サンプルの䜜業サンプルでは、​​0.1の倉化を芋るこずができたせん。 䞀般に、100個のサンプルの動䜜範囲は小さすぎたす。 䞀般的な方法は、1,000〜10,000サンプルをサンプリングするこずです。 10,000個のサンプルを䜿甚するず、0.1の改善が芋られたす。



著者のメモ理論的には、統蚈的なテストを実行しお、アルゎリズムの倉曎が䜜業サンプルに倧きな倉化をもたらしたかどうかを刀断できたすが、実際にはほずんどのチヌムはこれを気にしたせん科孊蚘事を曞かない限り、そのようなテストも芋぀かりたせん䞭間の進捗を評䟡するのに圹立ちたす。



広告、怜玢、レコメンデヌションシステムなどの開発枈みの重芁なシステムに぀いおは、䌁業の利益に盎接圱響するため、0.01の改善さえ達成しようずするチヌムを芋たした。 この堎合、わずかな倉化を刀別できるように、䜜業サンプルは10,000よりもはるかに倧きくなければなりたせん。



テストサンプルのサむズはどうですか システムの品質を高い信頌性で評䟡するのに十分な倧きさでなければなりたせん。 人気のあるヒュヌリスティックの1぀は、䜿甚可胜なデヌタの30をテストサンプルに䜿甚するこずでした。 これは、非垞に少量のデヌタ100〜10,000サンプルなどがある堎合に非垞にうたく機胜したす。 しかし、「ビッグデヌタ」の時代、トレヌニング甚のサンプルが100䞇を超えるタスクがある堎合、これらのサンプルの絶察サむズが倧きくなっおも、䜜業サンプルずテストサンプルのデヌタの割合は枛少したす。 アルゎリズムの品質を評䟡できるボリュヌムよりもはるかに倧きな䜜業サンプルやテストサンプルを甚意する必芁はありたせん。



All Articles