「あなたのために蚘事を読む」ずいう芋出し。 2017幎8月

画像







こんにちは、Habr この問題から、良い䌝統が始たりたす。チャンネル#article_essenceのOpen Data Scienceコミュニティのメンバヌからの科孊蚘事のレビュヌが毎月発行されたす。 誰よりも早くそれらを受け取りたい堎合は、 ODSコミュニティに参加しおください

蚘事は、個人的な興味から、たたは進行䞭のコンテストに近いために遞択されたす。 あなたがあなたの蚘事を提䟛したい堎合、たたはあなたが垌望を持っおいる堎合-コメントを曞くだけで、私たちは将来的にすべおを考慮に入れようずしたす。







今日の蚘事







  1. ノむズにフィットする、たたは䜕もしない垂堎での機械孊習
  2. 翻蚳で孊んだ文脈化された単語ベクトル
  3. AIでアニメキャラクタヌを䜜成したす
  4. LiveMaps地図画像をむンタラクティブな地図に倉換
  5. ランダム消去デヌタの増匷
  6. YellowFinず運動量調敎の芞術
  7. 悪魔はデコヌダヌの䞭にありたす
  8. Generic Data Augmentationを䜿甚した深局孊習の改善
  9. 効率的なニュヌラルネットワヌクの重みず接続の䞡方を孊習する
  10. 密な物䜓怜出のための焊点損倱
  11. 裕犏な宝物を借りる遞択的共同埮調敎によるディヌプトランスファヌ孊習
  12. ディヌプネットワヌクの高速適応のためのモデルにずらわれないメタ孊習


1.ノむズに合わせる、たたは䜕もしない垂堎での機械孊習



オリゞナル蚘事

投皿者kt {at} ut {dot} ee







これは、金融垂堎がディプラヌリングによっお予枬される蚘事のレビュヌです。 投皿の著者以降-ZHDは、 この蚘事および類䌌の蚘事の次の明癜なナンセンスを指摘しおいたす。









2.翻蚳で孊んだ文脈化された単語ベクトル



→ オリゞナル蚘事

→ コヌド

投皿者kt {at} ut {dot} ee







私たちの時代の転勀は暙準的な技術です。 ImageNetラップドッグの品皮で蚓緎されたグリッドを取埗し、錻氎タむプの認識のためにどこかにねじ蟌むこずは、すべおの母芪のディプロプナヌのための暙準プログラムです。 ワヌドプロセッシングのコンテキストでは、通垞、転送の孊習はそれほど深くなく、Word2Vec、GloVeなどの準備されたワヌドベクトルの䜿甚に䟝存したす。







この蚘事の著者は、次のようにテキスト転送の孊習を1レベルだけ深めるこずを提案しおいたす。









さらに、著者はバむアテンションずmaxout明らかに、以前の仕事から積み䞊げられたを䜿甚しお、自明でないモデルを䜜成し、ランダムな埋め蟌み、GloVe、GloVe + CoVe、GloVe + CoVe + CharNGramEmbeddingsをフィヌドする堎合のさたざたなタスクでの動䜜を比范したす。







結果によるず、CoVeを远加するず、裞のGloVeの粟床が玄1向䞊するようです。 効果が小さい堎合もあれば、負の堎合もありたすが、CoVeの代わりにCharNGramをモデルに远加するず、同じかそれ以䞊の効果が埗られたす。 いずれにせよ、GloVe + CoVe + CharNGramsの組み合わせは、他のすべおの方法よりも正確に機胜したす。







画像







私の意芋では、著者は比范されたタむプの埋め蟌みGloVe察CoVeの䞊に枛衰を備えたしっかりず構築されたモデルを台無しにしたずいう事実により、CoVeナヌティリティ効果の枬定は過床にうるさく、あたり説埗力がないこずが刀明したした。 もっず「実隓宀」の枬定が芋たいです。







3. AIを䜿甚しおアニメキャラクタヌを䜜成したす。



→ オリゞナル蚘事

→ りェブサむト

投皿者kt {at} ut {dot} ee







絵図付きのさたざたな日本のゲヌムからアニメキャラクタヌの「プロファむル」を収集するGetchuサむトがありたす。 これらの写真はダりンロヌドできたす。







写真で顔を芋぀けるには、特定のツヌル「lbpcascade animeface」を䜿甚できたす。 したがっお、著者は42kのアニメの顔を受け取り、ペンで修正し、悪い䟋の4を捚おたした。







アニメ写真の「笑顔」、「髪の色」などのプロパティを認識できる、特定の既補のCNNモデルIllustration2Vecがありたす。 著者は、画像のブロックを解陀するためにそれを䜿甚し、それらに関心のある34のタグを遞択したした。







著者はそれをすべおDRAGANに抌し蟌んだKodaliら、通垞のGANずは異なり、著者は明らかに深く、原理に基づいおいない。







䞎えられた属性で写真を生成できるようにするために、著者はACGANの堎合ず同じようにしたす









ゞェネレヌタヌずディスクリミネヌタヌはどちらも、かなり混乱した革呜的なSRResNetですゞェネレヌタヌは16ブロック、ディスクリミネヌタヌは10ブロック。 著者は、「募配ノルムの蚈算に望たしくないミニバッチ内で盞関をもたらすため」、識別噚から識別噚局を削陀したした。 私はこの問題を完党には理解しおいたせんでしたが、誰かに突然明らかになるかどうかを説明しおください。







すべおが0.0002から開始しおlrを枛らしおAdamによっおトレヌニングされたしたが、どのくらいの期間かはあたり明確ではありたせん。

webappの堎合、䜜成者はWebDNN https://github.com/mil-tokyo/webdnn でネットワヌクを倉換したため、クラむアントのブラりザヌですべおの画像を盎接生成したす。







4. LiveMaps地図画像をむンタラクティブな地図に倉換



→ オリゞナル蚘事

→蚘事-Best Short Paper Awart SIGIR 2017の受賞者

投皿者 zevsone







地図画像を分析し、関連するビュヌポヌトを抜出するための、根本的に新しいシステムLiveMapsが提案されおいたす。







このシステムでは、怜玢゚ンゞンを䜿甚しお取埗した画像に泚釈を付けるこずができ、ナヌザヌはリンクをたどっお、芋぀かった画像に察応する堎所の䞭心にあるむンタラクティブマップを開きたす。







LiveMapsはいく぀かの方法で機胜したす。 最初に、画像が地図かどうかを確認したす。

「はい」の堎合、システムはこの画像の䜍眮情報を特定しようずしたす。 堎所を特定するために、画像から抜出されたテキストおよび芖芚情報が䜿甚されたす。 その結果、システムは、画像に察しお蚈算された地理的領域を衚瀺するむンタラクティブなマップを䜜成したす。







䞊䜍の䜍眮デヌタセットの評䟡結果は、システムが良奜なカバレッゞを達成しながら、非垞に正確なむンタラクティブマップを構築できるこずを瀺しおいたす。







PSこのような由緒ある䌚議でベストショヌトペヌパヌ賞を受賞するこずは期埅しおいたせんでした今幎の競争盞手の121ショヌトペヌパヌ、すべおの業界の巚人。







5.ランダム消去デヌタの増匷



→ オリゞナル蚘事

egor.v.panfilov {at} gmail {dot} comが投皿







この蚘事は、画像増匷の最も単玔な方法の1぀であるランダム消去ロシア語ではランダムな長方圢の描画の研究に専念しおいたす。







拡匵は、4぀のパラメヌタヌでパラメヌタヌ化されたしたP_prob各画像にバッチを適甚する確率、P_area領域サむズ面積比、P_aspect領域アスペクト比、P_value倀で満たされたImageNetのランダム/平均0/255。







画像







著者は、この増匷方法が3぀のタスクに䞎える圱響を評䟡したしたAオブゞェクトの分類、Bオブゞェクトの怜出、©個人の再識別。







A AlexNetからResNeXtで終わる6぀のアヌキテクチャが䜿甚されたした。 デヌタセット-CIFAR10 / 100。 最適なパラメヌタヌ倀は次のずおりです。P_prob= 0.5、P_aspect =広い範囲ですが、できれば1正方圢ではなく、P_area = 0.02-0.4画像の2-40、P_value = ImageNetでランダムたたは平均、0および255の堎合、結果は著しく悪化したす。 たた、拡匵ランダムクロッピング、ランダムフリッピングおよび正則化ドロップアりト、ランダムノむズを他の方法ず比范したした効率を䜎䞋させるために、すべお、ランダムクロッピング、ランダムフリッピング、ランダム消去です。 このメ゜ッドは「チップ」を実行したす。 䞀般に、この方法は最も匷力ではありたせんが、最適なパラメヌタヌを䜿甚するず、1の粟床が安定しお埗られたす5.5-> 4.5。 たた、重耇するオブゞェクトに察する分類噚の堅牢性が向䞊するず曞いおいたすyou-dont-say。







B PASCAL VOC 2007 + 2012でFast-RCNNを䜿甚したした。 3぀のスキヌムを実装したしたIREむメヌゞ察応のランダム消去、盲目的にれロ化する領域も遞択したす、OREオブゞェクト察応、バりンディングボックスの䞀郚のみをれロ化、I + ORE䞡方 これらの方法の間にmAPに倧きな違いはありたせん。 玔粋なFast-RCNNず比范するず、玄5VOC07で67-> 71、VOC07 ​​+ 12で70-> 75、 A-Fast-RCNNず同じ量になりたす。 最適なパラメヌタヌは、P_prob = 0.5、P_area = 0.02-0.22-20、P_aspect = 0.3-3.33暪たわっおいる状態から立っおいる状態たでです。







C Market-1501 / DukeMTMC-reID / CUHK03でID-discim.EmbeddingIDE、Triplet Net、SVD-NetすべおResNetに基づいおおり、ImageNetで事前にトレヌニング枈みを䜿甚したした。 すべおのモデルおよびデヌタセットで、ランク1で少なくずも2最倧8、mAPで少なくずも3最倧8が安定しお増加したす。 パラメヌタヌはBず同じです。







䞀般に、この方法は単玔ですが、研究ず蚘事は非垞に簡朔で詳现10ペヌゞであり、倚数のグラフず衚がありたす。 䞭囜人に満足しお、䜕も蚀えたせん。







6. YellowFinず運動量調敎の芞術



→ オリゞナル蚘事

→ 運動量に関する远加資料

投皿者 Arech







ずっず前に読んだので、非垞に非垞に衚面的です。䞀次元の厳密に凞の二次関数の目的で、叀兞的な運動量Boris Polyakの運動量を思慮深く喫煙した埌、孊習率ず運動量係数を぀なぐ䞍平等そのため、特定の「堅牢な」領域に分類され、SGDアルゎリズムの最速の収束が保蚌されたす。 そしお、このステヌトメントは、少なくずもいく぀かの局所領域で、いく぀かの非凞関数に察しお原理的に䜕らかの圢で満たすこずができるこずが瀺されたした。これは、二次近䌌で倚少近䌌できたす。 次に、以前の募配倉化の履歎の知識に基づいお、䞍等匏に必芁な誀差関数の衚面特性募配分散、䞀郚の「䞀般化された」衚面曲率、および珟圚の点の2次近䌌の極小倀たでの距離を近䌌するチュヌナヌYellowFinをガッシュするこずにしたした。これらの近䌌のうち、SGDで䜿甚する孊習率ず運動量の適切な倀が埗られたす。







たた、ネットワヌクの非同期分散トレヌニングの問題を研究した男は、そのような方法の䞀般化閉ルヌプYellowFinを提案したした。これは、そのような条件での実際の勢いが蚈画よりも倧きいこずを考慮しおいたす。







それぞれCIFAR10および100で畳み蟌み110局および164å±€ResNetをテストし、PTB、TSおよびWSJで䞀郚のLSTMをテストしたした。 結果は興味深いAdamに比べおx1.18からx2.8の加速が、い぀ものように、実隓をセットアップするための質問がありたす-競合他瀟の係数の倧たかな遞択、+ emnip、各アヌキテクチャで1回の実行、+トレヌニングセットの結果のみが衚瀺されたす...芁するに、䞀番䞋に到達するものがありたす...







このようなこずを願っおいたす







私はそれを自分のlibinにカットするこずを考えおいたしたが、自己正芏化ニュヌラルネットワヌクSELU + AlphaDropoutに固執したした。これは少し前に取り組んでいたため、私の手に届くたで非垞に有甚でした。 私は、Lesagneのスレッド https://github.com/Lasagne/Lasagne/issues/856-結果の再珟に問題がある人をフォロヌしおいたす。䞀般に、結果の再珟に関する詳现情報が埗られるこずを期埅しおいたす。 だから誰かが詊しおみたら-chocakを共有しおください。







7.悪魔はデコヌダヌの䞭にありたす



→ オリゞナル蚘事

投皿者 ternaus







問題は、デコヌダヌが存圚するさたざたなアヌキテクチャにずっお、どのUpSamplingが優れおいるか、特にセグメンテヌション問題、超解像、色付け、深床、境界怜出で小数第5䜍を争う倚くの人の頭を悩たすこずです。







GoogleずUCLのメンバヌは混乱し、経隓的に、誰が優れおいるかを確認し、このロゞックを芋぀けるこずにした蚘事を曞きたした。







チェック枈み-違いがあるこずが刀明したしたが、ロゞックはあたり芋えたせん。







セグメンテヌションの堎合







[1]転眮倉換=アップサンプリング+倉換であり、誰もがUnetの芏範で激しく䜿甚しおいたす。

[2]スキップされた接続のキャスト、぀たり、SegNet => Unet倉換は、コンクリヌトのキャストを匷化したす。 これは盎感的ですが、ここには数字がありたす。

[3]トランスポヌズされたSeparable Transposedのように芋えたすが、セグメンテヌションのオプションが少ない方がうたく機胜したす。 #proj_carsの人々にこれをチェックしおほしい。

[4]セグメンテヌションに関する圌らが提案した独創的な双線圢加法アップサンプリングは、おおむね[3]のように機胜したす。 しかし、これは#proj_cars checkからチヌムにも向けられおいたす

[5]それらは理論的には䜕かを远加する可胜性のある残りの接続をどこかに投げたすが、正確にはあたり明確ではなく、非垞に䞍確実で垞にではない远加したす。







セグメンテヌションタスクの堎合、resnet 50をベヌスずしお䜿甚し、䞊からデコヌダヌを远加したす。







むンスタンス境界怜出の問題に぀いおは、マヌクアップアルゎリズムのオヌバヌフィットが少なく、より倚くの数倀が埗られるメトリックを遞択するこずにしたした。

぀たりDuring the evaluation, predicted contour pixels within three from ground truth pixels are assumed to be correct



。 これにより、すべおのピクセルが重芁なタスクにすべおがどのように転送されるかずいう疑問がすぐに生じたす。 ここでは、1ピクセルの厚さのフェンスを芋぀けるためのKostinのサテラむトトリックず、人々が車の問題で囜境で+ -1ピクセルのために戊っおいる方法を思い出したす







[6]トレヌニングするすべおのネットワヌクで、スケヌルは0.0002のオヌダヌのL2正則化を䜿甚したす

Karpatyは、以前より安定した収束のためにこれを垞に行うず蚀っおいたようです。 私はこれを詊しおみる必芁がありたす、誰かがこれを行い、それが目立った䜕かを䞎えるなら、スレッドでそれに぀いお話すのがいいでしょう







芁玄

[1]誰が、い぀、より良い質問をしたが、答えなかった。

[2]圌らは、アップサンプリングを行う別の方法を提案したした。これは他の方法ず同じように機胜したす。

[3]圌らは、スキップされた接続が確実に圹立぀こず、そしお月の䜍盞に応じお残留するこずを確認したした。







GridProが#proj_carsで蚀うこずを1か月埅っおいたす。







8. Generic Data Augmentationを䜿甚した深局孊習の改善



→ オリゞナル蚘事

egor.v.panfilov {at} gmail {dot} comが投皿







゚ピグラフ䞭囜の栄冠は、黒倧陞でも誰にでも出没したす。 圌らはただ良いコンピュヌタヌを提䟛しおいないのは事実ですが、テルナりスは私に「それで続けたす」ず曞くように呜じたした。







著者は、画像分類問題に関する画像増匷方法のベンチマヌクを実斜し、さたざたなケヌスでの䜿甚に関する掚奚事項を開発しようずしたした。 最初の近䌌では、これらのメ゜ッドは2぀のカテゎリに分類されたすGeneric䞀般的に適甚可胜およびComplexドメむン情報/生成を䜿甚。 この蚘事はゞェネリックのみを察象ずしおいたす。







この蚘事のすべおの実隓は、ZFNetバニラZFNetの最適なトレヌニング方法に関する蚘事の有益な郚分の半分を䜿甚しお、Caltech-101クラス101、9144画像で行われたした。 DL4jを䜿甚しお30の時代を教えたした。 考慮される増匷方法1増匷なし、2-4幟䜕孊的氎平反転、回転-30床および+ 30床、トリミング4コヌナヌトリミング、5-7フォトメトリック色のゆらぎ、゚ッゞ匷調Sobelフィルタヌの結果を画像に远加、PCAを空想画像の䞻成分を匷化。







結果ベヌスラむンに察しおtop1 / top548.1/ 64.5aフリッピングは+ 1/2を䞎えるが、粟床の広がりを増加させる、b回転は+ 2を䞎える、cトリミングは+ 14を䞎える、 dカラヌゞッタヌ+ 1.5 / 2.5 、de゚ッゞ匷調および+ 1/2の掟手なPCA。 すなわち 幟䜕孊的な方法の䞭ではトリミングが先にあり、枬光的な方法の䞭には色のゞッタヌがありたす。 結論ずしお、䜜者は、トリミングの増匷䞭の粟床の倧幅な改善は、デヌタセットが元の4倍であるずいう事実による可胜性があるず曞いおいたすバランスは運呜ではありたせん。 ポゞティブから-圌らはモデルの粟床を評䟡するずき、5倍の亀差怜蚌を忘れたせんでした。 なぜこれらの増匷方法特に人気のあるものを含むの䞭から具䜓的に遞ばれたのか、次の蚘事で明らかになりたす。







9.効率的なニュヌラルネットワヌクの重みず接続の䞡方を孊習する



→ オリゞナル蚘事

egor.v.panfilov {at} gmail {dot} comが投皿







この蚘事では、最新のDNNアヌキテクチャ特にCNNによるリ゜ヌス消費の問題を考慮しおいたす。 䞻な問題は、動的メモリぞのアクセスです。 たずえば、20 Hzで10億の接続がある干枉ネットワヌクは、玄13 Wを消費したす。







著者は、アクティブなニュヌロンずネットワヌク接続の数を枛らすための剪定方法を提案しおいたす。 1完党なデヌタセットでネットワヌクをトレヌニングし、2特定のレベル以䞋の重みで通信をマスクし、3完党なデヌタセットで残りの接続を再トレヌニングしたす。 アグレッシブ1぀のアプロヌチの堎合プルヌニングの結果はわずかに悪いたずえば、ImageNet䞊のAlexNetの堎合、5倍察9倍ため、ステップ2および3を数回繰り返すこずができたす。 トリック重みのL2正芏化を䜿甚しお、再トレヌニング䞭のドロップアりトを枛らし、孊習率を䜎䞋させ、CONVレむダヌずFCレむダヌを別々にドリルしお再トレヌニングし、ステップ2の結果に埓っおデッド非接続ニュヌロンを砎棄したす







実隓は、MnetistのLenet-300-100、Lenet-5ネットワヌク、AlexNet、ImageNetのVGG-16を䜿甚しおCaffeで実行されたした。 MNISTりェむトずFLOPの数を12倍 に枛らし、プルヌニングがアテンションメカニズムの特性を瀺しおいるこずも発芋したした゚ッゞでさらにカットしたす。 ImageNetで AlexNetは75時間トレヌニングし、173時間再トレヌニングし、VGG-16は5回ロヌルアップしお再トレヌニングしたした。 重量では、FLOP'am でそれぞれ9回ず13回、 3.3回ず5回絞るこずができたした。 興味深いプロファむルは、リンクがどのようにロヌルされるかです最初のCONVレむダヌは2回未満に圧瞮され、次のCONVレむダヌは3以䞊最倧12、非衚瀺FCは10-20回、最埌のFCレむダヌは4回です。







結論ずしお、著者はさたざたなプルヌニング方法の比范結果を提瀺したすL1、L2正芏化、远加トレヌニングあり、なし、CONVに応じお、FCに応じお。 芁するに、ドリルするには怠すぎるので、L1でネットワヌクを孊習し、レむダヌの半分を単玔に捚おるこずができたす。 怠notでない堎合-L2のみ、プルヌニングず再トレヌニングを5回たで繰り返したす。 そしお最埌に、著者ずずもにスケヌルをたばらな圢で保存するず、オヌバヌヘッドが最倧16になりたす。ネットワヌクが10倍小さい堎合はそれほど重芁ではありたせん。

画像







10.高密床オブゞェクト怜出の焊点損倱



→ オリゞナル蚘事

投皿者kt {at} ut {dot} ee







ご存知のように、機械孊習でモデルを怜玢するプロセスは、特定の客芳的損倱関数の最適化に䟝存したす。 最も単玔な損倱関数は、トレヌニングセットの゚ラヌの割合ですが、最適化が難しく、結果が統蚈的に悪いため、実際には異なる代理損倱を䜿甚したす゚ラヌ平方、確率察数、マむナス速床からの指数、ヒンゞ損倱など。 すべおの代理損倱は単調な関数であり、゚ラヌ倀が倧きくなるほど゚ラヌにペナルティを課したす。 損倱は​​、タヌゲット倉数の分垃のタむプずしお解釈できたすたずえば、誀差の2乗はガりス分垃に察応したす。







䜜品の著者は、フォヌムの代理損倱







損倱p、y=-1-p^ガンマログpy == 1の堎合-p ^ガンマログ 1-p







䜿甚および公開されたこずはありたせん。 なぜ私たちはそのような損倱だけを䜿甚する必芁がありたすかそしお暗黙の分垃の意味は䜕ですか著者は知りたせんが、それは圌らにずっおクヌルなようです 䜙分なパラメヌタガンマがあり、その助けを借りお、「簡単」な䟋のように眰金の量を倉えるこずができたす。 著者は、この機胜を「焊点損倱」ず呌びたした。







著者は、1぀のデヌタセットず1぀のニュヌラルネットワヌクモデルを遞択したしたが、パラメヌタヌ倀を調敎するず、通垞のクロス゚ントロピヌクラスによっお重み付けされたの代わりにこのような損倱を䜿甚した堎合のプラスの効果が結果タブに衚瀺されたす。 実際、ほずんどの蚘事では、オブゞェクト怜出にRetinaNetを䜿甚するこずを怜蚎しおいたすが、これは損倱関数の遞択にあたり䟝存しおいたせん。







この蚘事は、すべおの初心者がアカデミヌぞの道を読むために必芁です。 圌女は頭の䞭に良いアむデアがないずきに説埗力のある出版物を曞く方法を完璧に説明したす。







代替意芋

あなたの手を芋おください男は怜出で枬定される暙準のかなり耇雑なデヌタセットのいずれかを取り、ベルやホむッスル他の誰もができる限り絞り出そうずしたもののない単玔なネットワヌクを取り、損倱を適甚しおすぐにマルチスケヌルなしの単䞀モデルの結果を埗たした他のトリックは、このデヌタセットの他のすべおのものよりも高く、1段階のすべおのネットワヌクず、より高床な2段階のネットワヌクが含たれたす。 それが損倱の問題であり、他の䜕かではないこずを確認するために、圌らは以前にクヌルでファッショナブルなテクニックであった他のオプションを詊したした-クロス゚ントロピヌ、OHEMのバランスを取り、結果を独自に安定しお高くしたした。 私たちは自分のパラメヌタヌをひねり、最適に機胜するオプションを芋぀け、さらにその理由を少し説明しようずしたした2未満のガンマはかなり滑らかな分垃を䞎え、2぀以䞊の眰金は非垞に鋭くなりたす2぀でも実際には棚がある堎合、それは驚くべきこずです䜜品。







もちろん、40のネットワヌクオプション、100䞇のハむパヌパラメヌタヌオプション、既知のすべおのデヌタセット、10倍のクロス怜蚌を10回比范するこずもできたすが、どれだけ時間がかかり、い぀出版の準備ができ、いく぀が異なるのかアむデアの







ここではすべおが簡単です。1぀のコンポヌネントを倉曎し、特定のデヌタセットでSoTAよりも優れた結果を埗たした。 結果は他の䜕かではなく、倉化によっお匕き起こされたず確信したした。 フィン。







代替意芋

おそらく、蚘事がRetinaNetプレれンテヌションずしお䜍眮付けられた堎合、私の意芋では、たったく異なる方法で衚瀺されるこずを远加する䟡倀がありたす。 結局のずころ、実際には䞻にRetinaNetの䜿甚䟋ずしお構築されおいたす。 なぜそれが突然損倱ず奇劙なタむトルに重点を眮いおいるのか、私は個人的に理解しおいたせん。 この損倱に぀いお衚明された論文を確認する客芳的な枬定倀はただありたせん。







たぶん、たずえば、RetinaNetはより深刻な圢匏で、著者の順序を倉えお公開される予定であり、これはサヌドパヌティの実隓の結果であり、孊生がうたく働いたため远加の出版物ずしお発行するこずも決定したした。 この堎合も、これは䜙分な物品を薄い空気から吞い出す方法の䟋です。







いずれにせよ、私自身、この蚘事から抜け出すこずはできたせん。タむトルずテキストで玄束されおいる「どこでもこのような損倱をひねれば、あなたは幞せになりたす」。







論文「RetinaNetはCOCOでうたく機胜したすさらに損倱がありたす」しかし、私は我慢できたす。







11.富から宝物を借りる遞択的共同埮調敎によるディヌプトランスファヌ孊習



→ オリゞナル蚘事

→ コヌド

投皿者 movchan74







画像







著者は、小さなデヌタセットで画像を分類する問題に焊点を合わせたした。 この堎合の兞型的なアプロヌチは次のずおりです。ImageNetで事前にトレヌニングされたCNNを取埗し、デヌタセットで再トレヌニングしたすたたは、完党に接続された分類のみを再トレヌニングしたす。 しかし同時に、ネットワヌクはすぐに再トレヌニングされ、垌望する粟床倀に達したせん。 著者は、タヌゲットデヌタセットタヌゲットデヌタセット、十分なデヌタではないため、以䞋のデヌタセットTず呌びたすだけでなく、倚数の画像通垞はImageNetを含む远加の゜ヌスデヌタセット以䞋、Sデヌタセットず呌びたすを䜿甚しお2぀のデヌタセットでマルチタスクをトレヌニングするこずを提案したす同時にデヌタセットごずに1぀ず぀、CNNの埌に2぀のヘッドを行いたす。







しかし、著者がわかったように、トレヌニングにSデヌタセット党䜓を䜿甚するのは良い考えではありたせんが、Sデヌタセットの特定のサブセットを䜿甚する方が適切です。







次のフレヌムワヌクを取埗したす。







  1. SずTの2぀のデヌタセットを䜿甚したす。Tは少数の䟋を含むデヌタセットであり、分類噚を取埗する必芁がありたす。Sは倧きな補助デヌタセット通垞ImageNetです。
  2. サブセットの画像がタヌゲットデヌタセットTの画像に近くなるように、デヌタセットSから画像のサブセットを遞択したす。最も近いものを遞択する方法を考えおみたしょう。
  3. デヌタセットTず遞択されたサブセットSのマルチタスクネットワヌクを孊習したす。


デヌタセットSのサブセットを遞択する方法を怜蚎しおみたしょう。著者は、デヌタセットTから各サンプルを提案し、Sから特定の数の近傍を芋぀け、それらからのみ孊習したす。 近接性は、䜎レベルのAlexNetフィルタヌたたはGaborフィルタヌのヒストグラム間の距離ずしお定矩されたす。 空間コンポヌネントを考慮しないように、ヒストグラムが取埗されたす。







䜎レベルフィルタが䜿甚される理由の説明は次のずおりです。







  1. デヌタが倚いため、䜎レベルの畳み蟌み局をトレヌニングする方が良いこずがわかり、これらの䜎レベルフィヌチャの品質によっお、高レベルのフィヌチャの品質が決たりたす。
  2. 䜎レベルフィルタヌを䜿甚しお同様の画像を怜玢するず、トレヌニング甚のサンプルをより倚く芋぀けるこずができたす。 セマンティクスはほずんど考慮されたせん。

    正盎に蚀うず、私はこれらの説明はあたり奜きではありたせんが、そのような蚘事では。 もちろん、私は䜕かを理解しおいなかったか、たたは理解しおいないかもしれたせん。 これはすべお、「䜎レベルの特性に応じお画像を遞択する動機は2぀ありたす」ずいう蚀葉の埌に2ペヌゞで説明されおいたす。


近い画像の怜玢のその他の機胜







  1. ヒストグラムは、平均しお、デヌタセット党䜓でほが同じ量が1぀のビンに入るように構築されたす。
  2. ヒストグラム間の距離は、KL発散を䜿甚しお蚈算されたす。


著者は、AlexNetずGaborフィルタヌのさたざたな畳み蟌み局を詊し、近いサンプルを怜玢したした。AlexNetの1 + 2の畳み蟌み局を䜿甚するず最適に機胜したした。







著者は、Tの各サンプルのデヌタセットSから類䌌のサンプルの数を遞択する反埩的な方法も提案したした。最初に、Tから個々のサンプルごずに指定された数の最近傍を取埗したす。次に、トレヌニングを実行し、サンプルの誀差が倧きい堎合、この最近傍の数を増やしたすサンプル。 最も近い近傍がどのように拡倧されるかは、匏6から明らかです。







トレヌニングの特城の。 バッチを䜜成するずき、Tデヌタセットからサンプルをランダムに遞択し、遞択した各サンプルに぀いお、最も近い隣の1぀を取埗したす。







以䞋のデヌタセットで実隓が行われたしたStanford Dogs 120、Oxford Flowers 102、Caltech 256、MIT Indoor67。SOTAの結果はすべおのデヌタセットで埗られたした。 デヌタセットに応じお、分類粟床を2から10に䞊げるこずが刀明したした。







12.ディヌプネットワヌクの高速適応のためのモデルに䟝存しないメタ孊習



→ オリゞナル蚘事

→ コヌド

投皿者repyevsky {at} gmail {dot} com

メタトレヌニングに関する蚘事著者は、特定の䞀般クラスからの新しいタスクを解決するために、以前の経隓ず少量の新しい情報を組み合わせおモデルに教えるこずを望んでいたす。







著者が達成したいこずを明確にするために、モデルの評䟡方法を説明したす。







分類のベンチマヌクずしお、2぀のデヌタセット OmniglotずminiImagenetが䜿甚されたす。 最初に、いく぀かのアルファベットからの手曞き文字は合蚈で玄1600クラスで、クラスごずに20の䟋がありたす。 Imagenetの 2番目の100クラス-クラスごずに600枚の写真。 RLに関するセクションもありたすが、私は芋おいたせん。







トレヌニングの前に、すべおのクラスは互いに玠なセットtrain



、 validation



およびtest



分けられたす。 怜蚌のために、たずえば、 test



クラストレヌニング䞭にモデルに衚瀺されなかったから、5぀のランダムクラス 5-way learning が遞択されたす。 遞択されたクラスのそれぞれに぀いお、いく぀かの䟋がサンプリングされ、ラベルは長さ5のワンホットベクトルによっお゚ンコヌドされたす。各クラスのさらなる䟋は、 A



ずB



2぀の郚分に分割されたすB



A



䟋は回答のあるモデルを瀺し、 B



䟋は分類の正確性を怜蚌するために䜿甚されたす。 したがっお、 タスクが圢成されたす。 著者はaccuracy



芋accuracy



。







したがっお、数回の反埩/新しい䟋で、新しいタスククラスの新しいセットに適応するようにモデルを教える必芁がありたす。







テストでRNNたたはノンパラメトリックメ゜ッドを䜿甚した機胜埋め蟌みk最近傍などを䜿甚しようずした以前の䜜品ずは異なり、著者は、募配モデルによっおトレヌニングされおいる堎合、暙準モデルのパラメヌタヌを構成できるアプロヌチを提案しおいたす。







重芁なアむデア新しいタスクで最良の結果が埗られるようにモデルの重みを曎新する。







盎感モデル内で、デヌタセットのすべおのクラスの入力デヌタの普遍的な衚珟を取埗したす。これにより、モデルは新しいタスクにすばやく適応できたす。







䞀番䞋の行は次のずおりです。 モデルF(x, p)



に1回の反埩で新しいタスクF(x, p)



孊習させたす 1ショット å­Šç¿’ 。 次に、トレヌニングのために、テストず同じタスクをトレヌニングクラスから準備する必芁がありたす。 さらに、パヌトA



の䟋では、 loss



ずその募配を考慮し、トレヌニングを1回繰り返したす。その結果、䞭間の曎新された重みp' = p - a*grad



ずモデルの新しいバヌゞョンF(x, p')



を取埗したす。 B



F(x, p')



のloss



を考慮し、初期重みp



に関しおそれを最小化したす。 実際の新しい重み、぀たり反埩の終わりを取埗したす。 募配からの募配xxibitがカりントされるず、2次導関数が衚瀺されたす。







実際、耇数のタスクが䞀床に生成され、メタバッチに統合されたす。 それぞれに察しお、独自のp'



あり、独自のloss



が考慮されたす。 次に、これらのtotal_loss



はすべおtotal_loss



で合蚈されtotal_loss



。これは、 p



に関しおすでに最小化されおいたす。







著者は、以前の䜜品小さな畳み蟌みネットワヌクず完党に接続されたネットワヌクの基本モデルにアプロヌチを適甚し、䞡方のデヌタセットでSOTAを受け取りたした。







同時に、メタトレヌニング甚の远加パラメヌタヌなしで最終モデルが取埗されたす。 ただし、2次導関数を含むなど、倚数の蚈算が䜿甚されたす。 著者は、 miniImagenetに 2番目の掟生物をドロップしようずしたした 。 同時に、 accuracy



はほが同じたたで、蚈算は33加速したした。 おそらくこれは、 ReLU



が区分線圢関数であり、その2次導関数がほずんど垞にれロであるずいう事実によるものです。







Tensorflow䜜成者コヌド 。 そこでは、内郚募配ステップは手動で行われ、倖郚募配ステップはAdamOptimizerを䜿甚しお行われたす。







yuli_semenovaを線集しおいただきありがずうございたす。








All Articles