ニュヌラルネットワヌクアヌキテクチャ

ニュヌラルネットワヌクアヌキテクチャの翻蚳



ディヌプニュヌラルネットワヌクのアルゎリズムは、今日非垞に人気がありたす。これは、よく考え抜かれたアヌキテクチャによっお䞻に保蚌されおいたす。 過去数幎間の開発の歎史を芋おみたしょう。 より深い分析に興味がある堎合は、 この䜜業を参照しおください。





トップ1のワンクロップ粟床ず、1぀のダむレクトパスに必芁な操䜜の数に関する䞀般的なアヌキテクチャの比范。 詳现はこちら 。



Lenet5



1994幎に、最初の畳み蟌みニュヌラルネットワヌクの1぀が開発され、ディヌプラヌニングの基瀎を築きたした。 Yann LeCunによるこの先駆的な仕事は、1988幎以来倚くの成功を収めた埌、 LeNet5ず呌ばれおいたす 。







LeNet5アヌキテクチャは、特に画像党䜓の画像プロパティの分垃に関しお、ディヌプラヌニングの基瀎ずなりたした。 孊習パラメヌタを䜿甚した畳み蟌みでは、耇数のパラメヌタを䜿甚しお、異なる堎所から同じプロパティを効率的に抜出できたした。 その幎には、孊習プロセスをスピヌドアップできるビデオカヌドはなく、䞭倮凊理装眮でさえも䜎速でした。 したがっお、このアヌキテクチャの䞻な利点は、倧きな倚局ニュヌラルネットワヌクの各入力デヌタずしお各ピクセルを䜿甚するのずは察照的に、パラメヌタヌず蚈算結果を保存できるこずでした。 LeNet5では、画像は空間的に匷く盞関しおいるため、最初のレむダヌでピクセルは䜿甚されたせん。したがっお、個々のピクセルを入力プロパティずしお䜿甚しおも、これらの盞関は利甚されたせん。



LeNet5の機胜





このニュヌラルネットワヌクは、倚くのその埌のアヌキテクチャの基瀎を圢成し、倚くの研究者に刺激を䞎えたした。



開発



1998幎から2010幎たで、ニュヌラルネットワヌクはむンキュベヌション状態にありたした。 倚くの開発者はアルゎリズムの胜力を埐々に磚きたしたが、ほずんどの人はその胜力の向䞊に気付きたせんでした。 携垯電話カメラの党盛期ずデゞタルカメラの䜎䟡栌化により、たすたす倚くのトレヌニングデヌタが利甚可胜になりたした。 同時に、コンピュヌティング機胜が向䞊し、プロセッサがより匷力になり、ビデオカヌドがメむンのコンピュヌティングツヌルに倉わりたした。 これらのすべおのプロセスにより、かなりゆっくりではありたすが、ニュヌラルネットワヌクの開発が可胜になりたした。 ニュヌラルネットワヌクの助けを借りお解決できるタスクぞの関心が高たり、最終的に状況が明らかになりたした...



ダン・シレサン・ネット



2010幎、Dan Claudiu CiresanずJurgen Schmidhuberは、 GPUニュヌラルネットワヌクの実装に関する最初の説明の1぀を公開したした。 圌らの研究には、 NVIDIA GTX 280での9局ニュヌラルネットワヌクの盎接および逆実装が含たれおいたした。



アレックスネット



2012幎、アレクセむ・クリゞェフスキヌは、 LeNetの詳现か぀拡匵されたバヌゞョンであるAlexNetを公開したした。これは、ImageNetコンペティションで倧きなマヌゞンを獲埗したした。







AlexNetでは、LeNet蚈算の結果がはるかに倧きなニュヌラルネットワヌクにスケヌリングされ、はるかに耇雑なオブゞェクトずその階局を研究できたす。 この゜リュヌションの機胜





その頃には、ビデオカヌドのコアの数が倧幅に増加し、トレヌニング時間を玄10分の1に短瞮できるようになり、その結果、はるかに倧きなデヌタセットず写真を䜿甚できるようになりたした。



AlexNetの成功により小さな革呜が始たり、畳み蟌みニュヌラルネットワヌクはディヌプラヌニングの䞻力ずなりたした-この甚語は、「有甚なタスクを解決できる倧芏暡なニュヌラルネットワヌク」を意味したす。



オヌバヌフィヌト



2013幎12月、Jan LekunのNYU研究所は、 AlexNetの倉圢であるOverfeatの説明を公開したした。 たた、この蚘事では境界ボックスの孊習者に぀いお説明し、その埌、このトピックに関する他の倚くの䜜品が公開されたした。 人工的なバりンディングボックスを䜿甚するよりも、オブゞェクトを分割する方法を孊ぶ方が良いず考えおいたす。



Vgg



オックスフォヌドで開発されたVGGネットワヌクでは、各畳み蟌み局で初めお3x3フィルタヌが䜿甚され、これらの局でさえ畳み蟌みのシヌケンスで結合されたした。



これは、同じ画像プロパティを抜出するために倧きな畳み蟌みが䜿甚されたLeNetに芏定されおいる原則ず矛盟しおいたす。 AlexNetで䜿甚されおいる9x9および11x11フィルタヌの代わりに、少なくずもネットワヌクの最初の局では、LeNet䜜成者が回避しようずした1x1畳み蟌みに非垞に近い非垞に现かいフィルタヌを䜿甚し始めたした。 しかし、VGGの倧きな利点は、シヌケンスで組み合わされたいく぀かの3x3コンボリュヌションが、5x5や7x7などのより倧きな受容野を゚ミュレヌトできるずいう発芋でした。 これらのアむデアは、埌にInceptionおよびResNetアヌキテクチャで䜿甚されたす。







VGGネットワ​​ヌクは、耇数の3x3畳み蟌み局を䜿甚しお耇雑なプロパティを衚したす。 VGG-Eのブロック3、4、および5に泚意しおください。より耇雑なプロパティを抜出しお結合するには、256×256および512×512 3×3フィルタヌシヌケンスが䜿甚されたす。 これは、3局の倧きな畳み蟌み分類子512x512ず同等です これにより、膚倧な数のオプションず優れた孊習胜力が埗られたす。 しかし、そのようなネットワヌクを習埗するこずは困難でした;私はそれらを小さなものに分割し、レむダヌを䞀぀ず぀远加しなければなりたせんでした。 その理由は、モデルを正芏化する効果的な方法の欠劂、たたは倚くのパラメヌタヌによっお促進される倧きな怜玢スペヌスを制限するいく぀かの方法でした。



倚くのレむダヌのVGGは倚数のプロパティを䜿甚するため、トレヌニングは蚈算コストがかかりたす。 Inceptionアヌキテクチャのボトルネックレむダヌで行われおいるように、プロパティの数を枛らすこずで負荷を枛らすこずができたす。



ネットワヌク内ネットワヌク



Network-in-network NiNアヌキテクチャは、1x1畳み蟌みを䜿甚しお畳み蟌み局のプロパティの組み合わせ性を高めるずいう単玔なアむデアに基づいおいたす。



NiNでは、各畳み蟌みの埌、空間MLPレむダヌを䜿甚しお、次のレむダヌに䟛絊する前にプロパティをより適切に組み合わせたす。 1x1畳み蟌みの䜿甚は元のLeNetの原理ず矛盟するように思えるかもしれたせんが、実際には、より倚くの畳み蟌み局を詰め蟌むよりもプロパティを組み合わせるこずができたす。 このアプロヌチは、次のレむダヌの入力ずしおベアピクセルを䜿甚するこずずは異なりたす。 この堎合、プロパティカヌドのフレヌムワヌク内での畳み蟌みの埌、プロパティの空間的な組み合わせに1x1の畳み蟌みが䜿甚されるため、これらのプロパティのすべおのピクセルに共通するはるかに少ないパラメヌタヌを䜿甚できたす







MLPは、個々の畳み蟌み局をより耇雑なグルヌプに結合するこずで、個々の畳み蟌み局の有効性を倧幅に向䞊させるこずができたす。 このアむデアは、埌でResNet、Inception、およびそれらのバリアントなどの他のアヌキテクチャで䜿甚されたした。



GoogLeNetずむンセプション



Google Christian Szegedyは、ディヌプニュヌラルネットワヌクでの蚈算の䜎䞋を心配しおおり、その結果、最初のInceptionアヌキテクチャであるGoogLeNetを䜜成したした。



2014幎の秋たでに、ディヌプラヌニングモデルは、ビデオの画像コンテンツずフレヌムを分類するのに非垞に圹立ちたした。 倚くの懐疑論者はディヌプラヌニングずニュヌラルネットワヌクの利点を認識しおおり、Googleを含むむンタヌネットの巚人は、サヌバヌ容量に効率的で倧芏暡なネットワヌクを展開するこずに非垞に興味を持っおいたす。



クリスチャンは、ニュヌラルネットワヌクの蚈算負荷を軜枛し、最高のパフォヌマンスImageNetなどを実珟する方法を探しおいたした。 たたは、蚈算量を保持しながら、生産性を向䞊させたす。



その結果、コマンドはInceptionモゞュヌルを䜜成したした







䞀芋、これは畳み蟌みフィルタヌ1x1、3x3、5x5の䞊列の組み合わせです。 しかし、ハむラむトは、「高䟡な」パラレルブロックで䜿甚する前にプロパティの数を枛らすために1x1NiNの畳み蟌みブロックを䜿甚したこずです。 通垞、この郚分はボトルネックず呌ばれたす。詳现に぀いおは、次の章で説明したす。



GoogLeNetは、Inceptionモゞュヌルなしのステムを初期レむダヌずしお䜿甚し、平均プヌリングずNiNに類䌌したsoftmax分類噚も䜿甚したす。 この分類噚は、AlexNetおよびVGGず比范しお、非垞に少ない操䜜を実行したす。 たた、 非垞に効率的なニュヌラルネットワヌクアヌキテクチャの䜜成にも圹立ちたした。



ボトルネック局



このレむダヌは、各レむダヌのプロパティおよび操​​䜜の数を枛らすため、結果を取埗する速床を高いレベルに維持できたす。 デヌタを「高䟡な」畳み蟌みモゞュヌルに転送する前に、プロパティの数が4倍に削枛されたす。 これにより、蚈算量が倧幅に削枛され、アヌキテクチャが普及したした。



それを理解したしょう。 入力に256個、出力に256個のプロパティがあり、Inceptionレむダヌが3x3のたたみ蟌みのみを実行するずしたす。 256x256x3x3のコンボリュヌション环積乗算の589,000挔算、぀たりMAC挔算を取埗したす。 これは蚈算速床の芁件を超える可胜性がありたす;たずえば、Googleサヌバヌでレむダヌが0.5ミリ秒で凊理されるずしたす。 次に、折りたたみのプロパティの数を64256/4に枛らしたす。 この堎合、たず256-> 64の1x1畳み蟌みを実行し、次にすべおのInceptionブランチで別の64畳み蟌みを実行しおから、64-> 256プロパティの1x1畳み蟌みを再床適甚したす。 操䜜の数





箄70,000だけで、操䜜の数がほが10倍枛少したした しかし、同時に、このレむダヌの䞀般化は倱われたせんでした。 ボトルネックレむダヌは、ImageNetデヌタセットで優れたパフォヌマンスを瀺しおおり、ResNetなどの埌のアヌキテクチャで䜿甚されおいたす。 それらの成功の理由は、入力プロパティが盞関しおいるこずです。぀たり、プロパティを1x1畳み蟌みず正しく組み合わせるこずで冗長性を取り陀くこずができたす。 そしお、より少ないプロパティで折り畳んだ埌、次のレむダヌでそれらを再び重芁な組み合わせに展開できたす。



Inception V3およびV2



クリスチャンず圌のチヌムは非垞に効果的な研究者であるこずが蚌明されおいたす。 2015幎2月、 バッチ正芏化InceptionアヌキテクチャがInceptionの2番目のバヌゞョンずしお導入されたした。 バッチ正芏化は、出力レむダヌ内のすべおのプロパティ分垃マップの平均ず暙準偏差を蚈算し、これらの倀で応答を正芏化したす。 これはデヌタの「ホワむトニング」に察応したす。぀たり、すべおのニュヌラルマップの応答は同じ範囲にあり、平均倀はれロです。 次のレむダヌは入力デヌタのオフセットを蚘憶する必芁がなく、プロパティの最適な組み合わせのみを怜玢できるため、このアプロヌチにより孊習が容易になりたす。



2015幎12月に、 Inceptionモゞュヌルの新しいバヌゞョンず察応するアヌキテクチャがリリヌスされたした 。 著者の蚘事は、元のGoogLeNetアヌキテクチャをよりよく説明しおおり、行われた決定に぀いおさらに詳しく説明しおいたす。 䞻なアむデア





Inceptionは、最終的な分類子ずしおsoftmaxを含むプヌリングレむダヌを䜿甚したす。



Resnet



2015幎12月、Inception v3アヌキテクチャが導入されたのずほが同時に革呜が起こりたした-圌らはResNetを公​​開したした 。 シンプルなアむデアが含たれおいたす。2぀の成功した畳み蟌み局の出力を送信し、次の局の入力をバむパスしたす。







このようなアむデアは、たずえばここですでに提案されおいたす 。 ただし、この堎合、著者は2぀のレむダヌをバむパスし、倧芏暡にアプロヌチを適甚したす。 1぀のレむダヌをバむパスしおも倧きな利点はありたせん。2぀のレむダヌをバむパスするこずが重芁な発芋です。 これは、ネットワヌク内ネットワヌクのような小さな分類子ずみなすこずができたす



たた、数癟、数千のレむダヌのネットワヌクをトレヌニングする初めおの䟋でもありたした。

倚局ResNetは、Inceptionで䜿甚されるものず同様のボトルネックレむダヌを䜿甚したした。







このレむダヌは各レむダヌのプロパティの数を枛らしたす。たず、小さい出力通垞は入力の4分の1で1x1畳み蟌みを䜿甚し、次に3x3レむダヌを䜿甚しお、1x1をより倚くのプロパティに再び畳み蟌みたす。 Inceptionモゞュヌルの堎合ず同様に、これにより、豊富なプロパティの組み合わせを維持しながら蚈算リ゜ヌスを節玄できたす。 Inception V3およびV4のより耇雑でわかりにくいステムず比范しおください。



ResNetは、最終分類子ずしおsoftmaxを䜿甚したプヌリングレむダヌを䜿甚したす。

毎日、ResNetアヌキテクチャに関する远加情報が衚瀺されたす。





むンセプションV4



クリスチャンず圌のチヌムはInceptionの新しいバヌゞョンで再び卓越したした。



stemの埌のinceptionモゞュヌルはInception V3ず同じです







この堎合、InceptionモゞュヌルはResNetモゞュヌルず組み合わされたす。







このアヌキテクチャは、私の奜みでは、より耇雑で、゚レガントではなく、䞍透明なヒュヌリスティックな゜リュヌションで満たされおいたす。 著者がこれらの決定たたはそれらの決定を行った理由を理解するこずは困難であり、同様に圌らに䜕らかの評䟡を䞎えるこずは困難です。



したがっお、わかりやすく修正しやすい、クリヌンでシンプルなニュヌラルネットワヌクの賞品はResNetに莈られたす。



SqueezeNet



SqueezeNetは最近公開されたした。 これは、ResNetずInceptionの倚くの抂念の倚くの点でのリメむクです。 著者らは、アヌキテクチャを改善するこずで、耇雑な圧瞮アルゎリズムを䜿甚せずにネットワヌクサむズずパラメヌタヌ数を削枛できるこずを実蚌したした。



ENet



最近のアヌキテクチャのすべおの機胜は、非垞に効率的でコンパクトなネットワヌクに結合され、非垞に少ないパラメヌタヌず蚈算胜力を䜿甚しながら、同時に優れた結果をもたらしたす。 アヌキテクチャはENetず呌ばれ、Adam Paszke Adam Paszke によっお開発されたした。 たずえば、画面䞊のオブゞェクトの非垞に正確なマヌキングずシヌンの解析に䜿甚したした。 Enetのいく぀かの䟋 。 これらのビデオは、 トレヌニングデヌタセットずは関係ありたせん。



ここでは、ENetの技術的な詳现を芋぀けるこずができたす。 これは、゚ンコヌダヌずデコヌダヌに基づくネットワヌクです。 ゚ンコヌダヌは、埓来のCNNカテゎリ化スキヌムに基づいお構築され、デコヌダヌは、元のサむズの画像にカテゎリを広げるこずによっおセグメンテヌションのために蚭蚈されたアップサンプリングネットワヌクです。 画像のセグメンテヌションには、ニュヌラルネットワヌクのみが䜿甚され、他のアルゎリズムは䜿甚されたせんでした。







ご芧のずおり、ENetは他のすべおのニュヌラルネットワヌクず比范しお、最高の特定の粟床を備えおいたす。



ENetは、最初から可胜な限り少ないリ゜ヌスを䜿甚するように蚭蚈されたした。 その結果、゚ンコヌダヌずデコヌダヌはずもに、fp16粟床でわずか0.7 MBを占有したす。 そしお、このような小さなサむズで、ENetはセグメンテヌション粟床に劣らず、他の玔粋なニュヌラルネットワヌク゜リュヌションよりも優れおいたす。



モゞュヌル分析



CNNモゞュヌルの䜓系的な評䟡を公開したした 。 それは有益であるこずが刀明したした





Xception



Xceptionは、よりシンプルで゚レガントなアヌキテクチャをInceptionモゞュヌルに導入したした。これは、ResNetおよびInception V4よりも効率的です。

Xceptionモゞュヌルは次のようになりたす。







アヌキテクチャのシンプルさず゚レガントさにより、誰もがこのネットワヌクを奜むでしょう。







これには36段階の畳み蟌みが含たれおおり、これはResNet-34に䌌おいたす。 同時に、モデルずコヌドはResNetのようにシンプルで、Inception V4よりもずっず快適です。



このネットワヌクのtorch7実装はこちらから入手できたすが 、Keras / TF実装はこちらから入手できたす。



䞍思議なこずに、最近のXceptionアヌキテクチャの䜜成者は、 分離可胜な畳み蟌みフィルタヌに関する私たちの研究からも刺激を受けたした。



MobileNets



M obileNetsの新しいアヌキテクチャは、2017幎4月にリリヌスされたした。 パラメヌタヌの数を枛らすために、Xceptionず同じように、取り倖し可胜な畳み蟌みを䜿甚したす。 たた、著者はパラメヌタヌの数を倧幅に枛らすこずができたず曞かれおいたす。FaceNetの堎合は玄半分です。 フルモデルアヌキテクチャ







このネットワヌクを実際のタスクでテストしたしたが、Titan Xpグラフィックカヌドの1パッケヌゞ1バッチで非垞に䜎速で動䜜するこずがわかりたした。 単䞀の画像の出力時間を比范したす。





これは高速䜜業ずは蚀えたせん パラメヌタの数ずディスク䞊のネットワヌクサむズは削枛されたすが、これには意味がありたせん。



その他の泚目すべきアヌキテクチャ



FractalNetは、 ImageNetでただテストされおおらず、ResNetの掟生バヌゞョンたたはより䞀般的なバヌゞョンである再垰アヌキテクチャを䜿甚したす。



未来



ニュヌラルネットワヌクアヌキテクチャの開発は、ディヌプラヌニングの開発にずっお最も重芁であるず考えおいたす。 ここに提瀺されおいるすべおの䜜業を泚意深く読み、熟考するこずを匷くお勧めしたす。



なぜアヌキテクチャの開発にこれほど倚くの時間を費やす必芁があるのか​​、そしおその代わりに䜕を䜿甚し、どのようにモゞュヌルを組み合わせるのかを正確に䌝えるデヌタを䜿甚しないのはなぜでしょうか 魅力的な機䌚ですが、その䜜業はただ進行䞭です。 以䞋に初期結果を瀺したす。

さらに、コンピュヌタヌビゞョンのアヌキテクチャに぀いおのみ説明したした。 開発の他の領域も進行䞭であり、他の領域の進化を研究するこずは興味深いでしょう。



ニュヌラルネットワヌクのパフォヌマンスずコンピュヌティングのパフォヌマンスの比范に関心がある堎合は、最近の研究をご芧ください。



All Articles