畳み蟌みニュヌラルネットワヌク、パヌト1構造、トポロゞ、掻性化関数、およびトレヌニングセット

たえがき



これらの蚘事 パヌト2 は、倧孊での科孊研究の䞀郚であり、「畳み蟌みニュヌラルネットワヌクを䜿甚しおビデオストリヌム内の顔を怜出するための゜フトりェアパッケヌゞ」ず読みたした。 この䜜業の目暙は、ビデオストリヌム内の顔を怜出するプロセスの速床特性を改善するこずでした。 スマヌトフォンのカメラはビデオストリヌムずしお䜿甚され、デスクトップPSKotlin蚀語は、たたみ蟌みニュヌラルネットワヌクを䜜成およびトレヌニングするために䜜成されたした。 私が蚀う結果はたあたあなので、私が提案したトポロゞヌの正確なコピヌを自分の危険ずリスクで䜿甚するこずが刀明したした掚奚したせん。



理論的な問題
  • ニュヌラルネットワヌクによっお解決されおいる問題を刀別したす分類、予枬、修正。
  • 解決される問題の制限速床、回答の粟床を決定したす。
  • 入力タむプ画像、音声、サむズ100x100、30x30、圢匏RGB、グレヌスケヌルおよび出力クラス数を決定したす。
  • 畳み蟌みネットワヌクのトポロゞを決定したす畳み蟌み、サブサンプリング、完党に接続されたレむダヌの数、機胜マップの数、カヌネルのサむズ、アクティベヌション関数。




はじめに



顔認識の分野で最良の結果が埗られたのは、畳み蟌みニュヌラルネットワヌクたたは畳み蟌みニュヌラルネットワヌク以䞋、SNAです。これは、コグニトロンやネオコグニトロンなどのNSアヌキテクチャのアむデアを論理的に発展させたものです。 成功は、倚局パヌセプトロンずは察照的に、二次元画像トポロゞヌを考慮する可胜性によるものです。



畳み蟌みニュヌラルネットワヌクは、スケヌル、倉䜍、回転、角床の倉化、その他の歪みの倉化に察する郚分的な耐性を提䟛したす。 畳み蟌みニュヌラルネットワヌクは、ズヌム、回転、せん断、空間歪みに察する䞍倉性を保蚌するために、3぀のアヌキテクチャのアむデアを組み合わせおいたす。





珟時点では、畳み蟌みニュヌラルネットワヌクずその修正は、ステヌゞ䞊のオブゞェクトを粟床ず速床で芋぀けるための最適なアルゎリズムず芋なされおいたす。 2012幎以来、ニュヌラルネットワヌクは、よく知られおいるImageNet囜際パタヌン認識競争の第䞀䜍を占めおいたす。







それが、私の研究で、ネオコグニトロンの原理に基づいた畳み蟌みニュヌラルネットワヌクを䜿甚し、゚ラヌ逆䌝播アルゎリズムのトレヌニングで補足した理由です。



畳み蟌みニュヌラルネットワヌク構造



SNAはさたざたなタむプの局で構成されたす。畳み蟌み局、サブサンプリング、サブサンプリング局、および「通垞の」ニュヌラルネットワヌクの局-パヌセプトロン、図1に埓っお。





図1-畳み蟌みニュヌラルネットワヌクのトポロゞ



最初の2皮類のレむダヌ畳み蟌み、サブサンプリングは、亀互に重なり合っお、倚局パヌセプトロンの入力特城ベクトルを圢成したす。



畳み蟌みネットワヌクは、操䜜の名前でその名前を取埗したした-畳み蟌み、その本質は埌述したす。



たたみ蟌みネットワヌクは、生物孊的にもっずもらしいネットワヌクず通垞の倚局パヌセプトロンずの良い䞭間点です。 珟圚たでに、画像認識で最良の結果が埗られたした。 平均しお、このようなネットワヌクの認識粟床は、埓来のANNを10〜15超えおいたす。 SNAは、ディヌプラヌニングの重芁なテクノロゞです。



SNAが成功した䞻な理由は、䞀般的な重みの抂念でした。 これらのネットワヌクは、サむズが倧きいにもかかわらず、祖先であるネオコグニトロンず比范しお、構成可胜なパラメヌタヌが少数です。 ネオコグニトロンに䌌たSNATiled Convolutional Neural Networkのバヌゞョンがあり、そのようなネットワヌクでは関連する重みが郚分的に拒吊されたすが、孊習アルゎリズムは同じたたで、゚ラヌの逆䌝播に基づいおいたす。 SNAは、シリアルカヌド䞊ですばやく動䜜し、各カヌドの畳み蟌みプロセスの玔粋な䞊列化ず、ネットワヌク䞊で゚ラヌを䌝播する際の逆畳み蟌みにより、すばやく孊習できたす。



以䞋の図は、畳み蟌みずサブサンプリングの芖芚化を瀺しおいたす。







ニュヌロンモデル








畳み蟌みニュヌラルネットワヌクトポロゞ



ネットワヌクトポロゞの定矩は、解決される問題、科孊蚘事のデヌタ、および私たち自身の実隓的経隓に焊点を圓おおいたす。



トポロゞの遞択に圱響する次の手順を区別できたす。





私のニュヌラルネットワヌクによっお解決されるタスクは、画像、特に個人の分類です。 ネットワヌクに課せられる制限は、1秒以䞋の応答速床ず少なくずも70の認識粟床です。 図2に基づく䞀般的なネットワヌクトポロゞ。





図2-トポロゞヌたたみ蟌みニュヌラルネットワヌク



入力局



入力デヌタは、サむズが48x48ピクセルのJPEGタむプのカラヌ画像です。 サむズが倧きすぎるず、蚈算の耇雑さが増し、それに応じお、応答速床の制限に違反するこずになり、この問題のサむズの決定は遞択方法によっお解決されたす。 遞択したサむズが小さすぎるず、ネットワヌクは顔の䞻芁な兆候を特定できなくなりたす。 各画像は、赀、青、緑の3぀のチャネルに分割されたす。 したがっお、48x48ピクセルの3぀の画像が取埗されたす。



入力レむダヌは、画像の2次元トポロゞを考慮し、耇数のマップ行列で構成されたす。画像がグレヌの陰圱で衚瀺される堎合、マップは1぀になりたす。それ以倖の堎合、各マップは特定のチャンネル赀、青、緑 。



特定の各ピクセル倀の入力デヌタは、次の匏に埓っお0〜1の範囲に正芏化されたす。







畳み蟌み局



畳み蟌み局は䞀連のカヌドであり別の名前は機胜カヌドであり、日垞生掻ではこれらは通垞のマトリックスです、各カヌドにはシナプスコアがありたすスキャンコアたたはフィルタヌなど、゜ヌスが異なるず呌ばれたす。



カヌドの数は、タスクの芁件によっお決たりたす。倧量のカヌドを䜿甚するず、認識品質は向䞊したすが、蚈算の耇雑さが増したす。 科孊蚘事の分析に基づいお、ほずんどの堎合、1察2の比率を取るこずが提案されおいたす。぀たり、前のレむダヌたずえば、最初の畳み蟌みレむダヌ、前のレむダヌの入力の各カヌドは、図3に埓っお、畳み蟌みレむダヌの2぀のカヌドに関連付けられおいたす。カヌドの数- 6。





図3-畳み蟌み局のカヌドず前の局の間の関係の構成



畳み蟌み局のすべおのカヌドのサむズは同じであり、匏2で蚈算されたす。







コアは、前のマップの領域党䜓をスラむドし、オブゞェクトの特定の兆候を芋぀けるフィルタヌたたはりィンドりです。 たずえば、ネットワヌクが倚くの顔で蚓緎された堎合、コアの1぀は蚓緎䞭に目、口、眉、たたは錻の分野で最倧の信号を䞎えるこずができ、他のコアは他の兆候を明らかにするこずができたす。 コアのサむズは、通垞3x3〜7x7の範囲で採甚されたす。 栞のサむズが小さい堎合、兆候を匷調するこずはできたせん;それが倧きすぎる堎合、ニュヌロン間の接続の数が増加したす。 たた、カヌネルサむズは、畳み蟌み局カヌドのサむズが均等になるように遞択されたす。これにより、以䞋で説明するサブサンプルレむダヌの次元を小さくするずきに情報を倱うこずがなくなりたす。



コアは重みたたはシナプスを共有するシステムであり、これは畳み蟌みニュヌラルネットワヌクの䞻芁な機胜の1぀です。 通垞の倚局ネットワヌクでは、ニュヌロン間に倚くの接続、぀たりシナプスがあり、怜出プロセスが倧幅に遅くなりたす。 逆に、畳み蟌みネットワヌクでは、総重みによりリンクの数を枛らし、画像領域党䜓で同じ属性を芋぀けるこずができたす。







最初、畳み蟌み局の各カヌドの倀は0です。カヌネルの重みの倀は、-0.5〜0.5の範囲でランダムに蚭定されたす。 カヌネルは前のマップ䞊を滑空し、画像凊理によく䜿甚されるコンボリュヌション操䜜を実行したす







非公匏には、この操䜜は次のように蚘述できたすカヌネルサむズりィンドりgを所定のステップ通垞1で画像f党䜓を通過し、各ステップでりィンドりの内容にカヌネルgを乗算し、結果を合蚈しお結果マトリックスに曞き蟌みたす図4。





図4-畳み蟌み挔算ず畳み蟌みカヌドの倀の取埗有効





畳み蟌み挔算ず畳み蟌みマップ倀の取埗。 コアはシフトされ、新しいカヌドは前のものず同じサむズです同じ



さらに、元の行列の゚ッゞを凊理する方法によっおは、図5に埓っお、結果は元の画像より小さく有効、同じサむズ同じたたは倧きく完党になる堎合がありたす。





図5-元の行列の3皮類の畳み蟌み



簡略化した圢匏では、このレむダヌは次の匏で説明できたす。







さらに、゚ッゞ効果により、元の行列のサむズが小さくなり、匏







サブサンプルレむダヌ



サブサンプルレむダヌず畳み蟌みレむダヌにはカヌドがありたすが、それらの数は前の畳み蟌みレむダヌず䞀臎したす。6぀ありたす。レむダヌの目的は、前のレむダヌのカヌドの寞法を小さくするこずです。 前の畳み蟌み操䜜でいく぀かの兆候がすでに明らかになっおいる堎合、さらに凊理するためにそのような詳现な画像はもはや必芁ではなく、より詳现でない画像に圧瞮されたす。 さらに、すでに䞍芁な郚分をフィルタリングするこずで、再トレヌニングを行わないようにしたす。

前のレむダヌのマップのサブサンプルレむダヌフィルタヌのコアによるスキャン䞭、畳み蟌みレむダヌずは異なり、スキャンコアは亀差したせん。 通垞、各カヌドには2x2のコアがあり、以前のカヌドの畳み蟌み局を2倍枛らすこずができたす。 フィヌチャマップ党䜓が2x2のセル芁玠に分割され、最倧倀が遞択されたす。



通垞、サブサンプリングレむダヌはRelUアクティベヌション関数を䜿甚したす。 図6によるサブサンプリング操䜜たたはMaxPooling-最倧遞択。





図6-前の畳み蟌み局マップに基づく新しいサブサンプルレむダヌマップの圢成 サブサンプリング操䜜最倧プヌリング



正匏には、レむダヌは次の匏で蚘述できたす。







完党に接続されたレむダヌ



最埌のタむプの局は、通垞の倚局パヌセプトロンの局です。 局の目的は分類であり、耇雑な非線圢関数をモデル化し、認識の品質を向䞊させる最適化を行いたす。







前のサブサンプル局の各カヌドのニュヌロンは、隠れ局の1぀のニュヌロンに関連付けられおいたす。 したがっお、隠れ局のニュヌロンの数はサブサンプル局のカヌドの数に等しくなりたすが、接続は必ずしも同じではない可胜性がありたす。たずえば、サブサンプル局のカヌドのいずれかのニュヌロンの䞀郚のみが隠れ局の最初のニュヌロンに接続でき、残りの郚分は2番目、たたは最初のすべおのニュヌロンに接続できたすカヌドは、隠れ局のニュヌロン1および2に接続されおいたす。 ニュヌロンの倀の蚈算は、次の匏で説明できたす。







出力局



出力局は、前の局のすべおのニュヌロンに接続されおいたす。 ニュヌロンの数は、認識可胜なクラスの数、぀たり2-顔ではなく顔に察応したす。 ただし、バむナリケヌスの接続ず蚈算の数を枛らすために、1぀のニュヌロンを䜿甚できたす。双曲線正接を掻性化関数ずしお䜿甚する堎合、-1の倀を持぀ニュヌロンの出力は「非顔」クラスに属し、1の倀を持぀ニュヌロンの出力はクラスに属するこずを意味したす人。



アクティベヌション機胜の遞択



ニュヌラルネットワヌクの開発段階の1぀は、ニュヌロンの掻性化機胜の遞択です。 掻性化関数のタむプは、ニュヌラルネットワヌクの機胜ずこのネットワヌクのトレヌニング方法を倧きく決定したす。 埓来のバックプロパゲヌションアルゎリズムは2局および3局のニュヌラルネットワヌクでうたく機胜したすが、深さがさらに増加するず問題が発生し始めたす。 1぀の理由は、いわゆる募配枛衰です。 ゚ラヌが出力局から入力局に䌝播するず、珟圚の結果ずアクティベヌション関数の導関数の乗算が各局で発生したす。 埓来のシグモむド掻性化関数の導関数は、ドメむン党䜓で1未満であるため、耇数の局の埌、゚ラヌはれロに近くなりたす。 反察に、掻性化関数が無制限の埮分双曲線正接などを持っおいる堎合、䌝播時に゚ラヌの爆発的な増加が発生する可胜性があり、トレヌニング手順が䞍安定になりたす。



この論文では、双曲線正接を隠れ局ず出力局の掻性化関数ずしお䜿甚し、ReLUを畳み蟌み局で䜿甚したす。 ニュヌラルネットワヌクで䜿甚される最も䞀般的な掻性化関数を怜蚎しおください。







シグモむド掻性化機胜



この関数は連続関数のクラスに属し、入力で任意の実数を取り、出力で0〜1の範囲の実数を返したす。特に、倧きなモゞュロ負の数はれロになり、倧きな正の数は1になりたす。 歎史的に、シグモむドは広く䜿甚されおいたした。その出力はニュヌロンの掻性化レベルずしおよく解釈されおいるためです。掻性化の䞍圚0から完党に飜和した掻性化1たで。 シグモむドは次の匏で衚されたす。







以䞋の図に埓ったシグモむド関数のグラフ







シグモむドの非垞に望たしくない特性は、関数が䞀方たたは他方0たたは1で飜和するず、これらの領域の募配がれロに近くなるこずです。



゚ラヌの逆䌝播の過皋で、このロヌカル募配に䞀般募配が乗算されるこずを思い出しおください。 したがっお、局所募配が非垞に小さい堎合、党䜓の募配が効果的にリセットされたす。 その結果、信号はニュヌロンをその重みにほずんど通過せず、デヌタに再垰的に通過したせん。 さらに、飜和を防ぐためにシグモむドニュヌロンの重みを初期化するずきは非垞に泚意する必芁がありたす。 たずえば、初期の重みが倧きすぎるず、ほずんどのニュヌロンが飜和状態になり、ネットワヌクのトレヌニングが䞍十分になりたす。



シグモむド関数は次のずおりです。





双曲線正接掻性化関数



このホワむトペヌパヌでは、双曲線正接を非衚瀺局ず出力局の掻性化関数ずしお䜿甚したす。 これは、次の理由によるものです。





双曲線正接の関数のグラフを図に瀺したす







ReLUアクティベヌション機胜



十分な局があり、掻性化関数が非線圢である堎合、ニュヌラルネットワヌクは任意の耇雑な関数を近䌌できるこずが知られおいたす。 シグモむドやタンゞェンシャルなどの掻性化関数は非線圢ですが、枛衰や募配の増加に問題が生じたす。 ただし、はるかに簡単なオプション-修正線圢アクティベヌション関数修正線圢ナニット、ReLUを䜿甚できたす。これは次の匏で衚されたす。







以䞋の図に埓ったReLU関数のグラフ







ReLUを䜿甚する利点





欠点のうち、ReLUの信頌性は必ずしも十分ではなく、孊習プロセスで倱敗する可胜性がある「死ぬ」こずに泚意しおください。 たずえば、ReLUを通過する倧きな募配は、特定のニュヌロンが再びアクティブにならないようなバランスの曎新に぀ながる可胜性がありたす。 これが発生した堎合、この時点から、このニュヌロンを通過する募配は垞にれロになりたす。 したがっお、このニュヌロンは氞続的に無効になりたす。 たずえば、孊習率が速すぎる堎合、ReLUの最倧40が「デッド」であるこずが刀明する堎合がありたす぀たり、アクティブ化されたせん。 この問題は、適切な孊習率を遞択するこずで解決されたす。



実隓で䜿甚したトレヌニングサンプル



トレヌニングサンプルは、肯定的な䟋ず吊定的な䟋で構成されおいたす。 この堎合、人ず「人ではない」から。 ポゞティブな䟋ずネガティブな䟋の比率は、4察1、8000ポゞティブ、2000ネガティブです。



LFW3Dデヌタベヌス[7]は、ポゞティブトレヌニングサンプルずしお䜿甚されたした。 これには、JPEGなどの正面顔のカラヌ画像サむズ90x90ピクセル、13000が含たれおいたす。デヌタベヌスはFTP経由で提䟛され、アクセスはパスワヌドで保護されおいたす。 パスワヌドを取埗するには、サむトのメむンペヌゞで簡単なフォヌムに入力する必芁がありたす。ここで、名前ずメヌルを入力できたす。 以䞋の図に埓っお、デヌタベヌスの人物の䟋を瀺したす。







吊定的な教育䟋ずしお、SUN397デヌタベヌス[8]が䜿甚されたした。これには、カテゎリに分類される膚倧な数のあらゆる皮類のシヌンが含たれおいたす。 合蚈130,000個の画像、908個のシヌン、313,000個のシヌンオブゞェクト。 このベヌスの総重量は37 GBです。 画像のカテゎリは非垞に異なり、最終PSを䜿甚するより具䜓的な環境を遞択できたす。 たずえば、顔怜出噚が屋内での認識のみを目的ずしおいるこずが事前にわかっおいる堎合、自然、空、山などのトレヌニングサンプルを䜿甚しおも意味がありたせん。 このため、この䜜品の著者は、リビングルヌム、曞斎、教宀、コンピュヌタヌルヌムの画像カテゎリを遞択したした。 以䞋の図に埓っお、SUN397トレヌニングセットの画像の䟋を瀺したす。







結果



90x90ピクセルの入力画像からの信号の盎接䌝播には20 msPC䞊、モバむルアプリケヌションでは3,000 msかかりたす。 640x480ピクセルの解像床でビデオストリヌム内の顔を怜出する堎合、サむズが90x90ピクセルの50の重耇しない領域を怜出するこずができたす。 遞択したネットワヌクトポロゞで埗られた結果は、Viola-Jonesアルゎリズムに比べお劣っおいたす。



結論



畳み蟌みニュヌラルネットワヌクは、スケヌル、倉䜍、回転、角床の倉化、その他の歪みの倉化に察する郚分的な耐性を提䟛したす。



コアは、画像党䜓をスラむドし、任意の堎所で顔の兆候を怜出するフィルタヌです倉䜍に察する䞍倉性。



サブサンプルレむダヌは以䞋を提䟛したす。





最埌の局は、通垞の倚局パヌセプトロンの局です。 2぀の完党に接続された1぀の出力。 この局は分類を担圓し、数孊的な芳点から、耇雑な非線圢関数をモデル化し、認識の品質を向䞊させる最適化を行いたす。 䞋付き局の機胜マップの数に応じた、局6のニュヌロンの数。



可胜な改善







畳み蟌みニュヌラルネットワヌクトレヌニングに぀いおは、 第2郚で説明したす。



参照資料





- 畳み蟌みニュヌラルネットワヌクずは



-孊習セット

制玄のない画像での効果的な顔の前線化//有効な顔。

SUNデヌタベヌス// MITコンピュヌタサむ゚ンスおよび人工知胜研究所



- 畳み蟌みニュヌラルネットワヌクに関する情報



- ニュヌラルネットワヌクのトレヌニング関数に぀いお



- ニュヌラルネットワヌクの皮類ニュヌラルネットワヌクの同様の分類スキヌム



-初心者向けのニュヌラルネットワヌク 1぀ず 2぀ 。



All Articles