顔認識に察する既存のアプロヌチの分析

うらやたしいほどの芏則性で、Habréに衚瀺されるさたざたな顔認識方法に関する蚘事が衚瀺されたす。 この玠晎らしいトピックをサポヌトするだけでなく、すべおではないにしおも、顔認識ぞの倚くのアプロヌチ、それらの長所ず短所をカバヌする内郚ドキュメントをレむアりトするこずにしたした。 それは、いわば、教育目的のために、マシンビゞョン郚門の若い埓業員のために、私たちの゚ンゞニアであるアンドレむ・グサックによっお線集されたした。 今日、私たちは皆にそれを提䟛したす。 蚘事の最埌には、最も奜奇心the盛な人のための参考文献の印象的なリストがありたす。



それでは始めたしょう。

提瀺されたアルゎリズムの倚様性にもかかわらず、顔認識プロセスの䞀般的な構造を区別できたす。





認識䞭の䞀般的な顔画像凊理



最初の段階で、顔が怜出され、画像内でロヌカラむズされたす。 認識段階では、顔画像の䜍眮合わせ幟䜕孊的および明るさが実行され、サむンが蚈算され、認識が盎接実行されたす-蚈算されたサむンずデヌタベヌスに保存されおいる暙準ずの比范。 提瀺されたすべおのアルゎリズムの䞻な違いは、特城の蚈算ずそれらの間のセットの比范です。



1.グラフの柔軟な比范方法匟性グラフマッチング[13]。




この方法の本質は、顔の画像を蚘述するグラフの匟性比范に限定されたす。 面は、重み付きの頂点ず゚ッゞを持぀グラフずしお衚されたす。 認識段階では、グラフの1぀参照グラフは倉曎されないたたで、もう1぀は最初のグラフに最も適合するように倉圢されたす。 このような認識システムでは、グラフは長方圢の栌子か、顔の特城的な人䜓蚈枬点によっお圢成される構造のいずれかです。



a



b



顔認識のグラフ構造の䟋a芏則的な栌子b顔の人䜓枬定点に基づくグラフ。



グラフの頂点で、笊号の倀が蚈算されたす。ほずんどの堎合、ガボヌルフィルタヌの耇雑な倀たたはそれらの順序セット-ガボヌルりェヌブレットガボヌルビルドを䜿甚したす。





セットバンク、ゞェットガボヌルフィルタヌ





2぀のガボヌルフィルタヌを䜿甚した顔画像の畳み蟌みの䟋



グラフの゚ッゞは、隣接する頂点間の距離によっお重み付けされたす。 2぀のグラフの差距離、識別特性は、頂点で蚈算された属性の倀の差ずグラフの゚ッゞの倉圢床の䞡方を考慮した䟡栌倉圢関数を䜿甚しお蚈算されたす。

グラフは、その各頂点を初期䜍眮から特定の方向に特定の距離だけ特定の距離だけ倉䜍させ、倉圢可胜なグラフの䞊郚にある蚘号の倀ガボヌルフィルタヌ応答ず参照グラフの察応する頂点ずの差が最小になるようにその䜍眮を遞択するこずにより倉圢されたす。 この操䜜は、倉圢可胜グラフず参照グラフの特城間の最小の合蚈差に達するたで、グラフのすべおの頂点に察しお亀互に実行されたす。 倉圢可胜グラフのこの䜍眮での倉圢䟡栌関数の倀は、顔の入力画像ず参照グラフずの差の尺床になりたす。 この「緩和」倉圢手順は、システムデヌタベヌスに埋め蟌たれたすべおの参照者に察しお実行する必芁がありたす。 システムの認識の結果は、倉圢の䟡栌関数の最高倀を持぀暙準です。





通垞のグラフ栌子倉圢の䟋



䞀郚の出版物では、さたざたな感情衚珟や顔の角床が15床に倉化した堎合でも、95〜97の認識効率が瀺されおいたす。 ただし、グラフ䞊の匟性比范システムの開発者は、このアプロヌチの高い蚈算コストを挙げおいたす。 たずえば、顔の入力画像を87枚の参照画像ず比范するには、23台のトランスピュヌタを備えた䞊列コンピュヌタで䜜業する堎合、玄25秒かかりたした[15]泚1993幎発行。 このテヌマに関する他の出版物は、時間を瀺しおいないか、玠晎らしいず蚀っおいたす。



短所認識手順の蚈算量が倚い。 新しい暙準を蚘憶するずきの䜎い補造可胜性。 人のデヌタベヌスのサむズに察する皌働時間の線圢䟝存。



2.ニュヌラルネットワヌク




珟圚、玄12皮類のニュヌラルネットワヌクNSがありたす。 最も広く䜿甚されおいるオプションの1぀は、倚局パヌセプトロン䞊に構築されたネットワヌクです。これにより、ネットワヌクの事前構成/トレヌニングに埓っお入力に適甚される画像/信号を分類できたす。

ニュヌラルネットワヌクは、䞀連のトレヌニング䟋でトレヌニングされたす。 トレヌニングの本質は、募配降䞋法によっお最適化問題を解決する過皋で、ニュヌロン間の接続の重みを調敎するこずです。 NSをトレヌニングするプロセスで、䞻芁な特城が自動的に抜出され、それらの重芁性が決定され、それらの間の関係が構築されたす。 蚓緎されたNSは、胜力を䞀般化するため、孊習プロセスで埗られた経隓を未知の画像に適甚できるず想定されたす。

出版物の分析による顔認識の分野での最良の結果は、畳み蟌みニュヌラルネットワヌクたたは畳み蟌みニュヌラルネットワヌク以降-SNA[29-31]によっお瀺されたした。 成功は、倚局パヌセプトロンずは察照的に、二次元画像トポロゞヌを考慮する可胜性によるものです。

SNSの特城は、局所受容䜓フィヌルドニュヌロンの局所的な2次元接続性を提䟛、総重量画像内の任意の堎所でいく぀かの特城の怜出を提䟛、および空間サンプリング空間サブサンプリングによる階局構造です。 これらのむノベヌションのおかげで、SNAはスケヌル、倉䜍、回転、角床の倉化、その他の歪みの倉化に察する郚分的な耐性を提䟛したす。





畳み蟌みニュヌラルネットワヌクアヌキテクチャの抂略図



ORLデヌタベヌスを䜿甚しおSNAをテストしたす。ORLデヌタベヌスには、照明、スケヌル、空間回転、䜍眮、およびさたざたな感情がわずかに倉化する顔の画像が含たれ、96の認識粟床が瀺されたした。

SNAは、DeepFace [47]の開発で開発されたした。

Facebookは、゜ヌシャルネットワヌクのナヌザヌの顔を認識したす。 すべおのアヌキテクチャ機胜が閉じられおいたす。





DeepFaceの仕組み



ニュヌラルネットワヌクの短所新しい参照者をデヌタベヌスに远加するには、䜿甚可胜なセット党䜓でネットワヌクを完党に再トレヌニングする必芁がありたす1時間から数日たでのサンプルサむズに応じおかなり長い手順。 孊習に関連する数孊的性質の問題局所最適化、最適化最適化ステップの遞択、再蚓緎など。ネットワヌクアヌキテクチャニュヌロンの数、局、接続の性質を遞択する段階を圢匏化するこずは困難です。 䞊蚘のすべおを芁玄するず、囜䌚は䜜業結果の解釈が難しい「ブラックボックス」であるず結論付けるこずができたす。



3.隠れマルコフモデルSMM、HMM




顔認識の統蚈的手法の1぀は、離散時間を䜿甚した隠れマルコフモデルSMMです[32-34]。 SMMは、信号の統蚈的特性を䜿甚しお、空間特性を盎接考慮したす。 モデルの芁玠は、倚くの隠れた状態、倚くの芳枬可胜な状態、遷移確率のマトリックス、状態の初期確率です。 それぞれに独自のマルコフモデルがありたす。 オブゞェクトを認識するずき、オブゞェクトの特定のベヌスに察しお生成されたマルコフモデルがチェックされ、このオブゞェクトの芳枬シヌケンスの芳枬された確率の最倧倀が察応するモデルによっお生成されたす。

今日たで、顔認識のためのSMMの商業利甚の䟋を芋぀けるこずはできたせんでした。



短所

-各デヌタベヌスのモデルパラメヌタを遞択する必芁がありたす。

-SMMには識別胜力がありたせん。぀たり、トレヌニングアルゎリズムは各画像のモデルに察する応答を最倧化するだけで、他のモデルぞの応答は最小化したせん。



4.䞻成分分析たたは䞻成分分析PCA[11]




最も有名でよく開発されおいる方法の1぀は、Karunen-Loev倉換に基づく䞻成分分析PCAメ゜ッドです。

圓初、䞻芁なコンポヌネントのメ゜ッドは、情報の倧幅な損倱なしに属性のスペヌスを削枛するために統蚈で䜿甚され始めたした。 顔認識の問題では、䞻に小さな次元のベクトル䞻成分で顔画像を衚珟するために䜿甚され、デヌタベヌスに栌玍されおいる参照ベクトルず比范されたす。

䞻成分法の䞻な目的は、できるだけ倚くの顔に属する「兞型的な」画像を蚘述するように、特城空間の次元を倧幅に瞮小するこずです。 この方法を䜿甚するず、顔画像のトレヌニングサンプルのさたざたな倉動を識別し、この倉動を固有顔ず呌ばれるいく぀かの盎亀ベクトルに基づいお蚘述するこずができたす。



顔画像のトレヌニングサンプルで䞀床取埗された固有ベクトルのセットは、他のすべおの顔画像を゚ンコヌドするために䜿甚され、これらの固有ベクトルの重み付き組み合わせで衚されたす。 限られた数の固有ベクトルを䜿甚しお、顔の入力画像の圧瞮近䌌を取埗するこずができたす。これは、係数のベクトルずしおデヌタベヌスに栌玍でき、同時に顔デヌタベヌスの怜玢キヌずしお機胜したす。



䞻成分法の本質は次のずおりです。 最初に、顔のトレヌニングセット党䜓が1぀の共通デヌタマトリックスに倉換されたす。各行は、行に配眮された人物の画像の1぀のむンスタンスを衚したす。 トレヌニングセットのすべおの面を同じサむズに瞮小し、ヒストグラムを正芏化する必芁がありたす。





顔のトレヌニングセットを1぀の共通行列Xに倉換する



次に、デヌタが正芏化され、行が0番目の平均ず1番目の分散に瞮小され、共分散行列が蚈算されたす。 埗られた共分散行列に぀いお、固有倀ず察応する固有ベクトル固有倀を決定する問題が解決されたす。 次に、固有ベクトルは固有倀の降順で゜ヌトされ、最初のk個のベクトルのみがルヌルに埓っお残りたす。







PCAアルゎリズム





蚓緎された顔のセットで取埗された最初の10個の固有ベクトル固有倀の䟋



= 0.956 * -1.842 * +0.046 ...



独自の顔ず䞻芁コンポヌネントの組み合わせを䜿甚した人間の顔の構築合成の䟋





最初の最良の固有ベクトルから基底を遞択する原理





3぀の自身の顔から取埗した3次元メトリック空間に顔をマッピングし、さらに認識する䟋







䞻成分法は、実際のアプリケヌションで実蚌されおいたす。 ただし、顔の明るさや衚情に倧きな倉化がある堎合、この方法の有効性は倧幅に䜎䞋したす。 問題は、PCAが個人のクラスを区別するのではなく、可胜な限り入力デヌタセットを近䌌するこずを目暙に郚分空間を遞択するこずです。



[22]で、フィッシャヌ線圢刀別匏を䜿甚しおこの問題の解決策が提案されたした名前「Eigen-Fisher」、「Fisherface」、LDAは文献に蚘茉されおいたす。 LDAは、比率を最倧化する線圢郚分空間を遞択したす。







どこで



クラス間スプレッド行列、および





クラス内散垃の行列。 mはデヌタベヌス内のクラスの数です。



LDAは、クラスが可胜な限り線圢に分離可胜なデヌタ投圱法を探しおいたす䞋図を参照。 比范のために、PCAは、個人のデヌタベヌス党䜓の広がりが最倧化されるクラスを陀くデヌタ予枬を探しおいたす。 実隓結果[22]によるず、匷いタンクず顔画像の陰圱の䜎い条件では、FisherfaceはEigenfaceの53ず比范しお95の効率を瀺したした。





投圱の圢成の基本的な違いPCAずLDA



PCAずLDAの違い









5.アクティブな倖芳モデルAAMおよびアクティブな圢状モデルASM Habra゜ヌス 


アクティブな倖芳モデルAAM

アクティブな倖芳モデルAAMは、さたざたな倉圢を通じお実際の画像に適応できる画像の統蚈モデルです。 2次元バヌゞョンのこのタむプのモデルは、1998幎にTim KutsずChris Taylorによっお提案されたした[17,18]。 最初は、アクティブな倖芳モデルを䜿甚しお、顔画像のパラメヌタヌを評䟡したした。

アクティブな倖芳モデルには、圢状に関連付けられたパラメヌタヌ圢状パラメヌタヌず、画像のピクセルたたはテクスチャの統蚈モデルに関連付けられたパラメヌタヌ倖芳パラメヌタヌの2皮類のパラメヌタヌが含たれたす。 䜿甚する前に、事前にマヌクされた画像のセットでモデルをトレヌニングする必芁がありたす。 画像のマヌキングは手動で行われたす。 各ラベルには独自の番号があり、新しいむメヌゞぞの適応䞭にモデルが芋぀けなければならない特城的なポむントを定矩したす。





68ポむントの顔画像にAAM圢状を圢成するマヌクの䟋。



AAMトレヌニング手順は、ラベル付けされた画像の圢状を正芏化しお、スケヌル、傟き、バむアスの違いを補正するこずから始たりたす。 このために、いわゆる䞀般化されたプロクラストフ分析が䜿甚されたす。





正芏化の前埌の顔の圢のポむントの座暙



正芏化されたポむントのセット党䜓から、䞻成分がPCAメ゜ッドを䜿甚しお抜出されたす。





AAM圢状モデルは、䞉角圢分割栌子s0ず、s0に関する倉䜍siの線圢結合で構成されたす。



さらに、フォヌムのポむントによっお圢成される䞉角圢の内偎のピクセルから、各列が察応するテクスチャのピクセル倀を含むようにマトリックスが圢成されたす。 トレヌニングに䜿甚されるテクスチャは、シングルチャンネルグレヌスケヌルたたはマルチチャンネルRGBカラヌスペヌスなどのいずれかであるこずに泚意しおください。 マルチチャネルテクスチャの堎合、ピクセルベクトルはチャネルごずに個別に圢成され、それらの連結が実行されたす。 テクスチャマトリックスの䞻芁コンポヌネントを芋぀けた埌、AAMモデルはトレヌニング枈みず芋なされたす。







AAM倖芳モデルは、基本栌子s0内のピクセルず、A0に察する倉䜍Aiの線圢結合によっお定矩される基本圢A0で構成されたす。







AAMのむンスタンス化の䟋。 圢状オプションベクトル

p =p_1、p_2、〖...、p〗_m^ T =-54,10、-9.1、...^ Tはs圢匏のモデルを合成するために䜿甚され、パラメヌタヌベクトルλ=λ_1、λ_2、〖...、 λ〗_m^ T =3559,351、-256、...^モデルの倖芳を合成するためのT。 最終的な顔モデル〖MWx; p〗^は、圢状ず倖芳の2぀のモデルの組み合わせずしお取埗されたす。



モデルを特定の顔画像に適合させるこずは、最適化の問題を解決するプロセスで実行されたす。その本質は機胜を最小化するこずです







募配降䞋法。 この堎合に芋぀かったモデルパラメヌタは、特定の画像内のモデルの䜍眮を反映したす。







募配降䞋手順を20回繰り返しお、特定の画像にモデルを適合させる䟋。



AAMを䜿甚するず、剛䜓ず非剛䜓の䞡方の倉圢を受けるオブゞェクトの画像をシミュレヌトできたす。 AAMは䞀連のパラメヌタで構成され、その䞀郚は顔の圢状を衚し、残りはそのテクスチャを定矩したす。 倉圢は通垞、䌝達、回転、スケヌリングの構成の圢での幟䜕孊的倉換ずしお理解されたす。 画像内の顔の䜍眮を特定する問題を解決する堎合、AAMのパラメヌタヌ䜍眮、圢状、テクスチャの怜玢が実行されたす。これは、芳察されたものに最も近い合成画像を衚したす。 AAMの近接床により、調敎する画像が顔の有無によっお決たりたす。



アクティブ圢状モデルASM



ASMメ゜ッド[16、19、20]の本質は、人䜓枬定点の䜍眮間の統蚈的関係を考慮するこずです。 フルフェむスで撮圱された顔の画像の利甚可胜なサンプル。 画像では、専門家が人䜓枬定点の䜍眮をマヌクしたす。 各画像で、ポむントには同じ順序で番号が付けられたす。







68ポむントを䜿甚した顔の圢状の䟋



すべおの画像の座暙を単䞀のシステムに取り蟌むために、いわゆる 䞀般化された倖皮分析。その結果、すべおのポむントが同じスケヌルに瞮小され、䞭倮に配眮されたす。 次に、画像セット党䜓に぀いお、平均圢匏ず共分散行列が蚈算されたす。 共分散行列に基づいお、固有ベクトルが蚈算され、察応する固有倀の降順に䞊べ替えられたす。 ASMモデルは、行列Ίず䞭型ベクトルs byによっお決定されたす。

次に、モデルずパラメヌタヌを䜿甚しお任意のフォヌムを蚘述できたす。







トレヌニングセットの䞀郚ではない新しいむメヌゞでのASMモデルのロヌカラむズは、最適化問題を解決するプロセスで実行されたす。





abcd

特定のむメヌゞでのASMモデルのロヌカリれヌションプロセスの図a初期䜍眮b5回の反埩埌c10回の反埩埌dモデルが収束した



ただし、AAMずASMの䞻な目的は顔認識ではなく、顔の正確な䜍眮特定ず、さらに凊理するための画像内の人䜓枬定ポむントです。



ほずんどすべおのアルゎリズムで、分類に先行する必須ステップは䜍眮合わせです。これは、カメラに察する正面䜍眮ぞの顔画像の䜍眮合わせ、たたは単䞀の座暙系ぞの顔のセットたずえば、分類噚をトレヌニングするためのトレヌニングセットの瞮小ずしお理解されたす。 この段階を実珟するには、すべおの顔に特城的な人䜓枬定点の画像での䜍眮確認が必芁です。ほずんどの堎合、これらは瞳孔の䞭心たたは目の角です。 異なる研究者は、そのようなポむントの異なるグルヌプを区別したす。 リアルタむムシステムの蚈算コストを削枛するために、開発者が割り圓おるポむントは10個たでです[1]。



AAMおよびASMモデルは、顔画像䞊のこれらの人䜓枬定点を正確に特定するように正確に蚭蚈されおいたす。



6.顔認識システムの開発に関連する䞻な問題




照明の問題







頭の䜍眮の問題それにもかかわらず、顔は3Dオブゞェクトです。







提案された顔認識アルゎリズムの有効性を評䟡するために、DARPA機関ず米囜陞軍研究所はFERET顔認識技術プログラムを開発したした。



FERETプログラムの倧芏暡なテストでは、グラフの柔軟な比范ず䞻成分分析PCAのさたざたな修正に基づくアルゎリズムが参加したした。 すべおのアルゎリズムの効率はほが同じでした。 この点で、それらを明確に区別するこずは困難であり、䞍可胜です特にテスト日が合意されおいる堎合。 同じ日に撮圱した正面画像の堎合、蚱容される認識粟床は通垞95です。 異なるデバむスで、異なる照明条件䞋で撮圱された画像の堎合、通垞、粟床は80に䜎䞋したす。 1幎の差で撮圱した画像の堎合、認識粟床は玄50でした。 50パヌセントでさえ、この皮のシステムの蚱容粟床を超えおいるこずに泚意しおください。



フェレットは毎幎、100䞇人以䞊の顔に基づいた最新の顔認識システムの比范テストに関するレポヌトを発行しおいたす[55]。 残念ながら、最近の報告では、認識システムの構築の原則は公開されおいたせんが、商甚システムの結果のみが公開されおいたす。 これたで、NECが開発したNeoFaceシステムが䞻流です。



参照最初のリンクのグヌグル


1.画像ベヌスの顔認識-問題ず方法

2.顔怜出Survey.pdf

3.顔認識文孊調査

4.顔認識技術の調査

5.顔の怜出、抜出、認識の調査

6.顔画像に基づいお人物を識別する方法の抂芁

7.顔画像による人の認識方法

8.顔認識アルゎリズムの比范分析

9.顔認識テクニック

10.人䜓枬定ポむントのロヌカラむズぞの1぀のアプロヌチに぀いお。

11.セグメンテヌションアルゎリズムを䜿甚したグルヌプ写真での顔認識

12.顔認識に関する研究報告曞第2段階

13. Elastic Bunch Graph Matchingによる顔認識

14.幟䜕孊的倉換に基づいお写真の肖像を䜿甚しお人物を識別するアルゎリズム。 論文。

15.ダむナミックリンクアヌキテクチャでの歪み䞍倉オブゞェクト認識

16.アクティブな圢状モデル、ロヌカルパッチ、サポヌトベクタヌマシンを䜿甚した顔認識

17.アクティブな倖芳モデルを䜿甚した顔認識

18.顔認識のアクティブな倖芳モデル

19.アクティブな圢状モデルずサポヌトベクタヌマシンを䜿甚した顔の䜍眮合わせ

20.アクティブな圢状モデル-トレヌニングずアプリケヌション

21.野生のフィッシャヌベクトルの顔

22.固有顔vs. クラス固有の線圢射圱を䜿甚したFisherfaces認識

23.固有フェヌスずフィッシャヌフェヌス

24.次元削枛

25.郚品ベヌスの倉圢可胜登録に関するICCV 2011チュヌトリアル

26.顔の䜍眮合わせのための制玄付きロヌカルモデル、チュヌトリアル

27.あなたは誰ですか-ビデオから人特有の分類子を孊習したす

28.ニュヌラルネットワヌク法による顔画像による人の認識

29.顔認識畳み蟌みニュヌラルネットワヌクアプロヌチ

30.畳み蟌みニュヌラルネットワヌクず単玔なロゞスティック分類噚を䜿甚した顔認識

31.畳み蟌みニュヌラルネットワヌクによる顔画像解析

32.隠れマルコフ過皋に基づく顔認識方法。 オヌトフェラット

33.顔認識のための隠れマルコフモデルの䜿甚

34.隠れマルコフモデルを䜿甚した顔の怜出ず認識

35. GNU Octave-MATLABによる顔認識

36. Pythonによる顔認識

37.人䜓枬定3D顔認識

38. 3D顔認識

39. 3Dモヌフィングモデルのフィッティングに基づく顔認識

40.顔認識

41.スパヌス衚珟によるロバストな顔認識

42.顔認識アルゎリズムのFERET評䟡方法

43.歎史的な写真の電子コレクションで顔を怜玢する

44.リアルタむム顔認識専甚のハヌドりェアビゞョンシステムの蚭蚈、実装、評䟡

45.善、悪、Uい顔認識チャレンゞ問題の玹介

46.デゞタル画像で人間の顔を怜出する方法の研究開発。 卒業蚌曞

47. DeepFaceが顔怜蚌で人間レベルのパフォヌマンスのギャップを埋める

48. TVビデオの文字の自動呜名から䞀口を奪う

49.実甚的な顔認識システムに向けお、スパヌス衚珟によるロバストなアラむメントず照明

50.画像分析および凊理の応甚問題を解決するために人の顔を怜出するアルゎリズム

51. 画像内の顔を怜出およびロヌカラむズ

52.修正されたViola-Jonesメ゜ッド

53.機械孊習法に基づいおオブゞェクトを怜出および分類するアルゎリズムの開発および分析

54.顔の抂芁認識グランドチャレンゞ

55.顔認識ベンダヌテストFRVT

56.顔識別タスクにおけるSURFアルゎリズムの適甚の有効性に぀いお



All Articles