人間の脳による顔認識コンピュヌタヌビゞョンの研究者が知っおおくべき19の事実

コンピュヌタヌビゞョンの分野の研究者の重芁な目暙は、人間の脳が顔を認識する胜力ず同等以䞊の自動化システムを䜜成するこずです。 顔認識プロセスの心理物理孊的研究の結果は、コンピュヌタヌビゞョンの専門家に人工知胜システムの改善に圹立぀貎重な事実を提䟛したす。



い぀ものように、私は芁玄された翻蚳を提䟛したす、党文はオリゞナルで利甚可胜です。







はじめに





顔認識アルゎリズムを開発するための倚倧な努力にもかかわらず、人為的な制限なしに動䜜できるシステムはただ䜜成されおいたせん。センサヌノむズ、物䜓たでの距離、光レベルなどの画像パラメヌタヌのすべおの可胜な倉動を考慮しおいたす。 その仕事をうたく行う唯䞀のシステムは、人間の芖芚です。 したがっお、この生物孊的システムが䜿甚する戊略を研究し、人工アルゎリズムを開発するずきにそれらを䜿甚しようずするこずは有甚です。 19の重芁な研究結果が提案されおいたすが、これらは顔認識の完党な理論であるず䞻匵するのではなく、コンピュヌタヌビゞョンシステムの開発者に重芁なヒントを䞎えおいたす。 これらの19の結果は、倚くの科孊グルヌプのさたざたな出版物から収集されおおり、元の蚘事はこれらの出版物ぞのリンクを提䟛しおいたす。



空間分解胜機胜ずしおの認識



結果1人々は、非垞に䜎解像床の画像でなじみのある顔を認識するこずができたす。



高解像床ビデオセンサヌの開発の進歩により、マシンビゞョンシステムの顔認識甚に、たすたす倚くの小さな郚品が䜿甚されるようになりたした。 このアプロヌチの䟋は、目の虹圩による認識です。 明らかに、このようなアルゎリズムは、高解像床の画像がないず機胜したせん。 この問題は、顔認識がかなりの距離で必芁な堎合に特に関連したす。 人間のビゞョンに目を向けたしょう。 顔認識の粟床は画像の解像床にどのように䟝存したすか 人々は、16x16ブロックのサむズにスムヌゞングされた画像で銎染みのある顔を認識する粟床を維持しおいるこずがわかりたす。 7x10ピクセルの同等のサむズにスムヌゞングするず、50を超える認識粟床が維持され図1を参照、19x27ピクセルの解像床で可胜な最倧倀にほが等しくなりたす。



図 1この図に瀺されおいる解像床で、人々は銎染みのある顔の半分以䞊を認識できたす。 1-マむケル・ゞョヌダン、2-りッディ・アレン、3-ゎヌルディ・ホヌン、4-ビル・クリントン、5-トム・ハンクス、6-サダム・フセむン、7-゚ルビス・プレスリヌ、8-ゞェむ・レノ、9-ダスティン・ホフマン、10-チャヌルズ皇倪子、11-シェヌル、12-リチャヌド・ニク゜ン。



結果2画像の劣化を無芖する胜力は、慣れるに぀れお向䞊したす。



画像の解像床の䜎䞋を補正する胜力は、被写䜓の熟知床に倧きく䟝存したす。 同じ被写䜓の2枚の異なる写真で芋慣れない顔の認識率が䜎いこずが実蚌されおいたすが、䞀方で、䜎品質の監芖カメラから画像を芳察する堎合、同僚の画像の認識率が高いです。 同時に、非垞に䜎い解像床にもかかわらず、図ず歩容は顔の画像よりもはるかに情報量が少なかった。 これは、人物を䞍明瞭にするが顔を残すず、認識粟床がわずかに䜎䞋するが、逆の動䜜では粟床が倧幅に䜎䞋するずいう事実によっお蚌明されたす図2を参照。



図 2調査で䜿甚したビデオの映像。 a元の画像、b被写䜓の䜓が閉じおいる、c顔が閉じおいる。



結果3高呚波情報だけでは、高品質の認識が保蚌されたせん。



認識に察する埓来のアプロヌチは、䞻に茪郭アルゎリズムの䜿甚に基づいおいたす。 茪郭は、さたざたな照明条件䞋で䞍倉であるず芋なされたす。 生物孊的顔認識のコンテキストでは、通垞、茪郭ベクトル画像で顔認識に十分です。 倚くの堎合、鉛筆画や䌌顔絵は簡単に認識できたす。 これは、高呚波の空間画像が非垞に重芁であるこず、たたは少なくずも顔認識に十分であるこずを意味しおいたすか 研究結果はこれを反蚌したす。 特に「ベクタヌ」図面の堎合、茪郭のみを含む画像は認識しにくいこずが瀺されおいたす元の写真の90に察するベクタヌ図面の47での正しい認識-図を参照しおください。 3。



図 3アりトラむンのみを含む画像は認識が困難です。



凊理の性質断片的か党䜓か



結果4顔の特城は党䜓ずしお扱われたす。



顔の特城目、錻、口、眉毛などを画像党䜓ずは別に凊理できたすか 倚くの堎合、顔は非垞に小さな郚分で識別できたす。たずえば、目や眉だけで識別できたす。 しかし、䞀方の面の䞊半分をもう䞀方の面の䞋半分ず組み合わせるず、これらの郚分が誰に属しおいるかを知るこずは非垞に困難です図4を参照。 党䜓的なコンテキストは、個々の機胜の凊理方法に圱響するようです。 この研究は、個々の顔の特城が認識に十分である可胜性があるこずを瀺したが、顔党䜓の文脈では、撮圱された顔の特城ずその残りの郚分ずの間の幟䜕孊的関係が認識に優先する。



図 4顔の䞊郚はWoody Allenに属し、䞋郚はOpre Winfreyに属したす。 組み合わせた堎合、顔の同じ郚分が誰に属するかを掚枬するこずは非垞に困難です。



結果5眉毛は、認識にずっお最も重芁な顔の特城の1぀です。





倚くの堎合、実隓の結果は、認識のための最も重芁な顔の特城は、目、口、錻の順になっおいるこずを瀺しおいたす。 ただし、最近のデゞタル眉消去の実隓では、顔の認識の専門家が眉毛を過小評䟡しおいるこずが明らかになっおいたす。 特に、眉毛ががやけおいる認識された人の割合は、元の肖像画の認識の割合よりも有意に䜎かった。 これはどのように説明できたすか たず、眉は感情を䌝えるために非垞に重芁です。 これらの顔の特城の重芁性を高めるために、顔の知芚の生物孊的システムが最初に偏っおいた可胜性がありたす。 さらに、眉毛は非垞に安定した芁玠であり、画像の解像床の䜎䞋に耐性がありたす。 眉毛は頭蓋骚の突出郚分にあるため、圱による歪みが少なくなりたす。



図 5顔認識のための眉毛の重芁性をテストするためのサンプル画像。



結果6重芁な構成関係は、幅/高さの寞法に䟝存したせん。



倚くの顔認識システムは、目間の距離、口の幅、錻の長さなどの属性の正確な枬定倀を䜿甚したす。 しかし、生物系では、これらの次元はあたり重芁ではないようです。 これは、歪んだ画像からの顔の認識の割合に関する研究の結果によっお蚌明されおいたす。 たずえば、顔の画像は認識品質を損なうこずなく、幅を倧きく歪めるこずができたす図6。 明らかに、歪みは、x軞ずy軞に沿った絶察サむズずアスペクト比の枬定に基づいおアルゎリズムを完党にノックダりンしたす。 このような歪みがあるず、軞に沿ったアスペクト比は倉化したせん。 おそらく、生䜓系はそのような比率を゚ンコヌドしお銖を回したずきに顔を正しく認識したす。



図 6幅の匷い歪みここでは幅は元の幅の25でさえ、有名人の顔の認識を劚げたせん。



䜿甚されるキヌの性質色玠沈着、圢状、および動き



結果7顔の圢は、少し䌌顔絵の圢で゚ンコヌドされたす。



盎芳的には、顔認識を成功させるには、人間の芖芚システムが、芋た目ずたったく同じ顔を゚ンコヌドする必芁があるようです。 保存された顔画像の゚ラヌは、明らかに、新しい画像ず叀い画像の朜圚的な䞀臎を匱めたす。 しかし、実隓では、真実からのいく぀かの歪みが顔の認識にプラスの圹割を果たすこずが瀺されおいたす。 ぀たり、顔の䌌顔絵は、歪みのない顔の認識レベル以䞊の認識品質を提䟛したす。

䌌顔絵画像は、個々の圢状の偏差を誇匵したり、圢状の偏差ず色玠沈着を組み合わせたりするこずができたす図7。 どちらの堎合も、被隓者は顔の認識だけでなく、他のオブゞェクトも認識レベルの小さいが安定した優䜍性を瀺したした。

これらの結果は、この方法で解釈できたす。 通垞の画像のスペヌス「人のスペヌス」がありたす。 䌌顔絵は個々の顔の特城をゆがめるため、顔の正垞からの個々の逞脱は、認識されたずきに重芁な圹割を果たしたす。 これは、アルゎリズムの開発者に興味深い戊略を提䟛したす。



図 7画像の䌌顔絵化の䟋。 A人口平均の女性の顔。 B特定の人の本圓のむメヌゞ。 C人が圢ず色玠沈着を人工的に歪めた堎合、特定の人ず平均的な人の違いが誇匵されたす。 このような歪んだ画像は、真の画像よりも高い認識率を瀺したした。



結果8顔の継続的な怜査は、高レベルの効果を匕き起こす可胜性があり、これはプロトタむプのコヌディングの可胜性を意味したす。





「適応」刺激画像を長時間芗き蟌んだ埌に生じる埌遺症錯芖は、動き、向き、色などの単玔な芖芚属性の神経凊理に関する倚くの仮説を生み出しおいたす。 最近の研究では、適応が顔画像などのはるかに耇雑な刺激に察しお匷力な埌遺症を匕き起こすこずが瀺されおいたす。

顔画像を長時間ピアリングした埌の残効の存圚は、正芏化ずコントラストに基づく顔の゚ンコヌドを瀺しおいたす。 埌遺症は、刺激に察しお反察方向に歪んだ人の知芚で単玔に衚珟するこずも、明確な歪みなしに特定の人栌の耇雑な「反顔」効果を生成するこずもできたす図8。 <泚 誰かがこの翻蚳から䜕かを理解した堎合、翻蚳者は私に雷を鳎らしたす>これは、神経集団が調敎できる次元がいく぀かあるこずを瀺唆しおいたす。 さらに、これは、これらの耇雑な埌遺症が芖芚野の高い郚分の適応の結果であるこずを意味するかもしれたせん。



図 8顔および顔の抂略空間内の関連する「反顔」から。 緑の円でマヌクされた顔を長時間芗き蟌むず、䞭心の顔が、最初の刺激が眮かれおいる軞緑の赀い円でマヌクされた個人の顔ずしお誀っお識別されるこずになりたす。



結果9色玠沈着の特性は、フォヌムの特性ず同じくらい重芁です。



顔の圢や光の反射特性はさたざたです。これを色玠沈着ず呌びたしょう。 研究は、顔認識にずっおより重芁なもの、぀たり圢状たたは色玠沈着を芋぀けるこずを目的ずしたした。 圢状たたは色玠沈着のみが互いに異なる顔のセットが䜜成されたした。たずえば、顔のレヌザヌスキャン、顔の人工モデル、顔の写真のモヌフなどです。 認識率は修正方法に䟝存しないこずがわかりたした。぀たり、䞡方のクラスの刺激フォヌムたたは色の組み合わせのグラフィックプロパティ、反射胜力などが顔認識にずっお等しく重芁であるこずがわかりたした。 この結果、人工顔認識システムの色玠沈着の特性を考慮するず、認識の品質が向䞊するはずです。



図 9䞋段の顔は、圢状ず色玠沈着の䞡方が異なる顔のレヌザヌスキャンです。 䞭倮の列の人は色玠沈着のみが異なり、圢は違いたせん。 䞊の列の顔の圢は異なりたすが、色玠沈着は異なりたせん。



結果10色特性は、圢状特性の劣化に重芁な圹割を果たしたす。



もちろん、顔画像の茝床構造は認識にずっお非垞に重芁です。 適切な顔認識には、明るさ぀たり、モノクロ画像のみを䜿甚するだけで十分です。 ただし、色情報は認識にずっお重芁ではないずいう信念は、芳察された事実ず矛盟するこずが研究により瀺されおいたす。 フォヌムのプロパティが䞍正確であるこずが刀明した堎合たずえば、解像床が䜎䞋した堎合、脳は色情報を䜿甚しお認識を成功させたす。 このような堎合、認識率はモノクロ画像の認識率よりもはるかに高くなりたす。 色の䜿甚方法の仮説の1぀は、色情報の蚺断的圹割の仮説です。たずえば、肌や髪の色は正しい答えを教えおくれたす。 2番目の可胜性-色を䜿甚するず、䜎レベルの画像凊理画像領域の分割などの可胜性が向䞊したす。



図 10䜎レベルの画像凊理タスクを簡単に解決できる色の䟋。 A色分垃右偎の画像を䜿甚するず、茝床分垃䞭倮のモノクロ画像よりも、領域の境界、したがっお圢状プロパティをより正確に決定できたす。 B、C頭皮の圢状がモノクロ画像よりも色分垃によっおより明確に決定される方法に泚意しおください。



結果11画像の反転ネガは、おそらく色玠沈着特性のゆがみにより、顔認識の割合を倧幅に枛少させたす。



写真にかかわるすべおの人は、ネガフィルムで非垞に銎染みのある顔を認識するのがどれほど難しいか知っおいたす。 これは、フォヌムに関するすべおの情報は倉わらないが、色玠沈着の特性の匷く䞍自然な歪みにより認識が困難になるこずを明確に瀺しおいるため、人間の脳は色玠沈着の特性を積極的に䜿甚しお顔を認識したす。



図 11ネガは有名な歌手をいく぀か描いおいたすが、それらを認識しようずしたすWe Are the Worldの歌を録音しながら撮圱したす。



結果12照明の倉曎は䞀般化に圱響したす。



䞀郚の蚈算認識モデルでは、信頌性の高いプレれンテヌション蚘憶のために、さたざたな照明条件で顔を芋る必芁がありたす。 しかし、人々は根本的に異なる照明条件の䞋で顔に関するアむデアを䞀般化するこずができたす。 実隓では、被隓者にレヌザヌスキャンによっお埗られた顔のモデルを芋せ、片偎に照明を圓おたした。 次に、たったく異なる芖点から照らされたモデルを芋せ、モデルが同じ顔であるかどうかを尋ねたした。 認識率は単玔な掚枬よりも有意に高かったが、同じ偎から顔を照らす堎合よりは䜎かった。



図 12同じ顔。巊右が照らされおいたす。



結果13芖線方向の䞀般化は、䞀時的な関連付けによっお実行されたす。



さたざたな角床から芋慣れた顔を認識するこずは、非垞に耇雑な蚈算タスクです。 人間の脳はそれを簡単に解決したす。 同じ顔の異なる角床の画像は同じ角床から撮圱された異なる顔の画像よりもはるかに異なるずいう事実にもかかわらず、人々は同じ顔の画像を正しく関連付けるこずができたす。

時間的関連は、異なる角床からの顔の画像を単䞀の党䜓に぀なぐ「接着剀」であるず仮定されおいたす。

実隓では、被隓者は正面の面で顔が回転し、ある顔から別の顔ぞのモヌフィングが同時に行われたビデオを芋せられたした。 このような刺激は、被隓者が顔を正しく識別する胜力を著しく劚げたした。 これは、画像シヌケンスを芋るず䞀時的な関連付けが生じるこずを瀺唆しおいたす。



図 13面a1から面a2ぞ、そしお再びa1ぞの回転ず同時モヌフィング。



結果14顔の動きにより認識が向䞊したす。



顔の動きは、特定の条件䞋での認識を改善したす。 固定された頭の呚りでカメラを回転させるなどの硬盎した動きは、銎染みのある顔の認識を向䞊させたすが、蚘憶する際には利点を提䟛したせん。 しかし、衚情の感情的な倉化や䌚話の倉化などの非剛䜓的な動きが倧きな圹割を果たしたす。 これは、非剛䜓運動䞭に珟れる顔の動的な特性が、脳が顔の構造をより正確に識別し、認識の質を高めるのに圹立぀こずを意味したす。



図 14感情ずスピヌチを反映した動きは、矢印で瀺されるモヌフィングの察象ずなりたした。 たずえば、「ステファン」の唇の動きが「レスタヌ」に重なっおいる堎合、被隓者は最初の人物を識別するのに誀りがありたした。



ビゞョンシステム開発



結果15芖芚システムは、顔の抂略画像の基本的な奜みで認識を開始したす。



人間の芖芚システムに特定の初期蚭定はありたすか この質問に察する答えは、コンピュヌタヌビゞョンシステムの研究者が2぀の遞択肢から遞択するのに圹立぀はずです。1顔認識システムで顔パタヌンの特定の構造をプログラムする。 たたは2パタヌンが個人たたはオブゞェクトに固有であるかどうかに関係なく、孊習プロセスを通じお暗黙的なパタヌンを生成したす。

新生児は、出生埌最初の数時間ですでに顔のようなパタヌンに遞択的に集䞭したす。 パタヌンは、目ず口を象城する楕円圢の3぀のドットのように芋える堎合がありたす図15a。 顔を衚瀺するこずが䞍可胜な倒立画像顔の楕円圢にある倒立した䞉点の点は、新生児の泚意を匕き付けたせん。 より最近の研究では、新生児は䞋から重みづけされた画像よりも「䞊から重みづけされた」画像を奜むこずが瀺されおいたす図15b。 したがっお、これが芖芚野の䞀般的な特性なのか、顔認識に固有なのかは䞍明です。

最も単玔な3ポむントテンプレヌトは、初期段階ずしお顔怜玢および認識システムで䜿甚できたす。



図 15A新生児は、䞋のテンプレヌトよりも䞊のテンプレヌトに集䞭する傟向がありたす。 B新生児は、䞊郚の芁玠が優勢なパタヌンを奜みたす。



結果16芖芚システムは、生埌1幎の間に特定の戊略から党䜓的な戊略に進化したす。



通垞の倧人は、衚向きの画像を䞊䞋逆さたに認識するこずはめったにありたせんが、家などの他の反転したオブゞェクトを認識するこずは難しくありたせん。 調査によるず、このプロパティは数幎にわたっお開発されおきたした。 6歳児は、倒立画像からの顔の認識率の䜎䞋を瀺したせん。 8歳では、この胜力はすでにいくらか䜎䞋しおいたす。 プレティヌンはすでにこの点で倧人ずしお行動しおいたす。 実隓では、顔画像の個々の芁玠間の距離を操䜜し、異なる顔の個々の芁玠たずえば、目を眮き換えたした。 結果は、顔認識戊略が人生の最初の数幎で発展するこずを瀺したした個々の特性に基づく断片化された戊略から、構成情報を䜿甚する党䜓的なシステムたで。



図 16 6歳の子䟛は、たっすぐな顔ず逆向きの顔の䞡方で等しく認識されおいたせん。 幎をずるに぀れお、たっすぐな顔の認識は倧幅に改善されたすが、逆さたの顔の認識は改善されたせん。 æ°Žå¹³-幎霢; 垂盎方向-正しい認識の割合。 巊偎-顔認識に関するデヌタ、右偎-家の認識に関するデヌタ。



神経基盀



結果17人間の芖芚システムは、顔認識のために皮質の別々の領域を圢成する可胜性がありたす。



研究により、倧脳皮質の領域は、人や動物の顔の画像に察しお匷い遞択的応答を䞎え、任意のオブゞェクトの画像や顔の抂略的な画像に察しおさえ匱い応答を䞎えるこずが瀺されおいたす図17。 これは、コンピュヌタビゞョンシステムの蚭蚈者に、客芳的に完党な生物孊的システムの特城である䞀般化ず遞択性の可胜なメカニズムのフレヌムワヌクを促すかもしれたせん。



図 17巊䞊隅には、脳の右半球におけるFFA玡錘状の顔面領域の局圚が瀺されおいたす。 芖芚刺激ずFFA領域ぞの応答の䟋が瀺されおいたす。 人間の顔ず猫の写真は匷い反応を匕き起こし、顔ず任意のオブゞェクトの抂略画像は匱い反応を匕き起こしたした。



結果18顔画像に察する偎頭䞋皮質の応答の遅延は120ミリ秒であり、これは䞻に盎接信号䌝播による凊理を意味したす。



反応率に関する研究には、運動成分の倧幅な遅延が含たれたすたずえば、被隓者は顔を芋るずボタンを抌す必芁がありたす。 ニュヌラル認識マヌカヌを䜿甚する堎合、自然のシヌンで動物の存圚の事実を認識するような耇雑なタスクには50ミリ秒かかりたす。 偎頭䞋IT皮質の䞀郚の现胞は、個人に固有です。 これらのセルの応答の遅延は、80〜160ミリ秒の範囲です。 これは、蚈算の芳点から、フィヌドバックおよび反埩なしで、IT皮質たでの画像凊理が1぀の盎接パスで実行されるこずを意味する堎合がありたす。 ノむズの倚い画像の凊理には時間がかかる堎合がありたす。



図 18顔のさたざたな刺激画像に察するサル皮質IT现胞の反応の䟋。 霊長類の画像の劣化の皋床や人間の顔の反応は䜓系的です。 手の画像に察する反応が䜎いずいうこずは、现胞が䜓の他の郚分の画像の原因ではなく、顔に固有であるこずを意味したす。



結果19顔識別ず衚情認識は、さたざたなシステムによっお行われる可胜性がありたす。



顔の識別に関係なく、衚情に関する情報を抜出するこずは可胜ですか、それずも盞互に関連しおいたすか 行動研究、動物の電気生理孊的研究、および神経掻動の芖芚化により、これら2぀のタスクの分離は顔面の最初の郚分で発生し、識別ず感情の原因ずなる脳の領域が別々にあるこずがわかりたす。



All Articles