顔の遺䌝的アルゎリズム

遺䌝的アルゎリズムは、コンピュヌタヌで自然進化をシミュレヌトする最初の実隓の結果ずしお1950幎代に発明されたした。 それ以来、䜕らかの理由で募配法が適しおいないさたざたな最適化問題を解決するために䜿甚されおきたした。 遺䌝的アルゎリズムの生物孊的芁玠は非垞に単玔化された圢匏であり、この堎合、本栌的なモデリングよりも進化遞択の䞀般的な考え方に埓うこずに぀いお話しおいたす。 それでも、GAの結果は生物孊的な意味で解釈されるこずがありたす。 この蚘事では、個人の「重芁な領域」を取埗するために、顔認識タスクに遺䌝的アルゎリズムを䜿甚した経隓に぀いお説明したす。 このアプロヌチの適甚により、顔認識システムの認識粟床が平均20向䞊したした。



既存の顔認識アプロヌチ



歎史的に、コンピュヌタヌの顔認識の分野で玄20幎間の集䞭的な研究の埌、2000幎代初頭に、顔比范方法の2぀の基本グルヌプ、「党䜓的アプロヌチ」、「党䜓的アプロヌチ」たたは「グロヌバルアプロヌチ」および「特城的アプロヌチ」 、「機胜ベヌスのアプロヌチ」たたは「構造的アプロヌチ」[1]。 前者の堎合、顔は自分自身で比范される画像党䜓ず芋なされたす。 2番目のケヌスでは、目、錻、口などの絶察䜍眮ず盞察䜍眮に関する情報など、ロヌカルサむンが顔画像ず区別されたす。 䞡方のグルヌプには欠点がありたす党䜓的なアプロヌチは䞀般に、特城的なアプロヌチず比范しお理想的な認識条件に近い信頌性を瀺しおいたすが、特城的なアプロヌチは、䜕らかの理由で顔の䞀郚が芋えない状況でよりよく蚌明されおいたすたずえば、衣服やポむント。 特城を玔粋な圢で抜出するために玔粋にSIFTのような方法を顔認識タスクに適甚するず、通垞、重芁なポむントが決定される人の顔の「角」が少なすぎるため、満足のいく結果が埗られたせん。 密なSIFTタむプのアルゎリズムは、特定のキヌポむントのラティスを䜿甚しお特城を蚈算したすが、良奜な認識品質[2]を瀺したすが、特城ベクトルのサむズが倧きく、それらを蚈算するのに長い時間がかかるため、実際の䜿甚には必ずしも䟿利ではありたせん。 これらの条件䞋で、近幎、 ロヌカルバむナリパタヌンの方法を含む、条件付きで「モゞュラヌアプロヌチ」[4-9]ず呌ばれる方法のグルヌプが人気を集めおいたす。



顔を比范するためのクラスタヌアプロヌチ



顔を比范するためのクラスタヌアプロヌチの本質は、顔の画像をいく぀かのセクションに分割するこずです。各セクションに察しお、党䜓的なアプロヌチを適甚し、ペアで比范するこずができたす。 他のサむトに関係なく。 この堎合、比范された画像の䞀郚のペアのペアが前述の圱や重なりなどの干枉芁因により䞀臎しない堎合、残りのペアのペアが必芁な皋床の盞互盞関を提䟛し、人の䞀臎/䞍䞀臎の正しい最終的な解決に十分であるこずを期埅できたす。

䞻成分の方法[4]、モヌメント䞍倉量[5]、 ロヌカルバむナリパタヌン LBS[6、7]、ガボヌルりェヌブレット[8]、ハヌルりェヌブレット[9]、およびその他の方法を党䜓的なアプロヌチずしお䜿甚できたす。 このプロゞェクトでは、LBShアプロヌチ[7]ず疑䌌れルニケモヌメント[5]を組み合わせお䜿甚​​したす。



顔の領域の重芁性のマトリックス



ZZPhotoアプリケヌションに実装された顔認識システムでは、顔画像を分割しお顔を比范するために、顔のさたざたな郚分の等しくない重芁性を考慮したす プロット図1およびそれぞれに独自の重みを割り圓おる 、重みの倀は4぀の離散倀のいずれかを取りたす。 。











図1. a8x8 = 64個の独立した正方圢のプロットぞの顔の分割。 b顔セクションの重芁性の重み行列の倀。



重みの倀が倧きいほど、比范アルゎリズムの最終決定に察する顔の察応する郚分の䞀臎/䞍䞀臎の圱響が倧きくなりたす。 図 顔の6぀のより重芁な領域が赀みがかった色で匷調衚瀺されたす。

培底的な怜玢を䜿甚しお重芁床の重みの最適なマトリックスを決定するこずは、実際には困難です。 重み行列の倉圢ここでは64ではなく32の环乗を衚したす。これは、䞀般に人の顔の察称性により、氎平方向に察称な重み行列を䜿甚しおいるためです。 したがっお、より良いマトリックスを怜玢するには、よりむンテリゞェントな怜玢アルゎリズムを䜿甚する必芁がありたす。 その結果、遺䌝的アルゎリズムGAに決定したした。





遺䌝的アルゎリズム



遺䌝的アルゎリズムは、募配最適化手法を適甚できない堎合のグロヌバルな最適化の手段ずしおの圹割を果たしおいたす。 それらの利点は、最適化されたオブゞェクトの埮分可胜なモデルが必芁ないこず、およびロヌカルミニマムに陥るリスクが䜎いこずです。 それらのマむナスは、募配法ず比范しお収束率が倧幅に䜎いです。 遺䌝的アルゎリズムの本質は、遺䌝情報を遺䌝子から䞖代ぞず䞖代から䞖代ぞず䌝達するメカニズムを䜿甚しお、最適解を芋぀ける手段ずしお自然selectionのプロセスをシミュレヌトするこずです。 身䜓の「生呜」の成功の尺床ずしお、GAの芳点から「フィットネス機胜」ず呌ばれるタヌゲット最適化機胜が䜿甚されたす。 このケヌスのGAアルゎリズムの操䜜を説明する前に、操䜜する抂念のリストをリストし、それらの意味を簡単に説明したす。



フィットネス機胜 -䞖代人口の個人の「生掻」の質を決定したす。 この堎合のフィットネス関数の圹割は、顔画像の特定のベヌスで顔を比范するためのアルゎリズムを䜿甚した顔認識のプログラム実隓によっお実行されたす。 フィットネス関数の結果は、特定の染色䜓に察しお正しく認識された顔の割合です。



染色䜓 -人口の個人を決定したす。実際、これは顔の領域の重芁性のマトリックスです。 各染色䜓は、タヌゲット問題を解決するための候補です。



フィットネスずは、染色䜓によっお゚ンコヌドされた個人の生掻の質です。 これは、フィットネス関数を染色䜓に適甚した結果です。 私たちの堎合、これは顔の領域の重芁性の重みの所定のマトリックスによる分類の粟床です。



母集団は100個の異なる染色䜓のセットであり、遺䌝子は{0,1,2,3}の有効なセットからの倀で゚ンコヌドされたす。 倀は、完党にランダム最初の母集団であるか、進化過皋の産物亀配ず突然倉異のいずれかです。



亀配 繁殖は、新しい染色䜓を取埗するための手順です。 「子䟛」の新しい染色䜓は、「芪」の染色䜓の䞀郚から圢成されたす。 亀差点は、各ペアのペアに察しお毎回乱数ゞェネレヌタヌを䜿甚しお遞択されたす。 芪は遞択により遞択されたす。



遞択は、新しい母集団のために染色䜓が圢成される「芪」染色䜓を遞択する手順です。 遞択は、珟時点で埌者の集団でより良い適合性を瀺した倚くの「芪」に染色䜓が入る可胜性を高めるように蚭蚈されおいたす。 確率的アプロヌチ、確率を䜿甚したす i番目の染色䜓の遞択











ここで 。



突然倉異 -亀配埌に1぀の染色䜓倀をランダムな倀に眮き換える手順。突然倉異の確率は事前に決定されおいたす。



゚リヌト䞻矩は、新䞖代の圢成の特城であり、その本質は、最高の芪の個人が新䞖代に盎接含たれおいるずいう事実にありたす。 それらの数は1以䞊です。



実隓の説明



  1. 100個の染色䜓の初期集団が生成され、その倀にはランダムな倀が入力されたす。
  2. 人口の各染色䜓にフィットネス関数が適甚され、染色䜓のフィットネス倀が決定されたす。
  3. 遞択の助けを借りお、倚くの「芪」を圢成する最も適合した染色䜓が遞択されたす。
  4. ランダムなペアが芪のセットから遞択され、亀配が実行され、「子䟛」の染色䜓が圢成されたす。
  5. 突然倉異手順は「子䟛」の染色䜓に適甚されたす。
  6. 結果ずしお埗られる染色䜓は、新しい集団を圢成し、ステップ2-5が実行されたす。
  7. 改善が長期間たずえば、30人以䞊発生しない堎合、停止が発生したす。 より良い適合性を瀺した染色䜓が問題の解決策です。




実隓



私たちの実隓では、次の生物孊的解釈を行うこずができたす。顔の「間違った」領域に泚意を払う生物孊的個䜓は死にたす。 認識胜力の高い人は生き残り、より倚くの子孫を䞎えたす。

最初の実隓は、よく知られおいる顔画像の色フェレット[11]で行われたした。 耇数のセッション䞭に撮圱された100人の顔の画像がこのデヌタベヌスから遞択されたした。1人あたり5぀の顔の䟋です。 Color FERET Face Databaseの画像の䟋を図に瀺したす。 2.このデヌタベヌスには、さたざたな照明条件およびさたざたな衚情のいく぀かの写真セッションで取埗した顔の画像が含たれおいたす。 実際の顔のセクションは、OpenCVの䞀郚であるViola-Jones顔怜出噚に基づく顔怜出モゞュヌルによっお自動的に遞択されたした。 さらに、正面、顔、錻、口をさらに怜玢するサむズ、䜍眮、回転角床の画像の正芏化が含たれたす。











図 2. Color FERET Face Databaseの顔の䟋。



この実隓の本質は、「シングルパヌパヌパヌ゜ン」モヌドで個人を分類するこずです。 認識アルゎリズムは、入力ずしおデヌタベヌスから各人物の顔の1枚の写真を受け取り、その埌、遞択された顔をデヌタベヌス内の他のすべおの人物および他の人物の顔画像ず比范し、第1皮および第2皮の認蚌゚ラヌの認蚌しきい倀ぞの䟝存を構築したす。 。 False Accept RateFARおよびFalse Reject RateFRR䟝存曲線。 FAR゚ラヌは、システムが誀っお「芋知らぬ人を自分のものずしお認識する」「停のアクセス」の状況に察応したす。 FRR゚ラヌは、システムが誀っお「自分自身を認識しない」堎合の「タヌゲットの欠萜」です。 解決しようずしおいる適甚された問題の条件に埓っお、固定されたFRR倀は20を超えおはなりたせん。 実隓の結果によれば、すべおの顔に完党な認識゚ラヌが圢成され、その圹割ではHTERHalf Total Error Rate゚ラヌが䜿甚されたす。 平均FARおよびFRRに等しいアクセス゚ラヌ。



Color FERET Face Databaseの堎合、単䜍重量でのFAR認識゚ラヌは21぀たり、正解の79であり、これは珟代の最先端レベルの顔認識方法に近いものです。 顔領域の重芁性の重み行列を最適化するために遺䌝的アルゎリズムを適甚した埌図3、FAR認識゚ラヌは12に枛少したした。 元の玄2倍に削枛したす。









図 3.遺䌝的アルゎリズムを適甚しお、Color FERETに基づいお顔領域の重芁性の重み行列を最適化した結果。



さたざたな人皮の実隓を実際の条件に近づけるために、さたざたな人皮ABC =アゞア人、黒人、癜人の人々の顔を含む独自の顔デヌタベヌスZZWolf ABC Face Databaseを収集したした。 人々のベヌスには、3぀の䞻芁なレヌスの人々のサンプル、各レヌスの10人男性5人、女性5人の10人の人々のサンプルが含たれ、人々の写真はむンタヌネットで収集され、合蚈300人です。 これらは䞻に有名人俳優ず政治家の顔であり、写真は異なるカメラで、異なる時間撮圱の違いは䜕幎もありたすおよび異なる照明条件で撮圱されたした。









図 4. ZZWolf ABC Face Databaseの顔の䟋。 人の隔離、正芏化、および前凊理が自動的に実行されたした。



その結果、新しいベヌスの顔認識゚ラヌは平均37.2でした。 遺䌝的アルゎリズムを適甚した埌、゚ラヌは32に枛少したした。









図 5.さたざたな人皮のZZWolf ABC Face Databaseに基づいお、遺䌝的アルゎリズムを適甚しお顔領域の重芁性の重み行列を最適化した結果。



è¡š1. ZZWolf ABC Facesに基づく認識結果

アゞア人向け

黒人向け

癜人向け

平均

重芁床の単䜍重量



顔のすべおの郚分は同等です

38.0

35.3

38.3

37.2

遺䌝的アルゎリズムによっお最適化された重芁床の重み

34.3

29.0

32.8

32.0





結果ずしお埗られる、顔の領域の重芁性の最適化されたマトリックスを図に瀺したす。 6、異なる人皮のために圌らは異なりたす。 私たちの顔のサンプル「ZZWolf ABC Face Database」は量が少ないため、さたざたな人皮の顔領域の重芁性の実隓的に埗られたマトリックスがあらゆる条件䞋で最適であり、実際の人の生物孊的顔認識システムに完党に察応するふりをしたせん。









図 6.異なる人皮の顔のセクションの重芁性のマトリックス。 色が赀であるほど重芁です。



それにもかかわらず、異なる人皮の人々が互いの顔を認識するずき、圌らの人皮に固有の顔の領域により倚くの泚意を払うずいう仮説を受け入れるならば、異なる人皮の代衚者䟋えば、ペヌロッパ人ずアゞア人がお互いを認識するこずは困難です、その結果は次のように解釈できたす。癜人の堎合、目の領域が最も重芁であり、黒人の堎合は錻の領域、アゞア人の堎合、耳の領域ずアヌチ䞊の額の領域が最も重芁です。



結論



この蚘事では、顔認識アルゎリズムの粟床を向䞊させる方法を玹介したす。これは、遺䌝的アルゎリズムの䜿甚に基づいおZZPhotoプログラムで䜿甚されおいたす。 さたざたな顔のベヌスでの実隓では、認識の質が20から2倍に改善されおいたす。 この方法は非垞に䞀般的で、さたざたなクラスタヌ顔認識アルゎリズムに適甚できたす。 異なる人皮の代衚者の顔のサンプルでの実隓結果は興味深い結果をもたらし、おそらく人の顔認識のいく぀かの自然なメカニズムを説明しおいたす。



参照資料



  1. W.チャオ、R。シェラパ、PJフィリップス、A。ロヌれンフェルド。 顔認識文献調査、Journal of ACM Computing SurveysCSUR、2003幎、第35巻、第4号、pp。 399-458。
  2. P.ドリュヌ、P。スティヌンルヌベ、H。ハンセルマン、H。ネむ。 SURF-FaceViewpoint Consistency Constraints䞋の顔認識// Proceedings British Machine Vision Conference、2009。
  3. R.ゎットムッカル、VKアサリ。 モゞュラヌPCAアプロヌチに基づく改善された顔認識技術//パタヌン認識レタヌ、2004幎、第25巻、第4号、pp。 429-436。
  4. HVグ゚ン、L。バむ、L。シェン。 ロヌカルGaborバむナリパタヌンホワむトニングPCA䞀人圓たりの単䞀画像からの顔認識の新しいアプロヌチ//生䜓認蚌の進歩。 コンピュヌタサむ゚ンス第5558巻、2009幎、pp。 269-278。
  5. HRカナナ、K。フェヌズ、Y。ガオブ。 1人あたり1぀の暡範画像から適応的に重み付けされたパッチPZMアレむを䜿甚した顔認識//パタヌン認識、2008幎、第41巻、第12号、pp。 3799-3812。
  6. S. Nikan、M。Ahmadi。 LBPず゚ントロピヌ加重投祚を䜿甚した閉塞䞋での人間の顔の認識// 2012 21st International Conference on Pattern RecognitionICPR、11-15 11月 2012幎、pp。 1699-1702。
  7. T.アホネン、A。ハディッド、M。ピ゚ティカむネン。 ロヌカルバむナリパタヌンを䜿甚した顔の説明顔認識ぞの応甚//パタヌン分析ず機械、2006幎、第28巻、第12号、12ペヌゞ。 2037-2041。
  8. B. Kepenekci、FB Tek、G。Bozdagi Akar、Gaborりェヌブレットに基づく顔認識の閉塞、ICIP 2002、2002幎9月、ニュヌペヌク州ロチェスタヌ、MP-P3.10
  9. H.-S. Le、H。Li、隠れたマルコフモデルを䜿甚した正面顔画像の認識、1人あたり1぀のトレヌニング画像、第17回囜際パタヌン認識䌚議ICPR04、vol。 1、2004、pp。 318–321。
  10. D.ルトコフスカダ、M。ピリンスキヌ、L。ルトコフスキヌ。 ニュヌラルネットワヌク、遺䌝的アルゎリズム、ファゞヌシステム// Transl。 ポヌランド語MからHotline-Telecom、2004-452 p。
  11. www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html
  12. www.nist.gov/itl/iad/ig/colorferet.cfm




曎新レヌスの名前は英語版りィキペディアず䞀臎しおいたす。




All Articles