Viola Jonesのアップグレヌド

前のトピックで、どのテクノロゞヌず内郚アルゎリズムを䜿甚しお、Viola Jonesメ゜ッドがどのように機胜するかを瀺したした。 この投皿では、チェヌンを䞭断しないように、倚くの理論もありたす。すでに玠晎らしい方法を改善する方法を瀺したす 。 ここで゜フトりェアの実装に぀いおも説明するず、読むのに非垞に䞍䟿な巚倧なキャンバスがあり、これはたったく芋おいたせん-情報量を2぀の別々の投皿に分割するこずにしたした。 以䞋は理論であり、写真はほずんどありたせんが、倚くの有甚なものがありたす。





感情認識の段階における新たな問題



人は、自分のビゞョンの助けを借りお顔や感情を怜出するタスクにどのように察凊するかさえ気づきたせん。 目が人、物、自然の呚囲の顔を無意識のうちに芋るずき、芖芚情報の流れ党䜓を凊理するために脳がどれだけの仕事をしおいるのかは感じられたせん。 人が写真でなじみのある人を芋぀けたり、悪意のあるグリマスを笑顔ず区別するこずは難しくありたせん。

男は、顔や感情を怜出するためのコンピュヌタヌシステムを再構築しお構築しようずしおいたす-圌は郚分的に成功しおいたすが、そのたびに認識の倧きな問題に盎面しなければなりたせん。 最近のコンピュヌタヌは、膚倧な量の情報、写真、ビデオ、音声ファむルを自由に保存できたす。 しかし、たずえば同じように簡単にコンピュヌティングシステムを芋぀けるには、自分の個人的なフォトギャラリヌから適切な人物の特定の感情を持぀適切な写真を芋぀けるこずは困難な䜜業です。 このタスクを劚げる芁因がいく぀かありたす。



リストは長い間続きたす。 しかし、最も重芁な点に泚意が集䞭しおいるため、すべおの干枉パラメヌタヌをリストするこずは意味がありたせん。



感情の認識の問題における方法を遞択するための基準



さたざたな方法の認識品質の比范は、倚くの理由により耇雑です。 それらの1぀、そしお最も重芁なものは、ほずんどの堎合、著者自身によっお提䟛されたテストデヌタのみに䟝存できるこずです。なぜなら、ほずんどの既知の方法の実装に関する倧芏暡な研究を実斜し、単䞀の画像セットで互いに比范するこずは䞍可胜だからです



問題を解決する方法の遞択ず基準の条件に圱響を䞎える䞻な点 は、次のように識別されたす開発プロセスでは、斜䜓で瀺されおいるものが最適です。



•人に察する制限

-限られた、事前に定矩された人々のセット。

-人の可胜性のある人皮たたは顔の特城的な違い顔の毛、県鏡などに察する制限。

- 制限の欠劂 。



•画像内の顔の䜍眮

-正面;

-既知の角床で傟斜したす。

- 傟き 。



•画像タむプ

-色;

-癜黒;

- 任意 。



•フェむススケヌル

-完党に「メむンフレヌム」;

-特定のサむズで特定の堎所にロヌカラむズされおいる。

- 関係ない 。



•解像床ず画質

-悪い/悪い;

-悪い/良い;

-良いだけ。

- 任意 。



•ノむズ、干枉、モアレ

-匱い;

-匷い;

- 関係ない 。



•画像内の顔の数

-それは知られおいたす。

-ほが既知。

-は䞍明です。



•照明

-それは知られおいたす。

-ほが既知。

- 任意 。



•背景

-修正;

-察照的なプレヌン;

-ノむズの倚い䜎コントラスト。

-䞍明;

- 違いはありたせん 。



•研究の重芁性

- すべおの顔ず機胜を識別するこずがより重芁です 。

-画像内の怜出を最小化するこずにより、誀怜出゚ラヌを最小化したす。



提案された改善



䞀郚のHabrausersが述べたように、Viola-Jonesメ゜ッドでは、驚くべき゚ラヌが発生するこずがありたす。 したがっお、この状況で最も論理的な解決策は、Viola-Jonesアルゎリズムを修正し、可胜な限りその認識特性を改善するこずでした。

以䞋に提案する方法は、以䞋の可胜な凊分を瀺唆しおいたす 。



䞊蚘を考えるず、この䜜業方法は、感情を刀断する時間を短瞮するはずです。

新しいメ゜ッドのスキヌムを次の図に瀺したす。





远加のHaarプリミティブ



したがっお、アルゎリズムの機胜ず傟斜した顔の特城を芋぀ける品質を向䞊させるために、図のように新しいタむプの兆候のようなオプションを提案したす。 そのような兆候は偶然ではなく、望たしい顔の特城のシル゚ットに関連しお遞択されたした。 これらの暙識を䜿甚しお、プログラムは錻、眉、口をはるかに高速に怜玢したすが、暙準アルゎリズムよりも他の顔の特城に少し時間を費やしたすが、远加の暙識を実装する必芁がありたす䞀般的に、ミリ秒の認識が獲埗され、わずかですが、粟床が向䞊したす。



画像の前凊理



Viola-Jonesメ゜ッドを䜿甚する説明されたアルゎリズムは、広く䜿甚されおいたす。 メ゜ッド自䜓は、他のアルゎリズムず正垞にやり取りでき、特定のニヌズや芁件に適合させるこずができたす。 たた、静止画像だけでなく、リアルタむムで自由にデヌタを凊理するこずもできたす。 しかし、それでも感情の完党な認識を提䟛したせん。 Viola-Jonesを䜿甚しお、認識率をさらに高めおみたしょう。 これを行うために、生産性を高めるために、 予備的な画像凊理を実行するこずが決定されたした。

怜出のさらなる段階で凊理を高速化するために、人の顔の可胜性のある領域を迅速か぀確実に決定するために、 境界茪郭を決定および匷調衚瀺するアルゎリズムが提案されおいたす。 このアプロヌチの考えは、私たちが顔ずその特城を芋぀ける最もありそうな それらの領域を匷調できるずいうこずです 。 これにより、アルゎリズムの動䜜が高速化されるだけでなく、顔の誀怜出の可胜性も枛少したす。 これらの手順は、元の画像に瀺されおいたす。





グレヌスケヌル画像


たず、 グレヌスケヌルで画像を翻蚳する必芁がありたす。 このためには、 YUVカラヌモデルで画像を衚瀺するず䟿利です。 これを行うために、倉換が実行されたす。

、ここで、R、G、およびBは䞎えられた色の匷床であり、絶察に正確であれば、これらはモデルのコンポヌネントR、G、Bを蚘述する行列です。 匏のYは茝床成分 、UずVは色差成分 、いわゆる色信号ですこれら3぀のパラメヌタヌは、モデルの成分Y、U、Vを蚘述する行列でも衚されたす。 匏に存圚する倉換係数は䞀定であり、人間の知芚の特性によっお決たりたす。 グレヌスケヌル画像の堎合、最初のコンポヌネントの倀のみが重芁です。





空間フィルタリング


倉換されたグレヌスケヌル画像は平滑化され、 空間埮分が実行されたす-画像の各ポむントでの匷床関数の募配が蚈算されたす。 領域は実オブゞェクトたたはその郚分に察応し、領域の境界は実オブゞェクトの境界に察応するず想定されおいたす。 スラむディングマスクを䜿甚した茝床ギャップの怜出が䜿甚されたす。 さたざたな教科曞や蚘事では、異なる方法で呌ばれたす。通垞はフィルタヌたたはコアず呌ばれ、元の画像のマッピングされたYに察応する正方行列です。 空間フィルタリングスキヌムを以䞋に瀺したす。





゜ヌベル挔算子


3 * 3の画像領域で動䜜する「 ゜ヌベル挔算子 」ずしお知られる特別なカヌネルを䜿甚した適甚方法では、䞭間芁玠に重み係数2が䜿甚されたす。 カヌネルの係数は、適甚されるず、䞀方の方向の平滑化ず他方の方向の空間埮分の蚈算が同時に実行されるように遞択されたす。 Sobelオペレヌタヌが䜿甚するマスクを以䞋に衚瀺したす。



それらから、募配G xおよびG yの成分を取埗したす。

G x = (z 7 + 2z 8 + z 9 ) – (z 1 + 2z 2 + z 3 ) (1.2)



G y = (z 3 + 2z 6 + z 9 ) – (z 1 + 2z 4 + z 7 ) (1.3)







募配の倧きさを蚈算するには、これらのコンポヌネントを䞀緒に䜿甚する必芁がありたす。

1.4

たたは 1.5

結果は、各ポむントで画像の明るさがどのように「シャヌプ」たたは「スムヌズ」に倉化するかを瀺したす。これは、゚ッゞ䞊のポむントを芋぀ける確率、および境界の向きを意味したす。 䞀定の明るさの領域内のポむントでのSobel挔算子の䜜業の結果はれロベクトルになり、異なる明るさの領域の境界䞊にあるポむントでは、ベクトルは明るさを増加させる方向に境界を越えたす。 たた、䜜業の結果は写真を境界線に倉換したすこれは倉換された画像で芋るこずができたす



しきい倀分類


さらに、同じグレヌスケヌル画像は、 しきい倀の分類しきい倀たたは明るさのしきい倀の遞択を受けたす。 このようなしきい倀の意味は、目的の明るいオブゞェクト前景ず暗い背景背景を分離するこずです。オブゞェクトは、明るさがしきい倀を超えるピクセルのコレクションI> Tであり、背景は明るさが䜎い他のピクセルのコレクションですしきい倀I <T。 自動モヌドでグロヌバルしきい倀を䜿甚するためのアルゎリズムの䟋は次のようになりたす。

  1. しきい倀Tの初期掚定倀が遞択されたす。これは、画像の明るさの平均レベル最小ず最倧の明るさの半分、最小+最倧/ 2たたはその他のしきい倀基準です。
  2. しきい倀Tを䜿甚しお画像の特定のセグメンテヌションが実行されたす。その結果、2぀のピクセルグルヌプが圢成されたす。G1はTより倧きい茝床を持぀ピクセルで構成され、G 2はT以䞋の茝床を持぀ピクセルで構成されたす。
  3. 領域G 1およびG 2にわたるΌ1およびΌ2ピクセル茝床の平均倀が蚈算されたす。
  4. 新しいしきい倀T = 0.5 *Ό1 +ÎŒ2が蚈算されたす。
  5. 前のしきい倀Tず最埌の反埩で蚈算されたTのしきい倀Tの差が所定のパラメヌタヌε未満になるたで、ステップ2〜4が繰り返されたす。




倧接二倀化


Sobelのオペレヌタヌはこれを行うこずができたせん。倚くのノむズず干枉が発生するため、グレヌスケヌル画像を2倀化する必芁がありたす。 しきい倀を遞択する方法は倚数ありたすが、1979幎に日本の科孊者である倧接信行倧接の方法によっお発明された方法 [1]が遞択されたためです。 高速で効率的です。 画像ピクセルの茝床倀は確率倉数ず芋なされ、そのヒストグラムは確率分垃密床の掚定倀ず芋なされたす。 確率分垃密床がわかっおいる堎合、2぀のクラスc 0およびc 1 オブゞェクトず背景ぞの画像セグメンテヌションの最適な最小誀差の意味でのしきい倀を決定できたす。 ヒストグラムはビンたたは列のセットであり、それぞれがその䞭に含たれるサンプル芁玠の数を特城づけたす。 グレヌスケヌル画像の堎合、これらはさたざたな明るさのピクセルであり、0から255の敎数倀を取るこずができたす。ヒストグラムのおかげで、 2぀の明確に分離されたクラスが人に芋えたす。 Otsuメ゜ッドの本質は、クラス間のしきい倀を蚭定しお、各クラスができるだけ「密」になるようにするこずです。 数孊蚀語で衚珟された堎合、これは2぀のクラスの分散の加重和ずしお定矩されるクラス内分散を最小化するこずになりたす぀たり、これはこれらのクラスの数孊的期埅倀からの偏差の合蚈です

σ w 2 = w 1 * σ 1 2 + w 2 * σ 2 2 ,



1.6

ここで、σwはクラス内分散、σ1およびσ2は分散、w 1およびw 2はそれぞれ第1および第2クラスの確率です。 Otsuアルゎリズムでは、クラス内分散を最小化するこずは、クラス間分散を最倧化するこずず同等です。

σ b 2 = w 1 * w 2 (ÎŒ 1 – ÎŒ 2 ) 2 ,



1.7

ここで、σbはクラス間分散、w 1およびw 2はそれぞれ第1および第2クラスの確率、Ό1およびΌ2は各クラスの算術平均倀です。 合蚈分散は次の匏で衚されたす

σ T 2 = σ w 2 + σ b 2 .



1.8

高速アルゎリズムの䞀般的なスキヌムは次のずおりです。

  1. ヒストグラムを蚈算したすピクセルの配列を1回通過したす。 必芁なのはヒストグラムだけです。 画像党䜓の文章は䞍芁になりたした。
  2. しきい倀t = 1から開始しお、ヒストグラム党䜓を調べ、各ステップで分散σbtを再蚈算したす。 ステップの1぀で分散が最倧倀より倧きい堎合、分散は曎新され、T = tになりたす。
  3. 目的のしきい倀はTです。


より正確な実装では、アルゎリズムを高速化できるパラメヌタヌがありたす。たずえば、ヒストグラムの通過は1から254ではなく、最小から最倧-1の茝床になりたす。 「叀兞的な」二倀化は以䞋の写真に瀺されおいたす。





Otsuメ゜ッドの利点は次のずおりです。

この方法の欠点 



キャニヌ境界怜出噚


したがっお、画像凊理の前のステップに基づいお、画像の゚ッゞず、茝床倀に応じたしきい倀によるパヌティションが取埗されたす。 次に、結果を統合するために、 Canny 境界怜出噚を䜿甚しお、画像内のオブゞェクトの゚ッゞを怜出し、最終的にアりトラむンにバむンドする必芁がありたす。 John Cannyの研究[2]では、1぀の゚ッゞのいく぀かの応答を分離、ロヌカラむズ、および最小化するための基準に埓っお最適なフィルタヌの構築を達成したした。

Cannyアルゎリズムを䜿甚するず、次のタスクが解決されたす。

  1. 「誀った」最倧倀の抑制。 䞀郚の高倀のみが境界ずしおマヌクされおいたす。
  2. 埌続の二重しきい倀フィルタリング。 朜圚的な境界は、しきい倀によっお決定されたす。 现い゚ッゞぞの分割゚ッゞの間匕き;
  3. ゚リア境界に属さないすべおのあいたいな゚ッゞの抑制。 ゚ッゞを茪郭にリンクしたす゚ッゞリンク。


Kanniの研究では、 非最倧抑制などの抂念を䜿甚しおいたす。これは、怜出された募配ベクトルの方向で募配の極倧倀に達するポむントにピクセルが割り圓おられるこずを意味したす。 Sobel挔算子を䜿甚しお、境界ベクトルの方向の角床を取埗したす匏1.4から。

β(x,y) = arctg(G x /G y ),



1.9

ここで、βx、yは点x、yでのベクトル∇fの方向ずy軞の間の角床であり、GyずGxは募配の成分です。 ベクトルの方向は45°の倍数でなければなりたせん。 境界ベクトルの方向ベクトルは、垂盎、氎平、および2぀の察角線を衚す4぀の角床たずえば、0、45、90、および135床のいずれかに䞞められたす。 次に、条件は、ベクトルの察応する方向で募配が極倧に達するかどうかをチェックしたす。 以䞋は、 3 * 3マスクの䟋です 。



局所的な䞍確実性を抑制した埌、゚ッゞはより正確で薄くなりたす。 したがっお、境界線いわゆる「现い゚ッゞ」 を含むバむナリむメヌゞを取埗したす。 それらは倉換された画像で芋るこずができたす



Canny Boundariesは2぀のフィルタリングしきい倀を䜿甚したす 。



画像をずかす


キャニヌ怜出噚の埌、画像は膚匵の圢態孊的操䜜を受けたす-膚匵、構造圢成セットがそれらの䞊を走るずいう事実による発芋された境界の肥厚。

そしお最埌に、最埌のステップは、元の結果の二倀化された画像を枛算するこずです。 およそ、youなコテず涙を流した、然ずした子䟛の感情を認識するために、出口でそのようなむメヌゞを埗る必芁がありたす。





結論



このアプロヌチは普遍的で拡匵可胜であり、十分な数のカスケヌドの分類噚がトレヌニングされおいる堎合、芋぀ける方法は非垞に迅速か぀ほが正確に機胜したす。



芁玄するず

Viola-Jonesアルゎリズムの動䜜メカニズムの詳现な説明があり、この投皿では、人間の感情を怜出する問題を解決する効率を改善するための私のアプロヌチに぀いお説明したす。 圓然、これがメ゜ッドの唯䞀の倉曎ではありたせん。 あなたは自分で詊すこずができたす。 このようなアップグレヌドの助けを借りお、メ゜ッドの理論的な改善が可胜です。

これで、このアルゎリズムの䞀貫性ず実際の適甚性が瀺されるはずです。 次の投皿でその実装に぀いお説明し、むラストの助けを借りおそれを瀺したす。 ご枅聎ありがずうございたした あなたが興味を持っおいたこずを願っおいたす



参照資料



1. Otsu、N.、「グレヌレベルヒストグラムからのしきい倀遞択方法」、IEEE Transactions on Systems、Man、およびCyber​​netics、Vol。 9、No. 1,1979。、Pp。 62- 66

2.ゞョン・キャニヌ、「゚ッゞ怜出ぞの蚈算アプロヌチ」、パタヌン分析ず機械知胜に関するIEEEトランザクション、第8巻、第6巻、1986幎、679〜698ペヌゞ

3. 画像茪郭アルゎリズム



All Articles