「Yandex Internet Mathematics-2011」ずいう問題の解決策。 画像の芖芚的類䌌性の刀定

2011幎4月から5月にかけお、YandexはYandex Internet Mathコンテストの別のラりンドを開催したした。 ツアヌのテヌマ「画像の芖芚的類䌌性の刀定」。

受賞者の発衚に関するニュヌスを公開し、チヌムによるタスクの解決策であるLookLikeItをすぐに説明するこずを玄束したした。LookLikeItは最終評䟡で12䜍になりたした。



そしお今、その時はたったく正しくありたせん



はじめに



Yandex Internet Mathは、2011幎に5回開催されたYandexが䞻催する䞀連のコンテストです。 競争の䞻な内容は、実際のデヌタに基づいお実際の問題を解決するための競争です。 2011幎の競争の課題ずしお、䞀連のパノラマの䜙分なフレヌムを決定するために、画像の芖芚的類䌌性の分析が遞択されたした。 この蚘事では、問題のステヌトメント、その解決策の方法論、アプロヌチに぀いお説明したす。これらは、競争の枠組みで私たちが適甚したものであり、結果の分析でもありたす。

コンテストのデヌタは、Yandex.Mapsサヌビスのパノラマ画像から取埗した画像でした。 コンテストは2぀のステヌゞに分かれおいたした-トレヌニングステヌゞには5぀の画像がそれぞれ6,000゚ピ゜ヌド各画像の寞法は300x300ピクセルが含たれ、最終ステヌゞには6,000゚ピ゜ヌドが5぀の画像からなる別のセットが含たれおいたした。 各シリヌズの基瀎は、郚分的に重耇したパノラマの連続したフラグメントです間違った順序で。 䞀郚のシリヌズには、他のパノラマシリヌズの1぀たたは2぀の远加ショットがありたす。 参加者のタスクは、自動メ゜ッドを䜿甚しおシリヌズの䜙分なフレヌムを決定するこずでした。 トレヌニングセットの6000シリヌズの䞭で、1000はトレヌニングセットであり、どの写真が䞍芁であるかが瀺されたした。

シリヌズの䟋







競争の方法論は次のずおりでした。 チヌムは質問ぞの回答を䜜成したしたトレヌニング段階での5000シリヌズの5枚の写真の各シリヌズで䜙分な写真は䜕ですか最初の1000シリヌズは教育的であり、答えがわかっおいたため、1001から6000たで。 この回答は、各シリヌズの远加の写真を瀺すテキストファむルの圢匏で䜜成されたした。 このファむルに基づいお、Yandexサヌバヌは分析結果の公開評䟡を蚈算したした。 最終段階では、これたでに知られおいなかった6,000のシリヌズが提案されたした。 予備段階は2か月続き、最終段階はちょうど1日続きたした2011幎5月16日から17日たで。

結果を評䟡するための䞻芁な指暙は、正しく分類された写真の割合ですパノラマを構成する写真ず䞍芁な写真の2぀のクラスが考慮されたす。 評䟡は、匏に埓っお実行されたした。

Tp + Tn/P + N、ここでPはパノラマに関連する画像の数、Nは䜙分な画像の数、Tpはシステムがパノラマに正しく割り圓おた画像の数、Tnはシステムが正しく割り圓おた画像の数䜙分なクラス。 したがっお、システムがすべおの写真をパノラマクラスず䞍芁なものに完党に正しく分割した堎合、評䟡は1になりたす。

メトリックを分析した埌、䞀連の゚ラヌがさたざたな方法で結果の党䜓的な評䟡に圱響を䞎える可胜性があるこずが明らかになりたす。 図1に瀺すシリヌズを考えおみたしょう。2,3,4,5枚の写真が同じパノラマにあり、1枚目が䞍芁であるずシステムが蚀っおいる堎合、掚定倀は3 + 1/3 + 2= 4/5になりたす。 2番目、3番目、4番目の写真が同じパノラマにあり、1ず5が䞍芁であるずいう結果がシステムから埗られた堎合、掚定倀は1 + 0/3 + 2= 1/5になりたす。 これからわか​​るように、システムの蚭蚈時に考慮する必芁がある゚ラヌの皮類によっおは、他の゚ラヌよりも党䜓的なスコアが著しく悪化する可胜性がありたす。

問題を解決するためのシステム開発の䞻なタスクは、2぀の画像が同じパノラマの䞀郚であるかどうかを刀断し、これらのメトリックに基づいお各シリヌズの結果の回答を䜜成する決定サブシステムを䜜成するこずを可胜にするメトリックを決定するこずでした



指暙



2぀の画像が同じパノラマに属しおいるかどうかを刀断するために、さたざたな状況で䜿甚されるいく぀かのタむプのメトリックを開発したした。 1぀のシリヌズの画像はペアで比范されたす。 これらのメトリックをさらに詳しく怜蚎しおみたしょう。



1.オヌバヌレむメトリック


問題の声明は、1぀のパノラマからの画像が郚分的にオヌバヌラップするずいう条件を述べたした。 これは垞に圓おはたるわけではありたせんが、ほずんどの堎合、実際、重耇が発生しおいたす。

郚分的に重耇した画像を特定するために、我々はその本質が以䞋の通りである方法を開発したした。 2぀の画像は、50ピクセルのオヌバヌレむりィンドり幅で互いに重なり合っおいたす。

結果のりィンドりでは、各ピクセルに぀いお、RGBコンポヌネントを法ずしお差が蚈算されたす。その埌、R、G、Bの倀の差が各コンポヌネントで20より小さいピクセルの盞察数が蚈算されたす。これらのピクセルを「黒」ず呌びたす。 この数倀は、互いに重ね合わされたピクセルが色にどれだけ近いかを瀺し、したがっお、1番目ず2番目の画像の重ねられた郚分の近接床を決定したす。

その埌、りィンドりは6ピクセルシフトされ、オヌバヌレむりィンドりの幅が150ピクセルむメヌゞの半分に増加するたで手順が繰り返されたす。 同じ手順を同じ画像に察しお、反察偎が重なり合っお繰り返したす最初に、最初の画像の右偎が2番目の画像の巊偎に、次に反察に、2番目の画像の右偎が最初の画像の巊偎に。

たずえば、画像に぀いお考えおみたしょう。



これらの画像の反埩オヌバヌレむプロセスず、オヌバヌレむりィンドりでのピクセル差の蚈算を瀺したす。



オヌバヌレむの繰り返しに応じた暗いピクセルの盞察的な数の倉化のグラフ



ご芧のずおり、13回目の反埩で重芁なピヌクが埗られたした。これは、オヌバヌラップにできるだけ正確に到達したこずを意味し、これも図で確認できたす。

この手順の埌、䞀連の画像の各ペアに察しお、「黒」ピクセルの盞察数の倀を持぀2぀のベクトルがあり、それらの最倧倀を探したす。 これは、郚分的なオヌバヌラップによる2぀の画像の近接床のメトリックです。 ぀たり、2぀の画像が重なったずきにどれだけ䞀臎するかを刀断したす。

このメトリックの明らかな問題は、最初は暗い画像倜景などです。これは、暗い領域を暗い領域に適甚するず、画像に実際のオヌバヌラップがないにもかかわらず、R、G、Bの倀の差が小さくなるためです。 。 この問題を解決するには、手順を開始する前に、各画像の暗いピクセルの総数をチェックし、十分な倧きさ画像の70以䞊である堎合、そのような系列はこのメトリックを䜿甚しお分析されたせん。 そのようなシリヌズの䟋



このようなメトリックを適甚するずきの2番目の問題は、画像のオヌバヌラップが正確ではないが、特定の歪みがある画像です。

-有望な



-オヌバヌラップでのオブゞェクト車の倖芳



-重耇郚分に非垞に詳现なオブゞェクト朚、建物の耇雑なテクスチャ、グレアが存圚したす。これらのオブゞェクトは、理想的には互いに「重耇」できず、䞊蚘の手順を適甚したずきに盞察的な「黒」ピクセルが倚くなりたす。



さらに、同じパノラマの写真の前提条件ずしお問題の説明で郚分的な重耇が蚀及されおいるずいう事実にもかかわらず、写真に重耇がないかなり倚くの゚ピ゜ヌドがありたした。



この堎合、詳现化メトリックが䜿甚されたした。これに぀いおは、埌で説明したす。

オヌバヌレむメトリックに関連する3番目の問題は、2぀の画像に郚分的な重なりがあるかどうかを刀断できるメトリックしきい倀2蟺からオヌバヌレむを枡すずきの「黒」ピクセルの最倧数の決定でした。

この問題の最初の解決策は、静的しきい倀の遞択でした。その倀は、トレヌニングサンプルの特定のステップで特定の範囲の倀を経隓的に遞択するこずによっお遞択されたした。 したがっお、トレヌニングサンプルの公開評䟡の結果が最倧になる静的しきい倀の特定の倀を取埗したした。 ただし、このアプロヌチは十分に効果的ではないこずは明らかです。同じしきい倀は異なるシリヌズの写真にうたく適合しないためですたずえば、シリヌズAでは、2぀の写真が重なり合っおおり、メトリックの結果は95です。非垞に詳现なオブゞェクトがあり、メトリックの結果は70でした。これはシリヌズAの95に比べお非垞に小さいですが、シリヌズB内の他の写真ず比范するずはるかに倧きくなる可胜性がありたす。 さらに、しきい倀を遞択したトレヌニングサンプルはかなり小さく、十分な代衚倀ではありたせんでした。

これらの問題に関連しお、オヌバヌレむメトリックによっお近接性を刀断するためのしきい倀は、シリヌズごずに個別に蚈算する必芁があるこずが決定されたした。 たず、䞀連のすべおの写真のメトリック倀がペアで蚈算され、その埌、これらの掚定倀の平均二乗が決定されたす。 二乗平均倀は、高すぎるたたは䜎すぎる倀が衚珟力があり、2぀の写真が同じパノラマに属し、たたはその逆であり、それらの差が倧きすぎるため、これらのピヌクがシリヌズの平均スコアに匷い圱響を䞎えるこずを考慮しお遞択されたした平均スコアを蚈算するずきは正方圢。 その埌、各評䟡が平均評䟡ず比范され、それよりも倧きい堎合ある皋床のマヌゞンはある、写真は同じパノラマに属しおいるず芋なされたす。 そのような予備がない堎合、これは、シリヌズのすべおの写真がほが同じ倀を持぀こずを意味したす。これは、このシリヌズに䜙分な写真がないか、メトリックが機胜しなかったため、結果をさらに明確にする必芁があるこずを意味したす

各シリヌズの動的なしきい倀決定アプロヌチを䜿甚しお、公開評䟡の結果は10分の2以䞊改善されたした。



2.スペクトル盞関メトリック


このメトリックは、1぀のパノラマからの画像のオヌバヌラップが明瀺的でなく、オヌバヌレむメトリックを䜿甚しお䞍十分に決定されたシリヌズに䜿甚されたした。 十分な数の゚ピ゜ヌドシリヌズで、パノラマの画像ず過剰な画像は完党に異なる条件季節、時刻、ビュヌ構造建物や森林などなどで撮圱されたため、色の分垃ず画像の明るさ。



したがっお、色の分垃の類䌌性/差を評䟡するために、シリヌズの各画像を10倀のスペクトルヒストグラムにレむアりトしたした虹色赀、オレンゞ、黄色、緑、青、青、玫ず䞭立色癜、グレヌそしお黒。 虹色の堎合、HSV色空間は色盞成分ずずもに䜿甚され、0〜360の範囲にあり、ピクセルのトヌンを反映したす。 ただし、このアプロヌチでは、色の範囲の䞋にあるそれぞれの茝床成分を考慮せずに、図に瀺すように、癜、灰色、黒の色を含めたす。



したがっお、癜、グレヌ、黒を陀倖するには、RGBスペヌスの各ピクセルのコンポヌネントがたずこれらの色の範囲に属しおいるかどうかを確認したす癜の堎合、すべおのコンポヌネントは225-255、グレヌの堎合125-225、黒の堎合0- 30。

スペクトルの各成分は、画像内の1぀たたは別のサブ範囲の盞察的な色数を意味したす。぀たり、画像内の色の分垃を瀺したす。 次のようになりたす。



各スペクトルは10個の倀のベクトルであるため、ピア゜ン盞関係数を䜿甚しお、䞀連の画像のペアのスペクトル間の関係の存圚を刀断したした。



このアプロヌチは非垞によく蚌明されおおり、色の分垃が類䌌した画像の盞関の倀は急速に成長したした。



このメトリックの重芁な問題は、オヌバヌレむメトリックず同様に、2぀の画像が同じパノラマに属しおいるこずを瀺すために、2぀の画像の盞関係数の倀を超えるしきい倀の定矩です。 この問題を解決するために、シリヌズの平均二乗盞関倀によっお各シリヌズのしきい倀を動的に決定する方法も䜿甚したした。

2番目の問題は、パノラマ写真ず䞍芁な写真の色の分垃が非垞に近いたずえば、空ず緑の色ため、誀怜出が発生するこずです。



3番目の問題は、1぀のパノラマからの画像であり、その䞊に倧きなオブゞェクト通過車などが衚瀺され、画像の半分に達するこずがありたす。 この堎合、そのような画像のスペクトル分垃は劇的に倉化したずえば、パノラマの他の画像にはなかった倚くの青が珟れたす、盞関はそのスペクトルず他のパノラマ画像のスペクトルずの䟝存関係を瀺すこずができたせん。





3. SURF蚘述子メトリック


SURFSpeeded Up Robust Featuresメ゜ッドは、画像を認識し、その類䌌性を刀断するための最も効率的で最速の最新のアルゎリズムの1぀です。

この方法の䞻なポむントは、画像䞊でいく぀かのキヌポむントずそれらの呚りの小さな領域を匷調衚瀺するこずです。 キヌポむントは、ポむントの倧郚分からそれを倧幅に区別する特定の兆候があるようなポむントず芋なされたす。 たずえば、線の端、小さな円、照明の鋭い倉化、角床などです。 画像の小さな領域は遠近法や倧芏暡な歪みの圱響をほずんど受けないため、ポむントの呚りの小さな領域が遞択されたすが、小さすぎる領域は情報が少なすぎるため適切ではありたせん。

SURFメ゜ッドは、ヘッセ行列を䜿甚しお特異点を怜玢したす。ヘッセ行列の行列匏は、茝床募配の最倧倉化点で極倀に達し、線のスポット、角床、および゚ッゞを適切に怜出したす。 キヌポむントの䟋



この方法はスケヌル䞍倉であり、画像平面内で回転し、ノむズを発生させ、他のオブゞェクトず重なり、明るさずコントラストを倉曎したす。 ぀たり、最初の2぀のメトリックで問題があったシリヌズに最適です。

2぀の画像を比范するずきのメトリック倀は、共通のキヌポむントの数です。 ポむント数が10を超えるず、ほずんどの堎合2぀の画像に共通のオブゞェクトがあるため、このメトリックには静的なしきい倀が䜿甚され、実際には誀怜出はありたせんでした。

このメトリックにより、芖野角の倉化が倧きく、遠近法や幟䜕孊的な歪みが倧きい360床パノラマでスケヌリングされた写真を特定できたしたが、同時にオブゞェクトが残り、キヌポむントが残りたす。 たずえば、そのようなシリヌズでは





この方法の䞻な欠点は、蚈算負荷が高く、その結果、動䜜時間が長くなるこずです。 しかし、我々はそれをクラリファむアずしお䜿甚し、最も問題があり論争の的になる状況で蚈算したため、蚈算の数を最小限に枛らすこずが刀明したした。

このメ゜ッドの実装ずしお、OpenSURF 2.0ラむブラリが䜿甚されたした。

SURFメ゜ッドの詳现に぀いおは、泚目に倀する蚘事「 氞続的画像の特城の怜出SURFメ゜ッド 」を参照しおください。ここから、 メ゜ッドの図ず説明をうっかり借りたした:)



決定ロゞック



特定のシリヌズ内の画像をペアワむズで比范し、その長所ず短所を分析するためのメトリックを開発し、トレヌニングサンプルで䞀連のテストを実斜しお、これらのメトリックに基づいお答えを圢成する意思決定サブシステムを䜜成したしたこのシリヌズではどの写真が䞍芁ですか

たず、シリヌズの可胜なオプションを怜蚎したす。

1パノラマの3枚の写真ず2枚の写真は䞍芁です。

a1぀のパノラマの远加写真。

b異なるパノラマからの远加の写真。

2パノラマの4枚の写真のシリヌズで、1枚の写真は䞍芁です。

3䜙分なものはありたせん。

䞀連の写真を考慮するず、システムは写真付きの2぀のセットを䜜成したすpl。1およびpl。2。 最初に、アルゎリズムはこれらのセットに画像を配信したす。これらのセットは、オヌバヌレむメトリックによっお動的しきい倀を超えたす。 その埌、これらのセットにむメヌゞを配垃するための次の論理オプションが可胜です。 これらのオプションのアクションに぀いお説明したす。

100-このオプションは䜿甚できたせん。動的しきい倀を䜿甚する堎合、垞にオヌバヌレむメトリックがこのシリヌズ内の2次平均よりも倧きい画像がありたすオヌバヌレむメトリックで「マヌゞン」が克服されない堎合、シリヌズは「マヌゞン」が提䟛されないスペクトル盞関メトリックを䜿甚しお蚭定したす

222-このオプションは、アルゎリズムが2぀の写真が1぀のパノラマにあり、2぀が別のパノラマにあるず刀断したが、5番目に぀いおは䜕も蚀えなかったこずを意味したす。 この堎合、次のオプションが可胜です。

A5番目は耇数1になり、耇数2は䞍芁になりたす。

B5番目は耇数2になり、耇数1は䞍芁になりたす。

C5番目は䞡方のセットに入りたすが、䜙分なものはありたせん。

E5番目のピクチャがどのセットに属するかを決定するメトリックはないため、このピクチャの盞関係数の最倧倀が最初のセット、2番目のセットのピクチャず決定され、セット1およびセット2のピクチャの盞関係数も分析されたす。スペクトル盞関

-耇数の1ず耇数の2が結合し、5番目の画像が䞍芁になりたす。

-pl。1ず5番目の写真が結合され、pl。2は䞍芁になりたす。

-耇数の2番目ず5番目の画像は結合し、耇数の1぀は䞍芁です。

すべおの改良は、スペクトル盞関係数のメトリックずSURFメ゜ッドに埓っお行われたす



332-倧倚数のケヌスのトレヌニングサンプルでは、​​このオプションはすぐに正しく、明確化する必芁がないこずが経隓的に芳察されたしたpl。2-䞍芁。 そうでない堎合、゚ラヌはあたりにもひどくなく、結果の党䜓的な評䟡に倧きな圱響を䞎えたせん。

423-前の段萜ず同様pl。1-䞍芁。

530-この堎合、次のオプションが可胜です。

A䞡方の写真が䞍芁ですオプション32。

B2枚の写真のうち1枚がパノラマに含たれおおり、5枚目は䞍芁ですオプション41。

C䞡方の写真がパノラマに含たれおいたすが、䜙分なものはありたせんオプション50。

すべおの改良は、スペクトル盞関係数のメトリックずSURFメ゜ッドに埓っお行われたす



640-この堎合、オプションが可胜です

A5番目の写真はパノラマに含たれおいたせん。぀たり、5番目の写真は䞍芁です。

B5枚目の写真がパノラマに含たれおいたす。䜙分なものはありたせん。

すべおの改良は、スペクトル盞関係数のメトリックずSURFメ゜ッドに埓っお行われたす



750-オプションなし。 答えは䜙分ではありたせん。



結果の評䟡



この問題は反埩的に解決され、たすたす耇雑なアプロヌチを適甚しながら、公共の評䟡の䟡倀を埐々に高めおいきたした。

最も高い結果は、䞊蚘の決定によっお埗られ、予備的な公開評䟡で0.945に達したした。 最終結果は0.967に増加したした。 最終サンプルの勝者の結果は0.994でした。

1぀のシリヌズの分析時間は平均で玄20秒でした。

最終サンプルの結果がこのように急激に増加する䞻な理由は、私たちの意芋では、シリヌズの最終セットがより慎重にチェックされ、コンパむラヌに事実䞊゚ラヌがなかったこずであり、コンパむラヌは予備段階のシリヌズでしばしば発芋されたした。

このメトリクスはあたり明確ではなく、その意味はあたり明確ではないため、実際の認識結果はトレヌニングサンプルで埗られた統蚈ですそのような統蚈は、回答が既知であるため、それに぀いおのみ取埗できたす。

絶察正解85.3; さたざたな皮類の゚ラヌを含む䞍正解14.7。

この結果は非垞に高いです。 ゚ラヌになったシリヌズを分析するずき、私たちはしばしば正しい答えを決定できないずいう事実に遭遇したしたたたは、正しい答えは、Yandexのそれず䞀臎したせんでした。

たずえば、シリヌズでは



䜙分なのは1ず4ですただし、画像2、3、5の間には共通点はほずんどありたせん。

そしお、このシリヌズでは



最初の写真のみが䞍芁ず芋なされたす。 私たちの意芋では、4番目の写真は2、3および5の1぀のパノラマに入るこずができ、そこには入らず、これが非珟実的であるず刀断できたす。



説明した決定の䞻な欠点である結果を分析した埌、メトリックの数が䞍十分であり、意思決定の厳栌な論理構造を考慮したす。 実際、トレヌニングサンプルは、特定の方法の迅速な評䟡を取埗し、統蚈を収集するためにのみ䜿甚され、システムでは機械孊習は提䟛されたせんでした。 しかし、予備段階で最初の5 KEで行われたいく぀かの䞻芁なチヌムは、システムが予備デヌタセットで再蚓緎されすぎたため、最終サンプリングで結果を倧幅に削枛したした0.975から0.941。



あなたが興味を持っおいお、この蚘事の終わりに到達したこずを願っおいたす:)。 他の゜リュヌションの説明受賞者の決定を含むは、 Yandex Clubにありたす。



All Articles