あいたいな重耇ビデオを芋぀けるためのいく぀かの方法

分析が必芁なかなり広範囲のタスク、珟実の芖聎芚モデルがありたす。 これは静止画像ずビデオに適甚されたす。



画像








以䞋は、ファゞヌ重耇ビデオを怜玢および識別するためのいく぀かの既存の方法の簡単な抂芁です。それらの利点ず欠点が考慮されたす。 ビデオの構造的なプレれンテヌションに基づいお、方法の組み合わせが構築されたす。

レビュヌは非垞に小さく、詳现に぀いおは、゜ヌスを参照するこずをお勧めしたす。



「ファゞヌ耇補」ずいう甚語は、オブゞェクトが類䌌クラスの別のオブゞェクトず䞍完党たたは郚分的に䞀臎するこずを意味したす。 耇補は自然で人工的なものです。 自然耇補は、同様の条件䞋での同様のオブゞェクトです。 人工ファゞヌ耇補-同じオリゞナルに基づいお取埗。



あいたいな重耇の怜玢は、無人航空機の光孊ナビゲヌション残念ながら、必ずしも平和的な目的ずは限りたせん、地圢の性質の決定、ビデオカタログのコンパむル、怜玢゚ンゞンスニペットのグルヌプ化、ビデオ広告のフィルタリング、「海賊版」ビデオの怜玢に圹立ちたす。



画像








ファゞヌビデオ耇補NDVの怜玢の問題は、分類CVおよびビデオ怜玢PVの問題ず密接に関連しおいたす。 NDV怜玢のタスクは分類に、それから泚釈ずビデオ怜玢に枛らすこずができたす。 | {NDV怜玢} | <| {KB} | <| {PV} |。 しかし、これらのタスクは独立しおいたす。



画像








䞀般的なアルゎリズム



NDVを怜玢するために、ビデオはセグメントに分割されたす。 キヌフレヌムは各セグメントから抜出されたす。 キヌフレヌムの特性は、ビデオ党䜓を衚すために䜿甚されたす。 ビデオ間の類䌌性は、これらの特性のセットの類䌌性ずしお蚈算されたす。



アプロヌチ



NDVの怜玢方法には2぀のカテゎリがありたす。グロヌバル特性GCを䜿甚する方法です。 ロヌカル特性LHを䜿甚する方法。 カテゎリ間の区別は条件付きであり、非垞に頻繁に混合技術が䜿甚されたす。 GCメ゜ッドは、空間情報、色情報、および時間情報をモデリングするためのフレヌムレベルのシグネチャを抜出したす。 GCは、䜎レベル機胜のグロヌバル統蚈を芁玄したす。 ビデオ間の類䌌性は、䞀連の眲名眲名間の察応ずしお定矩されたす。 それらは「ほが同䞀の」ビデオを芋぀けるのに圹立ち、時空領域での小さな線集を明らかにするこずができたす。 化粧品の線集の結果ずしお埗られた人工NDVを䜿甚する堎合、GCは無効です。 このようなグルヌプの堎合、セグメントたたはフレヌムの䜎レベルの特性を䜿甚する方法がより䟿利です。 通垞、これらのメ゜ッドの動䜜は、䞀時的な順序の倉曎ずフレヌムの挿入たたは削陀の圱響を受けたす。 グロヌバルな方法ず比范しお、セグメントレベルのアプロヌチは遅くなりたす。 かなりの線集が行われたコピヌを特定するこずはできたすが、メモリの芁求はより厳しくなりたす。



ロヌカル特性



远跡远跡


LHメ゜ッドは、類䌌したビデオを怜玢するタスクを、重耇画像を芋぀けるタスクに枛らしたす。 画像を比范する際の䞻な手順特別なポむントの識別。 特異点の近傍の遞択; 特城ベクトルの構築; 画像蚘述子の遞択; 画像のペアの蚘述子を比范したす。 ビデオコピヌ怜出の動䜜のラベルに基づくロバスト投祚アルゎリズムの䜜業では、フレヌムの特定のポむントハリス怜出噚を䜿甚が区別され、その䜍眮がビデオ党䜓で監芖されたす。 その埌、倚くのポむントの軌跡が圢成されたす。



画像








パタヌンマッチングは、ファゞヌ怜玢に基づいおいたす。 このアプロヌチにより、ファゞヌ重耇フラグメントのロヌカラむズが容易になりたす。 ただし、この方法は特別なフレヌムポむントの割り圓おのために高䟡です。 たた、ポむントの軌跡がカメラの動きに敏感であるずいう事実により、アルゎリズムはビデオの正確なコピヌの怜玢にのみ適甚されたす。



平均倀


SIFTメ゜ッドを䜿甚した非同䞀重耇ビデオ怜出の䜜成者は、キヌフレヌムの特別なポむントを匷調衚瀺し、SIFTに基づいおフレヌムの類䌌性を評䟡したす。 フレヌムの類䌌性は、䞀臎する特異点の数の算術平均ずしお蚈算されたす。 ただし、ビデオの類䌌性を刀断するために、ビデオ党䜓のキヌフレヌムの類䌌性の平均倀ずしお完党適合性評䟡PICが䜿甚されたす。 すべおの可胜なフレヌムペアではなく、それらの䞀郚に぀いおのみ平均倀を蚈算するこずが重芁です。 これにより、コンピュヌティングリ゜ヌスが節玄されたす。



瞊フレヌム


䜜品はたた、フレヌムの遞択が通垞のビデオのように時間軞に沿っお行われるずいう点で興味深いものです。 このようなスラむスを䜿甚するず、通垞のフレヌムず同じように、ビデオから䞀時的な情報を抜出し、空間比范方法を適甚できたす。SIFTは2぀のビデオのスラむスに適甚され、PICが蚈算されたす。



画像








実隓の結果によるず、瞊方向のフレヌム割り圓おの方法は通垞よりも悪いです。 これは、ビデオのシャヌプなカメラの動きが倚い堎合に特に圓おはたりたす。 䞀般的なアプロヌチの欠点には、SIFTの䜿甚が含たれたす。 実隓は、小さな解像床320×240のビデオで行われたした。 フレヌムサむズが倧きくなるず、特別なポむントを匷調衚瀺するのに非垞にコストがかかりたす。 PICが通垞のフレヌムにのみ適甚される堎合、䞀時的なビデオ情報は考慮されたせん。



芖芚的な蚀葉


芖芚的な単語を䜿甚する方法は、特定のフレヌムポむントの盎接比范の改良版です。 それらは、特異点の量子化、぀たり「単語」の圢成に基づいおいたす。 フレヌムおよびビデオの比范は、テキストず同様に、完党に呚波数蟞曞で行われたす。 Inria-Leararのビデオコピヌ怜出システムは、優れたメ゜ッド性胜を実蚌しおいたす。 キヌフレヌムは、SIFTを䜿甚しお取埗される機胜によっお衚されたす。 次に、これらの特性が芖芚的な単語に量子化されたす。 バむナリ眲名は芖芚的な単語から䜜成されたす。 ただし、芖芚的な単語を適甚するには、既知の䞻題領域の呚波数蟞曞を䜜成する必芁がありたす。



グロヌバル特性



GCメ゜ッドを䜿甚しお、色、空間、および時間の情報がビデオから抜出され、䞀連の文字ずしお衚瀺され、䞀臎する線を芋぀ける方法が適甚されたす。



ロヌカルに敏感なハッシュ


ランダムヒストグラムず機胜のセットを効率的に䞀臎させるには、ロヌカルセンシティブハッシュLFを䜿甚したす。 各キヌフレヌムのカラヌヒストグラムをバむナリベクトルで衚瀺するために䜿甚されたす。 フレヌムの特性は、画像の局所的な特城ずは区別されたす。 これらの特性は、特性の空間内のポむントのセットずしお衚されたす。 LFを䜿甚しお、ポむントは離散倀にマッピングされたす。 䞀連の機胜に基づいお、フレヌムのヒストグラムが䜜成されたす。 次に、ヒストグラムは通垞のシヌケンスずしお比范されたす。



画像








実隓結果により有効性が確認されたした。 しかし、 倧芏暡なほが重耇したWebビデオ怜玢課題ず機䌚で指摘されおいるように、この方法にはメモリ消費量が倚いずいう朜圚的な問題がありたす。 䞀時的な情報は䞀切考慮されたせん。



序数眲名


順序枬定に基づく堅牢なビデオ眲名は、順序眲名を䜿甚しお、フレヌム内の盞察匷床分垃をモデル化したす。 2぀のフラグメント間の距離は、眲名の䞀時的な類䌌性を䜿甚しお枬定されたす。 このアプロヌチを䜿甚するず、解像床やフレヌムレヌトが異なるビデオのあいたいな耇補を怜玢できたすが、フレヌムの空間的な倉化はわずかです。 このアルゎリズムの利点は、リアルタむムで機胜するこずです。 欠点には、䜙分なフレヌムの倧きな挿入に察する䞍安定性が含たれたす。 この方法は、たずえば被写䜓が異なる光条件で撮圱された堎合など、自然なファゞヌ耇補の怜玢にはあたり適しおいたせん。



画像








ビデオコピヌ怜出のシヌケンスマッチング技術の比范は 、時間の経過に䌎う匷床の盞察的な倉化をキャプチャするモヌションシグネチャを瀺したす。 カラヌ眲名、モヌション眲名、シリアル眲名が比范されたす。 実隓では、序数の眲名がより効率的であるこずが瀺されおいたす...



DNAのようなビデオ


耇数の配列アラむメントによるクラスタリングに基づく準耇補ビデオ怜玢で提案されおいるアプロヌチは、ビデオのファゞヌ耇補を芋぀ける問題をビデオ分類の問題に軜枛したす。 この方法は、マルチプルシヌケンスアラむンメントMSAに基づいおいたす。 同様のアプロヌチがバむオむンフォマティクスで䜿甚され、DNA配列のアラむメントを怜玢したす。 著者は、 Muscleによっお提案されたヒュヌリスティックアラむンメントず反埩法を䜿甚しおいたす 。 高粟床ず高スルヌプットの耇数のシヌケンスアラむンメントです。 この方法は、次の䞀連のステップで説明できたす。



  1. ビデオ甚にDNA衚珟が䜜成されたす。
  2. デヌタベヌスからのビデオは、それぞれがそれぞれず比范され、距離のマトリックスが構築されたす。
  3. 距離行列に基づいお、隣接結合法を䜿甚しおガむドツリヌが構築されたす。
  4. ガむドツリヌに基づいお、プログレッシブビデオ調敎が実行されたす。
  5. アラむメント結果は、ビデオのクラスタヌを圢成するために䜿甚されたす。
  6. デヌタベヌスを怜玢するずき、ク゚リはクラスタヌの䞭心ず比范されたす。 リク゚ストずクラスタヌセンタヌの類䌌性が特定のしきい倀を超える堎合、クラスタヌ内のすべおのクリップは、リク゚ストのあいたいな耇補ず芋なされたす。




ビデオをゲノムずしお衚珟するために、キヌフレヌムが抜出され、グレヌスケヌルカラヌスペヌスに転送され、フレヌムが2×2ブロックに分割されたす。たった24 =2⋅2 空間順序パタヌン。 このようなパタヌンはそれぞれ、ラテンアルファベットの文字に関連付けるこずができたす。



画像








距離行列は、サむズnのスラむディングりィンドりを䜿甚しお構築されたす。 したがっお、ビデオ比范はn-gramに基づいおいたす。 ビデオの2぀のDNA衚珟の比范は、りィンドり内でのみ行われたす。

りィンドりサむズずステップサむズ比范埌にりィンドりをシフトする量がパラメヌタヌずしお蚭定されたす。



ガむドツリヌは、ネむバヌを結合するための貪欲なヒュヌリスティックアルゎリズムによっお構築されたす。 距離マトリックスに埓っお、2぀の最も近いDNA衚珟が区別され、ビデオプロファむルずしお単䞀のツリヌノヌドに結合されたす。 このモデルでは、各ビデオDNAはツリヌの葉であり、プロファむルはツリヌのノヌドに衚瀺されたす。 プロファむルも互いに比范され、シヌト衚珟ず同様に接着されたす。 結果は決定朚です。



ガむドツリヌを以䞋に瀺したす。

画像








このアプロヌチの利点粟床ず完党性が高く、特別な蚈算コストを必芁ずしたせん。 アプロヌチの短所-メ゜ッドは、ビデオの時間情報を考慮したせん。



シヌンチェンゞ


ビデオ共有゜ヌシャルネットワヌクでのビデオコピヌ怜出ぞの接尟蟞配列アプロヌチにより、シヌンの境界の定矩に基づいたシグネチャが導入されたした撮圱。

3぀の異なる抂念がありたす。 フレヌムたたは写真フレヌム-静止画像。 シヌンたたは線集フレヌムは、堎所ず時間の統䞀によっお接続されたフレヌムのセットです。 撮圱たたはシネマティックショット、撮圱の単䞀性によっお接続された倚くのフレヌム。 シヌンには耇数のショットが含たれる堎合がありたす。 文献では、撮圱はしばしば「シヌン」ず呌ばれたす。 さらに撮圱を怜蚎したすが、同じこずを「シヌン」ず呌びたす。



ビデオには、単なる䞀連のフレヌムよりも倚くの情報が含たれおいたす。 ビデオ内のむベントは、その時間構造を䞀意に決定したす。これは、キヌフレヌムのセットで衚すこずができたす。



この堎合、キヌフレヌムはIフレヌムずしおではなく、単に特別なビデオフレヌムずしお理解されたす。 むベントは、ビデオプロットのセマンティックコンポヌネントずしおではなく、フレヌムのコンテンツの倉化ずしおのみ理解されたす。 キヌフレヌムの匷調衚瀺は、茝床ヒストグラムの違いの怜玢に基づいおいたす。 キヌフレヌムを抜出した埌、珟圚のキヌフレヌムず前のキヌフレヌムの間の長さが蚈算されたす。 すべおの長さは、1次元のシヌケンスずしお曞き蟌たれたす。 このシヌンの長さのシヌケンスは、ビデオの眲名です。 実隓によれば、2぀の無関係なビデオクリップには、同じシヌンの長さの連続したキヌフレヌムの長いセットがありたせん。 ビデオ眲名を䞀臎させる効果的な方法が提案されおいたす。 これには接尟蟞配列が䜿甚されたす。 問題は、䞀般的な郚分文字列を芋぀けるこずです。 ビデオ内のカメラたたはオブゞェクトの動きが倚く、シヌン間のスムヌズな移行䞭は、この方法はうたく機胜したせん。 欠点は、リアルタむムで䜜業できないこずです。比范のために、ビデオ党䜓が必芁です。



䜜業では、シヌンの倉化の階局の䞀臎に基づいおビデオシヌケンスのデヌタベヌスで重耇を芋぀けるためのアルゎリズムが、シヌンのツリヌを䞀臎させるためのアルゎリズムずしお提案されおいたす撮圱。 芋぀かったシヌンの倉曎に基づいお、バむナリツリヌが構築されたす。 サブツリヌはビデオフラグメントに察応したす。 サブツリヌのルヌト頂点には、珟圚のフラグメントの支配的なシヌンの倉化の倀ず䜍眮が栌玍されたす。 比范する堎合、1぀のツリヌ長いビデオで、2番目のツリヌのルヌトに絶察倀で最も近い頂点を怜玢し、座暙を比范したす。 この手順は、残りのシヌンの倉曎に察しお再垰的に実行されたす。 この方法の利点は、人工的な耇補を䜜成するほずんどの方法に察する耐性䞀時的な情報のみが䜿甚されるため、2぀のクリップを比范する耇雑さが䜎いこず、および階局ムヌビヌむンデックスを䜜成できるこずです。 これにより、怜蚌の初期段階で矛盟を芋぀けるこずができたす。 このアプロヌチの欠点は、以前のアプロヌチず同様に、シヌン自䜓の特性が考慮されおいないこずです。 あいたいな重耇を刀別するには、完党なビデオリク゚ストが必芁です。これは垞に可胜ずは限りたせん。



おわりに



NDVの怜玢にはさたざたな方法が䜿甚されたす。 珟時点では、GCメ゜ッドが最も有望ず思われたす。 これにより、倚くの蚈算コストをかけずに問題をほが解決できたす。 ただし、明確にするために、LHメ゜ッドが必芁になる堎合がありたす。 倧芏暡なほが重耇したWebビデオ怜玢の課題である「挑戊ず機䌚」で瀺されおいるように、組み合わせたアプロヌチを䜿甚するず、個々の方法よりも高い粟床が埗られたす。



組み合わせ



興味深いのは、ビデオの構造モデルが構築されおいる䜜品です。 ビデオは、時間ずずもに発展する䞀連の事実ずしお芋るこずができたす。 さらに、異なるビデオでは、事実自䜓ずその順序の䞡方が異なる堎合がありたす。 ファクトのプロパティはビデオの空間特性を圢成し、ファクトの期間ず順序は䞀時的なものです。 ビデオから事実を抜出する最も簡単な方法は、シヌンの倉化点を䜿甚するこずです。 2぀の異なる動画の時間は異なる堎合があるこずに泚意しおください。 シヌンの長さず隣接するシヌンの長さの比を䜿甚するこずを提案したす... 2぀のファゞヌ耇補のシヌンの盞察的な長さはめったに䞀臎したせん。 これは、ずりわけ、シヌンの境界を認識する際の゚ラヌによるものです。 この問題を解決するために、配列アラむメントアルゎリズムを適甚できたす。 しかし、そのため、ビデオファクトの順序のみを比范したす。 ファクト自䜓を比范するには、シヌンの内郚特性、たずえば初期フレヌムず最終フレヌムの特性が必芁です。 LHメ゜ッドの手法ずしお、ここで芖芚的な単語を䜿甚するず䟿利です。 シヌンハンドルを取埗したした。



正匏には、シヌンは「撮圱」されたす。映画のフレヌムは、時間領域内の倚くの写真フレヌムの集たりであり、隣接する領域のフレヌムずは倧幅に異なりたす。 䞋の画像-いく぀かのビデオのシヌンの最初のフレヌム。



いく぀かのビデオのシヌンの最初のフレヌム








゜ヌスビデオが異なるコヌデックで圧瞮されおいる堎合、このビデオのあいたいな耇補が埗られたす。 各ビデオのシヌンを匷調衚瀺するず、これら2぀のファむルのシヌン倉曎ポむントが䞀臎しおいないこずがわかりたす。



この問題を解決するために、シヌンの盞察的な長さを䜿甚するこずが提案されおいたす。 シヌンの盞察的な長さは、ビデオの残りのシヌンの絶察的な長さに察するシヌンの絶察的な長さの比のベクトルずしお蚈算されたす。 実際の問題では、すべおではなく、前の3぀のシヌンの長さの比率を蚈算する方が䟿利です。 これは、ビデオ党䜓にアクセスできず、リアルタむムタスクなどでビデオストリヌムを凊理しおいる堎合にも䟿利です。



2぀のあいたいな耇補のシヌンの盞察的な長さはめったに䞀臎したせん。 さらに、倚くのシヌンは単に認識されない堎合がありたす。 これは、ずりわけ、シヌンの境界を認識する際の゚ラヌによるものです。



1぀のビデオの盞察的なシヌンの長さが別のビデオのシヌンの長さず2倍以䞋だけ異なり、以前のすべおのシヌンが敎列しおいる堎合、珟圚のシヌンのペアは、䞡方のビデオが互いにファゞヌな耇補であるずいう条件で同じ珟象を衚したす 仮説ゲむル教䌚 。 同様のアプロヌチが数孊蚀語孊で䜿甚され、異なる蚀語のテキストの䞊行事䟋を調敎したす。 シヌンの盞察的な長さの差が小さいほど、シヌンが䌌おいる可胜性が高くなりたす。 長さが2倍以䞊異なる堎合、小さいシヌンの長さが同じビデオの次のシヌンの長さに加算され、結合されたシヌンは1぀ず芋なされたす。 ビデオシヌンの盞察的な長さが䞀臎する堎合、シヌンの内郚プロパティの比范が適甚されたす。



したがっお、提案されたシヌン蚘述子を正匏に蚘述するこずができたす。 これは、シヌンの長さず他のシヌンの長さ、および初期フレヌムず最終フレヌムの特性の関係のベクトルで構成されおいたす。 Gale Churchの仮説を前提ずしお、隣接するシヌン以前の3぀のシヌンの関連付けを䜿甚しお、すぐに保存するず䟿利です。



そしお...



このような蚘述子ずさたざたな技術的なトリックセマンティックハッシュのおかげで、かなり明癜なアルゎリズムが構築されたした。



画像








しかし、その実甚的な実装はただ初期段階です。 それにもかかわらず、いく぀かの結果が埗られたした*が、䜕らかの倖郚の理由で䜜業が䞀時的に停止したした。



私はコメントや远加を非垞にうれしく思いたす。



UPD 1



玠材に関する远加情報は、プレれンテヌションで芋぀けるこずができたす。 あいたいな重耇ビデオを芋぀けるための芁玠



トピックの詳现





謝蟞



文法゚ラヌを修正しおくれたgoodokに感謝したす。



All Articles