ビデオ分析の2つの反対方向:「剛性」と「柔軟性」、どちらが強いですか?

問題-冗長なビデオ情報の削減-は、データ量が人を消化できない今日のビデオ監視に非常に関連しています。 誰もがさまざまな方法でそれを解決します。重要なポイントを検索する方法と、重要でないポイントをフィルタリングする方法です。 より効果的なものは何ですか?



画像



以前の記事では、このトピックに触れるとすぐに、ビデオ分析の謝罪者とすぐに話し合いました。 従来のビデオ分析の創始者である元インテルプログラマーでさえ、この問題に対する立場を修正しました。 このポータルには、この分野の著名人と考えられている人がたくさんいます。これを利用しないのは罪です。 私はそれらから始めると思います。 この記事では、違いの概要のみを説明します。そして、専門家の議論を期待しています。 そして、イベントがどのように展開するかを確認します。



残念ながら、「アナリスト」のサイトへのリンクを提供する余裕がないため、議論の前に禁止されないため、ウィキペディアを使用して基本的な概念を自分の言葉で少し説明しようとします。 膨大な数の国内外の企業を調査した後、情報量を削減するためにビデオ監視で使用されるビデオ分析の2つの特定の領域を特定できます。



1.タフなビデオ分析は、古き良きIntel Open CVライブラリに基づいたクラシックですが、Intelはもはや開発していません。 ほとんどの場合、その基盤はオブジェクト検出器です。 このアルゴリズムは、特定の兆候に従って変化する閉領域をビデオフレームのストリームにローカライズします。 私たちはすでに会社「 Synesis 」の例でそれを調べました。 ビデオ監視プログラムは、これらの「オブジェクト」の有用な目標を計算するためにそれらを分析しようとしています:人、車...それらが発見されたときの主なアイデアは、行動、動き、そして最終的に、社会的に犯罪的な意味での解釈に適した結果として生じる行動パターンを分析することです



画像



2.柔軟なビデオ分析は、ロシアの刑務所にあるように見える若い知識分野です。 ウィキペディアはそれをビデオセマンティクスと呼び、次のように解釈します。「ビデオセマンティクスは、セマンティックユニット(ビデオ)に分解することによるビデオ情報の簡潔な論理的要約であり、各セマンティックユニットは、前後のビデオセグメントとは異なる独自の完全な意味を持ちます。 これはビデオ分析の特別な領域です。いわゆる柔軟なビデオ分析と呼ばれ、難しいパラメーターや正確な形式化はありません。



一般的に、2回目の読み取りの後、その場で、最初のオプションの方が個人的に適しています。 それでも、だれが攻撃を準備しているのかをはっきりとすぐに言う必要があります。 さらに、これは私たちの「同志」が要求するものであり、数十億人が全国の安全な都市や地下鉄で知的ビデオ監視システムを購入しています。 結果がしばしば否定的であることだけが怖いです。 しかし、政治を政治家に任せましょう。



では、これら2つのアプローチの反対は何ですか? あなたがテキストを聞くなら-それだけです。 最初のものは、ビデオストリーム内の脅威である犯罪または人々(車)の行動を探します。 第二-このような機会を否定し、世界を構築する理論に訴えます。 説明に対して誤った態度を表明した場合、申し訳ありませんが、通常、原則としてハードビデオ分析は不可能であるという事実から始まります。 奇妙なことに、 ビデオ分析に関する記事もこれで始めましたが、特定のメーカーの特定の例にのみ基づいていました。 ただし、これは柔軟なビデオ分析がより良いものになるという意味ではありません。 落ちた-だから、すべてを倒しなさい、たくさんの森!



まあ、今、私はすでに硬直に対する態度を上回っていて、それが私に適していると言っています-私はスケールを修正する必要があります、私は他のことについて何か言います:私は「柔軟」という言葉が好きです、それはきれいです!



したがって、前者はオブジェクトの動作を形式化します(それができるかどうかはわかりません)が、他の人はできません(まあ、またはしたくない)。 ガードへの最初の叫び-見て、戦い! 第二-注意を払って、何かが起こった! 繰り返しますが、最初のものはより良い観点から描かれています-より理解しやすいです。 しかし、後者の方が何となくより正直に聞こえます。



「ハード」は重要なものを探し、「柔軟」は不要なものを取り除きます。 このフレーズの後、私は突然それらの間に違いがないと感じました。 しかし、彼らは自分自身をクラスのテクノロジーの敵と考えています。



厳しいビデオ分析は、オブジェクト、人、車、猫の分類に基づいていると既に述べました...しかし、彼女はどのように犯罪を探していますか? 大多数の企業は、仮想線を越えたり、混雑したり、ターゲットを移動するためのさまざまなオプションのためのアルゴリズムを提供しています。 つまり ほとんどの場合、「許可されているものの境界」を明確に知る必要があります-施設の特定の場所、その交差点は犯罪または検証の機会です。 これについては後で説明しますが、アプローチの方法を比較することについてのみ説明します。 しかし、すべての場合において、「厳しい」人は、不正行為の方法と手段が定義されていると仮定します。



画像



柔軟なビデオ分析の支持者は、質問の声明を「彼らがあなたを殺す方法を正確に知っていますか?」のようなフレーズで笑します。 「柔軟」では、何にも付けられず、何もカウントせず、コンピューターに完全に安全を与えます。 そして、このフレーズは心配です! しかし、柔軟なビデオ分析は人間の平和をどのように保護するのでしょうか? ウィキペディアによると、「ビデオセマンティクスは、統計的変化の分析の結果としてビデオコンテンツの特性を追跡します」、つまり 基礎は統計です。 たとえば、1000フレームを取り、それらのいずれかに何か新しい異常があるかどうか、または変更の性質が以前の1000フレーム、または以前の100 000フレームに完全に収まるかどうかを確認します。 すべての人が常にこの道をまっすぐ歩いて、誰かが突然芝生を駆け抜けたとします。 または、誰もジャンプしていない場所にジャンプしました。 彼は急に走りました...



画像



道路の真ん中で、私は身をかがめて、横になり、ポケットから樽を取り出しました... ここで私は、「ポケットやスカーフから樽を取り出した」という会社の言葉に恥ずかしいだけです。 脅威の形式化はありません。 しかし、私たちはまだ誰にも圧力をかけません。



画像



ちなみに、「タフな」ものでは、ターゲットのクラスとそのアクションを決定するすべての瞬間は非常に複雑であり、私の意見では、設定、およびカメラビューの異常(風、振動など)または地面上の大きなオブジェクトの再配置に失敗が伴います機能します。 また、「柔軟」には、一部のメーカーが主張するように、その動作の論理から判断すると、真実に対応する設定はまったくありません。



すでに見たように、リジッドビデオ分析は干渉、特に街路に非常に敏感です。 柔軟なウィキペディアの主張について:「ハードセットパラメーターと正確な形式化の欠如は、一般的な分析に含まれ、統計的変化の違いの結果としてそれらから差し引かれるため、干渉から保護します。」 ええ、はい、スパイダーがカメラに座っている場合、すべてのフレームにこのスパイダーがあります-理論的には、統計に変化はないはずです。 別のクモがクロールしない場合。



低コントラストの目標に関する以前の議論から何かを投げます。 これは、悪役が迷彩服を着てクロールし、地形と融合することを意味しますが、計算する必要があります。 人物を分類するには、オブジェクト検出器に高い感度と高いコントラストが必要です。そうしないと、散乱した小さなターゲットが大量に必要になり、迷彩服の一部が完全にマージされます-深刻な低コントラストについて話しているためです。 したがって、この問題における厳格なビデオ分析は、おそらく柔軟な分析よりも劣っています。目標の分類は原則として重要ではありません。 しかし、それはいくらですか? このトピックは議論のためだけに投げましたが、結論はありません。



議論すべき別のトピックは、解決中のトランザクションです。 たとえば、輻輳の定義は、厳格なビデオ分析と柔軟なビデオ分析の両方に該当します。 両方とも-伝えられるところでは-この問題を扱っています。 異なる方法でのみ。 どちらがより効果的ですか?



画像



まだたくさんの質問があります。記事の長さを苦しめないようにしようと思います。残りについては今後議論します。 (禁止されていない場合。)



All Articles