オフィスでのビデオ分析のデモンストレーションが、実際の仕事とは大きく異なるのはなぜですか?

この出版物では、今日のいわゆるインテリジェントビデオ監視に代表されるビデオ分析の圧倒的な市場について説明します。



すでにその規模が非常に大きいため、「クラシック」の概念をこの方向に結び付けることができます。 さらに、Intelは最前線にあり、これはすでに古典的です。 ビデオ監視の開発者が製品を製造しているのは、そのオープンCVライブラリOpen CVに基づいています。 誇りのために、私はこの分野のプログラマーと言わなければならない-ロシアの、そしてロシアにいる-インテルのニジニ・ノヴゴロド支店にいる。 なぜ位置しているのですか? 方向は数年間閉鎖されており、人々は他の会社に分散しています。 どうやら、Intelはその「クラシック」の無益さを最初に感じたようです。



それにもかかわらず、彼のビジネスは生き続け、積極的に発展しています。 最も怠laな監視システム開発者のみが、「スマート」コードでOpen CVを使用しませんでした。 そして、このライブラリーは、その死後は驚異的です! CCTVシステムの多くの売り手が主張しているように、犯罪の瞬間を計算し、戦いを検出し、残されて持ち去られたオブジェクトを特定し、過激派を見つけます... 数十億ルーブルは、Safe City、Metro上のセキュリティ、Operation Anti-Terrorなどのプロジェクトのこのようなタスクに引き裂かれています。 しかし、これは政治家です。テクノロジーについて、この美しい展示用ラッパーが実際には機能しない理由についてお話します。



このようなビデオ分析のアルゴリズムは、パラメーターの正確な設定とアクションの順序に基づいているため、専門家はこの方向を「ハード」と呼びます。特定の仮想線を越え、検出された領域を超え、オブジェクトを配置します...別の方向(Intelではない)、柔軟なビデオ分析、その仕事は結び付けられていません正式なタスクですが、次回はそれについてお話します。



従来の「ハード」ビデオ分析の原理は、主に、共存の一般的な兆候によってビデオ検出の閉じた領域をローカライズするオブジェクト検出器に基づいています。 しかし、これまでのところ、犬と猫、車と猫、芝刈り機と木の枝を明確に区別する原則はありません。 残念ながら、これらはすべて、理想的な実験室条件でのみうまく機能し、次のような滑りやすい瞬間をバイパスしようとします:



1.ビデオ検出器はコントラストに基づいています。 背景とマージする領域は、その分析の対象にはなりません。 これは、目的のオブジェクトの主要なパラメーターを何らかの方法で予測することが不可能であることを意味します。



画像



最初のカメラはそれぞれ暗い背景に対して人を見て、白いシャツのみが検出され、身体の他の部分は背景と結合し、分析に利用できません。 照明の問題も考慮すると、暗闇を暗闇から区別することは事実上不可能です。 これは干渉レベルです。



画像



2番目は、それぞれ白い背景の人を見て、暗い頭と暗いズボンだけが検出されます。 白いシャツはまったく考慮されていません。 検出器に関する情報はありません。 したがって、最初のカメラは通常、1人ではなく複数のオブジェクトを認識します。



2.影のような現象をうまく除去することはほとんど不可能です-それは痛みを伴い多くの形を取り、私たち全員を常に追いかけます。



画像



その結果、ターゲットの割合に違反し、コンピューターはそれが人間であることを理解しません。



3.交差する目標は、心を「鉄の破片」を完全なカオスに導きます。 これらが1人でも5人でもない2人であると判断するために、今日のアルゴリズムでは不可能です。



画像



4.グループの目標は、複数の人や車などのサードパーティのオブジェクトからの検出という形では区別できません。



画像



5.人と車を区別する能力を証明する際にビデオ分析デモンストレーターが依存するパラメーター「オブジェクトサイズ」は、2Dビデオ監視では原則として受け入れられません。



画像



さらに、鳥と車のどちらですか?



6.多くの場合、そのような成果を耳にします。しかし、一度に複数のカメラに登録します。 カメラはさまざまな方法でオブジェクトを見るため、これはおそらく、欠陥のように聞こえるはずです。



画像



-最初は暗い滑らかなうなじ、2番目は長い突起のある明るい顔、鼻です。

-最初に大きなオブジェクトが表示されるのは、 人は彼女に近づきます、2番目は小さいです、なぜなら 上の男。 二次元ビジョンには見通しがありません。

-最初はスポーツシャツの前面に刻印があり、2番目は背面にあります。

-最初は、人の頭の上に揺れる枝が見え、頭と遠近法で合流します。 2番目は、カメラの前に座っているハエで、ゾウの外観を作成します(近くにいるため)。

一般に、厳密なビデオ分析が実際には不可能な理由のリストは長いですが、非常に興味深い側面があります。これらの問題は、事前に準備されたショーで簡単に隠すことができます。



均一な背景のセット、対照的なスーツのセット、互いに素な目標のあるセットのアクション、茂み、樹木、降雨、まぶしさの形での干渉の欠如...これらはすべてオフィスで簡単に整理でき、ビデオ分析は奇跡に変わります!



PS:作成者がずっと前に埋めた「古典」についてだけ話しましたが、その名前は多くの金銭的なプロジェクトで使用されています。 しかし、市場にはライブビデオ分析アルゴリズムがあります。それらの利点と欠点については、次の記事で説明します。



死体がいつか再び上昇する可能性があります。 まあ、新しいタイプのコンピューターまたはX線監視システムのある時点で。 おそらく、インテルが最初ではなかったので、他のロシア企業のロシア人がニジニノヴゴロドのコンピュータービジョンの研究室に来て、ビデオ分析の最前線にいたので、私はそれを望みます。 実際、これはロシアの発明です。 そして、そのような記事を書かなければならないのは残念です。 しかし、このために、まだ古くて宣伝された加工肉を買っている他のロシア人を欺かないでください。



All Articles