機械学習法を使用したビデオストリームでのタンク認識(ElbrusおよびBaikalプラットフォームでの+2ビデオ)







活動の過程で、開発の優先順位を決定するという問題に日々直面しています。 IT業界の発展のダイナミクス、ビジネス側と新しいテクノロジーに対する国家の絶えず高まる需要を考えると、毎回、開発ベクトルを決定し、当社の科学的可能性に独自のリソースとリソースを投資し、すべての研究とプロジェクトが基本的であることを確認しますそして学際的。







そのため、主要技術であるHIEROGLYPHデータ認識フレームワークを開発し、文書認識(当社の主な事業ライン)の品質の向上と、関連する認識問題を解決するための技術の適用の可能性の両方を重視しています。 今日の記事では、認識エンジン(ドキュメント)に基づいて、ビデオストリーム内のより大きく戦略的に重要なオブジェクトをどのように認識したかを説明します。







問題の声明



既存の経験を使用して、タンク認識システムを構築します。これにより、オブジェクトを分類し、特殊な機器を使用せずに制御が不十分な条件で基本的な幾何学的パラメーター(方向と距離)を決定できます。







解決策



問題を解決するための主要なアルゴリズムとして、統計的機械学習のアプローチを選択しました。 しかし、機械学習の重要な問題の1つは、十分な量の学習データの必要性です。 明らかに、必要なオブジェクトを含む実際のシーンから取得した現物画像にはアクセスできません。 したがって、トレーニングに必要なデータを生成することに頼ることになりました。 この場所での経験の利点は大きいです。 それでも、このタスクのデータを完全に合成することは不自然に思えたので、実際のシーンをモデリングするための特別なレイアウトが用意されました。 田舎をモデル化するさまざまなオブジェクトがレイアウトにインストールされます:特徴的な景観カバー、茂み、木、障壁など。 画像は、デジタル小型カメラを使用してキャプチャされました。 画像をキャプチャする過程で、背景の変化に対するアルゴリズムの安定性を高めるために、シーンの背景が大幅に変化しました。







画像







4つの戦車モデルがターゲットとして使用されました:T-90(ロシア)、M1A2エイブラムス(米国)、T-14(ロシア)、メルカバIII(イスラエル)。 オブジェクトはポリゴンのさまざまな位置に配置されていたため、オブジェクトの許容可能な表示角度のリストが拡張されました。 エンジニアリングの障壁、樹木、茂み、その他の景観要素が重要な役割を果たしました。







画像







したがって、数日で、アルゴリズムの品質のトレーニングとその後の評価に十分なセットを収集しました(数万枚の画像)。







彼らは、認識をオブジェクトのローカリゼーションとオブジェクトの分類という2つの部分に直接分割することにしました。 ローカライズは、訓練された分類器ViolaおよびJonesを使用して実行されました(結局、タンクは通常の剛体であり、顔より悪くないため、「詳細なブラインド」Viola and Jonesメソッドはターゲットオブジェクトを迅速にローカライズします)。 しかし、角度の分類と定義を畳み込みニューラルネットワークに委ねました。このタスクでは、検出器が、たとえばT-90をメルカバと区別する機能を正常に識別することが重要です。 その結果、同じタイプのオブジェクトのローカライズと分類の問題をうまく解決するアルゴリズムの効果的な構成を構築することができました。







画像







さらに、私たちが持っているすべてのプラットフォーム(Intel、ARM、Elbrus、Baikal、COMDIV)で結果のプログラムを起動し、パフォーマンスを改善するために計算が難しいアルゴリズムを最適化しました(これについては、記事https:// // habr .com / ru / company / smartengines / blog / 438948 /またはhttps://habr.com/en/company/smartengines/blog/351134/ )およびデバイス上のプログラムのリアルタイムでの安定した動作を実現しています。











上記のすべてのアクションの結果として、重要な戦術的および技術的特性を備えた本格的なソフトウェア製品を取得しました。







スマートタンクリーダー



そこで、私たちは新しい開発- スマートタンクリーダービデオストリームでタンクの画像を認識するプログラムを紹介します。











通常、Habréに関する記事の結論として、携帯電話を使用したい人は誰でもアプリケーションのデモ版をダウンロードして、実際に技術のパフォーマンスを評価できる市場へのリンクを提供します。 今回は、結果のアプリケーションの詳細を考慮して、すべての読者がタンクが特定の側に属しているかどうかを迅速に判断する問題に直面しないことを望みます。








All Articles