MWC-2017。 モバイル認識の新技術(3つのビデオ+ App StoreとGoogle Playのデモリンク)

来週、バルセロナはモバイル業界の世界最大のイベントである国際展示会Mobile World Congress 2017(2017年2月27日から3月2日まで)を開催します。 スマートエンジンチームは、モバイルデバイスでのビデオストリームの認識と処理の新しい開発を示します。さまざまな国からのIDの認識、ホログラムの検出、ドキュメントの動的なパンニングです。













新しい技術の短いレビュー(+ビデオ)を準備し、バルセロナで公開します。 猫へようこそ!







1.モバイルデバイスでのさまざまな国のIDの認識







現在、世界では、モバイルアプリケーションでの識別ドキュメントの認識は、特定の種類のドキュメントに存在する特別な機械可読ゾーン(MRZ)によるデータの抽出に制限されることがよくあります。 ただし、多くのタイプのIDおよびパスポートでは、このゾーンはそうではありません。 そして、このような文書は世界中に数百あります。







この点で、MRZデータの抽出に加えて、関連するすべての人間が読み取れるテキスト情報を認識し、幅広いクラスのドキュメントで写真や署名を検索する拡張可能なソリューションを開発するタスクを引き受けました。







Smart IDReaderは、認識前のドキュメントタイプの超高速識別、情報(テキストおよびグラフィック)要素のサブピクセルローカリゼーション、および超軽量人工ニューラルネットワーク(ANN)によるテキスト認識を実装します。







私たちが知っているように、携帯電話で直接認識する場合、重要な問題-速度とエネルギー効率、および「最初にすべてを認識してからテキストを理解する」というおなじみのアプローチは、受け入れられる結果につながりません。 文書の種類を知ることで計算の複雑さを劇的に減らすことができますが、問題はこれらの種類の数が数百に及ぶことです。 したがって、ドキュメントタイプ分類子の重要な要件は、ドキュメントタイプの数という点での準線形の複雑さです。







ANNの高いパフォーマンスは、各コンピューティングプラットフォームの低レベル計算の高度な技術的最適化と、歪みモデリングを使用した一般化されたトレーニングとデータ増強の高度な技術を使用することによって保証されます。







少数の実際のデータコピーに基づいて高精度のANNを作成できる独自の「ワンショット拡張」テクノロジーを構築しました。









ロシアの文書(パスポート、SNILS、運転免許証、STS)に加えて、米国(パスポート)、イギリス(運転免許証、パスポート)、ドイツ(パスポート、IDカード、運転免許証)、オーストリア(IDカード、運転免許証)、スペインの文書がサポートされるようになりました(IDカード)、フィリピン(パスポート)、マレーシア(MyKad IDカード)、カザフスタン(IDカード)、日本(運転免許証、健康保険証)、中国(パスポート)、および機械可読ゾーン(MRZ)および銀行を含むすべての文書 カード(クレジットカードやデビット)。 ドキュメントのリストは拡大しています。







Smart IDReaderデモは、 App StoreおよびGoogle Playからダウンロードできます。







2.モバイルデバイス上のビデオストリーム内のホログラムの検出







人は、自分の前で文書を振るだけで、自分のコピーからホログラムで元の文書を簡単に区別できます。 最近まで、このチェックを自動的に実行できる製品は市場にありませんでした。 これは、サブピクセルの精度でビデオストリームに対応を確立する技術がなければ、ホログラムを静的なモトリー画像の動きと区別することは非常に難しいという事実によるものです。







必要な幾何学的精度の指標を達成し、別の問題を解決しました-照明の変化とホログラムのオーバーフローを安定して区別します。 このような問題の理論は古くから知られており、色の恒常性と呼ばれていますが、既にキャリブレーションされたデバイスが必要であり、エンドユーザーが携帯電話を使用する場合は不可能です。







ビデオは、ロシア連邦のパスポートでのホログラム検出を示しています。









3.ビデオストリーム内のドキュメントの動的な間引きとパン(ビデオスキャン)







条件付きで平らな下にある表面の動的なパンニングのタスクは、航空写真撮影中にしばしば起こります。 この場合、フレーム内の画像変位の速度は一定である必要はありません。 ヘリコプターから撮影する場合、速度の特に大きな変動が発生します。 動的デシメーション技術は、小さな空間変位を持つフレームの削除または平均化で構成されます。 その結果、平均化が可能な領域で、観測された速度とノイズレベルの低下に合わせて、より小さなボリュームのビデオストリームが生成されます。 同時に、単一のパノラマ画像を作成することもできます。 このタスクは、ドライブの容量と通信チャネルの幅を制限して撮影するときに最も関連があるようです。







ビデオでは、このようなビデオスキャンを使用して、非標準サイズの領収書の高品質画像を取得する方法を示しています。












MWC 2017のブース(ホール7スタンド7G84)でお待ちしております。今後の様子をお聞かせください。








All Articles