パスポートスキャナーからスタンドアロンの認識デバイスまで

パスポートスキャナーの最初の実用モデルが作成されてから約3か月が経過しました。 品質と認識の速さの点で良い結果を得て、私たちはオリンピックのモットー「より速く!」を旗に掲げました。 より良い! よりコンパクト!」、次のPAKモデルの作成について設定します。 結果として私たちが得たものに興味があるなら、猫へようこそ。









カメラ部分の開発



光学システムはPAKの心臓部です。 Microsoft Webカメラを使用して最初のバージョンで作業した後、将来のモデルに必要なカメラの要件を策定することができました。

  1. 焦点距離の手動制御。
  2. 受信したフレームの高解像度。 判明したように、Microsoft-Camera 2から返されたMPixは最小限の許容範囲です。
  3. コンパクトサイズ。
  4. さまざまなプラットフォームおよびオペレーティングシステム用のドライバーの存在。
  5. 低コスト。


その結果、ビデオ監視システムとELP USBカメラの有名な中国メーカーのMI5100オープンフレーム小型USBカメラに落ち着きました。







安価でコンパクト、マニュアルフォーカスを提供し、最大5 MPixの画像を返し、さまざまなオペレーティングシステムで動作するこの「理想的な」カメラには、一見するといくつかの欠点があります。

  1. ビデオストリームは、かなり低品質のMJPEGを使用してエンコードされます。 その結果、結果のフレームには、対照的な境界線で特に顕著なJPEG固有のアーティファクトが含まれます。 しかし、低品質の画像に対して認識コアがシャープ化されたため、カメラのこの機能は深刻な問題を引き起こしませんでした。
  2. ビルドの品質はかなり平凡です。 たとえば、レンズを締めるために、私はFUMテープとPVCテープに頼らなければなりませんでした。


住宅の開発



最初のモデルと同様に、ケースの素材として、チップボードの家具シートを選択しました。 このソリューションにはいくつかの利点があります。

  1. 組み立ては簡単です。大規模な建設店で適切なサイズの詳細を提出できます。また、箱をねじるための確認書を購入することもできます。
  2. 少なくともデバイスの壁を薄くすることで、工業デザインがよりコンパクトになることが保証されていることを知ってうれしいです。


広角の小型カメラを使用すると、デバイスの高さを大幅に削減できました。前のサンプルでは276 mmでしたが、146 mmです。 PAKは、スキャナーの長さと幅を直接決定するA5以下のサイズのドキュメントを認識するように設計されています。







自動化開発



私の意見では、この記事のこの部分は最も興味深いものです。 ハードウェアおよびソフトウェアコンプレックスに関する以前の投稿を読んだ場合、おそらくドキュメントの認識自体もPAC内で実行されるように、ボックスの空きをコンピューティングパワーで埋める計画に気付いているでしょう。 最初の写真からわかるように、私たちはそれを行い、経験を共有する準備ができています。



そのため、ARMアーキテクチャで作られたシングルボードの8コアミニコンピューターOdroid-XU4がメインコンピューティングデバイスとして選択されました。 シングルボードコンピューターには、クロック周波数2.0 GHzの4つのCortex-A15コアと、クロック周波数1.4 GHzの4つのCortex-A7コア、2 GBのRAM、ギガビットイーサネットネットワークコントローラー、2つのUSB 3.0ポート、1つのUSB 2.0ポート、およびまた、モニターを接続するためのHDMI。 オペレーティングシステムとして、Lubuntuを選択しました。







マイクロコンピューターで認識コアを組み立てた後(幸いなことに、ここに問題はありませんでした。AndroidおよびiOSモバイルプラットフォーム用のSDKを定期的に収集します)、ドキュメントが認識されることを確認し、問題に直面しました-認識結果を外部のクライアントにどのように返すか。



最初の明らかなアプローチは、OdroidでWebサーバーを選択し、認識結果を確認することです。 実装は簡単ですが、私たちが望んでいたものではありません(そして、統合手順を実質的にゼロに減らすことができる自律型デバイスが必要でした)。



いつものように、予想外の代替ソリューションが登場しました。 しかし、PAKにUSBキーボードのふりをするように教えたらどうでしょうか。 バーコードスキャナーに少し似ています。 この形式では、PACを既製の情報システムに統合するには、デバイスを空のUSBコネクターに接続し、「仮想」キーを押す正しい順序を(デバイス上で)設定する必要があります。



このアイデアに触発されて、Odroid Shifter Shield、Arduino Micro、ワイヤーのセット、いくつかのボタン、LEDを購入しました。 Arduinoをプログラムし(残念ながら、Arduinoには非常に詳細なマニュアルが付属しています)、ボタンの認識手順を「ハングアップ」し、LEDの認識品質に関するフィードバックを行いました。



「7回聞くよりも1回見た方がいい」という言葉に固執して、完全に自律的なスキャナーの動作のビデオを共有します。







おわりに



私たちの実験は、重要な科学的および社会的目標にスムーズにつながりました。つまり、チェックポイント、銀行、チケットオフィスでパスポートデータを入力する問題を完全に解決し、輸入代替を検討する工業デザインを作成することです。



All Articles