モバイルプラットフォームで認識すべきもの

画像






画像






どういうわけか、どのようなフリーランスエクスチェンジでも最初のプロジェクトを開始しました-常に認識していたため、同様の機能を持つアプリを作成する際に、今日あなたと共有したい経験がたくさんあります。



認識方法



実際、モバイルデバイスで認識する方法はそれほど多くありません。



次の3つのオプションがあります。



  1. 既製のライブラリを使用して、画像をフィードするだけです
  2. APIを使用するか、サーバーで認識を行います
  3. 独自のテキスト認識ライブラリを作成する


1.ライブラリを取り、写真をフィードします



これらの目的のためのライブラリはたくさんありますが、その中には宇宙的なものはありませんが、いくつかはより良く、他はもっと悪いです。 私自身のために、私はこれらに注意しました:



•Tesseract



画像



このライブラリはC ++で記述されています。 彼女はカッコイイのでここにはいません。 私のアドバイス:それを回避してください。 このライブラリを称賛する多くの記事がインターネット上にあり、構文はシンプルで便利ですが、個人的な経験からはひどいことが確認されています。 なぜそう説明するのですか:モバイルデバイスの場合、プロセッサの負荷に制限があり、適切な解像度で画像をフィードすると、電話がフリーズするだけで、マルチスレッドでさえも役に立たないので、モバイルには適合せず、認識精度は半分にすぎません理解します-それはすでに良いです。 誰かが信じていない場合-あなたはそれを自分で確認することができます1時間以内にかかります。



精度:4/10

速度:4/10

シンプルさ:8/10

負荷:2/10



一般的な印象:恐怖、10番目の道を回る



•OpenCV



画像



良好で非常に機能するライブラリで、一度だけ使用しました。長方形を認識する必要があり、タスクに完全に対応しました。 私はまた、それがあらゆる種類の他の事柄である可能性があることを知っています。 多くのチュートリアルがあり、構文は単純で、それ以上のものはありません。 一般的に、私は彼女にとても満足しています。



精度:8/10

速度:6/10

シンプルさ:8/10

負荷:6/10



機能:ちょうど良いライブラリー

全体的な印象:全体的に悪くない



•モバイルビジョン



画像



図書館の中で私のお気に入り。 テキスト、顔検出、感情を認識し、QRコードを読み取ります。 つまり、機能は優れています。 最も重要なことは、鉄の要件が低いことです。 モバイルデバイス専用に作成されました。 写真を撮って結果を表示するだけでなく、カメラを接続してすぐにカメラからデータストリームをスキャンし、その結果に基づいてカメラの上にあらゆる種類のものを認識して描画でき、FPSの沈下がないという事実が本当に気に入りました。 しかし、もう1つの重要な基準は精度です。ここでは、約95%です。 確かに、欠点もあります。 先月、GoogleはバグのあるバージョンのPlayサービスをリリースし、多くのデバイスでテキスト認識が機能しませんでした-ただのクラッシュでしたが、今ではすべてが問題ないようです。



サイトへのリンク: https : //developers.google.com/vision/



精度:10/10

速度:10/10

シンプルさ:7/10

負荷:9/10



機能:品質を損なうことなく高速データ処理を行うため、カメラに取り付け可能

全体的な印象:すばらしい



2.ネットワーク要求



一番下の行は簡単です。写真をネットワークに転送し、jsonの形式で応答を取得します。 写真はさまざまな方法で転送できます:リンク、base64文字列、投稿要求。 欠点の中で:インターネットへの常時アクセス、カメラからのストリームを処理することはできません。



•認識エンジンでサーバーを起動します



原則として、これは別の問題ですが、このオプションは検討する価値があります。ある種のapiから独立しているため、価格が一定に変化しないためです。



精度:ライブラリに依存

速度:ライブラリ依存+リクエストごとの時間

シンプル:1/10(認識できる独自のサーバーの作成は5分ではありません)

負荷:10/10(最小、ネットワークへの要求のみ)



機能:誰にも依存せず、自分で調整する

一般的な印象:出血するが、かなりリアル





•クラウドプラットフォームビジョン



画像

私はこのことを使うのが好きでした。 ocr、ロゴ認識、顔検出、ラベル検出など、最大の機能範囲があります。 また、視覚の認識を強調したいと思います-単に類似物はありませんが、精度は高く、いくつかのムホスランスクの老朽化した教会を認識することができますが、事件もあります。 リンクとbase64文字列をフィードできます。



クラウドビジョンのリクエストを作成するためのライブラリは確かにあまり良いものではありませんが、規範のクライアントを作成する例として: https : //github.com/GoogleCloudPlatform/java-docs-samples/tree/master/vision



精度:10/10

速度:リクエストに応じた時間

シンプルさ:7/10

負荷:10/10(最小、ネットワークへの要求のみ)



機能:すべてを認識できる、ランドマーク検出

一般的な印象:かなりクールですが、価格は...



•カイロス



この美しい機能認識APIについて知っている人はほとんどいません。 正確な結果が得られ、使いやすいです。 一般に、彼らはまだリクエスト用のSDKを持っていますが、GitHubで開くことができますが、有料です(私が見つけました)。 価格は比較的手頃なので、使用できます。



精度:10/10

速度:リクエストに応じた時間

シンプル:SDKで9/10、そうでない場合は6/10

負荷:10/10(最小、ネットワークへの要求のみ)



機能:顔認識の幅広い機能

全体的な印象:顔だけを認識する必要がある場合はかなりクール



3.認識用に独自のライブラリを作成する

パトスとクールですが、あなたは多くの時間を殺さなければなりません。



精度:それはあなた次第です

スピード:あなた次第

シンプルさ:-1/10

ロード:あなた次第



機能:何かを変えたい



このリストが誰かを助け、リストに載っていないライブラリをコメントで投稿してくれることを願っていますが、それらはクールであるか、あまりそうではありません。



All Articles