Googleのエンジニアは、StreetViewの写真から家番号を認識することに成功したことについて話しました

Googleエンジニアリングチームは、Goodfellowという友好的な姓を持つ男( イアンは2009年にCS大学を卒業し科学出版物の堅実なリストを誇っています)が、データベースが持っている情報の収集の成功を報告したarxiv.orgの作品を公開しましたGoogleストリートビュープロジェクト-特に、人と同じ品質の家番号の自動認識について。 雄弁な事実-Googleは1時間以内にフランス(より正確には、Google車が運転した場所)のすべての番地を取得できます。



この作業は、 Deep Convolutional Neural Networksを使用したStreet View Imageryからの複数桁数認識と呼ばれ、認識目的でのニューラルネットワークの使用を扱います。 明らかなように、問題は多くの要因によって非常に複雑です:家番号の異なる場所、プレートの色、そのさまざまな傾き、プレート自体とその写真の両方の品質、その他多数。



その結果、タスクは11レベルのニューロンを持つDistBeliefニューラルネットワーク(これは、Google 「深層学習」で概念の意味を特定するために使用するものと同じネットワーク)の変更に移されました。 まず、画像上に番号が正確に存在している必要があり、画像は、希望の番号がその約3分の1を占めるように準備する必要があります。 また、チームは、家番号の長さを5桁に制限できることをかなり合理的に認めました。これは、世界のほとんどの都市番号システムで許容されます。



ニューラルネットワークの生のソースは次のとおりです。



画像








ネットワークのトレーニングには約6日かかり、公開されているストリートビューの家番号データベースの資料に基づいて実施されました。 その結果、トレーニング後のGoogleの認識精度は96%でした。これは、98%の同様の作業の人率に匹敵します。この数値は、さらなる研究の目標となります。



[ ソース ]



All Articles