Fei-FeiがImageNetプロジェクトを立ち上げたときに重要なことが始まりました。 それは革命のように見えます。
潜在意識のレベルでは、ImageNetのコンペティションの議論でよく言及されている小さな詳細を手放しませんでした。 つまり、ニューラルネットワークが犬の品種をどれだけ正確に認識するかということです。 私のニューラルネットワークに共鳴するものがあります。 そして最後に、私はあなた方の多くがずっと前に理解していたことにも気づきました。 今、私は理解したことを定式化しようとします。
犬種は、私たちの知識のかなり狭い、よく発達した非常に専門的な分野です。 岩石を理解するには、多くの具体的な詳細を見て覚えておく必要があります。 品種に関連する多くの情報、例えば品種の歴史、交配の方法、遺伝学の基礎を知る必要があります。 多くの本を研究し、この分野の新しい情報を常に監視する必要があります。 さらに、犬の外観は、あなたが言うことができるなら、その科学はこの科学分野にとって重要です。 さて、私は同意します、繁殖は科学に大きく起因している可能性があります。 「この知識分野にとって重要です」と言いましょう。
私は最近、車と船を認識するシステムに取り組みました。 ImageNetの競争で輝いた既製のモデルを使用しても、良い結果が得られませんでした。 明らかに、ImageNetは犬の写真よりも船の写真がかなり少なかった。
船の写真はどこにありますか? これらの写真はデータベースまたはレジストリに収集されていますか? たぶんそれらは集められましたが、私はそれらを見つけることができませんでした。 別の小さな質問が私のニューラルネットワークに潜み、私を目覚めさせました。
数日前、私は再び初心者向けの人気のあるイメージベースであるアイリスフラワーベースに出会いました。 何かが脳内でクリックし、モデルに収まり始めました。
知識ベースと利用可能な画像
分類は最も古い科学的方法の1つです。 Carl Linneyの統一分類システムをすぐに思い出します。

これらのシステムのオブジェクトの画像は、分類の必要かつ最も重要な部分の1つです。 これは本質的に、知識の一部であり、知識の表現です。
科学者、エンジニア、専門家が日常的に必要とする画像ベースは何ですか?ランダムに選択してみましょう。
農学、植物

薬、細菌

釣り、魚

地質学、鉱石

生物学、昆虫

などなど。 掘り出そうとすると、文字通りあらゆる場所で画像を処理し、文字通りあらゆる場所で画像に基づいて決定を下すことがわかります。
画像データベースの必要性
オブジェクトの画像はほぼどこでも使用されます。 大量の本の中のオブジェクトを手動で検索したり、専門家を招待したりする代わりに、 どこでも常に認識システムを使用できれば、オブジェクト認識の作業が加速および改善されたことは明らかです。
画像があります。 しかし、それらは本やコレクションに散らばっています。 それらは、自動処理に便利な形式では表示されません。 そして、彼らは少数です。 優れた認識システムをトレーニングするには、明らかに十分ではありません。
モデル
私のモデルを紹介します。 長い間、誰もが非常に明確なことを理解してきたことを恥ずかしく思います。 このモデルには新しいものは何もないことを理解しています。 しかし、このテキストを書くことで問題を定式化することができました。 したがって、私はこのテキストを議論のためにあなたに提出する自由を取りました。
専用画像データベース
画像データベース (またはデータベース)を作成することにより、目に見えるオブジェクトを扱う科学および工学のあらゆる分野で明らかな利点が得られます。
特殊な画像認識モデル
可視オブジェクトを扱う科学および工学の分野は、独自の画像認識システムを作成することにより、明らかな利点を享受します 。
特殊な認識システムの組み合わせ
統合および結合するには、既製の特殊な認識システムを学習する必要があることは明らかです。
画像データベースを作成するための既製のシステム
そして、画像データベースを作成するためのライブラリである既製のシステムを作成するのが理にかなっているかもしれません。 便利にするために、たとえば、画像をインポートして、マークアップします。 しかし、 Amazon Mechanical Turkのようなもっと簡単なことができるかもしれません。
夢
ImageNetモデルだけでなく、船舶、ボート、カヤック、水上飛行機、トラック、車、自転車用の既製の認識モデルにもアクセスできる場合、私の最後のプロジェクトはどのように簡素化されますか。 これらすべてのモデルを簡単に組み合わせることができれば。
一般的に言えば、特殊な認識システムの作成は、エンティティの目に見える側面に関する知識を形式化するのに役立ちます。 専門性の低い知識を迅速かつ安価に効率的に配布および使用できます。 専門家の評価は、カメラ付きのスマートフォンを使用して取得できます。