パターン認識、推論

一般的な場合、パターン認識の問題はまだ解決されていません。 そのため、最初にいくつかのケースで画像内の個々のオブジェクトを検索できる方法について説明し、次に将来について説明します。



人間の目には、画像のプロパティを認識できるブロックがいくつかあります。 人は周囲の現実からオブジェクトのセットをすばやくつかみ、分類します。 彼はどのような基準に従いますか? それらの多くはありません:



基本的なパターン認識アルゴリズムは、一般に、同じブロックをコピーします:

-アウトライン選択

-プリセットの色、テクスチャの検索

-特定の画像要素に応答する線形フィルター

-情報の飽和度が高い/低いエリアの選択、詳細の明瞭さ





たとえば、最初の近似として、画像内の人間の肌を認識するという古典的な問題は、次のように解決されます。

A)潜在的に人間の肌である可能性のある色を強調する

B)テクスチャがチェックされます

C)選択した領域の接続性と十分なボリュームがチェックされます



原則として、顔認識はこれに線形フィルターへの反応を追加します。これは次のようになります。

画像

ところで、生まれたばかりの赤ちゃんが顔を出すように、実験が行われました。これらは2つの暗い丸いオブジェクトであり、その下には細長い暗いオブジェクトがあります。



要約すると、画像認識の既存の方法は、通常、アルゴリズム的に記述でき、この種のオブジェクトを検索するときに「フック」できるオブジェクトのいくつかの特徴的な詳細を見つける傾向があります。



それでは、未来について話しましょう。 人間の脳の重要な能力は、画像間の連想関係を確立する能力です。 彼はそれらが類似していると判断できます。 2つの画像を比較する過程で、人は先ほど話した画像要素に注目します。特定の色のスポット、形状と線の形状、情報の飽和、テクスチャ、単純なフィルターへの反応です。 子どもの頃、私たちはそれぞれ、頭に署名されたタグを持つ画像の大きなデータベースを形成します。 新しいフレームが表示されると、データベースで適切な画像を非常にすばやく見つけて「認識」します。



ただし、検索プロセスで基本的な記号に従って画像の詳細な比較があると仮定するのは間違っています-その巨大なコンピューティングリソースであっても、脳に保存されているデータベースの量はこれには十分ではありません。 したがって、頭の中には、すべてのオブジェクトのシンボリックで意味のある短い説明が格納されています。 「スティック、スティック、キュウリ、それが残った小さな男」、「テーブルは4本の脚を持つ大きな長方形の板」など 黒いハートを描いたカードの画像は、ほとんどの人がピークとして認識します。



つまり 人間の画像認識のプロセスは次のようになります。

A)シーンは、いくつかのシンボリック形式で記述されます(ほんの数文である場合があります。つまり、100メガピクセルの画像は、たとえば1000バイトのフレーズになります)。

B)シンボリック記述は、データベース内の画像の他の既存のシンボリック記述と比較されます

C)私たちの心の中で最も適切なマッチ「フレアアップ」



意味構造のセットの形でシーンを記述するこの能力は、パターン認識アルゴリズムにはまだ十分ではありませんが、この方向で非常に興味深い作業が行われています。 多くの特殊なケースでは、良い結果を得ることができますが、私はまだ明確で完全な解決策を見ていません。



最後に、おそらく、センセーショナルなかつて使用されたニューラルネットワークの方法に言及する価値があります。 アカデミック環境では、彼らは彼を本当に信じており、実際のプロジェクトでは彼はめったに使用されません。 判明したように、ニューラルネットワークの構成は非常に難しく、さらに人間の脳のプロセスのモデリングが不十分であり、これには大きな希望がありました。 今日、ニューラルネットワーク(未来の予測、手書き認識、顔認識など)の助けを借りて以前より多くの問題が解決されており、他のより古典的な数学手法を使用した効果的なソリューションに役立っています。



All Articles