ダミーの因子分析

私たちの多くは少なくとも一度は人工知能とニューラルネットワークに興味があったと思います。 ニューラルネットワークの理論では、 因子分析は最後の場所からほど遠いものです。 いわゆる隠れた要因を強調するように設計されています。 この分析には多くの方法があります。 主要なコンポーネントメソッドは際立っており、その際立った特徴は完全な数学的正当化です。 率直に言って、私が上記のリンクの記事を読み始めたとき、私は何も理解していなかったので不安を感じました。 私の興味は落ち着きましたが、通常起こるように、理解はそれ自体で思いがけなく起こりました。



それでは、0から9までのアラビア数字を見てみましょう。この場合は、Nokia 3310のLCDプロジェクトから取得した5x7形式です。









黒ピクセルは1、白-0に対応します。したがって、5x7マトリックスの形式で各桁を表すことができます。 たとえば、次のマトリックス:









画像と一致します:









すべての数字の写真を合計し、結果の数字を正規化します。 これは、5x7マトリックスを取得することを意味し、そのセルには、異なる数の同じセルの合計をその数で割った値が含まれます。 その結果、画像が得られます。









彼女のためのマトリックス:









最も暗い部分がすぐに目を引きます。 それらは3つあり、値0.9に対応します。 これが彼らの姿です。 すべての数字に共通するもの。 これらの場所で黒いピクセルに会う確率は高いです。 最も明るい領域を見てみましょう。 それらの3つもあり、それらは値0.1に対応します。 しかし、繰り返しますが、これはすべての数字が似ているものであり、すべての数字に共通しています。 これらの場所で白いピクセルを満たす可能性は高いです。 それらはどう違うのですか? そして、値が0.5の場所でのそれらの間の最大差。 これらの場所のピクセルの色も同様に可能性があります。 これらの場所の数字の半分は黒になり、半分は白になります。 これらの場所は6つしかないため、分析しましょう。









ピクセルの位置は、間違いなく列と行です。 カウントダウンは1から始まり、行の方向は上から下、列の方向は左から右です。 残りのセルでは、指定された位置の各桁のピクセル値が駆動されます。 次に、数字を区別できる位置の最小数を選択しましょう。 言い換えると、列の値が異なるものになります。 10桁であり、それらをバイナリでエンコードしているため、数学的には0と1の少なくとも4つの組み合わせが必要です(log(10)/ log(2)= 3.3)。 条件を満たす6つから選択してみましょう。









ご覧のとおり、列0と5の値は一致しています。 別の組み合わせを検討してください:









列3と5の間にも一致があります。 以下を考慮してください。









そして、ここでは衝突はありません。 ビンゴ! そして今、私はこれがすべて何であったかをあなたに話します:





5x7 = 35の各ピクセルから、信号が特定のブラックボックスに入り、出力で入力桁に対応する信号があると仮定します。 そして、ブラックボックスで何が起こりますか? そして、ブラックボックスでは、35のすべての信号から、デコーダー入力に供給される4つが選択され、入力で番号を一意に決定できます。 偶然のない組み合わせを探していた理由が明らかになりました。 実際、最初の組み合わせの4つの信号がブラックボックスで選択された場合、そのようなシステムの数字0と5は単に区別できません。 35個の信号の代わりに4個だけを処理すれば十分であるため、タスクを最小化しました。これらの4ピクセルは、この数値の配列を特徴付ける隠れた要因の最小セットです。 非常に興味深い機能はこのセットです。 列の値をよく見ると、数字の8は数字の4、7-5、9-3、6-2、0-1の反対であることがわかります。 ニューラルネットワークの特徴は、知的な人の介入なしに、それ自体がこれらの要因を分離できることです。 あなたは定期的に彼女に数字を見せ、彼女はそれらの4つの隠された信号を見つけ、彼女の10の出力のうちの1つと交換します。 最初に説明した同様の信号をどのように適用できますか? そして、それらは一連の数字のラベルとして機能します。 たとえば、ローマ数字には独自の高低のセットがあり、文字には独自の高低があります。 類似性シグナルにより、数字を文字から分離できますが、セット内の文字は最大の差によってのみ認識できます。



All Articles