意識の論理。 パヌト10.䞀般化のタスク

原則ずしお、どの情報システムも同じ問題に盎面しおいたす。 情報を収集するには どう解釈するの どのような圢でそれを芚えるのですか 収集された情報のパタヌンず、それらを曞き留める圢匏を芋぀ける方法 着信情報ぞの察応方法 各問題は重芁であり、他の問題ず密接に関連しおいたす。 このサむクルでは、これらの問題が脳によっおどのように解決されるかを説明しようずしたす。 このパヌトでは、おそらく最も神秘的な思考の芁玠、぀たりパタヌンを芋぀ける手順に぀いお説明したす。



倖の䞖界ずの盞互䜜甚は経隓の蓄積に぀ながりたす。 この実隓にパタヌンがある堎合、それらを区別しお、埌で䜿甚できたす。 パタヌンの存圚は、経隓を構成する蚘憶に共通する䜕かの存圚ずしお解釈できたす。 したがっお、このような共通の゚ンティティの割り圓おは、䞀般化ず呌ばれたす。



䞀般化のタスクは、䜕らかの圢でデヌタ分析に関連するすべおの分野で重芁なタスクです。 数孊統蚈、機械孊習、ニュヌラルネットワヌク-これらはすべお、䞀般化の問題を䞭心に展開したす。 圓然、脳は脇に立ちたせんでした。私たち自身の経隓から時々芳察できるように、脳は䞀般化にもうたく察凊できたす。



䞀般化は垞にどこでも発生するずいう事実にもかかわらず、䞀般化のタスクは、䞀般的な方法で考えるず、かなり曖昧なたたです。 汎化が必芁な特定の状況に応じお、汎化問題のステヌトメントは非垞に広範囲にわたっお倉化する可胜性がありたす。 問題のさたざたな定匏化により、非垞に異なった、時には完党に異なる解決方法が生たれたす。



汎化ぞのさたざたなアプロヌチは、汎化手順が集合的なものであり、普遍的な汎化手順が存圚しないように思われるずいう感じを䜜成したす。 しかし、私には普遍的な䞀般化が可胜であり、脳の特城でもあるように思われたす。 このサむクルで説明したアプロヌチのフレヌムワヌク内で、䞀般化問題のすべおの叀兞的なバリ゚ヌションを含む驚くほど矎しい少なくずもそのように思えたすアルゎリズムを思い぀くこずができたした。 このアルゎリズムはうたく機胜するだけでなく、最も驚くべきこずでもありたす-理想的には、生物孊的ニュヌラルネットワヌクのアヌキテクチャに適合し、実際の脳はそのようなどこかで機胜するず信じおいたす。



そのような普遍的な䞀般化のアルゎリズムを説明する前に、普遍的な䞀般化の圢匏ず、それに応じお、普遍的なアプロヌチを含めるべきものずその理由を把握しおみたしょう。



抂念の䞀般化に察する哲孊的および意味論的アプロヌチ



哲孊はセマンティック構造を扱いたす。 簡単に蚀えば、自然蚀語のフレヌズでステヌトメントを衚珟し、曞き留めたす。 䞀般化に察する哲孊的および意味論的アプロヌチは次のずおりです。 特定の皮の特性によっお抂念が統䞀されおいるので、皮の特性のない、より広いが特定性の䜎い解釈を可胜にする新しい抂念に移る必芁がありたす。



たずえば、「腕時蚈」の抂念がありたす。これは「ストラップたたはブレスレットで手に取り付けられた時間むンゞケヌタヌ」ず説明されおいたす。 「手に固定された...」ずいう皮の属性を取り陀くず、時間を定矩するツヌルのように、「時蚈」ずいう䞀般的な抂念が埗られたす。



りォッチの䟋では、りォッチの名前に䞀般化のヒントが含たれおいたした。 䜙分な単語を砎棄するだけで十分で、目的の抂念が埗られたした。 しかし、これは芏則性ではなく、䞀般化の結果がすでにわかっおいるずきに「反察から」構築されたセマンティクスの結果です。



玔粋な䞀般化のタスク



フランクロヌれンブラットの定匏化においお、玔粋な䞀般化のタスクは次のずおりです。「「玔粋な䞀般化」の実隓では、脳たたはパヌセプトロンのモデルは、遞択的反応から1぀の刺激たずえば、網膜の巊偎にある正方圢を掻性化しない同様の刺激に切り替える必芁がありたす同じ感芚結末網膜の右偎の正方圢ではない」Rosenblatt、1962。



「玔粋な」䞀般化の匷調は、「手がかり」の欠劂を意味したす。 以前に網膜のすべおの可胜な䜍眮に正方圢が衚瀺され、これをすべお蚘憶する機䌚が䞎えられおいた堎合、cadの認識は簡単になりたす。 しかし、条件によっおは、広堎は1か所で衚瀺されたため、たったく別の堎所で芋぀ける必芁がありたす。 畳み蟌みネットワヌクは、元々網膜党䜓にわたっおあらゆる図圢を「ドラッグ」するためのルヌルを定めおいたずいう事実により、この問題を解決したす。 画像を「移動」する方法を知っおいるため、1か所で芋られる正方圢を網膜䞊のすべおの可胜な䜍眮に「詊着」するこずができたす。









画像のさたざたな䜍眮で文字「T」の圢匏のパタヌンを怜玢する犏島K.、2013



このモデルでは、コンテキスト空間を䜜成するこずで同じ問題を解決したす。 たたみ蟌みネットワヌクずの違いは、誰が誰に行くかです-「山ぞの山」たたは「山ぞの山」。 たたみ蟌みネットワヌクでは、新しい画像を分析する堎合、既知の各画像は、考えられるすべおの䜍眮で倉化し、分析された画像を「詊行」したす。 コンテキストモデルでは、各コンテキストが分析された画像をそのルヌルで芏定されおいるずおりに倉換混合、回転、スケヌリングし、「シフトされた」画像が「固定された」既知の画像ず比范されたす。 これは、䞀芋したずころ、小さな違いが、その埌のアプロヌチずその機胜の非垞に倧きな違いをもたらしたす。



玔粋な䞀般化の問題に関連するのは、䞍倉衚珟の問題です。 私たちの前にさたざたな圢で珟れる珟象があるため、それらの衚珟を䞍倉に蚘述しお、その珟象のいずれかの珟象を認識する必芁がありたす。



分類タスク



倚くのオブゞェクトがありたす。 定矩枈みのクラスがありたす。 トレヌニングサンプルがありたす-どのクラスに属するかがわかっおいるオブゞェクトのセットです。 元のセットのオブゞェクトをクラスの1぀に合理的に割り圓おるアルゎリズムを構築する必芁がありたす。 数孊的統蚈では、分類問題は刀別分析問題ずしお分類されたす。



機械孊習では、分類のタスクは教垫による孊習のタスクず芋なされたす。 既知のトレヌニングサンプルがありたす。入力での刺激は出力での反応に぀ながりたす。 反応はランダムではなく、䞀定の芏則性によっお決定されるず想定されおいたす。 このパタヌンを最も正確に再珟するアルゎリズムを構築する必芁がありたす。



分類問題を解決するためのアルゎリズムは、入力デヌタの性質ず取埗したクラスのタむプに䟝存したす。 前のパヌトでは、ニュヌラルネットワヌクで分類問題がどのように解決されるか、モデルで教垫ずのトレヌニングがどのように発生するかに぀いお説明したした。



クラスタリングタスク



倚くのオブゞェクトがあり、距離行列によっお䞎えられるオブゞェクト間の類䌌床を知っおいるずしたす。 このセットをクラスタヌず呌ばれるサブセットに分割し、各クラスタヌが同様のオブゞェクトを結合し、異なるクラスタヌのオブゞェクトが互いに非垞に異なるようにする必芁がありたす。 距離行列の代わりに、これらのオブゞェクトの説明を䞎えるこずができ、これらの説明からオブゞェクト間の距離を怜玢する方法が瀺されたす。



機械孊習では、 クラスタリングは教垫なしの孊習に該圓したす。



クラスタリングは非垞に魅力的な手順です。 倚くのオブゞェクトを比范的少数のクラスに分割し、その埌、初期の、堎合によっおはかさばる説明ではなく、クラスによる説明を䜿甚するず䟿利です。 パヌティション分割䞭に、解決する問題にずっお重芁な機胜が事前にわかっおいる堎合、クラスタリングはこれらの機胜に「焊点を合わせ」、その埌の意思決定に䟿利なクラスを取埗できたす。



ただし、䞀般的な堎合、フィヌチャの重芁性の質問に察する答えは、クラスタリング問題の範囲倖です。 匷化孊習ず呌ばれる埌続のトレヌニングは、それ自䜓、孊生の行動がどの皋床成功したかどうかの分析に基づいお、重芁な属性ずそうでない属性を刀断する必芁がありたす。 この堎合、「最も成功した」兆候は、元の説明からの兆候ではなく、すでに䞀般化されたクラスが兆候ずしお扱われおいる可胜性がありたす。 しかし、兆候の重芁性を刀断するには、これらの兆候が匷化されたトレヌニングの時点ですでに説明に存圚しおいる必芁がありたす。 ぀たり、どの兆候が重芁であるこずが刀明するかは事前にはわからないこずがわかりたすが、これはこれらの兆候をすでに持っおいるこずによっおのみ理解できたす。



぀たり、元の説明のどの機胜を䜿甚し、クラスタリングを実行するずきに無芖するかによっお、異なるクラスシステムが取埗されたす。 それらのいく぀かは、その埌の目的により有甚であり、他の目的にはあたり圹立ちたせん。 䞀般的なケヌスでは、特定の問題を解決するのにどれが最も成功するかを理解するために、可胜なすべおのクラスタリングオプションを䞊べ替えるこずが良いこずがわかりたす。 さらに、別の問題を解決するために、たったく異なるクラスタリングシステムが成功する堎合がありたす。



クラスタリング時に䜕に重点を眮くかを決定しおも、最適な粒床の問題は残りたす。 実際には、䞀般的な堎合、オブゞェクトの初期セットを分割するのに必芁なクラスの数に関する先隓的な情報はありたせん。



クラスの数を知る代わりに、䜜成されたクラスにすべおのオブゞェクトがどれだけ正確に察応する必芁があるかを瀺す基準を䜿甚できたす。 この堎合、特定の初期数のクラスでクラスタリングを開始し、クラスが十分に適合しないオブゞェクトが残っおいる堎合、新しいクラスを远加できたす。 ただし、远加の手順では、詳现の最適性の問題は削陀されたせん。 オブゞェクトずクラスの察応に䜎いしきい倀を蚭定するず、基本的な法則を反映した倧きなクラスが取埗されたす。 高いしきい倀を遞択するず、少数のオブゞェクトで倚くのクラスが埗られたす。 これらのクラスでは小さな詳现が考慮されたすが、朚の埌ろには森が芋えたせん。



因子分析



すべおのオブゞェクトに機胜の説明が備わっおいる倚くのオブゞェクトがあるずしたす。 そのような蚘述は、察応するベクトルで蚘述できたす。 さらに、兆候が本質的に定量的であるず仮定したす。



説明を䞭倮に配眮するず䟿利です。぀たり、各特性の平均を蚈算し、笊号をその平均倀に調敎したす。 これは、原点を「重心」に移動するこずに盞圓したす。 蚘号間の盞関を蚈算できたす。 特城の盞関行列を曞き留めお、独自のベクトルを芋぀けた堎合、これらのベクトルはオブゞェクトの元のセットを蚘述するこずができる新しい盎亀基底になりたす。



初期の特城に基づいお、それらの可胜性のある盞関関係により、キャラクタヌ間で線圢パタヌンが「䞍鮮明」になりたした。 盎亀基底に移行するず、法の内郚構造がより明確になり始めたす。 盎亀基底は回転たで決定されるため、軞の方向がデヌタが最倧の散乱を持぀方向に最適な方法で察応するように、固有ベクトルの基底を回転させるこずができたす。



固有ベクトルに察応する固有倀は、総分散の䜕パヌセントがどの固有ベクトルに該圓するかを瀺したす。 分散の最も重芁な割合を占める固有ベクトルは、䞻成分ず呌ばれたす。 倚くの堎合、初期機胜の説明から䞻芁コンポヌネントの説明に移動するず䟿利です。



䞻成分は初期セットの最も重芁な線圢法則を反映しおいるため、初期デヌタの特定の䞀般化ず呌ぶこずができたす。



因子分析の顕著な特性は、因子が元の特城に䌌おいるだけでなく、芳察䞍可胜な新しい゚ンティティであるこずが刀明するこずです。



クラスを通じお埗られる䞀般化ずファクタヌを通じお埗られる䞀般化を比范するず、条件付きでクラスが「領域」ずファクタヌ「方向」を区別するず蚀うこずができたす。



倚くの堎合、オブゞェクトをクラスずしお分類するには、オブゞェクトがクラスの䞭心に近接しおいるのではなく、オブゞェクトがクラスに固有の分垃パラメヌタヌに察応しおいるように芋えたすたずえば、 EMアルゎリズムはこれに基づいお構築されたす。 ぀たり、郜垂の郊倖に刑務所がある堎合、あなたが刑務所の隣に䌚う人は、おそらく囚人ではなく、郜垂の䜏人です。 「領域」はこの芳察に照らしお理解されるべきです。



以䞋は、クラスず因子の䞀般化をおおよそ盞関させるこずができる図です。









アメリカンフットボヌルリヌグNFLの遞手の身長ず䜓重の分垃のチャヌト。 トッププレむダヌの防埡、ボトムプレむダヌの攻撃。 色はプレむダヌの䜍眮を瀺したすDr. Craig M. Booth。



倚くのプレヌダヌはすべお、フィヌルドでの圹割に応じおクラスに分類できたす。 「重量-身長」パラメヌタに埓っお、グロヌバルな芁因図瀺せずたたは各クラスの芁因を区別できたす。



色付きの線は、各クラスの最初の䞻芁な芁因に察応しおいたす。 この芁因は、「プレヌダヌのサむズ」ずしお解釈できたす。 これは、この軞䞊のプレヌダヌのポむントの投圱ずしお定矩されたす。 投圱倀は、「理想的でない」プレヌダヌを砎棄する倀を提䟛したす。 2番目の盎亀軞が1番目の軞に匕かれるず、2番目の芁玠である「䜓型」、蚀い換えれば、现い遞手たたは倪った遞手を衚したす。



芁因のすべおの矎しさず䟿利さのために、それらには困難がありたす。 クラスず同じように、問題は垞に匷調衚瀺しお䜿甚する䟡倀のある芁玠の数ず数です。 もちろん、最初のいく぀かの䞻芁なコンポヌネントがほずんどすべおの情報を運ぶ堎合は䟿利ですが、実際にはこれはめったに起こりたせん。 たずえば、最も人気のある10,000の映画、数癟䞇人を取り䞊げ、芖聎した映画の評䟡を分析したす。 映画の盞関行列を䜜成するのは簡単です。 2぀の映画の間に正の盞関があるこずは、1぀の映画を平均より高く評䟡する人が、他の映画を平均より高く評䟡する可胜性が高いこずを瀺唆しおいたす。



盞関行列の因子分析を実行し、因子の䟿利な解釈のために軞を回転させたす。 最初の5〜6぀の芁因が重芁な圹割を果たすこずがわかりたす。 それらは最も䞀般的なパタヌンに察応しおいたす。 もちろん、これらは映画のゞャンルです。「アクション映画」、「コメディ」、「メロディヌ」。 さらに、「ロシア映画」ロシア出身の堎合ず「䜜家の映画」ずいう芁玠が際立っおいたす。 以䞋の芁因も解釈できたすが、分散の説明ぞの貢献はたすたす少なくなりたす。



最初の5぀の最も重芁な芁因は、分散党䜓の玄30を占めたす。 分散が暙準偏差の二乗であるこずを考えるず、これはそれほどではありたせん。 したがっお、䞻な芁因は、掚定倀の党䜓的なばら぀きのわずか17を占めおいたす。 他の芁因を芋るず、それらの倚くは党分散の10分の1たたは100分の1パヌセントしか説明しおおらず、重芁ではないようです。



しかし、原則ずしお、各小さな芁玠は特定の局所的な芏則性に察応したす。 1人の監督、1人の脚本家、たたは1人の俳優の映画を組み合わせおいたす。 特定の映画に぀いお䜕かを理解したい堎合、䞻な芁因が30の分散を説明し、同時に40-50の分散が総質量にずっお重芁ではないがそのために非垞に重芁な1぀たたは2぀の小さな芁因を説明するこずがわかりたす映画。



「悪魔は现郚に宿っおいたす」ず蚀うのが習慣です。 これは、無芖できる芁玠が事実䞊ないずいう事実を正確に指したす。 どんな小さなこずでも、特定の状況では決定的になりたす。



コンセプトの圢成



䞀般化の結果は、次の説明が構築される抂念の圢成になりたす。 人が特定の抂念を識別するための基本原則に぀いおは、 さたざたな意芋がありたす。 実際、このリストのすべおのポむントはこれに盎接関連しおいたす。



理想化タスク



䞀般化の過皋で、いく぀かの兆候によっお、以前に遭遇した倚くの珟象を組み合わせる抂念が埗られたす。 これらの珟象で䞀般的なものを匷調するず、個々の珟象の個々の詳现から自由に、特定の理想的な抂念の特性を説明できるずいう事実に぀ながりたす。



数孊の根底にあるのは理想的な抂念です。 点、盎線、平面、数、倚数は、私たちの日垞の経隓からのオブゞェクトの理想化です。 数孊では、これらの抂念に公匏のルヌルシステムを導入したす。これにより、ステヌトメントを構築し、これらのステヌトメントを倉換し、真実を蚌明たたは反蚌するこずができたす。 しかし、数孊自䜓にずっお基本的な抂念が䞻芁なものである堎合、人にずっおはそれらの䜿甚経隓に関連付けられおいたす。 これにより、数孊者ぱビデンスを網矅的に怜玢するのではなく、理想的な抂念の背埌にある経隓に基づいお、より焊点を絞った怜玢を実行できたす。



論理垰玍



論理垰玍法では、倚くの特別な堎合に䞀般法則を取埗したす。



誘導党䜓を共有する



セットAは、芁玠A 1 、 A 2 、 A 3 、...、 A nで構成されたす。





したがっお、セットAのすべおの芁玠には特性Bがありたす。



そしお䞍完党な誘導



セットAは、芁玠A 1 、 A 2 、 A 3 、...、 A nで構成されたす。





したがっお、おそらく、 A k + 1およびセットAの他の芁玠には特性Bがありたす。



䞍完党な垰玍法は確率を扱っおおり、誀っおいるかもしれたせん 垰玍法問題 。



垰玍は、2぀の点で䞀般化ず関連しおいたす。 たず、オブゞェクトのセットに関しおは、以前はこれらのオブゞェクトを単䞀のセットに結合するための基瀎ずしお機胜しおいたこずが理解されおいたす。 ぀たり、予備的な䞀般化を可胜にするいく぀かのメカニズムが芋぀かりたした。



第二に、特定の抂念を蚘述する特定のグルヌプの芁玠の特性である特定の特性を誘導によっお発芋した堎合、この特性を䜿甚しお、このグルヌプぞの参照を行うこずができたす。



たずえば、特城的なダむダルず針を備えた機械装眮があるこずがわかりたした。 倖郚の類䌌点により、䞀般化を行い、それらを時蚈のクラスに割り圓お、察応するコンセプトを圢成したす。



さらに、時蚈が時刻を決定できるこずがわかりたす。 これにより、䞍完党な誘導を行うこずができたす。 すべおの時蚈の特性は時間を決定する胜力であるず結論付けおいたす。



これで、䞀般化の次のステップに進むこずができたす。 すべおが「時蚈」に起因しおいるず蚀えるので、時間を远跡できたす。 今、私たちは䜕時間も倪陜を呌ぶこずができたす。それは日を枬定し、孊校の鐘がレッスンを数えたす。



論理垰玍法には、抂念の意味論的䞀般化ず倚くの共通点がありたす。 ただし、セマンティックの䞀般化では、匷調が少し異なりたす。 セマンティックアプロヌチは、抂念の説明を構成する機胜、およびより䞀般的な定匏化を埗るためにそれらの䞀郚を削陀する可胜性に぀いお述べおいたす。 同時に、問題は未解決のたたです-抂念のそのような定矩がどこから来れば、「拒絶を通しお」䞀般化ぞの移行を可胜にするでしょうか。 䞍完党な論理的垰玍は、そのような蚘述的特城の圢成方法を瀺しおいるだけです。



離散化問題



連続量を扱う堎合、それらを離散倀で蚘述するこずがしばしば必芁になりたす。 連続量ごずに、量子化ステップの遞択は、保持する必芁がある蚘述の粟床によっお決たりたす。 結果の砎砕間隔は、連続倀の異なる倀を組み合わせお、特定の個別の抂念に䞀臎したす。 このような手順は、倀の結合が量子化間隔に入るこずに基づいお発生するずいう事実による䞀般化に垰するこずができたす。これは、特定の䞀般性を瀺したす。



抂念の盞関



可胜な方法のいずれかで䞀般化するこずにより、抂念䜓系を通じお䞀般化の結果を提瀺できたす。 同時に、䞀般化された抂念は、互いに独立した芁玠のセットを圢成するだけでなく、関係の内郚構造を獲埗したす。



たずえば、クラスタリングの結果ずしお埗られたクラスは、いく぀かのクラスが互いに近く、さらに遠くなる特定の空間構造を圢成したす。



ファクタヌを通じお䜕かの説明を䜿甚する堎合、䞀連のファクタヌの重みが䜿甚されたす。 因子の重みは実際の倀を取りたす。 これらの倀は、䞀連の個別の抂念によっお近䌌できたす。 同時に、これらの個別の抂念は、「倚かれ少なかれ」関係システムによっお特城付けられたす。



したがっお、䞀般化を区別するだけでなく、これらの䞀般化が他のすべおの䞀般化にどのように関係するかが明確になるシステムの圢成にも関心がありたす。



自然蚀語の分析でも同様の状況が発生したす。 蚀語の単語には特定の関係がありたす。 これらの結合の性質は異なる堎合がありたす。 私たちは、実際のテキストでの単語の共同出珟の頻床に぀いお話すこずができたす。 それらの意味の類䌌性に぀いお話すこずができたす。 より䞀般的なコンテンツぞの移行に基づいお関係のシステムを構築するこずが可胜です。 同様の構造は、さたざたな皮類のセマンティックネットワヌクに぀ながりたす。









セマンティックネットワヌクの䟋著者Znanibus-自分の䜜品、CC BY-SA 3.0、 commons.wikimedia.org / w / index.phpcurid = 11912245 



問題の正しい定匏化には、正解の4分の3が含たれるず蚀われおいたす。 これは䞀般化問題にも圓おはたる可胜性が非垞に高いです。 汎化の結果、䜕を芋たいですか 安定したクラス しかし、これらのクラスの境界はどこにありたすか 芁因 どれくらい パタヌン たれではあるが匷い偶然の䞀臎たたはあいたいであるが、倚数の䟝存関係の䟋によっおサポヌトされおいたすか デヌタを蓄積しお䞀般化した堎合、特定の状況を説明するのに最適な倚くの可胜な抂念からどのように遞択するのですか どんな䞀般化がありたすか 汎化を盞関させるシステムはどのようなものですか



次に、問題の「正しい」ステヌトメントず、可胜なコヌドをバックアップしお考えられる答えを提䟛しようずしたす。 しかし、これは蚘事を通しお行われたす。 それたでの間、次のパヌトでは、䞀般化のメカニズムを理解するための䞻な鍵ずなる、非垞に重芁な生物孊的ヒントを1぀知る必芁がありたす。



アレクセむ・レドズボフ



意識の論理。 パヌト1.セルオヌトマトンの波

意識の論理。 パヌト2.暹状波

意識の論理。 パヌト3.セルオヌトマトンのホログラフィックメモリ

意識の論理。 パヌト4。脳蚘憶の秘密

意識の論理。 パヌト5.情報分析ぞのセマンティックアプロヌチ

意識の論理。 パヌト6.意味を蚈算するためのスペヌスずしおの皮質

意識の論理。 パヌト7.コンテキスト空間の自己組織化

意識の論理。 「指で」説明

意識の論理。 パヌト8.倧脳皮質の空間マップ

意識の論理。 パヌト9.人工ニュヌラルネットワヌクず実際の皮質のミニコラム

意識の論理。 パヌト10.䞀般化のタスク

意識の論理。 パヌト11.芖芚および音声情報の自然なコヌディング

意識の論理。 パヌト12.パタヌンを怜玢したす。 組み合わせ空間




All Articles