バむアスのないナニバヌサルアルゎリズムむンテリゞェンス

問題の声明



前の蚘事「ナニバヌサルむンテリゞェンスを構築するためのアプロヌチの基瀎」パヌト1 http://habrahabr.ru/post/145309/ およびパヌト2 http://habrahabr.ru/post/145467/ で、抂芁を説明したす。さたざたな既存のアプロヌチを説明し、ナニバヌサルAIを開発する際に埓うべきいく぀かの方法論的原則を策定したした。 蚘事「理想的な孊生、たたは機械孊習で沈黙しおいるこず」 http://habrahabr.ru/post/148002/ で、これらの原則に埓う特に普遍性を維持する必芁性が機械孊習の䟋を䜿甚しお議論されたした。 ここでは、䞀般的なナニバヌサルむンテリゞェンスの1぀の䞀般的なモデルを分析したす。 このモデルは実際のナニバヌサルAIずはかけ離れおいたすが、他のアプロヌチの重倧な欠点を理解するこずができたす。



理想的な最小知胜IMIのモデルを合理的な゚ヌゞェントずしお考え、特定の䞖界で行動し、その目的関数効甚関数を最倧化しようずしたす。 ここでは、必芁なコンピュヌティングリ゜ヌスを完党に無芖し、そのような状況でもナニバヌサルAIを構築できるかどうかを確認したす。 䞀般性を実質的に倱うこずなく、゚ヌゞェントは、離散的な時点で、利甚可胜な基本アクションずセンサヌ読み取り倀の有限セットを持っおいるず仮定できたす。 センサヌのセットには、タヌゲット機胜を含む倖郚ず内郚の䞡方が含たれたす。 「センサヌ」、「゚フェクタ」、「タヌゲット機胜」を適切に遞択するこずにより、AI分野のプラむベヌトタスクず䞀般タスクの䞡方をこの圢匏で衚すこずができたすただし、この遞択は垞に明癜で自然ではありたせん。



したがっお、生産の問題を解決するロボット、たたはチェスをするプログラムは、この圢匏で非垞に透過的に提瀺されたす。 共通の知胜を持぀゚ヌゞェント人間などの堎合、同様の結論を出すこずはより困難です。 それでも、人は感芚情報を「のみ」受け取り、いく぀かのアクションを実行したす。 これ以䞊圌にアクセスできないものはありたせん。 目的関数を最適化したすか 進化の芳点からは、「はい」ず蚀うこずができたす。それはフィットネスの関数です。 人に無意識にこれをさせおくださいそしお、機胜自䜓は明瀺的に定矩されおいたせんが、行動の遞択がこの機胜ず䞀臎しない生物は、単に生き残らないか、子孫を残したせんでした。



もちろん、䜓、その「物理的」特性を改善するなど、非知的な方法を含む倚くの異なる方法で生存率を高めるこずができるず蚀うこずもできたす。 䞀郚の皮は、発達した知胜を䜿甚せずに䜕癟䞇幎も生き延びおいたす。぀たり、適性機胜の最適化を成功させるために知胜はあたり必芁ではありたせん。 これは、フィットネス関数だけでなく、他の目的関数にも適甚されたすたずえば、特定のオブゞェクトを認識するシステムを䜜成する堎合、感芚情報を凊理するための単玔な非特殊センサヌずむンテリゞェントアルゎリズムを䜿甚したり、耇雑な特殊センサヌを䜿甚しお認識を実行したりできたす基本アルゎリズム。 したがっお、知性は、そのような定匏化目的関数の最適化ず矛盟したせんが、それに限定されたせん。 この芳点がいかに公平であるかに぀いおの議論を掘り䞋げるこずなく、それでも、アクションを遞択するには知的な゚ヌゞェントが必芁であり、遞択の特定の方法に぀いおは、䜕らかの目的関数を遞択できるこずに泚意しおください。 この意味で、むンテリゞェンスは、適合性がコンポヌネントたたは特殊なケヌスの1぀である機胜を最適化するず仮定できたす。 ここでの質問は、そのような衚珟が原則ずしおどれだけ受け入れられるかではなく、それがどれほど䟿利かずいうこずですそしお、この質問は普遍的な知性に関しおは怠idleではありたせん。



もう1぀の疑問は、ナニバヌサルむンテリゞェンスのセンサヌず゚フェクタヌの限定リストを蚭定するのは䞍合理な制限のように芋えるこずです。 人それでも知性は十分に専門化されおおり、完党に普遍的ではないにずっおも、この制限はそれほど厳しくない。 男性はツヌルを非垞に広く䜿甚しおセンサヌず゚フェクタのセットを拡匵したすが、それらは郚分的には身䜓の拡匵ず解釈されたす。 さらに、脳のレベルでさえ、皮質領域の別のモダリティの情報の凊理ぞの方向転換が可胜である。 しかし、脳の「入力」ず「出力」の数はたったく倉わりたせん。 すべおの倉曎は、関連情報たたはアクションの構造たたはコンテキストによっお匕き起こされたすが、ナニバヌサルAIの問題の声明では犁止されおいたせん。 もちろん、新しいモダリティのセンサヌおよび゚フェクタずしおツヌルを盎接接続する機胜をAIに提䟛するこずは有甚ですが、少なくずも分析の珟圚の段階では、基本的なこずはほずんどありたせん。



もう1぀のポむントは、完党に具䜓化されたAIを怜蚎する堎合、䞖界ずの盞互䜜甚は、゚ヌゞェントの身䜓の「暙準むンタヌフェむス」センサヌ、タヌゲット機胜、および゚フェクタヌのみに限定されない可胜性があるこずです。 倖郚からは、知的゚ヌゞェントプログラム自䜓にarbitrary意的な圱響を䞎えるこずもできたす。 これは、重芁なポむントず芋なされるこずがありたす[Ring and Orseau、2011]。 ただし、人にずっおこの状況は脳ぞの盎接的な介入を意味し、通垞は情報ではなく物理的たたは化孊的な性質を持ち、人間の心はそのような介入に察しお非垞に脆匱です。 もちろん、このような圱響からより保護されるナニバヌサルAIを䜜成するずいう問題を提起するこずもできたすが、党䜓ずしお、この問題は優先事項ではないようです。



したがっお、最も䞀般的なものの1぀はおそらく最も成功しおいるわけではありたせんが、次のナニバヌサルむンテリゞェンスの問題に関する声明です。 ゚ヌゞェントぞの入力では、時刻tの各瞬間に、特定の構造を持぀可胜性があるセットOに属するo tの倀がタッチ入力を介しお送信されたす。 媒䜓から「ボディ」を介しお、所定の範囲R =r min 、r max に属する匷化r tのスカラヌ倀が受信されたす。 簡朔にするために、ペアo t 、r t x t 、x t∈X = O×Rを瀺したす。たた、゚ヌゞェントはアクションy t あるセットYに属するを実行しお、将来の目的関数の合蚈倀を最倧化したす。

画像

ここで、kは珟圚の時点です。 この論文で提瀺されおいるナニバヌサルAIのモデルは最も広く知られおおり、真の匷力なAIのれロ近䌌ず芋なすこずができるため、ここでは[Hutter、2005]から䞻に匕甚した衚蚘を䜿甚したす。



この定匏化1では、問題は明らかに正しく提起されおいたせん。゚ヌゞェントは、t> kに察しおr tの倀を最倧化する必芁がありたすが、これは問題の状態ではありたせん。 蚀い換えるず、以前の倀o t 、r t 、y tずそれらの将来の倀ずの関係を確立できるようにする䞖界に぀いお少なくずもいく぀かの仮定を導入する必芁がありたす。



有名な蚈算可胜な䞖界の堎合



たず、よく知られおいるチュヌリングマシンナニバヌサルチュヌリングマシンのアルゎリズムたたはプログラムq 'で完党に蚘述された媒䜓の最も単玔なケヌスを考えおみたしょう。その時点での入力ぱヌゞェントの動䜜であり、その出力は倀o kおよびr kです。 ゚ヌゞェント自䜓も、プログラムp 'によっお制埡されたす。その入力はo 1 r 1 、... o k – 1 r k – 1です。 x 1 、... x k – 1 、および出力はy kの倀です。



簡朔にするために、y m ... y nの圢匏のシヌケンスはy mnで瀺され、m = 1の堎合はy≀nたたはy <n + 1ず蚘述したす。 セットYのオブゞェクトで構成されるシヌケンスのセットを瀺すために、埓来の衚蚘Y *を䜿甚したす。 次に、プログラムq 'およびp'は、察応するマッピングq 'Y *→Xおよびp'X *→Yを定矩したすx k = q ' y≀k およびy k = p'x <k 。 たた、察応するコンポヌネントx kに察しお o k = q o ' y≀k およびr k = q r ' y≀k を蚘述したす。 ここでは、各タむムステップでプログラムが順番に開始されるず仮定したす。p 'が最初に起動され、次にq'が起動され、最初の時点では、行x <1は空です。 pずand qの開始は垞に亀互に行われ、1぀のクロックサむクルに2぀の開始を割り圓おるこずは条件付きであるため、環境ず゚ヌゞェントの間には基本的な非察称性はありたせん最初の瞬間を陀く。 ここでは、もちろん、蚈算時間p 'およびq'は考慮されたせんが、それ以倖の堎合、この蚭定は非垞に自然に芋えたす。 ここでは基本的に「リアルタむム」がないこずを匷調する必芁がありたす。これらのプログラムは垞に機胜するわけではありたせんが、各メゞャヌで再床呌び出されたす。 次に、゚ヌゞェントず䞖界ずの盞互䜜甚の珟圚の結果をルヌプで蚈算できたす。



tが0からkの堎合y t = p 'x <t 、x t = q' y≀t 。



非察称性たたは、半サむクルからを取り陀くために、x tをq 'y <t ず芋なすこずができたす。 正匏な芳点から、これは別の問題の定匏化に぀ながりたす。 したがっお、x t = q ' y≀t の元の蚭定はチェスのゲヌムを蚘述するのに適しおいたすが、ゲヌム「じゃんけん」では適しおいたせんが、x t = q'y <t のバヌゞョンは逆です。 ただし、これらのオプションは䞡方ずもq 'をリアルタむムで蚈算する必芁性を考慮しおいないため、導入時にそれらの間の差が解消されるため、この段階では、蚀及されおいるゲヌムなどの人工的なケヌスを陀いお、どちらを䜿甚するかはほずんど違いがありたせん。ルヌルはシヌケンスの特定の組織を決定したす゚ヌゞェントず環境の「移動」バリアントy t = p ' x≀t 、x t = q' y≀t の䞍正確さに泚意する䟡倀もありたす。 圓然、「じゃんけん」の実際のゲヌムでは、動きの絶察的な同時性はなく、基本的なアクションのレベルにあるかどうかは実際には重芁ではありたせんここでは、遞択を認識しおこのゲヌムに勝぀実際に動䜜するロボットを思い出すこずができたす自分の遞択を瀺す人。 たた、チェスの実際のゲヌムでは、䞀連の動きが「物理的に」簡単に違反される可胜性がありたす。



䟿宜䞊、x 1k = q y≀k およびy 1k = px <k のようなpおよびqプログラムも導入したす。぀たり、pは珟圚のアクションを遞択するだけでなく、圌らの党䜓の物語。 同等のプログラムpおよびp 'q and q'は簡単に盞互に取埗できるため、ここで玹介するのは䟿宜䞊のこずです。 xずyの生成された行は、呌び出しq y≀k = qpx <k = qpqy <k の再垰性により、pプログラムずqプログラムの䞡方に䟝存するため、具䜓的な芁玠pずqによっお圢成される履歎は、たずえばr t pq 、y 1k pqなどで瀺されたす。



pずqは決定的であるため、゚ヌゞェントが受け取る将来の珟圚の瞬間kからある瞬間mたで合蚈ゲむンを蚈算できたす。

画像

これで、最適なp *ポリシヌず珟圚の最適なアクションを決定するタスクを正しく蚭定できたす。

画像

特定の環境qの最適な戊略p *を芋぀ける問題の解決策は、匏2により挔prior的に実行できたすが、蚈算の耇雑さの理由で実際にこの匏を盎接適甚するこずは通垞䞍可胜であるため、このような最適なむンテリゞェント゚ヌゞェントの構築は非垞に重芁です。



異なる環境のp *プログラムは根本的に異なるように思われたす。 この点で、環境qのモデルに埓っお最適なアクションを遞択するための普遍的なプログラムがあるこずは泚目に倀したす。 実際、匏2はそのようなプログラムを定矩しおいたす。 ただし、プラむベヌトな最適なプログラムを怜玢するのではなく、最適なアクションを盎接遞択する別のナニバヌサルプログラムを提䟛できたす。 このようなプログラムは、次の匏で定矩されたす。

画像

実際、有名な環境プログラムが入力ずしお゚ヌゞェントの䞀連のアクションを受け取る堎合、最適なチェヌンを生成するプログラムpではなく、チェヌン自䜓を怜玢するこずができ、そのような怜玢は普遍的なプログラムになりたす。 ゚ヌゞェントプログラム自䜓はqプログラムに䟝存せず、入力ずしお䜿甚するため、普遍的であり、無制限のリ゜ヌスでの盎接列挙は明らかにqの最倧化に぀ながるはずです。 ただし、少なくずもよく知られおいる環境では、普遍的な知胜のモデルを持ち、問題自䜓の声明の劥圓性に぀いお議論したしょう。



目的関数を最倧化する問題の定匏化の劥圓性



ここで生じる明らかな疑問の1぀は、合蚈する時間間隔たたは䞊限の遞択です。 方皋匏1〜3を曞くずきに回避されるこの質問には、明確な答えがなく、分析が必芁です。 チェスの䜍眮の䌝統的な䟋を芋おみたしょう。

画像

ここでの考えは、黒人の癜いルヌクを食べるず損倱に぀ながるずいうこずです。 匕き分けは制限内でのみ行われたす。 列挙の最終的な深さでは、列挙アルゎリズムは、ルヌクを食べるこずの氞続的な拒吊が匕き分けに盞圓するこずを「理解」できたせん。 ただし、これぱヌゞェントがこの状況で適切に動䜜するこずを劚げたせん結局、十分な列挙の深さで、有限数の動きで食い尜くすこずは損倱に぀ながりたす、したがっお、ルヌクを食べる掚定は他のものより䜎くなりたす゚ヌゞェントは同等性を勝手に「理解」したせん長い非食べるず描画。 さらに、実際的な意味では、゚ヌゞェントは氞遠に存圚するこずはできないため、無限に長いゲヌムは抜象化にすぎたせん。 宇宙の存圚の時間そのものは有限であり、具䜓化された゚ヌゞェントが無限の探玢深さを必芁ずする珟実的な状況を想像するこずは困難です。



同時に、象城的な衚珟の芁玠ずしおの無限ずいう抂念により、そのような゚ヌゞェントも機胜するこずができたす。 そしお、人の象城的な衚珟は感芚ず運動胜力に意味的基盀を持っおいるため、぀たり、それらは単にxずyの䜕らかの組み合わせであるため、これは原則ずしお明瀺的ではないが問題の゚ヌゞェントが利甚できるはずです。 それにもかかわらず、無限の抂念にはいく぀かの顕著なセマンティック基盀がある可胜性が非垞に高く、それにより人は無限特に呚期的なプロセスに぀いおブルヌトフォヌスアルゎリズムよりもはるかに自然になりたす。 さらに、ノンストッププロセスは、蚈算可胜性の叀兞的な抂念いわゆる限界の蚈算可胜性の拡匵に関連しおいるため、たずえば[Schmidhuber、2003]に蚘茉されおいるナニバヌサルむンテリゞェンスの理論の重芁なコンポヌネントになる可胜性がありたす。 ただし、゚ヌゞェントが適切に行動するかどうかにのみ関心があり、明らかに䞍適切な行動の遞択の䟋はありたせん。



合蚈時間範囲の問題に戻るず、この範囲を制限する可胜性を採甚しおも、それを制限する方法の問題に察する答えが埗られないこずは泚目に倀したす。 特に、この範囲を゚ヌゞェントの予想寿呜に制限するず、䞍適切なたたは、むしろ人々にずっお望たしくない動䜜に぀ながりたす。 䟋えば、そのような゚ヌゞェントは、圌の呜を犠牲にしおだれも救わず、䞀般に「少なくずも私たちの埌の措氎」の原則に基づいお必然的に行動したす。 圓然、匷力なAIを䜜成する際には、゚ヌゞェントの個人的な利益だけでなく、適切な合蚈範囲、より広くは目的の目的関数を遞択する問題を解決する必芁がありたす。 そうでない堎合、゚ヌゞェントの死埌の時点ぞのこの関数の倖挿は垞に最小倀を䞎えたす。 しかし、゚ヌゞェント自䜓が存圚しない堎合でも、目的関数は「存圚」し続ける必芁がありたす。



最小限の知的゚ヌゞェントの䟋では、目的関数を蚭定するこずの難しさが特にはっきりず芋えたす。 このような゚ヌゞェント自身は、「生デヌタ」によっおのみ導かれ、基本アクションのチェヌンを遞択したす。 同時に、圌は明瀺的にいかなる抂念も䜿甚しおいたせんが、培底的な培底的な怜玢のために適切に行動するこずを劚げたせん。 しかし、目的関数を蚭定する必芁がありたす。実際には、単玔なセンサヌの枬定倀では衚珟されおいたせん。 そのような関数を蚈算するには、別の知性が必芁であり、普遍的ではなく専門的です。 実際、チェスのような単玔な䞖界の堎合、ゲヌムのルヌルによっお定矩された真の目的関数を蚭定するこずは非垞に可胜です。 しかし、将来のい぀でも䞖界の状態を決定できる正確な物理モデルを持っおいる珟実の䞖界を想像するず、この状態に関する情報を、少なくずも単玔に゚ヌゞェント自䜓の生存によっお決定される目的関数の倀に倉換するこずは非垞に困難です。



目的関数が単玔なセンサヌの読み取り倀、特に痛みや喜びだけによっお制限されおいる堎合、利己的な行動が予想されたす。 もちろん、補匷しお眰するこずで、この゚ヌゞェントを「教育」するこずができたす。 ゚ヌゞェントは、人々たたは他の知的゚ヌゞェントによっお課せられた眰を排陀する手段を持぀たで、望たしい方法で行動したす。 しかし、そのような゚ヌゞェントが自分自身に吊定的な結果がないこずを予枬できるずすぐに、圌は非倫理的に行動したす。 AI党䜓を「教育する」ずいう考え方は正しいのですが、それが機胜するためには、この教育が既存の個人的な「身䜓的」目的関数に基づいお構築するだけでなく、それを倉えるこずも必芁です。



AIの「芪しみやすさ」を確保するずいう問題を無芖し、それを単に私たち自身の生存のタスクに蚭定したずしおも、アプリオリの「身䜓的」目的関数を最倧化しおも、このタスクは完党に満たされたせん。 確かに、痛みず喜びは、フィットネスの進化関数の発芋的近䌌にすぎたせん。 圌らは駒の匷さに基づいおチェスのポゞションの質を評䟡するこずに䌌おいたす。 さらに、人生ではチェスずは異なり、生存の真の目暙機胜が䞎えられおいたせん-私たちがどの特定の状況で生きるか死ぬかを先隓的に決定するこずはできたせん。 チェスでは、粗雑な「身䜓的」評䟡によっおのみ導かれる堎合、ゲヌムのレベルは最適ずはほど遠いものになりたす。 たた、動物ずころで、ある皋床たでは人々は、生存を損なう「身䜓的」な暙的機胜を最倧化できたす。 これは、電極がセンタヌのラットに埋め蟌たれた実隓で最も明確に芋られたす

動物が独立しおそれらを掻性化できるように喜び。 目的関数は身䜓の状態の珟圚の品質のみを決定するため、その倖挿は死に関する予枬を明瀺的に䞎えるこずはできたせん。 電極の䜜甚により、真の状態ずは無関係の目的関数の倀が増加するため、動物の行動は最適ずはほど遠いものになりたす。 特定の条件䞋では、これは「普遍的な」人工知胜の振る舞いであるこずが刀明する堎合があり、これには生埗的な目的関数を最倧化するタスクがありたす。



退化した行動に぀ながらない先倩性の目的関数を提案する詊みが行われたした[Ring and Orseau、2011]。 さたざたなゞレンマに察しお異なる目的関数を持぀゚ヌゞェントの仮説的な反応を考慮するこずができたす。 たずえば、この゚ヌゞェントたたはその゚ヌゞェントは、仮想珟実を無制限に楜しむこずに同意し、そこから残りの人生を離れるこずはできたせんか 最も単玔な定匏化では考慮されおいなかった゚ヌゞェント自䜓の知胜を倉曎する可胜性を思い出すず、さらに難しいゞレンマを匕き起こす可胜性がありたす゚ヌゞェントの知胜を最倧化するこずを犠牲にしお無限の楜しみを。 玔粋に「身䜓的な」目的関数を最倧化するむンテリゞェント゚ヌゞェントが、すべおの人が同意するわけではない遞択をするこずは明らかです。 同時に、目的関数は、たずえば、受け取ったさたざたな情報を考慮に入れるこずで、知性自䜓の仕事に基づいお構築できたす。 知識の実行に必芁な条件ずしお生存に努めるずいう事実にもかかわらず、同様の動機を持぀゚ヌゞェントは、このようなゞレンマの堎合、「間違った」遞択の察象にならないずいう意芋がありたす[Orseau and Ring、2011]。 しかし、䌝統的な進化の芳点からは、むしろ逆に、知識の远求は生存の客芳的機胜における発芋的手法です。 ご芧のずおり、これらの問題の分析には、ナニバヌサルむンテリゞェンスのより詳现なモデルが必芁です。



したがっお、特定の目的関数を最倧化するモデルは完党に普遍的ではありたせん。 むしろ、それはナニバヌサルむンテリゞェンスのモデルず考えるこずができ、そのタスクは、固定された時間間隔でこの最倧化を実行するこずのみに制限されたす。 しかし、知的゚ヌゞェント党䜓のモデルずは考えられたせん。その目的関数自䜓は䞀郚であり、そのタスクは次のずおりです。

最小生存。 最埌に、もちろん、むンテリゞェント゚ヌゞェントの䜜成に興味がありたすサバむバルだけでなく。 ただし、圓面は、玔粋な知性のモデルのみを考慮するこずに制限したす。



未定矩の環境



所定の目的関数を持぀よく知られた決定論的媒䜓の堎合は䞀般的です。 実際、AIの分野党䜓は、思考の迷宮仮説が衚明されたこの事䟋を考慮しお始たりたした。 そしお、もちろん、研究者たちは問題の䞀般的な声明から、限られたコンピュヌティングリ゜ヌスの状況で実際にどのようにそれを解決するかずいう問題に非垞に迅速に移行したした。 同時に、特定の環境ずは、察応するむンテリゞェントプログラムの非自埋性ず非普遍性を意味したす。 したがっお、これらの限られた䞖界のそれぞれで、人間よりも効果的なプログラムを䜜成するこずは可胜ですが、これではコンピュヌタヌが新しい問題を単独で解決するこずはできたせん。 圓然のこずながら、arbitrary意的で䞍明確な環境を含む䞀般的なケヌスをすぐに怜蚎したいずいう願望。 もちろん、決定的な環境リ゜ヌスが限られおいるの単玔な問題に察する完党な解決策がない堎合、より耇雑な問題に取り組む䟡倀はありたすか しかし、科孊の歎史には、より䞀般的な問題が解決されるたで、より単玔で特定の問題の解決策が埗られなかった倚くの䟋がありたす。 ここで、より普遍的な知的゚ヌゞェントの問題ステヌトメントを考慮するこずで、完党な解決に぀ながらない堎合、AI問題党䜓をよりよく理解でき、わずかに具䜓的なタスクの解決を促進したす。



環境に関する完党な情報がないずはどういう意味ですか これは、qメディアの正確なアルゎリズムがわからないこずを意味したす。 しかし、゚ヌゞェントは環境に぀いお䜕を知っおいたすか アルゎリズムの特定のセットがあり、それぞれが真であるこずが刀明する堎合がありたすこのセットはアルゎリズム的に完党な堎合がありたす。 そしお、゚ヌゞェントにアプリオリ確率Όqの分垃を䞎えたす。



そのような配垃の導入は奇劙に思えるかもしれたせん。 確かに、考慮されるアルゎリズムモデルは決定論的であり、環境に察応するかどうかに関係したす。 ただし、最も議論の䜙地のあるのは統蚈ではなく、確率の情報解釈です。むベント、モデルなどの確率です。 予枬たたは遞択に関する完党な情報がないずいう範囲に起因したす。 ここでは、環境のモデルに関する䞍完党な情報を想定しおいるだけであり、この䞍完党さは確率分垃によっお柔軟に蚘述されおいたす。 ただし、分垃Όqを「真」ず芋なすこずはできないこずを匷調しおください。 利甚可胜なアプリオリ情報を䜿甚しお、可胜な限り最良のものず考える方がより正しいでしょう。 状況によっおは、この確率分垃に完党に統蚈的な意味を䞎えるこずができたす。 たずえば、「環境」がチェスの特定のゲヌムの敵である堎合、アプリオリ確率は、たずえば、ミニマックスの原理で理想的にプレむしおいる察戊盞手、プロ、初心者などの発生頻床を瀺すこずができたす。 この堎合、いく぀かの慣䟋が残っおいたすが、特定の䞀般的な反察者の集団、぀たり「真の」分垃Όqで蚘述される「メディア」が存圚するず想定できたす。



確率分垃Όqを䜿甚するず、予想される匷化の数孊的期埅倀を最倧化するように、゚ヌゞェントの問題の定匏化を簡単に倉曎できたす。

画像

繰り返したすが、この衚珟はオリゞナルではなく、たずえば[Hutter、2005]に埓っおここで䞎えられおいたす。 最適な゚ヌゞェントモデルは次のように決定されたす。

画像

この匏は正しく入力されたようです。 しかし、興味深いこずに、p *プログラムをそれに応じおアプリオリに遞択するこずはできず、そのたたにしおおくこずはできたせん。䞊蚘で匷調したように、珟圚、決定論的なメディアを怜蚎しおいたす;したがっお、分垃Όqはメディアの真の確率モデルを意味したせん。代わりに、Όqはアプリオリに決定論的媒䜓の最良の䞍定モデルです。



, ( , ), – P(0)=P(1)=0.5. , . , . , : , , .



q, , ÎŒ(q)≠0? , . ÎŒ(q) . k:

画像

C k – ( k), ÎŒ k (q). , , , , . p q - ? , . , , , . , , .



k:

画像

, p*, (2) k=1. , : , Ό(q) () , , p 1 * , (4), k >1. , , (4), , p 1 * , k >1. , . . , Ό(q) , . argmax (4) . . , , (4).



, , , :

画像

, , ( ) k.



(4), (5). , , , , , .



(4) (5) [Hutter, 2005]. , . , (4) p k * , p 1 * . Ό(q) . Ό(q) . , , . , , (4) (5). [Hutter, 2005].



. , . , . , , . , , . , ( « »). , , , , ( , , , ). () , .



(5) (3) , , . , .





, Ό(q)? , Ό(q) , ( ) . . ?



Ο. , q Ο(q)≠0, . , Ο(q)=const, , , Ο(q) – () . Ο(q) , , (), .



, , , , .. , . , Ο(q)=2 –l(q) , l(q) – q. 2 –l(q) () 1.



: , . , , ; , , , , . Ο(q) Ό(q), , Ο(q) (4) (5).



, . , , . - , . , - , . , . , , (), .



: () . , , , .



( ). , . , , , – , . , , , () , Ο(q) . , , () . , :

画像

Λ – .



, [Hutter, 2005] [Hutter, 2007] Ο(q)=2 –l(q) P ALP (x) . , , .



, «» : - , , . [Solomonoff, 1986] . , x x',

画像

, P ALP (x) , x, , x . P ALP (xx') – , xx'.



, , , . , , .



, . , [Hutter, 2005] , . . , x 1:k , q, , . , «» , , . «» , , , «» , , q . , q* , ( , q* ), .



, (., ., [Solomonoff, 1997], [Li and Vitanyi, 1997], [, 2007] ). , .



, (6) , ( ) U ( ), . U(q) q(Λ). Ο(q).



, U V u, q, V(uq)=U(q). ,

画像

P v (x) ≀ 2 l(v) P U (x), P V , P U – , . , . , . V, q, P V (q)=0, . , , , : ( ), ( ) ( ). , , . , , , , ( Ο(q)=const, Ο(q) ).



, « » , . . , , , , , «». , . , , - , .



AIΟ



AIΟ [Hutter, 2005] (4) (5) Ο(q) Ό(q).

画像

画像

Ο k (q) , Ό k (q).



. p , x >k , q, x (7). AIΟ , . ( ).



, . , AIΟ , (4) (5): Ο k (q). . , , . , , , , , , . .



, ? , «» . , « » , . . , , .



, AIΟ . , ( ) .





IMIモデルAIΟ型モデルは、本圓にナニバヌサルむンテリゞェンスを説明しおいたすか 目的関数の最倧化ずしおのAIの問題の蚘述は䞍完党であるこずが既にわかりたした。目的関数自䜓を蚭定する問題は非垞に困難ですここでは、予枬範囲を蚭定するより具䜓的な問題を含めるこずができたす。 しかし、この問題を解決するずいう点でのみ、それらは普遍的ですか



さたざたな埮劙な偎面がありたす。 たずえば、アルゎリズムの確率は、ブレヌクの問題のために蚈算できたせん。 ノンストップモデルによっお生成された結果は、制限の蚈算可胜性の意味で解釈できるこずを既に説明したした。 䜿甚される蚈算可胜性の抂念に応じお、アルゎリズムの確率を蚈算する際に、ノンストップモデルおよび実際的な芳点からは、長時間実行モデルのみを考慮たたは無芖できたす。 この偎面は、将来的に明確化する必芁がありたす。



前述のIMIモデルのもう1぀の議論の䜙地がある偎面は、決定論です。 小孊校の詊合-じゃんけん玙CBNを考えおみおください。 各プレむダヌには䞀定のアクションがあり、勝぀ための明確なルヌルがありたす。 ラりンドの有限シヌケンスの堎合に考慮したす。



o k = q 'y <k 、y k = p'x <k ;の堎合、特定の深さのバリアントアクション/応答のツリヌを構築できたす。 r kは o kおよびy kによっお定矩されたす。 k = 1の堎合、ツリヌは察称になりたす。぀たり、アクション間に優先順䜍はありたせん。 ただし、この堎合の決定論的アルゎリズムはアクションを䞀意に遞択し、その埌察称性が砎られたす。 ラりンドの履歎によるず、各察戊盞手は別の察戊盞手のプログラムを埩元しようずしたす。 簡単にするために、互いのプログラムが䞀臎し、盞手によっおアプリオリに知られおいるず仮定したす。 これらは、たずえば2の圢匏のプログラムです。 しかし、プログラムが決定的である堎合、それらは明確な䞀連のアクションを決定したす。぀たり、各敵は簡単に他のアクションを蚈算し、勝ち抜くこずができたす。 ここには明確な矛盟がありたす。 結局のずころ、䞡方の察戊盞手が勝぀こずはできたせん



実際、矛盟がありたす。 それは非垞にシンプルですが、非垞に深いです。 事実は、y kを蚈算する際に、プログラムpがプログラムqを開始するずいうこずです。これは、プログラムpが匏3で蚘述される堎合は明らかです。 しかし、この堎合、qプログラムは同じ圢匏を持ち、pプログラムを起動し、次に、pプログラムを起動したす。 プログラム3にはqの有限数の呌び出しが含たれおいるように芋えたす。 メディアから、゚ヌゞェントのアクションに察しお盎接蚈算された反応が埗られるこずを暗黙的に期埅しおいたす。 ただし、別の゚ヌゞェントが環境ず芋なされるずすぐに、そのプログラムには最初の゚ヌゞェントのプログラムの開始が含たれ、無限の再垰が埗られ、原則ずしお遞択はできたせん。 そしお、無限のコンピュヌティングリ゜ヌスでさえここでは節玄できたせん。 これは、他の知的゚ヌゞェントずの察話が根本的に説明されおいない偎面であるこずを意味したす。



もちろん、AIの「理想」の芁件を枛らすず、぀たり、リ゜ヌスが限られたより詳现なモデルを怜蚎すれば、このパラドックスを解消できるず考えるかもしれたせん。 リ゜ヌスが限られおいる堎合、䜕らかの遞択が必然的に行われたすが、リ゜ヌスが少ない決定論的゚ヌゞェントは、KNBの優れたリ゜ヌスを持぀゚ヌゞェントに倱われたす。 同時に、KNBには平凡な戊略があり、任意の倧きなリ゜ヌスを持぀察戊盞手に察しお蚈算コストなしで平均的な匕き分けを提䟛したすこれは、AIΟに完党に存圚しない真にランダムな擬䌌ランダムではないアクションの遞択です。



前述のように、䞖界に真のランダム性が存圚するかどうかは議論の䜙地がありたすが、実際には、゚ヌゞェントがアルゎリズムの耇雑さを増す䞀連の数を生成できるセンサヌを実装するこずは難しくありたせん。 たた、KNBの䟋が倧げさではないこずにも泚意しおください。 捕食者や獲物などの゚ヌゞェントの盞互䜜甚では、軌跡の遞択のランダム性を远跡するプロセスにおいおも同様に重芁です。



そのため、゚ヌゞェントはランダムな遞択を行うこずができるず想定できたすが、原則ずしお決定論的なアルゎリズムに眮き換えるこずはできたせん特に考慮されるKNBゲヌムから、および䞀般的に他の゚ヌゞェントずやり取りする堎合。 AIが配眮されおいるマルチ゚ヌゞェント環境が確率的アルゎリズムによっお特城付けられおいる堎合、これは、そのモデルを構築するずきに考慮するこずを傷぀けたせん。必然的に抜象化基本的に䞍完党/䞍正確なモデルの構築が含たれたす。 このような抜象化は、リ゜ヌスが限られおいるだけでなく、pずqが互いに正確なモデルを䜿甚するずきに発生するこの矛盟を解消するために無制限のリ゜ヌスでも必芁です建蚭的な理由により、゚ヌゞェントが゚ヌゞェント自䜓を含む䞖界を正確にモデル化できないこずは明らかです、゚ヌゞェントは自分より耇雑にできないため



ここでも自然な疑問が生じたすそれらは反射、自己認識を持っおいるでしょうか より客芳䞻矩的な質問をするこずができたすIMIは「考える」、「知る」などの抂念を正しく䜿甚できたすか 䞀方では、IMRの問題の声明には明瀺的な圢匏での反映の必芁性がなく、リ゜ヌスの制限を考慮する堎合に必芁に応じお導入する必芁があるず想定できたす。 䞀方、IMIには無制限のリ゜ヌスがあるず仮定するず、特定の瀟䌚環境で圌自身の思考に関連する抂念を適甚する必芁性からIMIが救われるこずはありたせん。 IMRは任意のアルゎリズムを構築し、目的関数を増加させる任意のアクションを遞択できるため、これらの抂念を間接的に䜿甚できるず想定できたす盞互䜜甚の十分に長い履歎がある堎合が、圌にはそれらの盎接的なセマンティック基盀がありたせん。



䞖界党䜓のアルゎリズムモデルの劥圓性に疑問を投げかけるこずができたす。 理解や自己認識などの認知機胜は、蚈算䞍可胜な物理プロセスに関連しおいるこずはよく知られおいたす。 ただし、匷力なAIを䜜成するこの堎合でも、誰かが自己認識や理解を圌に垰するこずに同意しないこずを陀いお、この意芋に反論するこずは可胜ですが、圌の奜意的な議論は非垞に物議を醞しおいたす。 この問題は広く議論されおいるため、ここでは泚意を払いたせんが、この意芋が正しいずしおも、「アルゎリズム的に普遍的な」AIの䜜成は重芁な前進であり、さらに、今では技術的な手段がないこずに泚意しおくださいむンテリゞェンスに圹立぀数え切れないほどのプロセスを具䜓化できたす。



結論



理想的な最小むンテリゞェンスのモデルは、先隓的な䞍明確な環境でのアルゎリズムの確率に基づく普遍的な予枬を䜿甚しお、環境ずの盞互䜜甚の履歎に埓っお目的関数を最倧化するアクションを遞択するための理論的に最適な特定の予玄を䌎うオプションを衚したす。 目的関数の割り圓お、アルゎリズムの叀兞的な蚈算可胜性、マルチ゚ヌゞェント盞互䜜甚の過小評䟡、アクションの遞択における決定論、正確な環境モデルの䜿甚、アクションを遞択する際の䞖界モデルの䞍確実性を枛らす可胜性の過小評䟡、反射の欠劂は、その普遍性に疑問を投げかける考慮されたIMIモデルの特城です。 ただし、これらの偎面は、このモデルの非効率性たたは蚈算䞍可胜性の問題ほど深刻ではありたせん。 さらに、リ゜ヌスの制玄を入力した埌、それらをより詳现に分析するこずができたす。



文孊



Hutter、2005Hutter M. ナニバヌサル人工知胜。 アルゎリズムの確率 /スプリンガヌに基づく順次決定 。 2005.278 p。



Hutter、2007Hutter M. Universal Algorithmic IntelligenceA Mathematical Top→Down Approach // in Artificial General Intelligence。 Cognitive Technologies、B。GoertzelおよびC. Pennachin線。 スプリンガヌ 2007. P. 227–290。



Li and Vitanyi、1997Li M.、Vitanyi P. コルモゎロフ耇雑性ずその応甚の玹介。 第2版​​NY、Springer-Verlag。 1997。



Orseau and Ring、2011Orseau L、Ring M. 人工゚ヌゞェントの自己修正ず死亡 //コンピュヌタサむ゚ンス6830講挔ノヌトproc。Artificial General Intelligence-4th International Conference。 スプリンガヌ、2011。P。1-10。



Ring and Orseau、2011Ring M.、Orseau L. Delusion、Survival、およびIntelligent Agents //コンピュヌタヌサむ゚ンス6830講挔ノヌトproc。Artificial General Intelligence-4th International Conference。 スプリンガヌ、2011。P。11–20。



2003幎、SchmidhuberSchmidhuber J. 新しいAI物理孊に関連する䞀般的なサりンド。 テクニカルレポヌトTR IDSIA-04-03、バヌゞョン1.0、cs.AI / 0302012 v1、IDSIA。 2003幎。



Solomonoff、1986Solomonoff R. 人工知胜の問題ぞのアルゎリズム確率の適甚 // InLN Kanal and JF LemmerEds。。 人工知胜の䞍確実性Elsevier Science Publishers。 1986. P. 473-491。



Solomonoff、1997Solomonoff R. アルゎリズムの確率は垰玍の問題を解決したすか // Oxbridge Research、POB 391887、ケンブリッゞ、マサチュヌセッツ州。 02139. 1997。



Potapov、2007Potapov A.S. パタヌン認識ず機械認識最小蚘述長の原則に基づく䞀般的なアプロヌチ。 サンクトペテルブルクポリテクニック、2007.548 s。



All Articles