DeepMindとGoogle:強力なAIを制御するための戦い



Demis Hassabisは、世界で最も強力なAIを作成するために会社を設立しました。 その後、Googleに買収されました



2010年8月、34歳のロンドン人Demis Hassabisがサンフランシスコ郊外の会議室でステージに上がりました。 彼は神経をコントロールしようとしている男のゆったりとした歩行で出てきて、短い笑顔で唇をすぼめて始めました。 しかし、彼はまだ言った:「...強力なAI」。



強力なAI(人工一般知能またはAGI)は、普遍的な人工知能を意味します。これは、人間として、またはそれ以上の知的タスクを実行できる仮想的なコンピュータープログラムです。 強力なAIは、写真認識やテキスト翻訳などの個々のタスクを実行できます。これらは、携帯電話とコンピューターの各弱いAIの唯一のタスクです。 しかし、彼はまたチェスをし、フランス語を話します。 彼は物理学の記事を理解し、小説を作成し、投資戦略を開発し、見知らぬ人と楽しい会話を行います。 彼は核反応を監視し、電気ネットワークと交通の流れを管理し、他のすべてで多くの努力なしで成功します。 AGIは、今日の最も高度なAIをポケット電卓のように見せます。



現在、これらすべてのタスクを実行できる唯一のインテリジェンスは、人々に与えられているものです。 しかし、人間の知能は頭蓋骨のサイズによって制限されます。 私たちの脳の強さは、体が提供できる無視できる量のエネルギーによって制限されています。 AGIはコンピューター上で実行されるため、これらの制限はありません。 強力なインテリジェンスは、利用可能なプロセッサの数によってのみ制限されます。 彼は核反応を監視することから始めることができます。 しかし、すぐにそれは新しいエネルギー源を開き、人が1000の人生でできるよりも物理学でより多くの科学的な仕事を消化します。 人間の知能は、コンピューターの速度と拡張性と相まって、現在解決できないと思われる問題を解消します。 英国のオブザーバーとのインタビューでハッサビスは、とりわけ、強力なAIがそのような分野を習得し、「がん、気候変動、エネルギー、ゲノミクス、マクロ経済[および]金融システム」などの問題を解決する必要があると述べました。



HassabisカンファレンスはSingularity Summitと呼ばれていました。 未来学者によると、特異性はAGIの出現の最も可能性の高い結果の1つです。 情報を高速で処理するため、非常に迅速に賢くなります。 自己改善の高速サイクルは、機械の知能の爆発的増加につながり、人々はシリコンダストでの窒息をはるかに遅らせます。 この未来は完全に未検証の前提に基づいて構築されているため、特異点がユートピアまたは地獄と見なされるかどうかの問題はほとんど宗教的です。



会議での講義の名前から判断すると、参加者はメシアン主義に引き寄せられます。「理由とその構築方法」。 「老化の問題の解決策としてのAI」。 「私たちの体の交換」; 「生と死の境界を変える。」 一方、ハッサビスの講義はあまり印象的ではありません。「AGIを構築するための体系的な神経生物学的アプローチ」。



Hassabisは表彰台とスクリーンの間を歩き、何かをすばやく言います。 彼は、あずき色のカーディガンと、男子生徒のようにボタンの付いた白いシャツを着ています。 小さな成長は、彼の知性を強化するだけのようです。 これまでのところ、ハッサビスは、科学者は2つの側面からAGIにアプローチしていると説明した。 シンボリックAIの分野では、研究者は人のように考えることができるシステムのすべてのルールを記述およびプログラムしようとしました。 このアプローチは80〜90年代に人気がありましたが、望ましい結果は得られませんでした。 Hassabisは、脳の精神構造はあまりにも洗練されているため、このように説明できないと考えています。



脳の物理ネットワークをデジタル形式で再現しようとした研究者は、別の分野で働いていました。 これには明確な意味がありました。 結局のところ、脳は人間の知性の入れ物です。 しかし、これらの研究者は誤解されていた、とハッサビスは言った。 彼らの仕事は、宇宙のすべての星をマッピングする試みとほぼ同じ規模であることが判明しました。 さらに、彼女は間違ったレベルに焦点を当てています。 これは、コンピューターを分解してトランジスター相互作用を調べることにより、Microsoft Excelがどのように機能するかを理解しようとするようなものです。



代わりに、Hassabisは中盤を提案しました。強力なAIは、脳が情報を処理する幅広い方法からインスピレーションを引き出すべきであり、特定の状況で適用される物理システムや特定のルールからではありません。 つまり、科学者はハードウェアではなく脳のソフトウェアを理解することに焦点を合わせる必要があります。 機能的磁気共鳴画像法などの新しい方法を使用すると、脳の活動中に脳の内部を見ることができます。 彼らはそのような理解を可能にします。 最近の研究では、脳が夢の中で学習し、一般原則を導き出すために受け取った経験を再現することが示されています。 AI研究者はこのシステムをエミュレートする必要があります。



スライドの右下隅に丸い青い渦巻きのロゴが表示されました。 その下には、DeepMindという2つの単語があります。 これは、新しい会社の最初の公開言及でした。







Hassabisは1年を費やしてSingularity Summitへの招待を得ようとしました。 講義はカバーに過ぎませんでした。 彼が本当に必要としていたのは、カンファレンスを後援したシリコンバレーの億万長者であるPeter Thielとの1分でした。 Hassabisは投資を望んでいました。



ハッサビスは、なぜティエルから正確なサポートを得ようとしたのかについては一度も言いませんでした(この記事では、スポークスマンによるいくつかのインタビューのリクエストを拒否しました)。 現在および以前の従業員と投資家を含む25の情報源と話しました。 彼らのほとんどは、会社について話す権利を持っていなかったため、匿名で話をしました。 しかし、ティエルはハッサビスよりもさらに熱意をもってAGIを信じています。 2009年のスピーチで、ティエルは未来に対する彼の最大の恐怖はロボットの反乱ではないと述べました(ニュージーランドは全世界から隔離されていますが、ほとんどの人よりも保護されています)。 むしろ、彼は特異点が手遅れになることを恐れています。 世界は、景気後退を防ぐために新しい技術を必要としています。



最終的に、DeepMindは200万ポンドのベンチャーキャピタル資金を受け取りました。 Thielからの140万ポンドを含む。 Googleが2014年1月に6億ドルで会社を買収したとき、初期の投資家は5,000%の利益を記録しました。



多くの創設者にとって、これはハッピーエンドになるでしょう。 速度を落とし、一歩後退してお金を楽しむことができます。 Hassabisにとって、Googleとの契約は強力なAIの探求における別の一歩でした。 彼は2013年のほぼすべてを取引の交渉に費やしました。 DeepMindは、親会社とは別に運営されます。 Hassabisは、企業の支配権を失うことなく、キャッシュフローや処理能力へのアクセスなど、すべての企業特権を受け取ります。



Hassabisは、DeepMindはハイブリッドであると考えました。彼は、スタートアップドライブ、最高の大学の頭脳、そして世界で最も裕福な企業の1つの深いポケットを持つでしょう。 強力なAIの開発を加速し、人類を支援するためにすべてが行われました。






デミス・ハサビスは1976年に北キプロスとギリシャ系キプロス人と中国系シンガポール人の家族で生まれました。 彼は3人の兄弟姉妹の長男でした。 ママはジョンルイスデパートで働き、父親はおもちゃ屋で働きました。 少年は4歳のときに父と叔父の試合を見ながらチェスをすることを学んだ。 数週間後、大人はもはや彼をbeatることができませんでした。 13歳までに、デミスは彼の年齢で世界で2番目のチェスプレーヤーになりました。 8歳で、彼は独自にプログラムを学びました。



1992年、ハッサビスは予定より2年早く学校を卒業しました。 彼は、Bullfrog Productionsでビデオゲームのプログラミングの仕事を得て、ゲームテーマパークを書きました。 その中で、プレイヤーは仮想遊園地を構築および管理しました。 ゲームは非常に成功し、1500万部が売れました。 これはシミュレータの新しいジャンルに属し、敵を倒すことではなく、ビジネスや都市などの複雑なシステムの機能を最適化することを目標としています。





Android用テーマパーク、2018



Demisはゲームを開発しただけでなく、素晴らしいゲームもプレイしました。 ティーンエイジャーとして、彼はチェス、スクラブル、ポーカー、バックギャモンの競技の間で引き裂かれました。 1995年、ケンブリッジ大学でコンピューターサイエンスを学びながら、Hassabisは学生囲goトーナメントに参加しました。 これは古代のボード戦略ゲームで、チェスよりもはるかに複雑です。 習熟には、長い経験を通じて得られた直感が必要であると想定されています。 Hassabisが以前にプレイしたことがあるかどうかは誰も知りませんでした。



最初に、Hassabisは初心者向けのトーナメントで優勝しました。 それから彼は、ハンディキャップはあるものの、経験豊富なプレイヤーのためにトーナメントの勝者を打ち負かしました。 トーナメントの主催者であるケンブリッジのマスター、チャールズ・マシューズは、19歳のルーキーに負けた経験豊富な選手の衝撃を覚えています。 マシューズはハッサビスを世話した。



Hassabisの知性と野心は、常にゲームで明らかです。 次に、ゲームは知性への関心を呼び起こしました。 彼はチェスの進歩を見ながら、コンピューターをプログラミングして、経験に基づいて彼のように学ぶことができるのだろうかと考えました。 ゲームは、現実の世界では対応できない学習環境を提供しました。 彼らは明確で自給自足でした。 ゲームは現実とは別個のものであるため、現実の世界に干渉することなく実践でき、効果的にマスターできます。 ゲームは時間を短縮します:数日で犯罪シンジケートを作成でき、ソンムでの戦いは数分で終了します。



1997年の夏、ハッサビスは日本に向けて出発しました。 その年の5月、IBMのDeep Blueコンピューターは、世界チェスチャンピオンのGarry Kasparovを破りました。 初めて、コンピューターがチェスのグランドマスターを破った。 この試合は世界中の注目を集め、コンピューターの威力と脅威の可能性について懸念を表明しました。 Hassabisは日本のボードゲームのマスター、フジュヴァレアと出会い、戦略ゲームと人工知能への関心を組み合わせた計画について語った。いつか彼は最高のプレイヤーを倒すコンピュータープログラムを構築するだろう。



Hassabisは系統的に行動しました:「20歳のとき、Hassabisは、自分が望むレベルでAIに従事する前に、特定の事柄が所定の場所になければならないという意見でした」とマシューズは言います。 「彼には計画がありました。」



1998年、彼は自分のゲームスタジオElixirを設立しました。 Hassabisは、非常に意欲的な1つのゲーム、Republic:The Revolutionに焦点を当てており、複雑な政治シミュレーターです。 何年も前、学校で、ハッサビスは友人のムスタファ・スレイマンに、世界には複雑なダイナミクスをシミュレートし、最も複雑な社会問題を解決するための壮大なシミュレーターが必要だと語った。 今、彼はゲームでそれをやろうとしました。



ゲームフレームワークへの適合は、予想以上に困難でした。 最終的に、Elixirはレビューを緩和するためにゲームの短縮バージョンをリリースしました。 他のゲームは失敗しました(Evil Geniusと呼ばれるボンディアンの悪役シミュレーターを含む)。 2005年4月、HassabisはElixirを閉鎖しました。 マシューズは、ハサビスが経営経験を得るためだけに会社を設立したと考えています。 今では、Demisは強力なAIの作業を開始するために、重要な知識分野を1つだけ必要としました。 彼は人間の脳を理解する必要がありました。



2005年、ハッサビスはロンドン大学ユニバーシティカレッジ(UCL)から神経科学の博士号を取得しました。 彼は記憶と想像力の有名な研究を発表しました。 それ以来1,000回以上引用されている彼の記事の1つは、健忘症の人も新しい経験を理解するのが難しいことを示しており、記憶と記憶の作成にはつながりがあることを示唆しています。 Hassabisは、AGIを作成するタスクに適した脳表現を作成しました。 作業の大部分は1つの質問に要約されました。人間の脳はどのように概念と知識を受け取り、保存するのでしょうか?



Hassabisは2010年11月15日に正式にDeepMindを設立しました。 それ以来、同社の使命は変わっていません。「知性を解決し」、それを使用して他のすべてを解決します。 HassabisがSingularity Summitの参加者に語ったように、これは脳がどのように機能するかについての理解を、同じ自己学習法を使用できるソフトウェアに変換することを意味します。



Hassabisは、科学が人間の心の本質をまだ完全に把握していないことを理解しています。 数百の神経生物学的研究に基づいて強力なAIプロジェクトを単純に作成することはできません。 しかし彼は、強力なAIの作業を開始するのに十分なことがすでに知られていることを明確に信じています。 それでも、彼の自信が現実よりも先にある可能性があります。 脳が実際にどのように機能するかはまだほとんどわかっていません。 2018年、Hassabis自身の博士論文の結果は、オーストラリアの研究者チームによって疑問視されました。 これは1つの記事にすぎませんが、DeepMindの根底にある科学的意見はコンセンサスからほど遠いことを示しています。



同社は、ムスタファ・スレイマンと、ハサビスがUCLで出会ったAGIニュージーランド人であるシェーン・レゲとの共同設立者です。 会社の評判は高まり、ハッサビスは彼の才能の恩恵を享受していました。 「これは磁石のようなものです」と、DeepMindの元運用マネージャーであるBen Faulkner氏は言います。 多くの従業員は、GoogleやFacebookなどのシリコンバレーの大手人事部門から遠く離れたヨーロッパに住んでいました。 おそらく、DeepMindの主な成果は、AIの分野で最も優秀な人材を見つけて維持するために、設立直後に従業員を雇用することでした。 同社は、UCLの向かいにあるブルームズベリーのラッセルスクエアにあるタウンハウスの屋根裏にオフィスを開設しました。



同社が重点を置いている機械学習方法の1つは、ゲームと神経科学に対するHassabisの二重の情熱、つまり強化学習から生まれました。 このようなプログラムは、環境に関する情報を収集し、それについて研究し、HassabisがSingularity Summitの講義で語ったように、夢の中での人間の脳の活動のように、得られた経験を繰り返し再現するように設計されています。



強化トレーニングはゼロから始まります。 このプログラムには、ルールのみを知っている仮想環境が表示されます。 たとえば、チェスのゲームやビデオゲームのシミュレーション。 プログラムには、ニューラルネットワークと呼ばれる少なくとも1つのコンポーネントが含まれています。 これは、特定の機能または戦略を識別するために情報を選別する計算構造の層で構成されています。 各層は、新しい抽象化レベルで環境を探索します。 最初は、これらのネットワークは最小限の成功で動作しますが、各障害がマークを残し、ネットワーク内でエンコードされることが重要です。 ニューラルネットワークは、さまざまな戦略を試しているため、徐々に洗練されてきており、成功すると報酬を受け取ります。 プログラムがチェスの駒を動かし、その結果ゲームに負けた場合、このエラーは繰り返されません。 人工知能の魔法のほとんどは、タスクを繰り返す速度です。



DeepMindの成果の頂点は2016年で、同社はAlphaGoプログラムをリリースしました。AlphaGoプログラムでは、強化学習と他の方法を使用してgoをプレイしました。 誰もが驚いたことに、ソウルでの5試合の決闘で、このプログラムは世界チャンピオンを破りました。 2億8,000万人の視聴者がこの車の勝利を見ました。このイベントは、専門家が予測したよりも10年早く起こりました。 翌年、改良版のAlphaGoが中国の囲goチャンピオンを破りました。



1997年のディープブルーのように、AlphaGoは人間の卓越性に対する見方を変えました。 ボードゲームのチャンピオン、地球上で最も優秀な頭脳の一部は、もはや知性の頂点とは見なされませんでした。 日本の主人、フジュワラとの会話からほぼ20年後、ハッサビスは約束を果たした。 試合中、彼は後で涙が出そうになったと言いました。 伝統によると、囲studentの生徒は先生を試合で倒して感謝します。 HassabisはMatthewsに感謝し、ゲーム全体を打ち負かしました。



DeepBlueはブルートフォースと計算速度のおかげで勝ちましたが、AlphaGoのスタイルは芸術的で、ほとんど人間的でした。 その優雅さと洗練さ、計算筋肉の優位性は、病気を治療し、都市を管理できるプログラムの開発において、DeepMindが競合他社よりもさらに進んだことを示しているように見えました。






Hassabisは、DeepMindが世界をより良く変えるといつも言ってきました。 ただし、強力なAIについては確実ではありません。 彼が現れた場合、彼が利他的か悪意的か、人間のコントロールに従うかどうかはわかりません。 それでも、だれがコントロールするのでしょうか?



Hassabisは最初から、DeepMindの独立を擁護しようとしました。 彼は常に、DeepMindがロンドンにとどまることを主張しました。 Googleが2014年に会社を買収したとき、コントロールの問題がより重要になりました。 Hassabisは会社を売却する必要はありませんでした。 彼には十分なお金があり、研究資金を調達するために会社がゲームを開発するビジネスモデルを概説しました。 Googleの財務には重さがありましたが、多くの創業者のように、Hassabisは成長した会社をあきらめたくありませんでした。 契約の一環として、DeepMindは、Googleが一方的に企業の知的財産を管理することを防止する契約を締結しました。情報に基づいた人物によると、取引の前に、当事者は倫理および安全審査契約と呼ばれる契約に署名しました。これまで報告されていなかった合意は、ロンドンの真剣な弁護士によって作成されました。



この合意により、強力なAIのコアテクノロジーの制御が、そのAIが作成されるたびにDeepMindに移されます。つまり、倫理委員会と呼ばれる運営グループです。同じ情報源によると、倫理委員会はGoogleからの化粧品の譲歩ではありません。彼は、DeepMindに確固とした法的サポートを提供し、彼の最も価値があり、潜在的に最も危険な技術の管理を維持しています。評議会メンバーの名前は公表されていませんが、DeepMindとGoogleに近い別のソースは、DeepMindの3人の創立者全員を含むと述べています(会社は契約に関する質問への回答を拒否しましたが、優先度」)。



Hassabisは、他の方法でDeepMindの運命を判断できます。それらの1つはスタッフの忠誠心です。過去および現在の従業員は、Hassabisの研究プログラムはDeepMindの最大の強みの1つであると言います。彼のプログラムは、学界からの圧力から解放され、魅力的で重要な仕事を提供します。そのような条件は、世界で何百人もの最も有能な専門家を引き付けました。 DeepMindは、パリとアルバータに子会社があります。多くの従業員は、収益を求める親会社よりもハッサビスと彼の使命に近いと感じています。 Hassabisが個人的な忠誠心を維持している限り、彼は彼の唯一の株主に対して大きな力を持っています。 Googleにとって、DeepMindの才能は、FacebookやAppleを離れるよりも、仲介者を介して彼女のために働く方が優れています。



DeepMindにはもう1つのレバーがありますが、絶え間ない補充が必要ですが、有利な広告です。会社は順調です。 AlphaGoは本当のPR爆弾になりました。 Googleの買収以来、同社は世界中で注目を集めている奇跡を繰り返し生み出してきました。 DeepMindの1つのプログラムは、網膜をスキャンすることで眼疾患を診断できます。別の人はAlphaGoスタイルのアーキテクチャを使用してゼロからチェスをプレイすることを学び、わずか9時間の独学で史上最高のチェスプレーヤーになりました。 2018年12月、AlphaFoldと呼ばれるプログラムは、コンポーネントのリストを使用してタンパク質の3次元構造を予測する競合他社を上回り、パーキンソン病やアルツハイマー病などの疾患の治療への道を開く可能性があります。



DeepMindは、約250万台のサーバーが稼働しているGoogleデータセンターの最も効果的な冷却手段を計算する開発アルゴリズムを特に誇りに思っています。 DeepMindは2016年に、Googleのエネルギーコストを40%削減したと述べました。しかし、一部の関係者は、これは誇張された数字であると言います。 Googleはアルゴリズムを使用して、DeepMindよりもずっと前にデータセンターを最適化しました。 Alphabetの親会社であるGoogleは、そのようなサービスに対してDeepMindにgeneしみなく支払います。このため、DeepMindは2017年に彼女に5400万ポンドを請求しました。この数字は、DeepMindの現在の費用と比較すると見劣りします。その年のスタッフに費やした費用はわずか2億ドルでした。



これらは、裕福なインターネットの巨人にとって悲惨なペニーです。しかし、他の不採算企業Alphabetは、Alphabetの無駄のない最高財務責任者であるRuth Poratの注目を集めました。たとえば、Google Fiber部門は、個人宅に光ファイバー回線を敷設して、高速インターネットサービスプロバイダーを作成しようとしました。しかし、投資を回収するには数十年かかることが明らかになったため、プロジェクトは中断されました。したがって、AIの研究者が自分の関連性を証明して、名前が既にアルファベットで知名度になっているポラット夫人の粘り強い表情を引き付けないようにすることが重要です。



DeepMindのAIでの計画された成果は、会社の所有者との関係戦略の一部です。 DeepMindはその評判を示しています。これは、Googleがユーザーのプライバシーを侵害し、偽のニュースを広めていると非難される場合に特に重要です。 DeepMindは、最高レベルのサポーター、つまりGoogleの2人の創業者の1人であり、現在はAlphabetのCEOであるサポーターがいることも幸運でした。ページは、ハッサビスが親会社に最も近いものです。 Pageの父Carlは、60年代にニューラルネットワークを研究しました。経歴の初めに、PageはAI会社を設立するためだけにGoogleを作成したと言いました。



DeepMindの厳密な制御は、マスコミの目から見ても見栄えがよく、会社に浸透している学問的精神とはまったく一致しません。一部の研究者は、自分たちの作品を公開するのは難しいと不満を述べています。少なくとも会議の報告書や雑誌の記事を提出する前に、いくつかのレベルの内部検閲を克服しなければなりません。 DeepMindは、強力なAIの可能性を大衆に脅かさないように注意する必要があると考えています。しかし、あまりにも密な静寂は、学問的な雰囲気を台無しにし、従業員の忠誠心を弱める可能性があります。



Googleの買収から5年後、DeepMindを管理しているのは誰なのかという問題が重要なポイントに近づいています。創業者と最初の従業員は、まもなく彼らの経済的補償で退職することができます(おそらくGoogleの購入後のHassabisの株式は約1億ポンドの価値があります)。しかし、同社に近い情報筋は、Alphabetが創業者の選択肢の収益化を2年間延期したことを示唆している。彼の任務への執focusな集中を考えると、ハッサビスは船を離れることはないでしょう。お金は彼の人生の目標を達成するのに役立つ限り、彼に興味を持っています。しかし、一部の同僚はすでに去っています。 2019年の初めから、3人のAIエンジニアが退職しました。そして、世界で最も有名なセキュリティの専門家の1人であるベン・ローリーは、以前の雇用者にGoogleに戻ってきました。この数は少ないです結局のところ、DeepMindはそのような刺激的な使命とまともな給料を提供するので、休暇はほとんどありません。



これまでのところ、GoogleはDeepMindに介入していません。しかし、最近の出来事の1つは、会社が独立性を維持できる期間について懸念を表明しています。









DeepMindは、ヘルスケアを改善するために常にAIを使用することを計画しています。 2016年2月に、共同設立者の1人であるMustafa Suleimanが率いるDeepMind Healthの新しい部門が設立されました。スレイマンは、母親が国民健康サービス(NHS)で看護師として働いていたが、患者の健康が悪化したときに医師に警告するStreamsと呼ばれるプログラムを作成したいと考えていた。 DeepMindは、すべての効果的なシステム操作で稼ぐ必要がありました。この作業には患者の機密情報へのアクセスが必要だったため、スレイマンは英国の医療およびテクノロジー部門の代表者を含む独立審査委員会(IRP)を設立しました。 DeepMindは非常に慎重に行動しました。その後、英国情報委員が発見したパートナー病院の1つが患者データの処理中に法律に違反したこと。ただし、2017年末までに、スレイマンは4つの主要なNHS病院と契約を結びました。



2018年11月8日に、GoogleはGoogle Healthの独自の部門の設立を発表しました。 5日後、DeepMind Healthを親ユニットに含めることを発表しました。どうやら、DeepMindに警告した人はいなかったようだ。情報公開法に基づいてリクエストに応じて受け取った文書によると、DeepMindはわずか3日でパートナー病院にこの変更を通知しました。合併に関する議論が始まったとき、同社は報告を拒否したが、通知と公示の短いギャップは透明性のためであると述べた。 Suleimanは2016年に「患者のデータがGoogleアカウント、製品、またはサービスに関連付けられることは決してありません」と書いています。彼の約束は破られたようです。 (私たちの出版物からの質問に答えて、DeepMindは言いました「この段階では、Googleとの契約は一切行われていません。これはパートナーの同意がある場合にのみ可能です。 StreamsがGoogleサービスになったという事実は、患者データが他のGoogle製品またはサービスで使用できることを意味するものではありません。



Googleの併合により、DeepMind Healthの従業員が怒りました。この部門に近い人々によると、買収が完了すると、多くの従業員が辞める予定です。 IRPメンバーの1人であるマイクブラッケンはすでに退社しています。イベントに詳しい複数の人によると、ブラッケンは「管理委員会」が本当の監視よりもショーケースであるという恐れのために2017年12月に去りました。ブラッケンがスレイマンに委員会に責任を負わせ、その権限を非執行取締役と同等にするかどうかを尋ねると、スレイマンはにやにや笑った。 (DeepMindの広報担当者は、このような事件について「覚えていない」と述べました。) IRPの責任者であるJulian Huppertは、メンバーが率直に話すことができ、守秘義務に拘束されなかったため、グループはBreckenが予想したよりも「急進的なガバナンス」を提供したと主張します。



このエピソードは、DeepMindの周辺ユニットがGoogleに対して脆弱であることを明らかにしています。 DeepMindの声明では、「これらの取り組みを単一の共同プロジェクトでより強力なリソースと組み合わせることは理にかなっているということで全員が同意しました。」問題は、Googleが同じロジックをDeep AIの強力なAIに関する研究に適用するかどうかです。



外部からは、DeepMindは大きな成功を収めているようです。彼女はすでに、超人的なレベルでタスクを完了することを学習できるソフトウェアを開発しています。 Hassabisは、Atariコンソール用のビデオゲームであるBreakoutについてよく言及しています。ブレイクアウトプレーヤーは、画面の下部でプラットフォームを制御し、上部のブロックで跳ね返るボールを反映して、ヒットから崩壊します。すべてのブロックが破壊されると、プレイヤーが勝ちます。彼がボールを逃した場合に負けます。人間の指示なしに、DeepMindプログラムはゲームのプレイ方法を学習しただけでなく、ブロックの上にあるスペースにボールを発射する戦略を開発しました。そこでは、長時間ジャンプし、プレーヤー側の努力なしに多くのポイントを獲得します。 Hassabisによれば、これは強化された学習の力とDeepMindコンピュータープログラムの超常的な能力を示しています。



印象的なデモンストレーション。しかし、Hassabisには何かが欠けています。仮想プラットフォームを少なくとも数ピクセル上に移動すると、プログラムは失敗します。 DeepMindが習得するスキルは非常に限られているため、人々が考慮することができる小さな環境変化に対応することさえできません。しかし、そのような変化は周囲の現実の不可欠な部分です。診断医にとって身体の2つの同一の器官はありません。メカニックの場合、2つのエンジンを同等に構成することはできません。したがって、仮想空間でトレーニングされたシステムは、実際の条件で起動するときに問題が発生する場合があります。



DeepMindがめったに語らない2番目の問題は、仮想環境での成功は報酬機能(ニューラルネットワークがその進捗を測定できるようにする信号)に依存していることです。プログラムは、後壁からの複数のリバウンドがスコアを増加させることを確認します。 AlphaGoの開発の重要な部分は、このような複雑なゲームと互換性のある報酬機能の作成でした。残念ながら、現実の世界では単純な報酬は提供されません。進行状況が個々のポイントで測定されることはほとんどありません。たとえ存在していても、政治的な問題によりタスクは複雑です。気候(大気中のCO₂濃度)を改善するために報酬シグナルを設定することは、石油会社の報酬シグナル(株価)に反し、動機が相反する多くの人々との妥協を必要とします。報酬シグナルは通常非常に弱いです。人間の脳は、タスクの実行中にタスクの成功に関する明確なフィードバックを受けることはほとんどありません。






DeepMindは、膨大な量のコンピューティングリソースを使用して学習する効果的な方法を発見しました。 AlphaGoプログラムは、何かを理解するまでに何千年もの演奏時間を研究しました。 AIの専門家の多くは、この方法は報酬が弱いタスクには機能しないと考えています。 DeepMindは問題を認識します。彼女は最近、戦略的なコンピューターゲームであるStarCraft 2に注目しました。ゲームの開始時に下された決定は、はるかに後の結果をもたらします。これは、現実の世界での混乱し遅れたフィードバックに近いものです。 1月、DeepMindはデモで世界最高のプレイヤーの一部を破りました。これは非常に限られていましたが、それでも印象的でした。彼女のプログラムは、人間の先生からのフィードバックを考慮して、報酬機能の研究も始めました。しかし、先生を巻き込んで、純粋なコンピューター処理が提供する規模と速度の経済性を失うリスクがあります。



厳格な秘密保持契約のため匿名を要求した現在および以前のDeepMindとGoogleの研究者は、DeepMindがそのような方法を使用して強力なAIを作成できるという疑念も表明しました。彼らによると、仮想環境での高いパフォーマンスに重点を置くことは、報酬信号で問題を解決することを難しくします。それでも、ゲームのアプローチはDeepMindの中核にあります。同社には、競合するプログラミングチームのプログラムが仮想ドメインを競う社内リーダーボードがあります。



Hassabisは常に人生をゲームだと考えてきました。彼のキャリアのほとんどはゲーム開発に専念しており、彼の自由時間のほとんどはゲームの練習に費やされています。DeepMindでは、強力なAIを構築する主な手段としてゲームを選択しました。そのソフトウェアと同様に、Hassabisは自身の経験からしか学習できません。DeepMindはすでにいくつかの有用な医療技術を発明しており、ボードゲームのクラスで最高のプレーヤーをしのいでいるので、人々は最初のタスクを忘れるかもしれません。これらは重要な成果ですが、創業者が切望するものではありません。しかし、彼はまだGoogleのすぐ下で強力なAIを作成する機会がありますが、企業の管理外です。これが成功した場合、Demis Hassabisが最も難しいゲームに勝ちます。



All Articles