古代の囲gameゲームの秘密。 なぜコンピューターはまだ男をbeatらなかったのですか?



クレイジーストーンコンピュータープログラムを使用したレミークル(左)対グランドマスターヨーダノリモト



1994年、コンピューターは1997年にチェスでドラフトで世界チャンピオンを破りました。 今日、コンピューターは、1つを除いて完全な情報を備えた絶対にすべての人気ゲームの人々よりも優れています。



2500年の歴史を持つ古典的なゲームには非常に単純なルールがありますが、コンピュータープログラムは最高のグランドマスターに勝つことすらできない、 Wiredは書いています



古代のゲームは「チェスの東部版」と考えることができます。 チェスのように、これは完全な情報を持つゲームです。つまり、ゲームのどの時点でも、すべてのプレイヤーはゲームの状態に関する完全な情報を持ち、個別のアクションでゲームに作用します。 ここでは、成功は運や反応速度に依存しません。



コンピューターの計算能力は向上していますが(今日の世界チェスチャンピオンは自宅のPCでも負けそうです)、エキスパートレベルでプレイするためのアルゴリズムは未解決のままであり、AIの最も興味深いタスクの1つです。 問題は、ゲームで9番目のダンに昇格できる人がほとんどいないことです。 これを行うには、日本または韓国で数年間勉強する必要があります。 そこでは、才能のある子どもたちが家から連れ出され、9歳頃から囲Goアカデミーで勉強します。



上級アマチュアはほとんど常にゲームの特定のレベルで立ち往生し、結果を改善することはできません。「このロックを解除するには精神的な跳躍が必要です。同じ問題はソフトウェア開発にもあります」とPA-RISC 70年代のヒューレットパッカード社。 彼は開発プロセッサでgoプログラムをテストしました。 「問題は、個々のフラグメントではなく、ボード全体を評価する方法です。」



このゲームは東部だけでなく西部でも、特に数学者や物理学者の間で長い間人気があります。 たとえば、有名な数学者ジョン・ナッシュとアラン・チューリングがしたように、アインシュタインはしばしば外出をしました。



囲for用のコンピュータープログラムは45年間開発されており、チェスプログラムと同様にこの問題にほとんど注意が払われています。 1つ目は、1968年にゲーム理論の天才アルフレッド・ゾブリストによって書かれました。 彼女は、ルールを満たしたばかりの絶対的な初心者を打ち負かすことができました( 最初の人間とコンピューターのゲームを記録しました )。 最初は楽観的でした。 次の40年にわたって、膨大な時間と知的努力が費やされましたが、計算能力の進歩を考慮しても、プログラムは上級のアマチュアでさえ打ち負かすことはできませんでした。



理由は、チェスとgoを比較することで理解できます。 チェスゲームの開始時に、白には20の可能な動きがあり、黒には20の可能な答えがあります。 最初の動きの後、ボードには400の異なるポジションがあります。 次に、進行中の数字を比較します。19x19ボードでは、黒には361の可能な初期移動があり、白には360の可能な答えがあります。 これは、最初のラウンドの後でのみ129,960の可能な組み合わせを意味します。



いわゆる「ブランチングファクター」-各ラウンドで利用可能な移動の平均数-チェスでは35、ゴーでは-250。強いブランチングのゲームは、ミニマックスルールを使用して可能な組み合わせのツリーを作成する標準アルゴリズムの作業を複雑にします。 すべてではなく、分析を考慮しても、より深い分析のための有望な分岐のみを考慮します。 チェッカーやチェスで機能するものは、外出先では機能しません。 goの可能な組み合わせのツリーで有望な枝を選択することは、多くの場合、完全に神秘的なプロセスです。 プレイヤーでさえ、彼らがそれをどのように行っているのか理解していません。「ボードを見るだけでわかります」と彼らは言います。







繰り返しますが、チェスでは、少なくともピースの数によって、誰が勝つかをほとんど常に理解できます。 移動中は、専門家だけが状況を解釈できます。



ゲームの移動の平均数:チェス-約40、移動-200。分岐係数とこれらの統計を考慮すると、コンピューターのインポテンスが明確になります。



フランスの才能あるプログラマー、レミ・クーロムは、ミニマックスとモンテカルロ法を組み合わせることを思いついた2006年にクレイジーストーンプログラムで初めて成功を収めました。 彼は、新しい分岐ツリー計算アルゴリズムであるモンテカルロツリー検索またはMCTSを呼び出しました。 フランス人は2007年と2008年にUECカップのコンピュータープログラムのチャンピオンを獲得しましたが、これは彼に名声をもたらすことはなく、レミーは開発を放棄しました。 しかし、2010年に彼は日本のゲーム開発者Unbalanceからオファーを受け、2011年にCrazy Stoneの最初の商用バージョンがリリースされました。 2013年、レミーは勝利を勝ち取りました。



ただし、2014年には失敗がありました。 Zenプログラムに対する最終的な対立では、視聴者は3番目の動きの後に奇妙なことが起こっていることに気付きました。 Zenプログラムは、コーナーに2つの石を標準設定した後、突然3番目の石を中央近くに配置しました。 誰もそのようにプレイしませんでした、それは明らかに「非人間」の決定でした。 すぐに、Crazy Stoneでの勝利の期待のレベルは、60%を超える途方もなく高い値に上昇しました。 どうやら、プログラムは安全ではないが、右上隅の石のグループを安全と見なした。 戦略の成功は取締役会の正しい評価に直接依存するため、観客はクレイジーストーンの敗北の可能性についてささやき始めました。 そしてそれが起こったのです。186番目の動きで、クレイジーストーンは敗北を認め、ゼンはUECカップの新しいチャンピオンになりました。



しかし、Kulomにはまだ復venのチャンスがありました。 ファイナリストとして、彼は4石のハンディキャップで本物の人間のグランドマスターと対戦する権利を受け取りました。 今年、依田典本がトーナメントに参加しました。 日本のグランドマスターは、伝統的な緑の着物を着てテーブルに座っていました。 レミークール-リムレスメガネと青いセーターを着て、彼は前回のチャンピオンシップに参加しました。



パーティーのオンラインブロードキャストに同行したプロのコメンテーターは、クレイジーストーンが上手くプレイし、さらにはアドバンテージがあることに同意しました。 食べ物は非常にイライラし、船尾に見え、クーロムは大騒ぎし、ラップトップ、ゲームボード、クロノメーターを見て、どこでも、食べ物ではなく。



クレイジーストーンはエンディングで悲しい敗北を喫しました。 11石を獲得した人は、敵が取り戻して優位性を維持するのを防ぐために、明らかに防御的な動きをいくつか行います。 しかし、クレイジーストーンは勝つためだけにプログラムされました。 したがって、彼女のアルゴリズムは、勝者の状況で自分のゾーンで意味のない動きをすることで、対戦相手が敗北を認めるのを待っていました。 しかし、ここではそのようなトリックは通りませんでした-そして、ヨーダはなんとか回収しました。 ゼンとの2回目の試合では、彼はすでに見栄えが良く、プログラムで4つの石を獲得しました。







とにかくレミー・クラムはまだ幸せだった-そして次のチャンピオンシップの最後にアクションのアルゴリズムを完成させることを約束した。



どうやら、すぐにコンピュータが完全な情報で最後のゲームに勝ちますが、それはその人のために残っています。 Kulomaによると、プログラムは10年以内にハンディキャップなしで勝ちます。 最高の選手の力を知っている専門家は、よくわからない。 事実は、より高いレベルでゲームが質的に異なるレベルに達すると、動きが予測不可能になることです。 同時に、ゲームプログラムの品質は、コードの品質よりも計算能力に依存していません。たとえば、64コアの標準サーバー上の同じCrazy StoneとZenは、2048コアの敵クラスターを簡単に破りました。 つまり、プログラムが再び壁にぶつかります。



しかし、コンピューターが勝者になっても、チェスでのディープブルーの勝利後に新聞が書いたように、人々が支配する「最後の知的要塞の崩壊」について話すことはできません。 go用プログラムは、特定の問題を解決するための高度に専門化されたツールです。 彼らは人間の精神とはかけ離れており、脳の働きを真似ようとはしません。 「私にとっては楽しいだけです」とクロムは言います。



All Articles