プログラムはビデオで遊ぶことを学びます

このプログラムは、単純な三目並べゲーム、4つの連続(接続4)、五目並べをプレイし、その人に勝ちます。 1つの重要なニュアンスではないとしても、何もおもしろくないように思えます-このプログラムはルールを知らないのです! より正確には、彼女は人々のゲームを取り上げた2分間のビデオを見て、それらをゼロから学びました。



パリ大学ディドロのルーカスカイザー (ŁukaszKaiser)は、C ++でプログラムを作成しました。このプログラムは、ビデオシーケンスをフレームに分割し、不要なもの(人の手)をすべて削除し、連続した位置のリストを取得します。



このデータに基づいて、アルゴリズム(OCaml)は、許可された動きのデータベースと勝ち/負け/未解決の位置のリストをコンパイルし、∃x1Q(x1)∧∃x0(C(x1、x0))x0 = e1)のような論理式のセットを生成します 両方のモジュールは、無料のトスボードゲームプログラムに統合されています。



通常のラップトップでは、ゲームに応じて2分間のビデオを処理するのに28〜74秒かかります。 その後、さらに数分で一連のルールを作成します。そして、彼女はプレーする準備ができました。 確かに、勝つ方法を学ぶためには、複数のビデオを見る必要があります。 プログラムのテスト中に、彼女は三目並べのゲームの25本のビデオを処理しました。25本-連続4本、17本-ホモクです。 ゲームが単純な場合は、それ以下で十分です。



複雑なことはないように思えますが、そのようなシステムがより複雑で完全になり、 昆虫の行動を観察するだけで、より複雑なゲームや戦略を学ぶことができると想像してください。



実際、ルカシュカイザー自身は、プログラムの適用対象としてボードゲームを選んだと書いています。「ここでは、視覚的なオブジェクトの数は比較的少ないが、十分な種類のアクションがあるからです。 さらに、ゲームは現実世界の関係の多くのシナリオの自然なモデルであるため、幅広いコンテキストで結果が重要になります。



アルゴリズムの詳細については、調査論文: 記述的複雑さ (PDF)にガイドされたビデオからのゲームの学習 、または人工知能に関する第3回会議からの彼のプレゼンテーションのビデオを参照してください。






All Articles