マッチボックスニューラルネットワーク

この情報をどこから得たのか覚えていませんが、それは何よりもニューラルネットワークの本質を反映しています。 指の上。



ゲームのルール。 NAは「11本の棒」というゲームをプレイすることを学んでいます。 スティックは1本でも2本でも構いません。最後にすべてのスティックを引き出す必要があります。



10個のマッチ箱を用意し、それぞれに2色のボタンを配置します。 たとえば、黒と白。 1つずつ。 箱の番号は、現時点でスティックの数に責任があります。



たとえば、国会は動き始めます。



1.目を閉じて、11番のボックスからランダムなボタンを引き出します。黒の場合は、白の場合は1本、2本の棒を取ります。 (白にしましょう-2本の棒)。

2.人の進路。 たとえば、彼は2本の棒を取りました。

3.次に、番号11-2-2 = 7のボックスを取り出し、ボタンをランダムに引き出します。



ゲームが終わるまで。



国会が勝った場合、関連するボックスの上に同じ色のボタンを1つ追加することで解決策を推奨します。 国会が失われた場合、最後のボックスから細長いボタンを削除することで罰します。



これは10ノードのニューラルネットワーク全体であり、最初はルールさえ知らず、プレイすることを学び、人を倒し始めます。 ルールを変更して、たとえば最後に棒を取った人が負けた場合、国会は再学習して再び勝ち始めます。



ここではもちろん、規模は重要ではありませんが、柔軟なトレーニングとゲームのルール調整の可能性があるという点で、国会が良いことをよく示しています。



All Articles