人工生命のモデル。 パート1

ポイントに直行します。 ILの研究は何につながりますか? この分野で得られた知識を実際に適用する方法は? この分野で働いている科学者は、彼らの研究は、移動ロボット、医学、ナノテクノロジー、人工知能、さらには社会的および経済的システムの研究などの実際の応用に特に向けられていると言います。 しかし、人工生命の歴史において、かなりの数の論争と矛盾がありました。 多くの懐疑論者は人工生命に関するいくつかの研究を批判し、「事実のない科学」と呼んでいます。 しかし、人工生命に関する最近の出版物は、人工生命をモデル化するために使用される技術が、少なくとも進化の研究に関しては科学界によって認識されていることを示しています。



ILの主な問題は、生物学的および進化的原則に基づいて動作するコンピューティングシステムとモデルの作成です。 簡単に言えば、これは「人間によって作成された世界」です。 しかし、一定の時間まで、この分野での仕事は、生命の特性の理論的研究に限定されていました。 そして、モデリングは、たとえば適応行動進化など、生物学的システムの個々の部分の構築にすぎません。 しかし、最近、主にナノテクノロジーと分子生物学の発展、ならびに個々の遺伝子の目的とその相互作用の方法の理解の高まり、および個々の分子を操作するためのツールの出現により、ILの新しい方向が開発されており、新しい人工的に合成された生物学的形態の作成を目指していますILの哲学的正当化と、少なくとも「生命」の概念の定義(この言葉で一般的に理解されているもの)。 今日、この傾向の支持者は、地球上に存在するものよりもより一般的な生命形態を模索していると言います。 ILの開発の大まかな経過を追跡してみましょう-それがすべて始まり、今後この方向が導くかもしれないものまで。



PolyWorld(PolyWorld)

投稿者:Larry Yaeger、1993


したがって、人工生命は、人間が作成したプログラムを使用して、生命そのもの、生命システム、その進化を研究する試みに過ぎないことが明らかになりました。 しかし、医学、ロボット工学、社会経済システムなどの「生活」を研究するなど、これらすべてが実際にどのように機能するかは興味深いです。

そもそも、生物のかなり単純なプロセスのソフトウェアモデリングが実行された人工生命の最初のモデルの1つを考えてみましょう。これはPolyMir Larry Yagerです。

このモデルは、端が壁に囲まれた大きなテーブルと考えることができます。 人工生物はこのテーブルに住んでいます。 彼らは動き、食物を吸収し、交差し、子孫を与えます。 生物は他の人と戦うこともできます。 イェーガーは生物に興味深い特徴を与えました-それらはすべて色と色覚を持っています。 たとえば、生物が闘争に入ると赤くなり、渡りたいと思うと青くなります。

これらすべての特性により、これらの生物の個体群は進化することができ、実際、そのような進化過程を感じ、見、分析するのに役立ちます。 実際、Yagerモデルは次のことを示しました。



« » — , , , .

« » — , , , ( ).

« » — , , , , , , .








学習と進化の相互作用

著者:D. Ackley、M。Littman、1992


前の章の小さな結果を要約すると、ラリー・イェーガーは彼のPolyWorldの助けを借りて、人工生物の自然選択に過ぎず、それ以上は何も実現しなかったと言えます。 これが、PolyMirの「進化」という言葉の意味です。 AckleyとLittmanは用語を少し拡張しようとしました。 彼らの仕事は、学習と進化の相互作用のモデルです。

エージェントの動作の一般的なパターンは非常に単純です。 エージェントは、セルに分割された2次元の世界に住んでいます。 細胞自体は、エージェント、木、捕食者、草、石を含むことができます。 したがって、エージェントは世界の主要な「ユニット」であり、他のすべてがさまざまな方法でエージェントに影響を与えます。

捕食者はエージェントを倒し、捕食者のエージェントよりも強い。 捕食者に対する保護手段として、他のエージェントがいない場合にエージェントが登ることができるツリーが使用されます。 しかし、木が時間とともに枯れて、その上に座っているエージェントを殺すため、絶えず木にいるのは危険です。

各エージェントには独自のニューラルネットワークがあり、その助けを借りてアクションについて決定を下します。 エージェントのニューラルネットワークは、2つのブロックで構成されています。

  1. 動作ブロック、つまり 各タイムステップでエージェントのアクションを決定するブロック。
  2. アクション評価ユニット、すなわち エージェントの行動目標を形成するブロック。


実際、これらのブロックにより、このモデルで学習と進化を組み合わせることができます。 アクション評価ユニットは、行動ブロックのトレーニング信号を「生成」し、エージェントがそれに応じて行動するように強制します。 評価ユニットが行動ユニットのチームがエージェントの人生を改善したと「考える」場合、信号自体は正の場合もあれば、負の場合もあります。 したがって、エージェントのさまざまな成功と失敗の後、そのニューラルネットワークは修正され、同じアクションで「正しい」決定を下します。 そのため、トレーニングが実施されます。

そして、2つのエージェントを通過する過程で、それらのニューラルネットワークが子孫に送信されます。これが、モデルの進化が起こる方法です。

AckleyとLittmannの結果は非常に興味深いものでした。 彼らは一度に1つずつモデルを開始しました。最初はモデルはトレーニングのみで、次にモデルは進化のみで、最終的にモデルはトレーニングと進化の両方で完成しました。 学習と進化の相互作用により、エージェントは100万回以上の命の指標で死ぬことはありませんでした(そして、メジャーの数が9∙10 6に達すると)、一方、単一モデルでは、エージェントは5-7倍速く死にました!





PSまた、Grasshopper、Ant Farm、Tierraなどのモデルの概要を追加したいと思います。 ハブラフチャナムは面白い?

PPSおそらく、ブログの投稿をArtificial Intelligenceに転送することは理にかなっていますが、私は成功しませんでした。 謝ります



UPD正しいブログにコメントを公開してくれたカルマとコメントに感謝します。 パート2を書き始めています。

UPD PolyMirを収集したくない場合は、 ビデオとグラフィックを見ることができます。






All Articles