最もせっかちな人のために:科学者は犬Aiboをプログラムして、彼女が自分で世界を探索できるようにしました。 一連のアクションなし。
ここに、子供の頃のロボット犬が彼の周りの世界を探検するリンクがあります。
これで十分でない人は、habrakatの下で歓迎します。
したがって、 最後のトピックでは、 誰かが練習に欠けていたので、ここに練習があります。
ロボット構造
指示から判断すると、
ロボットには20の自由度があり、
1.5時間勤務
9ワットを消費し、
温度、IR、距離、加速度、圧力、振動、
32メガバイトのメインメモリ
64ビットRISCプロセッサを搭載しています。
実験のセットアップ
このグラフからわかるように:
(開発者によると、ロボットは約15,000のアクションを実行しました)
ロボットにはいくつかのオプションしかありません(噛む、打つ、周りを見回す)、センサーからのいくつかの状態(何も表示されず、オブジェクト1 \ 2が表示され、成功したバイト\ヒット)
図にP1-P5として示されている段階:
P1-ロボットは特定のオブジェクトに焦点を合わせて検出することを学習します
P2-特定のアクションを特定のオブジェクトに適用せずに実行しようとする試み
P3-彼の体の一部を動かそうとするが、特定の目標なし
P4とP5はより複雑なアクションであり、噛んだり蹴ったりします。
最も注意深い人は、垂れ下がったおもちゃの目の上と、犬の前の床の象の耳の後ろに「マーカー」が付いた白いシーツに気付いたに違いありません。 私は実験の声明でこれについて言及していませんでしたが、これは環境オブジェクトの識別を簡素化するために使用されたと推測できます。 つまり 犬はそれ自体でオブジェクトを決定しませんでした。特定のアルゴリズムがそれを決定したからです。 まあ。
内観
ロボットプログラムは、いくつかのモジュールで構成されています。
*最初は予測モジュールで、各部分は感覚運動空間の特定の領域に特化しています。
* 2番目のモジュールはメタ予測システムであり、その目的は最初のモジュールのさらなる開発とエラーを予測することです。 これは、過去と現在のエラー率の比較に基づいています。
* 3番目のモジュール-2番目のモジュールによって発行された結果に基づいてアクションを選択します。
アルゴリズムでは、予測しすぎないが予測するのが難しくないアクションを選択できると想定されています。
実験目標
「目的は、「好奇心」などの一般的な能力を実装するエンジンを構築することです。これにより、事前にプログラムされた最小限のバイアスで一般的な注意メカニズムを生成します。」
目標は、「好奇心」などの現象を実装してメカニズムを作成することです。これにより、事前にプログラムされたアクションを最小限に抑えたユニバーサルメカニズムを作成できます。
つまり 開発者は、人間がプログラミングを行う必要がほとんどない自己学習型のマシンを作成する方法を習得しようと努力しています。 開発者はまた、彼らが周囲の世界を研究し、「歯で」すべてを試して、幼い子供の行動をコピーしたいと言います。
主観的な外観
私の意見では、この方法(自習)は、特定のタスクに対して、または単に異なるアプローチで、より個別のアルゴリズムを取得するかなり有望な方法です。 しかし、ビデオから判断すると、開発者は犬に非常に狭い範囲の可能性を与えました。特に、犬は特定の方法で、特定の角度/高さでのみ、空間の特定の点で打つことができます。 体を完全に制御することはできません。 独立して構成されたアクションもありません。モーションパラメーター(影響のポイント)を変更し、順番に構成することしかできません。 オブジェクトの定義などもありませんが、そのような結果であっても、これはほんの始まりに過ぎないため、間違いなく興味深いものです。
写真と資料
ラッキーバイト
Uターン
まだ十分ではない人のために、 ここ (1.2 mb、pdf、英語)に研究の説明があります。これは彼らが「知的適応好奇心」と呼んでいます。 ソースコードはありませんが、プログラムと詳細な説明を計算するためのいくつかの公式があります。
議論のための質問
1)最初からロボットを子供のように訓練する見込みはありますか?
2)ロボットの動きが非常に制限されており、オブジェクトの検出が別のアルゴリズムによって実行されたと想定される場合、この実験は意味があると見なすことができますか?
3)この実験を成功と見なすことができますか? ロボットは、最初はそこに置かれていなかった新しい何かを本当に学びましたか?