MIT RobotがJengaを視覚とタッチに依存して学習する





機械学習への特別なアプローチは、ロボットが電話機を組み立て、組み立てライン上の他の小さな部品を操作する方法を学ぶのに役立ちます。



MITの3番目の建物の地下で、ロボットは次の動きを慎重に検討します。 彼はタワー全体を破壊しないように、タワーをブロックから優しく突いて、ストレッチに最適なブロックを探します。 だから、彼の孤独でゆっくりとした、しかし驚くほどダイナミックな「ジェンガ」のゲームもそうだ。



MITのエンジニアが開発したロボットには、ソフトピン付きグリップ、圧力センサー付きブレスレット、外部カメラが装備されており、これらすべてを使用して、タワー全体とその個々のブロックの両方を見て感じることができます。



ロボットがブロックを優しく押している間、コンピューターはカメラとブレスレットからの視覚的および触覚的フィードバックを認識し、測定値を以前の動きと比較します。 彼はまた、これらの動きの可能な結果を​​計算します-具体的には、タワーの特定の構成と特定のサイズの力の適用で、特定のブロックを正常に抽出することが可能になります。 その後、リアルタイムで、ロボットはブロックに圧力をかけ続ける必要があるかどうか、またはタワーの落下を防ぐために新しいブロックに切り替える必要があるかどうかを「学習」します。



「Jengu」をプレイするロボットの詳細な説明は、Science Robotics誌に1月に掲載されました。 アルベルト・ロドリゲス、キャリアセンター准教授 MIT Engineering DepartmentのWalter Henry Gale氏は、ロボットは以前のシステムを開発する際に達成が困難であったことを実証していると述べています。相互作用。



「チェスやゴーなど、より論理的に満たされたタスクやゲームとは異なり、Dzhengaをプレイするには、ブロックを調査、引き出し、配置、整列するための優れた身体スキルが必要です。 これにはインタラクティブな知覚と操作が必要です。ブロックを動かす方法とタイミングを理解するには塔に触れる必要があります、とロドリゲスは言います。 -このようなタスクをシミュレートするのは非常に難しいため、ロボットは実際のジェンガタワーと対話しながら、現実世界で学習する必要があります。 主な難点は、オブジェクトや物理学に適用する際に常識を使用して、比較的少数の実験から学習する必要があることです。



彼が開発した触覚学習システムは、ジェンガ以外のタスク、特にリサイクル可能な廃棄物の選別や消費者製品の組み立てなど、慎重な物理的相互作用を必要とするタスクに使用できると言います。



「電話の組み立てラインでは、ほとんどすべてのステップで、部品が所定の位置にあるか、ネジが締まっているという感覚が必要です。これはすべて、視覚的な感覚ではなく、触覚と力覚によるものです」とロドリゲスは言います。 「そのような行動の教育モデルは、今日のこの技術の最もおいしい部分です。」



この作品の筆頭著者は、MITの大学院生Nima Faseliです。 チームには、Michel Oller、Jiajun Wu、Zheng Wu、およびMITの認知科学および脳研究の教授であるJoshua Tenenbaumも含まれています。





プッシュプッシュ



スワヒリ語で「ビルド」を意味するゲーム「ジェンガ」では、54個の長方形ブロックがそれぞれ3ブロックの18層に配置されているため、隣接する層ではブロックが互いに垂直になります。 ゲームの目的は、ブロックを慎重に取り出してタワーの上に置き、タワーが落下しないように新しいレベルを構築することです。



Jengaをプレイするためにロボットをプログラムするには、従来の機械学習(MO)スキームでは、ブロック、ロボット、タワーが相互作用するときに発生する可能性のあるすべてのことを一般的に記述する必要があります。これらは、数千から数万のブロック。



代わりに、ロドリゲスと同僚は、データを使用するという観点から、ロボットが人間の認知能力に触発されたゲーム「ジェンガ」のプレイ方法と、このゲームへのアプローチ方法を学ぶためのより効率的な方法を探し始めました。



チームは、ABB IRB 120ロボットグリップ規格を業界向けにタスクに適合させ、その後、ジェンガタワーを撮影しやすい場所に設置し、トレーニング期間が始まりました。 最初に、ロボットはランダムなブロックと、押す必要があるブロック上の場所を選択しました。 それから彼は少し努力して、ブロックをタワーから絞り出そうとしました。



各試行中に、コンピューターはそれに関連する視覚的および触覚的測定値を記録し、それが成功したかどうかを記録しました。



そのような試みを何万回も行う代わりに(その後、タワーを何度も復元する必要があります)、ロボットはわずか300人で訓練しました。同様の測定と結果の試行をグループ化し、ブロックの動作の特定の側面を示しました。 たとえば、あるグループのデータは、移動に抵抗するブロックを移動しようとする試みを示し、別のグループは簡単に移動するブロックを操作し、3番目はタワーの崩壊につながった試みを示します。 各データグループについて、ロボットは、現在の視覚的および触覚的測定に基づいてブロックの動作を予測する単純なモデルを開発しました。



Fazeliによれば、このようなグループ化技術は、ロボットがこのゲームを学習する効率を大幅に向上させ、オブジェクトの類似の動作をグループ化する自然な方法に触発されました。 「ロボットは、原則として発生する可能性のあるすべてのことを記述するモデルから学習するのではなく、データクラスターを構築し、これらのクラスターのそれぞれからモデルを学習します。」



スタックの収集



研究者は、MuJoCoシミュレーターを使用したゲームのコンピューターシミュレーションで高度なMOアルゴリズムと比較することで、アプローチをテストしました。 シミュレータで得られたデータにより、科学者はロボットが現実世界でどのように学習するかを理解できます。



「これらのアルゴリズムに、システムが受信するデータと同じデータを提供して、同様のレベルでジェンガをプレイする方法を学習する方法を確認します」とオラーは言います。 「私たちのアプローチと比較すると、ゲームをマスターするためのこれらのアルゴリズムは、私たちが持っていたものよりも数桁高い数の塔で遊ぶ必要がありました。」



チームは、モスクワ地域へのアプローチが人間の選手と競うことができるかどうかに興味を持ち、ボランティアとの数回の非公式の大会を開催しました。



「私たちは、人が倒れる前にどれだけのブロックをタワーから出せるかを見ましたが、その差はそれほど大きくありませんでした」とオラーは言います。



しかし、研究者が望めば、ロボットと人間を真に掘る方法があります。 物理的な相互作用に加えて、「ジェンガ」をプレイするには、対戦相手がタワーを落とさずに次のブロックを引き抜くのが難しいように、適切なブロックを抽出する戦略が必要です。



これまでのところ、チームは「ジェンガ」に勝つロボットを作成することにあまり興味がなく、他の分野で新しいスキルを使用するのにより忙しいです。



「私たちの手で実行する多くのタスクがあり、「それを正しく行う」という感覚を強さと触覚のプロンプトの言語で表現できます」とロドリゲスは言います。 「私たちのアプローチに似たアプローチは、そのようなタスクに役立つかもしれません。」



All Articles