Googleのロボットは物を拾う方法を学習している Googleのロボットは物を拾う方法を学習している

Googleのロボットは物を拾う方法を学習している

Googleのロボットは物を拾う方法を学習している
Googleのつかむロボットの実演
グーグル

赤ちゃんは物を掴むことを学ぶとき、視覚と運動能力という2つのシステムを組み合わせます。この2つのメカニズムと多くの試行錯誤を組み合わせることで、私たちは鉛筆をホッチキスとは異なる方法で掴むことができるのです。そして今、ロボットも同じように学習を始めています。

Googleはロボットに、ある箱から物を拾い、別の箱に入れるという単純なタスクを教えています。何かを拾うロボットはこれが初めてではありませんが、これらのロボットは継続的なフィードバックに基づいて、異なる形状、サイズ、特性を持つ物を拾う新しい方法を学習しています。例えば、柔らかい物体と硬い物体を異なる方法で拾うことを学習しました。

コーネル大学のDeepGrasping論文のような他のプロジェクトでは、物体を一度分析して掴むのに最適な場所を見つけ、掴むことを試み、失敗したら再度試みます。Googleのアプローチは、物体とロボットハンドの関係を継続的に分析することで、人間のようにロボットハンドの適応性を高めます。

これらのロボットは、実際にはカメラに接続された脳を持つ腕に過ぎません。三関節式アームに2本の掴み指が接続されており、2つのディープラーニングネットワークによって制御されています。ディープラーニングネットワークは、大量のデータに基づいて予測を行う能力に優れているため、人工知能(AI)の分野で人気の高い分野です。今回のケースでは、1つのニューラルネットワークはゴミ箱の写真を見て、ロボットの手が物体を正しく掴めるかどうかを予測します。もう1つのニューラルネットワークは、手がどの程度正確に掴んでいるかを解釈し、最初のネットワークに調整を指示します。

研究者たちは、ロボットはカメラの配置の違いに応じて調整する必要がないと指摘した。カメラがビンとアームをはっきりと映し出している限り、ニューラルネットワークは調整を行い、物体を拾う学習を継続することができる。

2ヶ月間にわたり、Googleはロボットに80万回もの物体を拾わせました。6台から14台のロボットが常に物体を拾い上げており、人間の役割はロボットの容器に物体を詰め替えることだけでした。拾われた物体は、事務用品、子供のおもちゃ、スポンジなど、ごく普通の家庭用品でした。

ArXiv.orgに掲載された論文で研究者たちが最も驚いたのは、ロボットが硬い物体と柔らかい物体を異なる方法で掴むことを学習した点だ。硬いと認識された物体の場合、グリッパーは物体の外側の縁を掴み、しっかりと握る。しかし、スポンジのような柔らかい物体の場合、ニューラルネットワークは、掴む指を1本中央に、もう1本を縁に沿って置き、握る方が簡単だと認識した。

この研究は、ニューラルネットワークの学習を助ける継続的な直接的なフィードバックによって、人間の介入をほとんど必要とせずに、他の把持ロボットと大きく異なる。これにより、ロボットアームはこれまで見たことのない物体であっても、高い成功率で掴むことができる。研究者たちは、新しい物体を掴む際の失敗率は、物体の種類に応じて10~20%であると記録した。ロボットが物体を掴めなかった場合、ロボットは再度掴もうとする。Googleの成果は、ぬいぐるみなどでは一貫して成功するものの、硬い物体では16%の失敗率にとどまったコーネル大学のDeepGraspingプロジェクトよりもやや劣る。

ロボットに周囲の世界とその物理的限界を理解させることは、自動運転車、自律型ロボット、配達用ドローン、そしてロボットが自然界と相互作用するあらゆる未来的なアイデアにとって重要なプロセスです。

研究者たちは次に、ロボットを実験室の外、現実世界の環境でテストしたいと考えています。つまり、照明や場所、移動する物体、そしてロボットの摩耗など、さまざまな条件でテストするということです。