ロボットが自らジェンガの遊び方を学ぶ。しかし、これはゲームではない

ロボットが自らジェンガの遊び方を学ぶ。しかし、これはゲームではない

地球規模の熱核戦争。巨大小惑星が地球に激突するわずかな可能性。ジェンガ。これらは人類に深刻な不安を与えるもののほんの一部です。

ロボットはこれらの問題を私たちに代わって解決することはできませんが、崩れ落ちる積み木の塔という恐怖に立ち向かう機械が今、登場しました。MITの研究者たちは本日、Science Robotics誌に、ジェンガの複雑な物理法則を自ら学習するロボットを開発したと報告しました。しかし、これは単なるゲームではなく、ロボットに現実世界の物体を操作させるという困難な探求における大きな一歩です。

ロボットアームがジェンガのピースを掴んでタワーから取り除く

ファゼリら/MIT

プロセスはこうでした。研究者たちは、手首に力覚センサーと二本爪のマニピュレーターを取り付けた産業用ロボットアームをジェンガタワーの前に設置しました。ロボットはタワーに向けられたカメラから視覚情報を取得しました。

しかし、研究者たちはロボットに人間に勝つ方法を教えたわけではない。代わりに、ロボットにランダムにブロックを探査する探索行動をさせた。「ロボットはブロックの見た目や位置は知っているものの、ブロック同士がどのように相互作用するかは実際には理解していないのです」と、新論文の筆頭著者であるMITのロボット工学者ニマ・ファゼリ氏は述べている。

ロボットは探索を進めるうちに、ブロックの中には緩く、少ない力で動かすことができるものもあれば、なかなか動かせないものもあることを発見した。人間のジェンガプレイヤーのように、ロボットは視覚だけでどのブロックが触れるべきかを判断することはできない。「タワーを見ても、どのブロックに触れるべきかは目で判断できません」と、論文の共著者であるMITの機械工学者アルベルト・ロドリゲスは言う。「その情報は探ることで得られるもので、インタラクティブな知覚が必要なのです。」視覚と触覚の両方を使うことで、ジェンガタワーの物理的性質がより明確になる。

少なくとも、このロボットの経験はそうだった。「200~300回、時には400回も押すと、十分に豊富な物理モデルが構築され、それを使ってゲームをプレイできるようになることが分かりました」とファゼリ氏は言う。つまり、人間の子どものように、このロボットは博士号を取得するために学校に通うのではなく、現実世界での遊びを通して基礎物理学を学ぶのだ。(ただし今のところは、自分自身と対戦しているだけだ。)

このようにして、ロボットはジェンガのダイナミクスを根本的に理解していきます。「ですから、新しいタワーやブロックを見ると、新しい種類のインタラクションを行うのです」とファゼリ氏は言います。「ロボットは既に持っているモデルを頼りにし、それを使って次の行動を予測します。」人間が「いや、それはまずいやり方だ」「そうだ、君は正しい方向に進んでいる」と教える必要はありません。

ロボットがジェンガのピースを掴んでタワーから取り除く

ファゼリら/MIT

このアプローチは、ロボットに物体とのインタラクションを教えるという課題に取り組む他のロボット工学者とは異なる。例えば、カリフォルニア大学バークレー校の研究者たちは、強化学習と呼ばれる手法を用いている。これは、ロボットのランダムな動きを多数利用し、報酬システムによってフィードバックを与える手法である。ロボットが腕を任意の方法で動かし、あらかじめ設定された目標に近づけた場合、デジタル報酬が与えられる。これは基本的に、「そうだ、もう一度同じことをして」という指示を与える。多くの試行錯誤を繰り返すことで、ロボットは時間をかけて操作タスクを学習する。しかし、ジェンガを遊ぶロボットのような物理学的な理解は持ち合わせていない。

この新しいロボットがジェンガをしている間、コードは実験的な押し付け動作を以前の試みと比較し、成功を評価しています。ロボットはカメラと力覚センサーの情報から、これまでの試みがどのように見え、どのように感じられたかをすべて把握しています。そのため、これまでタワーをねじったり倒したりせずに取り出せなかったブロックのように見え、またそのブロックの感触が似ている粘着性のあるブロックを押し始めた場合、ロボットは後退します。(もしより多くの圧力をかけなければならない場合、それはより多くの摩擦に逆らって作業していることを示しており、ここでロボットの物理学的理解が役立ちます。)もしロボットが緩いブロックの感触と視覚を持っていれば、以前それがうまくいったことを知っているため、作業を続けます。

ジェンガはロボットにとって習得すべき必須スキルのようには思えないかもしれませんが、視覚と触覚を組み合わせるという根底にある戦略は、日常生活で広く用いられています。例えば、歯磨きを例に挙げてみましょう。前歯を磨いていることは視覚的に理解できますが、同時に、強く磨きすぎていないかどうかも判断する必要があります。これは視覚だけでは判断が難しいものです。ロボットに歯磨きをさせる必要はありませんが、現実世界には、ロボットが視覚と触覚の両方を組み合わせて解析する必要がある操作問題が数多く存在します。例えば、特に繊細な物体の取り扱いなどです。

このジェンガボットは、一部のロボットの学習方法にも変化をもたらしています。長年にわたり、ロボット工学者たちはシミュレーションでソフトウェアを動作させることでロボットを訓練してきました。これにより、ロボットは現実世界よりも速く経験を積むことができました。しかし、このアプローチには当然限界があります。

歩行ロボットの物理特性がどれほど複雑で、完璧な精度でモデル化するのがいかに難しいかを考えてみてください。「異なる表面を歩こうとすると、摩擦も重心も分かりません」と、カリフォルニア工科大学のAI研究者アニマ・アナンドクマール氏は言います。彼女は今回の研究には関わっていません。「こうした些細な要素はすぐに積み重なっていきます。だからこそ、これらのパラメータを正確にモデル化することは不可能なのです。」一方、現実世界でジェンガを実験することは、こうしたモデリングを一切省略し、ロボットに物理特性を直接的に理解させることを強いるのです。

だからといって、シミュレーションでの作業が役に立たないというわけではありません。例えば、イーロン・マスクのOpenAI研究所の研究者たちは、シミュレーションで学習した内容と現実世界の状況との間のギャップを、物理的なロボットハンドによってよりシームレスに埋めようとしています。ロボット学習の初期段階では、物事を進めるための唯一の正しい方法というものはありません。

ジェンガであなたに勝てるロボットが出てくるかどうかは、期待しすぎないでください。彼らはまだ基礎を学んでいる段階です。しかし、少なくとも、私たちが繰り広げる世界規模の熱核戦争の後には、何か暇つぶしになるものがあるでしょう。


WIREDのその他の素晴らしい記事

  • ケンブリッジ・アナリティカのデータを求める男の壮大な探求
  • Facebookがすべてのチャットアプリを統合する際の落とし穴
  • 政府閉鎖を終わらせても航空便の遅延は解消されない
  • ネズミの侵入に対抗するためドローンが毒爆弾を投下
  • 携帯電話は退屈になったのか? これから奇妙になる
  • 👀 最新のガジェットをお探しですか?おすすめ商品、ギフトガイド、お得なセールなど、一年を通してチェックしてみてください
  • 📩 毎週配信されるBackchannelニュースレターで、さらに多くの内部情報を入手しましょう