ボストン・ダイナミクスのヒューマノイドロボットがバック宙をしたり、犬型ロボット「スポット」が人間を撃退してドアを開けたりする様子は、確かに驚異的なハードウェアエンジニアリングの成果と言えるでしょう。しかし、目に見えないのは、それを可能にする極めて複雑な基盤コードです。私たちが簡単にできる動作(バック宙まではいかないかもしれませんが、歩くだけです)は、高度な協調性を必要とし、ロボット工学者はそれを再現しなければなりません。まるでモーターが協調して動くダンスのようです。
あれだけのコードを書かなければならないエンジニアたちは気の毒だ。グーグルの研究者たちは、ロボットに動きを教えるための、負担が少なく、しかも愛くるしい秘密兵器を持っている。それは犬だ。彼らは公開データセットからモーションキャプチャー動画を集め、そのデータをシミュレーターに入力して犬のデジタル版を作成する。そして、この本物の犬のデジタル版を、長方形の胴体と細い脚を持つ四足ロボット「Laikago」のデジタル版に変換する。そして、そのアルゴリズムをLaikagoの物理版に移植するのだ(ちなみに、このロボットは、地球を周回した最初の動物であるソ連の宇宙犬「ライカ」にちなんで名付けられている)。
ロボットの動作は実在の犬とは全く異なります。筋肉の代わりにモーターを持ち、全体的に犬よりもずっと硬いのです。しかし、この翻訳作業のおかげで、Laikagoは本物の犬のように動くことを学習しました。それだけでなく、学習した歩容はロボットメーカーが提示する最速の歩容よりも速いのです。ただし、公平を期すために言えば、まだそこまで安定しているわけではありません。この新しいシステムは、(申し訳ありませんが)徹底的なコーディングではなく、動物が走ったりジャンプしたりする動画を見ることで動きを学習するロボットへの第一歩となるかもしれません。
「こうした手動アプローチの欠点は、ロボットに実行させたいあらゆるスキルに拡張できるわけではないことです」と、このシステムを説明する新論文の筆頭著者であるAI研究者のジェイソン・ペン氏は述べている。「様々な戦略を考案するには、長時間のエンジニアリング作業が必要です。」
この新しいアプローチでは、強化学習アルゴリズムがその作業の大部分を担います。ロボットと犬はどちらも四足歩行ですが、ロボットの体は犬の体とはかなり異なります。そのため、コンピューターシミュレーションでは、ロボットのデジタル版は犬のデジタル版の仕組みを直接コピーすることなく、その動きを模倣する方法を見つけ出す必要があります。「つまり、強化学習アルゴリズムは、ロボットが元の参照動作に可能な限り近づく方法を見つけようとします」とペン氏は言います。

ソフト、ハード、非殺人的なオートマトンについて知りたいことすべて。
このアルゴリズムはランダムな動きを試し、犬の基準動作に近づいたらデジタルの「報酬」を得ます。これは基本的に、親指を立てたメッセージで「よかった。もう一度同じことをして」というものです。もしうまくいかなかった動きを試したら、デジタルの「減点」を与えられます。「二度と同じことをしてはだめだ」というものです。この報酬システムにより、シミュレーションロボットは何度も繰り返し、犬のように動くことを学習します。
次の課題は「シミュレーションから現実へ」、つまりシステムがシミュレーションで学習した内容を実際のロボットで動作させることです。シミュレーションは現実世界の不完全かつ非常に単純化されたバージョンであるため、これは容易ではありません。質量と摩擦は可能な限り正確に再現されますが、完璧ではありません。デジタル世界でのシミュレーションロボットの動作は、実験室の実際のロボットの動きと正確には一致しません。
Google提供
そこでペン氏と彼の同僚たちは、決定的なロボットシミュレーションを一つではなく、ロボットの行動の可能性について幅広い選択肢を構築した。例えば、シミュレーション内の摩擦をランダム化し、ロボットにコマンドを送ってから実際に実行するまでの遅延を微調整した。「十分な多様性を持たせてシミュレーションを訓練すれば、十分に優れた戦略セットを学習し、そのうちの1つが現実世界で機能するようになるのではないかと考えています」とペン氏は言う。
ちなみに、これらの戦略はすべてロボットが実行するのに無理のないものだ。ロボット自身や人間に怪我を負わせるほど急速または激しく動くことは望ましくない。システムはコンピューターシミュレーションで既に最も致命的なミスを犯している(これらのデメリットを覚えておいてほしい)ため、ロボットは現実世界でそれらを犯す必要がない。しかし、これらの行動の中には、他の行動よりも優れた歩行をもたらすものもある。ロボットは犬の解剖学的構造を欠いているにもかかわらず、それらは驚くほど犬らしい行動となった。研究者たちは、存在しない尻尾を追いかけてくるくる回らせることさえできた。また、アーティストが作成したアニメーションから小さなダンスなど、犬らしくない行動もいくつか学習した。
Google提供
念のため言っておきますが、ロボット工学者が動物の動きからインスピレーションを得たのは今回が初めてではありません。ボストン・ダイナミクスのロボット「Spot」は明らかに四足動物の滑らかな動きをモデルにしており、同社のヒューマノイド「Atlas」は人間の動きをモデルにしています。こうしたインスピレーションから生まれたSpotは、綿密にコーディングされた制御アルゴリズムにより、最も困難な地形でも登ることができます。
この新しいシステムは、それほどでもない。「このロボットは平らな床の上を歩き回ります」と、カーネギーメロン大学のロボット工学者クリス・アトケソン氏は言う。アトケソン氏は今回の研究には関わっていない。「不整地走行に関しては、最先端のロボット、特にボストン・ダイナミクスのロボットは、それをはるかに凌駕しています。」
しかし、もっと大きな視点があります。ロボットを家庭のような環境で役立てたいなら、人間と同じように学習しなければなりません。最後に瓶を開けるのに苦労した時のことを思い出してください。蓋を壊して開けたわけではありません。調理器具の引き出しに行き、スプーンを取り出し、蓋の端をこじ開けて密閉を解除しました。かつて他の人間が同じことをしているのを見たからです。
Google提供
「例えば、私たちはあらゆることをこのようにやっているとしましょう」とアトケソンは言う。「では、それはどういう意味でしょうか? つまり、他の人間が行ったことを大量に集めたライブラリが必要なのです。ライブラリにない状況に直面したら、ライブラリの要素を調べて、似たような事例をいくつか見つけ、補間したり、最も近いものを選択したりして、この論文で紹介されている手法を使って、本当に関心のある問題に適用していくのです。」
脚付きロボットに役立つような動作のライブラリを構築するには、かなりの労力が必要になるだろう。でも、全部を手でコーディングするよりはずっといい。
更新、2020年4月3日午後2時(東部標準時):当初記事では研究者らが独自のモーションキャプチャビデオを収集したと述べられていたが、実際には公開データセットを使用していた。
WIREDのその他の素晴らしい記事
- 特集:私たちはどのように気候危機を解決するのか
- パンデミック中の生活がなぜ非現実的に感じられるのか
- Zoomerの皆さん、ビデオ会議のパワーユーザーになる方法
- 終末の日を生き延びるための郵便局の驚くべき役割
- アマゾンの労働者は高いリスクに直面し、選択肢は少ない
- 👁 AIはなぜ因果関係を理解できないのか?さらに:最新のAIニュースもチェック
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください