WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。
4,000体を超える犬型ロボットの軍団が行進する光景は、シミュレーションであっても、どこか威圧感を与える。しかし、これは機械が新たな技を習得する道筋を示すものかもしれない。
この仮想ロボット軍団は、スイスのチューリッヒ工科大学(ETH)とチップメーカーのNVIDIAの研究者によって開発されました。彼らは、徘徊するロボットを用いてアルゴリズムを訓練し、それを現実世界のロボットの脚の制御に使用しました。
シミュレーションでは、「ANYmals」と呼ばれるロボットが、仮想空間内の斜面、階段、急勾配といった課題に立ち向かいます。ロボットが課題を乗り越える方法を学習するたびに、研究者たちはより難しい課題を提示し、制御アルゴリズムをより洗練させていきます。
遠くから見ると、まるで蟻の大群が広大な空間をうごめいているかのような光景が広がります。訓練中、ロボットたちは階段の上り下りは容易に習得できましたが、複雑な障害物を乗り越えるには時間がかかりました。斜面の登り降りは特に困難でしたが、一部の仮想ロボットは滑り降りる方法を習得しました。
仮想ロボットが階段の登り方を学習するシミュレーションのクリップ。
得られたアルゴリズムを、頭部にセンサーと取り外し可能なロボットアームを備えた大型犬ほどの大きさの四足歩行ロボット「ANYmal」の実機に移植したところ、階段やブロックを移動できたものの、高速走行時には問題が発生した。研究者らは、シミュレーションと比較して、センサーが現実世界を知覚する精度に問題があると指摘した。
同様のロボット学習は、荷物の仕分けから衣服の縫製、作物の収穫まで、機械があらゆる有用なことを学習するのに役立つ可能性があります。このプロジェクトは、応用人工知能の将来の進歩において、シミュレーションとカスタムコンピュータチップの重要性を反映しています。
「高レベルで言えば、非常に高速なシミュレーションは本当に素晴らしいものです」と、カリフォルニア大学バークレー校の教授であり、物流会社向けにAIとシミュレーションを用いてロボットアームに物体のピッキングと仕分けを訓練するCovariant社の共同創業者であるピーター・アビール氏は語る。アビール氏によると、スイスとNVIDIAの研究者たちは「素晴らしい高速化を実現した」という。
AIは、ソフトウェアに簡単に記述できない、あるいは何らかの適応を必要とする現実世界のタスクをロボットに実行させる訓練において有望性を示しています。例えば、扱いにくい、滑りやすい、あるいは見慣れない物体を掴む能力は、コードに記述できるものではありません。
4,000台のシミュレーションロボットは、強化学習を用いて訓練されました。強化学習は、動物が正負のフィードバックを通してどのように学習するかに関する研究に着想を得たAI手法です。ロボットが脚を動かすと、アルゴリズムがそれが歩行能力にどのような影響を与えるかを判断し、それに応じて制御アルゴリズムを調整します。
シミュレーションは、コンピュータやサーバーで使用されている汎用チップではなく、NVIDIAの専用AIチップ上で実行されました。その結果、研究者たちは、ロボットの訓練に通常必要な時間の100分の1以下で成功したと述べています。

スイスの会社 ANYbotics の 4 本足ロボット、本物の ANYmal。
Nvidia提供専用チップの使用にも課題があった。NVIDIAのチップはグラフィックスのレンダリングやニューラルネットワークの実行に不可欠な計算に優れているものの、登ったり滑ったりといった物理特性のシミュレーションには適していない。そのため、研究者たちは巧妙なソフトウェアによる回避策を講じなければならなかったと、NVIDIAのシミュレーション技術担当副社長、レヴ・レバレディアン氏は語る。「正しい解決策を見つけるまでには長い時間がかかりました」と彼は言う。
シミュレーション、AI、そして専用チップは、ロボットの知能を進化させる可能性を秘めています。NVIDIAは、自社のチップを用いて産業用ロボットのシミュレーションと制御を容易にするソフトウェアツールを開発しました。また、シアトルにロボット工学研究ラボを設立しました。さらに、自動運転車向けのチップとソフトウェアも販売しています。
3Dビデオゲーム開発用ソフトウェアを開発するユニティ・テクノロジーズは、ロボット工学者向けのソフトウェア開発にも進出しています。同社の人工知能担当シニアバイスプレジデント、ダニー・ランゲ氏によると、ユニティは多くの研究者が同社のソフトウェアをシミュレーションに利用していることに着目し、よりリアルな操作性と他のロボット工学ソフトウェアとの互換性を実現したとのことです。ユニティは現在、スウェーデンの企業アルゴリクスと提携し、強化学習とシミュレーションを用いて林業ロボットに丸太拾いを訓練できるかどうかを検証しています。
強化学習は数十年前から存在していましたが、他の技術の進歩のおかげで、近年、AIにおける注目すべきマイルストーンがいくつか生まれています。2015年には、強化学習を用いて、コンピューターが囲碁という繊細で直感的なボードゲームを超人的なスキルでプレイできるように学習されました。最近では、経験と判断力を必要とするチップ設計の自動化など、実用化も進んでいます。問題は、この学習方法には膨大な時間とデータが必要になることです。
例えば、Open AI社は、多数のCPUを同時に稼働させ、強化学習を用いてロボットハンドにルービックキューブを大まかに操作させる訓練を14日以上も行いました。ロボットの再訓練に毎回2週間もかかるとなると、企業がこのロボットを導入する意欲を削ぐ可能性があります。
強化学習を用いたロボットの訓練における初期の取り組みでは、プロセスを複数の実世界のロボットに分割していました。物理シミュレーションの改良により、仮想環境での学習を加速することが可能になりました。
この新しい研究は「エンドユーザーにとって非常に刺激的だ」と、MITの学生で同様のシミュレーション手法を用いてロボットの新しい物理的設計を考案したアンドリュー・スピルバーグ氏は述べている。彼は、Googleの研究グループが関連研究を行っており、同社のカスタムTensor Processing Unitチップの1つにロボットの学習を分割することで学習を高速化していると指摘する。
オープンロボティクス財団で広く利用されているオープンソースのロボットオペレーティングシステムを管理するタリー・フット氏は、シミュレーションは商用ユーザーにとってますます重要になっていると述べています。「ハードウェアに展開する前に、現実的なシナリオでソフトウェアを検証することで、時間とコストを大幅に節約できます」と彼は言います。「シミュレーションはリアルタイムよりも高速に実行でき、ロボットを壊すことはなく、エラーが発生した場合には自動的に即座にリセットされます。」
しかしタリー氏は、ロボットの学習を現実世界に適用するのははるかに困難だと付け加える。「現実世界には不確実性がはるかに多く存在します」と彼は言う。「汚れ、照明、天候、ハードウェアの不均一性、摩耗など、すべてを追跡する必要があります。」
Nvidiaのレバレディアン氏は、歩行ロボットの訓練に用いられるシミュレーションの種類が、最終的には関連するアルゴリズムの設計にも影響を与える可能性があると述べています。「仮想世界はほぼあらゆる面で価値があります」と彼は言います。「しかし、最も重要なものの一つは、私たちが作りたいAIのための遊び場や訓練場を構築することです。」
WIREDのその他の素晴らしい記事
- 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
- ベッキー・チェンバースはSF界の究極の希望でしょうか?
- デイヴ・エガースの新小説『The Every』からの抜粋
- ジェームズ・ボンドがiPhoneを使わない理由
- ホリデーギフトを買うなら今がチャンス
- ワクチン接種義務に対する宗教的免除は存在すべきではない
- 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
- 🎮 WIRED Games: 最新のヒントやレビューなどを入手
- ✨ ロボット掃除機からお手頃価格のマットレス、スマートスピーカーまで、Gearチームのおすすめ商品であなたの家庭生活を最適化しましょう