
エヌビディアのCEO兼社長、ジェンスン・フアン氏が、ラスベガスで開催された2019年コンシューマー・エレクトロニクス・ショーの基調講演で講演した。デビッド・ポール・モリス/ブルームバーグ/ゲッティイメージズ
シアトルにあるNVIDIAの13,000平方フィート(約1,200平方メートル)のAIロボティクス研究施設では、少人数の研究者チームが、同社のAIを活用した未来の構築に尽力しています。キッチンの作業台の横では、ロボットアームがスパムの缶を持ち上げて引き出しに入れています。このアームはダイニングテーブルを掃除する方法も学習しており、丁寧に頼めば料理の手伝いもしてくれます。まさにこれが、NVIDIAの野心的なAIマスタープランにおける最初の試みなのです。
今年初めに開設されたこの研究所は現在28名の職員を擁し、フル稼働時には50名の研究者、教員アドバイザー、インターンを受け入れることができます。著名なロボット工学者であり、NVIDIAのロボット研究担当シニアディレクターであり、ワシントン大学教授でもあるディーター・フォックス氏が率いるこの研究所は、人間と安全に共存できる次世代ロボットの開発を目指しており、その過程で製造、物流、医療などの産業を変革する可能性を秘めています。これは、人工知能が抱える数多くの壮大な課題の一つであり、特定のタスクに優れているだけでなく、ほぼ人間のような振る舞いをするロボットというSF的なビジョンを描いています。
しかし、このロボットは、やや手の込んだ筋肉運動でもある。NVIDIAのハードウェアとソフトウェアが現在、そして将来何ができるのかを示す、人目を引くデモンストレーションであり、ますますスピードを増す競合他社に一歩先んじようとする同社の試みでもある。
2005年にグラフィック・プロセッシング・ユニット(GPU)をAI向けに最適化したことは、テクノロジー・ハードウェアの歴史において最も賢明なビジネス判断の一つとして記憶されるに違いありません。しかし今やNVIDIAはトップに立ち、激化する競争に直面しています。その地位を確固たるものにすることは、NVIDIAにとって25年の歴史の中で最も厳しい試練の一つとなるでしょう。
Nvidiaの最新ラボには、ロボットが現実世界で遭遇すると想定される機器と現実の環境が整備されています。最初のシナリオは、簡素なキッチンです。ロボットアシスタントはAIとディープラーニング技術を統合し、物体を検出・追跡し、ドアや引き出しの相対位置を把握し、それらを開閉して特定のアイテムにアクセスします。「これまで、ロボット工学の研究は、完全に統合されたシステムではなく、小規模で独立したプロジェクトに重点を置いていました」とフォックス氏は述べています。「私たちは、ロボット制御と知覚、コンピュータービジョン、人間とロボットのインタラクション、そしてディープラーニングの専門家からなる、協力的で学際的なチームを結成しています。」
シアトルのチームは、サンタクララ、マサチューセッツ州東部、トロント、テルアビブにあるNVIDIAの他の研究拠点に所属する約60名の研究者の支援を受けています。この学際的なアプローチには、非常に困難な目標が掲げられています。NVIDIAは、自社の人工知能ハードウェアとソフトウェアによって、現在のロボット(非常に正確な位置決めを行うものの、規則に定められた指示にただ従うだけの機械)を、人間と安全に共存できる動的で柔軟な機械へと変革できることを証明しようとしているのです。
ベルリンのGoogleでAI研究者を務めるサミム・ワグナー氏は、NVIDIAが独自の研究を行っている主な理由の一つは、より優れたAIハードウェアを開発し、他社に販売できるようにするためだと考えている。「機械学習向けに実現可能で競争力のあるハードウェアを開発するために、NVIDIAは戦略的に高品質な機械学習研究を行わざるを得ないのです」とワグナー氏は語る。「ゲーム・エンターテインメント業界との伝統的な繋がりが、NVIDIAの機械学習研究の焦点となっており、それが成功の鍵となっています」。この言葉が、このロボット、そしてNVIDIAの研究所で行われている数々の奇抜な実験を説明する一助となる。
「ディープラーニングのおかげで、ロボットを周囲の環境とインタラクトさせることが可能になりました」と、NVIDIAのチーフサイエンティスト兼研究担当シニアバイスプレジデントであるビル・ダリー氏は、キッチンヘルパーロボットについて語った。「知覚システムを構築できるようになったので、車が常に同じ場所にいることを期待しないロボットを開発できるようになりました。」
NVIDIAのロボット工学実験と同様に、ディープラーニングはAIシステムがこれまで不可能だった問題に取り組むことを可能にしました。試行錯誤の手法を通して、バーチャルアシスタント、コンピュータービジョン、言語翻訳、チャットボット、顔認識といった分野で画期的な進歩が遂げられてきました。そして、人工知能の多くの分野と同様に、こうした画期的な進歩は、高性能な小型GPUに大きく依存しています。
NVIDIAのAIへの取り組みは、2010年、カリフォルニア州パロアルトのJoanie's Cafeで始まりました。「アンドリュー・ン氏との朝食会がきっかけでAIに着手したんです」とダリー氏は語ります。その朝食会で、当時Google Brainで働いていた著名なAI研究者のン氏は、Googleが1万6000個の中央処理装置(CPU)を使ってAIシステムに猫の写真を認識させるトレーニングを行っている様子を説明。1万6000個のCPUを自由に使える企業はほとんどいないと指摘した上で、ダリー氏はある課題を提示しました。「GPUの数をもっと少なくすれば、きっとできるはずです」とン氏に言ったのです。
出会いから間もなく、ダリーはNvidiaの研究者ブライアン・カタンザーロに、Ngとチームを組んでまさにその成果を出すよう依頼した。「彼らが1万6000個のCPUで達成したのとほぼ同じ性能を、私たちは48個のGPUで達成しました」とダリーは語る。「当時、これが全てを一変させるだろうと、私にははっきりと分かっていました。」
猫の認識という賭けから、NVIDIAのAI事業は爆発的に成長しました。同社は現在、この分野にどれだけの投資をしているのか正確には明らかにしていませんが、提出書類によると、昨年度はすべての研究に総額18億ドル(14億ポンド)を費やしました。主な投資分野はゲーム、AI、自動車でした。NVIDIAのGPUがAIプロジェクトにどれほど効果的であるかは、競合他社間の競争を激化させており、Intel、Google、そしてFacebookでさえ、NVIDIAに追いつこうと巨額の資金を投入しています。
2018年7月、Googleはデバイス上での機械学習向けに独自のAIチップを開発していると発表しました。Googleが賭けているのは、ニューラルネットワーク機械学習専用に設計されたテンソルプロセッシングユニット(TPU)という新しい種類のチップです。そして、それと同等に重要な別の争いも繰り広げられています。ハードウェアだけでなく、NVIDIAのコードライブラリも、Google TensorflowやFacebook PyTorchといった競合フレームワークと競合しています。これは、サービスとしてのディープラーニング(深層学習)と捉えれば分かりやすいでしょう。そして、あらゆる困難を乗り越え、NVIDIAは依然として健在です。
その理由は?猫のチャレンジが示したように、GPUはAIタスクの処理に非常に優れているからです。これは、多くの計算を同時に実行するAI関連の並列コンピューティング問題の処理において、GPUがCPUよりも優れているためです。並列コンピューティングはニューラルネットワークで特に普及しています。ニューラルネットワークは、多くのタスクを同時に、あるいは並列に実行できる動物の脳と同様に動作するように設計されているからです。NVIDIAは最終的に、あらゆるスマートフォン、コンピューター、ロボット、そして自動運転車に搭載される人工脳を開発したいと考えています。
CEOのジェンスン・フアン率いる同社は、2005年にAIブームを先取りし、自社のGPUで数百万単位の微細な計算を処理できるソフトウェアを開発しました。これは、後に現代のAIに必要となるものです。現在、同社のGPUは世界中のデータセンターに設置され、数千もの企業のAIタスクを支えています。2014年から2018年にかけて、データセンター向けに最適化されたチップの売上高は524%増加し、同社の成長を牽引しました。
「私たちは全世界へのサプライヤーです」とダリー氏は語る。「誰もがNVIDIAのGPUでディープニューラルネットワークのトレーニングを行っています」と彼は続け、同社のT4チップは推論タスクに広く使用されていると付け加えた。FacebookとGoogleは、自社プラットフォームのAI機能の基盤としてNVIDIAのプラットフォームを採用している。ほぼすべての自動運転車関連企業がNVIDIAの技術を採用している。同社はまた、テンセント、アリババ、百度とも契約を結んでいる。
キッチンのロボットと同様に、NVIDIAの他のAI実験も同様に多様で風変わりな印象を与えます。NVIDIAは、敵対的生成ネットワーク(GAN)と呼ばれる創造的なニューラルネットワークを構築し、人間の顔を超リアルに生成することに恐ろしいほど優れています。2018年12月に発表された論文では、NVIDIAはGANの顔が4年前のGANの顔と比べてどれほど鮮明であるかを示しました。
NvidiaのGANが作成、あるいは偽造できるのは顔だけではありません。Nvidiaは、冬に撮影した写真を美しい夏の風景に変える翻訳ネットワークも開発しました。雨に濡れた結婚式の写真に、もっと明るい雰囲気を演出したいと思いませんか?NvidiaのAIを使えば、まるで最初から太陽が輝いていたかのように見せることができます。そして、それだけではありません。Nvidiaは昨年末、AI生成グラフィックスを採用した世界初のビデオゲームデモを公開しました。このデモは、AI生成のビジュアルと標準的なビデオゲームエンジンを組み合わせて構築されたドライビングシミュレーターでした。
続きを読む:フィンランドの人工知能大国化計画の内幕
しかし、道のりには困難がつきまとい、それは今後の厳しい道のりを予感させる。年初、NVIDIAは第4四半期の売上高予想を5億ドル下方修正せざるを得なくなり、株価は18%近く下落した。2018年を通して猛威を振るった仮想通貨の暴落は、NVIDIAの収益に甚大な打撃を与え、時価総額は推定230億ドル減少した。しかし、これは大きな痛手ではあったものの、恩恵でもあった。
今のところ、NVIDIAのGPUの適応性の高さは、競合他社に対する優位性をもたらしています。データセンター、自動運転車、研究所、暗号通貨マイニング装置など、あらゆる用途にGPUは不可欠な存在です。しかし、状況はすぐに変わる可能性があります。そして、まさにそこでNVIDIAの研究所が活躍の場となるのです。
「AIハードウェアを扱うスタートアップ企業が次々と登場しています」と、AI研究コンサルタントであり、ステルスモードにあるスタートアップの創業者でもあるスティーブン・メリティー氏は語る。「確かに脅威となる可能性はありますが、それはまだ大きな疑問です。これらのスタートアップ企業が早期に大規模に事業を展開するとは想像できません。」
そうしたスタートアップ企業の一つが、英国に拠点を置くGraphcore社だ。BMW、Sequoia、そしてGoogle傘下のDeepMindの創業者らからの出資により、現在では評価額が10億ドル(76万ポンド)を超えている。Graphcore社は、まだ量産段階ではない同社の知能処理装置は、既存のシステムよりも100倍高速だと主張している。NVIDIA社にとって、これは仮想通貨バブル崩壊よりも大きな財政的負担となる可能性がある。
「AIハードウェア・エコシステムの最終段階がどうなるかは分かりません」と、ディープラーニング研究者のスティーブン・メリティー氏は語る。「もし最終的に双方が同じハードウェアを使うのであれば、NVIDIAが有利です。もしそれが『トレーニングに使うハードウェア』と『実世界で使用するハードウェア』に細分化されれば、Graphcoreのようなスタートアップ企業が大きな成功を収めるかもしれません。」
2019年2月28日11時10分更新: マサチューセッツ州にあるNvidiaの研究所は、州の西部ではなく東部にあります。
この記事はWIRED UKで最初に公開されました。