ベルリンのスタートアップ企業Spil.lyは昨春、問題に直面した。同社はSnapchatの自撮りフィルターの全身版とも言える拡張現実(AR)アプリを開発していた。スマートフォンをかざすと、友達の体が毛皮や炎といった特殊効果で変化する様子を見ることができるのだ。このアプリを動作させるには、動画内の人体を忠実に追跡する機械学習アルゴリズムを訓練する必要があった。しかし、この気骨のあるスタートアップ企業には、こうしたプロジェクトでアルゴリズムを学習させるのに通常必要な、数万枚、数十万枚の手作業でラベル付けされた画像を収集するリソースがなかった。
「AIのスタートアップでいるのは本当に大変で、私たちにはこれだけのデータを買う余裕がありませんでした」とCTOのマックス・シュナイダー氏は語る。
彼の解決策は?データを捏造することだ。
Spil.lyのエンジニアたちは、映画やビデオゲームのグラフィック作成に用いられる技術を応用し、アルゴリズムの学習用に独自のラベル付き画像を作成し始めた。約1年後、同社は「シミュラント」と呼ぶデジタルヒューマンを現実世界の風景写真に貼り付けることで作成した画像を約1000万枚保有している。見た目は奇妙だが、実際には機能する。人工知能に「人工」を組み込んだようなものだと考えてみて欲しい。
「純粋に合成されたデータで訓練したモデルは、実際のデータで訓練したモデルとほぼ同等です」と、Spil.lyのエンジニア、アダム・シュスター氏は語る。デモでは、iPhoneのカメラを通して見たテーブルの上に仮想の猿が現れ、地面に飛び降り、近くに立っている人間の服にペンキを吹きかける。

ベルリンのスタートアップ企業 Spil.ly は、このような画像を使用して、ビデオ内の人物を認識する拡張現実ソフトウェアを作成した。
フィギュア:Viorama GmbH、猫:Mike Estes「成功するまで偽装する」は、大手競合がひしめく市場で生き残りを図ろうとするスタートアップ企業の長年のモットーでした。血液検査の「イノベーター」であるセラノスのような企業を苦境に陥れてきました。しかし、機械学習の世界では、資金や実際の学習データが不足している状況で、学習データの偽装はプロジェクトを軌道に乗せるための正当な戦略になりつつあります。データが新たな石油だとすれば、これはまるで自宅の裏庭でバイオディーゼルを醸造するようなものです。
偽造データの動きは、生活やビジネスの新たな分野における人工知能の活用を加速させる可能性があります。機械学習アルゴリズムは人間の知能に比べて柔軟性に欠け、新しい問題に適用するには、通常、その状況に特化した新たな学習データが必要です。エストニアのタリンに拠点を置くスタートアップ企業Neuromationは、家畜の成長をカメラで追跡したいという顧客のために、擬似豚を含む画像を大量生産しています。Apple、Google、Microsoftはいずれも、合成学習データの使用の利便性を指摘する研究論文を発表しています。

Neuromation は、シミュレーション動物を使用して、農場で家畜を監視するのに役立つソフトウェアをトレーニングしています。
ニューロメーションベンチャー企業LDVキャピタルのパートナー、エヴァン・ニッセルソン氏は、合成データはスタートアップ企業に、データ豊富なAI大手企業と競争する希望を与えると述べています。優秀なチームはしばしばデータ不足に悩まされていると彼は言います。「合成データを作成し、それを使ってモデルを訓練する能力があれば、スタートアップ企業と大企業の間に公平な競争の場が生まれる可能性があります」とニッセルソン氏は言います。
Spil.lyの事例は、この議論にさらなる説得力を与えている。2月、Facebookは動画内の人物に特殊効果を適用できる独自の機械学習ソフトウェアを公開した。「Densepose」と呼ばれるこのソフトウェアは、500万点の手作業でアノテーションされた人物画像5万枚を用いて学習された。Spil.lyは数日のうちに、Facebookと同様のデータの合成を開始した。その後、このスタートアップはDenseposeのアイデアを自社製品に統合している。
Neuromationをはじめとする企業は、偽データのブローカーとしての地位を確立しようとしています。Neuromationの別のプロジェクトは、フランスのスーパーマーケットグループAuchanなどを顧客とする小売分析会社OSA HP向けに、食料品店の棚の画像を作成することです。このデータは、画像を読み取って棚の在庫を追跡するアルゴリズムのトレーニングに使用されます。「商品カテゴリーの数が膨大で、小売環境も多様であるため、画像の収集とラベル付けは現実的ではありません」とOSAのCEO、アレックス・イサエフ氏は述べています。

この画像は実際のものではありませんが、実際の店舗の在庫を監視するためのカメラ ソフトウェアの学習に役立っています。
ニューロメーションイスラエルのスタートアップ企業DataGenの共同創業者オフィール・チャコン氏によると、同社はシミュレーションされた(そしてやや不気味な)手のカスタム動画の制作に最大7桁の料金を請求しているという。同社のリアルさは、機械学習界で最近流行している「敵対的生成ネットワーク(GAN)」と呼ばれる手法に一部基づいており、写真のようにリアルな画像を作成できる。
人間の目には、あの手やNeuromationの偽の豚は本物とは到底思えない。「初めて合成データセットを見た時、『これはひどい。コンピューターがこんなものからどうやって学習できるんだ?』と思いました」とSpil.lyのシュスター氏は言う。「しかし、重要なのはコンピューターが画像から何を理解するかです。」
コンピューターに正しいものを理解させるには、ある程度の作業が必要です。Spil.lyは当初、裸の人物のみを合成していましたが、ソフトウェアが肌の色だけを認識できるようになったことが分かりました。現在、このスタートアップのシステムは、様々な体型、肌の色、髪、服装の人物を生成しています。Spil.lyをはじめとする多くの企業は、数百万もの合成画像に加えて、少数の実画像でシステムを学習させることもよくあります。
世界で最もデータと資金に恵まれたAIチームでさえ、合成データを活用し始めています。例えば、Googleの研究者はシミュレーション環境でロボットを訓練し、Microsoftは昨年、200万の合成文によってアラビア語のレヴァント方言の翻訳精度が向上するという結果を発表しました。
AIの着想源を秘密にしているAppleも、学習データの偽造に関心を示している。2016年には、視線検出ソフトウェアの改良を目指し、リアルな目の画像を生成する研究論文を発表した。その約1年後、同社はユーザーの視線を検知し、顔を認識することでロックを解除するiPhone Xを発売した。両プロジェクトには、同じ研究者が参加している。Appleは、この研究成果をロック解除機能に取り入れたかどうかについてコメントを控えている。
ロボット工学において、合成学習データは、研究者が現実世界では不可能なほど大規模な実験を行うのに役立ちます。アルファベット傘下のウェイモは、自社の自動運転車が公道で数百万マイルを走行したと発表していますが、その制御ソフトウェアは模擬道路で数十億マイルを走行しています。
機械にデジタルの分身を与えることで、ロボットは工場や家庭にある物体をより適切に扱う方法を学習できる。イーロン・マスク氏が共同設立した研究機関OpenAIの研究者たちは、シミュレーション世界において、実際のロボットでも十分に機能するソフトウェアを訓練できることを発見した。その効果的な手法としては、シミュレーション世界の色や質感をランダムに変化させることでソフトウェアが物理的な問題に集中できるようにしたり、掴むべき物体を数百万種類も生成したりすることが挙げられる。「2年前は、シミュレーションデータはあまり役に立たないというのが一般的な考えでした」とOpenAIの研究者ジョシュ・トービン氏は言う。「ここ1年ほどで、その認識は変わり始めています。」
こうした成功例があるにもかかわらず、偽造データは万能ではない。多くの複雑な問題は、現実的にシミュレーションできるほど十分に理解されていないと、データジェン社のチャコン氏は指摘する。また、リスクが大きすぎるため、現実から少しでも乖離したシステムを構築するリスクを負うことはできないケースもある。アイオワ大学のマイケル・アブラモフ教授は、網膜の画像を生成する方法を開発しており、大学院生のプロジェクトでは合成データを利用しているという。しかし、今月FDAの承認を得たスタートアップ企業IDxの網膜検査ソフトウェアの開発においては、実際の画像にこだわった。「最大限に保守的でありたいと考えました」とアブラモフ教授は語る。
ティーチングマシン
- 機械学習アルゴリズムを教えるビデオで演技して生計を立てている人もいます。
- Google は人工知能の導入を加速するために、アルゴリズムをトレーニングするためのアルゴリズムをトレーニングしています。
- この検索会社はまた、アジアのユーザーを活用して、自社のシステムに現地の文化を学ばせている。