AIはハリウッドにやってくるのではなく、すでに到来している

AIはハリウッドにやってくるのではなく、すでに到来している

生成AI戦争の初期の勝者は崩壊寸前だったが、その後、スター選手を擁する復活劇にすべてを賭けた。Stability AIは競争に打ち勝つことができるのか?

画像には、ショーン・パーカー、エリック・シュミット、ウィル・アイ・アム、顔、頭、人物、写真、ポートレート、アート、コラージュが含まれている可能性があります。

写真イラスト: マーク・ハリス、ゲッティイメージズ

レディー・ガガは、まさか自分の温室でクーデターが起こるとは思っていなかっただろう。とはいえ、彼女はそこで、ナップスターの創業者であり、フェイスブックの初代社長でもある億万長者のショーン・パーカーと共同でパーティーを主催していた。

2024年2月、ガガはスキンケア専門の非営利団体の設立を記念し、マリブにある2250万ドルの海辺の邸宅にゲストを招いていた。団体の理事の一人は、パーカー財団の運営を本業とする彼女のボーイフレンドだった。太平洋を見渡す床から天井まで届く大きな窓のそば、キャンドルの灯る空間で、パーカーの側近たちはガガの側近たちと交流し、弦楽四重奏(もちろんグラミー賞受賞)の音楽に合わせ、フォカッチャとスズキのアラ・ブレースをつまみながら過ごしていた。

パーカーの親しい友人でありビジネスパートナーでもあるプレム・アッカラジュが、仕立ての良いスーツを着て現れた。豊かな髪は完璧に整えられていた。二人はパーカーがFacebookに、アッカラジュが音楽業界にいた頃からの知り合いだった。長年にわたり、二人は映画ストリーミングプラットフォームの共同立ち上げを試みたものの失敗に終わり、さらに成功した例として、有名な視覚効果会社を買収したこともある。最近、二人はAIベンチャーの立ち上げについて話し合っていた。

その晩、ガガの家で、アッカラジュはStability AIの投資家の隣に座っていた。同社は2022年に大人気のテキスト画像生成ツール「Stable Diffusion」をリリースした企業だ。初期の成功にもかかわらず、Stabilityは「破綻寸前だった」と投資家は振り返る。「数日以内に選択肢がなくなった」のだ。彼はアッカラジュにこう言った。「Stabilityをハリウッド向きのAIモデルにすべきだ」

ハリウッドは確かに味方を必要としているようだった。2022年以降、米国で制作される映画やテレビ番組の数は、国内の制作費の高騰、海外との競争、そして各地での長期にわたる労働争議により、約40パーセント減少していた。AIは制作のスピードアップとコスト削減によって、制作数を回復させると約束していた。コンピューターが、会話の翻訳、一フレームずつの骨の折れる視覚効果の追加、無数のショットからブームマイクを編集するといった単調な作業を自動化するのだ。いつか、コンピューターが脚本を書いて演技までする日が来るかもしれない。業界最大の労働組合のうち2つは、近い将来、生成AIが組合の仕事を奪わないという確約を得るためなどもあり、ストライキを行った。しかし、すべての大手スタジオとストリーミングサービスは、AI戦略を模索し、Luma、Runway、Asteriaといった多くのスタートアップが、それらを売り込むツールの開発に取り組んでいた。

アカラジュは目の前にチャンスがあると感じた。スタビリティAIには技術力がある。あとはハリウッド映画のような仕上がりだけだ。彼にはただ一つ問題があった。会社にはすでにCEOがいたのではないか?

元ヘッジファンドマネージャーのエマド・モスタク氏が2020年にStability社を設立した当時、同社の使命は「社会の最も困難な問題の解決に真に貢献するシステムを構築する」ことだった。2022年までに、モスタク氏が構築する必要があると感じたシステムは、生成AIモデルを実行できるほど強力なクラウドスーパーコンピューターだった。OpenAIはクローズドソースモデルで注目を集めており、モスタク氏はオープンソースの代替手段、「Windowsに対するLinuxのような」ものを作りたいと考えていた。彼は、文字を入力して画像を生成できるオープンソースシステムを開発している学術研究者グループに、そのスーパーコンピューターを提供した。研究者たちは断るつもりはなかった。同年8月、彼らはモスタク氏の会社と提携し、Stable Diffusion社を立ち上げた。

テキストから画像を生成するこのジェネレーターは大ヒットとなり、2カ月で1000万人のユーザーを獲得した。「当時は最先端技術にかなり近かった」とスタンフォード大学のコンピューターサイエンス教授、マニーシュ・アグラワラ氏は語る。このモデルの成功の核心はオープン性だった。「研究者は基本的にモデルを拡張し、微調整することができ、機能強化やアドオンの作成に関してコミュニティ全体が動き出すきっかけとなった」とアグラワラ氏は言う。2022年10月時点で、Stability AIの従業員はわずか77人だったが、Stable Diffusionコミュニティにはその数千倍の人々が集まっており、より大規模なライバル企業と競争することができた。MostaqueはシードラウンドでCoatueやLightspeedなどのベンチャーキャピタルやヘッジファンドから1億100万ドルを調達した(最後の100万ドルは幸運を祈ってのものだと彼は言う)。同社はユニコーン企業となった。

画像には人物、ヘルメット、大人のアート、コラージュ、衣服、手袋、風船、グラフィックが含まれている可能性があります

写真イラスト: マーク・ハリス、ゲッティイメージズ

この時期の従業員たちは、モスタク氏を先見の明のある人物と評しています。彼は人工知能へのアクセスを民主化する必要性について雄弁に語りました。モスタク氏は従業員に対し、そう遠くない将来、複雑な生物医学的問題を解決し、『ゲーム・オブ・スローンズ』シーズン8を制作するだろうと語りました。「当時は信じられないほど楽しくて混沌としたスタートアップで、たくさんのスパゲッティを壁に投げつけていました。中には、本当にくっついてしまったものもありました」と、ある元幹部社員は語ります。(私が話を聞いた他の従業員と同様に、この従業員も匿名を条件に、モスタク氏と会社について自由に語ってくれました。)

モスタク氏は成功に興奮していた。しかし同時に、手に負えない状況に陥っていた。「この仕事は全くの初心者でした」と彼は言う。「アスペルガー症候群とADHDを抱えていたので、『一体何が起こっているんだ?』と思いました」。モスタク氏は早口で、淡々とした口調でこう語る。「研究面では本当に良い成果を上げました。一方で、マネジメント面はあまり得意ではありませんでした」。元従業員二人は、モスタク氏が市場性のある製品を作ることについて深く考えていなかったと感じていたと私に語った。「彼はただ模型を作りたかっただけなんです」と一人は言った。

同社の成功は、厳しい監視を招いた。2023年1月、ゲッティイメージズは、1,200万枚もの自社製写真でモデルを学習させたとして、ロンドン高等裁判所にスタビリティAI社を提訴した。同社は数週間後、米国でも同様の訴訟を起こした。米国での訴状の中で、ゲッティイメージズはスタビリティAI社を「厚かましい窃盗とフリーライド」で非難した。

そして2023年6月、フォーブス誌は、モスタク氏が投資家へのプレゼン資料で自身の経歴を水増しし、事業内容を偽っていたという大々的な記事を掲載した。記事ではさらに、モスタク氏がオックスフォード大学で修士号ではなく学士号しか取得していないと主張していた(モスタク氏は両方取得したと述べているが、この取り違えは彼自身の事務ミスによるものだ)。さらに、スタビリティ社は、同社のモデルに計算能力を提供していたAmazon Web Services(AWS)に数百万ドルの負債を抱えていると報じられていた。モスタク氏は提携について語っていたものの、スタビリティ社の広報担当者はフォーブス誌に対し、実際には標準的な割引が適用されたありふれたクラウドサービス契約だったことを認めた。

モスタク氏はこれらすべての疑問に答えを持っていたが、投資家は結局信頼を失った。記事が発表されて4ヶ月後、CoatueとLightspeed両社のベンチャーキャピタルが取締役会を去り、もはや同社への信頼を失っていることを示しました。年末までに、同社の研究責任者、最高執行責任者、法務顧問、そして人事責任者も辞任しました。スタビリティ社の著名な研究者の多くも後に続きました。投資家からの圧力を受け、モスタク氏はついに2024年3月22日、レディー・ガガの温室パーティーからわずか数週間後に会社を去りました。

アカラジュ氏とパーカー氏は、スタビリティ社の買収に即座に着手し、アカラジュ氏をCEO、パーカー氏を取締役会長に就任させた。モスタケ氏は、アカラジュ氏から支援の申し出があったと述べているものの、二人はモスタケ氏とは一切話をしていない。

二人は当面、スタビリティAIの再構築に着手した。しかし、経営を引き継いで間もなく、競争は激化した。その年の9月、別のスタートアップ企業であるランウェイが、AI業界初となる映画スタジオとの大型契約を締結した。ランウェイは、ライオンズゲートが保有する映画カタログをトレーニングデータとして利用し、スタジオ向けのツールを開発することになった。「アイデアから実行までの時間は、本当に大幅に短縮されています」とランウェイのCEO、クリストバル・バレンズエラ氏は語る。「かつては2週間かかっていた作業が、わずか数分で完了します」。彼は今後数年のうちに、「かつては大軍と数億ドルを必要としていた作業を、2人、3人、4人のチームでこなすようになるでしょう」と予測している。

ライオンズゲートとの契約は、ハリウッドのAI化を加速させた。「昨年ロサンゼルスに来た時と今とでは、雲泥の差です」と、Stabilityの競合企業LumaのCEO、アミット・ジェインは語る。「昨年は『プロトタイプを作ろう、概念実証をしよう』という感じで、避けられない事態を先送りしていました。今年は全く違う雰囲気です」

元 Google DeepMind の研究者らが設立した AI 企業 Moonvalley (女優のナターシャ・リオンが共同設立した AI 映画スタジオ Asteria の親会社) は最近、Time 誌に対して、12 を超える大手ハリウッドスタジオが同社の最新モデルをテストしていると語り、まだ全面的ではないものの、このテクノロジーに対してオープンな姿勢を示している。

「私とショーンがここに来て、方向性とリーダーシップを示し、タイミング、チーム、テクノロジーという 3 つの T を最大限に活用することが重要でした」とアカラジュ氏は語ります。

私は彼のTEDトークではなく、ビバリーヒルズ近郊の2000万ドルの豪邸で、美しく、ふかふかの白いソファに座っている。そこからは手入れの行き届いた庭園が見渡せる。アッカラジュ氏は引き締まった体格で、輝く白い笑顔を浮かべ、ボタンダウンシャツからは上腕二頭筋がはっきりと見える。アイコンタクトも握手も、力強い。

アッカラジュ氏によると、就任早々、StabilityはOpenAIやGoogleと最先端のモデル構築で競合することはもうしないと決断したという。代わりに、それらのモデルをベースにしたアプリを開発することで、莫大な計算コストから会社を解放するのだ。アッカラジュ氏はStability AIのクラウドコンピューティングベンダーと新たな契約を交渉し、会社の巨額の負債を帳消しにした。この件について詳細を問われると、広報担当者を通して彼は難色を示した。しかし、Coatueをはじめとする投資家たちは再び集まってきた。

モスタク氏がAIが世界で最も困難な問題を解決するという絵を描いたのに対し、アッカラジュ氏が構築しているのは、残酷なほどに魅力のない言葉で言えば、ハリウッド向けのSaaS企業だ。目標は映画を制作することではなく、AIを活用して映画製作者が既に使用しているツールを強化することだと彼は言う。「私たちの差別化要因は、クリエイターを中心に据えていることだと確信しています」とアッカラジュ氏は言う。「ジェームズ・キャメロン氏を取締役会に迎えているAI企業は他にありません」

そう、皮肉なことだ。かつてローマで「病気で一文無し」のときに殺人マシンの夢を熱で見て、それを映画『ターミネーター』に変えた男――スカイネットの生みの親――が、AI企業の役員になっているのだ。だが、さらに驚くべきは、キャメロン氏がパーカーとアッカラジュが経営するAI企業の役員になっていることだ。10年前、キャメロン氏はハリウッドによる彼らへの攻撃を主導していた。彼は、彼らのストリーミングプラットフォーム「スクリーニングルーム」の前提を快く思っていなかった。このプラットフォームでは、新作映画を劇場公開当日に自宅で50ドルで視聴できるのだ。キャメロン氏はシネマコンの聴衆に対し、「劇場での体験に尽力している」と語ったと伝えられている。その後の数年間、大手スタジオはスクリーニングルームとの契約を公に発表することはなく、2020年に同社はSR Labsに社名変更した。

画像にはジェームズ・キャメロンのアートコラージュ、人物、大人、顔、頭の写真、肖像画が含まれている可能性があります

写真イラスト: マーク・ハリス、ゲッティイメージズ

同年、アッカラジュとパーカーは、ロード・オブ・ザ・リングゲーム・オブ・スローンズ、そしてキャメロン監督のアバターといった大ヒット作を手掛けた視覚効果スタジオ、WETAデジタルを買収しました。WETAは、キャメロン監督がまるでパンドラという架空の世界で撮影しているかのような、人工環境のリアルタイムレンダリングをファインダーを通して確認できる仮想カメラを開発しました。

ある夜、キャメロン、アッカラジュ、そしてパーカーは夕食に集まり、テクノロジーが映画業界をどう変えつつあるのかを議論した。「テキーラが進みました」とキャメロンは回想する。「友情が芽生えました」。スクリーニングルームを巡る緊張は一気に解け去った。(「彼とは実際にそのことについて話したことはありませんでした」とアッカラジュは言う。「彼も私も知っていました。とても面白かったです」)

キャメロン氏は取締役会のメンバーですが、アカラジュ氏が言ったように「クリエイターが中心」なのでしょうか?パーカー氏と話した際、彼はオープンソースモデルの活用の重要性を強調し、「クリエイターと知的財産への敬意」について語りました。彼はこう付け加えました。「ナップスターや初期のソーシャルメディアに関わってきた経験からすると、私から言うと少し突飛な発言に聞こえるかもしれません。しかし、これは学んだ教訓です。」

AIに楽観的な人々でさえ、その技術の大部分はまだ映画化には至っていないことを認めている。テキスト画像生成ツールはマーケティング代理店には有効かもしれないが、長編映画に求められるクオリティに達していないことが多い。「Netflixの映画に携わった時、シングルショットで制作しようと試みました」と、AI活用について公に語りたくない匿名希望の映画製作者は語る。AIで生成された映像は4K解像度ではなかったため、品質管理から「差し戻された」と、映画製作者は語る。

さらに、一貫性の問題もあります。映画製作者はシーンを細かく調整する必要がありますが、市販されている画像・動画ジェネレーターのほとんどではそれが不可能です。チャットボットに同じ質問を10回入力しても、おそらく10通りの異なる応答が返ってくるでしょう。「これはVFXワークフローでは全く通用しません」とキャメロン氏は言います。「より高い解像度と高い再現性が必要です。まだ実現できていないレベルの制御性が必要なのです。」

それでも、映画製作者たちは実験を止めてはいない。この記事のために話を聞いたほぼ全員が、AIは既に撮影前にシーンをマッピングする「プリビズ」プロセスの中核を担っていると述べた。しかし、このプロセスは新たな非効率性を生み出す可能性がある。「旧システムの非効率性は、私が見ているものと、これから作りたいものを想像するものとの間の情報ギャップにありました」と、テクノロジー先進のアニメーション会社Toonstarの共同創業者、ルイサ・フアン氏は語る。「AIの登場で、非効率性は『こちらがバージョン、こちらが別のバージョン、こちらが別のバージョン』というように変わってしまうのです。」

ハリウッドで最初に生成AIを最終フレームに使用したことを認めた人物の一人が、Amazonの聖書叙事詩『ハウス・オブ・ダビデ』の監督兼プロデューサーであるジョン・アーウィンだ。彼はギリシャで同作のシーズン1を撮影中にこの技術に興味を持った。「制作デザイナーがほぼリアルタイムでアイデアを視覚化できることに気づきました」と彼は語る。「私はこう尋ねました。『今やっていることをどうやってやっているのか、具体的に教えてください。何を使っているんですか、マジシャン?』」と彼は回想する。

アーウィンは自らツールを触り始めました。「自分の想像力と直接繋がっているように感じました」と彼は言います。最終的に、彼はAmazonで、自身の制作活動に生成AIをどのように活用したいかを説明するプレゼンテーションを行いました。同社は彼を支援してくれました。

「できる限りのことは実際に撮影します。それでも何百人もの人員が必要です」とアーウィンは言う。「でも、同じジャンルの大型作品の3分の1程度の予算で、2倍のスピードで撮影できます」。『ハウス・オブ・ダビデ』の燃える森のシーンは、実写効果では費用がかかりすぎるため、観客が見たものをAIで再現したと彼は言う。

アーウィン氏は、Stabilityのチームと話し合ったものの、「大規模な番組制作では彼らのツールをうまく活用できていない」と述べています。このコメントは、私が取材で発見したテーマを反映しています。Stabilityのテキスト画像生成ツールを実際に使ってみたことを認める映画制作者は何人かいましたが、少なくとも今のところは、プロとしてそのツールを使用している人はいませんでした。

AI によって生成された画像が含まれます。

スタビリティAI提供

スタジオがAI導入を認めることに対するタブーは、徐々に緩和されつつあるようだ。7月、Netflixの共同CEOテッド・サランドスは投資家に対し、同社がオリジナルシリーズの一つに「AIによる最終映像」の使用を初めて許可したと発表。この決定により制作スピードが10倍に加速し、コストも劇的に削減されたとサランドスは述べた。「AIは、クリエイターが映画やシリーズをより良く、コスト削減するだけでなく、より優れた作品にするための素晴らしい機会を提供すると確信しています」とサランドスは述べた。

スタビリティ社の最高技術責任者、ハンノ・バッセ氏が、ロサンゼルスにある自宅の裏庭の写真を見せてくれた。高い生垣に囲まれた芝生、出窓に群がるバラの茂み、そして左端の隅に木が一本。すると突然、2D画像が3Dに展開する。AI生成モデルが奥行き(生垣からバラの茂みまでの距離、木から窓までの距離)やその他の欠落要素を推定し、画像の隙間を埋めることで、臨場感あふれるシーンを実現している。バッセ氏はドロップダウンメニューからズームイン/ズームアウト、パンアップ/パンダウン、スパイラルなどを選択することで、カメラの動きを再現できる。

「仮想環境を構築して撮影をリハーサルするのに何時間も、何日も、何週間も費やす代わりに、ここでの考え方は、実際には 1 枚の画像を撮影してコンセプトを生成するというものです」と Basse 氏は言います。

AI によって生成された画像が含まれます。

スタビリティAI提供

Stability社のチーフパイプラインアーキテクト、ロブ・レガート氏は満足げな様子だ。『ウルフ・オブ・ウォールストリート』や『アバター』を手がけたベテランVFXスペシャリストであるレガート氏は、3月に同社に入社した。映画の撮影前夜は午前2時まで起きていたが、今回の会議には会社の幹部とベータテスターの両方の役割を担うために出席した。

レガート氏によると、唯一の問題はドロップダウンメニューだという。「おそらく、ドロップダウンメニューを統合してスライダーにしたいと思うでしょう」と彼は言う。

AI によって生成された画像が含まれます。

スタビリティAI提供

Stability AIの製品はまだ初期段階です。レガート氏でさえ、私たちが検討している仮想カメラツールのバージョンがプロが使えるようになるまでには、まだ長い道のりがあることを認めています。「残念ながら、私の仕事は最初から批判的になることです」と彼は言います。

会話はロトスコープの話に移った。レガート氏によると、アーティストがシーンをフレームごとにスケッチしていくこのプロセスは、かつては何百時間もかかり、初心者のアニメーターだけが行うものだったという。今ではAIが自動的に画像の一部を切り出し、視覚効果を加えることができる。「子供にロトスコープをやらせたいとは思わないでしょう」と彼は言った。

このコメントは楽観的に聞こえるかもしれないが、AIがハリウッドにどのような影響を与えるかという、差し迫った懸念に言及している。つまり、AI技術が広範囲にわたる雇用喪失につながるのではないかという懸念だ。

「VFX会社のアーティストたちが『もう代わりはされたくない』と言っているのをよく聞きます。もちろん、あなたたちだって代わりはされたくないでしょう!」とキャメロンは言う。「もし仕事を失うなら、仕事が枯渇するからではなく、次世代AIモデルに押しのけられて職を失うからでしょう。」アカラジュ氏とパーカー氏も述べているように、映画の制作費が安くなれば、より多くの映画が作られ、全体的な雇用が増加するという考え方だ。

この点について追及されると、アッカラジュ氏はより詳細な比喩を再び用いた。「あらゆる大きな変革や技術革新は、最初は必ず不安を伴いますが、やがて受け入れられ、そして最終的には当たり前のものになります」と彼は言う。「80年代にATMが導入されたとき、窓口係は皆、本当に憤慨しました。『それが私たちの仕事です。私たちは引き出しをし、預金を受け付けます。それを今度は機械にやらせているんです』と彼らは言ったのです。それ以来、窓口係の仕事はかつてないほど増え、インフレ調整後でも平均賃金は上昇しています。」

レディー・ガガの温室で始まったクーデターが最終的にスタビリティAIを救うかどうかはさておき、AI革命はすでに到来し、ハリウッドを変革しつつある。あの崩壊するビル、あの燃え盛る森、ストリーミング配信や映画館で目にするあの群衆?キーボードを持った一人の人間が作ったものかもしれない。銀行窓口係の逸話で注目すべきは、スタビリティAIの投資家であるエリック・シュミット氏をはじめとするテクノロジー楽観主義者たちがよく使うことだ。彼らが言及していないのは、銀行窓口係の数は2015年頃にピークを迎え、それ以降は減少傾向にあるということだ。

更新:2025年8月20日午後4時45分(東部夏時間):WIREDはジョン・アーウィン氏の名前のスペルを訂正しました。また、WIREDはStability AIのトレーニングデータと投資家に関する詳細を明らかにし、Stable Diffusion 1.5への言及を削除しました。


この記事についてのご意見をお聞かせください。 [email protected]までお手紙をお送りください。

ゾーイ・シファーはWIREDでビジネスとシリコンバレーの取材を担当しています。以前はPlatformerの編集長、The Vergeのシニアレポーターを務めていました。…続きを読む

続きを読む