DeepSeekがOpenAIを激怒させた

DeepSeekがOpenAIを激怒させた

DeepSeekがAIの世界を揺るがしてから、わずか1週間余りが経った。同社のオープンウェイトモデル(業界リーダーが採用する専用コンピューティングチップの一部で学習させたとみられる)の導入は、OpenAI社内に衝撃波を巻き起こした。従業員たちは、DeepSeekがOpenAIのモデルを「不適切に抽出」して独自のモデルを作成した兆候を見たと主張しただけでなく、このスタートアップの成功は、OpenAIのような企業がコンピューティングに過剰な投資をしているのではないかとウォール街に疑問を抱かせた。

「DeepSeek R1はAIのスプートニクの瞬間だ」と、シリコンバレーの最も影響力があり挑発的な発明家の一人であるマーク・アンドリーセンはXに書いた。

これを受けて、OpenAIは当初の予定より前倒しで本日、新モデルのリリース準備を進めています。このモデル「o3-mini」は、APIとチャットの両方でデビューします。情報筋によると、このモデルはo1レベルの推論能力と40レベルの速度を備えています。つまり、高速、安価、スマートで、DeepSeekを圧倒するように設計されています。(OpenAIの広報担当者Niko Felix氏によると、o3-miniの開発はDeepSeekのデビューよりずっと前から開始されており、1月末のリリースを目指していたとのことです。)

この出来事はOpenAIのスタッフを奮い立たせた。社内では、特にDeepSeekが話題の中心となっている今、OpenAIはより効率化を進めなければ、新たな競合相手に遅れをとるリスクがあるという意識が高まっている。

この問題の一部は、OpenAIが営利企業となる以前は非営利研究組織だったことに起因しています。従業員によると、研究グループと製品グループの間で続く権力闘争が、高度な推論に取り組むチームとチャットに取り組むチームの間に亀裂を生じさせているとのことです。(OpenAIの広報担当者ニコ・フェリックス氏は、これは「誤り」であり、これらのチームのリーダーである最高製品責任者のケビン・ワイル氏と最高研究責任者のマーク・チェン氏は「毎週会合を開き、製品と研究の優先順位を一致させるために緊密に連携している」と述べています。)

OpenAI内部には、同社が統合チャット製品、つまり質問に高度な推論が必要かどうかを判断できる単一のモデルを構築することを望んでいる人もいる。しかし、今のところそれは実現していない。代わりに、ChatGPTのドロップダウンメニューで、ユーザーはGPT-4o(「ほとんどの質問に最適」)とo1(「高度な推論を使用」)のどちらを使用するかを選択できる。

一部のスタッフは、チャットがOpenAIの収益の大部分を占めている一方で、経営陣はo1に多くの注目とコンピューティングリソースを割いていると主張している。「経営陣はチャットのことなど気にしていない」と、チャットに携わっていた元従業員は語る。「誰もがo1に取り組みたがります。魅力的だからです。しかし、コードベースは実験用に構築されていないため、勢いがないのです」。この元従業員は、秘密保持契約を理由に匿名を条件に語った。

OpenAIは強化学習の実験に何年も費やし、最終的にo1と呼ばれる高度な推論システムへと発展したモデルを微調整した。(強化学習とは、ペナルティと報酬のシステムを用いてAIモデルを訓練するプロセスである。)DeepSeekは、OpenAIが先駆的に進めた強化学習の研究を基に、R1と呼ばれる高度な推論システムを構築した。「言語モデルに適用された強化学習が効果的であることを知っていたことが、DeepSeekの成功につながった」と、OpenAIの元研究者は述べている。この研究者は、同社について公に発言する権限はない。

「[DeepSeekが行った]強化学習は、私たちがOpenAIで行ったことと似ています」と、別の元OpenAI研究者は言う。「ただし、彼らはより優れたデータとよりクリーンなスタックを使ってそれを行いました。」

OpenAIの従業員によると、o1の研究は速度重視で構築された「ベリー」スタックと呼ばれるコードベースで行われたという。「実験の厳密さとスループットの間にトレードオフがあった」と、状況を直接知る元従業員は語る。

コードベースの制限はさておき、本質的に大規模な実験であったo1では、こうしたトレードオフは理にかなったものでした。しかし、何百万人ものユーザーが利用する製品であり、より信頼性の高い別のスタック上に構築されたチャットでは、それほど理にかなっていませんでした。o1がリリースされ、製品化されたとき、OpenAIの社内プロセスに亀裂が生じ始めました。「『なぜ実験的なコードベースでこんなことをするんだ?メインの製品研究コードベースでやるべきじゃないのか?』という感じでした」と、ある従業員は説明します。「社内では大きな反発がありました。」

同社は昨年、社内で「プロジェクト・スプートニク」を発表した。これは、コードを調べて、どの部分を統合し、どの部分を個別に残すかを判断する取り組みである。

従業員たちは、プロジェクトが完全に実現されなかったと考えています。スタックを統合するのではなく、「ベリー」スタックの使用を優先するように促されたため、チャット開発に携わる一部の従業員が憤慨しました。OpenAIの広報担当者はこれを否定し、プロジェクト・スプートニクは成功裏に展開されたと述べています。

情報筋によると、コードベースに関する認識された問題は具体的な影響を及ぼしたという。理想的には、従業員がトレーニングジョブを開始すると、そのジョブに使用されているGPUは他の誰かが使用できるように解放される。しかし、ベリーコードベースの構造上、必ずしもそうはならない。「従業員はGPUを占有するだけだった」と、ある元従業員は語る。「行き詰まり状態だった」

OpenAI以外では、DeepSeekの成功をどう解釈するかで業界内で意見が分かれている。今週初め、投資家がAI開発に必要なチップの数を業界が過大評価しているのではないかと懸念したことから、Nvidiaの株価は急落した。

しかし、専門家は、その解釈は近視眼的だと指摘する。DeepSeekが主張するように、モデル開発をより効率的に行う方法を発見すれば、モデル開発プロセスは加速するかもしれないが、最終的に勝利するのは、やはり最も多くのチップを持つ企業となるだろう。

「知能ユニットあたりの計算量は確かに少なくて済むが、さらにスケールアップするにはさらに多くのユニットが必要になるだろう」と、AI政策の独立研究者で、OpenAIで6年間勤務し、最近ではAGI準備担当のシニアアドバイザーを務めたマイルズ・ブランデージ氏は言う。

OpenAIの華々しい新インフラプロジェクト「Stargate」は、社内の人材不足感を和らげるかもしれない。テキサス州アビリーンにStargate初のデータセンターを建設するCrusoe社は、広報担当アンドリュー・シュミット氏によると、すでに99万8000平方フィート(約9万8000平方メートル)の施設の建設に着工しているという。

プロジェクトの詳細は不明ですが、より多くのデータセンター、チップ製造、スーパーコンピューターを包含する規模に拡大する可能性があると聞いています。OpenAIは、少なくとも理論上は、このプロジェクトを率いる新しいCEOを任命する予定です。

現CEOのサム・アルトマン氏は「将来何が起こるかを約束するのは得意だ。だが、実際にそうなると、その約束は全く当てにならない」と、別の元スタッフは語る。

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

タイムトラベル

2023年、スティーブン・レヴィは、OpenAIが数々の騒動を起こし、大きく報道される前の数ヶ月間、社内の状況を詳細に分析しました。当時から既に、現在沸き起こっているような緊張関係は明らかでした。

OpenAIをカルトと呼ぶのはフェアではないが、AGIの到来が本当に来ると信じていない人、そしてその到来が人類史上最も偉大な瞬間の一つとなると信じていない人でも、安心してそこで働けるかと同社幹部数人に尋ねたところ、ほとんどの幹部はそうは思わなかった。「なぜ信じていない人がここで働きたいと思うのか?」と彼らは疑問に思った。従業員数(現在約500人だが、この記事を読み始めた頃から増えているかもしれない)は、自ら信奉者だけを選抜しているという推測だ。少なくとも、アルトマン氏が言うように、一度採用されれば、その魔法に引き込まれるのは避けられないようだ。

同時に、OpenAIはかつての姿とはかけ離れている。純粋に非営利の研究機関として設立されたが、現在では従業員の大半は、時価総額が約300億ドルと報じられる営利企業で働いている。アルトマン氏と彼のチームは今、投資家の商業的要求を満たし、熾烈な競争の中で優位性を保ちながら、あらゆる製品サイクルで革命を起こさなければならないというプレッシャーに直面している。しかも、人類を絶滅させるのではなく、人類を高めるという、いわばメシア的な使命を貫いているのだ。

こうしたプレッシャー、そして全世界からの容赦ない注目は、人を衰弱させる力となり得る。ビートルズは文化に大きな変革の波を起こしたが、その革命を支えられたのは長くは続かなかった。あの忘れられないコードを鳴らしてから6年後には、彼らはもはやバンドですらなかったのだ。OpenAIが巻き起こした大混乱は、間違いなくはるかに大きなものとなるだろう。しかし、OpenAIのリーダーたちは、この道を歩み続けると誓っている。彼らが望むのは、歴史に終止符を打ち、人類を想像を絶する豊かさの時代へと導くほど賢く、安全なコンピューターを作ることだけだと彼らは言う。

終末クロニクル

水曜日の夕方、ワシントンDCで旅客機が軍用ヘリコプターに衝突した。

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

最後になりましたが、重要なことです

DeepSeek はコア データベースを公開したため、ユーザー プロンプトや API 認証トークンを含む 100 万件のレコードが漏洩しました。

イーロン・マスク氏は友人に対し、ホワイトハウス近くのDOGEオフィスで寝泊まりしていると語った。

そして、驚くことではないが、イーロン・マスクの手下たちがすでに米国人事管理局を乗っ取り始めている。

画像にはロゴ、シンボル、商標、テキスト、ラベルが含まれている場合があります

2025 年 1 月 31 日 11:32 (東部標準時) 更新: このストーリーは、o3-mini のタイミングに関する OpenAI からの追加コメントを含めるように更新されました。