研究に重点を置いたエージェントは、より有能な新世代の AI モデルがどのようにして一部のオフィス タスクを自動化できるかを示しています。

写真イラスト:WIREDスタッフ/ゲッティイメージズ
OpenAIの研究者であるIsa Fulford氏は、Deep Researchがリリースされる前からヒットするだろうという予感を抱いていた。
フルフォード氏は、ウェブを自律的に探索し、クリックするリンク、読むべきリンク、そして詳細なレポートにまとめるべき内容を自ら判断する人工知能エージェントの開発に携わった。OpenAIは当初、Deep Researchを社内向けに公開していたが、ダウンするたびに、復旧を切望する同僚からの問い合わせが殺到したとフルフォード氏は語る。「ダイレクトメッセージを送ってくる人の多さに、私たちはとても興奮しました」とフルフォード氏は語る。
2 月 2 日に一般公開されて以来、Deep Research は社外の多くのユーザーからも好評を得ています。
「Deep Researchは今日までに6つのレポートを作成しました」と、StripeのCEOであるパトリック・コリソン氏は、製品リリースの数日後にXに投稿しました。「本当に素晴らしいです。開発に携わった皆さん、おめでとうございます。」
「ディープ・リサーチは、ワシントンの政策立案コミュニティーのかなりの部分の人々に対し、AGI の真価を実感させ始めた AI 製品です」と、AI 政策を専門とするジョージ・メイソン大学の研究員ディーン・ボール氏は書いている。
Deep Researchはすべての有料ChatGPTプランで利用可能ですが、ほとんどのユーザーは月間10クエリまでに制限されています(200ドルのChatGPT Proプランのユーザーは月間120クエリまで)。「マサチューセッツ州の医療保険業界に関するレポートを書いてください」や「WIREDによる政府効率化局に関する報道について教えてください」といったクエリを入力すると、関連するウェブサイトを検索し、そのコンテンツを精査し、クリックすべきリンクやさらに調査する価値のある情報などを判断しながら、プランを作成します。時には数十分にも及ぶ調査の後、調査結果を引用、データ、グラフなどを含む詳細なレポートにまとめます。
現在AIエージェントと称されるツールの多くは、本質的には単純なプログラムに接続されたチャットボットであり、それほど高度な機能はありません。Deep Researchモデル自体は、計画を立てて各ステップを進める前に、人工的な推論処理を行います。このモデルは、サイドウィンドウに研究の背後にある推論の詳細を表示します。
「『ちょっと戻ってみないと、あまり期待できないな』と思うこともあります」と、ディープ・リサーチの構築に携わるもう一人のOpenAI研究者、ジョシュ・トービンは言う。「モデルがどのように考えているのかを理解するだけでも、そうした軌跡の一部を読み取るのはとても面白いです。」
OpenAIは明らかに、Deep Researchをより多くのオフィス業務をこなせるツールとして捉えている。「これはスケールアップ可能なツールです」とトービン氏は述べ、このエージェントは特定のホワイトカラー業務をこなせるように訓練できると付け加えた。例えば、企業の内部データにアクセスできるエージェントは、レポートやプレゼンテーションを迅速に作成できるだろう。トービン氏によると、長期的な目標は「Web検索によるレポート作成だけでなく、他の多くの種類のタスクにも優れたエージェントを構築すること」だという。
ディープ・リサーチは人間が書いたテキストを解析・要約するように訓練されていたため、多くの人がディープ・リサーチを使ってコード生成をしていることにチームは驚いたとトビン氏は語る。「これは興味深いテーマです」と彼は言う。「私たちは、このテーマをどう解釈すればいいのか、まだ完全には分かっていません。」
しかし、トービン氏は、このツールには依然として重要な盲点があることを認めている。「信頼できる情報と噂を区別するのが難しいかもしれません」と彼は言う。「現状では、信頼性の調整に弱点があり、不確実性を正確に伝えることができていないことが多いのです。」
推論の時代
ペンシルバニア大学ウォートン校で企業におけるAI導入を研究するイーサン・モリック教授は、「ディープ・リサーチは、より高性能なAIモデルがホワイトカラー業務を自動化できる方法を示している」と語る。
Deep Researchを定期的に利用しているモリック氏は、このツールは完璧ではないものの、その効果は専門家によるチェックによって最も発揮されるものの、これまで話をした専門家たちは感銘を受けていると述べている。「上級レベルの人にとって、このツールが完璧であるとか、優秀な人材に勝っているということではありません」とモリック氏は言う。「重要なのは、中級レベルの作業なら40時間分もかかるのに、チェックにはたった1時間しかかからないということです」
企業がこうしたツールを従業員の能力強化と捉えるのか、それとも単に従業員を丸ごと置き換えるものと捉えるのかは、まだ分からない。「それが一番心配なことです」とモリック氏は言う。
高度なスキルを要する大量のオフィスワークを自動化できるツールを販売できるという見通しこそが、OpenAIが高度なエージェントを高額で提供することを検討している理由なのかもしれない。The Informationの最近の報道によると、同社は投資家に対し、「博士レベルの仕事」をこなせるエージェントは最終的には月額2万ドルになる可能性があると説明しているが、具体的な計画は依然として不明だ。OpenAIの広報担当者ケイラ・ウッド氏は、この報道を「単なる憶測」だと表現している。
「ディープ リサーチ」は、ホワイトカラーの仕事の変化を示唆するだけでなく、最先端の AI 研究が、問題を構成要素に分解してより適切に解析し解決するエージェントと、いわゆる推論モデルの両方にますます重点を置いていることを示しています。
OpenAIの主なライバル企業は、それぞれ独自の推論モデルに加え、Deep Researchに類似したツールも開発しています。Google DeepMindは、2024年12月10日にOpenAIのツールと同名のWebリサーチエージェントをリリースしました。イーロン・マスクのGrokも同様の機能を提供しています。
Deep Researchは現在最も洗練されたサービスであるように思われますが、これはOpenAIの最先端の推論モデルであるOpenAI o3をベースとしていることが一因です。従来の大規模言語モデルはクエリに応じてテキストを生成するだけですが、Deep Researchはシミュレートされた推論を用いて次に取るべき行動を決定します。このような「エージェント的」な能力はAIの次の進化段階として広く認識されていますが、モデルにミスなく行動を起こさせることは依然として困難です。
「ディープリサーチは、こうした推論モデルの自然な発展形です」と、カーネギーメロン大学のコンピュータ科学者で、ウェブエージェントの研究も行っているルスラン・サラクディノフ氏は述べています。しかしサラクディノフ氏は、AIエージェントはまだ初期段階にあり、エラーが発生しやすいため、今後多くの実験と革新が必要になるだろうと述べています。
OpenAIは、Deep Researchのトレーニングを支援するために、大学院生やその他の高度なスキルを持つ専門家を雇用しました。これらのユーザーはクエリを入力し、間違いを修正することで、強化学習アルゴリズムのトレーニングデータを提供し、モデルがより優れた研究アシスタントとなるための学習を可能にします。
WIREDはディープ・リサーチのトレーナー数名に話を聞いたが、彼らもこのツールに感銘を受けているようだった。「このツールが最初にやるのは、説明を求めることです。これは非常に大きなメリットです」と、ディープ・リサーチのトレーニングに協力しているローズハルマン工科大学の言語学者オルガ・シュリヴナーは言う。「まるでコミュニケーションツールのようで、突然、まるでアシスタントのようになってしまうんです」
「私の祖父は数学者です」と、カリフォルニア大学サンディエゴ校で微生物学を専攻し、ディープ・リサーチに学習データを提供してきたアレクサンダー・ザークル氏は語る。「祖父は、シュレーダー=バーンスタインの定理を証明してもらいたいと考えていました。それをディープ・リサーチに渡すと、非常に長い証明が返ってきました。私には全く理解できませんが、数学者である祖父にとっては非常に興味深い内容だったようです。」
Deep Research のようなツールが普及するにつれ、チャットボットのブームに伴う熱狂が薄れ始めても、Web を使用する人の数が変化し始める可能性があります。
OpenAIでアライメントの取り組みを主導するアメリア・グレーゼ氏は、チャットボットがどれほど賢くても、行動を起こしてテキストを生成するだけでなく、価値ある仕事をこなすモデルとなると話は別だと語る。「非常に大きな実用性を持つモデル、つまり研究に伴う手作業の一部を学習したモデルが生まれると、『わあ、これは本当に便利だ』と思う新しい人々が現れると思います」と彼女は言う。
Deep ResearchのようなAIエージェントについてどう思いますか?彼らにやってほしいタスクはありますか?ぜひ下のコメント欄で教えてください。
2025年3月20日午後2時28分更新:この記事は、Isa Fulford氏のファーストネームのスペルを修正し、すべての有料ChatGPTユーザーがDeep Researchにアクセスできることを明確化するために更新されました。
受信箱に届く:ウィル・ナイトのAIラボがAIの進歩を探る

ウィル・ナイトはWIREDのシニアライターで、人工知能(AI)を専門としています。AIの最先端分野から毎週発信するAI Labニュースレターを執筆しています。登録はこちらから。以前はMIT Technology Reviewのシニアエディターを務め、AIの根本的な進歩や中国のAI関連記事を執筆していました。続きを読む