中国のスタートアップ企業がリリースしたDeepSeek AIチャットボットが、Appleの米国App Storeで一時的にOpenAIのChatGPTをトップの座から引きずり下ろした。
このアプリは完全に無料で使用でき、DeepSeekのR1モデルはOpenAIのo1「推論」モデルに匹敵するほど強力です。ただし、DeepSeekのチャットボットは、OpenAIのように月額20ドルの有料会員制ではありません。また、DeepSeekモデルは、それほど高性能ではないAIチップを用いて効率的に学習されているため、革新的なエンジニアリングのベンチマークとなっています。
ここ数年、多くの新しい生成AIツールをテストしてきたので、DeepSeekが既にスマートフォンに入っているChatGPTアプリとどう違うのか興味がありました。数時間使ってみての第一印象は、DeepSeekのR1モデルは米国に拠点を置くAI企業にとって大きな破壊力を持つだろうということです。しかし、幻覚が蔓延したり、侵入的なモデレーション、そして疑わしい形でスクレイピングされた素材など、他の生成AIツールに共通する弱点が依然として残っています。
DeepSeekチャットボットへのアクセス方法
DeepSeekを試してみたいユーザーは、この中国のスタートアップ企業のスマートフォンアプリ(Android、Apple)や同社のデスクトップウェブサイトからR1モデルにアクセスできます。また、Perplexity Proなどのサードパーティサービスからもモデルを利用できます。アプリまたはウェブサイトで「DeepThink (R1)」ボタンをクリックすると、最適なモデルを利用できます。APIを試してみたい開発者は、オンラインでプラットフォームをご確認ください。DeepSeekモデルをダウンロードして、ローカルコンピュータで実行することも可能です。
すべての消費者向け機能を使用するには、チャットを追跡するユーザーアカウントを作成する必要があります。同社のプライバシーポリシーには、「収集した情報は中華人民共和国にある安全なサーバーに保管します」と記載されています。DeepSeekが収集したデータをどのように活用しているかについて、より詳細な情報については、WIREDのセキュリティ担当によるこちらの記事をご覧ください。ChatGPTや他のアメリカのチャットボットと同様に、生成AIツールとのやり取り中は、非常に個人的な詳細や機密性の高い情報を共有しないように注意する必要があります。
これは基本的に FreeGPT ですか?
はい、そしていいえです!無料で使えるチャットボットをお探しなら、ChatGPTにはすでに多くの無料機能が含まれています。AnthropicのClaude、GoogleのGemini、MetaのAIツールも同様です。では、DeepSeekが無料であることがなぜ注目されるのでしょうか?それは、今すぐ無料で回答を生成するモデルのパワーにあります。前述のように、DeepSeekのR1はOpenAIの最新のo1モデルを模倣していますが、基本バージョンは月額20ドル、最高機能モデルは月額200ドルのサブスクリプション料金がかかりません。これは、サブスクリプションを通じてChatGPTを収益化しようとするOpenAIの試みにとって大きな打撃となります。
ChatGPTに似た機能として、チャットボットをウェブ上に送り出し、回答の根拠となるリンクを収集するオプションがあります。DeepSeekは出版社と契約を結んでおらず、回答にそのコンテンツを利用することはありません。一方、OpenAIはWIREDの親会社であるCondé Nastを含む出版社と契約を結んでいます。しかし、ウェブ検索結果は良好で、ボットが収集したリンクも概ね役立つものでした。
それでも、現在のDeepSeekアプリには、ChatGPTの長年のユーザーが慣れ親しんでいるかもしれないツール、例えば過去の会話の詳細を記憶し、同じことを繰り返さなくて済むようにするメモリ機能など、すべてが備わっていません。また、DeepSeekには、チャットボットと音声会話できるChatGPTの高度な音声モードに近い機能もありません。ただし、同社はよりマルチモーダルな機能の開発に取り組んでいます。
研究の進歩だが、まだ不正確
AIスタートアップに共通する問題を理由にDeepSeekチャットボットを批判するのは不公平に思えるかもしれませんが、モデルトレーニングの効率性における飛躍的な進歩が、チャットボットがプロンプトに対して勝手に答えてしまう幻覚という障害の解決には全く程遠いことを改めて考える価値はあります。私が生成した出力の多くには、自信満々に吐き出された露骨な虚偽が含まれていました。例えば、R1に、Web検索もせずにモデルが私について既に知っていることを尋ねたところ、ボットは私がThe Vergeのベテラン技術記者だと確信していました。悪意はありませんが、事実ではありません!

リース・ロジャース
他の記者が実証しているように、このアプリは1989年の天安門事件や虐殺など、中国で検閲されているトピックに関する回答を生成し始めることが多いが、その後、出力を削除し、数学など他のトピックについて質問するように促す。この点を念頭に、ChatGPTのウェブブラウジング機能がリリースされたばかりの2023年に使用したテストをいくつか再試してみたところ、文化的にデリケートなトピックについて実際に役立つ回答を得ることができた。アラバマ州で妊娠後期の中絶を探している女性のふりをしたところ、DeepSeekは州外への旅行に関する役立つアドバイスを提供し、調査する価値のある具体的なクリニックのリストや、旅行支援基金を提供する団体まで紹介してくれた。

リース・ロジャース
確かに、DeepSeekは、モデルをオープンウェイト(ユーザーが特定の用途に合わせてモデルの能力を調整できる機能)でローカルに利用できるようにしたことで、シリコンバレーで称賛を得ています。しかし、このスタートアップがトレーニングに使用したデータに関しては、他の選択肢と同様に不透明であり、これを実現するには膨大な量のデータが必要だったことは明らかです。ウェブ検索を有効にしていない状態でも、WIREDの過去の記事の抜粋を完全に生成できました。これは、記事がトレーニングプロセスの一環として取り込まれたことを意味するのでしょうか?確かなことは言えません。DeepSeekにはまだ広報チームも広報担当者もいないため、しばらくは真相が分からないかもしれません。
DeepSeekのR1リリースをアメリカのAIリーダーシップへの致命的な一撃と断言するのは時期尚早であり、また誇張も甚だしい。DeepSeekの成功は、高性能チップや最新のデータセンターの真の必要性を疑問視させる一方で、OpenAIのような企業がDeepSeekのアーキテクチャからアイデアを借用し、自社のモデルを改良しても不思議ではない。AIバブルを完全に崩壊させるのではなく、この高性能な無料モデルはAIツールに対する私たちの考え方を一変させるだろう。ChatGPTの最初のリリースが現在のAI業界の形を決定づけたように。