TikTokをめぐる懸念が続く中、中国の生成AIプラットフォームDeepSeekは、大量の米国ユーザーデータを米国に直接送信していると発表しており、より厳しい監視の場となる可能性がある。

写真:アナドル/ゲッティイメージズ
中国系ソーシャル動画プラットフォーム「TikTok」に対する米国の最近の規制措置は、別の中国製アプリであるソーシャルプラットフォーム「Rednote」への大規模な移行を促した。現在、中国の開発会社DeepSeekが開発した生成型人工知能プラットフォームの人気が爆発的に高まっており、米国のAI優位性に潜在的な脅威をもたらしている。また、TikTok禁止のようなモラトリアム措置が、米国人が中国系デジタルサービスを利用することを阻止できないことを示す新たな証拠となっている。
中国の著名なヘッジファンドが設立したAI研究機関DeepSeekは、OpenAIが開発したような米国のトッププラットフォームと容易に競合できる最新のオープンソース生成AIモデルをリリースし、最近人気を博しました。しかし、ハードウェアとソフトウェアに対する米国の制裁を回避するため、DeepSeekはモデル構築時に巧妙な回避策を講じました。月曜日、DeepSeekの開発者は、アプリが「大規模な悪意のある攻撃」に見舞われたと主張し、新規登録を制限しました。
DeepSeekには複数のAIモデルがあり、その一部はダウンロードしてノートパソコンにローカルで実行できますが、ほとんどの人はiOSまたはAndroidアプリ、あるいはウェブチャットインターフェースを通じてサービスにアクセスするでしょう。他の生成AIモデルと同様に、質問をして回答を得たり、ウェブを検索したり、あるいは推論モデルを用いて回答を詳細化したりすることも可能です。
DeepSeek はまだ広報部門や報道担当者を設置していないようで、ユーザーデータの保護と、データプライバシーへの取り組みをどの程度優先しているかについて WIRED からのコメント要請には返答しなかった。
AIプラットフォームを試用したいという人々の声が高まるにつれ、この中国のスタートアップがどのようにユーザーデータを収集し、本国に送信しているかが注目されている。ユーザーからは既に、DeepSeekが中国やその政策に批判的なコンテンツを検閲した事例がいくつか報告されている。このAIシステムは、ユーザーのチャットメッセージを含む多くの情報を収集し、中国に送信しているようだ。多くの点で、ソーシャルメディア企業が米国のセキュリティ懸念を回避するために米国のクラウドホスティングに移行して以来、近年TikTokが中国に送信しているデータよりも多くのデータを中国に送信している可能性が高い。
「中国のAIにパニックに陥る必要はない。この業界のほとんどの企業が、ユーザーの個人データの利用条件を定めているのだ」と、トロント大学シチズン・ラボの上級研究員、ジョン・スコット=レールトン氏は言う。「そして、彼らのサービスを利用するということは、彼らに代わって仕事をしているということであり、その逆ではないのだ」
DeepSeekが収集する情報
明確に申し上げますが、DeepSeekはユーザーのデータを中国に送信しています。DeepSeekの英語版プライバシーポリシーは、同社がユーザーデータをどのように取り扱うかを規定しており、明確に「収集した情報は中華人民共和国にある安全なサーバーに保管します」と明記されています。
つまり、DeepSeekに送信されたすべての会話や質問、そしてDeepSeekが生成した回答は、中国に送信されているか、送信される可能性があります。DeepSeekのプライバシーポリシーには、DeepSeekが収集するユーザー情報の概要も記載されており、その情報は大きく3つのカテゴリーに分類されます。ユーザーがDeepSeekと共有する情報、DeepSeekが自動的に収集する情報、そしてDeepSeekが他のソースから取得する情報です。
最初の項目は「ユーザー入力」です。これは、DeepSeekのアプリやウェブサイトを通じたチャットも含まれる可能性が高い、広範なカテゴリーです。プライバシーポリシーには、「当社は、お客様が当社のモデルおよびサービスに提供したテキストまたは音声入力、プロンプト、アップロードされたファイル、フィードバック、チャット履歴、その他のコンテンツを収集する場合があります」と記載されています。DeepSeekの設定から、チャット履歴を削除できます。モバイルでは、左側のナビゲーションバーに移動し、メニュー下部のアカウント名をタップして設定を開き、「すべてのチャットを削除」をクリックしてください。
このデータ収集は、ユーザーの質問に答えるためにユーザーのプロンプトを取り入れる他の生成AIプラットフォームの取り組みと似ています。例えば、OpenAIのChatGPTはデータ収集に関して批判を受けていますが、同社は時間の経過とともにデータを削除する方法を増やしています。こうした保護策にもかかわらず、プライバシー擁護派は、AIチャットボットに機密情報や個人情報を開示すべきではないと強調しています。
「私は、そのようなAIアシスタントに個人情報やプライベートなデータは入力しません」と、キングス・カレッジ・ロンドンAI研究所所属の独立研究者兼コンサルタント、ルカス・オレニク氏は述べています。しかしオレニク氏は、DeepSeekのようなモデルをローカルにインストールして自分のコンピューターで実行すれば、データを作成した企業に渡すことなく、プライベートに操作できると指摘しています。さらに、AI検索企業Perplexityは、自社のプラットフォームにDeepSeekを追加したと発表していますが、モデルは米国とEUのデータセンターでホスティングしていると主張しています。
DeepSeekに送信されるその他の個人情報には、アカウント設定時に使用するメールアドレス、電話番号、生年月日、ユーザー名などが含まれます。同様に、DeepSeekに連絡を取った場合も、DeepSeekと情報を共有することになります。
ガートナーで国際プライバシー担当バイスプレジデントアナリストを務めるバート・ウィレムセン氏は、生成AIモデルの構築と運用は、一般的に消費者やその他のグループにとって透明性が低いと指摘する。人々は、その仕組みや、その基盤となっているデータを正確には知らない。DeepSeekは個人ユーザーにとってほぼ無料だが、APIを使用する開発者には料金が発生する。「では、私たちは何にお金を払うのでしょうか?通常、何にお金を払うのでしょうか?データ、知識、コンテンツ、情報です」とウィレムセン氏は言う。
ウェブサイトからアプリまで、あらゆるデジタルプラットフォームと同様に、サービスを利用する際に大量のデータが自動的に、そして気づかれずに収集される可能性があります。DeepSeekは、ユーザーが使用しているデバイス、オペレーティングシステム、IPアドレス、クラッシュレポートなどの情報を収集するとしています。また、「キーストロークのパターンやリズム」も記録します。これは、文字ベースの言語向けに構築されたソフトウェアで広く収集されるデータの一種です。さらに、DeepSeekのプレミアムサービスをご購入いただいた場合、プラットフォームはその情報を収集します。また、Cookieなどの追跡技術を使用して、「サービスの利用状況を測定・分析」します。
WIREDがDeepSeekウェブサイトの基盤となる活動を調査したところ、同社は中国のIT大手百度(バイドゥ)の人気ウェブ分析ツール「百度同済」や、中国のクラウドインフラ企業「Volces」にもデータを送信しているようだ。イェール大学ロースクールのプライバシーラボ創設者であるショーン・オブライエン氏はソーシャルメディアへの投稿で、DeepSeekは「基本的な」ネットワークデータと「デバイスプロファイル」をTikTokの親会社であるByteDanceとその仲介業者にも送信していると述べた。
DeepSeekが収集する権利を留保する最後のカテゴリーは、他のソースからのデータです。例えば、GoogleやAppleのサインオンを使用してDeepSeekアカウントを作成した場合、DeepSeekはこれらの企業から一部の情報を受け取ります。DeepSeekのポリシーによると、広告主もDeepSeekと情報を共有しており、これには「広告用のモバイル識別子、ハッシュ化されたメールアドレスと電話番号、Cookie識別子などが含まれます。これらは、サービス外でのユーザーとユーザーの行動を照合するために使用します」
DeepSeekの情報の利用方法
DeepSeekの国際的なユーザーベースから膨大な量のデータが中国に流入する可能性があるものの、同社は依然としてその情報の使用方法に関する権限を有しています。DeepSeekのプライバシーポリシーでは、同社はサービスの維持、利用規約の履行、改善など、多くの典型的な方法でデータを使用することが明記されています。
しかし重要なのは、同社のプライバシーポリシーが、新しいモデルの開発においてユーザーからの情報を活用する可能性があることを示唆していることです。同社は「デバイス間のインタラクションや利用状況の監視、ユーザーによるサービスの利用状況の分析、そして当社の技術のトレーニングと改善などを通じて、サービスを見直し、改善し、開発していく」とポリシーには記されています。
DeepSeekのプライバシーポリシーには、同社が「法的義務を遵守する」ためにも情報を利用すると明記されています。これは多くの企業がポリシーに盛り込んでいる包括的な条項です。DeepSeekのプライバシーポリシーでは、データは同社の「企業グループ」によってアクセス可能であり、必要に応じて法執行機関、公的機関などと情報を共有するとされています。
すべての企業には法的義務がありますが、中国に拠点を置く企業には特に重大な責任があります。過去10年間、中国政府はサイバーセキュリティとプライバシーに関する一連の法律を制定し、政府当局がテクノロジー企業にデータ提供を要求できるようにしてきました。例えば、2017年に制定された法律の一つでは、組織と国民は「国家情報活動に協力する」べきであると規定されています。
これらの法律に加え、米中間の貿易摩擦の激化やその他の地政学的要因も相まって、TikTokに対するセキュリティ上の懸念が高まっている。TikTok禁止を支持する人々は、このアプリは膨大なデータを収集して中国に送る可能性があり、中国のプロパガンダの推進にも利用される可能性があると主張している。(TikTokは米国ユーザーのデータを中国政府に送信したことを否定している。)一方、DeepSeekのユーザー数名は、このプラットフォームが1989年の天安門事件に関する質問に答えておらず、一部の質問への回答がプロパガンダのように聞こえると指摘している。
ウィレムセン氏は、TikTokのようなソーシャルメディアプラットフォームのユーザーと比較して、生成AIシステムとメッセージを送るユーザーはより積極的に関与し、コンテンツがよりパーソナルに感じられる傾向があると述べています。つまり、影響力が大きくなる可能性があるということです。「この論理に従えば、能動的な関与において、潜在的にコンテンツが改変されたり、会話の方向性が操作されたりするリスクは、懸念が減るどころか、むしろ増すはずです」と彼は言います。「特に、このモデルの内部の仕組みが広く知られておらず、その閾値、境界、制御、検閲ルール、そして意図/ペルソナがほとんど精査されていないこと、そして初期段階で既に非常に人気があることを考えると、なおさらです。」
キングス・カレッジ・ロンドンのオレニク氏は、TikTokの禁止は特殊な状況ではあったものの、米国や他の国の立法者が同様の前提で再び行動を起こす可能性があると述べている。「2025年にはAI企業に対する直接的な措置という形で、状況が拡大する可能性も排除できません」とオレニク氏は言う。「もちろん、データ収集が再び理由として挙げられる可能性はあります。」
2025 年 1 月 27 日午後 5 時 27 分 (EST) 更新: DeepSeek Web サイトのアクティビティに関する詳細を追加しました。
2025 年 1 月 29 日午前 10 時 5 分 (EST) 更新: DeepSeek のネットワーク アクティビティに関する詳細が追加されました。
受信箱に届く:ウィル・ナイトのAIラボがAIの進歩を探る

マット・バージェスはWIREDのシニアライターであり、欧州における情報セキュリティ、プライバシー、データ規制を専門としています。シェフィールド大学でジャーナリズムの学位を取得し、現在はロンドン在住です。ご意見・ご感想は[email protected]までお寄せください。…続きを読む

リリー・ヘイ・ニューマンは、WIREDのシニアライターとして、情報セキュリティ、デジタルプライバシー、ハッキングを専門としています。以前はSlate誌のテクノロジー記者を務め、その後、Slate誌、ニューアメリカ財団、アリゾナ州立大学の共同出資による出版物「Future Tense」のスタッフライターを務めました。彼女の著作は…続きを読む