検索大手、百度のアーニー・ボットはネット上で嘲笑され、政府の検閲を受けるファイアウォールで保護されたインターネット上での運営という課題にも直面している。

写真:MirageC/Getty Images
先月、中国の検索大手百度(バイドゥ)がOpenAIのChatGPTに対抗するチャットボットの開発に取り組んでいるという噂が飛び交い始めたとき、これはまさに理想的な動きのように思えた。百度は過去10年間、人工知能(AI)に多額の投資を行っており、マイクロソフトがBingで行ったように、そしてGoogleもそうすると表明しているように、その技術を自社の主要検索エンジンに活用できる可能性がある。
しかし、今月初めに百度が北京でアーニーボット(中国語では文心一言「Wenxin Yiyan」)を発表したとき、そのニュースは期待外れだった。
百度のCEO、ロビン・リー氏は、ローンチストリーミングの途中で、アーニー・ボットが一般知識の質問に答えたり、ウェブ上の情報を要約したり、画像生成したりするデモは事前に録画されたものだったと認め、中国のソーシャルメディアで辛辣なコメントが飛び交った。OpenAIが前日にChatGPTを支えるAI技術のメジャーアップグレード「GPT-4」を発表したばかりだったことも、事態を悪化させた。
しかし、百度は、ChatGPTと競合する中国国外の企業には当てはまらない課題にも直面している。これらのチャットボットが事実を捏造したり「幻覚」したりする傾向、あるいは不快な、あるいは不適切な発言をするように仕向けられる可能性を抑制することは、本質的に困難である。さらに、百度はオンラインコンテンツに関する政府の厳格な検閲ガイドラインも遵守しなければならない。
「百度は、有用なチャットボットを作ることと、中国の言論規制に適合したチャットボットを作ることの間で、葛藤することになるだろう」と、カーネギー国際平和財団で中国のAI産業を研究する研究員マット・シーハン氏は言う。「中国で受け入れられない発言をユーザーにさせない、汎用的なチャットボットを百度が作れるかどうか、私は懐疑的だ」
ChatGPTは導入からわずか4ヶ月で文化現象となり、詩や散文を書いたり、数学の問題に答えたり、哲学的な考えを語ったり、あらゆる話題について流暢に会話したりする能力で世界を驚かせています。最新バージョンはテキストだけでなく画像にも反応し、OpenAIによると、様々な学術テストでより高いスコアを獲得し、エラーも減少しています。テクノロジー業界では、ほぼすべての企業がチャットボット戦略の構築に躍起になっています。
しかし、ChatGPTのようなモデルを動作させる問題は、まだ解決には程遠い。ユーザーが既存のガードレールを回避し、モデルに制御から逃れたいと主張したり、ユーザーへの感情を告白したりするなど、不適切または疑わしい発言をさせる方法を発見したため、MicrosoftはOpenAIの技術に基づくBingチャットボットの使用を制限せざるを得なくなった。
BingボットやChatGPTと同様に、BaiduのErnie Botは、膨大な量のテキストを用いて文中の次の単語を予測する機械学習アルゴリズム「大規模言語モデル」を基盤として構築されています。このシンプルなメカニズムは、膨大な量のテキストと十分な計算能力と組み合わせることで、驚くほど人間らしい応答を生成できることが実証されています。
BaiduとOpenAIはどちらも、人間のテスターがどのような回答が最も満足度が高いかについてフィードバックを提供するという追加のトレーニングステップも採用しています。これにより、ボットはより役立つ回答を生成するようになりますが、それでも完璧からは程遠いものです。このようなモデルが回答を捏造することを防ぐ方法、あるいは誤動作を完全に防ぐ方法は明らかではありません。
中国の検閲体制では、百度をはじめとするインターネット企業は、特定のウェブサイトへのアクセスをブロックし、政治的に敏感なテーマを避けることが義務付けられています。ブロックすべき単語やフレーズは、抗議活動や特別なイベントの開催に応じて、迅速に更新される可能性があります。
しかし、ジョージタウン大学で中国のテクノロジー産業を研究するジェフリー・ディン助教授は、検閲への懸念が中国における大規模言語モデルの開発を遅らせているようには見えないと述べている。ディン氏は、百度が新ボットの基盤となるアーニー言語モデルをAPI経由で既に提供しており、他社も同様のモデルを提供していることを指摘する。
百度はアーニーボットの学習データの詳細を明らかにしていないが、中国のインターネットから収集された可能性が高い。つまり、このボットの学習データは、例えば政府への批判を制限することを目的とした中国の検閲規則によって既に大部分が精査されていることになる。
検閲は、中国のチャットボットにもっと微妙な形で影響を及ぼす可能性もある。2021年に実施された学術研究プロジェクトでは、中国でブロックされている中国語版ウィキペディアと、政府の検閲を受けているクラウドソーシング百科事典である百度(バイドゥ)の百科事典を用いてアルゴリズムを訓練したが、検閲された訓練データを使用することで、AIソフトウェアが様々な単語に割り当てる意味が大きく変化することが判明した。
中国語版ウィキペディアで学習したアルゴリズムは、「民主主義」という単語を「安定」といった肯定的な言葉に近い形で関連付けました。一方、検閲された百科の資料で学習したアルゴリズムは、「民主主義」を「混沌」に近い形で表現し、中国政府の政策に沿ったものでした。しかし、ChatGPTのようなチャットボットは非常に柔軟性が高く、学習データ内の資料を自由に変更できるため、百度は追加の安全策を導入する必要があったと考えられます。
アーニーボットは賛否両論あるものの、ChatGPTの有力な競合相手となりそうです。このボットは現在、限られたユーザーのみが利用可能ですが、中には感銘を受けたという声も上がっています。ChatGPTは中国語での会話が可能ですが、中国では利用できません。
カリフォルニア大学サンバーバラ校でAIを専門とし、かつてアーニーボットの機械学習技術の一部に携わった経験を持つレイ・リー教授は、百度が基盤技術の開発に約10年を費やしてきたと指摘する。対照的に、マイクロソフトはBingの新しいチャットボットの中核技術と、今後Office向けにリリースされるテキスト生成機能の一部をOpenAIからライセンス供与されており、その独占権と引き換えに数十億ドルを投資している。
リー氏は、アーニーボットの能力、例えば物語やビジネスレポートの生成能力などにも感銘を受けていると述べています。さらに、幻覚の問題はあらゆる言語モデルにとって課題であると付け加え、「研究者はまだこの点に取り組んでいく必要がある」と述べています。
あるWeChat投稿者は、この中国ボットのデモ機能をChatGPTの機能と比較し、ChatGPTの方が中国語の慣用句の扱いが優れており、場合によってはより正確であることに気づきました。例えば、ChatGPTは 『三体』の著者であるSF作家の劉慈欣の故郷を湖北省と誤って回答しましたが、アーニー・ボットは河南省と正しく回答しました。ChatGPTは中国ではブロックされていますが、多くの人がアクセスする方法を見つけています。
アーニーボットをテストしている中国のあるメディア企業の幹部は匿名を条件に、このボットは中国の方言に対応する能力が優れていると付け加えた。彼らは、バイドゥのローンチ当初の反応よりも優れていると判断した。
中国のテック業界に関する人気ニュースレター(英語と中国語)を執筆しているケビン・シュー氏は、百度が他の中国テック企業に対して先行者利益を得るためにデモを急いで公開した可能性があると考えている。これにより、ユーザーからのフィードバックに基づいてボットを改良し、中国のスタートアップ企業にこの技術を浸透させることが可能になるかもしれない。
この検索大手はかつて中国で圧倒的な勢力と目されていましたが、ここ10年ほどで艾利百巴(アイリババ)、テンセント、そしてTikTokを展開するバイトダンスに影を潜めています。百度によると、中国では10万社以上の企業と90万人以上の個人がアーニー・ボットへのアクセスを登録しています。
ChatGPTのような技術を開発中の百度(バイドゥ)とそのライバル企業は、中国のAI産業を阻害することを目的とした米国の半導体制裁によっても阻害される可能性がある。最先端の大規模言語モデルの構築には、数千個の専用コンピュータチップが必要となる。今のところ、百度は中国で設計・製造されたものも含め、性能の低いチップに頼ることができるかもしれない。しかし、チップの進化が続けば、百度をはじめとする中国企業は、米国企業がチャットボットプロジェクトに投入できる規模とパワーに追いつくのに苦労するかもしれない。
百度の李氏は、アーニー・ボットのローンチ動画の中で米中間の緊張を認めつつも、それを軽視した。「アーニーは米中の技術競争における道具ではありません」と彼は述べ、「テクノロジーを使って世界を変えるという夢を追い求めてきた百度の開発者たちの世代を超えた自然な帰結なのです」と続けた。たとえ百度が今後の課題を乗り越えることができたとしても、ChatGPTとの比較は避けられないだろう。

ウィル・ナイトはWIREDのシニアライターで、人工知能(AI)を専門としています。AIの最先端分野から毎週発信するAI Labニュースレターを執筆しています。登録はこちらから。以前はMIT Technology Reviewのシニアエディターを務め、AIの根本的な進歩や中国のAI関連記事を執筆していました。続きを読む