AI チャットボットは英語以外の言語にはあまり堪能ではなく、世界的な商取引とイノベーションにおける既存の偏見を増幅させる恐れがあります。

イラスト:イスラエル・セバスチャン/ゲッティイメージズ
コンピューター科学者のパスカル・ファン氏は、ChatGPTのような多言語AIヘルパーが言語の壁を乗り越えるバラ色の未来を思い描いている。その世界では、方言しか話せないインドネシアの店主が、英語で商品をオンラインに掲載することで、新規の顧客を獲得できるかもしれない。「それはビジネスチャンスを広げるでしょう」とファン氏は言い、そして少し間を置く。彼女は、より相互につながった未来という自身のビジョンの中に、偏りがあることに気づいた。AI支援によるショッピングは一方的なものになるだろう。なぜなら、インドネシア語で広告されている商品を調べるのにAI翻訳を使うアメリカ人はほとんどいないからだ。「アメリカ人には別の言語を学ぶインセンティブがないのです」と彼女は言う。
すべてのアメリカ人がこの説明に当てはまるわけではない。約5人に1人は自宅で英語以外の言語を話す。しかし、世界の商業において英語が優位に立っているのは事実だ。香港科技大学AI研究センター所長で、自身も7か国語を話すフォン氏は、自身の分野にもこの偏りを感じている。「英語で論文を発表しないと、社会に出ていけないと思われてしまいます」と彼女は言う。「英語を話さない人は、仕事で不利な扱いを受ける傾向があります」
ファン氏は、AIが英語優位性をさらに強化するのではなく、この状況を変えることを望んでいる。彼女は、ChatGPTとその競合チャットボットの言語能力をテストし、英語以外の言語ではそれらの能力が著しく劣っているという証拠に警鐘を鳴らす、AI研究者の世界的なコミュニティの一員である。
研究者たちはいくつかの潜在的な解決策を特定しているものの、主に英語を話すチャットボットは蔓延している。「私の最大の懸念の一つは、英語と英語話者への偏見を悪化させてしまうことです」と、偏向したチャットボットへの反対運動にも参加しているオレゴン大学のコンピューター科学者、ティエン・ヒュー・グエン氏は述べている。「人々は規範に従い、自分自身のアイデンティティや文化について考えなくなるでしょう。これは多様性を殺し、イノベーションを阻害するのです。」
今年、プレプリントサーバーarXiv.orgに投稿された少なくとも15件の研究論文(グエン氏とファン氏の共著者による研究を含む)は、ChatGPTなどの体験を支えるAIソフトウェアの一種である大規模言語モデルの多言語性について調査しています。研究手法は様々ですが、結果は概ね一致しています。AIシステムは他言語を英語に翻訳するのは得意ですが、英語を他言語、特に韓国語のようにラテン文字以外の文字を持つ言語に書き換えるのは困難です。
AIが超人的になるという最近の議論にもかかわらず、ChatGPTのようなシステムは、
世界中の何十億もの人々が毎日何気なく行っているように、同じ発話の中で複数の言語(例えば英語とタミル語)を流暢に混ぜ合わせることにも苦労しています。グエン氏の研究によると、3月に行われたChatGPTのテストでは、事実に関する質問に答えたり、英語以外の言語で複雑な文章を要約したりする際のパフォーマンスが大幅に低下し、情報を捏造する傾向が強かったことが報告されています。「これは英語の文なので、ベトナム語に翻訳することはできません」とボットはある質問に対して不正確な回答をしました。
テクノロジーの限界にもかかわらず、世界中の労働者はビジネスアイデアの考案、社内メールの作成、ソフトウェアコードの修正などにおいて、チャットボットを活用しています。これらのツールが英語で最も効果的に機能し続けるとすれば、グローバル経済で地位を確立したい人々にとって、英語学習へのプレッシャーがさらに高まる可能性があります。そうなれば、大英帝国に端を発する英語の押し付けと影響力の悪循環がさらに悪化する恐れがあります。
懸念を抱いているのはAI研究者だけではない。今月行われた米国議会公聴会で、カリフォルニア州選出のアレックス・パディラ上院議員は、ChatGPTの開発元であるカリフォルニア州に拠点を置くOpenAIのCEO、サム・アルトマン氏に、言語格差を埋めるために同社がどのような取り組みを行っているかを尋ねた。カリフォルニア州民の約44%は英語以外の言語を話す。アルトマン氏は、ChatGPTの言語スキルを強化し、その恩恵を「可能な限り幅広い層」に広げるためのデータセットを取得するために、政府やその他の組織と提携したいと述べた。
スペイン語も話すパディーヤ氏は、開発者の戦略を大きく転換しなければ、システムが言語面で公平な成果をもたらすかどうかについて懐疑的だ。「これらの新しい技術は、情報へのアクセス、教育、そしてコミュニケーションの向上に大きな可能性を秘めています。言語がこれらの恩恵の障壁とならないようにしなければなりません」と彼は言う。
OpenAIは、自社のシステムに偏りがあるという事実を隠そうとはしていない。ChatGPTの有料ユーザーが利用できる、同社の最先端言語モデルであるGPT-4に関する同社の報告書には、基礎データの大部分が英語から取得されており、モデルの微調整と性能研究への取り組みは主に「米国中心の視点」で英語に焦点を当てていると記されている。また、昨年12月に同社のサポートフォーラムで、あるユーザーがOpenAIにChatGPTのスペイン語サポートを追加するかどうか尋ねたところ、スタッフが「スペイン語で良い結果が得られればボーナスです」とコメントした。OpenAIはこの件についてコメントを控えた。
ブラウン大学でコンピュータサイエンスの博士課程に在籍するジェシカ・フォード氏は、OpenAIがGPT-4の多言語対応能力をリリース前に徹底的に評価していないことを批判している。フォード氏は、企業がトレーニングデータを公開し、多言語対応の進捗状況を追跡することを望んでいる研究者の一人だ。「英語がこれほど定着しているのは、人々が『英語で弁護士や医師のように機能できるのか?英語でコメディを制作できるのか?』と問い続け、研究してきたからです。しかし、他の言語については同じことが問われていません」とフォード氏は言う。
大規模言語モデルは、インターネット、書籍、その他のリソースから収集された数十億語のテキストから学習した統計パターンを用いて単語を処理します。米国の経済的優位性と中国の膨大な人口のため、利用可能な資料の多くは英語と中国語で、他の言語よりも多くなっています。
テキストデータセットには他の言語も混在しているため、モデルは他の言語でも能力を発揮します。ただし、その知識は必ずしも包括的ではありません。ワシントンD.C.の民主主義技術センターの研究者が今月発表した論文で説明したように、英語が優勢であるため、「多言語モデルは、バスク語で鳩を意味する「 uso 」が侮辱的な意味を持つ可能性があるにもかかわらず、あらゆる言語で「dove」という単語を平和と関連付けてしまう可能性があります。」
アレイダ・ソリスさんは、GPT-4を基盤とするMicrosoftのBingチャットを試した際に、この弱点に遭遇しました。Bingのボットは、いくつかの英語圏の国でスニーカーの適切な口語表現(イギリスでは「trainers」、オーストラリアの一部では「joggers」)を提供しましたが、ラテンアメリカ全域の靴に関する現地語(スペインでは「Zapatillas deportivas」、ウルグアイでは「championes」)をスペイン語で尋ねたところ、地域に即した適切な表現を提供できませんでした。
別のダイアログで、英語で検索したところ、Bing チャットは、テレビ番組「ホワイト・ロータス」の次の舞台の噂の場所としてタイを正しく特定した が、検索クエリがスペイン語に翻訳されたときには「アジアのどこか」と表示された、と検索エンジンからのアクセスを増やすウェブサイトの支援をするオレインティというコンサルタント会社を経営するソリス氏は言う。
チャットボット開発に携わるマイクロソフト、OpenAI、グーグルの幹部らは、ユーザーは質問に詳細な指示を加えることで、質の低い回答に対処できると述べている。明確な指示がないと、チャットボットは英語の音声と英語圏の視点に頼ろうとする傾向が強くなる可能性がある。イタリアとアイルランドを行き来しながら活動する検索エンジン最適化(SEO)の専門家、ヴェルスカ・アンコニターノ氏に聞いてみれば分かる。彼女は、Bingのチャットでイタリア語で質問すると、「イタリア語で答えてください」と指定しない限り、英語で返答が返ってくることを発見した。別のチャットでは、アンコニターノ氏によると、Bingは彼女が日本語で会話を続けるのではなく、日本語の「元気ですか」という質問を英語に翻訳してほしいと想定していたという。
最近の研究論文は、Bingチャットなどの限界に陥った人々の事例研究結果を裏付けています。ブラウン大学で多言語モデルを研究している博士課程の学生、ジェン・シン・ヨン氏によると、彼と共同研究者は、ある研究で、中国語の質問に対してより良い回答を得るには、中国語ではなく英語で質問する必要があることを発見しました。
香港のフォン氏と共同研究者がChatGPTに30文を翻訳させようとしたところ、インドネシア語から英語への翻訳は28文を正しく翻訳できたものの、英語からインドネシア語への翻訳はわずか19文しか正しく翻訳できませんでした。これは、インドネシアの商店との取引にこのボットを利用する、母国語を母国語としないアメリカ人にとって、翻訳に苦労する可能性が高いことを示唆しています。同様の限定的な片方向の流暢さは、少なくとも5つの他の言語でも見られることが分かりました。
大規模言語モデルの言語的問題により、英語、そしておそらく中国語以上の言語を話す人にとっては、信頼するのは困難です。AIを使って結婚式の準備を加速させる実験の一環として、ChatGPTを使って古代サンスクリットの賛美歌を翻訳しようとした時、結果は式の台本に追加できるほど納得のいくものに思えました。しかし、そのモデルを信頼できるのか、それとも年長者たちに笑いものにされるのか、全く分かりませんでした。
WIREDの取材に応じた研究者たちは、確かに改善の兆しを感じている。グーグルが今月リリースした言語モデル「PaLM 2」の開発にあたり、同社は100以上の言語について英語以外の学習データを増やす努力をした。グーグルによると、このモデルはドイツ語とスワヒリ語の慣用句、日本語のジョークを認識し、インドネシア語の文法を整理する機能を備えており、以前のモデルよりも地域的な差異もより正確に認識できるという。
しかし、消費者向けサービスにおいては、GoogleはPaLM 2を限定的に扱っています。チャットボット「Bard」はPaLM 2を搭載していますが、アメリカ英語、日本語、韓国語でしか動作しません。PaLM 2を採用したGmailのライティングアシスタントも英語のみに対応しています。言語を正式にサポートするには、システムが有害なコンテンツを生成していないことを確認するためのテストやフィルターの適用など、時間がかかります。Googleは当初から多くの言語に対応させるために全面的な投資を行ったわけではありませんが、対応言語を急速に増やす取り組みは行っています。
研究者たちは言語モデルの欠陥を指摘するだけでなく、英語以外のテキストの新たなデータセットを作成し、真に多言語対応のモデル開発を加速させようとしています。Fung氏のグループはモデルの学習用にインドネシア語のデータをキュレーションしており、Yong氏の複数大学チームは東南アジアの言語について同様の作業を行っています。彼らは、アフリカの言語やラテンアメリカの方言を対象とするグループと同じ道を辿っています。
「私たちは、大手テック企業との関係を、敵対的ではなく協力的なものとして捉えたいのです」と、カリフォルニア大学バークレー校でテクノロジーとAIを専門とし、ヨン氏と共同研究を行っているスカイラー・ワン氏は語る。「共有できるリソースはたくさんあります。」
しかし、英語のテキストは膨大で、しかも増え続けているため、より多くのデータを収集するだけでは十分ではないだろう。文化的なニュアンスが失われるリスクはあるものの、一部の研究者は、企業は合成データを生成する必要があると考えている。例えば、限られたトレーニング教材で言語間の翻訳を橋渡しするために、中国語や英語などの中間言語を使用するなどだ。「ゼロから始めると、他の言語で十分なデータを得ることは決してできないでしょう」とオレゴン大学のグエン氏は言う。「科学的な問題について質問したいなら、英語で質問します。金融でも同じです。」
グエン氏はまた、AI開発者がモデルにどのようなデータセットを投入し、それが最終的な回答だけでなく、構築プロセスの各ステップにどのような影響を与えるかにもっと注意を払うようになることを期待している。グエン氏によると、これまでモデルにどの言語が採用されるかは「ランダムなプロセス」だったという。グエン氏によると、各言語のコンテンツが一定の基準に達するよう、より厳格な制御を行うことで(GoogleがPaLMで試みたように)、英語以外の言語の出力品質を向上させることができるだろう。
ファング氏は、ChatGPTや大規模言語モデルから生まれた他のツールを研究以外の目的で使うことを諦めた。それらのツールの発話は、彼女にとってあまりにも退屈に聞こえるからだ。基盤となる技術の設計上、チャットボットの発話は「インターネット上にあるものの平均値」だと彼女は言う。この計算は英語で最も効果的に機能し、他の言語での応答には面白みが欠けてしまうのだ。
あなたの受信箱に:毎日あなたのために厳選された最大のニュース

パレシュ・デイヴはWIREDのシニアライターで、大手テック企業の内部事情を取材しています。アプリやガジェットの開発方法やその影響について執筆するとともに、過小評価され、恵まれない人々の声を届けています。以前はロイター通信とロサンゼルス・タイムズの記者を務め、…続きを読む