遠い将来、人工知能が恩恵となるのか、それとも災いとなるのかは誰にも分かりません。しかし今、チャットボットやエージェントのある癖、つまり幻覚に対して、ほぼ普遍的な不快感と軽蔑が存在します。それは、ChatGPTのような大規模言語モデルの出力に現れる、作り話のような事実です。法学修士課程の学生は、一見すると理にかなっているように見えても、実際には全くの作り話を紛れ込ませることがあります。典型的なチャットボットは、失脚した元下院議員ジョージ・サントスをエイブラハム・リンカーンのように見せることができます。チャットボットが将来、これまでに書かれた散文の大部分を生成するようになるのは避けられないため、あらゆるAI企業は幻覚を最小限に抑え、排除すること、あるいは少なくとも問題は解決済みであると世界に納得させることに躍起になっています。
幻覚がゼロに近づくと、LLMの価値は明らかに新たなレベルに達するでしょう。しかし、そうなる前に、AIの作話に乾杯しましょう。
幻覚は、AI科学者たちがなぜ起こるのかかなりよくわかっているにもかかわらず、わたしの興味をそそるものです。AIスタートアップのVectaraは、幻覚とその蔓延を研究し、文書を要約するように求められたときのさまざまなモデルの幻覚率まで集計しました。(OpenAIのGPT-4が最も優れており、約3%しか幻覚を起こしません。Googleの今は時代遅れのPalm Chat(チャットボットのBardではありません!)は、衝撃的な27%の幻覚率でした。ただし、公平を期すために言うと、文書の要約はPalm Chatの得意分野ではありませんでした。)VectaraのCTO、アミン・アフマド氏によると、LLMは人工ニューロンに送られるすべてのトレーニングデータの圧縮表現を作成するとのことです。「圧縮の性質上、細かい詳細が失われることがあります」と彼は言います。モデルは、ユーザーからのクエリに対する最も可能性の高い回答で準備されますが、正確な事実は利用できません。「詳細に達すると、モデルは物事をでっち上げ始めます」と彼は言います。
ジョージア工科大学のコンピュータサイエンス教授、サントシュ・ヴェンパラ氏も幻覚を研究している。「言語モデルは世界の確率モデルに過ぎません」と彼は述べ、現実をありのままに映し出す鏡ではない。ヴェンパラ氏は、法学修士課程の解答は、訓練データに表される現実世界との一般的な一致を目指すものであり、これは「精度の弱いバージョン」だと説明する。OpenAIのアダム・カライ氏と共同で発表した彼の研究では、モデルの訓練データの情報では検証できない事実については、幻覚が避けられないことが明らかになった。
これがAI幻覚の科学/数学ですが、人間に引き起こす体験でも注目に値します。時として、こうした生成的な捏造は、しばしば驚くほど奇妙で満足のいくものではない実際の事実よりも、よりもっともらしく思えることがあります。あまりにも奇妙で、脚本家が映画で脚本化しようとは思わないようなことを、どれほど頻繁に耳にするでしょうか?最近では、しょっちゅうです!幻覚は、私たちが実際に生きている世界よりも違和感のない世界に私たちを誘導することで、私たちを魅了することがあります。さらに、ボットがどのような詳細をでっち上げる傾向があるかに注目することは、示唆に富むと思います。満足のいく物語の空白を埋めようと必死になるボットは、インターネット規模のトレーニングデータに表される、統計的に最も可能性の高い現実に引き寄せられますが、それ自体が真実である可能性もあります。私はこれを、実際の出来事に触発されて小説を執筆するフィクション作家に例えます。優れた作家は、実際に起こったことから、より深い真実を明らかにする想像上のシナリオへと方向転換し、現実よりもリアルなものを作ろうと努めます。
ChatGPTに私の死亡記事を書いてもらうよう依頼した時(認めましょう、あなたも同じことをしたことがあるでしょう)、多くの点は正しかったのですが、いくつか間違いもありました。私にはいない孫がいて、誕生日が早まり、1990年代後半のドットコムバブル崩壊について書いていない記事に対して、履歴書に全米雑誌賞が追加されました。法学修士課程による私の人生評価では、これは私のキャリアの事実に基づいて当然のことでした。同感です!アメリカ雑誌編集者協会がその栄誉に付随する金属製の象の彫刻を私に授与しなかったのは、現実生活の不完全さのせいだけです。50年近く雑誌記者として活動してきたのですから、それは彼らの責任であって、私の責任ではありません!まるでChatGPTが可能性のあるマルチバースの投票を行い、そのほとんどで私がエリー賞を獲得したことを発見したかのようです。もちろん、マルチバースの私の片隅で、人間の審査員が私を表彰台に呼んでくれた方が良かったでしょう。しかし、吸血鬼のような人工ニューラルネットからの認識は、何もないよりはましです。
AIの出力を事実の領域から切り離すことは、妥当な代替現実についての有益な視点を提供するだけでなく、生産的でもある。LLMは必ずしも人間のように考えるわけではないため、その統計的な空想は創造性を刺激する貴重なツールとなり得る。「だからこそ、アーティストたちは生成システムを積極的に探求し、必ずしも思いつかなかったアイデアを得ようとしているのです」と、Vectaraのアフマド氏は語る。AI開発者にとって最も重要な使命の一つは、人類が抱える難題の解決を支援することであり、それは表向きには人間の想像力の限界をはるかに超えるアイデアを生み出すことによって実現される。私が話を聞いた数人の研究者のうち、アフマド氏は、たとえアルゴリズムの誤りを大幅に排除する方法が見つかっても、依然としてそれらを残すべきだと考えている。「LLMは幻覚なしで何かを生み出すことができるはずですが、その後、幻覚を生み出してブレインストーミングを支援するモードに切り替えることも可能です」と彼は言う。ジョージア工科大学のベンパラ氏も同意見だ。「回せるノブがあるべきだ」と彼は言う。「車を運転したい時に、AIに道路上の状況を幻覚的に描写してほしくはないが、友人のために詩を書こうとしている時はそうであってほしい」
私が幻覚を高く評価するもう一つの大きな理由があります。今、幻覚の不正確さは、超知能AIとの共存への移行期において、人類に息抜きの場を与えてくれています。LLMが正しいと信じることはできないため、私たちは依然としてその事実確認作業を行わなければなりません。少なくとも、すべてをGPTに委ねるまでは、そうすることで私たちは現実と繋がることができます。
法律専門家を例に挙げましょう。法学修士(LLM)は信憑性のある弁論要旨を大量に作成できますが、その結果は悲惨なほど虚構になる可能性があります。有名な事件で、2人の弁護士が提出した弁論要旨には6つの判例が引用されていましたが、そのすべてがChatGPT(弁護士が作成を依頼した会社)によって完全に捏造されたものだったことが判明しました。裁判官は弁護士たちに制裁を与え、彼らは物笑いとなりました。その後、チャットボットを使って自分の主張を裏付ける判例を掘り起こし、その結果を再確認しないような弁護士は、全くの愚か者でしかありませんでした。実際、そのような人は存在するのです。マイケル・コーエンは現在、ドナルド・トランプのフィクサーとして服役しており、控訴しています。彼は弁護士たちに、Googleの法学修士(LLM)ベースのチャットボット「バード」が捏造した架空の判決書を提供し、逮捕されました。
しかし、コーエンは例外です。今のところ、弁護士は実際に判例を自ら明らかにすることが求められています。これは良いことです。AIが判例を正確に見つけ出し、説得力のある法的要約書を確実に生成できたらどうなるでしょうか。判例を完全に想起できれば、法学修士課程には数十の判例を含めることができます。弁護士は、関連性があると確信して、これらの判例を見ることさえせずに提出するでしょう。これらの判例がどのように適用されるかを検討するのは、哀れな裁判官次第です。当然、裁判官はAIに判例を要約させ、最終意見を起草するためにAIを使用することさえあるでしょう。最終的には、私たちの判例法はすべて、AIによって開始され、裁定される議論によって決定されるでしょう。人間は単なる傍観者になります。そして、実際の弁護士が行う仕事はほとんどありません。なんと、ChatGPT-4はすでに司法試験に合格できるのです!
正確さが求められる他の分野、つまりほぼすべての人間の職業にも同じことが当てはまります。法学修士号(LLM)を信頼できないからといって、人間がやるべき仕事が残っているわけではありません。幻覚は、私たち人間と大量失業との間にある一種の防火壁のようなものです。
幻覚を根絶できる日は来るのだろうか?科学者たちは異論を唱えている。「広い意味で答えはノーです」と、論文「較正モデルは幻覚を起こさなければならない」を発表したヴェンパラ氏は言う。一方、アフマド氏は実現可能だと考えている。「現在、研究コミュニティでは幻覚の問題に非常に注目が集まっており、あらゆる角度から取り組んでいます」と彼は言う。
一方、幻覚に囚われている以上、少なくともそれを尊重すべきです。確かに、法学修士課程の学生に特定の課題において事実に忠実であることの価値、ひいては必要性さえも理解しています。しかし、真の知識を培ってくれる情報源を軽視する自由を与えられたら、私たち人間がどれほど多くのことを見逃してしまうかを考えると、身震いします。そして、ホワイトカラー業務の大部分をロボットに委ねれば、数え切れないほどの仕事が失われることを嘆き悲しむでしょう。しかし、今のところAIは信頼できません。幻覚よ、乾杯!

タイムトラベル
私は少なくとも40年間人工知能について書いてきました。最初の著書『Hackers』でも取り上げましたが、2010年にWIREDでAI特集セクションの冒頭に書いたエッセイについては、ある程度の先見性があったと特別に主張できます。そのエッセイは「AI革命は始まった」というタイトルでした。(このエッセイの一部をタイムトラベルの他のエピソードに取り入れましたが、私の人間の読者はおそらく忘れていると思いますが、ChatGPTはおそらく忘れていないでしょう。)当時はSFのように聞こえたものが、今や現実です。
私たちは機械と永遠に踊らされ、ますます依存を深めている。しかし、ロボットの行動は人間の思考プロセスに基づいていないため、私たちはしばしばその行動を説明できない。科学者スティーブン・ウルフラムが作成したウェブサイト「Wolfram Alpha」は、多くの数学の問題を解くことができる。また、解答がどのように導き出されたかを示しているようにも見える。しかし、人間が目にする論理的な手順は、ウェブサイトが実際に行っている計算とは全く異なる。「Wolfram Alphaはそのような推論は一切行いません」とウルフラムは言う。「手順は全くの偽物です。私たちは、どうすれば世の中の人間に説明できるのかと考えました」
コンピューターは時として私たちの要求に応えなければ、私たちを怖がらせてしまう、ということが教訓となる。現在マイクロソフトのトップ研究者であるエリック・ホーヴィッツは、1980年代に病理学者の研究を支援するAIシステムの構築に携わった。このシステムは、それぞれの結果を分析し、次に行うべき検査を提案する。ただ一つ問題があった。答えを出すのが速すぎたのだ。「まるでコンピューターが息を切らして答えを出そうとしているかのように、点滅するライトの遅延ループを追加すると、人々はより信頼するようになった」とホーヴィッツは言う。
しかし、私たちは適応することを学ばなければなりません。AIは金融インフラのような一部のシステムにとって非常に重要であり、AIを排除することはHAL 9000のモジュールを単に切り離すよりもはるかに困難です。「ある意味では、SFのシナリオが既に起こり始めていると言えるでしょう」と、シンキング・マシーンズのヒリス氏は言います。「コンピューターが制御し、私たちは彼らの世界に生きているだけです。」ウルフラム氏は、AIが新たなタスクを担い、人間の理解をはるかに超えるようになるにつれて、この難問はさらに深刻化するだろうと述べています。「基盤となるアルゴリズムを規制するのですか?」と彼は問いかけます。「それはおかしなことです。なぜなら、ほとんどの場合、そのアルゴリズムがどのような結果をもたらすかは予見できないからです。」

一つだけ聞いてください
デレクは、「タイダイの T シャツやビルケンシュトック以外に、70 年代や 80 年代のシリコンバレーのテクノロジー界にあって、今は失われているものは何でしょうか?」と尋ねます。
デレク、質問ありがとうございます。70年代のシリコンバレーの記録を辿り、80年代には現場で時間を過ごした者として、ある程度の自信を持ってお答えできます。当時の大手企業、例えばヒューレット・パッカードやインテルなどは、製品が先駆的であったにもかかわらず、服装も企業文化もかなり保守的でした。しかし、あなたの質問が示唆するように、その原動力となったのは、パーソナルコンピュータとデジタル技術で世界に革命を起こそうという、カウンターカルチャー的な熱意でした。当時はあまり注目されていませんでしたが、ホームブリュー・コンピュータ・クラブは、Appleを含むPC業界を活性化させることで世界を変えました。クラブのメンバーの中には、まさに変人であり、中にはビルケンシュトックを履いている人もいました。
今日のテクノロジーのパイオニアたちも、同じようなオタク的な熱意は見られますが、カウンターカルチャーやその純粋な意図はそれほど見られません。結局のところ、アウトサイダーは今やインサイダーなのです。今日のテクノロジストたちは依然として「ビルド、ビルド、ビルド」というスローガンを掲げていますが、Yコンビネーターのアドバイザーから聞くのと同じくらい、ライフコーチからも同じ言葉を聞かされるでしょう。AppleやMicrosoftが登場した当時、超富裕層への道は未開で、想像もできませんでした。確かに、新興のベンチャーキャピタル業界は大きな利益を狙っていましたが、当時現場にいた人たちは、今では失われてしまった純粋さを持っていました。
一方、ビルケンシュトックは再び人気を集めています!実際、昨年10月には80億ドル以上の評価額で上場を果たしました。かつてヒッピーだったシリコンバレーの企業と同様に、あのヒッピーシューズも今や完全に体制の一部となってしまったようです。
ご質問は[email protected]までお送りください。件名に「ASK LEVY」とご記入ください。

終末クロニクル
Netflixが最近発表した視聴者統計によると、2023年にはヒット作『Leave the World Behind』を含む終末をテーマにした番組が視聴者に最も多く視聴されたことが分かりました。視聴者は何かを知っているのでしょうか?

最後になりましたが、重要なことです
Meta の主任 AI 科学者 Yann LeCun 氏は、常に AI 生活の明るい面を見ています。
鳥類関連で問題を抱えている企業はTwitterだけではない。数十億ドル規模の企業から破産に追い込まれたBirdの凋落ぶりを振り返る。
プラセボは、本物の薬を飲んでいないと分かっていても効果を発揮します。ですから、偽薬を処方された医師を責めないでください。
ハワイにあるマーク・ザッカーバーグの1億ドル規模の邸宅には、終末の時に知り合いかもしれない、あるいは知らないかもしれない人々を締め出すための巨大な地下シェルターがある。マハロ!

このコラムの今後の購読者限定版をお見逃しなく。WIRED を今すぐ購読しましょう(Plaintext読者は50%オフ) 。