AIは人間よりも人間を理解する

AIは人間よりも人間を理解する

ミハル・コシンスキーは、時​​宜を得たテーマに鋭い嗅覚を持つスタンフォード大学の心理学者です。彼は自身の研究を、知識の発展だけでなく、コンピュータシステムの作用によって引き起こされる潜在的な危険について世界に警鐘を鳴らすことだと考えています。彼の最も有名なプロジェクトは、Facebook(現Meta)がプラットフォーム上でユーザーが「いいね!」をクリックした回数から、ユーザーについて驚くほど深い理解をどのように得たかを分析することでした。現在、彼はAIの驚くべき可能性を研究しています。例えば、コンピューターが人の顔のデジタル写真を分析することで、その人の性的指向を予測できることを示す実験を行っています。

Metaに関する執筆活動を通してコシンスキー氏と知り合い、今週、査読付きの米国科学アカデミー紀要(Proceedings of the National Academy of Sciences)に掲載された彼の最新論文について議論するために再会しました。彼の結論は驚くべきものです。OpenAIのような大規模言語モデルは、かつては生身の人間(あるいは少なくとも哺乳類)の領域のみと考えられていた思考に類似した技術を境界を越えて使用していると彼は主張しています。具体的には、OpenAIのGPT-3.5とGPT-4をテストし、「心の理論」と呼ばれるものを習得しているかどうかを検証しました。これは、人間が幼少期に発達させた、他の人間の思考プロセスを理解する能力です。これは重要なスキルです。コンピュータシステムが人間の思考を正しく解釈できない場合、その世界理解は貧弱になり、多くの誤りを犯してしまうでしょう。もしモデルが心の理論を備えているとすれば、人間の能力に匹敵し、それを超えることに一歩近づくことになります。コシンスキー氏はLLMをテストし、特にGPT-4では心のような能力の理論が「LLMの言語スキルの向上による意図しない副産物として現れた可能性がある…それはより強力で社会的に熟練したAIの到来を意味する」ことを実験が示していると述べています。

コシンスキー氏は、AI分野での自身の研究は、以前Facebookの「いいね!」に取り組んだことの自然な発展だと考えている。「私はソーシャルネットワークを研究していたわけではなく、人間を研究していたのです」と彼は言う。OpenAIとGoogleが最新の生成AIモデルの構築に着手した際、彼らは主に言語処理を訓練していると考えていたと彼は言う。「しかし、実際には人間の心のモデルを訓練していたのです。なぜなら、私の心をモデル化しなければ、次にどんな言葉を言うかを予測することはできないからです。」

コシンスキー氏は、法学修士(LLM)が心の理論を完全にマスターしたとは断言しないように注意している ― まだだ)。実験では、チャットボットにいくつかの典型的な問題を提示し、そのうちのいくつかは非常にうまく処理した。しかし、最も洗練されたモデルであるGPT-4でさえ、4分の1の確率で失敗した。彼は、これらの成功によりGPT-4は6歳児と同等のレベルに達したと述べている。この分野の初期段階を考えると、悪くない数字だ。「AIの急速な進歩を目の当たりにして、AIが心の理論、つまり意識を獲得できるかどうか、そしていつそれが可能になるのか、多くの人が疑問に思っている」と彼は書いている。あの放射能まみれの「C」という言葉はさておき、これは考えるべきことが山ほどある。

「もし心の理論がこれらのモデルに自然発生的に現れたのであれば、次に他の能力が現れる可能性も示唆しています」と彼は言う。「それらの能力のおかげで、彼らは私たちをより良く教育し、影響を与え、操ることができるようになるでしょう。」彼は、人間の思考を理解する法学修士課程への備えがまだ十分にできていないのではないかと懸念している。特に、もし彼らが人間よりも人間を理解するようになったら、なおさらだ。

「人間は人格を模倣しているのではなく、人格を持っているのです」と彼は言う。「だから私は自分の人格に縛られているようなものです。これらの機械は人格を模倣します。いつでもどんな人格でも持てるという利点があります」。コシンスキーに、まるでソシオパスのことを言っているようだと指摘すると、彼は目を輝かせた。「講演でその言葉を使っているんです!」と彼は言う。「ソシオパスは仮面を被ることができる。本当は悲しんでいないのに、悲しい人間を演じることができるのです」。このカメレオンのような力は、AIを優れた詐欺師へと変える可能性がある。しかも、全く罪悪感を抱くことなく。

一部の心理学者はコシンスキーの主張に異議を唱えている。コシンスキーが2023年初頭にArxivに発表したプレプリントに対し、AI研究者グループが論文を発表し、彼が実際には「賢いハンス」を観察しているのではないかと示唆した。これは、人々が数学ができてカレンダーを把握できると騙された、20世紀初頭の有名な馬のことだ。彼らの主張は、言語モデル(LLM)が心の理論のテストに1つでも失敗すれば、完全に失敗するというものだった。「言語モデルにはある程度の推論能力があるかもしれないが、人間のように完全でも堅牢でもないことは確かだ」と、ブリティッシュコロンビア大学のコンピュータサイエンス助教授で共著者の一人であるヴェレッド・シュワルツ氏は述べている。「私たちは様々なテストを行いましたが、言語モデルが人間と同じ[心の理論]能力を持っていると断言することはできません。もしかしたら、単にズルをしているだけかもしれません。」

シュワルツが言及しているのは、法学修士課程(LLM)は膨大な情報コーパスで訓練されるため、その一部にはコシンスキーが行った実験と同様の実験を論じた学術論文が必然的に含まれてしまうという事実だ。GPT-4は膨大な訓練資料から答えを見つけ出したのかもしれない。AI懐疑論者の筆頭であるゲイリー・マーカスは、コシンスキーが使用したテストは、科学論文で1万1000回以上引用されている古典的な実験にも用いられていたことを発見した。まるで法学修士課程(LLM)が心の理論を持っているように見せかけるために暗記していたかのようだ。(私にとって、もしこれが事実だとすれば、認知へのこの冷酷な近道は、法学修士課程(LLM)が心の理論を創発的に獲得することよりもさらに恐ろしい。)

コシンスキー氏は、この最新版の論文で行われた作業は批判に対処していると述べています。また、最近、彼の主張を裏付けるような論文もいくつか発表されています。その中には、Nature Human Behavior誌に掲載された論文があり、GPT-3.5とGPT-4は、すべての心の理論タスクで成功したわけではないものの、いくつかのタスクでは「印象的なパフォーマンスを発揮」し、他のタスクでは「人間のレベルを超えた」と結論づけています。私宛のメールの中で、ハンブルク・エッペンドルフ大学医療センターのポスドク研究員である筆頭著者のジェームズ・ストラチャン氏は、LLMが心の理論を完全に習得したとは主張していませんが、彼のチームは不正行為の疑惑を反駁したと述べています。「これらの能力は、LLMの訓練に使用されたデータを単に繰り返す以上のものと思われます」と彼は述べ、「自然言語の統計から人間の精神状態に関する多くの情報を再構築することが可能です」と述べています。

法学修士課程が真の心の理論を習得するかどうかについては、私には懐疑的です。重要なのは、彼らがそのスキルを持っているかのように振る舞うかどうかであり、彼らは間違いなくその道を歩んでいます。コシンスキーの手法のいくつかを否定したシュワルツでさえ、それは可能だと認めています。「企業が言語モデルをさらに洗練させ続ければ、いつか(心の理論を)習得するかもしれません」と彼女は言います。

だからこそ、コシンスキー氏の研究は、厳しい批判にもかかわらず、傾聴する価値がある。彼の論文の結論も同様だ。「心の理論は、この宇宙においてニューラルネットワークが達成できるものの頂点にはなりそうにない」と彼は書いている。「近い将来、人間には想像もできない認知能力を備えたAIシステムに囲まれる日が来るかもしれない」。楽しいホリデーシーズンを!

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

タイムトラベル

コシンスキー氏はFacebookデータ分析のパイオニアであり、ケンブリッジ大学でこの分野の初期の研究者として、ケンブリッジ・アナリティカによる悪名高いFacebookデータ不正利用に間接的に関わる役割を果たしました。しかし、私が著書『Facebook: The Inside Story』で述べたように、コシンスキー氏(共著者のデイビッド・スティルウェル氏と共同)の研究は、人々が常に表示される「いいね!」ボタンを押すたびに、Facebookがいかに多くのデータを収集しているかを世界に知らしめました。そして今、批評家たちは彼の研究結果に異議を唱えています。

コシンスキーは、彼の方法論に懐疑的な意見を向けられた。「当時の上級学者たちはFacebookを使っていなかったので、40歳の男性が突然ユニコーンになったり、6歳の女の子になったりするといった話を信じていたのです」と彼は言う。しかし、コシンスキーは、人々がFacebook上で行うことが彼らの真の姿を反映していることを知っていた。そして、Facebookの「いいね!」をどんどん使ううちに、それが驚くほど多くのことを明らかにすることに気づき始めた。彼は、人について多くのことを知るのにクイズは必要ないと考えるようになった。必要なのは、Facebookで彼らが何に「いいね!」したかを知ることだけだ。

コシンスキー氏(と共同研究者)は、約6万人のボランティアの「いいね!」から統計を用いて個人特性を予測し、その予測結果をmyPersonalityテストで明らかになった被験者の実際の特性と比較しました。結果は非常に驚くべきもので、著者らは何度も検証しなければなりませんでした。「結果が出てから実際に自信を得て発表するまでに1年かかりました。まさかこんなことが可能だとは信じられなかったからです」と彼は言います…。「いいね!」の分析のみで、彼らは88%の確率で、ある人がストレートかゲイかを判断することに成功しました。20人中19人では、その人が白人かアフリカ系アメリカ人かを推測できました。そして、政党の推測は85%の確率で的中しました。

その後数か月で、コシンスキーとスティルウェルは予測手法を改良し、「いいね!」だけを使うことで、研究者は一緒に働いた人、一緒に育った人、あるいは結婚した人よりもその人のことをよく理解できると主張する論文を発表しました。「コンピューターモデルが平均的な職場の同僚、同居人、友人、家族、配偶者を上回るには、それぞれ10、70、150、300の「いいね!」が必要です」と彼らは記しています。

画像にはシンボルが含まれている可能性があります

一つだけ聞いてください

アランは、「なぜオンライン コンテンツの支払い方法を選択できないのか」と尋ねます。

アラン、質問ありがとう。私も困惑しています。有料記事を見つけて文句を言う人には、本当に我慢ならないんです。昔はね、子供たち、すべてが紙媒体で、無料で読むには、売店に立って、店主が盗み取らないように祈りながら読むしかなかったんですでも、あの宝石のような記事を作るにはお金がかかるんです。確かに、ニュース業界は当初、コンテンツをオンラインで無料で提供することで、自らの利益を損ねていました。しかし今では、ほとんど、いや、全てではないにしても、デジタル広告だけで優れた記事や報道の資金を調達できるという考えは捨て去られています。

しかし、あなたは支払い方法の選択肢の少なさについて不満を言っているのだと思います。現在のシステムが購読か無かのどちらかしかないことに不満を抱いているのでしょう。一般的に、記事1本、あるいはニュースレター1通にさえ少額の料金を支払う方法はありません。訪れたことのない町の新聞で、興味がありそうな記事へのリンクを見つけたのに、クレジットカードを登録しなければアクセスできず、興味のないニュースやアーカイブに完全アクセスできない、といった経験は、一体何度あるでしょうか?文字通り何十年もの間、私は使いやすいマイクロペイメントシステムが構築され、実装されるだろうと想定してきました。技術的な課題は最小限です。しかし、幾度となく試みられたにもかかわらず、どれも成功していません。かつてBlendleという会社は、マイクロペイメントシステムで「ジャーナリズムを救う」と約束しました。昨年、同社は記事ごとの支払いビジネスをやめ、複数の出版物にアクセスできるApple Newsのような購読サービスに移行すると発表しました。

マイクロペイメントの解決策はもう終わりのようです。それでも、有料コンテンツにアクセスできない、読みたいコンテンツにアクセスできない、そんな時、数セント、あるいは場合によっては1ドルか2ドルでも、出版物のアカウントに入金されるボタンを押したいです。とても理にかなっているように思えます。しかし、誰もがよく知っているように、意味があるだけでは、実際に何かが起こるための十分条件ではありません。

ご質問は[email protected]までお送りください。件名に「ASK LEVY」とご記入ください。

終末クロニクル

中部大西洋岸地域とニューイングランドのハロウィーンの真夏のような気温は、衣装よりも恐ろしい。

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

最後になりましたが、重要なことです

HotWired の口述歴史では、WIRED がオンライン ジャーナリズムにデジタル広告で資金を提供しようとしたという原罪を犯したと主張しています。

Facebook は民兵グループのグループページを自動生成しています。

病院はOpenAIの文字起こしツールを、幻覚を引き起こすにもかかわらず、積極的に活用している。コードブルー!

シスコの従業員たちは、イスラエルとガザの政治情勢をめぐって対立している。そこで疑問が浮かび上がる。シスコはまだ存続しているのだろうか?

画像にはロゴ、シンボル、商標、テキスト、ラベルが含まれている場合があります

このコラムの今後の購読者限定版をお見逃しなく。WIRED を今すぐ購読しましょう(Plaintext読者は50%オフ)