AI検出の軍拡競争が始まる

AI検出の軍拡競争が始まる

エドワード・ティアンは、自分を作家だとは思っていませんでした。プリンストン大学でコンピュータサイエンスを専攻していた彼は、ジャーナリズムの授業をいくつか受講し、そこで報道の基礎を学びました。明るい雰囲気と、いじくり回すような好奇心で、教師やクラスメイトから慕われていました。しかし、当時の自分の文章スタイルは「かなりひどい」、型にはまったぎこちないものでした。ジャーナリズムの教授の一人は、ティアンが「パターン認識」に長けており、それがニュース原稿の作成に役立つと言っていました。そのため、大学2年生の時にジョン・マクフィーの特別ノンフィクションライティングセミナーの席を確保できたときは、ティアン自身も驚きました。

毎週16人の学生が集まり、伝説のニューヨーカー誌ライターが自らの技巧を分析するのを聞きました。マクフィーは生徒たちに、言葉について厳密に考えさせる課題を与えました。キャンパスにある現代美術作品について描写したり、ゲティスバーグ演説を簡潔にまとめたりするといった課題です。プロジェクターとスライドを使いながら、マクフィーは自身のエッセイの構成方法を示す手描きの図表を見せました。直線、三角形、螺旋などです。ティアンは、マクフィーが生徒たちに書き方を指示することはできないが、少なくとも彼ら独自の表現を見つける手助けはできると言っていたことを覚えています。

マクフィーがティアンに言語に対するロマンチックな見方を植え付けたとすれば、コンピュータサイエンスは異なる視点、つまり言語を統計として捉える視点を提供した。パンデミックの間、彼はBBCで1年間の休職を取り、オープンソースのジャーナリズムプロジェクトであるベリングキャットでインターンとして働き、Twitterボットを検出するコードを書いた。大学3年生の頃は、機械学習と自然言語処理の授業を受講した。そして2022年秋、AI生成テキストと人間が書いたテキストの違いを検出することをテーマにした卒業論文の執筆に取り掛かった。

ChatGPTが11月にデビューしたとき、ティアン氏は異例の立場に立たされていました。世界中がこの新しく、劇的に改良されたチャットボットに夢中になっている一方で、ティアン氏は既にその基盤となるGPT-3技術に精通していました。また、偽情報キャンペーンの根絶に尽力してきたジャーナリストとして、AI生成コンテンツが業界に与える影響も理解していました。

この記事は2023年10月号に掲載されます。WIREDを購読するには、こちらをクリックしてください。

この記事は2023年10月号に掲載されます。WIREDを購読するには、こちらをクリックしてください。

写真:ジェシカ・チョウ

冬休みでトロントに帰省中、ティアンは新しいプログラム、ChatGPT検出器で遊び始めた。お気に入りのカフェでジャスミンティーをがぶ飲みしながら、寝室で夜遅くまでコーディングした。彼のアイデアはシンプルだった。このソフトウェアは、テキストをスキャンして2つの要素、「困惑度」(単語選択のランダム性)と「バースト性」(文章の複雑さまたは変化)を判断する。人間の文章は、どちらの指標でもAIの文章よりも評価が高い傾向があるため、ティアンはテキストがどのように作成されたかを推測することができた。ティアンはこのツールをGPTZeroと名付け、「ゼロ」は真実、つまり基本への回帰を意味し、1月2日の夜にオンラインで公開した。彼は簡単な紹介とともにTwitterにリンクを投稿した。目標は「AIによる盗作の増加」に対抗することだと彼は書いた。「高校の教師は、生徒にChatGPTを使って歴史のエッセイを書かせたいと思うだろうか? おそらくそうはならないだろう」。それから彼は就寝した。

翌朝、ティアンは何百ものリツイートと返信に目覚めた。ホストサーバーへのアクセスが非常に多く、多くのユーザーがアクセスできなかった。「完全にクレイジーでした」とティアンは言う。「電話が鳴り響いていました。」友人は彼がインターネットで優勝したことを祝福した。TikTokのティーンエイジャーは彼をナルシストと呼んだ。「最初の嫌がらせの多くは、『この子は密告者だ、人生がない、恋人がいたことがない』というものでした」とティアンはニヤリと笑って言う。「典型的なものです。」 (ティアンには恋人がいる) 数日のうちに、彼は世界中のジャーナリストから電話を受けるようになり、最終的にはNPRからサウスチャイナ・モーニング・ポスト、アンダーソン・クーパー360まで、あらゆる番組に出演した。1週間以内に、彼のオリジナルツイートは700万回以上再生された。

GPTZeroは、ChatGPTをめぐるメディアの言説に新たな展開をもたらした。ChatGPTは業界全体に懸念を抱かせ、AI生成の見出しが氾濫した。(研究者たちは2019年にGPT-2テキストの検出器を開発していたが、ChatGPTを標的にしたのはTian氏のものが初めてだった。)教師たちはTian氏の研究に感謝し、生徒の疑わしいエッセイへの疑念をついに証明できたことに感謝した。人類はロボットによる支配から救世主を見つけたのだろうか?

ティアン氏のプログラムは、いわば号砲だった。決定的なAI検出ツールの開発競争が始まった。AI生成コンテンツがますます飽和状態にある世界では、機械が作ったものと人間が作ったものを区別する必要がある、という考えが広まった。GPTZeroは、確かに機械が作ったものと人間が作ったものを区別できるという約束と、その違いが重要であるという確信を体現していた。メディアツアー中、笑顔で真摯、まさに優等生の体現者であるティアン氏は、生成AIツールがどれほど洗練されても、私たちは必ずそれを見破ることができるという、心強い見解を詳しく説明した。人間の文章には、還元できない何かがあるとティアン氏は言った。「決して数字にできない要素があるのです。」

インターネットは常に、偽物を作る者と偽物を見抜く者の戦いであり、双方がその衝突から利益を得てきた。初期のスパムフィルターは、キーワードでメールをふるいにかけ、「無料」や「21歳以上」といったフレーズを含むメッセージをブロックし、最終的には文章のスタイル全体をフィルタリングするようになった。スパマーはこれに対し、古い本から拾い上げて寄せ集めた人間らしい言葉の断片でアピールを囲むことで対抗した(この種のメッセージは「litspam」と呼ばれ、1つのジャンルになった)。検索エンジンが普及するにつれ、ページのランキングを上げたい作成者は、優先順位を得るために「キーワードスタッフィング」、つまり同じ単語を何度も繰り返す手法に頼るようになった。検索エンジンは、それらのサイトのランキングを下げることで対抗した。Googleが、被リンクの多いウェブサイトを優遇するPageRankアルゴリズムを導入した後、スパマーは相互にサポートし合うページのエコシステム全体を作り上げた。

2000年代初頭、歪んだ文字の画像を解釈する能力に基づいて人間とボットを選別するCAPTCHAツールが登場しました。一部のボットがこれを処理できるようになると、CAPTCHAはバイクや電車の画像の解析、マウスの動きなどのユーザー行動の検知といった他の検出手法を追加しました。(最近のテストでは、GPT-4の初期バージョンが、Taskrabbitで人を雇うことでCAPTCHAを代わりに入力する方法を知っていることが示されました。)企業全体の運命は、偽造を見抜くという問題にかかっています。イーロン・マスクは、Twitter買収契約から逃れようと、ボット検出ツールを引用し、Twitterがサイト上のボット数を偽って表示しているという主張を裏付けました。

生成AIが賭け金を再び引き上げた。過去10年間、大規模言語モデルとテキスト画像生成ツールは着実に進化してきたが、2022年にはChatGPTやDall-Eのような消費者向けツールが爆発的に増加した。悲観論者は、私たちはすぐに合成メディアの津波に溺れる可能性があると主張している。「数年後には、インターネットで目にする写真、動画、テキストの大部分がAIによって生成される可能性がある」と、ニューヨーク・タイムズのテクノロジーコラムニスト、ケビン・ルース氏は昨年警告した。アトランティック誌は、私たちが生成ノイズをフィルタリングするのに苦労する中で、「テキストポカリプス」が迫っていると想像した。政治キャンペーンはAIツールを活用して広告を作成し、AmazonにはChatGPTで書かれた本(多くはAIに関するもの)が溢れている。製品レビューをスクロールするだけでも、世界で最も面倒なチューリングテストのように感じられます。次のステップは明らかです。ナイジェリアの王子のメールがひどいと思ったら、ナイジェリアの王子のチャットボットを見るまで待ってください。

TianがGPTZeroをリリースした直後、類似製品が次々と登場した。OpenAIは1月末に独自の検出ツールをリリースし、盗作対策大手のTurnitinは4月に分類ツールを発表した。これら3社は基本的な手法は共通していたものの、それぞれのモデルは異なるデータセットでトレーニングされていた(例えば、Turnitinは学生の文章に重点を置いていた)。その結果、AIによる文章の検出精度はOpenAIが26%と主張しているのに対し、Winston AIという企業が発表した最も楽観的な99.6%という数値まで、精度は大きく異なっていた。競争で優位に立つためには、TianはGPTZeroを改良し続け、次の製品を開発し、その間に大学を卒業しなければならなかった。

ティアンはすぐに高校時代の友人アレックス・クイをCTOに迎え入れ、その後数週間かけてプリンストン大学とカナダから数人のプログラマーを招聘した。そして春には、4年前にアフリカでエンジニアを育成するスタートアップで働いていた時に出会ったウガンダ出身の3人組のプログラマーをチームに迎え入れた。(国際人であるティアンは東京で生まれ、4歳まで北京に住んでいたが、中国人エンジニアの両親と共にオンタリオ州に移住した。)チームは共に次のアプリケーションの開発に着手した。ウェブページのテキストをスキャンし、AI生成かどうかを判定するChromeプラグインだ。

GPTZeroにとってもう一つの脅威がGPTZeroだった。ローンチ直後から、ソーシャルメディアでは懐疑論者たちが、このツールがテキストを誤分類した恥ずかしい事例を投稿し始めた。米国憲法の一部をAIが書いた可能性があるとフラグ付けしたという指摘もあった。GPTZeroのせいで学生が不正行為を疑われたという話がRedditに殺到し始めると、嘲笑は怒りに変わった。ある時、そうした学生の親がメリーランド大学でコンピューターサイエンスの教授を務めるソヘイル・フェイジ氏に連絡を取った。「彼らは本当に激怒していました」とフェイジ氏は語る。GPTZeroがデビューする前の昨秋、フェイジ氏とメリーランド大学の同僚数名は、AI検出器の信頼性が低いのではないかと疑っていたAI検出器の問題についての研究プロジェクトをまとめ始めていた。今、GPTZeroとその模倣品は、有益よりも有害である可能性があるとフェイジ氏に思わせている。

ティアンにとってもう一つの頭痛の種は、検出器を回避する方法を見つける巧妙な学生たちの数々だった。あるTwitterユーザーは、ChatGPTで生成されたテキストのすべての「e」の前にゼロ幅スペースを挿入するようユーザーに指示した。あるTikTokユーザーは、特定の英語の文字をキリル文字に似たものに置き換えることで検出を回避するプログラムを作成。また、AIテキストを人気の言い換えツールQuillBotに通し始めた人もいた。ティアンはこれらの穴を修正したが、回避策は次々と現れた。誰かが対抗製品、つまり検出器対策を開発するのは時間の問題だった。

3月初旬、スタンフォード大学の新入生ジョセフ・セムライと数人の友人は、ロサンゼルスに向かってパシフィック・コースト・ハイウェイを走っていたところ、ベンチュラでジップカーの鍵を閉められてしまいました。彼らは近くのスターバックスまで歩いて行き、ロードサービスが来るのを待ちました。しかし、何時間も待たされたため、セムライと友人は失われた時間をどう埋め合わせようかと考えました。セムライは、新入生向けの必修ライティングクラスで翌週に提出するエッセイを待っていました。それは彼が最も苦手とするタイプの課題でした。論理的思考を示すための、決まりきったエッセイです。「かなりアルゴリズム的なプロセスなんです」とセムライは言います。

ChatGPTは当然の解決策でした。しかし当時、ChatGPTの応答はせいぜい数段落程度で、完全なエッセイを生成するには複数のステップが必要でした。Semraiは、一気に論文を作成できるツールを作りたいと考えていました。しかし同時に、GPTZeroに検知される可能性もあることを知っていました。友人の励ましを受け、Semraiはノートパソコンを取り出し、プロンプトに基づいてエッセイを作成し、そのテキストをGPTZeroに通し、AIが検知できなくなるまで言い回しを微調整し続けるスクリプトを作成しました。つまり、GPTZeroを自分自身に対抗させるようなものでした。

セムライ氏は数日後、スタンフォード大学の学部開発者コミュニティ向けの発表の場とも言える「Friends and Family Demo Day」で自作のプログラムを発表した。教室を埋め尽くしたクラスメートの前に立ち、聴衆にエッセイのテーマを尋ねた。誰かが「カリフォルニアの高級レストラン」を提案したため、彼はそれをプロンプトボックスに入力した。数秒後、プログラムは独創性はないが筋の通った8段落のエッセイを引用文献とともに吐き出した。「この論文を提出するとは言っていないよ」とセムライ氏は笑いながら言った。「でも、まあ、いいか。時間の節約になるしね」。彼はそのツールを「WorkNinja」と名付け、2カ月後にアプリストアに公開した。ジェネレーションZのインフルエンサー、デヴィッド・ドブリック氏を起用したプロモーションキャンペーンや、登録したユーザーにテスラ10台をプレゼントするキャンペーンの効果もあり、最初の1週間で35万回以上ダウンロードされた。セムライ氏によると、それ以降登録者数は1日数百人にまで減っているという。 (セムライ氏は誰がこのキャンペーンに資金を提供したかは明かさなかったが、シリコンバレーの大手エンジェル投資家だとだけ語った。)

セムライのズーマーのようなモップのような髪と落ち着いた物腰からは、くすぶる激しさが伝わってこない。ティアンが世界を跳ね回り、泡のように躍動するのに対し、セムライは集中力があり、無表情な印象を与える。19歳の彼は、世界を解決すべき問題として捉え、ほぼすべての文を「そうでしょう?」で締めくくる、自信に満ちた、ポッドキャスト向きのシリコンバレーの起業家のような口調で話す。彼が防衛堀や社会成長の「S字カーブ」について熱く語るのを聞いていると、彼が法的に飲酒できないことを忘れてしまいがちだ。しかし、時折、彼は世界に心を開きながらも、その中で自分の居場所を模索している、目を見開いた大学生らしい発言をする。例えば、友人とサンタモニカの桟橋を午前3時まで歩き回り、「何を大切にしているかを語り合った」時のこと。セムライは、バランスと幸せを見つける方法についてよく考えている。 「若いうちは、デリバティブを探求し、高値と安値を追いかけることの方が重要だと思う」と彼は言う。

ニューヨーク、そしてフロリダで育った彼の両親――ヨンカーズ出身の消防士の父と中国出身の主婦の母――は、彼に自由を与えてくれました。「子供の頃は、本当に自分がワクワクすることを追求する自由を与えられました」と彼は言います。「そのための最良の方法は、コンピューターで何かを作ることでした。」6歳の時、セムライはMinecraftサーバーの権限レベルを割り当てるプラグインを作成し、7歳の時にはWindows 7にパッチを適用してWindows XPを動作させるプログラムを作成しました。「人々のために何かを出荷することは、本当に幸せなことです」と彼は言います。

セムライは9歳の時、家族とクイーンズからパームシティに引っ越しました。そこで公立学校制度の違いを目の当たりにしました。ニューヨークの学校では当たり前のように受けていた基本的なコンピューターリテラシーは、フロリダでは不足していました。彼は教育のギャップを埋めるためのプログラムを書き始めました。その軌跡のおかげで、19歳にして「生涯教育テクノロジーに携わってきた」と言えるほどです。高校1年生の時、彼はオンライン学習プラットフォームを開発し、地元のコンテストでスタートアップ資金を獲得しました。新型コロナウイルス感染症の流行前には、接触者追跡の基盤となるデジタルホールパスシステムを開発し、南東部の40の学区で採用されました。

セムライ氏は根っからのテクノロジー楽観主義者だ。彼は、汎用人工知能(AGI)を含むテクノロジーの発展を加速させるべきだと考えている。なぜなら、それが最終的に私たちを「脱スカーシティ」社会へと導くからだ。この世界観は時に「効果的加速主義」とも呼ばれる。(効果的利他主義とは混同してはならない。効果的利他主義は、定義がどうであれ「良い」結果を最大化するように行動すべきだと主張する。)セムライ氏がWorkNinjaを主張する根拠は、独自の加速主義的論理に基づいている。AIライティングツールが良いのは、子供たちのカンニングを助けるからではなく、学校にカリキュラムの刷新を迫るからだ。「決まった公式に従ってエッセイを書けるような課題は、おそらく良い課題ではない」と彼は言う。彼は、かつては貴族だけが受けられたような教育を、AIによる個別指導によってすべての学生が受けられる未来を思い描いている。プログラミングを初めて学んだ頃は、疑問を解決するためにYouTubeの動画やインターネットフォーラムに頼っていたとセムライ氏は語る。 「指導してくれる家庭教師がいたらもっと楽だったのに」と彼は言う。AI家庭教師が現実のものとなった今、なぜ彼らの邪魔をするのだろうか?

ジョセフ・セムライ 19 歳、AI が書いたエッセイを生成するツール WorkNinja の開発者。

AIが書いたエッセイを生成するツール「WorkNinja」の開発者、ジョセフ・セムライさん(19歳)。

イラスト:ジェームズ・マーシャル、写真:カリス・モーガン

最近、 WorkNinjaを使っていくつかのエッセイを作成しました。その中にはダーウィンの進化論に関するものも含まれていました。最初に生成されたバージョンはぎこちなく繰り返しが多かったものの、生物学、遺伝学、哲学における進化論の意義を探求する、実用的なものでした。GPTZeroは、このエッセイをAI生成の可能性が高いと判定しました。

そこでWorkNinjaの「Rephrase」ボタンを押してみました。すると、テキストがわずかに変化し、いくつかの単語が同義語に置き換えられました。3回の言い換えを経て、GPTZeroはようやくテキストに人間らしさを与えてくれました。(数週間後に同じテキストを再度テストしたところ、ツールはそれを「人間とAIの文章が混在している」と判定しました。)問題は、言い換えられた文の多くが意味をなさなくなっていたことです。例えば、次の文です。

ダーウィンの進化論は、生物種は環境との相互作用により時間の経過とともに進化するという考え方です。

次のように変化しました。

ダーウィンの進化論は、生物種は周囲の環境との相互作用により進化していくという考えです。

少なくとも、近道を探している学生は、WorkNinjaの下書きを提出前に修正する必要がある。しかし、これは現実的な問題を示唆している。この未完成の作業でさえ検出装置を回避できるのであれば、より堅牢な製品で何ができるというのだろうか?

3月、メリーランド大学のソヘイル・フェイジ氏はAI検出器の性能に関する調査結果を発表しました。フェイジ氏は、AIテキスト検出器の仕組みを考えると、精度の問題は避けられないと主張しました。AIが生成したテキストをより多く検出するために機器の感度を高めると、誤検出の数が許容できないレベルまで増加することは避けられません。フェイジ氏によると、今のところ、どちらか一方だけを得ることは不可能だそうです。そして、AIが生成したテキストの単語の統計的分布が人間のそれに近づくにつれて、つまり、より説得力を持つようになるにつれて、検出器の精度は低下するだけだと彼は言います。彼はまた、言い換えがAI検出器を混乱させ、その判断を「ほぼランダム」にしてしまうことも発見しました。「これらの検出器の未来は明るくないと思います」とフェイジ氏は言います。

「透かし」も役に立たないと彼は言う。このアプローチでは、ChatGPTのような生成AIツールは、特定の互換性のある「トークン」単語(例えば、beginの代わりにstart、chooseの代わりにpickを使用するなど)の統計的な重みを、読者には気づかれないもののアルゴリズムによって容易に見分けられる方法で積極的に調整する。これらの単語が一定頻度で出現するテキストは、特定のツールによって生成されたものとしてマークできる。しかしフェイジ氏は、十分な言い換えによって透かしは「洗い流される」と主張する。

一方で、検出ツールは学生に悪影響を及ぼしているとフェイジ氏は指摘する。仮に検出ツールの誤検出率が1%だとしよう。これは楽観的な仮定だ。つまり、100人の生徒がいる教室で、10回の持ち帰り課題のエッセイをこなす中で、平均10人の生徒が不正行為の誤った疑いをかけられることになる。(フェイジ氏によれば、1000人に1人の割合であれば許容範囲内だという。)「AIモデルの使用を監視するために、このようなツールを使うことなど考えること自体が馬鹿げている」と彼は言う。

ティアン氏によると、GPTZeroの目的は不正行為者を捕まえることではないが、これまでのところ間違いなくそれが主な使用例となっている。(GPTZeroの検出結果には現在、「これらの結果は生徒を罰するために使用すべきではありません」という警告が表示される。)精度に関しては、ティアン氏によると、GPTZeroは最新のデータセットで学習させた場合、現在の精度は96%だという。他の検出ツールはより高い数値を誇っているが、ティアン氏は、こうした主張は危険信号だと指摘する。なぜなら、ツールの強みに合わせるために学習データを「過剰適合」させていることを意味するからだ。「AIと人間を対等に扱う必要がある」と彼は言う。

驚くべきことに、AIが生成した画像、動画、音声スニペットは、少なくとも現時点では、合成テキストよりもはるかに簡単に検出できます。Yコンビネーターの支援を受けたスタートアップ企業Reality Defenderは、2018年に偽の画像と動画の検出に特化して設立され、その後、音声とテキストにも事業を拡大しました。Intelは、カメラにのみ見える顔の血流パターンを分析することでディープフェイク動画を検出する「FakeCatcher」というツールをリリースしました。Pindropという企業は、音声「生体認証」を用いて偽造音声を検出し、セキュリティ質問の代わりに発信者を認証しています。

AIが生成したテキストは、分析対象となるデータポイントが比較的少ないため、検出が困難です。つまり、AIの出力が人間の基準から逸脱する機会が少ないということです。これをIntelのFakeCatcherと比較してみましょう。Intelの研究科学者で、ピクサー映画にも携わったイルケ・デミール氏は、ディープフェイカーが血流の特徴を模倣して検出器を欺くのに十分な規模と詳細なデータセットを作成するのは極めて困難だと述べています。そのようなものが最終的に作成可能かどうか尋ねると、彼女は、ディープフェイク技術の将来的な発展を予測し、常に一歩先を行くことができると答えました。

リアリティ・ディフェンダーのCEO、ベン・コールマン氏は、同社の検出ツールが回避不可能なのは、一部には非公開であるからだと述べています(これまでのところ、同社の顧客は主に政府機関と大企業です)。GPTZeroのような公開ツールでは、誰でもテキストを検出器に通し、検査に合格するまで微調整することができます。一方、リアリティ・ディフェンダーは、ツールを使用するすべての個人と機関を審査しているとコールマン氏は言います。また、疑わしい使用法にも注意を払っており、特定のアカウントが検出を回避する目的で同じ画像を繰り返しテストした場合、システムがそれを警告します。

いずれにせよ、スパムハンター、スパイ、ワクチン製造者、チェスの不正行為者、武器設計者、そしてサイバーセキュリティ業界全体と同様に、あらゆるメディアのAI検出機能は、新たな回避技術に常に適応していく必要があるでしょう。ただし、人間と機械の違いが依然として重要であると仮定した場合の話です。

ティアンとセムライ、そして彼らの同級生兼同僚たちと話すにつれ、私は疑問に思うようになった。これらの若者たちの中で、実際に…書くことを楽しんでいる人はいるのだろうか?「ええ、とても楽しんでいます!」と、昨年5月にプリンストン大学のキャンパスで尋ねた時、ティアンはいつも以上に満面の笑みで答えた。「パズルのようなものです」。言葉がどのように組み合わさるかを考え、アイデアをうまく​​組み合わせて文章を作り上げるのが好きなのだ。「それが楽しいんです」。彼はまた、インタビューというプロセスも気に入っている。それは「人々の人生を垣間見ることができる窓であり、同時に自分自身の生き方を映し出す鏡でもある」からだ。

高校時代、ティアンは文章を書くのが面倒な仕事のように感じていたと言う。マクフィーのおかげで文章を書くのが好きになり、趣味を広げられたと彼は言う。6月、彼はアニー・ディラードの『The Writing Life』の中古本を手に入れたばかりだと興奮気味に話してくれた。

セムライも同様に、高校の作文課題は退屈で機械的で、何か新しいものを作るというより、情報を統合することが求められていると感じていた。「創造性を刺激するオープンフォーマットの課題の方が良かった」と彼は言う。しかし彼は、そうした統合スキルを仕事に活かした。2年生の時、彼は『Build for Anything』という800ページの指導書を執筆した。これは、ウェブ開発について「何も知らない人を、ほぼすべてのことを少しずつ理解できる状態に導く」ことを目的としていた(彼は2022年にアマゾンでこの本を自費出版し、数百部を売り上げた)。セムライによると、それはChatGPTが今や得意とする散文のようなものだという。「この本は、意味のある文章とは言えないと思います」と彼は言う。

20年近くもの間、金のためにタイピングをしてきた経験から言えるのは、文章を書くのは最悪だということです。プロのライターに聞いても、最悪で、練習しても楽になることはないと言うでしょう。絶えず世界を眺め、事実を掘り起こし、そこから意味を見出していくために必要な熱意と好奇心を維持するのは、本当に大変なことです。しかも、業界の現状、つまり料金の下落、ページ数の減少、そして読者と私自身の集中​​力の低下といった状況は考慮に入れていません。私が文章を続けているのは、良くも悪くも、それが今の私だからです。楽しみのためではなく、少なくとも私にとっては意味があると感じるからこそ書いています。

作家の中には、その苦労を美化する者もいる。マクフィーはかつて、2週間ピクニックテーブルに横たわり、記事の書き出しをどうするか考えていた時のことを描写している。「最終的に記事は5000文ほどになるはずだったが、その2週間は1文も書けなかった」と彼は書いている。また別の時、22歳の彼は、バスローブのベルトで自分の執筆椅子に縛り付けた。トーマス・マンは「作家とは、他の人よりも書くことが難しい人のことである」と述べている。「探し求め、心、背中、脳を砕き、そしてその時――その時になって初めて――それは手渡される」と、アニー・ディラードは『The Writing Life』の中で書いている。彼女は、執筆をワニとの格闘に長々と例えた後、この言葉を述べている。

強く絞れば絞るほど、果汁は甘くなる、つまり、空白のページをじっと見つめ、それを飼いならし、散文へと道を譲らせることには美徳がある、という含意がある。こうして偉大なブレークスルーが生まれる、と私たちは自分に言い聞かせている。苦悩は価値がある。なぜなら、そうやってアイデアが生まれるからだ。

AIの誘惑は「こんな風になる必要はない」と告げる。そして、作家というエリート集団の外にいる何十億もの人々のことを考えてみると、「もしかしたら、こんな風になるべきではないのかもしれない」と考え始める。

メイ・ハビブは幼少期をレバノンで過ごした後、カナダに移住し、第二言語として英語を学びました。「読み書きが得意な人にこれほどの恩恵がもたらされるのは、かなり不公平だと思いました」と彼女は言います。2020年、彼女はWriterを設立しました。Writerは、人間の文章を置き換えるのではなく、人々、より正確にはブランドがAIとより良く連携できるようにすることを目指す、複数のハイブリッドプラットフォームの一つです。

ハビブは、白紙を見つめることに価値があると考えている。それは、アイデアを検討したり捨てたりするのに役立ち、思考を整理するきっかけになる。「カーソルを見つめながら、とりとめもなく頭を悩ませ、自殺したくなるような思いをするのは、実に多くのメリットがあります」と彼女は言う。「しかし、それは数ミリ秒単位のスピードと天秤にかける必要があるのです」

Writerの目的は、あなたに代わって文章を書くのではなく、あなたの文章をより速く、より力強く、より一貫性のあるものにすることだと彼女は言います。つまり、文章や構成の編集を提案したり、同じテーマで既に書かれたものを強調表示したり、反論を提示したりするということです。Writerの目標は、ユーザーが文章レベルの構造ではなく、伝えたいアイデアに集中できるようにすることです。理想的には、このプロセスによって、まるで人が自分で書いたかのように「人間らしい」文章が生まれるのです。「もしAIによる文章だと検知器が判断したら、ツールの使い方を間違えているということです」と彼女は言います。

ペンシルベニア大学ウォートン校のイーサン・モリック教授は、文章は人間が書いたものかAIが書いたものかという白黒はっきりした概念は既に消え去りつつあると指摘する。むしろ、私たちは彼が「ケンタウロスライティング」と呼ぶ時代の到来を告げている。確かに、ChatGPTにモンゴル帝国の歴史に関するエッセイを書いてもらうと、予想通り「AIっぽい」結果が出てくるとモリック教授は言う。しかし、「『3段落目の細部が少しおかしい。この情報を追加して、ニューヨーカー風のトーンにしてください』と書き始めると、よりハイブリッドな作品になり、はるかに質の高い文章になる」とモリック教授は言う。

ウォートン校で起業家精神を教えるモリック氏は、学生にAIツールの使用を許可するだけでなく、それを必須としている。「今のシラバスには、少なくとも1つの不可能なことをやらなければならないと書いてあります」と彼は言う。学生がコードを書けないなら、実際に動くプログラムを書くかもしれない。デザインの経験がなければ、ビジュアルプロトタイプを作るかもしれない。「提出する論文はすべて、自分がモデルとする少なくとも4人の著名な起業家から批評を受けなければなりません」と彼は言う。

モリック氏によると、生徒が良い成績を得るには、やはり自分の専門分野を完璧にマスターする必要がある。目標は、生徒に批判的かつ創造的に考えさせることだ。「どんなツールを使っていても構いません。ただ、そのツールを洗練された方法で使い、頭を使ってくれればそれでいいのです。」

モリック氏は、ChatGPTが最高の人間のライターほど優れているわけではないことを認めている。しかし、ChatGPTは他のライターを優位に立たせることができる。「もしあなたが下位4分の1のライターだったなら、今は60~70パーセンタイルにいることになります」と彼は言う。また、ChatGPTは特定の思考タイプの人々を、執筆プロセスの煩わしさから解放する。「私たちは文章力と知性を同一視しますが、必ずしもそうではありません」と彼は言う。「実際、多くの場合、そうではないと言えるでしょう。」

エドワード・ティアン、23歳。AI生成の文章を検出するツール「GPTZero」の開発者。

エドワード・ティアン、23歳。AIが生成した文章を検出するツール「GPTZero」の開発者。

イラスト:ジェームズ・マーシャル、写真:ローリン・ヒル

5月の雲ひとつない晴れた日、ティアンと私はプリンストン大学のキャンパスをぶらぶらと散歩しました。手入れの行き届いた芝生の上に、大きな白い同窓会のテントがまるで宇宙船のように降り立ったようでした。私の頼みで、ティアンは数人のクラスメートをキャンパス外の四川料理レストランに招待し、一緒に昼食をとりながらAIについて語り合いました。

一部の大学が急いでChatGPTを禁止し、テック企業のCEOたちがAIによる破滅を警告する書簡に署名するなか、学生たちは機械が支援する未来について明らかにリラックスしていた(プリンストンは教授たちに独自の基本ルールの設定を任せた)。学生の一人は最近、論文の謝辞を書くのにChatGPTを使った。ティアンを含む他の人たちは、コーディング中にスクリプトの塊を埋めるのにChatGPTを頼りにしていた。ジャーナリズムで働くことを計画しているコンピューターサイエンス専攻の4年生、リディア・ユーは、エリザベス・ビショップ風に物を失うことについての詩をChatGPTに書いてほしいと依頼した。彼女の有名な詩「One Art」(「失うことの芸術は習得するのが難しくない」)を再現する試みだった。出来上がりは元の詩に「とても近い」とユーは言い、チャットボットは元の詩をさらにうまく分析し、何がそれを感動させるのかを説明してくれたと彼女は感じた。 「人生のほとんどあらゆることに関して、パニックに陥るのを目にしてきました」とYouは、TikTok、Twitter、そしてインターネットそのものを例に挙げて語った。「私たちの世代の人たちは、『これをどう使うかは自分たちで考えればいい』と思っているように感じます」

機械・航空宇宙工学を専攻する4年生のソフィー・アミトンが口を挟んだ。「それに、私たちの世代はいろんな意味で怠惰になっていると思います」と彼女は言い、ユーも頷いた。「今は伝統的な仕事、9時から5時までの仕事を求めない人が増えているように感じます」

「彼らは幻滅している」とユー氏は言った。「多くの仕事がスプレッドシートのようなものだ」

「それはコロナ禍から生まれたものだと思います」とアミトン氏は続けた。「人々はそもそも仕事の目的を改めて考え直しました。ChatGPTを使って生活を楽にし、ひいては生活の質やワークライフバランスを向上させることができるなら、なぜその近道を使わないのでしょうか?」

プリンストン大学を卒業したばかりのリズさん(姓は伏せたい)が、国際政治の授業でChatGPTを使って書いた論文を送ってくれました。彼女は単にエッセイの質問に答えるのではなく、箇条書きで詳細なアウトラインを入力し、メモに基づいて論文を作成させました。何度も何度もやりとりを重ね、書き直したり、並べ替えたり、ニュアンスや文脈を追加したりと指示を出しながら、ようやく安心して提出できる論文が完成しました。彼女はAを取得しました。

彼女の論文をコピーしてGPTZeroに貼り付けてみた。判定は「あなたの文章は完全に人間によって書かれた可能性が高い」だった。

5月初旬、ティアンとクラスメートたちが黒い卒業式のガウンを着る数週間前、GPTZeroチームは開発中だったChromeプラグイン「Origin」をリリースした。Originはまだ原始的な機能で、ウェブページのテキストを自分で選択する必要があり、精度も完璧ではない。しかし、ティアン氏は将来、このツールがユーザーが閲覧するすべてのウェブサイトを自動的にスキャンし、テキストから画像、動画に至るまで、AI生成コンテンツだけでなく、「有害」なものや事実関係が疑わしいものもハイライト表示してくれることを期待している。彼はOriginを情報スーパーハイウェイの「風防」と表現し、無用または有害なコンテンツを遮断することで、私たちが道路の先をはっきりと見通せるようにしてくれるとしている。

ティアンは会社に対して揺るぎない楽観主義だった。そして、本当に望んでいた仕事に就けることを幸運に感じていた。多くの友人はプリンストン大学に入学した当初は起業家を目指していたが、テクノロジー業界の緊縮財政によって計画は変更された。

スタンフォード大学での残り3年を控えた2年生のセムライは、夏をもっと気楽な気持ちで迎えていた。6月の蒸し暑い木曜日の午後、ウォール街近くのピア17の屋上で、緑の柄シャツに白いナイキを履いたセムライは、未来について、少なくとも今後数週間について、明るく語ってくれた。彼の夏はまだ形を整えている最中だった。(「急いで論文テストをしているんだ」)しかし今は、ニューヨークで友人の家に泊まりながら、AI関連のプロジェクトに取り組んでいる。前の晩はソーホーのコワーキングスペースで寝泊まりしていた。そして今、彼はスタートアップアクセラレーターのテックスターズ・ニューヨークシティが主催するイベントの日陰のVIP席に立っていた。何百人もの汗だくの参加者が、まぶしい光の中でうろうろと歩き回っていた。

近くでは、ニューヨーク市長のエリック・アダムス氏がアビエイターグラスとスーツ姿でステージに立ち、コーディングの素晴らしさを称賛した。「私は技術者です」とアダムス氏は語り、多様な協力者を探し出し、「ソースコード」を使ってがんや銃暴力といった社会問題を解決するよう来場者に促した。そして、会場にいた独身の人たちに「若い人か恋人を見つけて、一緒に遊んでください」と促した。

セムライは「何がうまくいくか試す」というアプローチで開発を進めていた。WorkNinjaに加え、彼は実在の有名人をモデルに、彼らの膨大なデータで訓練したチャットボットのプラットフォームを開発していた。ファンが対話できる仕組みだ。また、私たちの言動をすべて記録するブレスレット(セムライはこれを「完璧な記憶」と呼んでいる)のプロトタイプも製作中だ。そして、会話をスムーズにするためのヒントをリアルタイムで提供してくれる。(スタンフォード大学のクラスメートグループは最近、RizzGPTという関連製品を開発した。これは、装着者が口説きやすいようにするアイピースだ。)

彼は、若いプログラマーたちが交流し、相互に影響し合うことで、今年の夏にはAIアプリが爆発的に増えるだろうと予想した(エリック・アダムスもきっと同意するだろう)。「スタートアップの集団が形成され、5年後には人々の間に境界線が引けるようになるだろう。エコシステムの始まりだ」と彼は語った。

夏までに、ティアンは12人の従業員を抱えるチームを編成し、ジャック・アルトマン(OpenAI CEOサム・アルトマンの弟)やStability AIのエマド・モスタクなど、数社のベンチャーキャピタルから350万ドルを調達していた。しかし、会話を重ねるうちに、GPTZero/Originに対する彼の見方が少しずつ変わってきていることに気づいた。今では、AI検出は人間性を証明するツールキットの一部に過ぎないと彼は言った。同じくらい重要なのは、来歴、つまり「コンテンツの資格情報」に重点を置くことだ。そのアイデアは、コンテンツに暗号タグを添付し、作成プロセスから判断して人間が作成したことを証明するというもので、デジタルファイル用の一種のキャプチャのようなものだ。Adobe Photoshopはすでに、新しいAI生成ツールFireflyを活用した写真にタグを添付している。画像を見る人は誰でも、右クリックして、誰が、どこで、どのように作成したかを確認できる。ティアン氏は、テキストでも同じことをしたいと考えており、メディア全体の来歴標準の作成に取り組むコンソーシアムであるコンテンツ認証イニシアチブやマイクロソフトと協力について話し合っているという。

彼が来歴を強調したのは、検出だけでは不十分であることを暗黙のうちに認めていると解釈することもできる(OpenAIは7月に「精度の低さ」を理由にテキスト分類ツールを停止した)。これはまた、デジタルメディアとの関わり方におけるパラダイムシフトの可能性を予見するものでもある。検出という試み全体が示唆するのは、人間がテキストに紛れもない署名(知覚できるもの)を残すということだ。これは、嘘発見器が不正行為が客観的な痕跡を残すと推定するのとよく似ている。来歴は「Made in America」ラベルのようなものに依存している。ラベルがなければ、私たちは違いに気づかないだろう。これは微妙だが意味のある違いだ。人間の文章は、人間より優れているわけでも、より創造的であるわけでも、より独創的であるわけでもないかもしれない。しかし、それは人間的なものであり、他の人間にとって重要なものとなるだろう。

6月、ティアン氏のチームは実用化に向けて新たな一歩を踏み出した。彼は、HumanPrintという新しいライティングプラットフォームを開発中だと私に語った。これは、ユーザーがAIで作成したテキストを改善し、「真正性の証明」を共有できるようにするものだ。ただし、テキストを生成するわけではない。GPTZeroの技術を用いて、人間らしさが足りないテキスト部分をハイライトし、ユーザーに自分の言葉で書き直すよう促す。これは、現在のAIライティングアシスタントの逆転と言えるだろう。「教師は、エッセイの50%以上は自分の言葉で書くべきだと指示できるのです」と彼は述べた。これが同社の方向転換なのかと尋ねると、ティアン氏は「検出の自然な流れ」だと反論した。「責任あるAI利用のゴールドスタンダードとなるというビジョンは常にありました」とティアン氏は述べ、「それは今も変わりません」。それでも、その意味するところは明らかだ。AIによるライティングを止めることは不可能であり、AIと共存していくしかないのだ。

ティアンがGPTZeroを初めて試用していた時、マクフィーが2015年にニューヨーカー誌に寄稿した「Frame of Reference」というエッセイに目を通した。その中でマクフィーは、文章の中で文化的な言及をすることの喜びとリスクについて、軽妙に述べている。「ビヨンセと言えば誰もが彼女を知っている。ヴェロニカ・レイクと言えば、まるでケティコ・スペリオールにいるようだ」と彼は恥ずかしそうに書いている。彼は口ひげを表現する際に使った形容詞を列挙し、「誠実」「生意気」「ジャイロスコープのような」「無邪気」「鎮痛剤のような」「心地よい」「オドベーンのような」「テトラグラマトニックな」などを挙げている。そして最後に、イギリス植民地時代に上流階級の観光客が使っていた、あまり知られていないイギリス用語への言及を編集者に載せるよう、苦労した逸話を披露している。 (彼は勝った。)まさにマクフィーの真骨頂だ。メスのように正確で、少々自己満足的ながらも寛大で、愉快に脱線し、要点に到達するまでは甘やかす。GPTZeroはこの記事を「あらゆる基準で最も人間的」だと評価したとティアン氏は語った。私はマクフィーに電話をかけ、彼の文章が特に人間的であるということはどういうことだと思うか尋ねてみた。

「本当によくわからないんです」とマクフィーは電話で言った。「でも、推測するなら、私の作品は科学、農業、航空など、どんなテーマであっても、人を通してそのテーマに触れているんです。いつも中心人物がいて、そこから学んでいます」。確かに、マクフィーは専門家の目を通して書いている。読者は地質学や素粒子物理学、オレンジに関する難解な知識だけでなく、そのテーマを研究している人物、そしてマクフィーがその人物を研究しているという感覚も得ることができる。

現在92歳のマクフィー氏は、AIが人間の作家に取って代わることについては懸念していないと述べた。「私は極めて懐疑的で、少しも心配していません」と彼は言った。「人工知能のマーク・トウェインなど存在しないと思います」

しかし、私はこう問いかけた。もし数年後、誰かがマクフィーの文章を学習させたMcPheeBot3000を設計し、新しいテーマの本を執筆させたらどうなるだろうか?環境活動家と川を渡ったり、魚類学者とフライフィッシングに行ったりすることはできないかもしれないが、マクフィーの声、スタイル、世界観を捉えることはできないだろうか?ティアンは、機械は模倣することしかできないが、マクフィーは決して同じことを繰り返さないと主張した。「マクフィーのユニークなところは、一昨日のマクフィーには思いつかなかったことを思いつくところだ」

私はマクフィー氏に、架空のMcPheeBot3000について尋ねた。(あるいは、セムライ氏の言う通りなら、それほど架空ではないかもしれないが。)「もしこのことがいつか、私がこの世にいない未来に起こったら」と彼は言った。「娘たちが弁護士を連れて現れてくれるといいのですが」


この記事は2023年10月号に掲載されます。 今すぐ購読してください。

この記事についてのご意見をお聞かせください。 [email protected]までお手紙をお送りください。