Prosecraftと呼ばれる文学分析プロジェクトは、作家コミュニティからの反発を受けて閉鎖された。これは、より大きな文化的潮流の変化の前兆と言えるだろう。

写真:エカテリーナ・ブディノフスカヤ/ゲッティイメージズ
ハリ・クンズルは喧嘩を売ろうとはしていなかった。8月7日、ブルックリン在住の作家は地下鉄に座り、ソーシャルメディアをスクロールしていた。すると、Prosecraftという言語分析サイトについて、何人かの作家が不満を漏らしているのに気づいた。このサイトは2万5000以上の作品について、文章や物語のスタイルを分類し、副詞の数といった言語統計や、単語の「鮮やかさ」や「受動性」の度合いによるランキングを提供している。クンズルはProsecraftのウェブサイトを開き、自分の作品が掲載されているかどうか確認した。すると、なんと、掲載されていた。 2017年の『ホワイト・ティアーズ』だ。Prosecraftによると、「鮮やかさ」の度合いは61パーセンタイルだった。
クンズルは憤慨し、高まるプロスクラフトへの抗議に自ら声を上げた。分析自体には腹を立てていなかった。しかし、創設者のベンジー・スミスが彼のカタログを無報酬で入手したのではないかと強く疑っていた。「彼がこのデータベースを合法的な方法で構築することは、私には到底不可能に思えました」と彼は言う。(クンズルはこうした問題についてよく知っている。小説家として成功を収めた経歴に加え、WIREDのライターとして活躍した経歴を持つ。)
「Prosecraftという会社は、大量の書籍を盗み、AIを訓練し、そのデータに基づいたサービスを提供しているようです」とクンズル氏はツイートした。「私は自分の作品がこのように利用されることに同意していません。」
彼のメッセージは瞬く間に拡散した。ホラー作家のザカリー・ローゼンバーグからの嘆願も同様に広まり、ベンジー・スミスに直接連絡を取り、サイトから作品を削除するよう要求した。クンズルと同様に、彼もProsecraftの存在を耳にしており、自分の作品が分析されているのを知った時は憤慨した。「かなり侵害されていると感じました」とローゼンバーグは語る。
他にも何百人もの著者が賛同した。中にはスミス氏に厳しい言葉を投げかける者もいた。「傲慢なテックブロ」「魂のないトロル」「ゴミ漁り」「汚物」「血まみれの痔」
法的措置を検討した人もいました。作家組合には支援要請が殺到しました。「メールがひっきりなしに届きました」と、組合のCEOであるメアリー・ラゼンバーガーは言います。「人々は本当に強く反応しました。」プロスクラフト社は24時間以内に数百通もの差し止め命令を受け取りました。
その日の終わりまでに、Prosecraft は機能しなくなった。(スミス氏はすべてを削除し、謝罪した。) しかし、それが引き起こした激しい反応は、AI に対する大規模な反発が本格化していることを物語っている。
Prosecraftの創設者は、論争が起こることを予期していなかった。
月曜日、ベンジー・スミスさんはオレゴン州ポートランド郊外の小さな町にある自宅に戻ったばかりだった。
週末は感謝瞑想のカンファレンスに参加し、仕事に戻るのが待ち遠しかった。スミスは今年5月までソフトウェアエンジニアとしてフルタイムで働いていたが、文系向けのデスクトップワードプロセッサ「Shaxpir」(そう、「シェイクスピア」と発音する)を開発するスタートアップに集中するために辞めたのだ。Shaxpirの収益はそれほど多くなく、スミスによるとクラウド費用を賄うにはまだ足りず、年間1万ドルにも満たないという。しかし、スミスは楽観視していた。
スミス氏が2017年に立ち上げたProsecraftは、副業の中に副業があるようなものでした。独立したウェブサイトとして、小説の言語分析を無料で提供していました。スミス氏は有料版Shaxpir内のツールにもProsecraftのデータベースを使用していたため、商業的な目的もありました。
今週のテック系男子に選ばれたものの、スミス氏にはベンチャーキャピタルらしい洗練されたところはあまりない。ピアス、鳥のタトゥー、無精ひげといった、まさにポートランディアのステレオタイプそのもの。ストーリーテリングの技術について熱く語る様子は、まるで『ザ・モス』の大ファン役のオーディションを受けているかのようだ。自称演劇少年のスミス氏は、計算言語学の会社で最初のテクノロジー関連の仕事を得る前は、脚本を書いていたこともある。
Prosecraftのアイデアは、2012年のコスタ・コンコルディア号沈没事故の生存者に関する回顧録を執筆中に、自分が賞賛する本の単語数を数えるという習慣から生まれたという。(「食べて、祈って、恋をして」は11万語あるとスミスは言う。)彼はこの種の分析が他の作家にも役立つかもしれないと考え、計算言語学の訓練を活かしていくつかのアルゴリズムを開発した。作家が自分の作品をデータベースに追加できる投稿プロセスを作り、いつかそれが自分の作品集の大部分を占めることを期待していた。(長年にわたり、約100人の作家がProsecraftに投稿してきた。)Prosecraftが、自分が感銘を与えたかったまさにその多くの人々を激怒させることになるとは、スミスには思いもよらなかった。
スミスはこれを、正当な目的のための卑劣な手段だと考えていた。今では自分の行動を弁護していない。「みんなが怒っている理由は理解できる」と彼は言うが、当時どのように自分を弁護したのかを説明したいと考えている。「長い目で見れば、このものを人々に見せることができれば、『わあ、すごくクールだ。前例がない。それに、すごく楽しくて、便利で、面白い』と言ってくれるだろうと思っていました。そして、人々は喜んで、そして惜しみなく原稿を投稿し、出版社も彼らの本をProsecraftで出版したいと思うでしょう」と彼は言う。「しかし、まずは実際に作ってみなければ、このものがどんなものなのかを伝える方法はありませんでした。だから、私が知っている唯一の方法、つまりインターネット上にすべて揃っている方法でデータを集めました」
スミスは分析した書籍を購入したわけではない。ほとんどは海賊版サイトから入手したのだ。Prosecraftを削除した際に投稿した謝罪文でもこのことをほのめかしており、尋ねられれば認めるだろう。しかし、人々がこれほど怒っていることに彼は困惑しているようだ。(「これらの書籍を1冊ずつ買ったら、人々は私への怒りを和らげてくれるだろうか?」と、Zoomで話している最中にスミスは声に出して疑問を呈した。「ええ」と私は答えた。)学術研究を行うためにシャドーライブラリを利用する慣行は長年議論されてきた。Sci-HubやLibgenといったプロジェクトは、古い格言にあるように情報は自由であるべきだと信じる多くの研究者から称賛を受け、学術論文や書籍を配信している。
クンズル氏をはじめとするスミス氏を非難した著者の多くは、主にこの海賊版データベースを非難している。より具体的には、単なる研究ではなく、海賊版ライブラリから派生した著作で金儲けしようとする考えを嫌っている。「データスクレイピング全般に反対しているわけではありません」とデヴィン・マドソン氏は言う。「デジタル人文学の研究者をたくさん知っていますが、彼らは実際に大量のデータをスクレイピングしています」。マドソン氏は先週、Prosecraftについてスミス氏に最初に連絡を取り、苦情を申し立てた一人だ。彼女が不快に感じたのは、スクレイピングされたデータを使って開発された分析ツールから利益を得ようとする試みだった。(マドソン氏はまた、Grammarlyを含むAIライティングツールについても、より広い意味で批判している。彼女の見解では、これらのツールは文体の画一化を助長するからだ。)
ソーシャルメディアでProsecraftがどう映ったかに関わらず、すべての作家が反対していたわけではない。MJ・ジャバニは、Prosecraftに自身の処女作に関するページがあるのを見て喜んだ。「実のところ、Prosecraftが無料で提供してくれていなかったら、この分析にお金を払っていたかもしれません」と彼は言う。彼はサイト閉鎖の決定に賛成していない。「素晴らしいアイデアだったと思います」と、作品を投稿したダニエラ・ザムディオは言う。
しかし、海賊版ライブラリについては支持者でさえ懸念を抱いている。例えばザムディオ氏は、人々が海賊版に憤慨している理由は理解しているものの、投稿に基づくデータベースを導入することでサイトが復活することを期待している。
Prosecraftに対する道徳的反論は明確だ。書籍は海賊版だったのだ。海賊版に反対する作家たちは、スミスのプロジェクトに対して明確な反論を展開している。
しかし、スミス氏はあれほどの非難を浴びるに値する人物だったのだろうか?「彼は非難されるべきだったと思います」とクンズル氏は言う。「WGAストライキや大規模言語モデル、その他様々な機械学習への注目といった状況において、スミス氏は今、どれほど繊細な問題なのかを十分理解していなかったのかもしれません」
一方で、そう確信していない人もいる。出版業界アナリストのサド・マキロイ氏もデータスクレイピングを否定している。「海賊版図書館は良いものではありません」と彼は言う。しかし、Prosecraftに対する反発は大きく的外れだと彼は考えている。彼の言葉で言えば、「悲鳴のようなヒステリー」だ。
スミス氏は5年間、同じサービスを問題なく提供してきた。しかし、作家やアーティストが人工知能(AI)に強い警戒感を抱いている今、Prosecraftは突如として新たな状況下で疑わしい存在として映るようになった。AI企業という括りはごく緩い意味でしかなく、Prosecraftは簡単に手に入る果物というよりは、果樹の近くの地面に落ちているキュウリのようなものだった。何か腐ったものがあったのだろうか?確かにそうだ。しかし、それを巻き添え被害と表現するのも不正確ではない。Prosecraftを飲み込んだAIへの反発の真の標的は、現在シリコンバレーで話題のジェネレーティブAI企業、そしてそれらのジェネレーティブAIツールを使って人間の創作活動を置き換えようと計画している企業たちだ。
1年後には、ソーシャルメディアを舞台にしたこの論争を人々が覚えている可能性は低いでしょう。スミス氏は批判に即座に屈し、ほとんど使われていなかった取るに足らない分析ツールは廃止されました。しかし、この事件は、モデルの学習に創作物を無断で利用することに対する、より大きな文化的変化を象徴しています。この件では、ライターたちは受動態の概念を曖昧に理解しているオレゴン州のある人物に対して、あっさり勝利を収めました。
これほど多くの著名な人々が声高に祝福した理由は、現在進行中の大規模な闘いがはるかに長期化し、勝利がはるかに困難になるからではないかと私は考えています。全米脚本家組合がスタジオに対しAIの利用について交渉を求めているハリウッドの脚本家ストライキは、1988年以来最長のストライキとなっています。OpenAIの訴訟は、主導権を奪還するための新たな試みです。前述のように、フェアユースの判例を考慮すると、勝利ははるかに困難なものとなるでしょう。
一方、作家たちも、生成AIが自身の作品をどのように利用できるかについて、独自のガードレールを設けようとしています。例えば、クンズルは最近、出版契約の交渉を行い、自身の作品が大規模言語モデルの学習に使用されないよう規定する条項を追加するよう求めました。出版社はこれに協力しました。
クンズル氏は、法学修士課程の学生が自身の著作をどのように扱うかをコントロールすることに関心を持つ唯一の作家ではない。契約交渉中の多くの作家がAI条項の導入を求めている。中には、必ずしもスムーズに交渉が進んでいるわけではない。「契約にAI条項を盛り込むことに対して、非常に強い反発がありました」とマドソン氏は言う。
文芸エージェントのアン・ティベッツ氏は、ここ数ヶ月、作家からの関心が急増していると感じている。契約交渉において、多くのクライアントがAI条項の盛り込みを求めているのだ。出版社の中には、最も適切な文言について議論し、対応が遅れるところもある。
一方で、この潜在的な新たな収益源のためにいかなる妥協も望まない出版社もある。「AIに関する条項を一切盛り込むことを拒否する出版社も一部ある」とティベッツ氏は言う。一方、広告代理店はすでにAIポリシーの策定を専門とするコンサルタントを雇用しており、この対立が解消されないことを十分に認識していると言える。

ケイト・ニブスはWIREDのシニアライターであり、生成AIブームの人間的側面や、新しいテクノロジーが芸術、エンターテインメント、メディア業界にどのような影響を与えているかを取材しています。WIRED入社前は、The Ringerで特集記事を執筆し、Gizmodoでシニアライターを務めていました。彼女は…続きを読む