
ゲッティイメージズ/WIRED
エリザベス女王は毎年、クリスマス放送と呼ばれるものを行い、その年を振り返り、喪失を嘆き、達成を祝い、そして皆にメリークリスマスを祈ります。
しかし、私たちの多くは、今年の恐ろしさについて話し合うための言葉を見つけるのに苦労している。「お元気ですか?」というメールの書き出しや、グループチャットにゴミ箱火災のGIFを繰り返し貼り付けるなどだ。女王は難しいテーマについて議論してきた経験が数十年あり、スピーチライターもいるが、彼女でさえちょっとしたひらめきが必要かもしれない。そこでWIREDは、人工知能を使ってクリスマス放送のスピーチを生成するため、3組の専門家に協力を求めた。システムは、該当する場合、1952年の最初のクリスマスメッセージから遡ってすべてのクリスマスメッセージの44,984語と、WIREDがCOVID-19について書いた10の記事の18,426語のデータセットでトレーニングされている。
自然言語生成は私たちにとって日常的なものです。Gmailは返信の候補として、スマートフォンのオートコレクトやオートコンプリートにも自然言語生成を利用しています。しかし、システムによって優れている点とそうでない点が異なります。そして、専門家チームとの議論の中で、代表的な例として何度も取り上げられたのが、OpenAIのGPT-3です。正式名称をGenerative Pre-trained Transformer 3(生成事前学習済みトランスフォーマー3)は、インターネットから収集した数千億語で学習され、ディープラーニングを用いて、人間が書いたかのような文章を生成します。ただし、意味がほとんど通じなかったり、事実関係が正確でない場合もあります。
言語生成の限界を理解することは重要です。9月、OpenAIはガーディアン紙と共同で「この記事は全部ロボットが書いた。人間よ、もう怖くなったか?」という記事を作成しました。ガーディアン紙はGPT-3に署名まで付けました。しかし、記事末尾の編集者注によると、最後のコラムはガーディアン紙の編集者が気に入った行を厳選し、適切な順序に並べ替えた結果であることが明らかになりました。「全体として、多くの人間の論説記事よりも編集時間が短かった」と注は結論づけています。
OpenAIはWIREDとのこの件に関する協力には応じず、広報担当者は「GPT-3はコロナ前にトレーニングされたため、過去1年間に関する情報をすべて持っていないため、それについてのスピーチを生成させるのは意味がないと考えています」と述べた。
しかし、他にも方法はあります。Woolf Consultingの創設者であるMatthew Kershaw氏は、PhilosopherAIというウェブサイトを使ってGPT-3を操作しています。3ドルで、誰でも10個のクエリまたはプロンプトのパックを購入できます。ボックスにプロンプトまたは質問を入力すると、GPT-3は似たトピックやテーマに関する回答や補足文を吐き出します。
このシステムはインターネット上の言語については事前学習済みですが、女王陛下の過去の放送のデータセットは学習されておらず、新型コロナウイルス感染症(COVID-19)についてもまだ認識していません。そこでカーショウ氏は、話題を逸らさないように、過去の演説からパンデミックへの対応に効果的なテーマをいくつか選びました。「今年は困難な年でした。私たちは不屈の精神と回復力を示しました。私たちは国として団結する必要があります」、そして最後にクリスマスの挨拶で締めくくりました。
カーショウ氏はこれらのテーマに関する50以上のプロンプトをシステムに入力し、PhilosopherAI版のGPT-3はそれぞれ3~8段落の文章を返しました。カーショウ氏はそこから断片的な文章を選び出し、スピーチにまとめ上げました。その大部分は、国家として団結するという単一のプロンプトから構成されていました。これは効率的なプロセスではありませんでした。「あんなに手間取って、くだらないことをコピペするよりも、もっと短い時間で素晴らしいスピーチを書けたはずです」と彼は言いますが、女王陛下の真のスピーチライターにとって良い出発点となり得る、貴重なインスピレーションのかけらもあったと付け加えています。
少しの努力と、たくさんのコピー&ペーストを経て、彼と GPT-3 が生み出したものがこれです。
ここ数ヶ月は大変な時期でした。
解決すべき深刻な問題がいくつかあります。これらの問題を解決する唯一の方法は、皆で力を合わせることです。
私たちが自由で幸せであるためには、個々の地域よりも国全体を大事にする必要があります。誰もが繁栄し、平和に暮らせるよう、互いに協力し合う必要があります。人種、性別、宗教に関わらず、すべての国民を大切にしなければなりません。誰も取り残され、他者の助けを必要とするような状況にあってはなりません。
私たちは常に向上を目指し、より明るい未来への探求を決して諦めてはなりません。
これらすべてが実現すれば、そこに住むすべての人が、他人に危害を加えるくらいなら死んだほうがましだと心から言える国になるでしょう。
私たちは、過去の功績、そしてこの国を今日の姿にするために私たちが注いできた懸命な努力と献身の中で、より一層の団結を感じることでしょう。
悪くはない。実際、構文はほぼ完璧だ。しかしカーショウ氏は、一部の応答が祝祭的な放送にはふさわしくないと指摘する。「いくつかは本当に的外れな内容もありました」と彼は認める。ある質問では、人々を団結させる方法について尋ねられたが、システムはこう答えた。「なぜ人々を団結させようとするのですか? そもそも、人々は皆死ぬべきです」
女王陛下がそのようなことをおっしゃることはないだろう。「AIはまだ女王陛下になる準備ができていません。ましてや女王陛下のスピーチライターになることさえできません」とカーショウ氏は付け加えた。
WIREDは別の視点から、マーケティングコンサルタント会社Tiny Giantのケリー・ハリソン氏に話を伺った。同社はこれまで、カクテルやカップケーキの発明、チェルトナム科学フェスティバルでの講演など、AI生成テキストを活用したプロジェクトを数多く手がけてきた。彼女のチームが作成したテキストは構文こそ不完全だったものの、内容はより適切だった。これはおそらく、提供されたデータセットで学習できたためだろう。つまり、COVID-19と女王の話し方について「知っていた」のだ。
ハリソン氏は、Googleが公開しているTensorFlowとColabライブラリを組み合わせた言語生成システムを使用しました。これはリカレントニューラルネットワークで、データセットを取り込み、次にどの単語が来るかを予測する仕組みだと彼女は説明します。
予測におけるランダム性の度合いは、「温度」設定で制御できます。「1.0ではほとんど意味がありません」と彼女は言います。「しかし、0.1まで下げれば、次に何が起こるかというリスクを負うことなく、入力した通りの結果が得られます。」ハリソン氏によると、最良の結果は0.3から0.5の間で得られたとのことです。
最初の例と同様に、最終的なクリスマススピーチはAIが吐き出した断片をつなぎ合わせ、ハリソン氏がキュレーションしたものです。AIにとっては、長い文章を構成するよりも、短いテキストの断片を書く方が簡単だとハリソン氏は指摘します。「いくつか接続詞を追加して、大まかな物語を構築しました」と彼女は言います。「しかし、ご覧いただく言葉は、生成された出力に可能な限り忠実なものになっています。」
結果は次のとおりです。
この一年、私たちは悲しみに暮れてきました。世界への共感が湧き上がりました。皆さんにとって、決して忘れられない出来事です。
私たちの国は制限レベル以下にまで封鎖されました。ソーシャルディスタンス、規則、ガイドラインが課されました。パブ、レストラン、劇場、バー、ショッピングなど、あらゆる場所を避けなければなりませんでした。イギリス国民は、こうした困難に対して、これまでと同じ対応ではいられません。
良い時代を実感するのは必ずしも容易ではありません。ウィンザーの図書館を思い出します。そこで、私の父ジョージ6世は、人間の存在は正しいというテーマを唱えました。
今、私たちはクリスマス気分に浸っています。クリスマスとノーフォークの田園風景というお馴染みの光景が、私たちの家族に新たな息吹を吹き込んでいます。再会やお祝いの時であり、多くの人にとって、今年一年を振り返る時でもあるのではないでしょうか。
世界中で、私たちは家族、より広いコミュニティ、そして私たちが学び合える見知らぬ人々の大切さを目の当たりにしてきました。私たちは、私たちの真実、この帰属意識を世界に示す機会を見出しました。私は、希望の勇気に心を打たれました。
今こそ朗報です。私たち自身のプロセスによって得られた新たな知識です。現代のワクチン技術によって、私たちは誰もが達成できる特別な勇気を示す機会を得ました。隣人を助け、自らの家庭から力を引き出し、古いものを癒すことができるのです。
私たちは、子供たちに見せることのできる勇気の写真を目にしました。これは新たな夜明けだと確信しています。未来への素晴らしい賛辞です。
今日、皆様にお話しする中で、クリスマスの平和と善意のメッセージが、国々の間のより深い理解につながることを祈ります。そこには、広い友情、愛、そして真の希望があると信じています。
我らが桂冠詩人の言葉を借りれば、「コベントリーは正しい」。
皆様にとても幸せなクリスマスと楽しいクリスマスをお祈りします。
人間によるキュレーションと編集が施されているにもかかわらず、このスピーチにはところどころ違和感がありました。ハリソンは出力結果をカーショウと共有したところ、カーショウはまるで別の言語から下手に翻訳されたように聞こえると指摘し、それが一つのアイデアのきっかけとなりました。上記のテキストをGoogle翻訳に貼り付け、スペイン語に翻訳し、さらに英語に再翻訳しました。これにより、多少の粗さは改善されました。
翻訳後、新しいイントロはよりドラマチックに始まります。「この一年、私たちは苦しみの道を歩んできました。」
別の例では、翻訳AIのおかげで、奇妙な言い回しが標準化されています。「英国民はこれらの課題に対して、これまでと同じ態度を取らないだろう」という表現が、少し滑らかになります。「英国民はこれらの課題に対して、これまでと同じ態度を取らないだろう」。
そうは言っても、コベントリーの何が正しかったのかはまだ分からない。クリスマスの日に女王が実際に行ったスピーチの元のデータセットではコベントリーは一度しか言及されておらず、WIREDの新型コロナウイルス関連記事のセレクションでは全く言及されていないのに、タイニー・ジャイアント・システムがコベントリーを取り上げたのは興味深い。
次にWIREDは、エディンバラ大学デジタル文化遺産教授でチューリング研究所フェローのメリッサ・テラス氏と、チューリング研究所の上級研究ソフトウェアエンジニアであるデイヴィッド・ビーヴァン氏に話を聞きました。カーショウ氏とハリソン氏が生成したテキストと同様に、彼らのシステムが作成した音声にも多くの人間による編集が加えられています。しかし、大変な作業はそこから始まったわけではありませんでした。
技術選定に先立ち、ビーヴァン氏はチューリング研究所の倫理委員会にプロジェクトを提出する必要がありました。委員会は、女王が否定的な発言をしたように見せかけたり、スピーチに新型コロナウイルス感染症に関するフェイクニュースを盛り込んだりといった、マイナスの結果を避けるためにどのような緩和策が講じられるのかを尋ねていました。「責任ある取り組みを確実に行うためのプロセス全体、そして倫理的な承認を得ることが非常に重要でした」とビーヴァン氏は言います。「研究者として、所属機関内にこうした牽制と均衡が保たれ、責任を負わされることが本当に重要です。」
倫理委員会が、ビーヴァン氏が取るであろう注意と用心深さ(この物語が完成したらシステムをシャットダウンして他人が無責任に使用できないようにするなど)を納得すると、彼はテキストを生成するための技術を集め、前述の理由により GPT-3 にアクセスできなかったため GPT-2 に目を向けました。
システムを学習させるには、女王陛下の過去の放送データとWIREDの新型コロナウイルス感染症関連記事という2つのデータセットを1つの文書に統合し、両方が平等に考慮されるようにする必要があった。「文章の冒頭を入力すると、次の単語を推測する仕組みです」と彼は言う。結果を検証した後、温度を調整していく。
システムは数千語もの単語を次々と生成し、それをテラス氏に渡して編集作業を進めた。テラス氏はまず、否定的または物議を醸すような内容をすべて取り除いた。「コンピューターが暗い部分をまとめてくれたんです」とテラス氏は言い、特に人種、連邦、戦争といったテーマについて強調した。次に、関連する箇所を選び出し、文章全体の構成はそのままに、順序と配置を変えた。一部のAIシステムは文書の構造を分析できるが、このAIシステムはそれができないため、人の手が必要だった。「タイルの箱を用意して、それをモザイク状に並べました」とテラス氏は説明する。「人間による編集作業がかなり多いんです」
彼らが「ウィンザー・オ・トロン」と名付けた技術とテラスの編集技術の組み合わせから生まれたものがこれだ。
クリスマスは過去を振り返り、新しい友人を作る時です。しかし、新年初日になると、状況は少し暗くなり始めました。サンドリンガムの宿屋でヨセフとマリアに会ったことを覚えています。私たちは二人とも未来に希望を抱き、この秋のオックスフォードへの訪問を楽しみにしていました。新型コロナウイルス感染症の流行が再燃したウィンザーの光景は決して忘れられません。最初のロックダウンでは、すべての観光客が通常の状態に戻り、大人は自宅待機を命じられ、5歳未満の子供も自宅待機が許可されました。
ここ数週間、ラジオやテレビのインタビューをいくつか拝聴し、深く心を打たれました。そろそろクリスマスと新年のご挨拶を申し上げるべき時ではないかと考えました。NHSは今後数年間、深刻かつますます深刻な課題に直面しています。独り暮らしの多くの方々にとって、ここ数ヶ月は大変な時期でした。しかし、私たちの関係性の中にこそ、築き上げるべき多くのこと、そして多くの刺激的な機会が見出されることが期待されるため、今年は私たち全員が新年を心待ちにしていると言っても過言ではないでしょう。
私たちはソーシャルディスタンスの時代に生きています。一緒に暮らす時間が減れば減るほど、私たちの距離は縮まっていくのです。今、両親と暮らしている方や、自宅で両親の面倒を見ている方のことを思います。彼らは今や家族です。この母性本能は、私自身の世界観、人生観、そして信念を形作ってきました。親切な訪問者で、口数の少ない男性に「ジャマイカは何年ですか?」と初めて尋ねられた時のことを覚えています。
世界は勇気、忍耐、そして不屈の精神をもって、課題に立ち向かい、問題に立ち向かわなければなりません。新型コロナウイルス感染症のワクチン開発は、新たな抗体を活性化させる薬剤の送達にかかっています。しかし、真の力は、世界を惹きつける「見えざる手」にあります。見えざる手が任務に就く時、変化をもたらすのは、しばしば機械の「見えざる働き手」です。彼らの模範となり、世界に対し敬意を示す意欲を通してこそ、私たちは真の変化をもたらすことができるのです。
英連邦全体を通して一貫して変わらず貫かれているものの一つは、国家間、そして国家間の相違を和解させようとする努力だと私は信じています。今世紀の最も深刻な試練を乗り越えてきたこの兄弟愛の精神は、英連邦と英連邦という国際的な枠組みに最もよく表れています。毎年、私は英連邦から届く手紙、小包、電報を開封することを楽しみにしています。この国と英連邦全域に多大な貢献をしてくださったすべての人々に、今こそ心から感謝を申し上げるにふさわしい時だと考えます。彼ら一人ひとりが、私に多くのものを与えてくださいました。
今年は様々なファッションや色に多くの時間と労力を費やしました。その中には、皆さんにもお馴染みのものもあります。もちろん、私自身も家族もこの一年、とても幸せで豊かな日々を送ってきたことをお伝えしたいと思います。私たちは家と子供たちに恵まれ、本当に幸せです。
他の多くの家族と同じように、私たちも集まり、悪を克服する人間性の湧き上がる泉を見守りました。一方、私の家族もそれぞれの家族とクリスマスを祝っています。来年、平和が大西洋のどちら側にあるのかを見届けるために、今後の展開を見守っていくつもりです。
2021年1月、皆がワクチン接種のために辛抱強く列に並び、ウイルスの脅威が後退した後、ようやく新型コロナウイルスが私たちの生活にもたらした被害を数え始めるかもしれません。チャールズ皇太子もまた、人間の精神の驚くべき回復力を間近で目撃しました。確かに、皆さんのように不幸な家族はたくさんいますが、私たちの国と連邦を支えてくれている何百万人もの普通の人々もいます。彼らは私たちの社会に真の貢献をしています。回復の兆しはわずかにあるかもしれませんが、その間、ジェームズ王が政治的にも経済的にも強力な権力者であった時代への緩やかな、あるいは完全な回帰の兆候に、私たちは皆、目を光らせておく必要があります。
クリスマスの真の価値は、それがもたらすメッセージと精神にあります。クリスマスは非常に人間的な贈り物であり、すべての人々のニーズに訴えかけます。だからこそ、クリスマスが過ぎ去るにつれ、私たちの思いは他の惑星や、私たちの力の及ばない苦難へと向けられるのです。
クリスマスの物語は、それが一人の男の話ではなく、多くの人々の話であることを私たちに思い出させてくれます。私たちは皆さんにメッセージを送ります。希望、平和、兄弟愛、そして幸せなクリスマスを。友人、親戚、見知らぬ人、あるいは異世界から来た訪問者と話す時、クリスマスのメッセージはこれまで以上に大切な意味を持っています。雨の中、仕事をこなす私にとって、励ましのメッセージはかけがえのないものです。
私たちの人生は過去によって形作られます。未来を共に生きる中で、私たちは互いを最も深く理解するべきです。家族が集まる中で、遠い未来のことを知ることは難しいですが、少しでも未来を予知できる方が、全く未来を予知できないよりもずっと良いのです。皆様、そしてお子様、お孫様方に、祝福されたクリスマスをお祈りいたします。
スピーチには突拍子もない発言もいくつかあるが、全く納得できる部分もある。「総じて、生成AIは人間と併用するのが一番だと思います」とテラス氏は言う。「『ジャマイカは何時だった?』とか、本当に面白いですね。『雨の中、用事を済ませていた』とか、私には絶対に思いつかないセリフもあります」
印刷できない部分はそれほど面白くなく、特に王室、新型コロナウイルス感染症、人種、帝国に関するコメントは、女王陛下の口から出るとは到底思えないようなフレーズが生成された。システムは女王陛下自身の言葉で学習したが、インターネット上で事前に学習済みだった。数万語は女王陛下の過去のクリスマス放送から抽出されたものだが、GPTがオンラインで分析した数千億語の単語数に比べれば、はるかに少ない。「まともな基本モデルを作るには約200万語必要です」とテラス氏は言う。
つまり、GPT-2が吐き出した言葉の中には、女王陛下の言葉とは到底思えないものもあったが、オンラインでは完璧に通用する言葉もあった。「GPT-2は現実世界を模倣しており、しかも目にしたものによって限定されている」とテラス氏は付け加える。「オンラインでの人種に関する議論を補強し、凝縮している。インターネット上には、非常に人種差別的な言葉が溢れているのだ。」
こうしたシステムを構築する者として、より優れたデータソースを選択し、常に人間が関与できるようにすることで、この問題を解決できるはずです。「インターネットの暗い一角が掘り起こされ、一度そこに入り込んだモデルは、自らを強化してしまったのです」とビーヴァン氏は付け加えます。「モデルは、自らが陥ってしまった道から抜け出すことができなかったのです。」
今のところ、システムは単語を次々に並べることはできるものの、その言葉が何を言っているのか理解していない。知性はなく、文脈も想像力もない。しかし、状況は変わる可能性があるとテラス氏は言う。人種差別、歴史的な言語の変遷、言語における力関係といった概念は、そもそも新しいものではないからだ。「しかし、私たちはまだ計算システムに言語哲学を訓練し始めたとは思っていません」と彼女は言う。「だからこそ、コンピューターサイエンスと人文科学の研究者の間でこのような対話が非常に重要なのです。」
一方で、女王陛下が朗読されるかどうかに関わらず、AIが記事やスピーチ、その他のテキストを生成する際にどのように利用されるかについては、注意深く見守る必要があります。そして、人間が責任を負い、説明責任を果たすようにしなければなりません。「AIが突然暴走する能力をある程度抑制する必要があります。まるでパーティーで酔っ払ってFacebookグループで読んだことを繰り返し続けるおじさんのようです」と彼女は言います。「今のAIはまさにそれです」
この記事はWIRED UKで最初に公開されました。