『アンディ・ウォーホルの日記』がAIでアーティストの声を再現した理由

『アンディ・ウォーホルの日記』がAIでアーティストの声を再現した理由

1982年、アンディ・ウォーホルは、ある意味悪名高いロボットにされてしまった。このロボットは、ディズニー・イマジニアリングのベテランが、結局成功しなかったプロジェクトのために作ったものだったが、ウォーホルはアニマトロニクスの姿に満足していた。「機械の方が問題が少ない」と彼はかつて言った。「僕も機械になりたい。そう思わないか?」 1987年に亡くなったこのアーティストは、独自のカルト的な人気を築き上げていた。そして、このロボットは、世界が彼をどう捉えているかを体現したようなものだった。細部まで丁寧に作られているが、彼の話し方はやや堅苦しく単調だった。

アンドリュー・ロッシはそれを知っている。それが、Netflixの新ドキュメンタリーシリーズで、同監督が人工知能(AI)にウォーホルの代弁をさせることに問題を感じなかった理由の一つだ。同名の書籍を原作とした全6話のドキュメンタリー「アンディ・ウォーホルの日記」では、ウォーホルが日記作者のパット・ハケットに語った物語をAIが読み上げるナレーションが部分的に収録されている。その声はウォーホルそっくりだ。そして、世界が知っていたあの声が常に平坦でロボット的なものだったことを思い出す。ウォーホルの作品は、図像表現や表面的な魅力に疑問を投げかけるものだ。ロッシは、そのイメージを維持するために声を平坦に保っていたと語り、実際にどれほどの心を込めたかを偽るためにそうしたと語る。「話す時も、彼の服装や作品の作り方の一部である、この表面的なパフォーマンスを続けていたのです」

それでも、愛される文化人(いや、実際のところ誰であれ)に代わって話すためにAIの音声を使用することには、倫理的なジレンマがないわけではない。ロッシ氏は昨年の夏、モーガン・ネヴィル監督がドキュメンタリー映画『ロードランナー』でアンソニー・ボーディンの声をAIで再現したことをめぐって論争が勃発したとき、すでに『アンディ・ウォーホルの日記』の編集作業を行っていた。ロッシ氏はAIによる再現についてアンディ・ウォーホル財団と協議しており、ボーディンのドキュメンタリーに触発されて『日記の開始数分後に、音声は財団の許可を得て作成されたという免責事項が表示されるようになった。同財団のライセンス責任者マイケル・デイトン・ハーマン氏は、「アンドリューがAIの音声を使用するというアイデアを共有したとき、私は『わあ、これは大胆であると同時に賢い』と思いました」と述べている。

頭に偽の頭蓋骨を乗せてポーズをとるアンディ・ウォーホルのポラロイド写真

『アンディ・ウォーホル・ダイアリーズ』は水曜日にNetflixで初公開される。

Netflix提供

ロッシのドキュメンタリーは率直であることで、『ロードランナー』が直面した大きな問題の一つを回避している。視聴者は最初から、聞いているものがコンピューターで生成されたものだと知っている。一方、ネヴィルが直面した多くの反発は、彼のディープフェイクが最初に明らかにされなかったことに起因する。しかし、だからといって、機械で人の声を再現することが許容される場合と許容されない場合について、未解決の疑問が数多く残されているわけではない。ボーディンのドキュメンタリーでは、AIが話す言葉は実際には故シェフが書いたものだが、彼がそれを話している実際の録音はない。『ダイアリーズ』では、ウォーホルはかつてAIのアンディが話す言葉をすべて話したことがある――ハケットに言ったのだ――が、当時は録音されていなかった。これらの注意事項は何か違いを生むのだろうか?これらのドキュメンタリーはどちらも、被写体が故人であったためにAIを使用している。おそらく、彼らが生きている場合は、別の倫理的懸念があるだろう。再現されたのが声だけではなく、肖像も再現されていたらどうなるだろうか? AIをはじめとする技術は、デジタルエフェクトによって実質的にパフォーマンス全体を制作できるレベルまで進歩しています。近い将来、そうした技術が本当に必要かどうかという疑問が浮上するでしょう。

ゾハイブ・アーメドはこうしたことをよく考えている。Resemble AIのCEOである彼は、ロッシがウォーホルの声を作り出すために頼った人物だ。しかし、アーメドがプロジェクトにサインする前に、ウォーホル財団の同意を得ていた。Resemble AIは一般的に、コールセンターなどの自動音声応答の作成など、まだ生きている人々の声を扱っているが、同社はガイドラインについては厳格な姿勢を保っているという。「(ウォーホルの)日記は本当に興味深い書き方で書かれていて、まるで声に出して読まれるように書かれているかのようです。彼の声で書かれているんです」とアーメドは言う。「まるでアンディの作品の延長線上にあるようなものなので、倫理的なジレンマを感じるようなものを作ることはありませんでした」

そのため、二人にとってこのプロジェクトは倫理的ではあるものの、簡単ではなかった。まず、ウォーホルが自分のために作り上げたあの声があった。ピッツバーグで育ち、ニューヨーク市のアートシーンで何年も過ごした経験から生まれた単調な声だ。また、アーメドと彼のチームには、使えるあの声がたくさんなかった。会社が始まったとき、約3分12秒の音声データしかなく、約30ページのテキストを読み上げられる音声を作成する必要があった。これを実現するために、ResembleのAIエンジンは、データセット内にあったウォーホルの声の特徴、つまり音素を使って、含まれていない音素を予測し、かなり充実した音声を作成した。次に、その音声は会社のウェブプラットフォームに読み込まれ、ユーザー(この場合はロッシ)は、声に言わせたい言葉を入力し、AIに調整を依頼して、思い通りの音声になるまで調整してもらえた。アーメドは、このように人間が関与できることは「本当に強力」だと言う。これにより、ロッシは感情を変化させたり、ウォーホルにアクセントが必要な言葉を言わせたりすることが可能になった。例えば、友人であり共同制作者でもあるジャン=ミシェル・バスキアの名前などだ。

結局、AIはその数分だけで全てをこなしたわけではない。ロッシ監督は途中で、俳優のビル・アーウィンにウォーホル風の声でセリフをいくつか録音してもらい、機械が適切な話し方を学習できるようにした。「AIの声の80~75%とビルの演技の20~15%を組み合わせたモデルを試しました」とロッシ監督は言う。「最終的に、シリーズ全体を通してアンディの声は、この補間モデルでさまざまな音域を表現しています」。例えば「クアルーダ」や「ロールシャッハ・テスト」など、一部の単語はピッチの変調が必要で、ロッシ監督はアルゴリズムに音声的に音を挿入し、AIに独創的なスペルで特定の言い方をするように強制することもあった。「覚えておいてください」と監督は言う。「これはピッツバーグ訛りのアンディが、ベテランのニューヨーカーとして電話で名前と場所を伝えているのです」

アンディ・ウォーホルの日記は、可能性の可能性を改めて示す作品だ。AIを用いて長らく失われた巨匠たちを蘇らせることの倫理性について、現在渦巻く疑問のすべてに完全に答えているわけではない。しかし、AIが過去の再現にどれほど近づけるか、そしてそれが一体何なのかを透明性を持って示してくれる。「AIが作り出した声を初めて聞いた時、ウォーホルの日記に命を吹き込み、この謎めいた芸術家を人間らしく表現する、信じられないほど効果的な方法になるだろうと確信しました」とヘルマン氏は語る。言い換えれば、ロボットはウォーホルを理解する上で、何よりも役立つ存在なのかもしれない。


WIREDのその他の素晴らしい記事

  • 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
  • 彼らは「助けを求めて」いました。そして何千もの
  • パンデミックにより小児ワクチン接種率が急落
  • MWC 2022で最も興味深い発表
  • エルデンリングは今年のゲームだ
  • 今日のスタートアップは資金が潤沢で倹約家だ
  • 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
  • 🎧 音に違和感を感じたら、ワイヤレスヘッドホン、サウンドバー、Bluetoothスピーカーのおすすめをチェック!