記憶が終わり、生成AIが始まる場所

記憶が終わり、生成AIが始まる場所

Google と Adob​​e の新しい写真操作ツールにより、実際の思い出と AI が作り出した思い出の境界線が曖昧になっています。 

写真と切り取った色紙で作った人物の顔のコラージュ

写真:タラ・ムーア/ゲッティイメージズ

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

3月下旬、資金力のある人工知能(AI)スタートアップ企業が、サンフランシスコのアラモ・ドラフトハウス・シアターで、史上初と謳うAI映画祭を開催しました。Runwayという名のこのスタートアップ企業は、2022年に人々の想像力を掻き立てた、テキストを画像に変換するAIツール「Stable Diffusion」の共同開発で最もよく知られています。今年2月には、Runwayは簡単な指示だけで既存の動画のスタイルを一変させることができるツールをリリースしました。Runwayは新進気鋭の映画制作者たちに挑戦を呼びかけ、その後、映画祭で上映する短編映画10作品を選定しました。 

短編映画は主にテクノロジーのデモンストレーションで、巧みに構成された物語は脇役に甘んじていた。中にはシュールなものもあり、少なくとも一作は意図的に不気味なものもあった。しかし、最後に上映された映画には背筋が凍りついた。まるで映画制作者が意図的に課題を誤解し、動画ではなく静止画を選んだかのようだった。  「 Expanded Childhood(拡張された幼少時代)」と題されたAIによる「映画」は、写真のスライドショーで、ナレーションのエコーがかすかに聞こえた。

ネブラスカ州出身の21歳の映画学生、サム・ロートン監督は後に、OpenAIのDALL-Eを使って画像を加工したと明かした。彼は幼少期の写真を集め、それをAIツールに入力し、画像を拡大する様々なコマンドを与えた。例えば、画像の端を牛や木で埋めたり、実際にはそこにいなかった人物をフレーム内に挿入したり、キッチンの外観を再現したりといったことだ。子犬をもう一匹バスタブに放り込むなんて、どうだろう? ロートンはAIが生成した画像を父親に見せ、困惑した父親の反応を録音し、その音声を映画に挿入した。 

「いや、あれはうちの家じゃない。 うわ、ちょっと待て。あれはうちの家だ。何かがおかしい。何がなんだか分からない。ただ 覚えていないだけなのか?」ロートンの父親が言う声が聞こえる。 

真の記憶はどこで終わり、生成AIはどこで始まるのか?これはAI時代の問いです。私たちの聖なる写真が穴だらけの記憶と融合し、人工知能によって新たなピクセルが一から生成される時代です。ここ数週間、数十億人の指先に届くツールを擁するテクノロジー大手のGoogleとAdobeは、画像の文脈を一変させるAI搭載編集ツールを次々とリリースし、真実、記憶、そして高度な写真表現の限界を押し広げています。 

Googleは2021年にMagic Eraserをリリースし、この分野に足を踏み入れました。現在、同社は一部のAndroidスマートフォンでMagic Editorをテスト中です。これは、被写体の位置を調整し、写真に写り込んだ不要な部分を削除し、その他の見苦しい要素を編集した後、生成AIを用いてピクセルの隙間を埋める機能です。クリエイティブ編集ソフトウェアのメーカーとしておそらく最も有名なAdobeは、今週初め、生成AIエンジンFireflyをAdobe Photoshopに搭載すると発表しました。その名も「Generative Fill」は、テキストベースのプロンプトを介して写真を編集し、新しいコンテンツを挿入する機能です。「雲を追加」と入力すると、雲が浮かび上がります。 

Adobeはこれをクリエイティブワークフローの「副操縦士」と呼んでいますが、これはMicrosoftなどの他のテクノロジー企業が生成AIアプリを説明する際に用いる表現をそのまま踏襲したものです。つまり、ユーザーが依然として完全にコントロールしているという印象を与えます。この表現では、AIはアシストを提供し、トイレ休憩が必要な時にナビゲーションを代行します。これは、AIが実際には地図製作者のように、ユーザーの存在の地図を描き直しているという点では、少々誤解を招く表現です。 

「『思い出を完璧に』という言葉は、おそらく私が今まで読んだ中で最も心に残る言葉でしょう」と、シグナル財団の会長で元Google社員のメレディス・ウィテカー氏は2月にツイートした。これは、Googleが「マジックイレイザー」ツールをより幅広い機種のスマートフォンで利用可能にすると発表したことを受けてのことだ。このツールのマーケティングでは、Googleは荒れた海を前にした少女の画像を掲載している。海岸線の近くには、おそらく彼女の家族ではない4人家族が写っている。マジックイレイザーは彼らを消し去る。 

はっきりさせておきましょう。写真編集はいつでも可能でした。ハサミ、カミソリ、ペイントなど、印刷された写真が存在する限り、私たちは編集を続けてきました。Photoshopの誕生は、パーソナルコンピュータの台頭と同時期に起こりました。誇張表現ではなく、パーソナルコンピュータが全てを変えたのです。 

Photoshopの最初のバージョンは1990年にリリースされました。世界中で話題になったデジタル写真は「ジェニファー・イン・パラダイス」。Photoshopの共同開発者ジョン・ノール氏の妻がボラボラ島のビーチに座っている写真です。デモでは、ノール氏は今では有名な投げ縄ツールを使って妻の輪郭を描き、複製していました。遠くの島をコピー、ペースト、縮小、拡散させていました。「複製された島だ!」とノール氏は2010年にAdobeのYouTubeチャンネルに投稿した動画で語っています。実際には存在しない島。作り物の陸地です。 

今日の違い、つまり生成AIが限界を押し広げているのは、こうした編集のスピードと、誰が編集できるかという点です。「編集ツール自体は古くから存在していました」と、Googleフォトの責任者であるシムリット・ベン=ヤイル氏は言います。「そしてもちろん、私たちもフォトで編集ツールを提供し始めてからしばらく経ちます。これらのプラットフォームのユーザー基盤が拡大するにつれて、これらのツールはよりアクセスしやすく、人々にとってより利用しやすくなりました。そして、編集された画像はより一般的になっています。」 

Googleのマジックイレーサーの初期デモでは、ウェットスーツとブギーボードを着た2人の子供と、遠くの背景に2人の大人が映っています。子供と大人の肌の色は異なり、このデモでは、2人が家族ではないという、やや不自然な仮定が提示されています。これは、2人の距離によっても強調されています。Googleのマジックイレーサーは、背景にいる大人の輪郭を描き、その後、彼らを消し去りました。

今年後半にリリース予定の新しいデモ版「Magic Editor」では、滝の前でポーズをとる女性の肩からバッグストラップを消し、その隙間をジャケットの生地で埋めることができました。ハイキングの写真でバッグストラップがなぜそれほど目障りだったのかは分かりません。しかし、こうした美的判断は写真の制作者の権利だとGoogleは述べています。

AdobeのGenerative Fillは、まさにジェネレーティブです。長毛のコーギーが誰もいない道を駆け抜ける。それだけの写真です。しかし、Generative Fillは道を長く見せます。枯れ木を春の花々に変えます。白いピックアップトラックが現れ、コーギーに向かって走っているのか、それともコーギーから遠ざかっているのかによって、写真の緊張感が著しく変化します。でも、ほら、水たまりができています。これは本当に幸せな写真ですよね?Generative AIは、水たまりに駆け抜ける子犬の姿までも描き出すほど賢く、しかもこれを数秒でこなします。本当に驚きです。

しかし、驚きの後には「次は?」が待っています。例えば、これがハイキングの写真、愛犬、ビーチにいる家族の写真だとしましょう。もし将来、それらが私の脳内で水彩画のように残ってしまい、より鮮やかな筆致を求めて写真ロールを何度も見返すようになったら、あの日のことをどうやって思い出せるでしょうか?ハイキング中、実はバッグを持っていなかったのでしょうか?あの日、ピックアップトラックが愛犬に危険なほど接近したのでしょうか?私はいつも手つかずのプライベートビーチでしか休暇を過ごしていなかったのでしょうか? 

GoogleとAdobe両社の幹部は、ツールの威力は写真の文脈の中で考慮されるべきだと述べています。誰が撮影し、誰が共有し、どこに共有されるのか。「公共の場での写真共有と、プライベートな場での写真共有では、期待されるものが異なると思います」とベン=ヤイル氏は言います。「Googleフォトやあなたが使っているメッセージアプリで誰かがあなたと写真を共有している場合、あなたはその情報源を信頼します。そして、その情報源を信頼しているからこそ、編集は写真の魅力を高めるものと考えるのです。」 

「でも、抽象化の層が多ければ多いほど、出所がわからないので、この写真はどれくらい本物なのか、じっくり考えなければなりません」と彼女は続ける。 

同様に、アドビのアンディ・パーソンズ氏は、AI編集された写真には「多様なユースケース」があると述べています。アーティスト(あるいはアーティストを自認する個人)は、記録ではなく創造的な解釈を意図した写真を、生成AIを使って改変するかもしれません。一方で、「報道機関など、写真に写っているものが現実を反映したものであることを非常に重要に知る必要がある場合、より多くの写真家に透明性の提供が求められるようになると予想されます」とパーソンズ氏は述べています。 

パーソンズ氏はアドビ社内で、いわば来歴の王様だ。彼の本職は、コンテンツ真正性イニシアチブ(Content Authenticity Initiative)のシニアディレクターである。これは、アドビが2019年にコンテンツの起源とメディアの透明性に関する業界横断的なガイドラインを確立するために共同設立したグループだ。パーソンズ氏によると、下院議長のナンシー・ペロシ氏のビデオが加工され、言葉がもつれているように見えたことが「再び歴史を変えた」という。編集がAIによるものとはされていないものの、ペロシ氏のビデオが操作されたことで、アドビは強力な編集ツールの使い方を再考することになった。アドビのCAIにおける初期のパートナーは、Twitterと ニューヨーク・タイムズだった。この連合は現在、さまざまな業界にわたる1000人以上の会員を擁している。

そして2021年、アドビはBBC、チップメーカーのインテルとARM、そしてマイクロソフトと協力し、「デジタル来歴」に関する標準化のための新たなコンソーシアム「コンテンツの来歴と真正性のための連合(C2PA)」を設立しました。マイクロソフトは今週開催された年次ソフトウェアカンファレンスで、Bing Image CreatorがまもなくC2PA標準の暗号化方式を使用してAI生成コンテンツに署名すると発表した。(グーグルのベン=ヤイル氏も、これは同社が現在取り組んでいる分野であり、開始時期が近づき次第、詳細を説明する予定だと述べています。)

「私たちは皆、同じ考えに集中しています」とパーソンズは言う。「偽造の可能性があるものを検知するための軍拡競争に、ある意味負けてしまったと言えるでしょう。溝は越えられてしまったのです。ですから、私たちが取れる防御策と対抗手段は、画像の撮影または作成にどのようなモデルが使われたかを把握し、そのメタデータを信頼できるものにすることです。」 

理論上、これらの暗号規格により、例えばロイター通信社のためにプロの写真家が写真を撮影し、その写真がロイター通信社の国際ニュースチャンネルに配信された場合、写真を依頼した編集者と閲覧する消費者の両方が、完全な来歴データにアクセスできるようになります。影が強調されているか、パトカーが削除されているか、フレームから人物が切り取られているかなど、すべてを把握できます。パーソンズ氏によれば、これらの写真要素は暗号的に証明・検証可能であることが望まれるとのことです。 

もちろん、これらすべては、写真を見る私たち人間が写真の真贋を確かめたい、あるいは確かめる気にもなり、あるいはその方法を知っているという前提に基づいています。つまり、私たちが社会的なもの、文化的なもの、ニュース的なものを区別でき、それらのカテゴリーが明確に定義されていることが前提となっています。透明性は確かに素晴らしいことですが、私はそれでもバレンシアガの法王に惚れ込んでしまいました。スタイリッシュなジャケットを着たフランシスコ法王の画像は、まずr/Midjourneyというサブレディットに一種のミームとして投稿され、Twitterユーザーの間で広まり、その後、AI生成画像の拡散性と影響について報道機関に取り上げられました。芸術、社会的なもの、ニュース、すべてが法王によって等しく祝福されました。今ではそれが偽物だとわかっていますが、バレンシアガの法王は私たちの脳内で永遠に生き続けるでしょう。 

マジック・エディターを見た後、私はシムリット・ベン=ヤイル氏に、道徳的な価値を付与することなく、あることを伝えようとしました。つまり、「私はこれに道徳的な価値を付与しようとはしていません」と前置きしたのです。私たちの人生の多くを記録するためのツールとインフラが存在するだけで、私たちの未来の記憶が巨大テクノロジー企業の手にどれほど握られているかは驚くべきことだ、と私は言いました。

ベン=ヤイルは5秒ほど間を置いてから答えた。「ええ、つまり…皆さんはGoogleにデータの安全を託していると思います。そして、それは私たちにとって非常に大きな責任だと考えています。」 忘れられがちな返答だったが、ありがたいことに私は録音していた。Googleアプリで。 

Adobeが今週Generative Fillを発表した後、  Expanded Childhoodの映像作家サム・ロートン氏にメールを送り、同機能を使う予定があるかどうか尋ねた。ロートン氏はMidjourneyやDALL-E 2のようなAI画像生成ツールを今でも気に入っていると書いているが、AdobeがGenerative AIを自社の最も人気のある編集ソフトウェアに直接統合することの有用性も認識しているという。 

「Twitterでは、AIがグラフィックデザイナーの仕事を全て奪うのではないかという議論がしばらく前から続いています。たいていは、ロゴ生成などができる小規模なAI企業を指しています」とロートン氏は言う。「実際には、Adobeのような大手企業が参入し、デザイナーに直接これらのツールを提供し、彼らを自社のエコシステム内に留めておくことは明らかでしょう。」 

短編映画については、予想以上に人々の反響があり「興味深い」と述べている。AIによって歪められた顔や、明らかに偽物と思われる静止画、そして自身の幼少期に根ざしているという事実が、人々が映画に共感する上で障壁となるのではないかと懸念していたという。「しかし、何度も聞かされた話によると、懐かしさや不気味の谷現象が、観客自身の体験にも浸透しているそうです」と彼は言う。 

ロートン氏は、AIが生成した記憶が完全に真実ではなかったとしても、基礎的な記憶の周囲の文脈をより深く理解できるようになるプロセスが治療効果があると気づいたと私に語った。

5月26日午前11時更新:以前の記事では、Magic Eraserが動画でも使用できると記載していましたが、これは誤りであり、修正されました。また、2つのGoogle製品デモの説明を編集し、それぞれのデモで具体的にどのような機能が紹介されたかを明確にしました。