AI アートが 70 年代のプログレッシブ ロックのアルバム カバーのように見えるのはなぜですか?

AI アートが 70 年代のプログレッシブ ロックのアルバム カバーのように見えるのはなぜですか?

予期せぬ場所で洞察に出会うこともあります。例えば昨年末、 ニューヨーク・タイムズのコメント欄で、AI生成アートについてこれまでで最も的確な描写を目にしました。記事は、ジェイソン・アレンという男性がAIプログラム「Midjourney」で生成した画像をアートコンテストに応募し、優勝した時の出来事を描写していました(端的に言うと、アーティストたちが激怒したということです)。記事はAI画像生成の倫理性に関する議論に焦点を当てていましたが、コメントは難解な道徳的問題とは無関係でした。代わりに、受賞作品の外観について述べられていました。「1970年代のプログレッシブロックのアルバムカバーのような画像をアルゴリズムで生成したアレン氏、おめでとうございます」と書かれていました。コメント投稿者のハンドルネームは?Cynical Observerです。

シニカルかもしれない。しかし、観察眼に優れているのは確かだ。「1970年代のプログレッシブロックのアルバムカバーみたい」というのは、この新しい生成AIアートシーンが頻繁に模倣するものを端的に表している。アレンの受賞作は、SF的なひねりを加えたフランスの新古典主義絵画を彷彿とさせる。流れるようなシエナ色の服と白いローブをまとった女性像が、どことなく異星人のような街並みを背景に、広大な装飾が施された部屋に立っている。不快感を与えるような作品ではない。「ほどよくグルーヴィー」と呼ぶのが適切だろう。しかし、このコンテストの審査員が、ジェスロ・タルの存命メンバー全員だったら、最優秀賞にふさわしい作品になっただろうと言わざるを得ない。 

どれも良い質問で、おそらく人々は何年も熱心に議論し続けるでしょう。しかし、この熱狂と懸念の中で、もう一つの疑問が忘れ去られています。なぜ これほど多くのAIアート作品が、70年代のプログレッシブロックのアルバムカバーのように見えるのでしょうか?

DallEが制作したアルバムカバーは、抽象的な宇宙空間にピラミッドが描かれ、その前にバンドのメンバー4人が立っている。

著者が DALL-E と「1970 年代のプログレッシブ ロックのアルバム カバー」というプロンプトを使用して作成した画像。

OpenAI、ケイト・ニブス経由

幸いなことに、私はジャーナリストなので、アーティストや研究者、美術評論家にAIアートの美学をどう思うか聞いてみることにした。まず、フロリダ大学のアーティスト兼教授であるアメリア・ウィンガー=ベアスキン氏に電話した。ウィンガー=ベアスキン氏は、最近のAIアートで気づいたさまざまなビジュアルトレンドをカタログ化している。彼女は、あるトレンドを「ナイトメア社」と呼んでいる。これは、2015年にリリースされたGoogleの古いジェネレーターであるDeep Dreamによって呼び起こされた画像でよく例えられる。これは、特に恐ろしいLSDトリップの記憶のような、渦巻くサイケデリックなイメージを専門としている。「プログレッシブ・ロックの影響は間違いない」と彼女は言う。ウィンガー=ベアスキン氏が探求するもう1つのカテゴリーは、彼女が「ダダ3D」と呼ぶもので、私がこれらのジェネレーターをいじっているときに引き起こす間抜けなシーンによく似ている。彼女はそれを「シュールレアリストの社交ゲームのようなもの」と表現している。

ウィンガー=ベアスキン氏は、トレンドの分類に加え、これらのジェネレーターにはより広範なスタイルの癖があることに気づいている。彼女は、ディズニー風の西洋アニメーションやアニメが明らかな影響を与えている点、そして白人をデフォルトの人種として扱う傾向を指摘する。これは、ディズニー風の西洋アニメーション、アニメ、そして白人の画像を多く含むデータセットでこれらのジェネレーターを学習させた結果ではないかと彼女は考えている。

レフ・マノヴィッチ氏もこの動向に注目している。ニューヨーク市立大学の文化理論家で教授でもある彼は、昨年からMidjourneyのDiscordサーバーに潜伏し、ユーザーがこのジェネレーターをどのように利用しているかを分析してきた。Midjourneyが昨年秋にアップデートをリリースした後、ユーザーがジェネレーターに求めるものに変化が見られたという。例えば、人間のリアルな描写能力が向上した後、男性と女性の両方の肖像画のリクエストが増加したという。

デジタルアーティストのサム・キングは、2021年にAIアートシーンを熱心に追い始めました。AIアートシーンに衝撃を受けた彼らは、お気に入りの画像をソーシャルメディアで共有し始め、AIテクノロジーが急速に普及すると同時にキュレーターとしてフォロワーを増やしていきました。彼らは、初期のジェネレーターの波は「トリッピーで抽象的なもの」を好んでいたと表現しています。(これらのジェネレーターは、敵対的生成ネットワーク(GAN)として知られています。この表現を、やや創造性に欠ける言い方で「GANism(GAニズム)」と呼ぶ人もいます。) 

キング氏は、拡散モデルと呼ばれる最新のジェネレーター群は、スタイルが明確に異なると考えている。油絵と水彩画が明らかに異なる効果を生み出すように、GANジェネレーターと拡散モデルも明らかに異なる画像を生み出す。例えば、トニー・ソプラノがシュレックと一緒にカプチーノを飲んでいる様子をよりリアルに表現したい場合、拡散モデルの方が説得力のある結果を生み出す可能性が高い。「理論上は、これらのマシンを使えばあらゆる種類の美的感覚を作り出すことができます」とキング氏は言う。しかし、よりリアルであることは、必ずしもスタイルの多様性を意味するわけではない。ウィンガー=ベアスキン氏と同様に、キング氏もディズニーやアニメ、そしてコミックブックアートの影響が頻繁に現れていると見ている。

「これらの企業のレトリックは、想像できるものは何でも作れるというものです。まさに開かれたフロンティアです。しかしもちろん、大衆文化は特定のステレオタイプや比喩に従います」とマノビッチ氏は言う。彼はいくつかのテーマのバリエーションを何度も目にしている。「ファンタジー、おとぎ話、コミック、ビデオゲーム」 

DallEが制作したアルバムカバーには、山岳風景の上に不自然に曲がった虹が描かれている。

著者が DALL-E と「1970 年代のプログレッシブ ロックのアルバム カバー」というプロンプトを使用して作成した画像。

OpenAI、ケイト・ニブス経由

マノヴィッチ氏は、こうした番組に惹かれる人々のタイプが、彼らの個人的な嗜好や好みによって作品の出来栄えを大きく左右すると指摘した。例えば、MidjourneyのDiscordは「男性ユーザーが圧倒的に多い」という。これは、キング氏がMidjourneyから出てきたものについて「無表情で、どこかセクシーに見える女性の描写が大量にある」と述べたこととも一致する。

マノヴィッチに倣い、MidjourneyのDiscordに潜入して、人々がリアルタイムで生み出すものを観察するようになりました。しかし、それは前衛的な世界への旅というわけにはいきませんでした。最初の2分で、「ルネッサンス風に雲を眺める女性」「小さな宇宙の王女、可愛い顔、王冠、魔法の城、ドレス、アニメキャラクター、高解像度、8K」「パイプを吸う老人、肖像画、ハイパーリアリスティック、4K」「男性芸者」といったテーマが提示されました。 

AIアートはどれも本質的に安っぽくて退屈なのだろうか?いいえ。しかし、私たちが夢に描いたものを視覚的に表現するための驚くほど強力なツールを開発し、男の芸者や宇宙の王女を生み出していることは印象的です。まるで、スタインウェイ・モデルDのグランドピアノで「Chopsticks」を何度も演奏する人々を見ているようです。AIアートの見た目については、すでに固定観念が形成されつつあります。最近、あるアーティストがRedditフォーラムから追放されましたが、その理由は、その作品が AIによって生成されたように見えるというだけのことでした(実際にはAIによって生成されたものではありません)。「別のスタイルを見つける必要があります」とモデレーターは言いました。問題の画像は、美しい女性がゆったりとしたローブを着て、鳥に囲まれ、空に赤い目をしているものですが、まるでプログレッシブロックのアルバムカバーのように見えます。

しかし、ここに良い考えがあります。AIによる画像生成は、模倣品の域を出ないかもしれませんが、それでも実際の芸術的ブレークスルーにつながる可能性があります。美術評論家のマイク・ペピ氏は、現在の生成ツールの使い方にはあまり感心していません。「今のところ、MidjourneyやDALL-Eに行って何かを入力すると、ただパソコンをいじっていただけなのに、すごくかっこよく見える場合、明らかにそこに作者の意図はあまりありません。アーティストとしての本当の姿を反映しているとは言えません」と彼は言います。それでも彼は、これらの生成ツールを賢明に使用すれば、本物の芸術性を高めることができる可能性を否定してはいません。「興味深いのは、映画監督やコンセプチュアルアーティストのように、より壮大なアサンブラージュの一歩としてこれらのツールを使用しているアーティストです。そこが、人間の創造性がこれらのツールを最大限に活用できる場所です」と彼は言います。

一方、ウィンガー=ベアスキン氏は、生成AIの最大の美的成果は、もしかしたら意図しないものなのかもしれないと想像するのを好む。この瞬間は、多くの画家が写真技術の出現によって自分たちが時代遅れになるのではないかと恐れていた時代を思い起こさせる。「人々は『これで絵画は終焉だ。機械を使えば肖像画を完璧に再現できる』と言いました」と彼女は言う。「しかし、それが印象派や抽象表現主義、そしてその他あらゆる絵画様式の爆発的な発展につながりました。絵画は必ずしも何かを表現する必要はないと気づいたからです」

同様に、ウィンガー=ベアスキン氏は、この瞬間がアーティストを刺激し、生成AIに反発させ、あるいはそれを破壊的に利用して、真に独創的な作品を生み出すきっかけになる可能性があると考えています。私はこの考えが大好きです。想像してみてください。これほどの技術進歩と誇大宣伝の後、これらの生成AIの最もエキサイティングな成果は、アーティストがそれらに反発するきっかけとなるかもしれないのです。理にかなっています。結局のところ、プログレッシブ・ロックがなければパンクも存在しなかったでしょう。