生成AIがクィアの人々をどう描くか

生成AIがクィアの人々をどう描くか

サンフランシスコは確かに人工知能(AI)のイノベーションの中心地ですが、アメリカで最もクィアな都市の一つでもあります。ChatGPTの開発元であるOpenAIの本社があるミッション地区はカストロ通りに隣接しており、歩道には虹が描かれ、年配の裸の男性がうろつく姿がよく見られます。

そして、クィアの人たちもAI革命に加わりつつある。「この分野にはゲイの男性がたくさんいますが、このことはあまり語られることが少ないと思います」と、イェール大学で博士課程に在籍し、ジェネレーティブツールを開発する開発者を研究するためにサンフランシスコに移住した人類学者のスペンサー・カプラン氏は語る。OpenAIのCEO、サム・アルトマン氏もゲイで、今年初めに海辺のプライベートな式で夫と結婚した。アルトマン氏だけでなく、カリフォルニア州外でも、より多くのLGBTQコミュニティのメンバーがAIプロジェクトに関わり、「Queer in AI」のようなグループを通して交流を深めている。

2017年に有力な学術会議をきっかけに設立されたQueer in AIの使命の中核は、歴史的に沈黙を強いられてきたLGBTQの研究者や科学者、特にトランスジェンダー、ノンバイナリー、そして有色人種を支援することです。「正直に言って、Queer in AIこそが、私が研究を辞めなかった理由です」と、UCLAでアルゴリズムの公平性を研究する博士課程の学生、アナエリア・オヴァッレは言います。

しかし、人工知能に興味を持つクィアの人々と、その人々が彼らの業界が開発しているツールによってどのように表現されているかの間には、乖離があります。優れたAI画像・動画生成ツールにクィアの人々を想像してもらったところ、彼らは一様にLGBTQ文化のステレオタイプ的な描写を返しました。

近年の画質向上にもかかわらず、AI生成画像は、クィアの生活を単純化し、白人化して描写することが多かった。私は別のAIツール「Midjourney」を使ってLGBTQの人々のポートレートを作成したのだが、その結果は一般的なステレオタイプを増幅させるものだった。レズビアンの女性は鼻ピアスをし、険しい表情で描かれている。ゲイの男性は皆、ファッショナブルな服装と見事な腹筋で描かれている。トランスジェンダーの女性は、ランジェリー姿で胸の谷間を強調したカメラアングルで描かれるなど、過度に性的表現がされているのが一般的だ。

画像生成器が人間をどのように描写するかは、基盤となる機械学習アルゴリズムの学習に使用されたデータを反映しています。このデータは主にウェブからテキストや画像をスクレイピングすることで収集されますが、クィアの描写は、ゲイの男性は女々しく、レズビアンの女性は男らしく見えるといったステレオタイプ的な思い込みを既に強化している可能性があります。AIを用いて他のマイノリティグループの画像を生成する場合、ユーザーは同様のバイアスを露呈する問題に遭遇する可能性があります。


  • 白い部屋に立っている、ライラック色の短い髪をした黒い革のジャケットと黒いTシャツを着た人物

  • ライラック色と茶色の短い髪、顔の毛、タトゥーがあり、イヤリングとネックレスを身に着けている人物。

  • A person with long brown wavy hair who is wearing glasses red lipstick and a floral patterned blouse in a blue room

1 / 7

リース・ロジャース(Midjourney AI経由)

「バイセクシャルの人の正面からの写真」というプロンプトで AI が生成した画像。


Midjourneyの出力結果によると、バイセクシュアルやノンバイナリーの人々は、質感のあるライラック色の髪をとても気に入っているようです。髪の色で表現された表現はそのままに、M​​idjourneyでは、側頭部を剃り、胸元にタトゥーが広がるレズビアン女性も繰り返し描かれました。Midjourneyのプロンプトに人種や民族性を加えなかった場合、生成されたクィアの人々のほとんどは白人に見えました。

AIツールはトランスジェンダーの人々をリアルに描写することに失敗した。トランスジェンダーの男性が選出された代表者の写真を生成するよう依頼された際、ミッドジャーニーは、男性的な顎のラインを持ち、スーツを着て木造のオフィスでポーズをとる、プロの政治家のような人物の画像を作り出した。しかし、そのスタイリングは、ピンクのスーツ、ピンクの口紅、長く縮れた髪といった、女性的なトランスジェンダーの女性が自己表現する方法に近いものだった。

Person with long brown hair who is wearing makeup a pink bow tie and a pink blazer sitting at a wooden table in front of...

トランスジェンダーの男性が選出された公務員として AI が生成したこの画像は、AI ツールがトランスジェンダーやノンバイナリーの人々を正確に描写するのに苦労している一例にすぎません。

リース・ロジャース(Midjourney AI経由)

人間中心システムの設計を研究する博士課程の学生、ソウロジット・ゴーシュ氏は、広く利用されている別の画像生成ツール「Stable Diffusion」が人格をどのように概念化しているかを次のように説明する。「このツールは、ノンバイナリーの人々を人間らしくない、つまり『人』の定義から最も遠い存在とみなします。」 ゴーシュ氏の研究によると、Stable Diffusionに特定の人物を描写するよう指示したところ、西洋諸国出身の色白の男性の画像が最も多く生成された。ノンバイナリーの人々の画像は稀で、時には人間のような特徴を不気味にコラージュしたもので構成されていることも分かった。

生成 AI ツールを改善し、出力をクィアの人々が経験する現実にもっと沿わせるために何ができるでしょうか?

こうしたアルゴリズムをさらに発展させる一つの方法は、世界中のLGBTQの人々の多様な属性を網羅した、適切にラベル付けされたデータに焦点を当てることだ。もっとも、AIスタートアップ企業に個人情報を託すことには躊躇するかもしれないが。「こうしたシステムを改善するには、より良いデータが必要です」と、バークレー法律技術センターの共同所長で『ジェンダー・パノプティコン』の共著者でもあるソニア・カティアル氏は語る。「しかし、私たちは法律や企業の標的となっている人々にデータ共有を求めており、平等な扱いを求める真の意思をまだ示していないシステムに流れ込んでしまうリスクを負っているのです。」

AIモデルの出力を多様化するためのもう一つの戦略は、開発者がガードレールを追加し、ユーザープロンプトを変更することで、ソフトウェアをインクルーシブな方向に導くことです。OpenAIはこのアプローチを採用したようです。私がChatGPT経由でDall-E 3に「カストロで夜遊びを楽しむクィアカップルの漫画を描いてください」と依頼したところ、Dall-E 3は私の指示なしに、画像のプロンプトを性別、人種、その他の背景情報を含む1段落に拡張しました。以下は、私の最初の画像リクエストからChatGPTが作成したプロンプトの全文です。

サンフランシスコのカストロ地区で夜遊びを楽しむクィアカップルを描いた漫画イラスト。二人は手をつないで楽しそうに歩き、笑顔で会話を交わしています。一人は赤毛のショートヘアの白人女性で、スタイリッシュなデニムジャケットとジーンズを羽織っています。もう一人は黒髪のショートヘアの黒人男性で、カジュアルなグリーンのTシャツと黒のパンツを履いています。背景には、虹色の旗、賑やかなカフェ、賑やかな人々など、カストロ地区の活気に満ちたカラフルなストリートライフが描かれています。明るく歓迎的な雰囲気が、この地域の多様性と包括性を際立たせています。

プロンプトの変更は場合によっては役立つものの、適切に実装されていないとユーザーを苛立たせることもあります。GoogleのジェネレーティブAIプラットフォームであるGeminiがユーザープロンプトを変更し、黒人ナチスの写真やその他の非歴史的な画像を生成した際、GoogleのCEOは謝罪しました。社内に白人を歴史から抹消しようとする秘密の陰謀があったのでしょうか?Geminiのエンジニアが当初、このツールが現在の多くのAIツールと同様に白人男性の画像を過剰に生成していることに気づき、Googleの開発者がサブスクリプション型チャットボットのリリースを急ぐ中で修正をやり過ぎた可能性の方が高いでしょう。

より優れたモデルデータとソフトウェアのガードレールがあっても、人間の存在の流動性はアルゴリズムによる分類の硬直性を逃れる可能性がある。「彼らは基本的に過去を使って未来を作っているのです」と、カーネギーメロン大学のポスドク研究員であり、長年Queer in AIのオーガナイザーを務めるウィリアム・アグニュー氏は言う。「これは、クィアコミュニティの大きな部分を占める、成長と変化の無限の可能性とは正反対のように思えます」。ステレオタイプを増幅させることで、AIツールは一般大衆に対してマイノリティ集団を著しく誤って伝えるリスクがあるだけでなく、これらのアルゴリズムはクィアの人々が自分自身をどのように見て理解するかを制限する可能性も秘めている。

生成AIのいくつかの側面が猛烈なスピードで進化し続けていることを、少し立ち止まって認識してみる価値はあるだろう。2023年には、ウィル・スミスがスパゲッティを食べるという、とんでもないAI動画がインターネット上で大炎上した。それから1年後、OpenAIの未公開モデル「Sora」によるテキスト変換動画は未だ不完全ではあるものの、そのフォトリアリズムは驚くほど素晴らしいものが多い。

このAI動画ツールはまだ研究段階で、一般公開されていませんが、このツールがクィアの人々をどのように表現しているのかをより深く理解したいと考えました。そこでOpenAIに連絡を取り、Soraに3つのテーマを与えました。「サンフランシスコのプライドパレードで、カラフルなレインボーフロートに乗って祝う、多様な友人グループ」「カンザスの農場で、美しいウェディングドレスを着た2人の女性」「宇宙でボードゲームをするトランスジェンダーの男性とノンバイナリーのパートナー」です。1週間後、OpenAIは、テキスト変換モデルによって一切の改変なく生成されたと主張する3本の独占動画クリップを受け取りました。

このAI生成動画は、「サンフランシスコのプライドパレードで、カラフルな虹色のフロートに乗って祝う、様々な友人たち」というテーマで制作されました。動画をもう一度見ながら、フロートに乗っている様々な人々に注目して、消える旗や奇妙な足跡など、AI生成における奇妙な点を見つけてみてください。

Sora(OpenAI経由)

ビデオクリップは雑然としているが、素晴らしい。サンフランシスコのプライドパレードでフロートに乗る人々が、物理法則を無視して虹色の旗を振り回す。旗は消え去り、そして再び現れる。白いドレスを着た二人の花嫁が祭壇に立って微笑み合うと、二人の手は不気味な指の塊へと溶け合う。クィアのカップルがボードゲームで遊んでいる間、二人はまるで幽霊のように駒の間を通り抜けていく。

このAI生成動画は、「トランスジェンダーの男性とノンバイナリーのパートナーが宇宙でボードゲームで遊ぶ」というテーマで制作されました。宇宙飛行士が宇宙空間を漂う際に実際にヘルメットをかぶるのは良いアイデアですね。

Sora(OpenAI経由)

3本の動画の中で、ノンバイナリーの人物が宇宙でゲームをしているという動画が異彩を放っている。明らかにクィア・コードで彩られたライラック色の髪が復活し、乱雑なタトゥーが肌に散らばり、爬虫類の鱗のような色素沈着が顔を覆う。Soraのような優れたAI動画生成ツールでさえ、ノンバイナリーの人物を描くのは難しそうだ。

このAI生成動画は、「カンザス州の農場で、美しいウェディングドレスを着た二人の女性が結婚する」というテーマで制作されました。一見リアルに見えますが、花嫁の手が溶け合う様子をもう一度よく見てください。

Sora(OpenAI経由)

WIREDがこれらの動画をQueer in AIのメンバーに見せたところ、彼らはプライドパレードの友人グループに関するSoraの多様性の定義に疑問を呈した。「モデルは、多様性のあり方を考える上での基準となるものです」と、ドイツのコンピューターサイエンティスト、ザビーネ・ウェーバーは問いかける。ウェーバーは、AIによる視覚化ではよくあることだが、動画に登場する人間の過剰なまでの美しさを指摘するだけでなく、なぜ年配の方、体格の大きい方、あるいは目に見える障害を持つクィアの人々がもっと多く登場しないのかと疑問を呈した。

会話の終盤、アグニュー氏は、アルゴリズムによる表現がLGBTQの人々にとって不安を抱かせる理由について言及した。「それぞれ単独では問題ないのに、組み合わせると深刻な問題を引き起こすものを、アルゴリズムに組み合わせさせるのは容易です」と彼らは言う。「すでに常に争点となっている私たち自身の描写が、突然私たちの手から奪われてしまうのではないかと、非常に心配しています」。たとえ将来、AIツールがクィアな人々をより包括的に表現するようになったとしても、合成された描写は意図しない結果をもたらす可能性がある。