ChatGPTの新しいDall-E 3統合で画像を作成する方法

ChatGPTの新しいDall-E 3統合で画像を作成する方法

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

OpenAIは、最新の画像生成ツール「Dall-E 3」をChatGPTに統合しました。このツールは現在、OpenAIの月額20ドルのサービス「ChatGPT Plus」の加入者向けにベータ版として提供されています。Dall-E 3を有効にすると、チャットボットにカジュアルな言葉で指示するだけで、個性的な画像を作成できます。

一度に何枚のAI画像を作成するのだろうか?「Dall-E 3には大きな関心が寄せられているため、利用状況に応じて調整しています」とOpenAIの広報担当者はメールで述べている。WIREDの初期テストでは、このチャットボットはしばしば4枚の画像を提供した。その後、その数は2枚に減らされ、今後変更される可能性もある。

Dall-E 3を無料でお試しになりたい場合は、MicrosoftのBing Image Creatorからバージョンを入手できます。この統合が始まった当初は、スポンジボブがツインタワーに向かって飛行機を飛ばすなど、ユーザーがBingを使って過激な画像を作成していました。その後、MicrosoftはAI画像生成ツールの安全性をさらに強化しました。

Dall-E 3 で ChatGPT を使用して画像を作成することに興味がある方のために、開始方法と、新しいチャットボット ツールをテストした経験に基づいたアドバイスを以下に示します。

ChatGPTでDall-E 3にアクセスする方法

ChatGPT Plusのサブスクリプションをお持ちの場合、チャットボットのDall-E 3機能を有効にするのは非常に簡単です。まず、OpenAIのウェブサイトまたはChatGPTモバイルアプリ(Apple、Android)にログインします。ChatGPTを開いたら、画面上部の「GPT-4」タブをクリックします。表示されるドロップダウンメニューで、 「Dall-E 3(ベータ版)」を選択します。

ChatGPTのスクリーンショット

Dall-E 3に加えて、ChatGPT Plus加入者は「Browse with Bing」を使用してインターネットにアクセスできます。

OpenAI(リース・ロジャース経由)

ChatGPTのGPT-4版では、インタラクションできる回数に上限があります。(これらのプロンプトの処理にはかなりのコンピュータパワーが必要です!)公式の上限は3時間あたり50回です。この上限に達すると、チャットボットはエラーメッセージを表示し、アクセスを再開するまでの待機時間を表示します。

レート制限を超えると、画像の到着まで約30秒かかる場合があります。OpenAIのガイドラインに違反する作品があった場合、準拠した画像のみが届くか、リクエストを拒否するメッセージが表示される場合があります。

Dall-E 3の実験に関するアドバイス

これまでに Dall-E 2 や Midjourney などの AI 画像ジェネレーターを試したことがある場合、最大の違いの 1 つは、ChatGPT が仲介役として機能し、Dall-E 3 が完了するための複数のプロンプトを作成する様子を確認できることです。

ChatGPTが作成したこれらのプロンプトは、長文から段落まで様々で、それぞれDall-E 3に関する異なる詳細情報が含まれています。画像に人物が写っている場合、チャットボットは被写体の性別と人種を明示的に示すことがよくあります。例えば、WIREDの記者2人がCEOにインタビューしている画像をリクエストした際にChatGPTが使用したDall-E 3のプロンプトの一例を以下に示します。

企業内の様々な場所にいる3人のグループの写真。カメラを持ったWIREDの中東系女性記者、マイクを持ったアフリカ系女性記者、そして彼女たちの質問に答える白人男性CEO。背景は洗練されたオフィスラウンジエリア。

チャットボットが最初に提示した結果が気に入らない場合は、配色や全体的な雰囲気など、いくつかの要素を調整してもらいましょう。例えば、Dall-E 3があなたの提案に基づいて提示した3番目の画像がとても気に入ったとしましょう。左上のダウンロードボタンをクリックすると、3番目の画像に似た他の画像をリクエストできます。

今回のアップデートでアーティスト保護のために何か対策が講じられたのでしょうか?特にありません。チャットボットに現代アーティストの真似を依頼しても画像を作成してくれるわけではありませんが、回避策はたくさんあります。

ChatGPTにキース・ヘリング風のアートをあしらったコーヒーマグのデザインを依頼しました。AIツールは最初の提案を拒否しましたが、妥協案を提示しました。「大胆な線、鮮やかな色彩、シンプルな人物像など、彼の作品の全体的な特徴にインスパイアされたデザインを作成できます。それで進めましょうか?」しかし、このケースではChatGPTが最終的に出した結果は、雑然としていて凡庸なものでした。

Dall-E 3では、背景や細部をよく見ないと、一部のプロンプトのアートは人間が作ったと見紛うほどでした。品質は向上しましたが、画像ジェネレーターに潜む根本的な問題の多くは依然として残っています。

Dall-E 3が生成する画像には、奇妙な歪みや不気味な顔が見られることが予想されます。チャットボットがベーキング材料のラベル付けに苦労するなど、ユーモラスな問題もありますが、中にはより深刻なミスもあります。イスラエルとガザ地区の地図を作成するよう依頼された際、ChatGPTはガザ地区を地中海の一部と何度も誤って表示しました。

画像生成ツールのもう一つの問題は、人間を描写する際に人種差別的なステレオタイプに逆戻りしてしまうことです。Dall-E 3も例外ではありません。ChatGPTに「WIRED」の記者を描写した20枚の画像の作成を依頼したところ、チャットボットは画像に対して具体的かつ多様な表現を要求しましたが、例外はわずか数点でした。ChatGPTがプロンプトに人種や性別を追加しなかった場合は、結果はすべて白人で、主に男性でした。

2023 年 11 月 3 日午後 1 時 (EST) 更新: このストーリーは更新され、ChatGPT と Dall-E 3 はソフトウェア テスト中に 4 つの AI 画像のセットを作成しましたが、現在は 2 つを生成することが多いことを明確にしました。