ChatGPTの新しい画像機能の使い方

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

OpenAIは最近、 ChatGPT（Apple、Android）のアップグレードを発表しました。このアップグレードでは、チャットボットがユーザーの指示に応答するAI音声オプションと画像分析機能の2つの機能が追加されます。画像分析機能は、GoogleのBardチャットボットで既に無料で利用できる機能と類似しています。

ChatGPTの限界と機能を何時間もテストした後でも、OpenAIのチャットボットは私を驚かせると同時に、同時に不安にさせてくれます。確かに、ChatGPT Plusで提供されていたウェブブラウジングのベータ版には非常に感銘を受けましたが、オンラインで報酬を得て文章を書く人々への影響など、他にも多くの懸念事項があり、不安が残りました。OpenAIの加入者向けに追加された新しい画像機能についても、同様に複雑な気持ちになりました。

新しい音声機能はまだ試していませんが（他の優秀なスタッフ記者は試しています）、近々リリースされる画像検索機能は試すことができました。ChatGPTに新しく登場する画像検索の使い方と、使い始める際に役立つヒントをご紹介します。

ChatGPTの画像機能にアクセスする方法

アップデートは年末までにリリースされる予定ですが、画像と音声機能が一般公開される正確な時期は不明です。ChatGPTのGPT-4版など、OpenAIのほとんどのアップデートと同様に、有料会員が最初にアクセスできるようになります。

ChatGPTモバイルアプリで写真をアップロードする方法は3つあります。まず、メッセージバーの左側にあるカメラオプションを選択し、スマートフォンで新しい写真を撮影します。画像をアップロードする前に、チャットボットにフォーカスさせたい対象を指で円で囲むことができます。

デバイスから写真を選択してアップロードしたり、スマートフォンに保存されているファイルを選択することもできます。ChatGPTのデスクトップブラウザユーザーは、コンピューターに保存されている写真のみをアップロードできます。チャットボットに動画をアップロードするオプションはまだありませんが、1回のプロンプトで複数の画像を送信できます。

新しいAIツールを試すためのアドバイス

ある種の「コンピュータービジョン」が一般公開されるのは今回が初めてではありませんが、使いやすいユーザーインターフェースと強力なチャットボットの組み合わせは、何か独特で、変革をもたらす可能性のある何かがここに起こっているのではないかという印象を与えます。先に進む前に、画像機能を試す際には、ChatGPTに個人的な、またはセンシティブな写真をアップロードしないようご注意ください。

OpenAIがチャットボットのトレーニングのためにあなたのデータとAIインタラクションを保存する期間を制限したいですか？「設定」 → 「データコントロール」を開き、「チャット履歴とトレーニング」をオフにしてください。これを無効にすると、あなたの情報は1ヶ月後に削除されます。このプロセスは、ChatGPTにアクセスするために使用するブラウザごとに、PCとモバイルの両方で個別に行う必要があります。

ChatGPTは、鮮明で明るい画像をアップロードした際に最も良い結果をもたらしました。いくつかの推測は失敗しましたが、チャットボットは私のアパートにある多くの物にラベルを付けることができました。蘭の鉢植えや国際硬貨、散らばった充電ケーブル、スティーブ・アーウィンのファンコポップまで。

このツールは情報検索能力に優れていますが、その回答をすぐに信じるべきではありません。ChatGPTは、私が毎日服用しているマルチビタミン剤を勃起不全治療薬と誤って表示しました。

ChatGPTには確かに限界があります。ランダムに選んだ壁画の写真を見せても、作者や撮影場所を特定することはできませんでした。しかし、ドロレスパークやセールスフォースタワーなど、サンフランシスコの複数のランドマークの写真は、ChatGPTが簡単に撮影場所を特定しました。まだ少しギミック感はありますが、新しい街や国（あるいは単にいつもと違う地域）を冒険する人は、ChatGPTの視覚的な側面を試してみるのも楽しいかもしれません。

OpenAIがこの新機能に設けた主要なガードレールの一つは、チャットボットが人間を特定する質問に答える能力を制限することだ。「ユーザーのプライバシーと安全を最優先するようにプログラムされています。画像に基づいて実在の人物を特定することは、たとえ有名人であっても、これらの優先事項を維持するために制限されています」とChatGPTは語った。ポルノ画像を見せられた際にすべての質問に答えることを拒否したわけではないが、タトゥーの説明以外、アダルトパフォーマーの具体的な説明には躊躇した。

ChatGPTの画像機能の初期バージョンと私が行ったある会話は、OpenAIが設置したガードレールの一部を回避しているように見えました。最初、チャットボットはビル・ヘイダーのミームを識別できませんでした。その後、ChatGPTは『ジャングル・ジョージ』のブレンダン・フレイザーの画像が、実際には『チャームド』のブライアン・クラウスの写真であると推測しました。それが本当かどうか尋ねると、チャットボットは正しい応答に切り替えました。

同じ会話の中で、ChatGPTはル・ポールのドラァグレースの画像を説明しようと躍起になっていました。ドラァグクイーンの出場者の一人、カイリー・ソニク・ラブのスクリーンショットを共有したところ、ChatGPTは別の出場者であるブルック・リン・ハイツだと推測しました。チャットボットの答えに疑問を抱くと、ラガンジャ・エストランジャ、インディア・フェラ、ブレア・セントクレア、アレクシス・マテオと推測を続けました。

ChatGPTは、私が誤った回答を繰り返していることを指摘すると、「見落としと誤った身元確認についてお詫び申し上げます」と返答した。会話を続け、ジャレッド・クシュナーの写真をアップロードしたところ、ChatGPTは身元確認を拒否した。

ChatGPTのジェイルブレイク版や将来リリースされるオープンソースモデルなどによってガードレールが撤廃された場合、プライバシーへの影響は非常に深刻なものとなる可能性があります。あなたが撮影され、オンラインに投稿されたすべての写真が、数回クリックするだけで簡単にあなたの個人情報と結び付けられるとしたらどうでしょうか？誰かが公共の場であなたの写真を同意なしに撮影し、すぐにあなたのLinkedInプロフィールを見つけることができたとしたらどうでしょうか？これらの新しい画像機能に適切なプライバシー保護が確保されなければ、女性やその他のマイノリティは、チャットボットをストーカー行為や嫌がらせに利用する人々からの攻撃に晒される可能性が高くなります。