ディープフェイクが企業研修の新たなツールとして注目を集めている

ディープフェイクが企業研修の新たなツールとして注目を集めている

今月、広告大手WPPは、世界中の数万人の従業員に、一風変わった企業研修ビデオを配信します。プレゼンターは受信者の言語で話し、名前を呼びながら、人工知能の基本概念を説明します。ビデオ自体がAIの可能性を力強く示すものとなります。顔と、そこに映る言葉は、ソフトウェアによって合成されます。

WPPはそれらをそう名乗ってはいないが、同社の合成トレーニングビデオはディープフェイクと呼ばれるかもしれない。これは、AIによって生成された、本物に見える画像や動画を指す曖昧な用語である。画像生成AIは、嫌がらせ、ポルノ、あるいは偽装工作のツールとして最もよく知られているが、現在では大企業によって企業研修といった平凡な目的にも利用されている。

画像には人物、衣服、顔が含まれている可能性があります

WPP提供

ロンドンのスタートアップ企業Synthesiaの技術を用いて制作されたWPPの非現実的な研修ビデオは、完璧ではない。WPPの最高技術責任者(CTO)ステファン・プレトリウス氏によると、プレゼンターの話し方の韻律が乱れていることがあるという。これは、WIREDに公開された初期版では視覚的には滑らかだったが、最も不快な欠点だったという。しかし、ビデオを個人に合わせてカスタマイズし、ローカライズできることで、通常の企業向けビデオよりも魅力的な映像が制作できると彼は言う。「この技術は急速に進歩しています」とプレトリウス氏は言う。

ディープフェイク風の制作は安価で迅速という利点もある。新型コロナウイルス感染症による制限で従来の動画撮影がより困難でリスクが高まっている今、この利点はさらに増している。プレトリウス氏によると、WPPの全社員を対象とした社内教育キャンペーンには、世界中の従業員向けに20種類の異なる台本が必要になる場合があり、それぞれ制作費は数万ドルに上るという。「Synthesiaを使えば、多様性に富み、あなたの名前と所属機関の名前、そしてあなたの言語で話すアバターを作成できます。全体で10万ドルかかることもあります」と彼は言う。今夏の研修キャンペーンでは、言語は英語、スペイン語、中国語に限定されている。プレトリウス氏は、約5分の20モジュールからなる動画クリップを、今年中に5万人の従業員に配信したいと考えている。

「ディープフェイク」という用語は、2017年に機械学習を用いてハリウッド女優の顔を挿入した一連のポルノ動画を公開した人物(複数名)のRedditユーザー名に由来しています。彼らのコードはオンラインで公開され、現在では様々な形態のAI動画・画像生成技術が、関心のあるアマチュアであれば誰でも利用できるようになりました。ディープフェイクは活動家に対する嫌がらせの道具となり、政治的な偽情報を懸念する議員やソーシャルメディア幹部の間で懸念材料となっています。しかし、ニコラス・ケイジを出演していない映画に挿入するなど、娯楽目的で使用されることもあります。

煽動、嫌がらせ、あるいは娯楽のために作られたディープフェイクには、通常、明らかな欠陥がつきものです。スタートアップ企業は現在、従来の企業映像やマーケティング写真の代替として通用する動画や画像を生成できるAI技術を開発しています。これは、合成メディアや合成人物が主流になりつつある中での出来事です。著名なタレント事務所CAAは最近、200万人以上のフォロワーを持つ、コンピューター生成のインスタグラムインフルエンサー、リル・ミケーラと契約しました。

モデルの顔の4つ

スタートアップ企業のローズバッドは、さまざまな外見のモデルの画像を生成できるAIソフトウェアを開発した。

ローズバッド提供

Rosebud AIは、eコマースやマーケティングで使用されるような、洗練された画像の作成を専門としています。昨年、同社は実在しない人物のモデル写真2万5000枚を収録したコレクションと、あらゆる写真に合成顔を差し替えられるツールを公開しました。最近では、マネキンに着せた服を、仮想でありながらリアルなモデルに着せることができるサービスを開始しました。

ローズバッドのCEO兼創業者であるリシャ・リー氏は、同社はリソースが限られている小規模ブランドが、より多様な顔を起用した、より力強い画像ポートフォリオを作成できるよう支援できると述べている。「視覚的なストーリーを伝えたいブランドは、かつては大規模なクリエイティブチームを編成するか、ストックフォトを購入する必要がありました」と彼女は語る。しかし今では、アルゴリズムを活用してポートフォリオを作成できるのだ。

デンマークのホイビャウに拠点を置くストックフォトのスタートアップ企業、JumpStoryは、Rosebudの技術を実験的に活用しています。同社は既に、視覚的に最も印象的な写真だけを集めたライブラリをキュレーションする社内機械学習技術を基盤とした事業を構築していました。Rosebudの技術を活用し、JumpStoryは顧客がストックフォトの顔を数回クリックするだけで変更できる機能をテストしました。これには、人物の見た目の民族性の変更も含まれます。これは、通常では実現不可能か、Photoshopを使った綿密な作業が必要となる作業です。

ジャンプストーリーのCEO、ジョナサン・ロー氏は、画像の信憑性を重視したため、この機能をリリースしなかったと述べている。しかし、この技術は実に印象的だった。「ポートレート写真であれば、非常に効果的に機能します」とロー氏は語る。しかし、全身写真など、顔が目立たない写真では、一般的にそれほど良い結果は出ないと彼は言う。

WPPのディープフェイク・プロジェクトを支えたロンドンのスタートアップ企業Synthesiaは、アクセンチュアやSAPなどの企業クライアント向けに、合成音声による語り手を使った動画を制作している。昨年は、デビッド・ベッカムがヒンディー語、アラビア語、そしてルワンダで数百万人が話すキニャルワンダ語など、複数の言語でマラリアに関するPSAを語る様子を同社が支援した。

サッカースターのデビッド・ベッカムがヒンディー語やアラビア語を含む複数の言語で話しているように見える、Synthesia のビデオ。

シンセシアのCEO兼共同創業者であるビクター・リパーベリ氏は、消費者と企業の動画への需要は従来の制作体制では到底満たせないため、合成動画の普及は避けられないと述べている。「カメラを使わずに動画を制作しようというのです」とリパーベリ氏は語る。リパーベリ氏によると、新型コロナウイルス感染症の影響で多くの動画撮影が中止となり、一部の企業が新たな従業員教育・研修制度の導入を余儀なくされて以来、同社の技術への関心が高まっているという。

Synthesiaのツールを使えば、わずか数秒で動画を作成できます。リストからアバターを選択し、台詞を入力して「動画を生成」ボタンをクリックするだけです。同社のアバターは実在の人物をモデルにしており、その人物の画像を使った動画の制作量に応じてロイヤリティが支払われます。Synthesiaのアルゴリズムは、人物の実写動画を解析した後、顔の動きと合成音声のセリフを一致させる新しい動画フレームを生成します。合成音声は20以上の言語で生成可能です。クライアントは、人物の数分間のサンプル映像を提供することで独自のアバターを作成し、周囲の環境や声もカスタマイズできます。

リパルベリ氏をはじめとするディープフェイクの商業化に取り組む人々は、ただ金儲けを急ぐのではなく、慎重に進めていると述べている。シンセシアは倫理規定をオンラインに掲載し、顧客とそのスクリプトを精査していると述べている。容姿を合成する前には正式な同意を得る必要があり、政治的なコンテンツには手を出さない。ローズバッドも、合成画像の悪影響や悪影響と闘うことを誓う、より詳細な倫理声明を発表している。

ローズバッドのCEO、リー氏は、自身の技術は害よりも利益をもたらすはずだと語る。多額の制作予算をかけずに、より幅広い層の人々が競争に参加できるようにすることで、美の基準の拡大を促すはずだと彼女は言う。彼女の技術は、ノンバイナリージェンダーや様々な民族のモデルを生成できる。「私が関わっているユーザーの多くは、ユーザー層を代表する多様なイメージを作りたいと考えているマイノリティブランドのオーナーです」とリー氏は語る。リー氏は10年以上、モデルの副業をしていた後、バークレー大学で統計学と機械学習の博士号を取得し、ベンチャーキャピタリストとして活躍している。

アリゾナ州立大学のAI教授、スバラオ・カンバンパティ氏は、この技術は素晴らしいと述べる一方で、ローズバッドの顧客の中には、少数派コミュニティの実在の人物の代わりに、多様な合成モデルを使用する人もいるのではないかと懸念している。「現実を変えることなく、表現という点で誤った達成感に陥ってしまう可能性がある」と同氏は指摘する。

合成画像が企業の主流になっていくにつれ、大手ブランドとその広告代理店は、人々がこの技術をどのように体験するかに大きな影響を与えるだろう。WPPのプレトリウス氏によると、同社はAI合成画像の様々な用途を模索しており、これまでにレンブラント風の肖像画や、実在の人物と見分けがつかないデジタルモデルなどを制作してきたという。「技術的には可能ですが、市場への展開はまだゆっくりと進んでいます」とプレトリウス氏は語る。同社の法務顧問は、合成モデルやその他の画像に関する倫理基準の策定に取り組んでおり、その中には、見た目と実際が異なることをいつ、どのように開示するかといった事項も含まれている。


WIREDのその他の素晴らしい記事

  • 国は再開している。私はまだロックダウン中だ
  • ポッドキャストやライブ配信を始めたいですか?必要なものはこちらです
  • ドゥームスクロールはゆっくりとあなたの精神的健康を蝕んでいる
  • 女子ローラーダービー、コロナ対策で素晴らしい成果
  • ハッカー用語集: サイドチャネル攻撃とは何ですか?
  • 👁 適切に活用すれば、AIは警察活動の公平性を高める可能性があります。さらに、最新のAIニュースもご覧ください
  • ✨ ロボット掃除機からお手頃価格のマットレス、スマートスピーカーまで、Gearチームのおすすめ商品であなたの家庭生活を最適化しましょう