ゴリラに関しては、Googleフォトは盲目のまま

ゴリラに関しては、Googleフォトは盲目のまま

2015年、ある黒人ソフトウェア開発者が、Googleのフォトサービスで黒人の友人と写っている写真に「ゴリラ」というラベルが付けられたとツイートし、Googleを困惑させた。Googleは「愕然とし、心からお詫び申し上げます」と表明した。この削除活動の顔となったエンジニアは、今後は複数の画像に「ゴリラ」というラベルを付けることはないとし、Googleは「長期的な解決策に取り組んでいる」と述べた。

2年以上経った今、その修正の一つとして、ゴリラをはじめとする霊長類をサービスの語彙から削除することが行われている。この厄介な回避策は、Googleをはじめとするテクノロジー企業が、自動運転車やパーソナルアシスタント、その他の製品への活用を目指している画像認識技術の発展において直面している困難を如実に示している。

WIREDは、動物が多数写っている4万枚の画像コレクションを用いてGoogleフォトをテストした。パンダやプードルなど多くの生き物を見つけるという点で、素晴らしい結果を示した。しかし、「ゴリラ」「チンパンジー」「チンパンジー」「サル」という検索語句に対しては、「結果なし」と表示された。

画像にはテキストページチームフットボールサッカーボールチームスポーツサッカーボールスポーツとスポーツが含まれている場合があります

Googleは、個人の写真整理サービス「Google フォト」内で「ゴリラ」「チンパンジー」「サル」の検索を検閲した。

スクリーンショット: Wired

モバイルアプリとウェブサイトで提供されているGoogleフォトは、5億人のユーザーに個人的なスナップ写真を管理・バックアップする場を提供しています。機械学習技術を活用し、湖やラテなど、似たようなコンテンツの写真を自動的にグループ化します。同じ技術により、ユーザーは自分のコレクションを検索することもできます。

WIREDのテストでは、Googleフォトはいくつかの霊長類を識別しました。「ヒヒ」「テナガザル」「マーモセット」「オランウータン」などの検索はうまく機能しました。オマキザルやコロブスも、Mの「M」を付けずにこれらの用語で検索すれば見つかりました。

別のテストでは、WIREDは非営利団体Chimp Havenとダイアン・フォッシー研究所から提供されたチンパンジーとゴリラの写真20枚をアップロードした。一部の類人猿は「森」「ジャングル」「動物園」などの検索語で見つけることができたが、残りの類人猿は見つけるのが困難だった。

結論:Googleフォトでは、ヒヒはヒヒだが、サルはサルではない。ゴリラやチンパンジーは見えない。

画像には野生動物の哺乳類とゴリラが含まれている可能性があります

スマートフォンの写真を解釈するGoogle Lensも、ゴリラを認識できないようだ。

スクリーンショット: Wired

Googleフォトの人物認識を評価するための3つ目のテストとして、WIREDは顔認識研究で使用された1万枚以上の画像コレクションもアップロードした。「アフリカ系アメリカ人」という検索語では、草を食むアンテロープの画像しか表示されなかった。「黒人男性」「黒人女性」「黒人人物」と入力すると、Googleのシステムは白黒の人物画像を表示した。性別は正しく分類されていたものの、人種によるフィルタリングは行われなかった。肌の色が濃い人物が選択されているように見える検索語は「アフロ」と「アフリカ人」のみだったが、結果はまちまちだった。

Googleの広報担当者は、2015年の事件以降、「ゴリラ」が検索や画像タグから検閲され、「チンパンジー」「チンパンジー」「サル」も現在ブロックされていることを確認した。「画像ラベル付け技術はまだ初期段階であり、残念ながら完璧には程遠い」と広報担当者はメールで述べ、ユーザーが間違いを報告できるGoogleフォトの機能を強調した。

ゴリラの画像に関するGoogleの警告は、既存の機械学習技術の欠陥を浮き彫りにしている。十分なデータと計算能力があれば、ソフトウェアは画像を分類したり音声を高精度に書き起こしたりするようにトレーニングできる。しかし、そのトレーニングで得た経験値を超えることは容易ではない。そして、どんなに優れたアルゴリズムであっても、人間のように常識や抽象的な概念を用いて世界の解釈を洗練させる能力が欠けているのだ。

その結果、機械学習エンジニアが自らの成果を現実世界に展開する際には、訓練データには見られない「コーナーケース」を懸念せざるを得なくなります。「システムが実際に稼働すると、あらゆる事象をモデル化するのは非常に困難です」と、バージニア大学のビセンテ・オルドニェス・ロマン教授は述べています。彼は昨年、画像に機械学習アルゴリズムを適用すると、性別役割に関する偏った見方を拾い上げ、増幅させる可能性があることを示す研究に貢献しました。

Googleフォトのユーザーは、様々な不完全な条件下で撮影された写真をアップロードします。膨大なデータベースに収められた画像の数を考えると、ある種の大型類人猿を別の種類の大型類人猿と間違える可能性は、ごくわずかであってもほぼ確実と言えるでしょう。

Googleの親会社であるAlphabetやテクノロジー業界全体は、自動運転車のように、よりリスクの高い形でこの問題に直面しています。ロマン氏は、ソフトウェア信頼性の専門家である同僚のバイシャキ・レイ氏と共に、自動運転車などのシナリオで使用される視覚システムの挙動を制限する方法を研究しています。レイ氏によると、進歩は見られるものの、このようなシステムの限界をどの程度うまく管理できるかはまだ不透明です。「これらの機械学習モデルが何を学習しているのか、まだ具体的な形では分かっていません」と彼女は言います。

Googleの機械学習システムの一部は、公共の場でゴリラの検出が許可されています。同社のクラウドコンピューティング部門は、企業向けにCloud Vision APIと呼ばれるサービスを提供し、自社のプロジェクトに組み込むことができます。WIREDがゴリラとチンパンジーの写真を使ってオンラインデモをテストしたところ、両方を識別できました。

例えば、大人のゴリラが双子の赤ちゃんをあやしている写真は、GoogleのCloud Visionサービスによって94%の信頼度で「ニシゴリラ」とタグ付けされました。このシステムは、画像に関連するタグについて、最良の推測リストを返します。「哺乳類」と「霊長類」も90%以上の信頼度を獲得しました。

この画像には動物、野生動物、哺乳類、ゴリラが含まれている可能性があります

Google が企業向けに提供するクラウド コンピューティング画像認識サービスでは、ゴリラをゴリラと呼ぶのは自由です。

スクリーンショット: Wired

AppleのSiriに対抗する広告会社Googleアシスタントも、ゴリラをゴリラと呼ぶ権利を主張しています。Androidスマートフォンでは、Googleアシスタントを呼び出して画面に表示されている内容を解釈させることができます。双子の赤ちゃんゴリラの写真を見るように指示したところ、Googleアシスタントは「マウンテンゴリラ」と提案しました。

しかし、Googleの「コンピュータービジョンの進歩」を体現すると謳われ、昨年10月にGoogleフォトに追加された「Googleレンズ」という類似機能は、異なる動作を見せた。同じ画像を見て解釈するように指示すると、「うーん…まだはっきりと見えません」と返答した。