Googleは米国外でのAI能力向上のため、ユーザーの声に耳を傾ける

Googleは米国外でのAI能力向上のため、ユーザーの声に耳を傾ける

スマートなアルゴリズムはGoogleを長きにわたって成長させてきました。同社は検索市場を席巻し、複雑なボードゲームである囲碁を制覇した最初のソフトウェアを開発しました。そして今、画像とテキストを理解するアルゴリズムが、クラウドサービスへのビジネス誘致、拡張現実(AR)の普及、そしてスマートフォンのカメラを使った検索を促すとGoogleは考えています。しかし、Googleが将来を賭けているアルゴリズムの中には、どこでも同じようにスマートなわけではないものもあります。

グーグルの機械学習システムは、米国のような一部の裕福な地域のデータで最も効果的に機能します。しかし、比較的裕福でない国のデータ、特にグーグルが成長維持に頼っているインドのような新興国からのデータでは、より頻繁に失敗します。

「米国と西ヨーロッパ以外の地域からの学習データセットは非常にまばらです」と、Googleのプロダクトマネージャー、アヌラグ・バトラ氏は語る。バトラ氏は故郷のデリーに戻ると、GoogleのAIシステムの知能が低下すると語る。現在、彼はこの状況を変えようとするプロジェクトを率いている。「パスタはよく理解できますが、ペサラットゥ・ドーサや韓国やベトナムの料理について聞かれると、あまり得意ではありません」とバトラ氏は言う。

この問題を解決するため、バトラ氏はGoogleの数十億人のユーザーの脳とスマートフォンを活用している。彼のチームは「クラウドソース」と呼ばれるアプリを開発し、Googleの画像認識や翻訳アルゴリズムの精度確認といった簡単なタスクの実行をユーザーに求める。今週から、このクラウドソースアプリはユーザーに近くにある物体の写真を撮影してアップロードするよう求めるようになった。

画像には人間と宇宙飛行士が含まれている可能性があります

Google は画像認識アルゴリズムの指導にあなたの協力を求めています。

グーグル

バトラ氏は、これが Google の画像検索、カメラ アプリ、あるいは記念碑やその他の物体に関する拡張現実機能や情報を提供する Google レンズ アプリケーションの改善に役立つ可能性があると述べている。

Googleは、機械学習に積極的に取り組んでいる他のテクノロジー企業と同様に、オンラインで収集した画像にラベルを付ける業務を委託している。しかし、インターネット上の画像は西洋や富裕層に大きく偏っている。「あなたの世界ではミシンがどのように見えるか、スリッパがどのように見えるかといった情報は、私たちにとって非常に役立ちます」とバトラ氏は語る。Googleはまた、AI研究を支援するためのオープンソースコレクションに画像を公開することを許可するかどうかをユーザーに尋ね、ユーザーが投稿した画像を後から確認・削除できるようにする予定だ。

Googleはバンガロールを拠点とするチームを擁し、インドおよびアジアの他の地域の大学やコミュニティグループでクラウドソースアプリの普及活動を行っています。今年は他の地域にも展開し、次はラテンアメリカが有力視されています。バトラ氏は、このプログラムはGoogleのAR(拡張現実)における野望にとって重要な意味を持つ可能性があると述べています。同社のソフトウェアはタージ・マハルを容易に認識できますが、近隣にある他の歴史的建造物をすべて認識できるわけではないとバトラ氏は言います。

クラウドソースアプリの活用は、Googleが世界とそこでの人々の暮らしを理解しようとする幅広い関心を示している。WIREDは、幼児から花嫁、葬儀に至るまで、80以上のカテゴリーの写真に付けられたラベルの検証を依頼された。また、タッチスクリーンに走り書きされた手書きの文字起こしや、カリフラワーを絶賛するオンラインレビューや建築業者を非難するオンラインレビューの文章が、肯定的な感情、否定的な感情、あるいは中立的な感情のいずれを表しているかを認識するための支援も求めていた。

アプリが提示するいくつかのタスクは、Googleがより多くのトレーニングデータを必要とする理由を如実に示しています。例えば、修道女や聖母マリアの画像は花嫁としてタグ付けされ、月面着陸の写真は雪景色としてタグ付けされました。

レディットでは、クラウドソースの投稿者の一人が、アプリが女性の性器の絵を表示して「この画像には『キス』が含まれていますか?」と尋ねる様子を記録した。バトラ氏は、グーグルはアプリに画像を表示する前に不快なコンテンツを除外するよう努めており、ユーザーは見逃した画像を報告できると述べている。

画像にはコーヒーカップとカップが含まれている可能性があります

Amazon は AI システムをトレーニングするために画像をクラウドソーシングしていますが、写真 1 枚につき数セントを支払います。

アマゾン

クラウドソースで収集されたデータは、Googleのシステムがムンバイとマウンテンビューで同様に機能するのに役立つならば、価値あるものとなるでしょう。欧米市場が飽和状態にある中、Googleは成長を維持するためにインドのような新しい市場を必要としています。アルゴリズムが何かを誤解するたびに、ルピーを無駄にしてしまう可能性があります。

Googleは、クラウドソースにデータを提供する人々と報奨金を共有するつもりはありません。アプリは、貢献者にポイント、バッジ、証明書といった報酬システムを提供しています。ポイントを十分に集めると、Googleのハングアウトサービスを通じて他のトップ貢献者とのオンラインチャットに招待されます。

バトラ氏によると、このプロジェクトはインドをはじめとする国々のユーザーから、Googleが自分たちの言語をより良く理解できるよう、どうすればよいかという質問を受けたことから始まったため、依然として大きな熱意が寄せられているという。「西洋で作られた製品が自分たちの言語や世界を本当によく理解してくれると、人々は喜びます」と彼は言う。インドや近隣諸国では、クラウドソース貢献者による草の根グループが次々と設立されている。スリランカのFacebookグループには、3,000人以上のメンバーがいる。

アマゾンは、人工知能(AI)の博士号取得者による研究を社外から支援する独自のプログラムを実施していますが、報酬は実際に支払われます。「A9 Data Collection」というアプリは、主に家庭用品の写真を撮影してアップロードするようユーザーに求めており、アマゾンのクラウドソーシングサービス「Mechanical Turk」と連携しています。今週初め、WIREDはコンロ式エスプレッソメーカーの写真を5枚撮影して35セントの報酬を得ました。

Googleが無償でデータ収集を依頼するのは、クラウドソースが初めてではない。同社はGoogleマップのユーザーにレビュー、写真、地図の更新情報を共有するよう促している。また、ボットがオンラインサービスにログインしてストリートビュー画像から道路標識のデータを収集するのを防ぐため、CAPTCHAも使用している。

カーネギーメロン大学でクラウドソーシングを研究するジェフ・ビッグハム教授は、提示される条件が透明であれば、人々に無償で作業を求めることは問題ないと述べている。しかし、グーグルは動機をオープンにしているものの、ユーザーが自分の貢献がどのような違いをもたらすのかを知るのは難しいだろう。自宅や近所にあるものの画像を数十枚アップロードしたからといって、スマートフォンが即座に賢くなるわけではない。「フィードバックループはそれほど緊密ではない」とビッグハム教授は言う。

Googleがユーザーのデータから得たメリットをどのように活用するのかも明確ではありません。また、貢献内容をオープンソース化すれば、誰でも利用できる可能性があります。バトラ氏によると、クラウドソースユーザーによって実現された改善は、最終的にはGoogleのクラウドコンピューティングチームにも提供される可能性が高いとのことです。この部門は、あらゆる組織に画像認識などの機械学習サービスを提供しています。その中には、Googleが「非攻撃的」と呼ぶドローン映像の分析のために、Googleの機械学習技術をテストしている国防総省も含まれています。

不完全な視力

  • 変わったタスクを実行して画像認識プログラムを改善している人々を紹介します。
  • 2015 年の失敗以来、Google フォトは依然として「ゴリラ」や他の霊長類を認識していない。
  • 多くの機械学習システムのトレーニングに使用されている写真セットは、女性に対する偏った見方を示しています。