大手テクノロジー企業に AI データラベリング サービスを提供する企業は、意図せずして 10 代の若者を自社のプラットフォーム上で働かせて雇用し、トラウマになるようなコンテンツにさらしてしまうケースが多い。

写真イラスト: キャメロン・ゲッティ、ゲッティイメージズ
15歳のハッサンは、同年代の多くの子供たちと同じように、オンラインで多くの時間を過ごしていた。パンデミック以前は、パキスタンのパンジャブ州にある故郷のブレワラで、地元の子供たちとサッカーをするのが好きだった。しかし、新型コロナウイルスによるロックダウンで、彼は引きこもりのような生活になり、携帯電話に頼るようになった。「何か食べなきゃいけないときだけ部屋から出てきました」と、現在18歳のハッサンは語る。彼は訴訟を恐れて仮名を希望した。しかし、ほとんどのティーンエイジャーとは異なり、彼はTikTokをスクロールしたりゲームをしたりはしていなかった。子供の頃の寝室から、この高校生はグローバルな人工知能サプライチェーンで働き、世界最大級のAI企業のアルゴリズムを学習させるためのデータをアップロードし、ラベル付けしていた。
機械学習アルゴリズムの学習に使用される生データは、まず人間によってラベル付けされ、その精度を評価するために人間による検証も必要となります。このデータラベル付けは、街灯の画像の識別や類似のeコマース商品の比較といった単純なものから、インターネットの隅々から収集されたデータ内の有害コンテンツを分類するコンテンツモデレーションといった非常に複雑なものまで多岐にわたります。これらの作業は、ハッサン氏がキャリアをスタートさせたTolokaなどのオンラインクラウドソーシングプラットフォームを通じて、ギグワーカーにアウトソーシングされることがよくあります。
友人に紹介されたサイトは、いつでもどこでも仕事が見つかると謳っていた。1時間働けば1ドルから2ドルほど稼げると知ったと彼は言う。当時の最低賃金は約0.26ドルだった。母親は主婦、父親は機械工だ。「貧しい家庭の出身だと言ってもいいでしょう」と彼は言う。パンデミックが襲来すると、彼はかつてないほど仕事が必要になった。家に閉じこもり、ネット上で落ち着かない日々の中、彼は情報収集に奔走し、トロカは氷山の一角に過ぎないことを知った。
「AIは何でもできる魔法の箱のように提示されています」と、ノースイースタン大学シビックAIラボの所長、サイフ・サベージ氏は言う。「人々は、その舞台裏で人間の作業員が働いていることを全く知らないのです。」
こうした人間の労働者の中には、少なくとも一部は子供だ。プラットフォームは労働者の年齢を18歳以上と定めているが、ハッサンは単に親族の情報を入力し、それに応じた支払い方法を使うことで審査を回避した。しかも、そうした行為は彼だけではなかった。WIREDはパキスタンとケニアの他の労働者3人にインタビューを行い、彼らも未成年としてプラットフォームに参加したと語り、こうした慣行が広く行われていることを示す証拠を発見した。
「私がまだ中学生だった頃、多くのティーンエイジャーがオンラインの仕事について、親のIDを使ってどうやって登録したかについて話していました」と、ケニアで16歳でAppenに入社したある従業員は匿名を条件に語る。彼は放課後、友人たちとログインして夜遅くまで注釈付け作業をし、8時間以上も作業を続けることも珍しくなかった。
アッペン氏は帰属に関するコメントを控えた。
「ユーザーが利用規約に違反した疑いがある場合、Tolokaは本人確認を行い、写真付き身分証明書と、その身分証明書を持っているユーザーの写真の提出を求めます」とTolokaの運営責任者であるGeo Dzhikaev氏は述べている。
市場調査・コンサルティング会社Grand View Researchによると、世界的なAI導入の急増を背景に、世界のデータラベリング・収集業界は2030年までに171億ドル規模に成長すると予想されています。Toloka、Appen、Clickworker、Teemwork.AI、OneFormaといったクラウドソーシング・プラットフォームは、グローバル・サウスの何百万人ものリモート・ギグワーカーとシリコンバレーのテクノロジー企業を繋いでいます。これらのプラットフォームは、Amazon、Microsoft Azure、Salesforce、Google、Nvidia、Boeing、Adobeといったテクノロジー企業クライアントからマイクロタスクを投稿しています。また、多くのプラットフォームは、Microsoft独自のデータサービス・プラットフォームであるUniversal Human Relevance System(UHRS)とも提携しています。
これらの労働者は主に東アフリカ、ベネズエラ、パキスタン、インド、フィリピンを拠点としているが、難民キャンプでラベル付け、評価、データ生成を行う労働者もいる。労働者は作業ごとに報酬を受け取り、報酬は1セントから数ドルの範囲だが、高額な報酬は希少価値が高いと労働者たちは語る。「仕事の性質上、デジタル奴隷のように感じることも少なくありませんが、生計を立てるためには必要なことです」と、現在ClickworkerとAppenでも働くハッサン氏は語る。
ワーカーは、AIの学習に用いるデータセットに音声、画像、動画のアップロードを求められることがあります。ワーカーは通常、提出された情報がどのように処理されるかを正確には知りませんが、これらは非常に個人的な情報となる場合があります。Clickworkerのワーカー求人タブには、「赤ちゃん/お子さんを見せてください!赤ちゃん/お子さんの写真を5枚撮って、AIの学習を手伝ってください!」というタスクがあり、報酬は2ユーロ(2.15ドル)です。次のタスクには、「未成年者(13~17歳)に、面白い自撮りプロジェクトに参加させましょう!」というものがあります。
タスクの中にはコンテンツモデレーション(内容の適正化)も含まれ、AIが無害なコンテンツと暴力、ヘイトスピーチ、成人向け画像を含むコンテンツを区別するのを支援する。ハッサンはWIREDの取材に応じた日に利用可能なタスクの画面録画を共有してくれた。UHRSのタスクの一つは、テキスト本文から「fuck」「c**t」「dick」「bitch」を識別するというものだった。トロカの場合は、何ページにもわたる半裸の体を見せられた。性的な画像、ランジェリー広告、露出した彫刻、さらにはルネッサンス様式の絵画の裸体まで含まれていた。タスクの内容は?成人向けと無害な部分を判別し、アルゴリズムがわいせつな上半身と許容できる上半身を区別できるようにすることだ。
ハッサン氏は、18歳未満だった頃にUHRSでコンテンツのモデレーションを担当していた時のことを思い出す。それが今でも彼の精神状態に重くのしかかっていると彼は言う。コンテンツの内容は露骨なものだったという。裁判記録を引用した記事から抜粋したレイプ事件の記述、ソーシャルメディアの投稿からのヘイトスピーチ、記事からの殺人描写、未成年者の性的画像、成人女性の裸の画像、YouTubeやTikTokから拾ってきた女性や少女のアダルト動画などだ。
パキスタンのリモートワーカーの多くは未成年だとハッサン氏は言う。彼はWIREDの依頼を受け、UHRS従業員約1万人を対象にTelegramのグループチャットで96人を対象に調査を実施した。回答者の約5分の1が18歳未満だと答えた。
ラホール出身の20歳のアワイスさんは、ファーストネームを公表しないことを条件に取材に応じた。16歳でクリックワーカーを通じてUHRSで働き始めた。恋人の誕生日にパキスタン北部のターコイズブルーの湖と雪を頂いた山々への旅行を約束したのがきっかけだった。両親は彼にお金を援助することができなかったため、友人のIDカードを使ってデータ関連の仕事に就いた。「簡単でした」と彼は言う。
彼は毎日サイトで作業し、主にマイクロソフトの「汎用シナリオテスト拡張」タスクを完了していました。これは、ホームページと検索エンジンの精度をテストするものでした。つまり、MSNのホームページで「車の取引」を選択すると車の写真が表示されるか? Bingで「猫」を検索すると猫の画像が表示されるか? 彼は1日に1ドルから3ドルを稼いでいましたが、仕事は単調で腹立たしいと感じていました。 特定のタスクにアクセスするために無給のトレーニングを受ける必要があったため、1ドルで10時間働いていることもあったそうです。 トレーニングに合格しても、完了するタスクがまったくないこともあれば、時間制限に違反するとアカウントが停止されることもあると彼は言います。 その後、どこからともなく、最も儲かるタスクの実行を禁止されました。従業員によると、これは定期的に起こるそうです。 禁止される理由は、誤った回答をする、答えが速すぎる、他の従業員の平均パターンから外れた回答をするなど、さまざまな可能性があります。 彼は合計で70ドルを稼いでいました。高校時代の恋人を旅行に連れて行くには十分だったため、アワイスは永久にログオフしました。
Clickworkerはコメント要請に応じなかった。Microsoftはコメントを拒否した。
「場合によっては、ユーザーがトレーニングを終えた時点で、そのプロジェクトの回答数が既に上限に達しており、そのタスクは利用できなくなることがあります」とジカエフ氏は述べた。「しかし、同様のタスクが利用可能になった場合は、追加のトレーニングなしで参加できるようになります。」
研究者たちは、世界中のAI業界で未成年労働者が働いている証拠を発見したと述べています。AI業界における人間の労働とデータ生産を研究するイェール大学アメリカ研究科のジュリアン・ポサダ助教授は、ベネズエラで未成年としてプラットフォームに参入した労働者に会ったことがあると述べています。
年齢確認の回避は至って簡単だ。ClickworkerやTolokaなど最も寛容なプラットフォームでは、労働者に18歳以上であることを申告するよう求めるだけだ。Remotasksなど最も安全なものは、顔認識技術を使って労働者と写真付きIDを照合する。だが、それでも間違いは起こり得るとポサダ氏は言い、祖母の顔に携帯電話をかざすだけで年齢確認をパスできたという労働者の話を引用した。家族内での単一アカウントの共有も、未成年者が仕事にアクセスするもう1つの方法だとポサダ氏は言う。ベネズエラの家庭の中には、両親が料理をしたり用事を済ませたりするときに、子供たちがログインして仕事をこなすところもあると彼は発見した。彼が会ったある6人家族には13歳の子供がいて、全員が1つのアカウントを共有していると主張した。彼らは家を工場のように使いこなしており、常に2人の家族がコンピューターでデータのラベル付け作業をしていたとポサダ氏は言う。 「長時間座りっぱなしで腰が痛くなるんです。だから休憩を取って、子供たちが代わりにやってくれるんです」と彼は言います。
AIを訓練する労働者とサプライチェーンのもう一方の端にいるテクノロジー大手との間の物理的な距離(ポサダ氏はこれを「インターネットの脱領土化」と呼んでいる)により、労働力全体が本質的に見えなくなり、異なる一連のルールによって管理されるか、あるいは全くルールがない状況が生み出される。
労働者への監督が不十分なため、クライアントは労働者が収入を維持しているかどうかさえ把握できない可能性がある。サイトからのアクセスを禁止されるのを避けるため匿名を条件に申し出たインドのClickworker利用者は、WIREDに対し、あるオフィスで17人のUHRS労働者を「雇用」し、収入の半分を支払う代わりに、パソコン、携帯電話、インターネットを提供していると語った。彼の労働者は18歳から20歳だが、Clickworkerには年齢確認の要件がないため、10代の若者がプラットフォームを利用していることも知っている。
クラウドソーシング業界のより暗い部分では、児童労働者の使用は公然と行われている。
クラウドソーシングプラットフォームが人間にCAPTCHA(コンピューターと人間を区別するための完全に自動化された公開チューリングテスト)解読サービスを有料で提供するサービスは、AIエコシステムの中であまり理解されていない部分です。CAPTCHAはボットと人間を区別するために設計されており、最も顕著な例はGoogleのreCaptchaです。これは、ウェブサイトにアクセスするためにユーザーに画像内のオブジェクトを識別するよう求めます。Posada氏によると、CAPTCHAを解読して報酬を得るサービスの正確な目的は、学者にとって依然として謎のままです。「しかし、GoogleのreCaptchaを含む多くの企業が、AIモデルのトレーニングにこれらのサービスを利用していることは確かです」と彼は言います。「つまり、これらの作業員は間接的にAIの進歩に貢献しているのです。」
Googleは記事掲載までにコメント要請に応じなかった。
浙江省杭州の研究者らによる2019年の調査によると、reCAPTCHAのアンダーグラウンド市場では50万人以上が働いており、そのほとんどが中国に拠点を置くアクティブなサービスが少なくとも152あるという。
「誰にでも、どこにいても、安定した仕事」と、コロティバブロというサービス業者はウェブサイトで謳っています。同社は、従業員の声を紹介する専用のプロモーションウェブサイトを運営しており、世界中の子供たちの写真も掲載されています。ある写真では、インドネシアの少年が笑顔で11歳の誕生日ケーキをカメラに見せています。また、7歳か8歳くらいの少年は「将来のために貯金を増やせてとても嬉しいです」と書いています。ハローキティのロングドレスを着た14歳の女の子は、自分のワークステーションの写真を共有しています。ピンクのバービー人形をテーマにした机の上にノートパソコンが置いてある写真です。
WIREDがインタビューした労働者全員がプラットフォームに不満を抱いているわけではない。ユニス・ハムディーン(17歳)の友人のほとんどはウェイトレスだった。しかし、パキスタン出身の彼はAppen経由でUHRSに参加することを選んだ。高校に通いながら、毎日3~4時間プラットフォームを利用し、月100ドルを稼いでいた。Amazonに掲載されている商品を比較するのが、彼が経験した中で最も儲かる仕事だった。「このプラットフォームで働くのが楽しいんです」と、現在18歳のハムディーンは言う。パキスタンでは珍しい米ドルで支払われるため、有利な為替レートの恩恵を受けるからだ。
しかし、この仕事の報酬がテック企業の社内従業員の賃金と比べて信じられないほど低く、その利益が一方通行(グローバル・サウスからグローバル・ノース)に流れているという事実は、不快な類似点を生み出している。「この種の仕事によって促進されている植民地主義の種類を考慮する必要がある」と、シビックAIラボのサベージ氏は述べている。
ハッサンさんは最近、医療検査技術の学士課程に合格しました。アプリが彼の唯一の収入源であり、午前8時から午後6時までのシフト勤務と、その後午前2時から午前6時までのシフト勤務をしています。しかし、パンデミック以降、より多くの労働者が参加するようになり、仕事の需要が供給を上回ったため、彼の収入は月100ドルにまで落ち込んでいます。
彼は、UHRSの仕事の報酬が1セントしかないことに嘆いている。Appenで時々ソーシャルメディアの仕事をするような、より高給の仕事でさえ、無給の調査に費やす時間を考えると、1時間のリアルタイム作業を完了するのに5~6時間も働かなければならず、その合計で2ドル稼げないのだと彼は言う。
「これはデジタル奴隷制だ」とハッサンは言う。