大きな進歩により、児童虐待の画像や動画をウェブから削除することが容易になる

ワイヤード
クリス・ヒューズがインターネットから児童虐待の画像や動画を削除し始めた約10年前、小児性愛者は慎重ではありませんでした。彼らはニュースグループ、フォーラム、専用ウェブサイトを通じてコンテンツを共有し、多くの場合、写真に何が写っているかを明確に説明していました。
下品なコンテンツを求める人々にとって、かつてはそれを見つけるのは驚くほど簡単でした。「検索エンジンでキーワードを入力すれば、まさに欲しいものが手に入る時代でした」と彼は言います。ヒューズ氏は現在、英国を拠点とする慈善団体インターネット・ウォッチ・ファウンデーション(IWF)で13名のアナリストからなるチームを率いています。IWFは、毎年数万件もの児童性的虐待コンテンツを含むウェブページ、画像、動画をウェブから削除する責任を負っています。
テクノロジー大手、法執行機関、そしてIWFのような組織が虐待コンテンツの検知とその背後にあるネットワークの解体に優れた能力を身につけるにつれ、犯罪者は捕まるのを避けるために行動を進化させてきました。これは恐ろしい猫とネズミのゲームです。常に一歩先を行くため、小児性愛者は長年、秘密のコードワードやフレーズを使って、虐待コンテンツの会話や共有を隠してきました。この言語を知らなければ、日常の会話からその意味を解読することはほとんど不可能でした。しかし、これまでは。
IWFは長年にわたる人的調査と技術の進歩を組み合わせ、小児性愛者のコードの大部分を解体しました。この慈善団体は現在、児童性的虐待を描写するコンテンツに関連するキーワードの膨大なデータベースを保有しています。これは小児性愛者が何年もかけて作り上げた秘密の言語であり、彼らが検挙を逃れる上で重要な役割を果たしてきました。IWFは10年以上前から犯罪者が使用する言語の特定に着手し、約450語の単語とフレーズをデータベース化しました。ここ数週間でデータベースのエントリ数は3,681件増加しており、今後さらに数百件が追加される予定です。
「これらの画像に関連付けられている俗語をより深く理解することで、これまで見たことのないウェブサイトや画像を見つけられるようになります」と、IWFの技術プロジェクト責任者で、この作業を監督し、7人からなる技術チームを率いるサラ・スミス氏は語る。「私たちが特定した膨大な量のキーワードによって、この種のコンテンツを特定・見つけ出すのは非常に困難になるでしょう。」
キーワードリストに含まれる用語は、IWFの140社以上の会員と共有されます。会員には、Apple、Amazon、Google、Microsoft、Facebookといったウェブ最大手企業から、ゲームプラットフォームのRoblox、Zoom、法執行機関、携帯電話事業者などが含まれます。企業は、特定されたキーワードを使用して、自社サービス上の検索を絞り込み、違法コンテンツが共有されている場所を特定できます。これは、企業が既存の虐待コンテンツのアップロードを阻止するために使用しているハッシュ化された画像のデータベースに加えて提供されます。
スミス氏とヒューズ氏は共に、この語彙の解読によって、違法コンテンツを積極的に摘発し削除することが容易になると述べています。また、違法画像の検証や新たに作成された虐待コンテンツの発見に時間を費やしている捜査官の権限も強化されます。
IWFの研究者がどのようにコードを解読したかを理解するには、まず犯罪者の行動を理解する必要があります。「虐待コンテンツの規模を特定するのは非常に困難です」と、ロンドン大学ミドルセックス校の犯罪学者でオンライン虐待の専門家であるエレナ・マルテロッツォ氏は述べています。彼女は、犯罪者は時間をかけて構築されたコミュニティネットワークを利用して、互いにコンテンツを共有することが多いと述べています。
オンラインで虐待コンテンツを共有する人々のネットワークが発見されると、それは急速に拡大します。「一人の人物が30人、40人、あるいは100人と繋がっていることがすぐに分かります」と、IWFの活動には関わっていないマルテロッツォ氏は言います。「私たちが話しているのは、闇の中で活動する個人ではなく、性犯罪者による仮想コミュニティなのです。」
マルテロッツォ氏は、これらのグループは発覚後、すぐに再結成する可能性があると付け加える。多くの場合、これはダークウェブにつながるが、多くの虐待コンテンツはオープンウェブ、ソーシャルネットワーク、またはプライベートメッセージアプリで共有されている。スミス氏によると、IWFはダークウェブから多くの情報を得ている。なぜなら、ダークウェブは多くの新しい虐待コンテンツが出現する場所だからだ。「アナリストは、この種の画像と明らかに関連付けられている特定のフレーズを特定します。それを出発点として、インターネット上の他の場所で、それらの画像と関連付けられている他の検索用語を調べることができます」とスミス氏は言う。
小児性愛者が虐待画像を分類、共有、そして検索するために用いる言葉は多岐にわたる。ヒューズ氏によると、中には性行為や画像内で起こっていることを描写する、明白で露骨な言葉もあるという。犯罪者ネットワークの中には、人目につく場所で行動する者もいる。昨年、WIREDの調査により、小児性愛者が子供が出演するYouTube動画にコメントし、他の動画を交換できる連絡先を共有していたことが明らかになった。
しかし、より洗練された犯罪者は、日常会話で使われる言葉を巧みに利用して虐待の種類を示します。当然のことながら、IWFが特定した新しいキーワードは公表されません。「中にはまるで異星人のようなものもあります」とヒューズ氏は説明します。「必ずしも整然とした単語やフレーズになるわけではありません。実際には単語を構成しない文字の集合体である場合もあります。」彼は、犯罪者が使用するフレーズがどれほど一般的であるかを示す仮説的な例を挙げます。「紫色のクッション」のような単純なものかもしれません、と彼は言います。使用される単語やフレーズは、被害者の名前、コンテンツが見つかる場所、または特定の画像セットを指すことがよくあります。
「もしフォーラムでそのような発言を読んだとしたら、おそらく他の会話はそれほど隠蔽されていないでしょうから、そのフレーズを別のサイトでさらに検索し、『紫色のクッション』が人々が公然と使っているフレーズであるということを示す結果が出るかどうかを確認します」と彼は説明します。(彼が「紫色のクッション」という言葉を使ったのは、それが目の前にあった日常的な物だからです。このフレーズは単なる例として使っていると彼は言います。)
実際に使われているキーワードは、他の単語と組み合わせることで意味を持つことがあります。特定のイメージや行動を指すために、複数のキーワードを同時に使うこともあります。「適切な組み合わせで使うことが大切な場合もあります」と彼は言います。
IWFが拡張したキーワードリストは主に英語ですが、オランダ語とドイツ語の用語も含まれています。2018年には、虐待画像をホストしていた10万5000件のウェブアドレスを削除しました。そのうち47%はオランダでホストされていました。「スペイン語から翻訳された用語もありました」とヒューズ氏は付け加えます。「これらは頭字語だったキーワードの一部です。スペイン語など、ある言語の頭字語が英語で使用されていたのです。」
スミス氏によると、IWFは新たな潜在的なキーワードを特定するインテリジェントクローラーを開発したという。これらのクローラーは、Googleなどの検索エンジンの技術と同様に、ウェブの一部をスキャンして潜在的な不正コンテンツを検出する。この情報は、コンテンツに付随するコメントやファイルに添付されたメタデータなどから得られる。
「クローラーは、私たちが保有する既存のデータに基づいてターゲットを絞り、児童性的虐待コンテンツが含まれている可能性があると特定したウェブサイトの情報を返します」とスミス氏は語る。この慈善団体は20年にわたる活動の中で、ウェブから削除したURLの膨大なデータベースを構築してきた。IWFはまた、よく使われているフレーズを特定するために、機械学習の要素をシステムに取り入れている。
クローラーが候補となるキーワードを生成したら、人間のアナリストが、それらが虐待コンテンツの誘導に使用されているかどうかを確認します。IWFによると、複数の場所で検証されていない単語やフレーズは、メンバーに提供するフレーズリストには含まれません。
プロジェクトの成功には人間の関与が不可欠です。自動検出を行い、キーワードやフレーズ候補を生成するシステムを構築することは技術的には可能ですが、検閲のリスクも伴います。例えば、「紫色のクッション」のような無害なフレーズが自動的にブロックされてしまうと、人々が枕を見つけられなくなってしまう可能性があります。
キーワードが使用される文脈が重要です。「犯罪者の思考パターンを把握し、彼らがどのようにしてコンテンツを見つけようとしているのかを考察し、その経路を遮断し、阻止する必要があります」とスミス氏は述べています。
IWFは、拡張されたキーワードリストが会員によって実施されるまでにはしばらく時間がかかるだろうが、最終的にはより多くの児童性的虐待の画像やビデオがウェブから発見され削除されることになると予想している。
「現場に赴き、これまで確認できなかった画像を特定できればと思っています。これは被害者の身元確認に大きく貢献するでしょう」とスミス氏は語る。「私たちは、この事態を未然に防ぐために、あらゆる努力をしています。」
マット・バージェスはWIREDの副デジタル編集長です。@mattburgess1からツイートしています。
WIREDによるコロナウイルス報道
😓 コロナウイルスはどのように始まり、次に何が起こるのでしょうか?
❓ 英国の雇用維持のための一時帰休制度について解説
💲 ユニバーサルベーシックインカムはコロナウイルス対策に役立つでしょうか?
🎲 自主隔離中のカップルに最適なビデオゲームとボードゲーム
👉 Twitter、Instagram、Facebook、LinkedInでWIREDをフォローしてください
この記事はWIRED UKで最初に公開されました。

マット・バージェスはWIREDのシニアライターであり、欧州における情報セキュリティ、プライバシー、データ規制を専門としています。シェフィールド大学でジャーナリズムの学位を取得し、現在はロンドン在住です。ご意見・ご感想は[email protected]までお寄せください。…続きを読む