最近、 Google を使っていたところ、不気味なほど見覚えのある記事に偶然出会いました。
Adobeの人工知能(AI)に関する最新情報を探していた時、Googleで「adobe train ai content」と入力し、ニュースタブに切り替えました。検索結果ページの2番目に表示されたWIREDの記事「Adobe、アーティストの作品を使ってAIをトレーニングしないと明言。クリエイターは納得せず」は既に目にしていました。検索結果の一番上に表示された記事の掲載元であるSyrus #Blogの名前は知りませんでしたが、記事の見出しには既視感を覚えました。「Adobeがアーティストのコンテンツを使ってAIをトレーニングしないと約束した時、クリエイティブコミュニティは懐疑的な反応を示した」
上部のハイパーリンクをクリックすると、盗作記事が溢れかえるスパムサイトに行き着きました。その多くはAI生成のイラストを上部に使用していました。このスパム記事は、WIREDの記事をほぼそのままコピーしたもので、表現はわずかに変更されているだけで、オリジナルの引用文さえも盗用されていました。出典表示は、ウェブページの下部にある、私たちの記事へのリンクを貼ったハイパーリンク1つだけでした。

Google の検索結果内のニュース記事リストには、WIRED の記事の AI スパム版がトップに表示され、オリジナルの報道記事が 2 番目に表示されている。
リース・ロジャース提供このボットは英語のジャーナリズムをコピーしていただけではありません。この盗作コンテンツは、WIRED がコンテンツを制作している日本語やスペイン語などの多くの言語を含む 10 の言語でも見つかりました。
ロイターやTechCrunchなどのメディアに掲載された記事も、このブログで複数の言語で盗用され、類似のAI画像が使用されていました。私がこの記事を調査している間、6月下旬から7月上旬にかけて、ウェブサイトSyrusがGoogleニュースの検索結果を巧妙に操作し、複数のテクノロジー関連の検索で1ページ目に表示されるほどだったようです。
1/4
リース・ロジャース提供
例えば、「競合ビジョン グーグル オープンAI」と検索したところ、GoogleニュースのトップにTechCrunchの記事が表示されました。その下には、ライバル企業のAI開発へのアプローチを比較したThe AtlanticとBloombergの記事が表示されていました。しかし、同じ検索で4番目に表示された記事、つまりこれらの評判の良いウェブサイトのすぐ下に、1位だったTechCrunchの記事をかなりコピーしたSyrusの別の#Blog記事が表示されました。
404 Mediaが1月に報じたように、今年初めにはGoogleニュースの検索結果に、AIを活用した記事が基本的な検索クエリに対して複数回表示されました。2か月後、Googleは検索結果の改善を目指し、アルゴリズムの大幅な変更と新しいスパムポリシーを発表しました。そして4月末には、検索エンジンのランキングシステムから役に立たない検索結果を削除するための大規模な調整が完了したと発表しました。「4月19日をもって、これらの変更の展開を完了しました。検索結果に表示される低品質で独創性のないコンテンツは、この取り組み全体で40%の改善を期待していたのに対し、45%減少することになります」と、Googleのプロダクトマネジメントディレクター、エリザベス・タッカー氏はブログ記事に記しています。
こうした変更にもかかわらず、AI を利用して作成されたスパムコンテンツは、Google ニュースにとって依然として蔓延している問題です。
「これは現在Googleで非常に蔓延している問題で、なぜこのようなことが起きているのかを具体的に説明するのは難しい」と、マーケティングエージェンシーAmsiveの検索エンジン最適化担当シニアディレクター、リリー・レイ氏は語る。「クライアントの中には、『私たちの記事をAIで焼き直したんです。元のコンテンツと全く同じように見えますが、AIが書き直した、意味不明な内容の文章のようです』と言う人もいます」
一見して、サイラスのブログの画像の一部は、イラストの垂れ目やその他の変形した身体的特徴に基づいて AI が生成したものであることは明らかでした。これは、AI が人体を表現しようとしていることの明らかな兆候です。
さて、私たちの記事のテキストはAIによって書き換えられたのでしょうか?ブログの制作者に連絡を取り、どのように作成されたのか詳しく尋ねたところ、イタリアのマーケティング代理店がブログを作成したことをメールで確認しました。彼らは、執筆プロセスの一環としてAIツールを使用したと主張しています。「盗作に関するご懸念についてですが、当社のコンテンツ作成プロセスには、知的財産権を常に尊重しながら、様々な情報源から情報を分析・統合するAIツールが使用されていることをお約束します」と、Daniele Syrusという名義の人物がメールで回答しています。
彼らは、盗用された記事の下部にある単一のハイパーリンクが十分な帰属表示だと指摘している。何もないよりはましだが、出版物名すら明記されていないリンクは、盗用に対する十分な防御策にはならない。また、この人物は、このウェブサイトの目的はGoogleの検索エンジンからのクリック数を増やすことではなく、多言語におけるAIアルゴリズムのテストであると主張している。
メールで回答を求めたところ、GoogleはSyrusについてコメントを控えた。「特定のウェブサイトについてはコメントしませんが、我々のスパムポリシーは更新されており、Googleで上位表示を狙う目的で、価値の低い独創性のないコンテンツを大量に作成することを禁止しています」と、Googleの広報担当者であるメーガン・ファーンズワース氏は述べている。「Googleのポリシーに従わないサイトには、世界中で措置を講じています」(ファーンズワース氏は元WIRED社員)。
Googleのスパムポリシーを調べたところ、このブログはオンラインスクレイピングに関する同社の規則に直接違反しているようだ。「悪質なスクレイピングの例としては、他のサイトのコンテンツをコピーし、わずかに改変(例えば、同義語の置き換えや自動化技術の使用など)して再公開するサイトが挙げられます。」ファーンズワース氏は、このブログがGoogleのポリシーに違反しているかどうか、また、この報告に基づいてGoogleがGoogleニュースの検索結果でこのブログの順位を下げるかどうかについては、明言を避けた。
オリジナル記事を書く人たちは、自分の作品を適切に保護するために何ができるでしょうか?それはまだ明確ではありません。しかし、SEOの専門家たちと様々な話をしてきた中で、一つの大きな共通点が浮かび上がってきました。それは、ある不安感です。
「私たちの業界はある種のトラウマを抱えています。冗談ではありません」と、オンラインリンク構築サービスForte Analyticaのコンサルタント、アンドリュー・ボイド氏は語る。「その主な理由の一つは、影響を受けたパブリッシャーにとって、救済措置がないことだと考えています。朝起きたら突然、トラフィックの50%が消えているのです。」ボイド氏によると、Googleの検索アルゴリズムのアップデートによって、一部のウェブサイトは訪問者の大部分を失ったという。
多くのSEO専門家がGoogleの大規模な変更に関する透明性の欠如に憤慨している一方で、私が話を聞いた全員が検索結果におけるスパムの蔓延を批判していたわけではない。「実のところ、Googleはこの件で十分な評価を受けていないが、Googleにとって最大の課題はスパムだ」と、『Product-Led SEO』の著者であるイーライ・シュワルツ氏は述べている。「つまり、Googleの現状の品質について多くの不満があるにもかかわらず、ハードウェアを検索しただけでアダルトサイトが見つかるようなことはない。彼らは十分に良い仕事をしているのだ」。同社はスパム対策として、引き続き小規模な検索アップデートをリリースしている。
確かに、Googleは、関連性のない人気キーワードで検索した際に、怪しいポルノサイトが表示されないようにすることで、ユーザーに快適な体験を提供していることもあります。しかし、オンラインコンテンツの作成、配信、消費に大きな影響力を持つ、世界で最も強力な企業の一つであるGoogleが、ニュース検索結果から盗作や役に立たないコンテンツをフィルタリングする機能を強化することを期待するのは当然です。
「自分たちは正しいことをしようとしているのに、低品質のAIが私たちより優れている例を数多く目にするというのは、本当にイライラします」とレイ氏は言う。「一時的なものだと期待していますが、業界内には大きな緊張と敵意が生まれています。個人的には15年間で見たことのないような状況です」。AIコンテンツを含むスパムサイトが検索結果から削除されない限り、パブリッシャーは高品質なコンテンツを制作するインセンティブを失い、結果として、Googleニュースのトップに表示されるウェブサイトをユーザーが信頼する理由も減ってしまうだろう。


