
マンデル・ンガン/AFP/ゲッティイメージズ
ロイターは、ジャーナリストがデータを分析し、記事のアイデアを提案し、文章を書くのを支援する AI ツールを構築している。その目的は、記者に代わるのではなく、デジタル データ サイエンティスト兼コピーライティング アシスタントによって記者を補佐することだ。
「Lynx Insight」と呼ばれるこのシステムは、夏以来、数十人のジャーナリストによって試験運用されており、今後はロイターのニュースルーム全体に導入される予定だ。ロイターの編集業務・データ・イノベーション担当編集委員のレグ・チュア氏は、編集業務を機械が得意とする分野(データの分析やパターンの発見など)と、人間の編集スタッフが得意とする分野(質問の提示、重要性の判断、文脈の理解、そしておそらく大量のコーヒーの飲み過ぎなど)に分担することが狙いだと述べている。
これは、地元のスポーツチームに関するスニペットや地震警報といった記事全体をAIに書かせるという、これまでの編集技術の取り組みとは異なる。ロイターはすでに金融記事でこれを試しており、その成果が、完全自動化ではなく「サイバネティック・ニュースルーム」を構築するという新たな目標の「ヒント」になったとチュア氏は語る。「真の価値は、機械に得意なことをさせて、それを人間に提示することにある。まさに両方の長所を活かすことだ」
このシステムは膨大なデータセットを精査し、急騰する株価、市場の興味深い変化、あるいはより微細なパターンなど、興味深いものを探し出します。ジャーナリストは、これらの情報を、メール、メッセンジャーサービス、あるいは勤務開始時にデータ端末を通じて、希望する方法で受け取ることができます。また、重要な背景情報も併せて提供されるため、記事を追及する価値があると判断した場合、調査をスムーズに進めることができます。さらに、特定の企業をシステムに入力して概要を把握することもでき、背景調査やインタビューの準備に役立ちます。
ロイターは、機械の力を借りて記事を作成した最初の報道機関ではありません。ワシントン・ポスト紙は、自社製のロボット記者「Heliograf」を用いて、数百もの短いスニペットを機械で作成しました。また、プレス・アソシエーションは、アーブス・メディアと共同で、RADAR(Reporters and Data and Robots)と呼ばれるプロジェクトを通じて、ローカルニュースの自然言語生成に取り組んでいます。また、ヤフーは、ファンタジーフットボールのスニペットから「ゲーム・オブ・スローンズ」の要約まで、あらゆる記事に自動ライティングツール「Wordsmith」を活用しました。AP通信社は、自動化によって報道対象企業の数を桁違いに増やしました。
続きを読む: 速報ニュースのプッシュ通知をすべてオフにしましょう
しかし、すべてが機械で書かれた記事を吐き出しているわけではない。AIを活用して報道の質を高めているメディアもある。ニーマンラボによる今年のジャーナリズム予測では、業界ウォッチャーは人工知能が人間の記者を「スクープ」すると予測し、ProPublicaが機械学習を用いて米国議会がどのトピックに時間を費やしているかを分析したり、BuzzFeedが飛行追跡データを精査して偵察機を見つけるアルゴリズムを例に挙げている。
Lynx Insightは文章を作成し、ジャーナリストが自動生成したテキストをドラッグ&ドロップで記事に組み込むことができますが、その機能の主眼はデータの提供です。ロイターが共有したある例では、Lynx Insightはウォルマートの株価が10%下落したことをジャーナリストに警告し、その日のウォルマートに関する見出しを抽出して、同程度の急落がいつあったかとその理由を知らせます。デモでは、Lynx Insightが過去のウォルマートの記事で引用されたアナリストの名前を提示し、競合他社と比較した同社の最近の業績を説明する様子も見られました。
ジャーナリストがデータベースをくまなく調べ、四半期決算報告書をざっと目を通すことで、自らその情報をすべて集めることは間違いなく可能だろう。しかし、機械学習を活用することで、調査の面で「今後の展開に大きな力を与えるだろう」と、ロイターのニューステクノロジー担当編集者、パドレイク・キャシディ氏は語る。チュア氏はさらに、「目標は、ジャーナリストがこれまで行ってきた作業に付加価値を加え、これまでは到達に時間がかかっていた視点を追求できるようになることだ」と付け加えた。
すべての記事のアイデアやデータポイントが役立つとは限りません。ジャーナリストは、洞察力に欠ける提案にフラグを立て、開発者に見逃した点を伝えることができます。つまり、システムが学習するにつれて、より興味深い記事を見つけられるようになるのです。
最終的にはUIレイヤーを廃止し、ジャーナリストが入力するとシステムが候補や事実、文脈的な背景情報をポップアップ表示するようにすることを目指しています。そう、これはジャーナリスト向けのWordの「クリッピー」です。「Microsoftについての記事を書いているようですが…」とチュア氏は笑います。「クリッピーの例えは嫌ですが、まさにそういう発想です。書いているトピックに関する15個の事実が表示されるのです。これは私たちのロードマップに載っています。」
現在、Lynx Insightsはロイターの膨大な金融データを扱っていますが、スポーツや、ひいては同社の広範な法務データベースにも拡張する計画が進行中です。ただし、AIがそれらの情報をどのようにふるいにかけるのかは、まだ明確ではありません。調査報道のための政府データから選挙運動中の世論調査まで、あらゆるデータセットを取り込むことができるため、候補者の支持率が上昇傾向にあるか下降傾向にあるかを容易に把握できます。「理論上は、私たちが把握している、適切な構造を持つあらゆるデータセットに対応できます」とキャシディ氏は言います。「それをパイプで送ることもできます。」
メタデータのおかげで、Lynx Insightは動画や写真にも対応しています。テキストを少し選択するだけで、ソーシャルメディア投稿に最適な写真を見つけてくれます。いわば、金融ニュースのミームを作成するツールです。
ジャーナリストがより質の高い仕事をより迅速に行えるよう支援するだけでなく、チュア氏と彼のチームは、Lynx Insightsを支える技術をニュース記事のパーソナライズにも活用できると考えています。例えば、通信社向けには、各市場の地元チームをリード役に据えたスポーツ記事のまとめ記事を提供したり、個人向けには、株価変動が自身のポートフォリオにどのような影響を与えるかを解説する段落を提供したりといった活用が考えられます。
これがジャーナリズムの未来なのだろうか?ミズーリ大学レイノルズ・ジャーナリズム研究所の研究員であり、ニュースプラットフォーム「Structured Stories」の創設者であるデビッド・キャスウェル氏は、ジャーナリズムの収益が減少する中で、特に地方報道など収益の少ない分野において、AIがニュース編集室のプレッシャーを軽減するのに役立つと考えている。「AIの大きなメリットは他にもあります。規模の拡大、高度なカスタマイズとパーソナライゼーション、スピードと正確性、そして特定の分野を体系的に報道できる能力です」と彼は言う。「さらに、ニュースがデータとして蓄積されることで得られる長期的なメリットは、さらに重要になるかもしれません。」
続きを読む: ピーター・ティールとハルク・ホーガンがGawkerを破った経緯: UpVote 24
ロイターは金融データから始めているが、キャスウェル氏は、犯罪からビジネス取引、授賞式からセレブのゴシップまで、繰り返しの多いジャーナリズムのあらゆる分野において自動化を活用できると主張する。「定型的な内容、つまりジャーナリズムの成果物の大部分を占めるもの全て」と彼は言う。「基本的に、これらすべてにおいて唯一の障壁となっているのは、綿密に構造化されたデータの入手可能性であり、機械学習はその解決に役立っています」。そして、構造化データはロイターとその親会社であるトムソン・ロイターが大量に保有しているものだ。
しかし、データ主導のジャーナリズムに過度に依存し、機械の助けを借りられる範囲に報道を限定すべきではありません。「これはあくまでツールであり、代替手段ではないことを忘れてはなりません。データやアルゴリズムは、私たちが見たり、感じたり、知っていることのほとんどを見ることも、感じたり、知ることもできません。そのため、ジャーナリズムの視野を、データとして捉えられるものだけに狭めてしまう危険性があるのです」と彼は言います。「それは重大な過ちです。」
実際、チュア氏はLynx Insightがジャーナリストの武器庫に加わり、電話やGoogle検索と同じくらい革新的でありながらありふれたツールの一つとなることを期待している。「目指すのは、これが『すごい』と思えるほど新しいツールになることではなく、日々の仕事の一部になることです」と彼は言う。「理想的な世界では、人々はLynx Insightの存在にさえ気づかないでしょう。電話やGoogleのように、バックグラウンドでただ動いているのです。もしそれが人々の仕事の一部になれば、それは成功の証となるでしょう。」
この記事はWIRED UKで最初に公開されました。