大手IT企業によるNHSの膨大なデータ窃取に誰もが懸念すべきだ

大手IT企業によるNHSの膨大なデータ窃取に誰もが懸念すべきだ

Amazon、Google、そしてシリコンバレーのその他の企業はNHSのデータを欲しがっています。膨大な量のデータが質の高いデータベースに存在しています。それは保護される必要があります。

画像には、クリニック、人間、医師、屋内、部屋、病院、手術室、外科手術が含まれる場合があります。

NHSは、革新的なテストベッドによって患者が高額な入院や外科手術を受ける必要がなくなることを期待している。クリストファー・ファーロング/ゲッティイメージズ

調子はどう?ちょっと風邪気味?それとももっとひどい病気?シリコンバレーは知りたい。大手IT企業が私たちの健康データを狙っている。

ここ数週間、Googleが5000万人のアメリカ人の健康記録を買収したり、AmazonがNHSのデータを無料で入手したり、NHSイングランドの幹部がデータを高額で売り飛ばしたりといったニュースが目立っています。私たちはこうした状況に満足していません。YouGovの最近の世論調査によると、NHSがさらなる民営化の脅威にさらされていることもあり、80%の人が巨大テクノロジー企業によるデータ買い漁りに反対しています。活動家団体MedConfidentialのコーディネーター、フィル・ブース氏は、「この状況は20年間変わっていません」と述べています。「この20年間、あらゆる世論調査や調査を見てきましたが、一貫して言えるのは、人々が健康データの商業利用に不快感を抱いているということです。」

学術研究や公的資金による研究が医療データを活用することには概ね満足しているものの、医療分野におけるAIに関する研究開発の多くは民間企業、特にアメリカの大手テクノロジー企業で行われています。健康データを慎重に活用すれば、人命を救い、医療提供コストを削減し、さらにはNHS(国民保健サービス)にとってささやかな収入源となる可能性さえあります。実際、政府が頻繁に引用するEYの分析によると、データの保管庫を公開することで、資金不足に悩むNHSは年間最大96億ポンドもの収入を得られる可能性があると示唆されています。しかし、その代償として、私たちのプライバシーが損なわれる可能性があり、大手テクノロジー企業が医療をさらに収益化することになり、病院や診療所が高額な技術システムに縛られ、長期的には私たちにさらなる負担がかかる可能性があります。

リスクは、データを受け取る企業の目的によって異なります。では、彼らは一体何を企んでいるのでしょうか?Googleは先月、米国の医療サービス提供会社Ascensionとの契約「プロジェクト・ナイチンゲール」を通じて5000万人のアメリカ人の健康データを大量に取得したことで話題になりました。この件は現在、米国保健福祉省の調査対象となっています。Googleは同省から書簡を受け取っているものの、正式な調査対象ではありません。(Googleは、Ascensionプロジェクトでは患者データがAscensionから外部に流出することはなく、機械学習システムが他の用途のために訓練されることもないと強調しました。)

同社は最近、FitBitも買収しました。英国では、Google傘下のDeepMindが、ロイヤル・フリー・ロンドンNHSトラストとのプロジェクトで患者の許可を得られなかったとしてデータ規制当局から軽い処罰を受けましたが、その後、Alphabetのヘルスケア部門Verilyを通じた投資と並行して、患者の許可をより厳格に監視する形ではあるものの、同様のプロジェクトを開始しています。ある意味では、これは目新しいことではありません。Googleは長年、eヘルスプラットフォームの構築に取り組んできましたが、失敗しています。しかし、最終目標はもはや、Googleのクラウド上にあるGoogleが運営するプラットフォームに私たちのデータを集めることではなく(もちろん、そこに十分な資金があるのは事実ですが)、AIや機械学習システムを構築するためのデータセットを収集することなのです。

Googleだけではない。Facebookでさえ、徐々にヘルスケア分野に進出し始めている。FacebookのAI部門は、ニューヨーク大学の放射線科医と協力し、機械学習にMRIスキャンの解読技術を習得させた。また昨年は、アメリカの病院に対し、患者データを共有し、Facebookのプロフィールとリンクさせることで、リスクの高い人を特定できるようにした。しかし、このプロジェクトはデータが実際に使用される前に中止された。10月には、Facebookは「Preventative Health(予防医療)」と呼ばれるツールを発表した。これは、アメリカ人にコレステロール検査やインフルエンザ予防接種のリマインダーを送るためのものだ。Facebookは、こうしたデータはマーケティングや広告ではなく、健康と研究の促進のみに利用されると述べている。

そしてAppleは、病院から健康データを購入するのではなく、患者自身にデータを取得するよう求めています。これは、iPhoneやApple Watchに搭載されているApple Healthシステムを通じて行われ、歩数や睡眠時間などを追跡します。さらに2018年現在、少なくとも米国では、HealthKitのAPIを介して独自の健康記録も取得しています。「Appleは興味深いアウトサイダーです」と、デモンフォート大学コンピュータサイエンス・情報学部の暫定学部長であるエールケ・ボイテン氏は述べています。「Appleは独自のデータリポジトリを構築するのではなく、ユーザーに健康データ、あるいはより正確には健康関連データを自分のデバイスに記録することを積極的に奨励しています。」ボイテン氏は、プライバシー、説明責任、透明性を高く評価していますが、情報が政府機関と共有される可能性については懸念があると指摘しています。「中国のiPhoneユーザーはおそらくオプトインしない方が良いでしょう」と彼は警告しています。

AmazonのNHSデータ利用は少し異なります。同社はNHSウェブサイトで使用されている情報を自社のEcho音声アシスタントシステムに追加し、ユーザーが「Alexa」に病状や症状に関する情報を尋ねられるようにしています。これらのデータはすべてオンラインで公開されているのに、なぜこれほど騒ぎになっているのでしょうか?ブース氏によると、その理由の一部は、大手IT企業がNHSデータを無料で大量に入手することへの懸念です。「人々は少しおかしくなりすぎたのです」と彼は言います。

NHSとの提携は、マット・ハンコック保健相の熱意もあって、より多くの人々がAmazon特有の監視資本主義に賛同するようになるだけでなく、私たち人間がAmazonと医療データを共有するように仕向けるのではないかという深刻な懸念がある。もちろん、私たちはGoogleで症状を検索するたびに、既にそうしている。しかしブース氏は、将来的にはAlexaに健康上の懸念について尋ねた際に収集されたデータが、私たちの同意なしにAI症状チェッカーの開発に利用される可能性があると警告している。「これは、EU市民のデータを使ってAmazonのAIを訓練しようとする人々を後押ししている」と彼は言う。

先週、NHSデータに関する報道がAmazonに独占されていた中、もう一つの発表が漏れていました。昨年、一般開業医の診療所から収集されたデータが、臨床実践研究データリンク(CPIDR)を通じてアメリカの製薬会社に1,000万ポンドで販売され、医薬品開発に利用されていたのです。ブース氏は、製薬会社がこのようなデータを欲しがるのは当然だと述べました。安全な医薬品をより安価に開発するのに役立つため、私たち全員にとって有益です。しかし、こうした取り組みは合意に基づき、安全かつ透明性が確保されていなければならないと述べました。私たちは、この件についてオブザーバー紙ではなく、かかりつけ医から知るべきです。

つまり、米国企業はあなたの健康データを欲しがっているものの、すべての企業が同じ理由で欲しがっているわけではない。しかし、なぜ英国にいる私たちが狙われるのだろうか?米国にはGoogleが既に買収しているデータセットなど、他にもデータセットは存在するが、NHSはその規模と質の高さゆえに標的となっている。「NHSは、世界最大規模で、ある程度均質で、それなりに質の高い縦断的健康データベースを保有しています」とボイテン氏は言う。「彼らは常に、システム内のすべてのデータを1つに統合することを検討しています。」こうした「データレイク」を構築しようとした最初の試みはcare.dataシステムだったが、特に同意に関して非常に厳しい批判を受け、カルディコット報告書として知られる患者識別情報の共有に関する政府の調査後に中止された。そして今、テクノロジーウェブサイトThe Registerが入手した最近のリーク情報によると、NHSは再び試みている。英国の患者データの大規模データベースへのアクセスを販売するための協議が既に進行中であることを示すスライドやファイルを入手したと報じている。

健康データ共有に対する主な抗弁は、情報が匿名化されているという点だが、それが本当に可能かどうかは長らく広く疑問視されてきた。Facebookが、社会的弱者を見つけて支援を提供するという提案を考えてみよう。ケンブリッジ・アナリティカのスキャンダル発覚で中止されたこの計画では、Facebookは病院から提供される人口統計情報を含む匿名化された健康データを求めており、それを自社のユーザーと比較していた。一致する人が見つかった場合、その人のプロファイリングを行い、追加の健康サポートが必要か、あるいは社会的弱者かを判断することになっていた。言い換えれば、データの匿名化を解除することが最大の目的だったのだ。

引き渡されるデータが増えれば増えるほど、匿名化が容易になります。これが、提供されるデータを制限する理由の一つです。「適切に集約され匿名化されていれば、範囲と焦点が狭いデータセット(医療画像や診断ラベルなど)の再識別リスクは原則として低いはずです」と、チューリング研究所フェローのクリストファー・ヤウ氏は述べています。パターンや関係性を探るために用いられるより広範なデータセットは、はるかに高いリスクがあると、彼は説明します。「例えば、組織が識別可能な地理位置情報データ(携帯電話などから取得)を保有している場合、それを病院の記録と相互リンクさせることで、患者の身元を絞り込むことができる可能性があります。」例えば、Android端末を使っている場合、Googleはあなたが特定の日に病院と同じ場所にいることを把握できます。そして、匿名化が解除されていれば、Google、Facebook、データブローカーなど、他のプロフィールとリンクされ、オンラインマーケティングや保険料などに悪用される可能性があります。

NHSやその他の医療機関が、こうしたリンクを回避するために実行できる簡単な対策があります。例えば、引き渡される情報を制限したり、将来の利用を厳しく規制・監査したり、さらにはデータの閲覧は許可するが持ち帰りは許可しないといった対策です。「アクセス条件を制限し、データを共有しないようにしつつ、研究者が『ドラフトチャンバー』のような場所で実験を行い、プライバシーへの影響が許容範囲内に抑えられる結果のみを持ち帰れるようにするのです」とボイテン氏は言います。「国勢調査データはすでにそのように機能しています。」

健康データ共有がうまく行われている事例はいくつかある。ヤウ氏は英国バイオバンク、ブース氏は10万ゲノムプロジェクトを挙げる。「彼らははるかに規律正しく、厳格な方法でデータ共有を進めています。合意に基づき、安全で、透明性も確保されています」とブース氏は言う。しかし、NHSには異なる課題がある。例えば、統一されたポリシーを策定するのが難しい断片化された組織構造や、限られたリソースなどだ。大手テクノロジー企業がNHSの扉を叩くと、データ共有契約書を作成する弁護士チームがやって来る。

だからこそ透明性が非常に重要なのです。ブース氏は「契約内容を見せてください。これはどんな取引においても双方に当てはまることです」と訴えます。彼はアマゾンとの契約を例に挙げ、NHSはそのような契約に合意する前に必ず実施すべきデータ保護影響評価を公開すべきだと主張します。「NHSには、この件全体を包括的に検討したことを示してもらいたいのです」と彼は言います。「提示された商業的提案を理解していることを示してください」

そして、商業面は長期的にNHSにとって問題となる。これらの機械学習アルゴリズムやその他の医療システムは、私たちのデータで訓練され、私たちの病院で試験運用されている。しかし、今のところ、最終結果の所有権はNHSにはない。「統計的手法や機械学習手法を用いて膨大なデータを分析することで、様々な相関関係が明らかになり、有用な治療や診断につながる可能性があります」とボイテン氏は言う。「特定されたパターンの所有権は通常、それを発見した者にあり、データを最初に提供した者にはないのです。」

しかし、レジスター文書に示された一筋の希望の光のおかげで、状況は変わりつつある。この文書には、3つのビジネスモデルが示唆されている。1つは、データを無料で提供し、そのキュレーションやシステム開発の支援と引き換えに提供する、もう1つは、データへのアクセスに対して前払い料金を請求する、そしてもう1つは、知的財産、株式、または利益を共有するというものだ。後者は、長期的な賭けとして成功する可能性がある。真のイノベーションがシリコンバレーの所有物であるならば、私たちは自らが築き上げた技術にアクセスするために、法外な金額を支払うことになるだろう。


Digital Societyは、テクノロジーが社会をどう変えていくかを探るデジタルマガジンです。Vontobelとの出版提携により制作されていますが、すべてのコンテンツは編集上独立しています。テクノロジーが社会の未来をどのように形作っていくかについてのストーリーをもっと知りたい方は、Vontobel Impactをご覧ください。


2019年12月20日20:17BST更新: GoogleとヘルスケアプロバイダーAscensionの関係が明らかに

この記事はWIRED UKで最初に公開されました。

続きを読む