人工知能は、医用画像やスキャン画像から病気を専門的に診断することを約束しています。しかし、眼疾患の診断アルゴリズムの学習に用いられるデータを詳しく見ると、これらの強力な新ツールが健康格差を永続させる可能性があることが示唆されています。
英国の研究チームは、眼疾患を発見するAIアルゴリズムの学習に一般的に用いられる94のデータセット(50万枚以上の画像)を分析しました。その結果、ほぼすべてのデータが北米、ヨーロッパ、中国の患者から得られたものであることがわかりました。南アジアからのデータセットはわずか4つ、南米からのデータセットは2つ、アフリカからのデータセットは1つで、オセアニアからのデータセットはありませんでした。
これらの眼画像の情報源の不一致は、AIによる眼科検査アルゴリズムが、少数派の国々の人種集団に対してうまく機能するかどうかの確実性が低いことを意味していると、この研究に参加したバーミンガム大学の眼科医兼研究者、シャオシュアン・リウ氏は述べている。「特定の集団において、疾患にごくわずかな変化があったとしても、AIは重大な失敗をする可能性があります」と彼女は言う。
アメリカ眼科学会はAIツールに強い関心を示しており、医療水準の向上に役立つと期待されている。しかし、リュー氏は、AIツールが主に白人患者を対象とした研究に基づいて開発されたと知れば、医師は人種的マイノリティへの使用に消極的になる可能性があると指摘する。また、医師自身には気づかないほど微妙な差異によってアルゴリズムが機能しない可能性もあると指摘する。
研究者たちは、データに他の問題も発見しました。多くのデータセットには、年齢、性別、人種といった重要な人口統計データが含まれていないため、他の点でバイアスがかかっているかどうかを判断することが困難でした。また、データセットは緑内障、糖尿病網膜症、加齢黄斑変性といった少数の疾患についてのみ作成されている傾向がありました。アルゴリズムの学習に使用された46のデータセットは、データが利用できませんでした。
米国食品医薬品局(FDA)は近年、眼科用AIツール2点を含む複数のAI画像診断製品を承認している。リュー氏によると、これらのアルゴリズムを開発する企業は、通常、アルゴリズムの学習方法の詳細を明らかにしていないという。リュー氏と共著者らは、規制当局に対し、AIツールの審査において学習データの多様性を考慮するよう求めている。
眼画像データセットに見られるバイアスは、そのデータで訓練されたアルゴリズムがアフリカ、ラテンアメリカ、東南アジアで適切に機能する可能性が低いことを意味します。これは、AI診断の大きな利点の一つ、つまり医療専門知識が不足している貧困地域に自動化された医療専門知識をもたらす可能性を損なうことになります。
「特定の集団の一部の人々にしか恩恵をもたらさないイノベーションが生まれているのです」とリュー氏は言う。「特定の郵便番号地域には対応していないGoogleマップのようなものでしょう。」
研究者らが「データ貧困」と呼ぶ眼の画像に見られる多様性の欠如は、多くの医療用AIアルゴリズムに影響を及ぼす可能性がある。
スタンフォード大学医学部助教授のアミット・カウシャル氏は、AIの医療利用に関する74件の研究を分析した研究チームの一員です。このうち56件は米国の患者のデータを使用していました。その結果、米国のデータの大部分は、カリフォルニア州(22)、ニューヨーク州(15)、マサチューセッツ州(14)の3州から収集されたものであることが分かりました。

超スマートなアルゴリズムがすべての仕事をこなせるわけではありませんが、これまで以上に速く学習し、医療診断から広告の提供まであらゆることを行っています。
「人口のサブグループがAIの学習データから体系的に除外されると、AIアルゴリズムは除外されたグループに対してパフォーマンスが低下する傾向があります」とカウシャル氏は言う。「過小評価されている集団が直面している問題は、利用可能なデータの不足により、AI研究者によって研究されることさえないかもしれません。」
解決策は、AI研究者や医師にこの問題を認識させ、より多様なデータセットを求めるようにすることだと彼は言います。「AI研究のために多様なデータへのアクセスを可能にする技術基盤と、こうしたデータの研究利用を支援し保護する規制環境を構築する必要があります」と彼は言います。
フロリダ州メイヨー・クリニックで放射線医学におけるAIの活用に取り組む研究科学者、ビカシュ・グプタ氏は、より多様なデータを追加するだけでバイアスを排除できる可能性があると述べている。「現時点では、この問題をどのように解決するかは難しい」と彼は言う。
しかしグプタ氏は、例えば特定の集団に不均衡に影響を与える病気を診断する場合など、状況によっては、アルゴリズムが人口のサブセットに焦点を当てることが有用である可能性があると述べている。
眼科医のリュー氏は、医療AI技術がより広く普及するにつれて、AIの学習データの多様性がさらに高まることを期待していると述べています。「10年後、AIを使って病気を診断するようになった時、目の前に肌の色が濃い患者さんがいたとしても、『申し訳ありませんが、この治療法はあなたには効果がありませんので、別の治療法を使わなければなりません』とは言いたくありません」と彼女は言います。
WIREDのその他の素晴らしい記事
- 📩 テクノロジー、科学、その他の最新情報を知りたいですか?ニュースレターにご登録ください!
- 陰謀論を封じ込めようとするYouTubeの陰謀
- 一般的な植物ウイルスは、がんとの戦いにおける意外な味方である
- 仕事がいかにして逃れられない地獄になったのか
- 今こそ、これらの5つの生理用品を試す絶好の機会です
- ピークニュースレター?それは80年前のこと
- 🎮 WIRED Games: 最新のヒントやレビューなどを入手
- 💻 Gearチームのお気に入りのノートパソコン、キーボード、タイピングの代替品、ノイズキャンセリングヘッドホンで仕事の効率をアップさせましょう