この物語 のオリジナル版はQuanta Magazineに掲載されました。
ローズ・ユーは10歳の時、人生を変える誕生日プレゼントをもらいました。そして、もしかしたら物理学の勉強方法も変えたかもしれません。叔父がコンピューターをプレゼントしてくれたのです。25年前の中国ではコンピューターは珍しかったので、このプレゼントは無駄にはなりませんでした。ユーは当初、主にコンピューターゲームをしていましたが、中学時代にウェブデザインの賞を受賞しました。これが、コンピューター関連の数々の栄誉の始まりでした。
ユーさんは浙江大学でコンピュータサイエンスを専攻し、革新的な研究で賞を受賞しました。大学院では南カリフォルニア大学(USC)を選びましたが、その理由の一つは、当時アメリカで唯一の知り合いだった叔父が、近隣のパサデナにあるジェット推進研究所で働いていたことでした。ユーさんは2017年に最優秀論文賞を受賞し、博士号を取得しました。最近の栄誉は1月、ジョー・バイデン大統領の任期最終週に、大統領若手キャリア賞を授与されたことです。
現在カリフォルニア大学サンディエゴ校(UCSD)の准教授を務めるユー氏は、「物理学誘導型ディープラーニング」と呼ばれる分野のリーダーであり、長年にわたり物理学の知識を人工ニューラルネットワークに組み込んできました。この研究は、これらのシステムの構築と学習に新たな手法を導入しただけでなく、実世界への応用においてもいくつかの進歩をもたらしました。流体力学の原理を活用して交通予測の精度向上を図り、乱流シミュレーションを高速化してハリケーンへの理解を深め、新型コロナウイルス感染症(COVID-19)の感染拡大予測に役立つツールを考案しました。
この研究により、ユウ氏は壮大な夢の実現に一歩近づきました。それは、彼女が「AIサイエンティスト」と呼ぶデジタルラボアシスタントスイートの導入です。彼女は現在、物理学の原理に完全に基づき、新たな科学的知見をもたらすことができる、人間の研究者とAIツールとの「パートナーシップ」を構想しています。このようなアシスタントチームからのインプットを組み合わせることが、発見プロセスを促進する最良の方法かもしれないと彼女は考えています。
QuantaはYu氏に、様々な形で現れる混乱、AIを最大限に活用する方法、そしてAIが都市の渋滞から抜け出す可能性について話を聞きました。インタビューは分かりやすくするために要約・編集されています。

彼女は UCSD キャンパスで准教授を務めています。
写真:ペギー・ピーティー(Quanta Magazine)物理学とディープラーニングを初めて組み合わせようとしたのはいつですか?
ローズ・ユー:きっかけは交通渋滞でした。私は南カリフォルニア大学の大学院生で、キャンパスは州間高速道路10号線と110号線の交差点のすぐ近くにありました。どこに行くにも渋滞を抜けなければならず、本当にイライラしました。2016年、この状況を改善できないかと考え始めました。
当時、データからパターンを導き出す多層ニューラルネットワークを用いるディープラーニングは、非常に注目を集めていました。画像分類への応用については既に大きな期待が寄せられていましたが、画像はあくまでも静的なものです。そこで、ディープラーニングが、常に変化する問題にも役立つのではないかと考えました。この考えを最初に抱いたのは私ではありませんでしたが、同僚と共に、この問題を捉える斬新な方法を発見しました。
新しいアプローチは何でしたか?
まず、交通を拡散という物理的なプロセスの観点から考えました。私たちのモデルでは、道路網上の交通の流れは、流体力学の法則に支配される運動である表面上の流体の流れに似ています。しかし、私たちの最大の革新は、交通をグラフ理論という数学の分野におけるグラフとして捉えたことです。高速道路などの道路上の交通を監視するセンサーが、このグラフのノードとして機能します。そして、グラフのエッジは、それらのセンサー間の道路(と距離)を表します。

ユウさんがコンピューターに興味を持ったのは、10歳の誕生日にもらったプレゼントがきっかけでした。
写真:ペギー・ピーティー(Quanta Magazine)グラフは、特定の時間における道路網全体のスナップショットを提供し、グラフ上の各地点における車の平均速度を示します。5分間隔でこれらのスナップショットを連続して取得すると、交通状況の変化を的確に把握できます。そこから、将来の状況を予測することができます。
ディープラーニングの大きな課題は、ニューラルネットワークを学習させるために大量のデータが必要になることです。幸いなことに、私の指導教官の一人であるサイラス・シャハビは長年交通量予測の問題に取り組んでおり、私がアクセス可能な膨大なロサンゼルスの交通データを蓄積していました。
それで、あなたの予測はどれくらい正しかったですか?
私たちの研究以前は、信頼できる交通予測は15分程度しかできませんでした。私たちの予測は1時間有効になり、大きな進歩でした。私たちのコードは2018年にGoogleマップに導入されました。それから少し経って、Googleから客員研究員に招かれました。
気候モデリングに取り組み始めたのはその頃ですよね?
はい、それは2018年にローレンス・バークレー国立研究所で講演したときに始まりました。その後、そこで科学者たちと話し合い、物理学に基づくディープラーニングのテストベッドとして適した問題を探しました。そして、気候モデルの重要な要素であると同時に、大きな不確実性を伴う領域でもある乱流の進化を予測することに落ち着きました。
乱流の身近な例としては、コーヒーにミルクを注いでかき混ぜた後に見える渦巻き模様が挙げられます。海洋では、このような渦は数千マイルにも及ぶことがあります。流体の流れを記述するナビエ・ストークス方程式を解くことに基づく乱流挙動の予測は、この分野におけるゴールドスタンダードと考えられています。しかし、必要な計算には非常に時間がかかるため、ハリケーンや熱帯低気圧を予測するための優れたモデルは未だに存在しません。

ロサンゼルスのひどい渋滞が、高速道路の交通を流体の流れとしてモデル化するきっかけとなった。
写真:ペギー・ピーティー(Quanta Magazine)ディープラーニングは役に立つのでしょうか?
基本的な考え方は、最高の数値シミュレーションで訓練されたディープラーニングネットワークが、それらのシミュレーションを模倣(言い換えれば「エミュレート」)することを学習できるというものです。これは、データに埋め込まれた特性やパターンを認識することによって実現されます。近似解を見つけるために、時間のかかる力ずくの計算を行う必要はありません。私たちのモデルは、2次元設定では予測速度を20倍、3次元設定では1,000倍向上させました。私たちの乱流予測モジュールのようなものは、将来的には、ハリケーンなどの予測精度を向上させる、より大規模な気候モデルに組み込まれるかもしれません。
他に乱気流はどこで発生しますか?
乱流はどこにでもあります。例えば、血流の乱流は脳卒中や心臓発作につながる可能性があります。カリフォルニア工科大学でポスドク研究員をしていた頃、ドローンの安定化に関する研究論文を共同執筆しました。プロペラによって発生した気流が地面と相互作用して乱流を発生させ、それがドローンの揺れを引き起こす可能性があります。私たちはニューラルネットワークを用いて乱流をモデル化し、離着陸時のドローンの制御を向上させました。
現在、UCSDとゼネラル・アトミックスの科学者たちと核融合発電に取り組んでいます。成功の鍵の一つは、高温のイオン化物質であるプラズマを制御する方法を学ぶことです。約1億度の温度では、プラズマ内に様々な乱流が発生しますが、その挙動を特徴付ける物理ベースの数値モデルは非常に遅いです。私たちは、プラズマの挙動を瞬時に予測できるディープラーニングモデルを開発していますが、これはまだ開発途上です。

UCSDのオフィスにいるYuさんと博士課程の学生Jianke Yangさん。
写真:ペギー・ピーティー(Quanta Magazine)AI サイエンティストのアイデアはどこから来たのですか?
ここ数年、私のグループはデータから対称性の原理を自動的に発見できるAIアルゴリズムを開発してきました。例えば、私たちのアルゴリズムは光速度不変に関係するローレンツ対称性を特定しました。また、回転対称性(例えば、球体をどのように回転させても見た目が変わらないという事実)も特定しました。これは、アルゴリズムが特に学習するように訓練されたものではありません。これらはよく知られた特性ですが、私たちのツールは物理学では現在知られていない新しい対称性を発見する能力も備えており、これは大きなブレークスルーとなるでしょう。
そこで、私たちのツールが生データから対称性を発見できるのであれば、これを一般化してみてはどうだろうかと考えたのです。これらのツールは、科学研究におけるアイデアや新たな仮説を生み出す可能性もあるのです。これがAI Scientistの誕生です。
AI サイエンティストとはいったい何でしょうか?単なるニューラル ネットの一種なのでしょうか?
これは単一のニューラルネットワークではなく、科学者が新たな発見をするのに役立つコンピュータプログラムの集合体です。私のグループはすでに、天気予報、地球温暖化の要因の特定、あるいはワクチン接種政策が病気の伝染に与える影響といった因果関係の発見といった、個々のタスクを支援するアルゴリズムを開発しています。
現在、複数のタスクに対応できる汎用性の高い、より広範な「基盤」モデルを構築しています。科学者はあらゆる種類の機器からデータを収集しており、私たちのモデルには数値、テキスト、画像、動画など、様々なデータタイプを組み込むことを目指しています。初期プロトタイプは完成していますが、リリース前にモデルをより包括的、よりインテリジェントに、そしてより高度な学習によって改良したいと考えています。これは数年以内に実現する見込みです。
それは何ができると思いますか?
AIは科学的発見プロセスのほぼすべてのステップを支援できます。「AIサイエンティスト」とは、AIによる科学アシスタントのことです。例えば、実験における文献調査の段階では、通常、膨大なデータ収集と整理作業が必要です。しかし今では、大規模な言語モデルは、たった一度の昼休みで数千冊もの書籍を読み込んで要約することができます。AIが苦手とするのは、科学的妥当性の判断です。この点では、経験豊富な研究者にはかないません。AIは仮説生成、実験設計、データ分析を支援できますが、高度な実験を実行することはできません。
このコンセプトをどこまで実現したいですか?
私が思い描くAI科学者は、研究者の重労働を軽減し、科学の創造的な側面を人間に委ねることができるでしょう。これは私たちが特に得意とする分野です。ご安心ください。目標は人間の科学者に取って代わることではありません。機械が人間の創造性を代替したり、妨害したりする姿は想像もしませんし、決して見たいとも思いません。
オリジナルストーリーは、数学、物理科学、生命科学の研究の進展や動向を取り上げることで科学に対する一般の理解を深めることを使命とする、 シモンズ財団の編集上独立した出版物であるQuanta Magazineから許可を得 て転載されました。