新しいタイプのニューラルネットワークがビッグ物理学の助けとなる

新しいタイプのニューラルネットワークがビッグ物理学の助けとなる

1000ページの本が あるとします。しかし、各ページには1行しかテキストがありません。スキャナーを使って本に含まれる情報を抽出するはずですが、このスキャナーはすべてのページを体系的にスキャンし、一度に1平方インチずつスキャンします。このスキャナーで本全体を読み取るには長い時間がかかり、そのほとんどは空白部分のスキャンに費やされることになります。

多くの実験物理学者の日常は、まさにこのようなものだ。素粒子実験では、検出器が膨大な量のデータを捕捉・分析するが、有用な情報を含むのはほんの一部に過ぎない。「例えば、空を飛ぶ鳥の写真では、すべてのピクセルが意味を持つ可能性がある」と、SLAC国立加速器研究所の物理学者、寺尾和弘氏は説明する。しかし、物理学者が実際に見る画像では、実際にはほんの一部しか重要ではない場合が多い。このような状況では、細部まで徹底的に調べることは、時間と計算リソースを無駄に消費してしまう。

しかし、状況は変わり始めています。スパース畳み込みニューラルネットワーク(SCNN)と呼ばれる機械学習ツールを用いることで、研究者はデータの関連部分に焦点を当て、それ以外の部分を除外することができます。研究者たちはこのネットワークを用いることで、リアルタイムデータ分析の能力を大幅に向上させています。そして、少なくとも3大陸で今後実施予定の、あるいは既に実施中の実験にSCNNを採用する計画です。この転換は、物理学界にとって歴史的な変化と言えるでしょう。 

「物理学では、独自のアルゴリズムや計算手法を開発することに慣れています」と、ハーバード大学の物理学者カルロス・アルゲレス=デルガド氏は述べた。「私たちは常に開発の最前線に立ってきましたが、今では計算の分野では、コンピュータサイエンスが先導することが多くなっています。」 

まばらな文字

SCNNにつながる研究は2012年に、当時ウォーリック大学にいたベンジャミン・グラハム氏が、中国語の手書きを認識できるニューラルネットワークを作りたいと考えたときに始まった。 

当時、このような画像関連タスクに最も適したツールは、畳み込みニューラルネットワーク(CNN)でした。中国語の手書きタスクでは、書き手がデジタルタブレットで文字をなぞり、例えば10,000ピクセルの画像を作成します。CNNは、カーネルと呼ばれる3×3のグリッドを画像全体に移動させ、各ピクセルの中心に配置します。カーネルを配置するたびに、ネットワークは畳み込みと呼ばれる複雑な数学的計算を実行し、特徴的な特徴を探します。

CNNは写真のような情報密度の高い画像での使用を想定して設計されています。しかし、漢字を含む画像はほとんどが空っぽです。研究者たちは、この特性を持つデータを「スパース(疎)」と呼んでいます。これは自然界のあらゆるものに共通する特徴です。「世界がどれほどスパースになり得るかを示す例として、エッフェル塔を可能な限り小さな長方形に収めるとしたら、その長方形は「99.98%が空気で、わずか0.02%が鉄」で構成されるでしょう」とグラハム氏は言います。

雪景色の中にある金属製の建物

南極のアイスキューブ・ニュートリノ観測所。写真:フェリペ・ペドレロス/アイスキューブ/NSF/クォンタ

グラハムはCNNのアプローチを微調整し、カーネルが画像の3×3の領域にのみ配置されるようにしました。この領域には、ゼロ以外の値を持つ(そして単なる空白ではない)ピクセルが少なくとも1つ含まれている必要があります。こうして、彼は手書きの中国語を効率的に識別できるシステムの開発に成功しました。このシステムは、2013年のコンテストで、個々の文字をわずか2.61%のエラー率で識別し、優勝しました(人間の平均スコアは4.81%でした)。次に彼は、さらに大きな問題、つまり3次元物体の認識に着目しました。

2017年までに、グラハムはFacebook AI Researchに移籍し、自身の技術をさらに洗練させ、最初のSCNNの詳細を公開しました。このSCNNは、カーネルを非ゼロ値を持つピクセルのみに中央配置するものでした(非ゼロ値ピクセルが少なくとも1つ含まれる3×3のセクションにカーネルを配置するのではなく)。寺尾が素粒子物理学の世界に持ち込んだのは、まさにこの基本的な考え方でした。

アンダーグラウンドショット

寺尾氏は、フェルミ国立加速器研究所で、ニュートリノの性質を解明する実験に携わっています。ニュートリノは、既知の素粒子の中で最も捉えにくい粒子の一つです。ニュートリノは宇宙で最も多く存在する質量を持つ粒子ですが(質量は大きくないものの)、検出器に現れることは稀です。そのため、ニュートリノ実験で得られるデータのほとんどはスパースであり、寺尾氏は常にデータ解析のより良い手法を模索していました。そして、SCNNにその一つを見つけました。

2019年、彼はSCNNを深部地下ニュートリノ実験(DUNE)から得られると予想されるデータのシミュレーションに適用しました。DUNEは2026年に稼働開始予定の世界最大のニュートリノ物理学実験となります。このプロジェクトでは、シカゴ郊外のフェルミ国立加速器研究所からニュートリノを発射し、地球を800マイル(約1300キロメートル)通過してサウスダコタ州の地下実験室に到達します。その過程で、粒子は既知の3種類のニュートリノの間で「振動」し、この振動によってニュートリノの詳細な特性が明らかになる可能性があります。

SCNNはシミュレーションデータを通常の手法よりも高速に分析し、必要な計算能力も大幅に削減しました。この有望な結果は、実際の実験実行においてSCNNが使用される可能性が高いことを示しています。

ロボットハンドがパズルのピースを1つ拾い上げる

一方、2021年には、寺尾氏はフェルミ国立加速器研究所の別のニュートリノ実験「MicroBooNE」にSCNNを導入する支援を行いました。この実験では、ニュートリノとアルゴン原子核の衝突後の挙動を観測しています。これらの相互作用によって生じた飛跡を調べることで、研究者は元のニュートリノの詳細を推測することができます。そのためには、検出器の3次元表現におけるピクセル(技術的には、その3次元対応物であるボクセル)を調べ、どのピクセルがどの粒子の軌道に関連付けられているかを判断できるアルゴリズムが必要です。

データは非常にスパース(巨大な検出器(約170トンの液体アルゴン)内の小さな線が点在する程度)であるため、SCNNはこのタスクにほぼ最適です。標準的なCNNでは、膨大な計算量を要するため、画像を50個に分割する必要があると寺尾氏は言います。「スパースCNNを使えば、画像全体を一度に分析でき、しかもはるかに高速に処理できます。」

タイムリーなトリガー

MicroBooNEの開発に携わった研究者の一人に、フェリックス・ユーという名の学部生インターンがいました。SCNNのパワーと効率性に感銘を受けた彼は、南極にあるIceCubeニュートリノ観測所と正式に提携しているハーバード大学の研究室に大学院生として赴任し、そのツールを次の職場に持ち込みました。

この観測所の主要目標の一つは、宇宙で最もエネルギーの高いニュートリノを捕捉し、その発生源まで追跡することです。発生源のほとんどは銀河系外にあります。検出器は南極の氷の中に埋め込まれた5,160個の光学センサーで構成されており、常時点灯するのはそのうちのごく一部だけです。残りのセンサーは暗く、特に有益な情報を与えません。さらに悪いことに、検出器が記録する「イベント」の多くは誤検知であり、ニュートリノ探索には役立ちません。いわゆるトリガーレベルのイベントだけが更なる分析にかけられ、どのイベントがトリガーレベルに値し、どのイベントは永久に無視されるのかを瞬時に判断する必要があります。

標準的なCNNはこのタスクには遅すぎるため、IceCubeの科学者たちは長年、LineFitと呼ばれるアルゴリズムに頼って、潜在的に有用な検出結果を予測してきました。しかし、このアルゴリズムは信頼性が低く、「興味深いイベントを見逃してしまう可能性がある」とYu氏は述べています。繰り返しますが、これはSCNNに最適なスパースデータ環境です。

ユウ氏は、博士課程の指導教官であるアルゲレス=デルガド氏、そしてウィスコンシン大学マディソン校の大学院生ジェフ・ラザール氏とともに、その利点を定量化し、最近の論文で、これらのネットワークは一般的なCNNの約20倍の速度になることを示しました。「これは、検出器から出力されるすべてのイベント(毎秒約3000件)を処理するのに十分な速度です」とラザール氏は述べました。「これにより、何を捨て、何を残すかについて、より適切な判断を下すことができます。」

IceCubeセンサーの二連画

IceCubeには、南極の氷の奥深くに数千個のセンサーが埋​​め込まれています。左の写真(研究者とエンジニアの署名入り)もその一つです。ニュートリノハンターにとって有用なデータを生成するセンサーは常にごくわずかであるため、研究者たちは不要なデータを選別するためのツールを必要としていました。写真:Robert Schwarz/NSF/Quanta

著者らは、公式IceCubeデータを用いたシミュレーションにSCNNを導入することに成功しており、次のステップは南極の計算システムのレプリカでシステムをテストすることです。すべてが順調に進めば、アルゲレス=デルガド氏は、来年には南極観測所にシステムが設置されると考えています。しかし、この技術はさらに幅広い用途に活用される可能性があります。「SCNNはIceCubeだけでなく、すべてのニュートリノ望遠鏡に役立つと考えています」とアルゲレス=デルガド氏は述べています。

ニュートリノを超えて

マサチューセッツ工科大学の物理学者フィリップ・ハリス氏は、世界最大の粒子加速器である欧州原子核研究機構(CERN)の大型ハドロン衝突型加速器(LHC)でSCNNが役立つことを期待しています。ハリス氏は、MITの同僚であるコンピュータ科学者ソン・ハン氏からこの種のニューラルネットワークについて聞きました。「ソン氏はアルゴリズムを高速かつ効率的に構築する専門家です」とハリス氏は述べました。毎秒4000万回の衝突が発生するLHCにはまさにうってつけの人物です。

数年前にソン氏はハリス氏と話をした際、研究室のメンバーと共同で進めている自動運転車プロジェクトについて話した。ソン氏のチームはSCNNを用いて、車両前方の空間(その大部分は空)の3Dレーザーマップを分析し、前方に障害物があるかどうかを調べていた。

ハリス氏と彼の同僚たちは、LHCでも同様の課題に直面している。装置内で2つの陽子が衝突すると、粒子でできた膨張する球体が形成される。これらの粒子の1つがコレクターに衝突すると、二次粒子シャワーが発生する。「このシャワーの全範囲をマッピングできれば、シャワーを発生させた粒子のエネルギーを特定できます」とハリス氏は述べた。この粒子は、物理学者が2012年に発見したヒッグス粒子や、物理学者が今もなお探査を続けている暗黒物質粒子のような、特に興味深い対象となる可能性がある。

「私たちが解決しようとしている問題は、点と点を結びつけることに尽きます」とハリス氏は語った。それは、自動運転車がレーザーマップの点と点を結びつけて障害物を検知するのと同じようなものだ。

SCNNはLHCでのデータ分析を少なくとも50倍高速化するだろうとハリス氏は述べた。「私たちの最終目標は、SCNNを検出器に組み込むことです」。そのためには、少なくとも1年間の書類手続きと、コミュニティからのさらなる協力が必要になるだろう。しかし、ハリス氏と同僚たちは希望を抱いている。

総合的に見て、SCNN(もともとコンピューターサイエンスの世界で考案されたアイデア)が、ニュートリノ物理学(DUNE)、ニュートリノ天文学(IceCube)、高エネルギー物理学(LHC)で行われた史上最大の実験で近いうちに役割を果たす可能性が高まっています。

グラハム氏は、SCNNが素粒子物理学に進出していることを知って嬉しい驚きを覚えたが、完全にショックを受けたわけではないと述べた。「抽象的な意味で言えば、宇宙を移動する粒子は、紙の上で動くペンの先端に少し似ています」と彼は言った。

オリジナルストーリーは、数学、物理科学、生命科学の研究の進展や動向を取り上げることで科学に対する一般の理解を深めることを使命とする、 シモンズ財団の編集上独立した出版物であるQuanta Magazineから許可を得て転載されました。