最近、ある素粒子物理学者が、ある計算を新たな精度の域にまで押し上げたという話をしているのを聞きました。彼が使ったツールは? 1980年代のFORMというコンピュータープログラムです。
素粒子物理学者は、科学分野全体の中でも最も長い方程式のいくつかを使います。例えば、大型ハドロン衝突型加速器(LHC)での衝突において、新たな素粒子の兆候を探すために、彼らは衝突の可能性のある結果を描いたファインマン図と呼ばれる何千もの図を描きます。それぞれの図は、数百万項に及ぶ複雑な式をコード化しています。このような式を紙とペンで足し合わせることは不可能であり、コンピューターで足し合わせることさえ困難です。学校で習う代数の規則は宿題としては十分速いですが、素粒子物理学では非常に非効率的です。
コンピュータ代数システムと呼ばれるプログラムは、こうしたタスクの処理に取り組んでいます。そして、世界最大の方程式を解きたい場合、33年間、あるプログラムが傑出してきました。それがFORMです。
オランダの素粒子物理学者ヨス・フェルマセレン氏によって開発されたFORMは、素粒子物理学の基盤の重要な部分であり、最も困難な計算に不可欠です。しかし、驚くほど多くの重要なデジタル基盤と同様に、FORMの維持管理は主に一人の人物、フェルマセレン氏自身にかかっています。そして73歳になった彼は、FORMの開発から身を引こうとしています。学術界のインセンティブ構造はソフトウェアツールではなく論文発表を重視するため、後継者は現れていません。この状況が変わらなければ、素粒子物理学は劇的に減速を余儀なくされる可能性があります。
FORMは、コンピュータの役割が急速に変化していた1980年代半ばに誕生しました。その前身であるマルティヌス・フェルトマン氏が作成したSchoonschipというプログラムは、Atariコンピュータの側面に差し込む専用チップとしてリリースされました。ヴェルマセレン氏は、世界中の大学がダウンロードできる、よりアクセスしやすいプログラムを作りたいと考えました。そこで、彼はFORTRAN(Formula Translation:数式変換)というコンピュータ言語でプログラミングを始めました。FORMという名前は、このFORTRANにちなんで付けられました(後に彼はCというプログラミング言語に切り替えました)。ヴェルマセレン氏は1989年にこのソフトウェアをリリースしました。1990年代初頭までに、世界中の200以上の機関がダウンロードし、その数は増え続けました。
2000年以降、FORMを引用した素粒子物理学論文は、平均して数日ごとに発表されています。「私たちのグループが過去20年間に得た(高精度の)結果のほとんどは、FORMのコードに大きく依存していました」と、チューリッヒ大学のトーマス・ゲールマン教授は述べています。
FORMの人気は、長年かけて構築された特殊なアルゴリズムに由来する部分もあります。例えば、ファインマン図の特定の部分を素早く掛け算するトリックや、乗算と加算を可能な限り少なくするように方程式を並べ替える手順などです。しかし、FORMの最も古く、そして最も強力な利点は、メモリの処理方法にあります。
人間には短期記憶と長期記憶の2種類の記憶があるように、コンピュータにもメインメモリと外部メモリの2種類があります。メインメモリ(コンピュータのRAM)は、瞬時にアクセスできますが、容量には限りがあります。ハードディスクやソリッドステートドライブなどの外部メモリデバイスは、より多くの情報を保持できますが、速度は遅くなります。長い方程式を解くには、簡単に扱えるようにメインメモリに保存する必要があります。
80 年代には、どちらのタイプのメモリも限られていました。「FORM は、メモリがほとんどなく、ディスク スペースもなかった、基本的に何もなかった時代に構築されました」と、Vermaseren の元教え子で FORM の開発者であり、現在はスイス連邦工科大学チューリッヒ校の博士研究員である Ben Ruijl は述べています。これが課題となりました。方程式が長すぎてメイン メモリで処理できなかったのです。方程式を計算するには、オペレーティング システムがハード ディスクをメイン メモリでもあるかのように扱う必要がありました。オペレーティング システムは、方程式がどのくらいの大きさになるか予測できないため、データをハード ディスク上の一連の「ページ」に格納し、必要な部分が増えるたびにページ間を頻繁に切り替えていました。これはスワッピングと呼ばれる非効率的なプロセスでした。

この xkcd コミックは状況をよく表しています。
イラスト: xkcd.comFORMはスワッピングを回避し、独自の技術を採用しています。FORMで方程式を操作する際、プログラムは各項にハードディスク上の一定量の領域を割り当てます。この技術により、方程式の各要素がどこにあるかをより簡単に追跡できます。また、必要なときに、残りの部分にアクセスすることなく、それらの要素だけをメインメモリに戻すことも容易になります。
FORMの初期の頃からメモリは増大し、1985年のAtari 130XEの128キロバイトのRAMから、私の高性能デスクトップの128ギガバイトのRAMへと、100万倍も進化しました。しかし、Vermaserenが開発した技術は依然として重要です。素粒子物理学者たちが大型ハドロン衝突型加速器(LHC)から得られるペタバイト単位のデータを精査し、新粒子の証拠を探すにつれ、精度への要求は高まり、方程式の長さも増しています。
「メモリがどれだけ大きくなっても、こうしたことは永遠に重要であり続けるだろう。なぜなら、メモリのサイズを超えてしまう物理的な問題が常に存在するからだ」とルイイル氏は語った。
コンピュータの能力はほぼ指数関数的に成長し、約2年ごとに倍増しています。しかし、指数関数的成長よりも速い成長形態があります。3つの文字(a、b、c)をあらゆる順序で書くという課題を考えてみましょう。最初の文字(a、b、c)には3つの選択肢があり、2番目の文字には2つの選択肢があり、3番目の文字には1つの選択肢があります。この問題は階乗、つまり指数関数的成長よりもさらに速く成長する数学的関係としてスケールします。階乗は、衝突する一連の粒子について描くことができるすべての異なるファインマン図など、物事の可能な組み合わせを数えようとするときによく見られます。これらの素粒子物理学の計算における階乗的成長は、コンピュータ処理能力の指数関数的成長を上回っています。
FORMのようなソフトウェアは物理学にとって極めて重要であるにもかかわらず、その開発努力はしばしば過小評価されている。ヴェルマセレン氏はオランダの国立素粒子物理学研究所に常勤の職を得て、そのプロジェクトを評価してくれる上司にも恵まれたという幸運に恵まれた。しかし、このような幸運はなかなか巡ってこない。この分野にとって極めて重要な簡略化アルゴリズムを開発したイタリアの物理学者ステファノ・ラポルタ氏は、キャリアの大半を学生や装置のための資金なしで過ごしてきた。大学は科学者の論文発表記録を追跡する傾向があるため、重要なインフラに携わる科学者は採用や終身雇用の機会を逃しがちだ。
「コンピューターに多くの時間を費やす人が物理学の終身在職権のある職に就けないということを、私は長年にわたり一貫して見てきました」と、ヴァーマセレン氏は語った。
「ツールに取り組むよりも、実際に物理的な結果を生み出すことの方が名誉なことなのかもしれません」とルイル氏は語った。
ルイルのような若い物理学者も散発的にFORMに取り組んでいますが、キャリアのためにほとんどの時間を他の研究に費やす必要があります。そのため、FORMの開発責任の多くは、現在ほぼ引退しているフェルマセレン氏に委ねられています。
継続的な開発がなければ、FORMはますます使い勝手が悪くなり、古いコンピュータコードしか扱えなくなり、現代の学生がプログラミングを学ぶ方法にも合わなくなります。経験豊富なユーザーはFORMを使い続けるでしょうが、若い研究者はMathematicaのような、よりユーザーフレンドリーだが桁違いに遅いコンピュータ代数プログラムを採用するでしょう。実際には、これらの物理学者の多くは、特定の問題は扱いにくいと判断するでしょう。そのため、素粒子物理学は停滞し、最も難しい計算に取り組めるのはごく少数の人々だけになるでしょう。
4月、ヴェルマセレン氏はFORMユーザーサミットを開催し、今後の計画について協議します。参加者はFORMを存続させる方法、つまりFORMを維持・拡張する方法、そして次世代の学生にFORMの持つ可能性を示す方法について議論します。幸運と努力、そして資金があれば、物理学における最も強力なツールの一つを守り続けられるかもしれません。
オリジナルストーリーは、数学、物理科学、生命科学の研究の進展や動向を取り上げることで科学に対する一般の理解を深めることを使命とする、 シモンズ財団の編集上独立した出版物であるQuanta Magazineから許可を得て転載されました。