多くの恒星が集まってできている銀河、球状星団、あるいは銀河団といったシステムは、多くの粒子が重力だけで相互作用しているシステム、すなわち重力多体系として扱うことができる。 重力多体系がどのように進化するかということを研究するには、数値計算が重要な役割を果たす。これは、重力多体系の振舞いを記述する方程式には、粒子数が3以上の場合は特殊な初期条件を除いて解析的な解が存在しないためである。 数値計算では、時間ステップ毎に各粒子への重力を計算し、それを使って軌道を数値積分していく。一つの粒子への重力は他のすべての粒子からの重力の和である。もっとも単純な方法では、実際にこの和を計算することになり、ステップ当たりの計算量が粒子数の2乗に比例することになる。Barnes-Hutツリー法やメッシュ上でポテンシャル場をFFTを使って高速に解く方法などでは、計算量をO(N log N)の程度に下げることができるが、FFTを使う方法では空間分解能に制限がつき、またBarnes-Hutツリーの場合にはそのような問題はないものの計算量がO(N2)に比べては大きく減っているとはいえ依然として大きい。特に、高い精度を要求すると計算時間が急速に増える。 どの程度の粒子数を必要とするかは問題によって大きく異なるが、銀河形成や宇宙の大規模構造の形成の場合、数値計算で扱える粒子数よりも実際の粒子数のほうがはるかに大きく、その意味で現実の系はほぼ粒子数無限大の極限である連続分布であり、それを有限の粒子数で近似していることになる。このために、近似誤差が分布関数の数値的な拡散(緩和)となって現れるので、現在のところ粒子数によって計算の信頼性が制限されており、計算を高速化することが極めて重要であるといえる。 論文提出者は主に上のBarnes-Hutツリー法について、その高速化を専用ハードウェアを開発するという方向と高次精度を実現する新しいアルゴリズムを開発・実装するという方向の2つについて行なった。 主論文は3章からなる。その一部は既に1篇の論文として印刷公表されており、またもう1篇現在投稿中の論文がある。これら2篇の論文は、それぞれ1名および3名の共著者との連名であるが、そのすべてが論文提出者の川井敦が筆頭著者であるだけでなく、彼の主導で研究が進められたものであることを論文審査において確認した。なお、その論文の内容を主論文のなかに含めることについては、共著者の承諾書が得られている。 主論文第1章は序論であり、以上のような研究の背景や従来の研究の問題点をまとめ、本研究の目的と意義を述べている。 第2章では、専用ハードウェアを開発することによってBarnes-Hutツリー法等を加速するというアプローチについて、具体的に開発したGRAPE-5とそれによって得られた性能をまとめている。 GRAPE-5は東京大学教養学部で開発されて来た多体問題専用計算機GRAPEシリーズの5号機である。GRAPEの基本的なアイディアは、重力多体系の数値シミュレーションにおいて、もっとも計算量の多い相互作用計算の部分だけを専用機化し、他の部分は汎用計算機に行なわせるというものである。開発自体は杉本らの主導により1990年代初めに始まっており、現在までにGRAPE-1からGRAPE-4までの一連のハードウェアが完成している。 本論文で述べられているGRAPE-5の特色は、ツリー法の高速実行を目的に全体の設計を最適化しているという点にある。GRAPE-3に比べると、GRAPE-5で開発した専用LSIの演算性能は約10倍になっている。これはLSIの集積度の増大と、それにともなう動作周波数の増加によるものである。しかし、ツリー法の場合、これだけでは全体システムとしての性能向上への効果は小さい。というのは、ツリー法では、ホスト計算機の仕事とGRAPEハードウェアでの計算量、両者の通信量がどれもオーダーとしてはN log Nであり、全体としてバランスのとれた性能向上を実現する必要があるためである。特にこのなかで問題になるのは通信速度である。これは、汎用計算機でも問題は同じであり、性能向上にはプロセッサ間、あるいはプロセッサと主記憶の間の通信を速くすることが鍵となる。 GRAPE-5では通信速度の向上を実現するため、GRAPE-4までで採用されていた共有バスによる結合方式に代わって、ポイント・ツー・ポイントの専用通信チャネルでホスト計算機に接続する方法をとった。もちろんこれが完全に有効に働くためにはホスト自体が並列に入出力を行なえるチャネルを持つ必要があるが、近年のワークステーションでは2本以上の独立動作するI/Oバスが一般化しており、またクラスタによる並列化も可能であるためこれは大きな問題ではないと論じられている。 実際に完成したGRAPE-5では、ボード一枚当たり50MB/s程度と従来のGRAPE-3に比べてほぼ10倍の高速化を実現し、さらに計算・通信を複数ボードで並列に行なうことで並列度に応じた性能向上が可能であることを実証している。具体的な性能については、GRAPE-5プロセッサボード2枚を1台のホスト計算機につないだものを、汎用並列計算機と比べた場合、富士通のスーパーコンピュータVPP300/16PEや70台のワークステーションクラスタでの並列ツリーコードとほぼ同等となり、さまざまなコストを考慮すると非常に大きな性能改善が実現されている。 第3章では、P2M2(Pseudo-particle multipole method,疑似粒子多重極法)を実装し、従来は困難とされていた高精度の計算をツリー法で可能にしたこと、またP2M2法自体も改良してさらなる高速化を実現したことが述べられている。 P2M2法自体は1998年に牧野が提案した方法である。基本的な考えは、ポテンシャル場の多重極展開を表現するのに、その係数自体を用いるのではなく同じ展開係数を持つようななるべく少ない数の(疑似)粒子を用いるというものである。この方法の利点は、定式化が単純になることと、GRAPEを使った高速化が可能になることである。 論文提出者はまずこのP2M2法を世界で初めて計算コードとして実現し、実際にこの方法が数値的に安定であり実用可能であることをさまざまなテストを通して示した。さらに、専用計算機GRAPE-4上に実装し、特に高い計算精度が要求される時に専用計算機が極めて有効であり、大きな高速化が実現できることを示した。 さらに、現在のところ2次(四重極)までではあるが、牧野が提案したもともとの方法に比べて少ない疑似粒子数で多重極展開を表現する新しいアルゴリズムをも提案・実現している。この方法により同じ計算精度で計算速度はほぼ4倍高速になっている。 以上を要するに、本論文は重力多体計算の高速化という天体物理、あるいはさらに広く長距離相互作用をもつ粒子系の研究にとって極めて重要な問題に対して、ハードウェアによる高速化、新しいアルゴリズムによる高速・高精度化という2つのアプローチによって大きな貢献をしたものである。よって本論文は博士(学術)の学位論文としてふさわしいものであると、審査委員会は認める。 |