学位論文要旨



No 215625
著者(漢字) 中島,研吾
著者(英字) Nakajima,Kengo
著者(カナ) ナカジマ,ケンゴ
標題(和) 大規模問題のための前処理付き並列反復法
標題(洋) Parallel Iterative Linear Solvers with Preconditioning for Large Scale Problems
報告番号 215625
報告番号 乙15625
学位授与日 2003.03.12
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第15625号
研究科 工学系研究科
専攻 システム量子工学専攻
論文審査委員 主査: 東京大学 教授 矢川,元基
 東京大学 教授 吉村,忍
 東京大学 教授 堀,宗朗
 東京大学 助教授 奥田,洋司
 東京大学 助教授 張,紹良
内容要旨 要旨を表示する

 新しい科学技術の開拓のために、計算機によるシミュレーションは不可欠である。並列計算は様々な大規模、複雑シミュレーションに使用されている。有限要素法(FEM)や差分法(FDM)を使用した大規模シミュレーションでは、計算時間のほとんどは疎行列を係数とした大規模一次連立方程式の解を求めることに費やされる。したがって、これまで、並列計算機上で大規模疎行列を解くためのスケーラブル(scalable)なアルゴリズムについて数々の研究開発が実施されてきた。

 疎行列の解法としては直接法と反復法があるが、並列計算機における大規模計算を考慮した場合、反復法が唯一の選択肢である。反復法の収束は係数行列の固有値分布に大きく依存するため、本来の係数行列を、「前処理(preconditioning)」によって収束しやすい行列に変換する手法が広く使用されている。適切な前処理の選択が反復法の収束に大きく影響する。

 本研究では、並列有限要素法のための「GeoFEM」プラットフォーム上で開発された、非構造格子を使用した様々なアプリケーションにおける並列反復解法に関して、以下に示す3種類の前処理手法を開発した;

(1)三次元固体力学のための局所ブロックILU(0)前処理法、「地球シミュレータ」に代表される「SMP(Symmetric Multi processor)クラスタ」アーキテクチュアを対象とした、汎用前処理手法(general preconditioner)

(2)三次元非圧縮性Navier-Stokes方程式から導かれる圧力補正ポアソン方程式を対象とした、幾何学的多重格子前処理によるスケーラブルな並列前処理、広い範囲の一般的問題に対応した前処理手法(preconditioners for broad classes of underlying problems)

(3)三次元接触問題を対象とした選択的ブロック(selective blocking)前処理手法、個別の問題に関する前処理手法(preconditioners for specific problems)

 適応格子法は非構造格子を使用したシミュレーションにおいて、解の性質の物理的詳細を予測することが不可能な問題の場合有効な手法である。この手法を並列計算機上で実行する場合、プロセッサ間の負荷が不均一になる場合がある。本研究では、「DRAMA」ライブラリを使用して、、動的負荷分散機能つきの並列適応格子手法を開発した。更に「GeoFEM」プラットフォーム上で開発された三次元圧縮性Navier-Stokes方程式解析コードに組み込んだ。適応格子、多重格子を考慮したGeoFEMデータ構造を拡張した。

 「GeoFEM」プラット-フォームを対象として開発された上記の前処理手法、データ構造によって、接触問題に代表されるような悪条件の問題においても、プロセッサ数が千を超えるような場合においても高い並列およびベクトル性能を得ることができた。

 (1)で開発した、局所ブロックILU(0)前処理法つき共役勾配法では、本研究で開発した非構造格子向けのオーダリング手法を使用して、22億自由度の三次元弾性問題を「地球シミュレータ」176ノード(1,408プロセッサ)を使用して3.80テラフロップスの性能を得た。これはピーク性能の33.7%に相当する。

 (2)で開発した幾何学的多重格子法は日立SR2201の128プロセッサを使用した計算で、高いスケーラビリティと95%を超えるような高い並列性能を達成するとともに、これまであまり使用されなかったILU型スムージング手法が特に悪条件問題の場合に有効であることも示された。また、適応格子を使用した場合、従来使用されてきた手法よりも簡便な「Direct Jump法」が有効であることが示された。

 また、(3)で開発された選択的ブロック(selective blocking)前処理手法は接触問題において効果を発揮し、精度良い解を効率よく得ることができた。また、ベクトル化によって「地球シミュレータ」のピーク性能の29.1%を達成することができた。選択的ブロック法は必要メモリ容量も少なく、ILU(1)の50%、ILU(2)の25%である。

 以上の結果により、本研究で開発された前処理手法、並列データ構造は今後並列計算機のアーキテクチュアの主流を占めると考えられる「SMPクラスタ」型アーキテクチュアにおいて有効であることが示された。

審査要旨 要旨を表示する

 新しい科学技術の開拓のために、計算機によるシミュレーションは不可欠である。並列計算は様々な大規模、複雑シミュレーションに使用されている。有限要素法(FEM)や差分法(PDM)を使用した大規模シミュレーションでは、計算時間のほとんどは疎行列を係数とした大規模一次連立方程式の解を求めることに費やされる。したがって、これまで、並列計算機上で大規模疎行列を解くためのスケーラブル(scalable)なアルゴリズムについて数々の研究開発が実施されてきた。

 疎行列の解法としては直接法と反復法があるが、並列計算機における大規模計算を考慮した場合、反復法が唯一の選択肢である。反復法の収束は係数行列の固有値分布に大きく依存するため、本来の係数行列を、「前処理(preconditioning)」によって収束しやすい行列に変換する手法が広く使用されている。適切な前処理の選択が反復法の収束に大きく影響する。

 本研究では、並列有限要素法のための「GeoFEM」プラットフォーム上で開発された、非構造格子を使用した様々なアプリケーションにおける並列反復解法に関して、以下に示す3種類の前処理手法を開発した:

(1)三次元固体力学のための局所ブロックILU(0)前処理法、「地球シミュレータ」に代表される「SMP(Symmetric Multiprocessor)クラスタ」アーキテクチュアを対象とした、汎用前処理手法(general preconditioner)

(2)三次元非圧縮性Navier-Stokes方程式から導かれる圧力補正ポアソン方程式を対象とした、幾何学的多重格子前処理によるスケーラブルな並列前処理、広い範囲の一般的問題に対応した前処理手法(preconditioners for broad classes of underlying problems)

(3)三次元接触問題を対象とした選択的ブロック(selective blocking)前処理手法、個別の問題に関する前処理手法(preconditioners for specific problems)

 適応格子法は非構造格子を使用したシミュレーションにおいて、解の性質の物理的詳細を予測することが不可能な問題の場合有効な手法である。この手法を並列計算機上で実行する場合、プロセッサ間の負荷が不均一になる場合がある。本研究では、「DRAMA」ライブラリを使用して、動的負荷分散機能つきの並列適応格子手法を開発した。更に「GeoFEM」プラットフォーム上で開発された三次元圧縮性Navier-Stokes方程式解析コードに組み込んだ。適応格子、多重格子を考慮したGeoFEMデータ構造を拡張した。

 「GeoFEM」プラット-フォームを対象として開発された上記の前処理手法、データ構造によって、接触問題に代表されるような悪条件の問題においても、プロセッサ数が千を超えるような場合においても高い並列およびベクトル性能を得ることができた。

 (1)で開発した、局所ブロックILU(0)前処理法つき共役勾配法では、本研究で開発した非構造格子向けのオーダリング手法を使用して、22億自由度の三次元弾性問題を「地球シミュレータ」176ノード(1,408プロセッサ)を使用して3.80テラフロップスの性能を得た。これはピーク性能の33.7%に相当する。

 (2)で開発した幾何学的多重格子法は日立SR2201の128プロセッサを使用した計算で、高いスケーラビリティと95%を超えるような高い並列性能を達成するとともに、これまであまり使用されなかったILU型スムージング手法が特に悪条件問題の場合に有効であることも示された。また、適応格子を使用した場合、従来使用されてきた手法よりも簡便な「Direct Jump法」が有効であることが示された。

 また、(3)で開発された選択的ブロック(selective blocking)前処理手法は接触問題において効果を発揮し、精度良い解を効率よく得ることができた。また、ベクトル化によって「地球シミュレータ」のピーク性能の29.1%を達成することができた。選択的ブロック法は必要メモリ容量も少なく、ILU(1)の50%、ILU(2)の25%である。

 以上の結果により、本研究で開発された前処理手法、並列データ構造は今後並列計算機のアーキテクチュアの主流を占めると考えられる「SMPクラスタ」型アーキテクチュアにおいて有効であることが示され、計算科学および科学技術計算の発展に寄与するところが大きい。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク http://hdl.handle.net/2261/37411