学位論文要旨



No 214183
著者(漢字) 高橋,大介
著者(英字) Takahashi,Daisuke
著者(カナ) タカハシ,ダイスケ
標題(和) 分散メモリ型並列計算機における高速多倍長計算とその応用
標題(洋) FAST MULTIPLE-PRECISION ARITHMETIC ON DISTRIBUTED MEMORY PARALLEL COMPUTERS AND ITS APPLICATIONS
報告番号 214183
報告番号 乙14183
学位授与日 1999.02.22
学位種別 論文博士
学位種類 博士(理学)
学位記番号 第14183号
研究科
専攻
論文審査委員 主査: 東京大学 教授 小柳,義夫
 東京大学 教授 平木,敬
 東京大学 助教授 今井,浩
 東京大学 講師 品川,嘉久
 東京大学 助教授 中村,宏
内容要旨

 本論文では,分散メモリ型並列計算機により多倍長加算,減算,乗算,除算および平方根を計算する,効率の良い並列アルゴリズムを提案する.

 高速Fourier変換(FFT)に基づく乗算アルゴリズムにより,n桁どうしの乗算はO(n log n log log n)の演算量で行えることが知られている.FFTに基づく従来の乗算アルゴリズムは2つのn桁の数を掛けて2n桁の結果を得るものであった.ところが,多倍長浮動小数点数の乗算においては,乗算結果の桁数は入力となる浮動小数点数の桁数と同じで良い.本論文ではこの事実を利用し,浮動小数点数の乗算において,FFTに基づく従来の乗算アルゴリズムより高速である分割計算法を提案する.

 またFFTに基づく任意精度の乗算においては,FFTのデータ点数Nは必ずしも2mであるとは限らない.したがって,本論文では分散メモリ型並列計算機における,高性能な2,3,5基底並列一次元FFTアルゴリズムを提案する.そして,分散メモリ型並列計算機における2p3q5r点並列一次元FFTの性能評価について述べる.

 次に,実数FFTに基づく乗算アルゴリズムの並列実装を示す.さらに本論文では,多倍長加算,減算,乗算におけるキャリーおよびボローの伝搬の並列化手法を提案する.また,Newton法に基づく多倍長除算および平方根の分散メモリ型並列計算機上の実装においては,ロードバランスとプロセッサ間通信量の間にトレードオフが存在する.このトレードオフを解決するために,多倍長除算および平方根の計算における,効果的なデータ分散アルゴリズムを示す.多倍長数を単精度整数で割る除算は,多倍長数を多倍長数で割る除算に比べてはるかに高速であることが知られている.本論文では,この多倍長数を単精度整数で割る並列多倍長除算アルゴリズムを提案する.

 さらに,円周率を求める際に使われるガウス-ルジャンドルの公式およびボールウェインの4次の収束の公式を改良する手法を提案する.改良したガウス-ルジャンドルの公式は従来のガウス-ルジャンドルの公式に比べて最大で1.08倍高速であり,改良したボールウェインの4次の収束の公式は従来のボールウェインの4次の収束の公式に比べて最大で1.78倍高速である.

 最後に,本論文では分散メモリ型並列計算機HITACHI SR2201(1024PE)で1374億桁以上のおよび515億桁以上のを計算するアルゴリズムとその計算結果について示す.これらの結果から,本論文で示す並列多倍長計算アルゴリズムが高精度の数学定数を計算するのに非常に有用であることが示された.

審査要旨

 本論文は10の章から構成される。第1章は、この研究の重要性と目的について述べ、従来のシステムと関連研究に対して分析を行なった。第2章は、多倍長計算のアルゴリズムについてこれまでの成果を総括した。第3章では、分散メモリ上の、基数2、3、5のFFTの実装について分析した。第4章は、これを用いた多倍長加減乗算について述べた第5章は、多倍長数の32ビット整数による除算について述べた。第6章は、多倍長数同志の除算および開平について述べた。第7章は、分散メモリ上でのの1374億桁計算について述べた。第8章は、円周率の計算の改良について述べた。第9章は、円周率の515億桁計算について述べた。第10章は、この研究の特徴をまとめ、将来の課題と可能な応用領域について述べた。

 本論文では、分散メモリ型並列計算機により多倍長加算、減算、乗算、除算および平方根の計算について分析し、効率の良い並列アルゴリズムを提案した。

 高速Fourier変換(FFT)に基づく多倍長乗算アルゴリズムにより、n桁同士の乗算はO(n log n log log n)の演算量で行えることが知られていたが、FFTに基づく従来の乗算アルゴリズムは2つのn桁の数を掛けて2n桁の結果を得るものであった。ところが、多倍長浮動小数点数の乗算においては、乗算結果の桁数は入力となる浮動小数点数の桁数と同じで良い。本論文ではこの事実を利用し、浮動小数点数の乗算において、FFTに基づく従来の乗算アルゴリズムより高速である分割計算法を提案するものである。

 またFFTに基づく任意精度の乗算においては、FFTのデータ点数Nは必ずしも2mであるとは限らない。したがって、本論文では分散メモリ型並列計算機における、高性能な2、3、5基底並列一次元FFTアルゴリズムを提案した。そして、分散メモリ型並列計算機における2p3q5r点並列一次元FFTの性能評価について述べた。

 次に、実数FFTに基づく乗算アルゴリズムの並列実装を示し、さらに、多倍長加算、減算、乗算におけるキャリーおよびボローの伝搬の並列化手法を提案した。また、Newton法に基づく多倍長除算および平方根の分散メモリ型並列計算機上の実装においては、ロードバランスとプロセッサ間通信量の間にトレードオフが存在するが、このトレードオフを解決するために、多倍長除算および平方根の計算における、効果的なデータ分散アルゴリズムを考案した。多倍長数を単精度整数で割る除算は、多倍長数を多倍長数で割る除算に比べてはるかに高速であることが知られているが、本論文では、この多倍長数を単精度整数で割る並列多倍長除算アルゴリズムを提案した。

 さらに、円周率を求める際に使われるガウス-ルジャンドルの公式およびボールウェインの4次の収束の公式を改良する手法を提案した。本論文で改良したガウス-ルジャンドルの公式は従来のガウス-ルジャンドルの公式に比べて最大で1.08倍高速であり、改良したボールウェインの4次の収束の公式は従来のボールウェインの4次の収束の公式に比べて最大で1.78倍高速である。

 最後に、本論文では分散メモリ型並列計算機HITACHI SR2201(1024PE)で1374億桁以上のおよび515億桁以上のを計算するアルゴリズムとその計算結果について示した。これらの結果から、本論文で示す並列多倍長計算アルゴリズムが高精度の数学定数を計算するのに非常に有用であることが示された。

 なお、第3、8、9章は、金田康正との共同研究であるが、論文提出者が主体となって提案、設計、実装、分析を行ったもので、論文提出者の寄与が充分であると判断する。

 したがって、博士(理学)を授与できると認める。

UTokyo Repositoryリンク http://hdl.handle.net/2261/50707