No | 124374 | |
著者(漢字) | マディーナ,ジュレイド | |
著者(英字) | ||
著者(カナ) | マディーナ,ジュレイド | |
標題(和) | プロセッサ能力制約的なモデルのための計算機アーキテクチャ | |
標題(洋) | Computer Architecture for Compute-Limited Scientific Models | |
報告番号 | 124374 | |
報告番号 | 甲24374 | |
学位授与日 | 2009.03.23 | |
学位種別 | 課程博士 | |
学位種類 | 博士(学術) | |
学位記番号 | 博総合第897号 | |
研究科 | 総合文化研究科 | |
専攻 | 広域科学専攻 | |
論文審査委員 | ||
内容要旨 | 本論文では、プロセッサ能力制約的な科学計算モデルの効率化のための、アーキテクチャ、またはマイクロアーキテクチャに対する斬新な手法を提供する。ここで、プロセッサ能力制約的なモデルとは、メインメモリへのアクセス要求に比して、ALU/FPUに対する基本演算処理量の要求が大きいプログラムを指す。具体的な内容は以下の通りである。 1.レイテンシ/消費電力間の効率的なトレードオフを実現するオンチップネットワーク(NoC)。このNoCでは、必要度に即した電力消費でのオペランドデータ転送により大規模なシステムスケーリングが可能である。その他、ワンホット(一進法)多電圧シグナル方式,メモリリクエストに対する低消費電力サービスのサポート等の斬新な特徴を持つ。 2.協調的シグナリングを利用したクロスバ。これは、今日一般的なナノメータスケールのVISIプロセス向きの、電力?面積の両方の面において効率的なシングルエンドクロスバであり、将来想定される寄生容量の大きなVLSIプロセスに対しても容易に拡張可能なクロスバ設計として初めてのものである。 3.メモリ、データ転送、計算ユニットのコストの三者間のトレードオフを実現する効率的な演算処理手法。不動点演算をジャストインタイム的な形で行うための、狭ビット幅演算ユニットベクトルの動的調節が、複数種の多項式補間手法を用いることで可能となっている。 4.VLSIマクロ間あるいはマクロ内部におけるより効率的なデータ転送を実現する、低電力差動信号(さらにはより一般化された)ワンホット通信システム。これには、キャッシュデータ、タグ、レジスタファイル等のマクロにおいての節電を実現する四線ワンホットマイクロセンスアンプ等が含まれる。 以上の各手法に対し,主要なカーネルに対する詳細なビットレベルの測定を含む複数のベンチマークを用いて検証を行った。また、最後にまとめとして、実装されたプロセッサの性能を示すデータとして、いくつかの例の実行結果を示した事。 | |
審査要旨 | 本論文は、計算制約タイプ(メモリーよりCPU パワーの必要な)の科学計算を行う上で有用な計算機アーキテクチャーを新しく提案し、具体的に設計するものである。 第1 章では、"計算制約タイプのコンピュータモデル(例えば、分子動力学やQCD )を定義し、なぜソフトウェア技術だけでは、これらのモデルのパフォーマンスがあげられないかを説明している。その上で、ハードウェア技術(新しいプロセッサーのデザインなど)の重要性を説き、プロセッサーのエネルギー消費量の問題を指摘している。通常のプロセッサー・コアを大量にひとつのチップに乗せると、非常にエネルギーを消費する。それで新しいプロセッサー設計のアイディアが必要となってくる。こうした研究の背景を説明した上で、本論文の構成と貢献がまとめられている。 第2章では、チップ上のプロセッサー・コア間でデータを効率よく移動するために、ここで新しく3つの提案が行われた。 1) 4個の低速振幅(low swing)リンクの発案。これは、容量結合型のトランスミッターと新しい4つのセンスアンプおよび新しい解析技術からなり、これまでの技術にくらべて約2倍以上エネルギー効率が良い。 2) 容量結合型で、協調シグナル型のクロスバー・デザインをした。これはオンチップ・ワイヤーの密度が高くてアスペクト比も高い場合に、威力を発揮できる初めてのデザインである。 3) 拡張されたマンハッタン型のトポロジーを使った、オンチップのバッファーを介さない"ホットポテト"・ルーティングを用いる。これはパケット通信のレイテンシとエネルギー消費量の間の単純なトレードオフを可能にするもので、他の一般に使われるネットワークトポロジーより遥かに高いパフォーマンスを発揮する。 第3章では、いくつかの分子動力学のコードにおける浮動小数点の特徴を解析する。その結果、主要な計算には、同じように大きな値をとる内積計算が数多く含まれていることが分かった。このような場合には、浮動小数点の内積を計算するプロセッサーを直接作ってしまうのが効果的である。そのために通常の掛け算よりも、より複雑なアルゴリズムが採用されている。それが解説されている。 第4 章では、2、3章で開発された計算制約型の科学モデルのための効率の良いプロセッサーのデザイン全体が示され、分子動力学のシミュレーションにおいて効率が計算されている。 第5章では、今後の方向性と結果について議論し、技術、方法論の詳細がAppendix に記載されている。 以上のように論文提出者の研究は、計算制約型の科学モデルのシミュレーションにおけるハードウェアの開発の重要性を指摘し、新しいチップデザインを具体的に提案するということで、今後計算生物学などの分野において重要な寄与をなすものと考えられる。したがって、本審査会は博士(学術) の学位を与えるのにふさわしいものと認定する。 | |
UTokyo Repositoryリンク |