学位論文要旨



No 215916
著者(漢字) 浜村,博史
著者(英字)
著者(カナ) ハマムラ,ヒロフミ
標題(和) 論理シミュレーション専用ハードウェアの高速化アーキテクチャとその実現方式に関する研究
標題(洋)
報告番号 215916
報告番号 乙15916
学位授与日 2004.02.27
学位種別 論文博士
学位種類 博士(情報理工学)
学位記番号 第15916号
研究科
専攻
論文審査委員 主査: 東京大学 教授 坂井,修一
 東京大学 教授 柴田,直
 東京大学 教授 平木,敬
 東京大学 教授 喜連川,優
 東京大学 教授 藤田,昌宏
内容要旨 要旨を表示する

近年CMOSLSI技術の急速な進歩にともない,デジタルシステム機器の高性能化と高機能化が1990年代に入り急速に進展した.システム全体の回路の殆どがLSIに集約され,また製品開発期間の短縮が加速化している今日,いかに早期に高品質な設計を実現して市場投入するかが,新製品開発における最重要課題となっている.しかしその一方で,LSI集積技術の飛躍的な進歩による回路の大規模化と複雑化に伴い,ハードウエアシステムの論理検証は年々難しさを増している.このような背景から,大規模化するデジタル回路の論理検証を高速に行う手段の一つとして,論理シミュレーション専用ハードウエアの高性能化が求められている.

シミュレーション専用ハードウエアは,1980年代の初頭以来,数多くの研究開発が行われて来た.しかし,これらの研究の多くは,扱う遅延モデルや,回路動作の評価単位あるいは評価レベルの問題によって性能向上率に限界があった.本研究では,システムレベルの大規模論理回路の高速論理検証を目的に,2種類の専用ハードウエアについて上記の性能限界を打破する新しい高速化方式を提案し,その有効性を検証する.一つは,クロック系回路を含む回路全体の動作検証を目的に,2種遅延モデル方式によるタイミング込みの高速論理シミュレーションとシステム分割方式によるシミュレーションの高スループット化を実現するイベント方式専用ハードウエアSP2(Simulation Processor-2)のアーキテクチャと実現方式を提案する.もう一つは,同期回路におけるシステム論理系回路部分の高速論理検証を目的として,ブロックレベル評価方式による高速処理化と分岐を含む複合命令方式によるシミュレーション対象回路の大規模化を実現するレベルソート&コンパイル法に基づくサイクルベース方式専用ハードウエアSAHARA(Simulation Acceleration Hardware Architecture) のアーキテクチャとその実現方式について提案する.

イベント方式専用ハードウエアSP2は,1000万ゲート級の大規模論理回路の高速シミュレーションを対象に,第1世代の単位遅延モデルベースのイベント方式ハードウエアSP1 [12]の実用において問題となったシミュレーションモデル生成の過程で生じるレーシングや発振などのタイミングエラーの除去と,シミュレーションスループットの向上を目標に開発されたマルチプロセッサ方式の専用ハードウエアである.SP2の第1の特徴は,従来の単位遅延にゼロ遅延モデルを加えた2種遅延モデルによるシミュレーション手法で,単一遅延モデルによる高速性を維持しながら,専用ハードウエアの基本回路へのマッピング処理のためのタイミング調整の容易化を実現し,モデル生成時間を従来のSP1システムに対して約1/10以下に短縮可能とした.また,第2の特徴は,ハードウエアシステムの論理的分割方式による複数シミュレーションの同時実行機能である.シミュレーションジョブの状況に応じて柔軟にシステム分割を行うことで,従来のシステム独占方式のSP1に対して,最大4倍のシミュレーションスループットの向上が実現された.本システム分割方式は,SP2以降の専用ハードウエアで多く採用されている.SP2システムは, 1.0μmの8000ゲートBiCMOSゲートアレイLSIを用いた最大256台の専用プロセッサからなるマルチプロセッサシステムで,最大1600万ゲートのシミュレーションが可能である.SP2は,1992年に開発されて以来,現在に至るまでに3システム(768プロセッサ)が製作され,メインフレーム,スーパンコンピュータ及びUNIXサーバなどの多くの大規模ハードウエアシステムの開発に長く適用されている.また,SP2は,最新の0.13μm CMOS LSIテクノロジを用いることによってシステム性能を約数倍向上することが可能である.SP2のようなイベント方式の専用ハードウエアは,最近著しく性能向上が進む汎用並列システムに対して性能及びコストパフォーマンスで圧倒的な優位性が得づらくなる傾向にあるが,絶対性能が必要とされる論理検証や,最近の低消費電力設計や高性能設計によって複雑化する大規模回路におけるクロック系回路の動作検証に今日でも有効である. 図-1に128プロセッサ構成のSP2ハードウエアの外観を示す.

サイクルベース方式専用ハードウエアSAHARAは,数1000万ゲート級の同期回路のシステム論理系回路を高速に論理検証するために研究されたレベルソート&コンパイル法に基づく超並列プロセッサベースの専用ハードウエアである.SAHARAは,過去のサイクルベース方式専用ハードウエア[7][8][35] [39]に対して大幅な性能向上を実現するために,新しい高速化技術としてブロックレベルでの評価処理方式と,分岐を含む複合命令による制御方式及び多段プロセッサ結合型の通信ネットワークを採用した.第1の特徴であるブロックレベル評価方式は,複数ゲートを一つの演算単位としてブロック化することでレベルソート&コンパイル法アルゴリズムにおける評価処理数を低減して性能向上を実現する.第2の特徴である分岐を含む複合命令セットと各プロセッサに配置したローカルプログラムカウンタによるサイクル同期の制御方式は,1評価ブロック当たりの制御メモリの消費量を低減することによって,シミュレーション規模の大規模化を実現する.第3の特徴である多段プロセッサ結合による通信ネットワークと専用通信方式は,プロトコルの単純性とデータ転送手順のプログラム化によって多パラレル伝送を可能とすることで,プロセッサ間のデータ転送の高速化を実現する.

SAHARAは,最大88064台の専用プロセッサからなる超並列システムで,最大約6720万ゲートのシミュレーションが可能である.SAHARAは,0.18μm CMOS LSIを用いることによって,ゲートレベル評価方式による市販のサイクルベース型専用ハードウエアCoBALTplusに対して約5倍以上の高速化が見込まれる.また,SAHARAは性能向上が著しい汎用並列システムに対して,性能及びコストパフォーマンスにおいて共に100倍以上の優位性が見込まれる.尚,本SAHARAシステムは,実装設計及びタイミング設計を含めた詳細設計と性能シミュレーションまで行ったが,実際のハードウエアは製作していない.

近年,半導体集積技術の飛躍的な進歩によって,LSI及びシステムに実装する回路は飛躍的に増大した.その結果,設計の論理検証作業の長期化が顕在化している.また一方では,LSIマスクコストの高騰や製品開発期間の短期化による圧力によって,論理検証作業が一段と難しくなっている.最近の高性能サーバを始めとする大規模論理回路の例では,回路規模が数1000万ゲートにも達し,その動作検証のために延べ1兆クロック以上の論理シミュレーションが必要となっている.配線遅延時間が支配的になっている今日のLSIテクノロジを用いた設計では,論理検証とタイミング検証を分離した検証手法が一般的である.そのようなことから,汎用並列システムと同様のパケット通信方式が必要となるイベント方式の専用ハードウエアの場合は性能向上率に限界があるため,今後高性能化が更に進む汎用機に対して圧倒的な優位性が得ずらくなって行くと推測される.一方,SAHARAタイプのサイクルベース方式の専用ハードウエアは,独自の通信方式を柔軟に工夫できる可能性があるため,パケット通信による汎用機に対してシステム性能で圧倒的な優位性を発揮し易いと考えられる.一般的に,性能向上の頻度が高い汎用機に対して,専用ハードウエアは開発コストと相対的な性能の経年低下率が高いと言う問題がある.しかしその反面,サイクルベース方式の専用ハードウエアの場合は,汎用機に対して性能及びコストパフォーマンス共に100倍以上の優位性が見込まれると伴に,その圧倒的な処理速度によって汎用機では実効的に不可能な領域の論理検証を可能にすると言う点で,今後の大規模化する論理回路の検証に極めて有効な技術と考えられる.

尚,本論文は,十数年間に亘って,筆者が設計から製作に至る開発全般の意志決定を行った論理シミュレーション専用ハードウエアの開発プロジェクトにおける2機種の専用ハードウエアSP2とSAHARAについてその研究開発の成果を纏めたものである.

128プロセッサ構成のSP2ハードウエアの外観

審査要旨 要旨を表示する

本論文は、「論理シミュレーション専用ハードウェアの高速化アーキテクチャとその実現方式に関する研究」と題し、8章から成る。現在の情報処理ハードウェアの中心はCMOS LSIであるが、その開発にあたっては、LSI高集積化に追随する論理シミュレーションシステムの高速化技術が重要となる。本論文では専用ハードウェアによってこれを実現する手法を提案し、実装、評価したものである。

第1章「序論」は、研究の背景、目的を述べるとともに、本論文の構成についてまとめている。

第2章「論理検証技術の動向と本研究の位置付け」では、論理検証技術の研究動向と各検証手法の特徴を分析し、本論文のテーマである大規模論理回路の動作検証の高速化に適したやりかたを検討している。その結果、ここではマルチプロセッサ方式のシミュレーション専用ハードウェアを開発することとした。

第3章「シミュレーション基本アルゴリズム」は、論理シミュレーションの基本アルゴリズムの動作原理と特徴について検討し、また、各シミュレーションアルゴリズムと組み合わせ可能な遅延モデルとの関係を示す。シミュレーション手法としては、イベント法、レベルソート&コンパイル法、レベルソート&イベント法の3種類を対象としている。

第4章「シミュレーション専用ハードウェアの分析と高速化方式の検討」では、大規模回路の論理シミュレーションの扱うべき問題を検討し、論理シミュレーション専用ハードウェアに関する過去の研究の特徴と問題点を分析し、イベント方式とサイクルベース方式の2タイプの専用ハードウェアに関して新しい高速化方式を検討する。前者は回路全体のタイミング込みの論理シミュレーションを対象とするハードウェアであり、後者はシステム論理系回路の論理シミュレーションを対象とするハードウェアである。

第5章「イベント方式シミュレーション専用ハードウェアSP2」では、第4章の提案方式に基づくイベント方式ハードウェアの高速化手法とそれを実現するアーキテクチャおよび実装方式を提案する。そして、提案アーキテクチャに基づくハードウェアSP2を開発し、実際の適用結果に基づく性能評価及び既存手法との比較分析を行い、提案方式の有効性を検証する。SP2システムは、最大256個の専用プロセッサからなるマルチプロセッサシステムで、最大1600万ゲートのシミュレーションが可能であり、従来機に対して10倍の性能向上を得た。また、本方式は個人用汎用コンピュータが高性能化した現在においても有用であることが示された。

第6章「サイクルレベル方式シミュレーション専用ハードウェアSAHARAでは、レベルソート&コンパイル法に基づくサイクルベース方式ハードウェアのアーキテクチャと、専用ハードウェアSAHARAの実現方式に関して述べる。SAHARAは詳細設計・シミュレーション評価によって、他の専用機の約5倍以上、汎用並列コンピュータの100倍以上の性能が得られることが示された。

第7章「総合評価」では、最新のCMOS LSIテクノロジによってSP2を実装したことを想定して、性能評価を行い、汎用並列システムとの性能及びコストパフォーマンスの比較分析を行う。また、SAHARAと現在のスーパコンピュータ、PCクラスタ、GRIDなどとの比較検討を行い、これらに対する優位性を検証する。

第8章は、本論文の結論を述べるとともに、論理シミュレーション技術の将来について知見を示す。

以上、これを要するに本論文は、高集積化の進むコンピュータシステムを構築するための2種類の論理シミュレーション専用ハードウェアについて、その処理方式と構成法を提案し、実装・性能評価を行って有用性を示し、さらには現在の技術を用いた実現について検討を行っており、電子情報学の発展に寄与するところが少なくない。

よって本論文は博士(情報理工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク