学位論文要旨



No 217442
著者(漢字) 加藤,心
著者(英字)
著者(カナ) カトウ,ココロ
標題(和) 大規模半導体マスクデータのルールチェック高速化に関する研究
標題(洋)
報告番号 217442
報告番号 乙17442
学位授与日 2011.01.20
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第17442号
研究科
専攻
論文審査委員 主査: 東京大学 教授 石原,直
 東京大学 教授 鈴木,雄二
 東京大学 教授 高木,周
 東京大学 准教授 池田,誠
 北九州市立大学 准教授 中武,繁寿
内容要旨 要旨を表示する

1.はじめに

半導体回路の高集積度化を支える微細加工技術において、光リソグラフィで用いられる光源波長よりもはるかに細かな精度でパターンを転写する必要があり、そのための技術として超解像技術(Resolution Enhancement Technologies: RET)が用いられている。そのRETの中でもフォトマスクパターンに大きな影響をもたらすものが光近接効果補正(Optical Proximity Correction: OPC)技術である。このOPC技術の進行に伴い、半導体回路を記述するフォトマスクデータの複雑度が増大している。マスクデータは通常製造前にマスクルールチェック(Mask Rule Check: MRC)と呼ばれる検証工程を経るが、マスクデータ複雑度の増大によるデータボリュームの爆発的な増加に対して有効な検証手段が提案されておらず、MRC工程の処理時間増大が問題となっている。そこで、本論文では分散並列技術を基盤として、その上で大規模マスクデータの高速検証システムを構築することを研究対象とする。本論文では、一貫して高速化に対する手法を研究対象としており、高速化のための分散アーキテクチャの設計開発と分散スケジューリングの最適化について論じたものである。

2.MRC分散並列システム設計目標

大規模なデータ処理問題を解く手段として、分散並列処理方式の有効性は昔から論じられており、マスクデータ処理の分野でもLinuxプラットホーム上で広く適用されている。一般的な分散並列処理手法では、マスタープロセスが問題分割を担当し(逐次処理)、n台のスレーブプロセスが分割された問題を解く(並列処理)。分散並列処理の性能を表す指標としてスケーラビリティがあるが、そのスケーラビリティの特性を表すものとしてアムダールの法則が知られている。アムダールの法則によれば、並列処理プログラムの実行時間RuntimeはTを1プロセッサでの処理時間、sを逐次処理部分の割合、nをプロセッサ数とすると

で表される。これをプロットしたのが図1である。ここから分かるように、逐次処理部分割合sを小さくすることが分散並列処理のスケーラビリティを確保する上で重要な要素となる。

そこで一般的な分散並列処理手法(マスター分割法)でマスクデータ検証実験を行った。結果として、マスクデータは非常にデータボリュームが大きい反面、MRC処理に求められる図形演算処理は単純であることから、分割処理時間が支配的となり、逐次処理割合sが84%から11%と高い割合を占めることが分かった。そこで、逐次処理割合sを低く抑える手法が必要であることが示された。

3.SAMS型分散並列処理システムの提案

MRC処理の問題の本質はマスクデータマスクデータの分割処理にあり、システム設計上で最も留意すべき部分は逐次処理であるデータ分割処理をいかにして短縮するかであると示された。そこで本研究では新しい試みとして分散スレーブプロセスが同時に入力ファイルにアクセスするというSAMS(Simultaneous Access by Multiple Slaves)方式を提案し、高速度MRCシステムの構築を目指す(図2)。

分散並列システムを構成する要素についてモデリングを行った結果、SAMS型分散並列システムを構築する上で次の4つの問題点が予見される。すなわち(1)巨大ファイルアクセスの問題(2)分割境界の問題(3)巨大セルでの冗長アクセスの問題(4)冗長データ存在の問題である。そしてその4つの問題のうち、ファイルアクセスに関する3つの問題(問題1,3,4)を解決するために、中間ファイルを設定する。具体的には入力データの必要な部分のみを圧縮したキャッシュファイルと、セル存在アドレスを記述したインデックスファイルを導入し、逐次処理部分割合を減らしつつスレーブプロセスから効率的にアクセスするためのシステム設計を行った。SAMSシステムにおける処理フローを図3に示す。入力ファイル圧縮の手段としてOASISフォーマットを採用し、OASISフォーマットの特性を解析して圧縮アルゴリズムを提案した。具体的には、フレキシブル整数表現、RECTANGLEレコード、モーダル表現、Repetition表現およびポイントリストのデルタ表現と呼ばれるデータ圧縮技術について、個々の要素に関する個別アルゴリズムと、全体処理フローアルゴリズムを導出した。さらに圧縮ファイルの内部構造について、ファイルアクセス効率化の観点から巨大セルの分割と、セルおよび図形レコードの配置座標によるソートを行い、スレーブプロセスからのランダムアクセスを極力排除する手法を採った。また同時に分散並列システムの基本要素であるマスタースレーブ間の制御方法について、過去の研究を引用しながらマスクデータの特性を考慮してスケジューリング手続きとしてワークプール法を採用し、問題の分割方法として正方分割を採用することを決定した。

スレーブプロセスの高速化の観点からは、マルチスレッド手法の採用によるファイルアクセス時間の隠蔽について論じた。そしてDRC処理で一般的な図形ベースの処理について問題点を明らかにし、エッジベースのデータモデルの導入を提案して、基礎実験を行いエッジベースのデータモデルの有効性を明らかにした。

4.分割境界問題の解決

SAMS型分割並列システムの実現について予見される4つの問題のうち、残る一つの問題、つまりスレーブプロセスにおける分割境界の問題に関する解を示す。まず高速な分散並列システムを構築するにはスレーブ間の干渉を排除する必要性を示し、分割境界部分にマージン領域を設ける手法を採用することを決定し、分割方式として正方分割法を選択した。

一般にマージン領域は処理速度に影響を与えるため、可能な限り小さいことが望ましいとされる。そこで本論文ではマスクチェックのルール値とサイジング量から最小マージン領域サイズの理論値を求めるための手法を構築した。マージン領域とエラールール、サイジング値に関する考察から、一般的にMRC処理に必要なマージン量Mはルールの最大値をMaxRuleValue、サイジング量をSizingValueとすると、

と導き出される。そして個々のルールに対して必要なマージン量を算出した。例えば、図4に示すように、図形の幅方向と高さ方向について、「(幅≦w、長さ≧h)のエラー図形を検出」というルールを用いる場合、必要なマージン量Mwidthは以下の式で表される。

5.SAMS型分散並列システムの検証

本論文で提案されたSAMS型分散並列MRC処理システムについて、実データを用いた実験において速度とスケーラビリティを検証した。6つの実データに対してn=12の条件で実験を行い、従来のマスター分割方式に対してSAMS型方式が6倍から50倍高速であることが示された(図5)。また逐次処理割合sは0.1%から2.3%に抑えることができた。図6にプロセッサ数と速度向上比のグラフを示す。そして、1テラバイトファイルをn=100で処理する際の推定時間として176分という値が得られ、「100分散で10時間以内」という目標値を達成した。実験で得られたその他の知見を以下に記す。

・ SAMS型システムの処理時間はデータ規模に比例する。

・ 分割数がスレーブ数に対して十分大きくない場合に、粒度の問題が発生しスケーラビリティが悪化しうる。

・ 分割境界マージンサイズの最適化は特にデータ複雑度が高い場合に有効である。

SAMS型システムの狙いは、スレーブが分割処理を効率的に行えるために良質な中間ファイルを作成しつつ、逐次処理である中間ファイル生成を簡素化し高速性を確保するというものであるが、本実験によりこれらの目標が達成されたことが示された。

6.マルチジョブ処理時の先行キャッシュファイル作成スケジューリングの提案

本論文ではここまで一つのマスクデータについて分散並列処理を用いることで高速に検証する手法を論じてきた。ここで観点を変えて、連続する複数のマスクデータ検証ジョブを全体として高速化する技法について提案する。まずSAMS型分散システムの特徴を観察し、次のジョブのキャッシュファイルを先行して作成するというPCG (Preceding Cache Generation)手法を提案した(図7)。そしてPCGを用いた時の理論的なスケーラビリティを求め、最大有効分散数Nmaxが逐次処理割合sから以下のように算出されることを導いた。

図8にPCGを用いた際の理論速度向上度グラフを示す(s=0.1を想定)。

そして最大サイズのデータに対して実験を行い、PCG手法により逐次処理割合sが2.3%から0.3%へと改善されることが示された。これにより、1テラバイトファイルに対してn=43で処理する際の推定時間として132分という値が見込まれる。

7.最後に

マスクデータの複雑化およびファイルサイズ増大は今後も続くと思われ、本論文で示されたSAMS型分散並列MRCシステムの発展、応用の必要性は高くなるはずである。今後の展望としては、DFM(Design for Manufacturing)技術の適用によるMRC効率化、EDA分野への応用、そしてHPC(High Performance Computing)やGPU(Graphic Processor Unit)という最新コンピューティング技術の適用などが挙げられる。

図1 アムダールの法則(n数と速度向上比)

図2 マスター分割とSAMS型分散処理方式

図3 SAMS型分散処理フロー

図4 幅チェック時のマージン量

図5 マスター分割方式とSAMSの処理時間比較

図6 SAMSにおけるプロセッサ数と速度向上比

図7 PCGスケジューリング概要

図8 PCGにおける速度向上比(s=0.1)

審査要旨 要旨を表示する

本論文は「大規模半導体マスクデータのルールチェック高速化に関する研究」と題し,大規模半導体のマスクデータに対するルールチェック検証処理の高速化を実現するため,分散並列システム手法,分割境界の問題解決手法およびジョブスケジューリングの最適化について提案し,実験的に提案手法の有効性を実証したものである.

第1章「序論」では,半導体の微細化と光近接効果補正(Optical Proximity Correction: OPC)技術の進行に伴うマスクデータボリュームの爆発的な増大が,マスクルールチェック(Mask Rule Check: MRC)処理時間の大幅な増大という問題を引き起こしているという背景から,その問題解決を目指す本研究の目的および意義について述べている.

第2章「マスクルールチェック(MRC)概要」では,マスクルールチェック処理について,近年のOPC導入によるマスクデータの特性変化を詳細に分析し,MRCマスクデータ検証処理高速化の技術開発の必要性について述べている.

第3章「MRC分散並列システム設計目標」では,大規模な計算処理の高速化手法として並列処理を挙げ,その中で本研究においては分散並列処理方式を採用すること提案している.並列処理時に重要とされるスケーラビリティについて分析し,分散並列処理システム構築に必要とされる技術的要件について考察している.一般的な分散並列方式を用いたMRC処理の予備実験の結果分析から,MRC処理の特殊性は初期分割処理負荷の高さであることを指摘し,初期分割処理の高速化を狙った分散並列システムを提案している.

第4章「SAMS型分散並列システムの提案」では,マスクルール検証処理の特徴を踏まえ,スレーブプロセスが入力データを直接に同時アクセスするSAMS(Simultaneous Access by Multiple Slaves)型分散並列処理システムを提案している.ここでは,中間ファイルを用いる巨大ファイルアクセス問題の解決策,OASISフォーマット図形ファイルの圧縮アルゴリズム,マスタープロセスにおける分散処理の制御方法,スレーブプロセスにおけるマルチスレッドI/O高速化手法,エッジベースデータモデルによる図形演算法など,各計算機処理の高速化手法を提案し,それらの有効性を論じている.

第5章「分割境界問題の解決」では,分散並列処理におけるマスクデータ分割方法について解析し,正方分割方式による分割メッシュ処理アルゴリズムを提示している.メッシュ間のマージンサイズが理論的に導き出されることを示し,個別のMRCルールおよびサイジング値を元にSAMS型分散並列システムにおける最適マージンサイズ理論式を導出している.

第6章「SAMS型分散並列システムの検証」では,前章までに提案したSAMS型分散並列処理システムの効率について実験検証を試み,本システムは従来のマスター分割法に対して高いスケーラビリティと最大50倍程度の高速化を達成できることを検証している.

第7章「マルチジョブ処理時の先行キャッシュファイル作成スケジューリングの提案」では,SAMS型分散並列処理システムに対するスケジュールの最適化手法として先行キャッシュ生成(Preceding Cache Generation)を提案し,その理論スケーラビリティ値を算出している.そしてその効果を検証するための実験を行い,PCG手法によりSAMSシステムのスケーラビリティが大きく改善し,名目上,逐次処理割合s=0.3%という良好な値を達成している.

第8章「総合的考察と今後の展望」では,本論文で提案したSAMS型分散並列MRCシステムに関する考察として,その達成度と残された課題について論じ,さらに今後の方向として,デザイン情報とのリンクによるマスク検証効率化,メッシュ境界を越える大局的図形処理,システムコンフィグレーション技術の適用,およびグラフィックプロセッサユニット(GPU)の採用という4つの技術展開を展望している.

第9章「結論」は,本論文で得られた結果の総括である.

以上のように本論文は,SAMS型分散並列によるデータ処理方式により大規模半導体マスクデータのルールチェックの大幅な高速化を達成するとともに,分散並列処理方式プログラムの高速化手法として広く一般に適用が可能であることを示しており,大規模半導体データ処理における共通基盤技術として半導体設計・製造工学の分野に大きな貢献があると考えられる.

よって本論文は,博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク