学位論文要旨



No 112650
著者(漢字) 茂木,和彦
著者(英字)
著者(カナ) モギ,カズヒコ
標題(和) 参照局所性を利用したディスクアレイの高性能化手法に関する研究
標題(洋)
報告番号 112650
報告番号 甲12650
学位授与日 1997.03.28
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第3928号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 喜連川,優
 東京大学 教授 井上,博允
 東京大学 教授 田中,英彦
 東京大学 教授 武市,正人
 東京大学 教授 坂内,正夫
内容要旨

 2次記憶装置の高性能化・高信頼化を目的としRAID(冗長情報を記録するディスクアレイ)の開発が進められている。RAIDの中で、サイズは小さいが多数のアクセス要求があるような負荷に対しては、ミラー(RAID Level1)やRAID5(RAID Level5)が良いと考えられている。性能に関して優れているミラーでは、データのコピーを保持することによる冗長化を行っており、データ容量が少ないという問題点が存在する。RAID5ではパリティを用いた冗長化を行っており、データ書き込み時のパリティ更新ためのオーバヘッドやディスク故障時のデータ復旧作業の影響による性能の低下が問題となっている。

 一般的に各ブロックのアクセス頻度には偏りがあり、頻度が高いもの(ホットブロック)と低いもの(コールドブロック)の2つに大別することができる。基本的にホットブロックに対するアクセスが大半を占めるため、ホットブロックに対する性能を向上させる事により、システム全体としての性能を高くすることが可能であると考えられる。従って、アクセス頻度によりブロックを2つのグループに分類し、それぞれで記憶管理方式を最適化する事により、大きな実効記憶容量を持たせながら高性能化を図る事が可能であると考えられる。このような参照局所性を利用するディスクアレイの高性能化手法を検討し、2つの手法を提案した。1つは"Hot block clustering"と名付けた手法であり、もう1つは"Hot mirroring"と名付けた手法である。

 Hot block clusteringはホットブロックを物理的に狭い領域に集め、管理を適切に行うことにより高性能化を図る手法であり、パリティストライプの動的再編成を伴う記憶管理方式を用いたRAID5に対する高性能化手法として提案を行った。

 パリティストライプの動的再編成を伴うRAID5の記憶管理方式として、LFSを基にした記録管理方式や仮想ストライピングによる記憶管理方式を挙げることができる。これらの特徴は、1)空き領域への書き込みの一括化によるコストの削減、2)書き込みのための空き領域作成処理(ガーベジコレクション)の一括実行によるコストの削減、という利点を持っているが、3)性能はガーベジコレクションの効率に多大な影響を受ける、という特徴を有しており、ガーベジコレクションの効率化が1つの課題である。

 Hot block clusteringにおいては、データブロックをアクセス頻度によりホットとコールドの2つのグループに分離することにより高い性能を得ることを考える。各ディスクを物理的に2つの領域へ分割し、ホットブロックを狭い連続した領域に集中させる。これによりアクセスの大半を占めるホットブロックへのアクセスを行うときのシーク時間の短縮化を図る。更に、ガーベジコレクションの効率化のために以下のようなことを考える。ホットブロックは頻繁に更新される傾向が存在する。つまり、ホットブロックをある領域に集中させておくと、そこにダーティブロック(最新のデータは保持していないが、パリティ計算のために利用されているブロック)がその領域に集中して作成される事になる。また、書き込みアクセスの大半がホットブロックに対するものと考えることができる。従って、ガーベジコレクションの実行単位内にホットブロックが無くなるまでガーベジコレクションを実行しないことが望ましい。そこで、記憶領域の分離によるホットブロックの集約とアクセス頻度が高いブロックを記録するホット領域へ空きブロックを多めに配置する事により、このガーベジコレクション高効率化の効果を大きく得ることを試みる。

 ホットブロックとコールドブロックの分離は以下のように行う。書き込みの大半はホットブロックに対して行われると考えられるので、書き込みは全てホット領域に対して行う。このとき、コールドブロックもホット領域に対して書き込まれることになり、適宜それをコールド領域に書き戻す。この書き戻し動作は、ホット領域のガーベジコレクション実行時に行う。書き戻し対象はLRUアルゴリズムを用いて決定する。

 Hot block clusteringの有効性を調べるためにシミュレーションによる性能評価を行った。ディスクアレイの構成は、8台のデータディスクに対して1台のパリティディスクをもつ(8D+P)ものとする。データ領域の利用率は85%とする。一括書き込み/ガーベジコレクションの実行による影響を減らすためにアクセススケジューリングを行う。90%のアクセスが10%のブロックに集中し(90-10アクセスローカリティ)、読み出し、書き込みの割合は双方とも50%である負荷を仮定する。LFSの書き込み/ガーベジコレクションの実行単位は1/2シリンダ、仮想ストライピングを用いた時の書き込み/ガーベジコレクションの実行単位は1シリンダとする。この時の結果を図1に示す。図の横軸はシステムに到着するアクセス要求の単位時間あたりの要求数を表し、図の縦軸は平均読み出しレスポンスタイムを表す。比較のため、図中にRAID5・Floating・Hot block clusteringを用いない場合・ブロックに関する知識を用いてホットブロックとコールドブロックを理想的に分離した場合の性能も示した。Hot block clusteringは、それを用いない場合と比較してより高い性能を示し、理想的に分離された場合より若干悪い性能を示す。このように、Hot block clusteringを用いることにより高い性能を得ることができる。また、分離の際に単純なアルゴリズムを用いた分離を行っても、理想的に分離が行われた場合に比べても若干の性能低下で済む。

 続いて、Hot mirroringについて検討を行った。Hot mirroringは参照局所性を利用したミラーとRAID5の階層構成と適切なデータ配置を用いた負荷分散により高性能化を図る手法である。

図1:Hot block clusteringの性能90-10 access locality,R:W=1:1,8D+P

 ミラーとRAID5を比較した時、RAID5の利点は冗長情報の記録量が少ない点であり、ミラーの利点は動作性能が高い点である。これらの利点をうまく利用するためにミラーとRAID5を組み合わせることを考える。前述のように、ホットブロックへのアクセス性能がディスクアレイの性能の支配的要因となると考えられる。ホットブロックの量は多くはないと考えられるので、これらを性能が高いミラーを用いて記録する。一方のコールドブロックに関しては性能よりも大容量性が重要であると考えられ、これらの記録に関してはパリティによる冗長化を行い冗長情報量の削減を図る。各ディスクをそれぞれ2つの領域に分割する。ミラー化されたホットブロックをある狭い領域に集中して配置することにより平均シーク時間を短縮し、更なる高性能化を図る。このとき、ホットブロックとコールドブロックを分離する必要があるが、この手法はHot block clusteringと同じ方式を用いる。つまり、書き込みはホット領域に対して行い、ホット領域内のコールドブロックを適宜コールド領域に書き移すことのより分離を行う。このコールド領域へ移されるブロックはLRUアルゴリズムを用いて決定する。

図2:Hot mirroringにおけるデータ配置4*(4D+P)

 Hot mirroringのデータ配置法を図2に示す。ミラー領域におけるデータのコピーに対して負荷分散と信頼性を考慮してChained declusteringを用いた配置を行う。RAID5領域においてはディスクを幾つかのグループに分割し、その中でパリティストライプを形成させる。さて、ディスクが故障した時のことを考える。このとき、信頼性と負荷分散の観点から、故障ディスクを含むディスクのグループをできるだけ復旧動作に専念させ、その他のディスクで通常のアクセス要求を処理することが望ましい。そこで、図2のようにミラー領域とRAID5領域では直交したデータ配置を行い、アクセスの大半を占めるホットブロックへのアクセスを故障したディスクを含むグループでできるだけ行わないようにする。

 Hot mirroringの有効性を調べるためにシミュレーションによる性能評価を行った。RAID5領域の構成は5台のデータディスクに対して1台のパリティディスクを持つグループが4つある(4*(5D+P))ものとする。各ディスクの20%をホット領域に割り当てる。高性能化のため、ブロックの記録位置はミラー・RAID5領域の双方で自由に変更可能とする。ディスクアクセスは要求到着順に実行される。90-10アクセスローカリティ、読み出し/書き込み比率が7/3の負荷を用いた時の通常動作時と復旧動作時の性能を図3に示す。図の横軸はシステムに到着するアクセス要求の単位時間あたりの要求数を表し、図の縦軸は90%読み出しレスポンスタイムを表す。比較のためRAID5・Floating・ミラー(同一ディスク、同一台数でデータ容量を削減)の結果も示した。アクセス頻度が高いブロックが狭い領域に集約される事により、Hot mirroringはミラーよりも高い性能を示す。また、RAID5やFloatingで見られるディスク復旧動作時の性能低下は、負荷分散が有効に働くことにより小幅なものに抑えられている。

 更に、Hot mirroringにおいてより現実的な負荷の下での性能を評価するために、TPC-Cベンチマークを基にしたトランザクション処理環境を構築し、処理実行時のディスクアクセスのトレースを採取した。そのトレースデータを用いてシミュレーションにより性能評価を行った。RAID5領域の構成は5台のデータディスクに対して1台のパリティディスクを持つグループが3つある(3*(5D+P))ものとする。このとき、全ディスクの10%をホット領域に割り当てる。管理テーブルサイズを小さくするため、RAID5領域におけるブロック記録位置は固定する。シミュレーション結果を図4に示す。図の横軸はトレースデータに基づく到着シーケンスの加速率を表す。図の縦軸は90%読み出しレスポンスタイムを表す。比較のためRAID5・Floating・ミラー(同ディスク台数でシリンダあたりのトラック数を1.5倍)・ミラー(同一ディスクで台数を1.5倍)の結果も示した。図のように、トラッザクション処理環境下においてもHot mirroringの性能は同ディスク台数を用いるRAID5・Floatingよりも高いものが得られることを確認した。また、適当な参照局所性が存在する時には、同一台数のディスクを用いるミラーよりも高い性能が得られることを確認した。

図3:Hot mirroringの性能90-10 access locality,R:W=7:3,4*(5D+P)図4:Hot mirroringの性能ディスクアクセストレース(スタンダード),3*(5D+P)
審査要旨

 本論文は「参照局所性を利用したディスクアレイの高性能化手法に関する研究」と題し、近年、高性能化が強く望まれている二次記憶システムに関し、アプリケーションプログラムの参照局所性を利用することにより、ディスクアレイの性能を向上させる方式を提案するとともに、詳細なシミュレーションによりその有効性を明らかにしたものであり、8章から構成される。

 第1章は「序論」であり、本研究の背景と目的について述べている。

 第2章は「ディスクアレイの高性能化手法」と題し、ディスクアレイにおける従来の高性能化手法について概説すると共に、一層の性能の向上を達成するには参照局所性を利用すべきであると本研究の立場を明らかにしている。

 第3章は「Hot block clustering:パリティストライプの動的再編成を伴う記憶管理方式における参照局所性の利用法」と題し、パリティストライプを動的に再編する方式として仮想ストライピングと名付けた方式を提案すると共に、高頻度参照ブロックのクラスタ化による性能向上化手法として、Hot block clusteringなる手法を提案している。高頻度参照ブロックのクラスタ化はアクセス時のシーク時間の削減、ならびに、ガーベジコレクション処理の効率化に有効である。

 第4章は「Hot block clusteringのシミュレーションによる性能評価」と題し、詳細なシミュレーションによりHot block clusteringの手法の有効性を明らかにしている。参照局所性の度合、ホットブロック領域とコールドブロック領域のデータ容量比率、ホットブロック用空き領域とコールドブロック用空き領域の容量比率等を変化させながら、Hot block clusteringを用いた場合と用いない場合の性能を比較し、参照局所性を適切に利用することにより大幅な性能の向上が達成されることを明らかにしている。また、ホットブロックが時間的に変化する場合についても評価している。

 第5章は「Hot mirroring:ミラーとRAID5の階層構成を利用した参照局所性の利用法」と題し、性能は高いが記憶効率が低いミラーと記憶効率は高いが性能の低いRAID5を融合し、両者の利点を備えたHot mirroringなる方式を提案している。すなわち、高頻度参照ブロックをミラー領域に、低頻度参照ブロックをRAID5領域に格納し、アクセス頻度に応じて両領域間を動的に移動させる方式について解説している。また、ミラー領域のミラーペアとRAID5領域のストライプを互いに直交させることにより、ディスク障害時の性能を改善することが可能であることを示している。

 第6章は「Hot mirroringのシミュレーションによる性能評価」と題し、二つの領域間のブロック移動の実装方式、ならびに、ディスク復旧動作の実装方式について説明するとともに、通常動作時、ならびに復旧動作時におけるHot mirroring手法の有効性を詳細なシミュレーションにより明らかにしている。ミラーとRAID5間の直交配置の有効性についても、特に短時間復旧動作時に効果が大きいことを明らかにしている。

 第7章は「トランザクション処理によるディスクアクセスのトレースを用いたHot mirroringの性能評価」と題し、データベースベンチマークとして業界標準であるTPC-Cベンチマークに準じた処理を商用ミドルウェア上で走行させディスクアクセスのトレースを採取することにより、代表的な実アプリケーションに対するHot mirroringの有効性について検討している。データベース容量、DBMSバッファ容量、チェックポイントの有無等を変化させ、種々の環境でのアクセストレースを用い詳細な評価を行うことにより、従来のRAID5と比べ、本方式は参照局所性を利用することにより大きく性能を改善することが可能であることを示している。

 第8章は「結論」と題し、本研究の成果が要約されている。

 以上、これを要するに、本論文はディスクアクセスの参照局所性を利用した新しいディスクアレイの記憶管理方式を提案し、シミュレーション、ならびに標準的なベンチマークから取得したアクセストレースを用いることにより詳細な評価を行い、従来のディスクアレイに比べ大幅な性能向上が達成可能であることを明らかにしたもので、情報工学上貢献するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク