学位論文要旨



No 121191
著者(漢字) 鈴木,正昭
著者(英字)
著者(カナ) スズキ,マサアキ
標題(和) タンパク質立体構造解析の高速化に関する研究
標題(洋)
報告番号 121191
報告番号 甲21191
学位授与日 2006.03.23
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第6281号
研究科 工学系研究科
専攻 システム量子工学専攻
論文審査委員 主査: 東京大学 教授 奥田,洋司
 東京大学 教授 越塚,誠一
 東京大学 教授 高橋,浩之
 東京大学 助教授 陳,迎
 東京大学 助教授 佐藤,文俊
内容要旨 要旨を表示する

タンパク質は20種類のアミノ酸がペプチド結合によって鎖状に連結した高分子であり,生理環境下に置かれるとある特定の三次元構造に折り畳まれる.タンパク質分子の生化学的機能はその三次元構造と密接に関係しているためタンパク質立体構造解析はポストゲノムの重要な研究課題であるが,近年の遺伝子解析により存在が明らかにされたタンパク質のほとんどはそのアミノ酸配列が知られているのみで,立体構造は依然未知である.現在最も広く用いられている構造解析手法はX線回折結晶解析およびNMR解析であるが,それぞれタンパク質の結晶化および大量精製,精度等に問題を残しており万能ではない.

現在も続くコンピュータの著しい発展は,タンパク質の折り畳みシミュレーションによる立体構造予測を可能にし始めている.立体構造予測シミュレーション手法には,既知タンパク質の構造情報を利用する知識的手法と,アミノ酸配列の情報のみをもちいる非知識的手法とがあるが,類縁タンパク質をデータベースにもたない新規タンパク質の構造予測には非知識的手法が必要である.非知識的手法では,「タンパク質の天然立体構造はアミノ酸配列より一意に決定され,その構造は系の自由エネルギ最小状態に対応する」というAnfinsenらの主張に基づいて,主にモンテカルロ法,分子動力学法,遺伝的アルゴリズムを用いた最適化計算により天然立体構造探索が行われる.

タンパク質系は多自由度系であり膨大な準安定状態(自由エネルギ極小状態)が存在する.そのため,構造探索プロセスにおけるエネルギ極小状態へのトラップをいかに回避するかがシミュレーション成功の鍵である.効率的な構造サンプリング手法として,拡張アンサンブル法が近年注目を集めている.マルチカノニカル法やレプリカ交換法に代表される拡張アンサンブル法は,非ボルツマン因子に基づいたシミュレーションによってポテンシャルエネルギ空間上の一次元酔歩を実現し,エネルギ障壁を乗り越える手法である.特にレプリカ交換法は,現在のスーパーコンピュータの主流である分散メモリ型およびSMP (Symmetric MultiProcessor )クラスタ型並列計算機への適用性が高い.

レプリカ交換法では,異なる温度を持つ互いに相互作用しないオリジナルの系のコピー(レプリカ)を複数用意する.それぞれのレプリカについてカノニカルアンサンブルシミュレーションを独立かつ同時に進めながら途中で温度を交換することで,ある一つのレプリカに注目すれば温度が酔歩(エネルギが酔歩)するため準安定状態を抜け出すことができる.レプリカ交換法の問題点としては,系の自由度が大きくなるにつれて多くのレプリカを必要とする点が挙げられる.

以上のような背景のもと,本研究ではアミノ酸配列情報のみを用いた大規模タンパク質立体構造予測を目的として,レプリカ交換分子動力学法によるタンパク質立体構造予測コードを開発し,SMPクラスタ型ベクトル超並列計算機である地球シミュレータ向け最適化,および大規模系における従来のレプリカ交換法の問題点を克服する改良レプリカ交換法の提案を提案する.本論文は五章で構成される.

第一章では研究の背景および目的を述べる.

第二章では,拡張アンサンブル法としてレプリカ交換法を用いた,並列分子動力学計算によるタンパク質立体構造予測について概要を述べる.

第三章では,地球シミュレータ上で高いパフォーマンスを発揮するための最適化について述べる.立方体領域に一様分布した荷電粒子系による性能評価の結果,レプリカ数が512,レプリカあたりの粒子数が約11万のレプリカ交換分子動力学計算において,2,048プロセッサ使用時に約92%の並列化効率を達成した.その際,3.9 TFLOPSの実行性能(理論ピーク性能の約24%)が得られた.4,098プロセッサ使用時の並列化効率は約85%と見積もられ,高い並列性能を持つことを確認した.また,レプリカ数が256,レプリカあたりの原子数が52,143である水中のタンパク質の折り畳みシミュレーションにおいて,2,048プロセッサ使用時に約88%の並列化効率を達成した.4,096プロセッサ使用時の並列化効率は約79%と見積もられ,実問題においても良好な並列性能を持つことを確認した.

第四章では,大規模系においても効率的なレプリカ交換計算を実現させるための,タンパク質のフラグメント分割に基づく改良レプリカ交換法を提案する.レプリカ交換法の問題点の一つに,系が大規模化(系の自由度が増加)するにつれてシミュレーションに必要なレプリカ数も増加する点がある.オリジナルのレプリカ交換法に対して,提案手法は部分構造毎のリファインメントを順次繰り返していき全体構造の最適化を図るものである.シミュレーションに必要なレプリカ数はフラグメントに含まれる自由度数にのみ依存することになり,必要レプリカ数を減らすことができる.提案手法の有効性検討のためのいくつかの数値実験の結果を示した.ポリアラニン(ALA)16を用いて提案した改良レプリカ交換法とオリジナルのレプリカ交換法の比較を行った.(ALA)16は比較的単純な系であるが,250K以下の低温の平衡分布を正しく得ることはそれほど簡単ではない.オリジナルREM,FREMおよび温度一定MDによる計算を実施し,そこから得られた200Kにおける平衡分布を比較した.ここでは,提案手法を用いた場合にオリジナルのレプリカ交換法と比較して1/4あるいは1/8のレプリカ数で正しい平衡分布を得ることに成功した.

第五章では,本研究によって得られた結論を述べる.

審査要旨 要旨を表示する

実験による構造解析と並行して,近年、計算機シミュレーションによるタンパク質構造予測が盛んに試みられている.過去数十年にわたる指数関数的な計算能力の改善をうけて、X線、NMRに続く第三のタンパク質構造決定の方法論としてのコンピュータシミュレーションが期待されている。

本論文は、アミノ酸配列情報のみを用いた大規模タンパク質の立体構造予測に成功するために、レプリカ交換法に基づく構造予測計算の高速化・効率化に関して検討および実証したものである。具体的にはレプリカ交換分子動力学法によるタンパク質立体構造予測コードを開発,SMPクラスタ型ベクトル超並列計算機である地球シミュレータ向け最適化を施し、高い演算性能を実現している。また、大規模系における従来のレプリカ交換法の問題点を克服する改良レプリカ交換法の提案がなされている.

本論文は五つの章から構成され,第一章では研究の背景、従来研究としてタンパク質立体構造解析および計算機実験によるタンパク質立体構造予測について述べられている.

第二章では,まず古典分子動力学法で使用されるポテンシャルと力の計算方法を説明している.古典MDでは原子間に共有結合力と非共有結合力を仮定して計算する.原子数をNとすれば前者の計算量はO(N)だが,後者はO(N2)となりMD計算の律速段階である.そこで,非共有結合力,特にCoulomb力の高速計算アルゴリズムについて述べられている.また,境界条件と溶媒、水分子を陽に扱う際に必要な剛体の分子動力学、系の全体運動の凍結および結果の解析法として主成分分析について概説している.さらに,拡張アンサンブル法の一つであるレプリカ交換法を用いて、いくつかの小さな分子に対する最安定構造計算例が示されている.

第三章では,地球シミュレータ上で高いパフォーマンスを発揮するための最適化について検討している.立方体領域に一様分布した荷電粒子系による性能評価の結果,レプリカ数が512,レプリカあたりの粒子数が約11万のレプリカ交換分子動力学計算において,2,048プロセッサ使用時に約92%の並列化効率を達成している.その際,3.9 TFLOPSの実行性能(理論ピーク性能の約24%)が得られている.4,098プロセッサ使用時の並列化効率は約85%と見積もられ,高い並列性能を持つことを確認している.また,レプリカ数が256,レプリカあたりの原子数が52,143である水中のタンパク質の折り畳みシミュレーションにおいて,2,048プロセッサ使用時に約88%の並列化効率を達成している.4,096プロセッサ使用時の並列化効率は約79%と見積もられ,実問題においても良好な並列性能を持つことが示された.

第四章では,大規模系においても効率的なレプリカ交換計算を実現させるための,タンパク質のフラグメント分割に基づく改良レプリカ交換法の提案がなされた.レプリカ交換法の問題点の一つに,系が大規模化(系の自由度が増加)するにつれてシミュレーションに必要なレプリカ数も増加する点がある.提案した改良レプリカ交換法は、タンパク質のアミノ酸配列における局所的な配列−構造相関の存在を仮定し、利用するものである。従来のレプリカ交換法に対して,提案手法では部分構造毎のリファインメントを順次繰り返していき全体構造の最適化を図っている.シミュレーションに必要なレプリカ数はフラグメントに含まれる自由度数にのみ依存することになり,必要レプリカ数を減らせることが示されている.提案手法の有効性検討のためのいくつかの数値実験の結果について述べている.ポリアラニン(ALA)16を用いて提案した改良レプリカ交換法と従来のレプリカ交換法の比較が行われた.従来法,提案手法および温度一定MDによる計算が実施され,そこから得られた200Kにおける平衡分布を比較している.ここでは,提案手法を用いた場合に従来のレプリカ交換法と比較して1/8のレプリカ数で正しい平衡分布を得ることに成功している.また、これにより非知識的なタンパク質立体構造予測においてもアミノ酸配列上の局所配列−構造相関の利用が有効であることが示された。

第五章では,各章の結論がまとめられ総括されている。タンパク質の二次構造の中で、αヘリックス構造とターン構造の形成は配列上で近接したアミノ酸間の相互作用が支配的であり、本論文で提案された改良レプリカ交換法は特に・タンパク質に極めて有効な非経験的構造予測の手段を与えるものであると結論付けている。

以上のように、本論文は創薬支援や人工タンパク質などの工学的応用分野を通じてシステム量子工学の発展に寄与するところが大きい。

よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク