学位論文要旨



No 215136
著者(漢字) 中村,周吾
著者(英字)
著者(カナ) ナカムラ,シュウゴ
標題(和) 核酸および核酸タンパク質複合体のダイナミクス解析に関する研究
標題(洋)
報告番号 215136
報告番号 乙15136
学位授与日 2001.09.11
学位種別 論文博士
学位種類 博士(農学)
学位記番号 第15136号
研究科
専攻
論文審査委員 主査: 東京大学 教授 清水,謙多郎
 東京大学 教授 田之倉,優
 東京大学 教授 正木,春彦
 東京大学 助教授 若木,高善
 理化学研究所 副主任研究員 皿井,明倫
内容要旨 要旨を表示する

 核酸分子については,塩基配列ベースの研究が主に行われており,そのコンピュータ・シミュレーションによる解析は,タンパク質に比べると研究例が少ないのが実情である.しかし核酸分子の立体構造やダイナミクスが機能を果たす上で重要な役割を担っているということは数多く報告されている.一方で,コンピュータの高速化と並列計算技術の進歩により,大規模な計算を行うことが可能となり,より現実に近い系でのシミュレーションができるようになってきている.

 そこで本研究では,核酸および核酸タンパク質複合体を対象として,シミュレーションに必要な並列計算アルゴリズムを開発し,それを用いて構築した解析システムを用いて,構造モデリングと自由エネルギー解析およびダイナミクス解析を行うことを目的とする.

 まず,並列計算技術を用いた生体分子の構造モデリング・ダイナミクス解析システムを構築した.このシステムは,生体分子の立体構造を二面角系で扱い,配座エネルギーとその1次・2次微分,一般化固有値問題などの行列演算,基準振動モード解析などの並列計算アルゴリズムを実装している.これを用いることで,大規模分子の構造モデリングやダイナミクス解析を高速に行うことが可能となった.

 またその際必要となる要素技術として,二面角系Hessian行列の並列計算アルゴリズムを開発した.Hessianは生体分子のエネルギー関数の2次微分行列のことであり,エネルギー関数の形状情報を与える重要な量である.しかしHessianの計算には大きな計算コストがかかるため,とくに大規模な分子の計算では高速解法が必要である.そこで筆者らは,「Unify方式」と呼ばれるHessianの並列計算アルゴリズムを新たに開発した[1].このアルゴリズムを用いることで,Hessian計算およびアルゴリズム内にHessian計算を含むニュートン・ラフソン法によるエネルギー極小化計算において6〜12倍程度の並列化効率を達成することができた.

 またUnify方式では,とくに小さい系において,プロセッサ数の増加に伴って通信コストが原因で性能低下がみられるケースがあることがわかった.そこで,これを改良した「サブタスクグループ方式」を開発した.これはHessian計算を複数の部分問題(サブタスク)に分割し,サブタスク間の依存関係を解析することで通信量を必要最小限に抑えるものである.さらに遺伝的アルゴリズムを用いて,プロセッサの負荷分散と通信量の低減を同時に達成できるように,サブタスクプロセッサ割り当てを最適化する.このサブタスクグループ方式をtRNA分子のHessian計算に適用したところ,プロセッサ数60で32.6倍の並列化効率を達成し,Unify方式からさらに大きく性能を改善することができた(図1).

 次にこのシステムを用いて,核酸ミニヘアピン分子の熱安定性解析,核酸タンパク質複合体の基準振動モード解析を行った.DNAミニヘアピン分子dGC(GAA)GCは高い熱安定性を示すことが知られており,ループ部の塩基をシステマティックに置換した生化学実験から,3番目と5番目の塩基がそれぞれG,Aであることが高い熱安定性の必要十分条件であることが明らかになっている.そこで,高い熱安定性を示す配列とそうでない配列を与えたときに,モデリングした構造の相違およびループ部塩基の相互作用の解析によって両者を区別できるかどうかを検証した.

 このDNAミニヘアピン分子の立体構造は,ループ部がGAAのものがNMRで解かれている.そこで,まずループ部配列がGAA, GGA, GCA, GTA, GAG, GACの6つについて,筆者らが開発した「Two-Stage法」で構造モデリングを行った[2].この方法はエネルギー最小化をベースにしており,塩基対を作る塩基などの事前知識なしに構造モデリングを行うことが可能であるという特長をもつ.Two-Stage法によって得られたGAAのモデリング構造は,NMR構造に極めて近く,Two-Stage法の有効性を確認できた(図2).また高い熱安定性を示すGGA, GCA, GTAについても,NMR解析結果と矛盾しないモデリング構造を構築することができた.一方,高い熱安定性を示さないGAG, GACについても,モデリング構造はヘアピン構造となった.またループ部の塩基間相互作用を解析したところ,熱安定なヘアピンを形成する配列とそうでない配列との間に大きな差はみられなかった[3].このことは,これらの分子の熱安定性の理解には,エネルギーだけでなく,エントロピーの効果も考慮することが必要であることを示唆する.

 そこで,ループ部配列がGAAとGAGのものについて,筆者と同じ研究グループのTazakiらが開発した「Poisson-Boltzmann分子動力学法」を用いて,多数の構造サンプリングを行い,得られたデータをWeighted Histogram Analysis Method (WHAM)で統合して,ヘアピン形成自由エネルギープロファイルを求めた(図3).反応座標は分子の両端にあたるG1のH1とC7のN3の間の距離に設定する.その結果,安定なヘアピンを形成するGAAでは,ヘアピン構造付近が自由エネルギーの谷となり(図3A),ヘアピンがopen構造に近づくにしたがって自由エネルギーは増加した.一方GAGでは,ヘアピン構造付近に自由エネルギーの谷はあるものの,ヘアピンが崩れた構造付近に自由エネルギーのより深い谷が存在していた(図3B).従来の自由エネルギー計算では安定な構造(今の場合はヘアピン構造)同士の自由エネルギー差をみることがほとんどであったが,本研究では,対象としたDNAミニヘアピン分子においては,分子動力学計算を用いた自由エネルギー解析によって求めたヘアピン形成自由エネルギープロファイルを直接比較することで熱安定性の配列依存性を議論できることを明らかにした.

 アミノアシルtRNA合成酵素(ARS)は似たような立体構造をもつ多数のトランスファーRNA(tRNA)の中から,自分が担当する種類のものだけを非常に正確に認識し,アミノ酸を付加することができる.tRNAのARSとの接触面から離れた部位を置換した場合もアミノアシル化効率やARSとの結合定数に影響をおよぼすことが明らかになっており,この分子認識にtRNAのダイナミクスが関与している可能性が指摘されている.そこで,この分子認識機構の中でダイナミクスの果たしている役割を理解するための手がかりとして,ダイナミクス解析手法である基準振動モード解析をフリー状態のtRNA, ARSおよびtRNA-ARS複合体に適用して,フリー状態と複合体形成状態のダイナミクスの違いを解析した.

 基準振動モード解析によって求まった各原子の熱ゆらぎの大きさは,X線結晶解析から得られる温度因子データと高い相関を示し,本研究による解析の妥当性を示した.フリー状態のtRNAのダイナミクス解析では,tRNA分子が球状タンパク質の1/4〜1/10の低いモード周波数でゆっくりとした大きな運動をしていることが明らかになった[4,5].

 また,tRNAGln-GlnRS複合体について,フリー状態のモード運動と複合体状態のモード運動の詳細な解析を試みた.複合体形成によって,両分子が接触している広い範囲で原子の熱ゆらぎの大きな減少がみられた.低周波数領域では,tRNAGlnのアクセプタステム,アンチコドンアーム,中央部分の各領域と,GlnRSの触媒ドメイン,アンチコドン認識ドメインなどの各ドメインが,カップリングして大きく協調的に運動していた(図4).

 複合体状態とフリー状態でのモード運動を相互に比較すると(図5),GlnRSは複合体形成によっても低周波数領域でのモード運動の保存性が高く,複合体形成によってそのダイナミクスは大きな影響を受けていないことがわかった.tRNAGlnでは,フリー状態のダイナミクスに,いくつかの複合体状態のモード運動が内在していることが明らかになった.また,複合体状態とフリー状態で対応するモードの周波数の大小関係は保存しておらず,tRNAGlnのダイナミクスは複合体形成によって大きな影響を受けていた.

 本研究をさらにすすめて,多数のアミノ酸系について同様の解析を行い,その結果を比較することで,これまで両分子の接触部位周辺の静的な解析が中心だったtRNA-ARSの分子認識メカニズムの解析に,ダイナミクスの観点からの新たな知見をもたらす可能性があると思われる.

 さらに,本研究で開発したシステムや並列計算アルゴリズムは汎用的な利用が可能であり,本研究で扱った分子以外の核酸や核酸タンパク質複合体などを対象とした幅広い応用が期待される.

参考文献

[1] S. Nakamura, M. Ikeguchi, K. Shimizu (1998) J. Comput. Chem., 19, 1716-1723.

[2] S. Nakamura, H. Hirose, M. Ikeguchi, J. Doi (1995) J. Phys. Chem., 99, 8374-8378.

[3] S. Nakamura, H. Hirose, M. Ikeguchi, K. Shimizu (1999) Chem. Phys. Lett., 308, 267-273.

[4] S. Nakamura, J. Doi (1993) Comput. Aided Innovation of New Materials II, 1203-1206.

[5] S. Nakamura, J. Doi (1994) Nuc. Acids Res., 22, 514-521.

図1 サブタスクグループ方式によるtRNAGlnのHessian計算時間の並列化効率.

(細実線)理想直線.(破線)Unify方式.(太実線)サブタスクグループ方式.

図2 dGC(GAA)GCのTwo-Stage法による構造モデリングの過程.

左端:初期構造.右端:最終構造.

図3 WHAMにより求められた自由エネルギープロファイルと自由エネルギーの谷付近でサンプリングされた構造の例.

左図で,太線はdGC(GAA)GC,細線はdGC(GAG)GC.

図4 グルタミニルtRNA-ARS複合体の最低周波数モードにおける各原子の運動.

右の図は,左の図を紙面に向かって左側の方向から見たもの.tRNAGlnを黒い矢印で,GlnRSをグレーの矢印で表示している.見やすいように運動のサイズは5倍に拡大している.

図5 グルタミニルtRNA-ARSの複合体状態(縦軸)とフリー状態(横軸)のモード運動の類似性解析.

類似性が高いほど白く色づけがしてある.(左)tRNAGln.(右)GlnRS.

審査要旨 要旨を表示する

 核酸分子は、遺伝情報の保持や遺伝子の発現において非常に重要な機能を担っている。近年、核酸あるいは核酸タンパク質複合体の立体構造が多数決定され、データベースに登録されている。しかし核酸については、塩基配列ベースの研究が中心であり、立体構造およびダイナミクスに関する研究はタンパク質に比べて少ない。一方で、コンピュータの高速化とシミュレーション技術の発達で、コンピュータを用いた研究ではとくに重要となる、現実に近い系における大規模で精度の高いシミュレーションが可能になってきている。

 本論文は、このような背景をふまえ、核酸および核酸タンパク質複合体を対象として、構造モデリング、自由エネルギー解析およびダイナミクス解析を行ったものであり、またこのような解析を行うためのソフトウェアとシミュレーション手法およびその並列計算アルゴリズムを開発したものである。本論文は3部16章から成り、第1章は序章、第16章は内容の総括に充てられている。

 第1部は第2章から第6章までであり、生体分子の構造モデリング・ダイナミクス解析システムの構築について述べたものである。第2章は、システム構築の概要について述べている。第3章では、生体分子の構造やダイナミクスを扱う上での重要な概念である、配座エネルギー関数および座標系について述べている。第4章では、構築したシステムの詳細について述べている。本システムでは、申請者が開発した構造モデリング、自由エネルギー・ダイナミクス解析の各手法が、並列計算技術を基盤として統合されている。第5章は、二面角系での解析において計算時間の大きな部分を占めるエネルギー2次微分行列の並列計算法の開発について述べている。まず、行列要素を並列計算することにより高速化したUnify方式を提案し、tRNA分子に対して1プロセッサの6.8倍、アミノアシルtRNA合成酵素に対して11.2倍の高速化を達成した。またUnify方式よりもさらに並列性を高め、遺伝的アルゴリズムで最適化を図ったサブタスクグループ方式を開発し、tRNA分子に対して32.6倍の高速化を達成した。これにより、Newton-Raphson法など、2次微分行列の計算を含む手法の大幅な性能改善が達成された。第6章は、第1部の結果のまとめを述べている。

 第2部は第7章から第10章までであり、第1部で構築した解析システムを用いて、DNAミニヘアピン分子の構造モデリングと熱安定性解析を行ったものである。第7章は、これらの解析の背景と目的を述べている。第8章では、本研究で開発したエネルギー最小化手法であるTwo-Stage法について述べ、それを生化学実験から熱安定であることがわかっているループ配列およびそうではないループ配列をもつDNAミニヘアピン分子に適用して構造モデリングを行った結果について述べている。第9章では、第8章でモデリングを行った2つの構造について、Poisson-Boltzmann分子動力学法による構造サンプリングとWeighted Histogram Analysis法を用いてヘアピン形成自由エネルギーの解析を行った結果について述べている。熱安定な配列ではヘアピン構造が自由エネルギー最低であるが、熱安定でない配列ではそうならないことを見出している。第10章は、第2部の結果のまとめを述べている。

 第3部は第11章から第15章までであり、第1部で構築した解析システムを用いて、tRNAおよびアミノアシルtRNA合成酵素のダイナミクスを、基準振動モード解析法により解析したものである。第11章は、これらの解析の背景と目的を述べている。第12章は、基準振動モード解析法の理論について述べている。第13章は、フリー状態のtRNA分子のダイナミクス解析結果について述べており、特異なL字型立体構造に起因した、分子全体にわたる大きな低周波数領域のモード運動を求めている。また計算された熱ゆらぎがX線結晶解析から得られる温度因子をもとにしたゆらぎとよく一致していることを示した。第14章では、tRNA・アミノアシルtRNA合成酵素複合体のダイナミクス解析結果について述べており、複合体の低周波数領域のモード運動と、フリー状態の運動との相関について解析している。これらの解析から、tRNA・アミノアシルtRNA合成酵素の精密な分子認識にダイナミクスの観点からアプローチできる可能性が示された。第15章は、第3部の結果のまとめを述べている。

 以上要約すると、コンピュータ・シミュレーションにより、核酸分子および核酸タンパク質複合体の熱安定性およびダイナミクスを解析し、またそれに用いる並列計算技術の開発と解析システムの構築を行ったもので、学術上、応用上貢献するところが少なくない。よって審査委員一同は、本論文が博士(農学)の学位論文として価値あるものと認めた。

UTokyo Repositoryリンク http://hdl.handle.net/2261/37483