学位論文要旨



No 114423
著者(漢字) 廣瀬,仁
著者(英字)
著者(カナ) ヒロセ,ヒトシ
標題(和) 適応的温度スケジューリングを用いた生体分子エネルギー曲面の効率的解析手法の開発とその応用
標題(洋)
報告番号 114423
報告番号 甲14423
学位授与日 1999.03.29
学位種別 課程博士
学位種類 博士(農学)
学位記番号 博農第2031号
研究科 農学生命科学研究科
専攻 応用生命工学専攻
論文審査委員 主査: 東京大学 教授 清水,謙多郎
 東京大学 教授 松澤,洋
 東京大学 教授 魚住,武司
 東京大学 助教授 山根,久和
 東京大学 助教授 西山,真
内容要旨

 生体分子のエネルギー曲面は、極めて複雑な形状を持ち、各構造に対応するエネルギー曲面上の点はそれぞれに非常に高いエネルギーの山にはばまれている。さらに、生体分子は一般に自由度が大きく、その自由度が大きくなるにつれそのエネルギー空間は指数関数的に大きくなるため、その曲面上の探索によるエネルギー曲面解析は困難なものとなっている。

 本研究では、そのような莫大な広さを持つエネルギー空間において、高いエネルギー障壁を乗り越え、かつ、できるだけ低いエネルギー構造を効率よく探索できる方法を開発した。この方法は、現在大域エネルギー最小化の手法の中で最も強力なものの1つと考えられているMonte Carlo minimization(MCM)法において、計算の対象とする生体分子のエネルギー曲面の凹凸の程度や各ステップで行う構造変形の変形の程度に適応して自動的に温度項Tを決定できるようにする温度スケジューリング方法である。具体的には、エネルギー曲面の凹凸や構造変形の程度に左右されず、Metropolisの判定においてE>0の時の採択率の期待値=〈P({ci+1が採択される}|{Ei>0})〉が所望の値になるように温度項Tを過去のエネルギーの履歴からステップごとに設定する。その結果、エネルギー曲面の凹凸の大きいところでは高いTによってよりダイナミックな探索を行うことを可能にし、一方、滑らかなエネルギー曲面においては低いTによってより細かな探索を行うことを可能にしている。この機構により、高いエネルギー障壁を越えることを可能にしつつ、不必要に高エネルギー構造に到達することを抑え、低エネルギー構造中心の広範囲の構造探索を可能にしている。

 申請者は、従来の温度一定のMonte Carlo法、Simulated annealing法、温度一定のMCMと比較実験を行い、本方法によって得られた構造群のエネルギー値が他手法に比して圧倒的に低かったことを示した。すなわち、本方法によって、最小エネルギー構造のみならず、生物学的に重要な数多くの準最小エネルギー構造群を見つけることができることを示した。本研究では、開発した方法を分子の構造予測とエネルギー曲面形状解析の2つに適用した。

I.大域的エネルギー最小化による構造予測

 生体分子の機能は、その立体構造に密接に関連しているため、立体構造を予測することは重要な課題であるである。そのため、ここでは本方法を用いて分子の構造予測を目的とした大域的エネルギー最小化を行い、ポテンシャルエネルギー最小構造、自由エネルギー最小構造をもって予測構造とした。ここでは、構造予測の対象分子として2種のモデルペプチド(Ala)19と(Gly)19、およびCDスペクトル実験によって-helix含有率が求められている3種類の17残基合成ペプチド、CH3CO-Y(KA4)3K-NH2(以下、オリジナル)、A5L/A10L/A15L(以下、Leu置換)、A5V/A10V/A15V(以下、Val置換)に適用した。この3つのCD実験による-helix含有率は、それぞれ、78%、80%、17%であった。

 ・(Ala)19:得られたポテンシャルエネルギー最小構造および300[K]における自由エネルギー最小構造は、いずれも2Alaから18Alaまで、DSSPで-helixと判定された完全な-helixであり、それらの構造間距離は0.6362Åでほとんど同じであった。これは、過去の大域的エネルギー最小化による構造予測計算の結果と一致するものであった。

 ・(Gly)19:得られたポテンシャルエネルギー最小構造は-sheetを多く含む構造で、自由エネルギー最小構造はターンの多い構造で、これらの構造間距離は4.518Åと大きかった。この分子の計算ではEに対し、TSの寄与が大きいことが示された。また、得られた構造はGlyの-helixの取りにくい性質と矛盾する結果ではなかった。

 ・17残基合成ペプチド:3種類の分子全てにおいて、ポテンシャルエネルギー最小構造、自由エネルギー最小構造は共に2Lysから16Alaまで全て-helixと判定された完全な-helix構造であったが、何回か行ったオリジナルとLeu置換の計算では必ず完全な-helixに到達したものの、Val置換の計算においては必ずしもそうではなく、ポテンシャルエネルギー最小構造のエネルギーに極めて近い局所極小構造(折れ曲がった-helix)にトラップされやすかった。この事実は3つの分子のCD実験の結果と合致しているものと考えられる。

II.分子の構造群解析によるエネルギー曲面形状解析

 近年、生体分子が理論上地質学的な数の構造の中から唯一の立体構造に、その一次配列情報から秒単位でフォールディングできるという矛盾を解明する鍵が、エネルギー曲面の形状にあるのではないかという理論が有力になっている。しかしながら、そのシミュレーションには莫大な計算時間を必要とするため、これまで主に簡略化された2次元格子モデルによって計算がなされてきた。本研究では、前述のように、低エネルギー構造中心に幅広く構造空間を探索する能力をもつ本方法を格子モデルでなく実際のタンパク質の分子構造に応用し、多くの構造群を生成し解析することによって、エネルギー曲面の特徴・形状を知り、フォールディングの機構の解明に迫る。

 構造群解析の1つ目として、ホモポリマー(Ala)17と3種類の17残基合成ペプチドの解析を行い、ホモポリマーとヘテロポリマーとの違い、-helix含有率の高い分子と低い分子との違いを、本研究で考案した解析法によるエネルギー曲面解析で明らかにした。構造群解析の2つ目として、異なった種のラクトアルブミン(LA)のBヘリックスのアルコール変性の実験に対応する計算を行い、実験結果と合致する結果を得、その理由を構造群解析の結果によって示した。構造群解析の3つ目として、G Proteinのアンフォールディングシミュレーションを行い、主成分解析法(PCA)で解析し、フォールディングの研究として新しい結果を得た。

1.解析法

 本研究では、従来から存在する解析法だけでなく、二次構造解析を利用した解析法をいくつか考案した。具体的には、残基数kの分子が総構造数Mだけ得られた構造群を全て二次構造解析し、-helix(その他、任意の二次構造で可能)と判定されたら1、そうでなければ0とし、1つの構造に対応する長さkの0-1配列をM個生成する。横軸を各0-1配列中の1の総数とし、縦軸を1の総数の同じ配列の中で0-1配列を2進法で小さいものから順に番号付けしたものにすることで、2k個ある二次構造を全て分類し表示できる。このグラフ上に、得られた構造群を点として表示し、探索された順に構造を結んでいくことで、どのような経路を通っていったか、どのようなトラップがあるかなどが分かる。これによりエネルギー曲面をある程度推定できる(以下、ネットワーク表示法)。また、上記の0-1配列の結果を用い近似的に-helix含有率を推定する手法なども考案し解析に利用した。その他、PCAなど既存の手法も利用した。

2.17残基ホモポリマーとヘテロポリマー(3種の17残基合成ペプチド)の解析

 本計算で得られた結果より、上記の計算法で-helix含有率を求めたところ、(Ala)17で64%、オリジナルで65%、Leu置換で73%、Val置換で27%と、CD実験で-helix含有率が明らかになっている後者3分子では、実際の実験データと比較的近い結果を得た。これらの計算で得られた構造の経路をネットワーク表示で解析したところ、2つの顕著な結果を得た。ひとつは、ホモポリマー(Ala)17は、他の3分子の計算に比して非常に多くの経路を持つのに対し、同サイズの他の3分子の経路はかなり限られていた。このことより、ホモポリマーのエネルギー曲面の形状は凹凸が比較的均質で異方性が小さくN構造へ向かう経路が無数にあるのに対し、他の3つのヘテロポリマーのエネルギー曲面形状はより複雑で異方性の強いごつごつとしたものとなっていて、N構造へ向かう経路はごく限られていると考えられる。もうひとつは、3種の合成ペプチドのネットワーク表示法の結果を比較すると、オリジナルとLeu置換ではN構造である完全な-helixに滑らかな経路を持っているのに比べ、Val置換ではN構造に向かう過程に多くのトラップを持つことが示された。このことから、Val置換のエネルギー曲面はその表面上に多くの抜け出しにくいトラップをもっているが、オリジナルやLeu置換ではそのようなトラップの少ないよりN構造へのdriving forceの強い形状をしていると考えられる。このことより、CD実験で得られた-helix含有率の差異は、それぞれのエネルギー曲面形状の差異によって説明できるといえる。

3.ラクトアルブミンのBヘリックスのアルコール変性の計算とその解析

 モルテングロビュール(MG)において形成されるLAのBヘリックス領域の安定性は異なる生物由来のLA間でかなり異なっていると考えられる。その安定性の差異が局所的アミノ酸配列のヘリックス形成能の差異に起因するか否かを調べるために、ヒトLA(HLA)、モルモットLA(GPLA)、ウシLA(BLA)、ヤギLA(GLA)のBヘリックス領域(残基番号22〜35)に対応するペプチド(B14)を合成し、そのヘリックス能を比較した実験がある。B14ペプチドは4種の内いずれも水溶液中では-helixを形成しなかったが、トリフルオロエタノール(TFE)を40%(体積濃度)誘導したところ、HLA、GPLAのペプチドは-helixを形成し、BLA、GLAのペプチドは-helixを形成しなかったという実験結果が得られている。これら4種のB14の一次配列は相互に類似しており、現在存在するどのような二次構造予測法でも差異が得られなかったという報告もなされている。

 本研究では、TFE40%中で-helixの形成に差異を示した2種のペプチド、

 HLA:CH3CO-ALPELICTMFHTSG-NH2

 BLA:CH3CO-SLPEWVCTTFHTSG-NH2

 を対象とし、本方法に水中およびTFE40%の溶媒の差を誘電率という形で取り入れ計算を行った。その結果得られた-helix含有率は水中の誘電率で、HLAが18.5%、BLAが16.5%といずれも低かったのに対し、TFE40%の誘電率で、HLAは44.8%と大きく上がり、BLAは16.6%と水中とほとんど同じく低かった。これは実験と定性的に一致する結果で、これらの分子においては誘電率の差が溶媒の溶質に与える影響が大きいことを示した結果といえる。TFE40%の計算で、HLAおよびBLAの構造の変遷の経路をネットワーク表示してみると、明らかにHLAに比して、BLAの方が-helix残基数の小さいところで大きなトラップをもっていて、全体に経路も少なく、-helixを取りにくいことが示された。また、0-1配列の解析から、BLAでは、5Trp、6Val、あるいはその両方が-helix形成を阻害している可能性を示す結果を得たため、それぞれの残基をAlaで置換した配列、W5AおよびV6Aの計算を行ったところ、前者においてのみ、57%と高い計算-helix含有率を得、BLAの-helix形成能の低さが5Trpにあることが明らかにされた。

4.G ProteinのアンフォールディングシミュレーションとPCAによる解析

 IgGにbindingするProtein Gのsegment B1(56残基、原子数540)を、X線結晶構造解析によって得られた構造を初期構造とし、本方法を適用しそのアンフォールドしていく様子をシミュレーションした。ここでは、採択された5140個の構造をPCAによって解析した。各PCの軸方向への揺らぎの大きさの全体の揺らぎに対する寄与率は最初の3つのPCの寄与率が飛び抜けて大きくPC1で33.8%、PC2で16.6%、PC3で13.4%であり、この3つだけで全体の63.7%を占めていた。すなわち、このアンフォールディングの動き(得られた構造群)は全部で969の自由度を持つが、それにも関わらず、このわずか3つの自由度によって生成される部分空間でその多くが記述できるということが分かった。すなわち得られた構造群は極めて異方性の強い空間にあり、このアンフォールディングの過程がfunnel理論的というよりかなりpathway理論的であると考えられる。次に、得られた全構造をPC1/PC2、PC1/PC3、PC2/PC3、の3種の平面上にプロットしたところ、明瞭に4つのクラスターに分かれていた。この4つのクラスター間の転移は、明確ではないが1つ目と2つ目のクラスター間の転移は、-sheetの崩壊、3つ目と4つ目の間の転移は-helixの崩壊に対応していた。ここで得られた構造群は、天然状態で二次構造をなしている部分は天然構造に近い何らかの二次構造をある程度保持したままであり、MGや折り畳み中間体に近いものであると考えられる。

まとめ

 本方法により、生体分子が極めて複雑なエネルギー曲面を持つにも関わらず、低エネルギー構造中心に広範囲に効率よく探索できることが、他手法に比して示された。これを分子の構造予測を目的としたエネルギー最小化およびエネルギー曲面形状解析に応用した。前者では、過去の研究と合致する結果を得、さらに計算効率の良さを示した。後者においては、大きく3つの応用を行ったが、ここで得た結論は、ひとつにはエネルギー曲面の形状がそのフォールディングと大きく関係するという理論を単純なモデルではなく実際のタンパク質分子の構造を用いて検証できたこと、もう一つは、タンパク質のエネルギー曲面は複雑で異方性が強く、そのフォールディングはpathway理論とfunnel理論の中間にあるがかなりpathway理論よりな、蜘蛛の巣状のネットワークが部分的にかなり欠損したような経路を取っているものと推察されることである。ただ、本研究において開発した温度スケジューリングは効率的サンプリングに必要なものであるが、一方で、後者の解析におけるシミュレーションの経路を解析の対象とするとき、その温度スケジューリングが恣意性となってしまっているため、実際の自然界における経路と必ずしも対応させられない。そのため、得られた経路は無視し、得られた構造群のみからフォールディング経路を推測する方法を確立する必要がある。

審査要旨

 生体分子のエネルギー曲面は極めて複雑な形状を持ち、その白由度の増大に伴いエネルギー空間が莫大になるため、その曲面上の探索解析は困難である。本研究では、そのような性質をもつエネルギー空間における、低エネルギー構造中心の効率的探索手法を開発し、大域エネルギー最小化による構造予測とタンパク質のフォールディング機構の解明に深く関わるエネルギー曲面解析に適用している。

 第1章では、本研究の背景および目的、計算結果の概要が述べられている。

 第2章から第6章では、提案手法の理論的導出と生体分子の立体構造予測への適用結果が述べられている。第2章では、従来の大域エネルギー最小化手法の概要が述べられ、それらの手法を背景とし第3章で提案手法を導出している。提案方法は、局所極小化付きモンテカルロ法において計算対象分子のエネルギー曲面における凹凸の程度に適応的に温度項Tを決定できる温度スケジューリングを行う手法で、エネルギー曲面の凹凸の大きいところで高いTによってダイナミックな探索、凹凸の小さいところで低いTによってきめの細かな探索を行う。この機構により、高いエネルギー障壁を越えることを可能にしつつ、かつ、低エネルギー構造中心の広範囲な構造探索を可能にしている。第4章では、2種のモデルペプチドおよびCDスペクトル実験によってヘリックス含有率が解析されている3種の17残基合成ペプチドを対象とし、大域エネルギー最小化によって立体構造予測した結果が示されている。モデルペプチドの計算結果は過去の研究と合致するものであり、17残基合成ペプチドの結果は、最小エネルギー構造だけでなく準安定な構造が重要であることを示している。第5章では、提案手法の初期構造依存性の低さおよび計算速度の速さが示され、第6章では、提案手法が他手法に比して低エネルギー構造中心に高いサンプリング能力を持つことが示されている。

 第7章から第11章では、提案手法によって得られる構造群を解析することによるエネルギー曲面解析について述べている。第7章では、従来のフォールディング理論と、近年生まれたフォールディング理論であるfunnel理論を従来ほとんど簡略化されたモデルによる計算によってしか検証されてこなかったのを、実際の蛋白質を用いて計算することで検証しフォールディング機構の解明に追るという本研究後半の意義が述べられている。第8章では、シミュレーション経路を視覚化する手法であるネットワーク表示法、確率的にヘリックス含有率を算出する計算ヘリックス含有率法などの分子の構造群-エネルギー曲面解析手法が提案されている。第9章では、ホモポリマーと第4章で計算を行ったCDによって解析されている3種のヘテロポリマーを対象として計算、解析がなされ、計算ヘリックス含有率法によって得られた値とCDによる値との相関が高いことが示されている。また、これらのエネルギー曲面解析により、ヘテロな一次構造をもつ蛋白質はエネルギー曲面が異方的で天然構造へ向かう経路が限られており、ヘリックス形成能の異なる分子の差異がエネルギー曲面形状によってある程度説明できることが示されている。第10章では、ラクトアルブミンのBヘリックスのアルコール変性の実験に対応する計算、解析を行っている。ここでは、トリフルオロエタノール(TFE)40%の誘導によりヘリックス能を示したHLAと示さなかったBLAが計算対象とされ、TFE40%中のHLAのみが高い計算ヘリックス含有率を示し、実験結果と合致する結果を得、その理由をエネルギー曲面解析によって明らかにしている。また、BLAの置換体の計算によりヘリックス形成阻害要因残基を特定し、提案手法による分子設計の可能性が示されている。第11章では、GProteinのアンフォールディングシミュレーションを行い、得られた構造群を主成分解析法で解析し、シミュレーション経路およびエネルギー曲面に強い異方性があることを指摘し、また、GProteinのアンフォールディングがシートの崩壊→ヘリックスの崩壊という順序で起こることが示されている。第9章から第11章までの結果より、蛋白質のエネルギー曲面が複雑で異方性が強いことが示され、フォールディング機構が基本的にfunnel理論的だが、天然構造への道筋の限られた蜘蛛の巣状のネットワークが部分的に欠損したような経路をとると推測されている。

 以上、本論文は、効率的生体分子エネルギー曲面の探索手法を提案し、これを大域エネルギー最小化による構造予測およびエネルギー曲面解析に適用したもので、蛋白質のフォールディング理論に新たな知見を与えるものであり、学術上、応用上貢献するところが少なくない。よって審査委員一同は、博士(農学)の学位論文として価値あるものと認めた。

UTokyo Repositoryリンク