学位論文要旨



No 123576
著者(漢字) 森田,瑞樹
著者(英字)
著者(カナ) モリタ,ミズキ
標題(和) タンパク質-リガンド結合部位の予測手法の開発
標題(洋)
報告番号 123576
報告番号 甲23576
学位授与日 2008.03.24
学位種別 課程博士
学位種類 博士(農学)
学位記番号 博農第3280号
研究科 農学生命科学研究科
専攻 応用生命工学専攻
論文審査委員 主査: 東京大学 教授 清水,謙多郎
 東京大学 教授 祥雲,弘文
 東京大学 准教授 若木,高善
 東京大学奈良先端科学技術大学院大学 准教授 川端,猛
 東京大学 准教授 中村,周吾
内容要旨 要旨を表示する

1.タンパク質-リガンド結合部位の予測手法の開発

あらゆる生物の生体内においてタンパク質は他の何らかの生体分子と相互作用をしていると考えられ,それによってタンパク質は機能を発現している。タンパク質は水を除けば生体中に最も多く存在する生体高分子であるので,タンパク質の働きの詳細を知ることは生命現象を理解するうえで非常に重要である。そのためタンパク質と他の生体分子との相互作用は研究対象として大変注目されており,個々の相互作用のレベルからそれらの相互作用が織りなすネットワークのレベルまで幅広く研究されている。この中の一つの研究対象にタンパク-リガンド結合部位の同定および予測がある。ここでリガンドは受容体タンパク質に結合する分子および酵素に結合する基質を指す。リガンドがタンパク質のどこに結合するかを知ることはタンパク質の機能解析の第一歩であり,また医薬品の探索や設計においても必要不可欠の情報であるため,それを同定・予測するための手法を開発することは非常に重要である。

近年,構造ゲノムプロジェクトの進展によって多数のタンパク質の立体構造が利用できるようになってきており,また,タンパク質の構造には機能に関する多くの情報を含むと考えられることから,本研究ではタンパク質の立体構造を利用し,そのどの部分にリガンドが結合するか,空間上の位置を示す手法を開発することとした。

立体構造のみを利用したリガンド結合部位の予測手法の主なものは大きく2通りに分けられる。1つはタンパク質の形状に基づく手法,もう1つはエネルギーの計算に基づく手法である。形状に基づく手法はタンパク質の表面にある溝や凹みを検出し,その大きさや深さに基づいてリガンド結合部位を予測する手法である。一方のエネルギー計算に基づく手法はタンパク質周囲のエネルギー分布を計算し,タンパク質との引力が強い一帯を探すことによってリガンド結合部位を予測する手法である。本研究では生体分子の結合は生体分子間に働く引力的なエネルギーによって引き起こされるとの仮定に依拠し,エネルギーの計算に基づいてリガンド結合部位を予測する手法を開発することにした。

タンパク質の立体構造を利用したリガンド結合部位予測手法の最終的な目標は,リガンドが結合していないタンパク質の立体構造(リガンド非結合状態の構造)を用いてリガンドが結合する部位を予測できるようにすることである。しかし,これまでに発表された手法の多くではリガンドが結合した立体構造(リガンド結合状態の構造)を用いて手法のテストがなされている。計算機によるタンパク質-リガンド結合部位の予測は1982年のKuntzらの研究からはじまったが,25年以上経った今もなおリガンド非結合状態の構造のどこにリガンドが結合をするかを充分な精度で予測をすることができない。よって本研究ではリガンド結合状態の構造を用いた場合のみならず,リガンド非結合状態の構造を用いた場合においても高い精度でリガンド結合部位の予測ができる手法の開発を目指した。

2.予測手法の概要

本研究で開発した手法では次のようにしてリガンド結合部位を予測する。タンパク質の表面近くにプローブを置き,タンパク質とプローブとの間に働くvan der Waals相互作用の強さを計算しながらプローブを挿引してゆく。このようにして強く相互作用をするようなまとまった場所を探し,そのような場所の中で全体として最も強く相互作用をする場所をリガンド結合部位の予測部位の第一候補とする(図1)。

本研究で開発した手法を従来手法と比較するために,従来研究の中から形状に基づく手法とエネルギーの計算に基づく手法を1つずつ選び,それらの手法がテストされたのと同じタンパク質で本手法をテストし,その結果を比較した。ここで従来手法として選んだのは2005年にLaurieとJacksonによって発表されたPocket-Finder(形状に基づく手法)とQ-SiteFinder(エネルギー計算に基づく手法)である。

3.予測結果

本研究で開発した手法は従来手法よりも高い予測精度をあげることができた(表I)。特にリガンド非結合状態での予測精度が従来手法よりも20%以上向上しており,結合状態での予測精度に近い精度が得られた。また,本手法はリガンドが結合した場所をどれくらい厳密に予測できたかを表す指標であるPrecisionの平均値(Average precision)が従来手法と比べて高かった。これは従来手法よりも狭い範囲でリガンドの結合する位置を予測できたことを示している。また,本手法とQ-SiteFinderによって得られたAverage precisionはPocket-Finderによって得られたものよりも格段に高い。このことはエネルギーの計算に基づく手法は,形状に基づく手法と比べてより狭い範囲でリガンドの結合する位置を予測できたことを示している。

4.データセットを作製するウェブサーバーの開発

タンパク質-リガンド結合部位の予測手法の開発においては,予測はリガンド非結合状態のタンパク質の立体構造を用いて行い,予測結果の評価はリガンド結合状態の立体構造を用いて行う必要がある。そのようにするためには,同じタンパク質のリガンド結合状態と非結合状態のペアの立体構造が必須である。またこのようなペアのデータセットは,タンパク質へのリガンドのドッキング・シミュレーション手法の開発や,リガンド結合によって引き起こされるタンパク質の立体構造変化の研究などのためにも欠かすことができない。このように,タンパク質-リガンド結合に関する研究にとってリガンド結合/非結合状態のペアの立体構造データセットは大きな価値があるが,このようなデータセットは現在非常に限定された内容のものしか存在しない。そのため本研究では,リガンド結合状態と非結合状態の立体構造のペア・データセットを作製するウェブサーバーを新たに開発した(図2)。

このウェブサーバーはユーザーがリガンド結合状態のタンパク質のPDB IDを入力すると,同じタンパク質のリガンド非結合状態のPDB IDをそれとペアにしてユーザーに返す。1つのPDB IDだけでなく,複数のPDB IDを同時に入力とすることができる。このウェブサーバーはすでに一般に公開している。

図1 本研究で開発した手法によるリガンド結合部位予測の概念図。(a) タンパク質の立体構造,(b) タンパク質との間に強い相互作用が働く場所を探す,(c) その中で最も強く相互作用をする場所をリガンド結合部位の第一候補とする。

表I 各手法によって得られた予測結果の概要

図2 本研究によって開発・公開したウェブサーバー:BUDDY-system http://www.bi.a.u-tokyo.ac.jp/services/buddy/

審査要旨 要旨を表示する

あらゆる生物の生体内においてタンパク質は他の何らかの生体分子と相互作用をしていると考えられ、それによってタンパク質は機能を発現している。本論文は、とくにタンパク質とリガンドの相互作用に着目し、リガンドがタンパク質のどこに結合するかをタンパク質の立体構造を利用して予測するタンパク質-リガンド結合部位予測手法の開発を目的とするもので、4章よりなる。

第1章では、タンパク質-リガンド結合部位予測の現状と応用、本論文の概要について述べている。

第2章では、タンパク質-リガンド結合部位予測手法の開発と、その予測性能について述べている。開発した手法は、以下の通りである。タンパク質の表面近くにメタン分子のプローブを置き、タンパク質とプローブとの間に働くvan der Waals相互作用の強さを計算しながらプローブを挿引していく。このようにして強く相互作用をするようなまとまったプローブ点の集合をクラスタリングにより探索し、そのようなプローブ点の集合の中で全体として最も強く相互作用する場所をリガンド結合部位の予測部位の第一候補とする。

プローブの生成は double cubic lattice method(DCLM)を階層的に適用し、タンパク質表面より放射状にプローブ点が配置されるようにしている。クラスタリングは2段階で行い、van der Waals相互作用エネルギー値が小さいプローブ点をクラスタリングし、さらにそれをseedとして、より緩いエネルギー値の条件でクラスタを広げるという手法を開発している。相互作用エネルギーを計算するための力場パラメータとしては、Amber parm94を使用している。

本章では、従来の手法として、本手法と同様にエネルギー計算に基づいた手法であるQ-SiteFinder、および本手法とは異なり形状に基づいた手法であるPocket-Finderを選び、予測精度の比較を行っている。これらの手法は、タンパク質-リガンド結合部位予測手法として現在広く利用されているものである。厳密な比較を行うため、これらの手法と同じ、134個のタンパク質-リガンド複合体(結合状態)構造と、134個の単体のタンパク質(非結合状態)構造からなるLaurie and Jacksonのデータセットを使用して本手法のパラメータのチューニングを行い、また、これらの手法と同じ35個の結合状態・非結合状態構造からなるテストデータセットに対して予測を行っている。その結果、これらの従来手法よりも高い予測精度が得られ、とくに非結合状態のタンパク質に対する予測では、25%以上、予測部位と実際のリガンドの存在部位が重なっているものを正解としたみなしたときの割合が、Q-SiteFinder、Pocket-Finderとも0.514であったのが、本手法では、0.771であったことを報告している。現実のタンパク質-リガンド結合部位予測では、非結合状態の構造を用いて結合部位を予測することが要求されるため、本手法の有用性が示されたことになる。さらに、本手法はリガンドの結合部位をどれくらい厳密に予測できたかを表す指標であるPrecisionの平均値が従来手法と比べて高く、これは従来手法よりも狭い範囲でリガンドの結合部位を予測できていることを示している。本手法と同じエネルギー計算に基づくQ-SiteFinderに対する精度の向上の要因は、本手法の特徴である、プローブの配置方法、エネルギー計算に用いた力場パラメータ、およびエネルギーの低いプローブ点を選別するためのクラスタリング手法の各要素に起因するものであることも示している。

第3章では、リガンド結合状態・非結合状態のタンパク質ペア・データセットを作成するためのWebサーバの開発について述べている。リガンド結合状態のタンパク質のデータベースは公開されているものが数多く存在するが、リガンド結合状態・非結合状態のタンパク質ペア・データベースとして公開されているものはこれまでNajmanovichらによるものとDessaillyらによるものの2つしかなく、前者は公開以来更新がなされていない、後者は固定した内容を公開しているのみで柔軟性がないという制約がある。本研究で開発したWebサーバは、利用者がリガンド結合タンパク質を入力するとそれと対をなすリガンド非結合状態のタンパク質を探索する機能をもち、しかもリガンドに対する条件を細かく設定することが可能である。これは、本研究のようなタンパク質-リガンド結合部位予測手法の開発に役立つだけでなく、タンパク質-リガンド・ドッキング手法の開発や、リガンド結合に伴うタンパク質の立体構造変化の研究などにも必要となる。

第4章では、本研究全般に対する考察と今後の計画について述べられている。

以上、本研究は、タンパク質-リガンド結合部位予測の新規手法を提案し、その有用性を示したもので、タンパク質の機能予測のほか、医薬品の設計や有用酵素の設計にも役立つものと考えられ、学術的にも応用的にも寄与するところが多い。よって審査委員一同は、本研究が博士(農学)の学位論文として価値あるものと認めた。

UTokyo Repositoryリンク