学位論文要旨



No 126448
著者(漢字) 笠原,浩太
著者(英字)
著者(カナ) カサハラ,コウタ
標題(和) 既知タンパク質-リガンド複合体立体構造情報を利用した結合部位および結合様式予測手法の開発
標題(洋) A knowledge-based method for predicting ligand binding sites and conformations using three-dimensional structure of protein
報告番号 126448
報告番号 甲26448
学位授与日 2010.09.27
学位種別 課程博士
学位種類 博士(科学)
学位記番号 博創域第638号
研究科 新領域創成科学研究科
専攻 情報生命科学専攻
論文審査委員 主査: 東京大学 准教授 北尾,彰朗
 東京大学 教授 高木,利久
 東北大学 教授 木下,賢吾
 東京大学 准教授 木立,尚孝
 産業技術総合研究所 客員准教授 広川,貴次
内容要旨 要旨を表示する

In recent years, structural databases of proteins have been rapidly growing, due to structural genomics projects. Revealing the nature of ligand recognition by proteins, based on the databases, is one of the main goals of structural biology. Toward this end, statistical, data-mining studies of the databases have revealed several structural patterns in protein-ligand interactions. There are two major methods to detect the patterns from the databases. The first treats the patterns in elemental units of interactions, such as inter-atomic and functional groups, that commonly appear in a variety of complexes. The second focuses on the structural patterns in larger units consisting of some residues, called "binding motifs", that are conserved among particular types of proteins. Although information about these patterns has been adopted to predict ligand recognition, the prediction methods are based on only one of the two types of patterns. This is because the methods focusing on the patterns in larger units may overlook those defined by elemental units, and vice versa. In order to consider both patterns, the size of the unit of interactions has to be defined suitably.

This thesis is composed of two studies, considering both types of patterns. First, I defined molecular fragments as the units of interactions, and developed a new prediction method for binding sites and ligand conformations, based on information about the interactions between the fragments. Second, I performed data-mining analyses on the spatial distributions of the fragment-fragment interactions based on a Gaussian mixture model, to clarify the patterns that contributed to the predictions.

Evaluations of the prediction method revealed that it could accurately predict the binding sites and conformations of chemically diverse ligands. I found that predictions for nucleotide binding were primarily supported by information about interactions in the binding motifs. On the other hand, other diverse ligands were predicted mainly from the information about interactions in the elemental units observed among a wide range of complexes. In addition, as a result of the data-mining analyses, various patterns of interactions were defined as Gaussian distributions. Basically, the patterns observed only among particular types of proteins and/or ligands had a small variance in their Gaussian distribution. In total, the majority of the ligands were recognized by the patterns commonly observed among various complexes.

In conclusion, I successfully developed a prediction method based on the patterns of interactions. In addition, the data-mining study based on the Gaussian mixture model clarified the two patterns: that is, those commonly observed among various complexes, and those appearing only in particular types of proteins and/or ligands with strictly conserved structures. Both types of interaction patterns of interactions play crucial roles in the ligand recognition by proteins.

審査要旨 要旨を表示する

本論文は2章からなり、第1章は既知のタンパク質-リガンド複合体立体構造情報を利用した結合部位と結合様式の予測法開発について、第2章はフラグメント-フラグメント相互作用のデータマイニングについて述べられている。

第1章では、これまでの当該分野での研究の状況に関する導入、論文提出者が開発した結合部位と結合様式の予測の手法とそれを用いた結果が述べられている。この手法では、まず準備として5524個の既知のタンパク質-リガンド複合体立体構造情報を用いて、相互作用情報を抽出している。具体的には、タンパク質とリガンドをそれぞれ化学的観点からフラグメントに分解し、フラグメント-フラグメント間の相互作用情報に変換する。結合部位の予測には、この相互作用情報を用いる。クエリーのタンパク質とリガンドの情報が与えられた時に、まず相互作用情報に基づいてタンパク質構造上に相互作用のホットスポットを予測する。次にホットスポットをリンクすることでリガンドが結合しうる部位を特定し、相互作用のアニーリングを行うことで結合様式を決定している。開発された手法の正確性を既知のタンパク質-リガンド複合体立体構造を正解として、予測値された結合様式を3つの指標で予測成功率を評価したところ、86.3%、69.6%、44.3%となった。最初の2つの指標は大まかな結合部位が予測できるかどうかを示した数値であり、それぞれの値はよい予測法となっていることを示すものであると評価できる。結合様式がどの程度よく予測されるかを示す三番目の予測成功率はあまり高くないが、結合様式を最適化することに優れた既知の手法と組み合わせれば大きく改善することが期待される。またこの予測法は特にヌクレオチドの結合を予測するのに優れていることが明らかになった。

第2章では、第1章で開発した手法を用いて、フラグメント-フラグメント相互作用の特徴を抽出している。具体的には、フラグメント-フラグメント相互作用の空間的な広がりやリガンドの種類とタンパク質フォールドの関係等について分析している。

本論文で開発された手法は、既存の手法と比較して、特に結合部位を予測するという点で優れていると評価できる。現在、タンパク質-リガンド複合体を形成する際に問題点のなっていることの1つはタンパク質の立体構造が変化するために予測が難しくなってしまうということである。この手法は相互作用のホットスポットを用いてために、この問題に比較的よく対処しうることも示されている。この特徴は、既存の手法にはない、本論文の手法の優位性であると考えられる。

なお、本論文は、木下賢吾、高木利休との共同研究であるが、論文提出者が主体となって研究を行ったもので、論文提出者の寄与が十分であると判断する。

したがって、博士(科学)の学位を授与できると認める。

UTokyo Repositoryリンク