学位論文要旨



No 115641
著者(漢字) 三澤,計治
著者(英字)
著者(カナ) ミサワ,カズハル
標題(和) 多数のOTUと遺伝子座を用いた分子系統解析に関する理論的研究
標題(洋) Theoretical Studies on Molecular Phylogenetic Analysis Based on a Large Number of OTUs and Loci
報告番号 115641
報告番号 甲15641
学位授与日 2000.09.29
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第3868号
研究科 理学系研究科
専攻 生物科学専攻
論文審査委員 主査: 東京大学 教授 田嶋,文生
 東京大学 教授 加藤,雅啓
 東京大学 教授 長谷川,政美
 東京大学 助教授 野崎,久義
 東京大学 講師 上島,励
内容要旨 要旨を表示する

 現在、多数の生物・多数の遺伝子の配列データが蓄積されている。遺伝子配列の情報は、遺伝学に関する研究はもちろんのこと、系統分類学から疫学にいたるまで、幅広く利用されている。これからもDNA配列データは増え続け、その重要性は、今後ますます大きくなって行くであろう。そこで、これらの多量のデータを有効に解析する方法が必要となる。

 私は、2種類のDNAデータ解析方法の研究を行なった。一つは、遺伝子が多数ある時に、それを分類する方法の研究であり、もう一つは、多数の遺伝子座を用いて正確に系統推定を行なう方法の研究である。

1. 多数の遺伝子座を用いた際の系統解析

 最近は、多数の遺伝子座の遺伝子配列から、分子系統樹を推定する事が多い。しかし、遺伝子によって、得られる系統情報の正確さに違いがある。多数のデータを使う際には、不正確なデータが系統推定の精度を下げることもあり得る。そこで、本研究では、距離法を用い、多数の遺伝子座から、できるだけ正確に分子系統樹を推定する方法を開発した。

 この方法は、次のような手順からなる。まず、それぞれの遺伝子座から距離行列を求める。その上で、それぞれの距離行列の正確さを評価し、その正確さに合わせてウエイトを与える。正確な距離行列には、大きなウエイトを、不正確な距離行列には小さなウエイトをかける。その上で、距離行列を足し合わせ、プールされた距離行列を一つ作り、そこから系統樹を作成する。

 この方法の効果を調べるため、コンピュータシミュレーションを行った。図1に示したモデル樹にそって遺伝子配列を生成した。遺伝子座の数は10で、そのうち5つはDNA配列、残りの5つはアミノ酸配列であるとした。DNA配列の置換はKimura(1980)のモデルに従うとした。transitionとtransversionの比を4.0とした。アミノ酸配列においてはすべてのアミノ酸問で同じ確率で置換が起こるものと仮定した。それぞれの遺伝子の長さは100塩基対、または100アミノ酸残基であるとした。遺伝子座ごとの進化速度のばらつきは、ガンマ分布に従うものと仮定した。ガンマ分布の形はパラメータαに依存し、αが小さいほど、ばらつきが大きくなる。遺伝子座内のサイトごとの置換率のばらつきはないと仮定した。全体の分子進化速度の平均値をuとする。

 この条件の下で生成された遺伝子配列から、DNAについてはKimura's(1980)twoparameter距離、アミノ酸についてはPoisson距離を用いて、距離行列を求めた。そして、それらの距離行列の正確さを評価し、それに応じたウエイトをかけた上で距離行列をプールし、系統樹を再構築した。この試行を1000回繰り返し、モデル樹と同じトポロジーの系統樹が再構築された回数を調べた。Table 1にその結果を示してある。ウエイトをかけることによって、正しい系統樹を得られる確率が高くなることがわかる。また、遺伝子座間の進化速度のばらつきが大きいほど、ウエイトの効果が大きいことがわかる。

 我々のウエイト方法を用い、ミトコンドリアにコードされている全遺伝子座を使って、哺乳類の系統関係を調べた。DNAについてはJukes & Cantor距離、アミノ酸についてはPoisson距離を使った。遺伝子座内の置換率のばらつきはないと仮定した。

 図2がNJ法で書いた系統樹である。枝の上にある数字は、ウエイト法を使った場合、枝の下にある数字は、ウエイト法を使わなかった場合のブートストラップ確率である。4つのクラスターでは、ウエイトをかけることによって、ブートストラップ値が有意に増加した。ウエイト法により、系統推定の誤差が少なくなることがわかった。

2.遺伝子の分類方法

 遺伝子配列を元にした分類は広く行なわれている。例えば、遺伝子は、遺伝子族に分類され、記載されている。ウイルスの分類は、疫学上必要だと考えられている。ヒトの歴史を推論するために、ヒトから取られたDNAサンプルがタイプ分けされることもある。しかしながら、遺伝子の分類を求める際には、統一的に利用できる方法がなく、混乱の原因となる事もあった。そこで、本研究では、広く使うことができる遺伝子の分類方法を開発した。

 Klastorin(1982)は、Dendrogramを用いた病院の分類方法を提案した。今回、私は、Klastorin(1982)の方法を遺伝子の分類に応用した。ただし、病院の分類の場合とは異なり、遺伝子の分類は分子系統樹をもとに決められるものとする。この方法により、遺伝子は、共通祖先で起こった進化的変化が大きい単系統群へと分類される。この方法は、遺伝子の系統樹が得られている限り必ず遺伝子の分類を求める。この方法で分類を求めるためのコンピュータ上のアルゴリズムも開発した。そのため、遺伝子の数が多い時でも高速に分類を求めることができる。また、ブートストラップ(Efron and Tishirani 1991)に基づいて、分類の信頼性をテストする方法を開発した。

 実際のデータに応用したのが、図3である。この図は、opsinの系統樹と今回開発された方法で得られた分類である。太線は、グループを分けている枝で、*は、系統推定の際に、高いbootstrap確率(P>90%)で支持された枝である。数字は、それぞれのグループのbootstrap確率である。この方法で得られたopsinの分類は、先行研究において吸収波長から得られたopsinの分類と一致した。

図1. モデル樹

Table 1 1000試行のうち正しいtopologyが推定された数

図2. mtDNAから求められた哺乳類の系統関係

枝の上の数字はウエイトをかけた時のbootstrap確率であり、枝の下の数字はウエイトをかけなかった時のbootstrap確率である。

図3. opsinの系統樹と分類

グループを分けている枝は太線で示してある。*は系統推定の際に、高いbootstrap確率(P>90%)で支持された枝を指す。数字はそれぞれのグループのbootstrap確率である。

審査要旨 要旨を表示する

 本論文は3章からなり、第1章は、序文、第2章は、多数の遺伝子座を用いた際の系統解析、第3章は、遺伝子の分類方法について述べられている。

 現在、多数の生物種において多数の遺伝子座のアミノ酸配列情報およびDNA配列情報が知られている。今後、その量はますます増大していくであろう。したがって、このような大量のデータを有効に解析する方法が必要になってきている。本論文の目的はこのような大量情報を解析する統計的方法を開発することである。

 第1章では、これまでに開発された系統樹作成法を要約し、本研究の目的が示されている。

 第2章において、論文提出者は多数の遺伝子座のアミノ酸配列情報およびDNA配列情報から系統樹を作成する新しい方法を示している。系統樹作成法には最尤法などいくつかに大別できるが、ここでは距離行列法について研究を行っている。すなわち、個々の遺伝子座で得られた距離行列をどのような加重をかけて一つの距離行列を作るかという問題である。すでに知られている方法および論文提出者が開発した方法をコンピュータ・シミュレーションにより検定したところ、論文提出者が開発したTT+TT0法がもっともよい方法であることが明らかになった。審査委員会はこの方法が有効な方法であり、広く用いられる方法になる可能性があることを確認した。

 第3章は、遺伝子の分類方法である。いままで、遺伝子は機能的側面から分類されることもあれば、研究者の主観に基づいて分類されることもあった。本研究においては、客観的分類方法が示されている。この方法は病院の分類方法として知られている方法を遺伝子の分類方法に応用したものであり、似たものはおなじグループに、そうでないものは異なったグループに分類するという概念に基づいている。論文提出者は、さらにブートストラップ法による統計的検定法も開発している。例として、オプシン遺伝子族をこの方法で分類したところ、機能に基づいて分類したものと一致していることが示されている。審査委員会はこの方法は有効な分類方法の一つであることを確認した。

 なお、本論文の第2章および第3章は、田嶋文生との共同研究であるが、論文提出者が主体となって行ったもので、論文提出者の寄与が十分であると判断する。

 したがって、博士(理学)の学位を授与できると認める。

UTokyo Repositoryリンク