学位論文要旨



No 125508
著者(漢字) 佐々木,直文
著者(英字)
著者(カナ) ササキ,ナオブミ
標題(和) 位置プロファイル法に基づくゲノム構造進化の解析
標題(洋) Analysis of genomic structure evolution using positional profile method
報告番号 125508
報告番号 甲25508
学位授与日 2010.03.24
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第957号
研究科 総合文化研究科
専攻 広域科学専攻
論文審査委員 主査: 東京大学 教授 佐藤,直樹
 東京大学 教授 池内,昌彦
 東京大学 教授 陶山,明
 東京大学 教授 和田,元
 東京大学 准教授 道上,達男
内容要旨 要旨を表示する

はじめに

ある一つの共通祖先から系統分岐した近縁の2つの生物種のゲノムは,遺伝子のセットも互いに類似していると考えられる.これらの互いに共通祖先からの派生関係にある遺伝子はオルソログと呼ばれている.これらオルソログのそれぞれのゲノム上における位置の対応関係を比較することで,ゲノム間の構造的進化を見ることができる.近年のシークエンス技術の発展により解読済みのゲノム数は急激に増加しており,それに伴い,ゲノム比較解析によるゲノムの構造的進化の様子が明らかになりつつある.しかし,遺伝子の配列進化に関しては既に確立された理論があるのに対し,ゲノムの構造的進化については未知であることが多い上に解析技術も発展の余地がある.本研究において,著者は近縁種のゲノムを網羅的に比較することにより,これらのゲノム構造を可視化する手法の開発を行い,ゲノム構造の進化的側面を明らかにすることを目的とした.また,解析の結果を組み込んだデータベースを開発した.

ゲノムの構造的進化はゲノムの一部の領域が別の領域と入れ替わるゲノム再編成 (genomic rearrangement) が深く関係しており,その様子は遺伝子の並び方の共通部分(シンテニー)を検出することによって見つけることができる.シンテニーを探索するための計算機科学的な手法の多くは,遺伝子を頂点,遺伝子の隣接関係と見なすことで,シンテニー探索を頂点と辺の集合から構成された「グラフ構造」の探索問題に帰着させている.しかし,このアプローチは近傍の情報に重点が置かれているため,互いに離れた位置にある遺伝子間の距離関係まで考慮することができない.グラフ探索法にはこのような欠点があるものの,これまでの類縁関係の遠いゲノム間の比較の結果から一般にゲノム間の進化的距離が離れると急速にシンテニーが崩れ,その断片がゲノム上にランダムに分布することが知られていたため,この問題点は重要視されていなかった.

本研究ではこの点に着目し,近傍だけでなくゲノム上で離れた位置も含め,遺伝子が同期的に移動する現象を検出することを目的とした.このため,従来のグラフ探索のアプローチではなく,多変量解析の考え方を応用することで,ゲノム間での遺伝子の位置関係について同期的挙動を示す遺伝子のグループ(Virtual Linkage Group, VLG)を抽出する手法について検討し,新規手法である「位置プロファイル法」を開発した.さらに,開発された手法を海洋性シアノバクテリア14種のゲノムに適用した結果,これらのゲノム間に存在するVLGを検出することができた.さらにそれぞれのゲノム上におけるVLGの位置を見ることにより,ゲノムの構造的進化を可視化することに成功した.

方法

本研究で開発した手法は,比較に使用するゲノム間に共通なオルソログを含んだ,ホモロジークラスターのデータとゲノム上の遺伝子の位置情報を基に,オルソログ間の距離関係のプロファイルを作成し,これを多変量解析を用いて統計的性質から分類する手法である.入力となるデータセットは本研究室において開発されたGclustデータベースを利用した.それぞれのゲノムに含まれる全オルソログ遺伝子間の距離の分散を計算して得られた非類似度行列を基にクラスタリングを行ったところ,8個のクラスターが得られた.多次元尺度法 (Multi Dimensional Scaling, MDS)による可視化の結果,これらのクラスターが比較に使用した全ゲノムを重ね合わせた「仮想ゲノム」における遺伝子の位置関係を反映していることが明らかになったため,このクラスターを'Virtual Linkage Group (VLG)'と呼ぶことにした.本手法を海洋性シアノバクテリアに適用した結果,それぞれのゲノム上で,同じVLGに属する遺伝子が断続的に隣接していることが分かったため,この隣接関係が連続している範囲を推定する手法を,HMM(隠れマルコフモデル)をベースとして開発した.

海洋性シアノバクテリアのゲノムのモザイク構造

シアノバクテリアは酸素発生型の光合成を行うバクテリアである.そのなかで海洋性のシアノバクテリアであるProchlorococcus属とSynechococcus属は,光条件や栄養条件といった生息環境の違いによっていくつかの生態型(ecotype)に分類することができ,これらについて研究が行われている.これらの生態型は16S rRNAと23S rRNA間領域のDNA配列(internal transcribed spacer sequence)を用いた分子系統解析の結果から,互いに近縁であることが知られている.海洋性シアノバクテリアを含め,幾つかの近縁種や変異株などの非常に近縁なゲノムの網羅的比較解析の結果,これらのゲノム間には,同属の種間においても驚くほどの多様性があることが明らかになっている.これらのゲノムにおいては近縁種間で保存されている安定な領域(ゲノム・コア)と,不安定な領域(ゲノム・アイランド)の2つの性質の異なったゲノム領域が存在していることが知られているが,本研究で開発した位置プロファイル法を海洋性シアノバクテリアのゲノムに適用した結果,得られたVLGが特にゲノム・コアの再配置ブロックに対応していることが明らかとなった.さらに,得られたVLGのパターンを分子系統樹に対応させて比較検討したところ,近縁のゲノム間ではシンテニー内のVLGのパターンがほとんど同じであり,進化的距離が離れるに従って,VLGの連続領域を単位としてゲノム再編成が起きていることが分かった.またProchlorococcus属において,光適応条件が類似したゲノムのシンテニーマップは類似しており,このことは,ゲノム構造と生息環境との間の相関を示唆している.

ゲノムの構造的な制約に関する解析

本研究において明らかとなった,海洋性シアノバクテリアゲノムのVLGのパターンの観察から,VLGが連続的に存在する領域はゲノムの骨格のようなものであり,付加的遺伝子はこの領域の間隙に寄せ集まるように存在していることが分かったが,これは,他の研究で報告されているように,ゲノム・アイランドが水平移動遺伝子を多く含んでいることとも一致しており,VLGコア領域のパターンによって,ゲノムの構造とその構造の進化について視覚的にもアプローチすることが可能になった.著者は,VLGのパターンの構造をよりはっきりさせるため,VLGが連続した領域を推測する手法を,HMM(隠れマルコフモデル)をベースとして開発した.HMMでは内部的な情報として確率構造が必要であり,連続領域推定の最適化は確率構造の最適化に対応している.本手法ではこの確率構造を最適化するために反復Viterbi法を用いた.この手法を前述の海洋性シアノバクテリアのVLGパターンに適用した結果,ゲノム全体のVLGのモザイク構造をより明確に可視化することに成功した.

本研究ではさらに,これらのVLGパターンが安定である理由について,ゲノムの構造的側面からアプローチした.ゲノムの一定区間のグアニン-シトシン塩基対におけるコーディング鎖でのグアニンの出現頻度の偏りはGC skewと呼ばれており,バクテリアではこの値の最大値と最小値がそれぞれ染色体複製開始点 (ori) と,複製終点 (ter) の位置にあたることが多い.アデニン-チミン塩基対においても同様の結果が得られるため,両者はあわせてGC/AT skewと呼ばれている.本解析で得られたVLG遺伝子と,GC/AT skewから予測されたori,terからの距離を測定し,統計を取ったところ,VLG遺伝子はVLG毎にori,terから一定の距離に多く分布していることが明らかになった.また,それぞれのVLGに含まれる遺伝子の機能分類を調べたところ,VLG毎に特徴的な機能遺伝子が含まれていることが明らかになった.

VLG情報のCyanoClustデータベースへの取り込み

シアノバクテリアは葉緑体の細胞内共生の起源と考えられている生物であり,葉緑体の進化を考える上で重要な生物である.しかし,葉緑体とシアノバクテリアを繋ぐような比較ゲノムに特化したデータベースは存在していなかった.そこで本研究では光合成生物の比較ゲノム解析のプラットフォームとして,Gclustデータベースの派生である,CyanoClustデータベースに本研究によって得られたVLGの情報を取り込み,インターネット上のウェブサービスとして公開した.CyanoClustに含まれるクラスターの内,917個のオルソログに対してVLG番号を割り当てることができた.本データベースは,他にもオルソログの系統解析機能等が実装されており,ゲノム比較解析における,オルソログの機能アノテーション付加等の解析プラットフォームとして利用できることが期待される.

まとめ

本研究で開発された新規手法である「位置プロファイル法」の,海洋性シアノバクテリアへの適用で得られたVLGコア領域のパターンの可視化により,これまで見過ごされてきた,ゲノムの骨格領域の再編成の様子が明らかになった.このことは本手法の有用性を示している.また,VLG遺伝子のori,terからの距離関係は,これまでランダムであると考えられてきたゲノム再編成が,ゲノム構造の制約を受けている可能性を示唆した.さらに,VLGと遺伝子機能との関係は,細胞の活動とゲノムの構造との関連を示唆しており,これらのことから,ゲノム比較によって明らかとなるゲノム構造とその進化が生物にとって重要な意味を持っていることが示唆された.(3994字)

審査要旨 要旨を表示する

本論文は,ゲノムの進化をゲノム構造の比較によって推定するための新たな手法の開発と近縁バクテリアの解析への適用について述べたもので,5章からなる。第1章では,生物進化をゲノムの進化によって解明するという方法論に関するこれまでの研究のレビューがまとめられている。ゲノムの進化を解析するには,異なるゲノム間で対応する遺伝子(オルソログ)を決める必要があること,オルソログの並び方(シンテニー)によってゲノムの進化を推定する方法として,従来は直接隣接した遺伝子をたどってゆくグラフ探索法が用いられているが,ゲノムの個数やサイズが増加するにつれて,探索はきわめて困難になること,などが述べられ,本研究では,これに変わる方法として,ゲノム全体にわたる遺伝子の距離関係の統計を利用することが提案されている。

第二章では,論文提出者の考案した位置プロファイル法について,理論的な背景を含めて詳しく述べられている。この方法では,任意の2個のオルソログの距離関係を比較対象とするゲノムのそれぞれについて求めた上で,それらの偏差の二乗和(分散)を非類似度の測度として定め,これに基づいてオルソログを多次元尺度法によって仮想空間上にマップする。このとき,シンテニーブロックの緩いつながりが仮想空間上でひとまとまりになることを利用してクラスタリングを行い,全てのオルソログを仮想連鎖群(VLG)に分類した。この場合,オルソログの距離関係を表すベクトル同士のユークリド距離を用いても仮想空間上にほぼ円形の仮想ゲノムを再構築することができるが,VLG を分類するのには適当でないことが示された。本手法によって検出できるのは,どのゲノムの上でもほぼ同じ程度はなれたオルソログの対と考えられ,これをisoapostasy(距離が同じであること)と名付けている。

第三章では,位置プロファイル法を用いて実際に海洋性シアノバクテリアのゲノムを分析した例が示され,この方法の有効性が実証されている。海洋性シアノバクテリアのゲノムは,8個のVLGからなる。VLG を実際のゲノムの上に逆投影してみると,一つのVLG があるバクテリアのグループではひとまとまりになっているが,別のグループでは2つに分離している例が見られ,VLG がゲノム再編成のマーカーとして有効であることが示された。また,長く連なったVLG 領域とVLG領域の間には水平移動によって他の生物からもたらされたと見られる共通オルソログがマップされない領域があり,これは従来ゲノムアイランドと呼ばれてきた領域に対応することも示された。

第四章では,第三章で推定されたVLG 領域をゲノム上で明確な領域として確定するための新たな手法として,隠れマルコフモデルを利用する方法が紹介され,これにより,ゲノムの構造的進化がよりビジュアルに理解しやすくなった。さらに現実のゲノム解析への利用例として,CyanoClustサーバーの構築について述べられ,この中で,VLG 情報を付加することによって遺伝子機能の注釈付け(アノテーション)が効率よくできるようになることが提案されている。

最後の第五章では,これまでの章での解析結果を踏まえ,位置プロファイル法によって得られる情報の吟味と,シアノバクテリア以外のバクテリアへの本手法の適用可能性について言及している。特に手法そのものの検討としては,本手法が当初isoapostatic な関係にあるオルソログ群を検出するのに有効と考えられたにも関わらず,実際にはそうした遺伝子はわずかで,VLG で示されるようなかなり長いゲノム領域にわたってオルソログのシンテニー関係が緩く保たれている領域を見いだすことができた点は,結果的にはゲノムコアと呼ばれるゲノム間で比較的よく保存されているブロックを浮かび上がらせることになり,これはゲノム構造の進化を考える上で有効な指標となることが結論された。

以上のように,本研究は,ゲノム進化をこれまでにない新しい統計的手法によりグローバルに解析しようとするもので,内容的にも斬新であり,また,得られた結果の例もビジュアルにわかりやすいなど,その研究内容は高く評価される。本論文の主要部分である第二・第三章を中心とした部分は,ゲノム進化研究の専門誌として2009 年に創刊されたGenome Biology and Evolution 誌に掲載され,また,第四章のVLG の応用についてはDatabase 誌に掲載されるなど,その成果は学界にも広められている。

なお,これらの出版論文は指導教員である佐藤直樹との共著であるが,論文申請者の寄与が十分であると判断される。

したがって,本審査委員会は博士(学術)の学位を授与するにふさわしいものと認定する。

UTokyo Repositoryリンク