学位論文要旨



No 119992
著者(漢字) 大西,啓介
著者(英字)
著者(カナ) オオニシ,ケイスケ
標題(和) 反復構造をもつ遺伝子の多様性と進化に関する研究
標題(洋) Study on Evolution and Diversity of the Genes with Tandemly-Duplicated Structures
報告番号 119992
報告番号 甲19992
学位授与日 2005.03.24
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第4721号
研究科 理学系研究科
専攻 生物科学専攻
論文審査委員 主査: 東京大学 教授 植田,信太郎
 国立情報学研究所 教授 藤山,秋佐夫
 総合研究大学院大学 助教授 颯田,葉子
 東京大学 助教授 石田,貴文
 東京大学 教授 久保,健雄
内容要旨 要旨を表示する

1. DSCAM遺伝子の進化

 ショウジョウバエ (Drosophila melanogaster ) の DSCAM 遺伝子は神経系で重要な役割を果たす遺伝子である。本遺伝子は Exon 4, 6, 9, 17 内の各メンバーが反復した構造をもち(Alternative Exon)、選択的スプライシングによってそれぞれから1つずつのエキソンを選ぶことにより、3万種以上の mRNA を生じうる(図1上)。まず DSCAM 遺伝子のゲノム構造をゲノムのドラフト配列が公開されている Drosophila 属の3種 (melanogaster・yakuba・pseudoobscura) で比較解析した。その結果、多くのエキソンは3種間で高度に保存されているものの、Exon 6 においては、yakuba で特異的に失われたメンバーがいくつも存在することが明らかになった。次に、ドラフト配列が公開された昆虫4種(ショウジョウバエ (Drosophila melanogaster)・ハマダラカ (Anopheles gambiae)・カイコ (Bombyx mori)・ミツバチ (Apis mellifera))に加え、自分自身がdegenerate PCR により増幅し、Alternative Exon 4, 6, 9 の配列を決定したアブラムシ(Acyrthosiphon pisum) の配列を用い、比較解析した(図1)。その結果、選択的スプライシングを受けないエキソンのアミノ酸配列は昆虫の種間で高度に保存されていた。しかし、Alternative Exon 4, 6, 9, 17 のそれぞれで分子系統樹を作成したところ、Exon 17を除き、目・科のレベルではそれぞれの系統特異的に大部分のエキソンが進化していることが明らかになった(例:図2)。さらに、本当にこれらAlternative Exon の大部分が組み合わせによるトランスクリプトームの多様性に寄与しているかどうかを確認するため、ミツバチとアブラムシでそれぞれ 44, 66クローンの cDNA の塩基配列を決定した。その結果、予想通りいずれの種でも様々にエキソンが組み合わせられていることが確認された。また、ハチにおいてはスプライシングのエラーが多い(Exon 6 のメンバーのうち2つ以上が1つの成熟型 mRNA に含まれていたり、イントロンの切り離しが正確でなかったりする)が、アブラムシではエラーが少ないことも明らかとなった。

 次に、エキソン反復構造をもたないが昆虫の DSCAM 遺伝子と同じドメイン構造(図3(A):10個の Igドメインと 6個の FN IIIドメイン)をもつ遺伝子が脊椎動物でも知られており(DSCAM と DSCAML1)、これらと昆虫のDSCAM 遺伝子を用い、解析をおこなった。IgドメインとFN IIIドメインそれぞれのみを用いて作成した分子系統樹(図3(B):FN IIIドメインの系統樹)において、大部分のドメインが種間でクラスターを形成したことから、脊椎動物の DSCAM と DSCAML1 遺伝子は昆虫 DSCAM 遺伝子と相同な関係にあることを明らかにした。さらに、同じドメイン構造をもつにもかかわらず、エキソン反復構造をもたない遺伝子が昆虫でもいくつか知られており、これらも用いて 遺伝子全長で分子系統解析をおこなうことにより、DSCAM 遺伝子自体の重複は脊椎動物、無脊椎動物の両方でそれぞれ独立に何度も起こり、またAlternative Exon は昆虫の1つの遺伝子においてのみ生じたことが明らかになった。

2. 直列反復構造をもつ遺伝子

 次に私はヒトゲノム中にも、反復構造をもち、かつ脳で重要な機能を果たす未知の遺伝子構造が存在し、それがトランスクリプトームやプロテオーム、インタラクトーム多様性の一端を担っているのではないかと考えた。そこで、ショウジョウバエDSCAM 遺伝子領域の Dot Plot ではエキソン反復領域特異的に『正方形状』のプロットが生じる(図4)ことに注目した。この Dot Plot を用い、ヒトおよびショウジョウバエの全ゲノム配列中から反復構造の検出をおこなった。Dot Plot を用いることで DSCAM 遺伝子と相同性がない反復構造にまで検出を一般化した。本解析の結果、ヒトゲノムにおいてショウジョウバエゲノムよりもはるかに多くの反復構造を検出できた(表)。ドメインの反復構造をもつような遺伝子はヒト、ショウジョウバエとも比較的多くを検出でき、これらの中には構造タンパク質が非常に多く見られた。遺伝子の反復構造としては、タンパクコード、非コードともヒトの方がショウジョウバエよりもはるかに多くの構造を検出できた。エキソン(あるいは gene fragment)の反復をもつ遺伝子構造としては、ヒトの方が多くのものを検出できた。しかし、ショウジョウバエの DSCAM 遺伝子のように、複数の Alternative Exon のクラスターをもつ未知の遺伝子構造は検出することができなかった。また、ショウジョウバエではほとんど検出できなかったが、ヒトでは、機能未知であるが何らかの機能をもつ可能性が高い、反復構造をいくつか検出することに成功した。

 その一例が図5に示した 150kb 近くにおよぶ反復構造である。本領域はマウスにも対応する領域が存在する。しかしヒトとマウスではプロットの形が大きく異なる(図5(A))。本領域に含まれる反復因子を詳しく解析したところ、ヒトとマウスの因子間では局所的にのみ相同性があることが分かった。また、ヒトでは反復因子が2つ反対向きに並ぶ、回文状の構造をいくつももつが、マウスではすべての因子が同方向であることが明らかとなった(図5(B))。さらにマウスにおいては、反復因子の大部分をイントロン内に、一部をエキソン内に含むような、機能未知の non-coding RNA(ncRNA)が存在することも明らかとなった。

 以上のヒトゲノム解析により発見された機能未知の反復構造のうち、もう1カ所に関し、次に詳細に解析をおこなった。

3. ヒトのncRNAクラスター

 Dot Plot によるヒトゲノム解析により見つかった領域のうち、最も興味深いのが図の領域である(図6(A):ncRNA 複合領域)。1辺が 20kb 以上のプロットが生じる頻度はヒトゲノム中でまれにもかかわらず、本領域はこのようなプロットが 200kb 以内に3つも並ぶという、昆虫 DSCAM 遺伝子領域(図4)に似た、極めて特異な構造をもつ。しかし、DSCAM 遺伝子とは違い、3つのプロットとも明らかに読み枠 (ORF) をもたない。本領域はフグ・ニワトリ・オポッサムのゲノム中には相同性のある領域が確認できなかったが、マウス・ラット・イヌ・ウシのゲノム中には明確に 1:1 に対応する領域が見つかった(図6(B):ヒト-マウス)。解析の結果、クラスター (1) と (2) は small nucleolar RNA (snoRNA) の反復構造であることが明らかとなった。これらの反復因子の塩基配列を哺乳類4種において取り出し、分子系統解析をおこなった。まずクラスター (1) では、ヒト・イヌ・ウシでは比較的保存性が高かったが、マウス・ラットではそれぞれの系統特異的な進化を果たしたメンバーが大部分を占めた。一方、クラスター (2) では、ヒト・イヌ・ウシのそれぞれの系統間でも昆虫の DSCAM 遺伝子(図2)と同じように、大部分のメンバーが特異的な進化を果たしたことが明らかとなった(図7)。

 次に、クラスター (3) のメンバー1つがマウス脳由来の既知 microRNA (miRNA)と完全に一致したことから、クラスター (3) は驚くべき構造をもった miRNA クラスターであることが明らかとなった。本クラスターのヒトパラローグ間の塩基配列の相同性は平均 60% と多様性が高い。しかしマウス 23 個中 22 個でヒトに相同な配列があり、前駆体領域において大部分の配列が高度に保存されていた(図8:黒)。それ以外のうちヒト 7 個はマウスゲノム中に対応するものが見つからず、そのうちいくつかはイヌゲノム中にも存在しないことから、ヒトの系統特異的に生じた可能性が高い(図8:赤)。次に、前駆体2次構造の自由エネルギーの値を既知 miRNA のそれの分布(図9(A)) と比較した。既知 miRNA においてはこの値が -20kcal/mol より大きいものはほとんど存在せず、-15kcal/mol より大きいものは1つも知られていない(図9(A):青い領域)。本 miRNA クラスターに含まれるメンバーの大部分は -30kcal/mol よりも小さな値をとる。しかしマウスの2つに関しては、この値が -15kcal/mol より大きく、非常に不安定である(図9(B))。またヒトにおいてもこの値に近い、かなり不安定な前駆体をもつものが2つ存在する。このことから、いくつかのメンバーにおいて、ヒトとマウスそれぞれの系統で独立に miRNA の偽遺伝子化が起こった可能性が高いことが明らかとなった。

<図1>昆虫DSCAM遺伝子のゲノム構造比較

白は各エキソンクラスター内のメンバー数があきらかなもの、

黒はゲノム配列の不完全さにより、実際にはさらにメンバーが多い可能性があるものを示す。

<図2>昆虫DSCAM遺伝子

Exon9の分子系統樹(NJ法)

<図3>DSCAM遺伝子の機能ドメインにもとづく分子系統樹(NJ法)

(A)タンパク質の構造(FNIIIドメイン)

(B)FNIIIドメインの分子系統樹

<図4>ショウジョウバエDSCAM遺伝子領域のDot Plot

<表>Dot Plotによる全ゲノム解析により検出された遺伝子構造(一部)

<図5>ヒトの機能未知の反復構造の一例

(A)ヒトとマウスのDot Plot(B)反復因子のゲノム上の構造

赤と緑はそれぞれヒトとマウスの反復因子をあらわす。互いの因子間には局所的に相同性がある。

<図6>ncRNA複合領域Dot Plot(A)ヒト−ヒト(B)ヒト−マウス

<図7>snoRNAクラスター

(図6の(2)の分子系統樹(NJ法)

<図8>miRNAクラスター(図6の(3))

赤は霊長類にあってげっ歯類にはないもの、

緑は霊長類にコピー数が多いものを示す。

<図9>miRNA前駆体2次構造の自由エネルギー解析

(A)ヒト既知miRNAの前駆対2次構造の自由エネルギー分布

(B)miRNAクラスター内で前駆体2次構造が不安定なもの

審査要旨 要旨を表示する

 本論文は4章からなり、第1章は論文概要について、第2章はDSCAM遺伝子の多様性と進化について、第3章はヒト全ゲノム配列をもちいて解析したヒトゲノム中の直列重複している遺伝子の構造について、第4章はヒト14番染色体上に位置している非翻訳RNAクラスターの進化について,述べられている。

 ショウジョウバエのDSCAM 遺伝子はエキソン4、6、9、17の各メンバーが反復した構造をもち、選択的スプライシングによってそれぞれから11つずつのエキソンを選ぶことにより、3万以上のmRNA を生じうる。DSCAM 遺伝子のゲノム構造をショウジョウバエの3種(melanogaster・yakuba・pseudoobscura)で比較解析し、多くのエキソンは3種間で高度に保存されているものの、エキソン6ではyakubaで特異的に失われたメンバーがいくつも存在することを明らかにした。次に、昆虫4種(ショウジョウバエ、ハマダラカ、カイコ、ミツバチ)に加え、自身が配列決定したアブラムシの配列を用いて比較解析し、選択的スプライシングを受けないエキソンのアミノ酸配列は昆虫の種間で高度に保存されていること、エキソン17を除き目・科のレベルではそれぞれの系統特異的にエキソン重複が生じたこと、を明らかにした。さらに、ミツバチとアブラムシそれぞれでcDNAの塩基配列を決定し、いずれの種でもこれらエキソンが様々に組み合わせられてトランスクリプトームの多様性に寄与していることを示した。また、ハチにおいてはスプライシングのエラーが多いのに対し、アブラムシではエラーが少ないことも明らかにした。

 次に、トランスクリプトーム、プロテオーム、インタラクトーム等の多様性の一端を担う未知の反復構造をヒトゲノム中から探索することを目的として、ヒト全ゲノム配列の自己ドットブロットを作成した。その結果、1)ヒトゲノムにおいてショウジョウバエゲノムよりもはるかに多数の反復構造が存在する、2)ドメインの反復構造をもつ遺伝子はヒト、ショウジョウバエとも多く、構造タンパク質が主である、3)エキソンあるいは遺伝子断片の反復をもつ遺伝子はヒトの方が多い、4)しかし、ショウジョウバエDSCAM遺伝子のような複数のAlternative Exon のクラスターをもつ未知の遺伝子構造はヒトゲノム中からは検出できなかったが、機能未知ながら何らかの機能をもつ可能性が高い反復構造が複数存在する、こと等を明らかにした。

  上記で得られた未知の反復領域のうち、1辺が20kb 以上のプロットが200kb 以内に3つ並ぶ極めて特異な反復構造をもつ領域を詳細に分析した。3プロットとも読み枠をもたず、フグ・ニワトリ・オポッサムのゲノム中には相同性のある領域が確認できなかったが、マウス・ラット・イヌ・ウシのゲノム中には明確に1:1に対応する領域が見つかった。解析の結果、クラスター1とクラスター2はsnoRNAの反復構造であった。哺乳類4種における分子系統解析の結果、クラスター1はヒト・イヌ・ウシで保存性が高かったが、マウス・ラットではそれぞれの系統に特異的な進化を果たしたメンバーが大部分を占めることを示した。一方、クラスター2は大部分のメンバーがヒト・イヌ・ウシのそれぞれの系統で特異的な進化を果たしたことが明らかとなった。クラスター3はメンバーの1つがマウス脳由来の既知miRNAと配列が完全に一致したことから、miRNA反復クラスターであることが明らかとなった。本クラスターのヒトパラローグ間の塩基配列の相同性は平均60%と多様性が高い。しかしマウス23メンバー中22メンバーでヒトに相同な配列があり、前駆体領域において大部分の配列が高度に保存されていた。それ以外のうちヒト7メンバーはマウスゲノム中に対応するものが見つからず、そのうちいくつかはイヌゲノム中にも存在しないことから、ヒトの系統特異的に生じた可能性が高い。前駆体2次構造の自由エネルギーの値から、ヒトとマウスそれぞれの系統で独立にmiRNAの偽遺伝子化が起こった可能性を強く示唆する結果を得ている。

 以上、本研究は反復構造をもつゲノム情報を全ゲノムにわたり網羅的かつ詳細に解析した点で、極めて先進的かつ野心的であるとの非常に高い評価を受けた。なお、本論文第4章は植田信太郎との共同研究であるが、論文提出者が主体となって分析および検証を行ったもので、論文提出者の寄与が十分であると判断する。

よって、博士(理学)の学位を授与できると認める。

UTokyo Repositoryリンク