学位論文要旨



No 216920
著者(漢字) 片山,慎太郎
著者(英字)
著者(カナ) カタヤマ,シンタロウ
標題(和) マウス・トランスクリプトームにおけるアンチセンス転写とmRNA-like noncoding RNAの関係
標題(洋)
報告番号 216920
報告番号 乙16920
学位授与日 2008.03.05
学位種別 論文博士
学位種類 博士(生命科学)
学位記番号 第16920号
研究科
専攻
論文審査委員 主査: 東京大学 教授 北村,俊雄
 東京大学 教授 小林,一三
 東京大学 教授 菅野,純夫
 東京大学 教授 中井,謙太
 東京大学 教授 渡邉,俊樹
内容要旨 要旨を表示する

ヒトゲノムの解読プロジェクトは1991年から始まり、2000年6月にドラフト配列を発表した後、2003年4月には全作業を終了した。国際ヒトゲノムコンソーシアムの解析によれば、生命を形作るために必要な約 22,000個の遺伝子に含まれるタンパク質の情報は、ゲノム中僅か1.5%程度の領域を占めるに過ぎなかった。しかし、この1.5%およびその周辺にある僅かな遺伝子発現制御領域だけで高度に複雑化されたヒトの生命活動を実現しているとは、にわかには信じがたい話であった。

一方、ゲノムからの転写産物の総体であるトランスクリプトームに目を移すと、1.5%のゲノム領域を遥かに超える多種多様なトランスクリプトの存在が示唆されており、生物が非常に非効率的であると思える程であった。例えばKampaらは、ヒト21, 22番染色体のゲノムタイリングチップを用いて11の細胞株のポリ(A)テールを持つトランスクリプトームを解析したところ、トランスクリプトが検出された領域の半分は、公共データベースに登録されているmessenger-RNA(mRNA)のいずれとも一致しない事を示した。また我々も完全長complementary DNA(cDNA)ライブラリ の技術を用いて、約300のマウス由来組織および細胞株のトランスクリプトームを解析し、ゲノムの62%が転写されていることを明らかにした。

そしてゲノムおよびトランスクリプトーム研究の進展により、2つの新しいトランスクリプトに関心が寄せられるようになった。1つはmRNA- like noncoding RNA (ncRNA)であり、これはmRNA同様ポリメラーゼIIで転写されキャップ構造とポリ(A)テールを持つものの、有効なopen reading frame(ORF)が存在しないトランスクリプトである。沼田らは、当時発表されていたマウスのトランスクリプトームからncRNAとして信頼度の高い4,280個に絞り、それらがCpG含有量の高い領域から転写されている傾向がある事を示した。Wangらは、これらncRNAの配列がその他ゲノム中の遺伝子間領域と同程度の進化速度である事を示し、一方我々は最新のマウス・トランスクリプトームに含まれるncRNAのtranscription start site(TSS)について解析を行い、TSS近傍の保存性が高い事を明らかにした。また今西らは当時発表されていたヒトのトランスクリプトームから1,377のncRNAを特定し、また前述のKampaらは、得られたヒト新規トランスクリプトのうち75bp以上のORFはせいぜい24%程度である事を示した。

ゲノムおよびトランスクリプトーム研究の進展により関心が寄せられたもう1つのトランスクリプトは、アンチセンスRNAである。あるトランスクリプトをコードするDNA鎖(センス鎖側)の逆鎖から転写され、センス鎖側のトランスクリプトと部分的もしくは全体的に2本鎖RNAを作る可能性がある。清澤らは、当時発表されていたマウスのトランスクリプトームから、sense-antisense(S/AS)のペアを2,481個特定し、imprintingを受ける遺伝子とS/ASペアに関連がある事を示した。Chenらは、当時発表されていたヒトのトランスクリプトームから、約20%の遺伝子にアンチセンスRNAが存在している事を明らかにした。またChengらは、ヒトの10本の染色体に対して設計したゲノムタイリングチップを用いて特定した新規トランスクリプトから768個をランダムに選びさらに実験的検証を行った結果、61%に両鎖のトランスクリプトが存在している事を明らかにした。

ゲノムワイドなトランスクリプトーム解析が行われるまでは、ncRNAとアンチセンスRNAいずれも数十個程度しか発見・機能解析がなされておらず、遺伝子発現制御に関わる要素ではあったが、その数からごく特別な事例であると考えられていた。またゲノムワイドなトランスクリプトーム解析の後大量のncRNAおよびアンチセンスRNAが特定されてからも、その大部分は機能未知のままであった。しかしゲノムの1.5%を遥かに超える領域にコードされ、そして実際に転写されているncRNAおよびアンチセンスRNAは、果たして生命活動に無関係なジャンクなのであろうか?

本研究では、前述した新しいトランスクリプト、ncRNAとアンチセンスRNAについて解析を行う。まずアンチセンスRNAについてであるが、アンチセンスRNAが多く存在している事はこれまでの解析でも示唆されているが、これを最新のマウス・トランスクリプトームを元に再度確認する。特に、マイクロアレイベースだけでなく、cDNAのシーケンスベースでも検証を行う事は、得られた事象の信頼度を高める点において価値がある。またこれまでのアンチセンスRNAの解析が、様々なサンプルから得られたトランスクリプトを同列に並べたものであったり、ごく少数の細胞・組織サンプルだけを用いた物であったりしたので、同一組織や細胞群の中での一般性が不明瞭である。そこで90サンプルから得られたcap analysis gene expression(CAGE)法による転写開始点レベルでの発現プロファイリングデータを用いて、アンチセンス転写の共発現性を考察する。

次にncRNAについてであるが、ゲノムタイリングチップの解析によると新規トランスクリプトの多くがncRNAであり、また多くの新規トランスクリプトで両鎖からの転写が重なるように発現していた事から、cDNAによるシーケンスベースでもncRNAとアンチセンス転写の関係性について考察する。

またその関係性に基づき、アンチセンスRNAとncRNAの発現動態を把握して機能解析につなげる為に必要な、新しい発現プロファイリングツールを提案する。

そしてこれらの解析の結果、まずncRNAとアンチセンス転写の関係性については、マウスゲノムには遺伝子数とほぼ同数のnoncoding TUが存在し、それらnoncoding TUはゲノムDNAの混入による人工産物ではなく、その23%(端読み配列を含めると59%)がS/ASペアを形成して、またcoding TUとdivergentもしくはfull-overlapする傾向にある。そしてdivergent S/ASペアは共発現する傾向にある。またS/ASペアはパートナーの発現量を活性化もしくは抑制している事が分かった。そして発現プロファイリングツールとしては、mRNAのキャップ構造からラベルしたトランスクリプトを、TSS直下流にデザインしたプローブへhybridizationさせるCAGE-TSSchipというマイクロアレイを開発した。プロトコール自体は、dye-swap間で良い相関を示す程度に完成しており、優位差を示すTSSについてはqRT-PCRおよびCAGEと一貫した結果を示し、また必要感度に応じて増えるCAGEのシーケンスコストに比べ良いコストパフォーマンスを持ち、さらには活性に大きな差のあるTSS近傍のプローブが有意差を示す事を示した。またCAGE-TSSchipを用いてマウスの肝臓と肝臓癌由来細胞株Hepa1-6で活性に有意差のあるTSSを調べた所、細胞周期や癌マーカとして知られている遺伝子の5'UTRに存在するTSSがスクリーニングされ、またHepa1-6で有意に活性の高いTSSの近傍にはE2Fなど癌関連転写因子の結合サイトが頻出している事が分かり、CAGE-TSSchipにより妥当な発現制御エレメントをスクリーニングすることができた。さらにCAGE-TSSchipを用いてマウスの肝臓と小脳で発現量が有意に変動しているdivergent S/ASペアをスクリーニングした所、Rshl2aのlong isoform TSSとそのアンチセンスが逆相関するように発現変動している事が分かり、divergent S/ASペアの発現プロファイリング用途としての可能性も示した。

本研究の1つの成果は、翻訳されてタンパク質を作る事ではなく、転写される事が重要なトランスクリプトが、S/ASペアという形でゲノム上に大量にコードされている事を示した点である。トランスクリプトームプロジェクトの進展により既に多くの機能未知ncRNAの存在が指摘され、またゲノムプロジェクトの進展もあって既に多くのS/ASペアの存在が指摘されていたが、実はそれらは密接にリンクし、細胞群や組織内でncRNAを含むS/ASペアが共発現して、静的に見えた細胞の中で互いを制御しあっていることを指摘した点が新しい。つまり細胞の状態は転写因子やクロマチンの構造だけではなく、転写される事が重要なトランスクリプトによるアンチセンス転写においても規定され得る事を示唆している。転写される事が重要なトランスクリプトとしてncRNAを想定する事は、多くのncRNAが配列レベルでは保存性が低く、しかし転写開始点レベルでは保存性が高かった事実と矛盾しない。

本研究の2つ目の成果は、TSSレベルでアンチセンス転写やncRNAの発現量をコストパフォーマンス良く測定する技術としてCAGE-TSSchipを開発した事である。いずれ来るであろう次世代シーケンス技術と完全に競合する技術であるが、今後、これら新規トランスクリプトを含めた遺伝子発現制御ネットワークの解明に資するものと期待される。

審査要旨 要旨を表示する

本論文は2章からなり、第1章はアンチセンス転写とmRNA-like noncoding RNA(ncRNA)の関係性に関する統計的解析、第2章は転写開始点レベルでの発現プロファイリング技術開発について述べられている。

近年のゲノムおよびトランスクリプトームに関する研究によって、アンチセンス転写という現象と、ncRNAという新しいトランスクリプトの存在が知られるようになった。アンチセンス転写とは、ゲノムDNAのある方向(センス)からRNAを転写している領域に対し、逆方向(アンチセンス)から重なり合うように転写が行われる現象である。またncRNAとは、タンパク質の鋳型がコードされているmRNAと同様に転写されたRNAであるものの、鋳型となる部分が非常に短く、機能的なタンパク質の鋳型として機能することが疑われるRNAである。しかしこれまで、アンチセンス転写とncRNAの関係性について解析された事はなかった。

そこで論文提出者はまず、マウスのmRNAおよびncRNAから単離したcDNAとマウスゲノムDNAのデータから、アンチセンス転写とncRNAの関係性について考察した。その結果、マウスゲノム中にmRNAとほぼ同数のncRNAのコード領域が存在し、それらはゲノムDNAの混入によって導かれたartifactではなく、またそれらの23%(端読み配列を含めた解析では59%)がアンチセンス転写となる事を明らかにした。またmRNAとncRNAは5'端同士が重なるか、もしくは完全に重なり合うようなペアを作る傾向にあって、5'端同士が重なり合うペアは共発現する傾向にある事を明らかにした。さらに共発現しているアンチセンス転写についていくつか取り上げ、センス側の転写とアンチセンス側の転写は、互いに制御関係にある例を示した。

以上の結果から、mRNAおよびncRNAについて、その発現の様相を転写開始点レベルで測定する事は、アンチセンス転写およびncRNAの機能解析において重要である。そこで論文提出者は、mRNAおよびncRNAの5'端に存在するキャップ構造からラベルしたトランスクリプトを、既知の転写開始点直下流にあたるゲノムDNA配列を元にデザインしたプローブへhybridizationさせることで、転写開始点レベルでの発現プロファイルを得られるCAGE-TSSchipというマイクロアレイを開発した。プロトコルの安定性はdye-swap間の比較で示し、信頼性はqRT-PCRおよびCAGE法との比較によって示した。さらに、正常組織と癌由来細胞株の比較による発現制御エレメントのスクリーニングと、5'端同士が重なり合うようなセンス・アンチセンスペアの転写開始点レベル発現プロファイリング、2つのケーススタディを行った。

本研究の主な成果は、アンチセンス転写がゲノム上の多くの領域に存在し、かつアンチセンス転写にncRNAが深く関与していることを示したことである。またアンチセンス転写による制御関係の例を示したことで、アンチセンス転写およびncRNAの機能について新しい知見をもたらした。

なお本論文第1章は、外丸靖浩、粕川雄也、脇和規、中西美聡、中村真理、西田洋巳、Chan C. Yap、鈴木正則、河合純、鈴木治和、Carninci Piero、林崎良英、Christine Wells、Martin Frith、Timothy Ravasi、Ken C. Pang、Jennifer Hallinan、John Mattick、David A. Hume、Leonard Lipovich、Serge Batalov、Par Engstrom、水野洋介、Mohammad A. Faghihi、Albin Sandelin、Alistair M. Chalk、Salim Mottagui-Tabar、Zicai Liang、Boris Lenhard、Claes Wahlestedtとの共同研究であり、また本論文第2章は、金森睦、山口一美、Carninci Piero、林崎良英との共同研究であるが、論文提出者が主体となって分析および検証を行ったもので、論文提出者の寄与が十分であると判断する。

したがって、博士(生命科学)の学位を授与できると認める。

UTokyo Repositoryリンク