学位論文要旨



No 113983
著者(漢字) 鈴木,穣
著者(英字) Suzuki,Yutaka
著者(カナ) スズキ,ユタカ
標題(和) Oligo-Capping法を用いた完全長および5’端特異的cDNA libraryの作製と解析
標題(洋) Construction and analysis of full length-enriched and 5’-end-enriched cDNA libraries using the oligo-capping.
報告番号 113983
報告番号 甲13983
学位授与日 1999.03.29
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第201号
研究科 総合文化研究科
専攻 広域科学専攻
論文審査委員 主査: 東京大学 助教授 陶山,明
 東京大学 教授 浅島,誠
 東京大学 教授 大森,正之
 東京大学 教授 林,利彦
 東京大学 助教授 池内,昌彦
内容要旨 はじめに

 現在ゲノム計画の一環としてまたポストゲノムを睨んで、機能面からのゲノム解折というアプローチに注目が集まりつつある。ゲノムの機能解析とは、ゲノム上に存在する様々な機能単位のゲノム上での位置とその構造を明らかにしていくことに他ならない。その機能単位として最も重要であると考えられる遺伝子の情報に関して、mRNAの3’端に当たるものは、近年cDNAの大量解析によりEST(expressd sequence tag)の蓄積が進んでいる。しかしその一方で、mRNA5’端近傍についての情報はデータベース上に乏しい。これは大規模解析を行っているcDNA libraryの多くがGubbler-Hoffmann法により構築されているために、そのクローンの多くが5’端塩基配列を欠損したものであることに起因する。多くの場合データベース上のEST配列に、タンパク質翻訳開始コドンに関する情報が含まれないため、大量のESTデータが様々な機能解析と直結しているとは言い難いのが現状である。

 そこで、遺伝子の機能また発現制御の解析を試みる時、依然としてmRNA転写開始部位を決定する操作は不可欠である。その際、プライマー伸張法やRACE法といった手法が用いられるが、これらは原理的に存在する最長のcDNAを分離する手法であるため、mRNAの転写開始部位が複数ある場合にはそれを見逃すおそれがある等、mRNAの5’末端についての正確な情報を得ることは困難である。さらにこれらの方法を実際に用いるには、個々の遺伝子ごとの繁雑な作業が要求されるために、転写開始部位の決定されている遺伝子はごく少数に限られている。

 私は、Oligo-Capping法を基にmRNA転写開始部位を持つクローンの含有率が50-80%である完全長cDNA libraryおよび5’端特異的cDNA libraryを作成した。これらのcDNA libraryを解析することで、多数のmRNA転写開始部位の決定を行い、mRNAの転写開始部位を決定するステップを大幅に簡略化することができる。そのため従来不十分であったmRNA5’端近傍の情報を集中的に補完することが可能であり、従来のデータベースを相補するものとして新規遺伝子の発現および機能解析に役立てることができると考えている。

I.Oligo-Capping法を用いたcDNA libraryの作成

 真核細胞mRNAの5’端には、キャップ構造とよばれる特異的な構造が存在する。Bacterial Alkarine Phosphatase(BAP)は、このキャップ構造自体を解離させることはできない。そこでpolyA+RNAにBAPを作用させることにより、キャップ構造を持たないミトコンドリア由来のmRNAや断片化されたmRNAの5’端に突出したリン酸基を加水分解する。その後に、Tobacco Acid Pyrophosphatase(TAP)によりキャップ構造のトリリン酸結合を特異的に加水分解すれば、キャップ構造を持つmRNAのみに5’端リン酸基を残すことができる。T4RNA ligase(5’端リン酸基を基質として必要とする)を用いてBAP、TAPで順に処理したpolyA+RNAに対して合成オリゴを結合させれば、キャップ構造を持つmRNAの5’端にのみ選択的に合成オリゴを導入できる。

 5’端キャップ構造を合成オリゴに置換したmRNAを鋳型に、完全長cDNA libraryの場合はoligo-dTアダプター、また5’端特異的cDNAライブラリーの場合はrandomアダプターをプライマーとして第一鎖cDNA合成を行う。これをPCRで増幅した後、プライマー内のSfiI部位(5’側プライマーと3’側プライマーで断端配列が異なる)を切断してDraIII部位(5’側、3’側断端が各々SfiI切断断端に相補するため一方向性のクローニングが可能である)を持ったplasmidベクターへとクローニングし、完全長および5’端持異的cDNA libraryを作成する(図1)。

II.完全長および5’端特異的cDNAライブラリーの解析

 上述のスキームに基づき、何種類かの組織、細胞より抽出したmRNAより完全長および5’端特異的cDNA libraryを作成し、ランダムに選択したクローンのシークエンスを決定して既知遺伝子との相同性を検討した。各cDNA library間に若干の相違は認められるものの、cDNA library中に見いだされた既知遺伝子に対し、その5’端が含まれる割合は50-70%であったため、未知遺伝子に対しても同様の割合で完全長クローンが含まれていると考ている。

 完全長cDNA libraryの作製は、合成オリゴを5’端に持つmRNAを出発材料に用い、oligo-dTアダプターをプライマーとして第一鎖cDNA合成を行うことにより行う。そこで、reverse-transcriptaseおよびDNA polymeraseの限界を超えるほど合成オリゴとpolyA配列が離れている、すなわち長いmRNAのcDNAは完全長cDNA library中には含まれない。すなわち長いmRNAの転写開始部位の含まれない完全長cDNA libraryはmRNA5’端近傍の塩基配列情報の蓄積に用いるには必ずしも十分な系ではない。それを補完することができる系として、長いmRNAの5’端合成オリゴまでがreverse-transcriptaseおよびDNA polymeraseの活性限界内に含まれるようmRNAの途中から第一鎖cDNA合成を行う系、すなわち第一鎖cDNA合成にrandomアダプター(6merの任意塩基配列を持つ)を用いた5’端特異的cDNA libraryを作製した。このcDNA libraryからランダムに選択したクローンの塩基配列を決定したところ、約80%の頻度でmRNAの5’端が含まれていた。またこのcDNA libraryより得られたクローンはmRNAの3’側塩基配列を含まないものの、完全長cDNA library中には見いだすことが出来ないと考えられる全長が5kbを超えるmRNAの5’端塩基配列が含まれていた。

III.mRNA転写開始部位の同定と5’非翻訳領域の解析

 完全長cDNA libraryおよび5’端特異的cDNA libraryからランダムに約1万クローンのcDNAを選択し、ワンパスシークエンスを行った。得られた1010種類の既知遺伝子cDNAの5’端塩基配列と、データベース上に登録されているcDNAの5’端塩基配列との比較を行った。新たに得られた塩基配列はデータベース上のものより平均42bp上流に長く、これらは従来見出されていなかったmRNAの転写開始部位に相当するクローンであると考えられた。タンパク質鎖延長因子2(EF-2)について、データベース中のESTと我々のクローンとの比較を示す。データベース中のESTはmRNAの3’端に集中しており、mRNAの5’端近傍はほとんどカバーされていない(図2)。

 得られた5’端近傍の塩基配列を用いて5’非翻訳領域(5’UTR)の統計的、熱力学的解析を行った。5’UTRは平均120bpの長さを持ち、mRNA長に関係なく200bp以下の領域に集中していた。また18S ribosomal RNA3’端と5’UTRの結合エネルギーの分布を5’UTRに沿って計算した(図3)。多くの遺伝子に対して、両者は翻訳開始コドン近傍で比較的安定な複合体を形成することが示された。これらは真核細胞生物におけるタンパク質翻訳開始機構を熱力学的観点から解明する際、重要な知見となると考えられた。

IV.おわりに

 polyA配列を持つ3’端に対してmRNAの5’端は明確なsequence tagを欠いており、大量に蓄積しているESTの中、そのmRNAの5’端が明確に記載されている例は極めて少ない。そのために、データベース上の塩基配列が様々な生物学的研究に直結しているとは言い難いのが現状である。我々はOligo-Capping法をcDNA libraryの作成に応用し、完全長cDNA libraryおよび5’端特異的cDNA libraryを作成した。私はこれらのcDNA libraryを用い、遺伝子の機能解析というcDNAプロジェクトの本来的な目的に、より合致した形でのESTクローンの蓄積を試みている。

 21世紀初頭には全ゲノムシークエンスの決定が完了することが予想される。大量の塩基配列データと、実際に様々な生命現象を担う遺伝子の構造や機能とを関連づける試みとして、ゲノム情報分野における計算機アルゴリズムの開発も進展がめざましい。塩基配列1次情報の統計的処理によるORF予測、転写制御領域の識別、さらにはタンパク質立体構造予測等といったソフトウェアの開発に際し、基礎データとしてのESTは、正確に全コード領域を含むだけでなく、詳細に転写開始部位が決定されていることが望まれる。本論文に記載された方法により作成される5’ESTデータは、現在情報量の不足している転写開始領域に関して、その要求に1塩基レベルの精度で答えうると考えている。

Fig.I Scheme to construct a full length-enriched and a 5’-end-enriched cDNA libraries.Fig.II Comparison of the 5’-ends of EF-2 cDNA between the"Oligo-Capped"clones and the dbEST entries.The distribution was compared between the"Oligo-Capped"cDNA clones and the dbEST entries along the EF-2 mRNA.The sequences derived from the 5’-ends of"Oligo-Capped"cDNA clones(a)and the dbEST entries were aligned along with the EF-2 complete cNDA sequence shown above.The length of each bar corresponds to the reported sequence length.Fig.III Free energy distribution of the secondary structure calcu lated along the 5’UTR of RTK mRNA.a:The free energy was calculated using the 20 bases of the 5’UTR sequence of RTK mRNA with(blue line)or without(black line)the 3’-end of the 18S rRNA.The calculated sequence was slid along the 5’UTR to the 50 bases downstream to the CDS start site.The X-axes shows the center position of the sequence used for the calculation.b:The binding energy between the 5’UTR and the 18S rRNA was plotted along the 5’UTR.
審査要旨

 本論文は1編からなり、第1章では序論、第2章では実験の材料と方法、第3章IではOligo-Capping法を用いたcDNAライブラリーの作製方法とその特徴、第3章IIではcDNAライブラリーの大規模シーケンシングで得られた5’非翻訳領域を解析した結果について述べられ、第4章では得られた結果についての全体的な結論がまとめられている。

 第1章の序論では、本学位論文で行われた研究の背景と目的について述べられている。現在、ポストゲノムシーケンシングの研究目標として、ゲノムの機能解析が注目されている。ゲノム上の多数の遺伝子の機能および発現制御の解析を行うためには、それらのmRNAの転写開始部位を決定することが不可欠である。従来、プライマー伸張法やRACE法といった手法がそのために用いられているが、それらは単に存在する最長のcDNAを分離する手法であるため、mRNAの5’末端についての正確な情報を得ることは難しい。また、個々の遺伝子ごとに異なる作業が必要なため、ゲノム全体にわたって大規模に転写開始部位を決定するには大きな困難がともなう。本学位論文では、mRNAの転写開始部位の大規模解析を行うために、Oligo-Capping法を基にしてmRNAの転写開始部位を含むcDNAライブラリーを作製する方法を確立している。そして、作製したcDNAライブラリーを大規模にシーケンシングし、5’非翻訳領域の塩基配列を大量に決定している。最後に、それらの塩基配列を解析することにより真核細胞生物のタンパク質翻訳機構について考察を行っている。

 第2章で実験の材料と方法について述べた後、第3章IではOligo-Capping法を用いたcDNAライブラリーの作製方法について述べられている。真核細胞mRNAの5’端には、キャップ構造とよばれる特異的構造が存在する。キャップ構造を解離させないBacterial Alkaline Phosphatase(BAP)でpolyA+RNAをまず処理し、ミトコンドリア由来のmRNAや断片化されたmRNAの5’端に突出したリン酸基を加水分解する。つぎに、Tabacco Acid Pyrophosphatase(TAP)によりキャップ構造のトリリン酸結合を特異的に加水分解し、キャップ構造をもつmRNAの5’端のみにリン酸基を残す。最後に、BAP、TAPで処理したpolyA+RNAをT4RNA ligaseで処理して合成オリゴを結合させると、キャップ構造をもつmRNAの5’端にのみ選択的に合成オリゴを導入することができる。

 5’端キャップ構造を合成オリゴで置換したmRNAを鋳型に、完全長cDNAライブラリーの場合はoligo-dTアダプター、また5’端特異的cDNAライブラリーの場合はrandomアダプターをプライマーとして第1鎖cDNA合成を行う。これを軽くPCRで増幅した後、プライマー内のSfiI部位を切断してDraIII部位をもつplasmidベクターへと一方向性クローニングし、完全長および5’端特異的cDNAライブラリーを作製する。

 第3章では、第2章で述べた方法を用いて作製したcDNAライブラリーが5’末端をもつクローンをどの程度の割合で含むかについて検討を行っている。ヒトの組織、細胞より抽出したmRNAから完全長および5’端特異的cDNAライブラリーを作製し、ランダムに選択したクローンの塩基配列を決定した。データベースを利用して既知遺伝子の塩基配列との比較を行い、既知の転写開始部位を含むか、より5’上流側の塩基配列を含むかなどの基準で5’端を含むクローンの割合を決定した。各cDNAライブラリー間に若干の相違は認められたが、完全長cDNAライブラリーでは5’端が含まれる既知遺伝子の割合は50-70%であった。一方、5’端特異的cDNAライブラリーでは約80%と、より高い頻度で既知遺伝子のmRNAの5’端が含まれていた。また、5’端特異的cDNAライブラリーには全長が5kbを超える長いmRNAの5’端塩基配列が含まれていた。

 第3章IIでは、完全長cDNAライブラリーおよび5’端特異的cDNAライブラリーの大規模シーケンシングで得られた5’非翻訳領域を解析した結果について述べられている。完全長cDNAライブラリーおよび5’端特異的cDNAライブラリーからランダムに約1万クローンのcDNAを選択してワンパスシークエンスを行い、1010種類の既知遺伝子cDNAの5’端塩基配列を決定した。新たに得られた塩基配列はデータベース上のものより平均42bp上流に長く、従来見出されていなかったmRNAの転写開始部位が多く決定された。

 大規模シーケンシングで得られた5’端近傍の塩基配列の統計的、熱力学的解析を行った。5’非翻訳領域(5’UTR)は平均120bpの長さをもち、mRNAの長さに関係なく200bp以下の領域に集中していることがわかった。また、18S rRNAの3’端と5’UTRの結合エネルギーの分布を最適2次構造を計算する方法で調べたところ、多くの遺伝子について翻訳開始コドン近傍で両者が比較的安定な複合体を形成することがわかった。これらは真核細胞生物におけるタンパク質翻訳開始機構を解明するための重要な知見を与えると考えられる。

 以上のように、論文提出者は、Oligo-Capping法を基にしてmRNA転写開始部位をもつクローンを多く含む完全長cDNAライブラリーおよび5’端特異的cDNAライブラリーを作製する方法を確立し、ヒトの組織および細胞から抽出したmRNAから実際に大きなライブラリーを作製した。これらのcDNAライブラリーの大規模シーケンシングを行い、多数の遺伝子のmRNA転写開始部位を決定し、mRNAの転写開始部位を決定するステップを大幅に簡略化することができることを示した。大規模シーケンシングで得られた5’非翻訳領域の塩基配列の統計的、熱力学的解析を行い、真核細胞生物におけるタンパク質翻訳開始機構を解明するための重要な知見を得た。

 本論文の研究は、吉友清美氏、丸山和夫氏、菅野純夫氏、陶山明氏らとの共同研究であるが、論文提出者が研究全体を主体的に行ったもので、論文提出者の寄与が十分であると判断する。したがって、博士(学術)の学位を授与できると認める。

UTokyo Repositoryリンク http://hdl.handle.net/2261/54674