学位論文要旨



No 117906
著者(漢字) 坂手,龍一
著者(英字)
著者(カナ) サカテ,リュウイチ
標題(和) チンパンジーcDNA配列のデータベース構築と比較解析
標題(洋) Database construction and comparative analysis of chimpanzee cDNA sequences
報告番号 117906
報告番号 甲17906
学位授与日 2003.03.28
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第4377号
研究科 理学系研究科
専攻 生物科学専攻
論文審査委員 主査: 東京大学 教授 平井,百樹
 東京大学 教授 青木,健一
 東京大学 助教授 川村,正二
 東京大学 助教授 石田,貴文
 東京大学 助教授 植田,信太郎
内容要旨 要旨を表示する

 2003年春にヒトゲノム配列の完全版が公開されるはこびとなった現在、数万個と考えられているヒト全遺伝子のカタログ作成と、その翻訳産物であるタンパク質およびそれらの相互作用といった、ポストゲノミクスの研究が加速している。ひとつの遺伝子配列の一塩基に置換が起こっただけでも、機能や表現型に変化が現れることがあるが、遺伝子配列の相違点について種間で比較解析をおこなうことは、遺伝子機能の解析には非常に有効である。そこで、ヒトに最も近い種であるチンパンジーの遺伝子配列が得られれば、そこから遺伝子機能の比較解析が可能になり、ひいてはヒトをヒトたらしめている遺伝子とその働きを知ることができると考えられる。現在、チンパンジーについてはゲノム配列のシークエンジングが国際プロジェクトとして進行しており、ヒトとの配列の一致度が98.77%であることが報告されている。しかし、転写・発現している配列についての情報はほとんど無く、公共のデータベースに登録されているのは、グロビンやMHCなど、進化系統を研究する対象として個々にシークエンジングされた遺伝子にかたよっているのが現状である。

 本研究では、包括的にチンパンジーの遺伝子配列を解析する目的のもと、2頭のチンパンジー(Pan troglodytes verus)の脳、皮膚、肝臓の組織を試料として、mRNAのコピーであるcDNAをクローン化し、ライブラリーとして大量に保存した。オリゴ・キャッピング法を用いることで、mRNAの5'端(上流)から3'端(下流)までの完全長を保存しているクローンに富む。DNAライブラリーを作製することができた。そこからランダムに選んだクローンの5'端配列部分のシークエンシングをおこなって、400bp以上の長さの配列(EST;expressed sequence tag,発現配列断片)を7,064配列蓄積した。アノテーション(生物学的意味)づけのため、これらの配列についてヒトの配列データベースに対してBLASTプログラムによる相同性検索をおこなった結果、3,875配列(1,652種類)のヒトmRNAと相同な遺伝子配列が含まれていることがわかった。残りの配列のうち2,107配列はヒトESTに、746配列はヒトゲノム配列に一致したが、いずれにも一致しない配列が85配列あった。

 ヒトと相同な1,652遺伝子のうち、1,537遺伝子(93.0%)は本研究で用いたBLAST E=e-120の条件でヒトの配列と1対1で対応しており、オーソログの関係(2つの遺伝子が、種内での遺伝子重複ではなく、ある共通祖先からの種分化に由来する関係)である可能性が高いと考えられる。全1,652遺伝子のうち、脳由来が928遺伝子、皮膚由来が937遺伝子得られたが、両方から得られたのは233遺伝子のみであり、組織特異的な発現傾向を示していると考えられる。両組織で共通に多くクローンが得られたのは、EF1-alpha,tubulin,lactate dehydrogenase、ribosome関連遺伝子などであった。脳からはneuron-specific protein,synaptosomal-associated protein,myelin関連遺伝子、皮膚からはvimentin,decorin,keratin関連遺伝子などが組織特異的に多く得られた。これまでに肝臓から得られたクローンからは、ヒトと相同な遺伝子が35種類得られ、albuminやfibrinogenなど、脳と皮膚からは得られていない遺伝子が得られた。

 遺伝子の塩基配列の種差を解析するには、まず正確度の高い配列データが必要である。クローニングやシークエンシングの過程でエラーが生ずることがあるからである。そこで、ひとつの遺伝子につき3つ以上のクローンの配列が得られている場合に、その複数のクローンの配列からコンセンサス配列(共通配列)を作製して配列比較をおこなった。コンセンサス配列は、複数の配列をClustalWプログラムでアラインメント(最も共通部分が多くなるように並べる)し、各塩基座位について多数決(50%以上)で塩基を決定することによって作製した。全1,652遺伝子のうち226遺伝子のコンセンサス配列を得ることができた。

 コンセンサス配列を対応するヒトの遺伝子配列と比較して、コンセンサス配列全体(5'-cDNA)、5'端の非翻訳領域(UTR)、コード領域(CDS)、コード領域を翻訳したアミノ酸配列について、一致度(identity)を計算した。CDSでは、Li(1993)の方法を用いて同義・非同義置換(アミノ酸の変化をもたらさない・もたらす塩基置換、Ks,Ka)についても計算し、比較検討した。その結果、全体で99.30%、5'-UTRで98.79%、CDSで99.42%、アミノ酸配列では99.44%、同義置換(Ks)は1.33%(一致度に変換(Ks*)すると98.67%)、非同義置換(Ka)はO.28%(Ks=:99,72%)という値が得られた。

 配列の一致度の比較解析のために対照として、カニクイザル(Macaca fascicularis)の5'-EST ,37,587配列(国立感染症研究所橋本研究室提供・80%が脳組織由来で他に精巣や皮膚などに由来)についても解析した。チンパンジーの場合と同様に、BLAST相同性検索によるヒトと相同な遺伝子の同定およびコンセンサス配列の作製をおこない、ヒトとの配列の一致度を計算した。チンパンジーとカニクイザルで共通に得られた133遺伝子のコンセンサス配列について結果を得た。チンパンジー、カニクイザルの順に、全体(5'-cDNA)で99.43%,97.43%、5'-UTRで98.76%,93.68%、CDSで99.57%,98.04%、アミノ酸部位では99.70%,98.88%、同義置換(Ks)は1.22%,5.47%(Ks=98.78%,94.53%)、非同義置換(Ka)は0.14%,0.53%(Ka=99-86%,99-47%)という値が得られた(図)。

 一般に、遺伝子(mRNA)配列では配列部位ごとに種間での保存度に違いがある。本研究でもヒトとの一致度は5'-UTRでは低く、CDSでは高く、アミノ酸配列ではさらに高くなっている。アミノ酸の置換をおこす非同義置換は同義置換と比べて全体では約1/5〜1/10である。同義置換は中立突然変異の蓄積を反映するため、種間系統距離を計ることができると考えられている。単純に見積もっても約4-7倍カニクイザルのほうがチンパンジーより変異度が大きい。これは本研究で初めて多数の核遺伝子の配列を比較した結果であり、ヒトとの分岐年代がチンパンジーでは約550万年、カニクイザルが約2,500万年とされている系統関係の値を支持するひとつの基準となるだろう。アミノ酸をコードしない5'-UTR配列の一致度は、本研究の計算結果では同義置換座位の一致度と差が無く、配列の保存性に関わるバイアスを確認できなかった。

 本研究で計算した、種間での配列の一致度は、同じ遺伝子の同じ配列部位を比べて見つかった塩基置換数に基づいている。計算の過程で、塩基・アミノ酸単位の欠失や、数十塩基にわたって種間で大きく異なる配列があることが確認できた。これらはゲノム配列の違いだけでなく、オルターナティブ・スプライシング(ゲノム上の一遺伝子座位からエキソンの組み合わせにより複数パターンのmRNAが転写されること)などの転写後修飾を含むと考えられる。また、チンパンジーはヒトと比較して種内変異が大きいとされているが、本研究での同一遺伝子の複数クローン配列から、一塩基多型(SNP)なども確認できた。今後、種間で遺伝子配列のより詳細な比較解析をおこなうには、このような転写後修飾や種内変異を考慮して解析していく方法論を検討する必要があるだろう。

 チンパンジーの大規模な遺伝子配列のデータおよびその解析はこれまでになく、ヒトに近縁な霊長類の遺伝子配列の解析は、ヒトの進化に関連する遺伝子や疾患遺伝子の探索・機能解析など、様々な側面から有効に活用することができると考えられる。cDNAライブラリーおよびその配列データの蓄積はポストゲノミクスの研究にとっても、非常な貴重な試料となるだろう。

 なお、本研究で強調すべき点のひとつに、コンセンサス配列の作製や一致度の計算をはじめとする解析処理は、独自のプログラムを作成しておこなったことが挙げられる。本研究で得られた配列データおよび解析結果についてはデータベースを構築しており、インターネットを通じてアクセスすることができる(http://www.prigen.org/)。そこではチンパンジーのヒトと相同な遺伝子について、遺伝子名のキーワード検索や、BLASTによる遺伝子配列の相同性検索をおこなうことができる。

図 チンパンジー(PTR)とカニクイザル(MFA)の共通の133遺伝子配列のヒトとの一致度

(identity)。UTR:untranslated region,CDS:coding sequence,KS*=1-KS,KA*=1-KA(%,KS:synonymous substitution,KA:nonsynonymous substitution)

審査要旨 要旨を表示する

 本論文は3章よりなる。第1章ではチンパンジーの完全長 cDNAライブラリーの作製と特性に関する研究、第2章ではクローンの塩基配列解析、第3章では、カニクイザルの対応配列との比較解析を行っている。

 ヒトとその最も近い種であるチンパンジーの遺伝子機能の比較解析から両種間の種差や、ひいてはヒトをヒトたらしめている遺伝子とその働きを知ることが期待できる。現在、チンパンジーについては、転写・発現している配列についての情報はほとんどない。そこで本研究では、包括的にチンパンジーの遺伝子配列を解析する目的のもと、2頭のチンパンジー(Pan troglodytes verus)の脳、皮膚、肝臓の組織を試料として、mRNAのコピーであるcDNAをクローン化し、ライブラリーとして大量に保存した。オリゴ・キャッピング法を用いることで、mRNAの5'端(上流)から3'端(下流)までの完全長を保存しているcDNAクローンに富むcDNAライブラリーを作製することができた。そこからランダムに選んだクローンの5'端配列部分のシークエンジングをおこなって、400bp以上の長さの配列(EST;expressed sequence tag,発現配列断片)を7,064配列蓄積した。これらの配列をヒトの配列データベースに対してBLASTプログラムによる相同性検索をおこなった結果、3,875配列(1,652種)のヒトmRNAと相同な遺伝子配列が含まれていることがわかった。残りの2,107配列はヒトESTに、746配列はヒトゲノム配列に一致したが、いずれにも一致しない配列が85配列あった。第1章においては、上述の記載がなされている。

 遺伝子の塩基配列の種差を正確に解析するには、まず正確度の高い配列データが必要である。そこで、ひとつの遺伝子につき複数のクローンの配列からコンセンサス配列(共通配列)を作製して配列比較をおこなった。コンセンサス配列はcDNA配列をClustalWプログラムでアラインメント(最もよく揃うように並べる)し、各塩基座位について多数決で塩基を決定して最終的なコンセンサス配列を作製した。全1,652遺伝子から226遺伝子のコンセンサス配列を得ることができた。これらを対応するヒトの遺伝子配列と比較して、コンセンサス配列全体、5'端の非翻訳領域(UTR)、コード領域(CDS)、コード領域を翻訳したアミノ酸配列の一致度(identity)について計算した。アミノ酸配列については、Li(1993)の方法を用いて同義・非同義置換(アミノ酸の変化をもたらさない・もたらす塩基置換、KsKa)についても計算し、比較検討した。その結果、全体で99.31%、5'-UTRで98.79%、CDSで99.42%、アミノ酸配列では99.44%、同義置換(Ks)は1.37%(一致度に変換(Ks)すると98.63%)、非同義置換(Ka)は0.27%(Ks*=99.73%)という値が得られた。第2章において、これらの解析結果を述べている。

 第3章では、配列の一致度の比較解析のために対照として、カニクイザル(Macaca fascicularis)の5'端cDNA,37,587配列についても同様にコンセンサス配列を作製して、ヒトとの配列の一致度を計算した。チンパンジーとカニクイザルで共通に得られた133遺伝子について結果を得た。チンパンジー、カニクイザルの順に、全体で99.43%,97.37%、5'-UTRで98.75%,9415%、CDSで99.56%,97.98%、アミノ酸部位では99.71%,97.98%、同義置換(Ks)は1.19%,5.56%(Ks*=98.81%,94.44%)、非同義置換(Ka)は0.14%,0.61%(Ka*=99.86%,99.39%)という値が得られた。

 チンパンジーの大規模な遺伝子配列のデータおよびその解析はこれまでになく、本研究で得られた。DNAライブラリーおよびその配列の蓄積は非常な貴重な試料となるだろう。本論文は、3草とも、肥田宗友、数藤由美子、長田直樹、橋本雄之、平井百樹との共同研究である。しかし、研究のうち特に重要な位置を占めるデータ解析は、すべて論文提出者が行ったものである。本研究で得られた配列データおよび解析結果については、論文提出者がデータベースを構築し、インターネット(http://pri.biol.s.u-tokyo.ac.jp/)を通じてアクセスできるよう管理しており、本研究への論文提出者の寄与が極めて大きい。

 したがって、博士(理学)の学位を授与できると認める。

UTokyo Repositoryリンク