学位論文要旨



No 128551
著者(漢字) 奥田,哲夫
著者(英字)
著者(カナ) オクダ,テツオ
標題(和) 高出力次世代シークエンス技術を応用した小胞体ストレス応答性mRNAの網羅的解析
標題(洋)
報告番号 128551
報告番号 甲28551
学位授与日 2012.06.25
学位種別 課程博士
学位種類 博士(生命科学)
学位記番号 博創域第808号
研究科 新領域創成科学研究科
専攻 メディカルゲノム専攻
論文審査委員 主査: 東京大学 教授 菅野,純夫
 東京大学 教授 上田,卓也
 東京大学 教授 中井,謙太
 東京大学 教授 村上,善則
 東京大学 准教授 泊,幸秀
内容要旨 要旨を表示する

真核細胞はグルコース飢餓などの栄養枯渇や低酸素状態、細胞内カルシウムの恒常性および酸化還元状態を乱すような環境ストレスへの曝露や遺伝子変異の存在により小胞体内に折りたたみ構造の異常なタンパク質が蓄積される。このようなストレスは小胞体ストレスと呼ばれ、近年、神経変性疾患、2型糖尿病、動脈硬化や癌といった疾病への関与が示されてきた。それ故、小胞体ストレス応答の分子メカニズムの解明が疾病の発症メカニズムの解明に繋がり、新たな治療法開発に貢献することが期待されている。

細胞内では小胞体ストレスに対する生体防御機構として2つの主要経路が機能する。第一に、小胞体内の異常タンパク質を正常化するために、小胞体シャペロンや酵素を転写レベルで誘導する IRE1α-XBP1経路が存在する。この経路はターゲットである小胞体シャペロンBiPの増加に伴い、負のフィードバック制御により不活性化される。第二に、全般的な翻訳抑制により小胞体への新生タンパク質のトランスロケーションを低下させる PERK-eIF2α経路が存在する。この PERK-eIF2α経路は翻訳開始複合体の形成阻害を通して翻訳の開始段階を抑制するが、 5'UTR内にuORFを有するmRNAに関しては逆に翻訳を促進することが知られ、その代表がATF4である。ATF4はストレス後のリカバリーに関わる遺伝子群の転写を誘導するだけではなく、アポトーシス誘導に関与する転写調節因子CHOPの発現も誘導する。

このように、小胞体ストレス応答は全般的な翻訳抑制状態において転写誘導を行う特異な経路である。最近、IRE1α-XBP1経路の不活性化後もPERK-eIF2α経路が恒常的に活性化していることが、小胞体ストレス下の細胞運命の決定と関係していることが報告された。そこで我々は、IRE1α-XBP1経路の活性状況下と不活性状況下それぞれにおいて、翻訳抑制の網を掻い潜って、タンパク質に翻訳されて機能していると考えられる、Polysome形成mRNAの網羅的発現解析を行うことで、細胞運命の決定に関与する遺伝子を同定する計画を立てた。

従来、ゲノムワイドな発現解析はマイクロアレイを用いて行われてきた。しかしながら、伝統的なハイブリダイゼーション技術に依存した解析手法ゆえに、事前に鋳型としての配列情報が必要になるばかりでなく、非相同配列間におけるミスハイブリダイゼーションに由来するノイズによって高いバックグラウンドが生じてしまう。そのため、既知の配列情報においてのみ解析が可能であり、また、高コピー数の遺伝子の発現変化を検出することには適しているが、低コピー数の遺伝子の発現変化を検出することは困難であった。この問題を解決する方法として、近年、注目されているのが、全RNAシークエンスと呼ばれる手法である。この解析手法を可能としたのは、従来のサンガー法に依存した電気泳動による配列決定とは全く原理を異にする、複数の次世代シークエンス技術である。その1つであるIllumina社製 1G Genome Analyzer (通称Solexa)は1Runにつき最大約10億塩基を読むことが可能な高出力を誇る。このSolexaの原理は、8サンプル分のレーンを有するプレート上で、ブリッジPCRにより形成されたクラスターを可逆的ターミネーター法により1塩基ずつ発光させ、その画像を取り込む作業を繰り返し、約36塩基の配列情報を1つのタグとして決定することで、1レーンにつき約400~600万タグを読む、というものである。決定された配列はElandというsoftwareにより、ヒトゲノム配列上にマップされることで、ゲノム上での位置が決定される。

Eland解析の過程は、プローブ(読まれた配列)を鋳型(ゲノム配列)に電子的にハイブリダイゼーションさせていることになるため、未知の転写産物(non-coding RNAなど)の同定が可能となるばかりではなく、読まれた配列がゲノム配列にマップされる頻度をカウントすることで、転写産物の発現量の変動を定量的に解析することが可能である。この定量法はマイクロアレイのようなバックグラウンドが生じないため、低発現量の転写産物の変化を検出することが可能となる。この原理に基づき、未知の転写産物を含めた、各転写産物のUTR、exon、intron、および splice junctionなどの詳細な解析を行う技術を全RNAシークエンスと呼ぶ。これまで全RNAシークエンスは細胞全体のRNAから分離されたmRNAを原材料として実行されてきた。しかしながら、現時点においてPolysome形成mRNAのランダムシークエンスは報告されていない。核内mRNAを除外した細胞質のRNAやPolysome形成mRNAの発現解析を行うことはこれまでの報告との対比を行う上でも重要である。

ヒト大腸腺癌由来の細胞株HT29を、小胞体ストレス誘発剤として作用するN結合型糖鎖形成阻害剤Tunicamycin (Tm)で処理し、IRE1α-XBP1経路の活性化および不活性化の条件をそれぞれ4時間および16時間と決定した。各時点でHT29を界面活性剤で可溶化後遠心により除核した。得られた細胞質成分および超遠心により分離したPolysome画分よりmRNAを抽出後、二本鎖cDNAを合成し、圧力をかけて断片化した。各断片の末端を平滑化したのち、Solexa用アダプターを両端に付加し、電気泳動により約200bpの断片を分離した。この断片をPCR増幅後濃度測定し、15pg(平均mRNA長を2,000ntとした場合、低く見積もって約1細胞あたりの総mRNAに相当する量)をSolexa用プレート1レーンに対してアプライした。Solexaにより1レーンあたり約500万タグが読まれ、Eland解析により、ミスマッチなくマップされたタグの割合は、Refseq(タンパク質コード遺伝子の代表mRNA/cDNA配列)に対しては約45%、ゲノム配列に対しては約50%であった。また、Refseqに対するEland解析で得たRefseqID(遺伝子の分類名の一種)の数と比較し、ゲノム配列に対してEland解析を行った場合のRefseq IDの数は約10%多かった。これは、細胞質由来の転写産物中にイントロンを含んだ転写産物もしくはイントロン由来の転写産物が含まれている可能性を示唆していた。この結果は、ストレスに依存せず、細胞質由来ばかりではなくPolysome由来のcDNAにおいても得られた。従来、Splicingは核内で起こり、不完全な産物を核外に輸送させないmRNA品質管理機構が存在するので、大部分の未成熟mRNAは核内に存在するか分解され、細胞質中には成熟mRNAが濃縮されていると考えられている。今回、タンパク質合成の場であるPolysomeにイントロンを含んだ転写産物が含まれる可能性があるという興味深い結果が得られた。

次に18,001種類の遺伝子に注目し、Refseqを用いた発現プロファイルを実行した。各遺伝子(cDNA)の配列中にタグがマップされた場合に1カウントとして、遺伝子ごとに合計して頻度(ppmで表示)を算出した。さらに各遺伝子のppmを各遺伝子のcDNA長を200で割った値で割ることによりカウントをmRNAについてノーマライズした。このとき、1カウントは1細胞あたりにmRNAが1コピー存在することに相当する。この結果、1細胞あたり1コピー以上mRNAが存在する遺伝子は7,394種類、mRNAの総コピー数は約10万コピーであった。

ショットガンシークエンスの性格上、mRNA長が長いほど、断片が増加することでカウントが増加し、その影響を受け、短いmRNAのカウントが減少してしまうことが懸念された。しかしながら、mRNA長を1,000bpごとにクラス分けし、各クラスに存在する遺伝子数が全遺伝子数に占める割合と、各クラスの総コピー数が全体のコピー数に占める割合を比較した結果、短いmRNA長のクラスのコピー数の減少は見られなかった。

また、PolysomeはmRNAに複数のリボソームが結合して形成されるため、mRNA長が長いほど結合するリボソーム数が増加すると考えられる。Polysomeの分離は重さに依存して行うため、結合リボソーム数が多い長鎖mRNAがPolysomeに濃縮されることが予想された。このような実験の性質上起こりうるバイアスによって、本来の機能的なmRNAを同定することが難しくなれば、人工的な結果を招く恐れがある。しかしながら、細胞質において見られた各長さのクラスの発現量の分布とPolysomeにおける各クラスの発現量の分布は類似していた。以前、mRNA長が長いほど結合するリボソーム数は増加するが、その結合密度に注目すると、mRNA長が短い程密度が高く、mRNA長が長くなるに伴って密度が減少することが報告された。発現ライブラリーを作成するにあたって、各Polysome画分を1つに合わせて調整したため、上述の現象が反映し、細胞質で観察されたクラスの分布と類似の分布が観察されたと考えられた。

実際に小胞体ストレスによって2倍以上に発現量が増加した遺伝子に注目した場合、これらの遺伝子が所属するクラスは、細胞質においては短~中鎖クラスに属する遺伝子の増加が見られ、Polysomeにおいては中~長鎖クラスに属する遺伝子の増加が見られた。細胞質とPolysome両方で増加している遺伝子に注目すると、細胞質における分布が反映し、短~中鎖クラスに属する遺伝子が抽出された。Polysomeにおいて見られた長鎖クラスの増加は、遺伝子機能の反映というよりも、翻訳の開始反応が阻害されていることで、短い転写産物がリボソームに取り込まれにくく、翻訳に時間のかかる長い転写産物に結合した状態のリボソームが乖離せずに残っていたことにより、見掛け上、増加しているように観測されと考えられた。

我々はSolexa解析の出力が正当なものであるのかを評価するために発現の上昇した93遺伝子(既知の小胞体ストレス応答性遺伝子BiP、ATF4やCHOPを含む)について定量的リアルタイムPCRを実行した。解析対象を選出する基準として細胞質およびPolysome両方で2倍以上に発現量が増加していること、およびPolysomeにおいてのみ発現量が2倍以上に増加している遺伝子とした。これは、小胞体ストレスが転写誘導と翻訳抑制を誘発するからであり、また、uORFに代表されるRNAの構造によって転写誘導に依存せずに翻訳が亢進される場合があるためである。

Solexaの結果とリアルタイムPCRの結果との相関はR=0.7で、完ぺきな相関とは言えなかったが、将来的な解析対象を選ぶことは可能である。この検定で、全体としては約3割の不一致が生じたが、細胞質およびPolysome両方で発現増加が見られた遺伝子グループでは2割前後の不一致だった。このことから、細胞質およびPolysome両方の発現プロファイルを組み合わせることで、実際に機能的な遺伝子を同定することが容易になることが示唆された。この93遺伝子の中から、低コピー数の遺伝子も含め、新たな小胞体ストレス応答性遺伝子の候補が22遺伝子同定された。

Solexa解析全体の結果から、検出された7,323遺伝子の内、小胞体ストレスによって細胞質において2倍以上に発現量が増加した遺伝子を抽出すると、刺激後4時間で約2.0%、16時間で約4.5%の遺伝子が増加し、4時間から16時間まで共通して増加した遺伝子は約0.6%であった。逆に言うと、これらの遺伝子の内、約80%がPolysomeにおいて一定量以上に保たれていた。この結果から、小胞体ストレス下に、細胞の生死の決定に関与する分子を機能させるには、その転写量を増加しさえすれば良いことが示唆された。この解析でATF4はPolysomeにおいてのみ増加が見られたが、同様の挙動を示した遺伝子グループ内にATF4のようにuORFを有した遺伝子は存在しなかった。このグループの検定結果が悪かったこととの関係は不明であるが、ATF4のような制御機構はレアケースなのかもしれない。

今回、全RNAシークエンスを応用することによって、マイクロアレイを用いた研究によって報告されてこなかった新規候補遺伝子の同定に成功した。これは、電子的なハイブリダイゼーションから獲得した高分解能により、低コピー数の遺伝子変化の検出が可能となったことが寄与している。IRE1など低コピー数でありながら、重要な働きを担う分子が存在していることからも、低コピー遺伝子の探索は重要な意義がある。また、未成熟mRNAの翻訳やその調節機構および、RNAの新機能が存在する可能性も見出した、この高出力な解析能力は、RNA研究の新展開の端緒を開く可能性を有しており、今後のさらなる発展が期待される。

審査要旨 要旨を表示する

本研究では、次世代シークエンス技術を応用して、小胞体ストレス応答性mRNAの網羅的解析を行った。小胞体ストレスとは、真核細胞において、グルコース飢餓、環境ストレスへの曝露や遺伝子変異の存在により小胞体内に折りたたみ構造の異常なタンパク質が蓄積されることを指す。細胞内では小胞体ストレスに対する生体防御機構としてIRE1α-XBP1経路とPERK-eIF2α経路が存在する。最近、IRE1α-XBP1経路の不活性化後もPERK-eIF2α経路が恒常的に活性化していることが、小胞体ストレス下の細胞運命の決定と関係していることが報告された。そこで我々は、IRE1α-XBP1経路の活性状況下と不活性状況下それぞれにおいて、タンパク質に翻訳されて機能していると考えられる、ポリソーム形成mRNAの網羅的発現解析を行うことで、細胞運命の決定に関与する遺伝子を同定する計画を立てた。その方法としてマイクロアレイではなく、次世代シークエンサーsolexaを用いた。ヒト大腸腺癌由来の細胞株HT29を、小胞体ストレス誘発剤として作用するTunicamycin (Tm)で処理し、IRE1α-XBP1経路の活性化および不活性化の条件をそれぞれ4時間および16時間と決定した。各時点でHT29の細胞質およびポリソーム画分よりmRNAを抽出後、ライブラリーを作成し、Solexaでシークエンスした。Solexaにより1レーンあたり約500万タグが読まれた。

次に18,001種類のタンパク質コード遺伝子に注目し、Refseq(タンパク質コード遺伝子の代表mRNA/cDNA配列)を用いた発現プロファイルを実行した。この結果、1細胞あたり1コピー以上mRNAが存在する遺伝子は6966種類、mRNAの総コピー数は約10万コピーであった。我々はSolexa解析の出力が正当なものであるのかを評価するために発現の上昇した71遺伝子(既知の小胞体ストレス応答性遺伝子を含む)について定量的リアルタイムPCRを実行した。Solexaの結果とリアルタイムPCRの結果との相関はR=0.7で、完ぺきな相関とは言えなかったが、将来的な解析対象を選ぶことは可能と判断した。この71遺伝子の中から、低コピー数の遺伝子も含め、新たな小胞体ストレス応答性遺伝子の候補が22遺伝子同定された。今回、全RNAシークエンスを応用することによって、マイクロアレイを用いた研究によって報告されてこなかった新規候補遺伝子の同定に成功した。これは、電子的なハイブリダイゼーションから獲得した高分解能により、低コピー数の遺伝子変化の検出が可能となったことが寄与している。

なお,本論文は,若栗浩幸・鈴木穣・菅野純夫との共同研究であるが,論文提出者が主体となって実験及び解析を行ったもので,論文提出者の寄与が十分であると判断する。

したがって,博士(生命科学)の学位を授与できると認める。

UTokyo Repositoryリンク