学位論文要旨



No 127547
著者(漢字) 金井,昭教
著者(英字)
著者(カナ) カナイ,アキノリ
標題(和) 転写因子STAT6に直接結合するクロマチン部分の網羅的解析
標題(洋) Analysis of Chromatin DNA Directly Bound by Transcription Factor STAT6
報告番号 127547
報告番号 甲27547
学位授与日 2011.09.27
学位種別 課程博士
学位種類 博士(生命科学)
学位記番号 博創域第727号
研究科 新領域創成科学研究科
専攻 メディカルゲノム専攻
論文審査委員 主査: 東京大学 教授 菅野,純夫
 東京大学 教授 渡邉,俊樹
 東京大学 教授 上田,卓也
 東京大学 教授 中井,謙太
 東京大学 教授 伊藤,隆司
内容要旨 要旨を表示する

<背景と目的>

転写因子標的遺伝子の同定には、転写因子の結合の有無、下流遺伝子の発現の変化の情報は必須である。しかし、転写因子結合の有無を調べるために従来のクロマチン免疫沈降法(ChIP)とマイクロアレイを組み合わせた方法(ChIP-CHIP法)では、ゲノムの全領域を解析するためのタイリングアレイの煩雑は処理が必要である等、技術面およびコスト面での困難が伴う。またマイクロアレイを用いた遺伝子発現解析においては、高い定量性をもって、あるいは正確な転写開始点(TSS)情報を加味した形で解析を進めることは困難である。一方、cDNAライブラリーのランダムシークエンスを基盤とした方法では、十分なカバレージを得ることは事実上、不可能である。

近年の新型シークエンサーの開発により、短時間で大量に短い塩基配列の決定をすることが可能となった。これらの技術を応用すれば、得られた配列数を指標に従来の検出系を置換することが可能である。すなわち、ChIP-CHIP法におけるハイブリダイゼーションをシークエンサーで得られる大量の短い塩基配列データに置換し、その配列をリファレンスとなるゲノム配列にマッピングすることでそのゲノム上の位置情報を得ることが出来る(以下、ChIP-Seq法と呼ぶ)。また、転写開始点情報、あるいは遺伝子発現情報についてもcDNAの5'末端を大量にシークエンスすることで(TSS-Seq)正確な転写開始点情報が得られ、さらにその配列数をデジタルにカウントは、その転写開始点からの発現量を示す発現情報として計測することが可能である。筆者はイルミナ社の新型シークエンサーGenome Analyzer(GA)を用いて1) ChIP-Seqによる転写因子の結合2) TSS-Seqによる転写開始点、発現頻度情報 3) それらを組み合わせたプロモーター解析を用いることによって転写因子の細胞内での標的遺伝子を同定することが可能であると考え、その方法論的開発を行った。

本研究では上記の手法を転写因子STAT6の標的遺伝子の探索に応用することを試みた。STAT6はIL-4・IL-13のようなサイトカインにより転写活性化能が誘導される転写活性化因子であり、喘息をはじめとする様々なアレルギー性疾患との関連が示唆されている。STAT6は核内ではDNAのTTCNNNNGAAという4つのNによって隔てられたコンセンサス配列を認識してDNAに結合し、イムノグロブリンやサイトカイン・ケモカインのような遺伝子発現を活性化することにより、アレルゲンに対する生体防御反応であるTh2細胞への分化やIgEへのクラススイッチを促す。しかし、その標的遺伝子の全体像について、また標的遺伝子の細胞種特異性について、現在の得られている知見は非常に限られている。

<実験方法と解析手法>

1)ChIP-seq

ヒトBリンパ球Ramos細胞・ヒト気道上皮BEAS2B細胞に対して、IL-4刺激を30分行った。その後、常法に従って抗STAT6抗体を用いたChIPを行った。回収されたDNAに対して、イルミナGA シークエンサーを用いて、36 bpの塩基配列を各実験条件につき、約500万本ずつ決定した。決定された36塩基の配列をリファレンスとなるヒトゲノム配列(UCSC Genome Browser; hg18)にELANDを用いてアラインメントし、ミスマッチなしでユニークにアラインした領域を同定した。得られたゲノム座標に対して120 bpでのクラスタリングを行い、各クラスターの塩基配列数を算出した。刺激依存的に10倍以上の濃縮が見られるクラスターをSTAT6の結合領域とした。また、クロマチンの状態を調べるためにH3K4me3、H3Ac、RNAポリメラーゼII(Pol II)の抗体を用いて同様にChIP-Seqを行った。

2)TSS-seq

Ramos細胞とBEAS2B細胞をIL-4存在、非存在下で24時間培養した。Total RNAを抽出し、オリゴキャップ法を用いてイルミナGAアダプタープライマーをキャップ構造に置換した後、ランダムプライマーを用いてcDNAを合成した。15サイクルのPCRの後に150-250塩基の領域をPAGEによりサイズ分画した。得られた鋳型cDNAを用いて、各実験条件につき、約3000万の転写開始点近傍塩基配列を決定した。配列をヒトゲノム配列に対して上記と同様の手法でアラインメントし、クラスターを精製した。TSS-Seqについては500 bpでのクラスタリングを行った。転写開始点クラスター(TSS Cluster; TSCs)が約18000種類のRef-seq遺伝子の転写開始点上流50 kbから3'exonの末端までに位置する場合、Ref-seq遺伝子への対応付けを行った。1 ppm(100万タグあたり1配列=1タグ)以上でIL-4刺激依存的に2倍以上のタグ数の変化が見られたTSCを、IL-4応答転写開始点とした。

3)プロモーター配列の計算機解析

TSC上流の塩基配列中におけるSTAT6結合コンセンサス配列を探索した。各計算機ツールはperlを用いて独自に作成したものを用いた。

<結果と考察>

ChIP-Seq法によるSTAT6結合領域の同定

ChIP-Seq法において、IL-4刺激依存的に10倍以上のタグの濃縮が見られる領域をSTAT6結合領域としたところ、ゲノム中にRamos細胞では556ヶ所、BEAS2B細胞で467ヶ所のSTAT6結合領域を同定することができた。これらSTAT6結合領域それぞれのゲノム上での位置について解析を行うと、BEAS2B細胞では77 %のサイトがRefSeq遺伝子のプロキシマルプロモーター領域(- 10 kbp ~ + 1 kbp; 転写開始点を0とする)に存在していたが、Ramos細胞では同じ領域に27 %しか存在しておらず、34 %がイントロン領域に存在していた。他にも両細胞のSTAT6結合サイトのコンセンサス配列を知るためにMATCHにて解析を行うとRamos細胞では既知コンセンサスであるTTCNNNNGAAが最も多く見られたが、BEAS2B細胞では既知コンセンサス配列よりもTCTCGCGというコンセンサス配列の方が多く見つかった。

TSS-Seq法によるTSS情報および遺伝子発現情報とChIP-Seq情報の統合的解析

TSS-Seq法を用いてRamos細胞、BEAS2B細胞の転写開始点の同定とmRNAの発現解析を行った。TSS-SeqのデータとSTAT6 ChIP-Seqのデータと組み合わせたところ、RefSeq遺伝子のプロキシマルプロモーター領域においてSTAT6が結合しており、TSCsが発現上昇している遺伝子はRamos細胞で132サイト、BEAS2B細胞で44サイトであった。これら以外の領域として、これまでのRefSeq遺伝子モデルでは同定されておらず選択的プロモーターと思われる領域に45サイトと9サイト、遺伝子間領域に34サイトと6サイトのSTAT6結合領域がRamos細胞、BEAS2B細胞それぞれについて同定された。これらのSTAT6標的遺伝子について比較を行ったところ、両細胞での標的遺伝子は全く重なっておらず、GO解析によってそれら遺伝子の機能についても比較したが異なる働きをする遺伝子群がそれぞれ多く見られていた。さらに近年報告されたTh2細胞でのSTAT6標的遺伝子の結果も同様に解析を行い比較してみたところコンセンサス配列はRamos細胞と同様に既知配列であったが、標的遺伝子は大きく異なっており、GO解析での遺伝子機能も異なっていた。このようにRamos細胞とBEAS2B細胞ではSTAT6標的遺伝子が大きく異なっているにもかかわらず、標的遺伝子群の発現レベルや発現変化量はほぼ同じであった。

次に細胞によって異なる転写誘導が各細胞系でのクロマチン状態が異なるためであると推測し、H3K4me3、H3Ac、Pol IIのChIP-Seqを両細胞にて行った。クロマチン活性化状態のマーカーであるH3K4me3とH3AcはSTAT6標的サイトの転写開始点周辺に濃縮されており、またこれらの修飾がIL-4による刺激以前に起きていることが明らかとなった。さらにRamos細胞においてRamos細胞では標的ではないがBEAS2B細胞では標的となっているような領域(サイレント領域)について解析を行ったところSTAT6の結合やTSSタグの存在は確認できなかったが、Pol IIは結合しておりヒストンは活性化型であった。一方、BEAS2B細胞ではRamos細胞同様にSTAT6標的領域のヒストン修飾は活性化の割合が少なく、Pol IIの結合はIL-4依存的に起きていた。これらの結果からSTAT6による転写活性化は活性化状態のクロマチンが形成されている領域にIL-4依存的にSTAT6が結合し、さらなる細胞依存的な因子がその領域に結合することによって転写誘導が行われると考えた。このような細胞特異的因子を同定するためにTRANSFCの転写因子とそのコンセンサス配列を用いて、解析を行ったところBEAS2B細胞ではFAC1遺伝子、Ramos細胞ではCEBPG遺伝子のコンセンサス配列がSTAT6標的領域に多くみられ、それぞれの遺伝子発現は各細胞のみで上昇していた。これらの遺伝子群は転写因子STAT6と細胞特異的にSTAT6と協調して働く遺伝子群候補として初めて同定されたものである。

本論文においては超並列型シーケンサを用いる事によって多段階からなる転写制御のゲノムワイドなデータを一度に得て解析する事が可能となり、STAT6の転写制御には全ての細胞で画一的な活性化クロマチン形成と転写因子結合のみでは表せない複雑な制御機構が細胞ごとにそれぞれ存在している可能性が示唆された。今回に同定された各STAT6標的候補遺伝子それぞれについての細胞レベルや組織レベルでの生化学的な解析はゲノムワイドな解析と比べてもさらに多くの詳細な検証を必要とする。しかし、このような細胞ごとのSTAT6標的遺伝子のカタログ化とその分類、特徴付けはIL-4の免疫系における重要な役割を明らかにしていく上で重要なリソースとなるであろう。

審査要旨 要旨を表示する

本論文は、ヒト培養細胞を用いて転写因子STAT6標的遺伝子の同定を行っている。これまでの転写因子の標的遺伝子を研究する際には細胞の種類、状態等を加味せずその全ての標的遺伝子を同列に扱っていたが、本論文ではヒト血球系B細胞(Ramos細胞)と気道上皮細胞(BEAS2B細胞)の2種類の細胞を用いてそれぞれの細胞でのSTAT6標的遺伝子の比較を行い、それぞれの標的遺伝子の違いとその違いがどのようにして生まれてくるのかについて論じている。

標的遺伝子の同定のため超並列型シーケンサーIllumina GAを用いてSTAT6でのChIP-Seqを行い、Ramos 細胞、BEAS2B細胞それぞれにおいて556種類、467種類のSTAT6標的サイトを同定した。STAT6結合サイトの検索のみでは細胞内での真の標的候補を絞り切れないため、実際にSTAT6が結合した近傍のmRNAが変化しているのか調べた。その方法論としてmRNAの5'末端を認識することの出来るオリゴキャップ法と次世代シーケンサーを組み合わせたTSS-Seqを用いた。TSS-Seqを用いることによって各mRNAの転写開始点を正確に特定し各転写産物がどこから発現しているのか、またそれらを制御する転写因子が結合位置と転写開始点の位置との関係を詳細に示す事が可能となっている。さらにマイクロアレイによる発現解析では既知遺伝子を基にした設計されたプローブ範囲内という限られた領域しか検索出来ないが、シーケンサーを用いることで遺伝子間領域なども含んだゲノム全領域での転写産物との比較を可能としている。シーケンサーを用いてゲノム全体の解析が可能となっている点はChIP-Seqにおいても同様である。STAT6 ChIP-SeqとTSS-Seqのデータを組み合わせる事によってゲノム全体で133ヶ所(Ramos)、147ヶ所(BEAS2B)のSTAT6標的サイトを同定した。標的サイトとRefSeq既知遺伝子モデルとの位置関係を調べると既知遺伝子プロモーター領域で44ヶ所(Ramos)と132ヶ所(BEAS2B)、選択的プロモーター領域で45ヶ所(Ramos)と9ヶ所(BEAS2B)、遺伝子間領域(推定非タンパク質コード遺伝子)で34ヶ所(Ramos)と6ヶ所(BEAS2B)にそれぞれ分類された。これらからSTAT6が標的とする遺伝子を両細胞系で比較しているがその種類、細胞内での役割は全く異なっており、各細胞から推測されるコンセンサス配列自体も異なっていた。このような違いを明らかにするためにH3K4me3、H3Ac、RNAポリメラーゼII(Pol II)のChIP-Seqを行った。その結果IL-4の刺激の有無にかかわらずSTAT6が結合する領域はクロマチンの状態が活性化されている事、またそれはその細胞内ではSTAT6が結合していなくても他の細胞でSTAT6結合するサイトであれば同じようにクロマチンは活性化状態である事、さらにSTAT6標的サイトへのPol IIの結合はRamos細胞ではIL-4非依存的であるが、BEAS2B細胞ではIL-4依存的であり、細胞で転写制御が異なる可能性を示唆した。両細胞でのこのような転写制御の違いが細胞特異的な転写因子によって起きているのではないかと推定し、転写因子のコンセンサス配列とTSS-SeqのデータからRamos細胞ではFAC1などが、BEAS2B細胞ではCEBPGなどの転写因子が細胞特異的な作用を担っている事を示唆した。

超並列型シーケンサーを用いて多段階による転写の様々なステップのゲノムワイドなデータを得る事によって、同じ転写因子であっても細胞によって全く異なる働きを促していることを明らかにするが可能となっている。今後、ゲノムデータから導き出された結果から細胞、組織、個体レベルの生化学的な検証へと進めていく必要があるが、本論文によって示されているSTAT6の細胞ごとの標的遺伝子のカタログ化はIL-4・STAT6シグナルの免疫系での様々な役割を説明していく上で有用なリソースとなることが期待される。

なお,本論文は,鈴木健太氏・水島純子博士・鈴木穣博士・菅野純夫博士との共同研究であるが,論文提出者が主体となって実験及び解析を行ったもので,論文提出者の寄与が十分であると判断する.

したがって,博士(生命科学)の学位を授与できると認める.

UTokyo Repositoryリンク