学位論文要旨



No 128507
著者(漢字) 生越,克己
著者(英字)
著者(カナ) オゴシ,カツミ
標題(和) 次世代シークエンサーを用いたヒト大腸癌細胞株のゲノムワイドなDNAメチル化解析
標題(洋)
報告番号 128507
報告番号 甲28507
学位授与日 2012.04.25
学位種別 課程博士
学位種類 博士(医学)
学位記番号 博医第3983号
研究科 医学系研究科
専攻 社会医学専攻
論文審査委員 主査: 東京大学 教授 遠山,千春
 東京大学 教授 小山,博史
 東京大学 教授 深山,正久
 東京大学 教授 瀬戸,泰之
 東京大学 准教授 神野,茂樹
内容要旨 要旨を表示する

近年、DNAの一次構造を変化させずに遺伝形質の発現を制御、維持する機構として後天的修飾 (エピジェネティクス) の概念が、生命の様々な事柄に関わる重要な因子であると認識された。エピジェネティクスの概念には、DNAのメチル化とヒストン修飾という2種類が存在する。DNAメチル化とは、DNAを構成する4種類の塩基対のうち、シトシンの5位炭素原子がDNAメチル化酵素によってメチル化されメチルシトシンとなる現象を指し、ゲノムDNAが生理的条件下で受ける唯一の化学修飾である。哺乳類に存在するシトシンのメチル化は、大部分がシトシンとグアニンが連続したCpGヌクレオチドで起こる。多くの遺伝子のプロモーター領域には、多数のCpGヌクレオチドが存在するCpG islandと呼ばれる領域が存在し、その領域のCpGヌクレオチドのメチル化は、隣接する遺伝子の発現を抑制する事で知られている。細胞のDNAメチル化は、発生分化の過程で形成されるだけでなく、細胞分裂におけるDNA複製時にも維持され、正常細胞のX染色体の不活化やゲノムインプリンティング、Alu配列などの外来性DNAの不活化を制御するメカニズムとして重要な役割を担っている。DNAメチル化の異常を引き起こす因子としては、加齢、慢性炎症、ウイルス感染、ピロリ菌感染、喫煙などがあり、これらの要因の影響を持続して受けることにより、特定領域のDNAメチル化異常が誘発される。現在、癌におけるDNAメチル化の異常が明らかにされると共に、癌の診断や予後のマーカー、治療の標的として臨床応用する試みがなされている。DNAメチル化は、癌以外の神経、免疫、代謝等の疾患においても関与する可能性が指摘され、現在最も注目されている研究分野の一つである。

近年開発された次世代シークエンサーは、超並列処理配列決定法により大量の短いDNA断片を高速に処理し、塩基配列を決定することを特徴としている。この技術は、ゲノム全体のヒストン修飾の決定、ヒトゲノムのリシークエンス、 転写開始点の検索、完全長RNAのシークエンス、small RNAの検索、SNPs解析、転写因子の結合領域の検索等に用いられるようになり、多岐の分野で応用されるようになった。この技術はDNAメチル化を検索する方法としても使用され、MethylC-seq法、MeDIP-seq法、MSCC法などの様々な方法が開発されている。次世代シークエンサーは、シークエンスを行う事自体にかかる費用はこれまでの手法と比較すると格段に高価であるが、取得できるシークエンスが格段に増えたことにより、今までと同量のシークエンスを得るために必要な単価は安くなるという特徴を有する。次世代シークエンサーを効率よく使用する為には、"大量のシークエンス"を"安い単価"で得ることが出来るという利点を最大限に利用した方法を考える必要がある。

そこで今回、メチル化感受性制限酵素と次世代シークエンサーを併用することを考えた。制限酵素認識サイトのDNAメチル化を特異的に測定出来るメチル化感受性制限酵素を使用することは、測定される部位を特定し、解析に必要なデータ量を最小限に留める事につながる。私はこのような簡略化したデータからゲノムワイドなDNAメチル化を検出する方法methylation-specific digital sequencing (MSDS法) を開発した。

ゲノムワイドなDNAメチル化の変化をより簡便に測定する為に、制限酵素認識サイトの数を抑えつつ、測定可能なCpG islandの数を最大限に増加させる制限酵素の組み合わせを検討した。その結果、6塩基認識のメチル化感受性制限酵素を3種類(BssHII、EagI、SacII)選択した。ヒトゲノムには、各々72,899、90,190、66,312ヶ所の制限酵素認識サイトが存在する。この3種類を組み合わせて使用することにより、全CpG island数の75%となる21,164ヶ所のCpG islandと、13,978ヶ所の遺伝子のプロモーター領域を測定することが出来る (表1)。

メチル化感受性制限酵素は、認識配列にメチル化されたCpGヌクレオチドが存在すると消化されない。言い換えれば、メチル化されていないCpGヌクレオチドのみが存在する制限酵素認識サイトを消化する為、その切断端に存在する認識サイトのCpGヌクレオチドは当然メチル化されていない。MSDS法はメチル化感受性制限酵素により切断された制限酵素認識サイトとその周囲の塩基配列を次世代シークエンサーで大量にシークエンスする方法である為 (図1)、シークエンスtagの出現頻度の高い認識サイトとは、メチル化感受性制限酵素を使用して切断された認識サイトの事であり、その認識サイトに存在するCpGヌクレオチドのメチル化の程度は当然低くなる。各認識サイトがシークエンスされた数=tag数を、データ解析の過程でMSDSスコアとして扱った。

MSDS法の有用性を確認する為、大腸癌細胞株のHT29とHCT116細胞に対してMSDS法を行った。得られたtag情報を基に、ヒトゲノムから制限酵素認識サイトを含む100余りの部位をランダムに選択し、その部位のDNAメチル化割合をDNAメチル化の絶対定量法であるbisulfite-sequencing法で測定し、MSDS法を使用して得たMSDSスコアと比較した。その結果、MSDSスコアが高値であるとDNA低メチル化であるという逆相関の関係にあることが明らかとなった(図2-A)。この結果から、制限酵素認識サイトはMSDSスコアを基に3種類のグループに分けることが出来た(図2-B)。MSDS法は同一の細胞内におけるDNAメチル化の有無だけでなく、異なる細胞においてDNAメチル化が異なる領域の検索にも使用できる事を確認した。

次に、正常ヒト乳腺上皮細胞 (Normal human mammary epithelial cells ; HMEC)に対してMSDS法の解析を行った。図2-Bで使用したMSDSスコアを基にしたグループ分けを、全ての制限酵素認識サイトに対して行い、ゲノムワイドなDNAメチル化を計測した。その結果、全制限酵素認識サイトは、DNA高メチル化、低メチル化のいずれかに偏ったDNAメチル化パターンを示した制限酵素認識サイトで約90%を占めていた。遺伝子周囲のDNAメチル化割合は、プロモーター領域においてDNA低メチル化なサイトの割合が高く、逆にgene-bodyにおいてDNA高メチル化なサイトの割合が高いことが示された。そして、いずれの領域においても、CpG island上のサイトはそれ以外のサイトと比較してDNA低メチル化なサイトの割合が高いことが明らかとなった。遺伝子周囲のDNAメチル化サイトの割合とその遺伝子発現量の関係では、発現量が高い遺伝子は転写開始点周囲にDNA低メチル化なサイトの割合が高い、逆に発現量の低い遺伝子はDNAメチル化サイトの割合が転写開始点からの距離に依存しないという結論に至った。細胞ごとに異なるDNAメチル化割合を示した領域differentially methylated regions (DMRs)の存在部位はCpG island shore (CpG islandの周囲±2000bpの範囲)に有意に多く観察されたが、遺伝子のTSS周囲にはあまり存在しないことが示された。しかし、遺伝子発現量との関係において、プロモーター領域のDMRsと遺伝子発現量との相関を認めた。以上の結果より、プロモーター領域のDMRsは数自体少ないが、その多くが"遺伝子発現を制御する働きを持つDMRs"であることが示唆された。

プロモーター領域にDMRsが存在して、遺伝子発現量が5倍以上変化していた遺伝子として、cell cycleに関与するSMPD3、VASH1、 TACC1遺伝子や、apoptosisに関与するRIPK3、TNFSF9遺伝子、cell adhesionに関与するCLDN1、NELL1、ROBO1、ENG、PLEKHC1 等の発癌過程に重要な遺伝子が挙げられた。これらの遺伝子の中には既にがん抑制遺伝子として機能し、遺伝子発現がDNAメチル化によりコントロールされている事が報告されているものもあるが、新たにTACC1、CLDN1、PLEKHC1の遺伝子においてDNAメチル化との関係を示唆された。今回注目した遺伝子周囲のメチル化の変化は悪性度や転移のしやすさ等の癌細胞個々の特徴をとらえている可能性が考えられた。

今回の結果から、MSDS法は遺伝子のプロモーター領域やCpG islandに限らず、様々な部位のDNAメチル化を測定する事が可能であることが明らかとなった。さらに、細胞集団のDNAメチル化を比較的簡便に測定、比較を行う際に有用な方法であると考えられた。癌をはじめとした様々な疾患に関連するDNAメチル化異常を同定し、癌の診断や新たな分子標的薬剤の開発などの有用なDNAメチル化パターンの同定に役立つと考えられる。今後、DNAメチル化測定法に必要とされるサンプル量が1分子レベルまで減量することが可能になれば、検診のような簡便なスクリーニング検査の場で、疾患に侵される前に、疾患発症のリスクを知ることが出来る可能性がある。この事は予防医学から見るに、大いに役立つものと考えられる。MSDS法の研究がこれからのメチル化測定のさらなる発展の一助となることを期待している。

表1 使用したメチル化感受性制限酵素のリスト

制限酵素名、認識配列、制限酵素サイト数、制限酵素が1ヶ所以上存在するCpG islandの数と割合、制限酵素サイトが1ヶ所以上存在する遺伝子のプロモーター領域の数を示す。上からBssHII、EagI、SacII、の情報で、最後に3種類の制限酵素を組み合わせた場合のデータを表示した。プロモーター領域はTSS±500bpとした。

図1 MSDS法のサンプル作製プロセス MSDS法では、メチル化感受性制限酵素のBssHII、EagI、SacIIを使用した。メチル化感受性制限酵素は、認識サイトがDNAメチル化されていると消化されない。まず、ゲノムDNAをメチル化感受性制限酵素で消化し、その断端に、各制限酵素に対応したビオチン化リンカーを接続した。その後、超音波破砕装置でDNAを断片化し、その切断端を平滑化した。ストレプトアジビンビーズで、ビオチン化リンカーが接続した制限酵素認識サイトとその周囲のDNA断片を回収及び濃縮した。ビオチン化リンカーの接続部位とは逆の断端に、平滑バーコードリンカーを接続した。PCR反応で増幅した後、次世代シークエンサーでシークエンスを行い、データを得た。

図2 MSDSスコアとDNAメチル化 (bisulfite-sequencing法) の関係 A.bisulfite- sequencing法で測定した100ヶ所のDNAメチル化データを利用して、その部位のMSDSスコアを散布図で示した。 X軸がMSDSスコア、Y軸がDNAメチル化状態(%)である。B. MSDSスコアを基準として、各tagをDNAメチル化の程度によるグループ分けを行った。Kruskal-Wallis検定を使用して解析すると、tagは3種類のグループに分けることが出来た。箱の下端が第一四分位値、上端が第三四分位値に対応する。線記号は中央値、ひげの下端が5パーセンタイル、上端が95パーセンタイルを示す。MSDSスコアが0~5のtagはDNAメチル化が高く(80%~100%)、MSDSスコアが16以上のtagはDNAメチル化が低く(0%~20%)、MSDSスコアが6~15のtagは中間のDNAメチル化を示した。いずれの場合も有意に差を認めた(P<0.01)。

審査要旨 要旨を表示する

本研究はゲノムワイドなDNAメチル化の変化を、低価格且つ簡便に検出するために、次世代シークエンサーとメチル化感受性制限酵素を併用する事を決定し、様々な条件検討の後、methylation-specific digital sequencing (MSDS法)を開発するに至る経緯と、MSDS法を使用して得た結果である。下記の結果を得ている。

1. 発生分化や癌化過程に深く関わり、細胞の形質変化を制御する因子の一つであるDNAメチル化を、ゲノムワイドに測定する方法は多数開発されたが、現状では測定には膨大なデータ量と高額な費用が必要不可欠とされている。この負担を軽減するために、私はメチル化感受性制限酵素と次世代シークエンサーを併用するmethylation-specific digital sequencing (MSDS法) を開発した。

2. 今回DNAメチル化の測定方法を作製する目的は、ゲノムワイドなDNAメチル化の変化をより簡便に測定することである。この為、CpG islandや遺伝子のプロモーター領域、及びそれ以外の領域のDNAメチル化を測定出来る事が必須であり、更に、サンプル作製手技やデータの取り扱いが簡便である事が重要とされた。そこで、制限酵素認識サイトの数を抑えつつ、測定可能なCpG islandの数を最大限に増加させる制限酵素の組み合わせを検討した。検討の結果、目的に最も則した組み合わせとして、メチル化感受性制限酵素のBssHII、EagI、SacII という6塩基認識酵素を3種類組み合わせて使用する事と決定した。

3. MSDS法で使用した3種類のメチル化感受性制限酵素の切断効率が、実際に制限酵素認識サイトに存在するCpG ヌクレオチドのDNAメチル化と相関する事を確認した。確認用のサンプルとして、3種類の制限酵素認識サイトを含み、全塩基配列の判明しているλDNAを用意した。λDNAはDNAメチル化が存在しないため、CpG ヌクレオチドが高メチル化となる完全メチル化λDNAを作製した。λDNA、完全メチル化λDNA、両者を1:1で混ぜたλDNAの3種類のサンプルをメチル化感受性制限酵素で消化して、切断状況を電気泳動で確認した。その結果、制限酵素の切断効率とDNAメチル化割合に相関関係がある事を見出した。

4. MSDS法における、3種類のメチル化感受性制限酵素の使用する順番を決定する為、同じゲノムDNAに対して、制限酵素を使用する順番のみを変えたサンプルを作製した。制限酵素の使用順番が変わることにより、制限酵素の切断効率が変化し、シークエンス結果に偏りが生じる可能性を考慮して、シークエンス結果における制限酵素の偏りが最も少ない使用順番を選択した。その結果、SacII→EagI→BssHIIという使用順番を選択した。

5. MSDS法では短いDNA断片を得る際に超音波破砕装置を使用する為、λDNAを使用して超音波破砕の使用条件の検討を行った。超音波破砕時間と破砕条件を変えた際に出来るDNA断片のサイズと回収量を、電気泳動とAgilent 2100バイオアナライザーを使用して確認した。その結果、MSDS法で使用する120~160bpのDNA断片は、超音波破砕装置の条件を、1サイクルをon;5秒、off;15秒、超音波破砕時間を計300秒とした際に最も回収量が多いことが判明し、これを設定した。

6. メチル化感受性制限酵素は、認識配列にメチル化されたCpGヌクレオチドが存在すると消化されない。言い換えれば、メチル化されていないCpGヌクレオチドのみが存在する制限酵素認識サイトを消化する為、その断端に存在する認識サイトのCpGヌクレオチドは当然メチル化されていない。MSDS法はメチル化感受性制限酵素により消化された制限酵素認識サイトとその周囲の塩基配列(tag)を次世代シークエンサーで大量にシークエンスする方法である為、シークエンスの出現頻度の高い認識サイトとは、メチル化感受性制限酵素を使用して消化出来た認識サイトの事であり、その認識サイトに存在するCpGヌクレオチドのメチル化比率は当然低くなる。しかし、各tagはその特異的な塩基配列により、出現頻度が上昇する場合や、低下する場合、時には出現自体しなくなる可能性がある。原因として塩基配列の特異性、実験手技、サンプルの突然変異等が考えられるが、事前に推測する事が可能な原因に対処する為、あらかじめ利用可能なtagを選別した。選別によりtagは458,802ヶ所から、86,897ヶ所に集約された。また、集約されたtag数をMSDSスコアと名付けた。

7. MSDS法を使用して収集したシークエンス情報 (tag) を使用してゲノムワイドなDNAメチル化を測定する事が可能である事を確認する為に、ヒト大腸癌細胞株であるHT29とHCT116の計2種類の細胞株に対してMSDS法を施行した。HT29、HCT116の2種類の細胞株から、それぞれ2,397,132 個と2,971,226 個のヒトゲノムに存在する塩基配列として認識され、使用した3種類のメチル化感受性制限酵素のいずれかの認識サイトを含むtag情報を回収した。これらのtag情報の中から、HT29から1,493,950 個の、HCT116から1,886,310 個のtag情報を、MSDSスコアとして使用した。

8. MSDS法の有用性を確認する為、ヒトゲノムから制限酵素認識サイトを含む100余りの部位をランダムに選択し、その部位のDNAメチル化割合をDNAメチル化の絶対定量法であるbisulfite-sequencing法で測定した。その上で、bisulfite-sequencing法で測定した制限酵素認識サイトのDNAメチル化と、MSDS法を使用して得たMSDSスコアを比較した。この結果、MSDSスコアとbisulfite-sequencing法で測定したDNAメチル化は、MSDSスコアが高値であるとDNA低メチル化であるという逆相関の関係にあることが示唆され、制限酵素認識サイトもMSDSスコアを基に3種類のグループに分けられた(DNA高メチル化、DNA中程度メチル化、DNA低メチル化)。

9. 全制限酵素認識サイトに対してMSDSスコアを基にしたグループ分けを行うと、約30%がDNA低メチル化グループに、約60%がDNA高メチル化グループに属していることが判明し、DNA高メチル化、低メチル化の両極端なDNAメチル化パターンを示す制限酵素認識サイトで約90%を占めていた。遺伝子周囲のDNAメチル化割合は、プロモーター領域においてDNA低メチル化なサイトの割合が高く、逆にgene-bodyにおいてDNA高メチル化なサイトの割合が高いことが示された。そして、いずれの領域においても、CpG island上のサイトはそれ以外のサイトと比較してDNA低メチル化なサイトの割合が高いことが明らかとなった。

10. 遺伝子発現とDNAメチル化の関係を測定する為、遺伝子を、5'SOLiD法で測定した遺伝子発現量を基に3種類のグループに分けた。3種類のグループで遺伝子の周囲に存在するDNAメチル化を測定すると、発現量が高い遺伝子はTSS周囲のDNAメチル化が低下している傾向が強く、逆に発現量の低い遺伝子はDNAメチル化がTSSからの距離に依存した変化を示さないという結論に至った。

11. 大腸癌由来の細胞株であるHT29とHCT116細胞のDNAメチル化が、どのような部位で、どの程度異なるかを検討する為に、MSDSスコアを基にHT29とHCT116のDNAメチル化を比較した。この2種類の細胞株間でDNAメチル化が異なった部位 (DMRs) は、全制限酵素認識サイトの9%に当たる7,903サイト存在した。DMRsの存在部位に関しては、DMRsはCpG island shore (CpG islandの周囲±2000bpの範囲)に有意に多く観察されたが、遺伝子のTSS周囲にはあまり存在しないことが示された。遺伝子発現量との関係において、プロモーター領域のDMRsと遺伝子発現量との相関を認めた。以上の結果より、プロモーター領域のDMRsは数自体少ないが、その多くが"遺伝子発現を制御する働きを持つDMRs"であることが示唆された。

12. 異なる細胞株として、正常ヒト乳腺上皮細胞 (Normal human mammary epithelial cells ; HMEC)を用いて、DNAメチル化の比較を行った。HMEC細胞から、1,346,711個のヒトゲノムに存在する塩基配列を回収した。このうちの64.2%にあたる864,430個のtagをMSDSスコアとして利用した。このデータを用いて、HT29、HCT116とHMEC細胞のDMRsのなかから、POPDC3、UCHL1、CHCHD6、WT1遺伝子の周囲に存在した4カ所を選択した。この4種類のDMRsが他の大腸癌細胞株や膵臓癌細胞株において示すDNAメチル化を、MSP法を用いて検索した。その結果、癌細胞のDNAメチル化は、UCHL1遺伝子のように癌細胞で均等に変化を起こしやすい部位と、POPDC3、CHCHD6、WT1遺伝子のように個々の癌細胞で異なる表現系を示す部位の両方が存在する事が示唆された。

13. HT29、HCT116とHMEC細胞のDMRsの働きを測定する為、以下の3点の条件を満たすCAMK2N1、MSL2、TNFSF9、GFI1遺伝子周囲の4種類のDMRsを選択した。 "(1)DMRが遺伝子のTSSから1~5kbpの距離に存在する事"、"(2)DMRよりもTSSに近い領域に制限酵素認識サイトが存在する事。そして、その領域はHT29、HCT116、HMEC全ての細胞においてDNA低メチル化である事"、"(3)このTSSに関係する遺伝子の発現量が、細胞ごとに大きく異なっている事"。このDMRsのDNAメチル化の有無が遺伝子発現に与える影響を測定する為に、レポーターアッセイを行った。その結果、CAMK2N1遺伝子のintronに存在したDMRは、周囲の塩基配列と共にエンハンサー活性を持つ事、その活性はDMRにおけるDNAメチル化の割合によりコントロールされている事が示唆された。

14. MSDS法と4塩基認識のメチル化感受性制限酵素であるHpaIIを使用した方法を比較した。HpaIIはCCGGという4塩基を認識して、94.2%ものCpG islandを検索する事が可能であるが、それと引き換えに、制限酵素認識サイトが2,302,391ヶ所存在するという制限酵素である。HpaIIには同じ4塩基を認識するメチル化非感受性制限酵素のMspIが存在する為、比較対象として使用した。HpaIIとMspIを使用した方法でそれぞれ4,189,531個、5,714,853個のヒトゲノムにマップされた塩基配列を回収した。MSDS法と同様に、HpaII、MspIを使用して得られたデータとbisulfite-sequencing法で測定した制限酵素認識サイトのDNAメチル化を比較した。この結果、メチル化感受性制限酵素であるHpaIIを使用した場合は、シークエンスされた回数が多いほどDNAメチル化が低いというMSDS法と同様の結果を得た。一方メチル化非感受性制限酵素であるMspIを使用した場合は、シークエンス回数とDNAメチル化に関係がないことが示された。しかし、"シークエンスされなかった部位"="tagが0個の部位"がどのようなDNAメチル化を示すのかを判断するには不十分な結果であった。これはシークエンスによって収集したデータの数が少なかった為、制限酵素サイトの全体をカバーできていない事が推測された。以上の結果より、MSDS法では十分にDNAメチル化を測定することが可能なシークエンス数であるにも関わらず、HpaIIを使用した場合は不十分な結果しか得ることが出来ないという事が明らかとなった。

以上、本論文ではHT29とHCT116の2種類の大腸癌細胞株のDNAメチル化を、今回開発したMSDS法を用いて解析した。他の細胞株を用いたデータや、4塩基認識の制限酵素(HpaII)を使用した方法との比較からMSDS法の有用性を明らかにした。本研究により得られた結果から、MDSD法はDNAメチル化の解明に重要な貢献をなすと考えられ、学位の授与に値するものと考えられる。

UTokyo Repositoryリンク