学位論文要旨



No 127237
著者(漢字) 田中,義章
著者(英字)
著者(カナ) タナカ,ヨシアキ
標題(和) ヌクレオソームの配置とダイナミクスのin silico解析
標題(洋) In silico Analyses of Nucleosome Positioning and Dynamics
報告番号 127237
報告番号 甲27237
学位授与日 2011.03.24
学位種別 課程博士
学位種類 博士(生命科学)
学位記番号 博創域第684号
研究科 新領域創成科学研究科
専攻 メディカルゲノム専攻
論文審査委員 主査: 東京大学 教授 中井,謙太
 東京大学 教授 伊藤,隆司
 東京大学 教授 小林,一三
 東京大学 教授 菅野,純夫
 東京大学 教授 渡邉,俊樹
内容要旨 要旨を表示する

1. 序論

真核生物はクロマチン構造を形成して巨大なゲノムDNAを核内に収納している。このクロマチンの基本単位であるヌクレオソームは多くの制御因子(転写因子など)のDNAへのアクセスを制限するため、転写や複製などの細胞内プロセスの制御に重要である。またヌクレオソーム配置は細胞分化や外部環境等によって変化することも知られており、プロモーターなどの機能的な領域上のヌクレオソームリモデリングは遺伝子発現誘導調節の一端を担っている。そのためヌクレオソームの配置やダイナミクスを理解することは転写制御機構の解析に必要不可欠である。そこで本論文ではヌクレオソームの配置とダイナミクスに着目し、大量ヌクレオソーム配列データとコンピューターを用いた3つの研究を行った。

2. 研究内容

2.1. 既存のヌクレオソーム配置予測モデルの比較と生物間でのヌクレオソーム配置のDNA配列依存性の比較

<背景>

ヌクレオソーム配置にはDNA配列依存性があることが知られている。例えばAA/TTやGCが10bp周期で現れる配列はヌクレオソームを形成しやすいことが知られている。近年ではこのような配列依存性を利用したコンピューターによるヌクレオソーム配置予測モデルが数多く提案されている。しかしこれらのモデルのうち、どの方法が最も実験データとよく一致するのか(精度が高いのか)、またこれらのモデルがヒトから酵母までどのようなゲノムにも適応できるのか十分な議論がされていなかった。そこで本研究ではヒト、メダカ、ショウジョウバエ、線虫、酵母のヌクレオソーム分布のデータを用い、代表的な既存の3つのモデル(Segal et al. 2006, Gupta et al. 2008, Miele et al. 2008)について精度の評価を行った。

<結果と考察>

実験的に同定された1000個のヌクレオソーム・非ヌクレオソーム配列をそれぞれ陽性・陰性の正解データとして用意し、各モデルの予測精度をReceiver Operating Characteristic (ROC)カーブで評価した(図1)。その結果、ほとんどのゲノムでSegalらの最新のモデルとGuptaらのモデルが高い精度を示したが、メダカではGuptaらのモデルのみが精度が高かった。また生物間でのヌクレオソーム配置の配列依存性の違いを見るために、各生物のヌクレオソーム配列・非ヌクレオソーム配列で富むオリゴヌクレオチドを比較解析した。その結果、全生物のヌクレオソーム配列で共通に観察されたのはCA/TGとAC/GTでだけであった。また非ヌクレオソーム配列においてはメダカ以外の生物ではpolyA等のAT-richな配列が観察されたが、メダカではGC-richなオリゴヌクレオチドが観察された。このことからヌクレオソームの配列依存性の生物間で相違が示唆された。

2.2. Aluエレメントのヌクレオソーム配置に与える影響

<背景>

ゲノムの約70~80%はヌクレオソームによって占められていることが知られている。そこで次に我々はゲノム全体でヌクレオソームの配置がどれだけヌクレオチドの周期性による影響を受けているのかということに着目した。本研究ではまず16種類のゲノム配列に対しフーリエ解析を行うことでゲノムワイドなヌクレオチドの周期性を観察した。

<結果と考察>

フーリエ解析の結果、哺乳類以上の生物ではヌクレオソーム形成に大きく関わることが知られている10bpの周期性が観察されず、霊長類ゲノムでは別に84bpと167bpの周期性が特異的に観察された。この167bpはコアヒストン(147bp)とリンカーヒストン(20bp)が結合する領域の長さに一致する。さらにこれらの周期性は霊長類ゲノム特異的な反復配列のAluエレメントを除くと観察されなくなることも明らかになった。そこで次にモノヌクレオソームのpaired-endシーケンシングデータを使って、Aluエレメントとその周辺のヌクレオソーム分布を調べた。その結果、Aluとその周辺のヌクレオソーム配置が整列化されていることが明らかとなった(図2)。また別のヌクレオソーム分布のタイリングアレイデータを使って同様の解析を行うと、周辺領域におけるヌクレオソーム配置の整列化が観察された。よってAlu配列にはその中だけでなく周辺のヌクレオソーム配置にも影響を与えることが示唆された。

2.3. ゲノムワイドなヌクレオソームリモデリングの解析

<背景>

ヌクレオソームリモデリングはこれまで一部のプロモーター上でのみで解析されてきたが、ゲノム全体でどのヌクレオソームが安定または不安定に配置されているのか十分にわかっていなかった。そこで我々は異なる条件下で得られたヌクレオソーム分布のデータを比較解析することで、ゲノムワイドなヌクレオソームリモデリングのプロファイルを得る方法を提案し、検証・解析を行った。

<結果と考察>

公共データベースに登録されている7種類の別々の実験条件から得られた酵母のヌクレオソーム分布のデータから、"entropy"と"linker ratio"の2つの指標を作成した(図3A)。前者はヌクレオソーム配置のデータセット間での差の度合いを、後者はオープンクロマチンの割合を示す。ヌクレオソーム配置がunstableかstableか実験的に証明されたデータ間でentropy値を比較したところ、unstableなヌクレオソームはentropy値が有意に高いことが示された(図3B)。また転写因子結合サイト周辺について両値を調べたところ、クロマチンリモデリング活性を持つと報告されている4つの転写因子は"entropy"と"linker ratio"が他の因子に比べ高く、一方、リモデリングの阻害機能が報告されているYhp1は両方の値が全因子の中で最も低い値を示した。以上の結果から我々が提唱した2つの指標はヌクレオソームリモデリングの度合いを反映していることが示唆された。

さらにプロモーター領域における本指標を利用し、遺伝子発現との関連を解析した。遺伝子発現量としては100以上のDNAマイクロアレイの標準偏差値を使った「発現変化の大きさ」とRNA-Seqのタグ数による「発現量の強さ」について解析した。その結果、プロモーター領域における"entropy"値は「発現変化の大きさ」と有意に相関するが、「発現量の強さ」とは相関しないことが明らかとなった。このことからプロモーターにおけるヌクレオソームリモデリングはmRNA量を制御せず、遺伝子発現のon/offのみを制御することが示唆された。また他のエピジェネティック因子との関連としてヒストンメチル化・アセチル化のChIP-chipデータとの比較解析も行った。その結果H3K4me1、H3K4me3、H3K14acがentropy値と有意な相関を示した。特にエンハンサーマーカーであるH3K4me1が富む領域ではentropyの値が有意に高く、ヌクレオソームリモデリングが起こりやすいことを示した。

3. 結論

ここ数年の間、ヌクレオソーム、DNAメチル化、ヒストン修飾といったゲノムの後天的な修飾(エピゲノム)情報が大量に得られるようになった。現在、これらの情報は遺伝子発現制御の基礎研究だけでなく再生医療や疾患などの解析にも応用されており、今後大規模なエピゲノム情報を利用した解析が様々な分野で必要不可欠になっていくと考えられる。そこで我々はヌクレオソームデータに重点を置き、そのDNA配列依存性の生物間における特徴やリモデリングの解析を示した。本研究で得られた結果は、今後ヌクレオソームの形成のメカニズムや遺伝子発現制御等への影響を理解していく上で重要な結果であると考えられる。

図1.ヒトとメダカにおける各モデルのヌクレオソーム配置予測精度の比較。

(Y. Tanaka and K. Nakai, Genome Informatics, 2009より引用)

図2.Aluエレメント周辺のヌクレオソームの分布。赤線はユニークにマッピングされたヌクレオソームDNAタグ、青線はランダムに抽出したゲノム断片から作成。円は赤線より推定したヌクレオソーム位置を示す。X軸はAluの中心位置からの距離、Y軸はヌクレオソームDNAタグの頻度の平均値を表す。

(Y. Tanaka, R. Yamashita, Y. Suzuki and K. Nakai, BMC Genomics, 2010より引用)

図3.A) ヌクレオソームリモデリングのプロファイル。赤のボックスは各データセットのヌクレオソーム位置を示す。黒枠や緑枠のようにヌクレオソームの欠失がある領域では"linker ratio"の値が高くなり、赤枠のようなヌクレオソームが密に存在する部分(closed chromatin)では低くなる。一方でヌクレオソームの欠失が一部(dynamic open chromatin、黒枠)か全データセット(stable open chromatin、緑枠)かは"entropy"の値で区別できる。B) 既知のunstableとstableヌクレオソーム間でのentropy値の差。

(Y. Tanaka, I. Yoshimura and K. Nakai, Chromosoma, 2010より引用)

審査要旨 要旨を表示する

本論文は、真核生物の遺伝子発現制御などに重要な役割を果たしているとして、近年注目を集めているヌクレオソームのゲノム塩基配列上の配置と、その動的変化について、コンピュータで解析した結果をまとめたものである。ヌクレオソームはヒストンという真核生物間で進化的に高度に保存されたタンパク質の複合体の周囲をDNAが約2回転巻き付いた構造をしており、核内で長大なDNAが格納される様式(クロマチン構造)の基本単位となっている。活発に転写が行われている遺伝子の周囲では、ヌクレオソーム構造が消失しているなど、ヌクレオソームがゲノム上にどのように配置されているか、あるいはどのような原理に従って配置されるかは、転写制御メカニズムを理解する上で非常に重要である。さらに、ヒストンタンパク質の特定の残基がリン酸化等の修飾を受けることで、ヒストンの配置が変化する現象も知られており、エピジェネティクスと呼ばれる、塩基配列情報以外の要因が関わる生命現象の典型例として、転写制御研究の最前線を形成している。ことに近年、DNAシークエンサーの性能が驚異的に進歩し、これを用いたいわゆるChIP-seq法などによって、生物のゲノム全体にわたるヌクレオソーム配置情報や、ヒストンの修飾情報が比較的容易に得られるようになってきた。また、インターネット技術の進歩や公共データベース活動の充実により、そのような最新データが論文と同時に一般公開され、自由にダウンロードできるようになった。論文提出者は、そのような状況の中で、入手可能ないくつもの実験データを駆使して、以下に述べるような興味深い解析結果を得ている。

論文の主な内容は3つの章に分かれている。

第一章には、主に塩基配列からヌクレオソームの位置を予測する複数のアルゴリズムを性能評価した研究結果が記されている。上述のように、ヌクレオソームの配置はエピジェネティックな効果の影響を受けることが知られているが、一方、DNAの立体構造はその塩基配列にもある程度影響されるため、ヌクレオソーム構造をとり易くなるような(あるいはそれを忌避するような)配列パターンも存在する。このような配列依存性をモデル化して、与えられた塩基配列中のヌクレオソームの位置を予測するアルゴリズムがいくつか発表されてきた。そこで申請者は、いくつかの生物種における網羅的なヌクレオソーム位置決定実験結果を用いて、それらの予測法の精度の評価を試みた。さらに、それらの実験結果から、生物種毎にヌクレオソーム位置に好まれる配列パターン、ヌクレオソーム間のリンカー領域に好まれる配列パターンを抽出し、その比較を行った。いずれの結果からも、ヌクレオソーム構造自体の進化的保存性とは裏腹に、ヌクレオソームの位置決定の配列依存性は、種によって大きく異なることが示唆された。

続く第二章では、ヌクレオソーム位置の配列依存性を、配列の周期性から調べた研究について述べている。ジヌクレオチド配列出現のフーリエ変換を用いて、様々なゲノム塩基配列における周期性を調べてみたところ、従来酵母を用いた研究等で示唆されてきたヌクレオソーム構造に特徴的な周期性は、高等生物のゲノムではそれほど顕著でなく、霊長類ではAluリピートに起因するずっと長い周期性の方が顕著であった。この周期がちょうどコアヌクレオソームとリンカー領域を1単位とする長さに一致するため、Alu配列とヌクレオソームの位置関係を詳しく調べてみたところ、ヌクレオソームはAlu配列中の決まった位置を好んで配置されていることが、確認できた。そればかりか、その周囲のヌクレオソームの位置取りにまで影響している様子が観察された。

最後の第三章では、複数の研究者や条件下で決定されたヌクレオソームの位置データを重ね合わせてみれば、ヌクレオソームが動き易い場所と、動きにくい場所を特定できるのではないかという発想で、酵母ゲノムにおけるヌクレオソームの動的情報を抽出するという研究について述べている。動的情報を示す二つの指標として、エントロピーとリンカー率の二つを定義したところ、確かにそれらの量は実験で得られたヌクレオソームの不安定性(または安定性)と相関していた。さらに、各遺伝子の転写開始点付近のヌクレオソームの動的情報を調べてみると、各遺伝子の発現頻度のゆらぎとの相関が観察されたほか、制御される遺伝子の機能にも特徴がみられるなど、数々の興味深いデータを報告している。

以上の研究は、従来ゲノム塩基配列の解析からはアプローチが難しかったエピジェネティクスの効果を、最新の実験データを自由に取捨選択して、配列解析の枠組みから、生物学的に有用な形で示したオリジナルな成果であり、学術的に評価できる。したがって、博士(生命科学)の学位を授与できると認める。

UTokyo Repositoryリンク