学位論文要旨



No 217549
著者(漢字) 大田,佳宏
著者(英字)
著者(カナ) オオタ,ヨシヒロ
標題(和) 転写の時空間モデリングとシミュレーション
標題(洋) Spatial-temporal Modeling and Simulation of Transcription
報告番号 217549
報告番号 乙17549
学位授与日 2011.09.09
学位種別 論文博士
学位種類 博士(数理科学)
学位記番号 第17549号
研究科
専攻
論文審査委員 主査: 東京大学 教授 時弘,哲治
 東京大学 教授 楠岡,成雄
 東京大学 教授 坪井,俊
 東京大学 准教授 稲葉,寿
 東京大学 准教授 WILLOX RALPH ISIDORE
 東京大学 特任教授 井原,茂男
 東京大学 特任准教授 堤,修一
内容要旨 要旨を表示する

遺伝子のDNA配列を鋳型に、RNAポリメレースII(RNAPII)という酵素が遺伝子上を5'側から3'側の方向へ転写を行いながら移動することでRNAが作られ、そのRNAの配列を元に蛋白質が作られることは、生命の基本原理と考えられている。近年、ゲノム解読からヒト染色体のもつDNAの配列が明らかになり、RNAが生成されていく全体像を解読することが可能となってきた。しかし、このDNAからRNAが生成される過程を、時間と空間において高分解能で精密に解析するのは困難だった。

本論文では、ヒトの血管の細胞が炎症刺激を受けた後、7.5分おきにRNAが作られていく様子を染色体上で観測し、RNAPIIが3100塩基(約1ミクロン)/分の速度で動き、さらにCTCF/CohesinにおいてRNAPIIの速度が遅くなることを、時空間上において高い分解能で解明した。

具体的には、空間分解能の高いカスタムタイリングアレイを独自に設計し、細胞刺激後にRNAPIIが作るRNAを7.5分という短い時間間隔で計測し、その結果得られる大量データの解析を行い、遺伝子上の転写産物の時間変化を特定した。ここでは、遺伝子上のプローブ特性を考慮したd(probe(Gx))/dtを用いて転写速度を導出し、イントロンについては通常のPremature termination (Ck(ik-xk/v))から逸脱した箇所を網羅的に解析した結果、転写開始点(TSS)近傍に特異点を発見した。

従来ポリメラーゼは確率的に動いたり止まったりすると考えられていたが、今回ChIP-Seq Intensity評価法に基づき、RNAPIIの密度分布の強度S(x,t) >ζを満たす全ての(x,t)についてΣS(x,t)/Nを計算することで、CTCF/Cohesinの存在密度が高い領域ではRNAPIIの速度が遅くなり、逆に存在密度が低い領域では速度が速くなるという転写ダイナミクスの制御を明らかにすることができた。通常DNAはCTCF/Cohesinという蛋白質が作用することで束ねられる。RNAPIIは活性化される前からこのCTCF/Cohesinで区切られた染色体上の特定の狭領域に集まっているが、活性化されるとそこから動きだし、先の部分ではCTCF/Cohesinの存在密度に応じて速度変化しながら転写していくというダイナミカルな描像を得ることができた。

次に、本論文ではこれら実験データの解析結果に基づいて、RNAPIIが遺伝子を転写していく運動をモデル化し、シミュレーションを行うことで転写モデルの実証を行った。具体的には、(1)RNAPII実体の運動モデルとしてセルオートマトン(CA)を用いて時間発展のシミュレーションを行い、さらに(2)RNAPIIが生成したRNAの時空間上での発現量シミュレーションを行うことで、ヒト遺伝子群でのRNAPIIの挙動から、その産物であるRNAを生成するモデリングまで行った。

(1)においては、1遺伝子の構造をn個のセルユニットに分割し、その各セルユニットにおけるRNAPIIの存在量を規定するベクトル、r(t)=(r0(t), r1(t), ..., rj(t), ..., rn(t))を導入する。ここで、CAはRule184に準拠すると仮定した。この時、rj(t+τ) = F[rj-1(t)-rj(t)]を満たし、j番目のRNAPIIは1つ前のRNAPIIから関数Fの影響を受けるものとした。さらに、CTCF/Cohesin存在領域やエクソン領域のような速度変化を引き起こす領域のゲノム領域にγ(x,t)を導入し、このパラメータは時空間的に変化するものとした。

ChIP-Seqにおける強度をモデル化するため、TNFα刺激後の細胞の確率密度分布Pcell(t)を導入すると、複数RNAPIIによる密度変化Qj(t)はΣ(rj(t)* Pcell(t))で表現される。本モデルによるシミュレーション結果は、ヒトの細胞を用いたChIP-Chipによる実験結果を極めてよく再現しており、最適なパラメータ集合を導出することができた。

(2)のRNAの時空間的な発現量解析においては、上記(1)で得られたRNAPIIダイナミクスの座標情報を引数にとり、各遺伝子について発現されるエクソン・イントロン領域のRNA量を時空間上でシミュレーションを行った。ここで、時間・空間の分解能は、生物学実験では扱うことの不可能な1(秒)・1(bp)レベルの高密度・高精度な計算を行った。

単一RNPIIによるRNA減衰モデルは、コピー数をρ、減衰定数をτ、減衰開始時刻をTdとして、ρ*exp(-(t-Td)/τ)を適用した。ここに新たに、TSS蓄積係数λを用いたPremature terminationモデルλ*exp(-((x-ξ)/ε+ (t-δ)/τ)を独自に導入し、単一RNPIIによるRNA算出シミュレーションを行った。さらに、同一遺伝子上には複数のRNAPIIが相互作用しながら転写を行っていると仮定し、上記(1)のベクトルr(t)と結合した協調作用のモデルを導入した。

従来は、衝突・停留などRNAPIIの局所的な相関モデルについての実験および数理モデルの研究は行われていたが、今回新たに長距離・非局所的な協調作用が存在することを明らかにした。長距離・非局所的な協調作用を考慮できるモデルとして、複数RNAPIIにおけるrj(t)とrj+1(t)の転写開始時間間隔Tir(rj)を用いたΣE(x,t,r)を導入し、遺伝子転写モデリングを行った。本モデリングによるシミュレーションの結果、イントロン部分のRNAは時間が経つと消滅し、エクソン部分のRNAは時間とともに蓄積されているのが確認された。また、刺激は常時入ったままであるが、刺激直後からRNAの転写が遺伝子上を波のように伝搬していき、安定的に転写する状態になっていく。この結果は、タイリングアレイにおけるRNA発現量実験の結果を極めてよく再現している。

本モデルによるシミュレーションを、実験結果を再現するためのパラメータバリデーションによって2万回計算することで、複数RNAPII におけるrj(t)とrj+1(t)の間隔Tir(rj)が、Logistic関数d/dr(Tir(r)) = 0.5*Tir(r)*(1-Tir(r)/16) 上にあることも導出した。現在この関数とゲノム構造との関連を解析しつつある。複数RNAPIIが遺伝子上でこのような関係にあることは、「複数のRNAPIIが相互に協調的挙動をとることで、RNA産出のための転写を効率的に行っている」ということを示唆している。

審査要旨 要旨を表示する

本論文の主題は遺伝子の転写における新しい数理モデルの提案と数値シミュレーションによる解析である。転写は、RNAポリメレースII(RNAPII)が遺伝子上を移動しつつ、そのDNA配列を読み、RNAを生成する過程である。生成されたRNAの配列から蛋白質が作られる。一連の過程は分子生物学における基本原理と考えられている。近年の網羅的にDNA配列を計測する高速シーケンシング技術の進歩によって、全DNA上の蛋白質の結合部位の同定、生成された全RNAを決定することは可能になったが、DNAからRNAが生成される過程を、時間と空間において十分高い精度で計測することは困難であった。従って、得られた実験データをもとに、数理モデルを構築し、そのモデルから任意の遺伝子における転写の過程を予測することは極めて重要である。しかし、従来は、原核生物においていくつかの試みはあるものの、様々な協調作用が働いていると考えられている真核生物特にヒトの細胞で、定量的に転写の過程を予測可能な数理モデルは構築されていなかった。

これに対して、本論文では、ヒトの細胞に対して、定量的に転写の過程を予測することが可能な数理モデルを提案している。真核生物の遺伝子構造を反映してRNAPIIが速度変化するモデル化を行い、相関を入射の時間間隔で取り扱うために全過程を時間ドメインで定式化したセルオートマトン(CA)モデルを定式化した。遺伝子をN個のセルに分割し、順に1~Nの整数値の番号をつけ、n番目のRNAPIIの時刻 t での位置を とする。CAでは、これらの独立変数、従属変数はすべて整数値をとる。運動方程式はTASEP(Totally Asymmetric Exclusion Process)に空間依存性を導入したもので、境界以外では 〓と表すことができる。ここでv(xtn) は位置に依存する最高速度で、イントロン部、エクソン部、さらにRNAPIIの移動の障壁となる蛋白質(Blockade)の存在するセルで異なった値をとるものとする。境界条件については、SAMD4A遺伝子での実験結果を考慮して、周期境界条件とし、初期条件(RNAPIIの入射時間)は実験データより最適化した値を用いた。また、生物実験では多数の細胞を扱っているために細胞の刺激に対する応答の遅れ分布をPoisson分布と仮定した。モデルに導入されたパラメータはSAMD4A遺伝子の実験データから求めたものであるが、このモデルを、Blockadeの少ないKnock Downセルや他の遺伝子に適用し数値シミュレーションを行った結果、実測されたRNAPIIの密度分布、生成されるRNAの強度など、転写の素過程が定量的によく再現することを示した。その意味で本モデルは様々な遺伝子に適用可能な一般性のあるモデルと言える。

本論文の第1 章は転写過程におけるRNAPIIの動力学に関する従来のモデルとその特徴の説明にあてられ、第2 章では申請者がデータ解析を担当した薬剤刺激を与えたときに細胞が応答するときの遺伝子の転写の過程を時間的空間的調べた結果について述べられている。第3 章では、セルオートマトンの従来研究を一般的に概観している。第4 章がセルオートマトンの転写過程における定式化とその応用の主結果である。RNAPIIが遺伝子の領域で速度を変化させた場合の通常の遺伝子上で起きていると考えられる自由流れのみの状態の場合について、実験結果と詳細な比較により、その相関を入射時間パラメータで記述し、従来認識されていたRNAPIIの衝突・停留などの局所的な相関に加え、RNAPIIに長距離かつ長時間にわたる相関が存在することを見出している。一方、自由流れから渋滞の状態(あるいは渋滞から自由流れの状態)に遷移するときのRNAPIIの臨界密度、臨界流れを予測している。第5 章は前章で得られたRNAPIIのDNA上の密度分布から、これもまた別の実験結果として得られるRNAの密度分布を求めている。第6 章は実験データとシミュレーションからの解析結果とを比較し、考察を述べている。第7 章では総括と今後の展望が述べられている。

以上のように本論文は、セルオートマトンモデルを遺伝子上の転写過程に拡張し、新しい数理モデルを提案し解析し実験結果とも比較し良好な結果を得たものである。相互作用する多体問題、力学系、非線形科学などを数理的に解析する上で貴重な結果である。得られた結果は応用面からも興味深い。論文全体を通して、複雑な計算を実行して明快な結果を得る計算力や、大規模解析のための効率的なプログラム作りにおいていくつか独創的なアイデアが見て取られる。

よって本論文提出者大田佳宏は博士(数理科学) の学位を授与されるに十分な資格があるものと認める。

UTokyo Repositoryリンク