学位論文要旨



No 122733
著者(漢字) ノマン ナシムル
著者(英字) Noman Nasimul
著者(カナ) ノマン ナシムル
標題(和) Memeticアルゴリズムを用いた遺伝子制御ネットワークの推定
標題(洋) A Memetic Algorithm for Reconstructing Gene Regulatory Networks from Expression Profile
報告番号 122733
報告番号 甲22733
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(科学)
学位記番号 博創域第270号
研究科 新領域創成科学研究科
専攻 基盤情報学専攻
論文審査委員 主査: 東京大学 教授 伊庭,斉志
 東京大学 教授 金田,康正
 東京大学 教授 近山,隆
 東京大学 助教授 佐藤,文俊
 東京大学 助教授 峯松,信明
 東京大学 助教授 杉本,雅則
内容要旨 要旨を表示する

近年の分子生物学の急速な進歩は,多くの新領域,複合領域の応用研究の発展を促した.新しい研究領域の一つに,生物有機体の全てをシステマティックに説明しようとするシステム生物学がある.システム生物学は,新しい生物システムの設計と,現存生物の制御を可能とする事を研究の目的としている.目的を達成するためには,現存生物の構造の特徴と,その振る舞いを明らかにするという基礎研究が必要になる.そのような特徴と振る舞いは,遺伝子の携帯で必要な全ての情報を含むゲノムと相互作用をする,分子の構成要素間の複雑な制御ネットワークによって決定される.この制御ネットワークとネットワークの働きのメカニズムを解明することが,シスム生物学における重要な課題である.

現在の所,多くの生体内作用の中心である遺伝子の制御関係は,プロモーター遺伝子によるシス作用制御と,その他の遺伝子の転写因子によるトランス作用制御の組合せであると考えられている.現象論的モデルを用いてシス作用を単純化すれば,遺伝子間の全てのトランス作用は「遺伝子制御ネットワーク」としてモデル化することができる.しかしながら,この生体制御ネットワークは動的かつ高次の非線形的性質を持っており非常に複雑であるため,このネットワークで表現される生体内要素やその依存関係,分子レベルでの相互作用の解明が進んでいなかった.

ところが最近,DNAマイクロアレイやオリゴヌクレオチドチップなどの測定のための新技術が開発され,複数の遺伝子発現の時系列変化や定常状態データを高速かつ同時に測定する事が可能になった.ゲノム規模でトランスクリプトームを観測することにより,ゲノム活性の構造と動的な変化について大域的な視点から考察を行うことができる.観測によって得られた大量の実験データにより,特定の生化学プロセスにおける特定遺伝子の活動の包括的な理解が可能になるのみならず,遺伝子制御ネットワークの構造も理解することが可能になると考えられている.従って,大量の生物学な観測データをもとに計算モデルをたて同定を行うシミュレーションにより、遺伝子ネットワークの転写制御を明らかにする手法の開発が必要となっている.

用いられる計算モデルはネットワークの接続関係や速度定数,生化学濃度のようなパラメータを考慮にいれたものである.GRNのモデルとして利用できるものに生化学系理論-モデル化と生化学系の分析のための一般化されたフレームワークに基づくS-systemモデルがある.このモデルは生物学的妥当性と数学的柔軟性の双方の利点を持つ.高次元問題を扱うために、元のモデルは結合した形態からネットワークの推定において有効である分離問題に分解される.この問題に対して進化論的計算手法を用いると,モデルの動的な性質と観測されたシステム応答のノイズの優位水準に優れていることが判明している.そのため進化論的計算手法をS-systemを用いたGRN推定に適用することが期待されている.

現在研究されているS-systemを用いたGRN推定での課題は,(i)疎なトポロジーアーキテクチャを検知すること,(ii)有意水準のノイズにより破損している限られた量の遺伝子発現データからkineticパラメータを推定すること,(iii)GRNを同定するために大域的最適解を探索する能力のある効率的な最適化方法を考案すること,の三つである.本論文では,これらの課題に対処するために分解S-systemモデルを利用したGRN推定のためのミメティック方法を提案している.

最初に,有用であるとされる進化アルゴリズム(EA)である標準的なDifferential Evolution(DE)を,交叉に基づく局所探索を用いて性能強化を行った.またDEに近傍探索を組み込み性能向上を狙った.局所探索のためのヒューリスティクスを組み込むことは大域的最適化のための効果的な進化アルゴリズムにとって非常に有効であることが広く知られており,近傍探索を組み込んだEAはMemetic Algorithm(MA)として有名である.

広範囲のベンチマーク問題で実験を行った結果,提案手法である拡張版DEは従来のDEより良いか,同等の性能を持つことが分かった.また,他の有名な進化アルゴリズムとの性能比較も行った.連続ランドスケープ発生器によって生成されるランダム問題で,元のアルゴリズムに対する優越性が確認された.さらに,実問題に対する適合性を,高次非線形,多峰性,だまし要素を含むS-system最適化問題に適用することによって調査した.その結果,実問題の最適化では元のDEと比較して優越性があることが示された.

次に,この効率的かつロバストな最適化アルゴリズムを用いて,分離S-system形態で表される生化学ネットワーク内の転写制御関係を推定するためのミメティックアルゴリズムを設計した.提案アルゴリズムは,ロバストな転写制御関係の同定,正確なキネティックパラメータの推定,ネットワークのアーキテクチャの獲得,そして効率的な計算などの課題の解決を目標として設計した.アルゴリズムの核である,最適化エンジンはmemDEと呼ばれる前述の拡張した最適化アルゴリズムを用いて実装した.さらに,拡張アルゴリズムでは骨格ネットワークを効率的に獲得するための局所探索を組み込んでいる.局所探索では,より疎なネットワークを獲得するために各世代からの最良個体とランダムに選ばれた個体の周辺の山登り探索を行う.また,ネットワーク内の最もロバストな制御関係と正確なキネティックパラメータを同定するために,アルゴリズムを2倍の最適化用に設計した.

ターゲットとするネットワークの最適パラメータの組合せを探索するときに,解候補を評価するための測度が必要となる.最もよく用いられている評価基準は数値計算によって算出される遺伝子発現レベルと観測されたシステムのダイナミクスの差である平均二乗誤差(MSE)である.ネットワークの骨格構造を獲得するために,適合度基準に基づくMSEのための新しいペナルティー項の提案を行う.本提案では,ネットワークのパラメータの組み合わせ最適化の性能向上のために,伝統的なMSEの代りに,適合度基準に基づくAICを用いる.実際には,適合度評価関数でAICのペナルティー項にComplexity項の追加を行い,疎なネットワークの構造を有するモデルの選択を容易にした.

提案手法の評価として,推定に用いるデータの量,ノイズのレベルなど様々な次元・特徴において,提案方法の適合性を調べる実験を行った.どの推定方法もネットワークトポロジーと制御パラメータを獲得することができたが,その精度は発現データの量とノイズのレベルに制限されてしまう.既存の適合度関数と比較して,提案手法は正しい発現データ量やノイズのレベルに対してロバスト性が高く,どのような状態でもネットワークトポロジーの同定と正確なパラメータを推定するのに適していることが分かった.提案アルゴリズムの異なる要素が,ロバストさ,効率,正確な制御パラメータの推定に必要であることを示すためにアルゴリズムの実験分析を行った.さらに既存のGRN推定アルゴリズムに比べて,提案した推定アルゴリズムは,計算量について効率的,ノイズに対してロバスト,より少ないサンプルサイズで推定可能であることが分かった.最後に,提案方法を2つの実データに適用したところ,主要な制御遺伝子の基本的なネットワークが獲得された.

今回提案した拡張アルゴリズムによる遺伝子ネットワークアーキテクチャとパラメータの推定の性能評価は,数十の遺伝子から構成される中型ネットワークを推定する事で行った.しかし数百,数千の遺伝子を含むネットワークを推定するにはさらなる強化,拡張,改良が必用となると考えられる.本論文では今後の課題についての方向付けを与えて結論を出す.

審査要旨 要旨を表示する

 本論文はMemeticアルゴリズムを用いた遺伝子制御ネットワークの推定と題し,10章からなり,遺伝子発現データからの制御ネットワークを導くリバースエンジニアリングのために進化型計算に基づく効率的なアルゴリズムを提案し,人工ネットワークと実際の遺伝子制御関係の推定において有効性を検証する.

 第1章は序章であり,主題と目的,概要が述べられ,遺伝子制御ネットワークのリバースエンジニアリングなどの本論文の基本的コンセプトが説明される.

 第2章においては,in vivoとin silico両方の遺伝子制御ネットワークについての概要が説明されている.まず生物の転写制御の仕組みについて分子生物学の観点から述べている.次に遺伝子制御のモデリングコンセプトを提示し,それに加え多数のモデリングアプローチを説明している.

 第3章においては,この研究の基礎となるS-systemモデルについて説明している.既存の評価基準の欠点への対処として,新たに候補となるネットワークモデルのための二つの評価基準を提案している.そして従来の再構築アルゴリズムの弱点を明らかにしている.

 第4章においては,提案する遺伝子ネットワーク推定のためのMemeticアルゴリズムについて説明している.Memeticアルゴリズムとは遺伝的アルゴリズムを局所探索法で拡張したものをいう.提案手法では,Fittest Individual Refinement (FIR)と呼ばれる交叉を基にした局所探索戦略により,遺伝的アルゴリズムの一種であるDifferential Evolution (DE)を拡張し,収束効率の改善とロバスト性の向上を実現している.FIRによって拡張されたDEは,特に高次の関数を求める際に,少ない評価数でも十分な近似解を得るのに適している.本章ではDEfirDEとDEfirSPXという二つの異なる実装法を示し,ランドスケープジェネレータから生成されたランダム問題などの良く知られたベンチマーク関数と実世界問題の両方において,FIRが従来のDEに比べて収束率とロバスト性を高めることを検証している.

 第5章においては,前章までに説明した本研究のコンセプトを,局所探索における柔軟性を導入することで拡張している.探索範囲が広い空間の局所探索の範囲を決定するのは非常に重要な問題である.本章では,山登り法の経験則を用いて局所探索の探索範囲を調整することで,この問題を解決している.広範囲の探索を要するベンチマーク関数を用いた実験により,本論文で提示している局所探索の調整を用いた新しいDEが,従来のDEに対して良い性能を持っていることが検証されている.

 第6章では,遺伝子ネットワーク推定のためのアルゴリズムについて述べられている.提案したアルゴリズムをネットワーク構造の再構築とモデルパラメータの推定に適用している.他の再構築手法との比較により,提案アルゴリズムのロバスト性が実験的に検証されている.

 第7章においては,本手法を実マイクロアレイデータの分析に適用することにより,その有効性を検証している.用いられたデータはEscherichia coliのSOS DNA修復ネットワークにおける遺伝子間相互作用の遺伝子プロファイルである.再構築されたネットワークの制御関係は既知のものとほぼ一致していることが示される.

 第8章においては,イースト菌の細胞周期ネットワークにおける制御関係の推定に,提案アルゴリズムを適用している.SOSネットワークの場合と同様に,提案アルゴリズムは対象ネットワークの構造をほぼ正確に同定している.

 第9章においては,提示してきた実験結果に対する総合的な議論がなされている.また,再構築アルゴリズムを他のアルゴリズムと比較し,いくつかの実際的な分析を示している.この分析と比較から提案手法の優位性が裏付けられている.

 第10章は本研究の全体を総括したまとめである.

 以上これを要するに本論文は,進化論的計算をもとにした遺伝子ネットワーク推定手法を提案し,多様な種類の実データにおいて提案手法の有効性を実験的に検証しており,情報学の基盤の発展に貢献するところが少なくない.

 したがって,博士(科学)の学位を授与できると認められる.

UTokyo Repositoryリンク http://hdl.handle.net/2261/9305