審査要旨 | | 生物は進化の過程で優れた分子機構を利用する道を発見し,その上に遺伝情報系と神経情報系という二つの情報システムを築き上げることに成功した.このうち,遺伝系はこれまでに主として分子生物学により研究されてきた.遺伝的配列には生物の基本情報が確率的な変動を伴う進化の結果として蓄積されており,これを情報システムとして数理的手法により解明することが重要である.すなわち,DNA配列、RNA配列、タンパク質のアミノ酸配列などの遺伝的配列が生物についてどの様な情報を含み、生体中でどのような機能を発現するかを解明することは、生物の情報処理を理解する上での基本的な課題といえる.近年遺伝情報データベースが急速に拡大されつつあるが,データベース上の遺伝的配列の「意味」を理解し、生命現象の本質に迫るためには、数理情報工学のさまざまな手法を駆使すると共に、高速な計算機による大量の情報処理を実行しなければならない.本論文は、このための新しい数理的手法を確立することを目指して,隠れマルコフモデルによる遺伝的配列の解析と、文法的な規則を用いた階層的な構造記述による,タンパク質の立体構造予測の確率モデルを提唱し,これにより遺伝情報の意味の数理的解明に取り組んだ研究といえる. 本論文は,まえがき,本文4章,参考文献および付録からなる.第1章は序論であり、本研究の目的と背景を分子生物学と数理情報工学の両面から論じている. 第2章は隠れマルコフモデルの遺伝子情報処理への応用と題し,新しい確率モデルを遺伝子情報処理の分野へ導入したものである.遺伝子のDNA系列やタンパク質のアミノ酸配列にはある種の統計的規則性が観測されるため,これを確率的系列とみなして統計的情報論的解析を行なう試みは従来からあったが,単純な頻度解析やマルコフ的解析ではその本質を捉えきれなかった.本研究は,音声認識で成功を収めた隠れマルコフモデルを用いることを提唱し,これにより解析が比較的簡単で遠隔相互作用をも表現できる方法を開発したものである.はじめに隠れマルコフモデルの性質とその構造同定法を述べ,次にこれをタンパク質のアミノ酸配列の解析に応用し,そのパターンを特徴づけている。また、隠れマルコフモデルによるマルチプル・アラインメント解析の手法を提案し、そのBerger、Mansonの逐次法との関係を明らかにした。さらに、隠れマルコフモデルをDNAのシグナル配列のモデル化に応用し、RNAへの転写開始位置付近に特徴的な配列パターンを効果的に識別する道を拓いた.この際、隠れマルコフモデルのネットワーク形状を遺伝的アルゴリズムを用いて決定する手法を考案するなど,多様な手法を組み合わせている. 第3章はタンパク質の立体構造予測を取り扱ったものである.遺伝情報の多くはタンパク質の機能を通じて発現するが、それはタンパク質の立体構造と密接に関係する.このため,アミノ酸系列からタンパク質の立体構造を予測解明しその機能を推測することが重要になる.立体構造を実験により決定することは非常に困難であるから、アミノ酸配列からその立体構造を予測する研究が必要とされる.本章では、隠れマルコフモデルを用いたタンパク質2次構造予測、文法的規則を用いたタンパク質立体構造予測、階層的構造記述による立体構造の表現・分類と予測という三方式を提唱している.これらは,情報をより大域的構造的に順次取り込むもので,タンパク質の構造予測に新しい確率的構造的な視点を導入したものといえる.具体的にはタンパク質の2次構造予測においては、連続する2個のアミノ酸の組を隠れマルコフモデルの出力記号として用いることでかなり正確に予測が出来ることを示した.また、これを文法的規則と組み合わせることにより、認識率の若干の向上に成功した.さらに、遠距離相互作用の表現には正規文法よりも高次のクラスの文法が必要であり、高次構造の予測には、連続音声認識と同様の構文解析手法が有用であることを示した。階層的構造記述では、部分構造の主鎖の構造を炭素原子の3次元座標の線形展開を用いて表現し、部分構造の大きさに関わらず不変な形で定義する.これにより、従来の2次構造に基づく大雑把な表現や、3次元座標による不必要に細かい表現を排し、タンパク質立体構造の局所構造の精密な記述と、大局的な構造のトポロジーを階層的に表現できることを示した. 第4章は結論であり,本論文の成果を要約している. これを要するに、本論文は隠れマルコフモデルを中心とした確率モデルを用いることにより遺伝情報の解析とタンパク質の立体構造予測に対して新しい視点と方式を導入し,その有効性を具体的に示したもので、数理工学上貢献するところが大きい。よって本論文は博士(工学)の学位請求論文として合格と認められる. |