学位論文要旨



No 116705
著者(漢字) 福田,賢一郎
著者(英字)
著者(カナ) フクダ,ケンイチロウ
標題(和) シグナル伝達経路の再構築 : シグナル伝達経路の解析に向けて
標題(洋) Represontation of Signal Transduction Pathways : Toward Computational Aualysis of Signal Transduction Pathways
報告番号 116705
報告番号 甲16705
学位授与日 2001.11.19
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第4072号
研究科 理学系研究科
専攻 情報科学専攻
論文審査委員 主査: 東京大学 教授 辻井,潤一
 東京大学 助教授 森下,真一
 東京大学 教授 宮野,悟
 東京大学 教授 萩谷,昌己
 京都大学 助教授 五斗,進
内容要旨 要旨を表示する

本論文では、生物のシグナル伝達機構に関する知識を形式化し知的システム上に共有するための方法論に関する研究成果を報告している。

 細胞内シグナル伝達の研究は細胞外からの刺激が核内に伝達され細胞応答が引き起こされる制御のネットワークを明らかにする研究である。分子生物学の分野で近年めざましい進展を遂げており、発生における細胞の運命の決定や細胞遊走、青色光への反応など多種多様な生命現象の分子機構を説明している。しかしながら、新しい研究分野であるが故に関与する構成因子の機能分類や相互作用の分類などの知識基盤が未整備であり、その知見は自然言語および情報の流れを描いたダイアグラム図として論文中に埋没しているのが現状である。これらの知見を計算機利用可能にするために、(1)知識表現手法、(2)推論手法、(3)文献からの知識の抽出手法の確立が望まれる。

 博士論文の主要な章の内容は以下の通りである。

 第2章では、ポストゲノム時代における生命科学研究の知識依存性について議論している。様々な生体内ネットワークおよび関連研究を比較し、本研究の枠組みを提示している。

 第3章では、断片的かつ記述の知識粒度が不揃いで階層的であるというシグナル伝達に関する専門知識の情報構造を明らかにし、これを自然に記述するための知識表現について論じている。シグナル伝達はa)現象の認識;b)構成要素の認識c)介在する相互作用の認識;d)構成要素と相互作用の結線関係の認識;e)要素・作用のより詳細な認識もしくは下流の現象の認識;というサイクルを繰り返すことで漸近的に既存知識に新規知識を追加して知見を詳細化させる。この結果シグナル伝達経路の知見は抽象度の異なる知識、不完全な知識が混在した記述となる。これらの問題を解決するために複合グラフ構造に基づいた知識表現モデルを提案した。複合グラフはグラフ構造の拡張で、木T=(ET,V,r)とグラフG=(EG,V)の対で定義される。各節点自身が階層的に部分グラフを内包できる構造であり、節点の包含関係は上記の木によって定義される。シグナル伝達パスウェイの各要素を複合グラフの節点と対応づけることにより、任意の粒度の知識を自由に記述することが可能になった。図1に示した例はTGF-β/SmadおよびIFN-γ/Stat1パスウェイの複合グラフによる表現である。

 第4章では生物学者が行っている"生物学的に正しい推論"を事例ベースに対する仮説推論としてモデル化し、知識ベース上で実験事実に矛盾しない推論を行うシステムの設計に関して論じている。シグナル伝達知識は多段階の実験結果を傍証として生物学者が導き出した細胞メカニズムの現状における認識結果であり、あるシグナル伝達パスウェイに関する記述が生物学的に妥当であるかを判断する際には人間の判断基準を離れて客観的な形式的指標を導入することができない。このため、生物学者が正しい新規知識を獲得するプロセスを背景知識と実験データに矛盾しないで観測事実を説明する仮説の獲得行為としてモデル化し、論理に基づく仮説推論の枠組みを応用した。提案手法に基づいて実際に過去の知見を組み合わせて新規の知識を獲得するシステムを実装し提案手法の有効性を実証した。

 第5章は文献から知識を抽出する際の支援環境の設計・実装について述べている。3章で提案した知識表現モデルが実際に生物学者が抱くシグナル伝達経路の表象を自然に表現しており、その結果、文献中の自然言語・図による記述を形式化するための入力環境を容易に構築できることを実証している。

 第6章は生物医学文献から知識を抽出する手法について論じている。知見が文献中で自然言語によって表現されているシグナル伝達経路においては情報抽出技術の応用が期待されており、未知語の頻出する同分野において適切に目的知識を抽出するための要素技術としてタンパク質名の同定方式を提案している。

 第7章では、提案手法の応用について論じている。将来の課題としては過去事例の検索を行う方式、構成要素の一致の判定の方式および知識ベースの更新方式の確立をあげている。

図1:TGF-β/SmadおよびIFN-γ/Stat1パスウェイの複合グラフによる表現

審査要旨 要旨を表示する

 本論文は、7章からなり、第1章において、論文の主課題である細胞内シグナル伝達経路の研究の意義に関して、第2章は、この分野における従来の研究(プロダクション・システム、フレーム型知識表現)の不十分な点を整理し、3章以降で展開される研究の課題を整理している。

 第3章では、シグナル伝達経路が生体内の物質の流れ、制御の関係を表す生体内ネットワークのひとつであることをのべ、比較的研究の進んだ代謝系のネットワークとの比較を行っている。特に、代謝系のネットワークが、生物学者の間でひろく受け入れられた知識体系を基盤としているのに対して、シグナル伝達経路は分子生物学で現在熾烈な研究競争が進行している分野であり、一般に受け入れられた知識基盤が存在せず、対象の性質が著しく異なること、したがって、知識記述の段階で不均一な記述粒度、不完全な知識の記述をどのように扱うか、など代謝系ネットワークの記述では見られなかった問題が存在することを指摘している。そして、これらの問題を解決するために、複合グラフと呼ばれる新しいデータ構造によって、粒度の異なる構成要素間の階層構造と各構成要素間の相互作用の関係を柔軟に記述する方式の提案を行い、それが有効であることを説得的に議論している。

 第4章では、第3章の表現形式の上に演繹的な推論系を定義し、演繹データベースとしてシグナル伝達系をシステム化することを提案、その有効性が示している。提案された手法は、階層構造の関係と構成要素間の相互作用の関係を対等に扱い、これらをHiLogによって操作する点が大きな特色であり、独創性の高い手法となっている。階層関係と相互作用の双方について複数の関係定義を実際に導入し、より柔軟な表現が可能となること、また、これに基づくシステムを実際に試作し、そのシステムが不完全知識に起因する知識の断片化を自然に回避し、経路の部分構造への問い合わせや複数経路間の共通構造の検索など、従来手法が苦手としていたシグナル伝達知識ベースが実現すべき機能が実現できることを示している。

 第5章では、第3章で導入されたデータ表現を人間に理解容易な形で表示するシステム、また、その表示を修正するためのシステムを構築し、実際に生物学者に使える道具として整備したことを報告している。

 第6章では、これまでの知識表現形式を使って、大量のデータを記述するための基礎技術として、文献からの知識抽出を目指した研究について、述べている。ここでは、データベース作成者が知識を抽出する作業を支援する環境の構築、自然言語処理技術における情報抽出技術の応用による目的知識の機械的な抽出が重要となることを指摘し、その基礎として、この分野用のNE技術を開発している。また、属性付き複合グラフに対応したグラフエディタの設計開発を通して、提案する知識表現手法が知識抽出の支援環境の構築にも適していることを実証している。

 第7章では、本論文で展開された知識表現手法、および、言語処理手法に残された課題を整理し、この分野における将来の研究課題を簡潔に整理している。

 なお、以上の研究内容は、高木利久・角田達彦との共同研究であるが、論文提出者が主体となって研究を推進し、システム開発を行ったものであり、論文提出者の寄与が十分であると判断する。

 したがって、博士(理学)の学位が授与できると認める。

UTokyo Repositoryリンク