学位論文要旨



No 123526
著者(漢字) 加納,真
著者(英字)
著者(カナ) カノウ,マコト
標題(和) 遺伝子クラスタ間の関係の可視化に関する研究
標題(洋)
報告番号 123526
報告番号 甲23526
学位授与日 2008.03.24
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第6842号
研究科 工学系研究科
専攻 先端学際工学専攻
論文審査委員 主査: 東京大学 教授 廣瀬,通孝
 東京大学 教授 伊福部,達
 東京大学 教授 油谷,浩幸
 東京大学 特任教授 井原,茂男
 東京大学 講師 谷川,智洋
内容要旨 要旨を表示する

ゲノムサイエンスの分野では,whole genome shotgun 法などによる塩基配列の解読や,マイクロアレイ技術による発現量やゲノムコピー数の測定など,全遺伝子の様々な特徴量が高速測定可能となった.特に,マイクロアレイ技術による発現量測定データは,器官(胃,肺,肝臓等),病気の種類,薬物などの刺激投与からの経過時間,など様々な条件下で測定されたデータが急速に蓄積している。

様々な条件下での遺伝子の特徴量が測定可能となったことで,個々の条件下での遺伝子間の関係に関する知見が取得されてきた.遺伝子間の関係の最も代表的な表現方法は,特定の条件下で類似した特徴を示した遺伝子の集合へのラベル付け,即ち「遺伝子クラスタ」である."遺伝子配列上流に共通な部分配列を有する遺伝子の集合","特定の癌で正常と比べて発現量が増加している遺伝子の集合","特定の薬物刺激に対して類似した時系列発現パターンを示した遺伝子の集合",など様々な関係が,遺伝子クラスタとして表現され,様々な公開データベースで多数の遺伝子クラスタが登録・公開されている.また,各研究機関では,それぞれが独自に行った実験データに基づき,多数の遺伝子クラスタを個別に保有している.このように}測定データの蓄積に伴い,遺伝子クラスタという形態で,フラグメントした知識が蓄積している.このため,遺伝子クラスタ間の関係の分析は,フラグメントした知識を横断的に統合し,新たな生物学的知見の獲得,重要な遺伝子の絞り込み,解析結果の妥当性の検証を可能とすると期待され,非常に有益である。

遺伝子クラスタ間の関係の基本的な分析方法は,二つの遺伝子クラスタ間の重複遺伝子数の統計的評価である.異なる観点で作成された二つの遺伝子クラスタ間の重複遺伝子数が統計的に有意に大きければ,クラスタ間の重複は偶然ではなく,何らかの理由が潜んでいることが示唆される.例えば,ある条件α下で類似した発現パターンを示した遺伝子クラスタAと,転写因子Xの認識配列を配列上流に有する遺伝子クラスタBとの重複遺伝子数が,統計的に有意に大きければ,遺伝子クラスタAの遺伝子群は,条件α下では転写因子Xの制御を受けていることが示唆される.

しかし,通常,ある観点で遺伝子クラスタを作成する場合,同時に多数の遺伝子クラスタが作成されるため,比較するクラスタの組み合わせ数が膨大となり,関係の全体像の把握が容易ではない.例えば,薬物刺激Aに対する遺伝子発現の時系列応答バターンに基づき,遺伝子をクラスタリングした場合,様々な発現パターンの遺伝子クラスタが多数生成される(以下,クラスタセットと呼ぶ).同様に,別の薬物刺激Bに対する遺伝子発現の時系列応答パターンからも,多数の遺伝子クラスタが生成される.薬物刺激Aと薬物刺激Bに対する遺伝子レベルでの振る舞いの違いを分析する上では,薬物刺激Aで形成されたクラスタが,薬物刺激Bのクラスタセットの中でも保存されるのか,あるいはどのように分割されるのか,その全体像を把握することが重要であるが,組み合わせ数が膨大になると容易ではない(「クラスタセット間の重複・分割関係の全体像把握」).

また,多くの遺伝子クラスタが,その集合を決定するに際し,閾値に依存するため,閾値を変化させた際の影響の把握が必要となる.例えば,薬物刺激Aに対して,類似した時系列遺伝子発現パターンを示した遺伝子クラスタを取り出す場合,発現パターンの類似度に閾値を設定する必要がある.この際,恣意的な閾値では,マイノリティな発現パターンの遺伝子クラスタが,マジョリティの発現パターンの遺伝子クラスタの中に埋もれてしまい,重要な遺伝子クラスタを見落としてしまうリスクがある.また,閾値によりクラスタを構成する遺伝子が変化するため,閾値の変化の影響を把握しないと,遺伝子クラスタ間の重複遺伝子数を適切に評価できない.(「閾値変化による影響の把握」).

さらに,クラスタ間の重複遺伝子数だけではなく,クラスタの背後にある特徴間の関係にも着目する必要がある.例えば,薬物刺激Aの時系列遺伝子発現パターンのクラスタCa、と,薬物刺激Bの時系列遺伝子発現パターンのクラスタCBとを比較する場合,クラスタ間の重複遺伝子数だけではなく,クラスタの平均発現パターンの類似度が重要な評価指標となる.刺激Aと刺激Bがもたらすマクロな現象の違いを分析する場合には,発現パターンが両者の間でまとまって変化している(ex.クラスタCAでは時間と共に発現が上昇,クラスタCBでは時間と共に発現が下降)遺伝子群を見つけることが重要となるためである.クラスタ間の重複遺伝子数だけではなく,クラスタの背後にある特徴間の関係を同時評価しないと,重要遺伝子を適切に絞り込むことが難しい場合が多い.(「クラスタ間の関係の多元的評価」)

本論文では,遺伝子クラスタ間の関係の分析における上記3つの課題一「クラスタセット間の重複・分割関係の全体像把握」,「閾値変化による影響の把握」,「クラスタ間の関係の多元的評価」一を解決するための可視化手法(Cluster Overlap Distribution Map: CODM)を提案した.

CODMは,異なる観点で作成された二種類のクラスタセットを,それぞれX軸,Y軸に配置し,X軸上のクラスタXiと,Y軸上のクラスタYの全ての組み合わせに関し,クラスタ間の関係を色付3Dヒストグラムで可視化する.クラスタ間の重複遺伝子数の統計評価値を高さで,クラスタの背後の特徴間の関係を色で提示することで,「クラスタ間の関係を多元的に評価・可視化」し,ユーザが意味のあるクラスタの組み合わせを,効率的に探索することを支援する.また,X軸上のクラスタXiとY軸上の全クラスタとの関係がY軸に上に,Y軸上のクラスタYjとX軸上の全クラスタとの関係がX軸に沿って提示されるため,「クラスタセット間の重複・分割関係の全体像把握」が可能となる.さらに,通常は取り扱われない,他に包含されるサブクラスタも可視化対象としており,「閾値変化の影響の把握」を支援する.

本論文では,まず,小細胞肺癌群に共通した染色体上発現異常領域の可視化と,小細胞肺癌検体の発染色体上発現異常領域の可視化にCODMを適用した.その結果,小細胞肺癌における既知の染色体異常領域を検知することができ,可視化結果の信頼性が裏付けられた.加えて,新規の発現異常領域の候補の全体像も可視化できた.また,単純に各遺伝子の発現量の増減を染色体上の遺伝子の位置にマップ表示する手法では,ノイズに埋もれてしまい情報を読み取ることが難しいが,CODMは,閾値の変化による影響の提示と,各発現異常領域の有意性の統計的の評価により,ノイズに頑強な手法であることを示した.次に,虚血耐性を持つラットと,虚血耐性を持たない通常ラットとの,虚血処理に対する時系列遺伝子発現応答の比較に対してCODMを適用した.解析の目的は,両群間で,虚血処理に対する時系列遺伝子発現パターンがまとまって変化している遺伝子集合の絞込みであった。クラスタ間の重複遺伝子数の統計的評価と,クラスタ問の発現パターンの相関の二軸から,クラスタ間の関係を評価する必要があり,どちらか一方のみの評価では絞込みが容易ではない.CODMでは,ブロックの高さと色を用いて両評価値を一度に可視化することにより,虚血耐性に関わる遺伝子を見落としリスク少なく効率的に絞り込むことができた.

さらに,癌のサブタイプ分類に固有なパスウェイ変異のトレ0スバック解析に対してCODMを適用した.発癌や癌の分化においては,染色体異常が起き,その領域の遺伝子の発現が変化し,その変化がタンパク質の制御ネットワークを伝わり,転写因子(Transcription Factor)の活性化/非活性化を引き起こし,転写因子の制御下にある多数の遺伝子の発現プロファイルに影響を与える,パスウェイ変異が発生している.このパスウェイ変異のトレースバック解析を,ゲノムコピー数データ,発現データ,既知のタンパク質制御ネットワークデータなどの統合によって実施,報告したのは筆者が最初である.遺伝子発現クラスタと転写因子の認識配列持つクラスタとの重複遺伝子数の評価で,発現パターンと相関して活性/不活性状態にある転写因子を検出した.さらに,その転写因子の活性・不活性のトリガーに遡るため,遺伝子クラスタの発現パターンと,転写因子の(タンパク質の制御ネットワーク)上流で染色体異常を有する遺伝子の発現パターンとの相関を可視化した.その結果,癌のサブ分類に関係する既知のパスウェイ変異を検出することができ,解析の信頼性が確認された.また,新規のパスウェイ変異の候補も多数検出することができた.以上のように,本論文の提案可視化手法(CODM)は,様々なタイプの遺伝子クラスタセットの比較に適用可能であり,有用性と解析結果の信頼性が確認された.今後,ゲノムサイエンスのエリアでは,マイクロアレイ技術による発現量やゲノムコピー数の測定など,全遺伝子の様々な特徴量データの蓄積と,そのデータに基づく遺伝子クラスタとしてのフラグメントした知見の蓄積はますます加速することが予測される.本論文の提案可視化手法は,フラグメントした知識を横断的に統合し,新たな生物学的知見の獲得,重要な遺伝子の絞り込むための重要な役割を果たすことができると期待される.

審査要旨 要旨を表示する

遺伝子解析の分野では,様々な条件下での遺伝子の特徴量測定データの解析結果が,「遺伝子クラスタ」として蓄積しつつある.遺伝子クラスタとは,特定の条件下で類似した特徴を示した遺伝子の集合へのラベル付けであり,個々の条件下での遺伝子間の関係に関するフラグメントした知見である.このため,遺伝子クラスタ間の関係の分析は,フラグメントした知識を横断的に統合し,新たな生物学的知見の獲得,重要な遺伝子の絞り込み,解析結果の妥当性の検証を可能にすると期待されている.

本論文では,「遺伝子クラスタ間の関係の可視化に関する研究」と題し,多数の遺伝子クラスタ間の関係を色付3Dヒストグラムとして可視化する手法を提案している.そして,遺伝子の解析におけるクラスタ比較解析の代表的な3種類のパターンに対して,提案可視化手法を適用し,その有効性を評価している.

第1章では,研究の背景について述べている.遺伝子関連のデータは、そのメカニズムの複雑さに比べると圧倒的に疎であり,解析には当該分野の専門家の知識や発想を取り込むことが不可欠である一方,そのデータ量は人が全体像を理解するには困難なほど膨大となっていることを述べ,可視化技術が課題解決に有効なアプローチであると論じている.そして,「遺伝子クラスタ」の蓄積と「遺伝子クラスタ間の関係の分析」の重要性について述べ,遺伝子クラスタ間の関係の可視化手法の提案と評価を,本論文の目的として位置づけている.また,最後に本論文の構成について述べている.

第2章では,代表的な遺伝子クラスタのタイプを概説した上で,遺伝子クラスタ間の関係を分析する上での3つの課題-「クラスタセット間の重複・分割関係の全体像把握」,「閾値変化による影響の把握」,「クラスタ間の関係の多元的評価」-を,具体的な遺伝子クラスタを例示しながら詳述している.そして,課題解決のための可視化手法を提案している.また,関連する従来研究を紹介し,上記3つの課題全てを解決できる点が本論文の提案手法の特長であると位置づけている.

第3章から第5章では,遺伝子クラスタの比較解析における代表的な3種類のパターンに対して,提案可視化手法を適用し,その有効性を評価している.

第3章では,癌検体において染色体の領域上でまとまって発現量が増減している箇所の検出を目的として,癌と正常との間で発現量に差を有する遺伝子クラスタセットと,染色体上で位置近傍な遺伝子クラスタセットとの比較に,提案の可視化手法を適用している.単純に各遺伝子の発現量の増減を染色体上の遺伝子の位置にマップ表示する手法では,ノイズに埋もれてしまい情報を読み取ることが難しいが,提案可視化手法は,ノイズに対してロバストであり,癌における既知の染色体異常領域を的確に可視化できることを示している.

第4章では,二群間における,時系列刺激応答発現パターンの遺伝子クラスタの比較解析に,提案可視化手法を適用している.両群間で,刺激に対する時系列遺伝子発現パターンがまとまって変化している遺伝子集合を絞り込むために,クラスタ間の重複遺伝子数に加え,クラスタ間の発現パターンの相関を同時に可視化することで,重要遺伝子が見落としリスク少なく効率的に絞り込めることが可能となることを示している.

第5章では,癌のサブ分類と関係したパスウェイ変異とそのトリガーを検出することを目的として,発現パターンのクラスタと転写因子の認識配列を有するクラスタとの比較解析に,提案可視化手法を適用している.パスウェイ変異の解析において,パスウェイ変異やそのトリガーの候補が多数存在するため,全体像を把握できぬまま,恣意的に閾値を設定して絞り込む単純なアプローチでは,重要な候補を見落とすリスクが高いことを論じ,提案可視化手法の有効性を示している.

第6章では,本論文を総括して研究成果をまとめるとともに,提案可視化手法が,遺伝子クラスタ間の関係の可視化に有効で,また,幅広く適用可能であると結論づけている.

以上、筆者によって提案された遺伝子クラスタ間の関係の可視化手法は,多数のファジーな遺伝子クラスタ間の背後にある関係の全体像把握を実現する,新規な手法である.提案可視化手法を実データへ適用することにより,有効な知見が得られている.またこの手法を遺伝子クラスタの比較解析における代表的なパターンについて適用しており,適用範囲の広さも示されている.今後,全遺伝子の様々な特徴量データの蓄積と,そのデータに基づく遺伝子クラスタの蓄積はますます加速することが予測され,本論文の提案可視化手法のゲノム情報解析進展への貢献が期待される.

よって本論文は博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク