学位論文要旨



No 117216
著者(漢字) 門田,幸二
著者(英字)
著者(カナ) カドタ,コウジ
標題(和) cDNAマイクロアレイを用いた遺伝子発現解析手法の開発
標題(洋)
報告番号 117216
報告番号 甲17216
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(農学)
学位記番号 博農第2412号
研究科
専攻
論文審査委員 主査: 東京大学 教授 清水,謙多郎
 東京大学 教授 太田,明徳
 東京大学 教授 正木,春彦
 東京大学 助教授 堀内,裕之
 理化学研究所ゲノム科学総合研究センター 主任研究員 林崎,良英
内容要旨 要旨を表示する

1.はじめに

 DNAマイクロアレイは、目的試料の相対的な遺伝子発現の変化を対照試料に対する比として、各試料をそれぞれの波長の異なる蛍光色素(Cy3, Cy5)でラベルし、競合的ハイブリダイゼーションによって、1回の実験で数万種類の遺伝子発現の変化を観察することができる技術である。最近ではその応用範囲を癌の分類などの臨床応用へと広げつつある。

 癌の分類は、従来、組織学的・免疫学的手法により行われていたが、同じ型に分類されていた症例に対し、同じ薬を投与しても異なる臨床経過をたどるなどの問題があった。このためマイクロアレイを用いた遺伝子発現レベルでの癌のサブタイプの発見やその分類が試みられてきた。これまでにメラノーマや急性白血病など様々な疾患に対して、そのサブタイプの発見やサブタイプ間で発現が大きく異なる遺伝子群を用いて新たな症例を分類する試みがなされるなど、実際の臨床応用に期待のもてる報告がなされている。しかしながら、悪性度の高い群と低い群の分類を行う場合に、実際は悪性度が高い症例であるにもかかわらず悪性度が低いと誤分類してしまうなど方法論的にまだ未成熟である。このような誤りが起こる他の原因としては、サンプル調製からデータ取得までの一連の過程における誤差の蓄積に起因する再現性の問題や、ある2群の分類に用いる遺伝子群の抽出法や用いる遺伝子数の問題などが複合的に絡み合っているものと考えられる。

 癌発生のメカニズムに関して、複数の遺伝子異常が順次、積み重なることによって良性腫瘍が次第に悪化していき、前癌性病変(腺腫)を経て癌に発展していくという多段階発癌説がある。その多くの知見が大腸癌における分子生物学的研究の成果によるものであるが、大腸癌は頻度的にも多く検討に必要十分な臨床材料が得られやすいこと、癌の病理学的そして遺伝的前駆体とされる"腺腫"の存在があることなどがその大きな理由である。

 DNAマイクロアレイを用いて腺腫と癌の発現プロファイルの観点からみた分類を行う場合、悪性度では癌の方が高く、また少なくとも腺腫の一部は癌に進展していくことから、より悪性度の高い病態である癌を正しく癌と分類できること(感度100%)が実際の臨床応用を目指す上で非常に重要である。また腺腫に関しては、単に腺腫であると分類するよりむしろどの程度癌の病態に近いかを評価することにより、遺伝子発現プロファイル的には癌に非常に近い腺腫のハイリスク群をスクリーニングできる可能性が考えられる。

 そこで本研究では、1)再現性の高いマイクロアレイデータを抽出する統計処理法の開発、2)悪性度の異なる2つの臨床サンプル群に対してより悪性な状態を特徴づける遺伝子群の抽出法、及びその遺伝子群を用いて臨床応用を目指した高精度な分類システムの開発を目的とした。

2.マイクロアレイデータの統計処理法の開発

 マウス胎児及び成体の主要組織(脳、心臓など)を含む計49組織を目的試料として、またマウス胎児17.5日目whole bodyを対照試料としてDNAマイクロアレイ実験が行われた。解析のためのDNAチップとしては、理化学研究所(以下理研と略す)のマウス全cDNA収集プロジェクトによって得られた18,816個のcDNAが載せられたチップが用いられた。一つの目的試料に対して2回実験が行われ、チップ上の各遺伝子に相当するスポットの目的試料(Cy3で標識)及び対照試料(Cy5で標識)のシグナル強度、バックグラウンドシグナル強度、そしてフラグ情報が含まれる出力ファイルが2つ生成された。一連の実験は理研のスタッフによって行われた。

 本研究で開発した統計処理法は、できるだけ再現性が高くかつ取り扱えるデータ数の減少を抑えたマイクロアレイデータのフィルタリングを行うことを目的としており、前述の2つのファイルを入力として、以下の三つの主要な手順を経てフィルタリングを行うものである:1)人手により、フラグが立てられたスポットを除去する、2)シグナル強度がCy3及びCy5両方のチャンネルにおいて、(μbg+xσbg)より低い値をもつスポットを除去する(ここで、μbg及びσbgは、それぞれバックグラウンドシグナル強度の平均と標準偏差を示す)、3)2回の実験をそれぞれ縦軸、横軸として発現比log2(Cy3/Cy5)のプロットをとり、その最小二乗近似直線±yσを越えるスポットを除去する(ここで、σは最小二乗近似直線からのスポットの距離の標準偏差を示す)。ここで、xはバックグラウンドに埋もれている程度を示す閾値を、そしてyは2回の実験のバラツキの程度を示す閾値を決定するためのパラメータであり、N(統計処理前の遺伝子数に対する各手順後に残った遺伝子数の割合)×R(2回の実験におけるフラグの立っていない発現比の相関係数)のスコアが最大値をとるような値を採用する。これら一連の処理を経た2回の実験データは正規化され、さらにそれをもとに2回の発現比の平均値が計算される。

 本手法を用いて前述の49組織に対する実験データを解析した結果、統計処理前後の相関係数の値が平均約0.073上昇し、特に処理前の値が低いデータほどより効果的であった。同じ組織由来のデータが発現プロファイルの類似度を指標にしてクラスタリングを行った際に同じ末端枝を形成するか否かも再現性を示す指標として用いられるが、その形成個数も本手法により44個から47個に増加した。また、上記評価基準をもとに、従来の3つの統計処理法と比較した結果、本手法が総合的に優れていることが確認された1,2)。

3.臨床サンプルの悪性度分類システムの開発

 大腸癌28例(うち、臓器転移を起こしていない原発巣(CAと略す)16例、臓器転移を起こした原発巣及び転移巣12例)及び腺腫(ADと略す)7例の計35例を目的組織として、また大腸正常組織を対照試料としてマイクロアレイ実験が行われた。DNAチップとしては、Research Genetics社製の20,784個のヒトクローンが載せられたチップを用いた。一連の実験は、理研の設備を用いて横浜市立大学のスタッフにより行われ、腫瘍サンプルごとに2つの出力ファイルが生成された。これらのファイルに前述の統計処理を適用し、最終的に縦軸が20,784遺伝子、そして横軸が35例の臨床サンプルからなる遺伝子発現行列を作成した。

 全35例のうち、AD7例及びCA16例をトレーニングセットとして用い、計23例からなる遺伝子発現行列をもとに悪性(CA)状態を特徴づける遺伝子群の抽出を行った。残りの12例は評価のためのテストセットとして用いた。悪性状態を特徴づける遺伝子の抽出は、母集団(20,784遺伝子)全てを用いたときの発現行列とj番目の遺伝子(j=1,2,...,20784)発現プロファイルを除く残りの遺伝子発現行列に対し、下記の条件を満たすj番目の遺伝子を候補として抽出した:

ここで、〓はサンプル集合iとkの発現比の総当りの相関係数の平均値、〓は母集団を用いたときの〓、〓は、母集団からj番目の遺伝子を除いたときの〓を示す。本手法の有効性を評価するために、Leave-One-Out Cross-Validation(LOOCVと略す)を用いてCAの16例のうち一つを未知サンプルxとし、残りをトレーニングセットとして候補遺伝子の抽出を行い、以下の式によりxを分類した:

評価は、S>0ならばxは癌であるとし、S<0ならば癌ではないとして、16例各々を未知サンプルとして行った。

 解析の結果、16例全てについて正しく癌と判定できることが確認された。また、それらのスコアの有意性は、対応する候補遺伝子数(1728〜2096個)を母集団からランダムに1000回抽出して得られたスコアの1%有意水準を越えており、開発した遺伝子抽出法の有効性が示された。候補遺伝子のさらなる絞込みのために、16例全てのLOOCVにより候補として抽出された335個を用いて、全35例についてその分類精度を評価した。その結果、テストセットの12例を含む28例の癌サンプルを正しく癌であると分類することができた。また腺腫7例中3例がS>0(癌)と分類されたが、うち2症例は他の腺腫に比してその腫瘍サイズが大きい(共に25mm)ことが確認された。腫瘍サイズは腫瘍切除の指標としても用いられていることから、本手法が腺腫の中での高悪性群のスクリーニングにも有用であることが示唆された。

4.まとめ

 本研究では、DNAマイクロアレイ実験により得られる遺伝子発現データを効率的に処理し臨床応用を目指す上で有用な二つの手法を開発した。一つは、2回行われた重複実験データを入力として再現性(R)と最終的な遺伝子数の割合(N)の両方を考慮し、N×Rが最大値をとる閾値を採用して統計処理を行うものであり、その有効性が本手法を適用する前のデータ及び他の方法を適用した結果との比較により示された。もう一つは、悪性度の異なる2群の臨床サンプルの発現データを入力として、高悪性群に特徴的な遺伝子群を抽出し悪性度分類を行うものであり、高悪性群を感度100%で分類できることが確認された。本手法は、従来の病理学的分類の追試のみならず、生存率などの観点から見た予後の予測などへの応用が原理的に可能であり、様々な臨床診断への応用が期待される。

参考文献

1)門田幸二、岡崎康司、清水謙多郎、林崎良英.マイクロアレイを用いた発現データベース構築とデータマイニング.,Mol. Med., 37, 1186-1194, 2000.

2)Kadota, K., Miki, R., Bono, H., Shimizu, K., Okazaki, Y., Hayashizaki, Y., PRIM (Preprocessing Implementation for Microarray): An efficient method for processing cDNA microarray data., Physiol. genomics, 4, 183-188, 2001.

審査要旨 要旨を表示する

 DNAマイクロアレイは、一度に数万種類の遺伝子発現の変化を観察することができる技術であり、最近ではその応用範囲を癌の分類などの臨床応用へと広げつつある。しかしながら、誤差の蓄積に起因する再現性の問題が残されている。そこで、実験データに統計処理を適用することにより、信頼性の高いデータだけを抽出する必要がある。DNAマイクロアレイを用いて腫瘍性ポリープ(腺腫)と癌の発現プロファイルの観点からみた診断を行う場合、より悪性度の高い病態である癌を正しく癌と分類できること(感度100%)が実際の臨床応用を目指す上で非常に重要である。また腺腫に関しては、どの程度癌の病態に近いかを評価することにより、遺伝子発現プロファイルが癌に非常に近い腺腫のハイリスク群をスクリーニングできる可能性が考えられる。そこで本研究では、DNAマイクロアレイ実験により得られる数万種類に及ぶ遺伝子の発現情報解析を行う上で有効な手法を開発することを目的とした。一つは、実験データに統計処理を適用することにより、信頼性の高いデータだけを抽出する、遺伝子発現解析を行う前段階で用いるプログラムである。もう一つは、前述の統計処理を適用して作成した遺伝子発現データを入力として、臨床サンプルの悪性度を遺伝子発現プロファイルの観点から分類して診断を行うプログラムである。

 研究の背景を述べた第一章に続き、第二章においては、DNAマイクロアレイ実験より得られたデータをコンピュータ上での遺伝子発現情報解析で有効に活用するために予め行う統計処理法を提案した。本手法は、2回行われた重複実験データを入力ファイルとして、再現性(R)と最終的なデータ数の割合(N)の両方を考慮した統計処理結果を出力するものである。本手法の有効性を調べるために、マウス胎児および成体の各組織からなる計49組織の実験データを用いて検証を行った。結果として、本手法を用いることで、統計処理前後の相関係数が平均で0.073上昇し、特に処理前の値が低いものほどより効果的であることが分かった。また、他の処理法との比較においても総合的に優れた結果を収めていることが明らかにされた。本研究で開発した統計処理プログラムは、理化学研究所のマイクロアレイ実験データに対して現在広く用いられており、その効果が確認されている。

 続く第三章においては、多段階発癌の過程を経てその悪性度を増していくとされている大腸腫瘍の2つの病態(癌と腺腫)に対して、臨床応用を目指した高精度な悪性度診断のためのシステムを開発した。本システムは、悪性度の異なる2つの臨床サンプル群を列方向、そしてDNAチップ上に載せられた遺伝子を行方向とする遺伝子発現行列を入力として、悪性度の高い状態(癌)を特徴づける遺伝子群を抽出して出力するものである。本システムおよびその分類に対する考え方の有効性を、ヒトcDNAが20,784個載せられたDNAチップを用いて得られた、大腸腺腫および癌の原発巣や転移巣のサンプル計35例の実験データを用いて検証した。分類のための候補遺伝子の絞込みによって得られた計335個の遺伝子発現プロファイルを用いて分類を行った。結果として、テストセットとして評価された12例を含む癌サンプル28例を正しくそのように分類することができた。また、腺腫3例がハイリスク群として診断されたが、そのうち2例は癌化率が50%以上と報告されている20mm以上の腫瘍サイズを示した。このことより、本手法が実際の臨床診断を行う上で十分に機能しうるものであることが示唆された。

 第四章においては、以上の結果をまとめ、本研究で開発した2つの遺伝子発現解析手法が有用であり、実際のマイクロアレイ実験データの統計処理、および様々な腫瘍の悪性度診断に十分耐えうるものであることについて論じた。また、残された課題および他の応用例についての具体的な提言などを述べた。

 以上要するに本論文は、cDNAマイクロアレイ実験によって得られる大量のデータを効率的に解析する上で非常に重要な手法を開発したものであり、学術(臨床)応用上寄与するところが少なくない。よって、審査委員一同は、本論文が博士(農学)の学位論文として価値あるものと認めた。

UTokyo Repositoryリンク