学位論文要旨



No 117319
著者(漢字) 村上,大勇
著者(英字)
著者(カナ) ムラカミ,ヒロオ
標題(和) データーベースを使用した遺伝子機能解析支援システム
標題(洋)
報告番号 117319
報告番号 甲17319
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(医学)
学位記番号 博医第1927号
研究科
専攻
論文審査委員 主査: 東京大学 教授 大江,和彦
 東京大学 教授 大橋,靖雄
 東京大学 教授 油谷,浩幸
 東京大学 講師 小山,文隆
 東京大学 講師 楠,進
内容要旨 要旨を表示する

 ディファレンシャル・ディスプレイ(Differential Display、以下DD)は、mRNAより作成したcDNA(群)に、より多くのcDNAとhybridizeすると思われる塩基配列を持ったプライマーと、3'−末端のPoly-A配列に対応するプライマーとでPCR法を行う実験法であり、多数の遺伝子についてその発現を同時かつ系統的に探索可能な優れた手法である。

 これまでのDDにおけるデータベースの使用は、主に得られた遺伝子の塩基配列決定後にデータベースから遺伝子の種類を推定するだけであった。また、これまで単一のDNA塩基配列よりPCR法用のプライマーを選定するプログラムはあったが、より多くの塩基配列をカバーするプライマーを選択するシステムはなく、現在のプログラムを使って実現するのが困難であった。DD法で使用するプライマーの選択については、これまでは経験則に頼るしかなかった。また、どのプライマーを選べば重複が少なく新規遺伝子を選べるかも、知る手段が無かった。

 また、DDの実験産物をゲル電気泳動してパターンを見ても、ある特定の遺伝子が、どのような位置に、バンドとして現れるかを予測するのは、既存のデータペース、バイオインフォマティックス用ソフトウェアでは困難であった。あるバンドについて、それが具体的に何の遺伝子であるかを調べる為には、実際にそのバンドをゲルより取得してDNA塩基配列を決定するしか方法はなかった。

 DDはRT-PCRにより検出精度が高く、安価で、比較的簡便な実験法である。DNAアレイのように膨大な量のPCR産物とプライマーを予め用意する必要がないので、多数の遺伝子の発現量を測定するのにコンピューター化されたDDは有用であると考えられる。

 そこで我々はDD実験の結果を予測するコンピュータープログラムを作成した。実際のDD電気泳動バンドパターンと比較し、データの解析を行うことで、DDの実効性を高めることが出来る。その遺伝子データベースを使用した選択されたDDプライマーを使用したDD結果予測を行う新規コンピューターシステムをin silico Differential Display (isDD)と名付けた。

 isDDシステムはJAVAスクリプトを含むダイナミックHTML(ハイパーテキスト・マークアップ・ランゲージ)で作成されWindows〓2000TMベースのIBM PC/AT互換機の上で開発、クライアントプログラム及びIIS(インターネット・インフォメーション・サーバ)上で実行される。

 まず、GenbankまたはUniGene DNA塩基配列データベースのDDに使用可能なエントリーを取得し、すべてのcDNA塩基配列から、DDの実際の実験で検出出来るcDNA3'−端1000塩基または2000塩基以内により多く現れる配列をコンピュータープログラムにより総当りで調べ列挙した。その際、パリンドローム禁止、3つ以上続いたT配列を含まない、より多いT配列を含んだものは除外、という条件付けをした。

 より多くのcDNAの発現を確かめられるプライマーの組み合わせを、遺伝的アルゴリズム(GA)によって選択した。GAによる選択では99.70%のisDDデータベース中のエントリーをカバーできたのに対し、上位20個のプライマーからランダムに選択する場合98.0%のカバー率に留まることが示された。

 さらに、その選択されたバンドがどのような電気泳動パターンを示すかを予測するプログラムを作成した。isDDバンドビューはWindows (R)ベースのプログラムで、フルスクリーンのDirectDraw方式を使い高速描画を行う。プログラムは実際の電気泳動ゲルの画像を白黒256階調のBMP(ウィンドウズ・ビットマップ)、フルカラー(24bit)のビットマップに変換したものを読み込み、シミュレーションのゲルイメージと重ね合わせられる。

 加えて、我々はWWWベースのバンドビューワーシステムも用意した。isDDコモン・ゲートウェイ・インターフェース(CGI)はWWWサーバー上で実行される。クライアントのWWWブラウザーでの表示は、ダイナミックHTML(DHTML)を使用したインタラクティブなアプローチを取っており、ウィンドウズ版と同様にisDDエントリー名をマウスカーソルが横切ると、対応するバンド位置が赤色で示される。エントリーをクリックするとそのエントリーの塩基配列が別ウィンドウで表示され、カット&ペーストすることで次のプログラムまたはWebサイトを使用して解析可能となる。

 次に、市販酵母RNA (Stratagene〓)を使用して実際のDD実験を行った。合計20個のバンドをゲルより取得し、TAベクターにサブクローニング後、それぞれのバンドについて20個のcDNAクローンを蛍光シークエンシング法で塩基配列を読んだところ、isDDデータベースに含まれるORFとESTのエントリー上で5塩基以上の精度で実際に存在したものが相当するクローン中の4個あり、さらに2クローンはESTのエントリー上でのみ一致した。それ以外のisDDの結果に出てこない12のクローンのうち少なくとも6個はPoly-A配列を持った新規遺伝子で、酵母染色体上の推定ORF配列と推定ORF配列の1000塩基以上離れた場所に存在した。その12クローンのうち9はオープン・リーディング・フレームを欠いており、リボソーマルRNAのような翻訳されないで使用されるRNAであると考えられる。以上の結果からisDDでのシミュレーションの効率はisDDで予測できるものにおいては5割、ORF全体では約20%程度であるが、isDDに使用可能な3'−端を含む遺伝子データベースが充実するか、推定ORFの精度が上がる、ESTの数が増える等の手法により改善可能であると考えられる。

 実際のDDのゲルイメージで変化が観察されたバンドは取得して解析する価値があり、isDDでその遺伝子の名称を絞り込んで予測することができる。isDDで見られないバンドは新規遺伝子である可能性が高い。多数の遺伝子発現の有無を、統一的に確認することが出来る。数本のプライマーで例えば酵母の場合、6塩基配列のプライマー8種類の組み合わせで、全GenbankとESTのisDDエントリー中の、99%以上の発現を調べられると考えられる。これは、従来の莫大な量(数千)のプライマーを用いてPCRを行い、DNAアレイ等を使用して調べる方法よりも、非常に安価で簡便に、さまざまな条件下での遺伝子発現についての知見が得られる。将来的には、シグナル伝達系、代謝系等のカテゴリー別のエントリー群が、どのようなバンドパターンを描くか予測して示すことが考えられる。

 現在、さまざまな種のゲノムプロジェクトが進行中である。特にヒトとマウスに関しては、データベース中の発現遺伝子プロファイリングが連日のように更新されている。isDDシステムは新規に作成されたデータベースに対して実行できるので、将来的にさらに効率が高くなることを期待出来、DD法による遺伝子の機能解析と新規遺伝子取得の一助になることが期待される。

審査要旨 要旨を表示する

 ディファレンシャル・ディスプレイ(以下DD)は、mRNAより作成したcDNA(群)に、任意のプライマーと、3'−末端のPoly-A配列に対応するプライマーとでPCRを行う実験法であり、遺伝子の機能解析と新規遺伝子を取得するのに、非常に有用である。また、近年、ゲノムプロジェクトの進展により、日々大量の遺伝子塩基配列データが蓄積され、巨大なコンピューター・データーベースが作成されてきている。DDでの泳動パターンを予測しておき、実際のDDの結果と比較できれば、実験の効率を飛躍的に向上させられる。そこで既知遺伝子についてのDDパターンを遺伝子データベースより予測するシステムを考案し、"in silico Differential Display (isDD)"と名付けた。実際のDDパターンと、isDDパターンの比較により、特定バンドが既知のいずれの遺伝子に対応するか、また新規遺伝子であるか予測可能とすることを目的とする。本論文について以下の結果を得ている。

1.ヒト、マウス、ラットではUniGeneのそれぞれのDNA塩基配列データベースファイルから、DDの実際の実験で検出出来るcDNA3'−端1000塩基または1500塩基以内のコンプリート(全長)CDSおよび3'−末端を含むcDNAエントリーを抜き出してFASTA形式で保存し、isDDデータベースとした。ヒト8043(平均長934.3nt)、マウス5000(平均長946.2nt)、ラット3099(平均長938.2nt)のエントリーの塩基配列が使用可能となった。

 isDDの実証実験用に、パン酵母で推定ORF配列とEST配列の結合を行い、isDDデータベースを作成した。酵母推定ORF配列全体の37.48%、2220個の塩基配列を使ってisDDを実行することが可能となった。

2.通常DD実験ではランダムなプライマー配列が使われるが、DD実験での電気泳動バンド数を多くし新規遺伝子の取得効率を最大限に上げるため、isDDデータベース中でより多く現れるプライマー塩基配列をコンピュータープログラムにより総当りで調べ列挙した。その際、パリンドローム禁止、3つ以上続いたT配列を含まない、より多いT配列を含んだものは除外、という条件付けをした。名古屋市立大学医学部医動物研究室の鈴木高史助手に、単一神経細胞からDD実験を行っていただいたところ、市販キット(Stratagene)に添付されているプライマーよりも電気泳動バンド数が多く得ることができることが示された。

3.より多くのcDNAの発現を確かめられるプライマーの組み合わせを、遺伝的アルゴリズム(GA)によって選択した。GAによる選択では99.70%分のisDDデータベース中のエントリーをカバーできたのに対し、上位20のプライマーをランダムに選択する場合98.0%のカバー率に留まることが示された。

4.選択されたバンドがどのような電気泳動パターンを示すかを予測するプログラムを作成した。isDDバンドビューはWindowsベースのプログラムで、フルスクリーンのDirectDraw方式を使い高速描画を行う。プログラムは実際の電気泳動ゲルの画像を白黒256階調のBMP(ウィンドウズ・ビットマップ)、フルカラー(24bit)のビットマップに変換したものを読み込み、シミュレーションのゲルイメージと重ね合わせられる。

5.WWWベースのバンドビューワーシステムも用意した。isDDコモン・ゲートウェイ・インターフェース(CGI)はWWWサーバー上で実行される。クライアントのWWWブラウザーでの表示は、ダイナミックHTML (DHTML)を使用したインタラクティブなアプローチを取っており、ウィンドウズ版と同様にisDDエントリー名をマウスカーソルが横切ると、対応するバンド位置が赤色で示される。エントリーをクリックするとそのエントリーの塩基配列が別ウィンドウで表示され、カット&ペーストすることで次のプログラムまたはWebサイトを使用して解析可能となる。

6.市販酵母RNA (Stratagene)を使用して実際のDD実験を行った。合計20個のバンドをゲルより取得し、TAベクターにサブクローニング後、それぞれのバンドについて20個のcDNAクローンを蛍光シークエンシング法で塩基配列を読んだところ、isDDデータベースに含まれるORFとESTのエントリー上で5塩基以上の精度で実際に存在したものが相当するクローン中の4個あり、さらに2クローンはESTのエントリー上でのみ一致した。それ以外のisDDの結果に出てこない12のクローンのうち少なくとも6個はPoly-A配列を持った新規遺伝子で、酵母染色体上の推定ORF配列と推定ORF配列の1000塩基以上離れた場所に存在した。その12クローンのうち9はオープン・リーディング・フレームを欠いており、リボソーマルRNAのような翻訳されないで使用されるRNAであると考えられる。以上の結果からisDDでのシミュレーションの効率はisDDで予測できるものにおいては5割、ORF全体では約20%程度であるが、isDDに使用可能な3'−端を含む遺伝子データベースが充実するか、推定ORFの精度が上がる、ESTの数が増える等の手法により改善可能であると考えられる。

 以上、本論文はDD実験おける効率を高め、isDDでその遺伝子の名称を絞り込んで予測することができる。DDのゲルイメージで変化が観察されたバンドは取得して解析する価値があり、isDDで見られないバンドは新規遺伝子である可能性が高い。多数の遺伝子の発現の有無を、統一的に確認することが出来る。数本のプライマーで例えば酵母の場合、6塩基配列のプライマー8種類の組み合わせで、全GenbankとESTのisDDエントリー中の99%以上の発現を調べられると考えられる。これは、従来の莫大な量(数千)のプライマーを用いてPCRを行い、DNAアレイ等を使用して調べる方法よりも、非常に安価で簡便に、さまざまな条件下での遺伝子発現についての知見が得られる。将来的には、シグナル伝達系、代謝系等のカテゴリー別のエントリー群が、どのようなバンドパターンを描くか予測して示すことが考えられる。また、オリゴDNAの選択はDNAアレイに応用も可能である。このようにさまざまな応用が期待され、精度で優位性があるDDで単一神経細胞等での遺伝子発現に関する知見が得られると期待され、遺伝子発現に関する研究に重要な貢献をなすものと考えられ、学位の授与に値すると考えられる。

UTokyo Repositoryリンク