1977年に真核生物の遺伝子上にイントロンが発見されて以来、イントロンの起源と進化的な役割についての論争が続いている。イントロンの起源に関して対立する二つの説がある。1987年にGilbertによって提唱された"exon theory of genes"[1]は、かつてばらばらに存在していた原始エクソンがイントロンを介して様々な仕方で繋ぎ合わされることによって最初の遺伝子のセットが作られたとする仮説である。この仮説によると、エクソン-イントロン構造は遺伝子の原始的な形態であり、原核生物と真核生物の共通祖先は既にイントロンをもっていたことになるので、この考え方はintron-earlyとも呼ばれる。それに対しintron-lateは、原始遺伝子上にはイントロンはなく、イントロンは原核生物と真核生物が分岐した後で真核生物の核に挿入されたと考える[2]。1981年Goは、ヘモグロビンのエクソンが蛋白質の立体構造上でコンパクトな部分構造をコードしていることを見いだし[3]、この部分構造を「モジュール」と呼んだ。このことはエクソンが蛋白質の構造の単位であることを示唆し、原始エクソンの集合による蛋白質進化の痕跡であると考えられた。その後いくつかの蛋白質において、イントロンがモジュール境界の付近に位置することが示されてきた。しかし、様々な生物の多数のイントロンが決定されるにつれ、生物によってイントロンの分布はかなり異なっており、イントロンの位置は必ずしも蛋白質の立体構造とは関係しないとも見なされるようになった。このイントロン起源論争はイントロンの発見以来20年以上経った現在においても決着が付いておらず、それどころか近年の遺伝子情報の急増により、様々な論点からますます盛んに議論されるようになってきている。 本研究では、Hsp70(70 kDa heat shock protein)ATPaseドメインおよびアクチンが、intron-earlyに対する非常に有力な証拠を与えることを見いだした。これらの蛋白質を用いて解析を行ったことに関してはいくつか理由がある。まず、この両者の蛋白質においては、現在までに様々な生物種のもつ多数の遺伝子のエクソン-イントロン構造が知られているため、統計的な解析が可能である。ともに配列の保存性が非常に高く、分子進化を調べる上での有用なマーカーとして用いられている。また、Hsp70 ATPaseドメインとアクチンは、互いの配列の類似性はほとんどないにもかかわらず立体構造がよく似ており、機能に共通性をもっている。このため、両者は共通祖先から派生した蛋白質であると考えられており、蛋白質の初期進化を知る上で非常に興味深い系であると言える。 Hsp70は、分子シャペロンの一種であり、古細菌・真正細菌・真核生物を含むほとんど全ての生物がもつ普遍的な蛋白質である。蛋白質のフォールディング・膜移行・ミスフォールドした蛋白質の分解など、様々な細胞内のプロセスに関与している。またHsp70は、最も保存性の高い蛋白質ファミリーの一つとして知られており、N端側のATPaseドメインは殊に保存性が高く、大腸菌とヒトの間でも50%のアミノ酸配列は一致している。 Hsp70 ATPaseドメインにおいて、一次配列上のイントロン分布が、立体構造上のコンパクトな部分構造であるモジュールと相関しているかどうか統計的な検定を行った。モジュールは連続した平均15残基程度のポリペプチドであり、蛋白質立体構造の原子座標からモジュール構成を自動的に同定する方法はすでに開発されている。塩基配列のデータベースからHsp70 ATPaseドメインのアミノ酸配列とイントロンの位置を検索し、マルチプル-アラインメントを行って立体構造既知の配列上での対応するイントロンの位置を求めた。配列の保存性が高いため、イントロンの位置は曖昧性なく一意的に決めることができた。結果として、動物・植物・菌類・原生生物を含む33の遺伝子中にある、56カ所の異なるイントロンの位置を得た。このうち54カ所のイントロンを用い、モジュール境界と統計的に有意な相関があるかどうか検定を行った。モジュール境界からのずれがk残基以内の領域Rkをとり、Rk内に位置するイントロンの数をOkとしたとき、「イントロンの分布がランダムである」という帰無仮説のもとでRk内にOk個以上のイントロンが存在する確率Pkを求めた。その結果、1.5から3.5までkの値に対してPk<0.05が示され、仮説は棄却された。つまり、Hsp70 ATPaseドメインにおいてイントロンの分布はランダムではなく、モジュール境界の近傍に多く存在していることが示された。 次に、古細菌・真正細菌を含むHsp70 ATPaseドメインのアミノ酸配列を用いて系統樹を作成した。真核生物の遺伝子は、葉緑体・ミトコンドリアで機能するオルガネラ由来のものと、細胞質・小胞体で機能する核由来のものに明確に分かれた。そして、オルガネラ由来の遺伝子と核由来の遺伝子の間で、1塩基のずれもなく全く同じ位置に存在するイントロンが4カ所あることを見いだした。これらは、共生によって真核生物が登場した際の宿主(host)と共生者(symbiont)のバクテリアが分岐する以前から存在していた非常に起源の古いイントロンであると考えられる。 以上の結果はいずれもintron-earlyを強く支持し、原始エクソンの集合によって原始Hsp70遺伝子が形成されたという進化のシナリオを示唆するものである。 アクチンは全ての真核生物がもち、細胞骨格の主要な構成要素となる極めて重要な蛋白質である。配列の保存性は極めて高く、動物・植物・菌類の間で比較しても80%以上のアミノ酸残基は同一である。最近、充分な相同性があるが、従来のアクチンに比べ保存性の低いactin-related protein(Arp)と呼ばれる遺伝子群が見つかってきている。アクチンとArpは、真核生物進化の初期段階に重複したと考えられる。アクチンおよびArpを用いてHsp70 ATPaseドメインの場合と同様の解析を行った。 データベース中のアクチンおよびArp遺伝子を検索したところ、100以上の遺伝子中に存在する70カ所の異なるイントロンの位置を得た。これらのイントロンが、モジュール境界と有意に相関しているかどうかを調べるため、Hsp70 ATPaseドメインの場合と同様の方法によって検定を行った。蛋白質の末端領域に位置する5カ所のイントロンを除外し、全部で65カ所のイントロンを用いて解析を行ったところ、次の結果を得た:(i)65カ所のイントロンの位置はモジュール境界と統計的に有意に相関している(P<0.05)。(ii)動物・植物・菌類・原生生物の界を超えて全く同じ位置か1塩基だけ異なった位置に存在する"保存された"イントロンが20カ所あり、それらはモジュール境界と強い相関を示す(P<0.01)。(iii)アクチンとArpの間で共通の位置にイントロンが存在し、その位置はモジュール境界と一致している。界を超えて"保存された"イントロンがモジュール境界と強い相関を示すという傾向はHsp70 ATPaseドメインの場合にも見られ、Hsp70 ATPaseドメインとアクチンで完全に同様の結果が得られた。これらの結果は全て、intron-earlyによって自然に説明することができる。つまり、原始遺伝子上にはモジュール境界に対応する位置にイントロンが存在していたが、次第にイントロンは失われていき、進化の過程でアミノ酸残基の挿入・欠失による立体構造の変化やイントロンのスライディングなどが起こり、次第にイントロンとモジュール境界との対応が弱くなっていったと考えられる。 系統樹の解析から、進化の過程で比較的最近になってイントロンが失われたと考えられるはっきりとした例が多数見つかった。また、イントロンの一次配列上の分布には統計的に有意な偏りがあり、N端付近には多く存在し、中央付近には少なかった。この偏りは菌類において特に顕著であった。このような偏った分布は、原始遺伝子上では多数のイントロンが一様に分布していたが、進化の過程で中央付近のイントロンが選択的に失われることによって実現したと考えられる。RNAを介した相同組み替えによるイントロン欠失のメカニズムが提唱されており、アクチンの偏ったイントロン分布はこのモデルによって自然に説明することができる。以上の結果はいずれもイントロンの挿入というモデルによっては説明することが困難であり、intron-earlyを支持するものである。 以上見てきたように、Hsp70 ATPaseドメインおよびアクチンの両方においてイントロンの位置とモジュール境界との有意な相関が見られ、intron-earlyを支持する多くの証拠を得ることができた。最後に、Hsp70 ATPaseドメインとアクチンの立体構造および機能部位を比較することにより、両者が共通祖先から分化し、それぞれに特異的な機能を獲得していったプロセスについて考察を行った。 [1] Gilbert,W.(1987)Cold Spring Harbor Symp.Quant.Biol.52,901-905.[2] Cavalier-Smith,T.(1991)Trends Genet.7,145-148.[3] Go,M.(1981)Nature 291,90-92. |