RNAを中間体として転移するレトロエレメントは、真核生物ゲノムの重要な構成要素である。レトロエレメントの中には両端に順方向の反復配列(LTR)を持たず、3’端がポリAで終わる非LTR型レトロトランスポゾン(LINE)が含まれる。LINEは一般的に自身の転移に必須の産物をコードする2つのorf(orf1、orf2)を持っており、orf1の産物(Orf1)内にはレトロウイルスのgag遺伝子で見られるRNA結合に関与するシステインモチーフが存在する。orf2の産物(Orf2)には、標的配列を切断するために必要なエンドヌクレアーゼドメインとmRNAからcDNAを合成するために必要な逆転写酵素のドメインとその下流にOrf1内のものとは異なるシステインモチーフが存在している。本研究は、多くの植物に存在するLINEを単離同定することによって、植物界に普遍的にLINEが存在すること、1つの植物種(シロイヌナズナ)においてさえ多種多様なLINEが存在することを明らかにしたものである。また、シロイヌナズナのLINEに保存されている構造的特徴を明らかにすることにより植物のLINEの転移と制御機構を推測したものである。更に、LINEがときには他のトランスポゾン様の因子に転移していることを示すと共に、シロイヌナズナの系統の分類に有用であることを指摘したものであり、これらの結果は以下の様に要約される。 1.植物ゲノムにおけるLINEの遍在性 野生イネOryza australiensisのLTR型レトロトランスポゾンRIRE1(Noma et al.1997)をPCRによって単離する過程で、トウモロコシのLINEであるCin4のorf2内のエンドヌクレアーゼ領域(en)と相同性を有するDNA断片を得た。得られたDNA断片とCin4間に存在するホモロジーの高い領域の配列を基にディジェネレートプライマー対を作成し、O.australiensisと栽培イネOryza sativa cv.Nipponbareの全DNAを鋳型としてPCRを行ったところ、en領域に相同性を有するDNA断片を得ることができた。そのen領域内の保存性の高い領域の配列を基にさらに新たなディジェネレートプライマーを作成し、様々な植物ゲノムDNAを鋳型としてPCRを行った。その結果、植物界の5つの門(被子植物、球果植物、イチョウ、シダ、コケ植物)に属する33種の内、27種から期待されるサイズのDNA断片が生じた。生じたDNA断片をクローニングし、その塩基配列を解析したところ、en領域に相同性を有するものであることが分かった。この結果は、得られたDNA断片がLINE由来のものであることを示している。このように同定した53個のLINEの配列に基づいてデータベース検索を行ったところ、シロイヌナズナのゲノム配列より更に2つのLINEを見出した。合計55個のLINEのアミノ酸配列中にエンドヌクレアーゼの活性部位と推定されているグルタミン酸とチロシン残基が良く保存されていることを確認するとともに、グリシンなどの他のいくつかの残基も良く保存されていることが分かった。この結果は、LINEが植物界に普遍的に存在していることを示している。 多くの植物から得られたLINEのエンドヌクレアーゼのアミノ酸配列を比較し系統樹を作成した。その結果、シダ、裸子植物、単子葉植物、双子葉植物から由来の因子がそれぞれクラスターを成しており、植物種間の近縁関係がLINEのエンドヌクレアーゼ配列を比較して得た近縁関係とほぼ一致することが分かった。この結果は、植物のLINEが異種生物ゲノム間を転移するhorizontral transfer(水平移動)よりむしろ、親から子へ単に因子が伝播するvertical transmission(垂直伝播)により派生したものであることを示唆する(Noma et al.1999)。 2.シロイヌナズナの多様なLINE(ATLN)の同定と分類 シロイヌナズナ(Arabidopsis thaliana)のColumbia系統においてその全ゲノム配列の60%以上が既に決定され、データベースとして登録されている。そこで、シロイヌナズナのゲノムに存在したLINEの1つの配列を用いてコンピューターによるホモロジー検索を行い、107個のホモログ(ATLN;Arabidopsis thaliana LINEと命名)を見い出した。これらの内65個のATLNメンバーの構造を詳細に解析したところ、中には5’領域を欠失したと思われるものが多く存在していた。殆どのメンバーの両外側には、7〜21bpのATLNの転移の標的となったと考えられる配列が重複して存在していた。いくつかのメンバーは、Columbiaとは生態型の異なるシロイヌナズナ系統には存在しておらず、標的配列のみが存在することを確認した。完全長を持つと考えられるATLNは、いくつかの例外を除けば、ほぼ同じ大きさであり、それらの内部にはorf1とorf2の遺伝子が存在していた。例外的なATLN(ATLN-Lと命名)はorf1とorf2が存在するがorf2の下流が2kb程長いものであった。 orf2を持つATLNにコードされるエンドヌクレアーゼのアミノ酸配列を基に系統樹を作成した。その結果、ATLNは大きく2つのグループ(IとII)に分けられ、更にIのグループ内は3つのサブグループに、IIのグループは6つのサブグループに分けられることが分かった。ここにおいて上記のATLN-L因子はIIのグループの1つのサブグループに属することが分かった。各サブグループにおいてATLNのorf1とorf2の間の配列は、orf1の終止コドンとorf2の開始コドンATGが重なっているか、1〜5bpまでの配列を挟んでおり、orf2の開始コドンはorf1の終止コドンに対し-1フレームの位相に存在していた。これらの結果より、orf1の翻訳後にしかorf2の翻訳が起こらないような機構(translational coupling)が存在すると考えられる。 同一のサブグループに属するATLNメンバーにおいて、例外的に全領域にわたってほぼ同じ配列をもつものがIIのサブグループの1つに属するATLNの中に存在したが、それらの5’UTRの最末端領域の配列にはホモロジーが認められなかった。この非相同な最末端領域の配列が、ATLNの上流の配列からmRNAの合成が開始された後、逆転写されたcDNAが新たな部位に挿入したことによって生じた可能性と、RNA editingが転写後に起こったために生じた可能性とが考えられる。 ATLNの転写産物をRT-PCRによって調べたところ、DNAメチル化阻害剤(5-azacytidine)処理した培養細胞とDNA低メチル化突然変異体(ddml)から転写産物を検出することができた。この結果は、プロモーター領域のメチル化が因子の転写を抑えることを示唆する。 3.シロイヌナズナの長大でユニークな構造を持つ新規LINE(ATLN-L)の同定 全長をもつと考えられるATLN因子(約5.5kb)は、その内部に2つのorf(orf1とorf2)を持っていたが、例外的にorf2からポリAに至る下流域が2kb程長いATLN-L因子が見出されたことは述べた。興味深いことに、ATLN-Lの付加的領域には、第3のorf(orf3と命名)が存在し、これがorf1と相同性があることが分かった。ATLN-Lのほとんどのメンバーには転移の標的となったと考えられる配列が重複していた。このことは、ATLN-Lのorf3がorf1-orf2と共に1つの単位として転移することを示す。 ATLN-Lは、他のATLNとは異なり、orf1の終止コドンTAAを挟む形でorf2がin frameで続く構造をとっていた。orf2の開始コドンATGは見当らなかったこと、orf1のすぐ下流にはmRNAの段階でシュードノット構造を形成しうる配列が存在したこと、からATLN-L因子は翻訳過程でTAAがサプレスされ、Orf1-Orf2融合タンパク質の生産を促すようにプログラム化されていると予測される。ATLN-Lのorf2とorf3の間には非常にピリミジンに富んだ長い数100塩基対の配列が存在したが、この配列はorf3が独立に発現することに関わっている可能性がある。ATLN-L因子の5’の非翻訳領域(5’UTR)の標的部位に接する配列には相同性はないが、そのすぐ下流域に有意義な相同性のある配列が存在していた。これらの配列は、ATLN-Lに固有の内在性のプロモーターを含んでいる可能性がある。 Orf1とOrf3のアミノ酸配列は相同性が高く、共にレトロウィルス様のシステインモチーフが存在していたが、Orf3内には加えてロイシンジッパーモチーフも存在していた。ATLN因子のOrf1のC末付近には核移行シグナル様配列が存在するが、ATLN-L因子のOrf1とOrf3でも同様であった。ATLN-LのOrf1とOrf3及び他のATLNのOrf1のアミノ酸配列を基に系統樹を作成したところ、ATLN-LのOrf3は自身のOrf1より他のATLNの一部の因子のOrf1と相同性が高いことが分かった。このことは、ATLN-Lが自身または他のATLN因子のorf1を取り込み生成し、自身のorf1とは独立に進化したと推測される。 4.内部に縦列型反復配列を持つシロイヌナズナの新規転移性遺伝因子Tnat1とTnat2の発見 シロイヌナズナゲノム中に見出されたLINEであるATLN44の挿入領域に関してデータベースにおけるホモロジー検索を行った結果、散在性の繰り返し配列であることを見いだした。その配列の全長は664bpであり、その末端には約70bpの逆向き反復配列が存在した。逆向き反復配列に接して同じ9bpの標的配列が重複していた。この発見は、この繰り返し配列が転移により9bpの配列の重複を促すような転移性遺伝因子であり、ATLN44がこのメンバーの1つに挿入したことを示唆する。我々は、それゆえこの配列をTnat1(Trasposable element of A.thaliana#1)と名付けた。興味あることに、Tnat1の内部には約60bpの配列が7個、縦列型反復配列として存在していた。シロイヌナズナゲノム内にはTnat1のメンバーが少なくとも14個が異なる遺伝子座に存在しており、それぞれのメンバーにおいて逆向き反復配列の外側に互いに異なる9bpの標的配列が重複して存在した。内部領域には約60bpをユニットとする縦列型反復配列が存在していたが、ユニットの数は、それぞれのTnat1メンバーによって異なっていた。 さらに、Tnat1メンバーの1つは、シロイヌナズナゲノム中にTnat1とは異なる散在性の繰り返し配列内に挿入していることが分かった。この繰り返し配列は約770bpであり、その末端に約110bpの逆向き反復配列が存在した。逆向き反復配列のすぐ外側に標的配列の重複と思われる9bpの同方向反復配列が存在した。このことは、この配列が転移性遺伝因子であることを示唆する。そこでこの配列をTnat2と命名した。興味あることにTnat2メンバーの内部には約240bpの2コピーの同方向反復配列が存在していた。2つの配列、Tnat1とTnat2は、共に縦列型反復配列を持つ点で似ているものの相同性は全くない。また、既知の転移性遺伝因子ともそれぞれは相同性がなかったので、全く新規の転移性遺伝因子と考えられる。既知の植物のトランスポゾン(Ac,En/Spm)はsubterminal領域に不規則な反復配列を持つことが示されているが、これらの因子が規則的な反復配列を持つTnat1とTnat2様配列から生じた可能性がある。 5.生態型の異なるシロイヌナズナ系統のATLN因子の存在様式による分類 シロイヌナズナには世界各地で採集された生態型の異なる多くの系統が存在するが、その系統関係は明確ではない。シロイヌナズナ(Columbia系統)ゲノム中に存在するいくつかのATLNについては異なる生態型の系統間においてその因子の存在の有無に関して多型が生じることを前述した。この結果は、シロイヌナズナが各生態型の系統に分化する過程でATLNが転移したことを意味しており、ATLNの存在の有無が系統分類の有用なマーカーである可能性がある。そこで、ヨーロッパ由来のものを多く含む異なる生態型のシロイヌナズナ23系統の全DNAを鋳型にして、Columbia系統で見いだした11個のATLN因子の隣接配列にハイブリダイズするプライマー対を用いでPCRを行った。そのPCR産物を解析したところ、11個の殆どの遺伝子座において、あるシロイヌナズナ系統からATLNが存在する長いDNA断片が生じるが他の系統からはATLNが存在しない短いDNA断片を生じるという多型が観察された。 いくつかの座位についてATLNが存在しない時に生じる短いDNA断片由来の塩基配列を決定したところ、実際ATLNは存在せず標的となったと考えられる配列を含むものであった。また、ATLNの有無のパターンを示す長短両方のDNA断片とは長さの異なる断片を増幅したサンプルについて配列を解析したところ、ATLN因子が新規トランスポゾン(Tnat3と命名)内の16bpの配列を標的配列として挿入していることが明らかとなった。Tnat3は、シロイヌナズナに多数存在するTouristタイプのトランスポゾンであった。 ATLNの存在の有無を調べることにより得られたデータを基に、生態型の異なるシロイヌナズナの系統をバーコード化し、系統樹を作成した。その結果、Columbia系統に最も近い関係にLandsberg系統があり、他の系統と最も遠い関係を示した。この結果は、Columbia系統がLandsbergと他の系統との交配によって生じたとされている結果と一致する。また、系統の関係とそれぞれの系統が採集された地域性に相関が見られる場合もあるが、一致しない場合もあった。 以上、本論文は、植物界に非LTR型レトロトランスポゾン(LINE)が遍在していること、1つの植物(シロイヌナズナ)にも多様なLINE(ATLN)が存在していることを明らかにした。また、ATLNの構造的特徴からその転移と調節機構を推測した。本研究で得られた知見は、これまで殆ど解明されていないLINEのその転移と制御機構の解明に大きく貢献すると期待される。さらに、ATLNの解析中にシロイヌナズナの新規トランスポゾンであるTnat1〜Tnat3を見出し同定した。また、ATLNの存在の有無を利用してシロイヌナズナの系統関係を明らかに出来るという可能性を示した。LINEの研究がトランスポゾンの発見の面で、またその応用面でも有用であることを示した。 ReferencesNoma K,Nakajima R,Ohtsubo H,Ohtsubo E(1997)RIRE1,a retrotransposon from wild rice Oryza australiensis. Genes Genet.Syst.,72,131-140Noma K,Ohtsubo E and Ohtsubo H(1999)Non-LTR retrotransposons(LINEs)as ubiquitous components of the plant genomes.Mol.Gen.Genet.,261,71-79.Noma K and Ohtsubo E(2000)Tnat1 and Tnat2 from Arabidopsis thaliana:novel transposable elements with tandem repeat sequences.DNA Research,in press |