学位論文要旨



No 122194
著者(漢字) 五條堀,淳
著者(英字)
著者(カナ) ゴジョウボリ,ジュン
標題(和) 進化の2つの段階、多型と固定の相関から明らかになったヒトの適応進化
標題(洋) Adaptive evolution revealed by the correlation between the two phases of molecular evolution in human : polymorphism and fixation
報告番号 122194
報告番号 甲22194
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第5057号
研究科 理学系研究科
専攻 生物科学専攻
論文審査委員 主査: 東京大学 教授 植田,信太郎
 東京大学 教授 青木,健一
 東京大学 講師 井原,泰雄
 国立遺伝学研究所 教授 斎藤,成也
 愛媛大学 教授 三木,哲郎
内容要旨 要旨を表示する

 ヒトゲノム上のタンパク質をコードする遺伝子のうち、どれだけが適応進化をしたかという問題は分子人類学や人類集団遺伝学において長らく議論されてきた。適応進化を検証する方法として種内変異(polymorphism)と種間変異(divergence)を対比する方法があり、進化の段階を多型(polymorphism)と固定(fixation)に分けて考える事で、自然選択の検出力を高める事が期待される。ヒトの全ゲノム塩基配列に加えて、チンパンジーのゲノム概要塩基配列が決定され、さらにヒトのゲノム規模の一塩基多型(Single Nucleotide Polymorphism, SNP)データベースも利用可能となった事で、塩基配列レベルやアミノ酸配列レベルでのヒトの適応進化の検証がゲノム規模で可能になった。本研究では2つの進化の段階、多型と固定を対比し、ヒトの適応進化をゲノム規模で検証した。

 集団中に新たな変異が導入された時、その変異が有害であったならば負の自然選択によって集団より除去され、有害でなかった場合、その変異は消失または多型となり、遺伝的浮動によりその変異の頻度は時間とともに増減する。集団中に除去されずに残った変異体は、遺伝的浮動により偶然に集団中に固定することもあり、生存に有利な変異であった場合は、正の自然選択により集団中に固定する可能性や、その速度が大きくなる。このように、変異体が集団中に固定する過程を考え、その前半の段階を進化の多型の段階、後半を固定の段階とすると、多型の段階では負の自然選択が遺伝的浮動とともに重要な力であるのに対し、固定の段階では遺伝的浮動に加えて正の自然選択の働きも重要となる。このように多型と固定の段階において、主に働く自然選択の種類が違う事から、この2つの段階を対比する事で、変異に対して自然選択がどのように作用するかを検証できる。

 この2つの進化の段階の相関を見るのに、これまでの単純な同義変異、非同義変異という分類では不十分であるが、非同義変異を1つの塩基の変異で起こりうる75種類のelementary amino acid changeに分類する事でそれが可能になる。本研究では、75種類のelementary amino acid changeのそれぞれに対して、多型のなりやすさの指標であるPI(Polymorphism Index)と、固定のしやすさの指標であるFI(Fixation Index,ここではWright [1921]のFstとは違う指標である)を定義し、ヒトの多型と固定の相関を検証した。

 多型データとしてヒトのSNPのデータベース、Perlegen Sciencesと国際HapMap Project、Seattle SNPsとNIEHS SNPsを用いた。固定のデータはヒト-チンパンジー間での種間変異を使用した。またヒトのSNPについて、チンパンジーをアウトグループとして祖先型と派生型の対立遺伝子を決めた。解析には常染色体上にあるタンパク質をコードする領域のみを用いた。解析の対象となった遺伝子数はPerlegenで5008個、HapMapで5535個、SeattleとNIEHSで274個となった。

 ヒトのSNPを派生型対立遺伝子の頻度別にみると、低頻度のSNPでは非同義変異/同義変異比(A/S比)が高頻度のものと比べて高かった。これは有害突然変異がヒトの集団の中で低頻度に蓄積していることを示している。そこでヒトのSNPを、頻度20%を境界として、20%以下の頻度のSNPをレアなSNP、20%より高い頻度のSNPをコモンなSNPとした。コモンのSNPはレアのものと比べて有害突然変異が少ない事が期待され、それゆえに中立的な変異がより多い事が期待される。

 表1はヒトのSNPデータベースの概要を示している。ここでMcDonald-Kreitmanテストを用いて多型と固定の段階のA/S比を比較し、ヒトゲノムにおける自然選択を検証した。ここでは多型にコモンなSNPだけ(より中立的な変異だけ)を使う事で検出力を高めた。ただし、Seattle+NIEHSのデータベースでは、高頻度のSNPのA/S比が大きく、hitchhikingの効果の可能性があるため、頻度20%〜80%のSNPsをコモンとした。FI=(固定のA/S比)/(コモン多型のA/S比)と定義し、FIの観測値が中立の期待値を上回るかどうかで正の自然選択の有無を検証した。その結果、PerlegenとHapMapの両方のデータベースにおいては強い正の自然選択は検出されなかった。特にHapMapでは、Perlegenと比べても非同義変異が同義変異より多く、収集バイアス(ascertainment bias)の影響が強く見られた。収集バイアスが含まれないSeattle+NIEHSのデータベースでは正の自然選択を検出できたが、これはこのデータベースに多くの免疫関連の遺伝子が含まれているためと思われ、必ずしもヒトゲノム一般の傾向を反映していないものと考えられる。これ以後の解析はPerlegenとHapMapについてのみ行った。

 次にアミノ酸変異を1塩基変異のみでおこる75種類のelementary amino acid changeに分類し、それぞれのアミノ酸変異についてA/S比を多型と固定の段階で比較した。また、各アミノ酸変異について期待される変異の数(new mutationの数)を解析に用いた遺伝子の塩基組成から計算した。ここで、PI=(レア多型のA/S比)/(new mutationのA/S比)とし、アミノ酸変異の多型のなりやすさの指標とした。FIはアミノ酸変異ごとに再計算し、アミノ酸変異の固定のしやすさとした。表2は、PerlegenにおけるFIについて上位と下位5種のアミノ酸変異とPerlegenとHapMapの概要である。どちらのデータベースについても、75種類のアミノ酸変異のFIについてχ2検定を行うと有意差があることから、FIは75種類のアミノ酸変異について一様ではない事が分かった。

Perlegenについて、FIの上位34種のアミノ酸変異を除いてχ2検定を行うと有意差がない事から、下位41種のアミノ酸変異はFIについて一様であることがわかる。表2から上位34種のアミノ酸変異のFIは1.713であり、下位41種のアミノ酸変異のFIの0.948より大きいので、上位34種のアミノ酸変異は正の自然選択を受けている可能性が示された。同様にHapMapでは、FIについて上位30種のアミノ酸変異が正の自然選択を受けている可能性が示された。

 表2からPerlegenについて、同義変異の固定/多型比を中立における期待値とすると、FIの上位34種のアミノ酸変異には (7589-[419 x 32582/3082])=3160個だけ期待値以上に種間変異が蓄積していることになり、その割合は種間変異におけるアミノ酸置換の11.9%(=3160/[7589+18916])となる。この期待値以上のアミノ酸置換の蓄積は正の自然選択によるものと解釈できる。HapMapについては非同義変異にかたよった収集バイアスが強いので、Perlegenと同じ解析は不可能であるが、FIについて下位45種のアミノ酸変異の固定/多型比を中立における期待値とし、Perlegenと同様の解析をすると、3149個(7168-[437 x 22990/2500])のアミノ酸置換が期待値以上に蓄積しており、その全体のアミノ酸置換に対する割合は10.4%(=3149/[7168+2290])となる(同じ解析をPerlegenのデータを用いてすると結果は12.8%となる)。2種類のデータベースからの正の自然選択を受けているアミノ酸置換の割合の推定は、ほぼ同じ結果になり、ヒトゲノム全体で正の自然選択を受けているアミノ酸置換の割合は10.4%〜12.8%であると推定される。

 どのような種類のアミノ酸変異が固定しやすいか、すなわち高いFIを持つのか?アミノ酸の変異や置換を議論するときに、しばしばアミノ酸の物理化学距離が使われる。物理化学距離が大きいアミノ酸の変異は、タンパク質の構造や機能に与える影響が大きいと考えられ、このような種類のアミノ酸変異は自然選択により淘汰されるのか、または選択されるのかという問題は長く議論されてきた。図1はFIとアミノ酸の物理化学距離との相関図である。Perlegen とHap-Mapのどちらのデータベースにおいても両者に相関がないことから、アミノ酸の物理化学距離はFIを説明しない事が言え、アミノ酸の固定のしやすさはアミノ酸の物理化学距離によらないことが示された。

 FIを説明するようなアミノ酸のパラメータは何か?図2はFIとPIの相関を示した図である。どちらのデータベースでもFIとPIはL字型の分布となり有意に負の相関を示した。特に、高いFIのアミノ酸変異のPIはすべて低かった(図2の点線枠内)。このことから、固定しやすいアミノ酸変異は多型になりにくいアミノ酸変異であること言え、アミノ酸変異の多型のなりやすさと固定のしやすさは、逆の傾向を示す事が分かった。また。多型になりにくいアミノ酸の変異は負の自然選択を受けやすい変異だと言え、したがって以上の事から、正の自然選択と負の自然選択は同じ種類のアミノ酸変異(PIが低い=多型になりにくい変異)に強く作用する事が示された。

表1 SNPデータベースの概要 A=非同義変異、S=同義変異

表2 75種類のelementary amino acid changes(一部)

図1 アミノ酸の物理化学距離

(Granthamの距離)とFIの相関。

a)Perlegen,b)HapMap.

図2 FIとPIの相関図。a) Perlegen, b) HapMap点線はFIについて下位41(45)種のアミノ酸変異の平均FIを示す。

審査要旨 要旨を表示する

 本論文は4章からなり,第1章はイントロダクションであり、研究の目的と背景が述べられている。第2章は本研究でもちいた材料と方法が詳述されている。第3章は本研究によって得られた結果が、第4章では結果の考察が述べられている。

 ヒトゲノム上のタンパク質をコードする遺伝子のうち、どれだけが適応進化をしたかという問題は分子進化学や集団遺伝学において長らく議論されてきた。適応進化を検証する方法として種内変異(polymorphism)と種間変異(divergence)を対比する方法があり、進化の段階を多型(polymorphism)と固定(fixation)に分けて考える事で、自然選択の検出力を高める事が期待される。集団中に新たな変異が導入された時、その変異が有害であったならば負の自然選択によって集団より除去され、有害でなかった場合その変異は多型となり、遺伝的浮動によりその変異の頻度は時間とともに増減する。集団中に除去されずに残った変異体は、そのまま遺伝的浮動により偶然に集団中に固定することもあり、生存に有利な変異であった場合は、正の自然選択により急速に固定する。前者の段階を進化の多型の段階、後者を固定の段階とすると、多型の段階では負の自然選択が遺伝的浮動とともに重要な力であるのに対し、固定の段階では遺伝的浮動に加えて正の自然選択の働きも重要となる。このように多型と固定の段階において主に働く自然選択の種類が違う事から、本論文では非同義置換を1つの塩基置換で起こりうる75種類のelementary amino acid changeに分類し、75種類すべてのelementary amino acid changeのそれぞれに対して、多型のなりやすさの指標であるPI (Polymorphism Index)と、固定のしやすさの指標であるFI (fixation Index)を定義して、この2つの段階を対比する事で、変異に対して自然選択がどのように作用するかを検証している。

 ヒトのSNPを由来型アレルの頻度別にみると、低頻度のSNPでは非同義置換/同義置換比(A/S比)が高頻度のものと比べて高かった。これは有害突然変異がヒトの集団の中で低頻度に蓄積していることを示している。FI=(固定A/S)/(コモン多型A/S)と定義し、FIの観測値が期待値を上回るかどうかで正の自然選択の有無を検証したが、強い正の自然選択は検出されなかった。次にアミノ酸変異を一塩基置換のみでおこる75種類のelementary amino acid changeに分類し、それぞれのアミノ酸変異についてA/S比を多型と固定の段階で比較している。また、各アミノ酸変異について期待される変異の数(new mutationの数)を解析に用いた遺伝子の塩基組成から計算している。ここで、PI=(レア多型A/S)/(new mutation A/S)とし、アミノ酸変異の多型のなりやすさの指標としている。FIはアミノ酸変異ごとに再計算しアミノ酸変異の固定のしやすさとしている。75種類のアミノ酸変異のFIについてχ2検定を行うと有意差があることから、FIは75種類のアミノ酸変異について一様ではない事を示した。また、ヒトゲノム全体で正の自然選択を受けているアミノ酸変異の割合は10.4%〜12.8%であると推定している。また、アミノ酸の物理化学距離はFIを説明しない事、すなわち、アミノ酸の固定のしやすさはアミノ酸の物理化学距離によらないことを示した。FIとPIの相関分析をおこない、多型になりにくいアミノ酸の変異は負の自然選択を受けやすい変異であり、正の自然選択と負の自然選択は同じ種類のアミノ酸変異(PIが低い=多型になりにくい変異)に強く作用する事を示した。

 以上,本研究はヒトゲノムSNPデータならびにヒトに最も近縁な現生種であるチンパンジーゲノム配列データから対立遺伝子の多型と固定の様態を明らかにすると共に、ヒトの適応進化を検証するための貴重な知見を明らかにしている。なお,本論文は米国シカゴ大学のChung-I Wu博士、Hua Tang博士、Joshua Akey博士との共同研究であるが,論文提出者が主体となって分析および検証を行ったもので,論文提出者の寄与が十分であると判断する。

 よって,博士(理学)の学位を授与できると認める。

UTokyo Repositoryリンク