学位論文要旨



No 127376
著者(漢字) 三浦,千明
著者(英字)
著者(カナ) ミウラ,チアキ
標題(和) 相互突然変異がある場合の2座位2対立遺伝子モデルの分布に対する近似公式について
標題(洋) On an approximate formula for the distribution of 2-locus 2-allele model with mutual mutations
報告番号 127376
報告番号 甲27376
学位授与日 2011.06.30
学位種別 課程博士
学位種類 博士(理学)
学位記番号 博理第5716号
研究科 理学系研究科
専攻 生物科学専攻
論文審査委員 主査: 東京大学 教授 田嶋,文生
 東京大学 教授 平野,博之
 東京大学 講師 井原,泰雄
 東京大学 准教授 高野,敏行
 名古屋市立大学 教授 能登原,盛弘
内容要旨 要旨を表示する

理論集団遺伝学では、あるメンデル集団中に生じた突然変異(遺伝子)が、自然選択圧や浮動、集団の大きさの増減や分集団間での移住、近親婚や同類婚などの条件下で、集団中にどのように広まっていくのかを数理的に研究する事を目的の一つとする。この場合重要な指標の一つは突然変異遺伝子の集団内での頻度(分布)であり、頻度(分布の)変化のモデル化とその解析が研究の中心となる。またヘテロザイゴシティーのような集団遺伝学的統計量の多くがしばしば頻度分布から構成されることからも、その重要性が理解できる。

1座位のみの場合、定常分布については、その数学的な扱い易さから十分豊富な結果が導かれている(Wright 1931, 1937)。また推移分布に関しても、Kimura(1955)やCrow and Kimura(1970)らの研究から、多くのの場合についてその解析的な解やその性質が求められている。2座位間の連鎖がある場合については、これまでは主に2座位モデルに特異な問題である連鎖不平衡(LD)に焦点が当てられてきた。例えば浮動のみの場合の期待値の時間に沿ったLDの推移(Ohta and Kimura 1969a)や定常状態での性質(Hill and Robertson 1968)、また再起突然変異がある場合の定常状態における偏差値(Ohta and Kimura 1969b)など、部分的な情報は得られていた。しかし各座位のアレル頻度や連鎖不平衡それ自体の頻度、またはハプロタイプ頻度について直接その頻度分布を求める試みは、その数学的な困難さからあまり研究されてこなかった。

一方確率論の分野においては、Watanabe(1987)やIkeda and Watanabe(1989)らによって、添え字付けられた伊藤過程によって表される確率微分方程のクラスにおいて、ウィーナー空間上でテイラー展開可能な条件が研究されてきた。更にYoshida(1992)によって数理統計への応用が研究され、確率過程の分布の具体的な漸近展開が得られるようになった。Takahashi and Kunitomo(2003)はこの理論を用いて、経済学に於けるデリバティブのプライシングの問題を考察し、漸近的な解とその有効性について研究した。これらの研究から得られた理論は小分散理論とよばれる。本論文では今まで導かれていなかった、それぞれの座位で相互に突然変異のある2 座位間のモデルについて、小分散理論を応用することで、頻度分布の推移的状態について明示的な近似表現を導いた。

【モデル】

2 つの座位A、B にそれぞれA1とA2、B1 とB2 のアレルがあり、再起突然変異率と各アレル頻度を以下のように決める。

ハプロタイプA1B1、A1B2、A2B1、A2B2 の頻度をそれぞれ x1、x 2、x 3、x 4 とする時、連鎖不平衡の度合いをD=x1x4-x2x3で表す。この時Dも確率過程となる。また組み換え価をcとする。モデルはpt= p、qt=q、Dt=Dを元とする3次元の確率微分方程式で表現する事が可能である。即ち

ここで

と書ける。 p 0、 q0 、 D0 はt=0 での初期値で、 Bt は3 次元のブラウン運動。

【漸近展開と近似公式】

上で述べた通り、形式的にε(0≦ε≦1)によって添え字づけられた、頻度と連鎖不平衡の確率過程〓をε に沿って展開する事が保障される。つまり

となる。ここで各 g (it)は非確率的な伊藤積分であり、従って平均0 のブラウン運動に沿う。今yt(ε)=(xt(ε)-xt(0))/ε と置くと、〓 。つまりyt(ε)は各時点t、ε→0で、平均0、共分散行列 Cov( g1t) の3 次元正規分布に従う。よって、xt(ε)は各時点t、ε→0で、平均xt(0)、共分散行列Cov( g1t)の3 次元正規分布に従う。

以上から近似公式〓が導かれた。

【シミュレーションと例】

近似公式はxtの真の分布をε→0という極限で、単峰型の分布である正規分布で近似したという事である。勿論εの与え方から、xt=xt(1)なので、この近似が非常に不正確になる条件がある。図1 は時間があまり経過していない時、真の分布のシミュレーションと近似公式から得た分布を重ね合わせたものである。特に分布の裾が境界に初めて到達する前までの頻度分布は単峰型を保つので、近似公式はうまく機能する。しかし時間が十分に経った場合、もし突然変異率が低いならば遺伝的浮動の効果の方が比較的強く働き、定常状態に近づくにしたがって頻度分布は境界に分布が偏り、結果として単峰型ではなくなり、近似公式では上手く表現できない(図2)。またこの場合LD は単峰型にもかかわらず、公式が頻度分布の境界近くでの分布を表せないために連鎖平衡状態になる確率を小さく見積もってしまい、結果的に真のLD の分布を表現する事ができない。他方で、突然変異率が十分高い(u1,v1,u2,v2,v2>(1/2))なら、頻度分布は境界から脱出する事無く推移時間を通して単峰型を保つので、公式を用いて上手く近似できる(図3)。

【定常状態とstandard linkage deviation (SLD)】

小分散理論では任意の有限時間までにおける確率過程のテイラー展開を保証しているが、時間が無限大の極限においては理論的に展開が保障できない。しかしながら形式的には近似公式をもちいて時間が無限大の定常状態について考える事が可能である。そこでその形式的な近似公式から、Ohta and Kimura(1969b)で定義され目下のモデルについて正確な値が導かれたstandard linkagdeviation(SLD)を構成し、LD に関してどの位の正確さを持つか考察する。まず自乗SLD は以下で定義される。

この定義から、Ohta and Kimura(1969b)で求められた正確な値をσ2(exact) と表し、形式的な近似公式から求めた値を2σ2(approx9と表す。図4は突然変異率をμ = u1 = v1 = u2 = v2と置いて増加させた時に、近似から正確な値を引いた関数がどのように変化するかを、組み換え率を色々と変えて見たものである。破線はc=0.01、点線はc=1、実線はc=100 の場合を表す。図から分かるように、近似から求めたSLD は常に正確な物より値が大きくなるが、組み換え率が高いほどその差小さくなる。また組み換え率がどのような大きさであっても、突然変異率が高くなれば、定常状態でも近似は非常に正確になる事がわかる。

【議論】

小分散理論は非常に広範な応用を持つ理論である。本論文では2 座位2 対立遺伝子モデルについて考察し、近似解を求める事に成功した。この結果から(幾らか計算量が増えるものの)すぐに2 座位多対立遺伝子モデルの近似解を求める事も可能である。また適切なパラメータセッティングに於いて、ancestral recombination graph にも応用が可能である。しかしながら真の分布が正規分布から遠ざかる時は、近似公式は境界をうまく表現する事ができない。この様な場合はまた、他の方法を用いて対処する必要がある。

図1

図2

図3

図4

審査要旨 要旨を表示する

本論文は3章から構成される。第1章では総合序論として理論集団遺伝学の中での本研究の位置付け及び本研究の目的が述べられている。第2章では具体的モデルと結果が、第3章ではその応用が示されている。

遺伝子頻度の分布を解析的に求める研究は、集団遺伝学的統計量の理論値の多くが頻度分布から導かれることから長く中心的主題の一つであり続けている。独立した1座位に関する頻度分布については、定常状態においても推移的な状態においても先行する研究によってかなり詳細に調べられている。2座位以上にわたる頻度分布を考える場合、座位間の組換え、座位間の相互作用や連鎖不平衡が存在するため、問題が非常に複雑になる。そのため先行研究においてもごくわずかな解析的研究があるのみである。定常状態においては、2座位間のモデルで相互突然変異が存在する場合の各座位の頻度とその間の連鎖不平衡の分布のモーメントなどが明示的に求められていた。しかし推移的な状態についての解析的研究は現在までほとんど知られていない状態であり、新たな手法による解析が必要とされていた。本論文の特徴は、比較的最近数学的基礎が築かれ数理ファイナンスの分野で利用されていたSmall disturbance asymptotic theoryを応用することにより、2座位モデルの推移状態の頻度と連鎖不平衡の分布に対する近似公式を与えることに成功していることである。この解析的な表示は、理論集団遺伝学の頻度分布の研究に新たな知見を加えるものである。

第2章においてはモデルの提示と近似公式導出のためのSmall disturbance asymptotic theoryを応用した具体的計算がなされている。さらに得られた近似公式がどのようなパラメーターの範囲の中で、どれほど良くモデルの真の分布近似できるかを研究するために、モンテカルロ法によるコンピュータ・シミュレーションが行われている。モデルは連鎖した2座位の間に組換えが存在し、各座位には選択がなく相互突然変異の存在する場合が採用されている。これは確率過程によって定式化する事ができる。一方Small disturbance asymptotic theoryは目下与えられた確率過程をブラウン運動に沿って展開する事を正当化する理論的側面と、具体的に密度関数の正規分布に沿った展開の計算を実行する方法までを含む。本論文では1次近似による公式が導かれ、その有効性が検討されている。シミュレーションとの比較によれば、公式は時間があまり経過していない状態か、突然変異が高い時には、十分よい近似を与える事が明らかになった。また定常状態においては、Small disturbance asymptotic theoryは確率過程の展開を数学的には保証しない。しかし先行する研究との比較によって、突然変異率が高ければ近似公式はやはり定常状態でもよい近似を与える事が明らかになった。

第3章では、第2章で導かれた公式の応用についての研究がなされ、また今後の展望について議論がなされている。Ancestral recombination graphは現在存在する各座位の系統の数から過去の共通祖先に至るまでの系統数の分布を表す確率過程である。これは実際のデータから組換え率を推定する時などに有効に用いられるが、解析的な表示はほとんど得られず、コンピューターによる大きな計算を必要とする。しかし本論文第2章において得られた近似公式を用いれば、各座位における相互突然変異がそれぞれ等しく、また突然変異率が高いといった限定的な条件の下ではあるものの、簡便な解析的表示が得られる事が明らかになった。また本章では今後の展望として、近似公式の精密化についての議論がなされている。すなわち突然変異率が低い場合においては、分布の境界において境界層法を用いれば公式がうまく機能する可能性が示唆されている。

第2章と第3章で述べられた結果は先行する研究には無く、全く新しいものである。主結果として得られた近似公式は実験データを解析する際に行われる計算を大幅に小さくできるだけでなく、今後の理論的発展の基礎的な道具立てを与えており、今後の集団遺伝学の分野に大きく貢献する可能性が認められる。

なお、本論文は、論文提出者が単独で行った研究であり、単著論文としてすでにGenes & Genetic Systemsに受理されていることを確認した。

したがって、博士(理学)の学位を授与できると認める。

UTokyo Repositoryリンク