学位論文要旨



No 115179
著者(漢字) 眞柄,祐一
著者(英字)
著者(カナ) マガラ,ユウイチ
標題(和) 3つのカテゴリからなる過大分散のあるデータの分析と環境リスクアセスメントへの応用
標題(洋)
報告番号 115179
報告番号 甲15179
学位授与日 2000.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4674号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 廣津,千尋
 東京大学 教授 伏見,正則
 東京大学 教授 竹村,彰通
 東京大学 教授 縄田,和満
 東京大学 助教授 駒木,文保
内容要旨

 化学物質の胎児に対する影響を評価する生殖発達毒性試験において,各母獣における胎児の状態を死亡,奇形,異常なしの3つの状態に分類してデータを分析することがしばしば行われる.このようなデータにおいて,データを説明するモデルとして3項分布を仮定すると,実際のデータの分散が3項分布の理論的な分散と比較して,過大になる場合がしばしばある.このようなデータを説明するモデルとして,母獣の胎児が3つのカテゴリに落ちる確率である反応確率が各母獣で異なり,反応確率がある独立同一分布に従うと考えるのが合理的であり,反応確率の分布としてディリクレ分布を仮定するディリクレ3項分布が用いられる.既存の研究において,ディリクレ3項分布を仮定して生殖発達毒性試験のデータを分析し,環境リスクアセスメントが行われているが,反応確率の分布としてディリクレ分布を仮定することの妥当性は必ずしも明らかではなく,ディリクレ3項分布を仮定して環境リスクアセスメントを行う場合,誤った推測を導く可能性があり,環境政策を行う上で問題になりうる.

 本論文では反応確率の分布としてディリクレ分布を仮定することが妥当であるかを反応確率の分布として任意の確率分布を考え,反応確率のとりうる共分散の領域を比較することによって調べた.ある母獣における胎児が死亡,奇形,異常なしの3つの状態になる反応確率(p,q,r)の平均を(,,)とし,反応確率の分布が任意の分布をとりうると仮定すると,反応確率の共分散のとりうる領域の満たす必要条件はp+q+r=1であること,p0,q0,r0であること,cov(p,q,r)が非負定値行列であることから求めることができ,この必要条件を満たす分布を具体的に構成することによって,この必要条件を満たす領域が反応確率のとりうる共分散の領域の十分条件でもあることを示すことができる.反応確率の共分散のとりうる領域は,3つのパラメータu,,を用いて,

 

 ただし

 

 と書くことができる.この(,,)の集合は3次元の凸集合であるが,ディリクレ分布のとりうる共分散の領域は,

 

 ただし,0<<1となり,3次元の凸集合の1次元の部分集合でしかないことがわかる.このことから,反応確率のとりうる共分散の観点からディリクレ3項分布は過大分散のある3つのカテゴリからなるデータを表現するモデルとして不十分であることがわかった.

 反応確率のとりうる共分散の領域を示すことにより,母獣の胎児の状態のデータの2次モーメントまで特定するセミパラメトリックモデルを構成することができる.セミパラメトリックモデルから推定関数を構成することができるが,本論文では興味あるパラメータである平均パラメータの推定量の分散が3次以上の高次のモーメントによらない推定関数を構成し,実データに対してパラメータ推定を行った.また,実際のデータにおいてディリクレ3項性が成り立たない場合,本論文で提案されたモデルがディリクレ3項モデルを仮定する場合と比較して,平均パラメータの推定に関してエフィシェンシーの観点から優れていることを理論的に示した.平均パラメータの推定量の分散推定として,モデル分散推定量とロバスト分散推定量を考えることができるが,ディリクレ3項性が成り立たない場合,ディリクレ3項モデルに基づいてモデル分散推定量を用いて分散推定を行うと,推定量の一致性が成り立たないことがわかる,シミュレーション実験によって,ディリクレ3項性が成り立たない設定で,平均パラメータの推定量のエフィシェンシーと平均パラメータの推定量の分散推定のバイアスに関して調べたところ,実際に得られるデータに近いサンプル数において,本論文で提案されたモデルとディリクレ3項モデルの平均パラメータ推定のエフィシェンシーに優劣がないこと,また,ディリクレ3項モデルに基づいてモデル分散推定量を用いて分散推定を行うとバイアスが大きくなることがわかった.

 本論文で提案されたモデルはディリクレ3項モデルを含むモデルであるので,データのディリクレ3項性に関する適合度検定を行うことができる.ディリクレ3項性に関する適合度検定として,推定関数に基づき,一般化ウォルド検定,一般化スコア検定,近似擬似尤度比検定の3つの検定を構成することができる.与えられる化学物質の用量により3群に分けられた生殖発達毒性試験の実データに対して適合度検定を行ったところ,3群のうち2群においてディリクレ3項性の帰無仮説に対して有意になった.従って,生殖発達毒性試験で観察されるデータはディリクレ3項性が成り立たないことがあることがわかった.

 ディリクレ3項性に関する適合度検定として,一般化ウォルド検定,一般化スコア検定,近似擬似尤度比検定の3つの検定を構成することができるが,これら3つの検定方式は漸近理論に基づくものであり,有限のサンプル数においてどの方式が優れているかは理論的には明らかではない,帰無仮説の下でデザインされた有意水準を達成するか否か,また,対立仮説の下で十分な検出力を持つか否かの2つの観点から,3つの検定方式に関する比較をシミュレーション実験により行った.実際に得られるデータのサンプル数に近い3つのサンプル数の設定を考え,モデルのパラメータの値も実際に得られるデータに基づいて設定し,シミュレーション実験を行ったところ,帰無仮説の下でデザインされた有意水準に十分近い有意確率を持ち,対立仮説の下でも十分な検出力を持つ検定として,近似擬似尤度比検定が優れていることがわかった.

 実際のデータにおいてディリクレ3項性が成り立たない場合があることが適合度検定によりわかるので,そのような状況において本論文で提案されたモデルとディリクレ3項モデルを用いて環境リスクアセスメントを行ったときの比較をシミュレーション実験により行った.このシミュレーション実験では,化学物質の用量として3つの用量をとり3群に分け,用量反応関係として死亡率,異常率にロジスティック曲線を仮定し,サンプル数も実際に得られるデータのサンプル数に近い3つの設定の場合を考えた.環境リスクアセスメントにおいて重要な指標として,Virtually Safe DoseとBenchmark Doseがあるが,Virtually Safe Doseは平均パラメータの推定,Benchmark Doseは平均パラメータの推定と平均パラメータの推定量の分散推定に関連がある.本論文で提案されたモデルはディリクレ3項モデルに比べ各群においてパラメータの数が2多く,このシミュレーション実験においてパラメータ数が6多いため,平均パラメータの推定においてバイアスが大きくなることがシミュレーション実験によりわかった.従って,Virtually Safe Dose,Benchmark Doseを求める場合,ディリクレ3項モデルを用いるのが良いことがわかった.また,環境リスクアセスメントのシミュレーション実験においても,ディリクレ3項性が成り立たない場合,ディリクレ3項モデルに基づきモデル分散推定量を用いて平均パラメータの推定量の分散推定を行うと,推定量に一致性がないためバイアスが大きくなることがわかった.従って,環境リスクアセスメントにおいてディリクレ3項モデルに基づき平均パラメータの推定量の分散推定を行う場合には,ロバスト分散推定量を用いるのが良く,ロバスト分散推定量に基づきBenchmark Doseを求めるのが良いことがわかった.

審査要旨

 現在日常的に使われている化学物質は、その適切な量によって健康を保ち、あるいは生産性を高めるのに有用である反面、量が過ぎた場合には人体あるいは環境に極めて有害な影響を及ぼす。そのため、その毒性評価は社会的要請の極めて強い研究課題である。本論文は「3つのカテゴリからなる過大分散のあるデータの分析と環境リスクアセスメントへの応用」と題し、環境リスクアセスメントのための基本的方法である動物実験の解析法に関し、新しい手法を提案するものであり、全6章から成る。

 第1章「はじめに」では、研究の意義、当該分野の現状、本論文の目的と位置付け、そして論文構成について述べている。

 第2章「3つのカテゴリからなる過大分散のあるデータに対するモデルの構成」では、動物実験における胎児の正常、奇型、死亡という3項データの確率モデルについて論じている。2.1節では、まず、同一母獣から生まれる胎児の状態が似通う同腹効果によって、通常の3項分布に比べ過大分散を示すデータの多いことからそれを説明できる確率モデルの必要性を述べ、現在唯一知られているディリクレ3項分布を紹介している。次に、2.2節では3項分布の確率がより一般の確率分布に従って変動するとした時に、その共分散行列の取り得る範囲を理論的に求め、ディリクレ3項分布の共分散行列はその中で極めて特殊な部分空間にしか過ぎないことを示している。2.3節では、ディリクレ3項分布の不十分性を補うものとして、任意の可能な共分散行列を生成する反応確率の分布を具体的に構成する方法を与え、それは実際に3.4節のシミュレーション実験に応用される。

 第3章は「推定方程式の構成とパラメータ推定」と題し、3項データの平均と過分散モデルを表す5個のパラメータの推定について論じている。ディリクレ3項分布のパラメータ空間はその3次元部分空間に当たる。推定方式はこれら2次以下のモーメント構造のみ既知として、ノンパラメトリックに構成している。3.1節では3項データのすべての2次以下のモーメントを用いて推定方程式を構成する方法について述べている。これは平均パラメータと分散パラメータに関する推定方程式をそれぞれ分離することにより、興味ある平均パラメータの推定方程式の構成に、2次より高次のモーメントの推定を不要とする巧妙な手法である。3.2節では平均パラメータ推定量の分散推定に関し、ロバスト分散推定量とモデル分散推定量を用いる方法を与え、両者が共に一致性を満たすことを述べている。3.3節ではChen等の3用量3項データに関し、本論文で提案する方法とディリクレ3項モデルに基づく方法を適用し、平均パラメータの推定値に有意な差が無いこと、一方、中用量、高用量において分散パラメータの推定に有意な差が生じることを示している。このことはChen等のデータに対するディリクレ3項分布の不適合を示唆する。このディリクレ性適合度検定は第4章の主題となる。3.4節では、さらに、データを発生する分布のパラメータを様々に変えた膨大なシミュレーションの結果から、平均パラメータの推定に関しては、バイアス、標準偏差のいずれについても比較した方法間に明らかな優劣の存在しないこと、一方、平均パラメータ推定量の分散推定に関しては、ディリクレ3項分布を仮定し、かつモデル分散を用いる方法はバイアスが明らかに大きく不適切であるが、他の3通りの方法に関しては明らかな優劣は存在しないという新しい知見を得ている。

 第4章は「ディリクレ3項性の適合度検定」と題し、ディリクレ3項分布の適合度検定の方法を与えている。4.1節では本章で扱う適合度検定が平均と分散・共分散構造のみを特定するモデルについてのものであり、通常の確率分布を特定する場合と相違すること、およびその困難な点について述べている。4.2節で一般化ウォルド検定、4.3節で一般化スコア検定、そして4.4節で近似擬似尤度比検定を導いているが、これらはいずれも従来にない新しい提案である。4.5節ではこれらの方法をChen等のデータに適用した結果、中用量と高用量においてディリクレ3項性が有意水準5%で棄却されることをあらためて示している。4.6節では帰無仮説の下でのシミュレーションを行い、近似擬似尤度比検定が最もよく所与の有意水準を達成し、また、一般化スコア検定も実用可能な範囲にあることを示している。4.7節では対立仮説の下でのシミュレーションを行い、その両者が共に十分な検出力を持つことを示している。4.8節は本章のまとめであり、他に理論的に正当化されたディリクレ3項性適合度検定法のない現状において、本章で提案した方法が最善の方法であることを述べている。

 第5章は「生殖発達毒性試験に基づく環境リスクアセスメント」と題し、本論文で提案したモデルを環境リスクアセスメントに応用することを論じている。5.1節では環境リスクアセスメントに用いられる分析手法を概観している。5.2節では死亡及び奇型発生(異常あり)率の用量反応曲線としてロジット線形モデルを想定し、それから作成される二つの主要な指標VSDおよびBDを取り上げることを述べている。VSDは、用量0のときに比べて、異常ありの確率が特定の値だけ大きくなる用量と定義される。BDはVSDの点推定値に替えて、その下側95%信頼限界の値を採用するものである。5.3節ではChen等の3用量データに対して、本論文で提案したモデル、およびディリクレ3項分布に基づきそれぞれBDの推定を行っているがその結果に大きな差はない。5.4節ではシミュレーションによりVSDおよびBDを推定する方法の性能比較を行っている。まず、VSDに関してはディリクレ3項モデルを仮定する方が本論文のモデルに基づく方法よりバイアスが小さい。これは、例え分散構造を誤って特定しても、平均パラメータに関しては一致性が保証されるという推定関数による接近法の頑健性と、3用量同時解析においては推定すべきパラメータ数が本論文のモデルの方が6多いことから、通常のサンブルサイズではやむをえない結果と思われる。BDの推定では分散推定の一致性が問題になるが、この場合でも、ディリクレ3項分布を仮定し、分散推定にロバスト分散を用いる方法が最適であることが示された。従って現状では、新しく提案したモデルはVSDおよびBDの推定に関しディリクレ3項分布を超える有用性を示すことはできないが、このことをきちんとした理論的枠組で明らかにしたこと自体が一つの成果である。

 第6章「本論文のまとめと今後の課題」では得られた結果を完結にまとめると共に、4カテゴリ以上のデータへの拡張など、今後の課題と展望について述べている。

 以上を要するに、本論文は、過大分散を示す3項データに対し、従来のデイリクレ3項分布を含む新しいモデルを提案し、この分野の応用研究のための埋論的枠組を与え、これによってディリクレ3項分布の環境リスクアセスメントにおける位置付けを明確にしたものであり、数理工学上の貢献が大きい。よって本論文は博士(工学)の学位論文として合格と認められる。

UTokyo Repositoryリンク