No | 118763 | |
著者(漢字) | 星野,崇宏 | |
著者(英字) | ||
著者(カナ) | ホシノ,タカヒロ | |
標題(和) | 構造方程式モデリングにおける段階推定と傾向スコア調整法への応用 | |
標題(洋) | Stepwise Estimation Procedure and its Application to Propensity Score Adjustment in Structural Equation Modeling | |
報告番号 | 118763 | |
報告番号 | 甲18763 | |
学位授与日 | 2004.03.25 | |
学位種別 | 課程博士 | |
学位種類 | 博士(学術) | |
学位記番号 | 博総合第482号 | |
研究科 | 総合文化研究科 | |
専攻 | 広域科学専攻 | |
論文審査委員 | ||
内容要旨 | 現在ほとんどの統計解析で利用されている推定方法は、Fisherによって提案され、1950年代初頭に基礎的な理論研究が完成した最大尤度法である。最大尤度法によって構成される推定と検定は、分布の仮定と統計モデルが決定すればほぼ自動的に計算ができるという簡便性や、大標本においての様々な優れた性質、たとえば標本数を無限大にした時に必ず母数の真値と等しくなるという一致性などを有するため、多くの学問分野で利用されてきた。 さらに心理学や社会科学分野では、分布の仮定を行わなくても利用できる推定方法として、様々なタイプの最小二乗法が利用されている。最大尤度法や最小二乗法などは性質の違いは存在するが、これらはモデル上のすべての母数を一度に推定する同時推定法として考えることができる。 これに対して、心理学などの行動科学分野や社会科学分野においては、母数をいくつかに分割し、段階的に推定を行う「段階推定法」が、同時推定が単に難しい場合に採用されるだけではなく、利用されるべき積極的な理由は複数存在すると考えられる。 本論文では、構造方程式モデリングにおいて、以下の3つの問題意識から段階推定法を提案し、その性質に関する研究を行った。 構造方程式と測定方程式の母数を別々に推定する方法の重要性 構造方程式モデリングでは、潜在因子間の関係を推定することが関心となる場合が多いが、潜在因子の定義は測定方程式の母数の推定結果に依存している。しかし、同時推定法では、構造方程式と測定方程式の母数を同時に推定するために、構造方程式の設定によって因子の定義が変化するという問題が発生する。 これに対して様々な研究者が構造方程式と測定方程式を別々に推定することを推奨しているが、これらの提案では明確な推定法の定義が行われておらず、さらに数理的な性質も明らかにされてこなかった。そのために、同時推定法が利用され続けてきたが、数理的性質の明確な段階推定法の開発が重要である。 因子スコアを用いた構造方程式の推定を行う方法の重要性 因子スコアの推定値を用いた構造方程式の母数推定は、(I)構造方程式の設定による測定方程式の推定への影響がない、(II)素データより遥かに少ないデータサイズですむ、(III)構造方程式モデリング全体の推定が不要、などといった利点があり、頻繁に実行される方法であるが、この方法は非常に大きな推定の偏りを与えることが知られている。そこで、因子スコアを用いた一致推定法があれば望ましい。 共変量の分布を調整することで、無作為割り当てが行われない研究において無作為割り当てにおいて得られる因果効果(causal effect)を推定する方法の重要性 行動科学においては、教育レベルや生育環境などの、研究者が操作不可能な要因の効果に関心があることが多い。無作為割り当てが行われない場合に従属変数に影響を与える共変量の影響を除去し、純粋な要因の効果(=因果効果)を推定するために、様々な手法が提案されているが、その中でも近年Rosenbaum & Rubin (1983)が提案した傾向スコア(Propensity Score)を用いた調整法は非常に有効である。傾向スコア調整法は段階推定法の一種として考えることが出来るが、一般的なパラメトリックモデルに対して適用でき、かつ数理的性質の良い手法の開発が行動科学の発展に非常に有用であると考えられる。 これらの方法はいずれも第一段階として局外母数を推定し、第二段階において第一段階での局外母数の推定値を所与として、研究者の本来の関心の対象である母数を推定する段階推定法である。 本論文は大きく2つの部分に分かれる。 まず構造方程式モデルにおける段階推定法について、以下の2つの研究を行った。 第2章では、上記(1)の問題意識から、構造方程式モデルにおいて測定方程式と構造方程式部分の母数を別々に推定する段階推定法の研究を行った。 特にいくつかの条件の下で、構成概念を測定する測定方程式の母数を第一段階として推定する場合、その推定量が一致推定量であり、漸近正規性を有することなどを示した。さらに構造方程式が測定方程式に影響を与える問題の原因をシミュレーション研究により特定した。 また、行動科学研究において必要であると考えられる、母数に制約がある場合の擬最尤推定量の漸近分布や、複合仮説における擬尤度比の漸近分布を導出した。 第3章では、(2)の問題意識から、「因子スコアを推定し、因子スコア間の相関係数を計算したり回帰分析を行うことで構造方程式の母数を推定する」という、非常に頻繁に行われる段階推定法が偏りのある推定法であることを示し、その原因を特定した。 そして、因子共分散の一部を置き換えるという方法を用いて、因子スコアを用いて構造方程式の母数を正しく推定する段階推定法を提案し、その数理的性質についての研究を行った。 また、様々な状況を想定したシミュレーション研究によって、因子スコアを用いた既存の推定法が、たとえ被験者数を多くしても偏り非常に大きいことを示し、提案された方法は最尤法とあまり変わらない精度で推定できることを示した。 第2・3章で提案された段階推定法では、第二段階はGong & Samaniego(1981)が提案した擬最大尤度法(Pseudo maximum likelihood estimation method)と同一である。 次に(3)の問題意識から、無作為割り当ての近似のために有用な傾向スコアによる調整法についての研究を行った。 第4章では、これまで行動科学への応用という観点からはほとんど取り上げられてこなかった傾向スコアによる調整法についての展望を行った。 既存の方法では多群の平均値の比較、または回帰モデルでの調整が可能であったが、構造方程式モデリングを含む複雑なモデルには利用することができなかった。 そこで第5章では、一般的なパラメトリックモデルにおいて傾向スコアによる共変量の調整を可能にする重み付き対数尤度最大化法を提案した。 具体的には、以下のような状況を考える。J個の条件が存在し、各被験者はその条件のどれかに割り当てられるとする。ここで、第i被験者が第j条件に割り当てられた時の従属変数yの値をYijとする。また、第i被験者が第j条件へ割り当てられる確率=「第i被験者の第j条件への一般化傾向スコア」をWijと置く。第i被験者が第j条件へ割り当てられるかどうかを表す割り当て変数をZijとする。ここでもし第i被験者が第j条件へ割り当てられる場合はZij=1、そうでないならZij=0であり、この割り当て変数は欠測を表す変数と考えることもできる。ここで、推測の目的は第j条件での従属変数yjの周辺分布P(yj|θ, θc)のみに特有な母数θjと、各条件に共通する母数θcを推定することにある。ここで、全被験者数をNと置くとき、以下の対数尤度〓を最大化するθj, θcの最尤推定量は、YjとZjが独立でない限りバイアスのある推定量となり、一致性も無い。 ここで、"weak unconfoundedness"条件、つまり全てのjについてYjとZjは共変量xを所与とすると独立であるという仮定が成立する場合に、一般化傾向スコアを用いた重み付け対数尤度〓を最大化する推定量に一致性と漸近正規性が存在することを証明した。 また、実際には一般化傾向スコアWijの真値は未知であり、一般には割り当てと共変量から推定される。ここで、上記の重み付け対数尤度において、一般化傾向スコアの推定値Wijを利用した段階推定を行って得られる推定量、つまり〓を最大化する推定量は、一般化傾向スコアの真値が分かっている場合の重み付き対数尤度最大化推定量と漸近的に同一の分布に従うことを示した。 つまり、一般化傾向スコアの推定に伴う変動は、従属変数の周辺分布の母数推定には影響を与えないという興味深い結果が得られた。 さらに、重み付き対数尤度最大化推定量を用いた検定法も開発した。 これらの結果は、本論文前半で利用した擬最大尤度法の議論を変形することで得られるという点で、前半部分と非常に関連がある。 第6章では、多群の構造方程式モデリングの母数推定に上記の結果を応用し、潜在変数上での因果効果の推定と検定を可能にする方法を構成した。 また、具体的にNational Longitudinal Educational Surveyのデータを利用し、高校における労働がその後の中退へ及ぼす影響や、進学コースによって生徒の自己概念が変化するかなどを提案された方法で解析し、「共変量の影響を除去した」ある要因単独の因果効果を推定することの有用性を示した。 | |
審査要旨 | 本論文は構造方程式モデルにおける既存の同時推定法の諸問題点を指摘し、それらの問題を解決するための段階推定法を統一的観点より提案し、その方法の統計的性質についての研究を行ったものである。構造方程式モデルは観測変数と潜在変数、潜在変数間の関係を推定するために行動科学において非常によく利用されている。構造方程式モデルの推定では,全母数の同時推定法が、一致性などの優れた性質を有する方法であるとして、母数を分割して段階的に推定する方法より良いとされて来た。しかし実質科学的な研究分野、特に心理学などの行動科学分野や社会科学分野においては、同時推定よりも段階推定が積極的に利用されるべき応用研究が多くあると思われる。本論文では,段階推定に関して,次の3つの問題点を指摘し,その問題を解決するための新しい方法を提案し,理論的考察を行っている。 第一の問題点は,構造方程式モデリングでの同時推定法では、構造方程式と測定方程式の母数を同時に推定するために、構造方程式の設定によって測定する潜在因子の定義が変化するという問題である。これに対して様々な研究者が構造方程式と測定方程式を別々に推定することを推奨しているが、これまで,明確な推定法が提案されておらず、さらに統計学的な性質も明らかにされてこなかった。第2章は,この問題に解決を与えるものである。 第2の問題点は,従来良く行われてきた段階推定法の持つ問題である。従来は,統計理論や計算能力が不十分であり,潜在変数(因子スコア)の推定値を求め,その推定値を所与として,構造方程式のパラメータを推定する方式をとることが多かった。しかし、この方法はしばしば非常に大きな推定の偏りを与える。この偏りを是正する修正法が第3章に説明される。 第3の問題点は,無作為割り当てが不可能な実験や調査のデータから因果関係を取り出す方法として十分満足できる方法がない点である。行動科学においては、教育レベルや生育環境などの、研究者が操作不可能な要因の効果に関心があることが多い。従って,共変量の分布を調整することで、無作為割り当てが行われない研究において本来の因果効果を推定する方法が重要な意味を持ってくる。それにもかかわらず,共変量を取り除いた上で,処理間の因果効果を推定する有効な方法は,統計学的根拠を欠くきらいがあった。第4章以下は,この点について,新しい理論体系を用意し,実際的な方法をも提案するものである。以下は,各章ごとに,章の内容を紹介する。 第2章では、一点目の問題意識から、構造方程式モデルにおいて測定方程式と構造方程式部分の母数を別々に推定する段階推定法の提案が行われた。特にいくつかの条件の下で、構成概念を測定する測定方程式の母数を第一段階として推定する場合、その推定量が一致推定量であり、漸近正規性を有することが示された。また、母数に制約がある場合の擬最尤推定量の漸近分布や、複合仮説における擬尤度比の漸近分布も導出された。さらに構造方程式が測定方程式に影響を与える問題の原因を特定し、同様のシミュレーション研究によって、本方法が最尤推定法よりもモデルの誤設定に対して頑健であることが示された。 第3章では、二点目の問題意識から、因子スコアの推定値を所与とする,従来の簡易な段階推定法が偏りのある推定法であることを示し、その原因が特定された。そして、因子共分散の一部を置き換えるという方法を用いて、因子スコアを用いて構造方程式の母数を正しく推定する段階推定法を提案し、その一致性が証明された。また、様々な状況を想定したシミュレーション研究によって、因子スコアを用いた従来の推定法が、たとえ被験者数を多くしても偏りが非常に大きいことを示し、これに対して本論文で提案された方法は実用上十分に精度で推定が可能であることが示された。 第4章では、従属変数に影響を与える共変量の影響を除去し、純粋な要因の効果である因果効果を推定するための方法として傾向スコア(Propensity Score)を用いた調整法が近年注目されているが,この方法についてのこれまでの到達点を展望している。この展望で明らかにされたように、既存の傾向スコア調整法は不十分であり,構造方程式モデリングを含む複雑なモデルには利用することができない。傾向スコア調整法は段階推定法の一種としてとらえ、一般的なパラメトリックモデルに対して適用でき、かつ統計学的性質の良い手法の開発が行動科学の発展に非常に有用であると考えられる。 そこで第5章では、一般的なパラメトリックモデルにおいて傾向スコアによる共変量の調整を可能にする重み付き対数尤度最大化法が提案された。共変量の値によって従属変数が観測される確率が決定される場合、欠測を無視した最尤推定量はバイアスのある推定量となり、一致性もないのに対して、"weak unconfoundedness"条件、つまり従属変数と割り当て変数は共変量を所与とすると独立であるという仮定が成立する場合には、提案された一般化傾向スコアを用いた重み付け対数尤度を最大化する推定量は一致性と漸近正規性を有することが証明された。 実際には一般化傾向スコアの真値は未知であり、一般には割り当てと共変量から推定されるが、上記の重み付け対数尤度において、一般化傾向スコアの推定値を利用した段階推定を行って得られる推定量は、一般化傾向スコアの真値が分かっている場合の重み付き対数尤度最大化推定量と漸近的に同一の分布に従うことも示された。つまり、一般化傾向スコアの推定に伴う変動は、従属変数の周辺分布の母数推定には影響を与えないという数理統計学上も興味深い結果が得られている。さらに本論文では重み付き対数尤度最大化推定量を用いた検定法も開発されている。これらの結果は、本論文前半で利用した擬最大尤度法の議論を変形することで得られるという点で、前半部分と関連がある。 第6章においては、第5章で提案された一般的な方法を具体的に多群の構造方程式モデリングに応用し、潜在変数上での因果効果の推定と検定を可能にする方法を構成し、さらに具体的に行動科学のデータに適用し、有用な知見を得ている。 以上、本論文の成果をまとめると、第一段階において関心のない局外母数を推定し、その推定値を所与として第二段階として本来関心のある母数を推定するという統一的な方略に立脚し,新しい段階推定法を提案することで、行動科学研究における構造方程式モデリングの推定において、理論上にも実際的な観点からも大きな貢献をしていることは評価に値する。 よって、本論文は東京大学大学院総合文化研究科課程博士(学術)の学位請求論文として合格であると認定された。 なお、本論文の第2章、第4章の内容の一部は、それぞれ「心理学研究」「品質」誌にすでに掲載されている。 | |
UTokyo Repositoryリンク |