学位論文要旨



No 127704
著者(漢字) 宇佐美,慧
著者(英字)
著者(カナ) ウサミ,サトシ
標題(和) 潜在変化得点モデルに基づく縦断データの群間比較 : 検定力と潜在クラス数の推定に焦点を当てて
標題(洋)
報告番号 127704
報告番号 甲27704
学位授与日 2012.03.22
学位種別 課程博士
学位種類 博士(教育学)
学位記番号 博教育第191号
研究科 教育学研究科
専攻 総合教育科学専攻
論文審査委員 主査: 東京大学 教授 南風原,朝和
 東京大学 准教授 遠藤,利彦
 東京大学 准教授 針生,悦子
 東京大学 教授 山本,義春
 東京大学 教授 野崎,大地
内容要旨 要旨を表示する

教育学・心理学・医学・薬学・農学等の分野を中心に広くその利用が浸透しつつある,縦断データ解析のための方法論に潜在曲線モデル(Latent Curve Model: LCM)がある.潜在曲線モデルは,数学的には平均構造を伴う確証的因子分析モデル(もしくは構造方程式モデリング) として位置付けられることから,そのモデル表現上の柔軟性を活かして,多くのモデル開発に関する理論研究がこれまでに報告されている.その中でも近年,応用上特に高い注目を集めているモデル表現の一つに,図1および図2で示されているような,潜在変化得点モデル(Latent Change Score Model: LCSM)が挙げられる.本論文の目的は,この潜在変化得点モデルを用いた,成長軌跡の(多母集団潜在曲線モデルに基づく)群間比較,および有限混合モデリングとの融合的手法である潜在変化得点混合モデルを用いた成長軌跡の潜在クラス間比較の二点に関わる方法論的問題について検証することである.

第1章ではまず,縦断データ解析の歴史を俯瞰しながら,潜在曲線モデルおよび潜在変化得点モデルの方法論上の位置づけについて触れた後に,多母集団潜在曲線モデルおよび潜在成長曲線混合モデルに基づく成長軌跡の比較の問題を議論した.そこでは,多母集団潜在曲線モデルと潜在変化得点混合モデルの間では,比較の主眼となる母数の違いや分析の探索的性格の強さなどの違いがある一方で,より多面的に成長軌跡の変化のメカニズムを把握しデータの理解を深めるという共通した狙いがあること,および潜在曲線モデルはまだ潜在変数モデリングの方法論の中では比較的歴史が浅いこともあり,成長軌跡の比較に関わる方法論的問題の検証は現段階では不十分であることを指摘した.

第2章では,最も基本的な潜在曲線モデルをはじめとして,多母集団潜在曲線モデル・自己回帰潜在曲線モデル・多変量潜在曲線モデル等についての数理的な概要を俯瞰した後に潜在変化得点モデルの特長について説明した.より具体的には,(i)潜在的な変化得点についての回帰式を設定し,変化得点の構成要素を比例的変化部分と定数的変化部分に分けて記述することを通して,直接観察されない変化の構造についてより詳細な言明を行うことが可能であること,また(ii)母数の解釈が比較的容易でありながらも,その表現の一般性の高さから多くの下位モデルを包含しており,実際のデータの特性に合わせて非線形の成長軌跡を柔軟に当てはめることが可能であること,そして(iii)カップリング母数を通して,多変量の測定値間の動的な関係を,潜在的な変化得点への影響度を通して直接的に記述することが可能であること,の3点を指摘した.また,本章の新規な内容として,潜在変化得点モデルと有限混合モデルを融合した潜在変化得点混合モデルの概要について説明を行い,さらに潜在変化得点モデルおよび潜在変化得点混合モデルの平均構造と共分散構造をRAM表現に即して導出した.

第3章では,二群間の平均的な成長軌跡の違いを検証する実験場面を想定して,非線形の成長軌跡を柔軟に考慮しながら,実験・介入効果の継続性を検証するための,(一変量)潜在変化得点モデルの傾き因子得点の平均値差の検定に関する検定力評価の問題に着目し,現段階においてその実行が困難である検定力分析およびサンプルサイズ決定を,その値の解釈および設定が容易な指標を通して行う方法を提案した.そして,これらの指標と検定力との関係を数値的検証を通して系統的に検討し,その実行の簡便性の観点から,特に正確な設定が必要な指標として効果量ES,測定の信頼性 ,比例的変化部分で説明される分散の割合 を挙げ,またこれらの設定条件を考慮した,一定の検定力を確保するのに必要なサンプルサイズを近似的に求める数表の作成を行った.さらに,より一般的な解析状況を想定して,測定時点数$T$が変化する場合やアンバランスデザインの場合,他にも切片因子得点の偏りがある場合(無作為化が成立していない場合)等における検定力の推定への影響についても検証した.その結果,(i)効果量ESが変化しなければ,測定時点数Tの違いは検定力の大きさにはほとんど差異を与えないことや,(ii)サンプルサイズ比が0.30-0.70程度(0.10-0.90程度)の偏りがある場合は,

効果量ESが大きく検定力が既に1付近に達している場合を除いて,バランスデザインである場合に比べて概ね一割(四割)前後の検定力の低下が見込まれること,(iii)また誤って切片因子の因子平均に群間で等値制約を課して検定すると,実際の偏りが小さい状況であっても検定力は敏感にその影響を受け,効果量ESに即した検定力評価の適切性は失われること,が分かった.

第4章では潜在変化得点混合モデルにおける潜在クラス数推定の問題に着目し,二変量潜在変化得点混合モデルに即して,情報量規準による潜在クラス数の選択傾向を,サンプルサイズや混合比率,また潜在クラス間の分離度など多面的な設定条件を考慮した,大規模なシミュレーション実験を行って検証した.その結果,とりわけ,応用上最も注目すべき点として,(i)潜在クラス間の分離度が大きく,サンプルサイズが大きいほど推定精度が一般に高くなるが,正規性を含め統計モデル上の仮定が満たされている理想的な場合においても,如何なる分離度やサンプルサイズ,混合比率の条件下でも一貫して優れたパフォーマンスを示す万能な情報量規準は存在しないこと.(ii)また,広く利用・推奨されているBICの利用は,分離度が高いときは対数尤度に基づく情報量規準の中でも高い推定精度をもつが,高い分離度が潜在クラス間にない限りは不適切であり,また最低限(200以上)の合計のサンプルサイズも必要であること.(iii)データに外れ値が存在する場合は,全ての情報量規準において過大推定傾向が高まるが,BIC,CAIC,ICL.BICについては比較的その影響に対して頑健であること.また,とりわけ外れ値の影響が大きい場合は,過剰に抽出される潜在クラスの混合比率が小さくなるため,このような際は特にサンプルサイズを増やすことで過剰に抽出された実質無意味な潜在クラスを特定し易くなること.(iv)測定値の上限への集中がある場合には,同様に全ての情報量規準において過大推定傾向が顕著に見られるが,エントロピーに基づく情報量規準は相対的に頑健であること.また,外れ値の影響がある場合とは異なり,真の潜在クラス数よりも多くの潜在クラスを設定して推定した場合においては,サンプルサイズの設定如何と関係なく,混合比率の小さな実際上無意味な潜在クラスは抽出されず,また真の成長軌跡との乖離が著しい成長軌跡が推定されてしまうこと.(v)(i)のような一般論が指摘できる一方で,ICL.BICは,ある程度の分離度が存在すれば,外れ値や測定値の上限の影響に対して比較的頑健でありながらも,高い選択精度をもって潜在クラス数を推定することができるため,応用上最も参照すべき情報量規準であること,が指摘された.

第5章では,全国高齢者縦断調査データに対して潜在変化得点モデル(および潜在変化得点混合モデル)の適用例を示し,また第3章の内容に関する追加検証を行った.まずADL・IADLデータおよび身体機能データに対して,性別を群とみなして群間の成長軌跡の差異を,傾き因子得点の平均値差を介して検定した場合の適用例を示し,その後モデルから計算された(事後)検定力と,モンテカルロ法を用いたシミュレーションにより推定された検定力の値を比較し,床効果やデータの離散性などの正規性からの逸脱の影響や漸近理論に基づく計算手続きの影響を受けて後者の値の方が低くなること(すなわち事後検定力が過大推定されていること)を示した.そして身長・体重データにおいては,二変量潜在変化得点混合モデルを適用した例を示し,各情報量規準の選択結果や解釈可能性(成長軌跡の特徴や性別間での一貫性)を考慮して,潜在クラス数をC=3と決定した.ここで,情報量規準間で推定結果の差異が見られたが,その理由として,潜在クラス間の成長軌跡の変化構造の違いや潜在クラス間の分離度,またサンプルサイズの影響を受けた結果,一部の情報量規準において潜在クラス数が過小推定されていた可能性が,第4章のシミュレーションの結果から示唆された.さらに,C=3のモデルの下で,男性・女性それぞれのデータに対してプロフィール解析を実行し,またベクトル図の作成も行った.

最後に,第6章では,本論文の一連の検証を通して得られた結果のまとめを行い,また今後の研究の方向性として特に重要な点として,(i)ベイズ統計の応用,(ii)ノンパラメトリック法・セミパラメトリック法の応用,(iii)欠損データの問題,の三点を挙げて,それぞれ議論した.

図1 一変量潜在変化得点モデル(測定時点数TがT=4の場合)

図2 二変量潜在変化得点モデル(測定時点数TがT=4の場合)

審査要旨 要旨を表示する

臨床的介入群と非介入群の間で,ターゲットとなる指標に関して,その後どのように変化していくかを比較検討したり,加齢に伴う心身の機能の変化の男女差を検討したりするなど,縦断的変化データの群間比較は,多くの分野で重要な研究アプローチとなっている。近年開発された潜在変化得点モデルは,測定時点間の変化量の真値に関し,変化量の個人差を表す因子や当該の変量および同時に分析される他の変量の一時点前の真値からの予測を組み込んだ,表現力に富む有用な統計モデルである。

潜在変化得点モデルはその柔軟性を反映して,群間差の検定における検定力が多くの母数の値に依存するため,検定力分析を実際に行うには大きな困難を伴う。縦断研究ではデータ収集のコストが大きいため,検定力分析に基づくサンプルサイズの決定が特に重要であり,この方法論的困難を克服することが強く望まれる。本研究では,潜在変化得点モデルにおける検定力分析を簡便に実行できる方法を開発することが第一の目的とされた。

潜在変化得点モデルの発展形として,縦断的変化のパターンの異なる潜在的なクラスの数を推定し,対象者を各潜在クラスに分類するとともに,各潜在クラスの変化パターンの特徴を明らかにする潜在変化得点混合モデルが開発されている。このモデルにおいては,潜在クラス数の推定が応用上最も重要な問題の一つであるが,そのための方法に関しては,複数のものが提案され,その性能に関する十分な情報がないまま共存し適用されているのが現状である。本研究では,潜在クラス数を推定するためのこれらの方法を,広範なシミュレーションによって比較検討し,方法選択のために必要な情報を提供することが第二の目的とされた。

論文では,第1章で縦断データ解析法の変遷を概観した後,第2章で潜在変化得点モデルについて詳しく論じ,この後に必要となる平均構造および共分散構造を導出している。

第3章では,第一の目的である検定力分析を取り上げ,ユーザに対して難解な母数値の設定を求めることなく,効果量や信頼性など,取扱いの容易な指標の値を設定するだけで実行可能な方式を開発した。さらに,各指標の検定力への影響度を調べ,影響度の大きい少数の指標のみに絞った近似的な検定力分析法を提案し,利用しやすい数表を作成した。

第4章では,第二の目的である潜在変化得点混合モデルにおける潜在クラス数の推定の問題を取り上げ,シミュレーションの結果,現在最も広く利用されている方法が,条件によっては最適な性能をもたないことを明らかにするなど,多様な条件ごとの各方法の性能に関する詳細かつ有用な比較結果を提供した。

第5章では,高齢者を対象とした大規模な縦断調査データを用いて,実データに見られる分布の偏りなどの条件下で,第3章で提案した検定力分析の頑健性を検討するとともに,第4章で検討した潜在クラス数推定の方法の実データへの適用結果の比較検討が行われた。

本研究は,自身によって在学中に遂行・公刊された数多くの関連研究を基礎としつつ,新たに二つの重要かつ挑戦的な研究課題に取り組み,現実の縦断データの解析に資する有用性の高い研究成果を得たものである。よって,本論文は博士(教育学)の学位を授与するにふさわしい論文であると判断された。

UTokyo Repositoryリンク