学位論文要旨



No 124326
著者(漢字) 奥村,太一
著者(英字)
著者(カナ) オクムラ,タイチ
標題(和) 階層的線形モデルにおけるサンプルサイズ決定のための探索的方法
標題(洋)
報告番号 124326
報告番号 甲24326
学位授与日 2009.03.23
学位種別 課程博士
学位種類 博士(教育学)
学位記番号 博教育第151号
研究科 教育学研究科
専攻 総合教育科学専攻
論文審査委員 主査: 東京大学 教授 南風原,朝和
 東京大学 教授 市川,伸一
 東京大学 准教授 遠藤,利彦
 東京大学 教授 本田,由紀
 東京大学 教授 山本,義春
内容要旨 要旨を表示する

教育心理学をはじめとする人間科学の諸分野における研究で得られるデータは,しばしば階層的な構造をもっている。ここでデータが階層的な構造をもっているとは,学級などの集団単位で標本が抽出された場合や,複数の被験者に対して反復測定を行った場合などを意味する。階層的線形モデルは,こうしたデータを適切に,かつ効率的に分析するために開発された統計モデルである。一般に,これからデータを収集しようとする研究者にとって最初の懸案の一つとなるのがサンプルサイズの決定である。特に,階層的線形モデルによる分析を行うことを予定しているような状況では,何人からなる集団をいくつ集めればよいかといった複雑なサンプリング計画を立てる必要がある。しかしながら,これまでに実際の研究場面において有効に利用することのできるサンプルサイズ決定法は提案されてこなかった。本論文では,予備データの情報を用い,事後予測分布から将来得られるであろうデータを繰り返し発生させ分析するという数値的方法をとることでサンプルサイズの決定を行う方法を新たに提案する。

第1章では,階層的線形モデルについて異なった分野の研究者が様々な論文や著作において独立に発表してきた理論的問題について,一貫した立場からレビューを行った。また,母数の推定法のアルゴリズムなど先行研究において明らかにされていない箇所については新たに導出を行い,研究者が参照できるようにした。

第2章では,階層的線形モデルにおいてサンプルサイズを決定する方法について,先行研究ですでに提案されている検定力分析にもとづく方法に加えて信頼区間幅の期待値にもとづく方法について数学的に導出した。こうした解析的方法は,いずれも母数値が既知であるとして,あるいは母数の点推定値のみを用いてサンプルサイズを決定することを想定している。また,同じ集団に属する個人の心理的属性がどの程度似ているかを示す指標である級内相関係数の値によって検定力や信頼区間幅がどのように変化するのかについてその数理的構造について考察し,その変化を確認するための簡便なプログラムも提供した。

第3章では,第2章で紹介・提案した方法が(1)母数値を既知としており,母数値が未知の場合はその点推定値を母数値とみなして用いるのみでその情報の不確実性を考慮に入れていない,(2)サンプルサイズを決定する基準として固定効果に関する検定力もしくは信頼区間幅の期待値しか扱えない,(3)2群比較など極めて単純なモデルしか扱えない,(4)完全釣り合い型デザインしか扱えないため階層的線形モデルが柔軟なデータ構造をその分析対象としているという長所を生かすことができない,といった理論上・応用上深刻な問題点を多数持っていることを指摘した。さらに,この章では,こうした先行研究の欠点をすべて克服する方法として,事後予測分布を用いた数値的方法にもとづく新たなサンプルサイズ決定法を提案した。具体的には,予備実験や予備調査などを行って事前に得られたデータから事後予測分布をもちいて将来得られるデータを発生させて統計的検定を行ったり信頼区間幅を計算したりすることを繰り返し,予定しているサンプルサイズでデータ収集を行った場合の検定力や信頼区間幅の期待値などを推定するというものである。本方法は,従来の解析的方法に比べて,(1)予備データから得られた母数推定値の不確実性を考慮することができる,(2)固定効果以外の母数に関しても扱え,また信頼区間幅についても期待値以外の基準を扱うことができる,(3)2群比較のような単純なモデルにとどまらず,各レベルのモデルに説明変数を投入した複雑なモデルを扱うことができる,(4)収集するデータのデザインに関して理論上まったく制約がない,という特徴をもっている。これらの特徴は,統計学的に妥当な結果を導くだけでなく,現実のデータ解析の状況により適応した応用範囲の広いものであると考えることができる。また,実際に予備データをどの程度収集しておけば検定力および信頼区間幅を正確に推定することができるのかについて,シミュレーションを行って知見を提供した。

第4章では,第3章で提案した方法を実際の心理学の研究に適用してその有用性を確認した。第4章で扱ったモデルは階層的線形モデルの中でも最も発展的なモデルの一つであり,階層的線形モデルの持つ柔軟なモデリングを存分に発揮し,心理学的に豊かな知見を得ることが期待されるモデルである。しかし,こうした複雑なモデルにおいてサンプルサイズの決定を行うことは,従来の方法では不可能であった。第4章では,このモデルを用いて社会心理学における「控えめ仮説」に関してTIMSS 2003のデータを用いて必要最小限のサンプルサイズで定量的検討を行った。その結果,第3章で提案した方法が有効に働くことが確認されただけでなく,日本人がアメリカ人に比べて心理測定論的に無視できない程度控えめであるという定量的な知見を提供することができた。

第5章では,心理物理学や生理心理学の分野で行われている被験者内反復測定に注目し,測定誤差の影響を除くために通常行われる最小2乗推定(得られた測定値の単純平均の算出)に比べて,統計モデルを設定してベイズ推定を行った方が真値を高い精度で推定できることを示した。さらに,平均的に真値の推定精度を一定以上に保つために必要となる測定デザインを予備データをもとに事後予測分布を用いて決定する方法について提案した。また,予測分布を用いて予備データの不確実性を考慮に入れる場合と無視した場合とでどのように結果が異なるのか比較を行った。その結果,母数の不確実性を考慮に入れた方がより予備データの規模の大小による変化が少なく,また安定してサンプルサイズの決定を行うことができることが明らかになった。

第6章では,第3章及び第5章で提案した方法を研究者がフリーの統計解析環境であるRにおいて実行できるようにプログラム"Samadhi"を開発し,その使用法について詳しく解説を行った。このプログラムはWeb上でソースコードが公開されていることから,従来のサンプルサイズ決定法を実行するために提供されてきたソフトウェアと異なり,アルゴリズムを研究者間で共有することができ,プログラムのバグの修正やさらに効率のよいアルゴリズムの開発などが円滑に行われることが期待できるものである。

第7章では,本論文のまとめと今後の展望を行った。本論文で検討できなかった点として,第1に事後予測分布からのデータ発生を行うために必要となる説明変数行列の用意の仕方が複数あることを指摘し,いずれの方法を用いるかによって若干結果が異なってくることやいずれの方法が統計学的に最も妥当であるかは未確認であることを指摘した。第2に,階層的線形モデルが母数推定法として経験ベイズ法を用いていることから,事後予測分布から発生させるデータセットの規模が小さい場合に,決定されるサンプルサイズがバイアスをこうむる可能性があることについて先行研究の知見を踏まえながら指摘した。第3に,今回提供したプログラムが必ずしも研究者にとって使い勝手の良いものではない可能性があること,適用できるモデルの範囲が限られていることを指摘し,こうした問題について解決すること必要があることを述べた。最後に展望として,本論文で提案した方法がそのアルゴリズムの中に検定力分析と信頼区間にもとづく方法が自然に統合されていることから,現在検定による定性的記述のみに偏りがちな心理学の研究法に対して定量的記述にもとづいた豊かな心理学的知見が見出されるよう,サンプルサイズ決定法からの改革を行える可能性について述べた。

審査要旨 要旨を表示する

教育研究におけるサンプリングでは,最初に学校や自治体を抽出し,次にその中から生徒を抽出するという二段階のサンプリングが行われることが多い。この場合,生徒のデータは学校や自治体ごとにまとまりをもつ階層的な構造をもっている。このようなデータを分析するためのモデルとして階層的線形モデルがある。本研究は,階層的線形モデルを適用する場合のサンプルサイズ決定のための方法を開発することを目的としている。

一般にサンプルサイズの決定は,検定力(有意な結果が得られる確率)が望ましい高さになることを目標にしてなされるが,その手続きには,母集団に関する様々な想定が必要とされる。しかし,特に階層的線形モデルを適用するような複雑なデータ構造の場合,データ収集に先立って母集団に関する想定を行うことは困難である。そこで本研究では,先に予備的なデータ収集を行い,それをもとに,任意のサンプルサイズでデータをとったとした場合の検定力を推定するという探索的な方法を開発した。この方法では,任意のサンプルサイズのもとでの母数の信頼区間幅の期待値を推定することもでき,これによって,検定力と信頼区間幅の両方の基準を満たすようなサンプルサイズの決定が可能となった。

本論文の構成は以下の通りである。まず第1章でその後の方法開発の基礎となる階層的線形モデルにおける母数推定法について詳述している。第2章では,母数値を既知とした場合の検定力をもとにした既存のサンプルサイズ決定法を紹介し,同じ条件のもとで信頼区間幅の期待値をもとにした方法を新たに導出した。また,第一段階の抽出単位(たとえば学校)間の差異の大きさによって検定力や信頼区間幅がどのような影響を受けるかについて数理的に検討した。

第3章が本研究の主要部分であり,予備データに基づいて,検定力,信頼区間幅,またはその双方の基準を用いたサンプルサイズ決定法の提案を行っている。この方法の中核は,予備データからベイズ流の事後予測分布を用いて任意のサンプルサイズで将来得られるであろうデータを繰り返し発生させる部分である。発生させたデータにおいて検定を行えば,そこで有意になる割合から検定力が推定され,そこで求められる信頼区間幅からその期待値が推定されるので,それによってサンプルサイズが十分か否かの判断を行い,サンプルサイズを調整するというのが基本的なアイディアである。

第4章ではこの方法を具体的な心理学研究に適用した例を示し,第5章では,同じく階層構造をもつ被験者内反復測定データに適用できるサンプルサイズ決定法を提案している。第6章では,第3章および第5章で提案した方法を実行するためのプログラムを提供し,最後の第7章でまとめと今後の展望を行っている。

本研究は,階層的線形モデルの適用において,予備データに基づいて検定力と信頼区間幅の両方の基準を満たすようなサンプルサイズの決定法を開発した点にオリジナリティが認められ,開発された方法の有用性も高い。いくつかの解決すべき問題も残されているが,本研究は,統計的方法による教育研究のための重要な貢献をなすものであると考えられる。よって,博士(教育学)の学位を授与するにふさわしい論文であると判断できる。

UTokyo Repositoryリンク