No | 125519 | |
著者(漢字) | 宮,慧 | |
著者(英字) | ||
著者(カナ) | ミヤザキ,ケイ | |
標題(和) | 項目反応理論における、非等質母集団のための新たなパラメータ推定法 | |
標題(洋) | New parameter estimation procedure for heterogeneous population in Item Response Model | |
報告番号 | 125519 | |
報告番号 | 甲25519 | |
学位授与日 | 2010.03.24 | |
学位種別 | 課程博士 | |
学位種類 | 博士(学術) | |
学位記番号 | 博総合第968号 | |
研究科 | 総合文化研究科 | |
専攻 | 広域科学専攻 | |
論文審査委員 | ||
内容要旨 | 本博士論文の主旨は,近年新しいテスト理論として注目を集めている項目反応理論(item response theory, IRT)について,非等質母集団のための新たな母数推定法を提案することである. IRTは心理テストを作成・実施・評価・運用するための実践的な数理モデルであり,既存のテスト理論には無い特長を幾つか持つ.例えば,複数の異なるテスト間の結果を容易に比較し,また項目レベルで受験者能力値測定の精度を確認する,受験者ごとに最適な問題を瞬時に選び,その場で出題するといったことが可能になる(豊田,2003). 現在では多様化しているテスト実施場面に対応するために,IRTに関する様々な拡張モデルが提案されている.例えば項目群が1次元以上の潜在特性を測定している可能性を考慮した多次元IRTモデル(multidimensional IRT, Rechase & Mackinly, 1983; Reckase, 1985; Fraser & McDonald, 1986),受験者が複数の母集団からサンプリングされている状況を想定した多母集団モデル(Bock & Zimowski, 1997),パラメトリックIRTの当てはまりが悪いときに,項目母数を仮定せず,能力パラメータを和得点などで置き換えるnonparametric IRTモデル(NIRT, Mokken, 1971)などがある. 項目反応理論の効果的な運用において重要な事項は, (1) 等化法,及び (2) 項目特性曲線(ICC:Item Characteristic Curve)の2つである.等化とはそれぞれ異なるテストデータから得られた項目パラメータ値を同一尺度上に並べる統計操作のことである.等化により,テストを実施する前に困難度・識別力などの項目特性が既に判明している項目群,即ち「項目プール」を充実させることができる.項目プールが豊富であるほど,受検者の特性を高い精度で調べるテストを構成することが可能である.そのため,等化は項目反応理論を運用する上で最も重要な統計操作の1つであると言ってよい. 項目特性曲線とは,横軸にそのテストで測ろうとしている能力特性を,縦軸に正答確率を配して描く曲線のことであり,項目の特性 (困難度や識別力) は,この項目特性曲線に全て反映される.従ってICCは作成したテストの性質・性能を評価する際の重要な指標となる.またICCの形状を変えることにより,様々な状況に対応したモデルを構成できる. さて,心理学を含め行動科学全般においては,観察研究によりデータを得て解析する場面がしばしば存在する.その場合,実験的操作が不可能な状況の下でデータを収集するために,母集団の等質性が保証されないことが多い.項目反応理論を用いる場合においても,非等質母集団から得られたデータを解析せねばならない場面にしばしば遭遇し,その際に先述の等化と項目特性曲線についてそれぞれ問題が浮上する. 等化においては,最も標準的な等化計画として共通項目デザインというものがある.これはテスト実施者がいくつかの共通項目を含んだテストを用意し,各受験者はランダムにそれぞれのテスト形式に振り分けられるというものである(Hanson & Beguin, 2002; Kim & Cohen, 2002).ところが調査観察研究の状況において共通項目デザインを考えると,母集団が非等質となる原因に,受験者がテスト形式を選択する行動が存在してしまう.実データ解析を例にして説明すると,アメリカにおけるAP (Advanced Placement) Examinationでは同じ能力を測っていると考えられる小論文の題目を受検者が自由選択できるようになっている.他に日本におけるビジネス日本語能力試験などでは,受検する地域によって受けるテスト形式が異なる.日本在住の受検者の方が日本語学習に対する動機付けが高いことを考えると,受検者がテスト形式へ無作為に割り当てられているとは考えにくい.そのような場面に対して,既存の等化法ではテスト形式選択行動を無視するものであり,そのまま適用するとバイアスを含んだ推定値が得られてしまう. そこで,受験者が受けるテストを自由選択できる際のモデルを構築し,実データとしてビジネス日本語能力試験の回答パターンデータに本手法を適用,モデル選択を行ったところ,既存の方法より開発手法がより正確に項目特性を測定できることが示された(Miyazaki et al., 2009).本研究により,心理テスト作成場面において受験者の正確な能力推定のために誤った項目を選択する可能性を軽減することに成功した. 次に項目特性曲線について,母集団が非等質である場合の問題を述べる.既述の通り,IRTにおいて項目の特性は項目特性曲線で表される.母集団の等質性が保証されない状況では様々な形状のICCが考えられるが,通常のロジスティックモデルでは表現できるICCの形状が限られるため,仮定されたモデルがデータに合致しない可能性がある.対処法として項目の特性や受験者の能力値をパラメータ化しない,項目分析を精緻化したNonparametric IRT (NIRT)がしばしば適用される.しかし項目反応理論を用いる場面では受験者の回答データから項目の特性と被験者の特性を求めることに関心がある場合が多く,そもそもモデル中に項目パラメータや能力パラメータを設定しないNIRTは,本来の研究関心に合致しない(Mokken, 1971; Junker & Sijtsma, 2001). そこで本研究では母集団の非等質性を部分的に表現可能にする混合モデリングと,さらに混合要素数の上限設定を解除できる方法である有限ディリクレ過程事前分布(Ishwaran & Zarepour, 2000; Ishwaran & James, 2001)という一種のセミパラメトリック法を項目反応モデルに導入することで,ロジスティックモデルで表現しきれない,能力値と正答率間の複雑な関係を,複数の項目特性曲線を混合することにより表現可能にし,母集団の異質性をモデル化でき,能力パラメータをモデル内に導入し,推定する方法を開発した(Miyazaki & Hoshino, 2009). 以上,本論文ではIRTにおける代表的な事項である等化と項目特性曲線において生じる問題とその解決法を提示した.そしてどちらの研究も根本的には,実験的統制が不可能な状況(調査・観察状況)において異質な母集団から得られたデータを解析するための手法という意味において共通している. 今後の研究の方向性は,そもそも心理データの解析において,非等質な母集団がなぜ発生するかを考えることで明らかになる.研究デザインを組み立てる際に重要なのは,独立変数の各水準にサンプルを無作為に割り当てることであるが,心理学を含め行動科学では,無作為割り当てを行わない研究,つまり観察研究が行われることが多い.しかし先述のように無作為割当などの実験的操作を取らない場合,データの内容に偏りが生じてしまう可能性があるため,従来の解析法をそのまま適用すると誤った結論を導き出してしまう場合がある(Hill et al., 2002; Condron, 2008).観察研究においては母集団の非等質性は不可避であるため,それに対応できるパラメータ推定法の開発は必須であり,事実ここ数十年間で着実に調査観察データの解析法の開発が進んでいる.星野 (2009) は観察研究において使用できる解析法として「共変量の利用」「セミパラメトリック推定」「欠測データモデリング」の三つを挙げている.「共変量の利用」とは従属変数と説明変数の双方に関係する背景情報を積極的に利用することで関心のあるパラメータの推定精度を高める方法である.「セミパラメトリック推定」とはモデル仮定をなるべく置かずに関心のある変量を推定する方法である.「欠測データモデリング」とは調査観察研究においてデータが偏りうる状況を,データ欠測の状況に読み替えることで,仮定すべきモデルを統一的に表現する枠組みのことをいう. 本研究は,上述の方法のうち「欠測データモデリング」と「セミパラメトリック推定」をそれぞれIRTにおける等化法と項目特性曲線に適用したものに当たる.等化法では実際には受けていないテスト形式を欠測データと見なすことでテスト形式選択行動をモデル化し,項目特性曲線においてはセミパラメトリック法の一種であるディリクレ過程を用いて関心のあるパラメータを推定する方法を提案した. 上述の調査観察データへの適用法を概観することで,今後の研究の展望が明らかとなる.例えば等化においてはテスト形式選択行動を説明する共変量(例えば別のテストの得点や知能テスト得点など)をモデル内に組み込めば欠損データを無視可能と見なせるかもしれない.また現実には,複数の受検者集団間に相関構造を仮定する方が自然な場合が多く,従来の推定法では相関構造を誤ってモデル化した場合にロバストでなく,実際のテストデータ解析場面において,能力測定に不適切な項目を選択しかねない.この問題に対し,分布形を仮定しないセミパラメトリック法の一種であるM推定法 (Huber, 1964) を用いることにより,モデルの誤設定に対しロバストな,バイアスを最小限に抑えることのできる推定法を開発できる.あるいはディリクレ過程についても,これを誤差変数に適用し,能力パラメータだけでなく項目パラメータを関心母数と見なし推定する方法も考えられる. 図1.共通項目等化デザイン | |
審査要旨 | 本博士論文では,近年新しいテスト理論として注目を集めている項目反応理論(item response theory, IRT)について,非等質母集団のための新たな母数推定法を提案した。 項目反応理論は心理テストを効果的に作成,運用するための実践的な数理モデルであり,内容の異なるテストであっても結果を容易に比較できる,項目別に受験者の能力測定の精度を測ることができる,各受験者の能力を測るために最適な問題をその場で選択し,出題できるなどの特長を持つ。 項目反応理論における主要なテーマは, (1) 等化法,及び (2) 項目特性曲線(ICC:Item Characteristic Curve)の2つである。本論文ではこれら2つの事項について,データが非等質な母集団から得られる際に発生する問題を解決している。 本論文は6章から構成される。第1章では非等質な母集団から得られたテストデータを解析する際の問題点,その解決法,並びに今後の研究の展開を概説し,第2章では項目反応理論,特に等化法,項目特性曲線の導入・説明を行っている。第3章では非等質母集団から得られたテストデータに対し項目反応理論を適用する際,特に等化法と項目特性曲線による表現において生じる問題を詳述し,かつ既存の方法の限界について述べている。第4章では第3章において述べられた問題を解決するための基礎的な統計概念・表記法・パラメータ推定法の導入・説明に割かれる。第5章では前章で紹介された手法を用いて,等化と項目特性曲線に対し,非等質母集団からデータが得られた際の問題の解決法を提案,シミュレーション研究,及び実データ解析を示し,提案手法の有用性を実証している。第6章では調査観察研究において有用なデータ解析法を俯瞰し,その中における本研究の位置づけ,及び今後の研究の展開が記述される。 等化とは複数の異なるテストデータから得られた項目パラメータ値の尺度を統一するための統計操作のことである。テスト実施前にその特性が既に推定されている項目群は項目プールと呼ばれ,等化により,この項目プールの拡充が達成される。項目プールが豊富であるほど,様々な受検者の特性に対応したテストを構成することが可能である。等化デザインは複数存在し,その中でも共通項目デザインが代表的である。本論文では共通項目デザインにおいて非等質な母集団からデータが得られる際に,受験者のテスト形式選択行動が存在することを指摘し,その際に既存の等化法を適用すると,バイアスを含んだ推定値が得られることを,シミュレーション研究,および実データ解析にて実証している。またその上でテストの自由選択行動をモデル化し,推定パラメータのバイアス補正に成功している。これはつまり,心理テスト作成場面において受験者の正確な能力推定のために誤った項目を選択する可能性を軽減することを意味する。 項目特性曲線とは,受検者の能力特性と正答確率との関数関係をグラフ表現したものであり,項目特性曲線の形状を観察することで,各項目の特性 (困難度や識別力) を確認できる。非等質母集団から得られたデータを解析する場合,様々な形状の項目特性曲線が考えられるが,通常のロジスティックモデルは一定の形状の項目特性曲線しか表現できず,そのためモデルがデータに合致しない可能性がある。このような場合に用いられるノンパラメトリックIRTは項目・能力パラメータを直接推定できないため,本来の研究関心とは外れるという問題があった。本研究では任意の形状の分布を複数の既知の分布を混合し表現可能にする有限ディリクレ過程事前分布というセミパラメトリック推定法を項目反応モデルに導入することで,既存のモデルで表現しきれない複雑な形状の項目特性曲線を表現可能にし,非等質母集団をモデル化し,また能力パラメータをモデル内に導入,推定する方法を開発した。 以上,本論文ではIRTにおける代表的な事項である等化と項目特性曲線において生じる問題とその解決法を提案している。総合考察では,現在観察研究におけるデータ解析法として知られる「共変量の利用」「セミパラメトリック推定」「欠測データモデリング」の3手法の中で,提案手法の位置づけが記述される。本論文は,上述の方法のうち「欠測データモデリング」と「セミパラメトリック推定」をそれぞれIRTにおける等化法と項目特性曲線に適用したものに当たり,今後の研究の方向性はこれら諸方法の,等化と項目特性曲線への応用を考えることで明らかとなるだろう。 以上要約した本博士論文において,特に次の諸点が高く評価された。 1) 心理テストデータ解析において使用頻度の高い項目反応理論について,高度な統計技術を要する不完全データ解析法を行い,実際のテスト運用上重要である等化法におけるパラメータ推定のバイアス低減法を提案していること 2) 項目特性曲線において用いられたディリクレ過程事前分布は母集団の非等質性の表現に有用な方法であるが,計算機性能の向上に伴い最近に応用可能となった手法であり,その意味で最新の統計手法の動向をとらえ,行動科学研究に有用かつ新たな解析法を提案していること 3) 本研究を通して,未だ解決されていなかった高度な数理統計的問題を解決し,既存の方法に優る新手法を開発していること これらの成果により,本論文は博士(学術)の学位に値するものであると審査員全員が判定した。なお上記(1)等化法と(2)項目特性曲線に関する研究はともにPsychometrika誌上に公表済みである。 | |
UTokyo Repositoryリンク |