内容要旨 | | 論文テストなどでは,評定の厳しさや評定値の散らばりなど評定者の個人差がある中で被験者の能力を推定しなければならない。本研究では,それらを推定するために基本モデルxij=j+ji+eijを用いる。ここで,xijは被験者i(i=1,2,...,n)のテストj(j=1,2,...,p)における得点,iは被験者iの能力パラメタ,j,jはテストjの困難度及び識別力,eijは誤差を表す。(論文テストの評定の場合は,各評定者が各テストに対応する。)ここで,eijは互いに独立に,同じp変量正規分布に従うものと仮定する。すなわち,eiNp(0,)である。ここで,誤差の分散共分散行列は正則行列とし,対角行列に限定しない。また,iとeijとは互いに独立であるとする。 本研究の主要課題はベイズ理論に基づいて,このモデルに含まれるパラメタの周辺事後分布を求めることである。 第1章では,種々のテスト理論モデル,及び因子分析モデル,共分散構造分析モデルなどについて,本研究とのかかわりを中心にその特徴,応用上の制限などを要約的に紹介した。次に,本研究で用いるベイズ理論によるパラメタ推定と標本理論によるパラメタ推定の方法論的な比較を行った。 第2章では,ベイズ推論における基本的概念について述べた。そして,テスト理論モデル及び関連モデルに関する従来のベイズ流アプローチのうち本研究に関係の深いものについて議論した。 第3章では,まず基本モデルから全パラメタの同時事後分布を導出した。このとき,iの事前分布としては,互いに独立な標準正規分布を用い,,,についてはいずれも参照事前分布 を用いた。ただし,=(1,2,...,p)’,=(1,2,...,p)’である。また,は比例を意味する。 次に,この同時事後分布から,とを積分消去して,との同時事後分布を導出した。すなわち, である。ただし,は被験者全体の能力パラメタのベクトル(1,2,...,n)を表し,V=(X-1nX)’(X-1nX)は標本における偏差積和行列であり,=(+’)は母集団分散共分散行列である。 ここで,とに関する条件によって基本モデルを表1のように6つの下位モデルに分類し,以後の解析をこの分類に準拠して行うこととした。 表1 種々のテストモデルの分類 第4章では,表1のモデル(e)における誤差の分散共分散行列の周辺事後分布 を導出した。 同様に,モデル(f)におけるの周辺事後分布 を導出した。ここで,は’-1の唯一の固有値であり,b11はV’(ただし’=-1)の第1行第1列の要素である。特に,が対角行列(モデル(d))の場合はb11=1111となる。ただし,11は-1の第1行第1列の要素で,11はVの第1行第1列の要素である。 次に,被験者の能力パラメタについては,,,の事前分布として参照事前分布を用いた場合の周辺事後分布と,一般化自然共役事前分布を用いた場合の周辺事後分布を導出し,その結果を比較した。 テストの困難度パラメタの場合には,直接積分することができないので,近似的方法によっての周辺事後分布 を得た。ただし,*はの唯一の固有値である。また,は近似的比例を意味する。 なお,テストの識別力パラメタについては,単独の周辺事後分布を得ることができなかった。従って,現段階ではに関する推定には,他のパラメタとの同時事後分布を用いなければならない。 第5章では,単一のパラメタの周辺事後分布を数値的に推定する方法としてマルコフ連鎖モンテカルロ法の1つであるGibbs samplerのアルゴリズムを紹介した。第4章で求められた各パラメタの周辺事後分布はいずれも同種のパラメタの同時分布であるが,実際の応用にあたっては,例えば,特定の被験者の能力iなど単一のパラメタの周辺事後分布が必要となる。そのためには,同時周辺事後分布の密度関数p(|X)=p(1,2,...,n|X)を1,...,i-1,i+1,...,nに関して多重積分する必要があるが,このような方法によって厳密な密度関数を求めることは現段階では困難である。Gibbs sampler法はこうした状況で,しばしば適用される方法である。まず,Gibbs sampler法における収束原理についてこれまでに発表されてきた理論的諸研究を吟味した。また,Gibbs sampler法のためのプログラムの確認と収束状況の観測のために,個々の変数の厳密な分布が明白である例を用いて実際に計算を試み,この方法によって分布を極めて正確に求めることができることを示した。 第6章では,実際のデータにおいて単一のパラメタの周辺事後分布を推定する数値例を報告した。第一の数値例は,語彙テストのデータにモデル(c)(本質的タウ等価テスト)をあてはめ,誤差の分散共分散行列を推定したものである。この場合には,推定すべきパラメタの個数も少なく,比較的短時間で収束がみられた。第二の数値例は,論文テストのデータに最も一般的なモデルであるモデル(f)をあてはめ,各被験者の能力パラメタiの周辺事後分布を推定したものである。推定されたiの周辺事後分布は互いにかなりよく分離し,能力の個人差をよく表していた。 これらの数値例においては,(1)推定された事後分布の平均は,推定に用いられた初期値と相関しないこと,(2)1つの初期値から始められた繰り返し計算の過程を分割して得られた各パラメタの事後平均の値は,周期性や増加(あるいは減少)の傾向を示さないこと,(3)異なる初期値を用いた繰り返し計算過程の反復によって得られる各パラメタの事後平均はそれぞれよく一致していること,などが観察された。 最後に第7章では,本論文のまとめとともに今後の課題について述べた。 |