学位論文要旨



No 111463
著者(漢字) 曹,亦薇
著者(英字)
著者(カナ) ソウ,エキビ
標題(和) 線形テスト理論モデルのベイズ解析
標題(洋)
報告番号 111463
報告番号 甲11463
学位授与日 1995.07.05
学位種別 課程博士
学位種類 博士(教育学)
学位記番号 博教育第45号
研究科 教育学研究科
専攻
論文審査委員 主査: 東京大学 教授 渡部,洋
 東京大学 教授 藤田,英典
 東京大学 助教授 市川,伸一
 東京大学 助教授 南風原,朝和
 東京大学 講師 山本,義春
 大学入試センター 助教授 前川,眞一
内容要旨

 論文テストなどでは,評定の厳しさや評定値の散らばりなど評定者の個人差がある中で被験者の能力を推定しなければならない。本研究では,それらを推定するために基本モデルxijj+ji+eijを用いる。ここで,xijは被験者i(i=1,2,...,n)のテストj(j=1,2,...,p)における得点,iは被験者iの能力パラメタ,j,jはテストjの困難度及び識別力,eijは誤差を表す。(論文テストの評定の場合は,各評定者が各テストに対応する。)ここで,eijは互いに独立に,同じp変量正規分布に従うものと仮定する。すなわち,eiNp(0,)である。ここで,誤差の分散共分散行列は正則行列とし,対角行列に限定しない。また,iとeijとは互いに独立であるとする。

 本研究の主要課題はベイズ理論に基づいて,このモデルに含まれるパラメタの周辺事後分布を求めることである。

 第1章では,種々のテスト理論モデル,及び因子分析モデル,共分散構造分析モデルなどについて,本研究とのかかわりを中心にその特徴,応用上の制限などを要約的に紹介した。次に,本研究で用いるベイズ理論によるパラメタ推定と標本理論によるパラメタ推定の方法論的な比較を行った。

 第2章では,ベイズ推論における基本的概念について述べた。そして,テスト理論モデル及び関連モデルに関する従来のベイズ流アプローチのうち本研究に関係の深いものについて議論した。

 第3章では,まず基本モデルから全パラメタの同時事後分布を導出した。このとき,iの事前分布としては,互いに独立な標準正規分布を用い,,,についてはいずれも参照事前分布

 

 を用いた。ただし,=(1,2,...,p)’,=(1,2,...,p)’である。また,は比例を意味する。

 次に,この同時事後分布から,を積分消去して,の同時事後分布を導出した。すなわち,

 

 である。ただし,は被験者全体の能力パラメタのベクトル(1,2,...,n)を表し,V=(X-1nX)’(X-1nX)は標本における偏差積和行列であり,=(+’)は母集団分散共分散行列である。

 ここで,に関する条件によって基本モデルを表1のように6つの下位モデルに分類し,以後の解析をこの分類に準拠して行うこととした。

表1 種々のテストモデルの分類

 第4章では,表1のモデル(e)における誤差の分散共分散行列の周辺事後分布

 

 を導出した。

 同様に,モデル(f)におけるの周辺事後分布

 

 を導出した。ここで,-1の唯一の固有値であり,b11V’(ただし-1)の第1行第1列の要素である。特に,が対角行列(モデル(d))の場合はb111111となる。ただし,11-1の第1行第1列の要素で,11はVの第1行第1列の要素である。

 次に,被験者の能力パラメタについては,,,の事前分布として参照事前分布を用いた場合の周辺事後分布と,一般化自然共役事前分布を用いた場合の周辺事後分布を導出し,その結果を比較した。

 テストの困難度パラメタの場合には,直接積分することができないので,近似的方法によっての周辺事後分布

 

 を得た。ただし,*の唯一の固有値である。また,は近似的比例を意味する。

 なお,テストの識別力パラメタについては,単独の周辺事後分布を得ることができなかった。従って,現段階ではに関する推定には,他のパラメタとの同時事後分布を用いなければならない。

 第5章では,単一のパラメタの周辺事後分布を数値的に推定する方法としてマルコフ連鎖モンテカルロ法の1つであるGibbs samplerのアルゴリズムを紹介した。第4章で求められた各パラメタの周辺事後分布はいずれも同種のパラメタの同時分布であるが,実際の応用にあたっては,例えば,特定の被験者の能力iなど単一のパラメタの周辺事後分布が必要となる。そのためには,同時周辺事後分布の密度関数p(|X)=p(1,2,...,n|X)を1,...,i-1,i+1,...,nに関して多重積分する必要があるが,このような方法によって厳密な密度関数を求めることは現段階では困難である。Gibbs sampler法はこうした状況で,しばしば適用される方法である。まず,Gibbs sampler法における収束原理についてこれまでに発表されてきた理論的諸研究を吟味した。また,Gibbs sampler法のためのプログラムの確認と収束状況の観測のために,個々の変数の厳密な分布が明白である例を用いて実際に計算を試み,この方法によって分布を極めて正確に求めることができることを示した。

 第6章では,実際のデータにおいて単一のパラメタの周辺事後分布を推定する数値例を報告した。第一の数値例は,語彙テストのデータにモデル(c)(本質的タウ等価テスト)をあてはめ,誤差の分散共分散行列を推定したものである。この場合には,推定すべきパラメタの個数も少なく,比較的短時間で収束がみられた。第二の数値例は,論文テストのデータに最も一般的なモデルであるモデル(f)をあてはめ,各被験者の能力パラメタiの周辺事後分布を推定したものである。推定されたiの周辺事後分布は互いにかなりよく分離し,能力の個人差をよく表していた。

 これらの数値例においては,(1)推定された事後分布の平均は,推定に用いられた初期値と相関しないこと,(2)1つの初期値から始められた繰り返し計算の過程を分割して得られた各パラメタの事後平均の値は,周期性や増加(あるいは減少)の傾向を示さないこと,(3)異なる初期値を用いた繰り返し計算過程の反復によって得られる各パラメタの事後平均はそれぞれよく一致していること,などが観察された。

 最後に第7章では,本論文のまとめとともに今後の課題について述べた。

審査要旨

 本論文は、論文テストのデータの解析をその視野においた上で、1次元潜在特性を用いた測定論的モデルを提示し、そのモデルのもとで受験者の能力や論文テストの評定者の特性についての統計的推測を行おうとしたものである。

 本論文で提示されているモデルは、従来の古典的テスト理論モデルを推測統計学的に取り扱おうとし、かつ、同時にベイズ流線形モデルの活用を考えるならば、自然に到達するであろう測定論的モデルであるということができるが、このモデルのもとでの解は本論文によって初めて示されたものであり、そこで得られた結果はこの分野における理論的研究の発展のために極めて有益な示唆を与えるものである。

 本論文で用いられているモデルは、論文テスト以外の場合にも利用し得るものであり、本論文の数値例の中にも客観式テストの例が含まれている。しかしながら、このモデルの一つの重要な実際的意味は、大学入学試験等における論文テストの答案を評定者が評定することによって得られるデータを分析するのに役立つということにある。論文テストのデータを分析するための推測統計学的な方法については、これまでも数多くの提案がなされてきたが、それらは多くの場合既存の推測統計学的な技術の応用にすぎず、本論文のようにそのためのモデルを提示し、そのモデルのもとで受験者の能力を推定したり評定者の特性を個人ごとにパラメータを用いて明らかにするといった研究は、その例を見ることが極めて少ない。その理由の一つとして、確率論的な推論を行うために必要な分布が数学的困難さのために求めることができないことがあげられるが、本論文ではその一部については近似的なものであるにせよ数学的な解を得ている。また、数学的な近似解が得られない部分については、Gibbs samplerとよばれる最新の数値解析的方法を用いることによって必要な分布を算出しているが、極めて多数の未知母数がある場合についてのこのような結果は、Gibbs samplerについての学術的評価に関しても一つの新しい知見を示すものである。

 以上のように、本論文の意義はテスト理論上に一つの学術的な貢献をなしたことにあり、このことをもって、本論文は博士(教育学)の学位論文として十分優れたものであると判断された。

UTokyo Repositoryリンク