学位論文要旨



No 115779
著者(漢字)
著者(英字) AYE,AYEMYINT
著者(カナ) エイ,エイミン
標題(和) ミャンマーの高校生のための数的推理能力テストと語彙理解能力テストの開発
標題(洋) DEVELOPMENT OF THE NUMERICAL REASONING ABILITY TEST AND THE VOCABULARY COMPREHENSION ABILITY TEST FOR MYANMAR HIGH SCHOOL STUDENTS
報告番号 115779
報告番号 甲15779
学位授与日 2001.03.14
学位種別 課程博士
学位種類 博士(教育学)
学位記番号 博教育第77号
研究科 教育学研究科
専攻
論文審査委員 主査: 東京大学 教授 渡部,洋
 東京大学 教授 苅谷,剛彦
 東京大学 教授 市川,伸一
 東京大学 教授 山本,義春
 東京大学 助教授 南風原,朝和
内容要旨 要旨を表示する

 現在ミャンマーの教育現場では、大学の入学選考などの重要な決定を行う際、学生の学業成績に加え、教科の学力以外の様々な能力、あるいは学内外での活動状況なども広く評価し活用している。しかし、こうした能力評価は教師の主観的判断に基づいて行われており、客観的な評価の枠組みはほとんど確立されていないのが現状である。一方、欧米諸国においては、能力評価を客観的に行うために、標準化された知能検査や学力検査が開発され利用されている。このような標準化されたテストの開発はミャンマーにおいても急務であると考えられる。能力評価の中でも特に重要視されているのは、数的推理能力と語彙理解能力であり、これらは教科学習とも深く関連する。そこで本研究では、ミャンマーの高校生のための数的推理能力テストおよび語彙理解能力テストを開発することを目的とする。

 テスト開発にあたっては、近年、欧米各国において広く研究され、かつ利用されているテスト理論である項目反応理論(Item Response Theory;IRT)を用いることにする。本研究では、IRTモデルのうち、2-パラメタ・ロジスティックモデルに着目し、活用することにする。IRTモデルを活用することの利点は、項目プールを構成てきること、適応型テストを実施できること、項目バイアスを検討できることなとであり、従来のテスト理論にはない多くの利点を有している。

 また、現在ミャンマーでは、高校生に対する統一学力テストは実施されていないため、各学校ごとに実施されている月例教科テストの成績を基準とする能力テストの妥当性の検討を行う。その際、教科の成績が共通のテストで測定されていないことが問題となるが,本研究では、ベイズ統計学的手法であるm集団回帰を応用することによりこの問題に対処する方法を考え、妥当性の検討を行う。

【数的推理能カテストの開発】

1.項目作成:数的推理能力に関する3領域(文章題・数値方程式・数列)について、諸外国で開発されているいくつかの知能検査や適性検査を参考に、自由回答形式の項目を80項目作成した。それらについて10名の高等学校の数学科教師およびヤンゴン教育大学の教官の検討を受け、さらに、5名の高校生にすべての項目を実施し、全体の回答時間、各項目に対する回答速度、テスト後の感想などの情報を収集した。これらの情報をもとに、難易度が高すぎる、冗長であるなどと判断された24項目を削除し、一部の項目内容を修正して、56項目からなる予備テストを作成した。

2.予備テスト:1996年7〜8月に、180名の高校生を対象に予備テストを実施した。得られたデータをもとに、項目正答率の検討,因子分析による1次元性の確認、IRTモデルを適用した項目パラメタの推定なとを行い、いくつかの項目を入れ替えて、45項目からなる本テストを作成した。

3.本テスト:1996年9〜10月に、多段階比例抽出法で抽出した905名の高校生標本を対象に本テストを実施した。得られたデータをもとに、項目分析、因子分析による1次元性の確認、因子負荷が0.35以下の項目の削除を行い、最終的に25項目からなる数的推理能力テスト(Numerica1 Reasoning Ability Test;NRT)を作成した。因子分析の結果をみると第1因子の寄与率は十分大きく、高い1次元性が確認された。また、項目特性曲線に基づいてモデルの適合性を検討したところ、2-パラメタロジスティックモデルはデータによく適合していることが示唆された。テスト情報関数を求めたところ、中程度の能力レベルを中心に広い範囲の能力レベルで十分なテスト情報量が得られることが分かった。

4.信頼性の検討:再テスト信頼性を検討するため、1996年11月に、本テストを実施した905名のうち301名の高校生を対象に、NRTを実施した。再テスト法による信頼性係数の推定値は0.81であり、十分高い信頼性が確認された。また、テスト情報関数に基づいて測定の標準誤差の検討を行ったところ、同様に高い信頼性が確認された。

5.妥当性の検討:構成概念妥当性を検討するため、1996年11月に、再テストを実施していない604名のうち362名の高校生を対象に、Otis-Lennon School Ability Test(OLSAT7)を実施した。OLSAT7の数的推理能力を測定する下位検査とNRTの得点間の相関係数は0.66であり、NRTの数的推理能カテストとしての妥当性が確認された。

【語彙理解能力テストの開発】

1.項目作成:ミャンマー国語辞典、高等学校で用いられる国語の教科書、高校生向けの学習雑誌などを参考に、語彙理解能力を測定するための多枝選択式の項目を245項目作成した。そして、それらについて6名のミャンマー語の研究者や専門家の検討を受け、さらに、5名の高校生にすべての項目を実施し、全体の回答時間、各項目に対する回答速度、テスト後の感想などの情報を収集した。これらの情報をもとに、不適切と判断された語彙などいくつかの語彙を修正して、245項目からなる予備テストを作成した。

2.予備テスト:1998年7〜8月に、240名の高校生を対象に予備テストを実施した。得られたデータをもとに項目正答率などを検討し、また、因子分析による1次元性の確認、IRTモデルの適用による項目パラメタの推定などを行い、不適切と判断された項目を削除して、139項目からなる本テストを作成した。

3.本テスト:1998年8〜9月に、多段階比例抽出法で抽出した1,025名の高校生標本を対象に本テストを実施した。実施に際しては、あて推量による誤差を極力なくすため、正答が分からない場合は無回答とすること、このテストの結果は学校の成績には無関係であることを十分に学生に説明した。得られたデータをもとに因子分析による1次元性の確認、項目パラメタの推定を行い、因子負荷が0.30以下の項目、項目パラメタの推定値が他の項目と重複する冗長な項目を削除し、最終的に52項目からなる語彙理解能力テスト(Myanmar Vocabulary Comprehension Ability Test;MVCT)を作成した。因子分析の結果をみると第1因子の寄与率はきわめて大きく、非常に高い1次元性が確認された。また、項目特性曲線に基づいてモデルの適合性を検討したところ、2-パラメタ・ロジスティックモデルはデータによく適合していることが示唆された。テスト情報関数を求めたところ、中程度の能力レベルを中心に広い範囲の能力レベルで十分なテスト情報量が得られることが分かった。

4.信頼性の検討:再テスト信頼性を検討するため、1999年1月に、本テストを実施した1,025名のうち873名の高校生を対象に、MVCTを実施した。再テスト法による信頼性係数の推定値は0.75であり、高い信頼性が確認された。また、テスト情報関数に基づいて測定の標準誤差の検討を行ったところ、同様に高い信頼性が確認された。

5.妥当性の検討:内容妥当性を検討するため、1999年10月に、ミャンマー語の専門家および高等学校の国語(ミャンマー語)教師24名に、MVCTに関するアンケート調査を実施した。内容は、日常生活におけるその語彙の重要性、高等学校レベルの語彙としての妥当性、選択枝の適切性、内容領域の適切性の4つの観点から各項目を評定し、さらに、テスト全体についても評価してもらうものである。結果は概ね高い評価であり、MVCTの語彙理解能力テストとしての妥当性が確認された。ただし、アンケートの中には有益な意見もいくつか述べられており、今後さらにテストを改良していく必要性も示唆された。

【数的推理能力および語彙理解能力の教科成績との関係についての検討】

 基準となる教科成績が、学校ごとに異なるテストで測定されていることへの対応として、次のような方法を考えた。なお、教科テストとして不適切と判断された月例教科テストの成績は事前に除外した。まず、学校ごとに被験者を適当に2群に分け、各学校の一方の群を用いて、べイズ統計学的手法であるm集団回帰を行い、学校に対応する回帰係数の推定値を求めた。そして、その回帰予測式を用いて、もう一方の群における予測値を求め、もう一方の群の各学校のテスト得点の予測値と実際の教科成績との交差妥当性指標の値を推定した。以上を数十回繰り返し、学校ごとに、交差妥当性指標の推定値の中央値を求め、さらに、その中央値を計算し全体の交差妥当性指標の推定値とした。

 この方法を用いて、数的推理能力と数学および理科の成績との交差妥当性指標、また、語彙理解能力と英語および国語(ミャンマー語)の成績との交差妥当性指標を推定したところ、およそ0.3〜0.5の範囲の値であった。テストに混入するさまざまな誤差の影響を考えると、この値は満足のいく値であると判断された。

【まとめ】

 本研究では、ミャンマーの高校生のための数的推理能力テストおよび語彙理解能力テストの開発を試みた。その結果、十分な信頼性と適度な妥当性をもつ2つの能力テストが作成された。今後,実際の教育の場において、これらのテストが利用され、ミャンマーの高校生の知的能力が適切に評価されることが期待される。

審査要旨 要旨を表示する

 いかなる国家においてもそうであるように、ミャンマーにおいても最も重要な課題の1つが教育環境の改善および教育水準の向上である。しかしながら、とくにミャンマーにおいては、多数の山岳民族等の存在による文化的言語的差異や経済的な地域間民族間格差等々により、状況が極めて複雑であるにもかかわらず、その改善や向上に資するための統一された尺度から得られた客観的な教育評価データが皆無であった。

 本論文の目的はそのようなミャンマーの教育事情を踏まえて、ミャンマーの高校生用に特定のカリキュラムに依存しない2つのテスト、すなわち、数的推理能力テストとミャンマー語の語彙理解能力テストを開発することにある。しかも、それらのテストがテスト理論的観点から要求される水準をも十分満たすものであることが意図されている。

 本論文は、7章より構成されている。第1章は導入であり、研究の目的が述べられている。第2章では過去の研究のレビューが行われており、とくに関心下のテストの開発に用いられた理論である項目反応理論やテストの測定論的性質に関する議論が紹介検討されている。第3章では、予備テストおよび本テスト合わせて1,085名のミャンマーの高校生より得られたデータに基づいた数的推理能カテストの開発と作成されたテストについての測定論的検討が行われている。第4章では、ミャンマー語の専門家等によるテスト項目の吟味を経た後に行われた、1,265名の高校生のデータに基づいたミャンマー語の語彙理解能力テストの開発と吟味が行われている。第3章においてもまた第4章においても、2つのテストの開発に利用された項目反応理論のモデル仮定が満たされるかどうかの吟味は的確に行われており、また両テストの測定論的特性が十分満足のいくものであったことが示されている。第5章では、これら両テストと教科成績との関連が交差妥当性研究の技術を用いて検討されている。とくにここでは、各高校ごとに教科で用いられる試験内容が異なるという困難さを、交換可能性を前提としたベイズ回帰と交差妥当化の技術とを巧妙に組み合わせることによって解決していることが注目される。第6章では、テストの開発に用いられたデータを利用して、地域、学校、性別による能力推定値の差異を分析し、今後の更なる調査の必要性と展望とを論じている。第8章はまとめである。

 以上のように、本論文はミャンマーの高校生の数的理解能力と語彙理解能力とを2つの一次元尺度の上で比較し得るように、2つの非常にすぐれたテストを開発しその客観的特性を明確にしたもので、ミャンマーの今後の教育改善に大きな寄与をなすものと評価された。よって本論文は博士(教育学)の学位論文として十分優れたものと認められた。

UTokyo Repositoryリンク