内容要旨 | | 1はじめに1.1背景と目的 科学一般において、「測定」にはある程度の信頼性(再現性)が必須である。すなわち、測るたびに得られる値が全く異なるとき、その行為はもはや測定ではない。しかし、完全な信頼性の達成は現実には不可能であり、それを要求することは実際的ではない。したがって、測定者は不完全とわかっている評価尺度を用いなくてはならない。実際の問題は評価尺度が不完全であることではなく、その「不完全さの程度」(=良さの程度)である。 評価尺度の信頼性評価の重要性はさまざまな所で強調され、信頼性研究の方法論については、既にさまざまな議論が行われてきた。しかし、統計的な議論のほとんどは指標の計算方法やその解釈など、データが得られた後の方法論に終始しており、サンプルサイズの設定方法など、研究のデザイン(計画)に関する方法論はほとんど手つかずの状態である。そこで、本論文ではサンプルサイズ設定に対する検出力計算の考え方を拡張し、連続尺度の信頼性研究のデザインパラメータ(対象者数・評価者数・くり返し数)決定の統計的な支援方法について考える。本論文の目的は次の3点である。 1.連続的な評価尺度に対する統計モデル、信頼性の指標、信頼性研究のデザインの整理 2.デザイン決定の支援方法として級内相関係数の信頼区間に基づく方法の提示 3.その方法を適用するために有用な、検出力等高線を描くためのプログラムを与えること 1.2統計モデルと信頼性の指標 評価の際に起こる誤差として、本論文では測定誤差と評価者の違いによる誤差を考える。論文中には3つの統計モデルについて記述したが、ここでは評価者効果が存在し、評価者母集団を想定するモデルについてのみ示す。 評価者効果が存在し、評価者母集団を想定する場合、次のようなモデルが適用できる。 ここで、i=1,2,…,Iは対象者、j=1,2,…,Jは評価者、k=1,2,…,Kはくり返し、Yijkは対象者iに対する評価者jによるk回目の評価、は全平均、aiは対象者iの効果、bjは評価者jの効果、eijkは測定誤差、〜N(0,2)i.i.d.は平均0、分散2の正規分布に独立に従う確率変数であることを表す。対象者効果と測定値の分散の比として級内相関係数(Intraclass Correlation Coefficient,ICC)が以下のように定義される。 ICCは連続的な評価尺度の信頼性の指標として標準的に用いられている。誤差の分散(,)が小さくなるとICCは最大値の1に近づき、逆に誤差分散が大きくなると最小値の0に近づく。 1.3信頼性研究のデザイン 誤差として測定誤差と評価者間誤差を考えるとき、信頼研究のデザインは表1のように表現できる。 表1:信頼性研究のデザイン このとき、決定すべきデザインパラメータは対象者数I、評価者数J、繰り返し数Kである。以下で、それらの決定に対する統計的な支援方法を提案する。 2デザイン決定の支援方法 信頼性研究の目的を「ICCの推定」とすると、よいデザインとは精度よくICCの推定ができるデザインである。さらに厳密に、信頼性研究の目的を「真のICCがある値(ICC0)以上であることを示すこと」とすると、以下のように必要な(I,J,K)の条件を導くことができる。 表1のようなデータに対する分散分析表は表2のようになる。ICCに対する近似的な片側100(1-)%信頼区間が利用可能である。 ここで、 は自由度(1,2)のF分布の上側100%点を表す。 統計的に「ICC>ICC0」を保証するには、「>ICC0」を示せばよい。そこで、ある確率以上で「>ICC0」となるような(I,J,K)の組の条件を考える。検定論のアナロジーでPr(>ICC0)を検出力と呼ぶことにする。の分布は(I,J,K)の他に、真のICC、誤差分散の比(/)、信頼性係数100(1-)%によって決まるので、Power=Pr(>ICCO)はそれらとICC0の関数である。そこで、(I,J,K)以外のパラメータを与えたもとで検出力がある値(例えば、0.8)以上になるような(I,J,K)の組を求めればよい。 表2:分散分析表 条件を満たす(I,J,K)を表現するために検出力等高線(Power Contour)を用いる。対象者数Iと繰り返し数K以外のパラメータを固定し、検出力をIとKの関数と考え、等しい検出力を与える(I,K)を曲線でつないだものが検出力等高線である。ただし、各(I,K)における検出力は以下のような関係を利用したシミュレーションによって評価した。 ただし、は自由度のカイ二乗分布に従う確率変数であることを示す。各(I,K)における検出力を推定し、その値をもとに検出力等高線を描く。等高線を描くために統計パッケージソフトSASのProc GCONTOURを用いた。 3結果 図1に検出力等高線の例を示す。ICC=0.8,/=1,=0.05,ICC0=0.4,評価者数J=5の条件で、検出力が0.8を達成するためには(対象者数,くり返し数)=(13,1),(11,2)、検出力0.9を達成するためには(28,1),(24,2)が必要であることが分かる。 図1:検出力等高線の例ICC=0.8,/=1,=0.05,ICCO=0.4,評価者数J=54まとめと考察 本論文では、誤差として測定誤差と評価者間誤差を考えた場合の統計モデル、信頼性の指標、研究デザインを整理し、級内相関係数の区間推定に基づくデザイン決定の支援方法および実行プログラムを示した。 本論文は、医学領域における一般的な状況を想定して議論を展開しているため、提案した方法は連続的な評価尺度の信頼性研究のほとんど全ての場合に適用可能であると考えられる。また、実際適用する際の手順、注意点につていは本文中で考察した。 |
審査要旨 | | 本研究は連続的な評価尺度の信頼性の評価を適切に行うために、統計学的な観点から、信頼性研究の計画段階において必要となるデザインパラメータの決定支援を行う方法論を提案した。要点は下記の通りである。 1.評価の際に発生する誤差として評価者間誤差と測定誤差を想定し、連続的な評価尺度の信頼性の統計モデルとして、評価者効果を考えないモデル(モデル1)、有限の評価者を想定するモデル(モデル2)、評価者母集団を想定するモデル(モデル3)の3つのモデルを提示し、考え方の枠組みを示した。また、それぞれのモデルに対して、信頼性研究のデザイン(完備デザイン、不完備デザイン)と信頼性の指標(級内相関係数)について整理した。 2.級内相関係数の区間推定に基づいて検出力等高線を描くことによって、デザインパラメータの決定支援方法を示した。モデル1に対する方法は、以前にDonner and Eliasziw(1987)が提案した検定に基づく方法に帰着する。モデル2およびモデル3に対するデザインパラメータの決定支援方法はKazempour and Graybill(1993)などの級内相関係数の信頼区間の構成方法を応用したものであり、特にモデル3に対する方法はコンピュータの乱数発生機能を用いたモンテカルロシミュレーションを利用している。モデル2、3に対しては先行研究は存在しない。 3.提案した方法を容易に実行するために統計プログラムパッケージソフトSASを用いたプログラムを作成した。その結果、市販のパーソナルコンピュータを用いた場合、モデル1、2の場合には1分以内に、モンテカルロシミュレーションを利用したモデル3の場合にさえ20分以内に検出力等高線を描くことができる。 4.提案した方法の位置づけと意義、および、実際の場で提案した方法を用いる場合に採るべき手順について考察した。提案した方法は、医学で用いられる連続尺度の信頼性研究のほとんど全ての場合について適用可能であると考えられる。 以上、本論文は連続的な評価尺度の信頼性研究におけるデザインパラメータの決定支援方法を提案した。本研究はこれまで扱われてこなかった信頼性研究のデザインパラメータの統計的な決定支援方法を提供し、今後の信頼性研究に重要な貢献をなすと考えられ、学位の授与に値するものと考えられる。 |