学位論文要旨



No 126051
著者(漢字) 田栗,正隆
著者(英字)
著者(カナ) タグリ,マサタカ
標題(和) 構造ネスト平均モデルの因果パラメータに対する疑似尤度法に基づく推測
標題(洋)
報告番号 126051
報告番号 甲26051
学位授与日 2010.03.24
学位種別 課程博士
学位種類 博士(保健学)
学位記番号 博医第3530号
研究科 医学系研究科
専攻 健康科学・看護学専攻
論文審査委員 主査: 東京大学 教授 大江,和彦
 東京大学 准教授 李,延秀
 東京大学 教授 小山,博史
 東京大学 准教授 山本,隆一
 東京大学 准教授 福田,敬
内容要旨 要旨を表示する

1 背景と目的

ランダム割り付け比較試験は人間に対して倫理的に許される範囲で実施される科学的な実験であり、治療の科学的効果を知るために最も重要な研究デザインである。しかし、全ての対象者が最初に割り付けられた治療を追跡が終了するまで必ずしも遵守し続けるとは限らず、対象者によっては割り付けられなかった方の治療を受けることもある。このようなデータに対して標準的に用いられている解析方針として、ランダム割り付け後の治療経過によらず、割り付けの対象となった全ての対象者を割りつけられた治療グループに属するとして解析するIntention-To-Treatの原則に基づく解析(ITT解析)が挙げられる。しかしながら、ITT解析では、割り付けられた治療を守らなかった対象者を元々の群として扱うため、ノンコンプライアンス割合が高くなるにつれて、もし試験に参加した対象者全員が割り付け治療を遵守した場合に観測される治療効果(因果効果)を大きく過小評価しうる。

ランダムでないノンコンプライアンスが存在する状況において因果治療効果を推定する方法論として、近年Rubinの因果モデルに基づく統計的方法が発展してきた。Robinsが提案した構造ネスト平均モデルでは、観測された結果変数と、基準となる「試験治療を受けていない」場合の結果変数の差(あるいは比)の期待値を、未知パラメータを用いてモデル化する。Robinsは、「試験治療を受けていない」場合の結果変数(潜在結果変数)が性・年齢などと同様の治療前変数として考えることができるため、治療割り付けとは独立になることから、構造ネスト平均モデルの未知パラメータの推定を行うことを提案している(G推定法)。Robinsはさらに結果変数が経時的に測定されている場合への一般化も行っている。

結果変数が経時的に繰り返し測定されている場合には、治療と時間の交互作用や治療とベースライン共変量との交互作用に興味がある場合がある。この交互作用効果に関する問題は、通常の回帰モデルにおける変数選択の問題と同様に、どのような構造モデルがデータにより当てはまっているか、というモデル選択の問題を喚起する。しかしながら、現在のところ構造ネスト平均モデルにおけるモデル選択基準は提案されておらず、未知の因果パラメータが複数存在するような構造モデルを推測の候補として考える場合、構造ネスト平均モデルに対する統計学的な方法論は、十分存在するとは言い難い状況にある。

そこで本論文では、構造ネスト平均モデルに対するG推定量が推定関数に基づくM推定量に属することを利用して、G推定関数に対する疑似尤度関数を導き、その疑似尤度関数に基づいて種々の統計的推測を行うことを提案した。

2 提案する疑似尤度法に基づく推測

Robinsが提案したG推定量の推定関数〓を用いて、その目的関数である疑似尤度関数〓を以下のように定義した。

ここでθは関心のある治療効果パラメータ(ベクトル)であり、定義より〓を満たす。また、積分の下端sはp(0)=0を満たすように決定する。上の積分(線積分)の結果は一般に経路に依存するが、本研究では積分結果が一意に定まるような〓を発見し、それに基づいて推測を行うことを提案した。また、ノンコンプライアンスの補正を行う場合、割り付けが治療に正の効果を与えているという現実的な状況では、〓がθで最大値を持つであろうことも確認した。

具体的に、提案した疑似尤度関数p(θ)を用いて、以下の3種の漸近検定を行うことができる。治療効果を規定する興味のあるパラメータベクトルθを〓と分割し、〓という帰無仮説の検定を考える。ここでθ(1)、θ(2)はそれぞれv1次元、v2次元のパラメータベクトルとする。ここでv=v1+v2である。同様なv次元のベクトルbの分割をb(1)、正方行列Bの分割行列をB(ij)(i,j=1,2)と表す。すると、

(i) ワルド検定〓

(ii) スコア検定〓

(iii) 尤度比検定〓

をそれぞれ導くことができる。ここでθ0は帰無仮説の下でのθの推定量である。 、〓はそれぞれ帰無仮説の下で漸近的に自由度v2のカイ2乗分布に従う。また、〓は独立な自由度1のカイ2乗分布に従う確率変数の重みつき和に分布収束する。

また、これらの検定統計量を用いた信頼区間の構成も可能である。パラメータが1つのケースについて100(1-a)%信頼区間を構成する方法について説明する。まず、ワルド型の信頼区間は〓により構成できる。ここでZ(1-a/2)は標準正規分布の100(1-a/2)%点である。次にスコア型の信頼区間は〓を満たすθの集合として定義される。ここでx2(1-a)は自由度1のカイ2乗分布の100(1-a)%点である。最後に尤度比型の信頼区間は〓を満たすθの集合として定義される。

さらに、導出した疑似尤度関数を利用してAICと同様のモデル選択基準GQIC (Quasi-likelihood based Information Criterion for G-estimation)を提案した。

GQICはパラメータθで規定される真のモデルと、パラメータθで規定される仮定したモデルの疑似尤度の距離〓の良い推定量となっている。

3 シミュレーション研究

GQICの性能評価を評価するためにシミュレーション研究を行った。真のモデルが治療の主効果(切片)のみである場合やベースライン共変量や時点との交互作用もある場合等、複数の組み合わせを想定したが、真のモデルが切片のみである場合を除いて、どのパターンにおいてもGQICは正しいモデルを選択する割合が最も高かった。特にサンプルサイズが500以下のときは、P値による選択基準と比較して性能の差が顕著であった。結果の1部を表1に示す。提案するGQICでは68.2%と検定のP値に基づく選択結果(Z-test1, Z-test2)と比較して、非常に高い割合で真のモデル(表1の1番下の行)を選択した。

4 MEGA Studyデータの解析

提案した方法の適用事例として、スタチン系薬剤であるプラバスタチンの冠動脈イベント発生の抑制効果を検証することを目的とした大規模一次予防試験であるMEGA Studyデータのデータ解析を行った。MEGA Studyの対象者は、本解析での最終追跡時点である5年時においては、試験治療群であるプラバスタチン群では33.1%、対照群である食事療法群では16.3%の対象者が割り付けを遵守していなかった。解析の目的は、コンプライアンスの影響を補正したLDL値改善に対するプラバスタチンの因果効果を推定し、時点やベースライン共変量と治療の交互作用を考慮した解析を行うことである。ITT解析とG推定法(G-est)により推定された群ごとのLDL値の平均的な推移とその95%信頼区間を図1に示す。

また、MEGA Studyの全対象者の内のサブ集団をランダムに繰り返しリサンプリングすることによって、提案した疑似尤度に基づくモデル選択基準の性能を様々なサンプルサイズにおいて確認した。その結果、提案するGQICはどのサンプルサイズにおいても、最も高い割合で元データに1番良く当てはまったモデルを選択していた。なお、当てはめたモデルは、共変量として「モデル(1);LDL」、「モデル(2);LDL、高脂血症治療歴有り」、「モデル(3);LDL、高血圧有り」、「モデル(4);LDL、高脂血症治療歴有り、高血圧有り」、「モデル(5);LDL、高脂血症治療歴有り、高血圧有り、年齢」を含める5つのモデルである。結果の1部を表2に示す(全データに最も良く当てはまったモデルは、下から2行目)。

5 考察

本研究で新たに提案したG推定のためのモデル選択基準GQICについて、シミュレーションで評価を行ったところ、因果治療効果を規定する変数の変数選択において、有限標本での良い性能が示された。また、MEGA Studyのデータ解析においてもシミュレーションとほぼ矛盾しない結果が得られた。

本研究で提案した手法の応用可能性について述べる。本研究では加法的な構造平均モデル(潜在結果変数の期待値の差をモデル化)においての検討を行ったので、結果変数が連続量である場合や2値変数である場合のリスク差のスケールの検討においてG推定を用いた場合に幅広く適用可能である。G推定法はノンコンプライアンスの補正だけでは無く、観察研究において治療変数が時間と共に変化する場合の時間依存性治療の因果効果の検討、治療の直接効果・間接効果の検討にも用いられている。これらの問題にも提案した手法は直接的に応用可能であり、汎用性は高い。

本研究の限界については、時点以外の時間依存性共変量やそれまでの治療履歴と、その時点での治療変数との交互作用項を含んだモデルを検討できないことが挙げられる。しかしながら、その場合でも疑似尤度に直接的に基づく方法(尤度比検定、尤度比信頼区間、モデル選択基準)以外を用いた推測を行うことは可能である。

6結論

本研究では、構造ネスト平均モデルにおけるG推定関数に対する疑似尤度関数を導き、その疑似尤度関数に基づいて種々の統計的推測を行うことを提案した。提案する方法によれば、ワルド、スコア、尤度比の3つのタイプの漸近検定や信頼区間の構成を行うことができる。また、AICと類似したモデル選択基準GQICの導入を行った。シミュレーション研究の結果、提案するモデル選択手法は有限標本において高い性能を有することが示された。提案する方法をMEGA Studyデータに適用した結果、ノンコンプライアンスの影響を補正したプラバスタチンのコレステロール抑制効果は投与してすぐに現れ、ほぼその値のまま持続することが示唆された。

表1 シミュレーション結果(g(X)交互作用なし、n=250)

図1 割り付け群ごとのLDL値の平均的な推移とその95%信頼区間

表2 1,000回の復元抽出によるMEGA Studyサブ集団におけるモデル選択結果

審査要旨 要旨を表示する

本研究はランダム割付け臨床試験において、ランダムでないノンコンプライアンスが存在する状況下で因果治療効果を推定するための方法である構造ネスト平均モデルにおけるG推定関数に対して、疑似尤度関数を導き、その疑似尤度関数に基づいて種々の統計的推測を行うことを提案したものである。本研究により得られた知見は下記の通りである。

1.構造ネスト平均モデルの推定方法であるG推定法の推定関数に関して、その目的関数である疑似尤度関数を推定関数のパラメータに関する積分により導出した。その際に導かれる疑似尤度関数が一意に定まるための工夫として、Harvard大学のRobinsによるオリジナルのG推定関数に修正を加えた。

2.現在までに別々の研究により提案されてきた構造ネスト平均モデルに対する手法群であるワルド流、スコア流の検定及び信頼区間の構成方法は、提案する疑似尤度理論の下で統一的に扱うことができることを示した。

3.導出した疑似尤度関数に基づいて、最尤法における尤度比検定と類似した検定手法及び、Akaike Information Criterion(AIC)と同様のモデル選択基準Quasi-likelihood based Information Criterion for G-estimation (GQIC)を新たに提案した。

4.提案するモデル選択基準の性能を確認するために、ランダムでないノンコンプライアンスが存在し、アウトカムの繰り返し測定を伴う臨床試験を模したシミュレーション実験を行った。様々な治療効果の関数及びサンプルサイズの組み合わせでの実験の結果、提案するGQICによる選択では真の状況が治療の主効果のみである場合以外は、常にP値に基づく既存のモデル選択方法より高い割合で真のモデルを選択していた。

5.提案した方法の適用事例として、スタチン系薬剤であるプラバスタチンの冠動脈イベント発生の抑制効果を検証することを目的とした大規模一次予防試験であるMEGA Studyデータのデータ解析を行った。提案する方法をMEGA Studyデータに適用したところ、ノンコンプライアンスの影響を補正したプラバスタチンのコレステロール抑制効果は投与してすぐに現れ、ほぼその値のまま持続することが示唆された。また、MEGA Studyの全対象者の内のサブ集団をランダムに繰り返しリサンプリングすることによって、提案したモデル選択基準GQICの性能を様々なサンプルサイズにおいて確認した。その結果、GQICはどのサンプルサイズにおいても、最も高い確率で元データに1番良く当てはまったモデルを選択していた。

以上、本論文は複数の未知因果パラメータ存在下での統計学的な方法論が不足している構造ネスト平均モデルにおいて、疑似尤度法という新たな視点に立った因果効果の推定方法を提案した。さらに、構造ネスト平均モデルによって妥当な結果を得るための重要な仮定を検証するモデル選択基準の性能が、既存の方法と比較して優れていることを示した。本研究は割付け治療のノンコンプライアンスを伴う臨床試験における、因果治療効果の推定に重要な貢献をなすと考えられ、学位の授与に値するものと考えられる。

UTokyo Repositoryリンク