学位論文要旨



No 122555
著者(漢字) 坂本,公彦
著者(英字)
著者(カナ) サカモト,キミヒコ
標題(和) メタアナリシスにおける公表バイアスに対するベイズ的な感度解析
標題(洋)
報告番号 122555
報告番号 甲22555
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(医学)
学位記番号 博医第2851号
研究科 医学系研究科
専攻 社会医学専攻
論文審査委員 主査: 東京大学 教授 赤林,朗
 東京大学 教授 木内,貴弘
 東京大学 客員教授 井上,聡
 東京大学 講師 大石,展也
 東京大学 講師 佐藤,元
内容要旨 要旨を表示する

1 背景

 近年『根拠に基づく医療(Evidence-based medicine, EBM)』の概念が医学の世界に定着し、医学上の様々な問題に対してメタアナリシスが行われる機会が増加している.メタアナリシスに関する方法論上の未解決問題の中で最も重要な問題の一つとして公表バイアスの取り扱いが挙げられる.周知のように、科学のあらゆる分野で実施された研究のうち、その成果が最終的に論文として公表されるものは一部に過ぎない.公表された研究は様々な理由により、公表されなかった研究に比べて有意な結果を示すことが多いが、メタアナリシスは通常公表された研究のみに基づいて行うため、一般に効果の大きさの推定が過大評価となる.これを公表バイアスという.

 公表バイアスの存在はメタアナリシスという手法自体の妥当性に関わる問題のため、これに対処するための統計的手法が研究されてきた.最も頻用される手法は漏斗プロットで、これはメタアナリシスに編入された個々の研究結果を、横軸を治療効果の大きさ、縦軸をその推定精度とした散布図で表し、公表バイアスの有無をその分布の対称性に基づいて視覚的に判断する方法である.漏斗プロットの主観性を補うため、漏斗プロットの対称性に関するEggerの検定、漏斗プロットが対称となるようデータを補完するTrim and fill法などの手法も比較的よく用いられるが、いずれも公表バイアスが存在しない状態での漏斗プロットの対称性を仮定しており、その妥当性が問題とされる.一方、主として社会科学の分野で選択バイアスの補正のために用いられていた統計モデル(選択モデル)をメタアナリシスに応用した方法も提案されている.この選択モデル法は、効果の大きさに関するモデルに加えて、公表バイアスの大きさに関わるパラメータ(感度パラメータ)を導入し研究の公表過程をモデル化する方法であるが、感度パラメータの推定が困難であるという問題があった.Copasはこの点を解決するため、選択モデル法において感度パラメータの推定を行わず、代わりに感度パラメータを様々な値に固定した下でその他のパラメータの推定を行う感度解析法を提案した.

 現時点ではCopasの感度解析法が理論的に最も妥当な方法と考えられるが、この方法を実際のメタアナリシスに適用する際、感度パラメータの値を動かす範囲をどのように設定するかが問題となる.Copas自身はこの点に関して明確な指針を示していない.感度パラメータの設定範囲が広すぎる場合、感度解析の結果として関心のあるパラメータの推定値を過度に過小評価する可能性がある.また、恣意的に設定した感度パラメータの範囲が当該分野の専門家の常識と乖離していた場合、感度解析の結果が一般に容認されにくいことも起こりうる.

2 目的

 Copasの感度解析法において行われる感度パラメータの範囲設定に適切な根拠を与えるため、ベイズ的な枠組みの下で感度解析を行う手法を提案する.このため専門家が持つ未公表研究数に関する事前知識を主観確率として同定し、ベイズ的な枠組みの下で感度パラメータの事前分布としてCopasの感度解析法に導入する.同時事後分布に基づくパラメータ推定は、ギブスサンプリングを利用した解析プログラムにより行う.さらに、提案する手法を受動喫煙と肺癌に関する疫学研究のメタアナリシスに適用する.

3 方法

3.1 公表バイアスに対するCopasの感度解析法

Copasの感度解析法では以下のような統計モデルを考える.

ただしyiは研究iにより報告された効果の大きさ、siはyiの標準誤差、μiはyiの期待値、σ2iは研究内分散、σ2は研究間分散、nは未公表研究も含めた当該分野の全研究数を表す.ziは研究iが公表される確率を規定する潜在変数で、zi〓0のとき研究が公表されyi,siが実際に観察されると仮定する.(γ0,γ1)は論文の公表されやすさを表すパラメータ(感度パラメータ)であり、γ0は当該分野全体の、γ1は研究ごとの公表されやすさを表す.

 Copasの感度解析法は感度パラメータ(γ0,γ1)の値を格子状に変化させながらその他のパラメータに関して最尤推定を行うことで、関心のあるパラメータμの推定に対する公表バイアスの影響を評価する方法である.

3.2 公表バイアスに対するベイズ的な感度解析法

 提案する方法では、Copasの感度解析をベイズ統計学の枠組みの下で行う.まず全ての未知パラメータに対して事前分布を設定する.

γ0の事前分布として正規分布を、その他のパラメータ(μ,ρ,τ2)には無情報事前分布を仮定した.またγ1については計算の簡単のため〓γ0+〓に固定した.

 次にこれらの事前分布の密度関数とモデルの尤度関数をベイズの定理を用いて統合し、全ての未知パラメータの同時事後分布を得る.式(1)〜(3)で表されるモデルの尤度関数をL(μ,ρ,τ2,γ0)で表し、パラメータの周辺分布を{・}で表すと、同時事後分布は次のように表せる.

 同時事後分布に基づくパラメータ推定を行うため、マルコフ連鎖モンテカルロ法と呼ばれる数値計算法の一種であるギブスサンプリングのアルゴリズムを利用した解析プログラムを作成した.ギブスサンプリングでは式(8)で表される同時事後分布を以下のような4つの完全条件付事後分布へと分解する.ただしDはデータ、{・|・}は条件付分布を表す.

各パラメータの完全条件付分布から単変量のサンプリングを順に繰り返すことで、マルコフ連鎖と呼ばれる確率過程からの標本が生成されるが、これはサンプリングが進むに従って次第に標本分布が同時事後分布に収束すると同時に、標本間の相関が減少し、近似的に同時事後分布からの独立な標本として扱えるという性質をもつ.このため、ギブスサンプリングにより得られた標本の経験分布に基づいてパラメータの周辺事後分布や事後予測分布を求めることができる.事後予測分布はベイズ的なモデル適合度の診断に利用される.

 ギブスサンプリングに用いる4つの完全条件付事後分布は、単変量だが一般によく知られた確率分布ではないため、ここからのサンプリングを行うには数値計算上の工夫が必要となる.本研究ではこの過程に適応的棄却メトロポリスサンプリングのアルゴリズムを利用し、比較的高速な統計環境であるR version 2.3.1を用いて記述した.ギブスサンプリングは異なる設定ごとに5000回反復し、初期の1000回をburn-in period(初期値の影響を強く受ける期間)として破棄した.

3.3 受動喫煙と肺癌に関する疫学研究のメタアナリシス

 Hackshawは1981〜1997年に公表された受動喫煙と肺癌に関する37の疫学研究を対象にメタアナリシスを行った.本研究では1997年〜2006年9月までに公表された受動喫煙と肺癌に関する疫学研究をHackshawと同様の編入・除外基準で系統的に収集し、新たに10の疫学研究を同定した.提案する方法による解析は

 1. Hackshawによる37研究のメタアナリシス

 2. 新たに同定された10研究を併合した47研究のメタアナリシス

の2つのデータを対象として行った.

 解析に使用する未公表研究数の事前分布は図1に示すように

 1. 専門家の主張する事前分布(未公表研究数はおよそ10以下)

 2. やや極端な仮定を表す事前分布(全研究のおよそ40%が未公表)

 3. 非常に極端な仮定を表す事前分布(全研究のおよそ60%が未公表)

の3通りを、2種類のデータに対してそれぞれ設定した.

4 結果

 ギブスサンプリングの結果を表1、対数相対リスクを表すパラメータμの周辺事後分布を図2に示す.

 3種類の異なる事前分布の下での相対リスクの推定値はそれぞれ1.227(95%区間1.129-1.343)、1.186(95%区間1.077-1.299)、1.160(95%区間1.046-1.275)であり、非常に極端な事前分布の下でも依然として受動喫煙の肺癌に対する影響が示された.

5 考察

 本研究で提案したベイズ的な感度解析法を受動喫煙と肺癌のメタアナリシスに適用した結果、非常に極端な事前分布の下でも相対リスクの95%最高事後密度区間は1を跨いでおらず、受動喫煙の肺癌に対する影響は依然として明らかであった.このことは、本研究で行った47研究のメタアナリシスによる結論の頑健性を示すものと考えられる.

 ベイズ統計学の枠組みの下では、感度パラメータ以外の未知パラメータに対しても本研究と全く同様の方法で主観確率を事前分布として導入することが可能である.例えば受動喫煙と肺癌の例において、関心のあるパラメータに関して何らかの事前知識が存在する場合、パラメータμの事前分布に主観確率を導入することができる.本来疫学研究には様々な不確実性が伴うことが多いため、データが持つ情報に加えて当該分野の専門家の意見をベイズ統計学の視点で適切に考慮することは、疫学研究の結果に関する不確実性に対処し、合理的な結論を得るために有効と考えられる.

6 結論

 メタアナリシスにおける未公表研究数に関する事前知識をCopasの感度解析モデルに事前分布として導入し、ベイズ的なパラメータ推定を行うことで、専門家の事前知識を考慮した公表バイアスに対する感度解析法を提案した.提案する方法を2006年9月までに公表された受動喫煙と肺癌に関する47個の疫学研究のメタアナリシスに適用した結果、非常に極端な事前分布の下でも受動喫煙の肺がん発症に対する影響は依然明白であり、公表論文に基づいた結論の頑健性が示された.

図1: 事前分布の設定.実線は専門家の事前分布(Prior 1)、破線はやや極端な事前分布(Prior 2)、点線は非常に極端な事前分布(Prior 3)を表す.(A)(B)はHackshawによる37研究のメタアナリシス、(C)(D)は本研究で行った47研究のメタアナリシスのための事前分布である.また(A)(C)は感度パラメータγ0の事前分布、(C)(D)は対応する未公表研究数の事前分布を表す.

表1: ギブスサンプリングの結果の要約

図2: パラメータμの周辺事後分布.実線は専門家の事前分布(Prior 1)、破線はやや極端な事前分布(Prior 2)、点線は非常に極端な事前分布(Prior 3)に対応している.(A)はHackshawによる37研究のメタアナリシス、(B)は本研究で行った47研究のメタアナリシスのデータを使用した.

審査要旨 要旨を表示する

 本研究は、メタアナリシスの方法論の分野における重要な未解決問題の一つである公表バイアスの統計的な取り扱いに関して、ベイズ統計学の手法を利用した感度解析を行うことによって公表バイアスに対するメタアナリシスの結論の頑健性を検証する方法を提案するものであり、下記の結果を得ている.

1. 公表バイアスに対する統計手法に関する先行研究の詳細なレビューを行った上で、理論的に最も妥当な方法としてCopasの感度解析法に注目し、この方法のもつ本質的な問題点として感度パラメータの範囲設定における恣意性の問題を指摘した.

2. Copasの感度解析法における感度パラメータの範囲設定の根拠となる客観的データは通常存在しないため、本研究では当該分野の専門家による未公表研究数の見積もりを主観確率として同定し、これを感度パラメータの事前分布として解析に導入することで恣意性の問題に対処できることを示した.このため本研究では、Copasの感度解析法における統計モデルをベイズ統計学の枠組みの下で定式化し、マルコフ連鎖モンテカルロ法の一種であるギブスサンプリングのアルゴリズムを利用してパラメータ推定を行う方法を提案した.さらに提案する方法を実行する解析プログラムを統計環境Rを利用して実際に作成した.

3. 本研究で提案した手法を、受動喫煙と肺癌に関する37の観察研究のメタアナリシスに適用した結果、公表バイアスの影響に対してメタアナリシスの結論が頑健であることが示された.また本研究では受動喫煙と肺癌に関して、オリジナルのメタアナリシスが公表された1997年以降2006年までに公表された観察研究のメタアナリシスを実施し、新たに10研究を同定した.これらを加えた47研究を対象として提案する手法による感度解析を行った結果、公表バイアスの影響に対するメタアナリシスの結論の頑健性が同様に示された.

 以上、本研究はメタアナリシスにおける公表バイアスに対して、ベイズ統計学の枠組みの下でCopasの感度解析法を実施する手法を提案すると共に、専門家から同定された未公表研究数に関する主観確率を感度パラメータの事前分布として解析に導入することで、公表バイアスがメタアナリシスの結論に及ぼす影響を適切な根拠に基づいて検証することを可能とした.これはメタアナリシスの方法論の分野に重要な貢献をなすものであり、学位の授与に値するものと考えられる.

UTokyo Repositoryリンク