学位論文要旨



No 215476
著者(漢字) 石塚,直樹
著者(英字)
著者(カナ) イシヅカ,ナオキ
標題(和) 用量制限毒性発現率の期待値の計算方法に着目した修正Continual Reassessment Methodとその応用
標題(洋) A modified continual reassessment method and its applications focused on the calculation for the mean of the dose limiting toxicity occurrence rate
報告番号 215476
報告番号 乙15476
学位授与日 2002.10.23
学位種別 論文博士
学位種類 博士(保健学)
学位記番号 第15476号
研究科
専攻
論文審査委員 主査: 東京大学 教授 小林,廉毅
 東京大学 助教授 渡辺,知保
 東京大学 教授 鶴尾,隆
 東京大学 助教授 木内,貴弘
 東京大学 助教授 平井,久丸
内容要旨 要旨を表示する

1.はじめに

 CRM(Continual Reassessment Method)は1990年にワシントン大学およびFred Hutchinson CancerResearch Centerに在籍していたO'Quigley et al.により発表された、がん等の予後不良の疾患に対する治療法についての第I相試験デザインである。本論文では、2章でがん第I相試験の要件を考え、3章では現時点で最も幅広く用いられている標準的なデザインと問題点をレビューし、その特性を計算例により検証した。4章では従来のCRMとその修正を提示し、従来法との優劣を示した。そして、5章では実例を通じてCRMを用いた第I相試験における利点と問題点を指摘した。

2.がん第1相試験に必要な要件

 次のようながん患者の臨床試験を想定する。

 ・既に標準的な治療は有効ではなく、短期間で死亡するリスクが高い。

 ・評価する新しい療法は、高用量では毒性が高くて致命的で、低用量では薬効が期待できない。

 この状況では最良の用量レベルが患者に投与されるべきである。しかし、そのようながん患者を対象に最大耐用量を求める第I相試験には研究目的と患者のインセンティブにギャップがある。また、毒性を過小評価して高すぎるMTDを選択すれば、第II相試験でより多くの患者に致命的な毒性が発現する用量レベルが投与されることにもなりかねない。逆にもう少し高い用量レベルが選ばれたかもしれないのに毒性を過大評価して低すぎるMTDが選択された場合には、第II相試験では期待される有効率が得られないことにもなりかねない。

3.がん第I相試験の標準的なデザイン(3+3デザイン)

 標準的なデザインは、マウスのLD10の1/10を試験開始用量として3例に投与する。その結果、試験開始用量で用量規制毒性(DLT)が現れなければ増量して次のレベルの検討に進む。もし、試験開始用量でDLTが現れれば、さらに3例が同じ用量レベルで試験が続けられる。6人中1人までの毒性発現なら次の用量レベルの検討に進む。増量した用量レベルで再び繰返し、2人以上に毒性が現れたらそこで試験を止め、終了した用量を最大耐用量(MTD)としている。

 ある用量レベルにおけるDLT発現率を想定すれば、二項確率から試験を中止せずに増量する確率と試験を終了する確率を計算することができる。さらにj段階目の用量レベルを考えたとき、用量レベルjが投与されるのは用量レベル1から用量レベルj-1まで増量と判断された条件付きとなる。低い用量レベルから順番に投与され、j番目の用量レベルで終了しMTDと判断される確率計算を導出した。そこで、試験開始用量と増量幅がMTDの選択に及ぼす影響を調べるために、いくつかの真のDLT出現率と増量幅の設定で、MTDとして各用量レベルが選択される確率関数を数え上げて計算した。さらに平均、標準偏差により、信頼性を正確さと精度の両面から評価をした。

 その結果、全般的に増量幅が狭いほど、真のDLT発現率が低い用量レベルでMTDとして選択される確率が高いことがわった。低用量レベルから始めて慎重に増量すれば、目標とする毒性レベル(例えばDLT発現率33%)に至るまでにMTDと判断して試験が終了してしまう可能性が高いことが示された。逆に試験開始用量レベルを高くすると目標を通過する可能性も高くなることを示していた。増量幅が狭いほど、また試験開始用量レベルが低いほどMTDとして選択される用量レベルの平均DLT発現率が低かった。さらに、増量幅が広いほど、また試験開始用量レベルが低いほど標準偏差は大きかった。

4.CRM

 CRMは3+3デザインでは得られなかった2つの大きな利点がある。1つはDLT発現率に関して定量的な解釈が可能であり、2つめは試験前の用量反応関係に関する様々な事前情報を明示的に利用する点である。オリジナルのCRMは以下の通りとなる。

 用量レベル: xi(i=1,...,k)

 j番目の患者の応答:yj{1 if toxic response 0 if no toxic response(j=1,...,n)

 用量反応(毒性)モデル:ψ(xi,a),例えば、E[Yj}=θ〜=ψ(xi,a)=exp(3+axi)/1+exp(3+axi)(4.1)

 j番目の患者のパラメータaについての事前分布:f(a,Ωj)ただし、Ωj={y1,...,yj-1}かつ∫∞0f(a,Ωj)da=1 (j=1,...,n)

 j番目の患者がi番目の用量レベルにおける応答確率の事前平均:θij=∫∞0ψ(xi,a)f(a,Ωj)da (i=1,..,k) 4.2)

 パラメータaの事前平均を用いた応答確率の近似的な事前平均,μ(j):θij=ψ{xi,μ(j)}(i=1,...,k),μ(j)=∫∞0af(a,Ωj)da (4.3)

 そして、次のように始まる:

 (i)用量反応(毒性)モデルψ(x1,a)を仮定する。ただし、xi,i=1,...,kは試験開始前に定められた

 用量レベルで、aはモデルのパラメータ。

 (ii)aの事前分布を仮定する。

 (iii)目標とするDLTの発現する確率θを定める。

 (iV)j番目の患者に目標とする毒性レベルと用量レベルの距離△(θ'ij,θ)に最も近い、用量レベルX(j)

 を割付ける。毒性の有無である二値応答yjが観察されれば、パラメータaの事後分布がベイズの定理に従った計算で更新される。この過程を事前に決めたサンプルサイズ、例えば25例、あるいは他の条件を満たすまで繰り返す。

 そこで、DLT発現率をθ'ijの近似ではなく、事前分布の分散が大きく、かつ歪んでいることを考慮に入れている平均確率(期待値)θijを用いることを提案した。この提案により投与開始用量レベルと増量スピードに差があり、試験開始直後に危険な増量を防ぐことが可能である。また、モデルのパラメータaに代えてDLT発現率万の分布をモニターすることを提案し、θ〜の分布はaから単純な確率変数の変数変換として導出することを示した。

 さらに、この提案を1000回のシミュレーションにより評価した。評価項目は25例により最終的に選択された用量レベル、真の目標となる用量レベルの事後確率、各用量レベルで試験された例数(割付けられた患者数)、DLT発現の観察された例数とした。結果は、最終的に選択された用量レベルにおいてθijに基づいた割付けルールとθ'ijに基づいた割付けルールで変わらず、商用量レベルが投与される症例数をθijに基づいた割付けルールがθ'ijに基づいた割付けルールに比べて減らしていた。

5.CRMを用いた事例

 シミュレーションに加えて、事前情報を活用することを個別の事例により考察した。

5.1JCOG9512試験

 がん治療では、2剤以上の薬剤による併用化学療法が一般的に用いられている。各薬剤の推奨用量で毒性と有効性について既に第II相試験で確認されているが、併用という状況では毒性が増強され単剤の推奨用量を投与することが困難になる可能性がある。そのため、併用のMTDあるいは推奨用量を決定するために第I/II相試験と呼ばれる新規の臨床試験が必要となる。日本臨床腫瘍研究グループのJCOG9512試験は、進行非小細胞肺がんを対象として3剤併用の化学療法をCDDPの用量レベルを固定し、CPT-11とVP-16の2薬剤で適当な用量レベルを探索するために計画された。単剤の事前情報を反映した用量反応モデル、事前分布を設定し、目標毒性レベルは33%であった。増量は5段階の用量レベルのうち最低レベルから開始され、先に説明した修正CRMに基づき各用量で少なくとも3例が投与された。また、用量レベルPr[θ>50%]>1/3の時には増量しなかった。この試験では中止規準として、

 (1)用量レベル間でDLT発現率の事後密度関数がきれいに分離されば試験を終了できる。あるいは、分離ははっきりしていてもその範囲に目標とするレベルが存在しなければ新しい用量レベルを定めるべきである。

 (2)目標とするDLT発現率のベイズ流信頼区間が十分に狭ければ試験を終了できる。

 を提案し、20例で終了した。

5.2 TOP-53試験

 この試験は、CRMとPhamacokinetic Guided Dose Escalation(PGDE)を組合せたハイブリッドなデザインであった。TOP-53は、がん治療薬として一般的なVP-16のアナログ化合物で、TOP-53の薬物動態はマウスと犬で、線型であった。動物では骨髄抑制がDLTで、AUCと毒性の強い相関が観察された。この現象はヒトでも同様であると期待された。毒性プロファイルもVP-16の動物実験と同様であり、VP-16の第I相試験のデータを事前情報として用いることができた。

 用量反応モデルには1パラメータのロジスティック・モデルを仮定し、傾きのパラメータにガンマ事前分布を採用した。試験開始用量はマウスのLD10レベルの1/10(5.7mg/m2=1n)に決定された。マウスのLD10の40%に達する用量レベルまではPGDEを用いて100%の増量を行い、それ以後は33%の増量を計画した。AUCと用量の関係を線型モデル(ただし切片はなし)と傾きのパラメータに曖昧な事前分布を仮定し、次用量レベルのAUCを事後t分布を用いて推定した。10例目以降でCRMの計算を始め、減量の可能性も考慮に入れた。MTDの目標毒性レベルは33%とした。試験期間中にPr[θ>0.33]がモニターされた。

 Modified Fibonacciを用いた3+3デザインに比べて少ない患者数の試験になり、試験は25例で終了した。ただし、1例は試験薬の投与を受けず、4例にDLTが観察された。DLT発現率に関して、Pr[θ>0.33]は14.1nと18.8nで、それぞれ7%,70%であり、確率密度関数間で十分に分離していた。

6.まとめ

 オリジナルのCRMは、目標より高い用量レベルを割付ける傾向がある。ここで提案した修正バージョンは、割付けルールを各用量レベルのDLT発現率の正確な期待値(平均)θijに基づいている。シミュレーション結果から、最終的に選択される用量レベルがオリジナルCRMと同等であり、一方で高用量レベルが投与される症例数を減らすことが確認された。また、DLT発現率が特定の毒性レベルを超える確率の事後確率を用いることを提案した。さらに安全性モニタリングと、用量レベル間における密度関数の分離の判断にこれらが有用な尺度であることを示した。

 実際の第I相試験では何らかの事前情報が存在することが一般的であり、単剤の治療のデータを事前情報として活用することができる併用療法を対象にした第I/II相試験、アナログ化合物の第I相試験に適用した実例を提示した。このような実例を通じて、事前情報をどのように定式化するのか、そのうち一般化できることは何なのかを経験的に知識を集積することが重要と考える。CRMは、増量・減量や試験の中止といった複雑な意思決定を必要とするような場面で、早期がん臨床試験におけるモニタリング・ツールとして、あるいは臨床家と統計家のコミュニケーションのツールとしてフレキシブルに用いることが可能である。

 要約すると、CRMの適用にはモデルの設定と事前分布の選択に関心を払うべきである。そのような努力は臨床家と科学的なデータに基づくべきである。そして、このような姿勢こそが、研究と倫理のジレンマの存在する困難な分野で、新規のアプローチに必要であると確信している。

審査要旨 要旨を表示する

 本研究はがん等の予後不良の疾患に対する治療法についての第I相試験デザインであるContinual Reassessment Method(CRM)において、最大耐用量(MTD)を超える用量レベルが投与される患者数を減らすために用量割付ルールに改良を試みたもので、下記の結果を得ている。

1.現時点において標準的な3例のコホートを用いたデザインについて、低い用量レベルから順番に投与され、ある用量レベルで終了しMTDと判断される確率計算を二項確率から導出した。その計算方法を用いて、試験開始用量レベルが低く増量幅が狭いほど真の用量制限毒性(DLT)発現率が低い用量レベルをMTDとして選択する確率が高く、目標とする毒性レベル(例えばDLT発現率33%)に至るまでにMTDと判断して試験が終了してしまう可能性が高いことが示された。逆に試験開始用量レベルを高くて増量幅が広いと目標を通過する可能性も高くなることが示された。

2.従来のCRMの用量割付ルールがDLT発現率の平均(期待値)に近似を用いていたことにより、試験早期に毒性を過小評価することを示し、事前分布の分散が大きく、かつ歪んでいることも考慮に含む正確に計算した平均(期待値)を用いることを提案した。また、用量反応モデルのパラメータの事前分布の確率密度関数から、確率変数の変数変換として各用量レベルにおけるDLT発現率の事前分布の導出を示し、グラフィカルにモニターすることを提案した。この提案が投与開始用量レベルと増量スピードを慎重にし、従来のCRMに比べて試験開始直後に危険な増量を防ぐことが可能であることが示された。

3.最終的に選択される用量レベルにおいて、従来のCRMで用いられていた近似の期待値に基づいた割付けルールと、提案した正確な期待値に基づいた割付けルールにはシミュレーションにより差がなく、いずれも標準的な3例のコホートを用いたデザインより目標毒性レベルに近いことが示された。また、高用量レベルが投与される症例数を、提案した正確な期待値に基づいた割付けルールが従来の近似の期待値に基づいた割付けルールより減らしていることが示された。

4.事前情報がある状況で進行非小細胞肺がんを対象とした3剤併用のJCOG9512試験、VP-16のアナログ化合物であるTOP-53の単剤試験の2試験において、提案した割付ルールが実地に適用可能であることが示された。さらに、それらの試験から中止規準として、

(1)用量レベル間でDLT発現率の事後密度関数がきれいに分離されば試験を終了する。あるいは、分離ははっきりしていてもその範囲に目標とするレベルが存在しなければ新しい用量レベルを定める。

(2)目標とするDLT発現率のベイズ流信頼区間が十分に狭ければ試験を終了する。の可能性が示唆された。

 以上、本論文は標準的な3例のコホートを用いたデザインの問題点、従来のCRMが目標より高い用量レベルを割付ける傾向があるという問題点を、各用量レベルのDLT発現率の正確な期待値(平均)に基づく割付ルールをCRMに採用することにより改善することをはじめて示した。また、各用量レベルのDLT発現率の事前分布の確率密度を有効活用できる可能性を示し、実施上でも重要な貢献があると考えられた。よって、学位の授与に値するものと考えられる。

UTokyo Repositoryリンク