学位論文要旨



No 214854
著者(漢字) 丸山,祐造
著者(英字) Maruyama,Yuzo
著者(カナ) マルヤマ,ユウゾウ
標題(和) 多変量正規分布の平均に対するミニマクスかつ許容的な推定とJames-Stein推定量の改良について
標題(洋) Minimax Admissible Estimation of a Multivariate Normal Mean and Improvement upon the James-Stein Estimator
報告番号 214854
報告番号 乙14854
学位授与日 2000.12.06
学位種別 論文博士
学位種類 博士(経済学)
学位記番号 第14854号
研究科
専攻
論文審査委員 主査: 東京大学 助教授 久保川,達也
 東京大学 教授 國友,直人
 東京大学 教授 竹村,彰通
 東京大学 教授 縄田,和満
 東京大学 教授 矢島,美寛
内容要旨 要旨を表示する

 統計的決定理論は,現代の統計的思考の基礎をなしており,ミニマクス性と許容性がその中心となる概念である.最近30年来の、ミニマクス性と許容性に関する研究は,数学の他分野,例えば,数理物理における偏微分方程式,微分不等式,確率過程の再帰的性質,などと強い結び付きがあることを示している.その研究の中心的な話題が多変量正規分布の平均ベクトルの推定であり,これは次に紹介するStein現象の典型である.

 許容性は,良さの基準としては,弱い基準なので,最尤推定量(MLE)などの自然な推定量は,許容的であることが想定される.Xが多変量正規分布N(θ,IP)に従うとき,二乗ロスのもとでの平均ベクトルθの推定問題に対し,Stein(1956)は,MLEである自然なミニマクス推定量Xがp≦2では,許容的であるが,p≧3では,非許容的であることを示した.このように自然な推定量が非許容的になることは,Stein現象と呼ばれている.James&Stein(1961)は,明示的にXを改良するJames-Stein推定量δJS=(1-(ρ-2)/||X||2)Xを導出している.さらにδJSのpositive-partを取った推定量δ+JS=max(0,1-(p-2)/||X||2)XがδJSを改良するので,δJSは非許容的である.

 一般に,ある推定量δがミニマクス推定量Xを改良するならば,δもまたミニマクスであり,Xよりも望ましい推定量である.統計的決定理論の立場からは,δが許容的かどうかを確かめることが重要なテーマである.さらにδが非許容的である場合,δを改良する許容的な推定量を提案することも数学的に興味深いテーマである.従って本論文では,ミニマクス性,許容性の2つの最適性を満たす推定量の広いクラスを導出することを考える.またJames-Stein推定量を改良する推定量のクラスとその許容性について考える.以下では,論文の構成の概略を説明しながら,上に述べたことをより具体的に述べる.

 第2章では,特に推定問題について,統計的決定理論の基礎的概念をまとめる.「許容性」,「ミニマクス性」,「ベイズ」,「準許容性」などを定義し,それらの概念の間の関係についてのいくつかの定理を述べる.

 第3章は,多変量正規分布の平均ベクトルの推定についての一連の結果を含んでいる.3.1節では,MLEであるXのミニマクス性とp≧3での非許容性について,証明する.3.2節では,許容性と準許容性についてのBrown(1971,1988)の結果を紹介する.3.3節では,ミニマクスでかつ許容的である推定量のクラスを考える.Brown(1971)の完備類定理「全ての許容的な推定量は,一般化ベイズ推定量である」に注意して,密度関数が

(ここでh(λ)は(0,1)上の可測関数である.)に比例しているような測度を事前分布として想定し,これに関する一般化ベイズ推定量δh(X)=(1-φh(||X||2)/||X||2)X(ここで

である)の性質を調べる.許容性については,Brown(1971)の一般化ベイズ推定量が許容的であるための必要十分条件により,h(λ)に依存せず,α≦2のとき,許容的であることが分かる.ミニマクス性については,直交変換群に関して共変な推定量のクラスδ(x)=(1-φ(||X||2)/||X||2)X,に対して,Stein's identityから得られるミニマクスであるための十分条件

を用いることにより,δhがミニマクスであるための十分条件が得られる.これまでに知られているミニマクスな一般化ベイズ推定量のクラスすなわちStrawderman(1971),Alam(1973),Berger(1976),Faith(1978),Maruyama(1998),Fourdrinier et al.(1998)の推定量のクラスは,全てh(λ)によって特徴づけられるが,我々はこれらのクラスをh(λ)が有界か否かで,次の表のように2つに分けることが出来ることを示す.

 さらに我々は,Stein(1973)による次のような単純なアイデアに決定理論的な結果を与える.Stein(1973)は,密度関数が||θ||2-ρ((1)において,α=2,h(λ)=1とした密度に対応する)で与えちれる分布とθ=0の一点分布の重み付き分布に対する一般化ベイズ推定量を,James-Stein推定量を改良している可能性がある推定量として提案した.この予想は後に密度関数が||θ||2-pで与えられる事前分布に対する一般化ベイズ推定量がJames-Stein推定量を改良することが,Kubokawa(1991)によって示されるので,一点分布の重みが小さい場合には,的を得た予想である.しかし,Stein(1973)以後,決定理論的な結果については,James-Stein推定量の改良はもちろんのこと,許容性やミニマクス性でさえも証明されていなかった.我々は,Stein(1973)の事前分布を一般化し,密度が(1)で与えられる分布とθ=0の一点分布の重み付き分布を考える.この分布の密度関数は,(1)においてh(λ)=βh(λ)+δ(λ一1)(ここでβ>0であり,またδ(・)はDiracのdelta functionである.)を代入したものに対応していることに注意する.この事前分布に対する一般化ベイズ推定量δβ(X)=(1-φβ(||X||2)/||X||2)X(ここでである.)は,Brown(1971)の結果より,h(λ),βによらず,α≦2のとき,許容的であることが分かる.ミニマクス性については,δhにおいて,ミニマクスな一般化ベイズ推定量を導くようなh(λ)に対し,β≧β*のとき,δβ(X)もまたミニマクスであるようなβ*が存在することが示される.

 さらに一般化ベイズ推定量について,事前分布とミニマクス性とその推定量に対するφ(w)の間の関係についても調べる.ミニマクスであるための十分条件(2)は,φ(w)が単調でないものも許しているが,φ(w)が単調である方が,条件のチェックが容易であり,Faith(1978)により,φ(w)が単調であるミニマクスな一般化ベイズ推定量を導く事前分布のsubclassの特徴付けがされている.一方,φ(w)が単調でないミニマクスな一般化ベイズ推定量を導く事前分布の特徴付けに関する結果は断片的であり,整理されていなかった.我々はφ(w)が,極値を1つ,あるいは2つ持つような推定量を導く事前分布のsubclassを特徴付ける.φ(w)が単調でないミニマクスな一般化ベイズ推定量に関する研究は,この分野で最も難しい問題「δ+JSを改良し,かつ許容的である推定量の導出」につながるため,今後ますます重要になると,我々は考える.

 3.4節では,Maruyama(1996)で提案されたJames-Stein推定量を改良する推定量δα(X)=(1-φα(||X||2)/||X||2)X(ここで

であり,またα>1である.)の性質を論じる.δα(X)withα>1は,許容的であるための必要条件である準許容性を満たすことが示される.しかし,非許容的であることが予想されており,このことは,James-Stein推定量を改良し,かつ許容的である推定量の広いクラスを導出することが,難しいことを示唆している.

 Stein現象は,多変量正規分布の場合以外にも現れる.Stein(1956)以後,最良共変推定量δ0(二乗ロスのもとではミニマクスである.)を改良する問題が考えられてきた.Brown(1966)は,分布の広いクラスに対して,3つ以上のlocation parameterの同時推定において,δ0が非許容的であることを示した明示的に改良する推定量を導出するには,分布を制限して考えることが必要であるが,この分野では,spherically symmetric distributionの平均ベクトルの推定が興味ある問題の一つとして,研究されてきた.Strawderman(1974)は,spherically symmetric distributionの特別な場合として,scale mixtures of multivariate normal distributions(密度関数は

で与えられ,ここで,Gは既知の分布関数である.)を考え,P≧3において,ミニマクスである最良共変推定量Xを改良する推定量を提案した.さらに一般的に,Berger(1975),Bock(1985),Brandwein and Strawderman(1978,1991)は,spherically symmetric distributionの平均ベクトルの推定において,Xを改良する推定量を提案した.しかし,ミニマクスであり,かつ許容的である推定量は導出されておらず,決定理論的立場から,そのような推定量が強く望まれていた.第4章において,分布関数Gが密度関数g(v)を持つ場合のscale mixtures of multivariate normal distributionsの平均ベクトルの推定問題を考える.g(v)がある条件を満たすとき,(少なくともmultivariate-t分布に対応するg(v)=vm/2-1exp(-mv/2)は,その条件を満たす)ミニマクスかつ許容的な推定量が提案される.

Table 1:いくつかの先行研究に対応するh(λ)

審査要旨 要旨を表示する

 本論文は,多変量正規分布及び多次元球面対称分布の平均ベクトルの推定問題を扱い,統計的決定理論の枠組みにおいて許容的でしかもミニマクスな推定量のクラスを構成することを主に議論している。この論文で得られたミニマクスな許容的推定量のクラスは,従来のものに比べかなり広く,新たな理論を展開することによって本質的な拡張を行っている。またStein(1973)によって提案された一般化ベイズ推定量に対して許容性とミニマクス性を確立しており,長い間未解決であった問題がこの論文において解かれたことを意味している。

 本論文は次のように構成されている。

 第1章 序文

 第2章 統計的決定理論の基礎概念

 第3章多変量正規分布の平均ベクトルの推定

 3.1節 通常の推定量の非許容性

 3.2節 許容性と準許容性

 3.3節 許容的ミニマクス推定量のクラス

 3.3.1節 一般化ベイズ推定量と許容性

 3.3.2節 Alam-Maruyama型ベイズ推定量

 3.3.3節 Stein型ベイズ推定量の一般化

 3.4節 James-Stein推定量の改良

 第4章 多変量正規一尺度混合分布の平均ベクトルの推定

 4.1節はじめに

 4.2節 一般化ベイズ推定量の構成

 4.3節 平均ベクトルの許容的ミニマクス推定量

 第2章以降の各章の内容を要約・紹介すると次のようになる。

 第2章では,統計的決定理論の考え方や基本概念である許容性とミニマクス性の定義とそれらの基本的な結果や関係などについてまとめている。未知母数をデータに基づいて推定するとき,様々な推定方法が存在するので各推定量の良さを評価してより優れたものを用いることが望ましい。そのために推定量と未知母数の間に損失関数を導入する。これは推定量と未知母数の間の距離に相当するものであり,これが小さい程推定値は推定したい母数に近いことになる。この損失関数は推定量の値,すなわち確率変数の値(観測値)に依存してしまうので,損失関数を推定量の確率変数に関して平均化した量で推定量の良さを評価する。この量をリスク関数といい,推定方法と未知母数の関数になっている。一般にリスク関数を通して統計手法の良さを議論する学問を統計的決定理論という。2つの推定量を比較するとき,未知母数のあらゆる値に対して常にある推定量のリスクが別の推定量のリスクよりも小さいか等しく,しかも未知母数のある点でより小さくなっているとき,前者は後者を改良する(もしくは優越する,優れている)という。すべての推定量を改良するような推定量は考える推定量のクラスを限定しない限り存在しないので,推定量の良さを判断する概念として許容性とミニマクス性が登場する。ある推定量が許容的であるという定義は,それを改良する推定量が存在しないことである。またある推定量がミニマクスであるとは,その「リスクの最大値」があらゆる推定量の「リスクの最大値」を最小にする値に等しいことをいう。言い換えると,最悪な場合を最良にする推定手法である。許容性は弱い概念で,定数で推定する自明な推定量を排除できず,またミニマクス性だけでは非許容的になっている可能性もある。そこで許容性とミニマクス性を併せ持つ推定量が望ましく,こうしたものの導出が統計的推定理論の1つの究極的な目的となる。

 第3章が本論文の主要部分であり,多変量正規分布の平均ベクトルの同時推定間題が扱われる。損失関数として通常の2乗損失関数が取られるので,平均2乗誤差(MSE)がリスクになっている。平均ベクトルの通常考えられる推定量は最尤推定量であり,これは最小2乗推定量(LSE)でもある。Stein(1956)は,この最尤推定量の許容性について歴史的な大発見を与えた。それは,1次元,2次元のときには許容的であるにもかかわらず,3次元以上では最尤推定量が非許容的になるというものであった。3次元以上のときに具体的に改良する推定量がJames and Stein(1961)によって明示的に与えられてJames-Stein推定量と呼ばれる。この推定量は最尤推定量を原点の方向へ縮小する形をしているので,一般にこのような推定量は縮小推定量と呼ばれる。許容性と非許容性についてのこの事実は多くの理論家の興味を引きつけ,1970年以降実に膨大な研究論文が生産された。またJames-Stein推定量が経験ベイズ推定量として解釈されることが示されてからは,データ解析の場面でより安定した精度の高い推定値を与えるための手法として多くの適用例が与えられてきた。

 3.1節では,最尤推定量のミニマクス性と3次元以上のときの非許容性が示される。一般に最尤推定量を改良する推定量は直交共変な推定量のクラスの中に構成することができ,それは縮小関数を用いて表現することができるので,ここでは縮小推定量と呼ぶことにする。縮小推定量のリスクの不偏推定量をSteinの部分積分公式を用いて求め,それが最尤推定量のリスクより小さくなるための,縮小関数に関する微分不等式を導いている。この微分不等式が,縮小推定量が最尤推定量を改良するための(言い換えるとミニマクスになるための)十分条件になっている。その微分不等式のよく知られた解は,縮小関数の単調増加性と有界性である。本論文では,この単調性の条件を緩めることによってミニマクス推定量のより広いクラスを構成している。

 ミニマクスでかつ許容的な推定量は,一般化ベイズ推定量の中にのみ存在することが一般論から知られている。一般化ベイズ推定量が許容的及び準許容的であるための必要十分条件が,タウバー型定理を用いて3.2節で与えられている。従って,目標は,許容性の条件をみたす一般化ベイズ推定量がミニマクスになるための条件を求めることになる。このことが3.3節で議論される。従来提案されてきた多くのミニマクス推定量は,技術的な問題から単調増加な縮小関数に限られてきた。ただし例外はAlam(1973)の推定量であり,縮小関数は最初単調に増加し途中から単調に減少してある定数に収束している。本論文での1つの主張は,より一般的な事前分布を用いてAlamの推定量を拡張し,ミニマクスになるためのより一般的な条件を与えていることである。縮小関数の単調性がなくなるためミニマクス性の条件の導出は技術的な困難さを伴うが,合流型超幾何関数の性質を用いて証明を組み立てることによって十分条件の導出に成功している。またより明快な条件を与えるための別証明の方法も与えられている。結局,このミニマクス性の条件と上述の許容性の条件とを組み合わせることによって,極めて広い許容的ミニマクス推定量のクラスが構成されている。

 3.3節で注目されるもう1つの点は,Stein(1973)によって提案された一般化ベイズ推定量に対して,その許容性及びミニマクス性の条件の解析的導出に成功したことである。この推定量は,原点に退化した確率をもつ分布と通常の絶対連続な分布の混合分布を事前分布とする一般化ベイズ推定量であり,Efron and Morris(1976)の論文においてもその推定量の良さが指摘されている。しかし,縮小関数に単調性がないため,ミニマクス性についての議論は全くなされてこなかった。本論文では,縮小関数の性質が解明され,混合分布の重みの付け方によって,(1)単調増加する場合,(2)最初単調に増加し途中から単調に減少してある定数に収束する場合,(3)最初単調に増加し途中から単調に減少し,また再度単調に増加してある定数に収束する場合,があることが示されている。このような縮小関数をもつSteinの一般化ベイズ推定量が実際ミニマクスになるための条件,特に混合分布における重み付け定数についての条件が解析的に与えられており,許容的ミニマクスになるための条件が明らかにされている。

 Steinの一般化ベイズ推定量の興味深さは,James-Stein推定量を改良する可能性を有している点にある。James-Stein推定量を改良する許容的推定量はKubokawa(1991)によって示された推定量のみが知られているが,この推定量の欠点は原点ではJames-Stein推定量と同じリスクの値になっていることであり,Steinの一般化ベイズ推定量は,James-Stein推定量を改良しかつ原点で十分な改良を与える許容的な推定量になっている可能性をもっている。しかし,数値的にはその可能性が示唆されるものの解析的に示すことは現段階では困難である。3.4節では,James-Stein推定量を改良する他の滑らかな推定量が求められ,その性質が論じられている。特に提案されている推定量の一般化ベイズ性が検討され,擬ベイズになっているもののベイズ解にはなっていないことが示唆されており,この種の問題は未解決のまま残されている。

 本論文のもう1つの主張は,多変量正規一尺度混合分布の平均ベクトルの推定における許容的ミニマクス推定量の導出であり,第4章で議論されている。多変量正規分布の平均ベクトルの同時推定におけるStein問題は,多次元球面対称分布における平均ベクトルの同時推定へと拡張され,最小2乗推定量の非許容性がより一般的な分布族の下で示されてきた。しかし許容的ミニマクスな推定量の構成については,全く知られてこなかった。Strawderman(1974)が,多変量正規-尺度混合分布の平均ベクトルの推定において一般化ベイズ推定量を導出し,そのミニマクス性を示した。この分布族は,多変量正規分布や多変量t-分布を含む球面対称な分布のクラスを構成している。本論文では,この分布族において許容的ミニマクス推定量の導出に成功している。そのために,まず可積分な事前分布を想定し,それに対するベイズ推定量を導出する。尺度分布として一般的な密度関数を考えているが,本論文ではそのベイズ推定量が縮小関数を用いて簡便な形に表現できることを示しており,そのことが,ベイズ推定量のミニマクス性の証明を比較的容易にしている。

 ミニマクス性の条件は,Berger(1976)によって与えられたものが知られてきたが,この条件は縮小関数の単調性に関してより制限的な仮定が付加されており,そのためミニマクスになるためにはより強い制約が課されてしまい,その結果,許容性の条件とミニマクス性の条件の共通集合が空になってしまう。そこで,まずミニマクス推定量について他のクラスを構成することから始めている。これは,縮小関数の上限についての条件を強くすることによって,縮小関数の単調性に関する制限的な仮定を外すことを可能にするクラスである。次に,上述のベイズ推定量がこうして求めた新たらしいクラスの中に入るような条件をFKG不等式を用いることによって求めており,その結果,許容性とミニマクス性を併せ持つ推定量のクラスが存在することが示され,具体的なその範囲が図示されている。また多変量正規-尺度混合分布の例として多変量t-分布を扱い,その平均ベクトルに対して許容的ミニマクス推定量のクラスを与えている。

 [評価]

 本論文の主要な結果は,

 (A)多変量正規分布の平均ベクトルの同時推定問題において,Alam-Maruyama型一般化ベイズ推定量に対して,許容性とミニマクス性の広い条件を導出したこと

 (B)同じ推定問題において,Stein型一般化ベイズ推定量の許容性とミニマクス性の条件を導出したこと

 (C)多変量正規一尺度混合分布族において,平均ベクトルの許容的ミニマクス推定量を導出したこと

である。Stein問題に関する理論展開は1970年代に活発になされ,分布族や損失関数の拡張,許容的ミニマクス推定量の導出などがなされた。その頃導出された許容的ミニマクス推定量の多くは単調な縮小関数を持っており,単調でない縮小関数にまで拡張することは技術的困難さを伴うため,その後20年近くこのような研究はなされてこなかった。唯一の例外は,Alam(1973)によって与えられた一般化ベイズ推定量であるが,証明方法が複雑であり,その後の拡張への興味を失わせる内容であった。本論文の主要結果(A)及び(B)は,この問題に対して挑戦的に取り組み優れた理論的解析結果を与えており,ほぼ四半世紀の間未解決であった問題を解決した優れた成果であると評価される。特に,Steinの一般化ベイズ推定量については,その良さがEfron and Morris(1976)の論文の中で示唆されているにもかかわらず,縮小関数の非単調性の故に従来の理論結果を適用することができず,未解決問題として手が着けられないままであった。(B)は,その問題に対して理論的解決を与えており,高く評価される内容である。

 多変量正規一尺度混合分布族は,尺度分布に任意の密度関数を想定しており,その関数の取り方に応じて多変量正規分布から多変量t-分布まで裾の薄い分布から厚い分布まで含んでいる。従って,このような分布族においてベイズ解の性質を論じ許容的ミニマクス推定量を理論的に導出することは,解析上困難であろうと予想される。このような常識を破ったのが上述の成果(C)であり,その証明の過程では,いくつかの工夫や試行錯誤が展開されている。1つは,一般化ベイズ推定量が縮小関数を用いて正規分布の場合に対応する形に変形できることが示されたことである。またミニマクス推定量のクラスについても,Berger(1976)により与えられた従来のクラスでは許容的ミニマクス推定量が得られないことを指摘し,ベイズ推定量が入るようなクラスを新たに構成している。このような工夫の上で(C)の成果が得られており,得られた結果とともに著者の深い洞察と挑戦的精神が評価されるであろう。

 著者が単調な縮小関数をもつ一般化ベイズ推定量から非単調な縮小関数をもつ許容的ミニマクス推定量の導出への拡張を試みた理由を考えてみると,James-Stein推定量及び打ち切り型James-Stein推定量が非許容的であることが知られているが,それらを改良する許容的推定量の導出が決定理論上最も興味深い問題であり,その解は単調な縮小関数をもつ一般化ベイズ推定量の範疇では得られず,非単調な縮小関数をもつクラスへの拡張が必須であったと考えられる。その意味では,本論文ではその最終目標を達することができておらず残念に思われる。しかしこれは極めて困難な問題であることが認識されており,本論文で提案された許容的ミニマクス推定量のJames-Stein推定量に対する優越性などが将来示されることを期待したい。また本論文は理論的成果を中心にまとめているが,扱われている問題は標本調査統計の分野における小地域推定などにおいて安定化された有効な推定手法を導出するために有用であり,今後このような応用例への適用についても取り組まれることが望ましいと思われる。回帰分析において多重共線性が存在するときに安定化された推定法としてリッジ回帰推定法が知られているが,縮小推定法はこのリッジ回帰推定法とも関係している。このような点から,回帰分析,主成分分析,因子分析など統計的多変量データ解析における様々な問題への応用なども今後検討してほしいと思う。

 以上述べてきたように,本論文は,いくつかの要望点はあるものの,博士論文としては高いレベルの研究を達成したものと認めることができ,審査委員会は申請論文が博士(経済学)の学位にふさわしいものと評価する。

UTokyo Repositoryリンク http://hdl.handle.net/2261/37485