著者(漢字) 松下,幸敏
著者(カナ) マツシタ,ユキトシ
標題(和) 操作変数の数が大きい場合の構造方程式モデルの推定と検定
標題(洋) Estimation and Testing in a Structural Equation Model with Possibly Many Instruments
学位授与日 2006.03.23
学位種別 課程博士
学位種類 博士(経済学)
学位記番号 博経第204号
研究科 大学院経済学研究科
専攻 経済理論専攻
論文審査委員 主査: 東京大学 教授 國友,直人
 東京大学 教授 林,文夫
 東京大学 教授 矢島,美寛
 東京大学 教授 久保川,達也
 東京大学 助教授 大森,裕浩
Statistical inference procedures in structural equation models are known to have poor finite sample properties in several contexts. It has been known that if instruments are only weakly correlated with the endogenous variables, classical normal and chi-square asymptotic approximations to the finitesample distributions of GMM and IV statistics can be poor. In addition, in recent microeconometric applications some econometricians have used many instrumental variables in estimating an important structural equation. One empirical example of this kind often cited in econometric literatures is Angrist and Krueger (1991), where they used 178 instruments in one of their specifications.If the number of the instrumental variables is large efficiency can be improved, but it makes the usual inference procedures inaccurate.

Recently, the problems of weak and many instruments have received increased attention by theoretical and applied researchers. Nelson and Startz (1990a,b), using a short sample and single instrument, showed that the distribution of the Two-Stage Least Squares (TSLS) estimetor can be strikingly nonnormal, biased seriously in the direction of the Ordinary Least Squares (OLS) estimator. On the other hand, Bound, Jaeger, and Baker (1995) showed that the properties of the TSLS estimator can be poor in the face of many weak instruments even when the sample size is huge, by analyzing the properties of TSLS in the context of Angrist and Krueger's (1991) regression of wages on education and exogenous variables.

In this thesis, several alternative asymptotic approximations are developed to improve the finite sample properties on the estimation and testing problems with possibly many instruments.

First, we focus on the finite sample properties of estimators. A method of asymptotic expansions of the distributions of a class of semi-parametric estimators is developed. (Chapter 3) To estimate the coefficients of a single equation in econometric models, GMM has been quite popular in the past two decades. In addition, the method of Empirical Likelihood (EL) is one of the alternatives which have been proposed recently, and has gotten some attention in the statistical and econometric literatures. It is shown that, under some conditions, the resulting formulas of the maximum empirical likelihood (MEL) estimator and the generalized method of moments (GMM) estimator are identical to those for the LIML estimator and the TSLS estimator respectively, except one term depending on the fourth order moments of the disturbances.

The distributions of the four different estimators (LIML, TSLS, MEL, GMM) of one endogenous variable are evaluated numerically in Chapter 4. Since it is quite difficult to obtain the exact densities and cdf's of these estimators, the numerical information makes possible the comparison of properties of alternative estimation methods. Again, it is shown that the relation of the exact distributions of the MEL estimator and GMM estimator are quite similar to that of the distributions of the LIML and TSLS estimators. The distribution of the MEL estimator approaches normality faster than the distribution of the GMM estimator, and is centered at the parameter value in all cases. However, the tail of the distribution of the MEL estimator is relatively long, especially when the instruments are weak. The distribution of the GMM estimator is, on the other hand, less spread out, but can be seriously skewed when the number of the instruments is large.

In Chapter 5, we consider the testing problems when a large or moderate number of instruments are available. We develop an alternative approximation theory, "large K-asymptotics", allowing the number of instruments to grow with the number of observations. The properties of t-ratio statistics are explored under the large K-asymptotic theory. A modified t-ratio statistic from the asymptotic expansion is also proposed. It is shown that when the number of the instruments is large, the null distribution of the standard t-ratio is skewed and extremely deviated from the normal distribution. The null distribution of the large K t-ratio is closer to the normal distribution than the standard t-ratio, but still skewed and size distortion can be large for the one-sided test. The null distribution of the modified large K t-ratio is closest to the standard normal distribution. In addition, the power of the large K t-ratio test is shown to dominate the other test, and the difference is substantial when the instruments are weak. When we know the sign of parameter from the economic theory, use of the modified large K t-atio statistic is recommended as a more accurate test procedure.

Finally, we make an asymptotic expansion of the distribution of the likelihood ratio (LR) statistic under the null hypothesis H0:β=β under normality, and propose a modification of the LR test.(Chpater 6) The comparison of this modified LR test are made with Moreira's conditional likelihood ratio test and the large K t-test by Monte Carlo experiments. The Monte Carlo experiments show that, when the instruments are weak, the size properties of the LR test become quite poor, and the modified LR (LRm) test improves upon the LR test when the number of the instruments is small and δ2/K2 is more than one. However, both the modified LR test and the Moreira's CLR test can be size distorted when the number of the instruments is large. The large K t-test has the best size properties when the number of the instruments is large and δ2/K2 is more than one.

この論文は、計量経済学分野で近年になり再びかなりの関心の持たれている同時方程式や構造方程式の統計的推測問題を扱っている。計量経済学では同時方程式に関する統計的推測問題は1950 年代〜1980 年代に研究が行われ、それが古典的な標準的理論として定着し、しばらく研究活動が下火になったという経緯がある。ところが、近年になり主として応用経済学における計量分析の興隆とともに、国際的規模において統計理論的な研究活動が再び盛んになりつつある。本研究もそうした近年の研究動向の中で重要な一石を投じる新しい研究成果と位置づけることができよう。例えば労働経済学などをはじめとして多くの応用経済学分野の研究では、大規模なクロスセクション・データの解析や計量分析が重要な位置を占めるようになってきている。こうした応用経済学において行われている近年での実証研究ではしばしばデータ数(観測数) はかなり多くなることがあるが、同時にかなりの数の操作変数(instrumental variables) を用いられることも少なくない。こうした、多くのデータ(観測数) が利用可能でありかつ多くの操作変数が利用可能な状況における構造方程式や同時方程式の推測問題をどの様な統計的方法を利用したらよいかという解答を与えることが本研究の主要な目的である。


次に第二章では本論文で考察する構造方程式の定式化と構造方程式の統計的推定法を説明している。本論文では計量経済学における伝統的なパラメトリック推定法として制限情報最尤法(LIML)、二段階最小二乗法(TSLS) を扱うが、さらにセミパラメトリック推定法として一般化積率法(generalized method of moments 、略してGMM) 及び最大経験尤度法(maximum empirical likelihood method 、略してMEL) を扱っている。経験尤度法はOwen (1990) がノンパラメトリックな信頼区間の構成法として提案したが、その後Qin-Lawless (1994) が推定方程式の推定問題に適用できることを示してから計量経済学においても関心が持たれるようになっている。計量経済学における同時方程式や構造方程式は統計学における推定方程式として解釈可能であり、例えば計量経済学においてGMM と言う名前でよく知られている方法は統計学におけるGodambe の推定方程式論と本質的に同一であると見なせることを指摘し、さらに経験尤度法(empirical likelihood method) の概要を解説している。なお、本論文で扱っている4つの統計的推定法はいずれも単一方程式法、あるいは制限情報推定法である。近年の計量経済学では操作変数が多く存在する場合において操作変数の質が問題となり、しばしば「弱操作変数(weak instruments) 」が議論されているが、こうした近年における研究動向についても解説している。さて、本論文では統計的漸近理論が一つの主要な分析手段であるが、統計学の標準的教科書等で説明されている伝統的な大標本理論(large sample asymptotic theory) の他に、操作変数の数が大きい場合には多操作変数理論(large-K2 asymptotic theory 、あるいはmany instruments theory) を考察する重要性を強調し、その内容の概要を説明している。

本論文の主要な部分は、三章から六章で展開されている4つの論文から構成されている。前半の2つの章では同時方程式・構造方程式における母数の統計的推定法に関する理論的結果(それぞれ漸近理論及び有限標本論からの結果)を説明している。後半の2つの章では同時方程式・構造方程式に表れる母数に関する統計的検定問題(それぞれt 検定統計量と尤度比統計量に関する結果)を扱っている。ここで各章の内容は次のように要約できる。

第三章では構造方程式における母数の推定量の分布の漸近展開を導いている。構造方程式の推定量については、しばしば近年の研究でも形式的に期待値やMSE (Mean Squared Errors 、平均二乗誤差) など積率(moments) やその漸近展開などを比較することなどが行われている。しかしながら、例えば古典的な研究(Mariano-Sawa (JASA 1972)) によりLIML 推定量について(一定の仮定の下で)期待値が存在しないことが証明されおり、期待値やMSEなどの積率により推定方法を比較することは不十分であると云える。そこでこの章では(一定の仮定の下で)推定量の厳密な分布関数の漸近展開を導いている。こうした統計学的に厳密な結果は(一定の仮定の下とは云え)特にGMM 推定量とMEL 推定量についてこれまで皆無であったと思われるので極めて興味深い。ここで得られた結果は、1980 年代初頭にAnderson, Sawa, Morimune, Kunitomo 等の研究により得た結果のセミパラメトリックな状況への一般化になっている。本章で導かれた漸近展開は新しい結果と考えられるが、通常の漸近理論を用いた推定量の高次の性質を調べる上で有用であると判断できよう。

第四章では構造方程式における母数の推定量の精密分布についての検討結果をまとめて議論している。同時方程式の場合には線形構造方程式のようなごく簡単な場合でも、推定量の精密分布は複雑になることが知られており、その分析は極めて困難である。本章ではAnderson-Kunitomo-Sawa (1982) がTSLS 推定量とLIML 推定量の比較のために利用したシミュレーションに基づく分布関数の評価方法を用い、新たにGMM 推定量及びMEL 推定量の分布を正確に評価している。この方法の特長は計算誤差が極めて小さいことが、精密な分布関数が得られている場合には既に知られている。これに対して近年の研究でもしばしば利用されているモンテカルロ実験の平均値やMSE は(積率の非存在等のことから) 必ずしも信頼できるものではないので、本章の内容も注目すべき結果を与えていると考えられよう。本章での重要な知見として、GMM 推定量の分布はTSLS 推定量の分布に極めて近く、MEL 推定量の分布はLIML 推定量の分布に極めて近いことを報告している。このことは近年の研究でGMM 推定とMEL 推定の比較が焦点の一つであるので重要な知見と判断されよう。

第五章では構造方程式における母数の検定問題を議論している。ここで扱っている検定問題については、Anderson-Rubin (1949) が提案した古典的な統計量(AR 統計量) が古典的方法として知られていたが、操作変数の数が多くなると検出力が弱くなることがこれまでの研究で明らかとなっている。そこでAR 検出量を改善する観点より、近年になりKleibergen の統計量とMoreira の統計量(条件付尤度比統計量)が代替する検定統計量として脚光を浴びている。本章では多操作変数理論によりt 検定統計量の精密分布の漸近展開を行い、実はt-検定統計量を修正した修正t-統計量が既存のよく知られている統計量よりも遙かに検出力がよいことを示している。本章で扱っているt-統計量は極めて容易に計算ができることもあり、本章の結果は今後の理論分析及び実証分析にも大きなインパクトがあると考えられる。

最後の第六章では検定統計量として尤度比統計量の精密分布の漸近展開を導いている。この章の内容はKunitomo-Morimune-Tsukuda (1983) 及びMorimune-Tsukuda (1985) などの先行研究の拡張になっている。特に操作変数の数が多い場合には、尤度比統計量よりもt-統計量の方がよい性質を持っているという結果は、本章で説明している漸近展開がオリジナルであると云うにとどまらず、極めて興味深い結果となっている。操作変数が弱い場合には識別性の条件がデータ上では弱いためと解釈されよう。


本論文はこれまで松下氏が博士課程に在学中に一貫して追求している計量経済学における構造方程式の統計的推測問題に関する理論的研究の結果をまとめたものである。近年の計量経済分析で特に注目を浴びているGMM 法やMEL 法などの統計的推定方法の性質を精密に検討し、推定方法と検定方法についてかなりの新しい結果を導いている。こうした計量経済学の統計的方法に関する理論的研究は、応用経済学における実際的な計量経済的分析と深く結びついており、応用上でも大きな意味のある独自の貢献がかなりあると高く評価できる。この論文で扱われている様々な問題は近年の計量経済学分野においてそれぞれかなり重要な問題であるが、そうした問題について注目すべき独創的な結果を導いたことは松下氏の力量を示すものとなっている。


第三には、近年のミクロ応用経済学の分析では、本論文の各章において議論されている統計的方法、例えば一般化積率法(GMM) が標準的手法として広汎に用いられていることも重要である。本論文の結果は幾つかの重要な点に置いて、計量経済学の標準的教科書で説明されているGMM 推定法に関する常識的議論について再考を迫るものがある。特に、t 検定に関する本論文の理論的結果は理論的結果とともに応用上に意義深いので、今後にかなり研究方向にもインパクトがあると判断される。






