学位論文要旨



No 124352
著者(漢字) 岡田,謙介
著者(英字)
著者(カナ) オカダ,ケンスケ
標題(和) ベイズ推定による多次元尺度構成法の拡張
標題(洋) Extensions of Bayesian Multidimensional Scaling
報告番号 124352
報告番号 甲24352
学位授与日 2009.03.23
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第875号
研究科 総合文化研究科
専攻 広域科学専攻
論文審査委員 主査: 東京大学 教授 繁桝,算男
 東京大学 教授 陶山,明
 東京大学 准教授 石垣,琢磨
 東京大学 准教授 倉田,博史
 東京大学 准教授 村上,郁也
内容要旨 要旨を表示する

1.研究の背景(第1 章)

本博士論文ではベイズ推定による多次元尺度構成法(multidimensional scaling)モデルを取りあげ、これについてのいくつかの方法論的拡張とその評価、および実データへの適用を行った。多次元尺度構成法は非類似度・類似度のデータを入力として低次元空間での対象の布置を得る統計手法であり、Torgerson (1952)によって確立された。他の多くの統計手法と同様、この方法は当初最小二乗法の考え方に基づくものであった。その後Kruskalの非計量多次元尺度構成法をはじめ多くの方法論的拡張ならびに応用研究が行われてきたが、現在でも依然として最小二乗推定に基づくモデルが主流である。しかし最小二乗推定には、(とくに計量的モデルにおいて)誤差を含むデータに対して頑健でない、拡張性に乏しいといった欠点がある。最尤推定を用いた多次元尺度構成も提案されているが、局所最適解の問題もあり、主要な統計パッケージには依然実装されていない。

近年、Oh & Raftery (2001)によってベイズ推定による多次元尺度構成法が提案された。この方法は観測誤差を測定モデルに内包しており、シミュレーション研究においても既存の方法より二乗誤差を小さくでき、拡張性の面でも優れているなどよい性質をもっている。そこで本研究では、このベイズ推定による多次元尺度構成法を拡張して、Minkowski 距離を扱うモデル(第2 章)、多次元展開法モデル(第3 章)、および確認的モデル(第4 章)を提案し、それぞれ数値シミュレーションによる手法の評価および実データへの適用を行った。また、この方法を応用研究者が手軽に実行するためのフリーソフトウェアを開発し、インターネット上で公開した(第5 章)。

2.Minkowski 距離を用いたベイズ推定による多次元尺度構成法(第2 章)

本章では、ベイズ推定による多次元尺度構成法を拡張し、Minkowski 距離を扱うことを可能にした。心理学研究では、古くから多次元尺度構成法を用いた心理的空間のモデリングが行われてきた。多次元尺度構成法では多くの場合ユークリッド距離を用いて対象間距離が測られるが、ユークリッド距離とはMinkowski 距離の特殊な場合(Minkowski 指数=2の場合)であり、ほかにも同指数1 の場合の市街地距離などが心理学的見地から重要とされる。多次元尺度構成法でデータの最適なMinkowski 指数を探る方法としては、Kruskal(1964)以来長らくMinkowski 指数の値を網羅的に設定して分析を繰り返し、最もストレス(観測非類似度とモデル距離との二乗誤差を標準化した指標)が小さくなるMinkowski 指数の値を求めることが行われてきた。しかし、この最もよく知られた応用のひとつであるEkman (1954)の色の類似度データの既存の分析では、ストレスが正しく最小化できていない可能性があった。そこで、本章ではまず古典的な多次元尺度構成法モデルに新しい最適化方法を適用してこのデータを再分析し、やはり既存の研究でストレスが最小化できていなかったこと、新しい最適化法を用いれば理論的に導かれるMinkowski 指数1 の場合と∞の場合のストレスの等値性が得られることを示した。

しかし、依然こうしたアプローチにはいくつかの問題が残る。たとえば、ストレスの定義には様々なものが知られているので、あるストレス(多くの場合ストレス‐1 と呼ばれる指標)を最小化するMinkowski 指数をもって真のMinkowski 指数(の推定値)と考えてよいのかという問題がある。また、そもそも異なるMinkowski 指数が設定された異なったモデルのよさを、ストレスで評価できるのかという問題もある。

近年、Lee (2008)はMinkowski 指数を様々な値に固定して何度も分析を繰り返すのではなく、これをパラメータとして扱ってベイズ推測を行う方法を提案した。こうしたアプローチは先行研究の問題点を改善するため有望と考えられるが、彼の方法は一様分布を多く使うなど特殊なモデルを用いており、またシミュレーションによる手法の評価も行われていなかった。そこで、この方法を用いて真のモデルからデータを発生させMinkowski 指数を推定するシミュレーション研究を行ったところ、推定値に大きなバイアスがあることがわかった。

そこで、本研究ではMinkowski 指数をパラメータとして扱うという考え方は継承しつつ、既存のベイズ推定による多次元尺度構成法モデルをシンプルにMinkowski 距離へと拡張することにより、安定した推定のできる方法を提案した。提案手法では同様のシミュレーションにより正しいMinkowski 指数を復元することができた。また、Ekman のデータにおいて本手法を用いた分析を行ったところ、Minkowski 指数=1.7 付近の値が事後推定値として得られた。この結果はストレスの最小化を用いた場合の推定値とほぼ一致するものであった。

3.ベイズ推定による多次元展開法(第3 章)

本章では、多次元展開法の問題に対してベイズ推定によるモデルを構築した。展開法は典型的には複数の評定者が複数の対象について評定を行ったデータに対して、評定者と対象の双方を同じ低次元空間上に布置する統計手法である。この展開法のモデルは、(評定者+対象)×(評定者+対象)という大きな非類似度データにおいて、(評定者×評定者)の部分のデータおよび(対象×対象)の部分のデータが欠損した場合の、欠測を含む多次元尺度構成法としてとらえることができる。こうした欠測は、データ拡大法(data augmentation)のアルゴリズムによってマルコフ連鎖モンテカルロ(Markov chain Monte Carlo, MCMC)法を用いたベイズ推定で扱うことができる。したがって、本研究ではベイズ推定による多次元尺度構成法モデルにデータ拡大法を組み合わせることにより、ベイズ推定による多次元展開法を提案した。多次元展開法にベイズ推定を用いたのは本研究が初めてである。

手法の評価としては、Green & Carmone (1970)の提案に基づいて「A」「M」を構成する33 点のうち、「A」に含まれる点と「M」に含まれる点の間の距離だけが観測されている(「A」の点どうし、「M」の点どうしの距離は欠測とする)状況から布置を復元するシミュレーション研究を行い、正しく元の布置が復元できることを確認した。つづいて実データの解析を行ったが、ここでは既存の多次元展開法アルゴリズム・ソフトウェアであるALSCAL,PREFSCAL と提案手法との比較を行った。各種ストレスおよび相関係数に基づく評価から、提案手法はALSCAL よりも優れ、PREFSCAL と同等または僅かに優れた成績を収めた。またALSCAL およびPREFSCAL では推定誤差を扱えないため、推定誤差も得られる点においても本手法が優越しているということができる。

4.ベイズ推定による確認的多次元尺度構成法(第4 章)

統計手法は探索的方法と確認的方法とに大別される。両者は両輪のように密接な関係にあり、データから有意義な情報を取り出すためには双方の発展が不可欠である。心理学研究において多次元尺度構成法と並んでよく使われる多変量解析法である因子分析・共分散構造分析においては、確認的方法が探索的方法と並んでよく発展している。しかし、多次元尺度構成法では、確率モデルを用いた確認的方法が相対的に未発展であった。ある種の制約付き推定を行う方法を確認的多次元尺度構成法と呼ぶ場合はあったが、このアプローチは単純な制約・重み付きの多次元尺度構成法にすぎず、推測統計学的なモデルの評価・比較などができなかった。そこで本章では、ベイズ推定を利用して距離行列に構造がある場合の確認的多次元尺度構成法を提案した。この方法では、あらかじめ距離行列への不等式制約が事前仮説としてある場合、MCMC 法における繰り返し毎に距離行列で不等式制約が成立するか否かを検討し、制約しない場合はその繰り返しを棄却する。こうして制約が満たされる場合のMCMC 標本のみを用いて事後分布を構成することにより、条件付き事後推定を行うことができる。またこの方法では制約を導入しないモデルと導入したモデルでのベイズ比(Bayes factor)を計算することができ、これを用いて導入した制約を定量的に評価・確認することができる。

本手法を用いて、まずシミュレーション研究により正しいモデルを正しいと評価できること、および誤ったモデルを誤りと評価できることを確認した。続いて多特性・多評定者(multitrait multi‐informant)データへの応用を行った。

5.ソフトウェアの開発(第5 章)

本章では、ベイズ推定による多次元尺度構成法の分析を行うためのプログラムの開発と公開を行った。統計的手法は方法論であり、実際に心理学研究のためにデータ解析を行う研究者によって利用され、新たな知見を得られてこそ意味がある。例えば共分散構造分析の今日の発展を支える要因として、Amos などの使いやすいソフトウェアの果たした役割は大きいと考えられる。これまでベイズ推定による多次元尺度構成法を実行できるフリーのプログラムは存在しなかったため、フリーの統計環境R 上で動作するベイズ推定による多次元尺度構成法プログラムを公開した。本プログラムの関数仕様はAppendix B に示した。

6.まとめと議論(第6 章)

本研究では、ベイズ推定を用いた多次元尺度構成法を方法論的に拡張する3 つの研究、およびソフトウェアの開発と公開を行った。本研究ではMinkowski 距離への拡張や確認的モデルの推定などにおいてベイズ推定の特徴を生かした多次元尺度構成法の拡張を行うことができた。

MCMC 法を用いたベイズ推定は、しばしばその時間的コストが欠点として指摘される。しかし、本研究で行った分析に要する時間は短いものでは数十秒を要するのみである。また、ムーアの法則として知られるように計算機の性能は指数関数的成長を過去数十年にわたって続けており、今後も計算機性能の躍進が続くことを考えると、将来的にベイズ推定の重要性はさらに増していくと考えられる。

審査要旨 要旨を表示する

多次元尺度構成法は、複数の対象間の類似度もしくは非類似度データを入力とし、多次元連続体上に対象を位置づける多変量解析の手法である。歴史的には、多次元尺度構成法は心理学的尺度構成法に関する研究から生まれた経緯がある。心的現象の多くは物理的現象と異なり量的に取り扱うための方法が自明でないが、これを量的に取り扱うことを可能にする方法の体系が心理学的尺度構成法である。多次元尺度構成法は、1 次元の尺度構成法の多次元データへの拡張として半世紀ほど前に確立した。本論文ではこうした歴史に鑑み、主に心理学および社会科学分野への適用を念頭に入れた多次元尺度構成法のいくつかの現代的拡張を提案している。

本論文でなされた多次元尺度構成法の拡張は、いずれもベイズ推定を用いたものであることに特色がある。ベイズ推定は事前確率とデータから得られた尤度とを組み合わせて未知母数の事後推定を行う方法論であり、理論的美しさと実用性を兼ね備え近年注目を集めている。ベイズ推定では多くの場合実行困難な高次の積分計算が頻出するが、本論文ではマルコフ連鎖モンテカルロ法に基づく数値的方法によりこの問題を解決している。

本論文は5 章より構成される。第1 章では多次元尺度構成法の歴史と特徴、および先行研究でのベイズ推定による多次元尺度構成法モデルが説明されている。以降、ベイズ推定による多次元尺度構成法の拡張として、Minkowski 距離を扱うモデル(第2 章)、多次元展開法モデル(第3 章)、および確認的モデル(第4 章)の提案とその評価について述べられている。また第5 章ではこの手法を応用研究者が手軽に実行するためのフリーソフトウェアが開発について説明されている。第6 章では全体をまとめ、全体的討論を行っている。

第2 章では、Minkowski 距離を扱うためのベイズ推定による多次元尺度構成法の拡張が提案された。心理学にはMinkowski 距離を用いて心理的空間をモデリングする長い研究の歴史がある。この分野で長らく使われてきた方法論は、Minkowski 指数の値を網羅的に設定して分析を繰り返し、ストレス、すなわち観測された非類似度とモデル距離との二乗誤差を標準化した指標がもっとも小さくなるMinkowski 指数の値を求めることであった。本論文では、まずこの枠組みの中で新しい最適化法を用いた再分析を行い、既存の研究でストレスが最小化できていなかったこと、新しい最適化法を用いれば理論的に導かれるストレスの等値性が確認されることを示した。続いて、ベイズ推定によるMinkowski 指数の推定という新たな枠組みの研究をおこなった。これについては1 本の先行研究があったが、シミュレーション研究により先行研究の方法では推定値に大きなバイアスを生じていることが示された。そこで、ベイズ推定による多次元尺度構成法モデルをMinkowski 距離へと拡張することにより、安定した推定のできる方法が提案された。この方法は、シミュレーション研究および実データ解析でよい性質を示した。

第3 章では、ベイズ推定による多次元展開法の手法が提案された。展開法は典型的には複数の評定者が複数の対象について評定を行ったデータに対して、評定者と対象の双方を低次元の同じ空間上に布置する統計手法である。この展開法のモデルは、欠測を含む多次元尺度構成法モデルとして再定義できる。本論文ではこのことを利用し、データ拡大法(data augmentation method)のアルゴリズムを用いて欠損値を処理することで、ベイズ推定による多次元展開法を実現する方法が提案された。シミュレーション研究により提案手法は正しく布置座標の復元ができることが示された。また、既存の多次元展開法手法との比較を行ったところ、点推定値の精度は既存の方法と同等もしくはそれ以上であり、かつ提案手法では推定誤差も正確に推定できる利点があることが示された。

第4 章では、ベイズ推定による確認的多次元尺度構成法が提案された。統計手法は探索的方法と確認的方法とに大別することができるが、心理学研究において多次元尺度構成法と並んでよく使われる因子分析と比較すると、多次元尺度構成法では確認的手法が未整備であった。そこで本論文では、ベイズ推定を利用して距離行列に構造がある場合の確認的多次元尺度構成法モデルが提案された。ベイズ比を用いることでモデルが評価され、これにより構造を定量的に評価することが可能になった。シミュレーション研究により本提案手法が正しくモデル構造を判定することが示され、また多特性・多評定者データへの適用例が示された。

第5 章では、R 言語を用いたベイズ推定による多次元尺度構成法の分析を行うためのプログラムの開発と公開について述べられている。優れた統計学的方法論が提案されてもソフトウェアの不在のために実際の分析では使われないという例は多いが、本章の成果により応用研究者は無償でベイズ推定による多次元尺度構成法による分析を行うことができる。

本論文はベイズ推定による多次元尺度構成法という新しいテーマに取り組み、複数の有用な拡張を行った優れた研究報告であると言える。各章はベイズ推定による多次元尺度構成法の拡張という点では共通するが、実際に扱った問題やモデルは各章ごとに異なり、各章それぞれがその独自性を持つものとなっている。現在、計算機能力は飛躍的向上を続けており、数値的方法を用いたベイズ的方法論は今後ますます有用性が高まっていくと期待されるが、実際に応用研究者が使うことのできるソフトウェアの開発・公開を行い、実際の問題解決のために利用できるようにした点も高く評価できる。

これらの成果により、本論文は博士(学術)の学位に値するものであると審査員全員が判定した。なお、第2 章の研究はNew Trends in Psychometrics、第5 章の研究はApplied Psychological Measurement 誌にそれぞれ掲載されている。

UTokyo Repositoryリンク