学位論文要旨



No 126387
著者(漢字) イスラム カジ サイフル
著者(英字)
著者(カナ) イスラム カジ サイフル
標題(和) 未知の空間変数探索に基づくヘドニック回帰分析の精度向上 : 発見的探索法
標題(洋) Improvement of hedonic regression based on unknown spatial variable search : heuristic search approach
報告番号 126387
報告番号 甲26387
学位授与日 2010.09.27
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第7350号
研究科 工学系研究科
専攻 都市工学専攻
論文審査委員 主査: 東京大学 教授 浅見,泰司
 東京大学 教授 清水,英範
 東京大学 准教授 貞広,幸雄
 東京大学 准教授 羽藤,英二
 東京大学 准教授 丸山,祐造
内容要旨 要旨を表示する

欠落変数問題は学問上特に新しい問題ではない。しかし、空間変数に着目した場合には、比較的新しい問題である。多くの未観測空間要因が回帰分析に影響を与える可能性がある。地理情報システムやリモートセンシングなどの技術革新の進展に伴い、小地域においても詳細なデータを取得することが可能になってきた。空間データにおいて空間特徴が急速に増え、「すべての物はすべての物と関係している…」というトブラーの地理の第一法則により空間変数の数はほぼ無限に増えつつある。このような問題は対象地域の地理的な範囲を限ることで多くの影響要因をコントロールし、部分的には回避できる。あるいは、データ数が多ければ、非常に多くの説明変数を導入することで様々な影響をコントロールすることができるかもしれない。しかし、変数を増やすことは単にモデルを煩雑にするだけでなく、変数をコントロールすること自体も複雑にしてしまう。さらに、変数を増やすと自由度が減り、モデルの説明力にも影響を与える。

またさらに、空間モデルのすべての変数を的確に捉えることは事実上不可能である。場所の快適性、建築の質、道路のアクセス、文化遺産、近隣のブランド性などの潜在的変数は、観察し、モデルに加えることが難しいことも多々ある。潜在クラス分析によりこれらの変数を推定することも可能になったが、モデルに欠けている特定の変数を同定することは非常に難しい。空間モデルに欠落変数の存在はつきものである。ただ、すべてめ変数がモデルに重大な問題をもたらすわけではない。一部の変数は大きな空間的関係性を持つために、探索できる可能性がある。

本研究ではヘドニック回帰を主に扱う。非空間的なヘドニック回帰分析において、モデルが完全であるならば、エラーがなぜ生じるかについて何ら手がかりを残してくれない。エラーの生じる理由についてよく研究されているのは、独立変数間の相関とデータの不均一性問題である。どの理由がどの程度の誤差の要因になっているかを明らかにすることはできない。そこで、本研究では局地的な変数が欠落することでヘドニック回帰の誤差が増加し、いくつかの変数を追加することで誤差項が顕著に減少し、モデルの適合性が良くなる状況を仮定する。

ヘドニック回帰分析では、不均一性問題に十分な対処ができないことがしばしば問題にされる。一つの対処法はデータをいくつかのグループに分ける方法である。局所的なヘドニック回帰式と局所的な変数を探索することで、東京の住宅市場を細分化できる。本研究では住宅市場細分化手法として空間ヘドニック回帰モデルの構造的な不安定性に着目した。空間スイッチング回帰によって一般的な空間モデルの構造的な不安定性を分析できる。空間スイッチング回帰はAnselin(1988,P・132-133and1990)に詳しく紹介されている。空間スイッチング回帰により、データ全体を、回帰係数や説明変数の異なるモデルで表現されるいくつかのグループに分割することができる。この部分は、単に住宅市場細分化の新たな空間計量経済学的手法を開発したことにとどまらず、局所的な空間変数探索に大きく貢献している。

このモデルを東京の住宅市場に適用することにより、既存戸建住宅市場が2つに細分化された。また、新築戸建住宅のサブマーケットは比較的分散していたが、一つのサブマーケットは都心部に集中している。都心部では土地利用パターンや政策的な扱いが明らかに異なる。土地利用分布やヘドニック価格が都心部と郊外部で異なるため、得られた空間分割は妥当な結果である。空間スイッチング回帰分析で推定された2つグループについて回帰分析を行った結果、局所的ヘドニック回帰は明らかに全体を回帰した場合に比べ優れていた。

本研究の2つめのパートでは、空間スイッチング回帰の結果得られた空間分布の要因分析を行ダった。このパートでは計算幾何学的な手法を用いて、キーとなる空間特徴や土地利用の探索を行った。まず、サンプル地点に基づいてドローネ三角網を構築し、誤差が大きい方の二等分した半平面を重ねていった。そのような多くの半平面の積集合の地区がキーとなる空間特徴の要因が存在する地区であると考えた。

既存戸建住宅については、東京東横線、東急田園都市線、京王線の3鉄道路線と渋谷駅、新宿駅、品川駅、表参道駅、白金台駅の5駅がキーとなる空間特徴として抽出された。これらとの距離を表す変数が欠損すると構造的な不安定性が引き起こされ、これらの空間特徴のために都心部で戸建住宅のクラスターが京成される。新築戸建住宅については、品川駅、世田谷代田駅、下北沢駅の3駅がキーとなる空間特徴として抽出された。本手法はもともと試行錯誤的なものであり、特徴となる土地利用の同定は見かけほど容易ではない。

局所的ヘドニック回帰にこれらの距離変数を加えることで、誤差が大きく減少した。よって、上記の2つのケースで適合度は改善が見られた。

本研究で開発した方法は、研究者が土地の状況を完全には把握していない対象地域において、ヘドニック回帰分析を行うときに、必要な変数群を決める際に有効な手法であると言える。多くの学術研究で欠損変数による問題を最小化しようとしているのに対して、本研究ではむしろ欠損変数を発見しようとしているのが大きな特徴となっている。

審査要旨 要旨を表示する

欠落変数問題は学問上特に新しい問題ではない。しかし、空間変数に着目した場合には、比較的新しい問題である。多くの未観測空間要因が回帰分析に影響を与える可能性がある。地理情報システムやリモートセンシングなどの技術革新の進展に伴い、小地域においても詳細なデータを取得することが可能になってきた。空間データにおいて空間特徴が急速に増え、「すべての物はすべての物と関係している・・・」というトブラーの地理の第一法則により空間変数の数はほぼ無限に増えつつある。このような問題は対象地域の地理的な範囲を限ることで多くの影響要因をコントロールし、部分的には回避できる。あるいは、データ数が多ければ、非常に多くの説明変数を導入することで様々な影響をコントロールすることができるかもしれない。しかし、変数を増やすことは単にモデルを煩雑にするだけでなく、変数をコントロールすること自体も複雑にしてしまう。さらに、変数を増やすと自由度が減り、モデルの説明力にも影響を与える。

またさらに、空間モデルのすべての変数を的確に捉えることは事実上不可能である。場所の快適性、建築の質、道路のアクセス、文化遺産、近隣のブランド性などの潜在的変数は、観察し、モデルに加えることが難しいことも多々ある。潜在クラス分析によりこれらの変数を推定することも可能になったが、モデルに欠けている特定の変数を同定することは非常に難しい。空間モデルに欠落変数の存在はつきものである。ただ、すべての変数がモデルに重大な問題をもたらすわけではない。一部の変数は大きな空間的関係性を持つために、探索できる可能性がある。

本研究ではヘドニック回帰を主に扱う。非空間的なヘドニック回帰分析において、モデルが完全であるならば、エラーがなぜ生じるかについて何ら手がかりを残してくれない。エラーの生じる理由についてよく研究されているのは、独立変数間の相関とデータの不均一性問題である。どの理由がどの程度の誤差の要因になっているかを明らかにすることはできない。そこで、本研究では局地的な変数が欠落することでヘドニック回帰の誤差が増加し、いくつかの変数を追加することで誤差項が顕著に減少し、モデルの適合性が良くなる状況を仮定する。

ヘドニック回帰分析では、不均一性問題に十分な対処ができないことがしばしば問題にされる。一つの対処法はデータをいくつかのグループに分ける方法である。局所的なヘドニック回帰式と局所的な変数を探索することで、東京の住宅市場を細分化できる。本研究では住宅市場細分化手法として空間ヘドニック回帰モデルの構造的な不安定性に着目した。空間スイッチング回帰によって一般的な空間モデルの構造的な不安定性を分析できる。空間スイッチング回帰はAnselin (1988, p. 132-133 and 1990)に詳しく紹介されている。空間スイッチング回帰により、データ全体を、回帰係数や説明変数の異なるモデルで表現されるいくつかのグループに分割することができる。この部分は、単に住宅市場細分化の新たな空間計量経済学的手法を開発したことにとどまらず、局所的な空間変数探索に大きく貢献している。

このモデルを東京の住宅市場に適用することにより、既存戸建住宅市場が2つに細分化された。また、新築戸建住宅のサブマーケットは比較的分散していたが、一つのサブマーケットは都心部に集中している。都心部では土地利用パターンや政策的な扱いが明らかに異なる。土地利用分布やヘドニック価格が都心部と郊外部で異なるため、得られた空間分割は妥当な結果である。空間スイッチング回帰分析で推定された2つグループについて回帰分析を行った結果、局所的ヘドニック回帰は明らかに全体を回帰した場合に比べ優れていた。

本研究の2つめのパートでは、空間スイッチング回帰の結果得られた空間分布の要因分析を行った。このパートでは計算幾何学的な手法を用いて、キーとなる空間特徴や土地利用の探索を行った。まず、サンプル地点に基づいてドローネ三角網を構築し、誤差が大きい方の二等分した半平面を重ねていった。そのような多くの半平面の積集合の地区がキーとなる空間特徴の要因が存在する地区であると考えた。

既存戸建住宅については、東京東横線、東急田園都市線、京王線の3鉄道路線と渋谷駅、新宿駅、品川駅、表参道駅、白金台駅の5駅がキーとなる空間特徴として抽出された。これらとの距離を表す変数が欠損すると構造的な不安定性が引き起こされ、これらの空間特徴のために都心部で戸建住宅のクラスターが京成される。新築戸建住宅については、品川駅、世田谷代田駅、下北沢駅の3駅がキーとなる空間特徴として抽出された。本手法はもともと試行錯誤的なものであり、特徴となる土地利用の同定は見かけほど容易ではない。

局所的ヘドニック回帰にこれらの距離変数を加えることで、誤差が大きく減少した。よって、上記の2つのケースで適合度は改善が見られた。

本研究で開発した方法は、研究者が土地の状況を完全には把握していない対象地域において、ヘドニック回帰分析を行うときに、必要な変数群を決める際に有効な手法であると言える。多くの学術研究で欠損変数による問題を最小化しようとしているのに対して、本研究ではむしろ欠損変数を発見しようとしているのが大きな特徴となっている。

以上のように、ヘドニック回帰分析の空間変数探索にかかわる重要な学術的成果をあげている。よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク