学位論文要旨



No 213859
著者(漢字) 田頭,直人
著者(英字)
著者(カナ) タガシラ,ナオト
標題(和) データの地区単位集計による空間分析への影響
標題(洋)
報告番号 213859
報告番号 乙13859
学位授与日 1998.05.21
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第13859号
研究科 工学系研究科
専攻 都市工学専攻
論文審査委員 主査: 東京大学 教授 岡部,篤行
 東京大学 教授 小出,治
 東京大学 助教授 原田,昇
 東京大学 助教授 浅見,泰司
 東京大学 講師 貞廣,幸雄
内容要旨

 都市を対象に、調査・分析を行う場合、データの基礎単位が世帯、人口など空間的に分布しているものを取り扱うことが多い。しかしながら、プライバシー保護、あるいはデータ収集における作業量上の制約等から、データの基礎単位ではなく、行政地区、メッシュなどある地区単位によって集計されたデータを用いて分析を行う場合がある。本論文では、このように空間的にデータを集計することが分析結果に及ぼす様々な影響(空間集計問題)について考察した。

 第1章では、これまでの空間集計問題を取り扱った過去の研究事例を整理し、本論文で取り扱った問題の位置付けを明らかにした。まず最初に、’modifiable areal unit problem’と呼ばれる地区単位の違いが及ぼす分析結果への影響について説明した。次に、回帰モデル、特に距離変数を取り扱った場合のバイアス、及び距離の近似が引き起こす最適施設配置問題への影響等の空間集計問題の一連の既存研究について説明し、本論文の第2、3章では距離を説明変数とした回帰モデルを取り上げ、特に第2章では距離の近似によって生じる回帰係数のバイアス、第3章では回帰係数の安定性に関わる’modifiable areal unit problem’について考察することを説明した。次に密度とそれを測定する地区単位に関する一連の研究について説明し、第4章においては都市の分析においてしばしば行われる密度を基準として地区の抽出を行う場合の、抽出面積への地区単位の面積の影響について論じることを述べた。

 第2章では、ある地区単位で集計したデータを用いた回帰モデルにおいて、都心や中心業務地区、あるいは最寄り駅のようなあらかじめ決められた点と地区の代表点との「距離」を説明変数とした場合に生じる回帰係数の「バイアス」について検討した。都市の分析においては、例えば所得のように都心からの距離に従って変化するような現象を対象とする場合がある。しかしながら、所得のように私的なデータはプライバシー保護の問題から世帯ごとに得られることはない。従って、各世帯毎のデータではなく、ある地区単位で集計されたデータを用いて分析を行うことが一般的である。ここで各世帯の所得の代わりには、ある地区内に存在する世帯の平均所得を用いることになる。また各世帯の都心からの平均距離の算出においては各世帯毎の位置データが必要となるが、これを得ることは膨大な作業量となり、そのようなデータを扱える都市は限られている。そこで我々が分析を行う場合、各データの基礎単位との平均距離でなく、各地区毎に代表点を設定し、あらかじめ決められた点とその地区の代表点への距離を用いることが多い。第2章では、このような距離の近似をして回帰分析を行った場合、推定した回帰係数にバイアスが生じる可能性があることを示し、そのバイアスの性質、及びそのバイアスを除去する方法等について検討した。

 まず最初に、データの基礎単位において成立する回帰モデルが、集計されたデータにおいても同様に成立するのは線形回帰モデルのみであり、他のモデルの場合線形モデルに変形する必要があることを示した。そこで以降では線形回帰モデルを仮定し、特に傾きに着目してそのバイアスについて考察した。次に、地区単位として都市の分析でしばしば用いられる同心円分割に着目し、同心円の中心から距離を測定すると仮定して様々な検討を行った。まず、真の平均距離と設定した代表点までの距離との差違が同心円の中心からの距離に従って減少する場合、推定した傾きが真の傾きより小さくなることを示した。さらに、等区間幅の同心円において区間幅の中心を代表点に設定した場合、データの基礎単位の密度が均一分布、及び負の指数関数分布に従うならば、推定した回帰モデルの傾きはより小さいことを証明した。また、バイアスの生じない、あるいは増大する空間密度関数についても明らかにした。一方、これらのバイアスを防ぐ最も良い方法はあらかじめ決められた点と各データの基礎単位との平均距離を用いることであるので、地区単位としてより一般的なポリゴンを設定し、地区単位までの真の平均距離を正確に求める方法を提示した。

 次に、説明変数が距離以外にも複数存在する多重回帰モデルを設定し、その際のバイアスを求める方法を提示し、代表点までの距離を用いることは距離の回帰係数だけでなく、すべての回帰係数にバイアスをもたらすことを示した。

 最後に、地区の取り方として、同心円分割の他、正方形メッシュ分割を仮定した数値例を示し、それぞれデータの基礎単位が均一分布及び密度変化の小さい負の指数関数分布に従う場合バイアスはそれほど大きくないが、密度が急激に減少する場合、あるいはドーナツ現象を示すならばバイアスは無視できないことを示した。また、距離変数に最寄り駅からの距離を用いた場合のシミュレーションを行い、距離変数が地区の大きさに比較して相対的に小さいならばバイアスは大きいものとなることを明らかにした。

 第3章では、地区単位で集計したデータを用いて、距離を説明変数とした回帰分析を行った場合に、地区単位の違いが及ぼす推定した回帰係数の「安定性」への影響について取り上げた。距離変数としては、地区内の各データの基礎単位までの平均距離を用いることとし、第2章で論じたバイアスは生じないものと仮定した。しかしながら、別の空間集計問題が存在し、地区単位の違いが回帰係数の安定性に影響を及ぼすこと、また集計を行わない場合よりも安定性が低くなることを示した。

 地区単位の影響については、対象都市内を分割した地区の総数の影響と、地区数は等しいものの地区単位の取り方の違いによる影響の2つに分けて考察した。まずはじめに地区単位の取り方として、等区間幅の同心円分割、及び正方形メッシュ分割を取り上げて、地区数の影響について検討した。データの基礎単位の空間分布としては均一分布、負の指数関数分布を仮定し、地区数を多くとるほど推定した回帰係数は安定することを示した。また、集計を行わずに推定した場合の回帰係数の安定性と比較し、ある程度安定した回帰係数が得られる地区数を明らかにした。

 次に、地区数は一定にして、地区単位の取り方を変化させた場合の回帰係数の安定性への影響を検討した。ここで、最も回帰係数の安定性が高い最適な集計地区単位、逆に最も不安定となる最大分散の集計地区単位、及び地区の幅の等しい等区間分割における推定された回帰係数の分散を求め、これらを比較検討してみた。その結果、地区数が一定でも、地区単位の取り方が回帰係数の安定性に影響を及ぼすことがわかった。しかしながら、最適な集計地区単位を選択することにより、あるいは最大分散の集計地区単位に比較すれば、等区間分割により回帰係数を安定させることができ、最大分散の地区単位においても、地区数を増加させることにより、最適、あるいは等区間分割との差違を小さくすることが可能であることがわかった。

 最後に、説明変数が距離以外にも複数存在する多重回帰モデルを取り上げ、地区単位の違いが距離変数以外の推定した回帰係数の安定性にも影響を及ぼすことを示した。また説明変数が複数ある場合の最適な集計地区単位を求める指標を提示し、回帰分析におけるその具体的な意味付けを明らかにした。

 第4章では、密度を基準として地区の抽出を行う場合の、地区単位の規模が及ぼす抽出地区への影響について考察した。都市の分析においては、対象とするデータの空間分布状況を把握するために、密度を基準として地区の抽出を行う場合が多い。しかしながら既存研究により、地域の密度分布が測定する地区面積によって異って表現されることがわかっていた。仮に同じ密度基準を用いて地区の抽出をした場合に、地区単位により抽出した地区が異なってしまうとすれば大きな問題である。そこで第4章では、密度を測定する地区単位の面積の違いにる抽出地区への影響について、均一分布を用いて理論的に検討を行った。その結果、対象地域の全体密度が密度基準より小さい場合は、地区単位の面積を大きくとるほど抽出された地区の面積の期待値は減少し、逆に全体密度が密度基準より大きい場合は、地区単位の面積を大きくとるほど抽出された地区の面積の期待値は増加することが明らかとなった。

 次に、このような地区の面積の違いによる抽出面積への影響を取り除くため、測定する地区の面積毎に密度基準を変更する手法を提示し、またその密度基準を求める方法を示した。具体的には、様々な地区面積における密度基準以上となる確率を、ある基準面積の場合の密度基準以上となる確率と等しくなるように密度基準を地区面積毎に変更して、抽出地区の総面積の期待値を一定することにより、地区面積が抽出地区の総面積に及ぼす影響を除去した。また、地区の面積毎の密度基準を求めてみた結果、密度基準の変更値は、本来の密度基準と地域の全体密度との差違に、地区面積の基準面積に対する比の平方根を掛け、それに全体密度を足したものとなることがわかった。例えば対象地域の全体密度が密度基準より小さい場合は、基準面積より地区面積が大きくなるにつれて密度基準を下げる必要があり、その下げ幅は地区面積とともに大きくなっていくことになる。

 最後に第5章では、これまでの研究の結論と今後の課題について述べた。

審査要旨

 本論文では、データの基礎単位が世帯、人口など空間的に分布しているものを取り扱う場合に、データ収集における作業上の制約等から、データの基礎単位ではなく、ある地区単位によって集計されたデータを用いて分析を行うことが、分析結果に及ぼす様々な影響について考察している。従来の地区単位集計の影響については実証的な研究が多い中で、本論文では、理論的な展開が厳密になされており、かつ実践的な分析にも示唆に富んだ結果を得ているいる点が特に評価される。

 本論文は5章からなる。第1章では、これまでの地区単位集計を取り扱った過去の研究事例が整理されている。まず、’modifiable areal unit problem’と呼ばれる地区単位の違いが及ぼす分析結果への影響について、回帰モデル、最適施設配置問題等の視点から、次に都市の分析において重要な指標である密度に関する研究について説明しており、これらは既存の研究結果を良く網羅している。

 第2章では、地区単位で集計したデータを用いた回帰モデルにおいて、都心のようなあらかじめ決められた点と地区の代表点との「距離」を説明変数とした場合に、各データの基礎単位との平均距離でなく、各地区毎に代表点を設定し、その地区の代表点への距離を用いた場合に生じるバイアスについて検討している。

 例えば地区単位として都市の分析でしばしば用いられる同心円分割に着目し、等区間幅の同心円において区間幅の中心を代表点に設定した場合、データの基礎単位の密度が均一分布、及び負の指数関数分布に従うならば、推定した回帰モデルの傾きはより小さい方向にバイアスが生じることを証明している。都市の分析において、均一分布や負の指数関数分布を取り扱うことは多く、この結果は実践的な分析に対して極めて重要な示唆を与えていると言える。また、バイアスの存在を指摘するだけでなく、地区単位により一般的なポリゴンを仮定し、バイアスを防ぐ最も良い方法として真の平均距離を正確に求める方法も提示されている。

 次に、説明変数が距離以外にも複数存在する多重回帰モデルにも着目し、代表点までの距離を用いることは距離の回帰係数だけでなく、すべての回帰係数にバイアスをもたらすことを示している。代表点を用いた距離の近似は一般的に都市の分析で行われており、これらの検討結果は今後の都市分析において有用な成果である。

 第3章では、地区単位で集計したデータを用いて、距離を説明変数とした回帰分析を行った場合に、地区単位の違いが及ぼす推定した回帰係数の「安定性」への影響について取り上げている。

 まずはじめに地区単位の取り方として、等区間幅の同心円分割、及び正方形メッシュ分割に着目して、地区数の影響について検討し、地区数を多くとるほど推定した回帰係数は安定することを示している。また、集計を行わずに推定した場合の回帰係数の安定性と比較し、ある程度安定した回帰係数が得られる地区数も明らかにしており、実際の都市分析に対して重要な知見を提供していると言える。

 次に、地区数は一定にして、地区単位の取り方を変化させた場合の回帰係数の安定性への影響を検討している。ここで、最も回帰係数の安定性が高い最適な集計地区単位、逆に最も不安定となる最大分散の集計地区単位、及び地区の幅の等しい等区間分割における推定された回帰係数の分散を求め、これらの比較検討の結果、地区数が一定でも、地区単位の取り方が回帰係数の安定性に影響を及ぼすことを明らかにしている。しかしながら、最適な集計地区単位により、あるいは最大分散の集計地区単位に比較すれば等区間分割により、回帰係数を安定させることができること、さらには最大分散の地区単位においても、地区数を増加させることにより、最適、あるいは等区間分割との差違を小さくすることが可能であることを示している。このように、地区単位の影響について、総合的に回帰係数の安定性を確保する方法を探求している点は、高く評価される。

 第4章では、密度を基準として地区の抽出を行う場合の、地区単位の規模が及ぼす抽出地区への影響について考察している。都市の分析においては、対象とするデータの空間分布状況を把握するために、密度を基準として地区の抽出を行う場合が多いが、これまでにも経験的に地区単位の規模が抽出地区に影響を及ぼすことはわかっていた。本論文では、均一分布を用いて検討を行い、地区単位の規模の違いにる抽出地区への影響について、理論的に明らかにしている。

 また、このような地区の面積の違いによる抽出面積への影響を取り除くため、測定する地区の面積毎に密度基準を変更する手法が提示されている。その手法とは、様々な地区面積における密度基準以上となる確率が、ある基準面積の場合の確率と等しくなるように密度基準を地区面積毎に変更して、抽出地区の総面積の期待値を一定にする方法である。また、密度基準の変更値と、地域の全体密度、及び基準となる地区面積との関係も具体的に提示しており、今後の実践的な応用に対して可能性を示した。

 以上のように、本論文は多くの優れた成果を挙げている。よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク