学位論文要旨



No 212900
著者(漢字) 史,中超
著者(英字)
著者(カナ) シ,チュウチョウ
標題(和) ステレオ航空写真画像からの建物の自動検出とその応用に関する研究
標題(洋) A Study on Automated House Extraction from Digital Stereo Imagery of Aerial Photographs and Its Application
報告番号 212900
報告番号 乙12900
学位授与日 1996.06.13
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第12900号
研究科 工学系研究科
専攻 社会基盤工学専攻
論文審査委員 主査: 東京大学 助教授 柴崎,亮介
 東京大学 教授 高木,幹雄
 東京大学 教授 村井,俊治
 東京大学 助教授 桑原,雅夫
 東京大学 助教授 清水,英範
内容要旨

 空中写真から建物の自動抽出はデジタル写真測量システムや地理情報システム(GIS)の分野で盛んに行われている。これまで、写真判読・計測作業の効率化のために写真画像などから建物などの自動検出手法が検討されている。単写真画像を利用する方法では、通常、影や様々な幾何条件(例えば、建物の奇数辺或いは偶数辺はお互いに垂直する、建物の辺の数と角の数は相同であるなど)を考えながら建物の検出を行う。しかし、都市地域に対応する写真画像では隠ペイなどが非常に多く、建物の検出率と信頼性を向上させることが容易ではない。一方、最近になって、3次元高さ情報をも利用した自動抽出システムが検討されている。このとき高さ情報は面積相関に基づくステレオマッチングや距離画像から取得される。しかし、前述した高さ情報の取得の高精度化と高効率化は容易ではなく、それらのシステムは検出率や信頼性も十分とは言えない。もし、建物抽出の手かかりとなる画像特徴(領域やエッジ)の3次元的な位置をより精確に得ることができれば、地表面の推定高さとの相対的な高さ情報を求めることで、建物の検出をより高い信頼性で行うことができると考えられる。本論文は、エッジや領域などの高さ情報をステレオマッチングにより求め、地面の高さを推定し、地面高さからの画像特徴の相対高さを算定することにより建物を自動検出するシステムを提案した。さらに、航空写真から自動認識された結果を現地調査の成果や建築確認申請データなど行政情報と組み合わせ、GISデータベースの随時更新への応用も検討した。主な内容を次にまとめる。

1、ウェーブレット変換を用いた航空写真画像からの特徴抽出と領域分割

 通常、画像上における濃淡値(intensity)の変化、つまり画像の特徴は濃淡の値自身より重要であり、航空写真などを自動認識するための最も基本的な情報と思われる。しかし、フーリエ変換などの伝統的な方法に基づく画像処理では周波数と時間(或いは空間)領域において同時に信号を局在化(localization)できないため、航空写真等非常に複雑な画像から特徴の抽出には適用ではない。本論文では、まず、周波数と時間領域において信号の局在化を同時に行える「ウェーブレット解析」(wavelet analysis)を利用した階層的な特徴の自動抽出方法を提案した。特に、建築物のエッジやコーナー、それらに関する情報(例えば、コーナーの種類)などを抽出できるウェーブレットアルゴリズムを開発した。さらに、モジュラス(modulus)に基づく画像分割(MOBIS)という階層的な領域分割手法を開発した。また、可変しきい値を適用して領域の抽出率を向上させる方法も提案・実現した。

2、段階的ステレオマッチングによる航空写真から3次元空間情報の抽出

 一般的な面積相関によるステレオマッチング方法に比べ、高さの変化が著しく隠ペイ部の多い都市域では、特徴に基づくステレオマッチング方法はマッチングの効率(efficiency)や安定性(stability)が高いと思われる。そのため、本研究では、領域や線分など画像特徴に基づく段階的ステレオマッチング方法を提案・開発した。ここで、「段階的」というのはピラミッド或いは多重解像度(multiresolution)の意味だけでなく、レベルの高い特徴(例えば、領域)に基づくより安定的なステレオマッチングの結果をレベルの低い特徴(例えば、線分)に基づく不安になりやすいステレオマッチングの教師データとして利用することも意味する。領域マッチングでは、マッチ候補を選択するための探索ウインドウを最大視差を基に定義し、各候補領域の面積、周長、面積と周長の比率、平均濃淡レベル、重心、重心を通るX軸とY軸方向に平行する線分の長さ(Lx,Ly)などの七つの情報の比較により最適マッチを発見する方法を検討した。その結果、得られる3D空間的の領域を3D領域とよぶ。一方、線分マッチングでは、ハフ変換(Hough transform)を用いて、切れ切れのエッジをつなぐ線分を検出する手法を提案し、線分のzero-crossing符号、向き、平均コントラスト(contrast)などを比較の基準としてマッチングするシステムを開発した(これ以降、マッチングされた線分ペアを3Dラインとよぶ)。また、コーナーのタイプや共役直線(epipolar lines)などの幾何条件を考慮したコーナーマッチング方法も提案した。

3、高さ情報を用いた建物の自動抽出

 地面の高さから3D領域や3Dラインの相対的な高さが得られば、コンピュータにより建物や道路などの地物要素を自動検出することがより容易になる。本研究では、地表上には数多くの3Dラインなどが存在し、3Dラインの高さの頻度分布をとれば、地表面に対応する高さにピークが来ると考えた。すなわち、それらの3Dラインの高さによって、最大・最小高さの差を一定間隔に等分した立体空間に投票すれば、一番多い投票度数を得たところが地面となる。この手法は地表面高さがほぼ一定と考えられる領域ごとに適用するので、対象地域の広さは地形起伏に応じて決める必要がある。さらに、地面の高さが推定された上で、建物の自動検出について次の基本モデルを提案した。1)領域ペアによる検出モデル。本モデルでは地面より高い領域ペアを建物として抽出する。2)領域と対応する線分を利用したモデル。本モデルは3Dラインがステレオペアを構成していない領域の一部となっている場合適用となる。3)3Dラインとコーナーペアに基づく検出モデル。本モデルはモデル1)と2)の補助モデルともいえ、二枚写真のいずれもある建物の輪郭を領域として抽出できなかった場合適用である。3Dラインとコーナーペアからいろいろ組合せにより最適3D平面を探索・作成し、その3D平面が地上にあれば、それを建物とする。

4、応用例:旧データとの比較等による建物変化の検出

 建物の変化を新築と滅失の二種類とし、それぞれ検出モデルを提案・検証した。

 1)新築建物の自動検出モデル。航空写真から検出された建物のすべてを既存基図データと重ね合わせて、対応する建物が既存基図データに存在しない場合、この建物を新築或いは増築とする。さらに、本モデルでは、地方自治体における実際のGISの利用形態を考慮し、固定資産調査データや建築確認申請、竣工図などの行政情報を重要な情報として、既存基図データまたは建物とフュージョンして新築・増築の検出をより高い信頼性で行うことを提案した。

 2)滅失した建物の自動検出モデル。通常、滅失とは、既存基図データに存在するにもかかわらず、新しい航空写真には存在しないものと考えられる。そのため、滅失を検出する際に、建物候補や3Dラインなどは非常に有効な情報である。すなわち、既存基図データにある建物Aに対して、もし写真上において建物Aとほぼ同じ場所に建物候補或いは3Dラインが存在しない場合、建物Aは滅失した建物とする。この場合も行政情報を併用することで、滅失検出の精度の向上や確認が行える。

 本論文では、航空写真データ(縮尺は1:5000と1:10000)を用いて建物の自動検出のテストを行ったである)。テストの結果では、建物の検出率は、エッジ検出のしきい値が一定の場合、写真によって90〜95%である。その後、空き地に対して、エッジ検出のしきい値を自動調節すると、抽出率を3〜5%上げることが可能となった。検出された建物と旧データを比較して建物変化の検出の検証を行うと、行政情報を利用しない場合、"新築"として抽出された建物の誤り(<3%)が、"滅失"として抽出された建物での誤り(<1%)より大きいことが分かった。また、検証地域では、新築の85パーセントと滅失のほぼ45パーセントが行政情報から得られるので、行政情報を利用すると、建物変化の検出率とその信頼性がより高くなることも分かった。

審査要旨

 従来からの紙地図にはない非常に幅広い分野で地理情報システム(GIS)が利用され始めるに伴い、データの新鮮さにたいする要求がますます大きくなってきている。これまで、GISのデータ収集に関する技術は写真測量が中心であった。航空写真はきわめて多様な情報を含んでおり、写真測量は航空写真から非常に高精度なデータを取得できるという利点があるが、専門家の手作業に頼る部分が大きく、作業時間や費用などの面で更新頻度を大幅に引き上げるためには大きな問題を抱えている。航空写真からのデータ収集を自動化することができれば、GISデータの鮮度を向上する上で非常に大きな意味を持つ。

 航空写真データをコンピュータで解析し、建物などを自動抽出・計測しようとする研究はこれまで数多く行われてきた。これらの研究では、航空写真上から抽出されたさまざまな特徴にさらに形や影の有無などの情報を追加することで建物の自動抽出などを試みている。しかし、これらの方法は比較的簡単な実験画像ではうまくいっても、実際の複雑な画像では十分機能しないことが多い。一方、最近では、さらにステレオ航空写真を利用することで建物高さや地表面高さなどの3次元形状情報を抽出し、これらの情報をも利用することで建物の自動抽出の信頼性を向上させようとする研究も見られるようになった。しかし、ロバストな建物輪郭の抽出方法や3次元情報の抽出方法の開発、十分な精度の検証など課題は依然として多い。

 本研究はステレオ航空写真データから高さ情報を自動抽出し、高さ情報と建物輪郭線情報などを組み合わせて建物を自動抽出する手法を開発することを目的としている。

 本論文は7章からなっている。

 第1章はイントロダクションであり、写真画像からの建物の自動抽出に関する研究について概観している。

 第2章は研究の全体構成を述べている。

 第3章はウェーブレット変換とその応用に関する章であり、ウェーブレット解析の特徴と画像における特徴抽出への利用に関する可能性を整理している。

 第4章はウェーブレット変換を用いた航空写真画像からの特徴抽出と領域分割方法を提案している。従来からよく用いられてきたフーリエ変換などの伝統的な方法は周波数と時間(或いは空間)領域において同時に信号を局在化(localization)することができないため、航空写真に代表されるような非常に複雑な画像からの特徴の抽出には適当ではない。ウェーブレット解析は周波数と時間領域において信号の局在化を同時に行え、局所的な濃度値の変化の検出にむいている。また、周波数を変化させることにより階層的な特徴の自動抽出が可能になる等の特長がある。本研究では、建築物のエッジばかりでなくコーナー点を抽出できるウェーブレット手法を開発した。この方法では階層的に解像度を変化(多重解像度)させながら特徴抽出を行うこともできる。さらにこれを基に、モジュラス(modulus)に基づく画像分割(MOBIS)という領域分割手法を提案した。これはガウス関数の1次微分をウェーブレットとして利用してエッジを抽出し、さらに2次微分関数を適用して得られるコーナー点をアンカー点として領域を塗りつぶしていく方法である。エッジ抽出にあたっては閾値の取り方が問題となるが、また、可変しきい値を適用して領域の抽出率を向上させる方法も提案・実現した。

 第5章はステレオマッチングにより建物と地表面の高さを抽出し、地表面に比べ高い位置にある建物の屋根を検出することで、建物を自動抽出する方法を提案している。

 すなわち、まずウェーブレット変換により抽出されたエッジ、領域、コーナー点を対象に特徴マッチングを行う。この際、多重解像度を利用し、解像度の低い粗い画像からマッチングを行い、マッチングの対象を絞り込みながら、より詳細なマッチングを行う。同時に領域のようにマッチングにあたって比較的手がかりが多く、より確実にマッチングできる特徴からマッチング範囲を絞り込み、エッジやコーナー点のマッチングを行う。こうした2重の意味での階層的なマッチングを行うことでマッチングの効率や安定性を向上させる工夫を行った。その際、領域のマッチングにおいては面積、周長、面積と周長の比率、平均濃淡レベル、重心、重心を通るX軸とY軸方向に平行する線分の長さ(Lx,Ly)などの7つの情報を利用する。一方、線分マッチングでは、ハフ変換(Hough transform)を用いて、切れ切れのエッジをつなぐ線分を検出し、線分のzero-crossing符号、向き、平均コントラスト(contrast)などを比較の基準としてマッチングするシステムを開発した。なお、ステレオマッチングにより高さ情報の与えられた領域、エッジをそれぞれ3D領域、3Dエッジと呼ぶ。なお、こうした特徴マッチングに加え、エッジが比較的乏しい地域での標高内挿を補助するために従来からの面積相関法によるマッチングも行っている。

 次に地表面を基準として3D領域や3Dエッジの相対的な高さを算定し、地表面より高い特徴(3D領域や3Dエッジ群)を建物として抽出する。本研究では、地表上には数多くの3Dエッジなどが存在し、3Dエッジの高さの頻度分布をとれば、地表面に対応する高さに3Dエッジの頻度ピークが来ると考え、地表面高さを推定する方法を開発した。この手法は地表面高さがほぼ一定と考えられる領域ごとに適用するので、対象地域の広さは地形起伏に応じて決める必要がある。

 次に、推定された地表面の高さを基に、建物を自動検出するために次の基本モデルを提案した。

 モデル1:3D領域による検出モデル,地面より高い3D領域ペアを建物として抽出する。

 モデル2:面積相関マッチングから得られる地表面より標高の高い地域と、特徴抽出から得られた領域との重ね合わせによる建物の検出モデル。モデル1から残った各領域について、重ねる面積が一定の閾値(例えば、領域の面積の75%)に達すれば、この領域を建物の屋根として検出する。

 モデル3:領域と対応するエッジを利用したモデル。本モデルは3Dエッジがステレオペアを構成していない領域の一部となっている場合に適用する。

 モデル4:3Dエッジとコーナーペア及び、面積相関による標高算定の結果に基づく検出モデル。本モデルはモデル1、2、3、の補助モデルともいえ、ステレオペア画像のいずれにおいてもある建物を領域として抽出できなかった場合に適用する。3Dエッジとコーナーペアからいろいろ組合せにより最適3D平面を探索・作成し、その3D平面が地表面より高い位置にあり面積相関の結果と矛盾がなければ、それを建物とする。

 第6章では実際の航空写真に本手法を適用し、GISデータベースの建物データの更新への適用性を定量的に検証している。検証実験では主に航空写真データ(縮尺は1:5000)を用いた。まず建物が領域分割の結果、領域として検出されている確率は多重解像度解析と多重閾値を両方とも利用しない場合にはただ80パーセントで、多重解像度解析だけを利用する場合には85パーセントで、両方とも利用する場合には96パーセントに達することが分かった。また、約180軒の建物が含まれている立体写真を利用した建物検出の検証実験では、モデル1、2、3、4はそれぞれ90、73、7、5軒の建物(総数約175軒)を検出できることが分かった。

 第7章は結論である。

 以上を整理すると、本論文はウェーブレット変換を適用して複雑な航空写真データから特徴抽出を行い、その結果をもとに地表面に対する建物の相対高さを推定することで建物の自動抽出する手法を提示している。この一連の手法は、複雑な航空写真データの解析をできるだけロバストに行うための独自の工夫が多数盛り込まれており、かなり複雑な航空写真データに対して(同じデータを用いていないので、直接の比較は困難であるが)従来手法に比べて高い建物抽出率を示している。

 このように本論文は測量工学の進展に対して大きな寄与をしていると考えられ、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク