学位論文要旨



No 213092
著者(漢字) 河田,耕三
著者(英字)
著者(カナ) カワタ,コウゾウ
標題(和) ウェーブレット相関に基づく画像解析
標題(洋)
報告番号 213092
報告番号 乙13092
学位授与日 1996.12.13
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第13092号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 有本,卓
 東京大学 教授 藤村,貞夫
 東京大学 教授 杉原,厚吉
 東京大学 助教授 出口,光一郎
 東京大学 助教授 山本,博資
内容要旨

 画像認識工学は人間の視覚情報処理機構を工学的に実現しようとする立場に基づく学問であるが、現在のところ機械の性能はまだまだ人間には及んでいない。本論文は、人間の視覚機能の中でも特に視野をうまく制御するという点に関して重点的に研究した結果、得られたテクスチャー解析とマッチングに関する方法について述べたものである。

 テクスチャー解析の研究において、従来、濃度共起行列、パワースペクトラムなどの統計的な手法や、自己回帰モデルやマルコフ確率場モデルなどモデルベースに基づく手法が提案されている。これらはすべてある領域内での統計量やモデルの当てはめを行なうものであり、あらかじめ画像を分割する必要があるが、どの程度の大きさに分割すれば良いかという明確な基準があるわけではない。テクスチャーは周期性を有するものであるとすると、本来ならばその周期性を検出した後で分割する領域の大きさを決めなければならないが、問題はその周期性を検出することそのものなのである。従って、領域をあらかじめ決めないで周期性を検出する手段が必要になるが、それを実現するのが空間-周波数解析であり、本論文では、その中でも時間(位置)の不確定性と周波数の不確定性との積を最小にするGabor関数について重点的に取り扱う。Gabor関数はGauss関数と複素三角関数との積で表され、信号にGaborフィルタを作用させることは、ある周波数近傍の周期成分を検出することを意味する。従って、その振幅出力を用いると信号の各位置に対して周期性を有するか否かを良く検出でき、その振幅出力の空間微分を統合して、テクスチャー勾配とテクスチャーエッジを求める方法について論じている。統合手段として空間微分の2次モーメント行列の特異値分解を用いる手法を提案しているが、これは線形的に統合する手法よりも2次元ベクトルの方向性を考慮できる点で優れていると主張している。Gaborフィルタに対して、信号のステップ状やパルス状の変化など周期的とはいえないパターンに対しても振幅出力は小さくなく、これらはノイズとして取り扱われる。そして、これらのノイズを抑制するためには低域フィルタによる方法以外にはなく、テクスチャーの領域幅が無限大の場合、低域フィルタとしてGauss形を用いたときにはその抑制度とエッジ位置の不確定性とは全く等しいことが示される。またGaborフィルタとGauss形低域フィルタの周波数バンド幅パラメータはエッジ位置の不確定性に対して全く同じ特性を持つが、Gauss形低域フィルタのバンド幅を小さく設定した方がノイズの抑制効果が高いことも示される。ただし、信号のステップ状の変化に対するノイズに対しては、エッジ位置の不確定性をほとんど増加することなく、ノイズ自体をほぼ完全に解消する補正フィルタによる方法があるが、この方法を信号のパルス状の変化に対するノイズに対して用いることが出来ないことが示される。

 Gaborフィルタ列を用いた従来研究においても低域フィルタを作用させているが、低域フィルタ定数(バンド幅)がどのように設定されるべきであるかということの議論なしで用いられていた。本論文では、低域フィルタのバンド幅をGaborフィルタのバンド幅に比例させて設定する方法を提案する。本方法において、その比例定数はGaborフィルタ自体がテクスチャーであるか否かを各人が判断し、テクスチャーであると判断されたうちの最大のバンド幅値を用いて求められる。この方法はGaborフィルタが相似系の場合にのみ適用できる。本論文では、Gaborフィルタが相似系で直流成分がゼロであるという条件をもってウエーブレットフィルタと呼んでいるが、直流成分がゼロであるという条件は信号の直流成分は局所的な特徴を表すものではないという要請による。この低域フィルタ定数の設定方法では、正確ではないにしてもテクスチャーの定義づけを各人が行ない、検出された振幅出力がテクスチャーであるか否かをテクスチャーの定義に基づいて調べられることを意味しており、合理的な方法であると主張している。尚、テクスチャーの領域幅が有限の場合、ノイズの抑制度とエッジ位置の推定誤差との両立という意味で、最適な低域フィルタ定数は一定で領域幅に対してほぼ一意に決まることが示されるが、低域フィルタのバンド幅をGaborフィルタのバンド幅に比例させずに一定値に設定する合理的な方法はないと主張している。

 この低域フィルタ定数の設定方法に基づいてテクスチャー勾配が求められ、テクスチャーエッジが検出されるが、これらをセグメンテーションへ応用する方法についても提案している。提案方法は、分割された境界上でテクスチャー勾配がどの程度大きく、テクスチャーエッジがどの程度多くあるかを評価する基準を設定し、その評価基準に基づいて確率的な組合せ最適化手法を用いてセグメンテーション解を得る方法である。この方法では再帰的にセグメンテーションが実行され、領域数は未知でもよい。また、Gauss形低域フィルタを差分フィルタで近似することにより、Gauss形低域フィルタのバンド幅パラメータと最大間引きレートとの関係を導出し、最大間引きレートの解像度から始めて解像度を上げながら階層的に最適化を実行して効率的に解を求める方法を提案し、実験的に有効性を検証している。

 一方、対応点の検出という意味でのマッチングにおいては、ラプラシアン距離や局所的相関など各画素における特徴を検出するために窓幅を設定する必要があるが、どの程度の窓幅を設定すれば良いかという明確な基準がなかった。本論文では、この問題に取り組むために局所的相関が解析される。その結果、Gauss窓を用いた局所的相関は、信号をまずGaborフィルタ成分に分解した後、分解成分ごとの複素積の総和を計算したものであり、この場合Gaborフィルタは相似系にならないので各周期成分が公平に検出されないことが示される。従って、Gaborフィルタを相似系に設定すれば各周期成分が公平に検出されるが、このときの分解成分ごとの複素積の総和を計算したものをウエーブレット相関と呼んで提案している。故に、ウエーブレット相関における窓幅はGaborフィルタのバンド幅の逆数であり、その最適幅はGaborフィルタの直流成分がゼロであるという条件に基づいて導かれ、これにより局所的相関で難しかった窓幅の設定問題が解決できることが示される。また実験において、局所的相関では各周期成分が公平に検出されないために起こる不都合と、ラプラシアン距離ではマッチングのために必要とする十分細かい特徴が検出されないために起こる不都合とが指摘され、ウエーブレット相関ではそれらが解消されることが示される。近年、Gaborフィルタの位相出力を用いたマッチング方法の数例が提案されている。それらはすべて、どの位相出力をどの程度重要視するかという、複数位相出力の統合についての問題を十分合理的に取り扱うことが出来なかった。ウエーブレット相関は振幅出力と位相出力を同時に扱え、かつ、複数フィルタ出力の統合も相関という原理に基づいて処理されるという点で、位相出力を用いる従来手法よりも優れていると主張している。さらに、ウエーブレット相関の狭帯域な性質を利用した大局的なマッチング手法が提案され、この方法がDP(ダイナミックプログラミング)マッチング法と比べると計算量はかなり多いが性能は同等であることが実験的に示される。

審査要旨

 画像認識やその工学的応用の分野において、テクスチャー画像のセグメンテーションやマッチングに関する研究成果は、その重要性にもかかわらず、顕著であるとは言い難く、実用化にはほど遠い状態にある.研究が遅々として進まない要因に、テクスチャーの周期性の自動検出そのものに視野制御の課題が未解決であり、またテクスチャー境界の検出についても決定的な方法が見い出されていないことがある.

 本論文は、このような背景のもとで、視野を適宜に制御することのできるGabor関数に基づいてウェーブレット関数を定義し、これを用いてテクスチャ特徴ベクトルを抽出し、その空間微分を統合してテクスチャー勾配とテクスチャーエッジを検出する新しい方法論を展開したものである.本論文は「ウェーブレット相関に基づく画像解析」と題し、6章よりなる.

 第1章は「まえがき」で、人間の視覚情報処理機構を工学的に実現させる立場で本研究を開始した動機を述べるとともに、画像認識における本研究の背景と研究現状をまとめている.特に、本研究では、テクスチャー領域内に存在するテクスチャーの繰り返しが数回である場合を想定しつつ、テクスチャー特徴ごとに視野パラメータを変させる方法に導入しなければならないことの理(ことわり)を、テクスチャー画像解析の本質的課題に関係づけて、明らかにしている.

 第2章は「空間・周波数解析の基礎」と題し、第3章以降で用いるGabor関数に基づいて定義したウェーブレット関数とウェーブレット分解を説明し、それらの性質や条件および設計方法などを論じている.

 第3章は「テクスチャー画像のエッジ検出」と題し、テクスチャーエッジ勾配とテクスチャーエッジを検出する新しい手法を提案している.まず、ウェーブレット関数を用いてテクスチャー特徴ベクトルを抽出し、特徴ベクトルの各要素の空間微分をとり、その勾配ベクトルから成るモーメント行列関数の特異値分解によってテクスチャ勾配を定義している.また、テクスチャー勾配に基づくテクスチャーエッジの検出には、前者の2次微分フィルタの零交差点をエッジ点と見なす方法が知られているが、ここでは勾配を表す最大特異値の勾配方向(その固有ベクトル)の2次微分をとり、エッジの満たす条件を与えている.そして、この方法の有効性を理論的に実証するために、数式で表現できる1次元信号に対して詳しい解析を行い、パルス型やステップ型のノイズが重畳した際の本手法の耐性を論じ、合わせて、ノイズを抑制するための低域フィルターによる補正法を論じている.

 第4章は[テクスチャー画像のセグメンテーション]と題し、前章で提案したテクスチャー勾配とテクスチャーエッジの検出法のセグメンテーションへの応用法について考察している.具体的には、勾配やエッジ等の境界情報を用いた方法として再帰的に組んだセグメンテーション算法を提案している.また、テクスチャー勾配を求めるときに必要となる視野パラメータが大きければ細かいセグメンテーションはできないという考えに基づいて、階層化手法を提案し、視野パラメータと階層の初期レベルとの関係を導いている.

 第5章は「ウェーブレット相関による画像のマッチング」と題し、従来の手法であるマッチングの基本となった局所的相関に代えて、ウェーブレット相関と呼ぶ計算量を導入している.この方法では、各周波数成分が公平に検出されないという局所的相関の欠点を改良するため、局所的相関の記法を拡張し、各周波数成分の公平な検出を可能にしている.また、ウェーブレット相関と局所的相関やラプラシアン距離との比較実験を行い、その優位性を検証している.そして、ウェーブレット相関の狭帯域の性質を利用した、大局的なマッチング手法を提案し、DPマッチング法と性能比較を行っている.

 最後に、第6章を「まとめ」と題し、研究の成果をまとめた後、今後の研究課題を挙げている.

 以上を要するに、本論文はテクスチャー画像解析の基本となるテクスチャー勾配とテクスチャーエッジの新しい検出法を示すとともに、振幅出力と位相出力を同時に扱い、かつ複数フィルタ出力の統合をも行い得た「ウェーブレット相関」という新しい概念を提案し、その有効性と有用性を理論的かつ実験的に示したものであり、画像認識工学の発展に大きく貢献するものである.よって博士(工学)の学位論文として合格と認める.

UTokyo Repositoryリンク