学位論文要旨



No 212281
著者(漢字) 武田,晴夫
著者(英字)
著者(カナ) タケダ,ハルオ
標題(和) モデルベース視覚情報処理の数理的手法に関する研究
標題(洋)
報告番号 212281
報告番号 乙12281
学位授与日 1995.04.14
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第12281号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 甘利,俊一
 東京大学 教授 杉原,厚吉
 東京大学 教授 有本,卓
 東京大学 教授 舘,すすむ
 東京大学 助教授 出口,光一郎
内容要旨

 非接触の外界センサによって得られる実世界の観測データと、あらかじめコンピュータ内に蓄えられた仮想世界のモデルデータとを照合することによって、高次の外界情報をコンピュータ内に自動的に獲得する処理が、コンピュータの新しい応用分野開拓の鍵として強く期待されている。例えば地球環境観測、移動体自動運転、医療診断装置、ロボットの位置決め問題、工業製品外観検査、ビジネス文書の認識装置、印影/署名/指紋照合機などにおいて、その具体ニーズが顕在化している。このような処理を、本論文では以下モデルベース視覚情報処理と呼ぶことにする。

 モデルベース視覚情報処理では、その過程で本質的に免れ得ない以下の2つの曖昧さに対する処理精度の確保が主要課題となる。第1の曖昧さは、対象と観測データの間に生じる観測誤差である。センサ、特に非接触の外界視覚センサを用いる場合には、観測データに含まれる有意な誤差を決定的に物理モデル化することが一般にできず、誤差確率分布のモデルによって統計的推定を行なう必要がある。従来解析的な扱いが容易であることなどの理由から、各変数の分散と平均が等しく互いに相関のない多次元の正規分布や、2次元平面上の円板の一様分布、N次元空間内の超立方体内の有界分布など、比較的単純な誤差確率分布が利用されることが多かったが、実際の誤差分布と仮定する誤差分布との乖離が、最終的なモデル照合結果に大きく影響する場合も数多く存在していた。各種の視覚センサの固有の物理的性質および実験によって求められた確率モデルは多く存在するが、このような一般に複雑な確率モデルから統計的推定を行なうのは通常困難であった。このような問題を解決するために、観測誤差モデルの複雑さと統計的推定の実現性の相反要因を最適化する、センサ固有のモデル表現と統計的推定の数理的手法が望まれていた。

 第2の曖昧さは実世界の対象に対する仮想世界モデルの記述誤差である。一般に実世界の対象を一般モデルで完全に記述することは効率が悪く、モデルにはある規則に従った変形を許容する。ただし観測対象の個々の変形は一般に観測者には未知であり、モデル照合の過程ではこれが対象とモデルの誤差となる。モデルを一般化すると許容される変形が大きくかつ複雑になり、誤差推定が困難となる。モデルを特殊化すると許容される変形は小さくなり誤差推定が容易になるが、実世界記述のためのモデル容量が増大する。このため階層構造と知識継承による実世界の表現など、効率的な知識の表現手法が広く研究されている。ただしこのような場合にも、観測対象とモデルの間の記述許容誤差の拡大と、その誤差推定手法の効率化の相反要因を最適化する対象固有のモデル表現と変形推定の数理的手法が必要となっていた。

 本論文では、このような2つの課題に対して、それぞれ典型的な実応用を数理モデル化し、これを解決するための数理的手法を導入し、その有効性を示す。上記第1の課題に対して、本研究では自律移動体のナビゲーション問題を具体例として考察する。ここでは放射方向に配置された複数の視覚距離センサのモデルと、これによって観測された多角形環境に関して、まずセンサ位置最尤推定手法を示し、次にその推定誤差を最小化する移動体経路計画について述べる。

 まず放射型視覚センサとして、2次元平面上の1点から放射方向に対象物までの距離データを計測する視覚センサモデルを呈示する。このようなセンサによって得られた観測データは各光線に沿った対象までの真の距離によって誤差分布(図1)が異なる。従って1本の直線を観測することによって得られた点列に対して、直線からの垂直距離の2乗和を最小化する従来方法は、最尤基準を満たしていることにならない。ここでは実際の自律移動体応用において、この不完全さよって生じる具体問題点を例示する。次に、特に上記の各個別の視覚センサの誤差が、真の距離に比例する標準偏差をもつ正規分布であるときに、直線の最尤推定問題が解析的に解けることを示す。これによって上記問題点が解消することを確認し、また統計実験によりモデルを含めた有効性を検証する。

図1:視覚による直線認識誤差分布

 次に上記センサモデルを前提としたときの、多角形環境における自律移動体のセンサ位置/姿勢の最尤推定問題について考察する(図2)。これは、上記が1本の直線の最尤推定問題であるのに対して、複数の直線の同時推定問題への一般化に相当する。ここでは移動体環境が2次元平面の線分の集合で記述できるとき、環境マップを先見知識とする観測データのマッチングを行なう。特に並進(x,y)、回転()の3自由度のコンフィギュレーション空間を視覚同値の類に分割し、各同値類内でxy平面と方向の最小値探索を繰り返す探索手法を呈示する。本手法については、数値実験により有効性を検証する。

図2:視覚による移動体位置推定の誤差分布

 さらに視覚の曖昧性を制約とする自律移動体の最適経路計画法を提案する(図3)。まず与えられた移動体環境のモデルに対して視覚センサの曖昧性に関する確率場(Sensory Uncertainty Field、以下SUFと略す)を、移動体のコンフィギュレーション空間に定義する。各移動体コンフィギュレーションqに対してSUFはこの点においてコンフィギュレーション推定を行なったときの推定誤差分布を表す。次にこのSUFを用いて視覚誤差の累積期待値を最小とする経路を探索する。これらを実現するアルゴリズムを提案し、最後に評価実験結果について述べる。

図3:視覚の曖昧性を制約条件とする移動体の経路計画

 上記第2の課題に対して、本研究では2次元の点対称パターンのマッチング問題を具体例として考察する。ここでは特に欠損のある印影の照合を高精度で行なうための手法を提案する。

 まず2次元画像中の連結成分のラベクング処理について述べる。画像の連結成分ラベリング処理は画像認識の前処理の基本的処理の1つである。ここでは、画像の2次元圧縮符号であるMR(Modified READ)符号が画素の2次元方向の連結性を保持しつつデータ量を削減していることに着目して、MR符号から直接2値画像のラベリング結果を得るアルゴリズムを提案する。従来方法に対する大幅な性能向上を実測実験結果によって示す。

 最後に本来点対称輪郭をもちながら、欠落・ノイズ等により対称性が不完全になった画像のパターンマッチングのために、対称の中心を検出アルゴリズムを提案する。本方式は、輪郭を180°回転して自分自身と整合(輪郭の自己整合)することにより、すべての輪郭上画素の位置情報を利用して統計的誤差最小化手法により中心を検出する。印影照合の実応用実験によって、通常生じる印鑑枠の欠落、背景や朱肉繊維によるノイズ等の部分的な輪郭の欠陥に対しても、十分な精度で位置合わせできることを検証する。

 以上の結果、モデルベースの視覚情報処理で最も重要な課題の1つである曖昧性の問題に対して、曖昧性の数理モデル化と、これを処理するための数理的手法の有効性が、典型的な2種類の曖昧性について示される。

審査要旨

 本論文は「モデルベース視覚情報処理の数理的手法に関する研究」と題し,本文7章と文献表からなる.視覚情報処理に関する研究は古くはパターン認識の研究に始まり,近年ロボットなどの自律移動体の開発に伴って,その重要性が増大している.現実の視覚情報処理にあっては,誤差を含む現実のデータを高速に高精度で処理する必要が生ずる.このために,外界の構造に関する知識を利用する方法が考えられる.外界の構造をモデルとしてコンピュータの内部に保持し,この仮想モデル世界の知識を活用して情報処理を行なう方注がこれで,モデルベース視覚情報処理と総称される.本研究は,自律移動体のナビゲーション問題を具体例にとり,多角形障害壁よりなる外界環境モデルのもとで,対象物,測定者位置および方位の最尤推定法,さらにこれに基づく最適経路計画問題に関する数理的手法を開発すると共に,モデルの適合度が必ずしも良くない場合の例として実用的な画像処理の例を取りあげ実用に耐える解法を研究している.

 第1章は序論であり,本研究の目的,背景および方法を述べると共に,各章の概要を簡潔にまとめることによってこれらが方法論的に統合されていること分明らかにしている.

 第2章は放射型センサによる直線の最尤推定と題し,境界面ないし障害物となる直線対象物までの距離を移動体が放射方向上に複数点測定し,このデータに基づいて対象物を構成する直線を同定する問題を取り扱う.はじめに,従来の最小2乗同定法の問題点として,同法が異常値に対して頑健でないなどいくつかの弱点を持つことを指摘する.これに代わるものとして,直線モデルから構成される外界に対する合理的な測定誤差モデルを示すと共に,この場合に最尤解を陽に求めることに成功した.さらに本法の有効性と頑健性をシミュレーションにより示している.

 第3章は多角形環境におけるセンサ位置の最尤推定と題し、前章と同じ固定した多角形環境モデルのもとで、測定体を取り囲む複数の直線対象物までの距離を放射線状に測定することにより、測定体の位置と方位を同定する問題を研究している.この場合、測定点と複数の環境対象との間の対応の組合せマッチング問題が生ずることを示すと共に、マッチング問題を解決するために対応の組合せのコンフィギュレーション空間を視覚同値類に分割し、その上で尤度を最大にする解を求める新しい効果的な方法を導入した.また本方法の有効性を評価実験により確かめている.

 第4章はさらに進んで,多角形環境モデルのもとで,移動体が自己の位置および方位に関する誤差評価を行ないつつ最適の移動経路を計画する問題を論じたもので,視覚の曖昧性を制約条件とする自律移動体の経路計画法と題する.従来の方法を概観すると共に,ここでは新しくセンサ誤差フィールドと呼ぶ位置と方位に関するスカラ場を導入する.最適経路はこの場の経路積分を最小にするものとして与えられる.これに関し,フィールドの求め方および経路積分の最小化についての数理的な方法が提案されている.本方法もシミュレーション実験によってその有効性が確認されている.

 第5章は圧縮符号からの画像連結ラベリングと題し,ファクシミリなどで多用されている画像の2次元圧縮符号であるMR符号から,画像を復元することなく直接に2値画像の連結成分をラベリングする手法を提案したものである.本手法は実用性の高いもので,従来の手法に比べて数倍の処理速度が得られている.

 第6章は,印影のように輪郭が点対称な構造をしている画像から,モデルの対称性を考慮して欠落情報を回復し中心位置と方位を同定する手法を論じたもので,自己相関を利用した点対称体のパターンマッチングと題する.本手法も十分に実用性に耐える数理的手法といえる.

 第7章は結論である.

 これを要するに,本論文は視覚情報処理システムを設計するに当たって対象とする外部世界の知識を仮想世界モデルとして取り込み,その数理的解析を通じて効率の良いシステムを開発する手法を提唱したもので,数理工学上貢献するところが大きい.よって本論文は博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク