学位論文要旨



No 214675
著者(漢字) 本谷,秀堅
著者(英字)
著者(カナ) ホンタニ,ヒデカタ
標題(和) 多重解像度解析による図形形状の記述の研究
標題(洋)
報告番号 214675
報告番号 乙14675
学位授与日 2000.04.13
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第14675号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 安藤,繁
 東京大学 教授 藤村,貞夫
 東京大学 教授 杉原,厚吉
 東京大学 教授 石川,正俊
 東京大学 客員教授 出口,光一郎
内容要旨 要旨を表示する

 コンピュータビジョンの分野において,画像中の図形形状を記述することは重要なことである.ここで図形形状の記述とは,形状の特徴を捉え記号で表現することである.ところで図形より捉えられる形状特徴は,図形を観測する際の視野の広さに応じて変化する.このことは一般に図形が,局所的な形から大局的な形に至る,様々な大きさの形より成る階層構造を有していることを示している.この階層構造は図形に本質的な特徴であり,図形認識システムを構築する上でも記述することが不可欠のものである.本論文の目標は,図形の階層構造を記述する手法を提案することである.

 第2章では輪郭線図形の階層的構造を,元図形の近似図形により記述する手法を提案する.輪郭線図形の近似図形は,元図形の大局的形状の記述である.一般に近似図形は,輪郭線図形上の小さな凹凸を滑らかな曲線で置き換えることにより作成される.近似する際,1)どの程度の大きさの凹凸までを,2)どのような曲線で置き換えるか,の2項目を定める必要がある.従来の近似手法はこれら2項目を近似に先立ち仮定する必要があった.例えば輪郭線図形の線分近似手法は,凹凸を置き換える曲線の形状を線分に仮定している.

 提案手法は上記2項目を図形自身より定めるために,曲率流と呼ばれる輪郭線図形の平滑化操作に基づく多重解像度解析を行う.すなわち輪郭線図形に平滑化操作を加え,平滑化量の変化に対する形状の変化を観測する.本論文では図形の平滑化量をスケールと呼ぶ.より小さなスケールにより消去される凹凸は,より小さい凹凸であると考えることができる.曲率流による平滑化操作は次式で表される.

ただし,sは輪郭線に沿ったパラメータ,C(s)=(x(s),y(s))は元図形F(s,t)はスケールtにおける図形,κ(s),nはそれぞれ位置sにおける曲率および外向き単位法線ベクトルを表す.スケールtの増加に伴う図形の変化の例を図1に示す.

 提案手法は,輪郭線図形の凹凸を捉えるために曲率の2階微分のゼロ交差に着目する.元図形上の曲率の2階微分のゼロ交差は,スケールtの増加に伴い互いに融合し消滅していく.提案手法は,消滅する際に融合したゼロ交差に挟まれた輪郭線上の領域を一つの凹凸とみなし,消滅したスケールtにより各凹凸の大きさを求める.求められる凹凸の大きさは,元図形に特徴的な大きさである.輪郭線図形の近似図形を作成するために,元図形上小さな凹凸に対応する領域だけを,各凹凸の大きさだけ部分的に平滑化する.小さな凹凸から順に平滑化していくことにより,一つの輪郭線図形から有限個の近似図形を作成することができる.本手法により作成された近似図形を図2に示す.

 第3章では輪郭線図形のスケルトンに基づいた階層的記述手法を提案する.ここでスケルトンとは輪郭線を構成する個々の凸図形に対応する骨格線のことである.スケルトンは図形形状の微小な変化により大きく変化しうることが知られている.そこで各スケルトンの大きさを,各スケルトンに対応する凸図形の大きさにより定め,大きさに基づいた階層構造で記述する.このとき元図形の形状の微小な変化により,小さな凸図形に対応するスケルトンのみが変化するようになる.このためスケルトンに基づく2つの図形の形状の比較が可能となる.

 凸図形の大きさは,輪郭線図形の曲率流(1)に基づく平滑化により,凸図形が消滅するスケールとして求められる.提案手法はスケルトン上の連絡橋・半連絡橋と呼ばれる部分において元図形を複数の凸図形へと分割する.次に分割された凸図形を,個々の大きさに基づき階層化する.作成される階層的記述は元図形の局所的な形状特徴と大局的な形状特徴とを分けて記述したものであり,認識に有用な記述である.

 第4章では濃淡画像の多重解像度解析に基づき,画像の階層構造を記述する手法を提案する.多重解像度解析においては,濃淡画像を様々なスケールtにより平滑化する.元画像をI(x,y)により表し,スケールtにより平滑化された画像をL(x,y;t)で表すとき,次式が成り立つ.

スケールの変化に対する画像の変化は,画像の階層構造を反映する.画像の変化を捉えるために,提案手法は画像の濃淡を表す曲面の主曲率に着目する.ただし主曲率の大きさはスケールの値により正規化する.

 スケールtを変化させ,各スケールにおいて画像中の各点で2つの主曲率を求める.この2つの主曲率の比が画像中のその位置における図形形状を表し,大きさが濃淡を表す曲面の曲り具合いを表す.主曲率の大きさが最大となるスケールは,画像中のその位置における図形に特徴的な大きさを表す.このことを利用して画像の階層的記述を作成する.図3に提案手法により作成された階層的記述の例を示す.

 第5章では第2章から第4章までに述べた図形形状の階層的記述手法の応用について考察する.図形認識システムはまず画像より認識対象を抽出し,次に抽出された対象の認識処理を行なう.本章では図形形状の階層的記述が画像からの認識対象抽出および認識処理に有用であることを述べる.例として第4章で述べた濃淡画像の階層的記述手法に基づき画像から文字候補図形を抽出した結果を図4に示す.画像の階層的記述を作成しておくことにより,文字の記載位置や大きさなどを仮定することなく,画像中の文字をその大きさとともに抽出することができる.

 第6章ではまとめを行う.本論文では多重解像度解析に基づき図形に特徴的な大きさを求め,図形形状の階層的記述を作成する手法を提案した.対象とした図形は輪郭線図形および濃淡図形である.多重解像度解析を行うために図形に平滑化操作を加え,その平滑化量を変化させる.平滑化量の変化に対する図形形状の変化は元図形に特徴的な大きさを反映する.本論文では図形形状の変化を捉えるための特徴量を定め,形状の階層構造の記述手法を提案し,その応用について述べた.

図1. スケールの変化に伴う輪郭線図形の変化

図2. 提案手法により作成された輪郭線の近似図形.一つの図形より近似の度合のそれぞれ異なる有限個の近似図形が得られる.これは元図形の形状の階層的記述である.

図3. 左:元画像.右:提案手法により作成した階層的記述.局所的線分と大局的円環の双方を抽出し記述できている.

図4. 左:元画像.右:画像からの文字候補図形抽出結果.

審査要旨 要旨を表示する

コンピュータピジョンの分野において,画像中の図形形状を記述することは重要なことである.ここで図形形状の記述とは,輪郭線図形,2値図形,濃淡図形の形状の特徴を捉え記号で表現することである.図形より捉えられる形状特徴は,図形を観測する際の視野の広さに応じて変化する.このことは一般に図形が,局所的な形から大局的な形に至る,様々な大きさの形より成る多層構造を有していることを示している.この多層構造は図形に本質的な特徴であり,図形認識システムを構築する上でもこの構造の記述が不可欠である.画像中の図形の多層構造を記述する手法は,これまでにも数多く提案されてきた.ただし,これまでに提案されてきた記述手法の多くでは,画像を観測する際の視野の広さを変化させることは,形状特徴を抽出する演算子の大きさを変化させることにより実現できると考え,複数の大きさの特徴抽出演算子を予め用意しておき,それらを画像に適用することにより画像の局所一大局の形状特徴を記述していた.しかしながら,こような手法により得られる記述は,一般には元図形が本質的に有する多層構造の記述とはならない.なぜならば,特徴抽出演算子は自身の大きさ程度の形状特徴のみを画像から抽出できるため,図形を構成する個々の形状特徴の大きさと予め用意した演算子の大きさとを適合させる必要があるからである.

 これに対し,本論文では,図形を構成する形状特徴の大きさを図形自身より求め,図形の形状特徴の多層性を記述する手法を提案している.図形を構成する形状特徴の大きさを求めるためには多重解像度解析の手法を利用し,解像度の変化に対する図形形状の変化に基づき多層構造を記述するものである.本論文においては,画像を様々な解像度で観測するための画像の平滑化操作および平滑化による画像の変化を捉えるための形状特徴量,そして平滑化による形状特徴の変化に基づく多層構造の記述手法の各々について論じている.また提案手法による図形の具体的な記述例および記述の工学的応用を実験とともに示している.

 本論文は6章から成る.

 1章では,上記図形形状を記述する際の問題点を指摘し,本論文の目的を明らかにしている.

 2章では輪郭線図形の多層的構造を,元図形の近似の度合の異なる複数の近似図形により記述する手法が提案されている.輪郭線図形の近似図形は,元図形の大局的形状の記述である.近似図形は元図形上の細かな凹凸を局所的な平滑化により消去することにより作成される.提案手法は消去すべき凹凸の位置および消去するために必要な平滑化量を,図形自身のみに基づき決定する.この決定のために曲率流と呼ばれる平滑化による形状の変化に着目する.曲率流においてはスケールの増加とともに曲率の複数の変曲点が融合しつつ消滅する.ここでスケールとは図形に施す平滑化量のことである.この変曲点の消滅に基づき,元図形を構成する凹凸の大きさを求める.提案手法によると一つの輪郭線図形より高々有限個の近似図形を作成すること,近似図形の近似図形が元図形の近似図形と一致することなどの構造記述にとって好ましい特徴が実験により示されている.

 3章では輪郭線図形の多層構造を,スケルトンに基づき記述する手法が提案される.スケルトンとは輪郭線図形を構成する凸図形の対称軸のことである.提案手法は各スケルトンに対応する凸図形の大きさに基づき,スケルトンを階層化する.各凸図形の大きさは,曲率流により元図形を平滑化する過程において,消滅するスケールに基づき求める.より大きなスケルトンほど,元図形のより大局的な凸図形を記述している.スケルトンを用いることにより元図形を各凸図形へと分割し,各凸図形の大きさに基づき元図形の階層的な記述を作成する.曲率流における凸図形の消滅を捉える手法,スケルトンに基づき凸図形へと分割する手法などが,スケルトンの階層化による輪郭線図形の多層構造の記述結果とともに具体的に示されている.

 4章では濃淡画像中の図形の多層構造の記述手法が提案される.図形の形状特徴に固有な大きさを図形自身より求めるために,濃淡画像の多重解像度解析を行なう.濃淡画像を様々な解像度で観測するために,拡散方程式に基づく平滑化操作を用いる.平滑化するスケールの変化に対する画像の変化を,濃淡を表わす曲面の主曲率の変化により捉える.微分演算をスケールにより正規化することにより主曲率が極大となるスケールより画像中の特徴的な図形を求めることができること,主曲率の比がそれらの濃淡分布に対応することなどが述べられる.また提案手法による濃淡画像の多層構造記述の作成が実験と共に具体的に示される.

 5章では2章から4章までに述べた図形形状の多層構造記述手法の応用について考察している.図形認識システムはまず画像より認識対象を抽出し,次に抽出された対象の認識処理を行なう.画像の種類を限定しない汎用的な図形認識システムにおいて,図形の多層構造の記述が認識対象の抽出,および二つの図形形状の比較の際に有用であることが,提案手法に基づく複数の輪郭線図形の階層的モデルの作成,医療画像や文書画像における線図形の強調,テキスチャによる画像分割,一般画像からの文字抽出,図面画像からの文字列抽出の実験結果とともに示されている.

 6章は本論文のまとめである.以上を要するに,本論文では,画像への多重解像度解析の利用とその振る舞いについて考察し,その結果を用いて,輪郭図形,2値図形,濃淡図形などの局所的な特徴から大局的な特徴に至る多層的な構造を記述する手法を開発し,工学的な応用を示しており,画像認識,形状計測の研究分野に貢献するところが大きい.

 よって本論文は博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク