学位論文要旨



No 117044
著者(漢字) ウアタヴィーキアット,スパタナー
著者(英字)
著者(カナ) ウアタヴィーキアット,スパタナー
標題(和) ロバストな領域成長法とセマンティックなオブジェクト抽出に関する研究
標題(洋) Robust Region Growing and Semantic Object Extraction
報告番号 117044
報告番号 甲17044
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5185号
研究科 工学系研究科
専攻 電子情報工学専攻
論文審査委員 主査: 東京大学 教授 相澤,清晴
 東京大学 教授 原島,博
 東京大学 教授 坂内,正夫
 東京大学 教授 石塚,満
 東京大学 教授 柴田,直
 東京大学 教授 相田,仁
内容要旨 要旨を表示する

 この論文は二つのテーマから成る。一つは領域成長による画像セグメンテーションで、もう一つはセマンティックなオブジェクト抽出である。一般の領域成長による画像セグメンテーションには二つの欠点がある。第一の欠点は一つの領域が二つ以上の領域に分けられてしまうというオーバーセグメンテーション問題である。第二の欠点は種の位置によって、セグメンテーション結果が変化してしまう問題である。本論文では新しい成長法を提案し、セグメンテーションを二つのステージに分けて以上の二つの欠点を緩和する。本手法は輝度に基づく尺度(Intensity criterion)とエッジに基づく尺度(No edge in-between criterion)を用いる。一般の成長法ではピクセルア"p"に領域を成長させるために"p"と他のピクセルを比較するか、もしくは"p"と成長中の領域を比較するが、本手法は人間の感覚を近づけるために"p"の周りのピクセルの値を用いて比較する。また、セグメンテーションでは二つのステージを分けて、違う種類の領域を処理する。粗いスケールでのセグメンテーション(Coarse scaled segmentation)は一様な領域と小さな揺らぎを持つ領域を処理する。精細なスケールでのセグメンテーション(Fine scaled segmentation)はその他の領域を処理する。提案した画像セグメンテーション手法を使って、セグメンテーションの結果はオーバーセグメンテーションを大きく押さえることができた。まだ領域のメンバーではないピクセルを種にすることで、種への依存の問題を緩和できた。

 最近のビデオ圧縮標準はコンテンツ応用の圧縮法(MPEG4)である。それを実現するためにセマンティックなオブジェクトを抽出しなければならない。一般のオブジェクト抽出法では"単一物体、単一の動き"を仮定するが、実際には、物体は一つの動きを持つとは限らない。そのため、人物などは一つ以上のオブジェクトとして抽出してしまう。本論文では、提案した領域成長法のセグメンテーションを利用して、新しいセマンティックオブジェクト抽出法を提案する。あらかじめユーザー(あるいは自動的な手法)により与えられた領域の中から個々のセマンティックなオブジェクトを抽出する。図1と図2のように人物の腕と胴体も同一オブジェクトとして、セマンティックに抽出可能なことを示した。

図1 Table tennis#52

図2 オブジェクト抽出結果

審査要旨 要旨を表示する

本論文は、「Robust Region Growing and Semantic Object Extraction(ロバストな領域成長法とセマンティックオブジェクトの抽出に関する研究)と題し、英文でかかれており、6章で構成されている。MPEG4の標準化にみられるように、映像はオブジェクトごとに表現することで、その一層の高度利用が促進できると期待されている。そのためには、映像から意味のある領域をオブジェクトとして抽出する処理を自動的に行えることが望ましい。このために、本論文では、画像のロバストなセグメンテーションによるオブジェクトの抽出について論じている。

第1章は、「Introduction(序論)」であり、本研究の背景と論文の構成についてまとめている。

第2章は、「Reviews on Object Extraction and Segmentation(物体抽出とセグメンテーションについての概論)」であり、これまでのセグメンテーション手法について網羅的に整理し、それらの手法の中でもちいる特徴量についてまとめている。オブジェクトの抽出は多くの処理の組み合わせで実現され、本研究での処理の枠組みについて述べている。本研究でのアプローチでは、まず初期フレームに対して静止画として、セグメンテーションを行う。次に背景除去処理を行い、セグメンテーションされた各領域を追跡することで意味のあるつながりと見出し領域の統合を行うという大きく2つの過程からなることを述べている。

第3章は、「Two Stage Segmentation using Robust Anisotropic Region Growing(ロバストな非等方領城成長法を用いた2段階セグメンテーション)」と題し、初期フレームのための静止画を対象としたセグメンテーション手法について論じている。提案する手法では、粗いスケールと細かいスケールの2段階でセグメンテーションを行う。各スケールでは、領域成長法を用いて、領域の均一性とエッジの有無の条件に基づいてセグメンテーションを進めている。粗いスケールでのセグメンテーションの結果を、細かなスケールヘうつし、調整の後に、細かなセグメンテーションを行っている。典型的な複数の実画像に適用し、人物の写っている画像に対しても過度な領城分割に陥ることなく、適度のセグメンテーションが行えることを確認している。

第4章は、「Object Extraction by Region Tracking(領域トラフキングによるオブジェクトの抽出)」と題し、分割された領域情報を基にした意味のあるオブジェクトの抽出について論じている。まず、初期フレームでのセグメンテーション結果を前景と背景に粗く分類する。対象オブジェクトは前景に含まれていると見なし、前景に属する領域の動きをそれぞれトラッキングし、近接して動く領域を統合することで意味のある大きな領域としてのオブジェクトを形成する。トラッキングは領域に対して定義したブロックに基づくヒストグラムマッチングを用いており、それらのブロックの隣接の状態により統合の判定を行っている。人物像など複数の典型的な映像を用いた実験を行い、実験映像は最終的に一つから少数のオブジェクトへ抽出表現されることを確認した。

第5章は、「Application Example: VOP Generation by Tracking(応用例:トラッキングによるVOPの生成)」と題し、オブジェクト抽出によるVOP(Video Object Plane)の生成についての実験を提示している。

第6章は、「Conclusion(結論)」であり、本論文の研究成果をまとめている。

以上、本論文では、映像のオブジェクト生成のための手法について論じている。粗いスケールから細かいスケールヘの2段階の領域成長に基づくロバストなセグメンテーション手法を提案し、また、領域のトラッキングによる意味のあるまとまりへの領域の統合についても論じている。本論文で論じるセグメンテーション手法は、映像のオブジェクト表現への自動化の試みとして、その高度利用に寄与することが期待され、電子情報工学上貢献するところが少なくない。よって本論文は博士(工学)の学位論文として合格と認められる。

UTokyo Repositoryリンク