学位論文要旨詳細

学位論文要旨


No		113386
著者（漢字）		汪,平涛
著者（英字）
著者（カナ）		ワン,ピンタオ
標題（和）		時空間画像を用いた3次元世界の構築と認識
標題（洋）		Reconstruction and Recognition of 3D World Using 2D Spatio-Temporal Image
報告番号		113386
報告番号		甲13386
学位授与日		1998.03.30
学位種別		課程博士
学位種類		博士(工学)
学位記番号		博工第4104号
研究科		工学系研究科
専攻		電子工学専攻
論文審査委員		主査：　東京大学　教授　坂内,正夫　東京大学　教授　池内,克史　東京大学　教授　石塚,満　東京大学　教授　安達,淳　東京大学　教授　喜連川,優　東京大学　教授　相澤,清晴
内容要旨		近年、コンピュータの処理速度の向上に伴い、動画である3次元時空間画像を効率よく処理し、解析できる環境が整ってきている。一方、人間のように、3次元時空間画像に含まれている膨大なデータを高速に記憶したり、解析することはまだ困難である。このため、人間と同等な能力をもつ汎用処理システムの開発を目指すのではなく、限定した環境の中で特定の目的に対する個別システムを開発するのが、現段階での3次元時空間画像に関する研究の流れである。　3次元時空間画像は、カメラにより撮影された連続画像から形成され、多くの冗長なデータが含まれるため、記憶するのに多くの蓄積媒体が必要となり、また、解析するのに時間がかかる。本研究では、処理するデータ量を減らし、処理時間を短縮するため、必要な情報を保ちながら、3次元時空間画像を2次元時空間画像に変換した上で、3次元世界の構築と認識を行うことを目的とする。本論文は「2次元時空間画像を用いた3次元世界の構築と認識」と題し、7章から構成される。　第1章は「序論」であり、研究の背景と目的及び論文の構成について述べている。　第2章では、ステレオビジョンのパラダイムから3次元時空間画像に基づくビジョン手法への遷移、そして2次元時空間画像の生成について述べている。はじめに、3次元時空間画像のデータの冗長性と、時間情報と空間情報の不確定性(あるいは融合性)を概説している。次に、データ量の減少手法として、これまでによく研究されてきたエピポーラ(epipolar)画像やパノラマ(panorama)画像などを取り上げ、これらは3次元時空間画像のスライス(slice)に帰着することができ、3次元時空間画像の任意のスライスは概括的に一般的な2次元時空間画像であると提唱している。　第3章では、解析の対象を3次元空間の直線と限定し、2次元時空間画像の生成、及び2次元時空間画像中に3次元直線の軌跡として生成されるパターンについて述べている。ここでは、カメラが直進していると限定し、2次元時空間画像上における3次元直線のパラメータに関わる線形関係式を導出している。3次元時空間画像上で、時間軸と直交する平面と2次元時空間画像であるスライスとの交線はスリットと定義されれば、エピポーラ画像とパノラマ画像は直線スリットによって得られたものである。そこで、エピポーラ画像とパノラマ画像と比較し、多くの情報を保てるサインスリットによる2次元時空間画像の生成手法を提案している。ある縦線を対象として、カメラを均一速度で左側から右側へ動きながら得られた3次元時空間画像の中では、縦線の軌跡は平面となり、それより生成されたエピポーラ画像、パノラマ画像と一般的な2次元時空間画像は図1に示す。　第4章では、2次元時空間画像上のパターンに大きな影響を与えるスライスの切り出しに利用されているスリットの選択について述べている。はじめに、不適当なスリットを利用することによって3次元直線のパラメータを推定できなくなる失敗例より、スリットの選択の必要性について述べている。次に、パラメータ推定に不可欠な行列計算において、パラメータの推定精度が推定行列の条件数に大きく左右されることについて実例と理論の両面から検証している。さらに、直線スリット、2次曲線スリットと提案するサインスリットについて、生成された2次元時空間画像からの3次元直線のパラメータ推定精度、及び各々の推定行列の条件数の比較を行い、サインスリットの推定精度が高いことを示している。　第5章では、2次元時空間画像からの3次元直線のパラメータの推定に関する実験について述べている。はじめに、カメラは直進のみを限定して、サインスリットを利用した場合の3次元直線のパラメータの推定に必要な4次元ハフ変換を2段階の2次元ハフ変換ですませる手法を提案し、実験を通して検証している。次に、カメラが直進しない場合について、3次元直線のパラメータの回帰的な推定手法を提案し、実験を行なっている。　以上のように、第3章から第5章までは、2次元時空間画像から3次元直線のパラメータの推定について検討している。　第6章では、固有空間解析手法を2次元時空間画像に応用し、2次元時空間画像に適応する固有空間解析手法を提案している。2次元時空間画像では時間軸上の情報の変化がカメラの動きによって大きく変動する。そのため、2次元時空間画像を時間軸上で分割し、一列一列の画素値を固有空間解析手法の入力ベクトル画像とする。さらに、そのベクトル画像を幾つかのシフト画像に分割したり、拡大したりすることにより、新しい画像列を生成して、固有空間を生成したり、画像を認識したりすることに利用している。これにより、提案する手法は時空間画像のシフトやスケーリングに対応できるようになっている。最後、固有空間解析手法を通して、2次元時空間画像のマッチングと認識に関する実験を行ない、提案した手法の効果について検証している。　第7章では、本論文の結論について述べ、今後の課題について考察している。　以上これを要するに、本論文は3次元時空間画像のデータ量を減らすことによって、より少ないデータで、3次元世界の構築と認識手法として、サインスリットによる2次元時空間画像の生成の提案、生成された2次元時空間画像から3次元直線のパラメータの推定のための2段階2次元ハフ変換手法と積分手法の提案、そして2次元時空間画像へ適応する固有空間解析手法の提案、且2次元時空間画像のシフトとスケーリングと対応する解析手法の提案と併せて2次元時空間画像の生成から、2次元次空間画像を用いた3次元世界の構築と認識という応用までについて検討しているものである。図1:エピポーラ画像、パノラマ画像と一般的な2次元時空間画像
審査要旨		本論文は「2次元時空間画像を用いた3次元世界の構築と認識」と題し、動画像から3次元世界の抽出・構築を行なう技術に関して、大幅なデータ低減を可能とする2次元時空間画像変換を対象に、新しい切り出し方式による3次元情報抽出方式の提案と適用方式の開発、及び固有空間解析手法を応用した新しい認識方式を提案したもので、英文7章から構成されている。　第1章は「序論」であり、研究の背景と目的及び論文の構成について述べている。　第2章「3次元時空間画像と2次元時空間画像」では、従来の3次元時空間画像に関連する研究を概説し、データの冗長性と時間・空間情報との関連性から体系的に論じて、これまでによく研究されてきたエピポーラ画像やパノラマ画像なども一般的な2次元時空間画像に帰着できることを明らかにしている。　第3章「2次元時空間画像上の3次元直線」では、解析の対象を3次元空間の直線と限定し、2次元時空間画像の生成、及び2次元時空間画像中に3次元直線の軌跡として生成されるパターンについて解析している。この解析に基づきカメラが直進している場合に、2次元時空間画像上における3次元直線のパラメータに関わる線形関係式を導出している。次に、これにもとづき従来のエピポーラ画像、パノラマ画像と比較してより多くの情報を保てるサインスリットによる2次元時空間画像の生成手法を提案し、これにもとづく3次元情報の抽出方法を示している。　第4章「スリットの選択」では、2次元時空間画像上のパターンに大きな影響を与えるスライスの切り出しに利用されているスリットの選択について述べている。先ず、選択基準として3次元直線のパラメータ推定精度を提唱し、その根拠を検証している。次に従来の直線スリット、2次曲線スリットと提案するサインスリットについて、生成された2次元時空間画像からの3次元直線のパラメータ推定精度、及び各々の推定行列の条件数の比較を行ない、サインスリットの推定精度が高いことを示している。　第5章「2次元時空間画像からの3次元直線のパラメータの推定」では、3次元直線のパラメータの推定に関する実験について述べている。はじめに、カメラが直進運動する場合について、サインスリットを利用した場合の3次元直線のパラメータの推定に必要な4次元ハフ変換を2段階の2次元ハフ変換ですませる手法を提案し、実験を通して検証している。次に、カメラが直進しない場合について、3次元直線のパラメータの回帰的な推定手法を提案し、実験を行ない、有効性を実証している。　第6章「2次元時空間画像の固有空間解析」では、固有空間解析手法を2次元時空間画像に応用し、2次元時空間画像に適応する固有空間解析方式を提案している。方式では、2次元時空間画像を時間軸上で分割し、一列一列の画素値を固有空間解析手法の入力ベクトル画像とし、幾つかのシフト画像に分割・拡大することにより、新しい画像列を生成し、これに基づく固有空間を用いて、画像を認識している。次に、2次元時空間画像のマッチングと認識に関する実験を行ない、提案した手法の効果について検証している。　第7章「結論」では、本論文の結論について述べ、今後の課題について考察している。　以上これを要するに、本論文は動画像からの3次元世界の構築と認識手法として、サインスリットによる2次元時空間画像の生成方式、2次元時空間画像へ適用する固有空間解析方式などの一連の手法を提案し、実証実験によってその有効性を示したもので、電子情報工学上貢献するところが少なくない。　よって、本論文は東京大学大学院工学系研究科電子工学専攻における博士(工学)の論文審査に合格と認められる。
UTokyo Repositoryリンク