近年、コンピュータの処理速度の向上に伴い、動画である3次元時空間画像を効率よく処理し、解析できる環境が整ってきている。一方、人間のように、3次元時空間画像に含まれている膨大なデータを高速に記憶したり、解析することはまだ困難である。このため、人間と同等な能力をもつ汎用処理システムの開発を目指すのではなく、限定した環境の中で特定の目的に対する個別システムを開発するのが、現段階での3次元時空間画像に関する研究の流れである。 3次元時空間画像は、カメラにより撮影された連続画像から形成され、多くの冗長なデータが含まれるため、記憶するのに多くの蓄積媒体が必要となり、また、解析するのに時間がかかる。本研究では、処理するデータ量を減らし、処理時間を短縮するため、必要な情報を保ちながら、3次元時空間画像を2次元時空間画像に変換した上で、3次元世界の構築と認識を行うことを目的とする。本論文は「2次元時空間画像を用いた3次元世界の構築と認識」と題し、7章から構成される。 第1章は「序論」であり、研究の背景と目的及び論文の構成について述べている。 第2章では、ステレオビジョンのパラダイムから3次元時空間画像に基づくビジョン手法への遷移、そして2次元時空間画像の生成について述べている。はじめに、3次元時空間画像のデータの冗長性と、時間情報と空間情報の不確定性(あるいは融合性)を概説している。次に、データ量の減少手法として、これまでによく研究されてきたエピポーラ(epipolar)画像やパノラマ(panorama)画像などを取り上げ、これらは3次元時空間画像のスライス(slice)に帰着することができ、3次元時空間画像の任意のスライスは概括的に一般的な2次元時空間画像であると提唱している。 第3章では、解析の対象を3次元空間の直線と限定し、2次元時空間画像の生成、及び2次元時空間画像中に3次元直線の軌跡として生成されるパターンについて述べている。ここでは、カメラが直進していると限定し、2次元時空間画像上における3次元直線のパラメータに関わる線形関係式を導出している。3次元時空間画像上で、時間軸と直交する平面と2次元時空間画像であるスライスとの交線はスリットと定義されれば、エピポーラ画像とパノラマ画像は直線スリットによって得られたものである。そこで、エピポーラ画像とパノラマ画像と比較し、多くの情報を保てるサインスリットによる2次元時空間画像の生成手法を提案している。ある縦線を対象として、カメラを均一速度で左側から右側へ動きながら得られた3次元時空間画像の中では、縦線の軌跡は平面となり、それより生成されたエピポーラ画像、パノラマ画像と一般的な2次元時空間画像は図1に示す。 第4章では、2次元時空間画像上のパターンに大きな影響を与えるスライスの切り出しに利用されているスリットの選択について述べている。はじめに、不適当なスリットを利用することによって3次元直線のパラメータを推定できなくなる失敗例より、スリットの選択の必要性について述べている。次に、パラメータ推定に不可欠な行列計算において、パラメータの推定精度が推定行列の条件数に大きく左右されることについて実例と理論の両面から検証している。さらに、直線スリット、2次曲線スリットと提案するサインスリットについて、生成された2次元時空間画像からの3次元直線のパラメータ推定精度、及び各々の推定行列の条件数の比較を行い、サインスリットの推定精度が高いことを示している。 第5章では、2次元時空間画像からの3次元直線のパラメータの推定に関する実験について述べている。はじめに、カメラは直進のみを限定して、サインスリットを利用した場合の3次元直線のパラメータの推定に必要な4次元ハフ変換を2段階の2次元ハフ変換ですませる手法を提案し、実験を通して検証している。次に、カメラが直進しない場合について、3次元直線のパラメータの回帰的な推定手法を提案し、実験を行なっている。 以上のように、第3章から第5章までは、2次元時空間画像から3次元直線のパラメータの推定について検討している。 第6章では、固有空間解析手法を2次元時空間画像に応用し、2次元時空間画像に適応する固有空間解析手法を提案している。2次元時空間画像では時間軸上の情報の変化がカメラの動きによって大きく変動する。そのため、2次元時空間画像を時間軸上で分割し、一列一列の画素値を固有空間解析手法の入力ベクトル画像とする。さらに、そのベクトル画像を幾つかのシフト画像に分割したり、拡大したりすることにより、新しい画像列を生成して、固有空間を生成したり、画像を認識したりすることに利用している。これにより、提案する手法は時空間画像のシフトやスケーリングに対応できるようになっている。最後、固有空間解析手法を通して、2次元時空間画像のマッチングと認識に関する実験を行ない、提案した手法の効果について検証している。 第7章では、本論文の結論について述べ、今後の課題について考察している。 以上これを要するに、本論文は3次元時空間画像のデータ量を減らすことによって、より少ないデータで、3次元世界の構築と認識手法として、サインスリットによる2次元時空間画像の生成の提案、生成された2次元時空間画像から3次元直線のパラメータの推定のための2段階2次元ハフ変換手法と積分手法の提案、そして2次元時空間画像へ適応する固有空間解析手法の提案、且2次元時空間画像のシフトとスケーリングと対応する解析手法の提案と併せて2次元時空間画像の生成から、2次元次空間画像を用いた3次元世界の構築と認識という応用までについて検討しているものである。 図1:エピポーラ画像、パノラマ画像と一般的な2次元時空間画像 |