学位論文要旨



No 113064
著者(漢字) 李,春暁
著者(英字)
著者(カナ) リ,チュンシャオ
標題(和) 時空間変換を用いた交通映像の解析に関する研究
標題(洋)
報告番号 113064
報告番号 甲13064
学位授与日 1997.12.12
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4020号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 坂内,正夫
 東京大学 教授 田中,英彦
 東京大学 教授 井上,博充
 東京大学 教授 池内,克史
 東京大学 教授 喜連川,優
内容要旨

 近年、コンピュータ処理速度の向上、画像処理技術の発展、高速大容量情報蓄積媒体や画像処理専用装置などの普及に伴って、より高速に画像データを処理、分析することが可能となってきている。このような中、都市環境や交通状況など様々な実世界情報を画像から獲得することを可能とする画像処理、画像認識技術が注目されている。画像認識とは、カメラで撮影した画像の分析、処理を行うことによって、人間のように、実世界の物体の3次元情報の獲得や、物体の認識を実現する技術のことで、いわゆるコンピュータビジョン技術である。画像はテキスト情報に比べて、データ量が多く、特に連続画像の場合、非常に膨大な量のデータとなり、分析、処理するのに時間がかかる。このため、目標物体の3次元情報を保ちながら、処理するデータ量をいかに減らすかが非常に重要な研究テーマの一つとなっている。本論文では、具体的な応用を考え、目標物体の特徴、カメラの運動などに応じて従来の3次元時空間画像を2次元時空間画像に変換し、3次元情報の獲得ができる新しい手法を提案する。2次元時空間画像への変換によって3次元時空間画像のデータ量が大幅に減り、画像の処理時間を短縮することが可能となり、さらに、生成された2次元時空間画像からより簡単に目標物体の3次元情報を獲得することができる。提案手法は平面から構成される人工物体の3次元情報の獲得には、特に有効である。本論文では、論理的な分析を行った上で、具体的な応用例を用いて提案手法の有効性を示す。

 第一章では、本研究の背景及び論文の構成について述べる。

 第二章では、従来のステレオビジョンの対応点づけ問題の解決に有力な方法として研究されてきた3次元時空間画像解析による3次元情報の獲得及びその応用について紹介し、本研究の位置付けを明確にする。

 第三章では、スリットを用いた連続画像からの2次元時空間画像への変換について一般的に検討する。従来の3次元時空間画像においては、膨大なデータ量が含まれているため、処理するのに長い時間が必要となる。2次元時空間への変換は連続画像のデータ量を減らし、処理時間の短縮を可能にするとともに3次元情報の獲得処理をより簡単にすることもできる。変換を行う際、カメラの運動とスリットの形状などは目標物体の2次元時空間画像への投影に大きな影響を与える。本章では、幾つかの典型的なカメラ運動を基本にして、カメラの運動、目標物体の特徴とスリットの形状の関係を分析し、スリットの選択と、連続画像から2次元時空間画像への変換について述べる。

 第四章では、双曲線スリットによる2次元時空間画像の生成と2次元時空間画像からの3次元情報の獲得について述べる。提案手法は都市情景中の建物のような平面物体を等速直線運動するカメラから観測し、その3次元情報の獲得を目的とする。提案手法では、画像上に設置された双曲線スリットによって連続画像をサンプリングし、2次元時空間画像を生成する。この時、生成された2次元時空間画像には対象物体の直線エッジの直線性が保存される。さらに、2次元時空間画像上の直線のパラメータがもとの3次元空間における直線エッジの位置情報と一意な関係をもつことから、その3次元情報を推定することが可能となる。また、本章では3次元直線パラメータの算出誤差を最小にする双曲線の最適形状は、観測系に固有な定数と、観測対象である建物の存在位置から決定できることを明らかにする。

 第五章では、カメラの回転によるカメラ運動自由度の拡張について述べる。2次元時空間画像から目標物体の3次元情報を獲得するため、目標物体をはっきり画像に撮らなければならない。そのため、本章ではカメラを目標物体の存在方向に回転してから走行しながら撮影した画像から、目標物体の3次元情報の獲得ができることを示す。カメラを回転する利点としては次の二つが上げられる。ひとつはカメラの視野が拡張される。カメラの回転によってカメラの走行ルート沿いにある目標物体はより多く、はっきり映るようになる。その上、目標物体間の遮蔽問題も大幅に改善される。もうひとつはカメラの撮影距離が短縮される。

 第六章では、提案手法の応用の一つとして、道路画像から時空間変換による建物の3次元情報の獲得と表面復元について述べる。具体的には、まず、道路から移動カメラで撮影した建物の連続画像を選択されたスリットによって2次元時空間画像に変換する。この2次元時空間画像から検出された建物の特徴エッジによって建物の3次元情報を獲得する。そして、建物の3次元情報と、建物の対称性とカラーのような構造的・表面的な特徴などに基づいて建物の各々の個体を区別する。さらにそれぞれの建物の3次元情報を用いて2次元時空間画像から建物の表面を復元する。

 第七章では、2次元時空間画像変換を用いた道路交通の観測と車両の3次元情報の獲得について述べる。この応用において、カメラは視覚センサーとして道路上に設置される。このカメラから撮影された連続道路画像の処理、分析によって道路の観測と車両情報の獲得を行う。具体的な処理においては、まずスリットを用いて連続道路画像を2次元時空間画像に変換し、画像のデータ量を減らす。そして、生成された2次元時空間画像から車両を検出して道路の交通情報を獲得する。さらに、2次元時空間画像から車両の特徴エッジの3次元情報に基づいて各車体の3次元情報と表面情報を獲得する。

 第八章では、本研究において得られたことをまとめて、結論とする。

 以上のように、本論文では、まず、従来の3次元時空間画像の膨大のデータ量を減らし、より簡単な処理で目標物体の3次元情報を獲得することのできる新しい手法を提案した。そして、提案手法の具体的なアプリケーションとなる建物の3次元情報の獲得とカメラによる道路観測への適用によって、その有効性を実証した。

審査要旨

 本論文は、「時空間変換を用いた交通映像の解析に関する研究」と題し、次世代道路交通システムの応用などで重要性を増している交通関連の3次元動画像解析技術に関して、対象の状況に適応する新しい画像変換法と、3次元情報獲得法とを提案し、それに基づく一連の解析方式の研究についてまとめたものであり、英文8章から構成されている。

 第1章は「序章」であり、本研究の背景と目的について述べている。

 第2章は、「関連研究」と題し、従来の3次元情報の獲得方式や、その中での有力方式である3次元時空間画像を用いた従来の方式を概説すると共に問題点を分析し、処理データ量、処理時間の改良が必要であることを明らかにしている。

 第3章は「2次元時空間画像変換方式」と題し、選択された変換スリットによって従来の3次元時空間画像をより効率の良い2次元時空間画像に変換し、これをもとに対象物体の3次元情報を抽出する新しい方式の一般論を提案している。更に、カメラの運動、対象物体の形状とスリットの形状との関係を分析している。

 第4章は、「双曲線スリットによる2次元時空間画像の生成と3次元情報の獲得」と題し、第3章の一般論から最も有力な方式として、双曲線変換スリットを用いる方式を提案し、対象とする画像から直線で構成される物体の3次元情報を獲得する方法論を示している。更に、交通応用に対応するために、カメラの等速直線運動、非等速直線運動への対処方法や、算出誤差を最小化するための変換スリットの最適設計法などを理論的に明らかにしている。

 第5章は、「回転を考慮したカメラ運動への拡張方式」と題し、カメラに回転がある状況を対象に、第4章の基本方式を拡張する方式を提案し、これに基づく3次元情報獲得方式を理論的に示している。

 第6章は、「画像解析による建物3次元情報の獲得」と題し、第4章、第5章の手法を応用して、市街地の建物を対象とする3次元情報の獲得実験を行ない、方式を定量的に評価している。更に、別の応用として、テキスチャ等の他の建物属性と結合した3次元物体の表面画像の復元実験を行なっている。

 第7章は「道路画像からの交通情報の獲得」と題し、第4章、第5章の手法の応用手法として、道路交通の観測と通過車輌の3次元情報の獲得への適用方法を明らかにし、実際の交通映像を用いた評価実験を行ない、本方式の有効性を明らかにしている。

 第8章は「終章」であり、本研究の成果が要約されている。

 以上、これを要するに、本論文は対象やカメラの動きに適応する新しい変換方式に基づいて3次元情報を獲得する効率の良い動画像解析方式を提案し、道路交通応用で現われる状況を考慮した適用方式、誤差最小化方式などを実現すると共に、その有効性について実例を持って検証したもので、情報工学上貢献するところが少なくない。

 よって、本論文は東京大学大学院工学系研究科情報工学専攻における博士(工学)の論文審査に合格と認められる。

UTokyo Repositoryリンク