学位論文要旨



No 115544
著者(漢字)
著者(英字) BIRLONI FERENC
著者(カナ) ビロニ,フェレンツ
標題(和) 高速ビジョンを用いた3次元対象物追跡
標題(洋) Three Dimensional Object Tracking Using High Speed Vision
報告番号 115544
報告番号 甲15544
学位授与日 2000.04.13
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4732号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 石川,正俊
 東京大学 教授 安藤,繁
 東京大学 教授 藤村,貞夫
 東京大学 教授 舘,すすむ
 東京大学 教授 杉原,厚吉
内容要旨 要旨を表示する

 視覚は,人間すなわち情報システムとしての生体において重要な役割を担うものであり,我々の感覚において主要な器官であると言える.ロボットと制御の研究アプローチはこのような人間の性質の解析に基づいており,視覚フィードバック,すなわちコンピュータビジョンが,これらの研究分野でより一層,重要な位置を占めるようになりつつある.しかしながらコンピュータビジョンでは,ここで得られた様々な技術の応用を妨げるいくつかの問題に直面している.

 これらの問題は次の3つにまとめられる.最初の重要な問題は,画像の伝送と処理においてかなりのコストがかかることであり,これに対して十分なフィードバック速度を得るために高いパフォーマンスが実時間画像処理に必要となる.2つ目は,従来からのアクティブビジョンシステムの多くで,空間認識の能力が欠けており,その結果パフォーマンス,正確さ,応用性を著しく減じることになっている.3つ目の問題は,多くの場合で,画像の解析は取り込まれた画像の部分的な領域にのみ焦点をあてているところにあり,そのため,より正確な分析を行うためには,より高い解像度が必要とされる.

 現在,ここに挙げた問題のうち,最初の問題に対する解決として我々の研究室では超並列ビジョンチップを開発している.ただし,いまだ他の2つの問題が残されている.

 まず,画像取得のための機器について,パラメータの空間の解析を行った後で,従来の画像処理アルゴリズムを概観し,それらとともに,新しく独自の再帰的なメジアンフィタを導入した.提案する再帰メジアンフィルタは,画像センサ,特にビジョンチップのノイズを減少させるために用いられる.ただし,次の段階に研究を進める前に,従来の研究について広範囲に概観することで,この分野での新しい手法の開発の必要性が明らかになる.すなわちアルゴリズム開発のフェーズに研究を進めた時に,ビジョンチップのインタフェースについて簡単に概観すると,ビジョンチップにおけるあらゆる距離計測に還元すべき,新しいループ手法が最初に導かれる.このループ手法によって,デフォーカスパラメータを計測するアルゴリズムの開発のために十分な基盤が提供されることになる.

 次に,提案したアルゴリズムのビジョンチップヘの実装について,様々な誤差解析とともに示した.実際の実装を行うためには,処理とメモリアクセスのコストについての前提条件が必要となる.このアルゴリズム手法の開発の結果,処理コストと分解能を上げる新しいビジョンチップの設計について,提案を行った.

 提案する手法は,デフォーカスパラメータの計測によって,カメラキャリブレーションの段階で奥行き方向の距離測定を行うものである。このデフォーカスに基づく奥行き計測(Depth from defocus)アルゴリズムは,ターゲットトラッキングにおいて1画面あるいは連続画像においての有効性を示している。

 3次元対象追跡への応用を目的として提案するビジョンシステムは,ターゲットトラッキングのためのアクチュエータヘのフィードバックを目的としている。また,単一の画像フレームの解析に加えての連続性の推定手法は,カルマンフィルタ用いた対象の運動軌跡の予測手法のサーベイを基にしている。このセクションでは,3次元対象追跡実験の説明を行っており,ターゲットトラッキングにおけるアルゴリズム面からのアプローチとともに実験の分析結果について議論を行っている.3次元解析の実験結果を図1に示す.最後に動的なウィンドウ位置の予測手法が提案されている.

 論文の最後では実験結果についての評価と分析を行い,その効果を示し,将来の研究の方向性について見通しを立てた.

図1実験結果

審査要旨 要旨を表示する

 本論文は、「Three Dimensional Object Tracking Using High Speed Vision(高速ビジョンを用いた3次元対象物トラッキング)」と題し、7章より構成されている英文の論文である.3次元空間内を任意に移動する対象物のトラッキングを実現するためには、視覚情報を用いた非接触3次元計測が必要である.この際、高速に移動する対象物の動きを的確に捕らえるためには、高速の処理が不可欠である.しかしながら、従来の画像処理はビデオレートを基本としていたため、高速性が十分でなく、対象の動きを捕らえるには本質的な問題を抱えていた.そこで、処理の高速性を実現するため、ディジタル回路による完全並列を実現したビジョンチップが提案されているが、その回路上の制約から、例えばステレオ視等のような通信や演算の負荷の多いアルゴリズムは実装上の問題があり、対象の高速トラッキングを実現することは不可能であった.

 本論文は、このような問題に対して、実装可能な単純なアルゴリズムを開発することにより、現実的な制約条件のもとで高速の3次元対象物トラッキングが実現可能であることを示し、将来の実システムの実現に向けて、基本的な問題を解決し、その高い実現可能性を示したものである.

 第1章は「Introduction(序論)」であり、コンピュータビジョン、ビジョンチップ、ステレオ視等について、研究の現状を述べた上で、本論文の目的と構成を記述している.

 第2章は、「Analysis of the Vision System(ビジョンシステムの解析)」と題し、本論文で提案する手法の前提となるカメラの光学系に関して、理論的な解析を行っている.ここでは、ビジョンチップの解像度、画角、絞り、焦点距離等の関係を求めるとともに、各パラメータの設定方法や校正方法を述べている.

 第3章は、「Algorithm to Measure Defocusness(焦点ずれ測定アルゴリズム)」と題し、焦点ずれから3次元情報を得る基本的な方法を説明した上で、ビジョンチップでの実現を前提とした、すなわち厳しいハードウェア上の制約の中で、焦点ずれを検出するアルゴリズムを提案している.ここで提案された方法は、焦点ずれのモデルを簡素化し、繰り返し演算を導入することにより、僅かな数のレジスタで必要な情報を検出できることが示されている.

 第4章は、「Adoption to the High Speed Vision Chip(高速ビジョンチップヘの適用)」と題し、実際のビジョンチップ上で稼働可能なアルゴリズムであることを具体的なプログラムを示し、また、シミュレーションにより具体的な処理例を示すことにより、処理時間と使用レジスタ数の両面で実現可能であることを示している.また、この結果に基づき、解像度の向上を目指した新しいビジョンチップのアーキテクチャを提案している.さらにここで提案した方法を拡張して、対象物の速度を検出する方法を提案し、実験を行ってその有効性を示している.

 第5章は、「 Dynamic Analysis of the System(システムの動的解析)」と題し、上述の方法で3次元情報が得られた後、システム並びに対象物のダイナミックスを考慮したシステム構成方法を提案している.ここでは、カルマンフィルタを用いたシステムを提案している.また、簡単な実験系でアルゴリズムを検証し、高い精度が得られることを示している.

 第6章は、「 Object Recognition(対象物認識)」と題し、部分的に得られる3次元情報から対象物の認識を行う際の、再構成手法について実験を行い、その有用性を示している.

 第7章は、「Conclusion(結論)」であり、本研究の成果と今後の展望がまめられている.

 以上要するに、本論文は、高速ビジョンを用いて3次元対象物のトラッキングに必要となる要素技術に関し、厳しい制約条件の中で実現する方法を提案し、実験によりその有効性を示すことにより、将来の高速3次元トラッキングシステムの実現に向けた基本的な問題点を整理・解決し、高い実現可能性を示したものである.これにより、帰納的に前提条件が成立し、さらに高い性能が実現できることを示したものであり、関連する分野の研究の発展に貢献するとともに、計測工学の進歩に対して寄与することが大であると認められる.よって、本論文は博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク