学位論文要旨



No 118592
著者(漢字)
著者(英字) BOUKRAA,MUSTAPHA
著者(カナ) ブクラ,ムスタフア
標題(和) 知識に基づく情景解析のための計算機視覚アーキテクチャ
標題(洋) Computer Vision Architecture for Knowledge-Based Scene Analysis
報告番号 118592
報告番号 甲18592
学位授与日 2003.09.30
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5611号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 安藤,繁
 東京大学 教授 杉原,厚吉
 東京大学 教授 石川,正俊
 東京大学 助教授 新,誠一
 東京大学 助教授 篠田,裕之
内容要旨 要旨を表示する

単一視点からの立体を確認することは困難な問題である。全く、深さ情報はイメージの形成プロセスで失われる。この問題を克服する為の1つの方法は知識ベースの計算機視覚である。

それは場面を構成する物体の知識を利用した視覚場面の分析で成り立つ。これは場面の物体が特別なマーカーと印が付いていれば可能である。各マーカーは物体の識別コードを含んでいる。

我々が提案するアーキテクチャは4つの要素で成っている。

無線周波数の同一証明(RFID)。

無線周波数タッグ(RF Tags)は自動物体同一証明を可能にする。RF Tag は物体に付ける小さい電子装置であり、単一識別子(Tag ID)を含んでいる。RF Tagは無線周波数のインテロデータ(アンテナ)と伝達し合う。インテロデータがRF Tagを検出するとき、物体のTag Idを読み込む。従って物体は自動的に検出される.

オブジェクトモデル。

オブジェクトモデルは物体の幾何学的な特徴そして色を記述する。私達はXMLの標準でオブジェクトモデルを作成した。

微分オペレータ。

オブジェクトモデルを画像と合わせるには、画像処理を行う必要です。我々は動画像の空間/時間的な微分を計算し、増進された正確の特徴を得る新しい最適の微分オペレータを開発しました。これらの微分オペレータの理論的な原則は二次元の画像の微分を計算する為の安藤先生によって発明されました。私達は三次元場合にそれらを拡張しました。私達はこれらのオペレータをエッジ及びコーナーのようなイメージの特徴を、得るのに使用する。

レジストレーション:物体の姿勢/位置計算。

オブジェクトモデルと画像特徴を結合して、物体の3次元姿勢及び位置を計算する(=レジストレーション)。本研究の主要な結果はモデル点と像点をマッチングさせる為の新しい方法である。この方法は速くてローバストな方法である。この方法はprojective geometry(投影幾何学)を使用する。

我々が投影幾何学を使ったレジストレーションに関して新しく理論的な結果そして数調査を示す。投影幾何学は多視点の場合(例えば:エピポラ-幾何学)のために非常に普及している。

但し、最近だけ単一視点からの物体認識のための使用が始まりました。その理由は投影幾何学が画像の投射の良いモデルであるが、それは回転及び変位を扱う為の最適でないモデルであることである。我々の分析が、投影幾何学が単一視点からの知識ベース物体認識のために効率的に使用することができることを示す。

近年, RF-ID (radio frequency identification)と呼ばれる電子タグを利用したシステムが注目を浴びている。RF-IDは,情報世界であらゆる人工物を一意に区別する役割と,拘束されない物理世界でそれらを容易に検出し自動認識する両面の役割を有する。本論文は,このRF-IDの技術を利用し,計算機による視覚認識技術をネットワークを介した知識共有環境のもとで効果的に機能させ連携させるための新たな枠組みを提案した英文の論文であり,全体で6章から構成されている。

第1章のIntroductionにおいては,計算機による情景解析の研究の展開を心理学的背景と数理的背景の両面から捉えて,頑健な特徴抽出のための矛盾最小勾配演算子とRF-IDを用いたタグに基づく視覚システム(Tag-Based Vision)を本論文の主題として導入し位置づけている。

第2章のTag-Based Vision : Principleにおいては,RF-IDを検出・検索キーとした物理オブジェクトと知識ベースの連携の役割が整理されている。RF-IDによるオブジェクトの識別情報と,視覚システムによる位置姿勢情報を相補的に利用することにより,提案する視覚認識システムが新たに獲得する機能として,数多くの分散した視覚システムの協調動作,オブジェクトと視覚システムの協調による両者のパラメータの逐次的推定と校正を挙げ,またアルゴリズムの特徴として共有オブジェクトモデルを広範囲に活用した知識ベース型の算法を挙げて,タグに基づく視覚システムの基本的構成を明らかにしている。

続く第3章のFeature Extraction in Image Sequencesにおいては,オブジェクトモデルの色情報とカメラが捉える色情報とを照明条件の変動に頑健に対応付けるアルゴリズムと,動画像や三次元画像から勾配特徴量を矛盾最小で計算する数値演算子を提案している。

第4章のKnowledge-Based Object Registrationにおいては,オブジェクトモデルと2次元画像情報を効率的に対応付けるために,I. Weissらによって提案された投影不変量法を3次元不変量ベクトルと2次元不変量行列の2次形式判別法として定式化し直し,画像上の6点をモデル上の多数の候補点から選択して対応付けるアルゴリズムとして構成している。また上記の行列の行列式について,幾何学的意味付けと判別力に関する詳細な理論的数値的解析を行っている。

第5章のImplementation and Experimentsでは,実験システムのハードウェア・ソフトウェアの概要を示し,それを用いた実験により基本的な動作と機能を確認している。最後の第6章は結論であり,以上の成果を総括するとともに,将来の発展方向や応用展開について論じている。

以上,要するに,本論文は,RF-IDを新たなキーデバイスとして,視覚認識技術をネットワークを介した知識共有環境のもとで効果的に機能させる新たな枠組みとアルゴリズムを提案した論文であり,ユビキタス情報環境における視覚認識技術の発展方向に大きな示唆を与える内容を含んでいる。また,勾配演算子の最適設計や投影不変量に関する理論的考察は,これらのより深い理解と応用範囲の拡大に相応の意義が認められる。以上のことから,本研究は画像センシング技術と画像認識技術へ十分な貢献があり,計測工学上の意義が大きい。よって,本論文は博士(工学)の学位請求論文として合格と認められる。

RFIDを使った知識に基づく物体レジストレーションの原則。

審査要旨 要旨を表示する

近年, RF-ID (radio frequency identification)と呼ばれる電子タグを利用したシステムが注目を浴びている。RF-IDは,情報世界であらゆる人工物を一意に区別する役割と,拘束されない物理世界でそれらを容易に検出し自動認識する両面の役割を有する。本論文は,このRF-IDの技術を利用し,計算機による視覚認識技術をネットワークを介した知識共有環境のもとで効果的に機能させ連携させるための新たな枠組みを提案した英文の論文であり,全体で6章から構成されている。

第1章のIntroductionにおいては,計算機による情景解析の研究の展開を心理学的背景と数理的背景の両面から捉えて,頑健な特徴抽出のための矛盾最小勾配演算子とRF-IDを用いたタグに基づく視覚システム(Tag-Based Vision)を本論文の主題として導入し位置づけている。

第2章のTag-Based Vision : Principleにおいては,RF-IDを検出・検索キーとした物理オブジェクトと知識ベースの連携の役割が整理されている。RF-IDによるオブジェクトの識別情報と,視覚システムによる位置姿勢情報を相補的に利用することにより,提案する視覚認識システムが新たに獲得する機能として,数多くの分散した視覚システムの協調動作,オブジェクトと視覚システムの協調による両者のパラメータの逐次的推定と校正を挙げ,またアルゴリズムの特徴として共有オブジェクトモデルを広範囲に活用した知識ベース型の算法を挙げて,タグに基づく視覚システムの基本的構成を明らかにしている。

続く第3章のFeature Extraction in Image Sequencesにおいては,オブジェクトモデルの色情報とカメラが捉える色情報とを照明条件の変動に頑健に対応付けるアルゴリズムと,動画像や三次元画像から勾配特徴量を矛盾最小で計算する数値演算子を提案している。

第4章のKnowledge-Based Object Registrationにおいては,オブジェクトモデルと2次元画像情報を効率的に対応付けるために,I. Weissらによって提案された投影不変量法を3次元不変量ベクトルと2次元不変量行列の2次形式判別法として定式化し直し,画像上の6点をモデル上の多数の候補点から選択して対応付けるアルゴリズムとして構成している。また上記の行列の行列式について,幾何学的意味付けと判別力に関する詳細な理論的数値的解析を行っている。

第5章のImplementation and Experimentsでは,実験システムのハードウェア・ソフトウェアの概要を示し,それを用いた実験により基本的な動作と機能を確認している。最後の第6章は結論であり,以上の成果を総括するとともに,将来の発展方向や応用展開について論じている。

以上,要するに,本論文は,RF-IDを新たなキーデバイスとして,視覚認識技術をネットワークを介した知識共有環境のもとで効果的に機能させる新たな枠組みとアルゴリズムを提案した論文であり,ユビキタス情報環境における視覚認識技術の発展方向に大きな示唆を与える内容を含んでいる。また,勾配演算子の最適設計や投影不変量に関する理論的考察は,これらのより深い理解と応用範囲の拡大に相応の意義が認められる。以上のことから,本研究は画像センシング技術と画像認識技術へ十分な貢献があり,計測工学上の意義が大きい。よって,本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク