学位論文要旨



No 120765
著者(漢字) 岡,兼司
著者(英字)
著者(カナ) オカ,ケンジ
標題(和) 柔軟なインターフェイスの実現に向けた人間行動の計測と理解
標題(洋)
報告番号 120765
報告番号 甲20765
学位授与日 2005.09.30
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第62号
研究科 情報理工学系研究科
専攻 電子情報学専攻
論文審査委員 主査: 東京大学 教授 池内,克史
 東京大学 助教授 佐藤,洋一
 東京大学 教授 石塚,満
 東京大学 教授 相澤,清晴
 東京大学 助教授 上條,俊介
 東京大学 助教授 苗村,健
内容要旨 要旨を表示する

近年,ユビキタスコンピューティング環境と呼ばれる,人間の周辺にコンピュータが多数遍在する環境が普及しつつある.このような環境のもとでは,遍在するコンピュータが人間の行動を自動的に計測・理解し,その結果に応じて人間にとって最適なサービスを提供するようなインタフェースが望まれる.このようなインタフェースは「柔軟なインタフェース」と呼ばれ,近年注目を集めている.柔軟なインタフェースの場合,人間は周囲に潜む多数のコンピュータを明示的に操作する必要がないため,ユビキタスコンピューティング環境のもとに置かれた人間にとって,非常に負担の少ないインタフェースであると言える.

以上に述べたような柔軟なインタフェースを実現するために最も重要な技術要素の一つとなるのが,人間の行動を自動的に計測し理解するための技術である.そこで本研究では,人間の各器官の動作を,安定して自動的に計測・理解するための技術について研究を進めてきた.

ここで,本研究の全体的な指針について述べる.本研究の動作計測手法はマン・マシン・インタフェースに利用することを前提としており,ユーザにとってできるだけ煩わしさを感じない手法でなければならない.そのためには,次に示す3個の条件を満たす必要がある.まず,ユーザに何らかのデバイスを装着する必要がないことが重要である.この問題に対して,本研究では,コンピュータビジョンにもとづいた,非装着・非接触型の動作計測を行うこととする.次に,動作計測に大幅な遅延が生じないように,汎用コンピュータでも実時間処理が可能な程度に計算コストが低い手法を実現する.最後に,インタフェースにも十分に適用可能な程度の精度や安定性で動作計測を行う.本研究では,以上の条件を満たすような手法の開発を行った.

以上の指針を踏まえた上で,まず,人間の数多くの器官の中でも最も動作させる頻度が多い器官の一つとして,手や指先の動作を安定して計測するための手法について研究を行った.手指追跡手法については従来から数多く提案されてきたが,実時間性を維持しながらも高い精度と安定性で複数の指先位置を追跡可能な手法はほとんど存在しなかった.そこで本研究では,赤外線カメラから得られる個々の入力画像フレームの中で検出された複数の指先位置に対して,画像フレーム間での指先同士の対応関係を考慮することにより,複数の指先の動作を計測することを可能とした.ここでは,まず,各画像フレームでの検出された指先位置に対して時系列フィルタを適用し,直後のフレームでの各指先の位置を予測する.次に,それらの予測位置と直後のフレームで実際に検出された指先位置との最適な組み合わせを決定することにより,隣り合う画像フレーム間での指先同士の対応関係を求める.本手法により,指の曲げ伸ばしによる指先の検出数が変化する場合や指先の検出に失敗した場合にも,複数の指先軌跡を実時間で安定して計測することが可能となった.指先同士の対応関係を考慮することによる指先追跡性能の向上に関しては,実験を通して証明することができた.

さらに,計測した指先動作をジェスチャとして認識するための手法についても提案した.特に,ダイレクトマニピュレーションとシンボリックジェスチャという二つの動作モードを統合的に利用するための機構についての提案を行った.従来のジェスチャ認識手法では,これら二つの動作モードを統合的に利用するという枠組み自体がほとんど存在せず,本手法のような機構の開発は斬新な試みである.本機構を実現するために,まず,計測された指先軌跡に基づいて,ダイレクトマニピュレーションとシンボリックジェスチャを自動判別する.その後,ダイレクトマニピュレーションとして判別された指先動作については指先位置情報を直接的にインタラクションに用いるとともに,シンボリックジェスチャとして判別された動作に対しては隠れマルコフモデルに基づく認識を行う.これにより,手の動作にもとづく様々な種類のインタラクションを可能とするための機構を実現することに成功した.

以上の手指動作の計測・理解についての研究により,手と指先動作を実時間で計測することが可能となった.その一方で,本研究における新たな問題も明らかになってきた.それは,計測された手指動作が意識的に行われたものであるかどうかを判断するのが困難であるという問題である.この問題が原因で,ユーザが意図しない偶発的な手動作についてもジェスチャとして認識してしまうという状況が頻繁に発生し,手動作の安定した認識・理解に向けての大きな障害となることがある.これは,手のジェスチャを認識するために手の動作から得られる情報だけしか利用しておらず,ユーザの意識的な動作を検出するために十分な情報が得られていないためである.

この問題に対して,本研究では,ユーザの意図と密接な関係を持つ情報として,ユーザの視線方向や顔の向きに関する情報についても同時に計測することとした.このうち,視線方向に関しては,特殊な装着型デバイスや目の周辺の高解像度画像が必要とされ,一般的なインタフェースへの応用は困難である.そこで本研究では,ユーザの顔の向きの計測を目的とし,頭部姿勢を3次元的に実時間で推定するための手法を提案した.

本研究の頭部姿勢推定手法では,入力画像への雑音や部分的な遮蔽への頑健性の観点から,時系列フィルタの一つであるパーティクルフィルタを利用する.その上で,本研究では,インタフェースへの適用を前提として,次の2点を同時に実現することが特に重要と考える.それは,ユーザ頭部の突発的な動作に対しても安定して追従することが可能であるという点と,ユーザが空間中のある一点に注目して頭部が静止している際には高精度に頭部姿勢を推定することが可能であるという点である.しかしながら,これらを同時に実現可能な手法は従来手法にはほとんど存在しなかった.そこで本研究では,パーティクルフィルタにおける仮説の拡散要素をユーザ頭部の速度に応じて適応的に制御するという手法を導入することにより,この2点を同時に実現することに成功した.このような適応的拡散制御による姿勢推定性能の向上に関しては,実画像を用いた実験を通して証明した.

また,インタフェースに応用する上では,任意のユーザが利用可能なシステムであることも求められる.しかしながら,従来手法ではシステムを使用するユーザを限定し,そのユーザ専用のモデルを追跡開始前にあらかじめ構築しておくという方法を採用している手法が多く見られる.これに対し,本システムでは,ユーザが画像領域内に入ってきた瞬間にそのユーザ専用の3次元頭部モデルを自動的に構築ための機構を実現した.ここでは,2台のカメラにより撮影された入力画像から,顔器官検出技術やステレオマッチング技術などを用いて,ユーザ頭部の複数の特徴点の3次元位置を計算する.ここで計算された特徴点位置を用いて3次元頭部剛体モデルを構築し,そのモデルを使用して頭部姿勢推定を開始する.これにより,任意のユーザに対して特別な事前準備なしに頭部姿勢を計測することが可能となった.

さらに,頭部姿勢の実時間推定と並行してユーザの顔形状変化を分析することにより,頭部変形モデルの自動構築も実現した.このように頭部変形モデルの構築と頭部姿勢推定の並行実行を試みた手法は過去に提案されておらず,本手法は非常に斬新なアプローチであると言える.本手法では,頭部剛体モデルを用いた姿勢推定の結果を手がかりとして頭部の各特徴点の正確な動きを実時間で計測する.こうして計測した特徴点の動きを分析することにより,姿勢推定を継続しながらも,新たな頭部変形モデルを構築するという手法を導入した.このように構築した頭部変形モデルを用いて頭部姿勢を推定することにより,表情変化などを原因とする顔の変形が発生した場合にも,安定して頭部姿勢を推定することが可能となった.この推定性能の向上に関しても,実画像を用いた実験により証明できた.

以上の研究により,インタフェースへの応用を前提とした上で,手指動作と頭部姿勢を計測することが可能となった.そこで本論文では,これらの動作計測手法を実際のアプリケーションとして応用した例について幾つか紹介する.そして,それら応用例の有効性を考察するとともに,本研究の計測手法の有効性についても考察を行った.

審査要旨 要旨を表示する

本論文は、「柔軟なインタフェースの実現に向けた人間行動の計測と理解」と題し、画像情報にもとづき人間の行動を自動的に計測および理解するための技術について論じたものであり、両手動作の実時間計測と認識、頭部の3次元姿勢と変形量の実時間計測などを含め、全体で5章からなる.

第1章は「序論」であり、柔軟なインタフェースの意義とその必要性について論じ、柔軟なインタフェースを実現するために必要となる要素技術として人間の行動を計測・理解するための技術を挙げている.

第2章は「手と指先位置の計測と動作認識」であり、複数の指先の動作を高い安定性と精度をもって実時間で計測するための技術を提案している.ここでは、赤外線カメラからの入力画像から複数の指先位置を検出した上で、時系列フィルタを用いてこれらの位置を隣りあう画像フレーム間で対応付けることにより、安定した指先軌跡の計測を実現している.それとともに、計測した指先軌跡をダイレクトマニピュレーションとシンボリックジェスチャとして識別・認識するための手法を提案し、それらを統合的に認識するための機構についても説明している.

第3章は「頭部の3次元的な姿勢の計測」であり、人間の3次元的な頭部姿勢を安定に実時間で計測するための手法について説明している.特に、パーティクルフィルタの拡散要素を頭部の速度に応じて適応的に制御することにより、頭部の突発的な動作に対する追従性と頭部静止時の姿勢推定精度を同時に向上させるための手法について提案している.加えて、頭部の変形モデルを事前学習なしに自動的に構築するために、頭部姿勢を実時間で推定するのと並列に頭部変形モデルを構築することが可能な枠組みについても提案している.ここで構築された頭部モデルを利用して頭部姿勢を推定することにより、顔変形が発生した場合にも安定して頭部姿勢を推定することを可能としている.

第4章は「計測技術のインタフェースへの応用」であり、第2章と第3章で開発した動作計測技術を実際のアプリケーションに利用した研究例について述べている.例えば、拡張机型インタフェースやマルチディスプレイ環境に対して計測技術を適用することにより、非常に有効性の高いインタフェースを実現している.これらの研究例を通して、本研究で提案した計測技術が有効性の面でも高い性能を持っていることを証明している.

第5章は「結論」であり、本論文の主たる成果をまとめるとともに、今後の課題と展望について述べている.

以上、これを要するに本論文は、マン・マシン・インタフェースへの応用を前提として、信頼性と有効性を両立可能な人間の行動計測・理解について検討した上で、実際に人間の手指動作と頭部姿勢の運動を実時間で安定して計測するための手法を論じたものであって、電子情報学上の貢献は大きい.

よって本論文は博士(情報理工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク