本論文は、"Study and Design of Advanced Visual Communication Systems"(高度画像通信システムに関する研究)と題し、視線の一致を実現するテレビ会議システムの開発と、顔の向きの推定とそのテレビ会議システムへの応用に関する研究であり、10章より構成され、英文で記述されている。 第1章は「序論」であり、研究の背景、歴史とその意義について述べている。 第2章は「画像通信技術」と題し、テレビ会議、テレビ電話あるいはネットワークを介する協調作業システムなどの現存の画像通信技術について述べるとともに、その問題点を明らかにしている。 第3章は「視線の一致を伴うテレビ会議システム」と題し、画像通信における視線の一致の重要性を論じている。話者の注視している点とその話者をとらえるカメラの位置のずれがもたらす違和感に関する実験を行い、水平あるいは垂直方向のずれ、すなわち視線の不一致が大きな違和感を生じさせ得るのに対し、奥行き方向のずれはそれほど違和感を生じさせないとの結論を導いている。さらに、視線の不一致を感じないための視差角の許容範囲はおおむね水平方向に5°以内であり、また上方向より下方向に広いということを示している。 第4章は「複数の出席者間の視線一致の可能なテレビ会議システム-MPEC-概要と設計」と題し、複数の会議出席者が存在する場合に、各出席者間の視線一致を同時に実現するMPEC(Multiple Person Eye Contact)テレビ会議システムを提案している。提案システムにおいてはハーフミラーを利用し、その上に映された相手の顔の後ろにカメラを配置、取得した画像を相手に提供する。カメラの物理的な配置を工夫することで、従来のシステムより少ないカメラ数で、なおかつ複数の出席者間の視線一致の可能なシステムを実現している。 第5章は「複数の出席者間の視線一致の可能なテレビ会議システム-MPEC-試作と結果」と題し、会議出席者が2対1の場合を想定したプロトタイプシステムの試作とその結果について述べている。試作したシステムによる実験を行い、提案システムでは、画像通信上重要な相手の視線に関する感覚を提供できること、出席者が複数であっても違和感のない画像を提供できることを検証している。 第6章は「顔の特徴検出とその追跡」と題し、画像処理のみより顔の特徴点を検出、追跡する手法を提案している。提案方式では、エッジ情報に基づいて特徴点を検出、追跡するが、表情の変化等によりフレーム間相関が低下した場合でも、従来の手法に比べ、よりよく追跡できることを示している。 第7章は「顔の向きの推定」と題し、顔の特徴点のモデルを用いて1枚のフレームより各特徴点の位置を求め、顔の向きを推定する手法を提案している。そして、顔画像のデータベースに対する実験により、高い正答率で顔の向きが推定できることを示している。 第8章は「視線の方向を考慮した圧縮方式-Line Of Gaze Centered Coding(LOGCC)」と題し、推定された顔の向きに関する情報を利用し、伝送する情報量を制御する手法(LOGCC-Line Of Gaze Centered Coding)を提案している。そして、実験により大きな違和感を生じることなく効率的に情報量を低減できることを示している。 第9章は「テレビ会議におけるSteerable Viewing Window(SVW)」と題し、推定された顔の向きの情報により他局のカメラを制御し、対話感覚を向上させる手法を提案している。そして、カメラの解像度に依存しない広視野画像を提供できることを示している。 第10章は「結論」であり、本論文の成果を要約している。 以上これを要するに、本論文は視線に重きをおいた、より臨場感のある画像通信システムに関する研究であり、複数の話者間の視線の一致の実現可能なテレビ会議システムを設計、試作、検証し、画像通信における視線の一致の重要性を明らかにするとともに、画像処理手法に基づく顔の向きの推定と、その情報を利用した高度通信システムの要素技術に関する検討を行ったものであり、電気通信工学上貢献するところが少なくない。 よって著者は東京大学大学院工学系研究科電気工学専攻における博士の学位論文審査に合格したものと認める。 |