学位論文要旨



No 122817
著者(漢字) 李,東姫
著者(英字) Lee,Dong Heui
著者(カナ) イ,ドンヒ
標題(和) 部分観測情報からの確率的ミメシスとそのヒューマノイドロボットへの応用
標題(洋) Statistical Mimesis from Partial Observation and its Application to Humanoid Robots
報告番号 122817
報告番号 甲22817
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第147号
研究科 情報理工学系研究科
専攻 知能機械情報学専攻
論文審査委員 主査: 東京大学 教授 中村,仁彦
 東京大学 教授 佐藤,知正
 東京大学 教授 國吉,康夫
 東京大学 講師 山根,克
 東京大学 講師 原田,達也
内容要旨 要旨を表示する

 This dissertation aims to design humanoid intelligence. Among various issues on humanoid intelligence, this dissertation focuses on development of humanoid's onboard intelligence. Humanoid's onboard intelligence means that a humanoid can recognize and estimate human's actions with its onboard vision systems in daily life, without using artificial markers.

 Currently, most motion recognition researches use motion capturing systems. In the case of optical motion capturing systems, humanoid cannot communicate with a human outside of a motion capture room and a human demonstrator is required to wear a marker attached suit. In the case of wearable capturing systems, a human demonstrator is required to wear the system, which consists of many gyros. Hence, in above cases, it can be said that a humanoid interact with a human indirectly by receiving perception information passively from the external motion capturing systems.

 In order to achieve humanoid's onboard intelligence, this dissertation includes (1) symbolizing human motion during interaction, (2) recognizing human behaviors from partial observation, (3) imitating congruent motions to the observation including invisible parts, (4) converting symbols into different spaces, and (5) localizing relative human position with respect to humanoid in the statistical and mathematical framework, which is inspired by the biological discovery of mirror neurons.

 With the fast proto-symbol acquisition, mimesis model's three functions are possible during human-robot interaction. By adopting the fast training method, when an untrained motion pattern is observed, mimesis model recognize that it is a new motion and starts on-line proto-symbol acquisition.

 By motion recognition from partial observation and motion generation conditioned by observation, it becomes possible to imitate a whole body motion from partial observation and to generate close motion to the observation.

 With symbols conversion method into different spaces, it becomes possible to nonlinear mimesis problem from partial observation, such as 3D motion imitation from watching 2D images using a monocular camera on a humanoid. In the scheme, positions and postures of a humanoid and a demonstrator are not pre-requisite. From two-dimensional image sequences of demonstrator's motion, the humanoid can generate its joint motor commands for imitation in 3D space.

審査要旨 要旨を表示する

 本論文は「Statistical Mimesis from Partial Observation and its Application to Humanoid Robots」(部分観測情報からの確率的ミメシスとそのヒューマノイドへの応用)と題し、6章からなっている。

 ロボットが人間の環境の中で生活を支援するようになるという展望の中で、ヒューマノイドロボットのもつ人間の形象は、人間とロボットの間に自然なコミュニケーションを成立させる要件であると考えられている。人間の運動をパターン情報として処理し、記号化を通して運動の認識と生成に利用するというミメシス原理は、進化人類学、脳科学、言語学などを横断的につなぐ人間の脳進化とコミュニケーションに関するパラダイムとして知られている。ヒューマノイドロボットの対人間コミュニケーション知能を、ミメシス原理に基づいて構築しようとする研究が急速な展開を見せつつある。本研究は、このような分野において、情報学的立場に立ち統計的情報処理の部分観測情報の扱いという側面から研究した成果をまとめたものである。

 これまでヒューマノイドロボットのミメシス研究はモーションキャプチャーなどの理想的に人間を観測できる環境を前提として議論されてきていた。人間が他者を見る状況やヒューマノイドロボットがオンボードのカメラで人間を観測する状況は理想的な観測とは程遠く、深さ方向の情報の低精度やオクルージョンによる情報の欠落が必ず付きまとっている。これは情報の一部が観測できない部分情報観測の問題と考えることができる。さらに、人間はマルチモーダルな感覚の融合において、関節や筋肉などのproprioceptiveな情報と視覚や聴覚などの固有感覚器によるexteroceptiveな情報の間の相互変換を自由に行なっている。ヒューマノイドロボットでも幾何学的情報の変換は議論されてきたが、統計的情報処理のもとで観測データのモダリティの違い超えて相互変換することが必要になる。本研究では、部分情報観測のもとで観測データのモダリティによらず相互変換を可能にする情報処理を扱い、これによってオンボードカメラを前提としたミメシス原理を構築し、それに基づいてヒューマノイドロボットの知能の構成法を明らかにすることを目的においている。

 第1章は序論であり、本論文の背景となる問題や先行する研究についてまとめた上で、ヒューマノイドロボットのミメシス原理と部分情報処理の関連について考察し、本研究の目的とするところを明確化している。

 第2章では、ミメシス原理の実装に際して採用される隠れマルコフモデルの表現と、それを用いた運動データの記号化の考え方と方法を概観している。

 第3章では、部分情報観測に基づくミメシス原理の実装に際して、4章と5章の統計的情報処理において必要になるいくつかの数学的結果を導いている。記号化のための計算法として知られるEMアルゴリズムに対して実時間性に優れたRelaxed Viterbi Training法を提案し、EMアルゴリズム、Viterbi Training法、Relaxed Viterbi Training法の間で比較検討を行ない、提案した方法の優位性を示した。記号に基づいた模倣による動作生成において、記憶の中から尤度の高いものを選択する従来の方法に対して、観測情報に条件付けられた尤度を計算することで現在の状況に適したものを記憶に照らして生成する方法を提案した。

 第4章では、部分情報観測からのミメシス原理の実装を目指して、ヒューマノイドロボットに搭載された単眼カメラ画像を用いた模倣動作の実現法を論じている。ここでは人間に光学的モーションキャプチャーで用いられる光学マーカが取り付けられており、単眼カメラで捉えた2次元画像においてマーカの識別がなされていることを前提として議論を行っている。部分情報観測の扱いや、関節角度からカメラ座標系への統計的データの相互変換などを実装し、単眼カメラに基づくミメシスが可能であることを実証した。

 第5章では、前章の議論で置いた光学マーカとその識別に関する前提条件をはずすために、ベクトルフィールドアプローチを展開した。単眼カメラの画像に表れる特徴点のオプティカルフローを用いて、これを記憶にある運動データと統計的に対応付けることで上記の前提条件を置かずに、単眼カメラに基づくミメシス原理の実装が可能であることを示し。実験によりその有効性を検証した。

 第6章は結論であり、以上の成果をまとめ今後の展望を述べている。

 以上を要するに、本研究はミメシス原理に基づくヒューマノイドロボットのコミュニケーション知能の構築において、情報学的立場に立ち統計的情報処理の部分観測情報の扱いという側面から研究した成果をまとめたものであり、知能機械情報学ならびにロボティクスに寄与するところが大きい。

 よって本論文は博士(情報理工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク