学位論文要旨



No 121892
著者(漢字) 高野,渉
著者(英字)
著者(カナ) タカノ,ワタル
標題(和) 運動パターンの統計的分節化,原始シンボルコーディング及びクラスタリングとその人間とヒューマノイドロボットの記号的コミュニケーションへの応用
標題(洋) Stochastic Segmentation, Proto-Symbol Coding and Clustering of Motion Patterns and Their Application to Signifiant Communication between Man and Humanoid Robot
報告番号 121892
報告番号 甲21892
学位授与日 2006.09.29
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第106号
研究科 情報理工学系研究科
専攻 知能機械情報学専攻
論文審査委員 主査: 東京大学 教授 中村,仁彦
 東京大学 教授 佐藤,知正
 東京大学 教授 稲葉,雅幸
 東京大学 助教授 森,武俊
 東京大学 講師 山根,克
 国立情報学研究所 助教授 稲邑,哲也
内容要旨 要旨を表示する

1.概要

ヒューマノイドロボットは人間と同じような身体的特徴を有することから人間の代わりにあるタスクを行うことや人間と同じ生活空間において共存するなど,様々な環境化で活動することが望まれる.このような多様なシチュエーションにおいて適切な振る舞いを行うには,ヒューマノイドロボット自体が未知環境においても学習するアプローチが有益である.特に,ヒューマノイドロボットの身体を通じた外部環境との接地が重要であり,身体的相互作用に知能が宿ると考えられる.

 認知心理学において,身振り手振りを駆使したコミュニケーションに高度な知能の根源があるとするミメシス理論が提唱されている.また,脳科学の分野においてマカクザルの脳に他者の特定の行動を観察したとき,および自らが同じ動作を行ったときに発火する特徴を有するミラーニューロンが発見され注目を集めている.

 このような近年の脳科学のパラダイムの発展にヒントを得て,身体を通じた運動情報の記号化に基づく運動パターンの認識と生成の双方向情報処理モデル(ミメシスモデル)が提案されている.本研究では,このミメシスモデルの運動パターンの記号化を基礎として,ヒューマノイドロボットの身体を用いた他者とのコミュニケーションを行う知能の構築を目指す.そこで,この情報処理に必要な(1)運動パターンの分節化,(2)運動パターンの記号化に基づく分類に関する基盤技術に関する研究を述べ,(3)運動パターンの記号に基づくコミュニケーションに関する新たな理論を提言している.さらに,運動パターンの記号化・分類の応用としてモーションキャプチャデータの記号化を通じた構造化により,必要なキャプチャデータの検索,ならびに記号を用いた新たな運動時系列データの生成を可能とするキャプチャデータベースを提案し,その試作システムを開発した結果について論じている.

2.運動パターンの記号化

 ミメシスモデルは,全身運動のダイナミクスをシンボルとして抽象化するフェーズ,獲得したシンボルを用いて運動パターンの認識を行うフェーズ,シンボルから運動パターンを生成するフェーズから構成されている.この統合モデルを実現するアプローチとして,Fig.1に示すようなノードの集合,ノード間の遷移確率,各ノードでの初期状態確率および確率分布をもつオートマトンである隠れマルコフモデル(HMM : Hidden Markov Model)を用いる.

 運動パターンはヒューマノイドロボットの関節角度などの時系列によって表現される.この運動パターン時系列のHMMによる抽象化は,この時系列データを教師信号としてHMMのパラメータを最適化することに相当する.最適化されたHMMは,全身行動のダイナミクスを抽出していることから原始シンボルと呼ぶことにする.

 運動認識過程は獲得した原始シンボルから観察した運動データが生成される尤度を計算し,最も尤度の大きい原始シンボルを観察された運動データの認識結果とすることによって実現される.

 さらに,原始シンボルからの運動生成は,HMMの確率統計の性質を利用し,多数の時系列を生成し,それらを平均した時系列を求めることによって実現できる.

 また,原始シンボル間の非類似度をシンボル間距離とみなし,この距離をできる限り満足するように原始シンボルを多次元空間上の点として配置した原始シンボル空間を構築する.ここでシンボル間の非類似度はKullback-Leibler情報量により求めることができ,原始シンボルの空間配置は多次元尺度法を用いる.このようなシンボルの空間構造を求めることによって,離散的であるシンボル間の補間やシンボルを幾何学的に操作することが可能となる.以上のようなHMMを用いた運動パターンの抽象化・認識・生成の枠組みがミメシスモデルである (Fig.2).

3.運動の分節化

ヒューマノイドロボットが見まねを通じて自律的に運動パターン毎のシンボルを獲得するには,一連の他者の行動から意味のある運動のまとまりを抽出する分節化能力が必要不可欠である.そこで,運動データ時系列の時間的相関から運動データのダイナミクスを相関学習により獲得する.過去の運動履歴から獲得したダイナミクスに基づき次の運動データを予測する.その予測値と実際の観察される運動データの誤差を予測不確実性と捉え,その不確実度が大きい時点はその前後での運動データの相関が弱い部分を示していることから運動パターンの境界と判定される.このような運動データの時間的相関に着目することによって頻繁に現れる時系列パターンを行動の単位として抽出することによって運動パターンの分節化が可能であった.さらに,分節化された運動パターンに対してHMMの競合学習を行うことにより自己組織的に原始シンボルを獲得する枠組みについて論じている (Fig.3, Fig4).

4.運動パターンの分類(I)

 運動パターンをシンボルとして獲得するには,必ずしも全身のダイナミクスを抽象化するわけではなく,各シンボルに応じて重要な身体部位が存在し,その部位に着目することによって運動パターンが記号化されている.このような運動パターンごとの特徴量を抽出することは運動認識やシンボルの獲得に有益であり,さらにこの特徴量に基づいてシンボルから生成される運動パターンの合成が実現されると思われる.そこで,多数の原始シンボルからなる原始シンボル空間において,シンボル群のクラスター構造を作り上げるように各身体部位の重みを最適化することによって運動パターンの特徴量抽出を行う (Fig5, Fig6).さらに,2つの原始シンボルから生成される運動データに対して,抽出した特徴量を利用することによる運動パターンの合成法を考案した (Fig.7).

5.運動パターンの分類(II)

 ヒューマノイドロボットやCGアニメーションにモーションキャプチャデータが広く利用されているが,以前計測したキャプチャデータを再利用することが困難であるという問題がある.そこで,運動パターンの記号化技術をキャプチャデータに適用することによって,キャプチャデータの検索ならびに新しい行動を生成することが可能なキャプチャデータベースを構築した.キャプチャデータには,運動パターンの分節化,認識を通じてシンボル列ラベルが付与されている.さらに,予め設計者が与えたキャプチャデータを表現する単語ラベル列とこのシンボル列の統計的な対応関係を獲得している.必要な運動データに対応する単語列を入力すると,単語列をシンボル列に変換し,このシンボル列を含むキャプチャデータを検索することによって,必要なキャプチャデータがデータベースから取り出されることや,変換されたシンボル列から運動を生成することによって,新しい行動パターンが出力されることを確認した (Fig8).

6.運動パターン間の関係性の記号化に基づく身体的コミュニケーション理論

 二者の身体運動の関係性を原始シンボルの記号を用いて表現する.これはヒューマノイドロボットとパートナーとのインタラクションパターンを表し,この記号表現を原始シンボルの上位層のHMMによって抽象化している.そして,このHMMをメタ原始シンボルと呼ぶことにする.このように,運動パターンに対応する原始シンボルを下位層,インタラクションパターンに対応するメタ原始シンボルを上位層にもつ階層構造モデルによってヒューマノイドロボットの身体的コミュニケーションモデルについて論じた (Fig.9).ここで,メタ原始シンボルの認識結果は推定されたインタラクション状態を表し,メタ原始シンボルの生成入力は身体的なコミュニケーションを実現するための戦略に相当する.そして現在のインタラクションを継続することによって単純なコミュニケーションは成り立っているという仮定に基づき,メタ原始シンボルの認識結果が生成入力に短絡するコミュニケーションモデルを考案した.特に本研究では,競合的なコミュニケーションとして格闘技をインタラクション例に取り上げ,ヒューマノイドロボットと人とのバーチャルな格闘を実現することによって,提案したコミュニケーションモデルの有効性を検証した (Fig.10).さらに,コミュニケーションモデルのシミュレーションレベルの検証のみでなく,ロボットにモデルを実装することによって実際のヒューマノイドロボットに適用した結果について論じた (Fig.11).

7.結論

本論文の結論は以下通りに纏められる.

(1)運動パターンの教師なし実時間分節化手法を考案.

(2)多数の原始シンボルの空間上における分類からシンボルの特徴量抽出ならびに特徴量を用いて運動パターンの合成手法を開発.

(3)運動の記号化を基礎とした検索・生成可能なキャプチャデータベースの試作・開発.

(4)二者のインタラクションパターンを記号表現化し,それを用いた身体的コミュニケーションの新たな情報処理の枠組みの提案,ならびにヒューマノイドロボットと人との身体的コミュニケーションの実現.

審査要旨 要旨を表示する

 本論文はStochastic Segmentation, Proto-Symbol Coding and Clustering of Motion Patterns and Their Application to Signifiant Communication between Man and Humanoid Robot (運動パターンの統計的分節化,原始シンボルコーディング及びクラスタリングとその人間とヒューマノイドロボットの記号的コミュニケーションへの応用)と題し、7章からなっている。

 ヒューマノイドロボットはこれまでのロボットと異なり、人間との関わりにおいてその形態の特異性が重要な意味を発揮するロボットである。人間の生活する空間で、人間と共存して、人間に対して働きかけるロボットに必要な情報処理を確立することが必要とされている。その中でも、ヒューマノイドロボットが人間とコミュニケーションをする上で身振りの果たす役割がコミュニケーションの身体性とも呼ばれ注目を集めている。本論文では、コミュニケーションを成り立たせるために必要な身体の運動パターンに関する情報処理的基盤が、文節化、プロトシンボルへの記号化、ならびにクラスタリングに基づく記号(シニフィアン)の生成とその利用にあるとし、これらに対して統計的な情報処理技術を新たに開発し、ヒューマノイドロボットを用いた実験によって実証したものである。

 本論文第1章は序論で、ヒューマノイドロボットに関する従来の研究、人間の運動パターンの計測・計算に関する従来の研究、心理学や哲学や脳科学において身体性に関して言及される際にとくに重要とおもわれる概念や仮説等についてまとめている。特に、近年の脳科学のパラダイムにヒントを得て、身体を通じた運動情報の記号化に基づく運動パターンの認識と生成の双方向情報処理モデル(ミメシスモデル)を本論文の全体を通した主題として位置づけている。

 第2章では、人間がシンボルを生成しコミュニケーションに利用する原理を脳の進化と模倣の役割から論じたミメシス理論について紹介し、それにヒントを得てこれまでに研究されてきた記号化の方法について解説し、本論文の基礎となる考え方と統計的情報処理の数学的基盤について説明している。

 第3章では、運動パターンの文節化について論じている。ヒューマノイドロボットが見まねを通じて自律的に運動パターン毎のシンボルを獲得するには、他者の行動から意味のある運動のまとまりを抽出する分節化能力が必要不可欠である。過去の運動履歴から獲得したダイナミクスに基づき次の運動データを予測し、予測値と実際に観察される運動データの誤差が大きくなる瞬間を運動パターンの境界と判定する。このような方法によって頻繁に現れる時系列パターンを行動の単位として抽出することが可能になり、教師なしでの運動パターンの分節化を実現した。さらに、分節化された運動パターンに対して隠れマルコフモデル(HMM)の競合学習を行うことにより自己組織的に原始シンボルを獲得する方法についても論じた。

 第4章では、運動パターンのクラスタリングについて1つ目の理論を展開している。運動パターンをシンボルとして獲得するには、各シンボルに応じて重要な身体部位が存在し、その部位に着目することによって運動パターンを記号化する必要がある。多数の原始シンボルからなる原始シンボル空間において、シンボル群のクラスター構造を作り上げるように各身体部位の重みを最適化することによって運動パターンの特徴量抽出を行った。さらに,2つの原始シンボルから生成される運動データに対して,抽出した特徴量を利用することによる運動パターンの合成法を提案した。

 第5章では、運動パターンのクラスタリングについて2つ目の理論を展開している。ヒューマノイドロボットやCGアニメーションにモーションキャプチャデータが広く利用されているが、キャプチャデータを再利用することは実際はほとんどない。運動パターンの記号化技術をキャプチャデータに適用することによって、キャプチャデータの検索ならびに新しい行動を生成することが可能なデータベースの構築法を開発した。キャプチャデータに対して、必要な運動データに対応する単語列を入力すると、シンボル列を含むキャプチャデータを検索することによって関連が強い運動パターンがデータベースから取り出される。また、シンボル列からデーターベースに含まれない新しい運動パターンを合成できることも確認した。

 第6章では、人間とヒューマノイドの身体運動パターンを介したコミュニケーションを可能にする基礎理論を展開している。運動パターンに対応する原始シンボルを下位層、インタラクションパターンに対応するメタ原始シンボルを上位層にもつ階層構造モデルを提案している。例として、競合的なコミュニケーションとしての格闘技を取り上げ、ヒューマノイドロボットと人間との仮想世界での格闘を実現することによって、提案したコミュニケーションモデルの有効性を実験的に検証した。

 第7章は、論であり、本研究の成果をまとめ今後の研究についても展望している。

 以上を要するに、本論文は、人間とヒューマノイドロボットの身体運動パターンの統計的分節化、原始シンボルコーディング、クラスタリングについて情報処理の基盤技術を確立し、それらを用いた身体的コミュニケーションの基礎理論を構築したものであり、ロボティクスならびに情報理工学に寄与するところが大きい。

 よって本論文は博士(情報理工学)の学位請求論文として合格と認められる。

UT Repositoryリンク