学位論文要旨



No 115223
著者(漢字) 稲邑,哲也
著者(英字)
著者(カナ) イナムラ,テツナリ
標題(和) 人間との対話に基づくロボットの行動知能形成に関する研究
標題(洋)
報告番号 115223
報告番号 甲15223
学位授与日 2000.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4718号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 井上,博允
 東京大学 教授 田中,英彦
 東京大学 教授 武市,正人
 東京大学 教授 中村,仁彦
 東京大学 助教授 稲葉,雅幸
内容要旨

 近年,オフィスや家庭など,一般の日常空間でユーザと共に行動する事を目的としたパーソナルロボットが注目されて来ている.ロボットがこのような環境で行動するためには,その環境に関する知識だけでなく,ユーザに関する知識や,ユーザに合わせてどのように自律行動を行なうか,という,行動のための知能を後天的に獲得する必要がある.しかしながら従来の研究の枠組では,ロボットの開発者が使用される環境を想定し,ロボットに先天的な知識を埋め込んでいる事が多かった.

 この問題に対して,学習によって後天的に行動を獲得する手法や,人間からの教示によって知識を獲得する手法などが研究されてきたものの,前者の場合には学習システムの設計者が想定した範囲で行動知能が形成されるのみで,ロボットを使用するユーザの期待と一致した行動知能が形成される保証は無いという問題があり,後者の場合には,ユーザの負荷が大きいという問題があった.

 本論文では,効率良く行動知能を獲得するためには,ロボットからユーザへの情報提示,ユーザからロボットへの情報教示の双方の統合が必要である,という立場を取る.そしてユーザとロボットとのインタラクションの経験を用いて行動知能を後天的に形成する事を目的とする.この手法により,ロボットに最初から完全な行動知能を搭載するのではなく,ある程度の自律行動レベルからスタートし,ユーザがロボットを使用していくに連れて次第に自律行動のレベルを高めて行く,というパーソナルロボットにふさわしい発達的な行動知能の獲得が可能となる.

 本論文は全9章から構成される.以下に各章の概要について述べる.

 第1章「序論」では,本研究の背景と目的,および本論文の構成について述べる.

 第2章「人間との対話に基づくロボットの行動知能形成」では,日常空間に進出し,人間をサポートするパーソナルロボットの実現について考察を行ない,行動知能を後天的に獲得するためにロボットとユーザの間の対話を経験として活用する事の必要性について述べ,対話経験から行動知能を形成する手法を提案する.

 このような「ロボットと人間との対話」は,従来古くから研究されてきた,「人間と機械との対話」研究における成果を利用する事ができるように思われるが,「ロボティクス」研究に必要な物理世界とのインタラクションに関する知見が少なく,単純に「人間と機械との対話」研究と「ロボティクス」研究を結合する事が難しかった.そこで,システムと人間とのインタラクションにおける問題点を整理し,「人間」「物理環境」「ロボット」の3者の関係を有機的に結合し表現するモデルの必要性について述べる.そしてユーザとの対話に基づいて行動知能を後天的に獲得するために,統計的表現が有利である事を示し,Bayesian Networkによる行動知能モデルの構築手法について述べる.

 第3章「対話経験の蓄積に基づく自律行動の獲得」では,ロボットに必要となる行動知能のうち,動的な環境変動に対応する行動決定モデルについて注目し,ユーザとの対話経験を利用した統計的行動決定モデルの表現方法と獲得方法を提案する.

 従来の機械学習の研究分野では,ロボットが自律的な環境とのインタラクションを介して行動決定モデルを獲得する例が多かったが,学習に膨大な時間がかかったり,必ずしもユーザが望んでいる行動を獲得するとは限らない,という問題があった.また一方でユーザが行動を教示する場合にも,動的な環境変動への対応を考えるとユーザへの負荷が問題となる.そこで十分に学習が行なわれていない状態において,ロボットがユーザへの質問や提案などを利用して学習を行なう,「質問に基づく学習」と従来の学習手法である「自律的な行動学習」の二つを統合した新しい行動獲得手法を提案し,Bayesian Networkによる行動知能モデルで実現する.

 この対話経験の蓄積に基づく行動決定モデルは,(1)ユーザからの教示情報を反映した行動を獲得する事が可能.(2)短時間で学習が収束する.(3)実環境の不安定な情報に対して頑健である.などの特徴を持つ.

 第4章「対話経験の蓄積に基づくユーザへの適応化」では,パーソナルロボットという言葉の定義にもなっている「パーソナル化」,すなわち,ユーザ固有の好みや癖,嗜好に応じて適応した行動を実現する手法について述べる.

 第3章で問題となっていた課題の一つは,あらかじめ開発者がBayesian Networkの構造をロボットに与えなければならない事であるが,個人の違いによって行動を適応させる問題は,この行動決定モデルの状態空間を決定する問題に帰着できる事を示す.この場合にもロボットとユーザとの間に交わされた対話経験を利用することが可能である事を示し,行動決定モデルが個人に適応している事を評価する基準として,モデルから推論される行動と,過去にユーザが指示した行動の差分を「推論のエラー値」という形で表現する手法を導入する.この推論のエラー値が最小となるような状態空間を遺伝的アルゴリズムを用いて探索する手法を提案し,移動ロボットにおける障害物回避タスクや,視覚探索タスクなどへの応用を通じて,ユーザへの適応化手法の有効性を確認する.

 第5章「対話と自律行動に基づく環境知識の獲得」では,開発者があらかじめロボットに埋め込む事のできない,ロボットが活動する環境に関する知識を後天的に獲得する手法について述べる.ロボットが活動する環境を構成する手法は大きく分けて,(1)自律的に地図情報などを獲得する手法.(2)ロボット用のインフラストラクチャを充実させる方法.の二つに分けられるが,いずれも人間との対話を利用する事が考慮されていない.そこで環境内で生活している人間を一種のインフラストラクチャと見なし,自律行動と,ユーザとの対話とを統合したハイブリッドな環境知識の獲得手法を提案する.

 対象としては,オフィスや病院などの環境を想定しており,部屋の配置関係や部屋の名前,環境の中で活動する複数ユーザの情報などを獲得する.部屋の配置と名前を獲得する場合,ロボットは自律的に環境内を走行し,ビューシーケンスと呼ばれる視覚に基づく地図を作成する.部屋の名前の獲得にはユーザへの質問を活用する.また,対話の履歴や視覚処理情報の結果から得られた,いつ,誰が,どの部屋にいたか,という固定されていない不確かな情報を,Bayesian Networkを用いて統計的に管理する手法について述べる.

 第6章「対象の局在性に基づく適切な対話の生成」では,ロボットがユーザと対話を行なう際に,ユーザに負荷をかけたり混乱させたりする事のない,自然な発話を生成するための手法について述べる.

 これを実現するためのアプローチとして,対象の局在性という概念を導入する.対象の局在性とは,対話の文脈の中で言葉や行動を介して参照されている対象が,他の対象と混同されずに唯一つのものとなっているかどうかを評価する基準である.この局在性が満たされるように発話や行動を制御する事によって,文脈に存在する曖昧な要素を取り除き,自然な対話を成立させる手法について述べる.

 具体的に,視覚処理による対象物の参照同定行動に焦点を絞り,対象物を同定しにくい状況において,ユーザの曖昧な指示に対応する事を目標とする.実際に言語的発話による曖昧性の解消と,行動を介した曖昧性の解消を行なう対話制御の例を通じて,本手法の有効性を示す.

 第7章「言語情報と行動知能との結合関係の獲得」では,ロボットと人間との自然な対話を実現するための,自然言語の処理手法,および言語情報とロボットの行動知能との結合関係の表現手法と獲得手法について述べる.

 まず,シンボルのレベルである自然言語入力を,物理的パラメータを扱うロボットの行動に変換する際に生じる問題を整理する.そして,ユーザが使用する言語に含まれる曖昧性を考慮しながら,ロボットの行動を記述する事のできる中間言語表現を提案し,この中間言語を出力するような自然言語処理手法について述べる.

 一方で,ユーザが完全に制約のない状態で自然言語を使用すると,ロボットが想定している文法規則から外れた表現や,辞書に登録されていない未知語を使用する事が考えられる.このような場合,ただ単に「理解できません」と入力を拒絶してしまうのではロボットのためのインタフェースとして不適切である.このような問題に対応するには,後天的にユーザが使用する語彙を獲得する事が必要となる.この問題に対し,ロボットがユーザとの対話から未知語を検出し,質問や行動を介して未知語の意味を獲得する手法を提案する.

 第8章「ヒューマンロボットインタラクションシステム:PEXIS」では,各章で論じた手法をソフトウェアシステムとして統合する手法について述べる.

 実際の日常空間では,複数のユーザが複数のロボットと対話する事が想定され,様々な形態を持つロボットに対応する必要が生じる.このため,行動知能モデルを管理するシステムをサーバとして立ち上げ,ロボットとユーザをクライアントとして接続するようなヒューマンロボットインタラクションシステムを構築する.

 このシステムは,既存のロボットシステムになるべく影響を与えずに,ユーザとのインタラクションを行なう機能を付加させるために,OSや開発言語に依存しないAPIを提供する特徴を持つ.また,単なる人間とロボットのインタラクションだけでなく,ロボット同士のインタラクション,すなわちマルチロボット環境における協調作業などへの応用可能性について検討する.

 第9章「結論と今後の展望」では,各章で展開された議論をまとめ,本論文の結論を示す.また,対話経験に基づくロボットの行動知能形成における今後の展望について述べる.

審査要旨

 本論文は、「人間との対話に基づくロボットの行動知能形成に関する研究」と題し、近年注目されるようになったオフィスや家庭などの一般の日常空間で人間と共に行動するパーソナルロボットに関し、ユーザーとロボットのインタラクションの経験を通じて環境や行動に関する知識を獲得し自律行動のレベルを高めていく手法についての研究をまとめたものであり、9章からなっている。

 第1章「序論」では、本研究の背景と目的、および本論文の構成について述べている。

 第2章「人間との対話に基づくロボットの行動知能形成」では日常の生活空間に進出し、人間をサポートするパーソナルロボットの実現について考察を行ない、行動知能を後天的に獲得するためにロボットとユーザとの対話を経験として活用することの必要性について述べ、対話経験を統計的に取り扱うためにベイジアン・ネットワークを用いて行動知能モデルを構築することを提案している。

 第3章「対話経験の蓄積に基づく自律行動の獲得」では、ロボットに必要となる行動知能のうち、動的な環境変動に対応する行動決定モデルを取り上げ、(1)ユーザからの教示情報を反映した行動を獲得する事が可能、(2)短時間で学習が収束する、(3)実環境の不安定な情報に対して頑健である、などの特徴を持つ統計的行動決定モデルの表現方法と獲得方法を述べている。

 第4章「対話経験の蓄積に基づくユーザへの適応化」では、パーソナルロボットという言葉の定義にもなっているパーソナル化、すなわち、ユーザ固有の好みや癖に応じた行動を実現する手法について述べている。行動決定モデルが個人に適応している事を評価する基準として、モデルから推論される行動と、過去にユーザが指示した行動の差分を推論のエラー値という形で表現する.この推論のエラー値が最小となるような状態空間を遺伝的アルゴリズムを用いて探索する手法を提案し、移動ロボットにおける障害物回避タスクや、視覚探索タスクなどへの応用を通じて、ユーザへの適応化手法の有効性を示している。

 第5章「対話と自律行動に基づく環境知識の獲得」では、開発者があらかじめロボットに埋め込む事のできない、ロボットが活動する環境に関する知識を後天的に獲得する手法について述べている。実験対象としてオフィスや病院などの環境を想定し、部屋の配置関係や部屋の名前、環境の中で活動する複数ユーザの情報などを獲得する。部屋の配置と名前を獲得する場合、ロボットは自律的に環境内を走行し、ビューシーケンスと呼ばれる視覚に基づく地図を作成する.部屋の名前の獲得にはユーザへの質問を活用する。また、対話の履歴や視覚処理情報の結果から得られた、いつ、誰が、どの部屋にいたか、という固定されていない不確かな情報を、ベイジアン・ネットワークを用いて統計的に管理する手法について述べている。

 第6章「対象の局在性に基づく適切な対話の生成」では、ロボットがユーザと対話を行なう際に、ユーザに負担をかけたり混乱させたりする事のない、自然な発話を生成するための手法について述べている。対象の局在性とは、対話の文脈の中で言葉や行動を介して参照されている対象が、他の対象と混同されずに唯一つのものとなっているかどうかを評価する基準である。この局在性が満たされるように発話や行動を制御する事によって、文脈に存在する曖昧な要素を取り除き、自然な対話を成立させる手法について述べ、視覚処理による対象物の参照同定行動の実験例を通じて、本手法の有効性を示している。

 第7章「言語情報と行動知能との結合関係の獲得」では、ロボットと人間との自然な対話を実現するための、自然言語の処理手法、および言語情報とロボットの行動知能との結合関係の表現手法と獲得手法について述べている。

 第8章「ヒューマンロボットインタラクションシステム:PEXIS」では、各章で論じた手法を統合したソフトウェアシステムについて述べている。PEXISと名付けたこのシステムは、既存のロボットシステムになるべく影響を与えずに、ユーザとのインタラクションを行なう機能を付加させるために、OSや開発言語に依存しないアプリケーションインターフェイスを提供する。また、単なる人間とロボットのインタラクションだけでなく、ロボット同士のインタラクション、すなわちマルチロボット環境における協調作業などへの応用も可能になる様に設計されている。

 第9章「結論と今後の課題」では、これまでの各章で展開した議論を総括して結論を示すとともに、今後の課題について考察している。

 以上、これを要するに本論文は、ロボットにユーザとの対話経験を通じて環境に関する知識や行動を選択する知能を形成する手法について検討し、実環境での人間との対話行動の実験を通じてその有効性を明らかにしたもので、情報工学上貢献する所少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UT Repositoryリンク http://hdl.handle.net/2261/54115