学位論文要旨



No 214015
著者(漢字) 磯崎,秀樹
著者(英字)
著者(カナ) イソザキ,ヒデキ
標題(和) マルチエージェント環境における他者の信念の推定に関する研究
標題(洋)
報告番号 214015
報告番号 乙14015
学位授与日 1998.10.08
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第14015号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 武市,正人
 東京大学 教授 田中,英彦
 東京大学 教授 井上,博允
 東京大学 教授 石塚,満
 東京大学 教授 近山,隆
 東京大学 教授 堀,浩一
内容要旨

 人間と円滑に対話できるコンピュータシステムを作ろうとする場合には,対話している相手が何を知っているか,どんな勘違いをしているか,といったことを効率よく判断することが円滑な対話の鍵となる.すでにいくつかの音声対話システムが試作されているが,普段人間がしゃべっている言葉は,十分に編集された書籍や新聞記事に代表される書き言葉とは,似ても似つかないものである.複雑な状況を,正確にかつ曖昧さがないように,そして文法的に正しい文にして説明し,しかも一字一句言い間違えずに発声することは,人間にとってきわめて苦痛である.

 そこで,コンピュータに話しかける場合も,人間同士の会話のように,正確かつ丁寧に意図や現状を説明しなくても,その場の状況や,それまでのいきさつから,今どんなことを信じていて何をしたいと思っているのか,わずかな言葉から,あるいはまったく言葉をかわさなくても,システムが推定して気をきかせてくれればよいと,コンピュータに不慣れな多くの人々が考えている.

 一方,複数のロボットを上手に制御しようとする場合には,個々のロボットを制御するための技術が不可欠であるが,それに加えてロボット同士で要領よく意思疎通を行なう技術が必要になる.従来の通信プロトコルによる手法でも十分なようにも思えるが,不完全な知識しか得られていない動的な世界で複雑な共同作業をする場合を考えてみると,どのような情報をいつ誰に送信すべきかをあらかじめ決めておくことは難しい.そこで,各ロボットが自分の知識や意図などに基づいて,誰に何を言うか自律的に判断することになるであろう.また,通信路のノイズ,輻輳,遅延,帯域の狭さなどの問題を考えると,通常の通信プロトコル以外の意思疎通の手段を考えておくことも重要である.その場合,人間同士の意思疎通がヒントになるであろう.

 複数のロボットの意思疎通の問題と,人間とコンピュータの意思疎通の問題には,共通する点が多く,ロボットや人間やコンピュータあるいはソフトウェアエージェントといった知的行為者(エージェント)が複数存在して,それぞれのエージェントが,ある程度自律的に判断し行動している系をマルチエージェント系と呼ぶ.

 そして,エージェント間の意思疎通を扱うために,「言語行為論」が注目されている.言語行為論によれば,「発話」は,物をつかむなどの物理的な行為と同じように考えることができる.ただ,物理的な行為が外界の物理的状態を変化させるのに対して,言語行為は,対話に参加している人々の心的状態に変化を及ぼすという点が異なる.

 マルチエージェント系では,物理的行為と言語行為を上手に組み合わせることによって,共同目標を達成したり,個々のエージェントの目標を効率よくこなせるように協調したり,故障者の発生に対処したり,事故を防いだりすることが可能になる.そのための技術を確立することが,マルチエージェント系の工学的研究の目標である.

 人間とコンピュータの対話のような応用を考えた場合,コンピュータ内部のビットレベルの詳細情報は,多くの場合人間には知りえないし,たとえ知ったとしても,コンピュータの行動を予測したり,理解したりするのには使いづらい.そこで,内部状態の詳細を捨象し,あるレベルまで抽象化して考えることが必要である.それによってコンピュータの行動を理解したり予測することができる.

 人間がコンピュータのような複雑な機械をしばしば擬人化して考えていることはよく知られている.コンピュータにトラブルが発生した場合,ユーザはしばしば,その状況を他人に説明するのに,「サーバが死んだ」,「ネットが見えていない」,「印刷が終わるのを待っている」,「データを取ってこようとしている」,「ディレクトリを調べている」,「プリンタがフォントを知らない」などの擬人的表現を用いる.

 つまり複雑な知的システムの抽象化には,「欲求」,「目標」,「意図」,「知識」などの心的状態を用いた擬人的な表現が有効なのである.とくに各エージェントの「知識」は,「意図」や「目標」などの他の心的状態をささえるものとして重要である.そこで本研究では知識を研究対象とする.ただし,未来永劫正しい知識ではなく,「勘違い」や「思い込み」を含む,間違っているかもしれない知識を対象とする.

 マルチエージェント系の世界は,個々のエージェントの思惑とは必ずしも関係なく変化していくので,各エージェントの信じていることが知らない間に古くなってしまう.したがって,ある時点で正しい情報でも,しばらくすると間違った情報になってしまうことは珍しくない.そしてこの種の間違っているかもしれない知識は,正しい知識と区別して「信念」と呼ばれることが多い.

 そこで本論文では,マルチエージェント系での各エージェントの信念の変化と,それを他のエージェントがどう推定したらよいか,という問題について考える.他のエージェントの信念が推定できれば,ある情報を今そのエージェントに送信する必要があるかどうか判断できるし,そのエージェントの意図や目標や行動を推定する場合に参考になるからである.たとえば,倉庫に施錠するという目標を持ったロボットを考えた場合,その鍵がどこにあると思っているかによって,そのロボットのとる行動は変わるはずである.したがって,そのロボットの信念を推定することがそのロボットの行動を予測することにつながる.

 以上の考察に基づき,本論文の1章では,本研究の背景と動機について,もう少し詳しく述べる.そして2章と3章において,絶対時刻を用いて他者の信念を推定する方法を提案する.まず,変化する世界に関する信念の変化の様子を明示的に表現するため,「心的時間地図」という概念を提案する.そして矛盾する情報がある場合,新しい情報の方が古い情報より正しい,という考え方に基づいて情報を取捨選択する.このとき絶対時刻を利用する.また,一度得られた信念は,それが否定されるまで捨てない,と考える.これによって,持続性と命題の競合という,信念の処理を単純化・理想化するための2つの中心的概念が得られる.そして,多次元の信念時間地図上での考察に基づいて,他者の信念を推定するアルゴリズムを考案する.

 とくに2章では,同じ命題が同一時刻で真と偽の両方になることはない,というきわめて単純な制約でさえ,処理のためには十分な考察が必要であることを説明する.そして3章では,「関数」や「一対一対応」の概念を導入して2章の手法を拡張し,身近かな例を簡単に表現し処理する方法を提案する.

 しかし,すべての情報に正確な絶対時刻を付与するのはきわめて困難である.そこで4章では,信念の更新をデータベースの更新とみなし,他者の信念の推定を,データベースの仮想的な更新によって実現する.このアイデアの実装には,「トランザクション論理」という既存の論理を転用する.その結果,トランザクション論理の表現力の限界が明らかになるとともに,計算上のネックとなる,行為の「事前条件」の意義に疑問が生じる.一方,信念に大きな影響を与える「観測」の重要性が明らかになる.

 そこで5章では,観測を重視し,事前条件を無視した推定システムを試作して,推定結果に大きな問題があるかどうかを調べる.そして,どういう状況であればどういうことが観測できるか,ということに関する知識を「観測条件」としてまとめ,これを利用して他者の信念を推定する方法を考える.

 6章では,5章で得たプログラムを命題論理に簡単化して「遡行的アルゴリズム」として整理し直し,これを意味論的に解析する.「信念」はしばしば様相論理で定式化され,様相論理の標準的な意味構造であるKripke構造によって意味が与えられる.遡行的アルゴリズムの挙動はKripke構造では説明できないが,Kripke構造を変形した一種の非標準構造によって説明できることを示す.この新しい非標準構造は,信念の変更を扱うための既存の非標準構造と,信念の論理的不完全さを扱うための既存の非標準構造を組み合わせたものである.

 7章では6章のアルゴリズムがかかえる「局所閉世界情報」による「否定」の問題の扱いについて考え,アルゴリズムを改良して新しい実装を行なう.そして,計算機実験により,処理時間や推定の精度の定量的データを得る.他者の信念を推定するアルゴリズムを提案しても,その推定結果をどう評価するかが問題であるが,本研究では,すべてのエージェントが同じ観測条件と信念推定アルゴリズムを用いる,という仮定のもとで実験することにより,客観的な評価を行なうことができることを示す.8章では,遡行的アルゴリズムの処理上の無駄を調べ,もっと効率のよい「前進的アルゴリズム」を提案する.

 さらに9章では,遡行的アルゴリズムを日本語文生成に適用することにより,助詞,助動詞,終助詞などの微妙なニュアンスの違いによる使い分けが可能になることを示す.従来から自然言語の文生成の研究では,聞き手の信念を考慮することの重要性が指摘されてきたが,処理効率の悪さから,本格的に利用されることはなかった.本論文で提案したアルゴリズムは,こうした壁を技術的に乗り越えるのに有効であると考えられる.

 そして最後の10章で,本論文の成果をまとめ,関連する他の研究と比較し,本研究の意義や位置付けを明確にする.エージェントの信念の望ましいあり方や処理方法については,人工知能の分野において多数の関連研究があるが,本研究は他者の信念を推定する技術である点と,計算機処理の効率に重点を置いているという点が他の研究と大きく異なる点である.これについて述べる.

審査要旨

 本論文は、マルチエージェント環境において、エージェントのもつ信念の変化を他のエージェントが推定して相互の行動を理解しようとする課題に対して、信念の変化を表現するためのモデルを設定し、推定アルゴリズムを提案するとともに、その有効性を実証し、工学的応用を論じたものである。そこでは、複数のロボットの意思疎通の問題と、人間と計算機との意思疎通の問題には共通する点が多いことに着目し、ロボット、人間、計算機、ソフトウェアといったエージェントが複数存在してそれぞれのエージェントが自律的に判断し行動するマルチエージェントシステムにおけるエージェント間の意思疎通を扱うための技術を確立するという課題として捉えている。

 本論文では、マルチエージェントシステムにおけるエージェントの信念の変化と、他のエージェントによるその変化の推定法を扱っている。他のエージェントの信念が推定できれば、そのエージェントの意図、目標、行動などを推定する有効な情報が得られるからである。

 第1章では、本研究の背景と動機について詳しく述べている。

 第2章と第3章においては、絶対時刻を用いて他者の信念を推定する方法を提案している。変化する世界に関する信念の変化を明示的に表現するために「心的時間地図」という概念を提案し、矛盾する情報がある場合には、絶対的な時間を用いて新しい情報の方が古い情報より正しいという基準で情報を取捨選択することとしている。また、一度得られた信念は、それが否定されるまで捨てないこととしている。これによって、持続性と命題の競合という信念の処理を単純化・理想化するための2つの中心的概念を得ている。そのうえで、多次元の信念時間地図上で他者の信念を推定するアルゴリズムを考案している。第2章では、同じ命題が同一時刻で真と偽の両方になることはない、というきわめて単純な制約でさえ、処理のためには十分な考察が必要であることを述べている。第3章では、「関数」や「一対一対応」の概念を導入して第2章の手法を拡張し、簡単に表現して処理する方法を提案している。

 第4章では、すべての情報に正確な絶対時刻を付与することの困難さに対処するために、信念の更新をデータベースの更新とみなし、他者の信念の推定をデータベースの仮想的な更新によって実現する方法を述べている。このアイデアの実装には「トランザクション論理」という既存の論理を転用している。その結果、トランザクション論理の表現力の限界が明らかにされ、行為の「事前条件」の意義という問題と、信念に大きな影響を与える「観測」の重要性を明らかにしている。

 第5章では、前章で考察した「観測」を重視して、事前条件を無視した推定システムを試作し、推定結果に大きな問題があるかどうかを調べ、種々の問合せに対して妥当な推論結果を得ている。これを通じて、観測可能性に関する知識を「観測条件」としてまとめ、それを利用して他者の信念を推定する方法を与えている。

 第6章では,前章で得たプログラムを命題論理に簡単化して「遡行的アルゴリズム」として整理し、これを意味論的に解析している。「信念」は様相論理の標準的な意味構造であるKripke構造によって意味が与えられるが、遡行的アルゴリズムの挙動はKripke構造では説明できないことを述べ、Kripke構造を変形した一種の非標準構造によって説明できることを示している。

 第7章では前章で述べたアルゴリズムがかかえる「局所閉世界情報」による「否定」の問題の扱いを考察し、アルゴリズムを改良したプログラムにより処理時間や推定の精度の定量的データを得ている。ここでは、他者の信念の推定結果の評価を、すべてのエージェントが同じ観測条件と信念推定アルゴリズムを用いるという仮定のもとで行ない、客観的な評価を与える方法を述べている。

 第8章では、遡行的アルゴリズムの処理上の無駄を調べて、より効率のよい「前進的アルゴリズム」を提案している。

 第9章では、遡行的アルゴリズムを日本語文生成に適用することにより、助詞、助動詞、終助詞などの微妙なニュアンスの違いによる使い分けが可能になることを示している。従来の自然言語の文生成の研究では聞き手の信念を考慮することの重要性が指摘されてきたが、処理効率の悪さから本格的に利用されることはなかったが、本論文で提案したアルゴリズムによってこうした問題点を技術的に解決できることを述べている。

 第10章で本論文の成果をまとめ、関連する他の研究と比較して本研究の意義や位置付けを明確にしている。

 これを要するに、本論文では、人工知能の分野においてなされてきた、エージェントの信念の処理方法について、他者の信念を推定するという新たな技術を開発し、計算機処理の効率に重点を置いてアルゴリズムを提示し、実験してその有効性を実証しており、その成果は情報工学・人工知能の研究に貢献するところが少なくない。よって本論文は博士(工学)の論文として合格と認められる。

UTokyo Repositoryリンク