学位論文要旨



No 214025
著者(漢字) 中野,幹生
著者(英字)
著者(カナ) ナカノ,ミキオ
標題(和) 倫理制約の処理に基づく話しことばの解析
標題(洋) Spoken Language Analysis Based on Logical Constraint Processing
報告番号 214025
報告番号 乙14025
学位授与日 1998.10.26
学位種別 論文博士
学位種類 博士(理学)
学位記番号 第14025号
研究科
専攻
論文審査委員 主査: 東京大学 教授 辻井,潤一
 大阪大学 教授 郡司,隆男
 奈良先端科学技術大学院大学 教授 松本,裕治
 東京大学 教授 米澤,明憲
 東京大学 教授 萩谷,昌己
内容要旨

 本研究の目的は,ユーザフレンドリな音声言語による人間と機械のインタフェースの構築であり,そのために,音声言語によって人間と自然な対話を行うシステムを構築することである.ここで自然な対話とは,発話の長さ,発話の文法性,割り込み等に関して制限のない対話を意味する.本論文では,そのような対話を行うシステムの発話解析モジュールで用いるための,話しことば解析法を提案する.

 対話システムが実時間で動作して自然な対話を行うためには,次のような特徴をもつ発話解析モジュールが必要である.まず最初に,ロバストでなくてはならない.すなわち,自発的発話を解析できなくてはならない.自発的な発話は言い直し,つなぎ語といった書きことばには現れない現象を含むので,通常の書きことば用の解析システムでは扱うことができない.また,入力が終わる前に解析を始めなくてはならない.すなわち,入力を逐次的に解析して部分的な結果を出力しなくてはならない.さもなくば,対話システムは必要な時に即座に応答することができない.さらに,入力を実時間で解析できなくてはならない.さもなくば,システムの応答が遅れてしまう.最後に,時間が許せばすべての可能な解析結果を出力できる必要がある.さもなくば,ユーザの発話が明瞭でゆっくりであってもシステムは誤解してしまう可能性がある.しかしながら,従来の対話システムの解析法の多くは,自然な話しことばを扱っていなかったか,または,構文解析を用いていないため可能な解析結果をすべて出力することができなかった.自然な話しことばを解析する方法がいくつか提案されているが,逐次的な解析とともに用いることができないという問題があった.

 本論文では,この問題の解決法として,チャート法に基づく分散型の逐次的部分解析法で,論理的制約の処理に基づく方法を提案する.この方法は次のような特徴を持つ.

 まず第一に,本方法ではチャート法を用いて単語列または単語ラティスを逐次的に解析し,部分解析法により発話単位を発見してその発話行為表現を出力する.ここで発話単位とは,逐次的に理解を行う際の単位となるもので,談話処理モジュールの入力の単位である.本方法では発話単位を文法によって構文的に定義する.名詞句や動詞句などの,書きことばの文よりも短い句も,発話単位として認識される.

 第二に,本方法では,書きことばの文法を拡張して作成した話しことば用の文法を用いる.この文法は構文制約や意味制約などの様々な制約が統一的に記述できる単一化文法に基づいている.話しことばの文法は,対話データの分析に基づき3つの点で拡張されている.まず格助詞の省略を扱うために素性制約が緩められている.次に,言い直しを扱うための句構造規則と,発話単位の発話行為表現を扱うための句構造規則が追加されている.特に言い直しに関しては,対話データの詳細な分析に基づき,4つの句構造規則が追加された.さらに話しことば特有の表現のための辞書項目が追加されている.この話しことば用の文法を用いて発話の解析実験を行い,対話データ中の発話の86%が解析できることを確認した.

 第三に,本方法では論理制約の処理技法を用いる.文法の拡張は文法の曖昧性を増加させるので,実時間で精度良く理解するために,曖昧性を効率的に扱う必要がある.この曖昧性は単一化文法の枠組で選言的素性構造を用いて表現する.本方法では,選言的素性構造を一階の確定節論理に基づく論理制約によって表現する.論理制約を用いると,選言的素性構造の単一化は論理制約を標準形に変換することによって行うことができる.制約変換の方法として,制約単一化と呼ばれる効率的な方法が開発されているが,制約変換が行われる度に出力の制約の中のリテラルの引数の数が増え,構文解析が進むと変換に時間がかかるようになるという欠点がある.そのため本論文では,制約射影という方法を提案する.制約射影は,論理制約と,ゴールと呼ばれる変数の集合とを引数としてとり,ゴール中の変数に関して入力と同等で,かつ,ゴール中の変数に関する情報のみをもつような制約を返す演算である.制約射影を用いることにより,後の解析では必要でない情報を無視することができるので,構文解析の効率が向上する.論理制約を用いて上記の話しことば用の文法を構築し,解析実験により制約射影と制約単一化の解析速度の比較を行ったところ,すべての入力について,制約射影を用いた構文解析の方が効率的であることが判明した.

 論理制約の処理に基づく解析に関するもう1つの問題点として,論理制約による文法記述に労力がいるという問題がある.このため,大規模な文法を構築することが困難である.そこで,経路方程式および素性名と素性値のペアのリストに基づく,記述および修正のしやすい文法記述形式から,論理制約に基づく文法の内部表現を生成するアルゴリズムを提案する.従来,同様の記述形式から一階論理の項に基づく内部表現を生成するアルゴリズムがいくつか提案されているが,選言情報を扱うことができなかった.しかしながら,このアルゴリズムは,もとの文法記述の選言情報を展開せずに論理制約に変換することができるため,結果として得られる内部表現を用いた構文解析の効率が低下しない.

 最後に,本方法では分散型の解析法を用いる.制約射影を用いることにより,選言を効率的に扱うことはできるが,文法の制約が緩められているため,チャート解析の弧の数が増加することを避けることはできない.もしも入力発話が話しことば特有の現象を全く含まなければ,書きことば用の文法を用いた解析は,話しことば用の文法を用いた解析よりも短い時間で解析できる.さらに発話単位は短いので,1つの発話単位がすべての話しことば特有の現象を含むことは稀である.この問題の解決のため様々なロバスト解析法が提案さているが,逐次解析とともに用いる時に問題が生ずる.例えば,最初に制約を緩和しない文法を用いて解析を行い,これが失敗した場合に,制約を緩和した文法を用いて再解析するロバスト解析法が用いられている.しかしこの方法では,発話が終了するまで解析が失敗したかどうかが不明なため,発話がどこで終了するのかがあらかじめ分からない逐次解析と共に用いることができない.そこで本論文では,multiple weakgrammar process法を提案する.この方法では,異なった文法を用いる解析プロセスを複数走らせる.各々の文法は,1つまたは複数の話しことば特有の現象を扱うための文法である.これらの文法の制約は完全に緩められているわけではないので,すべての話しことば特有の現象をカバーしているわけではない.しかし解析が成功する場合には,完全に制約が緩められた文法を用いた解析よりも短い時間で解析することができる.これらの解析プロセスを複数のプロセッサ上で走らせ,各プロセスからの解析結果を集めて出力することにより,話しことば特有の現象を少ししか含まない発話を効率よく解析することができる.複数の文法を用いた解析実験を行い,本方法を用いて解析が効率よく行えることを確認した.

 本論文の方法はチャート解析を用いるので,入力を逐次的に解析すること,および,時間が許せばすべての解を出力することが可能である.また,話しことば用に拡張された文法を用いているので,ロバストな解析が可能である.実時間解析はチャート解析におけるアジェンダ制御によって可能であり,さらに制約射影とmultiple weak grammar process法の効率性により解析中に発見できる発話単位の数が増えるので,実時間解析中に正解を得る確率が高くなる.以上のことから,本方法は,人間と自然な対話を行う音声対話システムの発話解析モジュールに用いることができる.

審査要旨

 本論文は9章からなる。

 第1章は序論である。まず、本論文で解決する問題が、音声対話システムの中の話しことばの構文解析を行うモジュールの構成法を明らかにすることであることが述べられている。次に、この話しことば解析部が満たすべき性質として、ロバスト性、逐次性、実時間性、完全性の4つの性質が示されている。さらに、本論文では論理制約の処理を用いた書きことば解析法を拡張することにより話しことば解析部を構築するアプローチをとることが述べられている。

 第2章では関連研究について述べられている。まず、従来の話しことば解析法を概観し、話しことばの構文解析法の研究が不十分であることが示されている。さらに、従来のロバスト解析法を概観し、従来の方法は逐次解析とともに用いることができないことが示されている。

 第3章では話しことばの特徴を対話データの分析に基づいて調査した結果が述べられている。構文解析の観点から話しことばと書きことばとの比較が行われ、話しことばには、書きことばの文法からの逸脱が見られること、および、話しことばの理解が実時間で行われていることが述べられている。また、話しことばの処理単位に関する議論が行われている。さらに以上の議論をふまえ、話しことば解析用の文法が扱うべき話しことば特有の現象に関して議論が行われている。

 第4章では本論文で提案される話しことば解析法の概要が述べられている。まず、話しことばの解析が書きことばの解析法の拡張によって可能であることが述べられ、チャートに基づく部分解析法と、書きことばの文法の拡張である話しことば解析用文法について述べられている。さらに、書きことばの文法を拡張することによって生じる曖昧性を扱うために、文法の中の選言情報を論理制約によって表現することと、その論理制約の変換を行うことが有効であることが述べられている。

 第5章では論理制約の効率的な変換法である制約射影が提案されている。まず,従来の論理制約の変換法の問題点が述べられている。次に、制約射影のアイディアとアルゴリズムが説明され、変換後の制約がコンパクトになるという利点が示されている。最後に構文解析実験の結果から、制約射影を用いた解析が従来の変換法を用いた解析に比べて効率が良いことが示されている。

 第6章では素性名と素性値のペアのリストおよび経路方程式に基づく文法記述を論理制約に変換する方法が提案されている。この方法により、選言情報を含む文法記述を、選言情報を保ったまま論理制約に変換することができ、文法記述の容易性と解析の効率性を両立することができることが示されている。

 第7章では書きことば解析用の文法を拡張することによって話しことば解析用の文法を構築する方法が提案されている。具体的に、話しことば特有の語句のための辞書項目の追加、助詞の省略を扱うための素性制約緩和、言い直しを扱うための句構造規則の追加、発話行為表現を得るための句構造規則の追加の4つの拡張について述べられており、さらにこの話しことば解析用の文法が論理制約によって効率よく表現できることが示されている。

 第8章では文法の拡張によって生じる曖昧性のうち、論理制約によって対処できない曖昧性を扱うための多重弱文法プロセス法が提案されている。この方法では、異なった方法で拡張された複数の文法を用いて分散並行的に解析を行うことによって、話しことば特有の現象を含む発話が解析可能であり、かつ、そのような現象を含まない発話も効率良く解析できることが示されている。

 第9章では、以上の議論から、論理制約の処理に基づく書きことばの解析法を拡張することにより話しことばの解析が可能であることが結論づけられている。

 なお、本論文第5章および第6章は島津明氏、第3章、第7章、第8章は島津明氏および小暮潔氏との共同研究であるが、論文提出者が主体となって手法の提案および検証を行ったもので、論文提出者の寄与が十分であると判断する。

 したがって、博士(理学)を授与できると認める。

UTokyo Repositoryリンク