内容要旨 | | 本研究の目的は,ユーザフレンドリな音声言語による人間と機械のインタフェースの構築であり,そのために,音声言語によって人間と自然な対話を行うシステムを構築することである.ここで自然な対話とは,発話の長さ,発話の文法性,割り込み等に関して制限のない対話を意味する.本論文では,そのような対話を行うシステムの発話解析モジュールで用いるための,話しことば解析法を提案する. 対話システムが実時間で動作して自然な対話を行うためには,次のような特徴をもつ発話解析モジュールが必要である.まず最初に,ロバストでなくてはならない.すなわち,自発的発話を解析できなくてはならない.自発的な発話は言い直し,つなぎ語といった書きことばには現れない現象を含むので,通常の書きことば用の解析システムでは扱うことができない.また,入力が終わる前に解析を始めなくてはならない.すなわち,入力を逐次的に解析して部分的な結果を出力しなくてはならない.さもなくば,対話システムは必要な時に即座に応答することができない.さらに,入力を実時間で解析できなくてはならない.さもなくば,システムの応答が遅れてしまう.最後に,時間が許せばすべての可能な解析結果を出力できる必要がある.さもなくば,ユーザの発話が明瞭でゆっくりであってもシステムは誤解してしまう可能性がある.しかしながら,従来の対話システムの解析法の多くは,自然な話しことばを扱っていなかったか,または,構文解析を用いていないため可能な解析結果をすべて出力することができなかった.自然な話しことばを解析する方法がいくつか提案されているが,逐次的な解析とともに用いることができないという問題があった. 本論文では,この問題の解決法として,チャート法に基づく分散型の逐次的部分解析法で,論理的制約の処理に基づく方法を提案する.この方法は次のような特徴を持つ. まず第一に,本方法ではチャート法を用いて単語列または単語ラティスを逐次的に解析し,部分解析法により発話単位を発見してその発話行為表現を出力する.ここで発話単位とは,逐次的に理解を行う際の単位となるもので,談話処理モジュールの入力の単位である.本方法では発話単位を文法によって構文的に定義する.名詞句や動詞句などの,書きことばの文よりも短い句も,発話単位として認識される. 第二に,本方法では,書きことばの文法を拡張して作成した話しことば用の文法を用いる.この文法は構文制約や意味制約などの様々な制約が統一的に記述できる単一化文法に基づいている.話しことばの文法は,対話データの分析に基づき3つの点で拡張されている.まず格助詞の省略を扱うために素性制約が緩められている.次に,言い直しを扱うための句構造規則と,発話単位の発話行為表現を扱うための句構造規則が追加されている.特に言い直しに関しては,対話データの詳細な分析に基づき,4つの句構造規則が追加された.さらに話しことば特有の表現のための辞書項目が追加されている.この話しことば用の文法を用いて発話の解析実験を行い,対話データ中の発話の86%が解析できることを確認した. 第三に,本方法では論理制約の処理技法を用いる.文法の拡張は文法の曖昧性を増加させるので,実時間で精度良く理解するために,曖昧性を効率的に扱う必要がある.この曖昧性は単一化文法の枠組で選言的素性構造を用いて表現する.本方法では,選言的素性構造を一階の確定節論理に基づく論理制約によって表現する.論理制約を用いると,選言的素性構造の単一化は論理制約を標準形に変換することによって行うことができる.制約変換の方法として,制約単一化と呼ばれる効率的な方法が開発されているが,制約変換が行われる度に出力の制約の中のリテラルの引数の数が増え,構文解析が進むと変換に時間がかかるようになるという欠点がある.そのため本論文では,制約射影という方法を提案する.制約射影は,論理制約と,ゴールと呼ばれる変数の集合とを引数としてとり,ゴール中の変数に関して入力と同等で,かつ,ゴール中の変数に関する情報のみをもつような制約を返す演算である.制約射影を用いることにより,後の解析では必要でない情報を無視することができるので,構文解析の効率が向上する.論理制約を用いて上記の話しことば用の文法を構築し,解析実験により制約射影と制約単一化の解析速度の比較を行ったところ,すべての入力について,制約射影を用いた構文解析の方が効率的であることが判明した. 論理制約の処理に基づく解析に関するもう1つの問題点として,論理制約による文法記述に労力がいるという問題がある.このため,大規模な文法を構築することが困難である.そこで,経路方程式および素性名と素性値のペアのリストに基づく,記述および修正のしやすい文法記述形式から,論理制約に基づく文法の内部表現を生成するアルゴリズムを提案する.従来,同様の記述形式から一階論理の項に基づく内部表現を生成するアルゴリズムがいくつか提案されているが,選言情報を扱うことができなかった.しかしながら,このアルゴリズムは,もとの文法記述の選言情報を展開せずに論理制約に変換することができるため,結果として得られる内部表現を用いた構文解析の効率が低下しない. 最後に,本方法では分散型の解析法を用いる.制約射影を用いることにより,選言を効率的に扱うことはできるが,文法の制約が緩められているため,チャート解析の弧の数が増加することを避けることはできない.もしも入力発話が話しことば特有の現象を全く含まなければ,書きことば用の文法を用いた解析は,話しことば用の文法を用いた解析よりも短い時間で解析できる.さらに発話単位は短いので,1つの発話単位がすべての話しことば特有の現象を含むことは稀である.この問題の解決のため様々なロバスト解析法が提案さているが,逐次解析とともに用いる時に問題が生ずる.例えば,最初に制約を緩和しない文法を用いて解析を行い,これが失敗した場合に,制約を緩和した文法を用いて再解析するロバスト解析法が用いられている.しかしこの方法では,発話が終了するまで解析が失敗したかどうかが不明なため,発話がどこで終了するのかがあらかじめ分からない逐次解析と共に用いることができない.そこで本論文では,multiple weakgrammar process法を提案する.この方法では,異なった文法を用いる解析プロセスを複数走らせる.各々の文法は,1つまたは複数の話しことば特有の現象を扱うための文法である.これらの文法の制約は完全に緩められているわけではないので,すべての話しことば特有の現象をカバーしているわけではない.しかし解析が成功する場合には,完全に制約が緩められた文法を用いた解析よりも短い時間で解析することができる.これらの解析プロセスを複数のプロセッサ上で走らせ,各プロセスからの解析結果を集めて出力することにより,話しことば特有の現象を少ししか含まない発話を効率よく解析することができる.複数の文法を用いた解析実験を行い,本方法を用いて解析が効率よく行えることを確認した. 本論文の方法はチャート解析を用いるので,入力を逐次的に解析すること,および,時間が許せばすべての解を出力することが可能である.また,話しことば用に拡張された文法を用いているので,ロバストな解析が可能である.実時間解析はチャート解析におけるアジェンダ制御によって可能であり,さらに制約射影とmultiple weak grammar process法の効率性により解析中に発見できる発話単位の数が増えるので,実時間解析中に正解を得る確率が高くなる.以上のことから,本方法は,人間と自然な対話を行う音声対話システムの発話解析モジュールに用いることができる. |