学位論文要旨



No 117138
著者(漢字) 桐山,伸也
著者(英字)
著者(カナ) キリヤマ,シンヤ
標題(和) 情報検索型音声対話システムにおける対話戦略及び音声応答の高度化に関する研究
標題(洋)
報告番号 117138
報告番号 甲17138
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5279号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 廣瀬,啓吉
 東京大学 教授 井上,博允
 東京大学 教授 石塚,満
 東京大学 教授 田中,英彦
 東京大学 教授 相田,仁
 東京大学 助教授 峯松,信明
内容要旨 要旨を表示する

 情報検索システムの利便性を向上させるためには,検索精度の向上はもとより,検索結果に対して,個々の内容はどのようなものであるか,今後どのような検索語によって絞り込みを行えばよいのか,といった検索支援のための情報をユーザに適切に提供することが必要である.音声の持つ韻律情報を利用して,内容の焦点にあたる部分を韻律的に強調した音声を生成することにより,伝達内容をより正確にユーザに伝えることができる.情報検索を音声対話によって行うシステムの研究の多くは,音声入力から検索要求を正しく認識・理解する点に主眼がおかれており,検索支援情報をユーザに伝える音声応答を生成するという観点からの積極的な研究は少ない.この観点から本論文では,自身が開発した学術文献検索をタスクとした情報検索型音声対話システムについて,ユーザによって有益な検索支援情報を,分かり易い音声応答によって提示できることを主眼に据えて行ってきた,システムの対話戦略,及び音声応答の高度化に関する研究について述べる.

 使い勝手の向上の観点からシステムに必要な機能に関する検討を行った.すなわち,システムの機能を検索機能,結果出力機能,質問応答機能の3つに分類した上で,各種機能をシステムに実装した.検索機能について,検索条件の変更に関する操作を音声入力によって柔軟に行える機能を実装した.また,検索結果の絞り込みにおいて,追加する検索語の候補(関連語)を表示することも可能である.結果出力機能について,該当件数に応じて臨機応変に検索支援情報の音声による提示内容,及び画面に表示する内容を切り替える機能を搭載した.すなわち,該当件数が多い場合,検索語を追加して絞込みを行うよう誘導するとともに,関連語のリストを画面に表示する.文献がある程度絞られている場合は,該当文献のタイトル一覧を表示するとともに,一覧中の文献の詳細を表示しますか,といった案内を行う.質問応答機能について,該当文献の著者名・雑誌名・発行年といった個々の項目に関する質問が可能である.さらに,該当文献全体に対する質問にも対処可能であり,文献一覧中で最も新しい文献はどれか,といったより知的な質問へも回答できる.機能拡張を行う前のシステムと,機能拡張後のシステムを比較するシステム試用実験を実施した.その結果,システムに搭載されたほぼすべての拡張機能について,有益な機能であると評価され,機能拡張によってシステムの使用感が飛躍的に向上したことが示された.

 本システムでは,状態遷移表に基づく対話管理手法を採用した.システムの基本的な対話戦略について,円滑な検索対話の実現を念頭において検討を行った.対話の主導権の管理について,対話中におけるシステム側からの案内や誘導,確認のレベルが異なる,ユーザ主導型,システム主導型・両者の中間型という3通りの対話管理方式を用意し,システムに実装した.システム試用実験を行ったところ,両者の中間型が最も良いという結果となり,適度なレベルで案内や確認を行う対話戦略を提案することができた.システム側からの案内・誘導が一切行われないユーザ主導型が最も敬遠された一方,対話中におけるシステムからの確認が最も頻繁に行われるシステム主導型について,確認がくどいと感じる被験者も存在していた.従って,ある程度システムに慣れたユーザはユーザ主導型を好むようになることも考えられる.質問に対する応答に含める情報量に関する検討としては,回答情報だけを応答する方式,回答情報を修飾する情報(修飾情報)を全て含めて応答する方式,ユーザの質問文中に含まれない修飾情報だけを含めて応答する方式という3通りの応答方式をシステム試用実験により評価した.その結果,ユーザの質問文中にない修飾情報を補完する方式が最もよいと評価され,対話の流れを考慮して省略・補完内容を変化させる応答形式がユーザにとって分かり易いものであることが示された.

 ユーザにとってより有益な検索支援情報を提示することによって検索を効率的に進めるために,システムに話題知識を導入した.すなわち,検索分野の情報を情報検索対話における話題と捉え,入力検索語から検索分野の推定を行い,推定分野での検索をユーザに誘導することにより,検索の効率化を図った.話題知識を表す尺度として,各検索語の各検索分野への分類寄与率RSW (Relevance Score between Words and topics),及びデータベース中の各文献の各検索分野への分類寄与率RSD (Relevance Score between Documents and topics)の2つを導入した.RSWとRSDを再帰計算によって算出する手法を開発し,計算の初期値で用いた文献の分類情報に対する分類正解率(81.1%)が,提案手法によって算出されるRSDを用いて文献を分類した場合,最大で86.1%まで向上することを示した.提案手法によって求めたRSWを用いて入力検索語から話題推定を行い,推定した検索分野で検索を進めるようユーザを誘導する機構をシステムの対話戦略へ組み込んだ.また画面表示に際して,該当文献一覧における各文献のRSDに基づく所属分野,及び関連語リストにおける各検索語のRSWに基づく所属分野の情報を色分けによって表示できるよう拡張した.話題知識を導入した新システムと従来システムを比較するシステム試用実験の結果,新システムにおいて対話数・対話時間を約20%削減できたことがわかった.主観評価の結果においても,対話の進め方や使い勝手の観点から新システムが良いという評点を得るに至り,話題知識の導入によって効率的な検索対話を実現できることが示された.一方,被験者のコメントには,検索語の入力だけによって文献を絞り込む方式に慣れているため,従来システムのほうが使い易いとする被験者も存在した.この点については,既に述べた対話の主導権に関する評価結果とも関連するが,ユーザのシステムに対する熟練度を考慮した対話戦略の検討が今後の重要な課題であるといえる.

 バリエーション豊かな応答文を見通しよく生成でき,応答内容の拡張を容易に行えることを目的として,文概念からの段階的情報変換による応答生成手法を提案した.応答文のシステム内部表現として,文概念コード・韻律句コード・単語コードの3つのを用いることとし,文概念として,定型文・検索語入力要求・実行命令通知・実行命令確認・該当件数通知・指示/通達・質問応答という7つを定義した.また,これら3つの内部表現間の変換に際して,文概念辞書・韻律句辞書・単語辞書という3つの辞書を用意した.本システムでは,基本周波数生成過程モデルに基づく,フレーズとアクセントに関する韻律規則を用いている.これらの大きさを決定する要因の一つである「重要語」に関する2値パラメータを操作することにより,対話の焦点を韻律によって表現している.提案した音声応答生成手法により,先述した対話管理に関する複数の応答形式を用意する作業を効率化することができた.さらに,後述する対話の焦点を韻律によって表現する制御についても,これを容易に実現できた.加えて,上述した3つの辞書について,それらの英語版を用意するだけでシステム応答を英語化することに成功しており,システムの多言語化という観点からも,提案手法が有効であることを確認した.

 対話の焦点を適切な韻律によって表現した音声応答を生成するための,焦点韻律制御に関する検討を行った.応答文中の焦点の位置を決定する「焦点位置決定規則」と,焦点が置かれた部分の韻律的な強調手法を決定する「焦点表出韻律規則」の2つの規則を構築した.最も初期のシステムにおいて用いていた簡便な規則(従来規則)を実験により評価したところ,焦点を置いた結果,却って不自然に聞こえる応答例が少なからずあることが分かった.これを解決するため,1)ユーザに情報を「通知」する応答文概念については,通知する内容を焦点とする,2)「確認」・「指示」など,ユーザを誘導する応答文概念については,誘導の主旨を焦点とする,といった焦点位置決定規則を提案し,焦点表出韻律規則についても,拍数が10を超える単語,及び列挙表現について,対応するフレーズ指令の「重要語」パラメータをONにしない,といった規則を提案した.聴取実験の結果,提案規則に対し,1)対話の流れを考慮したとき,既知の情報には焦点を置かない,2)対話中において初めて行う実行命令の「確認」では,確認の内容を焦点とする,3)文頭の固有名詞に対応するフレーズ指令に限って「重要語」パラメータをONにしない,といった項目を追加した改善規則を構築するに至った.システム試用実験を通して,改善規則の有効性を検証し,対話の焦点を適切に反映した音声応答を生成する焦点韻律規則が構築できたことを示した.一方,伝達情報の「明確さ」という観点からは,抑揚の大きい音声を出力するシステムを支持する被験者も存在し,被験者の好みによって評価が分かれる傾向にあることが分かった.この点について,ユーザの好みを考慮した焦点韻律制御の検討が,今後の課題の一つであるといえる.

 以上のように,本研究では,システム音声応答について,対話制御からの一貫した高品質化を実現した学術文献検索音声対話システムについて報告した.ユーザの多様な「個人性」に適応させていくことが今後の重要な課題として残されてはいるが,少なくとも「学術文献検索」を対象としたシステムの「音声出力」に関しては,ただ「動く」だけでなく,ユーザにとって「使える」レベルの実用性を兼ね備えたシステムを構築できたと考えている.

審査要旨 要旨を表示する

 本論文は「情報検索型音声対話システムにおける対話戦略及び音声応答の高度化に関する研究」と題し、学術情報検索を音声主体で行う対話システムを構築するなかで、話題知識による効率的な対話戦略、概念からの応答音声の生成と焦点韻律制御を実装してその有効性を立証したものであって、全8章からなる。

 第1章は「序論」であって、情報検索における音声の有用性を指摘した上で、本論文の目的が、効率的な対話戦略、適切な焦点制御と概念からの応答音声生成、に重点を置いた学術情報検索音声対話システムの構築にあるとしている。また、本論文で構築した4バージョンのシステムについて、第2章以降でどのように述べられるかを整理している。

 第2章は「音声対話システムの研究動向」と題し、まず、音声対話システムの要素技術である音声認識・理解、対話制御、音声合成に関しての研究動向を整理し、次に、各所で開発されている音声を利用した対話システムについて紹介した上で、本論文の音声対話システムの特徴を述べている。

 第3章は「学術情報検索音声対話システム」と題し、まず、音声による検索語入力に対応して文献を検索する基本システムを構築してその内容を説明し、次に、関連検索語表示などの拡張機能を有するシステムを開発して、システムの試用によりその優位性を示している。

 第4章は「基本的対話戦略の検討」と題して、対話の主導権、応答に含める既知情報について、実験的に適切なレベルを求め、以下の基準にするとしている。具体的には、両者とも中間的なレベルを選択しているが、ユーザの習熟度との兼ね合いについても指摘している。

 第5章は「話題知識を利用した効率的対話戦略」と題して、まず、データベースの文献を対象とする話題ごとに分け、次に、対話のプロセスにおいて適切に話題を限定することによって、効率的な検索が可能なことを、システムの試用実験で示している。話題への分類は、話題をよく表現する単語をχ2値を基準に選択することに基づく。

 第6章は「概念表現からの音声応答の生成」と題し、抽象文概念をコードにより表現した上で必要情報を補完し、重要語に対応した焦点位置制御を行って音韻・韻律記号列で表現された応答文を生成する手法を開発している。音韻・韻律記号列に従って音声合成が行われ、応答音声が生成される。

 第7章は「対話の焦点を反映した音声応答生成のための韻律制御」と題して、焦点位置の決定規則と、焦点に対応した韻律の制御について述べている。焦点を考慮しない場合と、2通りの焦点に対応した韻律生成の場合について、応答音声のふさわしさ、好ましさの観点から聴取実験を行って比較し、焦点の制御の一般的な有効性を示すと同時に、被験者の好みがあることを指摘した。この好みに従って、被験者によって異なる韻律制御を行うことを提案し、その有効性を示している。

 第8章は「結論」であって、本研究で得られた成果を要約し、将来の課題について言及している。

 以上を要するに、本論文は、音声を主要情報伝達媒体とした学術文献情報検索システムにおいて、対話の話題に着目することによる効率的な検索、概念からの一貫した応答音声生成、焦点に対応した応答音声の韻律制御を実現するとともに、4つのバージョンのシステムを構築することによって、これらの有効性を実験的に検証したもので、情報工学に貢献するところが少なくない。

 よって、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク