学位論文要旨



No 122726
著者(漢字) 渡邊,美知子
著者(英字)
著者(カナ) ワタナベ,ミチコ
標題(和) 音声コミュニケーションにおけるフィラーの特徴と役割
標題(洋) Features and Roles of Filled Pauses in Speech Communication
報告番号 122726
報告番号 甲22726
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(科学)
学位記番号 博創域第263号
研究科 新領域創成科学研究科
専攻 基盤情報学専攻
論文審査委員 主査: 東京大学 教授 広瀬,啓吉
 東京大学 教授 柴田,直
 東京大学 教授 近山,隆
 東京大学 教授 相田,仁
 東京大学 助教授 峯松,信明
 東京大学 助教授 杉本,雅則
内容要旨 要旨を表示する

 「エート」,「アノー」などのフィラー,繰り返し,引き延ばし,訂正,削除,挿入などの言い淀みは日常の話し言葉に頻出する。それにもかかわらず,これらの分布に関する記述と,このような現象が音声コミュニケーションに及ぼしている影響についての研究は,特に日本語に関しては驚くほど少ない。本研究では,言い淀みの中で最も頻度が高いフィラーの分布の特徴と役割を,発話生成・知覚の両側面から調べた。

 第1章では,研究の背景,目的,対象を述べた。

 第2章では,言い淀みの分類と分布の特徴,それらの発話生成モデルとの関連,聴き手への影響を調べた研究を,フィラーを中心に概観した。言い淀みは,句,節,文などの主要構成素境界ならびに談話の主要な切れ目で現れやすいこと,後続構成素が長く複雑なほど出現率が高いことが明らかになった。これらの先行研究より,フィラーの出現率に関し,「境界仮説」,「複雑さ仮説」の2つの仮説を提示した。境界仮説とは,「境界が深いほど,フィラーの出現率は高い」,複雑さ仮説とは,「後続構成素が長く複雑なほど,フィラーの出現率は高い」というものである。

 第3章で,フィラー使用頻度パタンによる話者タイプの分類を試みた。対応分析とクラスタリングにより,話者を使用頻度の高いフィラーによって,エー型,エート型,マア・アノ型,母音型,引き延ばし型,の5グループに分類した。各グループの特性より,フィラーの選択に影響する要因はフィラーの種類により異なることが示唆された。

 第4章では,境界仮説と複雑さ仮説を,学会講演,大学の講義,カジュアルな講演を対象に検証した。まず境界仮説を談話境界について検証した。オランダ語の独話では,多くの聴き手が談話の切れ目と認める箇所直後の韻律句頭で,それ以外の句頭よりもフィラーの頻度が高いこと,フィラーの中でも"uh"よりも"um"の頻度が高いことが報告されている。日本語でも同様の傾向があるかどうかを調べた。談話の深い切れ目と想定される箇所で浅い境界よりもフィラーの出現率が高かったのは,学会講演,講義では3講演のうち1つだけだった。カジュアルな講演では,フィラーの出現率は調査対象とした5講演全てにおいて深い境界で高い傾向があった。フィラーの出現位置に関し,オランダ語の深い境界ではフィラーは句中よりも句頭に現れやすいのに対し,日本語ではそのような傾向は観察されなかった。フィラーの種類に関しては,学会講演,講義では,深い境界で「エート」の出現率が高く,カジュアルな講演では「エート」と「エー」の出現率が高かった。これらの結果より,1) 談話境界の深さとフィラーの出現率に対応があるかどうかは,談話の種類,言い換えると即興性や改まりの度合いに左右される;2) フィラーが境界直後の句頭に現れる傾向は言語普遍的ではない;3) 特定のフィラーが深い境界で用いられやすいという傾向は言語の違いを超えて存在することが示唆された。

 次に,統語境界の深さとフィラーの出現率との対応について調べた。南(1974)らにより,日本語の副詞節は主節からの独立度に応じて,A, B, Cの3類に分類されている。主節とは独立した主題,主語を取ることのできるC類の独立度が最も高く,そのどちらも取ることのできないA類の独立度が最も低く,B類はその中間とされている。副詞節と主節間の境界の深さもこの分類に対応し,C類-主節間で最も深く,A類-主節間で最も浅く,B類-主節間はこれらの中間と考えられる。したがって,境界仮説よりフィラーの出現率は,C類-主節間で最も高く,A類-主節間で最も低く,B類-主節間はこれらの中間と予測される。節境界よりも深いと考えられる文境界では,フィラーの出現率はC類境界よりもさらに高いことが予測される。この仮説を,学会講演,カジュアルな講演を対象に検証した。A類は頻度が低かったため,分析対象からはずした。フィラーの出現率は予測どおり,B類境界よりもC類境界,文境界の方が高かったが,C類境界と文境界間では差がなかった。文境界では接続詞の頻度が節境界に比べ高く,接続詞がフィラーの役割を兼務し,話者にプラニングの時間を与えていることが推測された。

 次に,B, C類の節境界と文境界におけるフィラーの出現率を調べることによって複雑さ仮説を検証した。B, C類の節境界では,後続構成素が長く複雑なほどフィラーの出現率は高く,複雑さ仮説を支持する結果が得られた。しかし,文境界では,後続節長の違いによるフィラーの出現率の変化は見られなかった。この結果は,後続構成素の長さ・複雑さがフィラーの出現率に影響するのは文よりも小さい単位に限られることを示している。節頭・節中を合わせたフィラーの出現率は,境界の種類を問わず,節長の増加に伴い単調に増加した。この結果は,フィラーが発せられている間に生成される発話単位は,節よりも小さいものであることを示唆している。

 節境界,文境界では,フィラーの出現率に対する影響力は,後続構成素の長さ・複雑さよりも境界の深さの方が大きかった。境界が深いほど,次に何をどう話すかについて決めなければならないことが多いことを考えると,文境界以上の深い境界でフィラーの出現率に主として影響するのは発話プラニングの量であり,後続構成素の長さ・複雑さの影響は影を潜めること,後続構成素の長さ・複雑さの影響が現れるのは,節以下の単位における言語形式選択段階であることが示唆された。

 第5章では,聴き手による後続発話内容の予測にフィラーが影響を及ぼしているかどうか調べた。フィラーに続く構成素はフィラーがない場合に比べ長く複雑な傾向があった。そのような,フィラーと後続構成素の複雑さとの対応を聴き手が後続発話内容の予測に用いているかどうかを,日本語母語話者と非母語話者(中国語話者)を対象に聴取実験により調べた。コンピュータ画面に,単純な図形と,それらに2本の矢印がついた,より複雑な図形がペアで提示された。続いて,どちらかの形をした紙をもってくるよう話者が対話者に頼んでいる音声が提示された。被験者は,言及されているのがどちらの図形かわかり次第,できるだけ早く図形に対応したボタンを押すよう教示された。図形を描写する語の直前に,フィラー「エート」がある文,フィラーと同じ長さのポーズがある文,フィラーもポーズもない文の3条件が設定された。フィラーは長く複雑な構成素の前に現れる傾向があるので,フィラーがあると,聴き手は複雑な図形の描写が続くことを予測すると想定した。したがって,実際に複雑な図形の描写がフィラーに続いた場合,フィラーがない場合に比べて反応時間は短くなると予測した。一方,フィラーに単純な図形の描写が続いた場合,フィラーの分布傾向とは一致しないため,反応時間の短縮はおきないと予測した。ポーズ条件は,反応時間にフィラーの効果があった場合,その効果がフィラーの持つ音声によるものか,時間によるものかを調べるために設定した。フィラーと同じ長さのポーズにフィラーと同様の効果があれば,フィラーの効果はフィラーの長さの効果ということになり,もし効果が異なれば,その違いはフィラーの持つ音声の効果ということになる。日本語母語話者を対象とした実験結果は,「フィラーがあると,聴き手は長く複雑な句が続くことを予測する」という仮説を支持するものであった。予測どおり,フィラーが複雑な句の前にある場合,ない場合に比べ,反応時間は短かく,フィラーが単純な句の前にある場合には,反応時間の短縮はおきなかった。フィラーとポーズの効果に有意差はなかった。この結果から,フィラーの効果は主にフィラーの持つ長さによるものであることが示唆された。一方,非母語話者(中国語話者)を対象とした同じ実験では,被験者の日本語熟達度の違いにより,異なる結果が得られた。上級話者の反応パタンは日本語母語話者のものと同じであった。一方,滞日期間が短く,日本語熟達度が低いと考えられる被験者の反応パタンに,フィラー,ポーズの影響は見出されなかった。日本語熟達度が両者の中間と考えられる,被験者グループでは,複雑な句の前にフィラーがある場合はない場合に比べ反応時間は短縮したが,複雑な句の前にポーズがある場合,ない場合との有意差はなかった。これらの結果から,中国人日本語話者も日本語熟達度が上がるにつれ,日本語母語話者同様,フィラーを後続句の内容予測に用いるようになることが示唆された。

 第6章で,結論を述べた。

 以上の分析を通し,日本語の講演音声におけるフィラー分布の特徴とその役割の一端が明らかになった。また,母語話者,非母語話者の聴き手に対するフィラーのポジティブな影響を実証的に示した。本研究は,フィラーに存在する言語固有の特徴と言語を超えた特徴の一端も明らかにし,人間の発話生成・理解プロセス研究の進展に貢献した。

 本研究前半ではフィラーの出現率を中心に分析したが,今後,その音響的特徴量に着目することにより,より精緻で音声認識技術等に直接役立つ研究が可能になると考えられる。また,本研究では日本語における定量的言い淀み研究の第一歩として,最も頻度の高いフィラーに分析対象を絞ったが,今後,他の言い淀みの分布や働きとの関連を調べることにより,より包括的に発話生成・理解プロセスを把握することが可能になると考えられる。また,対話音声におけるフィラーの特徴の定量的分析も,今後の研究課題である。

審査要旨 要旨を表示する

 本論文は「Features and roles of filled pauses in speech communication」と題し、日常の話し言葉に頻出する言い淀み、特にその中でも「エート」,「アノー」などのフィラー(filled pause)が、音声コミュニケーションに及ぼす影響について、実証的な研究を行ったものであって、全6章からなり、英文で書かれている。

 第1章は「Introduction」であって、まず、フィラーなどの言い淀みが日常の話し言葉に多く頻出することを実例で示した後、それにもかかわらず、現在までの言語学では、人間の言語活動として扱われず、研究対象とされてこなかったという問題点を指摘している。欧米では、コミュニケーションの観点から、言い淀みの研究が進んできており、日本語においても定量的な研究が必要なことを指摘している。その上で、本論文ではフィラーに焦点を当てた研究を行うとしている。最後に、論文の章立てを示している。

 第2章は「Background」と題し、言い淀みの分類と特徴、それらの発話生成モデルとの関連ならびに聴き手への影響についての先行研究を、フィラーを中心に概観した。言い淀みは、句、節、文などの主要構成素境界ならびに談話の主要な切れ目で現れやすいこと、後続構成素が長く複雑なほど出現率が高いことが明らかにされている。これらの先行研究において提唱されているフィラーの出現率に関する仮説を整理し、「境界仮説」、「複雑さ仮説」の2つのとしてまとめた。これらは、フィラーの出現率が、それぞれ、「境界の深さ」、「後続構成素の長さ・複雑さ」によって高くなるとするものである。

 第3章は「Speaker variation in the use of filled pauses」と題し、フィラーの種類と頻度についての個人差を、日本語話し言葉コーパス(The Corpus of Spontaneous Japanese, CSJ)について調べた結果をまとめている。話者の性別・年齢や発話時のあらたまりの度合いとが、講演中の各種フィラーの頻度にどのように現れるかを、分散分析とクラスタリングによって調べた結果、フィラーの分布には、あらたまり度の違いや話者の性別・年齢による偏りがあり、話者のフィラー選択にはこのような社会言語学的要因が影響していることが示唆されたとしている。

 第4章は「Speech planning and filled pauses」と題し、第2章で示した境界仮説と複雑さ仮説を、フィラーの出現率の分析をもとに検証している。まず、日本語の副詞節を主節からの独立度の高さの順にA, B, Cの3つに分類した上で、副詞節と主節との境界の深さもこの分類に対応して、A類と主節の間(A類節境界)、B類と主節の間(B類節境界)、C類と主節の間(C類節境界)の順に深くなるとしている。ここで、A類は主節と独立した主題・主語を取ることのできない節、B類は主節と独立した主語を取ることができるが独立した主題は取ることの出来ない節、C類は主節と独立した主題・主語を取ることのできる節である。境界仮説では、フィラーの出現率はA類節境界、B類節境界、C類節境界、文境界の順位高くなることが予測されるが、その予測をCSJについて検証している。次に、複雑さ仮説の検証のために、フィラーの出現率と後続節長(語数)との対応を、同じくCSJについて境界の種類別に調べている。その結果、両仮説とも節境界において支持されるが、出現率との対応関係は境界の深さの方が強いことが分かったとしている。なお、文境界については、接続詞の存在が結果に影響していると考えられる。

 第5章は「Effects of filled pauses on listeners' expectation about the upcoming speech」と題し、聴き手による後続発話内容の予測にフィラーの存在が影響しているかどうかを、日本語母語話者と非母語話者(中国語話者)を対象に、聴取実験により調べている。コンピュータ画面に、単純な図形とそれらに2本の矢印がついたより複雑な図形を提示し、被験者が言及された方を選択するのに要する時間が、フィラー「エート」の存在によってどのように変化するかを調べた。フィラーがあると、聴き手は複雑な図形の描写が続くことを予測し、その結果、複雑な図形の描写がフィラーに続いた場合、フィラーがない場合に比べて反応時間が短くなると想定される。一方、単純な図形の描写が続いた場合には、反応時間の短縮はおきないと想定される。日本語母語話者を対象とした実験では、この想定が支持された。非母語話者を対象とした同じ実験では、日本語熟達度が上昇するにつれ日本語母語話者と同様の結果が得られ、フィラーを後続句の内容予測に用いるようになることが示されたとしている。

 第6章は「Conclusion」であって、本研究で得られた成果を要約するとともに、将来の研究の発展について展望している。

 以上を要するに、本論文は、従来の言語学研究では、ほとんど扱われていなかった話し言葉におけるフィラーを研究対象とし、まず、生成面からフィラーの分布について、種々の要因との関係を詳細に調べることにより、フィラー生成に関する仮説を検証し、次に、知覚面から、フィラーと音声理解にかかる時間との関係を調べ、音声理解におけるフィラーのポジティブな役割を実証したものであって、言語学、さらには、音声認識の高度化、対話システムの設計などの将来的な音声言語情報処理の発展に大きく寄与したものであり、情報学の基盤に貢献するところが少なくない。

 よって本論文は博士(科学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク