学位論文要旨



No 214628
著者(漢字) 柏野,牧夫
著者(英字)
著者(カナ) カシノ,マキオ
標題(和) 聴覚系の環境適応性に関する心理物理学的研究
標題(洋)
報告番号 214628
報告番号 乙14628
学位授与日 2000.03.15
学位種別 論文博士
学位種類 博士(心理学)
学位記番号 第14628号
研究科
専攻
論文審査委員 主査: 東京大学 教授 佐藤,隆夫
 東京大学 教授 立花,政夫
 東京大学 助教授 高野,陽太郎
 東京大学 教授 長谷川,壽一
 名古屋大学 教授 筧,一彦
内容要旨

 聴覚系の基本的な役割は,聴取者が周囲の状況に適応して合理的に行動するために,耳に届く音響信号を分析して,環境内のどこでどのような音源が鳴っているかを把握すること,すなわち音源定位と音源識別である.これは原理的にはきわめて困難な情報処理課題である.なぜならば,耳に届く音響信号から音源の位置と種類を求めることは,何個かの音源で生成された音波が,伝送経路での反射や吸収,聴取者の頭部や耳介での方向依存的フィルタリング等を経て,両方の耳に混合して到達する過程の逆問題に相当し,一般的には何らかの付加的情報なしに解くことのできない性質のものだからである.それにもかかわらず,日常の環境では,聴覚系は適切にこの情報処理課題を達成している.さらに,聴覚系の情報処理は,環境の変動や音響信号の劣化に対して頑健であり,また,刻一刻と入力される大量の情報を迅速に処理する効率の良さをも備えている.このような高度な環境適応性が聴覚系においていかにして実現されているかについて,情報論的分析や神経科学的知見を援用しつつ,主に心理物理学的な手法によって解明を図ることが本研究の目的である.その際の暫定的な指針として,並列-階層構造という枠組みを採用した.これは,(1)末梢系における周波数分析と神経パルス変換,(2)周波数帯域ごとに存在する並列モジュールによる局所的特徴抽出,(3)周波数間および特徴モジュール間の統合と音源解釈,(4)音源の認識,という四段階の機能的段階を経て音源の属性が求められ識別されるという枠組みである.とくに,第二段階における情報圧縮と適応符号化(第2章,第3章),第三段階における特徴統合における生態学的制約(第4章)や処理の限界と方略(第5章)について重点的に検討し,従来の研究に見られる第一段階と第四段階の間の乖離を埋めることを目指した.

 第2章では,聴覚系の中心機能の一つである音源識別の基礎となる,スペクトル変化パタンの分析機構について,選択的順応の手法を用いて検討した.振幅変調の検出閾が,振幅変調に対する順応によってどのように変化するかを,搬送波・変調波ともに正弦波を用いて測定した.その結果,(1)順応音と検査音の変調周波数が同一のとき検出閾は上昇するが,両者の差が増大すると検出閾上昇は小さくなる,(2)順応音と検査音の搬送周波数についても同様の選択性がある,(3)順応音と検査音を反対耳に提示すると同側耳に提示した場合より順応による検出閾上昇が小さい,ということが示された.これらの結果は,聴覚系の中でも比較的初期の両耳融合以前の段階に,各搬送周波数帯域ごとに,特定範囲の振幅変調周波数に選択性をもつ神経チャンネル群(変調フィルタバンク)が存在することを示唆している.一方,振幅変調の検出閾が同時に存在する振幅変調によって上昇する変調マスキングは,変調周波数に関する選択性はもつが搬送周波数や提示耳に関する選択性をもたないことが既に示されている.このことと本実験の結果とを考え合わせると,変調フィルタ群の出力が,上位段階で搬送周波数間および両耳間の統合を受けるという階層構造が示唆される.このような変調フィルタバンクの構造は,まずさまざまな時間分解能で局所的なスペクトル変化を分析し,その後で大域的なスペクトル変化パタンを抽出することに相当し,情報圧縮にもつながるものである.

 第3章では,聴覚系のもう一つの中心機能である音源定位の基礎となる,空間的パタンの分析機構について,とくに両耳間時間差の処理機構の刺激依存的可塑性を中心に,二種類の残効現象を通して分析した.第一の現象は,定位残効と呼ばれるものである.これは,ある両耳間時間差をもつ検査音の定位が,直前に提示された別の両耳間時間差をもつ順応音から遠ざかる方向にずれて知覚されるという現象である.実験の結果,この現象は,(1)順応音と検査音の周波数が同一のとき最大となり,両者の差が1/2 octaveになるとほぼ消失する,(2)順応音と検査音の両耳間時間差が250-300s離れたときに最大となる,ということが示された.第二の現象は,弁別残効と呼ばれるものである.これは,わずかに異なる両耳間時間差をもつ一対の検査音の定位の弁別閾が,直前に提示された順応音によって変化するという現象である.実験の結果,(1)順応音と検査音の両耳間時間差が近い場合には弁別閾が低下し,約250s以上離れている場合には上昇する,(2)順応音と検査音の周波数が近い場合には弁別閾が低下し,1/2あるいは1 octave離れている場合には上昇する,ということが示された.これらの事実は,従来固定的なものとされてきた両耳間時間差検出機構が,直前の入力の状態によって感度を変化させるような適応的なものであることを示唆している.これらの実験結果を説明するために,周波数帯域ごとに存在する両耳間時間差に選択性をもつ神経素子の利得が入力に応じて変化するというモデルをつくり,計算機シミュレーションを行ったところ,弁別残効の周波数選択性の一部を除いては良好な近似を得た.このように,先行する入力のパタンに応じて処理系の特性が変化するという適応符号化は,分解能と動作範囲の広さを両立し,入力信号の冗長性を低減して効率的な特徴符号化を行う上で有効である.

 第4章では,スペクトル変化パタンの情報と空間的パタンの情報との統合過程の一例として,聴覚的補完現象の最も単純な形態である連続聴効果を取り上げた.連続聴効果とは,弱い音(被誘導音)と強い音(誘導音)とが交互に提示されたときに,被誘導音が連続的に鳴っているかのように知覚される現象である.この現象は,実環境で不可避的に存在する,過渡的な強い音による弱い音の隠蔽効果(マスキング)に対する情報処理の頑健性に寄与している.この現象に関しては,従来からスペクトル的な制約条件が知られていた.すなわち,連続聴効果が生じるためには,誘導音は被誘導音が同時に存在していたとしてもそれをマスクできるだけの振幅スペクトルをもっていなければならない.これをマスキング可能性の法則と呼ぶ.ここでは,このマスキング可能性の法則が,空間的な特徴である両耳間位相差に対しても成り立つかどうかを検討した.実験の結果,誘導音と被誘導音の両耳間位相差が異なる場合には,同一の場合に比べて,(1)連続聴が生じなくなる被誘導音の相対レベルが低く,(2)マスキング量が少なく,(3)誘導音の知覚的な大きさの低下量が小さい,ことが示された.これらの結果は,これまで周波数領域について成り立つことが示されていたマスキング可能性の法則が,両耳間位相(時間)差領域でも成り立つことを示唆している.このことから,連続聴効果が,各周波数帯域ごとに,振幅変化情報と両耳間位相(時間)差情報とが統合された後に生じると考えられる.このような機構は,実環境でマスキングが生じている可能性が高いときにのみ選択的にマスキングの影響を補償し,適切な音源解釈を行う上で有効である.

 第5章では,同時に存在する複数の音源を知覚する際の限界を分析した.単語音声を中心として,同時に提示される音源(話者)数判断の実験を行ったところ,音源数二つまでは判断はきわめて正確であるが,三つ以上になると急激に不正確になることが明らかになった,この限界は,(1)話者の性別,(2)各単語の立ち上がりの非同期性,(3)各音源の空間的配置,などの音響的条件にほとんど依存しなかった.また,音源が単語音声であるか楽器音であるかといった音源の種類にもあまり影響されなかった.これらのことから,二つまでという限界は,音響的な特徴抽出過程や,あるいは言語音や楽器音などに特殊化した処理過程の制約ではなく,音一般に関する特徴を統合する段階に由来するのではないかと推測される.一方,刺激の提示時間が長くなると話者数3のときの正答率が向上し,しかも意味的文脈の有無によってその向上の程度が異なることが示された.このことは,実際の会話のように長くて意味的冗長性の高い音の場合には処理できる音源の数が増える可能性を示唆している.以上のことから,聴覚系は,同時には二つ程度の音源しか処理できないが,処理の焦点を時間とともに移したり,断片的な情報を時間的に統合したりすることによって過負荷を避けながら巧妙に複数の音源を処理していると考えられる.

 以上のように,本研究の結果,音響信号の解釈を,妥当に,頑健に,かつ効率よく行うための聴覚系の環境適応的な情報処理過程の構造と動作原理の一端が明らかになった.一言で言えば,聴覚末梢系の帯域フィルタ群で音響信号を周波数帯域ごとに分解し,各周波数帯域で並列的に特徴抽出すなわち情報圧縮を行い,その結果得られたさまざまな特徴を生態学的制約を適用しながら統合することによって,音源の定位および識別を行うということである.しかし同時に,上位階層から下位階層へのフィードバックや並列モジュール間の相互作用など,並列階層構造の枠組みを超えた,よりダイナミックな情報処理を示唆するデータもここで得られた実験結果には含まれており,聴覚系の環境適応性の本質的理解に向けて今後の発展的検討が望まれる.

審査要旨

 本論文は聴覚系における音源定位,識別の機能に関して理論的な分析を加え,その上で多くの実験的な検討を行ったものであり,聴覚系の機能の全体像に対して新しい見通しを与えたという意味で斬新かつ画期的な研究である.

 音源の定位や識別のためには,複数の音源からの音波が,伝送経路での反射や吸収,聴取者の頭部や耳介での方向依存的フィルタリング等を経て,両方の耳に混合して到達する過程の逆問題を解かなければならず,一般的には何らかの付加的情報なしに解くことはできない.さらに,聴覚系の情報処理は,環境の変動や音響信号の劣化に対して頑健であり,かつ,刻一刻と入力される大量の情報を迅速に処理するという特質も備えている.

 本論文の第一章では,こうした前提のもとに並列-階層構造という全体的な枠組みを提唱している.これは,(1)末梢系における周波数分析と神経インパルス変換,(2)周波数帯域ごとに存在する並列モジュールによる局所的特徴抽出,(3)周波数間および特徴モジュール間の統合と音源解釈,(4)音源の認識,という四段階の機能的段階を経て音源の属性が求められ識別されるという枠組みである.その上で,第二章以降において各段階における処理のメカニズムを解明するための実験的な研究を展開している.

 第二章では,聴覚系の中心機能の一つである音源識別の基礎となる,スペクトル変化パタンの分析機構について,選択的順応の手法を用いて検討している.振幅変調の検出閾が順応によってどのように変化するかを,搬送波,変調波ともに正弦波を用いて測定し,聴覚系の中でも比較的初期の両耳融合以前の段階に,各搬送周波数帯域ごとに,特定範囲の振幅変調周波数に選択性をもつ神経チャンネル群(変調フィルタバンク)が存在することを示す実験結果を得ている.これまでに報告されている振幅変調の検出閾に対するマスキングの効果と,今回の結果を総合することによって,さまざまな時間分解能で局所的なスペクトル変化を分析した後に大域的なスペクトル変化パタンを抽出するという聴覚系の周波数分析のメカニズムの全体像が浮かび上がってくる.

 第三章では,聴覚系のもう一つの中心機能である音源定位の基礎となる,空間的パタンの分析機構の検討を行っている.具体的には,両耳間時間差の処理機構の刺激依存的可塑性を,定位残効,弁別残効と呼ばれる二種類の残効現象を通して分析し,従来固定的なものとされてきた両耳間時間差検出機構に,直前の入力に依存して適応的な変化が存在することを示す結果を得ている.さらに,こうした事実を説明するために,周波数帯域ごとに両耳間時間差に選択性をもつ神経素子が存在し,その利得が入力に応じて変化するというモデルをたて,計算機シミュレーションによりそのモデルの有効性を確認している.

 第四章では,スペクトル変化パタンの情報と空間的パタンの情報との統合過程の一例として,聴覚的補完現象の最も単純な形態である連続聴効果を取り上げて解析している.連続聴効果とは,弱い音と強い音とを交互に提示した際に,弱い音が連続的に鳴っているかのように知覚される現象である.この現象は,実環境で不可避的に存在する,過渡的な強い音による弱い音の隠蔽効果に対する情報処理の頑健性に寄与している.この現象は従来,マスキング可能性の法則と呼ばれる原理によって説明されてきたが,ここでは,マスキング可能性の法則が,空間的な特徴である両耳間位相差に対しても成り立つことを示すことに成功している.このことから,連続聴効果は,各周波数帯域ごとに,振幅変化情報と両耳間位相(時間)差情報とが統合された後に生じるものと考えられる.

 第五章では,同時に存在する複数の音源を知覚する際の限界を分析している.同時に提示される話者数判断の実験を行い,話者が三人以上になると急激に話者数の判断が不正確になることを明らかにしている.この限界は,話者の性別,空間的配置などの音響的条件には依存せず,また,楽器などでも同じ結果が得られることから,音源の種類にも影響されない.これらのことから,二つまでという限界は,音一般に関する特徴を統合する段階に由来すると推測される.一方,刺激の提示時間が長くなると話者数が多い場合の正答率が向上し,実際の会話のような場合には処理できる音源の数が増える可能性を示唆している.以上のことから,聴覚系は,同時には二つ程度の音源しか処理できないが,処理の焦点を時間とともに移したり,断片的な情報を時間的に統合したりすることによって過負荷を避けながら巧妙に複数の音源を処理していると考えられる.

 以上のように,本論文では,聴覚系全体の構造に関して,モジュール性,階層性に重点をおいた新しい仮説を提案し,多くの巧妙な実験を組み合わせた解析によって,その仮説の妥当性を部分的ながらも実証することに成功している.実験結果から示唆される階層間のフィードバック構造,モジュール間の相互作用などに関するモデル化等は今後,さらに検討することが望まれるが,個別の実験的事実はもとより,グローバルなモデル化の方向性を与えたという意味で今後の聴覚研究の方向に大きく寄与する研究であり,審査委員会は本論文が博士(心理学)の学位にふさわしいものと判断する.

UTokyo Repositoryリンク