学位論文要旨



No 127657
著者(漢字) 本條,晴一郎
著者(英字)
著者(カナ) ホンジョウ,セイイチロウ
標題(和) 下方倍音知覚の動力学
標題(洋)
報告番号 127657
報告番号 甲27657
学位授与日 2012.02.23
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第1123号
研究科 総合文化研究科
専攻 広域科学
論文審査委員 主査: 東京大学 教授 染田,清彦
 東京大学 教授 国場,敦夫
 東京大学 教授 高塚,和夫
 東京大学 教授 小宮山,進
 東京大学 准教授 加藤,雄介
内容要旨 要旨を表示する

ひとは会話をするとき、あるいは音楽を聴くとき、音の高さを重要な情報として知覚している場合が多い。音高、つまり、ピッチは、空気の振動波形が周波数成分を一つしか含まない正弦波の場合にはその周波数と対応することが知られている。ところが、複数の周波数成分を含む複合音の場合には、周波数成分としては含まれていない低音が下方倍音として聞こえることが聴覚心理学実験から知られている。つまり、複合音の知覚においては、ピッチと周波数の対応関係は自明ではない。本研究は、下方倍音の知覚がいかになされているかを研究の対象とした。

本研究では、まず聴覚心理学実験を整理し、注目すべき問題を二つに分類した。一つは、下方倍音のピッチの値を求めるピッチシフトの問題である。聴覚系に入力される信号に含まれる全ての周波数成分を一定値シフトしたとき、下方倍音のピッチがどれぐらいシフトするかを定量的に求めることが課題となる。もう一つは、下方倍音が聞こえないときの知覚の状態と、聞こえるときの知覚の状態がどのような関係にあるかという問題である。聴覚心理学実験においては、単一の周波数成分しか持たない純音からは下方倍音が知覚されないにも関わらず、ノイズの存在下では純音からも下方倍音が知覚されることが知られている。また、下方外音が知覚されるか否かには、個人差があることが見出されている。こちらの問題では、下方倍音を知覚できない分析モードと、知覚できる合成モードの間で、どのような仕組みで切り替わりが実現されるかが明らかにすべき課題となる。本研究では、以上のような分類をした上で、後者の問題を解明することを目的とした。

ピッチシフトの問題については、数理的な先行研究が存在している。そこで、分析モードと合成モードの切り替わりの問題を考える基盤として、まず、合成モードによって生み出されるピッチシフトの問題がどのように解決されているかを調べた。Cartwright らは聴覚系が高調波成分を持つ自励振動子であると仮定し、その同期現象を考察することにより下方倍音として知覚される周波数を定量的に説明した(J. H. E. Cartwright, D. L. Gonzalezand O. Piro, Phys. Rev. Lett. 82, 538 1999))。本研究では、Cartwright らの扱いが普遍的なものではなく、聴覚系の素子としての性質が個別的に反映していることを見出した。個別性は、自励振動子が周波数ロッキングを起こす際、入力信号を近似的に何次の高調波として捉えるかに表れていた。この個別性への注目により、聴覚系のデフォルト状態は下方倍音が知覚されない分析モードではなく、Cartwright らが扱う合成モードであることが見出された。このことから、分析モードと合成モードの切り替わりを考えるためには、「入力が複合音の場合、なぜ下方倍音が知覚されるか」ではなく、「入力が純音の場合、なぜ下方倍音が知覚されないか」が問われるべき問題であることがわかった。

本研究では、この問題に答えるため、デフォルト状態で合成モードであり、適応によって分析モードを実現するモデルを構築した。

まず、聴覚心理学実験の結果と、Cartwright らの結果を検討することにより、合成モードを表す基本モデルとして、神経細胞の発火を表すFitzHugh-Nagumo モデルがふさわしいことを見出した。なぜなら、合成モードを実現するには、非線形自励振動子である必要があるが、入力の信号がないときには、音が知覚されるべきではないからである。このことから、入力の信号によっては振動系の性質を持つ興奮系が、合成モードを表す基本モデルとして適切であることがわかった。

次に、FitzHugh-Nagumo モデルの神経細胞モデルとしての成り立ちを吟味し直し、FitzHugh-Nagumo モデルの元になっているHodgkin-Huxley 方程式に対してなされた修正を、FitzHugh-Nagumo モデルに取り組んでモデルの拡張を行った。導出したモデルは、

〓(1)

である。変数x、y が興奮系として振る舞い、入力I を受けるとともに非線形性z が低くなる方向に適応する。α、β、γ は定数である。第三式で、dz/dt = 0 を考えると、z は時間スケール で、z = αx + βに緩和することがわかる。モデルは、周期刺激を受けたヤリイカの巨大軸索が、単一の大きなスパイクを発した後は小さなスパイクしか生み出さないという実験事実を踏まえ、同じ性質を満たすように導出された。この結果、モデルでは、ダイナミクスの振幅情報が系そのものの性質を変えるという構造を持つこととなった。

スパイクの大きさが減少するように適応するモデルは、適応することによって高次の周波数ロッキングを実現できなくなることが見出された。このことは、元々合成モードであったFitzHugh-Nagumo モデルが、入力信号を受けることによって、分析モードに適応することに対応する。つまり、導出したモデルは、分析モードと合成モードの切り替えを記述した数理モデルとなっている。

導出した数理モデルの性質を調べるため、適応した状態での非線形性の強さ、つまり、適応の弱さを表すパラメータ~ Z を導入し、α = (1.0- Z)(1.2)、β= Z としてモデルの性質に対するパラメータ依存性を調べた。その結果は、1 の通りであり、適応の速さγよりも、適応の弱さ Z がいかなる値をもつかが重要であることがわかった。

本研究ではさらに、末梢聴覚系の数理モデルを導出した。モデルの導出は、Hudspeth らによって発表された、ウシガエルの有毛細胞から得られた実験データに注目することによって行われた(P. Martin, A. D. Mehta, and A. J. Hudspeth. PNAS, 97, 12026 (2000))。有毛細胞にあるhair bundle が示す力学的特性に注目し、ヌルクラインをデータから推定することによって、

〓(2)

が得られた。ε0、ε1、ε2、a、b、c、g、h、k、l は定数であり、β は逆温度1=(kBT) を表す。

導出されたモデルは、非線形性を3 次の項までに限った場合、拡張したFitzHugh-Nagumo モデルと本質的に一致した。このことから、下方倍音の知覚は、聴覚系の様々な部位で行われている可能性が示唆された。

以上のように、本研究はで、ヌルクラインの形状変化を考えることにより、高次のロッキングが可能である合成モードの振動子が、低次のロッキングのみしか行うことのできない分析モードの振動子に適応して変化するダイナミクスを数理的に示した。このことにより、知覚の文脈依存性や個人差を考えるための新たな数理的枠組みが得ることができた。

本研究においては、生理的機構よりも知覚されるものを念頭において生理学的モデルを構築した。導出されたモデルでは振幅情報が重要な役割を果たしていた。知覚の文脈依存性や個人差を考える上では、動力学の振幅により大きな注目を要する必要があることが示唆される。

導出されたモデルでは、適応の弱さZ が、いかなる値をもつかが重要であった。~ Z が個人によってどのように異なるのか、あるいは、注意付けやノイズの効果によってどのように変化するかについては、未検討のままである。これらの問題については、今後の課題である。

図1: 入力としてI = A+Asin(wt) を加えてwを変化させたとき、ロッキングが実現する最大の次数を表す相図。A = 1.5。

審査要旨 要旨を表示する

本論文で報告されている本條氏の研究は,非線形物理学の観点から下方倍音知覚の機構が説明できることを示す研究で,当該研究分野に重要な貢献をなす研究成果である.

本論文は6章からなり,第1章では下方倍音知覚を中心とした音高知覚研究の歴史の総説,第2章では後の章の議論で必要となる聴覚系の生理学の基礎知識と用語を整理した解説,第3章では先行する数理モデル研究の検討,第4章では新しい数理モデルの提案を導く考察,第5章では本論文の中核となる新しい数理モデルの提案と解析,第6章では前章の成果を類似する問題群の中の別の問題に適用した応用例,第7章では物理学の視点からの聴覚研究の他分野への波及効果に関する著者の見解が示されている.

人間の聴覚は,正弦波のように単一の周波数成分からなる純音に対しては正しく音高を知覚するが,基本周波数は定まってはいるが複数の周波数成分からなる複合音を聴いたとき,音波中には実際には含まれない,基本周波数の1/2,1/3,1/4など整数分の一の周波数の音,すなわち下方倍音が知覚される.

聴覚心理学の分野において下方倍音に関する様々な実験がなされ,純音のみを聴かせる場合,複合音を聴かせる場合,雑音のある環境下で聴かせる場合,など異なる条件下で,下方倍音を感知せずに正しい音程が感知される「分析モード」と下方倍音が感知される「合成モード」が存在することが明らかにされている.また,有理数比でない周波数比を持つ二つの音からなる複合音を聞かせる実験で,要素となっている二つの音の周波数を同量増減させたときに,感知される下方倍音の周波数の増減に対して法則性「ピッチシフト」が存在することが知られている.

Cartwrightらは物理学の観点から,ピッチシフトが力学的共鳴で説明できることを指摘した.聴覚系を非線形自励振動子と考え,二つの入力音と聴覚系自体の固有周波数が3周波数共鳴を起こすとするとピッチシフトが説明できる.しかし,Cartwrightらの研究では,共鳴条件すなわち周波数比が有理数比になるという条件のみに着目し,共鳴現象の動力学に踏み込んだ議論をするには至っていなかった.

本條氏は,共鳴現象と,その一般化である周波数ロッキングの動力学に着目し,聴覚系の応答を模倣する非線形振動子の具体的なモデルを提案した.最初に,下方倍音が感知される合成モードにおいて聴覚系の振舞を模倣するモデルについて考察し,パワースペクトルに多数の高調波を持つ非線形振動子である必要性を指摘した.すなわち,外力に対して,振動子自体の固有自励振動の高調波で周波数ロッキングし,外力の周波数の整数分の一の周波数で振動する状態が下方倍音の感知に対応する.具体的に,Van der Pol方程式に従う非線形振動子で奇数次の下方倍音に対応する周波数ロッキングが見られることを数値実験により示した.そして,Van der Pol方程式に修正を加えることで奇数次だけでなく偶数次の下方倍音にも対応する周波数ロッキングを起こすモデルを考案した.更に,神経細胞の力学モデルとして知られるFitzHugh-Nagumoモデルが,上述の修正されたVan der Pol方程式と数理的に同等の性質を持ち,下方倍音知覚のモデルとして適することを示した.

本條氏は更に,下方倍音を感知する合成モードと感知しない分析モードの二つの状態を表現できるモデルを提案した.この点が本條氏の研究の最も重要な寄与である.FitzHugh-Nagumoモデルの非線形性の強さを表す定数を変数とみなす拡張を行い,これによりパラメータ選択によって高調波での周波数ロッキングを起こしたり消失させたりできることを示した.すなわち,この拡張されたFitzHugh-Nagumoモデルでは,パラメータ値によって下方倍音知覚の合成モードと分析モードの切り替えができる.パラメータ空間のどの領域が合成/分析モードの境界であるかを数値実験によって解析し,追加した変数の振舞により高調波での周波数ロッキングが消失する動力学について考察した.外力の入力により,振動変数の振動が励起されると,振動の非線形性が低減される効果が十分働くような設定で,高調波での周波数ロッキングが消失するという機構が明らかにされた.

上述の拡張されたFitzHugh-Nagumoモデルは聴覚神経系の応答を表現するモデルであるが,聴覚系の有毛細胞の自励振動についても,同様に高調波の周波数ロッキングの有無の切り替え機能を持つ非線形振動子モデルが構築可能であることを示した.

本條氏の研究は,聴覚の物理学という分野で,次のような点で重要な寄与をしたと考えられる.聴覚の研究に物理学が重要な視点を提供し得ることはCartwrightらの周波数共鳴の研究により示されていたが,彼らの研究は共鳴現象の物理に踏み込んでいなかった.本條氏は具体的な非線形振動子のモデルを構築することで,下方倍音知覚のより多くの実験事実が,非線形振動系の振舞と極めて良い平行性を持ち,非線形力学の概念で説明できることを示した.特に,下方倍音知覚の合成モードと分析モードの切り替えを表現する動力学モデルを考案したことは非常に独創的な研究成果である.また,そのモデルが神経細胞のよく知られたモデルの拡張によって得られていることから,本條氏の研究は,実際の細胞内の物理的非線形現象にもとづいて聴覚のメカニズムを解明する研究の戸口を開くことに貢献していると云える.

したがって,本審査委員会は博士(学術)の学位を授与するにふさわしいものと認定する

UTokyo Repositoryリンク