学位論文要旨



No 217776
著者(漢字) 田嶋,達裕
著者(英字)
著者(カナ) タジマ,サトヒロ
標題(和) 視覚における最適モデル推定
標題(洋) Optimal Model Estimation in Vision
報告番号 217776
報告番号 乙17776
学位授与日 2013.02.07
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第17776号
研究科
専攻
論文審査委員 主査: 東京大学 教授 古田,一雄
 東京大学 教授 大澤,幸生
 東京大学 准教授 白山,晋
 東京大学 准教授 鈴木,秀幸
 東京大学 准教授 村上,郁也
内容要旨 要旨を表示する

1.序論

ヒトの脳は,単に物理的な外的刺激を表現する以上のことを行っている.すなわち,刺激に埋め込まれた統計的構造を抽出し,その生成過程を推定し,将来の環境を予測することができる.ヒトをはじめとする動物にとって主要な感覚処理のひとつである視覚は,端的には網膜の神経応答に基づいて,上記のような複雑な外界の情報を解読する過程である.これまでに多くの先行研究によって,視知覚あるいは視覚系の神経応答が,刺激の物理的特徴と関係づけられてきた.しかしながら,前述した高度な推定問題を含む視覚処理がどのような計算原理に基づいて行われているのかは,いまだに明らかでない部分が多い.本論文では,視覚処理の中心的な問題を,経験ベイズ推定におけるモデル選択としてとらえることで,様々な心理物理学的および生理学的な現象を統一的に解釈するための理論的枠組みを構築した.

統計モデルの推定/選択は,確率的情報処理の核心を成す問題である.視覚情報は,3次元環境で様々な反射,屈折過程を経た光が網膜の神経細胞の反応を引き起ことで,2次元の網膜像として与えられる.視覚処理は,限られた視覚神経応答の観測データから複雑な外界の状態を推定することであり,一般的に不良設定問題である.こうした不良設定問題を扱う上で有効な方法は,自然界の統計的特徴に基づいた事前知識を制約として取り入れることである.自然画像は人工的なノイズ刺激と異なり,様々な点で統計的な規則性を有している.この規則を記述するものを,本論文では「統計モデル」あるいは単に「モデル」と呼ぶ.統計モデルの具体的内容としては,刺激のテクスチャ,カテゴリ,光学過程等,様々なものが含まれ得る.統計的推定においては,使用される統計モデルの精度は本質的な問題である.過去に多くの研究が,統計モデルに基づいた視覚情報処理の有用性を示してきたが,一方で,「統計モデル自体を神経システムがどのように推定/獲得し得るか」という問題については,あまり深く議論されてこなかった.本論文ではこの問題に焦点を当てた.

2. 統計モデルの神経符号化

まず理論的な立場から,神経系における知覚形成のモデルを提案した.ここでは,2種類の典型的な神経回路モデル,すなわち均一/不均一な受容野特性を持った神経細胞集団のそれぞれについて,定式化と理論的解析を行った.

網膜や低次視覚野のように,同じような受容野構造を持った神経細胞の配列による刺激の表現を,ここでは「均一な」神経集団符号と呼ぶ.均一な集団符号の解読は,工学分野における画像修復問題の拡張としての「画像再構成」と解釈できる.ベイズ推定は,画像のノイズ除去において集中的に研究されてきた方法のひとつであり,自然画像における「滑らかさ」などの統計的性質を事前知識として導入することで,確率的観測過程に伴う不良設定性を解決できる.これはベイズの定理の形で次のように表現される:

P(s|r,θ)=P(r|s)P(s|θ)/P(r|θ)

ここで,sは刺激,rは神経応答,θは刺激の統計モデルを決定するパラメータである(図 1).例えば,自然画像の周波数空間での振幅スペクトルは冪則に従う事が知られており(図 2),その指数がテクスチャなど画像特徴を反映することが分かっている.これを反映した統計モデルを事前分布P(s|θ)とする.一方,P(r|s)は,この場合神経細胞の受容野と応答ノイズのモデルを与える.

経験ベイズの枠組ではθを観測データrから推定する.その一つの方法は,P(r|θ)を最大化するようなθを選択することである.工学的な画像修復では,θを単なる制約条件として捉え,刺激sの推定精度に重点が置かれてきた.一方,生物の視覚処理においては,刺激そのものよりも,その統計モデルθの推定を通してテクスチャ等

の高次情報を得る事のほうが重要と考えられる.そこで,本論文ではモデルの推定に焦点を当て,神経集団符号から刺激統計量を推定するアルゴリズムを導くとともに,その性能を確認した(図 3).また,統計量の推定という目的に対して,どのような神経受容野が最も高い性能を示すかを,刺激統計量に関するフィッシャー情報量を用いて定量化した.この結果,最適受容野サイズの刺激依存性が理論的に導かれた(図 4).

さらに,不均一な神経集団においても,刺激および神経受容野,神経ノイズのモデルに基づいて,統計量が推定できることを示した(図 5左).画像統計量の例として,冪則に従う振幅スペクトルの指数を考え,この画像統計量に対する低次視覚野の神経応答特性を予測した(図 5右).また,ここでも統計量の推定精度をフィッシャー情報量により定量化し,行動学的な刺激弁別の精度に用いられるd'および弁別閾との関係を導いた.

3.実際の脳におけるモデルの符号化と復号化

次に,実証的な立場から理論を検証した.まず,刺激符号化の側面からの検証として,機能的核磁気共鳴画像(fMRI)による生理学的実験を行った.理論的解析からは,刺激の強度が小さい場合には,加算領域の大きな受容野を用いる事が,統計量および刺激の復号化精度を高める上で有利であることが示された.しかし,こうした受容野の変化を実際のヒトの脳で直接検証した例は過去に報告されていない.そこで,中心刺激を高/低2通りのコントラストに設定して周辺効果の特性を検証した.

その際,応答変化の検出感度を高めるため,刺激呈示中に周辺コントラストを長周期のサイン波形に従って連続的に変化させる新たな手法を開発した.一般に,刺激が低いコントラストで呈示された場合,得られる賦活は高コントラストのときに比べて小さくなるが,特定の周波数成分に注目することで,視覚刺激に由来する応答を抽出できる.さらに,刺激コントラストを連続的に変化させることにより,単一の実験で様々な周辺コントラスト条件での応答を記録できる点で効率的な方法である.

実験の結果,ヒトの第一次視覚野において,中心コントラストに依存して促進的/抑制的な相反する2種類の周辺効果を,初めてヒトの脳において検出した.中心が高コントラストの条件下では周辺効果は抑制的であるのに対し,中心が低コントラストの条件下では,同じ位置に呈示された周辺刺激が促進的な性質を持つことが示された(図 6).これは提案理論から予測される最適受容野の変化と定性的に矛盾しない.また,この特性の変化はイメージングにおけるボクセル毎のばらつきを考慮しても有意であることから,集団的に共有された傾向ある事も示された(図 7).

一方,刺激の復号化の側面からの検証として,視覚刺激における統計的パラメータの知覚について,理論による予測を,先行研究で報告されている心理物理学的データと比較した.このとき、前章で行った定式化に基づいて,非一様な周波数選択性曲線を持つ細胞集団に関する画像統計量の復号化精度を理論的に導き,フィッシャー情報量を通して行動データとの関係を予測した.その結果,選好周波数についての細胞数分布を変化させることで,統計量の弁別精度の振る舞いに定性的な差異が生じることを明らかにした.これは報告されている中心視・傍中心視での心理物理実験データをよく説明できる(図 8).この事は,従来説明されていなかった複雑な知覚特性が,本論文で提案する「刺激に関する最適な統計的モデル推定」の観点から自然に理解される例となっている.

さらに,実験で報告された弁別閾の特性から,逆に細胞数分布を推定することができる.この推定結果は,霊長類の生理実験により報告されている細胞分布の視野依存的特徴とも整合する結果となった(図 9).これらの結果から,実際にヒトが自然画像統計量を認識する際,ここで仮定したような 空間周波数選択的細胞の集団応答に基づいた推定を行っている可能性が示唆される.

4.モデル推定の動態

以上までの理論は,モデル自体の時間的変化を考慮したモデル推定問題(動的推定)に拡張できる.動的推定の第1のケースとして,統計モデル自体が時間的に変化する場合を考える.第2のケースとして,経験に基づいて観測モデルを学習により獲得する場合を考える.

統計モデルが時間的に変化する観測系は,隠れマルコフ過程(図 10)として記述できる.前章までの議論では,モデルθ自体に対する事前知識P(θ)として,無情報事前分布を仮定してきた.一方,時間的な連続性がある場合,時刻tにおける事前知識は,過去の観測D t-1≡{rt-1,rt-2,…}に基づき,P(θt| D t-1)として与えられる.

時間的に変化するモデル推定の例として,カテゴリカルな知覚を考える.色覚や顔認知など,様々な知覚処理において,カテゴリが弁別や記憶などに影響することが知られている.本研究では,カテゴリを統計モデルの隠れたパラメータとみなし,隠れマルコフ過程に基づく推

定問題として,推定アルゴリズムとその近似としての神経回路モデルを提案した(図 11).その結果,カテゴリカルな影響下での知覚バイアス,記憶の時間的特性,神経表現のタスク依存性といった様々な現象が,統一的な理論的枠組みから理解できることを示した(図 12).

最後に,経験に基づく観測モデルの獲得の問題を扱った.特に,生後発達における視覚刺激の複雑な生成モデル獲得について考察した.特に,現実の視環境では,非線形で複雑な光学過程の学習が必要となる.これは,第1段階に単純な刺激を学習した後に,第2段階でその観測モデルを学習する,という方略により効率よく学習できる(図 13).これは,従来提案されてきた,線形なカルマンフィルタによる隠れマルコフ過程の推定モデルを,非線形な設定に拡張したものになっている.

非線形光学の例として,このモデルを遮蔽環境下での観測モデルの獲得と物体認識に適用し,神経回路網による実装を行った(図 14).これまで,高度な処理機能を獲得する際の乳児視覚の段階的発達に関して理論的モデルがほとんど提供されてこなかった.本論文では,視覚処理における後天的学習を「刺激の観測モデルに関する段階的な推定過程」ととらえることにより,視覚発達過程の計算論的解釈を与えた.

5.結論

視覚処理の問題を経験ベイズ推定におけるモデル選択の視点から再解釈することで,広範な心理物理学的および生理学的現象を統一的な理論的枠組みの中で説明した.また,これまで十分な理論的説明が与えられてこなかったいくつかの現象について,新たなモデルによる解釈を与えた.本論文の理論的,技術的成果は,視覚およびその他の感覚処理を理解する上で有用な視点を与えるだろう.

図 1 刺激の観測過程

図 2 自然画像を表現する統計モデルの例

図 3 統計量の経験ベイズ推定

図 4 統計量と最適な受容野サイズ

図 5 不均一な神経集団による統計量の表現

図 6 刺激統計量に依存した神経符号機構の解明

図 7 受容野の刺激依存性の集団的特性

図 8 集団符号からのモデル推定と行動データの比較

図 9行動データから予測される神経集団の分布特性

図 10時間的変化を伴うモデル下での観測過程

図 11 動的モデル推定によるカテゴリカル知覚

図 12 カテゴリカルな記憶におけるバイアスの再現

図 13 適応的な観測モデルの推定

図 14 観測モデルの経験的獲得

審査要旨 要旨を表示する

視覚は、ヒトをはじめとする動物にとって主要な感覚処理のひとつである。しかし、高度な視覚処理がどのような計算原理に基づいて行われているのかはいまだに明らかでない部分が多い。本研究では、脳の視覚処理に関する新しい汎用的なモデルが提案されている。

1章は序論であり、研究の目的および背景となる基礎的知見について概説されている。1.1節対象とする問題、関連研究について述べ、統計的推測におけるモデル推定の視点から視覚機能を解釈することで、様々な心理物理学的および生理学的現象を統一的に説明する理論的枠組みを構築することが、本論文の目的であるとしている。 1.2節では、本研究の基礎となる数理統計学的および神経生理学的な背景について解説している。数理統計学的基礎として、古典的ベイズ推定およびその拡張である経験ベイズ推定の枠組みについて解説する。神経生理学的基礎として、脊椎動物の視覚神経系とその構成単位としての神経細胞の挙動に関して解説されている。

2章では、理論的な立場から、神経系における知覚形成のモデルが提案されている。知覚を「外部刺激に関する統計的モデル推定の結果」と解釈し、神経系の生理学的特性と知覚現象の関係が導かれている。具体例として、2種類の代表的な神経ネットワーク、すなわち一様な特性を持った神経細胞集団および非一様な特性の神経細胞集団について、モデル化とその特性の理論的解析の結果が示されている。

3章では、実証的な立場から理論的予測の検証が行われている。 3.1節では、生理学的な側面からの検証として、著者らが行った神経イメージングによる実験結果を紹介され、これを提案理論から予測される神経特性と比較している。この実験では新たに考案された計測手法を用いて、ヒトの初期視覚野における刺激コントラスト依存的な符号化特性を明らかにし、実験結果は理論的に予測される最適なモデル推定のための神経符号化特性と矛盾しないことが示されている。 3.2節では、心理物理学的な側面から理論の検証として、視覚刺激における統計的パラメータの知覚について、先行研究で報告されている心理物理学的データを理論による予測と比較している。本理論の予測は実験データと矛盾しないだけでなく、従来研究では説明されていなかった複雑な知覚特性が、本論文の理論的立場から自然に理解されることを示している。これらの検証結果は、提案理論の妥当性を支持すると同時に様々な生理学的、心理物理学的現象を理解する上での本理論の有効性を裏付けている。

4章では、モデル推定の動態に関して解析と検証が行われている。4.1節では、動的推定の第1の例として、視覚における時間的に変化する視覚的カテゴリの推定に理論を適用している。この結果、カテゴリカル知覚に関して従来別々に報告されてきた、記憶の時間的変化、ヒステリシス、知覚的バイアス、神経表現におけるタスク依存性といった様々な現象を、統一的な理論的枠組みから理解できることを示している。4.2節では、動的推定の第2の例として、視覚的モデルの学習による獲得を扱っている。特に、生後発達における視覚刺激の複雑な生成モデル獲得について考察されている。視覚処理における後天的学習を「刺激の観測モデルに関する段階的な推定過程」と解釈することで、これまで理論的モデルがほとんど提供されてこなかった、高度な知覚的処理機能を獲得するまでの乳児視覚の段階的発達について、計算論的な解釈を与えることに成功している。

5章では、本論文の内容を総括し、視覚およびその他の知覚研究の文脈における提案理論の意義について述べられている。

以上の内容は、ヒトの視覚認知機構を理解する上での重要な知見であると考えられ、学位請求論文の研究として十分な内容を有していると判断する。

よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク