学位論文要旨



No 126525
著者(漢字) 大海,悠太
著者(英字)
著者(カナ) オオガイ,ユウタ
標題(和) ニューラルネットワークを用いた認知実験とシミュレーションによるアクティブパーセプションの構成論的研究
標題(洋) Constructive Research of Active Perception by Cognitive Experiment and Simulation Using Neural Networks
報告番号 126525
報告番号 甲26525
学位授与日 2011.01.12
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第1035号
研究科 総合文化研究科
専攻 広域科学
論文審査委員 主査: 東京大学 教授 池上,高志
 東京大学 教授 開,一夫
 東京大学 教授 植田,一博
 電気通信大学 教授 横井,浩史
 理化学研究所 チームリーダー 谷,淳
内容要旨 要旨を表示する

1 Introduction

生態心理学者E. S. Reedは著書Encountering The World" の中で、生物を機械メタファーによって理解しようとする伝統的な心理学に対して、自律的なエージェンシーの問題を無視していると批判した[2]。そして、生態学からの代案として、生物は環境の中でアフォードされた行動を調整しながら動きまわるという描像を提案した。このような描像を、本論文では生態学的世界観と呼ぶことにする。

その生態学的世界観の生物は、中央処理装置を持っておらず、行動と知覚が密接に関係しあうことで活動する。そのような行動と知覚のカップリングのことをアクティブパーセプションと呼ぶ。アクティブパーセプションは五感全てで見られるが、本論文ではその中からアクティブタッチについて考えていく。アクティブタッチの研究は様々な研究が一括りに扱われているが、その種類は1) 静的な身体の特性、2) 時間的変化のある感覚入力、3) 入出力の関係、4) 高次の認知機能、という4 つに分類、整理できる。この分類の2) 時間的変化、と3) 入出力の関係、というものは力学系の考え方と相性がよい。本研究では力学系で表わされるリカレント型ニューラルネットワーク(RNN)を用いて、行動と知覚が密接に関係しあっているようなシステムを構築する。

生態学的世界観に基づいて生物を理解するためには、その分離不可分な行動と知覚をそのまま構成し、その挙動を観察したり、操作したりしてみることが必要なのではないかと考える。このような、システムを実際に構成してみて、それを操作し挙動を見ることで理解を試みる手法のことを構成論的アプローチという。この構成論的アプローチの分野では、センサーモーターカップリング(SMC)という、センサー入力とモーター出力を結合させたエージェントの研究が盛んに行なわれている。本研究ではSMC の持つこの結合としてRNNを用い、そのRNNを進化させてシステムに適応させ、シミュレーションと心理実験による2 種類のアクティブタッチの研究を行う。

2 Microslip as Simulated Artificial Mind

コーヒーを作ろうとする際などに、コップをちょっと触って触り直す、スプーンをとろうとしてコーヒーパウダーの方に手を動かしてしまう、というように日常の行動の中にも小さなスリップ現象が見られる。これをマイクロスリップという。E. S. Reed らは被験者のコーヒーを作る様子からこの現象を観察し、躊躇、軌道の変化、接触、手の形の変化、という4 つのタイプに分類した。

本章の研究では、このマイクロスリップのコンピュータシミュレーションによるアプローチを提案し、そのモデルを解析する。このモデルでは、エージェントが運動を切り替えながらフィールドの上の2 つのオブジェクトに接近し選択する。エージェントはRNN(図1)によって動作し、そのネットワークは進化的アルゴリズムによって進化されたものである。エージェントの挙動を解析した結果、その運動モジュールの関係はヘテラルキーな構造をしており、その運動選択は複雑なベイスン構造になっていることが分かった。このような結果から、実際のマイクロスリップに関して議論と提案を行なった。

3 Active Touch Feeling Evolved by Interactive Evolutionary Com-putation

近年、触覚ディスプレイの技術の発達により被験者にコンピュータから触覚刺激を与えて実験を行うことが可能になってきた[1]。この触覚ディスプレイを用いた研究では今のところ単純な振動数と振幅の関数のみを用いている。しかし、人間の神経回路は単純な関数の構造ではないため、もっと複雑な関数を用いたダイナミクスを入力として用いる必要があると考える。そこで本章の研究では、内部の関数としてRNNを用いて、手の運動から計算した触覚刺激を触覚ディスプレイを通して人間に与えることによってアクティブタッチの研究を試みる。

実験装置の概略を図2に示す。以下の1~3を1=60 秒毎に行なうことでリアルタイムなアクティブタッチの環境を構築する。

1. 手の甲に付けた3 次元磁気式位置計測システムのセンサーによって、手の速度と加速度を計測しPCに送る。

2. PC 内でRNN(図3)に手の速度と加速度を入力し、100 回RNNを計算させ、そのRNN の出力の平均からICPF 触覚ディスプレイに与える振動の電位を決める。

3. 出力電位をアンプで増幅し、触覚ディスプレイによって指に振動刺激を与える。

人間の皮膚には触覚受容器がいくつかあるが、テクスチャーの認識(振動刺激)に対して、低周波数領域ではマイスナー小体(FA I)、高周波数領域ではパチニ小体(FA II) が対応しているものと考えられている。そこで本章の研究ではこの2 つの受容器を刺激するように、f1(30Hz)とf2(180Hz) の2 つの振動を重ね合わせた電圧を触覚ディスプレイに与える。

また、RNN の重みは対話型進化計算法によって進化的に作り出している。進化は以下の1~4を繰り返すことで行う。

1. 目的となる触感をオノマトペとして被験者に提示し、乱数から作ったRNN の重みに正規分布乱数を足して2 つのRNN の重みを作る。

2. 2 つのRNN の重みについて触感を試し、目的のオノマトペに近い方を選ぶ。触感が確認できたら途中で止めてもよい。

3. 選んだRNN の重みに正規分布乱数を足して少し異なるものを作り、元の重みと合わせて2 つの重みを再提示する。

4. 2に戻るのを繰り返し、目的の触感が得られるまで繰り返す。

このようにして2 種類のオノマトペ(うねうね"、ざらざら") からRNN の重みを作り、二重盲検法によって自分の作った2 種類のRNN の判別と、自分の作ったものと人の作ったものの判別、さらに、自分の作ったRNNについて自分で動かした場合と手の運動をサイン波でエミュレートした場合の判別をさせた。また、ノイズを触覚ディスプレイの出力に加えた時の、ノイズが判別可能かどうかの閾値を測定した。さらに、2 種類のオノマトペを用いた文章を被験者に書かせ、言語学的に解析を試みた。

以上の実験から、触感は単純な振動の組み合わせで構成されてはいないということが示唆された。また、うねうね" の方がざらざら" よりも判別しやすい、ノイズの閾値が低い、作成した文章の中に物の動きや話者の視点の移動を伴うものが多い、という違いが見られた。この違いは、うねうね" の方がざらざら" よりもアクティブパーセプションの度合いが高いということを示していると考えている。

4 General Discussion

この2 種類の研究では、それぞれエージェント(被験者を含む)と環境との間で不安定性が見られ、その不安定性とアクティブパーセプションは関係しているのではないかと言える。マイクロスリップのシミュレーションでは進化させたRNNを数多く計算をすることで、その不安定性を見出したが、触覚ディスプレイを用いた研究での場合、実際の人間にそれほど数多くの試行をさせることはできない。そこで、触覚ディスプレイの研究で進化させたRNNも環境をエミュレートしてコンピュータ上で計算することで、進化させたRNNの不安定性について調べることができるのではないかと考える。

また、そのアクティブパーセプションをエージェントと環境の間にあるインターフェースとして捉えることができる。そのようなインターフェースという考え方を利用して、メディアアート作品を作成することもできる。そのインターフェースは人間とRNNとの間などにあり、相互に関係することで、適応的で、時に予測不可能な関係を構築することができる。さらに、そのメディアアート作品で見られたRNN の応用可能性から、新しいRNN の進化手法を提案する。

参考文献[1] M. Konyo, S. Tadokoro, T. Takamori, and K Oguro. Artificial tactile feel display using soft gel actuators.In roceedings of the 2000 IEEE International Conference on Robotics and Automation, pages 3416{3421, 2000.[2] E. S. Reed. ENCOUNTERING THE WORLD:Toward an Ecological Psychology. Oxford UniversigyPress, Inc., 1996.

図1: 2 章の研究で用いたRNN

図2: 3 章の研究で用いた実験装置の概略

図3: 3 章の研究で用いたRNN

審査要旨 要旨を表示する

本論文は人の能動的な知覚の問題を力学系の問題として定式化し、理論的解析を行なうとともに、実際の実験システムを設計し実験を行ったものである。能動的知覚とは、意図的な身体運動に伴って生じる知覚のことである。それを力学系モデルを用いて表現し、あるいは実際の装置を組み立てることによって、能動的認知を力学系の見地から解析し、あらたな知見を得ている。

本論文は全4章からなる。第1章では、心理学者のJ.J.ギブソン、E.リードらの提案した生態心理学の観点をもとに、能動的知覚をレビューし議論している。これは、運動と知覚を同一視し、知覚主体と知覚対象をひとつのシステムとして見ていこうという、新しい心理学である。申請者は、この生態心理学を力学系の問題としてあらたに定式化するアプローチを紹介している。

第2章では、生態心理学でよく知られている、通常の振る舞いの中に潜む特異性、マイクロスリップを研究対象にしている。マイクロスリップとは、腕を伸ばしてモノを取る際に観察される、躊躇や急激な腕の軌道の変更などである。申請者は力学系を使ってこの振る舞いをモデル化・シミュレーションし、マイクロスリップをベイスン構造の複雑さや、時系列のエントロピーを使って特徴付けることに始めて成功した。またそれらの議論にもとづいてマイクロスリップの力学系的分類を新たに提案している。この成果は、生態心理学の研究者によっても受け入れられ、学会に招待されるなど高い評価を得ている。

第3章では、人工的に触感を生成する装置を考案・設計し、この装置を用いて触感を表すオノマトペとの関係を研究した。装置は指先に高分子ゲルの膜を取り付け、それを機械的に振動させることで触覚をつくり出すもので、この振動パターンを人間の指の運動を入力とする神経回路網で制御し、その回路網を人間が実際に触りながら、ターゲットとする触感を生成するように回路網を育てる、進化的アルゴリズムを考案した。オノマトペに関して、被験者を用いて実際に「うねうね」と「ざらざら」という言葉をきいて触覚をつくってもらい、その触感知覚のノイズに対する安定性や、同一の触覚に対する他の人の作った触覚との区別、などを解析した。この結果、オノマトペを媒介とした言語の身体性との結びつけ、という認知科学の大きな難問のひとつに、装置を用いた実験という具体的な新しい道を拓いた。この触覚に関する生成的アプローチは、認知科学会/言語学会で高く評価され、注目を集めている。

第4章では、全体のまとめと今後の展開が議論されている。特に、能動的知覚の問題と力学系の安定性/不安定性の問題を2と3章の解析を比較し、それをもとにロボットを用い知覚生成の構成論的なアプローチについて議論している。

このように、論文提出者は本論文において、能動的認知を力学系の問題に帰着させて、その安定性の観点から詳細に解析し、また触覚認知に関しては実際にシステムを組み立てて、人を用いた認知実験を行い、実証的に研究していることが評価される。実際の認知実験や測定と密接に関連させられた考察は、すでに生態心理学会をはじめとして評価されているし。また審査委員会もこの手法は、これから能動的な認知を研究していく上で、新しい指針を与えるものとして高く評価できる。したがって、本審査委員会は博士(学術)の学位を授与するにふさわしいものと認定する。

UTokyo Repositoryリンク http://hdl.handle.net/2261/53588