学位論文要旨



No 214805
著者(漢字) 大山,英明
著者(英字)
著者(カナ) オウヤマ,エイメイ
標題(和) 人間の視覚フィードバック制御における座標変換学習モデルに関する研究
標題(洋)
報告番号 214805
報告番号 乙14805
学位授与日 2000.09.21
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第14805号
研究科 工学系研究科
専攻 計数工学専攻
論文審査委員 主査: 東京大学 教授 舘,すすむ
 東京大学 教授 安藤,繁
 東京大学 教授 石川,正俊
 東京大学 教授 合原,一幸
 東京大学 助教授 新,誠一
内容要旨 要旨を表示する

 図1のように人間が手をのばして物をつかむ運動を考える.物体をつかむためには,視覚座標系で表された物体の位置を,筋肉への運動指令に変換しなければならない.このような座標変換は逆運動学問題と呼ばれている.人間は神経系に逆運動学解法システムを形成している.

 このような逆運動学解法システムは,先天的に形成される固定的なものであろうか?多くの小児整形外科医が,幼児の視覚に基づく運動における大きな適応能力を認めている.親指のない幼児のために,人差し指を親指の位置に付け替えるような運動学的に大きな変化を伴う形成手術を行っても,幼児は人差し指をまるで親指のように使うことができるようになる(Ogino,1997,Hand Surgery).人間の柔軟な手先位置.姿勢制御における適応能力を説明するためには,逆運動学解法システムの学習機能が不可欠である.

 学習型逆運動学解法システムのモデルとして,最も広く用いられているモデルは,上肢の逆運動学モデルを神経回路によって学習し,それを制御に用いる手法である.代表的な逆モデル学習法として,直接逆モデリング,順逆モデリング(Jordan,1992,Cognitive Science),フィードバック誤差学習則(Kawwto,1987,Biological Cybernetics)の三つが知られている,しかし上肢の逆運動学関数は不連続関数である.単純な多層神経回路によって不連続な逆運動学関数を学習することは容易では無い.

 人間の神経系は逆運動学モデルを構築していると考えられるが,手先位置誤差を運動指令に変換し,逐次的に逆運動学解を計算するシステムが,逆運動学解法の基本になっている可能性が高い.特に手先位置誤差を運動指令に座標変換するフィードバック制御器の学習が重要である.このような座標変換回路は,直接逆モデリングや順逆モデリングによって学習可能である.しかし,これらの学習モデルには様々な弱点がある.直接逆モデリングは,神経回路への入力信号を複雑に切り替える必要がある.またオンライン学習が難しいという難点がある.順逆モデリングではバックプロパゲーション信号が本質的な役割を果たすが,現時点では,神経系でバックプロパゲーション学習が行われている可能性は低いとする立場が支配的である.さらに,順逆モデリングでは順モデルを構成する神経回路への教師信号の複雑な切り替えが必要である、このような信号の切り替え機構をモデル化できない限り,直接逆モデリングや順逆モデリングは生体モデルとして不完全であるといえる.

 本論文の第一の目標は,生物学的により「もっともらしい」フィードバック制御器の座標変換学習モデルを提案することである.θ∈Rmを関節角ベクトル,x∈Rnを手先位置・姿勢ベクトル,両者の関係をx=f(θ)とする.f(θ)のヤコビ行列J(θ)∈Rn×mをJ(θ)=∂f(θ)/∂θとする.図3に示すような,手先目標位置xd(k)(k=1,2,...,T)の変化量Δxd(k)=xd(k+1)-xd(k)を関節角空間に変換するフィードフォワード項Φff(θ(k),Δxd(k))と,位置誤差e(k)=xd(k)-x(k)を関節角空間に変換するフィードバック項Φfb(θ(k),e(k))から構成される次のような制御系を考える.

ここでd(k)∈Rmは手先位置制御系以外から加えられる外乱ノイズである.Φ'ff(θ,Δxd)とΦ'fb(θ,e)を,それぞれフィートフォワード制御器とフィードバック制御器のための教師信号とする.フィードフォワード制御器は,川人らが提案したフィードバック誤差学習則(Kawato,1987)を基にした次のような教師信号により学習されるものとする.

λはフィードフォワード制御器が過大な値を出力しないようにするための微少な正の実数である.λが微小であるとすると,学習によって最終的にJ(θ)Φff(θ,Δxd)〓Δxd、を満たすような座標変換回路を獲得できる.問題となるのはフィードバック制御器の学習である.

 フィードバック制御器の役割の一つに,制御系の予測できない外乱信号を補償することがある.フィードバック制御器の出力が,1時刻前に入力された外乱ノイズを打ち消すように学習は行われるべきであるから,次のような教師信号を利用して,フィードバック制御器の学習が可能である.

しかし,外乱ノイズd(k)が存在しない場合フィードバック制御器の出力が0に近づくという弱点があった.そこで,現在のフィードバック制御器の出力は過去のフィードバック制御器の出力のための教師信号として利用できることに着目し,外乱ノイズとフィードバック誤差信号を利用する次のような学習モデルを構築した.

右辺第1項は外乱ノイズ由来の項であり,第2項はフイードバック誤差信号由来の項である.第3項は学習の安定化のための項である.外乱ノイズ`こよって,フィードバック制御器の初期状態をある程度正確なものとし,その後はフィードバック制御器の出力により,自らの出力を改善できるという望ましい特性を持っている.図4に学習の概念図を示す.dが0で無い場合には,フィードバック制御器の学習結果は次の通りである.

J+(θ)はヤコビ行列J(θ)の疑似逆行列(Moore-Penroseの一般化逆行列)である.

 式(5)とは別に,著者らは,手先位置誤差の二乗和をスカラーの評価関数とし,その増減の情報を罰/報酬とする一種の強化学習によってフィードバック制御器の座標変換を学習する学習モデルを考案した.手先位置誤差e(κ)=xd-x(k)の二乗和の減少量〓と関節角ベクトルの変化量Δθ(k)との積をフィードバック制御器の教師信号とする学習モデルを提案する.図5に示すように,αを十分小さい正の実数として,

という教師信号を用いると,αが十分小さい場合,次式のようなフィードバック制御器を学習できる.

このように,フィードバック制御器は手先位置誤差の二乗和関数の最急降下方向を近似的に学習でき,座標変換が可能である.提案したモデルは,関節角ベクトルの変化量と評価関数の時間変化信号との積を必要とするが,このような機構が神経系に存在するかどうかは不明である.しかし,例えば,川人の座標変換ゲイン学習モデル(Kawato,1990,ATR-Tech. Report)等のモデルに比べれば,構造上の複雑さは小さい.

 図6に外乱ノイズとフィードバック誤差信号を利用した学習モデルによって学習を行った制御系による追従制御の一例を示す.現時点において提案した学習モデルが神経系に存在しているという実験的証拠は得られていないが,フィードバック制御器への入力信号や教師信号の切り替えを行うことなく,フィードバック制御器の座標変換の学習が可能であることを計算論的に確認できた.

 本論文の第二の目標は,不連続な逆運動学関数を正確に近似できるモジュラー型の神経回路を用いた逆運動学解法システムを提案することである.上肢の逆運動学モデルは一般に不連続関数であるが,複数の連続関数を組み合わせることによって構成できる.図7に提案する逆運動学解法システムの概念図を示す.各エキスパートは逆運動学関数の連続部分を近似する.またエキスパート選択器は,手先の目標位置・姿勢に応じて,適切なエキスパートを選択できるように学習を行う.各エキスパートは不連続関数を近似する必要がなくなり,全体として高精度の逆運動学関数の近似が可能である.全てのエキスパートの出力を利用しても適切な逆運動学解が得られなかった場合,拡張型のフィードバック制御器は大域的探索手法を用いて,正確な逆運動学解を得る.その解を利用してエキスパート生成器は新しいエキスパートを生成する.このようなモジュラー型神経回路システムによって,図8に示すように,従来法では困難であった逆運動学関数の正確な学習が可能となる.

 本論文では,従来の座標変換学習モデルの問題点を明らかにし,複雑な信号の切り替えを行うことなく視覚座標系から運動指令への座標変換を学習できる学習モデルを提案した.また,不連続な逆運動学関数を正確に学習できるモジュラー型神経回路システムを提案した.学習の高速化や,学習モデルの精密化,軌道計画を含めた総合的な運動制御の学習モデルの構築,人間の学習モデル同定のための新たな心理物理実験の考案は,今後の課題である.

図1: 逆運動学問題の概念図

図2: 運動学的に大きな変化を伴う形成手術(文献(Ogino,1997)より著者の許可を得て転載.)

図3: フィードフォワード制御器とフィードバック制御器から成る複合制御系の構成

図4: 外乱ノイズとフィードバック誤差信号によるフィードバック制御器の学習

図5: 手先位置誤差の変化量に基づくフィードバック制御器の学習

図6: 学習された制御系による追従制御

図7: モジュフー型神経回路による逆運動学解析システム

図8: 学習した逆運動学モデルの誤差

審査要旨 要旨を表示する

 本論文は「人間の視覚フィードバック制御における座標変換学習モデルに関する研究」と題し、6章からなる。人間の柔軟な手先位置・姿勢制御における適応能力を説明するためには、逆運動学の学習能力が不可欠である。本論文は、従来の人間上肢逆運動学の学習モデルのもつ問題点を明らかにし、上肢運動制御系の座標変換学習の計算論的な研究を進め、従来の学習モデルの弱点を回避した新たな逆運動学学習モデルを提案し、その有効性を実証したものである。

 第1章は序論で、ニューロコンピュータをはじめとする人間の機能の持つ情報処理方式に基づいて情報処理システムを構築することが人間の解明のみならず、将来的には工学的見地からも重要であり、そのためには運動学習機構の解明が緊要であることを主張して、本論文の具体的な目標が、上肢の逆運動学の学習に関する従来研究の問題点を明らかにし、それを回避した新しい学習モデルを提案することであることを述べ、本研究の目的と立場と意義を明らかにしている。

 第2章は、「人間の上肢逆運動学問題解法システムの学習モデルと問題点」と題し、人間の上肢の逆運動学学習モデルについて、従来研究の問題点を明らかにしている。逆運動学の学習モデルとして、直接逆モデリング、Jordanによって提案された順逆モデリング、川人によって提案されたフィードバック誤差学習則の三つが良く知られている。しかし、直接逆モデリングは、学習のために神経回路への入力信号を複雑に切り替える必要があり、オンライン学習が難しいという難点がある。一方、順逆モデリングではバックプロパゲーションを前提とし、かつ順モデルを構成する神経回路への教師信号の複雑な切り替えが必要である。このような学習のための特別な信号の切り替え機構が実際の生体にあることは現在の生理学的な知見に反しているため、直接逆モデリングや順逆モデリングは生体モデルとしては不適切であるといえる。そのような問題点を解決するため、本論文での第一の目標として、川人の座標変換ゲイン学習モデルの考え方を発展させ、それの持つ教師信号の複雑さや学習型制御器に特別な構造が必要であるといった弱点を解決し、現在得られている生物学的知見から存在が確認されている機構のみを用いて、存在の不確かなバックプロパゲーションや切り替え機構を前提としない、所謂“もっともらしい”フィードバック制御器の座標変換学習モデルを提案することであるとしている。

 第3章は「視覚フィードバック制御器の座標変換学習モデル」と題し、生体モデルとして“もっともらしい”視覚フィードバック制御器の学習モデルを提案し、数値実験による評価を行っている。その中で、現時点において構造的にも機能的にも生物学的に問題がないモデルとして以下の二つを提案している。第一の学習モデルは、外乱ノイズとフィードバック制御器の線形結合を利用するものである。過去に加えられた外乱ノイズは位置誤差と負の相関があり、また、フィードバック制御器の現在の出力を過去の出力の教師信号として利用できることから、過去の外乱ノイズとフィードバック制御器の出力の線形結合によって、フィードバック制御器の教師信号を構成できる。それにより、フィードバック制御器は上肢のヤコビ行列の疑似逆行列(Moore-Penroseの一般化逆行列)を学習できる。第二の学習モデルは、手先位置誤差の二乗和をスカラーの評価関数とし、その増減の情報を罰/報酬とする一種の強化学習によってフィードバック制御器の座標変換を学習するものである。関節角ベクトルの変化量と評価関数の時間変化信号との積を利用した教師信号により、制御器は手先位置誤差の二乗和関数の最急降下方向に正定対称行列を乗じた方向を学習できる。これらの提案した学習モデルは、フィードバック制御器への入力信号を切り替えたり、順運動学モデルヘの教師信号を切り替えたりといった、複雑な信号の切り替えを必要とせず局所的な座標変換を学習でき、しかも有効であることを数値実験で明らかにしている。

 第4章は「時間遅れを考慮した視覚フィードバック制御器の学習モデル」と題し、観測時間遅れを考慮して学習モデルを修正した方式を提案している。すなわち、フィードバック制御器の座標変換ゲインの学習モデルについて、人間の視覚に基づく運動制御に必然的に付随する0.1から0.4秒程度の観測時間遅れをも考慮した修正法を提案」生体に存在が認められている範囲の操作でありながら学習が可能であることを数値実験で示し、その有効性を検証している。

 第5章は「モジュラー型神経回路による逆運動学モデル学習」と題し、本論文の第二の目標である不導続な逆運動学関数を正確に近似できる神経回路システムの提案である。すなわち、上肢の逆運動学モデルは一般に不連続関数であるが、その不連続な逆運動学関数を、モジュラー構造を持った神経回路を用い正確に近似する手法を提案し、数値実験によりその動作を確認している。提案した逆運動学モデルは複数のエキスパートによって構成されている。各エキスパートは神経回路によって構成され、逆運動学関数の連続部分を近似する。エキスパートは、手先の目標位置・姿勢に応じて適切に選択される。各エキスパートは不連続関数を近似する必要がなくなり、全体として高精度の逆運動学関数の近似が可能となる。また全てのエキスパートの出力を利用しても適切な逆運動学解が得られなかった場合には、大域的探索手法を用いて、正確な逆運動学解を得ることができ、その解を利用してエキスパート生成器は新しいエキスパートを生成する。このようなモジュラー型神経回路システムを提案するとともに、従来の学習モデルでは困難であった逆運動学関数の正確な学習が可能となることをシミュレーションで示している。

 第6章は結論で、本論文をまとめ、今後を展望している。

 以上これを要するに、本論文では、現在までに提案されていた従来の学習モデルが有する問題点である、バックプロパゲーション、フィードバック制御器への入力信号の切り替え、順運動学モデルヘの教師信号の切り替えといった実際の神経系で用いられる可能性の少ない方式を用いず、視覚座標系から運動指令への座標変換を有効に学習可能な学習モデルが存在することを構成的に示しており、計算論的神経科学の発展に寄与するところが大である。また、従来モデルでは困難な不連続性に対応し逆運動学関数の正確な近似を実現したモジュラー構造を持つ神経回路と大域的な探索機能を導入した逆モデル学習法とを提案し、従来法では困難であった上肢逆運動学の学習に成功しており、神経工学の発展に寄与できると考えられ、計測工学及び神経工学に貢献するところが大である。

 よって、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク