学位論文要旨



No 114888
著者(漢字) 益岡,竜介
著者(英字)
著者(カナ) マスオカ,リュウスケ
標題(和) 微分情報を学習するニューラルネットワーク
標題(洋) Neural Networks Learning Differential Data
報告番号 114888
報告番号 甲14888
学位授与日 2000.03.17
学位種別 課程博士
学位種類 博士(数理科学)
学位記番号 博数理第130号
研究科 数理科学研究科
専攻
論文審査委員 主査: 東京大学 教授 山田,道夫
 東京大学 教授 薩摩,順吉
 東京大学 教授 時弘,哲治
 東京大学 助教授 一井,信吾
 東京大学 助教授 石岡,圭一
 東京農工大学 教授 大森,隆司
内容要旨

 学習するシステムは将来人類にとって大きな影響を与えるであろう。学習するシステムは、いかに行動するのかを指示しなくとも、なにをすればいいのかを示すだけで必要な作業を実行できるようになっていく。

 我々は「学習するシステム」を、特定の状況における次の行動をその状況を経験したことがなくとも以前の経験あるいは適切な行動の例示に基づいて適切に決定できるシステムと定義する。

 指示どおりにしか動かないシステムと(たとえ学習が一部であったとしても)学習するシステムは全く別の存在である。将来的に、プログラム言語、スクリプト言語、GUI(Graphical User Interface)、音声インタフェースなどシステムに指示を与える手段は非常に高機能になることが予測される。しかしそれらの手段がいかに高機能になろうとも、システムに学習機能がなければ、我々はシステムが遭遇する各状況でいかに行動するのかを指示しつづける必要がある。そのためには手間だけではなく、目的にとって本質的ではないシステムがどのように動くかについての理解も必要となり、システムを使うものにとって負担となる。

 一方、学習するシステムに対しては、なにをすればいいのかを示すだけでよい。学習システムはそれにより自分自身を適応させ、設定し、あるいはプログラムしなおす。これはシステムやシステムが対象とするものが複雑である、巨大である、あるいは非常に早く変化していて、人間がその全体を把握できないような場合に特に有効である。例えば、現在そのような対象の一つとしてインターネットがある。インターネットは人間の把握できる能力を超えており、今後インターネットを有効に使うためには学習するシステムが必要不可欠になっていく。

 そのような対象を扱う学習システムは人々をシステムのプログラミングや、調整や、設定などの複雑かつ退屈な作業から開放する。また学習によって、学習システムが徐々により抽象的になる目的の指定に対処することも可能になっていくであろう。

 学習するシステムには、学習アルゴリズムが必要である。学習アルゴリズムやその枠組にはクラスタリング、強化学習、論理ベースのシステム、ニューラルネットワーク、ファジーシステム、遺伝学習アルゴリズムなどがある。

 学習アルゴリズムの一つの分け方は、教師つき学習/教師なし学習によるものである。「教師つき学習」とは与えられた例から学習する学習アルゴリズムの分類である。そういった「教師つき学習」にとって、与えられる例とともに論理表現、確率分布、あるいは微分に関する制約などの形で与えられる知識を学習に活用できることは、効率が高くより正確な学習に不可欠である。

 そのような「教師つき学習」での例と共に知識を学習に活用する枠組として、微分情報を学習するニューラルネットワークがある。微分に関する制約を学習するニューラルネットワークはすでに、パターン認識や微分方程式に適用されており、ロボティックスなどその他の分野への適用も提案されている。

 本研究では学習するシステムとしての微分情報を学習するニューラルネットワークに対して、微分に関する制約をニューラルネットワークの学習に導入するための枠組を拡張し、より一般的な枠組を研究した。またその枠組を実際のアプリケーションに適用するために基本となる事項を研究した。

 まず多層パーセプトロンが微分情報を学習するための非常に汎用的な新しいネットワークアーキテクチャとアルゴリズムを提案した。アルゴリズムは一階も含めて二階以上の微分情報にも適用可能であり、通常のバックプロパゲーションと同様に各ユニットに対して完全に局所的な形で記述されている。

 次にそのアーキテクチャとアルゴリズムをコンピュータプログラムとしてインプリメントした。このプログラミングは高いプログラミング技術と細心の注意を要した。コアとなる部分はC++でプログラムされている。さらにこの実装を用いて、微分情報を学習するニューラルネットワークに関する各種実験を行なった。その中で実際に三階までの微分情報に関して収束することを示した。

 また微分情報を学習するニューラルネットワークについて、より多くデータを与えた場合との比較、学習の機構、必要な学習データ量の評価、スケーラビリティ、ノイズ耐性などに関する解析を行なった。

 微分情報を学習するニューラルネットワークの新しい応用として、強化学習における連続行動出力の問題を扱い、その枠組と実装を使った実験結果を記述した。この問題は与えられた確率分布を実現する乱数発生器を実現することであり、具体的には一階の微分方程式を解くことに相当する。二つの確率分布に適用し、与えられた確率分布を近似することを確認した。

 他にも、実際には実験などは行なわなかったが、微分情報を学習するニューラルネットワークの応用として、微分方程式と人間の腕の軌道のシミュレーションへの応用について提案した。前者の微分方程式については微分方程式、境界条件、その他の制約条件を包括するような非常に一般的な枠組を提案した。後者のシミュレーションでは、最小トルク変化モデルのニューラルネットワークによる自然な実装を提案した。

 最後にRadial Basis Fucntion(RBF)ネットワークに関する高階への拡張に関する結果を与えた。微分エラー項を持った場合の極小解の形やそれらのbest approximation property、RBFネットワークのCl稠密性の別証明を与えた。

 以上本研究で得られた成果は、次のように要約することができる。

 1.微分情報を学習するニューラルネットワークのアーキテクチャとアルゴリズム

 2.項目1のコンピュータプログラムによるインプリメンテーション

 3.項目2のインプリメンテーションを使った実験

 4.微分情報を学習するニューラルネットワークに関する各種解析

 5.項目1の強化学習における問題への応用と項目2を使った実験

 6.Radial Basis Function(RBF)の高階微分の場合への拡張

 本研究のアーキテクチャ、アルゴリズム、実装、実験、解析、アプリケーションの詳しい記述により、本研究は学習するシステムとしての、微分情報を学習するニューラルネットワークを実際の問題に適用していく際の基礎を築いた。これにより、微分情報を学習するニューラルネットワークの更なる適用が促進されるであろう。

審査要旨

 「学習するシステム」とは、特定の状況における次の行動をその状況を経験したことがなくとも、以前の経験や適切な行動の例示に基づいて適切に決定できるシステムを言う。このようなシステムには、与えられた例から学習するアルゴリズム(教師つき学習)を持つ一群があり、その代表的な枠組として「ニューラルネットワーク」が知られている。実質的には、ニューラルネットワークは関数を近似する枠組であり、学習とは、関数を特徴づけるデータを与えて、関数近似を行なうプロセスである。従来、ニューラルネットワークにおける学習では、関数を特徴づけるデータとして、主として独立変数と関数値の組を与えることが行なわれてきているが、関数の低階微分値をデータとして与えるものもいくつかの例があり、パターン認識や微分方程式、あるいはロボティックスなどの分野への適用も提案されている。

 本論文では、学習するシステムとして、一般階の微分情報を学習するニューラルネットワークを提案しその基本的性質を調べている。

 本論文ではまず、もっとも代表的なニューラルネットワークである多層パーセプトロンが微分情報を学習するための新しい汎用的なネットワークアーキテクチャとアルゴリズムを提案している。アルゴリズムは一階も含めて二階以上の一般階の微分情報に適用可能であり、通常のバックプロパゲーションと同様に各ユニットに対して完全に局所的な形で記述されている点が大きな特徴である。本論文では、このアーキテクチャとアルゴリズムをコンピュータプログラムとしてインプリメントし、基本的性質を実験的に調べている。このプログラムは、一般階の微分情報に対応する形で設計され、従って通常のニューラルネットワークとは異なってネットワーク構造そのものの構築を動的にプログラム上で行なうことが必要となるため、非常に複雑な構造を持つものとなっている。益岡氏は、プログラムのコアとなる部分はC++で書き、全体で約5000行からなるプログラムとしてアルゴリズムの実装作業、および微分情報を学習するニューラルネットワークのための実験環境の構築を遂行した。

 本論文では、この実装を用いて微分情報を学習するニューラルネットワークに関する各種実験が行なわれている。まず、実用上最も必要な収束性については、ゼロ階(関数値)から始め三階までの微分情報に対する収束性を実験的に確認している。さらに、微分情報を学習するニューラルネットワークについて、その性質を明らかにするため、関数値だけを学習する場合と微分情報も学習する場合の比較を中心に以下のような解析を行なっている。

 1.関数値だけを学習する場合により多くデータを与えた場合との比較

 2.学習の機構

 3.必要な学習データ量の評価

 4.無関係な入力次元に対するスケーラビリティ

 5.ノイズ耐性

 また更に、微分情報を学習するニューラルネットワークの新しい応用として、強化学習における連続行動出力の問題を扱い、その枠組と実装を使った実験を行なっている。この問題は与えられた確率分布を実現する乱数発生器を実現することであり、具体的には一階の微分方程式を解くことに相当するが、ここではこの方法を二つの確率分布に適用し、与えられた確率分布を近似することを確認している。さらに益岡氏は、本論文の結果を踏まえて、微分情報を学習するニューラルネットワークの応用として、微分方程式と人間の腕の軌道のシミュレーションへの応用について提案した。前者の微分方程式については、微分方程式、境界条件、その他の制約条件をニューラルネットワークで学習するための一般的な枠組が、また後者のシミュレーションでは、最小トルク変化モデルのニューラルネットワークによる自然な実装が提案されている。

 また本論文の最後ではRadial Basis Fucntion(RBF)ネットワークに関する高階への拡張が論じられており、微分エラー項を持った場合の極小解の形やそれらのbest approximation property、RBFネットワークのCl稠密性の別証明が与えられている。

 以上本論文の内容は次のように要約することができる。

 1.一般階の微分情報を学習するニューラルネットワークのアーキテクチャとアルゴリズムの提案

 2.アルゴリズムのコンピュータプログラムによるインプリメンテーション

 3.微分情報を学習するニューラルネットワークに関する数値実験的解析

 4.微分情報を学習するニューラルネットワークの応用例

 5.Radial Basis Function(RBF)の高階微分の場合への拡張

 本論文は、微分情報を学習するネットワークについて、初めて、一般的で統一的なアルゴリズムを与え、それを実際にプログラムの形に実装し、基本的性質について数値的に検証し、このアルゴリズムが実用に耐え得ることを示したものである。力学的システムを含む多くのシステムにおいて、微分情報を学習する必要性、あるいは、微分情報を用いることによるシステムの簡素化・能率化が予想されており、本論文の結果は、そのアルゴリズムの統一性や美しさのみならず実用性においても優れている点で高く評価できるものである。

 よって、論文提出者益岡竜介は、博士(数理科学)の学位を受けるにふさわしい充分な資格があると認める。

UTokyo Repositoryリンク http://hdl.handle.net/2261/54120