学位論文要旨



No 213535
著者(漢字) 小原,和博
著者(英字)
著者(カナ) コハラ,カズヒロ
標題(和) ニューラルネットワークの学習法と予測問題への適用に関する研究
標題(洋)
報告番号 213535
報告番号 乙13535
学位授与日 1997.09.18
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第13535号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 吉澤,修治
 東京大学 教授 伏見,正則
 東京大学 教授 岡部,洋一
 東京大学 助教授 合原,一幸
 東京大学 助教授 廣瀬,明
内容要旨 1.研究の背景と目的

 生体の神経回路網の仕組みや働きをモデル化して人工的に作り上げた神経回路網モデルを以下ニューラルネットワークと呼ぶことにする。ニューラルネットワークの構造で代表的なものは多層構造型ニューラルネットワークと相互結合型ニューラルネットワークである。多層構造型ニューラルネットワークは入力層、中間層、出力層から構成され、学習アルゴリズムにはバックプロパゲーション(誤差逆伝播学習)がよく用いられる。バックプロパゲーションでは入力信号とそれに対応する教師信号の学習セットを用意し、入力信号に対するニューラルネットワークの出力信号が教師信号に近づくようにニューロン間の接続線の重みを修正していく。

 バックプロパゲーションを用いた多層構造型ニューラルネットワークの学習法については、(1)入力信号・出力教師信号の選択および提示法、(2)中間層のニューロン数を最適化する方法、(3)初期値を設定する方法などの研究が継続的に行われている。(1)の「学習能力を有するニューラルネットワークに、どのような入力信号、出力教師信号を、どのようにコード化して提示するか」というテーマは、応用に際して重要な研究テーマである。

 ニューラルネットワークの応用分野はパターン認識、予測、制御など多岐にわたっている。最近では、非線形な入出力関係を学習できるというニューラルネットワークの性質を生かして、実世界の予測問題である経済予測(株価予測、為替レート予測など)への応用研究が盛んに行われている。本論文では、これらの状況を踏まえ、バックプロパゲーションを用いた多層構造型ニューラルネットワーク(BPNN)への教師信号と学習セットの提示法を提案することと、実世界の予測問題に適用することを目的とする。

2.ニューラルネットワークへの教師信号の提示法

 本研究の第一の目的は、部分特徴入力に適した教師信号の提示法を提案することである。BPNNをパターン認識問題に適用する場合、従来の学習法では、正解クラスに対応する出力層のニューロンには「1」、その他のクラスに対応するニューロンには「0」という断定的な教師信号を与えていた。この教師信号をクラス間で重なりのある部分特徴を入力としたパターン認識問題に適用すると、重なった部分において、よく似た入力パターンに対して全く異なる教師信号を与えることになり正解クラスの出力値を十分大きくできない場合が生じる。複数の部分特徴を複数のBPNNに個別に入力し各BPNNの出力を統合してパターン認識させる手法において、ある入力パターンの部分特徴1と部分特徴2がそれぞれ他のクラスによく似ている場合には、正解クラスの統合値をクラス間で最大にできない。そこで、入力パターンの類似性に応じて教師信号を修正する(互いに類似したクラスの教師値を大きくする)ことで、正解クラスの出力値および統合値が大きくなるようにする。

 提案法では、クラスAに所属する入力パターンがクラスBに誤認識されたとき、クラスBに所属するすべての入力パターンの教師信号のうちクラスAに対応する教師値を大きくする。この修正によりクラスBのパターンを入力したときクラスAの出力値を大きくするように学習できるので、クラスBによく似たクラスAのパターンを入力したときクラスA(正解クラス)の出力値を大きくできる。提案法は、複数の部分特徴を複数のBPNNに個別に入力し、各部分特徴で互いに類似のクラスが異なるとき有効である。これは、各部分特徴を入力したBPNNの出力値が単独では1位にならなくても、負ける相手(類似クラス)が異なれば、加算値で1位になる可能性があるためである。

 提案法を、2次元正規分布データから成る2つの部分特徴を用いたクラス分類問題(4クラス、10クラス、20クラス)と、手書き数字から抽出した2つの部分特徴を用いたパターン認識問題(10クラス)に適用したとき、テストデータの認識率が向上した。

3.ニューラルネットワークへの学習セットの提示法

 本研究の第二の目的は、クラス間で重なりがなくノイズデータを含まないパターン認識問題を対象として、学習誤差の分散を小さくし学習時間を短縮するような学習セットの提示法を提案することである。一般的に言って、すべての学習パターンが同じ速度で学習されていくとはかぎらず、比較的速く学習され2乗誤差が速やかに小さくなっていくパターンと、なかなか学習が進まず2乗誤差が速やかに小さくならないパターンに分かれる。どの学習パターンも同じように重要な場合には、すべてのパターンを十分に学習させる必要があるために、従来の均等提示学習(すべての学習パターンをBPNNに均等に同じ回数だけ提示)では学習時間が長くなるという問題が生じる。そこで、学習進捗のばらつきが小さくなるように選択的に提示して学習を進めることが、学習時間の短縮に有効であるものと考える。

 第一の提案法(段階的誤差監視)では、学習途上の誤差を監視して学習制御するために複数のマイルストーンを設け、各段階で学習の遅れているパターンを多く提示する。これにより、2乗誤差の減り方に関して偏りの少ない学習を実現でき、学習時間を短縮できる。第二の提案法(クロス・テスト)では、学習セットの部分集合を学習したBPNNで、未学習の部分集合をテストすることにより少数パターン(学習セットに比較的少なく含まれる特徴パターン)を検出する。少数パターンは出現頻度が小さいので学習速度が遅い。少数パターンを多く提示することで少数パターンの学習速度を上げ学習の偏りを少なくする。2つの提案法は、学習パターンを100%分類でき、特徴空間で学習パターンが広く分布しているときに有効である。これは、同じクラスの学習パターンが比較的狭い範囲に分布している場合には少数パターンがないので、従来法でも学習の偏りが少なく十分速く学習できるためである。

 提案法を、2次元正規分布データを用いた4クラス分類問題と、手書き数字のメッシュ特徴を用いたパターン認識問題に適用したとき、学習2乗誤差の分散が小さくなり学習時間が短縮した。その際、提案法により認識能力が低下しないことを確認した。

4.選択的強調学習のニューラルネットワークを用いた予測法

 本研究の第三の目的は、変動予測に適した学習セットの提示法と学習停止条件を提案し、実世界の予測問題に適用することである。BPNNを用いた従来の予測法では、予測対象時系列の変動の大きさによらずすべての学習データを均等にBPNNに提示していた。また、各学習データに与える学習係数も同一だった。また、過学習を防ぐために、訓練データを学習データと検証データとに分け、学習データを用いてBPNNの学習を進め、検証データにおける平均誤差が最小となる時点で学習を停止していた。

 一般的に言って、大きな変動が次の操作を決定する要因となるので、小さな変動よりも大きな変動を正確に予測できることの方が有用である。従来法のように、小さな変動に対応する学習データと、大きな変動に対応する学習データを同じ回数だけ提示すると、小さな変動も正確に学習しようとするために大きな変動を効果的に学習できないと考える。また、予測問題に応用する場合にBPNNに求められる目的関数は必ずしも平均予測誤差を最小にすることではない。予測値に基づく操作による効果を最大にすることの方が重要である(例えば、株式売買に応用する場合には、予測値を用いた売買操作による予測利益を最大にすることの方が重要である)。そこで、大きな変動を選択的に強調して学習させる方法と、平均誤差最小以外の学習停止条件を提案する。

 選択的提示法では、大きな変動に対応する学習データを提示する回数を増大し、選択的学習係数法では、大きな変動に対応する学習データの学習係数を比較的大きくする。またこれらの方法を併用することで、きめ細かな選択的強調学習を実現できる。さらに、平均誤差最小以外の学習停止条件として、検証期間において、予測値に基づく操作の効果が最大となる時点で学習を停止する方法を提案する。

 提案法では、大きな変動に対応する学習データを選択的に強調して学習するので、学習期間の予測効果(大きな変動の予測に基づく操作による効果)を向上できる。これにより、テスト期間での予測効果の向上も期待できる。提案法を東証株価指数(TOPIX)の変動予測問題に適用して評価した。入力データとして、複数の経済指標のほかに、株価変動に影響を及ぼすイベント知識も考慮した。評価実験の結果、大きな変動に対応するデータを選択的に強調して学習させ、予測値に基づく株式売買シミュレーションによる予測効果が最大の時点で学習を停止することで、大きな変動データの学習誤差を小さくし、学習期間での予測効果とテスト期間での予測効果を増大できた。

審査要旨

 本論文は「ニューラルネットワークの学習法と予測問題への適応に関する研究」と題して、6つの章と付録からなる。

 ニューラルネットワークが世の中に受け入れられ一つのブーム的研究課題になって既に15年が経過し、この間に分散・並列的な大規模システムのダイナミクスの理論、学習理論の新しい展開が見られたが、応用との関連・可能性の最も大きいものは誤差逆伝播法を用いたパターン分類・認識、予測問題であると考えられる。

 本論文はこの誤差逆伝播型ニューラルネットワークをパターン分類に応用する際の性能の改良とそれを用いた実世界の予測問題(具体的には株式売買決定問題)への応用について研究したものである。

 第1章は序論であり、ニューラルネットワーク研究を歴史的に展望し、本研究の背景とそれから引き出される本研究の目的について述べている。

 第2章「ニューラルネットワークへの教師信号の提示法」では、各部分特徴を入力した部分誤差逆伝播型ニューラルネットワークを統合する形式のパターン認識問題を対象として、各部分特徴ごとに誤りを解消する方向に教師信号を変更する方式を提案し、その有効性を手書き数字認識を用いて例証した。さらに2次元正規分布データを用いて、各部分特徴が互いに異なる類似クラスをもつ場合に本方式が有効であることを定量的に示した。

 第3章「ニューラルネットワークへの学習セットの提示法」では重なり合いのないクラスの分類問題を取り扱い、誤差逆伝播型ニューラルネットワークの学習時間短縮のための2つの学習セットの提示法を提案している。

 第1の段階的誤差監視法は学習中に各パターンの学習誤差を監視して誤差の大きいパターンの提示回数を増加することによって学習の偏りを減少させるものである。第2のクロス・テスト法は学習セットの中の少数パターンを予め検出しこれを多数含めた学習セットを構成する方法である。ここで、少数パターンの検出はつぎの方法による。学習セットを2つの部分学習セットに分割し、それらを2つの誤差逆伝播型ニューラルネットワークを用いて別個に学習し、つぎにこの学習の済んだニューラルネットワークにそれぞれ未学習の方の部分学習セットをテストパターンとして与えて誤ったパターンを少数パターンとする。これらの方法を伝票の手書き数字の実データに適応してその有効性を定量的に示すとともに、2次元擬似正規分布データを用いて本提示法によって構成される学習セットの構造の概念的理解を試みた。

 第4章「選択的強調学習のニューラルネットワークを用いた予測法」は誤差逆伝播型ニューラルネットワークを実際の予測問題に応用する際に検討すべき重要な問題点として、学習データおよび目的関数に関する価値付(評価法)の問題を扱っている。まず、学習データに関しては、すべての学習データを均等に扱うのではなく、ある評価基準にしたがって分類し選択的に提示する方式および選択的に学習係数を設定する方式を提案する。つぎに、目的関数の設定方法として予測に基づいてなされる行動に準拠した方法を提案している。

 第5章「予測問題への応用」は前章での問題提起を(1)多変量の、(2)先験知識がある,(3)実世界の予測問題に適用することを試みたものである。このような予測問題として東証株価指数(TOPIX)を取り上げて、学習データの価値評価として大きな変動を高く評価し、それに対応するデータを選択的に学習させ、また目的関数として株式の売買シミュレーションの予測効果を用いることによって、大きな変動データの学習誤差を減少させ、予測効果の大幅な改良が得られることを多数の事例において示した。

 第6章「結論」は上記の各章の結果を要約したものである。

 これを要するに本論文は誤差逆伝播型ニューラルネットワークにおける学習法の改良を提案し、実世界の問題に適用してその有効性を定量的に示したものであり、情報工学、システム工学に貢献するところが大きい。

 よって本論文は博士(工学)の学位論文として合格と認める。

UTokyo Repositoryリンク