学位論文要旨



No 111516
著者(漢字) 李,金鏞
著者(英字)
著者(カナ) リ,キムヨン
標題(和) 遺伝的回帰分析法によるカオティック時系列の分析及び予測
標題(洋) Analyses and Prediction of Chaotic Time Series through The Genetic Recursive Regression
報告番号 111516
報告番号 甲11516
学位授与日 1995.09.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第3520号
研究科 工学系研究科
専攻 システム量子工学専攻
論文審査委員 主査: 東京大学 教授 鈴木,篤之
 東京大学 助教授 吉村,忍
 東京大学 助教授 古田,一雄
 東京大学 助教授 高橋,浩之
 東京大学 助教授 長崎,晋也
 東京大学 助教授 岡本,孝司
内容要旨

 理論又は実験による研究が困難な時系列に対する分析および予測手法は様々な科学の分野で要求されている。時系列データ分析および予測の最も基本的な意義は過去と未来のデータを結ぶ関係を求めることである。その関係が多数の伝統的手法で仮定されているように線形的であれば、従来の研究成果により数多くの手法がある。しかし、実際の重要な時系列の殆どは非常に非線形的でカオティックであり、元のダイナミックスそのものが不安定とされているものも多く、新しいパラダイムの出現が強く要望されている。本研究では多様な次元を持つカオスまたは不安定ダイナミックスから発生する時系列に対して、大局的そして局所的非線形モデルを同時に構築する新しい手法を開発することを目的とする。大局的な非線形モデルに対してはニューラルネットワークが高い実績を挙げているが、ニューラルネットワークによるモデルは多数の局所モデリング手法と同じく常に陰的(Implicit)である。従って、構築されたモデルがニューラルネットワークの構造および構造内部のパラメータに組み込まれており、第三者によるモデル式の埋解/再現は情報不足によって制限される。本研究で開発された新手法、遺伝的回帰分析法(GRR)は明瞭な数学式で表現できるモデリング手法を目指し、ジェネティックプログラミングによる記号計算法を用いる。GRRは多数の数学式を表わす記号集団を並列進化させることで、与えられた時系列ダイナミックスを近似する数学式を直接構築する方式を取るためモデル式の埋解/再現が即時にできる。また、GRRの合理的な実装(コンピュータコーディング)のための特別なシステム、"遺伝社会(Genetic Society、GS)"が完全なオブジェクト指向で開発された。特に遺伝社会は複雑なソフト開発の最新手法であるオブジェクトモデリング手法(OMT)を採用しており、並列ジェネティックプログラミングによる時系列データ分析/予測に関わるすべての情報や手続きを一つのファイルで提供することが出来る。また将来、プログラムに修正、変更、追加などが可能なフレキシブルなソフト開発環境を実現している。GRRおよび遺伝社会システムを経済、物理、天文学、医療などの分野を代表する数多くの時系列に対し適用した結果、従来のジェネティックプログラミングによる方法に比べ非常に優れ、また洗練されたニューラルネットワーク及び非線形代数モデルに匹敵する予測性能が得られた。特に従来のジェネティックプログラミングによる方法に対して本研究で行われた独創的改善は、高次元カオス/不安定ダイナミックス時系列に抜群の予測性能を持っているのが確認されており、その定量的究明が今後の課題である。本研究の主な成果を以下に纏める:

 (1)複雑な時系列ダイナミックスを明瞭な式でモデル化する新手法、GRRの開発

 (2)大局非線形モデルと局所非線形モデルが並立するアルゴリズムの開発

 (3)並列ジェネティックプログラミング用オブジェクト指向ソフト、GSの開発

 (4)高次元カオス/不安定ダイナミックス時系列を扱うための数多くの改善

 (5)データ分析/モデル構築が同時に行える記号処理手法の採用

審査要旨

 様々なシステムにおける時系列データの分析及び予測は、これまで時系列データが線形的であるとの仮定に基づいて行われてきたものが多いが、実際の時系列データの大部分は非常に強い非線形性やカオティックな特性を有するものであり、また系を支配している基礎事象自身が不安定であるものが多い。時系列データの非線形性は「大局的な非線形性」と「局所的な非線形性」に分けて考えることができる。大局的な非線形性に対してはニューラルネットワークによるアプローチが高い実績をあげている。本研究では、大局的にも局所的にも非線形性が強い時系列データに適応が可能であり、かつ明示的な数学式で表現が可能なモデリング手法を提案し、その有効性を示した。本論文は全7章から構成されている。

 第1章は序論であり、時系列問題の数学的とらえ方と既往の研究の概要を論じた後、本研究の目的を述べている。

 第2章では、アルゴリズムに染色体を介した生物の進化を模して、目的とする関数やその組み合わせを進化させるという考え方を導入した既存の手法について概説した後、本研究で扱うジェネティックプログラミング(GP)の基本的な考え方、とくにモデル(記号集団)を階層的に表現するツリーの構成法について述べている。

 第3章では、時系列データへの数学的アプローチについて述べた後、ニューラルネットワークを用いたモデリングの方法と、GPによる方法との相違について述べている。すなわち、ニューラルネットワークによる解法は暗示的であり、ニューラルネット内部の構造やパラメータがモデルに組み込まれているため、第三者によるモデルの理解や再現は情報量如何によって制限を受けるのに対し、GPによる手法は最終的に提示されるモデルが明示的な数学式で記述されるため、第三者によるモデルの理解と再現がし易いという点などの違いがあることが述べられている。

 第4章では、コンピュータコーディングのための特別なシステムである遺伝的社会(GS)について述べている。GAを例にとりあげ、並行進化の概念を説明し、さらには、GSをオブジェクト指向でモデリングする際の「オブジェクトモデリング手法(OMT)」について述べている。

 第5章では、本研究で新たに開発された遺伝的反復回帰分析法(Genetic Recursive Regression,GRR)について述べている。従来のGPによる記号(単純)回帰分析法の構成要素にさらに2次的な変数を加えることにより、より複雑な構造を表記できるようにしている。時系列データ及びその中の検証データに常に含まれているノイズに関しては、ノイズを起因とする予測精度の劣化を評価しつつ検証データに対する予測精度が劣化しないようにモデリングのための反復を進めるというアルゴリズムが取り入れてある。また、従来では進化集団は単一であり、設定される各世代の個体数や突然変異率などの環境も一定であったのに対し、それぞれ異なる環境の複数の進化集団を設定し、これらの進化集団内で同時(並列的)に進化させている。このため、進化集団間での遺伝子の授受などの情報交換が可能となり、各集団の進化を活性化させることにより結果として存在する構造式、すなわちツリーの構築にはじめて成功している。さらには、最後まで生き残る各進化集団のエリートツリーを最小二乗法で結びつけまとめることにより、予測精度の向上が図られている。モデルの適応度の評価には、4つの統計指標を線形結合化、した新たな総合的指標の有効性を示し、その汎用性を提示している。

 第6章では、GRRを実際の時系列データ予測に適用し、予測の結果、並びに既存手法の結果との比較が述べられている。適用されたデータは、赤外線レーザーの振動のような低次元カオスから為替レイトのような高次元カオスまで多様であり、すでにスタンフォード大学などが主催して行った時系列データ解析国際コンペティションで出題されたものが中心になっている。対象としたすべてのデータに関して、本研究で開発された手法を適用し、その適合度を定量的に評価することにより手法の有効性が示されている。とくに、国際コンペティションにおいては、いずれの手法もいくつかの限られたサンプルデータにしか適用できていないのに対し、本手法はすべてのサンプルデータに適用できることを示し、その汎用性を提示している。すなわち、予測精度ばかりでなく、モデリングに必要なデータ数やプログラムの汎用性といった面からも、従来のGPと比較して優れており、ニューラルネットワーク又は非線形代数モデルが有効な特性を示すサンプルデータに対しても、それと同等の結果の得られることが示されている。とくに直交関数としてチェビシェフ関数を採用することより高次元カオスに対する予測精度を向上させることができることが示されている。

 第7章は結論であり、本研究ではじめて提案した手法と得られた成果について要約している。

 以上を要するに、本論文は、時系列データ予測問題に対してGPを並列的に用いる遺伝的反復回帰分析法を提案し、かつこれをOMT法を用いて記述することにより、プログラムの修正や追加が容易に可能となるフレキシブルなソフトウェアをつくることが可能であることを示したもので、制御システムや予測システムへの応用が期待され、システム量子工学、特にシステム設計工学の発展に寄与するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク