学位論文要旨



No 121652
著者(漢字) 鈴木,健二郎
著者(英字)
著者(カナ) スズキ,ケンジロウ
標題(和) KM2O-ランジュヴァン方程式論に基づく非線形リスク解析について
標題(洋) On a non-linear risk analysis based on the theory of KM2O-Langevin equations
報告番号 121652
報告番号 甲21652
学位授与日 2006.03.23
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第77号
研究科 情報理工学系研究科
専攻 数理情報学専攻
論文審査委員 主査: 東京大学 教授 岡部,靖憲
 東京大学 教授 竹村,彰通
 東京大学 教授 合原,一幸
 東京大学 教授 藤井,眞理子
 東京大学 助教授 駒木,文保
内容要旨 要旨を表示する

時系列に潜む異常性の前兆を検出する体系的な方法論は,さまざまな応用分野において大いに役立つと考えられる.たとえば,株価指標のような金融時系列から金融市場の暴落の前兆をつかむことができれば,市場に参加する投資家は何らかの行動を事前に起こし,重大な損失から免れることができるかもしれない.また,予防医学の分野では,疾患の早期発見が治療の成功において重要な鍵を握っているであろうことは間違いない.腎疾患の指標である血清クレアチニン値などの時系列において,そこに潜む異常性を事前につかむことができたならば,人工透析などの施術に関する意思決定において,大きな後ろ盾となるであろう.あるいは,地震学においては誰しもが日々感じているように,異変の前兆を地震データから発見することができれば,状況に的確に対処することで,災害を最小限に抑えることができるかもしれない.

この論文の目的は,さまざまな時系列に潜む異常の前兆を定量的に検出するための,非線形リスク解析を展開し,先行研究であるKM2O-ランジュヴァン方程式論に基づく非線形異常解析を補強することにある.東京大学大学院情報理工学研究科の岡部ら(2002)は,異常性を「時系列の背後にある確率過程における定常性の破れの度合い」と定義し,その前兆を検出するテストTest(ABN)を提案した.Test(ABN)の結果は異常グラフと定常グラフという2つのグラフを通じて解析される.異常グラフでは,実線が実データのチャートを表しており,灰色の網掛けは定常性のテストTest(S)を通過しなかった箇所を示している.一方定常グラフでは,実線でTest(S)を通過した2次元時系列の個数が表されており,定常性の破れの度合いを調べることができる.実際,岡部らは,いくつかの株式市場指標から市場崩壊の前兆を探るという点で前向きな成果を得たが,実験結果には問題点も残されていた.その一つとして,定常グラフにおいて,実際の異常の前兆として検出される箇所のほかにも,定常グラフが急激に下がったり,あるいは0になる箇所が現れ,それらの見分けがつかないということである.これは,定常性の破れという観点とは別の尺度により,定量的に異常の前兆を調べる必要性があることを示唆している.

本論文では,この問題を解決するために,異常性の前兆を検出するもうひとつの方法を導入する.理論的背景となるのは,松浦-岡部(2001)に基づく確率過程に対する非線形予測解析である.まず,非線形予測誤差によって定義される「リスク」の概念を導入する.これは,過去の情報を用いた予測の精度の低下をもって,リスクの拡大と解釈するところにその礎がある.確率過程に対する予測誤差を計算する理論について簡単に説明する.X=(X(n);0〓n〓N)を確率空間(Ω,B,P)上で定義された2次元確率過程とする.非線形予測問題とは,p期先の非線形予測子〓をいかに計算するか,ということであるが,この非線形予測子は,条件付期待値〓に対応している.この問題を解決するために,松浦-岡部は,非線形情報空間〓の生成系を導入した.そこでは,階数有限の非線形変換された多次元確率過程X(q)が構成され,これを用いた有限次元の非線形予測子〓の計算アルゴリズムが提案されており,〓のqを無限大に飛ばすことにより,理論的には〓が得られることになる.さらに岡部-金子(2001)は,この理論を多次元確率過程に拡張し,気象データを用いて実証分析を行っている.

非線形予測子の精度を測る際,我々は非線形予測誤差〓を計算する.予測誤差は,通常予測値と実現値との乖離を定量的に表したものであり,その値は〓を満たす.この非線形予測誤差の近似として,我々は先の階数有限の非線形予測子から階数有限の非線形予測誤差〓を計算することができる.これを時間経過とともに繰り返し計算した際,その値が以前よりも小さくなった場合,Xの将来の挙動に対する非線形予測子の説明力があることを示唆しており,逆に予測誤差に増加傾向が現れた場合,予測子が十分には将来の挙動を説明できなくなってきていることを示唆する.そこで,本研究ではこのメカニズムに着目し,時系列の異常解析に積極的に応用することをねらいとした.すなわち,解析の対象となる時系列の背後にある確率過程において,何らかの異常の前兆が潜在的に存在するとすれば,そこに非線形予測子の説明力が低下し,非線形予測誤差の拡大が現れるのではないかと考えたのである.したがって,時系列に対してTest(ABN)と同様,時間域をシフトしながら一定の階数有限の非線形予測誤差を計算し,その挙動を調べることで,定常性の破れとは別の観点から異常性の前兆を探ることができ,異常性解析で先に挙げた問題点の一解決策となると考えられる.

非線形リスク解析の概要を説明する.前述の自然数L(1〓L〓N)と各s(L〓s〓N)に対し,時系列Z=(Z(n);0〓〓N)から時系列Z(t)=(Z(t)(n+t-L);0〓n〓L)を抜き出す.さらにその時系列から見本共分散行列関数〓を計算し,これに基づいてその時間域の階数有限の非線計予測誤差〓を計算する.ここで,〓は,Z(t)の分散,〓は階数有限の非線形予測子の自乗ノルムを表す.さらに,時間域をシフトしながらこの値をプロットすることで,その推移を一つのグラフに描くことができる.これをリスク関数RF(Z)といい,そのグラフをRFgraphと呼ぶことにする.

非線形リスク解析は,d次元確率過程Xの非線形情報解析に基づいている.本論文では,これまでの非線形情報解析で確立された生成系とは別の生成系を構成することで,確率過程の構造に関して新たなアプローチを行っている.まず,以下のような直交分解を考える:〓(1)

この分解の第1項の具体的な表現により,Xの階数有限の非線形構造を把握することができることになり,先行研究におけるさまざまな非線形解析では,この分解が基礎となっている.我々はここで(1)を第1種直交分解と呼ぶことにする.しかしこれに加えて,X(q)に付随する前向きKM2O-ランジュヴァン揺動過程ν+(X(q))=(ν+(X(q))(n);0〓n〓L)の非線形構造の解析を通じて,Xについての構造を解析する方法を導入する.ν+(X(q))の典型的な性質は,直交性である.したがって,〓の線形情報からは構造について新たに何かをつかむことはできない.しかし,(1)は,ν+(X(q))の独立性については何も保証するものでなく,したがって非線形な相関構造の存在は否定されていない.そこで,次のようなもう一つの直交分解を考える:〓(2)

ここで,〓は,ν+(X(q)(q'))の線形情報空間であり,次の因果関係が成り立つ:〓(3)

この関係式は, (2)に基づいた解析の方が(1)よりも,Xの構造についてのより詳細な情報が得られる可能性を示唆している.(1)を,第1種直交分解と呼ぶのに対して,(2)を第2種直交分解と呼ぶことにする.これら2種類の分解式に基づいて,それぞれから階数有限の非線形予測誤差,〓および〓を計算することができる.これらを,それぞれp期先の第1種および第2種非線形予測誤差と呼ぶ.

さらに,これを時系列解析に応用してリスク関数を計算する場合にも,同様に2種類のリスク関数を定義することができる.時系列に対して第1種の階数有限の非線形予測誤差から得られるリスク関数を,第1種リスク関数,そのグラフをRF graph 1と呼び,第2種の場合も同様,第2種リスク関数,そのグラフをRF graph 2と呼ぶことにする.

本論文の内容を章ごとに追って説明する:

第2章Non-linear analyses for stochastic process (確率過程に対する非線形解析)では,KM2O-ランジュヴァン方程式論の中の理論的基礎となる先行研究と,本研究での新たな理論展開について説明する.

2.1節KM2O-Langevin equations associated with stochastic process(確率過程に付随するKM42O-ランジュヴァン方程式)ではまず,非退化な場合のd-次元確率過程Xに対して,線形情報空間〓を導入し,Xの線形の時間発展の表現として,これに付随するKM2O-ランジュヴァン方程式を導く.さらに,当該確率過程が定常性を持つ場合について考察し,散逸散逸定理(DDT),揺動散逸定理(FDT)および偏自己相関関係式(PAC)について説明する(Okabe(1988), Okabe(1988), Okabe(2000)).つづいて,退化した確率過程に対する理論の展開について言及する(Matsuura-Okabe(2001)).

2.2節Non-linear information analysis (非線形情報解析)では,確率過程Xの非線形情報空間〓を導入し,この解析により非線形構造を調べる.まず,岡部靖憲教授と松浦真也助手によって展開された,〓の生成系(生成系(1))を用いた非線形情報解析の手法について説明する(Matsuura-Okabe(2001)).つづいて,筆者と岡部靖憲教授による新しい研究成果として,確率過程X(q)に付随するKM2O-ランジュヴァン揺動過程ν+(X(q))を用いた第二の生成系(生成系(2))について説明する.本研究ではこれに基づき,元の確率過程の非線形変換の階数を固定した上で,KM2O-ランジュヴァン揺動過程に潜む非線形情報を抜き出すことにより,従来の方法では捉えきれない複雑な構造を解析する.

2.3節Non-linear prediction analysis (非線形予測解析)では,最初に生成系(1)を用いた従来のアルゴリズムにより,階数有限の非線形予測子(1)〓を求め,その階数qに関する極限として,〓を求める非線形予測公式(1)(Okabe-Kaneko(2000),Matsuura-Okabe(2001))を紹介する.その後,それに基づく非線形予測誤差(1)を求める.つづいて前節で新たに導入された生成系(2)に基づき,KM2O-ランジュヴァン揺動過程を用いて階数有限の非線形予測子〓を求め,q'に関する極限として,非線形予測公式(2)を導く.さらにそれに基づく非線形予測誤差(2)を求める.

第3章Non-linear analyses for time series (時系列に対する非線形解析)では,時系列の異常性の前兆を定量的に探るための新たな手法として,リスク関数を導入する.

3.1節The first kind of risk function (第1種リスク関数)では,1次元時系列Zに対し,第1種リスク関数を計算する手順を説明する.まず最初に,cut lengthの長さだけ切り出したものをZ(t)とする.これに対して階数6の非線形変換を施すことで,19個の1次元時系列Z(t)を得る.時間域を変更した後,2次元の時系列〓を構成し,これに対してTest(S)を実行する.Test(S)を通過したものに対して,見本共分散行列関数〓を求め,これを用いて第1種非線形予測値〓を計算する.その予測誤差として,第1種リスク値γ(1)を定義する.最後に時間域をシフトしながら,その変動を記録することによって,第1種リスク関数のグラフを得る.

3.2節The second kind of risk function (第2種リスク関数)では,前節の第1種リスク値を計算する過程で得られるKM42O-ランジュヴァン揺動列〓の非線形情報を利用して第2種リスク値を求める手順について説明する.まず〓の規格化を行い,階数4の非線形変換を施すことで,28個の1次元時系列〓を得る.これに対して,第1種の場合と同様の手順をを踏み,第2種リスク値γ(2)を求める.時間域をシフトしながら,その変動を記録することにより、第2種リスク関数のグラフを得る.

第4章Results of empirical analyses(実証解析の結果)では,前章で導入した時系列解析の手法を各種実データに適用し,非線形リスク解析を行う.

4.1節Stock market indexes (株式市場指数)では,アメリカ,イギリスおよび日本各国の代表的株価指数として,Dow,Ftse100および日経225の1984年〜1988年の日次データを取り上げ,各種指数に対して異常性のテストTest(ABN)を行った上で,第1種および第2種リスク関数を求めた.この時期には,大きな出来事として,1985年9月22日のプラザ合意と1987年10月19日のブラックマンデーが含まれている.実験の結果,特にDowと日経225のリスク関数において,プラザ合意までは減少傾向にあったが,その直後から一転して上昇傾向に変化し,ブラックマンデーの時期まで一貫して増加している現象が観察された.これは,Test(ABN)では区別できなかった異常性の前兆を捉えていると考えることができる.一方従来の市場リスク指標であるValue at Riskでは,そのような傾向は見られなかった.

4.2節Serum creatinine concentration (血清クレアチニン濃度)では,腎機能の指数である血清クレアチニン濃度のデータを取り上げ,前述と同様の実験を行う.その結果,腎機能の悪化を示唆する2.0の値を越える前で,リスク関数は一度減少した後に急上昇する傾向が得られる.この場合もTest(ABN)では区別できなかった異常性の前兆を捉えていると考えることができる.また,緊急人工透析の開始および離脱の前後で一貫してリスク関数は上昇しており,これらの施術判断への利用が期待できる.

4.3節Seismic waves (地震波)では,通常の地震と深部低周波地震という異なる2種類の地震波について,前述と同様の実験を行う.その結果,特に通常の地震において,上下成分ではP波到達の直前で一度減少した後で急上昇するという傾向が現れたが,一方で南北・東西成分ではその傾向が現れず,P波の前兆を捉えたTest(ABN)の結果を補強するものとなった.またS波到達の直前では,上下・南北成分では大きな上昇傾向が得られたが東西成分では上昇傾向が現れなかった.この結果はTest(ABN)からは捉えられなかった変化であるが,東京大学地震研究所の武尾実教授により指摘された,震源に対する観測地点の位置関係に起因する地理的条件を示唆している可能性がある.

審査要旨 要旨を表示する

本論文は「On a non-linear risk analysis based on the theory of KM2O-Langevin equations (KM2O-ランジュヴァン方程式論に基づく非線形リスク解析について)」と題し、5章からなる。実験数学の理論であるKM2O-ランジュヴァン方程式論に新たに付け加える理論的な部分として、KM2O-ランジュヴァン方程式論における階数有限の揺動過程に対する非線形情報解析を行い、もとの確率過程に対する非線形情報空間の新たな生成系を構成し、それに基づいた非線形予測公式を確立した。その時系列解析への応用として、非線形予測誤差を用いたリスク関数を導入し、時系列の異常を予測誤差関数の挙動で捉え、アメリカ、イギリスおよび日本の株式市場指数、血清クレアチニン濃度と地震波の時系列データを扱い、時系列データの異常の前兆を捉える実証分析を行った。従来のTest(ABN)では、時系列の異常を定常性の破れの度合いで捉え、定常関数と異常関数の挙動で時系列の異常の前兆を捉えるものであったが、本論文で用いられるリスク関数はTest(ABN)では捉えきれない大域的異常を捉えることができ、Test(ABN)と併用することによって、複雑系現象に現れる時系列のリスク解析への応用を示した。

第1章「Introduction(序文)」では、時系列の異常の前兆を捉える時系列のリスク解析において、時系列の異常をどのように数学的に定義し、それをどのように定量的に定義することが必要であるかを論じ、従来のTest(ABN)は、時系列の異常を定常性の破れの度合いで捉え、定常関数と異常関数の挙動で時系列の異常の前兆を捉えるものであったが、そこでの問題点を解決するために、本論文でリスク関数を導入する経過を詳しく述べている。

第2章「Non-linear analysis for stochastic process(確率過程に対する非線形解析)」はさらに二つの節:2.1節「Non-linear information analysis(非線形情報解析)」と2.2節「Non-linear prediction analysis(非線形予測解析)」から成り立つ。

2.1節ではドブルーシン・ミンロスの可積分条件を満たす離散時間の確率過程に対し、従来ある多項式型の生成系(生成系(1))の中で有限階数を固定したとき導かれるKM2O-ランジュヴァン揺動過程を基礎として、その非線形情報空間の多項式型の生成系を構成することによって、もとの確率過程の非線形情報空間の新しい生成系(生成系(2))を構成した。

2.2節では、生成系(1)に基づく非線形予測子と非線形予測誤差を計算する公式を求める考えを用いて、生成系(2)に基づく非線形予測子と非線形予測誤差を計算する公式を求めた。

第3章「Non-linear analysis for time series(時系列に対する非線形解析)」はさらに二つの節:3.1節「The first kind of risk function(第1種リスク関数)」と3.2節「The second kind of risk function(第2種リスク関数)」から成り立つ。

3.1節では、対象とする時系列から切り口の長さ(cut length)の長さだけ切り出した時系列の終端時刻に、前章の生成系(1)に基づく非線形予測誤差を適用して得られる予測誤差を第1種リスク値として定義し、終端時刻をシフトして得られる関数を第1種リスク関数として導入した。

3.2節では、対象とする時系列から切り口の長さ(cut length)の長さだけ切り出した時系列の終端時刻に、前章の生成系(2)に基づく非線形予測誤差を適用して得られる予測誤差を第2種リスク値として定義し、終端時刻をシフトして得られる関数を第2種リスク関数として導入した。

第4章「Results of empirical analysis(実証解析の結果)」はさらに三つの節:4.1節「Stock market indexes(株式市場指数)」、4.2節「Serum creatinine concentration(血清クレアチニン濃度)」と4.3節「Seismic waves(地震波)」から成り立つ。三つの実証解析に行く前に、前章で導入した時系列解析の手法をステップに分けて詳しく丁寧に説明している。

4.1節では、アメリカ、イギリスおよび日本の代表的株価指数としてそれぞれDow、FTSE100、日経225の1984年の日次データに、異常性のテストTest(ABN)を行い、異常グラフと定常グラフを求めた上でさらに、前章で導入した第1種リスク関数と第2種リスク関数のグラフを求めた。その結果、特にDowと日経225のリスク関数は、1985年9月の円高を容認したプラザ合意までは減少傾向にあったが、その直後から一転して上昇傾向に転じ、1987年10月19日のブラックマンデーの時期までは一貫して増加している挙動を示した。これは、Test(ABN)では局所的にはブラックマンデーの兆候を捉えたが、大域的にはブラックマンデーの前の多くの異常性を区別できなかったTest(ABN)を補強する結果を示している。一方、従来の市場リスク指標である Value at Risk ではそのような傾向は見られなかった。

4.2節では、腎機能の指数である血清クレアチニン濃度の時系列データに対し、上と同様の解析を行った。その結果、腎機能の悪化を示唆する値2.0を超える前で、リスク関数は一度減少した後に急に上昇する挙動を示した。この場合も、Test(ABN)では大域的には捉え切れなかった異常性の前兆を捉えている。また、緊急人工透析の開始と離脱の前後で一貫してリスク関数は上昇する挙動を示している。非線形リスク解析の予防医学での施術判断への利用が期待できる。

4.3節では、通常の地震と深部低周波地震という異なる2種類の地震波の時系列データに対し、上と同様の解析を行った。その結果、特に、通常の地震に対するリスクク関数は、上下成分ではP波到達の直前で一度減少した後で急に上昇する挙動を示したが、南北・東西の水平成分ではその挙動を示さず、P波の前兆を捉えたTest(ABN)の結果を補強している。またS波到達の直前では、上下・南北成分に対するリスク関数は大きく上昇する挙動を示したが、東西成分では上昇する挙動を示さなかった。これは、Test(ABN)からは捉えられなかったことであるが、震源に対する観測地点の位置関係に起因する地理的条件を示唆している可能性がある(東大地震研究所の武尾実教授からの口頭)。深部低周波地震に対するリスク関数はS波到達後に興味ある挙動を示しているが、深部低周波地震の構造解析に結ぶまでには至っていない。

第5章「Conclusion and more problems to be solved(結論と今後の課題)」では全体の総括にあてられ、本研究の学問的な位置づけと今後の問題に触れている。

以上を要するに、本論文はKM2O-ランジュヴァン方程式論に新たに付け加える理論的研究として、階数有限の揺動過程の非線形構造を調べる非線形解析を行い、それに基づく非線形予測公式を確立した。さらに、その時系列解析への応用として、時系列の異常性を予測誤差の悪さで捉えるリスク関数を導入し、株式市場指数、血清クレアチニン濃度と地震波における時系列データに適用することによって、従来のTest(ABN)では捉えきれない大域的異常を捉えることができることを示した。本論文は、Test(ABN)に現れる定常関数、異常関数とリスク関数を併用することによって、複雑系現象に現れる時系列の異常性の兆候を捉えるリスク解析への応用の可能性を示し、数理情報工学上の貢献が顕著である。

よって本論文は博士(情報理工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク