学位論文要旨



No 217502
著者(漢字) 藤巻,遼平
著者(英字)
著者(カナ) フジマキ,リョウヘイ
標題(和) 非定常及び異種多様なシステムに対するデータマイニングに関する研究
標題(洋) Studies on Data Mining for Nonstationary and Heterogeneous Systems
報告番号 217502
報告番号 乙17502
学位授与日 2011.04.14
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第17502号
研究科
専攻
論文審査委員 主査: 東京大学 准教授 矢入,健久
 東京大学 教授 堀,浩一
 東京大学 教授 中須賀,真一
 東京大学 教授 岩崎,晃
 東京大学 教授 山西,健司
内容要旨 要旨を表示する

本研究は、近年の実データ分析において重要性を増す非定常及び異種多様なシステムに対するデータマイニングフレームワークの構築を目的とし、主に3つの貢献を行った。1)非定常かつ異種多様なセンサ時系列データからの故障検出手法、異常パタンマイニングを提案し、自動車の実データにおいてその有効性を確認した。異常パタンマイニングは、異種多様な時系列データに発生する変化の共起を特徴量(異常スコアベクトル)とする。これは、異常スコアに基づいた非定常かつ異種多様なシステムに対する属性学習手法としても重要である。2)データのみならず特徴空間の基底関数が非定常変化する際の学習フレームワーク、非定常疎ベイズ学習のモデル及び逐次アルゴリズムを提案した。非定常疎ベイズ学習では、データの尤度と基底関数の重みの事前分布へ指数忘却型の非定常学習効果を導入し、その忘却の強さは事後分布として自動的に決定される。3)異なる種類の分布が混合する異種混合モデルを学習するための効率的アルゴリズム、一般化期待情報量基準最小化法を提案した。異種混合モデルを学習するためには、混合数、各コンポーネントの種類とパラメータを同時に最適化する必要があり、ナイーブな方法では計算量が組合せ的に増大するが、提案手法ではこの問題を線形の計算量で解く事が可能である。

審査要旨 要旨を表示する

修士(工学) 藤巻遼平 提出の論文は「Studies on Data Mining for Nonstationary and Heterogeneous Systems(非定常及び異種多様なシステムに対するデータマイニングに関する研究)」と題し、本文5章と補遺からなっている。

近年、宇宙機に代表される大規模で複雑な機械システムの運用効率化や異常検知などを目的として、システムから取得されたセンサデータに対して高度なデータマイニング技術を利用する気運が高まっている。しかし、現実の機械システムから得られるセンサデータには、時間とともに振る舞いが変化する非定常性、異なる属性や物理量が混在する異種多様性、という扱いが困難な2つの性質が含まれるため、従来のデータマイニング技術の適用では十分な成果が得られていなかった。

本論文では、データの非定常性と異種多様性を、特徴空間およびモデルという2つの観点から数理的に定式化することによって、大規模複雑な機械システムのセンサデータ等に対して有効なデータマイニングの方法論を提案している。具体的には、異なる属性や物理量が混在するような特徴空間の異種多様性を扱う手法、観測データと特徴空間の非定常性を同時に扱う手法、単一のモデルでは表現できない複雑な挙動を示すデータを異種多様なモデルの混合によって表現する手法を考案し、それらの有効性を検証している。

第1章は序論であり、非定常及び異種多様なシステムに対するデータマイニング研究について現状を概観するとともに、本研究の動機や方向性を述べ、研究の意義と目的を明らかにしている。

第2章では、特徴空間の異種多様性と非定常性を解決するための異常パタンマイニング法を提案している。異常パタンマイニング法は、非定常かつ異種多様なセンサデータを、非定常変化点検出アルゴリズムによって均質な特徴空間へ写像することによって、入力データに含まれる異種多様性と非定常性を除去する。また、変化点スコア空間における異常データと正常データの距離を最大化する特徴抽出手法を提案し、自動車のセンサデータを対象とした異常検出実験において両手法の有効性を示している。

第3章では、時間的に変動する特徴空間を追従するために、基底関数の非定常性という新しい概念を導入した非定常疎ベイズ学習法を提案し、実験によりその有効性を示している。非定常疎ベイズ学習法は、従来の疎ベイズ学習法に対して、尤度関数と基底重み関数の事前分布に非定常性を導入し、モデルパラメータを逐次的に更新することによって、二段階の忘却機構を実現する。その結果、非定常なシステムの変動を効率良く追随する事が可能である。また、ベイズ学習の枠組みにしたがって非定常性の度合いも同時に学習することが可能になっている。

第4章では、複雑な挙動パタンを持つデータをモデル化するために、異なる種類の統計モデルを確率的に混合した異種混合モデルの概念を提案し、その効率的な学習手法として、異種混合モデルのためのExpectation Maximization (EM) アルゴリズムを提案している。提案手法は、混合分布モデルのパラメータ学習法である従来のEMアルゴリズムに対して、混合される各モデルの種類を最適に選択する機構を導入し、素朴な探索法では指数オーダーの時間を要する最適化問題を、線形オーダーの時間で高速に解くことに成功している。また、提案手法とともに利用可能なモデル選択基準が満たすべき十分条件を示し、アルゴリズムを拡張するための指針を与えている。

第5章は結論であり、本論文で議論した非定常及び異種多様なシステムに対するデータマイニング手法に関して得られた知見と成果をまとめ、今後の課題と展望を述べている。

補遺では、第2章で利用されている変化点検出手法、第3章におけるモデルパラメータ更新式の詳細、第4章の先行研究であるEMアルゴリズムなどが説明されている。

以上要するに、本論文は、大規模複雑な機械システムから取得された異種多様で非定常なセンサデータに適用可能なデータマイニング方法論を提案し、その有効性を示したものであり、これらの成果は航空宇宙工学、知識情報工学上貢献するところが大きい。

よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク