学位論文要旨



No 129632
著者(漢字) ヴァレンティナ,バリャク
著者(英字)
著者(カナ) ヴァレンティナ,バリャク
標題(和) 高密度データ無線センサネットワークのための耐故障性フレームワークの提案
標題(洋) Framework for Fault Tolerance in Dense Data Centric Wireless Sensor Networks
報告番号 129632
報告番号 甲29632
学位授与日 2013.03.25
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第454号
研究科 情報理工学系研究科
専攻 創造情報学専攻
論文審査委員 主査: 東京大学 教授 江崎,浩
 東京大学 教授 石塚,満
 東京大学 教授 石川,正俊
 東京大学 教授 千葉,滋
 国立情報学研究所 教授 計,宇生
 東京大学 教授 本位田,真一
内容要旨 要旨を表示する

Primary task of wireless sensor networks is to gather and process observations about an entity or phenomena of interest. Reliability of the network depends entirely on the accuracy of the inference, which in turn is closely related to the accuracy of sensory readings. Over the time, different types of faults develop in the network, affecting the accuracy of sensory readings. Since reliable and independent functioning of the network is one of the key demands for the quality of service, it is crucial to minimize the number of erroneous readings that could affect the final result and functionality of the backend application.

Wireless sensor networks consist of numerous relatively inexpensive devices that are capable of creating rather complex systems. Often these networks are deployed in harsh environments and they have to meet demanding requirements. Sensors and actuators, vital parts of sensor node, are constantly exposed to the environment so the inherent vulnerability to failures is constantly present. Faults are a common occurrence rather than an exception. Development of faults is an inevitable event, even if nodes and network are perfectly calibrated in the beginning. Cumulative effects of these faults can shorten the effective lifetime of a network, the period in which the network provides accurate and reliable data. Quick recovery is the key for maintaining autonomous functioning over the prolonged period.

Faults in wireless sensor networks can be a result of various causes, such as malfunction or environmental noise and they can be transient or lasting. A fault can occur at any level of a network stack, but the effects can propagate and cause failures and errors even at some distance form the fault's site. Fault tolerance is a complex task, and it can focus on different aspects of the functionality in the network, for example, fault tolerant routing protocols or fault tolerant event detection. The focus of this work is on faulty readings and the detection, classification and correction of faults by observing the behavior of data.

The effects different types of faults produce in the readings also fall into a wide range of categories. Some types of faults can render data unusable, while some can still provide additional information about the system and possibly even point out to the cause of the fault. However, the main result is mostly related to the accumulation of faults, which can lead to the progressive decrease of reliability and accuracy of sensor readings and shorter effective lifetime of the network.

In this work we maintain the focus on faults and types of faults in sensory readings. The main question is whether a fault can be detected through observing the trace it leaves in collected data, independent of the underlying cause. This means that we can observe a fault through the pattern it leaves in collected data. In terms of duration, persistence and observable and learnable pattern, faults can be detected and classified.

The proposed method requires certain redundancy of readings, including the spatial and temporal correlation, while maintaining the assumption of uncorrelated development of faults in different nodes. Because of this, the best applicability is for data-centric, densely deployed wireless sensor networks. In this type of network, multiple sensors collect data in the same area at the same time, which preserves mentioned spatial and temporal correlation amongst readings and provides sufficient information for statistical methods to work.

Some of the key requirements for the complete fault tolerance scheme are quick self-recovery, flexibility and low cost. Full cycle consists of detection, diagnosis, resiliency mechanisms and fault models. To address these issues, this thesis proposes a complete and consistent fault classification based on two criteria, frequency and continuity of the occurrence and observable and learnable pattern in the data. This classification is used in the detection and diagnosis phase, and it enables handling of more than one type of fault at the same time. Further, we propose model learning based on the given classification. Model of the fault can be learned from the observed pattern as a function, and applied to the correction of the fault. It is important to note that in this system model of fault is expected to be applicable only for the specific sensor node. Finally, to complete the cycle, elements are integrated into a flexible fault correction framework. This framework uses learned models to handle faulty sensors in an appropriate manner, incorporating those models into improved assumptions about the network's behavior. The method gives the flexibility to address each faulty node individually without the big increase in overall communication cost. Even though the proposed method is centralized, it maintains some benefits of in-node solutions for fault correction.

The framework itself can be implemented with a different combination of algorithms for each stage of the process. In the current evaluation, methods for each phase have been chosen based on the applicability and simplicity. Detection phase relies on statistical features of data, analysis of time series and a classic neighborhood vote technique. Considering that a fault can belong to a one of a small set of classes, for the classification phase we use statistical pattern recognition, more specifically, decision trees. Finally, in model learning phase, we use regression. However, this is one limitation of the system, since currently it can only learn a model of a polynomial form. For the complete evaluation, we have used analysis of dataset, simulation and finally a small testbed deployment. Results so far maintain that the method is capable of satisfactory detection and classification of faults, as well as of learning the polynomial form of the fault model. Correctly classified faults in readings are either adequately corrected or their negative effects are eliminated from the data.

審査要旨 要旨を表示する

本論文は,「Framework for Fault Tolerance in Dense Data Centric Wireless Sensor Networks(高密度データ無線センサネットワークのための耐故障性フレームワークの提案)」と題して,英文で記されており,5章から成る.無線センサネットワーク(Wireless Sensor Network : WSN)から高精度なセンサデータを得られる時間を向上させることを目的として,エラー分類に基づき,センサデータのエラーを除去するフレームワークを提案している.WSNは,センサデータを得るためのインフラとして活用が期待される一方で,稼働時間の経過と共に得られるセンサデータに様々な種類のFaultが混入し,精度が低下することが知られており,実運用する際の障害となっている.これまでに,特定種類のFaultを検知し,各センサノードの補正を実行時に行う手法は提案されているが,実システムから得られるセンサデータには複数種類のFaultが混在しており,従来の検知・補正手法によるFault除去には限界があった.

そこで,本論文では,Faultの分類モデルに基づいて,複数種類のFaultが混在するセンサデータに対するFaultの検知・分類・補正を行うフレームワークを提案している.本論文の提案は次の3点である.まず,(1)Fault検知・分類・補正を行うフレームワークのアーキテクチャを提案した.また,(2)既知の4種類のFaultを対象とした分類モデルを提案した.さらに,(3)分類・補正の精度を向上させるための学習機構を提案した.本論文では,これら3点を備えたフレームワークを無線センサネットワークの実システムに対して適用し,その有効性を評価している.

本論文は以下の5つの章から構成されている.

第1章では,研究概要を述べている.第2章では,研究の背景や既存研究を述べており,本研究の位置づけを明確化している.

第3章では,Fault検知・分類・補正フレームワークを提案している.複数種類のFaultが混在するセンサデータからFaultを除去するためには,どの種類のFaultがセンサデータ内に含まれているかを判定するFault分類と,判定されたFaultの種類に応じた補正を行う必要がある.本章ではまず,検知・分類・補正フレームワークのアーキテクチャ詳細を説明している.本フレームワークはFaultの検知部,分類部,補正部から構成され,各部間のフローを規定している.各構成要素は既存のアルゴリズムを組み込み可能なようにフレームワークのホットスポットとなっており,対象とするFaultの種類に応じて異なるアルゴリズムを適用可能となっている.複数のFaultを扱う場合,特にFaultの分類部において,Faultの分類モデルが必要となる.そこで,本章では,既存研究でその存在が知られているBias,Drift,Malfunction,Randomという4種類のFaultを対象としたFault分類モデルを定義している.各Faultの種類毎の特性に基づき,発生の連続性,データ変化パターンのマッチング,発生頻度を組み合わせた決定木として分類モデルを定義している.この分類モデルを用いることで,統計的パターン認識など既存のアルゴリズムを用いてFaultの分類が可能になる.分類モデルに基づき,Faultの混入が判定された場合,Faultのモデルに基づきセンサノードの分類・補正を行う.その際に学習機構を組み込むことで,モデル上のパラメータを実行時に推定し,Faultの分類・補正精度の向上を図っている.

第4章では,第3章で示したフレームワークの実装例と,その実装を用いた評価を述べている.本章での実装では,検知部では,近隣ノードによる投票や,データの時系列解析による検知アルゴリズムによる実装が,分類部・検知部では,統計的パターン認識を用いた分類アルゴルズムによる実装が示されている.また,評価では,実システムから得られたデータセットを用いたデータ分析,シミュレーション評価,さらには実機を用いた評価に基づいて,分類モデルを用いたFault分類の精度評価,学習機構による補正精度評価,本フレームワークを用いることによる総合的なFault除去能力の評価を行っている.本評価によって,高精度のセンサデータが得られる稼働時間が向上することを示している.例えば,ある実験設定では稼働時間を18%,実時間で約3日間向上させることを示し,提案手法の有効性を示している.

最後に,第5章で,本論文の内容とまとめている.

以上のように,本論文では,高精度なセンサデータを得られる時間を向上させるという目標に対して,Faultの分類モデルに基づいて,センサデータに含まれる複数種類のFaultを実行時に検知・分類・補正するというアプローチに基づき,エラーを除去するフレームワークを提案したものである.本手法の有効性は,実システムから得られたデータセットを用いたシミュレーションや,実機での実験に基づいて現実的且つ有効であることが示されており,WSNの実運用に対して貢献するものである.以上のように情報理工学における創造的実践の観点でも価値が認められる.

よって本論文は博士(情報理工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク