学位論文要旨



No 122806
著者(漢字) 魏,新法
著者(英字) Wei,Xin fa
著者(カナ) ギ,シンホウ
標題(和) 空間データ共有のためのピアツーピアシステムに関する研究
標題(洋) A STUDY OF PEER-TO-PEER SYSTEMS FOR SPATIAL DATA SHARING
報告番号 122806
報告番号 甲22806
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第136号
研究科 情報理工学系研究科
専攻 電子情報学専攻
論文審査委員 主査: 東京大学 助教授 松浦,幹太
 東京大学 助教授 瀬崎,薫
 東京大学 教授 浅野,正一郎
 東京大学 教授 浅見,徹
 東京大学 教授 森川,博之
 東京大学 助教授 上條,俊介
内容要旨 要旨を表示する

 This thesis is about peer-to-peer systems for sharing spatial data. In recent years, tremendous improvements in data gathering techniques have contributed to an unprecedented growth of available spatial data at geographically distributed locations. This has created a strong motivation for the efficient sharing of such data. While peer-to-peer systems becomes an important approach of massively distributed systems not only for file transfers but also for searchable data network, in this thesis we study the methods of sharing geographically distributed data with P2P networks. By now, there are a number of P2P protocols proposed, but most of them are based on distributed hashing tables, such as CAN and Chord which support exact match only and have limited number of search predicates support. When we consider a set of peer nodes as a massively geographically distributed database, several types of search predicates should be provided in addition to exact match search. So in order to efficiently support spatial data sharing peer-to-peer application, we need to design new peer-to-peer systems that broaden the types of query processing, improve the performance and are of fault-tolerance.

 This thesis first presents the design and evaluation of GNet, an early work of exploring the possibility of geographical peer-to-peer protocol that targets supporting wide area location-based service. The GNet protocol uses hierarchical geographic address as the identifiers of peer nodes. By combining domain-progressive routing mechanism like plaxton mesh with geographical domain hierarchy, this protocol has the advantages of efficient routing, locality preserving, etc. It supports position-based and especially geographically scoped operations efficiently. Though implementation prerequisites limits its application area, analysis and evaluation results demonstrate its scalability, query efficiency and load balancing features, which makes it adaptable to certain applications.

 As the main contribution of this thesis, DHR-Trees peer-to-peer protocol is presented with its structure design, collaborative multidimensional query method, maintenance method and the cost analysis, and methods to strengthen fault-tolerance of structure and query execution under dynamic network environment. Essentially, DHR-Trees structure is the first peer-to-peer structure that has semi-independent R-Trees structure and supports region-based multidimensional search predicates, such as range queries and nearest neighbor queries as in R-Trees structure, while dealing with network dynamism efficiently as well.

 The thesis presents the structure details of DHR-Trees. Instead maintaining a global centralized R-Trees index, each peer owns a semi-independent partial region tree structure, which makes it possible to keep correctness of structure even under dynamic network changes. Each geographically distributed peer node is identified by its Hilbert value on a Hilbert space filling curve, by which the peer's two-dimensional geographical location is mapped to one-dimensional identifier. Peer nodes self-organize into a virtual ring topology, sorted by the identifiers. As the core part of the DHR-Trees' protocol, each peer maintains a routing table, which contains two principal parts: For routing purpose, it holds pointers to a number of nodes in the network; for supporting spatial query purpose, the region information of sub-trees in the DHR-Trees is contained.

 Spatial queries are executed in a distributed fashion by collaborative efforts among peers. DHR-Trees mainly provides three spatial query functions: point query, range query and nearest neighbor query. By exploiting region information in routing table, the spatial query evaluation results show that DHR-Trees can execute spatial queries much more efficiently than its competitor, the Squid P2P protocol. Furthermore, the nearest neighbor query, one of most important spatial queries which is unsupportable in Squid, can also be efficiently executed.

 DHR-Trees faces network churn problem as well as other P2P systems. To keep the system working properly while nodes join, leave, and fail on their own agenda, each peer node is required to maintain both the ring structure and routing table. To maintain ring structure, it uses similar ring stabilization approach as in Chord protocol. For routing table maintaining, processes includes ping, stabilization, and notification process are run periodically or triggered by routing table change events. Our analysis and evaluation result shows that the overhead of updating routing tables when a new node joins or fails increases nearly logarithmically to the network size. This demonstrates the scalability of DHR-Trees peer-to-peer system.

 To improve the fault-tolerance on spatial query support, DHR-Trees proposes two approaches: entry successor list and adaptive bounding rectangle. By introducing successor lists to the entries in the routing table, robustness and resilience are greatly improved. Moreover, to eliminate the frequent updating requirements of the region information in harsh churn environment, we introduce the usage of adaptive bounding rectangle as the replacement of minimum bounding rectangle. This approach decreases the updating overhead and greatly improves the quality of query result under churn.

 Through this thesis, two new novel peer-to-peer protocols are provided. Both GNet and DHR-Trees are designed to be architectures for sharing geographically distributed spatial data. In particular, the DHR-Trees can not only index spatial data as in centralized R-Trees, but also be able to handle dynamism in the peer-to-peer network. We believe our approaches can help realization of certain distributed spatial data sharing applications. We hope our works will stimulate more research interest in both peer-to-peer structures and spatial data sharing applications.

審査要旨 要旨を表示する

 本論文は「A STUDY OF PEER-TO-PEER SYSTEMS FOR SPATIAL DATA SHARING(空間データ共有のためのピアツーピアシステムに関する研究)」と題し、ピアツーピアシステムを用いて地理的に分散的にデータを共有すると共に、効率的な空間クエリを行う手法について研究を行ったものであり、全八章から構成されている。

 第一章は「Introduction(序論)」と題し、本論文で狙いとするピアツーピアネットワークの現状について概観すると共に、空間クエリの手法、メインテナンスの容易性、フォルトトレランスとスケーラビリティ等の解決すべき課題について整理を行っている。

 第二章は「Back Ground(背景)」と題し、従来のP2Pシステムについて整理を行うと共に、その上で展開されるアプリケーションの分類を行うことによって従来手法の問題点を述べ、本研究の狙いを明確化している。

 第三章は「GNet: A Geographic Address-based P2P System(地理的アドレスに基づくGNet)」と題し、地理的空間を出来る限り、行政区画等の意味のある領域に階層的に分割しアドレスを割り当てることにより、位置情報サービスとの親和性の高いP2PシステムであるGnetを提案している。Gnetは、最小ホップ数がDHTに比べて少なくルーティングのコストが小さいという特長を有するため、均一的なノード構成となり負荷分散が図られるような状況においては有効性のある手法であることを、シミュレーションにより明らかにしている。

 第四章は「DHR-Trees P2P System(DHR-Treeピアツーピアシステム)」と題し、ヒルベルトR-ツリーを応用したP2PシステムであるDHR-Tree (Distributed Hilbert R-Treeの提案を行っている。DHR-Treeは、各ピアが近隣のノードに関するルーティングテーブルを保持し、またこのテーブルが部分ヒルベルトR-ツリーとなっている所に特長がある。また、このような構成にすることによりデータに空間的偏りがあった場合でも、空間的偏りのない場合に比べて、ルート長の増加を5%以内に抑えることが可能なことを示している。

 第五章はMultidimensional Queries Support in DHR-Trees(DHR-Treeにおける多次元空間クエリ)」と題し、第四章で提案したDHR-Treeにおいてレンジクエリや近傍クエリを行う基本的な手法について述べると共に、シミュレーションによりその性能評価を行いその有効性を示している。

 第六章は「Maintenance in DHR -Trees(DHR-Treeのメインテナンス)」と題し、新たなノードがジョインした場合のメインテナンス手法を述べると共に、そのコストを定量的に解析した上で、提案システムが極めて大規模のノード数に対してもスケーラビリティを保つ優れたシステムであることを示している。

 第七章は「Improving Fault-Tolerance in DHR-Trees(DHR-Treeの故障耐性)」と題し、ピアが故障した場合においても、Adaptive Bounding Rctangleと呼ばれる新しい概念を導入することによりクエリコストの増加を最小限に抑える手法を提案し、DHR-Treeシステムが、故障の起こりえる現実的な環境においても有効に機能することを示している。

 第八章は「Conclusion and Future work(結論と今後の課題)」であり、論文の成果と、今後の展開をまとめている。

 以上これを要するに、本論文はGnet及び、Hilbert R-Treeを応用したピアツーピアシステムであるDHR-Treeを提案すると共に、DHR-Treeにおけるクエリの手法、メインテナンスコスト、故障耐性について分析を行い、DHR-Treeがスケーラビリティーと故障耐性をもち空間クエリに適応した優れたシステムであることを解明したものであって、電子情報学に貢献するところが少なくない。よって本論文は博士(情報理工学)の学位論文として合格と認められる。

UTokyo Repositoryリンク http://hdl.handle.net/2261/25866