学位論文要旨



No 129640
著者(漢字) 吉田,雅裕
著者(英字)
著者(カナ) ヨシダ,マサヒロ
標題(和) P2Pネットワーク測定技術と制御技術に関する研究
標題(洋) P2P Network Measurement and Management Techniques
報告番号 129640
報告番号 甲29640
学位授与日 2013.03.25
学位種別 課程博士
学位種類 博士(学際情報学)
学位記番号 博学情第62号
研究科 学際情報学府
専攻 学際情報学
論文審査委員 主査: 東京大学 准教授 中尾,彰宏
 東京大学 教授 坂村,健
 東京大学 教授 越塚,登
 東京大学 教授 暦本,純一
 東京大学 教授 清水,謙多郎
内容要旨 要旨を表示する

現在のインターネットにおけるサービス提供手段の一つとして,P2P 技術を用いたネットワーク構成方式が世界中で広く普及している.この「P2P ネットワーク」は各ユーザのPC を直接的に相互接続することで構築され,各ユーザはサービスを受けると同時に自分自身が保持する資源(ネットワーク回線,CPU,HDD など)を他のユーザに提供する.そのため,従来のクライアント・サーバー型のインターネットサービスと比較して,コスト面に優れ高い拡張性を持つ.このP2P ネットワークを用いたサービスとしては,Skype に代表されるVoIP サービス,PeerCast に代表されるP2P 動画ストリーミング,BitTorrent に代表されるP2P ファイル共有ネットワークなどが普及している.本論文では,「P2P ファイル共有ネットワーク」を対象とした測定技術と制御技術に関する研究成果を述べる.

P2P ファイル共有ネットワークでは,ユーザのPC をピア(クライアント)と呼び,各ピアが保有しているファイルを検索しダウンロードすることができる.あるファイルを検索しているピアが目的のファイルをP2P ファイル共有ネットワーク上で検索できた際は,ファイル検索ピアとファイル保持ピアの2 点間を直接的に接続しファイル交換が行われる.サイズの大きなファイルは「Chunk」と呼ばれる小さな部分データ単位で分割され交換されるため,複数のピアからChunk を同時並行的にダウンロードすることが可能である.さらに,ファイル全体のダウンロードが完了しない場合でも,既にダウンロード済みのChunkは他のピアにアップロードすることが可能である.これらの特徴的なファイル転送プロトコルにより,短時間で多くのピアにサイズの大きなファイルを配布することができ,ファイル転送効率に非常に優れるという特徴がある.特に近年では,P2P ファイル共有ネットワークが世界中で広く普及し,頻繁にサイズの大きなファイルの交換に利用されるようになったため,現在のインターネットにおける全体の通信量の大きな割合を占めるなど社会的なインパクトも大きい.

P2P ファイル共有ネットワークの普及に伴い,その研究も盛んに行われるようになった.研究対象のP2P ファイル共有ネットワークとしては,測定方式と制御方式の研究がある.P2P ネットワークの「測定」とは,世界中に分布したピアが持つアプリケーション層の情報を,ある一地点から収集しP2P ネットワーク全体の特性を推定する方式である.しかし,P2P ネットワークの測定には,(課題1)測定のために大量の資源が必要であること,(課題2)接続拒否端末と呼ばれる測定不可能なピアが多数存在すること,という2 つの課題がある.また,現在のP2P ファイル共有ネットワークには流通ファイルを「制御」する機能が備わっていないため,様々な課題がP2P ファイル共有ネットワーク上で起こっている.その一つが(課題3)非効率な長距離通信の発生である.また,P2P ファイル共有ネットワークでは,(課題4)一度流通を始めたファイルをネットワーク上から削除することができず,著作権侵害ファイルや個人情報ファイルなどの流通が問題となっている.本論文では,これらの課題1 から課題4 のそれぞれを解決するために,5 種類の提案方式を提案しその性能評価を行った.本論文で取り上げた4 つの課題を解決するためには技術的なアプローチだけでなく,法律,経済,倫理などの様々な視点が必要となる場合がある.しかし,本論文では技術的な方式の開発のみを研究対象としており,その他のアプローチとの組み合わせなどは本論文の対象外である.

本研究のオリジナリティ(Thesis Statement)は,以下の2 つである.第一に,本論文の全ての提案方式は,現在のP2P ファイル共有ネットワークのソフトウェアやプロトコルを全く変更せずに適用できるという点である.現在普及しているP2P ファイル共有ネットワークはネットワーク管理者が存在せず,プロトコルやソフトウェアの変更もP2P ネットワーク開発者のみにしか権限が無い.そのため,第三者が何らかの機能をP2P ファイル共有ネットワークに追加することは難しく,現在のP2P ファイル共有ネットワークの課題を解決する上で大きな障害であった.しかし,本論文の提案方式は,ソフトウェアやプロトコルに透過的でありそのまま直接的に適用することができるため,実効性や有効性の高い方式となる.第二のオリジナリティは,本論文の全ての提案方式が大規模な資源(ネットワーク回線,CPU,HDD など)を必要とせず,ユーザレベルで用意可能な資源(具体的には100Mbps の回線,1 台のPC)で提案方式を適用できる点である.P2P ファイル共有ネットワークには,国や年齢層の異なる様々なユーザが参加しているため,流通ファイルに対してどのような制御を行いたいかという要望はユーザごとに異なる.さらに,P2P ファイル共有ネットワークを制御する場合は,誰がどのような立場で制御するかという議論もあり,制御方式を実運用する上で問題となりうる.しかし,本論文の提案方式は,ユーザレベルで用意可能な資源のみで適用可能とすることで,各ユーザにP2P ファイル共有ネットワークの自立的な制御を可能とする方式を提供できる.

P2P ファイル共有ネットワークの測定における(課題1)の解決のために,「RE 方式」と呼ばれる提案方式を開発した.対象のP2P ネットワークは世界で最も普及しているP2Pファイル共有ネットワークの1 つである「BitTorrent」ネットワークを選択した.BitTorrentネットワークは数百万種類の「Swarm」と呼ばれる小ネットワークに分割され,数百万台のピアが複数のSwarm に同時に参加する形状となっている.そのため,BitTorrent ネットワーク全体を測定するために多くの資源(PC,回線帯域など)が必要であり,BitTorrent ネットワークの全容もこれまでに十分に明らかにされていなかった.そこでRE 方式では,1台のPCを利用して効率的にBitTorrent ネットワーク全体を測定可能とする.RE方式では,BitTorrent ネットワーク上の冗長な情報を取得しないようにすることで,BitTorrent ネットワークの測定でクローラ(測定端末)が消費する資源を節約する.さらに,BitTorrentプロトコルに備わったScrape-ALL クエリやIOCP ソケットなどの実装方式を有効に利用することで,高速な測定を実現する.最終的に,RE 方式では430 万種類のユニークな.torrent ファイルと48,000 種類のユニークなトラッカーアドレスを収集でき,1 日の計測で24 個のスナップショットと1,000 万のユニークピアの測定に成功した.

P2P ファイル共有ネットワークの測定における(課題2)の解決のために,「BR 方式」と呼ばれる提案方式を開発した.対象のP2P ネットワークは「BitTorrent」ネットワークを選択した.BitTorrent における分割された小ネットワークであるSwarm には,多数の到達不可能ピア(NAT ピア,FW ピア,離脱ピア)が存在する.クローラは各ピアと直接接続し測定する必要があるが,到達不可能ピアとクローラは接続を確立できず測定ができない.この到達不可能ピアの影響により,これまでのBitTorrent 測定ではネットワークの一部分に限定した測定が行われており,BitTorrent の全容も十分に明らかできなかった.そこでBR方式では,測定用クローラのアドレスTracker サーバを介して到達不可能ピアに送信し,到達不可能ピアから測定用クローラに積極的に接続させることで測定精度を向上させる.評価実験の結果,BR 方式はユニークな接続可能ピアの台数が,従来方式と比較して126%向上することを示す.さらに, BR 方式は,接続可能ピアのアドレスを積極的に拡散することで,各ピアのダウンロード効率を従来方式と比較して66%向上できることを示す.

P2P ファイル共有ネットワークの測定における(課題3)の解決のために,「BPEX 方式」と呼ばれる提案方式を開発した.対象のP2P ネットワークは「BitTorrent」ネットワークを選択した.P2P ネットワークはオーバレイネットワークと呼ばれ,IP ネットワーク(物理ネットワーク)の上で論理的にネットワーク構造が構築される.しかし,現在のP2P プロトコルは,IP ネットワークにおける通信コスト(通信距離,AS ホップ数)が考慮されておらず,大量の「長距離AS 間通信」が発生する.その結果,ピアは長距離AS 間通信に伴うネットワーク遅延により,ファイルダウンロード速度の低下を強いられている.さらに,ISP(ユーザにインターネットサービスを提供する運営会社)では,P2P ファイル共有ネットワークによる長距離AS 間通信が大きな損失を生み出すため,P2P 通信を規制するという動きもある.そこでこの問題を解決するために,BitTorrent によって発生するP2P 通信の通信距離を短縮するBPEX 方式を開発した.BPEX 方式では,測定用端末が最適な隣接ピア情報をBitTorrent における「PEX」というプロトコルを利用して各ピアに送信し,P2P通信の通信距離を短縮する.評価実験の結果,BPEX 方式はダウンロード完了速度を,従来方式と比較して25%向上することを示す.さらに, BPEX 方式はP2P 通信の通信距離を,従来方式と比較して12%短縮できることを示す.

P2P ファイル共有ネットワークの測定における(課題4)の解決のために,「IP 方式」と呼ばれる提案方式を開発した.対象のP2P ネットワークは国内で最も普及しているP2P ファイル共有ネットワークの1 つである「Winny」ネットワークを選択した.現在のP2P ファイル共有ネットワークにはファイル流通制御機能が実装されておらず,著作権侵害ファイルやマルウェアなどの流通が問題である.そこでIP 方式では,インデックスポイズニングという手法をWinny ネットワークのファイル流通制御方式として応用しその性能評価を行った.IP 方式では,Winny ネットワークの本質であるファイル流通技術としての側面を否定することなく,なおかつ,著作権侵害ファイルの流通などの反社会的な利用のみを技術的に制限することを目標とする.キーと呼ばれる,ファイルのメタデータを利用するWinny のファイル流通プロトコルに着目し,ファイルのダウンロードに必要な特定のキーを,インデックスポイズニングを用いてネットワーク上から消去することによりファイル流通制御を実現した.評価実験の結果,IP 方式をWinny ネットワークに適用した場合は,Winny ピアが特定のファイルのキーを入手できる確率が,適用しない場合の0.005%まで低下することを示す.

P2P ファイル共有ネットワークの測定における(課題4)の解決のために,「CP 方式」と呼ばれる提案方式を開発した.対象のP2P ネットワークは国内で最も普及しているP2Pファイル共有ネットワークの1 つである「Share」ネットワークを選択した.Share ネットワークにおいても,他のP2P ファイル共有ネットワークと同様に著作権侵害ファイルやマルウェアなどの流通が問題となっている.そこでCP 方式では,コンテンツポイズニングと呼ばれる手法をShare ネットワークのファイル流通制御方式として応用しその性能評価を行った.CP 方式は,一つのファイルを複数のブロックに分割して転送するShare ネットワークに対して,ファイル転送中に偽装ブロックを混ぜて転送することでダウンロードしたファイルを不完全なものにする制御方式である.しかしながら,コンテンツポイズニングの従来の適用方式では,制御によってP2P トラヒックが著しく増加してしまうなど四つの解決すべき課題が存在する.そこでCP 方式は,これら四つの課題を解決したコンテンツポイズニングの改良方式として開発した.評価実験の結果,CP 方式をShare ネットワークに適用した場合は,Share ピアが特定のファイルを入手できる確率が,適用しない場合と比較して5%まで低下することを示す.また,CP 方式はP2P トラヒックの増加を,従来方式と比較して4%まで抑えられることを示す.

審査要旨 要旨を表示する

本論文は、現在のインターネットにおけるサービス提供手段の一つであるP2P技術を用いたネットワーク構成方式に対する測定技術と制御技術に関する研究成果をまとめたものである。

「P2Pネットワーク」は各ユーザのPCを直接的に相互接続することで構築され、各ユーザはサービスを受けると同時に自分自身が保持する資源(ネットワーク回線、CPU、HDDなど)を他のユーザに提供するため、従来のクライアント・サーバー型のインターネットサービスと比較して、コスト面に優れ高い拡張性を持つ。例えば、Skypeに代表されるVoIPサービス、PeerCastに代表されるP2P動画ストリーミング、BitTorrentに代表されるP2Pファイル共有ネットワークなどが普及している。P2Pファイル共有システムにおけるファイル転送プロトコルは、短時間で多くのピアにサイズの大きなファイルを配布することができ、ファイル転送効率に非常に優れるという特徴があるが、 近年では、P2Pファイル共有ネットワークが世界中で広く普及し、頻繁にサイズの大きなファイルの交換に利用されるようになったため、現在のインターネットにおける全体の通信量の大きな割合を占めるなど社会的なインパクトも大きい。

P2Pファイル共有ネットワークの普及に伴い、その測定や制御の研究も盛んに行われるようになっている。 P2Pネットワークの「測定」とは、世界中に分布したピアが持つアプリケーション層の情報を、ある地点から収集しP2Pネットワーク全体の特性を推定する方式である。従来のP2Pネットワークの測定には、(課題1)測定のために大量の資源が必要であること、(課題2)接続拒否端末と呼ばれる測定不可能なピアが多数存在すること、という2つの課題がある。また、現在のP2Pファイル共有ネットワークには流通ファイルを「制御」する機能が備わっていないため、様々な課題がP2Pファイル共有ネットワーク上で起こっている。その一つが(課題3)非効率な長距離通信の発生である。また、P2Pファイル共有ネットワークでは、(課題4)一度流通を始めたファイルをネットワーク上から削除することができず、著作権侵害ファイルや個人情報ファイルなどの流通が問題となっている。

本論文では、これらの課題1から課題4のそれぞれを解決するために、5種類(課題4に対しては2種類、それ以外は1種類)の提案方式を提案しその性能評価を行っている。これら 4つの課題を解決するためには技術的なアプローチだけでなく、法律、経済、倫理などの様々な視点が必要となる場合があるが、本論文では技術的な方式の開発のみを研究対象としており、その他のアプローチとの組み合わせなどは本論文の対象外である。

本研究の新規性は、 以下の2つに集約される。第一に、本論文の全ての提案方式は、現在のP2Pファイル共有ネットワークのソフトウェアやプロトコルを全く変更せずに適用できるという点である。現在普及しているP2Pファイル共有ネットワークはネットワーク管理者が存在せず、プロトコルやソフトウェアの変更もP2Pネットワーク開発者のみにしか権限が無い。そのため、第三者が何らかの機能をP2Pファイル共有ネットワークに追加することは難しく、現在のP2Pファイル共有ネットワークの課題を解決する上で大きな障害であった。しかし、本論文の提案方式は、ソフトウェアやプロトコルに透過的でありそのまま直接的に適用することができるため、実効性や有効性が高い。第二のオリジナリティは、本論文の全ての提案方式が大規模な資源(ネットワーク回線、CPU、HDDなど)を必要とせず、ユーザレベルで用意可能な資源(具体的には100Mbpsの回線、1台のPC)で提案方式を適用できる点である。P2Pファイル共有ネットワークには、国や年齢層の異なる様々なユーザが参加しているため、流通ファイルに対してどのような制御を行いたいかという要望はユーザごとに異なる。さらに、P2Pファイル共有ネットワークを制御する場合は、誰がどのような立場で制御するかという議論もあり、制御方式を実運用する上で問題となりうる。しかし、本論文の提案方式は、ユーザレベルで用意可能な資源のみで適用可能とすることで、各ユーザにP2Pファイル共有ネットワークの自立的な制御を可能とする方式を提供できるなどの利点がある。

審査会において、委員からは、実験や評価方法の明確化に不十分な点があることや、技術的なインテグレーションやビジネス化に関しての疑問や、本論文の成果のうち一般的な手法として世の中に汎用的に残る貢献部分の明確化などに荒削りな部分が残されているという指摘もあったが、質疑応答で十分な回答をすることができたため、総合的にみて本研究が博士号に値することについて審査委員全員が合意した。

よって、本審査委員会は、本論文が博士(学際情報学)の学位に相当するものと判断する。

UTokyo Repositoryリンク