学位論文要旨



No 217327
著者(漢字) 松葉,浩也
著者(英字)
著者(カナ) マツバ,ヒロヤ
標題(和) 計算機クラスタにおける高品質ネットワーク送信に関する研究
標題(洋) A STUDY OF HIGH-QUALITY NETWORK TRANSMISSION ON COMPUTER CLUSTERS
報告番号 217327
報告番号 乙17327
学位授与日 2010.03.12
学位種別 論文博士
学位種類 博士(情報理工学)
学位記番号 第17327号
研究科
専攻
論文審査委員 主査: 東京大学 教授 米澤,明憲
 東京大学 教授 平木,敬
 東京大学 准教授 須田,礼仁
 東京大学 准教授 田浦,健次朗
 筑波大学 教授 朴,泰祐
内容要旨 要旨を表示する

近年の計算機技術は単純化、大規模化、集中化の傾向にあり、コモディティーハードウェアを用いた汎用計算機を大量に導入することで多様なニーズに応えるデータセンター型の計算機資源提供方法が主流になりつつある。商業用のデータセンターのみならず大学や研究所などの大型計算機においても汎用部品から成るスーパーコンピュータの導入が進んでおり、その汎用性を活用すべく、各種サーバのホスティングやデスクトップコンピュータの代替機能などの科学技術計算用途以外の新たな利用方法が模索されている。

大勢の利用者が多様なアプリケーションを同時に実行する計算機センターにおいては、資源の平等かつ正確な分配は必須の機能である。特にネットワーク資源は多くの利用者が、ファイル転送、Webサービス、遠隔操作、グリッドコンピューティングなどの多様なデータを一本のアップリンクを共有して転送するため、それらを高速かつ正確な帯域で扱うことはサービス品質上重要である。

本論文では計算機センターのネットワーク資源について、特に計算機センターとセンター外部の計算機が通信を行う状況において、高速かつ正確な帯域での通信を実現する手法を提案する。ユーザーごとの正確な帯域割り当てはバックボーンへの接続ルーターで行う方法や、各サーバにおいて出力帯域制限を設ける手法が考えられるが、本論文ではその中間的な方法として「I/Oサーバ」と呼ばれるネットワーク出力専用のサーバの設置を提案しそのサーバにすべてのデータを集めて帯域制御を行う方法を提案する。この方式の利点は次の3点である。一点目は各サーバとI/Oサーバの間をクラスタ用高速インターコネクトで接続することにより、データ混雑によるパケットロスのない安定した通信が可能であること、二点目は各サーバとI/Oサーバ間にユーザーごとに独立したフローコントロールプロトコルを定義することにより、パケットロスのない帯域制御を他のユーザーの通信の影響を受けずに実現可能であること、三点目は複数のI/Oサーバにデータを分散して送信することにより、各サーバが持つイーサネットインタフェースの性能を越えるバンド幅での通信が可能になることである。

提案手法の実現手法として、ユーザーレベルライブラリによる方式とカーネルレベルの方式の双方を設計、実装する。前者の中心はICBCと呼ばれる通信ライブラリであり、複数のI/Oサーバを経由した通信を単純な送受信APIで提供する。後者の中心は分散ネットワークインタフェースと呼ばれるネットワークデバイスドライバであり、各サーバに導入されたソフトウェアデバイスドライバが送信データをI/Oサーバに転送し、I/Oサーバは流量制限を適用しつつ、それらをインターネットに送信する。また、SFCPと呼ばれる各サーバとI/Oサーバ間の通信プロトコルも提案し、送信過多によるパケット廃棄を防止することで安定した通信を実現する。

提案手法の評価として、並列アプリケーションを用いた複数並列計算機間のグリッドコンピューティング性能、ファイル転送を想定した大量データ転送性能、およびWebサーバとしての計算機センター利用を想定したHTTPトラフィック転送性能を、最大使用可能帯域を設定した状態で測定する。測定の結果、通信の両端の計算機間で単純にTCP接続を確立する既存の手法と比較して、並列アプリケーション性能で最大25%、ファイル転送性能で5.4倍、HTTPトラフィックで5.3%の性能向上が確認された。また、ベンチマーク中のネットワークトラフィックの解析により、バックボーンネットワークは与えられた帯域を越えることなく、かつ上限に近い帯域で使用されていることが確認された。

提案した手法は、高速インターコネクションが使用できる計算機センターにおいて外部との通信に求められる機能、性能として必要十分であり、汎用ハードウェアと新規ソフトウェアのみによる汎用的な技術である。

審査要旨 要旨を表示する

近年の計算機環境は、並列数値計算からオフィスアプリケーションに至る様々な種類のアプリケーションが同一アーキテクチャをもつ計算機上で実行される傾向にある。これに伴い、同種の計算機を多数配置した計算機クラスタを、様々な用途に応じてクラスタ内部を切り分けて利用する形態が一般化しつつある。このような計算機クラスタでは、同時のクラスタを使う利用者間の公平な計算資源の配分が重要視されている。ところがクラスタとクラスタ外部を接続するネットワーク資源に関しては、その最適利用のために、各利用者の利用可能帯域を正確に設定しつつ、設定された帯域内で可能な限り高速で安定した通信を実現するような重要であるが、その有効な方式が確立されていない。

以上のような背景のもので、本論文では安定かつ正確な帯域でのクラスタからのネットワーク送信を目指して二つの方法を提案している。ひとつはI/O Server Aggregationと呼ぶ方法であり、本方式では外部との通信を中継するI/O専用ノードの数を調整することで帯域制御を実現する。もうひとつはDistributed Network Interfaceと呼ばれる方法であり、I/Oサーバに帯域を絞った仮想ネットワークインタフェースを準備し、それを各計算専用ノードから利用するために利用者毎の独立したフロー制御を実現することのできる新たな通信プロトコルを用いる。本研究ではこれらの提案手法を代表的な通信パターンを模したベンチマークを用いて評価し、いずれの通信方法でも設定帯域を上回ることのない正確な帯域制御を実現し、既存手法の最大5.4倍となる高い性能を得ている。

本論文の第1章では、クラスタからクラスタ外部への通信において一般的に高い性能を実現することだけでなく、各利用者が期待または設定した帯域が確実に得られることの重要性を指摘し、その実現のために提案する二つの方法、I/O Server AggregationとDistributed Network Interfaceについての概要を紹介している。

第2章では、現在のクラスタアーキテクチャの紹介を行った後、クラスタから外部への通信について、その代表的な通信パターンとして、ファイル転送、クラスタ間並列計算のための通信、およびHTTPの応答通信を挙げている。これらの通信において安定かつ帯域保証された通信を実現するための問題として、TCPの性質による性能ロスとクラスタの各ノードが持つ外部通信用機器の性能限界を指摘している。

第3章では、本研究で提案する手法の土台として、外部との通信を中継する「I/Oサーバ」と呼ばれるノードを導入する手法を紹介している。その上でI/Oサーバの数によって、クラスタからの総送信帯域の上限を規定する基本アイディアを提案している。また、提案手法の実現方法としてユーザーレベルの通信ライブラリを導入する場合とオペレーティングシステムカーネルに新たなドライバを組み込む場合の利害得失を議論し、双方のアプローチをもちいることを結論としている。

第4章では、ユーザーレベル通信ライブラリとして効率的かつ帯域保証された通信を実現する方法としてI/O Server Aggregationを提案している。 提案方法ではI/Oサーバの数に上限を与えることで送信バンド幅の上限を定める。一方、各ノードが持つ外部通信用機器では性能が不足するため、クラスタ内部向け高速インターコネクトを用いて単一メッセージを分割して複数のI/Oサーバに転送し、並列にI/Oサーバを用いることで広帯域通信を行う。

第5章では、安定かつ正確な帯域でのクラスタからのネットワーク送信を目指して二つ目の方法として、カーネルレベルでの目標実現手段として、Distributed Network Interfaceと呼ばれる方法を提案している。本方法では物理ネットワークインタフェースを時分割により帯域を絞った上で各ノードと接続し、帯域調整された送信を実現する。特定の利用者がI/Oサーバに大量にデータを送信して他の利用者の通信を阻害することがないよう、新たなフロー制御プロトコルを提案し利用者毎の独立したフロー制御を提供している。

第6章では、本論文で提案した二方法を評価するために、バンド幅、MPI並列計算、HTTPサーバの各種ベンチマークで性能評価を行っている。既存手法と比較して、バンド幅測定では最大5.4倍、並列計算では最大125%、HTTPでは109%の性能を記録している。またいずれの場合においても指定帯域を超えないことを確認しており、提案方法が高い性能と帯域保証を両立させていることを示している。

第7章では、データセンター用の最新機器、性能向上のための通信プロキシ手法、Ethernet上の特殊用途プロトコル、並列計算機用オペレーティングシステムおよび通信ライブラリなどの関連研究として紹介し、本研究で提案した手法との差異を議論している。

最終章(第8章)では、提案した二手法のまとめと残された課題について触れている。

以上まとめると、本論文では、クラスタ型計算機から安定かつ正確な帯域を保ちながらネットワーク送信するための二つ方法が提案されている。 どちらの手法も初めて提案されたもので、その有効性が評価結果で確認されており実用性と学術性が高い。よって本論文は博士(情報理工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク