内容要旨 | | 近年の光デバイスの発展によって,コンピュータの一部に光技術を取り込んだ高いパフォーマンスを持つ汎用処理システムの実現が現実的になってきた。このようなシステムを設計・評価するにあたっては,実現性だけではなく,システムの持つ特性を注意深く検討しなければならない。 そこで,本論文では,汎用のスマートピクセルと汎用性の高い再構成可能なスペースバリアント光インターコネクションを用いた処理システムを提案し,主に光インターコネクションの提供するネットワーク構造について,以下の観点から検証した。すなわち, (1)本システムがどのような問題を解くのに適しているか (2)本システムに効率的なアルゴリズムはどのようなものか (3)本システムのネットワークに適した光インターコネクションの光学系はどのようなものか という点である。 システム 図1が本論文で提案する処理システムである。 演算処理部には,スマートピクセルとも呼ばれる,光入出力を有する2次元メッシュ結合SIMD型計算機である光電子ハイブリッド並列処理システムを用いる。また,ネットワークには,再構成可能なスペースバリアント光インターコネクションを用いる。これは,クロスバ網に似た構造を持つが,1対多結合や,多対1結合が行なえる点,光インターコネクションの0次光を利用したプロセッシングエレメント(PE)の光出力の全OR回路を持つ点がクロスバ網と異なっており,ここでは,拡張クロスバと呼ぶことにする。 このシステムについて,すでに述べた3つの観点について検討した。 図1 拡張クロスバによるフィードバックを持つ光電子ハイブリッド並列処理システム(1)適した問題 スペースバリアントインターコネクションは,クロスバ網に似たネットワークを提供する。このネットワークは,リスト構造やグラフを表現するのに用いられるポインタ型のデータを表すのに適している。 そこで,主にポインタ型データを用いる代表的なアルゴリズムである動的置換問題について,システムのパフォーマンスを分析した。この問題は,全体の処理の中で,PE間の通信が占める割合が大きい。解析の結果,多くのPEを持つシステムでは,インターコネクションの光学系に用いられる空間光変調素子(SLM)が,5sから50sという充分高速とはいえないスイッチング時間を持たない場合にも,ハイパーキューブコンピュータに対し,より高速に動的置換問題を解けることが明らかになった。 (2)効率的なアルゴリズム 一般にハイパーキューブコンピュータなどのメッセージパッシング型のコンピュータでは,PE間の通信にかかるコストが大きく,アルゴリズムを構成する場合には,通信量を小さくする工夫に大きな労力が払われる。しかし,本システムでは,光インターコネクションを通して結合したPEからPEへの通信は,PEの数によらず一定であるので,その点を生かして,むしろ通信量の多いアルゴリズムを用いて処理の効率化が可能であると予想される。 そこで,実際にいくつか例題を選びアルゴリズムの構成を試みた。 主に検討した問題は,次の3つである。 ・連結成分問題 ・最短路問題 ・実時間ガーベッジコレクション これらの問題のアルゴリズムを考えることによって,以下のことが明らかになった。 まず,連結成分問題については,従来の2つの並列アルゴリズムを比較した。そして,一般にメッセージパッシングコンピュータでは,効率が良くないとされるアルゴリズムの方が,本システムにおいては,現実的な問題に対しては処理速度が速いことが分かった。 次に,最短経路問題について従来の方法とは異なったアルゴリズムを提案した。この問題に対する従来のアルゴリズムは,並列度が高くないなどの問題点があるが,今回提案したアルゴリズムは,並列度が高く,問題のサイズによらず各PEに必要なメモリの量が一定であるなどの特徴を持つ。このアルゴリズムは多くの通信を必要とするので,従来のメッセージパッシングコンピュータには適さず,本システムに特徴的なアルゴリズムと言える。ただし,アルゴリズムは局所演算を基本に構成されているので,最悪の処理速度は,問題のサイズに比例して線形に大きくなってしまう。しかし,いくつかのシミュレーションを通して,現実的な問題に対しては,それよりも少ない回数で収束することが明らかになった。 最後に,リスト構造などの記憶管理に用いられるガーベッジコレクションについて,実時間ガーベッジコレクションアルゴリズムを構成した。このアルゴリズムは,拡張クロスバの特徴である多対1結合を利用することによって,完全並列で一定時間の処理を実現している。SLMの切り替え速度が充分高速ではない場合にも処理速度が落ちないように検討してあり,シミュレーションを用いて,その効果を確認した。 (3)光学系の改良 従来のスペースバリアントインターコネクションの光学系は,インターコネクションの接続パターンを計算機ホログラムを用いて制御しているため,必要な接続パターンに対応する計算機ホログラムをあらかじめ設計しておかなければならない問題がある。 そこでまず,実現の容易なシフトインバリアント型の光インターコネクションに対して,フーリエ変換ホログラムを用いて接続パターンを制御することによって,オンデマンドに,つまり必要な接続パターンを必要な時に実現できる光インターコネクションを設計・試作した。しかし,この光学系は,オンデマンド化は行なるものの,SLMの書き込み側に参照光を必要とするなど,スペースバリアント光学系を実現するのに必要なアレイ化が難しい。 そこで次に,すでに述べたアルゴリズムなどは,高々1対2の結合しか用いていないことに注目して,一つのPEから同時には高々2つのPEにしか接続しないという制限を設けることによって,スペースバリアント型でオンデマンドに再構成が可能なインターコネクション光学系を開発し,原理確認のための実験を行なった。 図2,図3が,それぞれ光学系の全体とホログラム生成部分である。この光学系は,ファイバーアレイ対を2つ用いて2チャンネルの接続先を制御する。それぞれのファイバーアレイ対は,同時に2つのファイバーからコヒーレント光を射出することによって,SLM上に干渉縞を形成し,読み出し側の光を回折させる。 図2 フーリエ変換ホログラムを用いたスペースバリアントインターコネクション光学系全体図3 フーリエ変換ホログラムを用いたスペースバリアントインターコネクションのホログラム生成部分 ホログラムの分解能に注目して光学系を分析した結果,解像度50lp/mm,有効径26mmのSLMを各チャンネルに用いることで,最大PE数256(=16×16)のシステムに対応でき,さらに解像度200lp/mm,有効径37mmのSLMを用いることによって,最大PE数16384(=128×128)のシステムに対応できることが明らかになった。光学系が大きくなることが問題であるが,それは今後の課題である。 以上の原理を確認するための実験を行なった。今回は,ファイバーアレイ対の代わりにマイクロレンズアレイと固定マスクを組み合わせたものを用い,4×4のPEアレイを仮定して,1チャンネルの制御を確認した。 図4 実験結果。得られた出力像のうち,もっとも光軸に近い位置へのもの(a),もっとも光軸から遠い位置のもの(b),および得られた全出力像をエッジ抽出処理し,重ね合わせたもの(c) 図4がその結果である。図4(a),(b)は,得られた出力像のうち,もっとも光軸に近い位置のスポット(図4(a))と,もっとも光軸から遠い位置のスポット(図4(b))のものである。また図4(c)は,4×4の位置に対して得られた出力像をエッジ抽出処理し,重ね合わせて示してある。 この実験によって,オンデマンドに正しい位置へスポットを制御できることと,受光素子がおかれるべき位置同士でクロストークがないことが確認された。 まとめ 汎用のスマートピクセルと汎用性の高い再構成可能なスペースバリアント光インターコネクションを用いた処理システムを提案し,3つの観点から評価した。それによって,本システムで従来にないアルゴリズムが適していることが明らかになった。また,特に3つの観点を関連づけて評価することで,光学系の負担を軽減するネットワークに対する適当な制限を導くことができ,最終的にシステムに適した光学系を得ることができた。 |