学位論文要旨



No 119622
著者(漢字) 杉田,馨
著者(英字)
著者(カナ) スギタ,カオル
標題(和) プログラム可能なグラフィックスプロセッサを用いた高速画像処理環境の研究
標題(洋)
報告番号 119622
報告番号 甲19622
学位授与日 2004.09.16
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第27号
研究科 情報理工学系研究科
専攻 電子情報学専攻
論文審査委員 主査: 東京大学 教授 原島,博
 東京大学 教授 池内,克史
 東京大学 教授 坂井,修一
 東京大学 助教授 苗村,健
 東京大学 助教授 田浦,健次朗
 東京大学 助教授 上條,俊介
内容要旨 要旨を表示する

 次世代の映像メディアアプリケーションを構築するためには,カメラをはじめとする映像取得デバイスや,映像を提示するディスプレイデバイスの普及も重要であるが,それらの間に存在するバックエンドシステムにおいても高度な処理が必要となる.たとえば,映像メディアをキーとするユーザインターフェイスや,インタラクティブアプリケーションの構築のためには,入力された映像情報からイベントを抽出するといった処理や,画像の合成などの高度な処理を実時間で実行する必要がある.

 従来,このような特殊なアプリケーション分野に対しては,DSPやFPGAからなる画像処理に特化したハードウェアが開発され,利用されてきているが,これらのハードウェアは特定の用途を対象としたものであり,コストの高さが普及の障害となっている.現在は,一般的なパーソナルコンピュータに搭載されているCPUにも画像処理をはじめとするメディア情報処理を行うためのDSP回路が搭載され,さらにはプロセッサの処理速度の向上もあいまって一般家庭に普及しているパーソナルコンピュータでも高度な処理を行うことが可能となりつつある.

 パーソナルコンピュータの性能の発展において,近年特に注目されるのが,コンピュータグラフィックスの画像を生成するためのサブシステムである「グラフィックスハードウェア」の進展である.グラフィックスハードウェアには,グラフィックスプロセッサというコンピュータグラフィックスの画像生成に特化したプロセッサが搭載されているが,これらのプロセッサの集積化は「半導体の集積度は18ヶ月ごとに2倍になる」というムーアの法則を上回る勢いで進んでいる.また,グラフィックスハードウェア自体の小型化も進み,現在はパーソナルコンピュータの拡張カードとして安価に購入することが可能となっている.

 グラフィックスハードウェアの最も基本的な処理は,コンピュータグラフィックスにより描画されるシーンを構成しているポリゴンなどの多角形を高速に表示する,すなわち,画像を格納しているフレームメモリ上のポリゴンの領域を高速に塗りつぶすという処理である.近年では,一般的に用いられている計算モデルに従った頂点座標の演算や照明計算に特化された固定的なレンダリングパイプライン(画像の演算回路)だけではなく,アプリケーションが自由に処理内容を変更できる「プログラマブルシェーダ」と呼ばれるパイプラインを備えたグラフィックスハードウェアも登場している.プログラマブルシェーダは,アプリケーションが自由に処理内容を変更できるだけではなく,高度なモデルに基づく演算を実現するために浮動小数点精度の演算にも対応している.

 グラフィックスハードウェアのこれらの進展により,よりリアリティの高い演算モデルを利用したコンピュータグラフィックスの画像を高速に描画することが可能となった.また,グラフィックスハードウェアが本来持つ,多くのデータに対し同様の処理を高速に行うことができるという特性を利用し,数値計算などへの応用を試みる研究も行われ始めている.

 しかし,従来の研究では,本来汎用プロセッサとして用いられているCPUに対するグラフィックスハードウェアの性能の優位性が十分に検証されているとはいえない.また,グラフィックスハードウェアの演算の自由度が高くなったため,確かに任意の演算を実行することが可能となった.しかし,グラフィックスハードウェアは,本来コンピュータグラフィックスの画像を高速に生成する目的で開発されたものであるため,画像処理の演算に固有の演算機能を具備している.これらの機能を有効活用することで,より高速な画像処理の実行が可能であると考えられる.

 そこで,本論文では,グラフィックスハードウェアの実行性能の評価と画像処理への応用を行うことを主眼に,以下の内容について述べる.

・グラフィックスハードウェアを画像処理へ応用する手法

 グラフィックスハードウェアのさまざまな応用の中で,特に本論文の主題である画像処理への応用について,概要と具体的な実行方法について説明する.まず,グラフィックスライブラリMicrosoft DirectX 9を利用して,グラフィックスハードウェア上に画像処理アルゴリズムを実装する方法について述べる.次いで,アルゴリズムへ工夫を加えるとともに,グラフィックスハードウェアに固有の機能を利用することで,効率的に画像処理を実行する手法について,具体例を挙げて説明する.

・基本的な画像処理タスクについての,グラフィックスハードウェアとCPUの実行性能の測定と比較

 画像処理の基本である2次元画像のフィルタリング処理について,グラフィックスハードウェアATI社RADEON 9700 ProとIntel社Pentium 4 3.06GHz CPUそれぞれの上で同等の処理を行うプログラムを実行し,実行性能の測定を行った.測定の結果,線形フィルタに関しては,グラフィックスハードウェアがCPUに対しおよそ3から6倍高速であることが示された.しかし,最大値・最小値フィルタなどの非線形フィルタに関しては,グラフィックスハードウェアはCPUよりも約40%所要時間が長くなるということが明らかになった.また,CPUにはないグラフィックスハードウェア固有の機能である,テクスチャサンプラの双線形補間機能や,ラスタライザの線形補間機能を用いることで所要時間を大幅に削減できることが明らかになった.

・グラフィックスハードウェアを用いた実時間ステレオマッチングシステムの設計と実装

 グラフィックスハードウェアATI社RADEON 9700 Pro上に実装した線形フィルタ機能と,深度バッファを用いた最適化問題の解法を組み合わせて,ブロックマッチングによる全画素ステレオマッチングシステムの実装を行い,Intel社Pentium 4 3.06GHz CPU上の実装との実行性能の比較を行った.この結果グラフィックスハードウェア上の実装がCPU実装に比べておよそ2倍高速であることが明らかになった.あわせて,IEEE1394カメラを2台用いた実時間実写画像に対するステレオマッチングシステムの実装と実行性能の測定も行った.

・グラフィックスハードウェアを用いた合焦判定によるLight Fieldからの全焦点画像合成システムの設計と実装

 Light Field Renderingと呼ばれるレンダリング手法において全焦点画像を生成するアルゴリズムを,グラフィックスハードウェア上に実装した.この実装の要点は,従来のグラフィックスハードウェアでは実現が難しく,演算にCPUを用いていた処理を,完全にグラフィックスハードウェア上に実装することで,パーソナルコンピュータ内のデータ転送による処理遅延を削減したことである.実験では,グラフィックスハードウェアATI社RADEON 9800 Pro上の実装と,Intel社Pentium4 3.06GHz CPUを併用した実装という2種類のシナリオに対して,処理の各段階における所要時間を測定した.この結果グラフィックスハードウェアのみを用いた実装がCPUを併用した実装に比べて全体で約7.7倍高速であることが明らかになった.特に,データ転送による処理遅延の削減と,グラフィックスハードウェア上での演算の高速性が,処理速度の向上に大きく貢献した.

・グラフィックスハードウェアを用いた画像処理プラットフォームの提案と実装

 グラフィックスハードウェアに搭載されているプログラマブルシェーダや,グラフィックスライブラリが提供するアプリケーションプログラミングインターフェイスは,元来コンピュータグラフィックスの画像を生成するために設計されたものであり,本研究で述べる画像処理用途のために設計されたものではない.そのため,グラフィックスハードウェアの応用においては,目的となる画像処理アルゴリズムを,グラフィックスライブラリを用いたプログラムに書き換えるという作業が必要となり,開発者に負担を強いることになる.そこで,グラフィックスライブラリを意識することなく用いることが出来る画像処理プログラム記述言語を定義し,画像処理プログラムからグラフィックスライブラリを用いたプログラムに変換を行うプリプロセッサを中心とした画像処理プラットフォームを提案する.また,画像処理プラットフォームにおけるプリプロセッサについて初期的な実装内容とプリプロセッサの動作結果について述べる.

 論文の最後では,研究成果のまとめを行うともに,本論文で述べた各画像処理システムの課題と,画像処理プラットフォームの課題,さらに次世代グラフィックスハードウェアの予想をもとにした展望について述べる.

審査要旨 要旨を表示する

 本論文は,「プログラム可能なグラフィックスプロセッサを用いた高速画像処理環境の研究」と題し,近年技術的進展が著しい,パーソナルコンピュータ用のコンピュータグラフィックス(以下,CGと略す)画像生成サブシステムである「プログラム可能なグラフィックスプロセッサ(以下,GPUと略す)」の活用の試みとして,高速画像処理システムへの応用方法,実行性能の評価などについて体系的に論じたものであって,全体で7章からなる.

 第1章は「序論」であり,GPUのCG画像生成以外の分野への応用法が,従来は技法についての議論にとどまり,映像情報を用いたインタラクティブシステムを構築する上で必須である実行性能についての考察が不足していることを指摘し,本研究の対象領域を明確化することにより,本論文の背景と目的を明らかにしている.

 第2章は「グラフィックスハードウェアの進展と応用範囲の広がり」と題し,まず,GPUの機能面の発展と,GPUの発展に伴って実現可能となったCG表現技術の関係について論じている.また,GPUを用いたCG画像生成処理に関する研究の考察を通して,GPUがCG画像生成サブシステムから,プログラム可能で汎用性を持つ演算装置へと機能拡張されてきた背景について述べている.あわせて,CG画像生成処理以外へのGPUの応用について,近年の研究発表をもとにその傾向を論じている.

 第3章は「グラフィックスハードウェアの画像処理への応用」と題し,GPUを画像処理へ応用するための具体的な手法について論じている.GPUは,CPUにはないCG画像生成に特化された演算回路,メモリインターフェイスを有する.これらの機能を有効活用することで,CPUに比べて高速な画像処理が行えると考えられる.本章では,GPUに固有の演算機能と,それらを利用した効率的な画像処理アルゴリズムについて考察し,GPUを用いた高速画像処理システム設計のための指針を与えている.

 第4章は「グラフィックスハードウェアによる画像のフィルタリングとステレオマッチングの性能評価」と題し,GPUを画像処理システムの核として用いることの有効性を検証するために,画像処理における具体的な課題を与え,実験により実行性能の評価を行ったものである.すなわち本章では,画像のフィルタリングと,これを応用したステレオマッチングアルゴリズムをCPUとGPUにそれぞれ実装し,所要時間を測定するとともに,第3章で示したGPUにおける効率的な画像処理アルゴリズムの有効性について考察している.また,カメラシステムを用いた実時間実写画像に対するステレオマッチングシステムの実装と実験結果を示している.

 第5章は「グラフィックスハードウェアを用いた合焦判定によるLight Fieldからの全焦点画像合成」と題し,第4章での考察をもとに,GPUにより実現される高速画像処理システムを,「Light Field Renderingにおける全焦点画像生成処理」なる具体的な課題に適用した結果について述べている.すなわちこの処理を実現するために,GPUを用いた実装と,それに対する比較対象であるCPUを用いた実装からなる二通りのシステムを作成し,両実装の性能評価実験,および実験により得られた知見などについて述べている.

 第6章は「グラフィックスハードウェアを用いた画像処理プラットフォーム」と題し,第4章および第5章で行った画像処理システムの設計についての考察を通して,より容易に画像処理プログラムを作成する環境を提供することを目的とした画像処理プラットフォームについて提案している.画像処理プラットフォームの要素である画像処理プログラム記述言語の仕様と,実行システムであるプリプロセッサの設計および実装について示し,ベンダー提供のシステムや関連する他のプラットフォームとの差異について論じている.

 第7章は「結論」であり,本論文の主たる成果をまとめるとともに今後の課題と展望について述べている.

 以上を要するに,本論文は,パーソナルコンピュータ用のプログラム可能なグラフィックスプロセッサ(GPU)について,その実行性能の詳細な測定を通じて通常のCPUに対する有効性を評価するとともに,具体的にGPUを用いた画像処理システムの設計と実装を行い,さらにはそのプログラム環境の提案を行うなどして,GPUの活用と将来像について論じたものであって,電子情報学に貢献するところが少なくない.

 よって,本論文は博士(情報理工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク