学位論文要旨



No 212064
著者(漢字) 井澤,裕司
著者(英字)
著者(カナ) イザワ,ユウジ
標題(和) 画像の高能率符号化におけるDCTの応用に関する研究
標題(洋)
報告番号 212064
報告番号 乙12064
学位授与日 1995.01.26
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第12064号
研究科 工学系研究科
専攻 電気工学専攻
論文審査委員 主査: 東京大学 教授 羽鳥,光俊
 東京大学 教授 高木,幹雄
 東京大学 教授 原島,博
 東京大学 教授 坂内,正夫
 東京大学 教授 石塚,満
 東京大学 助教授 相澤,清晴
内容要旨

 画像を効率良く圧縮する符号化方式の国際標準には,DCT(離散コサイン変換)を用いたブロック符号化が採用されている.この方式の符号化効率は比較的高く,実現性でも優れている.しかしながら,画像をブロックに分割して処理するため,ブロック境界付近に特有の歪(ブロック歪)を生じ易い.この歪はランダム性の雑音に比べ目につき易く,画質劣化の最大の要因となっている.本論文はDCTとブロック歪の性質に基き,解像度の劣化を最小限に抑えながらこの歪を効率的に除去するとともに,符号化効率を向上させる手法についてまとめたものである.

 はじめに,本研究の基礎となるDCTの物理的イメージとその特性について検討した.その結果を要約すると,以下のようになる.

 DCTは,入力となる信号を鏡像を用いて周期が倍の偶関数を生成し,これをDFT(離散フーリエ変換)したときのコサイン(実部)の係数に等価である.したがってDCTでは,任意の入力信号に対し各周期の境界における連続性が保証されるため,変換係数に対する電力の集中度が高くなる.すなわち,DCTにおける偶関数化が,DFTをはじめとする他の直交変換より優れた符号化効率を示す基本的な理由と考えられる.

 次に,主に動画像符号化で用いられるシーケンシャル表示と,静止画像の検索等で有効なプログレッシブ表示(階層的符号化)について,ブロック歪が発生する要因を比較・検討した.その結果,シーケンシャル表示では量子化が粗い場合に,自然画像の統計的性質(隣接する画素間の相関が高い)と隣接するブロックの情報を用いて,ブロック歪を打ち消す成分をある程度予測できることが明らかになった.また,プログレッシブ表示についても,初期の階層(ステージ)で,同様の予測が可能であることが判明した.

 以上の検討結果に基づき,本論文の後半では,DCTの応用に関するいくつかの方式を提案した.

 はじめに,解像度が段階的に向上するプログレッシブ表示における応用として,画質と符号化効率を改善する方式(AC係数予測方式)を提案した.その方式とは,受信(復号)側において,階層の第1ステージで伝送されたDC(直流)係数を用いて未伝送のAC(交流)係数を予測する手法である.伝送されたDC係数と予測したAC係数を逆DCTすることにより,第1ステージのブロック歪を軽減することができる.具体的な予測手法として,(1)ブロック境界で滑らかに接続するようAC係数の値を代数方程式により求める係数操作法と,(2)DCTの変換係数に対応する画像が連続するコサインの曲面であることを利用したDCT補間フィルタ法について検討し,標準画像を用いたシミュレーション実験により,復号画像のブロック歪が除去ないしは軽減されることを確認した.さらに送信側にも,平均値分離形ブロック符号化(伝送すべきAC係数と予測したAC係数の差分を伝送する方式)を適用することにより,符号化効率が5〜8%改善されることが明らかになった.

 また,プログレッシブ表示(階層的符号化)におけるもうひとつの応用として,直流を含む複数の係数が伝送された第2ステージ以降のブロック歪を除去する手法について検討した.階層の第1ステージで用いたDCT補間フィルタ法を拡張し,一般的なコンボリューションによるフィルタ手法に比べ,少ない演算量で画質改善が図れることをシミュレーション実験により検証した.

 次に,シーケンシャル表示における応用として,復号画像の画質改善を図る適応フィルタ(帯域保存フィルタ)を提案し,その特性を評価した.この方式は,DCT係数が一種の空間周波数成分であることに着目し,伝送された有為な係数に対応する解像度成分を保存しながら,ブロック歪を効率的に除去する手法である.すなわち,2次元ウィンドウ関数(Hanning Windowを用いて各ブロックを包含する復号画像を切り出し,伝送されたDCT係数に対応する周波数成分を保存する帯域制限を行った後,この結果を加算して処理画像とする手法である.具体的な3つの帯域制限手法((1)DFT法,(2)DCT法,(3)近似手法)について,その画質やSN比,2次元パワースペクトル,演算量を比較・検討した.その結果,いずれの帯域制限を用いても,画像の解像度を保存しながらブロック歪を効率的に除去できることが明らかになった.なお,SN比の改善は0.4〜1.2dBであり,近似手法を用いることにより演算量をDFT法,DCT法の1/3以下に低減することができる.

 最後に,拡張DCTとしての応用として,DCTの問題点を解析し,これを改善する新たな手法(対称性DCT・DST方式)を提案した.DCTは画像の偶対称成分については理想的な変換となる.しかしながら,画像の奇対称成分についても偶関数化を行うため,境界付近の凹(凸)部により高調波成分が発生する可能性がある.一方,奇対称成分についてはサインの重ね合せ,すなわちDST(離散サイン変換)の方が高い符号化効率が得られる可能性がある.そこで,縦横2ブロック(計4ブロック)からなるマクロブロックを定義し,水平と垂直の2つの対称軸に関する偶対称成分と奇対称成分に分離し,それぞれDCTとDSTを適用する手法を検討した.この手法の符号化効率と画質,演算量について,従来のDCT法と比較・検討し,SN比が2.0〜0.5dB改善されることを確認した.

 このように,本論文では,DCTの応用に関するいくつかの方式を提案し,その特性について定性的・定量的な解析を行った.さらに標準画像を用いたシミュレーション実験により,画質と符号化効率が改善されることを実証した.

 以上述べた手法(最後の新手法を除く)は,国際標準を遵守しながら適用することが可能であり,一部は実用化されている.とくにAC係数予測方式は,静止画の標準化委員会(JPEG)でもその効果と実用性が評価され,国際標準のオプションに採用されている.

 本論文で提案した手法がさらに発展し,広範な広がりを示しつつある画像メディアの様々な領域で利用されることを期待するものである.

審査要旨

 本論文は「画像の高能率符号化におけるDCTの応用に関する研究」と題し,画像信号を効率良く圧縮する符号化方式として国際標準に採用されているDCT(離散コサイン変換)の性質を利用して,復号画像の特有の歪(ブロック歪)を除去するとともに,符号化効率を向上させる手法について論じたものであり,8章より成る.

 本論文の前半(第3章まで)では,本研究の背景と基礎となる部分について検討を行ない,後半(第4章以降)でDCTの応用に関するいくつかの方式を提案している.

 第1章は「序論」であり,本論文が対象とする画像の高能率符号化の概要を示し,その背景,目的および本研究の経過について述べている.

 第2章では,「DCTを用いたブロック符号化方式」と題し,画像符号化の標準となっているDCT方式を紹介し,その基本的な手法(フレーム内符号化/フレーム間符号化,シーケンシャル表示/プログレッシブ表示等)について解説している.さらに,画質劣化の最大の要因となっているブロック歪の性質を検討し,画像信号の統計的性質と隣接するブロックの情報を用いて,この歪を打ち消す成分を予測することにより,画質と符号化効率が改善できることを明らかにしている.

 第3章では,「DCTの基礎検討」と題し,DCTの物理的イメージとその性質について論じている.各周期の境界における連続性に着目して,DCTとDFT(離散フーリエ変換)を比較・検討し,DCTでは偶関数化により境界で滑らかに接続するため,DFTより優れた符号化効率が得られることを定性的・定量的に解説している.

 第4章では,「プログレッシブ表示における応用(1)」と題し,静止画の階層的符号化(解像度が段階的に向上する伝送手法)において,画質と符号化効率を改善する手法を提案している.この手法は,階層の第1ステージで伝送されたDC(直流)係数から未伝送のAC(交流)係数を予測する方式であり,具体的な2つの予測手法((1)係数操作法,(2)DCT補間フィルタ法)について,その特性を評価している.標準画像を用いたシミュレーション実験により,第1ステージのブロック歪が軽減ないしは除去されると同時に,送信側に平均値分離形ブロック符号化方式(伝送すべきAC係数と予測したAC係数の差分を伝送する手法)を適用することにより,符号化効率が改善されることを明らかにしている.

 第5章では,同じく「プログレッシブ表示における応用(2)」と題し,第4章で示したDCT補間フィルタ法を第2ステージ以降に拡張し,直流を含む複数の係数が伝送された階層のブロック歪を除去する手法と,その効果について述べている.

 第6章では,「シーケンシャル表示における応用」と題し,主として動画像符号化で用いられるシーケンシャル表示の画質改善を図るフィルタ手法を提案している.この方式は,DCT係数が特定の空間周波数成分に対応することに着目し,伝送された有為な係数に対応する解像度成分を保存しながら,ブロック歪を選択的に除去する手法である.3つの帯域制限手法((1)DFT法,(2)DCT法,(3)近似手法)について,その画質やSN比,パワースペクトル,演算量を比較・検討し,その有効性を明らかにしている.

 第7章では「拡張DCTとしての応用」と題して,DCTの問題点を解析し,これを改善する新たな方式を提案している.画像の奇対称成分はサインの重ね合せ,すなわちDST(離散サイン変換)の方が高い符号化効率が得られることに着目し,縦横2ブロック(計4ブロック)からなるマクロブロックについて,水平と垂直の2つの対称軸に関する偶対称成分と奇対称成分に分離し,それぞれDCTとDSTを適用する手法である.標準画像を用いて,符号化効率や画質,SN比,演算量について評価し,一般的なDCT方式に対する優位性を実証している.

 以上を要するに,本論文はDCTの性質を用いて,解像度の劣化を最小限に抑えながらブロック歪を選択的に除去する手法と,符号化効率を改善する手法について論じており,一部国際標準のオプションとして採用される等,電気通信工学上貢献するところが少なくない.

 よって本論文は博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク http://hdl.handle.net/2261/50919