学位論文要旨



No 213772
著者(漢字) 望月,孝志
著者(英字)
著者(カナ) モチヅキ,タカシ
標題(和) 直交変換での信号処理の解析と画像符号化への応用に関する研究
標題(洋)
報告番号 213772
報告番号 乙13772
学位授与日 1998.03.16
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第13772号
研究科 工学系研究科
専攻 電気工学専攻
論文審査委員 主査: 東京大学 教授 羽鳥,光俊
 東京大学 教授 今井,秀樹
 東京大学 教授 青山,友紀
 東京大学 教授 原島,博
 東京大学 教授 坂内,正夫
 東京大学 助教授 相澤,清晴
内容要旨

 本論文では,直交変換での信号処理を解析し,画像符号化への応用を検討した。1990年以降,動画/静止画あるいは用途に応じて,いくつかの画像符号化方式が標準化されている。これらの標準化方式のうち,諧調数のある自然画像を扱うものはいずれも離散コサイン変換(DCT)を採用している。DCTは直交変換の一手法であり,信号を周波数成分に分解する。本論文では,DCTも含めた3種類の直交変換について次の3項目を検討した。

 ・DCT逆変換での有限語長演算による演算誤差の解析と演算誤差推定式の導出。推定式を利用した演算誤差低減策の考察。

 ・変形離散コサイン変換(MDCT)でのブロックサイズ可変時の信号復元条件の導出。MDCT適応ブロックサイズ画像符号化の実現方法と符号化特性改善策の検討。

 ・アダマール変換での変換係数ビットパターンの相互関係の解明。相互関係を利用した効率的な可逆符号化の実現。

 この3項目はそれぞれ,動画像符号化標準化方式での処理方式設計時の指標の提供,高圧縮率領域での画質改善,可逆符号化の圧縮率改善とプログレッシブ機能の提供を目的としたものである。主要な成果は以下のとおりである。

DCT逆変換の演算誤差

 2次元8×8次のDCT逆変換(IDCT)について,有限語長演算による演算誤差の推定式を導出した。DCTを用いた画像符号化では,圧縮データの復元にIDCTが必要である。動画像符号化ではIDCTの演算精度が画質に大きく影響するため,動画像符号化の国際規格ではIDCTの演算誤差許容範囲を定めている。本論文で導出したIDCT演算誤差推定式は,国際規格として定められたIDCT演算誤差評価方法に準じている。IDCT演算誤差についての従来の検討では,国際規格の演算誤差評価方法の評価結果は推定できない。

 本論文では演算誤差推定式の導出に際して,従来考慮されていなかったIDCT最終段での整数化丸め処理の非線形性を考慮した。この非線形性を考慮することで,国際規格に規定された演算誤差評価方法での評価結果を正確に推定できるようになる。推定式を導出することで,IDCT実現方式設計時の指標として利用できる。行列演算によりIDCTを実現する場合について推定式の検証をしたところ,統計的ばらつきを考慮した95%信頼区間内に測定値をほぼ推定できていた。

 導出した演算誤差推定式をもとに演算誤差を解析した結果,IDCT最終段での整数化丸め処理の特性が重要であることがわかった。最終段での丸めを工夫するだけで,必要な演算精度が2ビット少なくて済む。近年,汎用プロセッサにおいて画像信号処理用に16ビット並列演算命令が強化されているが,16ビット演算でIDCTの演算誤差規定を満たすためには,最終段の丸めだけでなく途中の処理にも工夫が必要である。

MDCT適応ブロックサイズ符号化

 MDCTはブロックが重なり合う変換手法であり,本論文では可変ブロックサイズ時の信号復元条件を示し,画像符号化への応用について検討した。DCTを用いた画像符号化では,変換ブロックの境界で復号信号が不連続になり,圧縮率が大きいときに画質劣化の要因となる。ブロックが重なり合う変換を用いることで,ブロック境界での信号の不連続を軽減できる。さらにブロックサイズを可変とすることで,ブロック内に生ずる符号化雑音を軽減でき,圧縮率の改善も期待できる。画像符号化に対してブロックが重なり合う変換手法で,かつ可変ブロックサイズの符号化を検討したのは筆者が最初である。

 可変ブロックサイズMDCTの信号復元条件は,変換式に含まれる窓関数の制約条件に帰着される。大きさの異なるブロックが接する部分では,大きいブロックの窓関数は外側が0になり,隣接ブロックの中心線を越える重なりは実質的には生じない。画像符号化への応用ではブロックサイズのほかに窓関数にも選択の自由度があり、方式設計時の鍵となる。

 MDCT適応ブロックサイズ符号化で実現が最も容易なのは,最小のブロックサイズを決め,それに合わせてブロックサイズごとに窓関数を設定する方式である。この窓関数固定方式では信号の完全復元は保証される半面,変換係数の量子化が粗くなるとサイズの大きいブロックに格子状の歪が生じてしまう。格子状の歪は窓関数を適応化することで解決できる。画像信号のような2次元信号においては,窓関数を適応的に変えると信号が完全に復元されない場合が生ずるが,変換係数の量子化が粗ければ復元が不完全であることは問題にならない。窓関数までも適応としたMDCT適応ブロックサイズ符号化をDCT符号化と比較すると,急激な信号変化を多く含む画像を除くと,同程度の符号化特性であった。画質の点では,ブロック内の符号化雑音(モスキート雑音)の及ぶ範囲は広いが,信号の滑らかな部分ではタイル状の歪が減り好ましく感じられた。

アダマール変換可逆符号化

 8×8次アダマール変換の変換係数についてビットパターンの相互関係を明らかにし,それを利用した高能率な可逆符号化方式を提案した。DCTを用いて可逆符号化を実現するには,変換係数に入力信号より広いダイナミックレンジが必要であり圧縮率は期待できない。しかしながら,変換符号化により可逆符号化が実現できれば,画像の細部を順次追加し,最終的には無歪となるプログレッシブ符号化を実現できる。本論文ではアダマール変換を用いて,可逆でありながら高能率な符号化を達成した。

 アダマール変換の変換係数のビットパターンを解析した結果,各ブロックにおいて変換係数の下位6ビットのうち半数は不要であることがわかった。すなわち半数のビットから,下位3ビット目以下についてはそれぞれのビット平面内で排他的論理和を計算することで,下位4ビット目以上については変換係数の和を計算することで残りのビットを復元できる。

 導出したビットパターンの関係を可逆符号化に応用するに際しては,冗長ビットを削除した変換係数の下位6ビットについて,変換係数あたり3ビット均一に配分し直し,上位ビットに付けて符号化する方式を提案した。符号化側での冗長ビットの削除と保存ビットの再配置,また復号側での保存ビットをもとの位置に戻す操作と冗長ビットの復元は,それぞれ一括して処理できる。これは2次元8×8次の変換についてビットパターンの関係式を利用することにより可能となるもので,従来から知られている2次の関係式を繰り返し適用したのでは導出できない。

 提案方式の圧縮率は,静止画可逆符号化の標準方式であるJPEG可逆符号化方式と同程度であった。但し,画素レベルの予測誤差を変換符号化する構成ならば,JPEG可逆符号化方式より1.2〜8.2%符号量を低減できた。提案方式はプログレッシブ符号化が可能で,これはJPEG可逆符号化方式では実現できない。符号化特性を従来のDCT方式と比べると,符号化する変換係数が少ない間は符号化誤差が大きいが,可逆符号化に必要な符号量は2/3で済む。符号化する変換係数が少ない間の符号化誤差は,変換係数の予測を適用することで改善できる。

審査要旨

 本論文は「直交変換での信号処理の解析と画像符号化への応用に関する研究」と題し、近年要求が高まっている画像データの効率的な蓄積・伝送を目的として、直交変換での信号処理を解析し、それを応用した高能率な画像符号化方式の実現を論じたものであって、5章からなる。

 第1章は「緒論」であって、本研究の背景、必要性、目的および概要について述べている。すなわち、本研究の目的は、近年の画像符号化国際標準方式で採用されている直交変換DCTに対して、画質劣化を防ぐためのDCT演算誤差の低減策、DCTに比べ主観的な符号化歪を低減できる直交変換MDCTによる符号化方式の開発、および直交変換を用いた高能率な可逆符号化方式の開発の3点であることを述べている。また、上記3点に関連する従来の研究を概観して、本研究の位置付けを明らかにするとともに、論文の構成を説明している。

 第2章は「DCT逆変換の演算誤差」と題し、動画像符号化で問題となるDCT逆変換の演算誤差を解析し、演算誤差の低減策について論じている。近年の動画像符号化の国際標準方式では、画質劣化の予防策としてDCT逆変換の演算誤差について評価方法と許容範囲が定められており、本論文ではその評価方法に即した演算誤差推定式を導出している。論文では推定式の検証を行うとともに、推定式を用いた解析により、DCT逆変換の最終段で行う整数化丸め処理の特性が重要であることを明らかにしている。

 第3章は「MDCT適応ブロックサイズ符号化」と題し、DCTを用いた画像符号化で問題となる符号化歪の対策として、変換ブロックがオーバラップする直交変換MDCTを用い、かつブロックサイズを可変とした画像符号化方式について論じている。符号化方式を論じるに先立って、可変ブロックサイズMDCTでの信号復元条件を数学的に導出し、MDCTの変換式に含まれる窓関数の制約条件に帰着されことを示している。可変ブロックサイズ符号化ではブロックサイズと窓関数を2次元で調整しなければならない。本論文では窓関数をブロックサイズに応じて固定的に割り付ける場合と、隣接ブロックのサイズに応じて適応的に選択する場合について、実現時の問題点と画質の優劣を論じている。

 第4章は「アダマール変換可逆符号化」と題し、アダマール変換を用いた高能率な可逆符号化方式を論じている。DCTで可逆変換を実現する場合には十分な圧縮率は達成できないが、本論文ではアダマール変換での変換係数ビットパターンの相互関係を解析し、それを応用することで高い圧縮率を実現している。提案方式により可逆でかつプログレッシブな符号化が可能となる。本論文ではさらに変換係数の予測などの符号化特性の改善策も示している。

 第5章は「結論」であって、本論文をまとめている。

 以上、これを要するに本論文は、3種類の直交変換について信号処理を解析し、解析結果を応用した高能率な画像符号化方式の提案および実現方法に関する一連の研究をまとめたものであって、電気工学上貢献するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク