学位論文要旨



No 213522
著者(漢字) 滝嶋,康弘
著者(英字)
著者(カナ) タキシマ,ヤスヒロ
標題(和) デジタル映像符号化における画質制御および高機能可変長符号に関する研究
標題(洋) A Study on Quality Control and High-Function Variable Length Codes in Digital Video Coding
報告番号 213522
報告番号 乙13522
学位授与日 1997.09.18
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第13522号
研究科 工学系研究科
専攻 電子工学専攻
論文審査委員 主査: 東京大学 教授 坂内,正夫
 東京大学 教授 羽鳥,光俊
 東京大学 教授 原島,博
 東京大学 教授 石塚,満
 東京大学 助教授 相澤,清晴
内容要旨

 映像は、近年のデジタル情報化時代においては、マルチメディアシステムの中核として必須の情報媒体である。しかし、映像はその情報量の多さから、伝送路や蓄積媒体などのパフォーマンス上の制約を受け、情報量を圧縮するための符号化を必要とする。一般に符号化では、映像信号の統計的性質や人間の視覚特性を利用した情報量削減が行われるが、その際に生じる符号化歪みや、冗長度の削減に伴う伝送誤り耐性の劣化などの問題点を内包している。そこで本論文では、符号化および伝送・蓄積における映像の画質改善を実現する方式に関して、2つの観点から研究した内容を報告する。

 第一のアプローチは、映像符号化における改善であり、符号化パラメータの最適制御により、符号化効率の改善や主観画質の向上を実現する。これらは符号化アルゴリズムに影響を与えないため標準方式との組合せが容易であり、接続性を確保しながら画質の向上が可能である。一方、第二のアプローチは、映像復号時の改善、すなわち伝送路や蓄積媒体上での誤りへの対策に関する改善であり、可変長符号(VLC)に特殊な機能を持たせることにより、誤り耐性の向上を図るものである。これらのVLCは、通常のVLCと比較して、符号化効率の低下は全くあるいはほとんどないことが特長である。

 第一のアプローチは、3種類の手法により実現される。まず、低レート符号化における最適フレームレートの決定法を提案する。低レート符号化ではフレームレートの間引きが不可避であるが、従来その値はフィードバックにより決定されていた。しかしその場合、動きの大きいシーンでは、発生情報量を抑制するためにフレームレートが低下し、主観画質を劣化させていた。そこで、信号階調の間引き(量子化)とバランスの取れた、フレームレート選択法が必要となっていた。提案方式は、フレームレートと量子化精度を同時に考慮し、画像性質を参照しながら最適フレームレートを決定する。固定フレームレートで1枚の符号化フレームの後にm枚の非符号化フレームが存在する場合、符号化フレームおよび非符号化フレームに生じる符号化歪みDc,Dnは、それぞれ式(1),(2)のように表される。

 

 

 ただしは符号化フレームと非符号化フレームの相関係数初期値、はその減衰定数である。総合歪みDaは式(3)で表され、符号化レートと画像性質より与えられる状況に応じて、2種類の場合が生じる。

 

 すなわち、十分高い符号化レートでは最大フレームレートが最適であるのに対し、一定の符号化レート以下では、最大値以下のフレームレートにおいて画質最適となることを定量的に示している。

 次に、適応帯域型プリフィルタによる符号化歪みの低減手法を提案する。円滑な動きを重視する映像アプリケーションでは、周波数領域での量子化のみを利用した情報量の圧縮を行うものがある。しかし、大幅な圧縮を行う場合の粗い量子化は、ブロック状の歪みや輪郭線付近のむら状の歪みなど、視覚上大きな劣化として観察される"artifact"を生じることが問題となる。これに対し、厳しいシーンにおいて符号化前の信号成分を削減することにより、artifactを軽減することが可能である。特に、高周波成分に対して鈍感な人間の視覚特性を考慮し、ローパスフィルタにより入力信号の高周波成分をカットする方式(プリフィルタ)が有効である。そこで、符号化画質とレートを、量子化精度(Q)とフィルタの通過帯域(k)の2つのパラメータにより適応的に決定する方式を提案する。これらのパラメータは、符号化状態、入力画像性質などを参照し、以下の連立方程式の解として求められる。

 

 

 これらにより例えば大幅なレート削減が必要な場合、量子化に過大に依存しないよう制御する。提案方式により符号化artifactが減少し、主観画質が向上することを計算機シミュレーションにより示す。

 さらに、ATMや蓄積メディアなどの可変レート(VBR)環境での符号化レート制御手法として、可変レート制御方式を提案する。VBRでは、入力画像の性質に応じて出力レートを可変にできるため、過度に厳しい情報圧縮やスタッフビットの挿入などが不要であり、固定レート符号化よりも高い符号化効率を持つという利点がある。しかしVBRにおいても、課金や蓄積メディア容量などの制約から、平均ビットレートが設定値に収束するよう、符号化制御を行う必要がある。そこで、短期的な変動を許容しながら、長期的にレートを制御する手法を提案する。長期的な平均レートの収束性のほか、近接フレームの画像性質を考慮した処理を行うこと、最適化操作を容易にするため制御パラメータが少ないこと、などを考慮して、式(6)のフィードバック制御を提案する。これは、符号化開始から直前の画像フレームまでの平均レートと目標レートの差分を、今後の数フレームで補正することを目標とし、直前フレームの出力レートを特に参照して、現フレームの量子化幅ステップサイズを決定する方式である。

 

 ここで、は補正目標レートで、

 計算機シミュレーションにより、変化の激しいシーンでも画質を一定に保持可能であることを示す。

 第二のアプローチも3種類の手法により実現される。まず、伝送誤りによる非同期状態からの復帰が早いVLCの設計法を提案する。VLCは、符号語間の同期が、正確な順次復号によってのみ保証される。そのため、伝送路や蓄積メディア上でビット誤りが生じた場合、誤りの重畳を受けた符号語が誤復号される上、同期喪失により連続した誤復号を引き起こす。画像符号化では、連続した領域がこの影響を受け視覚上大きな劣化となる。これに対して、効率劣化を伴わなずに、誤りの影響を最小限に押さえる早期同期回復能力を有する可変長符号の系統的な生成法が必要とされていた。そこで、外乱がある場合でも同期が正確に認識されるためには、各符号語のサフィックスの類似性が高いことが必要であることに着目し、シンボルの生起確率分布から得られる通常の符号に対して、符号化効率を維持しながらビットパターンを変更する「等価変換」を行うことにより、短い符号語がより多く、長い符号語のサフィックスに一致する符号を生成する手法を提案する。例を使用した実験により、提案方式は、符号化効率を維持しながら、系統的に目的の符号が生成可能な上、同期回復速度が早いことを示す。

 次に、DP CM映像符号化において、誤り伝搬を防止する順逆両方向から瞬時復号可能なVLCの設計法を提案する。DP CM符号化では、隣接画素間差分信号にVLCが割り当てられるが、ビット誤りの発生により復号画像で誤りが伝搬する。これに対し、最後尾の信号のPCM値を伝送し、逆方向に差分信号を復号することにより、誤りのある画素を特定し、その他の信号に関しては、エラーフリーの復号を可能とする方式がある。この場合、順逆両方向から瞬時復号可能であるVLCが必要となる。そこで、符号語のプリフィックスを変更することなく、サフィックスのみを変更する手法として、原符号中の短い符号から順に末尾をルートに置く逆ツリーを作成してゆき、サフィックス条件を満たさない符号語に対しては、これを満たすようサフィックスに付加ビットを与える方式を提案する。計算機シミュレーションにより、提案方式における符号化効率の劣化はほとんどないことを示す。

 さらに、誤りの影響を最小に抑制したり、途中受信の復号画像を早期に正常化するために使用されるユニークワード(UW)に対して、エミュレーションを起こさないVLCの系統的設計法を提案する。排他的なビットパターンを持つUWは、伝送誤りによる復号画像への影響を軽減するため、国際標準の符号化にも採用されているが、排他性を保証するために、VICの全ての出現パターンに対して、エミュレーションを起こさないことが必要である。そのため、VLCの設計においては、この条件の考慮が必要であるが、従来は系統的にこうした符号を設計する手法は存在せず、経験的な手法を使用しており、また検証にも多大な労力が払われていた。そこで、0ビットから構成されるUWに対して、ダミーワードを利用したプリフィックス処理と付加ビットによるサフィックス処理を特徴とする、系統的なVLCの設計法を提案する。計算機シミュレーションにより、符号化効率の劣化は極めて小さいことを示す。

 以上の提案方式は、実用的な目的を持って研究されたものである。すなわち、符号化時の画質改善手法は、蓄積伝送型映像符号化端末において特に有効である。この端末は、通信インフラのない地域より、緊急に映像を伝送する場合などに利用されるシステムであり、符号化映像を一旦蓄積媒体に記録し、非実時間で低レートの伝送路により送信するものである。符号化レートと伝送レートの比が、映像素材時間と伝送時間の比に反比例するため、高速伝送のために高い圧縮率と高い主観画質が要求され、提案方式のプリフィルタや可変レート符号化方式が、有効である。一方、VLCによる復号画質の改善手法は、符号化テーブルを置換することにより、既存のシステムへの適用が可能である。今後アプリケーションの要求条件に応じて、国際標準化などにも採用されるべき手法と考えられる。

審査要旨

 本論文は「A Study on Quality Control and High-Function Variable Length Codes in Digital Video Coding(デジタル映像符号化における画質制御および高機能可変長符号に関する研究)」と題し、画像通信やマルチメディアシステムの根幹を成す映像符号化において、符号化時のパラメータ制御手法および復号時のエラー耐性の2つの観点から、画質向上を実現する技術に関してまとめたものであり、英文9章より構成されている。

 第1章は「序論」であり、本研究の目的と背景、本論文の構成や概要について述べている。

 第2章「画質改善の基本手法」では、映像符号化システムの基本的な構成を述べるとともに、その中で符号化時におけるパラメータ制御による画質改善と復号における可変長符号の改善によるエラー回復の2種類の画質改善アプローチがあることを概説し、各アプローチにおける提案方式の特徴、従来技術との関連、適用性(応用システム)を明確にしている。

 第3章「低レートビデオ符号化における最適フレームレート」では、テレビ電話・会議で従来経験的に定められていたフレームレートに関して、画像の性質をモデル化することにより、符号化歪みと動きの円滑さのバランス点を与える最適値を理論的に導出している。さらに計算機シミュレーションと主観評価実験を行ない、理論とよい一致を与える結果を得ている。これにより、与えられた画像に対し、十分高い符号化レートでは、フルフレームレートが最適であるのに対し、一定の符号化レート以下ではそれ以下で画質最適となることなどを明らかにしている。

 第4章「適応帯域型プリフィルタによる最適画質制御法」では、通過帯域可変のローパスフィルタにより、人間の視覚特性を利用しながら映像の鮮鋭度を制御することで、ブロック歪みやモスキート歪みなどを大幅に減少させ、主観画質を向上させる方式を提案している。計算機シミュレーションと主観評価実験を行ない、提案方式が他方式に比較して細かい量子化が行なわれ、歪みの削減に寄与していることなど、本方式の有効性を実証している。

 第5章「可変ビットレート環境における量子化制御法」では、ATMや蓄積メディアなどの可変レート環境での符号化レート制御手法として、長期レート収束型可変レート制御方式を提案している。本方式と他方式とを計算機シミュレーションにより比較し、優れた結果が得られることを示し、変化の激しいシーンにおいても画質を一定に保ちながら、平均レートを目標値に収束させ、伝送や蓄積における情報量を目標値に一致させる制御が可能であることを明らかにした。

 第6章「同期回復の早い可変長符号による画質改善」では、伝送路誤りによる非同期状態からの復帰が早い、高速同期回復可変長符号の設計法を提案している。この方式は、符号化効率を維持しながらビットパターンを一定ルールで変更する等価変換を行なうことを基本にしたもので、従来方式より優れた特性を示すことを実証している。

 第7章「両方向復号可能な可変長符号化による画質改善」では、DPCM画像符号化などにおいて、誤り伝搬を防止するために使用される順逆両方向から瞬時復号可能な可変長符号の設計法を提案している。初期符号から、逆方向トリー生成と一定ルールによるビット付与を繰り返す生成アルゴリズムを提示し、従来方式に比して、符号化効率が優れていることを示している。この符号を使用することにより、誤りの影響を最小限に抑制できることに加え、誤り箇所を特定することが可能であることを解析している。

 第8章「ユニークワードを保証する可変長符号による画質改善」では、誤りの影響を最小限に抑制したり、また途中受信の復号画像を早期に正常化するために使用されるユニークワードに対して、エミュレーションを起こさない可変長符号を系統的に設計する手法を提案している。反復演算を用いた設計手法を示すと共に、符号化効率との関係を解析している。これにより、ユニークワードのユニーク性が保証され、従来長時間を要した検証作業は不要となることを明らかにしている。

 第9章は「結論」であり、本論文のまとめを行っている。

 以上これを要するに、本論文はデジタル映像符号化において、相互接続性に影響を与えずに、映像の性質や符号化の状態を考慮することにより、符号化画質を従来手法よりも大きく向上させる符号化制御技術と、伝送誤りなどによる画質劣化を抑制するための新規機能を有する可変長符号の系統的な生成法を提案したものであり、電子工学上貢献するところが少なくない。

 よって、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク