映像は、近年のデジタル情報化時代においては、マルチメディアシステムの中核として必須の情報媒体である。しかし、映像はその情報量の多さから、伝送路や蓄積媒体などのパフォーマンス上の制約を受け、情報量を圧縮するための符号化を必要とする。一般に符号化では、映像信号の統計的性質や人間の視覚特性を利用した情報量削減が行われるが、その際に生じる符号化歪みや、冗長度の削減に伴う伝送誤り耐性の劣化などの問題点を内包している。そこで本論文では、符号化および伝送・蓄積における映像の画質改善を実現する方式に関して、2つの観点から研究した内容を報告する。 第一のアプローチは、映像符号化における改善であり、符号化パラメータの最適制御により、符号化効率の改善や主観画質の向上を実現する。これらは符号化アルゴリズムに影響を与えないため標準方式との組合せが容易であり、接続性を確保しながら画質の向上が可能である。一方、第二のアプローチは、映像復号時の改善、すなわち伝送路や蓄積媒体上での誤りへの対策に関する改善であり、可変長符号(VLC)に特殊な機能を持たせることにより、誤り耐性の向上を図るものである。これらのVLCは、通常のVLCと比較して、符号化効率の低下は全くあるいはほとんどないことが特長である。 第一のアプローチは、3種類の手法により実現される。まず、低レート符号化における最適フレームレートの決定法を提案する。低レート符号化ではフレームレートの間引きが不可避であるが、従来その値はフィードバックにより決定されていた。しかしその場合、動きの大きいシーンでは、発生情報量を抑制するためにフレームレートが低下し、主観画質を劣化させていた。そこで、信号階調の間引き(量子化)とバランスの取れた、フレームレート選択法が必要となっていた。提案方式は、フレームレートと量子化精度を同時に考慮し、画像性質を参照しながら最適フレームレートを決定する。固定フレームレートで1枚の符号化フレームの後にm枚の非符号化フレームが存在する場合、符号化フレームおよび非符号化フレームに生じる符号化歪みDc,Dnは、それぞれ式(1),(2)のように表される。 ただしは符号化フレームと非符号化フレームの相関係数初期値、はその減衰定数である。総合歪みDaは式(3)で表され、符号化レートと画像性質より与えられる状況に応じて、2種類の場合が生じる。 すなわち、十分高い符号化レートでは最大フレームレートが最適であるのに対し、一定の符号化レート以下では、最大値以下のフレームレートにおいて画質最適となることを定量的に示している。 次に、適応帯域型プリフィルタによる符号化歪みの低減手法を提案する。円滑な動きを重視する映像アプリケーションでは、周波数領域での量子化のみを利用した情報量の圧縮を行うものがある。しかし、大幅な圧縮を行う場合の粗い量子化は、ブロック状の歪みや輪郭線付近のむら状の歪みなど、視覚上大きな劣化として観察される"artifact"を生じることが問題となる。これに対し、厳しいシーンにおいて符号化前の信号成分を削減することにより、artifactを軽減することが可能である。特に、高周波成分に対して鈍感な人間の視覚特性を考慮し、ローパスフィルタにより入力信号の高周波成分をカットする方式(プリフィルタ)が有効である。そこで、符号化画質とレートを、量子化精度(Q)とフィルタの通過帯域(k)の2つのパラメータにより適応的に決定する方式を提案する。これらのパラメータは、符号化状態、入力画像性質などを参照し、以下の連立方程式の解として求められる。 これらにより例えば大幅なレート削減が必要な場合、量子化に過大に依存しないよう制御する。提案方式により符号化artifactが減少し、主観画質が向上することを計算機シミュレーションにより示す。 さらに、ATMや蓄積メディアなどの可変レート(VBR)環境での符号化レート制御手法として、可変レート制御方式を提案する。VBRでは、入力画像の性質に応じて出力レートを可変にできるため、過度に厳しい情報圧縮やスタッフビットの挿入などが不要であり、固定レート符号化よりも高い符号化効率を持つという利点がある。しかしVBRにおいても、課金や蓄積メディア容量などの制約から、平均ビットレートが設定値に収束するよう、符号化制御を行う必要がある。そこで、短期的な変動を許容しながら、長期的にレートを制御する手法を提案する。長期的な平均レートの収束性のほか、近接フレームの画像性質を考慮した処理を行うこと、最適化操作を容易にするため制御パラメータが少ないこと、などを考慮して、式(6)のフィードバック制御を提案する。これは、符号化開始から直前の画像フレームまでの平均レートと目標レートの差分を、今後の数フレームで補正することを目標とし、直前フレームの出力レートを特に参照して、現フレームの量子化幅ステップサイズを決定する方式である。 ここで、は補正目標レートで、 計算機シミュレーションにより、変化の激しいシーンでも画質を一定に保持可能であることを示す。 第二のアプローチも3種類の手法により実現される。まず、伝送誤りによる非同期状態からの復帰が早いVLCの設計法を提案する。VLCは、符号語間の同期が、正確な順次復号によってのみ保証される。そのため、伝送路や蓄積メディア上でビット誤りが生じた場合、誤りの重畳を受けた符号語が誤復号される上、同期喪失により連続した誤復号を引き起こす。画像符号化では、連続した領域がこの影響を受け視覚上大きな劣化となる。これに対して、効率劣化を伴わなずに、誤りの影響を最小限に押さえる早期同期回復能力を有する可変長符号の系統的な生成法が必要とされていた。そこで、外乱がある場合でも同期が正確に認識されるためには、各符号語のサフィックスの類似性が高いことが必要であることに着目し、シンボルの生起確率分布から得られる通常の符号に対して、符号化効率を維持しながらビットパターンを変更する「等価変換」を行うことにより、短い符号語がより多く、長い符号語のサフィックスに一致する符号を生成する手法を提案する。例を使用した実験により、提案方式は、符号化効率を維持しながら、系統的に目的の符号が生成可能な上、同期回復速度が早いことを示す。 次に、DP CM映像符号化において、誤り伝搬を防止する順逆両方向から瞬時復号可能なVLCの設計法を提案する。DP CM符号化では、隣接画素間差分信号にVLCが割り当てられるが、ビット誤りの発生により復号画像で誤りが伝搬する。これに対し、最後尾の信号のPCM値を伝送し、逆方向に差分信号を復号することにより、誤りのある画素を特定し、その他の信号に関しては、エラーフリーの復号を可能とする方式がある。この場合、順逆両方向から瞬時復号可能であるVLCが必要となる。そこで、符号語のプリフィックスを変更することなく、サフィックスのみを変更する手法として、原符号中の短い符号から順に末尾をルートに置く逆ツリーを作成してゆき、サフィックス条件を満たさない符号語に対しては、これを満たすようサフィックスに付加ビットを与える方式を提案する。計算機シミュレーションにより、提案方式における符号化効率の劣化はほとんどないことを示す。 さらに、誤りの影響を最小に抑制したり、途中受信の復号画像を早期に正常化するために使用されるユニークワード(UW)に対して、エミュレーションを起こさないVLCの系統的設計法を提案する。排他的なビットパターンを持つUWは、伝送誤りによる復号画像への影響を軽減するため、国際標準の符号化にも採用されているが、排他性を保証するために、VICの全ての出現パターンに対して、エミュレーションを起こさないことが必要である。そのため、VLCの設計においては、この条件の考慮が必要であるが、従来は系統的にこうした符号を設計する手法は存在せず、経験的な手法を使用しており、また検証にも多大な労力が払われていた。そこで、0ビットから構成されるUWに対して、ダミーワードを利用したプリフィックス処理と付加ビットによるサフィックス処理を特徴とする、系統的なVLCの設計法を提案する。計算機シミュレーションにより、符号化効率の劣化は極めて小さいことを示す。 以上の提案方式は、実用的な目的を持って研究されたものである。すなわち、符号化時の画質改善手法は、蓄積伝送型映像符号化端末において特に有効である。この端末は、通信インフラのない地域より、緊急に映像を伝送する場合などに利用されるシステムであり、符号化映像を一旦蓄積媒体に記録し、非実時間で低レートの伝送路により送信するものである。符号化レートと伝送レートの比が、映像素材時間と伝送時間の比に反比例するため、高速伝送のために高い圧縮率と高い主観画質が要求され、提案方式のプリフィルタや可変レート符号化方式が、有効である。一方、VLCによる復号画質の改善手法は、符号化テーブルを置換することにより、既存のシステムへの適用が可能である。今後アプリケーションの要求条件に応じて、国際標準化などにも採用されるべき手法と考えられる。 |