学位論文要旨



No 211831
著者(漢字) 加藤,洋一
著者(英字)
著者(カナ) カトウ,ヨウイチ
標題(和) テレビ電話・テレビ会議用高能率動画像符号化に関する研究
標題(洋)
報告番号 211831
報告番号 乙11831
学位授与日 1994.06.16
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第11831号
研究科 工学系研究科
専攻 電気工学専攻
論文審査委員 主査: 東京大学 教授 羽鳥,光俊
 東京大学 教授 高木,幹雄
 東京大学 教授 原島,博
 東京大学 教授 坂内,正夫
 東京大学 助教授 相澤,清晴
内容要旨

 高能率動画像符号化技術は、経済的なテレビ電話・テレビ会議の実現に不可欠である。また、符号化方式が標準化されることにより、テレビ電話・テレビ会議の広範囲な普及が可能となろ。本研究は、高能率動画像符号化方式の実現、符号化方式の標準化への寄与を目指して行われたものである。

 本研究の内容をまとめると以下のようになる。

 (1)フレーム間予測誤差符号化の高効率化

 -直交変換符号化方式の適応化による効率改善

 -適応直交変換符号化のフレーム間予測誤差符号化への適用

 (2)画品質改善のための検討

 -テレビ電話画像中の変形部分を効率的に表現する方法の実現

 -ポストフィルタによる再生画像品質の向上

 (3)高能率動画像符号化に用いる符号化制御方式

 -主観的な特性を考慮した符号化制御方式の定式化

 -動き補償フレーム間予測-DCT符号化方式への適用

 (4)動画像高能率符号化方式標準化への寄与

 -ブロックサイズの最適化

 -代表的なフレーム間予測誤差信号符号化方式の比較

1.フレーム間予測誤差符号化の高効率化

 高能率動画像符号化方式中に用いられる直交変換符号化の効率化と、これを利用したフレーム間予測誤差符号化について論じた。

 直交変換符号化自体の効率改善方法として、入力ブロックのクラス分けを利用した適応化を導入した。ブロックの交流電力を用いる方法、有効な係数位置のパターンを用いる方法、直交変換係数ブロックに対し粗いベクトル量子化(VQ)を行い、そのVQインデックスを用いる方法の3種類のクラス分け基準を提案して比較を行い、適応化により2〜4dBの再生画像SN比向上が望めること、クラス分け基準としてはVQインデックスが最も優れていることを示した。さらに、具体的な符号化アルゴリズム(適応DCT符号化)について述べ、本方法が従来方式に比べて0.5〜1dB高い再生画像SN比を与えることを示した。

 上記の適応DCT符号化方式を動画像符号化に応用する方法について述べ、動き補償付フレーム間予測方式と適応DCT符号化を組み合わせることにより、従来方式より0.5〜1dB高い再生画像SN比が得られることを示した。

2.画品質改善のための検討

 出力画像品質をさらに改善するため、以下の検討を行なった。

 従来のブロックマッチング方式による動き補償では、入力画像の並行移動部分を効率的に予測することができた。しかし、実際のテレビ電話・テレビ会議画像は、頭部、体全体の揺れなどという並行移動的な動きの他に、目や口等の形状変形部分を多く含んでいる。これらの形状変化を動き補償で予測することは困難である。しかし、ある形状と似た形状が繰り返し現れる可能性は大きいという点に着目し、変形補償という方式を提案した。これを利用してテレビ電話画像を16kb/sという超低ビットレートに符号化し、大きな画像品質劣化を伴わずに、約7.5フレーム/秒の出力フレームレートを得ることができた。

 ポストフィルタによる符号化雑音低減を試みた。2種類の適応雑音除去フィルタを用いることによりCCITT標準符号化方式を低ビットレートで用いた時に現れるブロック状雑音と、急峻なエッジ周辺に現れる視覚的に目立つ雑音を効果的に低減することができた。

3.高能率動画像符号化に用いる符号化制御方式

 高能率動画像符号化に適した符号化制御方式の定式化について述べた。高能率符号化において視覚的に良好な画品質を得るためには、高い符号化効率のみならず、入力画像に対する符号化パラメータを決定する符号化制御特性が、人間の視覚特性あるいは"好み"に適合している必要がある。尨大な情報量を持つ動画像信号を数100〜数10kb/sまで圧縮符号化する際には、高能率符号化アルゴリズムを用いたとしても、何らかの空間的、時間的歪みの発生を許容せざるを得ない。また、動画像信号が持つ情報量は、時間的に大きく変化していることから、動画像を、一定速度の伝送路に適合するように符号化し、かつ良好な再生画品質を保つためには、符号化パラメータを制御する符号化制御アルゴリズムが重要な要素となる。動きの再現性と空間的解像度あるいは雑音のバランスを最適に制御するためには、これから符号化するフレームの発生情報量対歪み特性を把握し、現符号化フレームに与える時間的、空間的歪みの量をバランス良く決定し、その状態を実現する符号化パラメータを設定すれば良い。このような考え方に基づいて、視覚的に望ましい特性を持つ符号化制御アルゴリズムを提案し、実験により有効性を確認した。また、このような原理に基づいた符号化制御方式を、動き補償フレーム間予測-DCT符号化方式に適用して、主観的な品質を向上させた。

4.動画像高能率符号化方式標準化への寄与

 高能率動画像符号化方式の国際標準化に関した研究について述べた。64kb/sから1920kb/sの伝送速度に適合する符号化方式の標準化は、CCITT SGXVビデオ符号化専門家グループを中心に行われた。この標準化方式策定に寄与するため、フレーム間予測誤差を符号化する際の最適なブロックサイズをもとめる実験、および、フレーム間予測誤差符号化方式の選定に資する実験を行なった。

 最適ブロックサイズは符号化方式の基本構成に関わる重要なパラメータであるが、この値を定量的に論じた文献は過去に見当たらなかった。実験の結果、ブロックサイズは、4×4あるいは8×8が最も効率が良いことが判明した。フレーム間予測誤差符号化方式の選定に関して、現在一般的に用いられているVQ方式とDCT方式の比較を行った。実験の結果、高度に適応化されたジグザグスキャン型DCT方式と適応Gain/Sgape VQ方式では、大きな効率、処理画像の差が無いことが判明した。また、ループフィルタは再生画像品質を改善する効果が大きいことが分かった。

5.まとめ

 上述のように、高能率動画像符号化方式全般に渡る改良を行い、ISDN時代のテレビ電話・テレビ会議サービスに十分に適用できる符号化方式を開発した。また、これらの成果の一部は、符号化方式の国際標準化に寄与した。

審査要旨

 本論文は「テレビ電話・テレビ会議用高能率動画像符号化に関する研究」と題し、高能率動画像符号化方式の実現、符号化方式の標準化への寄与を目指して行われた研究をまとめたものであり、6章よりなる。

 第1章は「序論」であり、動画像通信の現状と将来、高能率動画像符号化方式の研究動向について論じ、本研究の目的、本論文の構成と概要を述べている。

 第2章は「フレーム間予測誤差符号化方式」と題し、高能率動画像符号化方式の中枢技術をなす直交変換符号化の効率化と、これを利用したフレーム間予測誤差符号化について論じている。入力ブロックの3種類のクラス分け、すなわち、交流電力、有効な係数位置のパターン、粗いベクトル量子化によるクラス分けを論じ、クラス分けを利用した適応化を導入することにより、直交変換符号化の効率が改善されること、就中、ベクトル量子化によるクラス分けが優れていることを示した。動き補償付フレーム間予測方式とこの適応化を用いる適応DCT符号化を行うことにより、従来方式より0.5〜1dB高い再生画像SN比が得られることを示した。

 第3章は「再生画像品質改善に関する検討」と題し、変形補償と呼ぶ方式による画像品質の改善、ポストフィルタによる符号化雑音低減について論じている。ブロックマッチング方式による動き補償は、画像の並行移動部分には適するが、目や口等の形状変形部分には適さないことに注目し、変形補償という方式を提案し、これにより、16kb/s超低ビットレートテレビ電話画像符号化に於いて、7.5フレーム/秒の高いフレームレートを得られることを示した。また、2種類の符号化雑音除去ポストフィルタによる画像品質の改善を試み、低ビットレートCCITT標準符号化方式のブロック状雑音と急峻なエッジ周辺に現われる雑音を効果的に低減できることを示した。

 第4章は「高能率動画像符号化方式における符号化制御アルゴリズム」と題し、大幅な符号量削減に起因するこま落ちと符号化雑音の発生を制御し、画像品質に対する主観的印象の向上を目的とする符号化制御法を提案し論じている。すなわち、数100〜数10kb/sの低ビットレート符号化においては歪み、雑音の発生を許容せざるを得ない、また、時間的に情報量が変化する動画像を一定速度で符号化するためには、符号化パラメータを制御する必要があるとし、時間的、空間的歪み、雑音の量を視覚的にバランス良く決定する符号化制御アルゴリズムを提案し、これを動き補償フレーム間予測-DCT符号化方式に適用した場合主観的な品質を向上できることを確認した。

 第5章は「高能率動画像符号化国際標準化に関する検討」と題し、高能率動画像符号化方式の国際標準化に参画し寄与した研究について述べている。すなわちフレーム間予測誤差を符号化する際のブロックサイズの選定を実験的に行い4×4あるいは8×8が最も効率が良いことを明らかにした。また、フレーム間予測誤差符号化の選定に関し、ベクトル量子化方式とDCT方式の比較を行い効率、画像品質上大きな差の無いことを明らかにした。更に、ループフィルタは再生画像品質を改善する効果が大きいことを明らかにした。

 第6章は、結論で、本研究の成果、意義を要約している。

 以上これを要するに、本研究は、適応化の導入によるフレーム間予測符号化の高効率化、変形補償の導入、ポストフィルタによる画像品質の向上、符号化制御方式の定式化と主観的な特性の改善等の高能率動画像符号化方式の改善の研究を行い、また、ブロックサイズの最適化、代表的なフレーム間予測誤差符号化方式の比較等国際標準化における寄与をまとめたものであり、電気通信工学上寄与するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク