学位論文要旨詳細

学位論文要旨


No		111822
著者（漢字）		高村,誠之
著者（英字）
著者（カナ）		タカムラ,セイシ
標題（和）		自己回帰モデルに基づく静止画像の高能率可逆符号化に関する研究
標題（洋）		Efficient Lossless Still Image Coding Based on the Autoregressive Model
報告番号		111822
報告番号		甲11822
学位授与日		1996.03.29
学位種別		課程博士
学位種類		博士(工学)
学位記番号		博工第3620号
研究科		工学系研究科
専攻		電子工学専攻
論文審査委員		主査：　東京大学　教授　高木,幹雄　東京大学　教授　羽鳥,光俊　東京大学　教授　原島,博　東京大学　助教授　喜連川,優　東京大学　助教授　相澤,清晴　東京大学　助教授　瀬崎,薫
内容要旨		近年のデジタル信号処理技術の急速な発展に伴い、高品質画像放送・携帯電話などに於けるデジタル通信、また計算機間のネットワークを利用した情報の配信・授受・大規模データベースへのアクセス等の需要はますます増えつつある。このような現状において、いわゆるマルチメディア通信が現実味を持ったものとなり、画像符号化技術の果たす役割は急激に増大している。　もともと画像符号化に関する研究は1950年代から行われてきているが、冒頭に述べた理由から、それに対する需要と研究者の関心はますます高まっている。静止画像符号化標準方式JPEG、動画像符号化標準方式MPEG、さらにISO/IEC/JTC1/SC29/WG1の新規課題「階調画像のための次世代可逆圧縮」など、最近の標準化の波もそれに拍車をかけている。　画像符号化はその本質的区分として「可逆(lossless)」と「非可逆(lossy)」の二通りに分けられる。すなわち符号化→復号化を経たデータが原データと完全に一致するか(可逆)、しないか(非可逆)による分類である。文書データ等の符号化の場合は通常可逆符号化が用いられるのに対し、画像データの場合には、必ずしもデータが元に戻らなくても、主観的・客観的な規準の下で原データに似ていればよいとする、「非可逆な符号化方式」が存在するからである。JPEGのベースライン方式、MPEGなどは非可逆方式で、いずれも広く一般に用いられている。画像の可逆符号化と非可逆符号化との、損失の有無以外の最大の相違点は、その圧縮率である。現在ある技術では、通常の自然画像について、非可逆符号化では人が見て損失を感じない画質で1/10〜1/30、画像の内容が把握できる画質では1/60程度の圧縮率が得られるのに対し、可逆符号化では1/2〜1/4程度の圧縮率に留まる。　しかし実際は圧縮率の高い非可逆画像符号化を用いることができる場面は限られている。例えば　・計算機処理による特徴量の抽出等、種々の用途を持った利用者によりアクセスされる画像データベース　・画像の加工や修正を行うフォトレタッチ等の二次処理が行われる場合　・印刷のように特に高品質な画像が必要となる場合　・人工衛星によるリモートセンシング画像/医療画像/天文画像のように微小な画素値変動が時として重大な意味を持つため僅かな歪みも許されないような場合　等々、符号化歪みの全くない可逆符号化でなければならないような場面は非常に多い。またこれらほど要求が厳しくなくとも、ユーザがより高い画質を求める状況は多々考えられる。　加えて記憶装置の大容量化、高い処理速度をもつ計算機の普及、ネットワークの広帯域化、という昨今の事情から、圧縮後のサイズの問題から従来やむなく非可逆符号化されていた画像でも可逆符号化により保存・伝送されうる可能性が高まっている。この傾向は今後ますます進むものと思われる。　デジタル画像信号を可逆符号化するには、GIF方式のように画像にLZ系ユニバーサル符号化を行う方法もあるが、より高い圧縮率を達成するための画像の可逆符号化の一般的な流れは　1.画像のモデル化　2.モデル当てはめにより生じるあてはめ誤差の符号化　の二段階で表すことができる。前者により画像の持つ冗長度のうちのいくらかを取り除き、除けず残った情報(ペナルティ)を後者により符号として出力する、と解釈できる。そこで高能率に可逆符号化を行うためには、画像について如何に優れたモデルを適用し、誤差について如何に短く符号を生成するかの2点について検討を行わなければならないことになる。このような手法の一つとして例えばJPEGlosslessモードなどがある。この方式の圧縮率はかなり高いものであるが、依然改善の余地は多く、様々なより高性能な画像符号化のアプローチが提案されている。　本研究は上記の処理の流れを踏襲し、圧縮率の観点においてより効率的なペナルティの符号化方法を考案し、実際に自己回帰モデルに基づき、他モデルとのハイブリッド方式を含む三通りの可逆符号化器を設計し、静止濃淡画像の符号化の評価・考察をしたものである。　本論文は6章から構成される。まず第1章に於いて研究の背景、画像符号化のモデルと符号の関係、従来手法の問題点の指摘、研究の目的、並びに論文の構成概要などをまとめている。　次いで第2章に於いては、画像モデル化後残存する情報量を符号化する際の符号量削減に関する理論展開と諸考察を行い、符号化の様々な段階において符号量を減らすための手法を提案する。　まず、画素予測値および真値から実際に出力する信号の対応づけに関する考察を行い、ヒストグラムと誤差分布モデルから真値との距離を求める方式を提案し、単なる予測誤差の丸めよりもエントロピが低減されることを示している。　次いで、分布の異なる信号源は混合するとエントロピが必ず増大する事実つまり信号源分離による符号化利得の理論に基づいた、画像の誤差信号源のより効果的な分離法を提案し、評価考察を行っている。　また、従来指数分布や一般化Gauss分布で近似できるとされていた画像の予測誤差信号の確率密度関数と実際の誤差分布との食い違いを指摘し、実際のデジタル画像に含まれるGauss性雑音と量子化雑音が線形予測に及ぼす影響を定量的に考慮した新しい確率密度モデル(一般化Gauss分布とGauss分布の畳み込み)を提案し、提案する符号量規準の下で従来モデルよりもよい誤差分布あてはめができることを示した。このモデルは自己回帰モデルにおける予測誤差信号のみならず、DCT係数やサブバンド符号化におけるサブバンド信号など、他の画像の線形変換手法を含む様々な手法にまで広く応用が可能な一般的議論であるとともに、画像に重畳されたGauss型雑音の分散の推定も同時に行えるという極めて有用な知見を与えるものである。　また、統計的冗長度を削減するためのエントロピ符号化方式としては、ランレングス符号化、LZ系ユニバーサル符号化、Huffman符号化、算術符号化などが存在するが、本研究では最小記述長規準に基づくシンボル生起頻度表伝送を伴う適応的算術符号方式が、符号効率の面から最適であることを明らかにし、本章で提案した様々な効率化要素技術との組合せにより、実験においてはほぼ最適と言える結果(符号効率が99.99%程度)を得ている。　そして第3〜5章に於ては、第2章で得られた知見を実際に符号化に利用し、自己回帰モデルと従来画像の可逆符号化には試みられなかった画像モデルとの融合手法を提案し、実際の符号化実験を通してそれぞれ検討し、性能評価を行っている。　第3章では、従来画像の可逆符号化の主流であった自己回帰モデルを用いる方法の適応化等の改良法の提案をする。統計的モデルとしては自己回帰(Autoregressive,AR)モデルが代表的であり、これらは画像符号化以外にもテクスチャ解析等に大きな成果を上げている。本章では自己回帰モデルに基づく二つの符号化器、エッジ適応予測型符号化器および適応フィルタ(RLS)を用いた符号化器の設計・評価を行った。　第4章では、画像をm重マルコフ情報源と見倣す立場、つまりマルコフモデルを応用した画像符号化を行った。m重マルコフ情報源とは、m個まで遡った過去の信号の履歴(これを「状態」と呼ぶ)により次に出現する信号が確率的に定まるような信号源のことである。マルコフモデルは低い多重度(1,2重)に於いてもエントロピが0次エントロピより遥かに小さくなるという好ましい性質を持つ一方、状態数がmに対して指数的に増大してしまうという欠点があり、多階調画像への応用は従来試みられなかったのだが本研究では自己回帰モデルと融合した学習型マルコフモデルを提案し、さらに最尤法に基づくマルコフ状態毎の生起頻度表の生成を提案し、高能率符号化への見通しを開いた。幾つかの画像においてマルコフモデル学習による効率改善がこの状態伝送のオーバーヘッドを補償しうることを確認した。マルコフモデルとの統合を行うことによりいくつかの画像に於ては自己回帰モデルのみの場合より1bit/pixel程も小さい圧縮率が達成された。　第5章では、画像の非可逆符号化に用いられるDCT(離散コサイン変換)、KLT(Karhunen-Loeve変換)に代表される変換符号化による画像の可逆符号化に関する検討を行っている。変換符号化は冒頭で述べたように非可逆符号技術に於いて非常に有効な技術であり、これと自己回帰モデルを融合した符号化器を提案する。ところで画像データベースに於いては、利用者が必要とする画像の効率的な検索・伝送、およびデータ転送時の利用者の心理的負担の軽減・ネットワーク負荷の軽減も重要な課題であり、したがって画像の効果的な逐次(progressive)伝送も重要な機能の一つに数えられるが、本研究により、可逆復号を前提とした逐次画像伝送の高能率化が可能となった。また本章の副産物としてマルチチャネル画像(気象衛星NOAAのAVHRRデータ)の高能率(1/3〜1/4程度の圧縮)可逆符号化システムを作成した。　最後に第6章に於いて、本研究において得られた知見とそのもたらす成果についてのまとめを行っている。　本研究は、今後ますます盛んになるであろう画像の可逆符号化において、自己回帰モデルに基づいた画像のモデルあてはめという側面とその結果のペナルティ表現という側面の各々について従来顧みられなかった点に関する詳細な検討を行い、効率改善アルゴリズムを提案した。画像符号化の歴史は長くもあるが、本研究では変わりつつあるインフラストラクチャにいち早く対応する先進的なものであると言うことができる。
審査要旨		本論文は,"Efficient Lossless Still Image Coding Based on the Autoregressive Model"(自己回帰モデルに基づく静止画像の高能率可逆符号化に関する研究)と題し,自己回帰モデルを中心とする静止画像の可逆符号化の高能率化を追求し,エントロピ符号化における符号量削減手法及び他のモデルとの融合による新しい符号化方式について論じたもので,6章から構成され,英文で書かれている。　第1章は,"Introduction to Lossless Image Coding"と題し,研究の背景,画像符号化のモデルと符号の関係,従来手法の問題点の指摘,研究の目的,並びに本論文の構成を述べている。　第2章は,"Entropy Coding and Code Length Reduction"と題し,予測誤差信号の符号量の削減に関する考察を行っている。先ず,画素予測値および真値から実際に出力される信号の対応づけに関する考察を行い,ヒストグラムと誤差分布モデルから真値との距離を求める方式を提案し,単なる予測誤差の丸めよりもエントロピが低減されることを示している。次いで,信号源分離による符号化利得の理論に基づいた画像の誤差信号源のより効果的な分離法を提案し,評価考察を行っている。又,従来,指数分布や一般化正規分布で近似されていた画像の予測誤差信号の確率密度関数と実際の誤差分布との違いを指摘し,画像に含まれるGauss性雑音と量子化雑音が線形予測に及ぼす影響を定量的に考慮した分布モデル(一般化正規分布と正規分布の畳込み)を提案し,実験データが符号量規準の下で,それに良く従うことを示している。これは単に自己回帰モデルにおける予測誤差信号だけではなく,DCT係数やサブバンド符号化におけるサブバンド信号等,他の画像の線形変換手法を含む様々な手法にも応用が可能であり,画像に重畳されたGauss型雑音の分散の推定も同時に行えるという極めて有用な知見を与えている。更に,統計的冗長度を削減するためのエントロピ符号化方式を論じ,ランレングス符号化,LZ系ユニバーサル符号化,Huffman符号化,算術符号化等の中で,最小記述長規準に基づくシンボル生起頻度表伝送を伴う適応的算術符号方式が,符号効率の面から最適であることを明らかにし,本章で提案している種々の効率化要素技術との組合せにより,実験においてほぼ最適と言える結果(符号効率:99.99%)を得ている。　第3章は,"Image Coding Based on the AR Model"と題し,画像の可逆符号化の主流であった自己回帰(AR:Autoregressive)モデルを用いる方法の適応化等の改良法を提案している。自己回帰モデルに基づく二つの符号化器,エッジ適応予測型符号化器および適応フィルタを用いた符号化器の設計・評価を行ない,いずれもJPEG可逆符号化に比べて0.1〜1bit/pixel程度の圧縮率の改善が達成されている。　第4章は,"Image Coding Based on Markov-AR Hybrid Model"と題し,画像をm重マルコフ情報源と見倣す立場からの画像符号化を論じている。学習型マルコフモデルを提案し,更に,最尤法に基づくマルコフ状態毎の生起頻度表の生成を提案し,高能率符号化への見通しを開いている。幾つかの画像においてマルコフモデル学習による効率改善が,この状態伝送のオーバーヘッドを補償しうることを確認し,マルコフモデルとの統合を行うことにより,自己回帰モデルのみの場合よりも1bit/pixel程度の圧縮率改善が達成されることを示している。　第5章は,"Image Coding Based on Transforrn-AR Hybrid Model"と題し,画像の非可逆符号化に用いられるDCT(離散コサイン変換),KLT(Karhunen-Loeve変換)に代表される変換符号化による画像の可逆符号化に関する検討を行い,変換符号化と自己回帰モデルを融合した符号化器を提案している。更に,画像データベースにおいて,利用者が必要とする画像の効率的な検索・伝送,データ転送時の利用者の心理的負担の軽減・ネットワーク負荷の軽減のための重要な機能である逐次伝送においても,この方式により高能率可逆符号化が可能であることを示している。又,本研究の応用例としてマルチチャネル画像(気象衛星NOAAのAVHRRデータ)の高能率可逆圧縮システムを作成し,原画像の1/3〜1/4程度の高い圧縮率を達成している。　第6章は"Conclusion"であり,本研究の成果が要約されている。　以上これを要するに,本論文は画像の自己回帰モデルを中心に静止画像の高能率符号化に直接関連する手法を理論的に体系化し,高能率可逆符号化における自己回帰モデルの有効性を明らかにすると共に,圧縮効率の優れた新しい符号化アルゴリズムの提案を行ったものであって,電気通信工学上貢献するところが少なくない。　よって,本論文は博士(工学)の学位請求論文として合格と認められる。
UTokyo Repositoryリンク		http://hdl.handle.net/2261/1872