学位論文要旨



No 118006
著者(漢字) 八木,雅和
著者(英字)
著者(カナ) ヤギ,マサカズ
標題(和) 連想プロセッサアーキテクチャに基づく知的画像処理システムの研究
標題(洋) An Intelligent Image Recognition System Based on the Associative Processor Architecture
報告番号 118006
報告番号 甲18006
学位授与日 2003.03.28
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5464号
研究科 工学系研究科
専攻 電子工学専攻
論文審査委員 主査: 東京大学 教授 柴田,直
 東京大学 教授 鳳,紘一郎
 東京大学 教授 上野,照剛
 東京大学 教授 浅田,邦博
 東京大学 教授 相澤,清晴
 東京大学 助教授 廣瀬,明
内容要旨 要旨を表示する

 近年VLSIの集積化技術が著しく発達し、数年前のスーパーコンピュータークラスの演算能力を保持する携帯端末が一般に普及するほどになった。しかし、このような技術の進歩を遂げているにも関わらず人間のように柔軟な対応を行うことが可能なシステムは実現されていない。このようなシステムは、今後高齢化が進む社会の中でますます欠かせないものである。その中でも、知的画像認識は非常に重要な機能となる。そこでこのようなシステムを実現するためにさまざまな研究が行われてきた。しかし、ソフトウェアによるアプローチは、非常に強力な汎用プロセッサ上で動作させることを前提としておりソフトウェアの視点から最適化を行うのみであった。そのため、非常に演算コストの高い浮動小数点演算等を数多く利用することが多く、実時間応答の実現は困難であった。また、問題対象を限定してシステムの最適化を行うため他の問題に適用することは非常に困難であった。

 そこで本論文では、ハードウェアとソフトウェアの両方の視点から画像認識システムの構築・最適化を行った。ここで、脳の視覚情報処理からヒントを得た、我々の研究室が提案している連想プロセッサアーキテクチャを基に認識システムを構築した。このアーキテクチャは、ニューロン個々の機能を実現するのではなく、高次の認識レベル(例えば機能マップレベル)における機能を実現する。具体的には入力された画像と最も類似したものをシステム内に保持された膨大な記憶の中から高速に見つけ出しそれを認識結果とする、いわゆるテンプレートマッチング処理により認識を行う。高速なテンプレートマッチング処理はソフトウェア上では実現が非常に困難である。我々の研究室では別のプロジェクトでこのような処理を超高速に行う連想プロセッサがデジタル技術だけでなく、アナログ技術を用いても開発されている。その特徴としては、テンプレートを保持する膨大な内部メモリの中から最も類似したものを超並列に高速で見つける機能を実現していることである。

 しかし、このような連想プロセッサを用いたとしても、画像データはデータ量が冗長でかつ膨大なため効率的で柔軟な認識を実現するのが困難である。そこで本論文では、2次元の膨大な画像データから重要な特徴を抽出し連想プロセッサに適した1次元の数値列に変換するアルゴリズム、Projected Principal Distribution(PPED)を提案する。このアルゴリズムでは64x64ピクセルのデータから主要な4方向(水平、垂直、±45度)に対応するエッジ情報を抽出しその投影を行うことでエッジ情報分散ベクトルを生成する。このようにして生成されたPPEDベクトルは、4096次元の元画像データを64次元のベクトルに情報圧縮を行いながらも、人間の目で見て類似した画像はベクトル空間でも類似するという非常に連想プロセッサに適した特徴を示した。また、ハードウェア化を視野において開発したため浮動小数点演算は用いないアルゴリズムである。ここで述べたPPEDベクトル生成アルゴリズムと連想プロセッサを用いて連想プロセッサアーキテクチャを実装した。

 このような形で連想プロセッサアーキテクチャに基づいた知的画像認識システムを構築し、頭部X線の解剖学的特徴点の自動認識問題を一つの例題として適用することで最適化を行った。この問題は、矯正歯科医が患者の頭蓋骨の骨構造異常を診断する際に行うものあり、長年の経験を積んだ専門医にしか行うことができない、非常に時間が費やされる作業である。そのため、患者により多くの時間を割くことを求められている医療分野では非常にニーズが高い。この問題は大阪大学大学院歯学研究科顎顔面口腔矯正学教室高田研究室と共同研究を行っている。

 まず、最初に140枚の頭部X線画像を用いてPPEDのベクトル表現手法と柔軟なマッチングアルゴリズムという観点から認識アルゴリズムの最適化を行った。40枚を認識実験用、残りの100枚をテンプレート生成用のサンプルとした。認識対象として、解剖学的特徴点中でも非常に重要なSella、Nasion、Orbitaleの3つの特徴点を採用した。最適化は、エッジ抽出の感度、PPEDのベクトルの投影方法、PPEDベクトル要素の平滑化手法、テンプレートの生成手法、画素値の階調数、多解像度のマッチングアルゴリズムに関して行った。PPEDベクトル表現手法とテンプレートの生成手法の最適化を行った結果、認識精度はSella、Nasion、0rbitaleに関して62.5%、85%、87.5%となり、Sellaに関しては十分な認識能力を示さなかった。しかし、マクロ的な視点で対象の位置を大まかに見つけその後に詳細なサーチを行うというMacro vision アルゴリズムを適用することで認識率は95%に改善された。このMacro vision アルゴリズムは、扱う画像の解像度をHaar's Wavelet 変換を用いてハードウェア上で容易に実装可能である。

 頭部X線画像250枚を用いて26の解剖学的特徴点の認識を行い認識システムの実用性を評価した。この解剖学的特徴点の中には、X線が透過し画像化されにくい柔組織上に存在する点も含まれている。柔組織上の点を認識するには、矯正歯科医でもディスプレイ上でコントラストを最適化する必要がある。テンプレートの生成手法は、100枚のサンプル画像から学習のアルゴリズムを適用し15枚のテンプレートを生成した。このような条件で認識システムを用いてすべての特徴点認識を行ったところ、全般的に非常に良い認識精度が得られた。しかし、いくつかの特徴点に関しては十分な認識精度が得られなかった。

 十分な認識精度が得られなかった特徴点(Ar1、Cd1、Ba等)に関してはMacro visionアルゴリズムを適用することで大幅に改善した。しかし、前顔面の硬組織上の特徴点(Gn等)は同じ形を持つ柔組織上の点を誤認識するために認識率が非常に低下した。この結果は類似したものを探すという機能が非常に強力に働いていると言える。解剖学的特徴点Gnに対しては画素値の諧調の最適化を行った。具体的には画素データの下位bitを廃棄する処理によってハードウェア上でも非常に容易に実現可能である。この最適化により誤認識の原因となった柔組織情報を除去する機能が実現され、Gnの認識率が13%から97%へと飛躍的に向上した。このように、基本的に連想プロセッサアーキテクチャを利用することでほぼすべての特徴点の認識を90%近い精度で認識を行うことができた。

 また、同じ認識システムを、手書き文字認識や"Zoom Lens Metaphor"問題、顔における特徴点の認識などにも適用し、見込みのある成果が得られた。

 さらなるロバスト性を実現するためには、認識後に検証作業を行い再び認識を行う処理を必要とする。実時間応答性を保証しながらこのような処理を行うには、更なる高速化が必要となる。そこでPPEDベクトル生成加速VLSIチップを設計した。

 画像処理プロセッサではメモリ・プロセッサ間の画像データのバス転送ボトルネックが発生するため、効率的にフィルタ演算を行う必要がある。そこでパイプライン構造を適用することで冗長なメモリアクセスを80%減少させた。また、エッジ情報を抽出する際に用いる閾値の演算は、40個のデータの中からメディアン値を演算するため非常に演算コストが高い。そこで、保持するレジスタ数とパイプラインの段数、演算時間の最適化を行い演算回路の設計を行った。その際に、デジタル技術で実装すると回路規模も大きくなり演算時間がかかる機能ブロックに対しアナログ技術を利用することで回路実装の効率化を実現した。作成した専用デジタルプロセッサを25MHzで動作させることでPPEDベクトルを160μsec.で生成する機能を実現した。

 また、最適化を行ったPPEDベクトル生成手法と我々の研究室で開発されたアナログ連想プロセッサを利用しSellaの認識を行った。このアナログ連想プロセッサは制御電圧を下げることでアバブスレッショールド領域からサブスレッショールドの低消費電力の領域で動作させることが可能である。実験ではアバブスレッショールドはもちろんサブスレッショールドの領域でも正しくSellaが認識することができた。このようにアナログ連想プロセッサでも正しく認識でき、PPEDベクトル表現手法が連想プロセッサアーキテクチャに適していることが示された。

 本論文では、ソフトウェアとハードウェアの両方の視点から認識システムを構築した。そして、このアーキテクチャに欠かすことができない2次元画像データを連想プロセッサが扱うことができる形に変換するアルゴリズムProjected Principal Edge Distributtion1(PPED)を提案した。この認識システムは、解剖学的特徴点の自動抽出という矯正歯科医療上非常に重要な問題を一例として適用し最適化された。そして、大学病院に蓄積された膨大なレントゲン写真に適用し多数の解剖学的特徴点の認識を行うことで、システムの実用性が検証された。そして、ロバスト性を高めつつ実時間応答を実現するため、PPEDベクトル生成アルゴリズムをハードウェア上で実装を行い高速にベクトルを生成する機能を実現した。そして、我々の研究室で既に開発されたアナログの連想プロセッサと組み合わせることで、別々の回路ではあるが認識システムをハードウェア上で構築し、低消費電力で高速に知的な画像認識が実現できることを実証した。

審査要旨 要旨を表示する

 情報化社会の進展に伴い、画像情報の高速処理、特にヒトのように柔軟な認識を実行するシステムの実現が望まれている。本論文は、"An Intelligent Image Recognition System Based on the Associative Processor Architecture"(連想プロセッサアーキテクチャに基づく知的画像処理システムの研究)と題し、ハードウェア処理に特化した認識アルゴリズムを新たに提案するとともに、医用情報処理に応用することによりその有用性を実証し、さらに同アルゴリズムを実行する専用VLSIチップを開発することにより柔軟な認識処理が実時間で実行可能なことを示した研究成果を纏めたもので、全文8章よりなり、英文で書かれている。

 第1章は、序論であり、本研究の背景について議論するとともに、本論文の構成について述べている。

 第2章では、二次元の画像をマッチング処理に適したベクトル表現に変換する新たなアルゴリズムの提案を行っている。画像の中の特徴的なエッジ情報を抽出し、その空間分布を主要な方向に投影してベクトル表現を得る手法であり、Projected Principal-Edge Distribution(PPED)法と名づけている。これは、元画像の次元を64分の1に削減するとともに、我々の目に類似して見える画像はベクトル空間でも近距離にマッピングされる優れた表現法である。この提案は重要な研究成果である。

 第3章は、PPED法を矯正歯科専門医の重要な診療行為である頭部X線写真の解析に応用することにより、画像認識アルゴリズムとしての最適化を行った結果について述べている。Sella、Nasion、Orbitaleと呼ぶ三つの解剖学的特徴点を例題とし、専門医と同等の判断が出来るように各認識パラメタの最適化を行っている。特にマクロビジョン探索と呼ぶ新たな方法を提案している。これはまず対象を大まかに把握し、その後細かく候補を絞っていくというヒトの認知過程に習った認識アルゴリズムを採用したものである。

 第4章は、前章で開発した頭部X線写真の解析システムを実際の診療現場の多くの症例について適用し、その有効性を検証した結果を纏めている。250枚のX線写真、各写真26個の特徴点についてテストを行い、明瞭な骨組織上の特徴点のみならず専門医も苦労する軟組織上の特徴点も有効に検出できることを示している。これは実用上重要な結果である。

 第5章は、"Advanced Algorithms for Associative Processing"と題し、手書の文字認識等バイナリ画像への適応についての新たな展開を述べている。マルチスケールの概念を導入し、Zoom lens metaphorと呼ぶ認知科学の興味ある問題への適応も可能であることを述べている。

 第6章は、"VLSI Chips for PPED Vector Generation"と題し、計算コストの高いPPEDベクトル生成を実時間認識処理に適用可能なよう、専用プロセッサを開発した研究について述べている。繊細なグレースケール画像の認識では、エッジ検出時の閾値の決定が重要であるが、これには画素値の局所的な分散値からメディアンを検出して用いる手法が有効であることを見出し、これをアナログ・デジタル融合の回路アーキテクチャで実現している。これにより、入力画像に対し閾値検出から4方向のエッジフィルター処理、ベクトル生成までをすべて並列パイプライン処理で高速に実行できるLSIチップを完成している。これは実時間処理実現に重要な成果である。

 第7章では、実際にVLSIチップを用いて認識処理の実験を行い、ソフトウェア処理との比較によってハードウェア処理の有用性について論じている。

 第8章は結論である。

 以上要するに本論文は、連想プロセッサと呼ぶ並列データ検索専用のハードウェア処理に適合する、二次元画像の新たなベクトル表現アルゴリズムPPED法を提案するとともに、これを用いた柔軟な画像認識システムを開発し、医用情報処理に応用することによりその有用性を実証したものである。さらに、同アルゴリズムを実行する専用VLSIチップを開発することにより実時間の認識処理が可能なことを示した研究であり、電子工学の発展に寄与するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク http://hdl.handle.net/2261/1907