学位論文要旨



No 214248
著者(漢字) 宝珠山,治
著者(英字)
著者(カナ) ホウシュヤマ,オサム
標題(和) 適応マイクロホンアレイに関する研究
標題(洋) A Study on Adaptive Microphone Arrays
報告番号 214248
報告番号 乙14248
学位授与日 1999.03.17
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第14248号
研究科 工学系研究科
専攻 電子情報工学専攻
論文審査委員 主査: 東京大学 教授 羽鳥,光俊
 東京大学 教授 青山,友紀
 東京大学 教授 原島,博
 東京大学 教授 廣瀬,啓吉
 東京大学 助教授 相澤,清晴
内容要旨

 近年、携帯電話、自動車電話の普及、音声認識の実用化などが急速に進んでいる。これらの用途において、音声は最も重要なコミュニケーション媒体であり、使用感、実用性を決定する技術の一つである。ところが、その音環境は、車内、駅など、劣悪であり、周囲雑音を除去した高品質な音声収録技術の重要性が高まっている。マイクロホンアレイは、複数のマイクロホンにより取得した信号に、ビームフォーミング信号処理を施す事により、雑音除去、残響除去、音声抽出などを行う空間的なフィルタ技術である。この技術には多数のアナログディジタル変換器が必要であり、また、処理に必要な演算量が多いため、かつては、実用的ではないと言われていた。しかし、最近、LSI技術の急速な進歩により、実用化の可能性が高まったため、研究が盛んになっている。適応マイクロホンアレイは、適応信号処理を用いて、マイクロホンアレイの空間フィルタ能力を最大限に発揮させる技術である。原理は、すでに実用化されつつある適応アンテナアレイと同様であるが、「扱う周波数帯域が広い」、「波長が長い」などの理由により、高性能が発揮し難い、実用的でないと言われてきた。本論文では、この適応マイクロホンアレイの実用化のために、一般化サイドローブキャンセラに基づく、いくつかの新構成を提案し、コンピュータシミュレーション、および、実時間処理システムを用いた実験により、その有効性を実証する。

 まず第2章では、誤差に対するロバスト性の問題を扱う。原理的な適応マイクロホンアレイ、例えば、Griffiths-Jimビームフォーマは、誤差に弱く、信号の到来方向などに誤差がある場合には、雑音などの不要信号が除去されるとともに、目標の信号まで除去されてしまうという問題がある。この問題に対応したものは、ロバスト適応マイクロホンアレイと呼ばれる。これまで幾つかのロバスト化手法が提案されているが、ロバスト化と引き替えに、雑音除去性能の低下、マイクロホン数増加、演算量の急激な増大などの問題が生じる。本論文では、一般化サイドローブキャンセラに新たな適応フィルタを導入したロバスト適応マイクロホンアレイを提案する。

 一般化サイドローブキャンセラは、固定ビームフォーマ、ブロッキング行列、多入力キャンセラと呼ばれる部分から構成されている。ブロッキング行列は、従来固定的な構成であったが、提案法では、リーク適応フィルタを用いた適応的な構成とすることにより、誤差の影響を吸収し、ロバスト性を獲得する。この適応的なブロッキング行列は、目標信号到来方向を追従する一手法として解釈することもできる。ロバスト化のために、雑音除去のための空間的自由度を犠牲にしていないため、少数マイクロホンで、高い雑音除去能力とロバスト性が得られる。また、演算量の増加も1.5倍程度であり、現在のDSP(Digital Signal Processor)1個で十分実現可能な演算量である。シミュレーションにより、そのロバスト性を実証し、目標信号到来方向について、20度という大きな誤差を許容できることを示す。

 続く3、4章では、この適応ブロッキング行列を導入した一般化サイドローブキャンセラに基づいて、空間分離能力を改善するための手法を2つ提案する。3章では、適応ブロッキング行列について議論し、誤差吸収および目標信号到来方向追従を高精度で行うために、適応ブロッキング行列において、係数拘束適応フィルタという新規な適応則を用いる適応フィルタを導入する手法を提案する。この係数拘束適応フィルタでは、各フィルタ係数値を、一定範囲内を逸脱しないように不等式で拘束する。拘束範囲は、目標信号の追従が可能、かつ、雑音の追従が不可能となるように設定する。その結果、目標信号追従の範囲を、目標が存在しうる領域に設計することが可能となる。したがって、雑音除去性能と目標信号品質の両立、すなわち高い空間分離能力を得られる。しかも、そのための信号処理は、行列などの大規模な演算は必要とせず、各フィルタ係数において簡単に行うことができる。シミュレーションでは、雑音を26dB以上除去できることを示し、その高い空間分離能力を確認する。

 第4章では、多入力キャンセラについて議論し、空間分離能力をさらに高めた構成を提案する。まず理論的に、多入力キャンセラの適応則について考察を行い、フィルタ係数のノルムに不等式型の非線形拘束を導入したアルゴリズムが、他の手法より理想に近いことを指摘する。この考察に基づいて、このノルム拘束適応フィルタを多入力キャンセラに導入した構成を提案する。シミュレーションでは、一定範囲の方向から到来した信号は通過させ、その範囲を僅かでも逸脱すると信号が抑圧するような、理想に近い特性が得られることを示す。また、実環境において収録した信号を用いて、19dBもの雑音除去が可能であることを示す。さらに処理後の信号について、5点満点のMOS(Mean Opinion Score)に基づく定量的な主観音質評価を行う。提案法のMOS得点は3.8であり、従来法の2.6を大きく上回る主観音質が得られることを示す。

 第5章では、係数更新を制御する方法について議論し、新しい制御法を提案する。適応マイクロホンアレイでは、エコーキャンセラにおけるダブルトーク制御と同様に、適応すなわち係数更新するタイミングの制御は、出力信号の品質を決定する重要な要素技術である。提案する適応ブロッキング行列を用いた構成においても、適応信号処理が2段階に従属接続されており、各段の適応信号処理の干渉を避けるため、係数更新制御は必須である。これまで、2つのマイク信号の相互相関を制御の指標とする係数更新制御法が提案されている。しかし、この制御法は、適応ブロッキング行列を用いている提案法には適していない。指標の分散が大きいため、誤った制御が行われる確率が高く、その結果、雑音が息づきように変調される現象(息づき雑音)が生じる。この息づき雑音は主観的にとても不快な雑音である。本章では、係数更新制御法のための新指標として、固定ビームフォーマの出力信号と、適応ブロッキング行列の出力信号の電力比を用いる手法を提案する。この新指標は、相互相関と比較して、分散が小さいため、制御を誤る確率が減少する。その結果、息づき雑音が低減され、主観音質が改善される。実環境において収録した信号を用いてシミュレーションを行い、息づき雑音が減少することを、波形レベルで示す。また出力信号のMOS評価により、その主観音質改善効果を確認する。

 第6章では、主観的な音質、使い勝手をさらに改善するために、固定ビームフォーマに関係する手法について議論する。まず出力信号の高域特性を改善するために、補助的な固定ビームフォーマを信号経路に用いる手法を提案する。これまで信号経路には、ブロッキング行列におけるトラッキングのための固定ビームフォーマ出力を借用していた。ブロッキング行列のための固定ビームフォーマは、高域が減衰する特性を持っているため、信号経路においても高域が減衰し、こもり感などの主観的な音質劣化があった。これに対し提案法では、信号経路のために最適化した補助固定ビームフォーマを新たに設けることにより、高域減衰を防止し、主観的な音質を改善する。

 また、別の補助固定ビームフォーマを用いることにより、係数更新制御の特性を安定させ、出力信号の音質を改善する手法を提案する。これまで係数更新制御のために、適応ブロッキング行列の出力信号を用いていたが、適応ブロッキング行列の収束状況の影響を受けるため、移動信号源に対して係数更新制御が安定せず、信号源の移動方向によって感度が著しく異なる現象(ヒステリシス)が生じることがある。これに対し、提案法では、適応ブロッキング行列の出力信号の代わりに、新たな補助固定ビームフォーマの出力信号を用いることにより、収束状況の影響を避け、ヒステリシスを排除する。

 いずれの補助固定ビームフォーマも必要な演算量はわずかであり、実用化における問題はない。これらの提案法について、実機を用いた実時間評価により、その有効性を確認する。出力信号のスペクトルを従来法と比較し、提案法において、高域の感度が3dB増加していることを示す。また、移動音源に対する感度のグラフから、ヒステリシスが除去されていることを示す。

 第7章では、提案する適応マイクロホンアレイの実機実現について述べる。適応マイクロホンアレイは演算量が多いとされており、実機で実現した例はこれまで数例しかない。本章ではマルチDSPを用いた実現と単一DSPを用いた実現について報告する。これらの実機は、6章までの実時間評価において用いられている。前者は、ワークステーションおよび12個のDSPが搭載されたボード群から構成されている。その大きさは、19インチラック1台と巨大であるが、主にCコンパイラによりプログラミングできるため、フレキシビリティが高く、アルゴリズムの検証、改良を行うために適している。後者は、小型のパーソナルコンピュータにDSPボードを内蔵した構成である。プラグラミングはアセンブラで行わなければならないため手間がかかるが、小型であるため、様々な環境に持ち出して実験を行うことができる。

 最後に第8章では、本論文全体の研究成果をまとめ、今後の展望について述べる。

審査要旨

 本論文は「A Study on adaptive microphone arrays(適応マイクロホンアレイに関する研究)」と題し、雑音環境下における収音を目的として、複数のマイクロホンを使用した指向性制御技術(ビームフォーミング)を用いた雑音除去技術について論じている。その中で、一般化サイドローブキャンセラ構成に基づいた、演算量の少ないロバスト化手法を提案している。また、その各部分の構成について検討し、性能的に最適な構成を提案している。さらに、提案構成を実時間処理システムに実現し、実環境における実験により、その有効性を検証している。本文は全8章からなり、英文で記されている。

 第1章は「Introduction(序論)」であり、音響用ビームフォーミングの原理から、最近の研究動向までを概観している。まず、音声通信、音声認識などを雑音環境下で行う応用におけるビームフォーミング技術の有効性を述べている。そして、マイクロホン数、配置領域の大きさ、雑音除去能力、誤差に対するロバスト性、空間選択性などの課題および問題点を整理し、適応ビームフォーミング技術に基づく適応マイクロホンアレイがマイクロホン数、配置領域の大きさ、雑音除去能力の点で、有望であることを指摘している。

 第2章は、「A robust adaptive microphone array with an adaptive blocking matrix using leaky adaptive filters:ABM-LAF(リーク適応フィルタを用いた適応的なブロッキング行列を有するロバスト適応マイクロホンアレイ:ABM-LAF)」と題し、誤差に対して性能劣化が少ない(ロバスト性)適応マイクロホンアレイの構成を提案している。この構成は一般化サイドローブキャンセラの一種であり、固定ビームフォーマ、ブロッキング行列、多入力キャンセラと呼ばれる部分から構成されている。ブロッキング行列と呼ばれる部分を適応的に変化させることにより、誤差の影響を吸収し、ロバスト性を獲得することに成功している。この構成は、目標信号到来方向を追従する一手法として解釈することもできる。ロバスト性のために雑音除去のための空間的自由度を犠牲にしていないため、少数マイクロホンで、高い雑音除去能力とロバスト性が得られる。目標信号到来方向に誤差がある状況のシミュレーションにより、そのロバスト性を実証している。

 第3章は、「An adaptive blocking matrix using coefficient-constrained adaptive filters:ABM-CCAF(係数拘束適応フィルタを用いた適応ブロッキング行列:ABM-CCAF)」という題で、第2章で提案した適応ブロッキング行列について議論し、空間分離能力に優れた構成を提案している。この適応ブロッキング行列では、特に、誤差吸収および目標信号到来方向追従を高精度で行うために、係数拘束適応フィルタという新規な適応則を用いる適応フィルタを考案している。この係数拘束適応フィルタを導入することにより、目標方向追従の範囲をフィルタ係数空間で効率的に制限することが可能となり、雑音除去性能と目標信号品質を両立させること、すなわち高い空間分離能力を得ることに成功している。シミュレーションでは、一定範囲の方向から到来した信号は通過させ、その範囲を僅かでも逸脱すると信号が抑圧するという理想に近い特性が得られることを示している。

 第4章は、「A multi-input canceller using norm-constrained adaptive filters:MC-NCAF(ノルム拘束適応フィルタを用いた多入力キャンセラ:MC-NCAF)」という題で、多入力キャンセラについて議論し、空間分離能力をさらに高めた構成を提案している。まず、定性的な議論により、多入力キャンセラの適応則として、フィルタ係数のノルムに不等式型の非線形拘束を導入したアルゴリズムが、他の手法より理想に近いことを指摘し、このアルゴリズムを導入したノルム拘束適応フィルタを用いた多入力キャンセラの構成を提案している。シミュレーションによって、空間分離能力がさらに向上していることを示している。また、実環境において収録した信号を用いて、17dBもの雑音除去が可能であることを示している。

 第5章は、「Adaptation-mode control for robust adaptive microphone arrays(ロバスト適応マイクロホンアレイのための適応モード制御)」という題で、4章までで提案したロバスト適応マイクロホンアレイにおける係数更新を制御する方法について議論し、新しい制御法を提案している。まず係数更新の制御方法の重要性を説明し、相互相関を用いる従来法の問題点を指摘している。この問題を回避するために、複数のビームフォーマの出力信号電力比に基づく手法を提案し、シミュレーションにより、その有効性を実証している。

 第6章は、「Auxiliary fixed beamformers for better sound quality(高音質化のための補助固定ビームフォーマ)」と題し、補助的な固定ビームフォーマを用いる音質改善法を2つ提案している。まず出力信号の高域特性を完全にするために、補助固定ビームフォーマを信号経路に用いる手法を考案している。また、別の補助固定ビームフォーマを用いることにより、係数更新制御の特性を安定させ、出力信号の音質を改善する手法を提案している。いずれの手法も実機による実時間評価により、その有効性を実証している。

 第7章は、「Implementation of adaptive microphone arrays(適応マイクロホンアレイの実現)」と題し、提案法を含めた適応マイクロホンアレイの実機実現について述べている。適応マイクロホンアレイは演算量が多いとされており、実機実現例は少ない。本章ではマルチDSP(ディジタル信号処理プロセッサ)を用いた実現と、単一DSPを用いた実現について報告している。この実機は、6章までの実時間評価においても用いられている。

 第8章は、 「Conclusion(結論)」であり、本研究の成果を要約している。

 以上これを要するに、本論文は、雑音環境下における収音のための雑音除去技術として、マイクロホンアレイを用いた指向性制御技術における新しい手法を提案し、従来の手法と比較し、その優位を理論的、実験的に明らかにしたものであり、電子情報工学上貢献するところが少なくない。

 よって、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク