近年、携帯電話、自動車電話の普及、音声認識の実用化などが急速に進んでいる。これらの用途において、音声は最も重要なコミュニケーション媒体であり、使用感、実用性を決定する技術の一つである。ところが、その音環境は、車内、駅など、劣悪であり、周囲雑音を除去した高品質な音声収録技術の重要性が高まっている。マイクロホンアレイは、複数のマイクロホンにより取得した信号に、ビームフォーミング信号処理を施す事により、雑音除去、残響除去、音声抽出などを行う空間的なフィルタ技術である。この技術には多数のアナログディジタル変換器が必要であり、また、処理に必要な演算量が多いため、かつては、実用的ではないと言われていた。しかし、最近、LSI技術の急速な進歩により、実用化の可能性が高まったため、研究が盛んになっている。適応マイクロホンアレイは、適応信号処理を用いて、マイクロホンアレイの空間フィルタ能力を最大限に発揮させる技術である。原理は、すでに実用化されつつある適応アンテナアレイと同様であるが、「扱う周波数帯域が広い」、「波長が長い」などの理由により、高性能が発揮し難い、実用的でないと言われてきた。本論文では、この適応マイクロホンアレイの実用化のために、一般化サイドローブキャンセラに基づく、いくつかの新構成を提案し、コンピュータシミュレーション、および、実時間処理システムを用いた実験により、その有効性を実証する。 まず第2章では、誤差に対するロバスト性の問題を扱う。原理的な適応マイクロホンアレイ、例えば、Griffiths-Jimビームフォーマは、誤差に弱く、信号の到来方向などに誤差がある場合には、雑音などの不要信号が除去されるとともに、目標の信号まで除去されてしまうという問題がある。この問題に対応したものは、ロバスト適応マイクロホンアレイと呼ばれる。これまで幾つかのロバスト化手法が提案されているが、ロバスト化と引き替えに、雑音除去性能の低下、マイクロホン数増加、演算量の急激な増大などの問題が生じる。本論文では、一般化サイドローブキャンセラに新たな適応フィルタを導入したロバスト適応マイクロホンアレイを提案する。 一般化サイドローブキャンセラは、固定ビームフォーマ、ブロッキング行列、多入力キャンセラと呼ばれる部分から構成されている。ブロッキング行列は、従来固定的な構成であったが、提案法では、リーク適応フィルタを用いた適応的な構成とすることにより、誤差の影響を吸収し、ロバスト性を獲得する。この適応的なブロッキング行列は、目標信号到来方向を追従する一手法として解釈することもできる。ロバスト化のために、雑音除去のための空間的自由度を犠牲にしていないため、少数マイクロホンで、高い雑音除去能力とロバスト性が得られる。また、演算量の増加も1.5倍程度であり、現在のDSP(Digital Signal Processor)1個で十分実現可能な演算量である。シミュレーションにより、そのロバスト性を実証し、目標信号到来方向について、20度という大きな誤差を許容できることを示す。 続く3、4章では、この適応ブロッキング行列を導入した一般化サイドローブキャンセラに基づいて、空間分離能力を改善するための手法を2つ提案する。3章では、適応ブロッキング行列について議論し、誤差吸収および目標信号到来方向追従を高精度で行うために、適応ブロッキング行列において、係数拘束適応フィルタという新規な適応則を用いる適応フィルタを導入する手法を提案する。この係数拘束適応フィルタでは、各フィルタ係数値を、一定範囲内を逸脱しないように不等式で拘束する。拘束範囲は、目標信号の追従が可能、かつ、雑音の追従が不可能となるように設定する。その結果、目標信号追従の範囲を、目標が存在しうる領域に設計することが可能となる。したがって、雑音除去性能と目標信号品質の両立、すなわち高い空間分離能力を得られる。しかも、そのための信号処理は、行列などの大規模な演算は必要とせず、各フィルタ係数において簡単に行うことができる。シミュレーションでは、雑音を26dB以上除去できることを示し、その高い空間分離能力を確認する。 第4章では、多入力キャンセラについて議論し、空間分離能力をさらに高めた構成を提案する。まず理論的に、多入力キャンセラの適応則について考察を行い、フィルタ係数のノルムに不等式型の非線形拘束を導入したアルゴリズムが、他の手法より理想に近いことを指摘する。この考察に基づいて、このノルム拘束適応フィルタを多入力キャンセラに導入した構成を提案する。シミュレーションでは、一定範囲の方向から到来した信号は通過させ、その範囲を僅かでも逸脱すると信号が抑圧するような、理想に近い特性が得られることを示す。また、実環境において収録した信号を用いて、19dBもの雑音除去が可能であることを示す。さらに処理後の信号について、5点満点のMOS(Mean Opinion Score)に基づく定量的な主観音質評価を行う。提案法のMOS得点は3.8であり、従来法の2.6を大きく上回る主観音質が得られることを示す。 第5章では、係数更新を制御する方法について議論し、新しい制御法を提案する。適応マイクロホンアレイでは、エコーキャンセラにおけるダブルトーク制御と同様に、適応すなわち係数更新するタイミングの制御は、出力信号の品質を決定する重要な要素技術である。提案する適応ブロッキング行列を用いた構成においても、適応信号処理が2段階に従属接続されており、各段の適応信号処理の干渉を避けるため、係数更新制御は必須である。これまで、2つのマイク信号の相互相関を制御の指標とする係数更新制御法が提案されている。しかし、この制御法は、適応ブロッキング行列を用いている提案法には適していない。指標の分散が大きいため、誤った制御が行われる確率が高く、その結果、雑音が息づきように変調される現象(息づき雑音)が生じる。この息づき雑音は主観的にとても不快な雑音である。本章では、係数更新制御法のための新指標として、固定ビームフォーマの出力信号と、適応ブロッキング行列の出力信号の電力比を用いる手法を提案する。この新指標は、相互相関と比較して、分散が小さいため、制御を誤る確率が減少する。その結果、息づき雑音が低減され、主観音質が改善される。実環境において収録した信号を用いてシミュレーションを行い、息づき雑音が減少することを、波形レベルで示す。また出力信号のMOS評価により、その主観音質改善効果を確認する。 第6章では、主観的な音質、使い勝手をさらに改善するために、固定ビームフォーマに関係する手法について議論する。まず出力信号の高域特性を改善するために、補助的な固定ビームフォーマを信号経路に用いる手法を提案する。これまで信号経路には、ブロッキング行列におけるトラッキングのための固定ビームフォーマ出力を借用していた。ブロッキング行列のための固定ビームフォーマは、高域が減衰する特性を持っているため、信号経路においても高域が減衰し、こもり感などの主観的な音質劣化があった。これに対し提案法では、信号経路のために最適化した補助固定ビームフォーマを新たに設けることにより、高域減衰を防止し、主観的な音質を改善する。 また、別の補助固定ビームフォーマを用いることにより、係数更新制御の特性を安定させ、出力信号の音質を改善する手法を提案する。これまで係数更新制御のために、適応ブロッキング行列の出力信号を用いていたが、適応ブロッキング行列の収束状況の影響を受けるため、移動信号源に対して係数更新制御が安定せず、信号源の移動方向によって感度が著しく異なる現象(ヒステリシス)が生じることがある。これに対し、提案法では、適応ブロッキング行列の出力信号の代わりに、新たな補助固定ビームフォーマの出力信号を用いることにより、収束状況の影響を避け、ヒステリシスを排除する。 いずれの補助固定ビームフォーマも必要な演算量はわずかであり、実用化における問題はない。これらの提案法について、実機を用いた実時間評価により、その有効性を確認する。出力信号のスペクトルを従来法と比較し、提案法において、高域の感度が3dB増加していることを示す。また、移動音源に対する感度のグラフから、ヒステリシスが除去されていることを示す。 第7章では、提案する適応マイクロホンアレイの実機実現について述べる。適応マイクロホンアレイは演算量が多いとされており、実機で実現した例はこれまで数例しかない。本章ではマルチDSPを用いた実現と単一DSPを用いた実現について報告する。これらの実機は、6章までの実時間評価において用いられている。前者は、ワークステーションおよび12個のDSPが搭載されたボード群から構成されている。その大きさは、19インチラック1台と巨大であるが、主にCコンパイラによりプログラミングできるため、フレキシビリティが高く、アルゴリズムの検証、改良を行うために適している。後者は、小型のパーソナルコンピュータにDSPボードを内蔵した構成である。プラグラミングはアセンブラで行わなければならないため手間がかかるが、小型であるため、様々な環境に持ち出して実験を行うことができる。 最後に第8章では、本論文全体の研究成果をまとめ、今後の展望について述べる。 |