JP2014052585A

JP2014052585A - 音響処理装置

Info

Publication number: JP2014052585A
Application number: JP2012198329A
Authority: JP
Inventors: Tatsuya Komatsu; 達也小松; Kazuya Takeda; 一哉武田; Kazunobu Kondo; 多伸近藤
Original assignee: Nagoya University NUC; Yamaha Corp
Current assignee: Nagoya University NUC; Yamaha Corp
Priority date: 2012-09-10
Filing date: 2012-09-10
Publication date: 2014-03-20

Abstract

【課題】簡便な処理で音響信号の残響成分を有効に調整する。
【解決手段】変数設定部４２は、残響時間Ｔ₆₀を設定する。係数特定部４４は、残響時間Ｔ₆₀に応じた平滑化係数αを特定する。強度平均部４６は、係数特定部４４が特定した平滑化係数αを適用した音響信号ｘ(n)のパワースペクトルＰ_X(k,m)の指数移動平均で平均スペクトルＰ_X(k)を算定する。調整値算定部４８は、音響信号ｘ(n)の残響成分を抑圧するための調整値Ｇ(k,m)を平均スペクトルＰ_X(k)に対するパワースペクトルＰ_X(k,m)の比Ｐ_X(k,m)/Ｐ_X(k)に応じて算定する。調整値算定部４８が算定した調整値Ｇ(k,m)を音響信号ｘ(n)に作用させることで残響成分が抑圧される。
【選択図】図１

Description

本発明は、音響信号を処理する技術に関し、特に、音響信号に含まれる残響成分を調整する技術に関する。

音響信号に含まれる残響成分を抑圧する技術が従来から提案されている。例えば特許文献１には、音響信号に含まれる残響成分を推定する予測フィルタ係数の確率モデルを利用することで残響成分の予測フィルタ係数を推定し、推定後の予測フィルタを利用して残響成分を抑圧する技術が開示されている。また、非特許文献１には、発音源から収音点までの伝達関数の逆フィルタを推定し、推定後の逆フィルタを音響信号に適用することで残響成分を抑圧する技術が開示されている。

特開２００９−２１２５９９号公報

K. Furuya, et al."Robust speech dereverberation using multichannel blind deconvolution with spectral subtraction",IEEE Transantions on Audio, Speech, and Language Processing, vol. 15, no. 5, p.1579-1591, 2007

しかし、特許文献１の予測フィルタ係数や非特許文献１の逆フィルタの高精度な推定には膨大な演算が必要であるという問題がある。以上の事情を考慮して、本発明は、簡便な処理で音響信号の残響成分を調整（抑圧または強調）することを目的とする。

以上の課題を解決するために、本発明の音響処理装置は、残響時間に応じた移動平均係数を特定する係数特定手段と、係数特定手段が特定した移動平均係数を適用した音響信号の強度（例えばパワースペクトルＰ_X(k,m)）の移動平均で平均強度（例えば平均スペクトルＰ_X(k)）を算定する強度平均手段と、音響信号の残響成分を調整するための調整値を平均強度に応じて算定する調整値算定手段と、調整値算定手段が算定した調整値を音響信号に作用させる残響調整手段とを具備する。以上の構成では、音響信号の平均強度に応じて残響成分の調整値が算定されるから、特許文献１や非特許文献１の技術と比較して簡便な処理で音響信号の残響成分を調整できるという利点がある。また、平均強度の算定に適用される移動平均係数が残響時間に応じて可変に設定されるから、移動平均係数が所定値に固定された構成と比較して残響成分を有効に調整できるという利点もある。

本発明の好適な態様において、調整値算定手段は、平均強度と比較して高い追従性で音響信号の強度に追従する強度指標の、平均強度に対する比（例えば平均強度に対する音響信号の強度の比）に応じて調整値を算定する。特に、平均強度に対する前記音響信号の強度の比に応じて調整値を算定する構成によれば、簡便な処理で音響信号の残響成分を調整できるという効果は格別に顕著である。また、平均強度に対する強度指標の比が残響時間に影響されるという傾向を考慮すると、平均強度に対する強度指標の比と、残響時間に応じた補正係数（例えば補正係数Ａ1）とに応じて調整値を算定する構成が好適である。以上の態様では、残響時間に応じた補正係数が調整値の算定に適用されるから、残響時間が長い場合でも音響信号の残響成分を充分に抑圧できるという利点がある。

本発明の好適な態様において、係数特定手段は、残響時間が長いほど小さい数値となる平滑化係数（例えば平滑化係数α）を移動平均係数として特定し、強度平均手段は、音響信号の最新の強度に対して平滑化係数を適用した音響信号の強度の指数移動平均を平均強度として算定する。換言すると、残響時間が長いほど、指数移動平均における過去の平均強度に対する平滑化係数（例えば平滑化係数(１−α)）は大きい数値となる。以上の態様では、残響時間が長いほど音響信号の最新の強度に対する平滑化係数が小さい数値に設定されるから、音響信号の残響成分を有効に調整することが可能である。

本発明の好適な態様において、調整値算定手段は、音響信号の残響成分を抑圧するための調整値を算定し、係数特定手段は、残響成分の抑圧前の音響信号の目的音残響比と調整値を適用した抑圧後の音響信号の目的音残響比との差分が最大になるという条件のもとで近似的に選定された関係（例えば近似線Ｌの関係）を充足するように、残響時間に対応する移動平均係数を特定する。以上の態様では、残響成分の抑圧の前後にわたる目的音残響比の差分が最大となる条件のもとで近似的に選定された関係（例えば近似線の関係）を充足するように残響時間に応じた移動平均係数が特定されるから、音響信号の残響成分を有効に調整できるという効果は格別に顕著である。

以上の各態様に係る音響処理装置は、音響信号の処理に専用されるＤＳＰ（Digital Signal Processor）などのハードウェア（電子回路）によって実現されるほか、ＣＰＵ（Central Processing Unit）などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、残響時間に応じた移動平均係数を特定する係数特定処理と、係数特定処理で特定した移動平均係数を適用した音響信号の強度の移動平均で平均強度を算定する強度平均処理と、音響信号の残響成分を調整するための調整値を平均強度に応じて算定する調整値算定処理と、調整値算定処理で算定した調整値を音響信号に作用させる残響調整処理とをコンピュータに実行させる。以上のプログラムによれば、本発明に係る音響処理装置と同様の作用および効果が実現される。なお、本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。

本発明の第１実施形態に係る音響処理装置のブロック図である。解析処理部のブロック図である。解析装置のブロック図である。解析装置の動作のフローチャートである。平均個数と抑圧効果指標との関係を示すグラフである。残響時間と最適個数との関係を示すグラフである。残響時間と相補ウィナーフィルタの数値との関係を示すグラフである。

＜第１実施形態＞
図１は、本発明の第１実施形態に係る音響処理装置１００のブロック図である。図１に示すように、音響処理装置１００には信号供給装置１２と放音装置１４とが接続される。信号供給装置１２は、音響信号ｘ(n)を音響処理装置１００に供給する。音響信号ｘ(n)は、発音源から放射された音響に対して音響空間内で反射または散乱した音響成分（初期反射成分および後期残響成分）を付加した音響の時間波形を示すサンプル系列（ｎ：サンプル番号）である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号ｘ(n)や、残響効果がある音響空間（例えば音響ホール等）内で実際に収録された音響の音響信号ｘ(n)が好適に利用される。周囲の音響を収音して音響信号ｘ(n)を生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号ｘ(n)を取得して音響処理装置１００に供給する再生装置や、通信網から音響信号ｘ(n)を受信して音響処理装置１００に供給する通信装置が信号供給装置１２として採用され得る。

第１実施形態の音響処理装置１００は、音響信号ｘ(n)の残響成分（後期残響成分）を抑圧した時間領域の音響信号ｙ(n)を生成する残響抑圧装置である。放音装置１４（例えばスピーカやヘッドホン）は、音響処理装置１００が生成した音響信号ｙ(n)に応じた音波を再生する。なお、音響信号ｙ(n)をデジタルからアナログに変換するＤ/Ａ変換器や音響信号ｙ(n)を増幅する増幅器等の図示は便宜的に省略した。

図１に示すように、音響処理装置１００は、演算処理装置２２と記憶装置２４とを具備するコンピュータシステムで実現される。記憶装置２４は、演算処理装置２２が実行するプログラムＰGM1や演算処理装置２２が使用する各種のデータ（例えば後述の相関係数Ｃ）を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置２４として任意に採用され得る。音響信号ｘ(n)を記憶装置２４に記憶した構成（したがって信号供給装置１２は省略される）も好適である。

演算処理装置２２は、記憶装置２４に記憶されたプログラムＰGM1を実行することで、音響信号ｘ(n)から音響信号ｙ(n)を生成するための複数の機能（周波数分析部３２，解析処理部３４，残響調整部３６，波形合成部３８）を実現する。なお、演算処理装置２２の各機能を複数の装置に分散した構成や、専用の電子回路（ＤＳＰ）が各機能を実現する構成も採用され得る。

周波数分析部３２は、音響信号ｘ(n)のスペクトル（複素スペクトル）Ｘ(k,m)を時間軸上の単位期間（フレーム）毎に順次に生成する。記号ｋは、周波数軸上の任意の１個の周波数（帯域）を指定する変数であり、記号ｍは、時間軸上の任意の１個の単位期間（時間軸上の特定の時点）を指定する変数である。スペクトルＸ(k,m)の生成には、短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。なお、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクも周波数分析部３２として採用され得る。

解析処理部３４は、音響信号ｘ(n)のスペクトルＸ(k,m)に応じた調整値Ｇ(k,m)を各周波数について単位期間毎に順次に算定する。第１実施形態の調整値Ｇ(k,m)は、音響信号ｘ(n)の残響成分を抑圧するための変数（ゲイン）である。概略的には、第ｍ番目の単位期間の音響信号ｘ(n)のうち第ｋ番目の周波数の成分において残響成分が優勢であるほど調整値Ｇ(k,m)は小さい数値に設定されるという傾向がある。

残響調整部３６は、解析処理部３４が算定する調整値Ｇ(k,m)を音響信号ｘ(n)に作用させる。残響調整部３６による調整は、各周波数について単位期間毎に順次に実行される。具体的には、残響調整部３６は、音響信号ｘ(n)のスペクトルＸ(k,m)に調整値Ｇ(k,m)を乗算することで音響信号ｙ(n)のスペクトルＹ(k,m)を算定する（Ｙ(k,m)＝Ｇ(k,m)・Ｘ(k,m)）。すなわち、調整値Ｇ(k,m)は、音響信号ｘ(n)のスペクトルＸ(k,m)に対するゲイン（スペクトルゲイン）に相当する。

波形合成部３８は、残響調整部３６が単位期間毎に生成するスペクトルＹ(k,m)から時間領域の音響信号ｙ(n)を生成する。すなわち、波形合成部３８は、各単位期間のスペクトルＹ(k,m)を短時間逆フーリエ変換で時間領域の信号に変換するとともに相前後する単位期間について相互に連結することで音響信号ｙ(n)を生成する。波形合成部３８が生成した音響信号ｙ(n)が放音装置１４に供給されて音波として再生される。

＜調整値Ｇ(k,m)の検討＞
調整値Ｇ(k,m)の条件について以下に検討する。まず、１個の単位期間を平均的な音素の時間長に設定したうえで単位期間内のサンプルの総数をＮ_Eと表記し、音声が音素間（単位期間の相互間）で無相関であると仮定すると、発音源から放射された音響を示す音源信号ｓ(n)のうち１個の音素内（第ｍ番目の単位期間内）の自己相関関数Ｒ_s ^(m)(τ)は以下の数式(1)で表現される。

以下の数式(2)のように表現することも可能である。

数式(1)および数式(2)の記号τは、サンプルの個数で表現された時間差（ラグ）を意味し、数式(1)の記号Ｅ_n[ ]は、時間的な平均値（時間軸上の複数のサンプルにわたる平均値）を意味する。

他方、室内インパルス応答（ＲＩＲ：Room Impulse Response）ｈ(μ)は以下の数式(3)で表現される。

数式(3)の記号ｂ(μ)は、疑似乱数を意味する。例えば、独立同分布（i.i.d.）の白色雑音（平均零のガウス過程）が疑似乱数ｂ(μ)として好適である。また、記号Ｔ₆₀は残響時間を意味し、記号Ｎ₆₀は、サンプリング周波数ｆsでの残響時間Ｔ₆₀内のサンプルの総数を意味する。数式(3)から理解される通り、室内インパルス応答ｈ(μ)は、独立同分布の確率過程で表現される疑似乱数ｂ(μ)と指数減衰部ｅ^−Δμとでモデル化される。また、室内インパルス応答ｈ(μ)は、以下の数式(4)で表現される通り、空間的な平均値（発音源の複数の位置と収音点の複数の位置とにわたる集合平均）Ｅ_h[ ]に対して無相関となる。

他方、音響信号ｘ(n)の自己相関関数Ｒ_x(τ)は、以下の数式(5)で表現される。

数式(5)の記号Ｅ_n,hは、時間的および空間的な平均値（期待値）を意味する。なお、数式(5)の導出では、音響信号ｘ(n)が初期反射成分ｘ_E(n)と後期残響成分ｘ_R(n)との加算で表現されるという関係（ｘ(n)＝ｘ_E(n)＋ｘ_R(n)）を利用した。数式(5)の右辺の各項について以下に検討する。

数式(5)の第１項を以下の数式(6)のように変形する。

前掲の数式(3)で表現される室内インパルス応答ｈ(μ)のうち指数減衰部ｅ^−Δμは確率過程ではないから、平均値Ｅ_h[ ]の演算から除外される。また、疑似乱数（ｂ(i)，ｂ(l)）として利用される白色雑音の自己相関関数はディラック（Dirac）のデルタ関数であるから、変数ｉと変数ｌとが合致する場合（ｉ＝ｌ）にのみ所定の数値σ_b ²となる。以上の関係を考慮すると、以下の数式(7)が導出される。

また、数式(6)のうち音源信号ｓ(n)の自己相関関数に相当する部分Ｅ_n[ｓ(n-i)ｓ(n-τ-l)]に対しては室内インパルス応答ｈ(μ)に関する部分Ｅ_h[ｈ(i)ｈ(l)]が係数として作用するから、変数ｉと変数ｌとが合致する場合（ｉ＝ｌ）のみを加味すれば足りる。したがって、数式(6)は以下の数式(8)に変形される。なお、数式(8)の導出では、変数(n-i)を変数ｎ'に置換した。

前述のように音声が音素間で無相関であると仮定し、前掲の数式(2)の条件を加味すると、数式(8)における自己相関関数Ｒ_s(τ)を数式(1)の自己相関関数Ｒ_s ^(m)(τ)に置換しても一般性は維持される。したがって、数式(5)の第１項は以下の数式(9)のように変形される。

数式(9)の積和項が等比級数の和であることを考慮して等比級数の和の公式を適用すると、数式(5)の第１項に相当する数式(9)は、以下の数式(10)に変形される。なお、数式(10)では、表記を簡略化するために係数項を統括的に記号(σ_b')²で表現した。

後期残響成分ｘ_R(n)が初期反射区間の終点（Ｎ_E）から残響時間Ｔ₆₀終点（Ｎ₆₀）までの音響成分であることを考慮すると、数式(5)の第２項は以下の数式(11)のように変形される。

数式(11)の平均値Ｅ_h[ｈ(i)ｈ(l)]は、変数ｉと変数ｌとが合致する場合のみ有意な数値となるが、変数ｉの値域（Ｎ_E≦ｉ≦Ｎ₆₀）と変数ｌの値域（０≦ｌ≦Ｎ_E−１）とは相互に重複しないから、変数ｉと変数ｌとが合致することはない。したがって、数式(11)の平均値Ｅ_h[ｈ(i)ｈ(l)]は０である。以上の関係に前掲の数式(4)の関係を加味すると、数式(5)の第２項Ｅ_n,h[ｘ_R(n)ｘ_E(n-τ)]は０となることが理解される。また、数式(5)の第３項Ｅ_n,h[ｘ_E(n)ｘ_R(n-τ)]についても同様に０となる。

数式(5)の第４項は、後期残響成分ｘ_R(n)のみに対応するから、以下の数式(12)のように変形される。なお、数式(12)の導出では、前掲の数式(7)の導出と同様に、変数ｉと変数ｌとが合致する場合（ｉ＝ｌ）にのみ疑似乱数（ｂ(i)，ｂ(l)）の自己相関関数が所定の数値σ_b ²になるという関係を利用した。

初期反射区間の時間長Ｔ_E（サンプルのＮ_E個分）が残響時間Ｔ₆₀と比較して充分に短く（Ｔ_E≪Ｔ₆₀）、かつ、前述のように音源信号ｓ(n)が音素間では無相関であることを考慮すると、変数ｉが音素の境界を跨ぐたびに数式(12)の平均値Ｅ_n[ｓ(n-i)ｓ(n-τ-i)]は変化する。したがって、前掲の数式(9)の導出と同様に、音源信号ｓ(n)のうち第ｍ番目の音素内の自己相関関数Ｒ_s ^(m)(τ)を適用すると、数式(12)は、以下の数式(13)のように二重積和の形式に変形される（Ｍ₆₀＝Ｎ₆₀／Ｎ_E）。

数式(10)の導出と同様に、等比級数の和の公式を適用すると、数式(13)は、以下の数式(14)に変形される。

前述のように音声が音素間で無相関であるという仮定のもとでは数式(8)の自己相関関数Ｒ_s(τ)が数式(1)の自己相関関数Ｒ_s ^(m)(τ)に置換され得るという関係（Ｒ_s(τ)＝Ｅ_n,h[ｘ_E(n)ｘ_E(n-τ)]＋Ｅ_n,h[ｘ_R(n)ｘ_R(n-τ)]≒Ｒ_s ^(m)(τ)）に、以上に説明した関係（特に数式(10)および数式(14)）を加味すると、第ｍ番目の単位期間における音響信号ｘ(n)の自己相関関数Ｒ_x ^(m)(τ)は、初期反射区間の自己相関関数Ｒ_E,x ^(m)(τ)と後期残響区間の自己相関関数Ｒ_R,x ^(m)(τ)とを含む以下の数式(15)で表現される。

数式(15)の括弧内のうち後期残響区間に対応する第２項において変数ｍ’が０である場合に指数関数項ｅ^{−２Δｍ'ＮE}が１になることを考慮すると、数式(15)を以下の数式(16)のように簡略化することも可能である。

数式(16)から理解される通り、音響信号ｘ(n)の自己相関関数Ｒ_x ^(m)(τ)は、室内インパルス応答ｈ(μ)の指数減衰部ｅ^−Δμを加重値とする音源信号ｓ(n)の自己相関関数Ｒ_s ^(m)(τ)の線形和（加重和）として表現される。

自己相関関数のフーリエ変換はパワースペクトルである（Wiener-Khinchinの定理）。したがって、数式(15)を考慮すると、音響信号ｘ(n)のうち初期反射成分ｘ_E(n)のパワースペクトルＰ_E,X(k,m)は以下の数式(17)で表現され、後期残響成分ｘ_R(n)のパワースペクトルＰ_R,X(k,m)は以下の数式(18)で表現される。

数式(17)および数式(18)における記号Ｆ[ ]はフーリエ変換を意味し、記号Ｐ_S(k,m)は音源信号ｓ(n)のパワースペクトルを意味する。

音響信号ｘ(n)のうち初期反射成分ｘ_E(n)のスペクトルＸ_E(k,m)（Ｘ_E(k,m)＝Ｆ[ｘ_E(n)]）を音響信号ｘ(n)のスペクトルＸ(k,m)（Ｘ(k,m)＝Ｆ[ｘ(n)]）から回復するためのウィナーフィルタβ(k)は、以下の数式(19)で表現される。

数式(19)の記号Ｐ_X(k)は、音響信号ｘ(n)のパワースペクトルＰ_X(k)を複数の単位期間にわたり時間的に平均した平均スペクトル（Ｅ_m[Ｐ_X(k,m)]）を意味し、数式(19)の記号Ｐ_E,X(k)は、初期反射成分ｘ_E(n)のパワースペクトルＰ_E,X(k,m)を複数の単位期間にわたり時間的に平均した平均スペクトル（Ｅ_m［Ｐ_E,X(k,m)］）を意味する。音響信号ｘ(n)の平均スペクトルＰ_X(k)は、初期反射成分ｘ_E(n)の平均スペクトルＰ_E,X(k)と後期残響成分ｘ_R(n)の平均スペクトルＰ_R,X(k)との加算に相当する（Ｐ_X(k)＝Ｐ_E,X(k)＋Ｐ_R,X(k)）。

次に、後期残響成分ｘ_R(n)について検討する。音響信号ｘ(n)は時間軸上で発話区間Ｈ1と非発話区間Ｈ0とに区分される。発話区間Ｈ1は音源信号ｓ(n)が存在する区間であり、非発話区間Ｈ0は音源信号ｓ(n)が存在しない区間（発話区間Ｈ1内の音源信号ｓ(n)に由来する後期残響成分ｘ_R(n)が存在する区間）である。後期残響成分ｘ_R(n)は主に非発話区間Ｈ0で観測される。非発話区間Ｈ0内の音響信号ｘ(n)のパワースペクトルＰ_X(k,m)は、発話区間Ｈ1内の音源信号ｓ(n)のパワースペクトルＰ_S ^(H1)(k,m)の部分和として表現され、同時に後期残響成分のパワースペクトルＰ_R,X ^(H1)(k,m)の部分和に相当する。すなわち、以下の数式(20)が成立する。

数式(20)の記号ｍ1'は、非発話区間Ｈ0が開始してからのフレームの個数を意味し、記号Ｐar_(m1')[ ]は部分和を意味する。

音響信号ｘ(n)の平均スペクトルＰ_X(k)に対する１個の単位期間のパワースペクトルＰ_X(k,m)の比（以下「強度比」という）Ｐ_X(k,m)/Ｐ_X(k)を検討する。数式(20)の関係を考慮すると、強度比Ｐ_X(k,m)/Ｐ_X(k)は、以下の数式(21)で表現される。

数式(21)の部分和Ｐar_(m1')[Ｐ_R,X ^(H1)(k,m)]は、後期残響成分ｘ_R(n)のパワースペクトルＰ_R,X ^(H1)(k,m)以下の数値になる（Ｐar_(m1')[Ｐ_R,X ^(H1)(k,m)]≦Ｐ_R,X ^(H1)(k,m)）という関係を数式(21)に適用すると、以下の数式(22)が導出される。

また、数式(22)の右辺に相当する強度比Ｐ_R,X(k,m)/Ｐ_X(k)の平均値Ｅ_m[Ｐ_R,X(k,m)/Ｐ_X(k)]は、数式(19)の関係を適用することで以下の数式(23)のように表現される。

数式(22)と数式(23)とから以下の数式(24)が導出される。

数式(19)のウィナーフィルタβ(k)は、音響信号ｘ(n)のスペクトルＸ(k,m)のうち初期反射成分ｘ_E(n)のスペクトルＸ_E(k,m)を強調するように作用する。したがって、数式(24)の右辺｛１−β(k)｝は、非発話区間Ｈ0にて音響信号ｘ(n)のスペクトルＸ(k,m)から後期残響成分ｘ_R(n)のスペクトルＸ_R(k,m)を抑圧するフィルタ（相補的なウィナーフィルタであることを考慮して以下では「相補ウィナーフィルタ」という）として作用する。したがって、数式(24)から理解される通り、強度比Ｐ_X(k,m)/Ｐ_X(k)を音響信号ｘ(n)のスペクトルＸ(k,m)に乗算することで後期残響成分ｘ_R(n)が抑圧される。なお、発話区間Ｈ1内では音響信号ｘ(n)のパワースペクトルＰ_X(k,m)が初期反射成分ｘ_E(n)のパワースペクトルＰ_E(k,m)と後期残響成分ｘ_R(n)のパワースペクトルＰ_R(k,m)との加算に相当するから（Ｐ_X(k,m)＝Ｐ_E(k,m)＋Ｐ_R(k,m)）、強度比Ｐ_X(k,m)/Ｐ_X(k)の平均値（期待値）は１となり音響信号ｘ(n)は抑圧されない。

以上の知見を考慮して、第１実施形態の解析処理部３４は、残響成分の抑圧用の調整値Ｇ(k,m)を以下の数式(25)の演算で算定する。

数式(25)から理解される通り、解析処理部３４は、強度比Ｐ_X(k,m)/Ｐ_X(k)が１以上である場合に調整値Ｇ(k,m)を１（最大値）に設定し、強度比Ｐ_X(k,m)/Ｐ_X(k)が１を下回る場合に調整値Ｇ(k,m)を強度比Ｐ_X(k,m)/Ｐ_X(k)に設定する。なお、調整値Ｇ(k,m)の最大値を１以外の数値に設定した構成や、調整値Ｇ(k,m)の最小値を所定の正数に設定した構成も採用され得る。

ところで、音響信号ｘ(n)の平均スペクトルＰ_X(k)は、前掲の数式(16)を利用して導出される以下の数式(26)で表現される。なお、数式(26)の導出では、数式(10)の導出時と同様に、指数関数項ｅ^-2Δm'NEの総和に等比級数の和の公式を適用した。

残響時間Ｔ₆₀（サンプル数Ｎ₆₀）は、室内インパルス応答ｈ(μ)が６０ｄＢだけ減衰するまでの時間長であるから、数式(26)の指数関数項ｅ^-2ΔN60は１と比較して充分に小さい（ｅ^-2ΔN60≪１）。したがって、数式(26)は以下の数式(27)で近似される。

数式(27)から理解される通り、調整値Ｇ(k,m)の算定に適用される平均スペクトルＰ_X(k)は残響時間Ｔ₆₀（Ｎ₆₀）に依存する。すなわち、Ｍ個の単位期間にわたるパワースペクトルＰ_X(k,m)の平均（単純移動平均）を平均スペクトルＰ_X(k)として調整値Ｇ(k,m)を算定する場合を想定すると、調整値Ｇ(k,m)を利用して音響信号ｘ(n)の残響成分を有効に抑圧するには、平均スペクトルＰ_X(k)の算定に適用されるパワースペクトルＰ_X(k,m)の個数Ｍ（以下「平均個数Ｍ」という）を音響信号ｘ(n)の残響時間Ｔ₆₀に応じた適切な数値に設定する必要がある。

図１の記憶装置２４は、残響成分が有効に抑圧されるように事前に選定された残響時間Ｔ₆₀と平均個数Ｍとの関係を保持する。具体的には、記憶装置２４は、残響時間Ｔ₆₀と平均個数Ｍとの関係を近似する近似線（回帰直線）を規定する係数（以下「相関係数」という）Ｃを記憶する。例えば、残響時間Ｔ₆₀と平均個数Ｍとの関係を近似する１次の回帰直線の勾配が相関係数（回帰係数）Ｃとして記憶装置２４に記憶される。

図２は、第１実施形態の解析処理部３４のブロック図である。図２に示すように、第１実施形態の解析処理部３４は、変数設定部４２と係数特定部４４と強度平均部４６と調整値算定部４８とを含んで構成される。

強度平均部４６は、周波数分析部３２が算定した音響信号ｘ(n)のスペクトルＸ(k,m)に対応する各単位期間のパワースペクトルＰ_X(k,m)（Ｐ_X(k,m)＝|Ｘ(k,m)|²）の移動平均により単位期間毎に平均スペクトル（各周波数の平均強度）Ｐ_X(k)を順次に算定する。前述の説明では平均個数Ｍの単純移動平均に言及したが、第１実施形態では便宜的に、以下の数式(28)で表現されるパワースペクトルＰ_X(k,m)の指数移動平均を平均スペクトルＰ_X(k)として算定する。すなわち、強度平均部４６は、ＩＩＲ（Infinite Impulse Response）型のローパスフィルタに相当する。

数式(28)の記号Ｐ_X ^(m)(k)は、第ｍ番目の単位期間に対応する平均スペクトルＰ_X(k)を意味する。記号αは平滑化係数（忘却係数）であり、１未満の正数に設定される（０＜α＜１）。具体的には、平滑化係数αは、過去の平均スペクトルＰ_X ^(m-1)(k)に対する最新（現在）のパワースペクトルＰ_X(k,m)の加重値（各単位期間のパワースペクトルＰ_X(k,m)の平滑化の時定数）に相当する。

変数設定部４２は、音響信号ｘ(n)に想定される残響時間（例えば音響信号ｘ(n)が発音および収録された音響空間の残響時間）Ｔ₆₀を可変に設定する。例えば、変数設定部４２は、所定の測定用信号を音響空間内に放音したときに収録される音響信号を解析することで残響時間Ｔ₆₀を特定する。例えば、周波数が時間的に連続に変化する時間伸長信号（ＴＳＰ：Time Stretched Pulse）が測定用信号として好適に利用される。残響時間Ｔ₆₀の測定には、例えばインパルス積分法（Schroeder法）等の公知の技術が任意に利用され得る。また、公知のマルチステップ線形予測を利用して音響信号ｘ(n)から残響時間Ｔ₆₀を算定することも可能である。マルチステップ線形予測については、例えば、K. Kinoshita, et al.,"Suppression of late reverberation effect on speech signal using long-term multiple-step linear prediction", IEEE Transactions on Audio, Speech and Language processing, 17(4), p.534-545, 2009に詳述されている。また、入力装置（図示略）に対する操作で利用者が指定した残響時間Ｔ₆₀を変数設定部４２が取得する構成も採用され得る。

係数特定部４４は、変数設定部４２が設定した残響時間Ｔ₆₀に応じた平滑化係数αを特定する。具体的には、係数特定部４４は、記憶装置２４内の相関係数Ｃで規定される関係のもとで残響時間Ｔ₆₀に対応する平均個数Ｍを特定し、平均個数Ｍに対応する平滑化係数αを以下の数式(29)の演算で算定する。

数式(29)の記号Ｎ_Eは、音響信号ｘ(n)の単位期間内のサンプルの総数であり、記号ｆsは音響信号ｘ(n)のサンプリング周波数である。例えば単位期間内のサンプルの総数Ｎ_Eを５１２個とし、サンプリング周波数を１６ｋＨzとした場合、平滑化係数αと平均個数Ｍとの関係は以下の数式(30)で表現される。強度平均部４６は、係数特定部４４が残響時間Ｔ₆₀に応じて設定した平滑化係数αを適用した数式(28)の演算で平均スペクトルＰ_X(k)を算定する。数式(29)や数式(30)の平滑化係数αは、平均個数Ｍの単純移動平均に近似する数式(28)の指数移動平均の平滑化係数に相当する。したがって、平均個数Ｍが大きいほど最新のパワースペクトルＰ_X(k,m)に対する平滑化係数αは小さい数値となる。換言すると、平均個数Ｍが大きいほど、過去の平均スペクトルＰ_X ^(m-1)(k)に対する平滑化係数(１−α)は大きい数値となる。

図２の調整値算定部４８は、強度平均部４６が単位期間毎に算定する平均スペクトルＰ_X(k)（Ｐ_X ^(m)(k)）を適用した数式(25)の演算で各周波数の調整値Ｇ(k,m)を単位期間毎に順次に算定する。調整値算定部４８が算定した調整値Ｇ(k,m)が図１の残響調整部３６による残響成分の抑圧処理（音響信号ｘ(n)のスペクトルＸ(k,m)に対する調整値Ｇ(k,m)の乗算）に適用される。

以上に説明した第１実施形態では、音響信号ｘ(n)のパワースペクトルＰ_X(k,m)の平均スペクトルＰ_X(k)に応じて調整値Ｇ(k,m)が算定されるから、残響成分の予測フィルタ係数を推定する特許文献１の技術や伝達関数を推定して逆フィルタを生成する非特許文献１の技術と比較して簡便な処理で音響信号ｘ(n)の残響成分を抑圧することが可能である。また、平均スペクトルＰ_X(k)の算定に適用される平滑化係数α（平均個数Ｍ）が残響時間Ｔ₆₀に応じて可変に設定されるから、平滑化係数αを所定値に固定した構成と比較して、音響信号ｘ(n)の残響成分が有効に抑圧されるという利点もある。

＜残響時間Ｔ₆₀と平均個数Ｍとの関係＞
残響時間Ｔ₆₀と平均個数Ｍとの好適な関係について以下に詳述する。図３は、残響時間Ｔ₆₀と平均個数Ｍとの相関関係を解析する解析装置２００のブロック図である。図３の解析装置２００は、残響時間Ｔ₆₀と平均個数Ｍとの相関関係を解析して前述の相関係数Ｃを特定する情報処理装置であり、図１の音響処理装置１００と同様に、演算処理装置７２と記憶装置７４とを具備するコンピュータシステムで実現される。記憶装置７４は、演算処理装置７２が実行するプログラムＰGM2や演算処理装置７２が使用する各種のデータを記憶する。例えば半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置７４として任意に採用され得る。

演算処理装置７２は、記憶装置７４が記憶するプログラムＰGM2を実行することで、残響時間Ｔ₆₀と平均個数Ｍとの関係を解析する相関解析部７６として機能する。なお、図３では音響処理装置１００とは別個の解析装置２００を例示したが、相関解析部７６を音響処理装置１００に搭載することも可能である。

図４は、相関解析部７６が残響時間Ｔ₆₀と平均個数Ｍとの好適な関係を解析する解析処理のフローチャートである。例えば利用者からの指示を契機として解析処理が実行される。解析処理を開始すると、相関解析部７６は、残響時間Ｔ₆₀を所定値（変数設定部４２が設定し得る数値）に設定し（Ｓ11）、室内インパルス応答ｈ(μ)を規定する疑似乱数ｂ(μ)（具体的には疑似乱数ｂ(μ)を規定するシード値）を設定する（Ｓ12）。また、相関解析部７６は、平均個数Ｍを所定値（候補値）に設定する（Ｓ13）。

相関解析部７６は、音響信号ｘ(n)を設定する（Ｓ14）。具体的には、以下の数式(31)で表現される通り、相関解析部７６は、ステップＳ12で設定した疑似乱数ｂ(μ)に対応する室内インパルス応答ｈ(μ)（数式(3)）を、事前に用意された所定の音源信号ｓ(n)に畳込むことで音響信号ｘ(n)を生成する。

また、相関解析部７６は、ステップＳ14で設定した音響信号ｘ(n)に対する残響抑圧処理で音響信号ｙ(n)を生成する（Ｓ15）。残響抑圧処理の内容は音響処理装置１００（解析処理部３４，残響調整部３６）が実行する前述の処理と同様である。すなわち、相関解析部７６は、ステップＳ13で設定した平均個数Ｍ（平滑化係数α）を適用した数式(25)の演算で音響信号ｘ(n)から算定される調整値Ｇ(k,m)を音響信号ｘ(n)に作用させることで音響信号ｙ(n)を生成する。

相関解析部７６は、目的音信号ｔ(n)を生成する（Ｓ16）。目的音信号ｔ(n)は、音響信号ｘ(n)のうち抽出の目標となる音響信号を意味し、具体的には、以下の数式(32)で表現されるように、音響信号ｘ(n)のうち初期反射区間（サンプル数Ｎ_E）内の初期反射成分ｘ_E(n)（すなわち、残響抑圧処理が完全である場合の音響信号ｙ(n)）に相当する。

相関解析部７６は、残響成分の抑圧効果の指標（以下「抑圧効果指標」という）δを算定する（Ｓ17）。抑圧効果指標δは、残響成分の抑圧前の音響信号ｘ(n)の目的音残響比ＴＩＲxと調整値Ｇ(k,m)を適用した残響成分の抑圧後の音響信号ｙ(n)の目的音残響比ＴＩＲyとの差分（δ＝ＴＩＲy−ＴＩＲx）である。目的音残響比ＴＩＲ（Target-to-Interference Ratio）は、目的音成分（Target）と残響成分（Interference）との強度比を意味する。具体的には、相関解析部７６は、ステップＳ14で生成した音響信号ｘ(n)とステップＳ16で生成した目的音信号ｔ(n)とを適用した以下の数式(33)の演算で算定される目的音残響比ＴＩＲxと、ステップＳ15で生成した音響信号ｙ(n)とステップＳ16で生成した目的音信号ｔ(n)とを適用した以下の数式(34)の演算で算定される目的音残響比ＴＩＲyとから抑圧効果指標δを算定する。

数式(33)および数式(34)の記号ｌは単位期間の番号を意味し、記号Ｎは所定の正数に設定される。以上の説明から理解される通り、残響成分の抑圧効果が大きい（目的音残響比ＴＩＲyが目的音残響比ＴＩＲxと比較して大きい）ほど抑圧効果指標δは大きい数値となる。

以上の手順で抑圧効果指標δを算定すると、相関解析部７６は、平均個数Ｍの全部の数値について抑圧効果指標δを算定したか否かを判定する（Ｓ18）。判定結果が否定である場合（Ｓ18：NO）、相関解析部７６は、平均個数Ｍを現在とは別個の数値に設定し（Ｓ13）、変更後の平均個数Ｍについて抑圧効果指標δを算定する（Ｓ14〜Ｓ17）。

平均個数Ｍの全部の数値について抑圧効果指標δを算定すると（Ｓ18：YES）、図５に例示されるように平均個数Ｍと抑圧効果指標δとの関係が特定される。前掲の数式(27)を参照した説明や図５から理解される通り、抑圧効果指標δ（残響成分の抑圧効果）は平均個数Ｍに応じて変化する。相関解析部７６は、平均個数Ｍの複数の数値のうち抑圧効果指標δが最大となる数値（以下「最適個数」という）Ｍ0を特定する（Ｓ19）。

相関解析部７６は、事前に用意された全種類の疑似乱数ｂ(μ)について最適個数Ｍ0の特定が完了したか否かを判定する（Ｓ20）。判定結果が否定である場合（Ｓ20：NO）、相関解析部７６は、疑似乱数ｂ(μ)を変更し（Ｓ12）、変更後の疑似乱数ｂ(μ)について最適個数Ｍ0を算定する（Ｓ13〜Ｓ19）。他方、全部の種類の疑似乱数ｂ(μ)について最適個数Ｍ0を特定すると（Ｓ20：YES）、相関解析部７６は、残響時間Ｔ₆₀の全部の数値について最適個数Ｍ0を特定したか否かを判定する（Ｓ21）。判定結果が否定である場合（Ｓ21：NO）、相関解析部７６は、残響時間Ｔ₆₀を現在とは別個の数値に設定し（Ｓ11）、変更後の残響時間Ｔ₆₀について疑似乱数ｂ(μ)毎の最適個数Ｍ0を特定する（Ｓ12〜Ｓ20）。

残響時間Ｔ₆₀の全部の数値について各疑似乱数ｂ(μ)の最適個数Ｍ0を算定すると（Ｓ21：YES）、図６のように残響時間Ｔ₆₀と平均個数Ｍ（最適個数Ｍ0）との関係が疑似乱数ｂ(μ)毎に特定される。なお、図６内の丸印は、室内インパルス応答を実測した結果から抑圧効果指標が最大となるように実験的に選定した最適個数Ｍ0である。室内インパルス応答ｈ(μ)を数式(3)でモデル化した場合でも、室内インパルス応答を実測した場合と同等の結果が観測されることが図６で確認できる。

図６に示すように、相関解析部７６は、複数の疑似乱数ｂ(μ)にわたる残響時間Ｔ₆₀と平均個数Ｍ（最適個数Ｍ0）との相関関係を近似する近似線Ｌを特定する（Ｓ22）。例えば、残響時間Ｔ₆₀と平均個数Ｍとの相関関係を近似する１次の回帰直線が近似線Ｌとして特定される。以上の通り、近似線Ｌは、抑圧効果指標δが最大になるという条件のもとで選定された残響時間Ｔ₆₀と平均個数Ｍとの近似的な相関関係を表現する。具体的には、図６から把握される通り、近似線Ｌは、残響時間Ｔ₆₀が長いほど平均個数Ｍが増加するように残響時間Ｔ₆₀と平均個数Ｍとの近似的な関係を規定する。数式(29)を参照して前述した通り、平均個数Ｍが大きいほど最新のパワースペクトルＰ_X(k,m)に対する平滑化係数αは小さい数値となるから、残響時間Ｔ₆₀が長いほど平滑化係数αが減少するように、近似線Ｌが残響時間Ｔ₆₀と平滑化係数αとの関係を規定すると換言することも可能である。換言すると、残響時間Ｔ₆₀が長い（平均個数Ｍが大きい）ほど、過去の平均スペクトルＰ_X ^(m-1)(k)に対する平滑化係数(１−α)は増加する。

以上の手順で相関解析部７６が特定した近似線Ｌを規定する変数が相関係数Ｃとして音響処理装置１００の記憶装置２４に記憶されて係数特定部４４による平滑化係数α（平均個数Ｍ）の設定に適用される。例えば、前述の例示のように近似線Ｌを１次の回帰直線で表現した場合、近似線Ｌの勾配が相関係数Ｃとして記憶装置２４に記憶される。音響処理装置１００の係数特定部４４は、変数設定部４２が設定した残響時間Ｔ₆₀に対し、相関係数Ｃで規定される近似線Ｌの関係にある平均個数Ｍを特定する。

以上の説明から理解される通り、係数特定部４４が設定する平滑化係数αに対応する平均個数Ｍと変数設定部４２が設定する残響時間Ｔ₆₀とは、相関解析部７６が特定した近似線Ｌの関係にある。すなわち、平均個数Ｍ（平滑化係数α）と残響時間Ｔ₆₀とは、抑圧効果指標δが最大になるという条件のもとで選定された近似的な関係（近似線Ｌ）を充足する。したがって、音響信号ｘ(n)の残響成分を有効に抑圧できるという前述の効果は格別に顕著である。

＜第２実施形態＞
本発明の第２実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第１実施形態と同様である要素については、第１実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。

前掲の数式(24)の相補ウィナーフィルタ｛１−β(k)｝は、数式(19)と数式(27)を適用することで以下の数式(35)で表現される。

図７は、残響時間Ｔ₆₀と相補ウィナーフィルタ｛１−β(k)｝の数値（ゲイン）との間の数式(35)の関係を描画したグラフである。残響時間Ｔ₆₀が長いほど相補ウィナーフィルタ｛１−β(k)｝の数値が増加する（残響成分の抑圧効果が低下する）という傾向が図７から把握される。調整値Ｇ(k,m)の基礎となる強度比Ｐ_X(k,m)/Ｐ_X(k)は、前掲の数式(24)で表現されるように相補ウィナーフィルタ｛１−β(k)｝以下の数値に設定されるから、調整値Ｇ(k,m)を数式(25)で算定する第１実施形態では、残響時間Ｔ₆₀が長いほど調整値Ｇ(k,m)による残響成分の抑圧効果が低下する（強度比Ｐ_X(k,m)/Ｐ_X(k)が増加する）という傾向がある。

以上の傾向を考慮して、第２実施形態の調整値算定部４８は、前掲の数式(25)に代えて以下の数式(36)の演算で各周波数の調整値Ｇ(k,m)を単位期間毎に算定する。

強度比Ｐ_X(k,m)/Ｐ_X(k)が１を下回る場合、調整値Ｇ(k,m)は、第１実施形態と同様の強度比Ｐ_X(k,m)/Ｐ_X(k)と補正係数Ａ1および補正係数Ａ2とに応じた数値に設定される。補正係数Ａ1は、残響時間Ｔ₆₀に応じた強度比Ｐ_X(k,m)/Ｐ_X(k)の変動を補償するための係数であり、変数設定部４２が設定した残響時間Ｔ₆₀に応じて可変に設定される。具体的には、残響時間Ｔ₆₀が長いほど強度比Ｐ_X(k,m)/Ｐ_X(k)が増加するという傾向が補償されるように、残響時間Ｔ₆₀が長いほど補正係数Ａ1は減少する。例えば、以下の数式(37)で表現されるように、残響時間Ｔ₆₀を指数の分母に含む指数関数が補正係数Ａ1として好適に採用される。数式(37)の記号Ｔ_Eは、単位期間の時間長（サンプル数Ｎ_E）を意味する。

他方、補正係数Ａ2は、１未満の任意の正数（０＜Ａ2＜１）に設定される。例えば、入力装置（図示略）に対する利用者からの指示に応じて補正係数Ａ2は可変に設定される。補正係数Ａ2が小さいほど残響成分の抑圧効果が強化される。なお、補正係数Ａ1または補正係数Ａ2を数式(36)から省略することも可能である。

第２実施形態においても第１実施形態と同様の効果が実現される。また、第２実施形態では、残響時間Ｔ₆₀に応じた補正係数Ａ1が調整値Ｇ(k,m)の算定に適用されるから、残響時間Ｔ₆₀が長い場合でも音響信号ｘ(n)の残響成分を充分に抑圧できるという利点がある。

＜変形例＞
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された２以上の態様は適宜に併合され得る。

（１）前述の各形態では、音響信号ｘ(n)のパワースペクトルＰ_X(k,m)の指数移動平均を平均スペクトルＰ_X(k)として算定したが、以下の数式(38)で表現されるように、平均個数ＭにわたるパワースペクトルＰ_X(k,m)の単純移動平均を平均スペクトルＰ_X(k)として強度平均部４６が算定することも可能である。すなわち、強度平均部４６は、ＦＩＲ（Finite Impulse Response）型のローパスフィルタに相当する。

係数特定部４４は、変数設定部４２が設定した残響時間Ｔ₆₀に対し、相関解析部７６が特定した近似線Ｌの関係を充足するように平均個数Ｍを設定する。強度平均部４６は、係数特定部４４が設定した平均個数Ｍを適用した数式(38)の演算で平均スペクトルＰ_X(k)を算定する。なお、平均個数ＭのパワースペクトルＰ_X(k,m)の各々を加重する加重移動平均で平均スペクトルＰ_X(k)を算定することも可能である。

以上の説明から理解される通り、強度平均部４６は、係数特定部４４が特定した移動平均係数を適用した音響信号ｘ(n)の強度（パワースペクトルＰ_X(k,m)）の移動平均で平均強度（平均スペクトルＰ_X(k)）を算定する要素として包括され、移動平均係数は、指数移動平均（数式(28)）に適用される平滑化係数αと単純移動平均（数式(38)）や加重移動平均に適用される平均個数Ｍとの双方を包含する。

（２）前述の各形態では、残響時間Ｔ₆₀と平均個数Ｍとの関係を近似線Ｌ（相関係数Ｃ）で規定したが、音響信号ｘ(n)のパワースペクトルＰ_X(k,m)の指数移動平均（数式(28)）を平均スペクトルＰ_X(k)として算定する構成では、残響時間Ｔ₆₀と平滑化係数αとの関係を近似線Ｌ（相関係数Ｃ）で規定することも可能である。係数特定部４４は、変数設定部４２が設定した残響時間Ｔ₆₀に対して近似線Ｌの関係を充足するように平滑化係数αを直接的（すなわち平均個数Ｍを設定せず）に特定する。

（３）前述の各形態では、記憶装置２４に記憶された相関係数Ｃ（近似線Ｌ）を利用して残響時間Ｔ₆₀に応じた平均個数Ｍ（平滑化係数α）を特定したが、残響時間Ｔ₆₀に応じた平均個数Ｍを特定する方法は以上の例示に限定されない。例えば、残響時間Ｔ₆₀の各数値と平均個数Ｍ（平滑化係数α）の各数値とを対応させた参照テーブルを記憶装置２４に記憶し、変数設定部４２が設定した残響時間Ｔ₆₀に参照テーブル内で対応する平均個数Ｍを係数特定部４４が設定する構成も採用される。参照テーブル内で相互に対応する残響時間Ｔ₆₀と平均個数Ｍとの各数値は近似線Ｌで規定される関係にある。

（４）前述の各形態の音響処理装置１００は、複数の端末装置の間で音響信号を授受する音声通話システムにおいて各端末装置に搭載され得る。各端末装置の音響処理装置１００は、収音装置（信号供給装置１２）が生成した音響信号ｘ(n)に対する残響抑圧処理で音響信号ｙ(n)を生成して相手側の端末装置に送信する。残響時間Ｔ₆₀は、時間伸長信号等の測定用信号に応じた音響を端末装置から放射したときに収録される音響信号を解析することで変数設定部４２が設定する。以上の構成によれば、各端末装置が存在する音響空間内で付与された残響成分を抑圧した明瞭な音声を端末装置間で授受できるという利点がある。また、音響空間内の音響を録音する録音装置にも前述の各形態の音響処理装置１００を適用することが可能である。録音装置内の音響処理装置１００は、収音装置が生成した音響信号ｘ(n)に対する残響抑圧処理で音響信号ｙ(n)を生成して記憶装置２４に格納する。

（５）前述の各形態では、音響信号ｘ(n)の平均スペクトルＰ_X(k)に対する１個の単位期間のパワースペクトルＰ_X(k,m)の強度比Ｐ_X(k,m)/Ｐ_X(k)を調整値Ｇ(k,m)として例示したが、調整値Ｇ(k,m)を算定する方法は適宜に変更される。例えば、平均スペクトルＰ_X(k)の算定時の移動平均係数（平滑化係数α，平均個数Ｍ）とは別個の移動平均係数を適用したパワースペクトルＰ_X(k,m)の移動平均で平均スペクトルＱ(k)を算定し、平均スペクトルＰ_X(k)に対する平均スペクトルＱ(k)の強度比Ｑ(k)/Ｐ_X(k)を調整値Ｇ(k,m)として算定する（すなわち、数式(25)のパワースペクトルＰ_X(k,m)を平均スペクトルＱ(k)に置換する）ことも可能である。平均スペクトルＱ(k)は、平均スペクトルＰ_X(k)の算定に適用される平均個数Ｍを下回る個数の単位期間にわたるパワースペクトルＰ_X(k,m)の単純移動平均、または、平均スペクトルＰ_X(k)の算定に適用される平滑化係数αを上回る平滑化係数を適用したパワースペクトルＰ_X(k,m)の指数移動平均である。

前述の各形態におけるパワースペクトルＰ_X(k,m)と本変形例で例示した平均スペクトルＱ(k)とは、平均スペクトルＰ_X(k)と比較して高い追従性でパワースペクトルＰ_X(k,m)の時間変化に追従する強度指標Λ(k)として包括される。すなわち、本発明の好適な態様では、音響信号ｘ(n)の平均スペクトルＰ_X(k)に対する強度指標Λ(k)（Ｐ_X(k,m)またはＱ(k)）の相対比Λ(k)/Ｐ_X(k)が調整値Ｇ(k,m)として算定される。

また、前述の各形態では、音響信号ｘ(n)の残響成分を抑圧する調整値Ｇ(k,m)を例示したが、音響信号ｘ(n)の残響成分を強調する場合にも本発明は適用される。例えば、数式(25)で算定される調整値Ｇ(k,m)を所定値λ（例えば１）から減算した調整値｛λ−Ｇ(k,m)｝を音響信号ｘ(n)に作用させれば、残響成分を強調した音響信号ｙ(n)を生成することが可能である。以上の説明から理解される通り、調整値算定部４８は、音響信号ｘ(n)の残響成分を調整（抑圧または強調）するための調整値を平均強度（平均スペクトルＰ_X(k)）に応じて算定する要素として包括される。

（６）前述の各形態では、周波数の全域にわたり共通の残響時間Ｔ₆₀を設定したが、残響時間Ｔ₆₀を所定の帯域毎に個別に設定することも可能である。係数特定部４４は、各帯域の残響時間Ｔ₆₀に応じた移動平均係数（平滑化係数α，平均個数Ｍ）を帯域毎に個別に設定する。以上の構成では、抑圧効果指標δが最大となる残響時間Ｔ₆₀と移動平均係数との近似的な相関関係（近似線Ｌ）を帯域毎に個別に用意した構成が好適である。

（７）前述の各形態では音響処理装置１００を単体の装置として例示したが、音響処理装置１００の一部の機能を、音響処理装置１００と通信可能な外部装置（例えばウェブサーバ）に分担させることも可能である。例えば、外部装置は、音響処理装置１００からの要求に応じて残響時間Ｔ₆₀を算定するとともに残響時間Ｔ₆₀に応じた移動平均係数（平滑化係数α，平均個数Ｍ）を特定して音響処理装置１００に通知する。音響処理装置１００では、係数特定部４４が外部装置から移動平均係数を取得し、移動平均係数を適用した移動平均で強度平均部４６が平均スペクトルＰ_X(k)を算定する。したがって、変数設定部４２は音響処理装置１００から省略される。

外部装置が残響時間Ｔ₆₀を特定する方法は任意である。例えば、利用者が指定した音響空間の音響特性（例えば平均吸音率や空間サイズや発音源および受聴点の位置）を音響処理装置１００から外部装置に通知し、外部装置が鏡像法等の公知の残響評価技術で音響空間の音響特性から残響時間Ｔ₆₀を算定する構成が採用される。また、測定用信号に応じた音響の放音時に収録された音響信号を音響処理装置１００から外部装置に送信し、外部装置が音響信号から残響時間Ｔ₆₀を算定することも可能である。以上の説明から理解されるように、係数特定部４４は、残響時間Ｔ₆₀に応じた移動平均係数（平滑化係数αや平均個数Ｍ）を特定する要素として包括され、移動平均係数の算定を係数特定部４４が実行するか外部装置が算定した移動平均係数を係数特定部４４が取得するかは不問である。

（８）前述の各形態では、解析処理部３４と残響調整部３６とを具備する音響処理装置１００を例示したが、調整値Ｇ(k,m)を算定する調整値算定装置としても本発明は特定され得る。調整値算定装置は、前述の各形態における解析処理部３４を含んで構成され、残響調整部３６の有無は不問である。調整値算定装置が算定した調整値Ｇ(k,m)が、残響調整部３６を具備する音響処理装置に提供されて音響信号ｘ(n)の残響抑圧処理に適用される。

（９）音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分（共鳴成分）も残響成分に含意され得る。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分（胴鳴り，箱鳴り）の調整にも、前述の各形態と同様に本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分（減衰成分）を意味する。

１００……音響処理装置、１２……信号供給装置、１４……放音装置、２２……演算処理装置、２４……記憶装置、３２……周波数分析部、３４……解析処理部、３６……残響調整部、３８……波形合成部、４２……変数設定部、４４……係数特定部、４６……強度平均部、４８……調整値算定部、２００……解析装置、７２……演算処理装置、７４……記憶装置、７６……相関解析部。

Claims

残響時間に応じた移動平均係数を特定する係数特定手段と、
前記係数特定手段が特定した移動平均係数を適用した音響信号の強度の移動平均で平均強度を算定する強度平均手段と、
前記音響信号の残響成分を調整するための調整値を前記平均強度に応じて算定する調整値算定手段と、
前記調整値算定手段が算定した調整値を前記音響信号に作用させる残響調整手段と
を具備する音響処理装置。
前記調整値算定手段は、前記平均強度と比較して高い追従性で前記音響信号の強度に追従する強度指標の、前記平均強度に対する比に応じて前記調整値を算定する
請求項１の音響処理装置。
前記調整値算定手段は、前記平均強度と比較して高い追従性で前記音響信号の強度に追従する強度指標の、前記平均強度に対する比と、前記残響時間に応じた補正係数とに応じて前記調整値を算定する
請求項２の音響処理装置。
前記係数特定手段は、前記残響時間が長いほど小さい数値となる平滑化係数を前記移動平均係数として特定し、
前記強度平均手段は、音響信号の最新の強度に対して前記平滑化係数を適用した前記音響信号の強度の指数移動平均を前記平均強度として算定する
請求項２または請求項３の音響処理装置。
前記調整値算定手段は、前記音響信号の残響成分を抑圧するための調整値を算定し、
前記係数特定手段は、前記残響成分の抑圧前の音響信号の目的音残響比と前記調整値を適用した抑圧後の音響信号の目的音残響比との差分が最大になるという条件のもとで近似的に選定された関係を充足するように、前記残響時間に対応する移動平均係数を特定する
請求項１から請求項４の何れかの音響処理装置。