Nothing Special   »   [go: up one dir, main page]

JP2015161814A - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP2015161814A
JP2015161814A JP2014037132A JP2014037132A JP2015161814A JP 2015161814 A JP2015161814 A JP 2015161814A JP 2014037132 A JP2014037132 A JP 2014037132A JP 2014037132 A JP2014037132 A JP 2014037132A JP 2015161814 A JP2015161814 A JP 2015161814A
Authority
JP
Japan
Prior art keywords
reverberation
intensity
component
provisional
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014037132A
Other languages
English (en)
Other versions
JP6299279B2 (ja
Inventor
近藤 多伸
Kazunobu Kondo
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2014037132A priority Critical patent/JP6299279B2/ja
Publication of JP2015161814A publication Critical patent/JP2015161814A/ja
Application granted granted Critical
Publication of JP6299279B2 publication Critical patent/JP6299279B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】演算量や記憶容量が低減された簡便な処理で音響信号から残響時間を推定する。【解決手段】音響処理装置100は、音響信号xのうち一部の周波数帯域である特定帯域の音響成分X(k,m)について、初期反射成分の強度PERおよび後期残響成分の強度PLRを算定する強度算定部42と、強度算定部42が算定した初期反射成分の強度PERおよび後期残響成分の強度PLRに応じて、残響時間Tを特定する残響時間特定部44とを具備する。【選択図】図1

Description

本発明は、音響信号を処理する技術に関し、特に、音響信号の解析で残響時間を推定する技術に関する。
音響空間に固有の残響時間を取得するための各種の技術が従来から提案されている。例えば特許文献1には、白色雑音等の試験音を音響空間内に放射することで観測されるインパルス応答の解析により残響時間を算定する技術が開示されている。
音響空間で収録された任意の音響信号から残響時間を推定する技術も提案されている。例えば非特許文献1には、事前に収録された音響信号について反復法を利用した最尤推定を実行して音響信号の減衰率を推定したうえで減衰率から残響時間を算定する技術が開示されている。また、非特許文献2には、残響モデル(Polackモデル)を利用した事前の機械学習により算定された回帰係数を利用して音響信号から減衰率を推定し、減衰率の推定結果から残響時間を算定する技術が開示されている。
特開2014−026241号公報
R. Ratnam, et al.,"Blind estimation of reverberation time," J. Acoust. Soc. Am., vol. 114, no. 5, pp. 2877-2892, Nov. 2003 J. Y. C. Wen, et al.,"Blind estimation of reverberation time based on the distribution of signal decay rates," in Proc. IEEE Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Las Vegas, USA, Apr. 2008
しかし、特許文献1の技術では、音響空間の状況の変化毎にインパルス応答を測定する必要があり作業負担が大きいという問題がある。また、非特許文献1で採用される反復法や非特許文献2で採用される機械学習には膨大な演算量や記憶容量が必要であるという問題がある。以上の事情を考慮して、本発明は、演算量や記憶容量を低減した簡便な処理で音響信号から残響時間を推定することを目的とする。
以上の課題を解決するために、本発明の音響処理装置は、音響信号のうち一部の周波数帯域である特定帯域の音響成分について初期反射成分の強度と後期残響成分の強度とを算定する強度算定手段と、強度算定手段が算定した初期反射成分の強度と後期残響成分の強度とに応じて残響時間を特定する残響時間特定手段とを具備する。以上の構成では、特定帯域の音響成分から算定される初期反射成分の強度と強度残響成分の強度とに応じて残響時間が特定される。したがって、非特許文献1や非特許文献2の技術と比較して演算量や記憶容量を削減した簡便な処理で音響信号から残響時間を特定できるという利点がある。
本発明の好適な態様において、強度算定手段は、残響時間に応じた残響分離処理を、所定の暫定値を残響時間として特定帯域の音響成分に実行することで、暫定的な初期反射成分である暫定初期反射成分の強度の時系列と、暫定的な後期残響成分である暫定後期残響成分の強度の時系列とを算定する暫定処理手段と、暫定処理手段が算定した暫定初期反射成分の強度の時系列と暫定後期残響成分の強度の時系列とに応じて、初期反射成分が存在する初期反射区間と後期残響成分が存在する後期残響区間とを特定する区間解析手段と、初期反射区間内の暫定初期反射成分の強度に応じて初期反射成分の強度を算定するとともに後期残響区間内の暫定後期残響成分の強度に応じて後期残響成分の強度を算定する演算処理手段とを含む。以上の態様では、残響時間を暫定値に設定した暫定的な残響分離処理で暫定初期反射成分と暫定後期残響成分とが生成され、暫定初期反射成分および後期残響成分の各々の強度の時系列に応じて初期反射成分と後期残響成分とが特定され、初期反射区間内の暫定初期反射成分の強度に応じた初期反射成分の強度と後期残響区間内の暫定後期残響成分の強度に応じた後期残響成分の強度とが算定される。したがって、残響時間を暫定値に設定した残響分離処理で生成される暫定初期反射成分や暫定後期残響成分の強度を初期反射成分や後期残響成分の強度として確定する構成と比較して、例えば暫定値が実際の残響時間と乖離するような場合でも、初期反射区間および後期残響区間の各々の強度(ひいては残響時間)を頑健に算定できるという利点がある。
本発明の好適な態様において、区間解析手段は、暫定初期反射成分の複数の強度に応じた第1閾値と暫定後期残響成分の複数の強度に応じた第2閾値とを設定する閾値設定手段と、暫定初期反射成分の強度が第1閾値を上回る第1信号区間と暫定後期残響成分の強度が第2閾値を上回る第2信号区間とを画定する第1区間設定手段と、第1信号区間と第2信号区間とに応じて初期反射区間と後期残響区間とを画定する第2区間設定手段とを含む。以上の態様では、暫定初期反射成分の強度が第1閾値を上回る第1信号区間と暫定後期残響成分の強度が第2閾値を上回る第2信号区間とを画定する簡便な処理で初期反射区間と後期残響区間とを特定できるという利点がある。また、暫定初期反射成分の複数の強度の中央値を第1閾値に設定し、暫定後期残響成分の複数の強度の中央値を第2閾値に設定する構成によれば、暫定初期反射成分の優勢な区間を適切に第1信号区間として画定するとともに暫定後期残響成分の優勢な区間を適切に第2信号区間として画定することが可能である。
本発明の好適な態様において、暫定処理手段は、特定帯域内の音響成分に対する残響分離処理により、特定帯域内の複数の周波数の各々について暫定初期反射成分と暫定後期残響成分とを生成する残響分離手段と、暫定初期反射成分の強度を特定帯域内の複数の周波数について合計するとともに暫定後期残響成分の強度を特定帯域の複数の周波数について合計する強度累算手段とを含む。以上の態様では、暫定初期反射成分および暫定後期残響成分の各々の強度が特定帯域内の複数の周波数について合計されるから、各強度を周波数毎に個別に処理する構成と比較して、記憶容量を削減できるという効果は格別に顕著である。
本発明の好適な態様において、第2区間設定手段は、暫定後期残響成分の強度が暫定初期反射成分の強度を上回る減衰区間と第2信号区間とが相互に重複する区間を後期残響区間として設定し、後期残響区間以外の区間と第1信号区間とが相互に重複する区間を初期反射区間として設定する。以上の態様では、暫定後期残響成分の強度が暫定初期反射成分の強度を上回る減衰区間と第1信号区間および第2信号区間とを対比する簡便な処理で初期反射区間および後期残響区間を画定できるという利点がある。
本発明の好適な態様に係る音響処理装置は、残響時間特定手段が特定した残響時間を適用した残響分離処理を音響信号に対して実行する残響処理手段を具備する。以上の各態様によれば、演算量や記憶容量を低減した簡便な処理で音響信号から残響時間を推定できるから、残響分離処理のみを実行する場合と比較して演算量や記憶容量を極端に増加させる必要がないという利点がある。
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、本発明は、以上に説明した各態様に係る音響処理装置の動作方法(音響処理方法)としても特定される。
本発明の第1実施形態に係る音響処理装置の構成図である。 残響解析部の構成図である。 初期反射区間および後期残響区間の説明図である。 音響処理装置の動作のフローチャートである。 本発明の第2実施形態に係る音響処理装置の構成図である。
<第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100の構成図である。図1に例示される通り、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の波形を示す時間領域信号である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
第1実施形態の音響処理装置100は、音響信号xの残響成分(後期残響成分)を抑圧した時間領域の音響信号yを生成する残響抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号yに応じた音波を放射する。なお、音響信号yをデジタルからアナログに変換するD/A変換器や音響信号yを増幅する増幅器等の図示は便宜的に省略した。
図1に例示される通り、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号xを記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで、音響信号xから音響信号yを生成するための複数の機能(周波数解析部32,残響解析部34,残響処理部36,波形生成部38)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置22の一部の機能を実現する構成も採用され得る。
周波数解析部32は、信号供給装置12から供給される音響信号xを解析することで、相異なる周波数(周波数帯域)に対応する複数の音響成分(周波数スペクトル)X(k,m)を時間軸上の単位区間(フレーム)毎に順次に生成する。記号kは、周波数軸上に離散的に設定された複数の周波数(周波数ビン)のうち任意の1個の周波数を意味し、記号mは、時間軸上の任意の1個の単位区間(時間軸上の特定の時点)を意味する。各音響成分X(k,m)の算定には、短時間フーリエ変換等の公知の周波数解析が任意に採用され得る。残響解析部34は、音響信号xの各音響成分X(k,m)を解析することで残響時間Tを算定する。
残響処理部36は、残響解析部34が算定した残響時間Tに応じた残響分離処理(残響抑圧処理)を音響信号xの各音響成分X(k,m)に対して実行することで音響信号yの各音響成分(周波数スペクトル)Y(k,m)を生成する。残響分離処理は、音響成分X(k,m)の初期反射成分と後期残響成分とを分離(一方を他方に対して抑圧または強調)する処理である。残響分離処理には、音響信号xの各音響成分X(k,m)に応じた調整値G(k,m)が適用される。
第1実施形態の調整値G(k,m)は、音響成分X(k,m)に含有される後期残響成分を抑圧する(初期反射成分を強調する)ための変数である。具体的には、音響成分X(k,m)にて後期残響成分が優勢である(直接音成分や初期反射成分が劣勢である)ほど調整値G(k,m)は小さい数値に設定されるという概略的な傾向がある(0≦G(k,m)≦1)。第1実施形態の残響処理部36は、調整値G(k,m)を音響成分X(k,m)に乗算することで音響成分Y(k,m)を生成する(Y(k,m)=G(k,m)X(k,m))。以上の説明から理解される通り、調整値G(k,m)は、音響信号xの音響成分X(k,m)に対するゲイン(スペクトルゲイン)に相当する。
調整値G(k,m)の算定には例えば特開2013−130857号公報に開示された方法が好適に採用される。具体的には、調整値G(k,m)は以下の数式(1)で表現される。
Figure 2015161814

数式(1)の演算子min( )は、括弧内の各数値の最小値を採択する演算(調整値G(k,m)を1以下の範囲に制限する演算)である。数式(1)の記号CA(k,m)および記号CB(k,m)は、音響成分X(k,m)の強度(パワー)|X(k,m)|2の移動平均に相当する。具体的には、以下の数式(2A)および数式(2B)で表現される通り、相異なる係数(αA,αB)を適用した強度|X(k,m)|2の指数移動平均が強度CA(k,m)および強度CB(k,m)として算定される。
Figure 2015161814
係数αAおよび係数αBは1以下の正数に設定され、係数αAは係数αBを上回る(αA>αB)。数式(2A)および数式(2B)から理解される通り、強度CA(k,m)および強度CB(k,m)は音響信号xの強度|X(k,m)|2に追従して経時的に変動する。係数αAは係数αBを上回るから、強度CA(k,m)は、強度CB(k,m)と比較して高い追従性で強度|X(k,m)|2の時間変化に追従する。第1実施形態の残響処理部36は、残響解析部34が算定した残響時間Tに応じて係数αAおよび係数αBを可変に設定する。具体的には、残響時間Tが長いほど、係数αAは大きい数値に設定され、係数αBは小さい数値に設定される。以上の説明から理解される通り、第1実施形態の残響処理部36は、残響解析部34が算定した残響時間Tに応じた調整値G(k,m)を利用した残響分離処理で音響成分X(k,m)から音響成分Y(k,m)を生成する。
図1の波形生成部38は、残響処理部36が生成した各音響成分Y(k,m)から時間領域の音響信号yを生成する。音響信号yの生成には短時間逆フーリエ変換が好適に利用される。波形生成部38が生成した音響信号yが放音装置14に供給されて音波として放射される。
図1に例示される通り、第1実施形態の残響解析部34は、強度算定部42と残響時間特定部44とを含んで構成される。強度算定部42は、音響信号xのうち一部の周波数帯域(以下「特定帯域」という)Bの各音響成分X(k,m)を解析することで初期反射成分の強度PERと後期残響成分の強度PLRとを算定する。強度PERおよび強度PLRは、例えばパワーの平均値(エネルギー)である。なお、強度PERおよび強度PLRの表記のように、以下の説明では、初期反射成分(Early Reflection)に関連する要素に添字ERを付加し、後期残響成分(Late Reverberation)に関連する要素に添字LRを付加する。
初期反射成分は、音響信号xのうち発音源による直接音成分の発音の直後に音響空間内での反射(典型的には1回の反射)を経て受音点に到達する音響成分であり、後期残響成分は、初期反射音の到来後に音響空間内での多数回の反射を経て受音点に到達する音響成分である。なお、以下の説明では、直接音成分を初期反射成分の概念に便宜的に包含させる。強度PERおよび強度PLRの算定には、音響信号xのうち時間軸上の特定の区間(以下「評価区間」という)が利用される。評価区間は所定の時間長(例えば3秒程度)にわたる区間である。図1の残響時間特定部44は、強度算定部42が算定した初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tを算定する。
特定帯域Bは、残響処理部36による残響分離処理の対象となる周波数帯域と比較して狭い所定の周波数帯域に設定される。建築音響では一般的に可聴帯域の略全域にわたる音響の残響時間が500Hzの音響の残響時間に近似または合致するように音響ホール等の音響空間が設計される。以上の事情を考慮すると、設計基準となる500Hzを包含する所定幅の周波数帯域を特定帯域Bとして選定した構成が好適である。具体的には、500Hzに対して高域側に位置する所定個(例えば10個)の周波数と低域側に位置する所定個(例えば10個)の周波数とを含む周波数帯域が特定帯域Bとして選定される。
図2は、強度算定部42の構成図である。図2に例示される通り、第1実施形態の強度算定部42は、暫定処理部50と区間解析部60と演算処理部70とを含んで構成される。強度算定部42の各要素について以下に詳述する。
<暫定処理部50>
暫定処理部50は、音響信号xのうち特定帯域B内の各音響成分X(k,m)に残響処理部36と同様の残響分離処理を実行することで、暫定的な初期反射成分(以下「暫定初期反射成分」という)ZER(k,m)の単位区間毎の強度QER(m)の時系列と暫定的な後期残響成分(以下「暫定後期残響成分」という)ZLR(k,m)の単位区間毎の強度QLR(m)の時系列とを算定する。図2に例示される通り、第1実施形態の暫定処理部50は、残響分離部52と強度累算部54と平滑処理部56とを含んで構成される。
残響分離部52は、残響時間Tを所定の暫定値t0に暫定的に設定した残響分離処理で特定帯域B内の各音響成分X(k,m)を暫定初期反射成分ZER(k,m)と暫定後期残響成分ZLR(k,m)とに分離する。すなわち、残響分離部52による残響分離処理に適用される調整値G(k,m)は残響時間Tの暫定値t0に応じて設定される。具体的には、第1実施形態の残響分離部52は、係数αAおよび係数αBを暫定値t0に応じた可変の数値に設定した数式(2A)および数式(2B)の演算で強度CA(k,m)および強度CB(k,m)を算定し、強度CA(k,m)および強度CB(k,m)を適用した数式(1)の演算で調整値G(k,m)を算定する。例えば係数αAは0.9程度の数値に設定され、係数αBは0.1程度の数値に設定される。
暫定値t0に応じた調整値G(k,m)を以上の手順で算定すると、残響分離部52は、以下の数式(3A)で表現される通り、評価区間内の音響信号xのうち特定帯域B内の各音響成分X(k,m)に調整値G(k,m)を乗算する(すなわち後期残響成分を抑圧する)ことで暫定初期反射成分ZER(k,m)を算定する。他方、所定値(以下の例示では1)から調整値G(k,m)を減算した調整値{1−G(k,m)}は、調整値G(k,m)とは逆に、音響信号xの後期残響成分を強調する係数(初期反射成分を抑圧する係数)として機能する。第1実施形態の残響分離部52は、以下の数式(3B)で表現される通り、評価区間内の音響信号xのうち特定帯域B内の各音響成分X(k,m)に調整値{1−G(k,m)}を乗算することで暫定後期残響成分ZLR(k,m)を算定する。以上の説明から理解される通り、第1実施形態の残響分離部52は、残響時間Tを暫定値t0と仮定した暫定的な残響分離処理を実行する要素として機能する。
Figure 2015161814
図2の強度累算部54および平滑処理部56は、暫定初期反射成分ZER(k,m)の強度QER(m)の時系列と暫定後期残響成分ZLR(k,m)の強度QLR(m)の時系列とを算定する。強度累算部54は、以下の数式(4A)で表現される通り、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|2を特定帯域B内の全周波数にわたり平均(合計)することで単位区間毎に強度WER(m)を算定し、以下の数式(4B)で表現される通り、暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|2を特定帯域B内の全周波数にわたり平均(合計)することで単位区間毎に強度WLR(m)を算定する。
Figure 2015161814
平滑処理部56は、以下の数式(5A)で表現される通り、評価区間内の複数の単位区間にわたる強度WER(m)の時系列を平滑化(移動平均)することで各単位区間の強度QER(m)の時系列を算定し、数式(5B)で表現される通り、評価区間内の複数の単位区間にわたる強度WER(m)の時系列を平滑化することで各単位区間の強度QLR(m)の時系列を算定する。数式(5A)および数式(5B)の数値Maおよび数値Mbは所定の非負値に設定される。
Figure 2015161814
以上の説明から理解される通り、特定帯域B内の暫定初期反射成分ZER(k,m)の強度WER(m)の時系列を平滑化した各単位区間の強度QER(m)の時系列と、特定帯域B内の暫定後期残響成分ZLR(k,m)の強度WLR(m)の時系列を平滑化した各単位区間の強度QLR(m)の時系列とが算定される。図2の暫定処理部50の具体的な構成および作用は以上の通りである。なお、平滑処理部56は省略され得る。
<区間解析部60>
図2の区間解析部60は、暫定処理部50が算定した暫定初期反射成分ZER(k,m)の強度QER(m)の時系列と暫定後期残響成分ZLR(k,m)の強度QER(m)の時系列とを解析することで、音響信号xのうち初期反射成分が優勢に存在する初期反射区間SERと後期残響成分が優勢に存在する後期残響区間SLRとを特定する。図2に例示される通り、第1実施形態の区間解析部60は、閾値設定部62と第1区間設定部64と第2区間設定部66とを含んで構成される。
図3は、区間解析部60の動作の説明図である。図3に例示される通り、第1区間設定部64は、暫定初期反射成分ZER(k,m)の各単位区間の強度QER(m)と閾値(第1閾値)HERとの比較結果に応じて時間軸上に信号区間AERを画定する。信号区間AERは、暫定初期反射成分ZER(k,m)が優勢に存在する区間(第1信号区間)である。具体的には、第1区間設定部64は、強度QER(m)が閾値HERを上回る区間を信号区間AERとして画定する。したがって、信号区間AER内の各単位区間の集合mA_ERは以下の数式(6A)で表現される。また、第1区間設定部64は、暫定後期残響成分ZLR(k,m)の各単位区間の強度QLR(m)と閾値(第2閾値)HLRとの比較結果に応じて時間軸上に信号区間ALRを画定する。信号区間ALRは、暫定後期残響成分ZLR(k,m)が優勢に存在する区間(第2信号区間)である。具体的には、第1区間設定部64は、強度QLR(m)が閾値HLRを上回る区間を信号区間ALRとして画定する。したがって、信号区間ALR内の各単位区間の集合mA_LRは以下の数式(6B)で表現される。
Figure 2015161814
図2の閾値設定部62は、信号区間AERの画定に適用される閾値HERと信号区間ALRの画定に適用される閾値HLRとを可変に設定する。具体的には、閾値設定部62は、暫定初期反射成分ZER(k,m)の時間軸上の複数の強度QER(m)に応じて閾値HERを設定し、暫定後期残響成分ZLR(k,m)の時間軸上の複数の強度QLR(m)に応じて閾値HLRを設定する。第1実施形態の閾値設定部62は、評価区間内の各単位区間に対応する複数の強度QER(m)の中央値(メディアン)を閾値HERとして算定し、評価区間内の各単位区間に対応する複数の強度QLR(m)の中央値を閾値HLRとして算定する。なお、複数の強度QER(m)の平均値を閾値HERとして設定する構成や、複数の強度QLR(m)の平均値を閾値HLRとして設定する構成も採用され得る。
以上に例示した処理で第1区間設定部64が設定した信号区間AERと信号区間ALRとは相互に重複する可能性がある。第2区間設定部66は、第1区間設定部64が設定した信号区間AERと信号区間ALRとを利用して、評価区間内で相互に重複しない初期反射区間SERと後期残響区間SLRとを特定する。第1実施形態の第2区間設定部66は、図3に例示される通り、暫定後期残響成分ZLR(k,m)の強度QLR(m)が暫定初期反射成分ZER(k,m)の強度QER(m)を上回る区間(以下「減衰区間」という)Szを特定し、減衰区間Szと信号区間ALRとが相互に重複する区間を後期残響区間SLRとして画定する。すなわち、強度QLR(m)が閾値HLRを上回る信号区間ALRのうち強度QLR(m)が強度QER(m)を上回る区間が後期残響区間SLRとして設定される。また、第2区間設定部66は、図3に例示される通り、後期残響区間SLR以外の区間と信号区間AERとが相互に重複する区間を初期反射区間SERとして画定する。すなわち、後期残響区間SLR以外で強度QER(m)が閾値HERを上回る区間が初期反射区間SERとして設定される。
以上の説明から理解される通り、後期残響区間SLR内の各単位区間の集合mB_LRは以下の数式(7B)で表現され、初期反射区間SER内の各単位区間の集合mB_ERは以下の数式(7A)で表現される。なお、数式(7A)および数式(7B)における記号 ̄は否定を意味し、記号∩は積集合(AND)を意味する。図2の区間解析部60の具体的な構成および作用は以上の通りである。
Figure 2015161814
<演算処理部70>
図2の演算処理部70は、区間解析部60が設定した初期反射区間SERにおける暫定初期反射成分ZER(k,m)の強度QER(m)に応じて初期反射成分の強度PERを算定し、区間解析部60が設定した後期残響区間SLRにおける暫定後期残響成分ZLR(k,m)の強度QLR(m)に応じて後期残響成分の強度PLRを算定する。第1実施形態の演算処理部70は、以下の数式(8A)で表現される通り、初期反射区間SER内の複数の単位区間(数式(7A)の集合mB_ER)にわたる強度QER(m)の合計値を強度PERとして算定し、数式(8B)で表現される通り、後期残響区間SLR内の複数の単位区間(数式(7B)の集合mB_LR)にわたる強度QLR(m)の合計値を強度PLRとして算定する。以上の説明から理解される通り、第1実施形態では、暫定値t0のもとで算定された暫定的な強度QER(m)および強度QLR(m)が、初期反射区間SERおよび後期残響区間SLRの推定結果に応じて確定的な強度PERおよび強度PLRに補正される。以上が図1の強度算定部42の構成および動作である。
Figure 2015161814
図1の残響時間特定部44は、以上の手順で強度算定部42が算定した初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tを算定する。具体的には、初期反射成分の強度PERが後期残響成分の強度PLRに対して相対的に大きいほど残響時間Tは小さい数値に設定される。第1実施形態の残響時間特定部44は、以下の数式(9)の演算で残響時間Tを算定する。
Figure 2015161814

数式(9)の記号fsは音響信号xのサンプリング周波数を意味し、記号NEは、音響信号xのうち所定の初期反射区間の時間長(数十〜100msec)に相当するサンプルの個数を意味する。記号rは、後期残響成分の強度PLRに対する初期反射成分の強度PERの強度比(r=PER/PLR)である。残響時間特定部44は、強度算定部42が算定した強度PERおよび強度PLRから強度比rを算定し、強度比rを数式(9)に適用することで残響時間Tを算定する。残響時間Tと強度比rとの関係を規定する数式(9)について以下に詳述する。
残響音(室内インパルス応答)h(n)は以下の数式(10)で表現される(Polackの統計モデル)。数式(10)の記号nは収録音のサンプルの番号を意味し、数式(10)の記号b(n)は平均零のガウス確率過程を意味する。
Figure 2015161814
以下の数式(11)で表現される通り、音響信号xの強度(パワー)PX(k,m)(PX(k,m)=|X(k,m)|2)は、初期反射成分の強度PER(k,m)と後期残響成分の強度PLR(k,m)とに分解される。記号σb2は、確率過程b(n)の分散を意味し、記号Mは残響時間T内のフレームの個数を意味する。
Figure 2015161814
数式(10)の残響音h(n)の統計モデルを想定すると、初期反射成分の強度PER(k,m)と後期残響成分の強度PLR(k,m)との強度比の期待値Em[PER(k,m)/PLR(k,m)]を表現する以下の数式(12)が導出される。
Figure 2015161814
等比級数の和の公式を利用すると、数式(12)は以下の数式(13)に変形される。なお、数式(13)の導出では、残響時間Tの定義を考慮して変数e-2ΔM・NEをゼロと近似した。
Figure 2015161814
期待値Em[PER(k,m)/PLR(k,m)]を強度比rに置換して数式(13)を変形すると、以下の数式(14)が導出される。
Figure 2015161814

数式(14)の変数Δを展開して変形することで、残響時間Tと強度比rとの関係を規定する前掲の数式(9)が導出される。
図4は、音響処理装置100が音響信号xから音響信号yを生成する処理のフローチャートである。入力装置(図示略)に対する利用者からの指示(残響抑圧の開始指示)を契機として図4の処理が開始される。処理を開始すると、演算処理装置22(残響解析部34)は、評価区間内の音響信号xのうち特定帯域B内の音響成分X(k,m)を解析することで残響時間Tを算定する(S1〜S4)。具体的には、暫定処理部50による強度QER(m)および強度QLR(m)の算定(S1)と区間解析部60による初期反射区間SERおよび後期残響区間SLRの特定(S2)と演算処理部70による強度PERおよび強度PLRの算定(S3)とが順次に実行され、残響時間特定部44は、強度PERおよび強度PLRに応じた残響時間Tを算定する(S4)。残響時間Tの算定が完了すると、残響処理部36は、残響時間Tを適用した残響分離処理(残響抑圧)を音響信号xの全区間にわたり実行することで音響信号yを生成する(S5)。
以上に説明した通り、第1実施形態では、特定帯域B内の音響成分X(k,m)の解析で算定される初期反射成分の強度PERと後期残響成分の強度PLRとに応じて残響時間Tが算定される。したがって、非特許文献1や非特許文献2と比較して演算量や記憶容量を低減した簡便な処理で音響信号xから残響時間Tを推定できるという利点がある。第1実施形態では、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|2と暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|2とが特定帯域B内の複数の周波数について合計される(数式(4A),数式(4B))から、周波数毎の強度|ZER(k,m)|2および|ZLR(k,m)|2を利用する構成と比較して、記憶容量を削減できるという効果は格別に顕著である。
第1実施形態では、残響時間Tを暫定値t0と仮定した暫定的な残響分離処理で暫定初期反射成分ZER(k,m)の強度QER(m)と暫定後期残響成分ZLR(k,m)の強度QLR(m)とが生成され、強度QER(m)の時系列と強度QLR(m)の時系列とから特定される初期反射区間SERおよび後期残響区間SLRについて強度QER(m)および強度QLR(m)の各々を合計することで確定的な初期反射成分の強度PERと後期残響成分の強度PLRとが算定される。したがって、強度QER(m)を初期反射成分の強度PERとして確定する構成や強度QLR(m)を後期残響成分の強度PLRとして確定する構成と比較すると、特に暫定値t0が実際の残響時間Tと乖離するような場合でも、強度PERと強度PLRとを頑健に算定できるという利点がある。
第1実施形態では、暫定初期反射成分ZER(k,m)の強度QER(m)が閾値HERを上回る信号区間AERと、暫定後期残響成分ZLR(k,m)の強度QLR(m)が閾値HLRを上回る信号区間ALRと、強度QLR(m)が強度QER(m)を上回る減衰区間Szとを利用した簡便な処理で、音響信号xの初期反射区間SERと後期残響区間SLRとを特定できるという利点もある。
また、暫定初期反射成分ZER(k,m)の複数の強度QER(m)の中央値が閾値HERに設定され、暫定後期残響成分ZLR(k,m)の複数の強度QLR(m)の中央値が閾値HLRに設定されるから、強度QER(m)や強度QLR(m)の数値範囲に関わらず信号区間AERと信号区間ALRとを適切に特定できるという利点がある。また、第1実施形態では、前述の通り、暫定初期反射成分ZER(k,m)の強度|ZER(k,m)|2と暫定後期残響成分ZLR(k,m)の強度|ZLR(k,m)|2とを特定帯域B内で合計する(数式(4A),数式(4B))ことで、閾値設定部62による中央値の算定時に並替え(ソート)の対象となる数値の個数が削減される。したがって、閾値設定部62の処理負荷が軽減されるという利点もある。
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図5は、第2実施形態の音響処理装置100の構成図である。図5に例示される通り、第2実施形態の音響処理装置100の演算処理装置22は、第1実施形態と同様の要素(周波数解析部32,残響解析部34,残響処理部36,波形生成部38)に加えて雑音抑圧部33として機能する。
雑音抑圧部33は、周波数解析部32が単位区間毎に生成する音響成分X0(k,m)(第1実施形態の音響成分X(k,m))について雑音抑圧処理を実行することで音響成分X(k,m)を生成する。雑音抑圧処理は、音響信号xに包含される雑音成分を抑圧する処理である。雑音抑圧処理には公知の技術(例えば周波数領域で音響成分X(k,m)から推定雑音成分を減算するスペクトル減算)が任意に採用される。雑音抑圧部33による処理後の音響成分X(k,m)を適用した残響時間Tの算定(残響解析部34)や音響信号yの生成(残響処理部36)は第1実施形態と同様である。第2実施形態においても第1実施形態と同様の効果が実現される。
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)残響分離処理の具体的な内容は前述の各形態の例示に限定されない。例えば、以下の数式(1A)で表現される通り、強度CA(k,m)および強度CB(k,m)の双方を分母に含む演算で調整値G(k,m)を算定することも可能である。
Figure 2015161814
また、前述の各形態では、音響信号xの後期残響成分を抑圧する残響分離処理(残響抑圧処理)を残響処理部36が実行したが、音響信号xの後期残響成分を強調(初期反射成分を抑圧)する残響分離処理(残響強調処理)を残響処理部36が実行することも可能である。具体的には、残響処理部36は、数式(3B)と同様に、調整値G(k,m)を所定値(例えば1)から減算した調整値{1−G(k,m)}を音響信号xの各音響成分X(k,m)に乗算することで、後期残響成分が強調された音響成分Y(k,m)を生成する。
(2)前述の各形態では、初期反射成分の強度PERおよび後期残響成分の強度PLR(強度比r)と残響時間Tとの関係を規定する数式(9)の演算で残響時間Tを算定したが、強度PERおよび強度PLRに応じて残響時間Tを特定するための処理は以上の例示に限定されない。例えば、強度PERおよび強度PLR(または強度比r)と残響時間Tとを対応付けるテーブルや統計モデル(回帰モデル)を利用して残響時間特定部44が強度PERおよび強度PLRに応じた残響時間Tを特定することも可能である。
(3)前述の各形態では、1個の評価区間について算定された残響時間Tを音響信号xの全区間にわたる残響分離処理に共通に適用したが、時間軸上の相異なる評価区間について残響時間Tを順次に特定し、残響処理部36による残響分離処理に適用される残響時間Tを順次に更新することも可能である。具体的には、第1実施形態と同様の処理(図4)を所定の周期で反復的に実行する構成が採用される。例えば、音響信号xを時間軸上で区分した複数の評価区間の各々について残響時間Tが順次に特定され、任意の1個の評価区間の残響時間Tが、当該評価区間内の各単位区間の音響信号xに対する残響分離処理に適用される。また、例えば、音響信号xの任意の1個の単位区間(以下「対象単位区間」という)を包含するように単位区間の1個分を単位として評価区間を時間軸上で順次に移動させ、各評価区間について特定された残響時間Tを当該評価区間の対象単位区間の音響信号xに対する残響分離処理に適用する構成(単位区間毎に残響時間Tを更新する構成)も好適である。
(4)前述の各形態を公知の音声強調やエコー除去と併用することも可能である。例えば、音声強調やエコー除去等の処理後の音響信号xを対象として、残響解析部34による残響時間Tの特定や残響処理部36による残響分離処理が実行される。残響処理部36による処理後の音響信号yは、例えば音声認識や話者認識等の各種の音響処理の対象としても好適である。
(5)携帯電話機等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音響処理装置100を実現することも可能である。例えば、音響処理装置100は、端末装置から受信した音響信号xから音響信号yを生成して端末装置に送信する。なお、音響信号xの各音響成分X(k,m)が端末装置から送信される構成(例えば端末装置が周波数解析部32を具備する構成)では音響処理装置100から周波数解析部32が省略され、残響分離処理の実行後の音響成分Y(k,m)を音響処理装置100から端末装置に送信する構成(例えば端末装置が波形生成部38を具備する構成)では音響処理装置100から波形生成部38が省略される。また、端末装置が残響処理部36を具備する構成では、音響処理装置100から残響処理部36が省略され、残響解析部34が特定した残響時間Tが音響処理装置100から端末装置に提供される。以上の説明から理解される通り、本発明は、音響信号xの解析で残響時間Tを特定する装置(残響時間推定装置)としても実現され得る。
(6)音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分(共鳴成分)も残響成分に含意される。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分(胴鳴り,箱鳴り)の調整にも本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分(減衰成分)を意味する。
100……音響処理装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32……周波数解析部、33……雑音抑圧部、34……残響解析部、36……残響処理部、38……波形生成部、42……強度算定部、44……残響時間特定部、50……暫定処理部、52……残響分離部、54……強度累算部、56……平滑処理部、60……区間解析部、62……閾値設定部、64……第1区間設定部、66……第2区間設定部、70……演算処理部。

Claims (5)

  1. 音響信号のうち一部の周波数帯域である特定帯域の音響成分について初期反射成分の強度と後期残響成分の強度とを算定する強度算定手段と、
    前記強度算定手段が算定した初期反射成分の強度と後期残響成分の強度とに応じて残響時間を特定する残響時間特定手段と
    を具備する音響処理装置。
  2. 前記強度算定手段は、
    残響時間に応じた残響分離処理を、所定の暫定値を前記残響時間として前記特定帯域の音響成分に実行することで、暫定的な初期反射成分である暫定初期反射成分の強度の時系列と、暫定的な後期残響成分である暫定後期残響成分の強度の時系列とを算定する暫定処理手段と、
    前記暫定処理手段が算定した暫定初期反射成分の強度の時系列と暫定後期残響成分の強度の時系列とに応じて、前記初期反射成分が存在する初期反射区間と前記後期残響成分が存在する後期残響区間とを特定する区間解析手段と、
    前記初期反射区間内の前記暫定初期反射成分の強度に応じて前記初期反射成分の強度を算定するとともに前記後期残響区間内の前記暫定後期残響成分の強度に応じて前記後期残響成分の強度を算定する演算処理手段とを含む
    請求項1の音響処理装置。
  3. 前記区間解析手段は、
    前記暫定初期反射成分の複数の強度に応じた第1閾値と前記暫定後期残響成分の複数の強度に応じた第2閾値とを設定する閾値設定手段と、
    前記暫定初期反射成分の強度が前記第1閾値を上回る第1信号区間と前記暫定後期残響成分の強度が前記第2閾値を上回る第2信号区間とを画定する第1区間設定手段と、
    前記暫定後期残響成分の強度が前記暫定初期反射成分の強度を上回る減衰区間と前記第2信号区間とが相互に重複する区間を前記後期残響区間として設定し、前記後期残響区間以外の区間と前記第1信号区間とが相互に重複する区間を前記初期反射区間として設定する第2区間設定手段とを含む
    請求項2の音響処理装置。
  4. 前記暫定処理手段は、
    前記特定帯域内の音響成分に対する前記残響分離処理により、前記特定帯域内の複数の周波数の各々について前記暫定初期反射成分と前記暫定後期残響成分とを生成する残響分離手段と、
    前記暫定初期反射成分の強度を前記特定帯域内の前記複数の周波数について合計するとともに前記暫定後期残響成分の強度を前記特定帯域の前記複数の周波数について合計する強度累算手段とを含む
    請求項2または請求項3の音響処理装置。
  5. 前記残響時間特定手段が特定した残響時間を適用した残響分離処理を前記音響信号に対して実行する残響処理手段
    を具備する請求項1から請求項4の何れかの音響処理装置。
JP2014037132A 2014-02-27 2014-02-27 音響処理装置および音響処理方法 Expired - Fee Related JP6299279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014037132A JP6299279B2 (ja) 2014-02-27 2014-02-27 音響処理装置および音響処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014037132A JP6299279B2 (ja) 2014-02-27 2014-02-27 音響処理装置および音響処理方法

Publications (2)

Publication Number Publication Date
JP2015161814A true JP2015161814A (ja) 2015-09-07
JP6299279B2 JP6299279B2 (ja) 2018-03-28

Family

ID=54184940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014037132A Expired - Fee Related JP6299279B2 (ja) 2014-02-27 2014-02-27 音響処理装置および音響処理方法

Country Status (1)

Country Link
JP (1) JP6299279B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105529034A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 一种基于混响的语音识别方法和装置
JP2020028016A (ja) * 2018-08-10 2020-02-20 リオン株式会社 残響抑制装置及び補聴器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507720A (ja) * 2004-07-22 2008-03-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号反響除去
JP2009211021A (ja) * 2008-03-04 2009-09-17 Japan Advanced Institute Of Science & Technology Hokuriku 残響時間推定装置及び残響時間推定方法
JP2011065128A (ja) * 2009-08-20 2011-03-31 Mitsubishi Electric Corp 残響除去装置
JP2011203414A (ja) * 2010-03-25 2011-10-13 Toyota Motor Corp 雑音及び残響抑圧装置及びその方法
JP2013130857A (ja) * 2011-11-22 2013-07-04 Yamaha Corp 音響処理装置
US20140037094A1 (en) * 2012-07-03 2014-02-06 Dts, Inc. System and method for estimating a reverberation time
JP2014026241A (ja) * 2012-07-30 2014-02-06 Yamaha Corp 残響時間解析装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507720A (ja) * 2004-07-22 2008-03-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号反響除去
JP2009211021A (ja) * 2008-03-04 2009-09-17 Japan Advanced Institute Of Science & Technology Hokuriku 残響時間推定装置及び残響時間推定方法
JP2011065128A (ja) * 2009-08-20 2011-03-31 Mitsubishi Electric Corp 残響除去装置
JP2011203414A (ja) * 2010-03-25 2011-10-13 Toyota Motor Corp 雑音及び残響抑圧装置及びその方法
JP2013130857A (ja) * 2011-11-22 2013-07-04 Yamaha Corp 音響処理装置
US20140037094A1 (en) * 2012-07-03 2014-02-06 Dts, Inc. System and method for estimating a reverberation time
JP2014026241A (ja) * 2012-07-30 2014-02-06 Yamaha Corp 残響時間解析装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105529034A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 一种基于混响的语音识别方法和装置
JP2020028016A (ja) * 2018-08-10 2020-02-20 リオン株式会社 残響抑制装置及び補聴器
JP7083724B2 (ja) 2018-08-10 2022-06-13 リオン株式会社 残響抑制装置及び補聴器

Also Published As

Publication number Publication date
JP6299279B2 (ja) 2018-03-28

Similar Documents

Publication Publication Date Title
CN103067322B (zh) 评估单通道音频信号中的音频帧的语音质量的方法
US9485597B2 (en) System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain
US10504539B2 (en) Voice activity detection systems and methods
JP5666023B2 (ja) 残響知覚レベルの大きさを決定する装置及び方法、オーディオプロセッサ並びに信号処理方法
JP6064566B2 (ja) 音響処理装置
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP6299279B2 (ja) 音響処理装置および音響処理方法
JP5915281B2 (ja) 音響処理装置
CN113593604A (zh) 检测音频质量方法、装置及存储介质
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP2015049406A (ja) 音響信号解析装置、方法、及びプログラム
EP3242295A1 (en) A signal processor
JP5884473B2 (ja) 音響処理装置および音響処理方法
JP6171558B2 (ja) 音響処理装置
JP2015169901A (ja) 音響処理装置
Cruz et al. An incremental algorithm based on multichannel non-negative matrix partial co-factorization for ambient denoising in auscultation
JP2014052585A (ja) 音響処理装置
JP6191238B2 (ja) 音響処理装置および音響処理方法
JP6036141B2 (ja) 音響処理装置
JP2013182161A (ja) 音響処理装置およびプログラム
JP2015004959A (ja) 音響処理装置
JP2014230085A (ja) 音響処理装置
JP2018049228A (ja) 音響処理装置および音響処理方法
JP5733044B2 (ja) マスキング解析装置,マスカー音選択装置,マスキング装置およびプログラム
JP2002297178A (ja) 音響性能の予測方法、音声認識方法及び音響性能予測装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180212

R151 Written notification of patent or utility model registration

Ref document number: 6299279

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees