JP6905332B2

JP6905332B2 - マルチチャンネル音響の音声信号変換装置及びそのプログラム

Info

Publication number: JP6905332B2
Application number: JP2016244966A
Authority: JP
Inventors: 知美小倉; 大出　訓史; 訓史大出; 一穂小野; 飯田　一博; 一博飯田
Original assignee: Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2016-12-19
Filing date: 2016-12-19
Publication date: 2021-07-21
Anticipated expiration: 2036-12-19
Also published as: JP2018101824A

Description

本発明は、後方のチャンネルを含むマルチチャンネル音響の音声信号を実配置されるスピーカに応じて信号変換するマルチチャンネル音響の音声信号変換装置及びそのプログラムに関する。

近年、２２．２ｃｈ（チャンネル）のマルチチャンネル音響システム（ＩＴＵ−Ｒ勧告ＢＳ.２０５１）や、１１．１ｃｈ、７．１ｃｈ、或いは５．１ｃｈなどの後方にスピーカを配置することを想定したマルチチャンネル音響システムが知られている。

しかしながら、これらのマルチチャンネル音響システムにおけるスピーカ配置を利用者側で設置しようとしても、場所の制約などにより後方にスピーカを設置できないことがよくある。

その解決策として、頭部伝達関数（ＨＲＴＦ）を用いたバイノーラル再生方式が知られている（例えば、非特許文献１参照）。この方式では、受聴者本人の頭部伝達関数（ＨＲＴＦ）を鼓膜上で再現した場合に、精度の高い音像制御が実現できる。

しかし、頭部伝達関数（ＨＲＴＦ）には頭部や耳介形状に起因する個人性があり、他人の頭部伝達関数を使用してその音声を受聴すると、前後誤判定や音像の上昇などが生じやすいことが知られている（例えば、非特許文献２参照）。そして、頭部伝達関数（ＨＲＴＦ）は特殊実験室で測定装置を用いて測定するため、任意の受聴者の任意の方向の頭部伝達関数（ＨＲＴＦ）を測定することは、事実上不可能である。

また、マルチチャンネル音響の音声信号を入力し、ディスプレイの周囲に配置された複数のスピーカによりマルチチャンネル音響再生を行い、臨場感を高める前方スピーカ装置が開示されている（例えば、特許文献１参照）。また、ディスプレイの下方に設置可能とし、マルチチャンネル音響を再生可能な複数のスピーカを棒状に配置した前方スピーカ装置も知られている。

ただし、これらの前方スピーカ装置の技法においても頭部伝達関数の個人性の問題は解消されていない。

特許５６０４３６５号明細書

K. Matsui and A. Ando, "Binaural Reproduction of 22.2 Multichannel Sound over Loudspeakers," AES 129th Convention, Convention Paper 8272 (2010). M.Morimoto and Y.Ando, "On the simulation of sound localization", J.Acoust.Soc. Jpn.(E)1,3(1980) pp.167-174

後方のチャンネルを含むマルチチャンネル音響の音声信号を受聴する際に、後方にスピーカを設置できない場合でも、当該受聴者本人の頭部伝達関数（ＨＲＴＦ）について測定することなく、多くの受聴者が後方に音像を知覚できるようにする技法が望まれる。

本発明の目的は、上述の問題に鑑みて、後方のチャンネルを含むマルチチャンネル音響の音声信号を側方又は斜め前方に実配置されるスピーカから再生して後方に音像を知覚可能とするために、音声信号の信号変換を行うマルチチャンネル音響の音声信号変換装置及びそのプログラムを提供することにある。

本発明におけるマルチチャンネル音響の音声信号変換装置は、後方にスピーカが設置できない場合でも、後方のチャンネルの音声信号に対し、可聴周波数帯域の１つ又は複数の帯域を抑圧する帯域抑圧フィルタを適用して信号変換を行うことで、斜め前方又は側方に実配置される一対のスピーカから後方感を強調して再生可能とし、多くの受聴者が後方に音像を知覚させることができるようにした。

即ち、本発明の音声信号変換装置は、後方のチャンネルを含むマルチチャンネル音響の音声信号に対して信号変換を行う音声信号変換装置であって、可聴周波数帯域内の１つ又は複数の帯域を抑圧する帯域抑圧フィルタを記憶する帯域抑圧フィルタ記憶部と、前記マルチチャンネル音響の音声信号のうち後方のチャンネルの音声信号に対し、前記帯域抑圧フィルタを適用することにより、後方感強調処理を施した音響信号を生成する後方感強調処理部と、を備え、前記マルチチャンネル音響の音声信号のうち後方に設置されるスピーカから再生することが想定されていたチャンネルの音声信号について周波数スペクトルを分析し、この分析結果を基に前記帯域抑圧フィルタ記憶部に記憶されている帯域抑圧フィルタの形状及び抑圧帯域のいずれか一方又は双方を自動的に変更可能にする分析部を更に備えることを特徴とする。

また、本発明の音声信号変換装置において、前記後方感強調処理を施した音響信号は、受聴者の側方又は斜め前方に実配置されるスピーカから再生して後方に音像を知覚可能とすることを特徴とする。

また、本発明の音声信号変換装置において、前記マルチチャンネル音響の音声信号のうち後方以外のチャンネルの音声信号と、前記後方感強調処理を施した音声信号とを重み付け加算により合成し、実配置されるスピーカから再生するための再生信号を生成する再生信号生成部を更に備えることを特徴とする。

また、本発明の音声信号変換装置において、前記再生信号生成部は、前記マルチチャンネル音響の音声信号のうち左右後方のチャンネルの音声信号に対して、左右に異なる信号レベルで前記後方感強調処理を施した音声信号と重み付け加算により合成し、側方もしくは斜め前方の実配置のスピーカから再生するための再生信号を生成することを特徴とする。

また、本発明の音声信号変換装置において、前記後方感強調処理部は、前記マルチチャンネル音響の音声信号のうち後方のチャンネルが複数ある際に、該チャンネル毎に異なる帯域抑圧フィルタを適用可能に構成されていることを特徴とする。

また、本発明の音声信号変換装置において、前記後方感強調処理部は、当該帯域抑圧フィルタについて実配置されるスピーカに応じて選択変更可能に構成されていることを特徴とする。

また、本発明の音声信号変換装置において、前記分析部は、前記分析結果を基に前記帯域抑圧フィルタ記憶部に記憶されている複数の帯域抑圧フィルタのうち前記後方感強調処理部によって使用する帯域抑圧フィルタを自動的に選択設定可能に構成されていることを特徴とする。

また、本発明の音声信号変換装置において、前記帯域抑圧フィルタ記憶部は、予め定めた抑圧量で略２ｋＨｚから略８ｋＨｚの間で可変帯域となる複数種の帯域抑圧フィルタを記憶していることを特徴とする。

また、本発明の音声信号変換装置において、前記帯域抑圧フィルタ記憶部は、当該マルチチャンネル音響の音声信号における後方のチャンネルの音声信号用の頭部伝達関数の４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数を抑圧可能とする上側遮断周波数を持つ帯域抑圧フィルタを、前記後方感強調処理部によって使用する帯域抑圧フィルタとして定め記憶していることを特徴とする。

また、本発明のプログラムは、コンピュータを、本発明のマルチチャンネル音響の音声信号変換装置として機能させるためのプログラムとして構成される。

本発明によれば、後方にスピーカが設置できない場合でも、後方のスピーカから再生することを想定した音声信号を、受聴者本人の頭部伝達関数（ＨＲＴＦ）について測定することなく、多くの受聴者が後方に音像を知覚できるように再生できるようになる。

また、本発明におけるマルチチャンネル音響の音声信号変換装置は、特許文献１に開示されるディスプレイの周囲に配置された複数のスピーカによりマルチチャンネル音響再生を可能とする前方スピーカ装置や、マルチチャンネル音響を再生可能な複数のスピーカを棒状に配置した前方スピーカ装置に対しても、多くの受聴者が後方に音像を知覚できるようになる。

本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置と、その周辺装置の概略構成を示すブロック図である。（ａ）乃至（ｅ）は、それぞれ本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置における帯域抑圧フィルタ記憶部で記憶するフィルタ例を示す図である。本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置における後方感強調処理部の処理を示すフローチャートである。（ａ），（ｂ）は、それぞれ本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置に係る後方に音像を知覚できる割合と帯域抑圧フィルタの抑圧帯域の関係を実験的に評価した結果を示す図である。本発明による第２実施形態のマルチチャンネル音響の音声信号変換装置と、その周辺装置の概略構成を示すブロック図である。本発明による第２実施形態のマルチチャンネル音響の音声信号変換装置における再生信号処理部の処理を示すフローチャートである。本発明による第２実施形態のマルチチャンネル音響の音声信号変換装置における再生信号処理部の処理に係る、再生するチャンネルへの利得係数の一例を示す図である。（ａ），（ｂ）は、それぞれ本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置に係る典型的なスピーカ配置例を示す図である。本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置と、その周辺装置の概略構成を示すブロック図である。本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置における分析部のメイン処理を示すフローチャートである。本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置における分析部のサブ処理を示すフローチャートである。本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置における分析部のサブ処理を示すフローチャートである。（ａ）は、本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置における帯域抑圧フィルタ記憶部内に保持される典型的な基準の帯域抑圧フィルタと入力信号（後方チャンネル音声信号）の周波数スペクトラム分布の関係がずれている様子を例示する図であり、（ｂ）乃至（ｄ）は分析部の処理によって帯域抑圧フィルタのフィルタ形状を変更する様子を例示する図である。（ａ），（ｂ）は、それぞれ本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置における分析部の処理によって帯域抑圧フィルタのフィルタ形状を変更する様子を例示する図である。

以下、図面を参照して、本発明による各実施形態のマルチチャンネル音響の音声信号変換装置について説明する。

〔第１実施形態〕
図１は、本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置１０と、その周辺装置の概略構成を示すブロック図である。

図１に示す音声信号供給装置１００は、複数の音源が発音した複数の音響（歌唱音や楽器音等）の混合音の波形を示すマルチチャンネル音響の音声信号を供給可能とする装置である。特に、図１に示す音声信号供給装置１００は、本来、例示する５ｃｈのマルチチャンネル音響システムのスピーカ配置２００（図示破線）用に、後方のチャンネルの音声信号（後方チャンネル音声信号Ｘｍ）と、前方のチャンネルの音声信号（前方チャンネル音声信号Ｘｏ）と、を含むマルチチャンネル音響の音声信号を供給可能となっている。

スピーカ配置２００は、受聴者の頭部Ｈを基準に前方のスピーカ（前方中央のスピーカＦＣ及び斜め前方左右に一対のスピーカＦＬ，ＦＲ）と、後方のスピーカ（斜め後方左右に一対のスピーカＢＬ，ＢＲ）が配置されることが想定され、音声信号供給装置１００から供給するマルチチャンネル音響の音声信号は、これら各スピーカによって音像を定位させることが想定されたものである。尚、音声信号供給装置１００は、低音用の放音装置（ウーハ）をスピーカ配置２００に対し追加することで５.１ｃｈのサラウンドシステムを構成することも可能なマルチチャンネル音響の音声信号を供給する装置でもよい。

ただし、図１に示す本実施形態の例では、音声信号供給装置１００から供給するマルチチャンネル音響の音声信号は、例示する５ｃｈの変形マルチチャンネル音響システムとして実配置されるスピーカ配置３００にて再生されるようになっている。尚、本発明に直接関係しない要素、例えばスピーカ配置３００にて再生するためのパワーアンプ等の設置の図示は省略している。

つまり、スピーカ配置３００は、受聴者の頭部Ｈを基準に前方のスピーカ（前方中央のスピーカＦＣ及び斜め前方左右に一対のスピーカＦＬ，ＦＲ）についてはスピーカ配置２００と同配値であるが、後方のスピーカ（斜め後方左右に一対のスピーカＢＬ，ＢＲ）が設置できない等の理由で、側方のスピーカ（側方左右に一対のスピーカＳＬ，ＳＲ）として設置されている。

このようなスピーカ配置３００において、音声信号供給装置１００から供給するマルチチャンネル音響の音声信号について、前方チャンネル音声信号Ｘｏをそれぞれ対応する前方中央のスピーカＦＣ及び斜め前方左右に一対のスピーカＦＬ，ＦＲにて再生し、後方チャンネル音声信号Ｘｍをそれぞれ斜め後方左右に一対のスピーカＢＬ，ＢＲの代わりに設置した側方左右に一対のスピーカＳＬ，ＳＲにて再生すると、音像が定位する位置がずれてしまい受聴者が誤認識してしまうことになる。

そこで、図１に示す例では、このようなマルチチャンネル音響の音声信号のうち後方チャンネル音声信号Ｘｍについては本発明による第１実施形態の音声信号変換装置１０へ供給されるようになっている。一方、前方チャンネル音声信号Ｘｏはそれぞれ対応する前方中央のスピーカＦＣ及び斜め前方左右に一対のスピーカＦＬ，ＦＲに供給されるようになっている。

そして、本実施形態の音声信号変換装置１０は、帯域抑圧フィルタ記憶部１１と、後方感強調処理部１２とを備えるよう構成されている。

帯域抑圧フィルタ記憶部１１は、その詳細は後述するが、所定数（１つを含む）の帯域抑圧フィルタを記憶している。この所定数の帯域抑圧フィルタは、フィルタ形状として複数種類あるときは「形状種別」で分類されるとともに、それぞれの形状種別毎に、予め定めた抑圧量で予め定めた抑圧帯域幅の基準の帯域抑圧フィルタが定められ、抑圧帯域として複数種類あるときは各基準の帯域抑圧フィルタに対し異なる抑圧帯域幅となる帯域抑圧フィルタが「帯域種別」で分類されている。

「形状種別」としては、図２を参照して後述するが、矩形状（図２（ａ））、対称三角状（図２（ｂ））、非対称三角状（図２（ｃ））、変形対称三角状又は変形非対称三角状（図２（ｄ））、複数多重した変形三角状（図２（ｅ））がある。帯域抑圧フィルタは、所謂デジタルフィルタによるデジタル信号処理か、又は所謂アクティブフィルタ回路によるアナログ信号処理で実現できる。

「帯域種別」としては、所定オクターブバンド（例えば１／３オクターブバンド）の中心周波数（例えば２ｋＨｚから８ｋＨｚの間で予め規定される周波数）を対象にして、予め定めた抑圧量（例えば９６ｄＢ）で予め定めた抑圧帯域幅（２ｋＨｚから６．３ｋＨｚ）のものを基準の帯域抑圧フィルタとして１つ用意しておき、更に、当該基準の帯域抑圧フィルタに対し異なる抑圧帯域幅（２ｋＨｚから８ｋＨｚ，２．５ｋＨｚから８ｋＨｚ等）を１つ以上用意している。

即ち、本実施形態の例では、「形状種別」で分類される所定種類数の帯域抑圧フィルタについて、それぞれの形状種別毎に、「帯域種別」で分類される複数の帯域抑圧フィルタを帯域抑圧フィルタ記憶部１１に記憶している。

ただし、帯域抑圧フィルタ記憶部１１にて、矩形状（図２（ａ））のもの１種類のみについて１つの基準の帯域抑圧フィルタのみを保持する形態であっても、多くの受聴者に対応させることができ一定の作用・効果が得られるが、後述する理由で、より多くの受聴者に対応させるために、「帯域種別」で分類される複数の帯域抑圧フィルタを保持する形態が望ましい。

後方感強調処理部１２は、その詳細は後述するが、入力される後方チャンネル音声信号Ｘｍに対して、帯域抑圧フィルタ記憶部１１から読み出した帯域抑圧フィルタを適用することで後方感強調処理を行い、これにより側方のチャンネルの音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換し、この後方感強調処理済みの音声信号Ｘｍ’を側方左右に一対のスピーカＳＬ，ＳＲへ出力する機能部である。

ここで、当該受聴者本人の頭部伝達関数（ＨＲＴＦ）を測定することなく、より多くの受聴者が後方に音像を知覚できるようにするために、当該受聴者によって、帯域抑圧フィルタ記憶部１１に保持されている種々の帯域抑圧フィルタの形状種別及び帯域種別を選択的に外部設定できるように、当該外部設定に対応する選択設定信号を発生する外部インターフェース（図示せず）が音声信号変換装置１０に設けられている。そして、後方感強調処理部１２は、この選択設定信号に対応する帯域抑圧フィルタを帯域抑圧フィルタ記憶部１１から読み出し、後方感強調処理を行うよう構成されている。

複数の帯域抑圧フィルタが帯域抑圧フィルタ記憶部１１に記憶してある場合、当該帯域抑圧フィルタを識別できる情報、例えば帯域抑圧フィルタの名称や番号なども帯域抑圧フィルタ記憶部１１に記憶させておくようにする。当該外部インターフェースを用いて、受聴者が複数の帯域抑圧フィルタの名称や番号に対して使用する帯域抑圧フィルタを選択するよう構成することができる。

尚、本実施形態の例では、側方左右に対称に実配置される一対のスピーカＳＬ，ＳＲに対し、共通の帯域抑圧フィルタを適用する例としているが、左側方用スピーカＳＬと右側方用スピーカＳＲとで、異なる帯域抑圧フィルタを適用可能に構成してもよい。このようにチャンネル毎に異なる帯域抑圧フィルタを適用する場合、どのチャンネルに対してどの帯域抑圧フィルタを使用するのかを識別できるように、帯域抑圧フィルタを使用するチャンネルの番号も対応付けて記憶しておき、当該外部インターフェースを用いて受聴者が選択できるよう構成することができる。

このように、例示する本実施形態の音声信号変換装置１０は、後方感強調処理部１２により、入力される後方チャンネル音声信号Ｘｍに対して帯域抑圧フィルタを適用して後方感強調処理を行い、これにより側方のチャンネルの音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換し、この後方感強調処理済みの音声信号Ｘｍ’を側方左右に一対のスピーカＳＬ，ＳＲへ出力するように構成されている。

ただし、この音声信号変換装置１０は、前方チャンネル音声信号Ｘｏ及び後方チャンネル音声信号Ｘｍを入力する構成とすることもでき、この場合も後方感強調処理部１２により、後方チャンネル音声信号Ｘｍに対して帯域抑圧フィルタ記憶部１１から読み出した帯域抑圧フィルタを適用して後方感強調処理を行って側方のチャンネルの音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換して出力するとともに、入力された前方チャンネル音声信号Ｘｏをそのまま出力する構成とすることもできる。

尚、本実施形態の例では、前方チャンネルの音声信号Ｘｏと後方チャンネル音声信号Ｘｍを区別して入力する例を示しているが、音声信号に付随しているメタデータからどの音声信号が後方のチャンネルの音声信号であるか否かを判断し、音声信号変換装置１０内で自動的に前方（或いは側方）のチャンネルの音声信号と後方のチャンネルの音声信号に分離させる構成とすることもできる。

また、音声信号変換装置１０は、その入力段にマルチチャンネル音響のアナログ音声信号を入力してアナログ・デジタル変換処理を施してデジタル信号処理（本実施形態の例では、後方感強調処理）を行い、デジタル信号処理後にデジタル・アナログ変換処理を施してスピーカ配置３００へ出力する構成とすることもできる。

図２（ａ）乃至（ｅ）には、それぞれ本発明による第１実施形態のマルチチャンネル音響の音声信号変換装置１０における帯域抑圧フィルタ記憶部１１で記憶するフィルタ例を示している。図２（ａ）乃至（ｅ）には対応する帯域抑圧フィルタの「形状種別」を示している。

前述したように、帯域抑圧フィルタの「形状種別」として、矩形状（図２（ａ））、対称三角状（図２（ｂ））、非対称三角状（図２（ｃ））、変形対称三角状又は変形非対称三角状（図２（ｄ））、複数多重した変形三角状（図２（ｅ））がある。

図２（ａ），（ｂ）の帯域抑圧フィルタは、下側遮断周波数Ｆ_Ｌと上側遮断周波数Ｆ_Ｕ、並びに予め定めた抑圧量Ｆ_Ｇ（例えば９６ｄＢ）、減衰傾度（例えば−９６ｄＢ／（１／２４ｏｃｔ.））によって規定することができる。減衰傾度を急峻にした場合、図２（ａ）のような矩形状になり、減衰傾度を緩やかにした場合、図２（ｂ）のような対称三角状となる。

非対称三角状（図２（ｃ））の帯域抑圧フィルタは、下側遮断周波数Ｆ_Ｌと上側遮断周波数Ｆ_Ｕ、並びに下側遮断周波数Ｆ_Ｌに関する第１減衰傾度、上側遮断周波数Ｆ_Ｕに関する第２減衰傾度、抑圧量Ｆ_Ｇ（例えば９６ｄＢ）によって規定することができる。

変形対称三角状又は変形非対称三角状（図２（ｄ））の帯域抑圧フィルタは、下側遮断第１周波数Ｆ_Ｌ１と上側遮断第１周波数Ｆ_Ｕ１、下側遮断第２周波数Ｆ_Ｌ２と上側遮断第２周波数Ｆ_Ｕ２、下側強調量Ｅ_Ｌと上側強調量Ｅ_Ｕ並びに下側遮断第１周波数Ｆ_Ｌ１に関する第１減衰傾度、下側遮断第２周波数Ｆ_Ｌ２に関する第２減衰傾度、上側遮断第１周波数Ｆ_Ｕ１に関する第３減衰傾度、上側遮断第２周波数Ｆ_Ｕ２に関する第４減衰傾度、及び抑圧量Ｆ_Ｇ（例えば９６ｄＢ）によって規定することができる。

また、複数多重した変形三角状（図２（ｅ））の帯域抑圧フィルタは、複数のノッチに個別に下側遮断周波数Ｆ_Ｌと上側遮断周波数Ｆ_Ｕ、下側の減衰傾度、上側の減衰傾度、抑圧量によって規定することができる。例えばノッチＳ_Ｎ１，Ｓ_Ｎ１に対応させる抑圧量Ｆ_Ｇ１，Ｆ_Ｇ２をそれぞれ９０ｄＢ，９６ｄＢとして予め規定しておくことができる。

（後方感強調処理）
図３を参照して、後方感強調処理部１２による後方感強調処理について説明する。まず、後方感強調処理部１２は、入力される後方チャンネル音声信号Ｘｍに対し、帯域抑圧フィルタ記憶部１２に保持される初期設定された帯域抑圧フィルタを適用する（ステップＳ１）。ここで、初期設定された帯域抑圧フィルタとして、矩形状（図２（ａ））の帯域抑圧フィルタによる予め定めた抑圧量（例えば９６ｄＢ）で予め定めた抑圧帯域幅（下側遮断周波数Ｆ_Ｌ＝２ｋＨｚ、上側遮断周波数Ｆ_Ｕ＝６．３ｋＨｚ）、減衰傾度（−９６ｄＢ／（１／２４ｏｃｔ.））の基準の帯域抑圧フィルタを用いるものとする。

続いて、後方感強調処理部１２は、外部からの選択設定信号の有無を監視し（ステップＳ２）、当該選択設定信号が無ければ（ステップＳ２：Ｎｏ）、後方チャンネルの音声信号Ｘｍに対し当該基準の帯域抑圧フィルタを適用した後方感強調処理済みの音声信号Ｘｍ’を、本例では側方チャンネル音声信号として出力する（ステップＳ４）。

一方、当該選択設定信号が有るとき（ステップＳ２：Ｙｅｓ）、後方感強調処理部１２は、当該選択設定信号に対応する帯域抑圧フィルタを、帯域抑圧フィルタ記憶部１１から読み出して、入力される後方チャンネル音声信号Ｘｍに対して適用し（ステップＳ３）、当該選択設定信号に対応する帯域抑圧フィルタを適用した後方感強調処理済みの音声信号Ｘｍ’を、本例では側方チャンネル音声信号として出力する（ステップＳ４）。

本実施形態の例では、斜め後方左右に一対のスピーカＢＬ，ＢＲ用として想定されていた後方チャンネル音声信号Ｘｍに対して帯域抑圧フィルタを適用し、それぞれ側方左右に一対のスピーカＳＬ，ＳＲ用の側方チャンネル音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換する例を示しているが、斜め前方左右に一対のスピーカＦＬ，ＦＲ用の斜め前方チャンネル音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換するよう構成してもよい。この場合には、受聴者が複数の帯域抑圧フィルタの名称や番号に対して使用する帯域抑圧フィルタを選択する際に、その時の抑圧量も選択可能にして調整できるようにすることが好ましい。従って、後方感強調処理部１２は、当該帯域抑圧フィルタについて実配置されるスピーカに応じて選択変更可能に構成することができる。また、実配置されるスペーカ位置を制限しないようにするためには、マルチチャンネル音響の音声信号のうち後方に設置されたスピーカから再生することが想定された複数のチャンネルがある際に、該チャンネル毎に異なる帯域抑圧フィルタを適用可能に構成すればよい。

ところで、このように斜め後方左右に一対のスピーカＢＬ，ＢＲ用として想定されていた後方チャンネル音声信号Ｘｍに対して帯域抑圧フィルタを適用し、それぞれ側方左右に一対のスピーカＳＬ，ＳＲ用の側方チャンネル音声信号（後方感強調処理済みの音声信号Ｘｍ’）へと変換することで、多くの受聴者が後方に音像を知覚できるようになるか否かについて実験により検証した。

より具体的には、１／３オクターブバンドの中心周波数１．６ｋＨｚから１２．５ｋＨｚまでの周波数帯域を様々な帯域幅で抑圧した広帯域白色雑音を、受聴者の側方左右に一対のスピーカＳＬ，ＳＲから再生して、複数の受聴者に知覚した音像の方向を回答させる主観評価実験を行った。

音源は２００Ｈｚ〜１７ｋＨｚの広帯域白色雑音とした。帯域抑圧フィルタは、１．６ｋＨｚから１２．５ｋＨｚの１／３オクターブバンドを１〜１０バンドまで連続して抑圧した矩形状帯域抑圧フィルタの帯域幅を可変とした５５種類とし、帯域抑圧フィルタなしを含めて全５６種類である。帯域抑圧フィルタの抑圧量はＦ_Ｇ＝９６ｄＢで固定した。刺激の時間長は１．２秒とし、定常状態を１秒、ハミング窓によるフェードイン、フェードアウトを０．１秒ずつ設けた側方チャンネル音声信号（後方感強調処理済みの音声信号Ｘｍ’）を複数の受聴者に受聴させた。尚、実験に用いたスピーカはＦＯＳＴＥＸ製ＦＥ８３Ｅ、パワーアンプはＹＡＭＡＨＡ製ＰＡ４０５０、オーディオインターフェースはＲＭＥ製ＦｉｒｅｆａｃｅＵＣ、音声信号変換装置１０を構成したパーソナルコンピュータとして、エプソン製ＥｎｄｅｖｏｒＰｒｏ５６００で構成した。

そして、水平面内の方位角±９０°に設置した側方に左右一対のスピーカＳＬ，ＳＲから同相で刺激を提示した。スピーカＳＬ，ＳＲから当該受聴者の頭部Ｈの中心までの距離は１．２ｍであり、高さは、１．２ｍ（ほぼ当該受聴者の耳の高さ）に調整した。提示音圧レベルは、頭部中心位置で、６０ｄＢ（Ａ特性）である。当該受聴者には、音像の上昇角をマッピング法で回答させた。回答時問は６秒とした。１試行で全５６種類の実験音源を１回ずつランダムに提示し、提示順を変えて各々の当該受聴者について１０試行繰り返した。複数の当該受聴者は成人１０名である。

全５６種類の実験音源を基に、多くの受聴者が後方に音像を知覚できる割合の高いものから順に、上位１１パターン（Ｎｏ．１〜Ｎｏ．１１）の帯域抑圧フィルタの抑圧帯域についてまとめた結果を図４（ａ）に示している。

図４（ａ）にてＮｏ．１として示す帯域抑圧フィルタは、矩形状（図２（ａ））の帯域抑圧フィルタによる予め定めた抑圧量（例えば９６ｄＢ）で予め定めた抑圧帯域幅（下側遮断周波数Ｆ_Ｌ＝２ｋＨｚ、上側遮断周波数Ｆ_Ｕ＝６．３ｋＨｚ）、減衰傾度−９６ｄＢ／（１／２４ｏｃｔ.）の基準の帯域抑圧フィルタに対応している。

即ち、Ｎｏ．１として示す帯域抑圧フィルタのみを帯域抑圧フィルタ記憶部１２に保持しておき、後方感強調処理部１２により読み出して後方感強調処理を適用するだけでも、７８％の確率で後方に音像を知覚できている。

また、図４（ｂ）に示すように、Ｎｏ．１，２，３として示す帯域抑圧フィルタを帯域抑圧フィルタ記憶部１２に保持しておき、当該受聴者によって選択設定させ、後方感強調処理部１２により読み出して後方感強調処理を適用することで、９１％の確率で、後方に音像を知覚できるようになることが分かった。

一方、Ｎｏ．１，２，３として示す帯域抑圧フィルタでは抑圧帯域が広く、音響品質を損ないかねないことから、より狭い帯域幅となる複数の帯域抑圧フィルタを当該受聴者によって選択設定させるよう構成することができる。例えば、図４（ｂ）に示すように、Ｎｏ．６，７，１０，１１として示す帯域抑圧フィルタを当該受聴者によって選択設定させることで、８１％の確率で後方に音像を知覚できるようになることが分かった。また、更に狭い帯域幅となる複数の帯域抑圧フィルタとして、Ｎｏ．６，１１として示す帯域抑圧フィルタを当該受聴者によって選択設定させることで、７９％の確率で後方に音像を知覚できるようになることが分かった。

このように、概ね２ｋＨｚ〜８ｋＨｚの間で可変帯域となる複数種の帯域抑圧フィルタを帯域抑圧フィルタ記憶部１２に保持しておき、受聴者によって選択設定可能に構成することで、より多くの受聴者が後方に音像を知覚できるようになる。そして、図２に示したように、形状種別として複数種の形状の帯域抑圧フィルタを用意することで、更に一層、高品質でより多くの受聴者が後方に音像を知覚できるようになることが期待できる。

特に、頭部伝達関数（ＨＲＴＦ）は個人性があるが、平均的な後方チャンネル音声信号用の頭部伝達関数（ＨＲＴＦ）において、４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数は約６ｋＨｚ〜１０ｋＨｚに集中している。そこで、前述の頭部伝達関数（ＨＲＴＦ）の４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数を抑圧可能とする上側遮断周波数を持つ帯域抑圧フィルタを、後方感強調処理部１２によって使用する帯域抑圧フィルタとして定め、帯域抑圧フィルタ記憶部１１に記憶しておくようにすることが好ましい。これにより、より多くの受聴者が後方に音像を知覚する汎用的な後方音像知覚効果が得られるようになる。

〔第２実施形態〕
図５は、本発明による第２実施形態のマルチチャンネル音響の音声信号変換装置１０と、その周辺装置の概略構成を示すブロック図である。尚、図５において、図１と同様な構成要素には同一の参照番号を付している。第２実施形態では、入力されるマルチチャンネル音響の音声信号のチャンネル数より少ない出力チャンネル数（スピーカ数）で斜め前方（側方でもよい）から再生する場合を想定している。

図５に示す音声信号供給装置１００は、第１実施形態と同様に、本来、例示する５ｃｈのマルチチャンネル音響システムのスピーカ配置２００（図示破線）用に、後方のチャンネルの音声信号（後方チャンネル音声信号Ｘｍ）と、前方のチャンネルの音声信号（前方チャンネル音声信号Ｘｏ）と、を含むマルチチャンネル音響の音声信号を供給可能とする装置として構成される。

そして、スピーカ配置２００は、受聴者の頭部Ｈを基準に前方のスピーカ（前方中央のスピーカＦＣ及び斜め前方左右に一対のスピーカＦＬ，ＦＲ）と、後方のスピーカ（斜め後方左右に一対のスピーカＢＬ，ＢＲ）に配置されることが想定され、音声信号供給装置１００から供給するマルチチャンネル音響の音声信号は、これら各スピーカによって音像を定位させることが想定されたものである。尚、音声信号供給装置１００は、低音用の放音装置（ウーハ）をスピーカ配置２００に対し追加することで５.１ｃｈのサラウンドシステムを構成することも可能なマルチチャンネル音響の音声信号を供給する装置とすることもできる。

ただし、図５に示す例では、音声信号供給装置１００から供給するマルチチャンネル音響の音声信号は、例示する３ｃｈの変形マルチチャンネル音響システムとして実配置されるスピーカ配置４００にて再生されるようになっている。スピーカ配置４００は、受聴者の頭部Ｈを基準に前方のスピーカＦＣと、斜め前方のスピーカ（スピーカＦＬ，ＦＲ）が設置されている。

スピーカ配置４００において音像が定位する位置がずれて受聴者が誤認識することを抑制するために、５ｃｈのマルチチャンネル音響の音声信号は、本発明による第２実施形態の音声信号変換装置１０に供給され、この音声信号変換装置１０からスピーカ配置４００の３ｃｈの変形マルチチャンネル音響システムのスピーカ配置４００にて再生されるようになっている。尚、本発明に直接関係しない要素、例えばスピーカ配置４００にて再生するためのパワーアンプ等の設置の図示は省略している。

そして、本実施形態の音声信号変換装置１０は、帯域抑圧フィルタ記憶部１１と、後方感強調処理部１２と、再生信号生成部１３とを備えるよう構成される。即ち、本実施形態の音声信号変換装置１０は、第１実施形態と比較して、再生信号生成部１３を更に備える点で相違する。

帯域抑圧フィルタ記憶部１１及び後方感強調処理部１２の動作は、第１実施形態と同様であり更なる詳細な説明は省略する。

再生信号生成部１３は、後方感強調処理部１２から出力される後方感強調処理済みの音声信号Ｘｍ’（２チャンネル分）と前方チャンネル音声信号Ｘｏ（３チャンネル分）を入力し、予め定めた利得係数を基に重み付け加算合成処理を施して、スピーカ配置４００にて再生されるべき３チャンネル分のマルチチャンネル音響の音声信号（再生信号）を生成し、スピーカ配置４００に向けて出力する。

つまり、前述した第１実施形態では、後方感強調処理部１２から出力される後方感強調処理済みの音声信号Ｘｍ’（２チャンネル分）を、側方チャンネル音声信号としてスピーカ配置３００に向けて出力するよう構成していたが、本実施形態では、前方チャンネル音声信号Ｘｏ（３チャンネル分）との重み付け加算合成処理を経て、斜め前方のスピーカ（スピーカＦＬ，ＦＲ）用の前方チャンネル音声信号が生成される。

（再生信号生成処理）
ここで、図６を参照して、再生信号生成部１３による再生信号生成処理について説明する。まず、再生信号生成部１３は、後方感強調処理部１２によって帯域抑圧フィルタを適用した後方感強調処理済みの音声信号Ｘｍ’（２チャンネル分）と、音声信号供給装置１００から得られる前方チャンネル音声信号Ｘｏ（３チャンネル分）を入力する（ステップＳ１１）。

続いて、再生信号生成部１３は、各チャンネルの音声信号に対し、再生するチャンネルへの予め定められた利得係数ｋ_ｉｎ（添え字ｉは出力チャンネル番号、添え字ｎは入力チャンネル番号を示す）を乗算する（ステップＳ１２）。

利得係数ｋ_ｉｎの一例を図７に示している。入力信号は、前方チャンネル音声信号Ｘｏ（３チャンネル分）と、後方感強調処理済みの音声信号Ｘｍ’（２チャンネル分）の５チャンネル分であり、それぞれ本来、５ｃｈのマルチチャンネル音響システムのスピーカ配置２００における前方中央のスピーカＦＣ用、斜め前方左右に一対のスピーカＦＬ，ＦＲ用、及び斜め後方左右に一対のスピーカＢＬ，ＢＲ用の音声信号に対応しており、図７では便宜上、順番に“１ｃｈ”〜“５ｃｈ”として表し、利得係数ｋ_ｉｎにおける添え字ｎはその入力チャンネル番号に対応させている。そして、再生信号生成部１３の出力信号（再生信号）は、スピーカ配置４００における斜め前方左右に一対のスピーカＦＬ，ＦＲ用、及び前方中央のスピーカＦＣ用の音声信号に対応しており、図７では便宜上、順番に“１ｃｈ”〜“３ｃｈ”として表し、利得係数ｋ_ｉｎにおける添え字ｉはその出力チャンネル番号に対応させている。

続いて、再生信号生成部１３は、利得係数を乗算した各チャンネルの音声信号を、再生するチャンネル用に加算し、再生信号を生成する（ステップＳ１３）。即ち、図７に示すように予め規定された再生するチャンネル毎の利得係数ｋ_ｉｎの割り当てを参照して、式（１）のように５チャンネル分の入力信号ｘ_ｎ（添え字ｎは入力チャンネル番号）に利得係数ｋ_ｉｎを乗算した音声信号を加算して３チャンネル分の再生信号を生成する。

そして、再生信号生成部１３は、再生するチャンネル毎の再生信号をスピーカ配置４００に向けて出力する（ステップＳ１４）。

尚、本実施形態では、図８（ａ）に示すように、本来、受聴者の頭部Ｈの背面からの配置角度θで斜め後方左右に一対のスピーカＢＬ，ＢＲが配置されることが想定されている後方チャンネル音声信号Ｘｍであるときに、後方感強調処理済みの音声信号Ｘｍ’に対し、受聴者の頭部Ｈの正面からの配置角度θ_０で斜め前方左右に一対のスピーカＦＬ，ＦＲにおける左右のレベルバランスを考慮した利得係数ｋ_ｉｎが設定されている。

即ち、ｓｉｎθとｓｉｎθ_０の比が、“前方左用のスピーカＦＬのための利得係数ｋ_Ｌ及び前方右用のスピーカＦＲのための利得係数ｋ_Ｒの差分”と“利得係数ｋ_Ｌ及び利得係数ｋ_Ｒの和”の比と等しくなるよう利得係数ｋ_ｉｎが設定されている。

より具体的には、図７における利得係数ｋ_１４，ｋ_２４，ｋ_１５，ｋ_２５は、例えば図８（ａ）において左右対称でθ_０＝６０°の斜め前方スピーカＦＬ，ＦＲにより、左右対称でθ＝４５°の斜め後方スピーカＢＬ，ＢＲ用の入力信号に対し後方感強調処理を施して再生する場合を想定すると、この左右のレベルバランスの調整のために従来から知られているサイン則（例えば、安藤彰男,“音場の高臨場感技術”，映像情報メディア学会誌Vol.66, No.8, pp.671-677(2012)参照）を用いることができる。

つまり、図８（ａ）において、例えば受聴者の頭部Ｈの中心から後方感強調済みの音声信号を再生するスピーカＦＬ，ＦＲまでの角度θ_０＝６０°、受聴者の頭部Ｈの中心から後方に定位させたい音像の位置での角度θを４５°、入力信号（５チャンネル分の音声信号）を前方左側のスピーカＦＬから再生する音声の利得係数をｋ_１４、前方右側のスピーカＦＲから再生する音声の利得係数をｋ_２４とすると、式（２）から求めることができる。

同じく、図８（ｂ）に示すように、本来、受聴者の頭部Ｈの背面からの配置角度θで斜め後方左右に一対のスピーカＢＬ，ＢＲが配置されることが想定されている後方チャンネル音声信号Ｘｍであるときに、後方感強調処理済みの音声信号Ｘｍ’に対し、受聴者の頭部Ｈの正面からの配置角度θ_０で側方左右に一対のスピーカＳＬ，ＳＲにおける左右のレベルバランスを考慮した利得係数ｋ_ｉｎを設定することができる。

つまり、図８（ｂ）において、例えば受聴者の頭部Ｈの中心から後方感強調済みの音声信号を再生するスピーカＳＬ，ＳＲまでの角度θ_０＝９０°、受聴者の頭部Ｈの中心から後方に定位させたい音像の位置での角度θを４５°、入力信号（５チャンネル分の音声信号）を側方左側のスピーカＳＬから再生する音声の利得係数をｋ_１４、側方右側のスピーカＳＲから再生する音声の利得係数をｋ_２４とすると、同様に、式（２）から求めることができる。

このような左右のレベルバランスはサイン則の他にもタンゼント則など別の方法を用いて利得係数を算出してもよい。また、本実施形態の例では、５ｃｈ或いは５．１ｃｈのマルチチャンネル音響を例に説明しているが、再生チャンネルへの割り当てとして、２２．２ｃｈや、１１．１ｃｈ、或いは１０．２ｃｈの場合など、入力チャンネル数と出力チャンネル数の組み合わせについてそれぞれの利得係数のパターンを、再生信号生成部１３により読み出し可能な記憶部（図示せず）に予め記憶しておき、図示しない外部インターフェースを用いて受聴者がその割り当てを選択可能にしておくこともできる。これにより、生信号生成部１３は、入力チャンネル数や出力チャンネル数に応じて、尚且つ左右に異なる信号レベルで重み付け加算で合成して側方もしくは斜め前方の実配置のスピーカから再生するための再生信号を生成することができる。

尚、このように側方又は前方のチャンネルの音声信号に対して、帯域抑圧フィルタによるフィルタ処理に遅延が生じるときは、再生信号生成部１３の出力チャンネルの音声信号として音声信号変換装置１０への入力信号のチャンネルの音声信号の位相関係を維持するよう同期を確保するために、一定量の遅延を加えてもよい。

以上のように、入力されるマルチチャンネル音響の音声信号のチャンネル数より少ない出力チャンネル数（スピーカ数）で側方又は斜め前方から再生する場合でも、第１実施形態と同様に、より多くの受聴者が後方に音像を知覚することができようになる。

従って、概ね２ｋＨｚ〜８ｋＨｚの間で可変帯域となる複数種の帯域抑圧フィルタを帯域抑圧フィルタ記憶部１２に保持しておき、受聴者によって選択設定可能に構成することで、より多くの受聴者が後方に音像を知覚できるようになる。そして、図２に示したように、形状種別として複数種の形状の帯域抑圧フィルタを用意することで、更に一層、高品質でより多くの受聴者が後方に音像を知覚できるようになることが期待できる。

特に、頭部伝達関数（ＨＲＴＦ）は個人性があるが、平均的に、後方チャンネル音声信号用の頭部伝達関数（ＨＲＴＦ）において、４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数は約６ｋＨｚ〜１０ｋＨｚに集中している。そこで、後方チャンネル音声信号用の頭部伝達関数（ＨＲＴＦ）の４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数を抑圧可能に上側遮断周波数を持つ帯域抑圧フィルタを、或る帯域種別の基準の帯域抑圧フィルタとして予め設定しておくことで、より多くの受聴者が後方に音像を知覚する汎用的な後方音像知覚効果が得られるようになる。

〔第３実施形態〕
図９は、本発明による第３実施形態のマルチチャンネル音響の音声信号変換装置１０と、その周辺装置の概略構成を示すブロック図である。尚、図９において、図５と同様な構成要素には同一の参照番号を付している。第３実施形態における音声信号変換装置１０では、第２実施形態の構成に加えて分析部１４が設けられ、分析部１４により入力信号（入力される後方チャンネル音声信号Ｘｍ）を周波数分析し、分析結果によって帯域抑圧フィルタ記憶部１１に記憶されている或る帯域種別の基準の帯域抑圧フィルタを変形するか、又は或る帯域種別の基準の帯域抑圧フィルタに換えて別の帯域抑圧フィルタを選択するか、が変更可能となっている。

尚、以下に説明する第３実施形態では、上述した第２実施形態の音声信号変換装置１０に対して更に分析部１４を設ける例を説明するが、上述した第１実施形態の音声信号変換装置１０に対して更に同様の分析部１４を設ける構成とすることができる。

即ち、本実施形態の音声信号変換装置１０は、帯域抑圧フィルタ記憶部１１と、後方感強調処理部１２と、再生信号生成部１３と、分析部１４とを備えるよう構成され、第２実施形態と比較して、分析部１４を更に備える点で相違する。

帯域抑圧フィルタ記憶部１１、後方感強調処理部１２、及び再生信号生成部１３の動作は、第１及び第２実施形態と同様であり更なる詳細な説明は省略する。

分析部１４は、後方チャンネル音声信号Ｘｍを入力して周波数分析を行い、その分析結果によって帯域抑圧フィルタ記憶部１１に記憶されている或る帯域種別の基準の帯域抑圧フィルタを変形するか、又は或る帯域種別の基準の帯域抑圧フィルタから別の帯域抑圧フィルタに選択することで変更可能とし、変更した際にはその旨を後方感強調処理部１２に指示して変更後の帯域抑圧フィルタを利用させる機能部である。

（分析処理）
ここで、図１０乃至図１２を参照して、分析部１４による分析処理について説明する。図１０は、本実施形態のマルチチャンネル音響の音声信号変換装置１０における分析部１４のメイン処理を示すフローチャートであり、図１１及び図１２は、分析部１４のサブ処理を示すフローチャートである。

尚、図１０乃至図１２に示す分析処理は、帯域抑圧フィルタ記憶部１１にて図２に示すような複数種の形状種別の帯域抑圧フィルタが保持され、更にその形状種別毎に、複数の帯域種別の帯域抑圧フィルタが保持されている場合を説明する。

まず、図１０を参照するに、分析部１４は、所定帯域（例えば±１オクターブバンド）内に入力される後方チャンネル音声信号Ｘｍに対し、周波数スペクトルの分析を行う（ステップＳ２１）。

続いて、分析部１４は、帯域抑圧フィルタ記憶部１１に保持される或る帯域種別の基準の帯域抑圧フィルタについて、変更判定処理を実行する（ステップＳ２２）。

ここで、帯域抑圧フィルタ記憶部１１にて図２（ａ）乃至（ｅ）に示すような複数種の形状種別の帯域抑圧フィルタが保持され、更にその形状種別毎に、複数の帯域種別の帯域抑圧フィルタが保持されている。このため、その形状種別毎に、或る帯域種別の基準の帯域抑圧フィルタが設定されているものとし、この或る帯域種別の基準の帯域抑圧フィルタに対して異なる帯域幅の複数の帯域種別の帯域抑圧フィルタが保持されている。

そして、後述する図１１及び図１２に示すサブ処理（変更判定処理）により、その形状種別毎に、或る帯域種別の基準の帯域抑圧フィルタの形状が変更され、併せて当該異なる帯域幅の複数の帯域種別の帯域抑圧フィルタの形状が変更される。

尚、帯域抑圧フィルタ記憶部１１にて１つの或る帯域種別の基準の帯域抑圧フィルタのみが保持されているときは、その帯域抑圧フィルタの形状が変更される。

また、帯域抑圧フィルタの変更は、帯域抑圧フィルタ記憶部１１にて１種類の或る帯域種別の基準の帯域抑圧フィルタについて異なる帯域幅の複数の帯域種別の帯域抑圧フィルタが保持されているときに、複数有るうちの１つの帯域抑圧フィルタを選択することを含む。

図１０を参照するに、分析部１４は、当該変更判定処理後に、帯域抑圧フィルタについて変更した際にはその旨を後方感強調処理部１２に指示する（ステップＳ２３）。

そして、分析部１４からの指示を受け付けた後方感強調処理部１２は、当該分析部１４によって変更された帯域抑圧フィルタについて、これまで使用していた形状種別の帯域抑圧フィルタに対応させてその変更後の帯域抑圧フィルタを適用するよう構成される。

（変更判定処理）
次に、変更判定処理を説明する。図１１を参照するに、分析部１４は、入力される後方チャンネル音声信号Ｘｍの周波数スペクトルのうち、周波数スペクトルの分析を行った所定帯域（例えば±１オクターブバンド）の範囲で、帯域抑圧フィルタ記憶部１１に既設定されている帯域抑圧フィルタの変更判定処理を行う。

まず、分析部１４は、当該所定帯域内に高域側ピークＳ_Ｐ２から見て所定レベル以上、例えば２０ｄＢ以上で所定幅以上（例えば０．１２５％）のノッチが有るか否かを監視する（ステップＳ３１）。

当該所定帯域内にて２０ｄＢ以上のノッチが有るとき（ステップＳ３１：Ｙｅｓ）、分析部１４は、後述する図１３（ａ）の上側図に示すような当該所定帯域内におけるピークＳ_Ｐ１に基づく半値Ｓ_Ｌ、ピークＳ_Ｐ２に基づく半値Ｓ_Ｕ、及びノッチＳ_Ｎ（後述する図１４（ａ）の上側図に示すＳ_Ｎ１, Ｓ_Ｎ２を含む）を保持する（ステップＳ３２）。

続いて、分析部１４は、帯域抑圧フィルタ記憶部１１に保持されるうちの帯域抑圧フィルタにおける特定の形状種別について、特定の帯域種別のものを選択する（ステップＳ３３）。

続いて、分析部１４は、図１２を参照するに、当該特定の帯域種別の帯域抑圧フィルタＳ_Ｕを基に｜Ｓ_Ｕ−Ｆ_Ｕ｜が閾値Ｔｈを超えてずれていないかを判定する（ステップＳ３４）。

閾値Ｔｈを超えてずれているとき（ステップＳ３４：Ｎｏ）、分析部１４は、当該特定の形状種別の帯域抑圧フィルタにおける全ての帯域種別のものについて変更なしとして判定し（ステップＳ３５）、ステップＳ３８に移行する。

一方、閾値Ｔｈを超えてずれていないとき（ステップＳ３４：Ｙｅｓ）、分析部１４は、当該特定の帯域種別のものを閾値Ｔｈ以上、上側遮断周波数Ｆ_Ｕが下限周波数Ｆ_Ｕｍｉｎ以上、上限周波数Ｆ_Ｕｍａｘ以下となるよう所定値で変更する（ステップＳ３６）。この変更処理は、閾値Ｔｈ以上、上側遮断周波数Ｆ_Ｕが予め定めた下限周波数Ｆ_Ｕｍｉｎ以上、及び予め定めた上限周波数Ｆ_Ｕｍａｘ以下となる複数有るうちの１つを選択することを含む。つまり、当該特定の帯域種別のフィルタ（各帯域種別における基準の帯域抑圧フィルタ）の形状を直接的に所定値で形状変更するか、或いは複数の帯域抑圧フィルタが保持されているうちの閾値Ｔｈ以上、上側遮断周波数Ｆ_Ｕが予め定めた下限周波数Ｆ_Ｕｍｉｎ以上、及び予め定めた上限周波数Ｆ_Ｕｍａｘ以下となる１つを選択するよう構成することができる。例えば、Ｆ_Ｕｍｉｎ＝６．３ｋＨｚ、上限周波数Ｆ_Ｕｍａｘ＝８ｋＨｚとすることができる。

続いて、分析部１４は、当該特定の形状種別の帯域抑圧フィルタについて、当該所定値を用いて全ての帯域種別のものを変更する（ステップＳ３７）。これは、図９に示すように、外部インターフェースで受聴者が形状種別・帯域種別に関する選択する余地を残しているためである。

続いて、分析部１４は、全ての形状種別の帯域抑圧フィルタの変更判定が終了したか否かを判定する（ステップＳ３８）。全ての形状種別の帯域抑圧フィルタの変更判定が終了していないとき（ステップＳ３８：Ｎｏ）、図１１に示すステップＳ３３に移行し、別の形状種別の帯域抑圧フィルタの選択を行う。全ての形状種別の帯域抑圧フィルタの変更判定が終了していれば（ステップＳ３８：Ｙｅｓ）、帯域抑圧フィルタの変更判定処理を終了する。

尚、分析部１４は、帯域抑圧フィルタの変更判定に係る帯域内に複数のノッチを検出した場合、全てのノッチを順に走査（例えば、高域のノッチから順に走査）して、変更判定処理を実行する。

このように、分析部１４は、音声信号変換装置に入力されるマルチチャンネル音響の音声信号のうち後方に設置されるスピーカから再生することが想定されていたチャンネルの音声信号について周波数スペクトルを分析し、この分析結果を基に帯域抑圧フィルタ記憶部１１に記憶されている帯域抑圧フィルタの形状及び抑圧帯域のいずれか一方又は双方を自動的に変更可能に構成される。

特に、分析部１４は、その分析結果を基に帯域抑圧フィルタ記憶部１１に記憶されている複数の帯域抑圧フィルタのうち後方感強調処理部１２によって使用する帯域抑圧フィルタを自動的に選択設定するよう構成することができる。

図１３（ａ）は、例えば図２（ａ）に示す矩形状の帯域抑圧フィルタについて、入力信号（後方チャンネル音声信号）の周波数スペクトラム分布に対し、帯域抑圧フィルタ記憶部１１に記憶されている特定の帯域種別の帯域抑圧フィルタの｜Ｓ_Ｕ−Ｆ_Ｕ｜が閾値Ｔｈを超えてずれていない様子を示している。

そして、分析部１４による帯域抑圧フィルタの変更処理によって、例えば図２（ａ）に示す矩形状の帯域抑圧フィルタについては、図１３（ｂ）に示すように、｜Ｓ_Ｕ−Ｆ_Ｕ｜＜Ｔｈのときに、Ｆ_Ｕ＞Ｓ_Ｎ、且つＴｈ≦｜Ｓ_Ｕ−Ｆ_Ｕ｜、且つＦ_Ｕｍｉｎ≦Ｆ_Ｕ≦Ｆ_Ｕｍａｘとなるよう所定値で中心周波数の変更を行い基準の帯域抑圧フィルタとして更新する。或いは複数有るうちの選択によるときは、これを満たす中心周波数のものを基準の帯域抑圧フィルタとして選択更新する。

また、図１３（ｃ）に示すように、｜Ｓ_Ｕ−Ｆ_Ｕ｜＜Ｔｈのときに、Ｆ_Ｕ＞Ｓ_Ｎ、且つＴｈ≦｜Ｓ_Ｕ−Ｆ_Ｕ｜、且つＦ_Ｕｍｉｎ≦Ｆ_Ｕ≦Ｆ_Ｕｍａｘとなるよう所定値で帯域幅の変更を行い基準の帯域抑圧フィルタとして更新する。或いは複数有るうちの選択によるときは、これを満たす帯域幅のものを基準の帯域抑圧フィルタとして選択更新する。

また、図１３（ｄ）に示すように、Ｔｈ≦｜Ｓ_Ｕ−Ｆ_Ｕ｜、且つＦ_Ｕｍｉｎ≦Ｆ_Ｕ≦Ｆ_Ｕｍａｘを満たすが、Ｓ_Ｎ＜Ｆ_Ｇのときに、Ｆ_Ｇ’＝Ｓ_Ｎ＋α＞Ｆ_Ｇ（α：マージン）となるよう所定値で抑圧量の変更を行い基準の帯域抑圧フィルタとする。或いは複数有るうちの選択によるときは、これを満たす抑圧量のものを基準の帯域抑圧フィルタとして選択更新する。

更に、図２（ｂ）乃至図２（ｄ）に示す三角状ベースの帯域抑圧フィルタについては、図１４（ａ）に示すように、｜Ｓ_Ｕ−Ｆ_Ｕ｜＜Ｔｈのときに、Ｆ_Ｕ＞Ｓ_Ｎ、且つＴｈ≦｜Ｓ_Ｕ−Ｆ_Ｕ｜、且つＦ_Ｕｍｉｎ≦Ｆ_Ｕ≦Ｆ_Ｕｍａｘとなるよう所定値で減衰傾度の変更を行い基準の帯域抑圧フィルタとして更新する。或いは複数有るうちの選択によるときは、これを満たす減衰傾度のものを基準の帯域抑圧フィルタとして選択更新する。

帯域抑圧フィルタの変更判定処理は、当該判定対象の所定帯域内における入力信号のノッチ数と帯域抑圧フィルタのノッチ数が一致するか否かで帯域抑圧フィルタの変更判定を行うようにしてもよい。例えば、図２（ｅ）に示す複数ノッチの帯域抑圧フィルタについては、図１４（ｂ）に示すように、入力信号のノッチ数と帯域抑圧フィルタのノッチ数が一致するときに、ノッチ数が一致しないよう形状変更を行い基準の帯域抑圧フィルタとして更新する。或いは複数有るうちの選択によるときは、これを満たすノッチ数のものを基準の帯域抑圧フィルタとして選択更新する。

以上のように、分析部１４は、入力信号（後方チャンネル音声信号Ｘｍ）の周波数スペクトルの分析処理によって、入力信号にノッチもしくはピークがみられる場合、基準とする帯域抑圧フィルタよりも、図１３に示すように抑圧する中心周波数が高い又は低いフィルタとなるように変更又は選択することや、抑圧する帯域幅がより広い又は狭いフィルタとなるように変更又は選択することや、抑圧量を変更又は選択することや、減衰傾度がより急峻な又は緩やかなフィルタとなるように変形又は選択することや、ノッチ数を変更するように変形または選択することで、基準の帯域抑圧フィルタを変更することができる。上記の例では、入力信号の特徴としてピークやノッチを用いたが、入力信号が抑圧帯域を含むか否かなど、帯域抑圧による周波数特性の変化が確認できるものであればよい。

そして、音声信号が入力されている間、周波数分析は４００ｍｓ毎など一定時間毎に所定オクターブバンド単位で分析を行うことで、動的に帯域抑圧フィルタを変更することができる。

これにより、帯域抑圧フィルタ記憶部１１にて図２（ａ）乃至（ｅ）に示すような複数種の形状種別の帯域抑圧フィルタが保持され、更にその形状種別毎に、複数の帯域種別の帯域抑圧フィルタが保持されているときに、その形状種別毎に、或る帯域種別の基準の帯域抑圧フィルタの形状が変更され、併せて当該異なる帯域幅の複数の帯域種別の帯域抑圧フィルタの形状が変更される。この場合、図９に示すように、外部インターフェースで受聴者が形状種別・帯域種別に関する選択する余地を残されている。

ただし、本分析処理によって、入力信号（入力される後方チャンネル音声信号Ｘｍ）に応じた或る帯域種別の基準の帯域抑圧フィルタを変更可能となるため、外部インターフェースで受聴者が形状種別・帯域種別に関する選択するよう構成していなくても、高精度に、多くの受聴者が後方に音像を知覚できるようになる。

そして、帯域抑圧フィルタ記憶部１１に保持される図２（ａ）乃至（ｅ）に示すような複数種の形状種別の帯域抑圧フィルタの変更処理によって、入力信号に応じて動的に更新されるようになる。

また、各実施形態の音声信号変換装置１０をコンピュータとして機能させることができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられるメモリに記憶される。コンピュータに備えられる中央演算処理装置（ＣＰＵ）などの制御で、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、メモリから読み込んで、各実施形態の音声信号変換装置１０の各構成要素の機能をコンピュータに実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現してもよい。

以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した各実施形態の例では、５ｃｈ（又は５．１ｃｈ）のマルチチャンネル音響の音声信号を入力し変換する例を説明したが、２２．２ｃｈ，１０．２ｃｈ，１１．１ｃｈ，７．１ｃｈ等のマルチチャンネル音響の音声信号を入力し後方感強調処理により後方チャンネル音声信号を側方又は斜め前方のチャンネルの音声信号へ後方感強調処理を施して変換するよう構成することができる。尚、２２．２ｃｈ等の複数階層のマルチチャンネル音響の音声信号を入力し複数階層の出力チャンネルの音声信号へ後方感強調処理により変換する際には、対応する階層内で後方感強調処理を施すように構成する。これにより、上層部後方と中層部後方の音像を分けて知覚できるようにすることができる。

また、出力チャンネルも上述した実施形態の例に限らず、種々のスピーカ配置に適用することができる。例えば、本発明におけるマルチチャンネル音響の音声信号変換装置は、特許文献１に開示されるディスプレイの周囲に配置された複数のスピーカによりマルチチャンネル音響再生を可能とする前方スピーカ装置や、マルチチャンネル音響を再生可能な複数のスピーカを棒状に配置した前方スピーカ装置に対しても、多くの受聴者が後方に音像を知覚できるようになる。

また、上述した各実施形態の音声信号変換装置では、所謂クロストークキャンセルを行うことなく、後方感強調効果を実現することができるが、クロストークキャンセルを行う再生機と組み合わせてもよい。更に、クロストークキャンセル処理は、後方感強調部の前段又は後段に設けることもできる。従って、本発明に係る音声信号変換装置は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。

本発明によれば、後方にスピーカが設置できない場合でも、後方のスピーカから再生することを想定した音声信号を、受聴者本人の頭部伝達関数（ＨＲＴＦ）を測定することなく、多くの人が後方に音像を知覚できるように再生することができるので、後方のチャンネルを含むマルチチャンネル音響の音声信号を実配置されるスピーカに応じて信号変換する用途に有用である。

１０音声信号変換装置
１１帯域抑圧フィルタ記憶部
１２後方感強調処理部
１３再生信号生成部
１４分析部
１００音声信号供給装置
２００５ｃｈのマルチチャンネル音響システム
３００５ｃｈの変形マルチチャンネル音響システム
４００３ｃｈの変形マルチチャンネル音響システム

Claims

後方のチャンネルを含むマルチチャンネル音響の音声信号に対して信号変換を行う音声信号変換装置であって、
可聴周波数帯域内の１つ又は複数の帯域を抑圧する帯域抑圧フィルタを記憶する帯域抑圧フィルタ記憶部と、
前記マルチチャンネル音響の音声信号のうち後方のチャンネルの音声信号に対し、前記帯域抑圧フィルタを適用することにより、後方感強調処理を施した音響信号を生成する後方感強調処理部と、を備え、
前記マルチチャンネル音響の音声信号のうち後方に設置されるスピーカから再生することが想定されていたチャンネルの音声信号について周波数スペクトルを分析し、この分析結果を基に前記帯域抑圧フィルタ記憶部に記憶されている帯域抑圧フィルタの形状及び抑圧帯域のいずれか一方又は双方を自動的に変更可能にする分析部を更に備えることを特徴とする、マルチチャンネル音響の音声信号変換装置。
前記後方感強調処理を施した音響信号は、受聴者の側方又は斜め前方に実配置されるスピーカから再生して後方に音像を知覚可能とすることを特徴とする、請求項１に記載のマルチチャンネル音響の音声信号変換装置。
前記マルチチャンネル音響の音声信号のうち後方以外のチャンネルの音声信号と、前記後方感強調処理を施した音声信号とを重み付け加算により合成し、実配置されるスピーカから再生するための再生信号を生成する再生信号生成部を更に備えることを特徴とする、請求項１又は２に記載のマルチチャンネル音響の音声信号変換装置。
前記再生信号生成部は、前記マルチチャンネル音響の音声信号のうち左右後方のチャンネルの音声信号に対して、左右に異なる信号レベルで前記後方感強調処理を施した音声信号と重み付け加算により合成し、側方もしくは斜め前方の実配置のスピーカから再生するための再生信号を生成することを特徴とする、請求項３に記載のマルチチャンネル音響の音声信号変換装置。
前記後方感強調処理部は、前記マルチチャンネル音響の音声信号のうち後方のチャンネルが複数ある際に、該チャンネル毎に異なる帯域抑圧フィルタを適用可能に構成されていることを特徴とする、請求項１から４のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置。
前記後方感強調処理部は、当該帯域抑圧フィルタについて実配置されるスピーカに応じて選択変更可能に構成されていることを特徴とする、請求項１から５のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置。
前記分析部は、前記分析結果を基に前記帯域抑圧フィルタ記憶部に記憶されている複数の帯域抑圧フィルタのうち前記後方感強調処理部によって使用する帯域抑圧フィルタを自動的に選択設定可能に構成されていることを特徴とする、請求項１から６のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置。
前記帯域抑圧フィルタ記憶部は、予め定めた抑圧量で略２ｋＨｚから略８ｋＨｚの間で可変帯域となる複数種の帯域抑圧フィルタを記憶していることを特徴とする、請求項１から７のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置。
前記帯域抑圧フィルタ記憶部は、当該マルチチャンネル音響の音声信号における後方のチャンネルの音声信号用の頭部伝達関数の４ｋＨｚ以上の周波数帯域の中で最も低い周波数のノッチ周波数を抑圧可能とする上側遮断周波数を持つ帯域抑圧フィルタを、前記後方感強調処理部によって使用する帯域抑圧フィルタとして定め記憶していることを特徴とする、請求項１から８のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置。
コンピュータを、請求項１から９のいずれか一項に記載のマルチチャンネル音響の音声信号変換装置として機能させるためのプログラム。