Nothing Special   »   [go: up one dir, main page]

JP2021005822A - 音声処理装置および音声処理方法 - Google Patents

音声処理装置および音声処理方法 Download PDF

Info

Publication number
JP2021005822A
JP2021005822A JP2019119515A JP2019119515A JP2021005822A JP 2021005822 A JP2021005822 A JP 2021005822A JP 2019119515 A JP2019119515 A JP 2019119515A JP 2019119515 A JP2019119515 A JP 2019119515A JP 2021005822 A JP2021005822 A JP 2021005822A
Authority
JP
Japan
Prior art keywords
head
information
direction information
unit
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019119515A
Other languages
English (en)
Other versions
JP7342451B2 (ja
Inventor
裕介 小長井
Yusuke Konagai
裕介 小長井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2019119515A priority Critical patent/JP7342451B2/ja
Priority to CN202010528601.5A priority patent/CN112148117B/zh
Priority to US16/909,195 priority patent/US11076254B2/en
Publication of JP2021005822A publication Critical patent/JP2021005822A/ja
Application granted granted Critical
Publication of JP7342451B2 publication Critical patent/JP7342451B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】ドリフトが発生しても、リスナーの頭部の向きを精度良く求める。【解決手段】音声処理装置は、リスナーの頭部の姿勢に応じた検出信号を出力するセンサーと、検出信号に基づく演算によりリスナーの頭部が向く方向を求めて、当該方向を示す方向情報を出力するセンサー信号処理部と、方向情報を平均化した平均情報に基づいて、センサー信号処理部から出力される方向情報を補正するセンサー出力補正部と、予め求められた頭部伝達関数を、補正された方向情報にしたがって修正する頭部伝達関数修正部と、再生対象の音声信号に、修正された頭部伝達関数に応じて音像定位処理を施す音像定位処理部と、を含む。【選択図】図1

Description

本開示は、音声処理装置および音声処理方法に関する。
リスナーがヘッドホンなどを装用すると、音像が頭内に定位する。音像が頭内に定位すると、リスナーに不自然な感覚を与えるので、頭部伝達関数(Head Related Transfer Function)を用いて音源を仮想的な位置に作成し、あたかも当該音源の位置から音が発せられているかのように音像を定位させる技術が知られている。ただし、単純に頭部伝達関数を用いて音像を定位させるだけでは、頭部の向く方向が変化したときに、当該方向に追従して、音源の位置が移動してしまう。
そこで、加速度センサーやジャイロセンサー(角速度センサー)などのセンサーの検出信号に基づく演算によりリスナーの頭部が向く方向を求め、頭部の向く方向が変化しても、音源の位置が移動しないように音像伝達関数を適用する技術が提案されている(例えば特許文献1参照)。
特開2010−56589号公報
しかしながら、センサーの検出信号に基づく演算により求められる方向は、あるタイミングで検出された方向を初期値とし、その後、積分演算等による相対値として算出される。したがって、センサーを用いて求められる方向には、ノイズ等による誤差が蓄積されてしまう現象(ドリフト)が発生する。このドリフトのために、センサーを用いて求められる方向が時間経過とともに不正確となるので、上記技術では、音像の位置を正確に定位させることができない、という課題がある。
実施形態に係る音声処理装置は、リスナーの頭部の姿勢に応じた検出信号を出力するセンサーと、前記検出信号に基づく演算によりリスナーの頭部が向く方向を求めて、当該方向を示す方向情報を出力するセンサー信号処理部と、前記方向情報を平均化した平均情報に基づいて、前記センサー信号処理部から出力される方向情報を補正するセンサー出力補正部と、予め求められた頭部伝達関数を、補正された方向情報にしたがって修正する頭部伝達関数修正部と、音声信号に、修正された頭部伝達関数に応じて音像定位処理を施す音像定位処理部と、を含む。
実施形態に係る音声再生装置を適用したヘッドホンの構成を示す図である。 音声再生装置におけるオフセット値算出処理を示すフローチャートである。 音声再生装置における音像定位処理を示すフローチャートである。 音声再生装置の使用例を示す図である。 リスナーの頭部が向く方向を説明するための図である。 リスナーの頭部が向く方向を説明するための図である。 音声再生装置により作成される音像の位置を示す図である。 音声再生装置により付与される音像の位置を示す図である。
以下、実施形態について図面を参照して説明する。なお、図面において各部の寸法および縮尺は実際のものと適宜に異ならせてある。また、以下に記載する実施形態は、本開示の好適な具体例である。このため、本実施形態には、技術的に種々の限定が付されている。しかし、本開示の範囲は、以下の説明において特に本開示を限定する旨の記載がない限り、これらの形態に限られるものではない。
実施形態に係る音声処理装置は、典型的には、2個のスピーカーとヘッドバンドとを組み合わせた、いわゆる耳掛け型のヘッドホンに適用される。このヘッドホンについて説明する前に、便宜的にドリフトによる影響を小さくする技術の概要について説明する。
図4は、リスナーLがヘッドホン1を装用する例を示す図である。
ヘッドホン1のヘッドバンド3には、ヘッドホンユニット40L、40Rおよびセンサー5が設けられる。センサー5は、例えば3軸のジャイロセンサーである。ヘッドホンユニット40Lおよび40Rには、後述するように信号を音響に変換するスピーカーがそれぞれ設けられる。レフトチャンネルの信号は音響に変換されてリスナーLの左耳に、ライトチャンネルの信号は音響に変換されてリスナーLの右耳に、それぞれ出力される。
外部端末200は、例えばスマートホンおよび携帯ゲーム機器などの携帯型端末であり、ヘッドホン1によって再生の対象となる音声信号を出力する。このような外部端末200から出力される音声信号が、リスナーLに装用されたヘッドホン1を介して再生される場合としては、例えば次のような場合が想定される。
まず、外部端末200に表示されたビデオやゲームなどの映像に同期する音声信号がヘッドホン1を介して再生される場合が想定される。この場合、リスナーLは、外部端末200の画面、特にメインとなるべきオブジェクト(登場人物やゲームキャラクターなど)が表示される画面の中央を注視する、と考えられる。
また、外部端末200から出力される音楽などの音声信号が、映像なしでヘッドホン1を介して再生される場合が想定される。この場合、画面の表示を伴わないので、すなわち、注視すべきオブジェクトが存在しないので、リスナーLは、音楽等の聴取に集中するために一定の方向に向き続ける、と考えられる。
つまり、いずれの場合でも、ヘッドホン1を装用したリスナーは、比較的長い期間にわたって平均的にみれば、ほぼ一定の方向に向き続ける、と考えられる。
センサー5は、ヘッドホン1の任意の位置に設けられ、姿勢変化に応じた検出信号を出力する。リスナーLの頭部が向く方向それ自体は、周知のように、当該検出信号に対して、回転変換や、座標変換、または、積分演算などの演算処理が施されることによって求められる。説明を簡易化するために、センサー5をヘッドバンド3の中央に設けた場合のリスナーLの頭部が向く方向を、図6および図7に示されるような極座標で表すことにする。
詳細には、リスナーLの頭部が向く方向の成分のうち、仰角をθ(度)とし、水平角をφ(度)として、(θ、φ)と表すことする。なお、方向Aは、リスナーLの頭部がヘッドホン1の装用時に向き続ける方向を示す。方向Aを、基準の方向(0、0)としている。仰角θの正負については、例えば方向Aに対して上向きを正(+)とし、下向きを負(−)としている。また、水平角φの正負については、例えば方向Aに対して平面視したときに反時計回りを正(+)とし、時計回りを負(−)としている。
リスナーLがヘッドホン1を装用すると、ヘッドバンド3がリスナーLの頭部とともに姿勢変化するので、センサー5から出力される検出信号を演算することで、リスナーLの頭部が向く方向を求めることができる。
あるタイミングにおいて、リスナーLの頭部が実際に向く方向を(θs、φs)とする。また、ドリフトに伴う誤差のうち、仰角の誤差をθeとし、水平角の誤差をφeとした場合、センサー5の検出信号に基づく演算により求められる方向(センサー5の検出方向)は、これらの誤差を含むことから、(θs+θe、φs+φe)と表すことができる。
したがって、あるタイミングにおいて、例えばヘッドホン1を装用するリスナーLの頭部が実際に向く方向は、検出方向(θs+θe、φs+φe)から、誤差の方向(θe、φe)を減算することで、詳細には、検出方向のうち、仰角の(θs+θe)から、誤差の方向のうちの仰角(θe)を減算するとともに、検出方向の水平角(φs+φe)から、誤差の水平角(φe)を減算することで、求めることができる。
このように本説明において、ある方向から別の方向を減算するとは、ある方向を示す成分から別の方向を示す同一成分を減算することを、各成分について実行することをいう。
また、誤差の方向(θe、φe)は、リスナーLの頭部が実際に向く方向(θs、φs)をオフセットさせるので、オフセット方向と称されることがある。
本実施形態においてオフセット方向(θe、φe)は、次のようにして求めることができる。
上述したように、ヘッドホン1を装用するリスナーLの頭部は、平均的にみて方向Aに向き続ける。したがって、頭部が方向Aに向き続けた場合に、センサー5の検出方向を比較的長い期間にわたった平均化した場合の方向は(0、0)となるはずである。
しかしながら、センサー5の検出方向には、誤差としてのオフセット方向(θe、φe)が含まれる。このオフセット方向のため、検出方向は(0+θe、0+φe)として求められる。
逆にいえば、オフセット方向(θe、φe)は、センサー5の検出方向を、比較的長い期間にわたって平均化することで求めることができる。
なお、本説明において、検出方向の平均化とは、異なる時間において求められた2以上の検出方向について、同一成分同士を平均化することをいう。
本実施形態において、検出方向が、例えば所定の周期(例えば0.5秒)毎に出力される。
そして、本実施形態では、センサー5の検出方向が比較的長い期間分、例えば15秒間分にわたって蓄積され、その期間に蓄積された検出方向が平均化されることで、オフセット方向が算出される。
さらに、本実施形態では、このような算出が当該期間毎に繰り返されて、オフセット方向が更新される、という構成となっている。
また、あるタイミングで求められた検出方向には、過去の平均的な方向から著しく離間している場合がある。この場合、当該検出方向は、何かのきっかけでリスナーLが方向Aから極端に外れた方向に向いた状態でサンプリングされた、または、突発的なノイズ等が重畳された、と考えられる。このため、当該検出方向を、次回の平均化に算入すると、当該平均化で算出されるオフセット方向の信頼性に悪影響を与える。そこで、本実施形態では、過去の平均化によって求められたオフセット方向と比較してしきい値以上離間している検出方向については、次回の平均化に用いない構成としている。
なお、オフセット方向としきい値以上離間している検出方向については、平均化において、他の検出方向よりも小さな係数を乗じて重みを小さくする、としてもよい。
このようにヘッドホン1は、あるタイミングで求められた検出方向(θs+θe、φs+φe)から、オフセット方向(θe、φe)を減算すること、リスナーLの頭部が向く方向を求め、当該方向に応じて頭部伝達関数を修正する。
そこで以下、このように頭部伝達関数を修正するヘッドホン1の具体的な構成について説明する。
図1は、ヘッドホン1の電気的な構成を示すブロック図である。ヘッドホン1は、上述したセンサー5のほかに、センサー信号処理部12、センサー出力補正部14、頭部伝達関数修正部16、AIF22、アップミックス部24、音像定位処理部26、DAC32L、32R、アンプ34L、34R、スピーカー42Lおよび42Rを含む。
AIF(Audio InterFace)22は、外部端末200から、例えば無線によりデジタルで信号を受信するインターフェイスである。AIF22が受信する信号は、外部端末200から出力されて、ヘッドホン1で再生される音声信号であり、より具体的には、ステレオで2チャンネルの音声信号である。AIF22で受信された音声信号は、アップミックス部24に供給される。
なお、音声信号とは、人間の発声によって出力される音声の信号のみならず、人間が聴取可能な音の信号、さらには、これらの信号を変調や変換等の処理を施した信号を含み、アナログであるか、デジタルであるかを問わない。
また、AIF22は、外部端末200から音声信号を有線で受信してもよいし、アナログで受信してもよい。アナログの音声信号を受信する場合、AIF22は、当該音声信号をデジタルに変換する。
アップミックス部24は、2チャンネルの音声信号を、より多チャンネルに、例えば本実施形態では、5チャンネルの音声信号に変換する。なお、5チャンネルとは、例えばフロントレフトFL、フロントセンターFC、フロントライトFR、リアレフトRLおよびリアライトRRである。
アップミックス部24によって2チャンネルを5チャンネルに変換している理由は、サラウンド(いわゆる包まれ)感や音源の分離感により頭外定位しやすくなるためである。アップミックス部24を敢えて設けず、2チャンネルで処理してもよいし、7チャンネル、9チャンネルのように、より多くのチャンネルに変換してもよい。
センサー信号処理部12は、センサー5の検出信号を取得し、リスナーLの頭部が向く方向を上述したように例えば0.5秒毎に演算して求める。すなわち、センサー信号処理部12は、センサー5の検出方向を、0.5秒毎に出力する。なお、本実施形態において、センサー信号処理部12は、実際には、検出方向を、仰角を示す情報および水平角を示す情報を組とする方向情報として出力する。
センサー出力補正部14は、判定部142と算出部144と記憶部146と減算部148とを含む。
判定部142は、センサー信号処理部12から出力される方向情報と記憶部146に記憶された平均情報との差がしきい値未満であるか否かを判定する。なお、方向情報および平均情報は、本実施形態では上述したように、リスナーLの頭部が向く方向を、仰角の情報および水平角の情報で表している。このため、方向情報および平均情報の差がしきい値未満であるとは、例えば、当該方向情報で示される方向と平均情報で示される方向とでなす角度が、しきい値に相当する角度未満であることをいう。
判定部142は、方向情報と平均情報との差がしきい値未満であれば、当該方向情報を算出部144に供給し、しきい値以上であれば、当該方向情報を算出部144に供給せず、破棄する。
算出部144は、所定期間の15秒間にわたって、判定部142から供給された方向情報を蓄積し、それら複数組の方向情報を平均化して、オフセット方向を示す平均情報として記憶部146に記憶させる。なお、方向情報の平均化とは、方向情報のうち、仰角同士の平均化および水平角同士の平均化をいう。
減算部148は、センサー信号処理部12で求められた方向情報から、記憶部146に記憶された平均情報を減算する。具体的には、減算部148は、方向情報の仰角から平均情報の仰角を減算するとともに、方向情報の水平角から平均情報の水平角を減算する。
この減算により、センサー5の検出方向に含まれるオフセット方向が除去されるので、減算部148による減算結果は、ヘッドホン1を装用するリスナーLの頭部が向く方向を、精度良く示すことになる。
頭部伝達関数修正部16は、補正された方向情報を用いて、頭部伝達関数を修正する。ここで、修正される前の頭部伝達関数は、リスナーLの頭部が方向Aを向いている場合に、音源から、当該リスナーLの頭部(外耳道入口位置または鼓膜位置)までの伝搬特性を示す。
図7は、修正前の頭部伝達関数におけるリスナーLと音源位置との関係を平面視で簡易的に示す図である。
本実施形態において作成される音源は、リスナーLから等距離、例えば3mで離間し、かつ、5チャンネルと一対一に対応して次のように位置している。詳細には、5チャンネルのうち、フロントレフトFLの音源が方向(30、0)に、フロントセンターFCの音源が方向(0、0)に、フロントライトFRの音源が方向(−30、0)に、リアレフトRLの音源が方向(115、0)に、および、リアライトRRの音源が方向(−115、0)に、それぞれ位置している。
なお、このような音源の位置からリスナーLの頭部までの頭部伝達関数は、予めリスナーLについて測定した結果を用いてもよい。また、予め多数の人物について求めておいた平均的な頭部伝達関数のうち、個人の特徴によって変化する部分を、リスナーLについて実測した特徴に基づいて変更することにより得られる特性を用いてもよい。
次に、補正された方向情報を用いて、頭部伝達関数を修正する理由について説明する。
例えばリスナーLが図7に示されるように方向Aを向いている状態から、図8に示されるように頭部を水平角で−θc(度)だけ回転させた方向Bに向けた場合、頭部伝達関数を修正しないと、音源位置が白丸印で示されるように当該頭部の向きに追従して移動する現象が発生する。この現象は、リスナーLがヘッドホン1を装用していなければ、起こり得ないので、音源位置の移動は、ヘッドホン1を装用したときの音像定位感を大きく損なうことになる。
そこで、頭部伝達関数修正部16は、リスナーLの頭部が回転しても、音源の位置が移動しないように、頭部の向きに応じて、頭部伝達関数を修正する。詳細には、リスナーLが頭部を水平角で−θc(度)回転した場合、頭部伝達関数修正部16は、各音源位置について、方向Bに対しそれぞれ+θc(度)回転させた位置に変更した頭部伝達関数に修正する。
なお、ここでは簡易化のためにリスナーLの頭部の向きが、水平方向にのみ回転した場合で説明したが、仰角方向にのみ回転する場合、水平方向および仰角方向に回転する場合も同様である。
説明を図1に戻すと、音像定位処理部26は、アップミックス部24により変換された5チャンネルの音声信号に、頭部伝達関数修正部16により修正された頭部伝達関数を適用して、ヘッドホン1の再生に適した2チャンネルのステレオ信号を生成する。
音像定位処理部26により生成された2チャンネルのステレオ信号のうち、レフトチャンネルの信号は、DAC(Digital to Analog Converter)32Lによってアナログの信号に変換される。アンプ34Lは、DAC32Lによりアナログに変換された信号を増幅する。スピーカー42Lは、ヘッドホンユニット40Lに設けられ、アンプ34Lにより増幅された信号を空気の振動、すなわち音に変換してリスナーLの左耳に出力する。
音像定位処理部26により生成された2チャンネルのステレオ信号のうち、ライトチャンネルの信号は、DAC32Rによってアナログの信号に変換され、アンプ34Rは、当該アナログ信号を増幅する。スピーカー42Rは、ヘッドホンユニット40Rに設けられ、アンプ34Rにより増幅された信号を空気の振動、すなわち音に変換してリスナーLの右耳に出力する。
次に、実施形態に係るヘッドホン1の動作について説明する。
ヘッドホン1の特徴に関わる動作は、主に次の2つの処理に分けることができる。詳細には、オフセット値算出処理および音像定位処理である。このうち、オフセット値算出処理は、リスナーLがヘッドホン1を装用している状態において、センサー信号処理部12より算出された検出方向(方向情報)を、平均化してオフセット方向(平均情報)として算出する処理である。
また、音像定位処理は、センサー信号処理部12により算出された検出方向を、オフセット方向で補正し、当該向きに応じて頭部伝達関数を修正して、音像を定位させる処理である。
本実施形態においてオフセット値算出処理および音像定位処理は、ヘッドホン1の装用期間にわたって、具体的には、図示省略された電源スイッチがオンされてから繰り返し実行される。
なお、オフセット値算出処理および音像定位処理は、AIF22によって音声信号が受信されてから開始するとしてもよいし、リスナーLの指示または操作を契機として開始してもよい。
図2は、オフセット値算出処理を示すフローチャートである。
本実施形態においてオフセット値算出処理は、ヘッドホン1の装用期間にわたって繰り返し実行される。
まず、センサー信号処理部12は、センサー5の検出信号を取得し、リスナーLの頭部が向く方向を示す方向情報を、0.5秒毎に演算して求める(ステップS31)。
次に、センサー出力補正部14における判定部142は、方向情報と記憶部146に記憶された平均情報との差がしきい値未満であるか否かを判定する(ステップS32)。
なお、電源スイッチのオン後に、はじめてステップS32が実行された場合、記憶部146には、過去の平均情報が記憶されていない。ただし、記憶部146は、平均情報の初期値として(0、0)を与えればよい。
判定部142は、方向情報と平均情報との差がしきい値未満であれば(ステップS32の判定結果が「Yes」であれば)、当該方向情報を算出部144に供給し、しきい値以上であれば(ステップS32の判定結果が「No」であれば)、処理手順がステップS31に戻る。このため、平均情報との差がしきい以上である方向情報は、算出部144に供給されない。
次に、判定部142は、センサー信号処理部12により求められた方向情報の組数が所定期間分に相当する組数となったか否かを判定する(ステップS33)。例えばセンサー信号処理部12が0.5秒毎に方向情報を求める場合、所定期間が上述したように15秒間であれば、当該所定期間分にわたった方向情報の組数は「30」となるので、判定部142は、検出方向の組数が「30」となったか否かを判定する。
方向情報の組数が所定期間の分に相当する組数未満であれば(ステップS33の判別結果が「No」であれば)、処理手順はステップS31に戻る。
一方、方向情報の組数が所定期間の分に相当する個数になれば(ステップS33の判別結果が「Yes」になれば)、算出部144は、判定部142から供給された方向情報を、供給された組数で除して当該方向情報を平均化し、平均情報として記憶部146に記憶させる(ステップS34)。なお、所定期間分にわたった組数の「30」ではなく、供給された組数で除している理由は、平均情報との差がしきい以上である方向情報は、算出部144に供給されないためである。
なお、ステップS34の後、センサー信号処理部12により求められた方向情報の組数がクリアされて(ステップ省略)、処理手順がステップS31に戻る。
このようにオフセット値算出処理によれば、ステップS31〜S34が例えば電源スイッチがオンされてから0.5秒毎に繰り返して実行される。この繰り返しによって、所定期間にわたって方向情報を平均化した平均情報(オフセット方向の仰角および水平角を示す情報)が所定期間毎に算出されて、記憶部146において更新される。
図3は、音像定位処理を示すフローチャートである。
まず、センサー信号処理部12は、センサー5の検出信号を取得し、リスナーLの頭部が向く方向を示す方向情報を、0.5秒毎に演算して求める(ステップS41)。なお、このステップS41は、オフセット値算出処理のステップS31と共通である。
次に、センサー出力補正部14における減算部148は、方向情報から平均情報を減算する(ステップS42)。すなわち、減算部148は、検出方向からオフセット方向を減算する、より詳細には、方向情報の仰角から平均情報の仰角を減算するとともに、方向情報の水平角から平均情報の水平方向を減算する。この減算結果は、センサー5の検出方向から、当該センサー5のドリフトによる誤差、すなわちオフセット方向が除去されたものであるので、リスナーLの頭部が向く方向を精度良く示すことになる。
頭部伝達関数修正部16は、減算部148による減算結果で示される方向にしたがって音源の位置を変更し、変更した音源位置に応じて頭部伝達関数を修正する(ステップS43)。
音像定位処理部26は、アップミックス部24により変換された5チャンネルの音声信号に、音像定位処理を施す(ステップS44)。詳細には、音像定位処理部26は、5チャンネルの音声信号に、頭部伝達関数修正部16により修正された頭部伝達関数を適用した上で、2チャンネルの音声信号に再変換する。
なお、ステップS44の後、処理手順がステップS41に戻る。
このように音像定位処理によれば、ステップS41〜S44が0.5秒毎に繰り返して実行されて、検出方向に応じて音像の位置が適宜変更される。
本実施形態によれば、リスナーLの頭部が向く方向が、方向Aから方向Bに変化しても、仮想的な音源の位置が変化しないので、リスナーLに与える音像定位感が損なわれることはない。さらに、本実施形態によれば、リスナーLの頭部が向く方向Bが、ドリフト等に起因する誤差を少なくして精度良く求められるので、誤差を除去しない構成と比較して、仮想的な音源位置を、より正確な位置で作成することが可能となる。
本開示は、前述の実施形態に限定されるものではなく、以下に述べる各種の変形が可能である。また、各実施形態及び各変形例を適宜組み合わせてもよい。
実施形態において、オフセット値算出処理が、ヘッドホン1の装用期間において繰り返し実行されたが、センサー5によるドリフトは、ある程度の時間(例えば30分)が経過したら飽和する場合がある。具体的には、センサー5の温度は、電源オンから上昇するが、相当程度の時間が経過すると、ある温度でほぼ一定となる。センサー5によるドリフトには温度依存性があるので、センサー5の温度がほぼ一定となれば、ドリフトによる誤差についてもほぼ一定となるためである。
したがって、オフセット値算出処理については、装用開始から当該時間経過した時点で停止させる構成としてもよい。
具体的には、センサー出力補正部14において、判定部142が方向情報と平均情報との差がしきい値未満であるか否かの判定を停止し、算出部144が、判定部142によってしきい値未満であると判定された方向情報の平均化を停止する構成としてもよい。
このような構成によって、オフセット値算出処理が停止すると、その分、消費される電力を抑えることができる。
なお、オフセット値算出処理が停止した場合、センサー信号処理部12から出力された方向情報から、記憶部146に最後に記憶された平均情報を減算すればよい。
実施形態では、オフセット方向を示す平均情報を算出するために、所定期間として15秒期間にわたってセンサー信号処理部12により求められた方向情報を平均化する構成とした。ヘッドホン1を装用して音声信号を再生する場合、リスナーLは頭部の向きを極端に変更せず、ほぼ一定方向とする、という状況を考えれば、所定期間としては、10秒以上程度であれば十分と考えられる。
再生対象となる音声の種類、種別および性質等によっては、仮想的な音源の位置を正確に修正しなくても良い場合がある。このような音声の例としては、例えば、単なる会話や、集中して聴かれることを目的としない環境音楽などが挙げられる。
したがって例えば、外部端末200に、オフセット値算出処理および/または頭部伝達関数の修正をキャンセルさせるスイッチを設けることにより、当該スイッチの操作に応じても、ヘッドホン1の動作を制御する構成としてもよい。具体的には、スイッチの操作状態を受信部(図示省略)が受信して、当該操作状態に応じて、センサー出力補正部14によるオフセット値算出処理の実行、および/または、頭部伝達関数修正部16による頭部伝達関数の修正が禁止される構成としてもよい。
また、AIF22が受信した2チャンネルの音声信号を解析した結果に基づいて、オフセット値算出処理の実行、頭部伝達関数の修正、および、音像定位処理の実行の一部または全部を禁止させる構成としてもよい。この理由は、2チャンネルの音声信号の位相および振幅が揃っている程度が大きい(しきい値以上)の場合、モノラルまたはモノラルに近く、音源の位置が重要でないと考えられためである。
センサー5の検出方向が、方向Aを示す平均的な方向に対して極端に離れている場合、頭部伝達関数を修正するための演算量が多くなったり、頭部伝達関数を正確に修正できなったり、するという可能性がある。そこで、方向情報と記憶された平均情報との差がしきい値以上である場合、頭部伝達関数を修正しない構成としてもよい。また、この場合、修正しない旨の警告をヘッドホン1または外部端末200によりリスナーLに向けて通知する構成としてもよい。
実施形態では、頭部伝達関数修正部16が、センサー5の検出方向が求められる毎に頭部伝達関数を修正する構成であったが、ヘッドホン1を装用している場合、上述したようにリスナーLは、ほぼ一定の方向Aに向き続ける。したがって、センサー5の検出方向と、当該方向A(平均的な方向)との差がしきい値未満であれば、頭部伝達関数を修正し、しきい値以上であれば、頭部伝達関数を修正しない構成としてもよい。
また、センサー5の検出方向の時間的な変化量が小さい場合には修正頻度を低くし、逆に、変化量が大きい場合には、修正頻度を高くしてもよい。
実施形態において、リスナーの頭部の向く方向について仰角および水平角として求めたが、さらに例えば首を左右に傾けたときの角度を加えて、音像定位処理を実行してもよい。
実施形態では、音声処理装置が、ヘッドホン1に適用された例を説明したが、リスナーの耳殻に挿入されるカナル型、および、リスナーの耳甲介に載せられるイントラコンカ型などのように、ヘッドバンドが存在しない型のイヤホンに適用されてもよい。
<付記>
上述した実施形態等から、例えば以下のような態様が把握される。
<態様1>
本開示の態様1に係る音声処理装置は、リスナーの頭部の姿勢に応じた検出信号を出力するセンサーと、前記検出信号に基づく演算によりリスナーの頭部が向く方向を求めて、当該方向を示す方向情報を出力するセンサー信号処理部と、前記方向情報を平均化した平均情報に基づいて、前記センサー信号処理部から出力される方向情報を補正するセンサー出力補正部と、予め求められた頭部伝達関数を、補正された方向情報にしたがって修正する頭部伝達関数修正部と、音声信号に、修正された頭部伝達関数に応じて音像定位処理を施す音像定位処理部と、を含む。
態様1によれば、ドリフトが発生しても、リスナーの頭部の向きを精度良く求めることができるので、頭部伝達関数を適切に補正して、正確な位置に音像定位させることができる。
<態様2>
態様2に係る音声処理装置は、態様1において、前記センサー出力補正部は、前記センサー信号処理部から出力された方向情報から、前記平均情報を減算して、当該方向情報を補正する。態様2によれば、方向情報から平均情報を減算する、という比較的簡易に構成によって、当該方向情報を補正することができる。
<態様3>
態様3に係る音声処理装置は、態様2において、前記センサー出力補正部は、前記センサー信号処理部から出力された方向情報を少なくとも10秒以上平均化して、前記平均情報として用いる。平均化に用いる時間が短過ぎると、頭部の向く方向の微小変化が無視できないが、10秒以上の時間であると、この微小変化を無視することができる。
<態様4>
態様4に係る音声処理装置は、態様2または3において、前記センサー出力補正部は、前記平均情報を記憶する記憶部と、前記センサー信号処理部から出力された方向情報と前記記憶部に記憶された平均情報との差がしきい値未満であるか否かを判定する判定部と、前記判定部によってしきい値未満であると判定された方向情報を平均化して、前記平均情報として前記記憶部に記憶させる算出部と、を含む。
態様4によれば、リスナーの頭部が平均的な方向から極端に外れた方向に向いた場合の方向情報や、突発的なノイズ等の影響を受けた方向情報が、平均化にあたって算入されないので、平均情報の信頼性を高めることができる。
<態様5>
態様5に係る音声処理装置は、態様4において、前記音声信号の出力開始から所定時間経過した場合、前記判定部は、前記方向情報と前記平均情報との差がしきい値未満であるか否かの判定を停止し、前記算出部は、前記判定部によってしきい値未満であると判定された方向情報の平均化を停止する。ドリフトが、ある程度の時間が経過したら飽和する場合、その時間経過後、誤差についてもほとんど変化しないので、平均情報を更新する必要がなくなる。方向情報の平均化が停止すると、その分、消費される電力を抑えることができる。
<態様6>
態様6に係る音声処理装置は、態様1乃至5において、前記センサー出力補正部による前記方向情報の補正は、有効または無効のいずれかに設定可能である。再生対象となる音声の種類、種別および性質等によっては、音像定位処理を実行しなくても良い場合がある。この場合に、補正を無効とすることで消費される電力を抑えることができる。
なお、有効または無効の指示は、スイッチ等へのリスナーの操作であってもよいし、再生対象となる音声信号の解析結果にしたがってもよい。
<態様7乃至12>
態様7乃至12に係る音声処理方法は、態様1乃至6の音声処理装置が方法で表現される。
1…ヘッドホン、3…ヘッドバンド、5…センサー、12…センサー信号処理部、14…センサー出力補正部、16…頭部伝達関数修正部、26…音像定位処理部、42L、42R…スピーカー、142…判定部、144…算出部、146…記憶部、148…減算部。

Claims (12)

  1. リスナーの頭部の姿勢に応じた検出信号を出力するセンサーと、
    前記検出信号に基づく演算によりリスナーの頭部が向く方向を求めて、当該方向を示す方向情報を出力するセンサー信号処理部と、
    前記方向情報を平均化した平均情報に基づいて、前記センサー信号処理部から出力される方向情報を補正するセンサー出力補正部と、
    予め求められた頭部伝達関数を、補正された方向情報にしたがって修正する頭部伝達関数修正部と、
    音声信号に、修正された頭部伝達関数に応じて音像定位処理を施す音像定位処理部と、
    を含む音声処理装置。
  2. 前記センサー出力補正部は、
    前記センサー信号処理部から出力された方向情報から、前記平均情報を減算して、当該方向情報を補正する
    請求項1に記載の音声処理装置。
  3. 前記センサー出力補正部は、
    前記センサー信号処理部から出力された方向情報を少なくとも10秒以上平均化して、前記平均情報として用いる
    請求項2に記載の音声処理装置。
  4. 前記センサー出力補正部は、
    前記平均情報を記憶する記憶部と、
    前記センサー信号処理部から出力された方向情報と前記記憶部に記憶された平均情報との差がしきい値未満であるか否かを判定する判定部と、
    前記判定部によってしきい値未満であると判定された方向情報を平均化して、前記平均情報として前記記憶部に記憶させる算出部と、
    を含む
    請求項2または3に記載の音声処理装置。
  5. 前記音声信号の出力開始から所定時間経過した場合、
    前記判定部は、
    前記方向情報と前記平均情報との差がしきい値未満であるか否かの判定を停止し、
    前記算出部は、
    前記判定部によってしきい値未満であると判定された方向情報の平均化を停止する
    請求項4に記載の音声処理装置。
  6. 前記センサー出力補正部による前記方向情報の補正は、有効または無効のいずれかに設定可能である
    請求項1乃至5のいずれかに記載の音声処理装置。
  7. センサーからリスナーの頭部の姿勢に応じて出力された検出信号に基づく演算により、リスナーの頭部が向く方向を求めて、当該方向を示す方向情報を出力し、
    前記方向情報を平均化した平均情報に基づいて前記方向情報を補正し、
    頭部伝達関数を補正された方向情報にしたがって修正し、
    音声信号に、修正した頭部伝達関数に応じた音像定位処理を施す
    音声処理方法。
  8. 前記方向情報から前記平均情報を減算して、前記方向情報を補正する
    請求項7に記載の音声処理方法。
  9. 前記方向情報を少なくとも10秒以上平均化して、前記平均情報として用いる
    請求項8に記載の音声処理方法。
  10. 前記方向情報と記憶部に記憶された平均情報との差がしきい値未満であるか否かを判定し、
    しきい値未満であると判定された方向情報を平均化して、前記平均情報として前記記憶部に記憶させる
    請求項8または9に記載の音声処理方法。
  11. 前記音声信号の出力開始から所定時間経過した場合、
    前記方向情報と前記平均情報との差がしきい値未満であるか否かの判定、および、しきい値未満であると判定した方向情報の平均化、を停止する
    請求項9に記載の音声処理方法。
  12. 前記方向情報の補正は、有効または無効のいずれかに設定可能である
    請求項7乃至11のいずれかに記載の音声処理方法。
JP2019119515A 2019-06-27 2019-06-27 音声処理装置および音声処理方法 Active JP7342451B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019119515A JP7342451B2 (ja) 2019-06-27 2019-06-27 音声処理装置および音声処理方法
CN202010528601.5A CN112148117B (zh) 2019-06-27 2020-06-11 声音处理装置及声音处理方法
US16/909,195 US11076254B2 (en) 2019-06-27 2020-06-23 Audio processing apparatus, audio processing system, and audio processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019119515A JP7342451B2 (ja) 2019-06-27 2019-06-27 音声処理装置および音声処理方法

Publications (2)

Publication Number Publication Date
JP2021005822A true JP2021005822A (ja) 2021-01-14
JP7342451B2 JP7342451B2 (ja) 2023-09-12

Family

ID=73891809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019119515A Active JP7342451B2 (ja) 2019-06-27 2019-06-27 音声処理装置および音声処理方法

Country Status (3)

Country Link
US (1) US11076254B2 (ja)
JP (1) JP7342451B2 (ja)
CN (1) CN112148117B (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021183221A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021183219A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021183220A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021184841A (ja) * 2017-08-25 2021-12-09 株式会社三洋物産 遊技機
JP2022060436A (ja) * 2017-11-15 2022-04-14 株式会社三洋物産 遊技機
JP2022060440A (ja) * 2017-08-25 2022-04-14 株式会社三洋物産 遊技機
JP2022060437A (ja) * 2017-11-15 2022-04-14 株式会社三洋物産 遊技機
WO2023210699A1 (ja) 2022-04-28 2023-11-02 公立大学法人秋田県立大学 音声生成装置、音声再生装置、音声生成方法、及び音声信号処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11617050B2 (en) 2018-04-04 2023-03-28 Bose Corporation Systems and methods for sound source virtualization
US11356795B2 (en) * 2020-06-17 2022-06-07 Bose Corporation Spatialized audio relative to a peripheral device
US11982738B2 (en) 2020-09-16 2024-05-14 Bose Corporation Methods and systems for determining position and orientation of a device using acoustic beacons

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01121000A (ja) * 1987-11-05 1989-05-12 Sony Corp オーディオ再生装置
JPH1098798A (ja) * 1996-09-20 1998-04-14 Murata Mfg Co Ltd 角度計測装置およびこれを搭載したヘッドマウントディスプレイ装置
JP2012518313A (ja) * 2009-02-13 2012-08-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ モバイル用途のための頭部追跡

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3624805B2 (ja) * 2000-07-21 2005-03-02 ヤマハ株式会社 音像定位装置
JP2002171460A (ja) * 2000-11-30 2002-06-14 Sony Corp 再生装置
JP3435156B2 (ja) * 2001-07-19 2003-08-11 松下電器産業株式会社 音像定位装置
US6961439B2 (en) * 2001-09-26 2005-11-01 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for producing spatialized audio signals
JP2004135023A (ja) * 2002-10-10 2004-04-30 Sony Corp 音響出力装置、音響出力システム、音響出力方法
KR20060059866A (ko) * 2003-09-08 2006-06-02 마쯔시다덴기산교 가부시키가이샤 음상 제어 장치의 설계 툴 및 음상 제어 장치
JP2008193382A (ja) * 2007-02-05 2008-08-21 Mitsubishi Electric Corp 携帯電話機、及び音声調整方法
JP4735993B2 (ja) * 2008-08-26 2011-07-27 ソニー株式会社 音声処理装置、音像定位位置調整方法、映像処理装置及び映像処理方法
JP4849121B2 (ja) * 2008-12-16 2012-01-11 ソニー株式会社 情報処理システムおよび情報処理方法
US9271103B2 (en) * 2012-03-29 2016-02-23 Intel Corporation Audio control based on orientation
JP6292040B2 (ja) * 2014-06-10 2018-03-14 富士通株式会社 音声処理装置、音源位置制御方法及び音源位置制御プログラム
GB2535990A (en) * 2015-02-26 2016-09-07 Univ Antwerpen Computer program and method of determining a personalized head-related transfer function and interaural time difference function
US9918177B2 (en) * 2015-12-29 2018-03-13 Harman International Industries, Incorporated Binaural headphone rendering with head tracking
KR102277438B1 (ko) * 2016-10-21 2021-07-14 삼성전자주식회사 단말 장치들 간의 멀티미디어 통신에 있어서, 오디오 신호를 송신하고 수신된 오디오 신호를 출력하는 방법 및 이를 수행하는 단말 장치
US11140509B2 (en) * 2019-08-27 2021-10-05 Daniel P. Anagnos Head-tracking methodology for headphones and headsets

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01121000A (ja) * 1987-11-05 1989-05-12 Sony Corp オーディオ再生装置
JPH1098798A (ja) * 1996-09-20 1998-04-14 Murata Mfg Co Ltd 角度計測装置およびこれを搭載したヘッドマウントディスプレイ装置
JP2012518313A (ja) * 2009-02-13 2012-08-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ モバイル用途のための頭部追跡

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021183221A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021183219A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021183220A (ja) * 2017-08-25 2021-12-02 株式会社三洋物産 遊技機
JP2021184841A (ja) * 2017-08-25 2021-12-09 株式会社三洋物産 遊技機
JP2022060440A (ja) * 2017-08-25 2022-04-14 株式会社三洋物産 遊技機
JP2022060436A (ja) * 2017-11-15 2022-04-14 株式会社三洋物産 遊技機
JP2022060437A (ja) * 2017-11-15 2022-04-14 株式会社三洋物産 遊技機
WO2023210699A1 (ja) 2022-04-28 2023-11-02 公立大学法人秋田県立大学 音声生成装置、音声再生装置、音声生成方法、及び音声信号処理プログラム

Also Published As

Publication number Publication date
CN112148117A (zh) 2020-12-29
CN112148117B (zh) 2024-06-25
US20200413213A1 (en) 2020-12-31
JP7342451B2 (ja) 2023-09-12
US11076254B2 (en) 2021-07-27

Similar Documents

Publication Publication Date Title
JP7342451B2 (ja) 音声処理装置および音声処理方法
US8472653B2 (en) Sound processing apparatus, sound image localized position adjustment method, video processing apparatus, and video processing method
US10362432B2 (en) Spatially ambient aware personal audio delivery device
EP2503800B1 (en) Spatially constant surround sound
EP2775738B1 (en) Orientation free handsfree device
JP4849121B2 (ja) 情報処理システムおよび情報処理方法
US20150326963A1 (en) Real-time Control Of An Acoustic Environment
WO2013105413A1 (ja) 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ
JP6691776B2 (ja) イヤホン、およびイヤホンシステム
WO2016167007A1 (ja) 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
JP2005057545A (ja) 音場制御装置及び音響システム
US11477595B2 (en) Audio processing device and audio processing method
WO2022038929A1 (ja) 情報処理方法、プログラム、及び、音響再生装置
JP2550832B2 (ja) 仮想現実感生成装置
JP3750198B2 (ja) 音像定位装置
WO2022038931A1 (ja) 情報処理方法、プログラム、及び、音響再生装置
US10638249B2 (en) Reproducing apparatus
TW201928654A (zh) 音訊信號播放裝置及對應之音訊信號處理方法
CN115460526B (zh) 一种听力模型的确定方法、电子设备及系统
US20230199425A1 (en) Audio signal output method, audio signal output device, and audio system
JP2022122038A (ja) 肩乗せ型スピーカ、音像定位方法及び音像定位プログラム
JP2024056580A (ja) 情報処理装置及びその制御方法及びプログラム
JP2024159912A (ja) 音響処理方法、音響処理装置、及び音響処理プログラム
JP2024152931A (ja) 音響処理装置、音響処理方法、及び音響処理プログラム
WO2021024747A1 (ja) 音響出力装置、及びこれを用いた音響出力システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230814

R151 Written notification of patent or utility model registration

Ref document number: 7342451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350