JP2024119834A - ボリュメトリックオーディオソースのための空間広がりモデル化 - Google Patents
ボリュメトリックオーディオソースのための空間広がりモデル化 Download PDFInfo
- Publication number
- JP2024119834A JP2024119834A JP2024082256A JP2024082256A JP2024119834A JP 2024119834 A JP2024119834 A JP 2024119834A JP 2024082256 A JP2024082256 A JP 2024082256A JP 2024082256 A JP2024082256 A JP 2024082256A JP 2024119834 A JP2024119834 A JP 2024119834A
- Authority
- JP
- Japan
- Prior art keywords
- value
- audio source
- source
- spatial extent
- spatial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000009877 rendering Methods 0.000 claims abstract description 50
- 230000001427 coherent effect Effects 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 description 19
- 230000001419 dependent effect Effects 0.000 description 13
- 230000006399 behavior Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
【課題】所与のリスニング位置におけるリスナーが受信したオーディオに著しく寄与するボリュメトリックオーディオソースの幾何学的広がりの部分を決定するための極めて低複雑度のパラメトリックモデルを提供する方法およびシステムを提供する。【解決手段】リスナーのためのオーディオソースをレンダリングするための方法800は、オーディオソースの空間広がりを示す空間広がり値を取得することs802と、オーディオソースとリスナーとの間の距離を指定する距離値を取得することs804と、距離値がしきい距離値よりも小さいかどうかを決定することs806と、距離値がしきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、リスナーに対してオーディオソースをレンダリングすることs808と、含む。【選択図】図8
Description
ボリュメトリック(volumetric)オーディオソースのための空間広がり(spatial extent)モデル化のための方法およびシステムに関する実施形態が開示される。
XR(仮想現実、拡張現実、または複合現実)シーンは、そのシーンの空間内に空間的に分布された多くのオーディオソースを含み得る。これらのオーディオソースの多くは、空間における特定の明確に規定されたロケーションを有し、点状のソースと見なされ得る。これらのオーディオソースは、一般に、リスナーに対して点状のオーディオオブジェクトとしてレンダリングされる。
しかしながら、XRシーンはまた、しばしば、点状の性質というよりむしろボリュメトリック性質のものであるオーディオソースを含んでおり、これは、オーディオソースが1つまたは複数の空間次元におけるある空間広がりを有することを意味する。
いくつかの場合には、そのようなボリュメトリックオーディオソースは、シーン中の単一の物理的エンティティ(たとえば、飛行機、ピアノ、列車、工場における輸送パイプなど)に対応し得る。これらのボリュメトリックオーディオソースのうちのいくつかは、単一コヒーレント(coherent)オーディオソースとしてオーディオを放射し得、他のものは、より、空間的に広げられた拡散(diffuse)オーディオソースのように、オーディオを放射し得る。
他の場合には、単一の物理的エンティティに対応するのではなく、ボリュメトリックオーディオソースは、ともに複合ボリュメトリック(compound volumetric)オーディオソースと見なされ得る多数の(おそらく、さらに連続体の)非依存オーディオソースを含んでいる、シーン中のエリアを表現し得る。このタイプのボリュメトリックオーディオソースの例は、海辺の海岸および混んでいるハイウェイである。混んでいるハイウェイの例では、各車は、原則として非依存オーディオソースであるが、多くの車がその上にあるハイウェイは、複合ボリュメトリックオーディオソースと見なされ得る。
上記で説明された海岸およびハイウェイの例のように、多くの場合、ボリュメトリックオーディオソースの空間広がりは、その空間次元のうちの1つまたは複数において極めて大きくなり得、いくつかの場合には、これは、(たとえば、リスナーからボリュメトリックオーディオソースまでの距離に関して)事実上無限に大きくさえなり得る。
一般に、XRシーンについてのシーン説明データは、ボリュメトリックオーディオソースの広がりを、ソースの物理的ジオメトリに関して指定する(たとえば、1つまたは複数の次元におけるソースの物理的サイズ、またはソースの物理的ジオメトリを説明する幾何学的メッシュ構造)。ソースのこの指定された物理的ジオメトリは、一般に、XRシーン中のいくつかの対応する物理的(また、しばしば、視覚的)エンティティ(たとえば、車、ピアノなど)の物理的ジオメトリに直接関係する。
しかしながら、上記で説明されたように、ボリュメトリックオーディオソースは、上記で説明された海岸および混んでいるハイウェイのように、1つまたは複数の次元において物理的に極めて大きくなり得る。そのような場合、その広がりデータ中で一般に指定されるようなボリュメトリックオーディオソースの物理的サイズまたはジオメトリは、しばしば、リスナーに対してオーディオソースをレンダリングするために直接使用されるのにあまり適していない。
詳細には、多くの場合、ボリュメトリックオーディオソースの幾何学的広がりの限られた部分のみが、所与のリスニング位置におけるリスナーによって受信されたオーディオエネルギーに顕著に寄与する。これは、幾何学的広がりの外側部分が、リスナーから非常に遠く離れているので、距離および中間減衰により、かなりのオーディオエネルギーがこれらの外側部分からリスナーに達しない、極めて大きい(特に「無限に」大きい)ボリュメトリックソースの場合、当てはまる。
それは、リスナーに近いソースの部分からリスナーに達するオーディオエネルギーが、本質的に、リスナーからより遠くに離れている部分から来るオーディオエネルギーよりまさるような、中程度のサイズのボリュメトリックオーディオソースの近くにリスナーが来る場合にも、当てはまり得る。したがって、所与のボリュメトリックオーディオソースの「音響的に関連のある(acoustically relevant)」部分は、ソースに対するリスナーの位置に依存し得る。
したがって、大きいボリュメトリックオーディオソースの場合、所与のリスニング位置におけるリスナーに対してオーディオソースがどのくらい広くまたは高くレンダリングされるべきであるかについて、直接測度として、指定された幾何学的広がりを単に使用することは、しばしば、あまり適切でないかまたは好都合でない。実際、そうすることは様々な問題を生じ得る。
オーディオレンダリングのために直接、ボリュメトリックオーディオソースの指定された幾何学的広がりを使用することの1つの問題は、ソースの得られた主観的空間広がり(たとえば、リスナーによって知覚されたソースのサイズ)が、不自然になり得る(たとえば、不自然に広い、すなわち、空間広がりが、実生活で知覚されるよりも広く知覚され得る)ことである。この問題は、たとえば、ボリュメトリックオーディオソースのオーディオが、そのソースの指定された幾何学的広がりのエッジに位置する仮想ラウドスピーカーを使用してリスナーに対してレンダリングされる、レンダリングシナリオにおいて生じ得る。上記で説明された、これらの仮想ラウドスピーカーは、多くの場合、あまりに広く離間される。
ソースの幾何学的な広がりの代わりに、ソースの意図された知覚される空間広がりを指定することも、意図された知覚される空間広がりが、ある特定のリスニング位置のみについて有効であり、(6自由度XR使用事例において必要とされるであろう)他のリスニング位置についての意図された知覚される空間広がりを導出することは、簡単でないかまたは可能でさえないことがあるので、問題になろう。
さらに、ボリュメトリックオーディオソースによって放射されたオーディオを正確にレンダリングするために高度な物理的モデル化技法が使用されるレンダリングシナリオでは、レンダリングのために必要とされる算出複雑さは、一般に、ソースの物理的サイズが増加するにつれて急速に増大する。大きいボリュメトリックソース(たとえば、上記で説明された海岸および混んでいるハイウェイ、および通過する列車)の場合、リスナーに対してソースをレンダリングするために直接、ソースの指定された幾何学的広がりを使用することは、特にリアルタイム対話型XR適用例では、過大な算出労力を容易に必要とし得る。さらに、この算出労力のかなりの部分は、その部分が、特定のリスナー位置におけるオーディオにさえ著しくは寄与しないボリュメトリックソースの部分によって放射されるオーディオをレンダリングするために使用されるので、不必要に費やされることさえある。
したがって、知覚的に適切なおよび算出効率の良いやり方で大きいボリュメトリックオーディオソースをレンダリングすることが可能であるために、そのソースの指定された幾何学的広がりと、場合によっては他のプロパティとに基づいて、所与のリスニング位置におけるボリュメトリックオーディオソースの音響的に関連のある空間広がりをモデル化するための方法を有することは、極めて有益であろう。モデルが既存のリアルタイムレンダラアーキテクチャへの軽量アドオンとして実装され得るように、モデルが極めて簡単なものであれば、特に望ましいであろう。
本開示の実施形態は、ボリュメトリックオーディオソースの有効空間広がり(effective spatial extent)、すなわち、所与のリスニング位置におけるリスナーによって受信されたオーディオに著しく寄与するボリュメトリックオーディオソースの幾何学的広がりの部分、を決定するための極めて低複雑度のパラメトリックモデルを提供するための方法およびシステムを対象とする。
モデルのパラメータは、(i)1つまたは複数の次元におけるボリュメトリックオーディオソースの幾何学的広がりのサイズを示すサイズパラメータおよび/または(ii)リスナーからボリュメトリックオーディオソースまでの距離を示す距離パラメータを含む。
モデルのパラメータは、(i)ボリュメトリックオーディオソースのコヒーレンスプロパティを示すパラメータ(たとえば、コヒーレント、拡散、または中間の何か)および/または(ii)周波数パラメータ((部分的)コヒーレントソースの場合)をも含み得る。
決定された有効空間広がりは、リスナーに対してボリュメトリックオーディオソースをレンダリングする際に使用され得る。たとえば、決定された有効空間広がりは、(i)所与のリスニング位置におけるボリュメトリックオーディオソースのためのターゲット聴覚レンダリングサイズを決定すること、および/または(ii)レンダリングのために幾何学的空間広がりの他の音響的に関連のない部分を放棄しながら、リスナーに対してボリュメトリックソースのオーディオをレンダリングするために、ボリュメトリックオーディオソースの幾何学的広がりの音響的に関連のあるサブ部分のみを選択することを行うために使用され得る。
一態様では、リスナーのためのオーディオソースをレンダリングするための方法が提供される。本方法は、オーディオソースの空間広がりを示す空間広がり値を取得することと、(「観測距離」としても知られる)オーディオソースとリスナーとの間の距離を指定する距離値を取得することとを含む。本方法は、距離値がしきい距離値よりも小さいかどうかを決定することをも含む。本方法は、距離値がしきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、リスナーに対してオーディオソースをレンダリングすることをさらに含む。
別の態様では、コンピュータプログラムが提供される。コンピュータプログラムは、処理回路によって実行されたとき、処理回路に、本明細書で開示される実施形態のいずれか1つに記載の方法を実施させる命令を備える。別の態様では、コンピュータプログラムを含んでいるキャリアが提供され、キャリアは、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体のうちの1つである。
別の態様では、本明細書で開示される実施形態のいずれか1つに記載の方法を実施するように適応された装置が提供される。一実施形態では、本装置は、処理回路とメモリとを備え、メモリは、処理回路によって実行可能な命令を含んでおり、それにより、本装置は、本明細書で開示される実施形態のいずれか1つに記載の方法を実施するように適応される。
利点
大きいボリュメトリックオーディオソースの場合、本開示の実施形態による有効空間広がりを使用することは、ソースの幾何学的広がりを直接使用するよりも、ソースのより自然なおよび現実的な空間レンダリングを可能にする。
また、特定のリスニング位置についてのみ有効である、ボリュメトリックオーディオソースの意図された知覚される空間広がりを直接指定することと比較して、本開示の実施形態によるモデル化された有効空間広がりは、任意のリスニング位置において有効である。
さらに、いくつかのレンダリングシナリオでは、本開示の実施形態による方法およびシステムは、所与のリスニング位置における音響的に関連のある幾何学的広がりの部分のみがレンダリングの際に考慮されるので、大きいボリュメトリックオーディオソースのオーディオをレンダリングする際により良い算出効率を可能にする。
また、本開示の実施形態では、有効空間広がりを決定するためのパラメトリックモデルが、極めて単純であり、既存のレンダーアーキテクチャへの軽量アドオンとして容易に実装され得る。
本明細書に組み込まれ、明細書の一部をなす添付の図面は、様々な実施形態を示している。
有効空間広がり:定性的モデル
上記で説明されたように、所与のリスニング位置におけるリスナーのためのボリュメトリックオーディオソースの音響的に関連のある、または有効な、空間広がりを、そのソースの物理的特性のうちのいくつかから推測することができるモデルを見つけることが望ましい。
そのようなモデルを開発するための妥当な一般的な開始時の仮定は、特定のリスニング位置におけるソースの知覚されたラウドネスに著しくは寄与しないボリュメトリックオーディオソースの部分(それらの部分から来るオーディオがレンダリングに含まれるか否かにかかわらず、リスナーは、ラウドネスのいかなる差をも知覚することが可能でないという意味において)が、その同じリスニング位置における(ソースの知覚された空間広がりを含む)ソースの知覚された空間プロパティにも著しくは寄与しないことになることである。
モデルを構築するための開始点は、単一の次元においてサイズLの可変幾何学的空間広がりを有する1次元ボリュメトリックオーディオソース(すなわち、線ソース)(すなわち、可変長さLをもつ音響線ソース)の単純な場合である。この線ソースの場合、線ソースの中間点に対して垂直距離Dに位置する観測点Oにおける音圧レベル(SPL)の挙動は、ソース長さLの関数として評価され得る(図1参照)。
線ソースの長さLが極めて小さい場合、線ソースは本質的に点ソースである。長さLが、長さに沿って一定のソース強度密度を伴って、線ソースの両側において着実に増加する(たとえば、長さ2Lにおいて、ソースは、長さLにおいてよりも2倍の量の音響エネルギーを放射する)につれて、観測点OにおけるSPLも増加することが予想される。
しかしながら、ソース長さLが増加するにつれて、観測点におけるSPLへのソースの外側エッジからの寄与は、これらの外側部分から観測点までの増加する距離によりますます小さくなる。したがって、長さLを増加させることの関数としてSPLが増加するレートは、減少し得る。ある時点において、ソースが極めて長くなったとき、SPLが増加するレートは、SPLがもはやソース長さのさらなる増加とともに増加しなくなるように、有意でなくなり得る。言い換えれば、SPLは、線ソースのある長さ(Leff)を越えると、飽和することになる。
一定のソース強度密度を有する無限に長い線ソースの場合、異なる観測点Oにおける、無限に長い線ソースのサイズLeffの異なるセグメントは、ソースの音響的にかなりの部分になり得る。言い換えれば、リスナーが無限に長い線ソースに対して平行な線に沿って移動するにつれて、リスナーは事実上、リスナーとともに移動するサイズLeffの空間窓を通してソースを知覚する。
本開示のいくつかの実施形態では、1次元ボリュメトリックオーディオソース(すなわち、線ソース)の有効空間広がりは、最も小さいソースセグメントのサイズとして規定され、そのセグメントによる所与のリスニング位置における音レベルは、完全なソースの音レベルを下回るしきい音レベル差値(threshold sound level difference value)よりも小さい。言い換えれば、有効空間広がりのエッジを越える線ソースの部分を追加することは、リスニング位置における音レベルに、しきい音レベル差値よりも多くを追加しない。
有効空間広がりを決定する際に使用されるしきい音レベル差値は、異なるやり方で選定され得るが、相対的に(たとえば、完全なソースによる線形音圧の、ある割合として、または、完全なソースのSPLを下回る、ある数のデシベルとして)最も好都合に規定され得る。
目的は、ソースの物理的サイズを、対応する知覚された聴覚サイズにリンクすることであるので、しきい音レベル差値がこの知覚された聴覚サイズと関係を有するように、しきい音レベル差値を選択することが望ましい。詳細には、得られた有効空間広がりが、(知覚測度である)ラウドネスが完全なソースのラウドネスと区別不可能である最も小さいソースセグメントのサイズに対応するように、しきい音レベル差値を選択することが望ましいことがある。このコンテキストでは、したがって、しきい音レベル差値をセットするための知覚的に関連のある基準は、ラウドネスについての丁度可知差(JND:just-noticeable-difference)であり、これは音響知覚文献から約1dB SPLであることが知られている。
有効空間広がり:定量的モデル
ボリュメトリックオーディオソースは、点ソースの高密度分布として、物理的にモデル化され得る。1次元ボリュメトリックオーディオソースの場合、総圧力応答(total pressure response)Plineが、次のように表され得る。
ここで、Nは、1次元ボリュメトリックオーディオソースをモデル化するために使用される点ソースの総数であり、Ai(ω)は、ラジアル周波数ωにおけるi番目の点ソースの複素振幅であり、kは、波数ω/cであり、cは空気中の音速であり、riは、i番目の点ソースから観測点
までの距離である。
までの距離である。
次いで、1次元ボリュメトリックソースの音圧レベル(SPL)は、次のように表され得る。
このようにして連続ボリュメトリックソースをモデル化するとき、当該の全周波数範囲(たとえば、0~20kHz)にわたる正確な結果を取得するために、個々の点ソース間の十分に小さい離間が使用されるべきである。
(そのすべての点が、同じ音響信号をコヒーレントに放射する)コヒーレント1次元ボリュメトリックオーディオソースと、(そのすべての点が、非依存フル無相関信号を放射する)拡散1次元ボリュメトリックソースとを含む、様々なタイプの1次元ボリュメトリックオーディオソースがある。これらの2つの極端なタイプの1次元ボリュメトリックオーディオソースは、以下でより詳細に説明されるように、様々な態様で著しく別様に挙動する。
拡散1次元ボリュメトリックオーディオソース
拡散ボリュメトリックオーディオソースは、すべて周波数非依存SPL対距離挙動(frequency-independent SPL-vs-distance behavior)を有する非依存点ソースの高密度分布と見なされ得るので、拡散ボリュメトリックオーディオソースの挙動も周波数非依存である。したがって、以下の結果は、任意の個々の周波数についてならびに広帯域について有効である。
図2は、0.1m、1m、10m、および100mの観測距離Dについて、線ソース長さLの関数として、フルインコヒーレントまたは拡散1次元ボリュメトリックオーディオソースの総SPLについてのシミュレーション結果を示す。
4つの曲線すべての1つの共通特性は、それらが2つの別個の領域を有することであり、すなわち、小さい線ソース長さにおいて(または大きい観測距離において)、SPLは、線ソース長さLの倍増ごとに3dBの一定のレートで増加し(水平軸上の対数スケールに留意されたい)、長い線ソース長さにおいて(または、小さい観測距離において)、SPLは、Lの関数として一定になる。
小さい線ソース長さにおける(または、長い観測距離における)長さの倍増ごとの3dB SPL増加は、総圧力についての表現(式1)において、総圧力を決定する際に式1中の複素振幅Aiのみが関連のあるものであるように、個々の点ソースから観測点までの距離riが本質的に等しいということから、説明され得る。個々の点ソースについてのソースパワーが等しいと仮定される場合、式1および2から、以下の関係が成り立つことが容易に示され得る。
式3は、点ソースの数Nを倍増したときのSPLの3dB増加を暗示する。個々の点ソース間の離間が均等であることがさらに仮定された場合、式3は、線ソース長さLの倍増について3dB SPL増加を暗示する。
大きい線ソース長さにおける(または、小さい観測距離における)定数値までのSPLの飽和は、上記で説明された定性的モデルに一致する。上記で説明されたように、SPLの飽和は、長さが増加するにつれて、外側エッジにおける新たに追加された点ソースの寄与が、ますます有意でなくなり、最終的に完全に有意でなくなるということから、説明され得る。言い換えれば、拡散1次元ボリュメトリックオーディオソースが、ある線ソース長さに達すると、長さをさらに増加することは、SPLのさらなる増加につながらない。
異なる観測距離についての曲線を比較することは、2つの領域間、すなわち、SPLが増加する領域とSPLが実質的に定数値において維持される領域との間、の遷移が発生する線ソース長さLは、観測距離に依存し、遷移長さが、より大きい観測距離の場合、より大きくなることを示す。
極めて長い拡散1次元ボリュメトリックオーディオソースの有効空間広がりは、SPLが、極めて大きいソース長さにおいて観測された飽和SPLを下回るあるしきい音レベル差値である、線ソース長さLを見つけることによって、図2に示されている曲線から推定され得る。SPLが飽和する線ソース長さは、観測距離Dに比例することが見つけられる。
ラウドネス差についてのJNDが、しきい音レベル差値をセットするための基準として選定される場合、しきい音レベル差値は、約1dB SPLに等しい。その場合、SPLが飽和する(すなわち、この特定の場合、-1dB点)線ソース長さは、観測距離Dの約6倍の値を有することが見つけられる。
したがって、6Dまたはそれよりも大きい長さを有するソースの有効空間広がりは、6Dに等しい(すなわち、それは、観測距離Dに比例する)。等価的に、L/6よりも小さい観測距離において、空間広がりは6Dに等しい。
6Dよりも小さい線ソース長さまたは等価的にL/6よりも大きい観測距離の場合、有効空間広がりは、単に線ソース長さLに等しい(すなわち、1次元ボリュメトリックソースのあらゆる部分が、観測点において受信された音に著しく寄与する)。この特徴付けは、1次元拡散ボリュメトリックソースのように挙動するオーディオソースのより効率的なおよび現実的なレンダリングを可能にする。
有効空間広がりは、(i)長さに関してまたは(ii)角度スパン(「開口角度(opening angle)」)に関してのいずれかで表され得る。有効空間広がりが長さに関して表される場合、飽和長さよりも大きい線ソース長さについての有効空間広がりは、観測距離Dに比例する(たとえば、有効空間広がりは、いくつかのオーディオソースについて6Dに等しい)。対照的に、有効空間広がりが角度スパン(「開口角度(OA)」)に関して表される場合、有効空間広がりは定数値を有する(すなわち、観測距離に非依存)。開口角度(OA)についての一般的な表現は、OA=2*atan((0.5*長さの単位での有効空間広がり)/D)であり、ここで、atanは逆正接関数になる。拡散ソースの場合、長さの単位での有効空間広がりは6Dであり、したがって、OAについての表現は、OA=2*atan((0.5*6D)/D)=2*atan(3)=143度である。したがって、レンダラがOAおよびDを取得した場合、レンダラは長さの単位で有効空間広がりを計算することができる。
図2に示されている曲線の別の共通の特性は、SPLが、長さの倍増ごとに3dB増加する領域において、SPLは、観測距離の10倍の増加について20dBだけ減少する、または等価的に距離の倍増ごとに6dBだけ減少することである。これは、この領域において、1次元拡散ボリュメトリックオーディオソースが、SPLに関して点ソースのように挙動すること(すなわち、p∝1/r)を意味する。対照的に、SPLが線ソース長さの関数として一定である領域において、SPLは、距離の10倍の各増加について10dBのみだけ減少する、または距離の倍増ごとに3dBだけ減少する。これは、この領域において、1次元拡散ボリュメトリックソースが、理論的な線ソースのように挙動すること
を意味する。有限長さ線ソースのこの距離依存SPL挙動は、2019年12月19日に出願された、米国仮特許出願第62/950,272号において説明されている。
を意味する。有限長さ線ソースのこの距離依存SPL挙動は、2019年12月19日に出願された、米国仮特許出願第62/950,272号において説明されている。
コヒーレント1次元ボリュメトリックオーディオソース
フルコヒーレント均等1次元ボリュメトリックオーディオソースの場合、式1中のすべての振幅Aiが同等である(すなわち、Ai=A∀i)。ボリュメトリックオーディオソースの個々の点ソースの位相項
の周波数依存性およびコヒーレンシにより、ボリュメトリックオーディオソースの総圧力応答も周波数依存であることになり、したがって、個々の周波数についてのならびに広帯域についての有効空間広がりを分析することが必要である。
の周波数依存性およびコヒーレンシにより、ボリュメトリックオーディオソースの総圧力応答も周波数依存であることになり、したがって、個々の周波数についてのならびに広帯域についての有効空間広がりを分析することが必要である。
図3は、様々な周波数および1つの観測距離について、線ソース長さの関数としてSPL応答を示す。拡散1次元ボリュメトリックオーディオソースのように、コヒーレント1次元ボリュメトリックオーディオソースの場合、個々の周波数の各々について、ある線ソース長さを越えるとSPLの予想された飽和があるが、図2に示されている曲線とは異なり、今度は、飽和長さは周波数に依存する。
小さい線ソース長さにおけるSPLは、長さの倍増ごとに、拡散1次元ボリュメトリックオーディオソースについて図2に示されている3dBの代わりに、6dBのレートで増加する。拡散ソースの場合と同じ推論に従うと、小さい線ソース長さ(または、大きい観測距離)について、個々の点ソースから観測点までの距離riは、本質的に等しく、ボリュメトリックオーディオソースの個々の点ソースについての圧力Piは、すべて共通圧力Pと同等であり、したがって、(前述のように個々の点ソースについて、等しいパワーおよび等しい離間の仮定では)式1は、下記に低減する。
これは以下につながる。
これは、実際に、長さLの倍増ごとの観測された6dB増加に一致する。
多くの他の観測距離についての対応するシミュレーション結果の分析に基づいて、拡散ソースについて行われたものと同じ、有効空間広がりを決定するためのやり方を使用して、小さい観測距離(または大きい線ソース長さ)について、有効空間広がりは、周波数依存であり、
(fは周波数であり、c1は定数である)に等しいものとして表され得るが、有効空間広がりは、大きい観測距離(または、小さい線ソース長さ)について、この場合も、単に線ソース長さLに等しい。
(fは周波数であり、c1は定数である)に等しいものとして表され得るが、有効空間広がりは、大きい観測距離(または、小さい線ソース長さ)について、この場合も、単に線ソース長さLに等しい。
2つの領域間の遷移距離がL2fに比例していることが見つけられ、比例係数は
に等しい。前述のように、飽和長さを見つけるためのしきい音レベル差値としてラウドネス差についてのJND(1dB SPL)を使用する特定の選定の場合、c1が約18.4に等しいことが経験的に見つけられた。
に等しい。前述のように、飽和長さを見つけるためのしきい音レベル差値としてラウドネス差についてのJND(1dB SPL)を使用する特定の選定の場合、c1が約18.4に等しいことが経験的に見つけられた。
上記で示されたように、コヒーレント1次元ボリュメトリックオーディオソースの挙動は、周波数依存であり、また一般に、周波数依存のやり方でレンダリングされることになる。コヒーレント1次元ボリュメトリックオーディオソースの広帯域挙動を観測するために、シミュレーションが、20Hzから20kHzまでの128個の一様に離間した周波数について行われ得、すべての個々の周波数についての結果が、広帯域の結果を取得するために合計され、白色ソーススペクトル仮定を暗示し得る。
図4は、いくつかの観測距離Dについて、線ソース長さLの関数として広帯域SPLを示す。図4を(周波数非依存拡散ソースのSPLを示す)図2と比較すると、コヒーレントソースの全体的な広帯域挙動と拡散ソースの全体的な広帯域挙動とは、特に極めて小さい線ソース長さおよび極めて大きい線ソース長さについて、かなり類似している。主要な差は、(1)コヒーレントソースの遷移領域が、はるかに広いこと、および(2)コヒーレントソースの遷移領域内にいくらかのリップル(ripple)があることである。さらに、大きい観測距離において、コヒーレントソースについてのSPLは、拡散ソースについての線ソース長さの倍増ごとの3dBの代わりに、(個々の周波数について観測されるように)線ソース長さの倍増ごとに6dBだけ増加する。
小さい観測距離(または大きい線ソース長さ)について、広帯域有効空間広がりは、観測距離Dの平方根に比例し、すなわち
であるが、広帯域有効空間広がりは、大きい観測距離(または、小さいソース長さ)について、この場合も、単に線ソース長さLに等しい。2つの領域間の遷移距離は、線ソース長さLの2乗に比例し、比例係数は
に等しい。飽和長さを見つけるためのしきい音レベル差値としてラウドネス差についてのJND(1dB SPL)を使用する特定の選定の場合、c2が3.5にほぼ等しいことが見つけられた。
であるが、広帯域有効空間広がりは、大きい観測距離(または、小さいソース長さ)について、この場合も、単に線ソース長さLに等しい。2つの領域間の遷移距離は、線ソース長さLの2乗に比例し、比例係数は
に等しい。飽和長さを見つけるためのしきい音レベル差値としてラウドネス差についてのJND(1dB SPL)を使用する特定の選定の場合、c2が3.5にほぼ等しいことが見つけられた。
シミュレーションからの結果の概要
1次元ボリュメトリックオーディオソースの有効空間広がりは、ある遷移距離(別名、しきい距離値)よりも大きい観測距離について(またはある遷移長さよりも小さい線ソース長さについて)、線ソース長さLに等しい。
遷移距離よりも小さい観測距離について(または、遷移長さよりも大きい線ソース長さについて)、有効空間広がりは、拡散1次元ボリュメトリックオーディオソースの場合、観測距離Dに比例するが、有効空間広がりは、コヒーレント1次元ボリュメトリックオーディオソースの場合、Dの平方根に比例する。
遷移距離は、拡散1次元ボリュメトリックオーディオソースの場合、ソース長さLに比例するが、コヒーレント1次元ボリュメトリックオーディオソースの場合、遷移距離はLの2乗に比例する。
有効空間広がりのためのパラメトリックモデル
上記で説明されたシミュレーション結果は、観測距離Dの関数としての、長さLの1次元ボリュメトリックオーディオソースの有効空間広がりLeffのための以下のパラメトリックモデルにつながる。
拡散1次元ボリュメトリックソース:
コヒーレント1次元ボリュメトリックソース、周波数依存:
コヒーレント1次元ボリュメトリックソース、広帯域:
1dB(ラウドネスについてのJND)のしきい音レベル差値の特定の選定の場合、定数は、以下の近似値、すなわち、c0≒6、c1≒18.4、およびc2≒3.5を有することが経験的に見つけられた。
数値例
以下は、有効空間広がりのためのパラメトリックモデルが、1次元ボリュメトリックオーディオソースのレンダリングにどのように影響を及ぼすかを示す例である。
例1:
「無限に」長い拡散ソース(たとえば、海辺における海岸線)の場合、有効空間広がりは、任意の実際に関連のある観測距離におけるリスナーにとって「c0D」範囲にあることになる。したがって、有効空間広がりは、1mの観測距離において6m(143度)、10mの観測距離において60m(143度)、および100mの観測距離において600m(143度)であることになる。
例2:
長さL=10mをもつ拡散1次元ボリュメトリックソースの場合、有効空間広がりは、0.1mの観測距離において0.6m(143度)、1mの観測距離において6m(143度)、1.7mよりも大きい任意の観測距離において10m(これは、10m観測距離において53度、および100m観測距離において6度を生じる)であることになる。
例3:
長さL=10mをもつコヒーレント1次元ボリュメトリックソースの場合、広帯域有効空間広がりは、0.1mの観測距離において1.1m(160度)、1mの観測距離において3.5m(121度)、および8.2mよりも大きい任意の観測距離において10mであることになる。
例4:
長さL=10mをもつコヒーレント1次元ボリュメトリックソースの場合、有効空間広がりは以下の通りである。
f=100Hzにおいて:1mの観測距離において1.8m(85度)、および30mよりも大きい任意の観測距離において10m、
f=1000Hzにおいて:1mの観測距離において0.6m(32度)、および300mよりも大きい任意の観測距離において10m。
ボリュメトリックオーディオソースをレンダリングする際に有効空間広がりを利用すること
レンダラが、様々なやり方で、導出された有効空間広がりを使用し得る。
ターゲット空間広がりをセットする:
導出された有効空間広がりは、特定のリスニング位置におけるリスナーに対して長いボリュメトリックオーディオソースをレンダリングするためのターゲット空間広がりをセットするために使用され得る。これは、単に、受信された幾何学的広がりデータを使用することと比較して、より適切なレンダリングされたソース幅をリスナーに配信することになる。たとえば、1つのシナリオでは、導出された有効空間広がりは、特定のリスニング位置におけるリスナーに対してソースをレンダリングするために使用される仮想ステレオラウドスピーカーの最適位置を決定するために使用され得る。別のシナリオでは、導出された有効空間広がりは、特定のリスニング位置におけるリスナーに対してボリュメトリックオーディオソースをレンダリングするために使用される空間拡幅(spatial widening)アルゴリズムにおけるターゲット空間幅をセットするために使用され得る。
空間窓を決定する:
極めて長いボリュメトリックオーディオソースの場合、導出された有効空間広がりは、ソースに沿って、ソースから離れて、および/またはソースに向かって移動しているリスナーに対して時間的にどの瞬間にソースのどの部分をレンダリングすべきか決定するために使用され得る。これは、リスナーとともにスライドしている空間窓を適用するようなものであり、(リスナーの位置の変化に従って動的に更新される)導出された有効空間広がりが、空間窓の幅を決定する。
算出能力を節約する:
何らかの形態の物理的モデル化を使用して、ボリュメトリックオーディオソースからのオーディオがレンダリングされる使用事例では、特定のリスニング位置におけるリスナーに対してレンダリングされる必要があるソースの部分を限定するために、導出された有効空間広がりを使用することによって、算出能力が節約され得る。
2Dおよび3Dボリュメトリックオーディオソースへの拡張
上記で説明された1次元定量的パラメトリックモデルは、少なくとも、わずか1つの空間次元においてかなりの空間広がりを有するボリュメトリックオーディオソースの場合は、有効であり、これは、他の2つの次元における広がりが、これらの次元における広がりが主要な(長い)次元における有効空間広がりに著しく影響を及ぼさないように、観測距離に対して十分に小さい場合を意味する。特に、これは、特定の観測距離において、ソースが、他の2つの次元において本質的に点ソースのように挙動する場合、当てはまることになる。
上記で識別された仮特許出願は、ソース長さと観測距離との関数として、1次元オーディオソースが、点ソースのようにいつ挙動するかを決定するためのモデルを説明する。詳細には、この文書は、拡散1次元オーディオソースが、ソースの長さを超える観測距離において点ソースのように挙動することを説明する。
したがって、拡散2Dボリュメトリックオーディオソースが、2つの次元、次元1および次元2における2つのサイズを有し、ここで、次元1におけるサイズが次元2におけるサイズよりも長い、場合、式6の1次元定量的有効空間広がりモデルは、次元2におけるサイズが観測距離Dをよりも小さい場合(または、観測距離Dが、次元2におけるサイズであるL2よりも大きい場合)、この2Dソースの次元1に適用され得る。
同様の基準が、コヒーレント2Dボリュメトリックソースについての1次元式7および8の有効性のために取得され得る。その場合、1次元モデルは、次元2におけるサイズが(1)式7の周波数依存モデルについて
または(2)式8の広帯域モデルについて
よりも小さい場合(または、等価的に、観測距離が、周波数依存モデルについてf(L2)2/339、または広帯域モデルについて23(L2)2よりも大きい場合)に有効である。
または(2)式8の広帯域モデルについて
よりも小さい場合(または、等価的に、観測距離が、周波数依存モデルについてf(L2)2/339、または広帯域モデルについて23(L2)2よりも大きい場合)に有効である。
たとえば、10mの幅と1mの高さとをもつ2D拡散ソースを有する場合、観測距離が1mよりも大きい場合、その(長い次元における)有効空間広がりは式6(L=10mの場合)から計算され得る。同じサイズのフルコヒーレント2Dソースの場合、観測距離が1.5mよりも大きい場合、500Hzにおける(長い次元における)有効空間広がりは、式8から計算され得る。
これらの例は、式6~8の1次元定量的モデルが適用可能であるためのボリュメトリックソースの「1次元性(1-dimensionalness)」に関する要件が、かなり緩く、1次元モデルが、実際、広範囲の「長い」2D(および3D)ボリュメトリックソースにも適用され得ることを示す。
1次元モデルの有効性のための上記で説明された定量的基準は、有効空間広がりのための1次元モデルが適用される領域と適用されない領域との間の厳密な境界としてではなく、それを示すものとして理解されるべきであることに留意されたい。これは、1次元モデルが適用され得る2Dソースのタイプ、および/または所与の2Dソースが1次元モデルによってモデル化され得る条件を識別するための手段を提供する。
したがって、本開示の実施形態の追加の特徴は、レンダラが、上記の基準に基づいて、1次元モデルを2Dまたは3Dボリュメトリックソースに適用すべきか否か、および/あるいは2Dまたは3Dボリュメトリックソースを簡略化された1次元モデルに従ってレンダリングすることと、より複雑な2Dまたは3Dモデルを使用してレンダリングすることとの間でいつ切り替えるべきかを決定し得ることである。
2つ以上の次元においてかなりの広がりを有する(したがって、上記で説明された、1次元オーディオソースと見なされることが可能であるための基準を満たさない)ボリュメトリックオーディオソースの場合、上記で説明された同じ定性的モデルおよび原理が、依然として適用される。
概して、1つの次元における幾何学的な空間広がりを拡大することは、(1つまたは複数の)他の次元における有効空間広がりを増加させる影響を有する。たとえば、所与の観測距離Dについて、長さLを有する純粋な1次元ソース(すなわち、線ソース)と、長さLおよび高さHを有する2次元ソース(すなわち、面ソース)との比較では、長さLのための次元に沿った2次元ソースの有効広がりは、1次元ソースの場合のものよりも大きくなることになる。また、有効空間広がりが観測距離の関数である領域と、有効空間広がりが単に幾何学的な広がりの物理的サイズに等しい領域との間の遷移距離は、線ソースの場合よりも面ソースの場合に小さくなる。言い換えれば、2D面ソースの場合、ソースの幅全体が、すでに、等しい幅の線ソースの場合よりも短い距離におけるレンダリングにおいて考慮に入れられる必要がある。
上記の例では、2次元面ソースは、(上記で説明された1次元モデルにおけるような点ソースの代わりに)長さLに沿って分布されたサイズHの垂直線ソースの連続体から構成されたものと考えられ得る。これらの垂直線ソースの各々は、点ソースの1/r減衰よりも緩やかな距離減衰を有し、したがって、ソースの水平広がりに沿った点は、(所与のSPLベースの有意性基準、たとえば、上記で説明された1dB SPLラウドネスJND基準に関して)有意でなくなるように観測位置からより遠くに離れている必要がある。これの結果は、2次元面ソースの場合、各次元における空間広がりが、個々に、2つの次元の各々についてのものよりも大きくなることになることである。
各次元における有効空間広がりは、その次元における広がりの幾何学的なサイズによって依然として制限されることに留意されたい(すなわち、有効空間広がりは、幾何学的なサイズを決して超えないことになる)。
上記の説明は、ソースパワーが面にわたってほぼ均等に分布される矩形2D面ソースについて成り立つ。このクラスの2Dソースのために、式6~8の1次元定量的モデルの単純な拡張が、以下で説明されるように構成され得る。
仮出願は、3つの異なる観測距離領域、ソースがそれぞれ、(小さいソース長さおよび/または大きい観測距離における)点ソースのように挙動する領域と、(大きいソース長さおよび/または小さい観測距離における)線ソースのように挙動する領域と、中間の挙動を伴う遷移領域とを基本的に識別する、有限長さ1次元ソースのための距離依存SPL減衰関数についてのパラメトリックモデルを開示する。
したがって、上記で説明されたように長さL2の垂直線ソースの連続分布から構成されたものと見なされ得る、幅L1および高さL2を有する均等な矩形2D面ソースの場合、(観測距離Dにおける)これらの垂直線ソースの各々のSPLは、仮出願において開示された式3から決定され得る。
観測距離Dにおける2D面ソースの総圧力応答は、今や、上記で提供された式1中の(点ソース圧力応答に対応する)1/ri距離依存性を、仮出願からの式3の距離依存減衰モデルによって置き換えることによってシミュレートされ得る。言い換えれば、2D面ソースは、サイズL2の有限長さ線ソースに対応する距離減衰関数を各々有する、点状ソースのサイズL1の1次元分布としてモデル化され得る。
様々なサイズの均等な2D矩形ソースについてそのようなシミュレーション実行することは、観測距離が高さL2よりも小さい場合、得られた有効空間広がりに単純なスケーリング係数αを単に適用することによって、これらのソースにとっても式6~8の1次元モデルが有効であるとの結論を生じ、したがって、式6が以下に修正される。
拡散2D矩形ソースの場合、スケーリング係数αは、ソースの高さL2と観測距離Dとの間の比の単調な関数である。下記の表は、シミュレーションから取得されたL2/Dの関数としてのαについての値を提供する。
より任意の形状の2Dおよび3D広がりおよび/または均等でないパワー分布について、本開示の実施形態による有効空間広がりの同じ定性的概念が、依然として適用される。
均等なパワー分布をもつ基本的な2Dおよび3Dの幾何学的な広がり形状(たとえば、円、球体、円柱、矩形、ボックス)について、上記のモデルと同様の観測距離の関数としての有効空間広がりのための特定のパラメトリックモデルを作ることは、完全に実現可能である。
パラメトリックモデルの実装
いくつかの実施形態では、オーディオレンダラは、ソースの幾何学的広がり(たとえば、物理的サイズ)、形状、および/または他の特性に関する受信された情報に基づいて、ボリュメトリックオーディオソースの有効空間広がりを決定する。そのような実施形態では、上記で説明されたパラメトリックモデルが、オーディオレンダラにおいて実装され得、レンダラは、(1つまたは複数の)パラメトリックモデル、受信されたソース情報、およびリスナー距離から遷移距離と有効空間広がりとを決定する。
いくつかの実施形態では、レンダラは、(1つまたは複数の)パラメトリックモデルを設定するためのパラメータを、たとえば、ビットストリーム中で受信し得る。詳細には、モデルによって使用される選択されたSPLしきい音レベル差値に関係するパラメータc0、c1、およびc2は、レンダラによって受信され得る。
ビットストリーム中でソース固有メタデータとしてオーディオレンダラに送られ得る他のモデルパラメータは、以下である。
(1)レンダラにパラメトリックモデルのバージョン(拡散、コヒーレント広帯域、またはコヒーレント周波数依存)のうちのどれを使用すべきかを命令する、またはモデルのバージョンの混合(場合によっては周波数依存)を指定する(たとえば、低い周波数のためにコヒーレント周波数依存モデル、高い周波数のために拡散モデル、中間周波数においてこれらの2つのモデルの混合を使用する)、ボリュメトリックソースについてのコヒーレンスデータ。
(2)ソースが「無限に長い」と見なされるべきであることを示すフラグ。この場合、レンダラは、有効空間広がりを決定するためにソースの幾何学的な広がりデータを無視し得、常に、ソースについての有効空間広がりを決定するために遷移距離よりも小さい距離のための式を使用し得る。
(3)レンダラに、ソースのために有効空間広がりモデルを使用すべきか否かを命令するフラグ。特定のボリュメトリックソースのためのモデルを使用することは、常に適切であるまたは望まれるとは限らない。これは、たとえば、そのフル広がりからの音を放射しないが、限られた数の個々の音ソースを含んでいる単に概念ボリューム(conceptual volume)である、ボリュメトリックソースの場合、当てはまり得る。
他の実施形態では、(1つまたは複数の)パラメトリックモデルは、レンダラの外部に、たとえば、エンコーダにおいて実装され得る。そのようなシナリオでは、遷移距離、および/または、遷移距離よりも小さい観測距離についての有効空間広がり(これは、拡散1次元オーディオソースの場合、開口角度に関して定数である)が、レンダラに送信される。これらの実施形態では、レンダラは、したがって(1つまたは複数の)パラメトリックモデルを実装する必要はなく、ただ、ソースをレンダリングするために2つの「空間広がりモード」、すなわち、レンダラがレンダリングのために(絶対サイズに関して一定である)受信された幾何学的広がりを使用するあるモードと、レンダラが(相対的に角度に関して一定である)受信された有効空間広がりを使用する代替モードとの間で切り替えることが可能である必要があり、受信された遷移距離が、2つのモード間の選択基準として使用される。
手短に上記で述べられたように、定量的パラメトリックモデルは、広がりにわたって均等なソースパワー分布を仮定する。これは、「妥当に(reasonably)」均等であるソースへの定量的モデルの適用を制限するが、この基準を満たす、多くの関連のあるタイプのソースがある(たとえば、混んでいるハイウェイ、海の海岸線、高速列車など)。
上記の開示では、中心観測位置のみが考慮された。しかしながら、非中心観測位置の場合、同じ定性的概念モデルが依然として適用される。極めて長いソース(詳細には無限に長いソース)の場合、横方向観測位置は、有効空間広がりについて関連性がないものであり、したがって、定量的パラメトリックモデルは任意の観測位置に適用される。
仮出願は、ボリュメトリックソースのコヒーレンスプロパティと部分的コヒーレントボリュメトリックソースの処理とがどのように決定されるかを説明する。
例示的なシステムおよび/または方法
図5は、本開示のいくつかの実施形態による、オーディオソースをレンダリングするための例示的なシステム500を示す。システム500は、エンコーダ501とオーディオレンダラ502とを含む。オーディオレンダラ502は、有効空間広がり計算モジュール526とオーディオレンダリングモジュール528とを含む。随意に、オーディオレンダラ502は、空間広がり計算モジュール522およびしきい距離値計算モジュール524をも含み得る。
システム500では、レンダラ502は、エンコーダ501から、オーディオ入力信号512とオーディオソースメタデータ514とを受信する。メタデータ514は、(i)オーディオソースに関連付けられたコヒーレンス情報、(ii)オーディオソースに関連付けられた空間広がりデータまたはジオメトリ情報、および/または(iii)オーディオソースの有効空間広がりを計算するために必要とされるしきい距離値のいずれか1つまたは組合せを含み得る。コヒーレンス情報は、たとえば、オーディオソースがコヒーレントソースまたは拡散ソースであることを示す、オーディオソースのコヒーレンスプロパティを示す。ジオメトリ情報は、オーディオソースのジオメトリを示す。
メタデータ514が空間広がりデータとしきい距離値とを含む場合、有効空間広がり計算モジュール526は、空間広がりデータ、しきい距離値、およびオーディオソースとリスナーとの間の距離を指定する距離値に基づいて、オーディオソースの有効空間広がりを計算し、レンダリングモジュール528は、オーディオソースの有効空間広がりを使用してオーディオソースをレンダリングする。
メタデータ514が、空間広がりデータを含むが、しきい距離値を含まない場合、しきい距離値計算モジュール524は、受信された空間広がりデータに基づいてしきい距離値を計算する。次いで、有効空間広がり計算モジュール526は、空間広がりデータ、しきい距離値、およびオーディオソースとリスナーとの間の距離を指定する距離値に基づいて、オーディオソースの有効空間広がりを計算し、オーディオレンダリングモジュール528は、オーディオソースの有効空間広がりを使用してオーディオソースをレンダリングする。
メタデータ514が空間広がりデータもしきい距離値も含まないが、ジオメトリ情報を含む場合、空間広がり計算モジュール522は、ジオメトリ情報に基づいて空間広がりを計算し、しきい距離値計算ユニット524は、計算された空間広がりに基づいてしきい距離値を計算する。次いで、有効空間広がり計算モジュール526は、計算された空間広がりデータ、計算されたしきい距離値、およびオーディオソースとリスナーとの間の距離を指定する距離値に基づいて、オーディオソースの有効空間広がりを計算し、オーディオレンダリングモジュール528は、オーディオソースの有効空間広がりを使用してオーディオソースをレンダリングする。
図6は、XRシーンのための音を作り出すための例示的なレンダラ502を示す。システム600は、コントローラ601と、オーディオ信号651(たとえば、マルチチャネルオーディオ信号)を修正するための信号修正器602と、左スピーカー604と、右スピーカー605とを含む。1つのオーディオ信号と2つのスピーカーとが図6に示されているが、これは、単に説明の目的であり、いかなる形でも本開示の実施形態を限定しない。コントローラ601は、1つまたは複数のパラメータを受信し、受信されたパラメータに基づいてオーディオ信号651に対する修正を実施する(たとえば、ボリュームレベルを増加または減少させる)ように信号修正器602をトリガするように設定され得る。受信されたパラメータは、(1)リスナーの位置に関する情報653(たとえば、オーディオソースへの方向および距離)および(2)本明細書で説明されたオーディオオブジェクトに関するメタデータ514を含む。
本開示のいくつかの実施形態では、情報653は、図7Aに示されているXRシステム700中に含まれる1つまたは複数のセンサーから提供され得る。図7Aに示されているように、XRシステム700は、ユーザによって装着されるように設定される。図7Bに示されているように、XRシステム700は、配向検知ユニット701と、位置検知ユニット702と、システム600のコントローラ601に結合された処理ユニット703とを備え得る。配向検知ユニット701は、リスナーの配向の変化を検出し、検出された変化に関する情報を処理ユニット703に提供するように設定される。いくつかの実施形態では、処理ユニット703は、配向検知ユニット701によって検出された配向の検出された変化を前提として、(何らかの座標系に関する)絶対配向を決定する。配向および位置の決定のための異なるシステム、たとえば、lighthouseトラッカー(lidar)を使用するHTC Viveシステムもあり得る。一実施形態では、配向検知ユニット701は、配向の検出された変化を前提として、(何らかの座標系に関する)絶対配向を決定し得る。この場合、処理ユニット703は、単に、配向検知ユニット701からの絶対配向データと位置検知ユニット702からの絶対位置データとを多重化し得る。いくつかの実施形態では、配向検知ユニット701は、1つまたは複数の加速度計および/または1つまたは複数のジャイロスコープを備え得る。
図8は、リスナーのためのオーディオソースをレンダリングするための、一実施形態による、プロセス800を示すフローチャートである。プロセス800は、ステップs802において始まり得、レンダラ502によって実施され得る。ステップs802は、オーディオソースの第1の空間広がりを示す少なくとも第1の空間広がり値を取得することを含む。ステップs804は、オーディオソースとリスナーとの間の距離を指定する距離値を取得することを含む。ステップs806は、距離値がしきい距離値よりも小さいかどうかを決定することを含む。ステップs808は、距離値がしきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、リスナーに対してオーディオソースをレンダリングすることを含む。
いくつかの実施形態では、しきい距離値は、第1の空間広がり値の関数である。いくつかの実施形態では、有効空間広がり値は、距離値の関数である。
いくつかの実施形態では、有効空間広がり値は、距離値のべき乗に比例し、べき乗は0.5から1の間の値を有する。
いくつかの実施形態では、プロセス800は、コヒーレンスプロパティ情報を取得することをさらに含む。コヒーレンスプロパティ情報は、オーディオソースについてのコヒーレンス度(degree of coherence)を示す。したがって、コヒーレンスプロパティ情報は、オーディオソースが、コヒーレントソースであるのか、拡散ソースであるのか、またはこれらの混合であるのかに関する決定を行うために使用され得る。
いくつかの実施形態では、プロセス800は、取得されたコヒーレンスプロパティ情報に基づいて、有効空間広がり値を計算することをさらに含む。
いくつかの実施形態では、プロセス800は、取得されたコヒーレンスプロパティ情報に基づいて、オーディオソースが、拡散ソースまたはコヒーレントソースのいずれかのものであるのかを決定することをさらに含む。
ソースが拡散ソースである場合、有効空間広がり値を計算することは、C0×Dに基づいて有効空間広がり値を計算することを含み、ここで、C0が定数であり、Dが取得された距離値である。
いくつかの実施形態では、有効空間広がり値は、オーディオソースのセグメントを識別するために使用され、オーディオソースの識別されたセグメントは、リスナーのためのオーディオソースの音響的に関連のあるセグメントである。
いくつかの実施形態では、第1の空間広がり値を取得することは、エンコーダから、オーディオソースに関連付けられたメタデータを受信することを含む。メタデータは、オーディオソースに関連付けられたジオメトリ情報を含む。第1の空間広がり値を取得することは、メタデータ中に含まれるジオメトリ情報に基づいて、第1の空間広がり値を導出することをさらに含む。
いくつかの実施形態では、プロセス800は、オーディオソースに関連付けられたメタデータを受信することをさらに含み、メタデータは、(i)オーディオソースのサイズが本質的に無限であることを示すフラグ、および/または(ii)オーディオソースをレンダリングするために有効空間広がりモデルを使用すべきかどうかを命令するフラグを含む。
いくつかの実施形態では、オーディオソースをレンダリングすることは、有効空間広がり値に基づいて、1つまたは複数の仮想ラウドスピーカーのための位置を決定することと、オーディオソースをレンダリングするために前記1つまたは複数の仮想ラウドスピーカーを使用することとを含む。
いくつかの実施形態では、オーディオソースは、本質的に1次元(1D)オーディオソースである。
いくつかの実施形態では、オーディオソースは、2次元(2D)オーディオソースまたは3次元(3D)オーディオソースであり、プロセス800は、エンコーダから、2Dオーディオソースまたは3Dオーディオソースをレンダリングするために1D有効空間広がりモデルを使用すべきかどうかを示すフラグを含むメタデータを受信することを含む。
いくつかの実施形態では、オーディオソースは、2次元(2D)オーディオソース(すなわち、オーディオソースは第1の空間次元(たとえば、幅)における第1の空間広がりを有し、オーディオソースは第2の空間次元(たとえば、高さ)における第2の空間広がりを有する)、または3次元(3D)オーディオソース(すなわち、オーディオソースは、第1の空間次元(たとえば、幅)における第1の空間広がりと、第2の空間次元(たとえば、高さ)における第2の空間広がりと、第3の空間次元(たとえば、深度)における第3の空間広がりとを有する)であり、プロセス800は、2Dオーディオソースまたは3Dオーディオソースをレンダリングするために本明細書で説明される1D有効空間広がりモデルが使用され得るかどうか、および/あるいは(i)1Dモデルに従って2Dオーディオソースまたは3Dオーディオソースをレンダリングすることと(ii)より複雑な2Dモデルまたは3Dモデルを使用することとの間でいつ切り替えるべきかを決定することを含む。上記で説明されたように、2Dオーディオソースまたは3Dオーディオソースが、オーディオソースの1D有効空間広がりを使用してレンダリングされ得るかどうかに関する決定は、他の1つまたは2つの次元のサイズと観測距離とに基づき得る。たとえば、50メートルの幅(L)および1メートルの高さ(H)を有する2Dオーディオソースを仮定すれば、レンダーは、Hおよび観測距離に基づいて(たとえば、観測距離>Hであると決定したことに基づいて)、レンダーが、Leffの有効長さを有する1Dオーディオソースとしてオーディオソースがレンダリングされ得ると決定するように設定され得、ここで、Leff<Lである。
したがって、いくつかの実施形態では、オーディオソースの第1の空間広がりは、第1の空間次元における空間広がりであり、方法は、i)オーディオソースの第2の空間広がりを示す第2の空間広がり値を取得することであって、第2の空間広がりが、第2の空間次元における空間広がりである、第2の空間広がり値を取得することと、ii)オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、有効空間広がり値を導出すべきか否かを決定することとをさらに含む。いくつかの実施形態では、オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、有効空間広がり値を導出すべきか否かを決定することは、オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、有効空間広がり値が導出され得ることを示すフラグを受信することを含む。いくつかの実施形態では、オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、有効空間広がり値を導出すべきか否かを決定することは、i)第1の空間広がり値または第2の空間広がり値と距離値との間の差が、しきい値よりも大きいかどうか、あるいは、ii)第1の空間広がり値または第2の空間広がり値と距離値の関数である値との間の差が、しきい値よりも大きいかどうかを決定することを含む。いくつかの実施形態では、オーディオソースが拡散オーディオソースである場合、方法は、第1の空間広がり値または第2の空間広がり値と距離値との間の差が、しきい値よりも大きいかどうかを決定することを含み、オーディオソースが拡散オーディオソースでない場合、方法は、第1の空間広がり値または第2の空間広がり値と距離値の関数である値との間の差が、しきい値よりも大きいかどうかを決定することを含む。いくつかの実施形態では、第1の空間広がり値または第2の空間広がり値と距離値との間の差が、しきい値よりも大きいかどうかを決定することは、距離値が、第1の空間広がり値または第2の空間広がり値よりも大きいかどうかを決定することからなる。
図9は、システム500またはシステム500の一部分(たとえば、レンダラ502)および/またはシステム600を実装するための、いくつかの実施形態による、装置900のブロック図である。図9に示されているように、装置900は、1つまたは複数のプロセッサ(P)955(たとえば、汎用マイクロプロセッサ、および/または、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など、1つまたは複数の他のプロセッサなど)を含み得る処理回路(PC)902であって、そのプロセッサが、単一のハウジングにおいてまたは単一のデータセンタにおいて共同サイト式であり得るかあるいは地理的に分散され得る(すなわち、装置900が分散コンピューティング装置であり得る)、処理回路(PC)902と、少なくとも1つのネットワークインターフェース948であって、各ネットワークインターフェース948は、装置900が、ネットワークインターフェース948が(直接または間接的に)接続されるネットワーク110(たとえば、インターネットプロトコル(IP)ネットワーク)に接続された他のノードにデータを送信し、他のノードからデータを受信することを可能にするための送信機(Tx)945および受信機(Rx)947を備える(たとえば、ネットワークインターフェース948はネットワーク110に無線で接続され得、その場合、ネットワークインターフェース948はアンテナ構成に接続される)、少なくとも1つのネットワークインターフェース948と、1つまたは複数の不揮発性記憶デバイスおよび/または1つまたは複数の揮発性記憶デバイスを含み得る1つまたは複数の記憶ユニット(別名「データ記憶システム」)908とを備え得る。PC902がプログラマブルプロセッサを含む実施形態では、コンピュータプログラム製品(CPP)941が提供され得る。CPP941はコンピュータ可読媒体(CRM)942を含み、CRM942は、コンピュータ可読命令(CRI)944を備えるコンピュータプログラム(CP)943を記憶する。CRM942は、磁気媒体(たとえば、ハードディスク)、光媒体、メモリデバイス(たとえば、ランダムアクセスメモリ、フラッシュメモリ)など、非一時的コンピュータ可読媒体であり得る。いくつかの実施形態では、コンピュータプログラム943のCRI944は、PC902によって実行されたとき、CRIが、装置900に、本明細書で説明されるステップ(たとえば、フローチャートを参照しながら本明細書で説明されるステップ)を実施させるように設定される。他の実施形態では、装置900は、コードの必要なしに本明細書で説明されるステップを実施するように設定され得る。すなわち、たとえば、PC902は、単に1つまたは複数のASICからなり得る。したがって、本明細書で説明される実施形態の特徴は、ハードウェアおよび/またはソフトウェアで実装され得る。
上記で説明された実施形態は、少なくともいくつかの利点を提供する。たとえば、大きいボリュメトリックオーディオソースのために本開示の実施形態による有効空間広がりを使用することは、ソースの幾何学的広がりを直接使用するよりも、ソースのより自然なおよび現実的な空間レンダリングを可能にする。また、特定のリスニング位置についてのみ有効である、ボリュメトリックオーディオソースの意図された知覚される空間広がりを直接指定することと比較して、本開示の実施形態によるモデル化された有効空間広がりは、任意のリスニング位置において有効である。さらに、いくつかのレンダリングシナリオでは、本開示の実施形態による方法およびシステムは、所与のリスニング位置における音響的に関連のある幾何学的広がりの部分のみがレンダリングの際に考慮されるので、大きいボリュメトリックオーディオソースのオーディオをレンダリングする際により良い算出効率を可能にする。別の例として、本開示の実施形態では、有効空間広がりを決定するためのパラメトリックモデルが、極めて単純であり、既存のレンダーアーキテクチャへの軽量アドオンとして容易に実装され得る。
様々な実施形態が本明細書で説明されたが、それらの実施形態は、限定ではなく、例として提示されたにすぎないことを理解されたい。したがって、本開示の広さおよび範囲は、上記で説明された例示的な実施形態のいずれによっても限定されるべきでない。その上、本明細書で別段に示されていない限り、またはコンテキストによって明確に否定されていない限り、上記で説明されたエレメントのそれらのすべての考えられる変形形態における任意の組合せが、本開示によって包含される。
さらに、上記で説明され、図面に示されたプロセスおよびメッセージフローは、ステップのシーケンスとして示されたが、これは、説明のためにのみ行われた。したがって、いくつかのステップが追加され得、いくつかのステップが省略され得、ステップの順序が並べ替えられ得、いくつかのステップが並行して実施され得ることが企図される。
Claims (27)
- リスナーのためのオーディオソースをレンダリングするための方法(800)であって、前記方法は、
前記オーディオソースの第1の空間広がりを示す少なくとも第1の空間広がり値を取得すること(s802)と、
前記オーディオソースと前記リスナーとの間の距離を指定する距離値を取得すること(s804)と、
前記距離値がしきい距離値よりも小さいかどうかを決定すること(s806)と、
前記距離値が前記しきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、前記リスナーに対して前記オーディオソースをレンダリングすること(s808)と
を含む、方法(800)。 - 前記有効空間広がり値が、前記距離値の関数である、請求項1に記載の方法。
- 前記有効空間広がり値を備えるメタデータを受信することをさらに含む、請求項1に記載の方法。
- 前記有効空間広がり値が、開口角度値である、請求項3に記載の方法。
- 前記しきい距離値が、前記第1の空間広がり値の関数である、請求項1から4のいずれか一項に記載の方法。
- 前記有効空間広がり値が、前記距離値のべき乗に比例し、前記べき乗が、両端値を含む、0.5から1の間の値を有する、請求項1から5のいずれか一項に記載の方法。
- 前記方法は、コヒーレンスプロパティ情報を取得することをさらに含み、前記コヒーレンスプロパティ情報が前記オーディオソースについてのコヒーレンス度を示す、請求項1から6のいずれか一項に記載の方法。
- 前記方法が、前記取得されたコヒーレンスプロパティ情報に基づいて、前記有効空間広がり値を計算することをさらに含む、請求項7に記載の方法。
- 前記方法は、
前記オーディオソースについての前記コヒーレンス度に基づいて、前記オーディオソースが、拡散ソース、コヒーレントソース、または拡散ソースとコヒーレントソースとの混合のいずれであるのかを決定すること
をさらに含む、請求項8に記載の方法。 - 前記ソースが拡散ソースである場合、前記有効空間広がり値を計算することが、C0×Dに基づいて前記有効空間広がり値を計算することを含み、ここで、C0が定数であり、Dが前記距離値である、
請求項1から9のいずれか一項に記載の方法。 - 前記有効空間広がり値が、前記オーディオソースのセグメントを識別するために使用され、前記オーディオソースの前記セグメントが、前記リスナーのための前記オーディオソースの音響的に関連のあるセグメントである、請求項1から11のいずれか一項に記載の方法。
- 前記オーディオソースをレンダリングすることが、前記オーディオソースの前記識別されたセグメントのみをレンダリングすることを含む、請求項12に記載の方法。
- 前記第1の空間広がり値を取得することは、(i)エンコーダから、前記オーディオソースに関連付けられたメタデータを受信することであって、前記メタデータが前記オーディオソースに関連付けられたジオメトリ情報を含む、メタデータを受信することと、(ii)前記メタデータ中に含まれる前記ジオメトリ情報に基づいて、前記第1の空間広がり値を導出することとを含む、請求項1から12のいずれか一項に記載の方法。
- 前記方法は、前記オーディオソースに関連付けられたメタデータを受信することをさらに含み、前記メタデータが、(i)前記オーディオソースのサイズが本質的に無限であることを示すフラグ、および/または(ii)前記オーディオソースをレンダリングするために有効空間広がりモデルを使用すべきかどうかを命令するフラグ、および/または(iii)前記しきい値距離を含む、請求項1から14のいずれか一項に記載の方法。
- 前記オーディオソースをレンダリングすることが、
前記有効空間広がり値に基づいて、1つまたは複数の仮想ラウドスピーカーのための位置を決定することと、
前記オーディオソースをレンダリングするために前記1つまたは複数の仮想ラウドスピーカーを使用することと
を含む、請求項1から15のいずれか一項に記載の方法。 - 前記オーディオソースが、本質的に1次元(1D)オーディオソースである、請求項1から16のいずれか一項に記載の方法。
- 前記オーディオソースの前記第1の空間広がりが、第1の空間次元における空間広がりであり、
前記方法は、
前記オーディオソースの第2の空間広がりを示す第2の空間広がり値を取得することであって、前記第2の空間広がりが、第2の空間次元における空間広がりである、第2の空間広がり値を取得することと、
前記オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、前記有効空間広がり値を導出すべきか否かを決定することと
をさらに含む、請求項1から16のいずれか一項に記載の方法。 - 前記オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、前記有効空間広がり値を導出すべきか否かを決定することは、前記オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、前記有効空間広がり値が導出され得ることを示すフラグを受信することを含む、請求項18に記載の方法。
- 前記オーディオソースが1つの空間次元のみにおける空間広がりを有するかのように、前記有効空間広がり値を導出すべきか否かを決定することは、
i)前記第1の空間広がり値または前記第2の空間広がり値と前記距離値との間の差が、しきい値よりも大きいかどうか、あるいは
ii)前記第1の空間広がり値または前記第2の空間広がり値と前記距離値の関数である値との間の差が、しきい値よりも大きいかどうか
を決定することを含む、請求項18に記載の方法。 - 前記オーディオソースが拡散オーディオソースである場合、前記方法は、前記第1の空間広がり値または前記第2の空間広がり値と前記距離値との間の前記差が、しきい値よりも大きいかどうかを決定することを含み、
前記オーディオソースが拡散オーディオソースでない場合、前記方法は、前記第1の空間広がり値または前記第2の空間広がり値と前記距離値の関数である前記値との間の前記差が、しきい値よりも大きいかどうかを決定することを含む、
請求項20に記載の方法。 - 前記第1の空間広がり値または前記第2の空間広がり値と前記距離値との間の前記差が、しきい値よりも大きいかどうかを決定することは、前記距離値が、前記第1の空間広がり値または前記第2の空間広がり値よりも大きいかどうかを決定することからなる、請求項20または21に記載の方法。
- 処理回路(902)によって実行されたとき、前記処理回路に、請求項1から22のいずれか一項に記載の方法を実施させる命令(944)を備える、コンピュータプログラム(943)。
- 請求項に23に記載のコンピュータプログラムを含んでいるキャリアであって、前記キャリアが、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体(942)のうちの1つである、キャリア。
- リスナーのためのオーディオソースをレンダリングするための装置(900)であって、前記装置は、
前記オーディオソースの空間広がりを示す空間広がり値を取得すること(s802)と、
前記オーディオソースと前記リスナーとの間の距離を指定する距離値を取得すること(s804)と、
前記距離値がしきい距離値よりも小さいかどうかを決定すること(s806)と、
前記距離値が前記しきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、前記リスナーに対して前記オーディオソースをレンダリングすること(s808)と
を行うように設定された、装置(900)。 - 前記装置が、請求項2から22のいずれか一項に記載の方法を実施するようにさらに設定された、請求項25に記載の装置。
- リスナーのためのオーディオソースをレンダリングするための装置(900)であって、前記装置が、
メモリ(942)と、
前記メモリに結合された処理回路(902)と
を備え、前記処理回路は、前記装置に、
前記オーディオソースの空間広がりを示す空間広がり値を取得すること(s802)と、
前記オーディオソースと前記リスナーとの間の距離を指定する距離値を取得すること(s804)と、
前記距離値がしきい距離値よりも小さいかどうかを決定すること(s806)と、
前記距離値が前記しきい距離値よりも小さいと決定したことの結果として、有効空間広がり値を使用して、前記リスナーに対して前記オーディオソースをレンダリングすること(s808)と
を行わせるように設定された、装置(900)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024082256A JP2024119834A (ja) | 2020-07-22 | 2024-05-21 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2020/070606 WO2022017594A1 (en) | 2020-07-22 | 2020-07-22 | Spatial extent modeling for volumetric audio sources |
JP2023504452A JP7493673B2 (ja) | 2020-07-22 | 2020-07-22 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
JP2024082256A JP2024119834A (ja) | 2020-07-22 | 2024-05-21 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023504452A Division JP7493673B2 (ja) | 2020-07-22 | 2020-07-22 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024119834A true JP2024119834A (ja) | 2024-09-03 |
Family
ID=71786923
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023504452A Active JP7493673B2 (ja) | 2020-07-22 | 2020-07-22 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
JP2024082256A Pending JP2024119834A (ja) | 2020-07-22 | 2024-05-21 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023504452A Active JP7493673B2 (ja) | 2020-07-22 | 2020-07-22 | ボリュメトリックオーディオソースのための空間広がりモデル化 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230353968A1 (ja) |
EP (1) | EP4185945A1 (ja) |
JP (2) | JP7493673B2 (ja) |
CN (1) | CN116113918A (ja) |
WO (1) | WO2022017594A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023203139A1 (en) | 2022-04-20 | 2023-10-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Rendering of volumetric audio elements |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6786834B2 (ja) * | 2016-03-23 | 2020-11-18 | ヤマハ株式会社 | 音響処理装置、プログラムおよび音響処理方法 |
KR20170125660A (ko) * | 2016-05-04 | 2017-11-15 | 가우디오디오랩 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN114286277B (zh) * | 2017-09-29 | 2024-06-14 | 苹果公司 | 使用体积音频渲染和脚本化音频细节级别的3d音频渲染 |
US10425762B1 (en) * | 2018-10-19 | 2019-09-24 | Facebook Technologies, Llc | Head-related impulse responses for area sound sources located in the near field |
JP7470695B2 (ja) * | 2019-01-08 | 2024-04-18 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 仮想現実のための効率的な空間的にヘテロジーニアスなオーディオ要素 |
-
2020
- 2020-07-22 EP EP20746144.3A patent/EP4185945A1/en active Pending
- 2020-07-22 US US18/017,291 patent/US20230353968A1/en active Pending
- 2020-07-22 CN CN202080104750.7A patent/CN116113918A/zh active Pending
- 2020-07-22 JP JP2023504452A patent/JP7493673B2/ja active Active
- 2020-07-22 WO PCT/EP2020/070606 patent/WO2022017594A1/en unknown
-
2024
- 2024-05-21 JP JP2024082256A patent/JP2024119834A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230353968A1 (en) | 2023-11-02 |
CN116113918A (zh) | 2023-05-12 |
WO2022017594A1 (en) | 2022-01-27 |
JP2023534862A (ja) | 2023-08-14 |
EP4185945A1 (en) | 2023-05-31 |
JP7493673B2 (ja) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210306792A1 (en) | Audio rendering of audio sources | |
Cuevas-Rodríguez et al. | 3D Tune-In Toolkit: An open-source library for real-time binaural spatialisation | |
WO2008135310A2 (en) | Early reflection method for enhanced externalization | |
JP2024119834A (ja) | ボリュメトリックオーディオソースのための空間広がりモデル化 | |
US10911885B1 (en) | Augmented reality virtual audio source enhancement | |
KR20220103167A (ko) | 패닝된 객체 라우드스피커 이득 및 전파된 객체 라우드스피커 이득을 사용하는 오디오 객체 렌더러, 라우드스피커 이득을 결정하기 위한 방법 및 컴퓨터 프로그램 | |
CN113632505A (zh) | 装置、方法、声音系统 | |
KR101975920B1 (ko) | 가상 음향 합성 장치 및 방법 | |
CN115273795A (zh) | 模拟冲激响应的生成方法、装置和计算机设备 | |
WO2022214270A1 (en) | Audio apparatus and method therefor | |
KR20230058443A (ko) | 잔향 오디오 신호 생성 방법 | |
TWI640983B (zh) | 室內聲響效應模擬方法 | |
WO2023031182A1 (en) | Deriving parameters for a reverberation processor | |
KR20240008827A (ko) | 가상 현실 환경에서 오디오 소스의 지향성을 제어하기 위한 방법 및 시스템 | |
CN114946199A (zh) | 生成与虚拟声源相关联的音频信号 | |
Sporr et al. | Ermittlung von Randbedingungen für Schallausbreitungsberechnungen mittels Augmented Reality | |
Aspöck et al. | Room geometry acquisition and processing methods for geometrical acoustics simulation models | |
NL2024434B1 (en) | Generating an audio signal associated with a virtual sound source | |
Agus et al. | Energy-Based Binaural Acoustic Modeling | |
KR20240104154A (ko) | 사운드 처리 장치, 디코더, 인코더, 비트스트림 및 해당 방법 | |
WO2024115663A1 (en) | Rendering of reverberation in connected spaces | |
JP2024525456A (ja) | 残響レベルの調整 | |
TW202145806A (zh) | 基於柵格路徑尋找之繞射模型化 | |
CN118541996A (zh) | 基于输入扩散对直接比率的混响器调整 | |
CN117854488A (zh) | 音频处理方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240614 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240614 |