JP6732739B2 - オーディオ・エンコーダおよびデコーダ - Google Patents
オーディオ・エンコーダおよびデコーダ Download PDFInfo
- Publication number
- JP6732739B2 JP6732739B2 JP2017517248A JP2017517248A JP6732739B2 JP 6732739 B2 JP6732739 B2 JP 6732739B2 JP 2017517248 A JP2017517248 A JP 2017517248A JP 2017517248 A JP2017517248 A JP 2017517248A JP 6732739 B2 JP6732739 B2 JP 6732739B2
- Authority
- JP
- Japan
- Prior art keywords
- dialog
- downmix
- object representing
- audio objects
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は2014年10月1日に出願された米国仮特許出願第62/058,157号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本開示は、概括的にはオーディオ符号化に関する。詳細には、オーディオ・システムにおけるデコーダにおいてダイアログを向上させるための方法および装置に関する。本開示はさらに、ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードする方法および装置に関する。
第一の側面によれば、例示的実施形態は、デコード方法、デコーダおよびデコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、デコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。
例示的実施形態によれば、本方法はさらに、前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領し、ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する前記情報を、前記空間的情報をもつデータに基づいて計算する段階を含む。この実施形態の利点は、ダウンミックス信号およびサイド情報を含むビットストリームをエンコーダに伝送するために必要とされるビットレートが低減されるということでありうる。前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する前記空間的情報は、いずれにせよデコーダによって受領されうるのであり、さらなる情報やデータがデコーダによって受領される必要がないからである。
第二の側面によれば、例示的実施形態は、エンコード方法、エンコーダおよびエンコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、エンコーダおよびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもちうる。一般に、第二の側面の特徴は第一の側面の対応する特徴と同じ利点をもちうる。
上記のように、ダイアログ向上は、他のオーディオ成分に対するダイアログ・レベルの増大に関する。コンテンツ生成から適正に編成されると、オブジェクト・コンテンツは、ダイアログが別個のオブジェクトによって表現できるので、ダイアログ向上のために好適である。オブジェクト(すなわち、オブジェクト・クラスターまたはダウンミックス信号)のパラメトリック符号化は、ダイアログと他のオブジェクトとの間の混合を導入することがある。
Q=(absP)TC
によって計算されてもよい。ここで、absPは、未修正のウェット・アップミックス行列Pの要素の絶対値を取ることによって得られる行列を表わし、Cは未修正のドライ・アップミックス行列を表わす。
ここで、Dbは、ブーストされたダイアログ部分を含む修正されたダウンミックス214である。修正行列Mは
M=GC 式2
によって得られる。ここで、Gはダウンミックス利得の[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]行列、すなわち、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号110の現在デコードされている時間‐周波数タイルD中に混合されたかを記述する情報202である。Cは修正された係数218の[ダイアログ・オブジェクト数,ダウンミックス・チャネル数]行列である。
ここで、Xbは向上されたダイアログ部分を含む修正されたダウンミックス214である。修正行列Eは
E=I+GC 式4
によって得られる。ここで、Iは[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]の恒等行列、Gはダウンミックス利得の[ダウンミックス・チャネル数,ダイアログ・オブジェクト数]行列、すなわちダイアログを表わす前記少なくとも一つのオブジェクトがどのように現在デコードされている複数のダウンミックス信号110中に混合されたかを記述する情報202であり、Cは修正された係数218の[ダイアログ・オブジェクト数,ダウンミックス・チャネル数]行列である。
G=[rendCoef1,rendCoef2,…,rendCoefn] 式5
によって得られる。ここで、rendCoefiは、n個のダイアログ・オブジェクトのうちダイアログ・オブジェクトiについてのレンダリング係数である。
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ・システムにおけるデコーダにおいてダイアログを向上させる方法であって:
複数のダウンミックス信号を受領する段階であって、前記ダウンミックス信号はダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトのダウンミックスである、段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を受領する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを受領する段階と、
向上パラメータおよび前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを使って前記係数を修正する段階と、
修正された係数を使ってダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階とを含む、
方法。
〔態様2〕
前記向上パラメータを使って前記係数を修正する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトの再構成を可能にする係数に、前記向上パラメータを乗算することを含む、態様1記載の方法。
〔態様3〕
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を、前記サイド情報から計算することを含む、態様1または2記載の方法。
〔態様4〕
ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトのみを再構成することを含む、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
ダイアログを表わす前記少なくとも一つのオブジェクトのみの再構成は、前記ダウンミックス信号の脱相関を含まない、態様4記載の方法。
〔態様6〕
ダイアログを表わす再構成された前記少なくとも一つのオブジェクトを前記ダウンミックス信号と、少なくとも一つの別個の信号としてマージする段階をさらに含む、態様4または5記載の方法。
〔態様7〕
前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
前記複数のダウンミックス信号およびダイアログを表わす再構成された前記少なくとも一つのオブジェクトを、前記空間的情報をもつデータに基づいてレンダリングする段階とを含む、
態様6記載の方法。
〔態様8〕
前記ダウンミックス信号およびダイアログを表わす再構成された前記少なくとも一つのオブジェクトを、ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を使って、組み合わせる段階をさらに含む、
態様4または5記載の方法。
〔態様9〕
前記ダウンミックス信号とダイアログを表わす再構成された前記少なくとも一つのオブジェクトとの組み合わせをレンダリングする段階をさらに含む、態様8記載の方法。
〔態様10〕
ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を受領する段階をさらに含む、
態様8または9記載の方法。
〔態様11〕
ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されたかを記述する受領された前記情報は、エントロピー符号化によって符号化されている、態様10記載の方法。
〔態様12〕
前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する前記情報を、前記空間的情報をもつデータに基づいて計算する段階とをさらに含む、
態様8または9記載の方法。
〔態様13〕
前記計算する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置を、前記複数のダウンミックス信号についての空間位置にマッピングする関数を適用することを含む、態様12記載の方法。
〔態様14〕
前記関数が3Dパン・アルゴリズムである、態様13記載の方法。
〔態様15〕
ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、前記複数のオーディオ・オブジェクトを再構成することを含む、態様1記載の方法。
〔態様16〕
前記複数のオーディオ・オブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
前記空間的情報をもつデータに基づいて、再構成された前記複数のオーディオ・オブジェクトをレンダリングする段階とをさらに含む、
態様15記載の方法。
〔態様17〕
態様1ないし16のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様18〕
オーディオ・システムにおいてダイアログを向上させるデコーダであって:
ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を受領し、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を受領し、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを受領するよう構成された受領段と;
向上パラメータおよび前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを使って前記係数を修正するよう構成された修正段と;
修正された係数を使ってダイアログを表わす前記少なくとも一つのオブジェクトを再構成するよう構成された再構成段とを有する、
デコーダ。
〔態様19〕
ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードする方法であって:
ダイアログを表わす少なくとも一つのオブジェクトを含む前記複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を決定する段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を決定する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを決定する段階と、
前記複数のダウンミックス信号、前記サイド情報および前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを含むビットストリームを形成する段階とを含む、
方法。
〔態様20〕
前記複数のダウンミックス信号およびダイアログを表わす前記少なくとも一つのオブジェクトについての空間位置に対応する空間的情報を決定する段階と、
前記空間的情報を前記ビットストリームに含める段階とをさらに含む、
態様19記載の方法。
〔態様21〕
前記複数のダウンミックス信号を決定する段階はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する情報を決定することを含み、
当該方法はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する前記情報を、前記ビットストリームに含める段階を含む、
態様19または20記載の方法。
〔態様22〕
ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する決定された前記情報が、エントロピー符号化を使ってエンコードされる、態様21記載の方法。
〔態様23〕
前記複数のオーディオ・オブジェクトについての空間位置に対応する空間的情報を決定する段階と、
前記複数のオーディオ・オブジェクトについての空間位置に対応する前記空間的情報を前記ビットストリームに含める段階とをさらに含む、
態様19ないし22のうちいずれか一項記載の方法。
〔態様24〕
態様19ないし23のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様25〕
ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードするエンコーダであって:
ダイアログを表わす少なくとも一つのオブジェクトを含む前記複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を決定し、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を決定するよう構成されたダウンミックス段と、
前記複数のダウンミックス信号および前記サイド情報を含むビットストリームであって、前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータをさらに含むビットストリームを形成するよう構成された符号化段とを有する、
エンコーダ。
Claims (14)
- オーディオ・システムにおけるデコーダにおいてダイアログを向上させる方法であって:
複数のダウンミックス信号を受領する段階であって、前記ダウンミックス信号はダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトのダウンミックスである、段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を受領する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを受領する段階と、
向上パラメータおよび前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを使って前記係数を修正する段階と、
修正された係数を使ってダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階とを含む、
方法。 - 前記向上パラメータを使って前記係数を修正する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトの再構成を可能にする係数に、前記向上パラメータを乗算することを含む、請求項1記載の方法。
- 前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を、前記サイド情報から計算することを含む、請求項1または2記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、ダイアログを表わす前記少なくとも一つのオブジェクトのみを再構成することを含む、請求項1ないし3のうちいずれか一項記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトのみの再構成は、前記ダウンミックス信号の脱相関を含まない、請求項4記載の方法。
- 前記ダウンミックス信号およびダイアログを表わす再構成された前記少なくとも一つのオブジェクトを、ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を使って、組み合わせる段階をさらに含む、
請求項4または5記載の方法。 - 前記ダウンミックス信号とダイアログを表わす再構成された前記少なくとも一つのオブジェクトとの組み合わせをレンダリングする段階をさらに含む、請求項6記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトがオーディオ・システムにおけるエンコーダによってどのように前記複数のダウンミックス信号中に混合されたかを記述する情報を受領する段階をさらに含む、
請求項6または7記載の方法。 - ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されたかを記述する受領された前記情報は、エントロピー符号化によって符号化されている、請求項8記載の方法。
- ダイアログを表わす前記少なくとも一つのオブジェクトを再構成する段階は、前記複数のオーディオ・オブジェクトを再構成することを含む、請求項1記載の方法。
- 前記複数のオーディオ・オブジェクトについての空間位置に対応する空間的情報をもつデータを受領する段階と、
前記空間的情報をもつデータに基づいて、再構成された前記複数のオーディオ・オブジェクトをレンダリングする段階とをさらに含む、
請求項10記載の方法。 - コンピュータに請求項1ないし11のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
- 請求項1ないし11のうちいずれか一項記載の方法を実行するよう構成された一つまたは複数のコンポーネントを有する、オーディオ・システムにおいてダイアログを向上させるデコーダ。
- ダイアログを表わす少なくとも一つのオブジェクトを含む複数のオーディオ・オブジェクトをエンコードする方法であって、当該方法は:
ダイアログを表わす少なくとも一つのオブジェクトを含む前記複数のオーディオ・オブジェクトのダウンミックスである複数のダウンミックス信号を決定する段階と、
前記複数のダウンミックス信号からの前記複数のオーディオ・オブジェクトの再構成を可能にする係数を示すサイド情報を決定する段階と、
前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定するデータを決定する段階と、
前記複数のダウンミックス信号、前記サイド情報および前記複数のオーディオ・オブジェクトのうちのどれがダイアログを表わすかを同定する前記データを含むビットストリームを形成する段階とを含み、
前記複数のダウンミックス信号を決定する段階はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する情報を決定することを含み、
当該方法はさらに、ダイアログを表わす前記少なくとも一つのオブジェクトがどのように前記複数のダウンミックス信号中に混合されるかを記述する前記情報を、前記ビットストリームに含める段階を含む、
方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462058157P | 2014-10-01 | 2014-10-01 | |
US62/058,157 | 2014-10-01 | ||
PCT/EP2015/072666 WO2016050899A1 (en) | 2014-10-01 | 2015-10-01 | Audio encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017535153A JP2017535153A (ja) | 2017-11-24 |
JP6732739B2 true JP6732739B2 (ja) | 2020-07-29 |
Family
ID=54238446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017517248A Active JP6732739B2 (ja) | 2014-10-01 | 2015-10-01 | オーディオ・エンコーダおよびデコーダ |
Country Status (8)
Country | Link |
---|---|
US (1) | US10163446B2 (ja) |
EP (1) | EP3201916B1 (ja) |
JP (1) | JP6732739B2 (ja) |
KR (2) | KR102482162B1 (ja) |
CN (1) | CN107077861B (ja) |
ES (1) | ES2709117T3 (ja) |
RU (1) | RU2696952C2 (ja) |
WO (1) | WO2016050899A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160315722A1 (en) * | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US9961475B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US10249312B2 (en) | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US11386913B2 (en) | 2017-08-01 | 2022-07-12 | Dolby Laboratories Licensing Corporation | Audio object classification based on location metadata |
EP3444820B1 (en) * | 2017-08-17 | 2024-02-07 | Dolby International AB | Speech/dialog enhancement controlled by pupillometry |
CN113748459A (zh) * | 2019-04-15 | 2021-12-03 | 杜比国际公司 | 音频编解码器中的对话增强 |
US12118987B2 (en) | 2019-04-18 | 2024-10-15 | Dolby Laboratories Licensing Corporation | Dialog detector |
US11710491B2 (en) | 2021-04-20 | 2023-07-25 | Tencent America LLC | Method and apparatus for space of interest of audio scene |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5870480A (en) | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
EP1076928B1 (en) * | 1998-04-14 | 2010-06-23 | Hearing Enhancement Company, Llc. | User adjustable volume control that accommodates hearing |
US7415120B1 (en) * | 1998-04-14 | 2008-08-19 | Akiba Electronics Institute Llc | User adjustable volume control that accommodates hearing |
US7283965B1 (en) | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
CN1993733B (zh) * | 2005-04-19 | 2010-12-08 | 杜比国际公司 | 空间音频参数量化器、去量化器及参数量化、去量化方法 |
CN101253550B (zh) * | 2005-05-26 | 2013-03-27 | Lg电子株式会社 | 将音频信号编解码的方法 |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
JP4823030B2 (ja) * | 2006-11-27 | 2011-11-24 | 株式会社ソニー・コンピュータエンタテインメント | 音声処理装置および音声処理方法 |
US8494840B2 (en) | 2007-02-12 | 2013-07-23 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US8756066B2 (en) * | 2007-02-14 | 2014-06-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
WO2008106036A2 (en) * | 2007-02-26 | 2008-09-04 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
US8295494B2 (en) * | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
PL3591650T3 (pl) * | 2007-08-27 | 2021-07-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do wypełniania dziur widmowych |
US20090226152A1 (en) | 2008-03-10 | 2009-09-10 | Hanes Brett E | Method for media playback optimization |
CA2745842C (en) * | 2008-04-18 | 2014-09-23 | Dolby Laboratories Licensing Corporation | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
EP2146522A1 (en) * | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
WO2010130084A1 (zh) | 2009-05-12 | 2010-11-18 | 华为终端有限公司 | 远程呈现系统、方法及视频采集设备 |
KR101598654B1 (ko) | 2009-09-14 | 2016-02-29 | 디티에스 엘엘씨 | 적응적 음성 가해성 처리 시스템 |
KR101777639B1 (ko) | 2010-03-23 | 2017-09-13 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 음향 재생을 위한 방법 |
CN103026406B (zh) * | 2010-09-28 | 2014-10-08 | 华为技术有限公司 | 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法 |
KR101827036B1 (ko) | 2011-01-04 | 2018-02-07 | 디티에스 엘엘씨 | 몰입형 오디오 렌더링 시스템 |
US9179236B2 (en) * | 2011-07-01 | 2015-11-03 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
EP2839461A4 (en) * | 2012-04-19 | 2015-12-16 | Nokia Technologies Oy | AUDIO SCENE APPARATUS |
US8825188B2 (en) * | 2012-06-04 | 2014-09-02 | Troy Christopher Stone | Methods and systems for identifying content types |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
CN107454511B (zh) | 2012-08-31 | 2024-04-05 | 杜比实验室特许公司 | 用于使声音从观看屏幕或显示表面反射的扬声器 |
JP6186436B2 (ja) | 2012-08-31 | 2017-08-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング |
WO2014036121A1 (en) | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
EP2936485B1 (en) | 2012-12-21 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US10141004B2 (en) | 2013-08-28 | 2018-11-27 | Dolby Laboratories Licensing Corporation | Hybrid waveform-coded and parametric-coded speech enhancement |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
WO2015186535A1 (ja) * | 2014-06-06 | 2015-12-10 | ソニー株式会社 | オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム |
-
2015
- 2015-10-01 KR KR1020177008778A patent/KR102482162B1/ko active Active
- 2015-10-01 ES ES15771962T patent/ES2709117T3/es active Active
- 2015-10-01 JP JP2017517248A patent/JP6732739B2/ja active Active
- 2015-10-01 EP EP15771962.6A patent/EP3201916B1/en active Active
- 2015-10-01 WO PCT/EP2015/072666 patent/WO2016050899A1/en active Application Filing
- 2015-10-01 CN CN201580053303.2A patent/CN107077861B/zh active Active
- 2015-10-01 US US15/515,775 patent/US10163446B2/en active Active
- 2015-10-01 KR KR1020227016227A patent/KR20220066996A/ko not_active Ceased
- 2015-10-01 RU RU2017113711A patent/RU2696952C2/ru active
Also Published As
Publication number | Publication date |
---|---|
US10163446B2 (en) | 2018-12-25 |
RU2696952C2 (ru) | 2019-08-07 |
KR20170063657A (ko) | 2017-06-08 |
KR20220066996A (ko) | 2022-05-24 |
EP3201916A1 (en) | 2017-08-09 |
RU2017113711A (ru) | 2018-11-07 |
CN107077861B (zh) | 2020-12-18 |
KR102482162B1 (ko) | 2022-12-29 |
JP2017535153A (ja) | 2017-11-24 |
WO2016050899A1 (en) | 2016-04-07 |
RU2017113711A3 (ja) | 2019-04-19 |
US20170249945A1 (en) | 2017-08-31 |
CN107077861A (zh) | 2017-08-18 |
EP3201916B1 (en) | 2018-12-05 |
ES2709117T3 (es) | 2019-04-15 |
BR112017006278A2 (pt) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11984131B2 (en) | Concept for audio encoding and decoding for audio channels and audio objects | |
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP5563647B2 (ja) | マルチチャンネル復号化方法及びマルチチャンネル復号化装置 | |
JP6687683B2 (ja) | マルチチャネル非相関器、マルチチャネル・オーディオ・デコーダ、マルチチャネル・オーディオ・エンコーダおよび非相関器入力信号のリミックスを使用したコンピュータ・プログラム | |
US9966080B2 (en) | Audio object encoding and decoding | |
JP6134867B2 (ja) | レンダラ制御式空間アップミックス | |
KR101761569B1 (ko) | 오디오 현장의 코딩 | |
US10102863B2 (en) | Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal | |
TWI843389B (zh) | 音訊編碼器、降混訊號產生方法及非暫時性儲存單元 | |
JP7383685B2 (ja) | バイノーラル・ダイアログ向上 | |
KR101808464B1 (ko) | 변형된 출력 신호를 얻기 위해 인코딩된 오디오 신호를 디코딩하기 위한 장치 및 방법 | |
JP2016522445A (ja) | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6732739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |