JP6542717B2 - 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 - Google Patents
高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 Download PDFInfo
- Publication number
- JP6542717B2 JP6542717B2 JP2016120633A JP2016120633A JP6542717B2 JP 6542717 B2 JP6542717 B2 JP 6542717B2 JP 2016120633 A JP2016120633 A JP 2016120633A JP 2016120633 A JP2016120633 A JP 2016120633A JP 6542717 B2 JP6542717 B2 JP 6542717B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- gain
- segments
- filter bank
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 162
- 238000007906 compression Methods 0.000 title claims description 153
- 230000006835 compression Effects 0.000 title claims description 133
- 230000006837 decompression Effects 0.000 title description 66
- 238000013139 quantization Methods 0.000 title description 13
- 238000001228 spectrum Methods 0.000 title description 4
- 230000005236 sound signal Effects 0.000 claims description 210
- 230000008569 process Effects 0.000 claims description 78
- 230000001052 transient effect Effects 0.000 claims description 16
- 238000012935 Averaging Methods 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 5
- 239000004606 Fillers/Extenders Substances 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 230000002123 temporal effect Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005562 fading Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000009527 percussion Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Liquid Crystal Substances (AREA)
Description
大きさ(magnitude)、つまり、復号サブバンドサンプルの
システム100の圧縮伸張器(compander)を含む圧縮と拡張コンポーネントは、オーディオ信号処理の所定の時間においてだけ、もしくは、所定のタイプのオーディオコンテンツに対してだけ、プリとポスト処理ステップを適用するように構成されている。例えば、圧縮伸張は、スピーチおよび音楽の過渡信号に対して有益性を示し得る。しかしながら、変動がない信号といった、他の信号に対して、圧縮伸張は信号品質を低下させることがある。従って、図3Aに示されるように、圧縮伸張コントロールメカニズムがブロック310のように提供され、圧縮伸張オペレーションを調整するために、圧縮コンポーネント104から拡張コンポーネント114に対してコントロールデータが送信される。そうしたコントロールメカニズムの最も簡単な形態は、圧縮伸張の適用がオーディオ品質を低下させてしまうオーディオサンプルのブロックに対して、圧縮伸張機能をスイッチオフすることである。一つの実施例において、圧縮伸張のオン/オフ決定はエンコーダにおいて検出され、ビットストリームエレメントとしてデコーダに対して送信される。同一のQMF時間スロットにおいて圧縮器と拡張器がスイッチオン/オフされ得るようにである。
図4は、一つの実施例の下で、コーデックのエンコードステージに関してオーディオ信号を圧縮するためのシステムを説明するブロックダイヤグラムである。図4は、図3Aに示されたコーデックべースのシステムにおける使用のための圧縮方法の少なくとも一部を実施するハードウェア回路またはシステムを示している。システム400で示されるように、時間領域における入力オーディオ信号401が、QMFフィルターバンク402に入力される。このフィルターバンクは、入力信号を複数のコンポーネントへと分離する分析オペレーションを実施する。そこでは、各バンドパスフィルタがオリジナル信号の周波数サブバンドを伝える。QMFフィルターバンク410によって実行される合成オペレーションにおいて、信号の再構成が実行される。図4の実施例においては、分析と統合の両方のフィルターバンクが、64バンドを取り扱う。コアエンコーダ412は、統合フィルターバンク410からオーディオ信号を受信して、オーディオ信号を符号化することによって適切なデジタルフォーマット(例えば、MP3、ACC、等)においてビットストリームを生成する。
一つの実施例において、圧縮伸張コントロールメカニズムは、QMF領域において圧縮伸張のコントロールを提供するために、圧縮コンポーネント104の部分として含まれている。圧縮伸張コントロールは、多くのファクターに基づいて構成され得る。オーディオ信号タイプといったものである。例えば、大部分のアプリケーションにおいて、圧縮伸張は、スピーチ信号と過渡信号、または、時間的にピーキー(peaky)な信号のクラスの中のあらゆる他の信号に対して、ターンオンされるべきである。システムは、圧縮伸張機能のための適切なコントロール信号の生成を手助けするために、信号のピークを検出するための検出メカニズムを含んでいる。
Companding_control(nCh)
{
sync_flag=0;
if(nCh>1){
sync_flag
}
b_needAvg=0
ch_count=sync_flag?1:nCh
for(ch=0;ch<ch_count;ch++){
b_compand_on[ch]
if(!b_compand_on[ch]){
b_needAvg=1;
}
}
if(b_needAvg){
b_compand_avg:
}
}
sync_flag、b_compand_on〔ch〕、および、b_compand_avgフラグ、または、プログラムエレメントは、1ビット長のオーダーであってよく、または、システム制限と要求に応じたあらゆる他の長さであってよい。上記に説明されたプログラムコードは、圧縮伸張コントロール機能を実施する一つの方法の実施例であって、いくつかの実施例に従った圧縮伸張コントロールを実施するために他のプロトコルまたはハードウェアコンポーネントが使用され得ることに留意すべきである。
上記の実施形態につき以下の付記を残しておく。
(付記1)
オーディオ信号を拡張する方法であって、
オーディオ信号を受信するステップと、
拡張プロセスによって前記オーディオ信号を拡張されたダイナミックレンジまで拡張するステップと、を含み、
前記拡張プロセスは、
定められたウィンドウ形状を使用して前記受信したオーディオ信号を複数の時間セグメントへと分割するステップと、
前記オーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において各時間セグメントに対する広帯域ゲインを計算するステップと、
前記拡張されたダイナミックレンジを得るために、各時間セグメントに対して個別のゲイン値を適用するステップと、を含み、
前記個別のゲイン値の適用は、比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱める、
方法。
(付記2)
前記セグメントは、オーバーラップしている、
付記1に記載の方法。
(付記3)
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応している、
付記2に記載の方法。
(付記4)
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記3に記載の方法。
(付記5)
各時間セグメントに対する前記広帯域ゲインは、前記各時間セグメントにおけるサブバンドのサブセットの中の前記サブバンドサンプルを使用して計算される、
付記3に記載の方法。
(付記6)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記5に記載の方法。
(付記7)
各時間セグメントそれぞれに対する前記ゲインは、各時間セグメントにおける前記サブバンドサンプルのp−ノルムから引き出され、
ここで、pは、2に等しくない正の実数である、
付記5に記載の方法。
(付記8)
前記広帯域ゲインは、前記第1フィルターバンクの領域において適用される、
付記5に記載の方法。
(付記9)
各広帯域ゲイン値は、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含む、
付記8に記載の方法。
(付記10)
サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
付記9に記載の方法。
(付記11)
サブバンドの前記第1サブセットは、前記オーディオ信号の低周波数領域に対応し、かつ、
サブバンドの前記第2サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記9に記載の方法。
(付記12)
前記受信したオーディオ信号は、プロセスによって以前に圧縮されているものであり、
前記プロセスは、
最初のオーディオ信号を受信するステップと、
圧縮プロセスによって、前記最初のオーディオ信号のオリジナルのダイナミックレンジを実質的に低減するように圧縮するステップと、を含み、
前記圧縮プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、各セグメントに対する広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるために、前記複数のセグメントの各セグメントに対して前記最初のオーディオ信号から計算されたゲイン値を適用するステップと、
を含む、付記3に記載の方法。
(付記13)
拡張プロセスによって計算された前記広帯域ゲインは、対応する時間セグメントについて前記圧縮プロセスによって計算された前記広帯域ゲインの実質的な反転である、
付記12に記載の方法。
(付記14)
前記最初のオーディオ信号を分析するために前記圧縮プロセスにおいて前記広帯域ゲインが計算されて、周波数領域表現を獲得し、かつ、
分割のための前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記12に記載の方法。
(付記15)
前記拡張プロセスのために受信された信号は、ビットストリームを生成するオーディオエンコーダおよび前記ビットストリームを復号化するデコーダによる前記圧縮された信号の修正の後で獲得される、
付記12に記載の方法。
(付記16)
前記オーディオエンコーダと前記デコーダは、両方ともに変換ベースのものであり、かつ、
前記圧縮プロセスと前記拡張プロセスにおける前記オーディオ信号の時間セグメントは、前記オーディオエンコーダとデコーダにおける変換に係る一つのウィンドウ長よりも実質的に短い、
付記15に記載の方法。
(付記17)
前記方法は、さらに、
前記拡張プロセスの動作状態を決定するコントロール情報を生成するステップと、
前記エンコーダから前記デコーダへ送信されるビットストリームにおいて、前記コントロール情報を送信するステップと、
を含む、付記15に記載の方法。
(付記18)
前記ビットストリームにおけるオーディオ信号は、前記拡張プロセスの複数の時間セグメントに応じたそれぞれのフレームを伴うフレームへと分割され、
前記動作状態がグループから選択され、
前記グループは、
前記拡張プロセスをフレームにおける各時間セグメントに適用すること、
前記拡張プロセスをフレームにおけるあらゆる時間セグメントに適用しないこと
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、前記各時間セグメントにおいて適用される前記ゲインは、前記フレームにおける全ての時間セグメントの平均ゲインであること、
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、計算は前記拡張プロセスを全く適用しないときに対して中間のゲイン値を結果として生じること、
ストップフレームを使用して、前記拡張プロセスが適用されているフレームからフェードアウトして、前記拡張プロセスが適用されていないフレームへフェードインすること、
スタートフレームを使用して、前記拡張プロセスが適用されていないフレームからフェードアウトして、前記拡張プロセスが適用されているフレームへフェードインすること、および、
前記拡張プロセスを完全に適用すること、
からなる、付記17に記載の方法。
(付記19)
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記18に記載の方法。
(付記20)
前記コントロール情報は、動作状態間のスイッチングが信号の不連続性の発生を最小化するように決定される、
付記19に記載の方法。
(付記21)
前記コントロール情報は、前記圧縮プロセスもコントロールし、かつ、
前記拡張プロセスがスイッチオフされる場合に前記圧縮プロセスをターンオフし、前記拡張プロセスがスイッチオンされる場合に前記圧縮プロセスをターンオンする、効果を有し、
拡張に対する修正されたゲイン計算がなされる場合に、拡張に対する修正されたゲイン計算ができるようにし、
前記拡張器においてストップフレームが使用される場合にストップフレームを使用し、前記拡張器においてスタートフレームが使用される場合にスタートフレームを使用する、
付記20に記載の方法。
(付記22)
前記圧縮されたオーディオ信号と前記拡張器によって受信された前記オーディオ信号は、数量、N、チャンネルを有し、ここでNは1より大きく、
前記チャンネルは、一つまたはそれ以上の分離したサブセットへとグループ化され、
前記圧縮器および前記拡張器でのグループ化は、同一のものであり、
各グループにおける前記チャンネルは、前記圧縮器において同一のゲインを共有して圧縮され、かつ、前記拡張器において同一のゲインを共有して拡張される、
付記15に記載の方法。
(付記23)
前記グループ化は、既定のものであり、前記圧縮器と前記拡張器において既知である、
付記22に記載の方法。
(付記24)
各グループは、まさに一つのチャンネルを含み、N個のグループが存在する、
付記23に記載の方法。
(付記25)
チャンネルの前記グループ化は、
前記圧縮器においてチャンネル間の類似性メトリックを計算すること、
前記類似性メトリックに基づいて、類似のチャンネルを一緒にグループ化すること、
前記ビットストリームを通じて前記グループ化の情報を送信すること、
を含む、付記22に記載の方法。
(付記26)
ステレオ出力を再構成するために、少なくとも2つのチャンネルを前記第1フィルターバンク領域において適用された追加的なパラメトリック空間情報を伴うモノダウンミックスとして符号化し、
前記追加的なパラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記22に記載の方法。
(付記27)
オーディオ信号を圧縮する方法であって、
最初のオーディオ信号を受信するステップと、
圧縮プロセスによって前記最初のオーディオ信号のダイナミックレンジを実質的に低減するステップと、を含み、
前記圧縮プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用するステップと、を含む、
方法。
(付記28)
前記セグメントは、オーバーラップしており、
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応している、
付記27に記載の方法。
(付記29)
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記28に記載の方法。
(付記30)
各個別のゲイン値は、各時間セグメントにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記28に記載の方法。
(付記31)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記30に記載の方法。
(付記32)
各時間セグメントに対する前記ゲインは、各時間セグメントにおける前記サブバンドサンプルのp−ノルムから引き出され、
ここで、pは、2に等しくない正の実数である、
付記30に記載の方法。
(付記33)
前記ゲインは、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含む、
付記30に記載の方法。
(付記34)
サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
付記33に記載の方法。
(付記35)
サブバンドの前記第1サブセットは、前記オーディオ信号の低周波数領域に対応し、かつ、
サブバンドの前記第2サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
付記33に記載の方法。
(付記36)
前記方法は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張プロセスを実行する拡張コンポーネントに対して送信するステップを含み、
前記拡張プロセスは、
オーディオ信号の前記圧縮されたバージョンを受信するステップと、
前記オーディオ信号の前記圧縮されたバージョンを、プロセスによって、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するように拡張するステップ、を含み、
前記プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算するステップと、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用するステップと、
を含む、
付記27に記載の方法。
(付記37)
圧縮ステップによって計算された前記ゲインは、同一の時間セグメントについて前記拡張プロセスによって計算された前記ゲインの実質的な反転である、
付記36に記載の方法。
(付記38)
前記最初のオーディオ信号を分析するために前記拡張プロセスにおいて第2フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記36に記載の方法。
(付記39)
前記拡張ステップのために受信された信号は、ビットストリームを生成するオーディオエンコーダおよび前記ビットストリームを復号化するデコーダによる前記圧縮された信号の修正の後で獲得される、
付記36に記載の方法。
(付記40)
前記オーディオエンコーダと前記デコーダは、両方ともに変換ベースのものであり、かつ、
前記圧縮ステップと前記拡張ステップにおける前記オーディオ信号の時間セグメントは、前記オーディオエンコーダとデコーダにおける変換に係る一つのウィンドウ長よりも実質的に短い、
付記39に記載の方法。
(付記41)
前記方法は、さらに、
前記拡張ステップの動作状態を決定するコントロール情報を生成するステップと、
前記エンコーダから前記デコーダへ送信されるビットストリームにおいて、前記コントロール情報を送信するステップと、
を含む、付記39に記載の方法。
(付記42)
前記ビットストリームにおけるオーディオ信号は、前記拡張プロセスの複数の時間セグメントに応じたそれぞれのフレームを伴うフレームへと分割され、
前記動作状態がグループから選択され、
前記グループは、
前記拡張プロセスをフレームにおける各時間セグメントに適用すること、
前記拡張プロセスをフレームにおけるあらゆる時間セグメントに適用しないこと
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、前記各時間セグメントにおいて適用される前記ゲインは、前記フレームにおける全ての時間セグメントの平均ゲインであること、
修正されたゲイン計算を用いて前記拡張プロセスをフレームにおける各時間セグメントに適用することであって、計算は前記拡張プロセスを全く適用しないときに対して中間のゲイン値を結果として生じること、
ストップフレームを使用して、前記拡張プロセスが適用されているフレームからフェードアウトして、前記拡張プロセスが適用されていないフレームへフェードインすること、
スタートフレームを使用して、前記拡張プロセスが適用されていないフレームからフェードアウトして、前記拡張プロセスが適用されているフレームへフェードインすること、および、
前記拡張プロセスを完全に適用すること、
からなる、付記41に記載の方法。
(付記43)
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記42に記載の方法。
(付記44)
前記コントロール情報は、動作状態間のスイッチングが信号の不連続性の発生を最小化するように決定される、
付記43に記載の方法。
(付記45)
前記コントロール情報は、前記圧縮プロセスもコントロールし、かつ、
前記拡張プロセスがスイッチオフされる場合に前記圧縮プロセスをターンオフし、前記拡張プロセスがスイッチオンされる場合に前記圧縮プロセスをターンオンする、効果を有し、
拡張に対する修正されたゲイン計算がなされる場合に、拡張に対する修正されたゲイン計算ができるようにし、
前記拡張器においてストップフレームが使用される場合にストップフレームを使用し、前記拡張器においてスタートフレームが使用される場合にスタートフレームを使用する、
付記44に記載の方法。
(付記46)
前記圧縮されたオーディオ信号と前記拡張器によって受信された前記オーディオ信号は、数量、N、チャンネルを有し、ここでNは1より大きく、
前記チャンネルは、一つまたはそれ以上の分離したサブセットへとグループ化され、
前記圧縮器および前記拡張器でのグループ化は、同一のものであり、
各グループにおける前記チャンネルは、前記圧縮器において同一のゲインを共有して圧縮され、かつ、前記拡張器において同一のゲインを共有して拡張される、
付記39に記載の方法。
(付記47)
前記グループ化は、既定のものであり、前記圧縮器と前記拡張器において既知である、
付記46に記載の方法。
(付記48)
各グループは、まさに一つのチャンネルを含み、N個のグループが存在する、
付記47に記載の方法。
(付記49)
チャンネルの前記グループ化は、
前記圧縮器においてチャンネル間の類似性メトリックを計算すること、
前記類似性メトリックに基づいて、類似のチャンネルを一緒にグループ化すること、
前記ビットストリームを通じて前記グループ化の情報を送信すること、
を含む、付記46に記載の方法。
(付記50)
ステレオ出力を再構成するために、少なくとも2つのチャンネルを前記第1フィルターバンク領域において適用された追加的なパラメトリック空間情報を伴うモノダウンミックスとして符号化し、
前記追加的なパラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記49に記載の方法。
(付記51)
オーディオ信号を圧縮するための装置であって、
最初のオーディオ信号を受信する第1インターフェイスと、
前記最初のオーディオ信号のオリジナルのダイナミックレンジを実質的に低減するように前記最初のオーディオ信号を圧縮する圧縮器と、を含み、
前記圧縮器は、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより圧縮を行う、装置。
(付記52)
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記51に記載の装置。
(付記53)
個別のゲイン値は、各時間セグメントそれぞれにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記52に記載の装置。
(付記54)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記53に記載の装置。
(付記55)
前記装置は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張器へ送信する第2インターフェイスを含み、
前記拡張器は、
オーディオ信号の前記圧縮されたバージョンを受信し、
前記オーディオ信号の前記圧縮されたバージョンを、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用する、
ことによって拡張する、
付記52に記載の装置。
(付記56)
前記圧縮器によって計算された前記ゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転である、
付記55に記載の装置。
(付記57)
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得する第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記55に記載の装置。
(付記58)
前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
前記エンコーダと前記デコーダは、両方ともに変換ベースのものである、
付記55に記載の装置。
(付記59)
前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、前記ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記58に記載の装置。
(付記60)
前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記55に記載の装置。
(付記61)
オーディオ信号を拡張するための装置であって、
圧縮されたオーディオ信号を受信する第1インターフェイスと、
前記圧縮されたオーディオ信号をオリジナルの圧縮されていないダイナミックレンジに実質的に回復するための拡張器と、を含み、
前記拡張器は、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより拡張を行う、装置。
(付記62)
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つである、
付記61に記載の装置。
(付記63)
前記広帯域ゲインは、各時間セグメントに対する個々のゲイン値を含み、かつ、
個別のゲイン値それぞれは、各時間セグメントそれぞれにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算される、
付記62に記載の装置。
(付記64)
サブバンドの前記サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応し、かつ、
前記ゲインは、前記第1フィルターバンクの領域において適用される、
付記63に記載の装置。
(付記65)
前記装置は、さらに、
最初のオーディオ信号を受信する圧縮器から前記圧縮されたオーディオ信号を受信する第2インターフェイスを含み、
前記圧縮器は、
前記最初のオーディオ信号の前記オリジナルのダイナミックレンジを実質的に低減するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各時間セグメントに対して各ゲイン値を適用する、
ことによって前記最初のオーディオ信号を圧縮する、
付記62に記載の装置。
(付記66)
前記圧縮器によって計算された前記ゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転である、
付記65に記載の装置。
(付記67)
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得するする第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
付記65に記載の装置。
(付記68)
前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンのビットストリームを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
前記エンコーダと前記デコーダは、両方ともに変換ベースのものである、
付記65に記載の装置。
(付記69)
前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、前記ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
前記拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく前記圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
付記68に記載の装置。
(付記70)
前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
付記65に記載の装置。
106 エンコーダ
110 ネットワーク
112 デコーダ
114 拡張コンポーネント
116 オーディオ出力
406 圧縮器
412 コアエンコーダ
Claims (15)
- オーディオ信号を拡張する方法であって、
オーディオ信号の圧縮されたバージョンを圧縮プロセスを実行する圧縮コンポーネントから受信するステップと、
拡張プロセスによって前記オーディオ信号を拡張されたダイナミックレンジまで拡張するステップと、を含み、
前記拡張プロセスは、
定められたウィンドウ形状を使用して前記受信したオーディオ信号を複数の時間セグメントへと分割するステップと、
前記オーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において各時間セグメントに対する広帯域ゲインを計算するステップと、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用するステップと、を含み、
前記セグメントは、オーバーラップしており、
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、
各個別のゲイン値は、各時間セグメントにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算され、
ゲイン値は、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含み、
前記圧縮プロセスは、
前記オーディオ信号を受信するステップと、
前記オーディオ信号のダイナミックレンジを、プロセスによって、実質的に低減するように圧縮するステップ、を含み、
前記プロセスは、
定められたウィンドウ形状を使用して前記オーディオ信号を複数の時間セグメントへと分割するステップと、
前記オーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用するステップと、
を含む、
方法。 - 各時間セグメントそれぞれに対するゲインは、各時間セグメントにおける前記サブバンドサンプルのp−ノルムから引き出され、
ここで、pは、2に等しくない正の実数である、
請求項1に記載の方法。 - サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
請求項1に記載の方法。 - オーディオ信号を圧縮する方法であって、
最初のオーディオ信号を受信するステップと、
圧縮プロセスによって前記最初のオーディオ信号のダイナミックレンジを実質的に低減するステップと、を含み、
前記圧縮プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算するステップと、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用するステップと、を含み、
前記セグメントは、オーバーラップしており、
前記オーディオ信号を分析するために第1フィルターバンクが使用されて、周波数領域表現を獲得し、かつ、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、
各個別のゲイン値は、各時間セグメントにおけるサブバンドのサブセットの中のサブバンドサンプルを使用して計算され、
ゲインは、前記第1フィルターバンクのサブバンドの第1サブセットから計算されて、前記第1フィルターバンクのサブバンドの第2サブセットに適用され、
ここで、サブバンドの第2セットは、サブバンドの前記第1サブセットを含み、
前記方法は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張プロセスを実行する拡張コンポーネントに対して送信するステップを含み、
前記拡張プロセスは、
オーディオ信号の前記圧縮されたバージョンを受信するステップと、
前記オーディオ信号の前記圧縮されたバージョンを、プロセスによって、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するように拡張するステップ、を含み、
前記プロセスは、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割するステップと、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算するステップと、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用するステップと、
を含む、
方法。 - サブバンドの前記第1サブセットおよび前記第2サブセットは、同一であり、かつ、前記オーディオ信号の低周波数領域に対応している、
請求項4に記載の方法。 - サブバンドの前記第1サブセットは、前記オーディオ信号の低周波数領域に対応し、かつ、
サブバンドの前記第2サブセットは、前記第1フィルターバンクによってスパンされる全ての周波数帯に対応する、
請求項4に記載の方法。 - 圧縮ステップによって計算された前記ゲインは、同一の時間セグメントについて前記拡張プロセスによって計算された前記ゲインの実質的な反転である、
請求項4に記載の方法。 - オーディオ信号を圧縮するための装置であって、
最初のオーディオ信号を受信する第1インターフェイスと、
前記最初のオーディオ信号のオリジナルのダイナミックレンジを実質的に低減するように前記最初のオーディオ信号を圧縮する圧縮器と、を含み、
前記圧縮器は、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより圧縮を行い、
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つであり、
前記装置は、さらに、
前記最初のオーディオ信号の圧縮されたバージョンを拡張器へ送信する第2インターフェイスを含み、
前記拡張器は、
オーディオ信号の前記圧縮されたバージョンを受信し、
前記オーディオ信号の前記圧縮されたバージョンを、前記オーディオ信号のオリジナルのダイナミックレンジまで実質的に回復するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域表現の非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、各時間セグメントに対して前記広帯域ゲインの個別のゲイン値を適用する、
ことによって拡張し、
前記圧縮器によって計算されたゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転であり、
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得する第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
装置。 - 前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
エンコーダとデコーダは、両方ともに変換ベースのものである、
請求項8に記載の装置。 - 前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
請求項9に記載の装置。 - 前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
請求項8に記載の装置。 - オーディオ信号を拡張するための装置であって、
圧縮されたオーディオ信号を受信する第1インターフェイスと、
前記圧縮されたオーディオ信号をオリジナルの圧縮されていないダイナミックレンジに実質的に回復するための拡張器と、を含み、
前記拡張器は、
定められたウィンドウ形状を使用して最初のオーディオ信号を複数の時間セグメントへ分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域における広帯域ゲインを計算し、
比較的に高い強度のセグメントを増幅し、かつ、比較的に低い強度のセグメントを弱めるように、前記複数のセグメントの各セグメントに対して個別のゲイン値を適用する、
ことにより拡張を行い、
前記装置は、さらに、
前記オーディオ信号を分析して、周波数領域表現を獲得する第1フィルターバンクを含み、
前記定められたウィンドウ形状は、前記第1フィルターバンクに対するプロトタイプフィルタに対応しており、さらに、
前記第1フィルターバンクは、直角位相変調フィルタ(QMF)バンクまたは短時間フーリエ変換のうちの一つであり、
前記装置は、さらに、
最初のオーディオ信号を受信する圧縮器から前記圧縮されたオーディオ信号を受信する第2インターフェイスを含み、
前記圧縮器は、
前記最初のオーディオ信号の前記オリジナルのダイナミックレンジを実質的に低減するために、
定められたウィンドウ形状を使用して前記最初のオーディオ信号を複数の時間セグメントへと分割し、
前記最初のオーディオ信号の周波数領域サンプルの非エネルギーベース平均を使用して、前記周波数領域において広帯域ゲインを計算し、
比較的に低い強度のセグメントを増幅し、かつ、比較的に高い強度のセグメントを弱めるように、前記複数のセグメントの各時間セグメントに対して各ゲイン値を適用する、
ことによって前記最初のオーディオ信号を圧縮し、
前記圧縮器によって計算されたゲインは、同一の時間セグメントについて前記拡張器によって計算された前記ゲインの実質的な反転であり、
前記装置は、さらに、
前記最初のオーディオ信号を分析して周波数領域表現を獲得するする第2フィルターバンク、を含み、
分割のための前記定められたウィンドウ形状は、フィルターバンクに対するプロトタイプフィルタと同一であり、さらに、
第2フィルターバンクは、前記第1フィルターバンクと同一である、
装置。 - 前記装置は、さらに、
前記オーディオ信号の圧縮されたバージョンのビットストリームを圧縮器から拡張器へ送信するように構成されているオーディオコーデックのエンコードステージとデコードステージを含み、
エンコーダとデコーダは、両方ともに変換ベースのものである、
請求項12に記載の装置。 - 前記装置は、さらに、
前記拡張器の動作状態を決定するコントロール情報を生成し、かつ、前記ビットストリームにおいて前記コントロール情報を送信するコントロールコンポーネントを含み、
拡張プロセスに対する前記コントロール情報は、前記最初のオーディオ信号の一つまたはそれ以上の特性に基づく圧縮ステップによって決定され、前記オーディオ信号のコンテンツタイプと前記オーディオ信号に係る変動のない特性対過渡特性のうち少なくとも一つを含む、
請求項13に記載の装置。 - 前記装置は、さらに、
ステレオ出力を再構成するために、前記第1フィルターバンク領域においてパラメトリック空間情報を適用するパラメトリック空間情報コンポーネント、を含み、
前記パラメトリック空間情報は、既定の周波数の下で使用される分離したステレオ情報を伴う既定の周波数の上で使用されるか、または、既定の周波数の上で使用される分離したステレオ情報を伴う既定の周波数の下で使用されるか、いずれかである、
請求項12に記載の装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361809028P | 2013-04-05 | 2013-04-05 | |
US61/809,028 | 2013-04-05 | ||
US201361877167P | 2013-09-12 | 2013-09-12 | |
US61/877,167 | 2013-09-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016076927A Division JP6517723B2 (ja) | 2013-04-05 | 2016-04-07 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019110378A Division JP6838105B2 (ja) | 2013-04-05 | 2019-06-13 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016191934A JP2016191934A (ja) | 2016-11-10 |
JP6542717B2 true JP6542717B2 (ja) | 2019-07-10 |
Family
ID=50629038
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558242A Active JP6026678B2 (ja) | 2013-04-05 | 2014-04-01 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2016076927A Active JP6517723B2 (ja) | 2013-04-05 | 2016-04-07 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2016120633A Active JP6542717B2 (ja) | 2013-04-05 | 2016-06-17 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2019110378A Active JP6838105B2 (ja) | 2013-04-05 | 2019-06-13 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2021019640A Active JP7050976B2 (ja) | 2013-04-05 | 2021-02-10 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2022052882A Active JP7383067B2 (ja) | 2013-04-05 | 2022-03-29 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2023189975A Pending JP2024020311A (ja) | 2013-04-05 | 2023-11-07 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558242A Active JP6026678B2 (ja) | 2013-04-05 | 2014-04-01 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2016076927A Active JP6517723B2 (ja) | 2013-04-05 | 2016-04-07 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019110378A Active JP6838105B2 (ja) | 2013-04-05 | 2019-06-13 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2021019640A Active JP7050976B2 (ja) | 2013-04-05 | 2021-02-10 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2022052882A Active JP7383067B2 (ja) | 2013-04-05 | 2022-03-29 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
JP2023189975A Pending JP2024020311A (ja) | 2013-04-05 | 2023-11-07 | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 |
Country Status (24)
Country | Link |
---|---|
US (6) | US9947335B2 (ja) |
EP (3) | EP3564953B1 (ja) |
JP (7) | JP6026678B2 (ja) |
KR (7) | KR102088153B1 (ja) |
CN (8) | CN108269584B (ja) |
AP (1) | AP2015008800A0 (ja) |
AU (1) | AU2014248232B2 (ja) |
BR (2) | BR112015019176B1 (ja) |
CA (1) | CA2900724C (ja) |
CL (1) | CL2015002278A1 (ja) |
DK (1) | DK2981963T3 (ja) |
EA (1) | EA028755B9 (ja) |
ES (1) | ES2617314T3 (ja) |
HK (4) | HK1254791A1 (ja) |
HU (1) | HUE031966T2 (ja) |
IL (8) | IL300496A (ja) |
ME (1) | ME02623B (ja) |
MX (1) | MX342965B (ja) |
MY (2) | MY197063A (ja) |
PL (1) | PL2981963T3 (ja) |
RU (2) | RU2712814C2 (ja) |
SG (1) | SG11201506134XA (ja) |
WO (1) | WO2014165543A1 (ja) |
ZA (1) | ZA201600393B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014248232B2 (en) | 2013-04-05 | 2015-09-24 | Dolby International Ab | Companding apparatus and method to reduce quantization noise using advanced spectral extension |
US9584911B2 (en) * | 2015-03-27 | 2017-02-28 | Cirrus Logic, Inc. | Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses |
US10861475B2 (en) * | 2015-11-10 | 2020-12-08 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
US10395664B2 (en) | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
JP6603414B2 (ja) * | 2016-02-17 | 2019-11-06 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 過渡処理を高めるためのポストプロセッサ、プレプロセッサ、オーディオ符号器、オーディオ復号器、及び関連する方法 |
US9934788B2 (en) * | 2016-08-01 | 2018-04-03 | Bose Corporation | Reducing codec noise in acoustic devices |
WO2019009204A1 (ja) * | 2017-07-03 | 2019-01-10 | パイオニア株式会社 | 信号処理装置、制御方法、プログラム及び記憶媒体 |
RU2691122C1 (ru) * | 2018-06-13 | 2019-06-11 | Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) | Способ и устройство компандирования звуковых вещательных сигналов |
JP7447085B2 (ja) * | 2018-08-21 | 2024-03-11 | ドルビー・インターナショナル・アーベー | コンパンディングによる密過渡イベントの符号化 |
US11929085B2 (en) | 2018-08-30 | 2024-03-12 | Dolby International Ab | Method and apparatus for controlling enhancement of low-bitrate coded audio |
US12065430B2 (en) | 2018-10-26 | 2024-08-20 | Taiho Pharmaceutical Co., Ltd. | Indazole compound or salt thereof |
CN110265043B (zh) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | 自适应有损或无损的音频压缩和解压缩演算方法 |
US12126973B2 (en) | 2019-09-13 | 2024-10-22 | Dolby Laboratories Licensing Corporation | Dynamic range compression with reduced artifacts |
RU2731602C1 (ru) * | 2019-09-30 | 2020-09-04 | Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) | Способ и устройство компандирования с предыскажением звуковых вещательных сигналов |
JOP20220101A1 (ar) | 2019-10-28 | 2023-01-30 | Merck Sharp & Dohme | مثبطات صغيرة الجزئ لطافر G12C لبروتين ساركوما جرذان Kirsten (KRAS) |
JP2023523763A (ja) | 2020-04-30 | 2023-06-07 | ドルビー・インターナショナル・アーベー | ダイナミックレンジ低減領域においてマルチチャネルオーディオを強調するための方法、装置、及びシステム |
EP4158624A1 (en) * | 2020-06-01 | 2023-04-05 | Dolby International AB | Method and apparatus for determining parameters of a generative neural network |
CN114095831A (zh) * | 2020-08-25 | 2022-02-25 | 上海艾为电子技术股份有限公司 | 多段动态范围控制电路以及音频处理芯片 |
CN112133319B (zh) * | 2020-08-31 | 2024-09-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频生成的方法、装置、设备及存储介质 |
CN117079657B (zh) * | 2023-10-16 | 2024-01-26 | 中国铁塔股份有限公司 | 压限处理方法、装置、电子设备及可读存储介质 |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6026678B2 (ja) | 1981-04-30 | 1985-06-25 | 株式会社青木技研 | 電動ドライバ−の制御装置 |
JPS6026678A (ja) | 1983-07-22 | 1985-02-09 | Hiroshi Uchiyama | 原油受入配管防蝕法 |
JPS6026678U (ja) | 1983-07-28 | 1985-02-22 | 日本コロムビア株式会社 | キヤリツジ駆動装置 |
JPH05292592A (ja) | 1992-04-10 | 1993-11-05 | Toshiba Corp | 音質補正装置 |
KR100261254B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
US6003004A (en) * | 1998-01-08 | 1999-12-14 | Advanced Recognition Technologies, Inc. | Speech recognition method and system using compressed speech data |
JP3485786B2 (ja) | 1998-02-10 | 2004-01-13 | 三洋電機株式会社 | 音声データの圧縮/伸長装置 |
TW390104B (en) * | 1998-08-10 | 2000-05-11 | Acer Labs Inc | Method and device for down mixing of multi-sound-track compression audio frequency bit stream |
US6300888B1 (en) | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
US6487257B1 (en) * | 1999-04-12 | 2002-11-26 | Telefonaktiebolaget L M Ericsson | Signal noise reduction by time-domain spectral subtraction using fixed filters |
WO2001039370A2 (en) * | 1999-11-29 | 2001-05-31 | Syfx | Signal processing system and method |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
JP2003005797A (ja) | 2001-06-21 | 2003-01-08 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム |
GB0202386D0 (en) | 2002-02-01 | 2002-03-20 | Cedar Audio Ltd | Method and apparatus for audio signal processing |
JP3688657B2 (ja) | 2002-06-28 | 2005-08-31 | アロカ株式会社 | 検体分析装置 |
JP4247037B2 (ja) | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
US7787632B2 (en) * | 2003-03-04 | 2010-08-31 | Nokia Corporation | Support of a multichannel audio extension |
US7876966B2 (en) | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
KR101000345B1 (ko) | 2003-04-30 | 2010-12-13 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 |
US7353169B1 (en) | 2003-06-24 | 2008-04-01 | Creative Technology Ltd. | Transient detection and modification in audio signals |
WO2005004114A1 (en) * | 2003-07-07 | 2005-01-13 | Koninklijke Philips Electronics N.V. | System and method for audio signal processing |
KR20050049103A (ko) * | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
CN1677492A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
JP4318119B2 (ja) | 2004-06-18 | 2009-08-19 | 国立大学法人京都大学 | 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム |
WO2006047600A1 (en) * | 2004-10-26 | 2006-05-04 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
DK1825712T3 (da) * | 2004-12-16 | 2010-05-17 | Widex As | Høreapparat med tilbagekoblingsmodelforstærkningsestimation |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
US7956930B2 (en) | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
BRPI0709877B1 (pt) | 2006-04-04 | 2019-12-31 | Dolby Laboratories Licensing Corp | método e aparelho para controlar uma característica de intensidade acústica particular de um sinal de áudio |
SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
CN100543842C (zh) * | 2006-05-23 | 2009-09-23 | 中兴通讯股份有限公司 | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 |
CN101089951B (zh) * | 2006-06-16 | 2011-08-31 | 北京天籁传音数字技术有限公司 | 频带扩展编码方法及装置和解码方法及装置 |
EP1870880B1 (en) | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
HUE057855T2 (hu) * | 2006-07-04 | 2022-06-28 | Dolby Int Ab | Szûrõrendszer, amely tartalmaz egy szûrõátalakítót és egy szûrõkompresszort, valamint a szûrõrendszer mûködtetésére való eljárás |
CN101529929B (zh) * | 2006-09-05 | 2012-11-07 | Gn瑞声达A/S | 具有基于直方图的声环境分类的助听器 |
CA2874451C (en) * | 2006-10-16 | 2016-09-06 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
CN101681625B (zh) * | 2007-06-08 | 2012-11-07 | 杜比实验室特许公司 | 用于从两个输入的音频信号获得两个环绕声音频通道的方法和设备 |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
ES2377719T3 (es) * | 2007-07-13 | 2012-03-30 | Dolby Laboratories Licensing Corporation | Procesamiento de audio utilizando un análisis de escenas auditivas y oblicuidad espectral. |
CA2698039C (en) * | 2007-08-27 | 2016-05-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
JP4854630B2 (ja) * | 2007-09-13 | 2012-01-18 | 富士通株式会社 | 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム |
CN100585699C (zh) * | 2007-11-02 | 2010-01-27 | 华为技术有限公司 | 一种音频解码的方法和装置 |
RU2439720C1 (ru) * | 2007-12-18 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
RU2437247C1 (ru) * | 2008-01-01 | 2011-12-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN101262530B (zh) * | 2008-04-29 | 2011-12-07 | 中兴通讯股份有限公司 | 一种消除移动终端回音的装置 |
EP2299368B1 (en) * | 2008-05-01 | 2017-09-06 | Japan Science and Technology Agency | Audio processing device and audio processing method |
JP4750153B2 (ja) * | 2008-05-28 | 2011-08-17 | 独立行政法人科学技術振興機構 | 音響装置及び音響調整方法 |
CN101281747A (zh) * | 2008-05-30 | 2008-10-08 | 苏州大学 | 基于声道参数的汉语耳语音声调识别方法 |
BR122021003142B1 (pt) * | 2008-07-11 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2410521T3 (pl) | 2008-07-11 | 2018-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder sygnału audio, sposób generowania sygnału audio i program komputerowy |
PL2301020T3 (pl) | 2008-07-11 | 2013-06-28 | Fraunhofer Ges Forschung | Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
CN102099857B (zh) * | 2008-07-18 | 2013-03-13 | 杜比实验室特许公司 | 用于解码器中的编码音频数据的频域后滤波的方法和系统 |
CN101656580B (zh) * | 2008-08-22 | 2013-03-20 | 中兴通讯股份有限公司 | 全速率语音的处理方法和装置 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
CN101359902B (zh) * | 2008-09-25 | 2012-03-21 | 炬才微电子(深圳)有限公司 | 一种音频信号的均衡方法及系统 |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
EP2353161B1 (en) * | 2008-10-29 | 2017-05-24 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
WO2010075377A1 (en) * | 2008-12-24 | 2010-07-01 | Dolby Laboratories Licensing Corporation | Audio signal loudness determination and modification in the frequency domain |
US8626516B2 (en) * | 2009-02-09 | 2014-01-07 | Broadcom Corporation | Method and system for dynamic range control in an audio processing system |
TWI559680B (zh) * | 2009-02-18 | 2016-11-21 | 杜比國際公司 | 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法 |
JP4843691B2 (ja) * | 2009-03-09 | 2011-12-21 | 株式会社東芝 | 信号特性変化装置 |
CN101853666B (zh) * | 2009-03-30 | 2012-04-04 | 华为技术有限公司 | 一种语音增强的方法和装置 |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
WO2010137650A1 (ja) * | 2009-05-29 | 2010-12-02 | シャープ株式会社 | 音声再生装置、音声再生方法及びプログラム |
EP2438591B1 (en) * | 2009-06-04 | 2013-08-21 | Telefonaktiebolaget LM Ericsson (publ) | A method and arrangement for estimating the quality degradation of a processed signal |
CN101668303B (zh) * | 2009-09-24 | 2012-02-15 | 武汉中元通信股份有限公司 | 双频段宽带电台野外联试通信仿真方法与平台 |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
PL2486564T3 (pl) * | 2009-10-21 | 2014-09-30 | Dolby Int Ab | Urządzenie i sposób do generowania sygnału audio o wysokiej częstotliwości z użyciem adaptacyjnego nadpróbkowania |
CN101916567B (zh) * | 2009-11-23 | 2012-02-01 | 瑞声声学科技(深圳)有限公司 | 应用于双麦克风系统的语音增强方法 |
EP2513898B1 (en) | 2009-12-16 | 2014-08-13 | Nokia Corporation | Multi-channel audio processing |
CN101800520B (zh) * | 2010-02-25 | 2013-05-22 | 青岛海信移动通信技术股份有限公司 | 自动增益控制的实现方法及实现系统 |
TWI459828B (zh) * | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
US8616516B2 (en) | 2010-03-24 | 2013-12-31 | Intertechnique S.A. | Assembling device for cabin interior components |
CN101867809A (zh) * | 2010-04-09 | 2010-10-20 | 中国科学院光电技术研究所 | 基于脉动阵列的高速图像压缩vlsi编码方法及编码器 |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
WO2011127832A1 (en) | 2010-04-14 | 2011-10-20 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
US8964993B2 (en) * | 2010-04-27 | 2015-02-24 | Yobe, Inc. | Systems and methods for enhancing audio content |
EP2581902A4 (en) | 2010-06-14 | 2015-04-08 | Panasonic Corp | AUDIOHYBRID ENCODER AND AUDIOHYBRIDE DECODING DEVICE |
CN102361506A (zh) | 2011-06-08 | 2012-02-22 | 北京昆腾微电子有限公司 | 无线音频通信系统、以及用于发射音频信号的方法和设备 |
US8913754B2 (en) * | 2011-11-30 | 2014-12-16 | Sound Enhancement Technology, Llc | System for dynamic spectral correction of audio signals to compensate for ambient noise |
CN102522092B (zh) * | 2011-12-16 | 2013-06-19 | 大连理工大学 | 一种基于g.711.1的语音带宽扩展的装置和方法 |
CN102543086B (zh) * | 2011-12-16 | 2013-08-14 | 大连理工大学 | 一种基于音频水印的语音带宽扩展的装置和方法 |
CN102625220B (zh) * | 2012-03-22 | 2014-05-07 | 清华大学 | 一种确定助听设备听力补偿增益的方法 |
CN102737647A (zh) * | 2012-07-23 | 2012-10-17 | 武汉大学 | 双声道音频音质增强编解码方法及装置 |
AU2014248232B2 (en) * | 2013-04-05 | 2015-09-24 | Dolby International Ab | Companding apparatus and method to reduce quantization noise using advanced spectral extension |
US10861475B2 (en) * | 2015-11-10 | 2020-12-08 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
JP7447085B2 (ja) * | 2018-08-21 | 2024-03-11 | ドルビー・インターナショナル・アーベー | コンパンディングによる密過渡イベントの符号化 |
-
2014
- 2014-04-01 AU AU2014248232A patent/AU2014248232B2/en active Active
- 2014-04-01 CN CN201810160791.2A patent/CN108269584B/zh active Active
- 2014-04-01 JP JP2015558242A patent/JP6026678B2/ja active Active
- 2014-04-01 CN CN202210192156.9A patent/CN114566182A/zh active Pending
- 2014-04-01 EA EA201591533A patent/EA028755B9/ru not_active IP Right Cessation
- 2014-04-01 CN CN201610333318.0A patent/CN106024008B/zh active Active
- 2014-04-01 KR KR1020167015588A patent/KR102088153B1/ko active IP Right Grant
- 2014-04-01 SG SG11201506134XA patent/SG11201506134XA/en unknown
- 2014-04-01 KR KR1020217012568A patent/KR102509345B1/ko active IP Right Grant
- 2014-04-01 KR KR1020157022089A patent/KR101632599B1/ko active IP Right Grant
- 2014-04-01 AP AP2015008800A patent/AP2015008800A0/xx unknown
- 2014-04-01 RU RU2016116038A patent/RU2712814C2/ru active
- 2014-04-01 WO PCT/US2014/032578 patent/WO2014165543A1/en active Application Filing
- 2014-04-01 EP EP19173050.6A patent/EP3564953B1/en active Active
- 2014-04-01 US US14/762,690 patent/US9947335B2/en active Active
- 2014-04-01 CN CN201610364036.7A patent/CN105933030B/zh active Active
- 2014-04-01 MY MYPI2018001823A patent/MY197063A/en unknown
- 2014-04-01 RU RU2015133770/08A patent/RU2600527C1/ru active
- 2014-04-01 HU HUE14720877A patent/HUE031966T2/en unknown
- 2014-04-01 BR BR112015019176-2A patent/BR112015019176B1/pt active IP Right Grant
- 2014-04-01 KR KR1020207006389A patent/KR102248008B1/ko active Application Filing
- 2014-04-01 CN CN201810160805.0A patent/CN108269586B/zh active Active
- 2014-04-01 CA CA2900724A patent/CA2900724C/en active Active
- 2014-04-01 BR BR122017006632-3A patent/BR122017006632A2/pt not_active Application Discontinuation
- 2014-04-01 MY MYPI2015702483A patent/MY173488A/en unknown
- 2014-04-01 EP EP14720877.1A patent/EP2981963B1/en active Active
- 2014-04-01 DK DK14720877.1T patent/DK2981963T3/en active
- 2014-04-01 KR KR1020167015589A patent/KR102081043B1/ko active IP Right Grant
- 2014-04-01 KR KR1020237008172A patent/KR20230039765A/ko not_active Application Discontinuation
- 2014-04-01 CN CN201480008819.0A patent/CN104995680B/zh active Active
- 2014-04-01 IL IL300496A patent/IL300496A/en unknown
- 2014-04-01 PL PL14720877T patent/PL2981963T3/pl unknown
- 2014-04-01 ES ES14720877.1T patent/ES2617314T3/es active Active
- 2014-04-01 CN CN201810160804.6A patent/CN108269585B/zh active Active
- 2014-04-01 CN CN202210192171.3A patent/CN114566183A/zh active Pending
- 2014-04-01 KR KR1020227033715A patent/KR102740685B1/ko active IP Right Grant
- 2014-04-01 MX MX2015010478A patent/MX342965B/es active IP Right Grant
- 2014-04-01 ME MEP-2017-52A patent/ME02623B/me unknown
- 2014-04-01 EP EP16205100.7A patent/EP3176786B1/en active Active
-
2015
- 2015-07-19 IL IL240006A patent/IL240006A/en active IP Right Grant
- 2015-08-14 CL CL2015002278A patent/CL2015002278A1/es unknown
- 2015-12-08 HK HK18113875.3A patent/HK1254791A1/zh unknown
- 2015-12-08 HK HK15112109.6A patent/HK1211379A1/xx unknown
- 2015-12-08 HK HK19100077.5A patent/HK1257807A1/zh unknown
- 2015-12-08 HK HK18113874.4A patent/HK1254790A1/zh unknown
-
2016
- 2016-01-18 ZA ZA2016/00393A patent/ZA201600393B/en unknown
- 2016-01-19 IL IL243689A patent/IL243689A0/en active IP Right Grant
- 2016-04-07 JP JP2016076927A patent/JP6517723B2/ja active Active
- 2016-06-17 JP JP2016120633A patent/JP6542717B2/ja active Active
-
2018
- 2018-03-07 US US15/914,917 patent/US10217476B2/en active Active
- 2018-03-08 US US15/915,405 patent/US10373627B2/en active Active
- 2018-09-02 IL IL261514A patent/IL261514B/en active IP Right Grant
-
2019
- 2019-05-12 IL IL266569A patent/IL266569B/en active IP Right Grant
- 2019-06-13 JP JP2019110378A patent/JP6838105B2/ja active Active
- 2019-06-28 US US16/457,726 patent/US10679639B2/en active Active
-
2020
- 2020-04-30 IL IL274358A patent/IL274358B/en active IP Right Grant
- 2020-06-03 US US16/892,180 patent/US11423923B2/en active Active
-
2021
- 2021-02-10 JP JP2021019640A patent/JP7050976B2/ja active Active
- 2021-05-11 IL IL283098A patent/IL283098B/en unknown
-
2022
- 2022-03-29 JP JP2022052882A patent/JP7383067B2/ja active Active
- 2022-05-09 IL IL292853A patent/IL292853B2/en unknown
- 2022-08-18 US US17/820,594 patent/US12175994B2/en active Active
-
2023
- 2023-11-07 JP JP2023189975A patent/JP2024020311A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7383067B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
US20250069616A1 (en) | Companding system and method to reduce quantization noise using advanced spectral extension |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6542717 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |