CN104318930B - 子带处理单元以及生成合成子带信号的方法 - Google Patents
子带处理单元以及生成合成子带信号的方法 Download PDFInfo
- Publication number
- CN104318930B CN104318930B CN201410461177.1A CN201410461177A CN104318930B CN 104318930 B CN104318930 B CN 104318930B CN 201410461177 A CN201410461177 A CN 201410461177A CN 104318930 B CN104318930 B CN 104318930B
- Authority
- CN
- China
- Prior art keywords
- sample
- signal
- frame
- subband
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 235
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000004458 analytical method Methods 0.000 claims abstract description 268
- 230000005236 sound signal Effects 0.000 claims abstract description 27
- 230000017105 transposition Effects 0.000 claims description 166
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 28
- 238000005070 sampling Methods 0.000 claims description 28
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 claims description 25
- 230000010363 phase shift Effects 0.000 claims description 20
- 238000012937 correction Methods 0.000 claims description 11
- 238000011144 upstream manufacturing Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 4
- 239000002131 composite material Substances 0.000 description 42
- 230000001052 transient effect Effects 0.000 description 38
- 230000015572 biosynthetic process Effects 0.000 description 20
- 238000003786 synthesis reaction Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 15
- 238000006073 displacement reaction Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 210000001747 pupil Anatomy 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000011066 ex-situ storage Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 5
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 206010019133 Hangover Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 101100070541 Podospora anserina (strain S / ATCC MYA-4624 / DSM 980 / FGSC 10383) het-S gene Proteins 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Vibration Dampers (AREA)
- Production Of Liquid Hydrocarbon Mixture For Refining Petroleum (AREA)
- Superheterodyne Receivers (AREA)
- Braking Arrangements (AREA)
- Superconductors And Manufacturing Methods Therefor (AREA)
Abstract
本文档涉及子带处理单元以及生成合成子带信号的方法。子带处理单元包括块提取器、非线性帧处理单元以及重叠及相加单元。块提取器被配置为重复地:根据多个复值分析样本得出L个输入样本的帧,其中块提取器被配置为根据反映所述输入音频信号的瞬间声学性质的控制数据来设置帧长度L;以及在得出L个输入样本的接下来的帧之前对多个复值分析样本应用p个样本的块跳跃大小由此生成输入样本的一系列帧。非线性帧处理单元被配置为根据输入样本的帧确定经处理样本的帧。重叠及相加单元被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定合成子带信号,其中分析子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联。
Description
本申请是申请日为2011年1月5日、申请号为“201180006569.3”、发明名称为“改进的基于子带块的谐波换位”的发明专利申请的分案申请。
技术领域
本文档涉及使用谐波换位(harmonic transposition)方法用于高频重建(HFR)的音频源编码系统,以及谐波失真的产生向所处理的信号添加亮度的数字效果处理器(例如激励器),以及用所维护的频谱内容延长信号持续时间的时间拉伸器。
背景技术
在WO 98/57436中,作为根据音频信号的低频带重建高频带的方法,建立了换位的概念。在音频编码中使用该概念,可以获得比特率的实质性节省。在基于HFR的音频编码系统中,向核心波形编码器呈现低带宽信号,在解码器侧使用换位和描述目标频谱形状的非常低的比特率的附加侧信息来重新生成较高的频率。对于核心编码信号的带宽窄的低比特率,重建具有在感知上舒适的特性的高带变得越来越重要。在WO 98/57436中定义的谐波换位在具有低交叉频率的情形下对于合成音乐材料表现良好。通过引用将文档WO 98/57436合并于此。谐波换位的原理是,将频率为ω的正弦波映射到频率为的正弦波,其中,是定义换位的阶次的整数。与此对比,基于单边带调制(SSB)的HFR将频率为ω的正弦波映射为频率为ω+Δω的正弦波,其中,Δω是固定频移。给定具有低带宽的核心信号,一般会由于SSB换位产生不协调的振铃假象(ringing artifact)。由于这些假象,基于谐波换位的HFR通常优于基于SSB的HFR。
为了达到提高的音频质量,高质量的基于谐波换位的HFR方法一般利用使用精细频率分辨率和高度过采样的复调制滤波器组,以达到所需的音频质量。通常利用精细频率分辨率来避免由于对可以被视为多个正弦波之和的不同子带信号的非线性处置或者处理而出现的不希望的互调制失真。使用足够窄的子带,即使用足够高的频率分辨率,高质量的基于谐波换位的HFR方法的目的在于在每个子带中最多具有一个正弦波。其结果是,可以避免由非线性处理导致的互调制失真。另一方面,为了避免可能由滤波器组和非线性处理导致的混杂(alias)类型的失真,时间上的高度过采样可能是有利的。另外,为了避免由于对子带信号的非线性处理而导致的瞬态信号的前回声,可能需要频率上的一定程度的过采样。
此外,基于谐波换位的HFR方法通常利用基于两个滤波器组块的处理。基于谐波换位的HFR的第一部分一般利用使用高频率分辨率以及使用时间和/或频率过采样的分析/合成滤波器组,以根据低频信号分量生成高频信号分量。基于谐波换位的HFR的第二部分一般利用使用相对粗频率分辨率的滤波器,例如QMF滤波器组,以生成具有希望的谱形状的高频分量,该滤波器组用来对高频分量应用谱边信息或者HFR信息,即进行所谓的HFR处理。滤波器组的第二部分还用来将低频信号分量与修正后的高频信号分量合成,以提供经解码的音频信号。
作为使用两个滤波器组块的序列以及使用利用高频率分辨率以及时间和/或频率过采样的分析/合成滤波器组的结果,基于谐波换位的HFR的计算复杂度可能相对高。因此,需要提供具有降低的计算复杂度的基于谐波换位的HFR方法,其同时针对各种类型的音频信号(例如瞬态和稳态音频信号)提供良好的音频质量。
发明内容
根据一方面,可以使用所谓的基于子带块的谐波换位来抑制由于对子带信号的非线性处理而导致的互调制产物。即,通过对谐波换位器的子带信号进行基于块的非线性处理,可以抑制或者减少子带内的互调制产物。其结果是,可以应用利用使用相对粗的频率分辨率和/或相对低程度的过采样的分析/合成滤波器组的谐波换位。作为示例,可以应用QMF滤波器组。
基于子带块的谐波换位系统的基于块的非线性处理包括对复子带样本的时间块的处理。对复子带样本的块的处理可以包括对复子带样本的共同相位修正和几个经修正的样本的叠加,以形成输出子带样本。该基于块的处理具有抑制或减少否则将针对包含几个正弦波的输入子带信号产生的互调制产物的净效果。
鉴于可以将使用相对粗的频率分辨率的分析/合成滤波器组用于基于子带块的谐波换位这一事实,并且鉴于可能需要降低程度的过采样这一事实,与高质量谐波换位,即具有精细频率分辨率并且使用基于样本的处理的谐波换位相比,根据基于块的子带处理的谐波换位具有降低的计算复杂度。同时,实验显示,对于许多类型的音频信号,在使用基于子带块的谐波换位时达到的音频质量与使用基于样本的谐波换位时几乎相同。尽管如此,已观察到与使用高质量的基于样本的谐波换位,即,使用精细频率分辨率的谐波换位而实现的音频质量相比,针对瞬态音频信号获得的音频质量通常降低。已认识到瞬态信号的质量降低可能是由于由块处理导致的时间拖尾(time smearing)。
除了上面提到的质量问题之外,基于子带块的谐波换位的复杂度也高于最简单的基于SSB的HFR方法的复杂度。这是因为一般的HFR应用中通常需要几个具有不同的换位阶次的信号,以合成所需的带宽。一般来说,基于块的谐波换位的每个换位阶次需要不同的分析和合成滤波器组框架。
鉴于上述分析,特别需要在保持平稳信号的质量的同时,提高用于瞬态信号和浊音信号的基于子带块的谐波换位的质量。如下面所概述的,通过非线性块处理的固定修正或信号自适应修正来获得质量提高。此外,需要进一步降低基于子带块的谐波换位的复杂度。如下面所概述的,可以通过在单分析和合成滤波器组对的框架中有效地实现几个阶次的基于子带块的换位来实现计算复杂度的降低。其结果是,一个单分析/合成滤波器组,例如QMF滤波器组可以用于几个阶次的谐波换位另外,可以针对谐波换位(即基于谐波换位的HFR的第一部分)和HFR处理(即基于谐波换位的HFR的第二部分)应用同一分析/合成滤波器组对,从而整个基于谐波换位的HFR可以依赖于一个单分析/合成滤波器组。换句话说,可以在输入侧仅使用一个单分析滤波器组以生成多个分析子带信号,随后将该多个分析子带信号提交到谐波换位处理和HFR处理。最后,可以仅使用一个单合成滤波器组在输出侧生成解码信号。
根据一方面,描述了一种被配置为根据输入信号生成时间拉伸和/或频率换位信号的系统。该系统可以包括:分析滤波器组,被配置为根据输入信号提供分析子带信号。分析子带可以与输入信号的频带相关联。分析子带信号可以包括多个复值分析样本,每个复值分析样本具有相位和幅值。分析滤波器组是正交镜像滤波器组、加窗离散傅立叶变换或者小波变换之一。特别地,分析滤波器组是64点正交镜像滤波器组。这样,分析滤波器组可以具有粗频率分辨率。
分析滤波器组可以对输入信号应用分析时间跨步ΔtA,和/或分析滤波器组可以具有分析频率间隔ΔfA,使得与分析子带信号相关联的频带具有标称宽度ΔfA,和/或分析滤波器组可以具有数量N个分析子带,其中N>1,其中,n是分析子带索引,其中,n=0,...,N-1。注意,由于相邻频带的重叠,分析子带信号的实际谱宽度可能大于ΔfA。然而,相邻分析子带之间的频率间隔一般由分析频率间隔ΔfA给定。
该系统可以包括:子带处理单元,被配置为使用子带换位因数Q和子带拉伸因数S根据分析子带信号确定合成子带信号。Q或者S中的至少一个可以大于1。子带处理单元可以包括:块提取器,被配置为从多个复值分析样本得出L个输入样本的帧。帧长度L可以大于1,然而,在某些实施例中,帧长度L可以等于1。可选地或者另外,块提取器可以被配置为在得出L个输入样本的接下来的帧之前,对多个分析样本应用p个样本的块跳跃大小。作为对多个分析样本重复应用块跳跃大小的结果,可以生成输入样本的一系列帧。
注意,帧长度L和/或块跳跃大小p可以是任意数值,不一定必须是整数值。对于这种或其它情况,块提取器可以被配置为对两个或更多个分析样本进行插值,以得出L个输入样本的帧的输入样本。作为示例,帧长度和/或块跳跃大小是分数,可以通过对两个或更多个相邻的分析样本进行插值来得出输入样本的帧的输入样本。可选地或者另外,块提取器可以被配置为对多个分析样本进行下采样,以产生L个输入样本的帧的输入样本。特别地,块提取器可以被配置为以子带换位因数Q对多个分析样本进行下采样。这样,块提取器通过进行下采样操作,可以有助于谐波换位和/或时间拉伸。
该系统,特别是子带处理单元可以包括:非线性帧处理单元,被配置为根据输入样本的帧确定经处理的样本的帧。可以针对输入样本的一系列帧重复进行确定,由此生成经处理的样本的一系列帧。可以通过针对帧的每个经处理的样本,通过将相应的输入样本的相位进行偏移来确定经处理的样本的相位,来进行该确定。特别地,非线性帧处理单元可以被配置为根据输入样本的帧、换位因数Q和子带拉伸因数S,通过将相应的输入样本的相位偏移相移值来确定经处理的样本的相位,该相移值基于预定输入样本。相移值可以基于乘以(QS-1)的预定输入样本。特别地,相移值可以由预定输入样本乘以(QS-1)加相位校正参数θ来给定。可以针对具有特定声学性质的多个输入信号试验确定相位校正参数θ。
在优选实施例中,预定输入样本对于帧的每个经处理的样本相同。特别地,预定输入样本可以是输入样本的帧的中心样本。
可选地或者另外,可以通过针对帧的每个经处理的样本基于相应输入样本的幅值和预定输入样本的幅值确定经处理的样本的幅值,来进行该确定。特别地,非线性帧处理单元可以被配置为将经处理的样本的幅值确定为相应输入样本的幅值与预定输入样本的幅值的平均值。经处理的样本的幅值可以被确定为相应的输入样本的幅值与预定输入样本的幅值的几何平均值。更具体地,几何平均值可以被确定为相应输入样本提高到(1-ρ)次幂的幅值乘以预定输入样本提高到ρ次幂的幅值。一般来说,几何幅值加权参数是ρ∈(0,1]。此外,几何幅值加权参数ρ可以是子带换位因数Q和子带拉伸因数S的函数。特别地,几何幅值加权参数可以是这使得计算复杂度降低。
应注意,用来确定经处理的样本的幅值的预定输入样本可以与用来确定经处理的样本的相位的预定输入样本不同。然而,在优选实施例中,两个预定输入样本相同。
总的来说,非线性帧处理单元可以用来控制系统的谐波换位和/或时间拉伸的程度。可以示出,作为根据相应输入样本的幅值并且根据预定输入样本的幅值确定经处理的样本的幅值的结果,可以改善系统针对瞬态和/或浊音输入信号的性能。
该系统,特别是子带处理单元可以包括:重叠及相加单元,被配置为通过将经处理的样本的一系列帧的样本进行重叠及相加,来确定合成子带信号。重叠及相加单元可以对经处理的样本的连续帧应用跳跃大小。跳跃大小可以等于块跳跃大小p乘以子带拉伸因数S。这样,重叠及相加单元可以用来控制系统的时间拉伸和/或谐波换位的程度。
该系统,特别是子带处理单元可以包括:加窗单元,位于重叠及相加单元上游。加窗单元可以被配置为对经处理的样本的帧应用窗口函数。这样,可以在重叠及相加操作之前,对经处理的样本的一系列帧应用窗口函数。窗口函数的长度可以对应于帧长度L。窗口函数可以是高斯窗口、余弦窗口、升余弦窗口、汉明窗口、汉窗口、矩形窗口、巴特兰窗口和/或布莱克曼窗口之一。一般来说,窗口函数包括多个窗口样本,并且多个偏移了跳跃大小Sp的窗口函数的覆盖和相加的窗口样本可以以显著恒定值K提供一系列样本。
该系统可以包括:合成滤波器组,被配置为根据合成子带信号生成时间拉伸和/或频率换位信号。合成子带可以与时间拉伸和/或频率换位信号的频带相关联。合成滤波器组可以是相应的逆滤波器组或者滤波器组的变换或者分析滤波器组的变换。特别地,合成滤波器组可以是逆64点正交镜像滤波器组。在实施例中,合成滤波器组对合成子带信号应用合成时间跨步Δts,和/或合成滤波器组具有合成频率间隔Δfs,和/或合成滤波器组具有数量M个合成子带,其中,M>1,其中,m是合成子带索引,m=0,...,M-1。
应注意,一般来说,分析滤波器组被配置为生成多个分析子带信号;子带处理单元被配置为根据多个分析子带信号确定多个合成子带信号;并且合成滤波器组被配置为根据多个合成子带信号生成时间拉伸和/或频率换位信号。
在实施例中,该系统可以被配置为生成以物理时间拉伸因数进行了时间拉伸和/或以物理频率换位因数进行了频率换位的信号。在这种情况下,子带拉伸因数可以由给定,子带换位因数可以由给定;和/或与分析子带信号相关联的分析子带索引n和与合成子带信号相关联的合成子带索引m可以通过相关联。如果是非整数值,则n可以被选择为最接近项的整数值,即小于或大于项的最接近的整数值。
该系统可以包括:控制数据接收单元,被配置为接收控制数据,控制数据反映输入信号的瞬间声学性质。例如,可以通过将输入信号分类为不同的声学性质类别来反映该瞬间声学性质。这些类别可以包括针对瞬态信号的瞬态性质类别和/或针对平稳信号的平稳性质类别。该系统可以包括信号分类器或者可以从信号分类器接收控制数据。信号分类器可以被配置为分析输入信号的瞬间声学性质,和/或被配置为设置反映瞬间声学性质的控制数据。
子带处理单元可以被配置为通过考虑控制数据来确定合成子带信号。特别地,块提取器可以被配置为根据控制数据设置帧长度L。在实施例中,如果控制数据反映瞬态信号,则设置短帧长度L;和/或如果控制数据反映平稳信号,则设置长帧长度L。换句话说,与用于平稳信号部分的帧长度L相比,针对瞬态信号部分,帧长度L可以缩短。这样,可以在子带处理单元内考虑输入信号的瞬间声学性质。其结果是,可以改善系统针对瞬态和/或浊音输入信号的性能。
如上面所概述的,分析滤波器组一般被配置为提供多个分析子带信号。特别地,分析滤波器组可以被配置为根据输入信号提供第二分析子带信号。该第二分析子带信号一般与和分析子带信号不同的输入信号的频带相关联。第二分析子带信号可以包括多个复值第二分析样本。
子带处理单元可以包括:第二块提取器,被配置为通过对多个第二分析样本应用块跳跃大小p来得出一系列第二输入样本。即,在优选实施例中,第二块提取器应用帧长度L=1。一般来说,每个第二输入样本对应于输入样本的帧。该对应关系可以参考定时和/或样本方面。特别地,第二输入样本和相应输入样本的帧可以与输入信号的相同的时间实例相关。
子带处理单元可以包括:第二非线性帧处理单元,被配置为根据输入样本的帧并且根据相应的第二输入样本来确定第二经处理样本的帧。可以通过针对帧的每个第二经处理样本,通过将相应输入样本的相位偏移相移值来确定第二经处理样本的相位,来进行第二经处理样本的帧的确定,该相移值基于相应的第二输入样本、换位因数Q和子带拉伸因数S。特别地,可以如在本文档中所概述的来进行相移,其中,由第二经处理样本取代预定输入样本。此外,可以通过针对帧的每个第二经处理样本,基于相应输入样本的幅值和相应第二输入样本的幅值来确定第二经处理样本的幅值,来进行第二经处理样本的帧的确定。特别地,可以如在本文档中所概述的来确定幅值,其中,由第二经处理样本取代预定输入样本的位置。
这样,第二非线性帧处理单元可以用来根据从两个不同的分析子带信号中取得的帧,得出经处理样本的帧或者一系列帧。换句话说,可以根据两个或更多个不同的分析子带信号,得出特定合成子带信号。如在本文档中所概述的,这在对于多阶谐波换位和/或多程度时间拉伸使用单个分析和合成滤波器组对的情况下是有利的。
为了确定应当对索引为m的合成子带做出贡献的一个或两个分析子带,可以考虑分析和合成滤波器组的频率分辨率之间的关系。特别地,可以规定如果项是整数值n,则可以基于经处理的样本的帧来确定合成子带信号,即可以根据与整数索引n相对应的单个分析子带信号确定合成子带信号。可选地或者另外,可以规定如果项是非整数,其中,n是最接近的整数值,则可以基于第二经处理的样本的帧确定合成子带信号,即,可以根据与最接近的整数索引值n和相邻的整数索引值相对应的两个分析子带信号来确定合成子带信号。特别地,第二分析子带信号可以与分析子带索引n+1或n-1相对应。
根据又一方面,描述了一种被配置为根据输入信号生成时间拉伸和/或频率换位信号的系统。该系统尤其适合于在控制信号的影响下生成时间拉伸和/或频率换位信号,由此考虑输入信号的瞬间声学性质。这可能特别与改善系统的瞬时响应相关。
该系统可以包括:控制数据接收单元,被配置为接收反映输入信号的瞬间声学性质的控制数据。此外,该系统可以包括:分析滤波器组,被配置为根据输入信号提供的分析子带信号;其中,分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值。另外,该系统可以包括:子带处理单元,被配置为使用子带换位因数Q、子带拉伸因数S和控制数据,根据分析子带信号确定合成子带信号。一般来说,Q或者S中的至少一个大于1。
子带处理单元可以包括:块提取器,被配置为从多个复值分析样本得出L个输入样本的帧。帧长度L可以大于1。此外,块提取器可以被配置为根据控制数据设置帧长度L。块提取器还可以被配置为在得出L个输入样本的接下来的帧之前,对多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧。
如上面所概述的,子带处理单元可以包括:非线性帧处理单元,被配置为根据输入样本的帧确定经处理的样本的帧。可以通过针对帧的每个经处理的样本,通过将相应输入样本的相位进行偏移来确定经处理的样本的相位;并且通过针对帧的每个经处理的样本,基于相应输入样本的幅值确定经处理的样本的幅值,来进行该确定。
此外,如上面所概述的,该系统可以包括:重叠及相加单元,被配置为通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号;以及合成滤波器组,被配置为根据合成子带信号生成时间拉伸和/或频率换位信号。
根据另一方面,描述了一种被配置为根据输入信号生成时间拉伸和/或频率换位信号的系统。该系统可以特别良好地适合于在单个分析/合成滤波器组对内进行多个时间拉伸和/或频率换位操作。该系统可以包括:分析滤波器组,被配置为根据输入信号提供第一和第二分析子带信号;其中,第一和第二分析子带信号各自包括多个复值分析样本,分别称为第一和第二分析样本,每个分析样本具有相位和幅值。一般来说,第一和第二分析子带信号对应于输入信号的不同频带。
该系统还可以包括:子带处理单元,被配置为使用子带换位因数Q和子带拉伸因数S根据第一和第二分析子带信号确定合成子带信号。一般来说,Q或者S中的至少一个大于1。子带处理单元可以包括:第一块提取器,被配置为从多个第一分析样本得出L个第一输入样本的帧;帧长度L大于1。第一块提取器可以被配置为在得出L个第一输入样本的接下来的帧之前,对多个第一分析样本应用p个样本的块跳跃大小;由此生成第一输入样本的一系列帧。此外,子带处理单元可以包括:第二块提取器,被配置为通过对多个第二分析样本应用块跳跃大小p,来得出一系列第二输入样本;其中,每个第二输入样本对应于第一输入样本的帧。第一和第二块提取器可以具有在本文档中概述的特征中的任何特征。
子带处理单元可以包括:非线性帧处理单元,被配置为根据第一输入样本的帧并且根据相应的第二输入样本,确定经处理的样本的帧。这可以通过如下方式进行:针对帧的每个经处理的样本,通过将相应第一输入样本的相位进行偏移来确定经处理的样本的相位;和/或通过针对帧的每个经处理的样本,基于相应第一输入样本的幅值和相应的第二输入样本的幅值来确定经处理的样本的幅值。特别地,非线性帧处理单元可以被配置为通过将相应的第一输入样本的相位偏移相移值来确定经处理的样本的相位,该相移值基于相应第二输入样本、换位因数Q和子带拉伸因数S。
此外,子带处理单元可以包括:重叠及相加单元,被配置为通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号;其中,重叠及相加单元可以对经处理的样本的连续帧应用跳跃大小。跳跃大小可以等于块跳跃大小p乘以子带拉伸因数S。最后,该系统可以包括合成滤波器组,被配置为根据合成子带信号生成时间拉伸和/或频率换位信号。
应注意,在本文档中描述的系统的不同部件可以包括在本文档中关于这些部件概述的所有特征或者特征中的任意特征。这特别适用于在本文档中的不同部分描述的分析和合成滤波器组、子带处理单元、非线性处理单元、块提取器、重叠及相加单元和/或窗口单元。
在本文档中概述的系统可以包括多个子带处理单元。每个子带处理单元可以被配置为使用不同的子带换位因数Q和/或不同的子带拉伸因数S来确定中间合成子带信号。该系统还可以包括:合并单元,其位于多个子带处理单元的下游和合成滤波器组的上游,合并单元被配置为将相应中间合成子带信号与合成子带信号合并。这样,该系统可以用来在仅使用单个分析/合成滤波器组对的情况下进行多个时间拉伸和/或频率换位操作。
该系统可以包括:核心解码器,其位于分析滤波器组的上游,核心解码器被配置为将位流解码为输入信号。该系统还可以包括:HFR处理单元,其位于合并单元的下游(如果存在这种合并单元)和合成滤波器组的上游。HFR处理单元可以被配置为对合成子带信号应用从位流得出的谱带信息。
根据另一方面,描述了一种机顶盒,用于对接收到的信号进行解码,接收到的信号至少包括音频信号的低频分量。该机顶盒可以包括根据在本文档中概述的方面和特征中的任意方面和特征的、用于根据音频信号的低频分量生成音频信号的高频分量的系统。
根据又一方面,描述一种根据输入信号生成时间拉伸和/或频率换位信号的方法。该方法特别良好地适合于增强时间拉伸和/或频率换位操作的瞬时响应。该方法可以包括根据输入信号提供分析子带信号的步骤,其中,分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值。
总得来说,该方法可以包括使用子带换位因数Q和子带拉伸因数S来根据分析子带信号确定合成子带信号的步骤。一般来说,Q或者S中的至少一个大于1。特别地,该方法可以包括从多个复值分析样本得出L个输入样本的帧的步骤,其中,帧长度L一般大于1。此外,可以在得出L个输入样本的接下来的帧之前,对多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧。另外,该方法可以包括根据输入样本的帧确定经处理的样本的帧的步骤。这可以通过以下方式进行:针对帧的每个经处理的样本,通过将相应的输入样本的相位进行偏移来确定经处理的样本的相位。可选地或者另外,针对帧的每个经处理的样本,可以基于相应输入样本的幅值和预定输入样本的幅值来确定经处理的样本的幅值。
该方法还可以包括通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号的步骤。最终,可以根据合成子带信号生成时间拉伸和/或频率换位信号。
根据另一方面,描述了一种根据输入信号生成时间拉伸和/或频率换位信号的方法。该方法特别良好地适合于改善与瞬态输入信号结合的时间拉伸和/或频率换位操作的性能。该方法可以包括接收控制数据的步骤,该控制数据反映输入信号的瞬间声学性质。该方法还可以包括根据输入信号提供分析子带信号的步骤,其中,分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值。
在下面的步骤中,可以使用子带换位因数Q、子带拉伸因数S和控制数据,根据分析子带信号确定合成子带信号。一般来说,Q或者S中的至少一个大于1。特别地,该方法可以包括从多个复值分析样本得出L个输入样本的帧的步骤,其中,帧长度L一般大于1,并且其中,根据控制数据设置帧长度L。此外,该方法可以包括在得出L个输入样本的接下来的帧之前对多个分析样本应用p个样本的块跳跃大小,以由此生成输入样本的一系列帧的步骤。随后,通过针对帧的每个经处理的样本,通过将相应输入样本的相位进行偏移以确定经处理的样本的相位,并且基于相应输入样本的幅值确定经处理的样本的幅值,来根据输入样本的帧确定经处理的样本的帧。
可以通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号,并且可以根据合成子带信号生成时间拉伸和/或频率换位信号。
根据又一方面,描述了一种根据输入信号生成时间拉伸和/或频率换位信号的方法。该方法可以特别良好地适合于使用单个分析/合成滤波器组对进行多个时间拉伸和/或频率换位操作。同时,该方法良好地适合于对瞬态输入信号进行处理。该方法可以包括根据输入信号提供第一和第二分析子带信号的步骤,其中,第一和第二分析子带信号各自包括多个复值分析样本,分别称为第一和第二分析样本,每个分析样本具有相位和幅值。
此外,该方法可以包括使用子带换位因数Q和子带拉伸因数S根据第一和第二分析子带信号确定合成子带信号的步骤,其中,Q或者S中的至少一个一般大于1。特别地,该方法可以包括从多个第一分析样本得出L个第一输入样本的帧的步骤,其中,帧长度L一般大于1。可以在得出L个第一输入样本的接下来的帧之前对多个第一分析样本应用p个样本的块跳跃大小,以由此生成第一输入样本的一系列帧。该方法还可以包括通过对多个第二分析样本应用块跳跃大小p来得出一系列第二输入样本的步骤,其中,每个第二输入样本对应于第一输入样本的帧。
该方法在根据第一输入样本的帧并且根据相应第二输入样本来确定经处理的样本的帧中进行。这可以通过以下方式进行:针对帧的每个经处理的样本,通过将相应的第一输入样本的相位进行偏移来确定经处理的样本的相位,并且基于相应第一输入样本的幅值和相应第二输入样本的幅值来确定经处理的样本的幅值。随后,可以通过将经处理的样本的一系列帧的样本进行重叠及相加来确定合成子带信号。最终,可以根据合成子带信号生成时间拉伸和/或频率换位信号。
根据另一方面,描述了软件程序。软件程序可以适合于在处理器上执行,并且当在计算设备上执行时用于进行本文档中概述的方法步骤和/或用于实现本文档中概述的方面和特征。
根据又一方面,描述了存储介质。存储介质可以包括软件程序,软件程序适合于在处理器上执行,并且当在计算设备上执行时用于进行本文档中概述的方法步骤和/或用于实现本文档中概述的方面和特征。
根据另一方面,描述了计算机程序产品。计算机程序产品可以包括可执行指令,当在计算机上执行时,可执行指令用于进行本文档中概述的方法步骤和/或用于实现本文档中概述的方面和特征。
根据一个实施例,提供一种子带处理单元,被配置为根据分析子带信号确定合成子带信号;其中,分析子带信号包括不同时刻的多个复值分析样本,每个复值分析样本具有相位和幅值;其中,分析子带信号与输入音频信号的频带相关联;其中,子带处理单元包括:块提取器,被配置为重复地根据多个复值分析样本得出L个输入样本的帧;帧长度L大于1;以及在得出L个输入样本的接下来的帧之前,对多个复值分析样本应用p个样本的块跳跃大小;由此生成L个输入样本的一系列帧;非线性帧处理单元,被配置为通过针对帧的每个经处理样本进行以下确定来根据输入样本的帧确定经处理样本的帧:基于相应输入样本的相位和预定输入样本的相位来确定经处理样本的相位;以及基于相应输入样本的幅值来确定经处理样本的幅值;以及重叠及相加单元,被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定合成子带信号;其中,分析子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联。
根据另一个实施例,提供一种生成合成子带信号的方法,合成子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联,方法包括:提供分析子带信号,分析子带信号与输入音频信号的频带相关联,其中,分析子带信号包括不同时刻的多个复值分析样本,每个复值分析样本具有相位和幅值;根据多个复值分析样本得出L个输入样本的帧;帧长度L大于1;在得出L个输入样本的接下来的帧之前,对多个复值分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;通过针对帧的每个经处理样本进行如下确定来根据输入样本的帧确定经处理样本的帧:基于相应输入样本的相位和预定输入样本的相位来确定经处理样本的相位;以及基于相应输入样本的幅值来确定经处理的样本的幅值;以及通过将经处理样本的一系列帧的样本进行重叠及相加来确定合成子带信号。
注意,如在本专利申请中概述的包括其优选实施例的方法和系统可以单独使用或者与在本文档中公开的其它方法和系统组合使用。此外,可以任意组合在本专利申请中概述的方法和系统的所有方面。特别地,权利要求的特征可以以任意方式彼此组合。
附图说明
现在将参考附图通过不限制本发明的范围或精神的说明性示例来描述本发明,在附图中:
图1示出了示例基于子带块的谐波换位的原理;
图2示出了具有一个子带输入的示例非线性子带块处理的操作;
图3示出了具有两个子带输入的示例非线性子带块处理的操作;
图4示出了在HFR增强音频编解码器中使用几个阶次的换位的基于子带块的换位的应用的示例场景;
图5示出了每个换位阶次应用单独的分析滤波器组的多阶基于子带块的换位的操作的示例场景;
图6示出了应用单个64带QMF分析滤波器组的多阶基于子带块的换位的有效操作的示例场景;以及
图7示出了示例音频信号的因数为2的基于子带块的时间拉伸的瞬时响应。
具体实施方式
下面描述的实施例仅仅是对用于改进的基于子带块的谐波换位的本发明的原理的说明。应当理解,这里描述的设置和细节的变型和变化对于本领域技术人员是显而易见。因此,旨在仅受所附专利权利要求的范围限定,而不受这里通过对实施例的描述和说明而呈现的具体细节限定。
图1示出了示例基于子带块的换位、时间拉伸或者换位和时间拉伸的组合的原理。将输入的时域信号馈送到提供大量或多个复值子带信号的分析滤波器组101。将该多个子带信号馈送到子带处理单元102,控制数据104可以影响子带处理单元102的操作。可以通过一个输入子带的处理或从两个输入子带,或者甚至通过对几个这种经处理的子带的结果的叠加,来获得子带处理单元102的每个输出子带。将该大量或多个复值输出子带馈送到合成滤波器组103,合成滤波器组103继而输出经修正的时域信号。控制数据104有助于提高特定信号类型的经修正时域信号的质量。控制数据104可以与时域信号相关联。特别地,控制数据104可以与馈送到分析滤波器组101中的时域信号的类型相关联,或者可以取决于馈送到分析滤波器组101中的时域信号的类型。举例来说,控制数据104可以指示时域信号或者时域信号的瞬间片段是否是平稳信号,或者时域信号是否是瞬态信号。
图2示出了具有一个子带输入的示例非线性子带块处理102的操作。给定物理时间拉伸和/或换位的目标值以及分析和合成滤波器组101和103的物理参数,针对也以称为合成子带的索引的每个目标子带索引,得出子带时间拉伸和换位参数以及也可以称为分析子带的索引的分析源子带索引。子带块处理的目的是实现复值源子带信号的相应的换位、时间拉伸或者换位和时间拉伸的组合,以生成目标子带信号。
在非线性子带块处理102中,块提取器201对来自复值输入信号的样本的有限帧进行采样。帧可以由输入指针位置和子带换位因数定义。该帧在非线性处理单元202中经过非线性处理,随后由203中的有限长度窗口进行加窗。窗口203例如可以是高斯窗口、余弦窗口、汉明(Hamming)窗口、汉(Hann)窗口、矩形窗口、巴特兰(Bartlett)窗口、布莱克曼(Blackman)窗口等。将获得的样本与重叠及相加单元204中的先前输出的样本相加,其中输出帧位置可以由输出指针位置定义。将输入指针增大固定量,该固定量也称为块跳跃大小,并且将输出指针增大相同量的子带拉伸因数倍,即,块跳跃大小乘以子带拉伸因数。该操作链的迭代将生成输出信号,该输出信号的持续时间是输入子带信号持续时间的子带拉伸因数倍(到合成窗口的长度为止)并且复频率以子带换位因数换位。
控制数据104可以对基于块的非线性处理102的处理块201、202、203、204中的任何处理块有影响。特别地,控制数据104可以控制在块提取器201中提取的块的长度。在实施例中,当控制数据104指示时域信号是瞬态信号时,块长度减小,而当控制数据104指示时域信号是平稳信号时,块长度增大或者保持在较长的长度。可选地或者另外,控制数据104可以影响非线性处理单元202,例如在非线性处理单元202内使用的参数和/或加窗单元203,例如在加窗单元203中使用的窗口。
图3示出了具有两个子带输入的示例非线性子带块处理102的操作。给定物理时间拉伸和换位的目标值以及分析和合成滤波器组101和103的物理参数,针对每个目标子带索引得出子带时间拉伸和换位参数以及两个源子带索引。子带块处理的目的是实现两个复值源子带信号的组合的相应换位、时间拉伸或换位和时间拉伸的组合,以生成目标子带信号。块提取器301-1对来自第一复值源子带的样本的有限帧进行采样,而块提取器301-2对来自第二复值源子带的样本的有限帧进行采样。在实施例中,块提取器301-1和301-2之一可以生成单个子带样本,即块提取器301-1、301-2之一可以对一个样本应用块长度。帧可以由公共输入指针位置和子带换位因数定义。在块提取器301-1、301-2中提取的两个帧分别帧在单元302中经过非线性处理。非线性处理单元302一般根据两个输入帧生成单个输出帧。随后,由单元203中的有限长度窗口对输出帧进行加窗。针对由使用块跳跃大小从两个子带信号中提取的一系列帧生成的一系列帧重复上述处理。在重叠及相加单元204中将该系列输出帧重叠并相加。该操作链的迭代将生成持续时间是两个输入子带信号中最长的输入子带信号的子带拉伸因数倍的输出信号(到合成窗口的长度为止)。在两个输入子带信号承载相同频率的情况下,输出信号将具有以子带换位因数换位的复频率。
如在图2的上下文中概述的,可以使用控制数据104来修正非线性处理102的不同块的操作,例如块提取器301-1、301-2的操作。此外,应注意,一般针对由分析滤波器组101提供的所有分析子带信号,并且针对输入到合成滤波器组103中的所有合成子带信号进行上述操作。
在下面的文本中,通过添加适当的数学术语,参考图1-3来概述对基于子带块的时间拉伸和换位的原理的描述。
总体谐波换位器和/或时间拉伸器的两个主要配置参数是:
·希望的物理时间拉伸因数;以及
·希望的物理换位因数。
滤波器组101和103可以是任意复指数调制类型的,例如QMF或者加窗的DFT或者小波变换。可以在调制中成偶数或奇数地堆叠分析滤波器组101和合成滤波器组103,并且可以根据宽范围的原型滤波器和/或窗口定义分析滤波器组101和合成滤波器组103。然而,所有这些二阶选择都影响后续设计中的诸如相位校正和子带映射管理的细节,一般可以从下面全部以物理单位测量的四个滤波器组参数的两个商ΔtS/ΔtA和ΔtS/ΔtA的获知来得出子带处理的主要系统设计参数。在上述商中,
·ΔtA是分析滤波器组101的子带样本时间步长或者时间跨步(例如以秒[s]为单位测量);
·ΔfA是分析滤波器组101的子带频率间隔(例如以赫兹[1/s]为单位测量);
·ΔtS是合成滤波器组103的子带样本时间步长或者时间跨步(例如以秒[s]为单位测量);以及
·ΔfS是合成滤波器组103的子带频率间隔(例如以赫兹[1/s]为单位测量)。
对于子带处理单元102的配置,应当计算以下参数:
·S:子带拉伸因数,即,为了实现对时域信号的倍的总体物理时间拉伸而在子带处理单元102内应用的拉伸因数;
·Q:子带换位因数,即,为了实现对时域信号的因数倍的总体物理频率换位而在子带处理单元102内应用的换位因数;以及
·源和目标子带索引之间的对应关系,其中,n表示进入子带处理单元102的分析子带的索引,m表示子带处理单元102的输出处的相应合成子带的索引。
为了确定子带拉伸因数S,观察到分析滤波器组101的物理持续时间为D的输入信号对应于子带处理单元102的输入处的数量D/ΔtA的分析子带样本。这D/ΔtA个样本将被应用子带拉伸因数S的子带处理单元102拉伸为S·D/ΔtA个样本。在合成滤波器组103的输出处,这S·D/ΔtA个样本产生物理持续时间为ΔtS·S·D/ΔtA的输出信号。由于这一在后的持续时间应当满足指定值即,由于时域输出信号的持续时间应当是与时域输入信号相比拉伸了物理时间拉伸因数的时间,因此获得下面的设计规则:
为了确定为实现物理换位而在子带处理单元102内应用的子带换位因数Q,观察到分析滤波器组101的物理频率为Ω的输入正弦波将产生具有离散时间频率ω=Ω·ΔtA的复分析子带信号,并且在索引为n≈Ω/ΔfA的分析子带内产生主要贡献。将通过向索引为的合成子带馈送具有离散频率的复子带信号而产生合成滤波器组103的输出处的希望的经换位的物理频率为的输出正弦波。在这种情境下,应当注意避免具有不同于的混杂输出频率的合成。一般来说,如所讨论的,这可以通过进行适当的二阶选择,例如通过选择适当的分析/合成滤波器组来避免。子带处理单元102的输出处的离散频率应当对应于子带处理单元102的输入处的离散时间频率ω=Ω·ΔtA乘以子带换位因数Q。即,通过设置相等的QΩΔtA和可以确定物理换位因数和子带换位因数Q之间的以下关系:
类似地,给定目标的子带处理单元102的适当的源或分析子带索引n或者合成子带索引m应当遵守
在实施例中,成立,即,合成滤波器组103的频率间隔对应于分析滤波器组101的频率间隔乘以物理换位因数,并且可以应用分析到合成子带索引的一对一映射n=m。在其它实施例中,子带索引映射可以依赖于滤波器组参数的细节。特别地,如果合成滤波器组103和分析滤波器组101的频率间隔的分数不同于物理换位因数则可以对给定目标子带分配一个或两个源子带。在两个源子带的情况下,优选分别使用索引为n、n+1的两个相邻源子带。也就是说,由(n(m),n(m)+1)或者(n(m)+1,n(m))给定第一和第二源子带。
现在,将图2的使用单个源子带的子带处理描述为子带处理参数S和Q的函数。设x(k)是块提取器201的输入信号,并且设p是输出块跨步。即,x(k)是索引为n的分析子带的复值分析子带信号。在不失一般性的情况下,由块提取器201提取的块可以被认为由L=2R+1个样本定义
xl(k)=x(Qk+pl),|k|≤R, (4)
其中,整数l是块计数索引,L是块长度而R是R≥0的整数。注意,对于Q=1,从连续样本中提取块,而对于Q>1,以将输入地址拉伸因数Q的方式进行下采样。如果Q是整数,则一般直接进行该操作,而对于非整数值的Q,可能需要插值方法。该表述还与增量p,即输入块跨步的非整数值相关。在实施例中,可以对复值子带信号应用短插值滤波器,例如具有两个滤波器抽头的滤波器。例如,如果需要小数时间索引k+0.5处的样本,则x(k+0.5)≈ax(k)+bx(k+1)形式的2抽头插值可以获得足够的质量。
方程式(4)的令人感兴趣的特殊情况是R=0,其中,所提取的块由单个样本构成,即块长度L=1。
使用复数z=|z|exp(i∠z)的极坐标表示,其中,|z|是该复数的幅值,∠z是该复数的相位,由相位修正因数T=SQ通过下式有利地定义非线性处理单元202根据输入帧xl生成输出帧yl
其中,ρ∈[0,1]是几何幅值加权参数。情况ρ=0对应于所提取的块的纯相位修正。相位校正参数θ取决于滤波器组细节以及源和目标子带索引。在实施例中,可以通过扫描一组输入正弦波来试验地确定相位校正参数θ。此外,可以通过研究相邻目标子带复正弦波的相位差,或者通过优化输入信号的狄拉克(Dirac)脉冲类型的性能,来得出相位校正参数θ。相位修正因数T应当是整数,从而使方程式(5)的第一行中的相位的线性组合中系数T-1和1为整数。在这种假设下,即在相位修正因数T是整数的假设下,即使由于加上2π的任意整数倍而使相位不明确,也良好地定义非线性修正的结果。
换句话说,方程式(5)明确了通过将相应输入帧样本的相位偏移恒定偏移值,来确定输出帧样本的相位。该恒定偏移值可以取决于修正因数T,修正因数T本身取决于子带拉伸因数和/或子带换位因数。此外,恒定偏移值可以取决于来自输入帧的特定输入帧样本的相位。对于给定块的所有输出帧样本的相位的确定,该特定输入帧样本保持固定。在方程式(5)的情况下,使用输入帧的中心样本的相位作为特定输入帧样本的相位。另外,恒定偏移值可以取决于例如可以试验确定的相位校正参数θ。
方程式(5)的第二行明确了输出帧的样本的幅值可以取决于输入帧的相应样本的幅值。此外,输出帧的样本的幅值可以取决于特定输入帧样本的幅值。该特定输入帧样本可以用于所有输出帧样本的幅值的确定。在方程式(5)的情况下,使用输入帧的中心样本作为特定输入帧样本。在实施例中,输出帧的样本的幅值可以对应于输入帧的相应样本和特定输入帧样本的幅值的几何平均值。
在加窗单元203中,对输出帧应用长度为L的窗口w,得到加窗的输出帧
zl(k)=w(k)yl(k),|k|≤R。 (6)
最后,假设将所有帧拉伸了零,重叠及相加操作204由下式定义
其中,应注意,重叠及相加单元204应用块跨步Sp,即,比输入块跨步p大S倍的时间跨步。由于方程式(4)和(7)的时间跨步的该区别,输出信号z(k)的持续时间是输入信号x(k)的持续时间的S倍,即,与分析子带信号相比,合成子带信号被拉伸了子带拉伸因数S倍。应注意,如果与信号持续时间相比窗口的长度L可以忽略,则一般应用这种观察。
对于使用复正弦波作为到子带处理102的输入,即,分析子带信号对应于如下复正弦波的情况
x(k)=Cexp(iωk), (8)
可以通过应用方程式(4)-(7)来确定子带处理102的输出,即相应合成子带信号由下式给出
因此,假设对于所有k,跨步为Sp的窗口偏移的总和为同一恒定值K,则将具有离散时间频率ω的复正弦波变换为具有离散时间频率Qω的复正弦波,
考虑S=1并且T=Q的纯换位的特殊情况来进行说明。如果输入块跨步p=1并且R=0,则所有上述,即,明显地方程式(5)降低为逐点的(point-wise)或者基于样本的相位修正规则
当在分析子带信号x(k)内考虑正弦波之和时,使用块大小R>0的优点变得明显。对于频率为ω1,ω2,...,ωN的正弦波之和使用逐点规则(11)的问题在于,在子带处理102的输出中,即在合成子带信号z(k)内不仅呈现希望的频率Qω1,Qω2,...,QωN,还呈现形式的互调制产物频率。使用块R>0以及满足方程式(10)的窗口一般导致对这些互调制产物的抑制。另一方面,长块将导致瞬态信号的更大程度的不希望的时间拖尾。此外,对于脉冲序列状信号,例如元音情况下的人声或者单音调乐器,使用足够低的音调,互调制产物将是希望的,如在WO 2002/052545中描述的。该文献通过引用合并于此。
为了解决基于块的子带处理102对于瞬态信号的性能相对较差的问题,提出了在方程式(5)中使用非零值的几何幅值加权参数ρ>0。观察到(例如参见图7)与使用ρ=0的纯相位修正相比,几何幅值加权参数ρ>0的该选择改善了基于块的子带处理102的瞬时响应,同时保持了对平稳信号的足够力度的互调制失真抑制。特别有吸引力的幅值加权的值是ρ=1-1/T,对于该值,非线性处理方程式(5)简化为如下计算步骤
与从在方程式(5)中ρ=0的情况获得的纯相位调制的运算相比,这些计算步骤代表等同量的计算复杂度。换句话说,可以在计算复杂度上没有任何附加成本的情况下实现基于几何平均方程式(5)使用幅值加权ρ=1-1/T对输出帧样本的幅值的确定。同时,在保持针对平稳信号的性能的同时,针对瞬态信号的谐波换位器的性能得到了改善。
如在图1、2和3的情境下概述的,可以通过应用控制数据104来进一步增强子带处理102。在实施例中,可以使用在方程式(11)中共享相同的K值而利用不同的块长度的子带处理102的两种配置来实现信号自适应子带处理。设计切换子带处理单元的信号自适应配置的概念上的开始点可以是想像使用其输出处的选择器开关而并行运行的两种配置,其中,选择器开关的位置取决于控制数据104。K值的共享确保在单个复正弦波输入的情况下开关是无缝的。对于普通信号,由周围的滤波器组框架101、103自动对子带信号水平的硬开关进行加窗,从而不在最终输出信号上引入任何切换假象。可以示出,作为方程式(7)中的重叠及相加处理的结果,当块大小充分不同,并且控制数据的更新率不太块时,可以以使用最长块的配置的系统的计算成本再现与上述概念切换系统相同的输出。因此,在与信号自适应操作相关联的计算复杂度方面没有不利。根据上面的讨论,使用较短块长度的配置更适合于瞬态低音调周期信号,而使用较长块长度的配置更适合平稳信号。这样,可以使用信号分类器将音频信号的片段分类为瞬态类和非瞬态类,并且将该类信息作为控制数据104传递到信号自适应配置切换子带处理单元102。子带处理单元102可以使用控制数据104来设置某些处理参数,例如块提取器的块长度。
下面,将子带处理的描述拉伸到覆盖图3的具有两个子带输入的情况。仅描述对单个输入情况进行的修正。另外,对上面提供的信息进行参考。设x(k)是到第一块提取器301-1的输入子带信号,并且设是到第二块提取器301-2的输入子带信号。由方程式(4)定义由块提取器301-1提取的块,而由块提取器301-2提取的块由以下单子带样本构成
即,在所概述的实施例中,第一块提取器301-1使用块长度L,而第二块提取器301-2使用块长度1。在这种情况下,非线性处理302生成输出帧yl,其可以由下式定义
203和204中的其余处理与在单个输入情况的情境中描述的处理相同。换句话说,提出了用从相应其它分析子带信号中提取的单个子带样本替换方程式(5)的特定帧样本。
在实施例中,其中,合成滤波器组103的频率间隔ΔfS与分析滤波器组101的频率间隔ΔfA之比不同于希望的物理换位因数根据索引分别为n、n+1的两个分析子带确定索引为m的合成子带的样本是有利的。对于给定索引m,可以由通过对方程式(3)所给定的分析索引值n而获得的整数值取整(truncate)来给定相应的索引n。将分析子带信号之一,例如与索引n相对应的分析子带信号馈送到第一块提取器301-1中,将另一个分析子带信号,例如与索引n+1相对应的分析子带信号馈送到第二块提取器301-2中。基于这两个分析子带信号,根据上面概述的处理确定与索引m相对应的合成子带信号。相邻分析子带信号到两个块提取器301-1和301-2的分配可以基于在对方程式(3)的索引值取整时获得的余量,即,基于由方程式(3)给定的准确索引值与从方程式(3)获得的取整后的整数值n的差。如果余量大于0.5,则可以将与索引n相对应的分析子带信号分配给第二块提取器301-2,否则可以将该分析子带信号分配给第一块提取器301-1。
图4示出了在HFR增强音频编解码器中使用几个阶次的换位的基于子带块的换位的应用的示例场景。在核心解码器401处接收发送的位流,心解码器401以采样频率fs提供低带宽解码的核心信号。该低带宽解码的核心信号也可以称为音频信号的低频分量。可以通过复调制的32带QMF分析组402,之后通过64带QMF合成组(逆QMF)405,将该具有低采样频率fs的信号再采样为输出采样频率2fs。两个滤波器组402和405具有相同的物理参数ΔtS=ΔtA和ΔfS=ΔfA,HFR处理单元404一般使与低带宽核心信号相对应的未修正的较低子带通过。通过向64带QMF合成组405的较高子带馈送来自多重换位器单元403的输出带来获得输出信号的高频分量,来自多重换位器单元403的该输出带经过由HFR处理单元404进行的谱成形和修正。多重换位器403以经解码的核心信号作为输入,并且输出表示几个经换位的信号分量的叠加或组合的64QMF带分析的大量子带信号。换句话说,多重换位器403的输出处的信号应当对应于馈送到合成滤波器组103中的经换位的合成子带信号,在图4的情况下,合成滤波器组103由逆QMF滤波器组405表示。
在图5和6的情境下概述了多重换位器403的可能实现。多重换位器403的目的是,如果绕过了HFR处理404,则每个分量对应于核心信号的没有时间拉伸的整数物理换位(并且)。对于核心信号的瞬态分量,HFR处理有时能够补偿多重换位器403的不良瞬时响应,但是一般仅在多重换位器的瞬时响应本身令人满意的情况下才能够达到一贯的高质量。如在本文档中概述的,换位器控制信号104可以影响多重换位器403的操作,由此确保多重换位器403的令人满意的瞬时响应。可选地或者另外,上述几何加权方案(例如参见方程式(5)和/或方程式(14))可对改善谐波换位器403的瞬时响应做出贡献。
图5示出了每个换位阶次应用单独的分析滤波器组502-2、502-3、502-4的多阶的基于子带块的换位单元403的操作的示例场景。在所示出的示例中,要在以输出采样率2fs工作的64带QMF组的域中生成并传递三个换位阶次合并单元504选择来自每个换位因数分支的相关子带并将其组合为要馈送到HFR处理单元的单个大量QMF子带。
首先考虑的情况。目的具体是64带QMF分析502-2、子带处理单元503-2和64带QMF合成405的处理链产生并且(即没有拉伸)的物理换位。分别用图1的单元101、102和103标识这三个块,发现ΔtS/ΔtA=1/2并且ΔfS/ΔfA=2,使得方程式(1)-(3)产生下面针对子带处理单元503-2的规范。子带处理单元503-2需要进行S=2的子带拉伸、Q=1(即无)的子带换位,并且索引为n的源子带和索引为m的目标子带之间的对应关系由n=m(参见方程式(3))给定。
对于的情况,示例性系统包括采样率转换器501-3,采样率转换器501-3以因数3/2将输入采样率从fs下转换为2fs/3。目的具体是64带QMF分析502-3、子带处理单元503-3和64带QMF合成405的处理链产生并且(即没有拉伸)的物理换位。分别用图1的单元101、102和103标识上述这三个块,由于再采样而发现ΔtS/ΔtA=1/3并且ΔfS/ΔfA=3,使得方程式(1)-(3)提供下面针对子带处理单元503-3的规范。子带处理单元503-3需要进行S=3的子带拉伸、Q=1(即无)的子带换位,并且索引为n的源子带和索引为m的目标子带之间的对应关系由n=m(参见方程式(3))给定。
对于的情况,示例性系统包括采样率转换器501-4,采样率转换器501-4以因数2将输入采样率从fs下转换为fs/2。目的具体是64带QMF分析502-4、子带处理单元503-4和64带QMF合成405的处理链产生并且(即没有拉伸)的物理换位。分别用图1的单元101、102和103标识该处理链的这三个块,由于再采样而发现ΔtS/ΔtA=1/4并且ΔfS/ΔfA=4,使得方程式(1)-(3)提供下面针对子带处理单元503-4的规范。子带处理单元503-4需要进行S=4的子带拉伸、Q=1(即无)的子带换位,并且n的源子带和索引为m的目标子带之间的对应关系由n=m给定。
作为图5的示例性场景的结论,子带处理单元504-2至503-4全部进行纯子带信号拉伸,并且利用在图2的情境中描述的单输入非线性子带块处理。当存在时,控制信号104可以同时影响全部三个子带处理单元的操作。特别地,可以使用控制信号104,依据输入信号的片段的类型(瞬态或者非瞬态)同时在长块长度处理和短块长度处理之间进行切换。可选地或者另外,当三个子带处理单元504-2至504-4使用非零几何幅值加权参数ρ>0时,与ρ=0的情况相比,多重换位器的瞬时响应将得到改善。
图6示出了应用单个64带QMF分析滤波器组的多阶基于子带块的换位的有效操作的示例场景。事实上,由于采样率转换器501-3,即分数采样率转换,在图5中使用三个单独的QMF分析组和两个采样率转换器对于基于帧的处理产生了相当高的计算复杂度以及一些实现不利因素。因此,提出了与图5相比分别用子带处理单元603-3和603-4代替包括单元501-3→502-3→503-3和501-4→502-4→503-4的两个换位分支,而分支502-2→503-2保持不变。在参考图1的滤波器组域中进行所有三个阶次的换位,其中,ΔtS/ΔtA=1/2并且ΔfS/ΔfA=2。换句话说,仅使用单个分析滤波器组502-2和单个合成滤波器组405,由此降低了多重换位器的总体计算复杂度。
对于的情况,由方程式(1)-(3)给定的针对子带处理单元603-3的规范是子带处理单元603-3需要进行S=2的子带拉伸和Q=3/2的子带换位,并且索引为n的源子带和索引为m的目标子带之间的对应关系由n≈2m/3给定。对于的情况,由方程式(1)-(3)给定的针对子带处理单元603-4的规范是子带处理单元603-4需要进行S=2的子带拉伸和Q=2的子带换位,并且索引为n的源子带和索引为m的目标子带之间的对应关系由n≈2m给定。
可以看出,方程式(3)不一定针对索引为m的目标子带提供整数取值的索引n。这样,如上面(使用方程式(14))所概述的,对于目标子带的确定考虑两个相邻的源子带可能是有利的。特别地,这对于的索引为m的目标子带能是有利的,其中对于该目标子带方程式(3)为索引n提供非整数值。另一方面,可以根据索引为n的单个源子带(使用方程式(5))确定索引为m的目标子带,其中对于该目标子带方程式(3)为索引n提供整数值。换句话说,提出了使用两者都利用如在图3的情境中概述的具有两个子带输入的非线性子带块处理的子带处理单元603-3和603-4,可以实现足够高质量的谐波换位。此外,当存在时,控制信号104可以同时影响全部三个子带处理单元的操作。可选地或者另外,当三个单元503-2、603-3、603-4使用非零几何幅值加权参数ρ>0时,与ρ=0的情况相比,多重换位器的瞬时响应可以得到改善。
图7示出了因数为2的基于子带块的时间拉伸的示例瞬时响应。顶部面板描绘了作为以16KHz采样的响板打击的输入信号。使用64带QMF分析滤波器组101和64带QMF合成滤波器组103,设计了基于图1的结构的系统。子带处理单元102被配置为实现因数S=2的子带拉伸,没有子带换位(Q=1)以及源到目标子带的直接一对一映射。分析块跨步是p=1,块大小半径是R=7,因此块长度是L=15个子带样本,其对应于15·64=960个信号域(时域)样本。窗口w是升余弦,例如提高到2次方的余弦。图7的中间面板描绘了在子带处理单元102应用纯相位修正,即,将加权参数ρ=0用于根据方程式(5)的非线性块处理时的时间拉伸的输出信号。底部面板描绘了在将几何幅值加权参数ρ=1/2用于根据方程式(5)的非线性块处理时,时间拉伸的输出信号。可以看出,在后者的情况下,瞬时响应明显更好。特别地,可以看出,使用加权参数ρ=0的子带处理产生了假象701,其中在使用加权参数ρ=1/2的子带处理的情况下,假象701显著减小(参看附图标记702)。
在本文档中,描述了用于基于谐波换位的HFR和/或用于时间拉伸的方法和系统。与传统的基于谐波换位的HFR相比,可以以显著降低的计算复杂度实现该方法和系统,同时针对平稳信号以及针对瞬态信号提供高质量的谐波换位。所描述的基于谐波换位的HFR利用基于块的非线性子带处理。提出了使用依赖于信号的控制数据,来使非线性子带处理适应信号的类型,例如瞬态或者非瞬态。此外,提出了使用几何加权参数以改善使用基于块的非线性子带处理的谐波换位的瞬时响应。最后,描述了用于基于谐波换位的HFR的低复杂度方法和系统,其使用单个分析/合成滤波器组对用于谐波换位和HFR处理。可以在各种解码设备中,例如在多媒体接收器、视频/音频机顶盒、移动设备、音频播放器、视频播放器等中利用所概述的方法和系统。
可以作为软件、固件和/或硬件来实现在本文档中描述的用于换位和/或高频重建和/或时间拉伸的方法和系统。例如,可以作为在数字信号处理器或者微处理器上运行的软件来实现某些部件。例如,可以作为硬件和/或作为专用集成电路来实现其它部件。可以将在所描述的方法和系统中遇到的信号存储在诸如随机存取存储器或光存储介质的介质上。可以经由诸如无线电网络、卫星网络、无线网络或者有线网络的网络,例如因特网来传输这些信号。使用在本文档中描述的方法和系统的典型设备是便携式电子设备或者其它用来存储和/或呈现音频信号的消耗设备。也可以在存储和提供音频信号,例如音乐信号以供下载的计算机系统,例如因特网web服务器上使用该方法和系统。
本发明还包括如下实施例:
实施例1.一种被配置为根据输入信号生成时间拉伸信号和/或频率换位信号的系统,所述系统包括:
分析滤波器组(101),被配置为根据所述输入信号提供分析子带信号;其中,所述分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
子带处理单元(102),被配置为使用子带换位因数Q和子带拉伸因数S根据所述分析子带信号确定合成子带信号;Q或者S中的至少一个大于1;其中,所述子带处理单元(102)包括:
块提取器(201),被配置为
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;以及
在得出L个输入样本的接下来的帧之前,对所述多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;
非线性帧处理单元(202),被配置为通过针对所述帧的每个经处理样本进行以下确定来根据输入样本的帧确定经处理样本的帧:
通过将相应输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值和预定输入样本的幅值来确定所述经处理样本的幅值;以及
重叠及相加单元(204),被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
合成滤波器组(103),被配置为根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例2.根据实施例1所述的系统,其中所述分析滤波器组(101)是正交镜像滤波器组、加窗离散傅立叶变换或者小波变换之一;并且其中所述合成滤波器组(103)是相应逆滤波器组或变换。
实施例3.根据实施例2所述的系统,其中,
所述分析滤波器组(101)是64点正交镜像滤波器组;并且
所述合成滤波器组(103)是逆64点正交镜像滤波器组。
实施例4.根据前述实施例中的任一项所述的系统,其中,
所述分析滤波器组(101)对所述输入信号应用分析时间跨步ΔfA;
所述分析滤波器组(101)具有分析频率间隔ΔfA;
所述分析滤波器组(101)具有数量N个分析子带,其中,N>1,并且n是分析子带索引,其中n=0,...,N-1;
所述N个分析子带中的分析子带与所述输入信号的频带相关联;
所述合成滤波器组(103)对所述合成子带信号应用合成时间跨步ΔtS;
所述合成滤波器组(103)具有合成频率间隔ΔfS;
所述合成滤波器组(103)具有数量M个合成子带,其中,M>1,并且m是合成子带索引,其中m=0,...,M-1;以及
所述M个合成子带中的合成子带与所述时间拉伸信号和/或频率换位信号的频带相关联。
实施例5.根据实施例4所述的系统,其中,
所述系统被配置为生成以物理时间拉伸因数进行了时间拉伸的信号和/或以物理频率换位因数进行了频率换位的信号;
所述子带拉伸因数由给定;
所述子带换位因数由给定;以及
与所述分析子带信号相关联的所述分析子带索引n和与所述合成子带信号相关联的所述合成子带索引m以相关。
实施例6.根据前述实施例中的任一项所述的系统,其中,所述块提取器(201)被配置为以所述子带换位因数Q对所述多个分析样本进行下采样。
实施例7.根据前述实施例中的任一项所述的系统,其中,所述块提取器(201)被配置为对两个或更多个分析样本进行插值以得出输入样本。
实施例8.根据前述实施例中的任一项所述的系统,其中,所述非线性帧处理单元(202)被配置为将所述经处理样本的幅值确定为所述相应输入样本的幅值与所述预定输入样本的幅值的平均值。
实施例9.根据实施例8所述的系统,其中,所述非线性帧处理单元(202)被配置为将所述经处理样本的幅值确定为所述相应输入样本的幅值与所述预定输入样本的幅值的几何平均值。
实施例10.根据实施例9所述的系统,其中,所述几何平均值被确定为所述相应输入样本提高到(1-ρ)次方的幅值乘以所述预定输入样本提高到ρ次方的幅值,其中,几何幅值加权参数ρ∈(0,1]。
实施例11.根据实施例10所述的系统,其中,所述几何幅值加权参数ρ是所述子带换位因数Q和所述子带拉伸因数S的函数。
实施例12.根据实施例11所述的系统,其中,所述几何幅值加权参数
实施例13.根据前述实施例中的任一项所述的系统,其中,所述非线性帧处理单元(202)被配置为根据所述输入样本的帧、所述换位因数Q和所述子带拉伸因数S,通过将所述相应输入样本的相位偏移相移值来确定所述经处理样本的相位,所述相移值基于所述预定输入样本。
实施例14.根据实施例13所述的系统,其中,所述相移值基于所述预定输入样本乘以(QS-1)。
实施例15.根据实施例14所述的系统,其中,所述相移值由所述预定输入样本乘以(QS-1)加相位校正参数θ来给定。
实施例16.根据实施例15所述的系统,其中,针对具有特定声学性质的多个输入信号,通过试验确定所述相位校正参数θ。
实施例17.根据前述实施例中的任一项所述的系统,其中,对于所述帧的每个经处理样本,所述预定输入样本是相同的。
实施例18.根据前述实施例中的任一项所述的系统,其中,所述预定输入样本是所述输入样本的帧的中心样本。
实施例19.根据前述实施例中的任一项所述的系统,其中,所述重叠及相加单元(204)对经处理样本的随后帧应用跳跃大小,所述跳跃大小等于所述块跳跃大小p乘以所述子带拉伸因数S。
实施例20.根据前述实施例中的任一项所述的系统,其中,所述子带处理单元(102)还包括:
加窗单元(203),其位于所述重叠及相加单元(204)上游,并且被配置为对所述经处理样本的帧应用窗口函数。
实施例21.根据实施例20所述的系统,其中所述窗口函数具有对应于所述帧长度L的长度;并且其中所述窗口函数是如下函数之一:
高斯窗口;
余弦窗口;
升余弦窗口;
汉明窗口;
汉窗口;
矩形窗口;
巴特兰窗口;
布莱克曼窗口。
实施例22.根据实施例20至21中的任一项所述的系统,其中所述窗口函数包括多个窗口样本;并且其中多个窗口函数的以跳跃大小Sp偏移的重叠及相加的窗口样本以显著恒定值K提供一系列样本。
实施例23.根据前述实施例中的任一项所述的系统,其中,
所述分析滤波器组(101)被配置为生成多个分析子带信号;
所述子带处理单元(102)被配置为根据所述多个分析子带信号确定多个合成子带信号;并且
所述合成滤波器组(103)被配置为根据所述多个合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例24.根据前述实施例中的任一项所述的系统,还包括:控制数据接收单元,被配置为接收控制数据(104),所述控制数据(104)反映所述输入信号的瞬间声学性质;其中所述子带处理单元(102)被配置为通过考虑所述控制数据(104)来确定所述合成子带信号。
实施例25.根据实施例24所述的系统,其中,所述块提取器(102)被配置为根据所述控制数据(104)设置所述帧长度L。
实施例26.根据实施例25所述的系统,其中,
如果所述控制数据(104)反映瞬态信号,则设置短帧长度L;以及
如果所述控制数据(104)反映平稳信号,则设置长帧长度L。
实施例27.根据实施例24至26中的任一项所述的系统,还包括:
信号分类器,被配置为分析所述输入信号的所述瞬间声学性质,以及设置反映所述瞬间声学性质的所述控制数据(104)。
实施例28.根据前述实施例中的任一项所述的系统,其中,
所述分析滤波器组(101)被配置为根据所述输入信号提供第二分析子带信号;其中,所述第二分析子带信号:
与所述输入信号的不同于所述分析子带信号的频带相关联;并且包括多个复值第二分析样本;
所述子带处理单元(102)还包括:
第二块提取器(301-2),被配置为通过对所述多个第二分析样本应用所述块跳跃大小p来得出一系列第二输入样本;其中每个第二输入样本对应于输入样本的帧;
第二非线性帧处理单元(302),被配置为根据输入样本的帧以及根据相应第二输入样本,通过针对所述帧的每个第二经处理样本进行如下确定来确定第二经处理的样本的帧:
通过将所述相应输入样本的相位偏移相移值来确定所述第二经处理样本的相位,所述相移值基于所述相应第二输入样本、所述换位因数Q和所述子带拉伸因数S;
基于所述相应输入样本的幅值和所述相应第二输入样本的幅值确定所述第二经处理样本的幅值。
实施例29.根据返回引用实施例5的实施例28所述的系统,其中,
如果是整数值n,则基于所述经处理样本的帧确定所述合成子带信号;以及
如果是非整数,其中,n是最接近的整数值,则基于所述第二经处理样本的帧确定所述合成子带信号;其中,所述第二分析子带信号与所述分析子带索引n+1或n-1相关联。
实施例30.一种被配置为根据输入信号生成时间拉伸信号和/或频率换位信号的系统,所述系统包括:
控制数据接收单元,被配置为接收控制数据(104),所述控制数据(104)反映所述输入信号的瞬间声学性质;
分析滤波器组(101),被配置为根据所述输入信号提供分析子带信号;其中所述分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
子带处理单元(102),被配置为使用子带换位因数Q、子带拉伸因数S和所述控制数据(104),根据所述分析子带信号确定合成子带信号;Q或者S中的至少一个大于1;其中所述子带处理单元(102)包括:
块提取器(201),被配置为:
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;其中所述块提取器(201)被配置为根据所述控制数据(104)设置所述帧长度L;以及
在得出L个输入样本的接下来的帧之前,对所述多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;
非线性帧处理单元(202),被配置为通过针对帧的每个经处理样本进行如下确定来根据输入样本的帧确定经处理样本的帧:
通过将相应输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值确定所述经处理样本的幅值;以及
重叠及相加单元(204),被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
合成滤波器组(103),被配置为根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例31.一种被配置为根据输入信号生成时间拉伸信号和/或频率换位信号的系统,所述系统包括:
分析滤波器组(101),被配置为根据所述输入信号提供第一和第二分析子带信号;其中,所述第一和第二分析子带信号各自包括多个复值分析样本,分别称为第一和第二分析样本,每个分析样本具有相位和幅值;
子带处理单元(102),被配置为使用子带换位因数Q和子带拉伸因数S根据所述第一和第二分析子带信号确定合成子带信号;Q或者S中的至少一个大于1;其中所述子带处理单元(102)包括:
第一块提取器(301-1),被配置为:
根据所述多个第一分析样本得出L个第一输入样本的帧;帧长度L大于1;以及
在得出L个第一输入样本的接下来的帧之前,对所述多个第一分析样本应用p个样本的块跳跃大小;由此生成第一输入样本的一系列帧;
第二块提取器(301-2),被配置为通过对所述多个第二分析样本应用所述块跳跃大小p来得出一系列第二输入样本;其中每个第二输入样本对应于第一输入样本的帧;
非线性帧处理单元(302),被配置为根据第一输入样本的帧并且根据相应第二输入样本,通过针对帧的每个经处理样本进行如下确定来确定经处理样本的帧:
通过将相应第一输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应第一输入样本的幅值和所述相应第二输入样本的幅值来确定所述经处理样本的幅值;以及
重叠及相加单元(204),被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;其中,所述重叠及相加单元(204)对经处理样本的随后帧应用跳跃大小,所述跳跃大小等于所述块跳跃大小p乘以所述子带拉伸因数S;以及
合成滤波器组(103),被配置为根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例32.根据实施例31所述的系统,其中,所述非线性帧处理单元(302)被配置为通过将所述相应第一输入样本的相位偏移相移值来确定所述经处理样本的相位,所述相移值基于所述相应第二输入样本、所述换位因数Q和所述子带拉伸因数S。
实施例33.根据前述实施例中的任一项所述的系统,还包括:
多个子带处理单元(503-2、603-3、603-4),每个子带处理单元(503-2、603-3、603-4)被配置为使用不同的子带换位因数Q和/或不同的子带拉伸因数S确定中间合成子带信号;以及
合并单元(504),其位于所述多个子带处理单元(503-2、603-3、603-4)的下游和所述合成滤波器组(103)的上游,所述合并单元(504)被配置为将相应中间合成子带信号合并到所述合成子带信号。
实施例34.根据实施例33所述的系统,还包括:
核心解码器(401),其位于所述分析滤波器组(101)的上游,并且被配置为将位流解码为所述输入信号;以及
HFR处理单元(404),其位于所述合并单元(504)的下游和所述合成滤波器组(103)的上游,所述HFR处理单元(404)被配置为对所述合成子带信号应用根据所述位流得出的谱带信息。
实施例35.一种机顶盒,用于对接收到的信号进行解码,所述接收到的信号至少包括音频信号的低频分量,所述机顶盒包括:
根据实施例1至34中的任一项所述的系统,用于根据所述音频信号的所述低频分量生成所述音频信号的高频分量。
实施例36.一种根据输入信号生成时间拉伸信号和/或频率换位信号的方法,所述方法包括:
根据所述输入信号提供分析子带信号;其中所述分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;
在得出L个输入样本的接下来的帧之前,对所述多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;
通过针对帧的每个经处理样本进行如下确定来根据输入样本的帧确定经处理样本的帧:
通过将相应输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值和预定输入样本的幅值来确定所述经处理的样本的幅值;以及
通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例37.一种根据输入信号生成时间拉伸信号和/或频率换位信号的方法,所述方法包括:
接收控制数据(104),所述控制数据(104)反映所述输入信号的瞬间声学性质;
根据所述输入信号提供分析子带信号;其中所述分析子带信号包括多个复值分析样本,每个复值分析样本具有相位和幅值;
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;其中,根据所述控制数据(104)设置所述帧长度L;
在得出L个输入样本的接下来的帧之前,对所述多个分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;
通过针对所述帧的每个经处理样本进行如下确定来根据输入样本的帧确定经处理的样本的帧:
通过将相应输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值来确定所述经处理的样本的幅值;以及
通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例38.一种根据输入信号生成时间拉伸信号和/或频率换位信号的方法,所述方法包括:
根据所述输入信号提供第一和第二分析子带信号;其中所述第一和第二分析子带信号各自包括多个复值分析样本,分别称为第一和第二分析样本,每个分析样本具有相位和幅值;
根据所述多个第一分析样本得出L个第一输入样本的帧;帧长度L大于1;
在得出L个第一输入样本的接下来的帧之前,对所述多个第一分析样本应用p个样本的块跳跃大小;由此生成第一输入样本的一系列帧;
通过对所述多个第二分析样本应用所述块跳跃大小p来得出一系列第二输入样本;其中每个第二输入样本对应于第一输入样本的帧;
根据第一输入样本的帧并且根据相应第二输入样本,通过针对帧的每个经处理的样本进行如下确定来确定经处理样本的帧:
通过将相应第一输入样本的相位进行偏移来确定所述经处理样本的相位;以及
基于所述相应第一输入样本的幅值和所述相应第二输入样本的幅值确定所述经处理的样本的幅值;
通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;以及
根据所述合成子带信号生成所述时间拉伸信号和/或频率换位信号。
实施例39.一种软件程序,适合于在处理器上执行,并且当在计算设备上执行时,所述软件程序用于进行根据实施例36至38中的任一项所述的方法步骤。
实施例40.一种存储介质,包括软件程序,所述软件程序适合于在处理器上执行,当在计算设备上执行时,所述软件程序用于进行根据实施例36至38中的任一项所述的方法步骤。
实施例41.一种计算机程序产品,包括可执行指令,当在计算机上执行时,所述可执行指令用于进行根据实施例36至38中的任一项所述的方法。
Claims (18)
1.一种子带处理单元,被配置为根据分析子带信号确定合成子带信号;其中,所述分析子带信号包括不同时刻的多个复值分析样本,每个复值分析样本具有相位和幅值;其中,所述分析子带信号与输入音频信号的频带相关联;其中,所述子带处理单元包括:
块提取器,被配置为重复地
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;以及
在得出L个输入样本的接下来的帧之前,对所述多个复值分析样本应用p个样本的块跳跃大小;由此生成L个输入样本的一系列帧;
非线性帧处理单元,被配置为通过针对所述帧的每个经处理样本进行以下确定来根据输入样本的帧确定经处理样本的帧:
基于相应输入样本的相位和预定输入样本的相位来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值来确定所述经处理样本的幅值;以及
重叠及相加单元,被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号;其中,所述分析子带信号与关于所述输入音频信号被时间拉伸和/或频率换位的信号的频带相关联。
2.根据权利要求1所述的子带处理单元,其中,所述块提取器被配置为以子带换位因数Q对所述多个复值分析样本进行下采样。
3.根据前述权利要求中的任一项所述的子带处理单元,其中,所述块提取器被配置为对两个或更多个复值分析样本进行插值以得出输入样本。
4.根据权利要求1或2所述的子带处理单元,其中,所述非线性帧处理单元被配置为将所述经处理样本的幅值确定为所述相应输入样本的幅值与预定输入样本的幅值的平均值。
5.根据权利要求4所述的子带处理单元,其中,所述非线性帧处理单元被配置为将所述经处理样本的幅值确定为所述相应输入样本的幅值与所述预定输入样本的幅值的几何平均值。
6.根据权利要求5所述的子带处理单元,其中,所述几何平均值被确定为所述相应输入样本提高到(1-ρ)次方的幅值乘以所述预定输入样本提高到ρ次方的幅值,其中,几何幅值加权参数ρ∈(0,1]。
7.根据权利要求6所述的子带处理单元,其中,所述几何幅值加权参数ρ是子带换位因数Q和子带拉伸因数S的函数。
8.根据权利要求7所述的子带处理单元,其中,所述几何幅值加权参数
9.根据权利要求1或2所述的子带处理单元,其中,所述非线性帧处理单元被配置为通过将所述相应输入样本的相位偏移相移值来确定所述经处理样本的相位,所述相移值基于预定输入样本的相位、换位因数Q和子带拉伸因数S。
10.根据权利要求9所述的子带处理单元,其中,所述相移值基于所述预定输入样本的相位乘以(QS-1)。
11.根据权利要求10所述的子带处理单元,其中,所述相移值由所述预定输入样本的相位乘以(QS-1)加相位校正参数θ来给定。
12.根据权利要求11所述的子带处理单元,其中,针对具有特定声学性质的多个输入信号,通过试验确定所述相位校正参数θ。
13.根据权利要求4所述的子带处理单元,其中,对于所述帧的每个经处理样本,所述预定输入样本是相同的。
14.根据权利要求13所述的子带处理单元,其中,所述预定输入样本是所述输入样本的帧的中心样本。
15.根据权利要求1或2所述的子带处理单元,其中,所述重叠及相加单元对经处理样本的随后帧应用跳跃大小,所述跳跃大小等于所述块跳跃大小p乘以子带拉伸因数S。
16.根据权利要求1或2所述的子带处理单元,其中,所述子带处理单元还包括:
加窗单元,其位于所述重叠及相加单元上游,并且被配置为对所述经处理样本的帧应用窗口函数。
17.根据权利要求1或2所述的子带处理单元,其中,
所述子带处理单元被配置为根据多个分析子带信号确定多个合成子带信号;
所述多个分析子带信号与所述输入音频信号的多个频带相关联;并且
所述多个合成子带信号与关于所述输入音频信号被时间拉伸和/或频率换位的所述信号的多个频带相关联。
18.一种生成合成子带信号的方法,所述合成子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联,所述方法包括:
提供分析子带信号,所述分析子带信号与所述输入音频信号的频带相关联,其中,所述分析子带信号包括不同时刻的多个复值分析样本,每个复值分析样本具有相位和幅值;
根据所述多个复值分析样本得出L个输入样本的帧;帧长度L大于1;
在得出L个输入样本的接下来的帧之前,对所述多个复值分析样本应用p个样本的块跳跃大小;由此生成输入样本的一系列帧;
通过针对帧的每个经处理样本进行如下确定来根据输入样本的帧确定经处理样本的帧:
基于相应输入样本的相位和预定输入样本的相位来确定所述经处理样本的相位;以及
基于所述相应输入样本的幅值来确定所述经处理的样本的幅值;以及
通过将经处理样本的一系列帧的样本进行重叠及相加来确定所述合成子带信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29624110P | 2010-01-19 | 2010-01-19 | |
US61/296,241 | 2010-01-19 | ||
US33154510P | 2010-05-05 | 2010-05-05 | |
US61/331,545 | 2010-05-05 | ||
CN201180006569.3A CN102741921B (zh) | 2010-01-19 | 2011-01-05 | 改进的基于子带块的谐波换位 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180006569.3A Division CN102741921B (zh) | 2010-01-19 | 2011-01-05 | 改进的基于子带块的谐波换位 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104318930A CN104318930A (zh) | 2015-01-28 |
CN104318930B true CN104318930B (zh) | 2017-09-01 |
Family
ID=43531026
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410461177.1A Active CN104318930B (zh) | 2010-01-19 | 2011-01-05 | 子带处理单元以及生成合成子带信号的方法 |
CN201410460670.1A Active CN104318928B (zh) | 2010-01-19 | 2011-01-05 | 子带处理单元、生成合成子带信号的方法以及存储介质 |
CN201180006569.3A Active CN102741921B (zh) | 2010-01-19 | 2011-01-05 | 改进的基于子带块的谐波换位 |
CN201410461154.0A Active CN104318929B (zh) | 2010-01-19 | 2011-01-05 | 子带处理单元以及生成合成子带信号的方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410460670.1A Active CN104318928B (zh) | 2010-01-19 | 2011-01-05 | 子带处理单元、生成合成子带信号的方法以及存储介质 |
CN201180006569.3A Active CN102741921B (zh) | 2010-01-19 | 2011-01-05 | 改进的基于子带块的谐波换位 |
CN201410461154.0A Active CN104318929B (zh) | 2010-01-19 | 2011-01-05 | 子带处理单元以及生成合成子带信号的方法 |
Country Status (17)
Country | Link |
---|---|
US (10) | US8898067B2 (zh) |
EP (9) | EP3806096B1 (zh) |
JP (10) | JP5329717B2 (zh) |
KR (14) | KR20240121348A (zh) |
CN (4) | CN104318930B (zh) |
AU (1) | AU2011208899B2 (zh) |
BR (6) | BR122019025143B1 (zh) |
CA (9) | CA3074099C (zh) |
CL (1) | CL2012001990A1 (zh) |
ES (6) | ES2836756T3 (zh) |
MX (1) | MX2012007942A (zh) |
MY (2) | MY164396A (zh) |
PL (7) | PL3806096T3 (zh) |
RU (3) | RU2518682C2 (zh) |
SG (3) | SG10201408425QA (zh) |
UA (1) | UA102347C2 (zh) |
WO (1) | WO2011089029A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122019025143B1 (pt) | 2010-01-19 | 2021-01-19 | Dolby International Ab | método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
MX2013002876A (es) | 2010-09-16 | 2013-04-08 | Dolby Int Ab | Retransmision armonica basada en bloque de sub-banda mejorada de producto cruz. |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
JP2014041240A (ja) * | 2012-08-22 | 2014-03-06 | Pioneer Electronic Corp | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
CN106847297B (zh) * | 2013-01-29 | 2020-07-07 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
CN118262739A (zh) * | 2013-09-12 | 2024-06-28 | 杜比国际公司 | 基于qmf的处理数据的时间对齐 |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
EP2963645A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
WO2016180704A1 (en) | 2015-05-08 | 2016-11-17 | Dolby International Ab | Dialog enhancement complemented with frequency transposition |
TR201908841T4 (tr) * | 2015-09-22 | 2019-07-22 | Koninklijke Philips Nv | Ses sinyali işleme. |
TW202341126A (zh) | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
CN110892478A (zh) * | 2017-04-28 | 2020-03-17 | Dts公司 | 音频编解码器窗口和变换实现 |
KR102361987B1 (ko) | 2018-04-09 | 2022-02-14 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 신경망 매핑을 사용하는 hdr 이미지 표현 |
CN118782078A (zh) | 2018-04-25 | 2024-10-15 | 杜比国际公司 | 高频音频重建技术的集成 |
IL313348A (en) | 2018-04-25 | 2024-08-01 | Dolby Int Ab | Combining high-frequency restoration techniques with reduced post-processing delay |
CN114822572A (zh) * | 2022-04-18 | 2022-07-29 | 西北工业大学 | 一种低信噪比下基于滤波器组的语音增强方法 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
RU2256293C2 (ru) | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Усовершенствование исходного кодирования с использованием дублирования спектральной полосы |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3442974B2 (ja) | 1997-07-30 | 2003-09-02 | 本田技研工業株式会社 | 吸収式冷凍機の精留装置 |
US6266003B1 (en) * | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
AUPP829899A0 (en) * | 1999-01-27 | 1999-02-18 | Motorola Australia Pty Ltd | Method and apparatus for time-warping a digitised waveform to have an approximately fixed period |
SE0004818D0 (sv) | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
JP3848181B2 (ja) * | 2002-03-07 | 2006-11-22 | キヤノン株式会社 | 音声合成装置及びその方法、プログラム |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
TWI288915B (en) * | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
JP4227772B2 (ja) * | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
CA2399159A1 (en) * | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
EP1543307B1 (en) | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
RU2271578C2 (ru) * | 2003-01-31 | 2006-03-10 | Ооо "Центр Речевых Технологий" | Способ распознавания речевых команд управления |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
CN1875402B (zh) * | 2003-10-30 | 2012-03-21 | 皇家飞利浦电子股份有限公司 | 音频信号编码或解码 |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
JP2006070768A (ja) | 2004-09-01 | 2006-03-16 | Honda Motor Co Ltd | 蒸発燃料処理装置 |
WO2006049204A1 (ja) | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
US7472041B2 (en) | 2005-08-26 | 2008-12-30 | Step Communications Corporation | Method and apparatus for accommodating device and/or signal mismatch in a sensor array |
US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
JP4760278B2 (ja) * | 2005-10-04 | 2011-08-31 | 株式会社ケンウッド | 補間装置、オーディオ再生装置、補間方法および補間プログラム |
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
JP4693584B2 (ja) | 2005-10-18 | 2011-06-01 | 三洋電機株式会社 | アクセス制御装置 |
TWI311856B (en) | 2006-01-04 | 2009-07-01 | Quanta Comp Inc | Synthesis subband filtering method and apparatus |
KR100754220B1 (ko) | 2006-03-07 | 2007-09-03 | 삼성전자주식회사 | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8364497B2 (en) * | 2006-09-29 | 2013-01-29 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
DE602007001460D1 (de) | 2006-10-25 | 2009-08-13 | Fraunhofer Ges Forschung | Vorrichtung und verfahren zur erzeugung von audio-subband-werten und vorrichtung und verfahren zur erzeugung von zeit-domänen-audio-beispielen |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
JP2009116245A (ja) * | 2007-11-09 | 2009-05-28 | Yamaha Corp | 音声強調装置 |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
ES2372014T3 (es) * | 2008-07-11 | 2012-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. |
EP2291842B1 (en) * | 2008-07-11 | 2014-03-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal |
ES2904373T3 (es) | 2009-01-16 | 2022-04-04 | Dolby Int Ab | Transposición armónica mejorada de producto cruzado |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
TWI484481B (zh) * | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
BR122019025143B1 (pt) | 2010-01-19 | 2021-01-19 | Dolby International Ab | método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento |
JP2013153596A (ja) * | 2012-01-25 | 2013-08-08 | Hitachi Ulsi Systems Co Ltd | 充放電監視装置およびバッテリパック |
CN105700923A (zh) | 2016-01-08 | 2016-06-22 | 深圳市创想天空科技股份有限公司 | 安装应用程序的方法及系统 |
-
2011
- 2011-01-05 BR BR122019025143-6A patent/BR122019025143B1/pt active IP Right Grant
- 2011-01-05 CA CA3074099A patent/CA3074099C/en active Active
- 2011-01-05 EP EP20206463.0A patent/EP3806096B1/en active Active
- 2011-01-05 RU RU2012128847/08A patent/RU2518682C2/ru active
- 2011-01-05 CA CA3225485A patent/CA3225485A1/en active Pending
- 2011-01-05 BR BR122019025154-1A patent/BR122019025154B1/pt active IP Right Grant
- 2011-01-05 KR KR1020247025508A patent/KR20240121348A/ko active Search and Examination
- 2011-01-05 CN CN201410461177.1A patent/CN104318930B/zh active Active
- 2011-01-05 KR KR1020167027183A patent/KR101740912B1/ko active IP Right Grant
- 2011-01-05 SG SG10201408425QA patent/SG10201408425QA/en unknown
- 2011-01-05 KR KR1020177013777A patent/KR101783818B1/ko active IP Right Grant
- 2011-01-05 KR KR1020187013166A patent/KR101902863B1/ko active IP Right Grant
- 2011-01-05 PL PL20206463.0T patent/PL3806096T3/pl unknown
- 2011-01-05 CA CA2945730A patent/CA2945730C/en active Active
- 2011-01-05 EP EP22189443.9A patent/EP4120264B1/en active Active
- 2011-01-05 KR KR1020217041623A patent/KR102478321B1/ko active IP Right Grant
- 2011-01-05 AU AU2011208899A patent/AU2011208899B2/en active Active
- 2011-01-05 CA CA3107943A patent/CA3107943C/en active Active
- 2011-01-05 PL PL19175682T patent/PL3564955T3/pl unknown
- 2011-01-05 ES ES19175681T patent/ES2836756T3/es active Active
- 2011-01-05 ES ES19175682T patent/ES2841924T3/es active Active
- 2011-01-05 PL PL23190357.6T patent/PL4250290T3/pl unknown
- 2011-01-05 KR KR1020187027030A patent/KR101964179B1/ko active IP Right Grant
- 2011-01-05 BR BR122019025134-7A patent/BR122019025134B1/pt active IP Right Grant
- 2011-01-05 EP EP24193627.7A patent/EP4435779A3/en active Pending
- 2011-01-05 MY MYPI2012002842A patent/MY164396A/en unknown
- 2011-01-05 KR KR1020197008506A patent/KR102020334B1/ko active IP Right Grant
- 2011-01-05 PL PL19175681T patent/PL3564954T3/pl unknown
- 2011-01-05 KR KR1020207007483A patent/KR102198688B1/ko active IP Right Grant
- 2011-01-05 CA CA3200142A patent/CA3200142C/en active Active
- 2011-01-05 PL PL22189443.9T patent/PL4120264T3/pl unknown
- 2011-01-05 ES ES11700033T patent/ES2734179T3/es active Active
- 2011-01-05 ES ES22189443T patent/ES2955433T3/es active Active
- 2011-01-05 CA CA3038582A patent/CA3038582C/en active Active
- 2011-01-05 KR KR1020207037531A patent/KR102343135B1/ko active IP Right Grant
- 2011-01-05 KR KR1020137023416A patent/KR101663578B1/ko active IP Right Grant
- 2011-01-05 US US13/514,896 patent/US8898067B2/en active Active
- 2011-01-05 CA CA3008914A patent/CA3008914C/en active Active
- 2011-01-05 UA UAA201208556A patent/UA102347C2/ru unknown
- 2011-01-05 ES ES20206463T patent/ES2930203T3/es active Active
- 2011-01-05 CA CA2784564A patent/CA2784564C/en active Active
- 2011-01-05 CN CN201410460670.1A patent/CN104318928B/zh active Active
- 2011-01-05 ES ES22189432T patent/ES2955432T3/es active Active
- 2011-01-05 BR BR112012017651-0A patent/BR112012017651B1/pt active IP Right Grant
- 2011-01-05 KR KR1020197025724A patent/KR102091677B1/ko active IP Right Grant
- 2011-01-05 CA CA3166284A patent/CA3166284C/en active Active
- 2011-01-05 SG SG10202101744YA patent/SG10202101744YA/en unknown
- 2011-01-05 WO PCT/EP2011/050114 patent/WO2011089029A1/en active Application Filing
- 2011-01-05 KR KR1020127018729A patent/KR101343795B1/ko active IP Right Grant
- 2011-01-05 BR BR122019025131-2A patent/BR122019025131B1/pt active IP Right Grant
- 2011-01-05 EP EP22189432.2A patent/EP4120263B1/en active Active
- 2011-01-05 EP EP19175681.6A patent/EP3564954B1/en active Active
- 2011-01-05 CN CN201180006569.3A patent/CN102741921B/zh active Active
- 2011-01-05 JP JP2012547509A patent/JP5329717B2/ja active Active
- 2011-01-05 BR BR122020020536-9A patent/BR122020020536B1/pt active IP Right Grant
- 2011-01-05 EP EP23190357.6A patent/EP4250290B1/en active Active
- 2011-01-05 CN CN201410461154.0A patent/CN104318929B/zh active Active
- 2011-01-05 EP EP24193623.6A patent/EP4435778A3/en active Pending
- 2011-01-05 PL PL22189432.2T patent/PL4120263T3/pl unknown
- 2011-01-05 EP EP19175682.4A patent/EP3564955B1/en active Active
- 2011-01-05 PL PL11700033T patent/PL2526550T3/pl unknown
- 2011-01-05 EP EP11700033.1A patent/EP2526550B1/en active Active
- 2011-01-05 KR KR1020177027021A patent/KR101858948B1/ko active IP Right Grant
- 2011-01-05 MX MX2012007942A patent/MX2012007942A/es active IP Right Grant
- 2011-01-05 KR KR1020227043442A patent/KR102691176B1/ko active Application Filing
- 2011-01-05 SG SG2012045795A patent/SG182269A1/en unknown
-
2012
- 2012-07-18 CL CL2012001990A patent/CL2012001990A1/es unknown
-
2013
- 2013-07-24 JP JP2013153596A patent/JP5792234B2/ja active Active
-
2014
- 2014-01-13 RU RU2014100648A patent/RU2644527C2/ru active
- 2014-10-13 US US14/512,833 patent/US9431025B2/en active Active
-
2015
- 2015-08-05 JP JP2015154976A patent/JP6189376B2/ja active Active
-
2016
- 2016-08-02 US US15/226,272 patent/US9741362B2/en active Active
-
2017
- 2017-07-10 US US15/644,983 patent/US9858945B2/en active Active
- 2017-08-02 JP JP2017149826A patent/JP6426244B2/ja active Active
- 2017-11-27 US US15/822,305 patent/US10109296B2/en active Active
-
2018
- 2018-01-12 RU RU2018101155A patent/RU2665298C1/ru active
- 2018-09-19 US US16/135,284 patent/US10699728B2/en active Active
- 2018-10-24 JP JP2018200065A patent/JP6644856B2/ja active Active
-
2020
- 2020-01-08 JP JP2020001199A patent/JP6834034B2/ja active Active
- 2020-06-23 US US16/908,745 patent/US11341984B2/en active Active
- 2020-08-24 MY MYPI2020004336A patent/MY197452A/en unknown
-
2021
- 2021-02-03 JP JP2021015546A patent/JP7160968B2/ja active Active
-
2022
- 2022-05-23 US US17/751,214 patent/US11646047B2/en active Active
- 2022-10-13 JP JP2022164642A patent/JP7475410B2/ja active Active
-
2023
- 2023-03-30 US US18/192,982 patent/US11935555B2/en active Active
- 2023-12-20 US US18/390,953 patent/US20240127845A1/en active Pending
-
2024
- 2024-04-16 JP JP2024065878A patent/JP7522331B1/ja active Active
- 2024-07-11 JP JP2024111384A patent/JP7551023B1/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104318930B (zh) | 子带处理单元以及生成合成子带信号的方法 | |
RU2813317C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
RU2789688C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
RU2800676C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
RU2772356C2 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
AU2019240701B2 (en) | Improved Subband Block Based Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |