Nothing Special   »   [go: up one dir, main page]

CN1244904C - 声频信号编码方法和设备 - Google Patents

声频信号编码方法和设备 Download PDF

Info

Publication number
CN1244904C
CN1244904C CNB028015584A CN02801558A CN1244904C CN 1244904 C CN1244904 C CN 1244904C CN B028015584 A CNB028015584 A CN B028015584A CN 02801558 A CN02801558 A CN 02801558A CN 1244904 C CN1244904 C CN 1244904C
Authority
CN
China
Prior art keywords
signal
frequency range
noise
amplitude
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028015584A
Other languages
English (en)
Other versions
CN1462429A (zh
Inventor
R·陶里
S·L·J·D·E·范德帕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1462429A publication Critical patent/CN1462429A/zh
Application granted granted Critical
Publication of CN1244904C publication Critical patent/CN1244904C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

本发明涉及声频编码方法,尤其涉及一种有效的装置,利用这种装置从原始声频信号选出的可听到但感觉上关系不大的信息频段不需要被编码,而是可以用噪声填充参数来代替。相反,具有感觉上比较有关内容的那些信号频段被完全地编码。利用这种方式可以节省编码位,而没有在接收信号频谱中留下空白。本方法用这种方式避免令人烦恼的带宽切换人为产物。当利用对于表示每个频段内的信号显得太低的位预算进行全带宽声频信号编码时可能出现这种人为产物。因此,本方法允许增加编码声频带宽而没有引入令人烦恼的带宽切换人为产物。噪声填充参数是所谈到的频段内RMS信号值的一种量度,并在接收端通过一种解码算法将该参数用于指明在所谈到的频段中注入噪声的数量。

Description

声频信号编码方法和设备
技术领域
本发明涉及声频编码。
背景技术
在现有技术中,已经描述过许多语音和音乐编码技术。在用于声频编码的已知技术中,采用自适应位分配的声频编码系统是以变换为基础的。在这样的自适应位分配系统中,可编码带宽,假定可用位预算(bit budget)按照任何给定声频帧的声频信号中各段的频谱组成而改变。说到声频帧,是指一个特定的连续的声频块,例如,20ms的声频块。因为不可能找到对于所有的声频帧都是最佳的编码带宽的一个单值,所以在给定位速率上声频的质量方面,带宽切换逐帧出现。遗憾的是,编码带宽的切换经常可能引入令人烦恼的人为产物。
在一些现行的方案中,高位速率时,整个声频带宽(在此假定是22.04kHz,对应于44.1kHz的采样率)被编码和重建。然而,低位速率时,如果试图进行对整个带宽的编码,则畸变增加。在某点上,将声频带宽降低一定数量是明智的,尽管在有限的频率范围内,重新分配要编码的位,从而以较精确的方式降低带宽,并由此减少人为产物。例如,在MPEG-1层3编码器(MP3编码器)中,当所希望的位速率被降低到32 DBPS时,带宽被减半(减至大约11kHz)。当位速率不断降低时,AAC也有一项降低带宽的规定。这是通过利用分层的编码方法实现的,由此代表较高频率的层首先被降低。因而降低信号带宽在波形编码器中是一种通常采用的解决办法。
WO 97/31367(AT&T公司)公开了一种利用LPC(线性预测编码)和一个附加音调提取器的语音编码器对语音编码。利用一种变换编码器对残数顺序地编码。对残数编码可以出现这样的情况,即只有几位是有用的,某些变换系数根本得不到位,也就是被设置为零。在对残数编码时,对这种残数信息实施噪声填充,但是没有对所谈到的频带提供任何独立的可解码的信息,以便能够利用与对主要部分所用的特定的LPC编码方案不同的方案。而且,并不是相对于输入信号本身的电平系统地实施这种噪声填充算法,而只对残数实施,导致可变结果。
发明内容
本发明实施方案的一个目的是减少由于带宽切换问题产生的人为产物引入的问题,而并不将编码带宽限制到避免切换的人为产物所需要的安全保守值。
依据本发明的第一方面,提供一种对声频信号编码的方法,该方法包括:将信号划分成多个频段;将各个所划分的频段中的信号幅度与各自的阈值进行比较;和在优先级基础上对所划分的频段的信号编码,使得其中特定频段中的信号幅度超出其相应阈值最大数量的频段按照给定的编码方案进行编码,而对于其他的频段,有选择地分配噪声填充参数。
第一方面的方法具有特殊的优点,即不太重要(significant)频段的噪声填充可以按以下方式进行,即与重要频段所用的编码方案相对独立。换句话说,噪声填充原理可应用到大多数编码方法中。
本方法在每个时间帧固定位预算的编码方案中是特别有效的。在这样的情况下,用保留的几位按基于优先级的方式分配位预算,使得当太少的位保留以致于不能完全对整个声频带宽信号编码时,剩余的位被用于对那些未编码的和感觉上不大相关的频段提供噪声填充参数。
最好,对于给定频段的阈值稍微高于一个幅值,在此幅值之上,按照心理声学模型对于所谈到的频段,噪声对人耳是可感觉到的。
也可以设想其中某些位预算将是可变的方案,但其中只有那些具有幅值超出阈值大于预定量的频段才被编码。
因为任何心理声学模型只是一种平均收听者的听力表示,可以设想出高质量的方案,其中某些频段可被完全地编码,即使它们具有低于阈值的信号幅度电平。同样,在质量损失可接受的场合中可以实现许多有效的方案-在这种情况下,某些具有稍微在它们各自阈值电平以上的信号幅度的频段的编码可能是可接受的。因此,虽然上面提到的预定数量最好是零,但是它可以稍微正一点或负一点。
最好,对于给定频段的信号幅度未超出其各自的阈值预定数量的每个频段被分配单一噪声填充参数。
最好,噪声填充参数包括将插入到各自频段中的噪声的幅度的表示。
提供这样的与频段直接关联的幅度表示使得能够实施一种高效率的噪声填充操作,情况始终是这样,在此幅度表示在一个容易检索的位置上即在对于该频段的信号信息通常被找到的点上被编码。
最好,幅度表示包括表示在各自的频段上接收到的声频信号平均幅度的RMS值。
最好,对于被分配噪声填充参数的频段,噪声填充参数被编码并被提供在输出信号的位置中,否则已编码的信号信息将出现在这个位置上。
最好,与每个频段关联地提供一个标识符,以指明存在噪声填充参数还是已编码的信号信息。
最好,标识符是通常用于指明已编码信号信息中量化电平数目的一个参数。
如果标识符指明量化电平的零数目,则这可被解释成这样的含意,即对于各自的频段包括噪声填充参数而不是已编码的信号信息。
依据本发明的第二方面,提供一种对信号解码的方法,其中信号已被按照第一方面的方法进行编码,该解码方法包括:接收编码的声频信号:对于一个给定频段的编码信号,确定接收到的信号是否包括与给定频段内发送信号的幅度有关的已编码信号信息,或是否包括噪声填充参数;如果接收到的信号包括已编码信号信息,对该信息解码,以产生该频段的输出声频信号部分;如果接收到的信号包括噪声填充参数,通过将该频段的频率范围上的噪声信号输出到由噪声填充参数指明的幅度,合成该频段的输出声频信号部分。
依据第三方面,提供被安排用于对输入信号编码的声频编码设备,并包括:用于将信号划分成多个频段的划分装置;用于将各个频率划分频段中的信号的幅度与各自的阈值进行比较的比较装置;和用于在优先级基础上对所划分的频段的信号编码的编码器,使得其中特定频段中的信号的幅度超出其各自的阈值一个最大数量的频段被按照给定的编码方案进行编码,该设备的特征在于,对于其他的频段,有选择地分配噪声填充参数。
依据本发明的第四方面,提供用于对已编码声频信号解码的声频解码设备,该解码设备包括:用于接收已编码声频信号的接收装置;对于给定频段的编码信号,被安排用于确定接收到的信号是否包括与给定频段内发送信号幅度有关的已编码信号信息或是否包括噪声填充参数的处理装置;第一解码装置,用于在接收到的信号包括已编码信号信息时对信息解码,以产生该频段的输出声频信号部分;和第二解码装置,用于在接收到的信号包括噪声填充参数时通过将该频段的频率范围上的噪声信号输出到由噪声填充参数指明的幅度来合成该频段的输出声频信号部分。
依据本发明的第五方面,提供一种编码声频信号,其中该信号被划分成许多频段,第一多个所述频段包括按照给定的编码方案编码的已编码信号信息,而第二多个所述频段包括噪声填充参数。
依据本发明的第六方面,提供一种存储媒介,按照第五方面的已编码声频信号被存储在此存储媒介上。
附图说明
为了更好地理解本发明,并说明如何可以实施本发明的实施方案,将通过举例参考所附的附图,其中:
图1说明一个典型的声频分段的频率组成的时尚化的图形并且还示出了屏蔽阈值;
图2示出与图1相同的的信号,感觉上不太重要的频段用阴影线示出。
图3是说明依据本发明一种实施方案的声频编码方法的方框图;
图4是说明依据本发明一种实施方案的声频解码方法的方框图;和
图5是包括声频编码器和解码器的设备的简要方框图。
具体实施方式
参考图1,在此示出一种典型的声频段组成的时尚化图形,其中幅度a作为频率f的函数给出。在该图中的每个条表示总信号中的一个频段(或频率区(bin))。典型情况下,用于对声频信号编码的变换编码器按照这样的频段将接收到的声频信号划分。
虚曲线表示屏蔽阈值。这个屏蔽阈值表示可被引入声频信号而不使收听者注意到噪声并可通过制作心理声学模型来确定的量化噪声电平。
任何通常的编码方案将有特定的限制。例如,第一种编码方案可以取包括每个频段的整个信号并对每个频段分配可变的位数,以致完全地将该信号编码,具有最高幅度信号的频段被分配最多的位,而最低幅度信号被分配最少的位。另一种方案可以拥有总的固定位预算用于编码,并且可以首先将这些位分配给按照心理声学模型在感觉上是最重要的那些频段。
前一种编码方案具有的缺点在于位预算是可变的,对于有大量信号信息要传递的信号周期内,可能碰到位速率问题,同时对每个时间帧要发送的总信息可以感觉到非常宽的变化。在这方面,如果带宽限制被加到这样一种方案上,并且如果可分配到频段的不同的位是以最低到最高频率为基础进行的,则可能需要加上带宽限制,在图1中用垂直虚线表示这种情况。在此,对于所希望的位速率由于所有的频段不可能用足够的精确度进行编码,较高频率的信号已被删除。因此,在这条带宽限以外的所有频段根本不可能被编码,尽管它们中至少一个频段(图中标记为A)很清楚是在屏蔽阈值之上。
在某些现有的方案中,如果选择对图1的频段A编码,则编码带宽将必须即刻切换到较高值。然而,这是不可接受的,它将与前面的帧中所用的带宽发生冲突,从而引起切换的人为产物。
在两个提到的编码方案的第二方案中,根据优先级对许多声音上可感觉到的频段的编码,在某些情况下,导致一个或多个不太重要的频段(在图2中用阴影线示出的那些频段)没有位分配给它们。然而,没有位分配给某些频段意味着频谱的某些部分根本不包含任何能量,在频谱中的这些空白可能产生被收听者作为刺耳的声音感觉到的信号,它也将引起带宽切换的人为产物,因为接收能量的最高频段可能逐帧变化。
依据本发明的方法,在所提议的编码方案中,根据优先级将这些位分配给具有收听者最可能感觉到的信号的那些频段(也就是,超出屏蔽阈值给定数量的那些频段)。对于那些具有信号幅度比较接近屏蔽阈值的频段,以及对于在位预算为基础的方案中存在剩余的位对于完全编码是不够的情况下,所谈到的频段被分配一个或多个噪声填充参数。在使用有可变位预算方案的另一种方案中,可以选择只对那些超出屏蔽阈值大于预先确定数量的频段被完全地编码,对于那些并未超过阈值预先确定数量的频段有选择地被分配噪声填充参数。如果需要的话,为了获得强加于编码器的某个平均位速率,可以允许在逐帧的基础上改变这个预先确定的数量。
考虑图2中用字母B标记的频段。在此要指出,这个频段包括平均低于屏蔽阈值的信号。然而,信号幅度比较高,并可与图2中频段C的信号幅度相比拟。然而,频段B和C之间的区别在于频段C的频率区域中人耳比较敏感,因此该信号是比较重要的。在具有固定位预算的方案中为了提供有效的位分配,可以通过在优先级的基础上对较大程度上超过它们各自阈值电平的那些频段进行编码完成有用的节省,当剩余的可分配位对于完全地编码太少时,剩余的不太相关的频段如频段B利用噪声填充参数来表示,对于重现阶段,这指明噪声被注入到所谈到的频段中,达到给定的幅度。
在可变位预算方案中,或许可以决定,对于超出它的屏蔽阈值预先确定数量的每个频段将进行完全的编码,而对于其他的频段将分配噪声填充参数。
在此指出这点是重要的,即如果信号电平实际上低于屏蔽阈值,直接注入噪声没有实际用处,但也没有害处,因为不管怎么样,它们是听不到的。特别是对于刚刚高于屏蔽阈值的频率区,为了改进质量注入噪声证明是有价值的。然而,本发明的讲授内容包括两种方法,用噪声填充参数表示所有未被编码的频段,和让那些具有感觉上无关的信号幅度的未被编码的频段为空。
给出以上的讨论后,将藉助于图3较详细地描述一种对声频信号编码的方法。
图3中,以下的标记适用于以下的步骤:
S1=START启动;
S2=将输入信号划分成N个频段;
S3=SET C=1(设置C=1);
S4=将第C个烦段的幅度与第C个阈值电平作比较;
S5=频段幅度>阈值幅度?;
S6=如果YES(是),则利用给定的编码方案对C频段编码;
S7=如果NO(否),插入噪声填充参数;
S8=C→C+1;
S9=“C=N?”
S10=END(结束)
参考图3,假定为此目的表示一种可变的位预算方案,一个编码模决接收输入信号,在步骤S2,将输入信号划分成N个频段。然后在此实施迭代过程,其中对每个频段将该频段的幅度与各自的阈值作比较。典型情况下每个频段的阈值电平将是不同的,与由心理声学模型给出的阈值相对应,并可包括一定的与所需的编码效率有关的偏置。
在以上的比较步骤S4之后,实施两种操作之一,这取决于在步骤S5中给定频段的幅度是否大于阈值幅度。在第一种情况S6中,对于一个特定的频段信号幅度大于阈值幅度,该频段的信息利用给定的编码方案进行编码。另一方面,步骤S7,如果频段幅度并未大于阈值幅度,则噪声填充参数被插入编码信号。
将认识到,每个频段具有给定的频率范围,并且理想化的阈值将在此范围内变化。对于编码的用途,被设置并用于比较的阈值幅度实际上将是对于特定的频段算得的单一平均值,并且,例如,存储在一个查找存储器中。
在各个编码或插入操作以后,步骤S8中计数值被增量,步骤S9中检查,是否所有的频段已被编码。如果计数值指明有较多的频段要编码,则方法继续进行,使下一频段中的信号幅度与下一频段的阈值电平的幅度作比较,依此类推。另一方面,如果所有的频段已被编码,则步骤结束S10,或者,更精确地说,对该特定时间帧的步骤已经完成,可以对下一个时间帧的信息实施编码操作。
在每个时间帧有固定位预算的系统中,频段在优先级基础上进行编码。换句话说,具有信号幅度超过阈值最大数量的那些频段被完全地编码,而比较接近阈值的那些频段可以根据在位预算中剩余的位数有选择地被分配噪声填充参数。
当考虑编码方法时认识到这点是重要的,即对于给定的频段编码的特定的编码方案可以是任何数量编码方法中的一种,并且不限于任何特定的压缩系统。然而,典型情况下用于编码的系统可以是某种预测编码器,如自适应预测编码(APC)或某种形式的线性预测编码(LPC)。
现在将描述一种可能的噪声填充参数的实施方案,可用于不大重要的或者感觉上关系不大的频段编码。
对于一种给定的简单变换编码器,该编码器的一个性质就是首先将这些位分配给感觉上最重要的频段。结果,如以前所解释的那样,这样一种简单的变换编码过程可以导致某些频段没有分配给它们的位。为了实施与这样一种变换编码器有关的噪声填充,从总的位预算中分出的少量位可用于对其它空的频段的噪声填充参数编码。实际上,为了描述每个否则空的频段中的噪声只需要一个参数。所谈到的重要参数是被注入该频段的噪声信号幅度的RMS值。
在频谱域中利用从具有RMS值A的均匀分布中取出的随机噪声来填充空的频段。
利用等式(1)获得RMS值,A:
A = 1 N Σ n = 1 N X n 2 - - - ( 1 )
在等式1中,Xn是考虑的第n频段(或区)的采样值。RMS值被量化为1分贝网格并利用Huffman编码进行编码。
换句话说,在编码器侧,与噪声应该被注入的频段对应的原先的输入样本Xn,被放入等式1,值A就算得。这个值被转换成dB值,并量化到1 dB网格上。这个被量化的参数被编码成位流,并由接收机解码。然后随机发生器产生具有均匀概率密度函数的随机样本,使得这些随机样本(用dB为单位)预期的RMS值对应于A的解调值。换句话说,在接收机侧,在由参数A限定的适当电平上产生随机噪声。
在以上的实施方案中,将要指出,使用部分位流发送Huffman编码的RMS值是与消耗对其余频段的样本值编码可用的那些位一致的。然而,测试表明,比较这种位被剥夺以便填充空的频段的情景,相对于频段留着空白的状况,感觉到的结果是改进的。然而,给出这些结果后,这种方案将意味着,某些频段将不可避免地以较低的精度编码,实现一种波形编码部分质量并未因提供对噪声填充参数编码的附加位而受损害的系统也是在本发明的范围内。
在信号信息通常被找到的位置上对噪声参数编码。然而,对于解码器需要某种信号,以便指明噪声参数替代信号信息将接着出现在位流中。在我们的方法中,这可以通过将量化电平数目,例如用于存储每区信号信息的电平数目,编码的标识符来完成。当量化电平数目大于0时,这意味着信号信息将随后,当量化电平数目为0时,表示将无信号信息随后。在通常的方案中,没有噪声填充,将只有空的频段跟随在0数目量化电平标识符之后。在本方案中,量化电平数目0指明噪声填充参数(对于感觉上不重要的信号幅度它本身可以是零)将随后。
现在参考图4,在此描述一种方法,利用这种方法,解码模块可以将已经按照图3的方法编码的信号解码。
参考图4,标记S1到S9是指以下的项:
S1=START;
S2=接收N频段的编码信号;
S3=设置C=1;
S4=第C个编码频段包括噪声填充参数吗?
S5=如果否的话,按照解码方案将第C个编码频段的信号解码;
S6=如果是的话,通过注入噪声信号到所述的第C个频段达到给定的幅度,合成第C个频段的信号;
S7=C变成C+1;
S8=C=N?
S9=END
在图4的步骤S2中,N个频段的编码信号被接收。在S3中计数值被设置为初始值1,然后在S4中,对于N个频段中第1频段确定是否该频段包括噪声填充参数。
如果第1编码频段包括噪声填充参数,则在S6中该参数被解码,通过将噪声信号提供到由噪声填充参数给出的幅度来合成与第一频段有关的输出信号。
另一方面,如果第1编码频段的信号并不包括噪声填充参数,则在S5中,编码信号按照其特定的解码方案进行解码。
在步骤S7中,计数值被增量,下一个编码频段被解码。一旦在S8中计数值指明所谈到的特定时间帧中所有编码的频段已被解码,则在S9中解码子程序结束。更精确地说,当特定时间帧的所有信号已被解码时,解码方法开始对下一时间帧中接收到的编码信号的频段进行解码。
从以上的描述,将认识到提供一种对声频信号有效地编码和解码的方法,在其中感觉上关系不大的材料并未被完全地编码,相反地,用一个或多个噪声填充参数来表示。这样的噪声填充参数在算法的解码端被解码,以便藉助于提供给定幅度的噪声信号来合成感觉上不相关的信号部分。
参考图5,在此以简要格式示出一种设备10,包括声频编码器20和声频解码器30。
声频编码器20按照以前描述过的声频编码方法工作,以便按照给定的编码格式对输入的声频流编码,并利用本发明的方法提供噪声填充参数,以便有选择地替代那些感觉上关系不大的信号频段。
声频编码器20包括划分装置21、比较装置22和编码器23。
划分装置21将信号划分成多个频段。比较装置22将各个被划分的频段中的信号幅度与各自的阈值作比较。编码装置23根据优先级将所划分频段的信号编码,使得其中特定频段中的信号幅度超出它们各自阈值最大数量的频段被按照给定的编码方案编码,其他的频段被有选择地分配噪声填充参数。
声频解码器30起作用,以便在其输入上接收编码数据和在其输出上提供解码数据。解码器30包括噪声发生器40,可用于利用所希望的频带限制的噪声将所指明的频段填充到给定的信号幅度电平。
声频解码器30还包括接收装置31、处理装置32、第一解码装置33和第二解码装置34。
接收装置31接收编码的声频信号。处理装置32对编码信号的每个给定频段确定:该频段是否包括与给定频段内发送信号幅度有关的编码信号信息,或是否包括噪声填充参数。如果处理装置32确定接收到的信号包括编码的信号信息,则第一解码装置33被安排成对这样的信息解码,以产生对于各个频段的输出声频信号部分。如果另一方面处理装置32确定给定的频段包括噪声填充参数,如以前讨论过的那样,则第二解码装置34通过藉助于噪声发生器40输出该频段的频率范围上的噪声信号到由噪声填充参数指明的幅度来合成该频段的输出信号部分。
图5还示出一种存储媒介50,按照声频编码器编码的信号被存储在上面,并且声频解码器30从中可以重建声频信号。
从以上将很明显,本发明实施方案的目的是克服带宽切换的干扰效应,而不必将编码带宽限制到一个安全的、保守的值,以保证每个频段可在给定可用的位数时利用至少某个精度等级进行编码。换句话说,本发明的实施方案允许有效地增加声频带宽,而没有引入令人烦恼的带宽切换人为产物,这是按照另外的方案利用非常有限的位预算要碰到的问题。
本领域的技术人员将明白,提到硬件部件的地方,如果合适的话,可以用软件部件代替。相反,提到软件部件的地方,如果合适的话,也可用硬件部件代替。
将会非常明白,本发明的方法可与许多不同类型的通用的声频编码方案一同使用,并且这是极其具有位效率的。
应该指出,以上提到的实施方案是用作说明性的而不是限制本发明,本领域的技术人员将能够设计许多另外的实施方案而不偏离所附的权利要求的范围。在权利要求中,放在括号之间的任何参考符号不应该被解释成对权利要求的限制。字“包括”并不排斥权利要求中列举以外的其他部件或步骤的存在。本发明可藉助于包括几个不同部件的硬件实现,并藉助于适当编程的计算机来实现。在列举几种装置的设备权利要求中,这些装置中的几种装置可以用同一种硬件项来实施。某些措施在相互不同的从属的权利要求中被描述的唯一事实并不表明这些措施的组合不能用来有益使用。

Claims (16)

1.一种对声频信号编码的方法,该方法包括以下步骤:
将信号划分成多个频段;
将各个频率划分频段中信号的幅度与各自的感觉阈值进行比较;和
在优先级基础上将划分频段的信号编码,使得其中信号的幅度超出其各自的感觉阈值最大数量的特定频段按照给定的编码方案进行编码,
该方法的特征在于,对于其他的频段,有选择地分配表示噪声信号幅度的噪声填充参数。
2.如权利要求1的方法,其中对于给定频段的阈值是这样的幅度,根据心理声学模型,在该幅度以上噪声对于人耳是可感觉到的,而在该幅度以下噪声对于人耳是感觉不到的。
3.如权利要求1或2的方法,其中优先级基础使得其中信号幅度超出各自阈值大于预先确定值的频段按照给定的编码方案进行编码,而其中信号幅度并未超出各自阈值预先确定值的那些频段被有选择地分配噪声填充参数。
4.如权利要求1的方法,其中对于信号未被完全编码的那些频段中的每个频段,分配噪声填充参数。
5.如权利要求4的方法,其中对于感觉上不重要的信号幅度,分配等于零的噪声填充参数。
6.如权利要求1的方法,其中给定的编码方案具有固定的位预算,并且其中在优先级基础上分配位,用于对信号幅度超出各自阈值最大数量的频段中的那些信号编码,以及其中如果剩余位预算低于最小数量,则剩余未编码频段的信号被分配噪声填充参数。
7.如权利要求1的方法,其中噪声填充参数包括将插入在各自频段中的噪声大小的表示。
8.如权利要求1的方法,其中噪声填充参数包括编码的均方根值,表示在各自频段上接收到的声频信号的平均幅度。
9.如权利要求1的方法,其中对于被分配噪声填充参数的频段,噪声填充参数被编码并被提供在输出信号中否则将出现编码信号信息的位置上。
10.如权利要求9的方法,其中提供与每个频段相关联的标识符,以指明是存在噪声填充参数还是编码的信号信息。
11.如权利要求10的方法,其中标识符是平常用于指示编码的信号信息中量化电平数目的参数。
12.如权利要求11的方法,其中如果标识符指示量化电平的数目为零,则这被解释为这样的含意,即对于各自的频段,包括噪声填充参数而不是编码的信号信息。
13.一种对信号解码的方法,其中该信号已被按照权利要求1到12中任一项权利要求的方法编码,该解码方法包括以下步骤:
接收编码的声频信号;
对于一个给定频段的编码信号,确定接收到的信号是包括与给定频段内发送信号的幅度有关的编码的信号信息,还是包括噪声填充参数;
如果接收到的信号包括编码的信号信息,则对该信息解码,以产生该频段的输出声频信号部分;和
如果接收到的信号包括噪声填充参数,通过将该频段的频率范围上的噪声信号输出到由噪声填充参数指示的幅度,合成该频段的输出声频信号部分。
14.一种用于对输入信号编码的声频编码设备(20),包括:
划分装置(21),用于将信号划分成多个频段;
比较装置(22),用于将各个频率划分频段中信号的幅度与各自的感觉阈值进行比较;和
编码器(23),用于在优先级基础上对划分频段的信号进行编码,使得其中信号的幅度超出其各自感觉阈值最大数量的特定频段被按照给定的编码方案进行编码,
该设备的特征在于,对于其他的频段,有选择地分配表示噪声信号幅度的噪声填充参数。
15.一种用于对编码的声频信号进行解码的声频解码设备(30),该解码设备包括:
接收装置(31),用于接收编码的声频信号;
处理装置(32),被安排为:对于一个给定频段的编码信号,确定接收到的信号是包括与给定频段内发送信号的幅度有关的编码的信号信息,还是包括噪声填充参数;
第一解码装置(33),用于在接收到的信号包括编码的信号信息时对该信息解码,以产生该频段的输出声频信号部分;和
第二解码装置(34),用于在接收到的信号包括噪声填充参数时,通过将该频段的频率范围上的噪声信号输出到由噪声填充参数指示的幅度,合成该频段的输出声频信号部分。
16.一种声频设备(10),包括依据权利要求14的声频编码设备(20)和/或依据权利要求15的声频解码设备(30)。
CNB028015584A 2001-05-08 2002-04-18 声频信号编码方法和设备 Expired - Fee Related CN1244904C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01201689.5 2001-05-08
EP01201689 2001-05-08

Publications (2)

Publication Number Publication Date
CN1462429A CN1462429A (zh) 2003-12-17
CN1244904C true CN1244904C (zh) 2006-03-08

Family

ID=8180274

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028015584A Expired - Fee Related CN1244904C (zh) 2001-05-08 2002-04-18 声频信号编码方法和设备

Country Status (9)

Country Link
US (1) US7483836B2 (zh)
EP (1) EP1395980B1 (zh)
JP (1) JP2004522198A (zh)
KR (1) KR100871999B1 (zh)
CN (1) CN1244904C (zh)
AT (1) ATE320651T1 (zh)
DE (1) DE60209888T2 (zh)
ES (1) ES2260426T3 (zh)
WO (1) WO2002091363A1 (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1288625C (zh) * 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1814106B1 (en) * 2005-01-14 2009-09-16 Panasonic Corporation Audio switching device and audio switching method
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
JP2009534713A (ja) * 2006-04-24 2009-09-24 ネロ アーゲー 低減ビットレートを有するデジタル音声データを符号化するための装置および方法
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
US20100114581A1 (en) * 2006-10-06 2010-05-06 Te Li Method for encoding, method for decoding, encoder, decoder and computer program products
JP5071479B2 (ja) 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
PL3591650T3 (pl) * 2007-08-27 2021-07-05 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i urządzenie do wypełniania dziur widmowych
MX2010001394A (es) 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
ES2796493T3 (es) * 2008-03-20 2020-11-27 Fraunhofer Ges Forschung Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio
US9276787B2 (en) 2008-03-28 2016-03-01 Qualcomm Incorporated Transmission of signaling messages using beacon signals
US8995559B2 (en) 2008-03-28 2015-03-31 Qualcomm Incorporated Signaling message transmission in a wireless communication network
AU2009267543B2 (en) 2008-07-11 2013-01-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and audio decoder
EP2346029B1 (en) 2008-07-11 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and corresponding computer program
EP2304719B1 (en) 2008-07-11 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, methods for providing an audio stream and computer program
US8364471B2 (en) 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
KR101271430B1 (ko) * 2009-11-30 2013-06-05 한국전자통신연구원 무선 통신 시스템에서의 수신 신호 검출 방법 및 장치
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
TWI606441B (zh) 2011-05-13 2017-11-21 三星電子股份有限公司 解碼裝置
EP2709103B1 (en) * 2011-06-09 2015-10-07 Panasonic Intellectual Property Corporation of America Voice coding device, voice decoding device, voice coding method and voice decoding method
JP2013015598A (ja) * 2011-06-30 2013-01-24 Zte Corp オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法
JP5416173B2 (ja) * 2011-07-07 2014-02-12 中興通訊股▲ふん▼有限公司 周波数帯コピー方法、装置及びオーディオ復号化方法、システム
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
KR101778217B1 (ko) * 2013-01-29 2017-09-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 노이즈 채움 개념
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
CN110634495B (zh) 2013-09-16 2023-07-07 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
US10388293B2 (en) * 2013-09-16 2019-08-20 Samsung Electronics Co., Ltd. Signal encoding method and device and signal decoding method and device
US10395663B2 (en) 2014-02-17 2019-08-27 Samsung Electronics Co., Ltd. Signal encoding method and apparatus, and signal decoding method and apparatus
KR20240008413A (ko) * 2014-02-17 2024-01-18 삼성전자주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP4293666A3 (en) 2014-07-28 2024-03-06 Samsung Electronics Co., Ltd. Signal encoding method and apparatus and signal decoding method and apparatus
CN105374363B (zh) * 2014-08-25 2019-06-04 广东美的集团芜湖制冷设备有限公司 音频信号编码方法和系统
CN114822564A (zh) * 2021-01-21 2022-07-29 华为技术有限公司 音频对象的比特分配方法和装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
EP0707763B1 (en) * 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5790759A (en) * 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
WO1997031367A1 (en) * 1996-02-26 1997-08-28 At & T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
FR2747225B1 (fr) * 1996-04-03 1998-04-30 France Telecom Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique
GB9611425D0 (en) * 1996-05-31 1996-08-07 Tracker Network Uk Ltd Digital communications
JP2995037B2 (ja) * 1997-07-04 1999-12-27 三洋電機株式会社 音声符号化復号化装置
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
US6418404B1 (en) * 1998-12-28 2002-07-09 Sony Corporation System and method for effectively implementing fixed masking thresholds in an audio encoder device
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
US6434519B1 (en) * 1999-07-19 2002-08-13 Qualcomm Incorporated Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder
DE19959038A1 (de) * 1999-12-08 2001-06-28 Bosch Gmbh Robert Verfahren zur Dekodierung von digitalen Audiodaten
US6393338B1 (en) * 2000-03-17 2002-05-21 Tadeusz Kemnitz Apparatus and control method for accurate rotary peristaltic pump filling
US6968564B1 (en) * 2000-04-06 2005-11-22 Nielsen Media Research, Inc. Multi-band spectral audio encoding
US6801886B1 (en) * 2000-06-22 2004-10-05 Sony Corporation System and method for enhancing MPEG audio encoder quality
ATE319162T1 (de) * 2001-01-19 2006-03-15 Koninkl Philips Electronics Nv Breitband-signalübertragungssystem

Also Published As

Publication number Publication date
WO2002091363A1 (en) 2002-11-14
JP2004522198A (ja) 2004-07-22
ES2260426T3 (es) 2006-11-01
US7483836B2 (en) 2009-01-27
CN1462429A (zh) 2003-12-17
ATE320651T1 (de) 2006-04-15
EP1395980B1 (en) 2006-03-15
DE60209888T2 (de) 2006-11-23
KR20030014752A (ko) 2003-02-19
DE60209888D1 (de) 2006-05-11
EP1395980A1 (en) 2004-03-10
KR100871999B1 (ko) 2008-12-05
US20030061055A1 (en) 2003-03-27

Similar Documents

Publication Publication Date Title
CN1244904C (zh) 声频信号编码方法和设备
US11990147B2 (en) Adaptive transition frequency between noise fill and bandwidth extension
CN1135721C (zh) 音频信号编码方法及其有关设备
CN1038089C (zh) 信号编码或译码装置及信号编码或译码方法
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1030129C (zh) 高效数字数据编码和译码装置
CN1571993A (zh) 用于改善高频重建的方法
CN1878001A (zh) 对音频数据编码及解码的设备及方法
CN1662958A (zh) 使用频谱孔填充的音频编码系统
CN1237506C (zh) 音响信号编码方法及设备、音响信号解码方法及设备
CN1623185A (zh) 可伸缩音频编码的有效改进
CN1369092A (zh) 高质量音频的可缩放编码方法
CN1638479A (zh) 数字音频水印插入/检测装置及方法
CN1262990C (zh) 利用谐波提取的音频编码方法和设备
CN1735928A (zh) 用于可变速率音频编解码的方法
WO1997015916A1 (en) Method, device, and system for an efficient noise injection process for low bitrate audio compression
CN1525436A (zh) 可伸缩地编解码音频数据的方法和装置
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1765153A (zh) 表示多信道信号的主和副信号的编码
CN1945695A (zh) 对音频信号编码/解码的方法和设备
CN1918632A (zh) 音频编码
CN1711588A (zh) 音乐信息编码设备及方法和音乐信息解码设备及方法
CN1485849A (zh) 数字音频编码器及解码方法
CN1918630A (zh) 量化信息信号的方法和设备
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060308

Termination date: 20100418