Nothing Special   »   [go: up one dir, main page]

CN101399040B - 一种帧错误隐藏的谱参数替换方法 - Google Patents

一种帧错误隐藏的谱参数替换方法 Download PDF

Info

Publication number
CN101399040B
CN101399040B CN2007101525365A CN200710152536A CN101399040B CN 101399040 B CN101399040 B CN 101399040B CN 2007101525365 A CN2007101525365 A CN 2007101525365A CN 200710152536 A CN200710152536 A CN 200710152536A CN 101399040 B CN101399040 B CN 101399040B
Authority
CN
China
Prior art keywords
frame
isf
spectral frequency
demoder
amr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101525365A
Other languages
English (en)
Other versions
CN101399040A (zh
Inventor
钟睿毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007101525365A priority Critical patent/CN101399040B/zh
Publication of CN101399040A publication Critical patent/CN101399040A/zh
Application granted granted Critical
Publication of CN101399040B publication Critical patent/CN101399040B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种帧错误隐藏的谱参数替换方法,所述方法包括:(1)解码器统计最近连续坏帧数量;(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。本发明与现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换方案相比,能保持解码器解码质量并略有提高,同时节约解码器的内存并减小解码计算复杂度。

Description

一种帧错误隐藏的谱参数替换方法
技术领域
本发明涉及语音解码器的坏帧处理方法,具体的说,涉及一种帧错误隐藏的谱参数替换方法。
背景技术
在通信系统中,语音编码器常用的编码原理是代数码本激励线性预测(ACELP,Algebraic Code Excited Linear Prediction),这类编码器包括G.729、EVRC、AMR、AMR-WB、AMR-WB+等。其中AMR、AMR-WB、AMR-WB+是第三代移动通信合作伙伴计划(3GPP,3rd Generation Partnership Project)的语音编码标准。
基于ACELP的语音编码器生成的码流都是以语音帧为单位的,有的还把帧分为若干子帧,如AMR。对于每一帧的输入数据,通常为几十毫秒PCM(Pulse Code Modulation,脉冲编码调制)格式数据,发送端的语音编码器要将其编码为一组参数。这些参数一般要经过量化并且传输。接收端的解码器则要将这些参数重新合成为语音信号(常见为PCM格式数据)。
参照图1所示,为基于ACELP的语音编码器语音信号传输示意图。输入语音信号经编码器进行编码后由通信信道传输至解码器,由解码器重新合成语音信号。
线性预测系数(LPC,Linear Predictive Coefficience)表示短时语音的谱形状。语音编码器一般都会将LPC参数进行量化后再传输。为了减少量化误差,一些语音编码器会将LPC转换成线谱频率(LSF,Linear SpectralFrequency)或导谱频率(ISF,Immittance Spectral Frequency)等其他谱参数,再进行量化。使用ISF作为谱参数的语音编码器有AMR-WB、AMR-WB+等。
基于ACELP的语音编码器生成的语音帧的参数一般包括谱参数、自适应码本参数、代数码本参数、自适应码本增益和代数码本增益等。
如果一个语音帧的数据从发送端传输到接收端后,发生错误或者丢失,则称为坏帧。当出现坏帧时,接收端的解码器一般需要对坏帧中的错误参数进行替换,以减少解码后语音质量的下降。
最早的基于ACELP的语音解码器在发生帧错误时,都是简单的重复上一帧的谱参数,如G.729和EVRC(分别参见ITU-T G.729和3GPP2 3GPP2C.S0014-0)。之后的一些标准,为了进一步提高语音质量,开始利用其他的信息(如最近好帧的自适应平均值、常数平均值等)来替换当前坏帧的谱参数,如AMR-WB和AMR-WB+(参见AMR-WB的帧错误隐藏标准3 GPP TS26.191)。
AMR-WB和AMR-WB+使用的谱参数是16阶的导谱频率ISF。在发生帧错误时,AMR-WB和AMR-WB+语音解码器将上一帧的ISF向ISF的部分自适应平均值偏移,得到的值作为错误帧的ISF(参考AMR帧错误隐藏标准3GPPTS 26.191和国际专利WO 02/35520):
ISFq(i)=a*past_ISFq(i)+(1-α)*ISFmean(i)i=0..15
其中
α=0.9.
ISFq(i)是当前帧的ISF向量,
past_ISFq(i)是上一帧的ISF向量,
ISFmean(i)是ISF的部分自适应平均值,由ISF的自适应平均值和ISF的常数平均值组成:
ISFmean(i)=β*ISFconst_mean(i)+(1-β)*ISFadaptive_mean(i),i=0..15
其中
β=0.25,
ISF adaptive _ mean ( i ) = 1 3 Σ i = 0 2 past _ ISF q ( i ) , 是最近3个好帧的自适应平均值,每次好帧更新一次
ISFconst_mean(i)ISF向量的长期平均值常数向量。
在上述的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在下列缺陷:
a)没有考虑最近坏帧的严重程度。当连续坏帧时,最近好帧的ISF和当前坏帧的相关性应当减弱。
b)使用最近三个好帧的ISF平均值。实际上最近一个好帧的ISF和当前坏帧的ISF的相关度应大于其他好帧,可以忽略其他好帧。
c)基于(b),如果上一帧是坏帧,那么上一帧的ISF也要通过上一好帧的ISF推断出来。因此在替换当前帧的ISF时,没有必要将上一好帧的ISF和上一帧的ISF分开计算,仅用上一好帧的ISF进行计算即可。
可见,现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在计算冗余的问题。
发明内容
本发明所要解决的技术问题是提供一种帧错误隐藏的谱参数替换方法,在保证解码质量有所提高的情况下,为了解决AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在的计算冗余的问题,提出一个高效的谱参数替换方法。
为了解决上述技术问题,本发明提供了一种帧错误隐藏的谱参数替换方法,所述方法包括以下步骤:
(1)解码器统计最近连续坏帧数量;
(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。
进一步的,步骤(1)中所述统计最近连续坏帧数量,包括:设置坏帧计数器,当解码器接收到好帧时,将所述坏帧计数器置零;当解码器接收到坏帧时,将所述坏帧计数器加1。
进一步的,步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,包括:
ISF q ( i ) = 1 bfi _ count + 1 * past _ ISF q ( i ) + bfi _ count bfi _ count + 1 * ISF const _ mean ( i ) ,
i=0..15
其中
ISFq(i)是当前帧导谱频率的向量,
past_ISFq(i)是上一好帧的导谱频率向量,
ISFconst_mean(i)是导谱频率向量的长期平均值常数向量,
bft_count是最近连续坏帧的数量。
进一步的,所述方法还包括以下步骤:
(3)解码器按照所述当前帧的导谱频率对所述当前帧进行解码。
在技术上,采用本发明的优势有:
a)当发生连续坏帧时,逐渐减小最近好帧ISF与当前坏帧ISF的相关度,在相同码率和帧错误率情况下获得比AMR-WB和AMR-WB+原帧错误隐藏算法更好的音质。
b)当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用更早的好帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比,节约了解码器的内存和减小了计算复杂度。
c)当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用上一帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比,减小了计算复杂度。
附图说明
图1为基于ACELP的语音编码器语音信号传输示意图。
图2为本发明实施例帧错误隐藏的谱参数替换方法流程图。
具体实施方式
本发明通过统计最近连续坏帧个数,当发生连续坏帧时,逐渐减小最近好帧与当前坏帧的相关度,当发生帧错误时,将上一好帧的ISF向ISF的常数平均值进行自适应偏移,得到的值作为错误帧的ISF。从而本发明只使用最近一个好帧的ISF,不使用更早的好帧的ISF,节约解码器的内存和减小计算复杂度。并且当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用上一帧的ISF,从而减小了计算复杂度。
下面结合附图对本发明的优选实施例进行详细说明。
参照图2所示,为本发明实施例帧错误隐藏的谱参数替换方法流程图。所述方法包括以下步骤:
步骤201:设置坏帧计数器,解码器判断当前帧是否是坏帧,如果是坏帧,则执行步骤204;如果是好帧,则执行步骤202;
步骤202:将坏帧计数器置零;
步骤203:直接用接收到的好帧的ISF参数更新解码器的ISF输入缓冲区,作为解码器的输入参数,执行步骤206;
步骤204:将坏帧计数器加1,从而统计最近连续坏帧数量;
步骤205:按照统计出的所述最近连续坏帧数量,根据上一好帧的ISF,计算当前的坏帧的ISF,作为解码器输入参数,执行步骤206;
步骤206:解码器按照得到的当前帧的ISF对语音数据进行解码,结束。
总而言之,解码器需要统计最近连续坏帧数量。当接收到好帧时,则将统计数置0。在发生帧错误时,根据最近连续坏帧数量,将上一好帧的ISF向ISF的常数平均值进行自适应偏移,得到的值作为错误帧的ISF:
ISF q ( i ) = 1 bfi _ count + 1 * past _ ISF q ( i ) + bfi _ count bfi _ count + 1 * ISF const _ mean ( i ) , i=0..15
其中
ISFq(i)是当前帧的ISF向量,
past_ISFq(i)是上一好帧的ISF向量,
ISFconst_mean(i)是ISF向量的长期平均值常数向量
bfi_count是最近连续坏帧的数量。
本发明提供的改进的帧错误隐藏的ISF谱参数替换方法,与现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换方案相比,能保持解码器解码质量并略有提高,同时节约解码器的内存并减小解码计算复杂度。
当然,上述具体实施方式不是对本发明技术方案的进一步限定,任何熟悉本领域的技术人员对本发明技术特征所作的等同替换或者相应改进,仍在本发明的保护范围之内。

Claims (3)

1.一种帧错误隐藏的谱参数替换方法,其特征在于,所述方法包括以下步骤:
(1)解码器统计最近连续坏帧数量,包括:设置坏帧计数器,当解码器接收到好帧时,将所述坏帧计数器置零;当解码器接收到坏帧时,将所述坏帧计数器加1;
(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。
2.如权利要求1所述的方法,其特征在于,步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,包括:
ISF q ( i ) = 1 bfi _ count + 1 * past _ ISF q ( i ) + bfi _ coount bfi _ count + 1 * ISF const _ mean ( i ) ,
i=0..15
其中:
ISFq(i)是当前帧导谱频率的向量,
past_TSFq(i)是上一好帧的导谱频率向量,
TSFconst_mean(i)是导谱频率向量的长期平均值常数向量,
bfi_count是最近连续坏帧的数量。
3.如权利要求1所述的方法,其特征在于,所述方法还包括以下步骤:
(3)解码器按照所述当前帧的导谱频率对所述当前帧进行解码。
CN2007101525365A 2007-09-27 2007-09-27 一种帧错误隐藏的谱参数替换方法 Expired - Fee Related CN101399040B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101525365A CN101399040B (zh) 2007-09-27 2007-09-27 一种帧错误隐藏的谱参数替换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101525365A CN101399040B (zh) 2007-09-27 2007-09-27 一种帧错误隐藏的谱参数替换方法

Publications (2)

Publication Number Publication Date
CN101399040A CN101399040A (zh) 2009-04-01
CN101399040B true CN101399040B (zh) 2011-08-10

Family

ID=40517545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101525365A Expired - Fee Related CN101399040B (zh) 2007-09-27 2007-09-27 一种帧错误隐藏的谱参数替换方法

Country Status (1)

Country Link
CN (1) CN101399040B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088613B (zh) * 2009-12-02 2013-03-20 宏碁股份有限公司 图像修复方法
EP2458585B1 (en) 2010-11-29 2013-07-17 Nxp B.V. Error concealment for sub-band coded audio signals
KR102070430B1 (ko) 2011-10-21 2020-01-28 삼성전자주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
ES2967482T3 (es) * 2012-07-02 2024-04-30 Sony Group Corp Mejoras de desacoplamiento en el desplazamiento adaptativo de muestra (SAO) para codificador de vídeo de alta eficiencia (HEVC)
PL3285255T3 (pl) 2013-10-31 2019-10-31 Fraunhofer Ges Forschung Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu
PT3063759T (pt) 2013-10-31 2018-03-22 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma dissimulação de erros que modifica um sinal de excitação de domínio de tempo

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1134581A (zh) * 1994-12-21 1996-10-30 三星电子株式会社 音响信号的误差隐匿方法及其装置
US6327689B1 (en) * 1999-04-23 2001-12-04 Cirrus Logic, Inc. ECC scheme for wireless digital audio signal transmission

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1134581A (zh) * 1994-12-21 1996-10-30 三星电子株式会社 音响信号的误差隐匿方法及其装置
US6327689B1 (en) * 1999-04-23 2001-12-04 Cirrus Logic, Inc. ECC scheme for wireless digital audio signal transmission

Also Published As

Publication number Publication date
CN101399040A (zh) 2009-04-01

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
US7203638B2 (en) Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
US9053702B2 (en) Systems, methods, apparatus, and computer-readable media for bit allocation for redundant transmission
RU2418324C2 (ru) Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
CN101494055B (zh) 用于码分多址无线系统的方法和装置
EP1330818B1 (en) Method and system for speech frame error concealment in speech decoding
CN101399040B (zh) 一种帧错误隐藏的谱参数替换方法
US6721712B1 (en) Conversion scheme for use between DTX and non-DTX speech coding systems
US8447622B2 (en) Decoding method and device
US20050143984A1 (en) Multirate speech codecs
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
US20200227061A1 (en) Signal codec device and method in communication system
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
CN101322181A (zh) 有效的语音流转换
CA2293165A1 (en) Method for transmitting data in wireless speech channels
Wang et al. Parameter interpolation to enhance the frame erasure robustness of CELP coders in packet networks
Ahmadi et al. On the architecture, operation, and applications of VMR-WB: The new cdma2000 wideband speech coding standard
WO2000074036A1 (fr) Dispositif de codage/decodage de la voix et codage des parties non vocales, procede de decodage, et support enregistre d'enregistrement de programme
Gibson Speech coding for wireless communications
Bernard Source-channel coding of speech
Foodeei et al. A low bit rate codec for AMR standard
Hayashi et al. 8 kbit/s short and medium delay speech codecs based on CELP coding
Napoleon et al. Enhanced recovery technique for improving voice quality degraded by packet loss in data networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110810

Termination date: 20190927

CF01 Termination of patent right due to non-payment of annual fee