CN100550133C - 一种语音信号处理方法及装置 - Google Patents
一种语音信号处理方法及装置 Download PDFInfo
- Publication number
- CN100550133C CN100550133C CNB2008100269012A CN200810026901A CN100550133C CN 100550133 C CN100550133 C CN 100550133C CN B2008100269012 A CNB2008100269012 A CN B2008100269012A CN 200810026901 A CN200810026901 A CN 200810026901A CN 100550133 C CN100550133 C CN 100550133C
- Authority
- CN
- China
- Prior art keywords
- yield value
- background noise
- correspondence
- energy attenuation
- error concealment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 230000005236 sound signal Effects 0.000 title claims abstract description 17
- 238000005562 fading Methods 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 abstract description 8
- 206010038743 Restlessness Diseases 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000012804 iterative process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 239000012467 final product Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010049712 Dysacusis Diseases 0.000 description 1
- 208000016621 Hearing disease Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例公开了一种语音信号处理方法,通过对差错隐藏帧之后获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内,并利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声的能量衰减。本发明还公开了一种语音信号处理装置。采用本发明实施例,可使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
Description
技术领域
本发明涉及通信领域,尤其涉及一种语音信号处理方法及一种语音信号处理装置。
背景技术
在语音通信中,语音信号一般按帧来处理,每帧语音信号的长度一般为10毫秒(ms)到30ms,对每帧语音信号,其基本处理流程为:
发送端,语音编码器对每帧语音信号进行编码,并将编码比特封装成语音数据帧;
通信信道,将发送端发出的语音数据帧发送到接收端;
接收端,对接收到的语音数据帧用语音解码器进行解码,恢复出语音信号。
对于语音解码器来说,其是否能恢复出语音信号的关键在于能否准确接收发送端所发出的语音数据帧,而这取决于通信信道。而对于通信信道来说,如果通信信道资源较为紧张,那么就可能发生语音数据帧的丢失或语音数据帧出错。目前在语音编解码器中广泛采用的帧差错隐藏(Frame Erasure Concealment,FEC)技术可有效地解决通信信道丢失语音数据帧或语音数据帧出错时对语音数据帧通信质量所带来的影响。
不同的语音编解码器其采用的FEC技术可能不同,但一般均包含对恢复出的语音信号进行幅度衰减的操作。
语音解码器上定义了FEC技术,对语音数据帧进行FEC处理(对应为差错隐藏帧),但是由于语音信号中并不纯粹是人们发声产生的有声信号,也有可能包括有人们发声间隙的背景噪声信号(相对于有声信号,背景噪声信号为无声信号),背景噪声信号的出现,(对应语音编码器生成的背景噪声帧)会使差错隐藏处理后恢复出来的信号发生能量突变,给听者的听觉造成不适,特别是当背景噪声帧发生丢失时,这种能量突变造成的听觉不适感更为强烈。
发明内容
本发明实施例所要解决的技术问题在于,提供了一种语音信号处理方法及装置,使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
为了解决上述技术问题,本发明实施例提出了一种语音信号处理方法,包括:
当差错隐藏帧之后获得的为背景噪声帧时,对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内;
利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减。
所述对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值包括:
获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值;
根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设置背景噪声帧起始能量衰减增益值,该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在所述阈值范围内;
将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值,设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。
相应地,本发明实施例还提供了一种语音信号处理装置,包括:
背景噪声帧获取单元,获得差错隐藏帧之后的背景噪声帧;
能量衰减增益值设置单元,对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内;
控制单元,利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减。
所述能量衰减增益值设置单元包括:
获取单元,获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值;
第一设置单元,根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设定背景噪声帧起始能量衰减增益值,该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在所述阈值范围内;
第二设置单元,将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值,设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。
本发明实施例通过对差错隐藏帧之后获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内,并利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声的能量衰减,从而通过设置背景噪声信号能量衰减增益并利用其对背景噪声信号进行能量衰减,使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
附图说明
图1是本发明实施例的语音信号处理方法的示意图;
图2是本发明实施例的语音信号处理所得语音信号幅度示意图;
图3是本发明实施例的语音信号处理所得另一语音信号幅度示意图;
图4是本发明实施例的语音信号处理所得另一语音信号幅度示意图;
图5是本发明实施例的语音解码器的示意图。
具体实施方式
本发明实施例提供了一种语音信号处理方法及装置,可实现通过设置背景噪声信号能量衰减增益并利用其对背景噪声信号进行能量衰减,从而使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
下面结合附图,对本发明实施例进行详细说明。
图1是本发明实施例的语音信号处理方法的示意图,图2是本发明实施例的语音信号处理所得语音信号幅度示意图,参照该图1与图2,图1所示方法主要包括:
101,在差错隐藏帧之后,获得一个或多个背景噪声帧,对于在差错隐藏帧之后只获得一个背景噪声帧时,对该背景噪声帧可如下述背景噪声帧B的处理相同,下面具体以7个连续的背景噪声帧B、C、D、E、F、G、H为例进行说明,但不仅限于此,即当前获得的首个背景噪声帧B的前一帧为差错隐藏帧A,除所述首个背景噪声帧B之外的背景噪声帧前一帧均为背景噪声帧,该背景噪声帧对应的信号为背景噪声信号,例如背景噪声帧D前一帧为背景噪声帧C,具体地,判断当前获得的帧是否为背景噪声帧,可根据帧头中一标志位进行判断;
102,对所述获得的背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内,具体地,102可通过如下方法实现:
首先,获得已保存的差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′;
其次,根据所述差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′设定背景噪声帧起始能量衰减增益值αstart,该起始能量衰减增益值αstart与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值α′相差在所述阈值范围内,具体地,可令αstart=α′;
再次,将所述起始能量衰减增益值αstart与小于所述阈值的能量衰减增益值增加值Δα的和值,设置为所述首个背景噪声帧B对应的背景噪声信号能量衰减增益值;除所述首个背景噪声帧B之外,将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值,设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值,具体地,可令:
背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB=αstart+Δα,即αnoiseB以αstart为前提;
背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC=αnoiseB+Δα,即αnoiseC以αnoiseB为前提;
背景噪声帧D对应的背景噪声信号能量衰减增益值αnoiseD=αnoiseC+Δα,即αnoiseD以αnoiseC为前提;
背景噪声帧E对应的背景噪声信号能量衰减增益值αnoiseE=αnoiseD+Δα,即αnoiseE以αnoiseD为前提;
背景噪声帧F对应的背景噪声信号能量衰减增益值αnoiseF=αnoiseE+Δα,即αnoiseF以αnoiseE为前提;
背景噪声帧G对应的背景噪声信号能量衰减增益值αnoiseG=αnoiseF+Δα,即αnoiseG以αnoiseF为前提;
背景噪声帧H对应的背景噪声信号能量衰减增益值αnoiseH=αnoiseG+Δα,即αnoiseH以αnoiseG为前提;
需要说明的是,当获得连续的多个背景噪声帧且存在某一背景噪声帧对应的背景噪声信号能量衰减增益值αnoise通过上述相同的叠代过程满足αnoise≥1时,此时为满足语音信号处理要求,令αnoise=1,为描述简便,上述设置至少两个背景噪声帧对应的背景噪声信号能量衰减增益值的叠代过程可用如下式子表示:
αnoise=αnoise+Δα
if(αnoise≥1)
{αnoise=1}
作为一种实施方式,所述Δα可为但不仅限于如下两种取值方式中的一种:
103,利用所述能量衰减增益值控制所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号的能量衰减,具体地,103可通过如下方法实现:
首先,恢复出所述背景噪声帧B、C、D、E、F、G、H分别对应的背景噪声信号;
其次,利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减,例如利用背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB,对背景噪声帧B对应的背景噪声信号进行幅度衰减,利用背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC,对背景噪声帧C对应的背景噪声信号进行幅度衰减等等,具体地,当每个背景噪声帧中背景噪声信号的采样点数为M时,则利用每个背景噪声帧对应的背景噪声信号能量衰减增益值,对每个背景噪声帧对应的M个背景噪声信号采样点进行幅度衰减,为描述简便,上述对每个背景噪声帧对应的M个背景噪声信号采样样点进行幅度衰减可用如下式子表示,其中noise(n)表示M个背景噪声信号中第n个背景噪声信号采样样点的幅度:
if(αnoise<1)
for(n=0;n<M;n++)
{noise(n)=noise(n)×αnoise}
实施如图1所示的本发明实施例的语音信号处理方法,其中102保证了所述首个背景噪声帧B对应的背景噪声信号能量衰减增益值αnoise与差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′相差不大,并保证了存在至少两个背景噪声帧时,所述背景噪声帧C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差不大,103中采用上述背景噪声帧对应的背景噪声信号能量衰减增益值对所述背景噪声帧对应的背景噪声信号进行能量衰减,可使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
作为一种实施方式,上述102中对所述获得的背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内,还可以通过如下方法实现:
参照图3所示的本发明实施例的语音信号处理所得另一语音信号幅度,与图2所示的本发明实施例的语音信号处理所得语音信号幅度不同的是,此处采用“进2退1”的方法,需要说明的是,下面的2Δα也应该小于所述阈值,例如,令:
背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB=αstart+2Δα,即αnoiseB以αstart为前提;
背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC=αnoiseB-Δα,即αnoiseC以αnoiseB为前提;
背景噪声帧D对应的背景噪声信号能量衰减增益值αnoiseD=αnoiseC+2Δα,即αnoiseD以αnoiseC为前提;
背景噪声帧E对应的背景噪声信号能量衰减增益值αnoiseE=αnoiseD-Δα,即αnoiseE以αnoiseD为前提;
背景噪声帧F对应的背景噪声信号能量衰减增益值αnoiseF=αnoiseE+2Δα,即αnoiseF以αnoiseE为前提;
背景噪声帧G对应的背景噪声信号能量衰减增益值αnoiseG=αnoiseF-Δα,即αnoiseG以αnoiseF为前提;
背景噪声帧H对应的背景噪声信号能量衰减增益值αnoiseH=αnoiseG+2Δα,即αnoiseH以αnoiseG为前提,
这样,在保证了所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在所述阈值范围内的同时,使得背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值按照一个大致顺序的顺序增加,直至背景噪声帧对应的背景噪声信号能量衰减增益值为1为止即可,因此,采用其他类似的方式也可认为是本发明的其他实施方式,例如:
采用如图4所示的本发明实施例的语音信号处理所得另一语音信号幅度,其与图2所示本发明实施例的语音信号处理所得语音信号幅度的主要区别在于,背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB与所述αstart取值相等,其他背景噪声帧C、D、E、F、G、H对应的背景噪声信号能量衰减增益值在αnoiseB基础上按照步长Δα逐步增加。
下面相应地对本发明实施例的语音信号处理装置进行说明,但本发明实施例的语音信号处理装置并不仅限于下面的语音解码器。
图5是本发明实施例的语音解码器的示意图,参照该图5与图2,图5所示装置主要包括背景噪声帧获取单元51、能量衰减增益值设置单元52、控制单元53,能量衰减增益值设置单元52包括获取单元521、第一设置单元522、第二设置单元523、第三设置单元524,控制单元53包括背景噪声信号获取单元531、处理单元532,其中各单元功能如下述:
背景噪声帧获取单元51,获得差错隐藏帧之后的背景噪声帧B、C、D、E、F、G、H,即当前获得的首个背景噪声帧B的前一帧为差错隐藏帧A,除所述首个背景噪声帧B之外的背景噪声帧前一帧为背景噪声帧,该背景噪声帧对应的信号为背景噪声信号,例如背景噪声帧D前一帧为背景噪声帧C,具体地,判断当前获得的帧是否为背景噪声帧,可根据帧头中一标志位进行判断,此为现有技术不再赘述;
获取单元521,获得已保存的差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′;
第一设置单元522,根据所述差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′设定背景噪声帧起始能量衰减增益值αstart,该起始能量衰减增益值αstart与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值α′相差在所述阈值范围内,具体地,可令αstart=α′;
第二设置单元523,将所述起始能量衰减增益值αstart与小于所述阈值的能量衰减增益值增加值Δα的和值,设置为所述首个背景噪声帧B对应的背景噪声信号能量衰减增益值,具体地,可令:
背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB=αstart+Δα,即αnoiseB以αstart为前提;
第三设置单元524,除所述首个背景噪声帧B之外,将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值,设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值,具体地,可令:
背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC=αnoiseB+Δα,即αnoiseC以αnoiseB为前提;
背景噪声帧D对应的背景噪声信号能量衰减增益值αnoiseD=αnoiseC+Δα,即αnoiseD以αnoiseC为前提;
背景噪声帧E对应的背景噪声信号能量衰减增益值αnoiseE=αnoiseD+Δα,即αnoiseE以αnoiseD为前提;
背景噪声帧F对应的背景噪声信号能量衰减增益值αnoiseF=αnoiseE+Δα,即αnoiseF以αnoiseE为前提;
背景噪声帧G对应的背景噪声信号能量衰减增益值αnoiseG=αnoiseF+Δα,即αnoiseG以αnoiseF为前提;
背景噪声帧H对应的背景噪声信号能量衰减增益值αnoiseH=αnoiseG+Δα,即αnoiseH以αnoiseG为前提;
需要说明的是,当获得连续的多个背景噪声帧且存在某一背景噪声帧对应的背景噪声信号能量衰减增益值αnoise通过上述相同的叠代过程满足αnoise≥1时,此时为满足语音信号处理要求,令αnoise=1,为描述简便,上述计算单元设置至少两个背景噪声帧对应的背景噪声信号能量衰减增益值的叠代过程可用如下式子表示:
αnoise=αnoise+Δα
if(αnoise≥1)
{αnoise=1}
作为一种实施方式,所述Δα可为但不仅限于如下两种取值方式中的一种:
控制单元53,利用所述能量衰减增益值控制所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号的能量衰减,具体地,控制单元53可包括:
背景噪声信号获取单元531,恢复出所述背景噪声帧B、C、D、E、F、G、H分别对应的背景噪声信号;
处理单元532,利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减,例如利用背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB,对背景噪声帧B对应的背景噪声信号进行幅度衰减,利用背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC,对背景噪声帧C对应的背景噪声信号进行幅度衰减等等,具体地,当每个背景噪声帧中背景噪声信号的采样点数为M时,则利用每个背景噪声帧对应的背景噪声信号能量衰减增益值,对每个背景噪声帧对应的M个背景噪声信号采样点进行幅度衰减,为描述简便,处理单元532对每个背景噪声帧对应的M个背景噪声信号采样样点进行幅度衰减可用如下式子表示,其中noise(n)表示M个背景噪声信号中第n个背景噪声信号采样样点的幅度:
if(αnoise<1)
for(n=0;n<M;n++)
{noise(n)=noise(n)×αnoise}
实施如图5所示的本发明实施例的语音解码器,其中能量衰减增益值设置单元52保证了所述首个背景噪声帧B对应的背景噪声信号能量衰减增益值αnoise与差错隐藏帧A对应的差错隐藏信号能量衰减增益值α′相差不大,第并保证了存在至少两个背景噪声帧时,所述背景噪声帧C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差不大,控制单元53中采用上述背景噪声帧对应的背景噪声信号能量衰减增益值对所述背景噪声帧对应的背景噪声信号进行能量衰减,可使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
作为一种实施方式,上述能量衰减增益值设置单元52为实现如下功能:对所述获得的背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内,还可以具体用于:
参照图3的本发明实施例的语音信号处理所得另一语音信号幅度示意图,与图2所示的本发明实施例的语音信号处理所得语音信号幅度不同的是,此处采用“进2退1”的方法,需要说明的是,下面的2Δα也应该小于所述阈值,例如,令:
背景噪声帧B对应的背景噪声信号能量衰减增益值αnoiseB=αstart+2Δα,即αnoiseB以αstart为前提;
背景噪声帧C对应的背景噪声信号能量衰减增益值αnoiseC=αnoiseB-Δα,即αnoiseC以αnoiseB为前提;
背景噪声帧D对应的背景噪声信号能量衰减增益值αnoiseD=αnoiseC+2Δα,即αnoiseD以αnoiseC为前提;
背景噪声帧E对应的背景噪声信号能量衰减增益值αnoiseE=αnoiseD-Δα,即αnoiseE以αnoiseD为前提;
背景噪声帧F对应的背景噪声信号能量衰减增益值αnoiseF=αnoiseE+2Δα,即αnoiseF以αnoiseE为前提;
背景噪声帧G对应的背景噪声信号能量衰减增益值αnoiseG=αnoiseF-Δα,即αnoiseG以αnoiseF为前提;
背景噪声帧H对应的背景噪声信号能量衰减增益值αnoiseH=αnoiseG+2Δα,即αnoiseH以αnoiseG为前提,
这样,在保证了所述背景噪声帧B、C、D、E、F、G、H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差在所述阈值范围内的同时,使得背景噪声帧C、D、E、F、G、H对应的背景噪声信号能量衰减增益值按照一个大致顺序的顺序增加,直至背景噪声帧对应的背景噪声信号能量衰减增益值为1为止即可,因此,采用其他类似的方式也可认为是本发明的其他实施方式,例如,上图4所示的本发明实施例的语音信号处理所得另一语音信号幅度。
需要说明的有如下几点:
1、上述本发明实施例以背景噪声帧C、D、E、F、G、H为例进行说明,而在背景噪声帧数量可多可少的实际情况下,本发明也可以同样适用;
2、上述阈值的取值可以根据实际情况,从如下值中取值但不仅限于:2Δα、2.5Δα、3Δα等,其中 根据该阈值的取值范围,可根据实际情况,确定上述本发明实施例中的起始能量衰减增益值以及能量衰减增益值增加值的取值;
3、当发生丢失的为背景噪声帧时,由于根据现有技术的FEC技术处理得到的差错隐藏信号能量会比没有发生背景噪声帧丢失时衰减得更为剧烈,若此时在差错隐藏帧之后得到背景噪声帧,那么差错隐藏信号区域到背景噪声信号区域的能量过渡会比没有发生背景噪声帧丢失时突变更加明显,在这种情况下应用本发明实施例会有效地使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑,提高听者听觉的舒适感。
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (12)
1、一种语音信号处理方法,其特征在于,包括:
当差错隐藏帧之后获得的为背景噪声帧时,对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内;
利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减;
所述对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值包括:
获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值;
根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设置背景噪声帧起始能量衰减增益值,该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在所述阈值范围内;
将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值,设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。
2、如权利要求1所述的语音信号处理方法,其特征在于,该方法还包括:
当所述差错隐藏帧之后获得的为至少两个背景噪声帧时,除所述第一个背景噪声帧之外,将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值,设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值。
3、如权利要求2所述的语音信号处理方法,其特征在于,所述能量衰减增益值增加值为1/256,或为一设定值,该设定值为:
1与所述起始能量衰减增益值的差值,该差值与预先设定的背景噪声帧个数相比得到所述设定值。
4、如权利要求3所述的语音信号处理方法,其特征在于,所述预先设定的背景噪声帧个数为100。
5、如权利要求1至4中任一项所述的语音信号处理方法,其特征在于,所述起始能量衰减增益值等于所述差错隐藏帧对应的差错隐藏信号能量衰减增益值。
6、如权利要求1至4中任一项所述的语音信号处理方法,其特征在于,所述利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减包括:
恢复出所述背景噪声帧对应的背景噪声信号;
利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减。
7、如权利要求1至4中任一项所述的语音信号处理方法,其特征在于,所述差错隐藏帧中包含有进行差错隐藏处理的背景噪声帧。
8、一种语音信号处理装置,其特征在于,包括:
背景噪声帧获取单元,获得差错隐藏帧之后的背景噪声帧;
能量衰减增益值设置单元,对所述获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值,使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内;
控制单元,利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减;
所述能量衰减增益值设置单元包括:
获取单元,获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值;
第一设置单元,根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设定背景噪声帧起始能量衰减增益值,该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在所述阈值范围内;
第二设置单元,将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值,设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。
9、如权利要求8所述的语音信号处理装置,其特征在于,当所述差错隐藏帧之后获得的为至少两个背景噪声帧时,所述能量衰减增益值设置单元还包括:
第三设置单元,除所述第一个背景噪声帧之外,将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值,设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值。
10、如权利要求8至9中任一项所述的语音信号处理装置,其特征在于,所述控制单元包括:
背景噪声信号获取单元,恢复出所述背景噪声帧对应的背景噪声信号;
处理单元,利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减。
11、如权利要求8至9中任一项所述的语音信号处理装置,其特征在于,所述差错隐藏帧中包含有进行差错隐藏处理的背景噪声帧。
12、如权利要求8至9中任一项所述的语音信号处理装置,其特征在于,该语音信号处理装置为语音解码器。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008100269012A CN100550133C (zh) | 2008-03-20 | 2008-03-20 | 一种语音信号处理方法及装置 |
PCT/CN2009/070826 WO2009115032A1 (zh) | 2008-03-20 | 2009-03-17 | 一种语音信号处理方法及装置 |
CA2709790A CA2709790C (en) | 2008-03-20 | 2009-03-17 | Method and apparatus for speech signal processing |
RU2010129857/09A RU2435233C1 (ru) | 2008-03-20 | 2009-03-17 | Способ и устройство для обработки речевого сигнала |
EP09721810.1A EP2234102B1 (en) | 2008-03-20 | 2009-03-17 | A voice signal processing method and device |
US12/820,738 US7890322B2 (en) | 2008-03-20 | 2010-06-22 | Method and apparatus for speech signal processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008100269012A CN100550133C (zh) | 2008-03-20 | 2008-03-20 | 一种语音信号处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101339766A CN101339766A (zh) | 2009-01-07 |
CN100550133C true CN100550133C (zh) | 2009-10-14 |
Family
ID=40213815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2008100269012A Active CN100550133C (zh) | 2008-03-20 | 2008-03-20 | 一种语音信号处理方法及装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7890322B2 (zh) |
EP (1) | EP2234102B1 (zh) |
CN (1) | CN100550133C (zh) |
CA (1) | CA2709790C (zh) |
RU (1) | RU2435233C1 (zh) |
WO (1) | WO2009115032A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101291193B1 (ko) | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | 프레임 오류은닉방법 |
CN100550133C (zh) * | 2008-03-20 | 2009-10-14 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
KR101629661B1 (ko) * | 2012-08-29 | 2016-06-13 | 니폰 덴신 덴와 가부시끼가이샤 | 복호 방법, 복호 장치, 프로그램 및 그 기록매체 |
JP6561499B2 (ja) * | 2015-03-05 | 2019-08-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
US10013996B2 (en) * | 2015-09-18 | 2018-07-03 | Qualcomm Incorporated | Collaborative audio processing |
CN107833579B (zh) * | 2017-10-30 | 2021-06-11 | 广州酷狗计算机科技有限公司 | 噪声消除方法、装置及计算机可读存储介质 |
US10784988B2 (en) | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
US10803876B2 (en) * | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
SE502244C2 (sv) * | 1993-06-11 | 1995-09-25 | Ericsson Telefon Ab L M | Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation |
SE9500858L (sv) * | 1995-03-10 | 1996-09-11 | Ericsson Telefon Ab L M | Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning |
JPH08305395A (ja) | 1995-04-28 | 1996-11-22 | Matsushita Electric Ind Co Ltd | 雑音再生装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
GB2330485B (en) | 1997-10-16 | 2002-05-29 | Motorola Ltd | Background noise contrast reduction for handovers involving a change of speech codec |
FI980132A (fi) * | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
US6604071B1 (en) | 1999-02-09 | 2003-08-05 | At&T Corp. | Speech enhancement with gain limitations based on speech activity |
AU5032000A (en) | 1999-06-07 | 2000-12-28 | Ericsson Inc. | Methods and apparatus for generating comfort noise using parametric noise model statistics |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6804640B1 (en) | 2000-02-29 | 2004-10-12 | Nuance Communications | Signal noise reduction using magnitude-domain spectral subtraction |
US7003455B1 (en) | 2000-10-16 | 2006-02-21 | Microsoft Corporation | Method of noise reduction using correction and scaling vectors with partitioning of the acoustic space in the domain of noisy speech |
CN1288557C (zh) | 2003-06-25 | 2006-12-06 | 英业达股份有限公司 | 多执行线程同时停止的方法 |
CN1930607B (zh) * | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
CN1758694A (zh) | 2004-10-10 | 2006-04-12 | 中兴通讯股份有限公司 | 一种产生舒适噪声的装置 |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
US7454335B2 (en) | 2006-03-20 | 2008-11-18 | Mindspeed Technologies, Inc. | Method and system for reducing effects of noise producing artifacts in a voice codec |
CN100550133C (zh) * | 2008-03-20 | 2009-10-14 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
-
2008
- 2008-03-20 CN CNB2008100269012A patent/CN100550133C/zh active Active
-
2009
- 2009-03-17 WO PCT/CN2009/070826 patent/WO2009115032A1/zh active Application Filing
- 2009-03-17 EP EP09721810.1A patent/EP2234102B1/en active Active
- 2009-03-17 RU RU2010129857/09A patent/RU2435233C1/ru active
- 2009-03-17 CA CA2709790A patent/CA2709790C/en active Active
-
2010
- 2010-06-22 US US12/820,738 patent/US7890322B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2234102B1 (en) | 2014-05-07 |
WO2009115032A1 (zh) | 2009-09-24 |
EP2234102A1 (en) | 2010-09-29 |
CN101339766A (zh) | 2009-01-07 |
US20100250247A1 (en) | 2010-09-30 |
CA2709790C (en) | 2013-06-04 |
EP2234102A4 (en) | 2011-04-27 |
US7890322B2 (en) | 2011-02-15 |
CA2709790A1 (en) | 2009-09-24 |
RU2435233C1 (ru) | 2011-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100550133C (zh) | 一种语音信号处理方法及装置 | |
DE102018010463B3 (de) | Tragbare Vorrichtung, computerlesbares Speicherungsmedium, Verfahren und Einrichtung für energieeffiziente und leistungsarme verteilte automatische Spracherkennung | |
EP2535893B1 (en) | Device and method for lost frame concealment | |
JP2021060618A (ja) | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス | |
US20110251846A1 (en) | Transient Signal Encoding Method and Device, Decoding Method and Device, and Processing System | |
CN105340007A (zh) | 用于产生舒缓噪声的自适应频谱形状的装置及方法 | |
WO2004084467A3 (en) | Recovering an erased voice frame with time warping | |
ATE262723T1 (de) | Verbesserte verfahren zur rückgewinnung verlorener datenrahmen für ein lpc-basiertes, parametrisches sprachkodierungsystem. | |
US8190440B2 (en) | Sub-band codec with native voice activity detection | |
EP2037450A1 (en) | Method and device for performing frame erasure concealment to higher-band signal | |
MY112120A (en) | Soft error correction in a tdma radio system. | |
MY143176A (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
WO2004034379A3 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
EP0858069A4 (en) | VOICE CODEC, MEDIUM ON WHICH A VOICE CODEC PROGRAM IS RECORDED, AND MOBILE TELECOMMUNICATIONS APPARATUS | |
WO2000048171A8 (en) | Speech enhancement with gain limitations based on speech activity | |
WO2007078991A3 (en) | System and method of detecting speech intelligibility and of improving intelligibility of audio announcement systems in noisy and reverberant spaces | |
US9325544B2 (en) | Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame | |
CN103915097B (zh) | 一种语音信号处理方法、装置和系统 | |
CN103456307B (zh) | 音频解码器中帧差错隐藏的谱代替方法及系统 | |
US9489958B2 (en) | System and method to reduce transmission bandwidth via improved discontinuous transmission | |
EP0747884A2 (en) | Codebook gain attenuation during frame erasures | |
CN102959618B (zh) | 声音识别装置 | |
DE50006592D1 (de) | Verfahren und einrichtung zur entzerrung und dekodierung eines datensignals | |
US7171356B2 (en) | Low-power noise characterization over a distributed speech recognition channel | |
CN104934040B (zh) | 音频信号的时长调整方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |