本发明的一个目的是提供一种具有改进的可懂度的声音再现系统和方法。
为此目的,根据本发明的声音再现系统的特征在于,该系统包括数字信号处理器,该数字信号处理器包括具有高通频率的高通(HP)滤波器、用于放大由该HP滤波器滤波的信号的放大器和用于滤波放大之后的信号并且提供输出信号的低通(LP)滤波器,并且该数字处理器包括用于建立所述高通频率或低通频率的建立器(establisher)以及用于将所述高通滤波器和低通滤波器的高通频率和低通频率分别互相匹配的匹配器。
根据本发明的系统是基于以下理解:
1.进入的信号被(放大器)放大,以便提高响度,但是
2.增大进入的信号会导致高于最大数字信号的信号,在这种情况下,该信号将总是被数字限幅,从而导致该信号的失真。
3.在放大之前从信号中去除低频,这允许利用平均更高的增益因子来放大该信号的剩余部分。这是通过位于放大之前的HP滤波器来完成的。就可懂度来说,较低频率的重要性相对较低。所述较低频率包括信号的较多幅度,因此去除较低频率就大大降低了信号的幅度,从而为放大建立净空(headroom),即对信号的剩余部分进行更强的放大。特别是语音的幅度的大部分被包括在较低频率中,因此衰减较低频率允许可观地提高净空(即在不达到限幅电平的情况下进行放大)。
4.简单地截断较低频率并提高输出将提高可懂度,然而,这样做并不总是在可懂度中产生容易察觉的提高。由于使用了高通滤波器,该信号包括相对高比例的高频声调,从而导致在感觉上令人讨厌的尖声信号、音频信号的变色(discoloration)并且降低可懂度。此外,所述放大会导致引入泛音。在放大之后,所述低通(LP)滤波器恢复平衡,并且还会剪除或至少减小由放大器产生的泛音从而导致更自然的声音,以及至少部分地减小信号的变色并且提高可懂度。
5.在根据本发明的系统中,截止频率被匹配,也就是说,在所建立的HP截止频率和LP截止频率之间存在一种关系,其中所述低通频率和/或高通频率的值在相反的方向上匹配,这意味着如果HP截止频率被减小(降低),那么LP截止频率就被提高,反之亦然,或者换一种方式来说,HP滤波器和LP滤波器的截止动作被匹配,其中如果一个操作较大,那么另一个也较大,并且如果一个操作相对较小,那么另一个也相对较小。从而在语音或声音处理中,HP和LP滤波器被用作耦合的元件,它们不是具有无关参数的元件。高通滤波器的截止动作使音频信号变色,而LP滤波器的截止动作被匹配以便抵消这种影响。该系统具有用于建立HP或者LP截止频率以及将所述LP或HP截止频率匹配到所建立的频率的装置。
存在几个优选实施例:
在这些实施例中,该系统包括用于测量背景噪声电平的传感器,并且包括将所测量的噪声电平作为输入并将HP截止频率作为输出的元件,其中HP截止频率随着背景噪声电平的提高而提高,而LP截止频率则随着HP截止频率的提高而降低。LP截止频率的这种降低可以通过改变(降低)作为HP截止频率的函数的单个LP滤波器的截止频率来执行,或者替换地,该系统可以包括一组不同的LP滤波器,并且根据HP截止频率,所述信号在放大之后被导向该组LP滤波器的其中之一。如果使用更为复杂的LP滤波器(具有不止一个变量,即更多的参数被改变而不仅仅是LP截止频率),后一实施例尤其有用。该选择可以利用查找表来执行,其中根据HP截止频率,该信号经历与不同LP滤波器等效的不同数字计算。这可以在两个步骤中执行,其中在第一步骤中确定噪声电平,这触发了对HP截止频率的选择,然后根据该HP截止频率选择LP截止频率。
优选地,该系统和/或程序包括根据在放大级中的平均放大来建立高通滤波器的截止频率的装置。该平均放大是对信号的平均增益(从而是对所发射的声音信号的响度电平)的度量。当高通滤波器的HP截止频率随着所发射信号的平均响度电平的增加而增加时是有利地,此外,低通滤波器的截止频率被匹配,即与变化的HP截止频率同步降低。在非常高的放大水平下(例如当系统被用在喧吵的、嘈杂的环境中时所可能发生的那样),非常需要HP滤波器的滤波动作,其在声音中引入了相对大的不平衡,此外,较大的放大水平本身会引入信号的相对大的失真,其中,放大之后的信号的不希望的、不自然的泛音包括很多能量。这导致了刺耳的声音。如本发明的发明者已经意识到的那样,声音的刺耳度(harshness)有时、并且甚至经常导致收听者将扬声器(尤其是移动电话中的扬声器)与自己的耳朵保持一段距离。除了将扬声器与耳朵保持一段距离之外,所述刺耳度本身将导致信噪比的可观的降低,因为信号将被减小而噪声将被增加,实际上,声音本身被感觉为刺耳的这一事实就意味着所给出的消息的可懂度的降低。对于语音消息,语音的刺耳度通常是说话者希望传达给收听者的消息的整体部分,有时其甚至比消息中的实际的话语更为重要。因此,在比仅仅话语是否被理解更宽泛的概念中可以看到,对于消息可懂度来说很重要的是,获得清楚的“自然”语音传送。在较低的放大水平下,“刺耳声音”效果(即信号的变色)的可听程度要低得多。简而言之,在高放大水平下,在信号中存在相对较大的不平衡(在高频处有多得多的能量),此外,在高频处的幅度的相对较大部分是由于放大造成的人工伪信号(artifact),并且(完全地或部分地)去除较高频率就去除了所述不平衡和人工伪信号,从而导致更自然的声音,而在相对较低的放大水平下,在高频处的可观地更多的信号幅度是自然产生的而很少是由于人工伪信号造成的,因此,在相对较高的频率处设置截止频率是优选的。通过根据所述放大来建立高通滤波器的截止频率以及同时匹配低通滤波器的截止频率,可以改进声音再现。在某种程度上,本实施例旨在与具有噪声传感器的所述第一实施例具有类似的效果,但是并不是将HP和LP滤波器的匹配的截止动作耦合到所测量的噪声电平,而是将匹配的LP和HP滤波器截止动作耦合到放大水平。通常来说,较高的放大水平将被用在高背景噪声电平的情况下,(用户将在嘈杂的环境中调高音量),这样,在某种意义上,用户起到噪声传感器的作用。从技术的观点来看,将噪声传感器用作系统一部分是优选的,但是这将增加系统的成本和复杂度。
在这些实施例中,所述系统包括用来测量/建立进入的信号的样本频率fs并在fs/2处设置LP滤波器的最大截止频率的装置。任何高于fs/2的信号都不是原始信号的分量,而是由于泛音造成的。因此,该样本频率fs实际上确定LP滤波器的最大截止频率。因此,在这些实施例中,该截止频率具有fs/2的上限。该样本频率fs可以由进入的信号的带宽确定。例如,对于因特网音频-视频,带宽通常相当小。此外,如果音频系统本身具有相当低的功率,那么具有非常大的带宽将没有多大用处。因此,在优选的实施例中,该系统具有用来建立信号的样本频率的装置,该样本频率可以根据进入的信号建立,或者可以被建立为音频系统的功率限制的函数(例如,如果该系统可以被接通到不同的物理放大器,并且因此可以施加功率限制)。对于fs的较高值(例如44kHz),这对于低通滤波器的截止动作没有很大影响,然而,对于fs的较低值就不是这种情况(例如对于8kHz、11.025kHz、16kHz、22.05kHz,fs/2分别是相当小的4kHz、5.5kHz、8kHz、11kHz)。然而,该限制对声音进行“染色”,因为缺少了高于fs/2的频率,实际上所接收到的原始信号已经被“变色”。在该优选实施例中,该系统具有用于根据所建立的样本频率fs确定HP截止频率以便抵消所述变色的装置。同样,这可以以几种方式完成:HP截止频率的这种提高可以通过改变(提高)作为LP截止频率的函数的单个HP滤波器的截止频率来执行,或者替换地,该系统可以包括一组不同的HP滤波器,并且根据所述截止频率,所述信号被导向该组HP滤波器的其中之一。如果使用更为复杂的滤波器(具有不止一个变量,即更多的参数被改变而不仅仅是截止频率),后一实施例尤其有用。该选择可以利用查找表来执行,其中根据LP截止频率,该信号经历与不同HP滤波器等效的不同数字计算。
在多数优选实施例中,该系统组合上述两个优选实施例,即该系统包括一方面用于建立样本频率fs然后基于该fs值确定HP截止频率、另一方面用于测量噪声电平并确定HP截止滤波器值然后确定LP截止滤波器频率的装置。
优选地,所述高通频率位于300和2kHz之间,所述低通频率位于2kHz和fs/2之间,其中fs是样本频率。
优选地,该放大器不用来放大具有低于阈值的信号强度的信号。
在阈值(某一最小幅度)之下,信号可能是由噪声造成的。不放大这种信号改进了可懂度,因为噪声被减小了。此外,无声和语音之间的差别更好区分,这也提高了可懂度。在用户需要设置该阈值的情况下,例如当进行几个电话呼叫时,该阈值可以在初始化时间或者在运行时间被设置,因为信号噪声可能依赖于GSM提供商或者由远端用户使用的GSM设备。
所述高通滤波器优选地是1阶或2阶滤波器,即具有相对渐变的斜率的滤波器。有利的是去除进入的信号的低频分量的很多能量,以便为放大提供净空。然而,具有相对陡的斜率的滤波器(阶梯滤波器是这种滤波器的最极端的例子)去除了很多低频分量,从而可能导致听起来不自然的语音。优选地,该系统包括使用户能够改变所述阶数和/或截止频率的装置。使用2阶高通滤波器产生了较好的语音可懂性和/或信号响度,而使用1阶高通滤波器将保持原始信号的更为自然的声音。
在一个优选实施例中,该系统包括高通(HP)滤波器,其后是AGC,其后是限制器/限幅器,其后是低通(LP)滤波器。在主要关心信号响度的情况下,该实施例是优选的。限制器扫描音频信号中的峰值,并且在有必要进行衰减的情况下衰减该峰值周围的音频部分以便限制限幅的量,同时对于非常响的信号允许进行限幅。
在一个不同的优选实施例中,该系统包括自动音量校平器(leveler),在它前面、或优选地在它后面是高通(HP)滤波器,其提供经校平的信号,其后是增益和限幅器,其后是低通(LP)滤波器。当低计算量是优选的话,该实施例是优选的。
(硬)限幅是简单的操作,其中任何高于阈值信号强度的信号都被减小到所述给定的阈值信号强度,即设置最大信号强度。该实施例的优点在于使用了简单的系统,其缺点在于信号被更严重地失真,因为信号中的高于阈值信号的任何细节都被丢失。
在所有实施例中,HP和LP截止频率被耦合在一起。这形成了本发明的核心,HP和LP滤波器动作被匹配,其中由于应用一个滤波器而造成的变色至少部分地由另一滤波器的动作来补偿。通常,“领导滤波器”是HP滤波器,即HP截止频率将在参数的基础上建立,接下来是LP截止频率,但是在其中进入的信号具有小样本频率的实施例中,该“领导滤波器”可以是LP滤波器。
在各优选实施例中,该系统包括测量系统(诸如麦克风),以用于测量背景噪声电平。
优选地,对于一个或多个参数,对于所测量的噪声电平的相关性是非线性的。
在本发明的概念中,“限幅器”、“压缩器”、“放大器”、“滤波器”、“转换器”、“比较器”等等应当被宽泛地理解,并且包括例如任何硬件(诸如限幅器、压缩器、放大器等等)、被设计用于执行限幅、压缩、放大等所述功能的任何电路或子电路、被设计或编程来执行根据本发明的限幅、压缩、滤波等操作的任何软件(计算机程序或子程序或一组计算机程序或程序代码)以及(单独地或组合地起到上述功能的)任何硬件和软件的组合,而不限于以下给出的示例性实施例。一个程序可以组合几种功能。
本发明也可以用任何计算机程序来实现,所述计算机程序包括程序代码装置,当在计算机上运行所述程序时,所述程序代码装置用于执行根据本发明的方法。本发明也可以用任何计算机程序产品实现,所述计算机程序产品包括存储在计算机可读介质上的程序代码装置,当在计算机上运行所述程序时,所述程序代码装置用于执行根据本发明的方法。本发明还涉及任何包括在根据本发明的电话系统中使用的程序代码装置的程序产品,其用于执行本发明特定的操作。
下面将通过实例的方式并且参照附图来更详细地描述本发明的这些和其他方面,其中:
现在将通过参照附图来更完全地描述本发明,附图中显示了本发明的各优选实施例。然而,本发明可以以不同的形式来实现,并且不应该被视为限制在以下阐述的实施例中。类似的附图标记表示类似的元件。
图1示意性地说明了一种声音再现系统。该系统例如可以是用于汽车中的免提(hands-free)扬声器蜂窝无线电话。当被实现为免提蜂窝电话时,从远端(即从远方)接收的语音信号是从蜂窝基站(未示出)发送的,并且由蜂窝电话的收发器(未示出)接收,所述语音信号作为输入波形W被施加到用于进入的远端信号的输入端1。在该例中,假设在所述系统(在该例中是电话系统)和所述远端之间的来回传输是数字形式的。如果原始信号是模拟形式,那么该系统包括AD转换器以便产生数字远端信号,该数字远端信号然后被馈送到输入端1。
如图1所示,在DSP(数字声音处理器)2的输入端1或者在连接到DSP2的输入端1处,以数字的形式施加波形,该DSP2连接到或者包括数字输出端3。该数字信号输出被馈送到DA转换器4并被转换成模拟格式,并且由放大器5放大以便由扬声器6使用。表示远方的语音的声压波W1由扬声器5发射。因此,无线电话用户听到表示远方的语音的声压波形。
然而,收听者不仅仅听到由扬声器产生的声音,而且还听到其他声音,这会使扬声器产生的声音很难理解,即具有较低可懂度。
调高音量看起来是提高可懂度的很明显的第一选择。然而,扬声器的最大输出电平经常是受限制的,因此简单地调高音量通常导致更大的噪声,而不一定是更好懂的信号。
为了改进可懂度,在根据本发明的系统和方法中采取了许多协作措施。
图2非常示意性地说明了在根据本发明的系统中使用的DSP(数字声音处理器)。该DSP包括具有截止频率(例如优选地在300Hz和2kHz之间,例如在500和1500Hz之间,更优选地在800和1200Hz之间)的高通(HP)滤波器21。该高通滤波器去除或减少低于截止频率f的频率分量。
通过该HP滤波器,信号的大部分能量被去除。这使剩余的信号能够被放大器22更大地放大(在遇到关于数字限幅的问题之前,即高于最大值的值)。然而,HP滤波相对于低频提高了高频,从而导致尖锐的声音。在放大之后应用低通滤波器(LP)23至少部分地恢复了声音的“自然性”。在根据本发明的系统中,HP和LP截止频率f和f’被匹配,这示意性地由HP和LP滤波器之间的箭头表示。该系统具有用于建立频率f或者f’并且一旦建立了其中一个频率就建立另一个频率的装置。
在根据本发明的系统中,HP和LP滤波器的截止频率以及由此其截止动作是匹配的,即它们是互相关的。如到现在为止所述的那样,该系统一方面包括建立器24、25以用来建立HP或LP截止频率f或f’,以及包括匹配器26以用来将LP或HP截止频率匹配到所建立的HP或LP截止频率。在所有实施例中,HP和LP截止频率被耦合在一起。这形成了本发明的核心,HP和LP滤波器动作被匹配,其中,由于应用一个滤波器而造成的变色至少被另一个滤波器的动作部分地补偿。“匹配”意味着在f和f’之间存在一种关系,即f=F(f’)或者f’=F’(f)。通常,“领导滤波器”将是HP滤波器,即在所测量的或所确定的参数的基础上建立HP截止频率,其后是LP截止频率,但是在其中进入的信号具有较小样本频率的实施例中,“领导滤波器”可以是LP滤波器。
图3示意性地说明了具有高通滤波器频率f的高通滤波器,该滤波器频率f可以受到参数P的影响,比如环境噪声电平、线路噪声电平、由用户设置的参数或者所述放大。所述建立器根据所述一个或多个参数建立HP截止频率。该影响由通过频率f的横向箭头以及P和f之间的箭头示意性地表示。该系统包括匹配器,该匹配器将低通滤波器23的低通频率f’匹配到HP滤波器频率f。在本发明中,“匹配”不应当被理解为使f等于f’或相反,而应该是在f的值和f’的值之间建立一种关系,即f’=F(f),其中F表示函数。其可以是固定的关系,即固定的函数F,或者该函数可以依赖于其他参数,这在图3中由字母P’和该字母与函数F之间的箭头示意性地表示。所述参数可以例如是环境噪声电平N、线路噪声电平或者HP和LP滤波器之间的放大器的放大(增益)。在这种情况下,f和f’之间的关系可以由f’=F(f,P’)表示。
图4说明了图3所示的方案的一种变型。在该实施例中使用了多个LP滤波器,并且根据所建立的HP截止频率f以及可能的附加参数P’,使用匹配器把由放大器22放大之后的所述信号引导到其中一个LP滤波器,其中每个滤波器具有截止频率f’。这在图4中由互连HP滤波器和其中一个LP滤波器的不同箭头示意性地示出,其中截止频率在不同的LP滤波器中是不同的。
然而,这个实施例比其中使用单个LP滤波器的实施例更复杂。如果使用更为复杂的LP滤波器(具有不止一个变量,即更多的参数被改变而不仅仅是LP截止频率,例如滤波器阶数),后一实施例尤其有用。该选择可以利用查找表来执行,其中根据所建立的HP截止频率,所述信号经历与不同LP滤波器等效的不同数字计算。这可以在两个步骤中执行,其中在第一步骤中确定噪声电平,这触发了对HP截止频率的选择,然后根据该HP截止频率来选择LP截止频率。该选择可以取决于附加参数。
图5示意性地说明了一个实施例,其中建立LP滤波器频率作为样本频率fs的函数,并且HP滤波器截止频率是所建立的LP滤波器截止频率f’的函数,即f=F(f’),匹配器26匹配频率f’和f,即基于所建立的f’计算f。在一些实施例中,函数F本身依赖于其他参数P’,例如噪声电平。
图6说明了图5所示实施例的一个变型。在该实施例中使用了多个HP滤波器,并且根据所建立的LP截止频率f以及可能的附加参数P’,使用匹配器把由放大器22放大之后的所述信号引导到其中一个HP滤波器,其中每个滤波器具有截止频率f。这在图6中由互连LP滤波器和其中一个HP滤波器的不同箭头示意性地示出,其中截止频率在不同的HP滤波器中是不同的。
然而,这个实施例比其中使用单个HP滤波器的实施例更复杂。如果使用更为复杂的HP滤波器(具有不止一个变量,即更多的参数被改变而不仅仅是HP截止频率,例如滤波器阶数),后一实施例尤其有用。该选择可以利用查找表来执行,其中根据所建立的LP截止频率,所述信号经历与不同HP滤波器等效的不同数字计算。这可以在两个步骤中执行,其中在第一步骤中确定样本频率,这触发了对LP截止频率的选择,然后根据该LP截止频率来选择HP截止频率。该选择可以取决于附加参数。
图7以图形的方式显示了LP截止频率f’和HP截止频率f之间的关系。通过在HP(f)和LP(f’)截止频率曲线图之间对于参数(例如噪声)的特定值绘制一条垂直线以及读取相应的曲线值(由双箭头表示)而发现该关系。如图所示,所述曲线图可以是连续的(f’1(P)LP和f1(P)HP)或者是阶梯状的(f’2(P)LP和f2(P)HP),例如使用多个不同的LP或HP滤波器的情况。所述曲线本身可以依赖于参数P和/或P’,例如所测量的噪声电平N、线路噪声电平、所选择的放大水平(可以由用户设置)、相同的频率fs。
所述放大是由放大器22完成的(参见图2)。
该放大器22优选地是压缩放大器。压缩放大器是这样的放大器,其放大信号,同时也对平均声级进行校平,即具有较小幅度的声音比具有较高声级的声音被更大地放大,从而减小信号幅度范围。这可以以几种方式完成,例如限幅器/限制器装置、限幅器/压缩器或AVL(自动电压校平器),其后是增益和限幅器。可以使用多种不同的技术,包括使用查找表来执行放大和压缩。所述幅度范围、尤其是该范围的上限可以由制造商设置或者受到用户影响,例如通过响度设置器(用户可以用来设置响度的旋钮)设置。与对信号的直接线性放大(即对于所有的声级具有相等的放大因子)相比,压缩的放大导致声音更为可懂,尤其是在环境噪声较高的情况下,其导致静音部分被背景噪声屏蔽。话语更容易区分,从而改进了声音的可懂度。
然而,这也可能导致声音的失真,因为对声音的非线性放大引入了泛音(在原始频率的两倍、三倍等处的高频分量),这导致提高了声音的刺耳度。这令收听者感觉不愉快,并且重要的是实际上在更广的意义上降低了语音消息的可懂度,因为所说出的话语的刺耳度常常形成语音消息的一个重要方面。该效应即使在没有限幅的情况下也存在,但是限幅本身也引入泛音,从而使信号更为失真。
在更广的意义上,可懂度不仅仅与话语有关,而且也与说话者希望传达给收听者的消息有关。声音的刺耳度、尤其在较高平均放大下的刺耳度使得每个人听起来都是生气的,从而大大减小了说话者希望传达的情感的细节。
图2所示的本发明系统中的低通滤波器的应用在压缩放大器之后降低了语音的感觉刺耳度,从而至少在某种程度上恢复了所说出的话语的原始情感内容,即给出了更加自然的声音。
应当注意到,在大多数西方语言中,话语的音调影响话语的情感效果,但不影响话语本身的含义。但是,存在这样的语言,其中话语的音调扮演着更为重要的角色,从而根据话语的音调会导致相同“话语”的完全不同的含义。当使用这种语言时(不能排除这种情况),对于低通滤波器的使用变得更为有利。当与自动语音识别系统结合使用或者使用在自动语音识别系统中时,本发明尤其有利,特别是对于其中所说出的话语的音调影响话语含义的语言。上面关于所说出的话语(即语音)的讨论在声音再现系统被用于再现音乐的情况下同样适用。在音乐中,音乐被感觉的方式当然依赖于收听者是否可以听到音符,但是声音的刺耳度同样非常重要。因此,尽管本发明对于其中对语音消息进行中继的系统非常重要,但是本发明却不限于这样的系统,用于再现音乐的系统同样可以从本发明获益。
校平或压缩动作可以在对进入的信号进行HP滤波之前执行或者在其已经被HP滤波之后执行。放大本身(即增益)是在HP滤波之后完成的。限幅是在增益之后或者与增益相结合地完成的。当使用限幅器时,低通滤波器被放置在限幅器之后。
如上所述,HP和LP截止频率之间的关系可以是固定的,或者可以依赖于多个参数。
放大级和/或限幅级可能导致信号的变色,在本系统的更复杂的实施例中,用于匹配HP和LP频率的匹配器包括用于HP和LP滤波器之间的元件(诸如放大器和/或限幅器)的至少一个参数的输入端,因此,HP和LP截止频率之间的关系依赖于所述参数,即f’=F(f,P)或者f=F’(f’,P’),其中P和P’表示这种中间元件的参数。例如,由限幅器和/或校平放大器引入的非线性可能引入更高的泛音,因此根据这种元件的存在或效果,LP滤波器的LP滤波器截止动作可以被提高。
图8给出了可以在根据本发明的系统中使用的高通滤波器的两个实例。
图的左边说明了1阶滤波器,右边是2阶滤波器。所示的高通滤波器具有大约为1kHz的截止频率f。1阶或2阶高通滤波器(其具有每倍频程5-15dB的相对适度的斜率)是优选的。去除太多的低频分量导致听起来非常不自然的语音(或着听起来非常不自然的奇怪的音乐)。因此,高通滤波的阶数优选地被限制为2。这也减小了所需要的计算量。优选地,用户可以将高通滤波器从1阶改变到2阶,反之亦然,或者该系统包括根据进入的信号的自动切换机制。使用2阶产生了较高的语音可懂度(在严格的意义上,即仅仅是话语)和/或信号响度,而1阶HP滤波器将更好地保留原始信号的自然声音。
HP滤波器可以例如由双二次(biquad)构成,其系数被列在表1中,根据以下格式:
表1-图3中所示的HP滤波器的滤波器系数
|
1阶 |
2阶 |
b0b1b2 |
0.70710678118655-0.707106781186550.00000000000000 |
0.56903559372885-1.138071187457700.56903559372885 |
a1a2 |
-0.414213562373100.00000000000000 |
-0.942809041582060.33333333333333 |
较低频率的主要贡献在于语音中的特定声音,而对语音可懂度的贡献较小。这一属性形成了本发明的一个方面。
通过衰减较低频率,信号幅度将显著地降低,从而建立净空以便放大剩余的信号,所述剩余的信号包含相对较多的对语音可懂度有贡献的频率。
当随后放大语音信号时,即使对其进行压缩和限幅,语音可懂度也将比不使用HP滤波器的情况更好,这主要是出于两个原因:
-该信号包含相对较多的对语音可懂度有贡献的频率
-对低频的限幅不那么严重,导致对语音可懂度有干扰的谐波较少(由于限幅)。
然而,去除太多的低频将导致听起来非常不自然的语音。因此,HP滤波器优选地是仅仅1阶,例如Butterworth(1阶IIR)滤波器。其具有计算能力消耗很少的优点。
图9说明了根据本发明一个实施例的系统的细节。
DSP包括HP滤波器(例如图8所示的HP滤波器,在该例中例如是Butterworth 1阶或2阶滤波器,其截止频率值例如在50和2kHz之间),其后是AGC,其后是限制器/限幅器,其后是低通滤波器(LP),其截止频率在2kHz和fs/2之间。
在该实例中,所有的音频流都可以是单声道的。样本速率频率可以例如是下列各项的其中之一:8kHz,11.025kHz,16kHz,22.05kHz,32kHz,44.1kHz或48kHz。
对于具有非常低的样本频率(例如8kHz)的进入信号,LP滤波器截止频率被设置在fs/2(即4kHz),HP截止频率然后被设置在例如400Hz,对于16kHz的样本频率,HP截止频率被设置在200Hz,依此类推。因此,样本频率fs建立LP截止频率,而HP截止频率则被匹配到LP截止频率。
在各实施例中,AGC(自动增益控制)基于块操作,这意味着增益因子仅仅对于每块改变。按照这种方式,计算能力被保持在最小。
增益例如可以如下计算:
首先,计算输入信号的运行RMS(均方根)值。该RMS值是基于信号波形的最近“历史”的平滑平均值。然后,使用超前时间(look-ahead time)来计算峰值以便预期即将到来的信号峰值。
利用所述RMS和峰值来计算波峰因子(crest-faetor)。所谓的“去峰化”因子被用来指定该算法对尖峰信号进行限幅的程度(高的值将产生更大的限幅)。之后计算增益,并且将该增益与最大允许增益相比较,该最大允许增益可以由用户设置,并且选择这两个值当中的最小值。虽然这里未示出,但是最大允许增益设置可以是高通滤波器的输入,其中截止频率是最大允许增益设置的函数(或者更通常的是滤波器的一个或多个特性,其除了截止频率值之外还可以包括或者替换地包括从1阶到2阶的切换)。
最大允许增益设置可以是高通滤波器的输入,其中截止频率是最大允许增益设置的函数(或者更通常的是滤波器的一个或多个特性,其除了截止频率值之外还可以包括或者替换地包括从1阶到2阶的切换)。
图9说明了本发明的一种类型的实施例,图10针对的是一个不同类型的实施例。
基本上,这些实施例包括以下多个元件或步骤:
1.AVL(自动音量校平器):AVL是依赖于信号的处理块,其将进入信号的音量保持在近似恒定的电平;
2.(1阶)HP(高通)滤波器:该滤波器去除了一部分较低频率,从而为放大建立净空;
3.增益:提高信号的SPL(声压电平),即放大该信号;
4.在各优选实施例中的限幅器,当简单系统是优选的时,其优选地是硬限幅器:该信号被限幅在某个幅度,以便确保(在D/A转换之后的)模拟放大器的线性运算。除了硬限幅器(其简单地削去高于限幅电平的信号)之外,也可以使用软限幅器,该软限幅器削去高于限幅电平的信号同时衰减接近于该限幅电平的信号。使用软限幅器在某种程度上恢复了信号的动态行为,从而提高了可懂度;
5.LP(低通)滤波器:该滤波器恢复或者至少改进中频和高频之间的平衡,不平衡使得声音不自然,并且信号听起来相当刺耳;该LP滤波器使得经处理后的声音听起来更悦耳。HP和LP滤波器的截止频率被匹配。
在该实例中,输入是语音输入,但是应当注意到,该输入可以是任何声音信号。
在图11中示出示例性AVL行为。
左图显示了3个输入信号的幅度的阶梯改变。右图显示了AVL增益对于较大幅度变化提高得更快。这是一个优选实施例,其进一步改进了可懂度。
图12说明了与图10所示的类似的设备,其中使用传感器(测量系统)130用于测量背景噪声,例如单独的麦克风。该设备包括用于建立HP滤波器的截止频率的建立器131。应当注意,虽然未示出,但是可以根据所测量的噪声电平得到其他参数(诸如增益、限幅、AVL的设置)。
在各优选的简单实施例中,噪声测量可以给出表示总的噪声S的单一数据,或者可以对于不同噪声带给出噪声数字Sf1、Sf2、Sf3等等。如果对于不同的噪声带测量噪声数字,那么可以计算平均噪声或总噪声,例如Sav=∑Sfi,或者根据dB(A)比例因子进行加权,例如Sav=∑wiSfi,其中是wi是dB(A)比例因子的加权系数。通过幅度测量来计算噪声电平。
HP截止频率被适配于所测量的噪声。噪声电平越高,截止频率越高。对于自适应实施例,截止频率可以有利地在比非自适应实施例更宽的范围上变化。HP截止频率f的范围有利地在50Hz(对应于基本上没有噪声的情况)到对应于高噪声电平的情况的典型地高达2kHz之间。
HP滤波器截止频率因此根据环境噪声量而被更新,并且通常在从例如50Hz的非常低的值(没有环境噪声)到2kHz(大环境噪声)的范围上变化。在大噪声环境中,更多低频被去除,从而建立更多的净空以便之后放大信号。所建议的最大值为2kHz,以便避免去除对语音可懂度有贡献的频率。滤波器系数在运行时间被计算。
截止频率与噪声电平之间的关系优选地被设置如下:fcut-off=f0+Δf(S),其中f0是噪声下限(例如50、100或300Hz),而Δf是噪声电平的高于线性(与Si成比例,其中i大于1)的函数。
匹配器26将LP截止频率匹配到所建立的HP截止频率,即,f’由f’=F(f)设置。
在没有噪声的情况下,截止频率被设置在上限处,例如fs/2。
对于最大噪声,截止频率被设置在下限处,例如2kHz。
图12示意性地说明了匹配本身可以依赖于增益电平以及依赖于样本频率fs。在各优选实施例中,匹配器可以以两种方式操作,即根据样本频率和所测量的噪声,LP截止频率被匹配到HP截止频率(或者反之)。
在这些实施例中,所使用的算法被设计来自适应地操作,其由环境(近端)噪声量驱动。这导致用户友好的系统特征,其允许系统用户在与环境噪声有关的变化的条件下使用其系统(例如GSM),而不需要任何其他交互来控制GSM音量级。
当在自适应处理模式中使用时,根据环境噪声,各处理块的参数被适配于进入的样本。该算法根据环境噪声来适配参数。噪声量可以由单独的麦克风测量或者使用系统(GSM)麦克风(对于单个麦克风应用)来估计。
当环境噪声的音量降低时,各参数优选地被非常快速地适配,以便恢复进入信号的自然度和温暖度。
术语“无环境噪声”并不表示完全的寂静,而是表示规则的噪声,诸如风扇噪声、背景音乐等等。在典型的环境中,背景噪声通常是大约50dB(A)。术语“大环境噪声”表示正在通过的火车或地铁的噪声、舞厅中的噪声等等。这些噪声可以高达100dB(A)。
可以通过测量环境噪声的频谱幅度信息并且计算表示噪声量的单个值来测量噪声。
截止频率和所测量的噪声(或者更通常的是截止频率所依赖于的任何参数)之间的关系不必是线性的。
使用线性插值的测试显示出,对于“中间的”环境噪声,该算法的效果太大。
使用更高阶的插值(例如2阶或3阶),对于相同的环境噪声,其效果与线性插值相比较小。对于大环境噪声,效果的量是相等的。
在各优选实施例中的所述系统包括适配器,以用于根据所测量的背景噪声电平来适配除了HP滤波器截止频率之外的一个或多个附加参数。这样的参数例如是高通滤波器的阶数。
简而言之,本发明可以被描述如下:
一种声音再现系统,其包括数字音频信号输入端(1)、数字音频信号处理器(2,DSP)和数字音频信号输出端(3),其中该数字信号处理器(2,DSP)包括具有高通频率(f)的高通(HP)滤波器(21)、用于放大由该HP滤波器滤波的信号的放大器(22)和用于在由放大器(22)放大之后对信号进行滤波并且提供输出信号的具有低通频率(f’)的低通(LP)滤波器(23),并且该数字处理器包括用于建立所述高通频率或低通频率的建立器(24,25)以及用于将所述高通滤波器和低通滤波器的高通频率和低通频率分别互相匹配的匹配器(26)。
对于HP和LP截止频率的匹配,使得这些滤波器对于所感觉到的语音的效果相匹配。特别地,其减小了否则将被听到的声音的尖锐度。
本发明可以用于不同的系统。本发明特别可用于免提移动电话。然而,本发明可用于所有的声音再现系统,尤其是那些运行在具有有限电压源和/或小扬声器的系统上的声音再现系统。以下是可能应用的列表:
-手机(移动电话、DECT等等);
-便携式系统,例如便携式DVD播放器;
-PDA;
-汽车套件;
-电视、计算机;
-web终端;
-应答机。
本领域的技术人员可以理解,本发明不限于这里已经特别显示和描述的内容。本发明在于每个新颖特征和每个特征组合。权利要求中的附图标记不限制所保护的范围。“包括”一词并不排除在权利要求中所列的之外的其他元件。元件之前的冠词“一个”并不排除存在多个这类元件。
已经根据特定实施例对本发明进行了描述,所述实施例是对本发明的说明而非限制。本发明可以用硬件、固件、软件或其组合来实现。其他实施例在所附权利要求书的范围之内。
许多其他变型也可能落在本发明的概念中。