CN103109318A - 利用前向混迭消除技术的编码器 - Google Patents
利用前向混迭消除技术的编码器 Download PDFInfo
- Publication number
- CN103109318A CN103109318A CN2011800434768A CN201180043476A CN103109318A CN 103109318 A CN103109318 A CN 103109318A CN 2011800434768 A CN2011800434768 A CN 2011800434768A CN 201180043476 A CN201180043476 A CN 201180043476A CN 103109318 A CN103109318 A CN 103109318A
- Authority
- CN
- China
- Prior art keywords
- frame
- mixed
- repeatedly
- forward direction
- subframe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims description 105
- 238000000034 method Methods 0.000 claims description 64
- 239000002131 composite material Substances 0.000 claims description 41
- 230000008030 elimination Effects 0.000 claims description 22
- 238000003379 elimination reaction Methods 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 7
- 238000005086 pumping Methods 0.000 claims description 6
- 230000005284 excitation Effects 0.000 claims description 5
- 238000003780 insertion Methods 0.000 claims 1
- 230000037431 insertion Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 description 39
- 230000008569 process Effects 0.000 description 33
- 238000012545 processing Methods 0.000 description 28
- 102100040006 Annexin A1 Human genes 0.000 description 25
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 description 25
- 101000929342 Lytechinus pictus Actin, cytoskeletal 1 Proteins 0.000 description 25
- 239000012634 fragment Substances 0.000 description 22
- 101000959200 Lytechinus pictus Actin, cytoskeletal 2 Proteins 0.000 description 19
- 230000000694 effects Effects 0.000 description 16
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 11
- 238000007792 addition Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000009795 derivation Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 238000000844 transformation Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 101100499351 Chlorobaculum tepidum (strain ATCC 49652 / DSM 12025 / NBRC 103806 / TLS) lpd gene Proteins 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
本文提供了一种支持在时域混迭消除转换编码模式与时域编码模式之间切换的编解码器,其通过将其他语句部分添加到帧来实现较小可能的帧损失,编码器的分析器可根据该语句部分在预期当前帧包括的第一动作并由此从当前帧读取前向混迭消除数据与不预期当前帧包括的第二动作并由此不从当前帧读取前向混迭消除数据之间进行选择。换言之,尽管由于新语句部分的提供而损失一点编码效率,但其仅是在通信信道具有帧损失的情况下提供使用编解码器的能力的新语句部分。没有新语句部分,解码器在帧损失后将无法解码任何数据流部分且在试图恢复分析时将异常。因此,在易于出错的环境中,通过引入新语句部分来防止编码效率消失。
Description
技术领域
本发明与支持时域混迭消除转换编码模式和时域编码模式以及用于在两模式的间切换的前向混迭消除技术的编解码器相关。
混合不同的编码模式以编码表示不同类型的音频信号(诸如语音、音乐等)的混合的一般音频信号是有益的。各种编码模式可适用于特定的音频类型,且因此,多模式音频编码器可利用对应于音频内容类型的改变而随时间改变编码模式的优点。换言之,多模式音频编码器可确定例如利用特定专用于编码语音的编码模式来编码具有语音内容的音频信号的一部分,并利用另一编码模式来编码表示非语音内容(诸如音乐)的音频内容的不同部分。时域编码模式(诸如码簿激励线性预测编码模式)倾向更适用于编码语音内容,而例如至于有关音乐编码,转换编码模式倾向于胜过时域编码模式。
背景技术
已存在用于解决处理不同音频类型共存于一个音频信号内的问题的解决方案。例如,目前新兴的USAC建议在主要遵循AAC标准的频域编码模式与类似于AMR-WB+标准的子帧模式的两个其他线性预测模式(即,TCX(TCX=转换编码激励)模式和ACELP(适应性码簿激励线性预测)模式的基于MDCT(修正离散余弦转换)的变形)之间切换。更明确地,在AMR-WB+标准中,TCX基于DFT转换,但在USAC TCX中具有MDCT转换基础。特定帧结构被使用以在类似于AAC的FD编码域与类似于AMR-WB+的线性预测域之间切换。AMR-WB+标准本身使用针对USAC标准形成子帧结构的独自帧结构。AMR-WB+标准允许将AMR-WB+帧子分成较小的TCX和/或ACELP帧的特定子分配置。类似地,AAC标准使用基本帧结构,但允许利用不同窗口长度来转换编码帧内容。例如,长窗口和关联的长转换长度可被使用,或者具有较短长度的关联转换的八个短窗口可被使用。
MDCT产生混迭。因此,这在TXC和FD帧边界处是如此的。换言之,正如利用MDCT的任何频域编码器,混迭在窗口重迭区域发生,而这借助于相邻帧来消除。即,对于在两个FD帧之间或在两个TCX(MDCT)帧之间的任何转变或者在FD至TCX或TCX至FD之间的转变,存在解码端利用重构内的重迭/相加过程的隐性混迭消除。随后,在重迭相加之后不再有混迭。然而,在利用ACELP的转变的情况下,没有内在的混迭消除。随后,新的工具必须被引入,其可被称为FAC(前向混迭消除)。FAC用于消除来自相邻帧(在它们不同于ACELP时)的混迭。
换言之,每当转换编码模式与时域编码模式(诸如ACELP)之间的转变发生时,混迭消除问题产生。为了尽可能有效地执行从时域到频域的转换,时域混迭消除转换编码被使用,诸如MDCT,即,利用重迭转换的编码模式,其中,信号的重迭窗口部分使用转换来转换,根据该转换,每部分的转换系数数目少于每部分的样本数目,使得对于有关的各个部分,混迭发生,而该混迭利用时域混迭消除来消除,即,通过将相邻的再转换信号部分的重迭混迭部分相加来消除。MDCT是这种时域混迭消除转换。不利地,TDAC(时域混迭消除)不可用于TC编码模式与时域编码模式之间的转变。
为解决该问题,前向混迭消除(FAC)可被使用,根据该FAC,每当在编码模式中从转换编码到时域编码的改变发生时,编码器在当前帧内的数据流附加FAC数据中发送信号。然而,这需要解码器比较连续帧的编码模式,以确定当前解码的帧是否在其语句(syntax,语法)内包括FAC数据。反过来,这表示可能有解码器无法确信是否必须同样从当前帧读取或分析FAC数据的帧。换言之,在传输期间丢失一个或多个帧的情况下,解码器不知道关于实时接续(接收)的帧是否发生了编码模式改变以及当前帧编码数据的比特流是否包括FAC数据。因此,解码器必须放弃当前帧并等待下一帧。可替代地,解码器可通过执行两个解码尝试来分析当前帧,一个假设FAC数据存在,以及另一个假设FAC数据不存在,而随后确定两个选择中的一个是否失败。解码过程在两种情况的一个中,将极可能使解码器异常(crashing)。即,实际上,后者的可能性不是可行的方法。解码器应在任何时间知道如何理解数据且不依赖于其自身有关如何处理该数据的推测。
发明内容
因此,本发明的一个目的是提供一种编解码器,其更具错误强健性或帧损失强健性,然而,却支持时域混迭消除转换编码模式与时域编码模式之间的切换。
该目的由与此附带的任何独立权利要求的主题来实现。
本发明基于以下发明点:在其他语句部分被添加至帧中时,可实现更具错误强健性或帧损失强健性且支持时域混迭消除转换编码模式与时域编码模式之间的切换的编解码器,解码器的分析器可根据该其他语句部分在预期当前帧包括的第一动作并因此从该当前帧读取前向混迭消除数据与不预期该当前帧包括的第二动作并因此不从该当前帧读取前向混迭消除数据之间选择。换言之,尽管由于第二语句部分的供应而损失了一点编码效率,但它仅是在通信信道具有帧损失的情况下提供使用编解码器的能力的第二语句部分。没有第二语句部分,则解码器将不能在损失之后解码任何数据流部分,并将在试图继续分析时异常。因此,在易于出错的环境中,通过引入第二语句部分来防止编码效率消失。
附图说明
本发明的其他优选实施方式是从属权利要求的主题。此外,下文中,本发明的优选实施方式将参照附图更详细描述。尤其是:
图1示出了根据一种实施方式的解码器的示意性框图;
图2示出了根据一种实施方式的编码器的示意性框图;
图3示出了图2的重构器的可行实施的框图;
图4示出了图3的FD解码模块的可行实施的框图;
图5示出了图3的LPD解码模块的可行实施的框图;
图6示出了说明根据一种实施方式的为产生FAC数据的编码过程的示意图;
图7示出了根据一种实施方式的可行的TDAC转换再转换的示意图;
图8、图9示出了用于说明在编码器中进一步处理以测试最优意义的编码模式改变的编码器的FAC数据的路径轮廓的框图;
图10、图11示出了解码器的处理以从数据流到达图8、图9的FAC数据的框图;
图12示出了解码端越过不同编码模式的边界帧的基于FAC的重构的示意图;
图13、图14示意性示出了在图3的转变处理器处执行的以便执行图12的重构的处理;
图15至图19示出了根据一种实施方式的语句结构的部分;以及
图20至图22示出了根据另一实施方式的语句结构的部分。
具体实施方式
图1示出了根据本发明的一种实施方式的解码器10。解码器10被用于解码包括信息信号18的时段16a-c分别被编码而成的一系列帧14a、14b和14c的数据流。如图1所示,时段16a至16c是彼此时间上直接相邻且时间上相继排序的非重迭片段。如图1所示,时段16a至16c可以是相等大小,但不同实施方式也是可行的。时段16a至16c的每一个被编码为帧14a至14c的相应一个。换言之,每个时段16a至16c唯一关联于帧14a至14c中的一个,反过来,帧14a至14c也具有在它们间限定的顺序,其遵循分别被编码为帧14a至14c的时段16a至16c的顺序。尽管图1建议各帧14a至14c是例如相等的编码位测量长度,当然,这不是强制性的。相反,帧14a至14c的长度可根据相应的帧14a至14c所关联的时段16a至16c的复杂性而变化。
为容易说明以下概述的实施方式,假设信息信号18是音频信号。然而,应注意,信息信号也可以是任何其他信号,诸如由物理传感器等(例如光学传感器等)输出的信号。具体地,信号18可以特定采样率而被采样,且时段16a至16c可分别覆盖该信号18在时间和采样数目上相等的实时连续部分。每个时段16a至16c的采样数目例如可以是1024个样本。
解码器10包括分析器20和重构器22。分析器20被配置为分析数据流12,并在分析数据流12时,从当前帧(即,当前被解码的帧)14b读取第一语句部分24和第二语句部分26。在图1中,示例性假设帧14b是当前将被解码的帧,而帧14a是实时地在之前已被解码的帧。各帧14a至14c具有结合在其中的第一语句部分和第二语句部分,且其重要性或含义将在以下被概述。图1中,在帧14a至14c内的第一语句部分用其中具有“1”的方块指示,且第二语句部分用标示为“2”的方块指示。
自然,各帧14a至14c也具有结合在其中的其他信息,该其他信息用于表示将在下文以更详细方式叙述的关联时段16a至16c。该信息在图1中以斜线块指示,其中,附图标记28被用于当前帧14b的其他信息。分析器20被配置为在分析数据流12时也从当前帧14b读取信息28。
重构器22被配置为利用时域混迭消除转换解码模式和时域解码模式中的所选择的一个重构与基于其他信息28的当前帧14b相关联的信息信号18的当前时段16b。该选择取决于第一语句元素24。两种解码模式通过利用再转换以从频域返回至时域的任何转变的存在或不存在而彼此不同。再转换(伴随其相应转换)引入混迭,只要涉及各自时段,然而,只要注意到在以时域混迭消除转换编码模式编码的连续帧之间的边界处转变,则混迭可利用时域混迭消除来补偿。时域解码模式不需要任何再转换。相反,解码保留在时域中。因此,一般而言,重构器22的时域混迭消除转换解码模式包括利用重构器22执行的再转换。该再转换将从当前帧14b的信息28获得的第一数量的转换系数(属于TDAC转换解码模式)映射至具有大于第一数量的第二数量的样本的样本长度的再转换信号段,从而引发混迭。反过来,时域解码模式可包括线性预测解码模式,根据该模式,激励和线性预测系数根据当前帧的信息28来重构,在该情况下,这属于时域编码模式。
因此,从上述讨论变得清晰,在时域混迭消除转换解码模式下,重构器22从信息28获得用于通过再转换在相应时段16b处重构信息信号的信号段。该再转换信号段长于当前时段16b,其实际是并参与在包括和延长过时段16b的时间部分内的信息信号18的重构。图1示出了转换窗口32,其被用于转换原始信号或转换和再转换二者中。如图可见,窗口32可在其开始处包括零部分321和在其尾端包括零部分322,以及在当前时段16b的前缘与后缘可包括混迭部分323与324,其中,窗口32是1的非混迭部分325可被定位在两个混迭部分323与324之间。零部分321与322是任选的。也可能仅321与322中的一个零部分存在。如图1所示,在混迭部分内窗函数可以是单调增加/减少。混迭发生在混迭部分323与324内,其中,窗口32连续从0导向1或者反之亦然。混迭不是关键的,只要先前和后续的时段也以时域混迭消除转换编码模式来编码。图1针对时段16c示出了这一可能性。点线示出了对于时段16c的相应转换窗口32’,时段16c的混迭部分与当前时段16b的混迭部分324重合。利用重构器22将时段16b与16c的再转换片段信号相加彼此消除了两个再转换信号段的混迭。
然而,在先前或后续的帧14a或14c以时域编码模式来编码的情况下,不同编码模式之间的转变在当前时段16b的前缘或后缘处产生,并且为考虑相应的混迭,数据流12包括在实时跟随该转变的相应帧内的前向混迭消除数据以用于能使解码器10补偿发生在该相应转变处的混迭。例如,可能发生当前帧14b属于时域混迭消除转换编码模式,但解码器10不知道先前帧14a是否属于时域编码模式。例如,帧14a可能在传输期间已遗失,且解码器10因此无法访问。然而,根据帧14a的编码模式,当前帧14b包括前向混迭消除数据以是否补偿发生在混迭部分323的混迭。类似地,若当前帧14b属于时域编码模式,且先前帧14a未被解码器10接收,则根据先前帧14a的模式,当前帧14b具有是否并入其中的前向混迭消除数据。具体地,若先前帧14a属于其他编码模式,即时域混迭消除转换编码模式,则前向混迭消除数据将存在于当前帧14b中以消除以不同方式发生在时段16a与16b之间的边界处的混迭。然而,若先前帧14a属于相同编码模式,即时域编码模式,则分析器20将不必预期前向混迭消除数据存在于当前帧14b中。
因此,分析器20利用第二语句部分26来确定前向混迭消除数据34是否存在于当前帧14b中。在分析数据流12时,分析器20可选择预期该当前帧14b包括的第一动作并因此从当前帧14b读取前向混迭消除数据34以及不预期当前帧14b包括的第二动作并因此不从当前帧14b读取前向混迭消除数据34中的一个,该选择取决于第二语句部分26。若存在,则重构器22被配置为利用前向混迭消除数据来执行在当前时段16b与先前帧14a的先前时段16a之间的边界处的前向混迭消除。
因此,相比第二语句部分不存在的情况,即使在先前帧14a的编码模式例如由于帧损失而对解码器10未知的情况下,图1的解码器也不必放弃或不成功地中断分析当前帧14b。相反,解码器10能够利用第二语句部分26来确定当前帧14b是否具有前向混迭消除数据34。换言之,即使在帧损失的情况下,第二语句部分提供了关于选择中的一个(即对于先前帧的边界的FAC数据)是否存在的清晰标准,适用并确保任何解码器可具有相同作用而不论它们的实施。因此,上述实施方式引入了克服帧损失问题的机制。
在以下进一步描述更详细的实施方式之前,采用相应的图2来描述能产生图1的数据流12的编码器。图2的编码器通常用附图标记40来指示并用于将信息信号编码为数据流12,使得数据流12包括信息信号的时段16a至16c分别被编码而成的帧序列。编码器40包括构造器42和插入器44。构造器被配置为利用时域混迭消除转换编码模式和时域编码模式中的第一选择的一个来将信息信号的当前时段16b编码为当前帧14b的信息。插入器44被配置为将信息28连同第一语句部分24和第二语句部分26一起插入当前帧14b中,其中,第一语句部分信号传送第一选择,即编码模式的选择。反过来,构造器42被配置为确定用于在当前时段16b与先前帧14a的先前时段16a之间的边界处进行前向混迭消除的前向混迭消除数据,并在当前帧14b和先前帧14a利用时域混迭消除转换编码模式和时域编码模式的不同的一个来编码的情况下,将前向混迭消除数据34插入当前帧14b中,并在当前帧14b和先前帧14a利用时域混迭消除转换编码模式和时域编码模式中的相同的一个来编码的情况下,避免将任何前向混迭消除数据插入当前帧14b中。即,每当编码器40的构造器42在某种最佳化意义上确定优选从两个编码模式中的一个切换至另一个时,构造器42和插入器44被配置为确定并将前向混迭消除数据34插入当前帧14b中,而若在帧14a与14b之间保留编码模式,则FAC数据34将不被插入当前帧14b中。为能使解码器从当前帧14b获得FAC数据34是否存在于当前帧14b内而不必知晓先前帧14a的内容,确定的语句部分26根据当前帧14b和先前帧14a是否利用时域混迭消除转换编码模式和时域编码模式中的相同或不同的一个来编码而被设定。以下将概述用于了解第二语句部分26的具体实例。
下文中,将描述实施方式,根据该实施方式,编解码器、解码器和上述实施方式的编码器属于、支持特殊类型的帧结构,根据该特殊类型的帧结构,帧14a至14c本身受子帧限制,且存在两个不同版本的时域混迭消除转换编码模式。具体地,根据以下进一步描述的这些实施方式,第一语句部分24将其被读取的相应帧与下文中被称为FD(频域)编码模式的第一帧类型或下文中被称为LPD编码模式的第二帧类型相关联,且若该相应帧属于第二帧类型,则将由一些子帧组成的相应帧的子分割的子帧与第一子帧类型和第二子帧类型的相应一个相关联。如将在下文更详细叙述,第一子帧类型可包括TCX编码的相应子帧,而第二子帧类型可包括利用ACELP(即,适应性码簿激励线性预测)编码的该相应子帧。或者,任何其他码簿激励线性预测编码模式也可同样被使用。
图1的重构器22被配置为处理这些不同的编码模式可能性。为此,重构器22可如图3所示来构造。根据图3的实施方式,重构器22包括两个开关50和52以及三个解码模块54、56和58,其各自被配置为解码帧和特定类型的子帧,如下文将更详细描述。
开关50具有使当前被解码的帧14b的信息28进入其中的输入以及控制输入,开关50可根据当前帧的第一语句部分25经由该控制输入而被控制。开关50具有两个输出,其中一个被连接至负责FD解码(FD=频域)的解码模块54的输入,以及其中另一个被连接至子开关52的输入,子开关52也具有两个输出,其中一个连接至负责转换编码激励线性预测解码的解码模块56的输入端,以及其中另一个连接至负责码簿激励线性预测解码的模块58的输入。所有解码模块54至58输出重构与这些信号段利用相应的解码模式而被获得的相应帧和子帧相关联的相应时段的信号段,且转变处理器60在其相应的输入端接收该信号段,以进行如上所述的转变处理和混迭消除(且在下文将更详细描述),从而在其重构的输出端输出信息信号。转变处理器60如图3所示使用前向混迭消除数据34。
根据图3的实施方式,重构器22如下所述操作。若第一语句部分24将当前帧与第一帧类型、FD编码模式相关联,则开关50将信息28转发至FD解码模块54以使用频域解码作为时域混迭消除转换解码模式的第一版本来重构与当前帧15b相关联的时段16b。此外,即,若第一语句部分24将当前帧14b与第二帧类型、LPD编码模式相关联,则开关50将信息28转发至子开关52,其反过来对当前帧14的子帧结构进行操作。为更精确起见,根据LPD模式,帧被分割成一个或多个子帧,该子分割对应于将相应时段16b子分割成当前时段16b的非重迭子部分,如将在下文参照附图更详细叙述。语句部分24分别为一个或多个子部分中的每一个来信号传送,以指示其是否关联于第一或第二子帧类型。若相应子帧属于第一子帧类型,则子开关52转发属于该子帧的相应信息28至TCX解码模块56,以利用转换编码激励线性预测解码作为时域混迭消除转换解码模式的第二版本来重构当前时段16b的相应的子部分。然而,若相应的子帧属于第二子帧类型,则子开关52转发信息28至模块58,以进行码簿激励线性预测编码作为时域解码模式来重构当前时间信号16b的相应子部分。
利用模块54至58输出的重构信号段在进行如上所述的相应转变处理和重迭–相加与时域混迭消除处理时,由转变处理器60按正确(呈现)时顺放置于一起,并将在下文更详细描述。
具体地,FD解码模块54可如图4所示被构造,并如下所述来操作。根据图4,FD解码模块54包括彼此串行连接的解量化器70和再转换器72。如上所述,若当前帧14b是FD帧,则其被转发至模块54,以及解量化器70利用也包括在信息28中的标度系数信息76,执行在当前帧14b的信息28内的转换系数信息74的频谱变化解量化。标度系数在编码器端利用例如心理声学原理来确定,以将量化噪声保持在人类不察觉的阈值以下。
再转换器72随后对被解量化的转换系数信息执行再转换以获得再转换信号段78,其在时间上,延伸过且超过关联于当前帧14b的时段16b。如将在下文更详细叙述,利用再转换器72执行的再转换可以是IMDCT(反向修正离散余弦转换),其包括其后是展开操作的DCT IV,其中之后,利用再转换窗口(该再转换窗口可等同、或源自在产生转换系数信息74时使用的转换窗口)通过以反向顺序执行上述步骤(即,窗口化之后是折叠操作,之后是DCT IV,而后是量化步骤)来执行窗口化,该量化可遵循心理声学原理,以将量化噪声保持在人类不察觉的阈值以下。
值得注意,转换系数信息28的量取决于再转换器72的再转换的TDAC特性,低于长的重构信号段78的样本数量。在IMDCT的情况下,信息47内的转换系数的数目恰等于时段16b的样本数目。即,基础转换可被称为需要时域混迭消除的严格采样转换,以消除由于转换而在边界处发生的混迭,即,当前时段16b的前缘和后缘。
作为次要关注,应注意,类似于LPD帧的子帧结构,FD帧也可以是子帧结构的主题。例如,FD帧可属于长的窗口模式,其中,单一窗口被用于窗口化延伸过当前时段的前缘和后缘的信号部分,以编码相应的时段;或者FD帧可属于短窗口模式,其中,延伸过FD帧的当前时段的边界的相应信号部分被子分割为较小的子部分,其各自分别经历相应的窗口化和转换。在该情况下,FD解码模块54将为当前时段16b的子部分输出再转换信号段。
在已描述了FD解码模块54的可行实施之后,TCX LP解码模块和码簿激励LP解码模块56与58的可行实施将分别参照图5来描述。换言之,图5涉及当前帧是LPD帧的情况。在该情况下,当前帧14b被构造成一个或多个子帧。在当前情况下,构造为三个子帧90a、90b和90c被示出。其可以是默认构造被限制为特定的子构造可能性。各个子部分关联于当前时段16b的子部分92a、92b和92c的相应一个。即,一个或多个子部分92a至92c无隙缝涵盖整个时段16b而不重叠。根据在时段16b内的子部分92a至92c的顺序,在子帧92a至92c之间的序列顺序被定义。如图5所示,当前帧14b不完全被子分成子帧90a至90c。甚至换句话说,当前帧14b的一些部分共属于所有子帧,诸如第一和第二语句部分24和26、FAC数据34、和潜在的如下文将更详细描述的LPC信息的其他数据,尽管LPC信息也可被子构造为各个子帧。
为处理TCX子帧,TCX LP解码模块56包括频谱加权推导器94、频谱加权器96和再转换器98。为了说明的目的,第一子帧90a被示出为TCX子帧,而第二子帧90b被假设为ACELP子帧。
为处理TCX子帧90a,推导器94从在当前帧14b的信息28内的LPC信息104获得频谱加权滤波器,且频谱加权器96利用从推导器94接收到的频谱加权滤波器在频谱上加权有关子帧90a内的转换系数信息,如由箭号106所示。
反过来,再转换器98再转换该频谱加权转换系数信息以获得在时间t处延伸过且超越当前时段的子部分92a的再转换信号段108。由再转换器98执行的再转换可与利用再转换器72执行的相同。实际上,再转换器72和98可具有共有的硬件、软件程序或可程编硬件部分。
由当前LPD帧16b的信息28组成的LPC信息104可表示在时段16b内的一个时间点的LPC系数或在时段16b内的几个时间点,诸如用于各子部分92a至92c的一组LPC系数。频谱加权滤波推导器94根据利用推导器94从LPC系数导出的传输函数来将LPC系数转换为在频谱上加权在信息90a内的转换系数的频谱加权系数,使得其大致接近LPC合成滤波器或其一些修改版本。利用加权器96的频谱加权执行的任何解量化可在频谱上无变化。因此,不同于FD解码模式,根据TCX编码模式的量化噪声利用LPC分析而在频谱上被整形。
然而,由于再转换的利用,再转换信号段108遭遇混迭。然而,通过利用相同的再转换,连续帧和子帧的再转换信号段78和108分别可利用转变处理器60仅通过相加其重迭部分来消除它们的混迭。
在处理(A)CELP子帧90b时,激励信号推导器100从在相应子帧90b内的激励更新信息获得激励信号,且LPC合成滤波器102利用LPC信息104对该激励信号进行LPC合成滤波,以获得用于当前时段16b的子部分92b的LP合成信号段110。
推导器94和100可被配置为执行一些插值,以使当前帧16b内的LPC信息104适用于对应于在当前时段16b内的当前子部分的当前子帧的变化位置。
共同描述图3至图5,各种信号段108、110和78进入转变处理器60,其反过来以正确时间顺序将所有信号段放置于一起。具体地,转变处理器60在FD帧和TCX子帧中的实时连续的一个的时段之间的边界处的时间上重迭的窗口部分内执行时域混迭消除,以重构跨越这些边界的信息信号。因此,分别对于在连续FD帧之间的边界、在之后是TCX帧的FD帧与之后是FD帧的TCX子帧之间的边界,不需要前向混迭消除数据。
然而,每当FD帧或TCX子帧(二者皆表示转换编码模式变体)接续ACELP子帧(表示时域编码模式的形式)时,情况改变。在该情况下,转变处理器16从来自当前帧的前向混迭消除数据获得前向混迭消除合成信号,并将第一前向混迭消除合成信号添加至实时先前时段的再转换信号段100或78以重构跨越相应边界的信息信号。若由于当前帧内的TCX子帧和ACELP子帧限定了在关联时段子部分之间的边界,而使边界落在当前时段16b的内部,则转变处理器可根据第一语句部分24和在其中限定的子帧结构来确定对于这些转变的相应前向混迭消除数据的存在。语句部分26不需要。先前的帧14a可能被遗失或未被遗失。
然而,在与连续时段16a和16b之间的边界重合的边界的情况下,分析器20必须监视在当前帧内的第二语句部分26,以确定该当前帧14b是否具有前向混迭消除数据34,FAC数据34用于消除发生在当前时段16b的前缘端的混迭,因为先前帧是FD帧或之前的LPD帧的最后子帧是TCX子帧。至少,分析器20需要知晓语句部分26,以防先前帧的内容遗失。
类似叙述适用于向其他方向的转变,即,从ACELP子帧到FD帧或TCX帧。只要在相应片段和片段子部分之间的相应边界落在当前时段内部,分析器20便在确定来自当前帧14b本身(即,来自第一语句部分24)的对于这些转变的前向混迭消除数据34的存在时没有问题。第二语句部分不是所需的且甚至是不相关的。然而,若边界发生在,或重叠于先前时段16a与当前时段16b之间的边界,则分析器20需要监视第二语句部分26,以确定前向混迭消除数据34是否对于该转变在当前时段16b的前缘端存在–至少在没有访问先前帧的情况下。
在从ACELP转变至FD或TCX的情况下,转变处理器60从前向混迭消除数据34获得第二前向混迭消除合成信号,并将该第二前向混迭消除合成信号添加至当前时段内的再转换信号段,以重构跨越边界的信息信号。
在已描述的关于图3至图5的实施方式(其总体上涉及不同编码模式的帧和子帧根据其而存在的实施方式)之后,这些实施方式的特定实施将在下文更详细叙述。这些实施方式的描述将同时包括在产生分别包括这些帧和子帧的相应数据流时的可行措施。在下文中,该特定实施方式以统一的语音和音频编解码器(USAC)的方式来描述,尽管其中叙述的原理也可转移至其他信号。
USAC中的窗口切换具有几个目的。其混合FD帧(即,利用频率编码来编码的帧)与LPD帧(其反过来被构造为ACELP(子)帧以及TCX(子)帧。ACELP帧(时域编码)应用矩形、非重迭窗口至输入样本,而TCX帧(频域编码)应用非矩形、重迭窗口至输入样本,且随后,例如利用时域混迭消除(TDAC)转换(即MDCT)来编码该信号。为协调整体窗口,TCX帧可利用具有均匀形状的中心窗口,并管理在ACELP帧边界处的转变,传输用于消除协调化TCX窗口的时域混迭和窗口化效应的明确信息。该另外的信息可被视为前向混迭消除(FAC)。在以下实施方式中,在LPC加权域中量化FAC数据,使得FAC以及被解码的MDCT的量化噪声属于相同性质。
图6示出了在编码器处对利用转换编码(TC)来编码的帧120的处理,帧120的前后是利用ACELP编码的帧122、124。根据上述讨论,TC概念包括在长块和短块上利用AAC的MDCT,以及基于MDCT的TCX。即,帧120可以是例如图5中的子帧90a、92a的FD帧或TCX(子)帧。图6示出了时域标记和帧边界。帧或时段边界用点线指示,而时域标记是沿水平轴的短垂线。应注意,以下描述中,术语“时段”和“帧”由于其间唯一相关,所以有时同义性地被使用。
因此,图6中的垂直点线示出了帧120的开始和结束,帧120可以是子帧/时段子部分或帧/时段。LPC1和LPC2将指示对应于下文使用以进行混迭消除的LPC滤波系数或LPC滤波器的分析窗口的中心。这些滤波系数在解码器处例如通过重构器22或推导器90和100利用插值法使用LPC信息104来导出(参见图5)。LPC滤波器包括对应于其在帧120的开始处的计算的LPC1、以及对应于其在帧120的结束处的计算的LPC2。帧122被假设为已利用ACELP编码。其同样适用于帧124。
图6被构造为在图6右侧编号的四条线。各线表示在编码器处的处理中的步骤。应理解,各线在时间上与上方的线对齐。
图6的线1表示原始音频信号,其如上所述被分割于帧122、120和124中。因此,在标号“LPC1”左侧,原始信号利用ACELP编码。在标号“LPC1”与“LPC2”之间,原始信号利用TC编码。如上所述,在TC中,噪声整形直接被施加在转换域中而不在时域中。在标号LPC2右侧,原始信号再次利用ACELP编码,即,时域编码模式。该编码模式序列(ACELP其后是TC再其后是ACELP)被选择,以示出FAC中的处理,因为FAC与两个转变(ACELP到TC和TC到ACELP)有关。
然而,注意,图6中在LPC1和LPC2处的转变可发生在当前时段的内部或可与其前缘端重合。在第一情况下,关联FAC数据的存在的确定可仅基于第一语句部分24利用分析器20执行,而在帧遗失情况下,分析器20可能需要语句部分26以在后者情况下进行这些处理。
图6的线2对应于各帧122、120和124中的解码(合成)信号。因此,图5的附图标记110在对应于帧122的最后子部分是ACELP编码的子部分(类似于图5中的92b)的可能性的帧122内被使用,而附图标记组合108/78被使用,以类似于图5和图4来指示帧120的信号贡献。此外,在标号LPC1左侧,帧122的合成被假设已利用ACELP编码。因此,在标号LPC1左侧的合成信号110被识别为ACELP合成信号。原则上,因为ACELP尝试尽可能精确地编码波形,所以在ACELP合成与该帧122中的原始信号之间有高度相似性。随后,在图6的线2上的标号LPC1与LPC2之间的片段表示如在解码器处所见的片段120的反向MDCT的输出。此外,片段120可以是FD帧的时段16b或TCX编码子帧的子部分,例如,图5中的90b。附图中,该片段108/78被称为“TC帧输出”。在图4和图5中,该片段被称为再转换信号段。在帧/片段120是TCX片段子部分的情况下,TC帧输出表示再窗口化的TLP合成信号,其中,TLP表示“具有线性预测的转换编码”以指示在TCX的情况下,在转换域中通过利用分别来自LPC滤波器LPC1和LPC2的频谱信息滤波MDCT系数来实现相应片段的噪声整形,其也已参照图5针对频谱加权器96而被叙述。也应注意,合成信号(即,包括在图6的线2上的标号“LPC1”与“LPC2”之间的混迭的初步重构信号(即,信号108/78))包括窗口效应和在其开始与结束处的时域混迭。在如TDAC转换的MDCT的情况下,时域混迭可分别被符号化为展开标号126a和126b。换言之,图6的线2中的上方曲线(从片段120的开始延伸至结束并利用附图标记108/78指示)示出了由于转换窗口中间平坦以维持转换信号不改变但在开始和结束处不同的窗口效应。折叠效应在片段120的开始和结束处利用下方曲线126a与126b来示出,在片段开始处以负号表示并在片段结束处以正号表示。该窗口和时域混迭(或折叠)效应是MDCT固有,其用作关于TDAC转换的明确的实例。当两个连续帧如上所述利用MDCT编码时,混迭可被消除。然而,在“MDCT编码”帧120不是领先和/或跟随其他MDCT帧的情况下,其窗口化和时域混迭将不被消除且在反向MDCT之后保留在时域信号中。前向混迭消除(FAC)随后可被用于校正如上所述的这些效应。最终,在图6中的标号LPC2之后的片段124也被假设利用ACELP来编码。注意,为在该帧中获得合成信号,在帧124开始处,LPC滤波器102的滤波器状态(参见图5)(即,长期和短期预测器的存储)必须自我适当,这意味着在标号LPC1与LPC2之间的先前帧120结束处的时间混迭和窗口效应必须通过应用FAC以将在下文说明的特定方式来消除。总之,图6中的线2包括来自连续帧122、120和124的初步重构信号的合成,其包括对于在标号LPC1与LPC2之间的帧的在反向MDCT输出处的时域混迭中的窗口化效应。
为获得图6的线3,在图6的线1(即,原始音频信号18中)与图6的线2(即,合成信号110和108/78)之间的差分别如上所述被计算。这产生了第一差量信号128。
在编码器侧关于帧120的进一步处理在下文中参照图6的线3来说明。在帧120的开始处,首先,将采用在图6的线2上的标号LPC1的左侧的ACELP合成110的两个贡献如下所述彼此相加:
第一贡献130是最后ACELP合成样本(即,图5所示的信号段110的最后样本)的窗口化和时间反转(折叠)版本。对于该时间反转信号的窗口长度和形状与帧120左侧的转换窗口的混迭部分相同。该贡献130可被视为存在于图6的线2的MDCT帧120中的时域混迭的良好近似。
第二贡献132是在ACELP合成110结束(即,在帧122结束)处采用初始状态作为该滤波器的最后状态的LPC1合成滤波器的窗口化的零输入响应(ZIR)。该第二贡献的窗口长度和形状可与对于第一贡献130的相同。
采用图6中的新的线3,即在相加上述两个贡献130和132之后,编码器采用新的差量来获得图6中的线4。注意,差量信号134在标号LPC2处停止。时域中的误差信号的预期包络的近似图被示出在图6中的线4上。ACELP帧122的误差被预期在时域中振幅近似平坦。随后,TC帧120中的误差被预期为表现出一般形状,即时域包络,如图6中的线4的片段120中所示。该误差振幅的预期形状此处被示出仅用于说明的目的。
注意,若解码器仅使用图6中的线3的合成信号来产生或重构被解码的音频信号,则量化噪声通常将是如图6的线4上的误差信号136的预期包络。因此,应理解,校正应被发送至解码器以在TC帧120的开始和结束处补偿该误差。该误差来自于对于MDCT/反向MDCT对固有的窗口化和时域混迭效应。窗口化和时域混迭如上所述在TC帧120开始处通过相加来自先前的ACELP帧122的管道贡献132和130来降低,但无法如在连续的MDCT帧的实际TDAC操作中被完全消除。在图6中的线4上的TC帧120右侧,刚好在标号LPC2之前,所有来自MDCT/反向MDCT对的窗口化和时域混迭保留,并因此必须利用前向混迭消除来完全消除。
在继续描述编码处理以获得前向混迭消除数据之前,先参照图7来简要说明作为TDAC转换处理的一个实例的MDCT。两个转换方向参照图7被示出并描述。图7上半方中示出了从时域到转换域的转变,而再转换被示出在图7下方部分中。
在从时域转变至转换域时,TDAC转换包括窗口化150,其被施加至将被转换的信号的区间152,区间152延伸越过时段154(后续产生的转换系数实际在数据流内被传输)。被应用在窗口化150中的窗口在图7中被示出为包括越过时段154的前端的混迭部分Lk和在时段154后端的混迭部分Rk,且非混迭部分Mk延伸于其间。MDCT156被施加至窗口信号。即,折叠处理158被执行以折叠在区间152的前端与向后沿着时段154的左侧(前端)边界的时段154的前端之间延伸的区间152的第一个1/4部分。对于混迭部分Rk进行同样处理。随后,对产生的具有与时间信号154一样多的样本的窗口和折叠信号执行DCT IV160,以获得相同数量的转换系数。随后对话在162处进行。当然,量化162可被视为不被TDAC转换包括。
再转换进行反向操作。即,在解量化164之后,IMDCT166被执行,其首先包括DCT-1IV168以获得数量上等于将被重构的时段154的采样数量的时间样本。随后,对从模块168接收到的反向转换信号部分执行展开处理168,从而通过使混迭部分的长度加倍而扩展IMDCT结果的时间区间或时间样本数量。随后,窗口化利用可与由窗口化150使用的一个窗口相同的再转换窗口172(但其也可以是不同的)在170处被执行。图7中的其余块示出了在连续段154的重迭部分执行的TDAC或重迭/相加处理,即,其非折叠混迭部分的相加,如利用图3的转变处理器执行。如图7所示,利用块172和174的TDAC产生混迭消除。
现进一步继续对图6的描述。为有效补偿在图6的线4上的TC帧120的开始和结束处的窗口化和时域混迭效应,并假设TC帧120使用频域噪声整形(FDNS),前向混迭校正(FAC)被应用在以下图8中所述的处理之后。首先,应注意,图8描述了对于标号LPC1附近的TC帧120的左侧部分以及对于标号LPC2附近的TC帧120右侧部分两者的该处理。回想图6中的TC帧120被假设为之前是LPC1标号边界处的ACELP帧122以及随后是LPC2标号边界处的ACELP帧124。
为补偿标号LPC1附近的窗口化和时域混迭效应,该处理在图8中被描述。首先,加权滤波器W(z)从LPC1滤波器被计算。该加权滤波器W(z)可以是LPC1的修改分析或白化滤波器A(z)。例如,W(z)=A(z/λ),其中,λ是预定加权系数。在TC帧开始处的误差信号用附图标记138指示,正如图6的线4上的情况。在图8中,该误差被称为FAC目标。误差信号138在140处利用滤波器W(z)滤波,具有该滤波器的初始状态,即在该滤波器的存储器是图6的线4上的ACELP帧122中的ACELP误差141时具有初始状态。滤波器W(z)的输出随后形成图6的转换142的输入。该转换被示例性示出为MDCT。由MDCT输出的转换系数随后被量化并在处理模块143中被编码。这些编码系数可能形成至少一部分上述FAC数据34。这些编码系数可被传送至编码端。处理Q的输出(即,被量化的MDCT系数)随后是反向转换(诸如IMDCT144)的输入以形成时域信号,该时域信号随后在145处利用具有零存储(零初始状态)的反向滤波器1/W(z)滤波。通过1/W(z)的滤波利用对于在FAC目标之后扩展的样本的零输入而延伸至通过FAC目标的长度。滤波器1/W(z)的输出是FAC合成信号146,该信号146是现在可在TC帧120的开始处被施加以补偿发生在那里的窗口化和时域混迭效应的校正信号。
现将描述对于在TC帧120结束处(在标号LPC2之前)的窗口化和时域混迭校正的处理。为此,参照图9。
在图6的线4上的TC帧120结束处的误差信号提供有附图标记147且表示图9的FAC目标。FAC目标147经历与图8的FAC目标138相同的处理序列,且该处理的不同之处仅在于加权滤波器W(z)140的初始状态。为对FAC目标147滤波的滤波器140的初始状态是图6的线4上的TC帧120中的误差,其在图6中以附图标记148来指示。随后,进一步的处理步骤142至145与图8中应对在TC帧120开始处的FAC目标的处理的步骤相同。
图8和图9中的处理当被施加在编码器处以获得局部FAC合成和计算产生的重构时从左向右被完全执行,以确定通过选择帧120的TC编码模式而包括的编码模式的改变是否为最佳选择。在解码器处,图8和图9的处理仅从中间应用至右侧。即,由处理器Q143传输的被编码和被量化的转换系数被解码为形成IMDCT的输入。例如,参见图10和图11。图10等于图8的右侧,而图11等于图9的右侧。根据现在所述的具体实施方式,图3的转变处理器60可根据图10和图11而被实施。即,转变处理器60可使存在于当前帧14b内的FAC数据34中的转换系数信息经过再转换,以在从ACELP时段子部分转变至FD时段或TCX子部分的情况下,产生第一FAC合成信号146,或者在从FD时段或时段的TCX子部分转变至ACELP时段子部分时,产生第二FAC合成信号149。
还应注意,FAC数据34可与发生在当前时段内的这一转变有关,在该情况下,FAC数据34的存在对于分析器20唯一可从语句部分24获得,而分析器20需要在先前帧已被遗失的情况下,利用语句部分26来确定FAC数据34是否存在以用于在当前时段16b的前缘处的这些转变。
图12示出了可如何通过利用图8至图11中的FAC合成信号以及应用图6的相反步骤来获得对于当前帧120的完整合成或重构信号。还应注意,甚至现在图12中示出的步骤也利用编码器执行来确定用于当前帧的编码模式例如在编码率/失真意义等上是否产生最佳优化。在图12中,假设在标号LPC1左侧的ACELP帧122已诸如利用图3的模块58被合成或被重构直到标号LPC1,从而产生图12的线2上具有附图标记110的ACELP合成信号。由于FAC校正也在TC帧结束处被使用,所以也假设在标号LPC2之后的帧124将是ACELP帧。随后,为在图12中的标号LPC1与LPC2之间的TC帧120中产生合成或重构信号,以下步骤将被执行。这些步骤也被示出在图13和图14中,且图13示出了由转变处理器60执行以处理从TC编码段或片段子部分向ACELP编码段子部分的转变的步骤,而图14描述了用于反向转变的转变处理器的操作。
1.一个步骤是解码MDCT-编码TC帧以及将由此获得的时域信号置于标号LPC1与LPC2之间,如图12的线2中所示。解码利用模块54或模块56来执行且包括作为用于TDAC再转换的实例的反向MDCT,使得被解码的TC帧包括窗口化和时域混迭效应。换言之,当前将被解码且利用图13和图14中的指标k指示的片段或时段子部分,可以是如图13中所示的ACELP编码时段子部分92b,或如图14中所示的作为FD编码或TCX编码子部分92a的时段16b。在图13的情况下,先前处理的帧因此是TC编码段或时段子部分,且在图14的情况下,先前处理的时段是ACELP编码子部分。如由模块54至58输出的重构或合成信号部分经受混迭效应。这对于信号段78/108也是如此。
2.转变处理器60的处理中的另一步骤是在图14的情况下根据图10以及在图13的情况下根据图11的FAC合成信号的产生。即,转变处理器60可在FAC数据34内对转换系数执行再转换191,以分别获得FAC合成信号146和149。FAC合成信号146和149被置于TC编码段的开始和结束处,TC编码段反过来也经受混迭效应并被注册到时段78/108。在图13的情况下,例如,转变处理器60将FAC合成信号149置于TC编码帧k-1的末端,也如图12的线1所示。在图14的情况下,转变处理器60将FAC合成信号146置于TC编码帧k的开始处,也如图12的线1所示。还应注意,帧k是当前将被解码的帧,且帧k-1是先前被解码的帧。
3.关于考虑图14的情况,其中,编码模式改变发生在当前TC帧k的开始处,来自先于TC帧k的ACELP帧k-1的窗口化和折叠(反向)ACELP合成信号130以及LPC1合成滤波器的窗口零输入响应或ZIR(即信号132)被定位以注册到经受混迭的再转换信号段78/108。该贡献被示出在图12的线3中。如图14所示以及如上文已述,转变处理器60通过继续先前CELP子帧的LPC合成滤波至超越当前时段k的前缘边界并由图14中用附图标记190和192指示的两个步骤将在当前信号k内的信号110的延续窗口化来获得混迭消除信号132。为获得混迭消除信号130,转变处理器60也在步骤194中对先前CELP帧的重构信号片段110窗口化,并使用该被窗口化和时间反转信号作为信号130。
4.图12的线1、2和3的贡献以及图14中的贡献78/108、132、130和146以及图13中的贡献78/108、149和196,利用转变处理器60在上述注册位置被相加,以形成对于原始域中的当前帧k的合成或重构音频信号,如图12的线4中所示。注意,图13和图14的处理在TC帧中产生合成或重构信号198,其中,在帧开始和结束处的时域混迭和窗口化效应被消除,且其中,标号LPC1附近的帧边界的可能的中断已利用图12中的滤波器1/W(z)来平滑和使之不被察觉。
因此,图13适用于CELP编码帧k的当前处理并产生在先前TC编码段结束处的前向混迭消除。如在196处所示,最终的重构音频信号是较少混迭的跨越片段k-1与k之间的边界的重构。图14的处理在当前TC编码段k的开始处产生前向混迭消除,如在示出跨越信号段k与k-1之间的边界的重构信号的附图标记198处所示。在当前片段k的后端处的其余混迭在以下片段是TC编码段的情况下利用TDAC来消除,或者在其后的片段是ACELP编码片段的情况下由根据图13的FAC来消除。图13提及了通过指定附图标记198到时段k-1的信号片段上的该后者的可能性。
在下文中,将提及关于第二语句部分26可如何被实施的具体可行性。
例如,为处理遗失帧的发生,语句部分26可被实施为2位字段的prev_mode,其根据以下表格在当前帧14b内明确信号告知被应用在先前帧14a中的编码模式:
prev_mode | ||
ACELP | 0 | 0 |
TCX | 0 | 1 |
FD_long | 1 | 0 |
FD_short | 1 | 1 |
换句话说,这2位字段可被称为prev_mode并可由此指示先前帧14a的编码模式。在刚提及的实例的情况下,四个不同的状态被区分,即:
1)先前帧14a是LPD帧,其最后子帧是ACELP子帧;
2)先前帧14a是LPD帧,其最后子帧是TCX编码子帧;
3)先前帧是利用长转换窗口的FD帧;以及
4)先前帧是利用短转换窗口的FD帧。
可能利用不同窗口长度的FD编码模式的可行性已在上述参照图3的描述被提及。当然,语句部分26可仅具有三种不同状态,且FD编码模式可仅用恒定窗口长度来操作,从而总结上述列出的选项3和4的两个最后选项。
在任何情况下,基于上述2位字段,分析器20能确定关于在当前时段与先前时段16a之间的转变的FAC数据是否存在于当前帧14a内。如将在以下更详细叙述,分析器20和重构器22甚至能基于prev_mode来确定先前帧14a是否已是利用长窗口(FD_long)的FD帧或者先前帧是否已是利用短窗口(FD_short)的FD帧以及当前帧14b(若当前帧是LPD帧)是否接续FD帧或LPD帧,根据以下实施方式,该区分是必要的,以便分别正确分析数据流和重构信息信号。
因此,根据刚才所提及的利用2位标识符作为语句部分26的可行性,各帧16a至16c将设置有另外的2位标识符,除了语句部分24之外,语句部分24将当前帧的编码模式限定为FD或LPD编码模式以及在LPD编码模式的情况下的子帧结构。
对于所有上述实施方式,应注意,其他帧间的依赖关系也应被避免。例如,图1的解码器可能能够SBR。在该情况下,交叉频率可利用分析器20从相应的SBR延伸数据内的每个帧16a至16c分析以取代分析具有SBR文件头的该交叉频率,该SBR文件头可在数据流12内不很频繁地传输。其他帧间依赖关系可在类似意义上被移除。
值得注意的是,对于所有上述实施方式,分析器20可被配置为通过该缓冲器以FIFO(先进先出)方式在传送所有帧14a至14c的缓冲器内至少缓冲当前被解码的帧14b。在缓冲时,分析器20可从帧14a至14c的单元中的该缓冲器执行帧的移除。即,分析器20的缓冲器的填充和移除可在帧14a至14c的单元中被执行,以遵循由最大可用缓冲器空间施加的限制,例如,该空间每次仅容纳一个、或多于一个的最大大小的帧。
接下来将描述对于具有减小的位消耗的语句部分26的替代性信令可行性。根据该替代,语句部分26的不同构造结构被使用。在前述实施方式中,语句部分26是2位字段,其被传输在编码USAC数据流的每个帧14a至14c中。由于对于FD部分,其仅对于解码器重要以知晓在先前帧14a被遗失的情况下,其是否必须从比特流读取FAC数据,这些2位可被分割为2个1位标志,其中,它们中的一个作为fac_data_present在每个帧14a至14c内被信号传送。该位因此可被引入single_channel_element和channel_pair_element结构中,如图15和图16的表所示。图15和图16可被视为根据本实施方式的帧14的语句的高级结构定义,其中,函数“function_name(…)”调用子程序,且粗写语句元素名称指示从数据流的相应语句元素的读取。换言之,图15和图16中有标记的部分或阴影部分根据该实施方式示出了各帧14a至14c设置有标志fac_data_present。附图标记199示出了这些部分。
另一1位标志prev_frame_was_lpd若其利用USAC的LPD部分被编码,则随后仅在当前帧中被传输,且信号告知先前帧是否也利用USAC的LPD路径来编码。这被示出在图17的列表中。
图17的列表示出了在当前帧14b是LPD帧的情况下图1中的信息28的一部分。如在200处所示,各LPD帧设置有标志prev_frame_was_lpd。该信息被用于分析当前LPD帧的语句。LPD帧中的FAC数据34的内容和位置取决于在当前LPD帧的前端处的转变是在TCX编码模式与CELP编码模式之间的转变或者从FD编码模式向CELP编码模式的转变可从图18获得。具体地,若当前被解码的帧14b是刚好先于FD帧14a的LPD帧,且fac_data_present信号告知FAC数据存在于当前LPD帧中(因为前导子帧是ACELP子帧),则FAC数据在202处LPD帧语句末端被读取,且FAC数据34在该情况下包括如图18中的204处所示的增益系数fac_gain。采用该增益系数,图13的贡献149被增益调节。
然而,若当前帧是LPD帧且先前帧也是LPD帧,即,若在TCX与CELP子帧之间的转变发生在当前帧与先前帧之间,则FAC数据在206处被读取而不具有增益调节选项,即,不具有包括FAC增益语句元素fac_gain的FAC数据34。此外,在当前帧是LPD帧且先前帧是FD帧的情况下,在206处被读取的FAC数据的位置不同于在202处被读取的FAC数据的位置。尽管读取202的位置发生在当前LPD帧的末端,在206处的FAC数据的读取则发生在子帧特定数据的读取之前,即,ACELP或TCX数据分别取决于在208和210处的子帧结构的子帧模式。
在图15至图18的实例中,LPC信息104(图5)在子帧特定数据(诸如90a和90b)之后(对比图5)在212处被读取。
仅为完整起见,根据图17的LPD帧的语句结构将针对可能另外包括在LPD帧内的FAC数据来进一步说明,以提供关于在当前LPD编码时段内的TCX与ACELP子帧之间的转变的FAC信息。具体地,根据图15至图18的实施方式,LPD子帧结构被限定为仅以1/4单位子分割当前LPD编码时段,并将这些1/4单位分配至TCX或ACELP。精确的LPD结构利用在214处读取的语句元素lpd_mode来限定。第一、第二、第三和第四1/4部分可一起形成TCX子帧,而ACELP帧被限制为仅1/4的长度。TCX子帧也可延伸至越过整个LPD编码时段,在该情况下,子帧数目仅为1。图17中的当(while)循环走过当前LPD编码时段的1/4部分,且每当当前1/4部分的k是在当前LPD编码时段内的新的子帧的开始时在216处传输FAC数据,其设定若当前子帧属于ACELP模式,则当前开始/解码的LPD帧的实时先前子帧属于其他模式,即TCX模式,且反之亦然。
仅为完整起见,图19示出了根据图15至图18的实施方式的FD帧的可行的语句结构。可以看出,FAC数据利用关于仅包括fac_data_present标志的FAC数据34是否存在的确定在FD帧末端被读取。相比之下,在如图17所示的LPD帧的情况下,对fac_data34的分析对于正确分析需要知晓标志prev_frame_was_lpd。
因此,若当前帧利用USAC的LPD部分编码并信号告知先前帧是否利用USAC编解码器的LPD路径编码,则仅1位标志prev_frame_was_lpd被传输(参见图17中的lpd_channel_stream()语句)。
关于图15至图19的实施方式,还应注意,其他语句元素可在220处,即,在当前帧是LPD帧且先前帧是FD帧的情况下(且当前LPD帧的第一帧是ACELP帧)被传输,使得FAC数据将在202处被读取以处理在当前LPD帧的前缘端处从FD帧向ACELP子帧的转变。在220处被读取的该另外的语句元素可指示先前的FD帧14a是否属于FD_long或FD_short。根据该语句元素,FAC数据202可能被影响。例如,合成信号149的长度可根据用于转换先前LPD帧的窗口长度而被影响。总结图15和图19的实施方式并将其中提及的特征转移到参照图1至图14描述的实施方式上,下文可单独或结合地被应用于后续实施方式上:
1)之前图中所提及的FAC数据34主要旨在关注FAC数据存在于当前帧14b中,以能实现发生在先前帧14a与当前帧14b之间(即,在相应时段16a与16b之间)的转变的前向混迭消除。然而,可存在其他FAC数据。然而,该另外的FAC数据处理在其属于LPD模式的情况下的被放置在当前帧14b内部的TCX编码子帧与CELP编码子帧之间的转变。该另外的FAC数据的存在与否与语句部分26无关。在图17中,该另外的FAC数据在216处被读取。其出现或存在仅取决于在214处读取的lpd_mode。反过来,后续语句元素是揭示当前帧的编码模式的语句部分24的一部分。在图15和图16中示出的在230和232处连同core_mode一起被读取的lpd_mode对应于语句部分24。
2)此外,语句部分26可由如上所述的多于一个的语句元素组成。标志FAC_data_present指示用于先前帧与当前帧之间的边界的fac_data是否存在。该标志存在于LPD帧以及FD帧。其他标志(在上述实施方式中被称为prev_frame_was_lpd)仅在LPD帧中被传输以表示先前帧14a是否属于LPD模式。换言之,包括在语句部分26中的该第二标志指示先前帧14a是否是FD帧。分析器20预期且仅在当前帧是LPD帧的情况下读取该标志。在图17中,该标志在200处被读取。根据该标志,分析器20可预期FAC数据来包括并因此从当前帧读取增益值fac_gain。该增益值被重构器用于设定用于在当前与先前时段之间的转变的FAC的FAC合成信号的增益。在图15至图19的实施方式中,根据分别比较产生读取206和202的条件而清晰的第二标志,该语句元素在204处被读取。可替代地或另外,prev_frame_was_lpd可控制某一位置,其中,分析器20预期并读取FAC数据。在图15至图19的实施方式中,这些位置是206或202。此外,在当前帧是LPD帧且其前导子帧是ACELP帧以及先前帧是FD帧的情况下,第二语句部分26还可包括其他标志,以指示先前FD帧利用长转换窗口或短转换窗口来编码。在图15至图19的先前实施方式的情况下,后续标志可在220处被读取。关于该FD转换长度的了解可被用于分别确定FAC合成信号的长度以及FAC数据38的大小。通过该测量,FAC数据可在大小上被调适以重迭先前FD帧的窗口长度,使得可获得在编码质量与编码率之间的较佳折衷方案。
3)通过将第二语句部分26分割成上述三个标志,在当前帧是FD帧的情况下,可能仅传输一个标志或位以信号告知第二语句部分26,而在当前帧是LPD帧且先前帧也是LPD帧的情况下,仅传输两个标志或位。仅在从FD帧到当前LPD帧的转变的情况下,第三标志必需在当前帧中被传输。可替代地,如上所述,第二语句部分26可以是针对每帧而被传输的2位指示器,并指示先于该帧的帧的模式至对于分析器所需的程度以确定FAC数据38是否必须从当前帧被读取,且如果是这样,从何处读取且FAC合成信号是多长。即,图15至图19的特定实施方式可很容易地被转移至利用上述2位标识符来实施第二语句部分26的实施方式。代替图15和图16中的FAC_data_present,该2位标识符将被传输。在200和220处的标志将不必被传输。相反,在206和218之前的if语句中的fac_data_present内容可利用分析器20从2位标识符导出。以下列表可在编码器处被访问以利用该2位指示器。
prev_mode | 当前帧(超级帧)的core_mode | first_lpd_flag |
ACELP | 1 | 0 |
TCX | 1 | 0 |
FD_long | 1 | 1 |
FD_short | 1 | 1 |
在FD帧将仅利用一种可能长度的情况下,语句部分26也可仅具有三个不同的可能值。
略微不同地,但非常类似于参照图15至图19如上所述的语句结构将在图20至图22中利用如参照图15至图19使用的相同附图标记来示出,使得参照该实施方式来说明图20至图22的实施方式。
关于参照图3等所述的实施方式,应注意,任何具有混迭特性的转换编码方案可被用于与TCX帧连接,除了MDCT之外。此外,转换编码方案(诸如FFT)也可被使用,而无需LPD模式下的混迭,即,在LPD帧内无用于子帧转变的FAC,且因此,不需要传输用于在LPD边界之间的子帧边界的FAC数据。FAC数据随后将仅被包括以用于从FD到LPD的每种转变,且反之亦然。
关于参照图1等所述的实施方式,应注意,其针对另外的语句部分26被成行设定的情况,即,唯一取决于在当前帧的编码模式与如在先前帧的第一语句部分中限定的先前帧的编码模式之间的比较,使得在所有上述实施方式中,解码器或分析器能够利用或比较这些帧的第一语句部分(即,先前帧和当前帧)而唯一预料当前帧的第二语句部分的内容。即,在没有帧遗失的情况下,不论FAC数据是否存在于当前帧中,对于解码器或分析器也可以从帧之间的转变获得。若帧被遗失,则第二语句部分(诸如标志fac_data_present位)明确给出该信息。然而,根据另一实施方式,编码器可利用由第二语句部分26提供的该明确的信号化可行性,以施加反向编码,根据该反向编码,语句部分26适应性地,即,以一帧一帧为基础执行其上的确定,例如,被设定为使得尽管在当前帧与先前帧之间的转变属于通常与FAC数据一起出现的类型(诸如FD/TCX(即,任何TC编码模式)到ACELP(即,任何时域编码模式),或反之亦然),但当前帧的语句部分仍指示FAC的缺失。解码器随后可被实施以根据语句部分26而严格动作,从而有效禁用、或抑制在编码器处的FAC数据传输,其仅通过设定例如fac_data_present=0来信号告知该抑制。可能是有利的选项的情节是在以非常低的位率编码时,其中,另外的FAC数据可能占用太多位,而使所产生的混迭伪像相比整体声音质量可以是可忍受的。
尽管一些方面已在设备背景下被描述,但应清楚,这些方面也表示相应方法的描述,其中,块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤背景下所述的方面也表示相应设备的相应块或项目或者特征的描述。一些或所有方法步骤可由(或利用)硬件设备执行,其类似于例如微处理器、可编程计算机或电子电路。在一些实施方式中,一些或多个最重要的方法步骤可利用该设备来执行。
本发明的编码音频信号可被存储在数字存储介质上或可在传输介质(诸如无线传输介质或有线传输介质(诸如因特网))上被传输。
根据特定实施要求,本发明的实施方式可以硬件或软件来实施。该实施可使用具有存储其上的电可读控制信号的数字存储介质来执行,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或内存,该电可读控制信号与可编程计算机系统协作(或者能够协作),使得相应方法被执行。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施方式包括具有电可读控制信号的数据载体,该电可读控制信号能够与可编程计算机系统协作,从而执行本文所述方法中的一种。
一般地,本发明的实施方式可被实施为具有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可操作地用于执行方法中的一种。该程序代码例如可存储在机器可读载体上。
其他实施方式包括存储在机器可读载体上用于执行本文所述方法中的一种的计算机程序。
因此,换言之,本发明方法的实施方式是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,该程序代码用于执行本文所述方法中的一种。
因此,本发明方法的另一实施方式是包括存储其上用于执行本文所述方法中的一种的计算机程序的数据载体(或数字存储介质或者计算机可读介质)。该数据载体、数字存储介质或记录介质通常是有形的和/或非过渡性的。
因此,本发明方法的另一实施方式是表示用于执行本文所述方法中的一种的计算机程序的数据流或信号序列。该数据流或信号序列例如可被配置为经由数据通信连接(例如经由因特网)来传送。
另一实施方式包括处理装置(例如计算机)或可编程逻辑器件,其被配置为或适用于执行本文所述方法中的一种。
另一实施方式包括具有安装其上用于执行本文所述方法中的一种的计算机程序的计算机。
根据本发明的另一实施方式包括一种设备或系统,其被配置为将用于执行本文所述方法中的一种的计算机程序传送(例如,电子或光学地)至接收器。该接收器可以是例如计算机、移动装置、存储器装置等。该设备或系统例如可包括用于传送计算机程序至接收器的文档服务器。
在一些实施方式中,可编程逻辑器件(例如,现场可编程门阵列)可用于执行本文所述方法中的一些或全部功能。在一些实施方式中,现场可编程门阵列可与微处理器协作以执行本文所述方法中的一种。一般地,该方法优选由任何硬件设备执行。
上述实施方式仅用于说明本发明的原理。应当理解,本文所述配置和细节的修改和变形对于本领域技术人员而言将是显而易见的。因此,其旨在仅由所附专利权利要求的范围来限定,且不由以对本文实施方式的描述和说明的方式给出的具体细节来限定。
Claims (20)
1.一种用于解码包括分别编码信息信号(18)的时段而成的帧序列的数据流(12)的解码器(10),包括:
分析器(20),被配置为分析所述数据流(12),其中,所述分析器被配置为在分析所述数据流(12)时,从当前帧(14b)读取第一语句部分(24)和第二语句部分;以及
重构器(22),被配置为使用时域混迭消除转换解码模式和时域解码模式中的第一选择的一个,基于通过所述分析从所述当前帧获得的信息(28)来重构与所述当前帧(14b)相关联的所述信息信号(18)的当前时段(16b),所述第一选择取决于所述第一语句部分(24),
其中,所述分析器(20)被配置为在分析所述数据流(12)时,执行预期所述当前帧(14b)包括的第一动作的第二选择的一个,并因此从所述当前帧(14b)读取前向混迭消除数据(34),以及执行不预期所述当前帧(14b)包括的第二动作,并因此不从所述当前帧(14b)读取前向混迭消除数据(34),所述第二选择取决于所述第二语句部分,
其中,所述重构器(22)被配置为使用所述前向混迭消除数据(34)在所述当前时段(16b)与先前帧(14a)的先前时段(16a)之间的边界处执行前向混迭消除。
2.根据权利要求1所述的解码器(10),其中,所述第一语句部分和所述第二语句部分被每个帧包括,其中,所述第一语句部分(24)将已读取所述第一语句部分的相应帧与第一帧类型或第二帧类型相关联,且若所述相应帧属于所述第二帧类型,则将由一些子帧组成的所述相应帧的子分割的子帧与第一子帧类型和第二子帧类型中的相应一个相关联,其中,所述重构器(22)被配置为若所述第一语句部分(24)将所述相应帧与所述第一帧类型相关联,则利用频域解码作为所述时域混迭消除转换解码模式的第一版本来重构与所述相应帧相关联的所述时段,且若所述第一语句部分(24)将所述相应帧与所述第二帧类型相关联,则对于所述相应帧的每个子帧,使用转换编码激励线性预测解码作为所述时域混迭消除转换解码模式的第二版本来重构与相应子帧相关联的所述相应帧的所述时段的子部分,若所述第一语句部分(24)将所述相应帧的所述相应子帧与所述第一子帧类型相关联,且若所述第一语句部分(24)将所述相应子帧与第二子帧类型相关联,则使用码簿激励线性预测解码作为所述时域解码模式来重构与所述相应子帧相关联的所述相应帧的所述时段的子部分。
3.根据权利要求1或2所述的解码器(10),其中,所述第二语句部分具有各自唯一与一组可能性中的一个相关联的一组可能值,所述一组可能性包括:
所述先前帧(14a)属于所述第一帧类型,
所述先前帧(14a)属于所述第二帧类型,且所述先前帧的最后子帧属于所述第一子帧类型,以及
所述先前帧(14a)属于所述第二帧类型,且所述先前帧的所述最后子帧属于所述第二子帧类型,以及
所述分析器(20)被配置为基于所述当前帧(14b)的所述第二语句部分与所述先前帧(14a)的所述第一语句部分(24)之间的比较来执行所述第二选择。
4.根据权利要求3所述的解码器,其中,所述分析器(20)被配置为若所述当前帧(14b)属于所述第二帧类型,则根据所述先前帧(14a)属于所述第二帧类型且所述先前帧的所述最后子帧属于所述第一子帧类型或者所述先前帧(14a)属于所述第一帧类型来执行从所述当前帧(14b)对所述前向混迭消除数据(34)的读取,其中,在所述先前帧(14a)属于所述第一帧类型的情况下,从所述前向混迭消除数据(34)分析前向混迭消除增益;以及若先前帧属于所述第二帧类型且所述先前帧的所述最后子帧属于所述第一子帧类型则不执行,其中,所述重构器(22)被配置为以取决于在所述先前帧(14a)属于所述第一帧类型的情况下的所述前向混迭消除增益的强度来执行所述前向混迭消除。
5.根据权利要求4所述的解码器(10),其中,所述分析器(20)被配置为若所述当前帧(14b)属于所述第一帧类型,则从所述前向混迭消除数据(34)读取前向混迭消除增益,其中,所述重构器被配置为以取决于所述前向混迭消除增益的强度来执行所述前向混迭消除。
6.根据权利要求1或2所述的解码器(10),其中,所述第二语句部分具有各自唯一与一组可能性中的一个相关联的一组可能值,所述一组可能性包括:
所述先前帧(14a)属于所述第一帧类型且包括长转换窗口,
所述先前帧(14a)属于所述第一帧类型且包括短转换窗口,
所述先前帧(14a)属于所述第二帧类型且所述先前帧的最后子帧属于所述第一子帧类型,以及
所述先前帧(14a)属于所述第二帧类型且所述先前帧的所述最后子帧属于所述第二子帧类型,以及
所述分析器被配置为基于所述当前帧(14b)的所述第二语句部分与所述先前帧(14a)的所述第一语句部分(24)之间的比较来执行所述第二选择,以及若所述先前帧(14a)属于所述第一帧类型,则根据所述先前帧(14a)包括所述长转换窗口或所述短转换窗口来执行从所述当前帧(14b)对所述前向混迭消除数据(34)的读取,使得若所述先前帧(14a)包括所述长转换窗口,则前向混迭消除数据(34)的量较大,且若所述先前帧(14a)包括所述短转换窗口,则所述前向混迭消除数据的量较小。
7.根据权利要求2至6中任一项所述的解码器(10),其中,所述重构器被配置为:
对于所述第一帧类型的每个帧,基于在所述第一帧类型的所述相应帧内的标度系数信息,在所述第一帧类型的所述相应帧内执行转换系数信息的频谱改变解量化(70),并对被解量化的转换系数信息执行再转换以获得时间上延伸过且跨越与所述第一帧类型的所述相应帧相关联的所述时段的再转换信号段(78),以及
对于所述第二帧类型的每个帧,
对于所述第二帧类型的所述相应帧的所述第一子帧类型的每个子帧,
从所述第二帧类型的所述相应帧内的LPC信息获得(94)频谱加权滤波器,
利用所述频谱加权滤波器,在所述第一子帧类型的所述相应子帧内频谱上加权(96)转换系数信息,以及
再转换(98)被频谱上加权的转换系数信息以获得时间上延伸过且跨越与所述第一子帧类型的所述相应子帧相关联的所述时段的所述子部分的再转换信号段,以及,
对于所述第二帧的所述相应帧的所述第二子帧类型的每个子帧,
从所述第二子帧类型的所述相应子帧内的激励更新信息获得(100)激励信号,以及
利用在所述第二帧类型的所述相应帧内的LPC信息对所述激励信号执行LPC合成滤波(102),以获得用于
与所述第二子帧类型的所述相应子帧相关联的所述时段的所述子部分的LP合成信号段(110),以及
在所述第一帧类型的帧中的实时连续帧的时段与关联于所述第一子帧类型的子帧的时段的子部分之间的边界处的时间重迭窗口部分内执行时域混迭消除,以重构跨越所述边界的所述信息信号(18),以及
若所述先前帧属于所述第一帧类型或属于所述第二帧类型且所述先前帧的最后子帧属于所述第一子帧类型,以及所述当前帧(14b)属于所述第二帧类型且所述当前帧的所述第一子帧属于所述第二子帧类型,则从所述前向混迭消除数据(34)获得第一前向混迭消除合成信号,并将所述第一前向混迭消除合成信号添加至在所述先前时段内的所述再转换信号段(78),以重构跨越所述先前帧与所述当前帧(14a、14b)之间的边界的所述信息信号(18),以及
若所述先前帧(14a)属于所述第二帧类型且所述先前帧的所述第一子帧属于所述第二子帧类型,以及所述当前帧(14b)属于所述第一帧类型或属于所述第二帧类型且所述当前帧的最后子帧属于所述第一子帧类型,则从所述前向混迭消除数据(34)获得第二前向混迭消除合成信号,并将所述第二前向混迭消除合成信号添加至在所述当前时段(16b)内的所述再转换信号段,以重构跨越所述先前时段与所述当前时段(16a、16b)之间的边界的所述信息信号(18)。
8.根据权利要求7所述的解码器(10),其中,所述重构器被配置为
通过对由所述前向混迭消除数据(34)包含的转换系数信息执行再转换,从所述前向混迭消除数据(34)获得所述第一前向混迭消除合成信号,和/或
通过对由所述前向混迭消除数据(34)包含的转换系数信息执行再转换,从所述前向混迭消除数据(34)获得所述第二前向混迭消除合成信号。
9.根据权利要求7或8所述的解码器,其中,所述第二语句部分包括信号告知前向混迭消除数据(34)是否存在于所述相应帧中的第一标志,以及所述分析器被配置为根据所述第一标志来执行所述第二选择,且其中,所述第二语句部分还包括仅在所述第二帧类型的帧内的第二标志,所述第二标志信号告知是否所述先前帧属于所述第一帧类型或所述第二帧类型且所述先前帧的所述最后子帧属于所述第一子帧类型。
10.根据权利要求9所述的解码器,其中,所述分析器被配置为若所述当前帧(14b)属于所述第二帧类型,则根据所述第二标志来执行从所述当前帧(14b)对所述前向混迭消除数据(34)的读取,其中,在所述先前帧属于所述第一帧类型的情况下,从所述前向混迭消除数据(34)分析前向混迭消除增益,以及若先前帧属于所述第二帧类型且所述先前帧的所述最后子帧属于所述第一子帧类型则不执行,其中,所述重构器被配置为以取决于在所述先前帧属于所述第一帧类型的情况下的所述前向混迭消除增益的强度执行所述前向混迭消除。
11.根据权利要求10所述的解码器,其中,所述第二语句部分还包括信号告知所述先前帧是否包括长转换窗口或短转换窗口的第三标志,若所述第二标志信号告知所述先前帧属于所述第一帧类型,则所述第三标志仅在所述第二帧类型的帧内,其中,所述分析器被配置为根据所述第三标志来执行从所述当前帧(14b)对所述前向混迭消除数据(34)的读取,使得若所述先前帧包括所述长转换窗口,则前向混迭消除数据(34)的量较大,且若所述先前帧包括所述短转换窗口,则所述前向混迭消除数据的量较小。
12.根据权利要求7至11中任一项所述的解码器,其中,所述重构器被配置为若所述先前帧属于所述第二帧类型且所述先前帧的所述最后子帧属于所述第二子帧类型以及所述当前帧(14b)属于所述第一帧类型或所述第二帧类型且所述当前帧的所述最后子帧属于所述第一子帧类型,则对所述先前帧的所述最后子帧的所述LP合成信号段执行窗口化以获得第一混迭消除信号段,并将所述第一混迭消除信号段添加至所述当前时段内的所述再转换信号段。
13.根据权利要求7至12中任一项所述的解码器,其中,所述重构器被配置为若所述先前帧属于所述第二帧类型且所述先前帧的最后子帧属于所述第二子帧类型以及所述当前帧(14b)属于所述第一帧类型或所述第二帧类型且所述当前帧的第一子帧属于所述第一子帧类型,则继续对从所述先前帧到所述当前帧中的所述激励信号执行的所述LPC合成滤波,在所述当前帧(14b)内对由此获得的所述先前帧的所述LP合成信号段的延续进行窗口化,以获得第二混迭消除信号段,并将所述第二混迭消除信号段添加至所述当前时段内的所述再转换信号段。
14.根据权利要求1至13中任一项所述的解码器,其中,所述分析器(20)被配置为在分析所述数据流(12)时,根据所述第二语句部分且独立于所述当前帧(14b)和所述先前帧(14a)是否利用时域混迭消除转换编码模式和时域编码模式中的等同或不同的一个而被编码来执行所述第二选择。
15.一种用于将信息信号(18)编码为数据流(12)使得所述数据流(12)包括所述信息信号(18)的时段分别被编码成的帧序列的编码器,包括:
构造器(42),被配置为使用时域混迭消除转换编码模式和时域编码模式中的第一选择的一个,将所述信息信号(18)的当前时段(16b)编码为当前帧(14b)的信息;以及
插入器(44),被配置为将所述信息(28)连同第一语句部分(24)和第二语句部分一起插入所述当前帧(14b)中,其中,所述第一语句部分(24)信号告知所述第一选择,
其中,所述构造器(42)和所述插入器(44)被配置为:
在所述当前时段(16a)与先前帧的先前时段之间的边界处确定用于前向混迭消除的前向混迭消除数据(34),并在所述当前帧(14b)和所述先前帧(14a)使用所述时域混迭消除转换编码模式和所述时域编码模式中的不同的一个来编码的情况下,将所述前向混迭消除数据(34)插入所述当前帧(14b)中,以及
在所述当前帧(14b)和所述先前帧(14a)使用所述时域混迭消除转换编码模式和所述时域编码模式中的等同的一个来编码的情况下,避免将任何前向混迭消除数据(34)插入所述当前帧(14b)中,
其中,所述第二语句部分(26)根据所述当前帧(14b)和所述先前帧(14a)是否使用所述时域混迭消除转换编码模式和所述时域编码模式中的等同或不同的一个来编码而被设定。
16.根据权利要求15所述的编码器,其中,所述编码器被配置为,
若所述当前帧(14b)和所述先前帧(14a)使用所述时域混迭消除转换编码模式和所述时域编码模式中的等同的一个来编码,则将所述第二语句部分设定为信号告知在所述当前帧中不存在所述前向混迭消除数据(34)的第一状态,以及,
若所述当前帧(14b)和所述先前帧(14a)使用所述时域混迭消除转换编码模式和所述时域编码模式中的不同的一个来编码,则在位率/失真最佳化的意义上确定,以便
尽管所述当前帧(14b)和所述先前帧(14a)使用所述时域混迭消除转换编码模式和所述时域编码模式中的不同的一个来编码,但利用设定所述第二语句部分使得所述第二语句部分信号告知在所述当前帧(14b)中不存在所述前向混迭消除数据(34)来避免将所述前向混迭消除数据(34)插入所述当前帧(14b)中,或者
利用设定所述第二语句部分使得所述第二语句部分信号告知所述前向混迭消除数据(34)向所述当前帧(14b)中的插入来将所述前向混迭消除数据(34)插入所述当前帧(14b)中。
17.一种用于解码包括信息信号(18)的时段分别被编码成的帧序列的数据流(12)的方法,包括:
分析所述数据流(12),其中,分析所述数据流包括从当前帧(14b)读取第一语句部分(24)和第二语句部分;以及
使用时域混迭消除转换解码模式和时域解码模式中的第一选择的一个,基于通过所述分析从所述当前帧(14b)获得的信息来重构与所述当前帧(14b)相关联的所述信息信号(18)的当前时段,所述第一选择取决于所述第一语句部分(24),
其中,在分析所述数据流(12)时,执行预期所述当前帧(14b)包括的第一动作的第二选择的一个,并因此从所述当前帧(14b)读取前向混迭消除数据(34),以及执行不预期所述当前帧(14b)包括的第二动作,并因此不从所述当前帧(14b)读取前向混迭消除数据(34),所述第二选择取决于所述第二语句部分,
其中,所述重构包括使用所述前向混迭消除数据(34)在所述当前时段与先前帧的先前时段之间的边界处执行前向混迭消除。
18.一种用于将信息信号(18)编码为数据流(12)使得所述数据流(12)包括所述信息信号(18)的时段分别被编码成的帧序列的方法,包括:
使用时域混迭消除转换编码模式和时域编码模式中的第一选择的一个,将所述信息信号(18)的当前时段编码为当前帧(14b)的信息;以及
将所述信息连同第一语句部分(24)和第二语句部分一起插入所述当前帧(14b)中,其中,所述第一语句部分(24)信号告知所述第一选择,
在所述当前时段与先前帧的先前时段之间的边界处确定用于前向混迭消除的前向混迭消除数据(34),并在所述当前帧(14b)和所述先前帧使用所述时域混迭消除转换编码模式和所述时域编码模式中的不同的一个来编码的情况下,将所述前向混迭消除数据(34)插入所述当前帧(14b)中,以及在所述当前帧(14b)和所述先前帧使用所述时域混迭消除转换编码模式和所述时域编码模式中的等同的一个来编码的情况下,避免将任何前向混迭消除数据(34)插入所述当前帧(14b)中,
其中,所述第二语句部分根据所述当前帧(14b)和所述先前帧是否使用所述时域混迭消除转换编码模式和所述时域编码模式中的等同或不同的一个来编码而被设定。
19.一种包括信息信号(18)的时段分别被编码成的帧序列的数据流(12),每个帧包括第一语句部分(24)、第二语句部分和与相应帧相关联的时段使用时域混迭消除转换编码模式和时域编码模式中的第一选择的一个被编码成的信息,所述第一选择取决于所述相应帧的所述第一语句部分(24),其中,每个帧包括前向混迭消除数据(34);或者不取决于所述相应帧的所述第二语句部分,其中,所述第二语句部分指示所述相应帧包括所述相应帧的前向混迭消除数据(34),且先前帧使用所述时域混迭消除转换编码模式和所述时域编码模式中的不同的一个来编码,使得可以在相应时段与关联于所述先前帧(14a)的先前时段之间的边界处进行使用所述前向混迭消除数据(34)的前向混迭消除。
20.一种具有程序代码的计算机程序,当所述程序代码在计算机上运行时,用于执行根据权利要求17或18所述的方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36254710P | 2010-07-08 | 2010-07-08 | |
US61/362,547 | 2010-07-08 | ||
US37234710P | 2010-08-10 | 2010-08-10 | |
US61/372,347 | 2010-08-10 | ||
PCT/EP2011/061521 WO2012004349A1 (en) | 2010-07-08 | 2011-07-07 | Coder using forward aliasing cancellation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103109318A true CN103109318A (zh) | 2013-05-15 |
CN103109318B CN103109318B (zh) | 2015-08-05 |
Family
ID=44584140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180043476.8A Active CN103109318B (zh) | 2010-07-08 | 2011-07-07 | 利用前向混迭消除技术的编码器 |
Country Status (17)
Country | Link |
---|---|
US (1) | US9257130B2 (zh) |
EP (10) | EP4120248B1 (zh) |
JP (10) | JP5981913B2 (zh) |
KR (1) | KR101456639B1 (zh) |
CN (1) | CN103109318B (zh) |
AR (1) | AR082142A1 (zh) |
AU (1) | AU2011275731B2 (zh) |
BR (3) | BR122021002104B1 (zh) |
CA (1) | CA2804548C (zh) |
ES (3) | ES2968927T3 (zh) |
MX (1) | MX2013000086A (zh) |
MY (1) | MY161986A (zh) |
PL (3) | PL2591470T3 (zh) |
PT (2) | PT3451333T (zh) |
SG (1) | SG186950A1 (zh) |
TW (1) | TWI476758B (zh) |
WO (1) | WO2012004349A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105453173A (zh) * | 2013-06-21 | 2016-03-30 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
CN105556600A (zh) * | 2013-08-23 | 2016-05-04 | 弗劳恩霍夫应用研究促进协会 | 用于混迭误差信号来处理音频信号的装置及方法 |
CN106575507A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 用于处理音频信号的方法和装置,音频解码器和音频编码器 |
US10381011B2 (en) | 2013-06-21 | 2019-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in a CELP-like concealment employing improved pitch lag estimation |
CN113571070A (zh) * | 2014-07-29 | 2021-10-29 | 奥兰吉公司 | Fd/lpd转换环境中的帧丢失管理 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2730355C (en) * | 2008-07-11 | 2016-03-22 | Guillaume Fuchs | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
TR201900663T4 (tr) * | 2010-01-13 | 2019-02-21 | Voiceage Corp | Doğrusal öngörücü filtreleme kullanarak ileri doğru zaman alanı alıasıng iptali ile ses kod çözümü. |
BR122021002104B1 (pt) * | 2010-07-08 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador que utiliza cancelamento de serrilhado futuro |
WO2012110473A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
TR201910956T4 (tr) * | 2013-02-20 | 2019-08-21 | Fraunhofer Ges Forschung | Geçi̇ci̇ reji̇m konumuna bağli örtüşmeyi̇ kullanan ses si̇nyali̇ni̇n kodlanmasi ya da kodunun çözülmesi̇ i̇çi̇n aparat ve yöntem |
US10043528B2 (en) * | 2013-04-05 | 2018-08-07 | Dolby International Ab | Audio encoder and decoder |
WO2015071173A1 (en) | 2013-11-13 | 2015-05-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
KR101892086B1 (ko) | 2016-05-19 | 2018-08-27 | 주식회사 삼양사 | 옥심에스테르 유도체 화합물, 이를 포함하는 광중합 개시제, 및 감광성 조성물 |
US10438597B2 (en) * | 2017-08-31 | 2019-10-08 | Dolby International Ab | Decoder-provided time domain aliasing cancellation during lossy/lossless transitions |
KR101991903B1 (ko) | 2017-12-07 | 2019-10-01 | 주식회사 삼양사 | 카바졸 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 감광성 조성물 |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
KR102228630B1 (ko) | 2018-12-28 | 2021-03-16 | 주식회사 삼양사 | 카바졸 멀티 베타 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 포토레지스트 조성물 |
US11488613B2 (en) * | 2019-11-13 | 2022-11-01 | Electronics And Telecommunications Research Institute | Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1926609A (zh) * | 2004-02-19 | 2007-03-07 | 杜比实验室特许公司 | 用于信号分析和合成的自适应混合变换 |
WO2010003563A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
WO2010003532A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
FI118834B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
WO2006049204A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
KR100878766B1 (ko) * | 2006-01-11 | 2009-01-14 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 방법과 장치 |
US20070168197A1 (en) | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
US8379868B2 (en) | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
PL2052548T3 (pl) * | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
MY146431A (en) * | 2007-06-11 | 2012-08-15 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
KR101649376B1 (ko) * | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
KR101315617B1 (ko) * | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
KR101797033B1 (ko) * | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
WO2010125228A1 (en) | 2009-04-30 | 2010-11-04 | Nokia Corporation | Encoding of multiview audio signals |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
PL3352168T3 (pl) | 2009-06-23 | 2021-03-08 | Voiceage Corporation | Postępowe tłumienie aliasingu w dziedzinie czasu z zastosowaniem w ważonej albo pierwotnej dziedzinie sygnału |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
KR101397058B1 (ko) * | 2009-11-12 | 2014-05-20 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
TR201900663T4 (tr) * | 2010-01-13 | 2019-02-21 | Voiceage Corp | Doğrusal öngörücü filtreleme kullanarak ileri doğru zaman alanı alıasıng iptali ile ses kod çözümü. |
US9275650B2 (en) * | 2010-06-14 | 2016-03-01 | Panasonic Corporation | Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs |
BR122021002104B1 (pt) * | 2010-07-08 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador que utiliza cancelamento de serrilhado futuro |
TWI571863B (zh) * | 2011-03-18 | 2017-02-21 | 弗勞恩霍夫爾協會 | 具有彈性組態功能之音訊編碼器及解碼器 |
-
2011
- 2011-07-07 BR BR122021002104-0A patent/BR122021002104B1/pt active IP Right Grant
- 2011-07-07 CA CA2804548A patent/CA2804548C/en active Active
- 2011-07-07 JP JP2013517388A patent/JP5981913B2/ja active Active
- 2011-07-07 PT PT182004929T patent/PT3451333T/pt unknown
- 2011-07-07 ES ES22194160T patent/ES2968927T3/es active Active
- 2011-07-07 MY MYPI2013000043A patent/MY161986A/en unknown
- 2011-07-07 EP EP22194160.2A patent/EP4120248B1/en active Active
- 2011-07-07 KR KR1020137003325A patent/KR101456639B1/ko active IP Right Grant
- 2011-07-07 PL PL11730006T patent/PL2591470T3/pl unknown
- 2011-07-07 EP EP24167820.0A patent/EP4398247A3/en active Pending
- 2011-07-07 EP EP23217389.8A patent/EP4322160A3/en active Pending
- 2011-07-07 ES ES11730006T patent/ES2710554T3/es active Active
- 2011-07-07 SG SG2013000971A patent/SG186950A1/en unknown
- 2011-07-07 EP EP11730006.1A patent/EP2591470B1/en active Active
- 2011-07-07 WO PCT/EP2011/061521 patent/WO2012004349A1/en active Application Filing
- 2011-07-07 EP EP24167822.6A patent/EP4372742A3/en active Pending
- 2011-07-07 MX MX2013000086A patent/MX2013000086A/es active IP Right Grant
- 2011-07-07 AU AU2011275731A patent/AU2011275731B2/en active Active
- 2011-07-07 BR BR122021002034-5A patent/BR122021002034B1/pt active IP Right Grant
- 2011-07-07 PT PT11730006T patent/PT2591470T/pt unknown
- 2011-07-07 EP EP24167821.8A patent/EP4398248A3/en active Pending
- 2011-07-07 EP EP24167819.2A patent/EP4398246A3/en active Pending
- 2011-07-07 PL PL22194160.2T patent/PL4120248T3/pl unknown
- 2011-07-07 CN CN201180043476.8A patent/CN103109318B/zh active Active
- 2011-07-07 ES ES18200492T patent/ES2930103T3/es active Active
- 2011-07-07 EP EP18200492.9A patent/EP3451333B1/en active Active
- 2011-07-07 BR BR112013000489-4A patent/BR112013000489B1/pt active IP Right Grant
- 2011-07-07 PL PL18200492.9T patent/PL3451333T3/pl unknown
- 2011-07-07 EP EP24167818.4A patent/EP4398245A3/en active Pending
- 2011-07-07 EP EP24167817.6A patent/EP4398244A3/en active Pending
- 2011-07-08 TW TW100124235A patent/TWI476758B/zh active
- 2011-07-08 AR ARP110102462A patent/AR082142A1/es active IP Right Grant
-
2013
- 2013-01-08 US US13/736,762 patent/US9257130B2/en active Active
-
2015
- 2015-08-28 JP JP2015169621A patent/JP6417299B2/ja active Active
-
2018
- 2018-10-05 JP JP2018189917A patent/JP6773743B2/ja active Active
-
2020
- 2020-10-01 JP JP2020166836A patent/JP7227204B2/ja active Active
-
2023
- 2023-02-09 JP JP2023018225A patent/JP7488926B2/ja active Active
-
2024
- 2024-04-12 JP JP2024064918A patent/JP2024099608A/ja active Pending
- 2024-04-12 JP JP2024064916A patent/JP2024099607A/ja active Pending
- 2024-04-12 JP JP2024064919A patent/JP2024099609A/ja active Pending
- 2024-04-12 JP JP2024064912A patent/JP2024099606A/ja active Pending
- 2024-04-12 JP JP2024064910A patent/JP2024099605A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1926609A (zh) * | 2004-02-19 | 2007-03-07 | 杜比实验室特许公司 | 用于信号分析和合成的自适应混合变换 |
WO2010003563A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
WO2010003532A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
Non-Patent Citations (2)
Title |
---|
BERND GEISER,AT AL.: "JOINT PRE-ECHO CONTROL AND FRAME ERASURE CONCEALMENT FOR VOIP AUDIO CODECS", 《17TH EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO 2009)》 * |
MAX NEUENDORF,ET AL.: "Completion of Core Experiment on unification of USAC Windowing and Frame Transitions", 《ISO/IEC JTC1/SC29/WG11》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10643624B2 (en) | 2013-06-21 | 2020-05-05 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
CN105453173B (zh) * | 2013-06-21 | 2019-08-06 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
US10381011B2 (en) | 2013-06-21 | 2019-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in a CELP-like concealment employing improved pitch lag estimation |
CN105453173A (zh) * | 2013-06-21 | 2016-03-30 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
US11410663B2 (en) | 2013-06-21 | 2022-08-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation |
CN105556600A (zh) * | 2013-08-23 | 2016-05-04 | 弗劳恩霍夫应用研究促进协会 | 用于混迭误差信号来处理音频信号的装置及方法 |
CN105556600B (zh) * | 2013-08-23 | 2019-11-26 | 弗劳恩霍夫应用研究促进协会 | 用于混迭误差信号来处理音频信号的装置及方法 |
CN106575507A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 用于处理音频信号的方法和装置,音频解码器和音频编码器 |
US11869525B2 (en) | 2014-07-28 | 2024-01-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag |
US12014746B2 (en) | 2014-07-28 | 2024-06-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag |
US12033648B2 (en) | 2014-07-28 | 2024-07-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder for removing a discontinuity between frames by subtracting a portion of a zero-input-reponse |
CN113571070A (zh) * | 2014-07-29 | 2021-10-29 | 奥兰吉公司 | Fd/lpd转换环境中的帧丢失管理 |
CN113571070B (zh) * | 2014-07-29 | 2023-09-29 | 奥兰吉公司 | Fd/lpd转换环境中的帧丢失管理 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103109318B (zh) | 利用前向混迭消除技术的编码器 | |
AU2017206243B2 (en) | Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals | |
JP2015043096A (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
KR101648133B1 (ko) | 시간-도메인 및 주파수-도메인 코딩 방식을 지원하는 오디오 코덱 | |
CN106575505A (zh) | Fd/lpd转换环境中的帧丢失管理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |