RU2351024C2 - Method and device for noise reduction - Google Patents
Method and device for noise reduction Download PDFInfo
- Publication number
- RU2351024C2 RU2351024C2 RU2007101541/09A RU2007101541A RU2351024C2 RU 2351024 C2 RU2351024 C2 RU 2351024C2 RU 2007101541/09 A RU2007101541/09 A RU 2007101541/09A RU 2007101541 A RU2007101541 A RU 2007101541A RU 2351024 C2 RU2351024 C2 RU 2351024C2
- Authority
- RU
- Russia
- Prior art keywords
- celp
- tdac
- decoded signal
- env
- signal component
- Prior art date
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
Abstract
Description
Изобретение относится к способу декодирования сигнала, который кодирован посредством гибридного кодера. Изобретение также относится к устройству декодирования, выполненному соответствующим способом.The invention relates to a method for decoding a signal that is encoded by a hybrid encoder. The invention also relates to a decoding device made in an appropriate manner.
Для кодирования аудиосигналов известны различные способы, являющиеся особенно эффективными. Так, например, для качественно хорошего кодирования речевых сигналов, которые имеют хорошее качество, и одновременно при низких битовых скоростях кодированного потока данных оказались благоприятными, в частности, так называемые технологии CELP (линейное предсказание с кодовым возбуждением). Метод CELP работает во временной области и основывается на модели возбуждения для переменного фильтра. При этом речевой сигнал представлен как параметрами фильтра, так и параметрами, которые описывают сигнал возбуждения.Various methods are known for encoding audio signals, which are particularly effective. So, for example, for qualitatively good coding of speech signals that are of good quality, and at the same time at low bit rates, the encoded data stream turned out to be favorable, in particular, the so-called CELP technologies (linear prediction with code excitation). The CELP method works in the time domain and is based on an excitation model for a variable filter. In this case, the speech signal is represented by both filter parameters and parameters that describe the excitation signal.
В большинстве случаев в связи с кодером также рассматривается соответствующий декодер, который может вновь дешифровать или декодировать кодированные данные. Соответствующие устройства связи содержат так называемый кодек, чтобы иметь возможность передавать и принимать данные, что требуется для осуществления связи.In most cases, a corresponding decoder is also considered in connection with the encoder, which can again decrypt or decode the encoded data. Corresponding communication devices contain a so-called codec in order to be able to transmit and receive data, which is required for communication.
Для кодирования музыкальных или речевых сигналов, которые должны иметь очень высокое качество, в частности при высоких битовых скоростях кодированного потока данных, созданы так называемые перцепционные кодеки (кодек=кодер/декодер). Эти перцепционные кодеки основываются на сокращении информации в частотном диапазоне и используют эффекты маскирования, свойственные органам слуха человека, то есть, например, определенные частоты или изменения, которые не могут восприниматься человеком, также не представляются. Тем самым сложность кодера или кодека снижается. Так как эти кодеры чаще всего работают с преобразованием временного сигнала в частотный диапазон, причем преобразование осуществляется, например, посредством модифицированного дискретного косинусного преобразования (МДКП), они также часто называются преобразующими кодерами или кодеками. Это определение применяется в последующем описании.For encoding music or speech signals, which must be of very high quality, in particular at high bit rates of the encoded data stream, so-called perceptual codecs (codec = encoder / decoder) are created. These perceptual codecs are based on the reduction of information in the frequency range and use masking effects characteristic of the human hearing organs, that is, for example, certain frequencies or changes that cannot be perceived by the person are also not represented. Thus, the complexity of the encoder or codec is reduced. Since these encoders most often work with the conversion of a temporary signal into a frequency range, and the conversion is carried out, for example, by means of a modified discrete cosine transform (MDCT), they are also often called transform encoders or codecs. This definition is applied in the following description.
В последнее время все больше используются так называемые масштабируемые кодеки. Масштабируемые кодеки представляют собой такие кодеки, которые прежде всего обеспечивают превосходное качество аудиосигнала при относительно высокой битовой скорости кодированного потока данных. Тем самым формируются относительно длинные пакеты, которые должны передаваться периодическим образом.Recently, so-called scalable codecs are being used more and more. Scalable codecs are those codecs that primarily provide excellent audio quality at a relatively high bit rate of the encoded data stream. Thus, relatively long packets are formed, which should be transmitted periodically.
Пакет представляет собой множество данных, которые входят в один временной интервал и совместно передаются в этом пакете. В пакетах важные данные зачастую передаются сначала, а менее важные данные передаются вслед за ними. В случае таких длинных пакетов, однако имеется возможность сокращения этих пакетов за счет того, что часть данных удаляется, в частности передаваемая по времени последней часть пакета отсекается. Естественно, тем самым обуславливается некоторое ухудшение качества.A packet is a plurality of data that is included in one time slot and jointly transmitted in this packet. In packets, important data is often transmitted first, while less important data is transmitted after them. In the case of such long packets, however, it is possible to reduce these packets due to the fact that part of the data is deleted, in particular, the part of the packet transmitted by the time of the last is cut off. Naturally, this leads to some deterioration in quality.
Из-за вышеназванных свойств для масштабируемых кодеков предоставляется возможность при низких битовых скоростях работать с CELP-кодеками, а при более высоких битовых скоростях - с преобразующими кодеками. Это привело к развитию гибридных CELP-/преобразующих кодеков, которые генерируют основной сигнал с хорошим качеством посредством CELP-способа и, дополнительно к этому, дополнительный сигнал посредством способа на основе преобразующего кодека, с помощью которого основной сигнал улучшается. Это приводит к желательному высокому качеству.Due to the above-mentioned properties, scalable codecs provide the opportunity to work with CELP codecs at low bit rates, and at converting codecs at higher bit rates. This has led to the development of hybrid CELP / transform codecs that generate the main signal with good quality through the CELP method and, in addition, an additional signal through the transform codec method, with which the main signal is improved. This results in the desired high quality.
Недостатком при применении этих преобразующих кодеков является то, что проявляется так называемый эффект «упреждающего эха». При этом речь идет о помеховом шуме, который равномерно распределен по всей длине блока преобразующего кодера. Под блоком понимается совокупность данных, которые кодируются совместно. Для преобразующих кодеков типовая длина блока составляет 40 мс. Помеховый шум эффекта упреждающего эха возникает вследствие ошибки квантования передаваемых спектральных составляющих. При равномерном уровне сигнала уровень этого помехового шума повсюду находится ниже уровня полезного сигнала. Однако если имеется полезный сигнал с нулевым уровнем с последующим неожиданным высоким уровнем, этот помеховый шум перед наступлением высокого уровня отчетливо прослушивается. В литературе приводится известный пример такого изменения характеристик сигнала при щелкании кастаньет.The disadvantage of using these converting codecs is that the so-called “pre-emptive echo” effect is manifested. This is a noise interference that is evenly distributed over the entire length of the block of the transforming encoder. A block is understood as a collection of data that is coded together. For conversion codecs, the typical block length is 40 ms. The noise noise of the pre-emptive echo effect occurs due to the quantization error of the transmitted spectral components. With a uniform signal level, the level of this interference noise is everywhere below the level of the useful signal. However, if there is a useful signal with a zero level followed by an unexpected high level, this interference noise is clearly audible before a high level. A well-known example is given in the literature of such a change in the characteristics of a signal when a castanet is clicked.
Для снижения этого эффекта уже применяются различные способы. Но они все работают с передачей дополнительной информации, что, в свою очередь, приводит к усложнению схемы кодера или вынуждает кодер работать с временно повышенными битовыми скоростями.Various methods have already been applied to reduce this effect. But they all work with the transfer of additional information, which, in turn, complicates the encoder circuitry or forces the encoder to work with temporarily increased bit rates.
Исходя из этого уровня техники, задачей настоящего изобретения является обеспечение простыми средствами возможности снижения помехового шума для сигналов, кодированных посредством гибридного кодека, при котором не требуется дополнительная информация.Based on this prior art, it is an object of the present invention to provide simple means to reduce interference noise for signals encoded by a hybrid codec, which does not require additional information.
Эта задача решается совокупностями признаков независимых пунктов формулы изобретения. Предпочтительные варианты осуществления приведены в зависимых пунктах.This problem is solved by sets of features of the independent claims. Preferred embodiments are provided in the dependent claims.
Для такого снижения помехового шума в декодированном сигнале, который образован из первого сигнала, созданного, например, CELP-декодером, и второго сигнала, созданного, например, преобразующим декодером, выполняются следующие этапы:To reduce interference noise in the decoded signal, which is formed from the first signal created, for example, by the CELP decoder, and the second signal, created, for example, by the conversion decoder, the following steps are performed:
Из обеих декодированных сигнальных составляющих определяется соответственно соответствующая огибающая характеристика энергии. Под огибающей характеристикой энергии понимается, в частности, характеристика зависимости энергии сигнала от времени.From both decoded signal components, the corresponding envelope energy characteristic is determined accordingly. The envelope characteristic of energy is understood, in particular, as the characteristic of the dependence of the signal energy on time.
Из сравнения обеих огибающих характеристик энергии формируется некоторое характеристическое число, например отношение.From a comparison of both envelopes of the energy characteristics, a certain characteristic number is formed, for example, a ratio.
Это характеристическое число служит для вывода коэффициента усиления.This characteristic number is used to output the gain.
Данный способ проявляет преимущества особенно в том случае, когда энергия, например, в способе кодирования, приводящем к получению первой декодированной сигнальной составляющей, распознается более надежным образом. Затем именно посредством характеристического числа или коэффициента усиления может выявляться отклонение.This method is particularly advantageous when energy, for example, in the encoding method resulting in the first decoded signal component, is recognized in a more reliable manner. Then, it is by means of a characteristic number or gain that a deviation can be detected.
В частности, вторая декодированная сигнальная составляющая может умножаться на коэффициент усиления. Тем самым вышеупомянутое отклонение может корректироваться.In particular, the second decoded signal component may be multiplied by a gain. Thus, the aforementioned deviation can be corrected.
Все сигналы могут подразделяться на временные интервалы, причем, в частности, временные интервалы, которые применяются для первой декодированной сигнальной составляющей, могут быть короче, чем временные интервалы для второй сигнальной составляющей.All signals can be divided into time intervals, and in particular, time intervals that are used for the first decoded signal component may be shorter than time intervals for the second signal component.
За счет этого, ввиду более высокого временного разрешения, отклонения энергии во второй сигнальной составляющей могут лучше корректироваться.Due to this, due to the higher temporal resolution, energy deviations in the second signal component can be better corrected.
Первая сигнальная составляющая может создаваться CELP-декодером, который декодирует сигнал, кодированный согласно CELP-алгоритму, а вторая сигнальная составляющая - преобразующим декодером, который декодирует сигнал, кодированный с преобразованием. Этот кодированный с преобразованием сигнал может, в частности, также содержать первую сигнальную составляющую, декодированную согласно CELP-алгоритму, которая после декодирования была кодирована с преобразованием, суммирована с переданным от передатчика кодированным с преобразованием сигналом (то есть уже в частотной области) и затем декодируется в преобразующем декодере в качестве вклада во вторую сигнальную составляющую.The first signal component can be generated by a CELP decoder, which decodes the signal encoded according to the CELP algorithm, and the second signal component, by a conversion decoder, which decodes the signal encoded with the conversion. This transform encoded signal may, in particular, also comprise a first signal component decoded according to the CELP algorithm, which, after decoding, was encoded with transform, summed with the transform encoded signal transmitted from the transmitter (i.e. already in the frequency domain) and then decoded in the conversion decoder as a contribution to the second signal component.
Альтернативно этому, формирование суммы из передаваемого сигнала, кодированного согласно CELP-алгоритму, и передаваемого сигнала, кодированного с преобразованием, может также выполняться во временной области.Alternatively, the summation of the transmitted signal encoded according to the CELP algorithm and the transmitted signal encoded with the conversion can also be performed in the time domain.
Коэффициент усиления может, в частности, равняться характеристическому числу. Затем при формировании подходящего соотношения может получаться соответствующее ослабление второй декодированной сигнальной составляющей, если она предположительно содержит шум упреждающего эха.The gain may, in particular, be equal to a characteristic number. Then, when forming a suitable ratio, a corresponding attenuation of the second decoded signal component can be obtained if it presumably contains anticipatory echo noise.
В частности, первый декодер может представлять собой декодер, основанный на методе CELP, и/или второй декодер может представлять собой преобразующий декодер. Тем самым обеспечивается особенно эффективное снижение шума при одновременном высоком качестве декодированного сигнала.In particular, the first decoder may be a CELP-based decoder, and / or the second decoder may be a transform decoder. This provides a particularly effective noise reduction while at the same time high quality decoded signal.
Изменение принимаемого полного сигнала на стороне декодера может осуществляться, в частности, в том случае, если имеют место предварительно определенные критерии.The change in the received full signal on the side of the decoder can be carried out, in particular, if there are predetermined criteria.
В частности, предусматривается, что изменение принимаемого полного сигнала на стороне декодера осуществляется только в том случае, если изменение уровня сигнала превышает определенное пороговое значение. Это обеспечивает особенно эффективное снижение упреждающего эха, так как эффект упреждающего эха, как упомянуто выше, возникает, главным образом, при изменениях уровня, так как тогда шум упреждающего эха лежит выше сигнального уровня. С другой стороны, такое селективное изменение не приводит к отказу ненужным образом от улучшения качества посредством второго кодера.In particular, it is envisaged that the change in the received full signal on the side of the decoder is carried out only if the change in signal level exceeds a certain threshold value. This provides a particularly effective reduction of the pre-emptive echo, since the effect of the pre-emptive echo, as mentioned above, occurs mainly when the level changes, since then the noise of the pre-emptive echo lies above the signal level. On the other hand, such a selective change does not unnecessarily result in a quality improvement by the second encoder.
Согласно другому аспекту изобретения создан способ, в котором на основе описанного способа декодированный сигнал или его первая и вторая декодированные сигнальные составляющие обрабатываются раздельно по частотным диапазонам. Это имеет следующее преимущество. При декодировании для многих полос частот известна номинальная энергия для этих полос частот, в частности, из энергии отдельных разделенных по частотным диапазонам первых декодированных сигнальных составляющих, например CELP-сигналов. Посредством второй декодированной сигнальной составляющей может теперь обеспечиваться дополнительная сигнальная составляющая, которая, однако, по своей энергии может существенно отклоняться. Проблематичным является, прежде всего, если энергия второй декодированной сигнальной составляющей является в значительной мере слишком высокой, например, ввиду эффектов упреждающего эха. Способ обеспечивает для каждой отдельной обрабатываемой полосы частот ограничение энергии (или уровня) второй сигнальной составляющей в зависимости от энергии первой сигнальной составляющей. Этот способ является тем более эффективным, чем больше полос частот обрабатывается отдельно описанным образом.According to another aspect of the invention, a method is created in which, based on the described method, a decoded signal or its first and second decoded signal components are processed separately in frequency ranges. This has the following advantage. When decoding for many frequency bands, the nominal energy for these frequency bands is known, in particular, from the energy of individual first decoded signal components separated by frequency ranges, for example, CELP signals. By means of the second decoded signal component, an additional signal component can now be provided, which, however, can deviate substantially in energy. It is problematic, first of all, if the energy of the second decoded signal component is significantly too high, for example, due to the effects of pre-emptive echo. The method provides for each individual processed frequency band the energy (or level) of the second signal component is limited depending on the energy of the first signal component. This method is all the more effective the more frequency bands are processed in a separately described manner.
Другие преимущества изобретения представлены с помощью приведенных для примера вариантов осуществления.Other advantages of the invention are presented by way of example embodiments.
На чертежах представлено следующее.The drawings show the following.
Фиг.1 - представление существенных компонентов на стороне кодера и на стороне декодера для пояснения примерного выполнения процесса кодирования/декодирования.Figure 1 is a representation of the essential components on the encoder side and on the decoder side to explain an example implementation of the encoding / decoding process.
Фиг.2 - схематичное представление устройства связи для передачи кодированного сигнала между устройствами связи в сети связи.Figure 2 - schematic representation of a communication device for transmitting an encoded signal between communication devices in a communication network.
Фиг.3 - устройство декодирования или устройство подавления шумов для пояснения снижения упреждающего эха с помощью адаптации усиления, которая основывается на CELP-сигнале.Figure 3 is a decoding device or noise suppression device for explaining the reduction of the pre-emptive echo by means of gain adaptation, which is based on the CELP signal.
Фиг.4 - другой вариант осуществления согласования уровней или снижения упреждающего эха.4 is another embodiment of matching levels or reducing pre-emptive echoes.
На фиг.1 представлено схематичное выполнение процесса кодирования и декодирования согласно одному из вариантов осуществления. На стороне С кодера аналоговый сигнал S, который должен передаваться к приемнику, предварительно обрабатывается с помощью блока РР предварительной обработки или подготавливается для кодирования, например, путем преобразования в цифровую форму. Кроме того, производится разложение сигнала на временные сегменты или кадры в блоке F разделения. Подготовленный таким образом сигнал подается на блок COD кодирования. Блок COD кодирования содержит гибридный кодер, который включает в себя первый кодер, представляющий собой CELP-кодер COD1, и второй кодер, представляющий собой преобразующий кодер COD2. CELP-кодер COD1 включает в себя множество CELP-кодеров COD1_А, COD1_В, COD1_С, которые работают в различных частотных диапазонах. За счет этого подразделения на различные частотные диапазоны может быть обеспечено особенно точное кодирование. Кроме того, это подразделение на различные частотные диапазоны очень хорошо поддерживает принцип масштабируемого кодека, так как в зависимости от желательного масштабирования может передаваться только один частотный диапазон, несколько или все частотные диапазоны. CELP-кодер COD1 выдает основную составляющую S_G в кодированный полный сигнал S_GES. Преобразующий кодер COD2 выдает дополнительную составляющую S_Z в кодированный полный сигнал S_GES. Кодированный полный сигнал S_GES передается посредством устройства КС связи на стороне С кодера в устройство KD связи на стороне D декодера. Здесь осуществляется, при необходимости, обработка (например, разделение кодированного полного сигнала на составляющие S_G и S_Z) данных или принятого кодированного полного сигнала S_GES в блоке PROC обработки, причем затем обработанные данные или обработанный сигнал подаются на блок DEC декодирования для последующего декодирования (см. также фиг.3 и 4). К блоку декодирования подключен блок NR снижения шумов, который более детально представлен на фиг.3.Figure 1 shows a schematic diagram of the encoding and decoding process according to one embodiment. On the C side of the encoder, the analog signal S, which is to be transmitted to the receiver, is pre-processed by the pre-processing unit PP or prepared for encoding, for example, by digitization. In addition, the signal is decomposed into time segments or frames in the division block F. The signal thus prepared is fed to the COD coding block. The coding unit COD comprises a hybrid encoder that includes a first encoder representing a CELP encoder COD1 and a second encoder representing a transform encoder COD2. The CELP encoder COD1 includes a plurality of CELP encoders COD1_A, COD1_B, COD1_C, which operate in different frequency ranges. Due to this division into different frequency ranges, particularly accurate coding can be ensured. In addition, this division into different frequency ranges very well supports the principle of a scalable codec, since depending on the desired scaling, only one frequency range, several or all frequency ranges can be transmitted. The CELP encoder COD1 provides the main component S_G to the encoded full signal S_GES. The conversion encoder COD2 provides an additional component S_Z to the encoded full signal S_GES. The encoded full signal S_GES is transmitted by the communication device KS on the encoder side C to the communication device KD on the decoder side D. Here, if necessary, processing (for example, dividing the encoded full signal into S_G and S_Z components) of the data or the received encoded full signal S_GES is carried out in the processing unit PROC, and then the processed data or the processed signal is supplied to the decoding unit DEC for subsequent decoding (see also figure 3 and 4). A noise reduction unit NR, which is presented in more detail in FIG. 3, is connected to the decoding unit.
На фиг.2 показано первое устройство СОМ1 связи (например, представленное компонентами на стороне С кодера на фиг.1), которое имеет блок ANT1 передачи и приема (например, соответствующий устройству КС связи) для передачи или/и приема данных, а также вычислительный блок CPU1, выполненный с возможностью реализации компонентов на стороне С кодера или реализации показанного на фиг.1 способа кодирования (обработки на стороне С кодирования). Передача данных осуществляется посредством блока ANT1 передачи и приема по коммуникационной сети CN (которая, например, в зависимости от применяемых устройств связи может быть выполнена как сеть Интернет, телефонная сеть или сеть мобильной радиосвязи). Прием осуществляется посредством второго устройства СОМ2 связи (например, представленного компонентами на правой стороне фиг.1), которое вновь содержит блок ANT2 передачи и приема (например, соответствующий устройству КВ связи), а также вычислительный блок CPU2, выполненный с возможностью реализации компонентов на стороне D декодера или реализации показанного на фиг.1 способа декодирования (обработки на стороне D декодера). Примеры возможной реализации устройств СОМ1 и СОМ2 связи, в которых может найти применение этот способ, включают в себя IP-телефоны, шлюзы речевой связи или мобильные телефоны.FIG. 2 shows a first communication device COM1 (for example, represented by components on the C side of the encoder in FIG. 1), which has a transmission and reception unit ANT1 (for example, corresponding to a communication device CC) for transmitting and / or receiving data, as well as computing a CPU1 unit configured to implement components on the C side of the encoder or implement the encoding method shown in FIG. 1 (processing on the C side of the encoding). Data is transmitted via the transmit and receive unit ANT1 via the CN communication network (which, for example, depending on the communication devices used, can be implemented as the Internet, a telephone network, or a mobile radio communication network). Reception is carried out by means of a second communication device COM2 (for example, represented by components on the right side of FIG. 1), which again contains a transmission and reception unit ANT2 (for example, corresponding to an HF communication device), as well as a computing unit CPU2 configured to implement components on the side D of the decoder or implementation of the decoding method shown in FIG. 1 (processing on the D side of the decoder). Examples of possible implementations of COM1 and COM2 communication devices in which this method may find application include IP telephones, voice gateways, or mobile telephones.
Ниже приводятся ссылки на фиг.3, на которой показаны блок DEC декодирования и блок NR подавления шумов с существенными компонентами для схематичного представления процедуры подавления упреждающего эха. Кодированный с помощью CELP-алгоритма сигнал S_COD,CELP (соответствующий сигналу S_G) декодируется посредством CELP-декодера DEC_GES,CELP полной полосы. Декодированный сигнал S_CELP подается, с одной стороны, к (первому) блоку GE1 определения огибающей энергии для определения соответствующей огибающей ENV_CELP, а с другой стороны, к кодеру компенсации наложения спектров во временной области (COD_TDAC). Кодирование с компенсацией наложения спектров во временной области (TDAC) является примером преобразующего кодирования.The following are links to FIG. 3, which shows a decoding unit DEC and a noise reduction unit NR with essential components for schematically presenting a pre-emptive suppression procedure. The signal S_COD, CELP encoded using the CELP algorithm (corresponding to the signal S_G) is decoded using the full-band CELP decoder DEC_GES, CELP. The decoded signal S_CELP is supplied, on the one hand, to the (first) energy envelope determining unit GE1 to determine the corresponding envelope ENV_CELP, and on the other hand, to the time domain spectral overlap compensation encoder (COD_TDAC). Time Domain Overlay Compensation (TDAC) coding is an example of transform coding.
Кодированный сигнал S_COD,CELP,TDAC вместе с образованным на стороне приемника кодированным с преобразованием сигналом S_COD,TDAC (соответствующим сигналу S_Z) подается на преобразующий декодер DEC_TDAC, чтобы сформировать декодированный сигнал S_TDAC. Также из этого декодированного сигнала S_TDAC во втором блоке GE2 определения огибающей энергии определяется соответствующая огибающая энергии ENV_TDAC. В блоке D определения отношения на временных сегментах определяется отношение R огибающих энергии друг к другу в виде характеристического числа. В блоке BFE определения условий устанавливается, имеет ли отношение установленное наименьшее расстояние от 1 (1: обе огибающие энергии одинаковы), то есть равны ли уровни обоих сигналов или отклоняются друг от друга только на заданный процент.The encoded signal S_COD, CELP, TDAC together with the transmitter-encoded signal S_COD, TDAC (corresponding to the signal S_Z) formed on the receiver side is supplied to the conversion decoder DEC_TDAC to generate the decoded signal S_TDAC. Also from this decoded signal S_TDAC in the second energy envelope determination unit GE2, the corresponding energy envelope ENV_TDAC is determined. In the block D determining the relationship on time segments, the ratio R of the energy envelopes to each other in the form of a characteristic number is determined. In the condition determination unit BFE, it is established whether the set minimum distance from 1 is related (1: both energy envelopes are the same), that is, whether the levels of both signals are equal or deviate from each other only by a given percentage.
Результатом является коэффициент усиления или коэффициент ослабления G, который в показанном случае равен отношению R (характеристическому числу), на который кодированная с преобразованием сигнальная составляющая S_TDAC умножается в блоке М умножения, чтобы получить окончательный сигнал S_OUT со сниженным помеховым шумом. Точнее говоря, можно, например, исходить из того, что отношение R образуется посредством R=ENV_CELP/ENV_TDAC, и устанавливается, что это отношение не может спадать ниже предварительно определенного порогового значения SW, тогда при спадании ниже порогового значения SW кодированная с преобразованием сигнальная составляющая S_TDAC умножается на коэффициент усиления, например на G=R, что приводит к ослаблению сигнальной составляющей S_TDAC. Кроме того, возможно, в случае, когда нет спадания ниже порогового значения SW, присвоить коэффициенту усиления G значение «1», так что при умножении сигнальной составляющей S_TDAC, которое тогда в любом случае может осуществляться, значение S_TDAC остается неизменным.The result is a gain or attenuation coefficient G, which in the case shown is equal to the ratio R (characteristic number) by which the transform-encoded signal component S_TDAC is multiplied in the multiplication block M to obtain the final signal S_OUT with reduced interference noise. More precisely, it can be assumed, for example, that the relation R is formed by R = ENV_CELP / ENV_TDAC, and it is established that this ratio cannot fall below a predetermined threshold value SW, then when the value falls below the threshold value SW, the signal component encoded with conversion S_TDAC is multiplied by the gain, for example, by G = R, which leads to a weakening of the signal component of S_TDAC. In addition, it is possible, in the case when there is no fall below the threshold value SW, to assign the gain G to the value “1”, so that when the signal component S_TDAC is multiplied, which can then be implemented in any case, the value S_TDAC remains unchanged.
Таким образом, в случае отклонения энергии кодированной с преобразованием сигнальной составляющей S_TDAC, причем отклонение обусловлено именно упомянутым эффектом упреждающего эха, энергия или уровень этой сигнальной составляющей доводится до допустимого значения декодированного с помощью CELP-алгоритма сигнала S_CELP, так что в окончательном сигнале S-OUT помеховый шум снижен.Thus, in case of deviation of the energy of the signal component S_TDAC encoded with the conversion, the deviation being due to the aforementioned effect of the pre-emptive echo, the energy or level of this signal component is brought to the permissible value of the S_CELP signal decoded using the CELP algorithm, so that in the final S-OUT signal interference noise is reduced.
Ниже приведены ссылки на фиг.4, с помощью которой поясняется другой вариант осуществления для снижения эффекта упреждающего эха.The following are links to FIG. 4, with which another embodiment for reducing the effect of proactive echo is explained.
Возможно, что вместо только одного CELP-кодека имеется несколько разделенных по частотным диапазонам (CELP- и других) кодеков. Показанный на фиг.4 вариант осуществления соответствует в большей части показанному на фиг.3 варианту осуществления, и по отношению к нему предусматривает дальнейшее развитие, заключающееся в том, что показанный на фиг.3 способ применяется не к полным сигналам (CELP- и другого) декодера и преобразующего декодера, а этот способ применяется в отдельности по частотным диапазонам. Это означает, что сначала производится разделение полного сигнала или отдельных сигнальных составляющих на частотные диапазоны, причем способ по фиг.3 затем может применяться на каждый частотный диапазон к отдельным сигнальным составляющим.It is possible that instead of just one CELP codec, there are several codecs separated by frequency ranges (CELP and others). The embodiment shown in FIG. 4 corresponds for the most part to the embodiment shown in FIG. 3, and with respect to it provides further development, namely that the method shown in FIG. 3 is not applied to complete signals (CELP and other) a decoder and a conversion decoder, and this method is applied separately in the frequency ranges. This means that first, the complete signal or individual signal components are divided into frequency ranges, the method of FIG. 3 then being applied to each frequency range to the individual signal components.
Обеспечиваемое этим преимущество поясняется ниже. В декодере для нескольких полос частот известна номинальная энергия для этих полос частот, а именно из энергии отдельных разделенных на частотные диапазоны CELP-сигналов. Преобразующий декодер выдает теперь дополнительный сигнал (дополнительную сигнальную составляющую), который, однако, по своей энергии может отклоняться существенным образом. Проблематичным является, прежде всего, если энергия сигнала из преобразующего декодера слишком высока, например, ввиду эффектов упреждающего эха. Данный способ вводит теперь для каждой отдельно обрабатываемой полосы частот ограничение энергии преобразующего кодека в зависимости от CELP-энергии. Этот способ является тем более эффективным, чем больше полос частот отдельно обрабатываются указанным образом.The advantage provided by this is explained below. In the decoder for several frequency bands, the nominal energy for these frequency bands is known, namely from the energy of individual CELP signals divided into frequency ranges. The conversion decoder now produces an additional signal (additional signal component), which, however, can deviate substantially in energy. It is problematic, first of all, if the energy of the signal from the converting decoder is too high, for example, due to the effects of pre-emptive echo. This method now introduces, for each separately processed frequency band, the energy restriction of the transforming codec depending on the CELP energy. This method is all the more effective the more frequency bands are separately processed in this way.
Это может быть пояснено на следующем примере.This can be illustrated by the following example.
Пусть полный сигнал состоит из тона частотой 2000 Гц, который полностью образован составляющей CELP-кодека. Дополнительно, на основе эффектов упреждающего эха, преобразующий кодек формирует еще помеховый сигнал с частотой 6000 Гц; пусть энергия помехового сигнала составляет 10% энергии тона частотой 2000 Гц. Пусть критерием ограничения составляющей преобразующего кодека является то, что она должна быть максимально равна CELP-составляющей.Let the complete signal consist of a tone with a frequency of 2000 Hz, which is completely formed by a component of the CELP codec. Additionally, based on the effects of pre-emptive echo, the converting codec generates another interfering signal with a frequency of 6000 Hz; let the energy of the interfering signal be 10% of the tone energy with a frequency of 2000 Hz. Let the criterion for limiting the component of the transforming codec be that it should be as equal to the CELP component as possible.
Случай 1: не выполняется разделения на полосы частот (первый вариант осуществления). Тогда помеховый сигнал на частоте 6000 Гц не подавляется, так как он имеет только 10% энергии тона частотой 2000 Гц из CELP-кодека.Case 1: bandwidth division is not performed (first embodiment). Then the interfering signal at a frequency of 6000 Hz is not suppressed, since it has only 10% of the tone energy with a frequency of 2000 Hz from the CELP codec.
Случай 2: Полосы частот А: 0-4000 Гц и В: 4000-8000 Гц обрабатываются раздельно (второй вариант выполнения). В этом случае помеховый сигнал полностью подавляется, так как в верхней полосе частот CELP-составляющая равна нулю, и, тем самым, кодированный с преобразованием сигнал ограничивается на значении, равном нулю.Case 2: Frequency bands A: 0-4000 Hz and B: 4000-8000 Hz are processed separately (second embodiment). In this case, the interfering signal is completely suppressed, since in the upper frequency band the CELP component is equal to zero, and thus, the signal encoded with the conversion is limited to a value equal to zero.
На фиг.4 показан (соответственно фиг.3) блок DEC декодирования и блок NR подавления шума с компонентами, существенными для схематичного представления процедуры согласования уровней или снижения упреждающего эха. Что касается выработки кодированных сигналов или передачи на приемник, ссылки вновь будут даваться на фиг.1 или 2.FIG. 4 shows (respectively FIG. 3) a decoding unit DEC and a noise reduction unit NR with components essential for a schematic representation of a level matching procedure or for reducing pre-emptive echo. As for generating encoded signals or transmitting to the receiver, references will again be given in FIGS. 1 or 2.
Кодированный с помощью CELP-алгоритма сигнал S_COD,CELP (соответствующий сигнальной составляющей S_G) декодируется посредством CELP-декодера полной полосы, DEC_GES,CELP'. При этом CELP-декодер полной полосы включает в себя два блока декодирования, первый блок декодирования, DEC_FB_A, для декодирования сигнала S_COD,CELP в первой полосе А частот и второй блок декодирования, DEC_FB_В, для декодирования сигнала S_COD,CELP во второй полосе В частот. Первый декодированный сигнал S_CELP_A подается на первый блок GE1_A определения огибающей энергии для определения соответствующей огибающей ENV_CELP_A, в то время как второй декодированный сигнал S_CELP_В подается на второй блок GE1_В определения огибающей энергии для определения соответствующей огибающей ENV_CELP_В.The signal S_COD, CELP encoded by the CELP algorithm (corresponding to the signal component S_G) is decoded by the full-band CELP decoder, DEC_GES, CELP '. In this case, the full-band CELP decoder includes two decoding units, a first decoding unit, DEC_FB_A, for decoding the S_COD, CELP signal in the first frequency band A and a second decoding unit, DEC_FB_B, for decoding the S_COD, CELP signal in the second frequency band B. The first decoded signal S_CELP_A is supplied to the first energy envelope determination unit GE1_A to determine the corresponding envelope ENV_CELP_A, while the second decoded signal S_CELP_B is supplied to the second energy envelope determination unit GE1_B to determine the corresponding envelope ENV_CELP_B.
Кодированный с преобразованием сигнал S_COD,TDAC, созданный на стороне приемника (соответствующий сигналу S_Z), подается на преобразующий декодер DEC_TDAC, чтобы сформировать декодированный сигнал S_TDAC, который вновь подается на разделитель FBS полос частот. Этот разделитель делит сигнал S_TDAC на два сигнала, а именно сигнал S_TDAC_А для полосы А частот и сигнал S_TDAC_В для полосы В частот. Разделение на полосы частот может, как вариант, осуществляться в частотной области, перед обратным преобразованием во временную область. При этом отсутствует задержка, вводимая разделителем полос частот, работающим во временной области (фильтр верхних частот, фильтр нижних частот или полосовой фильтр). Также из этих декодированных зависящих от частоты сигналов S_TDAC_А и S_TDAC_В в третьем блоке GE2_А определения огибающей энергии или в четвертом блоке GE2_В определения огибающей энергии определяется соответствующая огибающая ENV_TDAC_A или ENV_TDAC_В.The transform-encoded S_COD, TDAC signal generated at the receiver side (corresponding to the S_Z signal) is supplied to the DEC_TDAC transform decoder to generate a decoded S_TDAC signal, which is again fed to the FBS frequency band splitter. This splitter divides the S_TDAC signal into two signals, namely, the S_TDAC_A signal for frequency band A and the S_TDAC_B signal for frequency band B. The division into frequency bands may, as an option, be carried out in the frequency domain, before being converted back to the time domain. There is no delay introduced by the frequency band separator operating in the time domain (high-pass filter, low-pass filter or band-pass filter). Also from these decoded frequency-dependent signals S_TDAC_A and S_TDAC_B in the third energy envelope determination unit GE2_A or in the fourth energy envelope determination unit GE2_B, the corresponding envelope ENV_TDAC_A or ENV_TDAC_B is determined.
В первом блоке BD_A определения усиления для полосы А частот с помощью огибающих ENV_CELP_A и ENV_TDAC_A энергии определяется коэффициент усиления G_А (или коэффициент ослабления, так как усиление отрицательно), а во втором блоке BD_В определения усиления для полосы В частот с помощью огибающих ENV_CELP_В и ENV_TDAC_В энергии определяется коэффициент усиления G_В (или коэффициент ослабления). Определение соответствующего коэффициента усиления может происходить соответственно определению на фиг.3 (см. компоненты D, BFE). При этом вновь может формироваться соответствующее отношение (характеристическое число) R_A, R_B огибающих энергии для соответствующей полосы А и В частот, а именно: R_A=ENV_CELP_A/ENV_TDAC_A или R_В=ENV_CELP_В/ENV_TDAC_В, причем для соответствующей полосы частот устанавливается пороговое значение SW_A или SW_B, при спадании ниже которого формируется соответствующий коэффициент усиления G_A (например, G_A=R_A) или G_B (например, G_B=R_B), который должен применяться к сигналу S_TDAC_А или S_TDAC_В соответствующей полосы частот (чтобы ввести соответствующее ослабление). Если не произошло спадание ниже порогового значения, соответствующий коэффициент усиления G_A или G_В может устанавливаться на «1», так что при умножении на него сигнал S_TDAC_А или S_TDAC_В, зависящий от полосы частот, остается неизменным.In the first block BD_A for determining the gain for frequency band A using the energy envelopes ENV_CELP_A and ENV_TDAC_A, the gain G_A is determined (or the attenuation coefficient, since the gain is negative), and in the second block BD_B for determining the gain for the frequency band B using envelopes ENV_CELP_В and ENV_TDAC_В of energy the gain G_B (or attenuation coefficient) is determined. The determination of the corresponding gain can occur according to the definition in figure 3 (see components D, BFE). In this case, the corresponding ratio (characteristic number) R_A, R_B of energy envelopes for the corresponding frequency band A and B can be formed again, namely: R_A = ENV_CELP_A / ENV_TDAC_A or R_B = ENV_CELP_B / ENV_TDAC_B, and the threshold value SW_A or SW_B is set for the corresponding frequency band , when falling below which the corresponding gain G_A (for example, G_A = R_A) or G_B (for example, G_B = R_B) is formed, which should be applied to the signal S_TDAC_A or S_TDAC_B of the corresponding frequency band (in order to introduce the corresponding attenuation). If there is no fall below the threshold value, the corresponding gain G_A or G_B can be set to “1”, so when you multiply by it, the signal S_TDAC_A or S_TDAC_B, depending on the frequency band, remains unchanged.
В первом устройстве М_А умножения для полосы А частот коэффициент усиления G_A умножается на сигнал S_TDAC_А, а коэффициент усиления G_В умножается на сигнал S_TDAC_В. Затем умноженные (в конечном счете, ослабленные), зависящие от полосы частот сигналы объединяются, чтобы получить окончательный сигнал S_OUT' полной полосы частот с подавленным помеховым шумом.In the first multiplication device M_A for frequency band A, the gain G_A is multiplied by the signal S_TDAC_A, and the gain G_B is multiplied by the signal S_TDAC_B. Then, the multiplied (ultimately attenuated) band-dependent signals are combined to obtain the final full-band signal S_OUT 'with suppressed interference noise.
Следует отметить, что хотя в вышеописанном примере производилось разделение декодированных сигнальных составляющих S_CELP_A, S_CELP_B, S_TDAC_A, S_TDAC_B только на два частотных диапазона А и В, также возможно и может быть предпочтительным разделение на три и более частотных диапазонов.It should be noted that although the decoded signal components S_CELP_A, S_CELP_B, S_TDAC_A, S_TDAC_B were only divided into two frequency bands A and B, the separation into three or more frequency bands was possible and may be preferred.
Claims (13)
a) определение первой огибающей характеристики (ENV_CELP) энергии и второй огибающей характеристики (ENV_TDAC) энергии первой декодированной сигнальной составляющей (S_CELP) и второй декодированной сигнальной составляющей (S_TDAC);
b) формирование характеристического числа (R) в зависимости от сравнения первой и второй огибающих характеристик (ENV_CELP, ENV_TDAC) энергии;
c) вывод коэффициента усиления (G) в зависимости от характеристического числа (R);
d) умножение второй декодированной сигнальной составляющей (S_TDAC) на коэффициент усиления (G), если характеристическое число (R) спадает ниже предварительно определенного порогового значения.1. A method of reducing interference noise (S_OUT) in a decoded signal, which is formed from a first decoded signal component (S_CELP) and a second decoded signal component (S_TDAC), comprising the following steps:
a) determining the first energy envelope of the characteristic (ENV_CELP) and the second energy envelope of the characteristic (ENV_TDAC) of the first decoded signal component (S_CELP) and the second decoded signal component (S_TDAC);
b) generating a characteristic number (R) depending on a comparison of the first and second envelopes of the energy characteristics (ENV_CELP, ENV_TDAC);
c) deriving a gain (G) depending on a characteristic number (R);
d) multiplying the second decoded signal component (S_TDAC) by the gain (G) if the characteristic number (R) falls below a predetermined threshold value.
a) определение первой огибающей характеристики (ENV_CELP_A, ENV_CELP_B) энергии, соответствующей первой декодированной сигнальной составляющей, и второй огибающей характеристики (ENV_TDAC_A, ENV_TDAC_B) энергии, соответствующей второй декодированной сигнальной составляющей, для соответствующей частичной полосы частот;
b) формирование соответствующего характеристического числа (R_A, R_B) в зависимости от сравнения первой и второй огибающих характеристик энергии для соответствующей частичной полосы частот;
c) вывод соответствующего коэффициента (G_A, G_B) усиления в зависимости от соответствующего характеристического числа для соответствующей частичной полосы частот; и
d) умножение второй декодированной сигнальной составляющей (S_TDAC_A, S_TDAC_B) на соответствующий коэффициент усиления (G_A, G_B) для соответствующей частичной полосы частот, если характеристическое число (R_A, R_B) спадает ниже предварительно определенного порогового значения.12. A method for reducing interference noise in a decoded signal relating to a frequency band that is formed from a corresponding first decoded signal component (S_CELP-A, S_CELP_B) and a corresponding second decoded signal component (S_TDAC_A, S_TDAC_B), for a corresponding partial frequency band of said frequency band containing the following steps:
a) determining the first envelope of the characteristic (ENV_CELP_A, ENV_CELP_B) of the energy corresponding to the first decoded signal component and the second envelope of the characteristic (ENV_CELP_A, ENV_TDAC_A, ENV_TDAC_B) of the energy corresponding to the second decoded signal component for the corresponding partial frequency band;
b) the formation of the corresponding characteristic number (R_A, R_B) depending on the comparison of the first and second envelopes of the energy characteristics for the corresponding partial frequency band;
c) outputting the corresponding gain factor (G_A, G_B) depending on the corresponding characteristic number for the corresponding partial frequency band; and
d) multiplying the second decoded signal component (S_TDAC_A, S_TDAC_B) by the corresponding gain (G_A, G_B) for the corresponding partial frequency band if the characteristic number (R_A, R_B) falls below a predetermined threshold value.
a) средство для определения первой огибающей характеристики (ENV_CELP) энергии и второй огибающей характеристики (ENV_TDAC) первой декодированной сигнальной составляющей (S_CELP) и второй декодированной сигнальной составляющей (S_TDAC);
b) средство для формирования характеристического числа (R) в зависимости от сравнения первой и второй огибающих характеристик (ENV_CELP, ENV_TDAC) энергии;
c) средство для вывода коэффициента усиления (G) в зависимости от характеристического числа (R); и
d) средство для умножения второй декодированной сигнальной составляющей (S_TDAC) на коэффициент усиления (G), если характеристическое число (R) спадает ниже предварительно определенного порогового значения. 13. A device for reducing interference noise in a decoded signal for implementing the method according to any one of claims 1 to 12, containing
a) means for determining the first envelope of the energy characteristic (ENV_CELP) and the second energy envelope (ENV_TDAC) of the first decoded signal component (S_CELP) and the second decoded signal component (S_TDAC);
b) means for generating a characteristic number (R) depending on a comparison of the first and second envelopes of the energy characteristics (ENV_CELP, ENV_TDAC);
c) means for deriving a gain (G) depending on a characteristic number (R); and
d) means for multiplying the second decoded signal component (S_TDAC) by a gain (G) if the characteristic number (R) falls below a predetermined threshold value.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005019863.5 | 2005-04-28 | ||
DE102005019863A DE102005019863A1 (en) | 2005-04-28 | 2005-04-28 | Noise suppression process for decoded signal comprise first and second decoded signal portion and involves determining a first energy envelope generating curve, forming an identification number, deriving amplification factor |
DE102005028182.6 | 2005-06-17 | ||
DE102005028182 | 2005-06-17 | ||
DE102005032079.1 | 2005-07-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007101541A RU2007101541A (en) | 2008-07-27 |
RU2351024C2 true RU2351024C2 (en) | 2009-03-27 |
Family
ID=39810390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007101541/09A RU2351024C2 (en) | 2005-04-28 | 2006-04-12 | Method and device for noise reduction |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2351024C2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2575809C2 (en) * | 2010-07-08 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Encoder using forward aliasing cancellation |
RU2591011C2 (en) * | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Audio signal encoder, audio signal decoder, method for encoding or decoding audio signal using aliasing-cancellation |
RU2622863C2 (en) * | 2012-12-21 | 2017-06-20 | Оранж | Effective pre-echo attenuation in digital audio signal |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2400987T3 (en) * | 2008-09-17 | 2013-04-16 | France Telecom | Attenuation of pre-echoes in a digital audio signal |
-
2006
- 2006-04-12 RU RU2007101541/09A patent/RU2351024C2/en not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2591011C2 (en) * | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Audio signal encoder, audio signal decoder, method for encoding or decoding audio signal using aliasing-cancellation |
RU2575809C2 (en) * | 2010-07-08 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Encoder using forward aliasing cancellation |
RU2622863C2 (en) * | 2012-12-21 | 2017-06-20 | Оранж | Effective pre-echo attenuation in digital audio signal |
Also Published As
Publication number | Publication date |
---|---|
RU2007101541A (en) | 2008-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612236B2 (en) | Method and device for noise suppression in a decoded audio signal | |
US7996233B2 (en) | Acoustic coding of an enhancement frame having a shorter time length than a base frame | |
US8457319B2 (en) | Stereo encoding device, stereo decoding device, and stereo encoding method | |
JP2021131569A (en) | Method and system for encoding stereo sound signal using coding parameters of primary channel to encode secondary channel | |
RU2439718C1 (en) | Method and device for sound signal processing | |
EP2382626B1 (en) | Selective scaling mask computation based on peak detection | |
US20100169101A1 (en) | Method and apparatus for generating an enhancement layer within a multiple-channel audio coding system | |
US20110077940A1 (en) | Speech encoding | |
US20100169100A1 (en) | Selective scaling mask computation based on peak detection | |
JP2004310088A (en) | Half-rate vocoder | |
WO2010079168A1 (en) | Filtering speech | |
CN1918632B (en) | Audio encoding | |
US10607624B2 (en) | Signal codec device and method in communication system | |
JP2023109851A (en) | Apparatus and method for MDCT M/S stereo with comprehensive ILD with improved mid/side determination | |
US5913187A (en) | Nonlinear filter for noise suppression in linear prediction speech processing devices | |
JP2008519306A (en) | Encode and decode signal pairs | |
RU2351024C2 (en) | Method and device for noise reduction | |
CN1918631B (en) | Audio encoding device and method and audio decoding device and method | |
KR20040102152A (en) | Generating LSF vectors | |
US8655650B2 (en) | Multiple stream decoder | |
CN1993734B (en) | Noise suppression process and device | |
US8849655B2 (en) | Encoder, decoder and methods thereof | |
EP0984433A2 (en) | Noise suppresser speech communications unit and method of operation | |
JP2002023798A (en) | Speech encoding method | |
AL-Rawi | ADPCM: US Patents from 2010 to 2016 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20150413 |