Nothing Special   »   [go: up one dir, main page]

RU2665214C1 - Стереофонический кодер и декодер аудиосигналов - Google Patents

Стереофонический кодер и декодер аудиосигналов Download PDF

Info

Publication number
RU2665214C1
RU2665214C1 RU2017145579A RU2017145579A RU2665214C1 RU 2665214 C1 RU2665214 C1 RU 2665214C1 RU 2017145579 A RU2017145579 A RU 2017145579A RU 2017145579 A RU2017145579 A RU 2017145579A RU 2665214 C1 RU2665214 C1 RU 2665214C1
Authority
RU
Russia
Prior art keywords
signal
frequency
waveform
encoded
signals
Prior art date
Application number
RU2017145579A
Other languages
English (en)
Inventor
Хейко ПУРНХАГЕН
Кристофер ЧЕРЛИНГ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Application granted granted Critical
Publication of RU2665214C1 publication Critical patent/RU2665214C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот. Принимают первый сигнал и второй сигнал. Принимают параметры восстановления высоких частот. Расширяют упомянутый сигнала понижающего микширования до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот. Принимают параметры повышающего микширования. Микшируют первый и второй сигналы для генерирования левого и правого каналов стереосигнала. Причем для частот ниже первой частоты разделения микширование содержит выполнение обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения микширование содержит выполнение параметрического повышающего микширования упомянутого сигнала понижающего микширования с использованием параметров повышающего микширования. 3 н. и 13 з.п. ф-лы, 6 ил.

Description

Область техники, к которой относится изобретение
Описываемое в настоящем документе изобретение в основном относится к стереофоническому кодированию аудиосигналов. В частности, оно относится к декодеру и кодеру для гибридного кодирования, включающего в себя понижающее микширование и дискретное стереофоническое кодирование.
Уровень техники изобретения
При традиционном стереофоническом кодировании аудиосигналов возможные схемы кодирования включают в себя методы параметрического стереофонического кодирования, которые используются в сферах применения с низкой скоростью передачи данных. При промежуточных скоростях часто используется левое/правое (L/R) или среднее/боковое (M/S) стереофоническое кодирование формы сигналов. Существующие форматы распределения и соответствующие методы кодирования могут быть улучшены с точки зрения их эффективности использования полосы частот, особенно в сферах применения со скоростью передачи данных между средней скоростью передачи данных и промежуточной скоростью передачи данных.
Попытка повысить эффективность распределения аудиосигналов в стереофонической звуковой системе предпринята в стандарте Унифицированного кодирования речи и звука (USAC). Стандарт USAC вводит стереофоническое кодирование на основе низкоскоростного кодирования формы сигналов в совокупности с методами параметрического стереофонического кодирования. Однако в решении, предлагаемом в USAC, используются параметрические стереофонические параметры для проведения стереофонического кодирования в области модифицированного дискретного косинусного преобразования (MDCT), чтобы несколько повысить эффективность по сравнению с простым M/S кодированием или L/R кодированием. Недостаток такого решения состоит в том, что может оказаться сложным наилучшим образом использовать стереофоническое кодирование на основе низкоскоростного кодирования формы сигналов в области MDCT на основе параметрических стереофонических параметров, извлекаемых и вычисляемых в области Квадратурных зеркальных фильтров (QMF).
С учетом вышесказанного, может потребоваться дальнейшее усовершенствование для устранения или, по меньшей мере, уменьшения одного или нескольких недостатков, рассмотренных выше.
Краткое описание чертежей
Примеры осуществления описываются ниже со ссылкой на прилагаемые чертежи, на которых:
фиг.1 представляет собой обобщенную блок-схему системы декодирования в соответствии с одним из примеров осуществления;
фиг.2 иллюстрирует первую часть системы декодирования, изображенной на фиг.1;
фиг.3 иллюстрирует вторую часть системы декодирования, изображенной на фиг.1;
фиг.4 иллюстрирует третью часть системы декодирования, изображенной на фиг.1;
фиг.5 представляет собой обобщенную блок-схему системы декодирования в соответствии с первым примером осуществления;
фиг.6 представляет собой обобщенную блок-схему системы декодирования в соответствии со вторым примером осуществления.
Все чертежи являются схематическими и в целом иллюстрируют лишь детали, которые необходимы для объяснения изобретения, при этом другие детали могут упоминаться или только предполагаться. Если не указано иное, одинаковые ссылочные позиции на различных чертежах относятся к одинаковым деталям.
Подробное описание
I. Обзор - декодер
Используемое в настоящем документе лево-правое кодирование или шифрование означает, что левый (L) и правый (R) стереосигналы кодируются без выполнения какого-либо преобразования между сигналами.
Используемое в настоящем документе суммарно-разностное кодирование или шифрование означает, что сумма М левого и правого стереосигналов кодируется как один сигнал (сумма), а разность S между левым и правым стереосигналами кодируется как один сигнал (разность). Суммарно-разностное кодирование может также называться средне-боковым кодированием. При этом соотношение между лево-правой формой и суммарно-разностной формой представляет собой M=L+R и S=L-R. Можно отметить, что возможны различные нормализации и масштабирование при преобразовании левого и правого стереосигналов в суммарно-разностную форму и наоборот при условии, что преобразование в обоих направлениях совпадает. В данном описании, главным образом, используется M=L+R и S=L-R, но система, использующая иное масштабирование, например, M=(L+R)/2 и S=(L-R)/2 действует с тем же успехом.
Используемое в настоящем документе понижающе-дополняющее (dmx/comp) кодирование или шифрование означает подвергание левого и правого стереосигналов матричному умножению в зависимости от весового параметра перед кодированием. При этом dmx/comp кодирование может также называться dmx/comp/a кодированием. Соотношение между понижающе-дополняющей формой, лево-правой формой и суммарно-разностной формой обычно выражается как L+R=M и comp=(1-a)L-(1+a)R=-aM+S. Примечательно, что сигнал понижающего микширования в понижающе-дополняющем представлении при этом эквивалентен суммарному сигналу М суммарно-разностного представления.
Используемый в настоящем документе аудиосигнал может представлять собой чистый аудиосигнал, аудиокомпоненту аудиовизуального сигнала, либо мультимедийный сигнал, либо любое из вышеназванного в совокупности с метаданными.
В соответствии с первым аспектом, в примерах осуществления предлагаются способы, устройства и компьютерные программные продукты для декодирования аудиосигнала стереофонического канала на основе входного сигнала. Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одинаковые признаки и преимущества.
В соответствии с примерами осуществления, предлагается декодер для декодирования двух аудиосигналов. Декодер включает в себя каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух аудиосигналов, причем первый сигнал содержит первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, и кодируемый по форме сигнал понижающего микширования, содержащий спектральные данные, соответствующие частотам выше первой частоты разделения, причем второй сигнал содержит второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Декодер дополнительно содержит каскад микширования на выходе каскада приема. Каскад микширования выполнен с возможностью проверки, находятся ли первый и второй кодируемые по форме сигналы в суммарно-разностной форме для всех частот до первой частоты разделения, и если нет, преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму таким образом, что первый сигнал является комбинацией кодируемого по форме суммарного сигнала, содержащего спектральные данные, соответствующие частотам до первой частоты разделения, и кодируемого по форме сигнала понижающего микширования, содержащего спектральные данные, соответствующие частотам выше первой частоты разделения, а второй сигнал содержит кодируемый по форме разностный сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Декодер дополнительно содержит каскад повышающего микширования на выходе каскада микширования, выполненный с возможностью повышающего микширования первого и второго сигналов для генерирования левого и правого каналов стереосигнала, причем для частот ниже первой частоты разделения каскад повышающего микширования выполнен с возможностью выполнения обратного суммарно-разностного преобразования первого и второго сигналов, а для частот выше первой частоты разделения каскад повышающего микширования выполнен с возможностью выполнения параметрического повышающего микширования сигнала понижающего микширования первого сигнала.
Преимущество наличия нижних частот, прошедших чистое кодирование формы сигналов, т.е., дискретного представления стерео-аудиосигнала, может состоять в том, что человеческое ухо более чувствительно к аудиокомпоненте, имеющей низкие частоты. Благодаря кодированию этой компоненты с более высоким качеством общее впечатление о декодированном аудиосигнале может улучшиться.
Преимущество наличия прошедшей параметрическое стереофоническое кодирование компоненты первого сигнала, т.е., кодируемого по форме сигнала понижающего микширования, а также упомянутого дискретного представления стерео-аудиосигнала состоит в том, что это может повысить качество декодированного аудиосигнала для определенных скоростей передачи данных по сравнению с использованием традиционного параметрического подхода к стереосигналу. При скоростях передачи данных около 32-40 килобит в секунду (кбит/с) параметрическая модель стереофонии может входить в насыщение, т.е., качество декодированного аудиосигнала ограничено недостатками параметрической модели, а не недостаточностью битов для кодирования. Следовательно, для скоростей передачи битов приблизительно от 32 кбит/с может оказаться более целесообразным использовать биты на нижних частотах кодирования формы сигналов. В то же время, гибридный подход к использованию и прошедшей параметрическое стереофоническое кодирование компоненты первого сигнала, и дискретного представления распределенного стерео-аудиосигнала состоит в том, что это может повысить качество декодированного аудиосигнала для определенных скоростей передачи данных, например, ниже 48 кбит/с по сравнению с использованием подхода, при котором все биты используются для нижних частот кодирования формы сигнала, и использованием репликации полосы спектра (SBR) для остальных частот.
Декодер при этом предпочтительно используется для декодирования двухканального стерео-аудиосигнала.
В соответствии с еще одним вариантом осуществления, преобразование первого и второго кодируемых по форме сигналов в суммарно-разностную форму в каскаде микширования осуществляется в перекрывающейся оконной области преобразования. Перекрывающаяся оконная область преобразования может, например, представлять собой область модифицированного дискретного косинусного преобразования (MDCT). Это может оказаться целесообразным, поскольку преобразование других имеющихся форматов распределения аудиосигналов, таких как левая/правая форма или dmx/comp форма, в суммарно-разностную форму легко обеспечивается в области MDCT. Следовательно, сигналы могут кодироваться с использованием различных форматов, для, по меньшей мере, поднабора частот ниже первой частоты разделения в зависимости от характеристик кодируемого сигнала. Это может обеспечить повышенные качество кодирования и эффективность кодирования.
В соответствии с еще одним вариантом осуществления, повышающее микширование первого и второго сигналов в каскаде повышающего микширования выполняется в области Квадратурных зеркальных фильтров (QMF). Повышающее микширование выполняется для генерирования левого и правого стереосигналов.
В соответствии с еще одним вариантом осуществления, кодируемый по форме сигнал понижающего микширования, содержит спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения. Параметры восстановления высоких частот (HFR) принимаются декодером, например, в каскаде приема, а затем отправляются в каскад восстановления высоких частот для расширения сигнала понижающего микширования первого сигнала до диапазона частот выше второй частоты разделения путем выполнения восстановления высоких частот с использованием параметров восстановления высоких частот. Восстановление высоких частот может, например, включать в себя выполнение репликации полосы спектра, SBR.
Преимущество наличия кодируемого по форме сигнала понижающего микширования, который содержит лишь спектральные данные, соответствующие частотам между первой частотой разделения и второй частотой разделения, состоит в том, что требуемая скорость передачи данных для стереофонической системы может быть понижена. В соответствии с другим вариантом, биты, сохраняемые благодаря наличию кодируемого по форме сигнала понижающего микширования, используются для нижних частот кодирования формы сигналов, например, квантование для этих частот может осуществляться более мелкими шагами, либо первая частота разделения может быть повышена.
Поскольку, как упоминалось выше, человеческое ухо более чувствительно к компоненте аудиосигнала, имеющей низкие частоты, высокие частоты, такие как компонента аудиосигнала, имеющий частоты выше второй частоты разделения, могут быть восстановлены путем восстановления высоких частот без снижения воспринимаемого качества звука декодированного аудиосигнала.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования первого сигнала расширяется до диапазона частот выше второй частоты разделения перед тем, как осуществляется повышающее микширование первого и второго сигналов. Это может оказаться целесообразным, поскольку каскад повышающего микширования будет иметь входной суммарный сигнал со спектральными данными, соответствующими всем частотам.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования первого сигнала расширяется до диапазона частот выше второй частоты разделения после преобразования первого и второго кодируемых по форме сигналов в суммарно-разностную форму. Это может оказаться целесообразным, поскольку с учетом того, что сигнал понижающего микширования соответствует суммарному сигналу в суммарно-разностном представлении, каскад восстановления высоких частот будет иметь входной сигнал со спектральными данными, соответствующими частотам до второй частоты разделения, представленный в той же форме, т.е., в суммарной форме.
В соответствии с еще одним вариантом осуществления, повышающее микширование в каскаде повышающего микширования осуществляется с использованием параметров повышающего микширования. Параметры повышающего микширования принимаются декодером, например, в каскаде приема и отправляются в каскад повышающего микширования. Генерируется декоррелированная версия сигнала понижающего микширования, при этом сигнал понижающего микширования и декоррелированная версия сигнала понижающего микширования подвергаются матричной операции. Параметры матричной операции задаются параметрами повышающего микширования.
В соответствии с еще одним вариантом осуществления, кодируемые по форме первый и второй сигналы, принимаемые в каскаде приема, кодируются по форме в лево-правой форме, суммарно-разностной форме и/или понижающе-дополняющей форме, причем дополняющий сигнал зависит от весового параметра a, адаптивного к сигналу. Кодируемые по форме сигналы могут при этом кодироваться по различным формам в зависимости от характеристик сигналов и, тем не менее, быть декодируемыми декодером. Это может обеспечить повышенное качество кодирования и, следовательно, повышенное качество декодированного стерео-аудиосигнала при наличии определенной скорости передачи данных системы. Еще в одном варианте осуществления весовой параметр a является вещественным. Это может упростить декодер, поскольку не требуется никакой дополнительный каскад, аппроксимирующий мнимую компоненту сигнала. Еще одно преимущество состоит в том, что вычислительная сложность декодера может понизиться, что может также привести к уменьшенной задержке/запаздыванию декодирования декодера.
В соответствии с еще одним вариантом осуществления, кодируемые по форме первый и второй сигналы, принимаемые в каскаде приема, кодируются по форме в суммарно-разностной форме. Это означает, что первый и второй сигналы могут кодироваться с использованием перекрывающихся оконных преобразований с организацией независимых окон для первого и второго сигналов соответственно и, тем не менее, быть декодируемыми декодером. Это может обеспечить повышенное качество кодирования и, следовательно, повышенное качество декодированного стерео-аудиосигнала при наличии определенной скорости передачи данных системы. Например, если переходный процесс обнаруживается в суммарном сигнале и не обнаруживается в разностном сигнале, кодер формы сигнала может кодировать суммарный сигнал с более короткими окнами, а для разностного сигнала могут быть сохранены более длительные задаваемые по умолчанию окна. Это может обеспечивать более высокую эффективность кодирования по сравнению с тем случаем, когда боковой сигнал также кодировался бы с использованием последовательности более короткого окна.
II. Обзор - кодер
В соответствии со вторым аспектом, в примерах осуществления предлагаются способы, устройства и компьютерные программные продукты для кодирования аудиосигнала стереофонического канала на основе входного сигнала.
Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одинаковые признаки и преимущества.
Преимущества, касающиеся признаков и устройств и представленные в приведенном выше обзоре декодера, в целом могут иметь силу для соответствующих признаков и устройств кодера.
В соответствии с примерами осуществления, предлагается кодер для кодирования двух аудиосигналов. Кодер содержит каскад приема, выполненный с возможностью приема первого сигнала и второго сигнала, соответствующих интервалу времени упомянутых двух сигналов, подлежащих кодированию.
Кодер дополнительно содержит каскад преобразования, выполненный с возможностью приема первого и второго сигналов с каскада приема и преобразования их в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом.
Кодер дополнительно содержит каскад кодирования формы сигналов, выполненный с возможностью приема первого и второго преобразованных сигналов с каскада преобразования и осуществления с ними кодирования формы сигналов с получением первого и второго кодируемых по форме сигналов соответственно, причем для частот выше первой частоты разделения каскад кодирования формы сигналов выполнен с возможностью осуществления кодирования по форме первого преобразованного сигнала, а для частот до первой частоты разделения каскад кодирования формы сигналов выполнен с возможностью осуществления кодирования по форме первого и второго преобразованных сигналов.
Кодер дополнительно содержит каскад параметрического стереокодирования, выполненный с возможностью приема первого и второго сигналов с каскада приема и подвергания первого и второго сигналов параметрическому стереокодированию с целью извлечения параметрических стереопараметров, обеспечивающих восстановление спектральных данных первого и второго сигналов для частот выше первой частоты разделения.
Кодер дополнительно содержит каскад генерирования битового потока, выполненный с возможностью приема первого и второго кодируемых по форме сигналов с каскада кодирования формы сигналов и параметрических стереопараметров с каскада параметрического стереокодирования, а также генерирования битового потока, содержащего первый и второй кодируемые по форме сигналы и параметрические стереопараметры.
В соответствии с еще одним вариантом осуществления, преобразование первого и второго сигналов в каскаде преобразования выполняется во временной области.
В соответствии с еще одним вариантом осуществления, для, по меньшей мере, поднабора частот ниже первой частоты разделения кодер может преобразовывать первый и второй кодируемые по форме сигналы в лево-правую форму путем выполнения обратного суммарно-разностного преобразования.
В соответствии с еще одним вариантом осуществления, для, по меньшей мере, поднабора частот ниже первой частоты разделения кодер может преобразовывать первый и второй кодируемые по форме сигналы в понижающе-дополняющую форму путем выполнения матричной операции над первым и вторым сигналами, прошедшими кодирование формы сигналов, причем матричная операция зависит от весового параметра а. Весовой параметр а может после этого быть включен в битовый поток в каскаде генерирования битового потока.
В соответствии с еще одним вариантом осуществления, для частот выше первой частоты разделения кодирование формы сигналов первого и второго преобразованных сигналов в каскаде преобразования включает в себя кодирование формы сигналов первого преобразованного сигнала для частот между первой частотой разделения и второй частотой разделения и установку первого сигнала, прошедшего кодирование формы сигналов, в нуль выше второй частоты разделения. Сигнал понижающего микширования первого сигнала и второго сигнала может после этого подвергаться кодированию с восстановлением высоких частот в каскаде восстановления высоких частот с целью генерирования параметров восстановления высоких частот, обеспечивающих восстановление высоких частот сигнала понижающего микширования. Параметры восстановления высоких частот могут после этого быть включены в битовый поток в каскаде генерирования битового потока.
В соответствии с еще одним вариантом осуществления, сигнал понижающего микширования вычисляется на основе первого и второго сигналов.
В соответствии с еще одним вариантом осуществления, подвергание первого и второго сигналов параметрическому стереокодированию в каскаде параметрического стереокодирования осуществляется путем сначала преобразования первого и второго сигналов в первый преобразованный сигнал, являющийся суммарным сигналом, и второй преобразованный сигнал, являющийся разностным сигналом, а затем подвергания первого и второго преобразованных сигналов параметрическому стереокодированию, причем сигнал понижающего микширования, подлежащий кодированию с восстановлением высоких частот, является первым преобразованным сигналом.
III. Примеры осуществления
Фиг.1 представляет собой обобщенную блок-схему системы 100 декодирования, содержащей концептуальные части 200, 300 и 400, которые подробно будут объясняться в соответствии с приводимыми ниже фиг.2-4. В первой концептуальной части 200 битовый поток принимается и декодируется в первый и второй сигналы. Первый сигнал содержит как первый кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения, так и кодируемый по форме сигнал понижающего микширования, содержащий спектральные данные, соответствующие частотам выше первой частоты разделения. Второй сигнал включает в себя лишь второй кодируемый по форме сигнал, содержащий спектральные данные, соответствующие частотам до первой частоты разделения.
Во второй концептуальной части 300 в том случае, если прошедшие кодирование формы сигналов компоненты первого и второго сигналов находятся не в суммарно-разностной форме, например, в M/S форме, прошедшие кодирование формы сигналов компоненты первого и второго сигналов преобразуются в суммарно-разностную форму. После этого первый и второй сигналы преобразуются во временную область, а затем в область Квадратурных зеркальных фильтров, QMF. В третьей концептуальной части 400 первый сигнал восстановлен по высоким частотам (HFR). И первый, и второй сигналы затем подвергаются повышающему микшированию с получением левого и правого стереофонических выходных сигналов, которые имеют спектральные коэффициенты, соответствующие полному диапазону частот кодированного сигнала, декодируемого системой 100 декодирования.
Фиг.2 иллюстрирует первую концептуальную часть 200 системы 100 декодирования, изображенной на фиг.1. Система 100 декодирования содержит каскад 212 приема. В каскаде 212 приема кадр 202 битового потока декодируется и деквантуется в первый сигнал 204а и второй сигнал 204b. Кадр 202 битового потока соответствует временному интервалу двух декодируемых аудиосигналов. Первый сигнал 204а включает в себя первый сигнал 208, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам до первой частоты разделения kγ, и сигнал 206 понижающего микширования, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам выше первой частоты разделения kγ. Например, первая частота разделения kγ составляет 1,1 кГц.
В соответствии с некоторыми вариантами осуществления, сигнал 206 понижающего микширования, прошедший кодирование формы сигналов, содержит спектральные данные, соответствующие частотам между первой частотой разделения kγ и второй частотой разделения kχ. Например, вторая частота разделения kχ лежит в диапазоне 5,6-8 кГц.
Принимаемые первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, могут быть с кодированием формы сигналов в лево-правой форме, суммарно-разностной форме и/или понижающе-дополняющей форме, причем дополняющий сигнал зависит от весового параметра a, адаптивного к сигналу. Сигнал 206 понижающего микширования, прошедший кодирование формы сигналов, соответствует понижающему микшированию, подходящему для параметрического стерео, которое - в соответствии с приведенным выше описанием - соответствует суммарной форме. Однако сигнал 204b не имеет контента выше первой частоты разделения kγ. Каждый из сигналов 206, 208, 210 представлен в области модифицированного дискретного косинусного преобразования (MDCT).
Фиг.3 иллюстрирует вторую концептуальную часть 300 системы 100 декодирования, изображенной на фиг.1. Система 100 декодирования содержит каскад 302 микширования. Конструкция системы 100 декодирования требует, чтобы входной сигнал каскада восстановления высоких частот, который подробнее описывается ниже, находился в суммарной форме. Следовательно, каскад микширования выполнен с возможностью проверки, находятся ли первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, в суммарно-разностной форме. Если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, не находятся в суммарно-разностной форме для всех частот до первой частоты разделения kγ, каскад 302 микширования полностью преобразует сигналы 208, 210, прошедшие кодирование формы сигналов, в суммарно-разностную форму. В случае если, по меньшей мере, поднабор частот входных сигналов 208, 210 каскада 302 микширования находится в понижающе-дополняющей форме, в качестве входного сигнала каскада 302 микширования требуется весовой параметр a. Можно отметить, что входные сигналы 208, 210 могут содержать несколько поднаборов частот, кодированных в понижающе-дополняющей форме, и что в этом случае каждый поднабор не обязательно должен кодироваться с использованием одного и того же значения весового параметра a. В этом случае в качестве входного сигнала каскада 302 микширования требуются несколько весовых параметров a.
Как указано выше, каскад 302 микширования всегда выдает суммарно-разностное представление входных сигналов 204a-b. Для того, чтобы иметь возможность преобразовывать сигналы, представленные в области MDCT, в суммарно-разностное представление, организация окон сигналов с MDCT кодированием должна быть такой же. Это предполагает, что в случае, если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, находятся в L/R или понижающе-дополняющей форме, организация окон для сигнала 204а и организация окон для сигнала 204b не могут быть независимыми.
Следовательно, в случае, если первый и второй сигналы 208, 210, прошедшие кодирование формы сигналов, находятся в суммарно-разностной форме, организация окон для сигнала 204а и организация окон для сигнала 204b не могут быть независимыми.
После каскада 302 микширования суммарно-разностный сигнал преобразуется во временную область путем применения обратного модифицированного дискретного косинусного преобразования (MDCT-1) 312.
Затем два сигнала 304a-b анализируются двумя блоками 314 QMF. Поскольку сигнал 306 понижающего микширования не содержит нижних частот, нет необходимости анализировать сигнал с помощью блока фильтров Найквиста для повышения разрешающей способности по частоте. Это можно сравнить с системами, в которых сигнал понижающего микширования содержит нижние частоты, например, традиционное параметрическое стерео декодирование, такое как параметрическое стерео MPEG-4. В этих системах сигнал понижающего микширования должен анализироваться с помощью блока фильтров Найквиста с целью повышения разрешающей способности по частоте сверх того, что достигается с помощью блока QMF, и посредством этого лучшего согласования с частотной избирательностью слуховой системы человека, например, представленной частотной шкалой барков.
Выходной сигнал 304 с блоков 314 QMF включает в себя первый сигнал 304а, который является комбинацией суммарного сигнала 308, прошедшего кодирование формы сигналов и содержащего спектральные данные, соответствующие частотам до первой частоты разделения kγ, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам между первой частотой разделения kγ и второй частотой разделения kχ. Выходной сигнал 304 дополнительно включает в себя второй сигнал 304b, который содержит разностный сигнал 310, прошедший кодирование формы сигналов и содержащий спектральные данные, соответствующие частотам до первой частоты разделения kγ. Сигнал 304b не имеет контента выше первой частоты разделения kγ.
Как будет описываться ниже, каскад 416 восстановления высоких частот (изображенный на фиг.4) использует нижние частоты, т.е., первый сигнал 308, прошедший кодирование формы сигналов, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов, из выходного сигнала 304 для восстановления частот выше второй частоты разделения kχ. Целесообразно, чтобы сигнал, на котором работает каскад 416 восстановления высоких частот, являлся сигналом аналогичного типа на всех нижних частотах. С этой точки зрения целесообразно, чтобы каскад 302 микширования всегда выдавал суммарно-разностное представление первого и второго сигналов 208, 210, прошедших кодирование формы сигналов, поскольку это означает, что первый сигнал 308, прошедший кодирование формы сигналов, и сигнал 306 понижающего микширования, прошедший кодирование формы сигналов, из выдаваемого первого сигнала 304а - одинакового характера.
Фиг.4 иллюстрирует третью концептуальную часть 400 системы 100 декодирования, изображенной на фиг.1. Каскад 416 восстановления высоких частот (HFR) расширяет сигнал 306 понижающего микширования входного сигнала 304а первого сигнала до диапазона частот выше второй частоты разделения kχ путем выполнения восстановления высоких частот. В зависимости от конфигурации каскада 416 HFR, входным сигналом для каскада 416 HFR является весь сигнал 304а или только сигнал 306 понижающего микширования. Восстановление высоких частот осуществляется путем использования параметров восстановления высоких частот, которые могут приниматься каскадом 416 восстановления высоких частот любым применимым способом. В соответствии с одним из вариантов осуществления, выполняемое восстановление высоких частот содержит выполнение репликации полосы спектра, SBR.
Выходным сигналом каскада 314 восстановления высоких частот является сигнал 404, содержащий сигнал 406 понижающего микширования с примененным расширением SBR. Восстановленный по высоким частотам сигнал 404 и сигнал 304b после этого подаются на каскад 420 повышающего микширования для генерирования левого L и правого R стерео сигналов 412a-b. Для спектральных коэффициентов, соответствующих частотам ниже первой частоты разделения kγ, повышающее микширование содержит выполнение обратного суммарно-разностного преобразования первого и второго сигналов 408, 310. Это попросту означает переход от средне-бокового представления к лево-правому представлению, как указано выше. Для спектральных коэффициентов, соответствующих частотам выше первой частоты разделения kγ, сигнал 406 понижающего микширования и расширение 412 SBR подаются через декоррелятор 418. Сигнал 406 понижающего микширования и расширение 412 SBR, а также декоррелированная версия сигнала 406 понижающего микширования и расширения 412 SBR после этого подвергаются повышающему микшированию с использованием параметров параметрического микширования для восстановления левого и правого каналов 416, 414 для частот выше первой частоты разделения kγ. Может применяться любая известная процедура параметрического повышающего микширования.
Необходимо отметить, что в вышеописанном примере 100 осуществления кодера, изображенном на фиг.1-4, необходимо восстановление высоких частот, поскольку первый принимаемый сигнал 204а содержит лишь спектральные данные, соответствующие частотам до второй частоты разделения kχ. В других вариантах осуществления первый принимаемый сигнал содержит спектральные данные, соответствующие всем частотам кодированного сигнала. В соответствии с этим вариантом осуществления, восстановление высоких частот не требуется. Специалисту понятно, как адаптировать пример 100 кодера в этом случае.
На фиг.5 в качестве примера изображена обобщенная блок-схема системы 500 декодирования в соответствии с одним из вариантов осуществления.
В этой системе кодирования первый и второй сигналы 540, 542, подлежащие кодированию, принимаются каскадом приема (не показан). Эти сигналы 540, 542 соответствуют временному интервалу левого 540 и правого 542 стереофонических звуковых каналов. Сигналы 540, 542 представлены во временной области. Система кодирования содержит каскад 510 преобразования. Сигналы 540, 542 преобразуются в суммарно-разностный формат 544, 546 в каскаде 510 преобразования.
Система кодирования дополнительно содержит каскад 514 кодирования формы сигналов, выполненный с возможностью приема первого и второго преобразованных сигналов 544, 546 с каскада 510 преобразования. Каскад кодирования формы сигналов, как правило, работает в области MDCT. В связи с этим, преобразованные сигналы 544, 546 подвергаются преобразованию 512 MDCT перед каскадом 514 кодирования формы сигналов. В каскаде кодирования формы сигналов первый и второй преобразованные сигналы 544, 546 кодируются по форме с получением первого и второго сигналов 518, 520, прошедших кодирование формы сигналов, соответственно.
Для частот выше первой частоты разделения kγ каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 с получением сигнала 552 с кодированием формы сигналов первого сигнала 518, прошедшего кодирование формы сигналов. Каскад 514 кодирования формы сигналов может быть выполнен с возможностью установки второго сигнала 520, прошедшего кодирование формы сигналов, в нуль выше первой частоты разделения kγ, либо не кодирования этих частот вообще. Для частот выше первой частоты разделения kγ каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 с получением сигнала 552 с кодированием формы сигналов первого сигнала 518, прошедшего кодирование формы сигналов.
Для частот ниже первой частоты разделения kγ в каскаде 514 кодирования формы сигналов принимается решение о том, какого рода стереокодирование использовать для двух сигналов 548, 550. В зависимости от характеристик преобразованных сигналов 544, 546 ниже первой частоты разделения kγ могут приниматься различные решения для различных поднаборов сигналов 548, 550, прошедших кодирование формы сигналов. Кодирование может представлять собой либо левое/правое кодирование, среднее/боковое кодирование, т.е., кодирование суммы и разности, либо dmx/comp/a кодирование. В случае если сигналы 548, 550 подвергались кодированию формы сигналов в каскаде 514 кодирования формы сигналов, сигналы 518, 520, прошедшие кодирование формы сигналов, могут кодироваться с использованием перекрывающихся оконных преобразований с независимой организацией окон для сигналов 518, 520 соответственно.
Одним из примеров первой частоты разделения kγ является 1,1 кГц, но эта частота может изменяться в зависимости от скорости передачи данных стереофонической звуковой системы или в зависимости от характеристик кодируемого аудиосигнала.
По меньшей мере, два сигнала 518, 520 при этом выдаются с каскада 514 кодирования формы сигналов. В случае, если один или несколько поднаборов, либо весь диапазон частот сигналов ниже первой частоты разделения kγ кодируется в понижающе-дополняющей форме путем выполнения матричной операции в зависимости от весового параметра а, этот коэффициент также выдается в качестве сигнала 522. В случае нескольких поднаборов, кодируемых в понижающей/дополняющей форме, каждый поднабор не обязательно должен кодироваться с использованием одного и того же значения весового параметра а. В этом случае в качестве сигнала 522 выдаются несколько весовых параметров.
Указанные два или три сигнала 518, 520, 522 кодируются и квантуются 524 с получением единого составного сигнала 558.
Для того чтобы иметь возможность восстанавливать спектральные данные первого и второго сигналов 540, 542 для частот выше первой частоты разделения на стороне декодера, из сигналов 540, 542 должны извлекаться параметрические стереопараметры 536. С этой целью кодер 500 содержит каскад 530 параметрического стерео (PS) кодирования. Каскад 530 PS кодирования, как правило, работает в области QMF. Следовательно, перед вводом в каскад 530 PS кодирования первый и второй сигналы 540, 542 преобразуются в область QMF с помощью каскада 526 анализа QMF. Каскад 530 PS кодирования предназначен лишь для извлечения параметрических стереопараметров 536 для частот выше первой частоты разделения kγ.
Можно отметить, что параметрические стереопараметры 536 отражают характеристики сигнала, прошедшего параметрическое стереокодирование. При этом они являются частотно избирательными, т.е., каждый параметр из параметров 536 может соответствовать поднабору частот левого или правого входных сигналов 540, 542. Каскад 530 PS кодирования вычисляет параметрические стереопараметры 536 и квантует их либо с равномерным шагом, либо с неравномерным шагом. Эти параметры, как упоминалось выше, являются частотно избирательными, причем весь диапазон частот входных сигналов 540, 542 делится, например, на 15 диапазонов параметров. Они могут быть разнесены в соответствии с моделью частотного разрешения слуховой системы человека, например, шкалой барков.
В примере осуществления кодера 500, изображенном на фиг.5, каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 для частот между первой частотой разделения kγ и второй частотой разделения kχ и установки первого сигнала 518, прошедшего кодирование формы сигналов, на ноль выше второй частоты разделения kχ. Это может осуществляться для дополнительного снижения требуемой скорости передачи данных звуковой системы, в состав которой входит кодер 500. Для того, чтобы иметь возможность восстанавливать сигнал выше второй частоты разделения kχ, должны генерироваться параметры 538 восстановления высоких частот. В соответствии с этим примером осуществления, это выполняется путем понижающего микширования двух сигналов 540, 542, представленных в области QMF, в каскаде 534 понижающего микширования. Результирующий сигнал понижающего микширования, который, например, равен сумме двух сигналов 540, 542, подвергается после этого кодированию с восстановлением высоких частот в каскаде 532 кодирования с восстановлением высоких частот - HFR - с целью генерирования параметров 538 восстановления высоких частот. Параметры 538 могут, например, включать в себя огибающую спектра частот выше второй частоты разделения kχ, информацию о накоплении помех и т.д., также известные специалистам.
Одним из примеров второй частоты разделения kχ является 5,6-8 кГц, но эта частота может изменяться в зависимости от скорости передачи данных стереофонической звуковой системы или в зависимости от характеристик кодируемого аудиосигнала.
Кодер 500 дополнительно содержит каскад генерирования битовых потоков, т.е., мультиплексор 524 битовых потоков. В соответствии с примером осуществления кодера 500, каскад генерирования битовых потоков выполнен с возможностью приема кодированного и квантованного сигнала 544 и двух сигналов 536, 538 параметров. Они преобразуются в битовый поток 560 каскадом 562 генерирования битовых потоков для последующего распределения в стереофонической звуковой системе.
В соответствии с еще одним вариантом осуществления, каскад 514 кодирования формы сигналов выполнен с возможностью кодирования по форме первого преобразованного сигнала 544 для всех частот выше первой частоты разделения kγ. В этом случае каскад 532 кодирования с HFR не требуется, и, следовательно, параметры 538 восстановления высоких частот не включаются в битовый поток.
На фиг.6 в качестве примера изображена обобщенная блок-схема системы 600 кодирования в соответствии с еще одним вариантом осуществления. Данный вариант осуществления отличается от варианта осуществления, изображенного на фиг.5, тем, что сигналы 544, 546, которые преобразуются каскадом 526 анализа QMF, находятся в суммарно-разностном формате. Следовательно, отдельный каскад 534 понижающего микширования не требуется, поскольку суммарный сигнал 544 уже находится в форме сигнала понижающего микширования. При этом для работы по суммарному сигналу 544 для извлечения параметров 538 восстановления высоких частот требуется лишь каскад 532 SBR кодирования. Каскад 530 PS кодирования предназначен для работы как по суммарному сигналу 544, так и по разностному сигналу 546 для извлечения параметрических стереопараметров 536.
Эквиваленты, расширения, альтернативы и прочее
После изучения приведенного выше описания специалисту станут очевидными другие варианты осуществления настоящего изобретения. Несмотря на то, что настоящее описание и чертежи раскрывают варианты осуществления и примеры, изобретение не ограничивается этими конкретными примерами. Возможно различные другие варианты в пределах объема настоящего изобретения, который определяется в прилагаемой формуле изобретения. Любые ссылочные позиции в формуле изобретения не должны трактоваться как ограничивающие ее объем.
Кроме того, по результатам изучения чертежей, описания и прилагаемой формулы изобретения специалистом могут быть поняты и реализованы изменения в описываемых вариантах осуществления. В формуле изобретения слово «содержащий» не исключает другие элементы или этапы. Сам по себе тот факт, что некоторые критерии излагаются в различных зависимых пунктах формулы изобретения, не означает, что совокупность этих критериев не может использоваться с пользой.
Описанные выше системы и способы могут быть реализованы в виде программных средств, микропрограммных средств, аппаратных средств или их комбинации. При аппаратной реализации разделение задач между функциональными блоками, упоминаемыми в приведенном выше описании, не обязательно должно соответствовать разделению на физические блоки; напротив, один физический компонент может иметь множество функциональных назначений, при этом одна задача может выполняться несколькими физическими компонентами совместно. Некоторые компоненты или все компоненты могут быть реализованы в виде программных средств, исполняемых цифровым сигнальным процессором или микропроцессором, либо реализованы в виде аппаратных средств, либо в виде специализированной интегральной схемы. Такие программные средства могут быть распределены по считываемым компьютером носителям, которые могут включать в себя запоминающие среды компьютеров (или энергонезависимые среды) и среды передачи данных (или энергозависимые среды). Как известно специалистам, термин «запоминающие среды компьютеров» включает в себя и энергозависимые, и энергонезависимые, и съемные, и несъемные среды, реализуемые с помощью любого способа или технологии для хранения информации, такие как считываемые компьютером инструкции, структуры данных, программные модули и прочие данные. Запоминающие среды компьютеров включают в себя, помимо прочего, оперативное запоминающее устройство (ОЗУ), постоянное запоминающее устройство (ПЗУ), электрически стираемое программируемое постоянное запоминающее устройство (ЭСППЗУ), флэш-память или иную технологию памяти, постоянное запоминающее устройство на компакт-дисках (CD-ROM), универсальный цифровой диск (DVD) или иной накопитель на оптических дисках, магнитные кассеты, накопитель на магнитных дисках или иные магнитные запоминающие устройства, либо иную среду, которая может использоваться для хранения необходимой информации и доступ к которой может осуществляться компьютером. Кроме того, специалистам известно, что среды передачи данных, как правило, включают в себя считываемые компьютером инструкции, структуры данных, программные модули или иные данные в модулированном информационном сигнале, таком как несущая волна или иной механизм переноса, и включают в себя любые среды доставки информации.

Claims (26)

1. Способ декодирования кодированного битового аудиопотока в системе аудиообработки, содержащий этапы, на которых:
извлекают из кодированного битового аудиопотока первый кодируемый по форме сигнал, содержащий спектральные коэффициенты, соответствующие частотам вплоть до первой частоты разделения, для первого периода времени;
извлекают из кодированного битового аудиопотока второй кодируемый по форме сигнал, содержащий спектральные коэффициенты, соответствующие подмножеству частот выше упомянутой первой частоты разделения, для первого периода времени;
выполняют восстановление высоких частот на второй частоте разделения для упомянутого первого периода времени, чтобы генерировать восстановленный сигнал, при этом вторая частота разделения выше первой частоты разделения и восстановление высоких частот использует параметры восстановления, полученные из кодированного битового аудиопотока, чтобы генерировать восстановленный сигнал;
осуществляют перемежение второго кодируемого по форме сигнала с восстановленным сигналом, чтобы сформировать перемеженный сигнал для первого периода времени, и
объединяют перемеженный сигнал с первым кодируемым по форме сигналом.
2. Способ по п. 1, в котором первая частота разделения зависит от скорости передачи битов системы аудиообработки.
3. Способ по п. 1, в котором упомянутое перемежение содержит (i) сложение второго кодируемого по форме сигнала с восстановленным сигналом, (ii) объединение второго кодируемого по форме сигнала с восстановленным сигналом или (iii) замену восстановленного сигнала вторым кодируемым по форме сигналом.
4. Способ по п. 1, в котором либо (i) объединение перемеженного сигнала с первым кодируемым по форме сигналом осуществляют в частотной области, либо (ii) выполнение восстановления высоких частот на второй частоте разделения, чтобы генерировать восстановленный сигнал, осуществляют в частотной области.
5. Способ по п. 1, в котором параметры восстановления включают в себя представление огибающей спектра или информацию о накоплении помех для частотного диапазона восстановленного сигнала.
6. Способ по п. 1, в котором выполнение восстановления высоких частот содержит выполнение репликации полосы спектра SBR.
7. Способ по п. 1, дополнительно содержащий прием управляющего сигнала, используемого во время перемежения, чтобы сформировать перемеженный сигнал.
8. Способ по п. 7, в котором управляющий сигнал указывает, как следует перемежать второй кодируемый по форме сигнал с восстановленным сигналом, посредством задания либо частотного диапазона, либо временного диапазона для этого перемежения.
9. Способ по п. 7, в котором первое значение управляющего сигнала указывает, что перемежение выполняют для соответствующей области частот.
10. Способ по п. 1, в котором перемежение выполняют до упомянутого объединения.
11. Способ по п. 1, в котором система аудиообработки представляет собой гибридный декодер, который выполняет декодирование по форме волны и параметрическое декодирование.
12. Способ по п. 1, в котором первый кодируемый по форме сигнал и второй кодируемый по форме сигнал разделяют общий резервуар битов, используя психоакустическую модель.
13. Способ по п. 1, в котором перемежение и объединение объединяют в единую стадию или операцию.
14. Способ по п. 1, в котором первый кодируемый по форме сигнал и второй кодируемый по форме сигнал представляют форму волны аудиосигнала в частотной области.
15. Аудиодекодер для декодирования кодированного битового аудиопотока, причем аудиодекодер содержит:
демультиплексор для извлечения из кодированного битового аудиопотока первого кодируемого по форме сигнала, содержащего спектральные коэффициенты, соответствующие частотам вплоть до первой частоты разделения, для первого периода времени;
восстановитель высоких частот, работающий на второй частоте разделения, чтобы генерировать восстановленный сигнал для первого периода времени, при этом вторая частота разделения выше первой частоты разделения и восстановитель высоких частот использует параметры восстановления, полученные из кодированного битового аудиопотока, чтобы генерировать восстановленный сигнал;
демультиплексор для извлечения из кодированного битового аудиопотока второго кодируемого по форме сигнала, содержащего спектральные коэффициенты, соответствующие подмножеству частот выше упомянутой первой частоты разделения, для первого периода времени;
средство перемежения для перемежения второго кодируемого по форме сигнала с восстановленным сигналом, чтобы сформировать перемеженный сигнал для первого периода времени, и
средство синтеза для объединения перемеженного сигнала с первым кодируемым по форме сигналом.
16. Долговременный считываемый компьютером носитель с инструкциями, которые при исполнении процессором выполняют способ по п. 1.
RU2017145579A 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов RU2665214C1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361808684P 2013-04-05 2013-04-05
US61/808,684 2013-04-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2015147181A Division RU2645271C2 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2018127639A Division RU2690885C1 (ru) 2013-04-05 2018-07-27 Стереофонический кодер и декодер аудиосигналов

Publications (1)

Publication Number Publication Date
RU2665214C1 true RU2665214C1 (ru) 2018-08-28

Family

ID=50473291

Family Applications (3)

Application Number Title Priority Date Filing Date
RU2017145579A RU2665214C1 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2015147181A RU2645271C2 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2018127639A RU2690885C1 (ru) 2013-04-05 2018-07-27 Стереофонический кодер и декодер аудиосигналов

Family Applications After (2)

Application Number Title Priority Date Filing Date
RU2015147181A RU2645271C2 (ru) 2013-04-05 2014-04-04 Стереофонический кодер и декодер аудиосигналов
RU2018127639A RU2690885C1 (ru) 2013-04-05 2018-07-27 Стереофонический кодер и декодер аудиосигналов

Country Status (9)

Country Link
US (5) US9570083B2 (ru)
EP (3) EP4300488A3 (ru)
JP (1) JP6019266B2 (ru)
KR (4) KR20150126651A (ru)
CN (6) CN110010140B (ru)
BR (4) BR122021009022B1 (ru)
HK (1) HK1214882A1 (ru)
RU (3) RU2665214C1 (ru)
WO (1) WO2014161993A1 (ru)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
BR112015029129B1 (pt) 2013-05-24 2022-05-31 Dolby International Ab Método para codificar objetos de áudio em um fluxo de dados, meio legível por computador, método em um decodificador para decodificar um fluxo de dados e decodificador para decodificar um fluxo de dados incluindo objetos de áudio codificados
CN117059107A (zh) 2013-05-24 2023-11-14 杜比国际公司 对音频场景进行解码的方法、装置及计算机可读介质
WO2014187989A2 (en) 2013-05-24 2014-11-27 Dolby International Ab Reconstruction of audio scenes from a downmix
WO2014187991A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Efficient coding of audio scenes comprising audio objects
RU2639952C2 (ru) 2013-08-28 2017-12-25 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
US10170125B2 (en) * 2013-09-12 2019-01-01 Dolby International Ab Audio decoding system and audio encoding system
ES2641538T3 (es) 2013-09-12 2017-11-10 Dolby International Ab Codificación de contenido de audio multicanal
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
WO2016066743A1 (en) * 2014-10-31 2016-05-06 Dolby International Ab Parametric encoding and decoding of multichannel audio signals
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN112951252B (zh) * 2021-05-13 2021-08-03 北京百瑞互联技术有限公司 一种lc3音频码流的混音方法、装置、介质及设备
WO2024147370A1 (ko) * 2023-01-02 2024-07-11 엘지전자 주식회사 디스플레이 장치 및 그의 오디오 신호 처리 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009115211A2 (en) * 2008-03-20 2009-09-24 Fraunhofer-Gesellchaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
US20100094631A1 (en) * 2007-04-26 2010-04-15 Jonas Engdegard Apparatus and method for synthesizing an output signal
WO2011039195A1 (en) * 2009-09-29 2011-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
WO2011124621A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding
US20120002818A1 (en) * 2009-03-17 2012-01-05 Dolby International Ab Advanced Stereo Coding Based on a Combination of Adaptively Selectable Left/Right or Mid/Side Stereo Coding and of Parametric Stereo Coding
US8255231B2 (en) * 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
RU2011108927A (ru) * 2006-01-20 2012-09-20 Майкрософт Корпорейшн (Us) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
BR0304541A (pt) 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Método e arranjo para sintetizar um primeiro e um segundo sinal de saìda a partir de um sinal de entrada, aparelho para prover um sinal de áudio decodificado, sinal de multicanal decodificado, e, meio de armazenamento
DE60318835T2 (de) 2002-04-22 2009-01-22 Koninklijke Philips Electronics N.V. Parametrische darstellung von raumklang
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
JP3579047B2 (ja) * 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
BRPI0415951B1 (pt) * 2003-10-30 2018-08-28 Coding Tech Ab método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado
CA2992125C (en) 2004-03-01 2018-09-25 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
DE602005024548D1 (de) 2004-05-19 2010-12-16 Panasonic Corp Audiosignalcodierer und audiosignaldecodierer
DE602004028171D1 (de) 2004-05-28 2010-08-26 Nokia Corp Mehrkanalige audio-erweiterung
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
JP2008519306A (ja) 2004-11-04 2008-06-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号の組のエンコード及びデコード
US7649135B2 (en) 2005-02-10 2010-01-19 Koninklijke Philips Electronics N.V. Sound synthesis
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
ES2376889T3 (es) * 2006-03-24 2012-03-20 Dolby International Ab Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20100121632A1 (en) 2007-04-25 2010-05-13 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and their method
JP5183741B2 (ja) * 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
BRPI0910792B1 (pt) * 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
EP2513899B1 (en) 2009-12-16 2018-02-14 Dolby International AB Sbr bitstream parameter downmix

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8255231B2 (en) * 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
RU2011108927A (ru) * 2006-01-20 2012-09-20 Майкрософт Корпорейшн (Us) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
US20100094631A1 (en) * 2007-04-26 2010-04-15 Jonas Engdegard Apparatus and method for synthesizing an output signal
WO2009115211A2 (en) * 2008-03-20 2009-09-24 Fraunhofer-Gesellchaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
US20120002818A1 (en) * 2009-03-17 2012-01-05 Dolby International Ab Advanced Stereo Coding Based on a Combination of Adaptively Selectable Left/Right or Mid/Side Stereo Coding and of Parametric Stereo Coding
WO2011039195A1 (en) * 2009-09-29 2011-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
WO2011124621A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding

Also Published As

Publication number Publication date
US9570083B2 (en) 2017-02-14
US20170133025A1 (en) 2017-05-11
CN110010140B (zh) 2023-04-18
EP4300488A2 (en) 2024-01-03
WO2014161993A1 (en) 2014-10-09
US20190088266A1 (en) 2019-03-21
US20160027446A1 (en) 2016-01-28
BR122017006701B1 (pt) 2022-03-03
KR20190134821A (ko) 2019-12-04
US20200286497A1 (en) 2020-09-10
US12080307B2 (en) 2024-09-03
KR20150126651A (ko) 2015-11-12
HK1214882A1 (zh) 2016-08-05
CN116741186A (zh) 2023-09-12
CN110047496A (zh) 2019-07-23
US10600429B2 (en) 2020-03-24
BR122021009022B1 (pt) 2022-08-16
RU2645271C2 (ru) 2018-02-19
CN116741188A (zh) 2023-09-12
US11631417B2 (en) 2023-04-18
RU2019116192A (ru) 2020-11-27
CN110047496B (zh) 2023-08-04
EP3528249A1 (en) 2019-08-21
CN105103225B (zh) 2019-06-21
BR112015025080A2 (pt) 2017-07-18
BR122021009025B1 (pt) 2022-08-30
CN105103225A (zh) 2015-11-25
KR20160111042A (ko) 2016-09-23
EP2981960A1 (en) 2016-02-10
EP2981960B1 (en) 2019-03-13
JP2016519786A (ja) 2016-07-07
KR20230020553A (ko) 2023-02-10
BR112015025080B1 (pt) 2021-12-21
CN110010140A (zh) 2019-07-12
CN116741187A (zh) 2023-09-12
RU2015147181A (ru) 2017-05-16
EP4300488A3 (en) 2024-02-28
JP6019266B2 (ja) 2016-11-02
BR122017006701A2 (pt) 2019-09-03
RU2690885C1 (ru) 2019-06-06
US10163449B2 (en) 2018-12-25
US20230245667A1 (en) 2023-08-03

Similar Documents

Publication Publication Date Title
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
US7974713B2 (en) Temporal and spatial shaping of multi-channel audio signals
JP5193070B2 (ja) 主成分分析に基づくマルチチャネルオーディオ信号の段階的な符号化のための装置および方法
KR20170021821A (ko) 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
NO342863B1 (no) Konsept for kopling av gapet mellom parametrisk flerkanals audiokoding og matrise-surround flerkanalkoding
CN109410966B (zh) 音频编码器和解码器
TW201316327A (zh) 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
CN110648674B (zh) 多声道音频内容的编码
JP2021507316A (ja) オーディオ信号の高周波再構成技術の後方互換性のある統合
KR20240050483A (ko) 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов