ES2261974T3 - Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. - Google Patents
Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.Info
- Publication number
- ES2261974T3 ES2261974T3 ES03766661T ES03766661T ES2261974T3 ES 2261974 T3 ES2261974 T3 ES 2261974T3 ES 03766661 T ES03766661 T ES 03766661T ES 03766661 T ES03766661 T ES 03766661T ES 2261974 T3 ES2261974 T3 ES 2261974T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- band
- sub
- amplitude
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 32
- 230000003595 spectral effect Effects 0.000 title description 6
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 43
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims description 12
- 239000002131 composite material Substances 0.000 claims 1
- 238000002347 injection Methods 0.000 abstract description 21
- 239000007924 injection Substances 0.000 abstract description 21
- 238000001228 spectrum Methods 0.000 abstract description 20
- 230000001629 suppression Effects 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereo-Broadcasting Methods (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Un aparato decodificador audio para decodificar una señal audio de un tren de bits (106) conteniendo información codificada acerca de una señal audio de banda estrecha (107) e información adicional (108, 109) para expandir la señal audio de banda estrecha a una señal audio de banda ancha, conteniendo la información adicional información de componente de alta frecuencia (108) que denota una característica de una banda de frecuencia más alta que una banda de la información codificada, e información de adición de sinusoide (109) que denota una señal sinusoidal añadida a una banda de frecuencia específica, incluyendo dicho aparato decodificador audio: un demultiplexor de tren de bits (101) operable para demultiplexar la información codificada y la información adicional del tren de bits; un decodificador (102) operable para decodificar la señal audio de banda estrecha de la información codificada demultiplexada; un filtro de sub-banda de análisis (103) operable para separar la señal audio de banda estrecha en una primera señal de sub-banda compuesta de una pluralidad de señales de sub-banda; un generador de señal sinusoidal (111) operable para generar una señal sinusoidal añadida a una sub-banda específica en una banda de frecuencia más alta que una banda de frecuencia de la información codificada en base a la información de adición de sinusoide en la información adicional demultiplexada; un generador de señal de corrección (114) operable para generar, en base a una característica de fase y una característica de amplitud de la señal sinusoidal, una señal de corrección añadida a sub-bandas cerca de una sub- banda específica para suprimir las señales de componente de solapamiento que se producen en las sub-bandas cerca de la sub-banda específica; un generador de señal de frecuencia alta (104) operable para generar una segunda señal de sub-banda compuesta de una pluralidad de señales de sub-banda en una banda de frecuencia más alta que la banda de frecuencia de la información codificada de la primera señal de sub-banda e información de componente de alta frecuencia en la información adicional demultiplexada, y añadir la señal sinusoidal y la señal de corrección a la segunda señal de sub-banda; y un filtro de síntesis de sub-banda de cálculo de valor real (105) operable para combinar la primera señal de sub-banda y la segunda señal de sub-banda para obtener la señal audio de banda ancha.
Description
Aparato decodificador y método de decodificación
audio basado en una duplicación de banda espectral.
La presente invención se refiere a un aparato
decodificador y método de decodificación para un sistema de
expansión de anchura de banda audio para generar una señal audio de
banda ancha a partir de una señal audio de banda estrecha añadiendo
información adicional conteniendo poca información, y se refiere a
tecnología que permite que este sistema proporcione reproducción de
alta calidad audio con pocos cálculos.
Se conocen muchas tecnologías de codificación
audio para codificar una señal audio a un tamaño de datos pequeño y
después reproducir la señal audio del tren de bits codificado. La
norma internacional ISO/IEC 13818-7
(MPEG-2 AAC) en particular se considera un método
superior que permite la reproducción de alta calidad audio con un
tamaño de código pequeño. Este método de codificación AAC se utiliza
también en el sistema ISO/IEC 14496-3
(MPEG-4 Audio) más reciente.
Los métodos de codificación audio, tales como
AAC, convierten una señal audio discreta del dominio de tiempo a una
señal en el dominio de frecuencia muestreando la señal de dominio de
tiempo a intervalos de tiempo específicos, dividiendo la información
de frecuencia convertida en múltiples bandas de frecuencia, y
codificando posteriormente la señal cuantificando cada una de las
bandas de frecuencia en base a una distribución de datos apropiada.
Para decodificación, la información de frecuencia es recreada a
partir del flujo de códigos, y el sonido reproducido se obtiene
convirtiendo la información de frecuencia a una señal de dominio de
tiempo. Si la cantidad de información suministrada para codificación
es pequeña (tal como en codificación a baja tasa de bits), el tamaño
de datos asignado a cada una de las bandas de frecuencia segmentadas
en el proceso de codificación disminuye, y, como resultado, algunas
bandas de frecuencia pueden no contener información. En este caso,
el proceso de decodificación produce reproducción audio sin sonido
en el componente de frecuencia de la banda de frecuencia que no
contiene información.
En general, dado que la sensibilidad al sonido
con una frecuencia superior a aproximadamente 10 kHz es menor que a
sonido a frecuencias más bajas, los datos de componente de alta
frecuencia se eliminan generalmente para proporcionar reproducción
audio de banda estrecha si el esquema de codificación audio
distribuye información mediante un proceso basado en percepción
auditiva humana.
Si se suministra datos a una tasa de bits de
aproximadamente 96 kbps, incluso el método AAC puede codificar una
señal estéreo de 44,1 kHz a una banda de aproximadamente 16 kHz,
pero si los datos se codifican con datos suministrados a la mitad de
esta tasa, es decir, 48 kbps, la anchura de banda que se puede
cuantificar y codificar a la vez que se mantiene la calidad de
sonido se reduce a lo sumo a aproximadamente 10 kHz. Además de ser
de banda estrecha, el sonido reproducido codificado con una baja
tasa de bits de 48 Kbps también suena poco nítido.
Un método que permite reproducción de banda
ancha añadiendo una cantidad pequeña de información adicional a un
flujo de códigos para reproducción audio de banda estrecha se
describe, por ejemplo, en la Especificación del Sistema de Radio
Digital Mundial (DRM) (ETSI TS 101 980) publicada por el Instituto
Europeo de Normas de Telecomunicaciones (ETSI). Se describe
tecnología similar denominada SBR (replicación de banda espectral),
por ejemplo, en los documentos de convención de AES (Audio
Engineering Society) 5553, 5559, 5560 (112ª Convención, 2002 mayo
1013, Munich, Alemania), especialmente el documento 5553 "Spectral
Band Replication, a new approach in audio coding" de M. Dietz y
otros.
La figura 2 es un diagrama esquemático de
bloques de un ejemplo de un decodificador para expansión de banda
usando SBR. El tren de bits de entrada 206 es separado por el
demultiplexor de tren de bits 201 en información de componente de
baja frecuencia 207, información de componente de alta frecuencia
208, e información de adición de onda sinusoidal 209. La información
de componente de baja frecuencia 207 es, por ejemplo, información
codificada usando el método de codificación MPEG-4
AAC u otro, y es decodificada por el decodificador de banda baja
202, por lo que se genera una señal de tiempo que representa el
componente de baja frecuencia. Esta señal de tiempo que representa
el componente de baja frecuencia es separada en múltiples (M)
sub-bandas por el banco de filtros de análisis 203 e
introducida en el generador de señal de frecuencia alta 204.
El generador de señal de frecuencia alta 204
compensa el componente de alta frecuencia perdido debido a
limitación de anchura de banda copiando la señal de
sub-banda de baja frecuencia que representa el
componente de baja frecuencia a una sub-banda de
alta frecuencia. La información de componente de alta frecuencia 208
introducida en el generador de señal de frecuencia alta 204 contiene
información de ganancia para la sub-banda de alta
frecuencia compensada de manera que la ganancia se regule para cada
sub-banda de alta frecuencia generada.
Un generador de señal adicional 211 genera señal
de inyección 212 por lo que se añade una onda sinusoidal de ganancia
controlada a cada sub-banda de alta frecuencia. La
señal de sub-banda de alta frecuencia generada por
el generador de señal de frecuencia alta 204 es introducida después
con la señal de sub-banda de baja frecuencia en el
banco de filtros de síntesis 205 para síntesis de banda, y se genera
la señal de salida 210. El recuento de sub-banda en
el lado del banco de filtros de síntesis no tiene que ser el mismo
que el número de sub-bandas en el lado del banco de
filtros de análisis. Por ejemplo, si en la figura 2 N = 2M, la
frecuencia de muestreo de la señal de salida será dos veces la
frecuencia de muestreo de la señal de tiempo introducida en el banco
de filtros de análi-
sis.
sis.
En esta configuración la información contenida
en la información de componente de alta frecuencia 208 o información
de adición de onda sinusoidal 209 se refiere solamente a control de
ganancia, y, por lo tanto, la cantidad de información requerida es
muy pequeña en comparación con la información de componente de baja
frecuencia 207, que también contiene información espectral. Por lo
tanto, este método es adecuado para codificar una señal de banda
ancha a una tasa de bits baja.
El banco de filtros de síntesis 205 de la figura
2 se compone de filtros que toman tanto entrada de número real como
entrada de número imaginario para cada sub-banda, y
realizan un cálculo de valor complejo.
El decodificador configurado como antes para
expansión de banda tiene dos filtros, el banco de filtros de
análisis y el banco de filtros de síntesis, que realizan cálculos de
valor complejo, y la decodificación requiere muchos cálculos. Un
problema cuando el decodificador se construye para dispositivos LSI,
por ejemplo, es que aumenta el consumo de potencia y disminuye el
tiempo de reproducción que es posible con una capacidad dada de la
fuente de alimentación. Dado que las señales que oímos en la salida
del banco de filtros de síntesis son señales de número real, el
banco de filtros de síntesis se puede configurar con bancos de
filtro de número real para reducir los cálculos. Aunque esto reduce
el número de cálculos, si se añade una onda sinusoidal usando el
mismo método como cuando el banco de filtros de síntesis realiza
cálculos de valor complejo, no se añade realmente una onda
sinusoidal pura y no se logra el resultado previsto en el audio
reproducido.
La presente invención reivindicada se dirige por
lo tanto a resolver estos problemas de la técnica anterior, y
proporciona un aparato y método de decodificación para un sistema de
expansión de banda que opera con pocos cálculos utilizando un banco
de filtros de cálculo de valor real por lo que la reproducción audio
prevista se logra añadiendo un cambio ligero a una señal de
generación de onda sinusoidal añadida tal como se introduciría en un
banco de filtros de cálculo de valor complejo.
Con esta composición, se puede lograr
reproducción audio de alta calidad a una baja tasa de bits usando
pocos cálculos.
La figura 1 es un diagrama esquemático de
bloques que representa un ejemplo de un aparato decodificador audio
según la presente invención.
La figura 2 muestra un ejemplo de la
configuración de un aparato decodificador audio de la técnica
anterior.
La figura 3 muestra un ejemplo de un generador
de señal adicional para describir el principio de la presente
invención.
La figura 4 muestra un ejemplo de un generador
de señal adicional en una primera realización de la presente
invención.
Las figuras 5A y 5B muestran un ejemplo de una
señal de valor complejo inyectada.
La figura 6 muestra ejemplos de las señales de
inyección generadas por el generador de señal adicional representado
en la figura 3.
La figura 7 muestra solamente la parte de número
real de las señales de inyección generadas por el generador de señal
adicional representado en la figura 3.
La figura 8 muestra ejemplos de señales de
inyección y señales de compensación generadas por el generador de
señal adicional y el generador de señal de compensación
representados en la figura 4.
La figura 9 es un diagrama de espectro para
cuando se inyecta una onda sinusoidal solamente para la parte de
valor real al filtro de síntesis de valor real.
La figura 10 es un diagrama de espectro para
cuando se inyectan una onda sinusoidal solamente para la parte de
valor real y una señal de compensación al filtro de síntesis de
valor real.
La figura 11 muestra otro ejemplo de la señal de
inyección y señal de compensación mostradas a modo de ejemplo en la
figura 8.
La figura 12 muestra un ejemplo del generador de
señal adicional en una segunda realización de la presente
invención.
Y la figura 13 es un diagrama de bloques que
representa el principio de la presente invención.
La figura 13 es un diagrama de bloques que
representa el principio de la presente invención. Las señales audio
de música y otras contienen un componente de banda de frecuencia
baja y un componente de banda de frecuencia alta. La información de
señal audio codificada es transportada por el componente de banda de
frecuencia baja, y la información de tono (información sinusoidal) y
la información de ganancia son transportadas por el componente de
banda de frecuencia alta. El receptor decodifica la señal audio del
componente de banda de frecuencia baja, pero para el componente de
banda de frecuencia alta, copia y procesa el componente de banda de
frecuencia baja usando la información de tono e información de
ganancia para sintetizar una señal pseudo-audio. La
información de fase e información de amplitud son necesarias para
sintetizar esta señal pseudo-audio, y la síntesis
requiere así un cálculo de valor complejo. Dado que los cálculos de
valor complejo requieren operaciones en las partes de número real y
número imaginario, el proceso de cálculo es complejo y lento. Para
simplificar este proceso de cálculo la presente invención opera
usando solamente la parte de número real. Sin embargo, si los
cálculos se realizan usando solamente la parte de valor real para
algunas sub-bandas, aparecen señales de ruido en
las sub-bandas más alta y más baja adyacentes. Se
genera una señal de compensación para cancelar estas señales de
ruido usando la información de fase, información de amplitud, e
información de tiempo contenida en la información de tono.
Un aparato y método de decodificación audio
según una realización preferida de la presente invención se
describen a continuación con referencia a las figuras
acompañantes.
Realización
1
La figura 1 es un diagrama esquemático que
representa un aparato decodificador que realiza expansión de anchura
de banda por medio de replicación de banda espectral (SBR) en base a
una primera realización de la presente invención.
El tren de bits de entrada 106 es demultiplexado
por el demultiplexor de tren de bits 101 en información de
componente de baja frecuencia 107, información de componente de alta
frecuencia 108, e información de adición de señal sinusoidal 109. La
información de componente de baja frecuencia 107 es información que
se codifica usando, por ejemplo, el método de codificación
MPEG-4 AAC, es decodificada por el decodificador de
baja frecuencia 102, y se genera una señal de tiempo que representa
el componente de baja frecuencia. La señal de tiempo resultante que
representa el componente de baja frecuencia es dividida después en
múltiples (M) sub-bandas por el banco de filtros de
análisis 103, e introducida en los medios de expansión de anchura de
banda (generador de señal de frecuencia alta) 104. El generador de
señal de frecuencia alta 104 copia la señal de
sub-banda de baja frecuencia que representa el
componente de baja frecuencia a una sub-banda de
alta frecuencia para compensar el componente de alta frecuencia
perdido por el límite de anchura de banda. La información de
componente de alta frecuencia 108 introducida en el generador de
señal de frecuencia alta 104 contiene información de ganancia para
la sub-banda de alta frecuencia a generar, y la
ganancia se regula para cada sub-banda de alta
frecuencia generada.
El generador de señal adicional 111 produce
señal de inyección 112 de manera que se añada una onda sinusoidal de
ganancia controlada a cada sub-banda de alta
frecuencia según la información de adición de señal sinusoidal
(también llamada información de tono) 109. Las señales de
sub-banda de alta frecuencia generadas por el
generador de señal de frecuencia alta 104 se introducen con las
señales de sub-banda de baja frecuencia al banco de
filtros de síntesis 105 para síntesis de banda, dando lugar a la
señal de salida 110. El número de sub-bandas en el
banco de filtros de síntesis no tiene que coincidir con el número de
sub-bandas en el lado del banco de filtros de
análisis. Por ejemplo, si en la figura 1 N = 2M, la frecuencia de
muestreo de la señal de salida será dos veces la frecuencia de
muestreo de la señal de tiempo introducida en el banco de filtros de
análisis.
El tren de bits de entrada 106 contiene
información codificada de banda estrecha para la señal audio (es
decir, información de componente de baja frecuencia 107) e
información adicional para expandir esta señal de banda estrecha a
una señal de banda ancha (es decir, información de componente de
alta frecuencia 108 e información de adición de señal sinusoidal
109).
El banco de filtros de síntesis 105 del aparato
decodificador representado en la figura 1 se compone de filtros de
cálculo de valor real. También será obvio que se podría usar un
filtro de cálculo de valor complejo que pueda llevar a cabo cálculos
de valor real.
El aparato decodificador representado en la
figura 1 también tiene un generador de señal de compensación 114
para generar una señal de compensación 113 para compensar la
diferencia que resulta de la adición de señal sinusoidal.
El tren de bits de entrada 106 es demultiplexado
por el demultiplexor de tren de bits 101 a información de componente
de baja frecuencia 107, información de componente de alta frecuencia
108, e información de adición de señal sinusoidal 109.
La información de componente de baja frecuencia
107 es, por ejemplo, un tren de bits codificado
MPEG-4 AAC, MPEG-1 Audio, o
MPEG-2 Audio que es decodificado por un
decodificador de baja frecuencia 102 que tiene una función de
decodificación compatible, y se genera una señal de tiempo que
representa el componente de baja frecuencia. La señal de tiempo
resultante que representa el componente de baja frecuencia es
dividida después en múltiples (M) primeras
sub-bandas S1 por el banco de filtros de análisis
103, e introducida en el generador de señal de frecuencia alta 104.
El banco de filtros de análisis 103 y el banco de filtros de
síntesis 105 descritos más adelante se construyen a partir de un
banco de filtros polifase o convertidor MDCT. Los bancos de filtros
de división de banda son conocidos por los expertos en la técnica
relacionada.
Las primeras señales de
sub-banda S1 para el componente de señal de
frecuencia baja del banco de filtros de análisis 103 son emitidas
directamente por el generador de señal de frecuencia alta 104 y
también enviadas a la parte de síntesis. La parte de generación de
señal de frecuencia alta del generador de señal de frecuencia alta
104 recibe las primeras señales de sub-banda S1 y
usando información de componente de alta frecuencia 108, la señal de
inyección 112, y la señal de compensación 113 genera múltiples
segundas señales de sub-banda S2. Las segundas
señales de sub-banda S2 están a una banda de
frecuencia más alta que las primeras señales de
sub-banda S1. La información de componente de alta
frecuencia 108 incluye información que indica que una de las
primeras señales de sub-banda S1 va a ser copiada, y
que se va a generar una de las segundas señales de
sub-banda S2, y la información de control de
ganancia que indica cuánto se deberá amplificar la primera señal de
sub-banda S1 copiada.
Si no hay información de adición de señal
sinusoidal 109 o no se genera señal realmente usando la información
de adición de señal sinusoidal 109, el banco de filtros de síntesis
105 con N (donde N es mayor o igual a M) filtros de síntesis de
sub-banda combina las señales de
sub-banda de anchura de banda expandidas emitidas
por el generador de señal de frecuencia alta 104 y el componente de
señal de frecuencia baja del banco de filtros de análisis 103 para
producir una señal de salida de banda ancha 110.
En esta primera realización de la invención el
banco de filtros de síntesis 105 es un banco de filtros de cálculo
de valor real. Es decir, el banco de filtros de síntesis 105 no usa
entrada de número imaginario, solamente tiene una parte de número
real introducida, y usa filtros que realizan cálculos de valor real.
Por lo tanto, este banco de filtros de síntesis 105 es más simple y
opera más rápidamente que un filtro que opera con cálculos de valor
complejo.
Si hay información de adición de señal
sinusoidal 109, la información de adición de señal sinusoidal 109 se
introduce en el generador de señal adicional 111 por lo que se
genera una señal de inyección 112, y añade a la señal de salida de
generador de señal de frecuencia alta 104. La información de adición
de señal sinusoidal 109 también es introducida en el generador de
señal de compensación 114 por lo que se produce una señal de
compensación 113, y se añade igualmente a la señal de salida del
generador de señal de frecuencia alta 104.
La señal de salida de generador de señal de
frecuencia alta 104 se introduce en el banco de filtros de síntesis
105. El banco de filtros de síntesis 105 envía la señal de salida
110 independientemente de si hay una señal añadida en base a
información de adición de señal sinusoidal 109.
La generación de la señal de inyección 112 y la
señal de compensación 113 en base a información de adición de señal
sinusoidal 109 se describe con más detalle a continuación utilizando
las figuras 3 y 4.
La figura 3 muestra el generador de señal
adicional 111 utilizado en el método de decodificación audio que
describe el principio básico de la presente invención, y la figura 4
muestra el generador de señal adicional 111 y el generador de señal
de compensación 114 en una primera realización de la presente
invención.
El generador de señal adicional 111 se describe
en primer lugar con referencia a la figura 3. La información
contenida en la información de adición de señal sinusoidal 109
incluye información de número de sub-banda inyectada
que denota a qué banco de filtros de síntesis se inyecta la onda
sinusoidal, información de fase que denota la fase en la que
comienza la señal sinusoidal inyectada, información de tiempo que
denota el tiempo en el que comienza la señal sinusoidal inyectada, e
información de amplitud que denota la amplitud de la señal
sinusoidal inyectada.
Unos medios de extracción de información de
sub-banda inyectada 406 extraen el número de
sub-banda inyectado. Los medios de extracción de
información de fase 402 determinan, en base a la información de fase
si la información de fase se contiene en la información de adición
de señal sinusoidal 109, la fase en la que comienza la señal
sinusoidal inyectada. Si la información de fase no se contiene en la
información de adición de señal sinusoidal 109, los medios de
extracción de información de fase 402 determinan la fase en la que
comienza la señal sinusoidal inyectada considerando la continuidad
a la fase del período de tiempo anterior.
Unos medios de extracción de amplitud 403
extraen la información de amplitud. Unos medios de extracción de
tiempo 404 ex-traen la información de tiempo que
indica en qué tiempo iniciar la inyección de onda sinusoidal y en
qué tiempo terminar la inyección cuando se inyecta una onda
sinusoidal al banco de filtros de síntesis.
En base a la información de los medios de
extracción de información de fase 402, los medios de extracción de
amplitud 403, y los medios de extracción de tiempo 404, los medios
de generación de sinusoide 405 generan la onda sinusoidal (señal de
tono) a inyectar. Se deberá observar que la frecuencia de la onda
sinusoidal generada se puede establecer deseablemente, por ejemplo,
a la frecuencia central de la sub-banda o una
frecuencia desplazada una desviación predeterminada de la frecuencia
central. Además, la frecuencia podría estar preestablecida según el
número de sub-banda de la sub-banda
inyectada. Por ejemplo, una onda sinusoidal del límite de frecuencia
superior o inferior de la sub-banda se podría
generar según que el número de sub-banda sea impar o
par. Se supone a continuación que se produce una onda sinusoidal con
la frecuencia central de la sub-banda, es decir, se
produce una señal periódica con cuatro períodos de muestreo de señal
de sub-banda.
Los medios de inyección de onda sinusoidal 407
insertan la onda sinusoidal enviada por medios de generación de
sinusoide 405 en la sub-banda de filtro de síntesis
que coincide con el número adquirido por los medios de extracción de
información de sub-banda inyectada 406. La señal de
salida de los medios de inyección de onda sinusoidal 407 es la señal
de inyección 112.
Considérese una señal de valor complejo con
cuatro períodos y amplitud S inyectada a la
sub-banda K como se representa en la tabla en la
figura 6. Los valores denotados (a,b) en la tabla significan la
señal de valor complejo a+jb donde j es un valor imaginario. Con
referencia a la figura 5A, la señal introducida en la
sub-banda K en la figura 6 es una señal periódica
que cambia 501, 502, 503, 504 en la figura 5A debido a la relación
entre la parte de valor real y la parte de valor imaginario.
Si, a diferencia de la presente invención, el
banco de filtros de síntesis es un filtro que toma entrada de valor
complejo y realiza cálculos de valor complejo, la señal de salida
del sistema de decodificación obtenido por esta señal de inyección
tiene un solo espectro de frecuencia y se inyecta la llamada onda
sinusoidal pura. Sin embargo, si el banco de filtros de síntesis es
un filtro que toma solamente entrada de valor real y realiza
solamente cálculos de valor real como en la presente invención, una
señal de número real no conteniendo la parte de número imaginario
representada en la figura 6 se inyecta a la
sub-banda K como se representa en la figura 7. Con
esta señal de inyección, el sistema de decodificación que usa un
filtro de síntesis que toma solamente valores reales, envía un solo
espectro de frecuencia como se representa en la figura 9 (espectro
902 de la onda sinusoidal inyectado) y espectros indeseados en las
bandas superior e inferior al espectro de onda sinusoidal (espectro
no deseado 903). Esto es debido a que un filtro de síntesis que usa
cálculo de valor real no puede eliminar por completo la fuga de
espectro a sub-bandas adyacentes debido a las
características de filtro, y estas fugas de espectro aparecen como
componentes de solapamiento.
Previendo un generador de señal de compensación
114 como se representa en la figura 4 además del generador de señal
adicional 111 representado en la figura 3 en un banco de filtros de
síntesis que usa cálculo de valor real solamente con entrada de
valor real, se puede extraer los componentes de espectro no deseados
representados en la figura 9.
El generador de señal adicional 111 y el
generador de señal de compensación 114 según la presente invención
se describen a continuación con referencia a la figura 4. En la
figura 4 la información de adición de señal sinusoidal 109, los
medios de extracción de información de fase 402, los medios de
extracción de amplitud 403, los medios de extracción de tiempo 404,
los medios de generación de sinusoide 405, los medios de extracción
de información de sub-banda inyectada 406, los
medios de inyección de onda sinusoidal 407, y la señal de inyección
408 son los mismos que los descritos con referencia a la figura 3.
Lo que difiere de la figura 3 es la adición de medios de
determinación de información de sub-banda de
compensación 409 y el generador de señal de compensación 410.
Los medios de determinación de información de
sub-banda de compensación 409 determinan la
sub-banda a compensar en base a la información
obtenida por los medios de extracción de información de
sub-banda inyectada 406 indicando el número del
banco de filtros de síntesis al que se inyecta la onda sinusoidal.
La sub-banda a compensar es una
sub-banda cerca de la sub-banda a la
que se inyecta la onda sinusoidal, y puede ser una
sub-banda de alta frecuencia o
sub-banda de baja frecuencia. La
sub-banda de alta frecuencia y la
sub-banda de baja frecuencia a compensar variarán
según las características del banco de filtros de síntesis 105, pero
aquí se supone que son las sub-bandas junto a la
sub-banda de la onda sinusoidal inyectada. Por
ejemplo, cuando la onda sinusoidal se inyecta a la
sub-banda K, la sub-banda K+1 y la
sub-banda K-1 son, respectivamente,
la sub-banda de alta frecuencia y la
sub-banda de baja frecuencia a compensar.
El generador de señal de compensación 410 genera
una señal que cancela espectros de solapamiento en la
sub-banda compensada en base a la salida de los
medios de extracción de información de fase 402, los medios de
extracción de amplitud 403, y los medios de extracción de tiempo
404, y envía esta señal como señal de compensación 113. Esta señal
de compensación 113 se añade a la señal de entrada al banco de
filtros de síntesis 105 de la misma manera que la señal de inyección
112. La amplitud S y fase de la señal de compensación 113 se ajustan
para la sub-banda K-1 y la
sub-banda K+1 como se representa en la tabla en la
figura 8.
En la figura 8 Alfa y Beta son valores
determinados según las características del banco de filtros de
síntesis específico, y más específicamente se determinan con
consideración a la cantidad de fuga de espectro a
sub-bandas adyacentes en el banco de filtros.
Como se reconocerá por la figura 8, si se añade
una señal sinusoidal a la sub-banda K, la amplitud
de una señal sinusoidal de período de ciclo T es de amplitud S en el
tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S en el tiempo
2T/4, y amplitud 0 en el tiempo 3T/4. Se aplica una señal de
compensación a la sub-banda K-1 y la
sub-banda K+1. En los dibujos, los tiempos 0, 1, 2 y
3 corresponden a los tiempos 0, 1T/4, 2T/4 y 3T/4,
respectivamente.
La señal de compensación aplicada a la
sub-banda K-1 tiene amplitud 0 en el
tiempo 0, amplitud Alfa*S en el tiempo 1T/4, amplitud 0 en el tiempo
2T/4, y amplitud Beta*S en el tiempo 3T/4.
La señal de compensación aplicada a la
sub-banda K+1 tiene amplitud 0 en el tiempo 0,
amplitud Beta*S en el tiempo 1T/4, amplitud 0 en el tiempo 2T/4, y
amplitud Alfa*S en el tiempo 3T/4.
La figura 10 es un gráfico de espectro para la
onda sinusoidal inyectada por una realización preferida de esta
invención. Como se verá por la figura 10, se suprime el componente
de espectro no deseado 903 observado en la figura 9.
Introduciendo esta señal de compensación, c no
se producen componentes de espectro no deseados aunque se inyecte
una señal sinusoidal a un banco de filtros de valor real, y se puede
inyectar una onda sinusoidal a una sub-banda deseada
con cálculos mínimos.
La invención se ha descrito con referencia a una
señal sinusoidal inyectada a la sub-banda K donde la
fase inicial es 0 y la parte de valor real o la parte de valor
imaginario pasa a 0 como se representa en la figura 5A. Como se
representa en la figura 5B, sin embargo, la presente invención
también se puede aplicar cuando la fase se desplaza \delta del
estado representado en la figura 5A. La relación entre la señal de
inyección y la señal de compensación en este caso puede ser
expresada como se representa en la tabla en la figura 11, por
ejemplo, donde S, P, y Q son valores determinados según las
características del banco de filtros con consideración a la
cantidad de fuga de espectro por el banco de filtros a
sub-bandas adyacentes.
Además, para una sub-banda K a
la que se inyecta la onda sinusoidal, se inyecta una señal de
compensación a sub-bandas K-1 y K+1
adyacentes, pero las sub-bandas adyacentes distintas
de K-1 y K+1 pueden precisar corrección dependiendo
de las características del filtro de síntesis. En este caso, la
señal de compensación se inyecta simplemente a las
sub-bandas que necesitan corrección.
Realización
2
La figura 12 es un diagrama esquemático que
representa un generador de señal adicional en una segunda
realización de la presente invención. Este generador de señal
adicional difiere del generador de señal adicional 111 representado
en la figura 4 en que se introduce información interpolada 1201
calculada por los medios de generación de sinusoide 405 en el
generador de señal de compensación 410 de manera que la señal de
compensación 113 se calcule en base a la información interpolada
1201.
Los medios de generación de sinusoide 405 en la
primera realización anterior ajustan la amplitud de la onda
sinusoidal generada en base solamente a la información de amplitud
de la trama corriente extraída por los medios de extracción de
amplitud 403. Sin embargo, los medios de generación de sinusoide 405
de esta segunda realización interpolan la información de amplitud
usando información de amplitud de tramas contiguas, y ajustan la
amplitud de la onda sinusoidal generada en base a esta información
de amplitud interpolada.
Dado que la amplitud de la onda sinusoidal
generada cambia suavemente como resultado de este proceso, se puede
mejorar la calidad de sonido observada de la señal de salida.
Dado que la amplitud de la onda sinusoidal
generada se cambia por interpolación con esta configuración, la
amplitud de la señal de compensación correspondiente también debe
ser ajustada. Por lo tanto, la información interpolada enviada por
los medios de generación de sinusoide 405 también se introduce en el
generador de señal de compensación 410 para regular la amplitud de
la señal de compensación 113 sincronizada a la amplitud variable
interpolada de la onda sinusoidal.
Esta configuración de la invención puede
calcular correctamente la señal de compensación y suprimir
componentes de espectro no deseados incluso cuando se interpola la
amplitud de la onda sinusoidal generada.
También será evidente que el proceso del aparato
decodificador audio representado en la figura 1 también puede ser
escrito en software usando un lenguaje de programación. Además, este
programa de software se puede grabar y distribuir por un medio de
grabación de datos.
Al utilizar un banco de filtros de síntesis que
reduce el número de operaciones utilizando solamente cálculos de
valor real, se puede suprimir componentes de espectro no deseados
que acompañan a la adición de onda sinusoidal y se puede inyectar
solamente la onda sinusoidal deseada inyectando una señal de
compensación a la sub-banda de baja frecuencia o
alta frecuencia de la sub-banda a la que se añade la
onda sinusoidal.
Claims (14)
1. Un aparato decodificador audio para
decodificar una señal audio de un tren de bits (106) conteniendo
información codificada acerca de una señal audio de banda estrecha
(107) e información adicional (108, 109) para expandir la señal
audio de banda estrecha a una señal audio de banda ancha,
conteniendo la información adicional información de componente de
alta frecuencia (108) que denota una característica de una banda de
frecuencia más alta que una banda de la información codificada, e
información de adición de sinusoide (109) que denota una señal
sinusoidal añadida a una banda de frecuencia específica, incluyendo
dicho aparato decodificador audio:
un demultiplexor de tren de bits (101) operable
para demultiplexar la información codificada y la información
adicional del tren de bits;
un decodificador (102) operable para decodificar
la señal audio de banda estrecha de la información codificada
demultiplexada;
un filtro de sub-banda de
análisis (103) operable para separar la señal audio de banda
estrecha en una primera señal de sub-banda compuesta
de una pluralidad de señales de sub-banda;
un generador de señal sinusoidal (111) operable
para generar una señal sinusoidal añadida a una
sub-banda específica en una banda de frecuencia más
alta que una banda de frecuencia de la información codificada en
base a la información de adición de sinusoide en la información
adicional demultiplexada;
un generador de señal de corrección (114)
operable para generar, en base a una característica de fase y una
característica de amplitud de la señal sinusoidal, una señal de
corrección añadida a sub-bandas cerca de una
sub-banda específica para suprimir las señales de
componente de solapamiento que se producen en las
sub-bandas cerca de la sub-banda
específica;
un generador de señal de frecuencia alta (104)
operable para generar una segunda señal de sub-banda
compuesta de una pluralidad de señales de sub-banda
en una banda de frecuencia más alta que la banda de frecuencia de la
información codificada de la primera señal de
sub-banda e información de componente de alta
frecuencia en la información adicional demultiplexada, y añadir la
señal sinusoidal y la señal de corrección a la segunda señal de
sub-banda; y
un filtro de síntesis de
sub-banda de cálculo de valor real (105) operable
para combinar la primera señal de sub-banda y la
segunda señal de sub-banda para obtener la señal
audio de banda ancha.
2. Un aparato decodificador audio según la
reivindicación 1, donde las señales de componente de solapamiento
contienen al menos componentes suprimidos después de la síntesis por
un filtro de síntesis de sub-banda que realiza
cálculos de valor complejos.
3. Un aparato decodificador audio según la
reivindicación 1, donde la primera señal de
sub-banda se compone de señal de
sub-banda de baja frecuencia, y la segunda señal de
sub-banda se compone de señales de
sub-banda de alta frecuencia.
4. Un aparato decodificador audio según la
reivindicación 1, donde la señal de corrección generada por el
generador de señal de corrección suprime señales de componente de
solapamiento producidas en una sub-banda junto a la
sub-banda a la que se añade la señal sinusoidal.
5. Un aparato decodificador audio según la
reivindicación 1, donde una amplitud de la señal de corrección
generada por el generador de señal de corrección es ajustada
sincrónicamente a la amplitud de la señal sinusoidal.
6. Un aparato decodificador audio según la
reivindicación 4, donde, cuando la señal sinusoidal se añade a la
sub-banda K, una señal sinusoidal de período T tiene
amplitud S en el tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S
en el tiempo 2T/4, y amplitud 0 en el tiempo 3T/4, y la señal de
corrección se aplica a la sub-banda
K-1 y la sub-banda K+1,
la señal de corrección aplicada a la
sub-banda K-1 tiene amplitud 0 en el
tiempo 0, amplitud Alfa*S en el tiempo 1T/4, amplitud 0 en el tiempo
2T/4, y amplitud Beta*S en el tiempo 3T/4, y
la señal de corrección aplicada a la
sub-banda K+1 tiene amplitud 0 en el tiempo 0,
amplitud Beta*S en el tiempo 1T/ 4, amplitud 0 en el tiempo 2T/4, y
amplitud Alfa*S en el tiempo 3T/4,
donde Alfa y Beta son constantes.
7. Un método de decodificación audio para
decodificar una señal audio de un tren de bits conteniendo
información codificada acerca de una señal audio de banda estrecha e
información adicional para expandir la señal audio de banda estrecha
a una señal audio de banda ancha, y conteniendo la información
adicional información de componente de alta frecuencia que denota
una característica de una banda de frecuencia más alta que una banda
de la información codificada, e información de adición de sinusoide
que denota una señal sinusoidal añadida a una banda de frecuencia
específica, incluyendo dicho método de decodificación audio:
demultiplexar la información codificada y la
información adicional del tren de bits;
decodificar la señal audio de banda estrecha de
la información codificada demultiplexada;
separar la señal audio de banda estrecha en una
primera señal de sub-banda compuesta de una
pluralidad de señales de sub-banda;
generar una señal sinusoidal añadida a una
sub-banda específica en una banda de frecuencia más
alta que una banda de frecuencia de la información codificada en
base a la información de adición de sinusoide en la información
adicional demultiplexada;
generar, en base a una característica de fase y
una característica de amplitud de la señal sinusoidal, una señal de
corrección añadida a sub-bandas cerca de una
sub-banda específica para suprimir señales de
componente de solapamiento que se producen en las
sub-bandas cerca de la sub-banda
específica;
generar una segunda señal de
sub-banda compuesta de una pluralidad de señales de
sub-banda en una banda de frecuencia más alta que la
banda de frecuencia de la información codificada de la primera señal
de sub-banda e información de componente de alta
frecuencia en la información adicional demultiplexada, y añadir la
señal sinusoidal y señal de corrección a la segunda señal de
sub-banda; y
sintetizar la primera señal de
sub-banda y la segunda señal de
sub-banda usando un cálculo de valor real para
obtener la señal audio de banda ancha.
8. Un método de decodificación audio según la
reivindicación 7, donde las señales de componente de solapamiento
contienen al menos componentes suprimidos después de la síntesis
realizada usando cálculos de valor complejos.
9. Un método de decodificación audio según la
reivindicación 7, donde la primera señal de
sub-banda se compone de señales de
sub-banda de baja frecuencia, y la segunda señal de
sub-banda se compone de señales de
sub-banda de alta frecuencia.
10. Un método de decodificación audio según la
reivindicación 7, donde la señal de corrección generada suprime
señales de componente de solapamiento producidas en una
sub-banda junto a la sub-banda a la
que se añade la señal sinusoidal.
11. Un método de decodificación audio según la
reivindicación 7, donde una amplitud de la señal de corrección
generada es ajustada sincrónicamente a la amplitud de la señal
sinusoidal.
12. Un método de decodificación audio según la
reivindicación 10, donde cuando la señal sinusoidal se añade a la
sub-banda K, una señal sinusoidal de período T tiene
amplitud S en el tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S
en el tiempo 2T/4, y amplitud 0 en el tiempo 3T/4, y la señal de
corrección se aplica a la sub-banda
K-1 y la sub-banda K+1,
la señal de corrección aplicada a la
sub-banda K-1 tiene amplitud 0 en el
tiempo 0, amplitud Alfa*S en el tiempo 1T/ 4, amplitud 0 en el
tiempo 2T/4, y amplitud Beta*S en el tiempo 3T/4, y
la señal de corrección aplicada a la
sub-banda K+1 tiene amplitud 0 en el tiempo 0,
amplitud Beta*S en el tiempo 1T/ 4, amplitud 0 en el tiempo 2T/4, y
amplitud Alfa*S en el tiempo 3T/4,
donde Alfa y Beta son constantes.
13. Un programa incluyendo código ejecutable por
ordenador operable para hacer que un ordenador efectúe el método de
decodificación audio reivindicado en la reivindicación 7.
14. Un medio de grabación de datos legible por
ordenador para grabar el programa según se reivindica en la
reivindicación 13.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002225068 | 2002-08-01 | ||
JP2002-225068 | 2002-08-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2261974T3 true ES2261974T3 (es) | 2006-11-16 |
Family
ID=31492144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03766661T Expired - Lifetime ES2261974T3 (es) | 2002-08-01 | 2003-07-30 | Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. |
Country Status (14)
Country | Link |
---|---|
US (1) | US7058571B2 (es) |
EP (1) | EP1527442B1 (es) |
JP (1) | JP3646938B1 (es) |
KR (1) | KR100723753B1 (es) |
CN (1) | CN1286087C (es) |
AT (1) | ATE322735T1 (es) |
AU (1) | AU2003252727A1 (es) |
BR (2) | BR0305710A (es) |
CA (1) | CA2464408C (es) |
DE (1) | DE60304479T2 (es) |
ES (1) | ES2261974T3 (es) |
HK (1) | HK1073525A1 (es) |
TW (1) | TWI303410B (es) |
WO (1) | WO2004013841A1 (es) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
DE60202881T2 (de) | 2001-11-29 | 2006-01-19 | Coding Technologies Ab | Wiederherstellung von hochfrequenzkomponenten |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR20070084002A (ko) * | 2004-11-05 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 복호화 장치 및 스케일러블 부호화 장치 |
JP5224017B2 (ja) * | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
KR101194902B1 (ko) * | 2005-02-24 | 2012-10-25 | 파나소닉 주식회사 | 데이터 재생장치 |
UA94041C2 (ru) * | 2005-04-01 | 2011-04-11 | Квелкомм Инкорпорейтед | Способ и устройство для фильтрации, устраняющей разреженность |
US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
CN100568863C (zh) * | 2005-09-30 | 2009-12-09 | 中国科学院上海微系统与信息技术研究所 | 基于多子带滤波器组的发射、接收装置及其方法 |
WO2007043648A1 (ja) | 2005-10-14 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 変換符号化装置および変換符号化方法 |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
KR101069268B1 (ko) * | 2007-02-14 | 2011-10-04 | 엘지전자 주식회사 | 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법 |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
KR101080421B1 (ko) * | 2007-03-16 | 2011-11-04 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
KR101425355B1 (ko) * | 2007-09-05 | 2014-08-06 | 삼성전자주식회사 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
EP2227682A1 (en) * | 2007-11-06 | 2010-09-15 | Nokia Corporation | An encoder |
US9082397B2 (en) | 2007-11-06 | 2015-07-14 | Nokia Technologies Oy | Encoder |
US20100274555A1 (en) * | 2007-11-06 | 2010-10-28 | Lasse Laaksonen | Audio Coding Apparatus and Method Thereof |
CN102568489B (zh) * | 2007-11-06 | 2015-09-16 | 诺基亚公司 | 编码器 |
BRPI0904958B1 (pt) * | 2008-07-11 | 2020-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral |
CN101751925B (zh) * | 2008-12-10 | 2011-12-21 | 华为技术有限公司 | 一种语音解码方法及装置 |
EP3992966B1 (en) * | 2009-01-16 | 2022-11-23 | Dolby International AB | Cross product enhanced harmonic transposition |
KR101599884B1 (ko) * | 2009-08-18 | 2016-03-04 | 삼성전자주식회사 | 멀티 채널 오디오 디코딩 방법 및 장치 |
US8515768B2 (en) | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
WO2011114192A1 (en) * | 2010-03-19 | 2011-09-22 | Nokia Corporation | Method and apparatus for audio coding |
JP5651980B2 (ja) | 2010-03-31 | 2015-01-14 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9514768B2 (en) | 2010-08-06 | 2016-12-06 | Samsung Electronics Co., Ltd. | Audio reproducing method, audio reproducing apparatus therefor, and information storage medium |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
JP5552988B2 (ja) * | 2010-09-27 | 2014-07-16 | 富士通株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
JP2011059714A (ja) * | 2010-12-06 | 2011-03-24 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5569476B2 (ja) * | 2011-07-11 | 2014-08-13 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP5969614B2 (ja) * | 2011-09-28 | 2016-08-17 | エルジー エレクトロニクス インコーポレイティド | 音声信号符号化方法及び音声信号復号方法 |
AU2012366843B2 (en) * | 2012-01-20 | 2015-08-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
KR101248125B1 (ko) | 2012-10-15 | 2013-03-27 | (주)알고코리아 | 주변소음 소거와 주파수 채널별 압축 기능을 가진 보청기 |
US9373337B2 (en) * | 2012-11-20 | 2016-06-21 | Dts, Inc. | Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis |
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4691292A (en) * | 1983-04-13 | 1987-09-01 | Rca Corporation | System for digital multiband filtering |
DE3510573A1 (de) * | 1985-03-23 | 1986-09-25 | Philips Patentverwaltung | Digitale analyse-synthese-filterbank mit maximaler taktreduktion |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
FR2680924B1 (fr) * | 1991-09-03 | 1997-06-06 | France Telecom | Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant. |
US5508949A (en) | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
JPH08162964A (ja) | 1994-12-08 | 1996-06-21 | Sony Corp | 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3437421B2 (ja) | 1997-09-30 | 2003-08-18 | シャープ株式会社 | 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体 |
EP0957579A1 (en) | 1998-05-15 | 1999-11-17 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for sampling-rate conversion of audio signals |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
US6718300B1 (en) | 2000-06-02 | 2004-04-06 | Agere Systems Inc. | Method and apparatus for reducing aliasing in cascaded filter banks |
US6889182B2 (en) | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
-
2003
- 2003-07-30 DE DE60304479T patent/DE60304479T2/de not_active Expired - Lifetime
- 2003-07-30 AT AT03766661T patent/ATE322735T1/de not_active IP Right Cessation
- 2003-07-30 BR BR0305710-0A patent/BR0305710A/pt active IP Right Grant
- 2003-07-30 BR BRPI0305710-0A patent/BRPI0305710B1/pt unknown
- 2003-07-30 AU AU2003252727A patent/AU2003252727A1/en not_active Abandoned
- 2003-07-30 EP EP03766661A patent/EP1527442B1/en not_active Expired - Lifetime
- 2003-07-30 CN CNB038014920A patent/CN1286087C/zh not_active Expired - Lifetime
- 2003-07-30 CA CA2464408A patent/CA2464408C/en not_active Expired - Lifetime
- 2003-07-30 US US10/491,894 patent/US7058571B2/en not_active Expired - Lifetime
- 2003-07-30 ES ES03766661T patent/ES2261974T3/es not_active Expired - Lifetime
- 2003-07-30 JP JP2004525798A patent/JP3646938B1/ja not_active Expired - Lifetime
- 2003-07-30 KR KR1020047006430A patent/KR100723753B1/ko active IP Right Grant
- 2003-07-30 WO PCT/JP2003/009646 patent/WO2004013841A1/en active IP Right Grant
- 2003-07-31 TW TW092120991A patent/TWI303410B/zh not_active IP Right Cessation
-
2005
- 2005-08-16 HK HK05107079A patent/HK1073525A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE60304479D1 (de) | 2006-05-18 |
ATE322735T1 (de) | 2006-04-15 |
TW200405267A (en) | 2004-04-01 |
KR20050042020A (ko) | 2005-05-04 |
BRPI0305710B1 (pt) | 2017-11-07 |
KR100723753B1 (ko) | 2007-05-30 |
CA2464408A1 (en) | 2004-02-12 |
JP3646938B1 (ja) | 2005-05-11 |
CN1286087C (zh) | 2006-11-22 |
CA2464408C (en) | 2012-02-21 |
CN1585972A (zh) | 2005-02-23 |
AU2003252727A8 (en) | 2004-02-23 |
US7058571B2 (en) | 2006-06-06 |
EP1527442A1 (en) | 2005-05-04 |
AU2003252727A1 (en) | 2004-02-23 |
HK1073525A1 (en) | 2005-10-07 |
US20050080621A1 (en) | 2005-04-14 |
EP1527442B1 (en) | 2006-04-05 |
WO2004013841A1 (en) | 2004-02-12 |
TWI303410B (en) | 2008-11-21 |
JP2005520217A (ja) | 2005-07-07 |
DE60304479T2 (de) | 2006-12-14 |
BR0305710A (pt) | 2004-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2261974T3 (es) | Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. | |
ES2683870T3 (es) | Procesador de audio y método para procesar una señal de audio usando corrección de fase | |
ES2667221T3 (es) | Aparato y método para decodificar y codificar una señal de audio utilizando selección de mosaicos espectrales adaptativos | |
ES2259158T3 (es) | Metodo y aparato decodificador audio. | |
ES2247466T3 (es) | Mejora de codificacion de la fuente utilizando replicacion de la banda espectral. | |
ES2273216T3 (es) | Codificacion de audio. | |
ES2714153T3 (es) | Decodificación de audio estéreo paramétrico | |
KR100602975B1 (ko) | 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체 | |
ES2387943T3 (es) | Ocultación de error de transmisión en una señal de audio digital en una estructura de decodificación jerárquica | |
RU2491658C2 (ru) | Синтезатор аудиосигнала и кодирующее устройство аудиосигнала | |
US8374853B2 (en) | Hierarchical encoding/decoding device | |
JP6407150B2 (ja) | 音響信号の帯域幅拡張を行う装置及び方法 | |
KR101411900B1 (ko) | 오디오 신호의 부호화 및 복호화 방법 및 장치 | |
ES2693051T3 (es) | Aparato y procedimiento para generar una señal mejorada mediante el uso de relleno de ruido independiente | |
RU2612584C2 (ru) | Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках | |
KR20070012194A (ko) | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 | |
BRPI0910523A2 (pt) | aparelho e método para gerar dados de saída de extensão de largura de banda | |
EP2153437A1 (en) | Method and apparatus for encoding and decoding high frequency band | |
ES2337903T3 (es) | Codificacion de audio. | |
ES2439693T3 (es) | Codificación de señales de múltiples canales |