ES2911527T3 - Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro - Google Patents
Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro Download PDFInfo
- Publication number
- ES2911527T3 ES2911527T3 ES21158838T ES21158838T ES2911527T3 ES 2911527 T3 ES2911527 T3 ES 2911527T3 ES 21158838 T ES21158838 T ES 21158838T ES 21158838 T ES21158838 T ES 21158838T ES 2911527 T3 ES2911527 T3 ES 2911527T3
- Authority
- ES
- Spain
- Prior art keywords
- vector
- decoded
- predictive
- coefficients
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims description 55
- 239000013598 vector Substances 0.000 claims abstract description 794
- 238000012937 correction Methods 0.000 claims abstract description 366
- 230000003595 spectral effect Effects 0.000 claims abstract description 111
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000013139 quantization Methods 0.000 description 109
- 238000012545 processing Methods 0.000 description 94
- 238000004364 calculation method Methods 0.000 description 74
- 238000010586 diagram Methods 0.000 description 23
- 230000005540 biological transmission Effects 0.000 description 20
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000009499 grossing Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 12
- 241000209094 Oryza Species 0.000 description 9
- 235000007164 Oryza sativa Nutrition 0.000 description 9
- 235000009566 rice Nutrition 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 101100492406 Caenorhabditis elegans unc-85 gene Proteins 0.000 description 3
- 101100436058 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) asf-1 gene Proteins 0.000 description 3
- 230000001934 delay Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Un dispositivo de descodificación de señales de sonido que comprende: una unidad de descodificación predictiva que está adaptada para obtener un vector diferencial descodificado al descodificar un primer código y generar un primer vector descodificado formado por valores descodificados de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada; y una unidad de descodificación no predictiva que está adaptada para obtener un vector de corrección descodificado mediante la descodificación de un segundo código y generar un segundo vector descodificado formado por valores descodificados de los coeficientes que se pueden convertir en los coeficientes de predicción lineal de más de un orden del trama actual sumando elementos del vector de corrección descodificado y al menos elementos de órdenes correspondientes del vector diferencial descodificado, en donde la unidad de descodificación no predictiva está adaptada para generar el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral a una secuencia de los coeficientes que son convertible en los coeficientes de predicción lineal, es mayor o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual a un valor de umbral predeterminado Th1'.
Description
DESCRIPCIÓN
Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro
[CAMPO TÉCNICO]
La presente invención se refiere a una tecnología de descodificación de descodificación de coeficientes de predicción lineal y coeficientes que son convertibles en los mismos.
[AN TECED EN TES DE LA TÉCNICA]
En la codificación de señales de sonido tales como habla y música, se utiliza ampliamente un método de realización de la codificación utilizando coeficientes de predicción lineal obtenidos realizando análisis de predicción lineal sobre una señal de sonido de entrada.
Para hacer posible la obtención, en la parte de un dispositivo de descodificación, de la información sobre los coeficientes de predicción lineal utilizados en el procesamiento de codificación mediante descodificación, un dispositivo de codificación codifica los coeficientes de predicción lineal y envía un código correspondiente a los coeficientes de predicción lineal al dispositivo de descodificación. En la Bibliografía no relacionada con patentes 1, un dispositivo de codificación convierte los coeficientes de predicción lineal en una secuencia de parámetros LSP (Par de Espectro de Línea) que son parámetros en un dominio de frecuencia y equivalentes a los coeficientes de predicción lineal y envía un código LSP obtenido codificando la secuencia de parámetros LSP a un dispositivo de codificación.
En la bibliografía no relacionada con patentes 1, para reducir la cantidad de código del código LSP , se utiliza una tecnología de codificación y descodificación vectorial que utiliza predicción de media móvil (predicción de MA).
En primer lugar, se describirá el flujo de procesamiento de codificación.
<Dispositivo 80 de codificación de coeficientes de predicción lineal>
La Figura 1 representa la configuración de un dispositivo 80 de codificación de coeficientes de predicción lineal existente.
Al dispositivo 80 de codificación de coeficientes de predicción lineal, se introducen parámetros LSP (Pares de Espectro de Línea) 0f[1], 0f[2], ..., 0f[p] de cada trama, y el dispositivo 80 de codificación de coeficientes de predicción lineal realiza el siguiente procesamiento de una unidad 83 de resta predictiva, una unidad 84 de codificación vectorial, y una unidad 87 de entrada de retardo trama por trama, obtiene un código LSP C f , y emite el código LSP C f . Por otro lado, f representa un número de trama y p representa un orden de predicción.
Cuando se introduce una señal X f de sonido de entrada al dispositivo 80 de codificación de coeficientes de predicción lineal, el dispositivo 80 de codificación de coeficientes de predicción lineal también se proporciona con una unidad 81 de análisis de predicción lineal y una unidad 82 de cálculo LSP , y las señales X f de sonido de entrada de trama por trama se introducen consecutivamente en el mismo y se realiza el siguiente procesamiento trama por trama.
En adelante, se describirá el procesamiento específico de cada unidad.
<Unidad 81 de análisis de predicción lineal>
La unidad 81 de análisis de predicción lineal recibe la señal X f de sonido de entrada, realiza análisis de predicción lineal sobre la señal X f de sonido de entrada, obtiene los coeficientes af[1], af[2], ..., af[p] de predicción lineal, y emite los coeficientes af[1], af[2], ..., af[p] de predicción lineal. Aquí, af[i] representa un coeficiente de predicción lineal de iésimo orden que se obtiene realizando análisis de predicción lineal sobre una señal X f de sonido de entrada de una fésima trama.
<Unidad 82 de cálculo LSP>
La unidad 82 de cálculo LSP recibe los coeficientes af[1], af[2], ..., af[p] de predicción lineal, obtiene los parámetros LSP 0f[1], 0f[2], ..., 0f[p] a partir de los coeficientes af[1], af[2], ..., af[p] de predicción lineal y emite un vector 0 f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP que es un vector que utiliza los parámetros LSP obtenidos como elementos del mismo. Aquí, Here, 0f[i] es un parámetro LSP de i-ésimo orden correspondiente a la señal X f de sonido de entrada de la f-ésima trama.
<Unidad 83 de resta predictiva>
La unidad 83 de resta predictiva está formada por, por ejemplo, un almacenamiento 83c que almacena un coeficiente a predeterminado, un almacenamiento 83d que almacena un vector V de media predictiva, una unidad 88 de multiplicación, y unidades 83a y 83b de resta.
La unidad 83 de resta predictiva recibe el vector 0 f de parámetros LSP y un vector aS m . diferencial de cuantificación de la trama precedente.
La unidad 83 de resta predictiva genera un vector diferencial S f = 0 f-V-axAS f - i = (st[1 ], sf[2], Sf[p])T que es un vector obtenido restando el vector V de media predictiva y un vector aASf - i del vector 0 f de parámetros LSP y emite el vector diferencial S f .
Por otro lado, el vector V = (v[1], v[2], ..., v[p])T de media predictiva es un vector predeterminado almacenado en el almacenamiento 83d y simplemente tiene que ser obtenido por adelantado a partir de, por ejemplo, una señal de sonido para el aprendizaje. Por ejemplo, en el dispositivo 80 de codificación de coeficientes de predicción lineal, utilizando una señal de sonido captada en el mismo entorno (por ejemplo, el mismo altavoz, dispositivo de captación de sonido, y lugar) que la señal de sonido a ser descodificada como una señal de sonido de entrada para el aprendizaje, se obtienen vectores de parámetros LSP de muchas tramas, y el promedio de los mismos se utiliza como el vector de media predictiva.
La unidad 88 de multiplicación obtiene un vector axASf-1 multiplicando un vector ASf-1 diferencial descodificado de una trama precedente por el coeficiente a predeterminado almacenado en el almacenamiento 83c.
Por otro lado, en la Figura 1, utilizando las dos unidades 83a y 83b de resta, en primer lugar, después de que el vector V de media predictiva almacenado en el almacenamiento 83d sea restado del vector 0 f de parámetros LSP en la unidad 83a de resta, el vector axASf-1 se resta en la unidad 83b de resta, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector diferencial S f se puede generar restando, del vector 0 f de parámetros LSP , un vector V+axASf-1 obtenido sumando el vector V de media predictiva y el vector axASf-1.
El vector diferencial S f de la trama actual también se puede denominar un vector que se obtiene restando un vector que contiene al menos una predicción basada en una trama pasada de un vector (un vector 0 f de parámetros LSP) basado en coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de la trama actual.
<Unidad 84 de codificación vectorial>
La unidad 84 de codificación vectorial recibe el vector diferencial S f, codifica el vector diferencial S f , y obtiene un código LSP C f y un vector ASf = (Asf[1], ASf [2], ..., Asf[p])T diferencial de cuantificación correspondiente al código LSP Cf y emite el código LSP C f y el vector ASf diferencial de cuantificación. Para codificar el vector diferencial S f , se puede utilizar cualquiera de los métodos de codificación bien conocidos, tal como un método de cuantificación vectorial del vector diferencial S f , un método de división del vector diferencial S f en una pluralidad de subvectores y cuantificación vectorial de cada uno de los subvectores, un método de cuantificación vectorial multietapa del vector diferencial S f o los subvectores, un método de cuantificación escalar de los elementos de un vector, y un método obtenido combinando estos métodos.
Aquí, se describirá un ejemplo de un caso en el que se utiliza el método de cuantificación vectorial del vector diferencial S f .
La unidad 84 de codificación vectorial busca un vector diferencial candidato más cercano al vector diferencial S f a partir de una pluralidad de vectores diferenciales candidatos almacenados en un libro de códigos 86 de vectores y emite el vector diferencial candidato como el vector ASf diferencial de cuantificación, y emite un código vectorial diferencial correspondiente al vector ASf diferencial de cuantificación como el código LSP C f . Por otro lado, el vector ASf diferencial de cuantificación corresponde a un vector diferencial descodificado que se describirá más adelante.
<Libro de códigos 86 de vectores>
En el libro de códigos 86 de vectores, los vectores diferenciales candidatos y los códigos vectoriales diferenciales correspondientes a los vectores diferenciales candidatos se almacenan por adelantado.
<Unidad 87 de entrada de retardo>
La unidad 87 de entrada de retardo recibe el vector ASf diferencial de cuantificación, mantiene el vector ASf diferencial de cuantificación, retarda el vector ASf , diferencial de cuantificación en una trama, y emite el vector resultante como un vector ASf-1 diferencial de cuantificación de la trama precedente. Es decir, si la unidad 83 de resta predictiva ha realizado el procesamiento sobre un vector ASf diferencial de cuantificación de una f-ésima trama, la unidad 87 de entrada de retardo emite un vector ASf-1 diferencial de cuantificación sobre una f-1 -ésima trama.
<Dispositivo 90 de descodificación de coeficientes de predicción lineal>
La Figura 2 representa la configuración de un dispositivo 90 de descodificación de coeficientes de predicción lineal existente. Al dispositivo 90 de descodificación de coeficientes de predicción lineal, se introducen consecutivamente códigos LSP C f de trama por trama, y el dispositivo 90 de descodificación de coeficientes de predicción lineal obtiene un vector A0f = (A0f[1], A0f[2], ..., A0f[p]) de parámetros LSP predictivos descodificados descodificando el código LSP C f trama por trama.
En adelante, se describirá el procesamiento específico de cada unidad.
<Unidad 91 de descodificación vectorial>
Una unidad 91 de descodificación vectorial recibe el código LSP C f , descodifica el código LSP C f , obtiene un vector AS f diferencial descodificado correspondiente al código LSP C f , y emite el vector AS f diferencial descodificado. Para la descodificación del código LSP C f , se utiliza un método de descodificación correspondiente al método de codificación adoptado por la unidad 84 de codificación vectorial del dispositivo de codificación.
Aquí, se describirá un ejemplo de un caso en el que se utiliza un método de descodificación correspondiente al método adoptado por la unidad 84 de codificación vectorial, el método de cuantificación vectorial del vector diferencial S f .
La unidad 91 de descodificación vectorial busca una pluralidad de códigos vectoriales diferenciales correspondientes al código LSP C f a partir de códigos vectoriales diferenciales almacenados en un libro de códigos 92 de vectores y emite un vector diferencial candidato correspondiente a los códigos vectoriales diferenciales como el vector ASf diferencial descodificado. Por otro lado, el vector ASf diferencial descodificado corresponde al vector ASf diferencial de cuantificación descrito anteriormente y los elementos correspondientes toman los mismos valores si no hay errores de transmisión y no hay errores y similares en el curso de la codificación y descodificación.
<Libro de códigos 92 de vectores>
En el libro de códigos 92 de vectores, los vectores diferenciales candidatos y los códigos vectoriales diferenciales correspondientes a los vectores diferenciales candidatos se almacenan por adelantado. Por otro lado, el libro de códigos 92 de vectores comparte información en común con el libro de códigos 86 de vectores del dispositivo 80 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 93 de entrada de retardo>
Una unidad 93 de entrada de retardo recibe el vector ASf diferencial descodificado, mantiene el vector ASf diferencial descodificado, retarda el vector ASf diferencial descodificado en una trama, y emite el vector resultante como un vector ASf-1 diferencial descodificado de la trama precedente. Es decir, si una unidad 95 de suma predictiva realiza el procesamiento sobre un vector ASf diferencial descodificado de una f-ésima trama, la unidad 93 de entrada de retardo emite un vector ASf-1 diferencial descodificado de una f-1-ésima trama.
<Unidad 95 de suma predictiva>
Una unidad 95 de suma predictiva está formada por, por ejemplo, un almacenamiento 95c que almacena un coeficiente a predeterminado, un almacenamiento 95d que almacena un vector V de media predictiva, una unidad 94 de multiplicación, y unidades 95a y 95b de suma.
La unidad 95 de suma predictiva recibe el vector ASf diferencial descodificado de la trama actual y el vector ASf-1 diferencial descodificado de la trama precedente.
La unidad 95 de suma predictiva genera un vector A©f (= ASf+V+aASf-1) de parámetros LSP predictivos descodificados que es un vector obtenido sumando el vector ASf diferencial descodificado, el vector V = (v[1 ], v[2], ..., v[N])T de media predictiva, y un vector axASf-1 y emite el vector A©f de parámetros LSP predictivos descodificados.
La unidad 94 de multiplicación obtiene el vector axASf-1 multiplicando el vector ASf-1 diferencial descodificado de la trama precedente por el coeficiente a predeterminado almacenado en el almacenamiento 95c.
En la Figura 2, utilizando las dos unidades 95a y 95b de suma, en primer lugar, después de que vector axASf-1 sea sumado al vector ASf diferencial descodificado de la trama actual en la unidad 95a de suma, el vector V de media predictiva se suma en la unidad 95b de suma, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector A©f de parámetros LSP predictivos descodificados se puede generar sumando un vector obtenido sumando el vector axASf-1 y el vector V de media predictiva al vector ASf diferencial descodificado.
Por otro lado, se supone que el vector V de media predictiva utilizado aquí es el mismo que el vector V de media predictiva utilizado en la unidad 83 de resta predictiva del dispositivo 80 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 96 de cálculo de coeficientes de predicción lineal predictivos descodificados>
Si son necesarios coeficientes de predicción lineal, el dispositivo 90 de descodificación de coeficientes de predicción lineal se puede proporcionar con una unidad 96 de cálculo de coeficientes de predicción lineal predictivos descodificados. En este caso, la unidad 96 de cálculo de coeficientes de predicción lineal predictivos descodificados recibe el vector a© de parámetros LSP predictivos descodificados, convierte el vector A©f de parámetros LSP predictivos descodificados en coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos descodificados, y emite los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos descodificados.
[BIBLIOGRAFÍA DE LA TÉCNICA ANTERIOR]
[BIBLIOGRAFÍA NO RELACIONADA CON PATENTES]
Bibliografía no relacionada con patentes 1: "ITU-T Recommendation G.729", ITU, 1996
Se conocen esquemas de codificación y descodificación predictiva/no predictiva adicionales a partir de los siguientes documentos:
Bibliografía no relacionada con patentes 2: Zarrrinkoub H et al. "Switched prediction and quantization of LSP frequencies", Proc. IEEE ICASSP, vol. 2, páginas 757-760, 7 Mayo de 1996
Bibliografía no relacionada con patentes 3: Jelinek M et al. "G.718: A new embedded speech and audio coding standard with high resilience to error-prone transmission channels", IE E E Communications Magazine, vol. 47, no. 10, páginas 117-123, Octubre de 2009
[COMPENDIO DE LA INVENCIÓN]
[PROBLEM AS A S E R RESU ELTO S POR LA INVENCIÓN]
En el dispositivo de descodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1, dado que el procesamiento de descodificación de una f-ésima trama se realiza utilizando el vector aSm diferencial descodificado que es el resultado de descodificación de una f-1-ésima trama, no solo cuando ocurre un error de transmisión en un código LSP de la trama actual, sino también cuando ocurre un error de transmisión en un código LSP de la trama inmediatamente precedente, los parámetros LSP de la trama actual tampoco se pueden descodificar correctamente.
En el dispositivo de descodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1, dado que los parámetros LSP obtenidos mediante descodificación se utilizan solamente para la síntesis de predicción lineal, incluso cuando los parámetros LSP no se pueden descodificar correctamente, esto simplemente causa una reducción en la calidad de sonido de la señal de sonido descodificada en una pluralidad de tramas consecutivas. Es decir, puede decirse que el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de descodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1 tienen una configuración que da una mayor prioridad a la expresión de los parámetros LSP con una cantidad de código pequeña que a un problema que surgirá cuando los parámetros LSP no puedan ser descodificados correctamente.
Sin embargo, el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de descodificación de coeficientes de predicción lineal se utilizan también en un dispositivo de codificación y un dispositivo de descodificación que utilizan los parámetros LSP no solo para análisis y síntesis de predicción lineal, sino también para codificación y descodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de los parámetros LSP . En este caso, surge el siguiente problema: si los parámetros LSP no se pueden descodificar correctamente en una trama, la descodificación de longitud variable no se puede realizar correctamente en una pluralidad de tramas consecutivas que incluyen esa trama, lo que hace posible obtener una señal de sonido descodificada.
En vista de tal problema, un objetivo de la presente invención es proporcionar un método de codificación y un método de descodificación de codificación y descodificación de coeficientes que son convertibles en coeficientes de predicción lineal, el método de codificación y el método de descodificación que pueden utilizar en combinación el método de codificación y método de descodificación predictivas que son un método de codificación y un método de descodificación que pueden expresar de manera precisa coeficientes que son convertibles en coeficientes de predicción lineal con una cantidad de código pequeña, los coeficientes tales como los utilizados en el análisis y síntesis de predicción lineal, por ejemplo, y un método de codificación y un método de descodificación que pueden obtener correctamente, mediante descodificación, coeficientes que son convertibles en coeficientes de predicción lineal de la trama actual, incluso cuando un código de coeficientes de predicción lineal (por ejemplo, un código LSP) que es un código correspondiente a los coeficientes que son convertibles en coeficientes de predicción lineal de una trama precedente, los coeficientes tales como los utilizados en codificación/descodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de los parámetros LSP , por ejemplo, no se introduce correctamente a un dispositivo de descodificación de coeficientes de predicción lineal, si se introduce correctamente un código de coeficientes de predicción lineal de la trama actual al dispositivo de descodificación de coeficientes de predicción lineal.
[MEDIOS PARA RESO LV ER LOS PROBLEMAS]
Para resolver el problema descrito anteriormente, la presente invención proporciona dispositivos de descodificación, métodos de descodificación, y programas y soportes de registro correspondientes, que tienen las características de las respectivas reivindicaciones independientes.
Según un ejemplo que no está incluido en las reivindicaciones pero que es útil para entender la presente invención, un dispositivo de codificación incluye: una unidad de codificación predictiva que obtiene un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual y un vector de predicción que contiene al menos un vector pronosticado a partir de una trama pasada, y obtiene un vector diferencial de cuantificación correspondiente al primer código; y una unidad de codificación no predictiva que genera un segundo código codificando un vector de corrección qué está formado por diferenciales entre el vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual y el vector diferencial de cuantificación o formado por algunos de los elementos de los diferenciales.
Para solucionar el problema descrito anteriormente, según otro ejemplo que no está incluido en las reivindicaciones pero que es útil para entender la presente invención, un dispositivo de codificación incluye: una unidad de codificación predictiva que obtiene un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual y un vector de predicción formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y obtiene un vector diferencial de cuantificación correspondiente al primer código; y una unidad de codificación no predictiva que genera un segundo código codificando un vector de corrección que está formado por diferenciales obtenidos restando el vector diferencial de cuantificación y el vector predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual o formado por algunos de los elementos de los diferenciales.
Para resolver el problema descrito anteriormente, según un aspecto de la presente invención, un dispositivo de descodificación de señales de sonido incluye: una unidad de descodificación predictiva que está adaptada para obtener un vector diferencial descodificado mediante la descodificación de un primer código y generar un primer vector descodificado formado por valores descodificados de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada; y una unidad de descodificación no predictiva que está adaptada para obtener un vector de corrección descodificado mediante la descodificación de un segundo código y genera un segundo vector descodificado formado por valores descodificados de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual sumando los elementos del vector de corrección descodificado y al menos los elementos de órdenes correspondientes del vector diferencial descodificado, en el que la unidad de descodificación no predictiva está adaptada para generar el segundo vector descodificado si (A) un índice Q proporcional a la altura de un pico -la altura del valle de una envolvente espectral es, la envolvente espectral correspondiente a una secuencia de coeficientes que son convertibles en coeficientes de predicción lineal, es mayor o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q ' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual que un valor de umbral predeterminado Th1'.
Para resolver el problema descrito anteriormente, según otro aspecto de la presente invención, un dispositivo de descodificación de señales de sonido incluye: una unidad de descodificación predictiva que está adaptada para obtener un vector diferencial descodificado mediante la descodificación de un primer código y generar un primer vector descodificado formado por valores descodificados de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción formado por al menos una predicción basada en una trama pasada y un vector predeterminado; y una unidad de descodificación no predictiva que está adaptada para obtener un vector de corrección descodificado al descodificar un segundo código y generar un segundo vector descodificado formado por valores descodificados de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual sumando, al vector de corrección descodificado, al menos el vector diferencial descodificado y un vector predeterminado para cada uno de los elementos de órdenes correspondientes, donde la unidad de descodificación no predictiva está adaptada para generar el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, la envolvente espectral correspondiente a una secuencia de coeficientes que se pueden convertir en coeficientes de predicción lineal, es mayor o igual a un valor de umbral predeterminado Th 1 y/o (B) un índice Q ' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual que un valor de umbral predeterminado Th1'.
Para solucionar el problema descrito anteriormente, según otro ejemplo que no está incluido en las reivindicaciones pero que es útil para entender la presente invención, un método de codificación incluye: un paso de codificación predictiva de obtención de un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual y un vector de predicción que contiene al menos un vector pronosticado a partir de una trama pasada, y obtención de un vector diferencial de cuantificación correspondiente al primer código; y un paso de codificación no predictiva de generación de un segundo código codificando un vector de corrección que está formado por diferenciales entre el vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual y el vector diferencial de cuantificación o formado por algunos de los elementos de los diferenciales.
Para resolver el problema descrito anteriormente, según otro ejemplo que no está incluido en las reivindicaciones pero que es útil para entender la presente invención, un método de codificación incluye: un paso de codificación predictiva de obtención de un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual y un vector de predicción formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y obtención de un vector diferencial de cuantificación correspondiente al primer código; y un paso de codificación no predictiva de generación de un segundo código codificando un vector de corrección qué está formado por diferenciales obtenidos restando el vector diferencial de cuantificación y el vector predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual o formado por algunos de los elementos de los diferenciales.
Para resolver el problema descrito anteriormente, según otro aspecto de la presente invención, un método de descodificación de señales de sonido incluye: un paso de descodificación predictiva para obtener un vector diferencial descodificado mediante la descodificación de un primer código y la generación de un primer vector descodificado formado por valores de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada; y un paso de descodificación no predictiva para obtener un vector de corrección descodificado descodificando un segundo código y generando un segundo vector descodificado formado por valores descodificados de los coeficientes que se pueden convertir en los coeficientes de predicción lineal de más de un orden de la trama actual sumando elementos del vector de corrección descodificado y al menos los elementos de órdenes correspondientes del vector diferencial descodificado, en donde
el paso de descodificación no predictiva genera el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, la envolvente espectral corresponde a una secuencia de coeficientes que se pueden convertir en los coeficientes de predicción lineal, es mayor que o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual que un valor de umbral predeterminado Th1'.
Para resolver el problema descrito anteriormente, según otro aspecto de la presente invención, un método de descodificación de señales de sonido incluye: un paso de descodificación predictiva para obtener un vector diferencial descodificado mediante la descodificación de un primer código y la generación de un primer vector descodificado formado por valores de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción formado por al menos una predicción basada en una trama pasado y un vector predeterminado; y un paso de descodificación no predictiva para obtener un vector de corrección descodificado descodificando un segundo código y generando un segundo vector descodificado formado por valores descodificados de los coeficientes que se pueden convertir en los coeficientes de predicción lineal de más de un orden de la presente actual sumando, al vector de corrección descodificado, al menos el vector diferencial descodificado y un vector predeterminado para cada uno de los elementos de órdenes correspondientes, donde
el paso de descodificación no predictiva genera el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, la envolvente espectral corresponde a una secuencia de coeficientes que se pueden convertir en la coeficientes de predicción lineal, es mayor que o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual a un valor de umbral predeterminado Th1'.
[EFEC TO S DE LA INVENCIÓN]
La presente invención produce el efecto de ser capaz de utilizar en combinación el método de codificación y método de descodificación predictivas que son un método de codificación y un método de descodificación que expresan de manera precisa coeficientes que son convertibles en coeficientes de predicción lineal con una cantidad de código pequeña y un método de codificación y un método de descodificación que pueden obtener correctamente, mediante descodificación, coeficientes que son convertibles en coeficientes de predicción lineal de la trama actual, incluso cuando un código de coeficientes de predicción lineal de una trama precedente no se introduce correctamente a un dispositivo de descodificación de coeficientes de predicción lineal, si se introduce correctamente un código de coeficientes de predicción lineal de la trama actual al dispositivo de descodificación de coeficientes de predicción lineal.
[BREV E DESCRIPCIÓN DE LOS DIBUJOS]
La Figura 1 es un diagrama que representa la configuración de un dispositivo de codificación de coeficientes de predicción lineal existente.
La Figura 2 es un diagrama que representa la configuración de un dispositivo de descodificación de coeficientes de predicción lineal existente.
La Figura 3 es un diagrama de bloques funcional de un dispositivo de codificación de coeficientes de predicción lineal de acuerdo con un primer ejemplo.
La Figura 4 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación de coeficientes de predicción lineal de acuerdo con el primer ejemplo.
La Figura 5 es un diagrama de bloques funcional de un dispositivo de descodificación de coeficientes de predicción lineal de acuerdo con el primer ejemplo.
La Figura 6 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de descodificación de coeficientes de predicción lineal de acuerdo con el primer ejemplo.
La Figura 7 es un diagrama de bloques funcional de un dispositivo de codificación de coeficientes de predicción lineal que es útil para comprender una primera realización.
La Figura 8 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación de coeficientes de predicción lineal que es útil para comprender las realizaciones primera y segunda.
La Figura 9 es un diagrama de bloques funcional de un dispositivo de descodificación de coeficientes de predicción lineal de acuerdo con la primera realización.
La Figura 10 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de descodificación de coeficientes de predicción lineal de acuerdo con las realizaciones primera y segunda. La Figura 11 es un diagrama de bloques funcional del dispositivo de codificación de coeficientes de predicción lineal que es útil para comprender la segunda realización.
La Figura 12 es un diagrama de bloques funcional del dispositivo de descodificación de coeficientes de predicción lineal de acuerdo con la segunda realización.
La Figura 13 es un diagrama de bloques funcional de un dispositivo de codificación de acuerdo con la tercera realización.
La Figura 14 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación de acuerdo con la tercera realización.
[DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES]
En adelante, se describirán ejemplos y realizaciones de la presente invención. Por otro lado, en los dibujos que se utilizan en la siguiente descripción, los elementos componentes que tienen la misma función y pasos en los que se realiza el mismo procesamiento se identifican con los mismos caracteres y se omitirán las explicaciones superpuestas. En la siguiente descripción, se supone que los símbolos tales como “A”, “~”, y utilizados en este texto se escriben inmediatamente encima de las letras que siguen inmediatamente a estos símbolos, pero, debido a una restricción impuesta por la notación de texto, se han escrito inmediatamente antes de las letras. En las fórmulas, estos símbolos están escritos en sus posiciones apropiadas. Además, se supone que el procesamiento que se realiza para cada elemento de los elementos de un vector y una matriz se aplica a todos los elementos del vector y la matriz a menos que se especifique lo contrario.
<Primer ejemplo>
El primer ejemplo es un ejemplo que no está incluido en las reivindicaciones pero que es útil para entender la presente invención.
En adelante, se describirán principalmente las diferencias entre el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de descodificación de coeficientes de predicción lineal existentes.
<Dispositivo 100 de codificación de coeficientes de predicción línea de acuerdo con el primer ejemplo>
La Figura 3 representa un diagrama de bloques funcional de un dispositivo 100 de codificación de coeficientes de predicción lineal de acuerdo con el primer ejemplo, y la Figura 4 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 100 de codificación de coeficientes de predicción lineal incluye una unidad 81 de análisis de predicción lineal, una unidad 82 de cálculo LSP , una unidad 120 de codificación predictiva, y una unidad 110 de codificación no predictiva. El procesamiento que se realiza en la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP es el mismo que el descrito en la tecnología existente y corresponde a s81 y s82 de la Figura 4.
El dispositivo 100 de codificación de coeficientes de predicción lineal recibe una señal de sonido Xf, obtiene un código LSP Cf y un código LSP de corrección Df, y emite el código LSP Cf y el código LSP de corrección Df. Los códigos emitidos desde el dispositivo 100 de codificación de coeficientes de predicción lineal se introducen a un dispositivo 200 de descodificación de coeficientes de predicción lineal. Por otro lado, si un vector 0f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP derivado de la señal de sonido Xf es generado por otro dispositivo y la entrada del dispositivo 100 de codificación de coeficientes de predicción lineal es el vector 0f de parámetros LSP , el dispositivo 100 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP .
<Unidad 120 de codificación predictiva>
La unidad 120 de codificación predictiva incluye una unidad 83 de resta predictiva, una unidad 84 de codificación vectorial, un libro de códigos 86 de vectores, y una unidad 87 de entrada de retardo, y el procesamiento que se realiza en cada unidad es el mismo que el descrito en la tecnología existente. El procesamiento que se realiza en la unidad 83 de resta predictiva, la unidad 84 de codificación vectorial, y la unidad 87 de entrada de retardo corresponde a s83 a s87, respectivamente, de la Figura 4. Sin embargo, la unidad 84 de codificación vectorial emite el vector ASf diferencial de cuantificación no solo a la unidad 87 de entrada de retardo, sino también a la unidad 110 de codificación no predictiva.
La unidad 120 de codificación predictiva recibe el vector 0f de parámetros LSP , codifica un vector Sf diferencial formado por diferenciales entre el vector 0f de parámetros LSP y un vector de predicción que contiene al menos una predicción basada en una trama pasada, obtiene un código LSP Cf y un vector ASf diferencial de cuantificación correspondiente al código LSP Cf (s120), y emite el código LSP Cf y el vector ASf diferencial de cuantificación. Por otro lado, el vector ASf diferencial de cuantificación correspondiente al código LSP Cf es un vector formado por valores de cuantificación correspondientes a los valores de los elementos del vector diferencial Sf.
Aquí, el vector de predicción que contiene al menos una predicción basada en una trama pasada es, por ejemplo, un vector V+axASf-1 obtenido sumando un vector V de media predictiva predeterminado y un vector obtenido multiplicando cada elemento de un vector asm diferencial de cuantificación (un vector diferencial de cuantificación de la trama precedente) de la trama inmediatamente precedente por a predeterminado. En este ejemplo, el vector que representa una predicción basada en una trama pasada, la predicción contenida en el vector de predicción, es axASf-1 que es a veces tan largo como el vector ASf-1 diferencial de cuantificación de la trama precedente.
Por otro lado, dado que la unidad 120 de codificación predictiva no necesita ninguna entrada desde el exterior aparte del vector 0 f de parámetros LSP , puede decirse que la unidad 120 de codificación predictiva obtiene el código LSP C f codificando el vector 0 f de parámetros LSP .
Además, aunque no se genere un vector A0 f de parámetros LSP de cuantificación predictivos en la unidad 120 de codificación predictiva, puede decirse que el vector A0f de parámetros LSP de cuantificación predictivos obtenidos cuantificando los elementos del vector 0 f de parámetros LSP en la unidad 120 de codificación predictiva es lo que se obtiene sumando el vector V+axASf-1 de predicción al vector ASf diferencial de cuantificación. Es decir, el vector de parámetros LSP de cuantificación predictivos es A0f = ASf+V+ axASf-1. Además, un vector de error de cuantificación en la unidad 120 de codificación predictiva es 0 f-A0f = 0 f(ASf+V+ axASf-1).
<Unidad 110 de codificación no predictiva>
La unidad 110 de codificación o predictiva incluye una unidad 111 de resta no predictiva, una unidad 112 de codificación vectorial de corrección, y un libro de códigos 113 de vectores de corrección.
La unidad 110 de codificación no predictiva recibe el vector 0 f de parámetros LSP y el vector ASf diferencial de cuantificación, y obtiene un código LSP de corrección Df codificando un vector de corrección que es un diferencial entre el vector 0 f de parámetros LSP y el vector ASf diferencial de cuantificación y emite el código LSP de corrección Df (s110).
Aquí, dado que el vector de corrección es 0 f-ASf y el vector de error de cuantificación de la unidad 120 de codificación predictiva es 0 f-A0f = 0 f-(ASf+V+ axASf-1), el vector de corrección es lo que se obtiene sumando el vector 0 f-A0f de error de cuantificación de la unidad 120 de codificación predictiva, el vector V de media predictiva, y axASf-1 que es el vector diferencial de cuantificación de la trama precedente multiplicado por a. Es decir, puede decirse que la unidad 110 de codificación no predictiva obtiene el código LSP de corrección Df codificando lo que se obtiene sumando el vector 0 f-A0f de error de cuantificación y el vector V+axASf-1 de predicción.
Se puede utilizar cualquiera de los métodos de codificación bien conocidos para codificar el vector 0 f-ASf de corrección; en la siguiente descripción, se describirá un método de cuantificación vectorial que se obtiene restando un vector Y de media no predictiva del vector 0 f-ASf de corrección. Por otro lado, en la siguiente descripción, Uf = 0 f-Y-ASf que es un vector obtenido restando el vector Y de media no predictiva del vector 0 f-ASf de corrección se denomina como un vector de corrección con fines descriptivos.
En adelante, se describirá el procesamiento de cada unidad
<Unidad 111 de resta no predictiva>
La unidad 111 de resta no predictiva está formada por, por ejemplo, un almacenamiento 111c que almacena el vector Y de media no predictiva y las unidades 111a y 111b de resta.
La unidad 111 de resta no predictiva recibe el vector 0 f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP emitido desde la unidad 82 de cálculo LSP y el vector ASf diferencial de cuantificación.
La unidad 111 de resta no predictiva genera un vector Uf = 0 f-Y-ASf de corrección que es un vector obtenido restando el vector ASf = (Asf[1], Asf [2], ..., Asf[p])T diferencial de cuantificación y el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva del vector 0 f = (0f[1 ], 0f[2], ..., 0f[p])T de parámetros LSP (s111), y emite el vector Uf de corrección.
Por otro lado, en la Figura 3, utilizando las dos unidades 111a y 111b de resta, en primer lugar, después de que el vector Y de media no predictiva almacenado en el almacenamiento 111c sea restado del vector 0 f de parámetros LSP en la unidad 111a de resta, el vector ASf diferencial de cuantificación se resta en la unidad 111b de resta, pero estas restas se pueden realizar a la inversa. Alternativamente, el vector Uf de corrección se puede generar restando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial de cuantificación del vector 0 f de parámetros LSP .
Por otro lado, el vector Y de media no predictiva es un vector predeterminado y simplemente tiene que ser obtenido por adelantado a partir de, por ejemplo, una señal de sonido para el aprendizaje. Por ejemplo, en el dispositivo 100 de codificación de coeficientes de predicción lineal correspondiente, utilizando una señal de sonido captada en el mismo entorno (por ejemplo, el mismo altavoz, dispositivo de captación de sonido, y lugar) que la señal de sonido a ser codificada como una señal de sonido de entrada para el aprendizaje, se obtienen los diferenciales entre los vectores de parámetros LSP y los vectores diferenciales de cuantificación para los vectores de parámetros LSP de muchas tramas, y se utiliza el promedio de los diferenciales como el vector de media no predictiva.
<Libro de códigos 113 de vectores de corrección>
En el libro de códigos 113 de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos.
<Unidad 112 de codificación vectorial de corrección>
La unidad 112 de codificación vectorial de corrección recibe el vector Uf de corrección, codifica el vector Uf de corrección, obtiene el código LSP de corrección Df (s112), y emite el código LSP de corrección Df. Por ejemplo, la unidad 112 de codificación vectorial de corrección busca un vector de corrección candidato más cercano al vector Uf de corrección a partir de la pluralidad de vectores de corrección candidatos almacenados en el libro de códigos 113 de vectores de corrección y emite el código vectorial de corrección correspondiente a ese vector de corrección candidato como el código LSP de corrección Df. Por otro lado, aunque la generación real del mismo no tiene que ser realizada en la unidad 112 de codificación vectorial de corrección, la siguiente descripción se dará en el supuesto de que un vector de corrección candidato más cercano al vector Uf de corrección es un vector AUf de corrección cuantificado.
Por otro lado, como se describió anteriormente, dado que el vector de corrección contiene al menos el vector ASf-1 diferencial de cuantificación de la trama precedente que es la predicción de la unidad 120 de codificación predictiva basada en la trama precedente, puede decirse que la unidad 112 de codificación vectorial de corrección codifica al menos la predicción de la unidad 120 de codificación predictiva en base a la trama precedente.
Además, aunque la generación del mismo no tiene que ser realizada en la unidad 110 de codificación no predictiva, un vector A0f de parámetros LSP de cuantificación no predictivos obtenido cuantificando los elementos del vector 0f de parámetros LSP en la unidad 110 de codificación no predictiva es lo que se obtiene sumando el vector Y de media no predictiva, el vector a& diferencial de cuantificación, y el vector AUf de corrección cuantificado. Es decir, A0f = AUf+Y+ASf se mantiene.
<Dispositivo 200 de descodificación de coeficientes de predicción lineal de acuerdo con el primer ejemplo>
En adelante, se describirán principalmente las diferencias con el ejemplo existente.
La Figura 5 representa un diagrama de bloques funcional del dispositivo 200 de descodificación de coeficientes de predicción lineal según el primer ejemplo, y la Figura 6 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 200 de descodificación de coeficientes de predicción lineal incluye una unidad 220 de descodificación predictiva y una unidad 210 de descodificación no predictiva.
El dispositivo 200 de descodificación de coeficientes de predicción lineal recibe el código LSP Cf y el código LSP de corrección Df, genera un vector A0f= (A0f[1], A0f[2], ..., A0f[pj) de parámetros LSP predictivos descodificados y un vector A0f = (A f^[1], â ] , ..., A^[p]) de parámetros LSP no predictivos descodificados, y emite el vector A0f de parámetros LSP predictivos descodificados y el vector A0f de parámetros LSP no predictivos descodificados. Además, cuando sea necesario, el dispositivo 200 de descodificación de coeficientes de predicción lineal genera coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos descodificados y coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos descodificados que se obtienen convirtiendo los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos descodificados y los parámetros â [1], â [2], ..., A^[p] LSP no predictivos descodificados respectivamente en coeficientes de predicción lineal, y emite los coeficientes Aaf[1], Aaf[2], ...,Aaf[p] de predicción lineal predictivos descodificados y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos descodificados.
<Unidad 220 de descodificación predictiva>
La unidad 220 de descodificación predictiva tiene una configuración similar a la del dispositivo 90 de descodificación de coeficientes de predicción lineal de la tecnología existente, y la unidad 220 de descodificación predictiva incluye un libro de códigos 92 de vectores, una unidad 91 de descodificación vectorial, una unidad 93 de entrada de retardo, y una unidad 95 de suma predictiva y, cuando sea necesario, también incluye una unidad 96 de cálculo de coeficientes de predicción lineal predictivos descodificados. El procesamiento que se realiza en la unidad 91 de descodificación vectorial, la unidad 93 de entrada de retardo, la unidad 95 de suma predictiva, y la unidad 96 de cálculo de coeficientes de predicción lineal predictivos descodificados corresponde a s91 a s96 respectivamente, de la Figura 6.
La unidad 220 de descodificación predictiva recibe el código LSP Cf, obtiene un vector ASf diferencial descodificado descodificando el código LSP Cf, genera un vector A0f = (A0f[1], A0f[2], ..., A0f[p]) de parámetros LSP predictivos descodificados formado por los valores A0f[1], A0f[2], ..., A0f[p] descodificados de los elementos del vector de parámetros LSP sumando el vector ASf diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada (s220), y emite el vector A0f de parámetros LSP predictivos descodificados. Cuando sea necesario, la unidad 220 de descodificación predictiva convierte además el vector A0f de parámetros LSP predictivos descodificados en coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos descodificados (s220) y emite los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos descodificados.
En el presente ejemplo, el vector de predicción es un vector (V+ axASf-1) obtenido sumando el vector V de media predictiva predeterminado y lo que se obtiene multiplicando el vector ASf-1 diferencial descodificado de una trama pasada por un factor de a.
Por otro lado, la unidad 91 de descodificación vectorial emite el vector AS f diferencial descodificado también a una unidad 213 de suma no predictiva de la unidad 210 de descodificación no predictiva además de la unidad 93 de entrada de retardo y la unidad 95 de suma predictiva.
<Unidad 210 de descodificación no predictiva>
La unidad 210 de descodificación no predictiva incluye un libro de códigos 212 de vectores de corrección, una unidad 211 de descodificación vectorial de corrección, y la unidad 213 de suma no predictiva y, cuando sea necesario, también incluye una unidad 214 de cálculo de coeficientes de predicción lineal no predictivos descodificados.
A la unidad 210 de descodificación no predictiva, se introducen el código LSP de corrección Df y el vector ASf diferencial descodificado. La unidad 210 de descodificación no predictiva obtiene un vector AUf = (Auf[1], Auf[2], ..., Auf[p])T de corrección descodificado el código LSP de corrección Df . La unidad 210 de descodificación no predictiva genera además un vector A0f = (â [1], â [2], ..., A^[p]) de parámetros LSP no predictivos descodificados formado por valores A^ f[1], a9 ,[2], ..., A^ f[p] descodificados de los elementos del vector de parámetros LSP de la trama actual sumando al menos el vector ASf diferencial descodificado al vector AUf de corrección descodificado (s210) y emite el vector A0f de parámetros LSP no predictivos descodificados. Cuando sea necesario, la unidad 210 de descodificación no predictiva convierte además el vector A0f de parámetros LSP no predictivos descodificados en coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos descodificados (s210) y emite los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos descodificados.
En el presente ejemplo, el vector A0f de parámetros LSP no predictivos descodificados es un vector obtenido sumando el vector ASf diferencial descodificado obtenido descodificando el código LSP C f y el vector Y de media no predictiva predeterminado al vector AUf de corrección descodificado obtenido descodificando el código LSP de corrección Df . Es decir, en la unidad 210 de descodificación no predictiva, el vector A0f descodificado del vector de parámetros LSP de la trama actual se obtiene solamente a partir de los códigos introducidos en la trama actual.
En adelante, se describirán los detalles de procesamiento de cada unidad.
<Libro de códigos 212 de vectores de corrección>
El libro de códigos 212 de vectores de corrección almacena la información con el mismo contenido que el del libro de códigos 113 de vectores de corrección en el dispositivo 100 de codificación de coeficientes de predicción lineal. Es decir, en el libro de códigos 212 de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos.
<Unidad 211 de descodificación vectorial de corrección>
La unidad 211 de descodificación vectorial de corrección recibe el código LSP de corrección Df , obtiene el vector AUf de corrección descodificado descodificando el código LSP de corrección Df (s211), y emite el vector AUf de corrección descodificado. Por ejemplo, la unidad 211 de descodificación vectorial de corrección busca un código vectorial de corrección correspondiente al código LSP de corrección Df introducido al dispositivo 200 de descodificación de coeficientes de predicción lineal a partir de la pluralidad de códigos vectoriales de corrección almacenados en el libro de códigos 212 de vectores de corrección y emite un vector de corrección candidato correspondiente al código vectorial de corrección obtenido por la búsqueda como el vector AUf de corrección descodificado.
<Unidad 213 de suma no predictiva>
La unidad 213 de suma no predictiva está formada por, por ejemplo, un almacenamiento 213c que almacena un vector Y de media no predictiva y unidades 213a y 213b de suma.
La unidad 213 de suma no predictiva recibe el vector AUf de corrección descodificado y el vector ASf diferencial descodificado. La unidad 213 de suma no predictiva genera un vector A0f = AUf+Y+ASf = (â [1], â [2], ..., A^[p]) de parámetros LSP no predictivos descodificados obtenido sumando el vector AUf de corrección descodificado, el vector ASf diferencial descodificado, y el vector Y de media no predictiva almacenados en el almacenamiento 213c (s213) y emite el vector A0f de parámetros LSP no predictivos descodificados. Por otro lado, en la Figura 5, utilizando las dos unidades 213a y 213b de suma, en primer lugar, después de que el vector ASf diferencial descodificado sea sumado al vector AUf de corrección descodificado en la unidad 213a de suma, el vector Y de media no predictiva almacenado en el almacenamiento 213c se suma en la unidad 213b de suma, pero estas sumas se pueden realizar a la inversa. Alternativamente, el vector A0f de parámetros LSP no predictivos descodificados se puede generar sumando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial descodificado al vector AUf de corrección descodificado.
Por otro lado, se supone que el vector Y de media no predictiva utilizado aquí es el mismo que el vector Y de media no predictiva utilizado en la unidad 111 de resta no predictiva del dispositivo 100 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 214 de cálculo de coeficientes de predicción lineal no predictivos descodificados>
La unidad 214 de cálculo de coeficientes de predicción lineal no predictivos descodificados recibe el vector A0f de parámetros LSP no predictivos descodificados. La unidad 214 de cálculo de coeficientes de predicción lineal no
predictivos descodificados convierte el vector AOf de parámetros LSP no predictivos descodificados en coeficientes Abf[1], Abf[2], Abf[p] (s214) de predicción lineal no predictivos descodificados y emite los coeficientes Abf[1], Abf[2], Abf[p] de predicción lineal no predictivos descodificados.
<Efecto del primer ejemplo>
Con el dispositivo de descodificación de coeficientes de predicción lineal del primer ejemplo, incluso cuando el vector ASf-1 diferencial descodificado no se puede descodificar correctamente debido a un error de transmisión ocurrido en un código LSP C f -1 de una f-1-ésima trama, dado que el vector AOf de parámetros LSP no predictivos descodificados que es un valor descodificado del vector de parámetros LSP que no depende del vector ASf-1 diferencial descodificado se obtiene en la unidad 210 de descodificación no predictiva, es posible evitar que el error de transmisión en el código LSP C f -1 de la f-1-ésima trama afecte al vector AOf de parámetros LSP no predictivos descodificados de una f-ésima trama. Por ejemplo, cuando el vector de parámetros LSP de cuantificación no predictivos/vector AOf de parámetros LSP no predictivos descodificados se utiliza como un vector de parámetros LSP que se utiliza en la codificación/descodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de un vector de parámetros LSP , incluso cuando no se puede obtener un vector AOf de parámetros LSP no predictivos descodificados correcto en la f-1-ésima trama y no se puede realizar correctamente la descodificación de longitud variable, se obtiene un vector AOf de parámetros LSP no predictivos descodificados correcto en la f-ésima trama y se puede realizar correctamente la descodificación de longitud variable.
Por otro lado, dado que el vector de corrección no tiene que ser cuantificado de manera precisa hasta tal punto que el vector de parámetros LSP se cuantifica (de tal manera que un error de cuantificación se vuelve menor), el número de tipos de vectores de corrección candidatos preparados en el libro de códigos 113 de vectores de corrección puede ser pequeño. Por ejemplo, la longitud de bit del código vectorial de corrección es 2-bits, y, en el libro de códigos 113 de vectores de corrección, se almacenan cuatro tipos de vectores de corrección candidatos correspondientes a cuatro tipos de códigos vectoriales de corrección ("00" "01" "10" "11").
Esto hace posible reducir el número de tipos de vectores de corrección candidatos preparados en el libro de códigos de vectores de corrección y de este modo asignar un código con una cantidad de código pequeña. Como resultado, con un aumento en una cantidad de código pequeña, es posible implementar la codificación y descodificación en las que ocurre menos distorsión que en el ejemplo existente.
<Modificación>
En el presente ejemplo, se describen los parámetros LSP , pero se pueden utilizar otros coeficientes siempre que los coeficientes sean coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden. Lo anterior se puede aplicar a coeficientes PARCOR, coeficientes obtenidos transformando los parámetros LSP o los coeficientes PARCOR, y los propios coeficientes de predicción lineal. Todos estos coeficientes se pueden convertir entre sí en el campo técnico de la codificación de habla, y el efecto del primer ejemplo se puede obtener utilizando cualquiera de estos coeficientes. Por otro lado, el código LSP C f o un código correspondiente al código LSP C f también se denomina como un primer código y la unidad de codificación predictiva también se denomina como una primera unidad de codificación. Similarmente, el código LSP de corrección o un código correspondiente al código LSP de corrección también se denomina como un segundo código y la unidad de codificación no predictiva también se denomina como una segunda unidad de codificación. Además, el vector A©f de parámetros LSP predictivos descodificados o un vector correspondiente al vector A0f de parámetros LSP predictivos descodificados también se denomina como un primer vector descodificado y la unidad de descodificación predictiva también se denomina como una primera unidad de descodificación. Además, el vector AOf de parámetros LSP no predictivos descodificados o un vector correspondiente al vector AOf de parámetros LSP no predictivos descodificados también se denomina como un segundo vector descodificado y la unidad de descodificación no predictiva también se denomina como una segunda unidad de descodificación.
En el presente ejemplo, solamente se utiliza una trama como una “trama pasada”, pero, si es necesario, se pueden utilizar dos tramas o más como sea apropiado.
<Primera realización>
Se describirán principalmente las diferencias con el primer ejemplo.
En la presente realización, se determina si codificar o no un vector de corrección y descodificar un código LSP de corrección utilizando la magnitud de un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral, en otras palabras, la altura de pico a valle de la envolvente espectral.
Si los parámetros LSP se codifican mediante la misma cantidad de código independientemente de la magnitud de un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral, un error de cuantificación observado cuando un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral es grande es mayor que un error de cuantificación observado cuando un cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral es pequeño. Por tanto, un dispositivo de codificación de coeficientes de predicción lineal ejecuta la unidad de codificación vectorial de corrección solo cuando se considera que un error de
cuantificación en LSP es grande y emite un código LSP de corrección Df y un dispositivo de descodificación de coeficientes de predicción lineal descodifica el código LSP de corrección Df , por lo que es posible realizar procesamiento de codificación y descodificación que sufra menos reducción en la calidad de sonido causada por un error de transmisión en un código que en la tecnología existente mientras se reduce la cantidad de código en su conjunto en comparación con el primer ejemplo.
<Dispositivo 300 de codificación de coeficientes de predicción lineal>
La Figura 7 representa un diagrama de bloques funcional de un dispositivo 300 de codificación de coeficientes de predicción lineal que no está incluido en las reivindicaciones pero que es útil para entender la primera realización, y la Figura 8 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 300 de codificación de coeficientes de predicción lineal de la primer realización incluye una unidad 310 de codificación no predictiva en lugar de la unidad 110 de codificación no predictiva. Como es el caso con el dispositivo 100 de codificación de coeficientes de predicción lineal descrito en el contexto del primer ejemplo, si los parámetros 0 LSP derivados de una señal X f de sonido son generados por otro dispositivo y la entrada del dispositivo 300 de codificación de coeficientes de predicción lineal es los parámetros LSP 0f[1], 0f [2], ..., 0f[p], el dispositivo 300 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP .
La unidad 310 de codificación no predictiva incluye una unidad 311 de resta no predictiva, una unidad 312 de codificación vectorial de corrección, el libro de códigos 113 de vectores de corrección, una unidad 314 de suma predictiva, y una unidad 315 de cálculo de índice. La diferencia radica en que se determina si se realiza o no procesamiento de resta en la unidad 311 de resta no predictiva y si se realiza o no procesamiento de codificación en la unidad 312 de codificación vectorial de corrección en función del resultado de cálculo de la unidad 315 de cálculo de índice.
Por otro lado, la unidad 120 de codificación predictiva emite un vector axAS f-1, que es un valor de salida de la unidad 88 de multiplicación, además de un vector ASf diferencial de cuantificación.
<Unidad 314 de suma predictiva>
La unidad 314 de suma predictiva está formada por, por ejemplo, un almacenamiento 314c que almacena un vector V de media predictiva y unidades 314a y 314b de suma.
La unidad 314 de suma predictiva recibe el vector ASf diferencial de cuantificación de la trama actual y el vector axASf-1 obtenido multiplicando el vector asm diferencial de cuantificación de la trama precedente por un coeficiente a predeterminado.
La unidad 314 de suma predictiva genera un vector A©f (= ASf+V+ aASf-1) = (A0f[1], A0f[2], ..., A0f[p])T de parámetros LSP de cuantificación predictivos que es un vector obtenido sumando el vector ASf diferencial de cuantificación, el vector V de media predictiva, y el vector axASf-1 (s314) y emite el vector A©f de parámetros LSP de cuantificación predictivos.
En la Figura 7, utilizando las dos unidades 314a y 314b de suma, en primer lugar, después de que el vector axASf-1 sea sumado al vector ASf diferencial de cuantificación de la trama actual en la unidad 314b de suma, el vector V de media predictiva se suma en la unidad 314a de suma, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector A©f de parámetros LSP de cuantificación predictivos se puede generar sumando un vector obtenido sumando el vector axASf-1 y el vector V de media predictiva al vector ASf diferencial de cuantificación.
Por otro lado, dado que tanto el vector ASf diferencial de cuantificación de la trama actual como el vector axASf-1 obtenido multiplicando el vector asm diferencial de cuantificación de la trama precedente por el coeficiente a predeterminado, el vector ASf diferencial de cuantificación y el vector axASf-1 que se introducen a la unidad 314 de suma predictiva, se generan también en la unidad 120 de codificación predictiva y el vector V de media predictiva almacenado en el almacenamiento 314c en la unidad 314 de suma predictiva es el mismo que el vector V de media predictiva almacenado en el almacenamiento 83d en la unidad 120 de codificación predictiva, se puede adoptar una configuración en la que la unidad 120 de codificación predictiva genera el vector A©f de parámetros LSP de cuantificación predictivos realizando el procesamiento que es realizado por la unidad 314 de suma predictiva y emite el vector a© de parámetros LSP de cuantificación predictivos a la unidad 310 de codificación no predictiva y la unidad 314 de suma predictiva no se proporciona en la unidad 310 de codificación no predictiva.
<Unidad 315 de cálculo de índice>
La unidad 315 de cálculo de índice recibe el vector A©f de parámetros LSP de cuantificación predictivos. Utilizando el vector A©f de parámetros LSP de cuantificación predictivos, la unidad 315 de cálculo de índice calcula un índice Q proporcional a lo alta que sea la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral al vector a© de parámetros LSP de cuantificación predictivos, es decir, el índice Q que aumenta con un aumento en el pico a valle de la envolvente espectral y/o un índice Q’ proporcional a lo corta que sea la altura de pico a valle de la envolvente espectral, es decir, el índice Q’ que disminuye con un aumento en el pico a valle de la
envolvente espectral (s315). De acuerdo con la magnitud del índice Q y/o Q’, la unidad 315 de cálculo de índice emite una señal C de control a la unidad 312 de codificación vectorial de corrección de tal manera que la unidad 312 de codificación vectorial de corrección realiza el procesamiento de codificación o realiza el procesamiento de codificación utilizando un número de bits predeterminado. Además, de acuerdo con la magnitud del índice Q y/o Q’, la unidad 315 de cálculo de índice emite la señal C de control a la unidad 311 de resta no predictiva de tal manera que la unidad 311 de resta no predictiva realiza el procesamiento de resta. En adelante, se describirá un método de generación de la señal C de control.
En general, los parámetros LSP son una secuencia de parámetros en un dominio de frecuencia que tienen una correlación con una envolvente espectral de potencia de una señal de sonido de entrada, y cada valor de los parámetros LSP se correlaciona con la posición de frecuencia del valor de extremo de la envolvente espectral de potencia de la señal de sonido de entrada. Si se supone que los parámetros LSP son 0 [1], 0 [2], ..., 0 [p], el valor de extremo de la envolvente espectral de potencia está presente en la posición de frecuencia entre 0 [i] y 0 [i+1], y, cuanto más pronunciada sea la pendiente de una tangente alrededor de este valor de extremo, más estrecho se vuelve el intervalo (es decir, el valor de (0[i+1] - 0[i])) entre 0[i] y 0[i+1 ]. Es decir, cuanto mayor sea la diferencia de altura en las ondas de la amplitud de la envolvente espectral de potencia, más desigual se vuelve el intervalo entre 0 [i] y 0 [i+1] para cada i, es decir, mayor se vuelve la varianza de los intervalos entre los parámetros LSP ; a la inversa, si no hay casi ninguna diferencia de altura en las ondas de la envolvente espectral de potencia, más igual se vuelve el intervalo entre 0 [i] y 0 [i+1] y para cada i, es decir, menor se vuelve la varianza de los intervalos entre los parámetros LSP .
Por tanto, un índice grande correspondiente a la varianza de los intervalos entre los parámetros LSP significa un gran cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral de potencia. Además, un índice pequeño correspondiente al valor mínimo de los intervalos entre los parámetros LSP significa un gran cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral de potencia.
Dado que los parámetros A0 f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos son lo que se obtiene cuantificando los parámetros LSP 0f[1], 0f[2], ..., 0f[p] y, si el código LSP C f se introduce al dispositivo de descodificación predictivo lineal desde el dispositivo de codificación predictivo lineal sin error, los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos descodificados son los mismos que los parámetros A0f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos, los parámetros A0f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos y los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos descodificados también tienen las propiedades similares a las de los parámetros LSP 0f[1], 0f[2], ..., 0f[p].
Por tanto, un valor correspondiente a la varianza de los intervalos entre los parámetros A0f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos se puede utilizar como el índice Q que aumenta con un aumento en el pico a valle de una envolvente espectral, y el valor mínimo de los diferenciales (A0f[i+1] - A0f[i]) entre los parámetros LSP de cuantificación predictivos con órdenes adyacentes, los parámetros LSP de cuantificación predictivos del vector A0f = (A0f[1], A0f[2], ..., A0f[p]) de parámetros LSP de cuantificación predictivos, se pueden utilizar como el índice Q’ que disminuye con un aumento en el pico a valle de una envolvente espectral.
El índice Q que aumenta con un aumento en el pico a valle de una envolvente espectral se calcula mediante, por ejemplo, un índice Q que indica la varianza de los intervalos entre los parámetros LSP de cuantificación predictivos que son los elementos del vector A0f de parámetros LSP de cuantificación predictivos, teniendo cada uno un orden menor o igual que un orden T (T < p) predeterminado, es decir,
Además, el índice Q’ que disminuye con un aumento en el pico a valle de una envolvente espectral se calcula mediante, por ejemplo, un índice Q’ que indica el valor mínimo del intervalo entre los parámetros LSP de cuantificación predictivos con órdenes adyacentes, los parámetros LSP de cuantificación predictivos del vector A0f de parámetros LSP de cuantificación predictivos cuyo orden es menor o igual que un orden T (T < p) predeterminado, es decir,
Alternativamente, el índice Q’ se calcula mediante un índice Q’ que indica el valor mínimo del intervalo entre los parámetros LSP cuantificados de predicción con órdenes adyacentes, los parámetros LSP cuantificados de predicción del vector A0f de parámetros LSP de cuantificación predictivos, y el valor del parámetro LSP de cuantificación predictivo de orden más bajo:
Dado que los parámetros LSP son parámetros presentes entre 0 y n en secuencia de orden, el parámetro A0f[ l] LSP de cuantificación predictivo de orden más bajo en esta fórmula significa el intervalo (A0f[1] - 0) entre A0f[ l] y 0.
La unidad 315 de cálculo de índice emite, a la unidad 311 de resta no predictiva y la unidad 312 de codificación vectorial de corrección, la señal C de control que indica que se realiza el procesamiento de codificación de corrección si el pico a valle de la envolvente espectral está por encima de un estándar predeterminado, es decir, en el ejemplo descrito anteriormente, si (A-1) el índice Q es mayor o igual que un valor de umbral Th1 predeterminado y/o (B-1) el índice Q’ es menor o igual que un valor de umbral Th1 ’ predeterminado; de lo contrario, la unidad 315 de cálculo de índice emite, a la unidad 311 de resta no predictiva y la unidad 312 de codificación vectorial de corrección, la señal C de control que indica que no se realiza el procesamiento de codificación de corrección. Aquí, “en el caso de (A-1) y/o (B-1)” es una expresión que incluye los siguientes tres casos: un caso en el que solo se obtiene el índice Q y se satisface la condición (A-1), un caso en el que solo se obtiene el índice Q’ y se satisface la condición (B-1), y un caso en el que se obtienen tanto el índice Q como el índice Q’ y se satisfacen las condiciones (A-1) y (B-1). Huelga decir que, incluso cuando se hace una determinación en cuanto a si se satisface o no la condición (A-1), se puede obtener el índice Q’, y, incluso cuando se hace una determinación en cuanto a si se satisface o no la condición (B-1), se puede obtener el índice Q. Lo mismo ocurre con “y/o” en la siguiente descripción.
Además, la unidad 315 de cálculo de índice se puede configurar de tal manera que la unidad 315 de cálculo de índice emita un entero positivo (o un código que representa un entero positivo) que representa un número de bits predeterminado como la señal C de control en el caso de (A-1) y/o (B-1); de lo contrario, la unidad 315 de cálculo de índice emite 0 como la señal C de control.
Por otro lado, cuando la unidad 311 de resta no predictiva se configura para realizar procesamiento de resta si la unidad 311 de resta no predictiva recibe la señal C de control y la unidad 312 de codificación vectorial de corrección se configura para realizar procesamiento de codificación si la unidad 312 de codificación vectorial de corrección recibe la señal C de control, la unidad 315 de cálculo de índice se puede configurar para no emitir la señal C de control en casos distintos del caso (A-1) y/o (B-1).
<Unidad 311 de resta no predictiva>
La unidad 311 de resta no predictiva recibe la señal C de control, el vector 0 f= (0f[1 ], 0f[2], ..., 0f[p])T de parámetros LSP , y el vector ASf diferencial de cuantificación.
La unidad 311 de resta no predictiva recibe la señal C de control que indica que se realiza el procesamiento de codificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 311 de resta no predictiva genera un vector Uf = 0 f-Y-ASf de corrección que es un vector obtenido restando el vector ASf-1 diferencial de cuantificación y el vector = (y[1], y[2], ..., y[p])T de media no predictiva del vector 0 f = (0f[1 ], 0f[2], ..., 0f[p])T de parámetros LSP (s311) y emite el vector Uf de corrección.
<Unidad 312 de codificación vectorial de corrección>
La unidad 312 de codificación vectorial de corrección recibe la señal C de control y el vector Uf de corrección. Si la unidad 312 de codificación vectorial de corrección recibe la señal C de control que indica que se realiza el procesamiento de codificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 312 de
codificación vectorial de corrección obtiene un código LSP de corrección Df codificando el vector Uf de corrección (s312) y emite el código LSP de corrección Df . El propio procesamiento de codificación de la codificación del vector Uf de corrección es similar al realizado en la unidad 112 de codificación vectorial de corrección.
Si la unidad 312 de codificación vectorial de corrección recibe la señal C de control que indica que no se realiza el procesamiento de codificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 312 de codificación vectorial de corrección no realiza la codificación del vector Uf de corrección y no obtiene y emite un código LSP de corrección Df .
<Dispositivo 400 de descodificación de coeficientes de predicción línea de acuerdo con la primera realización> La Figura 9 representa un diagrama de bloques funcional de un dispositivo 400 de descodificación de coeficientes de predicción lineal de acuerdo con la primera realización, y la Figura 10 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 400 de descodificación de coeficientes de predicción lineal de la primera realización incluye una unidad 410 de descodificación no predictiva en lugar de la unidad 210 de descodificación no predictiva.
La unidad 410 de descodificación no predictiva incluye el libro de códigos 212 de vectores de corrección, una unidad 411 de descodificación vectorial de corrección, y una unidad 413 de suma no predictiva, y una unidad 415 de cálculo de índice y, cuando sea necesario, también incluye la unidad 214 de cálculo de coeficientes de predicción lineal no predictivos descodificados.
La diferencia radica en que se determina si se realiza o no procesamiento de suma en la unidad 413 de suma no predictiva y si se realiza o no procesamiento de descodificación en la unidad 411 de descodificación vectorial de corrección en función del resultado de cálculo de la unidad 415 de cálculo de índice.
<Unidad 415 de cálculo de índice>
La unidad 415 de cálculo de índice recibe el vector A0 f de parámetros LSP predictivos descodificados y calcula un índice Q proporcional a lo alta que sea la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral al vector A0 f = (A0 f[1], A0 f[2], ..., A0 f[p])T de parámetros LSP predictivos descodificados, es decir, el índice Q que aumenta con un aumento en el pico a valle de la envolvente espectral y/o un índice Q’ proporcional a lo corta que sea la altura de pico a valle de la envolvente espectral, es decir, el índice Q’ que disminuye con un aumento en el pico a valle de la envolvente espectral (s415). De acuerdo con la magnitud del índice Q y/o Q’, la unidad 415 de cálculo de índice emite, a la unidad 411 de descodificación vectorial de corrección y la unidad 413 de suma no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de descodificación de corrección o una señal C de control que indica que se realiza el procesamiento de descodificación de corrección utilizando un número de bits predeterminado. Los índices Q y Q’ son similares a los de la descripción de la unidad 315 de cálculo de índice y simplemente tienen que ser calculados de manera similar a la utilizada en la unidad 315 de cálculo de índice utilizando el vector A0 de parámetros LSP predictivos descodificados en lugar del vector A0 f de parámetros LSP de cuantificación predictivos.
La unidad 415 de cálculo de índice emite, a la unidad 413 de suma no predictiva y la unidad 411 de descodificación vectorial de corrección, la señal C de control que indica que se realiza el procesamiento de descodificación de corrección si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, si (A-1) el índice Q es mayor o igual que el valor de umbral Th1 predeterminado y/o (B-1) el índice Q’ es menor o igual que el valor de umbral Th1 ’ predeterminado; de lo contrario, la unidad 415 de cálculo de índice emite, a la unidad 413 de suma no predictiva y la unidad 411 de descodificación vectorial de corrección, la señal C de control que indica que no se realiza el procesamiento de descodificación de corrección.
Además, la unidad 415 de cálculo de índice se puede configurar de tal manera que la unidad 415 de cálculo de índice emita un entero positivo (o un código que representa un entero positivo) que representa un número de bits predeterminado como la señal C de control en el caso de (A-1) y/o (B-1); de lo contrario, la unidad 415 de cálculo de índice emite 0 como la señal C de control.
Por otro lado, cuando la unidad 411 de descodificación vectorial de corrección y la unidad 413 de suma no predictiva se configuran para determinar la realización del procesamiento de descodificación de corrección si la unidad 411 de descodificación vectorial de corrección y la unidad 413 de suma no predictiva recibe la señal C de control, la unidad 415 de cálculo de índice se puede configurar para no emitir la señal C de control en casos distintos del caso (A-1) y/o (B-1).
<Unidad 411 de descodificación vectorial de corrección>
La unidad 411 de descodificación vectorial de corrección recibe el código LSP de corrección Df y la señal C de control. Si la unidad 411 de descodificación vectorial de corrección recibe la señal C de control que indica que se realiza el procesamiento de descodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar
predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 411 de descodificación vectorial de corrección obtiene un vector Aü f de corrección descodificado descodificando el código LSP de corrección Df haciendo referencia al libro de códigos 212 de vectores de corrección (s411) y emite el vector Aüf de corrección descodificado. El propio procesamiento de descodificación de descodificación del código LSP de corrección Df es similar al realizado en la unidad 211 de descodificación vectorial de corrección.
Si la unidad 411 de descodificación vectorial de corrección recibe la señal C de control que indica que no se realiza el procesamiento de descodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 411 de descodificación vectorial de corrección no realiza descodificación del código LSP de corrección Df y no obtiene y emite un vector Aüf de corrección descodificado.
<Unidad 413 de suma no predictiva>
La unidad 413 de suma no predictiva está formada por, por ejemplo, un almacenamiento 413c que almacena un vector Y de media no predictiva y unidades 413a y 413b de suma.
La unidad 413 de suma no predictiva recibe la señal C de control y el vector ASf diferencial descodificado. Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que se realiza el procesamiento de descodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, en el caso de (A-1) y/o (B-1), la unidad 413 de suma no predictiva recibe además el vector Aüf de corrección descodificado. Luego, la unidad 413 de suma no predictiva genera un vector A0f = AUf+Y+ASf de parámetros LSP no predictivos descodificados obtenido sumando el vector ASf diferencial descodificado y el vector Y de media no predictiva almacenado en el almacenamiento 413c al vector Aüf de corrección descodificado (s413) y emite el vector A0f de parámetros LSP no predictivos descodificados. Por otro lado, en la Figura 9, utilizando las dos unidades 413a y 413b de suma, en primer lugar, después de que el vector ASf diferencial descodificado sea sumado al vector Aüf de corrección descodificado en la unidad 413a de suma, el vector Y de media no predictiva almacenado en el almacenamiento 413c se suma en la unidad 413b de suma, pero estas sumas se pueden realizar a la inversa. Alternativamente, el vector A0f de parámetros LSP no predictivos descodificados se puede generar sumando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial descodificado al vector Aüf de corrección descodificado.
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que no se realiza el procesamiento de descodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), es decir, si la unidad 413 de suma no predictiva no recibe el vector Aüf de corrección descodificado, la unidad 413 de suma no predictiva genera un vector A0f = Y+ASf(s413) de parámetros LSP no predictivos descodificados y emite el vector A0f de parámetros LSP no predictivos descodificados.
Por otro lado, se supone que el vector Y de media no predictiva utilizado aquí es el mismo que el vector Y de media no predictiva utilizado en la unidad 311 de resta no predictiva del dispositivo 300 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Efecto de la primera realización>
Con tal configuración, además de evitar que un error de transmisión en un código LSP C f-1 de una f-1-ésima trama afecte al vector A0f de parámetros LSP no predictivos descodificados de una f-ésima trama, es posible obtener un vector A0f de parámetros LSP no predictivos descodificados que contiene errores de cuantificación reducidos sumando, al vector Y de media no predictiva y el vector ASf diferencial descodificado, del vector Aüf de corrección descodificado obtenido descodificando el código LSP de corrección Df si la altura de pico a valle de una envolvente espectral es alta y reducir la cantidad de código en una cantidad correspondiente al código LSP de corrección Df utilizando, como el vector A0f de parámetros LSP no predictivos descodificados, lo que se obtiene sumando el vector Y de media no predictiva y el vector ASf diferencial descodificado, que no necesita el código LSP de corrección Df , si la altura de pico a valle de una envolvente espectral no es alta. Es decir, es posible realizar el procesamiento de codificación y descodificación que sufre menos reducción en la calidad de sonido causada por un error de transmisión en un código de la trama precedente que en la tecnología existente mientras se reduce la cantidad de código en su conjunto en comparación con la codificación y descodificación del primer ejemplo.
<Modificación>
Como ya se ha explicado en la modificación del primer ejemplo, en lugar de los parámetros LSP , se pueden utilizar otros coeficientes siempre que los coeficientes sean coeficientes que son convertibles en coeficientes de predicción lineal. Lo anterior se puede aplicar a coeficientes PARCOR, coeficientes obtenidos transformando cualquiera de los parámetros LSP y los coeficientes PARCOR, y los propios coeficientes de predicción lineal. En adelante, se describirá un caso en el que se utilizan coeficientes PARCOR kf[1], kf[2], ..., kf[p].
Se sabe que cuanto mayor sea la altura de pico a valle de una envolvente espectral correspondiente a un vector 0 f de parámetros LSP , menor se vuelve un valor de
determinado por un coeficiente PARCOR. Por tanto, cuando se utilizan los coeficientes PARCOR, la unidad 315 de cálculo de índice recibe los coeficientes Akf[1], Akf[2], ..., Akf[p] PARCOR cuantificados y calcula un índice Q’ proporcional a lo corta que sea la altura de pico a valle de una envolvente espectral mediante
(s315). De acuerdo con la magnitud del índice Q’, la unidad 315 de cálculo de índice emite, a la unidad 312 de codificación vectorial de corrección y la unidad 311 de resta no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de codificación de corrección o una señal C de control que es un entero positivo que representa un número de bits predeterminado o es 0. Asimismo, de acuerdo con la magnitud del índice Q’, la unidad 415 de cálculo de índice emite, a la unidad 411 de descodificación vectorial de corrección y la unidad 413 de suma no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de descodificación de corrección o una señal C de control que es un entero positivo que representa un número de bits predeterminado o es 0.
La unidad 315 de cálculo de índice y la unidad 415 de cálculo de índice se pueden configurar para emitir el índice Q y/o el índice Q’ en lugar de la señal C de control. En ese caso, de acuerdo con la magnitud del índice Q y/o el índice Q’, la unidad 312 de codificación vectorial de corrección y la unidad 411 de codificación vectorial de corrección simplemente tienen que determinar si se realiza o no procesamiento de codificación y el procesamiento de descodificación, respectivamente. Además, asimismo, de acuerdo con la magnitud del índice Q y/o el índice Q’, la unidad 311 de resta no predictiva simplemente tiene que determinar si se realiza o no procesamiento de resta y la unidad 413 de suma no predictiva simplemente tiene que determinar qué tipo de procesamiento de suma realiza la unidad 413 de suma no predictiva. Las determinaciones hechas en la unidad 312 de codificación vectorial de corrección, la unidad 411 de descodificación vectorial de corrección, la unidad 311 de resta no predictiva, y la unidad 413 de suma no predictiva son las mismas que las explicadas en la unidad 315 de cálculo de índice y la unidad 415 de cálculo de índice descritas anteriormente.
<Segunda realización>
Se describirán principalmente las diferencias con la primera realización.
Un gran número de vectores de corrección candidatos almacenados en un libro de códigos de vectores de corrección significa que se puede realizar la codificación con una alta precisión de la aproximación en consecuencia. Por tanto, en la presente realización, la unidad de codificación vectorial de corrección y la unidad de descodificación vectorial de corrección se ejecutan utilizando un libro de códigos de vectores de corrección cuya precisión aumenta con un aumento en la influencia de una reducción en la precisión de la descodificación causada por un error de transmisión en un código LSP .
<Dispositivo 500 de codificación de coeficientes de predicción lineal>
La Figura 11 representa un diagrama de bloques funcional de un dispositivo 500 de codificación de coeficientes de predicción lineal que no está incluido en las reivindicaciones pero que es útil para entender la segunda realización, y la Figura 8 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 500 de codificación de coeficientes de predicción lineal de la segunda realización incluye una unidad 510 de codificación no predictiva en lugar de la unidad 310 de codificación no predictiva.
La unidad 510 de codificación no predictiva incluye la unidad 311 de resta no predictiva, una unidad 512 de codificación vectorial de corrección, libros de códigos 513A y 513B de vectores de corrección, la unidad 314 de suma predictiva, y la unidad 315 de cálculo de índice. Como es el caso con los dispositivos 100 y 300 de codificación de coeficientes de predicción lineal descritos en el contexto del primer ejemplo y de la primera realización, si los parámetros 0 LSP derivados de una señal Xf de sonido son generados por otro dispositivo y la entrada del dispositivo 500 de codificación de coeficientes de predicción lineal es los parámetros LSP 0f[1 ], 0f[2], ..., 0f[p], el dispositivo 500 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP .
Las diferencias con la primera realización radican en que el dispositivo 500 de codificación de coeficientes de predicción lineal de la segunda realización incluye una pluralidad de libros de códigos de vectores de corrección y la unidad 512 de codificación vectorial de corrección realiza la codificación seleccionando cualquiera de los libros de códigos de vectores de corrección de acuerdo con el índice Q y/o Q’ calculados en la unidad 315 de cálculo de índice.
En adelante, se dará una descripción tomando como ejemplo un caso en el que se proporcionan los dos tipos de libros de códigos 513A y 513B de vectores de corrección.
Los libros de códigos 513A y 513B de vectores de corrección difieren entre s í en el número total de vectores de corrección candidatos almacenados en los mismos. Un gran número total de vectores de corrección candidatos significa un gran número de bits de un código vectorial de corrección correspondiente. Para expresarlo al revés, cuanto mayor sea el número de bits de un código vectorial de corrección, más vectores de corrección candidatos se pueden preparar. Por ejemplo, si se supone que el número de bits de un código vectorial de corrección es A, se pueden preparar hasta 2A vectores de corrección candidatos.
En adelante, se dará una descripción en el supuesto de que el número total de vectores de corrección candidatos almacenados en el libro de códigos 513A de vectores de corrección es mayor que el número total de vectores de corrección candidatos almacenados en el libro de códigos 513B de vectores de corrección. En otras palabras, la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 513A de vectores de corrección es mayor que la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 513B de vectores de corrección. Por ejemplo, 2A pares de un código vectorial de corrección que tiene una longitud del código de A bits y un vector de corrección candidato se almacenan en el libro de códigos 513A de vectores de corrección, y 2B (2B < 2A) pares de un código vectorial de corrección que tiene una longitud del código de B bits (B < A) y un vector de corrección candidato se almacenan en el libro de códigos 513B de vectores de corrección.
Por otro lado, en la presente realización, como ya se explicó en la parte de modificación de la primera realización, la unidad de cálculo de índice emite el índice Q y/o el índice Q’ en lugar de la señal C de control, y, de acuerdo con la magnitud del índice Q y/o el índice Q’, la unidad de codificación vectorial de corrección y la unidad de descodificación vectorial de corrección determinan qué tipo de codificación y descodificación realizan la unidad de codificación vectorial de corrección y la unidad de descodificación vectorial de corrección, respectivamente. Sin embargo, como en la primera realización, se puede adoptar una configuración en la que la unidad de cálculo de índice determina qué tipo de codificación y descodificación se realiza y emite la señal C de control. Por otro lado, como ya se explicó en la parte de modificación de la primera realización, de acuerdo con la magnitud del índice Q y/o el índice Q’, la unidad 311 de resta no predictiva determina si se realiza o no procesamiento de resta y la unidad 413 de suma no predictiva determina qué tipo de procesamiento de suma realiza la unidad 413 de suma no predictiva.
<Unidad 512 de codificación vectorial de corrección>
La unidad 512 de codificación vectorial de corrección recibe el índice Q y/o el índice Q’ y el vector Uf de corrección. La unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df cuyo número de bits se vuelve mayor (la longitud del código se vuelve mayor) a medida que (A-2) el índice Q aumenta y/o (B-2) el índice Q’ disminuye (s512) y emite el código LSP de corrección Df . Por ejemplo, la unidad 512 de codificación vectorial de corrección realiza la codificación de la siguiente manera utilizando un valor Th2 de umbral predeterminado y/o un valor Th2’ de umbral predeterminado. Por otro lado, dado que la unidad 512 de codificación vectorial de corrección realiza el procesamiento de codificación si el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o el índice Q’ es menor o igual que el valor Th1 ’ de umbral predeterminado, Th2 es un valor mayor que Th1 y Th2’ es un valor menor que Th1 ’.
Si (A-5) el índice Q es mayor o igual que el valor Th2 de umbral predeterminado y/o (B-5) el índice Q’ es menor o igual que el valor Th2’ de umbral predeterminado, se supone que A que es un entero positivo se establece como el número de bits del código LSP de corrección Df , y la unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df codificando el vector Uf de corrección haciendo referencia al libro de códigos 513A de vectores de corrección que almacena los 2A pares de un código vectorial de corrección que tiene el número de bits (longitud del código) A y un vector de corrección candidato (s512) y emite el código LSP de corrección Df .
Si (A-6) el índice Q es menor o igual que el valor Th2 de umbral predeterminado y el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o (B-6) el índice Q’ es mayor que el valor Th2’ de umbral predeterminado y el índice Q’ es menor o igual que el valor Th1’ de umbral predeterminado, se supone que B que es un entero positivo menor que el número de bits A se establece como el número de bits del código LSP de corrección Df , y la unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df codificando el vector Uf de corrección haciendo referencia al libro de códigos 513B de vectores de corrección que almacena los 2B pares de un código vectorial de corrección que tiene el número de bits (longitud del código) B y un vector de corrección candidato (s512) y emite el código LSP de corrección Df .
En otros casos (C-6), se supone que 0 se establece como el número de bits del código LSP de corrección Df , y la unidad 512 de codificación vectorial de corrección no codifica el vector Uf de corrección y no obtiene y emite un código LSP de corrección Df .
Por tanto, la unidad 512 de codificación vectorial de corrección de la segunda realización se ejecuta cuando el índice Q calculado en la unidad 315 de cálculo de índice es mayor que el valor Th1 de umbral predeterminado y/o el índice Q’ calculado en la unidad 315 de cálculo de índice es menor que el valor Th1’ de umbral predeterminado.
<Dispositivo 600 de descodificación de coeficientes de predicción lineal de acuerdo con la segunda realización> La Figura 12 representa un diagrama de bloques funcional de un dispositivo 600 de descodificación de coeficientes de predicción lineal de acuerdo con la segunda realización, y la Figura 10 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 600 de descodificación de coeficientes de predicción lineal de la segunda realización incluye una unidad 610 de descodificación no predictiva en lugar de la unidad 410 de descodificación no predictiva.
La unidad 610 de descodificación no predictiva incluye la unidad 413 de suma no predictiva, una unidad 611 de descodificación vectorial de corrección, libros de códigos 612A y 612B de vectores de corrección, y la unidad 415 de cálculo de índice y, cuando sea necesario, también incluye la unidad 214 de cálculo de coeficientes de predicción lineal no predictivos descodificados.
Las diferencias con el dispositivo 400 de descodificación de coeficientes de predicción lineal que han sido descritos en el contexto de la primera realización radican en que el dispositivo 600 de descodificación de coeficientes de predicción lineal de la segunda realización incluye una pluralidad de libros de códigos de vectores de corrección y la unidad 611 de descodificación vectorial de corrección realiza la descodificación seleccionando cualquiera de los libros de códigos de vectores de corrección de acuerdo con el índice Q y/o Q’ calculados en la unidad 415 de cálculo de índice.
En adelante, se dará una descripción tomando como ejemplo un caso en el que se proporcionan los dos tipos de libros de códigos 612A y 612B de vectores de corrección.
Los libros de códigos 612A y 612B de vectores de corrección almacenan los contenidos compartidos por los libros de códigos 513A y 513B de vectores de corrección, respectivamente, del dispositivo 500 de codificación de coeficientes de predicción lineal. Es decir, en los libros de códigos 612A y 612B de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos, y la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 612A de vectores de corrección es mayor que la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 612B de vectores de corrección. Por ejemplo, 2A pares de un código vectorial de corrección que tiene una longitud del código de A bits y un vector de corrección candidato se almacenan en el libro de códigos 612A de vectores de corrección, y 2B (2B < 2A) pares de un código vectorial de corrección que tiene una longitud del código de B bits (B < A) y un vector de corrección candidato se almacenan en el libro de códigos 612B de vectores de corrección.
<Unidad 611 de descodificación vectorial de corrección>
La unidad 611 de descodificación vectorial de corrección recibe el índice Q y/o el índice Q’ y el código LSP de corrección Df . La unidad 611 de descodificación vectorial de corrección obtiene un vector AUf de corrección descodificado a partir de un gran número de vectores de corrección candidatos descodificando un código LSP de corrección Df con un número de bits en función de la magnitud del índice Q y el índice Q’, de tal manera que (A-2) cuanto mayor sea el índice Q y/o (B-2) menor sea el índice Q’, mayor será el número de bits (s611). Por ejemplo, la unidad 611 de descodificación vectorial de corrección realiza la descodificación de la siguiente manera utilizando un valor Th2 y/o Th2’ de umbral predeterminado. Por otro lado, dado que la unidad 611 de descodificación vectorial de corrección realiza el procesamiento de descodificación si el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o el índice Q’ es menor o igual que el valor Th1 ’ de umbral predeterminado, Th2 es un valor mayor que Th1 y Th2’ es un valor menor que Th1 ’.
Si (A-5) el índice Q es mayor o igual que el valor Th2 de umbral predeterminado y/o (B-5) el índice Q’ es menor o igual que el valor Th2’ de umbral predeterminado, se supone que A que es un entero positivo se establece como el número de bits del código LSP de corrección Df, y la unidad 611 de descodificación vectorial de corrección obtiene, como un vector AUf de corrección descodificado, un vector de corrección candidato correspondiente a un código vectorial de corrección que coincide con el código LSP de corrección Df haciendo referencia al libro de códigos 612A de vectores de corrección que almacena los 2A pares de un código vectorial de corrección que tiene el número de bits (longitud del código) A y un vector de corrección candidato (s611) y emite el vector AUf de corrección descodificado.
Si (A-6) el índice Q es menor que el valor Th2 de umbral predeterminado y el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o (B-6) el índice Q’ es mayor que el valor Th2’ de umbral predeterminado y el índice Q’ es menor o igual que el valor Th1’ de umbral predeterminado, se supone que B que es un entero positivo menor que el número de bits A se establece como el número de bits del código LSP de corrección Df , y la unidad 611 de descodificación vectorial de corrección obtiene, como un vector AUf de corrección descodificado, un vector de corrección candidato correspondiente a un código vectorial de corrección que coincide con el código LSP de corrección
Df haciendo referencia al libro de códigos 612B de vectores de corrección que almacena los 2B pares de un código vectorial de corrección que tiene el número de bits (longitud del código) B y un vector de corrección candidato (s611) y emite el vector Aü f de corrección descodificado.
En otros casos (C-6), se supone que 0 se establece como el número de bits del código LSP de corrección Df , y la unidad 611 de descodificación vectorial de corrección no descodifica el código LSP de corrección Df y no genera un vector Aüf de corrección descodificado.
Por tanto, la unidad 611 de descodificación vectorial de corrección de la segunda realización se ejecuta si el índice Q calculado en la unidad 415 de cálculo de índice es mayor que el valor Th1 de umbral predeterminado y/o el índice Q’ calculado en la unidad 415 de cálculo de índice es menor que el valor Th1 ’ de umbral predeterminado.
<Efecto de la segunda realización>
Con tal configuración, es posible obtener el efecto similar al de la segunda realización. Además, cambiando la precisión de la aproximación en función de la magnitud de la influencia de una reducción en la precisión de la descodificación causada por un error de transmisión en un código LSP , es posible realizar procesamiento de codificación y descodificación de mayor calidad de sonido que las correspondientes codificación y descodificación de la primera realización, mientras se reduce la cantidad de código en su conjunto en comparación con la codificación y descodificación del primer ejemplo.
<Modificación>
El número de libros de códigos de vectores de corrección no necesariamente tiene que ser dos y puede ser tres o más. El número de bits (longitud de bits) de los códigos vectoriales de corrección almacenados difiere de un libro de códigos de vectores de corrección a otro, y se almacenan los vectores de corrección correspondientes a los códigos vectoriales de corrección. Es necesario simplemente establecer un valor de umbral en función del número de libros de códigos de vectores de corrección. ün valor de umbral para el índice Q simplemente tiene que ser establecido de tal manera que cuanto mayor se vuelva el valor del valor de umbral, mayor se vuelva el número de bits de un código vectorial de corrección, el código vectorial de corrección que se almacena en el libro de códigos de vectores de corrección que se utiliza si el índice Q es mayor o igual que ese valor de umbral. Asimismo, un valor de umbral para el índice Q’ simplemente tiene que ser establecido de tal manera que cuanto menor se vuelva el valor del valor de umbral, mayor se vuelva el número de bits de un código vectorial de corrección, el código vectorial de corrección que se almacena en el libro de códigos de vectores de corrección que se utiliza si el índice Q’ es menor o igual que ese valor de umbral. Con tal configuración, es posible realizar codificación y descodificación de mayor precisión mientras se reduce la cantidad de código en su conjunto.
<Dispositivo 700 de codificación de acuerdo con la tercera realización>
ün dispositivo 700 de codificación de acuerdo con una tercera realización es lo que se obtiene aplicando el dispositivo 100 de codificación de coeficientes de predicción lineal y el dispositivo 200 de descodificación de coeficientes de predicción lineal del primer ejemplo al método de codificación TCX (excitación codificada por transformación) que es un método de codificación en un dominio de frecuencia.
La Figura 13 representa un diagrama de bloques funcional del dispositivo 700 de codificación de la tercera realización, y la Figura 14 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 700 de codificación de la tercera realización incluye el dispositivo 100 de codificación de coeficientes de predicción lineal, el dispositivo 200 de descodificación de coeficientes de predicción lineal, una unidad 710 de cálculo de serie de envolventes espectrales de potencia, una primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado, una segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado, una unidad 730 de conversión de dominio de frecuencia, una unidad 740 de normalización de envolvente, una unidad 750 de cálculo de parámetros de codificación de longitud variable, y una unidad 760 de codificación de longitud variable. Por otro lado, en lugar del dispositivo 100 de codificación de coeficientes de predicción lineal y el dispositivo 200 de descodificación de coeficientes de predicción lineal, se pueden utilizar los dispositivos 300 y 500 de codificación de coeficientes de predicción lineal y los dispositivos 400 y 600 de descodificación de coeficientes de predicción lineal de la primera y segunda realizaciones.
El dispositivo 700 de codificación de la tercera realización recibe una señal X f de sonido de entrada y emite un código de señal de dominio de frecuencia.
<Dispositivo 100 de codificación de coeficientes de predicción lineal>
El dispositivo 100 de codificación de coeficientes de predicción lineal recibe la señal X f de sonido, obtiene un código LSP C f y un código LSP de corrección Df (s100), y emite el código LSP C f y el código LSP de corrección Df .
<Dispositivo 200 de descodificación de coeficientes de predicción lineal>
El dispositivo 200 de descodificación de coeficientes de predicción lineal recibe el código LSP C f y el código LSP de corrección Df , obtiene los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos (s200), y emite los coeficientes
Aat[1], Aat[2], Aat[p] de predicción lineal de cuantificación predictivos y los coeficientes Abf[1], Abf[2], Abf[p] de predicción lineal de cuantificación no predictivos.
Por otro lado, el dispositivo 100 de codificación de coeficientes de predicción lineal del dispositivo 700 de codificación se puede configurar para obtener, cuando se obtiene el código LSP C f y el código LSP de corrección Df , los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos correspondientes al código LSP C f y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos correspondientes al código LSP C f y el código LSP de corrección Df . En este caso, el dispositivo 700 de codificación no tiene que incluir el dispositivo 200 de descodificación de coeficientes de predicción lineal.
<Unidad 710 de cálculo de serie de envolventes espectrales de potencia>
La unidad 710 de cálculo de serie de envolventes espectrales de potencia recibe los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. La unidad 710 de cálculo de serie de envolventes espectrales de potencia calcula una serie Z[1], ..., Z[N] de envolventes espectrales de potencia de la señal de sonido de entrada en el punto N utilizando los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos (s710) y emite la serie Z[1], ..., Z[N] de envolventes espectrales de potencia. Por ejemplo, cada valor Z[n] de la serie de envolventes espectrales de potencia se puede determinar mediante la siguiente fórmula.
donde n es un entero 1 < n < N, exp () es una función exponencial que utiliza la constante de Napier como base, j es una unidad imaginaria, y o2 es la energía residual de predicción.
<Primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado>
La primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado recibe los coeficientes Aaf[1], Aaf[2],..., Aaf[p] de predicción lineal de cuantificación predictivos. Utilizando los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos y un factor Yi de corrección que se da por adelantado y es una constante positiva menor o igual que 1, la primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado calcula una primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas mediante
(s720A), y emite la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas.
La primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas corresponde a una serie obtenida aplanando (suavizando) las ondas de la amplitud de una serie W[1], W[2], ..., W[N] de envolventes espectrales de potencia determinada por los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos. Y i es una constante positiva que determina el grado de suavizado.
<Segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado>
La segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado recibe los coeficientes Abf[1], Abf[2], Abf[p] de predicción lineal de cuantificación no predictivos. Utilizando los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos y un factor Yi de corrección que se da por adelantado y es una constante positiva menor o igual que 1, la segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado calcula una segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas mediante
(s720B) y emite la segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas.
La segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas corresponde a una serie obtenida aplanando (suavizando) las ondas de la amplitud de una serie Z[1], Z[2], ..., Z[N] de envolventes espectrales de potencia determinada por los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. Yi es una constante positiva que determina el grado de suavizado.
<Unidad 730 de conversión de dominio de frecuencia>
La unidad 730 de conversión de dominio de frecuencia convierte la señal Xf de sonido de entrada, que se introduce a la unidad 730 de conversión de dominio de frecuencia, en el dominio de tiempo en la secuencia X[1], ..., X[N] de coeficientes MDCT en el punto N en el dominio de frecuencia trama por trama que es un segmento de tiempo (s730) predeterminado y emite la secuencia X[1], ..., X[N] de coeficientes MDCT. Aquí, N es un entero positivo.
<Unidad 740 de normalización de envolvente>
La unidad 740 de normalización de envolvente recibe la secuencia X[1], ..., X[N] de coeficientes MDCT y la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas, obtiene una secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados que es una serie obtenida normalizando cada coeficiente X[i] de la secuencia X[1], ...,X[N] de coeficientes MDCT por la raíz cuadrada de cada valor ~W[i] de la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas (s740), y emite la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados. Es decir, X n [í] = X[i]/sqrt(~W[i]) se mantiene. Aquí, sqrt(-) es un símbolo que representa la mitad de la potencia.
<Unidad 750 de cálculo de parámetros de codificación de longitud variable>
La unidad 750 de cálculo de parámetros de codificación de longitud variable recibe la serie Z[1], ...,Z[N] de envolventes espectrales de potencia, la segunda serie ~Z[1], ..., ~Z[N] de envolventes espectrales de potencia suavizadas, la secuencia X[1], ..., X[N] de coeficientes MDCT, y la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados. Utilizando estos valores, la unidad 750 de cálculo de parámetros de codificación de longitud variable calcula un parámetro ri de codificación de longitud variable que es un parámetro para realizar la codificación de longitud variable de la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados (s750) y emite el parámetro ri de codificación de longitud variable. El parámetro ri de codificación de longitud variable es un parámetro que especifica un posible rango de la amplitud de la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados a codificar. En el caso de codificación de Rice, un parámetro de Rice corresponde al parámetro de codificación de longitud variable; en el caso de codificación aritmética, un posible rango de la amplitud de un objeto a codificar corresponde al parámetro de codificación de longitud variable.
Cuando se realiza la codificación de longitud variable por muestra, se calcula un parámetro de codificación de longitud variable para cada coeficiente X n [í] de la secuencia de coeficientes MDCT normalizados. Cuando se realiza la codificación de longitud variable colectivamente para un grupo de muestra formado por una pluralidad de muestras (por ejemplo, dos muestras a la vez), se calcula un parámetro de codificación de longitud variable para cada grupo de muestras. Es decir, la unidad 750 de cálculo de parámetros de codificación de longitud variable calcula un parámetro de codificación de longitud variable para una secuencia de coeficientes parciales normalizados que es parte de la secuencia de coeficientes MDCT normalizados. Aquí, se supone que hay una pluralidad de secuencias de coeficientes parciales normalizados y, en la pluralidad de secuencias de coeficientes parciales normalizados, los coeficientes de la secuencia de coeficientes MDCT normalizados se incluyen sin solapamientos.
En adelante, se describirá un método de cálculo de un parámetro de codificación de longitud variable tomando como ejemplo un caso en el que se realiza codificación de Rice por muestra.
(Paso 1) Por ejemplo, mediante la siguiente fórmula, se calcula el logaritmo del promedio de las amplitudes de los coeficientes de la secuencia X n [1], X n [2], ..., X n [N] de coeficientes MDCT normalizados como un parámetro de Rice sb.
sb se codifica solo una vez en cada trama y se transmite al dispositivo de descodificación como un código correspondiente a un parámetro de Rice de referencia. Alternativamente, cuando la amplitud de X[i] se puede estimar mediante otra información que se transmite al dispositivo de descodificación, se puede establecer un método para determinar aproximadamente sb a partir del valor estimado de la amplitud de X[i], compartido el método por el dispositivo 700 de codificación y el dispositivo de descodificación. En este caso, no hay necesidad de codificar sb y emitir un código correspondiente a un parámetro de Rice de referencia al dispositivo de descodificación.
(Paso 2) Se calcula un valor 0 de umbral mediante la siguiente fórmula.
(Paso 3) Cuanto mayor sea el grado en el que |sqrt(Z[i])/sqrt(~Z[i])| es mayor que 0, mayor será un valor que sb, el valor al que se establece el parámetro de Rice ri . Cuanto menor sea el grado en el que |sqrt(Z[i])/sqrt(~Z[i])| es menor que 0, menor será un valor que sb, el valor al que se establece el parámetro de Rice ri.
(Paso 4) Realizando repetidamente el procesamiento en el paso 3 en todos los i=1,2 , ..., N, se obtiene un parámetro de Rice ri para cada coeficiente X n [í] MDCT normalizado.
<Unidad 760 de codificación de longitud variable>
La unidad 760 de codificación variable recibe el parámetro ri de codificación de longitud variable, realiza la codificación de longitud variable de la secuencia X n (1), ..., X n (N) de coeficientes normalizados utilizando este valor, y emite un código C x de longitud variable (s760).
<Efecto de la tercera realización>
La tercera realización tiene una configuración en la que la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados obtenida normalizando la secuencia X[1], X[2], ..., X[N] de coeficientes MDCT por la serie de envolventes espectrales de potencia suavizadas se codifica utilizando un parámetro de codificación de longitud variable.
Dado que es necesario obtener, utilizando la serie de envolventes espectrales de potencia más precisa posible, una secuencia de coeficientes MDCT normalizados sobre la que se ha de realizar codificación de longitud variable, la unidad 740 de normalización de envolvente genera una secuencia de coeficientes MDCT normalizados utilizando la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas determinada por los coeficientes Aaf[1 ], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictiva, la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas cuya diferencia con una serie de envolventes espectrales de potencia determinada suavizando los coeficientes de predicción lineal es pequeña.
La unidad 750 de cálculo de parámetros de codificación de longitud variable utiliza una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas para obtener un parámetro de
codificación de longitud variable. Por tanto, es también deseable que, para la serie de envolventes espectrales de potencia y la serie de envolventes espectrales de potencia suavizadas que se utilizan en la unidad 750 de cálculo de parámetros de codificación de longitud variable, una diferencia con una serie de envolventes espectrales de potencia que se determina mediante coeficientes de predicción lineal y una serie de envolventes espectrales de potencia que se determina suavizando los coeficientes de predicción lineal es pequeña. Sin embargo, no solo cuando ocurre un error de transmisión en un código LSP de la trama actual, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente, los valores correctos de los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos no se pueden obtener en el lado de descodificación. Es decir, si se determina un parámetro de codificación de longitud variable a partir de una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas que se determinan a partir de los coeficientes Aaf[1], Aaf[2], ..., Aaf[p], de predicción lineal de cuantificación predictivos, se vuelve imposible realizar la descodificación de longitud variable correctamente no solo cuando ocurre un error de transmisión en un código LSP de la trama actual, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente.
Por tanto, en la tercera realización, se determina un parámetro de codificación de longitud variable utilizando una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas que se determinan a partir de los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. Como resultado, incluso cuando ocurre un error de transmisión en un código LSP de la trama precedente, dado que es posible obtener los mismos coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos, la serie Z[1], Z[2], ..., Z[N] de envolventes espectrales de potencia, y la segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas como las del lado de codificación en la trama actual si no ocurre error de transmisión en un código LSP de la trama actual, es posible obtener el mismo parámetro de codificación de longitud variable que el del lado de codificación en la trama actual y de este modo aumentar la resistencia a un error de transmisión en un código LSP .
Por otro lado, en la tercera realización, se establece una secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados obtenida utilizando la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas como un objeto sobre el que se ha de realizar la codificación de longitud variable. Por lo tanto, no solo cuando ocurre un error de transmisión en un código LSP de la trama actual, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente, ocurre un error en la raíz cuadrada de cada valor de una serie de envolventes espectrales de potencia suavizadas por el que se multiplica la secuencia X n [1], ..., X n [N] de coeficientes MDCT normalizados en el lado de descodificación y se produce distorsión indeseable en una secuencia de coeficientes MDCT que se obtiene mediante descodificación. Sin embargo, esto es menos problemático que un error en un parámetro de codificación de longitud variable que hace incorrecta la propia descodificación de longitud variable.
<Primera modificación>
En el primer ejemplo y en las realizaciones primera a tercera anteriores, solo se puede establecer un parámetro LSP (un parámetro LSP de bajo orden) cuyo orden es menor o igual que un orden T l predeterminado menor que un orden p de predicción como un objeto sobre el que se ha de realizar el procesamiento (procesamiento de codificación no predictiva), siendo realizado el procesamiento en la unidad 110 de codificación no predictiva del dispositivo 100 de codificación de coeficientes de predicción lineal de la Figura 3, la unidad 310 de codificación no predictiva del dispositivo 300 de codificación de coeficientes de predicción lineal de la Figura 7, y la unidad 510 de codificación no predictiva del dispositivo 500 de codificación de coeficientes de predicción lineal de la Figura 11, y el procesamiento correspondiente a los descritos anteriormente se puede realizar también en el lado de descodificación.
En primer lugar, se describirán cada una de las unidades 110, 310, y 510.
<Unidades 111 y 311 de resta no predictiva>
Las unidades 111 y 311 de resta no predictiva generan un vector U’f = 0 ’f-Y’-AS’f de corrección de bajo orden que es un vector obtenido restando, de un vector 0 ’f = (0f[1], 0f[2], ..., 0f[TL])T de parámetros LSP de bajo orden formado por parámetros LSP , cuyos órdenes son menores o iguales que el orden T l , del vector 0 f = (0f[1 ], 0f[2], ...,0 f[p])T de parámetros LSP de entrada, un vector Y ’ = (y[1], y[2], ..., y[TL])T de media de bajo orden no predictiva almacenado en el almacenamiento 111c y un vector AS’f = (Asf[1], Asf[2], ..., Asf[TL])T diferencial de cuantificación de bajo orden formado por elementos, cuyos órdenes son menores o iguales que el orden T l , del vector ASf = (Asf[1], Asf[2], ..., Asf[p])T diferencial de cuantificación de entrada, y emite el vector U’f de corrección de bajo orden. Es decir, las unidades 111 y 311 de resta no predictiva generan un vector U’f de corrección de bajo orden que es un vector formado por algunos de los elementos del vector Uf de corrección y emiten el vector U’f de corrección de bajo orden.
Aquí, el vector Y ’ = (y[1], y[2], ..., y[TL])T de media de bajo orden no predictiva es un vector predeterminado y es un vector formado por elementos, cuyos órdenes son menores o iguales que el orden T l , del vector Y = (y[1], y[2], ..., y[p])T de media no predictiva que se utiliza en el dispositivo de descodificación de la primera modificación.
Por otro lado, un vector 0 ’f de parámetros LSP de bajo orden formado por parámetros LSP , cuyos órdenes son menores o iguales que el orden T l , del vector 0 f de parámetros LSP se puede emitir desde la unidad 82 de cálculo LSP e introducir a las unidades 111 y 311 de resta no predictiva. Además, un vector AS’f diferencial de cuantificación de bajo orden formado por elementos, cuyos órdenes son menores o iguales que el orden T l , del vector ASf diferencial
de cuantificación se puede emitir desde la unidad 84 de codificación vectorial e introducir a las unidades 111 y 311 de resta no predictiva.
<Unidades 112, 312, y 512 de codificación vectorial de corrección>
Las unidades 112, 312, y 512 de codificación vectorial de corrección codifican el vector U’f de corrección de bajo orden que es un vector formado por algunos de los elementos del vector Uf de corrección haciendo referencia a los libros de códigos 113, 513A, y 513B de vectores de corrección. Los vectores de corrección candidatos que se almacenan en los libros de códigos 113, 513A, y 513B de vectores de corrección simplemente tienen que ser vectores del orden T l .
A continuación, se describirán los dispositivos 200, 400, y 600 de descodificación de coeficientes de predicción lineal de la primera modificación.
Se describirá el procesamiento (procesamiento de descodificación no predictiva) que se realiza en la unidad 210 de descodificación no predictiva del dispositivo 200 de descodificación de coeficientes de predicción lineal de la primera modificación, la unidad 410 de descodificación no predictiva del dispositivo 400 de descodificación de coeficientes de predicción lineal de la primera modificación, y la unidad 610 de descodificación no predictiva del dispositivo 600 de descodificación de coeficientes de predicción lineal de la primera modificación.
<Unidades 211,411, y 611 de descodificación vectorial de corrección>
Las unidades 211, 411, y 611 de descodificación vectorial de corrección reciben un código LSP de corrección Df , obtienen un vector AU’f de corrección de bajo orden descodificado descodificando el código LSP de corrección Df haciendo referencia a los libros de códigos 212, 612A, y 612B de vectores de corrección, y emiten el vector AU’f de corrección de bajo orden descodificado. El vector AU’f = (ut[1 ], uf[2], ..., uf[T l ])T de corrección de bajo orden descodificado es un vector del orden T l . Los vectores de corrección candidatos que se almacenan en los libros de códigos 212, 612A, y 612B de vectores de corrección simplemente tienen que ser vectores del orden T l como en el caso de los libros de códigos 113, 513A, y 513B de vectores de corrección.
<Unidad 213 de suma no predictiva>
La unidad 213 de suma no predictiva recibe el vector AU’f = (uf[1], uf[2], ..., uf[TL])T de corrección de bajo orden descodificado, el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva, y el vector ASf = (Asf[1], Asf[2], ..., Asf[p])T diferencial descodificado.
La unidad 213 de suma no predictiva genera un vector A0f de parámetros LSP no predictivos descodificados que se obtiene sumando los elementos del vector AU’f de corrección de bajo orden descodificado, el vector ASf diferencial descodificado, y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden T l y sumando los elementos del vector ASf diferencial descodificado y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden p y sea mayor que el orden T l , y emite el vector A0f de parámetros LSP no predictivos descodificados. Es decir, el vector A0f de parámetros LSP no predictivos descodificados es A0f = (uf[1]+y[1]+Asf[1], uf[2]+y[2]+Asf[2], ..., uf[TL]+y[TL]+Asf[TL], y[TL+1]+Asf[TL+1], ..., y[p]+Asf[p]).
<Unidad 413 de suma no predictiva>
La unidad 413 de suma no predictiva recibe el vector AU’f = (ut[1 ], uf[2], ..., uf[TL])T de corrección de bajo orden descodificado, el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva, y el vector ASf= (Asf[1], Asf[2], ..., Asf[p])T diferencial descodificado.
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que se realiza el procesamiento de descodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, en el caso de (A-1) y/o (B-1), la unidad 413 de suma no predictiva genera un vector A0f de parámetros LSP no predictivos descodificados que se obtiene sumando los elementos del vector AU’f de corrección de bajo orden descodificado, el vector ASf diferencial descodificado, y el vector Y de media no predictiva para cada orden menor o igual que el orden T l y sumando los elementos del vector ASf diferencial descodificado y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden p y sea mayor que el orden T l , y emite el vector A0f de parámetros LSP no predictivos descodificados. Es decir, el vector A0f de parámetros LSP no predictivos descodificados es A 0 = (uf[1]+y[1]+Asf[1], uf[2]+y[2]+Asf[2], ..., uf[TL]+y[TL]+Asf[TL], y[TL+1]+Asf[TL+1], ..., y[p]+Asf[p]).
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que no se realiza el procesamiento de descodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 413 de suma no predictiva genera un vector A0f = Y+ASf de parámetros LSP no predictivos descodificados que se obtiene sumando el vector ASf diferencial descodificado y el vector Y de media no predictiva y emite el vector A0f de parámetros LSP no predictivos descodificados.
Como resultado, reduciendo preferentemente la distorsión de codificación de un parámetro LSP de bajo orden cuyo grado de precisión de la aproximación puede tener una mayor influencia sobre la eficiencia del procesamiento de señal
que se describirá más adelante, es posible reducir la cantidad de código en comparación con los métodos del primer ejemplo y las realizaciones primera a segunda mientras se suprime un aumento en la distorsión.
<Segunda modificación>
En el primer ejemplo y en las realizaciones primera a tercera, los coeficientes af[1], af[2], ..., af[p] de predicción lineal se utilizan como la entrada de la unidad de cálculo LSP ; por ejemplo, una serie de coeficientes af[1]xY, af[2]xY2, ..., af[p]xYp obtenidos multiplicando cada coeficiente af[i] de los coeficientes de predicción lineal por y elevado a la i-ésima potencia se pueden utilizar como la entrada de la unidad de cálculo LSP.
Además, en el primer ejemplo y en las realizaciones primera a tercera, se supone que un objeto a ser codificado por el dispositivo de codificación de coeficientes de predicción lineal y descodificado por el dispositivo de descodificación de coeficientes de predicción lineal es un parámetro LSP , pero se puede utilizar un propio coeficiente de predicción lineal o cualquier coeficiente tal como un parámetro ISP como un objeto a ser codificado y descodificado siempre que el coeficiente sea un coeficiente que es convertible en un coeficiente de predicción lineal.
<Otras modificaciones>
La presente invención está definida por las reivindicaciones adjuntas y no está limitada a las realizaciones y modificaciones descritas anteriormente. Por ejemplo, se pueden realizar los diversos tipos de procesamiento descritos anteriormente, además de ser realizados en orden cronológico de acuerdo con la descripción, simultáneamente o individualmente en función de la potencia de procesamiento de un dispositivo que realiza el procesamiento o cuando sea necesario. Se pueden hacer otros cambios según sea apropiado sin desviarse de la presente invención.
<Programa y soporte de registro>
Además, pueden ser implementados por un ordenador diversos tipos de funciones de procesamiento de los dispositivos descritos en las realizaciones y modificaciones descritas anteriormente. En ese caso, los detalles de procesamiento de las funciones que se supone que se proporcionan en los dispositivos son descritos por un programa. Como resultado de la ejecución de este programa por el ordenador, los diversos tipos de funciones de procesamiento de los dispositivos descritos anteriormente son implementados en el ordenador.
El programa que describe los detalles de procesamiento se puede grabar en un soporte de registro legible por ordenador. Como soporte de registro legible por ordenador se puede utilizar, por ejemplo, cualquiera de un dispositivo de grabación magnética, un disco óptico, un soporte de registro magneto óptica, memoria de semiconductor, etc.
Además, la distribución de este programa es realizada, por ejemplo, vendiendo, transfiriendo, o prestando un soporte de registro portátil tal como un DVD o un CD-ROM en el que está grabado el programa. Además, el programa se puede distribuir almacenando el programa en un dispositivo de almacenamiento de un ordenador servidor y transfiriendo el programa a otros ordenadores desde el ordenador servidor a través de una red.
El ordenador que ejecuta tal programa en primer lugar, por ejemplo, almacena temporalmente el programa grabado en el soporte de registro portátil o el programa transferido desde el ordenador servidor en un almacenamiento del mismo. Luego, en el momento de la ejecución del procesamiento, el ordenador lee el programa almacenado en el almacenamiento del mismo y ejecuta el procesamiento de acuerdo con el programa leído. Además, como otra realización de este programa, el ordenador puede leer el programa directamente del soporte de registro portátil y ejecutar el procesamiento de acuerdo con el programa. Además, cada vez que el programa es transferido al ordenador desde el ordenador servidor, el ordenador puede ejecutar secuencialmente el procesamiento de acuerdo con el programa recibido. Además, se puede adoptar una configuración en la que no se realiza la transferencia de un programa al ordenador desde el ordenador servidor y el procesamiento descrito anteriormente es ejecutado por un así denominado servicio de tipo proveedor de servicios de aplicaciones (ASP) por el que son implementadas las funciones de procesamiento solo mediante una instrucción para la ejecución de las mismas y adquisición de resultados. Por otro lado, se supone que el programa incluye información (datos o similares que no son una orden directa al ordenador pero tienen la propiedad de definir el procesamiento del ordenador) que se utiliza para el procesamiento por una calculadora electrónica y es equivalente a un programa.
Además, se supone que los dispositivos se configuran como resultado de la ejecución de un programa predeterminado en el ordenador, pero al menos parte de estos detalles de procesamiento se pueden implementar en el hardware.
Claims (14)
1. Un dispositivo de descodificación de señales de sonido que comprende:
una unidad de descodificación predictiva que está adaptada para obtener un vector diferencial descodificado al descodificar un primer código y generar un primer vector descodificado formado por valores descodificados de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de una trama actual sumando el vector diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada; y
una unidad de descodificación no predictiva que está adaptada para obtener un vector de corrección descodificado mediante la descodificación de un segundo código y generar un segundo vector descodificado formado por valores descodificados de los coeficientes que se pueden convertir en los coeficientes de predicción lineal de más de un orden del trama actual sumando elementos del vector de corrección descodificado y al menos elementos de órdenes correspondientes del vector diferencial descodificado, en donde
la unidad de descodificación no predictiva está adaptada para generar el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral a una secuencia de los coeficientes que son convertible en los coeficientes de predicción lineal, es mayor o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q' proporcional con lo corta que es la altura de pico a valle de la envolvente espectral, es menor o igual a un valor de umbral predeterminado Th1'.
2. E l dispositivo de descodificación de señales de sonido de acuerdo con la reivindicación 1, en el que el vector de predicción es un vector formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y
el segundo vector descodificado es un vector formado por los valores descodificados de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual sumando, al vector de corrección descodificado, al menos el vector diferencial descodificado y el vector predeterminado para cada uno de los elementos de órdenes correspondientes.
3. El dispositivo de descodificación de señales de sonido de acuerdo con la reivindicación 1 ó con la reivindicación 2, en el que
suponiendo que a es una constante positiva, el vector de predicción es un vector obtenido al sumar un vector medio predictivo predeterminado y lo que se obtiene al multiplicar un vector diferencial descodificado de la trama pasada por un factor de a, y,
el segundo vector descodificado es un vector obtenido al sumar elementos del vector de corrección descodificado, elementos de órdenes correspondientes del vector diferencial descodificado y elementos de órdenes correspondientes de un vector medio no predictivo predeterminado.
4. El dispositivo de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 1 a 3, en el que
un número de elementos T l del vector de corrección descodificado obtenido al descodificar el segundo código es menor que un número de elementos p de cada uno de los vectores de la unidad de descodificación predictiva, y
un número de elementos del segundo vector descodificado generado por la unidad de descodificación no predictiva es p.
5. El dispositivo de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 1 a 4, en el que
los coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden son parámetros de par de espectro de línea, y el índice Q' es un valor mínimo de diferenciales entre parámetros adyacentes de una secuencia de parámetros de par de espectro de línea descodificados que es el primer vector descodificado y un parámetro de par de espectro de línea descodificado de orden más bajo.
6. El dispositivo de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 1 a 4, en el que
los coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden son parámetros de par de espectro de línea, y el índice Q' es un valor mínimo de diferenciales entre parámetros adyacentes de una secuencia de parámetros de par de espectro de línea descodificados que es el primer vector descodificado.
7. Un método de descodificación de señales de sonido que comprende:
un paso de descodificación predictiva para obtener un vector diferencial descodificado mediante la descodificación de un primer código y la generación de un primer vector descodificado formado por valores descodificados de coeficientes que se pueden convertir en coeficientes de predicción lineal de más de un orden de un trama actual sumando el vector diferencial descodificado y un vector de predicción que contiene al menos una predicción basada en un trama pasado; y
un paso de descodificación no predictivo para obtener un vector de corrección descodificado mediante la descodificación de un segundo código y la generación de un segundo vector descodificado formado por valores descodificados de los coeficientes que se pueden convertir en coeficientes de predicción lineal de más de un orden del trama actual mediante la suma de elementos del vector de corrección descodificado y al menos elementos de órdenes correspondientes del vector diferencial descodificado, en donde
el paso de descodificación no predictiva genera el segundo vector descodificado si (A) un índice Q proporcional a la altura de la altura de pico a valle de una envolvente espectral, la envolvente espectral corresponde a una secuencia de coeficientes que se pueden convertir en la coeficientes de predicción lineal, es mayor que o igual a un valor de umbral predeterminado Th1 y/o (B) un índice Q' proporcional a lo corta que sea la altura de pico a valle de la envolvente espectral, es menor o igual a un valor de umbral predeterminado valor umbral Th1'.
8. El método de descodificación de señales de sonido de acuerdo con la reivindicación 7, en el que el vector de predicción es un vector formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y
el segundo vector descodificado es un vector formado por los valores descodificados de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la trama actual sumando, al vector de corrección descodificado, al menos el vector diferencial descodificado y el vector predeterminado para cada uno de los elementos de órdenes correspondientes.
9. El método de descodificación de señales de sonido de acuerdo con la reivindicación 7 o con la reivindicación 8, en el que
suponiendo que a es una constante positiva, el vector de predicción es un vector obtenido al sumar un vector medio predictivo predeterminado y lo que se obtiene al multiplicar un vector diferencial descodificado del trama pasado por un factor de a, y,
el segundo vector descodificado es un vector obtenido al sumar elementos del vector de corrección descodificado, elementos de órdenes correspondientes del vector diferencial descodificado y elementos de órdenes correspondientes de un vector medio no predictivo predeterminado.
10. El método de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 7 a 9, en el que
un número de elementos T l del vector de corrección descodificado obtenido al descodificar el segundo código es menor que un número de elementos p de cada uno de los vectores del paso de descodificación predictiva, y
un número de elementos del segundo vector descodificado generado por el paso de descodificación no predictiva es p.
11. El método de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 7 a 10, en el que
los coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden son parámetros de par de espectro de línea, y el índice Q' es un valor mínimo de diferenciales entre parámetros adyacentes de una secuencia de parámetros de par de espectro de línea descodificados que es el primer vector descodificado y un parámetro de par de espectro de línea descodificado de orden más bajo.
12. El método de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 7 a 10, en el que
los coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden son parámetros de par de espectro de línea, y el índice Q' es un valor mínimo de diferenciales entre parámetros adyacentes de una secuencia de parámetros de par de espectro de línea descodificados que es el primer vector descodificado.
13. Un programa que comprende instrucciones que, cuando el programa es ejecutado por un ordenador, hacen que el ordenador realice los pasos del método de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 7 a 12.
14. Un soporte de registro que comprende instrucciones que, cuando son ejecutadas por un ordenador, hacen que el ordenador realice los pasos del método de descodificación de señales de sonido de acuerdo con cualquiera de las reivindicaciones 7 a 12.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014094758 | 2014-05-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2911527T3 true ES2911527T3 (es) | 2022-05-19 |
Family
ID=54358473
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES20167742T Active ES2876184T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro |
ES21158838T Active ES2911527T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro |
ES19174056T Active ES2822127T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de decodificación de señal de sonido, método de decodificación de señal de sonido, programa y soporte de registro |
ES15786812T Active ES2744904T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES20167742T Active ES2876184T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19174056T Active ES2822127T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de decodificación de señal de sonido, método de decodificación de señal de sonido, programa y soporte de registro |
ES15786812T Active ES2744904T3 (es) | 2014-05-01 | 2015-03-16 | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación |
Country Status (8)
Country | Link |
---|---|
US (6) | US10418042B2 (es) |
EP (4) | EP3139382B1 (es) |
JP (4) | JP6270993B2 (es) |
KR (4) | KR101855945B1 (es) |
CN (4) | CN110444217B (es) |
ES (4) | ES2876184T3 (es) |
PL (4) | PL3544004T3 (es) |
WO (1) | WO2015166733A1 (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2876184T3 (es) | 2014-05-01 | 2021-11-12 | Nippon Telegraph & Telephone | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro |
US11023235B2 (en) | 2017-12-29 | 2021-06-01 | Intel Corporation | Systems and methods to zero a tile register pair |
US11093247B2 (en) | 2017-12-29 | 2021-08-17 | Intel Corporation | Systems and methods to load a tile register pair |
US11789729B2 (en) | 2017-12-29 | 2023-10-17 | Intel Corporation | Systems and methods for computing dot products of nibbles in two tile operands |
US11669326B2 (en) | 2017-12-29 | 2023-06-06 | Intel Corporation | Systems, methods, and apparatuses for dot product operations |
US11816483B2 (en) | 2017-12-29 | 2023-11-14 | Intel Corporation | Systems, methods, and apparatuses for matrix operations |
US11809869B2 (en) | 2017-12-29 | 2023-11-07 | Intel Corporation | Systems and methods to store a tile register pair to memory |
CN109688409B (zh) * | 2018-12-28 | 2021-03-02 | 北京奇艺世纪科技有限公司 | 一种视频编码方法及装置 |
US11281470B2 (en) * | 2019-12-19 | 2022-03-22 | Advanced Micro Devices, Inc. | Argmax use for machine learning |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
JP3255189B2 (ja) * | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | 音声パラメータの符号化方法および復号方法 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
EP2154681A3 (en) * | 1997-12-24 | 2011-12-21 | Mitsubishi Electric Corporation | Method and apparatus for speech decoding |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP3590342B2 (ja) * | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3472279B2 (ja) * | 2001-06-04 | 2003-12-02 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ符号化方法及び装置 |
KR100487719B1 (ko) * | 2003-03-05 | 2005-05-04 | 한국전자통신연구원 | 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기 |
WO2005025072A1 (ja) * | 2003-09-02 | 2005-03-17 | Nippon Telegraph And Telephone Corporation | 浮動小数点信号可逆符号化方法、復号化方法、及びそれらの装置、プログラム及びその記録媒体 |
US8271272B2 (en) * | 2004-04-27 | 2012-09-18 | Panasonic Corporation | Scalable encoding device, scalable decoding device, and method thereof |
BRPI0510400A (pt) * | 2004-05-19 | 2007-10-23 | Matsushita Electric Ind Co Ltd | dispositivo de codificação, dispositivo de decodificação e método dos mesmos |
EP1837997B1 (en) * | 2005-01-12 | 2011-03-16 | Nippon Telegraph And Telephone Corporation | Long-term prediction encoding method, long-term prediction decoding method, devices thereof, program thereof, and recording medium |
WO2007037361A1 (ja) * | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
US20090248404A1 (en) * | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
ES2624718T3 (es) * | 2006-10-24 | 2017-07-17 | Voiceage Corporation | Método y dispositivo para la codificación de tramas de transición en señales de voz |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
WO2009004227A1 (fr) * | 2007-06-15 | 2009-01-08 | France Telecom | Codage de signaux audionumériques |
JP5006774B2 (ja) * | 2007-12-04 | 2012-08-22 | 日本電信電話株式会社 | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
WO2009075326A1 (ja) * | 2007-12-11 | 2009-06-18 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
US8724734B2 (en) * | 2008-01-24 | 2014-05-13 | Nippon Telegraph And Telephone Corporation | Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium |
JP5013293B2 (ja) * | 2008-02-29 | 2012-08-29 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体 |
US8576927B2 (en) * | 2008-10-10 | 2013-11-05 | Nippon Telegraph And Telephone Corporation | Encoding method, encoding device, decoding method, decoding device, program, and recording medium |
JP4848049B2 (ja) * | 2008-12-09 | 2011-12-28 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
JP4735711B2 (ja) * | 2008-12-17 | 2011-07-27 | ソニー株式会社 | 情報符号化装置 |
WO2010073977A1 (ja) * | 2008-12-22 | 2010-07-01 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
CN101521013B (zh) * | 2009-04-08 | 2011-08-17 | 武汉大学 | 空间音频参数双向帧间预测编解码装置 |
JP5486597B2 (ja) * | 2009-06-03 | 2014-05-07 | 日本電信電話株式会社 | 符号化方法、符号化装置、符号化プログラム及びこの記録媒体 |
GB0917417D0 (en) * | 2009-10-05 | 2009-11-18 | Mitsubishi Elec R&D Ct Europe | Multimedia signature coding and decoding |
KR101397058B1 (ko) * | 2009-11-12 | 2014-05-20 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
JP5602769B2 (ja) * | 2010-01-14 | 2014-10-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
CN103119647B (zh) * | 2010-04-09 | 2015-08-19 | 杜比国际公司 | 基于改进型离散余弦变换的复数预测立体声编码 |
WO2012137617A1 (ja) * | 2011-04-05 | 2012-10-11 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP6160072B2 (ja) * | 2012-12-06 | 2017-07-12 | 富士通株式会社 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
MX355091B (es) * | 2013-10-18 | 2018-04-04 | Fraunhofer Ges Forschung | Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz. |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
CA2940657C (en) * | 2014-04-17 | 2021-12-21 | Voiceage Corporation | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
ES2876184T3 (es) * | 2014-05-01 | 2021-11-12 | Nippon Telegraph & Telephone | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
-
2015
- 2015-03-16 ES ES20167742T patent/ES2876184T3/es active Active
- 2015-03-16 KR KR1020167030130A patent/KR101855945B1/ko active IP Right Grant
- 2015-03-16 PL PL19174056T patent/PL3544004T3/pl unknown
- 2015-03-16 EP EP15786812.6A patent/EP3139382B1/en active Active
- 2015-03-16 CN CN201910644499.2A patent/CN110444217B/zh active Active
- 2015-03-16 WO PCT/JP2015/057727 patent/WO2015166733A1/ja active Application Filing
- 2015-03-16 CN CN201910644404.7A patent/CN110444215B/zh active Active
- 2015-03-16 CN CN201910644410.2A patent/CN110444216B/zh active Active
- 2015-03-16 ES ES21158838T patent/ES2911527T3/es active Active
- 2015-03-16 US US15/307,059 patent/US10418042B2/en active Active
- 2015-03-16 PL PL21158838T patent/PL3859734T3/pl unknown
- 2015-03-16 KR KR1020187012387A patent/KR101870962B1/ko active IP Right Grant
- 2015-03-16 EP EP21158838.9A patent/EP3859734B1/en active Active
- 2015-03-16 EP EP20167742.4A patent/EP3706121B1/en active Active
- 2015-03-16 JP JP2016515896A patent/JP6270993B2/ja active Active
- 2015-03-16 EP EP19174056.2A patent/EP3544004B1/en active Active
- 2015-03-16 ES ES19174056T patent/ES2822127T3/es active Active
- 2015-03-16 ES ES15786812T patent/ES2744904T3/es active Active
- 2015-03-16 KR KR1020187012384A patent/KR101870957B1/ko active IP Right Grant
- 2015-03-16 CN CN201580022683.3A patent/CN106415715B/zh active Active
- 2015-03-16 KR KR1020187012383A patent/KR101870947B1/ko active IP Right Grant
- 2015-03-16 PL PL15786812T patent/PL3139382T3/pl unknown
- 2015-03-16 PL PL20167742T patent/PL3706121T3/pl unknown
-
2017
- 2017-12-25 JP JP2017247954A patent/JP6462104B2/ja active Active
-
2018
- 2018-01-26 JP JP2018011828A patent/JP6484358B2/ja active Active
- 2018-01-26 JP JP2018011829A patent/JP6490846B2/ja active Active
-
2019
- 2019-07-31 US US16/527,160 patent/US11120809B2/en active Active
-
2021
- 2021-07-07 US US17/369,056 patent/US11670313B2/en active Active
- 2021-07-08 US US17/370,060 patent/US11694702B2/en active Active
-
2023
- 2023-05-09 US US18/195,015 patent/US12051430B2/en active Active
-
2024
- 2024-06-14 US US18/743,662 patent/US20240339119A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2911527T3 (es) | Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro | |
US10553229B2 (en) | Coding device, decoding device, and method and program thereof |