Método y aparato para tratar una señal de vídeo
DESCRIPCIÓN
Campo técnico
La presente invención se refiere a un método y un aparato para procesar señales de vídeo.
Técnica anterior
Recientemente, la demanda de imágenes de alta resolución y alta calidad como imágenes de alta definición (HD) e imágenes de ultra alta definición (UHD) ha aumentado en varios campos de aplicación. Sin embargo, los datos de imagen de mayor resolución y calidad tienen cantidades cada vez mayores de datos en comparación con los datos de imagen convencionales. Por lo tanto, cuando se transmiten datos de imágenes utilizando un medio como las redes de banda ancha convencionales e inalámbricas, o cuando se almacenan datos de imágenes utilizando un medio de almacenamiento convencional, aumentan los costes de transmisión y almacenamiento. Para resolver estos problemas que ocurren con un aumento en la resolución y la calidad de los datos de imagen, se pueden utilizar técnicas de codificación/decodificación de imagen de alta eficiencia.
La tecnología de compresión de imágenes incluye varias técnicas, entre ellas: una técnica de inter-predicción, para la predicción de un valor de píxel incluido en una imagen actual a partir de una imagen anterior o posterior de la imagen actual; una técnica de intrapredicción de predicción de un valor de píxel incluido en una imagen actual mediante el uso de información de píxeles en la imagen actual; una técnica de codificación por entropía de asignar un código corto a un valor con una frecuencia de aparición alta y asignar un código largo a un valor con una frecuencia de aparición baja; etc. Los datos de imagen se pueden comprimir de manera efectiva usando dicha tecnología de compresión de imagen y se pueden transmitir o almacenar.
Mientras tanto, con la demanda de imágenes de alta resolución, la demanda de contenido de imágenes estereográficas, que es un nuevo servicio de imágenes, también ha aumentado. Se está discutiendo una técnica de compresión de vídeo
para proporcionar de forma efectiva contenido de imágenes estereográficas con alta resolución y resolución ultraalta.
Divulgación
Problema técnico
Un objeto de la presente invención está destinado a proporcionar un método y un aparato para realizar eficazmente la intrapredicción para un bloque objetivo de codificación/decodificación en la codificación/decodificación de una señal de vídeo.
Un objeto de la presente invención pretende proporcionar un método y un aparato para realizar una intrapredicción para un bloque objetivo de codificación/decodificación basado en una pluralidad de líneas de referencia.
Un objeto de la presente invención pretende proporcionar un método y un aparato para reemplazar una muestra de referencia no disponible con una muestra de referencia disponible durante una generación de una pluralidad de líneas de referencia en la codificación/decodificación de una señal de vídeo.
Un objeto de la presente invención pretende proporcionar un método y un aparato para calcular un valor promedio de una cualquiera de una pluralidad de líneas de referencia en la codificación/decodificación de una señal de vídeo.
Los objetivos técnicos a alcanzar por la presente invención no están limitados a los problemas técnicos mencionados anteriormente. Otros problemas técnicos que no se mencionan serán entendidos de manera inmediata por los expertos en la materia a partir de la siguiente descripción.
Solución técnica
Un método y un aparato para decodificar una señal de vídeo de acuerdo con la presente invención pueden derivar una pluralidad de líneas de muestra de referencia para un bloque actual, seleccionar una línea de muestra de referencia utilizada para la intrapredicción del bloque actual entre la pluralidad de líneas de muestra de referencia, y realice la intrapredicción para el bloque actual utilizando la línea de muestra de referencia seleccionada. En este momento, si se incluye una
muestra de referencia no disponible en una primera línea de muestra de referencia entre la pluralidad de líneas de muestra de referencia, la muestra de referencia no disponible se reemplaza con una muestra de referencia disponible incluida en la primera línea de muestra de referencia o en una segunda línea de muestra de referencia diferente de la primera línea de muestra de referencia.
Un método y un aparato para codificar una señal de vídeo de acuerdo con la presente invención pueden derivar una pluralidad de líneas de muestra de referencia para un bloque actual, seleccionar una línea de muestra de referencia usada para la intrapredicción del bloque actual entre la pluralidad de líneas de muestra de referencia, y realizar la intrapredicción para el bloque actual utilizando la línea de muestra de referencia seleccionada. En este momento, si se incluye una muestra de referencia no disponible en una primera línea de muestra de referencia entre la pluralidad de líneas de muestra de referencia, la muestra de referencia no disponible se reemplaza con una muestra de referencia disponible incluida en la primera línea de muestra de referencia o en una segunda línea de muestra de referencia diferente de la primera línea de muestra de referencia.
En el método y el aparato para codificar/decodificar una señal de vídeo de acuerdo con la presente invención, la muestra de referencia no disponible se reemplaza por una muestra de referencia disponible que tiene una distancia más corta de la muestra de referencia no disponible entre las muestras de referencia disponibles incluidas en la primera línea de muestra de referencia o en la segunda línea de muestra de referencia.
En el método y el aparato para codificar/decodificar una señal de vídeo de acuerdo con la presente invención, si una distancia entre la muestra de referencia no disponible y una muestra de referencia disponible incluida en la primera línea de referencia es igual o mayor que un valor umbral, el valor no disponible la muestra de referencia se reemplaza con una muestra de referencia disponible incluida en la segunda línea de referencia.
En el método y el aparato para codificar/decodificar una señal de vídeo de acuerdo con la presente invención, la segunda línea de referencia tiene un valor de índice mayor que la primera línea de referencia.
En el método y el aparato para codificar/decodificar una señal de vídeo de acuerdo
con la presente invención, se genera una muestra de predicción del bloque actual en base a un valor promedio de una parte de muestras de referencia incluidas en la línea de muestra de referencia seleccionada.
En el método y el aparato para codificar/decodificar una señal de vídeo de acuerdo con la presente invención, una cantidad de muestras de referencia utilizadas para calcular el valor promedio entre las muestras de referencia incluidas en la línea de muestra de referencia seleccionada se determina en función del tamaño del bloque actual.
Las características anteriormente resumidas brevemente para la presente invención son solo aspectos ilustrativos de la descripción detallada de la invención que sigue, pero no limitan el alcance de la invención.
Efectos ventajosos
De acuerdo con la presente invención, se puede realizar una eficiente intrapredicción para un bloque objetivo de codificación/decodificación.
De acuerdo con la presente invención, la intrapredicción para un bloque objetivo de codificación/decodificación se puede realizar basándose en una pluralidad de líneas de referencia.
De acuerdo con la presente invención, una muestra de referencia no disponible se reemplaza con una muestra de referencia disponible durante una generación de una pluralidad de líneas de referencia.
De acuerdo con la presente invención, la intrapredicción para un bloque objetivo de codificación/decodificación mediante el cálculo de un valor promedio de una de la pluralidad de líneas de referencia.
Los efectos obtenibles por la presente invención no están limitados a los efectos mencionados anteriormente, y los expertos en la técnica pueden entender claramente otros efectos no mencionados a partir de la siguiente descripción.
Descripción de dibujos
La figura 1 es un diagrama de bloques que ilustra un dispositivo para codificar un vídeo de acuerdo con una realización de la presente invención;
La figura 2 es un diagrama de bloques de un dispositivo para decodificar un vídeo de acuerdo con una realización de la presente invención;
La figura 3 es un dibujo que ilustra un ejemplo de partición jerárquica de un bloque de codificación basado en una estructura de árbol de acuerdo con una realización de la presente invención.
La figura 4 es un dibujo que ilustra un modo de partición que puede aplicarse a un bloque de codificación cuando el bloque de codificación está codificado mediante interpredicción.
La figura 5 es un dibujo que ilustra tipos de modos de intrapredicción predefinidos para un dispositivo para codificar/decodificar un vídeo de acuerdo con una realización de la presente invención.
La figura 6 es un diagrama que ilustra un tipo de modos de intrapredicción extendida de acuerdo con una realización de la presente invención;
La figura 7 es un diagrama de flujo que ilustra brevemente un método de intrapredicción según una realización de la presente invención.
La figura 8 es un dibujo que ilustra un método para corregir una muestra de predicción de un bloque actual basándose en información diferencial de muestras vecinas de acuerdo con una realización de la presente invención.
Las figuras 9 y 10 son dibujos que ilustran un método para corregir una muestra de predicción basándose en un filtro de corrección predeterminado de acuerdo con una realización de la presente invención.
La figura 11 muestra una gama de muestras de referencia para la intrapredicción de acuerdo con una realización a la que se aplica la presente invención.
Las figuras 12 a 14 ilustran un ejemplo de filtrado sobre muestras de referencias según una realización de la presente invención.
La figura 15 es un diagrama que ilustra una pluralidad de líneas de muestra de referencia de acuerdo con una realización de la presente invención.
La figura 16 es un diagrama de flujo que ilustra un método para realizar la intrapredicción utilizando una línea de referencia extendida según la presente invención.
La figura 17 es un dibujo que ilustra una pluralidad de líneas de referencia para un bloque no cuadrado de acuerdo con la presente invención.
La figura 18 es un dibujo para explicar un ejemplo donde una muestra de referencia no disponible se reemplaza con una muestra de referencia disponible ubicada a la distancia más corta de la muestra de referencia no disponible.
Las figuras 19 y 20 son dibujos para explicar una realización en la que la posición de una muestra de referencia disponible se determina de forma adaptativa según una distancia entre una muestra de referencia no disponible y una muestra de referencia disponible incluida en la misma línea de referencia que la muestra de referencia no disponible.
Las figuras 21 y 22 son dibujos que ilustran muestras de referencia utilizadas para obtener un valor promedio de una línea de referencia de acuerdo con una realización a la que se aplica la presente invención.
Modo de la invención
Se pueden realizar una variedad de modificaciones a la presente invención y existen diversas realizaciones de la presente invención, cuyos ejemplos se proporcionarán ahora con referencia a los dibujos y se describirán con detalle. Sin embargo, la presente invención no se limita a esto, y las realizaciones ejemplares pueden interpretarse como que incluyen todas las modificaciones, equivalentes o sustitutos en un concepto técnico y un alcance técnico de la presente invención. Los números de referencia similares se refieren al elemento similar descrito en los dibujos.
Los términos utilizados en la especificación, 'primero', 'segundo', etc. se pueden usar para describir varios componentes, pero los componentes no deben
interpretarse como limitados a los términos. Los términos solo se utilizan para diferenciar un componente de otros componentes. Por ejemplo, el "primer" componente puede denominarse el "segundo" componente sin apartarse del alcance de la presente invención, y el "segundo" componente también puede denominarse de manera similar al "primer" componente. El término 'y/o' incluye una combinación de una pluralidad de elementos o cualquiera de una pluralidad de términos.
Se entenderá que cuando se hace referencia simplemente a un elemento como 'conectado a' o 'acoplado a' otro elemento sin estar 'directamente conectado a' o 'directamente acoplado a' otro elemento en la presente descripción, puede estar 'directamente' conectado a 'o' directamente acoplado a’ otro elemento o estar conectado o acoplado a otro elemento, teniendo el otro elemento que interviene entre ellos. Por el contrario, cuando se hace referencia a un elemento como "directamente conectado” o "directamente acoplado" a otra característica o elemento, no hay elementos intermedios presentes.
Los términos utilizados en la presente memoria descriptiva se usan simplemente para describir realizaciones particulares, y no pretenden limitar la presente invención. Una expresión usada en singular abarca la expresión del plural, a menos que tenga un significado claramente diferente en el contexto. En la presente memoria descriptiva, debe entenderse que términos tales como "incluyendo", "teniendo", etc. pretenden indicar la existencia de las características, números, etapas, acciones, elementos, partes o combinaciones de los mismos que se describen en la especificación, y no pretenden excluir la posibilidad de que una o más características, números, etapas, acciones, elementos, partes o combinaciones de los mismos puedan existir o agregarse.
A continuación, se describirán detalladamente las realizaciones de la presente invención en el presente documento con referencia a los dibujos adjuntos. De aquí en adelante, los mismos elementos constituyentes en los dibujos se denotan con los mismos números de referencia, y se omitirá una descripción repetida de los mismos elementos.
La figura 1 es un diagrama de bloques que ilustra un dispositivo para codificar un vídeo de acuerdo con una realización de la presente invención.
Con referencia a la figura 1, el dispositivo 100 para codificar un vídeo puede incluir: un módulo de partición de imágenes 110, módulos de predicción 120 y 125, un módulo de transformación 130, un módulo de cuantificación 135, un módulo de reordenamiento 160, un módulo de codificación de entropía 165, un módulo de cuantificación inversa 140, un módulo de transformación inversa 145, un módulo de filtro 150 y una memoria 155.
La unidad, como se muestra en la figura 1 se muestran de forma independiente para representar funciones características diferentes entre sí en el dispositivo para codificar un vídeo. Por lo tanto, no significa que cada parte constitucional se constituya en una unidad constitucional de hardware o software separado. En otras palabras, cada parte constitucional incluye cada una de las partes constitucionales enumeradas por conveniencia. Por lo tanto, al menos dos partes constitucionales de cada parte constitucional pueden combinarse para formar una parte constitucional o una parte constitucional puede dividirse en una pluralidad de partes constitucionales para realizar cada función. La realización en la que se combina cada parte constitucional y la realización en la que se divide una parte constitucional también se incluyen en el alcance de la presente invención, si no se apartan de la esencia de la presente invención.
Además, algunos de los constituyentes pueden no ser constituyentes indispensables que realizan funciones esenciales de la presente invención, pero pueden ser constituyentes selectivos que mejoran solo el rendimiento de los mismos. La presente invención puede implementarse incluyendo solo las partes constitucionales indispensables para implementar la esencia de la presente invención, excepto los constituyentes utilizados para mejorar el rendimiento. La estructura que incluye solo los constituyentes indispensables, excepto los constituyentes selectivos utilizados para mejorar solo el rendimiento, también se incluye en el alcance de la presente invención.
El módulo de partición de imágenes 110 puede dividir una imagen de entrada en una o más unidades de procesamiento. Aquí, la unidad de procesamiento puede ser una unidad de predicción (PU), una unidad de transformación (TU) o una unidad de codificación (CU). El módulo de partición de imágenes 110 puede dividir una imagen en combinaciones de múltiples unidades de codificación, unidades de predicción y unidades de transformación, y puede codificar una imagen seleccionando una combinación de unidades de codificación, unidades de
predicción y unidades de transformación con un criterio predeterminado (por ejemplo, función de coste).
Por ejemplo, una imagen puede dividirse en varias unidades de codificación. Se puede usar una estructura de árbol recursiva, como una estructura de árbol cuádruple, para dividir una imagen en unidades de codificación. Una unidad de codificación que se divide en otras unidades de codificación con una imagen o una unidad de codificación más grande como raíz puede particionarse con nodos secundarios correspondientes al número de unidades de codificación particionadas. Una unidad de codificación que ya no está particionada por una limitación predeterminada sirve como un nodo de hoja. Es decir, cuando se supone que solo es posible una partición cuadrada para una unidad de codificación, una unidad de codificación se puede dividir como máximo en otras cuatro unidades de codificación.
De aquí en adelante, en la realización de la presente invención, la unidad de codificación puede significar una unidad que realiza la codificación, o una unidad que realiza la descodificación.
Una unidad de predicción puede ser una de las particiones divididas en una forma cuadrada o rectangular que tiene el mismo tamaño en una sola unidad de codificación, o una unidad de predicción puede ser una de las particiones particionadas para tener una forma/tamaño diferente en una sola unidad de codificación.
Cuando se genera una unidad de predicción sujeta a intrapredicción basada en una unidad de codificación y la unidad de codificación no es la unidad de codificación más pequeña, se puede realizar la intrapredicción sin dividir la unidad de codificación en múltiples unidades de predicción NxN.
Los módulos de predicción 120 y 125 pueden incluir un módulo de interpredicción 120 que realiza la interpredicción y un módulo de intrapredicción 125 que realiza la intrapredicción. Se puede determinar si realizar la interpredicción o la intrapredicción para la unidad de predicción, y se puede determinar información detallada (por ejemplo, un modo de intrapredicción, un vector de movimiento, una imagen de referencia, etc.) de acuerdo con cada método de predicción. Aquí, la unidad de procesamiento sujeta a predicción puede ser diferente de la unidad de
procesamiento para la cual se determina el método de predicción y el contenido detallado. Por ejemplo, el método de predicción, el modo de predicción, etc. pueden determinarse por la unidad de predicción, y la unidad de transformación puede realizar la predicción. Se puede ingresar un valor residual (bloque residual) entre el bloque de predicción generado y un bloque original al módulo de transformación 130. Además, la información del modo de predicción, la información del vector de movimiento, etc. utilizada para la predicción puede codificarse con el valor residual mediante el módulo de codificación de entropía 165 y puede transmitirse a un dispositivo para decodificar un vídeo. Cuando se usa un modo de codificación particular, es posible transmitir a un dispositivo para decodificar vídeo codificando el bloque original tal como es sin generar el bloque de predicción a través de los módulos de predicción 120 y 125.
El módulo de interpredicción 120 puede predecir la unidad de predicción basándose en la información de al menos una de una imagen anterior o una imagen subsiguiente de la imagen actual, o puede predecir la unidad de predicción basándose en la información de algunas regiones codificadas en la imagen actual, en algunos casos. El módulo de interpredicción 120 puede incluir un módulo de interpolación de imágenes de referencia, un módulo de predicción de movimiento y un módulo de compensación de movimiento.
El módulo de interpolación de imágenes de referencia puede recibir información de imágenes de referencia de la memoria 155 y puede generar información de píxeles de un píxel entero o menos que el píxel entero de la imagen de referencia. En el caso de píxeles de luminancia, se puede usar un filtro de interpolación de 8 derivaciones basado en DCTcon diferentes coeficientes de filtro para generar información de píxeles de un píxel entero o menos de un píxel entero en unidades de 1/4 de píxel. En el caso de señales de crominancia, se puede usar un filtro de interpolación de 4 derivaciones basado en DCT que tiene un coeficiente de filtro diferente para generar información de píxeles de un píxel entero o menos de un píxel entero en unidades de 1/8 de píxel.
El módulo de predicción de movimiento puede realizar la predicción de movimiento basándose en la imagen de referencia interpolada por el módulo de interpolación de imagen de referencia. Como métodos para calcular un vector de movimiento, se pueden utilizar varios métodos, como un algoritmo de coincidencia de bloques basado en búsqueda completa (FBMA), una búsqueda en tres etapas (TSS), un
nuevo algoritmo de búsqueda en tres etapas (NTS), etc. El vector de movimiento puede tener un valor de vector de movimiento en unidades de 1/2 píxel o 1/4 de píxel basado en un píxel interpolado. El módulo de predicción de movimiento puede predecir una unidad de predicción actual cambiando el método de predicción de movimiento. Como métodos de predicción de movimiento, se pueden usar varios métodos, como el método de omisión, el método de combinación, el método AMVP (predicción avanzada de vectores de movimiento), el método de copia intrabloque, etc.
El módulo de intrapredicción 125 puede generar una unidad de predicción basada en información de píxeles de referencia adyacente a un bloque actual que es información de píxeles en la imagen actual. Cuando el bloque vecino de la unidad de predicción actual es un bloque sometido a interpredicción y, por lo tanto, un píxel de referencia es un píxel sometido a interpredicción, el píxel de referencia incluido en el bloque sometido a interpredicción puede ser reemplazado por información de píxeles de referencia de un bloque vecino sujeto a intrapredicción. Es decir, cuando un píxel de referencia no está disponible, se puede usar al menos un píxel de referencia de píxeles de referencia disponibles en lugar de información de píxeles de referencia no disponible.
Los modos de predicción en la intrapredicción pueden incluir un modo de predicción direccional que utiliza información de píxeles de referencia que depende de la dirección de la predicción y un modo de predicción no direccional que no utiliza información direccional para realizar la predicción. Un modo para predecir la información de luminancia puede ser diferente de un modo para predecir la información de crominancia, y para predecir la información de crominancia, se puede utilizar la información de modo de intrapredicción utilizada para predecir la información de luminancia o información de señal de luminancia predicha.
Al realizar la intrapredicción, cuando el tamaño de la unidad de predicción es el mismo que el tamaño de la unidad de transformación, la intrapredicción se puede realizar en la unidad de predicción en función de los píxeles situados a la izquierda, arriba a la izquierda y arriba de la unidad de predicción. Sin embargo, al realizar la intrapredicción, cuando el tamaño de la unidad de predicción es diferente del tamaño de la unidad de transformación, la intrapredicción puede realizarse utilizando un píxel de referencia basado en la unidad de transformación. Además, la intrapredicción utilizando partición NxN puede usarse solo para la unidad de
codificación más pequeña.
En el método de intrapredicción, se puede generar un bloque de predicción después de aplicar un filtro AIS (filtrado intra adaptativo) a un píxel de referencia en función de los modos de predicción. El tipo de filtro AIS aplicado al píxel de referencia puede variar. Para realizar el método de intrapredicción, se puede predecir un modo de intrapredicción de la unidad de predicción actual a partir del modo de intrapredicción de la unidad de predicción adyacente a la unidad de predicción actual. En la predicción del modo de predicción de la unidad de predicción actual mediante el uso de información de modo predicha desde la unidad de predicción vecina, cuando el modo de intrapredicción de la unidad de predicción actual es el mismo que el modo de intrapredicción de la unidad de predicción vecina, la información indica que los modos de predicción de la unidad de predicción actual y la unidad de predicción vecina son iguales entre sí pueden transmitirse usando información de etiquetado predeterminada. Cuando el modo de predicción de la unidad de predicción actual es diferente del modo de predicción de la unidad de predicción vecina, se puede realizar la codificación de entropía para codificar la información del modo de predicción del bloque actual.
Además, un bloque residual que incluye información sobre un valor residual que es diferente entre la unidad de predicción sometida a predicción y el bloque original de la unidad de predicción puede generarse basándose en las unidades de predicción generadas por los módulos de predicción 120 y 125. El bloque residual generado puede introducirse en el módulo de transformación 130.
El módulo de transformación 130 puede transformar el bloque residual que incluye la información sobre el valor residual entre el bloque original y la unidad de predicción generada por los módulos de predicción 120 y 125 mediante el uso de un método de transformación, como la transformada discreta de coseno (DCT), la transformada de seno discreta (DST), y KLT. La aplicación de DCT, DST o KLT para transformar el bloque residual puede determinarse en función de la información del modo de intrapredicción de la unidad de predicción utilizada para generar el bloque residual.
El módulo de cuantización 135 puede cuantizar los valores transformados en un dominio de frecuencia por el módulo de transformación 130. Los coeficientes de cuantificación pueden variar según el bloque o la importancia de una imagen. Los
valores calculados por el módulo de cuantificación 135 pueden proporcionarse al módulo de cuantificación inversa 140 y al módulo de reordenamiento 160.
El módulo de reordenamiento 160 puede reorganizar los coeficientes de los valores residuales cuantificados.
El módulo de reordenamiento 160 puede cambiar un coeficiente en forma de un bloque bidimensional en un coeficiente en forma de un vector unidimensional a través de un método de exploración de coeficientes. Por ejemplo, el módulo de reordenamiento 160 puede escanear desde un coeficiente CC a un coeficiente en un dominio de alta frecuencia usando un método de escaneo en zigzag para cambiar los coeficientes para que estén en la forma de vectores unidimensionales. Dependiendo del tamaño de la unidad de transformación y del modo de intrapredicción, el escaneo en dirección vertical donde los coeficientes en forma de bloques bidimensionales se escanean en la dirección de columna o el escaneo en dirección horizontal donde los coeficientes en forma de bloques bidimensionales se escanean en la dirección de la fila puede usarse en lugar del escaneo en zigzag. Es decir, el método de exploración entre zigzag, exploración en dirección vertical y exploración en dirección horizontal se puede determinar según el tamaño de la unidad de transformación y el modo de intrapredicción.
El módulo de codificación de entropía 165 puede realizar la codificación de entropía basándose en los valores calculados por el módulo de reordenamiento 160. La codificación de entropía puede utilizar varios métodos de codificación, por ejemplo, la codificación exponencial de Golomb, la codificación de longitud variable adaptada al contexto (CAVLC) y la codificación aritmética binaria adaptada al contexto (CABAC).
El módulo de codificación de entropía 165 puede codificar una variedad de información, tal como información de coeficiente de valor residual e información de tipo de bloque de la unidad de codificación, información de modo de predicción, información de unidad de partición, información de unidad de predicción, información de unidad de transformación, información de vector de movimiento, información de cuadro de referencia, información de interpolación de bloque, información de filtrado, etc. del módulo de reordenamiento 160 y los módulos de predicción 120 y 125.
El módulo de codificación de entropía 165 puede codificar mediante entropía los coeficientes de la entrada de la unidad de codificación del módulo de reordenamiento 160.
El módulo de cuantización inversa 140 puede cuantizar inversamente los valores cuantificados por el módulo de cuantificación 135 y el módulo de transformación inversa 145 puede transformar inversamente los valores transformados por el módulo de transformación 130. El valor residual generado por el módulo de cuantización inversa 140 y el módulo de transformación inversa 145 puede combinarse con la unidad de predicción predicha por un módulo de estimación de movimiento, un módulo de compensación de movimiento y el módulo de intrapredicción de los módulos de predicción 120 y 125, de manera que se puede generar un bloque reconstruido.
El módulo de filtro 150 puede incluir al menos uno de entre un filtro de desbloqueo, una unidad de corrección de desplazamiento y un filtro de bucle adaptativo (ALF).
El filtro de desbloqueo puede eliminar la distorsión del bloque que se produce debido a los límites entre los bloques en la imagen reconstruida. Para determinar si se debe realizar el desbloqueo, los píxeles incluidos en varias filas o columnas en el bloque pueden ser una base para determinar si aplicar el filtro de desbloqueo al bloque actual. Cuando el filtro de desbloqueo se aplica al bloque, se puede aplicar un filtro fuerte o un filtro débil dependiendo de la fuerza de filtrado de desbloqueo requerida. Además, al aplicar el filtro de desbloqueo, el filtrado en dirección horizontal y el filtrado en dirección vertical pueden procesarse en paralelo.
El módulo de corrección de desplazamiento puede corregir el desplazamiento con la imagen original en unidades de un píxel en la imagen sujeta a desbloqueo. Para realizar la corrección de desplazamiento en una imagen en particular, es posible usar un método para aplicar el desplazamiento en consideración a la información de borde de cada píxel o un método de partición de píxeles de una imagen en el número predeterminado de regiones, determinando una región para estar sujeta a realizar un desplazamiento, y aplicar el desplazamiento a la región determinada.
El filtrado de bucle adaptativo (ALF) se puede realizar según el valor obtenido al comparar la imagen reconstruida filtrada y la imagen original. Los píxeles incluidos en la imagen se pueden dividir en grupos predeterminados, se puede determinar un
filtro que se aplicará a cada uno de los grupos y se puede realizar un filtrado individual para cada grupo. La información sobre si aplicar ALF y una señal de luz puede ser transmitida por unidades de codificación (CU). La forma y el coeficiente de filtro de un filtro para ALF pueden variar dependiendo de cada bloque. Además, el filtro para ALF en la misma forma (forma fija) puede aplicarse independientemente de las características del bloque objetivo de la aplicación.
La memoria 155 puede almacenar el bloque reconstruido o la imagen calculada a través del módulo de filtro 150. El bloque o imagen reconstruidos almacenados pueden proporcionarse a los módulos de predicción 120 y 125 para realizar la interpredicción.
La figura 2 es un diagrama de bloques de un dispositivo para decodificar un vídeo de acuerdo con una realización de la presente invención.
Con referencia a la figura 2, el dispositivo 200 para decodificar un vídeo puede incluir: un módulo de decodificación de entropía 210, un módulo de reorganización 215, un módulo de cuantificación inversa 220, un módulo de transformación inversa 225, módulos de predicción 230 y 235, un módulo de filtro 240 y una memoria 245.
Cuando se ingresa un flujo de bits de vídeo desde el dispositivo para codificar un vídeo, el flujo de bits de entrada se puede decodificar de acuerdo con un proceso inverso del dispositivo para codificar un vídeo.
El módulo de decodificación de entropía 210 puede realizar la decodificación de entropía de acuerdo con un proceso inverso de codificación de entropía por el módulo de codificación de entropía del dispositivo para codificar un vídeo. Por ejemplo, según los métodos realizados por el dispositivo para codificar un vídeo, se pueden aplicar varios métodos, como la codificación exponencial de Golomb, la codificación de longitud variable adaptada al contexto (CAVLC) y la codificación aritmética binaria adaptada al contexto (CABAC).
El módulo de decodificación de entropía 210 puede decodificar información sobre la intrapredicción e interpredicción realizada por el dispositivo para codificar un vídeo.
El módulo de reordenamiento 215 puede realizar un reordenamiento en la entropía del flujo de bits descodificado por el módulo de descodificación de entropía 210 en
base al método de reordenamiento utilizado en el dispositivo para codificar un vídeo. El módulo de reorganización puede reconstruir y reorganizar los coeficientes en forma de vectores unidimensionales al coeficiente en forma de bloques bidimensionales. El módulo de reordenamiento 215 puede recibir información relacionada con el escaneo de coeficientes realizado en el dispositivo para codificar un vídeo y puede realizar un reordenamiento a través de un método de escaneo inverso de los coeficientes en función del orden de escaneo realizado en el dispositivo para codificar un vídeo.
El módulo de cuantización inversa 220 puede realizar una cuantificación inversa basada en un parámetro de cuantificación recibido del dispositivo para codificar un vídeo y los coeficientes reorganizados del bloque.
El módulo de transformación inversa 225 puede realizar la transformación inversa, es decir, DCT inversa, DST inversa y KLT inversa, que es el proceso inverso de la transformación, es decir, DCT, DST y KLT, realizada por el módulo de transformación en el resultado de cuantificación por el dispositivo para codificar un vídeo. La transformación inversa se puede realizar en función de una unidad de transferencia determinada por el dispositivo para codificar un vídeo. El módulo de transformación inversa 225 del dispositivo para decodificar un vídeo puede realizar esquemas de transformación selectivamente (por ejemplo, DCT, DST y KLT) dependiendo de múltiples datos, como el método de predicción, el tamaño del bloque actual, la dirección de predicción, etc.
Los módulos de predicción 230 y 235 pueden generar un bloque de predicción basado en información sobre la generación de bloque de predicción recibida desde el módulo de descodificación de entropía 210 y la información de imagen o bloque previamente decodificado recibida desde la memoria 245.
Como se describió anteriormente, al igual que la operación del dispositivo para codificar un vídeo, al realizar la intrapredicción, cuando el tamaño de la unidad de predicción es el mismo que el tamaño de la unidad de transformación, la intrapredicción se puede realizar en la unidad de predicción en función de píxeles posicionados a la izquierda, arriba a la izquierda y arriba de la unidad de predicción. Al realizar la intrapredicción, cuando el tamaño de la unidad de predicción es diferente del tamaño de la unidad de transformación, la intrapredicción se puede realizar utilizando un píxel de referencia basado en la unidad de transformación.
Además, la intrapredicción utilizando partición NxN puede usarse solo para la unidad de codificación más pequeña.
Los módulos de predicción 230 y 235 pueden incluir un módulo de determinación de unidad de predicción, un módulo de interpredicción y un módulo de intrapredicción. El módulo de determinación de la unidad de predicción puede recibir una variedad de información, como la información de la unidad de predicción, la información del modo de predicción de un método de intrapredicción, la información sobre la predicción de movimiento de un método de interpredicción, etc. del módulo de descodificación de entropía 210, puede dividir una corriente codificar la unidad en unidades de predicción, y puede determinar si la interpredicción o intrapredicción se realiza en la unidad de predicción. Al utilizar la información requerida en la interpredicción de la unidad de predicción actual recibida del dispositivo para codificar un vídeo, el módulo 230 de interpredicción puede realizar la interpredicción en la unidad de predicción actual basándose en la información de al menos una de una imagen anterior o una imagen posterior de la imagen actual incluyendo la unidad de predicción actual. Alternativamente, la interpredicción se puede realizar en base a la información de algunas regiones reconstruidas previamente en la imagen actual, incluida la unidad de predicción actual.
Para realizar la interpredicción, se puede determinar para la unidad de codificación cuál de un modo de salto, un modo de combinación, un modo AMVP y un modo de copia entre bloques se utiliza como método de predicción de movimiento de la unidad de predicción incluida en la unidad de codificación.
El módulo de intrapredicción 235 puede generar un bloque de predicción basado en la información de píxeles en la imagen actual. Cuando la unidad de predicción es una unidad de predicción sujeta a intrapredicción, la intrapredicción se puede realizar basándose en la información del modo de intrapredicción de la unidad de predicción recibida del dispositivo para codificar un vídeo. El módulo de intrapredicción 235 puede incluir un filtro de filtrado intra adaptativo (AIS), un módulo de interpolación de píxeles de referencia y un filtro de CC. El filtro AIS realiza el filtrado en el píxel de referencia del bloque actual, y la aplicación del filtro se puede determinar según el modo de predicción de la unidad de predicción actual. El filtrado AIS se puede realizar en el píxel de referencia del bloque actual utilizando el modo de predicción de la unidad de predicción y la información del filtro AIS recibida del dispositivo para codificar un vídeo. Cuando el modo de predicción
del bloque actual es un modo donde no se realiza el filtrado AIS, es posible que no se aplique el filtro AIS.
Cuando el modo de predicción de la unidad de predicción es un modo de predicción donde la intrapredicción se realiza en función del valor de píxel obtenido al interpolar el píxel de referencia, el módulo de interpolación de píxel de referencia puede interpolar el píxel de referencia para generar el píxel de referencia de un píxel entero o menos que un píxel entero. Cuando el modo de predicción de la unidad de predicción actual es un modo de predicción donde se genera un bloque de predicción sin interpolación del píxel de referencia, el píxel de referencia no se puede interpolar. El filtro de CC puede generar un bloque de predicción a través del filtrado cuando el modo de predicción del bloque actual es un modo de CC.
El bloque o la imagen reconstruidos pueden proporcionarse al módulo de filtro 240. El módulo de filtro 240 puede incluir el filtro de desbloqueo, el módulo de corrección de desplazamiento y el ALF.
La información sobre si el filtro de desbloqueo se aplica o no al bloque o imagen correspondiente y la información sobre cuál de los filtros fuertes y débiles se aplica cuando se aplica el filtro de desbloqueo puede recibirse del dispositivo para codificar un vídeo. El filtro de desbloqueo del dispositivo para decodificar un vídeo puede recibir información sobre el filtro de desbloqueo del dispositivo para codificar un vídeo, y puede realizar un filtrado de desbloqueo en el bloque correspondiente.
El módulo de corrección de desplazamiento puede realizar la corrección de desplazamiento en la imagen reconstruida en función del tipo de corrección de desplazamiento y la información del valor de desplazamiento aplicada a una imagen al realizar la codificación.
El ALF se puede aplicar a la unidad de codificación en función de la información sobre si se debe aplicar el ALF, la información del coeficiente de ALF, etc., recibida del dispositivo para codificar un vídeo. La información ALF puede proporcionarse como incluida en un conjunto de parámetros particular.
La memoria 245 puede almacenar la imagen o bloque reconstruido para usar como imagen o bloque de referencia, y puede proporcionar la imagen reconstruida a un módulo de salida.
Como se describió anteriormente, en la realización de la presente invención, por conveniencia de explicación, la unidad de codificación se usa como un término que representa una unidad para la codificación, pero la unidad de codificación puede servir como una unidad que realiza la decodificación, así como la codificación.
Además, un bloque actual puede representar un bloque objetivo para ser codificado/decodificado. Y, el bloque actual puede representar un bloque de árbol de codificación (o una unidad de árbol de codificación), un bloque de codificación (o una unidad de codificación), un bloque de transformación (o una unidad de transformación), un bloque de predicción (o una unidad de predicción), o similares, dependiendo de un paso de codificación/decodificación.
Una imagen puede codificarse/decodificarse dividiéndose en bloques de base que tienen una forma cuadrada o una forma no cuadrada. En este momento, se puede hacer referencia al bloque de base como una unidad de árbol de codificación. La información sobre si la unidad del árbol de codificación tiene una forma cuadrada o si tiene forma no cuadrada o la información sobre el tamaño de la unidad del árbol de codificación se puede señalar a través de un conjunto de parámetros de secuencia, un conjunto de parámetros de imagen o un encabezado de división. La unidad del árbol de codificación se puede dividir en un árbol cuádruple o una estructura de árbol binario para que se pueda generar una unidad de codificación.
La figura 3 es un dibujo que ilustra un ejemplo de partición jerárquica de un bloque de codificación basado en una estructura de árbol de acuerdo con una realización de la presente invención.
Una señal de vídeo de entrada se decodifica en unidades de bloque predeterminadas. Dicha unidad predeterminada para decodificar la señal de entrada de vídeo es un bloque de codificación. El bloque de codificación puede ser una unidad que realiza intra/interpredicción, transformación y cuantificación. Además, se determina un modo de predicción (por ejemplo, modo de intrapredicción o modo de interpredicción) en unidades de un bloque de codificación, y los bloques de predicción incluidos en el bloque de codificación pueden compartir el modo de predicción determinado. El bloque de codificación puede ser un bloque cuadrado o no cuadrado que tenga un tamaño arbitrario en un rango de 8x8 a 64x64, o puede ser un bloque cuadrado o no cuadrado que tenga un tamaño de 128x128, 256x256
o más.
Específicamente, el bloque de codificación se puede dividir jerárquicamente en función de al menos uno de un árbol cuádruple y un árbol binario. Aquí, la partición basada en árbol cuádruple puede significar que un bloque de codificación 2Nx2N se divide en cuatro bloques de codificación NxN, y la partición basada en un árbol binario puede significar que un bloque de codificación se divide en dos bloques de codificación. La partición basada en árboles binarios se puede realizar de manera simétrica o asimétrica. El bloque de codificación dividido en función del árbol binario puede ser un bloque cuadrado o un bloque no cuadrado, como una forma rectangular. La partición basada en árbol binario se puede realizar en un bloque de codificación donde ya no se realiza la partición basada en árbol cuádruple. La partición basada en árbol cuádruple ya no se puede realizar en el bloque de codificación particionado en base al árbol binario.
Para implementar la partición adaptativa basada en el árbol cuádruple o en el árbol binario, la información que indica la partición basada en el árbol cuádruple, la información sobre el tamaño/profundidad del bloque de codificación que permite la partición basada en el árbol cuádruple, la información que indica la partición basada en el árbol binario, información sobre el tamaño/profundidad del bloque de codificación en que se permite la partición basada en árbol binario, información sobre el tamaño/profundidad del bloque de codificación en la que no se permite la partición basada en árbol binario, se puede utilizar información sobre si la partición basada en árbol binario se realiza en una dirección vertical o una dirección horizontal, etc.
Como se muestra en la figura 3, el primer bloque de codificación 300 con la profundidad de partición (profundidad de división) de k puede dividirse en múltiples segundos bloques de codificación basados en el árbol cuádruple. Por ejemplo, los segundos bloques de codificación 310 a 340 pueden ser bloques cuadrados que tienen la mitad del ancho y la mitad de la altura del primer bloque de codificación, y la profundidad de partición del segundo bloque de codificación se puede aumentar a k 1.
El segundo bloque de codificación 310 con la profundidad de partición de k 1 puede dividirse en múltiples terceros bloques de codificación con la profundidad de partición de k 2. La partición del segundo bloque de codificación 310 se puede
realizar utilizando selectivamente uno del árbol cuádruple y el árbol binario dependiendo de un método de partición. Aquí, el método de partición se puede determinar en función de al menos una de las informaciones que indican la partición basada en árbol cuádruple y la información que indica la partición basada en árboles binarios.
Cuando el segundo bloque de codificación 310 se divide en función del árbol cuádruple, el segundo bloque de codificación 310 puede dividirse en cuatro terceros bloques de codificación 310a que tienen la mitad del ancho y la mitad de la altura del segundo bloque de codificación, y la profundidad de partición de la tercera codificación el bloque 310a se puede aumentar a k 2. Por el contrario, cuando el segundo bloque de codificación 310 se divide en función del árbol binario, el segundo bloque de codificación 310 puede dividirse en dos terceros bloques de codificación. Aquí, cada uno de los dos terceros bloques de codificación puede ser un bloque no cuadrado que tiene una anchura media y la mitad de la altura del segundo bloque de codificación, y la profundidad de la partición se puede aumentar a k 2. El segundo bloque de codificación se puede determinar como un bloque no cuadrado de una dirección horizontal o vertical que depende de una dirección de partición, y la dirección de partición se puede determinar según la información sobre si la partición basada en árbol binario se realiza en una dirección vertical o una dirección horizontal.
Mientras tanto, el segundo bloque de codificación 310 puede determinarse como un bloque de codificación de hoja que ya no está particionado en función del árbol cuádruple o del árbol binario. En este caso, el bloque de codificación de hoja se puede utilizar como un bloque de predicción o un bloque de transformación.
Al igual que la partición del segundo bloque de codificación 310, el tercer bloque de codificación 310a puede determinarse como un bloque de codificación de hoja, o puede dividirse adicionalmente en base al árbol cuádruple o al árbol binario.
Mientras tanto, el tercer bloque de codificación 310b particionado en base al árbol binario puede dividirse adicionalmente en los bloques de codificación 310b-2 de una dirección vertical o los bloques de codificación 310b-3 de una dirección horizontal en base al árbol binario, y la profundidad de partición de los bloques de codificación relevantes se pueden aumentar a k 3. Alternativamente, el tercer bloque de codificación 310b puede determinarse como un bloque de codificación de hoja
310b-1 que ya no está particionado en base al árbol binario. En este caso, el bloque de codificación 310b-1 puede usarse como un bloque de predicción o un bloque de transformación. Sin embargo, el proceso de partición anterior se puede realizar de forma limitada en función de al menos una de las informaciones sobre el tamaño/profundidad del bloque de codificación que permite la partición basada en árbol cuádruple, la información sobre el tamaño/profundidad del bloque de codificación que permite la partición basada en ese árbol binario, y la información sobre el tamaño/profundidad del bloque de codificación que no permite la partición basada en árbol binario.
Un número de un candidato que representa un tamaño de un bloque de codificación puede estar limitado a un número predeterminado, o un tamaño de un bloque de codificación en una unidad predeterminada puede tener un valor fijo. Como ejemplo, el tamaño del bloque de codificación en una secuencia o en una imagen puede limitarse a tener 256x256, 128x128 o 32x32. La información que indica el tamaño del bloque de codificación en la secuencia o en la imagen se puede señalizar a través de un encabezado de secuencia o un encabezado de imagen.
Un bloque de codificación se codifica utilizando al menos uno del modo de omisión, intrapredicción, interpredicción o método de omisión. Una vez que se determina un bloque de codificación, se puede determinar un bloque de predicción a través de la partición predictiva del bloque de codificación. La partición predictiva del bloque de codificación se puede realizar mediante un modo de partición (Part_mode) que indica un tipo de partición del bloque de codificación. Un tamaño o una forma del bloque de predicción se puede determinar de acuerdo con el modo de partición del bloque de codificación. Por ejemplo, un tamaño de un bloque de predicción determinado de acuerdo con el modo de partición puede ser igual o menor que un tamaño de un bloque de codificación.
La figura 4 es un diagrama que ilustra un modo de partición que puede aplicarse a un bloque de codificación cuando el bloque de codificación está codificado mediante interpredicción.
Cuando un bloque de codificación se codifica por interpredicción, se puede aplicar uno de los 8 modos de partición al bloque de codificación, como en el ejemplo mostrado en la figura 4.
Cuando un bloque de codificación se codifica por intrapredicción, se puede aplicar un modo de partición PART_2Nx2N o un modo de partición PART_NxN al bloque de codificación.
PART_NxN puede aplicarse cuando un bloque de codificación tiene un tamaño mínimo. Aquí, el tamaño mínimo del bloque de codificación se puede predefinir en un codificador y un decodificador. O bien, la información sobre el tamaño mínimo del bloque de codificación puede ser señalizada a través de un flujo de bits. Por ejemplo, el tamaño mínimo del bloque de codificación se puede señalar a través de un encabezado de segmento, de modo que el tamaño mínimo del bloque de codificación se puede definir por segmento.
En general, un bloque de predicción puede tener un tamaño de 64^64 a 4x4. Sin embargo, cuando un bloque de codificación está codificado mediante interpredicción, se puede restringir que el bloque de predicción no tenga un tamaño de 4x4 para reducir el ancho de banda de la memoria cuando se realiza la compensación de movimiento.
La figura 5 es un dibujo que ilustra tipos de modos de intrapredicción predefinidos para un dispositivo para codificar/decodificar un vídeo de acuerdo con una realización de la presente invención.
El dispositivo para codificar/decodificar un vídeo puede realizar intrapredicción utilizando uno de los modos de intrapredicción predefinidos. Los modos de intrapredicción predefinidos para la intrapredicción pueden incluir modos de predicción no direccionales (por ejemplo, un modo plano, un modo DC) y 33 modos de predicción direccional.
Alternativamente, para mejorar la precisión de la intrapredicción, se puede utilizar un número mayor de modos de predicción direccional que los 33 modos de predicción direccional. Es decir, se pueden definir M modos de predicción direccional extendida mediante la subdivisión de los ángulos de los modos de predicción direccional (M > 33), y un modo de predicción direccional que tiene un ángulo predeterminado puede derivarse utilizando al menos uno de los 33 modos de predicción direccional predefinidos.
Un número mayor de modos de intrapredicción que 35 modos de intrapredicción
mostrados en la figura 5 puede ser utilizado. Por ejemplo, se puede usar un número mayor de modos de intrapredicción que los 35 modos de intrapredicción subdividiendo los ángulos de los modos de predicción direccional o derivando un modo de predicción direccional que tiene un ángulo predeterminado utilizando al menos uno de un número predefinido de modos de predicción direccional. En este momento, el uso de un número mayor de modos de intrapredicción que los 35 modos de intrapredicción puede ser referido como un modo de intrapredicción extendida.
La figura 6 muestra un ejemplo de los modos de intrapredicción extendida, y los modos de intrapredicción extendida pueden incluir dos modos de predicción no direccionales y 65 modos de predicción direccional extendida. Se pueden usar los mismos números de los modos de intrapredicción extendida para un componente de luminancia y un componente de crominancia, o se puede usar un número diferente de modos de intrapredicción para cada componente. Por ejemplo, se pueden usar 67 modos de intrapredicción extendida para el componente de luminancia, y se pueden usar 35 modos de intrapredicción para el componente de crominancia.
Alternativamente, dependiendo del formato de crominancia, se puede usar un número diferente de modos de intrapredicción para realizar la intrapredicción. Por ejemplo, en el caso del formato 4: 2: 0, se pueden usar 67 modos de intrapredicción para que el componente de luminancia realice la intrapredicción y se pueden usar 35 modos de intrapredicción para el componente de crominancia. En el caso del formato 4:4:4, se pueden usar 67 modos de intrapredicción para el componente de luminancia y el componente de crominancia para realizar la intrapredicción.
Alternativamente, dependiendo del tamaño y/o la forma del bloque, se puede usar un número diferente de modos de intrapredicción para realizar la intrapredicción. Es decir, dependiendo del tamaño y/o la forma de la PU o la CU, se pueden usar 35 modos de intrapredicción o 67 modos de intrapredicción para realizar la intrapredicción. Por ejemplo, cuando la CU o la PU tienen un tamaño inferior a 64x64 o está dividida asimétricamente, se pueden usar 35 modos de intrapredicción para realizar la intrapredicción. Cuando el tamaño de la CU o PU es igual o mayor que 64x64, se pueden usar 67 modos de intrapredicción para realizar la intrapredicción. Se pueden permitir 65 modos de intrapredicción direccional para Intra_2Nx2N, y solo se pueden permitir 35 modos de intrapredicción direccional
para Intra_NxN.
El tamaño de un bloque al que se aplica el modo de intrapredicción extendida puede configurarse de manera diferente para cada secuencia, imagen o segmento. Por ejemplo, se establece que el modo de intrapredicción extendida se aplica a un bloque (por ejemplo, CU o PU) que tiene un tamaño mayor que 64x64 en la primera división. Por otro lado, se establece que el modo de intrapredicción extendida se aplica a un bloque que tiene un tamaño superior a 32x32 en la segunda división. La información que representa el tamaño de un bloque al que se aplica el modo de intrapredicción extendida puede señalizarse en unidades de una secuencia, una imagen o un segmento. Por ejemplo, la información que indica el tamaño del bloque al que se aplica el modo de intrapredicción extendida puede definirse como 'log2_extended_intra_mode_size_minus4' obtenida al tomar un logaritmo del tamaño del bloque y luego restar el número entero 4. Por ejemplo, si un valor de log2_extended_intra_mode_size_minus4 es 0, puede indicar que el modo de intrapredicción extendida puede aplicarse a un bloque que tenga un tamaño igual o mayor que 16x16. Y si un valor de log2_extended_intra_mode_size_minus4 es 1, puede indicar que el modo de intrapredicción extendida puede aplicarse a un bloque que tenga un tamaño igual o mayor que 32x32.
Como se describió anteriormente, el número de modos de intrapredicción puede determinarse considerando al menos uno de un componente de color, un formato de crominancia y un tamaño o una forma de un bloque. Además, el número de candidatos para el modo de intrapredicción (por ejemplo, el número de MPM) utilizado para determinar un modo de intrapredicción de un bloque actual para codificar/decodificar también se puede determinar de acuerdo con al menos uno de un componente de color, un formato de color, y el tamaño o la forma de un bloque. Con los dibujos se describirá un método para determinar un modo de intrapredicción de un bloque actual para codificar/decodificar y un método para realizar la intrapredicción utilizando el modo de intrapredicción determinado.
La figura 7 es un diagrama de flujo que ilustra brevemente un método de intrapredicción según una realización de la presente invención.
Con referencia a la figura 7, se puede determinar un modo de intrapredicción del bloque actual en la etapa S800.
Específicamente, el modo de intrapredicción del bloque actual puede derivarse en base a una lista de candidatos y un índice. Aquí, la lista de candidatos contiene múltiples candidatos, y los múltiples candidatos pueden determinarse en función de un modo de intrapredicción del bloque vecino adyacente al bloque actual. El bloque vecino puede incluir al menos uno de los bloques ubicados en la parte superior, la parte inferior, la izquierda, la derecha y la esquina del bloque actual. El índice puede especificar uno de los múltiples candidatos de la lista de candidatos. El candidato especificado por el índice puede establecerse en el modo de intrapredicción del bloque actual.
Un modo de intrapredicción usado para la intrapredicción en el bloque vecino se puede establecer como candidato. Además, un modo de intrapredicción que tiene direccionalidad similar a la del modo de intrapredicción del bloque vecino se puede establecer como candidato. Aquí, el modo de intrapredicción que tiene una direccionalidad similar puede determinarse sumando o restando un valor constante predeterminado a o del modo de intrapredicción del bloque vecino. El valor constante predeterminado puede ser un número entero, como uno, dos o más.
La lista de candidatos puede incluir además un modo predeterminado. El modo predeterminado puede incluir al menos uno de un modo planar, un modo DC, un modo vertical y un modo horizontal. El modo predeterminado se puede agregar adaptativamente considerando el número máximo de candidatos que se pueden incluir en la lista de candidatos del bloque actual.
El número máximo de candidatos que se pueden incluir en la lista de candidatos puede ser tres, cuatro, cinco, seis o más. El número máximo de candidatos que pueden incluirse en la lista de candidatos puede ser un valor preestablecido en el dispositivo para codificar/decodificar un vídeo, o puede determinarse de forma variable en función de una característica del bloque actual. La característica puede significar la ubicación/tamaño/forma del bloque, el número/tipo de modos de intrapredicción que puede usar el bloque, un tipo de color, un formato de color, etc. Alternativamente, la información que indique el número máximo de candidatos que pueden ser incluido en la lista de candidatos puede señalarse por separado, y el número máximo de candidatos que pueden incluirse en la lista de candidatos puede determinarse de manera variable utilizando la información. La información que indica el número máximo de candidatos se puede señalar en al menos uno de un nivel de secuencia, un nivel de imagen, un nivel de división y un nivel de bloque.
Cuando se utilizan selectivamente los modos de intrapredicción extendida y los modos de intrapredicción predefinidos, los modos de intrapredicción de los bloques vecinos pueden transformarse en índices correspondientes a los modos de intrapredicción extendida, o en índices correspondientes a los 35 modos de intrapredicción, mediante los cuales se pueden derivar candidatos. Para la transformación a un índice, se puede usar una tabla predefinida, o se puede usar una operación de escala basada en un valor predeterminado. Aquí, la tabla predefinida puede definir una relación de asignación entre diferentes grupos de modos de intrapredicción (por ejemplo, modos de intrapredicción extendida y 35 modos de intrapredicción).
Por ejemplo, cuando el bloque vecino izquierdo utiliza los 35 modos de intrapredicción y el modo de intrapredicción del bloque vecino izquierdo es 10 (un modo horizontal), puede transformarse en un índice de 16 correspondiente a un modo horizontal en los modos de intrapredicción extendida.
Alternativamente, cuando el bloque vecino superior utiliza los modos de intrapredicción extendida y el modo de intrapredicción el bloque vecino superior tiene un índice de 50 (un modo vertical), se puede transformar en un índice de 26 correspondiente a un modo vertical en los 35 modos de intrapredicción.
Según el método descrito anteriormente para determinar el modo de intrapredicción, el modo de intrapredicción puede derivarse independientemente para cada componente de la luminancia y el componente de crominancia, o el modo de intrapredicción del componente de crominancia puede derivarse dependiendo del modo de intrapredicción del componente de luminancia.
Específicamente, el modo de intrapredicción del componente de crominancia se puede determinar en función del modo de intrapredicción del componente de luminancia como se muestra en la siguiente Tabla 1.
Tabla 1
En la Tabla 1, intra_chroma_pred_mode significa información señalizada para especificar el modo de intrapredicción del componente de crominancia, e IntraPredModeY indica el modo de intrapredicción del componente de luminancia.
Con referencia a la figura 7, se puede derivar una muestra de referencia para la intrapredicción del bloque actual en la etapa S710.
Específicamente, una muestra de referencia para la intrapredicción puede derivarse en base a una muestra vecina del bloque actual. La muestra vecina puede ser una muestra reconstruida del bloque vecino, y la muestra reconstruida puede ser una muestra reconstruida antes de que se aplique un filtro en bucle o una muestra reconstruida después de que se aplique el filtro en bucle.
Una muestra vecina reconstruida antes del bloque actual se puede usar como muestra de referencia, y una muestra vecina filtrada en base a un filtro intra predeterminado se puede usar como muestra de referencia. El filtrado de muestras vecinas utilizando un filtro intra también se puede denominar filtrado de muestras de referencia. El filtro intra puede incluir al menos uno de los primeros filtros intra aplicados a múltiples muestras adyacentes ubicadas en la misma línea horizontal y el segundo filtro intra aplicado a múltiples muestras vecinas ubicadas en la misma línea vertical. Dependiendo de las posiciones de las muestras vecinas, uno del primer filtro intra y el segundo filtro intra puede aplicarse selectivamente, o pueden aplicarse ambos filtros intra. En este momento, al menos un coeficiente de filtro del primer filtro intra o del segundo filtro intra puede ser (1, 2, 1), pero no está limitado a ello.
El filtrado puede realizarse de forma adaptativa en función de al menos uno de los modos de intrapredicción del bloque actual y el tamaño del bloque de transformación para el bloque actual. Por ejemplo, cuando el modo de intrapredicción del bloque actual es el modo CC, el modo vertical o el modo horizontal, es posible que no se realice el filtrado. Cuando el tamaño del bloque de
transformación es NxM, no se puede realizar el filtrado. Aquí, N y M pueden ser los mismos valores o valores diferentes, o pueden ser valores de 4, 8, 16 o más. Por ejemplo, si el tamaño del bloque de transformación es 4x4, no se puede realizar el filtrado. Alternativamente, el filtrado se puede realizar de forma selectiva en función del resultado de una comparación de un umbral predefinido y la diferencia entre el modo de intrapredicción del bloque actual y el modo vertical (o el modo horizontal). Por ejemplo, cuando la diferencia entre el modo de intrapredicción del bloque actual y el modo vertical es mayor que un umbral, se puede realizar el filtrado. El umbral se puede definir para cada tamaño del bloque de transformación como se muestra en la Tabla 2.
Tabla 2
El filtro intra se puede determinar como uno de los múltiples candidatos de filtro intra predefinidos en el dispositivo para codificar/decodificar un vídeo. Para este fin, se puede señalar un índice que especifique un filtro intra del bloque actual entre los múltiples candidatos de filtro intra. Alternativamente, el filtro intra se puede determinar en función de al menos uno de los tamaños/formas del bloque actual, el tamaño/formas del bloque de transformación, información sobre la intensidad del filtro y las variaciones de las muestras vecinas.
Con referencia a la figura 7, la intrapredicción puede realizarse utilizando el modo de intrapredicción del bloque actual y la muestra de referencia en la etapa S720.
Es decir, la muestra de predicción del bloque actual puede obtenerse utilizando el modo de intrapredicción determinado en la etapa S700 y la muestra de referencia derivada en la etapa S710. Sin embargo, en el caso de la intrapredicción, se puede usar una muestra delimitadora del bloque vecino y, por lo tanto, la calidad de la imagen de predicción puede disminuir. Por lo tanto, se puede realizar un proceso de corrección en la muestra de predicción generada a través del proceso de predicción descrito anteriormente, y se describirá en detalle con referencia a las figuras 8 a 10. Sin embargo, el proceso de corrección no se limita a aplicarse solo a la muestra de intrapredicción, y puede aplicarse a una muestra de interpredicción o la muestra
reconstruida.
La figura 8 es un dibujo que ilustra un método para corregir una muestra de predicción de un bloque actual basándose en información diferencial de muestras vecinas de acuerdo con una realización de la presente invención.
La muestra de predicción del bloque actual puede corregirse basándose en la información diferencial de múltiples muestras vecinas para el bloque actual. La corrección se puede realizar en todas las muestras de predicción en el bloque actual, o se puede realizar en muestras de predicción en regiones parciales predeterminadas. Las regiones parciales pueden ser una fila/columna o múltiples filas/columnas, y estas pueden ser regiones preestablecidas para la corrección en el dispositivo para codificar/decodificar un vídeo. Por ejemplo, la corrección se puede realizar en una fila/columna ubicada en un límite del bloque actual o se puede realizar en una pluralidad de filas/columnas desde un límite del bloque actual. Alternativamente, las regiones parciales se pueden determinar de forma variable en función de al menos uno de los tamaños/formas del bloque actual y el modo de intrapredicción.
Las muestras vecinas pueden pertenecer a los bloques vecinos ubicados en la esquina superior izquierda y superior izquierda del bloque actual. El número de muestras vecinas utilizadas para la corrección puede ser dos, tres, cuatro o más. Las posiciones de las muestras vecinas pueden determinarse de manera variable dependiendo de la posición de la muestra de predicción que es el objetivo de corrección en el bloque actual. Alternativamente, algunas de las muestras vecinas pueden tener posiciones fijas independientemente de la posición de la muestra de predicción que es el objetivo de corrección, y las muestras vecinas restantes pueden tener posiciones variables dependiendo de la posición de la muestra de predicción que es el objetivo de corrección.
La información diferencial de las muestras vecinas puede significar una muestra diferencial entre las muestras vecinas, o puede significar un valor obtenido al escalar la muestra diferencial por un valor constante predeterminado (por ejemplo, uno, dos, tres, etc.). Aquí, el valor constante predeterminado se puede determinar considerando la posición de la muestra de predicción que es el objetivo de corrección, la posición de la columna o fila que incluye la muestra de predicción que es el objetivo de corrección, la posición de la muestra de predicción dentro de la
columna o fila, etc.
Por ejemplo, cuando el modo de intrapredicción del bloque actual es el modo vertical, las muestras diferenciales entre la muestra vecina superior izquierda p(-1, -1) y las muestras vecinas p(-1, y) adyacentes al límite izquierdo del bloque actual se puede usar para obtener la muestra de predicción final como se muestra en la Ecuación 1.
Ecuación 1
P(0,y) = P(0,y)+((p(-1,y)-p(-1,-1)) >> 1 para y = 0...N-1
Por ejemplo, cuando el modo de intrapredicción del bloque actual es el modo horizontal, las muestras diferenciales entre la muestra vecina superior izquierda p(-1, -1) y las muestras vecinas p(x, -1) adyacentes al límite superior del bloque actual se puede usar para obtener la muestra de predicción final como se muestra en la Ecuación 2.
Ecuación 2
P(x,0) = P(x,0)+((p(x,-1)-p(-1,-1)) >> 1 para x = 0...N-1
Por ejemplo, cuando el modo de intrapredicción del bloque actual es el modo vertical, las muestras diferenciales entre la muestra vecina superior izquierda p(-1, -1) y las muestras vecinas p(-1, y) adyacentes al límite izquierdo del bloque actual se puede utilizar para obtener la muestra de predicción final. Aquí, la muestra diferencial se puede agregar a la muestra de predicción, o la muestra diferencial se puede escalar en un valor constante predeterminado, y luego se agrega a la muestra de predicción. El valor constante predeterminado utilizado en el escalado puede determinarse de manera diferente dependiendo de la columna y/o fila. Por ejemplo, la muestra de predicción se puede corregir como se muestra en la Ecuación 3 y la Ecuación 4.
Ecuación 3
P(0,y) = P(0,y)+((p(-1,y)-p(-1,-1)) >> 1 para y = 0...N-1
Ecuación 4
P(1,y) = P(0,y)+((p(-1,y)-p(-1,-1)) >> 2 para y = 0...N-1
Por ejemplo, cuando el modo de intrapredicción del bloque actual es el modo horizontal, las muestras diferenciales entre la muestra vecina superior izquierda p(-1, -1) y las muestras vecinas p(x, -1) adyacentes al límite superior del bloque actual se puede usar para obtener la muestra de predicción final, como se describe en el caso del modo vertical. Por ejemplo, la muestra de predicción se puede corregir como se muestra en la Ecuación 5 y la Ecuación 6.
Ecuación 5
P(x,0) = P(x,0)+((p(x,-1)-p(-1,-1)) >> 1 para x = 0...N-1
Ecuación 6
P(x,1) = P(x,1)+((p(x,-1)-p(-1,-1)) >> 2 para x = 0...N-1
Las figuras 9 y 10 son dibujos que ilustran un método para corregir una muestra de predicción basándose en un filtro de corrección predeterminado de acuerdo con una realización de la presente invención.
La muestra de predicción puede corregirse basándose en la muestra vecina de la muestra de predicción que es el objetivo de corrección y un filtro de corrección predeterminado. Aquí, la muestra vecina puede especificarse mediante una línea angular del modo de predicción direccional del bloque actual, o puede ser al menos una muestra colocada en la misma línea angular que la muestra de predicción que es el objetivo de corrección. Además, la muestra vecina puede ser una muestra de predicción en el bloque actual, o puede ser una muestra reconstruida en un bloque vecino reconstruido antes del bloque actual.
Al menos uno de los números de derivaciones, la intensidad y un coeficiente de filtro del filtro de corrección se pueden determinar en función de al menos una de las posiciones de la muestra de predicción que es el objetivo de corrección, independientemente de si la muestra de predicción es el objetivo de la corrección se coloca en el límite del bloque actual, el modo de intrapredicción del bloque
actual, el ángulo del modo de predicción direccional, el modo de predicción (modo inter o intra) del bloque vecino y el tamaño/forma del bloque actual.
Con referencia a la figura 9, cuando el modo de predicción direccional tiene un índice de 2 o 34, al menos una muestra de predicción/reconstruida colocada en la parte inferior izquierda de la muestra de predicción que es el objetivo de corrección y el filtro de corrección predeterminado se puede usar para obtener la muestra de predicción final. Aquí, la muestra de predicción/reconstruida en la parte inferior izquierda puede pertenecer a una línea anterior de una línea que incluye la muestra de predicción que es el objetivo de corrección. La muestra de predicción/reconstruida en la parte inferior izquierda puede pertenecer al mismo bloque que la muestra actual, o al bloque vecino adyacente al bloque actual.
El filtrado para la muestra de predicción se puede realizar solo en la línea ubicada en el límite del bloque, o se puede realizar en múltiples líneas. Se puede usar el filtro de corrección donde al menos una de la cantidad de derivaciones de filtro y un coeficiente de filtro es diferente para cada una de las líneas. Por ejemplo, se puede usar un filtro (1/2, 1/2) para la primera línea izquierda más cercana al límite del bloque, se puede usar un filtro (12/16, 4/16) para la segunda línea, se puede usar un filtro (14/16, 2/16) para la tercera línea, y se puede usar un filtro (15/16, 1/16) para la cuarta línea.
Alternativamente, cuando el modo de predicción direccional tiene un índice de 3 a 6 o de 30 a 33, el filtrado se puede realizar en el límite del bloque como se muestra en la figura 10, y se puede usar un filtro de corrección de 3 derivaciones para corregir la muestra de predicción. El filtrado se puede realizar utilizando la muestra inferior izquierda de la muestra de predicción, que es el objetivo de corrección, la muestra inferior de la muestra de la parte inferior izquierda, y un filtro de corrección de 3 derivaciones que toma como entrada la muestra de predicción que es el objetivo de corrección. La posición de la muestra vecina utilizada por el filtro de corrección se puede determinar de manera diferente según el modo de predicción direccional. El coeficiente de filtro del filtro de corrección se puede determinar de manera diferente dependiendo del modo de predicción direccional.
Se pueden aplicar diferentes filtros de corrección dependiendo de si el bloque vecino está codificado en el modo inter o el modo intra. Cuando el bloque vecino está codificado en el modo intra, se puede usar un método de filtrado donde se
otorga más ponderación a la muestra de predicción, en comparación con cuando el bloque vecino está codificado en el modo inter. Por ejemplo, en el caso de que el modo de intrapredicción sea 34, cuando el bloque vecino se codifica en el modo inter, se puede usar un filtro (1/2, 1/2), y cuando el bloque vecino se codifica en el modo intra, se puede usar un filtro (4/16, 12/16).
El número de líneas a filtrar en el bloque actual puede variar dependiendo del tamaño/forma del bloque actual (por ejemplo, el bloque de codificación o el bloque de predicción). Por ejemplo, cuando el tamaño del bloque actual es igual o inferior a 32x32, el filtrado puede realizarse en una sola línea en el límite del bloque; de lo contrario, el filtrado se puede realizar en varias líneas, incluida una línea en el límite del bloque.
Las figuras 9 y 10 se basan en el caso en que los 35 modos de intrapredicción en la figura 4 se utilizan, pero se pueden aplicar de manera igual o similar al caso donde se usan los modos de intrapredicción extendida.
La figura 11 muestra una gama de muestras de referencia para la intrapredicción de acuerdo con una realización a la que se aplica la presente invención.
Con referencia a la figura 11, la intrapredicción puede realizarse utilizando las muestras de referencia P(-1, -1), P(-1, y) (0 <= y <= 2N-1) y P(x, -1) (0 <= x <= 2N-1) ubicado en un límite de un bloque actual. En este momento, el filtrado en muestras de referencia se realiza de forma selectiva en función de al menos uno de un modo de intrapredicción (por ejemplo, índice, direccionalidad, ángulo, etc. del modo de intrapredicción) del bloque actual o el tamaño de un bloque de transformación relacionado con el bloque actual.
El filtrado en muestras de referencia se puede realizar utilizando un filtro intra predefinido en un codificador y un decodificador. Por ejemplo, se puede utilizar un filtro intra con un coeficiente de filtro de (1,2,1) o un filtro intra con un coeficiente de filtro de (2,3,6,3,2) para obtener muestras de referencia finales para su uso en la intrapredicción.
Alternativamente, al menos uno de una pluralidad de candidatos de filtro intra puede seleccionarse para realizar el filtrado en muestras de referencia. En este caso, la pluralidad de candidatos de filtro intra puede diferir entre sí en al menos uno de una
intensidad de filtro, un coeficiente de filtro o un número de derivación (por ejemplo, un número de coeficientes de filtro, una longitud de filtro). Una pluralidad de candidatos de filtro intra puede definirse en al menos una de una secuencia, una imagen, un segmento o un nivel de bloque. Es decir, una secuencia, una imagen, un segmento o un bloque donde se incluye el bloque actual puede usar la misma pluralidad de candidatos de filtro intra.
De aquí en adelante, por conveniencia de explicación, se supone que una pluralidad de candidatos de filtro intra incluye un primer filtro intra y un segundo filtro intra. También se asume que el primer filtro intra es un filtro de 3 derivaciones (1,2,1)y el segundo filtro intra es un filtro de 5 derivaciones(2,3,6,3,2).
Cuando las muestras de referencia se filtran aplicando un primer filtro intra, las muestras de referencia filtradas pueden derivarse como se muestra en la Ecuación 7.
Ecuación 7
P ( - 1 1 ) = ( P ( - 1,0 ) 2 P ( - 1 1 ) P ( 0 ,- 1 ) 2 ) » 2
P ( - 1 ,y-)=(P( - 1,j/+1 ) 2 P ( - 1 ,y )+ P (- l , y - l ) 2 ) » 2
P(x,~ 1 ) = ( P O 1 1 )+ 2 P O ,- 1 ) P ( x - 11 ) 2 ) » 2
Cuando las muestras de referencia se filtran aplicando el segundo filtro intra, las muestras de referencia filtradas pueden derivarse como se muestra en la siguiente ecuación 8.
Ecuación 8
PC- 1 1 )= (2 P ( -2 ,0 )+ 3 P ( -1,0 )+ 6 P ( -1 1 )+ 3 P (0 ,-1 ) 2 P ( 0 , - 2 ) 8 ) » 4
P ( - l ^ ) = ( 2 P ( - l 5>J+ 2 ) 3 P ( - l^ l ) 6 P ( - l ,3 ; ) 3 P ( - l ,3 ; - l ) 2 P ( - l ,>;- 2 ) 8 ) » 4 P { x - 1 ) = ( 2 P O 2 ,-1 ) 3 P O 1,-1 )+ 6 P (x - 1 ) 3 P O - 11 )+ 2 P (x -2 - 1 ) 8 ) » 4
En las ecuaciones anteriores 7 y 8, x puede ser un número entero entre 0 y 2N-2, e y puede ser un número entero entre 0 y 2N-2.
Alternativamente, en función de la posición de una muestra de referencia, se puede
determinar uno de una pluralidad de candidatos de filtro intra, y el filtrado en la muestra de referencia se puede realizar utilizando el determinado. Por ejemplo, un primer filtro intra puede aplicarse a las muestras de referencia incluidas en un primer rango, y un segundo filtro intra puede aplicarse a muestras de referencia incluidas en un segundo rango. Aquí, el primer rango y el segundo rango se pueden distinguir en función de si están adyacentes a un límite de un bloque actual, ya sea que estén ubicados en el lado superior o en el lado izquierdo de un bloque actual, o si están adyacentes a una esquina de un bloque actual. Por ejemplo, como se muestra en la figura 12, filtrando en muestras de referencia (P(-1, -1), P(-1,0), P(-1,1), ... , P(-1, N-1) y P(0, -1), P(1, -1), ...) que son adyacentes a un límite del bloque actual se realiza aplicando un primer filtro intra como se muestra en la Ecuación 7, y el filtrado en las otras muestras de referencia que no son adyacentes a un límite del bloque actual se realiza aplicando un segundo filtro de referencia como se muestra en la Ecuación 8. Es posible seleccionar uno de una pluralidad de candidatos dentro del filtro en función del tipo de transformación utilizado para un bloque actual, y realizar el filtrado en muestras de referencia utilizando el seleccionado. Aquí, el tipo de transformación puede significar (1) un esquema de transformación tal como DCT, DST o KLT, (2) un indicador de modo de transformación tal como una transformación 2D, una transformación 1D o no transformada o (3) el número de transformaciones tales como una primera transformada y una segunda transformada. De aquí en adelante, por conveniencia de la descripción, se supone que el tipo de transformación significa el esquema de transformación tal como DCT, DST y KLT.
Por ejemplo, si un bloque actual se codifica utilizando un DCT, el filtrado se puede realizar utilizando un primer filtro intra, y si un bloque actual se codifica utilizando un DST, el filtrado se puede realizar utilizando un segundo filtro intra. O, si un bloque actual se codifica utilizando DCT o DST, el filtrado se puede realizar utilizando un primer filtro intra, y si el bloque actual se codifica utilizando un KLT, el filtrado puede realizarse utilizando un segundo filtro intra.
El filtrado se puede realizar utilizando un filtro seleccionado en función de un tipo de transformación de un bloque actual y una posición de una muestra de referencia. Por ejemplo, si un bloque actual se codifica utilizando un DCT, filtrando en las muestras de referencia P(-1, -1), P(-1,0), P(-1,1)___P(-1, N-1) y P(0, -1), P(1, -1), ... , P(N-1, -1) se puede realizar utilizando un primer filtro intra, y el filtrado en otras muestras de referencia se puede realizar utilizando un segundo filtro intra. Si un
bloque actual se codifica utilizando un DST, filtrando en las muestras de referencia P(-1, -1), P(-1,0), P(-1,1), ... , P(-1, N-1) y P(0, -1), P(1, -1), ... , P(N-1, -1) se puede realizar utilizando un segundo filtro intra, y el filtrado en otras muestras de referencia se puede realizar utilizando un primer filtro intra.
Se puede seleccionar uno de una pluralidad de candidatos de filtro intra en función de si un tipo de transformación de un bloque vecino que incluye una muestra de referencia es el mismo que un tipo de transformación de un bloque actual, y el filtrado puede realizarse utilizando el candidato intrafiltro seleccionado. Por ejemplo, cuando un bloque actual y un bloque vecino usan el mismo tipo de transformación, el filtrado se realiza utilizando un primer filtro intra, y cuando los tipos de transformación de un bloque actual y de un bloque vecino son diferentes entre sí, el segundo filtro intra puede ser usado para realizar el filtrado.
Es posible seleccionar cualquiera de una pluralidad de candidatos de filtro intra en función del tipo de transformación de un bloque vecino y realizar el filtrado en una muestra de referencia utilizando el seleccionado. Es decir, se puede seleccionar un filtro específico considerando un tipo de transformación de un bloque donde se incluye una muestra de referencia. Por ejemplo, como se muestra en la figura 13, si un bloque adyacente a la izquierda/abajo a la izquierda de un bloque actual es un bloque codificado usando un DCT, y un bloque adyacente a la parte superior/parte superior derecha de un bloque actual es un bloque codificado usando un DST, filtrando muestras de referencia adyacentes a la izquierda/abajo a la izquierda de un bloque actual se realiza mediante la aplicación de un primer filtro intra y el filtrado en las muestras de referencia adyacentes a la parte superior/parte superior derecha de un bloque actual se realiza mediante la aplicación de un segundo filtro intra.
En unidades de una región predeterminada, se puede definir un filtro utilizable en la región correspondiente. Aquí, la unidad de la región predeterminada puede ser cualquiera de una secuencia, una imagen, un sector, un grupo de bloques (por ejemplo, una fila de unidades de árbol de codificación) o un bloque (por ejemplo, una unidad de árbol de codificación) o, se puede definir otra región que comparte uno o más filtros. Una muestra de referencia se puede filtrar utilizando un filtro asignado a una región en la que se incluye un bloque actual.
Por ejemplo, como se muestra en la figura 14, es posible realizar el filtrado en
muestras de referencia utilizando diferentes filtros en unidades CTU. En este caso, la información que indica si se usa el mismo filtro en una secuencia o en una imagen, un tipo de filtro usado para cada CTU, un índice que especifica un filtro usado en la CTU correspondiente entre los candidatos de filtro intra disponibles puede señalizarse mediante una secuencia conjunto de parámetros (SPS) o un conjunto de parámetros de imagen (PPS).
El filtro intra descrito anteriormente se puede aplicar en unidades de una unidad de codificación. Por ejemplo, el filtrado puede realizarse aplicando un primer filtro intra o un segundo filtro intra para hacer referencia a muestras alrededor de una unidad de codificación.
Cuando se determina un modo de intrapredicción de un bloque actual, la intrapredicción se puede realizar utilizando una muestra de referencia adyacente al bloque actual. Por ejemplo, las muestras de predicción de un bloque actual pueden generarse promediando muestras de referencia, o pueden generarse duplicando muestras de referencia en una dirección específica considerando una direccionalidad de un modo de intrapredicción. Como se describió anteriormente en un ejemplo que se refiere a la figura 11, P(-1, -1), P(-1, y) (0 <= y <= 2N-1), P(x, -1) (0 <= x <= 2N-1) que están ubicados en el límite de un bloque actual puede usarse como muestras de referencia.
Cuando se determina que una muestra incluida en un bloque vecino adyacente a un bloque actual no está disponible como muestra de referencia, la muestra que no está disponible puede reemplazarse con una muestra de referencia que esté disponible. Por ejemplo, una muestra vecina puede determinarse como no disponible en el caso de que una posición de una muestra incluida en un bloque vecino esté fuera de una imagen, una muestra incluida en un bloque vecino esté presente en una porción diferente de un bloque actual o una muestra incluido en un bloque vecino se incluye en un bloque codificado mediante una intrapredicción. Aquí, si una muestra incluida en un bloque codificado mediante una predicción no está disponible, se puede determinar en función de la información que indica si se debe usar una muestra incluida en un bloque codificado mediante una predicción como una muestra de referencia cuando se realiza una intrapredicción de un bloque actual. En este caso, la información puede ser un indicador de 1 bit (por ejemplo, 'restricta_intra_prediction_flag'), pero no se limita a eso. Por ejemplo, cuando un valor de 'restricta_intra_prediction_flag' es 1, se puede determinar que una muestra
incluida en un bloque codificado mediante una predicción no está disponible como una muestra de referencia. De aquí en adelante, una muestra que no se puede utilizar como muestra de referencia se denominará muestra de referencia no disponible.
En el ejemplo mostrado en la figura 11, cuando se determina que una muestra ubicada en el extremo inferior izquierdo (por ejemplo, P(-1, 2N-1)) no está disponible, la muestra ubicada en el extremo inferior izquierdo puede reemplazarse con una primera muestra de referencia disponible en la que primero se busque escanear las muestras disponibles en un orden predeterminado. Aquí, el orden de escaneo se puede realizar secuencialmente desde una muestra adyacente a la muestra inferior izquierda. Por ejemplo, en el ejemplo mostrado en la figura 11, cuando una muestra P(-1, 2N-1) no está disponible, la exploración puede realizarse en un orden de P(-1, -2N-2) a P(-1, -1), P(-1) a P(2N-1, -1). P(-1, 2N-1) puede reemplazarse con una primera muestra de referencia disponible que se encuentra como resultado del escaneo.
Cuando una muestra de referencia izquierda, excepto una muestra de referencia ubicada en el extremo inferior izquierdo no está disponible, la muestra de referencia izquierda puede reemplazarse con una muestra de referencia adyacente a una parte inferior de la muestra de referencia izquierda. Por ejemplo, una muestra de referencia no disponible P(-1, y) entre P(-1, 2N-1) y P(-1, -1) puede reemplazarse con una muestra de referencia P(-1, y 1).
Cuando una muestra de referencia superior no está disponible, la muestra de referencia superior puede reemplazarse con una muestra de referencia adyacente a la izquierda de la muestra de referencia superior. Por ejemplo, una muestra de referencia no disponible P (x, -1) entre P(0, -1) y P(2N-1, -1) puede reemplazarse con una muestra de referencia P(x-1, -1).
Un conjunto de muestras de referencia para un bloque actual puede denominarse "línea de referencia" (o "línea de intrareferencia" o "línea de muestra de referencia"). Aquí, la línea de referencia puede incluir un conjunto de muestras de referencia compuestas de una fila y una columna. Por ejemplo, en el ejemplo mostrado en la figura 11, una 'línea de referencia' un conjunto de muestras de referencia que incluye P(-1, 2N-1) a P(-1, 1), P(0, -1) a P(2N-2, -1). Se puede realizar una intrapredicción de un bloque actual en base a las muestras de
referencia incluidas en una línea de referencia. Se puede realizar una intrapredicción de un bloque actual, utilizando muestras de referencia incluidas en una línea de referencia, en función de un modo de intrapredicción de un bloque actual, por ejemplo, cuando un modo de intrapredicción de un bloque actual es un modo CC, se puede generar una señal de predicción utilizando una predicción ponderada y promedio de las muestras de referencia incluidas en la línea de referencia. Por ejemplo, cuando un modo de intrapredicción de un bloque actual es un modo CC, se pueden obtener muestras de predicción del bloque actual de acuerdo con la Ecuación 9.
Ecuación 9
P(0, y) = ( P ( - l ,y ) 3 * dcVal) » 2
En la Ecuación 9, dcVal puede generarse en base a un valor promedio de muestras, excepto P(-1, -1) entre las muestras de referencia incluidas en una línea de referencia.
Un modo plano proporciona una eficacia de predicción efectiva en un área suave que no tiene bordes fuertes, y es eficaz para mejorar la discontinuidad del límite del bloque o el deterioro de la calidad de la imagen de un límite del bloque. Cuando un modo de intrapredicción de un bloque actual es un modo plano, se puede obtener una muestra de predicción provisional en dirección horizontal del bloque actual utilizando una muestra de referencia adyacente a una esquina superior derecha del bloque actual y una muestra de referencia que tenga una coordenada y idéntica a la muestra de predicción provisional en dirección horizontal, y se puede obtener una muestra de predicción provisional en dirección vertical del bloque actual utilizando una muestra de referencia adyacente a una esquina inferior izquierda del bloque actual y una muestra de referencia con una coordenada x idéntica a la muestra de predicción provisional en dirección vertical. Por ejemplo, se puede obtener una muestra de predicción provisional en dirección horizontal y una muestra de predicción provisional en dirección vertical de un bloque actual de acuerdo con la Ecuación 10.
Ecuación 10
Ph(x,y) = ( N - l - x ) *P(—l,y) ( x 1) * P(N, —1)
P
17
(x,y) = (N — 1 — y) *P(x,-l) (y+1) * P(-1,N)
Se puede generar una muestra de predicción de un bloque actual sumando una muestra de predicción provisional en dirección horizontal y una muestra de predicción provisional en dirección vertical, y luego cambiando el resultado de la suma por un valor determinado de acuerdo con el tamaño de un bloque actual. Por ejemplo, una muestra de predicción de un bloque actual se puede obtener de acuerdo con la Ecuación 11.
Ecuación 11
P(x,y) = (Ph(x,y) Pv(x,y) N) » (
log2{N
)
1
)
Se puede realizar una intrapredicción de un bloque actual utilizando una pluralidad de líneas de referencia. Suponiendo que un bloque actual tiene un tamaño WxH, la línea de referencia k-ésima puede incluir p(-k, -k), muestras de referencia ubicadas en una fila idénticas a p(-k, -k) (por ejemplo, muestras de referencia de p( k 1, -k) a p(W H 2 (k-1), -k) o muestras de referencia de p(-k 1, -k) a p(2W 2 (k-1), -k)) y muestras de referencia ubicadas en una columna idéntica a p(-k, -k) (por ejemplo, muestras de referencia de p(-k, -k 1) a p(-k, W H 2 (k -1)) o muestras de referencia de p (-k, -k 1) a p(-k, 2H 2 (k-1))).
La figura 15 ejemplifica una pluralidad de líneas de muestra de referencia. Como en el ejemplo mostrado en la figura 15, cuando una primera línea de referencia adyacente a un límite de un bloque actual se denomina "línea de referencia 0", la línea de referencia k-ésima puede establecerse adyacente a la línea de referencia (k-1)-ésima.
Alternativamente, a diferencia del ejemplo mostrado en la figura 15, también es posible configurar todas las líneas de referencia para que tengan el mismo número de muestras de referencia.
Una intrapredicción de un bloque actual puede realizarse al menos por una de una pluralidad de líneas de referencia. Un método para realizar una intrapredicción utilizando una pluralidad de líneas de referencia como se describió anteriormente
puede denominarse "método de intrapredicción usando una muestra de referencia extendida" o "método de intrapredicción extendida". Además, se puede hacer referencia a una pluralidad de líneas de referencia como una 'línea de referencia extendida'.
El hecho de realizar o no la intrapredicción utilizando una línea de referencia extendida puede determinarse basándose en la información señalizada a través de un flujo de bits. Aquí, la información puede ser un indicador de 1 bit, pero no se limita a ello. La información sobre si realizar la intrapredicción utilizando una línea de referencia extendida se puede señalar en unidades de una unidad de árbol de codificación, una unidad de codificación o una unidad de predicción, o se puede señalar en unidades de una secuencia, una imagen o un segmento. Es decir, si realizar la intrapredicción utilizando la línea de referencia extendida puede determinarse en unidades de una secuencia, una imagen, una porción, una CTU, una CU o una PU.
Alternativamente, el hecho de realizar o no la intrapredicción utilizando una línea de referencia extendida puede determinarse en función de al menos uno de los modos de tamaño, forma, profundidad o intrapredicción de un bloque actual.
Cuando se determina realizar la intrapredicción utilizando una línea de referencia extendida, se puede determinar un número de líneas de referencia. Aquí, varias líneas de referencia pueden tener un valor fijo, y pueden determinarse de forma adaptativa según el tamaño, la forma o el modo de intrapredicción de un bloque actual. Por ejemplo, cuando un modo de intrapredicción de un bloque actual es un modo no direccional, la intrapredicción del bloque actual se realiza utilizando una línea de referencia. Cuando un modo de intrapredicción de un bloque actual es un modo direccional, la intrapredicción del bloque actual se puede realizar utilizando una pluralidad de líneas de referencia.
Para un ejemplo adicional, un número de líneas de referencia puede ser determinado por la información que se señala en unidades de una secuencia, una imagen, una porción o una unidad a ser decodificada. Aquí, la unidad a decodificar puede representar una unidad de árbol de codificación, una unidad de codificación, una unidad de transformación, una unidad de predicción, o similar. Por ejemplo, un elemento de sintaxis 'max_intra_line_idx_minus2' que indica un número de líneas de referencia disponibles disponibles en una secuencia o un segmento puede ser
señalizado a través de un encabezado de secuencia o un encabezado de segmento. En este caso, el número de líneas de referencia disponibles se puede establecer en max_intra_line_idx_minus2 2.
A continuación, se describirá con detalle un método para realizar la intrapredicción utilizando una línea de referencia extendida.
La figura 16 es un diagrama de flujo que ilustra un método para realizar la intrapredicción utilizando una línea de referencia extendida según la presente invención.
Primero, un decodificador puede generar una pluralidad de líneas de referencia (S1610). Las muestras de referencia incluidas en cada línea de referencia pueden generarse en base a las muestras reconstruidas incluidas en bloques descodificados antes que un bloque actual.
Cuando un modo de intrapredicción de un bloque actual es un modo direccional, un decodificador puede generar una línea de referencia considerando una direccionalidad del modo de intrapredicción. Considerando la direccionalidad de un modo de intrapredicción, puede incluirse un mayor número de muestras de referencia en la línea de referencia k-ésima que en la línea de referencia (k-1)-ésima. Es decir, una línea de referencia alejada de un bloque actual puede incluir un número mayor de muestras de referencia que una línea de referencia cerca del bloque actual.
Aquí, varias muestras de referencia incluidas además en la línea de referencia késima que en la línea de referencia (k-1)-ésima pueden determinarse de manera variable según un tamaño, una forma o un modo de intrapredicción de un bloque actual.
Por ejemplo, cuando un bloque actual tiene un tamaño de 4x4, la línea de referencia k-ésima puede incluir además cuatro muestras de referencia (específicamente, 2 en dirección horizontal y 2 en dirección vertical) que la línea de referencia (k-1)-ésima. Además, cuando un bloque actual tiene un tamaño de 8x8, la línea de referencia k-ésima puede incluir además ocho muestras de referencia (específicamente, 4 en dirección horizontal y 4 en dirección vertical) que la línea de referencia (k-1)-ésima.
Con referencia a la figura 15, como el tamaño de un bloque actual es 4x4, se ejemplifica que una primera línea de referencia incluye un total de 9 muestras de referencia y una segunda línea de referencia incluye un total de 13 (= 9 2x2) muestras de referencia.
Cuando un bloque actual no es cuadrado, se pueden determinar varias muestras de referencia incluidas en una línea de referencia de acuerdo con las longitudes horizontales y verticales de un bloque actual.
Por ejemplo, la figura 17 es un diagrama que ejemplifica una pluralidad de líneas de referencia para un bloque no cuadrado. Describiendo con las figuras 15 y 17, a medida que el ancho de un bloque actual disminuye a 1/2, un número de muestras de referencia superior excepto una muestra de referencia superior izquierda incluida en una línea de referencia 0 se reduce de 8 a 4.
Es decir, según las figuras 15 y 17, cuando se supone que un bloque actual tiene un tamaño WxH, la línea de referencia k-ésima puede incluir un total de 2{(W H)+ 2(k-1)}+1 muestras de referencia que incluyen W H 2(k-1) muestras de referencia superior (o 2W 2(k-1) muestras de referencia superior) (es decir, muestras de referencia en dirección horizontal), W H 2(k-1) muestras de referencia izquierda (o 2H 2(k-1) muestras de referencia izquierda (es decir, muestras de referencia en dirección vertical) y muestra de referencia superior izquierda.
Si una muestra de referencia que no está disponible se incluye en una línea de referencia, la muestra de referencia no disponible puede reemplazarse con una muestra de referencia disponible cercana. En este momento, la muestra vecina que reemplaza la muestra de referencia no disponible puede incluirse en una misma línea de referencia que la muestra de referencia no disponible, o puede incluirse en la línea de referencia diferente de la muestra de referencia no disponible.
Por ejemplo, si una posición de una muestra de referencia está fuera de una imagen o en un sector diferente de un bloque actual cuando se realiza la intrapredicción utilizando una línea de referencia extendida o si se incluye una muestra de referencia en un bloque codificado mediante interpredicción cuando la intrapredicción se realiza utilizando una línea de referencia extendida, la muestra de
referencia puede determinarse como no disponible. La muestra de referencia incluida en un bloque codificado mediante interpredicción puede determinarse como no disponible cuando se establece que una muestra de referencia incluida en un bloque codificado mediante interpredicción no se usa (por ejemplo, solo cuando el valor de restriccion_intra_predicción_flag es 0). O, si se establece que un bloque codificado mediante intrapredicción debe decodificarse antes que un bloque codificado mediante interpredicción, el bloque codificado mediante interpredicción aún no se puede reconstruir cuando el bloque codificado mediante intrapredicción. En consecuencia, una muestra de referencia incluida en el bloque codificado mediante interpredicción puede determinarse como no disponible.
Una muestra de referencia utilizada para reemplazar una muestra de referencia no disponible puede determinarse considerando una posición de la muestra de referencia no disponible, una distancia entre la muestra de referencia no disponible y la muestra de referencia disponible, o similar. Por ejemplo, una muestra no disponible puede reemplazarse con una muestra disponible que tenga una distancia más corta que la muestra de referencia no disponible. Es decir, una muestra de referencia disponible que tiene la distancia más corta y se selecciona comparando una distancia (primer desplazamiento) entre una muestra de referencia disponible incluida en la misma línea de referencia con la muestra de referencia no disponible y la muestra no disponible y una distancia (segundo desplazamiento) entre una muestra de referencia disponible incluida en una línea de referencia diferente de la muestra de referencia no disponible y la muestra no disponible puede sustituirse por la muestra de referencia no disponible.
En el ejemplo mostrado en la figura 18, se representa que una distancia entre la muestra de referencia no disponible incluida en la línea de referencia 0 y la muestra de referencia disponible incluida en la línea de referencia 0 es 4, y una distancia entre la muestra de referencia no disponible incluida en la línea de referencia 0 y el disponible La muestra de referencia incluida en la línea de referencia 2 es 2. Por consiguiente, la muestra no disponible incluida en la línea de referencia 0 puede sustituirse utilizando la muestra de referencia disponible incluida en la línea de referencia 2.
Si un primer desplazamiento y un segundo desplazamiento son iguales, una muestra de referencia no disponible puede reemplazarse utilizando una muestra de referencia disponible incluida en la misma línea de referencia que la muestra de
referencia no disponible.
Una muestra de referencia no disponible puede reemplazarse utilizando una muestra de referencia disponible incluida en una línea de referencia diferente de la muestra de referencia no disponible solo cuando hay una distancia (es decir, un primer desplazamiento) entre una muestra disponible incluida en la misma línea de referencia que la muestra de referencia no disponible y la muestra de referencia no disponible es igual o mayor que N. Alternativamente, incluso cuando el primer desplazamiento es igual o mayor que N, se puede usar una muestra de referencia disponible incluida en una línea de referencia diferente de una muestra de referencia no disponible para reemplazar la referencia no disponible muestrear solo cuando un segundo desplazamiento es más pequeño que el primer desplazamiento. Aquí, N puede representar un número entero de 1 o más.
Si un primer desplazamiento no es igual o mayor que N, una muestra de referencia no disponible puede reemplazarse utilizando una muestra de referencia disponible incluida en la misma línea de referencia que la muestra de referencia no disponible.
Las figuras 19 y 20 muestran un ejemplo donde una muestra de referencia no disponible se reemplaza con una muestra de referencia disponible cuando N es 2. Si la distancia entre una muestra de referencia no disponible incluida en la línea de referencia 0 y una muestra de referencia disponible incluida en la línea de referencia 0 es 2, como en el ejemplo mostrado en la figura 19, la muestra de referencia no disponible incluida en la línea de referencia 0 puede reemplazarse utilizando una muestra de referencia disponible incluida en la línea de referencia 1.
Por otro lado, si una distancia entre una muestra de referencia no disponible incluida en la línea de referencia 0 y una muestra de referencia disponible incluida en la línea de referencia 0 es 1, como en el ejemplo que se muestra en la figura 20, la muestra de referencia no disponible incluida en la línea de referencia 0 puede reemplazarse utilizando la muestra de referencia disponible incluida en la línea de referencia 0.
Una muestra de referencia no disponible puede reemplazarse utilizando una muestra de referencia disponible incluida en la misma línea de referencia que la muestra de referencia no disponible o una muestra de referencia disponible incluida en una línea de referencia adyacente a una línea de referencia en la que se incluye
la muestra de referencia no disponible. Aquí, una línea de referencia adyacente a una línea de referencia en la que se incluye la muestra de referencia no disponible puede referirse a una línea de referencia que tiene una diferencia de índice de 1 desde la línea de referencia, incluida la muestra de referencia no disponible. Alternativamente, la muestra de referencia no disponible puede reemplazarse con una muestra de referencia disponible incluida en una línea de referencia que tenga una diferencia de índice de dos o más de la línea de referencia, incluida la muestra de referencia no disponible.
Alternativamente, una muestra de referencia no disponible puede reemplazarse utilizando una muestra de referencia disponible incluida en una línea de referencia que tenga un valor de índice mayor o que tenga un valor de índice más pequeño que una línea de referencia que incluya la muestra de referencia no disponible. Por ejemplo, si se usa una línea de referencia que tiene un valor de índice mayor que una línea de referencia que incluye la muestra de referencia no disponible, se puede usar una muestra de referencia ubicada a la izquierda o en la parte superior de la muestra de referencia no disponible para reemplazar la muestra de referencia no disponible.
La búsqueda de una muestra de referencia disponible para reemplazar una muestra de referencia no disponible puede realizarse en una dirección predefinida. Por ejemplo, para reemplazar la muestra de referencia no disponible, puede usarse solo una muestra de referencia ubicada en la dirección de una parte superior, inferior, izquierda o derecha de la muestra no disponible entre las muestras de referencia incluidas en la misma línea de referencia que la muestra de referencia no disponible. Alternativamente, para reemplazar la muestra no disponible , se puede usar solo una muestra de referencia ubicada en una dirección superior, inferior, izquierda o derecha de la muestra no disponible entre las muestras de referencia incluidas en una línea de referencia diferente de la muestra de referencia no disponible.
Un decodificador puede decodificar, basándose en un flujo de bits, información de índice que especifica una de una pluralidad de líneas de referencia (S1620). Por ejemplo, cuando hay 4 líneas de referencia disponibles como en el ejemplo que se muestra en la figura 15, la información del índice puede especificar cualquiera de las 4 líneas de referencia.
Una línea de referencia para realizar la intrapredicción para un bloque actual puede determinarse de forma adaptativa basándose en el tamaño de un bloque actual, un tipo de bloque actual, un modo de intrapredicción de un bloque actual, información de índice en un bloque vecino o diferencia entre un modo de intrapredicción de un bloque actual y un modo de intrapredicción predeterminado, y similares.
Cuando se determina una cualquiera de una pluralidad de líneas de referencia, un decodificador puede realizar una intrapredicción para un bloque actual utilizando la línea de referencia determinada (S1630).
Por ejemplo, cuando un modo de intrapredicción de un bloque actual es el modo DC, se puede generar una muestra de predicción del bloque actual basándose en un valor promedio (dcVal) de muestras de referencia incluidas en la línea de referencia determinada. Haciendo referencia a las figuras 21 y 22, se describirá en detalle un cálculo del valor promedio de las muestras de referencia incluidas en la línea de referencia.
Alternativamente, cuando un modo de intrapredicción de un bloque actual es un modo direccional, se puede generar una muestra de predicción del bloque actual basándose en una muestra de referencia especificada por el modo direccional entre las muestras de referencia incluidas en la línea de referencia determinada. En este momento, si un segmento de línea que se extiende desde una muestra de predicción hacia la dirección indicada por los puntos del modo direccional entre muestras de referencia, la muestra de predicción del bloque actual se puede generar en base a una suma ponderada (predicción ponderada) de una primera muestra de referencia y una segunda muestra de referencia que se encuentra a ambos lados del punto indicado por el segmento de línea que se extiende hacia la dirección indicada por el modo direccional.
Cuando un modo de intrapredicción de un bloque actual es el modo DC, es necesario calcular un valor promedio (dcVal) de muestras de referencia incluidas en una línea de referencia para realizar la predicción en el bloque actual. En este momento, el valor promedio para las muestras de referencia en la línea de referencia k-ésima puede calcularse utilizando solo una parte de las muestras de referencia incluidas en la línea de referencia k-ésima. En este momento, el número de muestras de referencia utilizadas para derivar el valor promedio puede ser el mismo para cada línea de referencia, o puede ser diferente para cada línea de
referencia.
Alternativamente, un valor promedio para muestras de referencia en la línea de referencia k-ésima puede derivarse utilizando todas las muestras de referencia incluidas en la línea de referencia k-ésima. Alternativamente, puede determinarse basándose en el tamaño de un bloque actual, una forma de un bloque actual o una posición de una línea de referencia ya sea para derivar un valor promedio usando una parte de muestras de referencia en la línea de referencia k-ésima o para derivar un valor promedio utilizando todas las muestras de referencia en la línea de referencia k-ésima.
La figura 21 es un diagrama que ilustra muestras de referencia utilizadas para derivar un valor promedio de una línea de referencia.
La figura 21 muestra un ejemplo de derivación de un valor promedio de muestra de referencia de la k-ésima línea de referencia utilizando una parte de las muestras de referencia incluidas en una línea de referencia. Por ejemplo, un ejemplo ilustrado en la figura 21, un valor promedio de muestra de referencia de una primera línea de referencia adyacente a un bloque actual (es decir, la línea de referencia 0 que se muestra en la figura 21) se puede calcular utilizando muestras de referencia superior y muestras de referencia izquierda excluyendo una muestra de referencia adyacente a una esquina superior izquierda del bloque actual. Es decir, cuando un tamaño del bloque actual es NxN, se puede usar un total de muestras de referencia 4N tales como muestras de referencia superior 2N y muestras de referencia izquierda 2N para el cálculo del valor promedio de la primera línea de referencia.
El número de muestras de referencia utilizadas para calcular un valor promedio de la muestra de referencia de la k-ésima línea de referencia puede ser igual al número de muestras de referencia utilizadas para calcular el valor promedio de una muestra de referencia de la primera línea de referencia. En este momento, una posición de una muestra de referencia utilizada para calcular el valor promedio de la línea de referencia k-ésima puede corresponder a una posición de una muestra de referencia utilizada para calcular el valor promedio de la muestra de referencia de la primera línea de referencia.
Una muestra de referencia en la línea de referencia k-ésima correspondiente a una muestra de referencia de una primera línea de referencia puede tener la misma
coordenada x o la misma coordenada y como la muestra de referencia de la primera línea de referencia. Por ejemplo, una coordenada de una muestra de referencia superior incluida en la línea de referencia k-ésima correspondiente a una muestra de referencia superior P(i, j) incluida en una primera línea de referencia puede ser P(i, j-k 1) que tiene la misma coordenada x como P(i, j). Por ejemplo, una coordenada de una muestra de referencia izquierda en la línea de referencia késima correspondiente a una muestra de referencia izquierda P(i, j) incluida en una primera línea de referencia puede ser P(i-k 1, j) que tiene la misma y coordinar como P(i, j).
En la figura 21, se muestran las muestras de referencia de las líneas de referencia segunda a cuarta correspondientes a la muestra de referencia superior y la muestra de referencia izquierda en una primera línea de referencia. Se puede calcular un valor promedio de muestra de referencia de cada línea de referencia utilizando las muestras de referencia mostradas en la figura 21.
En la figura 21, se supone que un bloque actual tiene una forma cuadrada, pero incluso si el bloque actual tiene una forma no cuadrada, la realización anterior se puede aplicar tal como está. Por ejemplo, cuando la corriente es un bloque no cuadrado que tiene un tamaño WxH, se puede calcular un valor promedio de muestra de referencia de cada línea de referencia utilizando un total de 2(W H) muestras de referencia, como muestras de referencia superior 2W y muestras de referencia izquierda 2H. En consecuencia, como en el ejemplo mostrado en la figura 22, el número de muestras de referencia utilizadas para calcular un valor promedio de la k-ésima línea de referencia puede tener el mismo valor que el número de muestras de referencia utilizadas para calcular un valor promedio de la primera línea de referencia. Además, la ubicación de la muestra de referencia utilizada para calcular el valor promedio de la k-ésima línea de referencia puede corresponder a la ubicación de la muestra de referencia utilizada para calcular el valor promedio de la muestra de referencia de la primera línea de referencia.
En las figuras 21 y 22, las muestras de referencia superior se utilizan para duplicar el ancho de un bloque actual y para las muestras de referencia izquierda y el doble de altura del bloque actual para calcular el valor promedio de una muestra de referencia de una línea de referencia. Un valor promedio de muestra de referencia de una línea de referencia puede calcularse utilizando un número menor o mayor de muestras de referencia que las que se muestran en las figuras 21 y la figura 22.
Por ejemplo, el valor promedio de la muestra de referencia de la línea de referencia se puede calcular utilizando el mismo número de muestras de referencia superior que el ancho del bloque actual y el mismo número de muestras de referencia izquierda que la altura del bloque actual.
El valor promedio de una muestra de referencia de una línea de referencia puede calcularse asignando diferentes ponderaciones a las muestras de referencia, dependiendo de la forma de un bloque actual y la posición de una muestra de referencia. Por ejemplo, si el bloque actual tiene una forma cuadrada, el valor promedio de la muestra de referencia puede calcularse asignando la misma ponderación a las muestras de referencia superior y las muestras de referencia izquierda. Por otro lado, cuando el bloque actual tiene una forma no cuadrada, el valor promedio de la muestra de referencia puede calcularse asignando una ponderación mayor a una de las muestras de referencia superior y las muestras de referencia izquierda. Por ejemplo, si la altura del bloque actual es mayor que un ancho, el valor promedio puede calcularse asignando una ponderación mayor a las muestras de referencia superiores que las muestras de referencia de la izquierda. Por otro lado, cuando el ancho del bloque actual es mayor que la altura, el valor promedio puede calcularse asignando una ponderación mayor a las muestras de referencia de la izquierda que las muestras de referencia superiores.
Por ejemplo, cuando el tamaño del bloque actual es N/2 * N, el valor promedio de la k-ésima línea de referencia dcVal se puede calcular mediante la siguiente Ecuación 12.
Ecuación 12
Por ejemplo, cuando el tamaño del bloque actual es NxN/2, el valor promedio de la línea de referencia k-ésima dcVal se puede calcular mediante la siguiente Ecuación 13.
Ecuación 13
En las ecuaciones 12 y 13, k puede establecerse en un valor entre 1 y max_intra_line_idx_minus2 2.
En el ejemplo descrito a través de la figura 16, se ejemplifica que la información de índice que especifica una de la pluralidad de líneas de referencia se decodifica después de generar una pluralidad de líneas de referencia. También es posible obtener solo una línea de referencia especificada por la información de índice entre una pluralidad de líneas de referencia después de descodificar la información de índice que especifica una de la pluralidad de líneas de referencia.
En la realización descrita a través de la figura 16, se describe que la intrapredicción para un bloque actual se realiza utilizando cualquier línea de referencia especificada por información de índice entre una pluralidad de líneas de referencia. También es posible que la intrapredicción para un bloque actual se pueda realizar utilizando dos o más líneas de referencia entre una pluralidad de líneas de referencia. La utilización o no de dos o más líneas de referencia para realizar la intrapredicción para un bloque actual puede determinarse en función de la información señalizada desde un flujo de bits, el tamaño de un bloque actual, el tipo de bloque actual, un modo de intrapredicción de un bloque actual, ya sea que un modo de intrapredicción de un bloque actual sea uno no direccional o una diferencia entre un modo de intrapredicción de un bloque de corriente y un modo predeterminado de intrapredicción, y similares.
Las dos o más líneas de referencia pueden especificarse por una pluralidad de información de índice señalizada desde un flujo de bits. Por ejemplo, cuando se establecen dos líneas de referencia para ser utilizadas, cualquiera de las dos líneas de referencia puede especificarse mediante la primera información de índice, y la otra puede especificarse mediante la segunda información de índice.
Alternativamente, dos o más líneas de referencia pueden ser espacialmente contiguas. En este caso, la información de índice para especificar cualquiera de las dos o más líneas de referencia puede ser señalizada a través de un flujo de bits. Si cualquiera de las dos o más líneas de referencia es seleccionada por la información del índice, la línea de referencia restante puede seleccionarse automáticamente en
función de la adyacencia espacial con la línea de referencia seleccionada. Por ejemplo, cuando se configura para usar dos líneas de referencia, y la información del índice indica 'línea de referencia 0', entonces la intrapredicción de un bloque actual se puede realizar en base a la línea de referencia 0 y la línea de referencia 1 adyacentes a la línea de referencia 0.
Cuando se configura para usar una pluralidad de líneas de referencia, la intrapredicción de un bloque actual puede realizarse en base a un valor promedio, un valor máximo, un valor mínimo o una suma ponderada de muestras de referencia incluidas en la pluralidad de líneas de referencia.
Por ejemplo, suponiendo que un modo intrapredicción de un bloque actual es un modo direccional (es decir, un modo angular), se puede generar una muestra predicha del bloque actual basándose en una primera muestra de referencia y una segunda muestra de referencia, cada una de ellas que se incluye en una línea de referencia de diferencia. Aquí, una primera línea de referencia que incluye la primera muestra de referencia y una segunda línea de referencia que incluye la segunda muestra de referencia pueden posicionarse una al lado de la otra, pero no está limitada a ellas. Además, la primera muestra de referencia y la segunda muestra de referencia pueden determinarse mediante un modo de intrapredicción del bloque actual. La primera muestra de referencia y la segunda muestra de referencia pueden colocarse una cerca de la otra, pero no está limitada a ellas. Se puede generar una muestra de predicción de un bloque actual considerando la suma ponderada de la primera muestra de referencia y la segunda muestra de referencia, o se puede generar en base a un valor promedio, un valor mínimo o un valor máximo de la primera muestra de referencia y La segunda muestra de referencia.
La predicción interna de un bloque actual se puede realizar realizando una primera intrapredicción basada en una parte de una pluralidad de líneas de referencia y realizando una segunda intrapredicción basada en las líneas de referencia restantes. Aquí, un modo de intrapredicción usada en una primera intrapredicción y un modo de intrapredicción usada en una segunda intrapredicción puede ser igual o diferente. Se puede generar una muestra de predicción de un bloque actual basándose en una primera muestra de predicción generada realizando una primera intrapredicción y una segunda muestra de predicción generada realizando una segunda intrapredicción.
Las realizaciones anteriores se han descrito principalmente en el proceso de decodificación, el proceso de codificación se puede realizar en el mismo orden que se describe o en orden inverso.
Aunque las realizaciones descritas anteriormente se han descrito sobre la base de una serie de etapas o diagramas de flujo, no limitan el orden de las series de tiempo de la invención, y pueden realizarse simultáneamente o en diferentes órdenes según sea necesario. Además, cada uno de los componentes (por ejemplo, unidades, módulos, etc.) que constituyen el diagrama de bloques en las realizaciones descritas anteriormente puede implementarse mediante un dispositivo de hardware o software, y una pluralidad de componentes. O se puede combinar e implementar una pluralidad de componentes mediante un solo dispositivo de hardware o software. Las realizaciones descritas anteriormente pueden implementarse en forma de instrucciones de programa que pueden ejecutarse a través de diversos componentes del ordenador y grabarse en un medio de grabación legible por ordenador. El medio de grabación legible por ordenador puede incluir uno o una combinación de comandos de programa, archivos de datos, estructuras de datos y similares. Los ejemplos de medios legibles por ordenador incluyen medios magnéticos como discos duros, disquetes y cintas magnéticas, medios de grabación ópticos como CD-ROM y DVD, medios magnetoópticos como discos flexibles, medios y dispositivos de hardware específicamente configurados para almacenar y ejecute las instrucciones del programa, como ROM, RAM, memoria flash, etc. El dispositivo de hardware puede configurarse para funcionar como uno o más módulos de software para realizar el proceso de acuerdo con la presente invención, y viceversa.
Aplicabilidad industrial
La presente invención puede aplicarse a dispositivos electrónicos que pueden codificar/decodificar un vídeo.