KR101604033B1 - Method and apparatus for decoding an image - Google Patents
Method and apparatus for decoding an image Download PDFInfo
- Publication number
- KR101604033B1 KR101604033B1 KR1020140058639A KR20140058639A KR101604033B1 KR 101604033 B1 KR101604033 B1 KR 101604033B1 KR 1020140058639 A KR1020140058639 A KR 1020140058639A KR 20140058639 A KR20140058639 A KR 20140058639A KR 101604033 B1 KR101604033 B1 KR 101604033B1
- Authority
- KR
- South Korea
- Prior art keywords
- unit
- residual block
- encoding
- transform
- effective
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
레지듀얼 블록의 부호화, 복호화 방법 및 장치가 개시된다. 본 발명의 일 실시예에 따르면 레지듀얼 블록을 주파수 영역으로 변환한 변환 레지듀얼 블록을 소정의 주파수 대역 단위들로 분할하고, 분할된 주파수 대역 단위별로 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그를 생성하는 것을 특징으로 한다.A method and apparatus for coding and decoding a residual block are disclosed. According to an embodiment of the present invention, a transformed residual block obtained by transforming a residual block into a frequency domain is divided into predetermined frequency band units, and a valid coefficient flag indicating whether an effective transform coefficient exists for each divided frequency band unit .
Description
본 발명은 영상의 부호화 및 복호화에 관한 것으로 보다 구체적으로는 레지듀얼 블록의 부호화 및 복호화에 관한 것이다.More particularly, the present invention relates to encoding and decoding of residual blocks.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 비디오는 소정 크기의 매크로블록에 기반하여 제한된 부호화 방식에 따라 부호화되고 있다. 또한, 기존의 비디오 코덱은 4x4, 8x8와 같은 작은 크기의 변환 단위를 이용하여 레지듀얼 블록을 부호화한다.Background of the Invention [0002] As the development and dissemination of hardware capable of playing back and storing high-resolution or high-definition video content increases the need for video codecs to effectively encode or decode high-definition or high-definition video content. According to the existing video codec, video is encoded according to a limited encoding method based on a macroblock of a predetermined size. Also, existing video codecs encode residual blocks using small-sized conversion units such as 4x4 and 8x8.
본 발명은 큰 크기의 변환 레지듀얼 블록 내의 유효 변환 계수 정보를 보다 효율적으로 부호화 및 복호화하기 위한 방법 및 장치를 제공하기 위한 것이다.The present invention is intended to provide a method and apparatus for more efficiently encoding and decoding effective transform coefficient information in a large-sized transform residual block.
본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 방법은 현재 블록의 예측 블록을 생성하는 단계; 상기 예측 블록과 상기 현재 블록 사이의 차이인 레지듀얼 블록을 생성하는 단계; 상기 레지듀얼 블록을 주파수 영역으로 변환하여 변환 레지듀얼 블록을 생성하는 단계; 상기 변환 레지듀얼 블록을 소정 주파수 대역 단위들로 분할하는 단계; 및 상기 분할된 주파수 대역 단위마다 0이 아닌 유효 변환 계수가 존재하는지 여부를 나타내는 주파수 대역 단위별 유효 계수 플래그를 부호화하는 단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a residual block coding method including: generating a prediction block of a current block; Generating a residual block which is a difference between the prediction block and the current block; Generating a transformed residual block by transforming the residual block into a frequency domain; Dividing the transform residual block into predetermined frequency band units; And encoding an effective coefficient flag for each frequency band unit indicating whether or not a non-zero effective transform coefficient exists for each of the divided frequency band units.
본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 장치는 현재 블록의 예측 블록을 생성하는 예측부; 상기 예측 블록과 상기 현재 블록 사이의 차이인 레지듀얼 블록을 생성하는 감산부; 상기 레지듀얼 블록을 주파수 영역으로 변환하여 변환 레지듀얼 블록을 생성하는 변환부; 및 상기 변환 레지듀얼 블록을 주파수 대역별로 분할하고, 상기 분할된 주파수 대역별로 0이 아닌 유효 변환 계수가 존재하는지 여부를 나타내는 대역별 유효 계수 플래그를 부호화하는 엔트로피 부호화부를 포함하는 것을 특징으로 한다.An apparatus for encoding a residual block according to an exemplary embodiment of the present invention includes: a prediction unit for generating a prediction block of a current block; A subtractor for generating a residual block which is a difference between the prediction block and the current block; A transform unit for transforming the residual block into a frequency domain to generate a transform residual block; And an entropy encoding unit for dividing the transformed residual block by frequency bands and encoding an effective coefficient flag for each band indicating whether there is a non-zero effective transform coefficient for each of the divided frequency bands.
본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 방법은 부호화된 비트스트림으로부터 현재 블록의 변환 레지듀얼 블록을 분할한 소정 주파수 대역 단위별로 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그를 추출하는 단계; 상기 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할하는 단계; 및 상기 유효 계수 플래그를 이용하여 상기 변환 레지듀얼 블록을 분할한 주파수 대역 단위들 중 유효 변환 계수가 존재하는 주파수 대역 단위를 판단하는 단계를 포함하는 것을 특징으로 한다.A residual block decoding method according to an embodiment of the present invention extracts an effective coefficient flag indicating whether an effective transform coefficient exists for each predetermined frequency band unit obtained by dividing a transformed residual block of a current block from an encoded bit stream step; Dividing the transform residual block by a predetermined frequency band unit; And determining a frequency band unit in which effective conversion coefficients exist among the frequency band units obtained by dividing the conversion residual block using the effective coefficient flag.
본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 장치는 부호화된 비트스트림으로부터 현재 블록의 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할한 주파수 대역 단위별로 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그를 추출하는 파싱부; 및 상기 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할하고, 상기 추출된 유효 계수 플래그를 이용하여 상기 주파수 대역 단위들 중 유효 변환 계수가 존재하는 주파수 대역 단위를 판단하는 엔트로피 복호화부를 포함하는 것을 특징으로 한다.The apparatus for decoding a residual block according to an embodiment of the present invention decodes an effective coefficient indicating whether an effective transform coefficient exists for each frequency band unit obtained by dividing a transform residual block of a current block into a predetermined frequency band unit from an encoded bit stream A parsing unit for extracting a flag; And an entropy decoding unit for dividing the transformed residual block by a predetermined frequency band unit and determining a frequency band unit in which effective transform coefficients exist among the frequency band units using the extracted effective coefficient flag, do.
본 발명에 따르면 분할된 주파수 대역 단위 별로 유효 변환 계수의 존재 여부를 나타내는 유효 계수 플래그를 생성함으로써 변환 레지듀얼 블록 내에 유효 변환 계수가 존재하지 않는 주파수 대역의 스캐닝 과정을 스킵할 수 있도록 하며 또한 유효 변환 계수의 부호화에 필요한 비트 발생량을 감소시킬 수 있다.According to the present invention, it is possible to skip a scanning process in a frequency band in which no effective transform coefficient exists in a transform residual block by generating an effective coefficient flag indicating whether an effective transform coefficient exists in each divided frequency band unit, It is possible to reduce the amount of bits required for coding coefficients.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다.
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다.
도 10a 내지 10c는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.
도 12a 내지 도 12c는 본 발명이 속하는 기술 분야와 관련된 기술 분야에서 변환 레지듀얼 블록을 부호화하는 과정을 설명하기 위한 참조도이다.
도 13은 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 장치(1300)의 구성을 나타낸 블록도이다.
도 14a 내지 도 14j는 본 발명에 따라서 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할하는 실시예들을 나타낸 도면이다.
도 15a 및 도 15b는 본 발명의 일 실시예에 따른 유효 변환 계수의 부호화 과정을 설명하기 위한 참조도이다.
도 16a 및 도 16b는 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 과정을 보다 구체적으로 설명하기 위한 참조도이다.
도 17a 및 도 17b는 유효 계수 부호화부(1330)에 의하여 생성된 변환 레지듀얼 블록의 부호화 정보의 실시예들을 나타낸 참조도이다.
도 18은 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 방법을 나타낸 플로우 차트이다.
도 19는 본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 장치를 나타낸 블록도이다.
도 20은 본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 방법을 나타낸 플로우 차트이다.1 is a block diagram of an image encoding apparatus according to an embodiment of the present invention.
2 is a block diagram of an image decoding apparatus according to an embodiment of the present invention.
FIG. 3 illustrates a hierarchical encoding unit according to an embodiment of the present invention.
4 is a block diagram of an image encoding unit based on an encoding unit according to an embodiment of the present invention.
5 is a block diagram of an image decoding unit based on an encoding unit according to an embodiment of the present invention.
FIG. 6 illustrates a depth-based coding unit and a prediction unit according to an embodiment of the present invention.
FIG. 7 shows a relationship between an encoding unit and a conversion unit according to an embodiment of the present invention.
FIG. 8 illustrates depth-specific encoding information, in accordance with an embodiment of the present invention.
FIG. 9 shows a depth encoding unit according to an embodiment of the present invention.
FIGS. 10A to 10C show a relationship between an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
FIG. 11 shows encoding information for each encoding unit according to an embodiment of the present invention.
12A to 12C are views for explaining a process of encoding a transform residual block in a technical field related to the present invention.
13 is a block diagram showing the configuration of a residual
14A to 14J are diagrams illustrating embodiments in which a transform residual block is divided into predetermined frequency band units according to the present invention.
15A and 15B are reference diagrams for explaining the coding process of the effective transform coefficients according to an embodiment of the present invention.
16A and 16B are views for explaining the encoding process of the residual block according to an embodiment of the present invention.
17A and 17B are reference diagrams showing embodiments of encoding information of the conversion residual block generated by the effective
18 is a flowchart illustrating a residual block coding method according to an embodiment of the present invention.
19 is a block diagram illustrating an apparatus for decoding residual blocks according to an embodiment of the present invention.
20 is a flowchart illustrating a method of decoding a residual block according to an embodiment of the present invention.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들에 따른 영상 부호화 장치 및 영상 복호화 장치, 영상 부호화 방법 및 영상 복호화 방법을 설명한다.Hereinafter, an image encoding apparatus, an image decoding apparatus, an image encoding method, and an image decoding method according to preferred embodiments of the present invention will be described with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치의 블록도이다.1 is a block diagram of an image encoding apparatus according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 최대 부호화 단위 분할부(110), 부호화 심도 결정부(120) 및 출력부(130)를 포함한다.1, an image encoding apparatus 100 according to an exemplary embodiment of the present invention includes a maximum encoding
최대 부호화 단위 분할부(110)는 최대 크기의 부호화 단위인 최대 부호화 단위에 기반하여 현재 픽처 또는 현재 슬라이스를 분할한다. 현재 픽처 또는 현재 슬라이스는 적어도 하나의 최대 부호화 단위로 분할된다. 분할된 영상 데이터는 적어도 하나의 최대 부호화 단위별로 부호화 심도 결정부(120)로 출력될 수 있다.The maximum coding
본 발명의 일 실시예에 따르면, 최대 부호화 단위 및 심도를 이용해 부호화 단위가 표현될 수 있다. 최대 부호화 단위는 현재 픽처의 부호화 단위 중 크기가 가장 큰 부호화 단위를 나타내며, 심도는 부호화 단위가 계층적으로 분할되는 단계를 나타낸다. 심도가 깊어질수록, 부호화 단위는 최대 부호화 단위로부터 최소 부호화 단위까지 분할될 수 있다. 최대 부호화 단위의 심도가 최상위 심도이며, 최소 부호화 단위의 심도는 최하위 심도로 정의될 수 있다. 심도가 깊어짐에 따라 심도별 부호화 단위의 크기는 감소하므로, k 심도의 서브 부호화 단위는 k+1 이상의 심도를 갖는 복수 개의 서브 부호화 단위를 포함할 수 있다.According to an embodiment of the present invention, an encoding unit can be expressed using a maximum encoding unit and a depth. The maximum coding unit indicates the coding unit having the largest size among the coding units of the current picture, and the depth indicates a step in which the coding units are hierarchically divided. The deeper the depth, the more the encoding unit can be divided from the maximum encoding unit to the minimum encoding unit. The depth of the largest encoding unit is the highest depth, and the depth of the minimum encoding unit can be defined as the lowest depth. As the depth increases, the size of the depth-dependent coding unit decreases, so that the sub-coding unit of k depth may include a plurality of sub-coding units having a depth of k + 1 or more.
전술한 바와 같이 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할하며, 각각의 최대 부호화 단위는 심도별로 분할되는 부호화 단위들을 포함할 수 있다. 본 발명의 일 실시예에 따른 최대 부호화 단위는 심도별로 분할되므로, 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 심도에 따라 계층적으로 분류될 수 있다. As described above, according to the maximum size of an encoding unit, the image data of the current picture is divided into a maximum encoding unit, and each maximum encoding unit may include encoding units divided by depth. Since the maximum encoding unit according to an embodiment of the present invention is divided by depth, image data of a spatial domain included in the maximum encoding unit can be hierarchically classified according to depth.
최대 부호화 단위의 높이 및 너비를 계층적으로 분할할 수 있는 총 횟수를 제한하는 최대 심도 및 부호화 단위의 최대 크기가 미리 설정되어 있을 수 있다. 이러한 최대 부호화 단위 및 최대 심도는 픽처 또는 슬라이스 단위로 설정될 수 있다. 즉, 픽처 또는 슬라이스마다 상이한 최대 부호화 단위 및 최대 심도를 갖을 수 있으며, 최대 심도에 따라 최대 영상 부호화 단위에 포함된 최소 부호화 단위 크기를 가변적으로 설정할 수 있다. 이와 같이 픽처 또는 슬라이스마다 최대 부호화 단위 및 최대 심도를 가변적으로 설정할 수 있게 함으로써, 평탄한 영역의 영상은 보다 큰 최대 부호화 단위를 이용하여 부호화함으로써 압축률을 향상시키고, 복잡도가 큰 영상은 보다 작은 크기의 부호화 단위를 이용하여 영상의 압축 효율을 향상시킬 수 있다.The maximum depth for limiting the total number of times the height and width of the maximum encoding unit can be hierarchically divided and the maximum size of the encoding unit may be preset. The maximum encoding unit and the maximum depth may be set in units of pictures or slices. That is, each picture or slice may have a different maximum coding unit and maximum depth, and the minimum coding unit size included in the maximum image coding unit may be variably set according to the maximum depth. By setting the maximum coding unit and the maximum depth for each picture or slice in this manner, it is possible to improve the compression ratio by coding the image of the flat area using a larger maximum coding unit, and the image with a large complexity can be encoded The compression efficiency of the image can be improved by using the unit.
부호화 심도 결정부(120)는 심도마다 최대 부호화 단위의 영역이 분할된 적어도 하나의 분할 영역을 부호화하여, 적어도 하나의 분할 영역 별로 최종 부호화 결과가 출력될 심도를 결정한다. 즉 부호화 심도 결정부(120)는, 최대 부호화 단위마다 심도별 부호화 단위로 영상 데이터를 부호화하여 가장 작은 부호화 오차가 발생하는 심도를 선택하여 부호화 심도로 결정한다. 부호화 심도는 R-D 코스트(Rate-Distortion Cost) 계산에 기초해 결정될 수 있다. 결정된 부호화 심도 및 최대 부호화 단위별 영상 데이터는 출력부(130)로 출력된다. The encoding
최대 부호화 단위 내의 영상 데이터는 최대 심도 이하의 적어도 하나의 심도에 따라 심도별 부호화 단위에 기반하여 부호화되고, 각각의 심도별 부호화 단위에 기반한 부호화 결과가 비교된다. 심도별 부호화 단위의 부호화 오차의 비교 결과 부호화 오차가 가장 작은 심도가 선택될 수 있다. 각각의 최대화 부호화 단위마다 적어도 하나의 부호화 심도가 결정될 수 있다. The image data in the maximum encoding unit is encoded based on the depth encoding unit according to at least one depth below the maximum depth, and the encoding results based on the respective depth encoding units are compared. As a result of the comparison of the encoding error of the depth-dependent encoding unit, the depth with the smallest encoding error can be selected. At least one coding depth may be determined for each maximum coding unit.
최대 부호화 단위의 크기는 심도가 깊어짐에 따라 부호화 단위가 계층적으로 분할되어 축소되며 부호화 단위의 개수는 증가한다. 또한, 하나의 최대 부호화 단위에 포함되는 동일한 심도의 부호화 단위들이라 하더라도, 각각의 데이터에 대한 부호화 오차를 측정하고 하위 심도로의 분할 여부가 결정된다. 따라서, 하나의 최대 부호화 단위에 포함되는 데이터라 하더라도 위치에 따라 심도별 부호화 오차가 다르므로 위치에 따라 부호화 심도가 달리 결정될 수 있다. 다시 말해, 최대 부호화 단위는 상이한 심도에 따라 상이한 크기의 서브 부호화 단위로 분할될 수 있다. 하나의 최대 부호화 단위에 대해 부호화 심도가 하나 이상 설정될 수 있으며, 최대 부호화 단위의 데이터는 하나 이상의 부호화 심도의 부호화 단위에 따라 분할될 수 있다.As the depth of the maximum encoding unit increases, the encoding unit is hierarchically divided and reduced, and the number of encoding units increases. In addition, even if encoding units of the same depth included in one maximum encoding unit, the encoding error of each data is measured and it is determined whether or not the encoding unit is divided into lower depths. Therefore, even if the data included in one maximum coding unit has a different coding error according to the position, the coding depth can be determined depending on the position. In other words, the maximum encoding unit may be divided into sub-encoding units of different sizes according to different depths. One or more coding depths may be set for one maximum coding unit and data of the maximum coding unit may be divided according to the coding units of one or more coding depths.
또한, 최대 부호화 단위에 포함된 상이한 크기의 서브 부호화 단위들은 상이한 크기의 처리 단위에 기초해 예측 또는 주파수 변환될 수 있다. 다시 말해, 영상 부호화 장치(100)는 영상 부호화를 위한 복수의 처리 단계들을 다양한 크기 및 다양한 형태의 처리 단위에 기초해 수행할 수 있다. 영상 데이터의 부호화를 위해서는 예측, 주파수 변환, 엔트로피 부호화 등의 처리 단계를 거치는데, 모든 단계에 걸쳐서 동일한 크기의 처리 단위가 이용될 수도 있으며, 단계별로 상이한 크기의 처리 단위를 이용할 수 있다.Further, the sub-encoding units of different sizes included in the maximum encoding unit can be predicted or frequency-converted based on the processing units of different sizes. In other words, the image encoding apparatus 100 can perform a plurality of processing steps for image encoding based on various sizes and processing units of various types. In order to encode video data, processing steps such as prediction, frequency conversion, and entropy encoding are performed. Processing units of the same size may be used in all stages, and processing units of different sizes may be used in each step.
예를 들어 영상 부호화 장치(100)는 부호화 단위를 예측하기 위해, 부호화 단위와 다른 처리 단위를 선택할 수 있다. 일 예로, 부호화 단위의 크기가 2Nx2N(단, N은 양의 정수)인 경우, 예측을 위한 처리 단위는 2Nx2N, 2NxN, Nx2N, NxN 등일 수 있다. 다시 말해, 부호화 단위의 높이 또는 너비 중 적어도 하나를 반분하는 형태의 처리 단위를 기반으로 예측 부호화가 수행될 수도 있다. 이하, 예측 부호화의 기초가 되는 데이터 단위는 '예측 단위'라 한다.For example, in order to predict a coding unit, the image coding apparatus 100 may select a coding unit and a different processing unit. For example, when the size of the encoding unit is 2Nx2N (where N is a positive integer), the processing unit for prediction may be 2Nx2N, 2NxN, Nx2N, NxN, and the like. In other words, predictive coding may be performed based on a processing unit of a type in which at least one of the height or the width of an encoding unit is halved. Hereinafter, a data unit serving as a basis of predictive encoding is referred to as a 'prediction unit'.
예측 모드는 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있으며, 특정 예측 모드는 특정 크기 또는 형태의 예측 단위에 대해서만 수행될 수 있다. 예를 들어, 인트라 모드는 정방형인 2Nx2N, NxN 크기의 예측 단위에 대해서만 수행될 수 있다. 또한, 스킵 모드는 2Nx2N 크기의 예측 단위에 대해서만 수행될 수 있다. 부호화 단위 내부에 복수의 예측 단위가 있다면, 각각의 예측 단위에 대해 예측을 수행하여 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.The prediction mode may be at least one of an intra mode, an inter mode, and a skip mode, and the specific prediction mode may be performed only for a prediction unit of a specific size or type. For example, the intra mode can be performed only for a 2Nx2N, NxN sized prediction unit, which is a square. In addition, the skip mode can be performed only for a prediction unit of 2Nx2N size. If there are a plurality of prediction units in an encoding unit, a prediction mode having the smallest coding error can be selected by performing prediction for each prediction unit.
또한, 영상 부호화 장치(100)는 부호화 단위와 다른 크기의 처리 단위에 기초해 영상 데이터를 주파수 변환할 수 있다. 부호화 단위의 주파수 변환을 위해서 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 주파수 변환이 수행될 수 있다. 이하, 주파수 변환의 기초가 되는 처리 단위를 '변환 단위'라 한다.Also, the image encoding apparatus 100 can frequency-convert image data based on a processing unit having a different size from the encoding unit. The frequency conversion may be performed based on a data unit having a size smaller than or equal to the encoding unit for frequency conversion of the encoding unit. Hereinafter, a processing unit serving as a basis of frequency conversion is referred to as a 'conversion unit'.
부호화 심도 결정부(120)는 라그랑자 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 심도별 부호화 단위의 부호화 오차를 측정하여 최적의 부호화 오차를 갖는 최대 부호화 단위의 분할 형태를 결정할 수 있다. 다시 말해, 부호화 심도 결정부(120)는 최대 부호화 단위가 어떠한 형태의 복수의 서브 부호화 단위로 분할되는지 결정할 수 있는데, 여기서 복수의 서브 부호화 단위는 심도에 따라 크기가 상이하다.The
출력부(130)는, 부호화 심도 결정부(120)에서 결정된 적어도 하나의 부호화 심도에 기초하여 부호화된 최대 부호화 단위의 영상 데이터 및 심도별 부호화 모드에 관한 정보를 비트스트림 형태로 출력한다. The
심도별 부호화 모드에 관한 정보는, 부호화 심도 정보, 부호화 심도의 부호화 단위의 예측 단위의 파티션 타입 정보, 예측 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.The information on the depth-dependent coding mode may include coding depth information, partition type information of a prediction unit of a coding unit of coding depth, prediction mode information per prediction unit, size information of a conversion unit, and the like.
부호화 심도 정보는, 현재 심도로 부호화하지 않고 하위 심도의 부호화 단위로 부호화할지 여부를 나타내는 심도별 분할 정보를 이용하여 정의될 수 있다. 현재 부호화 단위의 현재 심도가 부호화 심도라면, 현재 부호화 단위는 현재 심도의 부호화 단위로 부호화되므로 현재 심도의 분할 정보는 더 이상 하위 심도로 분할되지 않도록 정의될 수 있다. 반대로, 현재 부호화 단위의 현재 심도가 부호화 심도가 아니라면 하위 심도의 부호화 단위를 이용한 부호화를 시도해보아야 하므로, 현재 심도의 분할 정보는 하위 심도의 부호화 단위로 분할되도록 정의될 수 있다.The coding depth information can be defined using depth division information indicating whether or not coding is performed at the lower depth coding unit without coding at the current depth. If the current depth of the current encoding unit is the encoding depth, the current encoding unit is encoded in the current depth encoding unit, so that the division information of the current depth can be defined so as not to be further divided into lower depths. On the other hand, if the current depth of the current encoding unit is not the encoding depth, the encoding using the lower depth encoding unit should be tried. Therefore, the division information of the current depth may be defined to be divided into the lower depth encoding units.
현재 심도가 부호화 심도가 아니라면, 하위 심도의 부호화 단위로 분할된 부호화 단위에 대해 부호화가 수행된다. 현재 심도의 부호화 단위 내에 하위 심도의 부호화 단위가 하나 이상 존재하므로, 각각의 하위 심도의 부호화 단위마다 반복적으로 부호화가 수행되어, 동일한 심도의 부호화 단위마다 재귀적(recursive) 부호화가 수행될 수 있다.If the current depth is not the encoding depth, encoding is performed on the encoding unit divided into lower-depth encoding units. Since there are one or more lower-level coding units in the current-depth coding unit, the coding is repeatedly performed for each lower-level coding unit so that recursive coding can be performed for each coding unit of the same depth.
하나의 최대 부호화 단위 안에 적어도 하나의 부호화 심도가 결정되며 부호화 심도마다 적어도 하나의 부호화 모드에 관한 정보가 결정되어야 하므로, 하나의 최대 부호화 단위에 대해서는 적어도 하나의 부호화 모드에 관한 정보가 결정될 수 있다. 또한, 최대 부호화 단위의 데이터는 심도에 따라 계층적으로 분할되어 위치 별로 부호화 심도가 다를 수 있으므로, 데이터에 대해 부호화 심도 및 부호화 모드에 관한 정보가 설정될 수 있다.At least one coding depth is determined in one maximum coding unit and at least one coding mode information is determined for each coding depth so that information on at least one coding mode can be determined for one maximum coding unit. In addition, since the data of the maximum encoding unit is hierarchically divided according to the depth and the depth of encoding may be different for each position, information on the encoding depth and the encoding mode can be set for the data.
따라서, 일 실시예에 따른 출력부(140)는, 최대 부호화 단위에 포함되어 있는 최소 부호화 단위마다 해당 부호화 정보를 설정할 수 있다. 즉, 부호화 심도의 부호화 단위는 동일한 부호화 정보를 보유하고 있는 최소 부호화 단위를 하나 이상 포함하고 있다. 이를 이용하여, 인근 최소 부호화 단위들이 동일한 심도별 부호화 정보를 갖고 있다면, 동일한 최대 부호화 단위에 포함되는 최소 부호화 단위일 수 있다.Therefore, the output unit 140 according to the embodiment can set the corresponding encoding information for each minimum encoding unit included in the maximum encoding unit. That is, the coding unit of the coding depth includes at least one minimum coding unit that holds the same coding information. By using this, if the neighboring minimum encoding units have the same depth encoding information, it can be the minimum encoding unit included in the same maximum encoding unit.
예를 들어 출력부(130)를 통해 출력되는 부호화 정보는, 심도별 부호화 단위별 부호화 정보와 예측 단위별 부호화 정보로 분류될 수 있다. 심도별 부호화 단위별 부호하 정보는, 예측 모드 정보, 파티션 크기 정보를 포함할 수 있다. 예측 단위별로 전송되는 부호화 정보는 인터 모드의 추정 방향에 관한 정보, 인터 모드의 참조 영상 인덱스에 관한 정보, 움직임 벡터에 관한 정보, 인트라 모드의 크로마 성분에 관한 정보, 인트라 모드의 보간 방식에 관한 정보 등을 포함할 수 있다. 또한, 픽처, 슬라이스 또는 GOP별로 정의되는 부호화 단위의 최대 크기에 관한 정보 및 최대 심도에 관한 정보는 비트스트림의 헤더에 삽입될 수 있다.For example, the encoding information output through the
영상 부호화 장치(100)의 가장 간단한 형태의 실시예에 따르면, 심도별 부호화 단위는 한 계층 상위 심도의 부호화 단위의 높이 및 너비를 반분한 크기의 부호화 단위이다. 즉, 현재 심도(k)의 부호화 단위의 크기가 2Nx2N이라면, 하위 심도(k+1)의 부호화 단위의 크기는 NxN 이다. 따라서, 2Nx2N 크기의 현재 부호화 단위는 NxN 크기의 하위 심도 부호화 단위를 최대 4개 포함할 수 있다.According to the simplest embodiment of the image coding apparatus 100, the depth-dependent coding unit is a coding unit having a height divided by the height and width of the coding unit of one layer higher depth. That is, if the size of the encoding unit of the current depth (k) is 2Nx2N, the size of the encoding unit of the lower depth (k + 1) is NxN. Therefore, the current encoding unit of 2Nx2N size can include a maximum of 4 sub-depth encoding units of NxN size.
따라서, 일 실시예에 따른 영상 복호화 장치(100)는 현재 픽처의 특성을 고려하여 결정된 최대 부호화 단위의 크기 및 최대 심도를 기반으로, 각각의 최대 부호화 단위마다 최적의 형태 분할 형태를 결정할 수 있다. 또한, 각각의 최대 부호화 단위마다 다양한 예측 모드, 주파수 변환 방식 등으로 부호화할 수 있으므로, 다양한 영상 크기의 부호화 단위의 영상 특성을 고려하여 최적의 부호화 모드가 결정될 수 있다.Therefore, the image decoding apparatus 100 according to an exemplary embodiment can determine an optimum shape division type for each maximum encoding unit based on the size and the maximum depth of the maximum encoding unit determined in consideration of the characteristics of the current picture. In addition, since each encoding unit can be encoded by various prediction modes, frequency conversion methods, and the like, an optimal encoding mode can be determined in consideration of image characteristics of encoding units of various image sizes.
영상의 해상도가 매우 높거나 데이터량이 매우 큰 영상을 종래의 16x16 크기의 매크로블록 단위로 부호화한다면, 픽처당 매크로블록의 수가 과도하게 많아진다. 이에 따라, 매크로블록마다 생성되는 압축 정보도 많아지므로 압축 정보의 전송 부담이 커지고 데이터 압축 효율이 감소하는 경향이 있다. 따라서, 본 발명의 일 실시예에 따른 영상 부호화 장치는, 영상의 크기를 고려하여 부호화 단위의 최대 크기를 증가시키면서, 영상 특성을 고려하여 부호화 단위를 조절할 수 있으므로, 영상 압축 효율이 증대될 수 있다.If an image having a very high image resolution or a very large data amount is encoded in units of a conventional 16x16 macroblock, the number of macroblocks per picture becomes excessively large. This increases the amount of compression information generated for each macroblock, so that the burden of transmission of compressed information increases and the data compression efficiency tends to decrease. Therefore, the image encoding apparatus according to the embodiment of the present invention can increase the maximum size of the encoding unit in consideration of the image size, and adjust the encoding unit in consideration of the image characteristic, so that the image compression efficiency can be increased .
도 2 는 본 발명의 일 실시예에 따른 영상 복호화 장치의 블록도를 도시한다.2 is a block diagram of an image decoding apparatus according to an embodiment of the present invention.
도 2를 참조하면, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)는 수신부(210), 영상 데이터 및 부호화 정보 추출부(220) 및 영상 데이터 복호화부(230)를 포함한다. 2, an
수신부(210)는 부호화된 비디오에 대한 비트스트림을 수신하여 파싱(parsing)한다. 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별로 영상 데이터를 추출하여 영상 데이터 복호화부(230)로 출력한다. 영상 데이터 및 부호화 정보 추출부(220)는 현재 픽처 또는 슬라이스에 대한 헤더로부터 현재 픽처 또는 슬라이스의 최대 부호화 단위에 대한 정보를 추출할 수 있다. 또한, 영상 데이터 및 부호화 정보 추출부(220)는 파싱된 비트스트림으로부터 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보를 추출한다. 추출된 부호화 심도 및 부호화 모드에 관한 정보는 영상 데이터 복호화부(230)로 출력된다.The receiving
최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보는, 하나 이상의 부호화 심도 정보에 대해 설정될 수 있으며, 부호화 심도별 부호화 모드에 관한 정보는, 부호화 단위별 예측 단위의 파티션 타입 정보, 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다. 또한, 부호화 심도 정보로서, 심도별 분할 정보가 추출될 수도 있다.Information on the coding depth and the coding mode per coding unit can be set for one or more coding depth information, and the information on the coding mode for each coding depth includes information on partition type information, prediction mode information, Size information of the conversion unit, and the like. In addition, as the encoding depth information, depth-based segmentation information may be extracted.
최대 부호화 단위의 분할 형태에 대한 정보는 최대 부호화 단위에 포함된 심도에 따라 상이한 크기의 서브 부호화 단위에 대한 정보를 포함할 수 있으며, 부호화 모드에 관한 정보는 서브 부호화 단위별 예측 단위에 대한 정보, 예측 모드에 대한 정보 및 변환 단위에 대한 정보 등을 포함할 수 있다. The information on the division type of the maximum encoding unit may include information on sub-encoding units of different sizes according to the depth included in the maximum encoding unit, the information on the encoding mode may include information on a prediction unit for each sub- Information on the prediction mode, information on the conversion unit, and the like.
영상 데이터 복호화부(230)는 최대 부호화 단위별 부호화 심도 및 부호화 모드에 관한 정보에 기초하여 각각의 최대 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 최대 부호화 단위의 분할 형태에 대한 정보에 기초하여, 영상 데이터 복호화부(230)는 최대 부호화 단위에 포함된 서브 부호화 단위를 복호화할 수 있다. 복호화 과정은 인트라 예측 및 움직임 보상을 포함하는 예측 과정, 및 주파수 역변환 과정을 포함할 수 있다.The image
영상 데이터 복호화부(230)는, 부호화 단위별 예측을 위해 부호화 심도별 부호화 단위의 예측 단위의 분할 타입 정보 및 예측 모드 정보에 기초하여, 부호화 단위마다 각각의 예측 단위 및 예측 모드로 인트라 예측 또는 움직임 보상을 수행할 수 있다. 또한, 영상 데이터 복호화부(230)는, 최대 부호화 단위별 역변환을 위해, 부호화 심도별 부호화 단위의 변환 단위의 크기 정보에 기초하여, 부호화 단위마다 각각의 변환 단위로 역변환을 수행할 수 있다.The image
영상 데이터 복호화부(230)는 심도별 분할 정보를 이용하는 현재 최대 부호화 단위의 부호화 심도를 결정할 수 있다. 만약, 분할 정보가 현재 심도로 복호화할 것을 나타내고 있다면 현재 심도가 부호화 심도이다. 따라서, 영상 데이터 복호화부(230)는 현재 최대 부호화 단위의 영상 데이터에 대해 현재 심도의 부호화 단위를 예측 단위의 파티션 타입, 예측 모드 및 변환 단위 크기 정보를 이용하여 복호화할 수 있다. 즉, 최소 부호화 단위에 대해 설정되어 있는 부호화 정보를 관찰하여, 동일한 분할 정보를 포함한 부호화 정보를 보유하고 있는 최소 부호화 단위를 모아, 하나의 데이터 단위로 복호화할 수 있다. The image
일 실시예에 따른 영상 복호화 장치(200)는, 부호화 과정에서 최대 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 최대 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다. 따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.The
도 3은 본 발명의 일 실시예에 따른 계층적 부호화 단위를 도시한다.FIG. 3 illustrates a hierarchical encoding unit according to an embodiment of the present invention.
도 3을 참조하면, 본 발명에 따른 계층적 부호화 단위는 너비x높이가 64x64인 부호화 단위부터, 32x32, 16x16, 8x8, 및 4x4를 포함할 수 있다. 정사각형 형태의 부호화 단위 이외에도, 너비x높이가 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8인 부호화 단위들이 존재할 수 있다.Referring to FIG. 3, the hierarchical coding unit according to the present invention may include 32x32, 16x16, 8x8, and 4x4 from a coding unit having a width x height of 64x64. In addition to the square-shaped encoding units, there may be encoding units whose width x height is 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4, 4x8.
도 3에서 비디오 데이터(310)에 대해서는, 해상도는 1920x1080, 최대 부호화 단위의 크기는 64, 최대 심도가 2로 설정되어 있다. 또한, 비디오 데이터(320)에 대해서는, 해상도는 1920x1080, 부호화 단위의 최대 크기는 64, 최대 심도가 4로 설정되어 있다. 또한, 비디오 데이터(330)에 대해서는, 해상도는 352x288, 부호화 단위의 최대 크기는 16, 최대 심도가 2로 설정되어 있다.3, the resolution is set to 1920 x 1080, the size of the maximum encoding unit is set to 64, and the maximum depth is set to 2 for the
해상도가 높거나 데이터량이 많은 경우 압축률 향상뿐만 아니라 영상 특성을 정확히 반영하기 위해 부호화 사이즈의 최대 크기가 상대적으로 큰 것이 바람직하다. 따라서, 비디오 데이터(330)에 비해, 해상도가 높0은 비디오 데이터(310, 320)는 부호화 사이즈의 최대 크기가 64로 선택될 수 있다.It is desirable that the maximum size of the encoding size is relatively large in order to accurately reflect not only the compression ratio but also the image characteristic when the resolution is high or the data amount is large. Therefore, the maximum size of the encoding size of the
최대 심도는 계층적 부호화 단위에서 총 계층수를 나타낸다. 따라서, 비디오 데이터(310)의 최대 심도는 2이므로, 비디오 데이터(310)의 부호화 단위(315)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 두 계층 깊어져서 장축 크기가 32, 16인 부호화 단위들까지 포함할 수 있다. 반면, 비디오 데이터(330)의 최대 심도는 2이므로, 비디오 데이터(330)의 부호화 단위(335)는 장축 크기가 16인 부호화 단위들로부터, 심도가 두 계층 깊어져서 장축 크기가 8, 4인 부호화 단위들까지 포함할 수 있다. The maximum depth indicates the total number of layers in the hierarchical encoding unit. Therefore, since the maximum depth of the
비디오 데이터(320)의 최대 심도는 4이므로, 비디오 데이터(320)의 부호화 단위(325)는 장축 크기가 64인 최대 부호화 단위로부터, 심도가 네 계층 깊어져서 장축 크기가 32, 16, 8, 4인 부호화 단위들까지 포함할 수 있다. 심도가 깊어질수록 더 작은 서브 부호화 단위에 기초해 영상을 부호화하므로 보다 세밀한 장면을 포함하고 있는 영상을 부호화하는데 적합해진다.Since the maximum depth of the
도 4 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 부호화부의 블록도를 나타낸 것이다.4 is a block diagram of an image encoding unit based on an encoding unit according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화부(400)는, 도 1의 영상 부호화 장치(100)의 부호화 심도 결정부(120)에서 부호화 심도를 결정하기 위하여 거쳐야 되는 영상 데이터 부호화 작업들을 수행한다.The
도 4를 참조하면, 인트라 예측부(410)는 현재 프레임(405) 중 인트라 모드의 예측 단위에 대해 인트라 예측을 수행하고, 움직임 추정부(420) 및 움직임 보상부(425)는 인터 모드의 예측 단위에 대해 현재 프레임(405) 및 참조 프레임(495)을 이용해 인터 예측 및 움직임 보상을 수행한다.4, the
인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)로부터 출력된 예측 단위에 기초해 레지듀얼 값들이 생성되고, 생성된 레지듀얼 값들은 주파수 변환부(430) 및 양자화부(440)를 거쳐 양자화된 변환 계수로 출력된다. The residual values are generated based on the prediction unit output from the
양자화된 변환 계수는 역양자화부(460), 주파수 역변환부(470)를 통해 다시 레지듀얼 값으로 복원되고, 복원된 레지듀얼 값들은 디블로킹부(480) 및 루프 필터링부(490)를 거쳐 후처리되어 참조 프레임(495)으로 출력된다. 양자화된 변환 계수는 엔트로피 부호화부(450)를 거쳐 비트스트림(455)으로 출력된다. 특히 도 12를 참조하여 후술되는 바와 같이 본 발명의 일 실시예에 따른 엔트로피 부호화부(450)는 예측 블록과 원 블록 사이의 차이값인 레지듀얼 블록을 주파수 영역으로 변환한 변환 레지듀얼 블록을 소정 주파수 대역 단위들로 분할하고, 분할된 주파수 대역 단위마다 0이 아닌 유효 변환 계수가 존재하는지 여부를 나타내는 주파수 대역 단위별 유효 계수 플래그를 부호화한다.The quantized transform coefficients are restored to a residual value through the
본 발명의 일 실시예에 따른 영상 부호화 방법에 따라 부호화하기 위해, 영상 부호화부(400)의 구성 요소들인 인트라 예측부(410), 움직임 추정부(420), 움직임 보상부(425), 주파수 변환부(430), 양자화부(440), 엔트로피 부호화부(450), 역양자화부(460), 주파수 역변환부(470), 디블로킹부(480) 및 루프 필터링부(490)는 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 부호화 과정들을 처리할 수 있다. 인트라 예측부(410), 움직임 추정부(420) 및 움직임 보상부(425)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 변환부(430)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려할 수 있다.In order to perform encoding according to the image encoding method according to an embodiment of the present invention, an
도 5 는 본 발명의 일 실시예에 따른 부호화 단위에 기초한 영상 복호화부의 블록도를 나타낸 것이다.5 is a block diagram of an image decoding unit based on an encoding unit according to an embodiment of the present invention.
도 5를 참조하면, 비트스트림(505)이 파싱부(510)를 거쳐 복호화 대상인 부호화된 영상 데이터 및 복호화를 위해 필요한 부호화 정보가 파싱된다. 부호화된 영상 데이터는 엔트로피 복호화부(520) 및 역양자화부(530)를 거쳐 역양자화된 데이터로 출력되고, 주파수 역변환부(540)를 거쳐 레지듀얼 값들로 복원된다. 레지듀얼 값들은 인트라 예측부(550)의 인트라 예측의 결과 또는 움직임 보상부(560)의 움직임 보상 결과와 가산되어 부호화 단위 별로 복원된다. 복원된 부호화 단위는 디블로킹부(570) 및 루프 필터링부(580)를 거쳐 다음 부호화 단위 또는 다음 픽처의 예측에 이용된다.Referring to FIG. 5, the
본 발명의 일 실시예에 따른 영상 복호화 방법에 따라 복호화하기 위해 영상 복호화부(400)의 구성 요소들인 파싱부(510), 엔트로피 복호화부(520), 역양자화부(530), 주파수 역변환부(540), 인트라 예측부(550), 움직임 보상부(560), 디블로킹부(570) 및 루프 필터링부(580)가 모두 최대 부호화 단위, 심도에 따른 서브 부호화 단위, 예측 단위 및 변환 단위에 기초해 영상 복호화 과정들을 처리할 수 있다. 특히, 인트라 예측부(550), 움직임 보상부(560)는 부호화 단위의 최대 크기 및 심도를 고려하여 부호화 단위 내의 예측 단위 및 예측 모드를 결정하며, 주파수 역변환부(540)는 부호화 단위의 최대 크기 및 심도를 고려하여 변환 단위의 크기를 고려할 수 있다.A
도 6은 본 발명의 일 실시예에 따른 심도별 부호화 단위 및 예측 단위를 도시한다.FIG. 6 illustrates a depth-based coding unit and a prediction unit according to an embodiment of the present invention.
일 실시예에 따른 영상 부호화 장치(100) 및 일 실시예에 따른 영상 복호화 장치(200)는 영상 특성을 고려하기 위해 계층적인 부호화 단위를 사용한다. 부호화 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라 다양하게 설정될 수도 있다. 미리 설정된 부호화 단위의 최대 크기에 따라, 심도별 부호화 단위의 크기가 결정될 수도 있다.The image encoding apparatus 100 and the
본 발명의 일 실시예에 따른 부호화 단위의 계층 구조(600)는 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 4인 경우를 도시하고 있다. 일 실시예에 따른 부호화 단위의 계층 구조(600)의 세로축을 따라서 심도가 깊어지므로 심도별 부호화 단위의 높이 및 너비가 각각 분할된다. 또한, 부호화 단위의 계층 구조(600)의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 기반이 되는 부분적 데이터 단위인 예측 단위가 도시되어 있다.The
최대 부호화 단위(610)는 부호화 단위의 계층 구조(600) 중 최대 부호화 단위로서 심도가 0이며, 부호화 단위의 크기, 즉 높이 및 너비가 64x64이다. 세로축을 따라 심도가 깊어지며, 크기 32x32인 심도 1의 부호화 단위(620), 크기 16x16인 심도 2의 부호화 단위(630), 크기 8x8인 심도 3의 부호화 단위(640), 크기 4x4인 심도 4의 부호화 단위(650)가 존재한다. 크기 4x4인 심도 4의 부호화 단위(650)는 최소 부호화 단위이다.The
또한 도 6을 참조하면, 각각의 심도별로 가로축을 따라, 부호화 단위의 예측 단위로서, 부분적 데이터 단위들이 도시되어 있다. 즉, 심도 0의 크기 64x64의 최대 부호화 단위(610)의 예측 단위는, 크기 64x64의 부호화 단위(610)에 포함되는 크기 64x64의 부분적 데이터 단위(610), 크기 64x32의 부분적 데이터 단위들(612), 크기 32x64의 부분적 데이터 단위들(614), 크기 32x32의 부분적 데이터 단위들(616)일 수 있다. Referring also to FIG. 6, partial data units are shown along the horizontal axis for each depth, as a prediction unit of an encoding unit. That is, the prediction unit of the
심도 1의 크기 32x32의 부호화 단위(620)의 예측 단위는, 크기 32x32의 부호화 단위(620)에 포함되는 크기 32x32의 부분적 데이터 단위(620), 크기 32x16의 부분적 데이터 단위들(622), 크기 16x32의 부분적 데이터 단위들(624), 크기 16x16의 부분적 데이터 단위들(626)일 수 있다. The prediction unit of the
심도 2의 크기 16x16의 부호화 단위(630)의 예측 단위는, 크기 16x16의 부호화 단위(630)에 포함되는 크기 16x16의 부분적 데이터 단위(630), 크기 16x8의 부분적 데이터 단위들(632), 크기 8x16의 부분적 데이터 단위들(634), 크기 8x8의 부분적 데이터 단위들(636)일 수 있다. The prediction unit of the
심도 3의 크기 8x8의 부호화 단위(640)의 예측 단위는, 크기 8x8의 부호화 단위(640)에 포함되는 크기 8x8의 부분적 데이터 단위(640), 크기 8x4의 부분적 데이터 단위들(642), 크기 4x8의 부분적 데이터 단위들(644), 크기 4x4의 부분적 데이터 단위들(646)일 수 있다. The prediction unit of the
마지막으로, 심도 4의 크기 4x4의 부호화 단위(650)는 최소 부호화 단위이며 최하위 심도의 부호화 단위이고, 해당 예측 단위도 크기 4x4의 데이터 단위(650)이다.Finally, a
일 실시예에 따른 영상 부호화 장치의 부호화 심도 결정부(120)는, 최대 부호화 단위(610)의 부호화 심도를 결정하기 위해, 최대 부호화 단위(610)에 포함되는 각각의 심도의 부호화 단위마다 부호화를 수행하여야 한다. In order to determine the depth of encoding of the
동일한 범위 및 크기의 데이터를 포함하기 위한 심도별 부호화 단위의 개수는, 심도가 깊어질수록 심도별 부호화 단위의 개수도 증가한다. 예를 들어, 심도 1의 부호화 단위 한 개가 포함하는 데이터에 대해서, 심도 2의 부호화 단위는 네 개가 필요하다. 따라서, 동일한 데이터의 부호화 결과를 심도별로 비교하기 위해서, 한 개의 심도 1의 부호화 단위 및 네 개의 심도 2의 부호화 단위를 이용하여 각각 부호화되어야 한다.The number of coding units per depth to include data of the same range and size increases as the depth of the coding unit increases. For example, for data containing one coding unit at
각각의 심도별 부호화를 위해서는, 부호화 단위의 계층 구조(600)의 가로축을 따라, 심도별 부호화 단위의 예측 단위들마다 부호화를 수행하여, 해당 심도에서 가장 작은 부호화 오차인 대표 부호화 오차가 선택될 수다. 또한, 부호화 단위의 계층 구조(600)의 세로축을 따라 심도가 깊어지며, 각각의 심도마다 부호화를 수행하여, 심도별 대표 부호화 오차를 비교하여 최소 부호화 오차가 검색될 수 있다. 최대 부호화 단위(610) 중 최소 부호화 오차가 발생하는 심도가 최대 부호화 단위(610)의 부호화 심도 및 파티션 타입으로 선택될 수 있다. For each depth-of-field coding, encoding is performed for each prediction unit of the depth-dependent coding unit along the horizontal axis of the
도 7은 본 발명의 일 실시예에 따른, 부호화 단위 및 변환 단위의 관계를 도시한다. FIG. 7 shows a relationship between an encoding unit and a conversion unit according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는, 최대 부호화 단위마다 최대 부호화 단위보다 작거나 같은 크기의 부호화 단위로 영상을 분할하여 부호화하거나 복호화한다. 부호화 과정 중 주파수 변환을 위한 변환 단위의 크기는 각각의 부호화 단위보다 크지 않은 데이터 단위를 기반으로 선택될 수 있다. 예를 들어, 현재 부호화 단위(710)가 64x64 크기일 때, 32x32 크기의 변환 단위(720)를 이용하여 주파수 변환이 수행될 수 있다. 또한, 64x64 크기의 부호화 단위(710)의 데이터를 64x64 크기 이하의 32x32, 16x16, 8x8, 4x4 크기의 변환 단위들로 각각 주파수 변환을 수행하여 부호화한 후, 원본과의 오차가 가장 적은 변환 단위가 선택될 수 있다. 또한, 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 복수의 예측 단위를 그룹핑하여 하나의 변환 단위를 설정하고 주파수 변환을 수행할 수 있다. 예를 들어, 부호화 단위가 32x32 크기를 갖는다고 할 때, 주파수 변환은 32x32 크기의 인접한 4개의 부호화 단위를 그룹핑한 64x64 크기의 데이터 단위를 하나의 변환 단위로 하여 수행될 수 있다.The image encoding apparatus 100 and the
도 8은 본 발명의 일 실시예에 따라, 심도별 부호화 정보들을 도시한다.FIG. 8 illustrates depth-specific encoding information, in accordance with an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 부호화 정보 부호화부는 부호화 모드에 관한 정보로서, 각각의 부호화 심도의 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 부호화하여 전송할 수 있다.The encoding information encoding unit of the image encoding apparatus 100 according to an embodiment of the present invention includes information on the encoding mode, information 800 about the partition type, information on the prediction mode 810 ), And information 820 on the conversion unit size may be encoded and transmitted.
파티션 타입에 대한 정보(800)는, 현재 부호화 단위의 예측 부호화를 위한 예측 단위로서, 현재 부호화 단위가 분할된 타입에 대한 정보를 나타낸다. 예를 들어, 심도 0 및 크기 2Nx2N의 현재 부호화 단위 CU_0는, 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806), 크기 NxN의 예측 단위(808) 중 어느 하나의 타입으로 분할되어 예측 단위로 이용될 수 있다. 이 경우 현재 부호화 단위의 파티션 타입에 관한 정보(800)는 크기 2Nx2N의 예측 단위(802), 크기 2NxN의 예측 단위(804), 크기 Nx2N의 예측 단위(806) 및 크기 NxN의 예측 단위(808) 중 하나를 나타내도록 설정된다.The partition type information 800 indicates a prediction unit for predictive encoding of the current encoding unit and information on the type in which the current encoding unit is divided. For example, the current encoding unit CU_0 of
예측 모드에 관한 정보(810)는, 각각의 예측 단위의 예측 모드를 나타낸다. 예를 들어 예측 모드에 관한 정보(810)를 통해, 파티션 타입에 관한 정보(800)가 가리키는 예측 단위가 인트라 모드(812), 인터 모드(814) 및 스킵 모드(816) 중 하나로 예측 부호화가 수행되는지 여부가 설정될 수 있다.The information 810 on the prediction mode indicates the prediction mode of each prediction unit. The prediction unit indicated by the information 800 relating to the partition type is predicted to be one of the
또한, 변환 단위 크기에 관한 정보(820)는 현재 부호화 단위를 어떠한 변환 단위를 기반으로 주파수 변환을 수행할지 여부를 나타낸다. 예를 들어, 변환 단위는 제 1 인트라 변환 단위 크기(822), 제 2 인트라 변환 단위 크기(824), 제 1 인터 변환 단위 크기(826), 제 2 인트라 변환 단위 크기(828) 중 하나일 수 있다.In addition, the information 820 on the conversion unit size indicates whether to perform frequency conversion on the basis of which conversion unit the current encoding unit is performed. For example, the conversion unit may be one of a first
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부는, 각각의 심도별 부호화 단위마다 파티션 타입에 관한 정보(800), 예측 모드에 관한 정보(810), 변환 단위 크기에 대한 정보(820)를 추출하여 복호화에 이용할 수 있다.The encoding information extracting unit of the
도 9 는 본 발명의 일 실시예에 따른 심도별 부호화 단위를 도시한다. FIG. 9 shows a depth encoding unit according to an embodiment of the present invention.
심도의 변화를 나타내기 위해 분할 정보가 이용될 수 있다. 분할 정보는 현재 심도의 부호화 단위가 하위 심도의 부호화 단위로 분할될지 여부를 나타낸다. Partition information may be used to indicate changes in depth. The division information indicates whether the current-depth encoding unit is divided into lower-depth encoding units.
심도 0 및 2N_0x2N_0 크기의 부호화 단위의 예측 부호화를 위한 예측 단위(910)는 2N_0x2N_0 크기의 파티션 타입(912), 2N_0xN_0 크기의 파티션 타입(914), N_0x2N_0 크기의 파티션 타입(916), N_0xN_0 크기의 파티션 타입(918)을 포함할 수 있다. The
파티션 타입마다, 한 개의 2N_0x2N_0 크기의 예측 단위, 두 개의 2N_0xN_0 크기의 예측 단위, 두 개의 N_0x2N_0 크기의 예측 단위, 네 개의 N_0xN_0 크기의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다. 크기 2N_0x2N_0, 크기 N_0x2N_0, 크기 2N_0xN_0 및 크기 N_0xN_0의 예측 단위에 대해서는, 인트라 모드 및 인터 모드로 움직임 예측이 수행될 수 있다. 스킵 모드는 크기 2N_0x2N_0의 예측 단위에 대해서만 수행될 수 있다.For each partition type, predictive encoding should be repeatedly performed for each prediction unit of 2N_0x2N_0 size, two 2N_0xN_0 size prediction units, two N_0x2N_0 size prediction units, and four N_0xN_0 size prediction units. For a prediction unit of size 2N_0x2N_0, size N_0x2N_0, size 2N_0xN_0, and size N_0xN_0, motion prediction can be performed in intra mode and inter mode. The skip mode can be performed only for the prediction unit of size 2N_0x2N_0.
크기 N_0xN_0의 파티션 타입(918)에 의한 부호화 오차가 가장 작다면, 심도 0를 1로 변경하고(920), 심도 2 및 크기 N_0xN_0의 파티션 타입의 부호화 단위들(922, 924, 926, 928)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다. If the coding error by the
동일한 심도의 부호화 단위들(922, 924, 926, 928)에 대해 부호화가 반복적으로 수행되므로, 이중 하나만 예를 들어 심도 1의 부호화 단위의 부호화를 설명한다. 심도 1 및 크기 2N_1x2N_1 (=N_0xN_0)의 부호화 단위의 예측 부호화를 위한 예측 단위(930)는, 크기 2N_1x2N_1의 파티션 타입(932), 크기 2N_1xN_1의 파티션 타입(934), 크기 N_1x2N_1의 파티션 타입(936), 크기 N_1xN_1의 파티션 타입(938)을 포함할 수 있다. 파티션 타입마다, 한 개의 크기 2N_1x2N_1의 예측 단위, 두 개의 크기 2N_1xN_1의 예측 단위, 두 개의 크기 N_1x2N_1의 예측 단위, 네 개의 크기 N_1xN_1의 예측 단위마다 반복적으로 예측 부호화가 수행되어야 한다.Since encoding is repeatedly performed on the
또한, 크기 N_1xN_1 크기의 파티션 타입(938)에 의한 부호화 오차가 가장 작다면, 심도 1을 심도 2로 변경하면서(940), 심도 2 및 크기 N_2xN_2의 부호화 단위들(942, 944, 946, 948)에 대해 반복적으로 최소 부호화 오차를 검색해 나갈 수 있다. If the coding error by the
최대 심도가 d인 경우, 심도별 분할 정보는 심도 d-1일 때까지 설정될 수 있다. 즉, 심도 d-1 및 크기 2N_(d-1)x2N_(d-1)의 부호화 단위의 예측 부호화를 위한 예측 단위(950)는, 크기 2N_(d-1)x2N_(d-1)의 파티션 타입(952), 크기 2N_(d-1)xN_(d-1)의 파티션 타입(954), 크기 N_(d-1)x2N_(d-1)의 파티션 타입(956), 크기 N_(d-1)xN_(d-1)의 파티션 타입(958)을 포함할 수 있다. If the maximum depth is d, the depth-based segmentation information can be set until the depth d-1. That is, the
파티션 타입마다, 한 개의 크기 2N_(d-1)x2N_(d-1)의 예측 단위, 두 개의 크기 2N_(d-1)xN_(d-1)의 예측 단위, 두 개의 크기 N_(d-1)x2N_(d-1)의 예측 단위, 네 개의 크기 N_(d-1)xN_(d-1)의 예측 단위마다 반복적으로 예측 부호화를 통한 부호화가 수행되어야 한다. 최대 심도가 d이므로, 심도 d-1의 부호화 단위(952)는 더 이상 분할 과정을 거치지 않는다.(D-1) x2N_ (d-1), two predicted units of two sizes 2N_ (d-1) (d-1) x2N_ (d-1), four sizes N_ (d-1) xN_ (d-1). Since the maximum depth is d, the
본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 부호화 단위(912)를 위한 부호화 심도를 결정하기 위해, 심도별 부호화 오차를 비교하여 가장 작은 부호화 오차가 발생하는 심도를 선택한다. 예를 들어, 심도 0의 부호화 단위에 대한 부호화 오차는 파티션 타입(912, 914, 916, 918)마다 예측 부호화를 수행한 후 가장 작은 부호화 오차가 발생하는 예측 단위가 결정된다. 마찬가지로 심도 0, 1, ..., d-1 마다 부호화 오차가 가장 작은 예측 단위가 검색될 수 있다. 심도 d에서는, 크기 2N_dx2N_d의 부호화 단위이면서 예측 단위(960)를 기반으로 한 예측 부호화를 통해 부호화 오차가 결정될 수 있다. 이와 같이 심도 0, 1, ..., d-1, d의 모든 심도별 최소 부호화 오차를 비교하여 오차가 가장 작은 심도가 선택되어 부호화 심도로 결정될 수 있다. 부호화 심도 및 해당 심도의 예측 단위는 부호화 모드에 관한 정보로써 부호화되어 전송될 수 있다. 또한, 심도 0으로부터 부호화 심도에 이르기까지 부호화 단위가 분할되어야 하므로, 부호화 심도의 분할 정보만이 '0'으로 설정되고, 부호화 심도를 제외한 심도별 분할 정보는 '1'로 설정되어야 한다. The image encoding apparatus 100 according to an exemplary embodiment of the present invention compares depth-based encoding errors to determine depths for encoding
본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위(912)에 대한 부호화 심도 및 예측 단위에 관한 정보를 추출하여 부호화 단위(912)를 복호화하는데 이용할 수 있다. 일 실시예에 따른 영상 복호화 장치(200)는 심도별 분할 정보를 이용하여 분할 정보가 '0'인 심도를 부호화 심도로 파악하고, 해당 심도에 대한 부호화 모드에 관한 정보를 이용하여 복호화에 이용할 수 있다.The encoding
도 10a, 10b 및 10c는 본 발명의 일 실시예에 따른, 부호화 단위, 예측 단위 및 주파수 변환 단위의 관계를 도시한다.FIGS. 10A, 10B, and 10C illustrate the relationship between an encoding unit, a prediction unit, and a frequency conversion unit according to an embodiment of the present invention.
부호화 단위(1010)는, 최대 부호화 단위에 대해 일 실시예에 따른 영상 부호화 장치(100)가 결정한 부호화 심도별 부호화 단위들이다. 예측 단위(1060)는 부호화 단위(1010) 중 각각의 부호화 심도별 부호화 단위의 예측 단위들이며, 변환 단위(1070)는 각각의 부호화 심도별 부호화 단위의 변환 단위들이다.The encoding unit 1010 is encoding units for encoding depth determined by the image encoding apparatus 100 according to the embodiment with respect to the maximum encoding unit. The prediction unit 1060 is a prediction unit of each coding depth unit among the coding units 1010 and the conversion unit 1070 is a conversion unit of each coding depth unit.
심도별 부호화 단위들(1010)은 최대 부호화 단위의 심도가 0이라고 하면, 부호화 단위들(1012, 1054)은 심도가 1, 부호화 단위들(1014, 1016, 1018, 1028, 1050, 1052)은 심도가 2, 부호화 단위들(1020, 1022, 1024, 1026, 1030, 1032, 1048)은 심도가 3, 부호화 단위들(1040, 1042, 1044, 1046)은 심도가 4이다. When the depth of the maximum encoding unit is 0, the depth of the
예측 단위들(1060) 중 일부(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 부호화 단위가 분할된 타입이다. 즉, 예측 단위(1014, 1022, 1050, 1054)는 2NxN의 파티션 타입이며, 예측 단위(1016, 1048, 1052)는 Nx2N의 파티션 타입, 예측 단위(1032)는 NxN의 파티션 타입이다. 즉, 심도별 부호화 단위들(1010)의 예측 단위는 각각의 부호화 단위보다 작거나 같다. A portion (1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054) of the prediction units 1060 is a type in which the coding unit is divided. That is, the
변환 단위들(1070) 중 일부(1052)의 영상 데이터에 대해서는 부호화 단위에 비해 작은 크기의 데이터 단위로 주파수 변환 또는 주파수 역변환이 수행된다. 또한, 변환 단위(1014, 1016, 1022, 1032, 1048, 1050, 1052, 1054)는 예측 단위들(1060) 중 해당 예측 단위와 비교해보면, 서로 다른 크기 또는 형태의 데이터 단위이다. 즉, 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)는 동일한 부호화 단위에 대한 예측 및 주파수 변환/역변환 작업이라 할지라도, 각각 별개의 데이터 단위를 기반으로 수행할 수 있다.The image data of a
도 11 은 본 발명의 일 실시예에 따른 부호화 단위별 부호화 정보를 도시한다.FIG. 11 shows encoding information for each encoding unit according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)의 출력부(130)는 부호화 단위별 부호화 정보를 출력하고, 본 발명의 일 실시예에 따른 영상 복호화 장치(200)의 부호화 정보 추출부(220)는 부호화 단위별 부호화 정보를 추출할 수 있다.The
부호화 정보는 부호화 단위에 대한 분할 정보, 파티션 타입 정보, 예측 모드 정보, 변환 단위 크기 정보를 포함할 수 있다. 도 11에 도시되어 있는 부호화 정보들은 본 발명의 일 실시예에 따른 영상 부호화 장치(100) 및 영상 복호화 장치(200)에서 설정할 수 있는 일 예에 불과하며, 도시된 것에 한정되지 않는다.The encoding information may include division information for the encoding unit, partition type information, prediction mode information, and conversion unit size information. The encoding information shown in FIG. 11 is only an example that can be set in the image encoding apparatus 100 and the
분할 정보는 해당 부호화 단위의 부호화 심도를 나타낼 수 있다. 즉, 분할 정보에 따라 더 이상 분할되지 않는 심도가 부호화 심도이므로, 부호화 심도에 대해서 파티션 타입 정보, 예측 모드, 변환 단위 크기 정보가 정의될 수 있다. 분할 정보에 따라 한 단계 더 분할되어야 하는 경우에는, 분할된 4개의 상위 심도의 부호화 단위마다 독립적으로 부호화가 수행되어야 한다.The division information may indicate the coding depth of the corresponding encoding unit. That is, since depths that are no longer divided according to the division information are coding depths, partition type information, prediction mode, and conversion unit size information can be defined with respect to the coding depth. If it is necessary to further divide by one division according to the division information, encoding should be performed independently for each of the four higher-depth-depth coding units.
파티션 타입 정보는, 부호화 심도의 부호화 단위의 변환 단위의 파티션 타입을 2Nx2N, 2NxN, Nx2N 및 NxN 중 하나로 나타낼 수 있다. 예측 모드는, 움직임 예측 모드를 인트라 모드, 인터 모드 및 스킵 모드 중 하나로 나타낼 수 있다. 인트라 모드 및 인터 모드는 파티션 타입 2Nx2N, 2NxN, Nx2N 및 NxN에서 정의될 수 있으며, 스킵 모드는 파티션 타입 2Nx2N에서만 정의될 수 있다. 변환 단위 크기는 인트라 모드에서 두 종류의 크기, 인터 모드에서 두 종류의 크기로 설정될 수 있다.As the partition type information, the partition type of the conversion unit of the coding unit of the coding depth can be represented by 2Nx2N, 2NxN, Nx2N and NxN. The prediction mode may indicate the motion prediction mode as one of an intra mode, an inter mode, and a skip mode. The intra mode and the inter mode can be defined in the partition types 2Nx2N, 2NxN, Nx2N and NxN, and the skip mode can be defined only in the partition type 2Nx2N. The conversion unit size can be set to two kinds of sizes in the intra mode and two kinds of sizes in the inter mode.
부호화 단위 내의 최소 부호화 단위마다, 소속되어 있는 부호화 심도의 부호화 단위별 부호화 정보를 수록하고 있을 수 있다. 따라서, 인접한 최소 부호화 단위들끼리 각각 보유하고 있는 부호화 정보들을 확인하면, 동일한 부호화 심도의 부호화 단위에 포함되는지 여부가 확인될 수 있다. 또한, 최소 부호화 단위가 보유하고 있는 부호화 정보를 이용하면 해당 부호화 심도의 부호화 단위를 확인할 수 있으므로, 최대 부호화 단위 내의 부호화 심도들의 분포가 유추될 수 있다.The encoding unit-specific encoding information of the belonging encoding depth may be stored for each minimum encoding unit in the encoding unit. Therefore, if encoding information held in each of the adjacent minimum encoding units is checked, it can be confirmed whether or not the encoding information is included in the encoding unit of the same encoding depth. In addition, since the encoding unit of the encoding depth can be identified by using the encoding information held in the minimum encoding unit, the distribution of encoding depths in the maximum encoding unit can be inferred.
따라서 이 경우 현재 부호화 단위가 주변 데이터 단위를 참조하여 예측하기 경우, 현재 부호화 단위에 인접하는 심도별 부호화 단위 내의 최소 부호화 단위의 부호화 정보가 직접 이용됨으로써 최소 부호화 단위의 데이터가 참조될 수 있다.In this case, when the current encoding unit is predicted with reference to the neighboring data unit, the encoding information of the minimum encoding unit in the depth encoding unit adjacent to the current encoding unit is directly used, so that the data of the minimum encoding unit can be referred to.
또 다른 실시예로, 심도별 부호화 단위의 부호화 정보가 심도별 부호화 단위 내 중 대표되는 최소 부호화 단위에 대해서만 저장되어 있을 수 있다. 이 경우 현재 부호화 단위가 주변 부호화 단위를 참조하여 예측되는 경우, 인접하는 심도별 부호화 단위의 부호화 정보를 이용하여, 심도별 부호화 단위 내에서 현재 부호화 단위에 인접하는 데이터가 검색됨으로써 참조될 수도 있다.In yet another embodiment, the encoding information of the depth encoding unit may be stored only for the minimum encoding unit represented in the depth encoding unit. In this case, when the current encoding unit is predicted by referring to the surrounding encoding unit, the data adjacent to the current encoding unit in the depth encoding unit may be retrieved using the encoding information of the adjacent depth encoding unit.
이하, 도 4의 본 발명의 일 실시예에 따른 영상 부호화 장치(400)의 엔트로피 부호화부(450) 및 도 5의 영상 복호화 장치(500)의 엔트로피 복호화부(520)에서 수행되는 레지듀얼 블록의 부호화 및 복호화 과정에 대하여 구체적으로 설명한다. 이하의 설명에서, 부호화 단위는 영상의 부호화 단계에서 현재 부호화되는 블록을 지칭하는 용어이며, 복호화 단위는 영상의 복호화 단계에서 현재 복호화되는 블록을 지칭하는 용어이다. 부호화 단위와 복호화 단위라는 용어는 영상의 부호화 단계 및 복호화 단계 중 어느 단계에서 지칭되느냐의 차이만 있을 뿐이며 부호화 단계에서의 부호화 단위는 복호화 단계에서의 복호화 단위로 불리울 수 있다. 용어의 통일성을 위하여 특별한 경우를 제외하고는 부호화 단계 및 복호화 단계에서 동일하게 부호화 단위로 통일하여 부르기로 한다. 또한, 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 및 복호화 방법 및 장치는 일반적인 영상 코덱에서의 레지듀얼 블록의 부호화 및 복호화에도 적용될 수 있음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 명세서를 통해 이해할 수 있을 것이다.The
전술한 바와 같이, 도 4의 본 발명의 일 실시예에 따른 영상 부호화 장치(400)의 인트라 예측부(410) 또는 움직임 보상부(425)에서 생성된 예측 블록과 현재 부호화되는 현재 블록 사이의 차이인 레지듀얼 블록이 생성되면, 주파수 변환부(430)는 레지듀얼 블록을 주파수 영역으로 변환한다. 예를 들어 주파수 변환부(430)는 DCT(Discrete Cosine Transform)을 이용하여 레지듀얼 블록을 주파수 영역으로 변환하여 변환 레지듀얼 블록을 생성한다. 특히, 전술한 도 7을 참조하여 설명한 바와 같이, 본 발명의 일 실시예에 따른 주파수 변환부(430)는 현재 부호화 단위보다 크지 않은 데이터 단위를 하나의 변환 단위로 하여 주파수 변환을 수행하거나, 복수개의 예측 단위를 그룹핑한 데이터 단위를 하나의 변환 단위로 하여 주파수 변환을 수행할 수 있다. 예를 들어, 레지듀얼 블록의 크기가 64x64 일 때, 주파수 변환부(430)는 64x64, 32x32, 16x16, 8x8, 4x4 크기 중 하나의 선택된 변환 단위의 크기에 따라서 변환 레지듀얼 블록을 생성하거나, 4개의 상하좌우로 인접한 레지듀얼 블록을 그룹핑한 128x128 크기의 데이터 단위를 하나의 변환 단위로 하여 128x128 단위로 변환 레지듀얼 블록을 생성할 수 있다. 변환 레지듀얼 블록은 양자화부(440)를 통해 양자화된 후, 엔트로피 부호화부(450)에 의하여 부호화된다. 양자화부(440)는 무손실 부호화의 경우 생략될 수 있다.As described above, the difference between the prediction block generated in the
도 12a 내지 도 12c는 본 발명이 속하는 기술 분야와 관련된 기술 분야에서 변환 레지듀얼 블록을 부호화하는 과정을 설명하기 위한 참조도이다.12A to 12C are views for explaining a process of encoding a transform residual block in a technical field related to the present invention.
도 12a를 참조하면, 레지듀얼 블록에 대한 주파수 변환이 수행되어 변환 레지듀얼 블록(1210)이 생성되면 지그재그 스캔 순서에 따라서 변환 레지듀얼 블록(1210) 내의 변환 계수들을 스캔하면서, 변환 레지듀얼 블록(1210) 내의 0이 아닌 값을 갖는 유효 변환 계수의 위치를 나타내는 유효성 맵(significance map) 및 유효 변환 계수의 레벨 정보가 부호화된다. 예를 들어, 변환 레지듀얼 블록의 크기가 4x4일 때, 도 12b에 도시된 바와 같은 변환 레지듀얼 블록(1220)을 부호화하는 과정을 설명한다. 도 12b에서 X라고 표시된 위치의 변환 계수들은 0이 아닌 값을 갖는 유효 변환 계수들이라고 가정한다. 이러한 경우, 도 12c에 도시된 바와 같이 레지듀얼 블록(1230) 내의 변환 계수들 중 유효 변환 계수를 1로 표시하고, 0인 변환 계수는 그대로 0으로 표시하는 것이 바로 유효성 맵이다. 유효성 맵은 소정의 스캔 순서에 따라서 스캐닝되면서 컨텍스트 기반 이진 산술 부호화(Context Adaptive Binary Arithmetic Coding)된다. 일 예로, 도 12c에 도시된 바와 같은 유효성 맵을 왼쪽에서 오른쪽, 위쪽에서 아래쪽의 순서로 스캐닝하는 래스터 스캐닝(raster scanning) 순서에 따라 부호화할 때에는, "111111110101000"의 빈 스트링에 해당하는 유효성 맵을 컨텍스트 기반 부호화하게 된다. 이러한 유효성 맵이 부호화된 다음, 유효 계수의 레벨 정보, 즉 유효 계수의 부호(sign) 및 절대값(abs)이 부호화된다.Referring to FIG. 12A, when a frequency conversion is performed on a residual block to generate a transform
이러한 관련 기술 분야에서의 변환 레지듀얼 블록을 부호화하는 방법은 8x8 또는 4x4 크기의 비교적 작은 크기의 변환 레지듀얼 블록의 부호화에는 적합하지만, 본 발명의 일 실시예에 따른 영상 부호화 장치와 같이 16x16, 32x32, 64x64와 같이 큰 크기를 갖는 변환 레지듀얼 블록을 부호화하는데는 적합하지 않다. 왜냐하면, 큰 크기를 갖는 변환 레지듀얼 블록에 대하여 도 12a 내지 도 12c를 참조하여 설명된 바와 같은 관련 기술에 따라서 변환 레지듀얼 블록 내의 모든 변환 계수들을 스캐닝하여 부호화하는 경우, 유효성 맵에 대응되는 빈 스트링의 길이가 증가하고 부호화 효율이 저하될 수 있기 때문이다.A method of encoding a transform residual block in the related art is suitable for encoding a relatively small-sized transformed residual block having a size of 8x8 or 4x4. However, as in the image encoding apparatus according to an embodiment of the present invention, , It is not suitable for encoding a conversion residual block having a large size such as 64x64. In the case where all transform coefficients in the transform residual block are scanned and coded according to the related art as described with reference to Figs. 12A to 12C for a transformed residual block having a large size, an empty string corresponding to the validity map And the coding efficiency may be lowered.
따라서, 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 방법 및 장치는 변환 레지듀얼 블록을 소정 주파수 대역 단위들로 분할하고, 분할된 주파수 대역 단위마다 0이 아닌 유효 변환 계수가 존재하는지 여부를 나타내는 주파수 대역 단위별 유효 계수 플래그를 부호화하는 한편, 주파수 대역 단위별 유효 계수 플래그가 1의 값을 갖는 주파수 대역에 대해서만 유효 변환 계수 정보, 즉 유효성 맵 및 유효 계수의 레벨 정보를 부호화함으로써 보다 효율적인 변환 레지듀얼 블록의 부호화를 가능하게 한다. Therefore, a residual block coding method and apparatus according to an embodiment of the present invention divides a transform residual block into predetermined frequency band units, and determines whether or not a non-zero effective transform coefficient exists for each divided frequency band unit And the effective coefficient information, that is, the level information of the validity map and the effective coefficient, is encoded only for the frequency band having the value of the effective coefficient flag for each frequency band unit of 1, Thereby enabling encoding of the residual block.
도 13은 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 장치(1300)의 구성을 나타낸 블록도이다. 도 13의 레지듀얼 블록 부호화 장치(1300)는 도 4의 엔트로피 부호화부(450)에 대응되거나 내부에 포함될 수 있다.13 is a block diagram showing the configuration of a residual
도 13을 참조하면, 레지듀얼 블록 부호화 장치(1300)는 주파수 대역 분할부(1310), 유효계수 플래그 생성부(1320) 및 유효계수 부호화부(1330)를 포함한다.13, the residual
주파수 대역 분할부(1310)는 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할한다. 전술한 도 12a를 다시 참조하면, 변환 레지듀얼 블록(1210)은 좌상측에 위치한 변환 계수일수록 저주파수 성분의 변환 계수에 해당되며, 우하측으로 갈수록 고주파수 성분의 변환 계수에 해당한다. 일반적으로 변환 레지듀얼 블록(1210)의 변환 계수는 저주파수 성분쪽에 몰려있고, 고주파수 성분의 변환 계수는 0인 값이 많다. 즉, 고주파수 성분의 변환 계수 중 0이 아닌 값을 갖는 유효 변환 계수는 희박하게(sparse) 존재한다. 특히, 본 발명의 일 실시예에 따른 영상 부호화 장치(400)과 같이 종래 4x4, 8x8 크기의 변환 단위보다 큰 크기를 갖는 16x16, 32x32, 64x64 및 그 이상의 크기의 변환 단위로 주파수 변환을 수행하여 생성된 변환 레지듀얼의 경우는 고주파수 성분의 유효 변환 계수의 분포는 좀 더 희박해진다. 따라서, 주파수 분할부(1310)는 이러한 변환 레지듀얼 블록 내에 존재하는 변환 계수의 주파수 대역에 따른 분포 특성을 고려하여, 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할한다.The frequency
도 14a 내지 도 14j는 본 발명에 따라서 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할하는 실시예들을 나타낸 도면이다.14A to 14J are diagrams illustrating embodiments in which a transform residual block is divided into predetermined frequency band units according to the present invention.
도 14a를 참조하면, 주파수 대역 분할부(1310)는 저주파수 대역부터 수평 주파수 H1 및 수직 주파수 V1까지 소정 주파수 간격으로 변환 레지듀얼 블록을 분할하여 주파수 대역 단위들(1411 내지 1414)을 생성한다. 도 14a에서는 주파수 대역 단위들(1411 내지 1414)의 가로변과 세로변이 동일한 길이를 갖는 경우를 도시하였으나, 이에 한정되지 않고 가로변과 세로변의 길이는 서로 다르게 설정될 수 있다. 만약, 수평 주파수 H1으로부터 최대 수평 주파수까지의 남은 주파수 대역의 길이가 주파수 대역 단위들(1411 내지 1414)의 가로변의 길이에 해당하는 주파수 간격보다 작은 경우 또는 수직 주파수 V1으로부터 최대 수직 주파수까지의 남은 주파수 대역의 길이가 주파수 대역 단위들(1411 내지 1414)의 세로변의 길이에 해당하는 주파수 간격보다 작은 경우에는, 주파수 대역 분할부(1310)는 더 이상 변환 레지듀얼 블록을 분할하지 않고 고주파수 대역 성분에 해당하는 하나의 주파수 대역 단위(1415)를 생성한다. 일반적으로 유효 변환 계수는 저주파수 성분들에 해당하는 주파수 대역 단위들(1411 내지 1414)에 집중적으로 분포하고, 고주파수 성분의 유효 변환 계수의 분포는 희박하다. 따라서, 소정 주파수 간격으로 변환 레지듀얼 블록을 분할함으로써 생성된 주파수 대역 단위들(1411 내지 1414) 이외의 남은 고주파수 대역 성분 전체를 하나의 주파수 대역 단위(1415)로 생성하더라도 주파수 대역 단위(1415) 내의 변환 계수들을 부호화할 때의 오버헤드는 크게 증가하지 않는다.Referring to FIG. 14A, the frequency
또한, 도 14b에 도시된 바와 같이, 주파수 대역 분할부(1310)는 전술한 도 14a와 유사하게 저주파수 대역으로부터 수평 주파수 H2 및 수직 주파수 V2 까지의 변환 레지듀얼 블록(1420)을 분할하여 주파수 대역 단위들(1421 내지 1424)를 생성하고, 나머지 고주파수 대역 성분의 변환 레지듀얼 블록을 수평 주파수 H2 및 수직 주파수 V2를 기준으로 분할하여 주파수 대역 단위들(1425, 1426, 1427)을 생성할 수 있다.14B, the frequency
또한, 도 14c에 도시된 바와 같이, 주파수 대역 분할부(1310)는 전술한 도 14a와 유사하게 저주파수 대역으로부터 수평 주파수 H3 및 수직 주파수 V3까지의 변환 레지듀얼 블록(1430)을 분할하여 주파수 대역 단위들(1431 내지 1434)를 생성하고, 나머지 고주파수 대역 성분의 변환 레지듀얼 블록을 수직 주파수 V3를 기준으로 이분할 함으로써 고주파수 성분의 주파수 대역 단위들(1435 및 1436)을 생성할 수 있다.14C, the frequency
또한, 도 14d에 도시된 바와 같이, 주파수 대역 분할부(1310)는 전술한 도 14a와 유사하게 저주파수 대역으로부터 수평 주파수 H4 및 수직 주파수 V4까지의 변환 레지듀얼 블록(1440)을 분할하여 주파수 대역 단위들(1441 내지 1444)를 생성하고, 나머지 고주파수 대역 성분의 변환 레지듀얼 블록을 수평 주파수 H4를 기준으로 이분할함으로써 고주파수 성분의 주파수 대역 단위들(1445 및 1446)을 생성할 수 있다.14D, the frequency
전술한 바와 같이, 유효 변환 계수의 분포는 저주파수 대역에 집중되고, 고주파수 대역으로 갈수록 희박해진다. 따라서, 이러한 유효 변환 계수의 분포 특성을 고려하여 도 14e에 도시된 바와 같이 주파수 대역 분할부(1310)는 저주파수 대역의 분할된 단위 크기가 고주파수 대역의 분할된 단위 크기에 비하여 작도록 변환 레지듀얼 블록(1450)을 분할한다. 다시 말해서, 주파수 대역 분할부(1310)는 저주파수 대역에 집중적으로 분포하는 유효 변환 계수를 보다 정밀하게 부호화할 수 있도록 저주파수 대역은 보다 세밀하게 분할하고, 고주파수 대역은 상대적으로 크게 분할한다. 예를 들어, 도 14e에 도시된 바와 같이, 주파수 대역 분할부(1310)는 소정의 수평 주파수 H5 및 수직 주파수 V5와, 수평 주파수 H5의 배수보다 큰 값을 갖는 수평 주파수 H6 및 수직 주파수 V5의 배수보다 큰 값을 갖는 수직 주파수 V6를 기준으로 변환 레지듀얼 블록(1450)을 분할함으로써 주파수 대역 분할 단위들(1451,1452,1453,1454,1455,1456,1457)을 생성할 수 있다. 즉, 주파수 대역 분할 단위들(1451,1452,1453,1454,1455,1456,1457)의 크기를 각각 A1451,A1452,A1453,A1454,A1455,A1456,A1457 라고 하면, A1451이 최소 크기를 갖고, A1457이 최대 크기를 갖도록 분할한다.As described above, the distribution of the effective conversion coefficients is concentrated in the low frequency band, and becomes thinner toward the high frequency band. Therefore, considering the distribution characteristics of the effective transform coefficients, the
또한, 도 14f에 도시된 바와 같이, 주파수 대역 분할부(1310)는 변환 레지듀얼 블록(1460)을 동일한 크기의 주파수 대역 단위(1461)들로 분할할 수 있다.Also, as shown in FIG. 14F, the frequency
또한, 도 14g에 도시된 바와 같이, 주파수 대역 분할부(1310)는 변환 레지듀얼 블록(1470)을 4등분하고, 4등분된 주파수 대역 단위들 중 가장 작은 저주파수 대역 단위(1471)를 다시 4등분함으로써 주파수 대역 단위들을 생성할 수 있다. 주파수 대역 분할부(1310)는 저주파수 대역 단위(1471)을 4등분한 주파수 대역 단위들 중 가장 작은 저주파수 대역 단위(1472)를 다시 4등분할 수 있다. 이러한 분할 과정은 4등분된 주파수 대역 단위의 크기가 소정의 크기가 될 때까지 반복될 수 있다.Also, as shown in FIG. 14G, the frequency
또한, 도 14h에 도시된 바와 같이, 주파수 대역 분할부(1310)는 저주파수로부터 수평 주파수 H7 및 수직 주파수 V7 까지의 저주파수 성분의 주파수 대역 단위(1481)을 생성하고, 변환 레지듀얼 블록(1480)의 나머지 고주파수 성분을 대각선으로 분리하여 주파수 대역 단위들(1482, 1483)을 생성할 수 있다.14H, the frequency
또한, 도 14i 및 도 14j에 도시된 바와 같이, 주파수 대역 분할부(1310)는 소정 값을 갖는 수평 주파수 및 수직 주파수를 연결하여 변환 레지듀얼 블록(1490, 1495)을 분할할 수 있다. 도 14i의 경우는 변환 레지듀얼 블록(1490)을 동일한 주파수 간격을 갖는 수평 주파수 및 수직 주파수를 연결한 경우를 도시한 경우이며, 도 14j의 경우는 고주파수쪽으로 갈수록 주파수 간격이 증가되도록, 즉 a1<a2<a3<a4 및 b1<b2<b3<b4인 관계를 만족하는 a1와 b1, a2와 b2, a3와 b3, a4와 b4를 연결하여 변환 레지듀얼 블록(1495)를 분할한 경우이다.Also, as shown in FIGS. 14I and 14J, the frequency
또한, 주파수 대역 분할부(1310)는 도 14a 내지 도 14j에 도시된 바와 같이 미리 설정된 분할 형태를 이용하는 대신에 변환 레지듀얼 블록을 구성하는 유효 변환 계수들의 분포 특성 또는 각 주파수 대역마다 존재하는 유효 변환 계수의 개수를 이용하여 변환 레지듀얼 블록의 영상 특성을 판단하고, 판단된 변환 레지듀얼 블록의 영상 특성을 이용하여 각 주파수 대역별로 변환 레지듀얼 블록을 분할할 주파수 단위의 크기를 결정할 수 있다. 예를 들어서, 변환 레지듀얼 블록 내의 유효 변환 계수가 수평 주파수 H8 및 수직 주파수 V8보다 작은 주파수 대역 내에만 존재하고 수평 주파수 H8 및 수직 주파수 V8보다 큰 주파수 대역 내에는 유효 변환 계수가 존재하지 않는다고 가정하면, 주파수 대역 분할부(1310)는 저주파수 대역으로부터 수평 주파수 H8 및 수직 주파수 V8까지의 변환 레지듀얼 블록 전체를 하나의 주파수 대역 단위로 설정하거나 동일 크기의 주파수 대역 단위들로 분할하고, 나머지 수평 주파수 H8 및 수직 주파수 V8보다 큰 주파수 대역을 하나의 주파수 대역 단위로 설정할 수 있다.14A to 14J, the frequency
전술한 도 14a 내지 도 14j에 도시된 변환 레지듀얼 블록을 주파수 대역 단위로 분할하는 실시예들에 한정되지 않고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 다양한 형태로 변환 레지듀얼 블록을 분할할 수 있음을 본 명세서에 기재된 내용을 통해 이해할 수 있을 것이다.The present invention is not limited to the embodiments in which the conversion residual block shown in FIGs. 14A to 14J is divided into frequency bands. In the present invention, It will be understood that the present invention is not limited thereto.
한편, 주파수 대역 분할부(1310)에서 변환 레지듀얼 블록을 분할하는 형태는 부호화측과 복호화측에서 동일하게 설정하거나, 도 14a 내지 도 14j에 도시된 바와 같은 다양한 분할 형태마다 소정의 인덱스를 부여한 다음 부호화측에서 변환 레지듀얼 블록의 부호화시에 이용된 분할 정보에 대한 분할 인덱스를 부호화된 비트스트림에 부가할 수 있다. 예를 들어, 분할 인덱스(div_index) 0~9까지의 정수값이 각각 도 14a 내지 도 14j에 도시된 각 분할 형태를 나타낸다고 가정하고, 현재 변환 레지듀얼 블록의 부호화시의 이용된 분할 형태가 도 14f에 도시된 바와 같은 div_index=5의 값을 갖는 경우라면 이러한 분할 인덱스 정보를 현재 변환 레지듀얼 블록의 부호화 정보에 부가할 수 있다.On the other hand, in the frequency
다시 도 13을 참조하면, 주파수 대역 분할부(1310)에 의하여 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할하고 나면, 유효 계수 플래그 생성부(1320)는 각 주파수 대역 단위마다 유효 변환 계수가 존재하는지를 나타내는 유효 계수 플래그를 생성한다. 이 때, 유효 계수 플래그 생성부(1320)는 가장 작은 저주파수 대역 단위에 대해서는 별도로 유효 계수 플래그를 생성하지 않는 것이 바람직하다. 예를 들어, 도 14a에 도시된 바와 같이 변환 레지듀얼(1410)을 분할한 경우, 유효 계수 플래그 생성부(1320)는 가장 작은 저주파수 대역 단위(1411)을 제외한 나머지 주파수 대역 단위들(1412,1413,1414,1415)마다 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그들을 생성한다. 주파수 대역 단위들(1412,1413,1414,1415)마다의 유효 계수 플래그를 각각 Coeff_exist_1412, Coeff_exist_1413, Coeff_exist_1414, Coeff_exist_1415라고 하고, 주파수 대역 단위들(1412,1413,1414,1415)중 주파수 대역 단위(1412, 1413)에만 유효 계수가 존재한다고 가정하면, 유효 계수 플래그 생성부(1320)는 Coeff_exist_1412=1, Coeff_exist_1413=1, Coeff_exist_1414=0, Coeff_exist_1415=0 과 같이 각 주파수 대역 단위의 유효 계수 플래그를 생성한다. 전술한 바와 같이, 가장 작은 저주파수 대역 단위(1411)의 경우 일반적으로 유효 변환 계수가 존재할 가능성이 존재할 가능성이 매우 크기 때문에 가장 작은 저주파수 대역 단위(1411)에 대해서는 별도로 유효 변환 계수의 존재를 나타내는 유효 계수 플래그를 생성하지 않는 것이 바람직하다. 또한, 가장 작은 저주파수 대역 단위(1411)에 유효 변환 계수의 존재를 나타내는 유효 계수 플래그를 별도로 생성하지 않고, 종래 레지듀얼 블록 내에 유효 변환 계수가 존재하는지 여부를 나타내는 coded_block_flag를 이용하여 가장 작은 저주파수 대역 단위(1411)에 유효 변환 계수의 존재 여부를 나타내도록 할 수 있다. 전술한 유효 계수 플래그 생성 과정은 도 14a에 도시된 분할 형태에 한정되지 않고, 도 14b 내지 도 14j에 도시된 다른 분할 형태에도 동일하게 적용될 수 있다.Referring again to FIG. 13, after dividing the transformed residual block by a predetermined frequency band unit by the frequency
다시 도 13을 참조하면, 유효 계수 부호화부(1330)는 유효 계수 플래그 생성부(1320)에 의하여 생성된 유효 계수 플래그가 1의 값을 갖는, 즉 유효 변환 계수가 존재하는 주파수 대역 단위 내에 존재하는 유효 변환 계수의 위치를 나타내는 유효성 맵 및 유효 변환 계수의 레벨 정보를 부호화한다.Referring again to FIG. 13, the effective
도 15a 및 도 15b는 본 발명의 일 실시예에 따른 유효 변환 계수의 부호화 과정을 설명하기 위한 참조도이다. 도 15a 및 도 15b에서는 변환 레지듀얼 블록을 4등분하고, 저주파수 대역을 다시 4등분하여 주파수 대역 단위를 생성하는 전술한 도 14e에 대응되는 분할 형태를 예시하고 있으나, 이에 한정되지 않고 전술한 도 14a 내지 도 14j에 도시된 다른 분할 형태의 주파수 대역 단위에도 이하 설명되는 유효 변환 계수의 부호화 과정은 동일하게 적용될 수 있다.15A and 15B are reference diagrams for explaining the coding process of the effective transform coefficients according to an embodiment of the present invention. 15A and 15B illustrate a division mode corresponding to the above-described FIG. 14E in which the conversion residual block is divided into quadrants and the low frequency band is divided into quadrants again to generate frequency band units. However, the present invention is not limited to this, The encoding process of the effective transform coefficients described below can be similarly applied to the frequency bands of other division types shown in Figs.
유효 계수 부호화부(1330)는 변환 레지듀얼 블록 전체를 스캐닝하여 유효 변환 계수를 부호화하거나, 각 주파수 대역 단위마다 독립적으로 스캐닝을 수행하여 주파수 대역 단위로 유효 변환 계수를 부호화할 수 있다. 구체적으로, 도 15a를 참조하면, 유효 계수 부호화부(1330)는 변환 레지듀얼 블록(1510) 전체를 소정의 스캐닝 순서, 예를 들어 도시된 바와 같이 래스터 스캐닝 순서에 따라서 스캐닝하면서, 변환 레지듀얼 블록(1510) 내에 존재하는 유효 변환 계수의 위치를 나타내는 유효성 맵 및 각 유효 변환 계수의 크기 및 부호 정보를 부호화할 수 있다. 이 경우, 유효 계수 플래그가 0의 값을 갖는 주파수 대역 단위, 즉 유효 변환 계수가 존재하지 않는 주파수 대역 단위의 스캐닝 과정은 스킵될 수 있다.The effective
또한, 도 15b를 참조하면, 유효 계수 부호화부(1330)는 주파수 대역 분할부(1310)에서 분할된 변환 레지듀얼 블록(1520)의 분할 형태에 따라서 각 주파수 대역 단위마다 유효성 맵 및 유효 변환 계수의 레벨 정보를 부호화할 수 있다.15B, the effective
도 16a 및 도 16b는 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 과정을 보다 구체적으로 설명하기 위한 참조도이다. 도 16a 및 도 16b에서 x로 표시된 변환 계수는 유효 변환 계수이며 아무런 표시가 없는 부분은 0의 값을 갖는 변환 계수라고 가정한다. 16A and 16B are views for explaining the encoding process of the residual block according to an embodiment of the present invention. In Figs. 16A and 16B, it is assumed that the conversion coefficient denoted by x is an effective conversion coefficient, and the portion where there is no indication is a conversion coefficient having a value of 0.
도 16a를 참조하면, 주파수 대역 분할부(1310)는 도 14a 내지 도 14j에 도시된 바와 같은 분할 형태 중 하나의 분할 형태에 따라서 변환 레지듀얼 블록(1610)을 분할한다. 도 16a에서는 도 14e에 대응되는 분할 형태를 예시하였으나, 이에 한정되지 않고 다양한 분할 형태에도 이하 설명되는 변환 레지듀얼 블록의 부호화 과정이 적용될 수 있을 것이다. 유효 계수 플래그 생성부(1320)은 유효 변환 계수가 존재하는 주파수 대역 단위들(1611,1612,1613)의 유효 계수 플래그를 각각 1로 설정하고, 나머지 유효 변환 계수가 존재하지 않는 주파수 대역 단위들(1614, 1615, 1616, 1617)의 유효 계수 플래그를 각각 0으로 설정한다. 유효 계수 부호화부(1330)는 변환 레지듀얼 블록(1610) 전체를 스캐닝하면서 유효 변환 계수의 위치를 나타내는 유효성 맵 및 각 유효 변환 계수의 레벨 정보를 부호화한다. 전술한 바와 같이 유효성 맵은 각 스캔 인덱스에 따른 변환 계수가 유효 변환 계수인지 아니면 0인지 여부를 나타낸다. 유효 변환 계수의 레벨 정보는 유효 변환 계수의 부호 및 절대값 정보를 포함한다. 예를 들어, 유효 변환 계수가 존재하는 주파수 대역 단위들(1611,1612,1613)의 유효성 맵은 도 16a에 도시된 바와 같은 래스터 스캐닝 순서에 따라서 스캐닝될 때 "1000100010101110100100100010001"와 같은 빈 스트링값을 갖는다.Referring to FIG. 16A, the frequency
또한, 도 16a에 도시된 바와 같이 변환 레지듀얼 블록(1610) 전체를 스캐닝하면서 유효 변환 계수의 정보를 부호화하는 경우, 유효 변환 계수가 마지막 유효 변환 계수인지 여부를 나타내는 EOB(End-Of-Block) 플래그는 전체 변환 레지듀얼 블록(1610) 전체에 대하여 설정되거나, 각 주파수 대역 단위로 설정될 수 있다. 예를 들어 전체 변환 레지듀얼(1610)에 대하여 EOB 플래그를 설정하는 경우, 도 16a에 도시된 변환 계수들 중 스캐닝 순서상 마지막 유효 변환 계수인 도면 부호 1602에 대응되는 변환 계수만이 EOB 플래그가 1의 값을 갖는다. 만약, 각 주파수 대역 단위마다 EOB 플래그를 설정하는 경우라면, 주파수 대역 단위(1611) 내의 도면 부호 1601에 해당하는 변환 계수, 주파수 대역 단위(1612) 내의 도면 부호 1602에 해당하는 변환 계수, 주파수 대역 단위(1613) 내의 도면 부호 1603에 해당하는 변환 계수의 EOB 플래그들이 1로 설정된다. 유효 변환 계수가 존재하지 않는 주파수 대역 단위들(1614, 1615, 1616, 1617)에 대해서는 EOB 플래그가 설정될 필요가 없다. 이와 같이 유효 변환 계수가 존재하는 각 주파수 대역 단위마다 EOB 플래그를 설정하는 경우, 소정 주파수 대역 단위에서의 유효 변환 계수의 스캐닝이 완료된 다음, 바로 다음 주파수 대역 단위의 유효 변환 계수의 스캐닝이 개시될 수 있다. 예를 들어, 주파수 대역 단위(1613)의 마지막 유효 변환 계수(1603)의 스캐닝이 완료된 이후에 주파수 대역 단위(1602) 내에 존재하는 변환 계수의 스캐닝이 개시될 수 있다.16A, when the information of the effective transform coefficient is encoded while scanning the entire transformed
도 16b는 각 주파수 대역 단위마다 독립적으로 유효 변환 계수 정보를 부호화하는 경우를 도시한 것이다. 유효 계수 부호화부(1330)는 변환 레지듀얼 블록(1620)의 각 주파수 대역 단위를 독립적으로 스캐닝하면서 유효 변환 계수의 위치를 나타내는 유효성 맵 및 각 유효 변환 계수의 레벨 정보를 부호화한다. 예를 들어, 주파수 대역 단위(1621)의 유효성 맵은 도 16b에 도시된 바와 같은 래스터 스캐닝 순서에 따라서 스캐닝될 때 "1000100010011"와 같은 빈 스트링 값을 갖는다. 또한, 유효 계수 부호화부(1330)는 주파수 대역 단위(1621) 내의 유효 변환 계수들 중 마지막 유효 변환 계수에 해당하는 도면부호 1631의 유효변환계수의 EOB 플래그를 1로 설정한다. 유사하게 유효 계수 부호화부(1330)은 주파수 대역 단위(1622)의 유효성 맵으로서 "101010001"와 같은 빈 스트링 값을 생성한다. 또한, 유효 계수 부호화부(1330)는 주파수 대역 단위(1622) 내의 유효 변환 계수들 중 도면부호 1632의 유효변환계수의 EOB 플래그를 1로 설정한다. 유사하게 유효 계수 부호화부(1330)은 주파수 대역 단위(1623)의 유효성 맵으로서 "11001"와 같은 빈 스트링 값을 생성하고, 도면부호 1633의 유효 변환 계수의 EOB 플래그를 1로 설정한다.16B shows a case in which the effective transform coefficient information is independently encoded for each frequency band unit. The
한편, 유효 계수 부호화부(1330)는 각 주파수 대역 단위들의 마지막 유효 변환 계수들(1631, 1632, 1633)이 해당 주파수 대역 단위의 마지막 유효 변환 계수임을 나타내는 EOB 플래그 이외에, 전체 변환 레지듀얼 블록(1620) 중 마지막 유효 변환 계수인지를 나타내는 플래그(End_Of_WholeBlock)를 별도로 부호화할 수 있다. 도 16b의 경우, 도면 부호 1621, 1622, 1623, 1624, 1625, 1626, 1627의 순서로 주파수 대역 단위들이 독립적으로 스캐닝된다고 할 때, 유효 변환 계수(1633)는 주파수 대역 단위(1623)의 마지막 유효 변환 계수임과 동시에 전체 변환 레지듀얼 블록(1620)의 마지막 유효 변환 계수가 된다. 따라서, 유효 변환 계수(1633)의 EOB 플래그 및 End_of_wholeBlock 플래그 모두는 1의 값을 갖는다. 주파수 대역 단위(1621,1622)의 마지막 유효 변환 계수들(1631,1632)은 EOB 플래그는 1의 값을 갖지만 End_of_WholeBlock 플래그는 0의 값을 갖는다.The effective
이와 같이 각 주파수 대역 단위 별로 마지막 유효 변환 계수에 대하여 EOB 플래그 및 End_Of_WholeBlock 플래그를 설정하는 경우, 복호화시에 우선 전술한 유효 계수 플래그를 이용하여 해당 주파수 대역 단위에 유효 변환 계수가 존재하는지 여부를 판단함으로써 유효 계수 플래그가 0인 주파수 대역 단위의 스캐닝은 스킵될 수 있다. 또한, 유효 계수 플래그가 1인 주파수 대역 단위, 즉 유효 변환 계수가 존재하는 주파수 대역 단위 내의 변환 계수를 스캐닝할 때, EOB 플래그가 1인 변환 계수까지 스캐닝되면, 다음 주파수 대역 단위의 스캐닝을 개시할 수 있다. 만약 EOB 플래그가 1이면서 End_Of_WholeBlock 플래그도 1인 유효 변환 계수가 스캐닝되면, 전체 변환 레지듀얼 블록의 유효 변환 계수의 스캐닝이 완료된 것이므로 해당 변환 레지듀얼 블록의 스캐닝 과정을 종료한다.When the EOB flag and the End_Of_WholeBlock flag are set for the last effective transform coefficient for each frequency band unit as described above, it is first determined at the time of decoding whether the effective coefficient is present in the frequency band unit by using the effective coefficient flag described above Scanning in frequency band units in which the effective coefficient flag is 0 can be skipped. When the conversion coefficient in the frequency band unit in which the effective coefficient flag is 1, that is, the conversion coefficient in the frequency band unit in which the effective conversion coefficient exists is scanned up to the conversion coefficient having the EOB flag of 1, scanning in the next frequency band unit is started . If the EOB flag is 1 and the effective conversion coefficient of the End_Of_WholeBlock flag is 1, the scanning of the effective conversion coefficient of the entire conversion residual block is completed and the scanning process of the conversion residual block is terminated.
도 17a 및 도 17b는 유효 계수 부호화부(1330)에 의하여 생성된 변환 레지듀얼 블록의 부호화 정보의 실시예들을 나타낸 참조도이다.17A and 17B are reference diagrams showing embodiments of encoding information of the conversion residual block generated by the effective
도 17a를 참조하면, 유효 계수 부호화부(1330)는 각 주파수 대역별로 생성된 유효성 맵 및 유효 계수 플래그 정보를 순차적으로 부호화할 수 있다. 제 1 주파수 대역을 변환 레지듀얼 블록의 가장 작은 주파수 대역이라고 할 때, 도시된 바와 같이, 제 1 주파수 대역에 대해서는 제 1 주파수 대역의 유효성 맵(1711) 정보만이 부호화되고 별도로 제 1 주파수 대역에 유효 변환 계수가 존재하는지 여부를 나타내는 제 1 주파수 대역 플래그의 부호화는 별도로 수행되지 않을 수 있다. 또한, 도 17b를 참조하면, 각 주파수 대역들의 유효 계수 플래그들(1721)을 먼저 부호화하고, 각 주파수 대역의 유효성 맵들(1725)은 이후에 부호화할 수도 있다.Referring to FIG. 17A, the effective
도 18은 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 방법을 나타낸 플로우 차트이다.18 is a flowchart illustrating a residual block coding method according to an embodiment of the present invention.
도 18을 참조하면, 단계 1810에서 인트라 예측부(410) 또는 움직임 보상부(425)에 의한 인터 예측 또는 인트라 예측을 통해 예측 블록을 생성한다.Referring to FIG. 18, in
단계 1820에서, 미도시된 감산부에 의하여 예측 블록과 현재 블록 사이의 차이값인 레지듀얼 블록을 생성한다.In
단계 1830에서, 주파수 변환부(430)는 레지듀얼 블록을 주파수 영역으로 변환하여 변환 레지듀얼 블록을 생성한다. 일 예로, DCT 변환을 통해 레지듀얼 블록을 주파수 영역으로 변환할 수 있다.In
단계 1840에서, 주파수 대역 분할부(1310)는 변환 레지듀얼 블록을 소정 주파수 대역 단위들로 분할한다. 전술한 바와 같이, 주파수 대역 분할부(1310)는 도 14a 내지 도 14j에 예시된 바와 같은 다양한 형태로 변환 레지듀얼 블록을 분할할 수 있다. 구체적으로, 주파수 대역 분할부(1310)는 저주파수 대역의 분할된 단위 크기가 고주파수 대역의 분할된 단위 크기에 비하여 작도록 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 4등분하고 4등분된 변환 레지듀얼 블록 중 가장 저주파수 대역을 다시 4등분하는 과정을 반복함으로써 변환 레지듀얼 블록을 분할하거나, 동일한 크기의 주파수 대역 단위로 변환 레지듀얼 블록을 분할하거나, 동일한 값을 갖는 수평 주파수 및 수직 주파수를 연결하여 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 구성하는 변환 계수들을 이용하여 판단된 변환 레지듀얼 블록의 영상 특성을 이용하여 변환 레지듀얼 블록의 주파수 대역별로 분할할 크기를 결정하고 결정된 주파수 대역별 분할 크기에 따라서 변환 레지듀얼 블록을 분할할 수 있다.In
단계 1850에서, 유효 계수 플래그 생성부(1320)는 분할된 주파수 대역 단위마다 0이 아닌 유효 변환 계수가 존재하는지 여부를 나타내는 주파수 대역 단위별 유효 계수 플래그를 생성한다. 이러한 유효 계수 플래그는 변환 레지듀얼 블록의 분할된 주파수 대역 단위들 중 가장 작은 주파수 대역 단위에 대해서는 별도로 생성되지 않는 것이 바람직하다. 또한, 유효 계수 부호화부(1330)는 유효 계수 플래그가 0이 아닌, 즉 유효 변환 계수가 포함된 주파수 대역 단위들에 대해서 도 15a,도 15b, 도 16a 및 도 16b를 참조하여 설명한 바와 같이 전체 변환 레지듀얼 블록을 소정의 스캐닝 순서에 따라 스캐닝하거나, 각 주파수 대역 단위 별로 독립적으로 스캐닝을 수행하면서 유효 변환 계수의 위치를 나타내는 유효성 맵 및 유효 변환 계수의 레벨 정보를 부호화한다.In
전술한 본 발명의 일 실시예에 따른 레지듀얼 블록의 부호화 방법 및 장치에 따르면, 16x16 이상의 큰 크기를 갖는 변환 레지듀얼 블록을 주파수 대역 단위로 분할하여 처리함으로써 변환 레지듀얼 블록 내의 유효 변환 계수의 분포 특성에 따라 보다 효율적으로 유효 변환 계수 정보를 부호화할 수 있다. 즉, 본 발명에 따르면 큰 크기의 변환 레지듀얼 블록을 주파수 대역 단위들로 분할하고, 분할된 주파수 대역 단위 별로 유효 변환 계수의 존재 여부를 나타내는 유효 계수 플래그를 생성함으로써 변환 레지듀얼 블록 내에 유효 변환 계수가 존재하지 않는 주파수 대역의 스캐닝 과정을 스킵할 수 있도록 하며, 또한 유효 변환 계수의 부호화에 필요한 비트 발생량을 감소시킬 수 있다.According to the method and apparatus for encoding a residual block according to an embodiment of the present invention, a transformed residual block having a large size of 16x16 or more is divided and processed in units of frequency bands to obtain a distribution of effective transform coefficients in the transformed residual block The effective transform coefficient information can be encoded more efficiently according to the characteristics. That is, according to the present invention, a large-sized conversion residual block is divided into frequency band units and an effective coefficient flag indicating the presence or absence of an effective conversion coefficient is generated for each divided frequency band unit, It is possible to skip the scanning process in the frequency band in which no frequency band exists and to reduce the amount of bits required for coding the effective transform coefficient.
도 19는 본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 장치를 나타낸 블록도이다. 본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 장치(1900)는 도 5의 엔트로피 복호화부(520)에 대응되거나 내부에 포함될 수 있다.19 is a block diagram illustrating an apparatus for decoding residual blocks according to an embodiment of the present invention. The residual
도 19를 참조하면, 레지듀얼 블록의 복호화 장치(1900)는 주파수 대역 분할부(1910), 유효 주파수 대역 판단부(1920) 및 유효계수 복호화부(1930)를 포함한다.19, the residual
주파수 대역 분할부(1910)는 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할한다. 구체적으로 주파수 대역 분할부(1910)는 전술한 도 14a 내지 도 14j에 예시된 바와 같이, 저주파수 대역의 분할된 단위 크기가 고주파수 대역의 분할된 단위 크기에 비하여 작도록 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 4등분하고 4등분된 변환 레지듀얼 블록 중 가장 저주파수 대역을 다시 4등분하는 과정을 반복함으로써 변환 레지듀얼 블록을 분할하거나, 동일한 크기의 주파수 대역 단위로 변환 레지듀얼 블록을 분할하거나, 동일한 값을 갖는 수평 주파수 및 수직 주파수를 연결하여 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 구성하는 변환 계수들을 이용하여 판단된 변환 레지듀얼 블록의 영상 특성을 이용하여 변환 레지듀얼 블록의 주파수 대역별로 분할할 크기를 결정하고 결정된 주파수 대역별 분할 크기에 따라서 변환 레지듀얼 블록을 분할할 수 있다. 다양한 분할 형태 중 어떠한 형태로 변환 레지듀얼 블록을 분할할 것인지는 미리 부호화 장치와 복호화 장치에서 결정된 형태에 의하거나, 다양한 분할 형태마다 소정의 분할 인덱스를 설정하고, 부호화시에 현재 변환 레지듀얼 블록의 분할에 이용된 분할 인덱스 정보를 비트스트림에 부가하면, 주파수 대역 분할부(1910)에서 비트스트림에 포함된 분할 인덱스 정보로부터 현재 변환 레지듀얼 블록을 어떠한 형태로 분할한 것인지를 결정할 수도 있다.The frequency
유효 주파수 대역 판단부(1920)는 비트스트림으로부터 변환 레지듀얼 블록을 분할한 주파수 대역 단위별로 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그를 추출한다. 이러한 유효 계수 플래그를 이용하여 유효 주파수 대역 판단부(1920)는 변환 레지듀얼 블록을 분할한 주파수 대역 단위들 중 유효 변환 계수가 존재하는 주파수 대역 단위를 판단할 수 있다. 예를 들어, 부호화된 변환 레지듀얼 블록이 전술한 도 16b과 같다고 가정하면, 도면 부호 1621, 1622, 1623으로 표시된 주파수 대역 단위만 유효 계수 플래그가 1의 값을 갖고 도면 부호 1624, 1625, 1626, 1627로 표시된 주파수 대역 단위는 유효 계수 플래그가 0의 값을 갖으므로, 유효 주파수 대역 판단부(1920)는 추출된 주파수 대역별 유효 계수 플래그로부터 유효 변환 계수가 존재하는 주파수 대역 단위를 판단할 수 있다.The valid frequency
유효 계수 복호화부(1930)는 유효 주파수 대역 판단부(1920)에 의하여 유효 변환 계수가 존재하는 것으로 판단된 주파수 대역 단위 내의 유효 변환 계수들을 복호화한다. 구체적으로, 유효 계수 복호화부(1930)는 비트스트림으로부터 유효 변환 계수들의 위치를 나타내는 유효성 맵 및 유효 변환 계수의 레벨 정보를 추출한다. 그리고, 유효 계수 복호화부(1930)는 전술한 도 15a 및 도 15b에 도시된 바와 같이, 전체 변환 레지듀얼 블록을 스캐닝하거나 분할된 주파수 대역 단위마다 독립된 소정의 스캐닝 순서에 따라서 각 주파수 대역 단위를 스캐닝하면서 추출된 유효성 맵 정보를 이용하여 변환 레지듀얼 블록 내의 유효 변환 계수의 위치를 판단하고, 레벨 정보를 이용하여 유효 변환 계수의 값을 복원한다.The effective
도 20은 본 발명의 일 실시예에 따른 레지듀얼 블록의 복호화 방법을 나타낸 플로우 차트이다.20 is a flowchart illustrating a method of decoding a residual block according to an embodiment of the present invention.
단계 2010에서 유효 주파수 대역 판단부(1920)는 부호화된 비트스트림으로부터 현재 블록의 변환 레지듀얼 블록을 분할한 소정 주파수 대역 단위별로 유효 변환 계수가 존재하는지 여부를 나타내는 유효 계수 플래그를 추출한다.In
단계 2020에서, 주파수 대역 분할부(1910)는 변환 레지듀얼 블록을 소정 주파수 대역 단위로 분할한다. 주파수 대역 분할부(1910)는 전술한 도 14a 내지 도 14j에 예시된 바와 같이, 저주파수 대역의 분할된 단위 크기가 고주파수 대역의 분할된 단위 크기에 비하여 작도록 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 4등분하고 4등분된 변환 레지듀얼 블록 중 가장 저주파수 대역을 다시 4등분하는 과정을 반복함으로써 변환 레지듀얼 블록을 분할하거나, 동일한 크기의 주파수 대역 단위로 변환 레지듀얼 블록을 분할하거나, 동일한 값을 갖는 수평 주파수 및 수직 주파수를 연결하여 변환 레지듀얼 블록을 분할하거나, 변환 레지듀얼 블록을 구성하는 변환 계수들을 이용하여 판단된 변환 레지듀얼 블록의 영상 특성을 이용하여 변환 레지듀얼 블록의 주파수 대역별로 분할할 크기를 결정하고 결정된 주파수 대역별 분할 크기에 따라서 변환 레지듀얼 블록을 분할한다. 이러한 분할 형태는 전술한 바와 같이 부호화측과 동일하게 미리 결정된 형태에 의하거나 비트스트림에 별도로 부가된 분할 인덱스 정보를 이용하여 결정될 수 있다. 단계 2010 및 단계 2020의 수행 순서는 변경될 수 있다.In
단계 2030에서, 유효 주파수 대역 판단부(1910)는 추출된 유효 계수 플래그를 이용하여 분할된 주파수 대역 단위들 중 유효 변환 계수가 존재하는 주파수 대역 단위를 판단한다. 유효 계수 복호화부(1930)는 유효 계수가 존재하는 것으로 판단된 주파수 대역 단위에 대한 유효성 맵 및 유효 변환 계수의 레벨 정보를 이용하여 유효 변환 계수를 복원한다.In
본 발명에 따른 영상의 부호화, 복호화 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 포함된. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The image coding and decoding method according to the present invention can also be implemented as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like. The computer readable recording medium may also be distributed over a networked computer system so that computer readable code can be stored and executed in a distributed manner.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.
Claims (4)
상기 특정 서브 변환 레지듀얼 블록의 유효 계수 플래그가 상기 특정 서브 변환 레지듀얼 블록에 상기 유효 변환 계수가 존재함을 나타내는 경우, 상기 비트스트림으로부터 획득된 상기 유효 변환 계수의 위치 정보 및 레벨 정보에 기초하여 상기 특정 서브 변환 레지듀얼 블록의 변환 계수들을 획득하는 단계;
상기 특정 서브 변환 레지듀얼 블록의 유효 계수 플래그가 상기 특정 서브 변환 레지듀얼 블록에 상기 유효 변환 계수가 존재하지 않음을 나타내는 경우, 상기 특정 서브 변환 레지듀얼 블록에 속하는 변환 계수들을 0으로 설정하는 단계; 및
상기 변환 계수들에 기초하여 상기 특정 서브 변환 레지듀얼 블록을 포함하는 상기 변환 레지듀얼 블록을 역변환하는 단계를 포함하며,
상기 특정 서브 변환 레지듀얼 블록의 변환 계수들은 상기 변환 레지듀얼 블록에 포함된 변환 계수들 중 일부분이며,
상기 유효 계수 플래그는
상기 특정 서브 변환 레지듀얼 블록이 상기 서브 변환 레지듀얼 블록들 중 가장 작은 주파수 대역에 해당되지 않는 경우에 획득되는 것을 특징으로 하는 영상 복호화 방법.The effective coefficient flag of the specific sub-conversion residual block indicating whether or not at least one effective conversion coefficient exists in the specific sub-conversion residual block among the sub-conversion residual blocks included in the conversion residual block is obtained from the bit stream step;
When the effective coefficient flag of the specific sub-transform residual block indicates that the effective transform coefficient exists in the specific sub-transform residual block, based on the position information and the level information of the effective transform coefficient obtained from the bit stream Obtaining transform coefficients of the specific sub-transform residual block;
If the effective coefficient flag of the specific sub-conversion residual block indicates that the effective conversion coefficient does not exist in the specific sub-conversion residual block, setting the conversion coefficients belonging to the specific sub-conversion residual block to 0; And
Transforming the transformed residual block including the specific sub-transform residual block based on the transform coefficients,
The transform coefficients of the specific sub-transform residual block are part of the transform coefficients included in the transform residual block,
The effective coefficient flag
Wherein the specific sub-transform residual block is obtained when the specific sub-transform residual block does not correspond to the smallest frequency band among the sub-transform residual blocks.
상기 위치 정보는 상기 유효 변환 계수들의 위치를 나타내는 유효성 맵(significance map)인 것을 특징으로 하는 영상 복호화 방법.The method according to claim 1,
Wherein the position information is a significance map indicating a position of the effective transform coefficients.
상기 서브 변환 레지듀얼 블록마다 독립된 소정의 스캔 순서에 따라서 상기 서브 변환 레지듀얼 블록 내의 유효 변환 계수의 위치를 나타내는 것을 특징으로 하는 영상 복호화 방법.3. The method of claim 2,
And the position of the effective transform coefficient in the sub-transform residual block is indicated according to a predetermined scan order independent of each sub-transform residual block.
상기 특정 서브 변환 레지듀얼 블록의 유효 계수 플래그가 상기 특정 서브 변환 레지듀얼 블록에 상기 유효 변환 계수가 존재함을 나타내는 경우, 상기 비트스트림으로부터 획득된 상기 유효 변환 계수의 위치 정보 및 레벨 정보에 기초하여 상기 특정 서브 변환 레지듀얼 블록의 변환 계수들을 획득하고, 상기 특정 서브 변환 레지듀얼 블록의 유효 계수 플래그가 상기 특정 서브 변환 레지듀얼 블록에 상기 유효 변환 계수가 존재하지 않음을 나타내는 경우, 상기 특정 서브 변환 레지듀얼 블록에 속하는 변환 계수들을 0으로 설정하는 유효 계수 복호화부; 및
상기 변환 계수들에 기초하여 상기 특정 서브 변환 레지듀얼 블록을 포함하는 상기 변환 레지듀얼 블록을 역변환하는 역변환부를 포함하며,
상기 특정 서브 변환 레지듀얼 블록의 변환 계수들은 상기 변환 레지듀얼 블록에 포함된 변환 계수들 중 일부분이며,
상기 유효 계수 플래그는
상기 특정 서브 변환 레지듀얼 블록이 상기 서브 변환 레지듀얼 블록들 중 가장 작은 주파수 대역에 해당되지 않는 경우에 획득되는 것을 특징으로 하는 영상 복호화 장치.The effective coefficient flag of the specific sub-conversion residual block indicating whether or not at least one effective conversion coefficient exists in the specific sub-conversion residual block among the sub-conversion residual blocks included in the conversion residual block is obtained from the bit stream An entropy decoding unit;
When the effective coefficient flag of the specific sub-transform residual block indicates that the effective transform coefficient exists in the specific sub-transform residual block, based on the position information and the level information of the effective transform coefficient obtained from the bit stream When the effective coefficient flag of the specific sub-transform residual block indicates that the effective transform coefficient does not exist in the specific sub-transform residual block, An effective coefficient decoding unit for setting the transform coefficients belonging to the residual block to 0; And
And an inverse transform unit for inversely transforming the transform residual block including the specific transform transform residual block based on the transform coefficients,
The transform coefficients of the specific sub-transform residual block are part of the transform coefficients included in the transform residual block,
The effective coefficient flag
And when the specific sub-transform residual block does not correspond to the smallest frequency band among the sub-transform residual blocks.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140058639A KR101604033B1 (en) | 2014-05-15 | 2014-05-15 | Method and apparatus for decoding an image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140058639A KR101604033B1 (en) | 2014-05-15 | 2014-05-15 | Method and apparatus for decoding an image |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090102818A Division KR101457894B1 (en) | 2009-10-28 | 2009-10-28 | Method and apparatus for encoding image, and method and apparatus for decoding image |
Related Child Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140148719A Division KR101604035B1 (en) | 2014-10-29 | 2014-10-29 | Method and apparatus for decoding an image |
KR1020150047487A Division KR101625629B1 (en) | 2015-04-03 | 2015-04-03 | Method and apparatus for decoding an image |
KR1020150047488A Division KR101625631B1 (en) | 2015-04-03 | 2015-04-03 | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
KR1020150047489A Division KR101604038B1 (en) | 2015-04-03 | 2015-04-03 | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140071304A KR20140071304A (en) | 2014-06-11 |
KR101604033B1 true KR101604033B1 (en) | 2016-03-16 |
Family
ID=51125793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140058639A KR101604033B1 (en) | 2014-05-15 | 2014-05-15 | Method and apparatus for decoding an image |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101604033B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080219578A1 (en) * | 2007-03-07 | 2008-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for context adaptive binary arithmetic coding and decoding |
-
2014
- 2014-05-15 KR KR1020140058639A patent/KR101604033B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080219578A1 (en) * | 2007-03-07 | 2008-09-11 | Samsung Electronics Co., Ltd. | Method and apparatus for context adaptive binary arithmetic coding and decoding |
Also Published As
Publication number | Publication date |
---|---|
KR20140071304A (en) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101457894B1 (en) | Method and apparatus for encoding image, and method and apparatus for decoding image | |
KR102250095B1 (en) | Method and apparatus for encoding/decoding video with predicting quantization parameter of hierarchical data unit | |
KR101927969B1 (en) | Method and apparatus for entropy coding video, and computer readable medium | |
KR101483750B1 (en) | Method and apparatus for image encoding, and method and apparatus for image decoding | |
DK2840789T3 (en) | PARAMETER UPDATE PROCEDURE FOR ENTROPIA CODING OF TRANSFORMATION COEFFICIENT LEVEL, AND ENTROPIA CODING APPLY RATE OF TRANSFORMATION COEFFICIENT LEVEL USING THE SAME | |
KR101969933B1 (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
KR101719737B1 (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
KR101863689B1 (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
KR101604038B1 (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
KR101625629B1 (en) | Method and apparatus for decoding an image | |
KR101625631B1 (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
KR101604035B1 (en) | Method and apparatus for decoding an image | |
KR101662741B1 (en) | Method for image decoding | |
KR101604033B1 (en) | Method and apparatus for decoding an image | |
KR101618766B1 (en) | Method and apparatus for image decoding | |
KR101525015B1 (en) | Method and apparatus for image encoding, and method and apparatus for image decoding | |
KR101618214B1 (en) | Method for image decoding | |
KR101489222B1 (en) | Method and apparatus for image encoding, and method and apparatus for image decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
A107 | Divisional application of patent | ||
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190227 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20200227 Year of fee payment: 5 |