Nothing Special   »   [go: up one dir, main page]

WO2013065259A1 - Video encoding device, video decoding device, video encoding method, video decoding method, and program - Google Patents

Video encoding device, video decoding device, video encoding method, video decoding method, and program Download PDF

Info

Publication number
WO2013065259A1
WO2013065259A1 PCT/JP2012/006812 JP2012006812W WO2013065259A1 WO 2013065259 A1 WO2013065259 A1 WO 2013065259A1 JP 2012006812 W JP2012006812 W JP 2012006812W WO 2013065259 A1 WO2013065259 A1 WO 2013065259A1
Authority
WO
WIPO (PCT)
Prior art keywords
square
scaling matrix
matrix
square scaling
video
Prior art date
Application number
PCT/JP2012/006812
Other languages
French (fr)
Japanese (ja)
Inventor
慶一 蝶野
啓史 青木
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Publication of WO2013065259A1 publication Critical patent/WO2013065259A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264

Definitions

  • the present invention relates to a video encoding device and a video decoding device that use a scaling matrix in quantization processing and inverse quantization processing for a non-square quadtree frequency transform block.
  • Non-Patent Document 1 discloses a video encoding method using a scaling matrix in quantization processing and inverse quantization processing for a square frequency transform block.
  • Non-Patent Document 1 supports 4 ⁇ 4 and 8 ⁇ 8 square frequency conversion blocks. Therefore, a scaling matrix can be set for each of intra prediction / inter prediction and luminance (Y) and color difference (U and V) components. That is, six 4 ⁇ 4 scaling matrices (two combinations of intra prediction / inter prediction and three signal components Y / U / V) and two 8 ⁇ 8 scaling matrices (two intra prediction / inter prediction and signal components) One combination of Y) can be set. Further, the six 4 ⁇ 4 scaling matrices and the two 8 ⁇ 8 scaling matrices can be transmitted using Sequence Parameter Set (SPS) and Picture Parameter Set (SPS) (for details, refer to 7.3.2.1.1 of Non-Patent Document 1). (Listed in Sequence, parameter, set, data, syntax, and 7.3.2.2, Picture, parameter, set, RBSP, syntax).
  • SPS Sequence Parameter Set
  • SPS Picture Parameter Set
  • Non-Patent Document 1 describes a method for predictively encoding elements of a scaling matrix based on a zigzag scan in order to reduce the code amount of each square scaling matrix in SPS and PPS. ing. That is, predictive coding closed in the scaling matrix is used. Hereinafter, this is referred to as intra-scaling matrix predictive coding.
  • the encoder 107 is configured.
  • the residual signal obtained by subtracting the prediction signal (predicted block signal) generated by the predictor 101 ⁇ ⁇ from the input signal (input block signal) is output by the frequency converter 102. Obtain the residual frequency transform coefficient.
  • the quantizer 103 quantizes the residual frequency transform coefficient using an externally set scaling matrix to obtain a residual level.
  • the entropy encoder 104 performs entropy encoding on the residual level and outputs a bit stream.
  • the residual level is converted into a reconstructed residual signal (reconstructed residual block signal) via the inverse quantization / inverse frequency converter 105, and reconstructed by adding the prediction signal.
  • the buffer 106 is stored as a signal (reconstructed block signal).
  • the intra-scaling matrix prediction encoder 107 performs intra-scaling matrix prediction encoding.
  • the intra-scaling matrix prediction encoder 107 supplies the prediction error of each element of the scaling matrix to the entropy encoder 104.
  • Non-Patent Document 2 describes a video code that uses non-square frequency transform blocks such as 2 ⁇ 8, 8 ⁇ 2, 4 ⁇ 16, 16 ⁇ 4, 8 ⁇ 32, and 32 ⁇ 8 in addition to square frequency transform blocks. Is disclosed. In Patent Document 2 that supports quadtrees, non-square frequency conversion is called non-square quadtree frequency conversion.
  • the non-square frequency transform block also includes intra prediction / inter prediction and luminance (Y) component and color difference (U and V). It is conceivable to set a scaling matrix for each component.
  • FIG. 3 shows a state of intra-scaling matrix prediction encoding of 2 ⁇ 8 (2 rows and 8 columns) and 8 ⁇ 2 (8 rows and 2 columns) non-square scaling matrices.
  • the code amount of the scaling matrix increases by the number of additional 2 ⁇ 8 and 8 ⁇ 2 non-square scaling matrices.
  • An object of the present invention is to more suitably reduce the code amount of a non-square scaling matrix by non-square scaling matrix inter-prediction encoding.
  • a video encoding device is a video encoding device including non-square frequency conversion means and non-square scaling matrix encoding means, wherein the non-square scaling matrix encoding means converts the elements of the non-square scaling matrix. Predictive encoding is performed using elements of an encoded non-square scaling matrix.
  • a video decoding device is a video decoding device comprising non-square inverse frequency conversion means and non-square scaling matrix decoding means, wherein the non-square scaling matrix decoding means has already decoded the elements of the non-square scaling matrix. Predictive decoding is performed using elements of a non-square scaling matrix.
  • a video encoding method is a video encoding method executed by a video encoding device including non-square frequency conversion means and non-square scaling matrix encoding means, wherein the non-square scaling matrix encoding means includes The non-square scaling matrix elements are predictively encoded with the encoded non-square scaling matrix elements.
  • a video decoding method is a video decoding method executed by a video decoding device including non-square inverse frequency conversion means and non-square scaling matrix decoding means, wherein the non-square scaling matrix decoding means includes non-square scaling. It is characterized by predictively decoding the elements of the matrix with the elements of the decoded non-square scaling matrix.
  • a video encoding program provides a computer that implements a non-square frequency conversion unit and a non-square scaling matrix encoding unit, and predicts a non-square scaling matrix element using an encoded non-square scaling matrix element. It is characterized in that the processing to be converted is executed.
  • the video decoding program according to the present invention is a computer that realizes non-square inverse frequency conversion means and non-square scaling matrix decoding means, and performs processing for predictive decoding of non-square scaling matrix elements using decoded non-square scaling matrix elements. Is executed.
  • the code amount of the non-square scaling matrix can be more suitably reduced by the non-square scaling matrix inter-prediction encoding.
  • the present invention takes advantage of the correlation between non-square scaling matrices of the same size, such as an additional 2 ⁇ 8 and 8 ⁇ 2, to encode the non-square scaling matrix to be transmitted first in the scaling matrix and subsequently transmit it
  • the non-square scaling matrix is predictively encoded with the transmitted non-square scaling matrix.
  • FIG. 4 shows how an 8 ⁇ 2 non-square scaling matrix is predictively encoded using the transmitted 2 ⁇ 8 non-square scaling matrix.
  • FIG. The video encoding apparatus of the present embodiment shown in FIG. 5 includes a predictor 101, a frequency converter 102, a quantizer 103, an entropy encoder 104, an inverse quantization / inverse frequency converter 105, a buffer 106, and a scaling matrix.
  • a predictive encoder 107 and a non-square scaling inter-matrix predictive encoder 108 are provided.
  • the video encoding device predictively encodes each corresponding frequency component (by transposition) between non-square scaling matrices.
  • the residual signal (residual block signal) obtained by subtracting the prediction signal (predicted block signal) generated by the predictor 101 from the input signal (input block signal) is converted into the frequency converter 102. Is converted into a residual frequency conversion coefficient.
  • the frequency conversion is a square frequency conversion and a non-square frequency conversion.
  • the residual frequency transform coefficient obtained by the square frequency transform is called a square residual frequency transform coefficient.
  • the residual frequency transform coefficient obtained by the non-square frequency transform is called a non-square residual frequency transform coefficient.
  • the quantizer 103 quantizes the residual frequency transform coefficient using an externally set scaling matrix to obtain a residual level. For a square residual frequency transform coefficient, a square residual level is obtained using a square scaling matrix. For non-square residual frequency transform coefficients, non-square residual levels are obtained using a non-square scaling matrix.
  • the entropy encoder 104 performs entropy encoding on the residual level and outputs a bit stream.
  • the residual level is converted into a reconstructed residual signal (reconstructed residual block signal) via the inverse quantization / inverse frequency converter 105, and reconstructed by adding the prediction signal.
  • the buffer 106 is stored as a signal (reconstructed block signal).
  • the inverse quantization / inverse frequency converter 105 uses a square scaling matrix for inverse quantization of the square residual level.
  • a non-square scaling matrix is used for inverse quantization of non-square residual levels.
  • the intra-scaling-matrix prediction encoder 107 encodes the square scaling matrix within the scaling matrix. Further, the horizontally long non-square scaling matrix (non-square scaling matrix 1) is subjected to intra-scaling matrix predictive coding. For example, in the case of the 2 ⁇ 8 and 8 ⁇ 2 non-square scaling matrix shown in FIG. 2, the non-square scaling matrix (a) is subjected to intra-scaling prediction encoding.
  • non-square scaling matrix 1 for an intra prediction block is represented by the following pseudo code:
  • Quant_intra_2 ⁇ 8 [2] [8] ⁇ ⁇ 6,10,13,16,18,23,25,27 ⁇ , ⁇ 18,23,25,27,29,31,33,36 ⁇ , ⁇ ;
  • non-square scaling matrix 1 for the inter prediction block is represented by the following pseudo code:
  • the non-square scaling matrix prediction encoder 108 ⁇ ⁇ performs a non-square scaling matrix prediction encoding on the vertically long non-square scaling matrix.
  • an 8 ⁇ 2 non-square scaling matrix (non-square scaling matrix 2) for an intra prediction block is represented by the following pseudo code:
  • Quant_intra_8 ⁇ 2 [8] [2] ⁇ ⁇ 6,18 ⁇ , ⁇ 10,23 ⁇ , ⁇ 13,25 ⁇ , ⁇ 16,27 ⁇ , ⁇ 18,29 ⁇ , ⁇ 23,31 ⁇ , ⁇ 25,33 ⁇ , ⁇ 27,36 ⁇ ⁇ ;
  • non-square scaling matrix 1 a matrix obtained by transposing a 2 ⁇ 8 non-square scaling matrix (non-square scaling matrix 1) matches an 8 ⁇ 2 non-square scaling matrix (non-square scaling matrix 2). Note that the prediction errors are all zero.
  • FIG. 6 is a flowchart focusing on the operation of the non-square scaling inter-matrix predictive encoder 108, which is a feature of the present invention.
  • the non-square scaling matrix inter-prediction encoder 108 ⁇ ⁇ transposes the transmitted non-square scaling matrix 1 in step S101.
  • step S102 the non-square scaling matrix inter-prediction encoder 108 calculates the difference of each element according to the zigzag scan with respect to the transposed matrix generated in step S101 and the non-square scaling matrix 2.
  • FIG. 7 The video decoding apparatus according to the present embodiment shown in FIG. 7 includes an entropy decoder 201, an inverse quantization / inverse frequency converter 202, a predictor 203, a buffer 204, an intra-scaling prediction decoder 205, and a non-square scaling matrix prediction.
  • a decoder 206 is provided.
  • the entropy decoder 201 entropy-decodes the bitstream, and entropy-decodes the prediction error and residual level of each element of each scaling matrix.
  • the prediction errors of the square scaling matrix and the horizontally long non-square scaling matrix (non-square scaling matrix 1) are supplied to the intra-scaling matrix prediction decoder 205.
  • the prediction error of the vertically long non-square scaling matrix (non-square scaling matrix 2) is supplied to a non-square scaling matrix prediction decoder 206.
  • the intra-scaling matrix prediction decoder 205 predictively decodes the prediction errors of the square scaling matrix and the horizontally long non-square scaling matrix (non-square scaling matrix 1).
  • the intra-scaling matrix prediction decoder 205 supplies the square scaling matrix and the non-square scaling matrix (non-square scaling matrix 1) subjected to the intra-scaling matrix prediction decoding to the inverse quantization / inverse frequency converter 202.
  • the non-square scaling matrix (non-square scaling matrix 1) is supplied to the non-square scaling matrix inter-prediction decoder 206.
  • the inverse quantization / inverse frequency converter 202 performs inverse quantization / inverse frequency conversion on the supplied residual level and outputs a reconstructed residual signal.
  • the reconstructed residual signal is added with the prediction signal supplied from the predictor 203 and stored in the buffer 204 as a reconstructed signal.
  • the inverse quantization / inverse frequency converter 202 calculates the reconstructed residual signal using the square scaling matrix for the square residual level. For non-residual levels, a reconstructed residual signal is calculated using a non-square scaling matrix.
  • FIG. 8 is a flowchart focusing on the operation of the non-square scaling inter-matrix prediction decoder 206, which is a feature of the present invention.
  • the non-square scaling matrix inter-prediction decoder 206 transposes the decoded non-square scaling matrix 1 in step S201.
  • step S202 each element of the non-square scaling matrix 2 is calculated according to the zigzag scan based on the prediction error of the non-square scaling matrix 2 and the transposed matrix generated in step S201.
  • Embodiment 3 In the above-described embodiment, encoding and decoding of 2 ⁇ 8 and 8 ⁇ 2 non-square scaling matrices are shown. Similar encoding and decoding can naturally be applied to non-square scaling matrices of 4 ⁇ 16 and 16 ⁇ 4 and 8 ⁇ 32 and 32 ⁇ 8.
  • the horizontally long non-square scaling matrix is predicted within the scaling matrix, and the vertically long non-square scaling matrix is predicted between the non-square scaling matrices.
  • a vertically long non-square scaling matrix may be predicted within a scaling matrix, and a horizontally long non-square scaling matrix may be predicted between non-square scaling matrices.
  • the non-square scaling matrix 2 to be encoded / decoded subsequently is always predicted between non-square scaling matrices.
  • intra-scaling matrix prediction may be applied to the non-square scaling matrix 2 as well.
  • the video encoding device may embed auxiliary information on whether non-square scaling matrix 2 or intra-scaling matrix prediction or non-square scaling matrix prediction is applied to the bit stream. .
  • the video decoding device may perform decoding based on intra-scaling matrix prediction or non-square scaling matrix prediction on the non-square scaling matrix 2 based on the auxiliary information.
  • the non-square scaling matrix 2 to be encoded / decoded subsequently is predicted between non-square scaling matrices, and all the prediction errors of the elements are transmitted.
  • the video encoding apparatus transposes the non-square scaling matrix 1 and the non-square scaling matrix 2 It is only necessary to embed auxiliary information indicating that the data is in the bitstream.
  • the video decoding device may use the non-square scaling matrix 2 as a result of transposing (adding 0 to) the non-square scaling matrix 1 based on the auxiliary information.
  • the information processing system shown in FIG. 9 includes a processor 1001, a program memory 1002, a storage medium 1003 for storing video data, and a storage medium 1004 for storing a bitstream.
  • the storage medium 1003 and the storage medium 1004 may be separate storage media, or may be storage areas composed of the same storage medium.
  • a magnetic storage medium such as a hard disk can be used as the storage medium.
  • the program memory 1002 stores a program for realizing the function of each block shown in FIG. 5 and FIG.
  • the processor 1001 implements the functions of the video encoding device or the video decoding device shown in FIGS. 5 and 7 by executing processing according to the program stored in the program memory 1002.
  • the present invention can be suitably applied to a video encoding device, a video decoding device, or the like that uses a scaling matrix in quantization processing and inverse quantization processing for a non-square quadtree frequency transform block.

Landscapes

  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

This video encoding device is provided with a non-square frequency-transformation means and a non-square-scaling-matrix encoding means. The non-square-scaling-matrix encoding means predictively encodes the elements of a non-square scaling matrix using the elements of an already-encoded non-square scaling matrix. This video decoding device is provided with a non-square inverse frequency-transformation means and a non-square-scaling-matrix decoding means. The non-square-scaling-matrix decoding means predictively decodes the elements of a non-square scaling matrix using the elements of an already-decoded non-square scaling matrix.

Description

映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラムVideo encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and program
 本発明は、非正方4分木周波数変換ブロックに対する量子化処理および逆量子化処理においてスケーリングマトリクスを用いる映像符号化装置および映像復号装置に関する。 The present invention relates to a video encoding device and a video decoding device that use a scaling matrix in quantization processing and inverse quantization processing for a non-square quadtree frequency transform block.
 非特許文献1は、正方形周波数変換ブロックに対する量子化処理および逆量子化処理においてスケーリングマトリクスを用いる映像符号化方法を開示している。 Non-Patent Document 1 discloses a video encoding method using a scaling matrix in quantization processing and inverse quantization processing for a square frequency transform block.
 非特許文献1は、4×4と8×8の正方形周波数変換ブロックをサポ-トする。よって、イントラ予測/インター予測、および、輝度(Y)成分と色差(UおよびV)成分ごとにスケーリングマトリクスを設定できる。すなわち、6つの4×4スケーリングマトリクス(イントラ予測/インター予測の2つと信号成分Y/U/Vの3つの組み合わせ)と、2つの8×8スケーリングマトリクス(イントラ予測/インター予測の2つと信号成分Yの1つの組み合わせ)を設定できる。また、前記6つの4×4スケーリングマトリクスと2つの8×8スケーリングマトリクスをSequence Parameter Set(SPS)およびPicture Parameter Sets(SPS)にて伝送できる(詳細は、非特許文献1の7.3.2.1.1 Sequence parameter set data syntaxと7.3.2.2 Picture parameter set RBSP syntaxに記載。)。 Non-Patent Document 1 supports 4 × 4 and 8 × 8 square frequency conversion blocks. Therefore, a scaling matrix can be set for each of intra prediction / inter prediction and luminance (Y) and color difference (U and V) components. That is, six 4 × 4 scaling matrices (two combinations of intra prediction / inter prediction and three signal components Y / U / V) and two 8 × 8 scaling matrices (two intra prediction / inter prediction and signal components) One combination of Y) can be set. Further, the six 4 × 4 scaling matrices and the two 8 × 8 scaling matrices can be transmitted using Sequence Parameter Set (SPS) and Picture Parameter Set (SPS) (for details, refer to 7.3.2.1.1 of Non-Patent Document 1). (Listed in Sequence, parameter, set, data, syntax, and 7.3.2.2, Picture, parameter, set, RBSP, syntax).
 非特許文献1の7.3.2.1.1.1 Scaling list syntaxは、SPSおよびPPSにおける各正方形スケーリングマトリクスの符号量を削減するために、ジグザグスキャンに基づいてスケーリングマトリクスの要素を予測符号化する方法を記述している。つまり、スケーリングマトリクス内で閉じた予測符号化を利用している。以下、スケーリングマトリクス内予測符号化と呼ぶ。 7.3.2.1.1.1 1Scaling list syntax of Non-Patent Document 1 describes a method for predictively encoding elements of a scaling matrix based on a zigzag scan in order to reduce the code amount of each square scaling matrix in SPS and PPS. ing. That is, predictive coding closed in the scaling matrix is used. Hereinafter, this is referred to as intra-scaling matrix predictive coding.
 図1に示す従来技術の映像符号化装置は、予測器101 、周波数変換器102 、量子化器103 、エントロピー符号化器104 、逆量子化/逆周波数変換器105 、バッファ106 、スケーリングマトリクス内予測符号化器107 によって構成される。 1 includes a predictor 101, a frequency converter 102, a quantizer 103, an entropy encoder 104, an inverse quantization / inverse frequency converter 105, a buffer 106, and intra-scaling matrix prediction. The encoder 107 is configured.
 従来技術の映像符号化装置においては、予測器101 が生成した予測信号(予測ブロック信号)を入力信号(入力ブロック信号)から減じた、残差信号(残差ブロック信号)を周波数変換器102 によって残差周波数変換係数を得る。 In the video encoding device of the prior art, the residual signal (residual block signal) obtained by subtracting the prediction signal (predicted block signal) generated by the predictor 101 か ら from the input signal (input block signal) is output by the frequency converter 102. Obtain the residual frequency transform coefficient.
 さらに、量子化器103 は、外部設定されるスケーリングマトリクスを用いて残差周波数変換係数を量子化して残差レベルを得る。 Furthermore, the quantizer 103 quantizes the residual frequency transform coefficient using an externally set scaling matrix to obtain a residual level.
 エントロピー符号化器104 は、残差レベルをエントロピー符号化して、ビットストリームを出力する。 The entropy encoder 104 performs entropy encoding on the residual level and outputs a bit stream.
 以後の入力信号の予測のために、残差レベルを逆量子化/逆周波数変換器105 を介して再構築残差信号(再構築残差ブロック信号)に変換し、予測信号を加えて再構築信号(再構築ブロック信号)としてバッファ106 格納する。 For the subsequent prediction of the input signal, the residual level is converted into a reconstructed residual signal (reconstructed residual block signal) via the inverse quantization / inverse frequency converter 105, and reconstructed by adding the prediction signal. The buffer 106 is stored as a signal (reconstructed block signal).
 スケーリングマトリクス内予測符号化器107 は、スケーリングマトリクスをスケーリングマトリクス内予測符号化する。スケーリングマトリクス内予測符号化器107 は、スケーリングマトリクスの各要素の予測誤差をエントロピー符号化器104 に供給する。 The intra-scaling matrix prediction encoder 107 performs intra-scaling matrix prediction encoding. The intra-scaling matrix prediction encoder 107 supplies the prediction error of each element of the scaling matrix to the entropy encoder 104.
 ところで、非特許文献2は、正方形周波数変換ブロックに加えて、2×8、8×2、4×16、16×4、8×32、32×8などの非正方形周波数変換ブロックを用いる映像符号化方法を開示している。なお、4分木をサポ-トする特許文献2では、非正方形周波数変換を非正方4分木周波数変換と呼んでいる。 By the way, Non-Patent Document 2 describes a video code that uses non-square frequency transform blocks such as 2 × 8, 8 × 2, 4 × 16, 16 × 4, 8 × 32, and 32 × 8 in addition to square frequency transform blocks. Is disclosed. In Patent Document 2 that supports quadtrees, non-square frequency conversion is called non-square quadtree frequency conversion.
 非特許文献1と非特許文献2の組み合わせを考えると、正方形周波数変換ブロックと同様に、非正方形周波数変換ブロックについても、イントラ予測/インター予測、および、輝度(Y)成分と色差(UおよびV)成分ごとにスケーリングマトリクスを設定することが考えられる。 Considering the combination of Non-Patent Document 1 and Non-Patent Document 2, similar to the square frequency transform block, the non-square frequency transform block also includes intra prediction / inter prediction and luminance (Y) component and color difference (U and V). It is conceivable to set a scaling matrix for each component.
 すなわち、前記6つの4×4スケーリングマトリクスと2つの8×8スケーリングマトリクスに加えて、6つの2×8スケーリングマトリクス(イントラ予測/インター予測の2つと信号成分Y/U/Vの3つの組み合わせ)と、6つの8×2スケーリングマトリクス(イントラ予測/インター予測の2つと信号成分Y/U/Vの3つの組み合わせ)を設定できる。同様に、4×16、16×4、8×32、32×8のスケーリングマトリクスをそれぞれ6つずつ設定できる。 That is, in addition to the six 4 × 4 scaling matrices and the two 8 × 8 scaling matrices, six 2 × 8 scaling matrices (three combinations of intra prediction / inter prediction and signal component Y / U / V) And six 8 × 2 scaling matrices (two combinations of intra prediction / inter prediction and signal component Y / U / V) can be set. Similarly, six 4 × 16, 16 × 4, 8 × 32, and 32 × 8 scaling matrices can be set.
 図2は、2×8および8×2非正方形周波数変換ブロックの周波数成分とジグザグスキャンに基づくその伝送順を示す。図3は、2×8(2行8列)と8×2(8行2列)の非正方形スケーリングマトリクスのスケーリングマトリクス内予測符号化の様子を示す。図3から分かるように、前記スケーリングマトリクス内予測符号化を用いる限り、追加の2×8と8×2の非正方形スケーリングマトリクスの個数だけ、スケーリングマトリクスの符号量が増加することが分かる。 Figure 2 shows the frequency components of 2x8 and 8x2 non-square frequency transform blocks and their transmission order based on zigzag scan. FIG. 3 shows a state of intra-scaling matrix prediction encoding of 2 × 8 (2 rows and 8 columns) and 8 × 2 (8 rows and 2 columns) non-square scaling matrices. As can be seen from FIG. 3, as long as the intra-scaling matrix prediction encoding is used, the code amount of the scaling matrix increases by the number of additional 2 × 8 and 8 × 2 non-square scaling matrices.
 本発明は、非正方形スケーリングマトリクス間予測符号化によって、非正方形スケーリングマトリクスの符号量をより好適に削減することを目的とする。 An object of the present invention is to more suitably reduce the code amount of a non-square scaling matrix by non-square scaling matrix inter-prediction encoding.
 本発明による映像符号化装置は、非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを備える映像符号化装置であって、非正方形スケーリングマトリクス符号化手段は、非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化することを特徴とする。 A video encoding device according to the present invention is a video encoding device including non-square frequency conversion means and non-square scaling matrix encoding means, wherein the non-square scaling matrix encoding means converts the elements of the non-square scaling matrix. Predictive encoding is performed using elements of an encoded non-square scaling matrix.
 本発明による映像復号装置は、非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを備える映像復号装置であって、非正方形スケーリングマトリクス復号手段は、非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号することを特徴とする。 A video decoding device according to the present invention is a video decoding device comprising non-square inverse frequency conversion means and non-square scaling matrix decoding means, wherein the non-square scaling matrix decoding means has already decoded the elements of the non-square scaling matrix. Predictive decoding is performed using elements of a non-square scaling matrix.
 本発明による映像符号化方法は、非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを備える映像符号化装置で実行される映像符号化方法であって、非正方形スケーリングマトリクス符号化手段が、非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化することを特徴とする。 A video encoding method according to the present invention is a video encoding method executed by a video encoding device including non-square frequency conversion means and non-square scaling matrix encoding means, wherein the non-square scaling matrix encoding means includes The non-square scaling matrix elements are predictively encoded with the encoded non-square scaling matrix elements.
 本発明による映像復号方法は、非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを備える映像復号装置で実行される映像復号方法であって、非正方形スケーリングマトリクス復号手段が、非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号することを特徴とする。 A video decoding method according to the present invention is a video decoding method executed by a video decoding device including non-square inverse frequency conversion means and non-square scaling matrix decoding means, wherein the non-square scaling matrix decoding means includes non-square scaling. It is characterized by predictively decoding the elements of the matrix with the elements of the decoded non-square scaling matrix.
 本発明による映像符号化プログラムは、非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを実現するコンピュータに、非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化する処理を実行させることを特徴とする。 A video encoding program according to the present invention provides a computer that implements a non-square frequency conversion unit and a non-square scaling matrix encoding unit, and predicts a non-square scaling matrix element using an encoded non-square scaling matrix element. It is characterized in that the processing to be converted is executed.
 本発明による映像復号プログラムは、非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを実現するコンピュータに、非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号する処理を実行させることを特徴とする。 The video decoding program according to the present invention is a computer that realizes non-square inverse frequency conversion means and non-square scaling matrix decoding means, and performs processing for predictive decoding of non-square scaling matrix elements using decoded non-square scaling matrix elements. Is executed.
 非正方形スケーリングマトリクス間予測符号化によって、非正方形スケーリングマトリクスの符号量をより好適に削減できるようになる。 The code amount of the non-square scaling matrix can be more suitably reduced by the non-square scaling matrix inter-prediction encoding.
従来技術の映像符号化装置のブロック図である。It is a block diagram of the video coding apparatus of a prior art. 2×8および8×2非正方形周波数変換ブロックの周波数成分(番号は、ジグザグスキャンに基づく、各周波数成分の伝送順)を示す説明図である。It is explanatory drawing which shows the frequency component (a number is the transmission order of each frequency component based on a zigzag scan) of a 2 * 8 and 8 * 2 non-square frequency conversion block. 2×8と8×2の非正方形スケーリングマトリクスそれぞれのスケーリングマトリクス内予測符号化の様子を示す説明図である。It is explanatory drawing which shows the mode of the prediction encoding in a scaling matrix of each of 2 * 8 and 8 * 2 non-square scaling matrix. 伝送済みの2×8非正方形スケーリングマトリクスを用いて8×2の非正方形スケーリングマトリクスを予測符号化する様子を示す説明図である。It is explanatory drawing which shows a mode that an 8x2 non-square scaling matrix is predictively encoded using the transmitted 2x8 non-square scaling matrix. 第1の実施形態の映像符号化装置のブロック図である。It is a block diagram of the video coding apparatus of 1st Embodiment. 非正方形スケーリングマトリクス間予測符号化器の動作に着目したフローチャートである。It is the flowchart which paid its attention to operation | movement of the non-square scaling matrix prediction encoder. 第2の実施形態の映像復号装置のブロック図である。It is a block diagram of the video decoding apparatus of 2nd Embodiment. 非正方形スケーリングマトリクス間予測復号器206 の動作に着目したフローチャートである。It is the flowchart which paid its attention to operation | movement of the non-square scaling matrix prediction decoder 206. 本発明を利用した情報処理装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the information processing apparatus using this invention.
 本発明は、追加の2×8と8×2などの同じサイズの非正方形スケーリングマトリクス間の相関を利用して、初めに伝送する非正方形スケーリングマトリクスをスケーリングマトリクス内予測符号化し、後続して伝送する非正方形スケーリングマトリクスを、伝送済みの非正方形スケーリングマトリクスで予測符号化する。以下、非正方形スケーリングマトリクス間予測符号化と呼ぶ。図4は、伝送済みの2×8非正方形スケーリングマトリクスを用いて、8×2の非正方形スケーリングマトリクスを予測符号化する様子を示す。非正方形スケーリングマトリクス間予測符号化によって、非正方形スケーリングマトリクスの符号量をより好適に削減できるようになる。 The present invention takes advantage of the correlation between non-square scaling matrices of the same size, such as an additional 2 × 8 and 8 × 2, to encode the non-square scaling matrix to be transmitted first in the scaling matrix and subsequently transmit it The non-square scaling matrix is predictively encoded with the transmitted non-square scaling matrix. Hereinafter, it is referred to as non-square scaling matrix predictive coding. FIG. 4 shows how an 8 × 2 non-square scaling matrix is predictively encoded using the transmitted 2 × 8 non-square scaling matrix. With the non-square scaling matrix inter-prediction encoding, the code amount of the non-square scaling matrix can be more suitably reduced.
実施形態1.
 図5に示す本実施形態の映像符号化装置は、予測器101 、周波数変換器102 、量子化器103 、エントロピー符号化器104 、逆量子化/逆周波数変換器105 、バッファ106 、スケーリングマトリクス内予測符号化器107 および非正方形スケーリングマトリクス間予測符号化器108 を備える。映像符号化装置は、非正方形スケーリングマトリクス間で(転置によって)対応する各周波数成分を予測符号化する。
Embodiment 1. FIG.
The video encoding apparatus of the present embodiment shown in FIG. 5 includes a predictor 101, a frequency converter 102, a quantizer 103, an entropy encoder 104, an inverse quantization / inverse frequency converter 105, a buffer 106, and a scaling matrix. A predictive encoder 107 and a non-square scaling inter-matrix predictive encoder 108 are provided. The video encoding device predictively encodes each corresponding frequency component (by transposition) between non-square scaling matrices.
 本実施形態の映像符号化装置においては、予測器101 が生成した予測信号(予測ブロック信号)を入力信号(入力ブロック信号)から減じた、残差信号(残差ブロック信号)を周波数変換器102 によって残差周波数変換係数に変換する。周波数変換は、正方形周波数変換および非正方形周波数変換である。正方形周波数変換で得られた残差周波数変換係数を正方形残差周波数変換係数と呼ぶ。非正方形周波数変換で得られた残差周波数変換係数を非正方形残差周波数変換係数と呼ぶ。 In the video encoding apparatus of the present embodiment, the residual signal (residual block signal) obtained by subtracting the prediction signal (predicted block signal) generated by the predictor 101 from the input signal (input block signal) is converted into the frequency converter 102. Is converted into a residual frequency conversion coefficient. The frequency conversion is a square frequency conversion and a non-square frequency conversion. The residual frequency transform coefficient obtained by the square frequency transform is called a square residual frequency transform coefficient. The residual frequency transform coefficient obtained by the non-square frequency transform is called a non-square residual frequency transform coefficient.
 さらに、量子化器103 は、外部設定されるスケーリングマトリクスを用いて残差周波数変換係数を量子化して残差レベルを得る。正方形残差周波数変換係数に対しては正方形スケーリングマトリクスを用いて正方形残差レベルを得る。非正方形残差周波数変換係数に対しては非正方形スケーリングマトリクスを用いて非正方形残差レベルを得る。 Furthermore, the quantizer 103 quantizes the residual frequency transform coefficient using an externally set scaling matrix to obtain a residual level. For a square residual frequency transform coefficient, a square residual level is obtained using a square scaling matrix. For non-square residual frequency transform coefficients, non-square residual levels are obtained using a non-square scaling matrix.
 エントロピー符号化器104 は、残差レベルをエントロピー符号化して、ビットストリームを出力する。 The entropy encoder 104 performs entropy encoding on the residual level and outputs a bit stream.
 以後の入力信号の予測のために、残差レベルを逆量子化/逆周波数変換器105 を介して再構築残差信号(再構築残差ブロック信号)に変換し、予測信号を加えて再構築信号(再構築ブロック信号)としてバッファ106 格納する。ただし、逆量子化/逆周波数変換器105 は、正方形残差レベルの逆量子化に正方形スケーリングマトリクスを用いる。また、非正方形残差レベルの逆量子化に非正方形スケーリングマトリクスを用いる。 For the subsequent prediction of the input signal, the residual level is converted into a reconstructed residual signal (reconstructed residual block signal) via the inverse quantization / inverse frequency converter 105, and reconstructed by adding the prediction signal. The buffer 106 is stored as a signal (reconstructed block signal). However, the inverse quantization / inverse frequency converter 105 uses a square scaling matrix for inverse quantization of the square residual level. A non-square scaling matrix is used for inverse quantization of non-square residual levels.
 スケーリングマトリクス内予測符号化器107 は、正方形スケーリングマトリクスをスケーリングマトリクス内予測符号化する。また、横長の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)をスケーリングマトリクス内予測符号化する。例えば、図2に示す2×8と8×2の非正方形スケーリングマトリクスであれば、(a)の非正方形スケーリングマトリクスをスケーリングマトリクス内予測符号化する。 The intra-scaling-matrix prediction encoder 107 encodes the square scaling matrix within the scaling matrix. Further, the horizontally long non-square scaling matrix (non-square scaling matrix 1) is subjected to intra-scaling matrix predictive coding. For example, in the case of the 2 × 8 and 8 × 2 non-square scaling matrix shown in FIG. 2, the non-square scaling matrix (a) is subjected to intra-scaling prediction encoding.
 例えば、イントラ予測ブロックに対する2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を以下の擬似コ-ドで表現すると、
Quant_intra_2×8[2][8] =
{
{ 6,10,13,16,18,23,25,27},
{18,23,25,27,29,31,33,36},
};
非正方形スケーリングマトリクス1内のジグザグスキャン順での直前の要素からの予測誤差、6(=6-0)、12(=18-6)、-8=(10-18), …, 9(=36-27)をエントロピー符号化器104 に供給する。
For example, if a 2 × 8 non-square scaling matrix (non-square scaling matrix 1) for an intra prediction block is represented by the following pseudo code:
Quant_intra_2 × 8 [2] [8] =
{
{6,10,13,16,18,23,25,27},
{18,23,25,27,29,31,33,36},
};
Prediction error from previous element in zigzag scan order in non-square scaling matrix 1, 6 (= 6-0), 12 (= 18-6), -8 = (10-18),…, 9 (= 36-27) are supplied to the entropy encoder 104.
 同様に、インター予測ブロックに対する2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を以下の擬似コ-ドで表現すると、 Similarly, if the 2 × 8 non-square scaling matrix (non-square scaling matrix 1) for the inter prediction block is represented by the following pseudo code:
Quant_inter_2×8[2][8] =
{
{ 9,13,15,17,19,21,22,24},
{19,21,22,24,25,27,28,30}
};
非正方形スケーリングマトリクス1内のジグザグスキャン順での直前の要素からの予測誤差、9(=9-0)、10(=19-9)、-6=(13-19), …, 6(=30-24)をエントロピー符号化器104 に供給する。
Quant_inter_2 × 8 [2] [8] =
{
{9,13,15,17,19,21,22,24},
{19,21,22,24,25,27,28,30}
};
Prediction error from previous element in zigzag scan order in non-square scaling matrix 1, 9 (= 9-0), 10 (= 19-9), -6 = (13-19),…, 6 (= 30-24) is supplied to the entropy encoder 104.
 続いて、非正方形スケーリングマトリクス間予測符号化器108 は、縦長の非正方形スケーリングマトリクスを非正方形スケーリングマトリクス間予測符号化する。 Subsequently, the non-square scaling matrix prediction encoder 108 す る performs a non-square scaling matrix prediction encoding on the vertically long non-square scaling matrix.
 例えば、イントラ予測ブロックに対する8×2の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)を以下の擬似コ-ドで表現すると、
Quant_intra_8×2[8][2] =
{
{ 6,18},
{10,23},
{13,25},
{16,27},
{18,29},
{23,31},
{25,33},
{27,36}
};
非正方形スケーリングマトリクス1の転置マトリクスの要素との予測誤差、0(=6-6)、0(=18-18)、0=(10-10), …, 0(=36-36)をエントロピー符号化器104 に供給する。
For example, if an 8 × 2 non-square scaling matrix (non-square scaling matrix 2) for an intra prediction block is represented by the following pseudo code:
Quant_intra_8 × 2 [8] [2] =
{
{6,18},
{10,23},
{13,25},
{16,27},
{18,29},
{23,31},
{25,33},
{27,36}
};
Prediction error with non-square scaling matrix 1 transpose matrix elements, 0 (= 6-6), 0 (= 18-18), 0 = (10-10), ..., 0 (= 36-36) entropy This is supplied to the encoder 104.
 同様に、インター予測ブロックに対する2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)を以下の擬似コ-ドで表現すると、
Quant_inter_8×2[8][2] =
{
{ 9,19},
{13,21},
{15,22},
{17,24},
{19,25},
{21,27},
{22,28},
{24,30},
};
非正方形スケーリングマトリクス1の転置マトリクスの要素との予測誤差、0(=9-9)、0(=19-19)、0=(13-13), …, 0(=30-30)をエントロピー符号化器104 に供給する。
Similarly, if the 2 × 8 non-square scaling matrix (non-square scaling matrix 2) for the inter prediction block is expressed by the following pseudo code:
Quant_inter_8 × 2 [8] [2] =
{
{9,19},
{13,21},
{15,22},
{17,24},
{19,25},
{21,27},
{22,28},
{24,30},
};
Prediction error with non-square scaling matrix 1 transpose matrix elements, 0 (= 9-9), 0 (= 19-19), 0 = (13-13),…, 0 (= 30-30) entropy This is supplied to the encoder 104.
 ここで、イントラ予測及びインター予測それぞれについて、2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を転置させたマトリクスが8×2の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)と一致することにより、予測誤差がすべて0となることに注意されたい。 Here, for each of intra prediction and inter prediction, a matrix obtained by transposing a 2 × 8 non-square scaling matrix (non-square scaling matrix 1) matches an 8 × 2 non-square scaling matrix (non-square scaling matrix 2). Note that the prediction errors are all zero.
 図6は、本発明の特徴である非正方形スケーリングマトリクス間予測符号化器108 の動作に着目したフローチャートである。 FIG. 6 is a flowchart focusing on the operation of the non-square scaling inter-matrix predictive encoder 108, which is a feature of the present invention.
 非正方形スケーリングマトリクス間予測符号化器108 は、ステップS101で、伝送済みの非正方形スケーリングマトリクス1を転置する。 The non-square scaling matrix inter-prediction encoder 108 予 測 transposes the transmitted non-square scaling matrix 1 in step S101.
 また、非正方形スケーリングマトリクス間予測符号化器108 は、ステップS102で、ステップS101で生成した転置マトリクスと非正方形スケーリングマトリクス2について、ジグザグスキャンに従って各要素の差分を計算する。 Further, in step S102, the non-square scaling matrix inter-prediction encoder 108 calculates the difference of each element according to the zigzag scan with respect to the transposed matrix generated in step S101 and the non-square scaling matrix 2.
実施形態2.
 図7に示す本実施形態の映像復号装置は、エントロピー復号器201 、逆量子化/逆周波数変換器202 、予測器203 、バッファ204 、スケーリングマトリクス内予測復号器205 、および非正方形スケーリングマトリクス間予測復号器206 を備える。
Embodiment 2. FIG.
The video decoding apparatus according to the present embodiment shown in FIG. 7 includes an entropy decoder 201, an inverse quantization / inverse frequency converter 202, a predictor 203, a buffer 204, an intra-scaling prediction decoder 205, and a non-square scaling matrix prediction. A decoder 206 is provided.
 エントロピー復号器201 は、ビットストリームをエントロピー復号し、各スケーリングマトリクスの各要素の予測誤差、および、残差レベルをエントロピー復号する。正方形スケーリングマトリクスと横長の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)の予測誤差は、スケーリングマトリクス内予測復号器205 に供給される。縦長の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)の予測誤差は、非正方形スケーリングマトリクス間予測復号器206 に供給される。 The entropy decoder 201 entropy-decodes the bitstream, and entropy-decodes the prediction error and residual level of each element of each scaling matrix. The prediction errors of the square scaling matrix and the horizontally long non-square scaling matrix (non-square scaling matrix 1) are supplied to the intra-scaling matrix prediction decoder 205. The prediction error of the vertically long non-square scaling matrix (non-square scaling matrix 2) is supplied to a non-square scaling matrix prediction decoder 206.
 スケーリングマトリクス内予測復号器205 は、正方形スケーリングマトリクスと横長の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)それぞれの予測誤差をスケーリングマトリクス内予測復号する。 The intra-scaling matrix prediction decoder 205 predictively decodes the prediction errors of the square scaling matrix and the horizontally long non-square scaling matrix (non-square scaling matrix 1).
 スケーリングマトリクス内予測復号器205 は、スケーリングマトリクス内予測復号した正方形スケーリングマトリクスおよび非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を逆量子化/逆周波数変換器202 に供給する。また、非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を非正方形スケーリングマトリクス間予測復号器206 に供給する。 The intra-scaling matrix prediction decoder 205 supplies the square scaling matrix and the non-square scaling matrix (non-square scaling matrix 1) subjected to the intra-scaling matrix prediction decoding to the inverse quantization / inverse frequency converter 202. The non-square scaling matrix (non-square scaling matrix 1) is supplied to the non-square scaling matrix inter-prediction decoder 206.
 非正方形スケーリングマトリクス間予測復号器206 は、縦長の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)の予測誤差を非正方形スケーリングマトリクス間予測復号する。例えば、スケーリングマトリクス内予測復号器205 にて復号済みのイントラ予測ブロックに対する2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を以下の擬似コ-ドで表現すると、
Quant_intra_2×8[2][8] =
{
{ 6,10,13,16,18,23,25,27},
{18,23,25,27,29,31,33,36},
};
8×2の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)のジグザグスキャン順の予測誤差、0、0、0, …, 0を、非正方形スケーリングマトリクス1の転置マトリクスのジグザグスキャン順の要素に加えることによって、非正方形スケーリングマトリクス2
Quant_intra_8×2[8][2] =
{
{ 6,18},
{10,23},
{13,25},
{16,27},
{18,29},
{23,31},
{25,33},
{27,36}
};
を計算する。
The non-square scaling matrix prediction decoder 206 predicts and decodes the prediction error of the vertically long non-square scaling matrix (non-square scaling matrix 2). For example, when a 2 × 8 non-square scaling matrix (non-square scaling matrix 1) for an intra prediction block decoded by the scaling matrix intra prediction decoder 205 is expressed by the following pseudo code:
Quant_intra_2 × 8 [2] [8] =
{
{6,10,13,16,18,23,25,27},
{18,23,25,27,29,31,33,36},
};
Add 8x2 non-square scaling matrix (non-square scaling matrix 2) zigzag scan order prediction error, 0, 0, 0, ..., 0 to zigzag scan order element of non-square scaling matrix 1 transpose matrix The non-square scaling matrix 2
Quant_intra_8 × 2 [8] [2] =
{
{6,18},
{10,23},
{13,25},
{16,27},
{18,29},
{23,31},
{25,33},
{27,36}
};
Calculate
 同様に、スケーリングマトリクス内予測復号器205 は、復号済みのインター予測ブロックに対する2×8の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス1)を以下の擬似コ-ドで表現すると、
Quant_inter_2×8[2][8] =
{
{ 9,13,15,17,19,21,22,24},
{19,21,22,24,25,27,28,30}
};
8×2の非正方形スケーリングマトリクス(非正方形スケーリングマトリクス2)のジグザグスキャン順の予測誤差、0、0、0, …, 0を、非正方形スケーリングマトリクス1の転置マトリクスのジグザグスキャン順の要素に加えることによって、非正方形スケーリングマトリクス2
Quant_inter_8×2[8][2] =
{
{ 9,19},
{13,21},
{15,22},
{17,24},
{19,25},
{21,27},
{22,28},
{24,30},
};
を計算する。
Similarly, the intra-scaling matrix prediction decoder 205 expresses a 2 × 8 non-square scaling matrix (non-square scaling matrix 1) for the decoded inter prediction block by the following pseudo code:
Quant_inter_2 × 8 [2] [8] =
{
{9,13,15,17,19,21,22,24},
{19,21,22,24,25,27,28,30}
};
Add 8x2 non-square scaling matrix (non-square scaling matrix 2) zigzag scan order prediction error, 0, 0, 0, ..., 0 to zigzag scan order element of non-square scaling matrix 1 transpose matrix The non-square scaling matrix 2
Quant_inter_8 × 2 [8] [2] =
{
{9,19},
{13,21},
{15,22},
{17,24},
{19,25},
{21,27},
{22,28},
{24,30},
};
Calculate
 逆量子化/逆周波数変換器202 は、供給される残差レベルを逆量子化/逆周波数変換して、再構築残差信号を出力する。前記再構築残差信号は、予測器203 から供給される予測信号が加えられて、再構築信号としてバッファ204 に格納される。 The inverse quantization / inverse frequency converter 202 performs inverse quantization / inverse frequency conversion on the supplied residual level and outputs a reconstructed residual signal. The reconstructed residual signal is added with the prediction signal supplied from the predictor 203 and stored in the buffer 204 as a reconstructed signal.
 ただし、逆量子化/逆周波数変換器202 は、正方形残差レベルに対しては、正方形スケーリングマトリクスを用いて再構築残差信号を計算する。非残差レベルに対しては非正方形スケーリングマトリクスを用いて再構築残差信号を計算する。 However, the inverse quantization / inverse frequency converter 202 calculates the reconstructed residual signal using the square scaling matrix for the square residual level. For non-residual levels, a reconstructed residual signal is calculated using a non-square scaling matrix.
 図8は、本発明の特徴である非正方形スケーリングマトリクス間予測復号器206 の動作に着目したフローチャートである。 FIG. 8 is a flowchart focusing on the operation of the non-square scaling inter-matrix prediction decoder 206, which is a feature of the present invention.
 非正方形スケーリングマトリクス間予測復号器206 は、ステップS201で、復号済みの非正方形スケーリングマトリクス1を転置する。 The non-square scaling matrix inter-prediction decoder 206 transposes the decoded non-square scaling matrix 1 in step S201.
 また、ステップS202で、非正方形スケーリングマトリクス2の予測誤差とステップS201で生成した転置マトリクスに基づいて、ジグザグスキャンに従って非正方形スケーリングマトリクス2の各要素を計算する。 In step S202, each element of the non-square scaling matrix 2 is calculated according to the zigzag scan based on the prediction error of the non-square scaling matrix 2 and the transposed matrix generated in step S201.
 以上で、本実施形態の発明の映像復号装置の動作説明を終了する。 This is the end of the description of the operation of the video decoding apparatus according to the present embodiment.
実施形態3.
 上述した実施形態においては、2×8と8×2の非正方系スケーリングマトリクスの符号化と復号を示した。同様の符号化と復号が、4×16と16×4、および、8×32と32×8の非正方系スケーリングマトリクスにも当然適用できる。
Embodiment 3. FIG.
In the above-described embodiment, encoding and decoding of 2 × 8 and 8 × 2 non-square scaling matrices are shown. Similar encoding and decoding can naturally be applied to non-square scaling matrices of 4 × 16 and 16 × 4 and 8 × 32 and 32 × 8.
 上述した実施形態においては、横長の非正方系スケーリングマトリクスをスケーリングマトリクス内予測、縦長の非正方系スケーリングマトリクスを非正方形スケーリングマトリクス間予測した。縦長の非正方系スケーリングマトリクスをスケーリングマトリクス内予測、横長の非正方形スケーリングマトリクスを非正方形スケーリングマトリクス間予測してもよい。 In the above-described embodiment, the horizontally long non-square scaling matrix is predicted within the scaling matrix, and the vertically long non-square scaling matrix is predicted between the non-square scaling matrices. A vertically long non-square scaling matrix may be predicted within a scaling matrix, and a horizontally long non-square scaling matrix may be predicted between non-square scaling matrices.
 上述した実施形態においては、後続して符号化/復号する非正方形スケーリングマトリクス2を常に非正方形スケーリングマトリクス間予測した。非正方系スケーリングマトリクス間の相関が低い場合には、非正方形スケーリングマトリクス2に対してもスケーリングマトリクス内予測を適用してもよい。そのような実施形態においては、映像符号化装置は、非正方形スケーリングマトリクス2に対してスケーリングマトリクス内予測と非正方形スケーリングマトリクス間予測のどちらかを適用したかの補助情報をビットストリームに埋め込めばよい。映像復号装置は、前記補助情報に基づいて、非正方形スケーリングマトリクス2に対してスケーリングマトリクス内予測あるいは非正方形スケーリングマトリクス間予測に基づく復号をすればよい。 In the embodiment described above, the non-square scaling matrix 2 to be encoded / decoded subsequently is always predicted between non-square scaling matrices. When the correlation between non-square scaling matrices is low, intra-scaling matrix prediction may be applied to the non-square scaling matrix 2 as well. In such an embodiment, the video encoding device may embed auxiliary information on whether non-square scaling matrix 2 or intra-scaling matrix prediction or non-square scaling matrix prediction is applied to the bit stream. . The video decoding device may perform decoding based on intra-scaling matrix prediction or non-square scaling matrix prediction on the non-square scaling matrix 2 based on the auxiliary information.
 上述した実施形態においては、後続して符号化/復号する非正方形スケーリングマトリクス2を非正方形スケーリングマトリクス間予測し、その要素の予測誤差をすべて伝送した。非正方形スケーリングマトリクス1の転置と非正方形スケーリングマトリクス2が完全一致する場合には、予測誤差を伝送する代わりに、映像符号化装置は、非正方形スケーリングマトリクス1と非正方形スケーリングマトリクス2とが転置関係にあることを示す補助情報をビットストリームに埋め込めばよい。映像復号装置は、前記補助情報に基づいて、非正方形スケーリングマトリクス2を、非正方形スケーリングマトリクス1の転置(に0を加えた)結果とすればよい。 In the embodiment described above, the non-square scaling matrix 2 to be encoded / decoded subsequently is predicted between non-square scaling matrices, and all the prediction errors of the elements are transmitted. When the transposition of the non-square scaling matrix 1 and the non-square scaling matrix 2 completely match, instead of transmitting a prediction error, the video encoding apparatus transposes the non-square scaling matrix 1 and the non-square scaling matrix 2 It is only necessary to embed auxiliary information indicating that the data is in the bitstream. The video decoding device may use the non-square scaling matrix 2 as a result of transposing (adding 0 to) the non-square scaling matrix 1 based on the auxiliary information.
 さらには上述した発明の実施形態においては、上述した説明からも明らかなように、ハ-ドウェアで構成することも可能であるが、コンピュ-タプログラムにより実現することも可能である。 Furthermore, in the embodiment of the invention described above, as is apparent from the above description, it can be configured by hardware, but can also be realized by a computer program.
 図9に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。 The information processing system shown in FIG. 9 includes a processor 1001, a program memory 1002, a storage medium 1003 for storing video data, and a storage medium 1004 for storing a bitstream. The storage medium 1003 and the storage medium 1004 may be separate storage media, or may be storage areas composed of the same storage medium. A magnetic storage medium such as a hard disk can be used as the storage medium.
 図9に示す情報処理システムにおいて、プログラムメモリ1002には、図5,図7のそれぞれに示す各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図5,図7のそれぞれに示す映像符号化装置または映像復号装置の機能を実現する。 In the information processing system shown in FIG. 9, the program memory 1002 stores a program for realizing the function of each block shown in FIG. 5 and FIG. The processor 1001 implements the functions of the video encoding device or the video decoding device shown in FIGS. 5 and 7 by executing processing according to the program stored in the program memory 1002.
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 As mentioned above, although this invention was demonstrated with reference to embodiment and an Example, this invention is not limited to the said embodiment and Example. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
 この出願は、2011年11月1日に出願された日本特許出願2011-240539を基礎とする優先権を主張し、その開示の全てをここに取り込む。 This application claims priority based on Japanese Patent Application No. 2011-240539 filed on November 1, 2011, the entire disclosure of which is incorporated herein.
 本発明は、非正方4分木周波数変換ブロックに対する量子化処理および逆量子化処理においてスケーリングマトリクスを用いる映像符号化装置や映像復号装置などに好適に適用可能である。 The present invention can be suitably applied to a video encoding device, a video decoding device, or the like that uses a scaling matrix in quantization processing and inverse quantization processing for a non-square quadtree frequency transform block.
 101 予測器
 102 周波数変換器
 103 量子化器
 104 エントロピー符号化器
 105 逆量子化/逆周波数変換器
 106 バッファ
 107 スケーリングマトリクス内予測符号化器
 108 非正方形スケーリングマトリクス間予測符号化器
 201 エントロピー復号器
 202 逆量子化/逆周波数変換器
 203 予測器
 204 バッファ
 205 スケーリングマトリクス内予測復号器
 206 非正方形スケーリングマトリクス間予測復号器
101 Predictor 102 Frequency converter 103 Quantizer 104 Entropy encoder 105 Inverse quantization / inverse frequency converter 106 Buffer 107 Intra-scaling matrix prediction encoder 108 Non-square scaling inter-matrix prediction encoder 201 Entropy decoder 202 Inverse quantization / inverse frequency converter 203 Predictor 204 Buffer 205 Intra-scaling matrix prediction decoder 206 Non-square scaling inter-matrix prediction decoder

Claims (8)

  1.  非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを備える映像符号化装置であって、
     前記非正方形スケーリングマトリクス符号化手段は、非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化する
     ことを特徴とする映像符号化装置。
    A video encoding device comprising non-square frequency conversion means and non-square scaling matrix encoding means,
    The non-square scaling matrix encoding means predictively encodes the elements of the non-square scaling matrix with the elements of the encoded non-square scaling matrix.
  2.  前記非正方形スケーリングマトリクス符号化手段は、非正方形スケーリングマトリクスと符号化済みの非正方形スケーリングマトリクスの転置マトリクスとについて各要素の差分を計算する
     請求項1記載の映像符号化装置。
    The video encoding device according to claim 1, wherein the non-square scaling matrix encoding unit calculates a difference between each element for a non-square scaling matrix and a transposed matrix of the encoded non-square scaling matrix.
  3.  非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを備える映像復号装置であって、
     前記非正方形スケーリングマトリクス復号手段は、非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号する
     ことを特徴とする映像復号装置。
    A video decoding device comprising non-square inverse frequency conversion means and non-square scaling matrix decoding means,
    The non-square scaling matrix decoding means predictively decodes the elements of the non-square scaling matrix with the elements of the decoded non-square scaling matrix.
  4.  前記非正方形スケーリングマトリクス復号手段は、復号済の非正方形スケーリングマトリクスの転置マトリクスと非正方形スケーリングマトリクスとに基づいて当該非正方形スケーリングマトリクスの要素を計算する
     請求項3記載の映像復号装置。
    The video decoding device according to claim 3, wherein the non-square scaling matrix decoding means calculates elements of the non-square scaling matrix based on a transposed matrix and a non-square scaling matrix of the decoded non-square scaling matrix.
  5.  非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを備える映像符号化装置で実行される映像符号化方法であって、
     前記非正方形スケーリングマトリクス符号化手段が、非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化する
     ことを特徴とする映像符号化方法。
    A video encoding method executed by a video encoding device including non-square frequency conversion means and non-square scaling matrix encoding means,
    The video encoding method, wherein the non-square scaling matrix encoding means predictively encodes the elements of the non-square scaling matrix with the elements of the encoded non-square scaling matrix.
  6.  非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを備える映像復号装置で実行される映像復号方法であって、
     前記非正方形スケーリングマトリクス復号手段が、非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号する
     ことを特徴とする映像復号方法。
    A video decoding method executed by a video decoding device comprising non-square inverse frequency conversion means and non-square scaling matrix decoding means,
    The video decoding method, wherein the non-square scaling matrix decoding means predictively decodes the elements of the non-square scaling matrix with the elements of the decoded non-square scaling matrix.
  7.  非正方形周波数変換手段と、非正方形スケーリングマトリクス符号化手段とを実現するコンピュータに、
     非正方形スケーリングマトリクスの要素を符号化済みの非正方形スケーリングマトリクスの要素で予測符号化する処理を実行させるための映像符号化プログラム。
    A computer that implements non-square frequency conversion means and non-square scaling matrix encoding means,
    A video encoding program for executing a process of predictively encoding non-square scaling matrix elements with encoded non-square scaling matrix elements.
  8.  非正方形逆周波数変換手段と、非正方形スケーリングマトリクス復号手段とを実現するコンピュータに、
     非正方形スケーリングマトリクスの要素を復号済みの非正方形スケーリングマトリクスの要素で予測復号する処理を実行させるための映像復号プログラム。
    A computer that implements non-square inverse frequency conversion means and non-square scaling matrix decoding means,
    A video decoding program for executing a process of predictive decoding an element of a non-square scaling matrix with an element of a decoded non-square scaling matrix.
PCT/JP2012/006812 2011-11-01 2012-10-24 Video encoding device, video decoding device, video encoding method, video decoding method, and program WO2013065259A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-240539 2011-11-01
JP2011240539 2011-11-01

Publications (1)

Publication Number Publication Date
WO2013065259A1 true WO2013065259A1 (en) 2013-05-10

Family

ID=48191637

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/006812 WO2013065259A1 (en) 2011-11-01 2012-10-24 Video encoding device, video decoding device, video encoding method, video decoding method, and program

Country Status (1)

Country Link
WO (1) WO2013065259A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020003740A1 (en) * 2018-06-29 2020-01-02 キヤノン株式会社 Image coding device, image decoding device, control methods therefor, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011052215A1 (en) * 2009-10-30 2011-05-05 パナソニック株式会社 Decoding method, decoder apparatus, encoding method, and encoder apparatus
WO2012160890A1 (en) * 2011-05-20 2012-11-29 ソニー株式会社 Image processing device and image processing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011052215A1 (en) * 2009-10-30 2011-05-05 パナソニック株式会社 Decoding method, decoder apparatus, encoding method, and encoder apparatus
WO2012160890A1 (en) * 2011-05-20 2012-11-29 ソニー株式会社 Image processing device and image processing method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNICHI TANAKA ET AL.: "Quantization Matrix for HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 5TH MEETING, 16 March 2011 (2011-03-16), GENEVA, CH *
XIAORAN CAO ET AL.: "CE6.bl Report on Short Distance Intra Prediction Method", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 5TH MEETING, 16 March 2011 (2011-03-16), GENEVA *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020003740A1 (en) * 2018-06-29 2020-01-02 キヤノン株式会社 Image coding device, image decoding device, control methods therefor, and program

Similar Documents

Publication Publication Date Title
KR101894971B1 (en) Methods of determination for chroma quantization parameter and apparatuses for using the same
JP6491691B2 (en) Method and apparatus for improved entropy encoding and decoding
KR101366249B1 (en) Scalable video encoding apparatus and method and scalable video decoding apparatus and method
JP6497423B2 (en) Video decoding apparatus, video decoding method, and program
US20160323581A1 (en) Method and Apparatus for Scaling Parameter Coding for Inter-Component Residual Prediction
JP6376130B2 (en) Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and program
JPWO2018123313A1 (en) Video encoding method, video decoding method, video encoding device, video decoding device, and program
JPWO2012070232A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and program
KR20080064008A (en) Method of deciding on coding for coefficients of residual block, apparatus, encoder and decoder
KR102284107B1 (en) Method and apparatus for generating parameter set to encode/decode image
KR101377529B1 (en) Video Coding and Decoding Method and Apparatus Using Adaptive Motion Vector Coding/Encoding
JP5707261B2 (en) Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program
WO2013065259A1 (en) Video encoding device, video decoding device, video encoding method, video decoding method, and program
WO2022130663A1 (en) Decoding device, program, and decoding method
WO2018123312A1 (en) Image encoding method, image decoding method, image encoding device, image decoding device and program
KR20170113724A (en) Cabac encoding method and apparatus using adaptive initialization for context model, and cabac decoding method and apparatus
US20140307779A1 (en) Video encoding device, video decoding device, video encoding method, video decoding method, and program
WO2013161194A1 (en) Video coding device, video coding method, and program
JP5592779B2 (en) Image encoding method, image decoding method, image encoding device, and image decoding device
KR20140048805A (en) Method of inter-layer prediction for multiple layer video and apparatus thereof
WO2013065258A1 (en) Video encoding device, video decoding device, video encoding method, video decoding method, and program
KR20130078321A (en) Method and device for near-lossless encoding of depth image
KR20180040827A (en) Video coding method and apparatus using grouped coding uinit syntax

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12845016

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12845016

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP