WO2013069269A1 - Video encoding device, video encoding method, video encoding program, transmission device, transmission method, transmission program, video decoding device, video decoding method, video decoding program, reception device, reception method, and reception program - Google Patents
Video encoding device, video encoding method, video encoding program, transmission device, transmission method, transmission program, video decoding device, video decoding method, video decoding program, reception device, reception method, and reception program Download PDFInfo
- Publication number
- WO2013069269A1 WO2013069269A1 PCT/JP2012/007130 JP2012007130W WO2013069269A1 WO 2013069269 A1 WO2013069269 A1 WO 2013069269A1 JP 2012007130 W JP2012007130 W JP 2012007130W WO 2013069269 A1 WO2013069269 A1 WO 2013069269A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- prediction
- motion information
- candidate
- block
- candidate list
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Definitions
- the present invention relates to a moving image encoding and decoding technique using motion compensated prediction, and more particularly to a moving image encoding and decoding technique for encoding and decoding motion information used in motion compensated prediction.
- motion compensation prediction is used.
- the motion compensated prediction is performed by dividing the target image into fine blocks, using the decoded image as a reference image, and moving from the processing target block of the target image to the reference block of the reference image based on the amount of motion indicated by the motion vector. This is a technique for generating a signal as a prediction signal.
- a motion vector of an encoded block adjacent to the processing target block is set as a prediction motion vector (also simply referred to as “prediction vector”), and a difference between the motion vector of the processing target block and the prediction vector is obtained.
- the compression efficiency is improved by transmitting the vector as an encoded vector.
- MPEG-4 AVC MPEG-4 AVC / H.
- MPEG-4 AVC moving picture compression coding such as H.264 (hereinafter referred to as MPEG-4 AVC)
- motion compensation prediction with high accuracy is made possible by making the block size for motion compensation prediction fine and diverse.
- the code amount of the encoded vector is increased by reducing the block size.
- Temporal direct motion compensated prediction is used to achieve motion compensated prediction without transmission.
- Patent Document 1 paying attention to the continuity of motion in the spatial direction, the encoded vector is transmitted using the motion vector of the processed block adjacent to the processing target block as the motion vector of the processing target block.
- a method for realizing motion compensated prediction without the need is disclosed.
- the present invention has been made in view of such circumstances, and an object of the present invention is to provide a moving image encoding and decoding technique capable of realizing motion compensation prediction with high efficiency without transmitting an encoding vector. is there.
- a moving picture coding apparatus divides a coded block into one or a plurality of prediction blocks based on a division type and performs motion compensation prediction to code a moving picture.
- a candidate derivation unit (140) that uses the motion information of the selected encoded prediction block as a selection candidate, the division type of the prediction block to be encoded, and the code of the prediction block to be encoded
- the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be encoded is not set as the selection candidate based on the position in the encoding block.
- a candidate list generation unit (140) for generating a candidate list including the selection candidates, motion information in one prediction direction of selection candidates included in the candidate list, and included in the candidate list
- An additional unit (140) that generates a new selection candidate for bi-prediction by combining with motion information in the other prediction direction of the other selection candidates and adds the selection candidate to the candidate list, and the prediction block to be encoded from the candidate list
- a determination unit (141) for determining motion information used for the motion compensation prediction of the first and second encodings
- an encoding unit (104) for encoding information for specifying the determined motion information in the candidate list.
- This apparatus is a moving picture encoding apparatus that performs motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type, and includes a division type of a prediction block to be encoded and the code Based on the position of the prediction block to be encoded in the encoded block, the first motion information group consisting of motion information of a plurality of encoded adjacent blocks adjacent to the prediction block to be encoded
- a recessive joint motion information candidate determination unit (166) that selects a recessive joint motion information candidate capable of motion compensation prediction with a prediction block having a size larger than the size of the prediction block to be encoded, and the first Combining combined motion information candidates for use in the prediction block to be encoded using the second motion information group obtained by removing the recessive combined motion information candidates from the motion information group
- Still another aspect of the present invention is a video encoding method.
- This method is a moving picture coding method for coding a moving picture by performing motion compensation prediction by dividing a coding block into one or a plurality of prediction blocks based on a division type, and a prediction block to be coded Is selected from the plurality of prediction blocks adjacent to the encoded prediction block for which the motion information including the motion vector information and the reference image information is valid, and the motion information of the selected encoded prediction block is selected.
- Still another aspect of the present invention is a transmission device.
- This apparatus packetizes an encoded stream encoded by a moving image encoding method that encodes a moving image by performing motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type.
- a packet processing unit that obtains encoded data and a transmission unit that transmits the packetized encoded data.
- the moving image encoding method selects an encoded prediction block in which motion information including motion vector information and reference image information is valid from a plurality of prediction blocks adjacent to a prediction block to be encoded.
- Still another aspect of the present invention is a transmission method.
- an encoded stream encoded by a moving image encoding method that performs motion compensated prediction and encodes a moving image by dividing an encoded block into one or a plurality of prediction blocks based on a division type is packetized.
- the moving image encoding method selects an encoded prediction block in which motion information including motion vector information and reference image information is valid from a plurality of prediction blocks adjacent to a prediction block to be encoded.
- a moving picture decoding apparatus is a moving picture decoding apparatus that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type, and decodes a coded stream of the moving picture.
- a decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be decoded, and the selected decoded block Based on the candidate derivation unit (230) that selects the motion information of the prediction block as a selection candidate, the division type of the prediction block to be decoded, and the position of the prediction block to be decoded in the decoding block
- the invalidation unit (230) that does not select motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block as the selection candidate, and the selection
- An addition unit (230) that generates a new bi-predictive selection candidate in combination with the motion information and adds it to the candidate list; a code string analysis unit (201) that decodes information indicating a position in the
- This apparatus is a moving picture decoding apparatus that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type, and for specifying a combined motion information candidate in a combined motion information candidate list.
- a decoding unit (201) that decodes the candidate identification index from a code string that is encoded as a candidate identification index, a division type of a prediction block to be decoded, and a decoding block of the prediction block to be decoded in the decoding block Based on the position, a size larger than the size of the prediction block to be decoded is selected from the first motion information group including motion information of a plurality of decoded adjacent blocks adjacent to the prediction block to be decoded.
- Recessive combined motion information candidate determination that selects a recessive combined motion information candidate capable of motion compensation prediction with a prediction block (166) and the second motion information group obtained by removing the recessive combined motion information candidate from the first motion information group, and the combined motion information candidate combined motion to be used for the prediction block to be decoded
- a combined motion information selection unit (231) that selects one combined motion information candidate from the combined motion information candidate list based on a specific index and uses the selected motion information as motion information of the prediction block to be decoded;
- Still another aspect of the present invention is a moving picture decoding method.
- This method is a moving picture decoding method in which a decoded block is divided into one or a plurality of prediction blocks based on a division type, motion compensated prediction is performed, and a coded stream of a moving picture is decoded.
- Still another aspect of the present invention is a receiving device.
- This apparatus is a receiving apparatus that performs decoding processing by performing motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks in an encoded stream of a received moving image, and the encoded block based on a division type
- a receiving unit that receives encoded data in which an encoded stream of a moving image that is encoded by performing motion compensation prediction by dividing the image into one or a plurality of prediction blocks, and the received encoded data
- Motion information including motion vector information and reference image information is valid from a restoration unit that performs packet processing to restore the original encoded stream and a plurality of prediction blocks adjacent to the prediction block to be decoded.
- a candidate derivation unit (230) that selects motion information of the selected decoded prediction block as a selection candidate, and a prediction target to be decoded. Based on the block division type and the position of the prediction block to be decoded in the decoding block, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded is selected as the selection candidate.
- Still another aspect of the present invention is a receiving method.
- This method is a receiving method of performing decoding processing by performing motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks in an encoded stream of a received moving image, and the encoded block based on the division type
- Motion information including motion vector information and reference image information from a plurality of prediction blocks adjacent to the prediction block to be decoded and a decoding step that recovers the original encoded stream by packet processing has been decoded.
- a candidate derivation step in which motion information of the selected decoded prediction block is selected as a selection candidate, and the decoding The motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded is based on the division type of the prediction block of the elephant and the position of the prediction block to be decoded in the decoding block.
- An invalidation step that is not a selection candidate a candidate list generation step that generates a candidate list that includes the selection candidate, motion information in one prediction direction of the selection candidate that is included in the candidate list, and another that is included in the candidate list
- a decoding step for decoding the decoding target from the candidate list based on the information indicating the decoded position and the code string analyzing step for decoding from the encoded stream And a selection step of selecting the motion information used to lock the motion compensated prediction.
- motion compensation prediction can be realized with high efficiency without transmitting an encoded vector.
- FIGS. 1A and 1B are diagrams for explaining an encoded block.
- 2A to 2D are diagrams for explaining the prediction block size type. It is a figure explaining a prediction block size type. It is a figure explaining prediction coding mode. It is a figure explaining the relationship between a merge index and a code sequence. It is a figure explaining an example of the syntax of a prediction block.
- 1 is a diagram illustrating a configuration of a moving image encoding device according to Embodiment 1.
- FIG. It is a figure which shows the structure of the motion information generation part of FIG. It is a figure explaining the structure of the merge mode determination part of FIG.
- FIG. 10 is a flowchart illustrating an operation of a combined motion information candidate list generation unit in FIG. 9.
- FIGS. 14A to 14D are diagrams for explaining recessive combined motion information candidates. It is a flowchart explaining the determination process of a recessive joint motion information candidate.
- FIG. 10 is a diagram illustrating an example of an effect according to the first embodiment. It is a figure explaining another example of the effect by Embodiment 1.
- FIG. 10 is a flowchart explaining the determination process of a recessive joint motion information candidate.
- FIG. 10 is a diagram illustrating a configuration of a combined motion information candidate list generation unit according to the second embodiment.
- FIG. 10 is a diagram for explaining an operation of a combined motion information candidate list generation unit according to the second embodiment. It is a figure explaining operation
- FIG. It is a figure explaining a duplication joint motion information candidate.
- MPEG-4AVC International Telecommunication Union Telecommunication Standardization Sector
- a plurality of adjacent blocks and another decoded image block are used as a candidate block group, and one candidate block is selected from these candidate block groups, and information on the selected candidate block is encoded and decoded.
- a merge mode is being considered.
- the input image signal is divided into units of maximum encoding blocks, and the divided maximum encoding blocks are processed in a raster scan order.
- the encoded block has a hierarchical structure, and can be made smaller encoded blocks by sequentially equally dividing into 4 in consideration of the encoding efficiency. Note that the encoded blocks divided into four are encoded in the zigzag scan order. An encoded block that cannot be further reduced is called a minimum encoded block.
- An encoded block is a unit of encoding, and the maximum encoded block is also an encoded block when the number of divisions is zero. In this embodiment, the maximum coding block is 64 pixels ⁇ 64 pixels, and the minimum coding block is 8 pixels ⁇ 8 pixels.
- 1 (a) and 1 (b) are diagrams for explaining an encoded block.
- the encoded block is divided into ten.
- CU0, CU1 and CU9 are 32 ⁇ 32 pixel coding blocks
- CU2, CU3 and CU8 are 16 ⁇ 16 pixel coding blocks
- CU4, CU5, CU6 and CU7 are 8 ⁇ 8 pixel coding blocks. It has become.
- the encoded block is divided into one.
- the encoded block is further divided into prediction blocks.
- the encoded block is divided into one or more prediction blocks according to a prediction block size type (also referred to as “division type”).
- FIGS. 2A to 2D are diagrams for explaining the prediction block size type.
- 2 (a) is 2N ⁇ 2N that does not divide the encoded block
- FIG. 2 (b) is 2N ⁇ N that is horizontally divided
- FIG. 2 (c) is N ⁇ 2N that is vertically divided
- FIG. d) shows N ⁇ N which is divided into 4 parts horizontally and vertically.
- 2N ⁇ 2N is one prediction block
- 2N ⁇ N and N ⁇ 2N are two prediction blocks 0 and 1
- N ⁇ N is four prediction blocks 0, prediction block 1, prediction block 2, and prediction It consists of block 3.
- FIG. 3 is a diagram for explaining the prediction block size according to the number of divisions of the encoded block and the prediction block size type.
- the prediction block size in the present embodiment is from 64 pixels ⁇ 64 pixels in which the number of CU divisions is 0 and the prediction block size type is 2N ⁇ 2N to 3 in the number of CU divisions, and the prediction block size type is N ⁇ N. There are 13 predicted block sizes up to 4 pixels x 4 pixels.
- the maximum encoding block is 64 pixels ⁇ 64 pixels and the minimum encoding block is 8 pixels ⁇ 8 pixels, but the present invention is not limited to this combination.
- the prediction block division patterns are shown in FIGS. 2A to 2D, the combination is not limited to this as long as it is a combination that is divided into one or more.
- FIG. 4 is a diagram for explaining the predictive coding mode.
- the prediction direction of motion compensation prediction is single prediction (L0 prediction) and the number of coding vectors is PredL0
- the prediction direction of motion compensation prediction is single prediction (L1 prediction).
- PredL1 in which the number of encoding vectors is 1
- PredBI in which the prediction direction of motion compensation prediction is bi-prediction (BI prediction) and the number of encoding vectors is 2
- the prediction direction in motion compensation prediction is single prediction
- merge mode MERGE
- BI prediction bi-prediction
- BI prediction bi-prediction
- BI prediction bi-prediction
- the prediction direction in motion compensation prediction is single prediction
- MERGE merge mode
- BI prediction bi-prediction
- Intra intra mode
- PredL0, PredL1, and PredBI are prediction vector modes.
- the prediction direction is any of L0 prediction / L1 prediction / BI prediction. This is because the prediction direction of the merge mode takes over the prediction direction of the candidate block selected from the candidate block group as it is, or is decoded information. This is because it is derived from In the merge mode, the encoded vector is not encoded. This is because the merge mode encoding vector inherits the motion vector of the candidate block selected from the candidate block group as it is or is derived from the decoded information.
- the reference image used in the motion compensation prediction is encoded as a reference image index together with the encoded vector.
- the reference image index used in motion compensation prediction is a numerical value of 0 or more. If the motion compensation prediction is uni-prediction, one reference index is used, and if the motion compensation prediction is bi-prediction, two reference indexes are used (FIG. 4).
- Reference index is not encoded in merge mode. This is because the reference index of the merge mode inherits the reference index of the candidate block selected from the candidate block group as it is or is derived from the decoded information.
- the reference index list includes a reference index list L0 and a reference index list L1.
- L0 prediction using a reference image in the reference index list L0 or L1 prediction using a reference image in the reference index list L1 is used.
- BI prediction using the reference index list L0 and the reference index list L1 is used.
- the maximum number of reference images that can be registered in each reference index list is 16.
- Merge index In the present embodiment, in the merge mode, a plurality of adjacent blocks in the processing target image and blocks around the same position as the processing target block in another encoded image are used as candidate block groups. A candidate block having the optimal predictive coding mode, motion vector, and reference index is selected from the block group, and a merge index for indicating the selected candidate block is encoded and decoded. Only one merge index is used in the merge mode (FIG. 4).
- the maximum number of merge indexes (also referred to as the maximum number of merge candidates) is 5, and the merge index is an integer from 0 to 4.
- the maximum number of merge indexes is set to 5, but it may be 2 or more, and is not limited to this.
- the motion information of the candidate block that is the target of the merge index is referred to as a combined motion information candidate, and the aggregate of combined motion information candidates is referred to as a combined motion information candidate list.
- the motion information includes a prediction direction, a motion vector, and a reference index.
- FIG. 5 is a diagram for explaining the relationship between the merge index and the code string.
- the code string when the merge index is 0 is '0'
- the code string when the merge index is 1 is '10'
- the code string when the merge index is 2 is '110'
- the code string when the merge index is 3 The code string when the column is “1110” and the merge index is 4 is “11110”, and the code string is set longer as the merge index becomes larger. Therefore, it is possible to improve the encoding efficiency by assigning a small merge index to a candidate block with a high selection rate.
- Predicted vector index In the present embodiment, in order to improve the accuracy of the prediction vector, a plurality of adjacent blocks and blocks around the same position as the processing target block of another encoded image are used as candidate block groups, and the candidate block group is used. A candidate block having an optimal motion vector is selected as a prediction vector, and a prediction vector index for indicating the selected candidate block is encoded and decoded. If the motion compensation prediction is uni-prediction, one prediction vector index is used, and if the motion compensation prediction is bi-prediction, two prediction vector indexes are used (FIG. 4). The maximum number of prediction vector indexes (also referred to as the maximum number of prediction vector candidates) is 2, and the prediction vector index is an integer of 0 or 1. Although the maximum number of prediction vector candidates is 2 here, it may be 2 or more, and is not limited to this.
- a motion vector of a candidate block that is a target of a prediction vector index is referred to as a prediction vector candidate
- a set of prediction vector candidates is referred to as a prediction vector candidate list.
- the prediction block (PU in FIG. 6) includes a merge flag (merge_flag), a merge index (merge_idx), an inter prediction type (inter_pred_type), a reference index for L0 prediction (ref_idx_10), a difference vector (mvd_10 [0]) for L0 prediction, mvd_l0 [1]), prediction vector index for L0 prediction (mvp_idx_l0), reference index for L1 prediction (ref_idx_l1), difference vector for L1 prediction (mvd_l1 [0], mvd_l1 [1]), and prediction vector index for L1 prediction ( mvp_idx_l1) is installed. [0] of the difference vector indicates a horizontal component and [1] indicates a vertical component.
- inter_pred_type indicates a prediction direction (also referred to as inter prediction type) of motion compensation prediction, and three types of Pred_L0 (uni prediction of L0 prediction), Pred_L1 (uni prediction of L1 prediction) and Pred_BI (bi prediction of BI prediction). There is.
- inter_pred_type is Pred_L0 or Pred_BI, information about L0 prediction is installed, and when inter_pred_type is Pred_L1 or Pred_BI, information about L1 prediction is installed.
- FIG. 7 shows the configuration of moving picture coding apparatus 100 according to the first embodiment.
- the moving image encoding apparatus 100 is an apparatus that encodes a moving image signal in units of prediction blocks for performing motion compensated prediction.
- the coding block division, the prediction block size type determination, the prediction block size and the position of the prediction block in the coding block (position information of the prediction block), and the determination whether the prediction coding mode is intra are not shown. It is assumed that it is determined by the higher-order coding control unit, and in the first embodiment, a case where the predictive coding mode is not intra will be described. In the first embodiment, a B picture corresponding to bi-prediction will be described, but L1 prediction may be omitted for a P picture not corresponding to bi-prediction.
- the moving picture encoding apparatus 100 is realized by hardware such as an information processing apparatus including a CPU (Central Processing Unit), a frame memory, a hard disk, and the like.
- the moving image encoding apparatus 100 realizes functional components described below by operating the above components. Note that the position information of the prediction block to be processed, the prediction block size, and the prediction direction of motion compensated prediction are assumed to be shared in the video encoding device 100 and are not shown.
- the moving image encoding apparatus 100 includes a prediction block image acquisition unit 101, a subtraction unit 102, a prediction error encoding unit 103, a code string generation unit 104, a prediction error decoding unit 105, a motion compensation unit 106, and an addition unit. 107, a motion vector detection unit 108, a motion information generation unit 109, a frame memory 110, and a motion information memory 111.
- the prediction block image acquisition unit 101 acquires the image signal of the prediction block to be processed from the image signal supplied from the terminal 10 based on the position information and the prediction block size of the prediction block, and subtracts the image signal of the prediction block 102, and supplied to the motion vector detection unit 108 and the motion information generation unit 109.
- the motion vector detection unit 108 obtains motion vectors and reference images of the L0 prediction and the L1 prediction from the image signal supplied from the prediction block image acquisition unit 101 and image signals corresponding to a plurality of reference images stored therein. Detect the reference index indicated.
- the motion vector of the L0 prediction and the L1 prediction and the reference index of the L0 prediction and the L1 prediction are supplied to the motion information generation unit 109.
- the motion vector detection unit 108 uses image signals corresponding to a plurality of reference images stored therein as reference images, but a reference image stored in the frame memory 110 can also be used.
- a general motion vector detection method calculates an error evaluation value for an image signal of a target image and a prediction signal of a reference image moved by a predetermined movement amount from the same position, and a movement amount that minimizes the error evaluation value.
- a motion vector is detected for each reference image, and a reference image having a minimum error evaluation value is selected.
- SAD Sud of Absolute Difference
- MSE Mel Square Error
- the motion information generation unit 109 indicates L0 prediction and L1 prediction motion vectors supplied from the motion vector detection unit 108, reference indexes for L0 prediction and L1 prediction, candidate block groups supplied from the motion information memory 111, and reference indexes.
- the prediction encoding mode is determined from the reference image in the frame memory 110 and the image signal supplied from the prediction block image acquisition unit 101.
- the merge flag, the merge index, the prediction direction of motion compensation prediction, the reference index of L0 prediction and L1 prediction, the difference vector of L0 prediction and L1 prediction, and the prediction vector of L0 prediction and L1 prediction is supplied to the code string generation unit 104 as necessary.
- the motion compensation prediction direction, the reference index of L0 prediction and L1 prediction, and the motion vector of L0 prediction and L1 prediction are supplied to the motion compensation unit 106 and the motion information memory 111. Details of the motion information generation unit 109 will be described later.
- the motion compensation unit 106 stores the frame compensation information in the frame memory 110 indicated by the LN prediction reference index supplied from the motion information generation unit 109.
- the reference image is motion-compensated based on the LN prediction motion vector supplied from the motion information generation unit 109 to generate a prediction signal for LN prediction.
- N is 0 or 1.
- the prediction direction of motion compensation prediction is bi-prediction, the average value of the prediction signals of L0 prediction and L1 prediction is the prediction signal. Note that the prediction signals of the L0 prediction and the L1 prediction may be weighted.
- the motion compensation unit 106 supplies the prediction signal to the subtraction unit 102.
- the subtraction unit 102 subtracts the image signal supplied from the prediction block image acquisition unit 101 and the prediction signal supplied from the motion compensation unit 106 to calculate a prediction error signal, and calculates the prediction error signal to the prediction error encoding unit 103. To supply.
- the prediction error encoding unit 103 performs processing such as orthogonal transformation and quantization on the prediction error signal supplied from the subtraction unit 102 to generate prediction error encoded data, and encodes the prediction error encoded data.
- the data is supplied to the column generation unit 104 and the prediction error decoding unit 105.
- the code string generation unit 104 includes prediction error encoded data supplied from the prediction error encoding unit 103, a merge flag, a merge index, and a motion compensation prediction prediction direction (inter prediction type) supplied from the motion information generation unit 109.
- the reference index of L0 prediction and L1 prediction, the difference vector of L0 prediction and L1 prediction, and the prediction vector index of L0 prediction and L1 prediction are entropy-coded according to the syntax sequence shown in FIG. Supply the column to terminal 11.
- Entropy coding is performed by a method including variable length coding such as arithmetic coding or Huffman coding.
- the prediction error decoding unit 105 performs a process such as inverse quantization or inverse orthogonal transform on the prediction error encoded data supplied from the prediction error encoding unit 103 to generate a prediction error signal, and the prediction error signal Is supplied to the adder 107.
- the addition unit 107 adds the prediction error signal supplied from the prediction error decoding unit 105 and the prediction signal supplied from the motion compensation unit 106 to generate a decoded image signal, and supplies the decoded image signal to the frame memory 110. To do.
- the frame memory 110 stores the decoded image signal supplied from the adding unit 107. In addition, for a decoded image in which decoding of the entire image is completed, a predetermined number of images of 1 or more is stored as a reference image.
- the frame memory 110 supplies the stored reference image signal to the motion compensation unit 106 and the motion information generation unit 109.
- the storage area for storing the reference image is a FIFO (First In First Out) method.
- the motion information memory 111 stores the motion information supplied from the motion information generation unit 109 for a predetermined number of images in units of the minimum predicted block size.
- the motion information of the adjacent block of the prediction block to be processed is set as a space candidate block group.
- the motion information memory 111 uses the motion information of the block on the ColPic and the surrounding blocks at the same position as the prediction block to be processed as a time candidate block group.
- the motion information memory 111 supplies the spatial candidate block group and the temporal candidate block group to the motion information generation unit 109 as candidate block groups.
- the motion information memory 111 is synchronized with the frame memory 110 and is controlled by a FIFO (First In First Out) method.
- ColPic is a decoded image different from the prediction block to be processed, and is stored in the frame memory 110 as a reference image.
- ColPic is a reference image decoded immediately before the processing target image.
- ColPic is a reference image decoded immediately before the processing target image.
- it may be a decoded image, for example, the reference image immediately before in the display order or the reference image immediately after in the display order. Alternatively, it can be specified in the encoded stream.
- the motion information is stored in each memory area in units of the smallest prediction block.
- Each memory area stores at least a prediction direction, a motion vector for L0 prediction, a reference index for L0 prediction, a motion vector for L1 prediction, and a reference index for L1 prediction.
- the predictive coding mode is the intra mode
- (0, 0) is stored as a motion vector for L0 prediction and L1 prediction
- “ ⁇ 1” is stored as a reference index for L0 prediction and L prediction.
- H represents a horizontal component
- V represents a vertical component.
- the reference index “ ⁇ 1” may be any value as long as it can be determined that the mode does not perform motion compensation prediction. From this point onward, unless expressed otherwise, the term “block” refers to the smallest predicted block unit when expressed simply as a block.
- LX direction (X is 0 or 1) is valid when the reference index in the LX direction is 0 or more.
- the LX direction is invalid (not valid).
- the reference index in the LX direction is “ ⁇ 1”. It is to be.
- “outside area” generally indicates an area outside a picture to which a prediction block to be processed belongs or an area outside a slice.
- FIG. 8 shows a configuration of the motion information generation unit 109.
- the motion information generation unit 109 includes a prediction vector mode determination unit 120, a merge mode determination unit 121, and a prediction encoding mode determination unit 122.
- the terminal 12 is in the motion information memory 111
- the terminal 13 is in the motion vector detection unit 108
- the terminal 14 is in the frame memory 110
- the terminal 15 is in the prediction block image acquisition unit 101
- the terminal 16 is in the code string generation unit 104
- the terminal 50 Are connected to the motion compensation unit 106
- the terminal 51 is connected to the motion information memory 111, respectively.
- the prediction vector mode determination unit 120 includes a candidate block group supplied from the terminal 12, a motion vector for L0 prediction and L1 prediction supplied from the terminal 13, a reference index for L0 prediction and L1 prediction, and a reference index supplied from the terminal 14.
- the inter-prediction type is determined from the reference image shown in FIG. 5 and the image signal supplied from the terminal 15, and the prediction vector index of the L0 prediction and the L1 prediction is selected according to the inter prediction type, and the difference vector between the L0 prediction and the L1 prediction , A prediction error is calculated, and a rate distortion evaluation value is calculated. Then, motion information, a difference vector, a prediction vector index, and a rate distortion evaluation value based on the inter prediction type are supplied to the prediction coding mode determination unit 122.
- the merge mode determination unit 121 generates a combined motion information candidate list from the candidate block group supplied from the terminal 12, the reference image supplied from the terminal 14, and the image signal supplied from the terminal 15, and the combined motion information
- One merged motion information candidate is selected from the candidate list, a merge index is determined, and a rate distortion evaluation value is calculated. Then, the motion information of the combined motion information candidate, the merge index, and the rate distortion evaluation value are supplied to the predictive coding mode determination unit 122. Details of the merge mode determination unit 121 will be described later.
- the prediction coding mode determination unit 122 compares the rate distortion evaluation value supplied from the prediction vector mode determination unit 120 and the rate distortion evaluation value supplied from the merge mode determination unit 121 to determine a merge flag.
- the merge flag is set to “0”.
- the prediction encoding mode determination unit 122 supplies the merge flag, the inter prediction type, the reference index, the difference vector, and the prediction vector index supplied from the prediction vector mode determination unit 120 to the terminal 16, and the prediction vector mode determination unit 120 The supplied motion information is supplied to the terminal 50 and the terminal 51.
- the merge flag is set to “1”.
- the predictive coding mode determination unit 122 supplies the merge flag and the merge index supplied from the merge mode determination unit 121 to the terminal 16, and supplies the motion information supplied from the merge mode determination unit 121 to the terminal 50 and the terminal 51. To do.
- a specific calculation method of the rate distortion evaluation value is not the main point of the present invention, detailed description is omitted, but the prediction error amount per code amount is calculated from the prediction error and the code amount, and the rate distortion evaluation value is calculated.
- the evaluation value has a characteristic that the encoding efficiency increases as the value decreases. Therefore, encoding efficiency can be improved by selecting a predictive encoding mode with a small rate distortion evaluation value.
- FIG. 9 is a diagram for explaining the configuration of the merge mode determination unit 121.
- the merge mode determination unit 121 includes a combined motion information candidate list generation unit 140 and a combined motion information selection unit 141.
- the combined motion information candidate list generation unit 140 is also installed in the video decoding device 200 that decodes the code sequence generated by the video encoding device 100 according to Embodiment 1 in the same manner.
- the moving image decoding apparatus 200 generates the same combined motion information list.
- the combined motion information candidate list generation unit 140 generates a combined motion information candidate list including the maximum number of merge candidate motion candidates from the candidate block group supplied from the terminal 12, and uses the combined motion information candidate list as the combined motion information. This is supplied to the selection unit 141. A detailed configuration of the combined motion information candidate list generation unit 140 will be described later.
- the combined motion information selection unit 141 selects the optimum combined motion information candidate from the combined motion information candidate list supplied from the combined motion information candidate list generation unit 140, and is information indicating the selected combined motion information candidate. A certain merge index is determined and the merge index is supplied to the terminal 17.
- a prediction error amount is calculated from the reference image supplied from the terminal 14 obtained by motion compensation prediction based on the prediction direction, motion vector, and reference index of the combined motion information candidate, and the image signal supplied from the terminal 15. .
- a rate distortion evaluation value is calculated from the code amount of the merge index and the prediction error amount, and a combined motion information candidate that minimizes the rate distortion evaluation value is selected as an optimal combined motion information candidate.
- the candidate block group includes a spatial candidate block group and a temporal candidate block group.
- FIG. 10 shows adjacent blocks of the prediction block to be processed when the prediction block size to be processed is 16 pixels ⁇ 16 pixels.
- the space candidate block group is assumed to be five blocks of block A1, block C, block D, block B1, and block E shown in FIG.
- the spatial candidate block group is five blocks of block A1, block C, block D, block B1, and block E, but the spatial candidate block group is at least one or more processed adjacent to the prediction block to be processed. Any block may be used, and the present invention is not limited to these. For example, all of block A1, block A2, block A3, block A4, block B1, block B2, block B3, block B4, block C, block D, and block E may be spatial candidate blocks.
- the time candidate block group includes two blocks, block H and block I6 shown in FIG.
- the time candidate block group is two blocks of block H and block I6 on ColPic, but the time candidate block group is at least one block on a decoded image different from the prediction block to be processed.
- the block H may be used.
- the block A4 is expressed as a block A
- the block B4 is expressed as a block B
- the block I6 is expressed as a block I
- the blocks H and I6 are expressed as a time block.
- FIG. 12 is a diagram for explaining the configuration of the combined motion information candidate list generation unit 140.
- the terminal 19 is connected to the combined motion information selection unit 141.
- the combined motion information candidate list generating unit 140 includes a spatially combined motion information candidate generating unit 160, a temporally combined motion information candidate generating unit 161, a redundant combined motion information candidate deleting unit 162, a recessive combined motion information candidate adding unit 163, and a first combined motion.
- An information candidate supplementing unit 164 and a second combined motion information candidate supplementing unit 165 are included.
- the spatially coupled motion information candidate generation unit 160 includes a recessive coupled motion information candidate determination unit 166.
- FIG. 13 is a flowchart for explaining the operation of the combined motion information candidate list generation unit 140.
- the combined motion information candidate list generation unit 140 initializes a combined motion information candidate list (S100). There are no combined motion information candidates in the initialized combined motion information candidate list.
- the recessive combined motion information candidate determination unit 166 selects a recessive combined motion information candidate and stores the recessive combined motion information candidate (S101).
- the stored recessive combined motion information candidates are shared in the combined motion information candidate list generation unit 140.
- the detailed operation of the recessive combined motion information candidate determination unit 166 will be described later.
- the spatially coupled motion information candidate generation unit 160 generates the maximum number of spatially coupled motion information candidates from 0 candidate block groups supplied from the terminal 12 and adds them to the combined motion information candidate list.
- the combined motion information candidate list and the candidate block group are supplied to the temporal combined motion information candidate generation unit 161.
- the detailed operation of the spatially coupled motion information candidate generation unit 160 will be described later.
- the maximum number of spatially coupled motion information candidates will be described later.
- the time combination motion information candidate generation unit 161 generates zero or time combination motion information candidate maximum number of time combination motion information candidates from the candidate block group supplied from the space combination motion information candidate generation unit 160 to generate a space. This is added to the combined motion information candidate list supplied from the combined motion information candidate generating unit 160 (S103), and the combined motion information candidate list is supplied to the recessive combined motion information candidate adding unit 163.
- the detailed operation of the time combination motion information candidate generation unit 161 will be described later. Further, the maximum number of temporally combined motion information candidates will be described later.
- the redundant combined motion information candidate deletion unit 162 examines the combined motion information candidates registered in the combined motion information candidate list supplied from the temporal combined motion information candidate generation unit 161, and combines the same motion information.
- one combined motion information candidate is left and other combined motion information candidates are deleted (S104), and the combined motion information candidate list is supplied to the recessive combined motion information candidate adding unit 163. . Accordingly, all of the combined motion information candidates registered in the combined motion information candidate list become different combined motion information candidates.
- the recessive combined motion information candidate adding unit 163 adds the recessive combined motion information candidate to the tail of the combined motion information candidate list supplied from the redundant combined motion information candidate deleting unit 162. (S105), and the combined motion information candidate list is supplied to the first combined motion information candidate supplementing unit 164. If the recessive combined motion information candidate is not valid, the combined motion information candidate list supplied from the redundant combined motion information candidate deleting unit 162 is supplied to the first combined motion information candidate supplementing unit 164. The detailed operation of the recessive combined motion information candidate adding unit 163 will be described later.
- the first combined motion information candidate supplementing unit 164 includes 0 to 2 first supplemental combining from the combined motion information candidates registered in the combined motion information candidate list supplied from the recessive combined motion information candidate adding unit 163.
- a motion information candidate is generated and added to the combined motion information candidate list (S106), and the combined motion information candidate list is supplied to the second combined motion information candidate supplementing unit 165.
- the detailed operation of the first combined motion information candidate supplement unit 164 will be described later.
- the second combined motion information candidate supplementing unit 165 generates 0 to 2 second supplemental combined motion information candidates that do not depend on the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164. Then, it is added to the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 (S107), and the combined motion information candidate list is supplied to the terminal 19.
- S107 the combined motion information candidate supplementing unit 165
- FIGS. 14A to 14D are diagrams for explaining a recessive combined motion information candidate.
- an encoded block can be divided into 1 or 2 or 4 prediction blocks.
- FIG. 14 shows an example in which the encoded block is 16 ⁇ 16.
- the prediction error related to the coding block can be minimized, while the syntax overhead related to the prediction block shown in FIG. 6 increases by the number of prediction blocks. Therefore, a plurality of prediction blocks having the same motion information and the same prediction error can be combined into one prediction block, and the coding efficiency can be improved by suppressing the number of divisions of the prediction block.
- FIG. 14A is a diagram for explaining Example 1 in which candidate block A is a recessive combined motion information candidate.
- the encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 1 when the prediction block size type is encoded as N ⁇ 2N is shown.
- the prediction block 0 and the prediction block 1 are collectively encoded as 2N ⁇ 2N, thereby generating syntax overhead related to the prediction block. And the coding efficiency can be improved.
- the candidate block A corresponding to the candidate block when encoded as 2N ⁇ 2N is selected as a combined motion information candidate.
- the candidate block A is set as a recessive combined motion information candidate.
- FIG. 14B is a diagram for explaining Example 2 in which candidate block A is a recessive combined motion information candidate.
- the encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 3 when the prediction block size type is encoded as N ⁇ N is shown. If the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same, and the motion information of the prediction block 2 and the motion information of the prediction block 3 are the same, the prediction block 0 and the prediction block 1 are combined.
- the prediction block 2 and the prediction block 3 together as 2N ⁇ N, it is possible to reduce the syntax overhead related to the prediction block and improve the encoding efficiency. Therefore, when the prediction block size type is N ⁇ N and the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same and the prediction block 3, the candidate block A is set as a recessive combined motion information candidate.
- FIG. 14C is a diagram for explaining Example 1 in which candidate block B is a recessive combined motion information candidate.
- the coding block is in the merge mode, and the prediction block size type is 2N ⁇ N.
- the prediction block 0 and the prediction block 1 are collectively encoded as 2N ⁇ 2N, thereby generating syntax overhead related to the prediction block.
- the coding efficiency can be improved. Therefore, when the prediction block size type is 2N ⁇ N and the processing target block is the prediction block 1, the candidate block B is set as a recessive combined motion information candidate.
- FIG. 14D is a diagram for explaining an example 2 in which the candidate block B is a recessive combined motion information candidate.
- the encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 3 when the prediction block size type is encoded as N ⁇ N is shown.
- the prediction block 0 and the prediction block 2 are the same, and the motion information of the prediction block 1 and the motion information of the prediction block 3 are the same, the prediction block 0 and the prediction block 2 are combined.
- N ⁇ 2N By encoding the prediction block 1 and the prediction block 3 together as N ⁇ 2N, it is possible to reduce the syntax overhead related to the prediction block and improve the encoding efficiency. Therefore, when the prediction block size type is N ⁇ N and the motion information of the prediction block 0 and the motion information of the prediction block 2 are the same and the prediction block 3, the candidate block B is set as a recessive combined motion information candidate.
- a combined motion information candidate that is more appropriate to be predicted in terms of coding efficiency is selected as a recessive combined motion information candidate.
- the recessive combined motion information candidate is a combined motion information candidate that is improved in coding efficiency by being combined with a larger predicted block size.
- the recessive combined motion information is motion information of a recessive combined motion information candidate.
- FIG. 15 is a flowchart for explaining an example of the determination process of the recessive combined motion information candidate determination unit 166.
- the predicted block size type is 2N ⁇ 2N (S150). If the predicted block size type is 2N ⁇ 2N (Y in S150), the process ends. If the predicted block size type is not 2N ⁇ 2N (N in S150), the predicted block size type is checked (S151). If the predicted block size type is N ⁇ 2N (N ⁇ 2N in S151), it is checked whether it is a predicted block 1 (S152). If the predicted block size type is 2N ⁇ N (2N ⁇ N in S151), it is checked whether it is a predicted block 1 (S154). If the predicted block size type is N ⁇ N (N ⁇ N in S151), it is checked whether it is a predicted block 3 (S156).
- block A is set as a recessive combined motion information candidate (S153). If the predicted block size type is N ⁇ 2N and the predicted block size is not 1 (N in S152), the process ends. If the predicted block size type is 2N ⁇ N and the predicted block is 1 (Y in S154), block B is set as a recessive combined motion information candidate (S155). If the predicted block size type is 2N ⁇ N and the predicted block size is not 1 (N in S154), the process ends.
- the prediction block size type is N ⁇ N and the prediction block 3 (Y in S156)
- the block B is set as a recessive combined motion information candidate (S160). If the motion information of the prediction block 0 and the prediction block 1 is not the same (N in S159), the process is terminated.
- the recessive combined motion information candidate when the recessive combined motion information candidate is determined, the recessive combined motion information candidate is valid, and when the recessive combined motion information candidate is not determined, the recessive combined motion information candidate is not effective. To do.
- FIG. 15 is an example of the determination process of the recessive combined motion information candidate determination unit 166, which is inferior using at least the number of divisions of the encoded block into the prediction block and / or the position of the prediction block in the encoded block. It is only necessary to be able to determine the combined motion information candidate, and the present invention is not limited to this.
- the motion block identity determination between the prediction block 0 and the prediction block 1 step S159
- the prediction block 0 and the prediction block 2 step S157.
- block A can always be an inferior combined motion information candidate
- block B can always be an inferior combined motion information candidate.
- the recessive combined motion information candidate may not be determined. it can. This means that additional control of the recessive joint motion information is performed based on the number of divisions of the encoded block into the prediction blocks.
- FIG. 16 is a flowchart for explaining the operation of the spatially coupled motion information candidate generation unit 160.
- the spatially coupled motion information candidate generating unit 160 repeatedly performs the following processing in the order of block A, block B, block C, block E, and block D, which are candidate blocks included in the spatial candidate block group of the candidate block group (from S110) S115).
- the candidate block is valid (S111). That the candidate block is valid means that at least one of the reference indexes of the L0 prediction and the L1 prediction of the candidate block is 0 or more. If the candidate block is valid (Y in S111), it is checked whether the recessive combined motion information candidate is valid (S112). If the candidate block is not valid (N in S111), step S112 to step S115 are skipped and the next candidate block is inspected (S116). If the recessive combined motion information candidate is valid (Y in S112), it is checked whether the motion information of the candidate block is the same as the motion information of the recessive combined motion information candidate (S113).
- the motion information of the candidate block is added to the combined motion information candidate list as a spatial combined motion information candidate (S114). If the motion information of the candidate block is the same as the motion information of the recessive combined motion information candidate (Y in S113), step S114 and step S115 are skipped and the next candidate block is examined (S116). If the motion information of the candidate block is not the same as the motion information of the recessive combined motion information candidate (N in S113), the motion information of the candidate block is added to the combined motion information candidate list as a spatial combined motion information candidate (S114).
- step S114 it is checked whether the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (S115).
- the maximum number of spatially coupled motion information candidates is 4. If the number of spatially combined motion information candidates added to the combined motion information candidate list is not the maximum number of spatially combined motion information candidates (N in S115), the next candidate block is examined (S115). If the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (Y in S115), the process ends.
- the processing information is processed so that the motion information of block A and block B, which are generally considered to have a long tangent to the processing target block and generally have a high correlation with the processing target block, can be preferentially registered in the combined motion information candidate list.
- the order is block A, block B, block C, block E, and block D
- the combined motion information candidates may be registered in the combined motion information candidate list in a highly correlated order, and the present invention is not limited to this.
- the maximum number of spatially coupled motion information candidates is four, the maximum number of spatially coupled motion information candidates may be 1 or more and less than or equal to the number of candidate blocks included in the spatial candidate block group, and is not limited to this.
- Step S112 and Step S113 can be omitted. If the candidate block is valid (Y in S111), the motion information of the candidate block is converted into the spatially coupled motion information. The candidate may be added to the combined motion information candidate list as a candidate (S114).
- FIG. 17 is a flowchart for explaining the operation of the time combination motion information candidate generation unit 161.
- the following processing is repeated for each prediction direction LX of L0 prediction and L1 prediction (S120 to S127).
- X is 0 or 1.
- the following processing is repeated in the order of block H and block I, which are candidate blocks included in the time candidate block group of the candidate block group (S121 to S126).
- the temporal combination motion information candidate generation unit 161 checks whether the LN prediction of the candidate block is valid (S122).
- N is 0 or 1.
- N is the same as X. That the LN prediction of the candidate block is valid means that the reference index of the LN prediction of the candidate block is 0 or more. If the LN prediction of the candidate block is valid (Y in S122), the LN prediction motion vector of the candidate block is set as the reference motion vector (S123). If the LN prediction of the candidate block is not valid (N in S122), step 123 to step 126 are skipped and the next candidate block is examined (S126).
- a reference image for LX prediction of a temporally coupled motion information candidate is determined (S124).
- the LX prediction reference image of the temporal combination motion information candidate is a reference image that is most frequently used as a reference image for LX prediction of candidate blocks included in the spatial candidate block group.
- the base motion vector is scaled to match the distance between the processing target image and the LX prediction reference image of the temporally combined motion information candidate to calculate a scaling vector, and the scaling vector is used for the temporally combined motion information candidate LX prediction.
- a motion vector is used (S125), and the next prediction direction is processed (S127).
- the scaling vector calculation formula is the same as the scaling vector calculation formula for temporal direct motion compensated prediction in MPEG-4 AVC.
- step S127 it is checked whether at least one of the L0 prediction and the L1 prediction of the temporally coupled motion information candidate is valid (S128).
- the fact that the LN prediction of the temporally combined motion information candidate is effective means that the reference image for the LN prediction of the temporally combined motion information candidate is determined. If at least one of the L0 prediction and the L1 prediction of the temporally combined motion information candidate is valid (Y in S128), the inter prediction type of the temporally combined motion information candidate is determined, and the temporally combined motion information candidate is combined with the motion. The information is added to the information candidate list (S129).
- the inter prediction type is determined as Pred_L0 if only the L0 prediction is valid, and if only the L1 prediction is valid, the inter prediction type of the temporally combined motion information candidate is determined. Is Pred_L1, and if both the L0 prediction and the L1 prediction are valid, the inter prediction type of the temporally combined motion information candidate is Pred_BI.
- FIG. 17 omits the processing corresponding to step S115 shown in FIG. 16 which is a flowchart for explaining the operation of the spatially coupled motion information candidate generation unit 160, but the maximum number of temporally coupled motion information candidate candidates is 2 or more. In this case, a process corresponding to step S115 can be added after step S129.
- the reference image for LX prediction of temporal combination motion information candidates is a reference image that is most frequently used as a reference image for LX prediction of candidate blocks included in the spatial candidate block group, but is not limited thereto, and is not limited to this.
- the reference image may be determined to be 0.
- the inter prediction type is any one of Pred_L0, Pred_L1, and Pred_BI, it may be only Pred_BI and is not limited to this.
- the spatial candidate block group is 5
- the spatial combined motion information candidate maximum number is 4
- the temporal combined motion information candidate maximum number is 1, which is relative to the recessive combined motion information candidate instead of the recessive combined motion information candidate.
- the block D having a high selection probability can be registered in the combined motion information candidate list.
- the spatially combined motion information candidate or temporal combination having a relatively higher selection probability than the recessive combined motion information candidate
- the motion information candidates may be registered in the combined motion information candidate list, and the present invention is not limited to this combination.
- the maximum number of spatially combined motion information candidates is 5
- the maximum number of temporally combined motion information candidates is 1, and when the recessive combined motion information candidate is not valid, the combined motion information candidates are given priority to the five spatially combined motion information candidates.
- the temporal combined motion information candidate having a higher selection probability than the recessive combined motion information candidate may be added to the combined motion information candidate list. it can.
- FIG. 18 is a flowchart for explaining the operation of the recessive combined motion information candidate adding unit 163.
- S140 it is checked whether the recessive combined motion information candidate is valid (S140). If the recessive combined motion information candidate is valid (Y in S140), the motion information of the recessive combined motion information candidate is added to the tail of the combined motion information candidate list (S141). If the recessive combined motion information candidate is not valid (N in S140), the process ends.
- the motion information of the recessive combined motion information candidate is added to the tail of the combined motion information candidate list.
- the recessive combined motion information candidate is valid and the motion information candidate list does not have the same motion information as the motion information of the recessive combined motion information candidate, it is added to the tail of the combined motion information candidate list It can also be done. In that case, the presence of redundant combined motion information candidates is excluded from the combined motion information candidate list, and instead, the first supplemental combined motion information candidate and the second supplemental combined motion information candidate are added to the combined motion information candidate list.
- candidate block A and candidate block B are combined motion information candidates with a relatively high selection rate compared to other blocks, a merge index with a short code length is assigned.
- a merge index with a short code length is assigned.
- the motion information candidate generation unit 160 temporarily removes the same motion information as the recessive combined motion information candidate from the combined motion information candidate list, and the recessive combined motion information candidate adding unit 163 adds the recessive combined motion information candidate to the combined motion information.
- the recessive combined motion information candidate determination unit 166 determines the motion information identity between the prediction block 0 and the prediction block 1 (step S159) or the prediction block 0.
- the motion information identity determination of the prediction block 2 step S157
- the blocks A and B are always inferior combined motion information candidates in the prediction block 3
- the operation of FIG. It is also possible to repeatedly process the two inferior combined motion information candidates of B.
- FIG. 19 is a flowchart for explaining the operation of the first combined motion information candidate supplementing unit 164.
- the first supplemental combined motion information candidate MaxNumGenCand which is the maximum number for generating, is calculated from Equation 1 (S170).
- MaxNumGenCand MaxNumMergeCand-NumCandList; (NumCandList> 0)
- MaxNumGenCand is larger than 0 (S171). If MaxNumGenCand is not greater than 0 (N in S171), the process ends. If MaxNumGenCand is greater than 0 (Y in S171), the following processing is performed. First, loopTimes that is the number of combination inspections is determined. LoopTimes is set to NumCandList ⁇ NumCandList. However, if loopTimes exceeds 8, loopTimes is limited to 8 (S172). Here, loopTimes is an integer from 0 to 7. The following processing is repeated for loopTimes (S172 to S180). A combination of the combined motion information candidate M and the combined motion information candidate N is determined (S173).
- FIG. 20 is a diagram for explaining the relationship between the number of combination inspections, the combined motion information candidate M, and the combined motion information candidate N.
- M and N are different values, and are set in order of decreasing total value of M and N. It is checked whether the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (S174). If the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (N in S174), the L0 prediction reference image of the combined motion information candidate M and the motion vector are combined motion information candidates.
- bi-coupled motion information is generated by combining the L0 prediction of a certain combined motion information candidate and the L1 prediction motion information of a different combined motion information candidate. If the reference image for L0 prediction of the combined motion information candidate M and the reference image for L1 prediction of the combined motion information candidate N are the same (N in S175), the next combination is processed. Subsequent to step S176, it is checked whether or not there is a combined motion information candidate in the combined motion information candidate list (S177). If the combined motion information candidate does not exist in the combined motion information candidate list (Y of S177), the combined motion information candidate is added to the combined motion information candidate list (S178).
- step S178 is skipped. Subsequent to step S177 or step S178, it is checked whether the number of generated double coupled motion information is MaxNumGenCand (S179). If the number of generated double coupled motion information is MaxNumGenCand (Y in S179), the process ends. If the number of generated double coupled motion information is not MaxNumGenCand (N in S179), the next combination is processed.
- the first supplemental combined motion information candidate is set as an L0 prediction motion vector of a certain combined motion information candidate registered in the combined motion information candidate list and the reference image, and the L1 prediction motion vector of another combined motion information candidate.
- a bi-coupled motion information candidate in which the direction of motion compensation prediction is bidirectional is used, but the present invention is not limited to this.
- combined motion information in which the direction of motion compensated prediction in which an offset value such as +1 is added to the motion vector of L0 prediction and the motion vector of L1 prediction of a certain combined motion information candidate registered in the combined motion information candidate list is bidirectional.
- Combined motion information in which the direction of motion compensated prediction obtained by adding an offset value such as +1 to the motion vector of L0 prediction or the motion vector of L1 prediction of a certain combined motion information candidate registered in the candidate, combined motion information candidate list is unidirectional Can also be a candidate.
- a motion vector of L1 prediction is obtained by scaling based on a motion vector of L0 prediction of a combined motion information candidate registered in the combined motion information candidate list, and these are combined.
- a new combined motion information candidate in which the direction of motion compensation prediction is bidirectional may be generated. Moreover, you may combine them arbitrarily.
- the first supplemental combined motion information candidate is a combined motion information candidate when there is a slight difference between the motion information of the combined motion information candidate registered in the combined motion information candidate list and the motion information candidate to be processed. Coding efficiency can be improved by correcting the motion information of the combined motion information candidates registered in the list to generate effective combined motion information candidates.
- either the L0 prediction or the L1 prediction is the same as the motion information of the processing target block even if the motion information is a recessive combined motion information candidate that is unlikely to be selected as a combined motion information candidate.
- the motion information of the processing target block may be slightly deviated from the motion information of the recessive combined motion information candidate. Therefore, without deleting the motion information of the recessive combined motion information candidate, the motion information of the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate, or the motion information of the recessive combined motion information candidate is corrected.
- the first supplemental combined motion information candidate having a higher selectivity than the recessive combined motion information candidate, it is possible to increase the encoding efficiency.
- at least two combined motion information candidates are required when using the dual combined motion information candidate, only one combined motion information candidate other than the recessive combined motion information candidate is registered in the combined motion information candidate list. If not, the motion information of the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate without deleting the motion information of the recessive combined motion information candidate, so that the coding efficiency can be improved.
- FIG. 21 is a flowchart for explaining the operation of the second combined motion information candidate supplementing unit 165.
- NumCandList the number of combined motion information candidates registered in the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 and the maximum number of merge candidates (MaxNumMergeCand)
- MaxNumGenCand MaxNumMergeCand-NumCandList; (NumCandList> 0)
- the second supplemental combined motion in which the motion vector for L0 prediction is (0,0), the reference index is i, the motion vector for L1 prediction is (0,0), and the inter prediction type for which the reference index is i is Pred_BI.
- Information candidates are generated (S192). It is checked whether the second supplementary combined motion information candidate exists in the combined motion information candidate list (S193). If the second supplementary combined motion information candidate does not exist in the combined motion information candidate list (Y in S193), the second supplemental combined motion information candidate is added to the combined motion information candidate list (S194). If the second supplementary combined motion information candidate exists in the combined motion information candidate list (N in S193), the next i is processed (S195).
- the second supplementary combined motion information candidate has a motion vector for L0 prediction of (0, 0), a reference index of i, a motion vector of L1 prediction of (0, 0), and a reference index of i.
- the combined motion information candidate whose inter prediction type is Pred_BI is used. This is because, in a general moving image, the frequency of occurrence of combined motion information candidates in which the motion vector for L0 prediction and the motion vector for L1 prediction are (0, 0) is statistically high.
- the present invention is not limited to this as long as it is a combined motion information candidate that is statistically frequently used without depending on the motion information of the combined motion information candidate registered in the combined motion information candidate list.
- the motion vectors of L0 prediction and L1 prediction may be vector values other than (0, 0), respectively, and may be set so that the reference indexes of L0 prediction and L1 prediction are different.
- the second supplementary combined motion information candidate can be set as an encoded image or motion information with a high occurrence frequency of a part of the encoded image, encoded in an encoded stream, and transmitted.
- the combined motion information candidate registered in the combined motion information candidate list When the number is zero, it is possible to use the merge mode and improve the encoding efficiency.
- the motion information of the combined motion information candidate registered in the combined motion information candidate list is different from the motion information candidate motion to be processed, new combined motion information that is statistically frequently used in the combined motion information candidate list Encoding efficiency can be improved by adding candidates and expanding the range of options.
- FIG. 22 is a diagram showing a configuration of the video decoding device 200 according to Embodiment 1.
- the video decoding device 200 is a device that generates a playback image by decoding the code string encoded by the video encoding device 100.
- the video decoding device 200 is realized by hardware such as an information processing device including a CPU (Central Processing Unit), a frame memory, and a hard disk.
- the moving picture decoding apparatus 200 realizes functional components described below by operating the above components.
- the coding block division, the prediction block size type determination, the prediction block size and the position of the prediction block in the coding block (position information of the prediction block), and the determination whether the prediction coding mode is intra are not shown. It is assumed that it is determined by the upper control unit, and here, a case where the predictive coding mode is not intra will be described. Note that the position information and the prediction block size of the prediction block to be decoded are shared in the video decoding device 200 and are not shown.
- the moving picture decoding apparatus 200 includes a code string analysis unit 201, a prediction error decoding unit 202, an addition unit 203, a motion information reproduction unit 204, a motion compensation unit 205, a frame memory 206, and a motion information memory 207.
- the code string analysis unit 201 analyzes the code string supplied from the terminal 30 to generate prediction error encoded data, a merge flag, a merge index, a motion compensation prediction direction (inter prediction type), a reference index, a difference vector, and Entropy decodes the prediction vector index according to the syntax. Entropy decoding is performed by a method including variable length coding such as arithmetic coding or Huffman coding. Then, the prediction error encoded data is supplied to the prediction error decoding unit 202, and the merge flag, the merge index, the inter prediction type, the reference index, the difference vector, and the prediction vector index are supplied to the motion information reproduction unit 204. To do.
- the motion information reproduction unit 204 includes a merge flag, a merge index, an inter prediction type, a reference index, a difference vector, and a prediction vector index supplied from the code string analysis unit 201 and a candidate block group supplied from the motion information memory 207.
- the motion information is reproduced, and the motion information is supplied to the motion compensation unit 205 and the motion information memory 207.
- a detailed configuration of the motion information reproducing unit 204 will be described later.
- the motion compensation unit 205 performs motion compensation on the reference image indicated by the reference index in the frame memory 206 based on the motion information supplied from the motion information reproduction unit 204, and generates a prediction signal. If the prediction direction is bi-prediction, an average of the prediction signals of the L0 prediction and the L1 prediction is generated as a prediction signal, and the prediction signal is supplied to the adding unit 203.
- the prediction error decoding unit 202 performs a process such as inverse quantization or inverse orthogonal transform on the prediction error encoded data supplied from the code string analysis unit 201 to generate a prediction error signal, and the prediction error signal is It supplies to the addition part 203.
- the adding unit 203 adds the prediction error signal supplied from the prediction error decoding unit 202 and the prediction signal supplied from the motion compensation unit 205 to generate a decoded image signal, and the decoded image signal is stored in the frame memory 206 and Supply to terminal 31.
- the frame memory 206 and the motion information memory 207 have the same functions as the frame memory 110 and the motion information memory 111 of the moving picture coding apparatus 100.
- the frame memory 206 stores the decoded image signal supplied from the adding unit 203.
- the motion information memory 207 stores the motion information supplied from the motion information reproducing unit 204 in units of the minimum predicted block size.
- FIG. 23 shows the configuration of the motion information playback unit 204.
- the motion information playback unit 204 includes an encoding mode determination unit 210, a motion vector playback unit 211, and a combined motion information playback unit 212.
- the terminal 32 is connected to the code string analysis unit 201
- the terminal 33 is connected to the motion information memory 207
- the terminal 34 is connected to the motion compensation unit 205
- the terminal 36 is connected to the motion information memory 207.
- the encoding mode determination unit 210 determines whether the merge flag supplied from the code string analysis unit 201 is “0” or “1”. If the merge flag is “0”, the inter prediction type, reference index, difference vector, and prediction vector index supplied from the code string analysis unit 201 are supplied to the motion vector reproduction unit 211. If the merge flag is “1”, the merge index supplied from the code string analysis unit 201 is supplied to the combined motion information reproduction unit 212.
- the motion vector reproduction unit 211 reproduces a motion vector from the inter prediction type, the reference index, the difference vector, and the prediction vector index supplied from the encoding mode determination unit 210 and the candidate block group supplied from the terminal 33. Motion information is generated and supplied to the terminals 34 and 36.
- the combined motion information reproduction unit 212 reproduces motion information from the merge index supplied from the encoding mode determination unit 210 and the candidate block group supplied from the terminal 33 and supplies the motion information to the terminal 34 and the terminal 36.
- FIG. 24 shows the configuration of the combined motion information playback unit 212.
- the combined motion information reproduction unit 212 includes a combined motion information candidate list generation unit 230 and a combined motion information selection unit 231.
- the terminal 35 is connected to the encoding mode determination unit 210.
- the combined motion information candidate list generation unit 230 has the same function as the combined motion information candidate list generation unit 140 of the video encoding device 100, and is the same as the combined motion information candidate list generation unit 140 of the video encoding device 100.
- the combined motion information candidate list is generated by the operation, and the combined motion information candidate list is supplied to the combined motion information selection unit 231.
- the combined motion information selection unit 231 selects a combined motion information candidate indicated by the merge index supplied from the terminal 35 from the combined motion information candidate list supplied from the combined motion information candidate list generation unit 230 and combines motion The information is determined, and the motion information of the combined motion information is supplied to the terminal 34 and the terminal 36.
- FIG. 25 is a diagram for explaining an example of the effect according to the first embodiment of the present invention.
- FIG. 25 shows the effect of backward addition of a recessive combined motion information candidate to the combined motion information candidate list when candidate block A is a recessive combined motion information candidate.
- candidate block A, candidate block B, candidate block C, candidate block E, and candidate block T are registered in the combined motion information candidate list.
- merge index 0 (candidate block A), merge index 1 (candidate block B), merge index 2 (candidate block C), merge index 3 (candidate block E), and merge index 4 (candidate block T) are respectively Suppose that they are 2%, 60%, 14%, 12%, and 12%. Strictly speaking, the merge index selection probability varies between when the recessive combined motion information candidate is added in front of the combined motion information candidate list and when the recessive combined motion information candidate is added behind the combined motion information candidate list. Here, for simplification of description, it is assumed that the merge index selection probability does not change. The same applies to examples for explaining the subsequent effects. In this case, the expected code length of the forward added merge index is 2.6 bits (Formula 3).
- the expected value of the code length of the merge index added later is 1.8 bits (Formula 4). Therefore, it can be seen that the expected value of the code length of the merge index added backward is 0.8 bits shorter than the forward addition, and the coding efficiency is improved.
- 0.02x1 + 0.6x2 + 0.14x3 + 0.12x4 + 0.12x4 2.6 Equation 3
- 0.6x1 + 0.14x2 + 0.12x3 + 0.12x4 + 0.02x4 1.8 Equation 4
- the inferior combined motion information candidate is added to the tail of the combined motion information candidate list in which the code length of the merge index is longer than that of the spatially combined motion information candidate or the temporally combined motion information candidate, and the selectivity is relatively Coding efficiency can be improved by assigning a merge index having a short code length to candidate blocks other than the inferior joint motion information candidate that increases.
- FIG. 26 is a diagram for explaining another example of the effect according to the first embodiment of the present invention. Here, it is assumed that candidate block A, candidate block B, and candidate block T are valid in the candidate block group, and the motion compensation prediction directions of candidate block A and candidate block B are both Pred_BI.
- the determination process of the recessive joint motion information candidate determination unit 166 according to Embodiment 1 includes at least either the number of divisions of the encoded block into the prediction block and / or the position of the prediction block in the encoded block as shown in FIG. It was assumed that a recessive combined motion information candidate could be determined. For example, as a condition determination simplification method that does not determine a recessive combined motion information candidate when the prediction block type is N ⁇ N, as shown in FIG. The recessive combined motion information candidate can also be determined using the block height.
- FIG. 27 is a flowchart for explaining an example of the determination process of the recessive combined motion information candidate determination unit 166.
- the operation of the recessive combined motion information candidate determination unit 166 according to the second modification of the first embodiment will be described with reference to FIG.
- the prediction block 1 (S200). If it is the prediction block 1 (Y in S200), it is checked whether the height of the prediction block is larger than the width of the prediction block (S201). If it is not the prediction block 1 (N of S200), a process will be complete
- block B is set as a recessive combined motion information candidate (S204), and the process ends. If the height of the prediction block is not smaller than the width of the prediction block (N in S203), the process is terminated.
- the recessive combined motion information candidate adding unit 163 is installed after the redundant combined motion information candidate deleting unit 162 as shown in FIG.
- the unit 163 may be installed after the spatially coupled motion information candidate generation unit 160.
- the recessive combined motion information candidate cannot be registered after the temporal combined motion information candidate in the combined motion information candidate list, but the process of adding the recessive combined motion information candidate is performed in the spatial combined motion information candidate generation unit 160. Therefore, the independence of the spatially coupled motion information candidate generating unit 160 and the temporally coupled motion information candidate generating unit 161 can be increased, and circuit design and software design can be facilitated.
- the recessive combined motion information candidate adding unit 163 is installed after the redundant combined motion information candidate deleting unit 162 as shown in FIG.
- the unit 163 may be installed after the first combined motion information candidate supplementing unit 164 and the second combined motion information candidate supplementing unit 165.
- the first combined motion information candidate supplementing unit 164 when the first supplemental combined motion information candidate is generated from the combined motion information candidates other than the recessive combined motion information candidate, the first combined motion information candidate supplementing unit 164 is relatively more than the recessive combined motion information candidate. Encoding efficiency can be improved by allocating a merge index having a code length shorter than that of the recessive combined motion information candidate to the first supplemental combined motion information candidate having a high selection probability. When the second supplemental combined motion information candidate has a relatively higher selection probability than the recessive combined motion information candidate, the second supplemental combined motion information candidate has a shorter code length than the recessive combined motion information candidate. By assigning the merge index, the encoding efficiency can be improved.
- the same motion information as the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate, or the recessive combined motion information candidate.
- the encoding efficiency can be improved.
- since at least two combined motion information candidates are required when using the dual combined motion information candidate only one combined motion information candidate other than the recessive combined motion information candidate is registered in the combined motion information candidate list. If not, the same motion information as the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate without deleting the same motion information as the recessive combined motion information candidate, thereby increasing the coding efficiency. be able to.
- the spatial combined motion information candidate generation unit 160 includes the recessive combined motion information candidate determination unit 166 as shown in FIG.
- the recessive combined motion information candidate is not registered in the combined motion information candidate list before the unit 163, and the present invention is not limited to this.
- the redundant combined motion information candidate deletion unit 162 may include a recessive combined motion information candidate determination unit 166.
- the redundant combined motion information candidate deletion unit 162 can exclude the spatially combined motion information candidate having the same motion information as the motion information of the recessive combined motion information candidate from the combined motion information candidate list.
- the redundant combined motion information candidate deletion unit 162 can exclude the spatially combined motion information candidate having the same motion information as the motion information of the recessive combined motion information candidate from the combined motion information candidate list.
- FIG. 28 is a diagram for explaining the configuration of the combined motion information candidate list generation unit 140 according to the second embodiment. 12 differs from the combined motion information candidate list generation unit 140 of Embodiment 1 in that a recessive combined motion information candidate deletion unit 167 is added after the first combined motion information candidate supplement unit 164.
- FIG. 29 is a diagram for explaining the operation of the combined motion information candidate list generation unit 140 according to the second embodiment.
- the operation of the combined motion information candidate list generation unit 140 of Embodiment 1 in FIG. 13 is that the recessive combined motion information candidate deletion unit 167 deletes the recessive combined motion information candidate from the combined motion information candidate list following step S106.
- step (S108) is installed.
- FIG. 30 is a diagram for explaining the operation of the recessive combined motion information candidate deletion unit 167.
- the following processing is repeated for the combined motion information candidates M corresponding to the number (NumCandList) of combined motion information candidates registered in the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 (S210 to S213).
- M is an integer from 0 to NumCandList-1. Whether the candidate block M is recessive combined motion information is checked (S211).
- the recessive combined motion information candidate is deleted from the combined motion information candidate list (S212), and the process is terminated. If the candidate block M is not the recessive combined motion information (N in S211), the next combined motion information candidate is processed (S213).
- Embodiment 2 (Modification of Embodiment 2)
- the operation of the recessive combined motion information candidate deletion unit 167 according to Embodiment 2 is simply to delete the recessive combined motion information candidate registered in the combined motion information candidate list as shown in FIG. 32, but it is a recessive combined motion information candidate. It can also be determined whether or not to delete the recessive combined motion information candidate registered in the combined motion information candidate list by determining whether or not the combined motion information of the prediction block is a duplicate combined motion information candidate.
- FIG. 31 is a diagram for explaining the operation of the recessive combined motion information candidate deletion unit 167 in the modification of the second embodiment. It differs from FIG. 30 in that step S213 is added. It is checked whether the combined motion information of the prediction block including the recessive combined motion information candidate is a redundant combined motion information candidate (step S213). If the combined motion information candidate of the prediction block including the recessive combined motion information candidate is an overlapping combined motion information candidate (Y in step S213), the recessive combined motion information candidate is deleted from the combined motion information candidate list (S212), and processing is performed. Exit. If the combined motion information of the prediction block including the recessive combined motion information candidate is not a redundant combined motion information candidate (N in step S213), the process ends.
- FIG. 32 is a diagram for explaining overlapping combined motion information candidates.
- FIG. 32 shows an example in which the encoded block is 16 ⁇ 16.
- FIG. 32A is a diagram for explaining a candidate for overlapping joint motion information when the prediction block size type is N ⁇ 2N, and the recessive joint motion of the prediction block 1 when the prediction block size type is N ⁇ 2N.
- a candidate block A, a candidate block B, a candidate block C, a candidate block D, and a candidate block E that are spatial combination motion information candidates of the prediction block 0 that is an information candidate are shown.
- 32B shows candidate block A, candidate block B, candidate block C, candidate block D, and candidate block E, which are spatially coupled motion information candidates in the case of the prediction block 0 having a prediction block size type of 2N ⁇ 2N. Show. In FIG. 32A and FIG. 32B, it can be seen that the positions of candidate block A, candidate block D, and candidate block E overlap. A candidate block that overlaps with a position of a candidate block of a larger predicted block size type in a certain predicted block size type is set as a redundant combined motion information candidate.
- the prediction block 0 that is the recessive combined motion information candidate of the prediction block 1 when the prediction block size type is N ⁇ 2N
- the prediction block Since selecting the overlapped joint motion information candidate in 1 is equivalent to the case of selecting the overlapped joint motion information candidate as 2N ⁇ 2N, it always involves a decrease in coding efficiency.
- FIG. 32 (c) is a diagram showing that the overlapped joint motion information candidates for the prediction block 0 of 2N ⁇ N prediction block size type are candidate block B, candidate block C, and candidate block D.
- FIG. 32 (d) is a diagram showing that the overlapped joint motion information candidates in the case of the prediction block 2 with the prediction block size type of N ⁇ N are candidate block A, candidate block D, and candidate block E.
- FIG. 32 (e) is a diagram showing that the overlapped joint motion information candidates for the prediction block 1 of which the prediction block size type is N ⁇ N are candidate block B, candidate block C, and candidate block D.
- the recessive combined motion information candidate registered in the combined motion information candidate list is obtained. By determining whether or not to delete, encoding efficiency can be improved.
- the moving image encoded stream output from the moving image encoding apparatus of the embodiment described above has a specific data format so that it can be decoded according to the encoding method used in the embodiment. Therefore, the moving picture decoding apparatus corresponding to the moving picture encoding apparatus can decode the encoded stream of this specific data format.
- the encoded stream When a wired or wireless network is used to exchange an encoded stream between a moving image encoding device and a moving image decoding device, the encoded stream is converted into a data format suitable for the transmission form of the communication path. It may be transmitted.
- a video transmission apparatus that converts the encoded stream output from the video encoding apparatus into encoded data in a data format suitable for the transmission form of the communication channel and transmits the encoded data to the network, and receives the encoded data from the network Then, a moving image receiving apparatus that restores the encoded stream and supplies the encoded stream to the moving image decoding apparatus is provided.
- the moving image transmitting apparatus is a memory that buffers the encoded stream output from the moving image encoding apparatus, a packet processing unit that packetizes the encoded stream, and transmission that transmits the packetized encoded data via the network.
- the moving image receiving apparatus generates a coded stream by packetizing the received data, a receiving unit that receives the packetized coded data via a network, a memory that buffers the received coded data, and packet processing. And a packet processing unit provided to the video decoding device.
- the above processing relating to encoding and decoding can be realized as a transmission, storage, and reception device using hardware, and is stored in a ROM (Read Only Memory), a flash memory, or the like. It can also be realized by firmware or software such as a computer.
- the firmware program and software program can be recorded on a computer-readable recording medium, provided from a server through a wired or wireless network, or provided as a data broadcast of terrestrial or satellite digital broadcasting Is also possible.
- the present invention can be used for a moving picture coding technique for coding motion information used in motion compensation prediction.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
A coupled motion information candidate list generation unit (140), in generating a candidate list, selects a previously encoded prediction block in which movement information comprising information on a movement vector and information on a reference image is valid, from among a plurality of prediction blocks adjacent to a prediction block intended to be encoded, and takes, as a selection candidate, movement information of the selected previously encoded prediction block but does not take as a selection candidate movement information of a specific prediction block within the plurality of prediction blocks that is adjacent to the prediction block intended to be encoded, on the basis of a segmentation type of the prediction block intended to be encoded and the position of the prediction block intended to be encoded within an encoding block. A coupled motion information selection unit (141) determines the movement information that is used to predict movement compensation for the prediction block intended to be encoded, from the candidate list. A code string generation unit (104) encodes information for specifying the movement information thus determined in the candidate list.
Description
本発明は、動き補償予測を用いた動画像符号化及び復号技術に関し、特に動き補償予測で利用する動き情報を符号化及び復号する動画像符号化及び復号技術に関する。
The present invention relates to a moving image encoding and decoding technique using motion compensated prediction, and more particularly to a moving image encoding and decoding technique for encoding and decoding motion information used in motion compensated prediction.
一般的な動画像圧縮符号化では動き補償予測が利用される。動き補償予測は、対象画像を細かいブロックに分割し、復号済みの画像を参照画像として、動きベクトルで示される動き量に基づいて、対象画像の処理対象ブロックから参照画像の参照ブロックに移動した位置の信号を予測信号として生成する技術である。動き補償予測には1本の動きベクトルを利用して単予測に行うものと、2本の動きベクトルを利用して双予測に行うものがある。
In general video compression coding, motion compensation prediction is used. The motion compensated prediction is performed by dividing the target image into fine blocks, using the decoded image as a reference image, and moving from the processing target block of the target image to the reference block of the reference image based on the amount of motion indicated by the motion vector. This is a technique for generating a signal as a prediction signal. There are two types of motion compensated prediction, one for single prediction using one motion vector and the other for bi-prediction using two motion vectors.
動きベクトルについては、処理対象ブロックに隣接する符号化済みのブロックの動きベクトルを予測動きベクトル(単に「予測ベクトル」ともいう)とし、処理対象ブロックの動きベクトルと予測ベクトルとの差分を求め、差分ベクトルを符号化ベクトルとして伝送することで圧縮効率を向上させている。
For a motion vector, a motion vector of an encoded block adjacent to the processing target block is set as a prediction motion vector (also simply referred to as “prediction vector”), and a difference between the motion vector of the processing target block and the prediction vector is obtained. The compression efficiency is improved by transmitting the vector as an encoded vector.
MPEG-4AVC/H.264(以下、MPEG-4AVC)のような動画像圧縮符号化では、動き補償予測を行うブロックサイズを細かく且つ多様にすることで、精度の高い動き補償予測を可能としている。一方、ブロックサイズを小さくすることで、符号化ベクトルの符号量は大きくなる問題があった。
MPEG-4 AVC / H. In moving picture compression coding such as H.264 (hereinafter referred to as MPEG-4 AVC), motion compensation prediction with high accuracy is made possible by making the block size for motion compensation prediction fine and diverse. On the other hand, there is a problem that the code amount of the encoded vector is increased by reducing the block size.
そこで、MPEG-4AVCでは、時間方向の動きの連続性に着目し、処理対象ブロックと同一位置にある参照画像のブロックが有する動きベクトルを処理対象ブロックの動きベクトルとして利用して、符号化ベクトルを伝送することなく動き補償予測を実現する時間ダイレクト動き補償予測が用いられている。
Therefore, in MPEG-4 AVC, focusing on the continuity of motion in the time direction, using the motion vector of the reference image block at the same position as the processing target block as the motion vector of the processing target block, Temporal direct motion compensated prediction is used to achieve motion compensated prediction without transmission.
また、特許文献1では、空間方向の動きの連続性に着目し、処理対象ブロックに隣接する処理済みのブロックが有する動きベクトルを処理対象ブロックの動きベクトルとして利用して、符号化ベクトルを伝送することなく動き補償予測を実現する方法が開示されている。
Also, in Patent Document 1, paying attention to the continuity of motion in the spatial direction, the encoded vector is transmitted using the motion vector of the processed block adjacent to the processing target block as the motion vector of the processing target block. A method for realizing motion compensated prediction without the need is disclosed.
特許文献1に記載された方法においては、動き補償予測を行うブロックサイズが可変となる場合には最小のブロックサイズを基準としており、MPEG-AVCのように予め多様なブロックサイズが定義されているような動画像圧縮符号化に適用する場合にそのまま適用できない課題がある。
In the method described in Patent Document 1, when the block size for motion compensation prediction is variable, the minimum block size is used as a reference, and various block sizes are defined in advance as in MPEG-AVC. There is a problem that cannot be applied as it is when applied to such moving image compression coding.
本発明はこうした状況に鑑みてなされたものであり、その目的は、符号化ベクトルを伝送することなく動き補償予測を高効率に実現することのできる動画像符号化及び復号技術を提供することにある。
The present invention has been made in view of such circumstances, and an object of the present invention is to provide a moving image encoding and decoding technique capable of realizing motion compensation prediction with high efficiency without transmitting an encoding vector. is there.
上記課題を解決するために、本発明のある態様の動画像符号化装置は、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化装置であって、符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出部(140)と、前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部(140)と、前記選択候補を含む候補リストを生成する候補リスト生成部(140)と、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部(140)と、前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定部(141)と、前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化部(104)とを備える。
In order to solve the above problems, a moving picture coding apparatus according to an aspect of the present invention divides a coded block into one or a plurality of prediction blocks based on a division type and performs motion compensation prediction to code a moving picture. An encoded prediction block in which motion information including motion vector information and reference image information is effective from a plurality of prediction blocks adjacent to a prediction block to be encoded. A candidate derivation unit (140) that uses the motion information of the selected encoded prediction block as a selection candidate, the division type of the prediction block to be encoded, and the code of the prediction block to be encoded The motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be encoded is not set as the selection candidate based on the position in the encoding block. , A candidate list generation unit (140) for generating a candidate list including the selection candidates, motion information in one prediction direction of selection candidates included in the candidate list, and included in the candidate list An additional unit (140) that generates a new selection candidate for bi-prediction by combining with motion information in the other prediction direction of the other selection candidates and adds the selection candidate to the candidate list, and the prediction block to be encoded from the candidate list A determination unit (141) for determining motion information used for the motion compensation prediction of the first and second encodings, and an encoding unit (104) for encoding information for specifying the determined motion information in the candidate list.
本発明の別の態様もまた、動画像符号化装置である。この装置は、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う動画像符号化装置であって、符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する符号化済みの複数の隣接ブロックの動き情報からなる第1の動き情報群の中から、前記符号化対象の予測ブロックのサイズよりも大きなサイズの予測ブロックで動き補償予測することが可能な劣性結合動き情報候補を選択する劣性結合動き情報候補判定部(166)と、前記第1の動き情報群から前記劣性結合動き情報候補を除いた第2の動き情報群を用いて、前記符号化対象の予測ブロックに利用するための結合動き情報候補の結合動き情報候補リストを生成する結合動き情報候補リスト生成部(140)と、少なくとも1つの前記劣性結合動き情報候補を前記結合動き情報候補リストに追加する結合動き情報候補追加部(163)と、前記結合動き情報候補リストから1つの結合動き情報候補を選択し、前記符号化対象の予測ブロックの動き情報とする結合動き情報選択部(141)と、前記選択された結合動き情報候補を前記結合動き情報候補リストにおいて特定するためのインデックスを候補特定インデックスとして符号化する符号化部(104)とを備える。
Another aspect of the present invention is also a moving picture coding apparatus. This apparatus is a moving picture encoding apparatus that performs motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type, and includes a division type of a prediction block to be encoded and the code Based on the position of the prediction block to be encoded in the encoded block, the first motion information group consisting of motion information of a plurality of encoded adjacent blocks adjacent to the prediction block to be encoded A recessive joint motion information candidate determination unit (166) that selects a recessive joint motion information candidate capable of motion compensation prediction with a prediction block having a size larger than the size of the prediction block to be encoded, and the first Combining combined motion information candidates for use in the prediction block to be encoded using the second motion information group obtained by removing the recessive combined motion information candidates from the motion information group A combined motion information candidate list generating unit (140) for generating a motion information candidate list, a combined motion information candidate adding unit (163) for adding at least one recessive combined motion information candidate to the combined motion information candidate list, A combined motion information selection unit (141) which selects one combined motion information candidate from the combined motion information candidate list and uses it as motion information of the prediction block to be encoded, and the selected combined motion information candidate as the combined motion information And an encoding unit (104) for encoding an index for specifying in the information candidate list as a candidate specifying index.
本発明のさらに別の態様は、動画像符号化方法である。この方法は、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法であって、符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、前記選択候補を含む候補リストを生成する候補リスト生成ステップと、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備える。
Still another aspect of the present invention is a video encoding method. This method is a moving picture coding method for coding a moving picture by performing motion compensation prediction by dividing a coding block into one or a plurality of prediction blocks based on a division type, and a prediction block to be coded Is selected from the plurality of prediction blocks adjacent to the encoded prediction block for which the motion information including the motion vector information and the reference image information is valid, and the motion information of the selected encoded prediction block is selected. Adjacent to the prediction block to be encoded based on the candidate derivation step as a selection candidate, the division type of the prediction block to be encoded, and the position of the prediction block to be encoded in the encoding block Invalidating step in which motion information of a specific prediction block in a plurality of prediction blocks is not set as the selection candidate, and a candidate for generating a candidate list including the selection candidate Combined with the motion information of one prediction direction of the selection candidates included in the candidate list and the motion information of the other prediction direction of the other selection candidates included in the candidate list. An adding step of generating a selection candidate and adding it to the candidate list, a determining step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list, and the determined motion information as the candidate And an encoding step for encoding information for specifying in the list.
本発明のさらに別の態様は、送信装置である。この装置は、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法により符号化された符号化ストリームをパケット化して符号化データを得るパケット処理部と、パケット化された前記符号化データを送信する送信部とを備える。前記動画像符号化方法は、符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、前記選択候補を含む候補リストを生成する候補リスト生成ステップと、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備える。
Still another aspect of the present invention is a transmission device. This apparatus packetizes an encoded stream encoded by a moving image encoding method that encodes a moving image by performing motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type. A packet processing unit that obtains encoded data and a transmission unit that transmits the packetized encoded data. The moving image encoding method selects an encoded prediction block in which motion information including motion vector information and reference image information is valid from a plurality of prediction blocks adjacent to a prediction block to be encoded. A candidate derivation step using motion information of the selected encoded prediction block as a selection candidate, a division type of the prediction block to be encoded, and a position of the prediction block to be encoded in the encoding block; And a candidate list that generates a candidate list including the selection candidates, and an invalidation step in which motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be encoded is not the selection candidate A generation step, motion information in one prediction direction of the selection candidates included in the candidate list, and other selection candidates included in the candidate list. An additional step of generating a new selection candidate for bi-prediction by combining the motion information in the prediction direction and adding it to the candidate list, and motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list. A determination step for determining, and an encoding step for encoding information for specifying the determined motion information in the candidate list.
本発明のさらに別の態様は、送信方法である。この方法は、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法により符号化された符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、パケット化された前記符号化データを送信する送信ステップとを備える。前記動画像符号化方法は、符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、前記選択候補を含む候補リストを生成する候補リスト生成ステップと、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備える。
Still another aspect of the present invention is a transmission method. According to this method, an encoded stream encoded by a moving image encoding method that performs motion compensated prediction and encodes a moving image by dividing an encoded block into one or a plurality of prediction blocks based on a division type is packetized. A packet processing step for obtaining encoded data and a transmission step for transmitting the packetized encoded data. The moving image encoding method selects an encoded prediction block in which motion information including motion vector information and reference image information is valid from a plurality of prediction blocks adjacent to a prediction block to be encoded. A candidate derivation step using motion information of the selected encoded prediction block as a selection candidate, a division type of the prediction block to be encoded, and a position of the prediction block to be encoded in the encoding block; And a candidate list that generates a candidate list including the selection candidates, and an invalidation step in which motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be encoded is not the selection candidate A generation step, motion information in one prediction direction of the selection candidates included in the candidate list, and other selection candidates included in the candidate list. An additional step of generating a new selection candidate for bi-prediction by combining the motion information in the prediction direction and adding it to the candidate list, and motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list. A determination step for determining, and an encoding step for encoding information for specifying the determined motion information in the candidate list.
本発明のある態様の動画像復号装置は、分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い、動画像の符号化ストリームを復号する動画像復号装置であって、復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出部(230)と、前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部(230)と、前記選択候補を含む候補リストを生成する候補リスト生成部(230)と、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部(230)と、前記候補リスト内の位置を示す情報を復号する符号列解析部(201)と、復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択部(231)とを備える。
A moving picture decoding apparatus according to an aspect of the present invention is a moving picture decoding apparatus that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type, and decodes a coded stream of the moving picture. A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be decoded, and the selected decoded block Based on the candidate derivation unit (230) that selects the motion information of the prediction block as a selection candidate, the division type of the prediction block to be decoded, and the position of the prediction block to be decoded in the decoding block The invalidation unit (230) that does not select motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block as the selection candidate, and the selection A candidate list generation unit (230) for generating a candidate list including the complement, motion information of one prediction direction of the selection candidate included in the candidate list, and the other prediction direction of the other selection candidate included in the candidate list An addition unit (230) that generates a new bi-predictive selection candidate in combination with the motion information and adds it to the candidate list; a code string analysis unit (201) that decodes information indicating a position in the candidate list; A selection unit (231) that selects motion information used for motion compensation prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position.
本発明の別の態様もまた、動画像復号装置である。この装置は、分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う動画像復号装置であって、結合動き情報候補を結合動き情報候補リストにおいて特定するためのインデックスが候補特定インデックスとして符号化された符号列から、前記候補特定インデックスを復号する復号部(201)と、復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する復号済みの複数の隣接ブロックの動き情報からなる第1の動き情報群の中から、前記復号対象の予測ブロックのサイズよりも大きなサイズの予測ブロックで動き補償予測することが可能な劣性結合動き情報候補を選択する劣性結合動き情報候補判定部(166)と、前記第1の動き情報群から前記劣性結合動き情報候補を除いた第2の動き情報群を用いて、前記復号対象の予測ブロックに利用するための結合動き情報候補の結合動き情報候補リストを生成する結合動き情報候補リスト生成部(230)と、少なくとも1つの前記劣性結合動き情報候補を前記結合動き情報候補リストに追加する結合動き情報候補追加部(163)と、前記候補特定インデックスにもとづいて前記結合動き情報候補リストから1つの結合動き情報候補を選択し、前記復号対象の予測ブロックの動き情報とする結合動き情報選択部(231)とを備える。
Another aspect of the present invention is also a video decoding device. This apparatus is a moving picture decoding apparatus that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type, and for specifying a combined motion information candidate in a combined motion information candidate list. A decoding unit (201) that decodes the candidate identification index from a code string that is encoded as a candidate identification index, a division type of a prediction block to be decoded, and a decoding block of the prediction block to be decoded in the decoding block Based on the position, a size larger than the size of the prediction block to be decoded is selected from the first motion information group including motion information of a plurality of decoded adjacent blocks adjacent to the prediction block to be decoded. Recessive combined motion information candidate determination that selects a recessive combined motion information candidate capable of motion compensation prediction with a prediction block (166) and the second motion information group obtained by removing the recessive combined motion information candidate from the first motion information group, and the combined motion information candidate combined motion to be used for the prediction block to be decoded A combined motion information candidate list generating unit (230) for generating an information candidate list, a combined motion information candidate adding unit (163) for adding at least one recessive combined motion information candidate to the combined motion information candidate list, and the candidate A combined motion information selection unit (231) that selects one combined motion information candidate from the combined motion information candidate list based on a specific index and uses the selected motion information as motion information of the prediction block to be decoded;
本発明のさらに別の態様は、動画像復号方法である。この方法は、分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い、動画像の符号化ストリームを復号する動画像復号方法であって、復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、前記選択候補を含む候補リストを生成する候補リスト生成ステップと、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、前記候補リスト内の位置を示す情報を復号する符号列解析ステップと、復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとを備える。
Still another aspect of the present invention is a moving picture decoding method. This method is a moving picture decoding method in which a decoded block is divided into one or a plurality of prediction blocks based on a division type, motion compensated prediction is performed, and a coded stream of a moving picture is decoded. Select a decoded prediction block for which motion information including motion vector information and reference image information is valid from a plurality of prediction blocks adjacent to the block, and select motion information of the selected decoded prediction block In a plurality of prediction blocks adjacent to the prediction block to be decoded based on the candidate derivation step as a candidate, the division type of the prediction block to be decoded and the position of the prediction block to be decoded in the decoding block A candidate for generating a candidate list including the selection candidates, and a step of invalidating the motion information of the specific prediction block of the selected prediction block as the selection candidates Combined with the motion information of one prediction direction of the selection candidates included in the candidate list and the motion information of the other prediction direction of the other selection candidates included in the candidate list. An addition step of generating a selection candidate and adding it to the candidate list, a code string analysis step of decoding information indicating a position in the candidate list, and a decoding target from the candidate list based on the information indicating the decoded position And a selection step of selecting motion information used for motion compensation prediction of the prediction block.
本発明のさらに別の態様は、受信装置である。この装置は、受信した動画像の符号化ストリームにおいて、復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い復号処理する受信装置であって、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い符号化された動画像の符号化ストリームがパケット化された符号化データを受信する受信部と、受信された前記符号化データをパケット処理して元の符号化ストリームを復元する復元部と、復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出部(230)と、前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部(230)と、前記選択候補を含む候補リストを生成する候補リスト生成部(230)と、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部(230)と、前記候補リスト内の位置を示す情報を、復元された符号化ストリームから復号する符号列解析部(201)と、復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択部(231)とを備える。
Still another aspect of the present invention is a receiving device. This apparatus is a receiving apparatus that performs decoding processing by performing motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks in an encoded stream of a received moving image, and the encoded block based on a division type A receiving unit that receives encoded data in which an encoded stream of a moving image that is encoded by performing motion compensation prediction by dividing the image into one or a plurality of prediction blocks, and the received encoded data Motion information including motion vector information and reference image information is valid from a restoration unit that performs packet processing to restore the original encoded stream and a plurality of prediction blocks adjacent to the prediction block to be decoded. A candidate derivation unit (230) that selects motion information of the selected decoded prediction block as a selection candidate, and a prediction target to be decoded. Based on the block division type and the position of the prediction block to be decoded in the decoding block, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded is selected as the selection candidate. An invalidation unit (230), a candidate list generation unit (230) that generates a candidate list including the selection candidates, motion information in one prediction direction of selection candidates included in the candidate list, and the candidate list An additional unit (230) that generates a new bi-prediction selection candidate by combining with motion information in the other prediction direction of the other selection candidates included, and adds information to the candidate list, and information indicating a position in the candidate list Is decoded from the restored encoded stream, and based on the information indicating the decoded position, the decoding pair is decoded from the candidate list. And a selector for selecting motion information (231) used for the motion compensation prediction of the prediction block.
本発明のさらに別の態様は、受信方法である。この方法は、受信した動画像の符号化ストリームにおいて、復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い復号処理する受信方法であって、分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い符号化された動画像の符号化ストリームがパケット化された符号化データを受信する受信ステップと、受信された前記符号化データをパケット処理して元の符号化ストリームを復元する復元ステップと、復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、前記選択候補を含む候補リストを生成する候補リスト生成ステップと、前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、前記候補リスト内の位置を示す情報を、復元された符号化ストリームから復号する符号列解析ステップと、復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとを備える。
Still another aspect of the present invention is a receiving method. This method is a receiving method of performing decoding processing by performing motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks in an encoded stream of a received moving image, and the encoded block based on the division type Receiving a coded data in which an encoded stream of a moving image encoded by performing motion compensation prediction by dividing the image into one or a plurality of prediction blocks is received, and the received encoded data Motion information including motion vector information and reference image information from a plurality of prediction blocks adjacent to the prediction block to be decoded and a decoding step that recovers the original encoded stream by packet processing has been decoded. A candidate derivation step in which motion information of the selected decoded prediction block is selected as a selection candidate, and the decoding The motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded is based on the division type of the prediction block of the elephant and the position of the prediction block to be decoded in the decoding block. An invalidation step that is not a selection candidate, a candidate list generation step that generates a candidate list that includes the selection candidate, motion information in one prediction direction of the selection candidate that is included in the candidate list, and another that is included in the candidate list An additional step of generating a new selection candidate for bi-prediction by combining with the motion information in the other prediction direction of the selection candidates and adding the information indicating the position in the candidate list to the restored code A decoding step for decoding the decoding target from the candidate list based on the information indicating the decoded position and the code string analyzing step for decoding from the encoded stream And a selection step of selecting the motion information used to lock the motion compensated prediction.
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
It should be noted that an arbitrary combination of the above-described components and a conversion of the expression of the present invention between a method, an apparatus, a system, a recording medium, a computer program, etc. are also effective as an aspect of the present invention.
本発明によれば、符号化ベクトルを伝送することなく動き補償予測を高効率に実現することができる。
According to the present invention, motion compensation prediction can be realized with high efficiency without transmitting an encoded vector.
まず、本発明の実施の形態の前提となる技術を説明する。
First, the technology that is the premise of the embodiment of the present invention will be described.
現在、MPEG(Moving Picture Experts Group)などの符号化方式に準拠した装置およびシステムが普及している。そのような符号化方式では、時間軸上に連続する複数の画像をデジタル信号の情報として取り扱う。その際、効率の高い情報の放送、伝送または蓄積などを目的とし、画像を複数のブロックに分割して時間方向の冗長性を利用した動き補償予測、および空間方向の冗長性を利用した離散コサイン変換などの直交変換を用いて圧縮符号化する。
Currently, devices and systems that comply with an encoding method such as MPEG (Moving Picture Experts Group) are widely used. In such an encoding method, a plurality of images that are continuous on the time axis are handled as digital signal information. At that time, for the purpose of broadcasting, transmitting or storing information with high efficiency, motion compensated prediction using the temporal redundancy by dividing the image into a plurality of blocks and the discrete cosine using the redundancy in the spatial direction Compression encoding is performed using orthogonal transformation such as transformation.
2003年に、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU-T)の共同作業によってMPEG-4 AVC/H.264と呼ばれる符号化方式(ISO/IECでは14496-10、ITU-TではH.264の規格番号がつけられている。以下、これをMPEG-4AVCと呼ぶ)が国際標準として制定された。MPEG-4AVCでは、基本的に処理対象ブロックの複数の隣接ブロックの動きベクトルの中央値を予測ベクトルとする。予測ブロックサイズが正方形でない場合で処理対象ブロックの特定の隣接ブロックの参照インデックスと処理対象ブロックの参照インデックスが一致する場合には、その特定の隣接ブロックの動きベクトルを予測ベクトルとする。
In 2003, a joint effort between the International Organization for Standardization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunication Union Telecommunication Standardization Sector (ITU-T) AVC / H. An encoding system called H.264 (144 / 96-10 in ISO / IEC and H.264 in ITU-T, hereinafter referred to as MPEG-4AVC) has been established as an international standard. In MPEG-4 AVC, basically, a median value of motion vectors of a plurality of adjacent blocks of a processing target block is used as a prediction vector. When the prediction block size is not square and the reference index of a specific adjacent block of the processing target block matches the reference index of the processing target block, the motion vector of the specific adjacent block is set as a prediction vector.
現在、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU-T)の共同作業によってHEVCと呼ばれる符号化方式の標準化が検討されている。
Coding currently called HEVC in collaboration with the International Technical Organization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunications Union Telecommunication Standardization Sector (ITU-T) Standardization of the method is being studied.
HEVCの標準化では、複数の隣接ブロックと復号済みの別の画像のブロックを候補ブロック群として、これら候補ブロック群から1つの候補ブロックが選択されて、選択された候補ブロックの情報が符号化および復号されるマージモードが検討されている。
In the standardization of HEVC, a plurality of adjacent blocks and another decoded image block are used as a candidate block group, and one candidate block is selected from these candidate block groups, and information on the selected candidate block is encoded and decoded. A merge mode is being considered.
[実施の形態1]
(符号化ブロック)
本実施の形態では、入力された画像信号は最大符号化ブロック単位に分割され、分割された最大符号化ブロックをラスタースキャン順序で処理する。符号化ブロックは階層構造となっており、符号化効率などを考慮して順次均等に4分割することでより小さい符号化ブロックにすることができる。なお、4分割された符号化ブロックはジグザグスキャン順で符号化される。これ以上小さくすることのできない符号化ブロックを最小符号化ブロックと呼ぶ。符号化ブロックは符号化の単位となり、最大符号化ブロックも分割数が0である場合は符号化ブロックとなる。本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とする。 [Embodiment 1]
(Encoding block)
In the present embodiment, the input image signal is divided into units of maximum encoding blocks, and the divided maximum encoding blocks are processed in a raster scan order. The encoded block has a hierarchical structure, and can be made smaller encoded blocks by sequentially equally dividing into 4 in consideration of the encoding efficiency. Note that the encoded blocks divided into four are encoded in the zigzag scan order. An encoded block that cannot be further reduced is called a minimum encoded block. An encoded block is a unit of encoding, and the maximum encoded block is also an encoded block when the number of divisions is zero. In this embodiment, the maximum coding block is 64 pixels × 64 pixels, and the minimum coding block is 8 pixels × 8 pixels.
(符号化ブロック)
本実施の形態では、入力された画像信号は最大符号化ブロック単位に分割され、分割された最大符号化ブロックをラスタースキャン順序で処理する。符号化ブロックは階層構造となっており、符号化効率などを考慮して順次均等に4分割することでより小さい符号化ブロックにすることができる。なお、4分割された符号化ブロックはジグザグスキャン順で符号化される。これ以上小さくすることのできない符号化ブロックを最小符号化ブロックと呼ぶ。符号化ブロックは符号化の単位となり、最大符号化ブロックも分割数が0である場合は符号化ブロックとなる。本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とする。 [Embodiment 1]
(Encoding block)
In the present embodiment, the input image signal is divided into units of maximum encoding blocks, and the divided maximum encoding blocks are processed in a raster scan order. The encoded block has a hierarchical structure, and can be made smaller encoded blocks by sequentially equally dividing into 4 in consideration of the encoding efficiency. Note that the encoded blocks divided into four are encoded in the zigzag scan order. An encoded block that cannot be further reduced is called a minimum encoded block. An encoded block is a unit of encoding, and the maximum encoded block is also an encoded block when the number of divisions is zero. In this embodiment, the maximum coding block is 64 pixels × 64 pixels, and the minimum coding block is 8 pixels × 8 pixels.
図1(a)、(b)は、符号化ブロックを説明するための図である。図1(a)の例では、符号化ブロックが10個に分割されている。CU0、CU1およびCU9は32画素×32画素の符号化ブロック、CU2、CU3およびCU8は16画素×16画素の符号化ブロック、ならびにCU4、CU5、CU6およびCU7は8画素×8画素の符号化ブロックとなっている。図1(b)の例では、符号化ブロックが1個に分割されている。
1 (a) and 1 (b) are diagrams for explaining an encoded block. In the example of FIG. 1A, the encoded block is divided into ten. CU0, CU1 and CU9 are 32 × 32 pixel coding blocks, CU2, CU3 and CU8 are 16 × 16 pixel coding blocks, and CU4, CU5, CU6 and CU7 are 8 × 8 pixel coding blocks. It has become. In the example of FIG. 1B, the encoded block is divided into one.
(予測ブロック)
本実施の形態では、符号化ブロックはさらに予測ブロックに分割される。符号化ブロックは予測ブロックサイズタイプ(「分割タイプ」ともいう)によって1以上の予測ブロックに分割される。図2(a)~(d)は、予測ブロックサイズタイプを説明するための図である。図2(a)は符号化ブロックを分割しない2N×2N、図2(b)は水平に2分割する2N×N、図2(c)は垂直に2分割するN×2N、および図2(d)は水平と垂直に4分割するN×Nを示す。2N×2Nは1個の予測ブロック0、2N×NとN×2Nは2個の予測ブロック0と予測ブロック1、N×Nは4個の予測ブロック0、予測ブロック1、予測ブロック2、予測ブロック3からなる。 (Prediction block)
In the present embodiment, the encoded block is further divided into prediction blocks. The encoded block is divided into one or more prediction blocks according to a prediction block size type (also referred to as “division type”). FIGS. 2A to 2D are diagrams for explaining the prediction block size type. 2 (a) is 2N × 2N that does not divide the encoded block, FIG. 2 (b) is 2N × N that is horizontally divided, FIG. 2 (c) is N × 2N that is vertically divided, and FIG. d) shows N × N which is divided into 4 parts horizontally and vertically. 2N × 2N is one prediction block 0, 2N × N and N × 2N are two prediction blocks 0 and 1, and N × N is four prediction blocks 0, prediction block 1, prediction block 2, and prediction It consists of block 3.
本実施の形態では、符号化ブロックはさらに予測ブロックに分割される。符号化ブロックは予測ブロックサイズタイプ(「分割タイプ」ともいう)によって1以上の予測ブロックに分割される。図2(a)~(d)は、予測ブロックサイズタイプを説明するための図である。図2(a)は符号化ブロックを分割しない2N×2N、図2(b)は水平に2分割する2N×N、図2(c)は垂直に2分割するN×2N、および図2(d)は水平と垂直に4分割するN×Nを示す。2N×2Nは1個の予測ブロック0、2N×NとN×2Nは2個の予測ブロック0と予測ブロック1、N×Nは4個の予測ブロック0、予測ブロック1、予測ブロック2、予測ブロック3からなる。 (Prediction block)
In the present embodiment, the encoded block is further divided into prediction blocks. The encoded block is divided into one or more prediction blocks according to a prediction block size type (also referred to as “division type”). FIGS. 2A to 2D are diagrams for explaining the prediction block size type. 2 (a) is 2N × 2N that does not divide the encoded block, FIG. 2 (b) is 2N × N that is horizontally divided, FIG. 2 (c) is N × 2N that is vertically divided, and FIG. d) shows N × N which is divided into 4 parts horizontally and vertically. 2N × 2N is one
図3は、符号化ブロックの分割数と予測ブロックサイズタイプによる予測ブロックサイズを説明するための図である。本実施の形態における予測ブロックサイズは、CU分割数が0であって予測ブロックサイズタイプが2N×2Nである64画素×64画素からCU分割数が3であって予測ブロックサイズタイプN×Nである4画素×4画素までの13の予測ブロックサイズが存在することになる。
FIG. 3 is a diagram for explaining the prediction block size according to the number of divisions of the encoded block and the prediction block size type. The prediction block size in the present embodiment is from 64 pixels × 64 pixels in which the number of CU divisions is 0 and the prediction block size type is 2N × 2N to 3 in the number of CU divisions, and the prediction block size type is N × N. There are 13 predicted block sizes up to 4 pixels x 4 pixels.
本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とするが、この組み合わせに限定されない。また、予測ブロックの分割のパターンを図2(a)~(d)としたが、1以上に分割される組み合わせであればよくこれに限定されない。
In this embodiment, the maximum encoding block is 64 pixels × 64 pixels and the minimum encoding block is 8 pixels × 8 pixels, but the present invention is not limited to this combination. Further, although the prediction block division patterns are shown in FIGS. 2A to 2D, the combination is not limited to this as long as it is a combination that is divided into one or more.
(予測符号化モード)
本実施の形態では、動き補償予測や符号化ベクトル数を予測ブロックのブロック毎に切り替えることが可能となっている。ここで、動き補償予測と符号化ベクトル数を関連付けた予測符号化モードの一例について図4を用いて簡単に説明する。図4は、予測符号化モードを説明するための図である。 (Predictive coding mode)
In the present embodiment, the motion compensation prediction and the number of encoded vectors can be switched for each block of the prediction block. Here, an example of a predictive coding mode in which motion compensation prediction is associated with the number of coding vectors will be briefly described with reference to FIG. FIG. 4 is a diagram for explaining the predictive coding mode.
本実施の形態では、動き補償予測や符号化ベクトル数を予測ブロックのブロック毎に切り替えることが可能となっている。ここで、動き補償予測と符号化ベクトル数を関連付けた予測符号化モードの一例について図4を用いて簡単に説明する。図4は、予測符号化モードを説明するための図である。 (Predictive coding mode)
In the present embodiment, the motion compensation prediction and the number of encoded vectors can be switched for each block of the prediction block. Here, an example of a predictive coding mode in which motion compensation prediction is associated with the number of coding vectors will be briefly described with reference to FIG. FIG. 4 is a diagram for explaining the predictive coding mode.
図4に示す予測符号化モードには、動き補償予測の予測方向が単予測(L0予測)であって符号化ベクトル数が1であるPredL0、動き補償予測の予測方向が単予測(L1予測)であって符号化ベクトル数が1であるPredL1、動き補償予測の予測方向が双予測(BI予測)であって符号化ベクトル数が2であるPredBI、および動き補償予測の予測方向が単予測(L0予測/L1予測)または双予測(BI予測)であって符号化ベクトル数が0であるマージモード(MERGE)がある。また、動き補償予測を実施しない予測符号化モードであるイントラモード(Intra)もある。ここで、PredL0、PredL1、およびPredBIが予測ベクトルモードとなる。
In the predictive coding mode shown in FIG. 4, the prediction direction of motion compensation prediction is single prediction (L0 prediction) and the number of coding vectors is PredL0, and the prediction direction of motion compensation prediction is single prediction (L1 prediction). PredL1 in which the number of encoding vectors is 1, PredBI in which the prediction direction of motion compensation prediction is bi-prediction (BI prediction) and the number of encoding vectors is 2, and the prediction direction in motion compensation prediction is single prediction ( There is a merge mode (MERGE) which is L0 prediction / L1 prediction) or bi-prediction (BI prediction) and the number of encoding vectors is zero. There is also an intra mode (Intra) which is a predictive coding mode in which motion compensation prediction is not performed. Here, PredL0, PredL1, and PredBI are prediction vector modes.
マージモードでは予測方向がL0予測/L1予測/BI予測のいずれにもなるが、それは、マージモードの予測方向は候補ブロック群から選択された候補ブロックの予測方向をそのまま引き継ぐか、復号済みの情報から導出されるためである。また、マージモードでは符号化ベクトルが符号化されない。これは、マージモードの符号化ベクトルは候補ブロック群から選択された候補ブロックの動きベクトルをそのまま引き継ぐか、復号済みの情報から導出されるためである。
In the merge mode, the prediction direction is any of L0 prediction / L1 prediction / BI prediction. This is because the prediction direction of the merge mode takes over the prediction direction of the candidate block selected from the candidate block group as it is, or is decoded information. This is because it is derived from In the merge mode, the encoded vector is not encoded. This is because the merge mode encoding vector inherits the motion vector of the candidate block selected from the candidate block group as it is or is derived from the decoded information.
(参照インデックス)
本実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照画像の中から最適な参照画像を選択することを可能とする。そのため、動き補償予測で利用した参照画像を参照画像インデックスとして符号化ベクトルとともに符号化する。動き補償予測で利用される参照画像インデックスは0以上の数値となる。動き補償予測が単予測であれば、参照インデックスは1つ利用され、動き補償予測が双予測であれば、2つの参照インデックスが利用される(図4)。 (Reference index)
In this embodiment, in order to improve the accuracy of motion compensation prediction, it is possible to select an optimal reference image from a plurality of reference images in motion compensation prediction. For this reason, the reference image used in the motion compensation prediction is encoded as a reference image index together with the encoded vector. The reference image index used in motion compensation prediction is a numerical value of 0 or more. If the motion compensation prediction is uni-prediction, one reference index is used, and if the motion compensation prediction is bi-prediction, two reference indexes are used (FIG. 4).
本実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照画像の中から最適な参照画像を選択することを可能とする。そのため、動き補償予測で利用した参照画像を参照画像インデックスとして符号化ベクトルとともに符号化する。動き補償予測で利用される参照画像インデックスは0以上の数値となる。動き補償予測が単予測であれば、参照インデックスは1つ利用され、動き補償予測が双予測であれば、2つの参照インデックスが利用される(図4)。 (Reference index)
In this embodiment, in order to improve the accuracy of motion compensation prediction, it is possible to select an optimal reference image from a plurality of reference images in motion compensation prediction. For this reason, the reference image used in the motion compensation prediction is encoded as a reference image index together with the encoded vector. The reference image index used in motion compensation prediction is a numerical value of 0 or more. If the motion compensation prediction is uni-prediction, one reference index is used, and if the motion compensation prediction is bi-prediction, two reference indexes are used (FIG. 4).
マージモードでは参照インデックスは符号化されない。これは、マージモードの参照インデックスは候補ブロック群から選択された候補ブロックの参照インデックスをそのまま引き継ぐか、復号済みの情報から導出されるためである。
∙ Reference index is not encoded in merge mode. This is because the reference index of the merge mode inherits the reference index of the candidate block selected from the candidate block group as it is or is derived from the decoded information.
(参照インデックスリスト)
本実施の形態では、動き補償予測で利用できる複数の参照画像を参照インデックスリスト内に登録しておき、参照インデックスリスト内に登録された参照画像を参照インデックスで示すことによって参照画像を確定させて動き補償予測で利用する。参照インデックスリストには、参照インデックスリストL0と参照インデックスリストL1がある。動き補償予測が単予測の場合は、参照インデックスリストL0の中の参照画像を用いたL0予測、または参照インデックスリストL1の中の参照画像を用いたL1予測のいずれかを利用する。双予測の場合は参照インデックスリストL0と参照インデックスリストL1の2つを利用したBI予測を利用する。各参照インデックスリストに登録できる参照画像の最大数は16とする。 (Reference index list)
In the present embodiment, a plurality of reference images that can be used in motion compensation prediction are registered in the reference index list, and the reference image is confirmed by indicating the reference image registered in the reference index list by the reference index. Used in motion compensated prediction. The reference index list includes a reference index list L0 and a reference index list L1. When the motion compensation prediction is simple prediction, either L0 prediction using a reference image in the reference index list L0 or L1 prediction using a reference image in the reference index list L1 is used. In the case of bi-prediction, BI prediction using the reference index list L0 and the reference index list L1 is used. The maximum number of reference images that can be registered in each reference index list is 16.
本実施の形態では、動き補償予測で利用できる複数の参照画像を参照インデックスリスト内に登録しておき、参照インデックスリスト内に登録された参照画像を参照インデックスで示すことによって参照画像を確定させて動き補償予測で利用する。参照インデックスリストには、参照インデックスリストL0と参照インデックスリストL1がある。動き補償予測が単予測の場合は、参照インデックスリストL0の中の参照画像を用いたL0予測、または参照インデックスリストL1の中の参照画像を用いたL1予測のいずれかを利用する。双予測の場合は参照インデックスリストL0と参照インデックスリストL1の2つを利用したBI予測を利用する。各参照インデックスリストに登録できる参照画像の最大数は16とする。 (Reference index list)
In the present embodiment, a plurality of reference images that can be used in motion compensation prediction are registered in the reference index list, and the reference image is confirmed by indicating the reference image registered in the reference index list by the reference index. Used in motion compensated prediction. The reference index list includes a reference index list L0 and a reference index list L1. When the motion compensation prediction is simple prediction, either L0 prediction using a reference image in the reference index list L0 or L1 prediction using a reference image in the reference index list L1 is used. In the case of bi-prediction, BI prediction using the reference index list L0 and the reference index list L1 is used. The maximum number of reference images that can be registered in each reference index list is 16.
(マージインデックス)
本実施の形態では、マージモードの場合には、処理対象画像内の複数の隣接ブロックおよび符号化済みの別の画像内の処理対象ブロックと同一位置の周辺にあるブロックを候補ブロック群として、候補ブロック群の中から最適な予測符号化モード、動きベクトル、及び参照インデックスを持つ候補ブロックを選択し、選択した候補ブロックを示すためのマージインデックスを符号化および復号する。マージモードのときのみマージインデックスが1つ利用される(図4)。マージインデックスの最大数(マージ候補最大数ともいう)は5であり、マージインデックスは0から4までの整数となる。ここでは、マージインデックスの最大数を5としたが、2以上であればよく、これに限定されない。 (Merge index)
In the present embodiment, in the merge mode, a plurality of adjacent blocks in the processing target image and blocks around the same position as the processing target block in another encoded image are used as candidate block groups. A candidate block having the optimal predictive coding mode, motion vector, and reference index is selected from the block group, and a merge index for indicating the selected candidate block is encoded and decoded. Only one merge index is used in the merge mode (FIG. 4). The maximum number of merge indexes (also referred to as the maximum number of merge candidates) is 5, and the merge index is an integer from 0 to 4. Here, the maximum number of merge indexes is set to 5, but it may be 2 or more, and is not limited to this.
本実施の形態では、マージモードの場合には、処理対象画像内の複数の隣接ブロックおよび符号化済みの別の画像内の処理対象ブロックと同一位置の周辺にあるブロックを候補ブロック群として、候補ブロック群の中から最適な予測符号化モード、動きベクトル、及び参照インデックスを持つ候補ブロックを選択し、選択した候補ブロックを示すためのマージインデックスを符号化および復号する。マージモードのときのみマージインデックスが1つ利用される(図4)。マージインデックスの最大数(マージ候補最大数ともいう)は5であり、マージインデックスは0から4までの整数となる。ここでは、マージインデックスの最大数を5としたが、2以上であればよく、これに限定されない。 (Merge index)
In the present embodiment, in the merge mode, a plurality of adjacent blocks in the processing target image and blocks around the same position as the processing target block in another encoded image are used as candidate block groups. A candidate block having the optimal predictive coding mode, motion vector, and reference index is selected from the block group, and a merge index for indicating the selected candidate block is encoded and decoded. Only one merge index is used in the merge mode (FIG. 4). The maximum number of merge indexes (also referred to as the maximum number of merge candidates) is 5, and the merge index is an integer from 0 to 4. Here, the maximum number of merge indexes is set to 5, but it may be 2 or more, and is not limited to this.
以降、マージインデックスの対象となる候補ブロックの動き情報を結合動き情報候補と呼び、結合動き情報候補の集合体を結合動き情報候補リストと呼ぶ。以降、動き情報とは予測方向、動きベクトル、及び参照インデックスを含む。
Hereinafter, the motion information of the candidate block that is the target of the merge index is referred to as a combined motion information candidate, and the aggregate of combined motion information candidates is referred to as a combined motion information candidate list. Hereinafter, the motion information includes a prediction direction, a motion vector, and a reference index.
なお、マージインデックスと符号列の関係について図を用いて説明する。図5はマージインデックスと符号列の関係を説明するための図である。マージインデックスが0の場合の符号列は'0'、マージインデックスが1の場合の符号列は'10'、マージインデックスが2の場合の符号列は'110'、マージインデックスが3の場合の符号列は'1110'、マージインデックスが4の場合の符号列は'11110'となり、マージインデックスが大きくなるほど符号列を長く設定する。そのため、選択率の高い候補ブロックに小さいマージインデックスを割り当てることで、符号化効率を向上させることができる。
Note that the relationship between the merge index and the code string will be described with reference to the drawings. FIG. 5 is a diagram for explaining the relationship between the merge index and the code string. The code string when the merge index is 0 is '0', the code string when the merge index is 1 is '10', the code string when the merge index is 2 is '110', and the code string when the merge index is 3 The code string when the column is “1110” and the merge index is 4 is “11110”, and the code string is set longer as the merge index becomes larger. Therefore, it is possible to improve the encoding efficiency by assigning a small merge index to a candidate block with a high selection rate.
(予測ベクトルインデックス)
本実施の形態では、予測ベクトルの精度を向上させるために、複数の隣接ブロックおよび符号化済みの別の画像の処理対象ブロックと同一位置の周辺にあるブロックを候補ブロック群として、候補ブロック群から予測ベクトルとして最適な動きベクトルを持つ候補ブロックを選択し、選択した候補ブロックを示すための予測ベクトルインデックスを符号化および復号する。動き補償予測が単予測であれば、予測ベクトルインデックスは1つ利用され、動き補償予測が双予測であれば、2つの予測ベクトルインデックスが利用される(図4)。予測ベクトルインデックスの最大数(予測ベクトル候補最大数ともいう)は2であり、予測ベクトルインデックスは0または1の整数となる。ここでは、予測ベクトル候補最大数を2としたが、2以上であればよく、これに限定されない。 (Predicted vector index)
In the present embodiment, in order to improve the accuracy of the prediction vector, a plurality of adjacent blocks and blocks around the same position as the processing target block of another encoded image are used as candidate block groups, and the candidate block group is used. A candidate block having an optimal motion vector is selected as a prediction vector, and a prediction vector index for indicating the selected candidate block is encoded and decoded. If the motion compensation prediction is uni-prediction, one prediction vector index is used, and if the motion compensation prediction is bi-prediction, two prediction vector indexes are used (FIG. 4). The maximum number of prediction vector indexes (also referred to as the maximum number of prediction vector candidates) is 2, and the prediction vector index is an integer of 0 or 1. Although the maximum number of prediction vector candidates is 2 here, it may be 2 or more, and is not limited to this.
本実施の形態では、予測ベクトルの精度を向上させるために、複数の隣接ブロックおよび符号化済みの別の画像の処理対象ブロックと同一位置の周辺にあるブロックを候補ブロック群として、候補ブロック群から予測ベクトルとして最適な動きベクトルを持つ候補ブロックを選択し、選択した候補ブロックを示すための予測ベクトルインデックスを符号化および復号する。動き補償予測が単予測であれば、予測ベクトルインデックスは1つ利用され、動き補償予測が双予測であれば、2つの予測ベクトルインデックスが利用される(図4)。予測ベクトルインデックスの最大数(予測ベクトル候補最大数ともいう)は2であり、予測ベクトルインデックスは0または1の整数となる。ここでは、予測ベクトル候補最大数を2としたが、2以上であればよく、これに限定されない。 (Predicted vector index)
In the present embodiment, in order to improve the accuracy of the prediction vector, a plurality of adjacent blocks and blocks around the same position as the processing target block of another encoded image are used as candidate block groups, and the candidate block group is used. A candidate block having an optimal motion vector is selected as a prediction vector, and a prediction vector index for indicating the selected candidate block is encoded and decoded. If the motion compensation prediction is uni-prediction, one prediction vector index is used, and if the motion compensation prediction is bi-prediction, two prediction vector indexes are used (FIG. 4). The maximum number of prediction vector indexes (also referred to as the maximum number of prediction vector candidates) is 2, and the prediction vector index is an integer of 0 or 1. Although the maximum number of prediction vector candidates is 2 here, it may be 2 or more, and is not limited to this.
以降、予測ベクトルインデックスの対象となる候補ブロックの動きベクトルを予測ベクトル候補と呼び、予測ベクトル候補の集合体を予測ベクトル候補リストと呼ぶ。
Hereinafter, a motion vector of a candidate block that is a target of a prediction vector index is referred to as a prediction vector candidate, and a set of prediction vector candidates is referred to as a prediction vector candidate list.
(シンタックス)
本実施の形態による予測ブロックのシンタックスの一例について図6を用いて説明する。予測ブロックがイントラであるかインターであるかは上位の符号化ブロックによって指定されているものとし、図6は予測ブロックがインターの場合の予測ブロックのシンタックスだけを示す。また、予測ブロックサイズタイプについても符号化ブロックで指定されているものとする。 (Syntax)
An example of the syntax of the prediction block according to the present embodiment will be described with reference to FIG. Whether the prediction block is intra or inter is specified by a higher-order encoding block, and FIG. 6 shows only the syntax of the prediction block when the prediction block is inter. In addition, it is assumed that the prediction block size type is also specified in the encoded block.
本実施の形態による予測ブロックのシンタックスの一例について図6を用いて説明する。予測ブロックがイントラであるかインターであるかは上位の符号化ブロックによって指定されているものとし、図6は予測ブロックがインターの場合の予測ブロックのシンタックスだけを示す。また、予測ブロックサイズタイプについても符号化ブロックで指定されているものとする。 (Syntax)
An example of the syntax of the prediction block according to the present embodiment will be described with reference to FIG. Whether the prediction block is intra or inter is specified by a higher-order encoding block, and FIG. 6 shows only the syntax of the prediction block when the prediction block is inter. In addition, it is assumed that the prediction block size type is also specified in the encoded block.
予測ブロック(図6のPU)には、マージフラグ(merge_flag)、マージインデックス(merge_idx)、インター予測タイプ(inter_pred_type)、L0予測の参照インデックス(ref_idx_l0)、L0予測の差分ベクトル(mvd_l0[0]、mvd_l0[1])、L0予測の予測ベクトルインデックス(mvp_idx_l0)、L1予測の参照インデックス(ref_idx_l1)、L1予測の差分ベクトル(mvd_l1[0]、mvd_l1[1])、及びL1予測の予測ベクトルインデックス(mvp_idx_l1)が設置されている。差分ベクトルの[0]は水平成分、[1]は垂直成分を示す。
The prediction block (PU in FIG. 6) includes a merge flag (merge_flag), a merge index (merge_idx), an inter prediction type (inter_pred_type), a reference index for L0 prediction (ref_idx_10), a difference vector (mvd_10 [0]) for L0 prediction, mvd_l0 [1]), prediction vector index for L0 prediction (mvp_idx_l0), reference index for L1 prediction (ref_idx_l1), difference vector for L1 prediction (mvd_l1 [0], mvd_l1 [1]), and prediction vector index for L1 prediction ( mvp_idx_l1) is installed. [0] of the difference vector indicates a horizontal component and [1] indicates a vertical component.
ここで、inter_pred_typeは動き補償予測の予測方向(インター予測タイプとも呼ぶ)を示し、Pred_L0(L0予測の単予測)、Pred_L1(L1予測の単予測)およびPred_BI(BI予測の双予測)の3種類がある。inter_pred_typeがPred_L0またはPred_BIの場合は、L0予測に関する情報が設置されて、inter_pred_typeがPred_L1またはPred_BIの場合は、L1予測に関する情報が設置される。
Here, inter_pred_type indicates a prediction direction (also referred to as inter prediction type) of motion compensation prediction, and three types of Pred_L0 (uni prediction of L0 prediction), Pred_L1 (uni prediction of L1 prediction) and Pred_BI (bi prediction of BI prediction). There is. When inter_pred_type is Pred_L0 or Pred_BI, information about L0 prediction is installed, and when inter_pred_type is Pred_L1 or Pred_BI, information about L1 prediction is installed.
なお、本実施の形態による予測ブロックのシンタックスを図6のように設定したが、これに限定されない。
In addition, although the syntax of the prediction block by this Embodiment was set like FIG. 6, it is not limited to this.
以下、図面とともに本発明の好適な実施の形態に係る動画像符号化装置、動画像符号化方法および動画像符号化プログラム、ならびに動画像復号装置、動画像復号方法および動画像復号プログラムの詳細について説明する。なお、図面の説明において同一要素には同一符号を付与して重複する説明を省略する。
Hereinafter, with reference to the drawings, details of a moving image encoding apparatus, a moving image encoding method, a moving image encoding program, a moving image decoding apparatus, a moving image decoding method, and a moving image decoding program according to a preferred embodiment of the present invention will be described. explain. In the description of the drawings, the same elements are denoted by the same reference numerals and redundant description is omitted.
(動画像符号化装置100の構成)
図7は、本実施の形態1に係る動画像符号化装置100の構成を示す。動画像符号化装置100は、動画像信号を、動き補償予測を実施する予測ブロック単位で符号化する装置である。符号化ブロックの分割、予測ブロックサイズタイプの決定、予測ブロックサイズと予測ブロックの符号化ブロック内の位置(予測ブロックの位置情報)の決定、予測符号化モードがイントラであるかの決定は図示しない上位の符号化制御部で決定されているものとし、実施の形態1では予測符号化モードがイントラでない場合について説明する。また、実施の形態1では双予測に対応したBピクチャについて説明するが、双予測に対応しないPピクチャについてはL1予測を省略すればよい。 (Configuration of moving picture coding apparatus 100)
FIG. 7 shows the configuration of movingpicture coding apparatus 100 according to the first embodiment. The moving image encoding apparatus 100 is an apparatus that encodes a moving image signal in units of prediction blocks for performing motion compensated prediction. The coding block division, the prediction block size type determination, the prediction block size and the position of the prediction block in the coding block (position information of the prediction block), and the determination whether the prediction coding mode is intra are not shown. It is assumed that it is determined by the higher-order coding control unit, and in the first embodiment, a case where the predictive coding mode is not intra will be described. In the first embodiment, a B picture corresponding to bi-prediction will be described, but L1 prediction may be omitted for a P picture not corresponding to bi-prediction.
図7は、本実施の形態1に係る動画像符号化装置100の構成を示す。動画像符号化装置100は、動画像信号を、動き補償予測を実施する予測ブロック単位で符号化する装置である。符号化ブロックの分割、予測ブロックサイズタイプの決定、予測ブロックサイズと予測ブロックの符号化ブロック内の位置(予測ブロックの位置情報)の決定、予測符号化モードがイントラであるかの決定は図示しない上位の符号化制御部で決定されているものとし、実施の形態1では予測符号化モードがイントラでない場合について説明する。また、実施の形態1では双予測に対応したBピクチャについて説明するが、双予測に対応しないPピクチャについてはL1予測を省略すればよい。 (Configuration of moving picture coding apparatus 100)
FIG. 7 shows the configuration of moving
動画像符号化装置100は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像符号化装置100は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。なお、処理対象の予測ブロックの位置情報、予測ブロックサイズおよび動き補償予測の予測方向に関しては動画像符号化装置100内で共有していることとし、図示しない。
The moving picture encoding apparatus 100 is realized by hardware such as an information processing apparatus including a CPU (Central Processing Unit), a frame memory, a hard disk, and the like. The moving image encoding apparatus 100 realizes functional components described below by operating the above components. Note that the position information of the prediction block to be processed, the prediction block size, and the prediction direction of motion compensated prediction are assumed to be shared in the video encoding device 100 and are not shown.
実施の形態1の動画像符号化装置100は、予測ブロック画像取得部101、減算部102、予測誤差符号化部103、符号列生成部104、予測誤差復号部105、動き補償部106、加算部107、動きベクトル検出部108、動き情報生成部109、フレームメモリ110、および動き情報メモリ111を含む。
The moving image encoding apparatus 100 according to Embodiment 1 includes a prediction block image acquisition unit 101, a subtraction unit 102, a prediction error encoding unit 103, a code string generation unit 104, a prediction error decoding unit 105, a motion compensation unit 106, and an addition unit. 107, a motion vector detection unit 108, a motion information generation unit 109, a frame memory 110, and a motion information memory 111.
(動画像符号化装置100の機能と動作)
以下、各部の機能と動作について説明する。予測ブロック画像取得部101は、予測ブロックの位置情報と予測ブロックサイズに基づいて、端子10より供給される画像信号から処理対象の予測ブロックの画像信号を取得し、予測ブロックの画像信号を減算部102、動きベクトル検出部108および動き情報生成部109に供給する。 (Function and operation of moving picture coding apparatus 100)
Hereinafter, the function and operation of each unit will be described. The prediction blockimage acquisition unit 101 acquires the image signal of the prediction block to be processed from the image signal supplied from the terminal 10 based on the position information and the prediction block size of the prediction block, and subtracts the image signal of the prediction block 102, and supplied to the motion vector detection unit 108 and the motion information generation unit 109.
以下、各部の機能と動作について説明する。予測ブロック画像取得部101は、予測ブロックの位置情報と予測ブロックサイズに基づいて、端子10より供給される画像信号から処理対象の予測ブロックの画像信号を取得し、予測ブロックの画像信号を減算部102、動きベクトル検出部108および動き情報生成部109に供給する。 (Function and operation of moving picture coding apparatus 100)
Hereinafter, the function and operation of each unit will be described. The prediction block
動きベクトル検出部108は、予測ブロック画像取得部101より供給される画像信号および内部に記憶している複数の参照画像に相当する画像信号から、L0予測とL1予測それぞれの動きベクトルと参照画像を示す参照インデックスを検出する。当該L0予測とL1予測の動きベクトル、および当該L0予測とL1予測の参照インデックスを動き情報生成部109に供給する。ここでは、動きベクトル検出部108は参照画像として内部に記憶している複数の参照画像に相当する画像信号を利用するとしたが、フレームメモリ110に記憶されている参照画像を利用することもできる。
The motion vector detection unit 108 obtains motion vectors and reference images of the L0 prediction and the L1 prediction from the image signal supplied from the prediction block image acquisition unit 101 and image signals corresponding to a plurality of reference images stored therein. Detect the reference index indicated. The motion vector of the L0 prediction and the L1 prediction and the reference index of the L0 prediction and the L1 prediction are supplied to the motion information generation unit 109. Here, the motion vector detection unit 108 uses image signals corresponding to a plurality of reference images stored therein as reference images, but a reference image stored in the frame memory 110 can also be used.
一般的な動きベクトルの検出方法は、対象画像の画像信号と、同一位置より所定の移動量だけ移動させた参照画像の予測信号について誤差評価値を算出し、誤差評価値が最小となる移動量を動きベクトルとする。参照画像が複数ある場合には各参照画像について動きベクトルを検出し、誤差評価値が最小となる参照画像を選択する。誤差評価値としては、絶対差分和を示すSAD(Sum of Absolute Difference)や二乗誤差平均を示すMSE(Mean Square Error)などを利用することが可能である。また、動きベクトル符号量を誤差評価値に加算して評価することも可能である。
A general motion vector detection method calculates an error evaluation value for an image signal of a target image and a prediction signal of a reference image moved by a predetermined movement amount from the same position, and a movement amount that minimizes the error evaluation value. Is a motion vector. When there are a plurality of reference images, a motion vector is detected for each reference image, and a reference image having a minimum error evaluation value is selected. As the error evaluation value, SAD (Sum of Absolute Difference) indicating the sum of absolute differences, MSE (Mean Square Error) indicating the mean square error, or the like can be used. It is also possible to evaluate by adding the motion vector code amount to the error evaluation value.
動き情報生成部109は、動きベクトル検出部108より供給されるL0予測とL1予測の動きベクトルおよびL0予測とL1予測の参照インデックス、動き情報メモリ111より供給される候補ブロック群、参照インデックスで示されるフレームメモリ110内の参照画像、および予測ブロック画像取得部101より供給される画像信号から、予測符号化モードを決定する。
The motion information generation unit 109 indicates L0 prediction and L1 prediction motion vectors supplied from the motion vector detection unit 108, reference indexes for L0 prediction and L1 prediction, candidate block groups supplied from the motion information memory 111, and reference indexes. The prediction encoding mode is determined from the reference image in the frame memory 110 and the image signal supplied from the prediction block image acquisition unit 101.
決定された予測符号化モードに基づいて、マージフラグ、マージインデックス、動き補償予測の予測方向、L0予測とL1予測の参照インデックス、L0予測とL1予測の差分ベクトルおよびL0予測とL1予測の予測ベクトルインデックスを必要に応じて、符号列生成部104に供給する。動き補償予測の予測方向、L0予測とL1予測の参照インデックス、およびL0予測とL1予測の動きベクトルを動き補償部106および動き情報メモリ111に供給する。動き情報生成部109の詳細については後述する。
Based on the determined predictive coding mode, the merge flag, the merge index, the prediction direction of motion compensation prediction, the reference index of L0 prediction and L1 prediction, the difference vector of L0 prediction and L1 prediction, and the prediction vector of L0 prediction and L1 prediction The index is supplied to the code string generation unit 104 as necessary. The motion compensation prediction direction, the reference index of L0 prediction and L1 prediction, and the motion vector of L0 prediction and L1 prediction are supplied to the motion compensation unit 106 and the motion information memory 111. Details of the motion information generation unit 109 will be described later.
動き補償部106は、動き情報生成部109より供給される動き補償予測の予測方向がLN予測であれば、動き情報生成部109より供給されるLN予測の参照インデックスで示されるフレームメモリ110内の参照画像を、動き情報生成部109より供給されるLN予測の動きベクトルに基づき動き補償してLN予測の予測信号を生成する。Nは0または1である。ここで、動き補償予測の予測方向が双予測であれば、L0予測とL1予測の予測信号の平均値が予測信号となる。なお、L0予測とL1予測の予測信号を重みづけしてもよい。動き補償部106は、当該予測信号を減算部102に供給する。
If the prediction direction of the motion compensation prediction supplied from the motion information generation unit 109 is LN prediction, the motion compensation unit 106 stores the frame compensation information in the frame memory 110 indicated by the LN prediction reference index supplied from the motion information generation unit 109. The reference image is motion-compensated based on the LN prediction motion vector supplied from the motion information generation unit 109 to generate a prediction signal for LN prediction. N is 0 or 1. Here, if the prediction direction of motion compensation prediction is bi-prediction, the average value of the prediction signals of L0 prediction and L1 prediction is the prediction signal. Note that the prediction signals of the L0 prediction and the L1 prediction may be weighted. The motion compensation unit 106 supplies the prediction signal to the subtraction unit 102.
減算部102は、予測ブロック画像取得部101より供給される画像信号と動き補償部106より供給される予測信号を減算して予測誤差信号を算出し、当該予測誤差信号を予測誤差符号化部103に供給する。
The subtraction unit 102 subtracts the image signal supplied from the prediction block image acquisition unit 101 and the prediction signal supplied from the motion compensation unit 106 to calculate a prediction error signal, and calculates the prediction error signal to the prediction error encoding unit 103. To supply.
予測誤差符号化部103は、減算部102より供給される予測誤差信号に対して、直交変換や量子化などの処理を行って予測誤差符号化データを生成し、当該予測誤差符号化データを符号列生成部104および予測誤差復号部105に供給する。
The prediction error encoding unit 103 performs processing such as orthogonal transformation and quantization on the prediction error signal supplied from the subtraction unit 102 to generate prediction error encoded data, and encodes the prediction error encoded data. The data is supplied to the column generation unit 104 and the prediction error decoding unit 105.
符号列生成部104は、予測誤差符号化部103より供給される予測誤差符号化データ、ならびに動き情報生成部109より供給されるマージフラグ、マージインデックス、動き補償予測の予測方向(インター予測タイプ)、L0予測とL1予測の参照インデックス、L0予測とL1予測の差分ベクトルおよびL0予測とL1予測の予測ベクトルインデックスを図6に示すシンタックスの順序に従ってエントロピー符号化して符号列を生成し、当該符号列を端子11に供給する。エントロピー符号化は算術符号化やハフマン符号化などの可変長符号化を含む方法によって実施される。
The code string generation unit 104 includes prediction error encoded data supplied from the prediction error encoding unit 103, a merge flag, a merge index, and a motion compensation prediction prediction direction (inter prediction type) supplied from the motion information generation unit 109. , The reference index of L0 prediction and L1 prediction, the difference vector of L0 prediction and L1 prediction, and the prediction vector index of L0 prediction and L1 prediction are entropy-coded according to the syntax sequence shown in FIG. Supply the column to terminal 11. Entropy coding is performed by a method including variable length coding such as arithmetic coding or Huffman coding.
予測誤差復号部105は、予測誤差符号化部103より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部107に供給する。加算部107は、予測誤差復号部105より供給される予測誤差信号と、動き補償部106より供給される予測信号を加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ110に供給する。
The prediction error decoding unit 105 performs a process such as inverse quantization or inverse orthogonal transform on the prediction error encoded data supplied from the prediction error encoding unit 103 to generate a prediction error signal, and the prediction error signal Is supplied to the adder 107. The addition unit 107 adds the prediction error signal supplied from the prediction error decoding unit 105 and the prediction signal supplied from the motion compensation unit 106 to generate a decoded image signal, and supplies the decoded image signal to the frame memory 110. To do.
フレームメモリ110は、加算部107より供給される復号画像信号を記憶する。また、画像全体の復号が完了した復号画像については参照画像として、1以上の所定の画像数を記憶する。フレームメモリ110は、記憶した参照画像信号を動き補償部106および動き情報生成部109に供給する。参照画像を記憶する記憶領域はFIFO(First
In First Out)方式で制御される。 Theframe memory 110 stores the decoded image signal supplied from the adding unit 107. In addition, for a decoded image in which decoding of the entire image is completed, a predetermined number of images of 1 or more is stored as a reference image. The frame memory 110 supplies the stored reference image signal to the motion compensation unit 106 and the motion information generation unit 109. The storage area for storing the reference image is a FIFO (First
In First Out) method.
In First Out)方式で制御される。 The
In First Out) method.
動き情報メモリ111は、動き情報生成部109より供給される動き情報を最小の予測ブロックサイズ単位で所定の画像数、記憶する。処理対象の予測ブロックの隣接ブロックの動き情報を空間候補ブロック群とする。
The motion information memory 111 stores the motion information supplied from the motion information generation unit 109 for a predetermined number of images in units of the minimum predicted block size. The motion information of the adjacent block of the prediction block to be processed is set as a space candidate block group.
また、動き情報メモリ111は、処理対象の予測ブロックと同一位置にあるColPic上のブロックとその周辺ブロックの動き情報を時間候補ブロック群とする。動き情報メモリ111は、空間候補ブロック群と時間候補ブロック群を候補ブロック群として動き情報生成部109に供給する。動き情報メモリ111は、フレームメモリ110と同期しており、FIFO(First In First Out)方式で制御される。
Also, the motion information memory 111 uses the motion information of the block on the ColPic and the surrounding blocks at the same position as the prediction block to be processed as a time candidate block group. The motion information memory 111 supplies the spatial candidate block group and the temporal candidate block group to the motion information generation unit 109 as candidate block groups. The motion information memory 111 is synchronized with the frame memory 110 and is controlled by a FIFO (First In First Out) method.
ここで、ColPicとは、処理対象の予測ブロックとは別の復号済みの画像であって、フレームメモリ110に参照画像として記憶されている。実施の形態1では、ColPicは処理対象画像の直前に復号した参照画像とする。なお、実施の形態1では、ColPicは処理対象画像の直前に復号した参照画像としたが、復号済みの画像であればよく、例えば、表示順で直前の参照画像や表示順で直後の参照画像でもよく、符号化ストリーム中で指定することも可能である。
Here, ColPic is a decoded image different from the prediction block to be processed, and is stored in the frame memory 110 as a reference image. In Embodiment 1, ColPic is a reference image decoded immediately before the processing target image. In Embodiment 1, ColPic is a reference image decoded immediately before the processing target image. However, it may be a decoded image, for example, the reference image immediately before in the display order or the reference image immediately after in the display order. Alternatively, it can be specified in the encoded stream.
ここで、動き情報メモリ111における動き情報の管理方法について説明する。動き情報は最小の予測ブロック単位で各メモリエリアに記憶される。各メモリエリアには、少なくとも予測方向、L0予測の動きベクトル、L0予測の参照インデックス、L1予測の動きベクトル、およびL1予測の参照インデックスが記憶される。
Here, a method for managing motion information in the motion information memory 111 will be described. The motion information is stored in each memory area in units of the smallest prediction block. Each memory area stores at least a prediction direction, a motion vector for L0 prediction, a reference index for L0 prediction, a motion vector for L1 prediction, and a reference index for L1 prediction.
なお、予測符号化モードがイントラモードである場合、L0予測とL1予測の動きベクトルとして(0,0)が記憶され、L0予測とL予測の参照インデックスとして「-1」が記憶される。これ以降、動きベクトルの(H、V)は、Hが水平成分、Vが垂直成分を表すこととする。なお、参照インデックスの「-1」は動き補償予測を実施しないモードであることが判定できればどのような値でもよい。これ以降は特に断らない限り単にブロックと表現する場合には、最小の予測ブロック単位のことを示すこととする。また、領域外のブロックである場合もイントラモードと同様に、L0予測とL1予測の動きベクトルとして(0,0)が記憶され、L0予測とL1予測の参照インデックスとして「-1」が記憶される。LX方向(Xは0または1)が有効であるとはLX方向の参照インデックスが0以上であることで、LX方向が無効である(有効でない)とはLX方向の参照インデックスが「-1」であることである。なお、領域外であるとは、一般的に処理対象の予測ブロックが属するピクチャの外の領域やスライスの外の領域を示す。
When the predictive coding mode is the intra mode, (0, 0) is stored as a motion vector for L0 prediction and L1 prediction, and “−1” is stored as a reference index for L0 prediction and L prediction. Hereinafter, in the motion vector (H, V), H represents a horizontal component and V represents a vertical component. The reference index “−1” may be any value as long as it can be determined that the mode does not perform motion compensation prediction. From this point onward, unless expressed otherwise, the term “block” refers to the smallest predicted block unit when expressed simply as a block. Also, in the case of a block outside the region, as in the intra mode, (0, 0) is stored as a motion vector for L0 prediction and L1 prediction, and “−1” is stored as a reference index for L0 prediction and L1 prediction. The The LX direction (X is 0 or 1) is valid when the reference index in the LX direction is 0 or more. The LX direction is invalid (not valid). The reference index in the LX direction is “−1”. It is to be. Note that “outside area” generally indicates an area outside a picture to which a prediction block to be processed belongs or an area outside a slice.
(動き情報生成部109の構成)
続いて、動き情報生成部109の詳細な構成について説明する。図8は、動き情報生成部109の構成を示す。動き情報生成部109は、予測ベクトルモード決定部120、マージモード決定部121および予測符号化モード決定部122を含む。端子12は動き情報メモリ111に、端子13は動きベクトル検出部108に、端子14はフレームメモリ110に、端子15は予測ブロック画像取得部101に、端子16は符号列生成部104に、端子50は動き補償部106に、および端子51は動き情報メモリ111にそれぞれ接続されている。 (Configuration of the motion information generation unit 109)
Next, a detailed configuration of the motioninformation generation unit 109 will be described. FIG. 8 shows a configuration of the motion information generation unit 109. The motion information generation unit 109 includes a prediction vector mode determination unit 120, a merge mode determination unit 121, and a prediction encoding mode determination unit 122. The terminal 12 is in the motion information memory 111, the terminal 13 is in the motion vector detection unit 108, the terminal 14 is in the frame memory 110, the terminal 15 is in the prediction block image acquisition unit 101, the terminal 16 is in the code string generation unit 104, and the terminal 50 Are connected to the motion compensation unit 106, and the terminal 51 is connected to the motion information memory 111, respectively.
続いて、動き情報生成部109の詳細な構成について説明する。図8は、動き情報生成部109の構成を示す。動き情報生成部109は、予測ベクトルモード決定部120、マージモード決定部121および予測符号化モード決定部122を含む。端子12は動き情報メモリ111に、端子13は動きベクトル検出部108に、端子14はフレームメモリ110に、端子15は予測ブロック画像取得部101に、端子16は符号列生成部104に、端子50は動き補償部106に、および端子51は動き情報メモリ111にそれぞれ接続されている。 (Configuration of the motion information generation unit 109)
Next, a detailed configuration of the motion
(動き情報生成部109の機能と動作)
以下、各部の機能と動作について説明する。予測ベクトルモード決定部120は、端子12より供給される候補ブロック群、端子13より供給されるL0予測とL1予測の動きベクトルおよびL0予測とL1予測の参照インデックス、端子14より供給される参照インデックスで示される参照画像、および端子15より供給される画像信号から、インター予測タイプを決定し、インター予測タイプに従って、L0予測とL1予測の予測ベクトルインデックスを選択してL0予測とL1予測の差分ベクトルを算出するとともに、予測誤差を算出し、レート歪み評価値を算出する。そして、当該インター予測タイプに基づいた動き情報、差分ベクトル、予測ベクトルインデックス、およびレート歪み評価値を予測符号化モード決定部122に供給する。 (Function and operation of motion information generation unit 109)
Hereinafter, the function and operation of each unit will be described. The prediction vectormode determination unit 120 includes a candidate block group supplied from the terminal 12, a motion vector for L0 prediction and L1 prediction supplied from the terminal 13, a reference index for L0 prediction and L1 prediction, and a reference index supplied from the terminal 14. The inter-prediction type is determined from the reference image shown in FIG. 5 and the image signal supplied from the terminal 15, and the prediction vector index of the L0 prediction and the L1 prediction is selected according to the inter prediction type, and the difference vector between the L0 prediction and the L1 prediction , A prediction error is calculated, and a rate distortion evaluation value is calculated. Then, motion information, a difference vector, a prediction vector index, and a rate distortion evaluation value based on the inter prediction type are supplied to the prediction coding mode determination unit 122.
以下、各部の機能と動作について説明する。予測ベクトルモード決定部120は、端子12より供給される候補ブロック群、端子13より供給されるL0予測とL1予測の動きベクトルおよびL0予測とL1予測の参照インデックス、端子14より供給される参照インデックスで示される参照画像、および端子15より供給される画像信号から、インター予測タイプを決定し、インター予測タイプに従って、L0予測とL1予測の予測ベクトルインデックスを選択してL0予測とL1予測の差分ベクトルを算出するとともに、予測誤差を算出し、レート歪み評価値を算出する。そして、当該インター予測タイプに基づいた動き情報、差分ベクトル、予測ベクトルインデックス、およびレート歪み評価値を予測符号化モード決定部122に供給する。 (Function and operation of motion information generation unit 109)
Hereinafter, the function and operation of each unit will be described. The prediction vector
マージモード決定部121は、端子12より供給される候補ブロック群、端子14より供給される参照画像、および端子15より供給される画像信号から、結合動き情報候補リストを生成し、当該結合動き情報候補リストの中から1つの結合動き情報候補を選択してマージインデックスを決定し、レート歪み評価値を算出する。そして、当該結合動き情報候補の動き情報、当該マージインデックスおよび当該レート歪み評価値を予測符号化モード決定部122に供給する。マージモード決定部121の詳細については後述する。
The merge mode determination unit 121 generates a combined motion information candidate list from the candidate block group supplied from the terminal 12, the reference image supplied from the terminal 14, and the image signal supplied from the terminal 15, and the combined motion information One merged motion information candidate is selected from the candidate list, a merge index is determined, and a rate distortion evaluation value is calculated. Then, the motion information of the combined motion information candidate, the merge index, and the rate distortion evaluation value are supplied to the predictive coding mode determination unit 122. Details of the merge mode determination unit 121 will be described later.
予測符号化モード決定部122は、予測ベクトルモード決定部120より供給されるレート歪み評価値と、マージモード決定部121より供給されるレート歪み評価値とを比較してマージフラグを決定する。
The prediction coding mode determination unit 122 compares the rate distortion evaluation value supplied from the prediction vector mode determination unit 120 and the rate distortion evaluation value supplied from the merge mode determination unit 121 to determine a merge flag.
予測ベクトルモードレート歪み評価値がマージモードレート歪み評価値未満の場合は、マージフラグを「0」に設定する。予測符号化モード決定部122は、当該マージフラグ、予測ベクトルモード決定部120より供給されるインター予測タイプ、参照インデックス、差分ベクトルと予測ベクトルインデックスを端子16に供給し、予測ベクトルモード決定部120より供給される動き情報を端子50および端子51に供給する。
When the predicted vector mode rate distortion evaluation value is less than the merge mode rate distortion evaluation value, the merge flag is set to “0”. The prediction encoding mode determination unit 122 supplies the merge flag, the inter prediction type, the reference index, the difference vector, and the prediction vector index supplied from the prediction vector mode determination unit 120 to the terminal 16, and the prediction vector mode determination unit 120 The supplied motion information is supplied to the terminal 50 and the terminal 51.
マージモードレート歪み評価値が予測ベクトルモードレート歪み評価値以下の場合は、マージフラグを「1」に設定する。予測符号化モード決定部122は、当該マージフラグおよびマージモード決定部121より供給されるマージインデックスを端子16に供給し、マージモード決定部121より供給される動き情報を端子50および端子51に供給する。なお、レート歪み評価値の具体的な算出方法は本発明の主眼ではないため詳細な説明は省略するが、予測誤差と符号量から符号量当たりの予測誤差量を算出し、レート歪み評価値が小さいほど符号化効率は高くなる特性を持つ評価値である。そのため、レート歪み評価値が小さい予測符号化モードを選択することで符号化効率を向上させることができる。
When the merge mode rate distortion evaluation value is less than or equal to the predicted vector mode rate distortion evaluation value, the merge flag is set to “1”. The predictive coding mode determination unit 122 supplies the merge flag and the merge index supplied from the merge mode determination unit 121 to the terminal 16, and supplies the motion information supplied from the merge mode determination unit 121 to the terminal 50 and the terminal 51. To do. Although a specific calculation method of the rate distortion evaluation value is not the main point of the present invention, detailed description is omitted, but the prediction error amount per code amount is calculated from the prediction error and the code amount, and the rate distortion evaluation value is calculated. The evaluation value has a characteristic that the encoding efficiency increases as the value decreases. Therefore, encoding efficiency can be improved by selecting a predictive encoding mode with a small rate distortion evaluation value.
(マージモード決定部121の構成)
続いて、マージモード決定部121の詳細な構成について説明する。図9は、マージモード決定部121の構成を説明するための図である。マージモード決定部121は、結合動き情報候補リスト生成部140および結合動き情報選択部141を含む。結合動き情報候補リスト生成部140は、実施の形態1に係る動画像符号化装置100により生成された符号列を復号する動画像復号装置200にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて同一の結合動き情報リストが生成される。 (Configuration of merge mode determination unit 121)
Next, a detailed configuration of the mergemode determination unit 121 will be described. FIG. 9 is a diagram for explaining the configuration of the merge mode determination unit 121. The merge mode determination unit 121 includes a combined motion information candidate list generation unit 140 and a combined motion information selection unit 141. The combined motion information candidate list generation unit 140 is also installed in the video decoding device 200 that decodes the code sequence generated by the video encoding device 100 according to Embodiment 1 in the same manner. The moving image decoding apparatus 200 generates the same combined motion information list.
続いて、マージモード決定部121の詳細な構成について説明する。図9は、マージモード決定部121の構成を説明するための図である。マージモード決定部121は、結合動き情報候補リスト生成部140および結合動き情報選択部141を含む。結合動き情報候補リスト生成部140は、実施の形態1に係る動画像符号化装置100により生成された符号列を復号する動画像復号装置200にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて同一の結合動き情報リストが生成される。 (Configuration of merge mode determination unit 121)
Next, a detailed configuration of the merge
(マージモード決定部121の機能と動作)
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部140は、端子12より供給される候補ブロック群からマージ候補最大数の結合動き情報候補を含む結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部141に供給する。結合動き情報候補リスト生成部140の詳細な構成については後述する。 (Function and operation of merge mode determination unit 121)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidatelist generation unit 140 generates a combined motion information candidate list including the maximum number of merge candidate motion candidates from the candidate block group supplied from the terminal 12, and uses the combined motion information candidate list as the combined motion information. This is supplied to the selection unit 141. A detailed configuration of the combined motion information candidate list generation unit 140 will be described later.
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部140は、端子12より供給される候補ブロック群からマージ候補最大数の結合動き情報候補を含む結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部141に供給する。結合動き情報候補リスト生成部140の詳細な構成については後述する。 (Function and operation of merge mode determination unit 121)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidate
結合動き情報選択部141は、結合動き情報候補リスト生成部140より供給される結合動き情報候補リストの中から、最適な結合動き情報候補を選択し、選択された結合動き情報候補を示す情報であるマージインデックスを決定して、当該マージインデックスを端子17に供給する。
The combined motion information selection unit 141 selects the optimum combined motion information candidate from the combined motion information candidate list supplied from the combined motion information candidate list generation unit 140, and is information indicating the selected combined motion information candidate. A certain merge index is determined and the merge index is supplied to the terminal 17.
ここで、最適な結合動き情報候補の選択方法について説明する。結合動き情報候補の予測方向、動きベクトルおよび参照インデックスに基づいて動き補償予測されて得られる端子14より供給される参照画像と、端子15より供給される画像信号とから予測誤差量が算出される。マージインデックスの符号量と、当該予測誤差量とからレート歪み評価値が算出されて、レート歪み評価値が最小となる結合動き情報候補が最適な結合動き情報候補として選択される。
Here, a method for selecting an optimal combined motion information candidate will be described. A prediction error amount is calculated from the reference image supplied from the terminal 14 obtained by motion compensation prediction based on the prediction direction, motion vector, and reference index of the combined motion information candidate, and the image signal supplied from the terminal 15. . A rate distortion evaluation value is calculated from the code amount of the merge index and the prediction error amount, and a combined motion information candidate that minimizes the rate distortion evaluation value is selected as an optimal combined motion information candidate.
(結合動き情報候補リスト生成部140に供給される候補ブロック群)
次に、結合動き情報候補リスト生成部140に供給される候補ブロック群について図10と図11を用いて説明する。候補ブロック群には空間候補ブロック群と時間候補ブロック群が含まれる。 (Candidate block group supplied to combined motion information candidate list generation unit 140)
Next, candidate block groups supplied to the combined motion information candidatelist generation unit 140 will be described with reference to FIGS. 10 and 11. The candidate block group includes a spatial candidate block group and a temporal candidate block group.
次に、結合動き情報候補リスト生成部140に供給される候補ブロック群について図10と図11を用いて説明する。候補ブロック群には空間候補ブロック群と時間候補ブロック群が含まれる。 (Candidate block group supplied to combined motion information candidate list generation unit 140)
Next, candidate block groups supplied to the combined motion information candidate
図10は、処理対象の予測ブロックサイズが16画素×16画素である場合の処理対象の予測ブロックの隣接ブロックを示す。実施の形態1では、空間候補ブロック群として、図10に示すブロックA1、ブロックC、ブロックD、ブロックB1およびブロックEの5ブロックとする。ここでは、空間候補ブロック群をブロックA1、ブロックC、ブロックD、ブロックB1およびブロックEの5ブロックとしたが、空間候補ブロック群は、処理対象の予測ブロックに隣接する少なくとも1以上の処理済みのブロックであればよく、これらに限定されない。例えば、ブロックA1、ブロックA2、ブロックA3、ブロックA4、ブロックB1、ブロックB2、ブロックB3、ブロックB4、ブロックC、ブロックDおよびブロックEの全てを空間候補ブロックとしてもよい。
FIG. 10 shows adjacent blocks of the prediction block to be processed when the prediction block size to be processed is 16 pixels × 16 pixels. In the first embodiment, the space candidate block group is assumed to be five blocks of block A1, block C, block D, block B1, and block E shown in FIG. Here, the spatial candidate block group is five blocks of block A1, block C, block D, block B1, and block E, but the spatial candidate block group is at least one or more processed adjacent to the prediction block to be processed. Any block may be used, and the present invention is not limited to these. For example, all of block A1, block A2, block A3, block A4, block B1, block B2, block B3, block B4, block C, block D, and block E may be spatial candidate blocks.
次に、時間候補ブロック群について図11を用いて説明する。図11は、処理対象の予測ブロックサイズが16画素×16画素である場合の処理対象の予測ブロックと同一位置にあるColPic上の予測ブロック内のブロックとその周辺ブロックを示す。実施の形態1では、時間候補ブロック群として、図11に示すブロックHとブロックI6の2ブロックとする。ここでは、時間候補ブロック群をColPic上のブロックHとブロックI6の2ブロックとしたが、時間候補ブロック群は、処理対象の予測ブロックとは別の復号済みの画像上の少なくとも1以上のブロックであればよく、これらに限定されない。例えば、ブロックHのみとしてもよい。以降、ブロックA4をブロックA、ブロックB4をブロックBと表記し、ブロックI6をブロックIと表記し、ブロックHとブロックI6のブロックを時間ブロックと表記する。
Next, the time candidate block group will be described with reference to FIG. FIG. 11 shows a block in a prediction block on ColPic and its peripheral blocks at the same position as the prediction block to be processed when the prediction block size to be processed is 16 pixels × 16 pixels. In the first embodiment, the time candidate block group includes two blocks, block H and block I6 shown in FIG. Here, the time candidate block group is two blocks of block H and block I6 on ColPic, but the time candidate block group is at least one block on a decoded image different from the prediction block to be processed. There is no limitation to these. For example, only the block H may be used. Hereinafter, the block A4 is expressed as a block A, the block B4 is expressed as a block B, the block I6 is expressed as a block I, and the blocks H and I6 are expressed as a time block.
(結合動き情報候補リスト生成部140の構成)
続いて、結合動き情報候補リスト生成部140の詳細な構成について説明する。図12は、結合動き情報候補リスト生成部140の構成を説明するための図である。端子19は結合動き情報選択部141に接続されている。結合動き情報候補リスト生成部140は、空間結合動き情報候補生成部160、時間結合動き情報候補生成部161、冗長結合動き情報候補削除部162、劣性結合動き情報候補追加部163、第1結合動き情報候補補充部164、および第2結合動き情報候補補充部165を含む。空間結合動き情報候補生成部160は劣性結合動き情報候補判定部166を含む。 (Configuration of combined motion information candidate list generation unit 140)
Next, a detailed configuration of the combined motion information candidatelist generation unit 140 will be described. FIG. 12 is a diagram for explaining the configuration of the combined motion information candidate list generation unit 140. The terminal 19 is connected to the combined motion information selection unit 141. The combined motion information candidate list generating unit 140 includes a spatially combined motion information candidate generating unit 160, a temporally combined motion information candidate generating unit 161, a redundant combined motion information candidate deleting unit 162, a recessive combined motion information candidate adding unit 163, and a first combined motion. An information candidate supplementing unit 164 and a second combined motion information candidate supplementing unit 165 are included. The spatially coupled motion information candidate generation unit 160 includes a recessive coupled motion information candidate determination unit 166.
続いて、結合動き情報候補リスト生成部140の詳細な構成について説明する。図12は、結合動き情報候補リスト生成部140の構成を説明するための図である。端子19は結合動き情報選択部141に接続されている。結合動き情報候補リスト生成部140は、空間結合動き情報候補生成部160、時間結合動き情報候補生成部161、冗長結合動き情報候補削除部162、劣性結合動き情報候補追加部163、第1結合動き情報候補補充部164、および第2結合動き情報候補補充部165を含む。空間結合動き情報候補生成部160は劣性結合動き情報候補判定部166を含む。 (Configuration of combined motion information candidate list generation unit 140)
Next, a detailed configuration of the combined motion information candidate
(結合動き情報候補リスト生成部140の機能と動作)
以下、各部の機能と動作について説明する。図13は、結合動き情報候補リスト生成部140の動作を説明するためのフローチャートである。まず、結合動き情報候補リスト生成部140は、結合動き情報候補リストを初期化する(S100)。初期化された結合動き情報候補リストには結合動き情報候補は存在しない。 (Function and operation of combined motion information candidate list generation unit 140)
Hereinafter, the function and operation of each unit will be described. FIG. 13 is a flowchart for explaining the operation of the combined motion information candidatelist generation unit 140. First, the combined motion information candidate list generation unit 140 initializes a combined motion information candidate list (S100). There are no combined motion information candidates in the initialized combined motion information candidate list.
以下、各部の機能と動作について説明する。図13は、結合動き情報候補リスト生成部140の動作を説明するためのフローチャートである。まず、結合動き情報候補リスト生成部140は、結合動き情報候補リストを初期化する(S100)。初期化された結合動き情報候補リストには結合動き情報候補は存在しない。 (Function and operation of combined motion information candidate list generation unit 140)
Hereinafter, the function and operation of each unit will be described. FIG. 13 is a flowchart for explaining the operation of the combined motion information candidate
次に、劣性結合動き情報候補判定部166は、劣性結合動き情報候補を選択して当該劣性結合動き情報候補を記憶する(S101)。記憶された劣性結合動き情報候補は結合動き情報候補リスト生成部140内で共有される。劣性結合動き情報候補判定部166の詳細な動作については後述する。次に、空間結合動き情報候補生成部160は、端子12より供給される候補ブロック群から0個から空間結合動き情報候補最大数の空間結合動き情報候補を生成して結合動き情報候補リストに追加し(S102)、当該結合動き情報候補リストと候補ブロック群を時間結合動き情報候補生成部161に供給する。空間結合動き情報候補生成部160の詳細な動作については後述する。また、空間結合動き情報候補最大数についても後述する。
Next, the recessive combined motion information candidate determination unit 166 selects a recessive combined motion information candidate and stores the recessive combined motion information candidate (S101). The stored recessive combined motion information candidates are shared in the combined motion information candidate list generation unit 140. The detailed operation of the recessive combined motion information candidate determination unit 166 will be described later. Next, the spatially coupled motion information candidate generation unit 160 generates the maximum number of spatially coupled motion information candidates from 0 candidate block groups supplied from the terminal 12 and adds them to the combined motion information candidate list. In step S102, the combined motion information candidate list and the candidate block group are supplied to the temporal combined motion information candidate generation unit 161. The detailed operation of the spatially coupled motion information candidate generation unit 160 will be described later. The maximum number of spatially coupled motion information candidates will be described later.
次に、時間結合動き情報候補生成部161は、空間結合動き情報候補生成部160より供給される候補ブロック群から0個または時間結合動き情報候補最大数の時間結合動き情報候補を生成して空間結合動き情報候補生成部160より供給される結合動き情報候補リストに追加し(S103)、当該結合動き情報候補リストを劣性結合動き情報候補追加部163に供給する。時間結合動き情報候補生成部161の詳細な動作については後述する。また、時間結合動き情報候補最大数についても後述する。
Next, the time combination motion information candidate generation unit 161 generates zero or time combination motion information candidate maximum number of time combination motion information candidates from the candidate block group supplied from the space combination motion information candidate generation unit 160 to generate a space. This is added to the combined motion information candidate list supplied from the combined motion information candidate generating unit 160 (S103), and the combined motion information candidate list is supplied to the recessive combined motion information candidate adding unit 163. The detailed operation of the time combination motion information candidate generation unit 161 will be described later. Further, the maximum number of temporally combined motion information candidates will be described later.
次に、冗長結合動き情報候補削除部162は、時間結合動き情報候補生成部161より供給される結合動き情報候補リストに登録されている結合動き情報候補を検査し、同一の動き情報を有する結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残してその他の結合動き情報候補を削除し(S104)、当該結合動き情報候補リストを劣性結合動き情報候補追加部163に供給する。したがって、当該結合動き情報候補リストに登録されている結合動き情報候補は全てが異なる結合動き情報候補となる。
Next, the redundant combined motion information candidate deletion unit 162 examines the combined motion information candidates registered in the combined motion information candidate list supplied from the temporal combined motion information candidate generation unit 161, and combines the same motion information. When there are a plurality of motion information candidates, one combined motion information candidate is left and other combined motion information candidates are deleted (S104), and the combined motion information candidate list is supplied to the recessive combined motion information candidate adding unit 163. . Accordingly, all of the combined motion information candidates registered in the combined motion information candidate list become different combined motion information candidates.
次に、劣性結合動き情報候補追加部163は、劣性結合動き情報候補が有効であれば、冗長結合動き情報候補削除部162より供給される結合動き情報候補リストの最後尾に劣性結合動き情報候補を追加し(S105)、当該結合動き情報候補リストを第1結合動き情報候補補充部164に供給する。劣性結合動き情報候補が有効でなければ、冗長結合動き情報候補削除部162より供給される結合動き情報候補リストを第1結合動き情報候補補充部164に供給する。劣性結合動き情報候補追加部163の詳細な動作については後述する。
Next, if the recessive combined motion information candidate addition unit 163 is valid, the recessive combined motion information candidate adding unit 163 adds the recessive combined motion information candidate to the tail of the combined motion information candidate list supplied from the redundant combined motion information candidate deleting unit 162. (S105), and the combined motion information candidate list is supplied to the first combined motion information candidate supplementing unit 164. If the recessive combined motion information candidate is not valid, the combined motion information candidate list supplied from the redundant combined motion information candidate deleting unit 162 is supplied to the first combined motion information candidate supplementing unit 164. The detailed operation of the recessive combined motion information candidate adding unit 163 will be described later.
次に、第1結合動き情報候補補充部164は、劣性結合動き情報候補追加部163より供給される結合動き情報候補リストに登録された結合動き情報候補から0個から2個の第1補充結合動き情報候補を生成して結合動き情報候補リストに追加し(S106)、当該結合動き情報候補リストを第2結合動き情報候補補充部165に供給する。第1結合動き情報候補補充部164の詳細な動作については後述する。
Next, the first combined motion information candidate supplementing unit 164 includes 0 to 2 first supplemental combining from the combined motion information candidates registered in the combined motion information candidate list supplied from the recessive combined motion information candidate adding unit 163. A motion information candidate is generated and added to the combined motion information candidate list (S106), and the combined motion information candidate list is supplied to the second combined motion information candidate supplementing unit 165. The detailed operation of the first combined motion information candidate supplement unit 164 will be described later.
次に、第2結合動き情報候補補充部165は、第1結合動き情報候補補充部164より供給される結合動き情報候補リストに依存しない0個から2個の第2補充結合動き情報候補を生成して第1結合動き情報候補補充部164より供給される結合動き情報候補リストに追加し(S107)、当該結合動き情報候補リストを端子19に供給する。第2結合動き情報候補補充部165の詳細な動作については後述する。
Next, the second combined motion information candidate supplementing unit 165 generates 0 to 2 second supplemental combined motion information candidates that do not depend on the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164. Then, it is added to the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 (S107), and the combined motion information candidate list is supplied to the terminal 19. The detailed operation of the second combined motion information candidate supplement unit 165 will be described later.
(劣性結合動き情報候補)
以下、劣性結合動き情報候補について説明する。図14(a)から(d)は劣性結合動き情報候補を説明するための図である。符号化ブロックは、1または2または4の予測ブロックに分割できることは上述した。図14では符号化ブロックが16x16である例を示す。符号化ブロックを多数の予測ブロックに分割することで、符号化ブロックに係る予測誤差を最小化できる一方、図6で示した予測ブロックに係るシンタックスのオーバーヘッドが予測ブロックの個数分増加する。そのため、動き情報が同一であって予測誤差が同一となる複数の予測ブロックについては1つの予測ブロックにまとめて、予測ブロックの分割数を抑制することで符号化効率を向上させることができる。 (Candidate for recessive joint motion information)
Hereinafter, the recessive combined motion information candidates will be described. FIGS. 14A to 14D are diagrams for explaining a recessive combined motion information candidate. It has been mentioned above that an encoded block can be divided into 1 or 2 or 4 prediction blocks. FIG. 14 shows an example in which the encoded block is 16 × 16. By dividing the coding block into a number of prediction blocks, the prediction error related to the coding block can be minimized, while the syntax overhead related to the prediction block shown in FIG. 6 increases by the number of prediction blocks. Therefore, a plurality of prediction blocks having the same motion information and the same prediction error can be combined into one prediction block, and the coding efficiency can be improved by suppressing the number of divisions of the prediction block.
以下、劣性結合動き情報候補について説明する。図14(a)から(d)は劣性結合動き情報候補を説明するための図である。符号化ブロックは、1または2または4の予測ブロックに分割できることは上述した。図14では符号化ブロックが16x16である例を示す。符号化ブロックを多数の予測ブロックに分割することで、符号化ブロックに係る予測誤差を最小化できる一方、図6で示した予測ブロックに係るシンタックスのオーバーヘッドが予測ブロックの個数分増加する。そのため、動き情報が同一であって予測誤差が同一となる複数の予測ブロックについては1つの予測ブロックにまとめて、予測ブロックの分割数を抑制することで符号化効率を向上させることができる。 (Candidate for recessive joint motion information)
Hereinafter, the recessive combined motion information candidates will be described. FIGS. 14A to 14D are diagrams for explaining a recessive combined motion information candidate. It has been mentioned above that an encoded block can be divided into 1 or 2 or 4 prediction blocks. FIG. 14 shows an example in which the encoded block is 16 × 16. By dividing the coding block into a number of prediction blocks, the prediction error related to the coding block can be minimized, while the syntax overhead related to the prediction block shown in FIG. 6 increases by the number of prediction blocks. Therefore, a plurality of prediction blocks having the same motion information and the same prediction error can be combined into one prediction block, and the coding efficiency can be improved by suppressing the number of divisions of the prediction block.
図14(a)は候補ブロックAが劣性結合動き情報候補となる例1を説明するための図である。符号化ブロックはマージモードで、予測ブロックサイズタイプはN×2Nとして符号化される場合の予測ブロック1の空間結合動き情報候補の位置を示している。ここで、予測ブロック0の動き情報と予測ブロック1の動き情報が同一であれば、予測ブロック0と予測ブロック1をまとめて2N×2Nとして符号化することで、予測ブロックに係るシンタックスのオーバーヘッドを減らし、符号化効率を向上させることができる。つまり、予測ブロックサイズタイプがN×2Nで且つ処理対象ブロックが予測ブロック1である場合、2N×2Nとして符号化される場合の候補ブロックに相当する候補ブロックAは結合動き情報候補として選択される可能性は低い。したがって、予測ブロックサイズタイプがN×2Nで且つ処理対象ブロックが予測ブロック1である場合に、候補ブロックAを劣性結合動き情報候補とする。
FIG. 14A is a diagram for explaining Example 1 in which candidate block A is a recessive combined motion information candidate. The encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 1 when the prediction block size type is encoded as N × 2N is shown. Here, if the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same, the prediction block 0 and the prediction block 1 are collectively encoded as 2N × 2N, thereby generating syntax overhead related to the prediction block. And the coding efficiency can be improved. That is, when the prediction block size type is N × 2N and the processing target block is the prediction block 1, the candidate block A corresponding to the candidate block when encoded as 2N × 2N is selected as a combined motion information candidate. Unlikely. Therefore, when the prediction block size type is N × 2N and the processing target block is the prediction block 1, the candidate block A is set as a recessive combined motion information candidate.
図14(b)は候補ブロックAが劣性結合動き情報候補となる例2を説明するための図である。符号化ブロックはマージモードで、予測ブロックサイズタイプはN×Nとして符号化される場合の予測ブロック3の空間結合動き情報候補の位置を示している。ここで、予測ブロック0の動き情報と予測ブロック1の動き情報が同一で且つ予測ブロック2の動き情報と予測ブロック3の動き情報が同一であれば、予測ブロック0と予測ブロック1をまとめ、さらに予測ブロック2と予測ブロック3をまとめて2N×Nとして符号化することで、予測ブロックに係るシンタックスのオーバーヘッドを減らし、符号化効率を向上させることができる。したがって、予測ブロックサイズタイプがN×Nで且つ予測ブロック0の動き情報と予測ブロック1の動き情報が同一且つ予測ブロック3である場合に、候補ブロックAを劣性結合動き情報候補とする。
FIG. 14B is a diagram for explaining Example 2 in which candidate block A is a recessive combined motion information candidate. The encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 3 when the prediction block size type is encoded as N × N is shown. If the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same, and the motion information of the prediction block 2 and the motion information of the prediction block 3 are the same, the prediction block 0 and the prediction block 1 are combined. By encoding the prediction block 2 and the prediction block 3 together as 2N × N, it is possible to reduce the syntax overhead related to the prediction block and improve the encoding efficiency. Therefore, when the prediction block size type is N × N and the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same and the prediction block 3, the candidate block A is set as a recessive combined motion information candidate.
図14(c)は候補ブロックBが劣性結合動き情報候補となる例1を説明するための図である。符号化ブロックはマージモードで、予測ブロックサイズタイプは2N×Nとして符号化する様子を示している。ここで、予測ブロック0の動き情報と予測ブロック1の動き情報が同一であれば、予測ブロック0と予測ブロック1をまとめて2N×2Nとして符号化することで、予測ブロックに係るシンタックスのオーバーヘッドを減らし、符号化効率を向上させることができる。したがって、予測ブロックサイズタイプが2N×Nで且つ処理対象ブロックが予測ブロック1である場合に、候補ブロックBを劣性結合動き情報候補とする。
FIG. 14C is a diagram for explaining Example 1 in which candidate block B is a recessive combined motion information candidate. The coding block is in the merge mode, and the prediction block size type is 2N × N. Here, if the motion information of the prediction block 0 and the motion information of the prediction block 1 are the same, the prediction block 0 and the prediction block 1 are collectively encoded as 2N × 2N, thereby generating syntax overhead related to the prediction block. And the coding efficiency can be improved. Therefore, when the prediction block size type is 2N × N and the processing target block is the prediction block 1, the candidate block B is set as a recessive combined motion information candidate.
図14(d)は候補ブロックBが劣性結合動き情報候補となる例2を説明するための図である。符号化ブロックはマージモードで、予測ブロックサイズタイプはN×Nとして符号化される場合の予測ブロック3の空間結合動き情報候補の位置を示している。ここで、予測ブロック0の動き情報と予測ブロック2の動き情報が同一で且つ予測ブロック1の動き情報と予測ブロック3の動き情報が同一であれば、予測ブロック0と予測ブロック2をまとめ、さらに予測ブロック1と予測ブロック3をまとめてN×2Nとして符号化することで、予測ブロックに係るシンタックスのオーバーヘッドを減らし、符号化効率を向上させることができる。したがって、予測ブロックサイズタイプがN×Nで且つ予測ブロック0の動き情報と予測ブロック2の動き情報が同一で且つ予測ブロック3である場合に、候補ブロックBを劣性結合動き情報候補とする。
FIG. 14D is a diagram for explaining an example 2 in which the candidate block B is a recessive combined motion information candidate. The encoded block is the merge mode, and the position of the spatially coupled motion information candidate of the prediction block 3 when the prediction block size type is encoded as N × N is shown. Here, if the motion information of the prediction block 0 and the motion information of the prediction block 2 are the same, and the motion information of the prediction block 1 and the motion information of the prediction block 3 are the same, the prediction block 0 and the prediction block 2 are combined. By encoding the prediction block 1 and the prediction block 3 together as N × 2N, it is possible to reduce the syntax overhead related to the prediction block and improve the encoding efficiency. Therefore, when the prediction block size type is N × N and the motion information of the prediction block 0 and the motion information of the prediction block 2 are the same and the prediction block 3, the candidate block B is set as a recessive combined motion information candidate.
このように、符号化対象の予測ブロックの分割タイプと符号化対象の予測ブロックの符号化ブロック内の位置とに基づいて、符号化対象の予測ブロックのサイズよりも大きなサイズの予測ブロックで動き補償予測することが符号化効率の点でより適切である結合動き情報候補を劣性結合動き情報候補として選択する。以上のように、劣性結合動き情報候補とは、より大きな予測ブロックサイズに結合されることで、符号化効率の向上する結合動き情報候補である。劣性結合動き情報とは、劣性結合動き情報候補の動き情報である。
In this way, motion compensation is performed on a prediction block having a size larger than the size of the prediction block to be encoded, based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block. A combined motion information candidate that is more appropriate to be predicted in terms of coding efficiency is selected as a recessive combined motion information candidate. As described above, the recessive combined motion information candidate is a combined motion information candidate that is improved in coding efficiency by being combined with a larger predicted block size. The recessive combined motion information is motion information of a recessive combined motion information candidate.
(劣性結合動き情報候補判定部166の動作)
図15は劣性結合動き情報候補判定部166の判定処理の一例を説明するためのフローチャートである。 (Operation of recessive combined motion information candidate determination unit 166)
FIG. 15 is a flowchart for explaining an example of the determination process of the recessive combined motion informationcandidate determination unit 166.
図15は劣性結合動き情報候補判定部166の判定処理の一例を説明するためのフローチャートである。 (Operation of recessive combined motion information candidate determination unit 166)
FIG. 15 is a flowchart for explaining an example of the determination process of the recessive combined motion information
最初に、予測ブロックサイズタイプが2N×2Nであるか検査する(S150)。予測ブロックサイズタイプが2N×2Nであれば(S150のY)、処理を終了する。予測ブロックサイズタイプが2N×2Nでなければ(S150のN)、予測ブロックサイズタイプを検査する(S151)。予測ブロックサイズタイプがN×2Nであれば(S151のN×2N)、予測ブロック1であるかを検査する(S152)。予測ブロックサイズタイプが2N×Nであれば(S151の2N×N)、予測ブロック1であるかを検査する(S154)。予測ブロックサイズタイプがN×Nであれば(S151のN×N)、予測ブロック3であるかを検査する(S156)。予測ブロックサイズタイプがN×2Nであって、予測ブロック1であれば(S152のY)、ブロックAを劣性結合動き情報候補とする(S153)。予測ブロックサイズタイプがN×2Nであって、予測ブロック1でなければ(S152のN)、処理を終了する。予測ブロックサイズタイプが2N×Nであって、予測ブロック1であれば(S154のY)、ブロックBを劣性結合動き情報候補とする(S155)。予測ブロックサイズタイプが2N×Nであって、予測ブロック1でなければ(S154のN)、処理を終了する。
First, it is checked whether the predicted block size type is 2N × 2N (S150). If the predicted block size type is 2N × 2N (Y in S150), the process ends. If the predicted block size type is not 2N × 2N (N in S150), the predicted block size type is checked (S151). If the predicted block size type is N × 2N (N × 2N in S151), it is checked whether it is a predicted block 1 (S152). If the predicted block size type is 2N × N (2N × N in S151), it is checked whether it is a predicted block 1 (S154). If the predicted block size type is N × N (N × N in S151), it is checked whether it is a predicted block 3 (S156). If the predicted block size type is N × 2N and the predicted block is 1 (Y in S152), block A is set as a recessive combined motion information candidate (S153). If the predicted block size type is N × 2N and the predicted block size is not 1 (N in S152), the process ends. If the predicted block size type is 2N × N and the predicted block is 1 (Y in S154), block B is set as a recessive combined motion information candidate (S155). If the predicted block size type is 2N × N and the predicted block size is not 1 (N in S154), the process ends.
予測ブロックサイズタイプがN×Nであって、予測ブロック3であれば(S156のY)、予測ブロック0と予測ブロック2の動き情報が同じであるか検査する(S157)。予測ブロックサイズタイプがN×Nであって、予測ブロック3でなければ(S156のN)、処理を終了する。予測ブロック0と予測ブロック2の動き情報が同じであれば(S157のY)、ブロックAを劣性結合動き情報候補とする(S158)。予測ブロック0と予測ブロック2の動き情報が同じでなければ(S157のN)、予測ブロック0と予測ブロック1の動き情報が同じであるか検査する(S159)。予測ブロック0と予測ブロック1の動き情報が同じであれば(S159のY)、ブロックBを劣性結合動き情報候補とする(S160)。予測ブロック0と予測ブロック1の動き情報が同じでなければ(S159のN)、処理を終了する。
If the prediction block size type is N × N and the prediction block 3 (Y in S156), it is checked whether the motion information of the prediction block 0 and the prediction block 2 is the same (S157). If the predicted block size type is N × N and it is not predicted block 3 (N in S156), the process is terminated. If the motion information of the prediction block 0 and the prediction block 2 is the same (Y of S157), the block A is set as a recessive combined motion information candidate (S158). If the motion information of the prediction block 0 and the prediction block 2 is not the same (N in S157), it is checked whether the motion information of the prediction block 0 and the prediction block 1 is the same (S159). If the motion information of the prediction block 0 and the prediction block 1 is the same (Y in S159), the block B is set as a recessive combined motion information candidate (S160). If the motion information of the prediction block 0 and the prediction block 1 is not the same (N in S159), the process is terminated.
以上のように、劣性結合動き情報候補が決定された場合には劣性結合動き情報候補は有効であるとし、劣性結合動き情報候補が決定されなかった場合には劣性結合動き情報候補は有効でないとする。
As described above, when the recessive combined motion information candidate is determined, the recessive combined motion information candidate is valid, and when the recessive combined motion information candidate is not determined, the recessive combined motion information candidate is not effective. To do.
図15は劣性結合動き情報候補判定部166の判定処理の一例であって、少なくとも符号化ブロックの予測ブロックへの分割数と符号化ブロック内の予測ブロックの位置の両方またはいずれかを用いて劣性結合動き情報候補が判定できればよく、これに限定されない。
例えば、予測ブロックタイプがN×Nである場合の条件判定簡略化のために、予測ブロック0と予測ブロック1の動き情報同一性判定(ステップS159)や予測ブロック0と予測ブロック2(ステップS157)の動き情報同一性判定を省略し、予測ブロック3では常にブロックAとBを劣勢結合動き情報候補とすることもできる。さらに、予測ブロック1では常にブロックAを劣勢結合動き情報候補とし、予測ブロック2では常にブロックBを劣勢結合動き情報候補とすることもできる。 FIG. 15 is an example of the determination process of the recessive combined motion informationcandidate determination unit 166, which is inferior using at least the number of divisions of the encoded block into the prediction block and / or the position of the prediction block in the encoded block. It is only necessary to be able to determine the combined motion information candidate, and the present invention is not limited to this.
For example, in order to simplify the condition determination when the prediction block type is N × N, the motion block identity determination between theprediction block 0 and the prediction block 1 (step S159) or the prediction block 0 and the prediction block 2 (step S157). It is also possible to omit the motion information identity determination for the prediction block 3 and always use blocks A and B as inferior combined motion information candidates. Furthermore, in prediction block 1, block A can always be an inferior combined motion information candidate, and in prediction block 2, block B can always be an inferior combined motion information candidate.
例えば、予測ブロックタイプがN×Nである場合の条件判定簡略化のために、予測ブロック0と予測ブロック1の動き情報同一性判定(ステップS159)や予測ブロック0と予測ブロック2(ステップS157)の動き情報同一性判定を省略し、予測ブロック3では常にブロックAとBを劣勢結合動き情報候補とすることもできる。さらに、予測ブロック1では常にブロックAを劣勢結合動き情報候補とし、予測ブロック2では常にブロックBを劣勢結合動き情報候補とすることもできる。 FIG. 15 is an example of the determination process of the recessive combined motion information
For example, in order to simplify the condition determination when the prediction block type is N × N, the motion block identity determination between the
また、予測ブロックタイプがN×Nである場合の条件判定簡略化の別の手法として、予測ブロックタイプがN×Nである場合には、劣性結合動き情報候補の判定をしないようにすることもできる。これは、符号化ブロックの予測ブロックへの分割数に基づいて、劣性結合動き情報の追加の制御をすることとなる。
Further, as another method for simplifying the condition determination when the prediction block type is N × N, when the prediction block type is N × N, the recessive combined motion information candidate may not be determined. it can. This means that additional control of the recessive joint motion information is performed based on the number of divisions of the encoded block into the prediction blocks.
(空間結合動き情報候補生成部160の詳細な動作)
続いて、空間結合動き情報候補生成部160の詳細な動作について説明する。図16は、空間結合動き情報候補生成部160の動作を説明するためのフローチャートである。空間結合動き情報候補生成部160は、候補ブロック群の空間候補ブロック群に含まれる候補ブロックであるブロックA、ブロックB、ブロックC、ブロックE、ブロックDの順に以下の処理を繰り返し行う(S110からS115)。 (Detailed operation of spatially coupled motion information candidate generation unit 160)
Next, a detailed operation of the spatially coupled motion informationcandidate generation unit 160 will be described. FIG. 16 is a flowchart for explaining the operation of the spatially coupled motion information candidate generation unit 160. The spatially coupled motion information candidate generating unit 160 repeatedly performs the following processing in the order of block A, block B, block C, block E, and block D, which are candidate blocks included in the spatial candidate block group of the candidate block group (from S110) S115).
続いて、空間結合動き情報候補生成部160の詳細な動作について説明する。図16は、空間結合動き情報候補生成部160の動作を説明するためのフローチャートである。空間結合動き情報候補生成部160は、候補ブロック群の空間候補ブロック群に含まれる候補ブロックであるブロックA、ブロックB、ブロックC、ブロックE、ブロックDの順に以下の処理を繰り返し行う(S110からS115)。 (Detailed operation of spatially coupled motion information candidate generation unit 160)
Next, a detailed operation of the spatially coupled motion information
最初に、候補ブロックが有効であるか検査する(S111)。候補ブロックが有効であるとは、候補ブロックのL0予測とL1予測の参照インデックスの少なくとも一方が0以上であることである。候補ブロックが有効であれば(S111のY)、劣性結合動き情報候補が有効であるか検査する(S112)。候補ブロックが有効でなければ(S111のN)、ステップS112からステップS115をスキップして次の候補ブロックを検査する(S116)。劣性結合動き情報候補が有効であれば(S112のY)、候補ブロックの動き情報が劣性結合動き情報候補の動き情報と同一であるか検査する(S113)。劣性結合動き情報候補が有効でなければ(S112のN)、候補ブロックの動き情報を空間結合動き情報候補として結合動き情報候補リストに追加する(S114)。候補ブロックの動き情報が劣性結合動き情報候補の動き情報と同一であれば(S113のY)、ステップS114とステップS115をスキップして次の候補ブロックを検査する(S116)。候補ブロックの動き情報が劣性結合動き情報候補の動き情報と同一でなければ(S113のN)、候補ブロックの動き情報を空間結合動き情報候補として結合動き情報候補リストに追加する(S114)。ステップS114に続いて、結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数であるか検査する(S115)。ここでは、空間結合動き情報候補最大数を4とする。結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数でなければ(S115のN)、次の候補ブロックを検査する(S115)。結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数であれば(S115のY)、処理を終了する。
First, it is checked whether the candidate block is valid (S111). That the candidate block is valid means that at least one of the reference indexes of the L0 prediction and the L1 prediction of the candidate block is 0 or more. If the candidate block is valid (Y in S111), it is checked whether the recessive combined motion information candidate is valid (S112). If the candidate block is not valid (N in S111), step S112 to step S115 are skipped and the next candidate block is inspected (S116). If the recessive combined motion information candidate is valid (Y in S112), it is checked whether the motion information of the candidate block is the same as the motion information of the recessive combined motion information candidate (S113). If the recessive combined motion information candidate is not valid (N in S112), the motion information of the candidate block is added to the combined motion information candidate list as a spatial combined motion information candidate (S114). If the motion information of the candidate block is the same as the motion information of the recessive combined motion information candidate (Y in S113), step S114 and step S115 are skipped and the next candidate block is examined (S116). If the motion information of the candidate block is not the same as the motion information of the recessive combined motion information candidate (N in S113), the motion information of the candidate block is added to the combined motion information candidate list as a spatial combined motion information candidate (S114). Following step S114, it is checked whether the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (S115). Here, the maximum number of spatially coupled motion information candidates is 4. If the number of spatially combined motion information candidates added to the combined motion information candidate list is not the maximum number of spatially combined motion information candidates (N in S115), the next candidate block is examined (S115). If the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (Y in S115), the process ends.
空間結合動き情報候補生成部160において劣性結合動き情報候補を結合動き情報候補リストに登録しないことで、例えば、ブロックA、ブロックB、ブロックC、ブロックE、ブロックDの全てが有効である場合に、劣性結合動き情報候補の代わりに劣性結合動き情報候補よりも相対的に選択確率の高いブロックDの動き情報を結合動き情報候補リストに登録することが可能となって、符号化効率を向上させることができる。
For example, when all of block A, block B, block C, block E, and block D are valid by not registering the recessive combined motion information candidate in the combined motion information candidate list in the spatially combined motion information candidate generation unit 160. , It is possible to register the motion information of block D having a higher selection probability than the recessive combined motion information candidate in the combined motion information candidate list instead of the recessive combined motion information candidate, thereby improving the encoding efficiency. be able to.
ここでは、処理対象ブロックとの接線の長く一般的に処理対象ブロックとの相関性の高いと考えられるブロックAとブロックBの動き情報を優先して結合動き情報候補リストに登録できるように処理の順序をブロックA、ブロックB、ブロックC、ブロックE、ブロックDとしたが、相関性の高い順序で結合動き情報候補が結合動き情報候補リストに登録されればよく、これに限定されない。また、空間結合動き情報候補最大数を4としたが、空間結合動き情報候補最大数は1以上で空間候補ブロック群に含まれる候補ブロック数以下であればよく、これに限定されない。また、空間結合動き情報候補の導出の簡略化のためにステップS112とステップS113を省略することもでき、候補ブロックが有効であれば(S111のY)、候補ブロックの動き情報を空間結合動き情報候補として結合動き情報候補リストに追加する(S114)としてもよい。
Here, the processing information is processed so that the motion information of block A and block B, which are generally considered to have a long tangent to the processing target block and generally have a high correlation with the processing target block, can be preferentially registered in the combined motion information candidate list. Although the order is block A, block B, block C, block E, and block D, the combined motion information candidates may be registered in the combined motion information candidate list in a highly correlated order, and the present invention is not limited to this. Further, although the maximum number of spatially coupled motion information candidates is four, the maximum number of spatially coupled motion information candidates may be 1 or more and less than or equal to the number of candidate blocks included in the spatial candidate block group, and is not limited to this. Further, in order to simplify the derivation of the spatially coupled motion information candidate, Step S112 and Step S113 can be omitted. If the candidate block is valid (Y in S111), the motion information of the candidate block is converted into the spatially coupled motion information. The candidate may be added to the combined motion information candidate list as a candidate (S114).
(時間結合動き情報候補生成部161の詳細な動作)
続いて、時間結合動き情報候補生成部161の詳細な動作について説明する。図17は、時間結合動き情報候補生成部161の動作を説明するためのフローチャートである。L0予測とL1予測の各予測方向LXについて以下の処理を繰り返し行う(S120からS127)。ここで、Xは0または1である。また、候補ブロック群の時間候補ブロック群に含まれる候補ブロックであるブロックH、ブロックIの順に以下の処理を繰り返し行う(S121からS126)。 (Detailed operation of time combination motion information candidate generation unit 161)
Subsequently, a detailed operation of the time combination motion informationcandidate generation unit 161 will be described. FIG. 17 is a flowchart for explaining the operation of the time combination motion information candidate generation unit 161. The following processing is repeated for each prediction direction LX of L0 prediction and L1 prediction (S120 to S127). Here, X is 0 or 1. Further, the following processing is repeated in the order of block H and block I, which are candidate blocks included in the time candidate block group of the candidate block group (S121 to S126).
続いて、時間結合動き情報候補生成部161の詳細な動作について説明する。図17は、時間結合動き情報候補生成部161の動作を説明するためのフローチャートである。L0予測とL1予測の各予測方向LXについて以下の処理を繰り返し行う(S120からS127)。ここで、Xは0または1である。また、候補ブロック群の時間候補ブロック群に含まれる候補ブロックであるブロックH、ブロックIの順に以下の処理を繰り返し行う(S121からS126)。 (Detailed operation of time combination motion information candidate generation unit 161)
Subsequently, a detailed operation of the time combination motion information
時間結合動き情報候補生成部161は、候補ブロックのLN予測が有効であるか検査する(S122)。ここで、Nは0または1である。ここでは、NはXと同じであるとする。候補ブロックのLN予測が有効であるとは、候補ブロックのLN予測の参照インデックスが0以上であることである。候補ブロックのLN予測が有効であれば(S122のY)、候補ブロックのLN予測の動きベクトルを基準動きベクトルとする(S123)。候補ブロックのLN予測が有効でなければ(S122のN)、ステップ123からステップ126をスキップして次の候補ブロックを検査する(S126)。
The temporal combination motion information candidate generation unit 161 checks whether the LN prediction of the candidate block is valid (S122). Here, N is 0 or 1. Here, N is the same as X. That the LN prediction of the candidate block is valid means that the reference index of the LN prediction of the candidate block is 0 or more. If the LN prediction of the candidate block is valid (Y in S122), the LN prediction motion vector of the candidate block is set as the reference motion vector (S123). If the LN prediction of the candidate block is not valid (N in S122), step 123 to step 126 are skipped and the next candidate block is examined (S126).
ステップS123に続いて、時間結合動き情報候補のLX予測の参照画像を決定する(S124)。ここでは、時間結合動き情報候補のLX予測の参照画像は、空間候補ブロック群に含まれる候補ブロックのLX予測の参照画像として最もよく利用される参照画像とする。次に、基準動きベクトルを処理対象画像と時間結合動き情報候補のLX予測の参照画像の距離に合うようにスケーリングしてスケーリングベクトルを算出し、当該スケーリングベクトルを時間結合動き情報候補のLX予測の動きベクトルとし(S125)、次の予測方向を処理する(S127)。ここでは、スケーリングベクトルの算出式については、MPEG-4AVCでの時間ダイレクト動き補償予測のスケーリングベクトルの算出式と同様とする。L0予測とL1予測について処理が終了したステップS127に続いて、時間結合動き情報候補のL0予測とL1予測の少なくとも一方の予測が有効であるか検査する(S128)。時間結合動き情報候補のLN予測が有効であるとは、時間結合動き情報候補のLN予測の参照画像が決定していることである。時間結合動き情報候補のL0予測とL1予測の少なくとも一方の予測が有効であれば(S128のY)、時間結合動き情報候補のインター予測タイプを決定して、当該時間結合動き情報候補を結合動き情報候補リストに追加する(S129)。ここでは、インター予測タイプの決定は、L0予測だけが有効であれば、時間結合動き情報候補のインター予測タイプをPred_L0とし、L1予測だけが有効であれば、時間結合動き情報候補のインター予測タイプをPred_L1とし、L0予測とL1予測の両方が有効であれば、時間結合動き情報候補のインター予測タイプをPred_BIとする。
Subsequent to step S123, a reference image for LX prediction of a temporally coupled motion information candidate is determined (S124). Here, the LX prediction reference image of the temporal combination motion information candidate is a reference image that is most frequently used as a reference image for LX prediction of candidate blocks included in the spatial candidate block group. Next, the base motion vector is scaled to match the distance between the processing target image and the LX prediction reference image of the temporally combined motion information candidate to calculate a scaling vector, and the scaling vector is used for the temporally combined motion information candidate LX prediction. A motion vector is used (S125), and the next prediction direction is processed (S127). Here, the scaling vector calculation formula is the same as the scaling vector calculation formula for temporal direct motion compensated prediction in MPEG-4 AVC. Subsequent to step S127 in which the processing for the L0 prediction and the L1 prediction is completed, it is checked whether at least one of the L0 prediction and the L1 prediction of the temporally coupled motion information candidate is valid (S128). The fact that the LN prediction of the temporally combined motion information candidate is effective means that the reference image for the LN prediction of the temporally combined motion information candidate is determined. If at least one of the L0 prediction and the L1 prediction of the temporally combined motion information candidate is valid (Y in S128), the inter prediction type of the temporally combined motion information candidate is determined, and the temporally combined motion information candidate is combined with the motion. The information is added to the information candidate list (S129). Here, when only the L0 prediction is valid, the inter prediction type is determined as Pred_L0 if only the L0 prediction is valid, and if only the L1 prediction is valid, the inter prediction type of the temporally combined motion information candidate is determined. Is Pred_L1, and if both the L0 prediction and the L1 prediction are valid, the inter prediction type of the temporally combined motion information candidate is Pred_BI.
ここでは、結合動き情報候補リストに登録できる時間結合動き情報候の最大数である時間結合動き情報候補最大数を1とした。そのため、図17には空間結合動き情報候補生成部160の動作を説明するフローチャートである図16で示したステップS115に相当する処理を省略したが、時間結合動き情報候補最大数が2以上である場合にはステップS129の後にステップS115に相当する処理を追加することもできる。
Here, the maximum number of temporally combined motion information candidates that is the maximum number of temporally combined motion information candidates that can be registered in the combined motion information candidate list is 1. Therefore, FIG. 17 omits the processing corresponding to step S115 shown in FIG. 16 which is a flowchart for explaining the operation of the spatially coupled motion information candidate generation unit 160, but the maximum number of temporally coupled motion information candidate candidates is 2 or more. In this case, a process corresponding to step S115 can be added after step S129.
ここでは、NはXと同じであるとしたが、NはXと異なっていても良く、これに限定されない。また、時間結合動き情報候補のLX予測の参照画像は、空間候補ブロック群に含まれる候補ブロックのLX予測の参照画像として最もよく利用される参照画像としたが、これに限定されず、参照インデックス0の参照画像に決定する等してもよい。また、インター予測タイプはPred_L0、Pred_L1、Pred_BIのいずれかであるとしたが、Pred_BIだけでもよく、これに限定されない。
Here, N is the same as X, but N may be different from X and is not limited to this. In addition, the reference image for LX prediction of temporal combination motion information candidates is a reference image that is most frequently used as a reference image for LX prediction of candidate blocks included in the spatial candidate block group, but is not limited thereto, and is not limited to this. The reference image may be determined to be 0. Further, although the inter prediction type is any one of Pred_L0, Pred_L1, and Pred_BI, it may be only Pred_BI and is not limited to this.
実施の形態1では、空間候補ブロック群を5、空間結合動き情報候補最大数を4、時間結合動き情報候補最大数を1として劣性結合動き情報候補の代わりに劣性結合動き情報候補よりも相対的に選択確率の高いブロックDを結合動き情報候補リストに登録できるとしたが、劣性結合動き情報候補の代わりに劣性結合動き情報候補よりも相対的に選択確率の高い空間結合動き情報候補または時間結合動き情報候補が結合動き情報候補リストに登録できればよく、この組み合わせに限定されない。例えば、空間結合動き情報候補最大数を5、時間結合動き情報候補最大数を1とし、劣性結合動き情報候補が有効でない場合には空間結合動き情報候補の5つを優先して結合動き情報候補リストに追加し、劣性結合動き情報候補が有効である場合には劣性結合動き情報候補よりも相対的に選択確率の高い時間結合動き情報候補を結合動き情報候補リストに追加するようにすることもできる。
In the first embodiment, the spatial candidate block group is 5, the spatial combined motion information candidate maximum number is 4, and the temporal combined motion information candidate maximum number is 1, which is relative to the recessive combined motion information candidate instead of the recessive combined motion information candidate. The block D having a high selection probability can be registered in the combined motion information candidate list. However, instead of the recessive combined motion information candidate, the spatially combined motion information candidate or temporal combination having a relatively higher selection probability than the recessive combined motion information candidate The motion information candidates may be registered in the combined motion information candidate list, and the present invention is not limited to this combination. For example, the maximum number of spatially combined motion information candidates is 5, the maximum number of temporally combined motion information candidates is 1, and when the recessive combined motion information candidate is not valid, the combined motion information candidates are given priority to the five spatially combined motion information candidates. In addition to the list, when the recessive combined motion information candidate is valid, the temporal combined motion information candidate having a higher selection probability than the recessive combined motion information candidate may be added to the combined motion information candidate list. it can.
(劣性結合動き情報候補追加部163の詳細な動作)
続いて、劣性結合動き情報候補追加部163の詳細な動作について説明する。図18は、劣性結合動き情報候補追加部163の動作を説明するためのフローチャートである。最初に、劣性結合動き情報候補が有効であるかどうかを検査する(S140)。劣性結合動き情報候補が有効であれば(S140のY)、劣性結合動き情報候補の動き情報を結合動き情報候補リストの最後尾に追加する(S141)。劣性結合動き情報候補が有効でなければ(S140のN)、処理を終了する。ここでは、劣性結合動き情報候補が有効であれば劣性結合動き情報候補の動き情報を結合動き情報候補リストの最後尾に追加するとしたが、結合動き情報候補リスト内から冗長な結合動き情報候補の存在を除外するために、劣性結合動き情報候補が有効で且つ結合動き情報候補リストに劣性結合動き情報候補の動き情報と同一の動き情報がない場合に結合動き情報候補リストの最後尾に追加するようにすることもできる。その場合、結合動き情報候補リスト内から冗長な結合動き情報候補の存在を除外して、その代りに第1補充結合動き情報候補や第2補充結合動き情報候補を結合動き情報候補リストに追加することで、マージモードの選択率を向上させて符号化効率を向上させることができる。 (Detailed operation of recessive combined motion information candidate adding unit 163)
Next, the detailed operation of the recessive combined motion informationcandidate adding unit 163 will be described. FIG. 18 is a flowchart for explaining the operation of the recessive combined motion information candidate adding unit 163. First, it is checked whether the recessive combined motion information candidate is valid (S140). If the recessive combined motion information candidate is valid (Y in S140), the motion information of the recessive combined motion information candidate is added to the tail of the combined motion information candidate list (S141). If the recessive combined motion information candidate is not valid (N in S140), the process ends. Here, if the recessive combined motion information candidate is valid, the motion information of the recessive combined motion information candidate is added to the tail of the combined motion information candidate list. In order to exclude the presence, if the recessive combined motion information candidate is valid and the motion information candidate list does not have the same motion information as the motion information of the recessive combined motion information candidate, it is added to the tail of the combined motion information candidate list It can also be done. In that case, the presence of redundant combined motion information candidates is excluded from the combined motion information candidate list, and instead, the first supplemental combined motion information candidate and the second supplemental combined motion information candidate are added to the combined motion information candidate list. Thus, it is possible to improve the encoding efficiency by improving the selection rate of the merge mode.
続いて、劣性結合動き情報候補追加部163の詳細な動作について説明する。図18は、劣性結合動き情報候補追加部163の動作を説明するためのフローチャートである。最初に、劣性結合動き情報候補が有効であるかどうかを検査する(S140)。劣性結合動き情報候補が有効であれば(S140のY)、劣性結合動き情報候補の動き情報を結合動き情報候補リストの最後尾に追加する(S141)。劣性結合動き情報候補が有効でなければ(S140のN)、処理を終了する。ここでは、劣性結合動き情報候補が有効であれば劣性結合動き情報候補の動き情報を結合動き情報候補リストの最後尾に追加するとしたが、結合動き情報候補リスト内から冗長な結合動き情報候補の存在を除外するために、劣性結合動き情報候補が有効で且つ結合動き情報候補リストに劣性結合動き情報候補の動き情報と同一の動き情報がない場合に結合動き情報候補リストの最後尾に追加するようにすることもできる。その場合、結合動き情報候補リスト内から冗長な結合動き情報候補の存在を除外して、その代りに第1補充結合動き情報候補や第2補充結合動き情報候補を結合動き情報候補リストに追加することで、マージモードの選択率を向上させて符号化効率を向上させることができる。 (Detailed operation of recessive combined motion information candidate adding unit 163)
Next, the detailed operation of the recessive combined motion information
一般的に、候補ブロックAや候補ブロックBは、他のブロックと比較して相対的に選択率の高い結合動き情報候補であるため、符号長の短いマージインデックスが割り当てられている。ところが、上記のように候補ブロックAや候補ブロックBが劣性結合動き情報候補の条件に該当する場合には、候補ブロックAや候補ブロックBはより大きな予測ブロックに結合された方が符号化効率が良いため、結合動き情報候補として選択される可能性は低い。そのため、空間結合動き情報候補生成部160において、劣性結合動き情報候補と同じ動き情報を結合動き情報候補リストから一旦排除し、劣性結合動き情報候補追加部163において劣性結合動き情報候補を結合動き情報候補リストの最後尾に移動させ、劣性結合動き情報候補に符号長の長いマージインデックスを割り当てて、相対的に選択率の高くなる劣性結合動き情報候補以外の候補ブロックに符号長の短いマージインデックスを割り当てることで符号化効率を向上させることができる。劣性結合動き情報候補判定部166が、予測ブロックタイプがN×Nである場合の条件判定簡略化のために、予測ブロック0と予測ブロック1の動き情報同一性判定(ステップS159)や予測ブロック0と予測ブロック2(ステップS157)の動き情報同一性判定を省略し、予測ブロック3では常にブロックAとBを劣勢結合動き情報候補とするような場合には、図18の動作をブロックAとブロックBの2つの劣勢結合動き情報候補について繰り返し処理をすることもできる。
Generally, since candidate block A and candidate block B are combined motion information candidates with a relatively high selection rate compared to other blocks, a merge index with a short code length is assigned. However, when candidate block A and candidate block B meet the condition of the recessive combined motion information candidate as described above, encoding efficiency is higher when candidate block A and candidate block B are combined with a larger prediction block. Since it is good, the possibility of being selected as a combined motion information candidate is low. Therefore, the motion information candidate generation unit 160 temporarily removes the same motion information as the recessive combined motion information candidate from the combined motion information candidate list, and the recessive combined motion information candidate adding unit 163 adds the recessive combined motion information candidate to the combined motion information. Move to the tail of the candidate list, assign a merge index with a long code length to the recessive combined motion information candidate, and assign a merge index with a short code length to candidate blocks other than the recessive combined motion information candidate that has a relatively high selectivity. By assigning, the encoding efficiency can be improved. In order to simplify the condition determination when the prediction block type is N × N, the recessive combined motion information candidate determination unit 166 determines the motion information identity between the prediction block 0 and the prediction block 1 (step S159) or the prediction block 0. When the motion information identity determination of the prediction block 2 (step S157) is omitted, and the blocks A and B are always inferior combined motion information candidates in the prediction block 3, the operation of FIG. It is also possible to repeatedly process the two inferior combined motion information candidates of B.
(第1結合動き情報候補補充部164の詳細な動作)
続いて、第1結合動き情報候補補充部164の詳細な動作について説明する。図19は、第1結合動き情報候補補充部164の動作を説明するためのフローチャートである。最初に、劣性結合動き情報候補追加部163より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第1補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式1より算出する(S170)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; (NumCandList>0)
MaxNumGenCand=0; (NumCandList==0) 式1 (Detailed operation of the first combined motion information candidate supplement unit 164)
Next, a detailed operation of the first combined motion informationcandidate supplement unit 164 will be described. FIG. 19 is a flowchart for explaining the operation of the first combined motion information candidate supplementing unit 164. First, from the number of combined motion information candidates (NumCandList) registered in the combined motion information candidate list supplied from the recessive combined motion information candidate adding unit 163 and the maximum number of merge candidates (MaxNumMergeCand), the first supplemental combined motion information candidate MaxNumGenCand, which is the maximum number for generating, is calculated from Equation 1 (S170).
MaxNumGenCand = MaxNumMergeCand-NumCandList; (NumCandList> 0)
MaxNumGenCand = 0; (NumCandList == 0)Equation 1
続いて、第1結合動き情報候補補充部164の詳細な動作について説明する。図19は、第1結合動き情報候補補充部164の動作を説明するためのフローチャートである。最初に、劣性結合動き情報候補追加部163より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第1補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式1より算出する(S170)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; (NumCandList>0)
MaxNumGenCand=0; (NumCandList==0) 式1 (Detailed operation of the first combined motion information candidate supplement unit 164)
Next, a detailed operation of the first combined motion information
MaxNumGenCand = MaxNumMergeCand-NumCandList; (NumCandList> 0)
MaxNumGenCand = 0; (NumCandList == 0)
次に、MaxNumGenCandが0より大きいか検査する(S171)。MaxNumGenCandが0より大きくなければ(S171のN)、処理を終了する。MaxNumGenCandが0より大きければ(S171のY)、以下の処理を行う。まず、組み合わせ検査回数であるloopTimesを決定する。loopTimesはNumCandList×NumCandListに設定する。ただし、loopTimesが8を超える場合にはloopTimesは8に制限する(S172)。ここで、loopTimesは0から7までの整数となる。loopTimesだけ以下の処理を繰り返し行う(S172からS180)。結合動き情報候補Mと結合動き情報候補Nの組み合わせを決定する(S173)。ここで、組み合わせ検査回数と結合動き情報候補Mと結合動き情報候補Nの関係について説明する。図20は組み合わせ検査回数と結合動き情報候補Mと結合動き情報候補Nの関係を説明するための図である。図20のようにMとNは異なる値であって、MとNの合計値が小さくなる順に設定される。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効であるか検査する(S174)。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効であれば(S174のN)、結合動き情報候補MのL0予測の参照画像と動きベクトルが結合動き情報候補NのL1予測の参照画像と動きベクトルと異なるか検査する(S175)。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効でなければ(S174のN)、次の組み合わせを処理する。結合動き情報候補MのL0予測の参照画像と結合動き情報候補NのL1予測の参照画像が異なれば(S175のY)、結合動き情報候補MのL0予測の動きベクトルと参照画像を結合動き情報候補NのL1予測の動きベクトルと参照画像と組み合わせてインター予測タイプがPred_BIである双結合動き情報候補を生成する(S176)。ここでは、第1補充結合動き情報候補として、ある結合動き情報候補のL0予測とそれとは異なる結合動き情報候補のL1予測の動き情報を組み合わせた双結合動き情報を生成する。結合動き情報候補MのL0予測の参照画像と結合動き情報候補NのL1予測の参照画像が同じであれば(S175のN)、次の組み合わせを処理する。ステップS176に続いて、双結合動き情報候補が結合動き情報候補リストに存在しないかを検査する(S177)。双結合動き情報候補が結合動き情報候補リストに存在しなければ(S177のY)、双結合動き情報候補を結合動き情報候補リストに追加する(S178)。双結合動き情報候補が結合動き情報候補リストに存在すれば(S177のN)、ステップS178をスキップする。ステップS177またはステップS178に続いて、生成した双結合動き情報の数がMaxNumGenCandであるか検査する(S179)。生成された双結合動き情報の数がMaxNumGenCandであれば(S179のY)、処理を終了する。生成された双結合動き情報の数がMaxNumGenCandでなければ(S179のN)、次の組み合わせを処理する。
Next, it is inspected whether MaxNumGenCand is larger than 0 (S171). If MaxNumGenCand is not greater than 0 (N in S171), the process ends. If MaxNumGenCand is greater than 0 (Y in S171), the following processing is performed. First, loopTimes that is the number of combination inspections is determined. loopTimes is set to NumCandList × NumCandList. However, if loopTimes exceeds 8, loopTimes is limited to 8 (S172). Here, loopTimes is an integer from 0 to 7. The following processing is repeated for loopTimes (S172 to S180). A combination of the combined motion information candidate M and the combined motion information candidate N is determined (S173). Here, the relationship between the number of combination inspections, the combined motion information candidate M, and the combined motion information candidate N will be described. FIG. 20 is a diagram for explaining the relationship between the number of combination inspections, the combined motion information candidate M, and the combined motion information candidate N. As shown in FIG. 20, M and N are different values, and are set in order of decreasing total value of M and N. It is checked whether the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (S174). If the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (N in S174), the L0 prediction reference image of the combined motion information candidate M and the motion vector are combined motion information candidates. It is checked whether or not the reference image and the motion vector of N L1 prediction are different (S175). If the L0 prediction of the combined motion information candidate M is not valid and the L1 prediction of the combined motion information candidate N is not valid (N in S174), the next combination is processed. If the reference image for L0 prediction of the combined motion information candidate M and the reference image for L1 prediction of the combined motion information candidate N are different (Y in S175), the motion vector of the combined motion information candidate M and the reference image for the L0 prediction are combined motion information. By combining the motion vector of L1 prediction of candidate N and the reference image, a bi-join motion information candidate having an inter prediction type of Pred_BI is generated (S176). Here, as the first supplemental combined motion information candidate, bi-coupled motion information is generated by combining the L0 prediction of a certain combined motion information candidate and the L1 prediction motion information of a different combined motion information candidate. If the reference image for L0 prediction of the combined motion information candidate M and the reference image for L1 prediction of the combined motion information candidate N are the same (N in S175), the next combination is processed. Subsequent to step S176, it is checked whether or not there is a combined motion information candidate in the combined motion information candidate list (S177). If the combined motion information candidate does not exist in the combined motion information candidate list (Y of S177), the combined motion information candidate is added to the combined motion information candidate list (S178). If the double coupled motion information candidate exists in the combined motion information candidate list (N in S177), step S178 is skipped. Subsequent to step S177 or step S178, it is checked whether the number of generated double coupled motion information is MaxNumGenCand (S179). If the number of generated double coupled motion information is MaxNumGenCand (Y in S179), the process ends. If the number of generated double coupled motion information is not MaxNumGenCand (N in S179), the next combination is processed.
ここでは、第1補充結合動き情報候補を、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルと参照画像を、別の結合動き情報候補のL1予測の動きベクトルと参照画像と組み合わせて、動き補償予測の方向が双方向である双結合動き情報候補としたが、これに限定されない。例えば、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルとL1予測の動きベクトルに+1などのオフセット値を加えた動き補償予測の方向が双方向である結合動き情報候補、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルまたはL1予測の動きベクトルに+1などのオフセット値を加えた動き補償予測の方向が単方向である結合動き情報候補としてもよい。第1補充結合動き情報候補の別の例として、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルを基準としてL1予測の動きベクトルをスケーリングにより求め、それらを組み合わせて動き補償予測の方向が双方向である新たな結合動き情報候補を生成してもよい。また、それらを任意に組み合わせてもよい。
Here, the first supplemental combined motion information candidate is set as an L0 prediction motion vector of a certain combined motion information candidate registered in the combined motion information candidate list and the reference image, and the L1 prediction motion vector of another combined motion information candidate. In combination with the reference image, a bi-coupled motion information candidate in which the direction of motion compensation prediction is bidirectional is used, but the present invention is not limited to this. For example, combined motion information in which the direction of motion compensated prediction in which an offset value such as +1 is added to the motion vector of L0 prediction and the motion vector of L1 prediction of a certain combined motion information candidate registered in the combined motion information candidate list is bidirectional. Combined motion information in which the direction of motion compensated prediction obtained by adding an offset value such as +1 to the motion vector of L0 prediction or the motion vector of L1 prediction of a certain combined motion information candidate registered in the candidate, combined motion information candidate list is unidirectional Can also be a candidate. As another example of the first supplemental combined motion information candidate, a motion vector of L1 prediction is obtained by scaling based on a motion vector of L0 prediction of a combined motion information candidate registered in the combined motion information candidate list, and these are combined. A new combined motion information candidate in which the direction of motion compensation prediction is bidirectional may be generated. Moreover, you may combine them arbitrarily.
ここで、第1補充結合動き情報候補は、結合動き情報候補リストに登録された結合動き情報候補の動き情報と処理対象の動き情報候補の動きに微妙にずれがある場合に、結合動き情報候補リストに登録された結合動き情報候補の動き情報を修正して有効な結合動き情報候補を生成することで、符号化効率を高めることができる。
Here, the first supplemental combined motion information candidate is a combined motion information candidate when there is a slight difference between the motion information of the combined motion information candidate registered in the combined motion information candidate list and the motion information candidate to be processed. Coding efficiency can be improved by correcting the motion information of the combined motion information candidates registered in the list to generate effective combined motion information candidates.
以上のように、結合動き情報候補として選択される可能性の低い劣性結合動き情報候補の動き情報であっても、L0予測またはL1予測のいずれか一方が処理対象ブロックの動き情報と同一である場合や、処理対象ブロックの動き情報が劣性結合動き情報候補の動き情報から微小にずれているだけである可能性がある。そのため、劣性結合動き情報候補の動き情報を削除することなく、劣性結合動き情報候補の動き情報を他の結合動き情報候補の動き情報と組み合わせたり、劣性結合動き情報候補の動き情報を修正させたりして、劣性結合動き情報候補よりも相対的に選択率の高い第1補充結合動き情報候補を生成することで、符号化効率を高めることができる。特に、双結合動き情報候補を利用する場合には少なくとも2つの結合動き情報候補が必要となるため、劣性結合動き情報候補以外の結合動き情報候補が結合動き情報候補リストに1つしか登録されていない場合に、劣性結合動き情報候補の動き情報を削除することなく、劣性結合動き情報候補の動き情報を他の結合動き情報候補の動き情報と組み合わせることで、符号化効率を高めることができる。
As described above, either the L0 prediction or the L1 prediction is the same as the motion information of the processing target block even if the motion information is a recessive combined motion information candidate that is unlikely to be selected as a combined motion information candidate. In some cases, the motion information of the processing target block may be slightly deviated from the motion information of the recessive combined motion information candidate. Therefore, without deleting the motion information of the recessive combined motion information candidate, the motion information of the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate, or the motion information of the recessive combined motion information candidate is corrected. Then, by generating the first supplemental combined motion information candidate having a higher selectivity than the recessive combined motion information candidate, it is possible to increase the encoding efficiency. In particular, since at least two combined motion information candidates are required when using the dual combined motion information candidate, only one combined motion information candidate other than the recessive combined motion information candidate is registered in the combined motion information candidate list. If not, the motion information of the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate without deleting the motion information of the recessive combined motion information candidate, so that the coding efficiency can be improved.
(第2結合動き情報候補補充部165の詳細な動作)
続いて、第2結合動き情報候補補充部165の詳細な動作について説明する。図21は、第2結合動き情報候補補充部165の動作を説明するためのフローチャートである。最初に、第1結合動き情報候補補充部164より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第2補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式2より算出する(S190)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; (NumCandList>0)
MaxNumGenCand=2; (NumCandList==0) 式2 (Detailed operation of second combined motion information candidate supplementing unit 165)
Next, the detailed operation of the second combined motion informationcandidate supplement unit 165 will be described. FIG. 21 is a flowchart for explaining the operation of the second combined motion information candidate supplementing unit 165. First, from the number of combined motion information candidates (NumCandList) registered in the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 and the maximum number of merge candidates (MaxNumMergeCand), the second supplemental combined motion information is obtained. MaxNumGenCand, which is the maximum number of candidates to be generated, is calculated from Equation 2 (S190).
MaxNumGenCand = MaxNumMergeCand-NumCandList; (NumCandList> 0)
MaxNumGenCand = 2; (NumCandList == 0)Equation 2
続いて、第2結合動き情報候補補充部165の詳細な動作について説明する。図21は、第2結合動き情報候補補充部165の動作を説明するためのフローチャートである。最初に、第1結合動き情報候補補充部164より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第2補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式2より算出する(S190)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; (NumCandList>0)
MaxNumGenCand=2; (NumCandList==0) 式2 (Detailed operation of second combined motion information candidate supplementing unit 165)
Next, the detailed operation of the second combined motion information
MaxNumGenCand = MaxNumMergeCand-NumCandList; (NumCandList> 0)
MaxNumGenCand = 2; (NumCandList == 0)
次に、以下の処理をiについてMaxNumGenCand回繰り返し行う(S191からS195)。ここで、iは0からMaxNumGenCand-1の整数となる。L0予測の動きベクトルが(0,0)、参照インデックスがiであって、L1予測の動きベクトルが(0,0)、参照インデックスがiであるインター予測タイプがPred_BIである第2補充結合動き情報候補を生成する(S192)。第2補充結合動き情報候補が結合動き情報候補リストに存在しないかを検査する(S193)。第2補充結合動き情報候補が結合動き情報候補リストに存在しなければ(S193のY)、第2補充結合動き情報候補を結合動き情報候補リストに追加する(S194)。第2補充結合動き情報候補が結合動き情報候補リストに存在すれば(S193のN)、次のiについて処理する(S195)。
Next, the following process is repeated MaxNumCand times for i (S191 to S195). Here, i is an integer from 0 to MaxNumGenCand-1. The second supplemental combined motion in which the motion vector for L0 prediction is (0,0), the reference index is i, the motion vector for L1 prediction is (0,0), and the inter prediction type for which the reference index is i is Pred_BI. Information candidates are generated (S192). It is checked whether the second supplementary combined motion information candidate exists in the combined motion information candidate list (S193). If the second supplementary combined motion information candidate does not exist in the combined motion information candidate list (Y in S193), the second supplemental combined motion information candidate is added to the combined motion information candidate list (S194). If the second supplementary combined motion information candidate exists in the combined motion information candidate list (N in S193), the next i is processed (S195).
ここでは、第2補充結合動き情報候補を、L0予測の動きベクトルが(0,0)、参照インデックスがiであって、L1予測の動きベクトルが(0,0)、参照インデックスがiであるインター予測タイプがPred_BIである結合動き情報候補とした。これは、一般的な動画像において、L0予測の動きベクトルとL1予測の動きベクトルが(0,0)である結合動き情報候補の発生頻度が統計的に高いためである。結合動き情報候補リストに登録された結合動き情報候補の動き情報に依存せず、統計的に利用頻度が高い結合動き情報候補であれば、これに限定されない。例えば、L0予測やL1予測の動きベクトルはそれぞれ(0,0)以外のベクトル値でもよく、L0予測とL1予測の参照インデックスが異なるように設定してもよい。また、第2補充結合動き情報候補を符号化済みの画像や符号化済みの画像の一部の発生頻度の高い動き情報とし、符号化ストリームに符号化して伝送して設定することもできる。
Here, the second supplementary combined motion information candidate has a motion vector for L0 prediction of (0, 0), a reference index of i, a motion vector of L1 prediction of (0, 0), and a reference index of i. The combined motion information candidate whose inter prediction type is Pred_BI is used. This is because, in a general moving image, the frequency of occurrence of combined motion information candidates in which the motion vector for L0 prediction and the motion vector for L1 prediction are (0, 0) is statistically high. The present invention is not limited to this as long as it is a combined motion information candidate that is statistically frequently used without depending on the motion information of the combined motion information candidate registered in the combined motion information candidate list. For example, the motion vectors of L0 prediction and L1 prediction may be vector values other than (0, 0), respectively, and may be set so that the reference indexes of L0 prediction and L1 prediction are different. Alternatively, the second supplementary combined motion information candidate can be set as an encoded image or motion information with a high occurrence frequency of a part of the encoded image, encoded in an encoded stream, and transmitted.
ここで、第2補充結合動き情報候補として結合動き情報候補リストに登録された結合動き情報候補に依存しない結合動き情報候補を設定することで、結合動き情報候補リストに登録された結合動き情報候補が0個である場合に、マージモードを利用することを可能とし、符号化効率を向上させることができる。また、結合動き情報候補リストに登録された結合動き情報候補の動き情報と処理対象の動き情報候補の動きが異なる場合に、結合動き情報候補リストに統計的に利用頻度の高い新たな結合動き情報候補を追加して選択肢の幅を広げることで、符号化効率を向上させることができる。
Here, by setting a combined motion information candidate that does not depend on the combined motion information candidate registered in the combined motion information candidate list as the second supplemental combined motion information candidate, the combined motion information candidate registered in the combined motion information candidate list When the number is zero, it is possible to use the merge mode and improve the encoding efficiency. In addition, when the motion information of the combined motion information candidate registered in the combined motion information candidate list is different from the motion information candidate motion to be processed, new combined motion information that is statistically frequently used in the combined motion information candidate list Encoding efficiency can be improved by adding candidates and expanding the range of options.
(動画像復号装置200の構成)
次に、実施の形態1の動画像復号装置を説明する。図22は、実施の形態1に係る動画像復号装置200の構成を示す図である。動画像復号装置200は、動画像符号化装置100により符号化された符号列を復号して再生画像を生成する装置である。 (Configuration of moving picture decoding apparatus 200)
Next, the moving picture decoding apparatus according to the first embodiment will be described. FIG. 22 is a diagram showing a configuration of thevideo decoding device 200 according to Embodiment 1. The video decoding device 200 is a device that generates a playback image by decoding the code string encoded by the video encoding device 100.
次に、実施の形態1の動画像復号装置を説明する。図22は、実施の形態1に係る動画像復号装置200の構成を示す図である。動画像復号装置200は、動画像符号化装置100により符号化された符号列を復号して再生画像を生成する装置である。 (Configuration of moving picture decoding apparatus 200)
Next, the moving picture decoding apparatus according to the first embodiment will be described. FIG. 22 is a diagram showing a configuration of the
動画像復号装置200は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像復号装置200は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。符号化ブロックの分割、予測ブロックサイズタイプの決定、予測ブロックサイズと予測ブロックの符号化ブロック内の位置(予測ブロックの位置情報)の決定、予測符号化モードがイントラであるかの決定は図示しない上位の制御部で決定されているものとし、ここでは予測符号化モードがイントラでない場合について説明する。なお、復号対象の予測ブロックの位置情報、予測ブロックサイズに関しては動画像復号装置200内で共有していることとし、図示しない。
The video decoding device 200 is realized by hardware such as an information processing device including a CPU (Central Processing Unit), a frame memory, and a hard disk. The moving picture decoding apparatus 200 realizes functional components described below by operating the above components. The coding block division, the prediction block size type determination, the prediction block size and the position of the prediction block in the coding block (position information of the prediction block), and the determination whether the prediction coding mode is intra are not shown. It is assumed that it is determined by the upper control unit, and here, a case where the predictive coding mode is not intra will be described. Note that the position information and the prediction block size of the prediction block to be decoded are shared in the video decoding device 200 and are not shown.
実施の形態1の動画像復号装置200は、符号列解析部201、予測誤差復号部202、加算部203、動き情報再生部204、動き補償部205、フレームメモリ206および動き情報メモリ207を備える。
The moving picture decoding apparatus 200 according to Embodiment 1 includes a code string analysis unit 201, a prediction error decoding unit 202, an addition unit 203, a motion information reproduction unit 204, a motion compensation unit 205, a frame memory 206, and a motion information memory 207.
(動画像復号装置200の動作)
以下、各部の機能と動作について説明する。符号列解析部201は、端子30より供給された符号列を解析して予測誤差符号化データ、マージフラグ、マージインデックス、動き補償予測の予測方向(インター予測タイプ)、参照インデックス、差分ベクトル、および予測ベクトルインデックスをシンタックスに従ってエントロピー復号する。エントロピー復号は算術符号化やハフマン符号化などの可変長符号化を含む方法によって実施される。そして、当該予測誤差符号化データを予測誤差復号部202に、当該マージフラグ、当該マージインデックス、当該インター予測タイプ、当該参照インデックス、当該差分ベクトル、および当該予測ベクトルインデックスを動き情報再生部204に供給する。 (Operation of the video decoding device 200)
Hereinafter, the function and operation of each unit will be described. The codestring analysis unit 201 analyzes the code string supplied from the terminal 30 to generate prediction error encoded data, a merge flag, a merge index, a motion compensation prediction direction (inter prediction type), a reference index, a difference vector, and Entropy decodes the prediction vector index according to the syntax. Entropy decoding is performed by a method including variable length coding such as arithmetic coding or Huffman coding. Then, the prediction error encoded data is supplied to the prediction error decoding unit 202, and the merge flag, the merge index, the inter prediction type, the reference index, the difference vector, and the prediction vector index are supplied to the motion information reproduction unit 204. To do.
以下、各部の機能と動作について説明する。符号列解析部201は、端子30より供給された符号列を解析して予測誤差符号化データ、マージフラグ、マージインデックス、動き補償予測の予測方向(インター予測タイプ)、参照インデックス、差分ベクトル、および予測ベクトルインデックスをシンタックスに従ってエントロピー復号する。エントロピー復号は算術符号化やハフマン符号化などの可変長符号化を含む方法によって実施される。そして、当該予測誤差符号化データを予測誤差復号部202に、当該マージフラグ、当該マージインデックス、当該インター予測タイプ、当該参照インデックス、当該差分ベクトル、および当該予測ベクトルインデックスを動き情報再生部204に供給する。 (Operation of the video decoding device 200)
Hereinafter, the function and operation of each unit will be described. The code
動き情報再生部204は、符号列解析部201より供給されるマージフラグ、マージインデックス、インター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスと、動き情報メモリ207より供給される候補ブロック群から、動き情報を再生し、当該動き情報を動き補償部205および動き情報メモリ207に供給する。動き情報再生部204の詳細な構成については後述する。
The motion information reproduction unit 204 includes a merge flag, a merge index, an inter prediction type, a reference index, a difference vector, and a prediction vector index supplied from the code string analysis unit 201 and a candidate block group supplied from the motion information memory 207. The motion information is reproduced, and the motion information is supplied to the motion compensation unit 205 and the motion information memory 207. A detailed configuration of the motion information reproducing unit 204 will be described later.
動き補償部205は、動き情報再生部204より供給される動き情報に基づいて、フレームメモリ206内の参照インデックスが示す参照画像を、動きベクトルに基づき動き補償して予測信号を生成する。予測方向が双予測であれば、L0予測とL1予測の予測信号を平均したものを予測信号として生成し、当該予測信号を加算部203に供給する。
The motion compensation unit 205 performs motion compensation on the reference image indicated by the reference index in the frame memory 206 based on the motion information supplied from the motion information reproduction unit 204, and generates a prediction signal. If the prediction direction is bi-prediction, an average of the prediction signals of the L0 prediction and the L1 prediction is generated as a prediction signal, and the prediction signal is supplied to the adding unit 203.
予測誤差復号部202は、符号列解析部201より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部203に供給する。
The prediction error decoding unit 202 performs a process such as inverse quantization or inverse orthogonal transform on the prediction error encoded data supplied from the code string analysis unit 201 to generate a prediction error signal, and the prediction error signal is It supplies to the addition part 203.
加算部203は、予測誤差復号部202より供給される予測誤差信号と、動き補償部205より供給される予測信号とを加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ206および端子31に供給する。
The adding unit 203 adds the prediction error signal supplied from the prediction error decoding unit 202 and the prediction signal supplied from the motion compensation unit 205 to generate a decoded image signal, and the decoded image signal is stored in the frame memory 206 and Supply to terminal 31.
フレームメモリ206および動き情報メモリ207は、動画像符号化装置100のフレームメモリ110および動き情報メモリ111と同一の機能を有する。フレームメモリ206は、加算部203より供給される復号画像信号を記憶する。動き情報メモリ207は、動き情報再生部204より供給される動き情報を最小の予測ブロックサイズ単位で記憶する。
The frame memory 206 and the motion information memory 207 have the same functions as the frame memory 110 and the motion information memory 111 of the moving picture coding apparatus 100. The frame memory 206 stores the decoded image signal supplied from the adding unit 203. The motion information memory 207 stores the motion information supplied from the motion information reproducing unit 204 in units of the minimum predicted block size.
(動き情報再生部204の詳細な構成)
続いて、動き情報再生部204の詳細な構成について説明する。図23は、動き情報再生部204の構成を示す。動き情報再生部204は、符号化モード判定部210、動きベクトル再生部211および結合動き情報再生部212を含む。端子32は符号列解析部201に、端子33は動き情報メモリ207に、端子34は動き補償部205に、端子36は動き情報メモリ207にそれぞれ接続されている。 (Detailed configuration of the motion information playback unit 204)
Next, a detailed configuration of the motioninformation reproducing unit 204 will be described. FIG. 23 shows the configuration of the motion information playback unit 204. The motion information playback unit 204 includes an encoding mode determination unit 210, a motion vector playback unit 211, and a combined motion information playback unit 212. The terminal 32 is connected to the code string analysis unit 201, the terminal 33 is connected to the motion information memory 207, the terminal 34 is connected to the motion compensation unit 205, and the terminal 36 is connected to the motion information memory 207.
続いて、動き情報再生部204の詳細な構成について説明する。図23は、動き情報再生部204の構成を示す。動き情報再生部204は、符号化モード判定部210、動きベクトル再生部211および結合動き情報再生部212を含む。端子32は符号列解析部201に、端子33は動き情報メモリ207に、端子34は動き補償部205に、端子36は動き情報メモリ207にそれぞれ接続されている。 (Detailed configuration of the motion information playback unit 204)
Next, a detailed configuration of the motion
(動き情報再生部204の詳細な動作)
以下、各部の機能と動作について説明する。符号化モード判定部210は、符号列解析部201より供給されるマージフラグが「0」であるか「1」であるか判定する。マージフラグが「0」であれば、符号列解析部201より供給されるインター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスを動きベクトル再生部211に供給する。マージフラグが「1」であれば、符号列解析部201より供給されるマージインデックスを結合動き情報再生部212に供給する。 (Detailed operation of the motion information playback unit 204)
Hereinafter, the function and operation of each unit will be described. The encodingmode determination unit 210 determines whether the merge flag supplied from the code string analysis unit 201 is “0” or “1”. If the merge flag is “0”, the inter prediction type, reference index, difference vector, and prediction vector index supplied from the code string analysis unit 201 are supplied to the motion vector reproduction unit 211. If the merge flag is “1”, the merge index supplied from the code string analysis unit 201 is supplied to the combined motion information reproduction unit 212.
以下、各部の機能と動作について説明する。符号化モード判定部210は、符号列解析部201より供給されるマージフラグが「0」であるか「1」であるか判定する。マージフラグが「0」であれば、符号列解析部201より供給されるインター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスを動きベクトル再生部211に供給する。マージフラグが「1」であれば、符号列解析部201より供給されるマージインデックスを結合動き情報再生部212に供給する。 (Detailed operation of the motion information playback unit 204)
Hereinafter, the function and operation of each unit will be described. The encoding
動きベクトル再生部211は、符号化モード判定部210より供給されるインター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスと、端子33より供給される候補ブロック群から、動きベクトルを再生して動き情報を生成し、端子34及び端子36に供給する。
The motion vector reproduction unit 211 reproduces a motion vector from the inter prediction type, the reference index, the difference vector, and the prediction vector index supplied from the encoding mode determination unit 210 and the candidate block group supplied from the terminal 33. Motion information is generated and supplied to the terminals 34 and 36.
結合動き情報再生部212は、符号化モード判定部210より供給されるマージインデックスと、端子33より供給される候補ブロック群から、動き情報を再生して端子34及び端子36に供給する。
The combined motion information reproduction unit 212 reproduces motion information from the merge index supplied from the encoding mode determination unit 210 and the candidate block group supplied from the terminal 33 and supplies the motion information to the terminal 34 and the terminal 36.
(結合動き情報再生部212の詳細な構成)
続いて、結合動き情報再生部212の詳細な構成について説明する。図24は、結合動き情報再生部212の構成を示す。結合動き情報再生部212は、結合動き情報候補リスト生成部230および結合動き情報選択部231を含む。端子35は符号化モード判定部210に接続されている。 (Detailed Configuration of Combined Motion Information Reproducing Unit 212)
Next, a detailed configuration of the combined motioninformation reproduction unit 212 will be described. FIG. 24 shows the configuration of the combined motion information playback unit 212. The combined motion information reproduction unit 212 includes a combined motion information candidate list generation unit 230 and a combined motion information selection unit 231. The terminal 35 is connected to the encoding mode determination unit 210.
続いて、結合動き情報再生部212の詳細な構成について説明する。図24は、結合動き情報再生部212の構成を示す。結合動き情報再生部212は、結合動き情報候補リスト生成部230および結合動き情報選択部231を含む。端子35は符号化モード判定部210に接続されている。 (Detailed Configuration of Combined Motion Information Reproducing Unit 212)
Next, a detailed configuration of the combined motion
(結合動き情報再生部212の詳細な動作)
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部230は動画像符号化装置100の結合動き情報候補リスト生成部140と同一の機能を有し、動画像符号化装置100の結合動き情報候補リスト生成部140と同一の動作によって結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部231に供給する。 (Detailed operation of the combined motion information reproduction unit 212)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidatelist generation unit 230 has the same function as the combined motion information candidate list generation unit 140 of the video encoding device 100, and is the same as the combined motion information candidate list generation unit 140 of the video encoding device 100. The combined motion information candidate list is generated by the operation, and the combined motion information candidate list is supplied to the combined motion information selection unit 231.
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部230は動画像符号化装置100の結合動き情報候補リスト生成部140と同一の機能を有し、動画像符号化装置100の結合動き情報候補リスト生成部140と同一の動作によって結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部231に供給する。 (Detailed operation of the combined motion information reproduction unit 212)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidate
結合動き情報選択部231は、結合動き情報候補リスト生成部230より供給される結合動き情報候補リストの中から、端子35より供給されるマージインデックスで示される結合動き情報候補を選択して結合動き情報を決定し、当該結合動き情報の動き情報を端子34及び端子36に供給する。
The combined motion information selection unit 231 selects a combined motion information candidate indicated by the merge index supplied from the terminal 35 from the combined motion information candidate list supplied from the combined motion information candidate list generation unit 230 and combines motion The information is determined, and the motion information of the combined motion information is supplied to the terminal 34 and the terminal 36.
(効果の説明)
本発明の実施の形態1による動画像符号化装置及び動画像復号装置による効果を説明する。図25は本発明の実施の形態1による効果の一例を説明する図である。図25は候補ブロックAが劣性結合動き情報候補となる場合に劣性結合動き情報候補の結合動き情報候補リストへの後方追加による効果を示す。ここでは、結合動き情報候補リストには、候補ブロックA、候補ブロックB、候補ブロックC、候補ブロックE、候補ブロックTが登録されているとする。マージインデックス0(候補ブロックA)、マージインデックス1(候補ブロックB)、マージインデックス2(候補ブロックC)、マージインデックス3(候補ブロックE)、マージインデックス4(候補ブロックT)の選択確率がそれぞれ、2%、60%、14%、12%、12%であるとする。厳密には劣性結合動き情報候補を結合動き情報候補リストの前方に追加した場合と劣性結合動き情報候補を結合動き情報候補リストの後方に追加した場合とではマージインデックスの選択確率は変動するが、ここでは説明の簡略化のためマージインデックスの選択確率は変動しないものとして説明する。以降の効果を説明する例についても同様とする。この場合、前方追加のマージインデックスの符号長の期待値は2.6ビットとなる(式3)。一方、後方追加のマージインデックスの符号長の期待値は1.8ビットとなる(式4)。したがって、後方追加のマージインデックスの符号長の期待値は前方追加よりも0.8ビット短くなり、符号化効率が向上することがわかる。
0.02x1+0.6x2+0.14x3+0.12x4+0.12x4=2.6 式3
0.6x1+0.14x2+0.12x3+0.12x4+0.02x4=1.8 式4 (Explanation of effect)
The effects of the moving picture coding apparatus and the moving picture decoding apparatus according toEmbodiment 1 of the present invention will be described. FIG. 25 is a diagram for explaining an example of the effect according to the first embodiment of the present invention. FIG. 25 shows the effect of backward addition of a recessive combined motion information candidate to the combined motion information candidate list when candidate block A is a recessive combined motion information candidate. Here, it is assumed that candidate block A, candidate block B, candidate block C, candidate block E, and candidate block T are registered in the combined motion information candidate list. The selection probabilities of merge index 0 (candidate block A), merge index 1 (candidate block B), merge index 2 (candidate block C), merge index 3 (candidate block E), and merge index 4 (candidate block T) are respectively Suppose that they are 2%, 60%, 14%, 12%, and 12%. Strictly speaking, the merge index selection probability varies between when the recessive combined motion information candidate is added in front of the combined motion information candidate list and when the recessive combined motion information candidate is added behind the combined motion information candidate list. Here, for simplification of description, it is assumed that the merge index selection probability does not change. The same applies to examples for explaining the subsequent effects. In this case, the expected code length of the forward added merge index is 2.6 bits (Formula 3). On the other hand, the expected value of the code length of the merge index added later is 1.8 bits (Formula 4). Therefore, it can be seen that the expected value of the code length of the merge index added backward is 0.8 bits shorter than the forward addition, and the coding efficiency is improved.
0.02x1 + 0.6x2 + 0.14x3 + 0.12x4 + 0.12x4 = 2.6Equation 3
0.6x1 + 0.14x2 + 0.12x3 + 0.12x4 + 0.02x4 = 1.8Equation 4
本発明の実施の形態1による動画像符号化装置及び動画像復号装置による効果を説明する。図25は本発明の実施の形態1による効果の一例を説明する図である。図25は候補ブロックAが劣性結合動き情報候補となる場合に劣性結合動き情報候補の結合動き情報候補リストへの後方追加による効果を示す。ここでは、結合動き情報候補リストには、候補ブロックA、候補ブロックB、候補ブロックC、候補ブロックE、候補ブロックTが登録されているとする。マージインデックス0(候補ブロックA)、マージインデックス1(候補ブロックB)、マージインデックス2(候補ブロックC)、マージインデックス3(候補ブロックE)、マージインデックス4(候補ブロックT)の選択確率がそれぞれ、2%、60%、14%、12%、12%であるとする。厳密には劣性結合動き情報候補を結合動き情報候補リストの前方に追加した場合と劣性結合動き情報候補を結合動き情報候補リストの後方に追加した場合とではマージインデックスの選択確率は変動するが、ここでは説明の簡略化のためマージインデックスの選択確率は変動しないものとして説明する。以降の効果を説明する例についても同様とする。この場合、前方追加のマージインデックスの符号長の期待値は2.6ビットとなる(式3)。一方、後方追加のマージインデックスの符号長の期待値は1.8ビットとなる(式4)。したがって、後方追加のマージインデックスの符号長の期待値は前方追加よりも0.8ビット短くなり、符号化効率が向上することがわかる。
0.02x1+0.6x2+0.14x3+0.12x4+0.12x4=2.6 式3
0.6x1+0.14x2+0.12x3+0.12x4+0.02x4=1.8 式4 (Explanation of effect)
The effects of the moving picture coding apparatus and the moving picture decoding apparatus according to
0.02x1 + 0.6x2 + 0.14x3 + 0.12x4 + 0.12x4 = 2.6
0.6x1 + 0.14x2 + 0.12x3 + 0.12x4 + 0.02x4 = 1.8
以上のように、劣性結合動き情報候補を空間結合動き情報候補や時間結合動き情報候補よりもマージインデックスの符号長の長くなる結合動き情報候補リストの最後尾に追加して、相対的に選択率の高くなる劣性結合動き情報候補以外の候補ブロックに符号長の短いマージインデックスを割り当てることで符号化効率を向上させることができる。
図26は本発明の実施の形態1による効果の別の例を説明する図である。ここでは、候補ブロック群の中で候補ブロックA、候補ブロックB、及び候補ブロックTが有効であって、候補ブロックAと候補ブロックBの動き補償予測の方向は共にPred_BIであるとする。また、結合動き情報候補リストには、候補ブロックA、候補ブロックB、候補ブロックT、候補ブロックAと候補ブロックBから生成された2つの双結合動き情報候補であるBD0とBD1が登録されているとする。マージインデックス0(候補ブロックA)、マージインデックス1(候補ブロックB)、マージインデックス2(候補ブロックT)、マージインデックス3(双結合動き情報候補BD0)、マージインデックス4(双結合動き情報候補BD1)の選択確率がそれぞれ、5%、60%、15%、10%、10%であるとする。計算式は省略するが、前方追加のマージインデックスの符号長の期待値は2.36ビットとなる。一方、後方追加のマージインデックスの符号長の期待値は1.46ビットとなる。したがって、後方追加のマージインデックスの符号長の期待値は前方追加よりも0.9ビット短くなり、符号化効率が向上することがわかる。 As described above, the inferior combined motion information candidate is added to the tail of the combined motion information candidate list in which the code length of the merge index is longer than that of the spatially combined motion information candidate or the temporally combined motion information candidate, and the selectivity is relatively Coding efficiency can be improved by assigning a merge index having a short code length to candidate blocks other than the inferior joint motion information candidate that increases.
FIG. 26 is a diagram for explaining another example of the effect according to the first embodiment of the present invention. Here, it is assumed that candidate block A, candidate block B, and candidate block T are valid in the candidate block group, and the motion compensation prediction directions of candidate block A and candidate block B are both Pred_BI. In the combined motion information candidate list, candidate block A, candidate block B, candidate block T, and two double combined motion information candidates generated from candidate block A and candidate block B, BD0 and BD1, are registered. And Merge index 0 (candidate block A), merge index 1 (candidate block B), merge index 2 (candidate block T), merge index 3 (bijoin motion information candidate BD0), merge index 4 (bijoin motion information candidate BD1) Are the selection probabilities of 5%, 60%, 15%, 10%, and 10%, respectively. Although the calculation formula is omitted, the expected value of the code length of the merge index added forward is 2.36 bits. On the other hand, the expected value of the code length of the backward added merge index is 1.46 bits. Therefore, it can be seen that the expected code length of the merge index added backward is 0.9 bits shorter than the forward addition, and the coding efficiency is improved.
図26は本発明の実施の形態1による効果の別の例を説明する図である。ここでは、候補ブロック群の中で候補ブロックA、候補ブロックB、及び候補ブロックTが有効であって、候補ブロックAと候補ブロックBの動き補償予測の方向は共にPred_BIであるとする。また、結合動き情報候補リストには、候補ブロックA、候補ブロックB、候補ブロックT、候補ブロックAと候補ブロックBから生成された2つの双結合動き情報候補であるBD0とBD1が登録されているとする。マージインデックス0(候補ブロックA)、マージインデックス1(候補ブロックB)、マージインデックス2(候補ブロックT)、マージインデックス3(双結合動き情報候補BD0)、マージインデックス4(双結合動き情報候補BD1)の選択確率がそれぞれ、5%、60%、15%、10%、10%であるとする。計算式は省略するが、前方追加のマージインデックスの符号長の期待値は2.36ビットとなる。一方、後方追加のマージインデックスの符号長の期待値は1.46ビットとなる。したがって、後方追加のマージインデックスの符号長の期待値は前方追加よりも0.9ビット短くなり、符号化効率が向上することがわかる。 As described above, the inferior combined motion information candidate is added to the tail of the combined motion information candidate list in which the code length of the merge index is longer than that of the spatially combined motion information candidate or the temporally combined motion information candidate, and the selectivity is relatively Coding efficiency can be improved by assigning a merge index having a short code length to candidate blocks other than the inferior joint motion information candidate that increases.
FIG. 26 is a diagram for explaining another example of the effect according to the first embodiment of the present invention. Here, it is assumed that candidate block A, candidate block B, and candidate block T are valid in the candidate block group, and the motion compensation prediction directions of candidate block A and candidate block B are both Pred_BI. In the combined motion information candidate list, candidate block A, candidate block B, candidate block T, and two double combined motion information candidates generated from candidate block A and candidate block B, BD0 and BD1, are registered. And Merge index 0 (candidate block A), merge index 1 (candidate block B), merge index 2 (candidate block T), merge index 3 (bijoin motion information candidate BD0), merge index 4 (bijoin motion information candidate BD1) Are the selection probabilities of 5%, 60%, 15%, 10%, and 10%, respectively. Although the calculation formula is omitted, the expected value of the code length of the merge index added forward is 2.36 bits. On the other hand, the expected value of the code length of the backward added merge index is 1.46 bits. Therefore, it can be seen that the expected code length of the merge index added backward is 0.9 bits shorter than the forward addition, and the coding efficiency is improved.
(実施の形態1の変形例1)
実施の形態1の劣性結合動き情報候補判定部166の判定処理は、図15のように少なくとも符号化ブロックの予測ブロックへの分割数と符号化ブロック内の予測ブロックの位置の両方またはいずれかを用いて劣性結合動き情報候補が判定できるとした。例えば、予測ブロックタイプがN×Nである場合に劣性結合動き情報候補を判定しない条件判定簡略化手法として、図27のように符号化ブロックの予測ブロックへの分割数と予測ブロックの幅と予測ブロックの高さを用いて劣性結合動き情報候補が判定することもできる。図27は劣性結合動き情報候補判定部166の判定処理の一例を説明するためのフローチャートである。以下、実施の形態1の変形例2の劣性結合動き情報候補判定部166の動作について図27を用いて説明する。 (Modification 1 of Embodiment 1)
The determination process of the recessive joint motion informationcandidate determination unit 166 according to Embodiment 1 includes at least either the number of divisions of the encoded block into the prediction block and / or the position of the prediction block in the encoded block as shown in FIG. It was assumed that a recessive combined motion information candidate could be determined. For example, as a condition determination simplification method that does not determine a recessive combined motion information candidate when the prediction block type is N × N, as shown in FIG. The recessive combined motion information candidate can also be determined using the block height. FIG. 27 is a flowchart for explaining an example of the determination process of the recessive combined motion information candidate determination unit 166. Hereinafter, the operation of the recessive combined motion information candidate determination unit 166 according to the second modification of the first embodiment will be described with reference to FIG.
実施の形態1の劣性結合動き情報候補判定部166の判定処理は、図15のように少なくとも符号化ブロックの予測ブロックへの分割数と符号化ブロック内の予測ブロックの位置の両方またはいずれかを用いて劣性結合動き情報候補が判定できるとした。例えば、予測ブロックタイプがN×Nである場合に劣性結合動き情報候補を判定しない条件判定簡略化手法として、図27のように符号化ブロックの予測ブロックへの分割数と予測ブロックの幅と予測ブロックの高さを用いて劣性結合動き情報候補が判定することもできる。図27は劣性結合動き情報候補判定部166の判定処理の一例を説明するためのフローチャートである。以下、実施の形態1の変形例2の劣性結合動き情報候補判定部166の動作について図27を用いて説明する。 (
The determination process of the recessive joint motion information
最初に、予測ブロック1であるかを検査する(S200)。予測ブロック1であれば(S200のY)、予測ブロックの高さは予測ブロックの幅より大きいか検査する(S201)。予測ブロック1でなければ(S200のN)、処理を終了する。予測ブロックの高さは予測ブロックの幅より大きければ(S201のY)、ブロックAを劣性結合動き情報候補とし(S202)、処理を終了する。予測ブロックの高さは予測ブロックの幅より大きくなければ(S201のN)、予測ブロックの高さは予測ブロックの幅より小さいか検査する(S203)。予測ブロックの高さは予測ブロックの幅より小さければ(S203のY)、ブロックBを劣性結合動き情報候補とし(S204)、処理を終了する。予測ブロックの高さは予測ブロックの幅より小さくなければ(S203のN)、処理を終了する。
First, it is checked whether it is the prediction block 1 (S200). If it is the prediction block 1 (Y in S200), it is checked whether the height of the prediction block is larger than the width of the prediction block (S201). If it is not the prediction block 1 (N of S200), a process will be complete | finished. If the height of the prediction block is larger than the width of the prediction block (Y in S201), block A is set as a recessive combined motion information candidate (S202), and the process ends. If the height of the prediction block is not larger than the width of the prediction block (N in S201), it is checked whether the height of the prediction block is smaller than the width of the prediction block (S203). If the height of the prediction block is smaller than the width of the prediction block (Y in S203), block B is set as a recessive combined motion information candidate (S204), and the process ends. If the height of the prediction block is not smaller than the width of the prediction block (N in S203), the process is terminated.
(実施の形態1の変形例2)
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように劣性結合動き情報候補追加部163を冗長結合動き情報候補削除部162の後に設置したが、劣性結合動き情報候補追加部163を空間結合動き情報候補生成部160の後に設置してもよい。 (Modification 2 of Embodiment 1)
In the configuration of the combined motion information candidatelist generation unit 140 according to the first embodiment, the recessive combined motion information candidate adding unit 163 is installed after the redundant combined motion information candidate deleting unit 162 as shown in FIG. The unit 163 may be installed after the spatially coupled motion information candidate generation unit 160.
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように劣性結合動き情報候補追加部163を冗長結合動き情報候補削除部162の後に設置したが、劣性結合動き情報候補追加部163を空間結合動き情報候補生成部160の後に設置してもよい。 (
In the configuration of the combined motion information candidate
この場合、結合動き情報候補リストにおいて、劣性結合動き情報候補を時間結合動き情報候補よりも後ろに登録することはできないが、劣性結合動き情報候補の追加処理が空間結合動き情報候補生成部160内で完結するように構成することもできるため、空間結合動き情報候補生成部160と時間結合動き情報候補生成部161の独立性を高め、回路設計やソフトウェア設計を容易にすることができる。
In this case, the recessive combined motion information candidate cannot be registered after the temporal combined motion information candidate in the combined motion information candidate list, but the process of adding the recessive combined motion information candidate is performed in the spatial combined motion information candidate generation unit 160. Therefore, the independence of the spatially coupled motion information candidate generating unit 160 and the temporally coupled motion information candidate generating unit 161 can be increased, and circuit design and software design can be facilitated.
(実施の形態1の変形例3)
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように劣性結合動き情報候補追加部163を冗長結合動き情報候補削除部162の後に設置したが、劣性結合動き情報候補追加部163を第1結合動き情報候補補充部164や第2結合動き情報候補補充部165の後に設置してもよい。 (Modification 3 of Embodiment 1)
In the configuration of the combined motion information candidatelist generation unit 140 according to the first embodiment, the recessive combined motion information candidate adding unit 163 is installed after the redundant combined motion information candidate deleting unit 162 as shown in FIG. The unit 163 may be installed after the first combined motion information candidate supplementing unit 164 and the second combined motion information candidate supplementing unit 165.
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように劣性結合動き情報候補追加部163を冗長結合動き情報候補削除部162の後に設置したが、劣性結合動き情報候補追加部163を第1結合動き情報候補補充部164や第2結合動き情報候補補充部165の後に設置してもよい。 (
In the configuration of the combined motion information candidate
この場合、第1結合動き情報候補補充部164において、劣性結合動き情報候補以外の結合動き情報候補から第1補充結合動き情報候補が生成される場合に、劣性結合動き情報候補よりも相対的に選択確率の高くなる第1補充結合動き情報候補に劣性結合動き情報候補よりも符号長の短いマージインデックスを割り当てることで符号化効率を向上させることができる。また、第2補充結合動き情報候補が劣性結合動き情報候補よりも相対的に選択確率の高くなるような場合には、第2補充結合動き情報候補に劣性結合動き情報候補よりも符号長の短いマージインデックスを割り当てることで符号化効率を向上させることができる。
In this case, in the first combined motion information candidate supplementing unit 164, when the first supplemental combined motion information candidate is generated from the combined motion information candidates other than the recessive combined motion information candidate, the first combined motion information candidate supplementing unit 164 is relatively more than the recessive combined motion information candidate. Encoding efficiency can be improved by allocating a merge index having a code length shorter than that of the recessive combined motion information candidate to the first supplemental combined motion information candidate having a high selection probability. When the second supplemental combined motion information candidate has a relatively higher selection probability than the recessive combined motion information candidate, the second supplemental combined motion information candidate has a shorter code length than the recessive combined motion information candidate. By assigning the merge index, the encoding efficiency can be improved.
以上のように、劣性結合動き情報候補と同一の動き情報を削除することなく、劣性結合動き情報候補と同一の動き情報を他の結合動き情報候補の動き情報と組み合わせたり、劣性結合動き情報候補と同一の動き情報を修正させたりして、劣性結合動き情報候補よりも相対的に選択率の高い第1補充結合動き情報候補を生成することで、符号化効率を高めることができる。特に、双結合動き情報候補を利用する場合には少なくとも2つの結合動き情報候補が必要となるため、劣性結合動き情報候補以外の結合動き情報候補が結合動き情報候補リストに1つしか登録されていない場合に、劣性結合動き情報候補と同一の動き情報を削除することなく、劣性結合動き情報候補と同一の動き情報を他の結合動き情報候補の動き情報と組み合わせることで、符号化効率を高めることができる。
As described above, without deleting the same motion information as the recessive combined motion information candidate, the same motion information as the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate, or the recessive combined motion information candidate. By generating the same supplementary motion information and generating a first supplemental combined motion information candidate having a relatively higher selection rate than the recessive combined motion information candidate, the encoding efficiency can be improved. In particular, since at least two combined motion information candidates are required when using the dual combined motion information candidate, only one combined motion information candidate other than the recessive combined motion information candidate is registered in the combined motion information candidate list. If not, the same motion information as the recessive combined motion information candidate is combined with the motion information of another combined motion information candidate without deleting the same motion information as the recessive combined motion information candidate, thereby increasing the coding efficiency. be able to.
(実施の形態1の変形例4)
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように空間結合動き情報候補生成部160が劣性結合動き情報候補判定部166を含むとしたが、劣性結合動き情報候補追加部163よりも前に劣性結合動き情報候補が結合動き情報候補リストに登録されていなければよく、これに限定されない。例えば、冗長結合動き情報候補削除部162が劣性結合動き情報候補判定部166を含む構成とすることもできる。 (Modification 4 of Embodiment 1)
In the configuration of the combined motion information candidatelist generation unit 140 according to Embodiment 1, the spatial combined motion information candidate generation unit 160 includes the recessive combined motion information candidate determination unit 166 as shown in FIG. The recessive combined motion information candidate is not registered in the combined motion information candidate list before the unit 163, and the present invention is not limited to this. For example, the redundant combined motion information candidate deletion unit 162 may include a recessive combined motion information candidate determination unit 166.
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のように空間結合動き情報候補生成部160が劣性結合動き情報候補判定部166を含むとしたが、劣性結合動き情報候補追加部163よりも前に劣性結合動き情報候補が結合動き情報候補リストに登録されていなければよく、これに限定されない。例えば、冗長結合動き情報候補削除部162が劣性結合動き情報候補判定部166を含む構成とすることもできる。 (
In the configuration of the combined motion information candidate
この場合、冗長結合動き情報候補削除部162にて劣性結合動き情報候補の動き情報と同一の動き情報を持つ空間結合動き情報候補を結合動き情報候補リストから除外することができ、その代りに第1補充結合動き情報候補や第2補充結合動き情報候補を結合動き情報候補リストに追加することで、マージモードの選択率を向上させて符号化効率を向上させることができる。
In this case, the redundant combined motion information candidate deletion unit 162 can exclude the spatially combined motion information candidate having the same motion information as the motion information of the recessive combined motion information candidate from the combined motion information candidate list. By adding the 1 supplementary combined motion information candidate and the second supplemental combined motion information candidate to the combined motion information candidate list, it is possible to improve the merge mode selection rate and improve the encoding efficiency.
(実施の形態1の変形例5)
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のようにしたが、第1結合動き情報候補補充部164と第2結合動き情報候補補充部165は一方または両方がなくてもよい。 (Modification 5 of Embodiment 1)
The configuration of the combined motion information candidatelist generation unit 140 according to the first embodiment is as shown in FIG. 12, but the first combined motion information candidate supplement unit 164 and the second combined motion information candidate supplement unit 165 do not have one or both. Also good.
実施の形態1の結合動き情報候補リスト生成部140の構成は図12のようにしたが、第1結合動き情報候補補充部164と第2結合動き情報候補補充部165は一方または両方がなくてもよい。 (
The configuration of the combined motion information candidate
[実施の形態2]
以下、実施の形態2について説明する。実施の形態1とは結合動き情報候補リスト生成部140の構成と動作が異なる。 [Embodiment 2]
The second embodiment will be described below. The configuration and operation of the combined motion information candidatelist generation unit 140 are different from those of the first embodiment.
以下、実施の形態2について説明する。実施の形態1とは結合動き情報候補リスト生成部140の構成と動作が異なる。 [Embodiment 2]
The second embodiment will be described below. The configuration and operation of the combined motion information candidate
最初に、結合動き情報候補リスト生成部140の構成について説明する。図28は実施の形態2の結合動き情報候補リスト生成部140の構成を説明するための図である。図12の実施の形態1の結合動き情報候補リスト生成部140とは、劣性結合動き情報候補削除部167が第1結合動き情報候補補充部164の後に追加されていることが異なる。
First, the configuration of the combined motion information candidate list generation unit 140 will be described. FIG. 28 is a diagram for explaining the configuration of the combined motion information candidate list generation unit 140 according to the second embodiment. 12 differs from the combined motion information candidate list generation unit 140 of Embodiment 1 in that a recessive combined motion information candidate deletion unit 167 is added after the first combined motion information candidate supplement unit 164.
次に、結合動き情報候補リスト生成部140の動作について説明する。図29は実施の形態2の結合動き情報候補リスト生成部140の動作を説明するための図である。図13の実施の形態1の結合動き情報候補リスト生成部140の動作とは、ステップS106に続いて、劣性結合動き情報候補削除部167が結合動き情報候補リストから劣性結合動き情報候補を削除するステップ(S108)が設置されていることが異なる。
Next, the operation of the combined motion information candidate list generation unit 140 will be described. FIG. 29 is a diagram for explaining the operation of the combined motion information candidate list generation unit 140 according to the second embodiment. The operation of the combined motion information candidate list generation unit 140 of Embodiment 1 in FIG. 13 is that the recessive combined motion information candidate deletion unit 167 deletes the recessive combined motion information candidate from the combined motion information candidate list following step S106. The difference is that step (S108) is installed.
次に、劣性結合動き情報候補削除部167の動作について説明する。図30は劣性結合動き情報候補削除部167の動作を説明するための図である。第1結合動き情報候補補充部164より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)分の結合動き情報候補Mについて以下の処理を繰り返し行う(S210からS213)。ここで、Mは0からNumCandList-1までの整数となる。候補ブロックMは劣性結合動き情報であるか検査する(S211)。候補ブロックMが劣性結合動き情報であれば(S211のY)、結合動き情報候補リストから劣性結合動き情報候補を削除して(S212)、処理を終了する。候補ブロックMが劣性結合動き情報でなければ(S211のN)、次の結合動き情報候補を処理する(S213)。
Next, the operation of the recessive combined motion information candidate deletion unit 167 will be described. FIG. 30 is a diagram for explaining the operation of the recessive combined motion information candidate deletion unit 167. The following processing is repeated for the combined motion information candidates M corresponding to the number (NumCandList) of combined motion information candidates registered in the combined motion information candidate list supplied from the first combined motion information candidate supplementing unit 164 (S210 to S213). . Here, M is an integer from 0 to NumCandList-1. Whether the candidate block M is recessive combined motion information is checked (S211). If the candidate block M is recessive combined motion information (Y in S211), the recessive combined motion information candidate is deleted from the combined motion information candidate list (S212), and the process is terminated. If the candidate block M is not the recessive combined motion information (N in S211), the next combined motion information candidate is processed (S213).
(効果の説明)
本発明の実施の形態2による動画像符号化装置及び動画像復号装置による効果を説明する。第2補充結合動き情報候補が符号化済みの画像や符号化済みの画像の一部において発生頻度の高かった動き情報を利用して設定された場合や予め選択率の高い動き情報候補が設定された場合などのように、第2補充結合動き情報候補の選択確率が劣性結合動き情報候補の選択確率よりも相対的に高ければ、結合動き情報候補リストから劣性結合動き情報候補を削除し、結合動き情報候補リストに第2補充結合動き情報候補を追加することで、符号化効率を向上させることができる。 (Explanation of effect)
The effects of the moving picture coding apparatus and moving picture decoding apparatus according toEmbodiment 2 of the present invention will be described. When the second supplementary combined motion information candidate is set using motion information having a high occurrence frequency in a coded image or a part of a coded image, a motion information candidate having a high selection rate is set in advance. If the selection probability of the second supplemental combined motion information candidate is relatively higher than the selection probability of the recessive combined motion information candidate, as in the case where the second supplemental combined motion information candidate is selected, the recessive combined motion information candidate is deleted from the combined motion information candidate list and combined By adding the second supplementary combined motion information candidate to the motion information candidate list, the encoding efficiency can be improved.
本発明の実施の形態2による動画像符号化装置及び動画像復号装置による効果を説明する。第2補充結合動き情報候補が符号化済みの画像や符号化済みの画像の一部において発生頻度の高かった動き情報を利用して設定された場合や予め選択率の高い動き情報候補が設定された場合などのように、第2補充結合動き情報候補の選択確率が劣性結合動き情報候補の選択確率よりも相対的に高ければ、結合動き情報候補リストから劣性結合動き情報候補を削除し、結合動き情報候補リストに第2補充結合動き情報候補を追加することで、符号化効率を向上させることができる。 (Explanation of effect)
The effects of the moving picture coding apparatus and moving picture decoding apparatus according to
(実施の形態2の変形例)
実施の形態2の劣性結合動き情報候補削除部167の動作は図32のように結合動き情報候補リストに登録された劣性結合動き情報候補を単純に削除するとしたが、劣性結合動き情報候補である予測ブロックの結合動き情報が重複結合動き情報候補であるか否かを判定することによって、結合動き情報候補リストに登録された劣性結合動き情報候補を削除するか否かを決定することもできる。 (Modification of Embodiment 2)
The operation of the recessive combined motion informationcandidate deletion unit 167 according to Embodiment 2 is simply to delete the recessive combined motion information candidate registered in the combined motion information candidate list as shown in FIG. 32, but it is a recessive combined motion information candidate. It can also be determined whether or not to delete the recessive combined motion information candidate registered in the combined motion information candidate list by determining whether or not the combined motion information of the prediction block is a duplicate combined motion information candidate.
実施の形態2の劣性結合動き情報候補削除部167の動作は図32のように結合動き情報候補リストに登録された劣性結合動き情報候補を単純に削除するとしたが、劣性結合動き情報候補である予測ブロックの結合動き情報が重複結合動き情報候補であるか否かを判定することによって、結合動き情報候補リストに登録された劣性結合動き情報候補を削除するか否かを決定することもできる。 (Modification of Embodiment 2)
The operation of the recessive combined motion information
以下、重複結合動き情報候補の判定を伴った実施の形態2の拡張例について説明する。図31は実施の形態2の変形例における劣性結合動き情報候補削除部167の動作を説明するための図である。図30とは、ステップS213が追加されている点が異なる。劣性結合動き情報候補を含む予測ブロックの結合動き情報は重複結合動き情報候補であるか検査する(ステップS213)。劣性結合動き情報候補を含む予測ブロックの結合動き情報候補が重複結合動き情報候補であれば(ステップS213のY)、結合動き情報候補リストから劣性結合動き情報候補を削除して(S212)、処理を終了する。劣性結合動き情報候補を含む予測ブロックの結合動き情報が重複結合動き情報候補でなければ(ステップS213のN)、処理を終了する。
Hereinafter, an extended example of the second embodiment accompanied by determination of overlapping combined motion information candidates will be described. FIG. 31 is a diagram for explaining the operation of the recessive combined motion information candidate deletion unit 167 in the modification of the second embodiment. It differs from FIG. 30 in that step S213 is added. It is checked whether the combined motion information of the prediction block including the recessive combined motion information candidate is a redundant combined motion information candidate (step S213). If the combined motion information candidate of the prediction block including the recessive combined motion information candidate is an overlapping combined motion information candidate (Y in step S213), the recessive combined motion information candidate is deleted from the combined motion information candidate list (S212), and processing is performed. Exit. If the combined motion information of the prediction block including the recessive combined motion information candidate is not a redundant combined motion information candidate (N in step S213), the process ends.
続いて、重複結合動き情報候補について説明する。図32は重複結合動き情報候補を説明するための図である。図32は符号化ブロックが16x16である例を示す。図32(a)は予測ブロックサイズタイプがN×2Nの場合の重複結合動き情報候補を説明するための図であって、予測ブロックサイズタイプがN×2Nの場合の予測ブロック1の劣性結合動き情報候補である予測ブロック0の空間結合動き情報候補である候補ブロックA、候補ブロックB、候補ブロックC、候補ブロックD、及び候補ブロックEを示す。図32(b)は、予測ブロックサイズタイプが2N×2Nの予測ブロック0の場合の空間結合動き情報候補である候補ブロックA、候補ブロックB、候補ブロックC、候補ブロックD、及び候補ブロックEを示す。図32(a)と図32(b)において、候補ブロックA、候補ブロックD、及び候補ブロックEの位置は重複していることがわかる。これらある予測ブロックサイズタイプにおいてより大きな予測ブロックサイズタイプの候補ブロックの位置と重複している候補ブロックを重複結合動き情報候補とする。
Subsequently, the overlapping combined motion information candidate will be described. FIG. 32 is a diagram for explaining overlapping combined motion information candidates. FIG. 32 shows an example in which the encoded block is 16 × 16. FIG. 32A is a diagram for explaining a candidate for overlapping joint motion information when the prediction block size type is N × 2N, and the recessive joint motion of the prediction block 1 when the prediction block size type is N × 2N. A candidate block A, a candidate block B, a candidate block C, a candidate block D, and a candidate block E that are spatial combination motion information candidates of the prediction block 0 that is an information candidate are shown. FIG. 32B shows candidate block A, candidate block B, candidate block C, candidate block D, and candidate block E, which are spatially coupled motion information candidates in the case of the prediction block 0 having a prediction block size type of 2N × 2N. Show. In FIG. 32A and FIG. 32B, it can be seen that the positions of candidate block A, candidate block D, and candidate block E overlap. A candidate block that overlaps with a position of a candidate block of a larger predicted block size type in a certain predicted block size type is set as a redundant combined motion information candidate.
ここで、予測ブロックサイズタイプがN×2Nの場合の予測ブロック1の劣性結合動き情報候補である予測ブロック0において、これら重複結合動き情報候補が結合動き情報候補として選択されている場合、予測ブロック1において重複結合動き情報候補を選択することは、2N×2Nとして重複結合動き情報候補を選択した場合と等価となるため、必ず符号化効率の低下を伴う。一方、予測ブロックサイズタイプがN×2Nの場合の予測ブロック1の劣性結合動き情報候補である予測ブロック0において、これら重複結合動き情報候補でない候補ブロックBまたは候補ブロックCが結合動き情報候補として選択されている場合、2N×2Nとして選択されることはないため、予測ブロック1において候補ブロックBまたは候補ブロックCを選択することで符号化効率は向上する可能性がある。図32(c)は予測ブロックサイズタイプが2N×Nの予測ブロック0の場合の重複結合動き情報候補が候補ブロックB、候補ブロックC、及び候補ブロックDとなることを示す図である。図32(d)は予測ブロックサイズタイプがN×Nの予測ブロック2の場合の重複結合動き情報候補が候補ブロックA、候補ブロックD、及び候補ブロックEとなることを示す図である。図32(e)は予測ブロックサイズタイプがN×Nの予測ブロック1の場合の重複結合動き情報候補が候補ブロックB、候補ブロックC、及び候補ブロックDとなることを示す図である。
Here, in the prediction block 0 that is the recessive combined motion information candidate of the prediction block 1 when the prediction block size type is N × 2N, when these overlapping combined motion information candidates are selected as combined motion information candidates, the prediction block Since selecting the overlapped joint motion information candidate in 1 is equivalent to the case of selecting the overlapped joint motion information candidate as 2N × 2N, it always involves a decrease in coding efficiency. On the other hand, in the prediction block 0 that is the recessive combined motion information candidate of the prediction block 1 when the prediction block size type is N × 2N, the candidate block B or candidate block C that is not the overlapped combined motion information candidate is selected as the combined motion information candidate In such a case, since 2N × 2N is not selected, there is a possibility that encoding efficiency may be improved by selecting candidate block B or candidate block C in prediction block 1. FIG. 32 (c) is a diagram showing that the overlapped joint motion information candidates for the prediction block 0 of 2N × N prediction block size type are candidate block B, candidate block C, and candidate block D. FIG. 32 (d) is a diagram showing that the overlapped joint motion information candidates in the case of the prediction block 2 with the prediction block size type of N × N are candidate block A, candidate block D, and candidate block E. FIG. 32 (e) is a diagram showing that the overlapped joint motion information candidates for the prediction block 1 of which the prediction block size type is N × N are candidate block B, candidate block C, and candidate block D.
以上のように、劣性結合動き情報候補である予測ブロックの結合動き情報が重複結合動き情報候補であるか否かを判定することによって、結合動き情報候補リストに登録された劣性結合動き情報候補を削除するか否かを決定することで、符号化効率を向上させることができる。
As described above, by determining whether or not the combined motion information of the prediction block that is a recessive combined motion information candidate is a redundant combined motion information candidate, the recessive combined motion information candidate registered in the combined motion information candidate list is obtained. By determining whether or not to delete, encoding efficiency can be improved.
以上述べた実施の形態の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有しており、動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。
The moving image encoded stream output from the moving image encoding apparatus of the embodiment described above has a specific data format so that it can be decoded according to the encoding method used in the embodiment. Therefore, the moving picture decoding apparatus corresponding to the moving picture encoding apparatus can decode the encoded stream of this specific data format.
動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。
When a wired or wireless network is used to exchange an encoded stream between a moving image encoding device and a moving image decoding device, the encoded stream is converted into a data format suitable for the transmission form of the communication path. It may be transmitted. In that case, a video transmission apparatus that converts the encoded stream output from the video encoding apparatus into encoded data in a data format suitable for the transmission form of the communication channel and transmits the encoded data to the network, and receives the encoded data from the network Then, a moving image receiving apparatus that restores the encoded stream and supplies the encoded stream to the moving image decoding apparatus is provided.
動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。
The moving image transmitting apparatus is a memory that buffers the encoded stream output from the moving image encoding apparatus, a packet processing unit that packetizes the encoded stream, and transmission that transmits the packetized encoded data via the network. Part. The moving image receiving apparatus generates a coded stream by packetizing the received data, a receiving unit that receives the packetized coded data via a network, a memory that buffers the received coded data, and packet processing. And a packet processing unit provided to the video decoding device.
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ROM(リード・オンリ・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。
The above processing relating to encoding and decoding can be realized as a transmission, storage, and reception device using hardware, and is stored in a ROM (Read Only Memory), a flash memory, or the like. It can also be realized by firmware or software such as a computer. The firmware program and software program can be recorded on a computer-readable recording medium, provided from a server through a wired or wireless network, or provided as a data broadcast of terrestrial or satellite digital broadcasting Is also possible.
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .
100 動画像符号化装置、 101 予測ブロック画像取得部、 102 減算部、 103 予測誤差符号化部、 104 符号列生成部、 105 予測誤差復号部、 106 動き補償部、 107 加算部、 108 動きベクトル検出部、 109 動き情報生成部、 110 フレームメモリ、 111 動き情報メモリ、 120 予測ベクトルモード決定部、 121 マージモード決定部、 122 予測符号化モード決定部、 130 予測ベクトル候補リスト生成部、 131 予測ベクトル決定部、 140 結合動き情報候補リスト生成部、 141 結合動き情報選択部、 160 空間結合動き情報候補生成部、 161 時間結合動き情報候補生成部、 162 冗長結合動き情報候補削除部、 163 劣性結合動き情報候補追加部、 164 第1結合動き情報候補補充部、 165 第2結合動き情報候補補充部、 166 劣性結合動き情報候補判定部、 167 劣性結合動き情報候補削除部、 200 動画像復号装置、 201 符号列解析部、 202 予測誤差復号部、 203 加算部、 204 動き情報再生部、 205 動き補償部、 206 フレームメモリ、 207 動き情報メモリ、 210 符号化モード判定部、 211 動きベクトル再生部、 212 結合動き情報再生部、 230 結合動き情報候補リスト生成部、 231 結合動き情報選択部。
DESCRIPTION OF SYMBOLS 100 moving image encoder, 101 prediction block image acquisition part, 102 subtraction part, 103 prediction error encoding part, 104 code sequence generation part, 105 prediction error decoding part, 106 motion compensation part, 107 addition part, 108 motion vector detection Unit, 109 motion information generation unit, 110 frame memory, 111 motion information memory, 120 prediction vector mode determination unit, 121 merge mode determination unit, 122 prediction encoding mode determination unit, 130 prediction vector candidate list generation unit, 131 prediction vector determination 140, combined motion information candidate list generation unit, 141 combined motion information selection unit, 160 spatial combined motion information candidate generation unit, 161 temporal combined motion information candidate generation unit, 162 redundant combined motion information candidate deletion unit, 16 Inferior combined motion information candidate adding unit, 164 First combined motion information candidate supplementing unit, 165 Second combined motion information candidate supplementing unit, 166 Inferior combined motion information candidate determining unit, 167 Inferior combined motion information candidate deleting unit, 200 video decoding Device, 201 code sequence analysis unit, 202 prediction error decoding unit, 203 addition unit, 204 motion information reproduction unit, 205 motion compensation unit, 206 frame memory, 207 motion information memory, 210 encoding mode determination unit, 211 motion vector reproduction unit 212, combined motion information playback unit, 230 combined motion information candidate list generation unit, 231 combined motion information selection unit.
本発明は、動き補償予測で利用する動き情報を符号化する動画像符号化技術に利用できる。
The present invention can be used for a moving picture coding technique for coding motion information used in motion compensation prediction.
Claims (26)
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化装置であって、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出部と、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部と、
前記選択候補を含む候補リストを生成する候補リスト生成部と、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部と、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定部と、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化部とを備えることを特徴とする動画像符号化装置。 A video encoding device that encodes a video by performing motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type,
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation unit that uses the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidating unit that does not make block motion information the selection candidate;
A candidate list generating unit for generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. An additional part to be added to the candidate list,
A determination unit that determines motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
A moving picture encoding apparatus comprising: an encoding unit that encodes information for specifying the determined motion information in the candidate list. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加部をさらに備えることを特徴とする請求項1に記載の動画像符号化装置。 2. The moving picture encoding apparatus according to claim 1, further comprising an adding unit that adds motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う動画像符号化装置であって、
符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する符号化済みの複数の隣接ブロックの動き情報からなる第1の動き情報群の中から、前記符号化対象の予測ブロックのサイズよりも大きなサイズの予測ブロックで動き補償予測することが可能な劣性結合動き情報候補を選択する劣性結合動き情報候補判定部と、
前記第1の動き情報群から前記劣性結合動き情報候補を除いた第2の動き情報群を用いて、前記符号化対象の予測ブロックに利用するための結合動き情報候補の結合動き情報候補リストを生成する結合動き情報候補リスト生成部と、
少なくとも1つの前記劣性結合動き情報候補を前記結合動き情報候補リストに追加する結合動き情報候補追加部と、
前記結合動き情報候補リストから1つの結合動き情報候補を選択し、前記符号化対象の予測ブロックの動き情報とする結合動き情報選択部と、
前記選択された結合動き情報候補を前記結合動き情報候補リストにおいて特定するためのインデックスを候補特定インデックスとして符号化する符号化部とを備えることを特徴とする動画像符号化装置。 A video encoding device that performs motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type,
Based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block, the motion of a plurality of encoded adjacent blocks adjacent to the prediction block to be encoded Inferior joint motion information for selecting a recessive joint motion information candidate capable of motion compensation prediction with a prediction block having a size larger than the size of the prediction block to be encoded from the first motion information group consisting of information. A candidate determination unit;
Using a second motion information group obtained by removing the recessive joint motion information candidate from the first motion information group, a joint motion information candidate list of joint motion information candidates for use in the prediction block to be encoded is used. A combined motion information candidate list generation unit to generate,
A combined motion information candidate adding unit for adding at least one recessive combined motion information candidate to the combined motion information candidate list;
A combined motion information selection unit that selects one combined motion information candidate from the combined motion information candidate list and uses it as motion information of the prediction block to be encoded;
A moving picture encoding apparatus comprising: an encoding unit that encodes an index for specifying the selected combined motion information candidate in the combined motion information candidate list as a candidate specifying index. - 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法であって、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備えることを特徴とする動画像符号化方法。 A moving picture coding method for coding a moving picture by performing motion compensation prediction by dividing a coding block into one or a plurality of prediction blocks based on a division type,
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation step using the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidation step in which block motion information is not the selection candidate;
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A determination step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
And a coding step for coding information for specifying the determined motion information in the candidate list. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項4に記載の動画像符号化方法。 5. The moving picture encoding method according to claim 4, further comprising an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化プログラムであって、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとをコンピュータに実行させることを特徴とする動画像符号化プログラム。 A moving picture coding program for coding a moving picture by performing motion compensation prediction by dividing a coding block into one or a plurality of prediction blocks based on a division type,
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation step using the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidation step in which block motion information is not the selection candidate;
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A determination step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
A moving picture encoding program for causing a computer to execute an encoding step of encoding information for specifying the determined motion information in the candidate list. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらにコンピュータに実行させることを特徴とする請求項6に記載の動画像符号化プログラム。 7. The moving picture encoding program according to claim 6, further causing the computer to execute an additional step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法により符号化された符号化ストリームをパケット化して符号化データを得るパケット処理部と、
パケット化された前記符号化データを送信する送信部とを備え、
前記動画像符号化方法は、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備えることを特徴とする送信装置。 Based on the division type, the coded block is coded by the moving picture coding method in which the coded block is divided into one or a plurality of prediction blocks and motion compensated prediction is performed and the moving picture is coded. A packet processing unit for obtaining data;
A transmission unit for transmitting the packetized encoded data,
The moving image encoding method includes:
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation step using the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidation step in which block motion information is not the selection candidate;
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A determination step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
And a coding step for coding information for specifying the determined motion information in the candidate list. - 前記動画像符号化方法は、予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項8に記載の送信装置。 The transmission apparatus according to claim 8, wherein the moving image encoding method further includes an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法により符号化された符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、
パケット化された前記符号化データを送信する送信ステップとを備え、
前記動画像符号化方法は、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備えることを特徴とする送信方法。 Based on the division type, the coded block is coded by the moving picture coding method in which the coded block is divided into one or a plurality of prediction blocks and motion compensated prediction is performed and the moving picture is coded. A packet processing step to obtain data;
Transmitting the packetized encoded data, and
The moving image encoding method includes:
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation step using the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidation step in which block motion information is not the selection candidate;
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A determination step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
And a coding step of coding information for specifying the determined motion information in the candidate list. - 前記動画像符号化方法は、予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項10に記載の送信方法。 The transmission method according to claim 10, wherein the moving image encoding method further includes an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い動画像を符号化する動画像符号化方法により符号化された符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、
パケット化された前記符号化データを送信する送信ステップとをコンピュータに実行させ、
前記動画像符号化方法は、
符号化対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である符号化済みの予測ブロックを選択し、前記選択した符号化済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記符号化対象の予測ブロックの分割タイプと前記符号化対象の予測ブロックの前記符号化ブロック内の位置とに基づいて、前記符号化対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リストから前記符号化対象の予測ブロックの動き補償予測に用いる動き情報を決定する決定ステップと、
前記決定された動き情報を前記候補リストにおいて特定するための情報を符号化する符号化ステップとを備えることを特徴とする送信プログラム。 Based on the division type, the coded block is coded by the moving picture coding method in which the coded block is divided into one or a plurality of prediction blocks and motion compensated prediction is performed and the moving picture is coded. A packet processing step to obtain data;
Transmitting the packetized encoded data to the computer, and
The moving image encoding method includes:
A coded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the prediction block to be coded, and the selected coded block is selected. A candidate derivation step using the motion information of the prediction block as a selection candidate;
Specific predictions in a plurality of prediction blocks adjacent to the prediction block to be encoded based on the division type of the prediction block to be encoded and the position of the prediction block to be encoded in the encoding block An invalidation step in which block motion information is not the selection candidate;
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A determination step of determining motion information used for motion compensation prediction of the prediction block to be encoded from the candidate list;
And a coding step for coding information for specifying the determined motion information in the candidate list. - 前記動画像符号化方法は、予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項12に記載の送信プログラム。 The transmission program according to claim 12, wherein the moving picture encoding method further includes an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い、動画像の符号化ストリームを復号する動画像復号装置であって、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出部と、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部と、
前記選択候補を含む候補リストを生成する候補リスト生成部と、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部と、
前記候補リスト内の位置を示す情報を復号する符号列解析部と、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択部とを備えることを特徴とする動画像復号装置。 A video decoding device that divides a decoded block into one or a plurality of prediction blocks based on a division type, performs motion compensation prediction, and decodes an encoded stream of the video,
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation unit that uses motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded And an invalidation unit that does not make the selection candidate,
A candidate list generating unit for generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. An additional part to be added to the candidate list,
A code string analysis unit for decoding information indicating a position in the candidate list;
A moving picture decoding apparatus comprising: a selection unit configured to select motion information used for motion compensation prediction of the decoding target prediction block from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加部をさらに備えることを特徴とする請求項14に記載の動画像復号装置。 15. The moving picture decoding apparatus according to claim 14, further comprising an adding unit that adds motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う動画像復号装置であって、
結合動き情報候補を結合動き情報候補リストにおいて特定するためのインデックスが候補特定インデックスとして符号化された符号列から、前記候補特定インデックスを復号する復号部と、
復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する復号済みの複数の隣接ブロックの動き情報からなる第1の動き情報群の中から、前記復号対象の予測ブロックのサイズよりも大きなサイズの予測ブロックで動き補償予測することが可能な劣性結合動き情報候補を選択する劣性結合動き情報候補判定部と、
前記第1の動き情報群から前記劣性結合動き情報候補を除いた第2の動き情報群を用いて、前記復号対象の予測ブロックに利用するための結合動き情報候補の結合動き情報候補リストを生成する結合動き情報候補リスト生成部と、
少なくとも1つの前記劣性結合動き情報候補を前記結合動き情報候補リストに追加する結合動き情報候補追加部と、
前記候補特定インデックスにもとづいて前記結合動き情報候補リストから1つの結合動き情報候補を選択し、前記復号対象の予測ブロックの動き情報とする結合動き情報選択部とを備えることを特徴とする動画像復号装置。 A video decoding device that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type,
A decoding unit that decodes the candidate specific index from a code string in which an index for specifying a combined motion information candidate in the combined motion information candidate list is encoded as a candidate specific index;
A first block comprising motion information of a plurality of decoded neighboring blocks adjacent to the prediction block to be decoded based on a division type of the prediction block to be decoded and a position in the decoding block of the prediction block to be decoded; A recessive joint motion information candidate determination unit that selects a recessive joint motion information candidate capable of motion compensation prediction using a prediction block having a size larger than the size of the prediction block to be decoded,
A combined motion information candidate list of combined motion information candidates to be used for the prediction block to be decoded is generated using the second motion information group obtained by removing the recessive combined motion information candidate from the first motion information group A combined motion information candidate list generation unit to perform,
A combined motion information candidate adding unit for adding at least one recessive combined motion information candidate to the combined motion information candidate list;
A moving image comprising: a combined motion information selection unit that selects one combined motion information candidate from the combined motion information candidate list based on the candidate specifying index and uses the combined motion information candidate as motion information of the prediction block to be decoded. Decoding device. - 分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い、動画像の符号化ストリームを復号する動画像復号方法であって、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リスト内の位置を示す情報を復号する符号列解析ステップと、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとを備えることを特徴とする動画像復号方法。 A moving picture decoding method for performing motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division type, and decoding a coded stream of a moving picture,
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation step using motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded Invalidating step that does not make the selection candidate,
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A code string analyzing step for decoding information indicating a position in the candidate list;
And a selection step of selecting motion information to be used for motion compensation prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項17に記載の動画像復号方法。 The moving image decoding method according to claim 17, further comprising an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 分割タイプに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い、動画像の符号化ストリームを復号する動画像復号プログラムであって、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リスト内の位置を示す情報を復号する符号列解析ステップと、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとをコンピュータに実行させることを特徴とする動画像復号プログラム。 A moving picture decoding program for dividing a decoded block into one or a plurality of prediction blocks based on a division type, performing motion compensation prediction, and decoding a coded stream of a moving picture,
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation step using motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded Invalidating step that does not make the selection candidate,
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A code string analyzing step for decoding information indicating a position in the candidate list;
A moving picture decoding program that causes a computer to execute a selection step of selecting motion information used for motion compensation prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらにコンピュータに実行させることを特徴とする請求項19に記載の動画像復号プログラム。 20. The moving picture decoding program according to claim 19, further causing the computer to execute an additional step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 受信した動画像の符号化ストリームにおいて、復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い復号処理する受信装置であって、
分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い符号化された動画像の符号化ストリームがパケット化された符号化データを受信する受信部と、
受信された前記符号化データをパケット処理して元の符号化ストリームを復元する復元部と、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出部と、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化部と、
前記選択候補を含む候補リストを生成する候補リスト生成部と、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加部と、
前記候補リスト内の位置を示す情報を、復元された符号化ストリームから復号する符号列解析部と、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択部とを備えることを特徴とする受信装置。 In a received moving image encoded stream, the decoding device divides a decoding block into one or a plurality of prediction blocks, performs motion compensation prediction, and performs decoding processing,
A receiving unit that receives coded data in which a coded stream of a moving image that has been coded by performing motion compensation prediction by dividing a coded block into one or a plurality of prediction blocks based on a division type is packetized;
A restoration unit that packet-processes the received encoded data and restores the original encoded stream;
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation unit that uses motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded And an invalidation unit that does not make the selection candidate,
A candidate list generating unit for generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. An additional part to be added to the candidate list,
A code string analyzing unit that decodes information indicating a position in the candidate list from the restored encoded stream;
A receiving apparatus comprising: a selection unit that selects motion information used for motion compensated prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加部をさらに備えることを特徴とする請求項21に記載の受信装置。 The receiving apparatus according to claim 21, further comprising an adding unit that adds motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 受信した動画像の符号化ストリームにおいて、復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い復号処理する受信方法であって、
分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い符号化された動画像の符号化ストリームがパケット化された符号化データを受信する受信ステップと、
受信された前記符号化データをパケット処理して元の符号化ストリームを復元する復元ステップと、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リスト内の位置を示す情報を、復元された符号化ストリームから復号する符号列解析ステップと、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとを備えることを特徴とする受信方法。 In a received moving image encoded stream, a decoding method in which a decoded block is divided into one or a plurality of prediction blocks, motion compensated prediction is performed, and decoding processing is performed.
A receiving step of receiving encoded data in which an encoded stream of a moving image encoded by performing motion compensated prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type is packetized;
A restoration step of packetizing the received encoded data to restore the original encoded stream;
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation step using motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded Invalidating step that does not make the selection candidate,
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A code string analyzing step of decoding information indicating a position in the candidate list from the restored encoded stream;
And a selection step of selecting motion information to be used for motion compensated prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらに備えることを特徴とする請求項23に記載の受信方法。 The receiving method according to claim 23, further comprising an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
- 受信した動画像の符号化ストリームにおいて、復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い復号処理する受信プログラムであって、
分割タイプに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行い符号化された動画像の符号化ストリームがパケット化された符号化データを受信する受信ステップと、
受信された前記符号化データをパケット処理して元の符号化ストリームを復元する復元ステップと、
復号対象の予測ブロックに隣接する複数の予測ブロックから、動きベクトルの情報と参照画像の情報とを含む動き情報が有効である復号済みの予測ブロックを選択し、前記選択した復号済みの予測ブロックの動き情報を選択候補とする候補導出ステップと、
前記復号対象の予測ブロックの分割タイプと前記復号対象の予測ブロックの前記復号ブロック内の位置とに基づいて、前記復号対象の予測ブロックに隣接する複数の予測ブロック内の特定の予測ブロックの動き情報を前記選択候補としない無効化ステップと、
前記選択候補を含む候補リストを生成する候補リスト生成ステップと、
前記候補リストに含まれる選択候補の一方の予測方向の動き情報と、前記候補リストに含まれる他の選択候補の他方の予測方向の動き情報とを組み合わせて双予測の新たな選択候補を生成して前記候補リストに加える追加ステップと、
前記候補リスト内の位置を示す情報を、復元された符号化ストリームから復号する符号列解析ステップと、
復号した前記位置を示す情報に基づき、前記候補リストから前記復号対象の予測ブロックの動き補償予測に用いる動き情報を選択する選択ステップとをコンピュータに実行させることを特徴とする受信プログラム。 In a received moving image encoded stream, a decoding program that performs decoding processing by performing motion compensation prediction by dividing a decoding block into one or a plurality of prediction blocks,
A receiving step of receiving encoded data in which an encoded stream of a moving image encoded by performing motion compensated prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division type is packetized;
A restoration step of packetizing the received encoded data to restore the original encoded stream;
A decoded prediction block in which motion information including motion vector information and reference image information is valid is selected from a plurality of prediction blocks adjacent to the decoding target prediction block, and the selected decoded prediction block A candidate derivation step using motion information as a selection candidate;
Based on the division type of the prediction block to be decoded and the position in the decoding block of the prediction block to be decoded, the motion information of a specific prediction block in a plurality of prediction blocks adjacent to the prediction block to be decoded Invalidating step that does not make the selection candidate,
A candidate list generating step of generating a candidate list including the selection candidates;
A new selection candidate for bi-prediction is generated by combining the motion information in one prediction direction of the selection candidates included in the candidate list and the motion information in the other prediction direction of the other selection candidates included in the candidate list. Adding to the candidate list
A code string analyzing step of decoding information indicating a position in the candidate list from the restored encoded stream;
A reception program that causes a computer to execute a selection step of selecting motion information used for motion compensation prediction of the prediction block to be decoded from the candidate list based on the decoded information indicating the position. - 予め定められた所定の動きベクトルを有する動き情報を新たな選択候補として前記候補リストに加える追加ステップをさらにコンピュータに実行させることを特徴とする請求項25に記載の受信プログラム。 26. The receiving program according to claim 25, further causing the computer to execute an adding step of adding motion information having a predetermined motion vector determined in advance to the candidate list as a new selection candidate.
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011244802 | 2011-11-08 | ||
JP2011-244802 | 2011-11-08 | ||
JP2011-244801 | 2011-11-08 | ||
JP2011244801 | 2011-11-08 | ||
JP2012244595A JP2013123217A (en) | 2011-11-08 | 2012-11-06 | Moving-image encoding device, moving-image encoding method, moving-image encoding program, transmission device, transmission method, and transmission program |
JP2012-244596 | 2012-11-06 | ||
JP2012244596A JP2013123218A (en) | 2011-11-08 | 2012-11-06 | Moving-image decoding device, moving-image decoding method, moving-image decoding program, reception device, reception method, and reception program |
JP2012-244595 | 2012-11-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013069269A1 true WO2013069269A1 (en) | 2013-05-16 |
Family
ID=48289476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2012/007130 WO2013069269A1 (en) | 2011-11-08 | 2012-11-07 | Video encoding device, video encoding method, video encoding program, transmission device, transmission method, transmission program, video decoding device, video decoding method, video decoding program, reception device, reception method, and reception program |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2013069269A1 (en) |
-
2012
- 2012-11-07 WO PCT/JP2012/007130 patent/WO2013069269A1/en active Application Filing
Non-Patent Citations (6)
Title |
---|
HIDEKI TAKEHARA ET AL.: "Bi-derivative merge candidate", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH MEETING, July 2011 (2011-07-01), TORINO, IT * |
HIROYA NAKAMURA ET AL.: "Unification of derivation process for merge mode and MVP", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT- VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/ WG11 6TH MEETING, July 2011 (2011-07-01), TORINO, IT * |
JIANLE CHEN ET AL.: "MVP index parsing with fixed number of candidates", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH MEETING, July 2011 (2011-07-01), TORINO, IT * |
TOSHIYASU SUGIO ET AL.: "arsing Robustness for Merge/AMVP", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH MEETING, July 2011 (2011-07-01), TORINO, IT * |
YNUFEI ZHENG ET AL.: "Unified Motion Vector Predictor Selection for Merge and AMVP", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 5TH MEETING, March 2011 (2011-03-01), GENEVA * |
YUNFEI ZHENG ET AL.: "Merge Candidate Selection in 2NxN, Nx2N, and NxN Mode", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH MEETING, July 2011 (2011-07-01), TORINO, IT * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2013099285A1 (en) | Video encoding device, video encoding method and video encoding program, and video decoding device, video decoding method and video decoding program | |
WO2013099283A1 (en) | Video encoding device, video encoding method and video encoding program, and video decoding device, video decoding method and video decoding program | |
JP6065088B2 (en) | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program | |
JP5725106B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP2013121167A (en) | Image encoder, image encoding method, and image encoding program | |
JP5725118B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP2013118626A (en) | Moving image encoding apparatus, moving image encoding method, moving image encoding program, transmitting apparatus, transmitting method and transmitting program | |
WO2013065300A1 (en) | Moving-image encoding device, moving-image encoding method, moving-image encoding program, transmitter, transmission method and transmission program, and moving-image decoding device, moving-image decoding method, moving-image decoding program, receiver, and reception method and reception program | |
JP5843041B1 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP6256539B2 (en) | Moving picture decoding apparatus, moving picture decoding method, and moving picture decoding program | |
JP2013123218A (en) | Moving-image decoding device, moving-image decoding method, moving-image decoding program, reception device, reception method, and reception program | |
WO2013069269A1 (en) | Video encoding device, video encoding method, video encoding program, transmission device, transmission method, transmission program, video decoding device, video decoding method, video decoding program, reception device, reception method, and reception program | |
JP2013121163A (en) | Image encoding device, image encoding method, and image encoding program | |
JP2013121164A (en) | Image decoding device, image decoding method, and image decoding program | |
JP2013123217A (en) | Moving-image encoding device, moving-image encoding method, moving-image encoding program, transmission device, transmission method, and transmission program | |
JP2013121168A (en) | Image decoder, image decoding method and image decoding program | |
JP2013121166A (en) | Image decoding device, image decoding method, and image decoding program | |
JP2013121165A (en) | Image encoding device, image encoding method, and image encoding program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12848045 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12848045 Country of ref document: EP Kind code of ref document: A1 |