JP2013021612A - Image encoder, image encoding method and image encoding program - Google Patents
Image encoder, image encoding method and image encoding program Download PDFInfo
- Publication number
- JP2013021612A JP2013021612A JP2011155097A JP2011155097A JP2013021612A JP 2013021612 A JP2013021612 A JP 2013021612A JP 2011155097 A JP2011155097 A JP 2011155097A JP 2011155097 A JP2011155097 A JP 2011155097A JP 2013021612 A JP2013021612 A JP 2013021612A
- Authority
- JP
- Japan
- Prior art keywords
- motion information
- candidate
- prediction
- block
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動き補償予測を用いた動画像符号化技術に関し、特に動き補償予測で利用する動き情報を符号化する画像符号化装置、画像符号化方法および画像符号化プログラムに関する。 The present invention relates to a moving image encoding technique using motion compensated prediction, and more particularly to an image encoding device, an image encoding method, and an image encoding program for encoding motion information used in motion compensated prediction.
一般的な動画像圧縮符号化では動き補償予測が利用される。動き補償予測は、対象画像を細かいブロックに分割し、復号済みの画像を参照画像として、動きベクトルで示される動き量に基いて、対象画像の対象ブロックから参照画像の参照ブロックに移動した位置の信号を予測信号として生成する技術である。動き補償予測には1本の動きベクトルを利用して単方向に行うものと、2本の動きベクトルを利用して双方向に行うものがある。 In general video compression coding, motion compensation prediction is used. Motion compensation prediction divides the target image into fine blocks, uses the decoded image as a reference image, and based on the amount of motion indicated by the motion vector, the position of the position moved from the target block of the target image to the reference block of the reference image This is a technique for generating a signal as a prediction signal. Some motion compensation predictions are performed unidirectionally using one motion vector, and others are performed bidirectionally using two motion vectors.
また、動きベクトルについても、処理対象ブロックに隣接する符号化済みのブロックの動きベクトルを予測動きベクトル(単に「予測ベクトル」ともいう)とし、処理対象ブロックの動きベクトルと予測ベクトルとの差分を求め、差分ベクトルを符号化ベクトルとして伝送することで圧縮効率を向上させている。 As for the motion vector, the motion vector of the encoded block adjacent to the processing target block is used as a prediction motion vector (also simply referred to as “prediction vector”), and the difference between the motion vector of the processing target block and the prediction vector is obtained. The compression efficiency is improved by transmitting the difference vector as an encoded vector.
MPEG−4AVCでは、MPEG−2よりも動き補償予測のブロックサイズを細かく且つ多様にすることで動き補償予測の効率を向上させている。一方、ブロックサイズを細かくしたことで動きベクトル数が増加するため、符号化ベクトルの符号量が問題となる。 MPEG-4AVC improves the efficiency of motion compensation prediction by making the block size of motion compensation prediction finer and more diversified than MPEG-2. On the other hand, since the number of motion vectors increases by making the block size finer, the code amount of the encoded vector becomes a problem.
そのため、MPEG−2では単純に処理対象ブロックの左に隣接するブロックの動きベクトルを予測ベクトルとしていたが、MPEG−4AVCでは複数の隣接ブロックの動きベクトルの中央値を予測ベクトルとすることで予測ベクトルの精度を向上させ、符号化ベクトルの符号量の増加を抑制している。さらに、MPEG−4AVCにおいてダイレクト動き補償予測が知られている。ダイレクト動き補償予測は、符号化済みの別の画像の処理対象ブロックと同一位置にあるブロックの動きベクトルを、対象画像と2つの参照画像の距離でスケーリングして新たな動きベクトルを生成し、符号化ベクトルを伝送することなく、動き補償予測を実現するものである。 Therefore, in MPEG-2, the motion vector of the block adjacent to the left of the block to be processed is simply used as the prediction vector, but in MPEG-4 AVC, the prediction vector is obtained by using the median of the motion vectors of the plurality of adjacent blocks as the prediction vector. And the increase in the code amount of the encoded vector is suppressed. Further, direct motion compensation prediction is known in MPEG-4 AVC. Direct motion compensated prediction generates a new motion vector by scaling the motion vector of a block at the same position as the processing target block of another encoded image by the distance between the target image and two reference images. The motion compensation prediction is realized without transmitting the quantization vector.
また、処理対象ブロックに隣接するブロックの動き情報を利用して、符号化ベクトルを伝送することなく動き補償予測を実現する動き補償予測が知られている(例えば、特許文献1参照)。 In addition, motion compensation prediction that realizes motion compensation prediction without transmitting an encoded vector using motion information of a block adjacent to a processing target block is known (see, for example, Patent Document 1).
上述したように、符号化ベクトルを伝送しないダイレクト動き補償予測は、処理対象ブロックと符号化済みの別の画像の処理対象ブロックと同一位置にあるブロックの動きの連続性に着目している。また、特許文献1は処理対象ブロックと処理対象ブロックに隣接するブロックの動きの連続性に着目している。それにより、他のブロックの動き情報を利用することで差分ベクトルを含む動き情報を符号化ベクトルとして符号化せずに符号化効率を向上させている。
As described above, direct motion compensated prediction that does not transmit an encoded vector focuses on the continuity of motion of a block that is in the same position as a processing target block and a processing target block of another encoded image. Further,
ところが従来の動き補償予測では、処理対象ブロックの動きが、処理対象ブロックと隣接するブロックとの動きや、符号化済みの別の画像の処理対象ブロックと同一位置周辺にあるブロックとの動きにずれがある場合、差分ベクトルを含む動き情報を符号化しなければならず、符号化効率の向上が十分に発揮されないという難しい面がある。 However, in the conventional motion compensated prediction, the motion of the processing target block is shifted to the motion of the processing target block and the adjacent block, or the motion of a block around the same position as the processing target block of another encoded image. In such a case, the motion information including the difference vector must be encoded, and there is a difficult aspect that the improvement of the encoding efficiency is not sufficiently exhibited.
本発明はこうした状況に鑑みてなされたものであり、その目的は、動きベクトルを含む動き情報の符号化効率を、より向上させる技術を提供することにある。 The present invention has been made in view of such circumstances, and an object thereof is to provide a technique for further improving the efficiency of encoding motion information including a motion vector.
上記課題を解決するために、本発明のある態様の画像符号化装置は、動き補償予測を行う画像符号化装置であって、1つの参照ブロック候補が持つ動き情報を使用する第1の画像間予測モードを使用するか、2つの参照ブロック候補が持つ動き情報を使用する第2の画像間予測モードを使用するかを判定する判定部(155)を備える。前記第1の画像間予測モードは、1つの参照ブロック候補の動き情報に含まれる単方向または双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードであり、前記第2の画像間予測モードは、2つの参照ブロック候補の動き情報から取得可能な2つの動きベクトルを組み合わせて、新たな双方向の動きベクトルの組み合わせを生成し、当該新たな双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードである。 In order to solve the above-described problem, an image coding apparatus according to an aspect of the present invention is an image coding apparatus that performs motion compensation prediction, and uses the motion information of one reference block candidate between first images. A determination unit (155) is provided for determining whether to use the prediction mode or to use the second inter-picture prediction mode that uses motion information of two reference block candidates. The first inter-picture prediction mode is a mode in which motion compensation of a coding target block is performed using a unidirectional or bidirectional motion vector included in motion information of one reference block candidate, and the second image The inter prediction mode combines two motion vectors that can be acquired from motion information of two reference block candidates, generates a new bidirectional motion vector combination, and encodes using the new bidirectional motion vector. In this mode, motion compensation is performed on the target block.
前記符号化対象ブロックに隣接する複数の符号化済みのブロックから、動き情報を持つ複数のブロックを選択して候補リストを生成する候補リスト生成部(150)と、前記候補リストに、重複する動き情報を持つブロックが複数存在する場合、1つを残し、残りを削除する削除部(151)と、をさらに備えてもよい。前記判定部(155)は、前記削除部(151)により削除されたブロックの数が、設定数以上の場合、前記第2の画像間予測モードを使用しないと判定してもよい。「前記符号化対象ブロックに隣接する複数の符号化済みのブロック」には、前記符号化対象ブロックを含む画像と時間的に異なる画像のブロックが含まれてもよい。 A candidate list generation unit (150) that generates a candidate list by selecting a plurality of blocks having motion information from a plurality of encoded blocks adjacent to the encoding target block, and a motion that overlaps the candidate list When there are a plurality of blocks having information, a deletion unit (151) that leaves one and deletes the remaining may be further provided. The determination unit (155) may determine not to use the second inter-picture prediction mode when the number of blocks deleted by the deletion unit (151) is equal to or greater than a set number. The “multiple encoded blocks adjacent to the encoding target block” may include blocks of images that are temporally different from the image including the encoding target block.
前記符号化対象ブロックに隣接する複数の符号化済みのブロックから、動き情報を持つ複数のブロックを選択して候補リストを生成する候補リスト生成部(150)と、前記判定部(155)は、前記候補リストに、双方向の動きベクトルを持ち、双方向の動きベクトルの2つの参照画像が対象画像の時間的に直前の画像及び直後の画像であるブロックが、設定数(例えば、1)以上含まれている場合、前記第2の画像間予測モードを使用しないと判定してもよい。「前記符号化対象ブロックに隣接する複数の符号化済みのブロック」には、前記符号化対象ブロックを含む画像と時間的に異なる画像のブロックが含まれてもよい。 A candidate list generation unit (150) that generates a candidate list by selecting a plurality of blocks having motion information from a plurality of encoded blocks adjacent to the encoding target block, and the determination unit (155), The candidate list has a bi-directional motion vector, and two reference images of the bi-directional motion vector are blocks that are the immediately preceding image and the immediately following image of the target image. If included, it may be determined that the second inter-picture prediction mode is not used. The “multiple encoded blocks adjacent to the encoding target block” may include blocks of images that are temporally different from the image including the encoding target block.
前記符号化対象ブロックに隣接する複数の符号化済みのブロックから2つのブロックを選択し、その2つのブロックの動き情報から、前記複数の符号化済みのブロックが単体で持つ動き情報と異なる、別の双方向の動きベクトルを含む動き情報を新たな選択候補として生成する選択候補生成部(152)と、前記選択候補生成部(152)により生成された新たな選択候補を含む複数の選択候補の中から1つを選択する選択部(141)と、前記選択部(141)により選択された候補を特定するための識別情報(例えば、識別番号)を符号化する符号列生成部(104)と、をさらに備えてもよい。前記選択候補生成部(152)により生成された新たな選択候補の識別情報は、当該選択候補を組成する第1の予測方向の動き情報候補の識別情報と第2の予測方向の動き情報候補の識別情報の組み合わせにより規定されてもよい。 Two blocks are selected from a plurality of encoded blocks adjacent to the encoding target block, and the motion information of the two encoded blocks is different from the motion information held by the plurality of encoded blocks. A selection candidate generation unit (152) that generates motion information including a bidirectional motion vector as a new selection candidate, and a plurality of selection candidates including the new selection candidate generated by the selection candidate generation unit (152). A selection unit (141) for selecting one from among, a code string generation unit (104) for encoding identification information (for example, an identification number) for specifying a candidate selected by the selection unit (141), , May be further provided. The new selection candidate identification information generated by the selection candidate generation unit (152) includes the identification information of the motion information candidate in the first prediction direction and the motion information candidate in the second prediction direction that compose the selection candidate. It may be defined by a combination of identification information.
前記第1の予測方向の動き情報候補及び前記第2の予測方向の動き情報候補のうち、基準方向の動き情報候補のそれぞれに識別情報が割り当てられ、基準方向の動き情報候補ごとに組み合わせ対象となる非基準方向の動き情報候補の数がカウントされ、それぞれのカウント値に基づいて、非基準方向の動き情報候補のそれぞれに識別情報が割り当てられてもよい。当該カウント値が1の場合、非基準方向の動き情報候補の識別情報は省略されてもよい。 Among the motion information candidates in the first prediction direction and the motion information candidates in the second prediction direction, identification information is assigned to each of the motion information candidates in the reference direction, and a combination target is set for each motion information candidate in the reference direction. The number of motion information candidates in the non-reference direction may be counted, and identification information may be assigned to each motion information candidate in the non-reference direction based on each count value. When the count value is 1, the identification information of the motion information candidate in the non-reference direction may be omitted.
本発明の別の態様は、画像符号化方法である。この方法は、動き補償予測を行う画像符号化方法であって、1つの参照ブロック候補が持つ動き情報を使用する第1の画像間予測モードを使用するか、2つの参照ブロック候補が持つ動き情報を使用する第2の画像間予測モードを使用するかを判定するステップを備える。前記第1の画像間予測モードは、1つの参照ブロック候補の動き情報に含まれる単方向または双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードであり、前記第2の画像間予測モードは、2つの参照ブロック候補の動き情報から取得可能な2つの動きベクトルを組み合わせて、新たな双方向の動きベクトルの組み合わせを生成し、当該新たな双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードである。 Another aspect of the present invention is an image encoding method. This method is an image coding method that performs motion compensation prediction, and uses the first inter-picture prediction mode that uses the motion information of one reference block candidate or the motion information of two reference block candidates. Determining whether to use the second inter-picture prediction mode using. The first inter-picture prediction mode is a mode in which motion compensation of a coding target block is performed using a unidirectional or bidirectional motion vector included in motion information of one reference block candidate, and the second image The inter prediction mode combines two motion vectors that can be acquired from motion information of two reference block candidates, generates a new bidirectional motion vector combination, and encodes using the new bidirectional motion vector. In this mode, motion compensation is performed on the target block.
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。 It should be noted that any combination of the above-described constituent elements and a conversion of the expression of the present invention between a method, an apparatus, a system, a recording medium, a computer program, and the like are also effective as an aspect of the present invention.
本発明によれば、動きベクトルを含む動き情報の符号化効率を、より向上させることができる。 According to the present invention, it is possible to further improve the encoding efficiency of motion information including motion vectors.
まず、本発明の実施の形態の前提となる技術を説明する。 First, a technique that is a premise of the embodiment of the present invention will be described.
現在、MPEG(Moving Picture Experts Group)などの符号化方式に準拠した装置及びシステムが普及している。そのような符号化方式では、時間軸上に連続する複数の画像をデジタル信号の情報として取り扱う。その際、効率の高い情報の放送、伝送または蓄積などを目的とし、時間方向の冗長性を利用した動き補償予測及び空間方向の冗長性を利用した離散コサイン変換などの直交変換を用いて圧縮符号化する。 Currently, apparatuses and systems that comply with an encoding method such as MPEG (Moving Picture Experts Group) are widely used. In such an encoding method, a plurality of images that are continuous on the time axis are handled as digital signal information. At that time, for the purpose of broadcasting, transmission or storage of highly efficient information, compression codes using orthogonal compensation such as motion compensated prediction using temporal redundancy and discrete cosine transform using spatial redundancy are used. Turn into.
1995年にはMPEG−2ビデオ(ISO/IEC 13818−2)符号化方式が、汎用の映像圧縮符号化方式として制定され、DVD及びD−VHS(登録商標)規格のデジタルVTRによる磁気テープなどの蓄積メディア、ならびにデジタル放送などのアプリケーションとして広く用いられている。 In 1995, the MPEG-2 video (ISO / IEC 13818-2) encoding method was established as a general-purpose video compression encoding method, such as DVD and D-VHS (registered trademark) standard digital VTR magnetic tapes, etc. It is widely used as an application for storage media and digital broadcasting.
さらに、2003年に、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU−T)の共同作業によってMPEG−4 AVC/H.264と呼ばれる符号化方式(ISO/IECでは14496−10、ITU−TではH.264の規格番号がつけられている。以下、これをMPEG−4AVCと呼ぶ)が国際標準として制定された。 Furthermore, in 2003, joint work of the International Technical Organization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunication Union Telecommunication Standardization Sector (ITU-T) -4 AVC / H. An encoding method called H.264 (the ISO / IEC has a standard number of 14496-10 and ITU-T has an H.264 standard number, hereinafter referred to as MPEG-4AVC) has been established as an international standard.
現在、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU−T)の共同作業によってHEVCと呼ばれる符号化方式の標準化が検討されている。 Coding currently called HEVC by the joint work of the International Technical Organization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunication Union Telecommunication Standardization Sector (ITU-T) Standardization of the method is being studied.
(符号化ブロック)
本発明の実施の形態では、入力された画像信号を図1のように最大符号化ブロック単位に分割し、分割した符号化ブロックをラスタースキャン順序で処理する。符号化ブロックは階層構造となっており、符号化効率などを考慮して順次均等に4分割することでより小さい符号化ブロックにすることができる。尚、4分割された符号化ブロックはジグザグスキャン順で符号化される。これ以上小さくすることのできない符号化ブロックを最小符号化ブロックと呼ぶ。符号化ブロックは符号化の単位となり、最大符号化ブロックも分割数が0である場合は符号化ブロックとなる。本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とする。
(Encoding block)
In the embodiment of the present invention, an input image signal is divided into maximum coding block units as shown in FIG. 1, and the divided coding blocks are processed in a raster scan order. The encoded block has a hierarchical structure, and can be made smaller encoded blocks by sequentially equally dividing into 4 in consideration of the encoding efficiency. The encoded block divided into four is encoded in the zigzag scan order. An encoded block that cannot be further reduced is called a minimum encoded block. An encoded block is a unit of encoding, and the maximum encoded block is also an encoded block when the number of divisions is zero. In this embodiment, the maximum coding block is 64 pixels × 64 pixels, and the minimum coding block is 8 pixels × 8 pixels.
図2(a)、(b)に最大符号化ブロックの分割の一例を示す。図2(a)の例では、符号化ブロックが10個に分割されている。CU0、CU1及びCU9は32画素×32画素の符号化ブロック、CU2、CU3及びCU8は16画素×16画素の符号化ブロック、ならびにCU4、CU5、CU6及びCU7は8画素×8画素の符号化ブロックとなっている。図2(b)の例では、符号化ブロックが1個に分割されている。 FIGS. 2A and 2B show an example of division of the maximum coding block. In the example of FIG. 2A, the encoded block is divided into ten. CU0, CU1 and CU9 are 32 pixel x 32 pixel coding blocks, CU2, CU3 and CU8 are 16 pixel x 16 pixel coding blocks, and CU4, CU5, CU6 and CU7 are 8 pixel x 8 pixel coding blocks It has become. In the example of FIG. 2B, the encoded block is divided into one.
(予測ブロック)
本発明の実施の形態では、符号化ブロックはさらに予測ブロックに分割される。予測ブロックの分割のパターンを図3(a)〜(d)に示す。図3(a)は符号化ブロックを分割しない2N×2N、図3(b)は水平に分割する2N×N、図3(c)は垂直に分割するN×2N、及び図3(d)は水平と垂直に分割するN×Nを示す。つまり、予測ブロックサイズには、図4に示すように、CU分割数が0であって最大の予測ブロックサイズである64画素×64画素からCU分割数が3であって最小の予測ブロックサイズである4画素×4画素までの13の予測ブロックサイズが存在することになる。
(Prediction block)
In the embodiment of the present invention, the encoded block is further divided into prediction blocks. The prediction block division patterns are shown in FIGS. 3A shows 2N × 2N that does not divide the encoded block, FIG. 3B shows 2N × N that divides horizontally, FIG. 3C shows N × 2N that divides vertically, and FIG. 3D. Indicates N × N divided horizontally and vertically. In other words, as shown in FIG. 4, the prediction block size includes a CU division number of 0 and a maximum prediction block size of 64 pixels × 64 pixels to a CU division number of 3 and a minimum prediction block size. There are 13 predicted block sizes up to 4 pixels x 4 pixels.
本発明の実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とするが、この組み合わせに限定されない。また、予測ブロックの分割のパターンを図3(a)〜(d)としたが、1以上に分割されればよくこれに限定されない。 In the embodiment of the present invention, the maximum coding block is 64 pixels × 64 pixels and the minimum coding block is 8 pixels × 8 pixels, but the present invention is not limited to this combination. Further, although the prediction block division patterns are shown in FIGS. 3A to 3D, the division is not limited to this as long as it is divided into one or more.
(予測符号化モード)
本発明の実施の形態では、動き補償予測の予測方向や符号化ベクトル数を予測ブロックのブロックサイズで切り替えることが可能となっている。ここで、動き補償予測の予測方向と符号化ベクトル数を関連付けた予測符号化モードの一例について図5を用いて簡単に説明する。
(Predictive coding mode)
In the embodiment of the present invention, the prediction direction of motion compensation prediction and the number of encoded vectors can be switched by the block size of the prediction block. Here, an example of a predictive coding mode in which the prediction direction of motion compensation prediction and the number of coding vectors are associated will be briefly described with reference to FIG.
図5に示す予測符号化モードには、動き補償予測の予測方向が単方向であって符号化ベクトル数が1である単方向モード(UniPred)、動き補償予測の予測方向が双方向であって符号化ベクトル数が2である双方向モード(BiPred)及び動き補償予測の予測方向が単方向または双方向であって符号化ベクトル数が0であるマージモード(MERGE)がある。また、動き補償予測を実施しない予測符号化モードであるイントラモード(Intra)もある。 The prediction coding mode shown in FIG. 5 includes a unidirectional mode (UniPred) in which the prediction direction of motion compensation prediction is unidirectional and the number of coding vectors is 1, and the prediction direction of motion compensation prediction is bidirectional. There are a bidirectional mode (BiPred) in which the number of encoded vectors is 2 and a merge mode (MERGE) in which the prediction direction of motion compensation prediction is unidirectional or bidirectional and the number of encoded vectors is 0. There is also an intra mode (Intra) which is a predictive coding mode in which motion compensation prediction is not performed.
(参照画像インデックス)
本発明の実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照画像の中から最適な参照画像を選択することを可能とする。そのため、動き補償予測で利用した参照画像を参照画像インデックスとして符号化ベクトルととも符号化ストリーム中に符号化する。動き補償予測で利用される参照画像インデックスは0以上の数値となる。
(Reference image index)
In the embodiment of the present invention, it is possible to select an optimal reference image from a plurality of reference images in motion compensation prediction in order to improve the accuracy of motion compensation prediction. Therefore, the reference image used in the motion compensation prediction is encoded in the encoded stream together with the encoded vector as a reference image index. The reference image index used in motion compensation prediction is a numerical value of 0 or more.
参照画像インデックスで選択できる複数の参照画像は参照インデックスリストで管理される。動き補償予測の予測方向が単方向であれば、参照画像インデックスは1つ符号化され、動き補償予測の予測方向が双方向であれば、それぞれの予測方向の参照画像を示す参照画像インデックスが符号化される(図5)。 A plurality of reference images that can be selected by the reference image index are managed in a reference index list. If the prediction direction of motion compensation prediction is unidirectional, one reference image index is encoded. If the prediction direction of motion compensation prediction is bidirectional, a reference image index indicating a reference image in each prediction direction is encoded. (FIG. 5).
(予測ベクトルインデックス)
HEVCでは、予測ベクトルの精度を向上させるために、複数の予測ベクトルの候補の中から最適な予測ベクトルを選択し、選択した予測ベクトルを示すための予測ベクトルインデックスを符号化することが検討されている。本発明の実施の形態では、上記の予測ベクトルインデックスを導入する。動き補償予測の予測方向が単方向であれば、予測ベクトルインデックスは1つ符号化され、動き補償予測の予測方向が双方向であれば、それぞれの予測方向の予測ベクトルを示す予測ベクトルインデックスが符号化される(図5)。
(Predicted vector index)
In HEVC, in order to improve the accuracy of a prediction vector, it is considered to select an optimal prediction vector from among a plurality of prediction vector candidates and to encode a prediction vector index for indicating the selected prediction vector. Yes. In the embodiment of the present invention, the prediction vector index is introduced. If the prediction direction of motion compensation prediction is unidirectional, one prediction vector index is encoded. If the prediction direction of motion compensation prediction is bidirectional, a prediction vector index indicating a prediction vector in each prediction direction is encoded. (FIG. 5).
(マージインデックス)
HEVCでは、さらに符号化効率を向上させるために、複数の隣接ブロックの候補及び符号化済みの別の画像の処理対象ブロックと同一位置にあるブロックの中から最適なブロックを選択し、選択したブロックを示すマージインデックスを符号化及び復号することが検討されている。これは、選択されたマージインデックスの示すブロックの動き補償予測の予測方向、動きベクトル情報、参照画像情報から成る動き情報を処理対象ブロックで利用する動き補償予測技術(マージ技術)である。本発明の実施の形態では、上記のマージインデックスを導入する。図5に示すように、マージインデックスは予測符号化モードがマージモードの場合に、1つ符号化される。尚、動き情報が双方向であれば、動き情報には各予測方向の動きベクトル情報と参照画像情報が含まれる。
(Merge index)
In HEVC, in order to further improve the coding efficiency, an optimum block is selected from among a plurality of adjacent block candidates and a block located at the same position as a processing target block of another coded image, and the selected block is selected. Encoding and decoding a merge index indicating This is a motion compensation prediction technique (merge technique) in which motion information including a prediction direction, motion vector information, and reference image information of a motion compensation prediction of a block indicated by a selected merge index is used in a processing target block. In the embodiment of the present invention, the above merge index is introduced. As shown in FIG. 5, one merge index is encoded when the prediction encoding mode is the merge mode. If the motion information is bidirectional, the motion information includes motion vector information and reference image information in each prediction direction.
以降、マージインデックスによって示される可能性のあるブロックの持つ動き情報を結合動き情報候補と呼び、結合動き情報候補の集合体を結合動き情報候補リストと呼ぶ。 Hereinafter, the motion information of a block that may be indicated by the merge index is referred to as a combined motion information candidate, and the aggregate of combined motion information candidates is referred to as a combined motion information candidate list.
(予測方向)
本発明の実施の形態では、動き補償予測の予測方向としてL0方向とL1方向の2つを設定する。ここで、動き補償予測の予測方向について図6(a)〜(d)を用いて簡単に説明する。動き補償予測の予測方向が単方向の場合はL0方向またはL1方向のいずれかを利用する。図6(a)は単方向であってL0方向の参照画像(RefL0Pic)が符号化対象画像(CurPic)より前の時刻にある場合を示している。図6(b)は単方向であってL0方向の参照画像が符号化対象画像より後の時刻にある場合を示している。図6(a)及び図6(b)のL0方向の参照画像をL1方向の参照画像(RefL1Pic)に置き換えることもできる。
(Forecast direction)
In the embodiment of the present invention, two directions of the L0 direction and the L1 direction are set as the prediction directions of the motion compensation prediction. Here, the prediction direction of motion compensation prediction will be briefly described with reference to FIGS. When the prediction direction of motion compensation prediction is unidirectional, either the L0 direction or the L1 direction is used. FIG. 6A shows a case where the reference image (RefL0Pic) in the unidirectional direction and the L0 direction is at a time before the encoding target image (CurPic). FIG. 6B shows a case where the reference image in the unidirectional direction and the L0 direction is at a time after the encoding target image. The reference image in the L0 direction in FIGS. 6A and 6B may be replaced with a reference image in the L1 direction (RefL1Pic).
双方向の場合はL0方向とL1方向の2つを利用してBI方向と表現する。図6(c)は双方向であってL0方向の参照画像が符号化対象画像より前の時刻にあって、L1方向の参照画像が符号化対象画像より後の時刻にある場合を示している。図6(d)は双方向であってL0方向の参照画像とL1方向の参照画像が符号化対象画像より前の時刻にある場合を示している。図6(c)及び図6(d)のL0方向の参照画像をL1方向の参照画像(RefL1Pic)に、L1方向の参照画像をL0方向の参照画像(RefL0Pic)に置き換えることもできる。以上で説明したように、動き補償予測の予測方向であるL0方向とL1方向はそれぞれ時間的に前方向と後方向のいずれでも示すことができる。 In the case of bidirectional, the BI direction is expressed using two of the L0 direction and the L1 direction. FIG. 6C shows a case where the reference image in the L0 direction is at a time before the encoding target image and the reference image in the L1 direction is at a time after the encoding target image. . FIG. 6D shows a case in which the reference image in the L0 direction and the reference image in the L1 direction are at a time before the encoding target image. The reference image in the L0 direction in FIGS. 6C and 6D can be replaced with a reference image in the L1 direction (RefL1Pic), and the reference image in the L1 direction can be replaced with a reference image in the L0 direction (RefL0Pic). As described above, the L0 direction and the L1 direction, which are prediction directions of motion compensation prediction, can be indicated in either the forward direction or the backward direction in terms of time.
また、L0方向とL1方向はそれぞれに複数の参照画像が存在することが可能性であって、L0方向の参照画像は参照画像リストL0にL1方向の参照画像は参照画像リストL1に登録されて、それぞれの予測方向の参照画像インデックスによって参照画像リスト中の参照画像の位置が指定されて、参照画像が確定する。以降、予測方向がL0方向であるとは参照画像リストL0に登録された参照画像と関連づけられた動き情報を利用する予測方向であり、予測方向がL1方向であるとは参照画像リストL1に登録された参照画像と関連づけられた動き情報を利用する予測方向である。 In addition, there may be a plurality of reference images in each of the L0 direction and the L1 direction. The reference image in the L0 direction is registered in the reference image list L0, and the reference image in the L1 direction is registered in the reference image list L1. The position of the reference image in the reference image list is designated by the reference image index in each prediction direction, and the reference image is determined. Hereinafter, the prediction direction is the L0 direction is a prediction direction that uses motion information associated with the reference image registered in the reference image list L0, and the prediction direction is the L1 direction is registered in the reference image list L1. The prediction direction uses motion information associated with the reference image.
(動き情報の符号量)
マージモードはマージインデックスで動き情報を伝送できる。従って、マージモード(マージフラグが1)と非マージモード(マージフラグが0)の予測誤差が同程度であれば、マージモードの方が動き情報を効率よく符号化できる。すなわち、マージモードの選択率を高くすることで動き情報の符号化効率を向上させることができる。
(Code amount of motion information)
In the merge mode, motion information can be transmitted using a merge index. Therefore, if the prediction errors in the merge mode (merge flag is 1) and the non-merge mode (merge flag is 0) are approximately the same, the merge mode can encode the motion information more efficiently. In other words, the efficiency of motion information encoding can be improved by increasing the selection rate of the merge mode.
(マージインデックスの特性)
マージモードの場合にマージインデックスの復号(符号化)の前段にマージの候補数を算出する処理が、非マージモードの場合に予測ベクトルインデックスの復号(符号化)の前段に予測ベクトルの候補数を算出する処理がそれぞれ設置されている。これらは隣接ブロックの動き情報の有効性によって、マージの候補数や予測ベクトルの候補数が予測ブロック毎に変化するために、その候補数を取得するために必要な処理である。尚、隣接ブロックの動き情報が有効であるとは、その隣接ブロックが領域外のブロックやイントラモードでないことであって、隣接ブロックの動き情報が無効であるとは、その隣接ブロックが領域外のブロックやイントラモードであることである。
(Characteristics of merge index)
In the merge mode, the number of merge candidates is calculated before the merge index decoding (encoding). In the non-merge mode, the number of prediction vector candidates is calculated before the prediction vector index decoding (encoding). Each process to calculate is installed. These are processes necessary for obtaining the number of candidates because the number of merge candidates and the number of prediction vector candidates change for each prediction block depending on the validity of motion information of adjacent blocks. Note that the motion information of the adjacent block is valid means that the adjacent block is not a block outside the area or the intra mode, and the motion information of the adjacent block is invalid means that the adjacent block is out of the area. It is a block or intra mode.
尚、マージの候補数が1である場合はマージインデックスを復号(符号化)しない。マージの候補数が1である場合は指定しなくとも一意に決定できるためである。予測ベクトルインデックスの場合も同様である。 When the number of merge candidates is 1, the merge index is not decoded (encoded). This is because when the number of merge candidates is 1, it can be uniquely determined without specifying. The same applies to the prediction vector index.
また、マージインデックスの符号列について図7(a)〜(c)を用いて説明する。本発明の実施の形態では、マージインデックスの符号列としてTruncated Unary符号列を用いる。図7(a)はマージの候補数が2個の場合のTruncated Unary符号列によるマージインデックスの符号列を、図7(b)はマージの候補数が3個の場合のTruncated Unary符号列によるマージインデックスの符号列を、図7(c)はマージの候補数が4個の場合のTruncated Unary符号列によるマージインデックスの符号列を示す。 The merge index code string will be described with reference to FIGS. In the embodiment of the present invention, a Trunked Unary code string is used as the code string of the merge index. FIG. 7A shows a merge index code string based on a truncated unary code string when the number of merge candidates is two, and FIG. 7B shows a merge based on a truncated unary code string when the number of merge candidates is three. FIG. 7C shows a code sequence of the index, and FIG. 7C shows a code sequence of the merge index by the Truncated Unary code sequence when the number of merge candidates is four.
図7(a)〜(c)から同じマージインデックスの値を符号化する場合でもマージの候補数が少ないほどマージインデックスに割り当てられる符号ビット数が小さくなることがわかる。例えば、マージインデックスが1である場合、マージの候補数が2個であれば‘1’の1ビットであるが、マージの候補数が3個または4個であれば‘10’の2ビットとなる。 7A to 7C that even when the same merge index value is encoded, the smaller the number of merge candidates, the smaller the number of code bits assigned to the merge index. For example, if the merge index is 1, if the number of merge candidates is two, it is 1 bit of “1”, but if the number of merge candidates is 3 or 4, it is 2 bits of “10”. Become.
以上のように、マージの候補数は少ないほどマージインデックスの符号化効率は向上する。すなわち、選択率が相対的に高い候補を残し、選択率が相対的に低い候補を削減することでマージインデックスの符号化効率は向上させることができる。また、候補数が同じである場合には、小さいマージインデックスの方が符号量は少なくなるため、選択率が相対的に高い候補に小さなマージインデックスを割り当てることで符号化効率を向上させることができる。 As described above, the encoding efficiency of the merge index improves as the number of merge candidates decreases. That is, the coding efficiency of the merge index can be improved by leaving candidates with a relatively high selectivity and reducing candidates with a relatively low selectivity. In addition, when the number of candidates is the same, the code amount of the smaller merge index is smaller, so that the encoding efficiency can be improved by assigning a small merge index to a candidate having a relatively high selectivity. .
(POC)
本発明の実施の形態では、画像の時間情報(距離情報)としてPOC(Picture Order Count)を用いる。POCはMPEG−4AVCで定義された画像の表示順序を示すカウンタである。画像の表示順序が1増加するとPOCも1増加する。したがって、画像間のPOC差から画像間の時間差(距離)を取得できる。
(POC)
In the embodiment of the present invention, POC (Picture Order Count) is used as time information (distance information) of an image. POC is a counter indicating the display order of images defined by MPEG-4 AVC. When the image display order is increased by 1, the POC is also increased by 1. Therefore, the time difference (distance) between images can be acquired from the POC difference between images.
(隣接ブロックの動き情報の特性)
一般的に処理対象ブロックの動き情報と処理対象ブロックに隣接するブロック(以下、隣接ブロックという)の動き情報の相関度が高いのは、処理対象ブロックと隣接ブロックが同じ動きをしている場合、例えば、処理対象ブロックと隣接ブロックを含めた領域が平行移動している場合である。また、一般的に処理対象ブロックの動き情報と隣接ブロックの動き情報の相関度は、処理対象ブロックと隣接ブロックの接している長さにも依存する。
(Characteristics of motion information of adjacent blocks)
In general, the degree of correlation between the motion information of the processing target block and the motion information of the block adjacent to the processing target block (hereinafter referred to as an adjacent block) is high when the processing target block and the adjacent block have the same motion. For example, this is a case where the region including the processing target block and the adjacent block is translated. In general, the degree of correlation between the motion information of the processing target block and the motion information of the adjacent block also depends on the length of contact between the processing target block and the adjacent block.
(別の画像の動き情報の特性)
一方、一般的に時間ダイレクトモードや空間ダイレクトモードで利用されている復号済みの別の画像上で処理対象ブロックと同一位置にあるブロック(以下、同一位置ブロックという)と、当該処理対象ブロックとの相関度が高いのは、当該同一位置ブロック及び当該処理対象ブロックが同じ動き情報、すなわち等速運動にある場合である。
(Characteristics of motion information of another image)
On the other hand, a block in the same position as the processing target block (hereinafter referred to as the same position block) on another decoded image generally used in the temporal direct mode or the spatial direct mode, and the processing target block The degree of correlation is high when the block at the same position and the block to be processed are in the same motion information, that is, at a constant velocity motion.
以下、図面とともに本発明の好適な実施の形態に係る動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラムの詳細について説明する。なお、図面の説明において同一要素には同一符号を付与して重複する説明を省略する。 Hereinafter, with reference to the drawings, the details of a moving image encoding apparatus, a moving image encoding method, a moving image encoding program, a moving image decoding apparatus, a moving image decoding method, and a moving image decoding program according to a preferred embodiment of the present invention will be described. explain. In the description of the drawings, the same elements are denoted by the same reference numerals and redundant description is omitted.
[実施の形態1]
(シンタックス)
本発明の実施の形態1における符号化及び復号で定義される予測ブロックのシンタックスの一例について図8を用いて説明する。予測ブロックがイントラであるかインターであるかは上位の符号化ブロックによって指定されており、図8は予測ブロックがインターの場合のシンタックスを示す。予測ブロックには、マージフラグ(merge_flag)、マージタイプ(merge_type)、マージインデックス(merge_idx、merge_idx_l0、merge_idx_l1)、インター予測モード(inter_pred_type)、参照インデックス(ref_idx_l0とref_idx_l1)、差分ベクトル(mvd_l0[0]、mvd_l0[1]、mvd_l1[0]、mvd_l1[1])及び予測ベクトルインデックス(mvp_idx_l0及びmvp_idx_l1)が設置されている。差分ベクトルの[0]は水平成分、[1]は垂直成分を示す。
[Embodiment 1]
(Syntax)
An example of the syntax of a prediction block defined by encoding and decoding in
選択されたマージインデックスで示される隣接ブロックの動き情報を利用するマージモードが予測ブロックに適用される場合、merge_flagは“1”に設定される。一方、予測ブロックにマージモードを適用せず、通常の動きベクトル検出にて検出された動きベクトルを利用する非マージモードを適用する場合、merge_flagは“0”に設定される。 When the merge mode using the motion information of the adjacent block indicated by the selected merge index is applied to the prediction block, merge_flag is set to “1”. On the other hand, merge_flag is set to “0” when the merge mode is not applied to the prediction block and the non-merge mode using the motion vector detected by the normal motion vector detection is applied.
merge_flagが“1”の場合、最初にmerge_typeが設定される。merge_typeはマージインデックスを1つ或いは2つ使用するかを切り換えるフラグである。merge_typeが“0”の場合、マージインデックスを1つ使用し、動き情報を利用する隣接ブロックをマージインデックス(merge_idx)で指定する。 When merge_flag is “1”, merge_type is set first. merge_type is a flag for switching whether to use one or two merge indexes. When merge_type is “0”, one merge index is used, and an adjacent block using motion information is designated by the merge index (merge_idx).
merge_typeが“1”の場合、マージインデックスを2つ使用する。マージインデックスはL0方向とL1方向にmerge_idx_l0,merge_idx_l1がそれぞれ設定され、L0方向とL1方向とで動き情報を利用する隣接ブロックをそれぞれ指定する。merge_typeが“1”の場合、L0及びL1方向の2つのマージインデックスを使用するので、予測ブロックを含むスライスタイプがBスライスの場合にのみ適用される。 When merge_type is “1”, two merge indexes are used. Merge_idx_l0 and merge_idx_l1 are set in the L0 direction and the L1 direction, respectively, and the merge index specifies adjacent blocks that use motion information in the L0 direction and the L1 direction, respectively. When merge_type is “1”, since two merge indexes in the L0 and L1 directions are used, this is applied only when the slice type including the prediction block is a B slice.
その為、スライスタイプがBスライスであるかどうかを判定し、スライスタイプがBスライスの場合に、更にマージインデックスを1つ或いは2つ使用するかをmerge_typeで指定する。スライスタイプがPスライスの場合は、予測方向がL0予測の1つしかないので、merge_typeは暗黙的に“0”に設定されることと等価になり、1つのマージインデックスで動き情報を利用する隣接ブロックを指定する。 Therefore, it is determined whether or not the slice type is a B slice, and if the slice type is a B slice, whether or not one or two merge indexes are to be used is specified by merge_type. When the slice type is P slice, since there is only one prediction direction of L0 prediction, merge_type is equivalent to being implicitly set to “0”, and adjacent using motion information with one merge index Specify a block.
マージインデックスの前段にマージの候補数を算出する関数NumMergeCand()が設置されている。これは隣接ブロックの動き情報の有効性によって、マージの候補数が予測ブロック毎に変化する為に、その候補数を取得するために必要な関数である。マージの候補数が1より大きい場合にマージの候補を指定する為にマージインデックスが使用され、マージの候補数が1の場合はマージ候補が一意に決定されるのでマージインデックスを使用しない。ここで、関数NumMergeCand()の括弧内に記述がある場合、その記述で示される予測方向のみの動き情報の有効性を判定し、候補数を算出する。予測方向はL0方向或いはL1方向である。関数NumMergeCand()の括弧内に記述が無い場合、L0方向またはL1方向の有効性を判定し、候補数を算出する。 A function NumMergeCand () for calculating the number of merge candidates is provided in the previous stage of the merge index. This is a function necessary for obtaining the number of candidates because the number of merge candidates changes for each prediction block depending on the validity of motion information of adjacent blocks. When the number of merge candidates is larger than 1, the merge index is used to designate the merge candidate. When the number of merge candidates is 1, the merge candidate is uniquely determined, so the merge index is not used. Here, when there is a description in parentheses of the function NumMergeCand (), the validity of motion information only in the prediction direction indicated by the description is determined, and the number of candidates is calculated. The prediction direction is the L0 direction or the L1 direction. When there is no description in parentheses of the function NumMergeCand (), the effectiveness in the L0 direction or the L1 direction is determined, and the number of candidates is calculated.
merge_flagが“0”の場合、非マージモードとなり、通常の動きベクトル検出で検出された動きベクトルを効率良く伝送する為に、L0及びL1方向毎に、予測ベクトルインデックスで示される隣接ブロックの動きベクトルを予測ベクトルとして、動きベクトル予測が行われる。予測ベクトルとして利用する隣接ブロックをL0、L1方向ごとに予測ベクトルインデックス(mvp_idx_l0及びmvp_idx_l1)で指定する。尚、図8に示すシンタックスにおいて、merge_idx_l0とmerge_idx_l1とを1つに纏めた形態を用いてもよい。例えば、merge_idx_l0をMSB、merge_idx_l1をLSBとして、(merge_idx_l0<<(merge_idx_l1のビット数))|merge_idx_l1としたものをmerge_idxとする。尚、この場合の条件文はif((NumMergeCand(L0)>1)||(NumMergeCand(L1)>1))となる。 When merge_flag is “0”, the non-merge mode is set, and in order to efficiently transmit the motion vector detected by the normal motion vector detection, the motion vector of the adjacent block indicated by the prediction vector index for each of the L0 and L1 directions. As a prediction vector, motion vector prediction is performed. An adjacent block used as a prediction vector is designated by a prediction vector index (mvp_idx_l0 and mvp_idx_l1) for each of the L0 and L1 directions. In the syntax shown in FIG. 8, a form in which merge_idx_l0 and merge_idx_l1 are combined into one may be used. For example, merge_idx_l0 is MSB, merge_idx_l1 is LSB, and (merge_idx_l0 << (number of bits of merge_idx_l1)) | merge_idx_l1 is merge_idx. In this case, the conditional statement is if ((NumMergeCand (L0)> 1) || (NumMergeCand (L1)> 1)).
予測ベクトルインデックスの前段に予測ベクトルの候補数を算出する関数NumMvpCand()が設置されており、NumMergeCand()と同様に、隣接ブロックの動き情報の有効性によって、予測ベクトルの候補数が予測ブロック毎に変化する為に、その候補数を取得するために必要な関数である。ここで、ref_idx_l0とmvd_l0[0]、mvd_l0[1]、mvp_idx_l0はL0方向に関する情報であって、ref_idx_l1とmvd_l1[0]、mvd_l1[1]、mvp_idx_l1はL1方向に関する情報である。inter_pred_typeにはPred_L0(L0方向の単方向)、Pred_L1(L1方向の単方向)及びPred_BI(BIの双方向)の3種類がある。 A function NumMvpCand () for calculating the number of prediction vector candidates is provided in the preceding stage of the prediction vector index. Like NumMergeCand (), the number of prediction vector candidates depends on the validity of motion information of adjacent blocks. This is a function necessary to obtain the number of candidates for changing to. Here, ref_idx_l0, mvd_l0 [0], mvd_l0 [1], and mvp_idx_l0 are information regarding the L0 direction, and ref_idx_l1, mvd_l1 [0], mvd_l1 [1], and mvp_idx_l1 are information regarding the L1 direction. There are three types of inter_pred_type: Pred_L0 (unidirectional in the L0 direction), Pred_L1 (unidirectional in the L1 direction), and Pred_BI (bidirectional in the BI).
(動画像符号化装置100の構成)
図9は本発明の実施の形態1に係る動画像符号化装置100の構成を示す。動画像符号化装置100は、動画像信号を動き補償予測を実施する予測ブロック単位で符号化する装置である。符号化ブロックの分割、予測ブロックサイズの決定、予測符号化モードの決定は上位の符号化制御部で決定されているものとする。
(Configuration of moving picture coding apparatus 100)
FIG. 9 shows a configuration of moving
動画像符号化装置100は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像符号化装置100は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。尚、処理対象の予測ブロックの位置情報、予測ブロックサイズ及び動き補償予測の予測方向に関しては動画像符号化装置100内で共有していることとし、図示しない。
The moving
実施の形態1の動画像符号化装置100は、予測ブロック画像取得部101、減算部102、予測誤差符号化部103、符号列生成部104、予測誤差復号部105、動き補償部106、加算部107、動きベクトル検出部108、動き情報生成部109、フレームメモリ110及び動き情報メモリ111を含む。
The moving
(動画像符号化装置100の機能)
以下、各部の機能について説明する。予測ブロック画像取得部101は、予測ブロックの位置情報と予測ブロックサイズに基づいて、端子10より供給される画像信号から処理対象の予測ブロックの画像信号を取得し、予測ブロックの画像信号を減算部102、動きベクトル検出部108及び動き情報生成部109に供給する。
(Function of moving picture coding apparatus 100)
Hereinafter, functions of each unit will be described. The prediction block
減算部102は、予測ブロック画像取得部101より供給される画像信号と動き補償部106より供給される予測信号を減算して予測誤差信号を算出し、当該予測誤差信号を予測誤差符号化部103に供給する。
The
予測誤差符号化部103は、減算部102より供給される予測誤差信号に対して、量子化や直交変換などの処理を行って予測誤差符号化データを生成し、当該予測誤差符号化データを符号列生成部104及び予測誤差復号部105に供給する。
The prediction
符号列生成部104は、予測誤差符号化部103より供給される予測誤差符号化データ、ならびに動き情報生成部109より供給されるマージフラグ、マージ候補番号、動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスを、動き補償予測の予測方向とともにシンタックスに従ってエントロピー符号化して符号列を生成し、当該符号列を端子11に供給する。
The code
ここで、マージ候補番号はマージインデックスに変換されて符号列を生成する。ここで、マージ候補番号は選択された結合動き情報候補を示す番号である。マージ候補番号からマージインデックスへの変換については後述する。尚、実施の形態1では上記のようにマージインデックスや予測ベクトルインデックスの符号化にTruncated Unary符号列を利用したが、候補数が小さいほど少ないビットで符号化できる符号列であればこれに限定されない。 Here, the merge candidate number is converted into a merge index to generate a code string. Here, the merge candidate number is a number indicating the selected combined motion information candidate. The conversion from the merge candidate number to the merge index will be described later. In the first embodiment, as described above, the truncated unified code string is used for encoding the merge index and the prediction vector index. However, the code string is not limited to this as long as the number of candidates is small and the code string can be encoded with fewer bits. .
予測誤差復号部105は、予測誤差符号化部103より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部107に供給する。
The prediction
動き補償部106は、動き情報生成部109より供給される参照画像インデックスで示されるフレームメモリ110内の参照画像を、動き情報生成部109より供給される動きベクトルに基づき動き補償して予測信号を生成する。予測方向が双方向であれば、L0方向とL1方向の予測信号を平均したものを予測信号とする。
The
加算部107は、予測誤差復号部105より供給される予測誤差信号と、動き補償部106より供給される予測信号を加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ110に供給する。
The
動きベクトル検出部108は、予測ブロック画像取得部101より供給される画像信号及び複数の参照画像に相当する画像信号から、動きベクトル及び参照画像を示す参照画像インデックスを検出し、当該動きベクトル及び当該参照画像インデックスを動き情報生成部109に供給する。尚、予測方向が双方向であれば、L0方向とL1方向の動きベクトルと参照画像インデックスを検出する。
The motion
一般的な動きベクトルの検出方法は、対象画像の画像信号と同一位置より所定の移動量だけ移動させた参照画像に相当する画像信号について誤差評価値を算出し、誤差評価値が最小となる移動量を動きベクトルとする。誤差評価値としては、絶対差分和を示すSAD(Sum of Absolute Difference)や二乗誤差平均を示すMSE(Mean Square Error)などを利用することが可能である。 A general motion vector detection method calculates an error evaluation value for an image signal corresponding to a reference image moved by a predetermined movement amount from the same position as the image signal of the target image, and moves to minimize the error evaluation value. Let the amount be a motion vector. As the error evaluation value, SAD (Sum of Absolute Difference) indicating the sum of absolute differences, MSE (Mean Square Error) indicating the mean square error, or the like can be used.
動き情報生成部109は、動きベクトル検出部108より供給される動きベクトルと参照画像インデックス、動き情報メモリ111より供給される候補ブロック群及びフレームメモリ110内の参照画像インデックスで示される参照画像から、マージ候補番号、または差分ベクトル及び予測ベクトルインデックスを生成し、マージフラグ、マージタイプ、マージ候補番号、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスを必要に応じて、符号列生成部104、動き補償部106及び動き情報メモリ111に供給する。動き情報生成部109の詳細な構成については後述する。
The motion
フレームメモリ110は、加算部107より供給される復号画像信号を記憶する。また、画像全体の復号が完了した復号画像については参照画像として、1以上の所定の画像数を記憶する。フレームメモリ110は、記憶した参照画像信号を動き補償部106及び動き情報生成部109に供給する。参照画像を記憶する記憶領域はFIFO(First In First Out)方式で制御される。
The
動き情報メモリ111は、動き情報生成部109より供給される動き情報を最小の予測ブロックサイズ単位で所定の画像数、記憶する。処理対象の予測ブロックの隣接ブロックの動き情報を空間候補ブロック群とする。
The
また、動き情報メモリ111は、処理対象の予測ブロックと同一位置にあるColPic上のブロックとその周辺ブロックの動き情報を時間候補ブロック群とする。動き情報メモリ111は、空間候補ブロック群と時間候補ブロック群を候補ブロック群として動き情報生成部109に供給する。動き情報メモリ111は、フレームメモリ110と同期しており、FIFO(First In First Out)方式で制御される。
In addition, the
ここで、ColPicとは、処理対象の予測ブロックとは別の復号済みの画像であって、フレームメモリ110に参照画像として記憶されている画像を指す。実施の形態1では、ColPicは直前に復号した参照画像とする。尚、実施の形態1では、ColPicは直前に復号した参照画像としたが、符号化済みの画像であればよく、例えば、表示順で直前の参照画像や表示順で直後の参照画像でもよく、符号化ストリーム中で指定することも可能である。
Here, ColPic refers to a decoded image different from the prediction block to be processed and stored in the
ここで、動き情報メモリ111における動き情報の管理方法について図10を用いて説明する。動き情報は最小の予測ブロック単位で各メモリエリアに記憶される。図10は処理対象の予測ブロックサイズが16画素×16画素である場合の様子を示している。この場合、この予測ブロックの動き情報は図10の斜線部の16個のメモリエリアに格納される。
Here, a method of managing motion information in the
尚、予測符号化モードがイントラモードである場合、L0方向とL1方向の動きベクトルとして(0,0)が記憶され、L0方向とL1方向の参照画像インデックスとして「−1」が記憶される。尚、参照画像インデックスの「−1」は動き補償予測を実施しないモードであることが判定できればどのような値でもよい。これ以降は特に断らない限り単にブロックと表現する場合には、最小の予測ブロック単位のことを示すこととする。また、領域外のブロックである場合もイントラモードと同様に、L0方向とL1方向の動きベクトルとして(0,0)、L0方向とL1方向の参照画像インデックスとして「−1」が記憶されている。LX方向(Xは0または1)が有効であるとはLX方向の参照画像インデックスが0以上であることで、LX方向が無効である(有効でない)とはLX方向の参照画像インデックスが「−1」であることである。 When the predictive coding mode is the intra mode, (0, 0) is stored as the motion vector in the L0 direction and the L1 direction, and “−1” is stored as the reference image index in the L0 direction and the L1 direction. The reference image index “−1” may be any value as long as it can be determined that the mode does not perform motion compensation prediction. From this point onward, unless expressed otherwise, the term “block” refers to the smallest predicted block unit when expressed simply as a block. Also, in the case of a block outside the area, as in the intra mode, (0, 0) is stored as the motion vector in the L0 direction and the L1 direction, and “−1” is stored as the reference image index in the L0 direction and the L1 direction. . The LX direction (X is 0 or 1) is valid when the reference image index in the LX direction is 0 or more, and the LX direction is invalid (not valid). The reference image index in the LX direction is “− 1 ”.
続いて、動き情報生成部109の詳細な構成について図11を用いて説明する。図11は動き情報生成部109の構成を示す。動き情報生成部109は、差分ベクトル算出部120、結合動き情報決定部121及び予測符号化モード決定部122を含む。端子12は動き情報メモリ111に、端子13は動きベクトル検出部108に、端子14はフレームメモリ110に、端子15は予測ブロック画像取得部101に、端子16は符号列生成部104に、端子50は動き補償部106に、及び端子51は動き情報メモリ111にそれぞれ接続されている。
Next, a detailed configuration of the motion
以下、各部の機能について説明する。差分ベクトル算出部120は、端子12より供給される候補ブロック群、端子13より供給される動きベクトルと参照画像インデックス、端子14より供給される参照画像及び端子15より供給される画像信号から予測ベクトルインデックスを決定して、差分ベクトル及びレート歪み評価値を算出する。そして、当該参照画像インデックス、当該動きベクトル、当該差分ベクトル、当該予測ベクトルインデックス及び当該レート歪み評価値を予測符号化モード決定部122に供給する。差分ベクトル算出部120の詳細な構成については後述する。
Hereinafter, functions of each unit will be described. The difference
結合動き情報決定部121は、端子12より供給される候補ブロック群、端子14より供給される参照画像及び端子15より供給される画像信号から結合動き情報候補リストを生成する。そして、結合動き情報決定部121は、生成した結合動き情報候補リストの中から結合動き情報候補を選択してマージ候補番号を決定すると共に、レート歪み評価値を算出して、当該結合動き情報候補の動き情報、当該マージ候補番号及び当該レート歪み評価値を予測符号化モード決定部122に供給する。結合動き情報決定部121の詳細な構成については後述する。
The combined motion
予測符号化モード決定部122は、差分ベクトル算出部120より供給されるレート歪み評価値と、結合動き情報決定部121より供給されるレート歪み評価値とを比較する。前者の方が後者未満の場合は、マージフラグを「0」に設定する。予測符号化モード決定部122は、マージフラグ及び差分ベクトル算出部120より供給される参照画像インデックスと差分ベクトルと予測ベクトルインデックスを端子16に供給し、差分ベクトル算出部120より供給される動きベクトルと参照画像インデックスを端子50及び端子51に供給する。
The predictive coding
後者が前者以下の場合は、マージフラグを1に設定する。予測符号化モード決定部122は、マージフラグ及び結合動き情報決定部121より供給されるマージ候補番号を端子16に供給し、結合動き情報決定部121より供給される動き情報の動きベクトルと参照画像インデックスを端子50及び端子51に供給する。尚、レート歪み評価値の具体的な算出方法は本発明の主眼ではないため詳細は省略するが、レート歪み評価値が小さいほど符号化効率は高くなる特性を持つ評価値である。
If the latter is less than or equal to the former, the merge flag is set to 1. The predictive coding
続いて、差分ベクトル算出部120の詳細な構成について図12を用いて説明する。図12は差分ベクトル算出部120の構成を示す。差分ベクトル算出部120は、予測ベクトル候補リスト生成部130、予測ベクトル決定部131及び減算部132を含む。端子17は予測符号化モード決定部122に接続されている。
Next, a detailed configuration of the difference
予測ベクトル候補リスト生成部130は、実施の形態1による動画像符号化装置100により生成された符号列を復号する動画像復号装置200(図33)にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて矛盾のない予測ベクトル候補リストが生成される。
The prediction vector candidate
以下、各部の機能について説明する。予測ベクトル候補リスト生成部130は、端子12より供給される候補ブロック群から領域外である候補ブロックや、イントラモードである候補ブロックを削除する。更に重複している動きベクトルを持つ候補ブロックが複数存在する場合には、1つの候補ブロックを残して、残りの少なくとも1つの候補ブロックを削除する。予測ベクトル候補リスト生成部130は、これら削除後の候補ブロックから予測ベクトル候補リストを生成し、予測ベクトル候補リストを予測ベクトル決定部131に供給する。このようにして生成された予測ベクトル候補リストには重複のない予測ベクトル候補が1つ以上含まれるとする。例えば、動きベクトルを持つ候補ブロックが1つもない場合には、ベクトル(0,0)が予測ベクトル候補リストに追加される。尚、予測方向が双方向であれば、L0方向とL1方向について予測ベクトル候補リストを生成して供給する。
Hereinafter, functions of each unit will be described. The prediction vector candidate
予測ベクトル決定部131は、予測ベクトル候補リスト生成部130より供給される予測ベクトル候補リストの中から、端子13より供給される動きベクトルに最適な予測ベクトルを選択する。予測ベクトル決定部131は、選択した予測ベクトルを減算部132に供給するとともに、参照画像インデックス及び選択された予測ベクトルを示す情報である予測ベクトルインデックスを端子17に供給する。尚、予測方向が双方向であれば、L0方向とL1方向について最適な予測ベクトルを選択して供給する。
The prediction
ここで、予測ベクトル候補が持つ動きベクトルに基づいて、端子14より供給される参照画像と端子15より供給される画像信号から予測誤差量がそれぞれ算出される。そして、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスの符号量と、上述の予測誤差量とからレート歪み評価値が算出されて、レート歪み評価値が最小となる予測ベクトル候補が最適な予測ベクトルとして選択される。 Here, based on the motion vector of the prediction vector candidate, the prediction error amount is calculated from the reference image supplied from the terminal 14 and the image signal supplied from the terminal 15. Then, the rate distortion evaluation value is calculated from the code amount of the reference image index, the difference vector, and the prediction vector index, and the above-described prediction error amount, and the prediction vector candidate that minimizes the rate distortion evaluation value is determined as the optimal prediction vector. Selected.
減算部132は、端子13より供給される動きベクトルから予測ベクトル決定部131より供給される予測ベクトルを減算して差分ベクトルを算出し、当該差分ベクトルを端子17に供給する。尚、予測方向が双方向であれば、L0方向とL1方向について差分ベクトルを算出して供給する。
The
(予測ベクトル候補リスト生成部130に供給される候補ブロック群)
ここで、予測ベクトル候補リスト生成部130に供給される候補ブロック群について図13と図14を用いて説明する。候補ブロック群には空間候補ブロック群と時間候補ブロック群が含まれる。
(Candidate block group supplied to prediction vector candidate list generation unit 130)
Here, the candidate block group supplied to the prediction vector candidate list production |
図13は処理対象の予測ブロックサイズが16画素×16画素である場合の処理対象の予測ブロックの隣接ブロックを示す。実施の形態1では、空間候補ブロック群として、図13に示すブロックA1、ブロックC、ブロックD、ブロックB1及びブロックEの5ブロックとする。ここでは、空間候補ブロック群をブロックA1、ブロックC、ブロックD、ブロックB1及びブロックEの5ブロックとしたが、空間候補ブロック群は、処理対象の予測ブロックに隣接する少なくとも1つ以上の処理済みのブロックであればよく、これらに限定されない。例えば、ブロックA1、ブロックA2、ブロックA3、ブロックA4、ブロックB1、ブロックB2、ブロックB3、ブロックB4、ブロックC、ブロックD及びブロックEの全てを空間候補ブロックとしてもよい。 FIG. 13 shows adjacent blocks of a prediction block to be processed when the prediction block size to be processed is 16 pixels × 16 pixels. In the first embodiment, the space candidate block group is assumed to be five blocks of block A1, block C, block D, block B1, and block E shown in FIG. Here, the spatial candidate block group is five blocks of block A1, block C, block D, block B1, and block E. However, the spatial candidate block group is at least one or more processed adjacent to the prediction block to be processed. However, the present invention is not limited to these blocks. For example, all of block A1, block A2, block A3, block A4, block B1, block B2, block B3, block B4, block C, block D, and block E may be spatial candidate blocks.
次に、時間候補ブロック群について図14を用いて説明する。図14は処理対象の予測ブロックサイズが16画素×16画素である場合の処理対象の予測ブロックと同一位置にあるColPic上の予測ブロック内のブロックとその周辺ブロックを示す。実施の形態1では、時間候補ブロック群として、図14に示すブロックHとブロックI6の2ブロックとする。 Next, the time candidate block group will be described with reference to FIG. FIG. 14 shows a block in a prediction block on ColPic and its peripheral blocks at the same position as the prediction block to be processed when the prediction block size to be processed is 16 pixels × 16 pixels. In the first embodiment, the time candidate block group includes two blocks, block H and block I6 shown in FIG.
ここでは、時間候補ブロック群をColPic上のブロックHとブロックI6の2ブロックとしたが、時間候補ブロック群は、処理対象の予測ブロックとは別の復号済みの画像上の少なくとも1つ以上のブロックであればよく、これらに限定されない。例えば、ColPic上のブロックI1からブロックI16、ブロックA1からブロックA4、ブロックB1からブロックB4、ブロックC、ブロックD、ブロックE、ブロックF1からブロックF4、ブロックG1からブロックG4及びブロックHの全てを時間候補ブロックとしてもよい。以降特に断らない限り、ブロックA4をブロックA、ブロックB4をブロックBと表記する。以降特に断らない限り、ブロックHとブロックI6のブロックを時間ブロックと表記する。 Here, the time candidate block group is two blocks of block H and block I6 on ColPic, but the time candidate block group is at least one block on a decoded image different from the prediction block to be processed. However, the present invention is not limited to these. For example, all of block I1 to block I16, block A1 to block A4, block B1 to block B4, block C, block D, block E, block F1 to block F4, block G1 to block G4 and block H on ColPic It may be a candidate block. Hereinafter, unless otherwise specified, block A4 is referred to as block A, and block B4 is referred to as block B. Hereinafter, unless otherwise specified, blocks H and I6 are referred to as time blocks.
(結合動き情報決定部121の構成)
続いて、結合動き情報決定部121の詳細な構成について図15を用いて説明する。図15は結合動き情報決定部121の構成を示す。結合動き情報決定部121は、結合動き情報候補生成部140及び結合動き情報選択部141を含む。結合動き情報候補生成部140は、実施の形態1による動画像符号化装置100により生成された符号列を復号する動画像復号装置200にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて矛盾のない結合動き情報リストが生成される。
(Configuration of the combined motion information determination unit 121)
Next, a detailed configuration of the combined motion
以下、各部の機能について説明する。結合動き情報候補生成部140は、端子12より供給される候補ブロック群から結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部141に供給する。結合動き情報候補生成部140の詳細な構成については後述する。
Hereinafter, functions of each unit will be described. The combined motion information
結合動き情報選択部141は、結合動き情報候補生成部140より供給される結合動き情報候補リストの中から、最適な結合動き情報候補を選択し、選択された結合動き情報候補を示す情報であるマージ候補番号を端子17に供給する。
The combined motion
ここで、結合動き情報候補の予測方向、動きベクトル及び参照画像インデックスに基づいて得られる端子14より供給される参照画像と、端子15より供給される画像信号とから予測誤差量が算出される。マージ候補番号の符号量と、当該予測誤差量とからレート歪み評価値が算出されて、レート歪み評価値が最小となる結合動き情報候補が最適な結合動き情報候補として選択される。 Here, the prediction error amount is calculated from the reference image supplied from the terminal 14 obtained based on the prediction direction, the motion vector, and the reference image index of the combined motion information candidate, and the image signal supplied from the terminal 15. A rate distortion evaluation value is calculated from the code amount of the merge candidate number and the prediction error amount, and the combined motion information candidate that minimizes the rate distortion evaluation value is selected as the optimal combined motion information candidate.
(結合動き情報候補生成部140に供給される候補ブロック群)
ここで、結合動き情報候補生成部140に供給される候補ブロック群について図13と図14を用いて説明する。候補ブロック群には空間候補ブロック群と時間候補ブロック群が含まれる。実施の形態1では、空間候補ブロック群を図13に示すブロックA4、ブロックB4、ブロックC及びブロックEの4ブロックとする。ここでは、空間候補ブロック群をブロックA4、ブロックB4、ブロックC及びブロックEの4ブロックとしたが、空間候補ブロック群は、処理対象の予測ブロックに隣接する少なくとも1つ以上の処理済みのブロックであればよく、ブロックの数や位置はこれらに限定されない。例えば、空間候補ブロック群をブロックA1、ブロックB1、ブロックC、ブロックE及びブロックDの5ブロックとしてもよい。
(Candidate block group supplied to the combined motion information candidate generation unit 140)
Here, the candidate block group supplied to the combined motion information
次に、時間候補ブロック群について図14を用いて説明する。実施の形態1では、時間候補ブロック群として、図14に示すブロックHとブロックI6の2ブロックとする。ここでは、時間候補ブロック群を予測ベクトル候補リスト生成部130に供給される時間候補ブロック群と同じとしたが、時間候補ブロック群は、処理対象の予測ブロックとは別の復号済みの画像上の少なくとも0以上のブロックであればよく、ブロックの数や位置はこれらに限定されない。
Next, the time candidate block group will be described with reference to FIG. In the first embodiment, the time candidate block group includes two blocks, block H and block I6 shown in FIG. Here, the time candidate block group is the same as the time candidate block group supplied to the prediction vector candidate
(結合動き情報候補生成部140の構成)
続いて、結合動き情報候補生成部140の詳細な構成について図16を用いて説明する。図16は結合動き情報候補生成部140の構成を示す。端子18は結合動き情報選択部141に接続されている。結合動き情報候補生成部140は、単結合動き情報候補リスト生成部150、単結合動き情報候補リスト削減部151、双結合動き情報候補リスト生成部152、双結合動き情報候補リスト削減部153及び双結合動き情報候補組合せリスト生成部154を含む。
(Configuration of combined motion information candidate generation unit 140)
Next, a detailed configuration of the combined motion information
以下、各部の機能について説明する。単結合動き情報候補リスト生成部150は、端子12より供給される候補ブロック群から単結合動き情報候補リストを生成し、当該単結合動き情報候補リストを単結合動き情報候補リスト削減部151に供給する。
Hereinafter, functions of each unit will be described. The single bond motion information candidate
単結合動き情報候補リスト削減部151は、単結合動き情報候補リスト生成部150より供給される単結合動き情報候補リストから重複している動き情報を持つ結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残し、残りの結合動き情報候補を削除して単結合動き情報候補リストを更新する。単結合動き情報候補リスト削減部151は、当該単結合動き情報候補リストを双結合動き情報候補リスト生成部152に供給するとともに端子18にも供給する。
When there are a plurality of combined motion information candidates that have overlapping motion information from the single combined motion information candidate list supplied from the single combined motion information candidate
双結合動き情報候補リスト生成部152は、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストから双結合動き情報候補リストを生成し、当該双結合動き情報候補リストを双結合動き情報候補リスト削減部153に供給する。
The bi-coupled motion information candidate
実施の形態1では、双結合動き情報候補リスト生成部152は、L0方向の双結合動き情報候補とL1方向の双結合動き情報候補の候補リストをそれぞれ生成するものとする。
In the first embodiment, it is assumed that bi-coupled motion information candidate
双結合動き情報候補リスト削減部153は、双結合動き情報候補リスト生成部152より供給される双結合動き情報候補リストから重複している動き情報を持つ結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残し、残りの結合動き情報候補を削除して双方向結合動き情報候補リストを更新する。双結合動き情報候補リスト削減部153は、当該双結合動き情報候補リストを双結合動き情報候補組合せリスト生成部154に供給する。
When there are a plurality of combined motion information candidates having motion information overlapping from the bi-coupled motion information candidate list supplied from the dual-coupled motion information candidate
双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補リスト削減部153より供給される双結合動き情報候補リストから、L0方向及びL1方向それぞれの結合動き情報候補の動き情報の組合せが、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストの中の結合動き情報候補の動き情報と重複している否かを判定する。重複していない双結合動き情報候補リストの組合せが存在する場合には双結合動き情報候補組合せリストを生成し、当該双結合動き情報候補組合せリストを端子18に供給する。
The bi-coupled motion information candidate combination
ここで、単結合動き情報候補は、所謂マージ技術で利用される候補ブロックの動き情報候補のことであって1つの候補ブロックから得られる動き情報である。一方、双結合動き情報は、2つの候補ブロックの2つの動き情報の両方を利用して得られる動き情報である。本実施の形態では2つの候補ブロックの2つの動き情報としてL0方向とL1方向をそれぞれ1つずつ利用する。 Here, the single combined motion information candidate is a motion information candidate of a candidate block used in a so-called merge technique, and is motion information obtained from one candidate block. On the other hand, bi-coupled motion information is motion information obtained by using both of two motion information of two candidate blocks. In the present embodiment, one L0 direction and one L1 direction are used as two pieces of motion information of two candidate blocks.
(双結合動き情報候補組合せリスト生成部154)
続いて、双結合動き情報候補組合せリスト生成部154の詳細な構成について図17を用いて説明する。図17は双結合動き情報候補組合せリスト生成部154の構成を示す。端子19は双結合動き情報候補リスト削減部153に、端子20は単結合動き情報候補リスト削減部151に、端子21は端子18にそれぞれ接続されている。双結合動き情報候補組合せリスト生成部154は、L0,L1方向動き情報候補組合せ部160及び双結合動き情報候補決定部161を含む。
(Bi-join motion information candidate combination list generation unit 154)
Next, a detailed configuration of the dual coupled motion information candidate combination
以下、各部の機能について説明する。L0,L1方向動き情報候補組合せ部160は、端子19より供給される双結合動き情報候補リストから取得される、L0予測及びL1予測の結合動き情報候補の動き情報を組合せて、双結合動き情報候補組合せリストを生成する。L0,L1方向動き情報候補組合せ部160は、当該双結合動き情報候補組合せリストを双結合動き情報候補決定部161に送る。
Hereinafter, functions of each unit will be described. The L0 and L1 direction motion information
双結合動き情報候補決定部161は、L0,L1方向動き情報候補組合せ部160より供給される双結合動き情報候補組合せリストの結合動き情報候補と、端子20により供給される単結合動き情報候補リストの結合動き情報候補とを比較する。双結合動き情報候補決定部161は、当該比較の結果、両候補間に重複があった場合、当該双結合動き情報候補組合せリストから重複する結合動き情報候補を外して、当該双方向結合動き情報候補組合せリストを更新し、当該双方向結合動き情報候補組合せリストを端子21に送る。
The bi-coupled motion information
(候補番号管理テーブル)
ここで、実施の形態1で利用するマージ候補番号と結合動き情報候補の関係を示す候補番号管理テーブルについて図18を用いて説明する。単結合動き情報候補リスト及び双結合動き情報候補リストに登録される結合動き情報候補のどちらにもマージ候補番号との関連付けが適用される。マージ候補番号の0から4は、それぞれ結合動き情報候補リストに含まれるブロックAの結合動き情報候補(A)、ブロックBの結合動き情報候補(B)、時間ブロックの結合動き情報候補(COL)、ブロックCの結合動き情報候補(C)、ブロックEの結合動き情報候補(E)を示す。また、結合動き情報候補リストに含まれる結合動き情報候補の最大数は5(マージインデックスの最大値は4)であるとする。尚、実施の形態1で利用する候補番号管理テーブルを図18としたが、選択率が相対的に高い結合動き情報候補ほど小さいマージ候補番号が割り当てられていればよくこれに限定されない。
(Candidate number management table)
Here, a candidate number management table indicating the relationship between merge candidate numbers and combined motion information candidates used in
ここで、候補番号管理テーブル及び結合動き情報候補リストに含まれる結合動き情報候補の最大数は動画像符号化装置100内で共有していることとし、図示しない。以下、マージ候補番号からマージインデックスへの変換について図19(a)、(b)を用いて説明する。
Here, the maximum number of combined motion information candidates included in the candidate number management table and the combined motion information candidate list is assumed to be shared in the moving
図19(a)は、ブロックAの結合動き情報候補、ブロックBの結合動き情報候補、時間ブロックの結合動き情報候補、ブロックCの結合動き情報候補及びブロックEの結合動き情報候補が全て有効である場合に、マージ候補番号はそのままマージインデックスとなることを示している。 In FIG. 19A, the combined motion information candidate for block A, the combined motion information candidate for block B, the combined motion information candidate for time block, the combined motion information candidate for block C, and the combined motion information candidate for block E are all valid. In some cases, the merge candidate number is directly used as a merge index.
図19(b)は、結合動き情報候補に無効なブロックが含まれている場合、無効であるマージ候補番号を詰めてからマージ候補番号の小さい順序にマージインデックスが割り当てられる場合を示している。図19(b)のようにマージ候補番号が1のブロックBとマージ候補番号が3のブロックCの結合動き情報候補が無効である場合、マージインデックスの0はマージ候補番号0に、マージインデックスの1はマージ候補番号2に、マージインデックスの2はマージ候補番号4にそれぞれ変換される。
FIG. 19B shows a case where merge indexes are assigned in ascending order of merge candidate numbers after filling invalid merge candidate numbers when the combined motion information candidates include invalid blocks. As shown in FIG. 19B, when the combined motion information candidate of the block B with the
実施の形態1による動画像符号化装置100により生成された符号列を復号する動画像復号装置200ではマージインデックスからマージ候補番号に上記とは逆の変換が行われて、動画像符号化装置100と動画像復号装置200にて矛盾のない候補番号管理テーブルが生成される。
In the moving
(動画像符号化装置100の動作)
続いて、図20のフローチャートを用いて、実施の形態1の動画像符号化装置100における符号化の動作を説明する。予測ブロック画像取得部101は、予測ブロックの位置情報と予測ブロックサイズに基づいて、端子10より供給される画像信号から処理対象の予測ブロックの画像信号を取得する(S100)。
(Operation of moving picture coding apparatus 100)
Next, an encoding operation in the moving
動きベクトル検出部108は、予測ブロック画像取得部101より供給される画像信号と複数の参照画像に相当する画像信号から、動きベクトル及び参照画像を示す参照画像インデックスを検出する(S101)。
The motion
動き情報生成部109は、動きベクトル検出部108より動きベクトルと参照画像インデックス、動き情報メモリ111より候補ブロック群のマージ候補番号或いは差分ベクトルと予測ベクトルインデックスが供給され、その中から画像の予測信号を生成する為の動き情報を生成する(S102)。
The motion
動き補償部106は、フレームメモリ110内の参照画像インデックスで示される参照画像を、動きベクトル検出部108より供給される動きベクトルに基づき、動き補償して予測信号を生成する。予測方向が双方向であれば、L0方向とL1方向の予測信号を平均したものを予測信号として生成する(S103)。
The
減算部102は、予測ブロック画像取得部101より供給される画像信号と、動き補償部106より供給される予測信号との差分を算出して予測誤差信号を算出する(S104)。予測誤差符号化部103は、減算部102より供給される予測誤差信号に対して、量子化や直交変換などの処理を行って予測誤差符号化データを生成する(S105)。
The
符号列生成部104は、予測誤差符号化部103より供給される予測誤差符号化データ、ならびに動き情報生成部109より供給されるマージフラグ、マージタイプ、マージ候補番号、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスを、予測方向とともにシンタックスに従ってエントロピー符号化して符号列を生成する(S106)。
The code
加算部107は、予測誤差復号部105より供給される予測誤差信号と、動き補償部106より供給される予測信号とを加算して復号画像信号を生成する(S107)。フレームメモリ110は、加算部107より供給される復号画像信号を記憶する(S108)。動き情報メモリ111は、動きベクトル検出部108より供給される動きベクトルを、最小の予測ブロックサイズ単位で1画像分記憶する(S109)。
The adding
引き続いて、図21のフローチャートを用いて、動き情報生成部109の動作を説明する。差分ベクトル算出部120は、端子12より供給される候補ブロック群、端子13より供給される動きベクトルと参照画像インデックス、端子14より供給される参照画像及び端子15より供給される画像信号から、予測ベクトルインデックスを決定して差分ベクトルとレート歪み評価値を算出する(S110)。
Subsequently, the operation of the motion
結合動き情報決定部121は、端子12より供給される候補ブロック群、端子14より供給される参照画像及び端子15より供給される画像信号から、マージ候補番号を決定してレート歪み評価値を算出する(S111)。
The combined motion
予測符号化モード決定部122は、差分ベクトル算出部120より供給されるレート歪み評価値と、結合動き情報決定部121より供給されるレート歪み評価値を比較し、前者が後者より小さい場合はマージフラグを「0」に設定し、そうでない場合は、マージフラグを「1」に設定する(S112)。
The predictive coding
引き続いて、図22のフローチャートを用いて、差分ベクトル算出部120の動作を説明する。予測ベクトル候補リスト生成部130は、端子12より供給される候補ブロック群から領域外である候補ブロック、イントラモードである候補ブロック及び重複している動きベクトルを持つ候補ブロックを除いた候補ブロックから、予測ベクトル候補リストを生成する。予測方向が双方向であれば、L0方向とL1方向について予測ベクトル候補リストを生成する(S120)。
Subsequently, the operation of the difference
予測ベクトル決定部131は、予測ベクトル候補リスト生成部130より供給される予測ベクトル候補リストの中から、端子13より供給される動きベクトルに最適な予測ベクトルを選択する。予測方向が双方向であれば、L0方向とL1方向について最適な予測ベクトルを選択する(S121)。減算部132は、端子13より供給される動きベクトルから、予測ベクトル決定部131より供給される予測ベクトルを減算して差分ベクトルを算出する。予測方向が双方向であれば、L0方向とL1方向について差分ベクトルを算出する(S122)。
The prediction
(結合動き情報決定部121の動作)
引き続いて、図23のフローチャートを用いて、結合動き情報決定部121の動作を詳細に説明する。結合動き情報候補生成部140は、端子12より供給される候補ブロック群から結合動き情報候補リストを生成する(S130)。結合動き情報選択部141は、結合動き情報候補生成部140より供給される結合動き情報候補リストの中から、端子13より供給される動きベクトルと参照画像インデックス、及び予測方向に最適な結合動き情報を決定する(S131)。
(Operation of the combined motion information determination unit 121)
Subsequently, the operation of the combined motion
(結合動き情報候補生成部140の動作)
引き続いて、図24のフローチャートを用いて、結合動き情報候補生成部140の動作を詳細に説明する。単結合動き情報候補リスト生成部150は、端子12より供給される空間候補ブロック群から領域外である候補ブロック及びイントラモードである候補ブロックを除いた候補ブロックから空間結合動き情報候補リストを生成する(S140)。空間結合動き情報候補リストの生成の詳細な動作は後述する。
(Operation of combined motion information candidate generation unit 140)
Subsequently, the operation of the combined motion information
単結合動き情報候補リスト生成部150は、端子12より供給される時間候補ブロック群から領域外である候補ブロック及びイントラモードである候補ブロックを除いた候補ブロックから、時間結合動き情報候補リストを生成する(S141)。時間結合動き情報候補リストの生成の詳細な動作は後述する。
The single combined motion information candidate
単結合動き情報候補リスト生成部150は、空間結合動き情報候補リストと時間結合動き情報候補リストをマージ候補番号の順序で結合して、単結合動き情報候補リストを生成する(S142)。
The single combined motion information candidate
単結合動き情報候補リスト削減部151は、単結合動き情報候補リスト生成部150より供給される単結合動き情報候補リストから重複している動き情報を持つ結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残して、それ以外の重複している動き情報を持つ結合動き情報候補を削除して、単結合動き情報候補リストを更新する(S143)。
When there are a plurality of combined motion information candidates that have overlapping motion information from the single combined motion information candidate list supplied from the single combined motion information candidate
双結合動き情報候補リスト生成部152は、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストから双結合動き情報候補リストを生成する(S144)。双結合動き情報候補リストはL0方向とL1方向の2つが作成される。単結合動き情報候補リストの中の各結合動き情報候補のL0方向及びL1方向の動き情報を分割して、それぞれの方向毎に作成される結合動き情報候補のリストを双結合動き情報候補リストとする。尚、スライスタイプがPスライスの場合、或いはマージタイプが“0”の場合は双結合動き情報候補リストを生成する必要はなく、双結合動き情報候補リスト生成部152によるステップS144以降の処理を実施しなくてもよい。
The double-coupled motion information candidate
双結合動き情報候補リスト削減部153は、双結合動き情報候補リスト生成部152より供給される双結合動き情報候補リストから重複している動き情報を持つ結合動き情報候補が複数存在する場合には、1つの結合動き情報候補を残して、それ以外の重複している動き情報を持つ結合動き情報候補を削除して双結合動き情報候補リストを更新する(S145)。双結合動き情報候補リストの削減の詳細な動作は後述する。
When there are a plurality of combined motion information candidates having motion information overlapping from the bi-coupled motion information candidate list supplied from the dual-coupled motion information candidate
双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補リスト削減部153より供給される双結合動き情報候補リストのL0方向及びL1方向それぞれの結合動き情報候補の動き情報を組み合わせて、双結合動き情報候補組合せリストを生成する(S146)。双結合動き情報候補組合せリストの生成の詳細な動作は後述する。
The bi-join motion information candidate combination
双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補組合せリストの結合動き情報候補の動き情報が、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストの結合動き情報候補の動き情報と重複している場合には、双結合動き情報候補組合せリストからその重複している組合せ候補を削除して、双結合動き情報候補組合せリストを更新する(S147)。双結合動き情報候補組合せリストの更新の詳細な動作は後述する。
The combined motion information candidate combination
引き続いて、図25のフローチャートを用いて、空間結合動き情報候補リストの生成の詳細な動作を説明する。実施の形態1では、空間結合動き情報候補リストには4以下の候補ブロックの動き情報が含まれるとする。
Subsequently, the detailed operation of generating the spatially coupled motion information candidate list will be described using the flowchart of FIG. In
空間候補ブロック群に含まれる4つの候補ブロックであるブロックA、ブロックB、ブロックC及びブロックEについて以下の処理を繰り返し行う(S150からS153)。候補ブロックの有効性を検査する(S151)。候補ブロックが領域外でなくイントラモードでもない場合に候補ブロックは有効となる。候補ブロックが有効であれば(S151のY)、候補ブロックの動き情報を空間結合動き情報候補リストに追加する(S152)。候補ブロックが有効でなければ(S151のN)、ステップS152はスキップされる。 The following processing is repeated for block A, block B, block C, and block E, which are four candidate blocks included in the space candidate block group (S150 to S153). The validity of the candidate block is checked (S151). A candidate block is valid when the candidate block is not out of the region and is not in intra mode. If the candidate block is valid (Y in S151), the motion information of the candidate block is added to the spatially combined motion information candidate list (S152). If the candidate block is not valid (N in S151), step S152 is skipped.
実施の形態1では空間結合動き情報候補リストには4以下の候補ブロックの動き情報が含まれるとしたが、候補ブロックの有効性によって空間結合動き情報候補の数が変動すればよく、これに限定されない。 In the first embodiment, it is assumed that the spatial combination motion information candidate list includes motion information of four or less candidate blocks. However, the number of spatial combination motion information candidates may be changed depending on the validity of the candidate block, and the present invention is not limited thereto. Not.
引き続いて、図26のフローチャートを用いて、時間結合動き情報候補リストの生成の詳細な動作を説明する。実施の形態1では、時間結合動き情報候補リストには1以下の候補ブロックの動き情報が含まれるとする。
Subsequently, a detailed operation of generating a time combination motion information candidate list will be described using the flowchart of FIG. In
時間候補ブロック群に含まれる2つの候補ブロックである時間ブロックについて以下の処理を繰り返し行う(S160からS166)。候補ブロックの有効性を検査する(S161)。候補ブロックが領域外でなくイントラモードでもない場合に候補ブロックは有効となる。候補ブロックが有効であれば(S161のY)、時間結合動き情報候補が生成され、時間結合動き情報候補が時間結合動き情報候補リストに追加され(ステップS162からステップS165)、処理を終了する。候補ブロックが有効でなければ(S161のN)、次の候補ブロックを検査する(S166)。 The following processing is repeated for time blocks that are two candidate blocks included in the time candidate block group (S160 to S166). The validity of the candidate block is checked (S161). A candidate block is valid when the candidate block is not out of the region and is not in intra mode. If the candidate block is valid (Y in S161), a temporally combined motion information candidate is generated, the temporally combined motion information candidate is added to the temporally combined motion information candidate list (from step S162 to step S165), and the process ends. If the candidate block is not valid (N in S161), the next candidate block is inspected (S166).
候補ブロックが有効であれば、時間結合動き情報候補の予測方向の決定を行う(S162)。実施の形態1では結合動き情報候補の予測方向を双方向とする。次に、時間結合動き情報候補のL0方向、L1方向の参照画像の決定を行う(S163)。実施の形態1ではL0方向の参照画像を、L0方向の参照画像のうち処理対象画像に最も近い距離にある参照画像とし、L1方向の参照画像を、L1方向の参照画像のうち処理対象画像に最も近い距離にある参照画像とする。ここでは、L0方向の参照画像を、L0方向の参照画像のうち処理対象画像に最も近い距離にある参照画像とし、L1方向の参照画像を、L1方向の参照画像のうち処理対象画像に最も近い距離にある参照画像としたが、L0方向の参照画像とL1方向の参照画像が決定できればよく、これに限定されない。例えば、符号化ストリーム中にL0方向及びL1方向の参照画像を符号化してもよく、L0方向及びL1方向の参照画像インデックスを0にしてもよく、処理対象ブロックの隣接ブロックが使用しているL0方向の参照画像及びL1方向の参照画像で、最も多く使用されている参照画像をL0方向、L1方向ぞれぞれの参照する参照画像としてもよい。 If the candidate block is valid, the prediction direction of the temporally combined motion information candidate is determined (S162). In the first embodiment, the prediction direction of the combined motion information candidate is bidirectional. Next, the reference images in the L0 direction and the L1 direction of the time combination motion information candidate are determined (S163). In the first embodiment, the reference image in the L0 direction is the reference image that is the closest to the processing target image among the reference images in the L0 direction, and the reference image in the L1 direction is the processing target image among the reference images in the L1 direction. The reference image is the closest distance. Here, the reference image in the L0 direction is the reference image that is the closest to the processing target image among the reference images in the L0 direction, and the reference image in the L1 direction is the closest to the processing target image among the reference images in the L1 direction. Although the reference image is at a distance, it is only necessary to determine the reference image in the L0 direction and the reference image in the L1 direction, and the present invention is not limited to this. For example, the reference images in the L0 direction and the L1 direction may be encoded in the encoded stream, the reference image indexes in the L0 direction and the L1 direction may be set to 0, and the L0 used by the adjacent block of the processing target block. Of the reference image in the direction and the reference image in the L1 direction, the most frequently used reference image may be used as a reference image for reference in each of the L0 direction and the L1 direction.
次に、時間結合動き情報候補の動きベクトルを算出する(S164)。本実施の形態における、時間結合動き情報候補は、候補ブロックの動き情報で有効な予測方向である参照画像ColRefPicと動きベクトルmvColを基準に、双方向の動き情報を算出する。 Next, the motion vector of the time combination motion information candidate is calculated (S164). In this embodiment, the temporally combined motion information candidate calculates bidirectional motion information based on the reference image ColRefPic and the motion vector mvCol, which are effective prediction directions in the motion information of the candidate block.
候補ブロックの予測方向がL0方向もしくはL1方向の単方向の場合には、その予測方向の参照画像と動きベクトルを基準として選択する。 When the prediction direction of the candidate block is the unidirectional direction of the L0 direction or the L1 direction, it is selected based on the reference image and the motion vector in the prediction direction.
候補ブロックの予測方向が双方向である場合には、L0方向或いはL1方向のいずれか一方の参照画像と動きベクトルを基準として選択する。例えば、ColPicと同じ時間方向に存在する参照画像と動きベクトルを基準として選択する、候補ブロックのL0方向或いはL1方向の参照画像のいずれかと、ColPicの画像間距離が近い方を基準として選択する、候補ブロックのL0方向或いはL1方向のいずれかの動きベクトルが処理対象画像と交差する方を基準として選択する等が挙げられる。 When the prediction direction of the candidate block is bidirectional, the selection is made based on either the reference image in the L0 direction or the L1 direction and the motion vector. For example, a reference image that is present in the same time direction as ColPic and a motion vector is selected as a reference, and either a reference image in the L0 direction or L1 direction of a candidate block is selected based on the one that has a shorter distance between ColPic images. For example, the candidate vector may be selected on the basis that the motion vector in the L0 direction or the L1 direction of the candidate block intersects the processing target image.
双方向動き情報生成の基準とする参照画像と動きベクトルが選択されたら、時間結合動き情報候補の動きベクトルを算出する。 When a reference image and a motion vector as a reference for generating bidirectional motion information are selected, a motion vector of a temporally combined motion information candidate is calculated.
ここで、双方向動き情報生成の基準とする動きベクトルColMvと参照画像ColRefPicからの時間結合動き情報候補の動きベクトルmvL0t、mvL1tの算出手法について図27を用いて説明する。 Here, a method of calculating the motion vectors mvL0t and mvL1t of the temporally combined motion information candidates from the motion vector ColMv and the reference image ColRefPic used as the basis for bidirectional motion information generation will be described with reference to FIG.
ColPicとColRefPicの画像間距離をColDistとし、時間結合動き情報候補のL0方向の参照画像ColL0Picと処理対象画像CurPicの画像間距離をCurL0Dist、時間結合動き情報候補のL1方向の参照画像ColL1Picと処理対象画像CurPicの画像間距離をCurL1Distとすると、ColMvをColDistとCurL0Dist、CurL1Distの距離比率でスケーリングした下記式1の動きベクトルを、時間結合動き情報候補の動きベクトルとする。ここで、画像間距離の算出はPOCを用いて行われ、正負の符号を有する。なお、除算は四捨五入で行われる。
mvL0t=mvCol×CurrL0Dist/ColDist
mvL1t=mvCol×CurrL1Dist/ColDist ・・・(式1)
尚、図27のColPic、ColRefPic、ColL0Pic、ColL1Picは一例であって、これ以外の関係であってもよい。
The distance between the images of ColPic and ColRefPic is ColDist, the distance between the reference images ColL0Pic in the L0 direction of the temporally coupled motion information candidate and the image to be processed CurPic is CurL0Dist, the reference image ColL1Pic of the temporally coupled motion information candidate in the L1 direction and the target of processing Assuming that the distance between images of the image CurPic is CurL1Dist, a motion vector of the
mvL0t = mvCol × CurrL0Dist / ColDist
mvL1t = mvCol × CurrL1Dist / ColDist (Formula 1)
Note that ColPic, ColRefPic, ColL0Pic, and ColL1Pic in FIG. 27 are examples, and other relationships may be used.
以上のようにして、算出された時間結合動き情報候補の動きベクトルは、時間結合動き情報候補リストを追加する(S165)。ここでは上記のようにして時間結合動き情報候補を生成したが、符号化済みの別の画像の動き情報を利用して双方向の動き情報が決定できればよく、これに限定されない。例えば、ダイレクト動き補償で行われているように各方向の参照画像と処理対象画像の距離に応じてスケーリングした動きベクトルを双方向の動きベクトルとしてもよい。候補ブロックが無効であれば(S161のN)、次の候補ブロックを検査する(S166)。 As described above, a temporally coupled motion information candidate list is added to the motion vector of the temporally coupled motion information candidate thus calculated (S165). Here, the time combination motion information candidates are generated as described above. However, bidirectional motion information may be determined using motion information of another encoded image, and the present invention is not limited to this. For example, a motion vector scaled according to the distance between the reference image in each direction and the processing target image as in direct motion compensation may be used as a bidirectional motion vector. If the candidate block is invalid (N in S161), the next candidate block is inspected (S166).
ここでは、時間結合動き情報候補リストには1以下の候補ブロックの動き情報が含まれるとしたが、候補ブロックの有効性によって時間結合動き情報候補の数が変動すればよく、これに限定されない。予測方向、参照画像及び動きベクトルの決定方法についても同様に、これらに限定されない。 Here, the temporally combined motion information candidate list includes motion information of one or less candidate blocks, but the number of temporally combined motion information candidates may be changed depending on the validity of the candidate block, and is not limited to this. Similarly, the prediction direction, the reference image, and the motion vector determination method are not limited to these.
(双結合動き情報候補リストの削減)
引き続いて、図28(a)〜(e)及び図29(a)〜(e)を用いて、双結合動き情報候補リストの結合動き情報候補の削減の詳細な動作を説明する。図28(a)は単結合動き情報候補リスト削減部151にて重複する動き情報を備える結合動き情報候補は削除されて更新された単結合動き情報候補リストの一例を示す。図28(a)はマージ候補番号と結合動き情報候補の関係を示す候補番号管理テーブルの説明に使用した図18の結合動き情報候補が全て双方向モード(BiPred)の場合であり、各結合動き情報候補のL0方向及びL1方向の動き情報が図28(a)のように設定されていることとする。
(Reduction of candidate list of double coupled motion information)
Subsequently, a detailed operation of reducing the combined motion information candidates in the dual combined motion information candidate list will be described with reference to FIGS. 28 (a) to 28 (e) and FIGS. 29 (a) to 29 (e). FIG. 28A shows an example of a single combined motion information candidate list updated by deleting a combined motion information candidate having overlapping motion information in the single combined motion information candidate
各結合動き情報候補に設定される動き情報は、L0方向の動き情報にL0_0,L0_1,L0_2、L1方向の動き情報にL1_0,L1_1,L1_2とし、それぞれ異なるものとする。その為、L0及びL1方向単位では重複する動き情報が存在するものの、L0とL1を合わせて1つの動き情報とみなす場合には、重複する動き情報が存在せず、単結合動き情報候補リスト削減部151において、それらの結合動き情報候補の削除はされずに、図28(a)に示されるように、5つの結合動き情報候補が残される。
The motion information set for each combined motion information candidate is different in the L0 direction motion information as L0_0, L0_1, L0_2, and the L1 direction motion information as L1_0, L1_1, L1_2. Therefore, although overlapping motion information exists in the L0 and L1 direction units, when L0 and L1 are regarded as one motion information, there is no overlapping motion information and the single combined motion information candidate list is reduced. In the
双結合動き情報候補リスト生成部152にて生成される双結合動き情報候補リストは、図28(a)で示される単結合動き情報候補リストの各結合動き情報候補の動き情報をL0方向とL1方向に分割して、図28(b)及び図28(c)のように生成される。図28(b)はL0方向、図28(c)はL1方向の双結合動き情報候補リストを示す。生成された双結合動き情報候補リストは、双結合動き情報候補リスト削減部153に供給される。
The double-coupled motion information candidate list generated by the dual-coupled motion information candidate
双結合動き情報候補リスト削減部153は、L0及びL1方向ごとに双結合動き情報候補リストの中で重複している動き情報を備える結合動き情報候補を削除する。まず、図28(b)のL0予測の双結合動き情報候補リストの結合動き情報候補の削除について説明する。
The dual coupled motion information candidate
図28(b)では、結合動き情報候補Aが動き情報L0_0を、BとCOLがL0_1を、CとEがL0_2を備えている。マージ候補番号の小さい結合動き情報候補の順番で動き情報を比較する。まず、マージ候補番号が0であるAと他の結合動き情報候補との比較を開始する。L0_0を備えるAはL0方向の双結合動き情報候補リストの中に1つしかないので、Aのマージ候補番号を変更せずに0としてL0方向の双結合動き情報候補リストに残す。 In FIG. 28B, the combined motion information candidate A includes motion information L0_0, B and COL include L0_1, and C and E include L0_2. The motion information is compared in the order of the combined motion information candidates with the smallest merge candidate number. First, a comparison between A having a merge candidate number of 0 and other combined motion information candidates is started. Since there is only one A having L0_0 in the L0 direction bi-join motion information candidate list, the merge candidate number of A is left as 0 in the L0 direction bi-join motion information candidate list.
BとCOLは同じ動き情報L0_1を備えているので、L0方向の双結合動き情報候補リストの中で動き情報が重複しており、どちらか一方をL0方向の双結合動き情報候補リストから削除する。ここでは、選択率が相対的に高い結合動き情報候補ほど小さいマージ候補番号を割り当てているので、マージ候補番号の大きい方を削除対象とする。この場合、Bのマージ候補番号が1でCOLが2であるので、COLを削除し、BはL0方向の双結合動き情報候補リストに残す。 Since B and COL have the same motion information L0_1, motion information is duplicated in the L0 direction bi-join motion information candidate list, and one of them is deleted from the L0 direction bi-join motion information candidate list. . Here, since a merge candidate number that is smaller is assigned to a combined motion information candidate having a relatively high selection rate, the larger merge candidate number is set as a deletion target. In this case, since the merge candidate number of B is 1 and COL is 2, COL is deleted, and B is left in the bi-join motion information candidate list in the L0 direction.
COLの削除により、COLに割り当てられてたマージ候補番号2は、COLの直後のマージ候補番号3のCに割り当てる。以降のL0方向の双結合動き情報候補リストに残っている結合動き情報候補(図28(b)の例ではE)に、結合動き情報候補のマージ候補番号を1だけ引いた数を割り当てて、L0方向の双結合動き情報候補リストを更新する。
By deleting COL, merge
次に、マージ候補番号2以降の結合動き情報候補の動き情報を比較する。CとEは同じ動き情報L0_2を備えているので、L0方向の双結合動き情報候補リストの中で動き情報が重複しており、L0方向の双結合動き情報候補リストからEを削除する。以上のように、L0方向の双結合動き情報候補リストの中で重複する動き情報を備える結合動き情報候補は削除され、図28(b)は図28(d)のように更新される。
Next, the motion information of the combined motion information candidates after the
図28(d)中のハッチングが入った行は削除された結合動き情報候補を示す。これらに割り当てられていたマージ候補番号はL0方向の双結合動き情報候補リストに残った結合動き情報候補に小さい順に割り当てられる。L0方向の双結合動き情報候補リストに残った結合動き情報候補は関数NumMergeCand(L0)で表され、ここでは3となる。 The hatched lines in FIG. 28 (d) indicate deleted combined motion information candidates. The merge candidate numbers assigned to these are assigned to the combined motion information candidates remaining in the L0 direction bi-join motion information candidate list in ascending order. The combined motion information candidate remaining in the L0 direction double-coupled motion information candidate list is represented by the function NumMergeCand (L0), and is 3 here.
同様にして、図28(c)のL1方向の双結合動き情報候補リストの結合動き情報候補の削除を実施すると、図28(e)のように更新される。L1方向の双結合動き情報候補リストに残った結合動き情報候補は関数NumMergeCand(L1)で表され、ここでは3となる。 Similarly, when deletion of the combined motion information candidates in the L1 direction double combined motion information candidate list in FIG. 28C is performed, an update is made as shown in FIG. The combined motion information candidate remaining in the L1 direction dual-coupled motion information candidate list is represented by the function NumMergeCand (L1), and is 3 here.
次に、図28(a)〜(e)で示される結合動き情報候補の動き情報が全て双方向モード(BiPred)でなく、単方向モード(UniPred)を含み、L0とL1方向を合わせて1つの動き情報とみなす場合に重複する動き情報が存在しない単結合動き情報候補リストの一例を図29(a)に示す。図29(a)は単結合動き情報候補リスト削減部151にて重複する動き情報を備える結合動き情報候補は削除されて更新された単結合動き情報候補リストの一例である。図29(a)において結合動き情報候補BはL1方向のみ、CはL0方向のみの動き情報を備え、それ以外の結合動き情報候補はL0及びL1方向の動き情報を備えているものとする。ここで、L0方向或いはL1方向に動き情報が存在しない場合、図29(a)〜(e)中で記号“−”で表すこととする。
Next, the motion information of the combined motion information candidates shown in FIGS. 28A to 28E includes not only the bidirectional mode (BiPred) but the unidirectional mode (UniPred), and the L0 and L1 directions are combined to 1 FIG. 29A shows an example of a single combined motion information candidate list in which there is no overlapping motion information when it is regarded as one piece of motion information. FIG. 29A shows an example of a single combined motion information candidate list updated by deleting the combined motion information candidate having the overlapping motion information in the single combined motion information candidate
双結合動き情報候補リスト生成部152にて生成される双結合動き情報候補リストは、図29(a)で示される単結合動き情報候補リストの各結合動き情報候補の動き情報をL0方向とL1方向に分割して、図29(b)及び図29(c)のように生成される。図29(b)はL0方向、図29(c)はL1方向の双結合動き情報候補リストを示す。生成された双結合動き情報候補リストは、双結合動き情報候補リスト削減部153に供給される。
The double-coupled motion information candidate list generated by the dual-coupled motion information candidate
双結合動き情報候補リスト削減部153は、L0及びL1方向ごとに双結合動き情報候補リストの中で重複している動き情報を備える結合動き情報候補を削除する。まず、図29(b)のL0予測の双結合動き情報候補リストの結合動き情報候補の削除について説明する。
The dual coupled motion information candidate
図29(b)では、結合動き情報候補AとEが動き情報L0_0を、COLとCがL0_1を備えており、BはL1方向の単方向モードなのでL0方向の動き情報は無い。図28(a)〜(e)での説明と同様に、マージ候補番号の小さい結合動き情報候補の順番で動き情報を比較し、重複する動き情報を備える結合動き情報候補が複数存在する場合には、選択率が相対的に高い結合動き情報候補ほど小さいマージ候補番号を割り当てているので、マージ候補番号の最も小さい結合動き情報候補を残し、他をリストから削除する。 In FIG. 29 (b), combined motion information candidates A and E have motion information L0_0, COL and C have L0_1, and B has a unidirectional mode in the L1 direction, so there is no motion information in the L0 direction. Similarly to the description in FIGS. 28A to 28E, when motion information is compared in the order of combined motion information candidates with the smallest merge candidate number, and there are a plurality of combined motion information candidates having overlapping motion information. Since the merge candidate number is assigned to the combined motion information candidate having a relatively high selection rate, the merged motion information candidate having the smallest merge candidate number is left and the others are deleted from the list.
まず、マージ候補番号が0であるAと他の結合動き情報候補との比較を開始する。AとEは同じ動き情報L0_1を備えており、Aのマージ候補番号が0でEが4であるので、Eを削除し、AはL0方向の双結合動き情報候補リストに残す。削除するEはL0方向の双結合動き情報候補リストの最も大きい番号が割り当てられており、E以降には結合動き情報候補が存在しない。従って、L0方向の双結合動き情報候補リストのマージ候補番号の割り当てを更新する必要はない。 First, a comparison between A having a merge candidate number of 0 and other combined motion information candidates is started. A and E have the same motion information L0_1. Since the merge candidate number of A is 0 and E is 4, E is deleted, and A is left in the L0 direction bi-join motion information candidate list. E to be deleted is assigned the largest number in the bi-join motion information candidate list in the L0 direction, and no join motion information candidate exists after E. Therefore, it is not necessary to update the allocation of merge candidate numbers in the L0 direction double-coupled motion information candidate list.
次のBはL0方向の動き情報が無く、L0方向の動き情報を持たない他の結合動き情報候補が存在しないので、Bのマージ候補番号を変更せずに1としてL0方向の双結合動き情報候補リストに残す。続いて、マージ候補番号が2のCOLとマージ候補番号が3のCが同じ動き情報L0_1を備えているので、Cを削除し、COLはL0方向の双結合動き情報候補リストに残す。L0方向の双結合動き情報候補リストは、既にEが削除され、Cより後ろに結合動き情報候補が存在しないので、L0方向の双結合動き情報候補リストのマージ候補番号の割り当てを更新する必要はない。以上のように、L0方向の双結合動き情報候補リストの中で重複する動き情報を備える結合動き情報候補は削除され、図29(b)は図29(d)のように更新される。
Since the next B has no motion information in the L0 direction and there is no other combined motion information candidate that does not have the motion information in the L0 direction, the B merge candidate number is set to 1 without changing the B merge candidate number. Leave on the candidate list. Subsequently, since COL with
図29(d)中のハッチングが入った行は削除された結合動き情報候補を示す。L0方向の双結合動き情報候補リストに残った結合動き情報候補は関数NumMergeCand(L0)で表され、ここでは3となる。 The hatched lines in FIG. 29 (d) indicate deleted combined motion information candidates. The combined motion information candidate remaining in the L0 direction double-coupled motion information candidate list is represented by the function NumMergeCand (L0), and is 3 here.
同様にして、図29(c)のL1方向の双結合動き情報候補リストの結合動き情報候補の削除を実施すると、図29(e)のように更新される。L1方向の双結合動き情報候補リストに残った結合動き情報候補は関数NumMergeCand(L1)で表され、ここでは3となる。 Similarly, when deletion of the combined motion information candidates in the L1 direction double combined motion information candidate list in FIG. 29C is performed, the information is updated as illustrated in FIG. The combined motion information candidate remaining in the L1 direction dual-coupled motion information candidate list is represented by the function NumMergeCand (L1), and is 3 here.
図29(a)〜(e)で示される単結合動き情報候補リストの一例では、単結合動き情報候補リストの中で、L0或いはL1方向の一方の動き情報のみ備える結合動き情報候補もL0及びL1方向の双結合動き情報候補リストに登録される結合動き情報候補としたが、双結合動き情報候補リストの結合動き情報候補から外してもよい。例えば、図29(a)の単結合動き情報候補リストの中の結合動き情報候補Bは単方向モードであり、L1方向の動き情報しか備えていない。従って、L0方向の双結合動き情報候補リストに結合動き情報候補として登録しても、L0方向の動き情報が無いので、他の結合動き情報候補のL1方向の動き情報のみを使用して動き補償予測を行うことになる。 In the example of the single combined motion information candidate list shown in FIGS. 29A to 29E, the combined motion information candidate including only one of the pieces of motion information in the L0 or L1 direction in the single combined motion information candidate list is L0 and The combined motion information candidate registered in the L1 direction double-coupled motion information candidate list is used, but may be excluded from the combined motion information candidate in the dual-coupled motion information candidate list. For example, the combined motion information candidate B in the single combined motion information candidate list in FIG. 29A is in the unidirectional mode and includes only the motion information in the L1 direction. Therefore, even if it is registered as a combined motion information candidate in the L0 direction bi-coupled motion information candidate list, there is no motion information in the L0 direction, so motion compensation is performed using only the motion information in the L1 direction of other combined motion information candidates. Make predictions.
その為、動き補償予測の予測精度が低下してしまうことも有り得る。そこで、単結合動き情報候補リストの中で双方向モードの結合動き情報候補のみを対象として、常にL0及びL1方向の2つの動き情報を備える結合動き情報候補の組合せを選出するようにしてもよい。以上のようにして、L0及びL1方向の双結合動き情報候補リストの結合動き情報候補の削減が実施され、L0及びL1方向の双結合動き情報候補リストが更新される。 Therefore, the prediction accuracy of motion compensation prediction may be reduced. Therefore, a combination of combined motion information candidates that always includes two pieces of motion information in the L0 and L1 directions may be selected from only the combined motion information candidates in the bidirectional mode in the single combined motion information candidate list. . As described above, the combined motion information candidate list in the L0 and L1 direction double combined motion information candidate lists is reduced, and the L0 and L1 direction double combined motion information candidate lists are updated.
(双結合動き情報候補組合せリストの生成)
引き続いて、図30(a)〜(d)及び図31(a)〜(d)を用いて、双結合動き情報候補組合せリストの生成の詳細な動作を説明する。図30(a)、(b)及び図31(a)、(b)は、双結合動き情報候補リスト削減部153にて、図28(a)〜(e)及び図29(a)〜(e)で示される双結合動き情報候補リストの一例から、重複する動き情報を備える結合動き情報候補を削除して更新された双結合動き情報候補リストである。図30(a)及び図31(a)がL0方向、図30(b)及び図31(b)がL1方向の双結合動き情報候補リストを示す。
(Generation of double combined motion information candidate combination list)
Subsequently, a detailed operation of generating a double-coupled motion information candidate combination list will be described with reference to FIGS. 30 (a) to 30 (d) and FIGS. 31 (a) to 31 (d). 30 (a), 30 (b), 31 (a), and 31 (b), the dual-join motion information candidate
最初に図30(a)、(b)の双結合動き情報候補リストを例として説明する。双結合動き情報候補リスト削減部153にて更新された図30(a)、(b)で示される双結合動き情報候補リストが双結合動き情報候補組合せリスト生成部154に供給される。双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補リストのL0方向及びL1方向の結合動き情報候補を組み合わせて、図30(c)に示される双結合動き情報候補組合せリストを生成する。図30(a)、(b)の例では、L0方向、L1方向ともに3つの結合動き情報候補があるので、9つの双結合動き情報候補が生成される。
First, a description will be given of the double-coupled motion information candidate list shown in FIGS. 30A and 30B as an example. The double coupled motion information candidate list shown in FIGS. 30A and 30B updated by the dual coupled motion information candidate
次に、生成された双結合動き情報候補組合せリストの中の双結合動き情報候補の動き情報が、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストの結合動き情報候補の動き情報と重複しているか否かを判定する。ここでは、図30(c)中のL0方向及びL1方向で組み合わされた双結合動き情報候補の動き情報が、図28(a)で示される単結合動き情報候補リストの中の結合動き情報候補の動き情報と同一であるかを判定する。
Next, the combined motion information candidate of the single combined motion information candidate list supplied from the single combined motion information candidate
双結合動き情報候補組合せリストの中の双結合動き情報候補の動き情報が、単結合動き情報候補リストの結合動き情報候補の動き情報と重複する場合、単結合動き情報候補の動き情報を参照することを優先し、この時の双結合動き情報候補の組合せは無効と判定し、使用しない。同じ動き情報を参照するのに、双結合動き情報候補ではL0及びL1方向の2つのマージインデックスが必要となり、単結合動き情報候補では1つのマージインデックスで済む為である。一方、重複しない場合、単結合動き情報候補リストに存在しない新たな組合せの動き情報の候補として、有効な双結合動き情報候補とする。 When the motion information of the bi-coupled motion information candidate in the bi-coupled motion information candidate combination list overlaps with the motion information of the combined motion information candidate in the single-coupled motion information candidate list, the motion information of the single-coupled motion information candidate is referred to. This combination is determined to be invalid and is not used. This is because, in order to refer to the same motion information, two merge indexes in the L0 and L1 directions are necessary for the dual coupled motion information candidate, and one merge index is sufficient for the single coupled motion information candidate. On the other hand, if they do not overlap, they are considered as effective double coupled motion information candidates as motion information candidates of a new combination that does not exist in the single coupled motion information candidate list.
ここで、説明の都合上、図30(c)中の双結合動き情報候補のL0方向及びL1方向の動き情報の組み合わせを(L0,L1)で表し、括弧内にはマージ候補番号を記述することとし、以下に図30(c)中の組合せが備える動き情報を判定する。 Here, for convenience of explanation, the combination of motion information in the L0 direction and the L1 direction of the bi-join motion information candidate in FIG. 30C is represented by (L0, L1), and the merge candidate number is described in parentheses. In the following, the motion information included in the combination in FIG.
(0,0)はL0方向はAの動き情報(L0_0)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストのAと同一であるので、単結合動き情報候補リストのAを優先し、この組合せは使用しない。 (0, 0) is the motion information (L0_0) of A in the L0 direction and the motion information (L0_0) of A is in the L1 direction, and is the same as A in the single combined motion information candidate list. A is given priority and this combination is not used.
(0,1)はL0方向はAの動き情報(L0_0)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (0, 1) is the motion information (L0_0) of the A in the L0 direction, and the motion information (L0_1) of the COL in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(0,2)はL0方向はAの動き情報(L0_0)、L1方向はEの動き情報(L0_2)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (0, 2) is the motion information of A in the L0 direction (L0_0), the L1 direction is the motion information of E (L0_2), and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(1,0)はL0方向はBの動き情報(L0_1)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストのBと同一であるので、単結合動き情報候補リストのBを優先し、この組合せは使用しない。 (1, 0) is the motion information (L0_1) of the B in the L0 direction and the motion information (L0_0) of the A1 is the same as B in the single combined motion information candidate list. B is given priority and this combination is not used.
(1,1)はL0方向はBの動き情報(L0_1)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストのCOLと同一であるので、単結合動き情報候補リストのCOLを優先し、この組合せは使用しない。 (1, 1) is the motion information (L0_1) of the B in the L0 direction and the motion information (L0_1) of the COL in the L1 direction, which is the same as the COL of the single combined motion information candidate list. COL is preferred and this combination is not used.
(1,2)はL0方向はBの動き情報(L0_1)、L1方向はEの動き情報(L0_2)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (1, 2) is B motion information (L0_1) in the L0 direction and E motion information (L0_2) in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(2,0)はL0方向はCの動き情報(L0_2)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (2, 0) is C motion information (L0_2) in the L0 direction and A motion information (L0_0) in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(2,1)はL0方向はCの動き情報(L0_2)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストのCと同一であるので、単結合動き情報候補リストのCを優先し、この組合せは使用しない。 (2, 1) is C motion information (L0_2) in the L0 direction and COL motion information (L0_1) in the L1 direction, which is the same as C in the single combined motion information candidate list. C is preferred and this combination is not used.
(2,2)はL0方向はCの動き情報(L0_2)、L1方向はEの動き情報(L0_2)となり、単結合動き情報候補リストのEと同一であるので、単結合動き情報候補リストのEを優先し、この組合せは使用しない。 (2, 2) is C motion information (L0_2) in the L0 direction and E motion information (L0_2) in the L1 direction, which is the same as E in the single combined motion information candidate list. E is given priority and this combination is not used.
こうして判定された双結合動き情報候補の組合せは図30(d)に示される。図30(a)〜(d)の例では、単結合動き情報候補リストに存在しない有効な組合せとなる双結合動き情報候補は(0,1),(0,2),(1,2)及び(2,0)となり(図30(c)中に“○”で表される)、これらの組合せを表すL0及びL1方向のマージ候補番号を、単結合動き情報候補リストのマージ候補番号とともに結合動き情報選択部141に供給する。
FIG. 30D shows the combination of the double-coupled motion information candidates determined in this way. In the example of FIGS. 30A to 30D, the double-coupled motion information candidates that are valid combinations not existing in the single-coupled motion information candidate list are (0, 1), (0, 2), (1, 2). And (2, 0) (represented by “◯” in FIG. 30 (c)), the merge candidate numbers in the L0 and L1 directions representing these combinations, together with the merge candidate numbers in the single combined motion information candidate list This is supplied to the combined motion
以上のようにして、L0方向とL1方向とで異なる隣接ブロックの動き情報が参照可能となる。しかしながら、図30(c)で示される双結合動き情報候補の組合せは、NumMergaCand(L0)×NumMergeCand(L1)=3×3=9通り存在するが、実際に有効な組合せは4通りしかない。その4通りを表す為のマージ候補番号に図7(b)の符号割当を適用すると、片方向を2ビットで表すので最大4ビットが必要となる。単純に4通りの組合せを表すのであれば、図7(c)の符号割当を適用すると最大3ビットで済むので、符号化効率が低下することなる。このことは、L0方向及びL1方向の双結合動き情報候補をそれぞれ独立して2次元上に配列した為である。 As described above, it is possible to refer to motion information of adjacent blocks that are different in the L0 direction and the L1 direction. However, there are NumMergaCand (L0) × NumMergeCand (L1) = 3 × 3 = 9 combinations of the double-coupled motion information candidates shown in FIG. 30C, but there are only four actually effective combinations. When the code allocation shown in FIG. 7B is applied to the merge candidate numbers for representing the four ways, one direction is represented by 2 bits, and a maximum of 4 bits are required. If the four combinations are simply represented, applying the code allocation of FIG. 7C requires a maximum of 3 bits, which reduces the encoding efficiency. This is because the double coupled motion information candidates in the L0 direction and the L1 direction are two-dimensionally arranged independently.
そこで、まず、L0方向の有効な双結合動き情報候補を決定し、その後に決定されたL1方向の有効な双結合動き情報候補と組み合わせて、有効な組合せとなるL1方向の双結合動き情報候補に対してマージ候補番号を割り当てるようにする。図30(d)を用いて説明する。 Therefore, first, an effective bi-coupled motion information candidate in the L0 direction is determined, and then combined with the determined effective bi-coupled motion information candidate in the L1 direction, an L1 direction bi-coupled motion information candidate that is an effective combination. A merge candidate number is assigned to. This will be described with reference to FIG.
L0方向の双結合動き情報候補としてAを選択した場合、単結合動き情報候補リストに存在しない組合せの動き情報を備えるL1方向の有効な双結合動き情報候補はCOLとEである。この時のL1方向の有効な双結合動き情報候補の候補数はNumMergeCand(L1)=2となり、COLにマージ候補番号を0、Eに1を割り当てるようにする。この時、L1方向のマージ候補番号の符号割当は、候補数が2となるので、図7(a)の符号割当が適用され、L1方向は1ビットで済むことになり、L0方向に必要な2ビットを加算しても3ビットで済むことになり、符号化効率が改善される。 When A is selected as the L0 direction bi-coupled motion information candidate, COL and E are effective bi-coupled motion information candidates in the L1 direction including motion information of combinations that do not exist in the single-coupled motion information candidate list. At this time, the number of effective candidates for bi-join motion information in the L1 direction is NumMergeCand (L1) = 2, and a merge candidate number is assigned to COL and 1 is assigned to E. At this time, since the number of candidates for the merge candidate number in the L1 direction is 2, the code assignment in FIG. 7A is applied, and the L1 direction needs only 1 bit, which is necessary for the L0 direction. Even if 2 bits are added, only 3 bits are required, and the coding efficiency is improved.
同様にして、L0方向の双結合動き情報候補としてBを選択した場合、単結合動き情報候補リストに存在しない組合せの動き情報を備えるL1方向の有効な双結合動き情報候補はEのみである。この時のL1方向の有効な双結合動き情報候補の候補数はNumMergeCand(L1)=1となり、一意にL1方向の有効な双結合動き情報候補として選出されるので、マージ候補番号は必要としない。 Similarly, when B is selected as the L0 direction double-coupled motion information candidate, only E is the only effective double-coupled motion information candidate in the L1 direction including motion information of a combination that does not exist in the single-coupled motion information candidate list. At this time, the number of valid bi-join motion information candidates in the L1 direction is NumMergeCand (L1) = 1, and is uniquely selected as a valid bi-join motion information candidate in the L1 direction, so a merge candidate number is not required. .
この場合はL0方向の双結合動き情報候補を表す2ビットのみで済むことになり、符号化効率が改善される。L0方向の双結合動き情報候補としてCを選択した場合は、上述したBを選択した場合と同様なので説明を割愛する。以上のように、L0方向の有効な双結合動き情報候補を選択した後で、有効な組合せとなるL1方向の有効な双結合動き情報候補を選択することで、参照する双結合動き情報候補を示す符号量を削減することが可能となる。L0方向、L1方向の順に処理を進めるので、実施の形態1で定義したシンタックスを変更しなくてもよい。 In this case, only 2 bits representing the L0-direction bi-join motion information candidate are required, and the coding efficiency is improved. When C is selected as a candidate for double coupled motion information in the L0 direction, the description is omitted because it is similar to the case where B is selected. As described above, after selecting an effective bi-coupled motion information candidate in the L0 direction, by selecting an effective bi-coupled motion information candidate in the L1 direction as an effective combination, the bi-coupled motion information candidate to be referred to is selected. It is possible to reduce the amount of code shown. Since the processing proceeds in the order of the L0 direction and the L1 direction, it is not necessary to change the syntax defined in the first embodiment.
次に、図31(a)、(b)の双結合動き情報候補リストを例として説明する。双結合動き情報候補リスト削減部153にて更新された図31(a)、(b)で示される双結合動き情報候補リストが双結合動き情報候補組合せリスト生成部154に供給される。双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補リストのL0方向及びL1方向の結合動き情報候補を組み合わせて、図31(c)に示される双結合動き情報候補組合せリストを生成する。図31(a)、(b)の例では、L0方向、L1方向ともに3つの結合動き情報候補があるので、9つの双方向結合動き情報候補が生成される。
Next, a description will be given of the double-coupled motion information candidate list of FIGS. 31A and 31B as an example. The double coupled motion information candidate list shown in FIGS. 31A and 31B updated by the dual coupled motion information candidate
次に、生成された双結合動き情報候補組合せリストの中の双結合動き情報候補の動き情報が、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストの結合動き情報候補の動き情報と重複しているか否かを判定する。ここでは、図31(c)中のL0方向及びL1方向で組み合わされた双結合動き情報候補の動き情報が、図28(a)で示される単結合動き情報候補リストの中の結合動き情報候補の動き情報と同一であるかを判定する。
Next, the combined motion information candidate of the single combined motion information candidate list supplied from the single combined motion information candidate
双結合動き情報候補組合せリストの中の双結合動き情報候補の動き情報が、単結合動き情報候補リストの結合動き情報候補の動き情報と重複する場合、単結合動き情報候補の動き情報を参照することを優先し、この時の双結合動き情報候補の組合せは無効と判定し、使用しない。同じ動き情報を参照するのに、双結合動き情報候補ではL0及びL1方向の2つのマージインデックスが必要となり、単結合動き情報候補では1つのマージインデックスで済む為である。一方、重複しない場合、単結合動き情報候補リストに存在しない新たな組合せの動き情報の候補として、有効な双結合動き情報候補とする。 When the motion information of the bi-coupled motion information candidate in the bi-coupled motion information candidate combination list overlaps with the motion information of the combined motion information candidate in the single-coupled motion information candidate list, the motion information of the single-coupled motion information candidate is referred to. This combination is determined to be invalid and is not used. This is because, in order to refer to the same motion information, two merge indexes in the L0 and L1 directions are necessary for the dual coupled motion information candidate, and one merge index is sufficient for the single coupled motion information candidate. On the other hand, if they do not overlap, they are considered as effective double coupled motion information candidates as motion information candidates of a new combination that does not exist in the single coupled motion information candidate list.
ここで、説明の都合上、図31(c)中の双結合動き情報候補のL0方向及びL1方向の動き情報の組み合わせを(L0,L1)で表し、括弧内にはマージ候補番号を記述することとし、以下に図31(c)中の組合せが備える動き情報を判定する。 Here, for convenience of explanation, the combination of motion information in the L0 direction and the L1 direction of the bi-join motion information candidate in FIG. 31C is represented by (L0, L1), and the merge candidate number is described in parentheses. In the following, the motion information included in the combination in FIG.
(0,0)はL0方向はAの動き情報(L0_0)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストのAと同一であるので、単結合動き情報候補リストのAを優先し、この組合せは使用しない。 (0, 0) is the motion information (L0_0) of A in the L0 direction and the motion information (L0_0) of A is in the L1 direction, and is the same as A in the single combined motion information candidate list. A is given priority and this combination is not used.
(0,1)はL0方向はAの動き情報(L0_0)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストのEと同一であるので、単結合動き情報候補リストのAを優先し、この組合せは使用しない。 (0, 1) is the motion information (L0_0) of A in the L0 direction, and the motion information (L0_1) of COL is in the L1 direction, and is the same as E in the single combined motion information candidate list. A is given priority and this combination is not used.
(0,2)はL0方向はAの動き情報(L0_0)、L1方向はCの動き情報(−)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (0, 2) is the motion information (L0_0) of A in the L0 direction, and the motion information (-) of C in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(1,0)はL0方向はBの動き情報(−)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストのBと同一であるので、単結合動き情報候補リストのBを優先し、この組合せは使用しない。 (1,0) is the motion information (−) of B in the L0 direction and the motion information (L0_0) of A in the L1 direction, which is the same as B in the single combined motion information candidate list. B is given priority and this combination is not used.
(1,1)はL0方向はBの動き情報(−)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (1,1) is B motion information (-) in the L0 direction and COL motion information (L0_1) in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(1,2)はL0方向はBの動き情報(−)、L1方向はCの動き情報(−)となり、両結合動き情報候補の動き情報が存在しないので、この組合せは使用しない。 In (1, 2), the L0 direction is B motion information (-), the L1 direction is C motion information (-), and there is no motion information of both combined motion information candidates, so this combination is not used.
(2,0)はL0方向はCOLの動き情報(L0_1)、L1方向はAの動き情報(L0_0)となり、単結合動き情報候補リストに該当する結合動き情報候補が存在しないので、有効な双結合動き情報候補とする。 (2, 0) is COL motion information (L0_1) in the L0 direction and A motion information (L0_0) in the L1 direction, and there is no combined motion information candidate corresponding to the single combined motion information candidate list. Let it be a combined motion information candidate.
(2,1)はL0方向はCOLの動き情報(L0_1)、L1方向はCOLの動き情報(L0_1)となり、単結合動き情報候補リストのCOLと同一であるので、単結合動き情報候補リストのCを優先し、この組合せは使用しない。 (2, 1) is COL motion information (L0_1) in the L0 direction and COL motion information (L0_1) in the L1 direction, which is the same as COL in the single combined motion information candidate list. C is preferred and this combination is not used.
(2,2)はL0方向はCの動き情報(L0_2)、L1方向はCの動き情報(−)となり、単結合動き情報候補リストのCと同一であるので、単結合動き情報候補リストのEを優先し、この組合せは使用しない。 (2, 2) is C motion information (L0_2) in the L0 direction and C motion information (-) in the L1 direction, which is the same as C in the single combined motion information candidate list. E is given priority and this combination is not used.
こうして判定された双結合動き情報候補の組合せは図31(c)に示される。図31(a)〜(c)の例では、単結合動き情報候補リストに存在しない有効な組合せとなる双結合動き情報候補は(0,2)、(1,1)及び(2,0)となり(図31(c)中に“○”で表される)、これらの組合せを表すL0及びL1方向のマージ候補番号を、単結合動き情報候補リストのマージ候補番号とともに結合動き情報選択部141に供給する。
FIG. 31C shows a combination of the dual-coupled motion information candidates determined in this way. In the examples of FIGS. 31A to 31C, the double-coupled motion information candidates that are valid combinations not existing in the single-coupled motion information candidate list are (0, 2), (1, 1), and (2, 0). (Represented by “◯” in FIG. 31 (c)), the merge candidate numbers in the L0 and L1 directions representing these combinations are combined with the merge candidate numbers in the single combined motion information candidate list, and the combined motion
以上のようにして、L0方向とL1方向とで異なる隣接ブロックの動き情報が参照可能となる。図31(a)〜(c)の例でも、図30(a)〜(d)で説明したのと同様に、L0方向の有効な双結合動き情報候補を決定し、その後に決定されたL1方向の有効な双結合動き情報候補と組み合わせて、有効な組合せとなるL1方向の双結合動き情報候補に対してマージ候補番号を割り当てるようにすると、図31(d)のようになる。L0方向の双結合動き情報候補としてA、B、COLの何れを選択した場合でも、単結合動き情報候補リストに存在しない組合せの動き情報を備えるL1方向の有効な双結合動き情報候補は1つしか存在しない。この時のL1方向の有効な双結合動き情報候補の候補数はNumMergeCand(L1)=1となり、一意にL1方向の有効な双結合動き情報候補として選出されるので、マージ候補番号は必要としない。この場合はL0方向の双結合動き情報候補を表す2ビットのみで済むことになり、符号化効率が改善される。 As described above, it is possible to refer to motion information of adjacent blocks that are different in the L0 direction and the L1 direction. In the example of FIGS. 31A to 31C as well, as described with reference to FIGS. 30A to 30D, an effective bi-join motion information candidate in the L0 direction is determined, and then the determined L1 When a merge candidate number is assigned to an L1 direction bi-join motion information candidate that is an effective combination in combination with a direction effective bi-join motion information candidate, the result is as shown in FIG. Regardless of whether A, B, or COL is selected as the L0 direction bi-coupled motion information candidate, there is one effective bi-coupled motion information candidate in the L1 direction that includes motion information of a combination that does not exist in the single coupled motion information candidate list Only exists. At this time, the number of valid bi-join motion information candidates in the L1 direction is NumMergeCand (L1) = 1, and is uniquely selected as a valid bi-join motion information candidate in the L1 direction, so a merge candidate number is not required. . In this case, only 2 bits representing the L0-direction bi-join motion information candidate are required, and the coding efficiency is improved.
また、図31の例では、L0方向或いはL1方向の片方向に動き情報が無い結合動き情報候補の場合も、双結合動き情報候補の1つとして、候補の動き情報の同一判定を行い、重複する結合動き情報候補を削除して、動き情報の無い結合動き情報候補を双結合動き情報候補リストに残すようにした。双結合動き情報候補としては、L0方向及びL1方向の2つにそれぞれ動き情報を備える方が、動き補償予測の予測精度を相対的に高めることが出来るので、L0方向或いはL1方向に動き情報を備える結合動き情報の候補を双結合動き情報候補リストの上位に設定する方が望ましい。以上のことから、動き情報が無い結合動き情報候補が存在する場合は、その結合動き情報候補を双結合動き情報候補リストに登録せず、双結合動き情報候補リストの最後に“動き情報を使用しない”ことを意味する状態を指定するマージ候補番号を設定してもよい。図32(a)、(b)は図31(a)、(b)に対して適用した例を示す。この処理を適用することで、L0及びL1の両方向の動き情報を使用することを優先して、動き補償予測の精度を高め、符号化効率を改善させることが出来る。 In the example of FIG. 31, even in the case of a combined motion information candidate having no motion information in one direction of the L0 direction or the L1 direction, the same determination of the candidate motion information is performed as one of the dual coupled motion information candidates, and duplication is performed. The combined motion information candidate to be deleted is deleted, and the combined motion information candidate having no motion information is left in the dual-coupled motion information candidate list. As bi-coupled motion information candidates, it is possible to relatively improve the prediction accuracy of motion compensated prediction when motion information is provided in each of the L0 direction and the L1 direction, so that motion information is stored in the L0 direction or the L1 direction. It is desirable to set the combined motion information candidate provided at the top of the dual combined motion information candidate list. From the above, if there is a combined motion information candidate with no motion information, the combined motion information candidate is not registered in the bi-coupled motion information candidate list, and “motion information is used at the end of the bi-coupled motion information candidate list. A merge candidate number for designating a state meaning “no” may be set. FIGS. 32A and 32B show examples applied to FIGS. 31A and 31B. By applying this processing, priority is given to using motion information in both directions of L0 and L1, so that the accuracy of motion compensation prediction can be improved and coding efficiency can be improved.
以上のように、実施の形態1の動画像符号化装置100では、単結合動き情報候補の動き情報には存在しない新たな組合せの双結合動き情報候補の動き情報を提供する。生成される双結合動き情報候補の動き情報が単結合動き情報候補の動き情報と重複しないように、単結合動き情報候補の動き情報と同一と判定された双結合動き情報候補を削除することで、双結合動き情報候補の個数を削減する。これにより、双結合動き情報候補を指定するマージ候補番号の符号量を抑制することで、符号化効率を向上させる。
As described above, the moving
しかしながら、動き情報の同一判定により符号化処理の負荷が高くなる。符号化処理の負荷を低減する為に、図18で示される単結合の候補番号管理テーブルの結合動き情報候補のL0方向及びL1方向の動き情報を双結合動き情報候補として、それらを単に組み合わせることで得られる20通りの中から双結合動き情報候補の組合せを生成してもよい。結合動き情報候補生成部140で実施される単結合及び双結合の結合動き情報候補の同一判定を実施しないので、符号化処理の負荷が低減される。この場合、符号化において、図18で示される結合動き情報候補の動き情報が無効であったり、双結合動き情報候補の組合せとして、L0方向、L1方向ともに動き情報が存在しないものは除外され、組合せとして有効なもののみ選択される。但し、L0方向及びL1方向ともに候補数が5つあるので、双結合動き情報候補の組合せを指定するマージインデックスは、最長で4ビットとなり、2つのマージインデックスを合わせると8ビットの符号量が必要となり、符号化効率は低下することになる。
However, the load of encoding processing increases due to the same determination of motion information. In order to reduce the load of the encoding process, the motion information in the L0 direction and the L1 direction of the combined motion information candidate in the single combined candidate number management table shown in FIG. A combination of candidates for the double coupled motion information may be generated from the 20 types obtained in the above. Since the same determination of the combined motion information candidates of the single bond and the double bond performed by the combined motion information
(動画像復号装置200の構成)
次に、実施の形態1の動画像復号装置を説明する。図33に実施の形態1の動画像復号装置200を示す。動画像復号装置200は、動画像符号化装置100により符号化された符号列を復号して再生画像を生成する装置である。
(Configuration of moving picture decoding apparatus 200)
Next, the moving picture decoding apparatus according to the first embodiment will be described. FIG. 33 shows a moving
動画像復号装置200は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像復号装置200は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。尚、復号対象の予測ブロックの位置情報、予測ブロックサイズに関しては動画像復号装置200内で共有していることとし、図示しない。また、候補番号管理テーブル、及び結合動き情報候補リストに含まれる結合動き情報候補の最大数は動画像復号装置200内で共有していることとし、図示しない。
The moving
実施の形態1の動画像復号装置200は、符号列解析部201、予測誤差復号部202、加算部203、動き情報再生部204、動き補償部205、フレームメモリ206及び動き情報メモリ207を備える。
The moving
(動画像復号装置200の機能)
以下、各部の機能について説明する。符号列解析部201は、端子30より供給された符号列を復号して予測誤差符号化データ、マージフラグ、マージタイプ、マージ候補番号、動き補償予測の予測方向、参照画像インデックス、差分ベクトル、及び予測ベクトルインデックスをシンタックスに従って復号する。そして、当該予測誤差符号化データを予測誤差復号部202に、当該マージフラグ、当該マージタイプ、当該マージ候補番号、当該動き補償予測の予測方向、当該参照画像インデックス、当該差分ベクトル、及び当該予測ベクトルインデックスを動き情報再生部204に供給する。尚、マージ候補番号はマージインデックスより変換されて得られる。
(Function of moving picture decoding apparatus 200)
Hereinafter, functions of each unit will be described. The code
予測誤差復号部202は、符号列解析部201より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部203に供給する。
The prediction
加算部203は、予測誤差復号部202より供給される予測誤差信号と、動き補償部205より供給される予測信号とを加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ206及び端子31に供給する。
The
動き情報再生部204は、符号列解析部201より供給されるマージフラグ、マージタイプ、マージ候補番号、動き補償予測の予測方向、参照画像インデックス、差分ベクトル、及び予測ベクトルインデックスと、動き情報メモリ207より供給される候補ブロック群から、動き情報を再生し、当該動き情報を動き補償部205に供給する。動き情報再生部204の詳細な構成については後述する。
The motion
動き補償部205は、動き情報再生部204より供給される動き情報に基づいて、フレームメモリ206内の参照画像インデックスが示す参照画像を、動きベクトルに基づき動き補償して予測信号を生成する。予測方向が双方向であれば、L0方向とL1方向の予測信号を平均したものを予測信号として生成し、当該予測信号を加算部203に供給する。
Based on the motion information supplied from the motion
フレームメモリ206及び動き情報メモリ207は、動画像符号化装置100のフレームメモリ110及び動き情報メモリ111と同一の機能を有する。
The
(動き情報再生部204の詳細な構成)
続いて、動き情報再生部204の詳細な構成について図34を用いて説明する。図34は動き情報再生部204の構成を示す。動き情報再生部204は、符号化モード判定部210、動きベクトル再生部211及び結合動き情報再生部212を含む。端子32は符号列解析部201に、端子33は動き情報メモリ207に、端子34は動き補償部205にそれぞれ接続されている。
(Detailed configuration of the motion information playback unit 204)
Next, a detailed configuration of the motion
以下、各部の機能について説明する。符号化モード判定部210は、符号列解析部201より供給されるマージフラグが「0」であれば、符号列解析部201より供給される動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスを動きベクトル再生部211に供給する。マージフラグが「1」であれば、符号列解析部201より供給されるマージ候補番号を結合動き情報再生部212に供給する。
Hereinafter, functions of each unit will be described. If the merge flag supplied from the code
動きベクトル再生部211は、符号化モード判定部210より供給される動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスと、端子33より供給される候補ブロック群から、動き情報を再生して端子34に供給する。動きベクトル再生部211の詳細な構成については後述する。
The motion
結合動き情報再生部212は、符号化モード判定部210より供給されるマージ候補番号と、端子33より供給される候補ブロック群から、動き情報を再生して端子34に供給する。結合動き情報再生部212の詳細な構成については後述する。
The combined motion
(動きベクトル再生部211の詳細な構成)
続いて、動きベクトル再生部211の詳細な構成について図35を用いて説明する。図35は動きベクトル再生部211の構成を示す。動きベクトル再生部211は、予測ベクトル候補リスト生成部220、予測ベクトル決定部221及び加算部222を含む。端子35は符号化モード判定部210に接続されている。
(Detailed Configuration of Motion Vector Reproducing Unit 211)
Next, a detailed configuration of the motion
以下、各部の機能について説明する。予測ベクトル候補リスト生成部220は、動画像符号化装置100の予測ベクトル候補リスト生成部130と同一の機能を有する。予測ベクトル決定部221は、予測ベクトル候補リスト生成部220より供給される予測ベクトル候補リスト及び端子35より供給される予測ベクトルインデックスから、予測ベクトルを決定して加算部222に供給する。
Hereinafter, functions of each unit will be described. The prediction vector candidate
加算部222は、端子35より供給される差分ベクトルと、予測ベクトル決定部221より供給される予測ベクトルとを加算して動きベクトルを算出し、当該動きベクトルを端子34に供給する。
The
(結合動き情報再生部212の詳細な構成)
続いて、結合動き情報再生部212の詳細な構成について図36を用いて説明する。図36は結合動き情報再生部212の構成を示す。結合動き情報再生部212は、結合動き情報候補生成部230及び結合動き情報選択部231を含む。
(Detailed Configuration of Combined Motion Information Reproducing Unit 212)
Next, a detailed configuration of the combined motion
以下、各部の機能について説明する。結合動き情報候補生成部230は図15に示す結合動き情報候補生成部140と同一の機能を有する。結合動き情報選択部231は、結合動き情報候補生成部230より供給される結合動き情報候補リスト及び端子35より供給されるマージ候補番号に基づいて、結合動き情報候補リストの中から動き情報を選択し、当該動き情報を端子34に供給する。
Hereinafter, functions of each unit will be described. The combined motion information
(動画像復号装置200の動作)
続いて、図37のフローチャートを用いて、実施の形態1の動画像復号装置200における復号の動作を説明する。符号列解析部201は、端子30より供給される符号列を復号して予測誤差符号化データ、マージフラグ、マージタイプ、マージ候補番号、動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスをシンタックスに従って復号する(S210)。
(Operation of the video decoding device 200)
Subsequently, a decoding operation in the moving
動き情報再生部204は、符号列解析部201より供給されるマージフラグ、マージタイプ、マージ候補番号、動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックスと、動き情報メモリ207より供給される候補ブロック群から、動き情報を再生する(S211)。
The motion
動き補償部205は、動き情報再生部204より供給される動き情報に基づいて、フレームメモリ206内の参照画像インデックスが示す参照画像を、動きベクトルに基づき動き補償して予測信号を生成する。予測方向が双方向であれば、L0方向とL1方向の予測信号を平均したものを予測信号として生成する(S212)。
Based on the motion information supplied from the motion
予測誤差復号部202は、符号列解析部201より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成する(S213)。加算部203は、予測誤差復号部202より供給される予測誤差信号と、動き補償部205より供給される予測信号とを加算して復号画像信号を生成する(S214)。
The prediction
フレームメモリ206は、加算部203より供給される復号画像信号を記憶する(S215)。動き情報メモリ207は、動き情報再生部204より供給される動きベクトルを最小の予測ブロックサイズ単位で1画像分記憶する(S216)。
The
引き続いて、図38のフローチャートを用いて、動き情報再生部204の動作を説明する。符号化モード判定部210は、符号列解析部201より供給されるマージフラグが「0」であるか「1」であるか判定する(S220)。マージフラグが「1」であれば、結合動き情報再生部212は、符号化モード判定部210より供給されるマージタイプ、マージ候補番号及び端子33より供給される候補ブロック群から、動き情報を再生する(S221)。
Subsequently, the operation of the motion
マージフラグが「0」であれば、動きベクトル再生部211は、符号化モード判定部210より供給される動き補償予測の予測方向、参照画像インデックス、差分ベクトル及び予測ベクトルインデックス、並びに端子33より供給される候補ブロック群から、動き情報を再生する(S222)。
If the merge flag is “0”, the motion
引き続いて、図39のフローチャートを用いて、動きベクトル再生部211の動作を説明する。予測ベクトル候補リスト生成部220は、動画像符号化装置100の予測ベクトル候補リスト生成部130と同一の動作によって予測ベクトル候補リストを生成する(S300)。
Subsequently, the operation of the motion
予測ベクトル決定部221は、予測ベクトル候補リスト生成部220より供給される予測ベクトル候補リストの中から、端子35より供給される予測ベクトルインデックスで示される予測ベクトル候補を選択して、予測ベクトルを決定する(S301)。加算部222は、端子35より供給される差分ベクトルと、予測ベクトル決定部221より供給される予測ベクトルとを加算して動きベクトルを算出する(S302)。
The prediction
引き続いて、図40のフローチャートを用いて、結合動き情報再生部212の動作を説明する。結合動き情報候補生成部230は、動画像符号化装置100の結合動き情報候補生成部140と同一の動作によって結合動き情報候補リストを生成する(S310)。結合動き情報選択部231は、結合動き情報候補生成部230より供給される結合動き情報候補リストの中から、端子35より供給されるマージ候補番号で示される結合動き情報候補を選択して、結合動き情報を決定する(S311)。
Subsequently, the operation of the combined motion
(実施の形態1の変形例)
尚、実施の形態1は以下のように変形できる。
(Modification of Embodiment 1)
The first embodiment can be modified as follows.
(変形例1:同一方向の利用)
上述の実施の形態1では、参照する隣接ブロック候補でL0方向或いはL1方向に動き情報を備えているブロック候補を、双結合動き情報候補のL0方向或いはL1方向の動き情報となる例を挙げた。双方向予測の場合、動き情報の選択として、図6(d)の一例で示されるように、同一方向から2つの動き情報を参照して動き補償予測の精度を高めることも可能であり、本実施の形態においても適用することが可能である。
(Modification 1: Use in the same direction)
In the first embodiment described above, an example in which a block candidate having motion information in the L0 direction or the L1 direction in the adjacent block candidate to be referred to becomes the motion information in the L0 direction or the L1 direction of the bi-join motion information candidate is given. . In the case of bi-directional prediction, as shown in the example of FIG. 6 (d), it is possible to improve the accuracy of motion compensated prediction by referring to two pieces of motion information from the same direction as the selection of motion information. The present invention can also be applied to the embodiment.
これは、図41(a)のように単結合動き情報候補リストに含まれる結合動き情報候補に同一の予測方向の動き情報のみ存在する場合に、双結合動き情報候補の生成確率を高め、結合動き情報候補の選択率を高めることで動き情報の符号化効率を向上させることが出来る。この場合、双結合動き情報候補決定部161では、本来L0方向とL1方向のそれぞれのマージ候補番号を供給するところを、双結合動き情報候補の予測が片方向(L0方向或いはL1方向)のみの場合に、L0方向のみの動き情報を備える結合動き情報候補をL1方向の有効な双結合動き情報候補として選択しても符号化及び復号で処理が破綻しないように、符号化側と復号側で合わせておく必要がある。
As shown in FIG. 41 (a), when only the motion information in the same prediction direction exists in the combined motion information candidates included in the single combined motion information candidate list, the generation probability of the dual combined motion information candidates is increased. By increasing the selection rate of motion information candidates, the efficiency of motion information encoding can be improved. In this case, the bi-coupled motion information
図41(a)の単結合動き情報候補リストから生成される双結合動き情報候補の組合せを図41(b)に示す。L0方向及びL1方向ともにBを選択する(0,0)の場合、或いはL0方向及びL1方向ともにCOLを選択する(1,1)の場合は、単結合動き情報候補リストのB或いはCOLと同一であるので、単結合動き情報候補リストのB或いはCOLを優先し、この組合せは使用しない。単結合動き情報候補リストに存在しない有効な組合せとなる双結合動き情報候補は(0,1)或いは(1,0)となる。これらの組合せを表すL0及びL1方向のマージ候補番号を、単結合動き情報候補リストのマージ候補番号とともに結合動き情報選択部141に供給する。以上のようにして、L0方向とL1方向とで異なる隣接ブロックの動き情報の参照可能となる。
FIG. 41 (b) shows a combination of double coupled motion information candidates generated from the single coupled motion information candidate list of FIG. 41 (a). When B is selected in both the L0 direction and the L1 direction (0, 0), or when COL is selected in both the L0 direction and the L1 direction (1, 1), the same as B or COL in the single combined motion information candidate list Therefore, priority is given to B or COL of the single combined motion information candidate list, and this combination is not used. A double-coupled motion information candidate that is an effective combination that does not exist in the single-coupled motion information candidate list is (0, 1) or (1, 0). The merge candidate numbers in the L0 and L1 directions representing these combinations are supplied to the combined motion
(変形例2:マージ候補番号の上位優先)
上述の実施の形態1では、双結合動き情報候補を、L0方向とL1方向において有効である結合動き情報候補ブロックを組み合わせて、L0方向とL1方向の動き情報を利用する新たな動き情報を備える双結合動き情報候補を生成した。L0方向とL1方向とで有効な結合動き情報候補ブロックの動き情報を組み合わせて、単結合動き情報候補の動き情報には存在しない新たな動き情報の組合せとして双結合動き情報候補を生成し、従来よりも動き補償予測の精度を上げ、動き情報の符号化効率を向上させることが出来るが、処理量が増加する。
(Modification 2: Higher priority of merge candidate numbers)
In the above-described first embodiment, the combined motion information candidate is combined with the combined motion information candidate block effective in the L0 direction and the L1 direction, and new motion information using the motion information in the L0 direction and the L1 direction is provided. A candidate for double coupled motion information is generated. By combining the motion information of the combined motion information candidate blocks effective in the L0 direction and the L1 direction, a double coupled motion information candidate is generated as a combination of new motion information that does not exist in the motion information of the single coupled motion information candidate. In addition, the accuracy of motion compensation prediction can be improved and the coding efficiency of motion information can be improved, but the processing amount increases.
そこで、本変形例では、双結合動き情報候補の生成される数を制限することで、処理量の増加を抑制する。具体的には、双結合動き情報候補リスト削減部153にて、重複する動き情報を備える結合動き情報候補を削除して更新された双結合動き情報候補リストに対して、マージ候補番号の小さい方の双結合動き情報候補から優先して選択する。
Therefore, in this modification, an increase in the amount of processing is suppressed by limiting the number of generated dual coupled motion information candidates. Specifically, in the double-coupled motion information candidate
図42(a)、(b)は、図28(b)〜、(e)で示される双結合動き情報候補リストの一例から、重複する動き情報を備える結合動き情報候補を削除して更新された双結合動き情報候補リストであり、それぞれ図42(a)がL0方向、図42(b)がL1方向の双結合動き情報候補リストを示す。ここでは、L0方向、L1方向ともに小さいマージ候補番号から2つ選択することとする。 42 (a) and 42 (b) are updated by deleting the combined motion information candidates including the overlapping motion information from the example of the dual combined motion information candidate list shown in FIGS. 28 (b) to 28 (e). FIG. 42A shows the bi-join motion information candidate list, and FIG. 42B shows the bi-join motion information candidate list in the L1 direction. Here, two merge candidate numbers are selected from the smaller L0 and L1 directions.
その為、図42(a)、(b)のハッチングが入った行で示される結合動き情報候補(L0方向ではC、L1方向ではE)が双結合動き情報候補リストから削除される。図42(a)、(b)に基づいて、双結合動き情報候補組合せリスト生成部154は、双結合動き情報候補リストのL0方向及びL1方向の結合動き情報候補を組み合わせて、図42(c)に示される双結合動き情報候補組合せリストを生成する。
Therefore, the combined motion information candidates (C in the L0 direction and E in the L1 direction) indicated by the hatched rows in FIGS. 42A and 42B are deleted from the double combined motion information candidate list. 42 (a) and 42 (b), the double coupled motion information candidate combination
図42(a)、(b)の例では、L0方向、L1方向ともに2つの結合動き情報候補に制限したので、4つの双結合動き情報候補が生成される。図42(c)の組み合わせから、(0,1)のみが単結合動き情報候補リストに存在しない双結合動き情報候補となり、この組合せを表すL0及びL1方向のマージ候補番号を、単結合動き情報候補リストのマージ候補番号とともに結合動き情報選択部141に供給する。
In the example of FIGS. 42A and 42B, since the number of combined motion information candidates is limited to two in both the L0 direction and the L1 direction, four dual combined motion information candidates are generated. From the combination of FIG. 42 (c), only (0, 1) is a double-coupled motion information candidate that does not exist in the single-coupled motion information candidate list, and merge candidate numbers in the L0 and L1 directions representing this combination are designated as single-coupled motion information. The data is supplied to the combined motion
以上のようにして、L0方向及びL1方向の双結合動き情報候補リストのマージ候補番号の小さい方から優先的に選択することで、双結合動き情報候補組合せリスト生成部154での組合せ判定処理を削減することが出来る。尚、この変形例ではL0方向、L1方向ともに2つの結合動き情報候補を優先して選択するようにしたが、L0方向、L1方向で異なる値としてもよい。更に、符号化と復号側で処理が矛盾しないように、符号化と復号で優先して選択する結合動き情報候補の個数を合わせるように、暗黙的に定義してもよい。
As described above, the combination determination process in the bi-coupled motion information candidate combination
また、符号化ストリーム単位または符号化ストリームの一部であるスライス毎に、符号化と復号で優先して選択する結合動き情報候補の個数を定義する機能を有するシンタックスを定義しても良い。符号列生成部104は、結合動き情報候補の個数を図43(a)及び(b)のように、符号化ストリーム中に符号化して伝送する。図43(a)及び(b)では、符号化ストリーム単位での制御のためのSPS(Sequence Parameter Set)、及びスライス単位での制御のためのSlice_headerで優先して選択する結合動き情報候補の個数を符号化するシンタックスの例を示している。“limited_merge_index_lX_flag”(Xは0或いは1)でLX方向の双結合動き情報候補リストで選択する結合動き情報候補の数を制限するか否かを指定し、“max_no_of_merge_index_lX_minus1”(Xは0或いは1)で選択する個数を指定する。
In addition, a syntax having a function of defining the number of combined motion information candidates to be preferentially selected in encoding and decoding may be defined for each slice that is a unit of the encoded stream or a part of the encoded stream. The code
本変形例による動画像符号化装置と動画像復号装置でストリーム単位またはスライス単位で双結合動き情報候補リストの結合動き情報候補の個数を制限することで、ストリーム単位やスライス単位で動きの特性が変化するような場合に、マージインデックスの符号化効率を一定にさせることが出来る。 By restricting the number of combined motion information candidates in the double-coupled motion information candidate list in units of streams or units of slices in the video encoding device and video decoding device according to this modification, motion characteristics can be improved in units of streams or slices. In such a case, the coding efficiency of the merge index can be made constant.
(変形例3:予め定められた組み合わせ)
上述の実施の形態1では、双結合動き情報候補を、L0方向とL1方向において有効である結合動き情報候補ブロックを組み合わせて、L0方向とL1方向の動き情報を利用する新たな動き情報を備える双結合動き情報候補を生成した。L0方向とL1方向に検索することで、単結合動き情報候補の動き情報には存在しない新たな動き情報の組合せとして双結合動き情報候補を生成し、従来よりも動き補償予測の精度を上げ、動き情報の符号化効率を向上させることが出来るが、処理量が増加する。
(Modification 3: Predetermined combination)
In the above-described first embodiment, the combined motion information candidate is combined with the combined motion information candidate block effective in the L0 direction and the L1 direction, and new motion information using the motion information in the L0 direction and the L1 direction is provided. A candidate for double coupled motion information is generated. By searching in the L0 direction and the L1 direction, a double-coupled motion information candidate is generated as a combination of new motion information that does not exist in the motion information of the single-coupled motion information candidate, and the accuracy of motion compensation prediction is improved compared to the conventional method. The encoding efficiency of motion information can be improved, but the processing amount increases.
そこで、図44に示されるように、双結合動き情報候補を予め定められたより信頼度の高い結合動き情報候補ブロックの組み合わせとして定義しておくことで、検索処理を省き、双結合動き情報候補の選択率を向上させて、符号化効率を向上させることが出来る。 Therefore, as shown in FIG. 44, by defining the double-coupled motion information candidate as a combination of predetermined combined motion information candidate blocks having higher reliability, the search process is omitted, and the double-coupled motion information candidate is selected. The selectivity can be improved and the encoding efficiency can be improved.
図44は、マージ参照候補として、最も信頼度の高い候補ブロックAと2番目に信頼度の高い候補ブロックBのL0及びL1方向の動き情報を組み合わせて、双結合動き情報候補として定義した例である。ここでは、(0,1)と(1,0)の組合せが双結合動き情報候補として定義される。尚、信頼度が相対的に高い候補ブロックの組み合わせであれば、これ以外の組み合わせでもよい。更に、符号化と復号側で処理が矛盾しないように、符号化と復号で優先して選択する結合動き情報候補を合わせるように、暗黙的に定義してもよい。 FIG. 44 shows an example in which motion information in the L0 and L1 directions of the candidate block A with the highest reliability and the candidate block B with the second highest reliability is combined as a merge reference candidate and defined as a dual coupled motion information candidate. is there. Here, a combination of (0, 1) and (1, 0) is defined as a double coupled motion information candidate. Note that other combinations may be used as long as the combinations of candidate blocks have relatively high reliability. Furthermore, it may be implicitly defined so that combined motion information candidates that are preferentially selected in encoding and decoding are matched so that processing does not contradict between the encoding and decoding sides.
また、符号化ストリーム単位または符号化ストリームの一部であるスライス毎に、候補番号管理テーブルを変更する機能を有するシンタックスを定義しても良い。符号列生成部104は、候補番号管理テーブルを図44(a)及び(b)のように、符号化ストリーム中に符号化して伝送する。図44(a)及び(b)では、符号化ストリーム単位での制御のためのSPS(Sequence Parameter Set)、及びスライス単位での制御のためのSlice_headerで候補番号管理テーブルを符号化するシンタックスの例を示している。”prior_merge_index_flag”で双結合動き情報候補リストで予め決められた結合動き情報候補を優先するか否かを指定する。
Also, a syntax having a function of changing the candidate number management table may be defined for each slice that is a coded stream unit or a part of the coded stream. The code
本変形例による動画像符号化装置と動画像復号装置でストリーム単位またはスライス単位で双結合動き情報候補リストの結合動き情報候補を優先することで、ストリーム単位やスライス単位で動きの特性が変化するような場合に、マージインデックスの符号化効率を一定にさせることが出来る。 By giving priority to the combined motion information candidates in the bi-join motion information candidate list in units of streams or units of slices in the video encoding device and video decoding device according to this modification, the motion characteristics change in units of streams or slices. In such a case, the encoding efficiency of the merge index can be made constant.
(実施の形態1の効果)
(双方向予測の双結合動き情報の効果例)
実施の形態1による効果について図46(a)、(b)を用いて説明する。以下の説明では、ブロックNのL0方向の動きベクトルをmvL0N、L1方向の動きベクトルをmvL1N、L0方向の参照画像インデックスをrefIdxL0N、L1方向の参照画像インデックスをrefIdxL1N、L0方向の差分ベクトルをdmvL0N、L1方向の差分ベクトルをdmvL1N、L0方向の参照画像インデックスの差分をdrefIdxL0N、及びL1方向の参照画像インデックスをdrefIdxL1Nと表す。尚、図45中の各結合動き情報候補の動き情報は、上述した記号に合わせて、(mvLXNx,mvLXNy)/refIdxLXNで表される。“/”の前の括弧は、ブロックNのLX方向(Xは0或いは1)の動きベクトルを表し、括弧内のmvLXNxは水平方向の動きベクトル成分、mvLXNyは垂直方向の動きベクトル成分を表す。“/”の後のrefIdxLXNはブロックNのLX方向(Xは0或いは1)の参照画像インデックスを表すものとする。
(Effect of Embodiment 1)
(Effects of bi-joint motion information in bidirectional prediction)
The effect by
処理対象ブロック(Z)にとって予測誤差が最小となる動き情報は、予測方向が双方向(BI)で、mvL0Z=(2,8)、mvL1Z=(4,2)、refIdxL0Z=0、refIdxL1N=0であるとする。 The motion information with the smallest prediction error for the processing target block (Z) is that the prediction direction is bidirectional (BI), mvL0Z = (2,8), mvL1Z = (4,2), refIdxL0Z = 0, refIdxL1N = 0 Suppose that
この時、単結合動き情報候補が図46(a)で示される単結合動き情報候補リストに記載されたA、B、COL、C、Eであるとする。これら単結合動き情報候補の中には処理対象ブロック(Z)にとって予測誤差が最小となる動き情報と同一の動き情報は存在しない。従って、これら単結合動き情報候補の中からレート歪み評価値が最小となる単結合動き情報候補を選択することになる。そして、その候補のレート歪み評価値と、差分ベクトル算出部120で算出されたレート歪み評価値とを比較して、前者が後者より小さくなる場合のみ符号化モードとしてマージモードが利用されることになる。
At this time, it is assumed that the single combined motion information candidates are A, B, COL, C, and E described in the single combined motion information candidate list shown in FIG. Among these single combined motion information candidates, there is no motion information identical to the motion information that minimizes the prediction error for the processing target block (Z). Therefore, a single combined motion information candidate having a minimum rate distortion evaluation value is selected from these single combined motion information candidates. Then, the candidate rate distortion evaluation value and the rate distortion evaluation value calculated by the difference
符号化モードとしてマージモードが選択された場合、それは動き情報の符号化効率と予測誤差のバランスが最適な為であって、予測誤差は最適とはならない。一方、符号化モードとして非マージモードが選択された場合には、動き情報の符号化効率は最適とはならない。 When the merge mode is selected as the encoding mode, it is because the balance between the encoding efficiency of motion information and the prediction error is optimal, and the prediction error is not optimal. On the other hand, when the non-merge mode is selected as the encoding mode, the encoding efficiency of motion information is not optimal.
ここで、実施の形態1によって生成された双結合動き情報候補は、図46(b)で示される組合せとなる。図46(a)の単結合動き情報候補リストの中で有効な結合動き情報候補はL0方向、L1方向ともに3つ存在するが、L1方向では結合動き情報候補AとCとが同一の動き情報である。従って、図46(b)で示されるように、L0方向で3つ、L1方向で2つの結合動き情報候補が選出されて、図46(a)の単結合動き情報候補リストから新たに生成される双結合動き情報候補の組合せは、計6つとなる。ここで、動き情報の組合せの中で、(0,0)、(1,1)及び(2,0)は単結合動き情報候補のA、B及びCと同じであるので使用せず、残りの(0,1)、(1,0)及び(2,1)の3つを双結合動き情報候補とする。この時、双結合動き情報候補の(0,1)の組合せは処理対象ブロック(Z)にとって予測誤差が最小となる動き情報と同じ動き情報を持つことが分かる。つまり、双結合動き情報候補の(0,1)の組合せを選択することで、予測誤差を最小化し、動き情報の符号化効率を最適化することが出来る。
Here, the double-coupled motion information candidates generated according to
(単方向予測の双結合動き情報の効果例)
また、実施の形態1による単方向予測の効果について図47(a)、(b)を用いて説明する。処理対象ブロック(Z)にとって予測誤差が最小となる動き情報は、予測方向が単方向(UNI)で、mvL0Z=(0,8)、refIdxL0Z=2であるとする。
(Effects of bi-joint motion information for unidirectional prediction)
The effect of unidirectional prediction according to
単結合動き情報候補のB、C、COLが無効(×)であるとし、有効な単結合動き情報候補のA、Eは図47(a)の単結合動き情報候補リストで示される動き情報を持つこととする。この場合も単結合動き情報候補の中には、処理対象ブロック(Z)にとって予測誤差が最小となる動き情報は存在しない。 It is assumed that B, C, and COL of the single combined motion information candidates are invalid (x), and valid single combined motion information candidates A and E indicate the motion information indicated by the single combined motion information candidate list in FIG. I will have it. Also in this case, there is no motion information in the single combined motion information candidate that minimizes the prediction error for the processing target block (Z).
ここでも、実施の形態1によって生成された双方向結合動き情報候補は、図47(b)で示される組合せとなる。図47(a)の単方向結合動き情報候補リストから新たに生成される双結合動き情報候補の組合せは、単結合動き情報候補リストの中で有効な結合動き情報候補はL0方向では2つ、L1方向では実際は1つであるが2つとする。すなわち、EはL0方向の動き情報のみでL1方向の動き情報を持たないが、動き情報が存在しないことも1つの動き情報として捉え、EのL1方向にも動き情報があることとする。従って、L1方向でも2つの結合動き情報候補が選出されて、図47(a)の単結合動き情報候補リストから新たに生成される双結合動き情報候補の組合せは、計4つとなる。 Again, the bidirectional combined motion information candidates generated by the first embodiment are the combinations shown in FIG. 47 (b). The combination of bi-coupled motion information candidates newly generated from the unidirectional combined motion information candidate list in FIG. 47A is two effective combined motion information candidates in the L0 direction in the single-coupled motion information candidate list. In the L1 direction, there is actually one, but two. That is, E has only the motion information in the L0 direction and does not have the motion information in the L1 direction. However, the fact that there is no motion information is regarded as one motion information, and there is motion information in the L1 direction of E. Accordingly, two combined motion information candidates are selected also in the L1 direction, and a total of four combinations of the dual combined motion information candidates are newly generated from the single combined motion information candidate list in FIG. 47A.
ここで、動き情報の組合せの中で、(0,0)及び(1,1)は単結合動き情報候補のA及びEと同じであるので使用せず、残りの(0,1)及び(1,0)の2つを双結合動き情報候補とする。この時、双結合動き情報候補の(0,1)の組合せは、処理対象ブロック(Z)にとって予測誤差が最小となる動き情報と同じ動き情報を持つことがわかる。つまり、双結合動き情報候補の(0,1)の組合せを選択することで、予測誤差を最小化し、動き情報の符号化効率を最適化することが出来る。 Here, among the combinations of motion information, (0, 0) and (1, 1) are the same as the single combined motion information candidates A and E, so they are not used, and the remaining (0, 1) and ( 1,0) are the double-coupled motion information candidates. At this time, it can be seen that the combination (0, 1) of the dual coupled motion information candidates has the same motion information as the motion information that minimizes the prediction error for the processing target block (Z). That is, by selecting the (0, 1) combination of bi-coupled motion information candidates, the prediction error can be minimized and the coding efficiency of motion information can be optimized.
(単方向予測の組み合わせによる双結合動き情報の効果例)
また、実施の形態1による予測方向が単方向の動き情報の組み合わせによる効果について図48(a)、(b)を用いて説明する。処理対象ブロック(Z)にとって予測誤差が最小となる動き情報は、予測方向が単方向(BI)で、mvL0Z=(2,2)、refIdxL0Z=0、mvL1Z=(―2,2)、refIdxL1Z=0であるとする。
(Example of effect of bi-joint motion information by combination of unidirectional prediction)
Moreover, the effect by the combination of motion information in which the prediction direction according to
単結合動き情報候補のA、COL、Cが無効(×)であるとし、有効な単結合動き情報候補のB、Eは図47(a)の単結合動き情報候補リストで示される動き情報を持つこととする。この場合も単結合動き情報候補の中には処理対象ブロック(Z)にとって予測誤差が最小となる動き情報は存在しない。 Assume that single-bond motion information candidates A, COL, and C are invalid (x), and valid single-link motion information candidates B and E are motion information indicated by the single-link motion information candidate list in FIG. I will have it. Also in this case, there is no motion information that has the smallest prediction error for the processing target block (Z) in the single combined motion information candidates.
ここでも、実施の形態1によって生成された双結合動き情報候補は、図48(b)で示される組合せとなる。図48(a)の単結合動き情報候補リストの中で有効な結合動き情報候補は、一方の予測方向の動き情報が存在しない場合も有効として、L0方向で2つ、L1方向で2つの結合動き情報候補を選出する。従って、図48(a)の単結合動き情報候補リストから新たに生成される双結合動き情報候補の組合せは、計4つとなる。 Again, the double coupled motion information candidates generated by the first embodiment are the combinations shown in FIG. The effective combined motion information candidates in the single combined motion information candidate list in FIG. 48A are effective even when there is no motion information in one prediction direction, and two combined in the L0 direction and two combined in the L1 direction. Select motion information candidates. Therefore, there are a total of four combinations of double-coupled motion information candidates newly generated from the single-coupled motion information candidate list in FIG.
ここで、動き情報の組合せの中で、(0,0)及び(1,1)は単結合動き情報候補のA及びEと同じであるので使用しない。また、(1,0)はL0方向、L1方向ともに動き情報が存在しない場合であるので、これも使用しない。残りの(0,1)の1つを双結合動き情報候補とする。この時、双結合動き情報候補の(0,1)の組合せは処理対象ブロック(Z)にとって予測誤差が最小となる動き情報と同じ動き情報を持つことが分かる。つまり、双結合動き情報候補の(0,1)の組合せを選択することで、予測誤差を最小化し、動き情報の符号化効率を最適化することが出来る。 Here, in the combination of motion information, (0, 0) and (1, 1) are not used because they are the same as the single combined motion information candidates A and E. Further, (1, 0) is a case where there is no motion information in both the L0 direction and the L1 direction, so this is also not used. One of the remaining (0, 1) is set as a double coupled motion information candidate. At this time, it can be seen that the combination (0, 1) of the dual coupled motion information candidates has the same motion information as the motion information that minimizes the prediction error for the processing target block (Z). That is, by selecting the (0, 1) combination of bi-coupled motion information candidates, the prediction error can be minimized and the coding efficiency of motion information can be optimized.
(双結合動き情報)
以上のように、単結合動き情報候補のL0方向とL1方向の動き情報を利用して、新たな組合せの双結合動き情報候補を生成することで、処理対象ブロックの動きが、符号化済みの別の画像の同一位置ブロックや当該処理対象ブロックの隣接ブロックの動きとずれがある場合でも、動き情報を符号化することなくインデックスのみで符号化することが出来る。従って、符号化効率と予測効率を最適化出来る動画像符号化装置及び動画像復号装置を実現出来る。
(Bi-bond motion information)
As described above, by using the motion information in the L0 direction and the L1 direction of the single combined motion information candidate to generate a new combination of dual combined motion information candidates, the motion of the processing target block is encoded. Even when there is a deviation from the motion of the same position block of another image or the adjacent block of the processing target block, the motion information can be encoded using only the index without encoding. Therefore, it is possible to realize a moving image encoding device and a moving image decoding device that can optimize encoding efficiency and prediction efficiency.
(単結合動き情報)
また、単結合動き情報候補のL0方向とL1方向の動き情報を利用して新たな単方向の結合動き情報候補を生成する場合についても、単結合動き情報候補のL0方向とL1方向の動き情報を利用して双結合動き情報候補を生成する場合と、同様の効果を奏する。
(Single bond motion information)
Also, when generating new single-direction combined motion information candidates using the single-link motion information candidate L0-direction and L1-direction motion information, the single-link motion information candidate L0-direction and L1-direction motion information is also generated. The same effect is produced as in the case of generating a double-coupled motion information candidate using.
(同一方向の利用による双結合動き情報)
また、単結合動き情報候補の同一の予測方向の動き情報を利用して双結合動き情報候補を生成する場合についても、単結合動き情報候補のL0方向とL1方向の動き情報を利用して双結合動き情報候補を生成する場合と、同様の効果を奏する。
(Bi-coupled motion information using the same direction)
Also, in the case of generating a double coupled motion information candidate using motion information in the same prediction direction of the single coupled motion information candidate, the dual coupled motion information candidate using the motion information in the L0 direction and the L1 direction is also used. The same effect is produced as when the combined motion information candidate is generated.
(動画像復号処理の簡易化)
以上のように、単結合動き情報候補の各方向の動き情報を利用して双結合動き情報候補を生成することで、処理対象ブロックの動きが、符号化済みの別の画像の同一位置ブロックや当該処理対象ブロックの隣接ブロックの動きとずれがある場合でも、予測方向、参照インデックス及び差分ベクトルの復号、予測ベクトルと差分ベクトルとの加算処理などが不要となり、動画像復号装置の処理を削減することが出来る。
(Simplified video decoding process)
As described above, by generating motion information candidates for each direction using motion information in each direction of the motion information candidate for single connection, the motion of the block to be processed is the same position block in another encoded image, Even when there is a deviation from the motion of the adjacent block of the processing target block, the decoding of the prediction direction, the reference index and the difference vector, the addition processing of the prediction vector and the difference vector, etc. are unnecessary, and the processing of the video decoding device is reduced. I can do it.
(選択率順のマージ候補番号割り当て)
以上のように、選択率が相対的に高い結合動き情報候補ほど小さいマージ候補番号を割り当てておくことで、各方向においてより確からしい動き情報の選択率を高め、各方向において精度の高い動き情報を利用して高精度な双結合動き情報候補を生成することが出来る。また、検索の処理を単純化することが出来、候補数を制限して処理数を削減しても符号化効率の低下を抑制出来る。
(Merge candidate number assignment in order of selectivity)
As described above, by assigning a smaller merge candidate number to a combined motion information candidate that has a relatively high selection rate, the selection rate of motion information that is more reliable in each direction is increased, and highly accurate motion information in each direction. Can be used to generate a high-precision bi-joint motion information candidate. In addition, the search process can be simplified, and even if the number of candidates is reduced and the number of processes is reduced, a decrease in encoding efficiency can be suppressed.
(メモリリードタイム)
以上のように、単結合動き情報候補の各方向の動き情報を利用して、新たな組合せの双結合動き情報候補を生成することで、単結合動き情報候補の数を増加させることなく結合動き情報候補の数を増加させることが出来る。従って、単結合動き情報候補数の増加によってメモリリード時間が長くなるような一般的なLSIを使用している動画像符号化装置及び動画像復号装置において、単結合動き情報候補数の増加によるメモリリード時間の増大を抑制出来る。
(Memory lead time)
As described above, by using the motion information in each direction of the single combined motion information candidates, the combined motion is generated without increasing the number of single combined motion information candidates by generating a new combination of dual combined motion information candidates. The number of information candidates can be increased. Accordingly, in a moving picture encoding apparatus and moving picture decoding apparatus using a general LSI in which the memory read time is increased due to an increase in the number of single combined motion information candidates, a memory due to an increase in the number of single combined motion information candidates Increase in lead time can be suppressed.
[実施の形態2]
(シンタックス)
本発明の実施の形態2における符号化及び復号で定義される予測ブロックのシンタックスの一例について図49を用いて説明する。予測ブロックがイントラであるかインターであるかは上位の符号化ブロックによって指定されており、図49は予測ブロックがインターの場合のシンタックスを示す。実施の形態1との違いは、merge_flagの機能が異なる。実施の形態1のmerge_typeは単マージか双マージかを指定するフラグとして符号化され、ビットストリームに記録される。一方、実施の形態2のmerge_typeは関数MergeType()の返り値が代入される変数に過ぎず、ビットストリームに記録されない。実施の形態2のmerge_typeに返り値を渡す関数MergeType()が“1”の場合は実施の形態1のmerge_typeが“1”と等価であり、単マージを適用する。関数MergeType()が“0”の場合は実施の形態1のmerge_typeが“0”と等価であり、双マージを適用する。関数MergeType()以外は実施の形態1と同様であるので、ここでは関数MergeType()についてのみ説明する。
[Embodiment 2]
(Syntax)
An example of the syntax of a prediction block defined by encoding and decoding in
(動画像符号化装置100の構成)
実施の形態2の動画像符号化装置の構成は、当該動画像符号化装置の動き情報生成部109の機能を除いて実施の形態1の動画像符号化装置100の構成と同一である。以下、実施の形態2における動画像符号化装置の動き情報生成部109の機能について実施の形態1との相違を説明する。
(Configuration of moving picture coding apparatus 100)
The configuration of the moving picture encoding apparatus according to the second embodiment is the same as that of the moving
図50は、実施の形態2における情報候補生成部140の構成を示す。図16の実施の形態1における情報候補生成部140の構成に、新たに結合タイプ判定部155が追加された構成である。結合タイプ判定部155はシンタックスで定義される関数MergeType()の機能を果たしており、図51のフローチャートを用いて説明する。
FIG. 50 shows a configuration of information
結合タイプ判定部155には、単結合動き情報候補リスト削減部151にて重複する動き情報を備える結合動き情報候補が削除された総数sとともに、更新された単結合動き情報候補リストが供給され、取得される(S400)。
The combined
結合タイプ判定部155は、sと閾値THとの比較を実施する(S401)。sがTH未満の場合(S401のY)、双結合動き情報候補リスト生成部152から双結合動き情報候補組合せリスト生成部154までの双結合動き情報候補の組合せ選出を実施し、双結合動き情報候補の組合せリストとともに単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストを端子18に供給する(S402)。sがTH以上の場合(S401のN)は、双結合動き情報候補の組合せ選出を実施せず、単結合動き情報候補リスト削減部151より供給される単結合動き情報候補リストのみを端子18に供給する(S403)。
The combination
ここで、閾値THの設定範囲は1以上で、且つ単結合動き情報候補リスト削減部151にて重複する動き情報を備える結合動き情報候補を削除する前の単結合動き情報候補リストの候補数から1を引いた値とする。単結合動き情報候補リストの候補が全て同一の動き情報を備える場合でも、単結合動き情報候補リストの候補は1つ残ることから、ここでは1以上4(=5−1)の範囲で設定される。sが閾値TH以上となるのは、単結合動き情報候補リスト削減部151にて削除された結合動き情報候補が多い場合である。
Here, the setting range of the threshold TH is 1 or more, and from the number of candidates in the single combined motion information candidate list before deleting the combined motion information candidates including the overlapping motion information in the single combined motion information candidate
この場合、処理対象ブロックに隣接する複数の参照候補ブロックの動き情報の多くが類似していることになるので、それらを組み合わせて新たな双結合動き情報候補を生成しても、単結合動き情報候補と同一或いは類似する候補の発生頻度が高くなり、適切な参照候補が得られない可能性が高くなる。一方、sがTH以上の場合は、処理対象ブロックに隣接する複数の参照候補ブロックの動き情報の中で異なるものが多くなるため、それらから得られる新たな双結合動き情報候補の組合せは、単結合動き情報候補と異なる可能性が高くなる。従って、特性の異なる動き情報から適切な参照候補を選択出来る確率が高くなり、マージによる動き情報の符号量削減の効果が期待出来る。尚、閾値THの設定範囲は上述の範囲に限るものではなく、設計者による実験やシミュレーションを通じて得られた知見にもとづき調整されてもよい。 In this case, since most of the motion information of the plurality of reference candidate blocks adjacent to the processing target block is similar, even if a combination of them is generated to generate a new bi-joint motion information candidate, the single-joint motion information The occurrence frequency of candidates that are the same as or similar to the candidates increases, and there is a high possibility that appropriate reference candidates cannot be obtained. On the other hand, when s is greater than or equal to TH, there are many different pieces of motion information among a plurality of reference candidate blocks adjacent to the processing target block. The possibility of being different from the combined motion information candidate is increased. Therefore, there is a high probability that an appropriate reference candidate can be selected from motion information having different characteristics, and an effect of reducing the amount of code of motion information by merging can be expected. The setting range of the threshold TH is not limited to the above range, and may be adjusted based on knowledge obtained through experiments or simulations by the designer.
以上のようにして、双結合動き情報候補の組合せ選出を実施するか否かを判定することで、双結合動き情報候補による組合せがマージモードの場合の参照候補として有効であるか否かを双結合動き情報候補の生成を実施する前に判定出来る。従って、双結合動き情報候補リスト生成部152から双結合動き情報候補組合せリスト生成部154までの処理を適宜省略でき、処理負荷を低減することが可能となる。更に、単マージ或いは双マージかを指定するフラグmerge_typeを符号化する必要がなくなるので、符号化効率を向上させることが出来る。
As described above, it is determined whether or not the combination of the bi-coupled motion information candidates is selected, and it is determined whether or not the combination of the bi-coupled motion information candidates is effective as a reference candidate in the merge mode. This can be determined before the combined motion information candidate is generated. Accordingly, the processing from the dual coupled motion information candidate
実施の形態2の動画像復号装置の構成は、動き情報再生部204の機能を除いて実施の形態1の動画像復号装置200の構成と同一である。以下、実施の形態2における動画像復号装置の動き情報再生部204の機能について実施の形態1との相違を説明する。
The configuration of the moving picture decoding apparatus according to the second embodiment is the same as that of the moving
実施の形態2における結合動き情報候補生成部230の構成が、実施の形態1と異なり、新たに結合タイプ判定部155が設置される。結合タイプ判定部155は、復号時に演算される関数MergeType()の機能を果たしており、実施の形態2における動画像符号化装置の結合動き情報候補生成部140の中の構成と同等の機能を有している。符号列解析部201により復号されたマージフラグが“1”の場合に、復号時に演算される関数MergeType()の返り値によって、単マージ或いは双マージかを選択し、更に符号列解析部201により復号されたマージインデックスにて参照する隣接ブロックの候補の動き情報を選出する。
The configuration of the combined motion information
(実施の形態2の変形例)
尚、実施の形態2は以下のように変形できる。
(Modification of Embodiment 2)
The second embodiment can be modified as follows.
(変形例1)
上述の実施の形態2では、双マージを実施するか否かを判定する関数MergeType()を実行するか否かを、単結合動き情報候補リストに登録された候補数に基づいて判定するようにした。本変形例では、処理対象ブロックを含む画像と、処理対象ブロックの参照候補となる隣接ブロックが参照する画像との画像間距離が最も小さい参照画像を、当該隣接ブロックがL0方向、L1方向ともに参照しているか否かに基いて判定する。本発明の実施の形態では、動き補償予測の精度向上の為に、動き補償予測において複数の参照画像の中から最適な参照画像を選択する。複数の参照画像の中から選択される参照画像を識別する為に、参照画像に対して参照画像インデックスを割り当てて管理する。参照画像はL0方向、L1方向それぞれにあるので、参照画像インデックスも両方向それぞれに設定される。参照画像インデックスは0以上の整数値であり、動き補償予測で利用した参照画像を復号時に指定出来るように、動きベクトルとともに符号化ストリーム中に符号化される。通常、処理対象ブロックを含む画像と複数の参照画像との相関性は、処理対象ブロックを含む画像と画像間距離が小さい参照画像程高いので、動き補償予測においても画像間距離の小さい参照画像を選択する確率が相対的に高くなる。その為、処理対象ブロックを含む画像と画像間距離が小さい参照画像に対して、小さい値の参照画像インデックスを割り当てるようにする。こうすることで、参照画像インデックスの符号量を抑えることが出来、符号化効率が向上することになる。本変形例では、以上の点を鑑みて、処理対象ブロックを含む画像と処理対象ブロックの参照候補となる隣接ブロックが参照する画像との画像間距離が最も小さい参照画像として、L0方向及びL1方向の参照画像インデックスが“0”となっている参照画像とし、隣接ブロックの中で、L0方向及びL1方向の参照画像インデックスがともに“0”となっている隣接ブロックが存在するか否かに基いて判定することとする。
(Modification 1)
In the above-described second embodiment, whether or not to execute the function MergeType () for determining whether or not to perform bimerging is determined based on the number of candidates registered in the single combined motion information candidate list. did. In this modification, a reference image having the smallest inter-image distance between an image including the processing target block and an image referred to by an adjacent block that is a reference candidate for the processing target block is referred to in both the L0 direction and the L1 direction. Judgment based on whether or not. In the embodiment of the present invention, in order to improve the accuracy of motion compensation prediction, an optimal reference image is selected from a plurality of reference images in motion compensation prediction. In order to identify a reference image selected from a plurality of reference images, a reference image index is assigned to the reference image for management. Since the reference image is in each of the L0 direction and the L1 direction, the reference image index is also set in each of both directions. The reference image index is an integer value of 0 or more, and is encoded in the encoded stream together with the motion vector so that the reference image used in motion compensated prediction can be specified at the time of decoding. In general, the correlation between an image including a processing target block and a plurality of reference images is higher for a reference image having a smaller inter-image distance and an image including a processing target block. The probability of selection is relatively high. For this reason, a reference image index having a small value is assigned to an image including the processing target block and a reference image having a small inter-image distance. By doing so, the code amount of the reference image index can be suppressed, and the encoding efficiency is improved. In the present modification, in view of the above points, the L0 direction and the L1 direction are used as reference images having the smallest inter-image distance between an image including a processing target block and an image referred to by an adjacent block serving as a reference candidate for the processing target block. Based on whether or not there is an adjacent block in which the reference image index in both the L0 direction and the L1 direction is “0”. Judgment is made.
図52で示される一例を用いて説明する。図52中のCurPicが処理対象ブロックを含む画像を示し、図下部の数字はCurPicが参照する画像の参照リストL0及びL1の参照画像インデックスを示している。CurPicの中心にある黒斜線で示される領域を処理対象ブロックとし、処理対象ブロックの参照候補となる隣接ブロックをBL0及びBL1で表す。 This will be described using an example shown in FIG. In FIG. 52, CurPic indicates an image including a processing target block, and the numbers in the lower part of the diagram indicate reference image indexes of reference lists L0 and L1 of images referred to by CurPic. An area indicated by a black oblique line in the center of CurPic is a processing target block, and adjacent blocks that are reference candidates for the processing target block are represented by BL0 and BL1.
ブロックBL0の動き情報は、予測方向が双方向モードであり、参照リストL0の参照インデックス2で示される画像RefL0Pic(BL0)と参照リストL1の参照インデックス0で示される画像RefL1Pic(BL0)を参照画像とし、L0方向の動きベクトルはmvL0(BL0)、L1方向の動きベクトルはmvL1(BL0)で表される。
In the motion information of the block BL0, the prediction direction is the bidirectional mode, and the image RefL0Pic (BL0) indicated by the
同様に、ブロックBL1の動き情報は、予測方向が双方向モードであり、参照リストL0の参照インデックス0で示される画像RefL0Pic(BL1)と参照リストL1の参照インデックス1で示される画像RefL1Pic(BL1)を参照画像とし、L0方向の動きベクトルはmvL0(BL1)、L1方向の動きベクトルはmvL1(BL1)で表される。
Similarly, in the motion information of the block BL1, the prediction direction is the bidirectional mode, the image RefL0Pic (BL1) indicated by the
処理対象ブロックが参照する単結合動き情報候補はブロックBL0とBL1と、ブロックBL0とBL1の動き情報の組合せで生成される双結合動き情報候補であり、双結合動き情報候補の組合せを(L0,L1)で表すと、(BL0,BL1)及び(BL1,BL0)の2つが生成される。単結合動き情報候補のBL0及びBL1には、L0方向、L1方向ともに参照画像インデックスが“0”となる動き情報はないが、双結合動き情報候補の組合せの(BL1,BL0)はL0方向、L1方向ともに参照画像インデックスが“0”となる動き情報を備えている。 The single combined motion information candidate referred to by the processing target block is a dual combined motion information candidate generated by combining the motion information of the blocks BL0 and BL1 and the blocks BL0 and BL1, and the combination of the dual combined motion information candidates is (L0, When represented by L1), two of (BL0, BL1) and (BL1, BL0) are generated. The single combined motion information candidates BL0 and BL1 have no motion information in which the reference image index is “0” in both the L0 direction and the L1 direction, but the combination (BL1, BL0) of the dual combined motion information candidates is in the L0 direction, Motion information with a reference image index of “0” is provided in both L1 directions.
処理対象ブロックを含む画像からの画像間距離が小さい参照画像ほど、処理対象のブロックを含む画像との時間的な相関性が高いので、画像間距離が小さい参照画像を参照して検出される動きベクトルの精度が高くなり、残差信号を小さくすることが出来、符号化効率が向上することが出来る。このことから(BL1,BL0)は、単結合動き情報候補以上に有用な動き情報の候補となり得る。 The reference image with a smaller inter-image distance from the image including the processing target block has a higher temporal correlation with the image including the processing target block, and thus the motion detected with reference to the reference image with a smaller inter-image distance. The accuracy of the vector increases, the residual signal can be reduced, and the encoding efficiency can be improved. Therefore, (BL1, BL0) can be a candidate for motion information more useful than a single combined motion information candidate.
単結合動き情報候補の動き情報にL0方向及びL1方向の参照画像インデックスがともに“0”となっている隣接ブロックが存在しない場合、双マージを適用し、L0方向及びL1方向の参照画像インデックスが“0”となる新たな組合せの双結合動き情報候補を生成することで、より高い符号化効率の改善が期待出来る。 When there is no adjacent block in which the reference image index in both the L0 direction and the L1 direction is “0” in the motion information of the single combined motion information candidate, bimerging is applied, and the reference image index in the L0 direction and the L1 direction is By generating a new combination of double-coupled motion information candidates that are “0”, higher encoding efficiency can be expected.
一方、単結合動き情報候補の動き情報にL0方向及びL1方向の参照画像インデックスがともに“0”となっている隣接ブロックが存在する場合、双マージを適用し、新たな組合せの双結合動き情報候補を生成しても、符号化効率の改善は殆ど期待出来ない。従って、単結合動き情報候補の動き情報の少なくとも1つに、L0方向及びL1方向の参照画像インデックスがともに“0”となっている候補が存在する場合、結合タイプ判定部155は、双結合動き情報候補生成処理を実行しないと判定する。
On the other hand, when there is an adjacent block in which the reference image index in the L0 direction and the L1 direction is both “0” in the motion information of the single combined motion information candidate, bimerging is applied to create a new combined bijoint motion information. Even if the candidates are generated, it is hardly expected to improve the encoding efficiency. Therefore, when there is a candidate in which the reference image index in both the L0 direction and the L1 direction is “0” in at least one of the motion information of the single combined motion information candidate, the combined
尚、単結合動き情報候補の動き情報の所定数(例えば、2つ)に、L0方向及びL1方向の参照画像インデックスがともに“0”となっている候補が存在する場合、双結合動き情報候補生成処理を実行しないと判定し、単結合動き情報候補の動き情報の所定数に、L0方向及びL1方向の参照画像インデックスがともに“0”となっている候補が存在しない場合、双結合動き情報候補生成処理を実行すると判定してもよい。 If there is a candidate in which the reference image index in the L0 direction and the L1 direction are both “0” in the predetermined number (for example, two) of motion information of the single coupled motion information candidate, the dual coupled motion information candidate If it is determined that the generation process is not to be executed and there is no candidate in which the reference image index in both the L0 direction and the L1 direction is “0” in the predetermined number of pieces of motion information of the single combined motion information candidate, It may be determined that the candidate generation process is executed.
更に、この判定処理の際、単結合動き情報候補から時間ブロック候補の動き情報を外してもよい。時間ブロックの動き情報候補を外すか否かは、時間ブロック候補の参照画像の決定方法に依存する。 Further, in the determination process, the motion information of the time block candidate may be excluded from the single combined motion information candidates. Whether or not to remove motion information candidates for time blocks depends on how to determine reference images for time block candidates.
尚、本変形例では、参照画像インデックスに基づいて判定を行ったが、処理対象ブロックを含む画像と、処理対象ブロックの参照候補となる隣接ブロックが参照する画像との画像間距離に基づいて判定可能であれば、これに限定されない。例えば、上述で説明したMPEG−4AVCで定義された画像の表示順序を示すカウンタであるPOC(Picture Order Count)を用いて、画像間距離を算出するようにしてもよい。画像の表示順序が1増加するとPOCも1増加するので、画像間のPOC差から画像間距離を取得可能である。 In this modification, the determination is performed based on the reference image index. However, the determination is based on the inter-image distance between the image including the processing target block and the image referred to by the adjacent block that is a reference candidate of the processing target block. It is not limited to this if possible. For example, the inter-image distance may be calculated using a POC (Picture Order Count) which is a counter indicating the display order of images defined in the MPEG-4 AVC described above. When the image display order is increased by 1, the POC is also increased by 1. Therefore, the inter-image distance can be obtained from the POC difference between the images.
(変形例2)
上述の実施の形態2では、実施の形態1と同様に、L0方向の双結合動き情報とL1方向の双結合動き情報にそれぞれマージインデックスを割り当てるシンタックスを前提に説明した。実施の形態2に係る双結合タイプの動き情報候補生成処理を実行するか否かを判定する処理は、L0方向及びL1方向の双結合動き情報の組み合わせに1つのマージインデックスを割り当てるシンタックスにも適用可能である。
(Modification 2)
In the above-described second embodiment, as in the first embodiment, the description has been made on the assumption that the merge index is assigned to each of the L0 direction bi-join motion information and the L1 direction bi-join motion information. The process for determining whether or not to execute the bi-joint type motion information candidate generation process according to the second embodiment is a syntax that assigns one merge index to the combination of the bi-join motion information in the L0 direction and the L1 direction. Applicable.
(実施の形態2の効果)
実施の形態2では、双結合動き情報候補の組合せ選出を実施するか否かを判定することで、双結合動き情報候補による組合せがマージモードの場合の参照候補として有効であるか否かを双結合動き情報候補の生成を実施する前に判定出来る。従って、双結合動き情報候補リスト生成部152から双結合動き情報候補組合せリスト生成部154までの処理を適宜省略でき、処理負荷を低減することが可能となる。更に、単マージ或いは双マージかを指定するフラグmerge_typeを符号化する必要がなくなるので、符号化効率を向上させる効果がある。
(Effect of Embodiment 2)
In the second embodiment, it is determined whether or not a combination of bi-coupled motion information candidates is effective as a reference candidate in the merge mode by determining whether or not a combination of bi-coupled motion information candidates is selected. This can be determined before the combined motion information candidate is generated. Accordingly, the processing from the dual coupled motion information candidate
以上述べた実施の形態1、2の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態1、2で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有している。当該動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。 The moving image encoded stream output from the moving image encoding apparatus according to the first and second embodiments described above is specified so that it can be decoded according to the encoding method used in the first and second embodiments. Data format. A moving picture decoding apparatus corresponding to the moving picture encoding apparatus can decode an encoded stream of this specific data format.
具体的には、双結合動き情報候補を示すマージインデックスや、候補番号管理テーブルを符号化ストリーム中に符号化している。また、双結合動き情報候補を示すマージインデックスのみを符号化ストリーム中に符号化し、候補番号管理テーブルを動画像符号装置と動画像復号装置で共有することで候補番号管理テーブルを符号化ストリーム中に符号化しなくてもよい。 Specifically, a merge index indicating a candidate for bi-join motion information and a candidate number management table are encoded in the encoded stream. Also, only the merge index indicating the bi-join motion information candidate is encoded in the encoded stream, and the candidate number management table is shared by the video encoding device and the video decoding device, so that the candidate number management table is included in the encoded stream. It may not be encoded.
動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。 When a wired or wireless network is used to exchange an encoded stream between a moving image encoding device and a moving image decoding device, the encoded stream is converted into a data format suitable for the transmission form of the communication path. It may be transmitted. In that case, a video transmission apparatus that converts the encoded stream output from the video encoding apparatus into encoded data in a data format suitable for the transmission form of the communication channel and transmits the encoded data to the network, and receives the encoded data from the network Then, a moving image receiving apparatus that restores the encoded stream and supplies the encoded stream to the moving image decoding apparatus is provided.
動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。 The moving image transmitting apparatus is a memory that buffers the encoded stream output from the moving image encoding apparatus, a packet processing unit that packetizes the encoded stream, and transmission that transmits the packetized encoded data via the network. Part. The moving image receiving apparatus generates a coded stream by packetizing the received data, a receiving unit that receives the packetized coded data via a network, a memory that buffers the received coded data, and packet processing. And a packet processing unit provided to the video decoding device.
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ROM(Read Only Memory)やフラッシュメモリなどに記憶されているファームウェアや、コンピュータなどのソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータなどで読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。 The processing related to encoding and decoding described above can be realized as a transmission, storage, and reception device using hardware, as well as firmware stored in a ROM (Read Only Memory), flash memory, and the like. It can also be realized by software such as a computer. The firmware program and software program can be recorded and provided on a computer-readable recording medium, provided from a server through a wired or wireless network, or provided as a data broadcast of terrestrial or satellite digital broadcasting. Is also possible.
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .
100 動画像符号化装置、 101 予測ブロック画像取得部、 102 減算部、 103 予測誤差符号化部、 104 符号列生成部、 105 予測誤差復号部、 106 動き補償部、 107 加算部、 108 動きベクトル検出部、 109 動き情報生成部、 110 フレームメモリ、 111 動き情報メモリ、 120 差分ベクトル算出部、 121 結合動き情報決定部、 122 予測符号化モード決定部、 130 予測ベクトル候補リスト生成部、 131 予測ベクトル決定部、 132 減算部、 140 結合動き情報候補生成部、 141 結合動き情報選択部、 150 単結合動き情報候補リスト生成部、 151 単結合動き情報候補リスト削減部、 152 双結合動き情報候補リスト生成部、 153 双結合動き情報候補リスト削減部、 154 双結合動き情報候補組合せリスト生成部、 155 結合タイプ判定部、 160 L0,L1方向動き情報組合せ部、 161 双結合動き情報候補決定部、 200 動画像復号装置、 201 符号列解析部、 202 予測誤差復号部、 203 加算部、 204 動き情報再生部、 205 動き補償部、 206 フレームメモリ、 207 動き情報メモリ、 210 符号化モード判定部、 211 動きベクトル再生部、 212 結合動き情報再生部、 220 予測ベクトル候補リスト生成部、 221 予測ベクトル決定部、 222 加算部。 DESCRIPTION OF SYMBOLS 100 moving image encoder, 101 prediction block image acquisition part, 102 subtraction part, 103 prediction error encoding part, 104 code stream production | generation part, 105 prediction error decoding part, 106 motion compensation part, 107 addition part, 108 motion vector detection , 109 motion information generation unit, 110 frame memory, 111 motion information memory, 120 difference vector calculation unit, 121 combined motion information determination unit, 122 prediction coding mode determination unit, 130 prediction vector candidate list generation unit, 131 prediction vector determination , 132 subtraction unit, 140 combined motion information candidate generation unit, 141 combined motion information selection unit, 150 single combined motion information candidate list generation unit, 151 single combined motion information candidate list reduction unit, 152 double combined motion information candidate list generation unit 153 Double-coupled motion information Information candidate list reduction unit, 154 double coupled motion information candidate combination list generation unit, 155 coupled type determination unit, 160 L0, L1 direction motion information combination unit, 161 dual coupled motion information candidate determination unit, 200 moving image decoding device, 201 code Sequence analysis unit, 202 prediction error decoding unit, 203 addition unit, 204 motion information reproduction unit, 205 motion compensation unit, 206 frame memory, 207 motion information memory, 210 encoding mode determination unit, 211 motion vector reproduction unit, 212 combined motion An information reproduction unit; 220 a prediction vector candidate list generation unit; 221 a prediction vector determination unit; 222 an addition unit.
Claims (7)
1つの参照ブロック候補が持つ動き情報を使用する第1の画像間予測モードを使用するか、2つの参照ブロック候補が持つ動き情報を使用する第2の画像間予測モードを使用するかを判定する判定部を備え、
前記第1の画像間予測モードは、1つの参照ブロック候補の動き情報に含まれる単方向または双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードであり、
前記第2の画像間予測モードは、2つの参照ブロック候補の動き情報から取得可能な2つの動きベクトルを組み合わせて、新たな双方向の動きベクトルの組み合わせを生成し、当該新たな双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードである、
ことを特徴とする画像符号化装置。 An image encoding device that performs motion compensation prediction,
It is determined whether to use the first inter-picture prediction mode that uses the motion information of one reference block candidate or to use the second inter-picture prediction mode that uses the motion information of two reference block candidates. It has a judgment part,
The first inter-picture prediction mode is a mode for performing motion compensation of a coding target block using a unidirectional or bidirectional motion vector included in motion information of one reference block candidate,
The second inter-picture prediction mode generates a new bidirectional motion vector combination by combining two motion vectors that can be acquired from the motion information of two reference block candidates. In this mode, motion compensation is performed on the current block using a vector.
An image encoding apparatus characterized by that.
前記候補リストに、重複する動き情報を持つブロックが複数存在する場合、1つを残し、残りを削除する削除部と、をさらに備え、
前記判定部は、前記削除部により削除されたブロックの数が、設定数以上の場合、前記第2の画像間予測モードを使用しないと判定する、
ことを特徴とする請求項1に記載の画像符号化装置。 A candidate list generation unit that generates a candidate list by selecting a plurality of blocks having motion information from a plurality of encoded blocks adjacent to the encoding target block;
When there are a plurality of blocks having overlapping motion information in the candidate list, a deletion unit that leaves one and deletes the rest is further provided,
The determination unit determines not to use the second inter-picture prediction mode when the number of blocks deleted by the deletion unit is equal to or greater than a set number.
The image coding apparatus according to claim 1.
前記判定部は、前記候補リストに、双方向の動きベクトルを持ち、双方向の動きベクトルの2つの参照画像が対象画像の時間的に直前の画像及び直後の画像であるブロックが、設定数以上含まれている場合、前記第2の画像間予測モードを使用しないと判定する、
ことを特徴とする請求項1に記載の画像符号化装置。 A candidate list generation unit that generates a candidate list by selecting a plurality of blocks having motion information from a plurality of encoded blocks adjacent to the encoding target block;
The determination unit has a bidirectional motion vector in the candidate list, and the number of blocks in which two reference images of the bidirectional motion vector are the temporally immediately preceding image and the immediately following image of the target image is greater than or equal to the set number. If included, it is determined not to use the second inter-image prediction mode.
The image coding apparatus according to claim 1.
前記選択候補生成部により生成された新たな選択候補を含む複数の選択候補の中から1つを選択する選択部と、
前記選択部により選択された候補を特定するための識別情報を符号化する符号列生成部と、をさらに備え、
前記選択候補生成部により生成された新たな選択候補の識別情報は、当該選択候補を組成する第1の予測方向の動き情報候補の識別情報と第2の予測方向の動き情報候補の識別情報の組み合わせにより規定される、
ことを特徴とする請求項1から3のいずれかに記載の画像符号化装置。 Two blocks are selected from a plurality of encoded blocks adjacent to the encoding target block, and the motion information of the two encoded blocks is different from the motion information held by the plurality of encoded blocks. A selection candidate generating unit that generates motion information including a bidirectional motion vector as a new selection candidate;
A selection unit that selects one of a plurality of selection candidates including a new selection candidate generated by the selection candidate generation unit;
A code string generation unit that encodes identification information for specifying the candidate selected by the selection unit;
The new selection candidate identification information generated by the selection candidate generation unit includes identification information of motion information candidates in the first prediction direction and identification information of motion information candidates in the second prediction direction that composes the selection candidates. Stipulated by the combination,
The image encoding device according to claim 1, wherein the image encoding device is an image encoding device.
ことを特徴とする請求項4に記載の画像符号化装置。 Among the motion information candidates in the first prediction direction and the motion information candidates in the second prediction direction, identification information is assigned to each of the motion information candidates in the reference direction, and a combination target is set for each motion information candidate in the reference direction. The number of motion information candidates in the non-reference direction is counted, and identification information is assigned to each of the motion information candidates in the non-reference direction based on the respective count values.
The image coding apparatus according to claim 4, wherein:
1つの参照ブロック候補が持つ動き情報を使用する第1の画像間予測モードを使用するか、2つの参照ブロック候補が持つ動き情報を使用する第2の画像間予測モードを使用するかを判定するステップを備え、
前記第1の画像間予測モードは、1つの参照ブロック候補の動き情報に含まれる単方向または双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードであり、
前記第2の画像間予測モードは、2つの参照ブロック候補の動き情報から取得可能な2つの動きベクトルを組み合わせて、新たな双方向の動きベクトルの組み合わせを生成し、当該新たな双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードである、
ことを特徴とする画像符号化方法。 An image encoding method for performing motion compensation prediction,
It is determined whether to use the first inter-picture prediction mode that uses the motion information of one reference block candidate or to use the second inter-picture prediction mode that uses the motion information of two reference block candidates. With steps,
The first inter-picture prediction mode is a mode for performing motion compensation of a coding target block using a unidirectional or bidirectional motion vector included in motion information of one reference block candidate,
The second inter-picture prediction mode generates a new bidirectional motion vector combination by combining two motion vectors that can be acquired from the motion information of two reference block candidates. In this mode, motion compensation is performed on the current block using a vector.
An image encoding method characterized by the above.
1つの参照ブロック候補が持つ動き情報を使用する第1の画像間予測モードを使用するか、2つの参照ブロック候補が持つ動き情報を使用する第2の画像間予測モードを使用するかを判定する処理をコンピュータに実行させ、
前記第1の画像間予測モードは、1つの参照ブロック候補の動き情報に含まれる単方向または双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードであり、
前記第2の画像間予測モードは、2つの参照ブロック候補の動き情報から取得可能な2つの動きベクトルを組み合わせて、新たな双方向の動きベクトルの組み合わせを生成し、当該新たな双方向の動きベクトルを用いて符号化対象ブロックの動き補償を行うモードである、
ことを特徴とする画像符号化プログラム。 An image encoding program for performing motion compensation prediction,
It is determined whether to use the first inter-picture prediction mode that uses the motion information of one reference block candidate or to use the second inter-picture prediction mode that uses the motion information of two reference block candidates. Let the computer execute the process,
The first inter-picture prediction mode is a mode for performing motion compensation of a coding target block using a unidirectional or bidirectional motion vector included in motion information of one reference block candidate,
The second inter-picture prediction mode generates a new bidirectional motion vector combination by combining two motion vectors that can be acquired from the motion information of two reference block candidates. In this mode, motion compensation is performed on the current block using a vector.
An image encoding program characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011155097A JP2013021612A (en) | 2011-07-13 | 2011-07-13 | Image encoder, image encoding method and image encoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011155097A JP2013021612A (en) | 2011-07-13 | 2011-07-13 | Image encoder, image encoding method and image encoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013021612A true JP2013021612A (en) | 2013-01-31 |
Family
ID=47692579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011155097A Withdrawn JP2013021612A (en) | 2011-07-13 | 2011-07-13 | Image encoder, image encoding method and image encoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013021612A (en) |
-
2011
- 2011-07-13 JP JP2011155097A patent/JP2013021612A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9686564B2 (en) | Picture encoding device, picture encoding method, picture encoding program, picture decoding device, picture decoding method, and picture decoding program | |
WO2013001803A1 (en) | Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program | |
JP6079860B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP6135750B2 (en) | Image encoding device, image encoding method, image encoding program, transmission device, transmission method, and transmission program | |
WO2012120870A1 (en) | Video encoding device, video encoding method, video encoding program, video decoding device, video decoding method, and video decoding program | |
JP5720751B2 (en) | Image decoding apparatus, image decoding method, and image decoding program, and receiving apparatus, receiving method, and receiving program | |
JP5682582B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP2013021613A (en) | Image decoder, image decoding method and image decoding program | |
JP2013021612A (en) | Image encoder, image encoding method and image encoding program | |
JP2013021573A (en) | Image decoder, image decoding method, and image decoding program | |
JP2013021572A (en) | Image encoder, image encoding method, and image encoding program | |
JP2013021505A (en) | Moving image decoding device, moving image decoding method, and moving image decoding program | |
JP2013021504A (en) | Moving image encoding device, moving image encoding method, and moving image encoding program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141007 |