JP2011004342A - Encoding preprocessor, encoding device, decoding device, and program - Google Patents
Encoding preprocessor, encoding device, decoding device, and program Download PDFInfo
- Publication number
- JP2011004342A JP2011004342A JP2009147860A JP2009147860A JP2011004342A JP 2011004342 A JP2011004342 A JP 2011004342A JP 2009147860 A JP2009147860 A JP 2009147860A JP 2009147860 A JP2009147860 A JP 2009147860A JP 2011004342 A JP2011004342 A JP 2011004342A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- motion
- encoding
- image
- motion vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動きシーンにおける適応的符号化技術に関し、特に、高速動きシーンにおける符号化前処理装置、符号化装置、復号装置及びプログラムに関する。 The present invention relates to an adaptive encoding technique in a motion scene, and more particularly to an encoding preprocessing device, an encoding device, a decoding device, and a program in a high-speed motion scene.
いわゆる8Kと呼ばれるスーパーハイビジョン(SHV)のようなハイビジョン16倍の解像度を有する超高精細動画像は従来のハイビジョンよりも大画面を目的とした動画像システムであり、標準視距離における水平視野角が広視野となるため、まるで画像に包み込まれるような臨場感ある動画像を楽しむことができる。しかしながら、フレームレートが従来の標準画質やハイビジョン用の画面と異なるため、同様の画角で動画像を撮像した場合、フレーム間の動き速度に差が生じることになる。 Ultra-high definition moving images with 16 times higher resolution such as Super Hi-Vision (SHV) called 8K is a moving image system aiming at a larger screen than conventional Hi-Vision, and has a horizontal viewing angle at a standard viewing distance. Since it has a wide field of view, it is possible to enjoy a moving image with a sense of presence that seems to be wrapped in an image. However, since the frame rate is different from that of a conventional standard image quality or high-definition screen, when moving images are captured at the same angle of view, a difference occurs in the motion speed between frames.
例えば、図8(a)に示すように、ハイビジョン画面は1920画素×1080ラインであり、画面高さ(H)に対して3Hの距離に視点があるとすると、水平視野角が30degであるのに対し、図8(b)に示すように、スーパーハイビジョン画面は、7680画素×4320ラインであり、画面高さ(H)に対して0.75Hの距離に視点があるとすると、水平視野角が100degである。この場合、スーパーハイビジョン画面用の超高精細動画像信号とハイビジョン画面用の動画像信号とを比較すると、超高精細動画像信号は、水平・垂直解像度ともに4倍となるため、両者が同じフレームレートの場合はフレーム間の動き速度も4倍となる。 For example, as shown in FIG. 8A, a high-definition screen is 1920 pixels × 1080 lines, and if the viewpoint is at a distance of 3H with respect to the screen height (H), the horizontal viewing angle is 30 degrees. On the other hand, as shown in FIG. 8B, the super high-definition screen has 7680 pixels × 4320 lines, and if the viewpoint is at a distance of 0.75H with respect to the screen height (H), the horizontal viewing angle is Is 100 deg. In this case, when the super high definition video signal for the super high-definition screen and the video signal for the high vision screen are compared, the super high definition video signal is quadrupled in both the horizontal and vertical resolutions. In the case of rate, the motion speed between frames is also quadrupled.
広視野の超高精細動画像は、従来の動画像に比べてフレーム間の動き速度が大きくなりがちであるばかりでなく、動領域における1画素あたりの動きボケ量も大きくなるため、H.264(MPEG−4 AVC)やMPEG−2のようなブロックマッチングによる動き検出法において単純にブロックサイズを大きくするか、又は動き探索範囲を広げても、動きベクトル検出確度がそれほど高くならず、フレーム間符号化による画像の画質劣化が顕著になりやすい。これは、動きシーンの場合に特に顕著である。 Wide-field ultra high-definition moving images not only tend to have a higher motion speed between frames than conventional moving images, but also increase the amount of motion blur per pixel in the moving region. Even if the block size is simply increased or the motion search range is expanded in a motion detection method using block matching such as H.264 (MPEG-4 AVC) or MPEG-2, the motion vector detection accuracy is not so high. Image quality degradation due to inter-coding tends to be noticeable. This is particularly noticeable in the case of a moving scene.
そこで、本発明の目的は、動きシーンを適応的に符号化する符号化前処理装置、符号化装置、復号装置及びプログラムを提供することにある。 Therefore, an object of the present invention is to provide a pre-encoding device, an encoding device, a decoding device, and a program for adaptively encoding a motion scene.
本発明は、広視野の超高精細動画像の高速動きシーンにおいて、H.264又はMPEG−2方式のようなフレーム内符号化処理(Iフレーム/Iスライス)とフレーム間符号化処理(P,Bフレーム/P,Bスライス)を用いる符号化方式で符号化するために、比較的大きなブロックサイズで、且つ大きな動き探索範囲で動き検出を行い、この動きベクトルをクラスタリングし、動領域が支配的且つ動き速度が大きいか否かを判別し、動き速度が大きいと判断した場合には、フレーム内符号化を行う旨の補助情報を送出する符号化前処理装置を提供するとともに、符号化装置、復号装置及びプログラムを提供する。 The present invention relates to a high-speed motion scene of an ultra-high definition moving image with a wide field of view. In order to encode with an encoding method using an intra-frame encoding process (I frame / I slice) and an inter-frame encoding process (P, B frame / P, B slice) such as H.264 or MPEG-2, When motion detection is performed in a relatively large block size and a large motion search range, and the motion vectors are clustered to determine whether the motion region is dominant and the motion speed is high, and it is determined that the motion speed is high Provides a pre-encoding device for sending auxiliary information for performing intra-frame encoding, as well as an encoding device, a decoding device, and a program.
即ち、本発明の符号化前処理装置は、動きシーンにおける動画像を適応的にフレーム内符号化処理とフレーム間符号化処理を用いる符号化方式で符号化するために前処理を行う符号化前処理装置であって、動画像フレーム列内の或るフレーム画像について所定のブロックサイズで複数の画素ブロックに分割するブロック分割部と、当該画像フレーム列内の前記フレーム画像とは異なる別フレーム画像を探索範囲として、前記画素ブロックの各々における動きベクトルを算出する動き探索処理部と、算出した全ての動きベクトルについて、所定数の動きベクトル候補クラスタとして識別可能に分類するクラスタリングを行うとともに、当該画像フレーム間の動き速度を算出する動きベクトルクラスタリング処理部と、前記所定数の動きベクトル候補クラスタの各動きベクトルから、広領域・高速動きのフレームであるか否かを判定し、広領域・高速動きのフレームであると判定した場合に、前記符号化方式に関わらず、前記フレーム画像を、強制的にフレーム内符号化を施すべきフレームとして決定する広領域・高速動き判定部とを備え、前記広領域・高速動き判定部は、前記所定数の動きベクトル候補クラスタの中で、割り付けられた動きベクトルの数が全動きベクトルに対する割合として規定される数よりも多く、且つ該動きベクトルの値が規定値よりも大きい場合に、広領域で高速な動きを有するフレームであると判定することを特徴とする。 That is, the pre-encoding apparatus of the present invention performs pre-processing for performing pre-processing in order to adaptively encode a moving image in a motion scene with an encoding method using intra-frame encoding processing and inter-frame encoding processing. A processing device, a block dividing unit that divides a certain frame image in a moving image frame sequence into a plurality of pixel blocks with a predetermined block size, and another frame image different from the frame image in the image frame sequence As a search range, a motion search processing unit that calculates a motion vector in each of the pixel blocks, clustering that classifies all the calculated motion vectors so as to be identifiable as a predetermined number of motion vector candidate clusters, and the image frame A motion vector clustering processing unit for calculating a motion speed between the predetermined number of motion vectors Whether each frame is a wide area / high-speed motion frame is determined from each motion vector of the complementary cluster, and when it is determined that the frame is a wide area / high-speed motion frame, the frame image is used regardless of the encoding method. And a wide area / high-speed motion determination unit that forcibly determines a frame to be subjected to intra-frame coding, and the wide area / high-speed motion determination unit allocates among the predetermined number of motion vector candidate clusters. When the number of motion vectors obtained is larger than the number specified as a ratio to the total motion vectors and the value of the motion vector is larger than the specified value, it is determined that the frame has a high-speed motion in a wide area. It is characterized by that.
また、本発明の符号化前処理装置において、前記フレーム間の動き速度は、全動きベクトル量の平均値であることを特徴とする。 In the pre-encoding apparatus of the present invention, the motion speed between frames is an average value of all motion vector amounts.
また、本発明の符号化前処理装置において、前記所定のブロックサイズは、前記符号化方式で規定される動き検出のブロックサイズよりも大きいことを特徴とする。 In the pre-encoding apparatus of the present invention, the predetermined block size is larger than a motion detection block size defined by the encoding method.
また、本発明の符号化前処理装置において、前記動き探索処理部によって探索される探索範囲は、前記符号化方式で規定される探索範囲よりも大きいことを特徴とする。 In the pre-encoding apparatus of the present invention, a search range searched by the motion search processing unit is larger than a search range defined by the encoding method.
また、本発明の符号化前処理装置において、前記クラスタリングは、k−means法に従って行われることを特徴とする。 In the pre-encoding apparatus of the present invention, the clustering is performed according to a k-means method.
更に、本発明の符号化装置は、本発明の符号化前処理装置と、前記動画像フレーム列について、該符号化前処理装置によって決定された広領域・高速動きのフレームであるか否かを示す付属情報に従って前記符号化方式の符号化を施す符号化器と、を備えることを特徴とする。 Furthermore, the encoding device of the present invention determines whether or not the pre-coding device of the present invention and the moving image frame sequence are wide-area / high-speed motion frames determined by the pre-coding device. And an encoder that performs encoding according to the encoding method according to the attached information.
更に、本発明の復号装置は、本発明の符号化装置によって符号化された動画像フレーム列について、前記付属情報に従って前記符号化方式の復号を施すことを特徴とする。 Furthermore, the decoding device of the present invention is characterized in that the moving picture frame sequence encoded by the encoding device of the present invention performs decoding of the encoding method according to the attached information.
更に、本発明は、動きシーンにおける動画像を適応的にフレーム内符号化処理とフレーム間符号化処理を用いる符号化方式で符号化するために前処理を行う符号化前処理装置として構成するコンピュータに、動画像フレーム列内の或るフレーム画像について所定のブロックサイズで複数の画素ブロックに分割するステップと、当該画像フレーム列内の前記フレーム画像とは異なる別フレーム画像を探索範囲として、前記画素ブロックの各々における動きベクトルを算出するステップと、算出した全ての動きベクトルについて、所定数の動きベクトル候補クラスタとして識別可能に分類するクラスタリングを行うとともに、当該画像フレーム間の動き速度を算出するステップと、前記所定数の動きベクトル候補クラスタの各動きベクトルから、広領域・高速動きのフレームであるか否かを判定し、広領域・高速動きのフレームであると判定した場合に、前記符号化方式に関わらず、前記フレーム画像を、強制的にフレーム内符号化を施すべきフレームとして決定するステップと、を実行させるためのプログラムとしても特徴付けられる。 Furthermore, the present invention provides a computer configured as a pre-encoding device that performs pre-processing to adaptively encode a moving image in a motion scene by an encoding method using intra-frame encoding processing and inter-frame encoding processing. A step of dividing a certain frame image in the moving image frame sequence into a plurality of pixel blocks with a predetermined block size, and using another frame image different from the frame image in the image frame sequence as a search range, A step of calculating a motion vector in each of the blocks; a step of performing clustering for classifying all the calculated motion vectors so as to be identifiable as a predetermined number of motion vector candidate clusters; and calculating a motion speed between the image frames; From each motion vector of the predetermined number of motion vector candidate clusters, It is determined whether the frame is a region / high-speed motion frame. When it is determined that the frame is a wide region / high-speed motion frame, the frame image is forcibly encoded regardless of the encoding method. And a step for determining a frame to be subjected to.
更に、本発明は、本発明の復号装置として構成するコンピュータに、前記付属情報に従って当該所定の符号化方式の復号を施すことを実行させるためのプログラムとしても特徴付けられる。 Furthermore, the present invention is also characterized as a program for causing a computer configured as a decoding apparatus of the present invention to execute decoding of the predetermined encoding method according to the attached information.
本発明によれば、広視野の超高精細動画像で問題を生じやすい高速動きシーンにおける画質劣化を防ぐことができ、簡便且つ効果が高い符号化技術を提供することができる。 According to the present invention, it is possible to prevent image quality deterioration in a high-speed motion scene that is likely to cause a problem in a wide-field ultra-high-definition moving image, and to provide a simple and highly effective encoding technique.
以下、本発明による一実施例の符号化装置及び復号装置を説明する。 Hereinafter, an encoding apparatus and a decoding apparatus according to an embodiment of the present invention will be described.
まず、本発明の理解を容易にするために、高速動きシーンについて説明する。高速動きシーンでは、フレーム内で動領域が支配的であり、且つフレーム間での動き速度が大きくなり、画面内の画像の大部分は動きボケを生じていると云える。そこで、本実施例の符号化装置では、動領域が支配的である高速動きシーンでは、強制的にフレーム内符号化(Iスライス・ピクチャ)処理を行うようにする。 First, in order to facilitate understanding of the present invention, a high-speed motion scene will be described. In a high-speed motion scene, the motion region is dominant in the frame, and the motion speed between the frames increases, so that it can be said that most of the images on the screen cause motion blur. Therefore, in the encoding apparatus of the present embodiment, intra-frame encoding (I slice / picture) processing is forcibly performed in a high-speed motion scene in which the moving region is dominant.
高速動きシーンにおいては、フレーム内符号化(Iスライス・ピクチャ)処理を行ったほうがフレーム間符号化(P又はBスライス・ピクチャ処理)を行うよりも画質劣化が少ない。更に、高速動きシーンでは画像の大部分に動きボケを生じているため、ビット量の小さなIスライス・ピクチャ処理を行えば十分である。このとき、Iスライス・ピクチャ処理におけるDCT(Discrete Cosine Transform)及び量子化において高空間周波成分の大部分は失われるが、もともと動きボケにより高空間周波数成分の大部分は失われているため、これに起因する画像劣化は問題とする必要がない。例えば、図9に示すように、動きボケ領域のDCT時の高空間周波数成分の大部分が失われる。 In a high-speed motion scene, image quality degradation is less when performing intra-frame coding (I slice / picture) processing than when performing inter-frame coding (P or B slice / picture processing). Furthermore, since motion blur occurs in most of the images in a high-speed motion scene, it is sufficient to perform I slice / picture processing with a small bit amount. At this time, most of the high spatial frequency components are lost in DCT (Discrete Cosine Transform) and quantization in the I slice picture processing, but most of the high spatial frequency components are originally lost due to motion blur. The image degradation caused by the image does not need to be a problem. For example, as shown in FIG. 9, most of the high spatial frequency components at the time of DCT in the motion blur region are lost.
図1に、本発明による一実施例の符号化装置を示す。本実施例の符号化装置1は、高速動きシーン判定器2と、符号化器3とを備える。高速動きシーン判定器2は、ブロック分割部21と、動き探索処理部22と、動きベクトルクラスタリング処理部23と、広領域・高速動き判定部24とを備える。本発明による一実施例の符号化装置1の各処理に用いるデータは、符号化装置1が備える記憶部(図示せず)に適宜格納することができる。
FIG. 1 shows an encoding apparatus according to an embodiment of the present invention. The
ブロック分割部21は、動画像フレーム列内の任意時間位置tのフレーム画像F(t)を当該記憶部に記憶するとともに、フレーム画像F(t)について任意のブロックサイズで複数の画素ブロックに分割する。
The
動き探索処理部22は、別フレーム画像(例えば、後続するフレーム画像F(t+1))の画面内全体を探索範囲として動き検出を行い、各々の画素ブロックにおける動きベクトルを算出し、算出した全ての動きベクトルを、動きベクトルクラスタリング処理部23に送出する。
The motion
動きベクトルクラスタリング処理部23は、動き探索処理部22によって算出した全ての動きベクトルについて、クラスタリングを行うとともに、フレーム間の動き速度を算出する。クラスタリングは、各動きベクトルについて、動きベクトル候補クラスタとして識別可能に分類する処理である。フレーム間の動き速度は、例えば、全動きベクトル量の平均値とすることができる。
The motion vector
広領域・高速動き判定部24は、所定数の動きベクトル候補クラスタの中で、割り付けられた動きベクトルの数が規定数よりも多く、且つその動きベクトルの値も規定値よりも大きい場合に、フレーム内の動領域が支配的であり、且つフレーム間の動き速度が大きいフレーム画像F(t)であると判定する。換言すれば、広領域・高速動き判定部24は、割り付けられた動きベクトルの数が規定数よりも多く、且つその動きベクトルの値も規定値よりも大きいか否かの判定が肯定的であれば広領域・高速動きのフレーム画像(例えば、高速動きシーンのフレーム画像)であると判定し、否定的であれば広領域・高速動きのフレーム画像ではないと判定する。広領域・高速動き判定部24は、この判定結果を、スライスタイプを表す補助情報として符号化器3に送出する。
The wide area / high-speed
符号化器3は、フレーム画像F(t)について、広領域・高速動きのフレーム画像であるか否かを表す補助情報を参照して任意の動画像の符号化方式(例えば、H.264,MPEG−2)に基づく符号化を施す。符号化器3は、補助情報を参照して広領域・高速動きのフレーム画像である旨を示す場合には、当該フレーム画像F(t)について、当該符号化方式に関わらず、強制的にフレーム内符号化(Iスライス・ピクチャ)処理を施す。一方、補助情報が広領域・高速動きのフレーム画像でない旨を示す場合には、当該符号化方式に従う符号化、即ちフレーム内符号化(Iスライス・ピクチャ)処理又はフレーム間符号化(P又はBスライス・ピクチャ処理)を施して、符号化画像を生成する。この符号化画像には、上記の補助情報が付与される。符号化画像は、当該記憶部に記憶されるか、又は外部装置に向けて伝送される。
The
図2には、本実施例の復号装置4が示されている。本実施例の復号装置4は、該復号装置4が備える記憶部に格納された当該符号化画像及び補助情報を読み出すか、又は伝送される当該符号化画像及び補助情報を受信して、所定の符号化方式に従う復号処理を実行する。尚、本実施例の復号装置4は、当該補助情報を参照してフレーム内符号化(Iスライス・ピクチャ)処理又はフレーム間符号化(P又はBスライス・ピクチャ処理)を施し、復号されたフレーム画像F’(t)を生成する。
FIG. 2 shows the
以下、本発明による一実施例の符号化装置の動作について、図3を参照して更に詳細に説明する。 Hereinafter, the operation of the encoding apparatus according to an embodiment of the present invention will be described in more detail with reference to FIG.
ステップS1にて、符号化装置1のブロック分割部21は、処理対象のフレーム画像F(t)及び後続するフレーム画像F(t+1)を入力し、ステップS2にて,ブロック分割部21によりフレーム画像F(t)を複数の画素ブロックに分割する。
In step S1, the
尚、ハイビジョン画面をMPEG−2で符号化する場合を考慮するに、通常16×16画素のブロックが用いられる。しかしながら、ブロック分割部21によって分割されるブロックサイズは、例えば、スーパーハイビジョン画面でも適用可能とすべく、16×16画素のブロックを水平・垂直方向に各4倍、即ち64×64画素ブロック、或いはそれ以上の大きなサイズの画素ブロックを用いるのが好適である。即ち、好適には、ブロック分割部21によって分割されるブロックサイズは、符号化器3の符号化方式で規定される動き検出のブロックサイズよりも大きい。
Note that a block of 16 × 16 pixels is usually used in consideration of a case where a high-definition screen is encoded by MPEG-2. However, the block size divided by the
尚、実用上、画面全体がパンする場合や、極めて大面積な動物体が高速な動きを行うような高速動きシーンなどを想定するため、図4に示すように、比較的大きめの画素ブロックサイズとすることができ、或いは又、フレーム画像F(t)の約1/4又は1/16程度の大きなブロックを画面中央に用意し、フレーム画像F(t+1)の画面全体を探索範囲として1個の動きベクトルを検出するだけでも効果的である。即ち、好適には、動き探索処理部22によって探索される探索範囲は、符号化器3の符号化方式で規定される探索範囲よりも大きい。
For practical purposes, it is assumed that the entire screen pans or a high-speed motion scene in which an extremely large moving object moves at a high speed. Therefore, as shown in FIG. 4, a relatively large pixel block size is used. Alternatively, a large block of about 1/4 or 1/16 of the frame image F (t) is prepared in the center of the screen, and the entire frame image F (t + 1) screen is set as one search range. It is effective to detect only the motion vector. That is, preferably, the search range searched by the motion
以下の説明では、図4に示すように、フレーム画像F(t)内が複数個の画素ブロックB(Bx,By)で分割される場合について説明する。Bxは水平方向のブロック位置番号、Byは垂直方向のブロック位置番号である。 In the following description, a case where the frame image F (t) is divided into a plurality of pixel blocks B (Bx, By) as shown in FIG. 4 will be described. Bx is a block position number in the horizontal direction, and By is a block position number in the vertical direction.
ステップS3にて、符号化装置1の動き探索処理部22は、複数個にブロック分割した画素ブロックB(Bx,By)の各々について、図5に示すように、例えばフレーム画像F(t+1)を参照して動き探索を実行する。
In step S3, the motion
尚、動き探索の処理に時間がかかるため、全画素ブロック探索でなく数画素ブロックずつ飛ばしながら代表的な画素ブロック位置の探索とすることもできる。この動き探索処理部22の処理により、各々の画素ブロックB(Bx,By)における動きベクトルMv_B(Bx,By)が求められる。
Since the motion search process takes time, it is possible to search for a representative pixel block position while skipping several pixel blocks instead of searching all pixel blocks. By the processing of the motion
ステップS4にて、符号化装置1の動きベクトルクラスタリング処理部23は、動きベクトルMv_B(Bx,By)のクラスタリング及びフレーム間の動き速度を算出する。クラスタリングの方法としては、非階層的クラスタリングアルゴリズムとして有名なk−means法を用いる。
In step S4, the motion vector
k−means法のアルゴリズムを簡潔に説明する。 The algorithm of the k-means method will be briefly described.
まず、初期値として予め定めたk個の動きベクトル候補クラスタ中心を設定する。動きベクトル候補クラスタ中心は、動きベクトルの360度方向に探索(例えば45度毎の探索)して、且つ大きい値を持つ位置を動きベクトル候補クラスタのクラスタ中心の初期候補として設定する。 First, k motion vector candidate cluster centers set in advance as initial values are set. The motion vector candidate cluster center is searched in the 360 degree direction of the motion vector (for example, every 45 degrees search), and a position having a large value is set as an initial candidate for the cluster center of the motion vector candidate cluster.
次に、各動きベクトルMv_B(Bx,By)を最もユーグリット距離が近い動きベクトル候補クラスタ中心に割り当てる。ユーグリット距離は、例えば、図6に示すように、動きベクトル候補クラスタ中心Oから各画素値(Bx,By)までのベクトル量uiの平均値として規定することができる。 Next, each motion vector Mv_B (Bx, By) is assigned to the motion vector candidate cluster center with the shortest Eugrid distance. The Eugrid distance can be defined as an average value of vector quantities u i from the motion vector candidate cluster center O to each pixel value (Bx, By) as shown in FIG. 6, for example.
次に、各動きベクトル候補クラスタごとに、各動きベクトル候補クラスタのクラスタ中心を計算し直す。全てのクラスタ中心の変化値が、或る閾値Th以下であれば終了とし、それ以外は、再度、動きベクトル候補クラスタ中心として割り当てる。 Next, the cluster center of each motion vector candidate cluster is recalculated for each motion vector candidate cluster. If the change values of all cluster centers are equal to or less than a certain threshold value Th, the process is terminated. Otherwise, the cluster is assigned again as a motion vector candidate cluster center.
動きベクトルのクラスタリングは、原点を中心として各各動きベクトルMv_B(Bx,By)の大きさ及び向きでクラスタリングを行う。例えば、図7(a)に示すように、フレーム画像F(t)について、右方向に移動する「人」と、「人」よりも少し遅い速度で同じく右方向に移動する「背景」と、「人」及び「背景」以外の「その他」の3つのオブジェクトがあるとして3つのクラスタリングを計算する際には、各動きベクトルMv_B(Bx,By)の大きさ及び向きでクラスタリングを行うことにより、図7(b)に示すように、「人」を表す動きベクトル候補クラスタはMVset1と、「背景」を表す動きベクトル候補クラスタはMVset2と、「その他」を表すベクトル候補クラスタMVset3のように分類することができる。 In the motion vector clustering, clustering is performed with the size and orientation of each motion vector Mv_B (Bx, By) with the origin at the center. For example, as shown in FIG. 7A, for the frame image F (t), a “person” that moves to the right and a “background” that also moves to the right at a slightly slower speed than “person”, When three clusterings are calculated on the assumption that there are three “other” objects other than “person” and “background”, clustering is performed with the size and orientation of each motion vector Mv_B (Bx, By), As shown in FIG. 7B, the motion vector candidate cluster representing “person” is classified as MVset1, the motion vector candidate cluster representing “background” is classified as MVset2, and the vector candidate cluster MVset3 representing “other”. be able to.
以上の処理によりk個の動きベクトル候補クラスタの決定処理を収束させることができるので、これにより、全ての動きベクトルMv_B(Bx,By)がk個の動きベクトル候補クラスタへと割り付けることができる。 Since the determination processing of k motion vector candidate clusters can be converged by the above processing, all motion vectors Mv_B (Bx, By) can be assigned to k motion vector candidate clusters.
ステップS5にて、符号化装置1の広領域・高速動き判定部24は、フレーム画像F(t)について、フレーム内の動領域が支配的であり、且つフレーム間の動き速度が大きいフレームであるか否かを判断し、肯定的であれば広領域・高速動きのフレーム画像(例えば、高速動きシーン)であると判定してステップS6に進み、否定的であれば広領域・高速動きのフレーム画像ではないと判定してステップS7に進む。
In step S5, the wide region / high-speed
例えば、k個の動きベクトル候補クラスタの中で、割り付けられた動きベクトルMv_B(Bx,By)の数が規定数よりも多く(全動きベクトルに対する割合として規定数よりも多く)、且つその動きベクトル値も規定値より大きい候補を、動領域が支配的且つその動き速度が大きいフレームであると判断する。具体例としては、全ての動きベクトルMv_B(Bx,By)の1/4以上の割り付けがあり、且つ動き速度が[フレーム画像F(t)の水平解像度/フレームレート]以上であれば、該当するフレーム画像F(t)は動領域が支配的且つその動き速度が大きいフレームであると判断する。これは、例えば水平解像度7680画素でフレームレート60Hzのスーパーハイビジョン画面の動画像信号においては、1秒間で画面を横切る動き速度として128画素/フレームに相当する。広領域・高速動き判定部24は、この判定結果を、スライスタイプを表す補助情報として符号化器3に送出する。
For example, among k motion vector candidate clusters, the number of allocated motion vectors Mv_B (Bx, By) is larger than a prescribed number (more than the prescribed number as a ratio to all motion vectors), and the motion vector A candidate whose value is larger than a specified value is determined to be a frame in which the moving area is dominant and the moving speed is high. As a specific example, if all the motion vectors Mv_B (Bx, By) are assigned at least 1/4 and the motion speed is equal to or higher than [the horizontal resolution / frame rate of the frame image F (t)], it corresponds. The frame image F (t) is determined to be a frame in which the moving area is dominant and the moving speed is high. For example, in a moving image signal of a super high-definition screen having a horizontal resolution of 7680 pixels and a frame rate of 60 Hz, this corresponds to 128 pixels / frame as a moving speed across the screen in one second. The wide area / high-speed
ステップS6にて、符号化装置1の広領域・高速動き判定部24は、当該肯定的な判定結果を、スライスタイプを表す補助情報として、当該符号化方式に関わらず、スライスタイプとして強制的にIスライス・ピクチャとして処理すべき旨を示すIスライス・ピクチャフラグを有効に設定する。
In step S6, the wide area / high-speed
一方、ステップS7にて、符号化装置1の広領域・高速動き判定部24は、当該否定的な判定結果を、スライスタイプを表す補助情報として、当該符号化方式に従って処理すべく、スライスタイプとして強制的にIスライス・ピクチャとして処理すべきではない旨を示すIスライス・ピクチャフラグを無効に設定する。
On the other hand, in step S7, the wide area / high-speed
尚、この強制するIスライス・ピクチャ処理(以下、「IFスライス・ピクチャ」と称する)について、通常であれば、符号化ビットレートが決まっているためレート制御を行う必要があるが、該当するフレーム画像F(t)は動きボケを多く含むと判断されるため、IFスライス・ピクチャのレートを低くしても画像劣化の問題は生じない。 For this forced I-slice / picture processing (hereinafter referred to as “IF slice / picture”), it is necessary to control the rate because the encoding bit rate is determined normally. Since it is determined that the image F (t) includes a lot of motion blur, there is no problem of image degradation even if the rate of the IF slice picture is lowered.
例えば、Closed GOP=15の場合、GOPの最初に挿入されるIスライス・ピクチャのbit数に対して、P,Bスライス・ピクチャのbit数は約1/10程度である。ここで、IFスライス・ピクチャを、Iスライス・ピクチャの1/5程度となるように設定してレート制御を行うと、いわゆるイントラフリッカ等が目立たずに良好な画像結果が得られる。もっとも、IFスライス/ピクチャは連続する可能性が高い。 For example, when Closed GOP = 15, the number of P and B slice pictures is about 1/10 of the number of I slice pictures inserted at the beginning of the GOP. Here, when the IF slice picture is set to be about 1/5 of the I slice picture and the rate control is performed, a so-called intra flicker or the like is not conspicuous and a good image result is obtained. However, IF slices / pictures are likely to be continuous.
最終的に、ステップS8にて、符号化装置1の符号化器3は、フレーム画像F(t)について、広領域・高速動きのフレーム画像であるか否かを表す補助情報を参照して所定の動画像の符号化方式(例えば、H.264,MPEG−2)に基づく符号化を施す。
Finally, in step S8, the
このように、本実施例の符号化装置及び復号装置によれば、比較的大きなブロックサイズで、且つ大きな動き探索範囲で動き検出を行い、この動きベクトルをクラスタリングし、動領域が支配的であり、且つ動き速度が大きいか否かを判別し、動き速度が大きいと判断した場合には、フレーム内符号化を行う旨の制御指示を補助情報として送出するため、例えば広視野の超高精細動画像で問題を生じやすい高速動きシーンにおける画質劣化を防ぐことができ、簡便且つ効果が高い符号化技術を提供することができる。 As described above, according to the encoding device and the decoding device of the present embodiment, motion detection is performed with a relatively large block size and a large motion search range, and the motion vectors are clustered, and the motion region is dominant. In addition, it is determined whether or not the motion speed is high, and if it is determined that the motion speed is high, a control instruction for performing intra-frame encoding is transmitted as auxiliary information, for example, a super-high definition video with a wide field of view. It is possible to prevent image quality deterioration in a high-speed motion scene that is likely to cause a problem with an image, and to provide a simple and highly effective encoding technique.
尚、本発明は、フレーム内で動領域が支配的であり、且つフレーム間の動き速度が大きいフレームを探索するものであり、本探索は、H.264(MPEG−4 AVC)やMPEG−2のブロックマッチング処理内で行ってもよい。ただし、これらの符号化方式で用いるものよりも大きなブロックサイズ且つ大きな動き探索範囲を採用することで、より確実に高速動きシーン又はパンフレームを判別することができるようになる。 The present invention searches for a frame in which the motion region is dominant in the frame and the motion speed between the frames is large. It may be performed within the block matching process of H.264 (MPEG-4 AVC) or MPEG-2. However, by adopting a larger block size and a larger motion search range than those used in these encoding methods, it becomes possible to more reliably discriminate a high-speed motion scene or pan frame.
尚、本実施例に係る符号化装置1及び復号装置4の各々は、コンピュータとして構成することができる。これらの装置の各機能を実現するためのプログラムはコンピュータの記憶部に記憶しておき、中央演算処理装置(CPU)によって適宜プログラムを読み出して実行することにより、符号化装置1及び復号装置4の機能を実現させることができる。
Each of the
同様に、本実施例に係る符号化前処理装置として機能する高速動きシーン判定器2も、コンピュータとして構成することができる。高速動きシーン判定器2の各機能を実現するためのプログラムはコンピュータの記憶部に記憶しておき、中央演算処理装置(CPU)によって適宜プログラムを読み出して実行することにより、符号化前処理装置の機能を実現させることができる。 Similarly, the high-speed motion scene determination unit 2 that functions as an encoding preprocessing device according to the present embodiment can also be configured as a computer. A program for realizing each function of the high-speed motion scene determination unit 2 is stored in a storage unit of a computer, and the program is appropriately read out and executed by a central processing unit (CPU), so that Functions can be realized.
上記の実施例では、動画像の1フレーム画像を代表的に説明したが、本発明は、Motion JPEGのような圧縮にも適用できる。更に、符号化装置1が、それぞれ高速動きシーン判定器2を備えるとして説明したが、高速動きシーン判定器2を個別の装置として、並びに高速動きシーン判定器2及び符号化器3を別個の装置として構成することができる。従って、本発明は、上述の実施例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。
In the above embodiment, one frame image of a moving image has been representatively described, but the present invention can also be applied to compression such as Motion JPEG. Further, the
本発明によれば、広視野の超高精細動画像であるスーパーハイビジョン画面用の超高精細動画像信号において従来の動画像システムより高確率で発生する高速動きシーンの動画像符号化における問題を比較的簡単な方法で解決することが可能であるので、将来のスーパーハイビジョンだけではなく、現在のハイビジョンでも同様の問題が発生しがちなサッカーやバスケットボール中継等の高速パンなどの符号化技術の用途に有用である。 According to the present invention, there is a problem in moving image coding of a high-speed motion scene that occurs with a higher probability than a conventional moving image system in an ultra-high-definition moving image signal for a super high-definition screen that is an ultra-high-definition moving image with a wide field of view. Because it can be solved by a relatively simple method, the use of coding technology such as high-speed panning such as soccer and basketball broadcasts, where similar problems are likely to occur not only in future Super Hi-Vision but also in current Hi-Vision Useful for.
1 符号化装置
2 高速動きシーン判定器
3 符号化器
4 復号装置
21 ブロック分割部
22 動き探索処理部
23 動きベクトルクラスタリング処理部
24 広領域・高速動き判定部
DESCRIPTION OF
Claims (9)
動画像フレーム列内の或るフレーム画像について所定のブロックサイズで複数の画素ブロックに分割するブロック分割部と、
当該画像フレーム列内の前記フレーム画像とは異なる別フレーム画像を探索範囲として、前記画素ブロックの各々における動きベクトルを算出する動き探索処理部と、
算出した全ての動きベクトルについて、所定数の動きベクトル候補クラスタとして識別可能に分類するクラスタリングを行うとともに、当該画像フレーム間の動き速度を算出する動きベクトルクラスタリング処理部と、
前記所定数の動きベクトル候補クラスタの各動きベクトルから、広領域・高速動きのフレームであるか否かを判定し、広領域・高速動きのフレームであると判定した場合に、前記符号化方式に関わらず、前記フレーム画像を、強制的にフレーム内符号化を施すべきフレームとして決定する広領域・高速動き判定部とを備え、
前記広領域・高速動き判定部は、前記所定数の動きベクトル候補クラスタの中で、割り付けられた動きベクトルの数が全動きベクトルに対する割合として規定される数よりも多く、且つ該動きベクトルの値が規定値よりも大きい場合に、広領域で高速な動きを有するフレームであると判定することを特徴とする符号化前処理装置。 An encoding pre-processing device that performs pre-processing to adaptively encode a moving image in a motion scene by an encoding method using intra-frame encoding processing and inter-frame encoding processing,
A block dividing unit for dividing a certain frame image in the moving image frame sequence into a plurality of pixel blocks with a predetermined block size;
A motion search processing unit that calculates a motion vector in each of the pixel blocks using a different frame image different from the frame image in the image frame sequence as a search range;
Performing clustering to classify all the calculated motion vectors so as to be identifiable as a predetermined number of motion vector candidate clusters, and a motion vector clustering processing unit for calculating a motion speed between the image frames,
From each motion vector of the predetermined number of motion vector candidate clusters, it is determined whether or not the frame is a wide area / high speed motion frame. Regardless, the frame image includes a wide area and high-speed motion determination unit that determines the frame image as a frame to be subjected to the intra-frame encoding.
The wide area / high-speed motion determination unit is configured such that, among the predetermined number of motion vector candidate clusters, the number of allocated motion vectors is greater than a number defined as a ratio to all motion vectors, and the value of the motion vector An encoding pre-processing apparatus that determines that the frame has a high-speed motion in a wide area when is larger than a specified value.
前記動画像フレーム列について、該符号化前処理装置によって決定された広領域・高速動きのフレームであるか否かを示す付属情報に従って前記符号化方式の符号化を施す符号化器と、
を備えることを特徴とする符号化装置。 An encoding pre-processing device according to any one of claims 1 to 5;
An encoder that performs encoding of the encoding scheme in accordance with attached information indicating whether or not the moving image frame sequence is a wide-area high-speed motion frame determined by the encoding pre-processing device;
An encoding device comprising:
動画像フレーム列内の或るフレーム画像について所定のブロックサイズで複数の画素ブロックに分割するステップと、
当該画像フレーム列内の前記フレーム画像とは異なる別フレーム画像を探索範囲として、前記画素ブロックの各々における動きベクトルを算出するステップと、
算出した全ての動きベクトルについて、所定数の動きベクトル候補クラスタとして識別可能に分類するクラスタリングを行うとともに、当該画像フレーム間の動き速度を算出するステップと、
前記所定数の動きベクトル候補クラスタの各動きベクトルから、広領域・高速動きのフレームであるか否かを判定し、広領域・高速動きのフレームであると判定した場合に、前記符号化方式に関わらず、前記フレーム画像を、強制的にフレーム内符号化を施すべきフレームとして決定するステップと、
を実行させるためのプログラム。 In a computer configured as a pre-encoding processing device that performs pre-processing to adaptively encode a moving image in a motion scene with an encoding method using intra-frame encoding processing and inter-frame encoding processing,
Dividing a certain frame image in the moving image frame sequence into a plurality of pixel blocks with a predetermined block size;
Calculating a motion vector in each of the pixel blocks using a different frame image different from the frame image in the image frame sequence as a search range;
Performing clustering to classify all the calculated motion vectors so as to be identifiable as a predetermined number of motion vector candidate clusters, and calculating a motion speed between the image frames;
From each motion vector of the predetermined number of motion vector candidate clusters, it is determined whether or not the frame is a wide area / high speed motion frame. Regardless, the step of determining the frame image as a frame to be forcibly intra-frame encoded,
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009147860A JP5173946B2 (en) | 2009-06-22 | 2009-06-22 | Encoding preprocessing device, encoding device, decoding device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009147860A JP5173946B2 (en) | 2009-06-22 | 2009-06-22 | Encoding preprocessing device, encoding device, decoding device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011004342A true JP2011004342A (en) | 2011-01-06 |
JP5173946B2 JP5173946B2 (en) | 2013-04-03 |
Family
ID=43561877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009147860A Expired - Fee Related JP5173946B2 (en) | 2009-06-22 | 2009-06-22 | Encoding preprocessing device, encoding device, decoding device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5173946B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109600600A (en) * | 2018-10-31 | 2019-04-09 | 万维科研有限公司 | It is related to the storage method and format of encoder, coding method and three layers of expression formula that depth map is converted |
CN111680618A (en) * | 2020-06-04 | 2020-09-18 | 西安邮电大学 | Dynamic gesture recognition method based on video data characteristics, storage medium and device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004214740A (en) * | 2002-12-26 | 2004-07-29 | Canon Inc | Moving picture encoder |
JP2008079238A (en) * | 2006-09-25 | 2008-04-03 | Nikon Corp | Image compression method and apparatus, electronic camera, and program |
JP2008131321A (en) * | 2006-11-21 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | Video transmission method, video transmission program and computer readable recording medium with the program recorded thereon |
-
2009
- 2009-06-22 JP JP2009147860A patent/JP5173946B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004214740A (en) * | 2002-12-26 | 2004-07-29 | Canon Inc | Moving picture encoder |
JP2008079238A (en) * | 2006-09-25 | 2008-04-03 | Nikon Corp | Image compression method and apparatus, electronic camera, and program |
JP2008131321A (en) * | 2006-11-21 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | Video transmission method, video transmission program and computer readable recording medium with the program recorded thereon |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109600600A (en) * | 2018-10-31 | 2019-04-09 | 万维科研有限公司 | It is related to the storage method and format of encoder, coding method and three layers of expression formula that depth map is converted |
CN109600600B (en) * | 2018-10-31 | 2020-11-03 | 万维科研有限公司 | Encoder, encoding method, and storage method and format of three-layer expression relating to depth map conversion |
CN111680618A (en) * | 2020-06-04 | 2020-09-18 | 西安邮电大学 | Dynamic gesture recognition method based on video data characteristics, storage medium and device |
CN111680618B (en) * | 2020-06-04 | 2023-04-18 | 西安邮电大学 | Dynamic gesture recognition method based on video data characteristics, storage medium and device |
Also Published As
Publication number | Publication date |
---|---|
JP5173946B2 (en) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11902536B2 (en) | Method and apparatus for processing video signal based on inter prediction | |
US8681866B1 (en) | Method and apparatus for encoding video by downsampling frame resolution | |
US20130170557A1 (en) | Method and System for Video Coding with Noise Filtering | |
JP4764807B2 (en) | Motion vector detection apparatus and motion vector detection method | |
US9560379B2 (en) | Inter-prediction method and video encoding/decoding method using the inter-prediction method | |
JP2022517134A (en) | How and devices to selectively apply bidirectional optical flow and decoder-side motion vector correction for video coding | |
KR20020001331A (en) | Apparatus for stabilizing digital video | |
US8780976B1 (en) | Method and apparatus for encoding video using granular downsampling of frame resolution | |
CN107852500B (en) | Motion vector field encoding method and decoding method, encoding and decoding device | |
JP2013504256A (en) | Scene switching detection | |
KR20130130695A (en) | Method and system for encoding video frames using a plurality of processors | |
JP2012034225A (en) | Motion vector detection device, motion vector detection method and computer program | |
US20210227216A1 (en) | Template refined bi-prediction for video coding using anchor point | |
JP5173946B2 (en) | Encoding preprocessing device, encoding device, decoding device, and program | |
CN114157870A (en) | Encoding method, medium, and electronic device | |
EP3547684A1 (en) | Method, device and system for method of encoding a sequence of frames in a video stream | |
US20040141555A1 (en) | Method of motion vector prediction and system thereof | |
CN110839157B (en) | Image processing method and device | |
CN112534809B (en) | Selective template matching in video coding | |
JP2010258576A (en) | Scene change detector, and video recorder | |
JP4469904B2 (en) | Moving picture decoding apparatus, moving picture decoding method, and storage medium storing moving picture decoding program | |
US20130251045A1 (en) | Method and device for determining a motion vector for a current block of a current video frame | |
US20180109791A1 (en) | A method and a module for self-adaptive motion estimation | |
CN112437312B (en) | Video decoding method, encoding method, device, equipment and storage medium | |
CN114040209A (en) | Motion estimation method, motion estimation device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5173946 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |