JP2014230031A - Image encoding device and image encoding program - Google Patents
Image encoding device and image encoding program Download PDFInfo
- Publication number
- JP2014230031A JP2014230031A JP2013107253A JP2013107253A JP2014230031A JP 2014230031 A JP2014230031 A JP 2014230031A JP 2013107253 A JP2013107253 A JP 2013107253A JP 2013107253 A JP2013107253 A JP 2013107253A JP 2014230031 A JP2014230031 A JP 2014230031A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- unit
- image
- parameter
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、画像符号化装置、及び画像符号化プログラムに関する。 The present invention relates to an image encoding device and an image encoding program.
現在、超高精細の動画像の伝送、蓄積が一般化している。たとえば、非圧縮のHDTVの情報量は1Gbp/secを超える。このため、高精細の動画像を効率的に圧縮する技術が必要とされている。動画データの符号化標準技術としては、MPEG 2、MPEG 4、H.264/AVC(Advanced Video Coding)、H.265/HEVC(High Efficiency Video Coding)などが挙げられる。 Currently, transmission and storage of ultra-high-definition moving images are common. For example, the information amount of uncompressed HDTV exceeds 1 Gbp / sec. For this reason, a technique for efficiently compressing a high-definition moving image is required. MPEG2, MPEG4, H.264, and the like are standard coding techniques for moving image data. H.264 / AVC (Advanced Video Coding), H.264. H.265 / HEVC (High Efficiency Video Coding).
H.265/HEVCでは、従来の符号化技術のように画面を左上から符号化単位であるブロック状に単純に分割するのではなく、新たに階層的な分割構造(CTU:Coding Tree Unit)を採用し、複数階層のブロック分割を可能とする。また、複数のブロックに分割された符号化単位は、CU(Coding Unit)や符号化ブロックとも称す。H.265/HEVCでは、64×64、32×32、16×16、8×8などのサイズに画像を分割して、符号化を行うことができる。 H. H.265 / HEVC does not simply divide the screen from the upper left into blocks, which are coding units, as in the conventional coding technology, but newly adopts a hierarchical division structure (CTU: Coding Tree Unit). The block division of a plurality of hierarchies is possible. A coding unit divided into a plurality of blocks is also referred to as a CU (Coding Unit) or a coding block. H. In H.265 / HEVC, an image can be divided into 64 × 64, 32 × 32, 16 × 16, 8 × 8, and the like and encoded.
また、H.265/HEVCでは、予測誤差信号を効率的に表現するため、CUを階層分割し、変換単位に分けることができる。変換単位は、TU(Transform Unit)や変換ブロックとも称す。 H. In H.265 / HEVC, in order to efficiently express a prediction error signal, a CU can be divided into hierarchies and divided into conversion units. The transform unit is also referred to as a TU (Transform Unit) or a transform block.
図1(A)はCUを示す。図1(b)はTUを示す。図1に示すように、例えば32×32のCUに対し、階層分割0回のTUは32×32のCUと同じブロックであり、階層分割1回のTUは、16×16に分割されたブロックである。また、階層分割2回のTUは、8×8に分割されたブロックである。 FIG. 1A shows a CU. FIG. 1B shows a TU. As shown in FIG. 1, for example, for a 32 × 32 CU, a TU with zero layer division is the same block as a 32 × 32 CU, and a TU with one layer division is a block divided into 16 × 16 It is. In addition, a TU with two hierarchical divisions is a block divided into 8 × 8.
なお、TUは、CUのサイズに応じて階層分割されるので、各階層におけるTUのサイズはCUのサイズに応じてそれぞれ異なる。 Since TUs are hierarchically divided according to the size of CUs, the TU sizes in each layer are different depending on the size of CUs.
図1(C)は、予測単位を示す。H.265/HEVCでは、CUを複数種類の矩形領域である予測単位に分割し、それぞれの予測単位で予測処理が行われる。この予測単位は、PU(Prediction Unit)や予測ブロックとも称す。PUの分割形状は、8種類である。 FIG. 1C shows a prediction unit. H. In H.265 / HEVC, a CU is divided into prediction units that are a plurality of types of rectangular areas, and prediction processing is performed in each prediction unit. This prediction unit is also referred to as a PU (Prediction Unit) or a prediction block. There are eight types of PU division shapes.
ここで分割されたブロックに対し、次に予測符号化が行われる。画面内符号化(イントラ符号化)は、画面内の空間的な信号予測を行って画像を符号化する。この技術は、画面内予測(イントラ予測)とも称す。また、画面間予測(インター符号化)は、異なるフレーム間で類似した領域を探索し、予測に用いて画像を符号化する。この技術は、動き補償予測(インター予測)とも称す。 Next, predictive coding is performed on the divided blocks. In-screen coding (intra coding) encodes an image by performing spatial signal prediction within the screen. This technique is also referred to as intra prediction (intra prediction). Also, inter-screen prediction (inter-coding) searches for similar regions between different frames and encodes an image for prediction. This technique is also referred to as motion compensation prediction (inter prediction).
たとえば、H.265/HEVCでは、上述の多様な分割形状をRD(Rate-Distortion)最適化といった手法によって決定する。 For example, H.M. In H.265 / HEVC, the above-described various division shapes are determined by a technique such as RD (Rate-Distortion) optimization.
RD最適化とは、ビットレートと歪の関係であるRD(Rate-Distortion)コストを算出し、異なる符号化パラメータで算出したRDコスト同士の比較を行い、目標ビットレートに最適な符号化パラメータの組合せを求める最適化手法である。 RD optimization is to calculate the RD (Rate-Distortion) cost, which is the relationship between bit rate and distortion, compare RD costs calculated with different encoding parameters, and determine the optimal encoding parameter for the target bit rate. This is an optimization method for obtaining a combination.
以下RD最適化による具体的なCUサイズ、PUサイズの選択手法を説明する。 A specific CU size and PU size selection method based on RD optimization will be described below.
まず、符号化システムは、最上位階層のCUを8種類のPU形状に分割し、イントラ予測、インター予測のそれぞれの場合のRDコストを計算し、PU形状と予測手法、予測モードの最適な組合せを求める。 First, the encoding system divides the CU of the highest hierarchy into 8 types of PU shapes, calculates the RD cost in each case of intra prediction and inter prediction, and optimal combinations of PU shapes, prediction methods, and prediction modes Ask for.
符号化システムは、続いてCUを4分割し、下位階層の4つのCU全てについて同様にRDコストを算出し、PU形状と予測手法、予測モードの最適な組合せを求める。以上の処理を再帰的に行い、最も深いCUまで、PU形状と予測手法、予測モードの最適な組合せを求める。 Subsequently, the encoding system divides the CU into four, calculates RD costs in the same manner for all four CUs in the lower layer, and obtains an optimal combination of the PU shape, the prediction method, and the prediction mode. The above processing is performed recursively, and the optimum combination of PU shape, prediction method, and prediction mode is obtained up to the deepest CU.
最も深い階層まで、最適な組合せを求めることができたら、同一階層の4つのCUのRDコストを合計し、一つ上位階層のCUとRDコストを比較する。下位階層のRDコストの合計の方が大きい場合は分割しないこととし、一つ上位の階層で同様の処理を行う。
一方、下位階層のRDコストの合計の方が小さい場合には、該当するCUは分割することとし、次のCUで処理に移る。これら処理を最上階層まで繰り返し、CTU内のCU全てについて分割形状及び変換サイズを計算する(非特許文献1参照)。
If the optimal combination can be obtained up to the deepest hierarchy, the RD costs of four CUs in the same hierarchy are summed, and the CU and RD cost of one higher hierarchy are compared. If the total RD cost of the lower layer is larger, the division is not performed, and the same processing is performed on the upper layer.
On the other hand, when the total RD cost of the lower layer is smaller, the corresponding CU is divided, and the process proceeds to the next CU. These processes are repeated up to the highest layer, and the division shape and transform size are calculated for all CUs in the CTU (see Non-Patent Document 1).
このように、1つのCTU内全てのCUについて、各種ブロック分割形状を確定するのにRD最適化を用いる場合、符号化効率は高くなるものの、各種符号化パラメータ全ての組合せでRDコスト計算が必要となり、膨大な計算量となる。原画像の空間解像度が高い場合は、単一の符号化器での処理が間に合わないことがある。 As described above, when RD optimization is used to determine various block division shapes for all CUs in one CTU, although the encoding efficiency is high, RD cost calculation is required for all combinations of various encoding parameters. It becomes a huge amount of calculation. When the spatial resolution of the original image is high, processing with a single encoder may not be in time.
このため、原画像を空間的に複数に分割し、分割した数だけ符号化器を用意して並列な符号化処理を行う解決法が知られている。例えば、画像を8分割し、8台のエンコーダで並列処理を行う技術が報告されている(非特許文献2参照)。 For this reason, a solution is known in which an original image is spatially divided into a plurality of pieces, and an encoder is prepared for the number of divisions, and parallel coding processing is performed. For example, a technique for dividing an image into eight and performing parallel processing with eight encoders has been reported (see Non-Patent Document 2).
H.264/AVC及びH.265/HEVCは、基準となるサイズのブロックから階層的な分割を繰り返す。この場合、ブロックサイズ、分割形状、予測手法、予測モード等の符号化パラメータを求めるために、例えばRD最適化などを用いる。しかしながら、RD最適化は、全ての符号化パラメータの組合せでRDコストの計算を行う必要がある。上述のように、この処理は、膨大な計算量が必要となる。特に、空間解像度が高い画像に対しては、長時間の計算が必要となる。 H. H.264 / AVC and H.264. H.265 / HEVC repeats hierarchical division from a block having a reference size. In this case, for example, RD optimization or the like is used to obtain encoding parameters such as a block size, a division shape, a prediction method, and a prediction mode. However, in the RD optimization, it is necessary to calculate the RD cost for all combinations of encoding parameters. As described above, this processing requires a huge amount of calculation. In particular, a long time calculation is required for an image having a high spatial resolution.
また、計算を分散させるために空間的に画面分割を行い、複数の符号化装置を並列に用いる場合には、原画像の分割の数だけ符号化器が必要となる。加えて、複数の符号化器の同期処理など、複雑な構成が必要とされる。更に、複数の符号化器では、原則として別々に符号化処理が行われるため、分割境界における画質の劣化が生じる場合がある。 In addition, when the screen is spatially divided in order to distribute the calculation and a plurality of encoding devices are used in parallel, as many encoders as the number of divisions of the original image are required. In addition, a complicated configuration such as synchronization processing of a plurality of encoders is required. Furthermore, since a plurality of encoders perform encoding processing separately in principle, image quality may deteriorate at the division boundary.
そこで、本発明は、画像の符号化の処理において、符号化パラメータの決定に必要とされる計算量を減少させることを目的とする。 Accordingly, an object of the present invention is to reduce the amount of calculation required for determining the encoding parameter in the image encoding process.
本発明の一態様における画像符号化装置は、入力された動画像から情報量が削減された動画像を生成する、情報量削減部と、前記情報量が削減された動画像を符号化することによって、前記入力された動画像の符号化に用いられる符号化パラメータを推定する、符号化パラメータ推定部と、前記推定された符号化パラメータを基にして、前記入力された動画像の符号化を行う、符号化部と、を有する。 An image encoding device according to an aspect of the present invention encodes an information amount reducing unit that generates a moving image with a reduced amount of information from an input moving image, and the moving image with the reduced amount of information The encoding parameter estimation unit for estimating the encoding parameter used for encoding the input moving image, and the encoding of the input moving image based on the estimated encoding parameter And an encoding unit.
また、前記符号化部は、前記推定された符号化パラメータのうち,所定の符号化パラメータを、所定の範囲内で修正してもよい。 The encoding unit may correct a predetermined encoding parameter among the estimated encoding parameters within a predetermined range.
また、前記符号化パラメータ推定部は、前記入力された動画像と、前記情報量が削減された動画像との関係に基づいて、前記情報量が削減された動画像の符号化によって得られた符号化パラメータを、前記推定された符号化パラメータに変換する、パラメータ変換部、を有してもよい。 Further, the encoding parameter estimation unit is obtained by encoding the moving image with the reduced information amount based on the relationship between the input moving image and the moving image with the reduced information amount. You may have a parameter conversion part which converts an encoding parameter into the said estimated encoding parameter.
また、前記情報量削減部は、前記入力された動画像に含まれる複数のフレームの各々の画素数を削減する画素数削減部、前記フレームの画素のビット数を削減するビット数削減部、及び前記入力された動画像の単位時間当たりのフレーム数を削減するフレーム数削減部、のうち少なくとも1つを含んでもよい。 The information amount reduction unit includes a pixel number reduction unit that reduces the number of pixels of each of a plurality of frames included in the input moving image, a bit number reduction unit that reduces the number of bits of pixels in the frame, and It may include at least one of a frame number reduction unit that reduces the number of frames per unit time of the input moving image.
また、前記画素数削減部で、前記入力された動画像に含まれる複数のフレームの各々の画素数が削減された場合、前記符号化パラメータ推定部は、前記入力された動画像の所定のフレームにおける画素数と、画素数が削減された前記所定のフレームの画素数との比を用いて、前記推定された符号化パラメータのうち、ブロックの大きさ及び動きベクトルの長さを算出してもよい。
また、前記フレーム数削減部で、前記入力された動画像の単位時間当たりのフレーム数が削減された場合、前記符号化パラメータ推定部は、前記削減されたフレーム以外の複数のフレームから得られた前記推定された符号化パラメータを補間することにより、前記削減されたフレームに係る前記推定された符号化パラメータのうち、動きベクトルを算出してもよい。
In addition, when the number of pixels of each of the plurality of frames included in the input moving image is reduced by the pixel number reduction unit, the encoding parameter estimation unit is configured to perform a predetermined frame of the input moving image. Among the estimated encoding parameters, the block size and the motion vector length may be calculated using the ratio between the number of pixels in and the number of pixels in the predetermined frame with the number of pixels reduced. Good.
When the number of frames per unit time of the input moving image is reduced by the frame number reduction unit, the encoding parameter estimation unit is obtained from a plurality of frames other than the reduced frame. A motion vector may be calculated among the estimated encoding parameters related to the reduced frame by interpolating the estimated encoding parameters.
また、他の態様における画像符号化プログラムは、コンピュータを、上記のうちのいずれかの画像符号化装置として機能させる。 An image encoding program according to another aspect causes a computer to function as any one of the above image encoding apparatuses.
一側面において、本発明は、画像の符号化の処理において、符号化に必要とされる計算量を減少させることができる。 In one aspect, the present invention can reduce the amount of calculation required for encoding in the process of encoding an image.
以下、添付図面を参照しながら、実施例について詳細に説明する。なお、同様の構成要素については、異なる図において、同じ参照番号が付されている場合がある点に留意すべきである。 Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. It should be noted that similar components may be given the same reference numerals in different drawings.
[実施例]
実施例では、原画像(動画像)100を符号化部200が符号化し、ビットストリーム300を出力する際に、符号化部200での符号化に必要とされる計算量を減少させることができる。
[Example]
In the embodiment, when the
<構成の概要>
図2は、実施例の概要を示すブロック図である。画像符号化装置10は、符号化部200、情報量削減部400、及び符号化パラメータ推定部500を有する。各部についての概略を以下に説明する。
<Outline of configuration>
FIG. 2 is a block diagram showing an outline of the embodiment. The
符号化部200は、原画像100を符号化しビットストリーム300を出力する。本明細書では、符号化部200の符号化処理として、H.265/HEVCに準拠した符号化を例として符号化処理の説明を行うが、符号化部200が利用する符号化処理は、H.265/HEVCに限定されるものではない。
The
情報量削減部400は、例えば、画素数削減部410、ビット数削減部420、及びフレーム数削減部430のうち、少なくとも1つを有する。情報量削減部400は、原画像100の情報量を削減し、情報量が削減された画像412、及び情報量の削減処理として何が用いられたかを示す情報411を、符号化パラメータ推定部500に与える。
The information
画素数削減部410は、原画像100の画素数を削減することにより、縮小画像を生成することができる。
The pixel
図3は、図3(b)の原画の画素を1つ置きに間引き、図3(a)に示されるように1/2の縮小画像を形成した例を示している。例えば、画素を1つ置きに間引くことによって、縦横の画像のサイズは1/2となる。面積比は1/4となる(情報量も1/4となる)。原画像100のCU310は、1/2縮小画像におけるCU320に対応している。原画像100において、2Nの長さは、1/2縮小画像においては、Nの長さになる。また、CU310の面積の1/4が、CU320の面積となっている。なお、図3においては、CU、PUの分割形状が示されている。PUの分割線を321、322、311、312で示す。
FIG. 3 shows an example in which every other pixel of the original image in FIG. 3B is thinned out to form a 1/2 reduced image as shown in FIG. For example, by thinning out every other pixel, the size of the vertical and horizontal images is halved. The area ratio is 1/4 (the amount of information is also 1/4). The
図2に戻る。ビット数削減部420は、原画像100の各画素が持つ情報を削減する機能を有する。例えば、各画素が10bitの情報量を持つ場合には、下位の2ビットを切り捨てて、8ビットとする。この処理によって、原画像100よりも情報量が削減された画像412が得られる。
Returning to FIG. The bit
フレーム数削減部430は、原画像(動画像)100のフレーム数を削減する処理を施す。たとえば、フレーム数削減部430が、1つ置きにフレームを削減すると、原画像(動画像)100のフレームレートは、1/2に低減される。この処理によって、原画像(動画像)100の単位時間当たりの情報量を1/2に削減することができる。
The frame
なお、以上の説明は、一例であり、情報量を削減する割合は、上述の例に限られるものではない。 Note that the above description is an example, and the rate of reducing the amount of information is not limited to the above example.
符号化パラメータ推定部500は、パラメータ変換部511を含む。符号化パラメータ推定部500は、情報量削減部400から、情報量が削減された画像412を受け取る。符号化パラメータ推定部500は、受け取った画像を符号化する処理を行う。
The encoding
符号化パラメータ推定部500で処理される画像は、原画像100よりも情報量が削減されているため、原画像100を符号化するよりも、少ない計算量で画像を符号化することができる。そして、符号化パラメータ推定部500は、画像の符号化において得られた符号化パラメータを取得することができる。
Since the image processed by the encoding
符号化パラメータ推定部500で取得される符号化パラメータとしては、例えば、以下のものが挙げられる。
・ブロック分割形状(CU、TU、PU)
・ブロック分割階層(CU、TU)
・ブロックサイズ(CU、TU、PU)
・予測手法(例えば、インター予測、イントラ予測)
・予測モード(動きベクトル値、予測方向)
・量子化パラメータ(Qp)
以上の符号化パラメータは、情報量が削減された画像412に基づいて求められたものであるが、原画像100と、情報が削減された画像412とは、極めて類似した画像であるため、情報量が削減された画像412に基づいて求められた符号化パラメータを用いて、原画像100を符号化した際に得られる符号化パラメータを、十分な確度で推定することができる。
Examples of the encoding parameters acquired by the encoding
・ Block division shape (CU, TU, PU)
・ Block division hierarchy (CU, TU)
・ Block size (CU, TU, PU)
・ Prediction methods (for example, inter prediction, intra prediction)
-Prediction mode (motion vector value, prediction direction)
・ Quantization parameter (Qp)
The above encoding parameters are obtained based on the
なお、原画像100と、情報量が削減された画像412とは、画像の大きさ、フレームレートなどに差異がある場合があるため、その差異を考慮して、符号化パラメータの種類に応じて、情報量が削減された画像412に基づいて求められた符号化パラメータを適切に変換することが望ましい。
Note that the
パラメータ変換部511は、符号化パラメータの種類に応じて、情報量が削減された画像412に基づいて求められた符号化パラメータを適切に変換する処理を行う。この変換された符号化パラメータを、推定符号化パラメータ600と呼ぶ。推定符号化パラメータ600は、符号化部200に与えられる。
The
符号化部200は、推定符号化パラメータ600を用いて、原画像100の符号化を行い、ビットストリーム300を出力する。
The
以下に、パラメータ変換部511の主要な変換処理を説明する。
(1)原画像100の画素数を削減し、短辺が1/Nの縮小画像を符号化パラメータ推定部で処理した場合。
The main conversion process of the
(1) When the number of pixels of the
この場合には、ブロック分割形状、ブロック分割階層に係るブロックサイズについては、N倍することで、符号化パラメータを推定できる。なお、H.265/HEVCなどのブロックのサイズが2のべき乗で離散的に規定されている標準では、Nの値も2のべき乗とすることが望ましい。 In this case, the encoding parameter can be estimated by multiplying the block division shape and the block size related to the block division hierarchy by N times. H. In a standard in which the block size, such as H.265 / HEVC, is specified discretely by a power of 2, it is desirable that the value of N is also a power of 2.
また、たとえば、上述のN倍したサイズがCUサイズの規格上の上限サイズ(たとえばH.265/HEVCでは64×64)を超える場合には、この上限サイズ(例えばH.265/HEVCでは64×64)を推定されたCUサイズとする。なお、このような状況が発生する場合には、原画像(動画像)100のうち、該当するCUの画像が静止している、もしくは予測処理が容易であると判断される。このため、上述のような処理を実行し、上限サイズのブロックを用いて原画像を符号化しても、確度の高いパラメータで符号化することができると判断できる。 Further, for example, when the above-mentioned size multiplied by N exceeds the upper limit size (for example, 64 × 64 in H.265 / HEVC) of the CU size, this upper limit size (for example, 64 × in H.265 / HEVC). 64) is the estimated CU size. When such a situation occurs, it is determined that the image of the corresponding CU in the original image (moving image) 100 is still or the prediction process is easy. For this reason, even if the above processing is executed and the original image is encoded using the block of the upper limit size, it can be determined that the encoding can be performed with the parameter with high accuracy.
なお、上記のようにN倍したブロックサイズが、規格上の上限サイズを超えないよう、符号化パラメータ推定部500の符号化におけるブロックサイズの上限サイズを、規格上の上限サイズの1/Nに予め制限しておいてもよい。
Note that the block size upper limit size in encoding of the encoding
予測手法は、符号化パラメータ推定部500の予測手法と同じ手法を、符号化部200でも用いることができる。例えば、符号化パラメータ推定部500の予測手法がイントラ予測であれば(例えば図3におけるブロックa2)、符号化部200の予測手法もイントラ予測を用いればよい(例えば図3におけるブロックa1)。
As the prediction method, the same method as the prediction method of the encoding
予測モードについては、以下のように処理する。符号化パラメータ推定部500の予測手法がイントラ予測である場合は、予測モードとしての予測方向は、符号化部200においても同じ方向を用いればよい。符号化パラメータ推定部500の予測手法がインター予測であった場合には、符号化部200に対しては、符号化パラメータ推定部500で得られた予測ベクトルと同じ方向とし、ベクトルの距離はN倍に変換すればよい。
The prediction mode is processed as follows. When the prediction method of the encoding
図3(b)におけるブロック分割は、図3(a)に示すように、N=2の場合において、符号化パラメータ推定部500で得られたCU又はPUの分割形状を、符号化部200で用いるために、パラメータ変換部511で変換した結果の一例を示している。
(2)原画像(動画像)100のフレーム数を削減し、1/Nのフレームレートの動画像を符号化パラメータ推定部で処理した場合。
As shown in FIG. 3A, the block division in FIG. 3B is performed by using the
(2) When the number of frames of the original image (moving image) 100 is reduced and a moving image having a frame rate of 1 / N is processed by the coding parameter estimation unit.
この場合には、削除されていないフレームに関する符号化パラメータ推定部500の符号化パラメータは、符号化部200においてそのまま利用することができる。削除されたフレームについては、符号化パラメータ推定部500において符号化パラメータが取得されていないため、例えば、過去に取得された2つの時刻のフレームによって得られた符号化パラメータから、削除された時刻の符号化パラメータを補間(外挿)によって予測することができる。このため、このフレーム削減による符号化パラメータの推定方法は、画像の動きが少ないような入力動画像に適している。
In this case, the encoding parameter of the encoding
フレームを1つ置きに削除し、原画像(動画像)100のフレームレートを1/2に削減して、符号化パラメータ推定部500において、符号化パラメータを推定する具体例を以下に示す。そして、フレーム番号2、3、4、5のうち、フレーム番号3及び5が削除され、既にフレーム番号2及び4の符号化パラメータが符号化パラメータ推定部500において取得済であり、現在処理フレームのフレーム番号が5である場合を想定する。
A specific example in which every other frame is deleted, the frame rate of the original image (moving image) 100 is reduced to 1/2, and the encoding
この場合、予測手法がインター予測である場合、フレーム5のブロック分割は、例えば直前のフレーム4のブロック分割を採用すればよい。そして、フレーム5の注目するブロックにおいて、対応するフレーム2のブロック分割と、フレーム4のブロック分割が同じである場合、注目するブロックのフレーム番号2の動きベクトルがα2、フレーム番号4の動きベクトルがα4とすると、削除された現在処理フレーム5の注目するブロックの動きベクトルα5は、
α5=aα4−bα2(ただしa, bは処理フレームからの時間距離に応じた任意の係数)
として推定できる。
In this case, when the prediction method is inter prediction, for example, the block division of the immediately preceding frame 4 may be adopted as the block division of the frame 5. If the block division of the corresponding frame 2 and the block division of the frame 4 are the same in the block of interest in the frame 5, the motion vector of the frame number 2 of the block of interest is α2, and the motion vector of the frame number 4 is Assuming α4, the motion vector α5 of the block of interest in the deleted current processing frame 5 is
α5 = aα4-bα2 (where a and b are arbitrary coefficients corresponding to the time distance from the processing frame)
Can be estimated.
なお、フレーム2と、4とで、ブロック分割が異なる場合には、フレーム5で注目しているブロックに、空間的に近い、フレーム2及びフレーム4のブロックの動きベクトルから、上述の補間(外挿)を行ってもよい。或いは、フレーム4の対応するブロックの動きベクトルをそのまま採用してもよい。 If the block division is different between frames 2 and 4, the above interpolation (outside) is performed from the motion vectors of the blocks of frames 2 and 4 that are spatially close to the block of interest in frame 5. Insertion) may be performed. Alternatively, the motion vector of the corresponding block of the frame 4 may be employed as it is.
同様に、予測手法がイントラ予測である場合も、同様の補間(外挿)を行う。なお、規格においてイントラ予測の予測方向については、所定のパターンが定められている(H.265/HEVCの場合には34方向)。このため、外挿によって求めたイントラ予測の方向に一番近い、所定のイントラ予測方向のパターンを、特定すればよい。
(3)ビット数の削減処理のみが行われた場合には、符号化パラメータ推定部500で得られた符号化パラメータを、符号化部200でそのまま用いることができる。なお、このビット数削減による場合は、計算に用いるリソース(メモリ)を減らす効果が期待できる。
Similarly, when the prediction method is intra prediction, the same interpolation (extrapolation) is performed. In the standard, a predetermined pattern is defined for the prediction direction of intra prediction (34 directions in the case of H.265 / HEVC). For this reason, a pattern of a predetermined intra prediction direction that is closest to the direction of intra prediction obtained by extrapolation may be specified.
(3) When only the bit number reduction process is performed, the encoding parameter obtained by the encoding
以上、(1)ないし(3)に場合分けして、パラメータ変換部511の具体的な処理を説明した。上記以外の符号化パラメータについては、符号化パラメータ推定部500で得られた推定符号化パラメータ600を、符号化部200においてそのまま用いることができる。なお、情報量削減部400において、情報量の削減方式としていずれの方式を用いるかは、外部から指定するか、または各削減方式を試行後に、システム全体の処理能力を考慮して、符号化パラメータ推定部500、および符号化部200での処理量の削減効果を基準に選択されるようにしてもよい。
The specific processing of the
なお、図2における画像符号化装置10は、ハードウェアとして構成することができる。また、コンピュータを動作させるプログラムとして実現することもできる。
Note that the
符号化パラメータ推定部500、及び符号化部200の両者は、同様の符号化処理を行うため、両者を同一のハードウェアによって兼用してもよい。この場合には、1回目の処理において、情報量が削減された画像412を処理して推定符号化パラメータ600を求め、2回目の処理において、推定符号化パラメータ600を用いて、原画像の符号化を行ってもよい。また、画像符号化装置10がコンピュータとプログラムにより実現されている場合においても、1つのコンピュータが、符号化パラメータ推定部500、及び符号化部200の両者の処理を時間的に直列に処理してもよい。
Since both the encoding
なお、符号化パラメータ推定部500、及び符号化部200が、別個のハードウェアで実現される場合には、両者はパイプライン的に処理を実行することができる。
In addition, when the encoding
<詳細な構成>
図4は、図2に示した画像符号化装置10を、より詳細に記載したブロック図である。図2と同じ機能を有する要素には同じ符号が付されている。図2において既に説明した要素については、以下の説明において省略する。また、符号化パラメータ推定部500と、符号化部200とは、パラメータ変換部511を除いて、同じ構成要素を用いることができる。このため、以下の説明では、符号化部200の構成要素について説明を行う。
<Detailed configuration>
FIG. 4 is a block diagram showing the
符号化制御部201は、符号化パラメータ推定部500からの推定符号化パラメータ600を受け取り、原画像100の符号化に用いる。あるいは、符号化制御部201は、一部のパラメータについてさらにRD最適化などを行い、適切な符号化パラメータを求める。
The
画面分割部220は、ブロック分割を行い、ブロック分割の境界情報をループフィルタ部290に出力する。
The
予測誤差信号生成部225は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。予測誤差信号生成部225は、そのブロックデータと、予測手法切り換え部210を介して得られたイントラ予測部260又は動き補償予測部270の出力とにより、予測誤差信号を生成する。予測誤差信号生成部225は、生成された予測誤差信号を変換・量子化部230に出力する。
The prediction error
変換・量子化部230は、入力された予測誤差信号を直交変換処理し、量子化する。変換・量子化部230は、この処理によって出力信号の符号量を低減させる。変換・量子化部230は、この出力信号をエントロピー符号化部240及び逆量子化・逆変換部250に出力する。変換・量子化部230は、量子化パラメータのQp値をループフィルタ部290に出力してもよい。
The transform /
エントロピー符号化部240は、変換・量子化部230からの出力信号、動き検出部280から出力された動きベクトル情報、ループフィルタ部290からのフィルタ係数などをエントロピー符号化して出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
The
逆量子化・逆変換部250は、変換・量子化部230からの出力信号を逆量子化し、逆直交変換する。変換・量子化部230によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
The inverse quantization /
復号画像生成部255は、イントラ予測部260で画面内予測された画像或いは動き補償予測部270で動き補償された画像のブロックデータと、逆量子化・逆変換部により復号処理された予測誤差信号とを加算する。復号画像生成部255は、加算して生成した復号画像のブロックデータを、ループフィルタ部290に出力する。
The decoded image generation unit 255 includes the block data of the image predicted in the screen by the
ループフィルタ部290は、例えばALF(Adaptive Loop Filter)やデブロッキングフィルタである。ループフィルタ部290は、フィルタ処理結果を参照画像として保持する。
The
ループフィルタ部290は、保持した参照画像をイントラ予測部260、動き補償予測部270及び動き検出部280に出力する。
The
イントラ予測部260は、符号化対象画像の処理対象ブロックに対して、既に符号化された参照画素から予測画像のブロックデータを生成する。イントラ予測部260は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。予測方向については、符号化済みブロックの予測方向との差分値をビットストリームに含めるために、差分値がエントロピー符号化部240に出力される。
The
動き補償予測部270は、参照画像のデータを動き検出部280から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。動きベクトルについては、符号化済みブロックの動きベクトル(予測ベクトル)との差分値をビットストリームに含めるために、差分値がエントロピー符号化部240に出力される。
The motion
動き検出部280は、符号化対象画像におけるブロックデータと、参照画像とを用いて、動きベクトルを求める。
The
動き検出部280は、求めた動きベクトルを動き補償予測部270に出力し、参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部240に出力する。
The
イントラ予測部260と動き補償予測部270から出力されたブロックデータは、予測手法切り換え部210に入力される。
The block data output from the
予測手法切り換え部210は、イントラ予測部260と動き補償予測部270とから取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部225に出力される。
The prediction
符号化パラメータ推定部500が有する構成要素は、パラメータ変換部511を除き、上述の符号化部200の構成要素と同様の構成要素を用いることができるため、説明を省略する。
The constituent elements included in the encoding
なお、図4に示す符号化部200及び符号化パラメータ推定部500の構成は一例であり、必要に応じて各構成を組み合わせたり、各構成を適宜変更したりしてもよい。
Note that the configurations of the
<動作>
次に、実施例における画像符号化装置10の動作について説明する。
<Operation>
Next, the operation of the
図5は、画像符号化装置10の動作の一例を示すフローチャートである。
FIG. 5 is a flowchart illustrating an example of the operation of the
ステップ502で、情報量削減部400は、入力された原画像100の情報量を削減する。情報量が削減された画像412は、符号化パラメータ推定部500に与えられる。原画像100の情報量の削減の具体的動作については、図5(B)で説明する。
In
ステップ504で、符号化パラメータ推定部500は、情報量が削減された画像412を符号化し、符号化パラメータを取得し、必要な変換を施すことによって、符号化パラメータの推定を行う。推定符号化パラメータ600は、符号化部200に与えられる。
In
ステップ506で、符号化部200は、与えられた推定符号化パラメータ600を用いて、原画像100を符号化し、ビットストリーム300を出力する。
In
図5(B)は、原画像100の情報量の削減の動作を示すフローチャートである。
FIG. 5B is a flowchart showing an operation for reducing the information amount of the
ステップ591で、情報量削減部400は、画素数削減の指定があるか否かをチェックする。このチェックが「はい」であれば(画素数削減の指定がなされていれば)、ステップ592に進む。このチェックが「いいえ」であれば、ステップ593に進む。
In
ステップ592で、情報量削減部400は、原画像100の画素数を削減する動作を行う。例えば、1画素置きに画素を削減する場合には、原画像100を1/2に縮小された画像が得られる(面積比で1/4となる)。
In
なお、画素数の削減は、単純に画素を間引くことによって行われてもよい。 Note that the reduction in the number of pixels may be performed by simply thinning out the pixels.
ステップ593で、情報量削減部400は、ビット数削減の指定があるか否かをチェックする。このチェックが「はい」であれば(ビット数削減の指定がなされていれば)、ステップ594に進む。このチェックが「いいえ」であれば、ステップ595に進む。
In
ステップ594で、情報量削減部400は、原画像100の画素の情報のビット数の削減を行う。例えば、1画素を10bitで表現している原画像100に対して、1画素のビット数を8bitにすることにより、原画像100の情報量を削減することができる。なお、ビット数の削減は、例えば、下位のビットを単純に切り捨てることにより行うことができる。
In
ステップ595で、情報量削減部400は、フレーム数削減の指定があるか否かをチェックする。このチェックが「はい」であれば(フレーム数削減の指定がなされていれば)、ステップ596に進む。このチェックが「いいえ」であれば、ステップ597に進む。
In
ステップ596で、原画像(動画像)100のフレーム数を減少させる処理を行う。例えば、フレームを1つ置きに間引く処理を行ってもよい。例えば、偶数のフレーム番号を持つフレームを間引いてもよい。この処理を行うことにより、原画像(動画像)100のフレームレートを減少させることができる。
In
ステップ597で、情報量削減部400は、エラーを返す。この場合には、情報量の削減が行われないことを意味するため、予め定めたエラー処理を実行してもよい。
In
以上のようにして、複数の情報量削減の手段のうち少なくとも1つの情報削減処理が行われる。また、複数の情報削減処理を組み合わせてもよい。なお、本実施例の情報削減処理は、例示であり、この例示以外の情報削減処理がなされてもよい。 As described above, at least one information reduction process among a plurality of information amount reduction means is performed. A plurality of information reduction processes may be combined. In addition, the information reduction process of a present Example is an illustration, Information reduction processes other than this illustration may be made.
なお、いずれの処理を行わせるかは、予め定めておくことができる。或いは、いずれの情報量の削減の処理を行うかを、デフォルトとして定めておいてもよい。また、デフォルトとして、各情報量削減方法を試行し、最もRDコストが少ない削減方法を選択するというモードを設定することもできる。 Note that which process is to be performed can be determined in advance. Alternatively, which information amount reduction process is to be performed may be determined as a default. In addition, as a default, a mode in which each information amount reduction method is tried and a reduction method with the lowest RD cost is selected can be set.
<パラメータ変換部511について>
パラメータ変換部511については、既に図2を用いて説明した。以下、図6及び図7を用いて、構成と動作の例を示す。
<Regarding
The
<パラメータ変換部511の構成例>
図6は、パラメータ変換部511の構成の例を示している。パラメータ変換部511は、パラメータ保存部512と、切換制御部513と、パラメータ倍率変更部514と、パラメータ補間部515とを有する。
<Configuration Example of
FIG. 6 shows an example of the configuration of the
パラメータ保存部512は、符号化パラメータ推定部500が、情報量が削減された画像412を符号化した際に得た符号化パラメータを、図4に示す符号化制御部501から取得し、一時的に保存する。この取得された符号化パラメータは、情報量が削減された画像412の符号化によって求まった値であるため、符号化部200が利用できるよう、必要な変換を施し、推定符号化パラメータ600として、符号化部200に提供される。
The
情報量削減部400において、フレーム数の削減が行われた場合には、削減されたフレームに対応する推定符号化パラメータ600を、補間(外挿)により求めることが望ましい。この点に関する処理については、既に述べたとおりである。補間(外挿)を行うためには、少なくとも、過去に符号化された2つのフレームの符号化パラメータがパラメータ保存部512に保存されていることが望ましい。
When the information
なお、フレーム数の削減が行われていない場合には、現在処理しているフレームの符号化パラメータが保存されていればよい。或いは、パラメータ保存部512には、符号化の単位である、現在処理している独立スライスセグメントに対応する符号化パラメータが少なくとも保存されていればよい。
If the number of frames has not been reduced, it is only necessary to store the encoding parameters of the currently processed frame. Alternatively, the
スライスは、スライスセグメントと呼ばれる単位の集合として定義される。スライスセグメントには、全ての符号化データを独立して符号化できる独立スライスセグメントと、同一スライス内の独立スライスセグメントと復号処理に関して依存性がある依存スライスセグメントがある。このように、独立スライスセグメントは、符号化データの処理単位となっている。したがって、パラメータ変換部511は、符号化の処理単位である独立スライスセグメント単位で、推定符号化パラメータ600を生成し、符号化部200に提供することができればよい。
A slice is defined as a set of units called slice segments. The slice segment includes an independent slice segment that can encode all encoded data independently, an independent slice segment in the same slice, and a dependent slice segment that has a dependency on decoding processing. Thus, the independent slice segment is a processing unit of encoded data. Therefore, the
図8は、フレーム700が、独立スライスセグメント710、720、及び730に分割されていることを示している。独立スライスセグメント710は、先頭CTU711から始まっている。独立スライスセグメント720は、先頭CTU721から始まっている。独立スライスセグメント730は、先頭CTU731から始まっている。
FIG. 8 shows that the
図6に戻る。パラメータ倍率変更部514は、例えば、画素数削減の指定がおこなわれて、原画像100の縮小画像が、符号化パラメータ推定部500において処理された場合に機能する。たとえば、1/2に縮小された縮小画像が符号化パラメータ推定部500において処理された場合には、原則としてブロックの大きさを2倍にして推定符号化パラメータ600とする。また、符号化パラメータ推定部500予測手法がインター予測であった場合には、符号化パラメータ推定部500で得られた予測ベクトルと同じ方向とし、パラメータ倍率変更部514は、ベクトルの距離を2倍に変換すればよい。
Returning to FIG. The parameter
パラメータ補間部515は、フレーム数の削減の処理がなされた場合に、削除されたフレームの推定符号化パラメータ600を求めるために補間(外挿)を行う。補間(外挿)の処理の具体例については、既に述べたとおりである。
The
切換制御部513は、図4に示すように情報量削減部400から、情報量の削減処理として何が用いられたかを示す情報411を受け取る。切換制御部513は、この情報411を基にして、パラメータ倍率変更部514、及びパラメータ補間部515に対して、パラメータ保存部512からの符号化パラメータを必要に応じて与える。
As shown in FIG. 4, the switching
パラメータ変換部511は、このようにして得られた推定符号化パラメータ600を出力する。
The
<パラメータ変換部511の動作>
図7は、パラメータ変換部511の動作のフローチャートを示している。
<Operation of
FIG. 7 shows a flowchart of the operation of the
ステップ602で、パラメータ変換部511は、画素数の削減が指定されているかチェックする。このチェックが「はい」であれば(画素数の削減がなされていれば)、ステップ604に進む。このチェックが「いいえ」であれば、ステップ606に進む。
In
ステップ604で、パラメータ変換部511は、所定のパラメータを所定の倍率を用いて変換する。この変換の具体的内容は、既に述べたとおりである。
In
ステップ606で、パラメータ変換部511は、フレーム数の削減指定がなされているかをチェックする。このチェックが「はい」であれば(フレーム数の削減がなされていれば)、ステップ608に進む。このチェックが「いいえ」であれば処理は終了する。
In
ステップ608で、パラメータ変換部511は、削除されたフレームの推定符号化パラメータ600を得るために、既に取得された符号化パラメータを用いて補間(外挿)を行う。
In
以上の処理によって、符号化パラメータ推定部500によって取得された符号化パラメータを、適切に変換し、推定符号化パラメータ600を得ることができる。なお、ビット数の削減処理のみが行われた場合には、符号化パラメータ推定部500で得られた符号化パラメータを、符号化部200でそのまま用いることができる。この推定符号化パラメータ600は、符号化部200に与えられる。
Through the above processing, the encoding parameter acquired by the encoding
<符号化部200における推定符号化パラメータ600の利用について>
上述のように、符号化パラメータ推定部500によって得られた推定符号化パラメータ600を利用して、符号化部200は、原画像100の符号化を行うことができる。この場合に、符号化部200は、推定符号化パラメータ600をそのまま利用することによって、上述のRD最適化などの網羅的計算を省略して、原画像100を符号化し、ビットストリーム300を得ることができる。符号化パラメータ推定部500は、削減された画像の符号化によって、推定符号化パラメータ600を得ることができるため、画像符号化装置10の処理効率を向上させることができる。
<Use of Estimated
As described above, the
なお、符号化部200の処理能力に余裕があれば、符号化部200における推定符号化パラメータ600の利用を一部のみとしてもよい。残りのパラメータについては、符号化部200が、原画像100の符号化の際に再度RD最適化などの最適化手法を用いて、符号化パラメータを求め直してもよい。
If the processing capability of the
例えば、推定符号化パラメータ600から、CTUの分割形状をRD最適化によって求め直す場合の例を以下に示す。
For example, an example in the case of re-determining the CTU division shape from the estimated
符号化部200が、CTUの分割形状を求め直す場合、まず、各CUについて推定符号化パラメータ600の値を利用して符号化した場合のRDコストを計算する。
When the
その後、各CUを分割する。符号化部200が、下位階層で各符号化パラメータの組合せの全ての符号化を試行して、RDコスト(合計値)を計算する。分割前と比べて、よりRDコストの小さい方を選択する。これを、符号化規格で許される階層(H.265/HEVCでは4階層)まで繰り返し、CTUの分割形状を求める。
Thereafter, each CU is divided. The
なお、この場合、下位階層への分割を検討する範囲を、例えば、下位階層方向に1、若しくは2階層までに制限してもよい。 In this case, for example, the range to be divided into lower layers may be limited to one or two layers in the lower layer direction.
また、下位階層へのCUの分割を検討する際に、RDコストを計算する予測手法、予測モードは、推定符号化パラメータ600と同じものを利用してもよい。
Further, when considering the division of a CU into lower layers, the same prediction method and prediction mode for calculating the RD cost may be used as the estimated
例えば、縮小画像の推定符号化パラメータ600で、インター予測となっているCUについては、下位階層への分割を検討する場合も、符号化部200は、インター予測に限定して、RDコストを計算してもよい。イントラ予測が推定符号化パラメータ600で利用されている場合も、符号化部200で、同様にイントラ予測を用いてもよい。
For example, for a CU that is inter-predicted with the estimated
なお、上述の場合、符号化部200は、下位階層へ処理を進めたが、上位階層に処理を進めてもよい。
In the above-described case, the
このように、インター予測とイントラ予測とのいずれを採用するかは、推定符号化パラメータ600で推定された予測手法と同じ手法を用いて、符号化部200で、改めて予測手法及び予測モードの決定のための処理を行わなくてもよい。
As described above, whether to use inter prediction or intra prediction is determined by the
また、注目しているブロックの推定符号化パラメータ600が、インター予測であって、かつ動きベクトルがマージされている場合には、注目しているブロックの周辺でのブロックの動きと同じであるため、推定符号化パラメータ600の動きベクトルをそのまま利用してもよい。マージとは、処理対象ブロックの動きベクトルが、隣接のブロックと同じである場合、その旨を示すことにより、処理対象ブロックでの動きベクトルの情報量を削減するモードを意味する。
In addition, when the estimated
以上のように、原画像100に対して、情報量を削減した画像を用いて、符号化パラメータ推定部500によって、推定符号化パラメータ600を求めることにより、符号化部200が計算しなければならないCTUの数を減少させることができる。したがって、画像符号化装置10は、符号化パラメータの推定を高速に行うことができる。これによって、符号化にかかる画像符号化装置10の全体の処理時間を短縮することができる。
As described above, the
また、符号化部200は、推定符号化パラメータ600から再度符号化パラメータを求め直すことで、推定符号化パラメータ600を用いることにより生じる可能性のある画質劣化を最小限に抑えることができる。
Also, the
また、単純な画面分割による並列符号化装置と比べて高速な符号化が可能であるため、符号化処理のために、画面を分割して多くのハードウェアを用いて並列処理する必要がない。したがって、複数の符号化器の同期処理、又は画面分割境界の画質劣化対策といった処理は必要ない。また、符号化器の数も減らすことができる。 In addition, since high-speed encoding is possible as compared with a parallel encoding apparatus using simple screen division, it is not necessary to divide a screen and perform parallel processing using a lot of hardware for the encoding process. Accordingly, there is no need for processing such as synchronization processing of a plurality of encoders or countermeasures for image quality deterioration at the screen division boundary. Also, the number of encoders can be reduced.
なお、原画像100の情報には、例えば、輝度情報(Y)、色差信号(Cb、及びCr)の各情報が含まれている。本明細書に記載された技術は、これらの情報それぞれに対して適用することができることは言うまでもない。
The information of the
<プログラムによる実装>
なお、上述の実施例の全部又は一部はプログラムによって実装され得る。このプログラムは、可搬記録媒体に格納することができる。可搬記録媒体とは、非一時的(non−transitory)な記憶媒体を言う。例示として、可搬記録媒体としては、磁気記録媒体、光ディスク、光磁気記録媒体、不揮発性メモリなどがある。
<Implementation by program>
All or part of the above-described embodiments can be implemented by a program. This program can be stored in a portable recording medium. A portable recording medium refers to a non-transitory storage medium. Examples of portable recording media include magnetic recording media, optical discs, magneto-optical recording media, and nonvolatile memories.
可搬型記録媒体に格納されたプログラムが読み出され、プロセッサによって実行されることにより、本発明の実施例の全部又は一部が実施され得る。 All or a part of the embodiments of the present invention can be implemented by reading a program stored in a portable recording medium and executing it by a processor.
以上、図面を用いて本発明の実施例を詳細に説明した。なお、上述の実施例は、発明を理解するためのものであり、本発明の範囲を限定するためのものではない点に留意すべきである。また、実施例の動作は、矛盾のない限り処理の順番を入れ替え、或いはスキップしてもよい。あるいは、複数の処理を同時に実行してもよい。そして、これらの実施例も、請求項に記載された発明の技術的範囲に包含されることは言うまでもない。 The embodiments of the present invention have been described in detail with reference to the drawings. It should be noted that the above-described embodiments are for understanding the invention and are not intended to limit the scope of the present invention. In the operation of the embodiment, the order of processing may be changed or skipped as long as there is no contradiction. Alternatively, a plurality of processes may be executed simultaneously. Needless to say, these embodiments are also included in the technical scope of the invention described in the claims.
また、コンピュータが読み出したプログラムコードを実行することにより、上述の実施例の機能が実現されるだけでなく、そのプログラムコードの指令に基づき、コンピュータ上で稼働しているOS、仮想マシンモニタVMM、ファームウエア、BIOSなどのプログラムが実際の処理の一部または全部を行ない、その処理によって実施例の機能が実現される場合も、本発明に含まれることは言うまでもない。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS, a virtual machine monitor VMM, Needless to say, the present invention also includes a case where a program such as firmware or BIOS performs part or all of the actual processing and the functions of the embodiments are realized by the processing.
また、本発明の実施例の構成要素は、物理的に分離された複数のハードウェアで実現されてもよい。また、本発明の各種実施例のそれぞれの構成要素は、1つ以上のコンピュータ上で動作することによって実現されてもよい。 In addition, the constituent elements of the embodiments of the present invention may be realized by a plurality of physically separated hardware. Also, each component of the various embodiments of the invention may be implemented by running on one or more computers.
10 画像符号化装置
100 原画像(動画像)
200 符号化部
201、501 符号化制御部
210、510 予測手法切り換え部
220、520 画面分割部
225、525 予測誤差信号生成部
230、530 変換・量子化部
240、540 エントロピー符号化部
250、550 逆量子化・逆変換部
255、555 復号画像生成部
260、560 イントラ予測部
270、570 動き補償予測部
280、580 動き検出部
290、590 ループフィルタ部
300 ビットストリーム
400 情報量削減部
410 画素数削減部
411 情報量の削減処理として何が用いられたかを示す情報
412 情報量が削減された画像
420 ビット数削減部
430 フレーム数削減部
511 パラメータ変換部
600 推定符号化パラメータ
10
200
Claims (7)
前記情報量が削減された動画像を符号化することによって、前記入力された動画像の符号化に用いられる符号化パラメータを推定する、符号化パラメータ推定部と、
前記推定された符号化パラメータを基にして、前記入力された動画像の符号化を行う、符号化部と、
を有する画像符号化装置。 An information amount reduction unit that generates a moving image with a reduced amount of information from the input moving image;
An encoding parameter estimator configured to estimate an encoding parameter used for encoding the input moving image by encoding the moving image with the reduced information amount;
An encoding unit that encodes the input moving image based on the estimated encoding parameters;
An image encoding device having:
前記パラメータ変換部は、前記入力された動画像の所定のフレームにおける画素数と、画素数が削減された前記所定のフレームの画素数との比を用いて、ブロックの大きさ及び動きベクトルの長さを変換する、
請求項3記載の画像符号化装置。 When the number of pixels of each of the plurality of frames included in the input moving image is reduced by the pixel number reduction unit,
The parameter conversion unit uses a ratio between the number of pixels in the predetermined frame of the input moving image and the number of pixels of the predetermined frame in which the number of pixels is reduced to determine the size of the block and the length of the motion vector. Convert
The image encoding device according to claim 3.
前記パラメータ変換部は、前記削減されたフレーム以外の複数のフレームから得られた動きベクトルを外挿することで、前記削減されたフレームの動きベクトルを算出する、
請求項3記載の画像符号化装置。 When the number of frames per unit time of the input moving image is reduced by the frame number reduction unit,
The parameter conversion unit calculates a motion vector of the reduced frame by extrapolating motion vectors obtained from a plurality of frames other than the reduced frame;
The image encoding device according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013107253A JP2014230031A (en) | 2013-05-21 | 2013-05-21 | Image encoding device and image encoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013107253A JP2014230031A (en) | 2013-05-21 | 2013-05-21 | Image encoding device and image encoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014230031A true JP2014230031A (en) | 2014-12-08 |
Family
ID=52129522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013107253A Pending JP2014230031A (en) | 2013-05-21 | 2013-05-21 | Image encoding device and image encoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014230031A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019062339A (en) * | 2017-09-26 | 2019-04-18 | 富士通株式会社 | Dynamic picture image encoder, dynamic picture image coding method, and dynamic picture image coding program |
CN110537370A (en) * | 2017-02-08 | 2019-12-03 | 弗劳恩霍夫应用研究促进协会 | Use the predictive coding of template matching |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11298904A (en) * | 1998-04-13 | 1999-10-29 | Nippon Telegr & Teleph Corp <Ntt> | Video coding method, video encoder and recording medium with video coding program recorded therein |
JP2000032467A (en) * | 1998-07-09 | 2000-01-28 | Sony Corp | Image processor, image processing method, and provision medium |
JP2002016912A (en) * | 2000-06-28 | 2002-01-18 | Mitsubishi Electric Corp | Moving picture encoding device |
US20060140273A1 (en) * | 2004-12-28 | 2006-06-29 | Siu-Wai Wu | Dual-pass HDTV encoder with noise reduction |
JP2006246431A (en) * | 2005-02-07 | 2006-09-14 | Matsushita Electric Ind Co Ltd | Image coding apparatus and method |
JP2007013864A (en) * | 2005-07-04 | 2007-01-18 | Pioneer Electronic Corp | Moving image encoding apparatus, moving image encoding method, and moving image encoding program |
JP2010507983A (en) * | 2006-10-25 | 2010-03-11 | トムソン ライセンシング | Efficient one-pass encoding method and apparatus in multi-pass encoder |
-
2013
- 2013-05-21 JP JP2013107253A patent/JP2014230031A/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11298904A (en) * | 1998-04-13 | 1999-10-29 | Nippon Telegr & Teleph Corp <Ntt> | Video coding method, video encoder and recording medium with video coding program recorded therein |
JP2000032467A (en) * | 1998-07-09 | 2000-01-28 | Sony Corp | Image processor, image processing method, and provision medium |
JP2002016912A (en) * | 2000-06-28 | 2002-01-18 | Mitsubishi Electric Corp | Moving picture encoding device |
US20060140273A1 (en) * | 2004-12-28 | 2006-06-29 | Siu-Wai Wu | Dual-pass HDTV encoder with noise reduction |
JP2006246431A (en) * | 2005-02-07 | 2006-09-14 | Matsushita Electric Ind Co Ltd | Image coding apparatus and method |
JP2007013864A (en) * | 2005-07-04 | 2007-01-18 | Pioneer Electronic Corp | Moving image encoding apparatus, moving image encoding method, and moving image encoding program |
JP2010507983A (en) * | 2006-10-25 | 2010-03-11 | トムソン ライセンシング | Efficient one-pass encoding method and apparatus in multi-pass encoder |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110537370A (en) * | 2017-02-08 | 2019-12-03 | 弗劳恩霍夫应用研究促进协会 | Use the predictive coding of template matching |
CN110537370B (en) * | 2017-02-08 | 2023-08-25 | 弗劳恩霍夫应用研究促进协会 | Apparatus and method for picture encoding, and apparatus and method for picture decoding |
JP2019062339A (en) * | 2017-09-26 | 2019-04-18 | 富士通株式会社 | Dynamic picture image encoder, dynamic picture image coding method, and dynamic picture image coding program |
JP7147145B2 (en) | 2017-09-26 | 2022-10-05 | 富士通株式会社 | Video encoding device, video encoding method, and video encoding program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7543464B2 (en) | Intra prediction using multiple reference lines | |
CN112425166B (en) | Intra-prediction in video coding using cross-component linear model | |
US20230105972A1 (en) | Method and system for processing video content | |
KR102635983B1 (en) | Methods of decoding using skip mode and apparatuses for using the same | |
US9973756B2 (en) | Video encoder and video encoding method | |
TWI535269B (en) | Performing motion vector prediction for video coding | |
JP2024071777A (en) | Method and device for decoding picture by intra-prediction in picture coding system | |
CN112042199A (en) | Adaptive interpolation filter | |
JP6980911B2 (en) | Limited memory access window for improved motion vector | |
KR20190029732A (en) | Intra prediction mode based image processing method and apparatus therefor | |
KR20200005648A (en) | Intra prediction mode based image processing method and apparatus therefor | |
KR20220045045A (en) | Matrix Weighted Intra Prediction of Video Signals | |
KR20190096432A (en) | Intra prediction mode based image processing method and apparatus therefor | |
KR20220092477A (en) | Method for intra prediction and apparatus thereof | |
JP2022535859A (en) | Method for constructing MPM list, method for obtaining intra-prediction mode of chroma block, and apparatus | |
WO2015145504A1 (en) | Image decoding device, image decoding method, and integrated circuit | |
JP2017537491A (en) | Scalable conversion hardware architecture with improved transposition buffer | |
JP2023521295A (en) | Method for signaling video coded data | |
CN114868393A (en) | Method of performing surround motion compensation | |
KR20220024877A (en) | How to calculate the position of integer grid reference sample for block level boundary sample gradient calculation in double prediction optical flow calculation and double prediction correction | |
TW201448573A (en) | Spatial motion vector scaling for scalable video coding | |
US20230090025A1 (en) | Methods and systems for performing combined inter and intra prediction | |
JP2014230031A (en) | Image encoding device and image encoding program | |
CN112565767B (en) | Video decoding method, video encoding method and related equipment | |
JP2022548555A (en) | Motion compensation method for video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170613 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20171205 |