JP2009188514A - Image encoding apparatus, image decoding apparatus and image processing program - Google Patents
Image encoding apparatus, image decoding apparatus and image processing program Download PDFInfo
- Publication number
- JP2009188514A JP2009188514A JP2008023941A JP2008023941A JP2009188514A JP 2009188514 A JP2009188514 A JP 2009188514A JP 2008023941 A JP2008023941 A JP 2008023941A JP 2008023941 A JP2008023941 A JP 2008023941A JP 2009188514 A JP2009188514 A JP 2009188514A
- Authority
- JP
- Japan
- Prior art keywords
- orthogonal transform
- signal
- image
- unit
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、映像処理装置における画像符号化技術に関し、特に、映像信号を効率的に記憶装置に格納するための画像符号化装置、画像復号装置及び画像処理プログラムに関する。 The present invention relates to an image encoding technique in a video processing device, and more particularly to an image encoding device, an image decoding device, and an image processing program for efficiently storing a video signal in a storage device.
従来、デジタル映像信号を記録するために可逆又は非可逆の様々なフォーマットが、VTRやコンピュータ、デジタルカメラなどにおいて利用されている。非圧縮フォーマットの代表的なものにBMP(ビットマップ形式)、非可逆圧縮フォーマットとしてJPEGやMPEGと呼ばれる規格群がある。これらの符号化方式は、人の視覚特性を巧みに利用し、情報量を積極的に減少させることにより、動画像の符号化を実現するものであり、基本的には、直近のN×N画素で構成される小領域に対し、DCT(Discrete Cosine Transform:離散コサイン変換)又はDCT(Discrete Sine Transform:離散サイン変換)に代表される直交変換を施し、直交変換係数を量子化し、可変長符号化を行うことにより、動画像の符号化を実現している。 Conventionally, various reversible or irreversible formats for recording digital video signals are used in VTRs, computers, digital cameras, and the like. Typical examples of non-compressed formats include BMP (bitmap format), and JPEG and MPEG as a lossy compression format. These encoding schemes realize the encoding of moving images by skillfully using human visual characteristics and actively reducing the amount of information. Basically, the most recent N × N An orthogonal transform such as DCT (Discrete Cosine Transform) or DCT (Discrete Sine Transform) is applied to a small region composed of pixels, and the orthogonal transform coefficient is quantized to obtain a variable length code. By performing the conversion, the encoding of the moving image is realized.
一般に、画面内を小領域に分割した場合、映像信号の高解像度化により、小領域間の信号の活性度(複雑さ)の差は大きくなる。これは、映像信号の高解像度化により、従来の映像信号では表現することができなかった緻密な物体の表現が可能となるからである。しかし、同時に、画面内の平坦な領域(符号化の容易な領域)の解像度も高まることから、この平坦な領域における信号の活性度は他の領域に比べ一層小さくなる。この平坦な領域は、隣接する領域との間の信号性質の差も小さいから、複数の領域をまとめて符号化することにより、高効率な圧縮符号化を実現することができる。例えば、H.264符号化方式等の規格では、小領域の分割方法を工夫して符号化を実現している。 In general, when the screen is divided into small areas, the difference in signal activity (complexity) between the small areas increases due to the high resolution of the video signal. This is because, by increasing the resolution of the video signal, it becomes possible to express a precise object that could not be expressed by a conventional video signal. However, at the same time, since the resolution of a flat area (an area that can be easily encoded) in the screen is increased, the signal activity in the flat area is further reduced compared to other areas. Since this flat area has a small signal property difference between adjacent areas, highly efficient compression coding can be realized by coding a plurality of areas together. For example, H.M. In standards such as the H.264 encoding method, encoding is realized by devising a small area dividing method.
また、画像を互いに画素を共有しない部分画像に分離し、互いに直交変換のオーバーサンプリングによる予測を用いた画像符号化装置が開示されている(例えば、特許文献1,特許文献2参照)。
In addition, an image encoding device that separates images into partial images that do not share pixels and uses prediction by oversampling of orthogonal transforms is disclosed (for example, see
従来の代表的な符号化方式では、映像信号を隣接画素で構成される小領域に分割し、小領域毎に符号化を行い、小領域内の画素の性質により量子化の程度を変動させている。そのため、BMP形式のファイルフォーマットは、映像信号を圧縮しないフォーマットであり、高品質であるが記録媒体の記録領域消費が増大する。一方、静止画におけるJPEGや動画におけるMPEG符号化方式は、高品質を維持したまま高い圧縮性能を示す符号化方式であるが、過度の圧縮が行われた場合、符号化領域が矩形に並んでいるため、符号化の最小単位の圧縮率の違いが、ブロック歪みとなって現れやすい。符号化最小単位を大きくすることでブロック歪みの低減を図ることができるが、この場合、画像の性質に応じた圧縮率の適応的な変化をつけにくくなり、画像品質の低下につながりやすい。そのため、特許文献1及び特許文献2に開示される方式を用いれば、DCT及びDSTを併用することにより、ブロック歪みの少ない符号化を実現させている。
In a typical conventional coding method, a video signal is divided into small regions composed of adjacent pixels, and coding is performed for each small region, and the degree of quantization is varied depending on the characteristics of the pixels in the small region. Yes. Therefore, the file format of the BMP format is a format that does not compress the video signal, and the recording area consumption of the recording medium increases although it is high quality. On the other hand, JPEG for still images and MPEG encoding for moving images are encoding methods that exhibit high compression performance while maintaining high quality. However, if excessive compression is performed, the encoding areas are arranged in a rectangle. Therefore, the difference in the compression rate of the minimum unit of encoding tends to appear as block distortion. Although the block distortion can be reduced by increasing the minimum encoding unit, in this case, it is difficult to adaptively change the compression rate in accordance with the properties of the image, which tends to reduce the image quality. Therefore, if the methods disclosed in
特に、特許文献2に開示される方式は、符号化器において画像を画素間引きにより、好適には2つに分離し、第1の分離画像をDCTの直交変換を行い、量子化後、可変長符号化するとともに、その量子化係数を逆量子化し、1/2画素精度逆DCT変換により他の分離画像の信号を予測する予測信号を生成し、他の分離画像用の予測信号と原信号の差分に対してDSTの直交変換を行い、その係数を量子化後、可変長復号し、それぞれの可変長符号化した信号を伝送する(復号側ではそれぞれ逆の処理を行う。)。このように分離画像を用いることで、DCT及びDSTと量子化との組み合わせで生じるブロック歪みの低減を図り、視覚的に良好な符号化画像を生成することができる。 In particular, the method disclosed in Patent Document 2 separates an image in an encoder by pixel thinning, preferably into two, performs DCT orthogonal transform on the first separated image, and after quantization, has a variable length. In addition to encoding, the quantization coefficient is inversely quantized, and a prediction signal for predicting a signal of another separated image is generated by 1/2 pixel precision inverse DCT transform, and the prediction signal for the other separated image and the original signal are generated. DST orthogonal transform is performed on the difference, the coefficient is quantized, variable-length decoded, and each variable-length encoded signal is transmitted (reverse processing is performed on the decoding side). By using the separated image in this way, it is possible to reduce block distortion caused by the combination of DCT, DST, and quantization, and to generate a visually good encoded image.
しかしながら、DCT又はDSTは、同一の画素信号に適応された場合に理想的に最良の効果を示すものであるが、DCT及びDSTと量子化との組み合わせで生じるブロック歪みの低減を図るには更なる改善の余地があった。 However, although DCT or DST ideally shows the best effect when applied to the same pixel signal, it is further necessary to reduce block distortion caused by the combination of DCT, DST, and quantization. There was room for improvement.
そこで、本発明は、かかる課題を解決するためになされたものであり、その目的は、ブロック歪みの低減を図りながら高効率符号化を実現する画像符号化装置、画像復号装置及び画像処理プログラムを提供することにある。 Accordingly, the present invention has been made to solve such a problem, and an object of the present invention is to provide an image encoding device, an image decoding device, and an image processing program that realize high-efficiency encoding while reducing block distortion. It is to provide.
まず、本発明に係る画素信号予測においても、特許文献1及び特許文献2に開示される方式と同様に、符号化対象となる映像信号を例えば2つの分離画像として分離し、相関の高い隣接画素からなる第1の分離画像(原信号)を用いて第2の分離画像(補間信号)を生成する(以下、オーバーサンプリングと称する)。これは、第1の分離画像の低周波成分による補間信号は、第2の分離画像の原信号との相関も高く、予測値として適切であることが多いことに基づいている。この場合、第1の分離画像は元の映像信号から第2の分離画像を間引いた信号であり、符号化情報量が少ない。また、相関の高い隣接画素からなる第1の分離画像を用いて第2の分離画像を予測するため、その予測は比較的正確になされ、第1の分離画像による第2の分離画像の予測信号と第2の分離画像との間の差分信号のエネルギーは小さくなる。これにより、高効率符号化を実現することが可能となる。
First, in the pixel signal prediction according to the present invention, similarly to the methods disclosed in
しかしながら、本発明に係る画像符号化方式においては、オーバーサンプリング時に発生するエイリアシングによる高周波成分を抑制するために、復号側でのみ、直交変換基底と前述の補間信号との相関を利用するようにする。即ち、その相関の強さによって、復号側で補間信号の直交変換係数にのみ重み付けを施すようにする。 However, in the image coding system according to the present invention, in order to suppress high-frequency components due to aliasing that occur during oversampling, the correlation between the orthogonal transform base and the aforementioned interpolation signal is used only on the decoding side. . That is, only the orthogonal transform coefficient of the interpolation signal is weighted on the decoding side according to the strength of the correlation.
また、本発明に係る画像符号化方式においては、特許文献1及び特許文献2に開示される方式を更に改良し、画像符号化側では、第1の分離画像(原信号)についての直交変換係数から、重み付けを施すことなく他の分離画像の予測信号を生成し、且つ各分離画像に対して、それぞれDCT及びDSTのタイプ2の直交変換を施すようにする。一方で、画像復号側では、画像符号化の処理とは逆の処理を行う際に、DSTタイプ2を用いる分離画像については、DSTタイプ2の係数に逆変換とエイリアシングを考慮した重み付け係数を乗じ、1/2画素精度のDST変換を行って所定の閾値で選択される復号信号を生成するようにする。これにより、予測した画像の誤差を表す差分信号の直交変換係数のスペクトル分布に偏りを発生させるようにした。従って、より一層ブロック歪みを低減させることができ、更に、原信号は正しく逆変換により再生され、補間信号の信号値は高周波成分による雑音がより一層抑制されるようになる。
Further, in the image coding method according to the present invention, the methods disclosed in
即ち、本発明による画像符号化装置は、映像信号の画像を構成する小領域毎の画素信号に直交変換、量子化及び可変長符号化を施す画像符号化装置であって、前記小領域毎の画素信号について隣接画素を分離し、複数の分離画像を生成する分離部と、前記複数の分離画像のうちの第1の分離画像の画素信号に対し第1のタイプの直交変換及び量子化を施す直交変換・量子化部と、前記複数の分離画像のうちの他の分離画像の画素信号を予測するために、前記直交変換及び量子化が施された信号に対し、逆量子化を施す逆量子化部と、前記逆量子化部から得られる直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像を予測する第1の逆直交変換部と、前記第1の逆直交変換により予測された他の分離画像の予測信号と、前記分離部により生成された前記他の分離画像の信号との間の差分信号を求める減算器と、前記差分信号に第2のタイプの直交変換及び量子化を施す差分信号直交変換・量子化部と、前記差分信号直交変換・量子化部により前記差分信号に対し直交変換及び量子化が施された信号、及び、前記直交変換・量子化部により前記第1の分離画像に対し直交変換及び量子化が施された信号に、可変長符号化を施す可変長符号化部とを備え、前記第1のタイプがDCTタイプ2であるときは、前記第2のタイプがDSTタイプ2であることを特徴とする。 That is, an image encoding device according to the present invention is an image encoding device that performs orthogonal transform, quantization, and variable length encoding on a pixel signal for each small region that constitutes an image of a video signal. A separation unit that separates adjacent pixels from the pixel signal and generates a plurality of separated images, and a first type of orthogonal transformation and quantization is performed on the pixel signal of the first separated image of the plurality of separated images. An inverse transform / quantization unit, and an inverse quantum that performs inverse quantization on the signal subjected to the orthogonal transform and quantization in order to predict a pixel signal of another separated image among the plurality of separated images. And a first inverse orthogonal transform that performs inverse orthogonal transform with 1 / n pixel accuracy on the orthogonal transform coefficient obtained from the inverse quantization unit as a natural number n excluding zero and predicts the other separated image And predicted by the first inverse orthogonal transform A subtractor for obtaining a difference signal between the prediction signal of the separated image and the signal of the other separated image generated by the separation unit, and performing a second type of orthogonal transformation and quantization on the difference signal A differential signal orthogonal transform / quantization unit; a signal obtained by performing orthogonal transform and quantization on the differential signal by the differential signal orthogonal transform / quantization unit; and the first signal by the orthogonal transform / quantization unit. A variable-length coding unit that performs variable-length coding on a signal that has undergone orthogonal transformation and quantization on a separated image, and when the first type is DCT type 2, the second type Is DST type 2.
尚、前記差分信号直交変換・量子化部は、前記差分信号の誤差エネルギーが所定の閾値以下となるように小領域の直交変換係数を求めるようにしている。 Note that the differential signal orthogonal transform / quantization unit obtains a small region orthogonal transform coefficient so that the error energy of the differential signal is equal to or less than a predetermined threshold.
更に、本発明の画像復号装置は、本発明の画像符号化装置により符号化された信号を復号する画像復号装置であって、前記画像符号化装置により符号化された信号を可変長復号する可変長復号部と、前記画像符号化装置から得られる前記第1の分離画像の量子化信号に対して逆量子化を施して生成された第1の直交変換係数の信号に対し、逆直交変換を施して前記第1の分離画像の復号信号を生成する第2の逆直交変換部と、前記第1の直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像に対応する予測信号を生成する第3の逆直交変換部と、前記画像符号化装置から得られる前記他の分離画像の差分信号の量子化信号に対して逆量子化を施して生成された第2の直交変換係数の信号に対し、当該第2のタイプの逆直交変換を施して予測差分信号を生成する第4の逆直交変換部と、前記第2の直交変換係数に、前記他の分離画像と前記第1の分離画像との間の相関に応じた第1の重み付け係数を加味する直交変換係数重み付け部と、前記直交変換係数重み付け部の結果に対し、当該自然数nとして1/n画素精度で逆直交変換を施し、前記第1の分離画像の量子化誤差を予測するための量子化誤差予測信号を生成する第5の逆直交変換部と、前記画像符号化装置から得られる信号に含まれている前記第1の分離画像の量子化情報を用いて、前記量子化誤差予測信号を制限する制限部と、前記第2の逆直交変換部により生成された前記第1の分離画像の復号信号に、前記制限部により制限された前記量子化誤差予測信号を加算し、新たな第1の分離画像の復号信号を生成する第1の加算部と、前記第3の逆直交変換部により生成された前記他の分離画像の予測信号に、前記第4の逆直交変換部により生成された前記予測差分信号を加算し、前記他の分離画像の復号信号を生成する第2の加算部と、前記第1の加算部により生成された前記新たな第1の分離画像の復号信号、及び、前記第2の加算部により生成された前記他の分離画像の復号信号を合成する合成部とを備えることを特徴とする。 Furthermore, the image decoding apparatus of the present invention is an image decoding apparatus that decodes a signal encoded by the image encoding apparatus of the present invention, and is a variable decoding unit that performs variable length decoding on the signal encoded by the image encoding apparatus. Inverse orthogonal transform is performed on the signal of the first orthogonal transform coefficient generated by performing inverse quantization on the quantized signal of the first separated image obtained from the long decoding unit and the image encoding device. And a second inverse orthogonal transform unit that generates a decoded signal of the first separated image, and an inverse orthogonal transform is performed on the first orthogonal transform coefficient with a 1 / n pixel accuracy as a natural number n excluding zero. A third inverse orthogonal transform unit that generates a prediction signal corresponding to the other separated image, and inverse quantization on the quantized signal of the difference signal of the other separated image obtained from the image encoding device. To the signal of the second orthogonal transform coefficient generated by applying A fourth inverse orthogonal transform unit that performs the second type of inverse orthogonal transform to generate a prediction difference signal, and the second orthogonal transform coefficient includes the other separated image and the first separated image. An orthogonal transform coefficient weighting unit that takes into account the first weighting coefficient according to the correlation between the orthogonal transform coefficient weighting unit, and the result of the orthogonal transform coefficient weighting unit is subjected to inverse orthogonal transform with 1 / n pixel accuracy as the natural number n, A fifth inverse orthogonal transform unit that generates a quantization error prediction signal for predicting a quantization error of the first separated image; and the first separation included in the signal obtained from the image coding device. Using the quantization information of the image, the restriction unit restricts the quantization error prediction signal to the decoded signal of the first separated image generated by the second inverse orthogonal transform unit and the restriction unit. The quantized error prediction signal generated is added, A first adder for generating a decoded signal of the first separated image, and a fourth inverse orthogonal transform unit for the prediction signal of the other separated image generated by the third inverse orthogonal transform unit. A second adder that adds the prediction difference signal generated by the above-described step and generates a decoded signal of the other separated image, and a decoding of the new first separated image generated by the first adder. And a synthesis unit that synthesizes a signal and a decoded signal of the other separated image generated by the second addition unit.
更に、本発明は、画像符号化装置として機能するコンピュータを、前記小領域毎の画素信号について隣接画素を分離し、複数の分離画像を生成する分離手段、前記複数の分離画像のうちの第1の分離画像の画素信号に対し第1のタイプの直交変換及び量子化を施す直交変換・量子化手段、前記複数の分離画像のうちの他の分離画像の画素信号を予測するために、前記直交変換及び量子化が施された信号に対し、逆量子化を施す逆量子化手段、前記逆量子化手段から得られる直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像を予測する第1の逆直交変換手段、前記第1の逆直交変換により予測された他の分離画像の予測信号と、前記分離手段により生成された前記他の分離画像の信号との間の差分信号を求める減算器、前記差分信号に第2のタイプの直交変換及び量子化を施す差分信号直交変換・量子化手段、及び、前記差分信号直交変換・量子化手段により前記差分信号に対し直交変換及び量子化が施された信号、及び、前記直交変換・量子化手段により前記第1の分離画像に対し直交変換及び量子化が施された信号に、可変長符号化を施す可変長符号化手段として機能させるための画像処理プログラムであって、前記第1のタイプがDCTタイプ2であるときは、前記第2のタイプがDSTタイプ2であることを特徴とする画像処理プログラムとして特徴付けられる。 Furthermore, the present invention provides a computer functioning as an image encoding apparatus, separating means for separating adjacent pixels from the pixel signal for each small region and generating a plurality of separated images, a first of the plurality of separated images. Orthogonal transform / quantization means for performing a first type of orthogonal transform and quantization on the pixel signals of the separated images, the orthogonal signal for predicting pixel signals of other separated images of the plurality of separated images Inverse quantization means for performing inverse quantization on the transformed and quantized signal, and orthogonal transform coefficient obtained from the inverse quantization means is inverse orthogonal with 1 / n pixel accuracy as a natural number n excluding zero. A first inverse orthogonal transform unit that performs transformation and predicts the other separated image, a prediction signal of another separated image predicted by the first inverse orthogonal transform, and the other generated by the separating unit With separated image signal A difference signal orthogonal transform / quantization means for subjecting the difference signal to a second type of orthogonal transform and quantization, and the difference signal orthogonal transform / quantization means for the difference signal. A variable-length code that performs variable-length coding on a signal that has undergone orthogonal transformation and quantization, and a signal that has undergone orthogonal transformation and quantization on the first separated image by the orthogonal transformation / quantization means An image processing program for functioning as an image processing unit, characterized in that when the first type is DCT type 2, the second type is DST type 2 It is done.
更に、本発明は、本発明の画像符号化装置により符号化された信号を復号する画像復号装置として機能するコンピュータを、前記画像符号化装置により符号化された信号を可変長復号する可変長復号手段、前記画像符号化装置から得られる前記第1の分離画像の量子化信号に対して逆量子化を施して生成された第1の直交変換係数の信号に対し、逆直交変換を施して前記第1の分離画像の復号信号を生成する第2の逆直交変換手段、前記第1の直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像に対応する予測信号を生成する第3の逆直交変換手段、前記画像符号化装置から得られる前記他の分離画像の差分信号の量子化信号に対して逆量子化を施して生成された第2の直交変換係数の信号に対し、当該第2のタイプの逆直交変換を施して予測差分信号を生成する第4の逆直交変換手段、前記第2の直交変換係数に、前記他の分離画像と前記第1の分離画像との間の相関に応じた第1の重み付け係数を加味する直交変換係数重み付け手段、前記直交変換係数重み付け手段の結果に対し、当該自然数nとして1/n画素精度で逆直交変換を施し、前記第1の分離画像の量子化誤差を予測するための量子化誤差予測信号を生成する第5の逆直交変換手段、前記画像符号化装置から得られる信号に含まれている前記第1の分離画像の量子化情報を用いて、前記量子化誤差予測信号を制限する制限手段、前記第2の逆直交変換手段により生成された前記第1の分離画像の復号信号に、前記制限手段により制限された前記量子化誤差予測信号を加算し、新たな第1の分離画像の復号信号を生成する第1の加算手段、前記第3の逆直交変換手段により生成された前記他の分離画像の予測信号に、前記第4の逆直交変換手段により生成された前記予測差分信号を加算し、前記他の分離画像の復号信号を生成する第2の加算手段、前記第1の加算手段により生成された前記新たな第1の分離画像の復号信号、及び、前記第2の加算手段により生成された前記他の分離画像の復号信号を合成する合成手段として機能させるための画像処理プログラムとして特徴付けられる。 Furthermore, the present invention provides a computer functioning as an image decoding device for decoding a signal encoded by the image encoding device of the present invention, and a variable length decoding for variable length decoding of the signal encoded by the image encoding device. A first orthogonal transform coefficient signal generated by performing inverse quantization on the quantized signal of the first separated image obtained from the image encoding device, and performing inverse orthogonal transform on the signal A second inverse orthogonal transform unit for generating a decoded signal of the first separated image; the first orthogonal transform coefficient is subjected to inverse orthogonal transform with 1 / n pixel accuracy as a natural number n excluding zero; Third inverse orthogonal transform means for generating a prediction signal corresponding to the separated image, generated by performing inverse quantization on the quantized signal of the difference signal of the other separated image obtained from the image coding device Second orthogonal transform coefficient signal In contrast, a fourth inverse orthogonal transform unit that performs the second type of inverse orthogonal transform to generate a prediction difference signal, the second orthogonal transform coefficient, the other separated image and the first separated image An orthogonal transform coefficient weighting means that takes into account a first weighting coefficient corresponding to the correlation between the orthogonal transform coefficient weighting means, the result of the orthogonal transform coefficient weighting means is subjected to inverse orthogonal transform with 1 / n pixel accuracy as the natural number n, and Fifth inverse orthogonal transform means for generating a quantized error prediction signal for predicting a quantized error of the first separated image; and the first separated image included in the signal obtained from the image coding apparatus. Using the quantization information, the limiting means for limiting the quantization error prediction signal and the decoded signal of the first separated image generated by the second inverse orthogonal transform means are limited by the limiting means. The quantization error prediction signal Are added to the prediction signal of the other separated image generated by the first adding means for generating a new decoded signal of the first separated image and the third inverse orthogonal transform means, and the fourth inverse A second addition unit that adds the prediction difference signal generated by the orthogonal transform unit and generates a decoded signal of the other separated image, and the new first separated image generated by the first addition unit. And an image processing program for functioning as a synthesizing unit that synthesizes the decoded signal of the other separated image generated by the second adding unit.
本発明によれば、映像信号のイントラ符号化において、符号化による劣化の少ないより圧縮率の高い符号化を実現することができ、記録媒体の使用効率を上げ、映像伝送帯域の利用効率を上げることができる。 According to the present invention, in intra coding of a video signal, it is possible to realize coding with a higher compression rate and less deterioration due to coding, increasing the use efficiency of a recording medium and raising the utilization efficiency of a video transmission band. be able to.
以下、本発明の実施例について図面を用いて詳細に説明する。まず、画像符号化装置について説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. First, an image encoding device will be described.
通常、直交変換として用いるDCT及びDSTは、離散化方法の違いによりそれぞれ4種類のタイプ(各DSTタイプは、タイプ1、タイプ2、タイプ3、タイプ4と称される。)が存在する。これらのタイプ(以下、直交変換タイプとも称する。)は、それぞれ同一の直交変換タイプでの直交変換係数の重み付け和により、DFT(Discrete Fourier Transform:離散フーリエ変換)が導かれる。そこで、先行技術の方式(即ち、前述した特許文献1及び特許文献2の方式)及び本発明に係る方式では、実際には同一でない画素を同一位置画素とみなし、各分離画像をDCT及びDSTで符号化し、加算することでDFTを用いた場合より少ない表現によって、DFTを用いて符号化を行った場合とほぼ等価な結果を導いていると云える。
Usually, there are four types of DCT and DST used as orthogonal transforms depending on the discretization method (each DST type is referred to as
本発明の一実施例では、それぞれの分離画像で使用する直交変換として、同一の直交変換タイプを使用し、且つタイプ2を用いる。更に、第1の分離画像をDCTタイプ2による直交変換を施し、その係数情報を用いて生成する第2の分離画像の予測信号と第2の分離画像の原信号との差分信号には、DSTタイプ2による直交変換を用いる。更に、復号側では、DSTタイプ2による直交変換係数には、重み付けを乗じるようにする。このように構成することにより、特に高周波成分に対する符号化効率は大きく改善する。 In one embodiment of the present invention, the same orthogonal transform type is used as the orthogonal transform used in each separated image, and Type 2 is used. Further, the first separated image is subjected to orthogonal transformation by DCT type 2 and the difference signal between the prediction signal of the second separated image generated using the coefficient information and the original signal of the second separated image is DST. Orthogonal transformation by type 2 is used. Further, on the decoding side, the DST type 2 orthogonal transform coefficient is multiplied by a weight. By configuring in this way, the coding efficiency especially for high frequency components is greatly improved.
即ち、以下に説明する実施例の符号化送信装置は、第1の分離画像をDCTタイプ2で符号化し、1/2画素精度の逆DCTにより他方の分離画像の画素位置の信号を予測する予測信号を生成し、この予測信号と他の分離画像の対応する画素位置の画素信号との差からなる差分信号をDSTタイプ2で符号化するようにした。これにより高能率な符号化を実現することができる。 That is, the encoding transmission apparatus according to the embodiment described below predicts a signal at the pixel position of the other separated image by coding the first separated image with DCT type 2 and performing inverse DCT with 1/2 pixel accuracy. A signal is generated, and a difference signal composed of a difference between the prediction signal and a pixel signal at a corresponding pixel position of another separated image is encoded by DST type 2. Thereby, highly efficient encoding is realizable.
(画像符号化装置)
図1は、本発明による実施例の符号化装置の構成を示すブロック図である。図1に示す符号化装置10は、2つの分離画像の8×8画素領域に対して直交変換を行い、符号化を実現する例である。符号化装置10は、分離部11と、直交変換部(DCTタイプ2)13−1と、量子化部14−1と、可変長符号化部15と、バッファ16と、直交変換部(DSTタイプ2)13−2と、量子化部14−2と、逆量子化部17と、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18と、減算部19とを備えている。
(Image coding device)
FIG. 1 is a block diagram showing a configuration of an encoding apparatus according to an embodiment of the present invention. The
符号化装置10が映像のベースバンド信号をフレームメモリ(図示せず)の所定の領域に格納すると、分離部11は、当該フレームメモリから所定の画素領域毎の小領域のベースバンド信号を読み出す。そして、当該ベースバンド信号の正方画素信号を1画素毎に交互に分離し、2つの分離画像A及びBを生成し、フレームメモリの所定の領域に格納する。
When the
具体的には、分離部11は、図2の上部に示す正方配置した(2×N−1)×(2×N)領域(N=8)の画素信号をフレームメモリから読み出す際に、45°の回転処理を施し、図2の下部に示す画素信号として読み出す。そして、分離部11は、図2の下部に示す枠内の画素信号を、図3に示すように、分離画像Aについての8×8画素の正方画素信号と、分離画像Bについての8×8画素の正方画素信号とに分離する。このように、45°の回転処理を施すことにより、直交変換処理の処理負担又は処理速度を向上させることができる。45°の回転処理の代わりに、フレームメモリに書き込まれたベースバンド信号から分離画像A及びBを取り出す際に、画素信号が45°方向に回転するように、フレームメモリの対応するメモリアドレスから読み出して、図示しないフレームメモリに書き込むこともできる。
Specifically, the
一般に、分離画像A及びBとして示すように、画像符号化は矩形領域の単位で行われる。この矩形領域に対して異なる圧縮率で量子化が行われた場合には、領域の境界に画像の劣化が顕著に検知されることがある。また、人間の視覚特性は、水平及び垂直パターンに比べて45°傾いた斜めパターンの感度が最も劣ることが知られている。したがって、45°傾いた斜めパターンの菱形領域毎に符号化を施した場合は、その斜めパターンの境界の画像に劣化が生じても、人間の視覚特性上認識されにくい。即ち、45°の回転処理を含む分離部11を用いた菱形直交変換の符号化方式を採用することは、符号化領域を矩形ではなく菱形の斜方形にし、隣接する領域間の境界を斜めパターンとすることになり、符号化歪みの検知量を減らすことができる。
In general, as shown as separated images A and B, image encoding is performed in units of rectangular areas. When quantization is performed on this rectangular area at a different compression rate, image degradation may be significantly detected at the boundary of the area. Further, it is known that the human visual characteristics are most inferior in the sensitivity of the oblique pattern inclined by 45 ° compared to the horizontal and vertical patterns. Therefore, when encoding is performed for each rhombus region of an oblique pattern inclined by 45 °, even if the image at the boundary of the oblique pattern is deteriorated, it is difficult to be recognized in terms of human visual characteristics. That is, adopting the rhombus orthogonal transformation coding method using the
このようにして、分離部11により、例えば15×16画素領域の映像のベースバンド信号は、黒丸に示す8×8画素の分離画像Aと、白丸に示す8×8画素の分離画像Bとに分離される。この場合、各画素の座標は変わらない。また、分離画像A及びBは、高解像度画像(ベースバンド信号)を2つに分離した、部分画像の符号化最小単位を表している。そして、後述するように、直交変換部(DCTタイプ2)13−1及び量子化部14−1を介して、逆量子化部17により得られる分離画像Aの直交変換係数から、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18により、分離画像Bの画素位置の信号を予測する予測信号を生成する。最終的には、分離画像Bの復号用の信号は、分離画像Bの原信号とその予測信号との差分(差分信号)を直交変換部(DSTタイプ2)13−2及び量子化部14−2を経て直交変換及び符号化することにより生成される。以下、分離部11以降の構成要素を具体的に説明する。
In this way, the baseband signal of the video of, for example, a 15 × 16 pixel region is separated into an 8 × 8 pixel separated image A indicated by a black circle and an 8 × 8 pixel separated image B indicated by a white circle. To be separated. In this case, the coordinates of each pixel do not change. Separated images A and B represent minimum encoding units of partial images obtained by separating a high-resolution image (baseband signal) into two. Then, as will be described later, from the orthogonal transform coefficient of the separated image A obtained by the
直交変換部(DCTタイプ2)13−1は、分離部11から8×8画素の正方画素ブロックの画素信号を入力し、当該8×8画素領域に対して、DCTタイプ2を施して直交変換を行い、直交変換係数(DCT係数)を出力する。
The orthogonal transform unit (DCT type 2) 13-1 receives the pixel signal of the 8 × 8 pixel square pixel block from the
量子化部14−1は、バッファ16からバッファ量を入力し、直交変換部(DCTタイプ2)13−1によるDCTの結果であるDCT係数に対し、目標ビットレートに応じた量子化を施し、量子化係数を出力する。量子化部14−1により出力された量子化係数は、可変長符号化部15及び逆量子化部17に入力される。
The quantization unit 14-1 receives the buffer amount from the
逆量子化部17は、量子化部14−1から量子化係数を入力し、逆量子化を施し、DCT係数を出力する。
The
1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18は、逆量子化部17からDCT係数を入力し、入力されたDCT係数に対し1/2画素精度で逆直交変換を施し、16×16画素の画素情報を算出する。そして、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18は、当該16×16画素の画像情報を予測信号として出力する。ここで、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18により出力される16×16画素の画像情報について、この画像信号のうち、分離部11により分離して生成された分離画像Bの画素位置に対応する画素部分が分離画像Bの予測信号となる。尚、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18は、逆直交変換の計算量を減じるために、分離画像Bに対応する画素部分についてのみ逆直交変換を施すようにしてもよい。また、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18は、圧縮率を最大限高めるために、差分信号の誤差エネルギーが所定の閾値以下となるように小領域の直交変換係数を求めるようにすることが好適である。尚、本実施例では、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18として説明するが、1/2画素精度に限定するものではない。
A 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DCT type 2) 18 receives a DCT coefficient from the
ここで、DCTタイプ2、逆DCTタイプ2、1/2画素精度逆DCTタイプ2、DSTタイプ2、逆DSTタイプ2、1/2画素精度逆DSTタイプ2の数式を以下に示す。尚、f(x,y)を画素信号、x及びyを画素の座標、f’(x’,y’)を1/2画素精度の画素信号、x’及びy’を1/2画素精度の画素の座標、F(u,v)をDCT又はDSTにより得られたDCT係数又はDST係数(直交変換係数)、uを水平周波数、及び、vを垂直周波数とする。
Here, DCT type 2,
DCTタイプ2の変換式は、式(1)に示すとおりである。 The DCT type 2 conversion equation is as shown in equation (1).
また、逆DCTタイプ2の変換式は、式(2)に示すとおりである。 The inverse DCT type 2 conversion formula is as shown in formula (2).
また、1/2画素精度逆DCTタイプ2の変換式は、式(3)に示すとおりである。 Also, the conversion formula of 1/2 pixel accuracy inverse DCT type 2 is as shown in formula (3).
また、DSTタイプ2の変換式は、式(4)に示すとおりである。 The DST type 2 conversion formula is as shown in formula (4).
また、逆DSTタイプ2の変換式は、式(5)に示すとおりである。 The inverse DST type 2 conversion equation is as shown in equation (5).
また、1/2画素精度逆DSTタイプ2の変換式は、式(6)に示すとおりである。 Also, the conversion formula of 1/2 pixel precision inverse DST type 2 is as shown in formula (6).
減算部19は、分離部11から8×8画素の分離画像Bの信号、及び1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18から16×16画素の予測信号をそれぞれ入力し、当該8×8画素の分離画像Bの信号と、当該信号に対応する画素部分における予測信号との間の差分信号を生成する。
The subtracting
直交変換部(DSTタイプ2)13−2は、減算部19により生成された差分信号を入力し、当該8×8画素領域に対して直交変換を施す。
The orthogonal transformation unit (DST type 2) 13-2 receives the difference signal generated by the
図1において、量子化部14−2は、バッファ16からバッファ量を入力し、直交変換部(DSTタイプ2)13−2による直交変換の結果であるDST係数の直交変換係数に対し、目標ビットレートに応じた量子化を施し、量子化係数を出力する。
In FIG. 1, the quantization unit 14-2 receives the buffer amount from the
可変長符号化部15は、量子化部14−1及び14−2から量子化係数をそれぞれ入力し、各量子化係数に対し、例えばISO/IEC13818−2の規定における量子化された直交変換係数を、ランレングス符号化を用いた符号化手法により符号化し、バッファ16を介して、可変長符号に変換されたビットストリーム信号として出力する。このビットストリーム信号は、分離画像Aの情報であることを識別するための符号、量子化係数の可変長符号、最後の量子化係数の可変長符号の後に付加され量子化係数の終了を示すための終了符号により構成される分離画像Aの信号と、分離画像Bの情報であることを識別するための符号、量子化係数の可変長符号、最後の量子化係数の可変長符号の後に付加され量子化係数の終了を示すための終了符号により構成される分離画像Bの信号、DCT又はDSTの直交変換の種別を識別するための情報を含むように構成される。
The variable
即ち、可変長符号化部15は、可変長符号化により、分離画像Aを識別するための符号を出力し、その量子化係数の可変長符号を出力し、その量子化係数の終了を示すための終了符号を出力し、更に、分離画像Bを識別するための符号を出力し、直交変換を識別するための符号を出力し、その量子化係数の可変長符号を出力し、その量子化係数の終了を示すための終了符号を出力する。
That is, the variable
このように、本発明の実施例による画像符号化装置10によれば、分離部11がベースバンド信号を1画素毎に交互に分離して分離画像A及びBを生成し、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18が、分離画像Aを用いて分離画像Bの画素信号を予測し、減算部19が分離画像Bの画素信号と分離画像Bの予測信号との間の差分信号を出力し、直交変換部(DSTタイプ2)13−2及び量子化部14−2が当該差分信号をDSTタイプ2による直交変換及び量子化を施し、可変長符号化部15が分離画像Aの画素信号及び分離画像Bの差分信号を符号化するようにした。
As described above, according to the
分離画像Bを予測する予測信号は、分離画像Bの画素について最も合致する画素からなる分離画像Aを用いて生成されるため、比較的正確な信号となり得る。これにより、分離画像Bの差分信号は、活性度が小さく平坦な信号となり、分離画像Bをそのまま符号化する場合に比べ、符号化効率は高くなる。また、分離画像Aの画素信号は、ベースバンド信号から分離画像Bを間引いた信号であるため、符号化情報量は半分になる。つまり、画像符号化装置10によれば、分離画像A及びBをそのまま符号化する場合に比べ、高効率符号化を実現することが可能となり、且つ、効果的に不要な高周波成分をより一層低減させることができる。
Since the prediction signal for predicting the separated image B is generated using the separated image A including the best matching pixels for the pixels of the separated image B, it can be a relatively accurate signal. As a result, the difference signal of the separated image B becomes a flat signal with low activity, and the encoding efficiency is higher than when the separated image B is encoded as it is. Further, since the pixel signal of the separated image A is a signal obtained by thinning the separated image B from the baseband signal, the amount of encoded information is halved. That is, according to the
また、基本画像信号と予測差分信号の直交変換に、特にDCTタイプ2とDSTタイプ2のように同一の性質の直交変換を組み合わせるとともに、合致精度の高い組み合わせとすることによって、ブロック歪みを検知されにくくする。更に、この画像符号化装置10と適合した、後述する画像復号装置40の直交変換係数重み付け部46−2により、低解像度の分離画像A又はBに高解像度画像を構成すべき高周波成分が含まれていないにも関わらず、オーバーサンプリングによって生じうる補間信号内の高周波成分を、より一層効果的に除去することができ、結果的に予測歪み(即ち、高周波歪み)を低減させることができる。
Further, block distortion is detected by combining orthogonal transformation of the basic image signal and the prediction difference signal, in particular, orthogonal transformation of the same property as DCT type 2 and DST type 2, and a combination with high matching accuracy. Make it harder. Further, a high-frequency component that should form a high-resolution image is included in the low-resolution separated image A or B by an orthogonal transform coefficient weighting unit 46-2 of the
即ち、一方の分離画像をDCTタイプ2で、他方の分離画像をDSTタイプ2で直交変換を施す手法は、後述する復号側におけるDSTタイプ2で直交変換を施す補間信号に対してのみ重み付けする処理との整合が優れている。これは、実際にシミュレーションを用いて確かめることもできる。即ち、DCT(cos成分による直交変換)によって分離画像Aを符号化し、分離画像Bをその符号化した信号から予測することによって、分離画像Bの差分信号は、sin成分を主とする信号となる。そこで、分離画像BをDST(sin成分による直交変換)することにより、分離画像Bの予測差分信号の直交変換にDCTを用いる場合よりも電力集中度を向上させることができる。従って、処理対象の映像の画質(特に、ブロック歪みなどの符号化歪みの低減効果)を高めることができるようになる。 That is, the method of performing orthogonal transform on one separated image with DCT type 2 and the other separated image with DST type 2 is a process of weighting only interpolation signals to be orthogonally transformed with DST type 2 on the decoding side described later. The alignment with is excellent. This can be confirmed by actually using simulation. That is, by encoding the separated image A by DCT (orthogonal transformation using a cos component) and predicting the separated image B from the encoded signal, the difference signal of the separated image B becomes a signal mainly composed of the sin component. . Therefore, by performing DST (orthogonal transformation using sin components) on the separated image B, the power concentration degree can be improved as compared with the case where DCT is used for the orthogonal transformation of the prediction difference signal of the separated image B. Therefore, it is possible to improve the image quality of the video to be processed (particularly, the effect of reducing coding distortion such as block distortion).
尚、画像符号化装置10に備えられる分離部11は、ベースバンド信号を分離画像A及びBに分離するようにしたが、例えば矩形に分離する場合は、4つの分離画像に分離するようにしてもよいし、分離する画像の数を限定するものではない。また、分離部11は、フレームメモリから15×16画素領域毎の小領域のベースバンド信号を読み出すようにしたが、読み出し単位はこれに限定されるものではない。
The
また、量子化部14−2は、入力した全ての直交変換係数を0に量子化した場合に、量子化係数を出力しないようにしてもよい。この場合、可変長符号化部15は、量子化部14−2から量子化係数を入力しないから、量子化部14−2側の符号化を施す必要がない。これにより、出力するビットストリーム信号は量子化部14−1側の信号のみで済むから、実質的に符号化情報を1/2にすることができる。
Further, the quantization unit 14-2 may not output the quantization coefficient when all the input orthogonal transform coefficients are quantized to 0. In this case, since the variable
次に、本発明による一実施例の画像復号装置について説明する。 Next, an image decoding apparatus according to an embodiment of the present invention will be described.
(画像復号装置)
図4は、本発明の実施の形態による復号装置の構成例を示すブロック図である。この画像復号装置40は、前述した実施例の画像符号化装置10からのビットストリームを復号するように構成され、可変長復号部41と、逆量子化部42−1及び42−2と、直交変換係数重み付け部46−2と、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1及び1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2と、逆直交変換部(逆DCTタイプ2)45−1及び逆直交変換部(逆DSTタイプ2)45−2と、加算部48及び49と、制限部50と、合成部51とを備えている。
(Image decoding device)
FIG. 4 is a block diagram showing a configuration example of the decoding device according to the embodiment of the present invention. The
可変長復号部41は、図1に示した画像符号化装置10からビットストリーム信号を入力し、可変長復号を施す。具体的には、分離画像A及び分離画像Bを識別するための情報、量子化情報、DCT又はDSTの直交変換の種別を識別するための情報、直交変換係数情報等を復号する。可変長復号部41は、可変長復号後、識別した分離画像A及び分離画像Bの量子化信号を、それぞれ逆量子化部42−1及び42−2に送出する。
The variable
逆量子化部42−1は、識別された分離画像Aの量子化信号を入力し、逆量子化を施して直交変換係数の信号を生成し、逆直交変換部(逆DCTタイプ2)45−1及び1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1に送出する。 The inverse quantization unit 42-1 receives the quantized signal of the identified separated image A and performs inverse quantization to generate an orthogonal transform coefficient signal. The inverse orthogonal transform unit (inverse DCT type 2) 45- 1 and 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DCT type 2) 43-1.
即ち、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1に入力される信号は、分離画像Bの復号のために用いられ、逆直交変換部(逆DCTタイプ2)45−1に入力される信号は、分離画像Aの復号のために用いられる。 That is, the signal input to the 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DCT type 2) 43-1 is used for decoding the separated image B, and the inverse orthogonal transform unit (inverse DCT) is used. Type 2) The signal input to 45-1 is used for decoding the separated image A.
逆直交変換部(逆DCTタイプ2)45−1は、逆量子化部42−1から分離画像Aの直交変換係数の信号を入力し、逆直交変換(例えば式(2)に示す逆DCT)を施して分離画像Aの復号信号を生成し、加算部48に送出する。
The inverse orthogonal transform unit (inverse DCT type 2) 45-1 receives the signal of the orthogonal transform coefficient of the separated image A from the inverse quantization unit 42-1, and performs inverse orthogonal transform (for example, inverse DCT represented by Expression (2)). To generate a decoded signal of the separated image A and send it to the
1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1は、逆量子化部42−1から分離画像Aの直交変換係数の信号を入力し、1/2画素精度の逆直交変換を施す(例えば、式(3)に示す1/2画素精度の逆DCTタイプ2)。これにより、16×16画素の画像情報として、分離画像Bの画素位置に対応する予測信号を生成し、加算部49に送出する。ここで、可変長復号部41が、ビットストリーム信号の先頭から復号を始めた場合には、可変長復号部41により、分離画像Aの量子化情報、及び量子化された直交変換係数情報が復号される。このようにして、逆量子化部42−1及び1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1により、例えば分離画像Aの8×8のDCT係数の信号から16×16画素の画像情報の信号を生成し、分離画像Bの画素位置に対応する8×8の予測信号を生成することができる。
The 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DCT type 2) 43-1 receives the signal of the orthogonal transform coefficient of the separated image A from the inverse quantization unit 42-1, and
逆量子化部42−2は、可変長復号部41により可変長復号され、識別された分離画像Bを復号するための差分信号に対し、逆量子化を施して差分信号の直交変換係数の信号を生成し、直交変換係数重み付け部46−2及び逆直交変換部(逆DSTタイプ2)45−2に送出する。
The inverse quantization unit 42-2 performs inverse quantization on the differential signal for decoding the identified separated image B that has been variable-length decoded by the variable-
即ち、直交変換係数重み付け部46−2に入力される信号は、後述する表1に示す重み付け係数wu,vで重み付けした直交変換係数の生成(分離画像Aの復号用)のために用いられ、逆直交変換部(逆DSTタイプ2)45−2に入力される信号は、重み付け係数wu,vを使用しない直交変換係数の生成(分離画像Bの復号用)のために用いられる。 That is, the signal input to the orthogonal transform coefficient weighting unit 46-2 is used for generating orthogonal transform coefficients (for decoding the separated image A) weighted by weighting coefficients w u and v shown in Table 1 described later. The signal input to the inverse orthogonal transform unit (inverse DST type 2) 45-2 is used for generating orthogonal transform coefficients (for decoding the separated image B) that do not use the weighting coefficients w u, v .
逆直交変換部(逆DSTタイプ2)45−2は、逆量子化部42−2から分離画像Bの差分信号の直交変換係数の信号を入力し、逆直交変換(例えば式(5)に示す逆DSTタイプ2)を施して分離画像Bを復号するための差分信号(以下、予測差分信号と称する)を生成し、加算部49に送出する。
The inverse orthogonal transform unit (inverse DST type 2) 45-2 receives the signal of the orthogonal transform coefficient of the difference signal of the separated image B from the inverse quantization unit 42-2, and performs inverse orthogonal transform (for example, shown in Expression (5)). A differential signal (hereinafter referred to as a prediction differential signal) for decoding the separated image B by performing inverse DST type 2) is generated and sent to the adding
直交変換係数重み付け部46−2は、逆量子化部42−2から入力された分離画像Bの差分信号の直交変換係数の信号に対して、予め規定されている重み付け係数(表1)を用いて、後述する式(8)に対応する直交変換係数X’[u][v]を算出し、1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2に送出する。ここで、重み付け係数wu,vからなるマトリクスを、画像復号装置側で図示しないメモリ(ROMなど)に予め記憶させておく。好適には、画像復号装置40は、予め画像符号化装置10から送出されたビットストリーム信号に含まれる、重み付け係数wu,vからなるマトリクスを用いる。
The orthogonal transform coefficient weighting unit 46-2 uses a predetermined weighting coefficient (Table 1) for the signal of the orthogonal transform coefficient of the difference signal of the separated image B input from the inverse quantization unit 42-2. Then, an orthogonal transform coefficient X ′ [u] [v] corresponding to Equation (8) described later is calculated, and the 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DST type 2) 43-2 is calculated. Send it out. Here, a matrix composed of the weighting coefficients w u, v is stored in advance in a memory (such as a ROM) not shown on the image decoding apparatus side. Preferably, the
直交変換係数重み付け部46−2の効果を詳しく説明する。原理上、分離画像Aと分離画像Bの画素を完全に表現するためには、16×16の直交変換係数を必要とし、8×8の直交変換係数で他方の信号(実施例では、分離画像Bの画素位置の信号)を表現するには、高周波成分の情報が足りない。そのため、画像符号化装置10から送られてくる分離画像Bに対応する予測信号から単に分離画像Aの復号信号を生成すると、本来画像情報が有する高周波信号成分の高周波歪み(即ち、折り返し歪み)が、その予測信号に含まれている場合が比較的多いので好ましくない。
The effect of the orthogonal transform coefficient weighting unit 46-2 will be described in detail. In principle, in order to completely represent the pixels of the separated image A and the separated image B, a 16 × 16 orthogonal transform coefficient is required, and the other signal (an isolated image in the embodiment) with an 8 × 8 orthogonal transform coefficient. In order to express the signal of the pixel position of B), there is insufficient information on the high frequency component. For this reason, when a decoded signal of the separated image A is simply generated from the prediction signal corresponding to the separated image B sent from the
即ち、これは、分離画像Aの画素ブロックと、分離画像Aをオーバーサンプリングすることによって得られる分離画像Bの画素位置に対応する画素ブロックとの間の基底のずれに起因している。より効率的な画像圧縮を実現するためには、画像信号のスペクトル分布として、より高周波成分が弱いことが好ましいため、このような高周波歪みを復号側で除去するのを可能とすることが好適となる。そこで、分離画像Bに対応する予測信号から分離画像Aの復号信号を生成する際に、直交変換係数重み付け部46−2により直交変換係数(DST係数)の周波数成分に重み付けをし、1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2により予測信号を生成することによって、上記高周波歪みを低減する。 That is, this is due to a base shift between the pixel block of the separated image A and the pixel block corresponding to the pixel position of the separated image B obtained by oversampling the separated image A. In order to realize more efficient image compression, it is preferable that the high-frequency component is weaker as the spectral distribution of the image signal. Therefore, it is preferable to be able to remove such high-frequency distortion on the decoding side. Become. Therefore, when generating the decoded signal of the separated image A from the prediction signal corresponding to the separated image B, the orthogonal transformation coefficient weighting unit 46-2 weights the frequency component of the orthogonal transformation coefficient (DST coefficient), and 1/2 The high-frequency distortion is reduced by generating a prediction signal by the pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DST type 2) 43-2.
以下、直交変換係数重み付け部46−2による直交変換係数への重み付けの導出方法について説明する。 Hereinafter, a method for deriving weights to orthogonal transform coefficients by the orthogonal transform coefficient weighting unit 46-2 will be described.
まず、分離画像A及び分離画像Bに関する基底のずれに関して説明する。図5に、図3の黒丸の画素(分離画像A)で構成されるDCT基底パターンを示す。図6に、図3の黒丸の画素(分離画像A)で構成されるDCT基底パターンから、1/2画素精度逆DCTによるオーバーサンプリングによって補間した、白丸の画素(分離画像B)の位置のDCT基底パターンを示す。いずれも白丸及び黒丸のみで構成される8×8画素のDCT基底パターンである。略同一の周波数成分を有する図5及び図6に示す基底パターンは、それぞれ位相が垂直・水平方向に1/2画素ずれたパターンである。従って、各基底パターンは、構成する信号の周波数成分は同じであり、両者に相関がある。 First, the base shift regarding the separated image A and the separated image B will be described. FIG. 5 shows a DCT base pattern composed of black circle pixels (separated image A) in FIG. FIG. 6 shows the DCT at the position of the white circle pixel (separated image B) interpolated from the DCT base pattern composed of the black circle pixels (separated image A) of FIG. Indicates the base pattern. Both are 8 × 8 pixel DCT base patterns composed of only white and black circles. The base patterns shown in FIGS. 5 and 6 having substantially the same frequency components are patterns whose phases are shifted by 1/2 pixel in the vertical and horizontal directions, respectively. Therefore, each base pattern has the same frequency component of the signal constituting it, and both are correlated.
しかしながら、各基底パターンを比較すると、高周波成分になるに従って、基底を構成する周波数の周期に対して画素のずれが大きくなるため、相関が低くなっていることが分かる。このような傾向は、一般的な動画像の性質として捉えることができる。同様に、画素間距離をより粗く分離画像を生成した場合も、空間的なずれが大きくなるに伴い、各基底パターンの相関が低くなる傾向がある。従って、本実施例の画像符号化装置10では、このような傾向を有したまま各分離画像の符号化データを送信するため、画像復号装置40により、この高周波成分を好適に抑圧することが必要になる。
However, comparing each base pattern, it can be seen that the correlation is low because the pixel shift increases with respect to the period of the frequency constituting the base as the high frequency component is obtained. Such a tendency can be grasped as a general moving image property. Similarly, when a separated image is generated with a coarser inter-pixel distance, the correlation between the base patterns tends to decrease as the spatial deviation increases. Therefore, since the
本実施例の画像符号化装置10は、分離画像Bの差分信号の直交変換としてDSTタイプ2を用いるので、分離画像Aの画素位置におけるDSTの(u,v)次の基底パターンをfu,v[x][y]、そのDSTタイプ2によって得られるDST係数をX[u][v]とおく。該X[u][v]の逆DSTをオーバーサンプリングし、得られる分離画像Bの画素位置の基底パターンをf’u,v[x][y]、また分離画像Bの画素位置を予測するための新たなDST係数をX’[u][v]とおく。(u,v)次の係数の重み付け係数wu,vは、以下に示す式(7)によって求められる。尚、Nは画素数(8×8画素の分離画像であれば、N=8)、x及びyは画素の位置座標、uは水平周波数、vは垂直周波数とする。
Since the
また、DST係数X’[u][v]は、重み付け係数wu,v及びDST係数X[u][v]から式(8)を用いて得られる。 Also, the DST coefficient X ′ [u] [v] is obtained from the weighting coefficient w u, v and the DST coefficient X [u] [v] using the equation (8).
分離画像Bの差分信号の直交変換としてDSTタイプ2を用いる重み付け係数wu,vのマトリクスは、表1のように表される。 A matrix of weighting coefficients w u, v using DST type 2 as orthogonal transform of the difference signal of the separated image B is expressed as shown in Table 1.
表1に示すマトリックスは、目的とする性能に応じて精度を設定し、画像符号化装置又は画像復号装置内のメモリ(例えばROMなど)に予め記憶しておき、DST係数の重み付け時に使用する。 The matrix shown in Table 1 sets the accuracy according to the target performance, is stored in advance in a memory (for example, ROM) in the image encoding device or the image decoding device, and is used when weighting the DST coefficients.
このように、直交変換係数重み付け部46−2では、分離画像Aの画素ブロックと、分離画像Aをオーバーサンプリングすることによって得られる分離画像Bの画素位置に対応する画素ブロックとの間の基底のずれを補正するための予め規定された重み付け係数のマトリクス(表1)を用いる。 As described above, the orthogonal transform coefficient weighting unit 46-2 calculates the basis between the pixel block of the separated image A and the pixel block corresponding to the pixel position of the separated image B obtained by oversampling the separated image A. A pre-defined matrix of weighting factors (Table 1) for correcting the deviation is used.
1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2は、直交変換係数重み付け部46−2から直交変換係数の信号X’[u][v]を入力し、1/2画素精度の逆直交変換を施す(例えば、式(6)に示す1/2画素精度の逆DSTタイプ2)。これにより、16×16画素の差分信号の画像情報として、分離画像Aの量子化誤差を予測するための信号(以下、量子化誤差予測信号)を生成し、制限部50に送出する。
The 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DST type 2) 43-2 inputs the signal X ′ [u] [v] of the orthogonal transform coefficient from the orthogonal transform coefficient weighting unit 46-2. Then, inverse orthogonal transform with 1/2 pixel accuracy is performed (for example, inverse DST type 2 with 1/2 pixel accuracy shown in Expression (6)). As a result, a signal for predicting the quantization error of the separated image A (hereinafter referred to as a quantization error prediction signal) is generated as image information of the difference signal of 16 × 16 pixels, and is sent to the
ここで、可変長復号部41がビットストリーム信号の先頭から復号を始めた場合には、可変長復号部41により、前述の分離画像Aの量子化情報及び量子化された直交変換係数情報に引き続き、分離画像Bの差分信号の量子化された直交変換係数情報が復号される。このようにして、逆量子化部42−2及び1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2により、分離画像Bの差分信号の8×8の直交変換係数から16×16画素の差分の画像情報の信号を生成し、分離画像Aの画素位置に対応する8×8の量子化誤差予測信号を生成することができる。
Here, when the variable
尚、1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2において、分離画像A及びBに対応する画素についてのみの逆変換を行うようにしてもよい。これにより、逆変換の演算回数を半分に減らすことができる。 Note that the 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DST type 2) 43-2 may perform the inverse transform only for the pixels corresponding to the separated images A and B. As a result, the number of inverse transform operations can be reduced to half.
制限部50は、逆直交変換部(逆DCTタイプ2)45−1により生成された分離画像Aの復号信号を入力すると共に、1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2から分離画像Aの量子化誤差予測信号を入力し、両者を比較し、分離画像Aの量子化誤差予測信号が所定の量子化範囲内の信号である場合に、当該分離画像Aの量子化誤差予測信号を出力し、所定の量子化範囲内の信号でない場合に、分離画像Aの量子化情報に基づいた信号を出力する。
The limiting
図7は、図4に示した制限部50の構成を示すブロック図である。制限部50の構成は、画像符号化装置10の直交変換部(DCTタイプ2)13−1における分離画像Aに用いた直交変換と同一の種類(即ち、DCTタイプ2)の直交変換部61と、逆直交変換部63とを備える。具体的には、この制限部50は、DCT(DCTタイプ2)部61と、比較部62と、IDCT(逆DCTタイプ2)部63とを備えている。
FIG. 7 is a block diagram showing a configuration of the limiting
DCT(DCTタイプ2)部61は、1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)43−2から分離画像Aの量子化誤差予測信号(8×8画素の差分の画像情報)を入力し、直交変換(DCTタイプ2)を施し、DCT係数を出力する。
The DCT (DCT type 2)
比較部62は、可変長復号部41から分離画像Aの量子化情報を、DCT(DCTタイプ2)部61からDCT係数を入力し、両者を比較する。量子化情報における各成分に対する量子化値をQ[u][v]、DCT係数における各成分の値をDCT[u][v]とすると、例えば以下に示す比較制限を行う。
for(u=0;u<8;u++){
for(v=0;v<8;v++){
if(DCT[u][v]>Q[u][v]/a) DCT[u][v]=Q[u][v]/a;
}
}
ここで、aは、システム設計によって予め設定される変数であり、例えばa=2.0である。即ち、DCT(DCTタイプ2)部61は、DCT[u][v]>Q[u][v]/aの場合に、Q[u][v]/a(制限したDCT係数)を出力し、DCT[u][v]≦Q[u][v]/aの場合に、DCT[u][v](DCT係数)を出力する。
The
for (u = 0; u <8; u ++) {
for (v = 0; v <8; v ++) {
if (DCT [u] [v]> Q [u] [v] / a) DCT [u] [v] = Q [u] [v] / a;
}
}
Here, a is a variable preset by system design, for example, a = 2.0. That is, the DCT (DCT type 2)
IDCT(逆DCTタイプ2)部63は、比較部62からDCT係数又は制限されたDCT係数を入力し、逆直交変換(逆DCTタイプ2)を行い、画素情報に変換して加算部48に出力する。
The IDCT (inverse DCT type 2)
図4において、加算部48は、逆直交変換部(逆DCTタイプ2)45−1から分離画像Aの復号信号と、制限部50からの画素情報の信号とをそれぞれ入力し、これらを加算して新たな分離画像Aの復号信号を出力する。即ち、加算部48は、分離画像Aの復号信号に、分離画像Aの量子化誤差予測信号又は制限された量子化誤差予測信号を加算し、新たな分離画像Aの復号信号を合成部51に送出する。また、加算部49は、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)43−1からの分離画像Bの予測信号と、逆直交変換部(逆DSTタイプ2)45−2から分離画像Bの予測差分信号とをそれぞれ入力し、これらを加算して分離画像Bの復号信号を出力する。即ち、加算部49は、分離画像Aから予測した分離画像Bの予測信号に、分離画像Bの予測差分信号を加算し、分離画像Bの復号信号を合成部51に出力する。
In FIG. 4, an
合成部51は、加算部48からの新たな分離画像Aの復号信号と、加算部49から分離画像Bの復号信号とをそれぞれ入力し、これらの復号信号を元の画像配置の信号に合成し、ベースバンド信号として図示しないメモリに格納する。
The synthesizing
このように、本発明の一実施例による画像復号装置40によれば、分離画像Aの量子化誤差予測信号又は制限した量子化誤差予測信号を用いて、分離画像Aの復号信号を生成すると共に、分離画像Bの予測差分信号を用いて、分離画像Bの復号信号を生成する。従って、上述した実施例による画像復号装置40であれば、復号側においてのみ重み付け処理を施したDST係数から生成した復号信号を原画像の再構成に用いるため、比較的簡素な構成で、再生品質を一層向上させた画像を得ることができる。
As described above, according to the
以上、実施例を挙げて本発明を説明したが、本発明は上記実施例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上記実施例は、符号化対象となる画素密度を1/2にした場合の符号化方法について説明した。即ち、画像符号化装置10において、分離部11が1/2の画素密度の分離画像A及びBを生成し、1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18が1/2画素逆直交変換を行うようにした。これに対し、分離部11が、1/4、1/16等の画素密度の分離画像を生成し、ゼロを除く自然数nとして、図示しない可変密度逆直交変換部(1/n画素逆直交変換部)が1/4、1/16等の画素逆直交変換を行うようにしてもよい。この場合、減算部19が、1/n画素逆直交変換部からの予測信号と分離画像の信号との間の差分信号を生成し、可変長符号化部15が、当該差分信号を用いて繰り返し符号化することにより、可変密度直交変換符号化を実現することができる。
The present invention has been described with reference to the embodiments. However, the present invention is not limited to the above embodiments, and various modifications can be made without departing from the technical idea thereof. For example, the above embodiment has described the encoding method when the pixel density to be encoded is halved. That is, in the
例えば、図1に示した1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)18に代わる1/n画素逆直交変換部は、前述した式(2)において、信号x及びyを1/n刻みにすればよいから、xをx/nとし、yをy/nとすることにより実現することができる。この場合の1/n画素精度逆変換式は、式(9)に示すとおりである。 For example, a 1 / n pixel inverse orthogonal transform unit that replaces the 1/2 pixel accuracy inverse orthogonal transform unit (1/2 pixel accuracy inverse DCT type 2) 18 shown in FIG. And y only in increments of 1 / n, this can be realized by setting x to x / n and y to y / n. In this case, the 1 / n pixel precision inverse conversion equation is as shown in Equation (9).
また、1/n画素の逆DSTも同様に導出することができる。 Also, the inverse DST of 1 / n pixels can be derived similarly.
また、上述した実施例では、分離画像の分離の仕方として最密な二つの分離画像として示したが、例えば図8に示すような画素配置の4つの分離画像に分割することも可能である。また、この場合の重み付け係数の導出方法は、前述と同様に、直交変換基底のオーバーサンプリングにより他の分離画像の画素位置の信号を補間し、その信号と直交変換基底との相関によって決めればよい。 In the above-described embodiment, the two separated images are shown as the closest separation method for separating the separated images. For example, the separated images can be divided into four separated images having a pixel arrangement as shown in FIG. Also, in this case, the weighting coefficient derivation method may be determined by interpolating the signal at the pixel position of another separated image by oversampling of the orthogonal transformation base and correlation between the signal and the orthogonal transformation base, as described above. .
更に、本発明の一態様として、画像符号化装置10又は画像復号装置40を、各装置として機能するコンピュータとしてそれぞれ構成させることができる。コンピュータに、前述した各構成要素(直交変換部など)を実現させるためのプログラムは、各コンピュータの内部又は外部に備えられる記憶部に記憶される。そのような記憶部は、外付けハードディスクなどの外部記憶装置、或いはROM又はRAMなどの内部記憶装置で実現することができる。各コンピュータに備えられる制御部は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。ここで、各成要素の機能をハードウェアの全部又は一部で実現しても良い。
Furthermore, as one aspect of the present invention, the
上述した実施例において、各構成要素の機能を実現するための処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録装置、半導体メモリ等どのようなものでもよい。 In the embodiment described above, the program describing the processing contents for realizing the function of each component can be recorded on a computer-readable recording medium. As the computer-readable recording medium, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording device, and a semiconductor memory may be used.
また、この処理内容を記述したプログラムを、例えばDVD又はCD‐ROMなどの可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばIPなどのネットワーク上にあるサーバの記憶部に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。 In addition, the program describing the processing contents can be distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM, and such a program can be distributed on a network such as an IP. The program can be distributed by storing the program in the storage unit of the server and transferring the program from the server to another computer via the network.
また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶部に記憶することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。尚、本態様におけるプログラムには、電子計算機の処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないが、コンピュータの処理を規定する性質を有するデータ等)を含むものとする。 In addition, a computer that executes such a program can temporarily store, for example, a program recorded on a portable recording medium or a program transferred from a server in its own storage unit. As another embodiment of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and each time the program is transferred from the server to the computer. In addition, the processing according to the received program may be executed sequentially. Note that the program in this aspect includes information provided for processing of an electronic computer and equivalent to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer). .
上述の実施例については代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。従って、本発明は、上述の実施例によって制限するものと解するべきではなく、特許請求の範囲によってのみ制限される。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many changes and substitutions can be made within the spirit and scope of the invention. Accordingly, the invention should not be construed as limited by the embodiments described above, but only by the claims.
本発明によれば、映像信号のイントラ符号化において圧縮率の高い符号化を実現することができるので、記録媒体の使用効率を上げ、映像伝送帯域の利用効率を上げることができるようになり、動画像を扱う記録媒体及び/又は記録システム、並びに放送システムに有用である。 According to the present invention, it is possible to realize high-compression encoding in intra-encoding of a video signal, so that it is possible to increase the usage efficiency of the recording medium and increase the usage efficiency of the video transmission band. This is useful for recording media and / or recording systems that handle moving images, and broadcast systems.
10 画像符号化装置
11 分離部
13−1 直交変換部(DCTタイプ2)
13−2 直交変換部(DSTタイプ2)
14−1 量子化部
14−2 量子化部
15 可変長符号化部
16 バッファ
17 逆量子化部
18 1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)
19 減算部
40 画像復号装置
41 可変長復号部
42−1,42−2 逆量子化部
43−1 1/2画素精度逆直交変換部(1/2画素精度逆DCTタイプ2)
43−2 1/2画素精度逆直交変換部(1/2画素精度逆DSTタイプ2)
45−1 逆直交変換部(逆DCTタイプ2)
45−2 逆直交変換部(逆DSTタイプ2)
46−2 直交変換係数重み付け部
48,49 加算部
50 制限部
51 合成部
61 DCT部
62 比較部
63 IDCT部
DESCRIPTION OF
13-2 Orthogonal transformation unit (DST type 2)
14-1 Quantization unit 14-2
19
43-2 1/2 Pixel Accuracy Inverse Orthogonal Transformer (1/2 Pixel Accuracy Inverse DST Type 2)
45-1 Inverse Orthogonal Transformer (Inverse DCT Type 2)
45-2 Inverse Orthogonal Transformer (Inverse DST Type 2)
46-2 Orthogonal transform
Claims (4)
前記小領域毎の画素信号について隣接画素を分離し、複数の分離画像を生成する分離部と、
前記複数の分離画像のうちの第1の分離画像の画素信号に対し第1のタイプの直交変換及び量子化を施す直交変換・量子化部と、
前記複数の分離画像のうちの他の分離画像の画素信号を予測するために、前記直交変換及び量子化が施された信号に対し、逆量子化を施す逆量子化部と、
前記逆量子化部から得られる直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像を予測する第1の逆直交変換部と、
前記第1の逆直交変換により予測された他の分離画像の予測信号と、前記分離部により生成された前記他の分離画像の信号との間の差分信号を求める減算器と、
前記差分信号に第2のタイプの直交変換及び量子化を施す差分信号直交変換・量子化部と、
前記差分信号直交変換・量子化部により前記差分信号に対し直交変換及び量子化が施された信号、及び、前記直交変換・量子化部により前記第1の分離画像に対し直交変換及び量子化が施された信号に、可変長符号化を施す可変長符号化部とを備え、
前記第1のタイプがDCTタイプ2であるときは、前記第2のタイプがDSTタイプ2であることを特徴とする画像符号化装置。 An image encoding device that performs orthogonal transform, quantization, and variable length encoding on a pixel signal for each small region constituting an image of a video signal,
A separation unit that separates adjacent pixels with respect to the pixel signal for each small region and generates a plurality of separated images;
An orthogonal transform / quantization unit that performs a first type of orthogonal transform and quantization on a pixel signal of a first separated image of the plurality of separated images;
An inverse quantization unit that performs inverse quantization on the signal subjected to the orthogonal transformation and quantization in order to predict a pixel signal of another separated image of the plurality of separated images;
A first inverse orthogonal transform unit that performs inverse orthogonal transform with 1 / n pixel accuracy on the orthogonal transform coefficient obtained from the inverse quantization unit as a natural number n excluding zero, and predicts the other separated image;
A subtractor for obtaining a difference signal between a prediction signal of another separated image predicted by the first inverse orthogonal transform and a signal of the other separated image generated by the separation unit;
A differential signal orthogonal transform / quantization unit for performing a second type of orthogonal transform and quantization on the differential signal;
The difference signal orthogonal transform / quantization unit performs orthogonal transform and quantization on the difference signal, and the orthogonal transform / quantization unit performs orthogonal transform and quantization on the first separated image. A variable-length coding unit that performs variable-length coding on the applied signal,
When the first type is DCT type 2, the second type is DST type 2, and the image coding apparatus is characterized in that:
前記画像符号化装置により符号化された信号を可変長復号する可変長復号部と、
前記画像符号化装置から得られる前記第1の分離画像の量子化信号に対して逆量子化を施して生成された第1の直交変換係数の信号に対し、逆直交変換を施して前記第1の分離画像の復号信号を生成する第2の逆直交変換部と、
前記第1の直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像に対応する予測信号を生成する第3の逆直交変換部と、
前記画像符号化装置から得られる前記他の分離画像の差分信号の量子化信号に対して逆量子化を施して生成された第2の直交変換係数の信号に対し、当該第2のタイプの逆直交変換を施して予測差分信号を生成する第4の逆直交変換部と、
前記第2の直交変換係数に、前記他の分離画像と前記第1の分離画像との間の相関に応じた第1の重み付け係数を加味する直交変換係数重み付け部と、
前記直交変換係数重み付け部の結果に対し、当該自然数nとして1/n画素精度で逆直交変換を施し、前記第1の分離画像の量子化誤差を予測するための量子化誤差予測信号を生成する第5の逆直交変換部と、
前記画像符号化装置から得られる信号に含まれている前記第1の分離画像の量子化情報を用いて、前記量子化誤差予測信号を制限する制限部と、
前記第2の逆直交変換部により生成された前記第1の分離画像の復号信号に、前記制限部により制限された前記量子化誤差予測信号を加算し、新たな第1の分離画像の復号信号を生成する第1の加算部と、
前記第3の逆直交変換部により生成された前記他の分離画像の予測信号に、前記第4の逆直交変換部により生成された前記予測差分信号を加算し、前記他の分離画像の復号信号を生成する第2の加算部と、
前記第1の加算部により生成された前記新たな第1の分離画像の復号信号、及び、前記第2の加算部により生成された前記他の分離画像の復号信号を合成する合成部と、
を備えることを特徴とする画像復号装置。 An image decoding apparatus for decoding a signal encoded by the image encoding apparatus according to claim 1,
A variable-length decoding unit for variable-length decoding the signal encoded by the image encoding device;
The first orthogonal transform coefficient signal generated by performing inverse quantization on the quantized signal of the first separated image obtained from the image encoding device is subjected to inverse orthogonal transform and the first orthogonal transform coefficient is generated. A second inverse orthogonal transform unit that generates a decoded signal of the separated image of
A third inverse orthogonal transform unit configured to perform inverse orthogonal transform with 1 / n pixel accuracy on the first orthogonal transform coefficient as a natural number n excluding zero and generate a prediction signal corresponding to the other separated image;
The inverse of the second type is applied to the signal of the second orthogonal transform coefficient generated by performing inverse quantization on the quantized signal of the difference signal of the other separated image obtained from the image encoding device. A fourth inverse orthogonal transform unit that performs orthogonal transform to generate a prediction difference signal;
An orthogonal transform coefficient weighting unit that adds a first weighting coefficient corresponding to the correlation between the other separated image and the first separated image to the second orthogonal transform coefficient;
The result of the orthogonal transform coefficient weighting unit is subjected to inverse orthogonal transform with 1 / n pixel accuracy as the natural number n to generate a quantization error prediction signal for predicting the quantization error of the first separated image. A fifth inverse orthogonal transform unit;
A limiting unit that limits the quantization error prediction signal using quantization information of the first separated image included in a signal obtained from the image encoding device;
The quantized error prediction signal limited by the limiting unit is added to the decoded signal of the first separated image generated by the second inverse orthogonal transform unit, and a new decoded signal of the first separated image is added. A first adder for generating
The prediction difference signal generated by the fourth inverse orthogonal transform unit is added to the prediction signal of the other separated image generated by the third inverse orthogonal transform unit, and the decoded signal of the other separated image is added. A second adder for generating
A combining unit that combines the decoded signal of the new first separated image generated by the first adding unit and the decoded signal of the other separated image generated by the second adding unit;
An image decoding apparatus comprising:
前記小領域毎の画素信号について隣接画素を分離し、複数の分離画像を生成する分離手段、
前記複数の分離画像のうちの第1の分離画像の画素信号に対し第1のタイプの直交変換及び量子化を施す直交変換・量子化手段、
前記複数の分離画像のうちの他の分離画像の画素信号を予測するために、前記直交変換及び量子化が施された信号に対し、逆量子化を施す逆量子化手段、
前記逆量子化手段から得られる直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像を予測する第1の逆直交変換手段、
前記第1の逆直交変換により予測された他の分離画像の予測信号と、前記分離手段により生成された前記他の分離画像の信号との間の差分信号を求める減算器、
前記差分信号に第2のタイプの直交変換及び量子化を施す差分信号直交変換・量子化手段、及び、
前記差分信号直交変換・量子化手段により前記差分信号に対し直交変換及び量子化が施された信号、及び、前記直交変換・量子化手段により前記第1の分離画像に対し直交変換及び量子化が施された信号に、可変長符号化を施す可変長符号化手段として機能させるための画像処理プログラムであって、
前記第1のタイプがDCTタイプ2であるときは、前記第2のタイプがDSTタイプ2であることを特徴とする画像処理プログラム。 A computer functioning as an image encoding device,
Separating means for separating adjacent pixels for the pixel signal for each small region and generating a plurality of separated images;
Orthogonal transform / quantization means for performing a first type of orthogonal transform and quantization on a pixel signal of a first separated image of the plurality of separated images;
Inverse quantization means for performing inverse quantization on the signals subjected to the orthogonal transformation and quantization in order to predict pixel signals of other separated images among the plurality of separated images;
A first inverse orthogonal transform unit that performs an inverse orthogonal transform with 1 / n pixel accuracy as a natural number n excluding zero with respect to the orthogonal transform coefficient obtained from the inverse quantization unit, and predicts the other separated image;
A subtractor for obtaining a difference signal between a prediction signal of another separated image predicted by the first inverse orthogonal transform and a signal of the other separated image generated by the separating unit;
A differential signal orthogonal transform / quantization means for subjecting the differential signal to a second type of orthogonal transform and quantization; and
The difference signal orthogonal transform / quantization means performs orthogonal transform and quantization on the difference signal, and the orthogonal transform / quantization means performs orthogonal transform and quantization on the first separated image. An image processing program for causing a given signal to function as variable length coding means for performing variable length coding,
An image processing program characterized in that when the first type is DCT type 2, the second type is DST type 2.
前記画像符号化装置により符号化された信号を可変長復号する可変長復号手段、
前記画像符号化装置から得られる前記第1の分離画像の量子化信号に対して逆量子化を施して生成された第1の直交変換係数の信号に対し、逆直交変換を施して前記第1の分離画像の復号信号を生成する第2の逆直交変換手段、
前記第1の直交変換係数に対し、ゼロを除く自然数nとして1/n画素精度で逆直交変換を施し、前記他の分離画像に対応する予測信号を生成する第3の逆直交変換手段、
前記画像符号化装置から得られる前記他の分離画像の差分信号の量子化信号に対して逆量子化を施して生成された第2の直交変換係数の信号に対し、当該第2のタイプの逆直交変換を施して予測差分信号を生成する第4の逆直交変換手段、
前記第2の直交変換係数に、前記他の分離画像と前記第1の分離画像との間の相関に応じた第1の重み付け係数を加味する直交変換係数重み付け手段、
前記直交変換係数重み付け手段の結果に対し、当該自然数nとして1/n画素精度で逆直交変換を施し、前記第1の分離画像の量子化誤差を予測するための量子化誤差予測信号を生成する第5の逆直交変換手段、
前記画像符号化装置から得られる信号に含まれている前記第1の分離画像の量子化情報を用いて、前記量子化誤差予測信号を制限する制限手段、
前記第2の逆直交変換手段により生成された前記第1の分離画像の復号信号に、前記制限手段により制限された前記量子化誤差予測信号を加算し、新たな第1の分離画像の復号信号を生成する第1の加算手段、
前記第3の逆直交変換手段により生成された前記他の分離画像の予測信号に、前記第4の逆直交変換手段により生成された前記予測差分信号を加算し、前記他の分離画像の復号信号を生成する第2の加算手段、
前記第1の加算手段により生成された前記新たな第1の分離画像の復号信号、及び、前記第2の加算手段により生成された前記他の分離画像の復号信号を合成する合成手段として機能させるための画像処理プログラム。 A computer functioning as an image decoding device that decodes a signal encoded by the image encoding device according to claim 1,
Variable length decoding means for variable length decoding the signal encoded by the image encoding device;
The first orthogonal transform coefficient signal generated by performing inverse quantization on the quantized signal of the first separated image obtained from the image encoding device is subjected to inverse orthogonal transform and the first orthogonal transform coefficient is generated. Second inverse orthogonal transform means for generating a decoded signal of the separated image of
A third inverse orthogonal transform unit that performs inverse orthogonal transform with 1 / n pixel accuracy on the first orthogonal transform coefficient as a natural number n excluding zero and generates a prediction signal corresponding to the other separated image;
The inverse of the second type is applied to the signal of the second orthogonal transform coefficient generated by performing inverse quantization on the quantized signal of the difference signal of the other separated image obtained from the image encoding device. A fourth inverse orthogonal transform unit that performs orthogonal transform to generate a prediction difference signal;
Orthogonal transform coefficient weighting means for adding a first weighting coefficient corresponding to the correlation between the other separated image and the first separated image to the second orthogonal transform coefficient;
The result of the orthogonal transform coefficient weighting unit is subjected to inverse orthogonal transform with 1 / n pixel accuracy as the natural number n to generate a quantization error prediction signal for predicting the quantization error of the first separated image. Fifth inverse orthogonal transform means;
Limiting means for limiting the quantization error prediction signal using quantization information of the first separated image included in the signal obtained from the image encoding device;
The quantized error prediction signal limited by the limiting unit is added to the decoded signal of the first separated image generated by the second inverse orthogonal transform unit, and a new decoded signal of the first separated image is added. First adding means for generating
The prediction difference signal generated by the fourth inverse orthogonal transform unit is added to the prediction signal of the other separated image generated by the third inverse orthogonal transform unit, and the decoded signal of the other separated image Second adding means for generating
Function as a combining unit that combines the decoded signal of the new first separated image generated by the first adding unit and the decoded signal of the other separated image generated by the second adding unit. Image processing program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023941A JP4825227B2 (en) | 2008-02-04 | 2008-02-04 | Image decoding apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023941A JP4825227B2 (en) | 2008-02-04 | 2008-02-04 | Image decoding apparatus and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009188514A true JP2009188514A (en) | 2009-08-20 |
JP4825227B2 JP4825227B2 (en) | 2011-11-30 |
Family
ID=41071375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008023941A Expired - Fee Related JP4825227B2 (en) | 2008-02-04 | 2008-02-04 | Image decoding apparatus and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4825227B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011205602A (en) * | 2010-03-05 | 2011-10-13 | Nippon Hoso Kyokai <Nhk> | Encoding apparatus, decoding apparatus, and program |
JP2011223068A (en) * | 2010-04-02 | 2011-11-04 | Nippon Hoso Kyokai <Nhk> | Encoder, decoder, and program |
WO2012053210A1 (en) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | Decoding method, encoding method, decoding device, and encoding device |
WO2012077347A1 (en) * | 2010-12-09 | 2012-06-14 | パナソニック株式会社 | Decoding method |
CN113557719A (en) * | 2019-03-11 | 2021-10-26 | 日本放送协会 | Image encoding device, image decoding device, and program |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0678294A (en) * | 1992-08-21 | 1994-03-18 | Sony Corp | Coding method, coder and decoder |
JPH10285595A (en) * | 1997-04-08 | 1998-10-23 | Matsushita Joho Syst Kk | Image data transmitter-receiver |
JPH1155678A (en) * | 1997-07-31 | 1999-02-26 | Victor Co Of Japan Ltd | Inter-block interpolation prediction coder, decoder, coding method and decoding method |
JP2002064823A (en) * | 2000-08-21 | 2002-02-28 | Matsushita Electric Ind Co Ltd | Apparatus and method for detecting scene change of compressed dynamic image as well as recording medium recording its program |
JP2004172657A (en) * | 2002-11-15 | 2004-06-17 | Nec Viewtechnology Ltd | Image decompression/compression apparatus, method, and program |
JP2004187036A (en) * | 2002-12-04 | 2004-07-02 | Canon Inc | Contour correction system |
JP2007151062A (en) * | 2005-10-28 | 2007-06-14 | Nippon Hoso Kyokai <Nhk> | Image encoding device, image decoding device and image processing system |
JP2008125002A (en) * | 2006-11-15 | 2008-05-29 | Nippon Hoso Kyokai <Nhk> | Image encoder, image decoder and image processing program |
-
2008
- 2008-02-04 JP JP2008023941A patent/JP4825227B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0678294A (en) * | 1992-08-21 | 1994-03-18 | Sony Corp | Coding method, coder and decoder |
JPH10285595A (en) * | 1997-04-08 | 1998-10-23 | Matsushita Joho Syst Kk | Image data transmitter-receiver |
JPH1155678A (en) * | 1997-07-31 | 1999-02-26 | Victor Co Of Japan Ltd | Inter-block interpolation prediction coder, decoder, coding method and decoding method |
JP2002064823A (en) * | 2000-08-21 | 2002-02-28 | Matsushita Electric Ind Co Ltd | Apparatus and method for detecting scene change of compressed dynamic image as well as recording medium recording its program |
JP2004172657A (en) * | 2002-11-15 | 2004-06-17 | Nec Viewtechnology Ltd | Image decompression/compression apparatus, method, and program |
JP2004187036A (en) * | 2002-12-04 | 2004-07-02 | Canon Inc | Contour correction system |
JP2007151062A (en) * | 2005-10-28 | 2007-06-14 | Nippon Hoso Kyokai <Nhk> | Image encoding device, image decoding device and image processing system |
JP2008125002A (en) * | 2006-11-15 | 2008-05-29 | Nippon Hoso Kyokai <Nhk> | Image encoder, image decoder and image processing program |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011205602A (en) * | 2010-03-05 | 2011-10-13 | Nippon Hoso Kyokai <Nhk> | Encoding apparatus, decoding apparatus, and program |
JP2011223068A (en) * | 2010-04-02 | 2011-11-04 | Nippon Hoso Kyokai <Nhk> | Encoder, decoder, and program |
WO2012053210A1 (en) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | Decoding method, encoding method, decoding device, and encoding device |
WO2012077347A1 (en) * | 2010-12-09 | 2012-06-14 | パナソニック株式会社 | Decoding method |
CN113557719A (en) * | 2019-03-11 | 2021-10-26 | 日本放送协会 | Image encoding device, image decoding device, and program |
CN113557719B (en) * | 2019-03-11 | 2023-09-12 | 日本放送协会 | Image encoding device, image decoding device, and program |
Also Published As
Publication number | Publication date |
---|---|
JP4825227B2 (en) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5957559B2 (en) | Video encoding / decoding method and apparatus using large size transform unit | |
RU2612614C2 (en) | Method and apparatus for performing interpolation based on transform and inverse transform | |
JP6245888B2 (en) | Encoder and encoding method | |
JP5686499B2 (en) | Image predictive encoding apparatus, method and program, image predictive decoding apparatus, method and program, and encoding / decoding system and method | |
JP2022514870A (en) | Intra prediction using linear or affine transformations with adjacent sample reduction | |
JP2005333622A (en) | Predictive reversible encoding of image and video | |
JPWO2014054267A1 (en) | Image coding apparatus and image coding method | |
CN105049855A (en) | Method for decoding a video | |
JP2016226001A (en) | Decoder and decoding method | |
JP6409516B2 (en) | Picture coding program, picture coding method, and picture coding apparatus | |
JP4825227B2 (en) | Image decoding apparatus and image processing program | |
JP4973886B2 (en) | Moving picture decoding apparatus, decoded picture recording apparatus, method and program thereof | |
JP4776505B2 (en) | Image encoding device, image decoding device, and image processing program | |
JP2012231505A (en) | Video encoding method enabling highly efficient partial decoding of h.264 and other transform coded information | |
JP2010098352A (en) | Image information encoder | |
JP2007329780A (en) | Method, apparatus and program for encoding moving image and recording medium recording the program | |
JP4580880B2 (en) | Image encoding apparatus, image decoding apparatus, and image processing system | |
US11218705B2 (en) | Information processing device and video encoding method | |
JP6875566B2 (en) | Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program | |
JP6016488B2 (en) | Video compression format conversion apparatus, video compression format conversion method, and program | |
JP2013017128A (en) | Intra-prediction mode estimation device, image encoder, image decoder and program | |
JP6557483B2 (en) | Encoding apparatus, encoding system, and program | |
JP2016076758A (en) | Reproducer, encoder, and reproduction method | |
JP6388476B2 (en) | Encoding apparatus and program | |
JP4411131B2 (en) | Encoded video playback device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110511 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110816 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4825227 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |