JP2024144780A - 予測装置、画像符号化装置、画像復号装置、及びプログラム - Google Patents
予測装置、画像符号化装置、画像復号装置、及びプログラム Download PDFInfo
- Publication number
- JP2024144780A JP2024144780A JP2024133213A JP2024133213A JP2024144780A JP 2024144780 A JP2024144780 A JP 2024144780A JP 2024133213 A JP2024133213 A JP 2024133213A JP 2024133213 A JP2024133213 A JP 2024133213A JP 2024144780 A JP2024144780 A JP 2024144780A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- image
- unit
- block
- intra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 43
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 43
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000001308 synthesis method Methods 0.000 abstract description 8
- 238000013139 quantization Methods 0.000 description 50
- 238000000034 method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 18
- 230000009466 transformation Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】予測画像合成手法によりイントラ予測の予測精度をさらに高める。
【解決手段】イントラ予測装置は、原画像を分割して得た画像ブロックに対するイントラ予測を行う。前記イントラ予測装置は、方向性予測である第1イントラ予測モードにより前記画像ブロックを予測して第1予測画像を生成する第1予測画像生成部と、非方向性予測である第2イントラ予測モードにより前記画像ブロックを予測して第2予測画像を生成する第2予測画像生成部と、前記画像ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて、前記第1予測画像及び前記第2予測画像を重み付け合成する際に用いる重み係数を決定する重み係数決定部と、前記重み係数決定部により決定された前記重み係数を用いて、前記第1予測画像及び前記第2予測画像を重み付け合成する画像合成部とを備える。
【選択図】図3
【解決手段】イントラ予測装置は、原画像を分割して得た画像ブロックに対するイントラ予測を行う。前記イントラ予測装置は、方向性予測である第1イントラ予測モードにより前記画像ブロックを予測して第1予測画像を生成する第1予測画像生成部と、非方向性予測である第2イントラ予測モードにより前記画像ブロックを予測して第2予測画像を生成する第2予測画像生成部と、前記画像ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて、前記第1予測画像及び前記第2予測画像を重み付け合成する際に用いる重み係数を決定する重み係数決定部と、前記重み係数決定部により決定された前記重み係数を用いて、前記第1予測画像及び前記第2予測画像を重み付け合成する画像合成部とを備える。
【選択図】図3
Description
本発明は、イントラ予測装置、画像符号化装置、画像復号装置、及びプログラムに関する。
静止画像や動画像の伝送時や保存時のデータ量圧縮のため、映像符号化方式の研究が行われている。近年、映像符号化技術では8K-SHVに代表されるような超高解像度映像の普及が進んでおり、膨大なデータ量の動画像を伝送するための手法としてAVC/H.264やHEVC/H.265などの符号化方式が知られている。
MPEG及びITUが合同で標準化を行っている次世代映像符号化方式であるVVCの評価用ソフトウェア(VTM)では、フレーム内の空間的な相関を利用したイントラ予測が利用されている(非特許文献1参照)。符号化対象の画像ブロックの周辺の復号済み参照画素を利用して、Planar予測、DC予測、及び65通りの方向性予測の、計67通りの予測モードから、エンコーダ側で最適なモードが選択され、その情報がデコーダ側へ送られる。
イントラ予測の予測精度を高めるための手法として、2つのイントラ予測モードによりそれぞれ予測画像を生成し、2つの予測画像の各画素を足し合わせて新しい予測画像を生成する予測画像合成手法が提案されている(非特許文献2参照)。具体的には、上述の65通りの方向性予測のうちいずれかのモードによって生成した予測画像である方向性予測画像と、Planarモードによって生成した予測画像であるPlanar予測画像とを足し合わせて予測画像を生成する。
JVET-L1001 "Versatile Video Coding (Draft 3)"
JVET-M0458 "Non-CE3: Combined-Hypothesis Intra-Prediction"
ところで、方向性予測は、参照画素に近い位置の画素については予測の精度が高いものの、参照画素から遠ざかるにつれて予測の精度が低くなりうるという欠点を有する。
しかしながら、非特許文献2に記載の予測画像合成手法は、方向性予測画像とPlanar予測画像とを単に画素単位で平均化するに過ぎないものであって、方向性予測の欠点について考慮しておらず、イントラ予測の予測精度をさらに高める点において改善の余地があった。
そこで、本発明は、予測画像合成手法によりイントラ予測の予測精度をさらに高めるイントラ予測装置、画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。
第1の態様に係るイントラ予測装置は、原画像を分割して得た画像ブロックに対するイントラ予測を行う。前記イントラ予測装置は、方向性予測である第1イントラ予測モードにより前記画像ブロックを予測して第1予測画像を生成する第1予測画像生成部と、非方向性予測である第2イントラ予測モードにより前記画像ブロックを予測して第2予測画像を生成する第2予測画像生成部と、前記画像ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて、前記第1予測画像及び前記第2予測画像を重み付け合成する際に用いる重み係数を決定する重み係数決定部と、前記重み係数決定部により決定された前記重み係数を用いて、前記第1予測画像及び前記第2予測画像を重み付け合成する画像合成部とを備える。
第2の態様に係る画像符号化装置は、第1の態様に係るイントラ予測装置を備える。
第3の態様に係る画像復号装置は、第1の態様に係るイントラ予測装置を備える。
第4の態様に係るプログラムは、コンピュータを第1の態様に係るイントラ予測装置として機能させる。
本発明によれば、予測画像合成手法によりイントラ予測の予測精度をさらに高めるイントラ予測装置、画像符号化装置、画像復号装置、及びプログラムを提供できる。
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号をそれぞれ行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
<画像符号化装置の構成>
まず、本実施形態に係る画像符号化装置について説明する。図1は、本実施形態に係る画像符号化装置1の構成を示す図である。
まず、本実施形態に係る画像符号化装置について説明する。図1は、本実施形態に係る画像符号化装置1の構成を示す図である。
図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換・量子化部120と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、メモリ160と、予測部170とを有する。
ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像である原画像を複数の画像ブロックに分割し、分割により得た画像ブロックを減算部110に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックの形状は正方形に限らず長方形(矩形)であってもよい。画像ブロックは、画像符号化装置1が符号化を行う単位(符号化対象ブロック)であり、且つ画像復号装置が復号を行う単位(復号対象ブロック)である。かかる画像ブロックはCU(Coding Unit)と呼ばれることがある。
減算部110は、ブロック分割部100から入力された符号化対象ブロックと、符号化対象ブロックを予測部170が予測して得た予測画像との差分(誤差)を表す予測残差を算出する。具体的には、減算部110は、ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換・量子化部120に出力する。
変換・量子化部120は、ブロック単位で直交変換処理及び量子化処理を行う。変換・量子化部120は、変換部121と、量子化部122とを有する。
変換部121は、減算部110から入力された予測残差に対して直交変換処理を行って直交変換係数を算出し、算出した直交変換係数を量子化部122に出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: Karhunen-Loeve Transform)等をいう。
量子化部122は、変換部121から入力された直交変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化した直交変換係数をエントロピー符号化部130及び逆量子化・逆変換部140に出力する。なお、量子化パラメータ(Qp)は、ブロック内の各直交変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各直交変換係数を量子化する際の量子化値を要素として有する行列である。
エントロピー符号化部130は、量子化部122から入力された直交変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部130は、予測部170から予測に関するシンタックス等の情報が入力され、入力された情報のエントロピー符号化も行う。
逆量子化・逆変換部140は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部140は、逆量子化部141と、逆変換部142とを有する。
逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122から入力された直交変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより直交変換係数を復元し、復元した直交変換係数を逆変換部142に出力する。
逆変換部142は、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部121が離散コサイン変換を行った場合には、逆変換部142は逆離散コサイン変換を行う。逆変換部142は、逆量子化部141から入力された直交変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。
合成部150は、逆変換部142から入力された復元予測残差を、予測部170から入力された予測画像と画素単位で合成する。合成部150は、復元予測残差の各画素値と予測画像の各画素値を加算して符号化対象ブロックを再構成(復号)し、復号したブロック単位の復号画像をメモリ160に出力する。かかる復号画像は、再構成画像と呼ばれることがある。
メモリ160は、合成部150から入力された復号画像を記憶する。メモリ160は、復号画像をフレーム単位で記憶する。メモリ160は、記憶している復号画像を予測部170に出力する。なお、合成部150とメモリ160との間にループフィルタが設けられてもよい。なお、メモリ160の一部は、予測部170に含まれていてもよい。
予測部170は、ブロック単位で予測を行う。予測部170は、インター予測部171と、イントラ予測部172と、切替部173とを有する。
インター予測部171は、メモリ160に記憶された復号画像を参照画像として用いて、ブロックマッチングなどの手法により動きベクトルを算出し、符号化対象ブロックを予測してインター予測画像を生成し、生成したインター予測画像を切替部173に出力する。
インター予測部171は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部171は、インター予測に関する情報(動きベクトル等)をエントロピー符号化部130に出力する。
イントラ予測部172は、メモリ160に記憶された復号画像のうち、符号化対象ブロックの周辺にある復号画素値を参照してイントラ予測画像を生成し、生成したイントラ予測画像を切替部173に出力する。また、イントラ予測部172は、選択した予測モードに関するシンタックスをエントロピー符号化部130に出力する。以下において、イントラ予測の対象となるブロックをイントラ予測対象ブロックと呼ぶ。
イントラ予測部172は、複数の予測モードの中から、イントラ予測対象ブロックに適用する最適な予測モードを選択し、選択した予測モードを用いてイントラ予測対象ブロックを予測する。
図2は、本実施形態に係るイントラ予測の予測モードを示す図である。図2に示すように、0から66までの67通りの予測モードがある。予測モードのモード「0」はPlanar予測であり、予測モードのモード「1」はDC予測であり、予測モードのモード「2」乃至「66」は方向性予測である。方向性予測において、矢印の方向は予測方向を示し、矢印の起点は予測対象の画素の位置を示し、矢印の終点はこの予測対象画素の予測に用いる参照画素の位置を示す。モード「2」~「33」は、イントラ予測の対象ブロックの左側の参照画素を主として参照する予測モードである。一方で、モード「35」~「66」は、イントラ予測の対象ブロックの上側の参照画素を主として参照する予測モードである。
切替部173は、インター予測部171から入力されるインター予測画像とイントラ予測部172から入力されるイントラ予測画像とを切り替えて、いずれかの予測画像を減算部110及び合成部150に出力する。
図3は、本実施形態に係るイントラ予測部172の構成を示す図である。イントラ予測部172は、画像符号化装置1に設けられるイントラ予測装置に相当する。
図3に示すように、イントラ予測部172は、メモリ160aと、第1予測画像生成部172aと、第2予測画像生成部172bと、重み係数決定部172cと、画像合成部172dとを有する。
メモリ160aは、図1に示すメモリ160の一部である。メモリ160aは、イントラ予測の際に参照される復号済み画素である参照画素を記憶する。
第1予測画像生成部172aは、方向性予測である第1イントラ予測モードによりイントラ予測対象ブロックを予測して方向性予測画像(第1予測画像)を生成し、生成した方向性予測画像を画像合成部172dに出力する。具体的には、第1予測画像生成部172aは、メモリ160aに記憶された参照画素を参照し、65通りの方向性予測のうちいずれかのモードによって方向性予測画像を生成する。
第2予測画像生成部172bは、非方向性予測である第2イントラ予測モードによりイントラ予測対象ブロックを予測して予測画像(第2予測画像)を生成し、生成した予測画像を画像合成部172dに出力する。具体的には、第2予測画像生成部172bは、メモリ160aに記憶された参照画素を参照し、予め定められた非方向性の第2イントラ予測モードによって方向性予測画像を生成する。
第2イントラ予測モードは、非方向性の予測モードであればどのような予測モードであってもよいが、本実施形態において第2イントラ予測モードがPlanar予測である一例について説明する。
重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を画像合成部172dに出力する。重み係数決定部172cが出力する重み係数は、第1予測画像生成部172aが生成する方向性予測画像及び第2予測画像生成部172bが生成するPlanar予測画像を重み付け合成する際に用いられる。
画像合成部172dは、重み係数決定部172cから入力された重み係数を用いて、第1予測画像生成部172aから入力された方向性予測画像及び第2予測画像生成部172bから入力されたPlanar予測画像を重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する。
図4は、本実施形態に係るイントラ予測部172の動作例を示す図である。図4において、イントラ予測対象ブロックが8×8画素の正方形状である一例を例示しているが、イントラ予測対象ブロックは正方形でなくてもよい。また、図4における黒丸は参照画素を表す。
図4(a)に示すように、第2予測画像生成部172bは、Planar予測によりイントラ予測対象ブロックを予測してPlanar予測画像を生成する。具体的には、Planar予測は、図4(a)に示す4つの参照画素を用いて内挿予測により予測画素値を生成するものである。
図4(b)に示すように、第1予測画像生成部172aは、方向性予測モードによりイントラ予測対象ブロックを予測して方向性予測画像を生成する。方向性予測は、参照画素を予測方向に沿って外挿して予測画素値を生成するものであるため、参照画素に近い位置の画素については予測の精度が高いものの、参照画素から遠ざかるにつれて予測の精度が低くなりうるという欠点を有する。
重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定する。本実施形態において、重み係数決定部172cは、Planar予測画像に適用する重み係数α(第2重み係数)と、方向性予測画像に適用する重み係数β(第1重み係数)とを決定する。
図4(c)に示すように、画像合成部172dは、第1予測画像生成部172aが生成した方向性予測画像の画素ごとに重み係数βを適用するとともに、第2予測画像生成部172bが生成したPlanar予測画像の画素ごとに重み係数αを適用し、且つ、方向性予測画像及びPlanar予測画像を画素単位で合成し、合成後の予測画像をイントラ予測画像として出力する。
図5は、本実施形態に係る重み係数決定部172cの動作例1を示す図である。図5において、「小さい一辺の長さ」は、矩形状のイントラ予測対象ブロックの短辺の長さを画素数で表したものである。すなわち、「小さい一辺の長さ」は、イントラ予測対象ブロックのブロックサイズを表す。一方、図5の「α:β」は、重み係数αの重み係数βに対する比を表す。
ここではイントラ予測対象ブロックのブロックサイズを示す一例として「小さい一辺の長さ」を提示したが、ほかの例として「ブロックの幅+ブロックの高さ」や「ブロックの幅×ブロックの高さ」などを用いても構わない。
図5に示すように、重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズが大きくなるにつれて、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を大きくするように、重み係数α及びβを決定する。
図5に示す例において、ブロックサイズが「8」である場合、Planar予測画像の重み(α)と方向性予測画像の重み(β)とが等しい。この場合、画像合成部172dは、Planar予測画像と方向性予測画像との平均をとって得た予測画像をイントラ予測画像として出力する。以下において、ブロックサイズ「8」を基準ブロックサイズと呼ぶ。
基準ブロックサイズよりも小さいブロックサイズ「4」である場合、重み係数決定部172cは、Planar予測画像の重み(α=1)が方向性予測画像の重み(β=2)よりも小さくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が小さくなる。
一方、重み係数決定部172cは、基準ブロックサイズよりもブロックサイズが大きくなるにつれて、Planar予測画像の重み(α)が方向性予測画像の重み(β)よりも大きくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が大きくなる。
ここで、方向性予測においては、イントラ予測対象ブロックのブロックサイズが大きくなるほど、参照画素から遠い画素の予測精度が低くなりうる。このため、Planar予測画像の占める割合を大きくし、且つ、方向性予測画像の占める割合を小さくするように重み係数α及びβを決定することにより、予測精度を改善できる。
なお、図5に示す重み係数α及びβの決定方法は一例であって、重み係数α及びβの具体的な値については図5に示す例に限定されるものではない。
図6は、本実施形態に係る重み係数決定部172cの動作例2を示す図である。図6において、「width/heightまたはheight/widthの大きい方」は、イントラ予測対象ブロックについて、幅(width)/高さ(height)の値、高さ(height)/幅(width)の値のうち、大きい方の値である。すなわち、「width/heightまたはheight/widthの大きい方」は、イントラ予測対象ブロックが細長形状であるほど大きくなる値である。一方、図6の「α:β」は、重み係数αの重み係数βに対する比を表す。
図6に示すように、重み係数決定部172cは、矩形状のイントラ予測対象ブロックの短辺に対する長辺の比が大きくなるにつれて、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を小さくするように、重み係数α及びβを決定する。なお、短辺とは矩形の短い方の辺をいい、長辺とは矩形の長い方の辺をいう。
言い換えると、重み係数決定部172cは、イントラ予測対象ブロックが細長形状であるほど、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を小さくするように、重み係数α及びβを決定する。
図6に示す例において、「width/heightまたはheight/widthの大きい方」が「1」である場合、すなわち、イントラ予測対象ブロックが正方形である場合、Planar予測画像の重み(α)と方向性予測画像の重み(β)とが等しい。この場合、画像合成部172dは、Planar予測画像と方向性予測画像との平均をとって得た予測画像をイントラ予測画像として出力する。以下において、正方形のイントラ予測対象ブロックを基準形状と呼ぶ。
重み係数決定部172cは、イントラ予測対象ブロックが基準形状(正方形)から細長形状に変化するにつれて、Planar予測画像の重み(α)が方向性予測画像の重み(β)よりも小さくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が小さくなる。
ここで、方向性予測においては、イントラ予測対象ブロックが細長形状であるほど、参照画素から遠く離れた画素を予測する可能性が小さくなり、予測精度が高くなりうる。このため、Planar予測画像の占める割合を小さくし、且つ、方向性予測画像の占める割合を大きくするように重み係数α及びβを決定することにより、予測精度を改善できる。
なお、図6に示す重み係数α及びβの決定方法は一例であって、重み係数α及びβの具体的な値については図6に示す例に限定されるものではない。
また、重み係数決定部172cの動作例1と動作例2とを組み合わせて実施してもよい。例えば、「小さい一辺の長さ」(すなわち、ブロックサイズ)の値ごとに、図6のようなテーブルを別々に定義してもよい。或いは、「width/heightまたはheight/widthの大きい方」の値ごとに、図5のようなテーブルを別々に定義してもよい。
<画像復号装置の構成>
次に、本実施形態に係る画像復号装置について説明する。図7は、本実施形態に係る画像復号装置2の構成を示す図である。
次に、本実施形態に係る画像復号装置について説明する。図7は、本実施形態に係る画像復号装置2の構成を示す図である。
図7に示すように、画像復号装置2は、エントロピー復号部200と、逆量子化・逆変換部210と、合成部220と、メモリ230と、予測部240とを有する。
エントロピー復号部200は、画像符号化装置1により生成された符号化データを復号し、量子化された直交変換係数を逆量子化・逆変換部210に出力する。また、エントロピー復号部200は、予測(イントラ予測及びインター予測)に関するシンタックスを取得し、取得したシンタックスを予測部240に出力する。
逆量子化・逆変換部210は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部210は、逆量子化部211と、逆変換部212とを有する。
逆量子化部211は、画像符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー復号部200から入力された量子化直交変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、復号対象ブロックの直交変換係数を復元し、復元した直交変換係数を逆変換部212に出力する。
逆変換部212は、画像符号化装置1の変換部121が行う直交変換処理に対応する逆直交変換処理を行う。逆変換部212は、逆量子化部211から入力された直交変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部220に出力する。
合成部220は、逆変換部212から入力された予測残差と、予測部240から入力された予測画像とを画素単位で合成することにより、元のブロックを再構成(復号)し、ブロック単位の復号画像をメモリ230に出力する。
メモリ230は、合成部220から入力された復号画像を記憶する。メモリ230は、復号画像をフレーム単位で記憶する。メモリ230は、フレーム単位の復号画像を画像復号装置2の外部に出力する。なお、合成部220とメモリ230との間にループフィルタが設けられてもよい。また、メモリ230の一部は、予測部240に含まれていてもよい。
予測部240は、ブロック単位で予測を行う。予測部240は、インター予測部241と、イントラ予測部242と、切替部243とを有する。
インター予測部241は、メモリ230に記憶された復号画像を参照画像として用いて、復号対象ブロックをインター予測により予測する。インター予測部241は、エントロピー復号部200から入力されたシンタックス及び動きベクトル等に従ってインター予測を行うことによりインター予測画像を生成し、生成したインター予測画像を切替部243に出力する。
イントラ予測部242は、メモリ230に記憶された復号画像を参照し、エントロピー復号部200から入力されたシンタックスに基づいて、復号対象ブロックをイントラ予測により予測することによりイントラ予測画像を生成し、生成したイントラ予測画像を切替部243に出力する。
切替部243は、インター予測部241から入力されるインター予測画像とイントラ予測部242から入力されるイントラ予測画像とを切り替えて、いずれかの予測画像を合成部220に出力する。
図8は、本実施形態に係るイントラ予測部242の構成を示す図である。イントラ予測部242は、画像復号装置2に設けられるイントラ予測装置に相当する。イントラ予測部242は、画像符号化装置1に設けられるイントラ予測部172と同様な動作を行う。
図8に示すように、イントラ予測部242は、メモリ230aと、第1予測画像生成部242aと、第2予測画像生成部242bと、重み係数決定部242cと、画像合成部242dとを有する。
メモリ230aは、図7に示すメモリ230の一部である。メモリ230aは、イントラ予測の際に参照される復号済み画素である参照画素を記憶する。
第1予測画像生成部242aは、方向性予測である第1イントラ予測モードによりイントラ予測対象ブロックを予測して方向性予測画像(第1予測画像)を生成し、生成した方向性予測画像を画像合成部242dに出力する。具体的には、第1予測画像生成部242aは、メモリ230aに記憶された参照画素を参照し、エントロピー復号部200から入力されたシンタックスが示す方向性予測モードによって方向性予測画像を生成する。
第2予測画像生成部242bは、非方向性予測である第2イントラ予測モードによりイントラ予測対象ブロックを予測して予測画像(第2予測画像)を生成し、生成した予測画像を画像合成部242dに出力する。具体的には、第2予測画像生成部242bは、メモリ230aに記憶された参照画素を参照し、予め定められた非方向性の第2イントラ予測モードによって方向性予測画像を生成する。本実施形態において第2イントラ予測モードはPlanar予測である。
重み係数決定部242cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を画像合成部242dに出力する。イントラ予測対象ブロックのブロックサイズ及びブロック形状は、エントロピー復号部200から重み係数決定部242cに入力される。重み係数決定部242cの動作は、上述した動作例1及び2と同じ動作である。
画像合成部242dは、重み係数決定部242cから入力された重み係数を用いて、第1予測画像生成部242aから入力された方向性予測画像及び第2予測画像生成部242bから入力されたPlanar予測画像を重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する。
<イントラ予測の動作フロー例>
次に、本実施形態に係るイントラ予測の動作フロー例について説明する。画像符号化装置1及び画像復号装置2でイントラ予測の動作は同じであるが、ここでは画像復号装置2におけるイントラ予測(イントラ予測部242)の動作を説明する。図9は、イントラ予測部242の動作フロー例を示す図である。
次に、本実施形態に係るイントラ予測の動作フロー例について説明する。画像符号化装置1及び画像復号装置2でイントラ予測の動作は同じであるが、ここでは画像復号装置2におけるイントラ予測(イントラ予測部242)の動作を説明する。図9は、イントラ予測部242の動作フロー例を示す図である。
第1に、エントロピー復号部200は、画像符号化装置1により選択されたイントラ予測モードを示すシンタックスを復号する。このシンタックスが方向性予測モード以外のモード(DC予測又はPlanar予測)を示す場合(ステップS1:NO)、イントラ予測部242は、従来と同様なイントラ予測を行う(ステップS7)。
第2に、エントロピー復号部200は、予測画像合成手法を適用するか否かを示すシンタックスを復号する。このシンタックスが予測画像合成手法を適用しないことを示す場合(ステップS2:NO)、イントラ予測部242は、従来と同様なイントラ予測を行う(ステップS7)。但し、画像符号化装置1により選択されたイントラ予測モードが方向性予測モードである場合、常に予測画像合成手法を適用するとしてもよい。この場合、予測画像合成手法を適用するか否かを示すシンタックスのシグナリングは不要である。
第3に、画像符号化装置1により選択されたイントラ予測モードが方向性予測であり(ステップS1:YES)、且つ、予測画像合成手法を適用する場合(ステップS2:YES)、重み係数決定部242cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数α及びβを決定する(ステップS3)。
第4に、第1予測画像生成部242aは、画像符号化装置1により選択された方向性予測モードによりイントラ予測対象ブロックを予測して方向性予測画像を生成する(ステップS4)。また、第2予測画像生成部242bは、Planar予測によりイントラ予測対象ブロックを予測してPlanar予測画像を生成する(ステップS5)。
第5に、画像合成部242dは、ステップS3で決定された重み係数α及びβを用いて、ステップS4で生成された方向性予測画像とステップS5で生成されたPlanar予測画像とを重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する(ステップS6)。
<実施形態のまとめ>
本実施形態に係る画像符号化装置1及び画像復号装置2は、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を用いて方向性予測画像及びPlanar予測画像を重み付け合成する。これにより、予測画像合成手法において、方向性予測画像とPlanar予測画像とを単に平均化する場合に比べて、イントラ予測の予測精度を高めることができる。
本実施形態に係る画像符号化装置1及び画像復号装置2は、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を用いて方向性予測画像及びPlanar予測画像を重み付け合成する。これにより、予測画像合成手法において、方向性予測画像とPlanar予測画像とを単に平均化する場合に比べて、イントラ予測の予測精度を高めることができる。
<その他の実施形態>
上述した実施形態において、第2イントラ予測モードがPlanar予測である一例について主として説明した。しかしながら、第2イントラ予測モードは、Plane予測であってもよい。第2イントラ予測モードがPlane予測である場合、上述した実施形態における「Planar予測」を「Plane予測」と読み替えればよい。
上述した実施形態において、第2イントラ予測モードがPlanar予測である一例について主として説明した。しかしながら、第2イントラ予測モードは、Plane予測であってもよい。第2イントラ予測モードがPlane予測である場合、上述した実施形態における「Planar予測」を「Plane予測」と読み替えればよい。
或いは、第2イントラ予測モードは、DC予測であってもよい。第2イントラ予測モードがDC予測である場合、上述した実施形態における「Planar予測」を「DC予測」と読み替えればよい。
画像符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。画像復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
1 :画像符号化装置
2 :画像復号装置
100 :ブロック分割部
110 :減算部
120 :変換・量子化部
121 :変換部
122 :量子化部
130 :エントロピー符号化部
140 :逆量子化・逆変換部
141 :逆量子化部
142 :逆変換部
150 :合成部
160 :メモリ
160a :メモリ
170 :予測部
171 :インター予測部
172 :イントラ予測部
172a :第1予測画像生成部
172b :第2予測画像生成部
172c :重み係数決定部
172d :画像合成部
173 :切替部
200 :エントロピー復号部
210 :逆量子化・逆変換部
211 :逆量子化部
212 :逆変換部
220 :合成部
230 :メモリ
230a :メモリ
240 :予測部
241 :インター予測部
242 :イントラ予測部
242a :第1予測画像生成部
242b :第2予測画像生成部
242c :重み係数決定部
242d :画像合成部
243 :切替部
2 :画像復号装置
100 :ブロック分割部
110 :減算部
120 :変換・量子化部
121 :変換部
122 :量子化部
130 :エントロピー符号化部
140 :逆量子化・逆変換部
141 :逆量子化部
142 :逆変換部
150 :合成部
160 :メモリ
160a :メモリ
170 :予測部
171 :インター予測部
172 :イントラ予測部
172a :第1予測画像生成部
172b :第2予測画像生成部
172c :重み係数決定部
172d :画像合成部
173 :切替部
200 :エントロピー復号部
210 :逆量子化・逆変換部
211 :逆量子化部
212 :逆変換部
220 :合成部
230 :メモリ
230a :メモリ
240 :予測部
241 :インター予測部
242 :イントラ予測部
242a :第1予測画像生成部
242b :第2予測画像生成部
242c :重み係数決定部
242d :画像合成部
243 :切替部
Claims (6)
- 原画像を分割して得た画像ブロックに対する予測を行う予測装置であって、
第1予測モードにより前記画像ブロックを予測して第1予測画像を生成する第1予測画像生成部と、
第2予測モードにより前記画像ブロックを予測して第2予測画像を生成する第2予測画像生成部と、
前記画像ブロックのブロック形状に基づいて、前記第1予測画像及び前記第2予測画像を重み付け合成する際に用いる重み係数を決定する重み係数決定部と、
前記重み係数決定部により決定された前記重み係数を用いて、前記第1予測画像及び前記第2予測画像を重み付け合成する画像合成部と、を備える
予測装置。 - 前記第1予測モードは、方向性予測のイントラ予測モードである
請求項1に記載の予測装置。 - 前記第2予測モードは、非方向性予測の予測モードである
請求項1に記載の予測装置。 - 請求項1ないし請求項3のいずれか1項に記載の予測装置を備える
画像符号化装置。 - 請求項1ないし請求項3のいずれか1項に記載の予測装置を備える
画像復号装置。 - コンピュータを請求項1ないし請求項3のいずれか1項に記載の予測装置として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019023028 | 2019-02-12 | ||
JP2019023028 | 2019-02-12 | ||
JP2020020957A JP7537879B2 (ja) | 2019-02-12 | 2020-02-10 | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020020957A Division JP7537879B2 (ja) | 2019-02-12 | 2020-02-10 | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024144780A true JP2024144780A (ja) | 2024-10-11 |
Family
ID=72263785
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020020957A Active JP7537879B2 (ja) | 2019-02-12 | 2020-02-10 | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |
JP2024133213A Pending JP2024144780A (ja) | 2019-02-12 | 2024-08-08 | 予測装置、画像符号化装置、画像復号装置、及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020020957A Active JP7537879B2 (ja) | 2019-02-12 | 2020-02-10 | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7537879B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7483422B2 (ja) * | 2019-03-15 | 2024-05-15 | 日本放送協会 | イントラ予測装置、画像復号装置、及びプログラム |
CN114938453B (zh) * | 2022-07-19 | 2022-09-30 | 深流微智能科技(深圳)有限公司 | 视频编码方法、芯片、存储介质及计算机设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116915985A (zh) | 2016-10-04 | 2023-10-20 | Lx 半导体科技有限公司 | 图像编码/解码方法和发送方法 |
-
2020
- 2020-02-10 JP JP2020020957A patent/JP7537879B2/ja active Active
-
2024
- 2024-08-08 JP JP2024133213A patent/JP2024144780A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2020137119A (ja) | 2020-08-31 |
JP7537879B2 (ja) | 2024-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8780980B2 (en) | Video image encoding device | |
JP2024144780A (ja) | 予測装置、画像符号化装置、画像復号装置、及びプログラム | |
WO2020036132A1 (ja) | 画像符号化装置、画像復号装置、及びプログラム | |
JP2023168518A (ja) | 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム | |
JP2022000953A (ja) | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム | |
JP7415067B2 (ja) | イントラ予測装置、画像復号装置、及びプログラム | |
JP7229413B2 (ja) | 画像符号化装置、画像復号装置、及びプログラム | |
JP2022093657A (ja) | 符号化装置、復号装置、及びプログラム | |
JP2024053019A (ja) | 符号化装置、復号装置、及びプログラム | |
JP2023138826A (ja) | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム | |
JP7483422B2 (ja) | イントラ予測装置、画像復号装置、及びプログラム | |
JP7229682B2 (ja) | ループフィルタ制御装置、画像符号化装置、画像復号装置、及びプログラム | |
WO2020059616A1 (ja) | 画像符号化装置、画像復号装置、及びプログラム | |
JP7531683B2 (ja) | 符号化装置、復号装置、及びプログラム | |
JP2021129148A (ja) | 予測装置、符号化装置、復号装置、及びプログラム | |
JP7361498B2 (ja) | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム | |
JP7449690B2 (ja) | インター予測装置、画像符号化装置、画像復号装置、及びプログラム | |
JP7515266B2 (ja) | イントラ予測装置、画像復号装置、及びプログラム | |
JP2020109960A (ja) | イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240808 |