JP2023516249A - ビデオの符号化及び復号のための高レベルシンタックス - Google Patents
ビデオの符号化及び復号のための高レベルシンタックス Download PDFInfo
- Publication number
- JP2023516249A JP2023516249A JP2022542498A JP2022542498A JP2023516249A JP 2023516249 A JP2023516249 A JP 2023516249A JP 2022542498 A JP2022542498 A JP 2022542498A JP 2022542498 A JP2022542498 A JP 2022542498A JP 2023516249 A JP2023516249 A JP 2023516249A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- slice
- bitstream
- header
- flag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 101
- 230000000670 limiting effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 abstract description 11
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 73
- 241000023320 Luma <angiosperm> Species 0.000 description 65
- 238000004891 communication Methods 0.000 description 36
- 238000013507 mapping Methods 0.000 description 29
- 239000013598 vector Substances 0.000 description 25
- 230000006870 function Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 230000015654 memory Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 9
- 238000000926 separation method Methods 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 6
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 101150039623 Clip1 gene Proteins 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 235000019395 ammonium persulphate Nutrition 0.000 description 3
- 238000000261 appearance potential spectroscopy Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920000069 polyphenylene sulfide Polymers 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
前記方法は、少なくとも1つのシンタックス要素が復号対象のピクチャが1つのスライスを含むことを示すとき、サブピクチャの存在を示すシンタックス要素の値を、サブピクチャが使用されないことを示す値に制限することをさらに有する。サブピクチャの存在を示すシンタックス要素は、サブピクチャ情報が存在するかどうかを示すフラグを含むことができる。
復号太陽のピクチャが1つのスライスを含むことを示す少なくとも1つのシンタックス要素は、ラスタスキャンスライスモードが有効であることを示すシンタックス要素を含み、ピクチャ内のタイルの数が1より大きいことを示すシンタックス要素を含み、スライス内のタイルの数がピクチャ内のタイルの数と等しいことを示すシンタックス要素を含み得る。
この態様の利点は、ビットストリームの矛盾を避けることである。実際、独立して符号化されたカラープレーンを含むピクチャは、いくつかのスライスを有する。したがって、現在のピクチャ内に1つのスライスのみを有することは不可能である。さらに、一部の実装ではスライスヘッダの解析が簡素化される。
オプションとして、本方法は、カラーピクチャのカラープレーンが分離され、ピクチャヘッダがスライスヘッダ内に位置するとき、カラープレーン識別子シンタックス要素を構文解析することを更にする。
オプションとして、本方法は、ラスタスキャンスライスモードが有効であり、ピクチャ内のタイルの数が1より大きい場合、及び、スライス内のタイルの数がピクチャ内のタイルの数に等しいとき、現在のピクチャのカラープレーンが分離されることを許可しないことをさらに有する。
オプションとして、本方法は、ピクチャのカラープレーンの分離を示すフラグの値を、カラープレーンの分離がないことを示す値に制限することによって、ピクチャのカラープレーンを分離することを許可しないことをさらに有する。
オプションとして、ラスタスキャンスライスモードが有効であり、ピクチャ内のタイルの数が1より大きく場合、及び、スライス内のタイルの数がピクチャ内のタイルの数に等しいとき、カラープレーン識別子シンタックス要素は復号されない。
オプションとして、強制は、ピクチャが1つのスライスのみを含む場合に行われる。
推定されるカラープレーン識別子は、ルマ(Luma)であり得る。
オプションとして、強制は、ピクチャヘッダがスライスヘッダ内でシグナリングされたときに行われる。
オプションとして、強制は、ラスタスキャンスライスモードが有効であり、現在のピクチャ内のタイルの個数が1よりも大きいとき、及び、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいときに行われる。
サブピクチャの存在を示すシンタックス要素は、サブピクチャ情報が存在するかどうかを示すフラグを含むことができる。
符号化対象のピクチャが1つのスライスを含むことを示すシンタックス要素は、ピクチャヘッダインスライスヘッダシンタックス要素を有し、スライスヘッダ内でシグナリングされるピクチャヘッダは1つのスライスを含むピクチャを示す。
符号化対象のピクチャが1つのスライスを含むことを示す少なくとも1つのシンタックス要素は、ラスタスキャンスライスモードが有効であることを示すシンタックス要素を含んでもよく、ピクチャ内のタイル数が1より大きいことを示すシンタックス要素を含んでもよく、スライス内のタイルの数がピクチャ内のタイルの数と等しいことを示すシンタックス要素を含んでもよい。
オプションとして、サブピクチャの使用、及び/又は、サブピクチャ情報の構文解析、及び、ピクチャヘッダがスライスヘッダ内に送信するかどうかは、構文解析対象のシンタックス要素によって示される。
オプションとして、サブピクチャの使用、および/または、サブピクチャ情報の構文解析を示すシンタックス要素と、ピクチャヘッダがスライスヘッダ内で送信されることを示すシンタックス要素は、組み合わせが許可されない。
本発明の別のさらなる態様では、ビデオデータをビットストリームに符号化する方法が提供される。ここで、前記ビットストリームは1以上のスライスに対応するビデオデータを有する。そして、前記復号は、1以上のシンタックス要素を構文解析することと、サブピクチャの使用、および/または、サブピクチャ情報と、スライスヘッダ内に送信されるピクチャヘッダの構文解析を許可しないことと、前記シンタックス要素を用いて前記ビットストリームを符号化することを有する。
オプションとして、サブピクチャの使用、及び/または、サブピクチャ情報の構文解析、及び、ピクチャヘッダがスライスヘッダ内に送信するかどうかは、構文解析対象のシンタックス文要素によって示される。
オプションとして、サブピクチャの使用、および/または、サブピクチャ情報の構文解析を示すシンタックス要素と、ピクチャヘッダがスライスヘッダ内に送信されることを示すシンタックス要素の組み合わせは許可されない。
前記方法は、ピクチャヘッダがスライスヘッダ内でシグナリングされるかどうかを示すシンタックス要素を判定することを更に有し、前記スライスヘッダ内でシグナリングされているピクチャヘッダは1つのスライスを含むピクチャを示す。
前記方法は、カラーピクチャのカラープレーンが分離され、ピクチャヘッダがスライスヘッダ内に位置するとき、カラープレーン識別子シンタックス要素を判定することを更に有する。
前記方法は、ラスタスキャンスライスモードが有効にされ、ピクチャ内のタイルの数が1より大きい場合、及び、スライス内のタイルの数がピクチャ内のタイルの数に等しいとき、現在のピクチャのカラープレーンが分離されることを許可しないことをさらに有する。
オプションとして、ピクチャのカラープレーンを分離することが許されないことは、ピクチャのカラープレーンの分離を示すフラッグの値を、カラープレーンの分離がないことを示す値に制限することによる。
オプションとして、ラスタスキャンスライスモードが有効にされ、ピクチャ内のタイルの数が1より大きい場合、及び、スライス内のタイルの数がピクチャ内のタイルの数に等しいとき、カラープレーン識別子シンタックス要素は符号化されない。
オプションとして、推定されるカラープレーン識別子はルマ(Luma)である。
オプションとして、前記強制は、ピクチャヘッダがスライスヘッダ内でシグナリングされるときに行われる。
オプションとして、前記強制は、ラスタスキャンスライスモードが有効にされ、現在のピクチャ内のタイルの数が1よりも大きい場合、及び、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいときに行われる。
さらに、ハードウェアで実施される特徴は、ソフトウェアで実施されてもよく、その逆も可能である。本明細書におけるソフトウェアおよびハードウェア特徴へのいかなる基準も、それに応じて解釈されるべきである。
- CPUで示されるマイクロプロセッサなどの中央演算処理装置311;
- 本発明を実施するためのコンピュータプログラムを記憶するためのROMと表記される読み出し専用メモリ306;
- RAMと示されるランダムアクセスメモリ312は、本発明の実施形態の方法の実行可能コード、ならびに本発明の実施形態によるデジタル画像のシーケンスを符号化する方法、および/またはビットストリームを復号する方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタを記憶するためのものである、
- 処理されるデジタルデータが送受信される通信ネットワーク303に接続された通信インターフェース302
- 本発明の1つまたは複数の実施形態の方法を実施するためのコンピュータプログラム、および本発明の1つまたは複数の実施形態の実施中に使用または生成されるデータを記憶するための、ハードディスクなどのデータ記憶手段 304;
- ディスク306のためのディスクドライブ305であり、ディスクドライブは、ディスク306からデータを読み取るか、またはディスクにデータを書き込むように構成されている;
- キーボード310または他の任意のポインティング手段の手段によって、ユーザーとのグラフィカルインターフェースとして機能するデータを表示するためのスクリーン309。
このNALユニットは。pic-typeの構文要素を1つだけ含んでいる。
“pic_typeは、AUデリミタNALユニットを含むAU内の符号化ピクチャのすべてのスライスのslice_type値がpic_typeの所与の値についてテーブル2に列挙されたセットのメンバであることを示す。pic_typeの値は、この明細書のこのバージョンに適合するビットストリームにおいて0、1または2に等しいものとする。pic_typeの他の値は、ITUT-T |ISO/IECによって将来の使用のために予約される。この明細書のこのバージョンに適合するデコーダは、pic_typeの予約値を無視するものとする”
rbsp_trailing_bits()は、バイトの末尾に整列させるためにビットを追加する関数である。したがって、この関数の後、解析されるビットストリームの量は整数のバイト数になる。
NALユニットスライスレイヤはテーブル3に示すように、スライスヘッダ及びスライスデータを含む。
アダプテーションパラメータセット(APS)NALユニット605は、シンタックス要素を示すテーブル4において定義される。
テーブル4に示すように、APS_params_type シンタックス要素で指定できるAPS には3つのタイプがある:
・ ALF_AP: ALFパラメータ用
・ LMCSパラメータ用のLMCS_APS
・ Scaling list 相対パラメータ用のScaling_APS
ALFパラメータは、適応ループフィルタデータシンタックス要素(テーブル5)で説明する。第1に、4つのフラグが、ALFフィルタがルマおよび/またはクロマのために送信されるかどうか、ならびにCC-ALF(Cross Component Adaptive Loop Filtering)がCb成分およびCr成分のために有効にされるかどうかを指定するために専用である。ルマフィルタフラグが有効な場合、クリップ値がシグナリングされているかどうかを知るために別のフラグがデコードされる(alf_Luma_clip_flag)。次に、シグナリングされるフィルタの数が、alf_luma_num_filters_signalled_minus1シンタックス要素を使用してデコードされる。必要に応じて、ALF係数delta“alf_luma_coeff_delta_idx”を表すシンタックス要素が、有効なフィルタごとに復号される。そして、各フィルタの各係数の絶対値及び符号(sign)が復号される。
同様に、ALFクロマ係数が、必要に応じて復号される。
以下のテーブル6に、APS_params_type パラメータが1 (LMCS_APS) に設定されている場合に、適応パラメータセット(APS)シンタックス構造で符号化されるすべてのLMCSシンタックス要素を示す。符号化ビデオシーケンスでは最大4つのLMCS APSを使用することができるが、所与のピクチャに対して単一のLMCS APSのみを使用することができる。
これらのパラメータは、ルマの順方向および逆方向マッピング関数と、クロマのスケーリング関数を構築するために使用される。
スケーリングリストは、定量化に使用される量子化行列を更新する可能性を提供する。VVCにおいては、このスケーリングマトリクスがスケーリングリストデータのシンタックス要素(テーブル7)に記述されているように、APSにおいてシグナリングされる。最初のシンタックス要素は、フラグscaling_matrix_for_LFNST_disabled_flagに基づいてLFNST(Low Frequency Non-Separable Transform)ツールにスケーリング行列を使用されるかどうかを特定する。2 番目のものは、スケーリングリストがクロマ成分(scaling_list_Chroma_present_flag)に使用される場合に特定される。次に、スケーリング行列を構築するために必要なシンタックス要素が復号される(scaling_list_copy_mode_flag、scaling_list_pred_mode_flag、scaling_list_pred_id_delta、scaling_list_dc_coef、scaling_list_delta_coef)。
ピクチャヘッダは、他のスライスデータの前の各ピクチャの先頭で送信される。これは、標準の以前の草案における以前のヘッダと比較して非常に大きい。これら全てのパラメータの完全な説明は、JVET-Q2001-vDに記載されている。テーブル10は、現在のピクチャヘッダの復号シンタックスにおけるこれらのパラメータを示している。
・ このピクチャの使用、参照フレームかどうか
・ ピクチャのタイプ
・ 出力フレーム
・ ピクチャの個数
・ 必要に応じてサブピクチャの使用
・ 必要に応じて参照ピクチャリスト
・ 必要に応じて色プレーン
・ オーバライドフラグが有効な場合のパーティション更新
・ 必要に応じてデルタQPパラメータ
・ 必要に応じて動き情報パラメータ
・ 必要に応じてALFパラメータ
・ 必要に応じてSAOパラメータ
・ 必要に応じて定量化パラメータ
・ 必要に応じてLMCSパラメータ
・ 必要に応じてスケーリングリストパラメータ
・ 必要に応じてピクチャヘッダ拡張
・ Etc...
最初のフラグはgdr_or_irap_pic_flag で、現在のピクチャが再同期ピクチャ(resynchronisation picture)(IRAPまたはGDR)かどうかを示す。このフラグがtrueの場合、gdr_pic_flag は復号され、現在のピクチャがIRAPかGDRピクチャかを知ることができる。
次に、ph_inter_slice_allowed_flag が復号され、インタースライスが許可されていることが識別される。
許可されると、フラグph_intra_slice_allowed_flag が復号され、現在のピクチャに対してイントラスライスが許可されているかどうかがわかる。
次に、non_reference_picture_flag、PPS IDを示すph_pic_parameter_set_id、ピクチャ順序カウントph_pic_order_cnt_lsbが復号される。ピクチャ順序カウントは、現在のピクチャの個数を与える。
ピクチャがGDRまたはIRAPピクチャの場合、フラグno_output_of_prior_pics_flag が復号される。
ピクチャがGDRの場合、recovery_poc_cntが復号される。その後、必要に応じてph_poc_msb_present_flagとpoc_msb_valが復号される。
現在のピクチャに関する重要な情報を記述するこれらのパラメータの後、ALFがSPSレベルで有効になっていて、ALFがピクチャヘッダレベルで有効になっている場合、ALF APS idシンタックス要素のセットが復号される。ALFは、sps_alf_enabled_flagフラグによってSPSレベルで有効になる。そして、ALFシグナリングは、alf_info_in_ph_flag が1であることによってピクチャヘッダレベルで有効になる。そうでない場合(alf_info_in_ph_flagが0)、ALFはスライスレベルでシグナリングされる。
“alf_info_in_ph_flag が1 に等しいことは、ALF情報がPH シンタックス構造に存在し、PHシンタックス構造を含まないPPSを参照するスライスヘッダには存在しないことを特定する。alf_info_in_ph_flagが0に等しいことは、ALF情報がPHシンタックス構造に存在せず、PHシンタックス文構造を含まないPPSを参照するスライスヘッダに存在する可能性があることを特定する。”
このようにして、CC-ALF方法のためのAPS IDが、Cbおよび/またはCR成分のために、必要に応じて復号される
次いで、LMCS APS IDシンタックス要素のセットが、LMCSがSPSレベルで有効にされた場合に、復号される。まず、ph_lmcs_enabled_flag が復号され、現在のピクチャに対してLMCS が有効かどうか判定される。LMCSが有効な場合、そのID値は、復号されたph_lmcs_aps_ID である。クロマの場合、クロマのメソッドを有効または無効にするため、ph_Chroma_residual_scale_flagのみが復号される。
次いで、スケーリングリストがSPSレベルで有効にされている場合、スケーリングリストAPS IDのセットが復号される。ph_scaling_list_present_flag が復号され、現在のピクチャに対してスケーリングマトリクスが有効かどうかを判定される。そして、APS IDの値ph_scaling_list_aps_idが復号される。
サブピクチャパラメータは、SPSで有効にされたとき、および、サブピクチャidシグナリングが無効にされたときに有効にされる。また、仮想境界に関する情報も含まれている。サブピクチャパラメータに対して、8つのシンタックス要素が定義される:
・ ph_virtual_boundaries_present_flag
・ ph_num_ver_virtual_boundaries
・ ph_virtual_boundaries_pos_x[i]
・ ph_num_hor_virtual_boundaries
・ ph_virtual_boundaries_pos_y[i]
これらのサブピクチャパラメータの後に、pic_output_flagが続く(存在する場合)。
参照ピクチャリストがピクチャヘッダでシグナリングされている場合(rpl_info_in_ph_flagが1のため)、参照ピクチャリストのパラメータは、ref_pic_lists() に復号され、これは以下のシンタックス要素が含まれる:
・ rpl_sps_flag[]
・ rpl_idx[]
・ poc_lsb_lt[][]
・ delta_poc_msb_present_flag[][]
・ delta_poc_msb_cycle_lt[][]
また、次のシンタックステーブルが定義される。
パーティショニングパラメータのセットが必要に応じてデコードされ、それには以下のシンタックス要素が含まれる:
・ partition_constraints_override_flag
・ ph_log2_diff_min_qt_min_cb_intra_slice_luma
・ ph_max_mtt_hierarchy_depth_intra_slice_luma
・ ph_log2_diff_max_bt_min_qt_intra_slice_luma
・ ph_log2_diff_max_tt_min_qt_intra_slice_luma
・ ph_log2_diff_min_qt_min_cb_intra_slice_chroma
・ ph_max_mtt_hierarchy_depth_intra_slice_chroma
・ ph_log2_diff_max_bt_min_qt_intra_slice_chroma
・ ph_log2_diff_max_tt_min_qt_intra_slice_chroma
・ ph_log2_diff_min_qt_min_cb_inter_slice
・ ph_max_mtt_hierarchy_depth_inter_slice
・ ph_log2_diff_max_bt_min_qt_inter_slice
・ ph_log2_diff_max_tt_min_qt_inter_slice
加重予測パラメータpred_weight_table()が、加重予測方法がPPS レベルで有効になっていて、加重予測パラメータがピクチャヘッダ(wp_info_in_ph_flag が1) でシグナリングされている場合に、復号される。
pred_weight_table() は、双予測重み付き予測(bi-prediction weighted prediction)が有効な場合、リストL0とリストL1の重み付き予測パラメータを含む。加重予測パラメータがピクチャヘッダで送信されると、pred_weight_table()シンタックステーブル8に示すように、各リストの加重個数が明示的に送信される。
ピクチャがイントラの場合、必要に応じて、ph_cu_qp_delta_subdiv_intra_slice とph_cu_chroma_qp_offset_subdiv_intra_slice が復号される。また、インタースライスが許可されている場合、必要に応じてph_cu_qp_delta_subdiv_inter_slice とph_cu_chroma_qp_offset_subdiv_inter_slice が復号される。最後に、ピクチャヘッダ拡張シンタックス要素は、必要に応じて復号される。
スライスヘッダは、各スライスの先頭で送信される。スライスヘッダには、約65個のシンタックス要素が含まれる。これは、以前のビデオコーディング規格における以前のスライスヘッダと比較して非常に大きい。すべてのスライスヘッダパラメータの完全な説明は、JVET-Q2001-vDにある。テーブル11は、現在のスライスヘッダ復号シンタックス文における、これらのパラメータを示している。
slice_subpic_id は、SPS内にてsubpic_info_present_flagが1に等しく設定されている場合に復号され、slice_subpic_id は現在のスライスのサブピクチャidを与える。subpic_info_present_flagは、現在のVVC仕様では次のように定義されている:
“1に等しいsubpic_info_present_flagの場合、サブピクチャ情報がCLVSのために存在すること、及び、CLVSの各ピクチャ内に1以上のサブピクチャが存在し得ることを特定する。0に等しいsubpic_info_present_flagは、サブピクチャ情報がCLVSのために存在せず、かつ、CLVSの各ピクチャ内には1つのサブピクチャのみが存在することを特定する。”
“num_tiles_in_slice_minus1 + 1 (存在する場合) は、スライス内のタイルの数を特定する。num_tiles_in_slice_minus1の値は、0からNumTilesInPic-1までの範囲内である。”
ALFがSPS レベル(sps_alf_enabled_flag) で有効になっていて、ALFがスライスヘッダ(alf_info_in_ph_flag が0) にシグナリングされている場合、ALF情報が復号される。これには、現在のスライスに対してALF が有効であることを示すフラグ(slice_alf_enabled_flag) が含まれる。有効であると、ルマ用のAPS ALF ID(slice_num_alf_aps_ids_luma)の個数が復号され、APS IDが復号される(slice_alf_aps_id_luma[i])。次に、slice_ALF_chroma_idcが復号され、クロマ成分に対してALF が有効になっているかどうか、および、いずれのクロマ成分が有効になっているかを知る。次に、クロマのAPS IDが必要に応じて、slice_alf_aps_id_chromaに復号される。同様に、slice_cc_alf_cb_enabled_flagが、必要に応じて復号され、CC ALF方法が有効かどうかを知る。CC ALFが有効である場合、CC ALFがCRおよび/またはCBに対してイネーブルである場合ではCRおよび/またはCBに対する関連するAPS IDが復号される。
“separate_colour_plane_flagが1に等しい場合、4:4:4 クロマ形式の3つのカラー成分が個別に符号化されることを特定する。separate_colour_plane_flagが0に等しい場合、カラー成分が個別に符号化されないことを特定する。separate_colour_plane_flag が存在しない場合は、0に等しいと推測される。separate_colour_plane_flagが1に等しいとき、符号化ピクチャは3つの別個の成分からなり、その各々は1つのカラープレーン(Y、Cb、またはCr)の符号化サンプルからなり、モノクロ符号化シンタックスを使用する。この場合、各色プレーンは、特定のcolour_plane_id値に関連付けられる。”
“num_ref_idx_active_override_flagが1 に等しい場合、シンタックス要素num_ref_idx_active_minus1[ 0 ] がPおよびBスライスに存在し、シンタックス要素num_ref_idx_active_minus1[ 1 ]がBスライスに存在することを特定する。num_ref_idx_active_override_flagが0に等しい場合、シンタックス要素num_ref_idx_active_minus1[ 0 ]およびnum_ref_idx_active_minus1[ 1 ]が存在しないことを特定する。存在しない場合、num_ref_idx_active_override_flagの値は1に等しいと推測される。”
LMCSがピクチャヘッダで有効にされていた場合(ph_lmcs_enabled_flagが1に等しい)、フラグslice_lmcs_enabled_flag が復号される。現在のVVC仕様において、slice_lmcs_enabled_flagは以下のように定義されている:
“slice_lmcs_enabled_flagが1に等しい場合、現在のスライスにたいしてクロマスケーリングを用いるルミナンスマッピングが有効であることを特定する。slice_lmcs_enabled_flag が0に等しい場合、現在のスライスに対し、クロマスケーリングを用いるルミナンスマッピングが有効になっていないことを特定する。slice_lmcs_enabled_flag が存在しない場合、0に等しいと推測される。”
“slice_scaling_list_present_flagが1 に等しい場合、現在のスライスに使用されているスケーリングリストデータは、
SCALING_APSに等しいaps_params_typeを持つ参照されるスケーリングリストAPSに含まれているスケーリングリストデータ、及び、ph_scaling_list_APS_idに基づいて導出されることを特定する。slice_scaling_list_present_flagが0に等しい場合、現在のピクチャに使用されているスケーリングリストデータは、節7.4.3.21で指定され、導出されるデフォルトのスケーリングリストデータであることを特定する。派生データであることを指定する。存在しない場合、slice_scaling_list_present_flagの値は0に等しいと推測される。”
その後、必要に応じて他のパラメータが復号される。
特定のシグナリング方法では、図7に示すように、ピクチャヘッダ(708)がスライスヘッダ(710)内にてシグナリングすることができる。その場合、ピクチャヘッダ(608)のみを含むNALユニットは存在しない。NALユニット701~707は、図6のそれぞれのNALユニット601~607に対応する。同様に、コードタイル(coding tile)720およびコードブロック(coding block)740は図6のブロック620および640に対応する。したがって、これらのユニットおよびブロックの説明はここでは繰り返さない。これは、フラグpicture_header_in_slice_header_flag によってスライスヘッダで有効にできる。さらに、ピクチャヘッダがスライスヘッダの内部でシグナリングされるとき、ピクチャは1つのスライスのみを含む。したがって、ピクチャごとに常に1つのピクチャヘッダのみが存在する。さらに、フラグpicture_header_in_slice_header_flagは、CLVS(Coded Layer Video Sequence:符号化レイヤビデオシーケンス)の全ての画像に対して同じ値を持つ。これは、第1のIRAPを含む2つのIRAP間の全てのピクチャが、ピクチャ当たり1つのスライスのみを有することを意味する。
“picture_header_in_slice_header_flag が1 の場合、PHシンタックス構造がスライスヘッダ内に存在することを特定する。picture_header_in_slice_header_flag が0 の場合、PH シンタックス構造がスライスヘッダ内に存在しないことを特定する。
picture_header_in_slice_header_flag の値がCLVSのすべての符号化スライスで同じであることは、ビットストリーム適合性の要件である。
符号化されたスライスに対してpicture_header_in_slice_header_flag が1 に等しい場合、PH_NUT に等しいnal_unit_typeを持つVCL NALユニットがCLVSに存在しないことが、ビットストリーム適合の要件である。
picture_header_in_slice_header_flagが0に等しいとき、現在のピクチャ内の符号化スライスの全てが、0に等しいpicture_header_in_slice_header_flagを持ち、そして現在のPUはPH NALユニットを持つ。
picture_header_structure()は、スタッフィングビットrbsp_trailing_bits()を除き、picture_rbsp() のシンタックス要素を含む。”
一部のストリーミングアプリケーションは、ビットストリームの特定の部分のみを抽出する。これらの抽出は、空間的(サブピクチャとして)または時間的(ビデオシーケンスのサブ部分)であり得る。次いで、これらの抽出された部分は、他のビットストリームとマージされ得る。いくつかの他のものは、いくつかのフレームのみを抽出することによってフレームレートを低減する。一般に、これらのストリーミングアプリケーションの主な目的は、エンドユーザに対して最大品質を示すために、許容帯域幅を最大限に使用することである。
クロマスケーリングを有するルママッピング(Luma Mapping with Chroma scaling;LMCS)技法は、VVCのようなビデオデコーダにおけるループフィルタを適用する前に、ブロックに適用されるサンプル値変換方法である。
1)第1のサブツールは、適応区分線形モデル(adaptive piecewise linear models)に基づくルマ成分におけるループ内マッピングである。ルマ成分のループ内マッピングは、圧縮効率を改善するために、ダイナミックレンジにわたってコードワードを再分配することによって、入力信号のダイナミックレンジを調整する。ルママッピングは、「マッピング済み領域(mapped domain)」への順方向マッピング機能と、「入力領域(input domain)」に戻る、対応の逆方向マッピング機能を利用する。
2)第2のサブツールは、ルマ依存のクロマ残差スケーリングが適用されるクロマ成分に関連する。クロマ残差スケーリングは、ルマ信号と対応するクロマ信号の相互作用を補正するように設計されている。クロマ残差スケーリングは、現在のブロックのトップおよび/または左の再構成された隣接ルマサンプルの平均値に依存する。
ルママッピングサブツールは、区分線形モデル(piecewise linear model)を使用する。これは、区分的線形モデルが、入力信号ダイナミックレンジを、16個の等しいサブレンジにダイナミックレンジを分離することを示し、それぞれのサブレンジについて、その線形マッピングパラメータがそのレンジに割り当てられた符号語の数を用いて表現される。
シンタックス要素lmcs_min_bin_idxは、クロマスケーリングを持つルママッピングにおいて使用される最小ビンインデックスを指定する。lmcs_min_bin_idx の値は、0から15の範囲内である。
シンタックス要素lmcs_delta_abs_cw[i]は、第i番目のビンの絶対デルタコードワード値を特定する。
シンタックス要素lmcs_delta_sign_cw_flag[i]は、変数lmcsDeltaCW[i]の符号(sign)を特定する。lmcs_delta_sign_cw_flag[i]が存在しない場合、0に等しいと推測される。
順方向および逆方法のルママッピングプロセスを適用するために、いくつかの中間変数およびデータ配列が必要とされる。
OrgCW =(1 << BitDepth)/16
lmcsDeltaCW[i]=(1 - 2 * lmcs_delta_sign_cw_flag[i]) * lmcs_delta_abs_cw[i]
- For i = 0.. lmcs_min_bin_idx-1, lmcsCW[i]を0に等しくなるようにセットされる.
- For i = lmcs_min_bin_idx.. LmcsMaxBinIdx、以下が適用される:
lmcsCW[i]= OrgCW + lmcsDeltaCW[i]
lmcsCW[i]の値は、(OrgCW>>3)~(OrgCW<<3-1)の範囲内である。
- For i = LmcsMaxBinIdx+1 .. 15, lmcsCW[i]を0に等しくなるようにセットする.
InputPivot[i] = i * OrgCW
LmcsPivot[0]=0;
for(i=0; i <=15; i++){
LmcsPivot[i+1] =LmcsPivot[i] + lmcsCW[i]
ScaleCoeff[i] = (lmcsCW[i] * (1<<11) + (1 <<
(Log2(OrgCW)-1))) >> (Log2(OrgCW))
if (lmcsCW[i] ==0)
InvScaleCoeff[i] = 0
else
InvScaleCoeff[i] = OrgCW * (1 << 11)/lmcsCW[i]
図8に示すように、LMCSがルマに適用されるとき、predMapSamples[i][j]と呼ばれるルマ再マッピングされたサンプルが、予測サンプルpredSamples[i][j]から取得される。
predMapSamples[i][j]は、以下のように計算される:
先ず、インデックスidxYが、位置(i,j)における、予測サンプルpredSamples[i][j]から算出される。
idxY = preSamples[i][j] >> log2(OrgCW)
次いで、predMapSamples[i][j]が、セクション0の中間変数idxY、LmcsPivot[idxY]およびInputPivot[idxY]を使用して以下のように導出される。
predMapSamples[i][j] = LmcsPivot[idxY]
+ (ScaleCoeff[idxY] * (predSamples[i][j] - InputPivot[idxY])+(1 << 10)) >> 11
再構成プロセスは、予測されたルマサンプルpredMapSample[i][j]および残差ルマサンプルresiSamples[i][j]から取得される。
再構成されたルマピクチャサンプルrecSamples[i][j]は、以下のように、resiSamples[i][j]にpredMapSample[i][j]を加算するだけで得られる。
recSamples[i][j] = Clip1(predMapSamples[i][j] + resiSamples[i][j]])
上記の関係において、Clip1関数は、再構成されたサンプルが、きちんと0と1<<BitDepth-1内にあるようにするクリッピング関数である。
図8に従って逆ルママッピングを適用するとき、処理対象の現在のブロックの各サンプルrecSample[i][j]に、以下の演算が適用される:
まず、インデックスidxYが、位置(i,j)における再構成サンプルrecSamples[i][j]から計算される。
idxY = recSamples[i][j] >> Log2(OrgCW)
逆マッピングされたルマサンプルinvLumaSample[i][j]が、次のように導出される。
invLumaSample[i][j] =
InputPivot[idxYInv] + (InvScaleCoeff[idxYInv] *
(recSample[i][j] - LmcsPivot[idxYInv]) + (1 << 10)) >> 11
次いで、最終サンプルを得るためにクリッピング演算が行われる:
finalSample[i][j] = Clip1(invLumaSample[i][j])
クロマスケーリング用のLMCSセマンティクス
テーブル6のシンタックス要素lmcs_delta_abs_crsは、変数lmcsDeltaCrs の絶対コードワード値を特定する。lmcs_delta_abs_crsの値は、両端値を含む0と7の範囲内にあるものとする。もし存在しない場合、lmcs_delta_abs_crs は0に等しいと推測される。
シンタックス要素lmcs_delta_sign_crs_flag は、変数lmcsDeltaCrsの符号(sign)を特定する。存在しない場合、lmcs_delta_sign_crs_flagは0 に等しいと推測される。
クロマスケーリングプロセスを適用するには、いくつかの中間変数が必要となる。
変数lmcsDeltaCrsは以下のように導出される:
lmcsDeltaCrs = (1 - 2 * lmcs_delta_sign_crs_flag) * lmcs_delta_abs_crs
変数ChromaScaleCoeff[i]は、i = 0..15 にて、次のように導出される:
if(lmcsCW[i] == 0)
ChromaScaleCoeff[i] = (1 << 11)
else
ChromaScaleCoeff[i] = OrgCW * (1 << 11) / (lmcsCW[i] + lmcsDeltaCrs)
第1のステップでは、変数invAvgLumaが、現在の対応するクロマブロックの周りの再構成されたルマサンプルの平均ルマ値を計算するために導出される。平均ルマは、対応するクロマブロックを囲む左および上のルマブロックから計算される。
もしサンプルがない場合、変数invAvgLumaは次のように設定される:
invAvgLuma = 1 << (BitDepth - 1)
For (idxYInv = lmcs_min_bin_idx; idxYInv <= LmcsMaxBinIdx; idxYInv++) {
if(invAvgLuma < LmcsPivot [idxYInv + 1]) break
}
IdxYInv = Min(idxYInv, 15)
varScale = ChromaScaleCoeff[idxYInv]
recSamples[i][j] = Clip1(predSamples[i][j] +
Sign(resiSamples[i][j]) * ((Abs(resiSamples[i][j]) * varScale +
(1 << 10)) >> 11))
現在のブロックに変換が適用されない場合は、以下が適用される:
recSamples[i][j]= Clip1(predSamples[i][j])
LMCSエンコーダの基本原理は、最初に、より多くのコードワードを、それらのダイナミックレンジセグメントが平均分散よりも低いコードワードを有する範囲に割り当てることである。これの別の定式化では、LMCSの主な目標が平均分散よりも高いコードワードを有するダイナミックレンジセグメントに、より少ないコードワードを割り当てることである。このようにして、ピクチャの滑らかなエリアは、平均よりも多くのコードワードでコーディングされ、逆もまた同様である。
1.スライスが1つしかない場合はサブピクチャを避けること
一実施形態では、少なくとも1つのシンタックス要素が、現在のピクチャが1つのスライスのみを含むことを示すとき、サブピクチャは許可されない、および/またはシグナリングされない。これは、以下の文を、subpic_info_present_flagのセマンティクスに追加することで実装できる:
“一つ以上のシンタックス要素が現在のピクチャが一つのスライスのみを含むことを特定するとき、subpic_info_present_flagが0に等しいことは、ビットストリーム適合性の必要条件である。”
この実施形態の利点は、ビットストリームの不整合を回避することである。実際、サブピクチャを含むピクチャは、いくつかのスライスを有する。ピクチャが1つのスライスのみを含む場合、それは、1つのサブピクチャのみを含むピクチャである。つまり、ピクチャのサブパートである。さらに、一部の実装ではスライスヘッダの解析が簡素化される。
一実施形態では、サブピクチャは、ピクチャヘッダがスライスヘッダで送信されるとき、許可されず、かつ/またはシグナリングされない。実際、ピクチャヘッダがスライスヘッダ内にあるとき、現在のピクチャは1つのスライスのみを含む。したがって、現在のピクチャをいくつかのサブピクチャに分割することは不可能であり、サブピクチャは少なくとも1つのスライスを含むので、いくつかのスライスを暗示する。
一実施形態では、subpic_info_present_flagは、ピクチャヘッダがスライスヘッダで送信されるときは、0に等しくなるように設定される。これは、次の文をsubpic_info_present_flagのセマンティクスに追加することで取得できる:
“PPSを参照するスライスヘッダがPHシンタックス構造を含む場合、subpic_info_present_flag が0に等しいことはビットストリーム適合性の要件である。”
一実施形態では、テーブル12に示されるように、ピクチャヘッダがスライスヘッダ内にあるとき、slice_subpic_idは復号されない。このシンタックステーブルでは、subpic_info_present_flag が1に等しくなるように設定され、picture_header_in_slice_header_flagが0に等しくなるように設定されている場合にのみ、slice_subpic_id が復号される。
一実施形態では、ラスタスキャンスライスモードが有効になっており、現在のピクチャ内のタイルの数が1を超えており、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、サブピクチャは許可されない、および/またはシグナリングされない。その場合、現在のピクチャが1つのスライスのみを含むので、現在のピクチャはいくつかのサブピクチャを含むことができないことが確かである。
一実施形態では、ラスタスキャンスライスモードが有効であるとき、現在のピクチャ内のタイルの数が1より大きく、およびスライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、subpic_info_present_flagは0に等しくなるように設定される。これは、次の文を、subpic_info_present_flag のセマンティクスに追加することで取得できる:
“ラスタスキャンスライスモードが有効で、現在のピクチャ内のタイルの数が1より大きく、スライスのタイルの数が現在のピクチャ内のタイルの数と等しい場合、subpic_info_present_flagが0に等しいビットストリーム適合性の要件である。”
一実施形態において、ラスタ走査スライスモードが有効になっており、現在のピクチャ内のタイルの数が1を超えており、及び、スライス内のタイルの数が、テーブル13に示されるように、現在のピクチャ内のタイルの数に等しいとき、slice_subpic_idは復号されない。
一実施形態では、ピクチャヘッダがスライスヘッダ中で送信されるとき、または、ラスタスキャンスライスモードが有効にされ、現在ピクチャ内のタイルの数が1を超え、スライス内のタイルの数が現在のピクチャ内のタイルの個数に等しいとき、サブピクチャは許可されない、および/またはシグナリングされない。
一実施形態では、現在のピクチャのカラープレーンは、現在のピクチャがただ一つのスライスを含むときには分離されない。これは、以下の文をseparate_colour_plane_flag のセマンティクスに追加することで取得できる:
“1つ以上のシンタックス要素が、現在のピクチャが1つのスライスのみを含むことを特定するとき、separate_colour_plane_flagが1に等しくないことは、ビットストリーム適合性の要件である。”
この実施形態の利点は、矛盾ビットストリームを回避することである。実際、独立して符号化されたカラープレーンを含むピクチャは、いくつかのスライスを有する。したがって、現在のピクチャ内に1つのスライスのみを有することは不可能である。さらに、一部の実装ではスライスヘッダの解析が簡素化される。
一実施形態では、ピクチャヘッダがスライスヘッダ内で送信されるとき、現在のピクチャのカラープレーンは分離されない。実際、ピクチャヘッダがスライスヘッダ内にあるとき、現在のピクチャは1つのスライスのみを含む。
一実施形態では、ピクチャヘッダがスライスヘッダ内で送信されるとき、separate_colour_plane_flagは0に設定される。これは、以下の文をseparate_colour_plane_flag のセマンティクスに追加することで取得できる:
“PPSを参照するスライスヘッダがPHシンタックス構造を含む場合、separate_colour_plane_flag が0に等しいことは、ビットストリーム適合性の要件である。”
一実施形態では、表12に示されるように、ピクチャヘッダがスライスヘッダ内にあるとき、colour_plane_idは復号されない。このシンタックステーブルでは、separate_colour_plane_flag が1に設定され、picture_header_in_slice_header_flagが0 に設定されている場合にのみ、colour_plane_idが復号される。
一実施形態では、ラスタスキャンスライスモードが有効にされていて、現在のピクチャ内のタイルの数が1より大きく、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、現在のピクチャのカラープレーンは分離されない。その場合、現在のピクチャが1つのスライスのみを含むことが確実であり、したがって、現在のピクチャは、異なるスライスで符号化されたカラープレーンを含むことができない。
一実施形態では、ラスタスキャンスライスモードが有効にされおり、現在のピクチャ内のタイルの数が1より大きく、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、separate_colour_plane_flagは0に等しく設定される。これは、以下の文をseparate_colour_plane_flag のセマンティクスに追加することで取得できる:
“ラスタスキャンスライスモードが有効であり、現在のピクチャ内のタイルの数が1よりも大きいとき、および、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、separate_colour_plane_flagが0に等しくなければならないことは、ビットストリーム適合性の要件である。”
一実施形態では、ラスタスキャンスライスモードが有効にされており、現在のピクチャ内のタイルの数が1を超えており、およびスライス内のタイルの個数が、テーブル13に示すように、現在のピクチャ内のタイルの数に等しいとき、colour_plane_idは復号されない。
一実施形態では、ピクチャヘッダがスライスヘッダ中で送信されるとき、またはラスタ走査スライスモードが有効にされ、現在のピクチャ内のタイルの数が1より大きく、スライス内のタイルの数が現在のピクチャ中のタイルの数に等しいとき、現在のピクチャのカラープレーンは分離されない。
一実施形態では、少なくとも1つのシンタックス要素が、現在のピクチャが1つのスライスのみを含むことを示すとき、サブピクチャは許可されず、および/またはシグナリングされず、現在のピクチャのカラープレーンは分離されない。
一実施形態では、分離されたカラープレーンシンタックス要素は1に等しく設定され、現在のピクチャは同じカラープレーンidのみを有する1以上のスライスを含む。
この実施形態は、いくつかのシンタックス要素を各スライスに変更することなく、3つの色プレーンを含むビットストリームから1つの色プレーンのみを容易に抽出する可能性を提供する。したがって、そのようなアプリケーションの複雑さを軽減する
一実施形態では、少なくとも1つのシンタックス要素が、現在のピクチャが1つのスライスのみを含むことを示すとき、ルマ成分のモノクロが現在のピクチャが、分離されたカラープレーンシンタックス要素のおかげで、シグナリングされ得る。その場合、colour_plane_idは0に等しいと推測される。前の実施形態と比較した場合のこの実施形態の利点は、カラープレーンidを送信する必要がないため、ビットレートの低減である。
これは、次の文をcolour_plane_idのセマンティクスに追加することで取得できる:
“1つ以上のシンタックス要素が、現在のピクチャが1つのスライスのみを含むことを示し、separate_colour_plane_flagが1に設定されている場合、colour_plane_idは0に等しいと推測される。”
一実施形態では、ピクチャヘッダがスライスヘッダ内で送信されるとき、分離されたカラープレーンシンタックス要素のおかげで、ルマ成分のモノクロがシグナリングされ得る。その場合、colour_plane_id は0 に等しいと推測される。前の実施形態と比較した場合のこの実施形態の利点は、カラープレーンidを送信する必要がないため、ビットレートの低減である。
これは、次の文をcolour_plane_id のセマンティクスに追加することで取得できる:
“PPSを参照するスライスヘッダがPHシンタックス構造を含んでいるとき、及び、separate_colour_plane_flag が1に設定されているとき、colour_plane_id は0に等しいと推測される。”
さらに、テーブル12に示すように、カラープレーンidを送信する必要はない。
一実施形態では、ラスタスキャンスライスモードが有効にされ、現在のピクチャ内のタイルの数が1を超えており、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、ルマ成分のモノクロは、分離されたカラープレーンシンタックス要素のおかげでシグナリングされ得る。その場合、colour_plane_idは0に等しいと推測される。この実施形態の利点は、カラープレーンidを送信する必要がないため、ビットレートを低減することである。
これは、次の文をcolour_plane_id のセマンティクスに追加することで取得できる:
“ラスタスキャンスライスモードが有効であり、現在のピクチャ内のタイルの数が1を超えているとき、及び、スライス内のタイルの数が現在のピクチャ内のタイルの数に等しいとき、及び、separate_colour_plane_flagが1に等しく設定されるとき、colour_plane_idは0に等しいと推論される。”
一実施形態では、ピクチャヘッダがスライスヘッダ中で送信されるとき、または、ラスタスキャンスライスモードが有効にされ、現在のピクチャ内のタイルの数が1を超えているとき、及び、スライス内のタイルの個数が現在のピクチャ内のタイルの数に等しいとき、分離されたカラープレーンシンタックス要素のおかげで、ルマ成分のモノクロがシグナリングされ得る。
図11は、本発明の実施形態による、エンコーダ150またはデコーダ100および通信ネットワーク199のうちの少なくとも1つを備えるシステム191、195を示す。一実施形態によれば、システム195は例えば、デコーダ100を含むユーザ端末のユーザインターフェースまたはデコーダ100と通信可能なユーザ端末を介してデコーダ100にアクセスできるユーザにコンテンツ(例えば、ビデオ/オーディオコンテンツを表示/出力またはストリーミングするためのビデオおよびオーディオコンテンツ)を処理し提供するためのものである。このようなユーザ端末は、コンピュータ、携帯電話、タブレット、または(提供/ストリーミングされた)コンテンツをユーザに提供/表示することができる任意の他のタイプの装置であってもよい。システム195は通信ネットワーク199を介してビットストリーム101(例えば、以前のビデオ/オーディオが表示/出力されている間、連続ストリームまたは信号の形成で)を取得/受信する。一実施形態によれば、システム191はコンテンツを処理し、処理されたコンテンツ、例えば、後で表示/出力/ストリーミングするために処理されたビデオおよびオーディオコンテンツを記憶するためのものである。システム191は、受信され、エンコーダ150によって処理される(本発明によるデブロッキングフィルタによるフィルタリングを含む)オリジナルの画像シーケンス151を含むコンテンツを取得/受信し、エンコーダ150は、通信ネットワーク191を介してデコーダ100に通信されるビットストリーム101を生成する。次に、ビットストリーム101はいくつかの方法でデコーダ100に通信され、例えば、エンコーダ150によって事前に生成され、ユーザが記憶装置からコンテンツ(すなわち、ビットストリームデータ)を要求するまで、通信ネットワーク199内の記憶装置(例えば、サーバまたはクラウドストレージ)にデータとして記憶装置に記憶され、その時点で、データが記憶装置からデコーダ100に通信/ストリーミングされる。また、システム191はユーザに(例えば、ユーザ端末上に表示されるユーザインターフェースのためのデータを通信することによって)、記憶装置に記憶されたコンテンツのコンテンツ情報(例えば、コンテンツのタイトルや、コンテンツを識別、選択、要求するためのその他のメタ/記憶位置データ)を提供/ストリーミングし、要求されたコンテンツを記憶装置からユーザ端末に配信/ストリーミングできるように、コンテンツに対するユーザ要求を受信して処理するためのコンテンツ提供装置を備えてもよい。あるいは、エンコーダ150がビットストリーム101を生成し、ユーザがコンテンツを要求するときに、それをデコーダ100に直接通信/ストリーミングする。デコーダ100は、次いで、ビットストリーム101(または信号)を受信し、本発明によるデブロッキングフィルタを用いてフィルタリングを実行して、ビデオ信号109および/またはオーディオ信号を取得/生成し、次いで、ビデオ信号は、ユーザ端末によって使用されて、要求されたコンテンツをユーザに提供する。
図13は、ネットワークカメラ2102及びクライアント装置2104を含むネットワークカメラシステム2100を示す図である。
ネットワークカメラ2102は、撮像部2106と、符号化部2108と、通信ユニット2110と、制御部2112とを有する。
ネットワークカメラ2102とクライアント装置2104は、ネットワーク200を介して相互に通信可能に接続されている。
ネットワークカメラ2102の通信ユニット2110は、符号化部2108で符号化された符号化画像データをクライアント装置2104に送信する。
また、通信ユニット2110は、クライアント装置2104からコマンドを受信する。コマンドは、符号化ユニット2108の符号化のためのパラメータを設定するコマンドが含まれる。
制御部2112は、通信部2110が受信したコマンドに従って、ネットワークカメラ2102内の他のユニットを制御する。
クライアント装置2104の通信ユニット2114は、ネットワークカメラ2102にコマンドを送信する。
また、クライアント装置2104の通信ユニット2114は、ネットワークカメラ2102から符号化画像データを受信する。
復号部2116は、上述した復号方法を用いて、符号化画像データを復号する。
クライアント装置2104の制御部2118は、復号部2116で復号された画像を表示するように表示装置2120を制御する。
また、クライアント装置2104の制御部2118は、GUI(Graphical User Interface)を表示するように表示装置2120を制御し、符号化部2108の符号化のためのパラメータを含むネットワークカメラ2102のパラメータの値を指定する。
また、クライアントユニット2104の制御部2118は、表示ユニット2120が表示するGUIに対するユーザ操作入力に応じて、クライアントユニット2104内の他の部を制御する。
クライアント装置2104の制御部2119は、表示装置2120が表示するGUIに対するユーザ操作入力に応じて、ネットワークカメラ2102のパラメータの値を指定するネットワークカメラ2102にコマンドを送信するように、クライアント装置2104の通信ユニット2114を制御する。
図14は、スマートフォン2200を示す図である。
スマートフォン2200は、通信ユニット2202、復号部2204、制御部2206、表示部2208、画像記録装置2210およびセンサ2212を備える。
通信ユニット2202は、ネットワーク200を介して符号化画像データを受信する。
復号部2204は、通信ユニット2202により受信された符号化画像データを復号する。
復号部2204は、上述した復号方法を用いて、符号化画像データを復号する。
制御部2206は、通信部2202によって受信されたユーザ操作またはコマンドに従って、スマートフォン2200内の他のユニットを制御する。
例えば、制御部2206は、復号部2204により復号された画像を表示するように表示部2208を制御する。
Claims (15)
- ビットストリームからビデオデータを復号する方法であって、ここで前記ビットストリームは1以上のスライスに対応するビデオデータを有し、
前記復号は、
1以上のシンタックス要素を構文解析することと、
復号対象のピクチャが1つのスライスのみを含むことを示す少なくとも一つの構文要素と組み合わせて、サブピクチャの使用、及び/又はサブピクチャ情報の構文解析を許可しないことと、
前記シンタックス要素を用いて前記ビットストリームを復号すること
を有することを特徴とする方法。 - 復号対象のピクチャが1つのスライスを含むことを少なくとも1つのシンタックス要素が示すとき、サブピクチャの存在を示すシンタックス要素の値を、サブピクチャが使用されないことを示す値に制限すること
をさらに有することを特徴とする請求項1に記載の方法。 - サブピクチャの存在を示す前記シンタックス要素が、サブピクチャ情報が存在するかどうかを示すフラグを有する
ことを特徴とする請求項2に記載の方法。 - 前記復号対象のピクチャが1つのスライスを含むことを示す前記シンタックス要素は、ピクチャヘッダインスライスヘッダシンタックス要素を有し、
前記スライスヘッダ内でシグナリングされる前記ピクチャヘッダが、1つのスライスを含む前記ピクチャを示す
ことを特徴とする請求項1乃至3のいずれか1項に記載の方法。 - 復号対象のピクチャが1つのスライスを含むことを示す前記少なくとも1つのシンタックス要素は、ラスタスキャンスライスモードが有効であることを示すシンタックス要素を有する
ことを特徴とする請求項1乃至4のいずれか1項に記載の方法。 - ビデオデータをビットストリームに符号化する方法であって、ここで、前記ビットストリームは1つ以上のスライスに対応するビデオデータを有する、
前記符号化は、
1以上のシンタックス要素を判定することと、
符号化対象のピクチャが1つのスライスのみを含むことを示す少なくとも一つのシンタックス要素と組み合わせて、サブピクチャの使用、及び/又はサブピクチャ情報の符号化を使用することを認めないことと、
前記シンタックス要素を用いて前記ビットストリームを符号化すること
を有することを特徴とする方法。 - 復号対象のピクチャが1つのスライスを含むことを少なくとも1つのシンタックス要素が示すとき、サブピクチャの存在を示すシンタックス要素の値を、サブピクチャが使用されないことを示す値に制限すること
をさらに有することを特徴とする請求項6に記載の方法。 - サブピクチャの存在を示す前記シンタックス要素は、サブピクチャ情報が存在するかどうかを示すフラグを有する
ことを特徴とする請求項7に記載の方法。 - 符号化対象の前記ピクチャが1つのスライスを含むことを示す前記シンタックス要素は、ピクチャヘッダインスライスヘッダシンタックス要素を有し、
前記スライスヘッダ内でシグナリングされる前記ピクチャヘッダは1つのスライスを含む前記ピクチャを示す
ことを特徴とする請求項6乃至8のいずれか1項に記載の方法。 - 符号化対象のピクチャが1つのスライスを含むことを示す前記少なくとも1つのシンタックス要素は、ラスタスキャンスライスモードが有効であることを示すシンタックス要素を有する
ことを特徴とする請求項6乃至9のいずれか1項に記載の方法。 - ビットストリームからビデオデータを復号する方法であって、ここで前記ビットストリームは1以上のスライスに対応するビデオデータを含み、
前記ビットストリームは、当該ビットストリームが復号対象のピクチャが1つのスライスのみを含むことを示す値を有するシンタックス要素を含む場合に、前記ビットストリームはサブピクチャが使用されないこと、および/またはサブピクチャ情報がピクチャに存在しないことを示す値を有するシンタックス要素も含むように制約されている、
前記方法は、前記シンタックス要素を使用して前記ビットストリームを復号すること
を有することを特徴とする方法。 - ビデオデータをビットストリームに符号化する方法であって、ここで、前記ビットストリームは1以上のスライスに対応するビデオデータを含み、
前記ビットストリームは、当該ビットストリームが復号対象のピクチャが1つのスライスのみを含むことを示す値を有するシンタックス要素を含む場合に、前記ビットストリームはサブピクチャが使用されないこと、および/またはサブピクチャ情報がピクチャに存在しないことを示す値を有するシンタックス要素も含むように制約されている、
前記方法が、前記シンタックス要素を使用して前記ビットストリームを符号化すること
を有することを特徴とする方法。 - 請求項1乃至5および11のいずれか1項に記載の方法を実行するように構成されたデコーダを有することを特徴とするデバイス。
- 請求項6乃至10および12のいずれか1項に記載の方法を実行するように構成されたエンコーダを有することを特徴とするデバイス。
- 実行時に、請求項1乃至12のいずれか1項に記載の方法を実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024085018A JP2024105712A (ja) | 2020-03-20 | 2024-05-24 | ビデオの符号化及び復号のための高レベルシンタックス |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2004093.7A GB2593221B (en) | 2020-03-20 | 2020-03-20 | High level syntax for video coding and decoding |
GB2004093.7 | 2020-03-20 | ||
PCT/EP2021/056866 WO2021185927A1 (en) | 2020-03-20 | 2021-03-17 | High level syntax for video coding and decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024085018A Division JP2024105712A (ja) | 2020-03-20 | 2024-05-24 | ビデオの符号化及び復号のための高レベルシンタックス |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023516249A true JP2023516249A (ja) | 2023-04-19 |
JP7497441B2 JP7497441B2 (ja) | 2024-06-10 |
Family
ID=70546659
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022542498A Active JP7497441B2 (ja) | 2020-03-20 | 2021-03-17 | ビデオの符号化及び復号のための高レベルシンタックス |
JP2024085018A Pending JP2024105712A (ja) | 2020-03-20 | 2024-05-24 | ビデオの符号化及び復号のための高レベルシンタックス |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024085018A Pending JP2024105712A (ja) | 2020-03-20 | 2024-05-24 | ビデオの符号化及び復号のための高レベルシンタックス |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230179802A1 (ja) |
EP (1) | EP4122199A1 (ja) |
JP (2) | JP7497441B2 (ja) |
KR (1) | KR20220154171A (ja) |
CN (1) | CN115380531A (ja) |
GB (3) | GB2624318B (ja) |
TW (1) | TW202137763A (ja) |
WO (1) | WO2021185927A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230136821A1 (en) * | 2020-04-16 | 2023-05-04 | Lg Electronics Inc. | Image coding method based on information included in picture header in video or image coding system |
WO2024146428A1 (en) * | 2023-01-06 | 2024-07-11 | Mediatek Inc. | Method and apparatus of alf with model-based taps in video coding system |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9749661B2 (en) * | 2012-01-18 | 2017-08-29 | Qualcomm Incorporated | Sub-streams for wavefront parallel processing in video coding |
US11997297B2 (en) * | 2019-03-06 | 2024-05-28 | Sharp Kabushiki Kaisha | Systems and methods for signaling tile group information in video coding |
CN113785571A (zh) * | 2019-04-03 | 2021-12-10 | Lg 电子株式会社 | 基于自适应环路滤波器的视频或图像编译 |
KR20220112289A (ko) * | 2020-01-14 | 2022-08-10 | 엘지전자 주식회사 | 서브 픽처 및 픽처 헤더에 관한 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
-
2020
- 2020-03-20 GB GB2400077.0A patent/GB2624318B/en active Active
- 2020-03-20 GB GB2301783.3A patent/GB2614453B/en active Active
- 2020-03-20 GB GB2004093.7A patent/GB2593221B/en active Active
-
2021
- 2021-03-17 KR KR1020227035374A patent/KR20220154171A/ko unknown
- 2021-03-17 US US17/913,030 patent/US20230179802A1/en active Pending
- 2021-03-17 WO PCT/EP2021/056866 patent/WO2021185927A1/en active Application Filing
- 2021-03-17 EP EP21713912.0A patent/EP4122199A1/en active Pending
- 2021-03-17 CN CN202180022702.8A patent/CN115380531A/zh active Pending
- 2021-03-17 JP JP2022542498A patent/JP7497441B2/ja active Active
- 2021-03-18 TW TW110109781A patent/TW202137763A/zh unknown
-
2024
- 2024-05-24 JP JP2024085018A patent/JP2024105712A/ja active Pending
Non-Patent Citations (3)
Title |
---|
BENJAMIN BROSS, JIANLE CHEN, SHAN LIU, AND YE-KUI WANG: "Versatile Video Coding (Draft 8)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-Q2001 (version 15), JPN6023043698, 12 March 2020 (2020-03-12), pages 39 - 44, ISSN: 0005178771 * |
GUILLAUME LAROCHE, NAEL OUEDRAOGO, AND PATRICE ONNO: "AhG9: Syntax cleanups when Picture Header is in the Slice Header", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-R0202, JPN6023043696, April 2020 (2020-04-01), pages 1 - 6, ISSN: 0005178772 * |
JONATAN SAMUELSSON, ET AL.: "AHG9: Picture Header in Slice Header", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-Q0775, JPN6023043699, January 2020 (2020-01-01), pages 1 - 5, ISSN: 0005178770 * |
Also Published As
Publication number | Publication date |
---|---|
GB2624318A (en) | 2024-05-15 |
JP7497441B2 (ja) | 2024-06-10 |
CN115380531A (zh) | 2022-11-22 |
US20230179802A1 (en) | 2023-06-08 |
GB202400077D0 (en) | 2024-02-14 |
GB2593221A (en) | 2021-09-22 |
KR20220154171A (ko) | 2022-11-21 |
GB202004093D0 (en) | 2020-05-06 |
GB2614453A (en) | 2023-07-05 |
WO2021185927A1 (en) | 2021-09-23 |
EP4122199A1 (en) | 2023-01-25 |
GB2624318B (en) | 2024-11-13 |
GB2614453B (en) | 2024-02-21 |
TW202137763A (zh) | 2021-10-01 |
GB2593221B (en) | 2023-04-05 |
JP2024105712A (ja) | 2024-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7403633B2 (ja) | ビデオの符号化及び復号のための高レベルシンタックス | |
TWI842980B (zh) | 用於視訊編碼及解碼的高階語法 | |
JP7434580B2 (ja) | ビデオの符号化及び復号のための高レベルシンタックス | |
TWI811651B (zh) | 用於視頻編碼及解碼的高階語法 | |
JP7561256B2 (ja) | ビデオコーディング及び復号のための高レベルシンタックス | |
JP2024105712A (ja) | ビデオの符号化及び復号のための高レベルシンタックス |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240412 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7497441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |