JP2022548685A - 画像データの符号化及び復号化 - Google Patents
画像データの符号化及び復号化 Download PDFInfo
- Publication number
- JP2022548685A JP2022548685A JP2022517356A JP2022517356A JP2022548685A JP 2022548685 A JP2022548685 A JP 2022548685A JP 2022517356 A JP2022517356 A JP 2022517356A JP 2022517356 A JP2022517356 A JP 2022517356A JP 2022548685 A JP2022548685 A JP 2022548685A
- Authority
- JP
- Japan
- Prior art keywords
- output data
- data
- encoding
- image
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 71
- 238000013139 quantization Methods 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 23
- 230000001419 dependent effect Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 30
- 230000006837 decompression Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 23
- 238000007906 compression Methods 0.000 description 20
- 230000006835 compression Effects 0.000 description 17
- 230000033001 locomotion Effects 0.000 description 15
- 238000013144 data compression Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 10
- 239000000523 sample Substances 0.000 description 8
- 239000000872 buffer Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000009795 derivation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 239000013074 reference sample Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 244000050403 Iris x germanica Species 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4006—Conversion to or from arithmetic code
- H03M7/4012—Binary arithmetic codes
- H03M7/4018—Context adapative binary arithmetic codes [CABAC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
所与の出力データ部に適用可能な符号化属性を検出するように構成された属性検出器と、
検出された符号化属性に応じて、上記所与の出力データ部と共に使用するための制約を、2つ以上の制約の候補から選択するように構成された選択器と
を具備し、
上記エントロピーエンコーダは、出力データストリームを生成するように構成されており、この出力データストリームは、その出力データ部のバイトサイズに対する任意の個々の出力データ部のバイトサイズで表される二値化シンボルの数に対する上限を定義する制約を受け、
この制約を満たすために、その出力データ部のバイト単位のサイズを増加させるために、制約を満たさない各出力データ部に対して、パディングデータを提供するように上記エントロピーエンコーダが構成されている
画像データ符号化装置を提供する。
上記出力データ部のバイト単位のサイズに対して任意の個々の出力データ部によって表される2値化シンボルの数の上限を定義する制約を受ける出力データストリームを生成するステップと、
この制約を満たすために、その出力データ部のバイト単位のサイズを大きくするように、この制約を満たさない各出力データ部に対して、パディングデータを提供するステップと、
所与の出力データ部に適用可能な符号化属性を検出するステップと、
検出された符号化属性に応答して、所与の出力データ部と共に使用するための制約を、2つ以上の候補制約から選択するステップと
を含む
画像データ符号化方法をさらに提供する。
ソフトウェア及び/又はファームウェアで実現される実施形態の場合、このようなソフトウェア及び/又はファームフェア、並びに、このようなソフトウェア及び/又はファームウェアが記憶又は提供される非一時的なデータ記録媒体が本技術の実施形態と見なされることが理解されるであろう。
解凍装置110は、例えば、表示装置120と同じ筐体内に設けることにより、表示装置120と一体的に形成してもよい。或いは、解凍装置110は、(例えば)いわゆるセットトップボックス(STB:Set Top Box)として提供されてもよい。
なお、「セットトップ」という用語は、当該ボックスを表示装置120に対して特定の方向又は位置に配置する必要があることを意味するわけではない。この用語は、単に、周辺機器として表示部に接続可能なデバイスを示すために当該技術分野で使用されているに過ぎない。
したがって、オーディオデータの圧縮について別途説明は行わない。また、特に、放送品質ビデオデータにおいて、ビデオデータに関連するデータレートは一般的に、(圧縮及び非圧縮を問わず)オーディオデータに関連するデータレートよりもはるかに高いことも理解されるであろう。
したがって、非圧縮オーディオデータを圧縮ビデオデータに追加して圧縮オーディオ/ビデオ信号とすることができることが理解されるであろう。さらに、本発明の実施形態(図1~図4参照)はオーディオ/ビデオデータに関するものであるが、以下に説明する技術は、単にビデオデータを処理(すなわち、圧縮、解凍、記憶、表示、及び/又は送信)するシステムに使用してもよいことが理解されるであろう。
すなわち、これらの実施形態は、必ずしもオーディオデータ処理と関連している必要はなく、ビデオデータの圧縮に適用することができる。
また、制御部343は、ビデオデータが符号化されるに当たって損失が生じるか否かを制御する。この制御部は、画像エンコーダ又は画像デコーダ(場合による)の一部を構成すると見なされる。入力ビデオ信号300の連続画像は、加算部310及び画像予測部320に供給される。画像予測部320については、図8を参照して後で詳述する。
画像エンコーダ又は画像デコーダ(場合による)は、図8のイントラ画像予測部と共に、図7に示す装置からの特徴を用いてもよい。しかしながら、この画像エンコーダ又は画像デコーダは、必ずしも図7に示す全ての特徴を必要とするわけではない。
残差画像における「エネルギ」は、残差画像に含まれる情報量に関連する。仮に、予測画像と実画像とが同一だとすると、これら2つの画像の差(すなわち、残差画像)は、ゼロの情報(ゼロエネルギ)を含み、非常に容易に少量の符号化データに符号化することができる。
一般的に、予測画像の内容が、符号化される画像の内容と同様になるように、予測処理を或る程度良好に実行することができる場合、残差画像データは、入力画像よりも情報が少なく(エネルギが少ない)、容易に少量の符号化データに符号化することができると予想される。
また、DCTの使用は、一構成例の例示に過ぎない。他の変換方式として、例えば、離散サイン変換(DST:Discrete Sine Transform)を用いることができるであろう。変換方式は、例えば、1つの変換方式に別の変換方式が(直接的又は間接的に)続く構成等、個々の変換方式を組み合わせてもよい。
変換方式の選択は、明示的に決定されてもよく、且つ/又は、エンコーダ及びデコーダを構成するのに用いられる付帯情報(side information)に依存してもよい。
2つ目は、変換データの値がゼロである可能性を量子化処理により増加させることである。これらにより、少量の圧縮ビデオデータの生成において、後述するエントロピー符号化処理をより効率的に行うことができる。
したがって、スキャン処理は、(a)スキャンの一部として全ての係数が一度は選択されるように、且つ、(b)スキャンにより所望の再整理を行うことができるように、「スキャン順」に従って、量子化変換データ、及び、特に、変換及び量子化された画像データのブロックに対応する係数のブロックから係数を選択することを含む。有効な結果をもたらすスキャン順の一例は、いわゆるUp-right Diagonalスキャン順である。
しかしながら、CAVLCが示す(実行する上での)複雑性のレベルは、CABACの複雑性のレベルよりもはるかに低いと考えられている。なお、スキャン処理及びエントロピー符号化処理は、別々の処理として示されているが、実際には、組み合わせるか、又は、一緒に扱うことができる。すなわち、エントロピーエンコーダへのデータの読み出しは、スキャン順で行うことができる。これは、後述する各逆処理の場合も同様である。
もちろん、装置は、解凍時において元の入力画像にアクセスすることができない。装置がアクセスすることができるのは、解凍画像のみである。したがって、圧縮時において、予測部320は、解凍された圧縮画像に基づいて(少なくともインター画像符号化について)その予測を行う。
実際、スキャン部360によって実行されるスキャン処理も無損失であると考えられるが、本実施形態では、リターンパス390は、量子化部350の出力から、補足逆量子化部420の入力までとされている。ステージによって損失が生じる又は損失が生じる可能性がある場合、当該ステージは、リターンパスによって形成されるフィードバックループに含めてもよい。
例えば、エントロピー符号化ステージは、例えば、ビットをパリティ情報において符号化する技術によって、少なくとも原理的には損失を生じるものとされ得る。このような例では、エントロピー符号化及び復号化は、フィードバックループの一部を形成する必要がある。
したがって、デコーダ側では、デコーダは、残差画像を再構築し、これを(ブロック単位で)(加算部450によって)予測画像に適用することで各ブロックを復号化する。端的に言うと、加算部450の出力460が出力解凍ビデオ信号480を形成する。
実際には、信号を出力する前に、さらに(例えば、フィルタ560を用いて)フィルタリングを任意選択で施してもよい。このフィルタ560は、図8に示す。図8に比べて全体的な構成を示す図7では、フィルタ560は、見易さのために省略している。
これに関して、例えば、入力画像から、2つのバージョンの予測画像の領域を試行減算し、差分画像の各ピクセル値を2乗し、乗算値を合計し、当該2つのバージョンのうち、その画像領域に関連する差分画像の平均乗算値が低いのはどちらのバージョンかを特定することによって、画像エネルギを検出することができる。他の例では、選択毎に又はあり得る選択毎に試行符号化を実行することができる。そして、符号化に必要なビット数及び当該画像に対する歪みのうちの一方又は両方に関する、あり得る選択毎の費用に応じて選択が行われる。
サンプルアダプティブオフセッティング(SAO:Sample Adaptive Offsetting)フィルタを用いることも可能である。また、再構築信号460及び入力ビデオ信号300を処理することによって得られる係数を使用して、適応ループフィルタが任意選択で適用される。この適応ループフィルタは、公知の技術を使用して、フィルタリング対象のデータに対して適応フィルタ係数を適用するフィルタの一種である。すなわち、フィルタ係数は、各種要素に基づいて変化し得る。どのフィルタ係数を用いるかを定義するデータは、符号化出力データストリームの一部に挿入される。
この特定の目的のために、公知のいかなる圧縮/解凍システムを用いてもよい。記憶画像は、より高い解像度の記憶画像を生成する補間フィルタ580に送られる。この例では、補間フィルタ580によって出力される補間画像の解像度が、輝度チャンネルが4:2:0である場合に画像記憶部570に記憶された画像の4倍(各寸法)となるように、色チャンネルが4:2:0である場合に画像記憶部570に記憶された画像の8倍(各寸法)となるように、中間サンプル(サブサンプル)が生成される。補間画像は、動き推定部550及び動き補償予測部540への入力として送られる。
いくつかの例では、結果として得られるブロック又は領域は、様々なサイズを有し、場合によっては、決定木により、全体的に当該画像内の画像特徴の配列に沿った形状を有する。これだけでも符号化効率を向上させることができる。というのも、類似の画像特徴を表す又はこれらに沿うサンプルは、このような構成によって、グループ化される傾向にあるからである。いくつかの例では、異なるサイズの正方形ブロック又は領域(例えば、4×4サンプル~例えば64×64、又はより大きいブロック)が、選択に利用可能である。
他の構成例では、(例えば、垂直方向又は水平方向に配向された)矩形ブロック等の異なる形状のブロック又は領域を用いることができる。他の非正方形及び非矩形ブロックも包含される。このような画像のブロック又は領域への分割結果として、(少なくとも本例では)画像のサンプルがそれぞれ1つの、さらには、1つのみの係るブロック又は領域サンプルに割り当てられる。
各CUは、可能性として、TU単位で符号化される。なお、現在のCTU(Coding Tree Unit)内の個々のTU(ブロック分割のツリー構造において最大のノード)について、上述した(CU毎の、次いで、TU毎の)符号化の階層順は、現在のCUにおいて先に符号化されたサンプルが存在し、当該TUの符号化に利用可能であり得ることを意味する。これらのサンプルは、例えば、当該TUの右上又は左下に存在する。
このような理由から、CUは、変換ブロック又は領域、予測ブロック又は領域及び予測情報の構造に対して異なるツリー構造を有し得る。HEVC等のいくつかの例では、当該構造は、葉ノードが1つ又は複数の予測単位及び1つ又は複数のTUを含む、CUのいわゆる四分木とすることができる。TUは、画像のルマ及びクロマ表現に対応する複数の変換ブロックを含むことができ、予測方式は、変換ブロックレベルで適用可能であると考えることができる。
いくつかの例では、特定のサンプル群に適用されるパラメータは、主にブロックレベルで定義されると考えることができる。このブロックレベルは、変換構造と同じ粒度ではない可能性がある。
方向930は、単一の個別の参照サンプルを示してもよいが、より一般的には、周辺の参照サンプルの補間値を予測値として用いる。なお、ブロック910は、図13に示すように正方形であってもよく、矩形等の他の形状であってもよい。
コンテキストの選択は、既に復号化されたデータに基づいて、デコーダに渡される符号化データストリームに追加される(コンテキストを特定する)別のデータを必要とすることなく、デコーダにおいて同じ決定が行われるような決定論的な方法で実行される。
CABAC符号化のいくつかの例では、一連のデータを特に急速に処理する必要がある場合、当該バイパス経路を選択することができる。しかしながら、本実施形態では、いわゆる「バイパス」データの2つの特徴について言及する。1つ目の特徴は、バイパスデータは、50%の確率を表す固定コンテキストモデルを利用するだけでCABACエンコーダ(950,1460)により処理されることである。
2つ目の特徴は、バイパスデータは、一定のカテゴリのデータに関するということである。当該データの特定例は、係数符号データである。バイパス経路を選択しない場合、制御回路1435の制御下で動作する図に示すスイッチ1430,1440により正規経路が選択される。これには、コンテキストモデラ1450によって処理され、続いて符号化エンジン1460によって処理されるデータが含まれる。
バイナリ形式である重要性マップデータ自体は、CABAC符号化される。重要性マップを利用することは、重要性マップによってゼロであると示される大きさの係数に対してデータを符号化する必要はないため、圧縮に役立つ。また、重要性マップには、ブロックにおける最後の非ゼロ係数を示す特別なコードを含めることもできる。これにより、最後の高周波数/後置ゼロ(トレーリングゼロ)係数の全てを符号化から省略することができる。符号化ビットストリームにおいて、重要性マップの後には、重要性マップにより規定される非ゼロ係数の値を定義するデータが続く。
1つの例では、少なくとも有意性マップはCABACエンコードされ、残りのマップの少なくとも一部(符号データなど)はバイパスエンコードされる。したがって、各データ項目は、データのそれぞれのサブセットに分割され、それぞれのサブセットは、第1の(例えば、CABAC)および第2の(例えば、バイパス)符号化システムによって符号化される。
データ、CABACおよびバイパス符号化の性質は、所定の量のCABAC符号化データに対して、同じ初期データ項目に関して可変量がゼロ以上のバイパスデータが生成されるようなものである。したがって、例えば、量子化された、再配列されたDCTデータが実質的にすべてゼロ値を含む場合、バイパスデータが生成されないか、または非常に少量のバイパスデータが生成されてもよい。
これは、バイパスデータは、有意性マップの値がゼロでないことを示しているマップ位置のみに関係するためである。別の例では、多くの高い値係数を有する量子化再順序付けDCTデータにおいて、かなりの量のバイパスデータが生成されてもよい。
「次のビットは確率モデルと一致しない」ことを符号化することは効率が悪いので、コンテキストデータの導出は、エンコーダの良好な動作にとって重要である。「適応」という用語は、(まだ符号化されていない)次のデータとの良好な一致を提供する試みにおいて、コンテキストまたは確率モデルが符号化の間に適応されるか、または、変化されることを意味する。
バイパス処理-これらの実施形態では、CABAC符号化と同一であるが、確率モデルが1sと0sの等しい(0.5:0.5)確率分布で固定されているという事実に対して、少なくとも符号データと、値が>2であるかどうかを示すマップのために使用される。>2として識別されるそれらのデータ位置に対して、別個のいわゆるエスケープデータエンコードを使用して、データの実際の値を符号化することができる。これには、Golomb-Rice符号化技術が含まれてもよい。
エンコーダ1620は、CABACエンコーダ1500のモードにあるとき(上述のように)適応コンテキストモデルで動作し、かつ、バイパスエンコーダ1510のモードにあるとき、固定された50%確率コンテキストモデルで動作するように、エンコーダ1630の制御下で動作する。
図17を参照すると、それぞれのバッファ1710、1700は、CABACデコーダ1730およびバイパスデコーダ1720にデータを渡し、特定の符号化されたデータワードまたは値がCABACデコーダまたはバイパスデコーダのいずれかによって復号されるが、両方ではないように配置される。復号化されたデータは、ロジック1740によって、後続の復号化段階のための適切な順序に再順序付けされる。
デコーダ1850は、CABACデコーダ1730のモードにあるとき(上述のように)適応コンテキストモデルで動作し、かつ、バイパスエンコーダ1720のモードにあるとき、固定された50%確率コンテキストモデルで動作するように、デコーダ1860の制御下で動作する。
いわゆるタイルは、ピクチャをタイルの行と列に分割するための水平方向の境界と垂直境界を定義する。正規のスライスに対応する方法では、インピクチャ予測依存性はタイル境界を越えて許可されず、エントロピーデコード依存性もない。ただし、タイルは、個々のNALユニットに含まれるように制約されない。
N <= K1 * B + (K2 * CU)
ここで、N=出力データ部の2値化シンボル数、
K1は定数、
B=出力データ部のエンコードされたバイト数、
K2は、画像データ符号化装置によって採用される最小サイズ符号化単位の特性に依存する変数であり、
CU=最小サイズの符号化単位数で表される出力データ部で表されるピクチャ、スライス、またはタイルのサイズである。
BinCountsinNalUnits <= (32/3) * NumByteslnVclNalUnits +
(RawMinCuBits * PicSizelnMinCbsY)/32 (式2)
エンコーダ側で比較的簡単なレート制御を可能にするために、この状況を制御するために使用される技術は、スライスまたはピクチャあたりの2値の数を制限する(例えば、上限または閾値または制約として)ことである。その後、CABACデコーダによって要求される最大処理性能は、この制約のプロダクトまたは機能、および、スライスまたはピクチャがデコードされなければならない速度として考慮され得る。
したがって、例示的な構成では、出力データ部は独立して復号可能なデータユニットであってもよい。例えば、(出力データ部によって表される)画像部分は、画像、スライス、またはタイルのうちの1つであってもよい。
図20を参照すると、入力2000において、CABAC/EP符号化ストリームがエンコーダから受信される。パディングデータ検出器2010は、スライスまたはタイルを符号化した終端などのスライスまたはタイルの完了を参照して、所定の段階で、上述した閾値算出が準拠しているかどうかを検出する。
コントローラ2020は、検出器2010による検出に応答してパディングデータジェネレータ(生成器)2030を制御し、上述したCABACゼロワードのようなパディングデータ2040を生成し、これを結合器2050によってストリームに付加して出力ストリーム2060を形成する。
ゼロワードの生成は、ゼロワードが付加されると、パディングデータ検出器2010が閾値に準拠しているかどうかを監視し続け、閾値に準拠した後、コントローラ2020にゼロワードの生成を中止させるように、検出器2010に信号を送り返すこともできる。
例えば、フラグデータは、出力データ部のヘッダデータ(例えば、スライスヘッダデータ)のようなヘッダデータに含まれてもよい。検出器2070は、それ自体がフラグデータを生成または挿入する必要はない。プロセスのこの態様は、本説明の利益のために単に概略的目的のために図21に示されている。
属性は、(いくつかの例のように)属性が他の(例えば先行または後続の)出力データ部にも適用可能である場合であっても、所与の出力データ部に適用可能であると考えることができる。
画像データを表す連続するシンボルから二値化シンボルを表す出力データビットを生成するように構成された第1のデータエンコーダ1450、1460及び第2のデータエンコーダ1420を具備する。
第1のデータエンコーダは、符号化シンボルの数に対する可変データビットの比率で符号化シンボルを表す出力データビットを生成するように構成されている。
第2のデータエンコーダは、各符号化シンボルを表す固定数の出力データビットを生成するように構成されている。
エントロピーエンコーダは、(例えば、コントローラ2020及び/又はコントローラ1435を使用して)出力データストリームを生成するように構成されている。この出力データストリームは、制約を満たすために、その出力データ部のバイト単位のサイズを増加させるために、制約を満たさない各出力データ部に対して、パディングデータを提供するようにエントロピーエンコーダが構成されている、その出力データ部のバイトサイズに対する任意の個々の出力データ部のバイトサイズで表される二値化シンボルの数に対する上限を定義する制約を受ける。
装置は、
所与の出力データ部に適用可能な符号化属性を検出するように構成された属性検出器2070と、
検出された符号化属性に応じて、所与の出力データ部と共に使用するための制約を、2つ以上の候補制約から選択するように構成された選択器2080とを備える。
画像データ符号化装置は、連続する出力データ部の符号化された2値化シンボルを生成するように画像データを表すデータ項目を選択的に符号化するように構成されたエントロピーエンコーダを具備する。
エントロピーエンコーダは、出力データストリームを生成するように構成されており、この出力データストリームは、その出力データ部のバイトサイズに対する任意の個々の出力データ部のバイトサイズで表される二値化シンボルの数に対する上限を定義する制約を受け、
この制約を満たすために、その出力データ部のバイト単位のサイズを増加させるために、この制約を満たさない各出力データ部に対して、パディングデータを提供するようにエントロピーエンコーダが構成されている
画像データ符号化装置は、
所与の出力データ部に適用可能な符号化属性を検出するように構成された属性検出器と、
検出された符号化属性に応じて、所与の出力データ部と共に使用するための制約を、2つ以上の制約の候補から選択するように構成された選択器(セレクタ)とを備える。
BinCountsinNalUnits <= 10 * NumByteslnVclNalUnits +
(RawMinCuBits * PicSizelnMinCbsY)/16 (式3)
したがって、この選択は、dep_quantツールが現在有効か無効かではなく、プロファイル制約で行うことができる。
例えば、セクション8.7.3を参照する。これは、例えば、前にエンコードされ、デコードされたサンプル値のプロパティ(例えば、パリティプロパティ)に応答して、デコード処理が複数の可能な量子化パラメータまたは一連の量子化パラメータの間で選択する技術に関する。したがって、dep_quant_enabled_flag = 1(有効)の場合、このような進行中の従属クオンタイズの選択が行われる。dep_quant_enabled_flag = 0(無効)の場合、このような進行中の従属クオンタイズの選択は行われない。
前述のように、フラグdep_quant_enabled_flagは(コーディング属性の例として)、たとえばスライスヘッダに用意されており、従属クオンタイズの有効化または無効化がスライス全体に適用されるようになっている。
式(3)のような異なる制約は、従属量子化と共に使用するのにより適切であり得る。
タイルの例として、複数のソース(ソースごとに1つのタイル)からの画像の組成物のケースを考える。各タイルは、元のエンコード方法に応じて独自の閾値導出を有することができる。または、属性は、ピクチャ内の同じ位置にある前のタイル/出力データ部の属性の値を使用して決定することもできる。
N <= K1 * B + (K2 * CU)
ここで、
N = 出力データ部の2値化シンボル数、
K1は定数、
B = 出力データ部の符号化されたバイト数、
K2は、画像データ符号化装置によって採用される最小サイズ符号化単位の特性に依存する変数である。
CU = 最小サイズの符号化単位数で表される出力データ部によって表されるピクチャ、スライス、またはタイルのサイズである。
vcIByteScaleFactor = (32 + 4 * general_tier_flag) / 3
ここで、general_tier_flagは、エンコーディング層のインジケータであり、(少なくともいくつかの例では)0または1のフラグ値として変化する。0はいわゆるメイン層を示し、1はいわゆる高層を示す。
(符号化されるべき画像の最大寸法を表す) 特定の符号化レベルに対して、高層は一般にメイン層より高いビットレート表現に対応する。したがって、この例では、画像データ符号化装置は、少なくとも2つの候補符号化層から選択された符号化層で動作し、少なくとも定数K1が層パラメータに依存する、現在選択された符号化層を定義する層パラメータ(例えば、符号化された画像データまたはビットストリーム内でまたはこれに少なくとも関連して符号化される)を生成するように構成される。
例えば、層(ティア)パラメータが高いほど、特定の画像サイズに対して符号化された高品質の出力が示され、層パラメータに応じてパラメータK1が増加する場合がある。
次いで、式 N <= K1* B + (K2 * CU)は、一般的に選択された(K1、K2)を使用して、比較器2090でテストすることができる。
(ステップ2300で)画像データを表すデータ項目を選択的に符号化して、連続する出力データ部の符号化された二値化シンボルを生成するステップと、
(ステップ2310で)その出力データ部のバイト単位のサイズに対して任意の個々の出力データ部によって表される2値化シンボルの数の上限を定義する制約を受ける出力データストリームを生成するステップと、
(ステップ2320で)この制約を満たすために、その出力データ部のバイト単位のサイズを大きくするように、この制約を満たさない各出力データ部に対して、パディングデータを提供するステップと、
(ステップ2330で)所与の出力データ部に適用可能な符号化属性を検出するステップと、
(ステップ2340で)検出された符号化属性に応答して、所与の出力データ部と共に使用するための制約を、2つ以上の候補制約から選択するステップと
を含む。
任意の実施形態における部品および構成要件が、任意の適切な方法で物理的に、機能的に、及び、論理的に実装される。実際、機能は、単一のユニットで、複数のユニットで、または他の機能ユニットの一部として実装され得る。したがって、本開示の実施形態は、単一のユニットで実装されてもよく、または異なるユニット、回路、および/またはプロセッサの間で物理的および機能的に分散されてもよい。
(1)連続する出力データ部の符号化された2値化シンボルを生成するように画像データを表すデータ項目を選択的に符号化するように構成されたエントロピーエンコーダと、
所与の出力データ部に適用可能な符号化属性を検出するように構成された属性検出器と、
検出された符号化属性に応じて、前記所与の出力データ部と共に使用するための制約を、2つ以上の制約の候補から選択するように構成された選択器と
を具備し、
前記エントロピーエンコーダは、出力データストリームを生成するように構成されており、この出力データストリームは、その出力データ部のバイトサイズに対する任意の個々の出力データ部のバイトサイズで表される二値化シンボルの数に対する上限を定義する制約を受け、
この制約を満たすために、その出力データ部のバイト単位のサイズを増加させるために、制約を満たさない各出力データ部に対して、パディングデータを提供するように前記エントロピーエンコーダが構成されている
画像データ符号化装置。
(2)前記エントロピーエンコーダは、符号化された二値化シンボルを生成するために、第1の、コンテキスト適応二値算術符号化(CABAC)、符号化システム、または、第2の、バイパス、符号化システムによって符号化されるべき画像データを表すデータ項目を選択的に符号化するように構成されている
(1)に記載の画像データ符号化装置。
(3)前記画像データは、1つ以上のピクチャを表し、各々のピクチャは、
(i)各ネットワークアブストラクションレイヤ(NAL)部内の1つ以上のスライスと、
(ii)ピクチャ領域のそれぞれの水平方向の境界及び垂直境界を定義し、それぞれのNALユニット内にカプセル化されるように制約されないゼロ個以上のタイルと、
を表すデータを含んでおり、
ピクチャの各スライスは、同じピクチャの他のスライスとは無関係に復号化可能であり、前記タイルは、同じピクチャの他のタイルとは無関係に復号化可能であり、
前記出力データ部は、1つ以上のピクチャ、スライス及びタイルを含む
(1)に記載の画像データ符号化装置。
(4)前記第2の符号化システムは、固定された50%確率コンテキストモデルを使用する二値算術符号化システムである
(1)または(2)に記載の画像データ符号化装置。
(5)前記制約は、
N <= K1 * B + (K2 * CU) (制約式1)
ここで、N=前記出力データ部の2値化シンボル数、
K1は定数、
B=前記出力データ部のエンコードされたバイト数、
K2は、前記画像データ符号化装置によって採用される最小サイズ符号化単位の特性に依存する変数であり、
CU=最小サイズの符号化単位数で表される前記出力データ部で表される前記ピクチャ、スライスまたはタイルのサイズである
ように定義される
(1)~(4)のいずれか1つに記載の画像データ符号化装置。
(6)少なくとも2つの候補制約が前記制約式1によって定義され、
一連の(K1、K2)のそれぞれが前記少なくとも2つの候補制約の各々に関連付けられ、
前記選択器が、前記所与の出力データ部のための一連の(K1、K2)を選択するように構成されている
(5)に記載の画像データ符号化装置。
(7)前記コントローラは、前記所定の出力データ部を表す出力データストリームに関連して、前記所定の出力データ部に適用可能な前記符号化属性の表現を符号化するように構成されている
(1)~(6)のいずれか1つに記載の画像データ符号化装置。
(8)前記画像データ符号化装置は、従属量子化モードで選択的に動作するように構成された量子化部を含み、
前記符号化属性は、前記従属量子化モードが所与の出力データ部に関して有効か無効かを示す
(7)に記載の画像データ符号化装置。
(9)前記エントロピーエンコーダは、
現在の出力データ部の符号化に対する所定の段階で、前記制約が前記現在の出力データ部によって満たされるかどうかを検出するように構成された検出器と、
挿入されるパディングデータを含む前記出力データ部が前記制約を満たすように、前記現在の出力データ部に十分なパディングデータを生成し、挿入するように構成されたパディングデータ生成器と
を含む
(1)~(8)のいずれか1つに記載の画像データ符号化装置。
(10)前記所定の段階が、前記現在の出力データ部を符号化した終端である
(6)に記載の画像データ符号化装置。
(11)(1)~(10)のいずれか1つに記載の画像データ符号化装置を具備する、ビデオ記憶装置、キャプチャ装置、送受信装置。
(12)画像データを表すデータ項目を選択的に符号化して、連続する出力データ部の符号化された二値化シンボルを生成するステップと、
前記出力データ部のバイト単位のサイズに対して任意の個々の出力データ部によって表される2値化シンボルの数の上限を定義する制約を受ける出力データストリームを生成するステップと、
この制約を満たすために、その出力データ部のバイト単位のサイズを大きくするように、この制約を満たさない各出力データ部に対して、パディングデータを提供するステップと、
所与の出力データ部に適用可能な符号化属性を検出するステップと、
検出された符号化属性に応答して、所与の出力データ部と共に使用するための制約を、2つ以上の候補制約から選択するステップと
を含む
画像データ符号化方法。
(13)コンピュータによって実行されるときに、前記コンピュータに、(12)に記載の方法を実行させるコンピュータソフトウェア。
(14)(13)に記載のコンピュータソフトウェアを記憶する、機械読み取り可能な非一時的記憶媒体。
(15)(12)に記載の方法に従って生成された符号化データを含むデータ信号。
(16)(15)に記載のデータ信号を復号化するように構成された画像データデコーダ。
Claims (16)
- 連続する出力データ部の符号化された2値化シンボルを生成するように画像データを表すデータ項目を選択的に符号化するように構成されたエントロピーエンコーダと、
所与の出力データ部に適用可能な符号化属性を検出するように構成された属性検出器と、
検出された符号化属性に応じて、前記所与の出力データ部と共に使用するための制約を、2つ以上の制約の候補から選択するように構成された選択器と
を具備し、
前記エントロピーエンコーダは、出力データストリームを生成するように構成されており、この出力データストリームは、その出力データ部のバイトサイズに対する任意の個々の出力データ部のバイトサイズで表される二値化シンボルの数に対する上限を定義する制約を受け、
この制約を満たすために、その出力データ部のバイト単位のサイズを増加させるために、制約を満たさない各出力データ部に対して、パディングデータを提供するように前記エントロピーエンコーダが構成されている
画像データ符号化装置。 - 前記エントロピーエンコーダは、符号化された二値化シンボルを生成するために、第1の、コンテキスト適応二値算術符号化(CABAC)、符号化システム、または、第2の、バイパス、符号化システムによって符号化されるべき画像データを表すデータ項目を選択的に符号化するように構成されている
請求項1に記載の画像データ符号化装置。 - 前記画像データは、1つ以上のピクチャを表し、各々のピクチャは、
(i)各ネットワークアブストラクションレイヤ(NAL)部内の1つ以上のスライスと、
(ii)ピクチャ領域のそれぞれの水平方向の境界及び垂直境界を定義し、それぞれのNALユニット内にカプセル化されるように制約されないゼロ個以上のタイルと、
を表すデータを含んでおり、
ピクチャの各スライスは、同じピクチャの他のスライスとは無関係に復号化可能であり、前記タイルは、同じピクチャの他のタイルとは無関係に復号化可能であり、
前記出力データ部は、1つ以上のピクチャ、スライス及びタイルを含む
請求項1に記載の画像データ符号化装置。 - 前記第2の符号化システムは、固定された50%確率コンテキストモデルを使用する二値算術符号化システムである
請求項1に記載の画像データ符号化装置。 - 前記制約は、
N <= K1 * B + (K2 * CU) (制約式1)
ここで、N=前記出力データ部の2値化シンボル数、
K1は定数、
B=前記出力データ部のエンコードされたバイト数、
K2は、前記画像データ符号化装置によって採用される最小サイズ符号化単位の特性に依存する変数であり、
CU=最小サイズの符号化単位数で表される前記出力データ部で表される前記ピクチャ、スライスまたはタイルのサイズである
ように定義される
請求項1に記載の画像データ符号化装置。 - 少なくとも2つの候補制約が前記制約式1によって定義され、
一連の(K1、K2)のそれぞれが前記少なくとも2つの候補制約の各々に関連付けられ、
前記選択器が、前記所与の出力データ部のための一連の(K1、K2)を選択するように構成されている
請求項5に記載の画像データ符号化装置。 - 前記コントローラは、前記所定の出力データ部を表す出力データストリームに関連して、前記所定の出力データ部に適用可能な前記符号化属性の表現を符号化するように構成されている
請求項1に記載の画像データ符号化装置。 - 前記画像データ符号化装置は、従属量子化モードで選択的に動作するように構成された量子化部を含み、
前記符号化属性は、前記従属量子化モードが所与の出力データ部に関して有効か無効かを示す
請求項7に記載の画像データ符号化装置。 - 前記エントロピーエンコーダは、
現在の出力データ部の符号化に対する所定の段階で、前記制約が前記現在の出力データ部によって満たされるかどうかを検出するように構成された検出器と、
挿入されるパディングデータを含む前記出力データ部が前記制約を満たすように、前記現在の出力データ部に十分なパディングデータを生成し、挿入するように構成されたパディングデータ生成器と
を含む
請求項1に記載の画像データ符号化装置。 - 前記所定の段階が、前記現在の出力データ部を符号化した終端である
請求項6に記載の画像データ符号化装置。 - 請求項1に記載の画像データ符号化装置を具備する、ビデオ記憶装置、キャプチャ装置、送受信装置。
- 画像データを表すデータ項目を選択的に符号化して、連続する出力データ部の符号化された二値化シンボルを生成するステップと、
前記出力データ部のバイト単位のサイズに対して任意の個々の出力データ部によって表される2値化シンボルの数の上限を定義する制約を受ける出力データストリームを生成するステップと、
この制約を満たすために、その出力データ部のバイト単位のサイズを大きくするように、この制約を満たさない各出力データ部に対して、パディングデータを提供するステップと、
所与の出力データ部に適用可能な符号化属性を検出するステップと、
検出された符号化属性に応答して、所与の出力データ部と共に使用するための制約を、2つ以上の候補制約から選択するステップと
を含む
画像データ符号化方法。 - コンピュータによって実行されるときに、前記コンピュータに、請求項12に記載の方法を実行させるコンピュータソフトウェア。
- 請求項13に記載のコンピュータソフトウェアを記憶する、機械読み取り可能な非一時的記憶媒体。
- 請求項12に記載の方法に従って生成された符号化データを含むデータ信号。
- 請求項15に記載のデータ信号を復号化するように構成された画像データデコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1913733.0 | 2019-09-24 | ||
GB1913733.0A GB2587359A (en) | 2019-09-24 | 2019-09-24 | Image data encoding and decoding |
PCT/GB2020/052296 WO2021058947A1 (en) | 2019-09-24 | 2020-09-23 | Image data encoding and decoding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022548685A true JP2022548685A (ja) | 2022-11-21 |
Family
ID=68425486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022517356A Pending JP2022548685A (ja) | 2019-09-24 | 2020-09-23 | 画像データの符号化及び復号化 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230007259A1 (ja) |
EP (1) | EP4014493A1 (ja) |
JP (1) | JP2022548685A (ja) |
KR (1) | KR20220062540A (ja) |
CN (1) | CN114788276A (ja) |
BR (1) | BR112022005038A2 (ja) |
GB (1) | GB2587359A (ja) |
WO (1) | WO2021058947A1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130034566A (ko) * | 2011-09-28 | 2013-04-05 | 한국전자통신연구원 | 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치 |
GB201119180D0 (en) * | 2011-11-07 | 2011-12-21 | Sony Corp | Data encoding and decoding |
-
2019
- 2019-09-24 GB GB1913733.0A patent/GB2587359A/en not_active Withdrawn
-
2020
- 2020-09-23 EP EP20780776.9A patent/EP4014493A1/en active Pending
- 2020-09-23 BR BR112022005038A patent/BR112022005038A2/pt unknown
- 2020-09-23 US US17/642,910 patent/US20230007259A1/en active Pending
- 2020-09-23 CN CN202080066130.9A patent/CN114788276A/zh active Pending
- 2020-09-23 WO PCT/GB2020/052296 patent/WO2021058947A1/en unknown
- 2020-09-23 KR KR1020227009735A patent/KR20220062540A/ko unknown
- 2020-09-23 JP JP2022517356A patent/JP2022548685A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114788276A (zh) | 2022-07-22 |
BR112022005038A2 (pt) | 2022-06-21 |
GB2587359A (en) | 2021-03-31 |
EP4014493A1 (en) | 2022-06-22 |
KR20220062540A (ko) | 2022-05-17 |
GB201913733D0 (en) | 2019-11-06 |
US20230007259A1 (en) | 2023-01-05 |
WO2021058947A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10893273B2 (en) | Data encoding and decoding | |
TWI657692B (zh) | 於視訊寫碼程序中用於係數層級寫碼之萊斯(rice)參數初始化 | |
US10284864B2 (en) | Content initialization for enhancement layer coding | |
US9544599B2 (en) | Context adaptive data encoding | |
CN117915092A (zh) | 数据编码和解码方法、数据编码和解码设备及存储介质 | |
JP2022539311A (ja) | ピクチャのサブセクション用の独立したcabac | |
JP2022538007A (ja) | 画像データ符号化及び復号化 | |
WO2020260878A1 (en) | High throughput cabac | |
JP2022548685A (ja) | 画像データの符号化及び復号化 | |
US11936872B2 (en) | Image data encoding and decoding | |
KR20240135611A (ko) | 비디오 코딩의 일반 제약 정보를 전송 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220603 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240521 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240917 |