JP2023506878A - サブピクチャに関連するビデオコーディング - Google Patents
サブピクチャに関連するビデオコーディング Download PDFInfo
- Publication number
- JP2023506878A JP2023506878A JP2022536874A JP2022536874A JP2023506878A JP 2023506878 A JP2023506878 A JP 2023506878A JP 2022536874 A JP2022536874 A JP 2022536874A JP 2022536874 A JP2022536874 A JP 2022536874A JP 2023506878 A JP2023506878 A JP 2023506878A
- Authority
- JP
- Japan
- Prior art keywords
- sub
- picture
- video
- pictures
- data stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 43
- 239000010410 layer Substances 0.000 claims description 426
- 238000000034 method Methods 0.000 claims description 130
- 238000000605 extraction Methods 0.000 claims description 48
- 239000000945 filler Substances 0.000 claims description 21
- 230000011664 signaling Effects 0.000 claims description 18
- 230000000153 supplemental effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 241000023320 Luma <angiosperm> Species 0.000 claims description 12
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 239000011229 interlayer Substances 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims 5
- 238000012217 deletion Methods 0.000 claims 4
- 230000037430 deletion Effects 0.000 claims 4
- 238000013213 extrapolation Methods 0.000 claims 4
- 230000000295 complement effect Effects 0.000 claims 2
- 230000007717 exclusion Effects 0.000 claims 2
- 230000002265 prevention Effects 0.000 description 8
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 7
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 7
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 7
- 238000002490 spark plasma sintering Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/395—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
ビデオが符号化されたデータストリームの符号化、処理、及び復号を含む概念が説明され、この場合ビデオは複数の写真を含み、この場合、データストリームは、少なくとも2つのレイヤに複数の画像を含み、この場合、少なくとも1つのレイヤの画像は、所定のレイヤ固有の数のサブピクチャに分割され、1つのレイヤの1つまたは複数の画像またはサブピクチャは、1つまたは複数の他のレイヤの1つまたは複数の画像に対応し、サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界、及び対応するサブピクチャまたは異なる層内の対応するピクチャの境界の少なくとも1つが互いに一直線化していることの表示を含む。【選択図】図5
Description
本願は、ビデオコーディングの概念、特にサブピクチャに関する。
複数のコード化されたビデオビットストリームまたはデータストリームが共同で復号される特定のビデオベースのアプリケーションが存在する。例えば共同ビットストリームにマージされ、複数の参加者からのコード化されたビデオストリームが単一のエンドポイントで処理されるマルチパーティ会議などの単一のデコーダ、または例えばVR(仮想現実)のアプリケーションでの360度のタイルビデオ再生用のタイルベースのストリーミングに供給される。
高効率ビデオコーディング(HEVC)の場合、モーション制約タイルセットが定義され、モーションベクトルは、現在のタイルセット(またはタイル)とは異なるタイルセット(またはタイル)を参照しないように制約された。したがって、問題のタイルセット(またはタイル)は、復号の結果に影響を与えることなく、ビットストリームから抽出するか、別のビットストリームにマージすることができ、例えば復号されたサンプルは、問題のタイルセット(またはタイル)が単独で復号されるか、各画像に対してより多くのタイルセット(またはタイル)を有するビットストリームの一部として復号されるかに関係なく、完全に一致する。
後者では、そのような技術が役立つ360度ビデオの例が示されている。ビデオは空間的にセグメント化され、各空間セグメントは、図1に示すように、さまざまな空間解像度の複数の表現で、ストリーミングするクライアントに提供される。この図は、2つの解像度で6×4の空間セグメントに分割された360度のビデオを投影したキューブマップを示している。簡単にするために、これらの独立した復号可能な空間セグメントは、この説明ではタイルと呼ばれる。
ユーザは通常、90×90度の視野を表す青の中実の視野の境界を介して、図2の左側に示されているように、最新のヘッドマウントディスプレイを使用する場合、360度ビデオ全体を構成するタイルのサブセットのみを表示する。図2で緑色で網掛けされている対応するタイルは、最高の解像度でダウンロードされる。
ただし、クライアントのアプリケーションはまた、ユーザの突然の向きの変更を処理するために、図2で赤で網掛けされている現在のビューポートの外側にある他のタイルの表現をダウンロードして復号する必要がある。したがって、このようなアプリケーションのクライアントは、現在のビューポートを最高の解像度でカバーするタイルと、現在のビューポートの外側のタイルを比較的低い解像度でダウンロードするが、タイルの解像度の選択は常にユーザの向きに合わせて調整される。クライアント側でダウンロードした後、ダウンロードしたタイルを単一のビットストリームにマージして単一のデコーダで処理することは、限られた計算リソースと電力リソースを備える一般的なモバイルデバイスの制約に対処する手段である。図3は、上記の例のジョイントビットストリームで可能なタイルの配置を示している。ジョイントビットストリームを生成するためのマージ操作は、圧縮ドメイン処理を介して実行する必要がある、例えばトランスコーディングによるピクセルドメインでの処理を回避する。
HEVCビットストリームは主にインターコーディングツールに関係するいくつかの制約に従って符号化しているため、マージプロセスを実行できる、例えば上記のようにモーションベクトルを制約する。
新たに登場したコーデックVVCは、同じ目標を達成するためのより効果的な他の手段、つまりサブピクチャを提供する。サブピクチャを使用すると、全体画像よりも小さい領域を、境界が画像であるかのように扱われるという意味で、画像と同様に扱うことができる、例えば運動補償のために境界拡張を適用し、例えば運動ベクトルが領域の外側を指している場合、領域の最後のサンプル(交差する境界)が繰り返され、画像の境界で行われるのとまったく同じように、予測に使用される参照ブロックにサンプルが生成される。これにより、モーションベクトルはHEVC MCTSのようにエンコーダで制約されず、対応する効率が低下する。
新しいVVCコーディング標準は、マルチレイヤサポート用のメインプロファイルでスケーラブルなコーディングツールを提供することも想定している。したがって、上記のアプリケーションシナリオのさらに効率的な構成は、低解像度のコンテンツ全体をより少ない頻度のRAPで符号化することによって実現できる。ただし、これには、常にベースレイヤに低解像度のコンテンツが含まれ、拡張レイヤに幾ばくか高解像度のコンテンツが含まれるレイヤコーディング構造を使用する必要がある。階層化されたコーディング構造を図1に示す。
ただし、ビットストリームの単一領域の抽出を可能にするいくつかのユースケースには依然として関心があり得る。例えば、エンドツーエンドの遅れが高次のユーザは、360度のビデオ全体を低解像度(すべてのタイル)でダウンロードするが、エンドツーエンドの遅れが低次のユーザは、低解像度コンテンツのタイルを少なくダウンロードする、例えばダウンロードする高解像度タイルと同じ数である。
したがって、階層化されたサブピクチャの抽出は、ビデオコーディングの標準によって適切に処理される必要がある。これには、デコーダ側またはエクストラクター側で適切な知識を保証する追加のシグナリングが必要である。
したがって、本発明の目的は、現在利用可能なメカニズムを改善するこの追加のシグナリングを提供することである。
本願の独立請求項の主題によってこの目的が達成される。
本願の第1の態様によれば、データストリームは、ビデオの複数の画像に復号され、データストリームは、少なくとも2つのレイヤに複数の画像を含む。この場合、少なくとも1つのレイヤの画像は、所定のレイヤ固有の数のサブピクチャ、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む。その中の表示は、言い換えれば、データストリームから復号または解析し、異なるレイヤの対応するサブピクチャまたは対応する画像の境界の少なくとも1つが、互いに一直線化しているという表示を解釈する。
本願の第2の態様によれば、一定のビットレートのデータストリームが処理され、複数の画像のそれぞれが所定の数のサブピクチャに分割される方法で、中に符号化された前記複数の画像を有し、各サブピクチャは、運動補償のための境界拡張の境界を含む。サブピクチャデータストリームは、少なくとも1つのサブピクチャのデータストリームに含まれるダミーデータを保持すること、及び抽出されたデータストリームが関係しない別のサブピクチャのデータストリームに含まれるダミーデータを削除することによって、一定のビットレートで少なくとも1つのサブピクチャに関連するデータストリームから生成する。
本発明の第3の態様によれば、サブピクチャ抽出が、複数のレイヤに符号化されたビデオの複数の画像を有するデータストリームに対して実行され、この場合、すべてのレイヤの複数の画像のそれぞれが所定の数のサブピクチャに分割され、各サブピクチャは運動補償のための境界拡張のための境界を含む。サブピクチャ抽出は、1つまたは複数のサブピクチャに対応しないデータストリームのNALユニットをドロップすること、及びパラメータセット及び/またはピクチャヘッダを書き換えることによって、関心のある1つまたは複数のサブピクチャに関連する抽出されたデータストリームへデータストリームに対して実行される。
本発明の第4の態様によれば、ビデオの複数の画像がデータストリームに符号化され、複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含む。複数の画像は、スライスの単位で符号化され、スライスのスライスヘッダに書き込まれ、第1の構文要素及びサブピクチャ識別情報パラメータがあり、第1の構文要素及びサブピクチャ識別情報パラメータは、1ずつ増加し、ビットで区切られ、1に設定され、スライスの少なくとも1つのスライスヘッダでデータストリームに書き込まれる。
本発明の第5の態様によれば、ビデオの複数の画像がデータストリームに符号化され、複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含む。複数の画像がスライスの単位で符号化され、スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータが書き込まれる。その中で、第1の構文要素及びサブピクチャ識別情報パラメータがデータストリームに書き込まれるので、第1の構文要素は第1のビットの長さで書き込まれ、サブピクチャ識別情報パラメータは第2のビットの長さで書き込まれ、第1の構文要素はサブピクチャ識別情報パラメータに先行し、第1の構文要素が1つ増加したデータストリームに書き込まれるように、またサブピクチャ識別情報パラメータが特定の値だけ増加したデータストリームに書き込まれ、その後に少しで続き、1に設定するようにする。
特定の値は、第1のビットの長さと第2のビットの長さの合計が31ビットより小さいかどうかをチェックし、第1のビットの長さと第2のビットの長さの合計が31ビットより小さい場合は、特定の値を値1に設定すること、また第1及び第2のビットの長さの合計が31ビット以上の場合は、特定の値を値4に設定することに決定される。
本発明の第6の態様によれば、ビデオの複数の画像がデータストリームに符号化され、複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含む。各サブピクチャは、コンテキスト適応型バイナリ算術コーディングを使用して符号化され、この場合、ビデオエンコーダは、サブピクチャのいずれかが所定ビンとビットの比率を超えることを回避するように、ゼロワードの各サブピクチャの1つまたは複数のスライスの終わりに少なくとも1つのサブピクチャのデータストリームを提供するように構成される。
上記のすべての態様は、符号化または復号に限定されず、符号化及び復号のそれぞれの他の態様は、同じ原理に基づいている。本願の前述の態様に関して、すべての態様などの前述の態様の2つ以上がビデオコーデックに同時に実装されるように、同じものを組み合わせることができることに留意されたい。
本願の好ましい実施形態が、図に関して以下に説明される。
以下では、本発明の追加の実施形態及び態様が説明され、これらは、個別に、または本明細書に記載の特徴及び機能及び詳細のいずれかと組み合わせて使用することができる。
第1の実施形態は、層及びサブピクチャ、特にサブピクチャの境界一直線化(2.1)に関する。
サブピクチャの境界がレイヤ間で一直線化していることが通知される、例えばレイヤごとに同じ数のサブピクチャが存在し、すべてのサブピクチャの境界はサンプルが正確に併置されている。これは、例えば図4に示されている。このようなシグナリングは、例えばsps_subpic_treatment_as_pic_flagによって実装できる。このフラグsps_subpic_treatment_as_pic_flag[i]が設定されている場合、例えば1に等しい値を持つ場合、コード化されたレイヤワイズビデオシーケンスCLVSの各コード化された画像のi番目のサブピクチャは、ループ内フィルタリング操作を除く、復号プロセスの画像として扱われるように指定される。sps_subpic_treatment_as_pic_flag[i]が設定されていない場合、例えば値が0の場合、CLVS内の各コード化画像のi番目のサブピクチャは、ループ内フィルタリング操作を除く復号プロセスで画像として扱われないように指定される。フラグが存在しない場合は、例えばsps_subpic_treatment_as_pic_flag[i]の値は1に等しいと推測される設定されていると見なすことができる。
抽出器/受信機はスライスヘッダに存在するサブピクチャIDを検索して、対象のサブピクチャに属していないすべてのNALユニットをドロップできるため、シグナリングは抽出に有用である。サブピクチャが一直線化されると、サブピクチャIDはレイヤ間で1対1でマッピングされる。これは、サブピクチャID Aによって識別されるエンハンスメント層サブピクチャAのすべてのサンプルについて、ベース層サブピクチャBの併置されたサンプルが、サブピクチャID Bnによって識別される単一のサブピクチャに属することを意味する。
説明されているように一直線化がない場合、参照レイヤの各サブピクチャに対して、参照レイヤに複数のサブピクチャが存在する可能性があり、ビットストリームの抽出または並列化の観点、レイヤのサブピクチャの部分的なオーバーラップから、遥かに劣悪であることに留意されたい。
特定の実装では、サブピクチャの一直線化の表示は、これがレイヤ固有のシグナリングであるため、VPSで示されるprofile_tier_level()のgeneral_constraint_info()構造の制約フラグによって行うことができる。これは、例えば図5に示されている。
構文は、出力レイヤセット(OLS)内のレイヤがサブピクチャを一直線化していることを示すことができる。別のオプションは、ビットストリームの全レイヤの一直線化を示すことであり、例えばすべてのOLSに対して、シグナリングOLSを独立させることが挙げられる。
言い換えれば、この実施形態では、データストリームは、ビデオの複数の画像に復号され、データストリームは、少なくとも2つのレイヤに複数の画像を含む。この例では、1つのレイヤがベースレイヤ(図4の「低解像度」)で、もう1つのレイヤが拡張レイヤ(図4の「高解像度」)である。両方のレイヤの画像は、タイルとも時に呼ばれるサブピクチャに分割され、少なくとも図4の例では、ベースレイヤの各サブピクチャには、エンハンスメントレイヤにおいて対応するサブピクチャがある。図4に示すサブピクチャの境界は、運動補償の境界拡張に使用される。
復号では、異なるレイヤの対応するサブピクチャの境界の少なくとも1つが互いに一直線化していると解釈される表示がある。簡単な注記として、本明細書の説明全体を通して、異なる層のサブピクチャは、それらのコロケーションのために互いに対応していると理解され、すなわち、それらは、それらが含まれる画像の中の同じ位置に配置されることに留意されたい。サブピクチャは、それが含まれている同じピクチャ内の他のいずれかのサブピクチャから独立してコード化される。しかしながら、そのレイヤの画像の相互に対応するサブピクチャを説明する用語の特定の層のサブピクチャ及びこれらの相互に対応するサブピクチャは、これらの相互に対応するサブピクチャの外側の領域からの符号化依存性が不要であるように、また、例えば、境界の拡張がこれらの相互に対応するサブピクチャ内のブロックの運動ベクトルによって指し示される運動補償参照部分、すなわち、サブピクチャの境界を超えて延びるこれらの参照部分の一部分に使用されるよう、運動補償予測及び時間予測を使用して符号化される。そのようなレイヤの画像のサブピクチャへの細分割は、互いに重なり合うサブピクチャが互いに対応し、一種の独立してコード化されたサブビデオを形成するような方法で行われる。サブピクチャは、層間予測に関連して機能する場合もあることに留意されたい。コーディング/デコーディングにレイヤ間予測が利用できる場合、あるレイヤの1つの画像が、下のレイヤの別の画像から予測され、両方の画像が同じ時刻になる。あるレイヤの1つの画像の1つのブロックと呼ばれる領域は、別の層の参照画像のサブピクチャの境界を超えて広がり、1つのブロックが併置されている、つまり領域がオーバーレイされている領域は、境界で埋められる拡張、つまり、参照画像の併置されたサブピクチャの外部からのコンテンツを使用しないことによる。
画像が1つのサブピクチャにのみ分割されている場合、つまり画像がサブピクチャとして扱われている場合、画像はレイヤ間で相互に対応し、画像の境界が一直線化され、運動補償の境界拡張に使用されていることを示す。
少なくとも2つの層内の複数の画像のそれぞれは、1つまたは複数のサブピクチャに分割することもでき、異なる層内の対応するサブピクチャのすべての境界が互いに一直線化する程度まで表示を解釈することができる。
以下は、サブピクチャIDの対応(2.2)に関するものである。
サブピクチャの境界の一直線化に加えて、サブピクチャが一直線化されている場合に、レイヤ間で互いに対応するサブピクチャIDの検出を容易にすることも必要である。
最初のオプションでは、ビットストリームのサブピクチャIDは異なる、例えば各サブピクチャIDは、OLSの1つのレイヤでのみ使用できる。これにより、各レイヤサブピクチャは独自のIDによって一意に識別できる。これは、例えば図6に示されている。
これは、2つのレイヤが1つのOLSに属しているかどうかに関係なく、ビットストリーム全体で一意のID、例えばビットストリームの任意のOLSにも当てはまる可能性があることに留意されたい。したがって、一実施形態では、任意のサブピクチャIDの値は、ビットストリーム内で一意である(例えば、unique_ids_in_bitstream_flag)。
2番目のオプションでは、レイヤ内のサブピクチャは、(OLSまたはビットストリーム全体の)別のレイヤ内の対応する一直線化されたサブピクチャと同じID値を有する。これにより、サブピクチャID値を照合するだけで、対応するサブピクチャを非常に簡単に識別できる。また、抽出プロセスは、対象のサブピクチャごとに1つのIDのみが抽出器で必要とされるため、簡略化されている。これは、例えば図7に示されている。aligned_subpictures_ids_in_ols_unique_flagの代わりに、SubpicIdVal制約を使用することもできる。
以下は、サブピクチャのシグナリング順序(2.3)に関するものである。
サブピクチャIDのシグナリング順序、位置、及び寸法も制約されている場合、サブピクチャIDの対応の処理を大幅に簡素化できる。これは、対応する一直線化されたサブピクチャと一意のサブピクチャIDが示されている場合(例えば、フラグsubpictures_in_ols_aligned_flagとaligned_subpictures_ids_in_ols_unique_flagが1に設定されている場合)、サブピクチャの定義(位置、幅、高さ、境界線の処理、その他のプロパティを含む)をOLS上のすべてのSPSにわたって一直線化させる必要があることを意味する。
例えば、構文要素sps_num_subpics_minus1は、可能なリサンプリング要素を考慮して、レイヤとそのすべての参照レイヤ、及びsubpic_ctu_top_left_x [i]、subpic_ctu_top_left_y [i]、subpic_width_minus1 [i]、subpic_height_minus1[i]で同じ値を有する必要がある。
この実施形態では、すべての層のSPS内のサブピクチャの順序(SPS内の構文要素の緑色のマーキングを参照)は、同じになるように制約されている。これにより、サブピクチャとレイヤ間の位置の簡単な照合と検証が可能になる。これは、例えば図8に示されている。
サブピクチャIDシグナリングは、以下に示すように、SPS、PPS、またはPHのそれぞれの上書き機能で発生する可能性があり、aligned_subpictures_ids_in_ols_flagが1の場合、サブピクチャIDの値はすべてのレイヤで同じである必要がある。unique_subpictures_ids_in_ols_flagが1の場合、サブピクチャIDの値は複数のレイヤで発生しないようにする必要がある。これは、例えば図9から11に示されている。
言い換えれば、この実施形態では、相対的なサブピクチャ位置及びサブピクチャの寸法は、すべての層の対応するサブピクチャについて同じであるという指示が解釈される。例えば、データストリーム内のシグナリング順序を表す対応するサブピクチャの位置と次元を示す構文要素のインデックスは同じである。表示は、データストリームの層ごとに1つのフラグ、フラグがデータストリームに存在する層を含む層のサブピクチャ一直線化を示すフラグ、及び参照画像としてのそのフラグのレイヤの画像のいずれかを使用するものなどの1つまたは複数の上位層を含み得る。
図12はこれを示す。その中に、階層化されたデータストリームのレイヤの写真が示されている。レイヤ1の画像1211は、例示的に、サブピクチャに分割されておらず、言い換えれば、1つのサブピクチャのみに分割されていないため、(サブ)画像L1(1)が存在する。レイヤ2の画像1212は、4つのサブピクチャL2(1)からL2(4)に分割される。ここでは3から4の上位レイヤの画像は、同じ方法で分割される。画像は層間予測を使用してコード化されている、つまり、層間予測はコーディング/復号に使用できることに留意されたい。ある層の1つの画像は、下の層の別の画像から予測でき、両方の画像は、同じ時刻の場合である。ここでも、サブピクチャの境界は、相互予測で境界の彼方を引き起こす、つまり、ある層の1つの画像の1つのブロックと呼ばれる領域は、別の層の参照画像のサブピクチャの境界を超えて広がり、1つのブロックが併置され、参照画像の併置されたサブピクチャの外部からのコンテンツを使用しないことによって埋められる。さらに、サブピクチャに分割される各レイヤでは、画像は一定のサイズである必要がある場合がある、つまり、各レイヤの画像のサイズは変化しない、つまり、RPRは使用されない。レイヤL1などの単一サブピクチャレイヤの場合、さまざまなピクチャサイズとRPRの適用が許可される場合がある。次に、表示のフラグは、上記のように、レイヤ2以上のサブピクチャが一直線化していることを示し得る。つまり、上位層の画像1213、1214、層3以上は、すべて層2と同じサブピクチャ分割を有している。層3以上のサブピクチャも、層3と同じサブピクチャIDを有している。結果として2超のレイヤには、サブピクチャLX(1)からLX(4)もあり、この場合Xはレイヤの番号である。図12は、いくつかのより高い層3及び4についてこれを例示的に示しているが、1つまたは2つ以上のより高い層も存在することができ、その場合、表示もそれに関連する。したがって、表示が行われたレイヤ(ここではレイヤ2)の上の各レイヤのサブピクチャ、つまりフラグが設定されているサブピクチャは、同じインデックスを有する。レイヤ2の対応するサブピクチャとして1、2、3、または4であり、レイヤ2の対応するサブピクチャと同じサイズ及び併置された境界を有する。対応するサブピクチャは、ピクチャ内で互いに併置されているものである。この場合も、このような表示のフラグは、他の各レイヤにも存在する可能性があり、ここで、レイヤ3やレイヤ4などの上位レイヤにも同じサブピクチャの細分を設定することができる。
少なくとも2つの層の複数の画像のそれぞれが1つまたは複数のサブピクチャに分割されるとき、表示は、1つまたは複数の層のそれぞれについて、それぞれの層よりも高い1つまたは複数のより高い層の画像がサブピクチャに分割されることを示し、所定の層固有のサブピクチャの数がそれぞれの層及び1つまたは複数の上位層に対して等しくなり、所定の層固有の数のサブピクチャの境界がそれぞれの層と1つまたは複数の上位層との間で空間的に一致するようにする。
特に、これを図12の画像に当てはめると、レイヤ2以上のサブピクチャが一直線化していることが示されれば、レイヤ3以上も対応して一直線化したサブピクチャを有することが明らかになる。
1つまたは複数の上位層は、予測のためにそれぞれの層の画像を使用することができる。
また、サブピクチャのIDは、それぞれのレイヤと1つ以上の上位レイヤの間で同じである。
また、図12には、サブピクチャ抽出器1210が示されており、これは、今議論したレイヤがコード化されているビットストリームから、レイヤ2~4の1つまたは複数のサブピクチャの特定のセットに固有の抽出ビットストリームをコーディングするためのものである。完全なビットストリームから、レイヤ化された画像の関心領域に関連する部分を抽出し、ここでは、サブピクチャの例として、画像の右上隅を抽出する。したがって、抽出器1210は、タイRoIに関連するビットストリーム全体の部分、すなわち、上記の表示がサブピクチャ調整を示さない、すなわち、上記のフラグが設定されていない任意の層の画像全体に関連する部分を抽出し、及び相互に一直線化されたレイヤ内の画像のサブピクチャに関連する部分、つまり、フラグが設定されている部分と、サブピクチャがRoIをオーバーレイするいずれかの上位レイヤ、ここでは例としてL2(2)、L3(2)、及びL4(2)である。言い換えれば、出力層セットにあり、サブピクチャ層、ここでは2~4である、の参照として機能する、図12の場合のL1などの任意の単一サブピクチャ層は、抽出器1210によって抽出されたビットストリームに含まれ、抽出されたビットストリームでは、HLSの層間予測パラメータがそれに応じて調整される、つまり、抽出されたビットストリームでは、レイヤ2~4の以前のサブピクチャに分割された上位層の画像がRoI内のサブピクチャにのみトリミングされるほど小さいことを反映するために、スケーリングウィンドウの条件が調整される。サブピクチャが互いに一直線化していることを表示が示しているため、抽出は簡単である。サブピクチャ一直線化の表示を利用する別の方法は、復号をより簡単に編成するデコーダである可能性がある。
以下は、下位層(2.4)のサブピクチャの境界サブセットに関するものである。
符号化を高速化するためのレイヤ内の領域の完全並列符号化など、他のユースケースが存在する可能性があり、この場合、解像度が高く、レイヤが高次であるほどサブピクチャの数が多くなる(空間スケーラビリティ)。このような場合、一直線化も望ましい。さらなる実施形態は、上位層のサブピクチャの数が下位(参照)層のサブピクチャの数よりも多い場合、下位層のすべてのサブピクチャの境界が上位層(同じ場所に配置された境界)に対応するものを有することである。図13は、下位層と上位層の間で一直線化された境界である境界と、下位層で対応がない上位層の境界を示している。
そのプロパティを通知するための例示的な構文を図14に示す。
以下は、サブピクチャの境界の層状運動補償予測の影響(2.5)に関するものである。
サブピクチャがレイヤ内のみであるか、レイヤ間でも独立したサブピクチャであるかは、ビットストリームに示される。より具体的には、この表示は、レイヤ間で実行される運動補償予測がサブピクチャの境界も考慮に入れるかどうかを示す。一例には、図15に示されているように、RoIがコンテンツの低解像度バージョン(低次のレイヤ)で設けられ(例えば、1080pコンテンツ内の720p RoI)、高解像度コンテンツ(例えば、4k解像度の高次のレイヤ)では設けられない場合がある。
別の実施形態では、レイヤ間で実行される運動補償予測がサブピクチャの境界をまた考慮に入れるかどうかは、サブピクチャがレイヤ間で一直線化されているかどうかという事実に依存する。そうである場合、中間層予測などの運動補償を考慮して境界が考慮される。例えば、運動補償では境界の外側のサンプル位置を使用すること、またはそのようなサンプル位置のサンプル値は境界内のサンプル値から外挿されることが、許容されない。それ以外の場合、境界は層間運動補償予測では無視される。
以下は、サブピクチャ縮小参照OLS(2.6)に関するものである。
レイヤ付きのサブピクチャの使用について検討できるもう1つのユースケースは、RoIスケーラビリティである。このようなユースケースの潜在的なレイヤとサブピクチャの構成の図を図16に示す。このような場合、下位レイヤのRoI部分またはサブピクチャのみが上位レイヤに必要である、つまり、RoIにのみ関心があるときに、つまり、指定された例のベースレイヤまたは拡張レイヤで720pバージョンを復号しているときに復号されることが必要なサンプルが少なくて済むことを意味している。それでも、ビットストリームのサブセットのみ復号する必要があること、したがって、RoIに関連付けられたサブビットストリームのレベルはベースレイヤ全体及びエンハンスメントレイヤよりも低次である(復号されるサンプルが少ない)ことを、デコーダに示す必要がある。
この例では、1080+4Kの代わりに、720+4Kのみを復号する必要がある。
一実施形態では、OLSシグナリングは、1つのレイヤが完全に必要とされるのではなく、そのサブピクチャのみが必要であることを示す。各出力レイヤについて、表示がなされると(reduced_subpic_reference_flagが1に等しい)、参照に使用される関連するサブピクチャIDのリストが与えられる(num_sub_pic_ids、subPicIdToDecodeForReference)。これは、例えば図17に示されている。
別の実施形態では、OLS内の層の不要なサブピクチャがOLSビットストリームから削除される場合に必要とされるであろうPTLを示す追加のPTLシグナリングが提示される。オプションを図18に示しており、この場合、それぞれの構文がVPSに追加されている。
以下は、一定のビットレート(CBR)とサブピクチャ(3)に関するものである。
態様によれば、ビデオ処理装置は、複数の画像を含むデータストリームから復号されたビデオの複数の画像を処理するように構成され得、複数の画像、例えばすべてのレイヤの各々が、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、またビデオ処理装置は、ダミーデータを維持することによって、データストリームから一定のビットレートで少なくとも1つのサブピクチャを生成するように構成され、そのデータの例は、サブピクチャの直後のサブピクチャのためのデータストリームに含まれるか、またはデータストリームで別のサブピクチャが発生するまでサブピクチャに隣接していないがサブピクチャの表示、例えばサブピクチャ識別情報を含むデータストリームに含まれる、FD_NUT及びフィラーペイロード補足拡張情報、SEIのメッセージがある。データスチームが層状データストリームである場合、このコード化された画像は1つの層に関連する可能性があり、サブピクチャごとのビットレート制御が各層に適用され得ることに留意されたい。
別の態様によれば、ビデオエンコーダは、複数の画像を含むデータストリームにビデオの複数の画像を符号化するように構成され得、すべてのレイヤの複数の画像の各々が、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、またビデオエンコーダは、データストリームのダミーデータ、例えばFD_NUT及びフィラーペイロード補足拡張情報、SEIのメッセージを包含することによって、一定のビットレートで少なくとも1つのサブピクチャをデータストリームに生成するように構成され、各サブピクチャについて、各サブピクチャの直後であるか、サブピクチャに隣接していないがサブピクチャの表示、例えばサブピクチャ識別情報を含む。
別の態様によれば、ビデオを処理するための方法は、複数の画像を含むデータストリームから復号されたビデオの複数の画像を処理するステップを有し得、複数の画像、例えばすべてのレイヤの各々が、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、また方法は、ダミーデータを維持することによって、データストリームから一定のビットレートで少なくとも1つのサブピクチャを生成するステップを含み、そのデータの例は、サブピクチャの直後のサブピクチャのためのデータストリームに含まれるか、またはデータストリームで別のサブピクチャが発生するまでサブピクチャに隣接していないがサブピクチャの表示、例えばサブピクチャ識別情報を含むデータストリームに含まれる、FD_NUT及びフィラーペイロード補足拡張情報、SEIのメッセージがある。
別の態様によれば、ビデオを符号化するための方法は、複数の画像を含むデータストリームにビデオの複数の画像を符号化するステップを有し得、複数の画像、例えばすべてのレイヤの複数の画像の各々が、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、また方法は、データストリームのダミーデータ、例えばFD_NUT及びフィラーペイロード補足拡張情報、SEIのメッセージを包含することによって、一定のビットレートで少なくとも1つのサブピクチャをデータストリームに符号化するステップを含み、各サブピクチャについて、各サブピクチャの直後であるか、サブピクチャに隣接していないがサブピクチャの表示、例えばサブピクチャ識別情報がある。
サブピクチャを含むビットストリームが符号化され、関連するHRD構文要素が固定ビットレート(CBR)ビットストリームを定義する場合がある、例えば少なくとも1つのスケジューリング値に対してcbr_flagは1に設定され、ビットストリームが一定のビットレートビットストリームに対応し、頻繁に、いわゆるフィラーデータ、VCL NALユニットまたはフィラーペイロードSEI(非VCL NALユニット)、例えばFD_NUT及びフィラーペイロードSEIメッセージを使用することによることを示す。
ただし、サブピクチャビットストリームが抽出された場合、このプロパティが引き続き適用されるかどうかは明確ではない。
一実施形態では、サブピクチャの抽出プロセスは、常にVBRビットストリームをもたらす方法で定義される。CBRケースを示す/保証する可能性はない。その場合、FD_NUT及びフィラーペイロードSEIメッセージは、抽出プロセス中に単に破棄される。
別の実施形態では、各サブピクチャのCBR「動作点」は、サブピクチャを構成するVCL NALユニットの直後、したがってサブピクチャのCBR「動作点」の抽出中に、それぞれのFD_NUT及びフィラーペイロードSEIメッセージを配置することによって保証されることが示され、サブピクチャVCL NALユニットに関連付けられたそれぞれのFD_NUT及びフィラーペイロードSEIメッセージは、サブピクチャのサブビットストリームが抽出プロセス中に抽出されるときに保持され、抽出プロセスが別のサブピクチャを対象とする抽出プロセス中または非CBRの「動作点」にて保持される。このような表示は、例えばsli_cbr_constraint_flagを使用して実行できる。したがって、例えば、sli_cbr_constraint_flagが0に等しい場合、nal_unit_typeがFD_NUTに等しいすべてのNALユニットと、フィラーペイロードSEIメッセージを含むSEINALユニットが削除される。
説明されているプロセスでは、FD_NUTまたはフィラーペイロードSEIメッセージがドロップされたかどうかを知るために、VCL NALユニットとそれに関連する非VCLNALユニットの状態を保持する必要があり、直接先行するVCLNALユニットのサブピクチャIDが何であったかを知る必要がある。このプロセスを容易にするために、FD_NUTとFiller Payload SEIにシグナリングが追加され、それらが特定のサブピクチャIDに属していることを表示する。あるいは、別の実施形態では、次のSEIメッセージまたはNALユニットが、別のサブピクチャIDを示す別のSEIメッセージの存在まで、サブピクチャIDを有する所与のサブピクチャに属することを示すSEIメッセージがビットストリームに追加される。
言い換えれば、複数の画像のそれぞれが所定の数のサブピクチャに分割され、各サブピクチャが運動補償のための境界の拡張のための境界を含むように、中に符号化された複数の画像を有する一定のビットレートのデータストリームが処理され、処理により、一定のビットレートの少なくとも1つのサブピクチャに関連するサブピクチャのデータストリームは、少なくとも1つのサブピクチャのデータストリームに含まれるダミーデータを保持し、抽出されたデータストリームが関係しない別のサブピクチャのデータストリームに含まれるダミーデータを除去することによって、データストリームから生成される。
これは、図19及び20で見ることができ、処理されたデータストリームにコード化されたビデオの例示的な2つの画像1910及び1920が示されている。これらの画像は、それぞれサブピクチャ1911、1912、1913、及び1921、1922、及び1923に分割され、いくつかのエンコーダ1930によってビットストリーム1945の対応するアクセスユニット1940及び1950に符号化される。
サブピクチャへの細分化は、単に例示のために示されている。説明のために、アクセスユニットAUは、それぞれ、いくつかのヘッダ情報部分、HI1及びHI2も含むように示されているが、これは単に説明のためであり、画像は、いくつかの部分に断片化されたビットストリーム1945にコード化されるように示され、例えばそれぞれ、VCL NALユニット、1941、1942、1943、1951、1952、及び1953などであり、1940及び1950の画像のサブピクチャごとに1つのVCLユニットが存在するが、これは説明のみを目的として行われ、1つのサブピクチャが複数のそのような部分またはVCLNALユニットに断片化/コード化することによるものであり得る。
エンコーダは、サブピクチャを表す各データ部分の最後にダミーデータdを含めることによって、一定のビットレートのデータストリームを作成する、つまり、各サブピクチャのダミーデータ1944、1945、1946、1954、1955、及び1956になる。ダミーデータは、図19に十字を使用して示されている。それにおいて、ダミーデータ1944はサブピクチャ1911に対応し、1945はサブピクチャ1912に対応し、1946はサブピクチャ1913に対応し、1954はサブピクチャ1921に対応し、1955はサブピクチャ1922に対応し、1956はサブピクチャ1923に対応する。一部のサブピクチャでは、ダミーデータが必要ない可能性がある。
オプションで、前述のように、サブピクチャを複数のNALユニットに分散させることもできる。この場合、ダミーデータは、各NALユニットの最後、またはそのサブピクチャの最後のNALユニットの最後に挿入できる。
次に、一定のビットレートのデータストリーム1945は、サブピクチャ抽出器1960によって処理され得、サブピクチャ抽出器1960は、例として、サブピクチャ1911及び対応するサブピクチャ1921、つまり併置されているため、ビットストリーム1945でコード化された相互に対応するビデオのサブピクチャに関連する情報を抽出する。抽出されたサブピクチャのセットは複数である可能性がある。抽出の結果、抽出されたビットストリーム1955になる。抽出のために、抽出されたサブピクチャ1911/1921のNALユニット1941及び1951が抽出され、抽出されたビットストリーム1955に引き継がれ、他のサブピクチャの他のVCL NALユニットは、抽出されないものが無視またはドロップされ、抽出されたサブピクチャ(2)に対応するダミーデータdのみが抽出されたビットストリーム1955に引き継がれ、他のすべてのサブピクチャのダミーデータもドロップされる。つまり、他のVCL NALユニットの場合、ダミーデータdが削除される。必要に応じて、ヘッダ部分HI3及びHI4は、以下に詳述するように変更され得る。それらは、PPS及び/またはSPS及び/またはVPS及び/またはAPSなどのパラメータセットに関連するか、またはそれらを含み得る。
したがって、抽出されたビットストリーム1955は、ビットストリーム1945のアクセスユニット1940及び1950に対応するアクセスユニット1970及び1980を含み、一定のビットレートである。次に、抽出器1960によってかように生成されたビットストリームは、デコーダ1990によって復号されて、サブビデオ、すなわち、抽出されたサブピクチャ1911及び1921のみから構成されるサブピクチャを含むビデオを生成することができる。抽出は、当然、ビットストリーム1945のビデオの画像の複数のサブピクチャに影響を及ぼし得る。
別の代替案として、1つまたは複数のサブピクチャが1つまたは複数のNALユニットにコード化されているかどうかに関係なく、ダミーデータは、データストリームの最後にある各アクセスユニット内で順序付けられ得るが、各ダミーデータがそれぞれのアクセスユニットにコード化された対応するサブピクチャと関連する。これは、1940と1950の代わりに図20に示されて、アクセスユニット2040と2050と名付けている。
ダミーデータは、VCL NALユニットと区別できるように、特定のNALユニットタイプのNALユニットである場合があることに留意されたい。
一定のビットレートであるとしてビットストリーム1945を取得する別の方法も図20で説明され得るが、ここでは、一定のビットレートはサブピクチャごとに作成されない。むしろ、それはグローバルに作られている。図20に示すように、ダミーデータは、ここで、AUの終わりにあるすべてのサブピクチャに完全に含めることができ、図19に対応するデータストリーム部分のみを例示的に示す。その中で、アクセスユニット2040及び2050において。サブピクチャを表すデータ部分、それぞれ2044、2045、2046、2054、2055、及び2056は互いに直接続き、ダミーデータはサブピクチャの最後、それぞれのアクセスユニットの最後に追加される。
サブピクチャ選択ダミーデータ削除を実行するかどうか、つまり、サブピクチャビットストリームを抽出するときにすべてのダミーデータを削除する必要があるかどうか、または関心のあるサブピクチャのダミーデータ(複数可)、つまり抽出されるものは、図19に示すように保持する必要があるかどうか、ということを抽出器によって処理されるビットストリームで表示される。
また、データストリームがサブピクチャごとに一定のビットレートではないことが示されている場合、抽出器1960は、すべてのNALユニットのすべてのダミーデータdを削除することができ、結果として抽出されるサブピクチャビットストリームは、一定のビットレートではない。
ダミーデータの配置は、アクセスユニット内で、今説明した例に比べて変更される可能性があり、VCLユニット間またはアクセスユニットの先頭に配置される可能性があることに留意されたい。
処理装置または抽出器1960の上記及び下記のプロセスは、例えば、デコーダによっても実行できることに留意されたい。
言い換えれば、データストリームは、解釈、例えば復号及び解析によって処理することができ、データストリームのサブピクチャの少なくとも1つの抽出可能なセットが、抽出されたサブピクチャのビットストリームが一定のビットレートになるように抽出可能であることを示す。この表示は、例えば、ビデオパラメータセット、VPS、またはSEIメッセージから処理するか、それらに含めることができ、例えば、cbr_flagまたはsli_cbr_constraint_flagにすることができる。
データストリームはまた、データストリームの1つまたは複数のサブピクチャの抽出可能なセットが一定のビットレートでコード化されていないという表示を解釈して処理することができ、その表示は、例えば、ビデオパラメータセット、VPS、またはSEIメッセージにおけるものであり、そのように示される場合は、すべてのダミーデータが削除される。
前述のように、ダミーデータにはFD_NUT、特別なNALユニットが含まれる場合がある。追加的または代替的に、ダミーデータは、フィラーペイロード補足拡張情報、SEI、メッセージを含み得る。
データストリームは、解釈を使用して処理することもでき、例えば、生成が一定のビットレートの抽出されたデータストリームになるかどうか、この場合、ビデオ処理装置はダミーデータdの保持と削除を実行する、または、生成が一定のビットレートである抽出されたデータストリームに終わらないかどうか、この場合、ビデオ処理装置はすべてのダミーデータの削除を実行するということの、抽出されたデータストリームの生成のためのデータストリームからの表示を復号する。
最後に、前述のダミーデータは、例えば、FD_NUT及びフィラーペイロード補足拡張情報、SEI、メッセージを含むことができる。
以下は、サブピクチャ抽出の完了に関するもの、パラメータセットの書き換え(4)である。
別の態様によれば、ビデオ処理装置は、ビデオの複数の画像を含むデータストリームに対してサブピクチャ抽出を実行するように構成され得、この場合、すべてのレイヤの複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、データストリームでサブピクチャ抽出を実行するときにデータストリームのパラメータセット及び/またはピクチャヘッダを書き換えることが許可されるというデータストリーム内の表示を解釈する。
前の態様を参照するときの別の態様によれば、ビデオ処理装置は、HRD関連情報、画像サイズ、及び/または複数の画像の細分化に関する情報をサブピクチャに書き換えるための追加情報を提供するデータストリームの表示を解釈するようにさらに構成され得る。
さらに別の態様によれば、ビデオエンコーダは、ビデオの複数の画像をデータストリームに符号化するように構成され得、データストリームは、複数の画像を含み、この場合、すべてのレイヤの複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、データストリームでサブピクチャ抽出を実行するときにデータストリームのパラメータセット及び/またはピクチャヘッダを書き換えることが、データストリームにおいてサブピクチャ抽出を実行するときに許可される、という表示する。
前の態様を参照するときの別の態様によれば、ビデオエンコーダは、HRD関連情報、画像サイズ、及び/または複数の画像の細分化に関する情報をサブピクチャに書き換えるための追加情報を提供するデータストリームの表示を解釈するようにさらに構成され得る。
別の態様によれば、ビデオを処理するための方法は、ビデオの複数の画像を含むデータストリームに対してサブピクチャ抽出を実行するように構成され得、この場合、すべてのレイヤの複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、データストリームでサブピクチャ抽出を実行するときにデータストリームのパラメータセット及び/またはピクチャヘッダを書き換えることが許可されるというデータストリーム内の表示を解釈する。
前の態様を参照するときの別の態様によれば、ビデオを処理するための方法は、HRD関連情報、画像サイズ、及び/または複数の画像の細分化に関する情報をサブピクチャに書き換えるための追加情報をデータストリームに表示するようにさらに構成され得る。
別の態様によれば、ビデオを処理するための方法は、ビデオの複数の画像を含むデータストリームにてサブピクチャ抽出実行するステップであって、この場合、すべてのレイヤの複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含む、実行するステップ、及びデータストリームでサブピクチャ抽出を実行するときにデータストリームのパラメータセット及び/またはピクチャヘッダを書き換えることが、データストリームにおいて許可される、という表示を解釈するステップを有し得る。
前の態様を参照するときの別の態様によれば、ビデオを処理するための方法は、HRD関連情報、画像サイズ、及び/または複数の画像の細分化に関する情報をサブピクチャに書き換えるための追加情報を提供するデータストリームの表示を解釈するステップをさらに有し得る。
別の態様は、データストリームについて言及し得、それに対しビデオが符号化され、ビデオは複数の画像を含み、この場合、すべてのレイヤの複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、データストリームでサブピクチャ抽出を実行するときにデータストリームのパラメータセット及び/またはピクチャヘッダを書き換えることが許可される、という表示する。
通常、ビットストリーム抽出プロセスは、(サブ)レイヤに対して次のように指定されている。
- 対象の(サブ)レイヤに対応しないNALユニットをドロップする
- SEIメッセージをドロップする(Picture Timing SEI、Buffering Period SEIなど)
- オプションで、対象の(サブ)レイヤに関連付けられたネストされたSEIメッセージから適切なSEIメッセージを取得する
- 対象の(サブ)レイヤに対応しないNALユニットをドロップする
- SEIメッセージをドロップする(Picture Timing SEI、Buffering Period SEIなど)
- オプションで、対象の(サブ)レイヤに関連付けられたネストされたSEIメッセージから適切なSEIメッセージを取得する
ただし、上で説明したように、NALユニットを(サブ)レイヤごとよりも細かい粒度でドロップする、例えばサブピクチャ抽出では、これまでに解決されていない問題が発生する可能性がある。例は、上記のCBRのFD_NUTの説明を参照されたい。別の問題はパラメータセットから発生する。(サブ)レイヤ抽出では、パラメータセットには、抽出された(サブ)レイヤに関係のない追加情報が含まれる可能性があり、例えば、ドロップされた(サブ)レイヤに関する情報が含まれるが、抽出されたサブビットストリームの(サブ)レイヤを依然記述しているという意味で正しいということがある。ドロップされた(サブ)レイヤのその追加情報は、まさに無視し得る。サブピクチャ抽出に関しては、この設計原理は複雑すぎて維持できず、そのため、例えばHEVCでは、MCTSをネストするSEIメッセージに置換パラメータセットが含まれる。ただし、VVCでは、状況をさらに複雑にし、SEIメッセージをネストするHEVCスタイルのソリューションを実行不可能にする画像ヘッダが定義されている。
したがって、サブピクチャ抽出を実行するときにパラメータセットが変更される。パラメータセットには、サブピクチャ抽出を実行するときに変更する必要がある、画像サイズ、profile_level情報、タイリング/スライスグリッド(画像ヘッダにも存在する可能性がある)などの情報が含まれていることに留意されたい。
一実施形態では、抽出プロセスは次のように定義される。
- 対象のサブピクチャに対応しないNALユニットをドロップする
- SEIメッセージをドロップする(Picture Timing SEI、Buffering Period SEIなど)
- 対象の(サブ)レイヤに関連付けられたネストされたSEIメッセージから適切なSEIメッセージを取得する
- パラメータセットをドロップする
- 適切なパラメータセットを追加する
- 画像ヘッダをドロップする
- 適切な画像ヘッダを追加する
- 対象のサブピクチャに対応しないNALユニットをドロップする
- SEIメッセージをドロップする(Picture Timing SEI、Buffering Period SEIなど)
- 対象の(サブ)レイヤに関連付けられたネストされたSEIメッセージから適切なSEIメッセージを取得する
- パラメータセットをドロップする
- 適切なパラメータセットを追加する
- 画像ヘッダをドロップする
- 適切な画像ヘッダを追加する
「適切な」パラメータセットと画像ヘッダを生成する必要がある。抽出前のパラメータセットと画像ヘッダを書き直すことによるのが最も見込みがある。
変更が必要な情報は次のとおりである。
- レベルとHRD関連
- 画像のサイズ
- タイリング/スライス/サブピクチャグリッド
変更が必要な情報は次のとおりである。
- レベルとHRD関連
- 画像のサイズ
- タイリング/スライス/サブピクチャグリッド
結果として得られるレベル及びHRD関連の情報は、それぞれのSEIメッセージ(サブピクチャレベル情報SEIメッセージ)から抽出して、パラメータセットの書き換えに使用できる。
各サブピクチャのサイズはSPSで簡単に見つけられるため、プロセスで抽出された単一のサブピクチャがある場合、結果の画像サイズを簡単に導き出すことができる。ただし、ビットストリームから複数のサブピクチャが抽出される場合、例えば、結果のビットストリームには複数のサブピクチャが含まれ、結果の画像サイズは、外的手段によって定義された配置によって異なる。
一実施形態では、ビットストリームは、元のビットストリーム内の長方形の領域に対応するサブピクチャの抽出のみが許可され、元のビットストリーム内のそれらの相対的な配置が変更されないように保たれることを制約した。したがって、抽出された領域内での並べ替えやギャップは許可されない。
サブピクチャの座標は現在、図21に示すように、top_leftの座標と幅及び高さを表すパラメータによって定義されている。これにより、左上、右上、左下、右下のコーナーまたは領域を簡単に導出できる。したがって、抽出プロセスは、抽出されたすべてのサブピクチャに対して実行され、さらに小さい座標が見つかった場合(最小値の検索など)、top_left座標の最小の「x」及び「y」の座標を更新し、さらに小さい座標が見つかった場合(最大値の検索など)、右下の座標の最大の「x」及び「y」の座標を更新する。例えば、以下が挙げられる。
MinTopLeftX=PicWidth
MinTopLeftY= PicHeight
MaxBottomRightX=0
MaxBottomRightY=0
For i=0..NumExtSubPicMinus1
If(subpic_ctu_top_left_x[ i ]<MinTopLeftX)
MinTopLeftX= subpic_ctu_top_left_x[ i ]
If(subpic_ctu_top_left_y[ i ]<MinTopLeftY)
MinTopLeftY= subpic_ctu_top_left_y[ i ]
If(subpic_ctu_top_left_x[ i ]+ subpic_width_minus1[i]>MaxBottomRightX)
MaxBottomRightX= subpic_ctu_top_left_x[ i ]+ subpic_width_minus1[i]
If(subpic_ctu_top_left_y[ i ]+ subpic_height_minus1[i]> MaxBottomRightY)
MaxBottomRightY= subpic_ctu_top_left_y[ i ]+ subpic_height_minus1[i]
MinTopLeftY= PicHeight
MaxBottomRightX=0
MaxBottomRightY=0
For i=0..NumExtSubPicMinus1
If(subpic_ctu_top_left_x[ i ]<MinTopLeftX)
MinTopLeftX= subpic_ctu_top_left_x[ i ]
If(subpic_ctu_top_left_y[ i ]<MinTopLeftY)
MinTopLeftY= subpic_ctu_top_left_y[ i ]
If(subpic_ctu_top_left_x[ i ]+ subpic_width_minus1[i]>MaxBottomRightX)
MaxBottomRightX= subpic_ctu_top_left_x[ i ]+ subpic_width_minus1[i]
If(subpic_ctu_top_left_y[ i ]+ subpic_height_minus1[i]> MaxBottomRightY)
MaxBottomRightY= subpic_ctu_top_left_y[ i ]+ subpic_height_minus1[i]
次に、この値を使用して、MinTopLeftXまたはMinTopLeftYのそれぞれの値を差し引くことにより、最大画像サイズと、各抽出されたサブピクチャのsubpic_ctu_top_left_x [i]、subpic_ctu_top_left_y[i]の新しい値を導出できる。
代替の実施形態では、議論された値を必要とせずに、または導出することなく、パラメータセット及び画像ヘッダを書き換えることを可能にするシグナリングが提供される。抽出されるサブピクチャの潜在的な組み合わせごとに、パラメータセットで書き換える必要のある画像サイズを提供できる。これは、例えばSEIメッセージの形式で実行できる。SEIメッセージには、再書き込みに役立つ情報が内部にあることを示すparameter_type構文要素を含めることができる。例えば、タイプ0は、画像サイズ、抽出されたビットストリームのタイプ1レベル、画像ヘッダ内のタイプ2情報、それらの組み合わせなどである。
言い換えると、複数のレイヤに符号化されたビデオの複数の画像を有するデータストリームに対してサブピクチャ抽出を実行し、この場合、すべてのレイヤの複数の画像のそれぞれが所定の数のサブピクチャに分割され、各サブピクチャは運動補償のための境界拡張のための境界を含む。サブピクチャ抽出は、1つまたは複数のサブピクチャに対応しないデータストリームのNALユニットをドロップすること、及びパラメータセット及び/またはピクチャヘッダを書き換えることによって、関心のある1つまたは複数のサブピクチャに関連する抽出されたデータストリームへデータストリームに対して実行される。
これを図19に関してもう一度説明していく。サブピクチャ1912、1913、1922、1923は、対象のサブピクチャ(複数可)に属していないため、サブピクチャ抽出1960では必要なく、対応するNALユニット1942、1943、1952、1953は、抽出によって完全にドロップすることができる。今回、図19のダミーデータの存在は任意であると理解されるべきであり、または存在する場合、図20で説明されているように、同じことがサブピクチャによって非特異的である可能性がある。
しかしながら、図19に関して今説明した例では、抽出器1960は、ヘッダ情報HI1及びHI2をそれぞれHI3及びHI4に書き換えることができる。サブピクチャを抽出するときに同時に行うことができるこのプロセスにおいて、ヘッダ情報は、例えば、ビデオパラメータセット、VPS、及び/またはシーケンスパラメータセット、SPS、及び/または画像パラメータセット、PPSなどであり得、その特定の変数値を書き換えることによって変更できる。
書き換えのための情報は、データストリームから導出され得、データストリームに存在することができ、実際のヘッダ情報HI1及びHI2に加えて、追加情報は、HRD関連情報、画像サイズ、及び/またはサブピクチャへの細分割に関連し得る。書き換えが許可されていること、または追加が存在することの表示、及び/または追加情報は、データストリームで示すことができ、例えば、補足の拡張情報、SEI、メッセージを伴う。
サブピクチャ抽出は、抽出されたデータストリームが抽出されたサブピクチャのセットからなるように実行でき、そのそれぞれがデータストリーム内の長方形の領域に対応するという点で長方形であるようさらに構成される。
書き換え可能な値には、輝度サンプルのサブピクチャ幅、輝度サンプルのサブピクチャ高さ、レベル情報、HRD関連パラメータ、及びピクチャサイズがある。
以下は、sub_pic_id(5)のエミュレーション防止の廃止に関するものである。
サブピクチャIDは、現在VVCのスライスヘッダに通知される。これは、例えば図22に示されている。
ただし、それらはスライスヘッダの第1の構文要素の1つとして記述されているため、その値に簡単にアクセスできる。抽出プロセス(またはIDを変更/チェックする必要があるマージプロセス)では、サブピクチャIDの値を読み書きする必要があるため、簡単にアクセスできることが望ましいことに留意されたい。その値に簡単にアクセスするためにまだ欠けている1つの側面は、エミュレーションの防止である。構文要素slice_pic_order_cnt_lsbは最大16ビットの長さであり、値0、例えば0x0000をとることができる。slice_sub_pic_idの長さは16ビットである。したがって、slice_pic_order_cnt_lsb値とslice_sub_pic_id値の組み合わせによっては、エミュレーション防止が行われる可能性があり、これにより、上位レイヤの適用によるサブピクチャIDの解析がより複雑になり、上位レイヤの適用の変更または変更がさらに困難になる、なぜならslice_headerにエミュレートされた防止の長さは、slice_sub_pic_idの値がslice_sub_pic_id*の別の値に変更された場合に変更される可能性がある。
一実施形態では、slice_pic_order_cnt_lsbがslice_pic_order_cnt_lsb_plus1に変更され、slice_sub_pic_idがslice_sub_pic_id_plus1に変更されるため、slice_pic_order_cnt_lsbとslice_sub_pic_idの間でエミュレーション防止が発生することはない。これはslice_sub_pic_idの解析には役立つが、slice_sub_pic_idの値を変更する必要があるユースケースの解決策にはならない。slice_sub_pic_id_plus1は、slice_sub_pic_id_plus1を含むスライスヘッダの最後のバイトにあるslice_sub_pic_id_plus1の最下位ビットがゼロでないことを保証しないことに留意されたい。したがって、そのバイトで0x00が発生し、次の2バイトの構文要素の値に応じてエミュレーション防止がトリガーされる可能性がある。
別の実施形態では、1つの1ビット構文要素が、図23の例のように、slic_sub_pic_id_plus1の後に続き、これは、説明された問題を解決するであろう。
明らかに、提供されるソリューションにはオーバーヘッドが伴う。例えば、追加の1ビットとx_plus1構文要素である。さらに、説明されている問題は次の場合にのみ発生する。
・ slice_pic_order_cnt_lsbとslice_sub_pic_idの間で発生するエミュレーション防止の場合:両方の構文要素を合わせた長さが24ビットより大きい場合。
・ slice_sub_pic_id_plus1及び次の構文要素で発生するエミュレーション防止の場合:slice_sub_pic_id_plus1が複数のバイトにわたる場合。
・ slice_sub_pic_id_plus1及び次の構文要素で発生するエミュレーション防止の場合:slice_sub_pic_id_plus1が複数のバイトにわたる場合。
説明されている問題はあまり頻繁に発生しない可能性があるため、説明されている変更は、画像ヘッダのいずれかのパラメータセットのいくつかのゲーティングフラグに条件付けられる可能性がある。これは、例えば図24に示されている。ここで、Val(subpiuc idへのオフセット)は、slice_pic_order_cnt_lsb_plus1とslice_subpic_id_plusValのコード化された長さの組み合わせから次のように決定される。
Val = codedLength(slice_pic_order_cnt_lsb_plus1 + slice_subpic_id_plusVal) < 31 ? 1 : 4.
これは、slice_pic_order_cnt_lsb_plus1とslice_subpic_id_plusValのコード化された長さが一緒にしても31ビットより短い場合、Valが「1」の値に設定され、それ以外の場合は「4」の値に設定されると読み取れる。
以下は、CABACゼロワードに関するものである(6)。
cabac_zero_wordは、各スライスの最後に挿入できる。それらは、画像のどのスライスにも配置できる。現在のビデオの仕様では、ビンとビットの比率が高すぎる場合にcabac_zero_wordsが挿入されることを保証する、画像レベルの制約について説明している。
サブピクチャが抽出され、これらが特定のプロファイルとレベルに準拠していることが示されている場合、AUに適用される次の条件が各サブピクチャにも個別に適用されることが要件である必要がある。
変数RawMinCuBitsを次のように導出する。
RawMinCuBits =
MinCbSizeY*MinCbSizeY* (BitDepth + 2 * BitDepth/( SubWidthC * SubHeightC ))
RawMinCuBits =
MinCbSizeY*MinCbSizeY* (BitDepth + 2 * BitDepth/( SubWidthC * SubHeightC ))
BinCountsInNalUnitsの値は、(32÷3)* NumBytesInVclNalUnits +(RawMinCuBits * PicSizeInMinCbsY)÷32以下である必要がある。
したがって、ビットストリーム制約または表示は、各サブピクチャが個別に上記の条件を満たすことを示す。
第1の実施形態として、フラグは、サブピクチャが言及された制約を満たすことを示す制約フラグとしてシグナリングすることができる。これは、例えば図25に示されている。
別の実施形態では、そのような制約の履行は、以下の条件の一方または両方に基づく。
1) サブピクチャのsubpic_treatment_as_pic_flagが1に等しい
2) ビットストリームには、サブピクチャのレベル適合性表示が含まれ、例えば SEIメッセージ(既存のsubpic_level_info SEIメッセージ)による。
1) サブピクチャのsubpic_treatment_as_pic_flagが1に等しい
2) ビットストリームには、サブピクチャのレベル適合性表示が含まれ、例えば SEIメッセージ(既存のsubpic_level_info SEIメッセージ)による。
言い換えると、ビデオの複数の画像をデータストリームに符号化することにおいて、複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、コンテキスト適応型バイナリ算術コーディングを使用して符号化され得る。
この場合、データストリームは、サブピクチャのいずれかが所定のビンとビットの比率を超えることを回避するように、ゼロワードの各サブピクチャの1つまたは複数のスライスまたは VCL NALユニットの終わりに少なくとも1つのサブピクチャを提供する。
図26に見られるように、エンコーダは、以下の方法でビットストリーム2605を生成することができる。2つのアクセスユニット2620または2630の部分が例示的に示されている。それらのそれぞれは、図19の画像について例示的に示されるように、サブピクチャに細分されるようにその中に符号化された画像を有する。しかしながら、図26は、各画像の正確に1つのサブピクチャに関連するビットストリームのそれらの部分に集中している。AU2621の場合、符号化は、例示的に、そのAU2610の画像のサブピクチャがコード化された1つのスライス2621のみをもたらし、AU260の場合、3つのスライス、すなわち、2631、2632、及び2633が生じ、そのAU2630のサブピクチャがコーディングされている。
エンコーダは、CABACなどのバイナリ算術コーディングを使用する。つまり、構文要素を使用して、ビデオまたは画像のコンテンツを説明するために生成された構文要素を符号化する。まだバイナリ値が設定されていないものは、ビン文字列に2値化される。したがって、画像は構文要素に符号化され、順次一連のビンに符号化され、順次データストリームに算術的にコード化され、ビットストリームの各部分に至り、その各々は、サブピクチャなど、そこに符号化されたビデオの特定の部分を有する。この部分は特定のビット数を消費し、順次ビンの場合に特定の数を算術的にコード化することによって生成され、ビンとビットの比率が得られる。デコーダは逆のことを行い、1つのサブピクチャに関連付けられた部分が算術的に復号されてビンのシーケンスが生成され、次に2値化されて構文要素が生成され、そこから順次デコーダがサブピクチャを再構築できる。そのため、「bin-to-bitratio」の「bin」は、コード化される2値化されたシンボルのビット数または桁数を表し、「bit」は、CABACビットストリームの書き込み/読み取りビット数を表す。
所定のビン対ビット比を超えることを回避するために、エンコーダは、各サブピクチャについて、それぞれのサブピクチャがコード化された1つまたは複数のスライスのCABACコード化部分のビンとビットの比率をチェックし、比率が高すぎる場合、それぞれのサブピクチャがコード化されている1つまたは複数のスライスの1つまたは複数の終わりにCABACコード化されるゼロワードをできるだけ多くCABACエンコーディングエンジンに供給し、レーションがもはや超えられないようにする。これらのcabacゼロワードは、図26ではゼロ、つまり「0」で示されている。それらは、サブピクチャ2621の終わり、すなわち最後のスライスの終わりに追加されるか、またはサブピクチャのスライス2631、2632、及び2633の1つまたは複数の端に分散される方法で追加され得る。つまり、図26は図26の分散的なバリアントを示しているが、代わりにゼロワードを最後のスライス2613の最後に完全に追加することもできる。
データストリーム2605は、デコーダ2640に到達すると、デコーダがデータストリーム、または少なくとも上記のサブピクチャに関連するその部分を復号し、AU2620及び2630内の対応するデータ部分を解析する。そうすることで、デコーダ2640は、ビンとビットの比率を超えないために必要なゼロワードの数を決定することによって、特定のサブピクチャの1つまたは複数のスライスの終わりにコード化されたゼロワードの量または数を決定でき、cabacゼロワードを破棄することができる。しかしながら、デコーダ2640が、他の手段によってゼロワードを他の構文要素から区別し、その後ゼロワードを破棄することができるような方法でスライスを解析することができることも可能であろう。すなわち、デコーダは、特定の所定の範囲に比率を得るのに必要な数のゼロワードをCABAC復号し続けるために、特定のサブピクチャの1つまたは複数のスライスのビンとビットの比率をチェックする場合もしない場合もある。そうでない場合、デコーダは、構文的に他の構文要素から、CABAC復号されたゼロワードを区別することができる。
比率条件が満たされない場合、デコーダ2640は特定のエラーモードに陥り、所定のエラーの処理がデコーダによってトリガーされ得る。
最後に、サブピクチャの数は任意の数であり得ることに留意されたい。言い換えれば、少なくとも1つは、特に2つ以上のサブピクチャを意味することができる。
独立性のプロパティ、例えばsubpic_treatment_as_pic_flagについて、及び対応するレベルの適合性の表示、例えば、補足拡張情報、SEI、メッセージについて、各サブピクチャを評価することが出来る。そのとき、評価に応じて、評価に従ってのみ、サブピクチャにゼロワードを提供することができる。
少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの終わりにゼロワードでデータストリームを提供することができ、コンテキスト適応算術コーディングを使用するデータストリームへのそれぞれのサブピクチャに対するコード化されたビンの数は、所定の係数と、それぞれのサブピクチャに関連付けられたデータストリームの1つまたは複数のVCL NALユニットのバイト長との間の積を使用して決定される数以下である。
少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの終わりにゼロワードでデータストリームを提供することもでき、コンテキスト適応算術コーディングを使用するデータストリームへのそれぞれのサブピクチャに対するコード化されたビンの数は、第1の所定の係数と、それぞれのサブピクチャに関連付けられたデータストリームの1つまたは複数のVCL NALユニットのバイト長との間の第1の積、及び第2の所定の係数と、コーディングブロックごとの最小ビット数とそれぞれのサブピクチャを構成するコーディングブロックの数の間の第2の積の合計を使用して決定される数以下である。
いくつかの態様が装置の観点で説明されているが、これらの態様が対応する方法の説明も表すことが明らかであり、ブロックまたはデバイスは方法ステップ、または方法ステップの特徴に対応する。同様に、方法ステップの観点で説明された態様もまた、対応するブロックもしくは項目、または対応する装置の特徴の説明を表す。いくつかの、またはすべての方法ステップは、例えば、マイクロプロセッサ、プログラマブルコンピュータまたは電子回路などのハードウェア装置によって(またはそれを使用して)実行され得る。いくつかの実施形態では、ほとんどの重要な方法ステップのうちの1つ以上は、そのような装置によって実行されてもよい。
発明のデータストリームは、デジタル記憶媒体に記憶されてもよく、またはインターネットなどの無線伝送媒体または有線伝送媒体などの伝送媒体上で伝送されてもよい。
特定の実装要件に応じて、発明の実施形態は、ハードウェアまたはソフトウェアにおいて実装されてもよい。実装態様は、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または、協働することが可能な)、そこに記憶された電子可読制御信号を有する、デジタル記憶媒体、例えば、フロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して実行されてもよい。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。
本発明による、いくつかの実施形態は、電子的に可読な制御信号を有するデータキャリアを含み、これらの制御信号がプログラム可能なコンピュータシステムと協働することができることで、本明細書に記載の方法のうちの1つが実行される。
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装され得、このプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行するときに方法のうちの1つを実行するように動作可能である。プログラムコードは、例えば、機械可読キャリアに格納され得る。
他の実施形態は、本明細書に記載の方法のうちの1つを実行し、機械可読キャリアに格納されるコンピュータプログラムを含む。
換言すれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行するときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、発明の方法の更なる実施形態は、そこに記録された、本明細書で説明される方法の1つを実行するためのコンピュータプログラムを含むデータキャリア(または、デジタル記憶媒体またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は典型的には、有形であり、及び/または非一時的である。
したがって、発明の方法の更なる実施形態は、本明細書で説明される方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは信号シーケンスは、例えば、インターネットを介してなど、データ通信接続を介して転送されるように構成され得る。
さらなる実施形態は、例えば、本明細書に記載の方法のうちの1つを実行するように構成される、または適合されるコンピュータ、またはプログラマブルロジックデバイスなどの処理手段を含む。
さらなる実施形態は、コンピュータを含み、その上には、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムがインストールされている。
本発明による、さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信器に転送する(例えば、電子的に、または光学的に)ように構成される、装置またはシステムを含む。受信器は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってよい。装置またはシステムは、例えば、コンピュータプログラムを受信器に転送するためのファイルサーバを含み得る。
いくつかの実施形態では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)は、本明細書に記載の方法の機能の一部またはすべてを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法のうちの1つを実行するためにマイクロプロセッサと協働し得る。概して、方法は、いずれかのハードウェア装置によって好ましくは実行される。
本明細書で説明される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実装されてもよい。
本明細書で説明される装置、または本明細書で説明される装置のいずれかの構成要素は、ハードウェア及び/またはソフトウェアにおいて少なくとも部分的に実装されてもよい。
本明細書で説明される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置及びコンピュータの組み合わせを使用して実行されてもよい。
本明細書で説明される方法、または本明細書で説明される装置のいずれかの構成要素は、ハードウェア及び/またはソフトウェアにおいて少なくとも部分的に実装されてもよい。
上述の実施形態は、本発明の原理の例示に過ぎない。構成及び詳細の修正や変更が、当業者に明らかであろうことが理解される。したがって、本明細書の実施形態の記述及び説明として提示された具体的な詳細によってではなく、差し迫る特許請求の範囲によってのみ限定されることが意図される。
Claims (169)
- ビデオデコーダであって、
データストリームをビデオの複数の画像に復号し、
この場合、前記データストリームは、少なくとも2つの層に複数の画像を含み、
この場合、少なくとも1つのレイヤの前記画像(1212)は、所定のレイヤ固有の数のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、前記サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む、
対応するサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、または異なるレイヤの対応する画像の前記境界の少なくとも1つが、互いに一直線化しているという表示を解釈するように構成される、前記ビデオデコーダ。 - 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれが、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割され、
前記異なるレイヤの対応するサブピクチャのすべての前記境界が互いに一直線化する程度まで前記表示を解釈するように構成されている、請求項1に記載のビデオデコーダ。 - この場合、各レイヤの前記画像(1212、1213、1214)は、同じ解像度を有し、及び/または
この場合、前記解像度はレイヤ間で異なり、及び/または
この場合、各レイヤ内の前記解像度は、連続する画像間で変化する可能性がある、請求項1または2に記載のビデオデコーダ。 - この場合、1つのレイヤの前記画像(1211)はサブピクチャに分割されず、前記サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))は、他のレイヤの1つの前記画像(1212、1213、1214)の1つが、分割されていない前記画像(1211)の1つに対応するように分割されるものに分割されない、請求項1から3のいずれか一項に記載のビデオデコーダ。
- 1つのレイヤの1つの画像(1212)のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))の前記外側の境界が別のレイヤで1つの対応する画像(1211)の前記境界と一直線化しているという表示を解釈するようにさらに構成されている、請求項4に記載のビデオデコーダ。
- 下位レイヤには対応する上位レイヤの境界のサブセットがあるという表示を解釈するようにさらに構成されている、請求項5に記載のビデオデコーダ。
- 例えば、あるレイヤの前記サブピクチャのそれぞれが別のレイヤの前記サブピクチャの1つに対応するというsubpictures_in_ols_coherent_flagの表示を解釈し、この場合前記表示が所定のセクションにあり、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項1から6のいずれか一項に記載のビデオデコーダ。
- 前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されているという表示を解釈し、この場合前記表示は、ビデオパラメータセット、VPS、またはシーケンスパラメータセット、SPS内にあるようにさらに構成されている、請求項1から7のいずれか一項に記載のビデオデコーダ。
- 例えば、前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていることの表示subpictures_in_ols_aligned_flagを解釈し、この場合、前記表示は前記VPSの所定のセクションにあり、例えば、general_constraint_info()またはprofile_tier_level()であるようにさらに構成されている、請求項8に記載のビデオデコーダ。
- この場合、各サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))にはサブピクチャ識別情報が割り当てられ、前記デコーダはさらに、前記サブピクチャ識別情報がすべてのレイヤに対して一意であるという表示を解釈するように構成される、請求項1から9のいずれか一項に記載のビデオデコーダ。
- 例えば、前記サブピクチャ識別情報は、所定のセクション内のすべてのレイヤに対して一意であるというunique_subpictures_ids_in_ols_flagの表示を解釈し、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項10に記載のビデオデコーダ。
- 互いに対応する異なるレイヤの前記サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))が同じサブピクチャ識別情報を有しているという表示を解釈するようさらに構成された、請求項1から9のいずれか一項に記載のビデオデコーダ。
- 例えば、互いに対応する異なるレイヤの前記サブピクチャが、所定のセクションで同じサブピクチャ識別情報を有するというaligned_subpictures_ids_in_ols_flagの表示を解釈し、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項12に記載のビデオデコーダ。
- 相対的なサブピクチャの位置とサブピクチャの寸法が、すべてのレイヤの前記対応するサブピクチャで同じであるという表示を解釈する、例えば前記データストリーム内のシグナリング順序を表す対応するサブピクチャの位置と次元を示す構文要素のインデックスが等しいようにさらに構成された、請求項1から13のいずれか一項に記載のビデオデコーダ。
- 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれが、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割され、
この場合、前記表示は、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしているかどうかを示すフラグを含む、請求項14に記載のビデオデコーダ。 - 前記1つまたは複数の上位レイヤは、予測のために前記それぞれのレイヤの画像を使用する、請求項15に記載のビデオデコーダ。
- この場合、前記フラグは、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしていると表示しているとき、前記サブピクチャのID(L2(1)、L2(2)、L2(3)、L2(4))が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で同じであることを示す、請求項14、15、16に記載のビデオデコーダ。
- 前記表示は、シーケンスパラメータセットSPSに含まれている、請求項14から17のいずれか一項に記載のビデオデコーダ。
- 特定のレイヤの前記サブピクチャまたは画像の1つの前記境界の少なくとも1つは、前記特定のレイヤ及び少なくとも1つの他のレイヤが、同じ所定のレイヤ固有の番号のサブピクチャを使用してサブピクチャに分割されていること、及び前記結果のサブピクチャの前記境界が一直線化していることを決定することにより、運動補償のための境界拡張に使用されることを決定するか、または
特定のレイヤの前記サブピクチャまたはピクチャの1つの前記境界の少なくとも1つが、前記サブピクチャの1つについて、前記サブピクチャが境界拡張プロパティに関して同じレイヤ内または1つ以上のレイヤにまたがる隣接するサブピクチャから独立しているという表示を解釈することにより、運動補償の境界拡張に使用されないことを決定するようにさらに構成される、請求項1から18のいずれか一項に記載のビデオデコーダ。 - 前記サブピクチャの境界が、レイヤ間で実行される運動補償のサンプル外挿に使用されるかどうかの表示を解釈するようにさらに構成された、請求項1から19のいずれか一項に記載のビデオデコーダ。
- 一直線化されたサブピクチャの前記サブピクチャの境界が、レイヤ間で実行される層間運動予測に使用されるかどうかの表示を解釈するようにさらに構成された、請求項1から20のいずれか一項に記載のビデオデコーダ。
- 例えば、前記少なくとも1つの他のレイヤのどのサブピクチャが復号に必要であるかに関して、前記他のレイヤの少なくとも1つについて、所定のレイヤで前記ビデオの所定の空間セクションを復号するためのreduced_subpic_reference_flagフラグの表示を解釈するようにさらに構成される、請求項1から21のいずれか一項に記載のビデオデコーダ。
- 各レイヤについて、前記サブピクチャが前記ビデオの前記空間的選択に必要であるという表示を解釈し、これは好ましくは前記対応するサブピクチャ識別情報を示し、この場合、前記表示は特に好ましくは補足の強調情報、SEI、メッセージ、またはビデオパラメータセット、VPS、例えばnum_sub_pic_ids及びsubPicIdToDecodeForReferenceである、または
スケーリング係数及び/またはオフセットに従って、前記ビデオの前記空間的選択に必要なサブピクチャを導出するようにさらに構成される、請求項22に記載のビデオデコーダ。 - 補足拡張情報SEI、メッセージ、またはビデオパラメータセットVPSで、前記必要なサブピクチャのみを含むデータストリームの前記必要なプロファイル/レイヤ/レベル、PTLの表示、例えばsubpic_add_ptl_present_flag[i]を解釈するようにさらに構成される、請求項22または23に記載のビデオデコーダ。
- ビデオ処理装置(1960)であって、
複数の画像(1910、1920)のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割される方法で、中に符号化された前記複数の画像(1910、1920)を有する一定のビットレートのデータストリーム(1945)を処理し、各サブピクチャは、運動補償のための境界拡張の境界を含むように構成され、
この場合、前記ビデオ処理装置(1960)は、前記少なくとも1つのサブピクチャの前記データストリームに含まれるダミーデータ(d)を保持すること、及び前記抽出されたデータストリームが関係しない別のサブピクチャの前記データストリームに含まれるダミーデータ(d)を削除することによって、一定のビットレートで少なくとも1つのサブピクチャ(1911、1921)に関連するサブピクチャデータストリーム(1955)を、前記データストリーム(1945)から生成するように構成される、前記ビデオ処理装置(1960)。 - 前記データストリームの前記サブピクチャの少なくとも1つが、ビデオパラメータセット、VPS、またはSEIメッセージ、例えばcbr_flagの一定のビットレートであるという表示を解釈(データストリームから復号及び解析)するようにさらに構成された、請求項25に記載のビデオ処理装置。
- 前記データストリームのサブピクチャがビデオパラメータセット、VPS、またはSEIメッセージで一定のビットレートではないという表示を解釈し、すべてのダミーデータ、例えばFD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを削除するようにさらに構成された、請求項25または26に記載のビデオ処理装置。
- 前記生成が一定のビットレートの前記抽出されたデータストリームになるかどうか、この場合、前記ビデオ処理装置は前記ダミーデータ(d)の前記保持と削除を実行する、または、前記生成が一定のビットレートである前記抽出されたデータストリーム(1955)に終わらないかどうか、この場合、ビデオ処理装置はすべてのダミーデータ(d)の削除を実行するということの、前記抽出されたデータストリーム(1955)の前記生成のための前記データストリームからの表示を復号するようにさらに構成される、請求項25または26に記載のビデオ処理装置。
- ダミーデータが、例えば、FD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを含む、請求項25または26に記載のビデオ処理装置。
- 複数のレイヤに符号化されたビデオの複数の画像(1910、1920)を有するデータストリーム(1945)に対してサブピクチャ抽出を実行し、すべてのレイヤの前記複数の画像のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割され、各サブピクチャは運動補償のための境界拡張のための境界を含むよう構成され、
この場合、前記ビデオ処理装置(1960)は、前記1つまたは複数のサブピクチャ(1911、1921)に対応しない前記データストリームのNALユニット(1942、1943、1952、1953;2045、2046、2055、2056)をドロップすること、及びパラメータセット及び/またはピクチャヘッダ(HI1、HI2)を書き換えることによって、関心のある1つまたは複数のサブピクチャ(1911、1921)に関連する抽出されたデータストリーム(1955)へ前記データストリームに対して前記サブピクチャ抽出を実行するように構成される、ビデオ処理装置(1960)。 - 前記データストリームから書き換えるための追加情報、HRD関連情報に関連する前記追加情報、画像サイズ、及び/またはサブピクチャへの細分化を導き出すようさらに構成された、請求項30に記載のビデオ処理装置。
- 例えば、補足の拡張情報、SEI、メッセージについて、前記書き換えが許可されているという前記データストリーム内の表示を解釈するようにさらに構成される、請求項30または31に記載のビデオ処理装置。
- 前記抽出されたデータストリーム(1955)が抽出されたサブピクチャのセットからなるように前記サブピクチャ抽出を実行し、そのそれぞれが前記データストリーム内の長方形の領域に対応するという点で長方形であるようさらに構成される、請求項30から32のいずれか一項に記載のビデオ処理装置(1960)。
- 輝度サンプルのサブピクチャの幅、
輝度サンプルのサブピクチャの高さ、
レベル情報、
HRD関連のパラメータ、及び
画像サイズの1つまたは複数を示す変数を書き換えるようにさらに構成された、請求項30から33のいずれか一項に記載のビデオ処理装置。 - ビデオエンコーダであって、
データストリームにビデオの複数の画像に符号化し、
この場合、前記データストリームは、少なくとも2つの層に複数の画像を含み、
この場合、少なくとも1つのレイヤの前記画像(1212)は、所定のレイヤ固有の数のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、前記サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む、
対応するサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、または異なるレイヤの対応する画像の前記境界の少なくとも1つが、互いに一直線化していると表示するように構成される、前記ビデオエンコーダ。 - 前記少なくとも2つのレイヤにある前記複数の画像(1212、1213、1214)のそれぞれを、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割し、
前記異なるレイヤの対応するサブピクチャのすべての前記境界が互いに一直線化する程度まで表示するように構成されている、請求項35に記載のビデオエンコーダ。 - この場合、各レイヤの前記画像(1212、1213、1214)は、同じ解像度を有し、及び/または
この場合、前記解像度はレイヤ間で異なり、及び/または
この場合、各レイヤ内の前記解像度は、連続する画像間で変化する可能性がある、請求項35及び36に記載のビデオエンコーダ。 - この場合、1つのレイヤの前記画像(1211)はサブピクチャに分割されず、サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))には画像(1212、1213、他のレイヤの1つの1214)は、分割されていない画像(1211)の1つに対応するように分割される、請求項35から37のいずれか一項に記載のビデオエンコーダ。
- 1つのレイヤの1つの画像(1212)のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))の前記外側の境界が別のレイヤで1つの対応する画像(1211)の前記境界と一直線化していると表示するようにさらに構成されている、請求項38に記載のビデオエンコーダ。
- 下位レイヤには対応する上位レイヤの境界のサブセットがあると表示するようにさらに構成されている、請求項39に記載のビデオエンコーダ。
- 例えば、あるレイヤの前記サブピクチャのそれぞれが別のレイヤの前記サブピクチャの1つに対応するというsubpictures_in_ols_coherent_flagの表示をし、この場合前記表示が所定のセクションにあり、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項35から40のいずれか一項に記載のビデオエンコーダ。
- 前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていると表示し、この場合前記表示は、ビデオパラメータセット、VPS、またはシーケンスパラメータセット、SPS内にあるようにさらに構成されている、請求項35から41のいずれか一項に記載のビデオエンコーダ。
- 例えば、前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていることの表示subpictures_in_ols_aligned_flagをし、この場合、前記表示は前記VPSの所定のセクションにあり、例えば、general_constraint_info()またはprofile_tier_level()であるようにさらに構成されている、請求項42に記載のビデオエンコーダ。
- この場合、各サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))にはサブピクチャ識別情報が割り当てられ、前記デコーダはさらに、前記サブピクチャ識別情報がすべてのレイヤに対して一意であると表示するように構成される、請求項35から43のいずれか一項に記載のビデオエンコーダ。
- 例えば、前記サブピクチャ識別情報は、所定のセクション内のすべてのレイヤに対して一意であるというunique_subpictures_ids_in_ols_flagの表示をし、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項44に記載のビデオエンコーダ。
- 互いに対応する異なるレイヤの前記サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))が同じサブピクチャ識別情報を有していると表示するようさらに構成された、請求項35から43のいずれか一項に記載のビデオエンコーダ。
- 例えば、互いに対応する異なるレイヤの前記サブピクチャが、所定のセクションで同じサブピクチャ識別情報を有するというaligned_subpictures_ids_in_ols_flagの表示をし、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()であるようにさらに構成される、請求項46に記載のビデオエンコーダ。
- 相対的なサブピクチャの位置とサブピクチャの寸法が、すべてのレイヤの前記対応するサブピクチャで同じであることを示す、例えば、対応するサブピクチャまたは画像の前記データストリームのシグナリング順序に使用される構文要素の前記インデックスが等しくなるようにさらに構成される、請求項35から47のいずれか一項に記載のビデオエンコーダ。
- 前記少なくとも2つのレイヤにある前記複数の画像(1212、1213、1214)のそれぞれを、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割し、
この場合、前記表示は、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしているかどうかを示すフラグを含む、請求項48に記載のビデオエンコーダ。 - 前記1つまたは複数の上位レイヤは、予測のために前記それぞれのレイヤの画像を使用する、請求項49に記載のビデオエンコーダ。
- この場合、前記フラグは、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしていると表示しているとき、前記サブピクチャのID(L2(1)、L2(2)、L2(3)、L2(4))が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で同じであることを示す、請求項48、49、または50に記載のビデオエンコーダ。
- 前記表示は、シーケンスパラメータセットSPSに含まれている、請求項148から51のいずれか一項に記載のビデオエンコーダ。
- 特定のレイヤの前記サブピクチャまたはピクチャの1つの前記境界の少なくとも1つが、前記サブピクチャの1つについて、前記サブピクチャが境界拡張プロパティに関して同じレイヤ内または1つ以上のレイヤにまたがる隣接するサブピクチャから独立しているという表示をすることにより、運動補償の境界拡張に使用されないことをシグナリングするようにさらに構成される、請求項35から52のいずれか一項に記載のビデオエンコーダ。
- 前記サブピクチャの境界が、レイヤ間で実行される運動補償のサンプル外挿に使用されるかどうか表示するようにさらに構成された、請求項35から53のいずれか一項に記載のビデオデコーダ。
- 一直線化されたサブピクチャの前記サブピクチャの境界が、レイヤ間で実行される層間運動予測に使用されるかどうかの表示を解釈するようにさらに構成された、請求項35から54のいずれか一項に記載のビデオエンコーダ。
- 前記少なくとも1つの他のレイヤのどのサブピクチャが復号に必要であるかに関して、前記他のレイヤの少なくとも1つについて、所定のレイヤで前記ビデオの所定の空間セクションを復号するための、例えばreduced_subpic_reference_flagフラグの表示を解釈するようにさらに構成される、請求項35から55のいずれか一項に記載のビデオデコーダ。
- 各レイヤについて、前記ビデオの前記空間的選択に必要なサブピクチャを示すようさらに構成され、
好ましくは、前記対応するサブピクチャ識別情報を表示し、この場合、前記表示は特に好ましくは補足の強調情報、SEI、メッセージ、またはビデオパラメータセット、VPS、例えばnum_sub_pic_ids及びsubPicIdToDecodeForReferenceである、または
スケーリング係数及び/またはオフセットによってなされるようにさらに構成される、請求項56に記載のビデオエンコーダ。 - 補足拡張情報SEI、メッセージ、またはビデオパラメータセットVPSで、前記必要なサブピクチャのみを含むデータストリームの前記必要なプロファイル/レイヤ/レベル、PTLの表示、例えばsubpic_add_ptl_present_flag[i]をするようにさらに構成される、請求項56または57に記載のビデオデコーダ。
- ビデオエンコーダ(1930)であって、
複数の画像(1910、1920)のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割される方法で、前記複数の画像(1910、1920)をデータストリーム(1945)に符号化し、各サブピクチャは、運動補償のための境界拡張の境界を含むように構成され、
この場合、前記ビデオエンコーダ(1930)は、前記少なくとも1つのサブピクチャのためのダミーデータ(d)を前記データストリームに含めること、及びダミーデータ(d)を、前記抽出されたデータストリームが関係しない別のサブピクチャの前記データストリームに含まないことによって、前記少なくとも1つのサブピクチャ(1911、1921)に関するサブピクチャデータストリームを一定のビットレートで前記データストリームに符号化するように構成される、前記ビデオエンコーダ。 - 前記データストリームの前記サブピクチャの少なくとも1つが、ビデオパラメータセット、VPS、またはSEIメッセージ、例えばcbr_flagの一定のビットレートであるという表示をするようにさらに構成された、請求項59に記載のビデオエンコーダ。
- 前記データストリームのサブピクチャがビデオパラメータセット、VPS、またはSEIメッセージで一定のビットレートではないと表示し、すべてのダミーデータ、例えばFD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを含まないようにさらに構成された、請求項59または60に記載のビデオエンコーダ。
- 前記生成が一定のビットレートの前記抽出されたデータストリームになるかどうか、この場合、前記ビデオエンコーダは前記ダミーデータ(d)の前記包含と不包含を実行する、または、前記生成が一定のビットレートである前記抽出されたデータストリーム(1955)に終わらないかどうか、この場合、ビデオエンコーダはいずれのダミーデータ(d)も包含しないことを実行するということを、前記抽出されたデータストリーム(1955)の前記生成のため前記データストリームに表示するようにさらに構成される、請求項59または60に記載のビデオエンコーダ。
- ダミーデータが、例えば、FD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを含む、請求項59または60に記載のビデオエンコーダ。
- ビデオエンコーダ(1930)であって、
ビデオの複数の画像(1910、1920)を複数のレイヤのデータストリーム(1945)に符号化し、この場合前記データストリーム(1945)は複数の画像(1910、1920)を有し、すべてのレイヤの前記複数の画像のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割され、各サブピクチャは運動補償のための境界拡張のための境界を含むよう構成され、
この場合、前記ビデオエンコーダ(1930)は、前記1つまたは複数のサブピクチャ(1911、1921)に対応しない前記データストリームへNALユニット(1942、1943、1952、1953;2045、2046、2055、2056)を包含しないこと、及びパラメータセット及び/またはピクチャヘッダ(HI1、HI2)を書き換えることによって、関心のある1つまたは複数のサブピクチャ(1911、1921)に関連するデータストリームへ前記データストリームに対して前記サブピクチャ抽出を表示するように構成される、ビデオエンコーダ。 - 前記データストリームへ書き換えるための追加情報、HRD関連情報に関連する前記追加情報、画像サイズ、及び/またはサブピクチャへの細分化を表示するようさらに構成された、請求項64に記載のビデオエンコーダ。
- 例えば、補足の拡張情報、SEI、メッセージについて、前記書き換えが許可されているという前記データストリーム内に表示するようにさらに構成される、請求項64または65に記載のビデオエンコーダ。
- 輝度サンプルのサブピクチャの幅、
輝度サンプルのサブピクチャの高さ、
レベル情報、
HRD関連のパラメータ、及び
画像サイズの1つまたは複数を示す変数を書き換えるようにさらに構成された、請求項64から66のいずれか一項に記載のビデオエンコーダ。 - ビデオエンコーダであって、
データストリームにビデオの複数の画像に符号化し、
この場合、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記ビデオエンコーダは、スライスの単位で前記複数の画像を符号化し、前記スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータを書き込むように構成され、
この場合、前記ビデオエンコーダは、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込むように構成され、
1ずつ増加する方法であり、
前記スライスの少なくとも1つのスライスヘッダで、ビットで区切られる、前記ビデオエンコーダ。 - 前記スライスの前記スライスヘッダに、第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込み、
前記第1及び第2のビットの長さの合計が24ビットより大きいかどうかを確認し、
前記第1及び第2のビットの長さの合計が24ビットより大きい場合は、前記第1の構文要素と前記サブピクチャ識別情報パラメータの間のビットを書き込み、
前記サブピクチャ識別情報パラメータの後に、1に設定された別のビットを書き込むようさらに構成された、請求項68に記載のビデオエンコーダ。 - ビデオエンコーダであって、
ビデオの複数の画像をデータストリームに符号化し、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記ビデオエンコーダは、スライスの単位で複数の画像を符号化し、スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータを書き込むように構成され、
この場合、前記ビデオエンコーダは、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込むように構成され、
第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込み、
前記第1の構文要素がサブピクチャ識別情報パラメータの前に来るような方法であり、
前記第1の構文要素が前記データストリームに1増加して書き込まれるようにし、
前記サブピクチャ識別情報パラメータが前記データストリームに特定の値増加して、その後に1に設定され書き込まれるようにし、
前記特定の値を、
前記第1及び第2のビットの長さの合計が31ビットより小さいかどうかを確認し、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値1に設定し、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値4に設定することによって、決定する、ビデオエンコーダ。 - この場合、前記第1の構文要素は前記画像順序カウントパラメータである、請求項68から70のいずれか一項に記載のビデオエンコーダ。
- ビデオエンコーダであって、
ビデオの複数の画像をデータストリーム(2065)に符号化し、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記ビデオエンコーダ(2610)は、コンテキスト適応型バイナリ算術符号化を使用して各前記サブピクチャを符号化するように構成され、
この場合、前記ビデオエンコーダは、サブピクチャのいずれかが所定ビンとビットの比率を超えることを回避するように、ゼロワードの各サブピクチャの1つまたは複数のスライス(2631、2632、2633)の前記終わりに少なくとも1つのサブピクチャの前記データストリームを提供するように構成される、前記ビデオエンコーダ。 - 独立性のプロパティ、例えばsubpic_treatment_as_pic_flagについて、及び対応するレベルの適合性の表示、例えば、補足拡張情報、SEI、メッセージについて各サブピクチャを評価し、また
前記評価に応じて、前記評価に従ってのみ、サブピクチャに前記ゼロワードを提供するようにさらに構成される、請求項72に記載のビデオエンコーダ。 - 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを提供するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャは、所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の積を使用して決定される数以下である、請求項72または73に記載のビデオエンコーダ(2610)。
- 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを提供するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャへの符号化されたビンの数は、第1の所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の第1の積と、第2の所定の係数と、コーディングブロックあたりの最小ビット数と前記それぞれのサブピクチャが構成されるコーディングブロックの数との間の第2の積の合計を使用して決定される数以下である、請求項72または73に記載のビデオエンコーダ(2610)。
- ビデオを復号するための方法であって、
データストリームをビデオの複数の画像に復号することと、
この場合、前記データストリームは、少なくとも2つの層に複数の画像を含み、
この場合、少なくとも1つのレイヤの前記画像(1212)は、所定のレイヤ固有の数のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、前記サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む、
対応するサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、または異なるレイヤの対応する画像の前記境界の少なくとも1つが、互いに一直線化しているという表示を解釈することとを含む、前記方法。 - 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれが、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割され、
前記異なるレイヤの対応するサブピクチャのすべての前記境界が互いに一直線化する程度まで前記表示を解釈することを含む、請求項76に記載のビデオを復号するための方法。 - この場合、各レイヤの前記画像(1212、1213、1214)は、同じ解像度を有し、及び/または
この場合、前記解像度はレイヤ間で異なり、及び/または
この場合、各レイヤ内の前記解像度は、連続する画像間で変化する可能性がある、請求項76または77に記載のビデオを復号するための方法。 - この場合、1つのレイヤの前記画像(1211)はサブピクチャに分割されず、サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))には画像(1212、1213、他のレイヤの1つの1214)は、分割されていない画像(1211)の1つに対応するように分割される、請求項76、77、78のいずれか一項に記載のビデオを復号するための方法。
- 1つのレイヤの1つの画像(1212)のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))の前記外側の境界が別のレイヤ(1211)で1つの対応する画像の前記境界と一直線化しているという表示を解釈することをさらに含む、請求項79に記載のビデオを復号するための方法。
- 下位レイヤには対応する上位レイヤの境界のサブセットがあるという表示を解釈することをさらに含む、請求項80に記載のビデオを復号するための方法。
- 例えば、あるレイヤの前記サブピクチャのそれぞれが別のレイヤの前記サブピクチャの1つに対応するというsubpictures_in_ols_coherent_flagの表示を解釈することをさらに含み、この場合前記表示が所定のセクションにあり、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項76から81のいずれか一項に記載のビデオを復号するための方法。
- 前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されているという表示を解釈することを含み、この場合前記表示は、ビデオパラメータセット、VPS、またはシーケンスパラメータセット、SPS内にある、請求項76から82のいずれか一項に記載のビデオを復号するための方法。
- 例えば、前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていることの表示subpictures_in_ols_aligned_flagを解釈することをさらに含み、この場合、前記表示は前記VPSの所定のセクションにあり、例えば、general_constraint_info()またはprofile_tier_level()である、請求項83に記載のビデオを復号するための方法。
- この場合、各サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))にはサブピクチャ識別情報が割り当てられ、前記方法はさらに、前記サブピクチャ識別情報がすべてのレイヤに対して一意であるという表示を解釈することをさらに含む、請求項76から84のいずれか一項に記載のビデオを復号するための方法。
- 例えば、前記サブピクチャ識別情報は、所定のセクション内のすべてのレイヤに対して一意であるというunique_subpictures_ids_in_ols_flagの表示を解釈することをさらに含み、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項85に記載のビデオを復号するための方法。
- 互いに対応する異なるレイヤの前記サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))が同じサブピクチャ識別情報を有しているという表示を解釈することをさらに含む、請求項76から84のいずれか一項に記載のビデオを復号するための方法。
- 例えば、互いに対応する異なるレイヤの前記サブピクチャが、所定のセクションで同じサブピクチャ識別情報を有するというaligned_subpictures_ids_in_ols_flagの表示を解釈することをさらに含み、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項87に記載のビデオを復号するための方法。
- 相対的なサブピクチャの位置とサブピクチャの寸法が、すべてのレイヤの前記対応するサブピクチャで同じであるという表示を解釈することをさらに含み、例えば、対応するサブピクチャまたは画像の前記データストリームのシグナリング順序に使用される構文要素の前記インデックスが等しくなる、請求項87から88のいずれか一項に記載のビデオを復号するための方法。
- 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれが、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割され、
この場合、前記表示は、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしているかどうかを示すフラグを含む、請求項89に記載のビデオを復号するための方法。 - 前記1つまたは複数の上位レイヤは、予測のために前記それぞれのレイヤの画像を使用する、請求項90に記載のビデオを復号するための方法。
- この場合、前記フラグは、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしていると表示しているとき、前記サブピクチャのID(L2(1)、L2(2)、L2(3)、L2(4))が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で同じであることを示す、請求項89、90、91に記載のビデオを復号するための方法。
- 前記表示は、シーケンスパラメータセットSPSに含まれている、請求項89から92のいずれか一項に記載のビデオを復号するための方法。
- 特定のレイヤの前記サブピクチャまたは画像の1つの前記境界の少なくとも1つは、前記特定のレイヤ及び少なくとも1つの他のレイヤが、同じ所定のレイヤ固有の番号のサブピクチャを使用してサブピクチャに分割されていること、及び前記結果のサブピクチャの前記境界が一直線化していることを決定することにより、運動補償のための境界拡張に使用されることを決定すること、または
特定のレイヤの前記サブピクチャまたはピクチャの1つの前記境界の少なくとも1つが、前記サブピクチャの1つについて、前記サブピクチャが境界拡張プロパティに関して同じレイヤ内または1つ以上のレイヤにまたがる隣接するサブピクチャから独立しているという表示を解釈することにより、運動補償の境界拡張に使用されないことを決定することをさら含む、請求項76から93のいずれか一項に記載のビデオを復号するための方法。 - 前記サブピクチャの境界が、レイヤ間で実行される運動補償のサンプル外挿に使用されるかどうかの表示を解釈することさらに含む、請求項76から94のいずれか一項に記載のビデオを復号するための方法。
- 一直線化されたサブピクチャの前記サブピクチャの境界が、レイヤ間で実行される層間運動予測に使用されるかどうかの表示を解釈することをさらに含む、請求項76から95のいずれかに記載のビデオを復号するための方法。
- 例えば、前記少なくとも1つの他のレイヤのどのサブピクチャが復号に必要であるかに関して、前記他のレイヤの少なくとも1つについて、所定のレイヤで前記ビデオの所定の空間セクションを復号するためのreduced_subpic_reference_flagフラグの表示を解釈することをさらに含む、請求項76から96のいずれか一項に記載のビデオを復号するための方法。
- 各レイヤについて、前記サブピクチャが前記ビデオの前記空間的選択に必要であるという表示を解釈すること、これは好ましくは前記対応するサブピクチャ識別情報を示し、この場合、前記表示は特に好ましくは補足の強調情報、SEI、メッセージ、またはビデオパラメータセット、VPS、例えばnum_sub_pic_ids及びsubPicIdToDecodeForReferenceである、または
スケーリング係数及び/またはオフセットに従って、前記ビデオの前記空間的選択に必要なサブピクチャを導出することをさらに含む、請求項97に記載のビデオを復号するための方法。 - 補足拡張情報SEI、メッセージ、またはビデオパラメータセットVPSで、前記必要なサブピクチャのみを含むデータストリームの前記必要なプロファイル/レイヤ/レベル、PTLの表示、例えばsubpic_add_ptl_present_flag[i]を解釈することをさらに含む、請求項97または98に記載のビデオを復号するための方法。
- ビデオを処理するための方法であって、
複数の画像(1910、1920)のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割される方法で、中に符号化された前記複数の画像(1910、1920)を有する一定のビットレートのデータストリーム(1945)を処理することを含み、各サブピクチャは、運動補償のための境界拡張の境界を含み、また
この場合、前記方法は、前記少なくとも1つのサブピクチャの前記データストリームに含まれるダミーデータ(d)を保持すること、及び前記抽出されたデータストリームが関係しない別のサブピクチャの前記データストリームに含まれるダミーデータ(d)を削除することによって、一定のビットレートで少なくとも1つのサブピクチャ(1911、1921)に関連するサブピクチャデータストリーム(1955)を、前記データストリーム(1945)から生成することを含む、前記方法。 - 前記データストリームの前記サブピクチャの少なくとも1つが、ビデオパラメータセット、VPS、またはSEIメッセージ、例えばcbr_flagの一定のビットレートであるという表示を解釈することをさらに含む、請求項100に記載のビデオを処理するための方法。
- 前記データストリームのサブピクチャがビデオパラメータセット、VPS、またはSEIメッセージで一定のビットレートではなく、すべてのダミーデータ、例えばFD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを削除するという表示を解釈することをさらに含む、請求項100または101に記載のビデオを処理するための方法。
- 前記生成が一定のビットレートの前記抽出されたデータストリームになるかどうか、この場合、前記ビデオ処理装置は前記ダミーデータ(d)の前記保持と削除を実行する、または、前記生成が一定のビットレートである前記抽出されたデータストリーム(1955)に終わらないかどうか、この場合、ビデオ処理装置はすべてのダミーデータ(d)の削除を実行するということの、前記抽出されたデータストリーム(1955)の前記生成のための前記データストリームからの表示を復号することをさらに含む、請求項100または101に記載のビデオを処理するための方法。
- ダミーデータが、例えば、FD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを含む、請求項100または101に記載のビデオを処理するための方法。
- ビデオを処理するための方法であって、
複数のレイヤに符号化されたビデオの複数の画像(1910、1920)を有するデータストリーム(1945)に対してサブピクチャ抽出を実行することであって、すべてのレイヤの前記複数の画像のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割され、各サブピクチャは運動補償のための境界拡張のための境界を含む、前記実行すること、を含み、
この場合、前記方法は、前記1つまたは複数のサブピクチャ(1911、1921)に対応しない前記データストリームのNALユニット(1942、1943、1952、1953;2045、2046、2055、2056)をドロップすること、及びパラメータセット及び/またはピクチャヘッダ(HI1、HI2)を書き換えることによって、関心のある1つまたは複数のサブピクチャ(1911、1921)に関連する抽出されたデータストリーム(1955)へ前記データストリームに対して前記サブピクチャ抽出を実行することを含む、ビデオを処理するための方法。 - 前記データストリームから書き換えるための追加情報、HRD関連情報に関連する前記追加情報、画像サイズ、及び/またはサブピクチャへの細分化を導き出すことをさらに含む、請求項105に記載のビデオを処理するための方法。
- 例えば、補足の拡張情報、SEI、メッセージについて、前記書き換えが許可されているという前記データストリーム内の表示を解釈することをさらに含む、請求項105または106に記載のビデオを処理するための方法。
- 前記抽出されたデータストリーム(1955)が抽出されたサブピクチャのセットからなるように前記サブピクチャ抽出を実行することであって、そのそれぞれが前記データストリーム内の長方形の領域に対応するという点で長方形であるようさらに構成される、前記実行することをさらに含む、請求項105から107のいずれか一項に記載のビデオを処理するための方法。
- 輝度サンプルのサブピクチャの幅、
輝度サンプルのサブピクチャの高さ、
レベル情報、
HRD関連のパラメータ、及び
画像サイズの1つまたは複数を示す変数を書き換えることをさらに含む、請求項105または108のいずれか一項に記載のビデオを処理するための方法。 - ビデオを符号化するための方法であって、
データストリームにビデオの複数の画像に符号化すること、
この場合、前記データストリームは、少なくとも2つの層に複数の画像を含み、
この場合、少なくとも1つのレイヤの前記画像(1212)は、所定のレイヤ固有の数のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、前記サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む、
対応するサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、または異なるレイヤの対応する画像の前記境界の少なくとも1つが、互いに一直線化していると表示することを含む、前記方法。 - 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれを、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割することを含み、
前記異なるレイヤの対応するサブピクチャのすべての前記境界が互いに一直線化する程度まで前記表示を解釈することを含む、請求項110に記載のビデオを符号化するための方法。 - この場合、各レイヤの前記画像(1212、1213、1214)は、同じ解像度を有し、及び/または
この場合、前記解像度はレイヤ間で異なり、及び/または
この場合、各レイヤ内の前記解像度は、連続する画像間で変化する可能性がある、請求項110または111に記載のビデオを符号化するための方法。 - この場合、1つのレイヤの前記画像(1211)はサブピクチャに分割されず、サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))には画像(1212、1213、他のレイヤの1つの1214)は、分割されていない画像(1211)の1つに対応するように分割される、請求項110、111、または112に記載のビデオを符号化するための方法。
- 1つのレイヤの1つの画像(1212)のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))の前記外側の境界が別のレイヤで1つの対応する画像(1211)の前記境界と一直線化していると表示することをさらに含む、請求項113に記載のビデオを符号化するための方法。
- 下位レイヤには対応する上位レイヤの境界のサブセットがあると表示することをさらに含む、請求項114に記載のビデオを符号化するための方法。
- 例えば、あるレイヤの前記サブピクチャのそれぞれが別のレイヤの前記サブピクチャの1つに対応するというsubpictures_in_ols_coherent_flagを表示することをさらに含み、この場合前記表示が所定のセクションにあり、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項110から115のいずれか一項に記載のビデオを符号化するための方法。
- 前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていると表示することをさらに含み、この場合前記表示は、ビデオパラメータセット、VPS、またはシーケンスパラメータセット、SPS内にある、請求項110から116のいずれか一項に記載のビデオを符号化するための方法。
- 例えば、前記サブピクチャの境界が少なくとも2つのレイヤにわたって一直線化されていることの表示subpictures_in_ols_aligned_flagをすることをさらに含み、この場合、前記表示は前記VPSの所定のセクションにあり、例えば、general_constraint_info()またはprofile_tier_level()である、請求項117に記載のビデオを符号化するための方法。
- この場合、各サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))にはサブピクチャ識別情報が割り当てられ、前記方法はさらに、前記サブピクチャ識別情報がすべてのレイヤに対して一意であると表示することをさらに含む、請求項110から118のいずれか一項に記載のビデオを符号化するための方法。
- 例えば、前記サブピクチャ識別情報は、所定のセクション内のすべてのレイヤに対して一意であるというunique_subpictures_ids_in_ols_flagを表示することをさらに含み、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項119に記載のビデオを符号化するための方法。
- 互いに対応する異なるレイヤの前記サブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))が同じサブピクチャ識別情報を有していると表示するようさらに構成された、請求項110から118のいずれか一項に記載のビデオを符号化するための方法。
- 例えば、互いに対応する異なるレイヤの前記サブピクチャが、所定のセクションで同じサブピクチャ識別情報を有するというaligned_subpictures_ids_in_ols_flagを表示することをさらに含み、例えば、ビデオパラメータセットVPS、またはシーケンスパラメータセットSPSのgeneral_constraint_info()またはprofile_tier_level()である、請求項121に記載のビデオを符号化するための方法。
- 相対的なサブピクチャの位置とサブピクチャの寸法が、すべてのレイヤの前記対応するサブピクチャで同じであることを表示することをさらに含み、例えば、対応するサブピクチャまたは画像の前記データストリームのシグナリング順序に使用される構文要素の前記インデックスが等しくなる、請求項110から122のいずれか一項に記載のビデオを符号化するための方法。
- 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれを、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割すること、及び
1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしていることを表示することを含む、請求項123に記載のビデオを符号化するための方法。 - 前記1つまたは複数の上位レイヤは、予測のために前記それぞれのレイヤの画像を使用する、請求項124に記載のビデオを符号化するための方法。
- この場合、前記フラグは、1つまたは複数のレイヤのそれぞれについて、前記それぞれのレイヤ(1212)よりも高い1つまたは複数のより高いレイヤの前記画像(1213、1214)がサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))に分割され、前記所定のレイヤ固有のサブピクチャの数は、前記それぞれのレイヤ及び前記1つまたは複数の上位レイヤについて等しくなり、所定のレイヤ固有の数のサブピクチャの前記境界が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で空間的に一致するようにしていると表示しているとき、前記サブピクチャのID(L2(1)、L2(2)、L2(3)、L2(4))が前記それぞれのレイヤと前記1つまたは複数の上位レイヤの間で同じであることを示す、請求項123、124、125に記載のビデオを符号化するための方法。
- 前記表示は、シーケンスパラメータセットSPSに含まれている、請求項123から126のいずれか一項に記載のビデオデコーダ。
- 特定のレイヤの前記サブピクチャまたはピクチャの1つの前記境界の少なくとも1つが、前記サブピクチャの1つについて、前記サブピクチャが境界拡張プロパティに関して同じレイヤ内または1つ以上のレイヤにまたがる隣接するサブピクチャから独立しているという表示をすることにより、運動補償の境界拡張に使用されないことをシグナリングすることをさらに含む、請求項110から127のいずれか一項に記載のビデオを符号化するための方法。
- 前記サブピクチャの境界が、レイヤ間で実行される運動補償のサンプル外挿に使用されるかどうか表示することをさらに含む、請求項110から128のいずれか一項に記載のビデオを符号化するための方法。
- 一直線化されたサブピクチャの前記サブピクチャの境界が、レイヤ間で実行される層間運動予測に使用されるかどうかを表示することをさらに含む、請求項110から129のいずれか一項に記載のビデオを符号化するための方法。
- 前記少なくとも1つの他のレイヤのどのサブピクチャが復号に必要であるかに関して、前記他のレイヤの少なくとも1つについて、所定のレイヤで前記ビデオの所定の空間セクションを復号するための、例えば、reduced_subpic_reference_flagを表示することをさらに含む、請求項110から130のいずれか一項に記載のビデオを符号化するための方法。
- 各レイヤについて、前記ビデオの前記空間的選択に必要なサブピクチャを表示することをさらに含み、
好ましくは、前記対応するサブピクチャ識別情報を表示し、この場合、前記表示は特に好ましくは補足の強調情報、SEI、メッセージ、またはビデオパラメータセット、VPS、例えばnum_sub_pic_ids及びsubPicIdToDecodeForReferenceである、または
スケーリング係数及び/またはオフセットによってなされる、請求項131に記載のビデオを符号化するための方法。 - 補足拡張情報SEI、メッセージ、またはビデオパラメータセットVPSで、前記必要なサブピクチャのみを含むデータストリームの前記必要なプロファイル/レイヤ/レベル、PTLを表示することをさらに含み、例えばsubpic_add_ptl_present_flag[i]をする、請求項131または132に記載のビデオを符号化するための方法。
- ビデオを符号化するための方法であって、
複数の画像(1910、1920)のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割される方法で、前記複数の画像(1910、1920)をデータストリーム(1945)に符号化することをさらに含み、各サブピクチャは、運動補償のための境界拡張の境界を含み、
この場合、前記方法は、前記少なくとも1つのサブピクチャのためのダミーデータ(d)を前記データストリーム(1945)に含めること、及びダミーデータ(d)を、前記抽出されたデータストリームが関係しない別のサブピクチャの前記データストリームに含まないことによって、前記少なくとも1つのサブピクチャ(1911、1921)に関するサブピクチャデータストリームを一定のビットレートで前記データストリームに符号化することを含む、前記方法。 - 前記データストリームの前記サブピクチャの少なくとも1つが、ビデオパラメータセット、VPS、またはSEIメッセージ、例えばcbr_flagの一定のビットレートであるという表示することをさらに含む、請求項134に記載のビデオを符号化するための方法。
- 前記データストリームのサブピクチャがビデオパラメータセット、VPS、またはSEIメッセージで一定のビットレートではなく、すべてのダミーデータ、例えばFD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを削除すると表示することをさらに含む、請求項134または135に記載のビデオを処理するための方法。
- 前記生成が一定のビットレートの前記抽出されたデータストリームになるかどうか、この場合、前記ビデオエンコーダは前記ダミーデータ(d)の前記包含と不包含を実行する、または、前記生成が一定のビットレートである前記抽出されたデータストリーム(1955)に終わらないかどうか、この場合、ビデオエンコーダはいずれのダミーデータ(d)も包含しないことを実行するということを、前記抽出されたデータストリーム(1955)の前記生成のため前記データストリームに表示することをさらに含む、請求項134または135に記載のビデオを符号化するための方法。
- ダミーデータが、例えば、FD_NUT及びフィラーペイロードの補足拡張情報、SEI、メッセージを含む、請求項134または135に記載のビデオを符号化するための方法。
- ビデオを符号化するための方法であって、
ビデオの複数の画像(1910、1920)を複数のレイヤのデータストリーム(1945)を符号化することであって、この場合前記データストリーム(1945)は複数の画像(1910、1920)を有し、すべてのレイヤの前記複数の画像のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割され、各サブピクチャは運動補償のための境界拡張のための境界を含む、前記符号化すること、及び
前記1つまたは複数のサブピクチャ(1911、1921)に対応しない前記データストリームへNALユニット(1942、1943、1952、1953;2045、2046、2055、2056)を包含しないこと、及びパラメータセット及び/またはピクチャヘッダ(HI1、HI2)を書き換えることによって、関心のある1つまたは複数のサブピクチャ(1911、1921)に関連するデータストリームへ前記データストリームに対して前記サブピクチャ抽出を表示することを含む、ビデオを符号化するための方法。 - 前記データストリームへ書き換えるための追加情報、HRD関連情報に関連する前記追加情報、画像サイズ、及び/またはサブピクチャへの細分化を表示することをさらに含む、請求項139に記載のビデオを符号化するための方法。
- 例えば、補足の拡張情報、SEI、メッセージについて、前記書き換えが許可されているという前記データストリーム内に表示することをさらに含む、請求項139または140に記載のビデオを符号化するための方法。
- 輝度サンプルのサブピクチャの幅、
輝度サンプルのサブピクチャの高さ、
レベル情報、
HRD関連のパラメータ、及び
画像サイズの1つまたは複数を示す変数を書き換えることをさらに含む、請求項139または141のいずれか一項に記載のビデオを符号化するための方法。 - ビデオを符号化するための方法であって、
ビデオの複数の画像をデータストリームに符号化することであって、前記データストリームは複数の画像を含み、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含む、前記符号化することを含み、
この場合、前記方法は、スライスの単位で複数の画像を符号化し、スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータを書き込むことを含み、
この場合、前記方法は、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込むことを含み、
1ずつ増加する方法であり、
前記スライスの少なくとも1つのスライスヘッダで、ビットで区切られ、1に設定される、前記方法。 - 前記スライスの前記スライスヘッダに、第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込むこと、
前記第1及び第2のビットの長さの合計が24ビットより大きいかどうかを確認すること、
前記第1及び第2のビットの長さの合計が24ビットより大きい場合は、前記第1の構文要素と前記サブピクチャ識別情報パラメータの間のビットを書き込むこと、及び
前記サブピクチャ識別情報パラメータの後に、1に設定された別のビットを書き込むことをさらに含む、請求項143に記載のビデオを符号化するための方法。 - ビデオを符号化するための方法であって、
ビデオの複数の画像をデータストリームに符号化することであって、前記データストリームは複数の画像を含み、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含む、前記符号化することを含み、
この場合、前記方法は、スライスの単位で複数の画像を符号化し、スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータを書き込むことを含み、
この場合、前記方法は、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込むことを含み、
第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込み、
前記第1の構文要素がサブピクチャ識別情報パラメータの前に来るような方法であり、
前記第1の構文要素が前記データストリーム1つ増加して書き込まれるように、
前記サブピクチャ識別情報パラメータが前記データストリームに書き込まれるように、特定の値だけ増加し、その後にビットが続き、1に設定され、
前記特定の値を、
前記第1及び第2のビットの長さの合計が31ビットより小さいかどうかを確認し、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値1に設定し、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値4に設定することによって、決定する、前記方法。 - この場合、前記第1の構文要素は前記画像順序カウントパラメータである、請求項145に記載のビデオを符号化するための方法。
- ビデオを符号化するための方法であって、
ビデオの複数の画像をデータストリームに符号化することを含み、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記方法は、コンテキスト適応型バイナリ算術符号化を使用して各前記サブピクチャを符号化することを含み、
この場合、前記方法は、サブピクチャのいずれかが所定ビンとビットの比率を超えることを回避するように、ゼロワードの各サブピクチャの1つまたは複数のスライス(2631、2632、2633)の前記終わりに少なくとも1つのサブピクチャの前記データストリーム(2605)を提供することを含む、前記方法。 - 独立性のプロパティ、例えばsubpic_treatment_as_pic_flag、及び、例えば、補足拡張情報、SEI、メッセージにおける対応するレベルの適合性の表示のため、各サブピクチャを評価すること、及び
前記評価に応じて、前記評価に従ってのみ、サブピクチャに前記ゼロワードを提供することをさらに含む、請求項147に記載のビデオを符号化するための方法。 - 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを提供することを含み、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャは、所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の積を使用して決定される数以下である、請求項147または148に記載のビデオを符号化するための方法。
- 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを提供することを含み、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャへの符号化されたビンの数は、第1の所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の第1の積と、第2の所定の係数と、コーディングブロックあたりの最小ビット数と前記それぞれのサブピクチャが構成されるコーディングブロックの数との間の第2の積の合計を使用して決定される数以下である、請求項147、148、または149に記載のビデオを符号化するための方法。
- プログラムが処理デバイスで実行されるときに、請求項76から150のいずれか一項のステップを実行するためのソフトウェアコード部分を含む、処理デバイス用のプログラムを含むコンピュータプログラム製品。
- 前記コンピュータプログラム製品は、前記ソフトウェアコード部分が格納されるコンピュータ可読媒体を含み、前記プログラムは、前記処理デバイスの内部メモリに直接ロード可能である、請求項151に記載のコンピュータプログラム製品。
- ビデオデコーダ(2640)であって、
ビデオの複数の画像をデータストリーム(2065)から復号するよう構成され、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記ビデオデコーダ(2640)は、コンテキスト適応型バイナリ算術復号を使用して各前記サブピクチャを復号するように構成され、
この場合、前記ビデオデコーダは、ビンとビットの比率が所定のビンとビットの比率を下回るように、複数のゼロワードを各サブピクチャの1つまたは複数のスライス(2631、2632、2633)の前記終わりに少なくとも1つのサブピクチャのため復号するように構成される、前記ビデオデコーダ。 - 前記ビンとビット比率が前記所定のビンとビットの比率を下回るまでゼロワードを読み続けるか、構文的にゼロワードを他の構文要素から区別することによって、ゼロワードの数を決定するように構成される、請求項153に記載のビデオデコーダ(2640)。
- 独立性のプロパティ、例えばsubpic_treatment_as_pic_flagについて、及び対応するレベルの適合性の表示、例えば、補足拡張情報、SEI、メッセージについて各サブピクチャを評価し、また
前記評価に応じて、前記評価に従ってのみ、サブピクチャに前記ゼロワードを復号するようにさらに構成される、請求項153、または154に記載のビデオデコーダ。 - 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを復号するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャは、所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の積を使用して決定される数以下である、請求項153、154、または155に記載のビデオデコーダ(2640)。
- 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを復号するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャへの符号化されたビンの数は、第1の所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の第1の積と、第2の所定の係数と、コーディングブロックあたりの最小ビット数と前記それぞれのサブピクチャが構成されるコーディングブロックの数との間の第2の積の合計を使用して決定される数以下である、請求項153、154、または155に記載のビデオデコーダ(2640)。
- データストリームであって、
中に符号化されたビデオであって、複数の画像を含む前記ビデオを有し、
この場合、前記データストリームは、少なくとも2つの層に複数の画像を含み、
この場合、少なくとも1つのレイヤの前記画像(1212)は、所定のレイヤ固有の数のサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、1つまたは複数の他の層の1つの画像またはサブピクチャに対応する1つのレイヤの画像前記画像またはサブピクチャの1つまたは複数に分割され、前記サブピクチャの少なくとも1つは、運動補償のための境界拡張のための境界を含む、また
対応するサブピクチャ(L2(1)、L2(2)、L2(3)、L2(4))、または異なるレイヤの対応する画像の前記境界の少なくとも1つが、互いに一直線化しているという表示を有する、前記データストリーム。 - 前記少なくとも2つのレイヤの前記複数の画像(1212、1213、1214)のそれぞれが、1つまたは複数のサブピクチャ(L2(1)、L2(2)、L2(3)L2(4))に分割され、
前記異なるレイヤの対応するサブピクチャのすべての前記境界が互いに一直線化する程度まで前記表示を有する、請求項158に記載のデータストリーム。 - データストリーム(1945)であって、
符号化された複数の画像(1910、1920)を有し、
前記複数の画像(1910、1920)のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割される方法であり、各サブピクチャは、運動補償のための境界拡張の境界を含み、
この場合、前記データストリーム(1945)は、前記少なくとも1つのサブピクチャの前記データストリームに含まれるダミーデータ(d)を保持すること、及び前記抽出されたデータストリームが関係しない別のサブピクチャの前記データストリームに含まれるダミーデータ(d)を削除することによって、一定のビットレートで少なくとも1つのサブピクチャ(1911、1921)に関するサブピクチャデータストリーム(1955)が抽出可能であるように、前記データストリーム(1945)が符号化される、前記データストリーム。 - データストリームであって、
中でビデオが符号化されたであって、前記ビデオは複数のレイヤでデータストリームに符号化された複数の画像(1910、1920)を有し、
全レイヤの前記複数の画像のそれぞれが所定の数のサブピクチャ(1911、1912、1913、1921、1922、1923)に分割され、各サブピクチャは、運動補償のための境界拡張の境界を含み、
この場合、前記データストリームは、前記1つまたは複数のサブピクチャ(1911、1921)に対応しない前記データストリームのNALユニット(1942、1943、1952、1953;2045、2046、2055、2056)をドロップすること、及びパラメータセット及び/またはピクチャヘッダ(HI1、HI2)を書き換えることによって、関心のある1つまたは複数のサブピクチャ(1911、1921)に関連する抽出されたデータストリーム(1955)へサブピクチャ抽出をためのものである、前記データストリーム。 - 輝度サンプルのサブピクチャの幅、
輝度サンプルのサブピクチャの高さ、
レベル情報、
HRD関連のパラメータ、及び
画像サイズの1つまたは複数を示す変数を書き換えることの表示を有する、請求項161に記載のデータストリーム。 - データストリームであって、
中に符号化されたビデオであって、複数の画像を含む前記ビデオ、
この場合、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記複数の画像はスライスの単位で符号化され、
第1の構文要素とサブピクチャ識別情報パラメータが前記スライスのスライスヘッダへの前記データストリームに書き込まれ、
この場合、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込み、
1ずつ増加する方法であり、
前記スライスの少なくとも1つの前記スライスヘッダで、ビットで区切られ、1に設定される、前記データストリーム。 - 前記スライスの前記スライスヘッダに、第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込むこと、
前記第1及び第2のビットの長さの合計が24ビットより大きい場合は、前記第1の構文要素と前記サブピクチャ識別情報パラメータの間のビットを書き込むこと、及び
前記サブピクチャ識別情報パラメータの後に、1に設定された別のビットを書き込むことをさらに有する、請求項163に記載のデータストリーム。 - データストリームであって、
中に符号化されたビデオであって、複数の画像を含む前記ビデオを有し、
この場合、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前記複数の画像がスライスの単位で符号化され、スライスのスライスヘッダに第1の構文要素及びサブピクチャ識別情報パラメータが書き込まれ、
この場合、前記第1の構文要素及び前記サブピクチャ識別情報パラメータを前記データストリームに書き込み、
第1のビットの長さで前記第1の構文要素を書き込み、第2のビットの長さで前記サブピクチャ識別情報パラメータを書き込み、
前記第1の構文要素がサブピクチャ識別情報パラメータの前に来るような方法であり、
前記第1の構文要素が前記データストリーム1つ増加して書き込まれるように、
前記サブピクチャ識別情報パラメータが前記データストリームに書き込まれるように、特定の値だけ増加し、その後にビットが続き、1に設定され、
前記特定の値は、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値1に設定し、
前記第1及び第2のビットの長さの前記合計が31ビットより小さい場合は、前記特定の値を値4に設定する、前記データストリーム。 - この場合、前記第1の構文要素は前記画像順序カウントパラメータである、請求項165に記載のデータストリーム。
- データストリーム(2605)であって、
中に符号化されたビデオであって、複数の画像を含む前記ビデオを有し、
この場合、前記複数の画像のそれぞれは、所定の数のサブピクチャに分割され、各サブピクチャは、運動補償のための境界拡張のための境界を含み、
この場合、前コンテキスト適応型バイナリ算術符号化を使用して各前記サブピクチャを符号化し、
この場合、前記データストリームは、サブピクチャのいずれかが所定ビンとビットの比率を超えることを回避するように、ゼロワードの各サブピクチャの1つまたは複数のスライス(2631、2632、2633)の前記終わりに少なくとも1つのサブピクチャのための前記ゼロワードを含む、前記データストリーム。 - 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを復号するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャは、所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の積を使用して決定される数以下である、請求項167に記載のデータストリーム。
- 前記少なくとも1つのサブピクチャの各サブピクチャの1つまたは複数のスライスの前記終わりに前記データストリームを復号するように構成され、前記コンテキスト適応算術符号化を使用する前記データストリームへの前記それぞれのサブピクチャへの符号化されたビンの数は、第1の所定の係数と、前記それぞれのサブピクチャに関連付けられた前記データストリームの1つまたは複数のVCL NALユニットのバイト長との間の第1の積と、第2の所定の係数と、コーディングブロックあたりの最小ビット数と前記それぞれのサブピクチャが構成されるコーディングブロックの数との間の第2の積の合計を使用して決定される数以下である、請求項167に記載のデータストリーム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19218973.6 | 2019-12-20 | ||
EP19218973 | 2019-12-20 | ||
PCT/EP2020/086937 WO2021123101A1 (en) | 2019-12-20 | 2020-12-18 | Video coding in relation to subpictures |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023506878A true JP2023506878A (ja) | 2023-02-20 |
Family
ID=69063624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022536874A Pending JP2023506878A (ja) | 2019-12-20 | 2020-12-18 | サブピクチャに関連するビデオコーディング |
Country Status (9)
Country | Link |
---|---|
US (2) | US11973955B2 (ja) |
EP (1) | EP4078962A1 (ja) |
JP (1) | JP2023506878A (ja) |
KR (1) | KR20220110761A (ja) |
CN (1) | CN114788282A (ja) |
AU (1) | AU2020407270A1 (ja) |
CA (1) | CA3164490A1 (ja) |
TW (1) | TWI789662B (ja) |
WO (1) | WO2021123101A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021201628A1 (ko) * | 2020-04-01 | 2021-10-07 | 엘지전자 주식회사 | 출력 레이어 셋에 기반하여 파라미터 셋의 참조 여부를 결정하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
WO2024063559A1 (ko) * | 2022-09-23 | 2024-03-28 | 엘지전자 주식회사 | 프로파일을 정의하는 하이 레벨 신택스에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2777286B1 (en) * | 2011-11-11 | 2017-01-04 | GE Video Compression, LLC | Effective wedgelet partition coding |
US9351016B2 (en) * | 2012-04-13 | 2016-05-24 | Sharp Kabushiki Kaisha | Devices for identifying a leading picture |
PT3931748T (pt) * | 2019-03-11 | 2024-06-27 | Huawei Tech Co Ltd | Endereços de parcela baseados em subgravura na codificação vídeo |
US20220182681A1 (en) * | 2019-03-24 | 2022-06-09 | Lg Electronics Inc. | Image or video coding based on sub-picture handling structure |
GB2585042A (en) * | 2019-06-25 | 2020-12-30 | Sony Corp | Image data encoding and decoding |
US20220377344A1 (en) * | 2019-09-19 | 2022-11-24 | Vid Scale, Inc. | Systems and methods for versatile video coding |
US11412263B2 (en) * | 2019-09-23 | 2022-08-09 | Qualcomm Incorporated | Arithmetic coder byte stuffing signaling for video coding |
WO2021060834A1 (ko) * | 2019-09-24 | 2021-04-01 | 엘지전자 주식회사 | 서브픽처 기반 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
-
2020
- 2020-12-18 JP JP2022536874A patent/JP2023506878A/ja active Pending
- 2020-12-18 AU AU2020407270A patent/AU2020407270A1/en active Pending
- 2020-12-18 WO PCT/EP2020/086937 patent/WO2021123101A1/en unknown
- 2020-12-18 KR KR1020227020384A patent/KR20220110761A/ko unknown
- 2020-12-18 CN CN202080088665.6A patent/CN114788282A/zh active Pending
- 2020-12-18 TW TW109145104A patent/TWI789662B/zh active
- 2020-12-18 CA CA3164490A patent/CA3164490A1/en active Pending
- 2020-12-18 US US17/787,219 patent/US11973955B2/en active Active
- 2020-12-18 EP EP20824941.7A patent/EP4078962A1/en active Pending
-
2024
- 2024-03-27 US US18/617,726 patent/US20240236328A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
TWI789662B (zh) | 2023-01-11 |
CA3164490A1 (en) | 2021-06-24 |
WO2021123101A1 (en) | 2021-06-24 |
US20230054567A1 (en) | 2023-02-23 |
EP4078962A1 (en) | 2022-10-26 |
US11973955B2 (en) | 2024-04-30 |
US20240236328A1 (en) | 2024-07-11 |
KR20220110761A (ko) | 2022-08-09 |
CN114788282A (zh) | 2022-07-22 |
AU2020407270A1 (en) | 2022-08-11 |
TW202131682A (zh) | 2021-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11128898B2 (en) | Method, device, and computer program for encapsulating scalable partitioned timed media data | |
US20220007036A1 (en) | Partial Video Decoding Method, Device and System | |
US10291923B2 (en) | Mapping of tile grouping and samples in HEVC and L-HEVC file formats | |
TWI793532B (zh) | 用於圖像/視訊資料串流而允許有效可縮減性或有效隨機存取之技術 | |
US10257247B2 (en) | Method, device, and computer program for encapsulating and parsing timed media data | |
JP6572222B2 (ja) | メディアファイルの生成方法、生成装置、及びプログラム | |
US20160014480A1 (en) | Method, device, and computer program for encapsulating partitioned timed media data | |
GB2539462A (en) | Method, device, and computer program for obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be | |
US20240236328A1 (en) | Video coding in relation to subpictures | |
JP2024038274A (ja) | フレーム部分を有するビデオデータを符号化又は復号する方法及び装置 | |
CN115550722A (zh) | 信令通知画中画区域中的视频数据单元的替换 | |
CN114787921A (zh) | 用于假设参考解码器和用于输出层集的视频数据流、视频编码器、装置和方法 | |
CN115225905A (zh) | 子图片轨道的级别信息 | |
TWI850969B (zh) | 用於圖像/視訊資料串流而允許有效可縮減性或有效隨機存取之技術 | |
CN117296326A (zh) | 用于视频编码和视频解码的方法、装置和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220816 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231213 |