JP2022524783A

JP2022524783A - ビデオコーディングのための方法および装置

Info

Publication number: JP2022524783A
Application number: JP2021553844A
Authority: JP
Inventors: ジャオ，リアン; ジャオ，シン; リ，シアン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2019-03-17
Filing date: 2020-03-17
Publication date: 2022-05-10
Anticipated expiration: 2040-03-17
Also published as: US20200296418A1; US11405638B2; EP3942798A1; EP3942798A4; CN113348664B; CN113348664A; JP7236558B2; WO2020190916A1

Abstract

ビデオデコーダが実行するビデオデコードの方法を提供する。この方法では、コード化されたビデオビットストリームから、現在ブロックの隣接ブロックのコード化された情報を受信する。前記コード化された情報は前記隣接ブロックのイントラ予測情報を含む。前記隣接ブロックのコード化された情報に基づいて、前記現在ブロックのイントラ予測情報を決定する。前記現在ブロックのイントラ予測情報に基づいてイントラ予測方向モードを決定する。前記現在ブロックのイントラ予測方向モードに従って、前記現在ブロックの少なくとも１つのサンプルを再構築する。【選択図】図１

Description

参照による援用
本願は、２０１９年３月１７日に提出された、出願番号が６２／８１９６５２であり、発明の名称が「ＩＭＰＲＯＶＥＤＩＮＴＲＡＭＯＤＥＣＯＤＩＮＧＳＣＨＥＭＥ」である米国仮出願に対して優先権を主張する、２０２０年３月１２日に提出された、出願番号が１６／８１７１３１であり、発明の名称が「ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＶＩＤＥＯＣＯＤＩＮＧ」である米国特許出願に対して優先権を主張する。これらの出願の全ての内容は、参照により本願に組み込むものとする。

本開示は、一般的にビデオコーディングに関する実施形態を記載する。

本明細書で提供される「背景技術」の説明は、本開示の背景を大まかに示すことを目的とする。ここに名を挙げられている発明者の業績は、この背景技術に記載された範囲において、出願時に従来技術として通常見なされえない記載の態様と共に、明示的にも黙示的にも本開示に対する従来技術として認められない。

ビデオコーディングおよびデコードは、動き補償を伴うインターピクチャ予測を使用して実行されることができる。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、１９２０×１０８０輝度サンプルと関連する彩度サンプルの空間寸法を持っている。該一連のピクチャは、例えば毎秒６０ピクチャまたは６０Ｈｚの固定または可変ピクチャレート（非公式には「フレームレート」とも呼ばれる）を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚフレームレートでの１９２０×１０８０輝度サンプル解像度）には、１．５Ｇｂｉｔ／ｓに近い帯域幅が必要となる。このようなビデオを１時間使用するには、６００ＧＢｙｔｅｓを超えた記憶空間が必要である。

ビデオコーディングおよびデコードの１つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶空間の要件を、場合によっては２桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号の間の歪みは、再構築された信号を意図されたアプリケーションに役立てる程度に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ発行アプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能／許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。

ビデオエンコーダおよびデコーダは、例えば、動き補償、変換、量子化、およびエントロピーコーディングを含むいくつかの幅広いカテゴリからの技法を利用することができる。

ビデオコーデック技術は、イントラコーディングとして知られる技法を含み得る。イントラコーディングでは、サンプル値は、予め再構築された参照ピクチャからのサンプルまたは他のデータを参照せずに表される。一部のビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分される。サンプルのすべてのブロックがイントラモードでコード化されると、そのピクチャはイントラピクチャになる可能性がある。イントラピクチャと、独立したデコーダリフレッシュピクチャなどのその派生物とは、デコーダの状態をリセットするために使用できるため、コード化されたビデオビットストリームとビデオセッションの最初のピクチャとして、または静止画像として使用されることができる。イントラブロックのサンプルは変換にさらされることができ、変換係数はエントロピーコーディングの前に量子化されることができる。イントラ予測は、事前変換領域でサンプル値を最小化する技法であり得る。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、エントロピーコーディング後のブロックを表すために所定の量子化ステップサイズで必要なビットが少なくなる。

例えばＭＰＥＧ－２世代コーディング技術から知られているような従来のイントラコーディングは、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、デコード順の先に位置するデータのブロックのエンコード／デコード中に得られた周囲のサンプルデータおよび／またはメタデータからイントラ予測を試みる技法を含む。そのような技法は、以降、「イントラ予測」技法と呼ばれる。少なくともいくつかのケースでは、イントラ予測は、再構築中の現在ピクチャからの参照データのみを使用し、参照ピクチャからの参照データを使用しないことに注意されたい。

イントラ予測はさまざまな形態で存在し得る。そのような技法の２つ以上が所定のビデオコーディング技術に使用できる場合、使用中の技法はイントラ予測モードでコード化されることができる。場合によっては、モードはサブモードやパラメータを有することができ、それらを個別にコード化するか、もしくはモードコードワードに含めることができる。どのコードワードが所定のモード／サブモード／パラメータの組み合わせに使用されるかは、イントラ予測によるコーディング効率ゲインに影響を与える可能性があるので、コードワードをビットストリームに変換するために使用されるエントロピーコーディング技術も影響を与える可能性がある。

イントラ予測の特定のモードはＨ．２６４で提出され、Ｈ．２６５で改良され、さらに共同探索モデル（ＪＥＭ）、多用途ビデオコーディング（ＶＶＣ）、およびベンチマークセット（ＢＭＳ）などのより新しいコーディング技術で改良された。予測子ブロックは、すでに利用可能なサンプルに属する隣接サンプル値を使用して形成されることができる。隣接サンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用中の方向への参照は、ビットストリームでコード化されるか、もしくはそれ自体を予測され得る。

図１を参照し、右下に示されたのは、Ｈ．２６５の３３通りの予測可能な方向（３５個のイントラ予測モードのうちの３３個の角度モードに対応）から知られる９通りの予測方向のサブセットである。矢印が収束する点（１０１）は、予測されているサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、水平軸から４５度の角度での右上の１つまたは複数のサンプルから予測されることを示す。同様に、矢印（１０３）は、サンプル（１０１）が、水平軸から２２．５度の角度での、サンプル（１０１）の左下の１つまたは複数のサンプルから予測されることを示す。

引き続き図１を参照し、左上には、４×４サンプルの正方形ブロック（１０４）（太い破線で示される）が示されている。正方形ブロック（１０４）は、それぞれが、「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、およびＸ次元におけるその位置（例えば、列インデックス）でラベル付けされた１６サンプルを含む。例えば、サンプルＳ２１は、Ｙ次元（上から）における２番目のサンプルかつＸ次元（左から）における１番目のサンプルである。同様に、サンプルＳ４４は、ＹおよびＸ次元の両方においてブロック（１０４）における４番目のサンプルである。ブロックがサイズで４×４サンプルなので、Ｓ４４は、右下にある。さらに、同様な番号付け体系に従う参照サンプルが示されている。参照サンプルは、Ｒ、ブロック（１０４）に対するそのＹ位置（例えば、行インデックス）およびＸ位置（列インデックス）でラベル付けされる。Ｈ．２６４とＨ．２６５の両方で、予測サンプルは再構築中のブロックに隣接している。したがって、負の値を使用する必要がない。

イントラピクチャ予測は、シグナリングされた予測方向で適切の隣接するサンプルから参照サンプル値をコピーすることで機能することができる。例えば、仮に、コード化されたビデオビットストリームは、このブロックについて矢印（１０２）と一致する予測方向（すなわち、サンプルが、水平から４５度の角度での右上の１つまたは複数の予測サンプルから予測される）を示すシグナリングを含むとする。この場合、サンプルＳ４１、Ｓ３２、Ｓ２３、およびＳ１４は同一の参照サンプルＲ０５から予測される。サンプルＳ４４は、参照サンプルＲ０８から予測される。

特定の場合において、複数の参照サンプルの値は、参照サンプルを算出するために、特に方向が４５度で均等に分割されていない場合に、例えば補間によって組み合わせられることができる。

ビデオコーディング技術が発展するにつれて、可能な方向の数は増加した。Ｈ．２６４（２００３年）では、９通りの異なる方向を表すことができた。Ｈ．２６５（２０１３年）で３３通りに増加し、ＪＥＭ／ＶＶＣ／ＢＭＳは開示時に最大６５通りの方向をサポートできる。最も見込みのある方向を識別するための実験が行われ、エントロピーコーディングにおける特定の技法は、数が少ないビットで見込みの高い方向を表すために使用され、見込みの低い方向に対する特定のペナルティを容認する。さらに、方向自体は、隣接する、すでにデコードされたブロックで使用される隣接方向から予測される場合がある。

図２は、経時的な予測方向の増加数を示すために、ＪＥＭによる６５通りのイントラ予測方向を示す概略図（２０１）を示す。

方向を表すコード化されたビデオビットストリームにおけるイントラ予測方向ビットのマッピングは、ビデオコーディング技術ごとに異なる可能性があり、また、例えば、イントラ予測モードへ乃至コードワードへの予測方向の単純な直接マッピングから、最も可能性の高いモードや類似した技法を含む複雑な適応方式までの範囲とすることができる。しかしながら、すべての場合において、他の特定の方向よりも統計的にビデオコンテンツにおいて発生する可能性が低い特定の方向が存在する可能性がある。ビデオ圧縮の目的は冗長性の削減であるため、適切に機能するビデオコーディング技術では、これらの可能性の低い方向は、可能性の高い方向よりも多くのビット数で表される。

本開示の態様は、ビデオエンコード／デコードのための方法および装置を提供する。一部の例では、ビデオデコードのための装置は、受信回路および処理回路を含む。

本開示の一態様によれば、コード化されたビデオビットストリームから、現在ブロックの隣接ブロックのコード化された情報を受信し、前記コード化された情報が前記隣接ブロックのイントラ予測情報を含む。前記隣接ブロックのコード化された情報に基づいて、前記現在ブロックのイントラ予測情報を決定する。前記現在ブロックのイントラ予測情報に基づいてイントラ予測方向モードを決定する。また、前記現在ブロックのイントラ予測方向モードに従って、前記現在ブロックの少なくとも１つのサンプルを再構築する。

一部の実施形態では、前記コード化された情報に基づいて、コンテキストモデルのセットからコンテキストモデルを決定する。前記決定されたコンテキストモデルに従って、前記現在ブロックの隣接ブロックのコード化された情報に基づいて、前記現在ブロックのイントラ予測情報を決定する。

一部の実施形態では、前記コード化された情報は、ＭＰＭフラグ、参照ラインインデックス、イントラサブパーティション（ＩＰＳ）フラグ、イントラ予測モード、またはＭＰＭインデックスを含むことができる。

一部の実施形態では、前記現在ブロックのイントラ予測情報は、最確モード（ＭＰＭ）フラグ、ＭＰＭリストのサイズ、またはＭＰＭインデックスを含むことができる。

一部の実施形態では、前記コンテキストモデルを、前記隣接ブロックの非角度モード数、前記隣接ブロックの角度モード数、前記隣接ブロックのＭＰＭフラグ、前記隣接ブロックのＭＰＭインデックス、および前記隣接ブロックのＩＳＰフラグのうちの少なくとも１つに基づいて決定することができる。

前記隣接ブロックのイントラ予測モードが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第１の整数であってもよい。前記隣接ブロックのイントラ予測モードの１つが角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第２の整数であってもよい。前記第１の整数が前記第２の整数よりも小さくなってもよい。

また、前記隣接ブロックのイントラ予測モードが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第１の整数であってもよい。前記隣接ブロックのイントラ予測モードの１つが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第２の整数であってもよい。前記隣接ブロックのイントラ予測モードがいずれも角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第３の整数であってもよい。前記第１の整数が前記第２の整数よりも小さくなり、前記第２の整数が前記第３の整数よりも小さくなってもよい。

本開示の一態様によれば、ビデオデコーダによって実行されるビデオデコードの方法を提供する。この方法では、コード化されたビデオビットストリームから、現在ブロックおよび前記現在ブロックの隣接ブロックのコード化された情報を受信し、前記コード化された情報が前記現在ブロックおよび前記隣接ブロックのイントラ予測情報を含む。また、前記コード化された情報内の現在ブロックに関連付けられた第１の情報をデコードし、前記第１の情報が、前記現在ブロックの輝度サンプルのイントラ予測モードが選択されたイントラ予測モードに属するか否かを示すものである。また、前記第１の情報は前記現在ブロックの輝度サンプルのイントラ予測モードが前記選択されたイントラ予測モードに属することを示すものであることに対応して、前記コード化された情報内の現在ブロックに関連付けられた第２の情報をデコードする。前記第２の情報は、前記現在ブロックの輝度サンプルの最確モード（ＭＰＭ）が角度モードであるか、または非角度モードであるかを示すものである。

さらに、前記コード化された情報内の現在ブロックに関連付けられた第３の情報がデコードされている。前記第２の情報は前記現在ブロックの輝度サンプルのＭＰＭが前記角度モードであることを示すものであることに対応して、前記第３の情報が前記現在ブロックの輝度サンプルのＭＰＭインデックスを示すものである。前記コード化された情報内の現在ブロックに関連付けられた第４の情報がデコードされている。前記第４の情報は、前記現在ブロックの輝度サンプルのＭＰＭが前記非角度モードであることを示す、前記現在ブロックに関連付けられた第２の情報に対応する、前記現在ブロックのＭＰＭが平面モードであるか、またはＤＣモードであるかを示すものである。

一部の実施形態では、前記現在ブロックに関連付けられた第２の情報をエントロピーコード化するために使用されるコンテキストモデルが、前記隣接ブロックに関連付けられた第１の情報または前記隣接ブロックに関連付けられた第２の情報に基づいて決定される。

一部の実施形態では、前記現在ブロックに関連付けられた第３の情報は、固定長コーディングを使用してコード化される。

本開示の態様はまた、ビデオデコードのためにコンピュータによって実行されると、前記コンピュータにビデオデコードのための方法のいずれか１つまたは組み合わせを実行させる命令を記憶する非一時的なコンピュータ可読媒体を提供する。

開示された主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになる。

イントラ予測モードの例示的なサブセットの概略図である。

例示的なイントラ予測方向の説明図である。

実施形態に係る通信システム（３００）の簡略化されたブロック図の概略図である。

実施形態に係る通信システム（４００）の簡略化されたブロック図の概略図である。

実施形態に係るデコーダの簡略化されたブロック図の概略図である。

実施形態に係るエンコーダの簡略化されたブロック図の概略図である。

別の実施形態に係るエンコーダを示すブロック図である。

別の実施形態に係るデコーダを示すブロック図である。

実施形態に係る３５個のイントラ予測モードを示す図である。

実施形態に係る８７個のイントラ予測モードを示す図である。

実施形態に係る現在コーディングブロックユニットの隣接コーディングブロックユニットの位置を示す図である。

実施形態に係るコーディングブロックユニットに隣接する４本の参照ラインを示す図である。

ブロックの第１の例示的な分割を示す図である。

ブロックの第２の例示的な分割を示す図である。

本開示の一部の実施形態に係るプロセス例の概要を示すフローチャートである。

実施形態に係るコンピュータシステムの概略図である。

図３は、本開示の実施形態による通信システム（３００）の簡略化されたブロック図を示す。通信システム（３００）は、例えばネットワーク（３５０）を介して互いに通信可能な複数の端末装置を含む。例えば、通信システム（３００）は、ネットワーク（３５０）を介して相互接続された第１の対の端末装置（３１０）および（３２０）を含む。図３の例では、第１の対の端末装置（３１０）および（３２０）は、データの単方向送信を実行する。例えば、端末装置（３１０）は、ネットワーク（３５０）を介して他方の端末装置（３２０）へ送信するためにビデオデータ（例えば、端末装置（３１０）によってキャプチャされたビデオピクチャのストリーム）をコード化し得る。エンコードされたビデオデータは、１つ以上のコード化されたビデオビットストリームの形で送信されることができる。端末装置（３２０）は、ネットワーク（３５０）からコーディングビデオデータを受信し、コーディングビデオデータをデコードしてビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。

別の例では、通信システム（３００）は、例えば、ビデオ会議中に発生し得るコーディングビデオデータの双方向送信を実行する第２の対の端末装置（３３０）および（３４０）を含む。データの双方向送信の場合、一例では、端末装置（３３０）および（３４０）のそれぞれは、ネットワーク（３５０）を介して端末装置（３３０）および（３４０）のうちの他方の端末装置へ送信するためにビデオデータ（例えば、端末装置によってキャプチャされたビデオピクチャのストリーム）をコード化し得る。端末装置（３３０）および（３４０）の一方は、端末装置（３３０）および（３４０）のうちの他方の端末装置で送信されたコーディングビデオデータを受信することができ、コーディングビデオデータをデコードしてビデオピクチャを復元することができ、復元されたビデオデータに従ってビデオピクチャをアクセス可能な表示装置に表示することができる。

図３の例では、端末装置（３１０）、（３２０）、（３３０）および（３４０）は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、および／または専用のビデオ会議機器などにおける用途を見出す。ネットワーク（３５０）は、例えば有線および／または無線通信ネットワークを含む、端末装置（３１０）、（３２０）、（３３０）および（３４０）間でコーディングビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（３５０）は、回線交換および／またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび／またはインターネットを含む。本議論の目的のために、ネットワーク（３５０）のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要でないかもしれない。

図４は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示す。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、および、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。

ストリーミングシステムは、例えば非圧縮のビデオピクチャ（４０２）のストリームを作成するデジタルカメラなどのビデオソース（４０１）を含むことができるキャプチャサブシステム（４１３）を含んでもよい。一例では、ビデオピクチャ（４０２）のストリームは、デジタルカメラによって取得されたサンプルを含む。エンコードされたビデオデータ（４０４）（またはコード化されたビデオビットストリーム）と比較して高データ量を強調するために太線で示されたビデオピクチャ（４０２）のストリームは、ビデオソース（４０１）に結合されたビデオエンコーダ（４０３）を含む電子デバイス（４２０）によって処理されることができる。ビデオエンコーダ（４０３）は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか或いは実施するためのハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ビデオピクチャ（４０２）のストリームと比較してより低いデータ量を強調するために細い線で示された、エンコードされたビデオデータ（４０４）（またはエンコードされたビデオビットストリーム（４０４））は、将来使うためにストリーミングサーバ（４０５）に記憶されることができる。図４のクライアントサブシステム（４０６）および（４０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（４０５）にアクセスして、エンコードされたビデオデータ（４０４）のコピー（４０７）および（４０９）を検索することができる。クライアントサブシステム（４０６）は、例えば、電子デバイス（４３０）におけるビデオデコーダ（４１０）を含むことができる。ビデオデコーダ（４１０）は、エンコードされたビデオデータの入り方向コピー（４０７）をデコードし、ディスプレイ（４１２）（例えば、表示画面）または他のレンダリングデバイス（描画せず）でレンダリングできるビデオピクチャ（４１１）の出方向ストリームを作成する。一部のストリーミングシステムにおいて、エンコードされたビデオデータ（４０４）、（４０７）、および（４０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮規格に従ってエンコードされることができる。これらの規格の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、発展中のビデオコーディング規格は、非公式的にヴァーサトゥルビデオコーディングまたはＶＶＣとして知られている。開示された主題は、ＶＶＣの文脈に使用され得る。

なお、電子デバイス（４２０）および（４３０）は、他の構成要素（図示せず）を含むことができる。例えば、電子デバイス（４２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（４３０）は、ビデオエンコーダ（図示せず）を含むこともできる。

図５は、本開示の実施形態によるビデオデコーダ（５１０）のブロック図を示す。ビデオデコーダ（５１０）は、電子デバイス（５３０）に含まれることができる。電子デバイス（５３０）は、受信機（５３１）（例えば、受信回路）を含むことができる。ビデオデコーダ（５１０）は、図４の例におけるビデオデコーダ（４１０）の代わりに使用されることができる。

受信機（５３１）は、ビデオデコーダ（５１０）によってデコードされる１つ以上のコーディングビデオシーケンスを受信することができ、同一または別の実施形態では、一度に１つのコーディングビデオシーケンスを受信してもよく、各コーディングビデオシーケンスのデコードは、他のコーディングビデオシーケンスから独立している。コーディングビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得るチャネル（５０１）から受信されることができる。受信機（５３１）は、それぞれの使用エンティティ（描画せず）に転送され得る他のデータ、例えば、コーディングオーディオデータおよび／または補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機（５３１）は、コーディングビデオシーケンスを他のデータから分離することができる。ネットワークジッタを防止するために、バッファメモリ（５１５）は、受信機（５３１）とエントロピーデコーダ／パーサ（５２０）（以降、「パーサ（５２０）」）の間に結合されてもよい。特定のアプリケーションでは、バッファメモリ（５１５）は、ビデオデコーダ（５１０）の一部である。他の場合、バッファメモリ（５１５）は、ビデオデコーダ（５１０）（描画せず）の外部に存在し得る。さらに他の場合、例えば、ネットワークジッタを防止するためにビデオデコーダ（５１０）の外部にバッファメモリ（描画せず）が存在し、さらに、例えば、再生タイミングを取り扱うためにビデオデコーダ（５１０）の内部に別のバッファメモリ（５１５）が存在し得る。受信機（５３１）が十分な帯域幅および可制御性を有する記憶／転送装置から、または等同期ネットワークからデータを受信する際に、バッファメモリ（５１５）は必要とされないことがあり、または小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、バッファメモリ（５１５）が必要になる場合があり、バッファメモリ（５１５）は、比較的大きいことがあり、有利には適応サイズであることができ、ビデオデコーダ（５１０）の外部のオペレーティングシステムまたは類似の要素（描画せず）に少なくとも部分的に実施され得る。

ビデオデコーダ（５１０）は、コーディングビデオシーケンスからシンボル（５２１）を再構築するパーサ（５２０）を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ（５１０）の操作を管理するために使用される情報を含んで、および、電子デバイス（５３０）の不可欠な部分ではないが、図５に示されるように電子デバイス（５３０）に結合され得るレンダリングデバイス（５１２）（例えば、表示画面）のようなレンダリングデバイスを制御する情報を潜在的に含む。レンダリングデバイスのための制御情報は、補助強化情報（ＳＥＩメッセージ）またはビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（描画せず）の形態であってよい。パーサ（５２０）は、受信されたコーディングビデオシーケンスを構文解析／エントロピーデコードすることができる。コーディングビデオシーケンスのコーディングは、ビデオコーディング技術または規格に合わせることができ、可変長コーディング、ハフマンコーディング、文脈感受性を有するもしくは有さない算術コーディングなどを含む様々な原理に従うことができる。パーサ（５２０）は、グループに対応する少なくとも１つのパラメータに基づいて、コーディングビデオシーケンスからビデオデコーダ内の画素の少なくとも１つのサブグループのためのサブグループパラメータのセットを抽出することができる。サブグループは、ピクチャ群（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。パーサ（５２０）は、コーディングビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。

パーサ（５２０）は、シンボル（５２１）を作成するために、バッファメモリ（５１５）から受信されたビデオシーケンスに対してエントロピーデコード／構文解析操作を実行することができる。

シンボル（５２１）の再構築は、コーディングビデオピクチャまたはその一部のタイプ（例えば、インターおよびイントラピクチャ、インターおよびイントラブロック）、および他の要因に応じて、複数の異なるユニットが関与することができる。どのユニットが、どのように関与するかは、パーサ（５２０）によってコーディングビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（５２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。

すでに述べた機能ブロックに加え、ビデオデコーダ（５１０）は、以下で説明されるようにいくつかの機能ユニットに概念的に細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数をシンボル（５２１）としてパーサ（５２０）から受信する。スケーラ／逆変換ユニット（５５１）は、アグリゲータ（５５５）に入力可能なサンプル値を含むブロックを出力することができる。

場合によっては、スケーラ／逆変換（５５１）の出力サンプルは、イントラコーディングブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係することがある。このような予測情報は、イントラピクチャ予測ユニット（５５２）によって提供されることができる。場合によっては、イントラピクチャ予測ユニット（５５２）は、現在ピクチャバッファ（５５８）から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。現在ピクチャバッファ（５５８）は、例えば、一部再構築された現在ピクチャおよび／または完全に再構築された現在ピクチャをバッファリングする。アグリゲータ（５５５）は、場合によっては、サンプルごとに、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供される出力サンプル情報に追加する。

他の場合では、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコード化された、潜在的に動き補償されたブロックに関係することがある。このような場合、動き補償予測ユニット（５５３）は、参照ピクチャメモリ（５５７）にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル（５２１）に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ（５５５）によってスケーラ／逆変換ユニット（５５１）の出力に追加されることができる（この場合、残差サンプルまたは残差信号と呼ばれる）。動き補償予測ユニット（５５３）が予測サンプルを取り出す参照ピクチャメモリ（５５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照ピクチャ成分を有し得るシンボル（５２１）の形態で動き補償予測ユニット（５５３）に利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリ（５５７）から取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。

アグリゲータ（５５５）の出力サンプルは、ループフィルタユニット（５５６）において様々なループフィルタリング技法を受けられる。ビデオ圧縮技術は、コーディングビデオシーケンス（コード化されたビデオビットストリームとも呼ばれる）に含まれる、パーサ（５２０）からのシンボル（５２１）としてループフィルタユニット（５５６）に利用可能とされたパラメータによって制御されることができ、それに、コーディングピクチャまたはコーディングビデオシーケンスの（デコード順で）前の部分のデコード中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできるループ内フィルタ技術を含むことができる。

ループフィルタユニット（５５６）の出力は、レンダリングデバイス（５１２）へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ（５５７）に記憶されることができるサンプルストリームであり得る。

特定のコーディングピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。例えば、現在ピクチャに対応するコーディングピクチャが完全に再構築され、コーディングピクチャが（例えば、パーサ（５２０）によって）参照ピクチャとして識別されると、現在ピクチャバッファ（５５８）は、参照ピクチャメモリ（５５７）の一部になることができ、次のコーディングピクチャの再構築を開始する前に新しい現在ピクチャバッファを再割当てすることができる。

ビデオデコーダ（５１０）は、ＩＴＵ－Ｔ推奨のＨ．２６５のような規格での所定のビデオ圧縮技術に従ってデコード操作を実行することができる。コーディングビデオシーケンスが、ビデオ圧縮技術または規格のシンタックスと、ビデオ圧縮技術または規格で文書化されたプロファイルとの両方に準拠しているという意味で、コーディングビデオシーケンスは、使用されているビデオ圧縮技術または規格によって指定されるシンタックスに準拠し得る。具体的には、プロファイルは、ビデオ圧縮技術または規格で使用可能なすべてのツールから、特定のツールをそのプロファイルで使用できるツールとして選択することができる。コーディングビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート（例えば、１秒あたりのメガサンプルで測定される）、最大参照ピクチャサイズなどがレベルによって制限される。レベルによって設定された制限は、場合によっては、仮想参照デコーダ（ＨＲＤ）仕様およびコーディングビデオシーケンスでシグナリングされたＨＲＤバッファ管理のためのメタデータによってさらに制限され得る。

一実施形態では、受信機（５３１）は、エンコードされたビデオとともに追加の（冗長な）データを受信することができる。追加のデータは、コーディングビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、および／または、元のビデオデータをより正確に再構築するためにビデオデコーダ（５１０）によって使用され得る。追加のデータは、例えば、時間的、空間的、または信号対雑音比（ＳＮＲ）エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。

図６は、本開示の実施形態によるビデオエンコーダ（６０３）のブロック図を示す。ビデオエンコーダ（６０３）は、電子デバイス（６２０）に含まれる。電子デバイス（６２０）は、送信機（６４０）（例えば、送信回路）を含む。図４の例におけるビデオエンコーダ（４０３）の代わりにビデオエンコーダ（６０３）を使用することができる。

ビデオエンコーダ（６０３）は、ビデオエンコーダ（６０３）によってコード化されるビデオ画像をキャプチャし得るビデオソース（６０１）（図６の例では電子デバイス（６２０）の一部ではない）からビデオサンプルを受信することができる。別の例では、ビデオソース（６０１）は、電子デバイス（６２０）の一部である。

ビデオソース（６０１）は、ビデオエンコーダ（６０３）によってコード化されるソースビデオシーケンスを、任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビット、・・・）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、・・・）および任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース（６０１）は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース（６０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて１つ以上のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明ではサンプルを中心に説明する。

一実施形態によれば、ビデオエンコーダ（６０３）は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャをコード化し、コーディングビデオシーケンス（６４３）に圧縮することができる。適切なコーディング速度を実施することは、コントローラ（６５０）の機能の１つである。一部の実施形態では、コントローラ（６５０）は、以下で説明される他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。分かりやすくするために、カップリングは示されていない。コントローラ（６５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化、レート歪み最適化技法のラムダ値、・・・）、ピクチャサイズ、ピクチャ群（ＧＯＰ）レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ（６５０）は、特定のシステム設計に対して最適化されたビデオエンコーダ（６０３）に関する他の適切な機能を有するように構成されることができる。

一部の実施形態では、ビデオエンコーダ（６０３）は、コーディングループで動作するように構成される。過度に簡略化した説明として、一例では、コーディングループは、ソースコーダ（６３０）（例えば、コーディング対象となる入力ピクチャおよび参照ピクチャに基づくシンボルストリームなどのシンボルの作成を担当する）、およびビデオエンコーダ（６０３）に埋め込まれた（ローカル）デコーダ（６３３）を含むことができる。デコーダ（６３３）は、シンボルを再構築して、（リモート）デコーダが作成するのと同様な方法でサンプルデータを作成する（シンボルとコード化されたビデオビットストリーム間の如何なる圧縮は、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである）。再構築されたサンプルストリーム（サンプルデータ）は参照ピクチャメモリ（６３４）に入力される。シンボルストリームのデコードにより、デコーダの位置（ローカルまたはリモート）に関係なくビット正確な結果が得られるため、参照ピクチャメモリ（６３４）のコンテンツもローカルエンコーダとリモートエンコーダの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性の該基本原理（および例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト）は、いくつかの関連分野にも使用されている。

「ローカル」デコーダ（６３３）の動作は、前文で図５に関連して既に詳細に説明された、ビデオデコーダ（５１０）などの「リモート」デコーダの動作と同様であり得る。しかしながら、図５も簡単に参照し、シンボルが使用可能であり、エントロピーコーダ（６４５）およびパーサ（５２０）によるコーディングビデオシーケンスへのシンボルのコーディング／デコードは可逆であり得るので、バッファメモリ（５１５）、およびパーサ（５２０）を含むビデオデコーダ（５１０）のエントロピーデコード部分は、ローカルデコーダ（６３３）では完全に実施されない場合がある。

これで分かるように、デコーダに存在する構文解析／エントロピーデコード以外の如何なるデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で必ず存在する必要がある。このため、開示された主題は、デコーダ操作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。

操作中、一部の例では、ソースコーダ（６３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の予めコード化されたピクチャを参照して入力ピクチャを予測的にコード化する動き補償予測コーディングを実行してもよい。このようにして、コーディングエンジン（６３２）は、入力ピクチャの画素ブロックと、入力ピクチャへの予測基準として選択され得る参照ピクチャの画素ブロックとの差異をコード化する。

ローカルビデオデコーダ（６３３）は、ソースコーダ（６３０）で作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコーディングビデオデータをデコードすることができる。コーディングエンジン（６３２）の操作は、有利には非可逆プロセスであり得る。コーディングビデオデータがビデオデコーダ（図６に示されていない）でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ（６３３）は、ビデオデコーダによって参照ピクチャに対して実行され得るデコードプロセスを再現し、再構築された参照ピクチャを参照ピクチャキャッシュ（６３４）に記憶させることができる。このようにして、ビデオエンコーダ（６０３）は、遠端ビデオデコーダによって取得される再構築された参照ピクチャと共通するコンテンツ（送信エラー無し）を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。

予測器（６３５）は、コーディングエンジン（６３２）の予測検索を実行することができる。つまり、コーディング対象となる新しいピクチャについて、予測器（６３５）は、（候補の参照画素ブロックとしての）サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ（６３４）で検索することができる。予測器（６３５）は、適切な予測基準を見つけるために、サンプルブロック／画素ブロックごとに操作することができる。場合によっては、予測器（６３５）で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（６３４）に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。

コントローラ（６５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング操作を管理することができる。

前述のすべての機能ユニットの出力は、エントロピーコーダ（６４５）においてエントロピーコーディングを受けられる。エントロピーコーダ（６４５）は、例えば、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従ってシンボルを可逆圧縮することにより、様々な機能ユニットによって生成されたシンボルをコーディングビデオシーケンスに変換する。

送信機（６４０）は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得る通信チャネル（６６０）を介した送信の準備のために、エントロピーコーダ（６４５）によって作成されたコーディングビデオシーケンスをバッファリングすることができる。送信機（６４０）は、ビデオコーダ（６０３）からのコーディングビデオデータを、送信されるべき他のデータ、例えば、コーディングオーディオデータおよび／または補助データストリーム（ソースは示されていない）とマージすることができる。

コントローラ（６５０）は、ビデオエンコーダ（６０３）の操作を管理し得る。コーディング中、コントローラ（６５０）は、各コーディングピクチャに特定のコーディングピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得るコーディング技法に影響を及ぼし得る。例えば、ピクチャは、多くの場合、次のピクチャタイプのいずれかとして割り当てられ得る。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の他のいかなるピクチャを使用せずにコーディングおよびデコードされ得るものであり得る。一部のビデオコーデックは、例えば、インディペンデントデコーダリフレッシュ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ、「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャの変形およびそれらのそれぞれの用途および特徴を知っている。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために最大１つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測によりコーディングおよびデコードされ得るものであり得る。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測によりコーディングおよびデコードされ得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために２つを超えた参照ピクチャおよび関連メタデータを使用することができる。

ソースピクチャは、一般に、複数のサンプルブロック（例えば、それぞれ、４×４、８×８、４×８、または１６×１６サンプルのブロック）に空間的に細分され、ブロックごとにコーディングされ得る。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てによって決定された他の（既にコード化された）ブロックを参照して予測的にコーディングされ得る。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてもよく、或いは、同一のピクチャの既にコード化されたブロック（空間予測またはイントラ予測）を参照して予測的にコーディングされてもよい。Ｐピクチャの画素ブロックは、１つの予めコード化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的にコーディングされ得る。Ｂピクチャのブロックは、１つまたは２つの予めコード化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的にコーディングされ得る。

ビデオエンコーダ（６０３）は、ＩＴＵ－Ｔ推奨のＨ．２６５などの予め設定されたビデオコーディング技術または規格に従って、コーディング操作を実行することができる。操作中、ビデオエンコーダ（６０３）は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測コーディング操作を含む、様々な圧縮操作を実行することができる。したがって、コーディングビデオデータは、使用されるビデオコーディング技術または規格によって指定されたシンタックスに準拠する場合がある。

一実施形態では、送信機（６４０）は、エンコードされたビデオとともに追加のデータを送信することができる。ソースコーダ（６３０）は、このようなデータをコーディングビデオシーケンスの一部として含み得る。追加のデータは、時間的／空間的／ＳＮＲエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含み得る。

ビデオは、時系列で複数のソースピクチャ（ビデオピクチャ）としてキャプチャされ得る。イントラピクチャ予測（「イントラ予測」と略されることが多い）は、所定のピクチャにおける空間相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的または他の）相関を利用する。一例では、現在ピクチャと呼ばれるエンコード／デコード中の特定のピクチャは、ブロックに分割される。現在ピクチャにおけるブロックが、ビデオにおける予めコーディングされ、まだバッファリングされている参照ピクチャの参照ブロックに類似している場合、現在ピクチャにおけるブロックは、動きベクトルと呼ばれるベクトルによってコード化されることができる。動きベクトルは、参照ピクチャの参照ブロックを指し、複数の参照ピクチャが使用されている場合、参照ピクチャを識別する第３次元を有することができる。

一部の実施形態では、インターピクチャ予測において双予測法を使用することができる。双予測法によれば、ビデオにおける現在ピクチャよりもデコード順序がそれぞれ前である（ただし、表示順序でそれぞれ過去および未来にあり得る）第１の参照ピクチャおよび第２の参照ピクチャのような２つの参照ピクチャを使用する。現在ピクチャ内のブロックは、第１の参照ピクチャ内の第１の参照ブロックを指す第１の動きベクトル、および第２の参照ピクチャ内の第２の参照ブロックを指す第２の動きベクトルによってコード化されることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

さらに、マージモード技法をインターピクチャ予測に適用して、コーディング効率を向上させることができる。

本開示の一部の実施形態によれば、インターピクチャ予測およびイントラピクチャ予測などの予測は、ブロック単位で実行される。例えば、ＨＥＶＣ規格によれば、一連のビデオピクチャ内のピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ）に分割され、ピクチャ内のＣＴＵは、６４×６４画素、３２×３２画素、または１６×１６画素など、同一のサイズを有する。一般に、ＣＴＵは、１つの輝度ＣＴＢと２つの彩度ＣＴＢである３つのコーディングツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つまたは複数のコーディングユニット（ＣＵ）に再帰的に四分木分割されることができる。例えば、６４×６４画素のＣＴＵは、１つの６４×６４画素のＣＵ、４つの３２×３２画素のＣＵ、または１６個の１６×１６画素のＣＵに分割されることができる。一例では、各ＣＵを解析して、インター予測タイプまたはイントラ予測タイプなど、ＣＵの予測タイプを決定する。ＣＵは、時間的および／または空間的予測可能性に応じて、１つ以上の予測ユニット（ＰＵ）に分割される。通常、各ＰＵは、１つの輝度予測ブロック（ＰＢ）と２つの彩度ＰＢを含む。一実施形態では、コーディング（エンコード／デコード）における予測操作は、予測ブロックの単位で実行される。輝度予測ブロックを予測ブロックの例として用いて、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素などの画素の値（例えば、輝度値）の行列を含む。

図７は、本開示の別の実施形態によるビデオエンコーダ（７０３）の図を示す。ビデオエンコーダ（７０３）は、一連のビデオピクチャ内の現在ビデオピクチャにおけるサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックを、コーディングビデオシーケンスの一部であるコーディングピクチャにエンコードするように構成される。一例では、図４の例におけるビデオエンコーダ（４０３）の代わりにビデオエンコーダ（７０３）を使用する。

ＨＥＶＣの例では、ビデオエンコーダ（７０３）は、８×８サンプルのような予測ブロックなどの処理ブロックのサンプル値の行列を受信する。ビデオエンコーダ（７０３）は、例えばレート歪み最適化を用いて、処理ブロックをイントラモード、インターモード、または双予測モードにより最も良くコード化するか否かを決定する。処理ブロックがイントラモードでコーディングされようとする場合、ビデオエンコーダ（７０３）は、イントラ予測法を用いて処理ブロックをコーディングピクチャにエンコードすることができる。また、処理ブロックがインターモードまたは双予測モードでコーディングされようとする場合、ビデオエンコーダ（７０３）は、それぞれインター予測または双予測法を用いて、処理ブロックをコーディングピクチャにエンコードすることができる。特定のビデオコーディング技術では、マージモードは、予測子外のコーディング動きベクトル成分の利便を介することなく、１つ以上の動きベクトル予測子から動きベクトルを導出するインターピクチャ予測サブモードであり得る。特定の他のビデオコーディング技術では、対象ブロックに適用可能な動きベクトル成分が存在し得る。一例では、ビデオエンコーダ（７０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）などの他の構成要素を含む。

図７の例では、ビデオエンコーダ（７０３）は、図７に示すように互いに結合されたインターエンコーダ（７３０）、イントラエンコーダ（７２２）、残差算出部（７２３）、スイッチ（７２６）、残差エンコーダ（７２４）、統括制御部（７２１）およびエントロピーエンコーダ（７２５）を含む。

インターエンコーダ（７３０）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、該ブロックを参照ピクチャ内の１つ以上の参照ブロック（例えば、前のピクチャおよび後のピクチャ内のブロック）と比較し、インター予測情報（例えば、インターエンコード法による冗長情報の記述、動きベクトル、マージモード情報）を生成し、インター予測情報に基づいて任意の適切な技法を用いてインター予測結果（例えば、予測ブロック）を算出するように構成される。一部の例では、参照ピクチャは、エンコードされたビデオ情報に基づいてデコードされたデコード参照ピクチャである。

イントラエンコーダ（７２２）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、場合によっては該ブロックを同一のピクチャで既にコード化されたブロックと比較し、量子化された変換後係数を生成し、場合によってはイントラ予測情報（例えば、１つ以上のイントラエンコード法によるイントラ予測方向情報）をも生成するように構成される。一例では、イントラエンコーダ（７２２）は、イントラ予測情報および同一のピクチャ内の参照ブロックに基づいてイントラ予測結果（例えば、予測ブロック）も算出する。

統括制御部（７２１）は、統括制御データを決定し、統括制御データに基づいてビデオエンコーダ（７０３）の他の構成要素を制御するように構成される。一例では、統括制御部（７２１）は、ブロックのモードを決定し、モードに基づいて制御信号をスイッチ（７２６）に提供する。例えば、モードがイントラモードである場合、統括制御部（７２１）は、残差算出部（７２３）が使用するためのイントラモード結果を選択するようにスイッチ（７２６）を制御するとともに、イントラ予測情報を選択してイントラ予測情報をビットストリームに含ませるようにエントロピーエンコーダ（７２５）を制御する。また、モードがインターモードである場合、統括制御部（７２１）は、残差算出部（７２３）が使用するためのインター予測結果を選択するようにスイッチ（７２６）を制御するとともに、インター予測情報を選択してインター予測情報をビットストリームに含ませるようにエントロピーエンコーダ（７２５）を制御する。

残差算出部（７２３）は、受信されたブロックとイントラエンコーダ（７２２）またはインターエンコーダ（７３０）から選択された予測結果との差（残差データ）を算出するように構成される。残差エンコーダ（７２４）は、残差データに基づいて動作し、残差データをエンコードして変換係数を生成するように構成される。一例では、残差エンコーダ（７２４）は、残差データを空間領域から周波数領域へと変換し、変換係数を生成するように構成される。その後、変換係数は量子化処理を受けて、量子化された変換係数が得られる。様々な実施形態では、ビデオエンコーダ（７０３）は、残差デコーダ（７２８）をも含む。残差デコーダ（７２８）は、逆変換を実行し、デコード残差データを生成するように構成される。デコード残差データは、イントラエンコーダ（７２２）およびインターエンコーダ（７３０）によって適切に使用されることができる。例えば、インターエンコーダ（７３０）は、デコード残差データよびインター予測情報に基づいて、デコードブロックを生成することができ、イントラエンコーダ（７２２）は、デコード残差データおよびイントラ予測情報に基づいて、デコードブロックを生成することができる。一部の例では、デコードブロックは、デコードピクチャを生成するように適切に処理され、デコードピクチャは、メモリ回路（図示せず）にバッファリングされ、参照ピクチャとして使用されることができる。

エントロピーエンコーダ（７２５）は、エンコードブロックを含めるようにビットストリームをフォーマットするように構成される。エントロピーエンコーダ（７２５）は、ＨＥＶＣ規格などの適切な規格に従って様々な情報をビットストリームに含ませるように構成される。一例では、エントロピーエンコーダ（７２５）は、統括制御データ、選択された予測情報（例えば、イントラ予測情報またはインター予測情報）、残差情報、および他の適切な情報をビットストリームに含ませるように構成される。開示された主題によれば、インターモードまたは双予測モードのマージサブモードでブロックをコード化する場合、残差情報はないことに留意されたい。

図８は、本開示の別の実施形態によるビデオデコーダ（８１０）の図を示す。ビデオデコーダ（８１０）は、コーディングビデオシーケンスの一部であるコーディングピクチャを受信し、コーディングピクチャをデコードして、再構築ピクチャを生成するように構成される。一例では、図４の例におけるビデオデコーダ（４１０）の代わりにビデオデコーダ（８１０）を使用する。

図８の例では、ビデオデコーダ（８１０）は、図８に示されるように互いに結合されたエントロピーデコーダ（８７１）、インターデコーダ（８８０）、残差デコーダ（８７３）、再構築モジュール（８７４）、およびイントラデコーダ（８７２）を含む。

エントロピーデコーダ（８７１）は、コーディングピクチャから、コーディングピクチャを構成するシンタックス要素を表す特定のシンボルを再構築するように構成されることができる。このようなシンボルは、例えば、ブロックがコード化されるモード（例えば、イントラモード、インターモード、双予測モード、後の２つのマージサブモードまたは別のサブモード）、それぞれイントラデコーダ（８７２）またはインターデコーダ（８８０）による予測に使用される特定のサンプルまたはメタデータを識別できる予測情報（例えば、イントラ予測情報またはインター予測情報）、例えば、量子化された変換係数の形態での残差情報などを含むことができる。一例では、予測モードがインターまたは双予測モードであれば、インター予測情報は、インターデコーダ（８８０）に提供される。また、予測タイプがイントラ予測タイプであれば、イントラ予測情報は、イントラデコーダ（８７２）に提供される。残差情報は、逆量子化を施されることができ、残差デコーダ（８７３）に提供される。

インターデコーダ（８８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

イントラデコーダ（８７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

残差デコーダ（８７３）は、逆量子化を実行することで、逆量子化された変換係数を抽出し、逆量子化された変換係数を処理して残差を周波数領域から空間領域に変換するように構成される。残差デコーダ（８７３）は、（量子化器パラメータ（ＱＰ）を含めるように）特定の制御情報をも必要とする場合があり、この情報は、エントロピーデコーダ（８７１）によって提供されてもよい（データパスは、低ボリューム制御情報のみであり得るため、示されていない）。

再構築モジュール（８７４）は、空間領域において、残差デコーダ（８７３）によって出力された残差と、（場合によってはインターまたはイントラ予測モジュールによって出力される）予測結果とを組み合わせて、再構築ビデオの一部となり得る再構築ピクチャの一部であり得る再構築ブロックを形成するように構成される。なお、視覚的品質を改善するために、デブロッキング操作などの他の適切な操作を実行することができる。

なお、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、任意の適切な技法を用いて実施されることができる。一実施形態では、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、１つ以上の集積回路を用いて実施されることができる。別の実施形態では、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、ソフトウェア命令を実行する１つ以上のプロセッサを用いて実施されることができる。

本開示は、改良されたイントラモードコーディング方式を含む、高度なビデオコーディング技術のセットを対象としている。

例えば、ＨＥＶＣで使用されるように、合計３５個のイントラ予測モードが図９に示されている。３５個のイントラ予測モードのうち、モード１０は水平モードであり、モード２６は垂直モードである。モード２、１８、および３４は対角モードである。３５個のイントラ予測モードは、３つの最確モード（ＭＰＭ）と残りの３２個のモードによってシグナリングすることができる。

例えば、ＶＶＣで使用されるように、合計９５個のイントラ予測モードが図１０に示されている。モード１８は水平モードであり、モード５０は垂直モードである。モード２、３４、および６６は、対角モードである。モード－１～－１４およびモード６７～８０は、広角イントラ予測（ＷＡＩＰ）モードと呼ぶことができる。

サイズ３のＭＰＭリストは、例えば、ＨＥＶＣにおいて、現在ブロックの隣接ブロックのイントラ予測モードに基づいて生成することができる。このＭＰＭリストは、一次ＭＰＭリストとも呼ばれる。現在ブロックのイントラ予測モードがＭＰＭリストからのものではない場合、フラグ、例えば、ＭＰＭフラグは、現在ブロックのイントラ予測モードが選択されたモード、例えば、ＭＰＭリスト内のイントラ予測モードとは異なる他の候補イントラ予測モードに属するか否かを示すためにシグナリングすることができる。

ＭＰＭリスト生成プロセスの例は、以下のシンタックス要素に示されている。

If (leftIntraDir == aboveIntraDir && leftIntraDir > DC_IDX)

MPM [0] = leftIntraDir;

MPM [1] = ((leftIntraDir + offset) % mod) + 2;

MPM [2] = ((leftIntraDir - 1) % mod) + 2;

Else if (leftIntraDir == aboveIntraDir)

MPM [0] = PLANAR_IDX;

MPM [1] = DC_IDX;

MPM [2] = VER_IDX;

Else if (leftIntraDir != aboveIntraDir)

MPM [0] = leftIntraDir;

MPM [1] = aboveIntraDir;

If (leftIntraDir > 0 && aboveIntraDir > 0)

MPM [2] = PLANAR_IDX;

Else

MPM [2] = (leftIntraDir + aboveIntraDir) < 2 ?VER_IDX :DC_IDX;
上記のシンタックス要素の例では、ｌｅｆｔＩｎｔｒａＤｉｒを使用して、現在ブロックの左の隣接ブロック（「左ブロック」）のモードを示し、ａｂｏｖｅＩｎｔｒａＤｉｒを使用して、現在ブロックの上の隣接ブロック（「上ブロック」）のモードを示す。左ブロックまたは上のブロックが現在利用不可である場合、ｌｅｆｔＩｎｔｒａＤｉｒまたはａｂｏｖｅＩｎｔｒａＤｉｒをイントラＤＣモードのインデックス（ＤＣ＿ＩＤＸなど）に設定することができる。また、変数「ｏｆｆｓｅｔ」と「ｍｏｄ」は定数値であり、一例ではそれぞれ２９と３２に設定することができる。

ＭＰＭリストのサイズは、例えばＶＶＣテストモデル３（ＶＴＭ３）のように、隣接する参照ライン（ゼロ参照ラインとも呼ばれる）および隣接しない参照ライン（非ゼロ参照ラインとも呼ばれる）の両方において６に設定することができる。６つのＭＰＭ候補を導出するために使用される隣接モードの位置はまた、例えば図１１に示されるように、隣接する参照ラインおよび隣接しない参照ラインについて同じであり得る。図１１に示されるように、ブロックＡおよびブロックＢは、現在コーディングユニット１１００の例示的な上および左の隣接コーディングユニットを示す。変数ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡおよびｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢは、それぞれブロックＡおよびＢに関連付けられたイントラ予測モードを示す。また、ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡおよびｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢは、最初にＩＮＴＲＡ＿ＰＬＡＮＡＲに等しく設定することができる。ブロックＡ（またはＢ）が使用可能としてマークされる場合、ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡ（またはｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢ）は、ブロックＡ（またはＢ）の実際のイントラ予測モードに等しく設定される。

現在コーディングユニット１１００のＭＰＭ候補導出プロセス（またはＭＰＭリスト導出プロセス）は、現在コーディングユニット１１００の隣接する参照ライン（またはゼロ参照ライン）と隣接しない参照ライン（または非ゼロ参照ライン）との間で異なることができる。ゼロ参照ラインについて、隣接モードが両方とも平面モードまたはＤＣモードである場合、デフォルトモードを使用してＭＰＭリストを構築することができる。デフォルトモードの２つは平面モードとＤＣモードであり得、残りの４つのモードは角度モード（角度デフォルトモードとも呼ばれる）であり得る。非ゼロ参照ラインについて、隣接モードが両方とも平面モードまたはＤＣモードである場合、６つの角度デフォルトモードを使用してＭＰＭリストを構築することができる。例示的なＭＰＭリスト導出プロセスを以下のシンタックス要素に示す。以下のシンタックス要素において、ｘ＝０．．５のｃａｎｄＭｏｄｅＬｉｓｔ［ｘ］は６つのＭＰＭ候補を示し、ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］は予測されるブロック（または現在コーディングユニット）の参照ラインインデックスを示し、ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］は、０、１、または３にすることができる。
ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢがｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡに等しく、かつｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡがＩＮＴＲＡ＿ＤＣよりも大きい場合、ｘ＝０．．５のｃａｎｄＭｏｄｅＬｉｓｔ［ｘ］は以下のように導出される。
ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０である場合、以下が適用される。

candModeList[ 0 ] = candIntraPredModeA

candModeList[ 1 ] = INTRA_PLANAR

candModeList[ 2 ] = INTRA_DC

candModeList[ 3 ] =
2 + ( ( candIntraPredModeA + 61 ) % 64 )

candModeList[ 4 ] =
2 + ( ( candIntraPredModeA - 1 ) % 64 )

candModeList[ 5 ] =
2 + ( ( candIntraPredModeA + 60 )
% 64 )
そうでない場合（ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０ではない場合）、以下が適用される。

candModeList[ 0 ] = candIntraPredModeA

candModeList[ 1 ] =
2 + ( ( candIntraPredModeA + 61 ) % 64 )

candModeList[ 2 ] =
2 + ( ( candIntraPredModeA - 1 ) % 64 )

candModeList[ 3 ] =
2 + ( ( candIntraPredModeA + 60 ) % 64 )

candModeList[ 4 ] =
2 + ( candIntraPredModeA % 64 )

candModeList[ 5 ] =
2 + ( ( candIntraPredModeA + 59 ) % 64 )
そうでない場合、ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢがｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡに等しくなく、かつｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡまたはｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢがＩＮＴＲＡ＿ＤＣよりも大きい場合、以下が適用される。
変数ｍｉｎＡＢおよびｍａｘＡＢは、以下のように導出される。

minAB
=candModeList[ (candModeList[ 0 ] > candModeList[ 1 ] ) ?1 :0]

maxAB=candModeList[ (candModeList[ 0 ] > candModeList[ 1 ] ) ?0 :1]
ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡおよびｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢの両方がＩＮＴＲＡ＿ＤＣよりも大きい場合、ｘ＝０．．５のｃａｎｄＭｏｄｅＬｉｓｔ［ｘ］は以下のように導出される。

candModeList[ 0 ] = candIntraPredModeA

candModeList[ 1 ] = candIntraPredModeB
ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０である場合、以下が適用される。

candModeList[ 2 ] = INTRA_PLANAR

candModeList[ 3 ] = INTRA_DC
ｍａｘＡＢ－ｍｉｎＡＢが２～６２の範囲にある場合、以下が適用される。

candModeList[ 4 ] =
2 + ( ( maxAB + 61 ) % 64 )

candModeList[ 5 ] = 2 + ( ( maxAB - 1 ) % 64 )
そうでない場合、以下が適用される。

candModeList[ 4 ] = 2 + ( ( maxAB + 60 ) % 64 )

candModeList[ 5 ] =
2 + ( ( maxAB ) % 64 )
そうでない場合（ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０ではない場合）、以下が適用される。
ｍａｘＡＢ－ｍｉｎＡＢが１である場合、以下が適用される。

candModeList[ 2 ] =
2 + ( ( minAB + 61 ) % 64 )

candModeList[ 3 ] = 2 + ( ( maxAB - 1 ) % 64 )

candModeList[ 4 ] =
2 + ( ( minAB + 60 ) % 64 )

candModeList[ 5 ] = 2 + ( maxAB % 64 )
そうでない場合、ｍａｘＡＢ－ｍｉｎＡＢが２である場合、以下が適用される。

candModeList[ 2 ] = 2 + ( ( minAB - 1 ) % 64 )

candModeList[ 3 ] = 2 + ( ( minAB + 61 ) % 64 )

candModeList[ 4 ] = 2 + ( ( maxAB - 1 ) % 64 )

candModeList[ 5 ] = 2 + ( ( minAB + 60 ) % 64 )
そうでない場合、ｍａｘＡＢ－ｍｉｎＡＢが６１よりも大きい場合、以下が適用される。

candModeList[ 2 ] = 2 + ( ( minAB - 1 ) % 64 )

candModeList[ 3 ] =
2 + ( ( maxAB + 61 ) % 64 )

candModeList[ 4 ] = 2 + ( minAB % 64 )

candModeList[ 5 ] =
2 + ( ( maxAB + 60 ) % 64 )
そうでない場合、以下が適用される。

candModeList[ 2 ] =
2 + ( ( minAB + 61 ) % 64 )

candModeList[ 3 ] = 2 + ( ( minAB - 1 ) % 64 )

candModeList[ 4 ] =
2 + ( ( maxAB + 61 ) % 64 )

candModeList[ 5 ] = 2 + ( ( maxAB - 1 ) % 64 )
そうでない場合（ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡまたはｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢがＩＮＴＲＡ＿ＤＣよりも大きい場合）、ｘ＝０．．５のｃａｎｄＭｏｄｅＬｉｓｔ［ｘ］は以下のように導出される。
ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０である場合、以下が適用される。

candModeList[ 0 ] = candIntraPredModeA

candModeList[ 1 ] = candIntraPredModeB

candModeList[ 2 ] = 1 - minAB

candModeList[ 3 ] =
2 + ( ( maxAB + 61 ) % 64 )

candModeList[ 4 ] = 2 + ( ( maxAB - 1 ) % 64 )

candModeList[ 5 ] =
2 + ( ( maxAB + 60 ) % 64 )
そうでない場合（ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０ではない場合）、以下が適用される。

candModeList[ 0 ] = maxAB

candModeList[ 1 ] = 2 + ( ( maxAB +
61 ) % 64 )

candModeList[ 2 ] = 2 + ( ( maxAB - 1 ) % 64 )

candModeList[ 3 ] =
2 + ( ( maxAB + 60 ) % 64 )

candModeList[ 4 ] = 2 + ( maxAB % 64 )

candModeList[ 5 ] =
2 + ( ( maxAB + 59 ) % 64 )
そうでない場合、以下が適用される。
ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０である場合、以下が適用される。

candModeList[ 0 ] = candIntraPredModeA

candModeList[ 1 ] =candModeList[0] = =

INTRA_PLANAR ) ?INTRA_DC :INTRA_PLANAR

candModeList[ 2 ] = INTRA_ANGULAR50

candModeList[ 3 ] = INTRA_ANGULAR18

candModeList[ 4 ] = INTRA_ANGULAR46

candModeList[ 5 ] = INTRA_ANGULAR54
そうでない場合（ＩｎｔｒａＬｕｍａＲｅｆＬｉｎｅＩｄｘ［ｘＣｂ］［ｙＣｂ］が０ではない場合）、以下が適用される。

candModeList[ 0 ] = INTRA_ANGULAR50

candModeList[ 1 ] = INTRA_ANGULAR18

candModeList[ 2 ] = INTRA_ANGULAR2

candModeList[ 3 ] = INTRA_ANGULAR34

candModeList[ 4 ] = INTRA_ANGULAR66

candModeList[ 5 ] = INTRA_ANGULAR26

多重ラインのイントラ予測では、追加の参照ラインをイントラ予測に使用することができる。エンコーダは、イントラ予測子を生成するためにどの参照ラインを使用するかを決定し、シグナリングすることができる。参照ラインインデックスを、イントラ予測モードの前にシグナリングすることができ、非ゼロ参照ラインインデックスがシグナリングされた場合、最確モードのみを許容することができる。図１２には、４本の参照ライン（例えば、参照ライン０～３）の例が示され、４本の参照ラインのそれぞれは、左上の参照サンプルとともに、６つのセグメント、すなわち、セグメントＡ～Ｆで構成される。また、セグメントＡとＦに、それぞれセグメントＢとＥからの最も近いサンプルを埋め込むことができる。

イントラサブパーティション（ＩＳＰ）コーディングモードでは、例えば表１に示すように、輝度イントラ予測ブロックは、ブロックサイズの寸法に応じて、垂直方向または水平方向にサブパーティション（例えば２つまたは４つ）に分割することができる。図１３および図１４は、ＩＳＰコーディングモードに基づく輝度イントラ予測ブロックの分割の２つの可能性の例を示す。図１３は、４×８ブロックまたは８×４ブロックの例示的な分割を示す。図１４は、４×８ブロック、８×４ブロック、および４×４ブロックのうちの１つではないブロックの例示的な分割を示す。全てのサブパーティションは、一例では、少なくとも１６個のサンプルを有するという条件を満たす。

サブパーティションのそれぞれについて、残差信号は、エンコーダによって送信された係数をエントロピーデコードして、係数を逆量子化および逆変換することによって生成することができる。また、サブパーティションはイントラ予測され、対応する再構築されたサンプルは、残差信号を予測信号に加算することによって取得することができる。したがって、各サブパーティションの再構築された値を使用して、次のサブパーティションの予測を生成でき、これにより、プロセスなどを繰り返すことができる。全てのサブパーティションは、同じイントラ予測モードを共有することができる。

イントラ予測モードおよび利用される分割に基づいて、クラスの異なる２つの処理順序を使用することができ、通常の順序および逆の順序と呼ばれることができる。通常の順序では、処理される１番目のサブパーティションは、ＣＵの左上のサンプルを含む。その後、処理は下向き（例えば水平分割）または右向き（例えば垂直分割）に継続する。その結果、サブパーティションの予測信号を生成するための参照サンプルは、ラインの左側および上側にのみ配置される。一方で、逆の処理順序（または逆の順序）は、（ｉ）ＣＵの左下のサンプルを含むサブパーティションで始まり、上向きに続くか、（ｉｉ）ＣＵの右上のサンプルを含むサブパーティションで始まり、左向きに続くかのいずれかである。

一部の実施形態では、ＩＳＰアルゴリズムは、ＭＰＭリストの一部であるイントラ予測モードでのみテストされる。したがって、ブロックがＩＳＰモードを使用する場合、ＭＰＭフラグは１つであると推定することができる。ＩＳＰモードが特定のブロックに使用される場合、ＭＰＭリストを変更して、ＤＣモードを除外し、かつＩＳＰの水平分割の水平イントラ予測モードとＩＳＰ垂直分割の垂直イントラ予測モードを優先することができる。

平面モードおよびＤＣモードが、例えばＶＴＭ４において常にＭＰＭリストに含まれ、隣接モードが両方とも平面／ＤＣモードである場合、現在モードは、平面またはＤＣモードである可能性が高い。本開示の実施形態は、現在のイントラ予測モードコーディングの設計においてこの相関関係を利用することを含む。以下でさらに説明されるように、一部の実施形態では、現在ブロックのイントラ予測情報をエントロピーコード化するために使用されるコンテキストは、隣接ブロックのコード化された情報に依存する。さらに、一部の実施形態では、選択されたＭＰＭが角度モードであるか、および／または平面またはＤＣモードが選択されているか否かをシグナリングするためのシンタックス要素が提供される場合もある。

上記のように、隣接する参照ライン、または最も近い参照ラインのラインインデックスは０（ゼロ参照ライン）であり、他のラインは非ゼロ参照ラインと呼ばれる。また、ｃａｎｄＭｏｄｅＬｉｓｔはＭＰＭリストを示し、ＲｅｆＬｉｎｅＩｄｘは現在ブロックの参照ラインインデックスを示し、ｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＡとｃａｎｄＩｎｔｒａＰｒｅｄＭｏｄｅＢは左および上の隣接イントラ予測モードを示す。各イントラ予測モードは、モード番号（イントラ予測モードインデックスとも呼ばれる）に関連付けられている。例えば、ＶＶＣでは、平面、ＤＣ、水平および垂直のイントラ予測モードを、それぞれモード番号０、１、１８、および５０に関連付けることができる。ＭＰＭリストの１番目の候補のＭＰＭインデックスは０として示すことができ、２番目の候補のＭＰＭインデックスは１として示すことができ、それ以降は同様である。

隣接イントラ予測モードが平面またはＤＣモードではない場合、または、隣接イントラ予測モードが、例えばＶＶＣドラフト２で定義されるように、モード２からモード６６までのイントラ予測モードなど、所定の予測方向に従って予測サンプルを生成する場合、隣接イントラ予測モードは角度モードである。隣接イントラ予測モードが、平面またはＤＣモードなど、指向性イントラ予測を示さない場合、隣接イントラ予測モードは非角度モードである。

一部の実施形態では、現在ブロックのＭＰＭフラグをエントロピーコード化するために使用されるコンテキスト（またはコンテキストモデル）は、現在ブロックおよび／または現在ブロックの隣接ブロックのコード化された情報に依存することができる。コード化された情報は、ＭＰＭフラグ、参照ラインインデックス、ＩＳＰタイプ（例えば、垂直サブパーティション、水平サブパーティション、サブパーティションなし）、イントラ予測モード、ＭＰＭインデックスなどを含むことができるが、これらに限定されない。

一実施形態では、現在ブロックのＭＰＭフラグおよび／またはイントラ予測モードなどの他のコード化された情報の前にデコードすることができる、現在ブロックのコード化された情報（例えば、参照ラインインデックスおよび／またはＩＳＰタイプ）は、現在ブロックのＭＰＭフラグおよびイントラ予測モードをエントロピーコード化するために使用することができる。

一実施形態では、現在ブロックのＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックの非角度（または角度）モードの数に依存することができる。第１の例では、隣接ブロックのイントラ予測モードが両方とも非角度モードである場合、第１のコンテキストを使用する。隣接ブロックのイントラ予測モードの一方のみが非角度モードである場合、第２のコンテキストを使用する。隣接ブロックのイントラ予測モードが両方とも角度モードである場合、第３のコンテキストを使用する。第２の例では、隣接ブロックのイントラ予測モードの少なくとも１つが非角度モードである場合、第１のコンテキストを使用する。隣接ブロックのイントラ予測モードが両方とも角度モードである場合、第２のコンテキストを使用する。第３の例では、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックのモードのいくつが平面モードであるかに依存する。第４の例では、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックのモードのいくつが平面またはＤＣモードであるかに依存する。

ＭＰＭフラグのエントロピーコーディングのためのコンテキストの数は、隣接モードがいくつ使用されるかに依存することができる。例えば、使用される隣接ブロックの数がＮである場合、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストの数はＫ＊（Ｎ＋１）であり得、ここでＫは１または２などの任意の正の整数であり得る。

一実施形態では、現在ブロックのＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックのＭＰＭフラグに依存することができる。第１の例では、隣接ブロックのＭＰＭフラグが両方とも真である場合、第１のコンテキストを使用する。隣接ブロックのＭＰＭフラグのうちの１つのみが真である場合、第２のコンテキストを使用する。隣接ブロックのＭＰＭフラグがいずれも真ではない場合、第３のコンテキストを使用する。第２の例では、隣接ブロックのＭＰＭフラグの少なくとも１つが真である場合、第１のコンテキストを使用する。隣接ブロックのＭＰＭフラグがいずれも真ではない場合、第２のコンテキストを使用する。第３の例では、ＭＰＭフラグをエントロピーコード化するためのコンテキストの数は、隣接モード（またはブロック）のＭＰＭフラグのいずれが真であるかに依存することができる。例えば、使用される隣接ブロックの数がＮである場合、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストの数はＫ＊（Ｎ＋１）であり得、ここでＫは１または２などの任意の正の整数であり得る。

一実施形態では、現在ブロックのＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接モードのＭＰＭフラグおよび／または隣接ブロックの非角度（または角度）ＭＰＭの数に依存する。例えば、隣接モードが両方とも非角度ＭＰＭである場合、第１のコンテキストを使用する。隣接モードが両方とも、角度ＭＰＭと非角度ＭＰＭを含むことができるＭＰＭである場合、第２のコンテキストを使用する。隣接モードのうちの１つのみがＭＰＭである場合、第３のコンテキストを使用する。そうでない場合、隣接モードがいずれもＭＰＭではない場合、第４のコンテキストを使用する。

一実施形態では、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックのＭＰＭフラグおよび／またはＭＰＭインデックスに依存する。一実施形態では、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、隣接ブロックのＭＰＭフラグおよび／またはＩＳＰフラグに依存する。また、さらなる例では、ＭＰＭフラグをエントロピーコード化するために使用されるコンテキストは、他のコード化された情報またはコード化された情報の組み合わせに依存することができる。

一部の実施形態では、現在ブロックのＭＰＭリストのサイズは、例えば上記のように、現在ブロックのコード化された情報、および／または現在ブロックの隣接ブロックに依存することができる。コード化された情報は、イントラ予測モード、ＭＰＭフラグ、ＩＳＰフラグ、ＭＰＭインデックス、参照ラインインデックスなどを含むことができるが、これらに限定されない。一実施形態では、ＭＰＭリストのサイズは、隣接ブロックの非角度（または角度）モードの数に依存する。第１の例では、隣接モードが両方とも非角度モードである場合、ＭＰＭリストのサイズはＫ１である。隣接モードの１つが角度モードである場合、ＭＰＭリストのサイズはＫ２である。Ｋ１とＫ２は正の整数であり、Ｋ１はＫ２よりも小さい。例えば、Ｋ１を２に設定することができる。第２の例では、隣接モードが両方とも非角度モードである場合、ＭＰＭリストのサイズをＫ１とすることができる。隣接モードの１つのみが非角度モードである場合、ＭＰＭリストのサイズはＫ２とすることができる。隣接モードがいずれも非角度モードではない場合、ＭＰＭリストのサイズはＫ３である。Ｋ１、Ｋ２、およびＫ３は正の整数である。また、Ｋ１はＫ２よりも小さくすることができ、Ｋ２はＫ３よりも小さくすることができる。例えば、Ｋ１を２に設定し、Ｋ２を５に設定することができる。

一部の実施形態では、現在ブロックのＭＰＭフラグが真である場合に、ＭＰＭインデックスをシグナリングする代わりに、新しいシンタックス要素、例えば、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇは、選択されたＭＰＭが角度モードであるか否かを示すようにシグナリングすることができる。ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇが真である場合、別のフラグｉｎｔｒａ＿ｌｕｍａ＿ｐｌａｎａｒ＿ｆｌａｇは、平面またはＤＣモードが選択されるか否かを示すようにシグナリングすることができる。例示的なシンタックスの変更とセマンティクスを表２に示す。

表２に示すように、シンタックス要素ｉｎｔｒａ＿ｌｕｍａ＿ｒｅｆ＿ｉｄｘ［ｘ０］［ｙ０］＝＝０（例えば、現在ブロックの参照ラインは参照ライン０である）およびシンタックス要素ｉｎｔｒａ＿ｓｕｂｐａｒｔｉｔｉｏｎｓ＿ｍｏｄｅ＿ｆｌａｇ［ｘ０］［ｙ０］＝＝０（例えば、ＩＳＰモードは適用されない）の場合、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］がシグナリングされる。ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］は、現在ブロックの輝度サンプルのイントラ予測モードが、選択されたイントラ予測モード（例えば、ＭＰＭリスト内のイントラ予測モードとは異なる他の候補イントラ予測モード）に属するか否かを示す。ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］が真である場合（例えば、現在ブロックの輝度サンプルのイントラ予測モードが、選択されたイントラ予測モードに属している場合）、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］をシグナリングすることができる。ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］は、現在ブロックの輝度サンプルのイントラ予測モードが角度モードであるか、または非角度モードであるかを指定することができ、角度モードは、平面またはＤＣモードではないイントラ予測モードである。配列インデックスｘ０、ｙ０は、ピクチャの左上の輝度サンプルに対する、考えられたコーディングブロック（または現在ブロック）の左上の輝度サンプルの位置（ｘ０、ｙ０）を指定する。ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］が真である（例えば、現在ブロックの輝度サンプルのイントラ予測モードが角度モードである）場合、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘ［ｘ０］［ｙ０］をシグナリングすることができる。ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘ［ｘ０］［ｙ０］は、現在ブロックの輝度サンプルのＭＰＭインデックスを示す。

ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］が真ではない（例えば、現在ブロックの輝度サンプルのイントラ予測モードが非角度モードである）場合、ｉｎｔｒａ＿ｌｕｍａ＿ｐｌａｎａｒ＿ｆｌａｇ［ｘ０］［ｙ０］をシグナリングすることができる。ｉｎｔｒａ＿ｌｕｍａ＿ｐｌａｎａｒ＿ｆｌａｇ［ｘ０］［ｙ０］は、現在ブロックの輝度サンプルのイントラ予測モードが平面であるか、またはＤＣであるかを指定することができる。配列インデックスｘ０、ｙ０は、ピクチャの左上の輝度サンプルに対する、考えられたコーディングブロック（または現在ブロック）の左上の輝度サンプルの位置（ｘ０、ｙ０）を指定する。

ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］が真ではない（例えば、現在ブロックの輝度サンプルのイントラ予測モードが、選択されたイントラ予測モードに属していない）場合、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ［ｘ０］［ｙ０］をシグナリングすることができる。ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ［ｘ０］［ｙ０］は、現在ブロックの輝度サンプルのイントラ予測モードが、選択されたイントラ予測モード以外の残りの候補に属していることを示すことができる。

一実施形態では、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘ［ｘ０］［ｙ０］は、固定長コーディングを使用してコード化する（例えば、２ビットを使用してコード化する）ことができる。一実施形態では、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］をエントロピーコード化することができ、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］をエントロピーコード化するために使用されるコンテキストは、隣接ブロックのｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇの値から導出することができる。一実施形態では、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］をエントロピーコード化することができ、ｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇ［ｘ０］［ｙ０］をエントロピーコード化するために使用されるコンテキストは、隣接ブロックのｉｎｔｒａ＿ｌｕｍａ＿ａｎｇ＿ｍｐｍ＿ｆｌａｇの値から導出することができる。

一部の実施形態では、現在ブロックのＭＰＭインデックスをエントロピーコード化するためのコンテキストは、現在ブロックの隣接ブロックのコード化された情報に依存することができ、コード化された情報は、隣接ブロックのイントラ予測モード、ＭＰＭフラグ、ＭＰＭインデックス、参照ラインインデックス、ＩＳＰフラグなどを含むことができるが、これらに限定されない。一実施形態では、ＭＰＭインデックスをエントロピーコード化するためのコンテキストは、隣接ブロックの角度モードの数に依存することができる。例えば、ＭＰＭインデックスの第１のビンをエントロピーコード化するためのコンテキストは、隣接ブロックの角度モードの数に依存する。一実施形態では、ＭＰＭインデックスをエントロピーコード化するためのコンテキストは、平面モードよりも大きいイントラ予測モードである隣接モードの数に依存することができる。例えば、ＭＰＭインデックスの第１のビンをエントロピーコード化するためのコンテキストは、イントラ予測モード番号が平面モードよりも大きい隣接モードの数に依存する。

図１５は、本開示の実施形態に係るプロセス（１５００）の概要のフローチャートを示す。プロセス（１５００）は、イントラモードでコード化されたブロックの再構築に用いて、再構築中のブロックの予測ブロックを生成することができる。様々な実施形態では、プロセス（１５００）は、端末装置（３１０）、（３２０）、（３３０）および（３４０）の処理回路、ビデオエンコーダ（４０３）の機能を実行する処理回路、ビデオデコーダ（４１０）の機能を実行する処理回路、ビデオデコーダ（５１０）の機能を実行する処理回路、ビデオエンコーダ（６０３）の機能を実行する処理回路などの処理回路によって実行される。一部の実施形態では、プロセス（１５００）はソフトウェア命令で実施され、したがって処理回路がソフトウェア命令を実行すると、処理回路はプロセス（１５００）を実行する。プロセスは（Ｓ１５０１）から開始し、（Ｓ１５１０）に進む。

（１５１０）では、コード化されたビデオビットストリームから、現在ブロックの隣接ブロックのコード化された情報を受信することができる。コード化された情報は隣接ブロックのイントラ予測情報を含むことができる。一部の実施形態では、コード化された情報は、ＭＰＭフラグ、参照ラインインデックス、イントラサブパーティション（ＩＰＳ）フラグ、イントラ予測モード、またはＭＰＭインデックスを含むことができる。

（１５２０）では、隣接ブロックのコード化された情報に基づいて、現在ブロックのイントラ予測情報を決定することができる。一部の実施形態では、現在ブロックのイントラ予測情報は、最確モード（ＭＰＭ）フラグ、ＭＰＭリストのサイズ、またはＭＰＭインデックスを含むことができる。一部の実施形態では、現在ブロックのイントラ予測情報を決定するために、コード化された情報に基づいて、コンテキストモデルのセットからコンテキストモデルを決定することができ、かつ決定されたコンテキストモデルに従って、現在ブロックの隣接ブロックのコード化された情報に基づいて、現在ブロックのイントラ予測情報を決定することができる。

一部の実施形態では、コンテキストモデルを、隣接ブロックの非角度モード数、隣接ブロックの角度モード数、隣接ブロックのＭＰＭフラグ、隣接ブロックのＭＰＭインデックス、および隣接ブロックのＩＳＰフラグのうちの少なくとも１つに基づいて決定することができる。

一部の実施形態では、現在ブロックのＭＰＭリストのサイズは、隣接ブロックのイントラ予測モードが非角度モードである場合に第１の整数であり得、現在ブロックのＭＰＭリストのサイズは、隣接ブロックのイントラ予測モードの１つが角度モードである場合に第２の整数であり得、第１の整数は第２の整数よりも小さい。

一部の実施形態では、現在ブロックのＭＰＭリストのサイズは、隣接ブロックのイントラ予測モードが非角度モードである場合に第１の整数であり得、現在ブロックのＭＰＭリストのサイズは、隣接ブロックのイントラ予測モードの１つが非角度モードである場合に第２の整数であり得、現在ブロックのＭＰＭリストのサイズは、隣接ブロックのイントラ予測モードがいずれも角度モードである場合に第３の整数であり得る。第１の整数は第２の整数よりも小さく、第２の整数は第３の整数よりも小さい。

（１５３０）では、現在ブロックのイントラ予測情報に基づいてイントラ予測方向モードを決定することができる。（１５４０）では、現在ブロックのイントラ予測方向モードに従って、現在ブロックの少なくとも１つのサンプルを再構築することができる。

本開示に説明された方法は、別々に用いられてもよく、任意の順序で組み合わせられてもよい。さらに、方法（または実施形態）、エンコーダおよびデコーダのそれぞれは、処理回路（例えば、１つ以上のプロセッサまたは１つ以上の集積回路）によって実施することができる。一例では、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に記憶されるプログラムを実行する。さらに、ブロックという用語は、予測ブロック、コーディングブロック、またはコーディングユニット、即ちＣＵとして解釈されてもよい。

以上で説明された技法は、コンピュータ読取可能な命令を使用するコンピュータソフトウェアとして実行され、１つ以上のコンピュータ読取可能な媒体に物理的に記憶されることができる。例えば、図１６は、開示された主題の特定の実施形態を実行することに適したコンピュータシステム（１６００）を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックスプロセッシングユニット（ＧＰＵ）などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いてコード化されることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。

コンピュータシステム（１６００）について、図１６に示される例示的なコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム（１６００）の例示的な実施形態で示されるコンポーネントのうちのいずれか１つまたは組み合わせに関する任意の依存性または必要性を有するとして解釈されるべきではない。

コンピュータシステム（１６００）は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（キーストローク、スワイプ、データグローブの動きなど）、オーディオ入力（音声、拍手など）、視覚入力（ジェスチャーなど）、嗅覚入力（描画せず）によって、１人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ（音声、音楽、環境音など）、画像（走査画像、静止画像カメラから取得される写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。

入力ヒューマンインターフェースデバイスは、キーボード（１６０１）、マウス（１６０２）、トラックパッド（１６０３）、タッチスクリーン（１６１０）、データグローブ（図示せず）、ジョイスティック（１６０５）、マイクフォン（１６０６）、スキャナ（１６０７）、カメラ（１６０８）（それぞれ１つのみ示されている）のうちの１つ以上を含み得る。

コンピュータシステム（１６００）は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚／味覚を介して１人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１６１０）、データグローブ（図示せず）、またはジョイスティック（１６０５）による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい）、オーディオ出力デバイス（スピーカ（１６０９）、ヘッドホン（描画せず）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（１６１０）（それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、２次元の視覚出力または３次元以上の出力を出力することができる）、仮想現実眼鏡（描画せず）、ホログラフィックディスプレおよびスモークタンク（描画せず）など）、およびプリンタ（描画せず）を含み得る。

コンピュータシステム（１６００）は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、ＣＤ／ＤＶＤなどの媒体（１６２１）付きのＣＤ／ＤＶＤＲＯＭ／ＲＷ（１６２０）を含む光学媒体、サムドライブ（１６２２）、リムーバブルハードドライブまたはソリッドステートドライブ（１６２３）、テープやフロッピー（登録商標）ディスクなどの従来の磁気媒体（描画せず）、セキュリティドングルなどの専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス（描画せず）などをも含むことができる。

ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するべきである。

コンピュータシステム（１６００）は、１つ以上の通信ネットワークへのインターフェースをさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線ＬＡＮなどのローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、および地上放送ＴＶを含むＴＶ有線または無線広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス（１６４９）（例えば、コンピュータシステム（１６００）のＵＳＢポートなど）に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続することにより、コンピュータシステム（１６００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを用いて、コンピュータシステム（１６００）は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ（例えば、放送ＴＶ）、単方向の送信のみ（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム（１６００）のコア（１６４０）に接続されることができる。

コア（１６４０）は、１つ以上の中央処理装置（ＣＰＵ）（１６４１）、グラフィックスプロセッシングユニット（ＧＰＵ）（１６４２）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）（１６４３）の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１６４４）などを含むことができる。これらのデバイスは、リードオンリメモリ（ＲＯＭ）（１６４５）、ランダムアクセスメモリ（１６４６）、非ユーザアクセス可能な内部ハードドライブ、ＳＳＤなどの内部大容量ストレージ（１６４７）とともに、システムバス（１６４８）を介して接続されてもよい。一部のコンピュータシステムでは、システムバス（１６４８）は、１つ以上の物理プラグの形態でアクセスでき、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にする。周辺機器は、コアのシステムバス（１６４８）に直接、または周辺バス（１６４９）を介して接続されることができる。周辺バスのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

ＣＰＵ（１６４１）、ＧＰＵ（１６４２）、ＦＰＧＡ（１６４３）、およびアクセラレータ（１６４４）は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１６４５）またはＲＡＭ（１６４６）に記憶されることができる。推移データはＲＡＭ（１６４６）にも記憶できるが、永続データは、例えば、内部大容量ストレージ（１６４７）に記憶されることができる。１つ以上のＣＰＵ（１６４１）、ＧＰＵ（１６４２）、大容量ストレージ（１６４７）、ＲＯＭ（１６４５）、ＲＡＭ（１６４６）などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。

コンピュータ読取可能な媒体は、様々なコンピュータ実施操作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。

限定ではなく、一例として、アーキテクチャを有するコンピュータシステム（１６００）、特にコア（１６４０）は、１つ以上の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ（１６４７）またはＲＯＭ（１６４５）などの非一時的な性質を持つコア（１６４０）の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実行するソフトウェアは、このようなデバイスに記憶され、コア（１６４０）によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、１つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（１６４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（１６４６）に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更することを含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路（例えば、アクセラレータ（１６４４））に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。
付録Ａ：頭字語
ＪＥＭ：ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ（共同探索モデル）
ＶＶＣ：ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（多用途ビデオコーディング）
ＢＭＳ：ＢｅｎｃｈｍａｒｋＳｅｔ（ベンチマークセット）
ＭＶ：ＭｏｔｉｏｎＶｅｃｔｏｒ（動きベクトル）
ＨＥＶＣ：ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（高効率ビデオコーディング）
ＳＥＩ：ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ（補助強化情報）
ＶＵＩ：ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ（ビデオユーザビリティ情報）
ＧＯＰ：ＧｒｏｕｐｓｏｆＰｉｃｔｕｒｅｓ（ピクチャ群）
ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ（変換ユニット）
ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ（予測ユニット）
ＣＴＵ：ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ（コーディングツリーユニット）
ＣＴＢ：ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ（コーディングツリーブロック）
ＰＢ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ（予測ブロック）
ＨＲＤ：ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ（仮想リファレンスデコーダ）
ＳＮＲ：ＳｉｇｎａｌＮｏｉｓｅＲａｔｉｏ（信号対雑音比）
ＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ（中央処理装置）
ＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ（グラフィック処理装置）
ＣＲＴ：ＣａｔｈｏｄｅＲａｙＴｕｂｅ（ブラウン管）
ＬＣＤ：Ｌｉｑｕｉｄ－ＣｒｙｓｔａｌＤｉｓｐｌａｙ（液晶表示装置）
ＯＬＥＤ：ＯｒｇａｎｉｃＬｉｇｈｔ－ＥｍｉｔｔｉｎｇＤｉｏｄｅ（有機発光ダイオード）
ＣＤ：ＣｏｍｐａｃｔＤｉｓｃ（コンパクトディスク）
ＤＶＤ：ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ（デジタルビデオディスク）
ＲＯＭ：Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ（リードオンリメモリ）
ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ（ランダムアクセスメモリ）
ＡＳＩＣ：Ａｐｐｌｉｃａｔｉｏｎ－ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（特定用途向け集積回路）
ＰＬＤ：ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ（プログラマブルロジックデバイス）
ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ（ローカルエリアネットワーク）
ＧＳＭ：ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎ（移動通信用グローバルシステム）
ＬＴＥ：Ｌｏｎｇ－ＴｅｒｍＥｖｏｌｕｔｉｏｎ（長期的な進化）
ＣＡＮＢｕｓ：ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋＢｕｓ（コントローラエリアネットワークバス）
ＵＳＢ：ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ（ユニバーサルシリアルバス）
ＰＣＩ：ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ（ペリフェラルコンポーネントインターコネクト）
ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡrray（フィールド・プログラマブル・ゲート・アレイ）
ＳＳＤ：Ｓｏｌｉｄ－ＳｔａｔｅＤｒｉｖｅ（ソリッドステートドライブ）
ＩＣ：ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（集積回路）
ＣＵ：ＣｏｄｉｎｇＵｎｉｔ（コーディングユニット）

本開示は一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。

Claims

ビデオデコーダが実行する、ビデオデコードの方法であって、
コード化されたビデオビットストリームから、現在ブロックの隣接ブロックのコード化された情報を受信するステップであって、前記コード化された情報が前記隣接ブロックのイントラ予測情報を含む、ステップと、
前記隣接ブロックのコード化された情報に基づいて、前記現在ブロックのイントラ予測情報を決定するステップと、
前記現在ブロックのイントラ予測情報に基づいて、イントラ予測方向モードを決定するステップと、
前記現在ブロックのイントラ予測方向モードに従って、前記現在ブロックの少なくとも１つのサンプルを再構築するステップと、を含む方法。
前記現在ブロックのイントラ予測情報を決定するステップは、
前記コード化された情報に基づいて、コンテキストモデルのセットからコンテキストモデルを決定するステップと、
前記決定されたコンテキストモデルに従って、前記現在ブロックの隣接ブロックのコード化された情報に基づいて、前記現在ブロックのイントラ予測情報を決定するステップと、を含む、請求項１に記載の方法。
前記コード化された情報は、最確モード（ＭＰＭ）フラグ、参照ラインインデックス、イントラサブパーティション（ＩＰＳ）フラグ、イントラ予測モード、およびＭＰＭインデックスのうちの少なくとも１つを含む、請求項２に記載の方法。
前記現在ブロックのイントラ予測情報は、前記ＭＰＭフラグ、ＭＰＭリストのサイズ、および前記ＭＰＭインデックスのうちの少なくとも１つを含む、請求項３に記載の方法。
前記コード化された情報に基づいて、複数のコンテキストモデルから前記コンテキストモデルを決定するステップは、
前記コンテキストモデルを、前記隣接ブロックの非角度モード数、前記隣接ブロックの角度モード数、前記隣接ブロックの最確モード（ＭＰＭ）フラグ、前記隣接ブロックのＭＰＭインデックス、および前記隣接ブロックのイントラサブパーティション（ＩＳＰ）フラグのうちの少なくとも１つに基づいて決定するステップを含む、請求項２に記載の方法。
前記隣接ブロックのイントラ予測モードが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第１の整数であり、前記隣接ブロックのイントラ予測モードの１つが角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第２の整数であり、前記第１の整数が前記第２の整数よりも小さい、請求項４に記載の方法。
前記隣接ブロックのイントラ予測モードが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第１の整数であり、前記隣接ブロックのイントラ予測モードの１つが非角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第２の整数であり、前記隣接ブロックのイントラ予測モードがいずれも角度モードである場合、前記現在ブロックのＭＰＭリストのサイズは第３の整数であり、前記第１の整数が前記第２の整数よりも小さく、前記第２の整数が前記第３の整数よりも小さい、請求項４に記載の方法。
ビデオデコーダが実行する、ビデオデコードの方法であって、
コード化されたビデオビットストリームから、現在ブロックおよび前記現在ブロックの隣接ブロックのコード化された情報を受信するステップであって、前記コード化された情報が前記現在ブロックおよび前記隣接ブロックのイントラ予測情報を含む、ステップと、
前記コード化された情報内の現在ブロックに関連付けられた第１の情報をデコードするステップであって、前記第１の情報は、前記現在ブロックの輝度サンプルのイントラ予測モードが選択されたイントラ予測モードに属するか否かを示すものである、ステップと、
前記第１の情報は前記現在ブロックの輝度サンプルのイントラ予測モードが前記選択されたイントラ予測モードに属することを示すものであることに対応して、前記コード化された情報内の現在ブロックに関連付けられた第２の情報をデコードするステップであって、前記第２の情報は、前記現在ブロックの輝度サンプルの最確モード（ＭＰＭ）が角度モードおよび非角度モードのいずれかを示すものである、ステップと、
前記コード化された情報内の現在ブロックに関連付けられた第３の情報をデコードするステップであって、前記第２の情報は前記現在ブロックの輝度サンプルのＭＰＭが前記角度モードであることを示すものであることに対応して、前記第３の情報が前記現在ブロックの輝度サンプルのＭＰＭインデックスを示すものである、ステップと、
前記コード化された情報内の現在ブロックに関連付けられた第４の情報をデコードするステップであって、前記第２の情報は前記現在ブロックの輝度サンプルのＭＰＭが前記非角度モードであることを示すものであることに対応して、前記第４の情報が前記現在ブロックのＭＰＭが平面モードおよびＤＣモードのいずれかを示すものである、ステップと、を含む方法。
前記現在ブロックに関連付けられた第２の情報をエントロピーコード化するために使用されるコンテキストモデルが、前記隣接ブロックに関連付けられた第１の情報または前記隣接ブロックに関連付けられた第２の情報に基づいて決定される、請求項８に記載の方法。
前記現在ブロックに関連付けられた第３の情報は、固定長コーディングを使用してコード化される、請求項８又は９に記載の方法。
処理回路を含むビデオデコードのための装置であって、
前記処理回路は、請求項１から１０のいずれかの一項に記載の方法を実行する、装置。