KR101924254B1

KR101924254B1 - 비디오 데이터에 대한 파일 포맷

Info

Publication number: KR101924254B1
Application number: KR1020157011464A
Authority: KR
Inventors: 예-쿠이 왕
Original assignee: 퀄컴 인코포레이티드
Priority date: 2012-10-04
Filing date: 2013-10-02
Publication date: 2018-11-30
Also published as: DK2904799T3; EP2904798B1; TWI558177B; US20140098868A1; TWI565305B; TW201433151A; CN104704829A; JP6203852B2; KR102172130B1; EP2904799A2; HUE042386T2; CN104704830A; WO2014055606A3; BR112015007502B1; JP2015537421A; DK2904798T3; WO2014055594A3; HUE053036T2; US20140098860A1; ES2716852T3

Abstract

디바이스는 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성한다. 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 시퀀스 파라미터 세트 (SPS) 들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함한다. 동일한 또는 상이한 디바이스는, 샘플 엔트리에서의 엘리먼트에 기초하여, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정한다.

Description

비디오 데이터에 대한 파일 포맷{FILE FORMAT FOR VIDEO DATA}

본 출원은, 2012년 10월 4일자로 출원된 미국 가특허출원 제61/709,748호의 이익을 주장하며, 이 미국 가특허출원의 전체 내용은 여기에 참조로 포함된다.

기술분야

본 개시물은 비디오 인코딩 및 디코딩에 관한 것이다.

디지털 비디오 능력들은 디지털 텔레비전들, 디지털 다이렉트 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인 휴대 정보 단말기 (personal digital assistant; PDA) 들, 랩톱 또는 데스크톱 컴퓨터들, 태블릿 컴퓨터들, 전자책 판독기들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 무선 전화기들, 소위 "스마트 폰들", 원격 화상회의 디바이스들, 비디오 스트리밍 디바이스들 등을 포함한, 광범위한 디바이스들에 포함될 수 있다. 디지털 비디오 디바이스들은 MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, 어드밴스드 비디오 코딩 (Advanced Video Coding; AVC) 에 의해 정의된 표준들, 현재 개발 중인 고효율 비디오 코딩 (High Efficiency Video Coding; HEVC) 표준, 및 이러한 표준들의 확장들에서 설명되는 것들과 같은 비디오 압축 기법들을 구현한다. 비디오 디바이스들은 이러한 비디오 압축 기법들을 구현함으로써, 디지털 비디오 정보를 더욱 효율적으로 송신, 수신, 인코딩, 디코딩, 및/또는 저장할 수도 있다.

비디오 압축 기법들은 비디오 시퀀스들에 내재하는 리던던시를 감소시키거나 제거하기 위한 공간 (인트라-픽처) 예측 및/또는 시간 (인터-픽처) 예측을 수행한다. 블록-기반 비디오 코딩을 위해, 비디오 슬라이스 (즉, 비디오 프레임 또는 비디오 프레임의 일부분) 는 비디오 블록들로 파티셔닝될 수도 있다. 픽처의 인트라-코딩된 (I) 슬라이스에서 비디오 블록들은 동일한 픽처에서 이웃하는 블록들에서의 참조 샘플들에 대한 공간 예측을 사용하여 인코딩된다. 픽처의 인터-코딩된 (P 또는 B) 슬라이스에서 비디오 블록들은 동일한 픽처에서 이웃하는 블록들에서의 참조 샘플들에 대한 공간 예측 또는 다른 참조 픽처들에서의 참조 샘플들에 대한 시간 예측을 사용할 수도 있다. 픽처들은 프레임들이라고 지칭될 수도 있으며, 참조 픽처들은 참조 프레임들이라고 지칭될 수도 있다.

공간 또는 시간 예측은 코딩될 블록에 대한 예측 블록을 발생시킨다. 잔차 데이터 (residual data) 는 코딩될 오리지널 블록과 예측 블록 사이의 픽셀 차이들을 나타낸다. 인터-코딩된 블록은 예측 블록을 형성하는 참조 샘플들의 블록을 가리키는 모션 벡터, 및 코딩된 블록과 예측 블록 사이의 차이를 나타내는 잔차 데이터에 따라 인코딩된다. 인트라-코딩된 블록은 인트라-코딩 모드 및 잔차 데이터에 따라 인코딩된다. 추가적인 압축을 위해, 잔차 데이터는 픽셀 도메인으로부터 변환 도메인으로 변환되어, 잔차 계수들을 발생시킬 수도 있으며, 이 잔차 계수들은 그 후에 양자화될 수도 있다. 처음에 2차원 어레이로 배열된, 양자화된 변환 계수들은 계수들의 1차원 벡터를 생성하기 위해 스캐닝될 수도 있으며, 엔트로피 코딩이 훨씬 더 많은 압축을 달성하기 위해 적용될 수도 있다.

멀티뷰 코딩 비트스트림은, 예를 들어, 다수의 시점들로부터의 뷰들을 인코딩함으로써 생성될 수도 있다. 멀티뷰 코딩 양태들의 사용을 행하는 일부 3차원 (3D) 비디오 표준들이 개발되어 왔다. 예를 들어, 상이한 뷰들이 3D 비디오를 지원하기 위해 좌측 및 우측 눈 뷰들을 송신할 수도 있다. 대안적으로, 일부 3D 비디오 코딩 프로세스들은 소위 멀티뷰 플러스 심도 코딩 (multiview plus depth coding) 을 지원할 수도 있다. 멀티뷰 플러스 심도 코딩에서, 3D 비디오 비트스트림은 텍스처 뷰 컴포넌트들뿐만 아니라, 심도 뷰 컴포넌트들도 포함할 수도 있다. 예를 들어, 각각의 뷰는 하나의 텍스처 뷰 컴포넌트 및 하나의 심도 뷰 컴포넌트를 포함할 수도 있다.

일반적으로, 본 개시물은 비디오 콘텐츠의 저장을 위한 기법들을 설명한다. 일부 예들에서, 이 기법들은 ISO (International Organization for Standardization) 베이스 미디어 파일 포맷 (ISOBMFF) 에 기초한 파일에의 고효율 비디오 코딩 (HEVC) 콘텐츠의 저장을 위해 제공한다. 예를 들어, 디바이스는 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성할 수도 있다. 이 파일은 또한, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 레코드를 포함하는 박스를 포함할 수도 있다. 동일한 또는 상이한 디바이스는, 레코드에서의 엘리먼트에 기초하여, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정할 수도 있다.

하나의 예에서, 본 개시물은 비디오 데이터를 프로세싱하는 방법을 설명하고, 이 방법은, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정하는 단계를 포함한다.

다른 예에서, 본 개시물은 코딩된 비디오 데이터를 저장하는 방법을 설명하고, 이 방법은, 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성하는 단계를 포함하고, 이 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함한다.

다른 예에서, 본 개시물은, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정하도록 구성된 하나 이상의 프로세서들을 포함하는 디바이스를 설명한다.

다른 예에서, 본 개시물은 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성하도록 구성된 하나 이상의 프로세서들을 포함하는 디바이스를 설명하고, 이 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함한다.

다른 예에서, 본 개시물은, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일을 수신하는 수단; 및 샘플 엔트리에서의 엘리먼트에 기초하여, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정하는 수단을 포함하는 디바이스를 설명한다.

다른 예에서, 본 개시물은, 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성하는 수단; 및 파일을 출력하는 수단을 포함하는 디바이스를 설명하고, 이 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함한다.

다른 예에서, 본 개시물은, 실행될 때, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정하도록 하나 이상의 프로세서들을 구성하는 명령들을 저장한 비일시적 컴퓨터 판독가능 저장 매체를 설명한다.

다른 예에서, 본 개시물은, 실행될 때, 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성하도록 하나 이상의 프로세서들을 구성하는 명령들을 저장한 비일시적 컴퓨터 판독가능 저장 매체를 설명하고, 이 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함한다.

하나 이상의 예들의 세부사항들이 첨부 도면들 및 하기의 설명에서 제시된다. 다른 특징들, 목적들, 및 이점들은 이 설명, 도면들, 그리고 청구항들로부터 자명해질 것이다.

도 1 은 본 개시물에 설명된 기법들을 활용할 수도 있는 일 예시적인 비디오 코딩 시스템을 예시한 블록도이다.
도 2 는 본 개시물에 설명된 기법들을 구현할 수도 있는 일 예시적인 비디오 인코더를 예시한 블록도이다.
도 3 은 본 개시물에 설명된 기법들을 구현할 수도 있는 일 예시적인 비디오 디코더를 예시한 블록도이다.
도 4 는 본 개시물의 하나 이상의 기법들에 따른 일 예시적인 동작을 예시한 플로차트이다.
도 5 는 본 개시물의 하나 이상의 부가적인 기법들에 따른 일 예시적인 동작을 예시한 플로차트이다.
도 6 은 본 개시물의 하나 이상의 기법들에 따른 파일의 일 예시적인 구조를 예시한 개념도이다.

고효율 비디오 코딩 (High Efficiency Video Coding; HEVC) 비트스트림과 같은 비트스트림은, 코딩된 픽처들의 표현을 형성하는 비트들의 시퀀스 및 하나 이상의 코딩된 비디오 시퀀스 (coded video sequence; CVS) 들을 형성하는 관련 데이터를 포함할 수도 있다. 코딩된 픽처는 픽처의 코딩된 표현을 포함하여 픽처의 모든 코딩 트리 유닛들을 포함할 수도 있다. 코딩 트리 유닛 (coding tree unit; CTU) 은 루마 샘플들의 코딩 트리 블록 (coding tree block; CTB) 과 크로마 샘플들의 2개의 대응하는 CTB들 및 이 샘플들을 코딩하는데 사용되는 신택스 구조들을 포함할 수도 있다. CVS 는 액세스 유닛들의 시퀀스를 포함할 수도 있다. 액세스 유닛들 각각은 동일한 시간 인스턴스와 연관된 코딩된 픽처들의 세트를 포함할 수도 있다.

미디어 인지 네트워크 엘리먼트 (media aware network element; MANE) 또는 다른 타입의 디바이스는 다수의 서브-레이어들에서 코딩되는 HEVC 비트스트림에 비트스트림 시닝 (thinning) 을 적용할 수도 있다. 레이어 내의 다른 픽처들에 대한 참조 없이 코딩될 수도 있는 레이어 내의 픽처들의 서브세트는 여기에서 "서브-레이어" 또는 "시간적 서브-레이어" 라고 지칭될 수도 있다. 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛의 시간적 식별자는, NAL 유닛이 연관되는 서브-레이어를 식별한다. 따라서, 비트스트림의 각 서브-레이어는 상이한 시간적 식별자와 연관될 수도 있다. 제 1 NAL 유닛의 시간적 식별자가 제 2 NAL 유닛의 시간적 식별자보다 더 작은 경우, 제 1 NAL 유닛에 의해 캡슐화된 데이터는 제 2 NAL 유닛에 의해 캡슐화된 데이터에 대한 참조 없이 디코딩될 수도 있다.

비트스트림에서의 임의의 포인트에서, MANE 는 하위 서브-레이어들에서의 픽처들에 대한 디코딩 프로세스가 상위 서브-레이어들의 NAL 유닛들에 의존하지 않기 때문에 하위 서브-레이어들에서의 픽처들이 여전히 디코딩가능하다는 점에 기초하여 상위 서브-레이어들의 네트워크 추상화 레이어 (NAL) 유닛들을 제거하기 시작할 수 있다. 특정 값보다 더 높은 시간적 식별자들을 갖는 모든 NAL 유닛들을 제거하는 액션은 시간적 다운-스위칭이라고 지칭될 수 있다. 시간적 다운-스위칭은 항상 가능할 수도 있다.

그 포인트까지 포워딩되지 않았던 특정 서브-레이어의 NAL 유닛들을 포워딩하기 시작하는 액션은 시간적 업-스위칭이라고 지칭될 수 있다. 일부 예들에서, 시간적 업-스위칭은 스위칭되는 레이어에서의 픽처들 중 어떠한 것도 스위치가 수행된 비트스트림에서의 포인트 이전에 동일한 서브-레이어에서의 임의의 픽처에 의존하지 않는 경우에만 단지 가능하다. 시간적 업-스위칭이 가능한 비트스트림에서의 포인트들은 서브-레이어 스위칭 포인트들이라고 지칭될 수도 있다.

HEVC 에서, 서브-레이어 스위칭 포인트들과 연관된 2개의 픽처 타입들, 즉, 시간적 서브-레이어 액세스 (temporal sub-layer access; TSA) 픽처 타입 및 단계적인 시간적 서브-레이어 액세스 (step-wise temporal sub-layer access; STSA) 픽처 타입이 존재한다. TSA 및 STSA 픽처 타입들은 시간적 서브-레이어 스위칭 포인트들을 나타내는데 사용될 수 있다. TSA 픽처는, TSA 픽처에서, 바로 아래의 서브-레이어로부터, 임의의 상위 서브-레이어 또는 TSA 픽처를 포함하는 서브-레이어로의 업-스위칭을 가능하게 한다. STSA 픽처는, STSA 픽처에서, 바로 아래의 서브-레이어로부터, STSA 픽처를 포함하는 서브-레이어로의 업-스위칭을 가능하게 한다. 따라서, TSA 픽처와는 대조적으로, STSA 는, STSA 픽처를 포함하는 서브-레이어와 같은, 임의의 상위 서브-레이어로의 업-스위칭을 반드시 가능하게 하지는 않는다.

HEVC 콘텐츠의 저장을 위한 파일 포맷 (즉, HEVC 파일 포맷) 에 따르면, 파일은 복수의 "박스들" 을 포함할 수도 있다. 따라서, HEVC 파일 포맷을 준수하는 파일들은 박스들이라고 불리는 일련의 오브젝트들을 포함할 수도 있다. "박스" 는 고유 타입 식별자 및 길이로 정의된 오브젝트-지향적인 구축 블록일 수도 있다. 일부 경우들에서, HEVC 파일 포맷을 준수하는 파일에서의 모든 데이터가 박스들 내에 포함될 수도 있어서 파일에는 박스에 있지 않는 데이터가 없을 수도 있다.

또한, HEVC 파일 포맷을 준수하는 파일은 복수의 트랙들을 포함할 수도 있다. 각각의 트랙은 관련 샘플들의 시간지정된 시퀀스일 수도 있다. HEVC 파일 포맷의 맥락에서, "샘플" 은 단일의 타임스탬프와 연관된 데이터를 포함할 수도 있다. 샘플의 예들로는 비디오의 개개의 프레임, 디코딩 순서의 일련의 비디오 프레임들, 또는 디코딩 순서의 오디오의 압축된 섹션을 포함한다.

또한, HEVC 파일 포맷에서, 샘플 그룹화는 하나의 샘플 그룹의 멤버이도록 하는 트랙에서의 샘플들 각각의 할당이다. 샘플 그룹에서의 샘플들은 인접할 필요는 없다. 샘플 그룹들은 2개의 데이터 구조들, 즉, SampleToGroup 박스 및 SampleGroupDescription 박스로 표현될 수도 있다. SampleToGroup 박스는 샘플 그룹들로의 샘플들의 할당을 표현한다. 각각의 샘플 그룹 엔트리에 대한 SampleGroupDescription 박스의 하나의 인스턴스가 있을 수도 있다. SampleGroupDescription 박스는 대응하는 샘플 그룹의 속성들을 설명한다.

HEVC 콘텐츠의 저장을 위한 파일 포맷의 기존 설계들에는 몇몇 문제들 또는 결점들이 존재한다. 예를 들어, STSA 픽처들을 포함하는 샘플들 (STSA 샘플들이라고도 또한 지칭됨) 을 시그널링하기 위한 어떤 콤팩트한 방법도 존재하지 않는다. 다른 예에서, 임의의 상위 시간적 레이어 (higher temporal layer) 로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있는지 여부를 시그널링하기 위한 어떤 효율적인 방법도 존재하지 않는다.

본 개시물의 기법들은 상술된 문제들 또는 결점들 중 하나 이상을 해결할 수도 있다. 본 개시물의 일 예시적인 기법에 따르면, 디바이스 (예를 들어, 비디오 인코더 또는 다른 디바이스) 는, 코딩된 픽처들을 포함하는 복수의 샘플들을 포함하는 파일을 생성할 수도 있다. 파일은 또한 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스 (예를 들어, SampleToGroupBox) 를 포함할 수도 있다. 박스는 또한 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낸다. 이에 따라, 디바이스 (예를 들어, 비디오 디코더 또는 다른 디바이스) 는, 샘플 그룹을 식별하는 박스에서의 데이터에 기초하여, 박스를 포함하는 파일에서의 샘플들 중에서 STSA 샘플들을 식별할 수도 있다.

본 개시물의 다른 예시적인 기법에 따르면, 비디오 인코더 또는 다른 디바이스는 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성할 수도 있다. 파일은 또한, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 레코드를 포함하는 박스를 포함할 수도 있다. 이에 따라, 비디오 디코더 또는 다른 디바이스는, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 박스에서의 레코드에서의 엘리먼트에 기초하여, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정할 수도 있다.

예를 들어, 비디오 인코더는 HEVC 디코더 구성 레코드 (decoder configuration record) 를 생성할 수도 있다. HEVC 디코더 구성 레코드는 temporalIdNested 엘리먼트를 포함할 수도 있다. temporalIDNested 엘리먼트는 HEVC 디코더 구성 레코드가 적용되는 스트림의 임의의 샘플에서 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있는지 여부를 나타낼 수도 있다.

도 1 은 본 개시물의 기법들을 활용할 수도 있는 일 예시적인 비디오 코딩 시스템 (10) 을 예시한 블록도이다. 여기에 사용된 바와 같이, 용어 "비디오 코더" 는 비디오 인코더들과 비디오 디코더들 양쪽 모두를 일반적으로 지칭한다. 본 개시물에서, 용어들 "비디오 코딩" 또는 "코딩" 은 비디오 인코딩과 비디오 디코딩을 일반적으로 지칭할 수도 있다.

도 1 에 도시된 바와 같이, 비디오 코딩 시스템 (10) 은 소스 디바이스 (12) 및 목적지 디바이스 (14) 를 포함한다. 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 생성한다. 이에 따라, 소스 디바이스 (12) 는 비디오 인코딩 디바이스 또는 비디오 인코딩 장치라고 지칭될 수도 있다. 목적지 디바이스 (14) 는 소스 디바이스 (12) 에 의해 생성되는 인코딩된 비디오 데이터를 디코딩할 수도 있다. 이에 따라, 목적지 디바이스 (14) 는 비디오 디코딩 디바이스 또는 비디오 디코딩 장치라고 지칭될 수도 있다. 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 비디오 코딩 디바이스들 또는 비디오 코딩 장치들의 예들일 수도 있다.

소스 디바이스 (12) 및 목적지 디바이스 (14) 는, 데스크톱 컴퓨터들, 모바일 컴퓨팅 디바이스들, 노트북 (예를 들어, 랩톱) 컴퓨터들, 태블릿 컴퓨터들, 셋톱 박스들, 전화기 핸드셋들, 예컨대, 소위 "스마트" 폰들, 텔레비전들, 카메라들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 콘솔들, 차량내 컴퓨터들 등을 포함하는 광범위한 디바이스들을 포함할 수도 있다.

목적지 디바이스 (14) 는 채널 (16) 을 통해 소스 디바이스 (12) 로부터 인코딩된 비디오 데이터를 수신할 수도 있다. 채널 (16) 은 인코딩된 비디오 데이터를 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 이동시키는 것이 가능한 하나 이상의 매체들 또는 디바이스들을 포함할 수도 있다. 하나의 예에서, 채널 (16) 은 소스 디바이스 (12) 로 하여금 인코딩된 비디오 데이터를 직접 목적지 디바이스 (14) 에 실시간으로 송신할 수 있게 하는 하나 이상의 통신 매체들을 포함할 수도 있다. 이 예에서, 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 무선 통신 프로토콜과 같은 통신 표준에 따라 변조할 수도 있고, 변조된 비디오 데이터를 목적지 디바이스 (14) 에 송신할 수도 있다. 하나 이상의 통신 매체들은 무선 또는 유선 통신 매체, 예컨대, 무선 주파수 (RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인들을 포함할 수도 있다. 하나 이상의 통신 매체들은 패킷 기반 네트워크, 예컨대, 로컬 영역 네트워크, 광역 네트워크, 또는 글로벌 네트워크 (예를 들어, 인터넷) 의 부분을 형성할 수도 있다. 하나 이상의 통신 매체들은 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로의 통신을 용이하게 하는 다른 장비를 포함할 수도 있다.

다른 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성되는 인코딩된 비디오 데이터를 저장하는 저장 매체를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는, 예를 들어, 디스크 액세스 또는 카드 액세스를 통해 저장 매체에 액세스할 수도 있다. 저장 매체는 블루레이 디스크들, DVD들, CD-ROM들, 플래시 메모리, 또는 인코딩된 비디오 데이터를 저장하기 위한 다른 적합한 디지털 저장 매체들과 같은 다양한 로컬 액세스 데이터 저장 매체들을 포함할 수도 있다.

추가의 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성되는 인코딩된 비디오 데이터를 저장하는 파일 서버 또는 다른 중간 저장 디바이스를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는 스트리밍 또는 다운로드를 통해 파일 서버 또는 다른 중간 저장 디바이스에 저장되는 인코딩된 비디오 데이터에 액세스할 수도 있다. 파일 서버는 인코딩된 비디오 데이터를 저장하는 것 및 인코딩된 비디오 데이터를 목적지 디바이스 (14) 에 송신하는 것이 가능한 서버의 한 타입일 수도 있다. 예시적인 파일 서버들은 (예를 들어, 웹사이트를 위한) 웹 서버들, 파일 전송 프로토콜 (FTP) 서버들, 네트워크 연결 저장 (network attached storage; NAS) 디바이스들, 또는 로컬 디스크 드라이브들을 포함한다.

목적지 디바이스 (14) 는 인터넷 접속과 같은 표준 데이터 접속을 통해 인코딩된 비디오 데이터에 액세스할 수도 있다. 데이터 접속들의 예시적인 타입들은 파일 서버에 저장된 인코딩된 비디오 데이터에 액세스하기에 적합한 무선 채널들 (예를 들어, Wi-Fi 접속들), 유선 접속들 (예를 들어, 디지털 가입자 라인 (DSL), 케이블 모뎀 등), 또는 이들 양쪽의 조합들을 포함할 수도 있다. 파일 서버로부터의 인코딩된 비디오 데이터의 송신은, 스트리밍 송신, 다운로드 송신, 또는 이들 양쪽의 조합일 수도 있다.

본 개시물의 기법들은 무선 애플리케이션들 또는 세팅들로 제한되지 않는다. 이 기법들은 다양한 멀티미디어 애플리케이션들, 예컨대, 공중경유 (over-the-air) 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, 스트리밍 비디오 송신들, 예를 들어, 인터넷을 통한 스트리밍 비디오 송신들, 데이터 저장 매체 상의 저장을 위한 비디오 데이터의 인코딩, 데이터 저장 매체 상에 저장된 비디오 데이터의 디코딩, 또는 다른 애플리케이션들의 지원 하의 비디오 코딩에 적용될 수도 있다. 일부 예들에서는, 비디오 코딩 시스템 (10) 은 1방향 또는 2방향 비디오 송신을 지원하여 애플리케이션들, 예컨대, 비디오 스트리밍, 비디오 재생, 비디오 브로드캐스팅, 및/또는 비디오 텔레포니를 지원하도록 구성될 수도 있다.

도 1 은 일 예에 불과하고, 본 개시물의 기법들은 인코딩 디바이스와 디코딩 디바이스 사이의 임의의 데이터 통신을 반드시 포함하지는 않는 비디오 코딩 세팅들 (예를 들어, 비디오 인코딩 또는 비디오 디코딩) 에 적용할 수도 있다. 다른 예들에서, 데이터는 로컬 메모리로부터 취출되거나, 네트워크를 통해 스트리밍되거나 등으로 된다. 비디오 인코딩 디바이스는 데이터를 인코딩하여 메모리에 저장할 수도 있거나, 및/또는 디코딩 디바이스는 메모리로부터 데이터를 취출하여 디코딩할 수도 있다. 많은 예들에서, 인코딩 및 디코딩은, 서로 통신하지 않지만, 단순히 메모리에 대한 데이터를 인코딩하거나 및/또는 메모리로부터 데이터를 취출하여 디코딩하는 디바이스들에 의해 수행된다.

도 1 의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20) 및 출력 인터페이스 (22) 를 포함한다. 일부 예들에서, 출력 인터페이스 (22) 는 변조기/복조기 (모뎀) 및/또는 송신기를 포함할 수도 있다. 비디오 소스 (18) 는 비디오 캡처 디바이스, 예를 들어, 비디오 카메라, 이전에 캡처된 비디오 데이터를 포함하는 비디오 아카이브, 비디오 데이터를 비디오 콘텐츠 제공자로부터 수신하기 위한 비디오 피드 인터페이스, 및/또는 비디오 데이터를 생성하기 위한 컴퓨터 그래픽 시스템, 또는 비디오 데이터의 이러한 소스들의 조합을 포함할 수도 있다.

비디오 인코더 (20) 는 비디오 소스 (18) 로부터의 비디오 데이터를 인코딩할 수도 있다. 일부 예들에서, 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 출력 인터페이스 (22) 를 통해 목적지 디바이스 (14) 에 직접 송신한다. 다른 예들에서, 인코딩된 비디오 데이터는 또한 디코딩 및/또는 재생을 위해 목적지 디바이스 (14) 에 의한 추후 액세스를 위해 저장 매체 또는 파일 서버에 저장될 수도 있다.

도 1 의 예에서, 목적지 디바이스 (14) 는 입력 인터페이스 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 포함한다. 일부 예들에서, 입력 인터페이스 (28) 는 수신기 및/또는 모뎀을 포함한다. 입력 인터페이스 (28) 는 인코딩된 비디오 데이터를 채널 (16) 을 통해 수신할 수도 있다. 비디오 디코더 (30) 는 인코딩된 비디오 데이터를 디코딩할 수도 있다. 디스플레이 디바이스 (32) 는 디코딩된 비디오 데이터를 디스플레이할 수도 있다. 디스플레이 디바이스 (32) 는 목적지 디바이스 (14) 와 통합될 수도 있거나, 또는 그 외부에 존재할 수도 있다. 디스플레이 디바이스 (32) 는, 다양한 디스플레이 디바이스들, 예컨대, 액정 디스플레이 (liquid crystal display; LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (organic light emitting diode; OLED) 디스플레이, 또는 다른 타입의 디스플레이 디바이스를 포함할 수도 있다.

비디오 인코더 (20) 및 비디오 디코더 (30) 각각은, 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서 (digital signal processor; DSP) 들, 주문형 집적 회로 (application specific integrated circuit; ASIC) 들, 필드 프로그램가능 게이트 어레이 (field-programmable gate array; FPGA) 들, 이산 로직, 하드웨어, 또는 이들의 임의의 조합과 같은 다양한 적합한 회로부 중 임의의 것으로서 구현될 수도 있다. 이 기법들이 부분적으로 소프트웨어로 구현되면, 디바이스는 그 소프트웨어에 대한 명령들을 적합한 비일시적 컴퓨터 판독가능 저장 매체에 저장할 수도 있고 그 명령들을 하드웨어로 하나 이상의 프로세서들을 사용하여 실행함으로써 본 개시물의 기법들을 수행할 수도 있다. (하드웨어, 스프트웨어, 하드웨어와 소프트웨어의 조합 등을 포함하여) 전술한 것들 중 임의의 것이 하나 이상의 프로세서들인 것으로 고려될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 하나 이상의 인코더들 또는 디코더들에 포함될 수도 있고, 이들 중 어느 하나는 결합형 인코더/디코더 (CODEC) 의 부분으로서 각각의 디바이스에 통합될 수도 있다.

본 개시물은 일반적으로, 다른 디바이스, 예컨대, 비디오 디코더 (30) 로 특정 정보를 "시그널링" 하는 비디오 인코더 (20) 에 관련된 것일 수도 있다. 용어 "시그널링" 은 일반적으로 압축된 비디오 데이터를 디코딩하는데 사용되는 신택스 엘리먼트들 또는 다른 데이터의 통신을 지칭할 수도 있다. 이러한 통신은 실시간으로 또는 근실시간으로 발생할 수도 있다. 대안적으로, 이러한 통신은 시간의 기간에 걸쳐 발생할 수도 있는데, 예컨대, 인코딩시에 인코딩된 비트스트림으로 컴퓨터 판독가능 저장 매체에 신택스 엘리먼트들을 저장하는 경우 발생할 수도 있으며, 이 신택스 엘리먼트들은 그 후에 이러한 매체에 저장된 후의 임의의 시간에 디코딩 디바이스에 의해 취출될 수도 있다.

일부 예들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 그 스케일러블 비디오 코딩 (Scalable Video Coding; SVC) 확장, 멀티뷰 비디오 코딩 (Multiview Video Coding; MVC) 확장, 및 MVC-기반 3차원 비디오 (3DV) 확장을 포함하는 ISO (International Organization for Standardization)/IEC MPEG-4 비주얼 (Visual) 및 ITU-T H.264 (또한 ISO/IEC MPEG-4 AVC 라고 알려짐) 와 같은 비디오 압축 표준에 따라 동작한다. 일부의 경우들에서, H.264/AVC 의 MVC-기반 3DV 확장을 준수하는 임의의 비트스트림은 H.264/AVC 의 MVC 확장을 준수하는 서브-비트스트림을 항상 포함한다. 또한, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 현재 개발 중에 있는 H.264/AVC 에 대한 3DV 코딩 확장 (즉, AVC-기반 3DV) 에 따라 동작할 수도 있다. 다른 예들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 ITU-T (International Telecommunication Union Telecommunication Standardization Sector) H.261, ISO (International Organization for Standardization)/IEC (International Electrotechnical Commission) MPEG (Moving Picture Experts Group)-1 비주얼, ITU-T H.262 또는 ISO/IEC MPEG-2 비주얼, 및 ITU-T H.264, ISO/IEC 비주얼에 따라 동작할 수도 있다.

다른 예들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 ITU-T 비디오 코딩 전문가 그룹 (Video Coding Experts Group; VCEG) 및 ISO/IEC 동영상 전문가 그룹 (Motion Picture Experts Group; MPEG) 의 비디오 코딩에 관한 공동 협력팀 (Joint Collaboration Team on Video Coding; JCT-VC) 에 의해 개발된 고효율 비디오 코딩 (HEVC) 에 따라 동작할 수도 있다. "HEVC 작업 초안 8 (HEVC Working Draft 8)" 이라고 지칭되는 HEVC 표준의 초안은 「Bross 등, "High Efficiency Video Coding (HEVC) text specification draft 8", ITU-T SG16 WP3 과 ISO/IEC JTC1/SC29/WG11 의 비디오 코딩에 관한 공동 협력팀 (JCT-VC), 10차 회의, 스웨덴 스톡홀름, 2012년 7월」에 설명되어 있으며, 이는 2013년 9월 17일 시점에서, http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip 으로부터 입수가능하다. 또한, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 스케일러블 비디오 코딩, 멀티-뷰 코딩, 및 현재 개발 중인 HEVC 에 대한 3DV 확장들에 따라 동작할 수도 있다. HEVC 의 스케일러블 비디오 코딩 확장은 SHEVC 라고 지칭될 수도 있다. HEVC 의 3DV 확장은 HEVC-기반 3DV 또는 3D-HEVC 라고 지칭될 수도 있다.

HEVC 및 다른 비디오 코딩 사양들에서, 비디오 시퀀스는 통상적으로 일련의 픽처들을 포함한다. 픽처들은 또한 "프레임들" 이라고 지칭될 수도 있다. 픽처는 S_L, S_Cb 및 S_Cr 로 나타내는 3개의 샘플 어레이들을 포함할 수도 있다. S_L 은 루마 샘플들의 2차원 어레이 (즉, 블록) 이다. S_Cb 는 Cb 크로미넌스 샘플들의 2차원 어레이이다. S_Cr 은 Cr 크로미넌스 샘플들의 2차원 어레이이다. 크로미넌스 샘플들은 또한 여기에서 "크로마" 샘플들이라고 지칭될 수도 있다. 다른 경우들에서, 픽처는 단색 (monochrome) 일 수도 있고, 루마 샘플들의 어레이를 단지 포함할 수도 있다.

픽처의 인코딩된 표현을 생성하기 위해, 비디오 인코더 (20) 는 코딩 트리 유닛 (CTU) 들의 세트를 생성할 수도 있다. CTU들 각각은 루마 샘플들의 코딩 트리 블록, 크로마 샘플들의 2개의 대응하는 코딩 트리 블록들, 및 코딩 트리 블록들의 샘플들을 코딩하는데 사용되는 신택스 구조들을 포함할 수도 있다. 단색 픽처들 또는 3개의 개별 컬러 평면들을 갖는 픽처들에서, CTU 는 단일 코딩 트리 블록 및 코딩 트리 블록의 샘플들을 코딩하는데 사용되는 신택스 구조들을 포함할 수도 있다. 코딩 트리 블록은 샘플들의 NxN 블록일 수도 있다. CTU 는 또한 "트리 블록" 또는 "최대 코딩 유닛 (largest coding unit)" (LCU) 이라고 지칭될 수도 있다. HEVC 의 CTU들은 H.264/AVC 와 같은 다른 표준들의 매크로블록들과 대략 유사할 수도 있다. 그러나, CTU 는 반드시 특정 사이즈로 제한되는 것은 아니고, 하나 이상의 코딩 유닛 (coding unit; CU) 들을 포함할 수도 있다. 슬라이스는 래스터 스캔 순서 (raster scan order) 로 연속적으로 순서화된 정수 (integer number) 의 CTU들을 포함할 수도 있다.

코딩된 CTU 를 생성하기 위해, 비디오 인코더 (20) 는 코딩 트리 블록들을 코딩 블록들, 이에 따라, 명칭 "코딩 트리 유닛들" 로 분할하기 위해, CTU 의 코딩 트리 블록들에 대해 쿼드-트리 파티셔닝을 재귀적으로 수행할 수도 있다. 코딩 블록은 샘플들의 NxN 블록이다. CU 는, 루마 샘플 어레이, Cb 샘플 어레이, 및 Cr 샘플 어레이를 갖는 픽처의 크로마 샘플들의 2개의 대응하는 코딩 블록들 및 루마 샘플들의 코딩 블록, 및 코딩 블록들의 샘플들을 코딩하는데 사용되는 신택스 구조들을 포함할 수도 있다. 단색 픽처들 또는 3개의 개별 컬러 평면들을 갖는 픽처들에서, CU 는 단일 코딩 블록 및 코딩 블록의 샘플들을 코딩하는데 사용되는 신택스 구조들을 포함할 수도 있다.

비디오 인코더 (20) 는 CU 의 코딩 블록을 하나 이상의 예측 블록들로 파티셔닝할 수도 있다. 예측 블록은 동일한 예측이 적용되는 샘플들의 직사각형 (즉, 정사각형 또는 비-정사각형) 블록이다. CU 의 예측 유닛 (prediction unit; PU) 은 루마 샘플들의 예측 블록, 크로마 샘플들의 2개의 대응하는 예측 블록들, 및 예측 블록들을 예측하는데 사용되는 신택스 구조들을 포함할 수도 있다. 단색 픽처들 또는 3개의 개별 컬러 평면들을 갖는 픽처들에서, PU 는 단일 예측 블록 및 예측 블록을 예측하는데 사용되는 신택스 구조들을 포함할 수도 있다. 비디오 인코더 (20) 는 예측 루마, 루마에 대한 Cb 및 Cr 블록들, CU 의 각 PU 의 Cb 및 Cr 예측 블록들을 생성할 수도 있다.

비디오 인코더 (20) 는 PU 에 대한 예측 블록들을 생성하기 위해 인트라 예측 또는 인터 예측을 사용할 수도 있다. 비디오 인코더 (20) 가 PU 의 예측 블록들을 생성하기 위해 인트라 예측을 사용할 경우, 비디오 인코더 (20) 는 PU 와 연관된 픽처의 디코딩된 샘플들에 기초하여 PU 의 예측 블록들을 생성할 수도 있다. 본 개시물에서, "에 기초하여" 라는 어구는 "에 적어도 부분적으로 기초하여" 를 나타낼 수도 있다. 비디오 인코더 (20) 가 PU 의 예측 블록들을 생성하기 위해 인터 예측을 사용할 경우, 비디오 인코더 (20) 는 PU 와 연관된 픽처 이외의 하나 이상의 픽처들의 디코딩된 샘플들에 기초하여 PU 의 예측 블록들을 생성할 수도 있다.

인터 예측을 지원하기 위해, 비디오 인코더 (20) 는 하나 이상의 참조 픽처 리스트들을 생성할 수도 있다. 이들 참조 픽처 리스트들은 RefPicList0 및 RefPicList1 이라고 지칭될 수도 있다. 일부 예들에서, 비디오 인코더 (20) 는 상이한 픽처들의 상이한 참조 픽처 리스트들 또는 픽처들의 상이한 슬라이스들을 생성할 수도 있다. 이에 따라, 상이한 픽처들 및/또는 슬라이스들의 상이한 PU들은 RefPicList0 및 RefPicList1 의 상이한 버전들과 연관될 수도 있다.

또한, 비디오 인코더 (20) 가 PU 의 예측 블록을 생성하기 위해 인터 예측을 사용할 때, 비디오 인코더 (20) 는 PU 에 대한 모션 정보를 시그널링할 수도 있다. 모션 정보는 PU 에 대한 참조 인덱스 및 PU 에 대한 모션 벡터를 포함할 수도 있다. PU 에 대한 참조 인덱스는, 참조 픽처의, PU 와 연관된 참조 픽처 리스트들 중 하나 내의, 포지션을 나타낼 수도 있다. PU 에 대한 모션 벡터는 참조 픽처에서의 참조 위치와 PU 의 예측 블록 사이의 공간적 변위를 나타낼 수도 있다. 비디오 인코더 (20) 는 참조 위치와 연관된 참조 픽처의 샘플들을 사용하여 PU 에 대한 예측 블록을 생성할 수도 있다. PU 가 2개의 참조 픽처들과 연관될 수도 있기 때문에, PU 는 2개의 참조 인덱스들 및 2개의 모션 벡터들을 가질 수도 있다. 이에 따라, PU 는 RefPicList0 참조 인덱스 및 RefPicList1 참조 인덱스를 가질 수도 있다. PU 의 RefPicList0 참조 인덱스는 RefPicList0 의 PU 의 버전으로 참조 픽처를 나타낸다. PU 의 RefPicList1 참조 인덱스는 RefPicList1 의 PU 의 버전으로 참조 픽처를 나타낸다. 이와 유사하게, PU 는 RefPicList0 모션 벡터 및 RefPicList1 모션 벡터를 가질 수도 있다. PU 의 RefPicList0 모션 벡터는 RefPicList0 의 PU 의 버전으로 참조 픽처에서의 참조 위치를 나타낼 수도 있다. PU 의 RefPicList1 모션 벡터는 RefPicList1 의 PU 의 버전으로 참조 픽처에서의 참조 위치를 나타낼 수도 있다.

비디오 인코더 (20) 는 PU 의 참조 인덱스들 및 모션 벡터들을 비트스트림으로 시그널링할 수도 있다. 다시 말해, 비디오 인코더 (20) 는, 비트스트림에, PU 의 참조 인덱스들 및 모션 벡터들을 나타내는 데이터를 포함할 수도 있다. 비디오 디코더 (30) 는 RefPicList0 및/또는 RefPicList1 의 PU 의 버전들을 재구성할 수도 있고 PU 의 참조 인덱스들 및 모션 벡터들을 사용하여 PU 에 대한 하나 이상의 예측 블록들을 결정할 수도 있다. 비디오 디코더 (30) 는, 잔차 데이터 (residual data) 와 함께, PU 에 대한 예측 블록들을 사용하여 샘플들을 디코딩할 수도 있다.

비디오 인코더 (20) 가 CU 의 하나 이상의 PU들에 대한 예측 루마 블록들을 생성한 후에, 비디오 인코더 (20) 는 CU 에 대한 루마 잔차 블록을 생성할 수도 있다. CU 의 루마 잔차 블록에서의 각각의 샘플은 CU 의 예측 루마 블록들 중 하나에서의 루마 샘플과, CU 의 오리지널 루마 코딩 블록에서의 대응하는 샘플과의 사이의 차이를 나타낸다. 부가적으로, 비디오 인코더 (20) 는 CU 에 대한 Cb 잔차 블록을 생성할 수도 있다. CU 의 Cb 잔차 블록에서의 각각의 샘플은 CU 의 예측 Cb 블록들 중 하나에서의 Cb 샘플과, CU 의 오리지널 Cb 코딩 블록에서의 대응하는 샘플과의 사이의 차이를 나타낼 수도 있다. 비디오 인코더 (20) 는 또한 CU 에 대한 Cr 잔차 블록을 생성할 수도 있다. CU 의 Cr 잔차 블록에서의 각각의 샘플은 CU 의 예측 Cr 블록들 중 하나에서의 Cr 샘플과, CU 의 오리지널 Cr 코딩 블록에서의 대응하는 샘플과의 사이의 차이를 나타낼 수도 있다.

또한, 비디오 인코더 (20) 는 CU 의 루마, Cb, 및 Cr 잔차 블록들을 하나 이상의 루마, Cb, 및 Cr 변환 블록들로 분해하기 위해 쿼드-트리 파티셔닝을 사용할 수도 있다. 변환 블록은 동일한 변환이 적용되는 샘플들의 직사각형 (예를 들어, 정사각형 또는 비-정사각형) 블록일 수도 있다. CU 의 변환 유닛 (TU) 은 루마 샘플들의 변환 블록, 크로마 샘플들의 2개의 대응하는 변환 블록들, 및 변환 블록 샘플들을 변환하는데 사용되는 신택스 구조들을 포함할 수도 있다. 따라서, CU 의 각각의 TU 는 루마 변환 블록, Cb 변환 블록, 및 Cr 변환 블록과 연관될 수도 있다. TU 와 연관된 루마 변환 블록은 CU 의 루마 잔차 블록의 서브-블록일 수도 있다. Cb 변환 블록은 CU 의 Cb 잔차 블록의 서브-블록일 수도 있다. Cr 변환 블록은 CU 의 Cr 잔차 블록의 서브-블록일 수도 있다. 단색 픽처들 또는 3개의 개별 컬러 평면들을 갖는 픽처들에서, TU 는 단일 변환 블록 및 변환 블록의 샘플들을 변환하는데 사용되는 신택스 구조들을 포함할 수도 있다.

비디오 인코더 (20) 는 TU 에 대한 루마 계수 블록을 생성하기 위해 하나 이상의 변환들을 TU 의 루마 변환 블록에 적용할 수도 있다. 계수 블록은 변환 계수들의 2차원 어레이일 수도 있다. 변환 계수는 스칼라 양 (scalar quantity) 일 수도 있다. 비디오 인코더 (20) 는 TU 에 대한 Cb 계수 블록을 생성하기 위해 하나 이상의 변환들을 TU 의 Cb 변환 블록에 적용할 수도 있다. 비디오 인코더 (20) 는 TU 에 대한 Cr 계수 블록을 생성하기 위해 하나 이상의 변환들을 TU 의 Cr 변환 블록에 적용할 수도 있다.

계수 블록 (예를 들어, 루마 계수 블록, Cb 계수 블록 또는 Cr 계수 블록) 을 생성한 후에, 비디오 인코더 (20) 는 계수 블록을 양자화할 수도 있다. 양자화는 일반적으로, 변환 계수들을 표현하는데 사용되는 데이터의 양을 가능한 대로 감소시키기 위해 변환 계수들이 양자화되어 추가의 압축을 제공하는 프로세스를 지칭한다. 비디오 인코더 (20) 가 계수 블록을 양자화한 후에, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들을 엔트로피 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들에 대해 콘텍스트-적응 이진 산술 코딩 (Context-Adaptive Binary Arithmetic Coding; CABAC) 을 수행할 수도 있다.

비디오 인코더 (20) 는 코딩된 픽처들 및 연관된 데이터의 표현을 형성하는 비트들의 시퀀스를 포함하는 비트스트림을 출력할 수도 있다. 용어 "비트스트림" 은 네트워크 추상화 레이어 (NAL) 유닛 스트림 (예를 들어, NAL 유닛들의 시퀀스) 또는 바이트 스트림 (예를 들어, HEVC 표준의 부록 B 에 의해 특정된 NAL 유닛들 및 시작 코드 프리픽스들을 포함하는 NAL 유닛 스트림의 캡슐화) 중 어느 하나를 지칭하는데 사용되는 통칭되는 용어일 수도 있다. NAL 유닛은 NAL 유닛에서의 데이터의 타입의 표시, 및 에뮬레이션 방지 비트들과 함께 필요에 따라 산재된 원시 바이트 시퀀스 페이로드 (raw byte sequence payload; RBSP) 의 형태로 그 데이터를 포함하는 바이트들을 포함하는 신택스 구조이다. NAL 유닛들 각각은 NAL 유닛 헤더를 포함할 수도 있고, RBSP 를 캡슐화할 수도 있다. NAL 유닛 헤더는 NAL 유닛 타입 코드를 나타내는 신택스 엘리먼트를 포함할 수도 있다. NAL 유닛의 NAL 유닛 헤더에 의해 특정된 NAL 유닛 타입 코드는 NAL 유닛의 타입을 나타낸다. RBSP 는 NAL 유닛 내에 캡슐화되는 정수의 바이트들을 포함하는 신택스 구조일 수도 있다. 일부의 경우들에서, RBSP 는 0 비트들을 포함한다.

상이한 타입들의 NAL 유닛들은 상이한 타입들의 RBSP들을 캡슐화할 수도 있다. 예를 들어, 제 1 타입의 NAL 유닛은 픽처 파라미터 세트 (picture parameter set; PPS) 에 대한 RBSP 를 캡슐화할 수도 있고, 제 2 타입의 NAL 유닛은 코딩된 슬라이스의 RBSP 를 캡슐화할 수도 있고, 제 3 타입의 NAL 유닛은 SEI 에 대한 RBSP 를 캡슐화할 수도 있다는 것 등이다. (파라미터 세트들 및 SEI 메시지들에 대한 RBSP들과는 반대로) 비디오 코딩 데이터에 대한 RBSP들을 캡슐화하는 NAL 유닛들은 비디오 코딩 레이어 (video coding layer; VCL) NAL 유닛들이라고 지칭될 수도 있다. 파라미터 세트들 (예를 들어, 비디오 파라미터 세트 (video parameter set; VPS) 들, 시퀀스 파라미터 세트 (SPS) 들, PPS들 등) 을 포함하는 NAL 유닛들은 파라미터 세트 NAL 유닛들이라고 지칭될 수도 있다.

비디오 디코더 (30) 는 비디오 인코더 (20) 에 의해 생성된 비트스트림을 수신할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 비트스트림으로부터 신택스 엘리먼트들을 획득하기 위해 비트스트림을 파싱 (parse) 할 수도 있다. 비디오 디코더 (30) 는 비트스트림으로부터 획득된 신택스 엘리먼트들에 적어도 부분적으로 기초하여 비디오 데이터의 픽처들을 재구성할 수도 있다. 비디오 데이터를 재구성하기 위한 프로세스는 비디오 인코더 (20) 에 의해 수행된 프로세스와 일반적으로 상반될 수도 있다. 예를 들어, 비디오 디코더 (30) 는 현재 CU 의 PU들에 대한 예측 블록들을 결정하기 위해 PU들의 모션 벡터들을 사용할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 현재 CU 의 TU들과 연관된 계수 블록들을 역양자화할 수도 있다. 비디오 디코더 (30) 는 현재 CU 의 TU들과 연관된 변환 블록들을 재구성하기 위해 계수 블록들에 대해 역변환들을 수행할 수도 있다. 비디오 디코더 (30) 는 현재 CU 의 PU들에 대한 예측 블록들의 샘플들을 현재 CU 의 TU들의 변환 블록들의 대응하는 샘플들에 부가함으로써, 현재 CU 의 코딩 블록들을 재구성할 수도 있다. 픽처의 각각의 CU 에 대한 코딩 블록들을 재구성함으로써, 비디오 디코더 (30) 는 픽처를 재구성할 수도 있다.

멀티-뷰 코딩에서는, 상이한 뷰포인트들로부터 동일한 장면의 다수의 뷰들이 존재할 수도 있다. 멀티-뷰 코딩의 맥락에서, 용어 "액세스 유닛" 은 동일한 시간 인스턴스에 대응하는 픽처들의 세트를 지칭하기 위해 사용될 수도 있다. 따라서, 비디오 데이터는 시간이 지남에 따라 발생하는 일련의 액세스 유닛들로서 개념화될 수도 있다. "뷰 컴포넌트" 는 단일 액세스 유닛에서 뷰의 인코딩된 표현일 수도 있다. 본 개시물에서, "뷰" 는 동일한 뷰 식별자와 연관된 뷰 컴포넌트들의 시퀀스를 지칭할 수도 있다. 일부 예들에서, 뷰 컴포넌트는 텍스처 뷰 컴포넌트 (즉, 텍스처 픽처) 또는 심도 (depth) 뷰 컴포넌트 (즉, 심도 픽처) 일 수도 있다.

멀티-뷰 코딩은 인터-뷰 예측을 지원한다. 인터-뷰 예측은 HEVC 에서 사용되는 인터 예측과 유사하고, 동일한 신택스 엘리먼트들을 사용할 수도 있다. 그러나, 비디오 코더가 (PU 와 같은) 현재 비디오 유닛에 대해 인터-뷰 예측을 수행할 때, 비디오 코더는, 참조 픽처로서, 현재 비디오 유닛과 동일한 액세스 유닛에 있지만 상이한 뷰에 있는 픽처를 사용할 수도 있다. 반대로, 종래의 인터 예측은 단지 참조 픽처들과 상이한 액세스 유닛들에서의 픽처들을 사용한다.

멀티-뷰 코딩에서는, 비디오 디코더 (예를 들어, 비디오 디코더 (30)) 가 임의의 다른 뷰에서의 픽처들을 참조하는 일 없이 뷰에서의 픽처들을 디코딩할 수 있을 경우에, 뷰는 "기본 뷰" 라고 지칭될 수도 있다. 비-기본 (non-base) 뷰에서의 픽처를 코딩할 때에는, 픽처가 상이한 뷰에 있지만 비디오 코더가 현재 코딩하고 있는 픽처와 동일한 시간 인스턴스 (즉, 액세스 유닛) 내에 있을 경우에, (비디오 인코더 (20) 또는 비디오 디코더 (30) 와 같은) 비디오 코더는 픽처를 참조 픽처 리스트 내에 부가할 수도 있다. 다른 인터 예측 참조 픽처들처럼, 비디오 코더는 참조 픽처 리스트의 임의의 위치에서 인터-뷰 예측 참조 픽처를 삽입할 수도 있다.

예를 들어, NAL 유닛들은 헤더들 (즉, NAL 유닛 헤더들) 및 페이로드들 (예를 들어, RBSP들) 을 포함할 수도 있다. NAL 유닛 헤더들은 nuh_reserved_zero_6bits 신택스 엘리먼트들을 포함할 수도 있다. 상이한 값들을 특정하는 nuh_reserved_zero_6bit 신택스 엘리먼트들을 갖는 NAL 유닛들은 비트스트림의 상이한 "레이어들" 에 속한다. 따라서, 멀티-뷰 코딩, 3DV, 또는 SVC 에서, NAL 유닛의 nuh_reserved_zero_6bits 신택스 엘리먼트는 NAL 유닛의 레이어 식별자 (즉, 레이어 ID) 를 특정한다. 일부 예들에서, 멀티-뷰 코딩, 3DV 코딩, 또는 SVC 에서 NAL 유닛이 기본 레이어와 관련된 경우 NAL 유닛의 nuh_reserved_zero_6bits 신택스 엘리먼트는 0 과 동일하다. 비트스트림의 기본 레이어에서의 데이터는 비트스트림의 임의의 다른 레이어에서의 데이터를 참조하는 일 없이 디코딩될 수도 있다. 멀티-뷰 코딩, 3DV, 또는 SVC 에서 NAL 유닛이 기본 레이어와 관련되지 않은 경우, nuh_reserved_zero_6bits 신택스 엘리먼트는 논-제로 (non-zero) 값을 가질 수도 있다. 멀티-뷰 코딩 및 3DV 코딩에서, 비트스트림의 상이한 레이어들은 상이한 뷰들에 대응할 수도 있다. SVC 에서, 기본 레이어 이외의 레이어들은 "인핸스먼트 레이어들" 이라고 지칭될 수도 있고, 비트스트림으로부터 디코딩된 비디오 데이터의 시각 품질을 향상시키는 정보를 제공할 수도 있다.

또한, 레이어 내의 일부 픽처들은 동일한 레이어 내의 다른 픽처들을 참조하는 일 없이 디코딩될 수도 있다. 따라서, 레이어의 특정 픽처들의 데이터를 캡슐화하는 NAL 유닛들은 레이어에서의 다른 픽처들의 디코딩능력에 영향을 미치는 일 없이 비트스트림으로부터 제거될 수도 있다. 이러한 픽처들의 데이터를 캡슐화하는 NAL 유닛들을 제거하는 것은 비트스트림의 프레임 레이트를 감소시킬 수도 있다. 레이어 내의 다른 픽처들을 참조하는 일 없이 디코딩될 수도 있는 레이어 내의 픽처들의 서브세트는 여기에서 "서브-레이어" 또는 "시간적 서브-레이어" 라고 지칭될 수도 있다.

NAL 유닛들은 temporal_id 신택스 엘리먼트들을 포함할 수도 있다. NAL 유닛의 temporal_id 신택스 엘리먼트는 NAL 유닛의 시간적 식별자를 특정한다. NAL 유닛의 시간적 식별자는 NAL 유닛이 연관되는 서브-레이어를 식별한다. 따라서, 비트스트림의 각각의 서브-레이어는 상이한 시간적 식별자와 연관될 수도 있다. 제 1 NAL 유닛의 시간적 식별자가 제 2 NAL 유닛의 시간적 식별자보다 더 작은 경우, 제 1 NAL 유닛에 의해 캡슐화된 데이터는 제 2 NAL 유닛에 의해 캡슐화된 데이터를 참조하는 일 없이 디코딩될 수도 있다.

H.264/AVC 및 HEVC 에서, SPS들은 CVS 의 모든 슬라이스들에 적용되는 정보를 포함할 수도 있다. HEVC 에서, CVS 는 IDR (instantaneous decoding refresh) 픽처, BLA (broken link access) 픽처, 또는 IDR 또는 BLA 픽처가 아닌 모든 후속하는 픽처들을 포함하여, 비트스트림에서 제 1 픽처인 CRA (clean random access) 픽처로부터 시작할 수도 있다. 즉, HEVC 에서, CVS 는, 디코딩 순서로, 비트스트림에서의 제 1 액세스 유닛인 CRA 액세스 유닛, IDR 액세스 유닛 또는 BLA 액세스 유닛, 다음으로 모든 후속 액세스 유닛들을 포함하지만 어떠한 후속 IDR 또는 BLA 액세스 유닛도 포함하지 않는 0 이상의 비-IDR 및 비-BLA 액세스 유닛들로 이루질 수도 있는 액세스 유닛들의 시퀀스를 포함할 수도 있다.

HEVC 및 다른 비디오 코딩 표준들은 비트스트림들로 랜덤 액세스를 가능하게 하는 메커니즘들을 제공한다. 랜덤 액세스는 비트스트림에서 제 1 코딩된 픽처가 아닌 코딩된 픽처로부터 시작하는 비트스트림의 디코딩을 지칭한다. 비트스트림에 대한 랜덤 액세스는 브로드캐스팅 및 스트리밍과 같은 다양한 비디오 애플리케이션들에서 필요할 수도 있다. 비트스트림에 대한 랜덤 액세스는, 사용자들로 하여금 임의의 시간에 프로그램에 맞출 수 있게 하거나, 상이한 채널들 간을 스위칭할 수 있게 하거나, 비디오의 특정 부분들로 점프할 수 있게 하거나, 또는 스트림 적응 (예를 들어, 비트 레이트의 적응, 프레임 레이트의 적응, 또는 공간 해상도의 적응) 을 위한 상이한 비트스트림으로 스위칭할 수 있게 한다. 일정한 간격으로의 비트스트림 내의 랜덤 액세스 포인트 (random access point; RAP) 픽처들의 삽입은 랜덤 액세스를 가능하게 할 수도 있다. RAP 픽처들의 예시적인 타입들로는 IDR 픽처들, CRA 픽처들, 및 BLA 픽처들을 포함한다. 이에 따라, IDR 픽처들, CRA 픽처들 및 BLA 픽처들은 통칭하여 랜덤 액세스 포인트 (RAP) 픽처들이라고 지칭된다.

IDR 픽처는 I 슬라이스들 (즉, 인트라 예측만이 사용되는 슬라이스들) 만을 포함한다. IDR 픽처는 디코딩 순서로 비트스트림에서 제 1 픽처일 수도 있고, 또는 비트스트림에서 나중에 나타날 수도 있다. 각각의 IDR 픽처는 디코딩 순서로 CVS 의 제 1 픽처이다. HEVC 및 H.264/AVC 에 특정된 IDR 픽처들은 랜덤 액세스를 위해 사용될 수도 있다. 그러나, 디코딩 순서로 IDR 픽처에 후속하는 픽처들은 참조로서 IDR 픽처 이전에 디코딩된 픽처들을 사용할 수 없다. 이에 따라, 랜덤 액세스를 위해 IDR 픽처들에 의존하는 비트스트림들은, 랜덤 액세스 픽처들의 부가적인 타입들을 사용하는 비트스트림들보다 상당히 더 낮은 코딩 효율을 가질 수 있다. IDR 액세스 유닛은 IDR 픽처를 포함하는 액세스 유닛이다.

CRA 픽처들의 개념은, 디코딩 순서로는 CRA 픽처에 후속하지만 출력 순서로는 CRA 픽처에 선행하는 픽처들이, 참조를 위해 CRA 픽처 이전에 디코딩된 픽처들을 사용하게 하도록 HEVC 에 도입되었다. 디코딩 순서로는 CRA 픽처에 후속하고 출력 순서로는 CRA 픽처에 선행하는 픽처들은, CRA 픽처와 연관된 선두 픽처들 (leading pictures) (또는 CRA 픽처의 선두 픽처들) 이라고 지칭된다. 즉, 코딩 효율을 개선시키기 위해, CRA 픽처들의 개념은 디코딩 순서로는 CRA 픽처에 후속하지만 출력 순서로는 CRA 픽처에 선행하는 픽처들이 참조로서 CRA 픽처 이전에 디코딩된 픽처들을 사용하게 하도록 HEVC 에 도입되었다. CRA 액세스 유닛은 코딩된 픽처가 CRA 픽처인 액세스 유닛이다.

디코딩 순서로 CRA 픽처 이전에 발생하는 CRA 픽처 또는 IDR 픽처로부터 디코딩이 시작하는 경우 CRA 픽처의 선두 픽처들은 올바르게 디코딩가능하다. 그러나, CRA 픽처로부터의 랜덤 액세스가 발생할 때 CRA 픽처의 선두 픽처들은 디코딩가능하지 않을 수도 있다. 이에 따라, 비디오 디코더는 통상적으로 랜덤 액세스 디코딩 동안 CRA 픽처의 선두 픽처들을 디코딩한다. 디코딩이 시작하는 곳에 따라 이용가능하지 않을 수도 있는 참조 픽처들로부터의 에러 전파를 방지하기 위해, 디코딩 순서와 출력 순서 양쪽 모두에서 CRA 픽처에 후속하는 어떠한 픽처도, 참조로서 (선두 픽처들을 포함하는) 디코딩 순서 또는 출력 순서 중 어느 하나의 순서로 CRA 픽처에 선행하는 어떠한 픽처도 사용하지 않을 수도 있다.

BLA (broken link access) 픽처의 개념은 CRA 픽처들의 도입 후에 HEVC 에 도입되었고 CRA 픽처들의 개념에 기초한다. BLA 픽처는 통상적으로 CRA 픽처의 포지션에서 비트스트림 스플라이싱 (splicing) 으로부터 유래하고, 스플라이싱된 비트스트림에서 스플라이싱 포인트 CRA 픽처는 BLA 픽처로 변경된다. RAP 픽처를 포함하는 액세스 유닛은 여기에서 RAP 액세스 유닛이라고 지칭될 수도 있다. BLA 액세스 유닛은 BLA 픽처를 포함하는 액세스 유닛이다.

BLA 픽처들과 CRA 픽처들 사이의 하나의 차이는 다음과 같다. CRA 픽처에 대해, 디코딩이 디코딩 순서로 CRA 픽처 이전에 RAP 픽처로부터 시작하는 경우, 연관된 선두 픽처들이 올바르게 디코딩가능하다. 그러나, CRA 픽처로부터의 랜덤 액세스가 발생할 때 (즉, 디코딩이 CRA 픽처로부터 시작할 때, 또는 다시 말해, CRA 픽처가 비트스트림에서 제 1 픽처일 때), CRA 픽처와 연관된 선두 픽처들은 올바르게 디코딩가능하지 않을 수도 있다. 반대로, 디코딩 순서로 BLA 픽처 이전에 RAP 픽처로부터 디코딩이 시작할 때에도, BLA 픽처와 연관된 선두 픽처들이 디코딩가능하다는 시나리오는 없을 수도 있다.

특정 CRA 픽처 또는 특정 BLA 픽처와 연관된 선두 픽처들 중 일부는, 특정 CRA 픽처 또는 특정 BLA 픽처가 비트스트림에서 제 1 픽처일 때에도 올바르게 디코딩가능할 수도 있다. 이들 선두 픽처들은 디코딩가능 선두 픽처 (decodable leading picture; DLP) 들이라고 지칭될 수도 있다. 다른 선두 픽처들은 디코딩불가능 선두 픽처 (non-decodable leading picture; NLP) 들이라고 지칭될 수도 있다. HEVC 작업 초안 8 은 또한 NLP들을 TFD (tagged for discard) 픽처들로서 지칭할 수도 있다.

VPS 는, 0 이상의 전체 CVS들에 적용되는 신택스 엘리먼트들을 포함하는 신택스 구조이다. SPS 는, 0 이상의 전체 CVS들에 적용되는 신택스 엘리먼트들을 포함하는 신택스 구조이다. SPS 는, SPS 가 액티브할 때 액티브한 VPS 를 식별하는 신택스 엘리먼트를 포함할 수도 있다. 따라서, VPS 의 신택스 엘리먼트들은 SPS 의 신택스 엘리먼트들보다 더 일반적으로 적용가능할 수도 있다.

파라미터 세트 (예를 들어, VPS, SPS, PPS 등) 는 슬라이스의 슬라이스 헤더로부터 직접적으로 또는 간접적으로 참조되는 식별물을 포함할 수도 있다. 참조 프로세스는 "활성화" 로 알려져 있다. 따라서, 비디오 디코더 (30) 가 특정 슬라이스를 디코딩하고 있을 때, 특정 슬라이스의 슬라이스 헤더에서 신택스 엘리먼트에 의해 직접적으로 또는 간접적으로 참조되는 파라미터 세트는 "활성화된" 것이라고 한다. 파라미터 세트 타입에 따라, 이 활성화는 픽처 기반으로 또는 시퀀스 기반으로 발생할 수도 있다. 예를 들어, 슬라이스의 슬라이스 헤더는 PPS 를 식별하는 신택스 엘리먼트를 포함할 수도 있다. 따라서, 비디오 코더가 슬라이스를 코딩할 때, PPS 가 활성화될 수도 있다. 또한, PPS 는 SPS 를 식별하는 신택스 엘리먼트를 포함할 수도 있다. 따라서, SPS 를 식별하는 PPS 가 활성화될 때, SPS 가 활성화될 수도 있다. SPS 는 VPS 를 식별하는 신택스 엘리먼트를 포함할 수도 있다. 따라서, VPS 를 식별하는 SPS 가 활성화될 때, VPS 가 활성화된다.

HEVC 및 다른 비디오 코딩 표준들은 프로파일들, 티어 (tier) 들, 및 레벨들을 특정한다. 프로파일들, 티어들, 및 레벨들은 비트스트림들에 대한 제약들, 그리고 이에 따라 비트스트림들을 디코딩하는데 필요한 능력들에 대한 제한들을 특정한다. 프로파일들, 티어들, 및 레벨들은 또한 개개의 디코더 구현들 사이의 상호운용 포인트들을 나타내는데 사용될 수도 있다. 각각의 프로파일은, 이러한 프로파일을 준수하는 모든 비디오 디코더들에 의해 지원되는 알고리듬 피처들 및 제한들의 서브세트를 특정할 수도 있다. 비디오 인코더들은 프로파일에 지원된 모든 피처들을 사용하는데 요구되지 않는다. 티어의 각 레벨은 신택스 엘리먼트들이 가질 수도 있는 값들에 대한 제한들의 세트를 특정할 수도 있다. 동일한 세트의 티어 및 레벨 정의들이 모든 프로파일들과 사용될 수도 있지만, 개개의 구현들은 상이한 티어들을 지원하고 티어 내에서는 각각의 지원된 프로파일에 대한 상이한 레벨들을 지원할 수도 있다. 임의의 주어진 프로파일에 대해, 티어의 레벨은 일반적으로 특정 디코더 프로세싱 로드 및 메모리 능력에 대응할 수도 있다. 비디오 디코더들의 능력들은 특정 프로파일들, 티어들, 및 레벨들의 제약들을 준수하는 비디오 스트림들을 디코딩하는 능력의 관점에서 특정될 수도 있다. 각각의 이러한 프로파일에 대해, 이러한 프로파일에 대해 지원되는 티어 및 레벨이 또한 표현될 수도 있다. 일부 비디오 디코더들은 특정 프로파일들, 티어들, 또는 레벨들을 디코딩하는 것이 가능하지 않을 수도 있다.

HEVC 에서, 프로파일들, 티어들, 및 레벨들은 신택스 구조 profile_tier_level() 신택스 구조로 시그널링될 수도 있다. profile_tier_level() 신택스 구조는 VPS 및/또는 SPS 에 포함될 수도 있다. profile_tier_level() 신택스 구조는 general_profile_idc 신택스 엘리먼트, general_tier_flag 신택스 엘리먼트, 및 general_level_idc 신택스 엘리먼트를 포함할 수도 있다. general_profile_idc 신택스 엘리먼트는 CVS 가 준수하는 프로파일을 나타낼 수도 있다. general_tier_flag 신택스 엘리먼트는 general_level_idc 신택스 엘리먼트의 해석을 위한 티어 콘텍스트를 나타낼 수도 있다. general_level_idc 신택스 엘리먼트는 CVS 가 준수하는 레벨을 나타낼 수도 있다. 이들 신택스 엘리먼트들에 대한 다른 값들이 예비될 수도 있다.

비디오 디코더들의 능력들은 프로파일들, 티어들, 및 레벨들의 제약들을 준수하는 비디오 스트림들을 디코딩하는 능력의 관점에서 특정될 수도 있다. 각각의 이러한 프로파일에 대해, 이러한 프로파일에 대해 지원되는 티어 및 레벨이 또한 표현될 수도 있다. 일부 예들에서, 비디오 디코더들은 HEVC 에 특정된 값들 사이의 general_profile_idc 신택스 엘리먼트의 예비된 값이 특정된 프로파일들 사이의 중간 능력들을 나타낸다고 추론하지 않는다. 그러나, 비디오 디코더들은 HEVC 에 특정된 값들 사이의 general_tier_flag 신택스 엘리먼트의 특정 값과 연관된 general_level_idc 신택스 엘리먼트의 예비된 값이 티어의 특정된 레벨들 사이의 중간 능력들을 나타낸다고 추론할 수도 있다.

하나 이상의 HEVC 비트스트림들은 특정 파일 포맷을 준수하는 파일에 저장될 수도 있다. 일부 예들에서, 하나 이상의 비디오 데이터 비트스트림들 (예를 들어, HEVC 비트스트림들) 은 ISO 기반 미디어 파일 포맷 (ISOBMFF) 을 준수하는 파일에 저장될 수도 있다. ISOBMFF 는 또한 ISO/IEC 14496-12 라고 지칭될 수도 있다. 비디오 데이터 비트스트림들의 저장을 위한 다른 예시적인 파일 포맷들은, MPEG-4 파일 포맷 (ISO/IEC 14496-14), 제 3 세대 파트너십 프로젝트 (3GPP) 파일 포맷 (3GPP TS 26.244), 및 AVC 파일 포맷 (ISO/IEC 14496-15) 을 포함하여, ISOBMFF 로부터 도출된 파일 포맷들을 포함한다. HEVC 비디오 콘텐츠의 저장을 위한 AVC 파일 포맷에 대한 수정안이 MPEG 에 의해 개발 중이다. 이러한 AVC 파일 포맷 수정안은 HEVC 파일 포맷이라고 지칭될 수도 있다. 즉, HEVC 파일 포맷은 ISO/IEC 14496-15 의 일부가 되고 있는 MPEG 에 의해 개발되고 있다.

HEVC 파일 포맷을 준수하는 파일은 논리적 구조, 시간 구조, 및 물리적 구조를 가질 수도 있다. 파일의 논리적 구조는 시간 병렬 트랙들의 세트를 포함하는 무비의 것일 수도 있다. 파일의 시간 구조는 트랙들이 시간에 있어서의 샘플들의 시퀀스들을 포함한다는 것이다. 샘플들의 시퀀스들은 편집 리스트들에 의해 무비의 타임라인에 맵핑될 수도 있다. HEVC 파일 포맷의 맥락에서, "샘플" 은 단일 타임스탬프와 연관된 데이터를 포함할 수도 있다. 샘플의 예들로는 비디오의 개개의 프레임, 디코딩 순서의 일련의 비디오 프레임들, 또는 디코딩 순서의 오디오의 압축된 섹션을 포함한다.

물리적으로, HEVC 파일 포맷을 준수하는 파일들은 박스들이라고 불리는 일련의 오브젝트들을 포함할 수도 있다. 박스는 고유 타입 식별자 및 길이로 정의된 오브젝트-지향적인 구축 블록일 수도 있다. 일부 경우들에서, HEVC 파일 포맷을 준수하는 파일에서의 모든 데이터가 박스들 내에 포함될 수도 있어서 파일에는 박스에 있지 않는 데이터가 없을 수도 있다. HEVC 파일 포맷을 준수하는 파일은 다양한 타입들의 박스들을 포함할 수도 있다.

예를 들어, HEVC 파일 포맷을 준수하는 파일은 파일 타입 박스, 미디어 데이터 박스, 무비 박스, 무비 프래그먼트 박스 등을 포함할 수도 있다. 이 예에서, 파일 타입 박스는 파일 타입 및 호환성 정보를 포함한다. 미디어 데이터 박스는 샘플들 (예를 들어, 코딩된 픽처들) 을 포함할 수도 있다. 무비 박스는 무비에 관한 메타데이터 (예를 들어, 샘플들 사이의 논리적 및 타이밍 관계들, 그리고 또한 샘플들의 위치들의 포인터들) 를 포함할 수도 있다. 무비 박스들은 서브-박스들의 몇몇 타입들을 포함할 수도 있다. 무비 박스들에서의 서브-박스들은 하나 이상의 트랙 박스들을 포함할 수도 있다. 트랙 박스는 무비의 개개의 트랙에 관한 정보를 포함할 수도 있다. 트랙 박스는 단일 트랙의 전체 정보를 특정하는 트랙 헤더 박스를 포함할 수도 있다. 부가적으로, 트랙 박스는 미디어 정보 박스를 포함하는 미디어 박스를 포함할 수도 있다. 미디어 정보 박스는 트랙에서의 미디어 샘플들의 데이터 인덱싱을 포함하는 샘플 테이블 박스를 포함할 수도 있다. 샘플 테이블 박스에서의 정보는 시간에 있어서의 샘플들 그리고, 트랙의 샘플들 각각에 대해, 타입, 사이즈, 컨테이너, 및 오프셋을 샘플의 컨테이너에 위치시키는데 사용될 수도 있다.

또한, 샘플 테이블 박스는 하나 이상의 SampleToGroup 박스들 및 하나 이상의 샘플 그룹 설명 박스들 (즉, SampleGroupDescription 박스들) 을 포함할 수도 있다. SampleToGroup 박스는, 샘플 그룹의 관련 설명과 함께, 샘플이 속하는 샘플 그룹을 결정하는데 사용될 수도 있다. 다시 말해, SampleToGroup 박스는 샘플이 속하는 그룹을 나타낼 수도 있다. SampleToGroup 박스는 "sbgp" 의 박스 타입을 가질 수도 있다. SampleToGroup 박스는 그룹화 타입 엘리먼트 (예를 들어, grouping_type) 를 포함할 수도 있다. 그룹화 타입 엘리먼트는 샘플 그룹화의 타입 (즉, 샘플 그룹들을 형성하는데 사용되는 기준) 을 식별하는 정수일 수도 있다. 또한, SampleToGroup 박스는 하나 이상의 엔트리들을 포함할 수도 있다. SampleToGroup 박스에서의 각각의 엔트리는 트랙에서 연속하는 샘플들의 상이한, 비-오버랩하는 시리즈와 연관될 수도 있다. 각각의 엔트리는 샘플 카운트 엘리먼트 (예를 들어, sample_count) 및 그룹 설명 인덱스 엘리먼트 (예를 들어, group_description_index) 를 나타낼 수도 있다. 엔트리의 샘플 카운트 엘리먼트는 엔트리와 연관된 샘플들의 수를 나타낼 수도 있다. 다시 말해, 엔트리의 샘플 카운트 엘리먼트는 동일한 샘플 그룹 디스크립터를 갖는 연속하는 샘플들의 수가 주어진 정수일 수도 있다. 그룹 설명 인덱스 엘리먼트는 엔트리와 연관된 샘플들의 설명을 포함하는 SampleGroupDescription 박스를 식별할 수도 있다. 다수의 엔트리들의 그룹 설명 인덱스 엘리먼트들은 동일한 SampleGroupDescription 박스를 식별할 수도 있다.

일부 예들에서, 다음의 의사 코드 (pseudo-code) 는 SampleToGroup 박스를 설명한다.

위에 나타낸 바와 같이, 샘플 테이블 박스는 0 이상의 SampleGroupDescription 박스들을 포함할 수도 있다. SampleGroupDescription 박스는 샘플 그룹의 설명을 포함할 수도 있다. 트랙에 샘플들에 대한 2개 이상의 샘플 그룹화가 존재하는 경우 SampleGroupDescription 박스의 다수의 인스턴스들이 존재할 수도 있다. SampleGroupDescription 박스는 "sgpd" 의 박스 타입을 가질 수도 있다.

일부 예들에서, 다음의 의사 코드는 SampleGroupDescription 박스를 설명한다.

위의 의사 코드에 나타낸 바와 같이, SampleGroupDescription 박스는 grouping_type 엘리먼트, entry_count 엘리먼트, 및 하나 이상의 엔트리들을 포함할 수도 있다. SampleGroupDescriptionBox 의 grouping_type 엘리먼트는 SampleGroupDescription 박스와 연관된 SampleToGroup 박스를 식별하는 정수일 수도 있다. entry_count 엘리먼트는 SampleGroupDescription 박스에서의 엔트리들의 수를 나타낼 수도 있다. SampleGroupDescription 박스에서의 각각의 엔트리는 VisualSampleGroupEntry 오브젝트, AudioSampleGroupEntry 오브젝트, 또는 HintSampleGroupEntry 오브젝트를 포함할 수도 있다. VisualSampleGroupEntry 오브젝트는 시각적 (예를 들어, 비디오) 샘플들의 그룹에 관한 설명을 제공할 수도 있다. AudioSampleGroupEntry 오브젝트는 오디오 샘플들의 그룹에 관한 설명을 제공할 수도 있다. HintSampleGroupEntry 오브젝트는 힌트 샘플들의 그룹에 관한 설명을 제공할 수도 있다. VisualSampleGroupEntry 오브젝트들 및 AudioSampleGroupEntry 오브젝트들은 추상 SampleGroupDescriptionEntry 클래스를 확장시킨 추상 클래스에 속할 수도 있다.

또한, 샘플 테이블 박스는 스트림에 대한 포맷 설명을 포함하는 샘플 설명 박스를 포함할 수도 있다. 특히, 샘플 설명 박스는 하나 이상의 샘플 엔트리들의 리스트를 포함할 수도 있다. 샘플 엔트리들 각각은 미디어 타입 (예를 들어, 스트림을 디코딩하는데 필요한 디코더의 타입) 의 명칭 및 필요한 그 디코더의 임의의 파라미터화를 포함할 수도 있다. 예를 들어, HEVC 의 맥락에서, 샘플 엔트리는 HEVC 디코더 구성 레코드를 포함할 수도 있다. 따라서, HEVC 디코더 구성 레코드는 샘플 테이블 박스의 서브-박스일 수도 있다. HEVC 디코더 구성 레코드는 ISO/IEC 23008-2 (즉, HEVC) 비디오 콘텐츠의 디코더 구성 정보를 포함할 수도 있다. 예를 들어, HEVC 디코더 구성 레코드는 파라미터 세트들 (예를 들어, VPS들, SPS, PPS들 등) 을 포함하는 하나 이상의 NAL 유닛들을 포함할 수도 있다.

위에 나타낸 바와 같이, HEVC 파일 포맷을 준수하는 파일은 무비 프래그먼트 박스를 포함할 수도 있다. 무비 프래그먼트 박스는 무비 프래그먼트 (즉, 무비의 프래그먼트) 에 관한 메타데이터를 포함할 수도 있다. 무비 프래그먼트 박스는 무비 프래그먼트의 트랙의 프래그먼트에 관한 정보를 포함하는 트랙 프래그먼트 박스를 포함할 수도 있다. 또한, 트랙 프래그먼트 박스는 무비 프래그먼트의 샘플들이 속하는 샘플 그룹들을 나타낼 수도 있는 하나 이상의 SampleToGroup 박스들을 포함할 수도 있다.

도 1 의 예에서, 비디오 코딩 시스템 (10) 은 미디어 인지 네트워크 엘리먼트 (MANE; 27) 를 포함한다. MANE (27) 는 소스 디바이스 (12) 에 의해 생성된 비디오 데이터를 수신할 수도 있고 비디오 데이터를 목적지 디바이스 (14) 로 포워딩할 수도 있다. MANE (27) (또는 다른 타입의 디바이스) 는 다수의 서브-레이어들에서 인코딩되는 HEVC 비트스트림에 비트스트림 시닝을 적용할 수도 있다. 비트스트림에서의 임의의 포인트에서, MANE (27) 는 하위 서브-레이어들에서의 픽처들에 대한 디코딩 프로세스가 상위 서브-레이어들의 NAL 유닛들에 의존하지 않기 때문에 하위 서브-레이어들 (즉, 하위 시간적 식별자들과 연관된 서브-레이어들) 에서의 픽처들이 여전히 디코딩가능하다는 사실에 기초하여 상위 서브-레이어들 (즉, 상위 시간적 식별자들과 연관된 서브-레이어들) 의 NAL 유닛들을 제거하기 시작할 수 있다. 특정 값보다 더 높은 시간적 식별자들을 갖는 모든 NAL 유닛들을 제거하는 액션은 시간적 다운-스위칭이라고 지칭될 수 있다. 시간적 다운-스위칭은 항상 가능할 수도 있다. 따라서, 시간적 서브-레이어 스위칭 포인트라는 용어는, 픽처와 동일한 서브-레이어에 있고 디코딩 순서로 픽처에 선행하는 임의의 다른 픽처에 대한 어떠한 의존성도 갖지 않는 픽처를 지칭할 수도 있다.

용어 "시간적 업-스위칭" 은 그 포인트까지 포워딩되지 않았던 특정 서브-레이어의 NAL 유닛들을 포워딩하기 시작하는 액션을 지칭할 수도 있다. 시간적 업-스위칭은 스위칭되는 레이어에서의 픽처들 중 어떠한 것도 스위치가 수행된 비트스트림에서의 포인트 이전에 동일한 서브-레이어에서의 임의의 픽처에 의존하지 않는 경우에만 단지 가능할 수도 있다.

H.264/AVC 비디오 코딩 표준의 스케일러블 비디오 코딩 확장 (즉, H.264/SVC) 에서, 시간적 서브-레이어 스위칭 포인트들은 SPS들에서 temporal_id_nesting_flag 신택스 엘리먼트를 통해 나타낼 수 있다. 특정 CVS 에 적용가능한 SPS 에서 temporal_id_nesting_flag 신택스 엘리먼트가 1 과 동일한 경우, 0 보다 더 큰 시간적 식별자들을 갖는 CVS 에서의 모든 픽처들은 시간적 레이어 스위칭 포인트들일 수도 있다. 또한, H.264/SVC 에서, 시간적 레벨 스위칭 포인트 SEI 메시지들은 시간적 서브-레이어 스위칭 포인트들을 나타낼 수도 있다. 시간적 레벨 스위칭 포인트 SEI 메시지들이 시간적 서브-레이어 스위칭 포인트들을 나타내는 일부 예들에서, 시간적 레벨 스위칭 포인트 SEI 메시지는 스위치 포인트에서 시간적 레이어 M + 1 로 스위칭 업하기 위해 스위치 포인트 이전에 시간적 레이어 M 이 디코딩되어야 하는 기간이 얼마나 긴지에 관한 정보를 포함할 수도 있다.

H.264/SVC 에서처럼, HEVC 에서, SPS 는 sps_temporal_id_nesting_flag 신택스 엘리먼트를 포함할 수도 있다. sps_temporal_id_nesting_flag 신택스 엘리먼트가 1 과 동일한 값을 가질 때, 0 보다 더 큰 시간적 식별자들을 갖는 모든 픽처들은 서브-레이어 스위칭 포인트들이다. HEVC 에서, 서브-레이어 스위칭 포인트들과 연관된 2개의 픽처 타입들, 즉, 시간적 서브-레이어 액세스 (TSA) 픽처 타입 및 단계적인 시간적 서브-레이어 액세스 (STSA) 픽처 타입이 존재할 수도 있다. TSA 및 STSA 픽처 타입들은 시간적 서브-레이어 스위칭 포인트들을 나타내는데 사용될 수 있다.

TSA 픽처 그리고 디코딩 순서로 TSA 픽처에 후속하는 픽처들은, 인터 예측 참조를 위해 TSA 픽처의 시간적 식별자 이상인 시간적 식별자들을 갖는 픽처들을 사용하지 않는다. TSA 픽처는, TSA 픽처에서, 바로 아래의 서브-레이어로부터, 임의의 상위 서브-레이어 또는 TSA 픽처를 포함하는 서브-레이어로의 업-스위칭을 가능하게 한다. 일부 예들에서, 모든 TSA 픽처들은 0 보다 더 큰 시간적 식별자들을 갖는다.

STSA 픽처는 인터 예측 참조를 위해 STSA 픽처와 동일한 TemporalId 를 갖는 픽처들을 사용하지 않는다. STSA 픽처와 동일한 시간적 식별자를 갖는, 디코딩 순서로 STSA 픽처에 후속하는 픽처들은, 인터 예측 참조를 위해 STSA 픽처와 동일한 시간적 식별자를 갖는, 디코딩 순서로 STSA 픽처 이전의 픽처들을 사용하지 않는다. STSA 픽처는, STSA 픽처에서, 바로 아래의 서브-레이어로부터, STSA 픽처를 포함하는 서브-레이어로의 업-스위칭을 가능하게 한다. 일부 예들에서, 모든 STSA 픽처들은 0 보다 더 큰 시간적 식별자들을 갖는다. 따라서, TSA 픽처와는 대조적으로, STSA 는, 임의의 상위 서브-레이어로의 업-스위칭을 반드시 가능하게 하지는 않는다. 오히려, STSA 픽처는 STSA 픽처를 포함하는 서브-레이어로의 업-스위칭만을 단지 가능하게 할 수도 있다.

HEVC 콘텐츠의 저장을 위한 파일 포맷의 기존 설계들에는 몇몇 문제들 또는 결점들이 존재한다. 예를 들어, STSA 픽처들을 포함하는 샘플들 (STSA 샘플들이라고도 또한 지칭됨) 을 시그널링하기 위한 어떤 콤팩트한 방법도 존재하지 않는다. 다른 예에서, 인트라 픽처들을 포함하는 샘플들을 시그널링하기 위한 어떤 효율적인 방법도 존재하지 않을 수도 있다. 인트라 픽처들을 포함하는 샘플들의 시그널링은 인트라 픽처들만을 사용하는 트릭 모드 플레이의 특정 타입들을 가능하게 할 수도 있다. 다른 예에서, 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있는지 여부를 시그널링하기 위한 어떤 효율적인 방법도 존재하지 않을 수도 있다.

본 개시물의 하나의 예시적인 기법에 따르면, 샘플 그룹화 타입이 'stsa' 일 수도 있는 단계적인 시간적 서브-레이어 액세스 샘플 그룹이라고 명명된 샘플 그룹은 STSA 샘플들을 마킹한다. 이러한 메커니즘을 이용하여, 비디오 코더 또는 다른 디바이스는 STSA 샘플들을 쉽게 식별할 수도 있다.

이 예시적인 기법에 따르면, 디바이스 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는, 코딩된 픽처들을 포함하는 복수의 샘플들을 포함하는 파일을 생성할 수도 있다. 파일은 또한 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스 (예를 들어, SampleToGroupBox) 를 포함할 수도 있다. 박스는 또한 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낸다. 일부 예들에서, 디바이스는 파일을 출력할 수도 있다. 이러한 예들에서, 디바이스의 출력 인터페이스 (예를 들어, 네트워크 인터페이스, 디스크 또는 드라이브 인터페이스, 메모리 액세스 시스템 등) 가 파일을 출력할 수도 있다.

이와 유사하게, 디바이스 (예를 들어, 비디오 디코더 (30) 또는 다른 디바이스) 는, 샘플 그룹을 식별하는 박스에서의 데이터에 기초하여, 박스를 포함하는 파일에서의 샘플들 중에서 STSA 샘플들을 식별할 수도 있다. 일부 예들에서, 디바이스의 입력 인터페이스 (예를 들어, 네트워크 인터페이스, 디스크 또는 드라이브 인터페이스, 메모리 액세스 시스템 등) 는, 샘플 그룹을 식별하는 박스를 포함하는 파일을 수신할 수도 있다. 또한, 일부 예들에서, 디바이스는 샘플 그룹에서의 STSA 샘플들 중 하나에서 시간적 업-스위칭을 수행할 수도 있다. 또한, 일부 예들에서, 비디오 디코더 (30) 는 STSA 샘플들 중 하나 이상을 디코딩할 수도 있다.

또한, 본 개시물의 일부 예시적인 기법들에 따르면, 샘플 그룹화 타입이 'ipsg' 일 수도 있는, 인트라 픽처 샘플 그룹 (즉, 인트라 픽처 샘플 그룹화 엔트리) 이라고 명명된 샘플 그룹은, 인트라 코딩된 픽처들을 포함하는 샘플들 (인트라 샘플들이라고 또한 지칭됨) 을 마킹하도록 설계된다. 따라서, HEVC 비디오 트랙은 "ipsg" 의 grouping_type 엘리먼트를 갖는 SampleToGroupBox 의 0 인스턴스들 또는 1 인스턴스를 포함할 수도 있다. 이러한 메커니즘을 이용하여, 인트라 코딩된 픽처들을 포함하는 샘플들이 인트라 픽처 샘플 그룹만을 통해 쉽게 식별될 수 있다. 비디오 디코더 (30) 는 인트라 코딩된 픽처들 중 하나 이상을 디코딩할 수도 있다.

대안적으로, 인트라 픽처 샘플 그룹은, 비-RAP 인트라 코딩된 픽처들, 즉, HEVC 작업 초안 8 에 정의된 RAP 픽처들이 아닌 인트라 픽처들을 포함하는 샘플들만을 마킹한다. 이러한 메커니즘을 이용하여, 인트라 코딩된 픽처들을 포함하는 샘플들은, 인트라 픽처 샘플 그룹과 RAP 픽처들을 포함하는 샘플들 모두를 마킹하는 sync 샘플 테이블 양쪽 모두를 통해 쉽게 식별될 수 있다. 이러한 방법으로, 디바이스 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는 비-랜덤 액세스 포인트 (비-RAP) 인트라 코딩된 픽처들을 포함하는 파일을 생성할 수도 있고, 여기서 샘플 그룹은 파일에서 비-RAP 인트라 코딩된 픽처들을 마킹한다.

또한, 본 개시물의 일부 예시적인 기법들에 따르면, 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있는지 여부는, 예를 들어, 플래그를 사용하여, 샘플 엔트리에 시그널링된다. 일부 예들에서, 비디오 인코더 (20) 또는 다른 디바이스는 엘리먼트를 포함하는 레코드 (예를 들어, HEVC 디코더 구성 레코드) 를 생성할 수도 있다. 제 1 값을 갖는 엘리먼트는, 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있음을 나타낸다. 제 2 값을 갖는 엘리먼트는, 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있다는 것을 보장하지 않음을 나타낸다. 또한, 일부 예들에서, 엘리먼트가 제 1 값을 가질 때, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 임의의 샘플에서 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있는지 여부를 나타내는 신택스 엘리먼트들을 갖는다.

이러한 방법으로, 디바이스 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는, 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성할 수도 있다. 파일은 또한, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 레코드 (예를 들어, HEVC 디코더 구성 레코드와 같은 디코더 구성 레코드) 를 포함하는 박스를 포함할 수도 있다. 일부 예들에서, 디바이스의 출력 인터페이스 (예를 들어, 네트워크 인터페이스, 디스크 또는 드라이브 인터페이스, 메모리 액세스 시스템 등) 가 파일을 출력할 수도 있다. 이에 따라, 디바이스 (예를 들어, 비디오 디코더 (30) 또는 다른 디바이스) 는, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 박스에서의 레코드 (예를 들어, HEVC 디코더 구성 레코드와 같은 디코더 구성 레코드) 에서의 엘리먼트에 기초하여, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정할 수도 있다. 일부 예들에서, 디바이스의 입력 인터페이스 (예를 들어, 네트워크 인터페이스, 디스크 또는 드라이브 인터페이스, 메모리 액세스 시스템 등) 는, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일을 수신할 수도 있다. 또한, 일부 예들에서, 디바이스는 SPS들 중 하나와 연관된 샘플에서 시간적 업-스위칭을 수행할 수도 있다.

본 개시물의 기법들은 또한 HEVC 이외의 비디오 코덱들을 사용하여 인코딩되는 다른 비디오 콘텐츠에 적용할 수도 있다.

도 2 는 본 개시물의 기술들을 구현할 수도 있는 일 예시적인 비디오 인코더 (20) 를 예시한 블록도이다. 도 2 는 설명의 목적들을 위해 제공되고, 본 개시물에서 폭넓게 예시 및 설명된 기법들의 제한으로 간주되지 않아야 한다. 설명의 목적들을 위해, 본 개시물은 HEVC 코딩의 맥락에서 비디오 인코더 (20) 를 설명한다. 그러나, 본 개시물의 기술들은 다른 코딩 표준들 또는 방법들에 적용가능할 수도 있다.

도 2 의 예에서, 비디오 인코더 (20) 는 예측 프로세싱 유닛 (100), 잔차 생성 유닛 (102), 변환 프로세싱 유닛 (104), 양자화 유닛 (106), 역양자화 유닛 (108), 역변환 프로세싱 유닛 (110), 재구성 유닛 (112), 필터 유닛 (114), 디코딩된 픽처 버퍼 (116), 및 엔트로피 인코딩 유닛 (118) 을 포함한다. 예측 프로세싱 유닛 (100) 은 인터-예측 프로세싱 유닛 (120) 및 인트라-예측 프로세싱 유닛 (126) 을 포함한다. 인터-예측 프로세싱 유닛 (120) 은 모션 추정 유닛 (122) 및 모션 보상 유닛 (124) 을 포함한다. 다른 예들에서, 비디오 인코더 (20) 는 더 많거나, 더 적거나, 또는 상이한 기능적 컴포넌트들을 포함할 수도 있다.

비디오 인코더 (20) 는 비디오 데이터를 수신할 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 픽처의 슬라이스에서 각각의 CTU 를 인코딩할 수도 있다. 비디오 인코더 (20) 는 CU들의 인코딩된 표현들 (즉, 코딩된 CU들) 을 생성하기 위해 CTU 의 CU들을 인코딩할 수도 있다. CU 를 인코딩하는 것의 부분으로서, 예측 프로세싱 유닛 (100) 은 CU 의 하나 이상의 PU들 중에서 CU 와 연관된 코딩 블록들을 파티셔닝할 수도 있다. 따라서, 각각의 PU 는 루마 예측 블록 및 대응하는 크로마 예측 블록들과 연관될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 는 다양한 사이즈들을 갖는 PU들을 지원할 수도 있다. CU 의 사이즈는 CU 의 루마 코딩 블록의 사이즈를 지칭할 수도 있고, PU 의 사이즈는 PU 의 루마 예측 블록의 사이즈를 지칭할 수도 있다. 특정 CU 의 사이즈가 2Nx2N 인 것으로 가정하면, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 인트라 예측을 위한 2Nx2N 또는 NxN 의 PU 사이즈들과, 인터 예측을 위한 2Nx2N, 2NxN, Nx2N, NxN, 또는 유사한 것의 대칭적인 PU 사이즈들을 지원할 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 는 또한, 인터 예측을 위한 2NxnU, 2NxnD, nLx2N, 및 nRx2N 의 PU 사이즈들에 대한 비대칭적인 파티셔닝을 지원할 수도 있다.

인터-예측 프로세싱 유닛 (120) 은 CU 의 각각의 PU 에 대한 인터 예측을 수행함으로써 PU 에 대한 예측 데이터를 생성할 수도 있다. PU 에 대한 예측 데이터는 PU 의 예측 블록들 및 PU 에 대한 모션 정보를 포함할 수도 있다. 인터-예측 프로세싱 유닛 (120) 은 PU 가 I 슬라이스, P 슬라이스, 또는 B 슬라이스에 있는지 여부에 따라 CU 의 PU 에 대한 상이한 동작들을 수행할 수도 있다. I 슬라이스에서는, 모든 PU들이 인트라 예측된다. 이에 따라, PU 가 I 슬라이스에 있을 경우, 인터-예측 프로세싱 유닛 (120) 은 PU 에 대한 인터 예측을 수행하지 않는다.

PU 가 P 슬라이스에 있을 경우, 모션 추정 유닛 (122) 은 PU 에 대한 참조 영역을 위해 참조 픽처들의 리스트 (예를 들어, "RefPicList0") 에서 참조 픽처들을 탐색할 수도 있다. PU 에 대한 참조 영역은, PU 의 예측 블록들에 가장 가깝게 대응하는 샘플들을 포함하는, 참조 픽처 내에서의 영역일 수도 있다. 모션 추정 유닛 (122) 은 PU 에 대한 참조 영역을 포함하는 참조 픽처의 RefPicList0 에서의 포지션을 나타내는 참조 인덱스를 생성할 수도 있다. 부가적으로, 모션 추정 유닛 (122) 은 PU 의 코딩 블록과, 참조 영역과 연관된 참조 위치와의 사이의 공간적 변위를 나타내는 모션 벡터를 생성할 수도 있다. 예를 들어, 모션 벡터는 현재 픽처에서의 좌표들로부터 참조 픽처에서의 좌표들까지의 오프셋을 제공하는 2차원 벡터일 수도 있다. 모션 추정 유닛 (122) 은 참조 인덱스 및 모션 벡터를 PU 의 모션 정보로서 출력할 수도 있다. 모션 보상 유닛 (124) 은 PU 의 모션 벡터에 의해 나타낸 참조 위치에서의 실제의 또는 보간된 샘플들에 기초하여 PU 의 예측 블록들을 생성할 수도 있다.

PU 가 B 슬라이스에 있을 경우, 모션 추정 유닛 (122) 은 PU 에 대한 단예측 또는 양예측을 수행할 수도 있다. PU 에 대한 단예측을 수행하기 위해, 모션 추정 유닛 (122) 은 PU 에 대한 참조 영역을 위해 RefPicList0 또는 제 2 참조 픽처 리스트 ("RefPicList1") 의 참조 픽처들을 탐색할 수도 있다. 모션 추정 유닛 (122) 은, PU 의 모션 정보로서, 참조 영역을 포함하는 참조 픽처의 RefPicList0 또는 RefPicList1 에서의 포지션을 나타내는 참조 인덱스, 참조 영역과 연관된 참조 위치와 PU 의 예측 블록과의 사이의 공간적 변위를 나타내는 모션 벡터, 및 참조 픽처가 RefPicList0 또는 RefPicList1 에 있는지 여부를 나타내는 하나 이상의 예측 방향 표시자들을 출력할 수도 있다. 모션 보상 유닛 (124) 은 PU 의 모션 벡터에 의해 나타낸 참조 위치에서의 실제의 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU 의 예측 블록들을 생성할 수도 있다.

PU 에 대한 양방향 인터 예측을 수행하기 위해, 모션 추정 유닛 (122) 은 PU 에 대한 참조 영역을 위해 RefPicList0 에서 참조 픽처들을 탐색할 수도 있고, 또한 PU 에 대한 다른 참조 영역을 위해 RefPicList1 에서 참조 픽처들을 탐색할 수도 있다. 모션 추정 유닛 (122) 은 참조 영역들을 포함하는 참조 픽처들의 RefPicList0 및 RefPicList1 에서의 포지션들을 나타내는 참조 인덱스들을 생성할 수도 있다. 부가적으로, 모션 추정 유닛 (122) 은 참조 영역들과 연관된 참조 위치들과 PU 의 예측 블록과의 사이의 공간적 변위들을 나타내는 모션 벡터들을 생성할 수도 있다. PU 의 모션 정보는 PU 의 모션 벡터들 및 참조 인덱스들을 포함할 수도 있다. 모션 보상 유닛 (124) 은 PU 의 모션 벡터들에 의해 나타낸 참조 영역들에서의 실제의 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU 의 예측 블록들을 생성할 수도 있다.

인트라-예측 프로세싱 유닛 (126) 은 PU 의 인트라 예측을 수행함으로써 PU 에 대한 예측 데이터를 생성할 수도 있다. PU 에 대한 예측 데이터는 PU 에 대한 예측 블록들 및 다양한 신택스 엘리먼트들을 포함할 수도 있다. 인트라-예측 프로세싱 유닛 (126) 은 I 슬라이스들, P 슬라이스들, 및 B 슬라이스들에서의 PU들에 대해 인트라 예측을 수행할 수도 있다.

PU 에 대해 인트라 예측을 수행하기 위해, 인트라-예측 프로세싱 유닛 (126) 은 PU 에 대한 예측 블록들의 다수의 세트들을 생성하기 위해 다수의 인트라 예측 모드들을 사용할 수도 있다. 특정 인트라 에측 모드를 사용하여 인트라 예측을 수행할 대, 인트라-예측 프로세싱 유닛 (126) 은 이웃하는 블록들로부터의 샘플들의 특정 세트를 사용하여 PU 에 대한 예측 블록들을 생성할 수도 있다. PU들, CU들, 및 CTU들에 대한 좌측에서 우측으로, 상부에서 하부로의 인코딩 순서를 가정하면, 이웃하는 블록들은 PU 의 예측 블록들의 상부, 상부 및 우측, 상부 및 좌측, 또는 좌측에 있을 수도 있다. 인트라-예측 프로세싱 유닛 (126) 은 다양한 수들의 인트라 예측 모드들, 예를 들어, 33개의 방향성 인트라 예측 모드들을 사용할 수도 있다. 일부 예들에서, 인트라 예측 모드들의 수는 PU 의 예측 블록들의 사이즈에 의존할 수도 있다.

예측 프로세싱 유닛 (100) 은 PU들에 대한 인터-예측 프로세싱 유닛 (120) 에 의해 생성된 예측 데이터 또는 PU들에 대한 인트라-예측 프로세싱 유닛 (126) 에 의해 생성된 예측 데이터 중에서 CU 의 PU들에 대한 예측 데이터를 선택할 수도 있다. 일부 예들에서, 예측 프로세싱 유닛 (100) 은 예측 데이터의 세트들의 레이트/왜곡 메트릭들에 기초하여 CU 의 PU들에 대한 예측 데이터를 선택한다. 선택된 예측 데이터의 예측 블록들은 여기에서 선택된 예측 블록들이라고 지칭될 수도 있다.

잔차 생성 유닛 (102) 은 CU 의 루마, Cb 및 Cr 코딩 블록들 및 CU 의 PU들의 선택된 예측 루마, Cb 및 Cr 블록들에 기초하여, CU 의 루마, Cb 및 Cr 잔차 블록들을 생성할 수도 있다. 예를 들어, 잔차 생성 유닛 (102) 은, 잔차 블록들에서의 각각의 샘플이 CU 의 코딩 블록에서의 샘플과, CU 의 PU 의 대응하는 선택된 예측 블록에서의 대응하는 샘플과의 사이의 차이와 동일한 값을 갖도록, CU 의 잔차 블록들을 생성할 수도 있다.

변환 프로세싱 유닛 (104) 은 CU 의 잔차 블록들을 CU 의 TU들과 연관된 변환 블록들로 파티셔닝하기 위해 쿼드-트리 파티셔닝을 수행할 수도 있다. 따라서, TU 는 루마 변환 블록 및 2개의 대응하는 크로마 변환 블록들과 연관될 수도 있다. CU 의 TU들의 루마 및 크로마 변환 블록들의 사이즈들 및 포지션들은 CU 의 PU들의 예측 블록들의 사이즈들 및 포지션들에 기초할 수도 있고 또는 기초하지 않을 수도 있다.

변환 프로세싱 유닛 (104) 은 하나 이상의 변환들을 TU 의 변환 블록들에 적용함으로써 CU 의 각각의 TU 에 대한 변환 계수 블록들을 생성할 수도 있다. 변환 프로세싱 유닛 (104) 은 다양한 변환들을 TU 와 연관된 변환 블록에 적용할 수도 있다. 예를 들어, 변환 프로세싱 유닛 (104) 은 이산 코사인 변환 (discrete cosine transform; DCT), 방향성 변환, 또는 개념적으로 유사한 변환을 변환 블록에 적용할 수도 있다. 일부 예들에서, 변환 프로세싱 유닛 (104) 은 변환들을 변환 블록에 적용하지 않는다. 이러한 예들에서는, 변환 블록이 변환 계수 블록으로서 취급될 수도 있다.

양자화 유닛 (106) 은 계수 블록에서의 변환 계수들을 양자화할 수도 있다. 양자화 프로세스는 변환 계수들의 일부 또는 전부와 연관된 비트 심도를 감소시킬 수도 있다. 예를 들어, n-비트 변환 계수는 양자화 동안에 m-비트 변환 계수로 버림 (round down) 될 수도 있고, 여기서, n 은 m 보다 더 크다. 양자화 유닛 (106) 은 CU 와 연관된 양자화 파라미터 (quantization parameter; QP) 값에 기초하여 CU 의 TU 와 연관된 계수 블록을 양자화할 수도 있다. 비디오 인코더 (20) 는 CU 와 연관된 QP 값을 조정함으로써 CU 와 연관된 계수 블록들에 적용된 양자화의 정도를 조정할 수도 있다. 양자화는 정보의 손실을 도입할 수도 있어서, 양자화된 변환 계수들은 오리지널 것들보다 더 낮은 정밀도를 가질 수도 있다.

역양자화 유닛 (108) 및 역변환 프로세싱 유닛 (110) 은 계수 블록으로부터 잔차 블록을 재구성하기 위해, 역양자화 및 역변환을 계수 블록에 각각 적용할 수도 있다. 재구성 유닛 (112) 은 TU 와 연관된 재구성된 변환 블록을 생성하기 위해, 재구성된 잔차 블록을, 예측 프로세싱 유닛 (100) 에 의해 생성된 하나 이상의 예측 블록들로부터의 대응하는 샘플들에 부가할 수도 있다. 이러한 방법으로 CU 의 각각의 TU 에 대한 변환 블록들을 재구성함으로써, 비디오 인코더 (20) 는 CU 의 코딩 블록들을 재구성할 수도 있다.

필터 유닛 (114) 은 CU 와 연관된 코딩 블록들에서의 블록킹 아티팩트 (blocking artifact) 들을 감소시키기 위해 하나 이상의 디블록킹 동작들을 수행할 수도 있다. 필터 유닛 (114) 이 재구성된 코딩 블록들에 대해 하나 이상의 디블록킹 동작들을 수행한 후에, 디코딩된 픽처 버퍼 (116) 는 재구성된 코딩 블록들을 저장할 수도 있다. 인터-예측 프로세싱 유닛 (120) 은 다른 픽처들의 PU들에 대해 인터 예측을 수행하기 위해, 재구성된 코딩 블록들을 포함하는 참조 픽처를 사용할 수도 있다. 부가적으로, 인트라-예측 프로세싱 유닛 (126) 은 CU 와 동일한 픽처에서의 다른 PU들에 대해 인트라 예측을 수행하기 위해, 디코딩된 픽처 버퍼 (116) 에서의 재구성된 코딩 블록들을 사용할 수도 있다.

엔트로피 인코딩 유닛 (118) 은 비디오 인코더 (20) 의 다른 기능적 컴포넌트들로부터 데이터를 수신할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (118) 은 양자화 유닛 (106) 으로부터 계수 블록들을 수신할 수도 있고, 예측 프로세싱 유닛 (100) 으로부터 신택스 엘리먼트들을 수신할 수도 있다. 엔트로피 인코딩 유닛 (118) 은 엔트로피-인코딩된 데이터를 생성하기 위해, 데이터에 대해 하나 이상의 엔트로피 인코딩 동작들을 수행할 수도 있다. 예를 들어, 엔트로피 인코딩 유닛 (118) 은 데이터에 대해 콘텍스트-적응 가변 길이 코딩 (context-adaptive variable length coding; CAVLC) 동작, CABAC 동작, 가변-대-가변 (variable-to-variable; V2V) 길이 코딩 동작, 신택스-기반 콘텍스트-적응 이진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding; SBAC) 동작, 확률 구간 파티셔닝 엔트로피 (Probability Interval Partitioning Entropy; PIPE) 코딩 동작, 지수-골롬 (Exponential-Golomb) 인코딩 동작, 또는 다른 타입의 엔트로피 인코딩 동작을 수행할 수도 있다. 비디오 인코더 (20) 는 엔트로피 인코딩 유닛 (118) 에 의해 생성된 엔트로피-인코딩된 데이터를 포함하는 비트스트림을 출력할 수도 있다.

일부 예들에서, 비디오 인코더 (20) 는 비트스트림을 포함하는 파일을 생성할 수도 있다. 본 개시물의 하나 이상의 기법들에 따르면, 파일은 코딩된 픽처들을 포함하는 복수의 샘플들을 포함할 수도 있다. 파일은 또한 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스를 포함할 수도 있다. 박스는 또한 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낼 수도 있다. 또한, 본 개시물의 하나 이상의 기법들에 따르면, 파일은 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장할 수도 있다. 파일은 또한, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 레코드를 포함하는 박스를 포함할 수도 있다.

도 3 은 본 개시물의 기법들을 구현하도록 구성되는 일 예시적인 비디오 디코더 (30) 를 예시한 블록도이다. 도 3 은 설명의 목적들을 위해 제공되고, 본 개시물에서 폭넓게 예시 및 설명된 기법들에 대해 제한하지 않는다. 설명의 목적들을 위해, 본 개시물은 HEVC 코딩의 맥락에서 비디오 디코더 (30) 를 설명한다. 그러나, 본 개시물의 기법들은 다른 코딩 표준들 또는 방법들에 적용가능할 수도 있다.

도 3 의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 유닛 (150), 예측 프로세싱 유닛 (152), 역양자화 유닛 (154), 역변환 프로세싱 유닛 (156), 재구성 유닛 (158), 필터 유닛 (160), 및 디코딩된 픽처 버퍼 (162) 를 포함한다. 예측 프로세싱 유닛 (152) 은 모션 보상 유닛 (164) 및 인트라-예측 프로세싱 유닛 (166) 을 포함한다. 다른 예들에서, 비디오 디코더 (30) 는 더 많거나, 더 적거나, 또는 상이한 기능적 컴포넌트들을 포함할 수도 있다.

코딩된 픽처 버퍼 (CPB; 151) 는 비트스트림의 인코딩된 비디오 데이터 (예를 들어, NAL 유닛들) 를 수신하고 저장할 수도 있다. 엔트로피 디코딩 유닛 (150) 은 CPB (151) 로부터 NAL 유닛들을 수신하고 NAL 유닛들을 파싱하여 비트스트림으로부터 신택스 엘리먼트들을 획득할 수도 있다. 엔트로피 디코딩 유닛 (150) 은 NAL 유닛들에서 엔트로피-인코딩된 신택스 엘리먼트들을 엔트로피 디코딩할 수도 있다. 예측 프로세싱 유닛 (152), 역양자화 유닛 (154), 역변환 프로세싱 유닛 (156), 재구성 유닛 (158), 및 필터 유닛 (160) 은 비트스트림으로부터 획득된 신택스 엘리먼트들에 기초하여 디코딩된 비디오 데이터를 생성할 수도 있다.

비트스트림의 NAL 유닛들은 코딩된 슬라이스 NAL 유닛들을 포함할 수도 있다. 비트스트림을 디코딩하는 것의 부분으로서, 엔트로피 디코딩 유닛 (150) 은 코딩된 슬라이스 NAL 유닛들로부터 신택스 엘리먼트들을 파싱하고 엔트로피 디코딩할 수도 있다. 코딩된 슬라이스들 각각은 슬라이스 헤더 및 슬라이스 데이터를 포함할 수도 있다. 슬라이스 헤더는 슬라이스에 속하는 신택스 엘리먼트들을 포함할 수도 있다.

비트스트림으로부터의 신택스 엘리먼트들을 디코딩하는 것에 부가하여, 비디오 디코더 (30) 는 CU 에 대해 디코딩 동작을 수행할 수도 있다. CU 에 대해 디코딩 동작을 수행하기 위해, 비디오 디코더 (30) 는 CU 의 코딩 블록들을 재구성할 수도 있다.

CU 에 대해 디코딩 동작을 수행하는 것의 부분으로서, 역양자화 유닛 (154) 은 CU 의 TU들과 연관된 계수 블록들을 역양자화, 즉, 양자화해제 (de-quantize) 할 수도 있다. 역양자화 유닛 (154) 은 역양자화 유닛 (154) 이 적용하기 위한 양자화의 정도 그리고 마찬가지로, 역양자화의 정도를 결정하기 위해 TU 의 CU 와 연관된 QP 값을 사용할 수도 있다. 즉, 압축 비율, 즉, 오리지널 시퀀스와 압축된 것을 표현하는데 사용되는 비트 수의 비율은, 변환 계수들을 양자화할 때 사용되는 QP 의 값을 조정함으로써 제어될 수도 있다. 압축 비율은 또한 채용된 엔트로피 코딩의 방법에 의존할 수도 있다.

역양자화 유닛 (154) 이 계수 블록을 역양자화한 후에, 역변환 프로세싱 유닛 (156) 은 TU 와 연관된 잔차 블록을 생성하기 위해 하나 이상의 역변환들을 계수 블록에 적용할 수도 있다. 예를 들어, 역변환 프로세싱 유닛 (156) 은 역 DCT, 역정수 변환, 역 카루넨-루베 변환 (Karhunen-Loeve transform; KLT), 역회전 변환, 역방향성 변환, 또는 다른 역변환을 계수 블록에 적용할 수도 있다.

PU 가 인트라 예측을 사용하여 인코딩될 경우, 인트라-예측 프로세싱 유닛 (166) 은 PU 에 대한 예측 블록들을 생성하기 위해 인트라 예측을 수행할 수도 있다. 인트라-예측 프로세싱 유닛 (166) 은 공간적으로 이웃하는 PU들의 예측 블록들에 기초하여 PU 에 대한 예측 루마, Cb 및 Cr 블록들을 생성하기 위해 인트라 예측 모드를 사용할 수도 있다. 인트라-예측 프로세싱 유닛 (166) 은 비트스트림으로부터 디코딩된 하나 이상의 신택스 엘리먼트들에 기초하여 PU 에 대한 인트라 예측 모드를 결정할 수도 있다.

예측 프로세싱 유닛 (152) 은 비트스트림으로부터 추출된 신택스 엘리먼트들에 기초하여 제 1 참조 픽처 리스트 (RefPicList0) 및 제 2 참조 픽처 리스트 (RefPicList1) 를 구성할 수도 있다. 또한, PU 가 인터 예측을 사용하여 인코딩될 경우, 엔트로피 디코딩 유닛 (150) 은 PU 에 대한 모션 정보를 획득할 수도 있다. 모션 보상 유닛 (164) 은 PU 의 모션 정보에 기초하여 PU 에 대한 하나 이상의 참조 영역들을 결정할 수도 있다. 모션 보상 유닛 (164) 은 PU 에 대한 하나 이상의 참조 블록들에서의 샘플들 블록들에 기초하여 PU 에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다.

재구성 유닛 (158) 은 CU 의 루마, Cb 및 Cr 코딩 블록들을 재구성하기 위해, CU 의 TU들과 연관된 루마, Cb 및 Cr 변환 블록들 및 CU 의 PU들의 예측 루마, Cb 및 Cr 블록들, 즉, 적용가능하다면, 인트라-예측 데이터 또는 인터-예측 데이터 중 어느 하나로부터의 잔차 값들을 사용할 수도 있다. 예를 들어, 재구성 유닛 (158) 은 CU 의 루마, Cb 및 Cr 코딩 블록들을 재구성하기 위해, 루마, Cb 및 Cr 변환 블록들의 샘플들을 예측 루마, Cb 및 Cr 블록들의 대응하는 샘플들에 부가할 수도 있다.

필터 유닛 (160) 은 CU 의 루마, Cb 및 Cr 코딩 블록들과 연관된 블록킹 아티팩트들을 감소시키기 위해 디블록킹 동작을 수행할 수도 있다. 비디오 디코더 (30) 는 CU 의 루마, Cb 및 Cr 코딩 블록들을 디코딩된 픽처 버퍼 (162) 에 저장할 수도 있다. 디코딩된 픽처 버퍼 (162) 는 추후의 모션 보상, 인트라 예측, 및 도 1 의 디스플레이 디바이스 (32) 와 같은 디스플레이 디바이스 상에서의 프리젠테이션을 위해 참조 픽처들을 제공할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 디코딩된 픽처 버퍼 (162) 에서의 루마, Cb 및 Cr 블록들에 기초하여 다른 CU들의 PU들에 대한 인트라 예측 또는 인터 예측 동작들을 수행할 수도 있다. 이러한 방법으로, 비디오 디코더 (30) 는 비트스트림으로부터 유의 루마 계수 블록의 변환 계수 레벨들을 추출할 수도 있고, 변환 계수 레벨들을 역양자화할 수도 있고, 변환 블록을 생성하기 위해 변환을 변환 계수 레벨들에 적용할 수도 있고, 변환 블록에 적어도 부분적으로 기초하여 코딩 블록을 생성할 수도 있으며, 디스플레이를 위해 코딩 블록을 출력할 수도 있다.

위에 나타낸 바와 같이, HEVC 파일 포맷을 준수하는 파일은 SampleToGroup 박스의 0 이상의 인스턴스들을 포함할 수도 있다. 또한, 위에 나타낸 바와 같이, 각각의 SampleToGroup 박스는 샘플 그룹화의 타입을 식별하는 그룹화 타입 엘리먼트를 포함할 수도 있다. 본 개시물의 하나 이상의 기법들에 따르면, SampleToGroup 박스는, SampleToGroup 박스와 연관된 샘플 그룹에 속하는 샘플들이 STSA들임을 나타내는 값을 가진 그룹화 타입 엘리먼트 (예를 들어, "stsa") 를 포함할 수도 있다. 예를 들어, HEVC 비디오 트랙은, "stsa" 의 grouping_type 을 갖는 SampleToGroupBox 의 0 인스턴스들 또는 1 인스턴스를 포함할 수도 있다. SampleToGroup 박스들과 연관된 샘플 그룹들에 속하는 샘플들이 STSA들임을 나타내는 값들을 가진 그룹화 타입 엘리먼트들을 갖는 SampleToGroup 박스들 (예를 들어, "stsa" 의 grouping_type 을 갖는 SampleToGroup 박스들) 의 인스턴스들은 단계적인 시간적 서브-레이어 샘플 그룹 엔트리들이라고 지칭될 수도 있다. 단계적인 시간적 서브-레이어 샘플 그룹 엔트리는 단계적인 시간적 서브-레이어 액세스 포인트들 (즉, STSA들) 로서 샘플들의 마킹을 표현할 수도 있다. 다시 말해, 단계적인 시간적 서브-레이어 샘플 그룹 엔트리는 STSA 샘플들을 마킹하는데 사용된 샘플 그룹일 수도 있다. 단계적인 시간적 서브-레이어 샘플 그룹 엔트리의 그룹화 타입들은 "stsa" 의 그룹 타입을 가질 수도 있다.

따라서, 비디오 인코더 또는 다른 디바이스는 파일에서의 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스 (예를 들어, SampleToGroup 박스) 를 생성할 수도 있다. 박스는 또한 (예를 들어, "stsa" 의 그룹화 타입을 특정함으로써) 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낼 수도 있다. 이에 따라, 비디오 디코더 또는 다른 디바이스는 박스에서의 데이터에 기초하여 파일에서의 샘플들 중에서 STSA 샘플들을 식별할 수도 있다.

위에 나타낸 바와 같이, SampleGroupDescription 박스는 샘플 그룹의 설명을 포함할 수도 있다. 또한, 위에 나타낸 바와 같이, SampleGroupDescription 박스는 0 이상의 엔트리들을 포함할 수도 있다. SampleGroupDescription 박스에서의 엔트리들은 하나 이상의 VisualSampleGroupEntry 오브젝트들을 포함할 수도 있다. VisualSampleGroupEntry 오브젝트는 시각적 (예를 들어, 비디오) 샘플들의 그룹에 관한 설명을 제공할 수도 있다. VisualSampleGroupEntry 오브젝트는 VisualSampleGroupEntry 클래스에 속할 수도 있다. 본 개시물의 하나 이상의 기법들에 따르면, StepWiseTemporalSubLayerEntry 클래스는 VisualSampleGroupEntry 클래스를 확장시킬 수도 있다. 따라서, SampleGroupDescription 박스에서의 엔트리는 StepWiseTemporalSubLayerEntry 클래스에 속하는 오브젝트 (즉, StepWiseTemporalSubLayerEntry 오브젝트) 를 포함할 수도 있다. 이에 따라, SampleGroupDescription 박스는 StepWiseTemporalSubLayerEntry 오브젝트의 컨테이너일 수도 있다. 파일이 StepWiseTemporalSubLayerEntry 오브젝트를 포함하는 것이 필수적이 아닐 수도 있으며 파일은 0 이상의 StepWiseTemporalSubLayerEntry 오브젝트들을 포함할 수도 있다.

따라서, 다음의 설명은 단계적인 시간적 서브-레이어 샘플 그룹 엔트리들에 적용할 수도 있다:

그룹 타입들: 'stsa'

컨테이너: 샘플 그룹 설명 박스 ('sgpd')

필수적: 아니오

양: 0 이상

이 샘플 그룹은 단계적인 시간적 서브-레이어 액세스 (STSA) 샘플들을 마킹하는데 사용된다.

다음은 단계적인 시간적 서브-레이어 샘플 그룹 엔트리에 대한 일 예시적인 신택스이다.

일부 예들에서, StepWiseTemporalSubLayerEntry 오브젝트를 포함하는 SampleGroupDescription 박스의 인스턴스는 단계적인 시간적 서브-레이어 샘플 그룹 엔트리 (예를 들어, "stsa" 의 그룹화 타입 엘리먼트를 갖는 SampleToGroup 박스의 인스턴스) 를 수반할 수도 있다. 이에 따라, 일부 예들에서, SampleToGroup 박스가 "stsa" 의 그룹화 타입을 가질 때, 동일한 그룹화 타입을 갖는 SampleGroupDescription 박스의 수반하는 인스턴스는 존재할 것이다.

본 개시물의 하나 이상의 기법들에 따르면, HEVC 비디오 트랙은 "ipsg" 의 grouping_type 엘리먼트를 갖는 SampleToGroup 박스의 0 인스턴스들 또는 하나의 인스턴스를 포함할 수도 있다. "ipsg" 의 grouping_type 엘리먼트를 갖는 SampleToGroup 박스들의 인스턴스들은 인트라 픽처 샘플 그룹화들이라고 지칭될 수도 있다. "ipsg" 의 그룹화 타입을 갖는 SampleToGroup 박스 인스턴스 (즉, 인트라 픽처 샘플 그룹화) 는 단계적인 시간적 서브-레이어 액세스 포인트들로서 샘플들의 마킹을 표현할 수도 있다. 따라서, 비디오 인코더 또는 다른 디바이스는 파일에서의 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스 (예를 들어, SampleToGroup 박스) 를 생성할 수도 있다. 박스는 또한 (예를 들어, "ipsg" 의 그룹화 타입을 특정함으로써) 샘플 그룹에서의 각각의 샘플이 인트라 샘플임을 나타낼 수도 있다. 이에 따라, 비디오 디코더 또는 다른 디바이스는 박스에서의 데이터에 기초하여 파일에서의 샘플들 중에서 인트라 샘플들을 식별할 수도 있다.

일부 예들에서, 동일한 그룹화 타입을 갖는 SampleGroupDescription 박스의 수반하는 인스턴스는 HEVC 비디오 트랙에 존재한다. 위에 나타낸 바와 같이, SampleGroupDescription 박스는 0 이상의 엔트리들을 포함할 수도 있다. SampleGroupDescription 박스에서의 엔트리들은 하나 이상의 VisualSampleGroupEntry 오브젝트들을 포함할 수도 있다. isualSampleGroupEntry 오브젝트는 VisualSampleGroupEntry 클래스에 속할 수도 있다. 또한, 본 개시물의 하나 이상의 기법들에 따르면, IntraPictureEntry 클래스는 VisualSampleGroupEntry 클래스를 확장시킬 수도 있다. 따라서, SampleGroupDescription 박스에서의 엔트리는 IntraPictureEntry 클래스에 속하는 오브젝트 (즉, IntraPictureEntry 오브젝트 또는 인트라 픽처 샘플 그룹화 엔트리) 를 포함할 수도 있다. 이에 따라, SampleGroupDescription 박스는 IntraPictureEntry 오브젝트의 컨테이너일 수도 있다. 파일이 IntraPictureEntry 오브젝트를 포함하는 것이 필수적이 아닐 수도 있으며 파일은 0 이상의 IntraPictureEntry 오브젝트들을 포함할 수도 있다. 이러한 방법으로, 파일은, 샘플 그룹이 인트라 코딩된 픽처들을 포함하는 샘플들을 마킹하는데 사용됨을 나타내는 엔트리 (예를 들어, IntraPictureEntry 오브젝트) 를 포함하는 샘플 그룹 설명 박스 (예를 들어, SampleGroupDescription 박스) 를 포함할 수도 있다.

따라서, 다음의 설명은 IntraPictureEntry 엔트리들에 적용할 수도 있다:

그룹 타입들: 'ipsg'

컨테이너: 샘플 그룹 설명 박스 ('sgpd')

필수적: 아니오

양: 0 이상

이 샘플 그룹은 인트라 코딩된 픽처들을 포함하는 샘플들, 즉, 모든 슬라이스들이 인트라 슬라이스들인 샘플들을 마킹하는데 사용된다.

다음은 인트라 픽처 샘플 그룹화 엔트리에 대한 일 예시적인 신택스이다.

위에 나타낸 바와 같이, HEVC 파일 포맷은 HEVC 디코더 구성 레코드에 대해 제공한다. 예를 들어, HEVC 파일 포맷을 준수하는 파일의 트랙 박스 내의 샘플 테이블 박스는 HEVC 디코더 구성 레코드를 포함할 수도 있다. HEVC 디코더 구성 레코드는 HEVC 비디오 콘텐츠에 대한 구성 정보를 포함한다. 예를 들어, HEVC 디코더 레코드는 0 이상의 NAL 유닛들을 포함할 수도 있다. HEVC 디코더 레코드에 포함된 NAL 유닛들은 VPS들, SPS들, PPS들 등과 같은 파라미터 세트들을 포함하는 NAL 유닛들을 포함할 수도 있다.

다음은 HEVC 디코더 구성 레코드에 대한 일 예시적인 신택스를 제공한다. 볼드로 나타낸 다음 신택스의 부분들은 「MPEG 출력 문서 W12846, "Study of ISO/IEC 14496-15:2010/PDAM 2 Carriage of HEVC", MPEG 의 10차 회의, 스웨덴 스톡홀름, 2012년 07월 16일부터 2012년 07월 20일까지」 에 특정된 HEVC 디코더 구성 레코드의 변경된 부분들을 나타낼 수도 있다.

HEVC 디코더 구성 레코드는, 샘플 엔트리에 저장된다면, 파라미터 세트들뿐만 아니라, HEVC 디코더 구성 레코드에 의해 포함된 NAL 유닛들의 길이를 나타내기 위해 각각의 샘플에서 사용된 길이 필드 (예를 들어, lengthSizeMinusOne) 의 사이즈를 포함한다. HEVC 디코더 구성 레코드는 외부적으로 프레임화될 수도 있다. 다시 말해, HEVC 디코더 구성 레코드의 사이즈는 HEVC 디코더 구성 레코드를 포함하는 구조에 의해 지원될 수도 있다.

또한, HEVC 디코더 구성 레코드는 버전 필드를 포함할 수도 있다. 위에 제공된 예시적인 신택스에서, 이 버전 필드는 configurationVersion 이라고 명명된다. 레코드에 대한 호환불가능 변화들은 버전 넘버의 변화로 나타낼 수도 있다. 일부 예들에서, 디바이스 또는 다른 판독기는, 이 디바이스 또는 다른 판독기가 HEVC 디코더 구성 레코드의 버전 필드에 의해 특정된 버전 넘버를 인식하지 못한 경우 HEVC 디코더 구성 레코드가 적용되는 스트림들 또는 HEVC 디코더 구성 레코드를 디코딩하려고 시도해서는 안된다. 일부 예들에서, HEVC 디코더 구성 레코드에 대한 호환가능 확장들은 HEVC 디코더 구성 레코드를 확장시키지 않으며 HEVC 디코더 구성 레코드의 버전 필드에 의해 특정된 구성 버전 코드를 변화시키지 않는다. 일부 예들에서, 디바이스 또는 다른 판독기는 그 디바이스 또는 다른 판독기가 이해하는 데이터의 정의 이외의 미인식된 데이터를 무시할 준비가 되어 있을 수도 있다.

VPS 는, 다른 신택스 엘리먼트들 중에서, general_profile_space 신택스 엘리먼트, general_profile_idc 신택스 엘리먼트, general_profile_compatibility_flag[i] 신택스 엘리먼트, 및 general_reserved_zero_16bits 신택스 엘리먼트를 포함할 수도 있다. general_profile_space 신택스 엘리먼트는 i 의 모든 값들이 0 내지 31 의 범위에 있는 general_profile_compatibility_flag[i] 신택스 엘리먼트 및 general_profile_idc 신택스 엘리먼트의 해석을 위한 콘텍스트를 특정한다. general_profile_space 신택스 엘리먼트가 0 과 동일할 때, general_profile_idc 신택스 엘리먼트는 CVS 가 준수하는 프로파일을 나타낸다. HEVC 작업 초안 8 의 부록 A 는 일 예시적인 프로파일들의 세트를 설명한다. general_profile_space 신택스 엘리먼트가 0 과 동일하고 general_profile_compatibility_flag[i] 신택스 엘리먼트가 1 과 동일할 때, general_profile_compatibility_flag[i] 신택스 엘리먼트는, i 와 동일한 general_profile_idc 신택스 엘리먼트에 의해 나타낸 프로파일을 CVS 가 준수함을 나타낸다. general_profile_space 신택스 엘리먼트가 0 과 동일할 때, general_profile_idc[general_profile_idc] 가 1 과 동일하다. "general_profile_idc[general_profile_idc]" 는 general_profile_idc 신택스 엘리먼트에 의해 특정된 인덱스 값과 연관된 general_profile_idc 신택스 엘리먼트를 나타낸다. 일부 예들에서, general_profile_idc 의 허용된 값으로서 특정되지 않은 i 의 임의의 값에 대해 general_profile_compatibility_flag[i] 신택스 엘리먼트는 0 과 동일하다. HEVC 작업 초안 8 의 부록 A 는 general_profile_idc 신택스 엘리먼트의 허용된 값들의 일 예시적인 세트를 특정한다. general_reserved_zero_16bits 신택스 엘리먼트는 비트스트림들에서 0 과 동일하다. general_reserved_zero_16bits 신택스 엘리먼트들의 특정 값들은 HEVC 의 확장들에 대해 사용될 수도 있다.

또한, VPS 는, general_tier_flag 신택스 엘리먼트 및 general_level_idc 신택스 엘리먼트를 포함하는 profile_tier_level 신택스 구조를 포함할 수도 있다. general_tier_flag 신택스 엘리먼트는 general_level_idc 신택스 엘리먼트의 해석을 위한 티어 콘텍스트를 특정한다. general_level_idc 신택스 엘리먼트는 CVS 가 준수하는 레벨을 나타낸다. HEVC 작업 초안 8 의 부록 A 는 general_tier_flag 신택스 엘리먼트에 의해 특정된 티어 콘텍스트에 기초하여 general_level_idc 신택스 엘리먼트의 일 예시적인 해석을 특정한다.

위에 제공된 HEVC 디코더 구성 레코드들의 예시적인 신택스에서, profile_space, tier_flag, profile_idc, profile_compatibility_indications, constraint_indicator_flags, 및 level_idc 엘리먼트들은, 이 HEVC 디코더 구성 레코드가 적용되는 스트림에 대해, ISO/IEC 23008-2 에 정의된 바와 같이, 신택스 엘리먼트들 general_profile_space, general_tier_flag, general_profile_idc, i 가 0 에서부터 31 까지의 범위에 있는 general_profile_compatibility_flag[i], general_reserved_zero_16bits, 및 general_level_idc 에 대한 매칭 값들을 각각 포함한다.

하나의 예에서, HEVC 디코더 구성 레코드의 profile_space, tier_flag, profile_idc, profile_compatibility_indications, constraint_indicator_flags, 및 level_idc 엘리먼트들에 대한 값들은, HEVC 디코더 구성 레코드에 의해 설명되는 스트림이 디코딩될 때 활성화되는 모든 파라미터 세트들 (파라미터 세트들 모두 또는 스트림의 모든 파라미터 세트들이라고 지칭됨) 에 대해 유효해야 한다. 다시 말해, 이 예에서, HEVC 디코더 구성 레코드의 profile_space, tier_flag, profile_idc, profile_compatibility_indications, constraint_indicator_flags, 및 level_idc 엘리먼트들의 값들은, HEVC 디코더 구성 레코드에 의해 설명되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 대응하는 신택스 엘리먼트들의 값들을 올바르게 설명해야 한다.

예를 들어, 스트림이 디코딩될 때 활성화된 VPS들 각각에서의 general_profile_space 신택스 엘리먼트들은, profile_space 엘리먼트의 값과 동일한 값들을 가질 수도 있다. 다시 말해, 파라미터 세트들 모두에서의 profile_space 엘리먼트의 값은 동일해야 한다. 이에 따라, HEVC 디코더 구성 레코드는 프로파일 공간 엘리먼트 (예를 들어, profile_space 엘리먼트) 를 포함할 수도 있다. HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 공간 플래그 신택스 엘리먼트들 (예를 들어, general_profile_space 신택스 엘리먼트들) 은 프로파일 공간 엘리먼트의 값들과 매칭하는 값들을 가질 수도 있다.

또한, 이 예에서, 티어 표시 (예를 들어, tier_flag) 는 HEVC 디코더 구성 레코드에 의해 설명되는 스트림이 디코딩될 때 활성화된 파라미터 세트들 모두에 나타낸 최상위 티어 이상의 티어를 나타내야 한다. 이에 따라, HEVC 디코더 구성 레코드는 티어 플래그 엘리먼트 (예를 들어, tier_flag 엘리먼트) 를 포함할 수도 있다. 디바이스는 HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 티어 플래그 신택스 엘리먼트들 (예를 들어, general_tier_flag 신택스 엘리먼트들) 이 티어 플래그 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정할 수도 있다. 일반적 티어 플래그 신택스 엘리먼트들 각각은 코딩된 비디오 시퀀스들이 준수하는 레벨들을 나타내는 일반적 레벨 표시자 신택스 엘리먼트들의 해석을 위한 티어 콘텍스트를 나타낼 수도 있다.

이 예에서, 레벨 표시 엘리먼트 (예를 들어, level_idc) 는 파라미터 세트들 모두에서 최상위 티어에 대해 나타낸 최상위 레벨 이상의 능력의 레벨을 나타내야 한다. 이에 따라, HEVC 디코더 구성 레코드는 레벨 표시자 엘리먼트 (예를 들어, level_idc 엘리먼트) 를 포함할 수도 있다. 디바이스는 HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 레벨 표시 신택스 엘리먼트들 (예를 들어, general_level_idc 신택스 엘리먼트들) 이 레벨 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정할 수도 있다. 일반적 레벨 표시 신택스 엘리먼트들 각각은 코딩된 비디오 시퀀스가 준수하는 레벨을 나타낼 수도 있다.

이 예에서, 프로파일 표시 엘리먼트 (예를 들어, profile_idc) 는 HEVC 디코더 구성 레코드와 연관된 스트림이 준수하는 프로파일을 나타내야 한다. 이에 따라, HEVC 디코더 구성 레코드는 프로파일 표시자 엘리먼트 (예를 들어, profile_idc 엘리먼트) 를 포함할 수도 있다. 디바이스는 HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 프로파일 표시 신택스 엘리먼트들 (예를 들어, profile_idc 신택스 엘리먼트들) 이 프로파일 표시 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정할 수도 있다. 프로파일 표시 신택스 엘리먼트들 각각은 코딩된 비디오 시퀀스가 준수하는 프로파일을 나타낼 수도 있다.

profile_compatibility_indications 엘리먼트에서의 각각의 비트는 파라미터 세트들 모두가 그 비트를 설정하는 경우에만 단지 설정될 수도 있다. 이에 따라, EVC 디코더 구성 레코드는 프로파일 호환성 표시들 엘리먼트 (예를 들어, profile_compatibility_indications 엘리먼트) 를 포함할 수도 있다. 디바이스는 HEVC 디코더 구성 레코드가 적용가능한 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 호환성 플래그 신택스 엘리먼트들 (예를 들어, general_profile_compatibility_flag 신택스 엘리먼트들) 이 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정할 수도 있다.

부가적으로, HEVC 디코더 구성 레코드는 제약 표시자 플래그들 엘리먼트 (예를 들어, constraint_indicator_flags 엘리먼트) 를 포함할 수도 있다. 디바이스는 HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 예비된 제로 16 비트들 신택스 엘리먼트들 (예를 들어, general_reserved_zero_16bits 신택스 엘리먼트들) 이 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정할 수도 있다.

HEVC 디코더 구성 레코드들이 profile_space, tier_flag, profile_idc, profile_compatibility_indications, constraint_indicator_flags, 및 level_idc 엘리먼트들을 특정하기 때문에, 디바이스 (예를 들어, 비디오 디코더 (30)) 는 스트림을 파싱하는 일 없이 스트림의 대응하는 속성들을 결정하는 것이 가능할 수도 있다. 오히려, 디바이스는 스트림에 적용되는 HEVC 디코더 구성 레코드를 검사함으로써 스트림의 대응하는 속성들을 결정할 수도 있다.

스트림의 SPS들이 상이한 프로파일들로 마킹된다면, 스트림은, 어느 경우라도, 전체 스트림이 준수하는 프로파일을 결정하기 위한 조사를 필요로 할 수도 있다. 전체 스트림이 조사되지 않는다면, 또는 그 조사가 전체 스트림이 준수하는 프로파일이 존재하지 않는다고 나타낸다면, 이 예에서, 전체 스트림은, 이들 룰들이 만족될 수 있는 개별 구성 레코드들 (예를 들어, HEVC 디코더 구성 레코드들) 을 이용하는 2개 이상의 서브-스트림들로 분할되어야 한다.

HEVC 디코더 구성 레코드는 크로마 포맷 및 비트 심도에 관한 명백한 표시뿐만 아니라 HEVC 비디오 엘리멘트리 (elementary) 스트림에 의해 사용된 다른 포맷 정보를 제공할 수도 있다. 엘리멘트리 스트림은 하나 이상의 비트스트림들의 시퀀스를 포함할 수도 있다. 엘리멘트리 스트림이 다수의 비트스트림들을 포함하는 경우, 마지막 비트스트림을 제외한 비트스트림들 각각은 EOS (end of bitstream) NAL 유닛으로 종단된다.

일부 예들에서, 이러한 정보의 각각의 타입은, 존재한다면, 단일 HEVC 디코더 구성 레코드에서의 모든 파라미터 세트들에서 동일해야 한다. 2개의 시퀀스들이 이러한 정보의 임의의 타입이 다른 경우, 비디오 프로세서는 2개의 상이한 HEVC 디코더 구성 레코드들을 생성하는 것이 요구될 수도 있다. 2개의 시퀀스들이 이들의 비디오 사용가능성 정보 (VUI) 에서의 컬러 공간 표시들이 다른 경우, 비디오 프로세서 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는 2개의 상이한 HEVC 디코더 구성 레코드들을 생성하는 것이 요구될 수도 있다. HEVC 에서, SPS 는 VUI 신택스 엘리먼트들을 포함하는 VUI 신택스 구조를 포함할 수도 있다.

위에 설명된 HEVC 디코더 구성 레코드들에 대한 예시적인 신택스에서, chromaFormat 엘리먼트는, 이 HEVC 디코더 구성 레코드가 적용되는 스트림에 대해, ISO/IEC 23008-2 (즉, HEVC) 에서 chroma_format_idc 신택스 엘리먼트에 의해 정의된 바와 같이 chroma_format 표시자를 포함한다. SPS 의 chroma_format_idc 신택스 엘리먼트는 크로마 샘플링을 특정할 수도 있다. HEVC 작업 초안 8 에서, chroma_format_idc 신택스 엘리먼트는 HEVC 작업 초안 8 의 하위조항 6.2 에서 특정된 루마 샘플링에 대한 크로마 샘플링을 특정한다. 현재 픽처에 대해 활성화된 SPS 의 chroma_format_idc 신택스 엘리먼트가 0 과 동일한 경우, 현재 픽처는 하나의 샘플 어레이 (예를 들어, S_L) 로 이루어질 수도 있다. 그렇지 않다면, chroma_format_idc 신택스 엘리먼트가 0 과 동일하지 않은 경우, 현재 픽처는 3개의 샘플 어레이들 (예를 들어, S_L, S_Cb 및 S_Cr) 을 포함할 수도 있다.

위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, bitDepthLumaMinus8 엘리먼트는, 이 HEVC 디코더 구성 레코드가 적용되는 스트림에 대해, ISO/IEC 23008-2 에서 bit_depth_luma_minus8 신택스 엘리먼트에 의해 정의된 바와 같이 루마 비트 심도 표시자를 포함한다. bitDepthChromaMinus8 엘리먼트는, 이 구성 레코드가 적용되는 스트림에 대해, ISO/IEC 23008-2 에서 bit_depth_chroma_minus8 신택스 엘리먼트에 의해 정의된 바와 같이 크로마 비트 심도 표시자를 포함할 수도 있다. 샘플 값 (예를 들어, 루마 샘플 또는 크로마 샘플) 에 대한 비트 심도는 얼마나 많은 비트들이 샘플 값을 표현하는데 사용되는지를 나타낼 수도 있다.

부가적으로, 위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, avgFrameRate 엘리먼트는, 이 HEVC 디코더 구성 레코드가 적용되는 스트림에 대해, 프레임들/(256 초들) 의 유닛들로 평균 프레임 레이트가 주어진다. 0 과 동일한 값을 갖는 avgFramRate 엘리먼트는 미특정된 평균 프레임 레이트를 나타낼 수도 있다.

위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, 1 과 동일한 constantFrameRate 엘리먼트는, 이 HEVC 디코더 구성 레코드가 적용되는 스트림이 일정한 프레임 레이트로 됨을 나타낼 수도 있다. 2 와 동일한 constantFrameRate 엘리먼트는, 스트림에서의 각각의 시간적 레이어의 표현이 일정한 프레임 레이트로 됨을 나타낼 수도 있다. 0 과 동일한 constantFrameRate 엘리먼트는, 스트림이 일정한 프레임 레이트로 될 수도 있음 또는 되지 않을 수도 있음을 나타낸다.

또한, 위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, numTemporalLayers 엘리먼트는, HEVC 디코더 구성 레코드가 적용되는 스트림이 시간적으로 스케일러블한지 여부 및 제약된 수의 시간적 레이어들 (ISO/IEC 23008-2 에서 시간적 서브-레이어 또는 서브-레이어라고도 또한 지칭됨) 이 numTemporalLayers 과 동일한지 여부를 나타낼 수도 있다. 예를 들어, 1 보다 더 큰 numTemporalLayers 신택스 엘리먼트는, 이 HEVC 디코더 구성 레코드가 적용되는 스트림이 시간적으로 스케일러블함 및 제약된 수의 시간적 레이어들이 numTemporalLayers 과 동일함을 나타낼 수도 있다. 이 예에서, 1 과 동일한 numTemporalLayers 엘리먼트는, 스트림이 시간적으로 스케일러블하지 않음을 나타낼 수도 있다. 또한, 이 예에서, 0 과 동일한 numTemporalLayers 엘리먼트는, 스트림이 시간적으로 스케일러블한지 여부가 알려져 있지 않음을 나타낼 수도 있다.

위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, temporalIdNested 엘리먼트는, HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 0 과 동일한 sps_temporal_id_nesting_flag 신택스 엘리먼트들을 갖는지 여부를 나타낼 수도 있다. 예를 들어, 1 과 동일한 temporalIdNested 엘리먼트는, HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 1 과 동일한 ISO/IEC 23008-2 에 정의된 sps_temporal_id_nesting_flag 신택스 엘리먼트들을 가지며 임의의 상위 시간적 레이어로의 시간적 서브-레이어 업-스위칭이 임의의 샘플에서 수행될 수 있음을 나타낼 수도 있다. 이 예에서, 0 과 동일한 temporalIdNested 엘리먼트는, HEVC 디코더 구성 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 SPS들 중 적어도 하나가 0 과 동일함을 나타낼 수도 있다.

이러한 방법으로, 디바이스는 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성할 수도 있다. 파일은 또한, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 sps_temporal_id_nesting_flag 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 레코드를 포함하는 박스를 포함한다.

위에 제공된 HEVC 디코더 구성 레코드에 대한 예시적인 신택스에서, lengthSizeMinusOne 엘리먼트 플러스 1 은, HEVC 디코더 구성 레코드가 적용되는 스트림에서 HEVC 비디오 샘플에서의 NALUnitLength 필드의 바이트들에 있어서의 길이를 나타낸다. 예를 들어, 1 바이트의 사이즈는 0 의 값으로 나타낸다. 이 필드의 값은 1, 2, 또는 4 바이트들로 인코딩된 길이에 각각 대응하는 0, 1, 또는 3 중 하나일 것이다.

또한, HEVC 디코더 구성은 초기화 NAL 유닛들을 전달하는 어레이들의 세트를 포함할 수도 있다. 다시 말해, HEVC 디코더 구성 레코드에는, 초기화 NAL 유닛들을 전달하는 어레이들의 세트가 존재한다. HEVC 디코더 구성 레코드에서의 NAL 유닛 타입들은 VPS들, SPS들, PPS들, 및 SEI 메시지들을 포함하는 NAL 유닛들로 한정될 수도 있다. HEVC 작업 초안 8 및 본 개시물은 몇몇 예비된 NAL 유닛 타입들에 대해 제공한다. 차후에, 이러한 예비된 NAL 유닛 타입들은 HEVC 에 대한 확장들을 구현하도록 정의될 수도 있다. 다시 말해, ISO/IEC 23008-2 에서 그리고 본 명세서에서 예비되는 NAL 유닛 타입들은 차후에 정의를 획득할 수도 있다. 일부 예들에서, 판독기들 (예를 들어, HEVC 디코더 구성 레코드를 수신하고 프로세싱하는 디바이스들) 은 예비된 또는 비허가된 NAL 유닛 타입 값들을 갖는 NAL 유닛들의 어레이들을 무시해야 한다. 이 예비된 또는 비허가된 NAL 유닛 타입 값들을 갖는 NAL 유닛들의 어레이들을 무시하는 '저항성' 거동은 에러들이 일어나지 않게 하여, 차후 사양들에서 이들 어레이들에 대한 역호환가능 확장들의 가능성을 가능하게 하도록 설계된다. 일부 예들에서, 어레이들은 VPS, SPS, PPS, 및 SEI 의 순서로 될 수도 있다. 다른 예들에서, 어레이들은 사이즈에 따라 HEVC 디코더 구성 레코드 내에서 순서화될 수도 있다. 예를 들어, 어레이들은, 더 작은 어레이들이 더 큰 어레이들보다 앞에 생기도록 HEVC 디코더 구성 레코드 내에서 순서화될 수도 있다.

또한, 위에 제공된 HEVC 디코더 구성 레코드들에 대한 예시적인 신택스에서, numArrays 엘리먼트는, 나타낸 타입(들) 의 NAL 유닛들의 어레이들의 수를 나타낸다. HEVC 디코더 구성 레코드들의 array_completeness 엘리먼트들은, HEVC 디코더 구성 레코드에서 어레이에 있는 주어진 타입의 NAL 유닛들에 부가적으로, 주어진 타입의 NAL 유닛들을 스트림이 포함할 수도 있는지 여부를 나타낼 수도 있다. 예를 들어, 1 과 동일한 array_completeness 엘리먼트는, 주어진 타입의 모든 NAL 유닛들이 HEVC 디코더 구성 레코드에서 NAL 유닛들의 어레이에 있고 어떤 것도 스트림에 있지 않음을 나타낼 수도 있다. 0 과 동일한 array_completeness 엘리먼트는, 나타낸 타입의 부가적인 NAL 유닛들이 스트림에 있을 수도 있음을 나타낸다. array_completeness 엘리먼트의 디폴트 및 허가된 값들은 샘플 엔트리 코드에 의해 제약될 수도 있다.

또한, 위에 제공된 HEVC 디코더 구성 레코드들의 예시적인 신택스에서, NAL_unit_type 엘리먼트는, NAL 유닛들의 어레이에서 NAL 유닛들의 타입을 나타낸다. 이 예에서, 어레이에서의 NAL 유닛들 모두는 NAL_unit_type 엘리먼트에 의해 특정된 타입에 속해야 한다. NAL_unit_type 엘리먼트는 ISO/IEC 23008-2 에 정의된 값을 취할 수도 있다. 일부 예들에서, NAL_unit_type 엘리먼트는 VPS, SPS, PPS, 또는 SEI NAL 유닛을 나타내는 값들 중 하나를 취하는 것으로 한정된다.

위에 제공된 예시적인 HEVC 디코더 구성 레코드 신택스에서, numNalus 엘리먼트는, HEVC 디코더 구성 레코드가 적용되는 스트림에 대해 이 HEVC 디코더 구성 레코드에 포함된 나타낸 타입의 NAL 유닛들의 수를 나타낸다. 일부 예들에서, HEVC 디코더 구성 레코드의 NAL_unit_type 엘리먼트는, HEVC 디코더 구성 레코드가 SEI 어레이 (즉, SEI NAL 유닛들의 어레이) 를 포함함을 나타낼 수도 있다. 예를 들어, 이러한 예들에서, numNalus 가 4 와 동일한 경우, SEI 어레이는 4개의 SEI NAL 유닛들로 이루어질 수도 있다. 또한, 일부 이러한 예들에서, SEI 어레이는 '서술' 성질의 SEI 메시지들만을 포함해야 한다. 즉, SEI 어레이는 전체로서 스트림에 관한 정보를 제공하는 SEI 메시지들만을 포함할 수도 있다. '서술' 성질의 SEI 메시지의 일 예는 사용자-데이터 SEI 메시지이다.

또한, 위에 제공된 HEVC 디코더 구성 레코드들에 대한 예시적인 신택스에서, HEVC 디코더 구성 레코드의 NALUnitLength 엘리먼트는 NAL 유닛의 바이트들에 있어서의 길이를 나타낸다. HEVC 디코더 구성 레코드의 nalUnit 엘리먼트는, ISO/IEC 23008-2 에 특정된 바와 같이, VPS, SPS, PPS, 또는 서술 SEI NAL 유닛을 포함할 수도 있다.

도 4 는 본 개시물의 하나 이상의 기법들에 따른 일 예시적인 동작 (200) 을 예시한 플로차트이다. 도 4 의 예에서, 제 1 디바이스 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는 파일을 생성한다 (202). 이 파일은 코딩된 픽처들을 포함하는 복수의 샘플들, 및 그 복수의 샘플들 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별하는 박스를 포함한다. 이 박스는 또한 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낸다.

또한, 도 4 의 예에서, 제 2 디바이스 (예를 들어, 비디오 디코더 (30) 또는 다른 디바이스) 는, 샘플 그룹을 식별하는 박스에서의 데이터에 기초하여, 박스를 포함하는 파일에서의 샘플들 중에서 STSA 샘플들을 식별한다 (204).

도 5 는 본 개시물의 하나 이상의 부가적인 기법들에 따른 일 예시적인 동작 (250) 을 예시한 플로차트이다. 도 5 의 예에서, 제 1 디바이스 (예를 들어, 비디오 인코더 (20) 또는 다른 디바이스) 는 비디오 데이터의 코딩된 픽처들을 포함하는 코딩된 샘플들을 저장하는 파일을 생성할 수도 있다 (252). 이 파일은 또한, 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함하는 샘플 엔트리를 포함할 수도 있다.

또한, 도 5 의 예에서, 제 2 디바이스 (예를 들어, 비디오 디코더 (30) 또는 다른 디바이스) 는, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 포함하는 파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 레코드가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정할 수도 있다 (254).

도 6 은 본 개시물의 하나 이상의 기법들에 따른 파일 (300) 의 일 예시적인 구조를 예시한 개념도이다. 도 6 의 예에서, 파일 (300) 은 무비 박스 (302) 및 복수의 미디어 데이터 박스들 (304) 을 포함한다. 미디어 데이터 박스들 (304) 각각은 하나 이상의 샘플들 (305) 을 포함할 수도 있다. 또한, 도 6 의 예에서, 무비 박스 (302) 는 트랙 박스 (306) 를 포함한다. 다른 예들에서, 무비 박스 (302) 는 상이한 트랙들에 대한 다수의 트랙 박스들을 포함할 수도 있다. 트랙 박스 (306) 는 샘플 테이블 박스 (308) 를 포함한다. 샘플 테이블 박스 (308) 는 SampleToGroup 박스 (310), SampleGroupDescription 박스 (312), 및 HEVC 디코더 구성 레코드 (314) 를 포함한다. 다른 예들에서, 샘플 테이블 박스 (308) 는 SampleToGroup 박스 (310) 및 SampleGroupDescription 박스 (312) 에 부가적으로 다른 박스들을 포함할 수도 있거나 및/또는 다수의 SampleToGroup 박스들 및 SampleGroupDescription 박스들을 포함할 수도 있다.

본 개시물의 하나 이상의 기법들에 따르면, SampleToGroup 박스 (310) 는 샘플들 (305) 중에서 하나 이상의 샘플들을 포함하는 샘플 그룹을 식별할 수도 있다. SampleToGroup 박스 (310) 는 또한 샘플 그룹에서의 각각의 샘플이 STSA 샘플임을 나타낼 수도 있다. 이에 따라, 디바이스는, SampleToGroup 박스 (310) 에서의 데이터에 기초하여, 파일 (300) 에서의 샘플들 (305) 중에서 STSA 샘플들을 식별할 수도 있다. 본 개시물의 하나 이상의 부가적인 예시적인 기법들에 따르면, SampleToGroup 박스 (310) 는 샘플 그룹에서의 각각의 샘플이 인트라 샘플들임을 나타낼 수도 있다. 이에 따라, 디바이스는, SampleToGroup 박스 (310) 에서의 데이터에 기초하여, 파일 (300) 에서의 샘플들 (305) 중에서 인트라 샘플들을 식별할 수도 있다.

본 개시물의 하나 이상의 부가적인 예시적인 기법들에 따르면, HEVC 디코더 구성 레코드 (314) 는, HEVC 디코더 구성 레코드 (314) 가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는지 여부를 나타내는 엘리먼트를 포함할 수도 있다. 이에 따라, 디바이스는, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들 (305) 을 포함하는 파일 (300) 의 샘플 테이블 박스 (308) 에서의 HEVC 디코더 구성 레코드 (314) 에서의 엘리먼트에 기초하여, HEVC 디코더 구성 레코드 (314) 가 적용되는 스트림이 디코딩될 때 활성화되는 모든 SPS들이 그 SPS들과 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트들을 갖는 것을 결정할 수도 있다.

하나 이상의 예들에서는, 설명된 기능들이 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다.　 소프트웨어로 구현될 경우, 기능들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독가능 매체 상에 저장되거나 컴퓨터 판독가능 매체를 통해 송신될 수도 있고, 하드웨어-기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터 판독가능 매체들은 데이터 저장 매체들과 같은 유형의 매체에 대응하는 컴퓨터 판독가능 저장 매체들, 또는, 예를 들어, 통신 프로토콜에 따라 하나의 장소로부터 또 다른 장소로 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하는 통신 매체들을 포함할 수도 있다. 이러한 방식으로, 컴퓨터 판독가능 매체들은 일반적으로 (1) 비일시적인 유형의 컴퓨터 판독가능 저장 매체들 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수도 있다. 　데이터 저장 매체들은 본 개시물에서 설명된 기법들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능한 매체들일 수도 있다.　 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있다.

제한이 아닌 예로서, 이러한 컴퓨터 판독가능 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 저장, 자기 디스크 저장, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 명령들 또는 데이터 구조들의 형태로 원하는 프로그램 코드를 저장하는데 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다.　 또한, 임의의 접속은 컴퓨터 판독가능 매체라고 적절하게 칭해진다. 예를 들어, 동축 케이블, 광섬유 케이블, 트위스트 페어 (twisted pair), 디지털 가입자 라인 (DSL), 또는 무선 기술들, 예컨대, 적외선, 라디오 (radio), 및 마이크로파 (microwave) 를 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 명령들이 송신될 경우, 동축 케이블, 광섬유 케이블, 트위스트 페어, DSL, 또는 무선 기술들, 예컨대, 적외선, 라디오, 및 마이크로파는 매체의 정의 내에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체들 및 데이터 저장 매체들은 접속들, 반송파들, 신호들, 또는 다른 순시적 매체들을 포함하는 것이 아니라, 그 대신에, 비순시적인 유형의 저장 매체들에 관한 것이라는 것을 이해해야 한다. 여기에서 사용된 바와 같은 디스크 (disk) 및 디스크 (disc) 는 컴팩트 디스크 (compact disc; CD), 레이저 디스크 (laser disc), 광학 디스크 (optical disc), 디지털 다기능 디스크 (digital versatile disc; DVD), 플로피 디스크 (floppy disk) 및 블루레이 디스크 (Blu-ray disc) 를 포함하고, 여기서 디스크 (disk) 들은 통상 데이터를 자기적으로 재생하는 한편, 디스크 (disc) 들은 데이터를 레이저들로 광학적으로 재생한다. 상기의 조합들은 컴퓨터 판독가능 매체들의 범위 내에 또한 포함되어야 한다.

명령들은 하나 이상의 디지털 신호 프로세서 (DSP) 들, 범용 마이크로프로세서들, 주문형 집적 회로 (ASIC) 들, 필드 프로그래밍가능 로직 어레이 (FPGA) 들, 또는 다른 등가의 통합된 또는 별개의 로직 회로부와 같은 하나 이상의 프로세서들에 의해 실행될 수도 있다. 따라서, 여기에서 사용된 바와 같은 용어 "프로세서" 는 전술한 구조 또는 여기에서 설명된 기법들의 구현에 적합한 임의의 다른 구조 중 임의의 것을 지칭할 수도 있다. 부가적으로, 일부 양태들에서는, 여기에서 설명된 기능성이 인코딩 및 디코딩을 위해 구성되거나 조합된 코덱 내에 통합되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수도 있다. 또한, 기법들은 하나 이상의 회로들 또는 로직 엘리먼트들에서 완전히 구현될 수 있다.

본 개시물의 기법들은 무선 핸드셋, 집적 회로 (IC) 또는 IC들의 세트 (예를 들어, 칩셋) 를 포함하는 광범위한 디바이스들 또는 장치들에서 구현될 수도 있다. 다양한 컴포넌트들, 모듈들, 또는 유닛들은 개시된 기법들을 수행하도록 구성된 디바이스들의 기능적 양태들을 강조하기 위해 본 개시물에서 설명되지만, 상이한 하드웨어 유닛들에 의한 실현을 반드시 요구하지는 않는다. 오히려, 위에 설명된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛 내에 조합될 수도 있거나, 적합한 소프트웨어 및/또는 펌웨어와 함께, 위에 설명된 바와 같은 하나 이상의 프로세서들을 포함하는 상호동작하는 하드웨어 유닛들의 집합에 의해 제공될 수도 있다.

다양한 예들이 설명되었다. 이러한 그리고 다른 예들은 다음의 청구항들의 범위 내에 있다.

Claims

비디오 데이터를 프로세싱하는 방법으로서,
상기 방법은,
파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 결정하는 단계를 포함하고,
상기 파일은 상기 샘플 엔트리를 포함하고, 상기 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 SPS들 중 하나와 연관된 샘플에서 상기 시간적 서브-레이어 업-스위칭을 수행하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는, 상기 샘플 엔트리에 있는 디코더 구성 레코드 (decoder configuration record) 에 있는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
제 1 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내고,
제 2 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있다는 것이 보장되지 않음을 나타내는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 신택스 엘리먼트는 sps_temporal_id_nesting_flag 신택스 엘리먼트인, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 공간 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 공간 플래그 신택스 엘리먼트들이 상기 프로파일 공간 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 티어 (tier) 플래그 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 티어 플래그 신택스 엘리먼트들이 상기 티어 플래그 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하고,
상기 일반적 티어 플래그 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스들이 준수하는 레벨들을 나타내는 일반적 레벨 표시자 신택스 엘리먼트들의 해석을 위한 티어 콘텍스트를 나타내는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 표시자 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 프로파일 표시 신택스 엘리먼트들이 상기 프로파일 표시자 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하고,
상기 프로파일 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 프로파일을 나타내는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 호환성 표시들 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 호환성 플래그 신택스 엘리먼트들이 상기 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 제약 표시자 플래그들 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 예비된 제로 16 비트들 신택스 엘리먼트들이 상기 제약 표시자 플래그들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
제 1 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 레벨 표시자 엘리먼트를 포함하며,
상기 방법은, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 레벨 표시 신택스 엘리먼트들이 상기 레벨 표시자 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하는 단계를 더 포함하고,
상기 일반적 레벨 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 레벨을 나타내는, 비디오 데이터를 프로세싱하는 방법.
코딩된 비디오 데이터를 저장하는 방법으로서,
상기 방법은,
샘플 엔트리를 포함하고, 상기 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하는 파일을 생성하는 단계를 포함하고,
상기 샘플 엔트리는, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 나타내는 엘리먼트를 포함하고,
상기 샘플 엔트리에 포함된 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는, 상기 샘플 엔트리에 있는 디코더 구성 레코드에 있는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
제 1 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내고,
제 2 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있다는 것이 보장되지 않음을 나타내는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 신택스 엘리먼트는 sps_temporal_id_nesting_flag 신택스 엘리먼트인, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 공간 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 공간 플래그 신택스 엘리먼트들은, 상기 프로파일 공간 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 티어 플래그 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 티어 플래그 신택스 엘리먼트들은, 상기 티어 플래그 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 일반적 티어 플래그 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스들이 준수하는 레벨들을 나타내는 일반적 레벨 표시자 신택스 엘리먼트들의 해석을 위한 티어 콘텍스트를 나타내는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 표시자 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 프로파일 표시 신택스 엘리먼트들은, 상기 프로파일 표시자 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 프로파일 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 프로파일을 나타내는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 호환성 표시들 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 호환성 플래그 신택스 엘리먼트들은, 상기 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 제약 표시자 플래그들 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 예비된 제로 16 비트들 신택스 엘리먼트들은, 상기 제약 표시자 플래그들 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하는 방법.
제 12 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 레벨 표시자 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 레벨 표시 신택스 엘리먼트들은 상기 레벨 표시자 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 일반적 레벨 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 레벨을 나타내는, 코딩된 비디오 데이터를 저장하는 방법.
비디오 데이터를 프로세싱하기 위한 디바이스로서,
상기 디바이스는,
상기 비디오 데이터를 저장하도록 구성된 메모리; 및
파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 결정하도록 구성된 하나 이상의 프로세서들
을 포함하고,
상기 파일은 상기 샘플 엔트리를 포함하고, 상기 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 하나 이상의 프로세서들은 상기 SPS들 중 하나와 연관된 샘플에서 상기 시간적 서브-레이어 업-스위칭을 수행하도록 구성되는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는, 상기 샘플 엔트리에 있는 디코더 구성 레코드에 있는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
제 1 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내고,
제 2 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있다는 것이 보장되지 않음을 나타내는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 신택스 엘리먼트는 sps_temporal_id_nesting_flag 신택스 엘리먼트인, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 공간 엘리먼트를 포함하며,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 공간 플래그 신택스 엘리먼트들이 상기 프로파일 공간 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하도록 구성되는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 티어 플래그 엘리먼트를 포함하고,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 티어 플래그 신택스 엘리먼트들이 상기 티어 플래그 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하도록 구성되며,
상기 일반적 티어 플래그 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스들이 준수하는 레벨들을 나타내는 일반적 레벨 표시자 신택스 엘리먼트들의 해석을 위한 티어 콘텍스트를 나타내는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 표시자 엘리먼트를 포함하고,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 프로파일 표시 신택스 엘리먼트들이 상기 프로파일 표시자 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하도록 구성되며,
상기 프로파일 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 프로파일을 나타내는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 호환성 표시들 엘리먼트를 포함하며,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 호환성 플래그 신택스 엘리먼트들이 상기 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하도록 구성되는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 제약 표시자 플래그들 엘리먼트를 포함하며,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 예비된 제로 16 비트들 신택스 엘리먼트들이 상기 제약 표시자 플래그들 엘리먼트의 값들과 매칭하는 값들을 갖는 것을 결정하도록 구성되는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 22 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 레벨 표시자 엘리먼트를 포함하고,
상기 하나 이상의 프로세서들은 또한, 상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 레벨 표시 신택스 엘리먼트들이 상기 레벨 표시자 엘리먼트의 값과 매칭하는 값들을 갖는 것을 결정하도록 구성되며,
상기 일반적 레벨 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 레벨을 나타내는, 비디오 데이터를 프로세싱하기 위한 디바이스.
코딩된 비디오 데이터를 저장하기 위한 디바이스로서,
상기 디바이스는,
상기 비디오 데이터를 저장하도록 구성된 메모리; 및
샘플 엔트리를 포함하고, 상기 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하는 파일을 생성하도록 구성된 하나 이상의 프로세서들
을 포함하고,
상기 샘플 엔트리는, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 나타내는 엘리먼트를 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는, 상기 샘플 엔트리에 있는 디코더 구성 레코드에 있는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
제 1 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내고,
제 2 값을 갖는 상기 엘리먼트는, 상기 SPS들과 연관된 샘플들 중 임의의 샘플에서 임의의 상위 시간적 서브-레이어로의 시간적 서브-레이어 업-스위칭이 수행될 수 있다는 것이 보장되지 않음을 나타내는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 신택스 엘리먼트는 sps_temporal_id_nesting_flag 신택스 엘리먼트인, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 공간 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 공간 플래그 신택스 엘리먼트들은, 상기 프로파일 공간 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 티어 플래그 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 티어 플래그 신택스 엘리먼트들은, 상기 티어 플래그 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 일반적 티어 플래그 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스들이 준수하는 레벨들을 나타내는 일반적 레벨 표시자 신택스 엘리먼트들의 해석을 위한 티어 콘텍스트를 나타내는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 표시자 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 프로파일 표시 신택스 엘리먼트들은, 상기 프로파일 표시자 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 프로파일 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 프로파일을 나타내는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 프로파일 호환성 표시들 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 프로파일 호환성 플래그 신택스 엘리먼트들은, 상기 프로파일 호환성 표시들 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 제약 표시자 플래그들 엘리먼트를 포함하며,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 예비된 제로 16 비트들 신택스 엘리먼트들은, 상기 제약 표시자 플래그들 엘리먼트의 값들과 매칭하는 값들을 갖는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
제 33 항에 있어서,
상기 엘리먼트는 제 1 엘리먼트이고,
상기 샘플 엔트리는 레벨 표시자 엘리먼트를 포함하고,
상기 스트림이 디코딩될 때 활성화되는 파라미터 세트들에서의 모든 일반적 레벨 표시 신택스 엘리먼트들은 상기 레벨 표시자 엘리먼트의 값과 매칭하는 값들을 가지며,
상기 일반적 레벨 표시 신택스 엘리먼트들 각각은, 코딩된 비디오 시퀀스가 준수하는 레벨을 나타내는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
비디오 데이터를 프로세싱하기 위한 디바이스로서,
상기 디바이스는,
샘플 엔트리를 포함하고, 상기 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하는 파일을 수신하는 수단; 및
파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 결정하는 수단
을 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 비디오 데이터를 프로세싱하기 위한 디바이스.
코딩된 비디오 데이터를 저장하기 위한 디바이스로서,
상기 디바이스는,
샘플 엔트리를 포함하고, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하는 파일을 생성하는 수단; 및
상기 파일을 출력하는 수단
을 포함하고,
상기 샘플 엔트리는, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 나타내는 엘리먼트를 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.
명령들을 저장한 비일시적 컴퓨터 판독가능 저장 매체로서,
상기 명령들은, 실행될 때, 파일의 샘플 엔트리에서의 엘리먼트에 기초하여, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 결정하도록 하나 이상의 프로세서들을 구성하고,
상기 파일은 상기 샘플 엔트리를 포함하고, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
명령들을 저장한 비일시적 컴퓨터 판독가능 저장 매체로서,
상기 명령들은, 실행될 때, 샘플 엔트리를 포함하고, 비디오 데이터의 코딩된 픽처들을 포함하는 샘플들을 별도로 포함하는 파일을 생성하도록 하나 이상의 프로세서들을 구성하고,
상기 샘플 엔트리는, 상기 샘플 엔트리가 적용되는 스트림이 디코딩될 때 활성화되는 복수의 시퀀스 파라미터 세트 (sequence parameter set; SPS) 들의 각각의 개별 SPS 에 대해, 상기 개별 SPS 가 상기 개별 SPS 와 연관된 임의의 샘플에서 임의의 상위 시간적 서브-레이어 (higher temporal sub-layer) 로의 시간적 서브-레이어 업-스위칭이 수행될 수 있음을 나타내는 신택스 엘리먼트를 포함하는 것을 나타내는 엘리먼트를 포함하고,
상기 샘플 엔트리에서의 상기 엘리먼트는 상기 SPS 들 중 임의의 SPS 로부터 분리된 것이고, 그리고
상기 시간적 서브-레이어 업-스위칭은, 그 포인트까지 포워딩되지 않았던 특정 시간적 서브-레이어의 네트워크 추상화 레이어 (Network Abstraction Layer; NAL) 유닛들을 포워딩하기 시작하는 액션을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
제 22 항에 있어서,
상기 디바이스는,
집적 회로;
마이크로프로세서; 또는
무선 통신 디바이스
중 적어도 하나를 포함하는, 비디오 데이터를 프로세싱하기 위한 디바이스.
제 33 항에 있어서,
상기 디바이스는,
집적 회로;
마이크로프로세서; 또는
무선 통신 디바이스
중 적어도 하나를 포함하는, 코딩된 비디오 데이터를 저장하기 위한 디바이스.