Nothing Special   »   [go: up one dir, main page]

KR20080067637A - 독립 변수들에 대한 적응적 가변 길이 코드들 - Google Patents

독립 변수들에 대한 적응적 가변 길이 코드들 Download PDF

Info

Publication number
KR20080067637A
KR20080067637A KR1020087010634A KR20087010634A KR20080067637A KR 20080067637 A KR20080067637 A KR 20080067637A KR 1020087010634 A KR1020087010634 A KR 1020087010634A KR 20087010634 A KR20087010634 A KR 20087010634A KR 20080067637 A KR20080067637 A KR 20080067637A
Authority
KR
South Korea
Prior art keywords
symbol
symbols
variable length
length code
buffer
Prior art date
Application number
KR1020087010634A
Other languages
English (en)
Inventor
저스틴 릿
마르타 카르제위즈
일리앙 바오
시앙글린 왕
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20080067637A publication Critical patent/KR20080067637A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

가변 길이 코드들을 이용하는 규모가변적 비디오 코딩 시, 공간적인 품질 개선 정보를 코딩하는 방법. 일반적인 시스템들은 비규모가변적 비디오 코딩에서만 가변 길이 코드들을 사용할 수 있었다. 본 발명에서는, 각 정보 블록에 대한 코딩 블록 패턴, 유의 패스들, 및 정교화 패스들이 모두 서로 다른 유형의 가변 길이 코드들을 이용해 코딩될 수 있다. 본 발명은 또한 실제 심볼 확률에 동적으로 적응하는 가변 길이 인코더/디코더를 제공한다. 본 발명의 인코더/디코더는 각 심볼이 코딩되는 횟수를 카운트한다. 이러한 카운트에 기초해, 인코더/디코더는 코드 워드를 형성시 얼마나 많은 심볼들을 그룹화할지를 선택한다. 인코더 또한 이러한 카운트들을 이용하여, 사용될 특정 코드워드를 선택하도록 한다.

Description

독립 변수들에 대한 적응적 가변 길이 코드들 {Adaptive variable length codes for independent variables}
본 발명은 일반적으로 채널 코딩 및 데이터 압축, 그리고 규모가변적 비디오 코딩에 관한 것이다. 보다 구체적으로 말해, 본 발명은 미세 단위 (fine granularity) 규모가변적 비디오 코딩 시의 코딩에 관한 것이다. 본 발명은 기본적으로 비디오 코딩에 사용되기 위해 고안되었으나, 음성/오디오 및 이미지 압축과 같은 다른 유형의 데이터 압축에 대해서도 구현될 수 있다.
MPEG-1, H.261/263/264 같은 일반적인 비디오 코딩 규격들은, 일반적으로 "고정 QP 인코딩"이라 불리는 어떤 소정의 품질 설정이나, 레이트 제어 메커니즘 사용을 통한 상대적으로 일정한 비트 레이트로 비디오를 인코딩한다. 비디오가 다른 품질로서 전송 또는 디코딩되어야 할 때, 데이터는 먼저 디코딩되고 그런 다음 적절한 설정을 이용해 재 인코딩되어야 한다. 저-지연 (low-delay) 실시간 어플리케이션들에서와 같은 일부 시나리오 하에서는, 그러한 "트랜스코딩" 절차가 적합하지 못하다.
마찬가지로, 통상의 비디오 코딩 규격들은 특정한 공간 해상도로 비디오를 디코딩한다. 비디오가 보다 낮은 해상도로 전송 혹은 디코딩되어야 할 때, 데이터 는 우선 디코딩되고, 공간 스케일링 되고 나서, 다음으로 재 인코딩되어야 한다. 역시 그러한 트랜스코딩은 일부 시나리오상에서 적합하지 못하다.
규모가변적 (scalable) 비디오 코딩은, 어떤 최소한의 품질로 "기저 계층 (base layer)"을 인코딩하고, 그런 다음 그 품질을 최고 레벨까지 끌어올리는 개선 (enhancement) 정보를 인코딩함으로써 그러한 문제를 해소한다. 개선 정보를 그 전체로서 산입 (inclusion) 또는 배제 (exclusion)함으로써 "기저" 및 "최고" 품질들 간을 선택하는 것 말고도, 개선 정보는 흔히 불연속 (discrete)점들에서 절단되어, "기저" 계층 및 "최대" 인핸스먼트 계층 사이의 중간 품질들을 가능하게 한다. 품질 향상을 위해, 그 정보는 흔히 불연속(이나 근접 간격의) 포인트들에서 절단되어, "기저" 및 "최고" 사이의 중간 품질들이 얻어질 수 있게 함으로써 추가적 적응성을 제공한다. 불연속 절단 점들 (truncation points)이 가까운 간격으로 떨어져 있는 경우들에서, 규모가변성은 "미세 단위 (fine-grained)"라고 불리고, 그로부터 "미세 단위의 규모가변성 (FGS, fine grained scalability)"이라는 용어가 파생된다.
현재 규모가변적 확장 버전인 H.264/AVC은, 공간 및 품질 인핸스먼트 정보를 디코딩할 때 산술 (arithmetic) 코더의 일종인 CABAC를 이용한다. CABAC는 가변 길이 코드들 (VLCs)에 대한 대안적 엔트로피 코딩 방법이다. CABAC는 일반적으로 코딩 효율성이라는 장점을 가지지만, 그것과 관련해 디코더 복잡도의 증가와 같은 여러 단점들이 존재한다고 파악되고 있다. 또, 현재의 규모가변적 확장 버전인 H.264/AVC에 대해 어떠한 VLC 대안도 제공되고 있지 않다. 비규모가변적 H.264/AVC 규격은 CABAC 및 VLC들 모두를 지원하고, 그 각각이 장단점을 가진다는 것을 인지하여, 특정 어플리케이션에 가장 적합한 방법이 선택되게 한다.
그 외에, 규모가변적 비디오 코딩에서, FGS 정보는 가변 길이 코드들 혹은 산술 코딩을 이용해 비트 스트림으로 코딩될 수 있다. 산술 코딩 대신 가변 길이 코드들을 이용할 때 코딩 효율성을 개선하는 것이 요망된다. 이전에 값들은 독립 플래그들로서 코딩되거나 고정 길이 그룹들 안에 모아져서 컨텍스트 적응적이지 않은 VLC를 이용해 인코딩되었다.
보다 짧은 코드워드들은 보다 높은 발생 확률을 가진 심볼들로 할당되고, 보다 긴 코드워드들은 보다 낮은 발생 확률을 가진 심볼들로 할당되도록 가변 길이 코드들이 디자인된다. 더 특정하여 말하면, 확률
Figure 112008031631488-PCT00001
을 갖는 심볼
Figure 112008031631488-PCT00002
가 k 비트 길이의 코드워드에 할당될 것이다.
가변 길이 코드 테이블 디자인 시 사용되는 확률 분포가 특정 비트 스트림에서 실제 심볼 확률들과 매치하지 않을 때, 가변 길이 코드의 압축 효율은 저하된다. 일반적으로 그러한 "확률 미스 매치"에 이바지하는 두 가지 요인들이 있다. 첫째, 실제 심볼 확률이 미리 알려지지 않을 것이므로, 가변 길이 코드는 어떤 유형의 일반화된 "트레이닝 데이터"를 이용해 디자인되어야 한다. 이러한 문제를 극복하기 위한 기술들은, 비트 스트림 헤더를 통해 코드 테이블을 전송하거나, 미리 설계된 여러 가변 길이 코드들 중 어떤 것이 가장 정확하게 소스 데이터와 매치하는지를 시그날링하는 동작을 수반한다. 둘째, 심볼 확률들이 미리 알려져 있더라 도, 이들은
Figure 112008031631488-PCT00003
에 대응하지 않을 수 있는데, 이는 k가 정수 값들로 한정되어 있기 때문이다. 이것이 구조상의 한계로서, 그 한계는 보통 여러 개의 심볼들을 그룹화하고 한 코드워드를 각각의 가능한 그룹에 할당함으로써 극복된다. 예를 들어, 바이너리의 경우, 두 심볼들인 0과 1이 쌍들로 그룹화되어, 가능한 조합들인 00, 01, 10, 11을 산출한다. k는 동일한 정수 강제요건을 가지므로, 이것이 확률 식의 정확도를 효과적으로 배가시킨다.
상술한 "워크 어라운드 (work-around)" 기술들은 일반적으로 알려져 있지만, 보통은 실용적이지 못하다. 예를 들어, 확률 분포가 중대한 로컬 변경 (가령, 비디오 코딩시 한 프레임에서 다른 프레임으로)을 겪게 되면, 최적의 VLC 테이블을 비트 스트림으로 코딩하는 것과 관련된 오버헤드가 지나치게 클 수 있다. 다른 경우들에서, 확률 분포를 정확히 재현하기 위해 결합할 필요가 있는 심볼들의 개수가 디코딩될 심볼들의 개수를 초과하거나, 아니면 그것이 디코딩 경로에 원치않는 복잡도를 더할 수 있다. 산술 코딩은 상술한 그런 한계를 극복하는 것을 돕기 위해 사용될 수 있다. 예를 들어, CABAC 같은 산술 코더는, 어떤 비트 스트림 시그날링도 필요로 되지 않고, 그러한 코더가 심볼 확률들의 유한 집합을 조건으로 하지 않도록 (즉, k는 식
Figure 112008031631488-PCT00004
의 정수에 국한되지 않음) 심볼 확률에 자가 적응한다. 그러나, 산술 코딩은 자체적인 일련의 결함들을 가지고 있다. 그것은 일반적으로 상술한 시스템들보다 더 복잡하다는 것이고, 디코딩 시 "미리 파악해야 할" 필요성이, 데이터를 자르고 유효한 디코더 상태를 유지시키는 것을 어렵게 만든다 는 것이다.
따라서, 가변 길이 코드들 (즉, 낮은 복잡도, 순시 디코딩 가능/용이한 자르기 가능) 및 산술 코딩 (즉, 자가 적응 및 심볼 확률 모델링을 더 잘할 수 있음) 양측 모두의 긍정적 특징을 보이는 엔트로피 코딩 메커니즘을 가질 것이 요망된다.
본 발명은 가변 길이 코드들 (VLC, variable length codes)을 이용할 때 개선된 코딩 효율성을 고려한다. 본 발명은 또한 소스 데이터의 특성 변화에 자동 적응하는 기능을 갖춘 시스템을 제안한다. 기존의 VLC 기반 솔루션들과 비교할 때, 본 발명은 심볼 확률들에 동적으로 적응하므로, 비트 스트림에서 VLC 테이블을 명백하게 특정할 필요가 없게 된다. 본 발명은 또, 심볼들 간 상관을 활용하는 기존의 여러 VLC 기반 솔루션들과 비교해, 독립 변수들을 코딩할 때의 코딩 효율성 이익 (gain)들을 또한 고려한다. 이외에, 본 발명의 솔루션의 내부 상태는 종래의 산술 코딩 솔루션들의 경우보다 간단하다. 각각의 코드워드는 차후 값들과 무관하게 디코딩 가능한데, 이것은, 이를테면, 비트 스트림에 대해 변경된 버퍼를 "재기입"할 필요 없이 비트 스트림을 자를 수 있다는 것을 의미한다.
본 발명은 가변 길이 코드들을 이용시 FGS 계층들에 대한 코딩 효율성을 개선시키기 위한 방법들을 제안한다. 코딩된 블록 패턴 (CBP, coded block pattern)을 디코딩할 때, 사용될 가변 길이 코딩은, 해당 기저 계층 CBP 내 1들 및 0들의 개수뿐 아니라, 블록이 코딩될 확률에도 좌우된다. 블록이 코딩될 확률은 앞서 관측된 CBP들에 기초한다. 코딩된 블록 플래그들 (CBFs, coded block flags)을 디코딩할 때, 여러 개의 CBF들을 재현하기 위해 하나의 코드워드가 디코딩된다. 사용되는 가변 길이 코딩은 이전의 CBF 값들이 1일 확률에 좌우된다. EOB (end of block) 플래그를 디코딩할 때, "비허용 (illegal) 심볼들"이 사용되어, 1보다 큰 크기를 갖는 블록 내 계수들의 개수 및/또는 블록 내 최대 크기를 가리킨다. 정교화 (refinement) 비트들을 디코딩할 때, 하나 이상의 정교화 비트들로 된 그룹들이 단일 VLC 코드워드로부터 디코딩되며, 이때 사용되는 VLC는 이전에 관찰된 정교화 값들에 기초한다.
본 발명은 C/C++, 또는 어셈블리 언어 등의 어떤 일반적인 프로그래밍 언어를 이용하는 소프트웨어를 통해 바로 구현될 수 있다. 본 발명은 하드웨어를 통해 구현될 수도 있으며, 광범위한 소비자 기기들 안에서 활용될 수 있다.
본 발명은 가변 길이 코드들을 이용한 공간적 품질 (FGS) 개선 정보를 디코딩하기 위한 방법을 또한 제안한다. 본 발명은 이전에는 존재하지 않았던, 규모가변적 비디오 코딩시 VLC들을 이용하는 솔루션을 제안한다. VLC들의 사용이 계산 효율성 면에서 약간의 손실 (약 10% 범위의)을 수반할 수 있다고는 하나, 이 손실은 코더 복잡도 면에서의 개선에 의해 보상된다. 사실상, 인핸스먼트 계층들에서 관찰된 타협점 (tradeoff)들은 비규모가변적 (non-scalable) H.264/AVC 규격에 대해 이미 허용되어온 타협점과 매우 유사하다.
본 발명의 이러한, 그리고 기타 이점들 및 특징들은 첨부된 도면과 연계하여 파악되는 이하의 상세 설명으로부터 자명해질 것이며, 이하에 기술될 여러 도면들에 걸쳐 동일한 구성요소들은 동일한 참조부호를 가진다.
도 1은 서로 다른 세 가변 길이 코드들에 있어, 디코딩할 값들을 포함하고 있지 않을 블록의 확률에 대해 각 심볼에 요구되는 비트들의 개수를 비교한 도표이다.
도 2는 본 발명의 일반적인 인코딩/디코딩 프로세스를 보인 흐름도이다.
도 3은 도 2의 흐름도에서 현재의 가변 길이 코드를 업데이트하는 제1프로세스 예를 보인 흐름도이다.
도 4는 도 2의 흐름도에서, 네 번째 코드워드마다 업데이트가 수행되는 현재의 가변 길이 코드 업데이트를 위한 제2프로세스 예를 보인 흐름도이다.
도 5는 도 2의 흐름도에서, 관측된 심볼들의 개수가 8을 초과할 때까지 가변 길이 코드에 대한 초기값이 특정되는, 현재의 가변 길이 코드 업데이트를 위한 제3프로세스 예를 보인 흐름도이다.
도 6은 p(0)<p(1)인 경우 디코딩 후 시스템이 심볼 벡터들을 "비트 플립 (bit flip)"하는 본 발명의 인코딩/디코딩 프로세스를 보인 흐름도이다.
도 7은 인코딩/디코딩 프로세스 시 버퍼 플러시 (buffer flush)가 포함되는, 본 발명의 인코딩/디코딩 프로세스를 보인 흐름도이다.
도 8은 본 발명의 원리들을 포함할 수 있는 전자 기기의 입체도이다.
도 9는 도 8의 전자 기기의 개략적 회로 표현이다.
일반적으로, 품질 개선 정보는 세 개의 카테고리들로 분류될 수 있다: 코딩 블록 패턴 (coded block pattern), 유의 패스 (significant pass), 및 정교화 패스 (refinement pass). 코딩 블록 패턴에 있어서, 각 매크로블록 (MB) 또는, 8x8 영역인 "서브 MB" 같은 매크로블록의 한 영역에 대해 한 "코딩 플래그 (coded flag)"가 디코딩된다. 이 플래그는 모든 하위 계층들에서 대응하는 매크로블록의 "코딩 플래그"가 0이었을 때, 즉, MB가 기저 계층 또는 다른 하위 계층들에서 코딩되지 않았을 때에만 디코딩될 필요가 있다. 여기 포함된 설명과 예들이 디코딩 프로세스를 특정하여 기술한다고 해도, 이 분야의 당업자라면 동일한 개념 및 원리가 상응하는 인코딩 프로세스에도 적용되고, 또 그 반대의 경우도 성립한다는 것을 쉽게 파악할 수 있을 것이다.
"코딩(됨)"이라고 플래그 된 MB들 (또는 서브 MB들)에 있어서, 그 MB (혹은 서브 MB) 내 각각의 4x4 블록에 대한 코딩 블록 패턴이 이제 디코딩된다. MB의 각 8x8 영역 안에는, 이를테면 네 개의 4x4 블록들이 존재한다. 4x4 블록들 중 어느 것이 인코딩될 계수들을 포함하는지를 가리키기 위해 바이너리 넘버가 사용될 수 있다. 0101이라는 수는 좌 상단의 4x4 블록은 디코딩할 계수들을 포함하고 있지 않고 우 상단의 4x4 블록은 인코딩되었으며, 좌 하단의 것은 인코딩되지 않았고, 우 하단의 것은 인코딩되었음을 가리킨다. 4x4 블록이 이미 기저 계층에서 코딩된 대로 플래그 되었다면, 어떤 CBP 값도 디코딩되지 않는다. 따라서, 비규모가변적 H.264/AVC와는 달리, CBP 내 비트들의 개수는 가변할 수 있다. 상기 예를 이용할 때, 만일 우 하단의 4x4 블록이 기저 계층에서 이미 인코딩되었으면, CBP의 마지막 비트는 불필요하며 CBP는 010이 된다.
그 CBP를 디코딩하는데 한 VLC가 사용된다. 사용되는 특정 VLC는 CBP 내 비트들의 수에 좌우된다. 따라서 VLC는 "컨텍스트 적응적" (CAVLC)이며, 여기서 컨텍스트 (즉, 사용된 VLC)는 기저 대역의 CBP에 의해 주어진다. 컨텍스트 결정 또한, 기저 및/또는 인핸스먼트 계층들에서 공간적으로 이웃하는 블록들의 CBP에 의해 영향을 받을 수 있다. 또한 컨텍스트 결정이 이웃하는 블록들의 코딩 계수들의 개수에 적어도 일부 기반하거나, 인핸스먼트 계층 내 이웃하는 블록들에서의 코딩 계수들의 위치별로 기초할 수도 있다.
사용될 수 있는 VLC들은 맞춤형으로 설계되거나, Golomb 코드들 같은 "구조화된" VLC들을 포함할 수 있다. Golomb 코드는 값들의 확률에 대한 간단한 모델에 기초하는 가변 길이 코드로서, 이때 작은 값들의 확률이 큰 값들보다 크다.
유의 비트들 (significance bits)은 모든 하위 계층들에서 한 계수가 0이었을 때마다 디코딩된다, 즉, 그것은 현재의 계층까지는 디코딩되지 않았다. 유의 비트는 계수가 0인지 0이 아닌 것인지 여부를 가리킨다. 계수가 0이 아니면, 부호와 크기가 뒤따른다.
본 발명에서, 다음 유의 계수 전의 제로 (0)들의 수 (즉, 런 (run))가 인코딩된다. 예를 들어, 기저 대역이 1 0 1 0 0 1이라는 값들을 포함하고, 인핸스먼트 계층이 1 0 2 0 1 1이라는 값을 포함하면, 유의 비트들을 디코딩할 목적으로 첫째, 셋째 및 여섯 번째 계수들은 무시되는데, 이들은 기저 계층에서 0이 아니기 때문이다. 따라서, 디코딩되는 것은 0 0 1 값들이다. 이 예에서, 0 아닌 값 이전의 0들의 "런"은 2이다. "스캔 위치"라는 용어가 여기서, 런이 시작되는 계수의 인덱스 로서 정의된다. 위의 예에서, 첫째 계수는 무시되므로, 첫째 디코딩되는 제로 (0) 값은 스캔 위치 2에 있다. "런"을 디코딩하는데 사용되는 VLC 또한 컨텍스트 적응형으로, 스캔 위치, 기저 계층에서 코딩되는 계수들의 개수 (위의 예에서는 셋), 기저 계층에서 코딩되는 마지막 계수의 인덱스 (위의 예에서는 6), 또는 이 세 가지의 조합에 좌우된다. 본 발명이 구조화되어 있지 않은 VLC (즉, 임의의 VLC가 선택되는 경우에 해당) 뿐 아니라, Golomb 코드들이나 스타트-스텝-스탑 (start-step-stop) 코드들과 같은 "구조화"된 VLC들이 사용되는 보다 협소한 컨텍스트에도 관여할 수 있다는 것 역시 주지해야 한다.
본 발명의 특정 실시예에서, 컨텍스트 기준 (context criteria)의 최적 VLC로의 매핑이 비트 스트림으로부터 디코딩된다. 이것은 예를 들어, 슬라이스 당 한 번 (슬라이스 헤더 안에서), 혹은 프레임 당 한번 일어날 수 있을 것이다. "스캔 위치 #1에 대해 k=1인 Golomb 코드 사용", "스캔 위치 #2에 대해 k=1인 Golomb 코드 사용", "스캔 위치 #3에 대해 k=2인 Golomb 코드 사용" 등등을 명시할 수 있다. 어떤 컨텍스트 기준이 어떤 VLC로 매핑하는지를 정하는 것은 인코딩 전에 데이터를 "사전 스캐닝"하거나, 앞서 인코딩된 데이터 (가령, 이전 프레임)의 통계치를 활용함으로써 해결될 수 있다. 디코딩될 비트 스트림은 실질적으로 어떤 타입의 네트워크 안에서나 자리하는 원격 장치로부터 수신될 수 있다. 그외에, 비트 스트림은 하드웨어나 소프트웨어로부터 수신될 수 있다.
본 발명의 또 다른 실시예에서, 컨텍스트 기준의 VLC 매핑이 효율적인 방식으로 코딩된다. 이를 수행하기 위해, 가능한 VLC들이 통상적인 방식으로 정렬된 다. 예를 들어, 가능한 VLC들은 "최대 피크의" 확률 분포들 (제1심볼 값에서의 하이 피크 (high peak))에서, "최소 피크" 또는 납작한 분포들 순으로 정렬될 수 있다. VLC들 자체에 인덱스들이 주어진다. 예를 들어, 제1VLC는 파라미터 k=1을 가진 Golomb 코드일 수 있고, 제2VLC는 파라미터 k=2를 가진 Golomb 코드일 수 있다는 식이다. 이때 VLC가 컨텍스트 선택 기준의 단조 (증가 혹은 감소) 함수가 되게 강제함으로써, 코딩 효율성 측면의 전반적인 개선이 있게 된다. VLC 선택시 미소한 최적성 손실이 존재한다고 하더라도 그러한 효율성은 생기게 된다. 상기 예를 이용시, 스캔 위치 1, 2 및 3에 사용된 VLC들은 각각 1, 1 및 2일 수 있고, 이것은 1 1 2로 작성될 수 있다. 1 2 1 같은 시퀀스들은 허용되지 않는데, 이는 그들이 단조적이지 않기 때문이다. 단조 함수적 성격 때문에, 시작 VLC 및 스텝의 위치만 디코딩하면 된다. 예를 들어, "1 1 2"라는 값들을 있는 그대로 디코딩하기보다, 시작 VLC ("1")를 디코딩하고, 이어서 다음 레벨로의 스텝 전의 값들의 개수가 뒤따른다.
상술한 실시예는 둘 이상의 컨텍스트 선택 기준이 존재하는 상황까지 확장될 수 있다. 이것은 매핑 함수를 2 (혹은 'n') 차원 테이블로서 나타내고 각 차원을 따라 단조성을 강제함으로써 행해질 수 있다. 다른 예에서, VLC는 스캔 위치뿐 아니라 마지막 0 아닌 기저 계층 계수 둘 모두에 기초해 선택된다. 이 예에서, 최적의 VLC들을 위한 매핑은, 가령 다음과 같을 수 있다:
1 1 2
2 2 2
1 2 2
이 테이블에서, 첫째 줄 (row)은 마지막 0 아닌 기저 계층 계수 (LNZBC)가 위치 1에 있는 경우에 해당하고, 둘째 줄은 LNZBC가 위치 2에 있는 경우에 해당하는 식이다. 각각의 줄은 단조적으로 증가하지만, 첫째 열 (column)은 그렇지 않다는 것을 주지해야 한다. 이러한 제약을 강화함으로써, 테이블은 다음과 같이 다시 작성될 수 있다:
1 1 2
2 2 2
2 2 2
아니면 그와 달리, 다음과 같이 작성될 수도 있다:
1 1 2
1 2 2
1 2 2
이 상황에서, 런-레벨 코딩이 각 차원을 따라 적용될 수 있다. 예를 들어, 첫째 줄이 상술한 바와 같이 디코딩될 수 있다. 각 열을 디코딩할 때 첫째 줄부터 시작위치가 사용될 수 있다. 구현시, 이것은 매트릭스의 좌측 상위 코너를 제외한 대부분의 값들에 대한 코딩을 피하게 한다.
본 발명의 또 다른 실시예에서, EOB (end-of-block) 마커 (marker)가 사용되어, 주어진 블록에 대해 유의 패스로서 디코딩되어야 할 더 이상의 계수들이 존재하지 않음을 나타낸다. EOB는 유의 비트들을 디코딩할 때 다른 가능한 런 길이 (명목상의 값 - 1을 가짐)로서 취급된다.
구조화된 VLC들에 있어서, 최저값의 심볼들이 최고 확률을 가질 것이다. 몇몇 경우들에서, EOB는 실제로 모든 심볼들 중 최고 확률을 가지지만, 항상 그와 같지는 않다. 이러한 것은 VLC에서 EOB 심볼 위치를 가리키는 비트 스트림 (가령, 슬라이스 헤더)부터 디코딩함으로써 극복될 수 있다. 이것은, 딱 한번 수행되거나, 추가 코딩 효율성 이익을 얻기 위해 컨텍스트 선택 기준의 일부나 전부에 대해 한번 수행될 수 있다. 예를 들어, 그것은 각 스캔 위치마다 한번 디코딩될 수 있다. 동일한 단조성 구속요건 및 디코딩 방법이, VLC 매핑에 대해 상술한 바와 같은 EOB 심볼 위치를 디코딩하는데 적용될 것이다. 또 다른 실시예에서, EOB 심볼은 일부 컨텍스트 기준에 대해 매우 낮은 확률을 가진다고 지정될 수 있다. 코딩 효율성을 높이기 위해, 그러한 "낮은 확률"의 EOB 심볼들의 개수를 나타내는 별개의 심볼이 디코딩될 수 있다. 이제 나머지 EOB 심볼들의 디코딩이 앞서 서술한 바와 같이 뒤따르게 된다.
상기 내용은, 자르는 값들의 부호나 크기를 고려하지 않고 유의 계수들의 위치들을 디코딩하는 데 초점을 맞췄다. 일반적으로, 대부분의 값들은 0이나 1의 크기를 가진다. 2 내지 4의 크기 역시 가능하다.
코딩 효율성 개선의 한 방법이 유의 비트들을 두 패스들로 나누는 것이다. 첫째 패스에서는 어떤 크기도 디코딩되지 않는다. 대신, 위치 정보 및 부호 플래그만이 디코딩된다. 유의 계수들의 크기는 0으로 추정된다. 둘째 패스에서, 보다 큰 크기를 가진 계수들의 위치들이 인코딩된다. 예를 들어, 0 0 1 0 0 -3 1 0이라 는 값들을 디코딩해야 할 때, 초기에 0 0 1 0 0 -1 1 0 값들이 디코딩될 것이다. 이 상황에서는, 크기 1을 가진 세 개의 유의 계수들이 존재한다. 다음으로 둘째 패스에서, 실제 상에서 단위 크기 계수들 중 두 번째 것이 보다 큰 크기 (이 경우 3이라는 크기)를 가진다는 것을 나타내는 "2"가 디코딩된다. 보다 큰 크기의 계수 위치를 식별한 뒤에, 정확한 크기 (가령, 2, 3 또는 4)가 디코딩된다. 한 고정 VLC가 이 목적에 사용될 수 있다. 본 발명의 다른 실시예에서, VLC 자체는 컨텍스트 적응적일 것이며, 스캔 위치, 유닛 크기 값들의 수, 데드 존 (dead zone) 사이즈, 인핸스먼트 계층 넘버, 다른 요인들 및 이러한 요인들의 어떤 조합에 기초해 선택될 수 있다. 본 발명의 다른 실시예에서, 크기 2를 가진 계수들이 두 번째 패스 상에서 디코딩되고, 크기 3을 가진 계수들은 세 번째 패스 상에서 디코딩되고, 크기 4를 가진 계수들은 네 번째 패스 상에서 디코딩되도록 프로세스가 반복된다. 이러한 반복적인 프로세스가 각 사이클마다 크기 정보를 디코딩할 필요성을 없앤다.
마지막으로, 하위 계층에서 계수가 0이 아닐 때 정교화 비트들이 전송된다. 정교화 비트들은 크기 및 부호 정보를 포함한다. 정교화 비트들은 고정 사이즈 로트들 (lots)로 그룹화된다. 본 발명의 특정 실시예에서, 정교화 비트들은 3의 로트들로 그룹화되지만, 다른 사이즈들도 사용될 수 있다. 예를 들어, 세 비트 그룹화하기 시, 정규화 비트들이 0 0 0 1 1 0 1 0 0 1이면, 그것은 [0 0 0] [1 1 0] [1 0 0] [1]로 그룹화될 것이다. 마지막 집합은 세 개의 값들보다 적은 개수를 포함할 것이다. 이제 바이너리 값들에 대응하는 심볼들이 VLC를 이용해 인코딩된다. 위의 예에서는, 심볼들 0, 6, 4 및 1이 인코딩된다.
심볼을 인코딩하는데 사용된 VLC는 비트 스트림으로부터 디코딩되거나, 앞서 디코딩된 데이터로부터 추론하거나, FGS 계층 넘버에 기초한다. 가능한 VLC들이 0의 확률의 내림 차순으로 구성된다. 예를 들어, 0에 대한 보다 높은 확률을 반영한 VLC에서, 가장 짧은 코드워드는 000 값을 표현하는데 사용되고, 다음으로 짧은 코드워드들이 001, 010, 100 등등의 값들을 표현하는데 사용된다. 심볼과 코드워드가 대등할 때, 0에 대한 최저 확률은 50%인 경우가 된다.
마지막 심볼이 인코딩될 때, 효율성 손실이 한계상황이 되기 때문에 플래그들만이 사용된다 (VLC는 사용되지 않는다). 마지막 코드워드가 패딩되거나 (padded), 다른 VLC (다른 값들에 대해 사용된 VLC에 기초해 선택된 것)가 사용되는 것 역시 가능하다.
부호 비트들은 상술한 것과 유사한 방식으로 인코딩된다. 그러나, 부호 비트들에 대해서는 두 가지 경우들만이 존재하는 경향이 있다; 최초 인핸스먼트 계층에 대해서 그 분포는 0으로 기울거나, 이어지는 인핸스먼트 계층들에 대해 50%의 1들과 50%의 0들로 기우는 경향이 있다. 따라서 VLC는 인핸스먼트 계층 넘버에 좌우된다. 50/50 케이스에서, 그룹화된 값들이 아닌 플래그들이 인코딩된다.
본 발명에서, 공간적 인핸스먼트 정보의 인코딩은 일반적으로 H.264/AVC하의 정상적 비규모가변적 인코딩과 유사하다. 그러나, 추가적이고/거나 상이한 VLC들이 공간적으로 샘플링되지 않은 정보를 인코딩할 때 사용될 수 있고, 사용되는 컨텍스트는 공간상의 이웃이 아닌 하위 계층 정보에 기초할 수 있다.
일반적으로, 주어진 한 VLC에 있어서, 각각의 심볼에 요구되는 평균 비트 수는
Figure 112008031631488-PCT00005
이고, 이때
Figure 112008031631488-PCT00006
는 알파벳 X로부터 나온 심볼
Figure 112008031631488-PCT00007
의 확률이며,
Figure 112008031631488-PCT00008
는 심볼
Figure 112008031631488-PCT00009
에 할당된 코드워드의 길이이다. 이 식은 심볼들의 그룹 (혹은'벡터')이
Figure 112008031631488-PCT00010
로서 모두 인코딩되는 VLC를 나타내도록 확장될 수 있다. 이 식에서, N은 그룹화될 심볼들의 개수이고,
Figure 112008031631488-PCT00011
Figure 112008031631488-PCT00012
, 즉 심볼들의 벡터이고, 그 합은 이 벡터의 모든 가능한 값들에 걸친 것이다. 본 발명의 바람직한 일 실시예에서, 알파벳 X는 0과 1인 심볼들을 포함하며, p(1)=1-p(0)이다. 따라서, 한 주어진 VLC 코드워드 테이블에 있어서, R 값은 p(0)의 함수이다.
테이블 1(a)-1(c)는 세 가지 VLC 코드워드 테이블들의 예들을 보인 것이다. 이 상황에서, 코드워드들은, 더 많은 제로(0)들을 포함하는 심볼 벡터들이 더 짧은 코드워드들을 갖도록 선택된다. 각 코드워드 테이블에 대한, R 대 p(0)의 해당 도표가 도 1에 도시된다.
Figure 112008031631488-PCT00013
Figure 112008031631488-PCT00014
Figure 112008031631488-PCT00015
본 발명에 따르면, p(0)의 각 값에서 최적 VLC는 심볼 당 최소 비트들, 즉 도 1에 도시된 곡선의 최하한을 낳는 VLC가 된다. 이것이 매핑 테이블 (테이블 2)에 표현되거나, 아래의 함수에 의해 근사화될 수 있다:
Figure 112008031631488-PCT00016
Figure 112008031631488-PCT00017
상기 예는 본 발명의 개념을 예시하기 위해 세 가지 VLC들을 이용하고 있으나, 다른 개수의 VLC들을 이용하거나 다른 N 값들을 가진 VLC들을 이용하거나, 테이블 1(a)-(c)에서 사용된 것들에 대해 다른 코드워드들을 가진 VLC들을 사용해 그 절차가 반복될 수 있다.
일실시예에서, 본 발명은 H.264/AVC에서의 FGS 정보 디코당에 적용된다. H.264/AVC에 따르면 FGS 정보는 두 패스들 상에서 디코딩된다. 첫째, "유의 패스 (significance pass)"가 기저 계층이나 이전의 인핸스먼트 계층들에서 코딩되지 않았던 모든 계수들을 고려한다. 둘째, "정교화 패스 (refinement pass)"가 나머지 계수들, 즉 이전 계층에서 코딩되었던 계수들의 정확도를 향상시킨다. 이 실시예에서, 정교화 비트가 1이 될 확률이 p(1)이고, 정교화 비트가 0이 될 확률이 p(0) 이다.
도 1의 도표는, 디코딩되는 심볼들이 서로에 대해 무관하다고 전제한다. 달리 말해, 다음 심볼의 확률 분포가 현 심볼의 값에 좌우될 수 없다. 이러한 독립성의 전제가 FGS 코딩시의 정교화 비트들에 대해서도 실질적으로 적용된다. 대비해 보면, 가변 길이 코딩을 위한 종래의 시스템들은 심볼들간의 상관성을 이용하는 것을 목적으로 하므로, 독립적인 값들을 코딩할 때 제한된 활용성을 가진다.
서로에 대해 독립적이라고 해도, 정교화 비트들은 치우친 확률 분포를 보일 수 있다, 즉, p(0) 및 p(1)의 값들이 보통은 같지 않다. 이 실시예에서, p(1) 및 p(0의 값들은 이전에 디코딩된 정교화 비트들을 관찰해 정해진다. 그 값들 역시 비트 스트림 안에 있는 그대로 코딩될 수 있을 것이다.
예컨대, 테이블 2를 사용해 적절한 VLC를 결정할 때, 일반적인 VLC 인코딩/디코딩 프로세스가 이어질 수 있다. 디코딩 프로세스의 다이어그램이 도 2에 도시된다. 도 2의 200 단계에서, 심볼이 요청된다. 210 단계에서, 버퍼가 비어 있는지 여부가 판단된다. 버퍼가 비어 있지 않으면, 사용될 다음 심볼이 버퍼로부터 리턴되고 (220 단계), 그 심볼이 출력된다 (230 단계). 버퍼가 비어 있으면, 비트 스트림으로부터 한 코드워드가 가져와 진다 (240 단계). 250 단계에서, 그 코드워드는 현재의 VLC를 이용해 디코딩된다. 이것이 심볼 벡터를 파생한다. 260 단계에서, 심볼 벡터로부터의 심볼들이 버퍼에 추가된다. 270 단계에서, 심볼 카운트들이 업데이트 된다. 280 단계에서, 현재의 VLC가 업데이트 되고, 이제 시스템은 상술한 바와 같은 220 및 230 단계들로 진행한다.
도 3은 도 2에 도시된 프로세스에 있어서, 현재의 VLC를 업데이트하기 위한 프로세스를 보인 흐름도이다. 300 단계에서, count(0)<2count(1) 여부가 판단된다. count(0)<2count(1)이면, 310 단계에서 K가 0으로 세팅된다. count(0)가 2count(1) 미만이면, 320 단계에서 count(0)<7count(1) 여부가 판단된다. count(0)<7count(1)이면, 330 단계에서 K는 1로 세팅된다. count(0)가 7count(1) 미만이 아니면, 340 단계에서 K는 2로 세팅된다.
다음은 실제 소스 압축 시스템에서 사용하기 위한 본 발명의 여러 실시예들의 구현시 수반되는 여러 세부사항들에 대한 논의이다. 자가 적응할 코더에 대해, VLC 선택이 "업데이트"되어야 한다. 달리 말해, K 값이 상술한 테이블이나 공식을 이용해 재산출되어야 한다. 최적의 코딩 효율성을 얻기 위해, 이러한 "업데이트"는 도 2에 도시된 바와 같이 각각의 코드워드가 디코딩된 뒤에 일어나야 한다. 그러나, 일부 경우들에서는 (가령, 복잡도를 낮추기 위해) 그러한 업데이트 빈도를 줄여서, 예컨대 하나 걸러나 둘 걸러 한 코드워드를 디코딩한 후에 업데이트가 수행되도록 하는 것이 바람직할 수 있다. 이러한 "업데이트 빈도"는 미리 디자인되거나, 비트 스트림을 통해 명시적으로 지시되거나, 코딩 히스토리에 기초해 추단될 수 있다. 예를 들어, "업데이트 빈도"는 선택된 VLC가 얼마나 자주 바뀌는 것이 관찰되는지에 따라 동적으로 변경될 수 있다.
업데이트가 셋 걸러 하나씩의 심볼에 대해 수행되는 경우가 도 4에 도시된다. 400 단계에서, %가 모듈로 (modulus) 연산자일 때, [count(0)+count(1)]%4=0인지 여부가 판단된다. 그런 경우가 아니면, 업데이트는 일어나지 않는다. 그 값 이 0과 같지 않으면, 일어나는 단계들은 실질적으로 도 3에 도시된 단계들과 동일하게 된다.
초기에 확률 측정들은 제한된 횟수의 관찰에 기반할 것이다. 이것은 준최적 (sub-optimal) VLC가 선택될 가능성을 높인다. 이러한 문제를 극복하도록 돕기 위해, 관찰된 심볼들의 개수가 일정한 한계치에 도달할 때까지는 VLC를 특정하는 "초기 값"을 사용할 수 있다. 그 한계치에 도달한 뒤, 상술한 정상적 업데이트 절차가 뒤따른다. VLC를 특정한 "초기 값"은 미리 디자인되거나 비트 스트림을 통해 지시될 수 있다. 이것이 도 5에 도시되어 있다. 도 5의 500 단계에서는 먼저 [count(0)+count(1)]이 심볼들의 문턱 넘버로서 세팅되었던 8보다 큰지 여부가 판단된다. 이 문턱치를 넘지 않았으면, 업데이트는 일어나지 않는다. 문턱치가 초과 되었으면 프로세스는 실질적으로 도 3의 방식과 동일한 방식으로 진행된다. 도 4에 도시된 프로세스 역시 이 방식에서 구현될 수도 있다.
도 1의 p(0)의 확률은 p(0)=0.5에서 시작함을 주지해야 한다. 달리 말해, 그것은
Figure 112008031631488-PCT00018
인 경우를 나타낸다. 심볼 확률들이 디코더에서 평가되기 때문에, 디코더는 이것이 그러한 경우인지 아닌지를 인지하여 p(0)<p(1)인 경우 심볼 벡터들을 디코딩한 후에 그 심볼 젝터들을 "비트 플립 (bit flip)"한다. 따라서, 도 1의 도표는 p(0)=0.5를 축으로 대칭적으로 된다고 간주 될 수 있다. 이것이 도 6에 나타내 진다. 도 6의 프로세스는 250 단계 후에, count(1)>count(0) 여부를 판단하는 것 외에, 실질적으로 도 2와 동일하다. 상기 판단이 긍정인 경우, 260 단계로 진행하기 전에 심볼 벡터가 인버트 (invert)된다.
심볼 벡터
Figure 112008031631488-PCT00019
내 심볼들의 수가 1 보다 클 것이기 때문에, 개별 심볼들은 버퍼가 N 개의 심볼들을 보유할 때까지 버퍼링되어야 하며, 그 다음
Figure 112008031631488-PCT00020
의 VLC 코드워드가 인코딩될 수 있다. 모든 심볼들이 인코더로 보내졌을 때 하나 이상의 심볼들이 버퍼에 남아 있는 경우, 버퍼는 비트 스트림으로 플러쉬 되어야 (flushed) 한다. 이것은 버퍼에 남은 심볼들의 수보다 작거나 같은 N 값을 가진 VLC를 선택하고, 그런 다음 그 VLC를 이용해 버퍼 콘텐츠를 코딩하는 동작을 수반한다. 필요하면, 이 프로세서는 버퍼가 비워질 때까지 반복된다.
바이너리 경우 시 버퍼를 플러시하는데 사용되는 VLC를 정하기 위해, 도 1에서 시작하여, N이 현재의 VLC에 대한 N 값보다 크거나 같은 모든 곡선들을 배제한다. 예를 들어, 현재의 VLC가 VLC2이면, VLC2는 배제되고 VLC0와 VLC1이 남는다. 그런 다음 버퍼를 플러시하기 위한 최적의 VLC를 정하기 위해, p(0)의 값이 남은 곡선들의 하한치와 비교된다. 디코더가 정상적 VLC를 이용해 "풀" 코드워드를 디코딩할지, 아니면 다른 VLC를 이용해 버퍼 플러시를 처리할지를 아는 경우, 그 디코더는 비트 스트림을 처리할 수 있을 것이다.
디코더는 현재의 VLC에 대한 N 값에 대해, 처리될 나머지 심볼들의 개수를 비교해 두 경우들 중 어느 것을 적용할지를 정할 수 있다. N이 남은 심볼들의 개수보다 적거나 같으면, "풀" 코드워드가 디코딩된다. 그렇지 않으면, 버퍼 플러시가 디코딩된다. 이러한 프로세스가 도 7에 예시되어 있다. 도 7은, 210 단계 후 에, 700 단계에서 N이남은 심볼들의 개수를 초과하는지 여부를 판단한다는 것을 제외하면, 도 6과 실질적으로 동일하다. N이 그 개수를 초과하면, 240 단계로 진행하기 전에, N이 남은 심볼들의 개수보다 큰 VLC들을 배제하도록 현재의 VLC가 710 단계에서 업데이트 된다.
디코딩할 남은 심볼들의 개수를 이용하는 것은, 본 발명을 다른 가변 길이 코딩 방법들과 구별시키는 또 다른 중요한 특징이다. 그 개수는 비트 스트림으로부터 명시적으로 디코딩되거나, 디자인-시간 상수이거나, 비트 스트림의 다른 정보로부터 추단될 수 있다.
본 발명이 비디오 데이터를 포함하는 비트 스트림으로부터 FGS 정보를 디코딩하는데 사용되는 일 실시예에서, 플러시 프로세스는 정보가 주기적으로 정렬되게 일어날 것이다. 예를 들어, 플러시 프로세스는 각 4x4 블록의 끝이나 각 매크로블록에서 일어날 수 있다. 다시 한번 비디오 데이터를 포함하는 비트 스트림으로부터 FGS 정보의 디코딩을 수반하는 다른 실시예에서, 플러시 프로세스는 신택스 엘리먼트 (syntax element)의 타입이 바뀔 때마다 일어날 수 있다. 이를테면, 모든 정교화 비트들이 코딩되고, 다음에 플러시 (flush)가 , 다음에 부호 정보가, 다음에 또 다른 플러시가 뒤따를 수 있다.
다시 비디오 데이터를 포함하는 비트 스트림으로부터 FGS 정보의 디코딩을 수반하는 또 다른 실시예에서, 디코더 상태는, 예를 들어, 슬라이스 당 한 번씩, 혹은 비디오 데이터의 프레임 당 한 번씩과 같이 주기적으로 리셋된다.
또 다른 실시예에서, 플러시 주기는 코더의 리셋 인터벌과 동일하며, 이것은 사실상 플러시가 일어나지 않음을 의미한다. 예를 들어, 다양한 신택스 엘리먼트들이 플러시 없이 인터리빙되거나, 여러 블록들로부터의 정보가 플러시 없이 코딩된다.
플러시 프로세스의 결과로서, 준최적 VLC가 미소한 시간 동안 사용될 수 있다. 일반적으로, 코딩 효율성의 손실은 얼마 되지 않는다. 이것은, 버퍼 사이즈 N 역시 작다는 사실과 연계해 볼 때, 버퍼가 산술 코딩에 비해 훨씬 자주 플러시 될 수 있다는 것을 의미한다. 예를 들어, 비디오 코딩시, 버퍼는 매 블록마다 (아마도 16 개 미만의 심볼들) 플러시 될 수 있다. 이것은 산술 코딩과 관련해 커다란 코딩 효율성의 이익을 낳고, 더 잦은 버퍼 플러시로 인해 비트 스트림의 절단 (truncation)이 보다 정밀하게 제어될 수 있다.
본 발명의 추가 실시예에서, 벡터
Figure 112008031631488-PCT00021
의 심볼들의 개수 N은 일정하게 유지되지 않고 가변 될 수 있다. 이를테면, 다른 코드워드를 보다 긴 0들 (혹은 1들)의 런에 할당함으로써, 매우 높은 p(0)의 값들에서 코드워드 테이블을 지나치게 가득 채우지 않고도 코딩 효율성이 개선될 수 있다.
본 발명의 기본 디자인은 비 바이너리 심볼 알파벳들, 즉, 알파벳의 3 이상의 심볼들에 적용될 수 있다. 예를 들어, 3진수의 경우, 이차원 곡선이 삼차원 면이 될 것이다. 그러나, 최적 VLC를 선택하는 기능은 알파벳 사이즈가 커지면서 보다 복잡해진다는 것을 알아야 한다.
다른 실시예에서, 본 발명은 코딩 블록 패턴들 (coded block patterns)의 디 코딩에 적용된다. 코딩 블록 패턴은 디코딩될 값들을 포함하는 매크로블록 내 공간적인 영역들을 특정한다. 예를 들어, H.264/AVC에서, CBP는 16x16 매크로블록 내 어느 8x8 블록들이 디코딩될 값들을 포함하는지를 명시한다.
본 발명에 따르면, 블록이 디코딩될 값들을 포함할 확률은 p(1)이고, 블록이 디코딩될 값들을 포함하지 않을 확률은 p(0)이다. 이 실시예에서, p(1)과 p(0)의 값들은 앞서 디코딩된 CBP 값들을 관찰함으로써 정해진다. 또한 그 값들은 비트 스트림 안에 숨김없이 코딩될 수 있다.
본 발명의 이 실시예에서, 충분한 바이너리 값들이 읽혀져서 온전한 CBP를 형성할 때까지 비트 스트림으로부터 코드워드가 디코딩된다. 예를 들어, 16x16 매크로블록 및 8x8 블록들의 경우, 한 CBP 안에 네 개의 비트들이 존재한다. 따라서, 가능한 VLC들이 테이블 1(a) 및 테이블 1(b)로부터 얻어지고 VLC0가 선택되면, 네 개의 코드워드들이 읽혀져야 할 것이다. VLC1이 선택되면, 한 코드워드만이 읽혀져도 된다.
또 다른 실시예에서, 본 발명은, 해당 기저 계층 매크로블록의 CBP가 디코딩 프로세스에 사용되는, 코딩 블록 패턴의 디코딩에 적용된다. 인핸스먼트 계층 매크로블록의 CBP는 두 부분으로 구획된다. 제1부분 (CBP0)은 기저 계층 CBP 내 해당 비트가 0인 블록들에 대한 인핸스먼트 계층 CBP 비트들을 포함한다. 제2부분 (CBP1)은 나머지, 즉 기저 계층 CBP 내 해당 비트가 1이었을 때의 인핸스먼트 계층 CBP 비트들을 포함한다. 예를 들어, 기저 계층 CBP가 0001이고 인핸스먼트 계층 CBP가 1101인 경우, CBP0는 인핸스먼트 계층 CBP의 최초 세 비트들, 즉, CBP0=110 일 것이고, CBP1은 나머지 비트들을 포함, 즉, CBP1=1이 될 것이다.
확률 p(0) 및 p(1)은 CBP0 (p0(0) 및 p0(1)로 표시) 및 CBP1 (p1(0) 및 p1(1)로 표시)에 대해 독자적으로 유지된다. 최적 VLC는 CBP0 및 CBP1 각자에 대해 별개로 정해지며, CBP0 및 CBP1의 디코딩이 독자적으로 진행된다.
본 발명의 다른 실시예에서, CBP를 CBP0와 CBP1으로 분리할지 여부의 결정은 동적으로 이뤄진다. 예를 들어, CBP0, CBP1 및 세그먼트화되지 않은 CBP 각각을 디코딩하는데 요구되는 비트 수를 추정하는데 코스트 (cost) 함수가 사용될 수 있다. 코스트 함수로의 한 입력은 pk(0)의 값들을 포함한다. CBP0를 나타내기 위해 추정된 비트 수와 CBP1을 나타내기 위해 추정된 비트 수의 합이 세그먼트화되지 않은 CBP를 디코딩하는데 필요하다고 추정된 비트 수보다 적으면, CBP0 및 CBP1의 값들은 따로 디코딩된다. 그렇지 않은 경우, 세그먼트화되지 않은 CBP가 디코딩된다.
다른 실시예에서, 본 발명은 코딩 블록 플래그들 (CBFs, coded block flags)의 디코딩에 적용된다. CBF들은 한 매크로블록 내 한 영역이 디코딩될 값들을 포함하는지 포함하지 않는지 여부를 나타낸다. H.264/AVC에 대한 기존의 FGS에서, CBF들은 독자적으로 디코딩된다. 그러나, CBP들에서와 같이, 여러 CBF들을 동시에 디코딩함으로써 코딩 효율성 이득이 실현될 수 있다. 0이나 1이 될 이전 CBF들의 확률이 측정되고, 그 정보가 디코딩을 위한 VLC를 선택하는데 사용된다. 이러한 것은 CBP들의 경우와 같은 방식으로 이뤄진다. 비트 플립하기 (bit flipping) 역 시 이용된다.
일 실시예에서, CBF 값들의 벡터를 코딩할 때, 기저 계층의 해당 블록들로부터의 CBF들이, 사용할 VLC 결정에 활용된다. 다른 실시예에서, 기저 계층 내 해당 블록들로부터의 CBF 값들은 인핸스먼트 계층 CBF를 세그먼트화하는데 활용된다. 예를 들어, CBF와 유사한 방식을 통해, CBF0 및 CBF1 값들이 형성될 수 있을 것이고, 이때 CBF0는 기저 계층 CBF가 0이었던 인핸스먼트 계층 CBF 값들을 포함하고, CBF1은 기저 계층 CBF가 1이었던 인핸스먼트 계층 CBF 값들을 포함한다. 이러한 세그먼트화된 CBF 값들은, 세그먼트화된 CBP를 코딩하는 방법과 실질적으로 동일한 방식 등을 이용해 개별 코딩될 수 있다.
다른 실시예에서, 본 발명은 H.264/ABC의 FGS 정보 디코딩에 적용되며, 더 구체적으로 말하면 유의 패스 상에서 EOB (end of block) 마커들의 디코딩에 적용된다. 현재, H.264/AVC는 블록 내에 0 아닌 값들이 남아 있는지 여부를 나타내기 위해 하나의 EOB 심볼을 사용한다. 본 발명은 여러 개의 EOB 심볼들의 사용을 수반하며, 이때 사용되는 EOB 심볼들의 일부나 전부는 그 블록으로부터 유의 패스 중에 "중요하다"고 표시되었던 계수들의 크기에 대한 정보를 가리킨다. 이 정보는 1 보다 큰 크기를 갖는 블록 내 계수들의 개수를 포함할 수 있다. 그와는 달리, 상기 정보는 유의 패스에서 디코딩되는 계수들의 최대 크기를 포함할 수 있다. 그 정보는 또한 상기 항목들을 합한 것들을 포함할 수도 있다.
1보다 큰 크기를 갖는 블록 내 계수들의 개수 (x)와, 유의 패스에서 디코딩되는 계수들의 최대 크기 (y)는, EOBoffset=16y+x 같은 분리 가능한 선형 함수를 이용해 결합될 수 있다. 이 상황에서, 디코딩 프로세스시, y=EOBoffset/16이고, x=EOBoffset%16, 즉, x는 EOBoffset을 16으로 나눌 때의 나머지이다. 어떤 경우들에서, 선형 함수들의 조합이 사용될 수 있다. 예를 들어, y<4이면 EOBoffset=2x+y%2이고, 그 외의 경우 EOBoffset=16y+x이다.
디코딩된 계수들의 개수 (z) 역시 상기 선형 식에 포함될 수 있다. 예를 들어, 일 실시예에서, y<4이면 EOBoffset=2(x-1)+y%2이고, 그 이외의 경우 EOBoffset=z(y-2)+x-1이다. 따라서, 디코딩 프로세스시, EOBoffset<2z이면, x=(EOBoffset/2)+1, y=(EOBoffset%2)+2가 되고, 그 외의 경우 x=(EOBoffset%z)+1, y=(EOBoffset/z)+2이다.
따라서 본 발명은 (1) 유의 패스 상에서 아무 계수도 1 보다 큰 크기를 가지지 않는 EOB를 가리키기 위해 한 EOB 심볼이 사용되고; (2) 나머지 EOB 심볼들이 EOB 조건만 가리키는 것이 아니라, 부가적으로 1보다 큰 크기를 가진 계수들의 개수 및 그 최대 크기를 가리키는 특별한 경우를 아우른다.
본 발명의 일 실시예에서, 크기 정보를 포함하는 EOB 마커들로서 사용되는 실제 심볼들은 임의의 것이지만 디코더에 알려진다. 예를 들어, 그 마커들은 코드 디자인 중에 고정되거나, 비트 스트림 상에서 명시적으로 지시될 수 있다. 이 경우, 디코딩되는 심볼이 매핑 테이블에 자리한다. 심볼의 인덱스는 상기 식들에 사용될 EOBoffset의 값을 제공한다. 예를 들어, 심볼 "9"가 디코딩될 대, 이하의 테이블 3에 든 예에 따라, EOBoffset=1이 된다. 상기 선형 식들의 사용을 통해, x 및 y 값들이 이제 결정될 수 있다.
Figure 112008031631488-PCT00022
본 발명의 한 특정 실시예에서, 크기 정보를 포함하는 EOB 심볼들은 순차적이다. 이 경우, 심볼을 디코딩한 후에, 첫째 EOB 심볼이 그 디코딩 된 심볼로부터 빼져서 EOBoffset을 제공한다. EOB 순차 값들의 예가 테이블 4에 보인다. 이 경우, EOB 심볼 "9"가 디코딩되면, 값 "6"이 빼져서, EOBoffset=3을 제공한다.
Figure 112008031631488-PCT00023
본 발명의 다른 실시예에서, 크기 정보를 포함하는 EOB 심볼들은 순차적일 뿐 아니라, 첫 번째 "비허용 (illegal)" 런 길이부터 시작한다. 예를 들어, 한 블록이 16 개의 계수들을 포함하지만, 10 개의 계수들은 이미 처리되었으면, 다음 비 제로 값 전의 0들의 최대 "런"은 5가 된다. 길이 6 이상의 "런"이 발생할 가능성은 없으며, 따라서 6 이상의 심볼들은 "비허용"되는 것으로 간주된다. 이 상황에서, 크기 정보를 포함하는 EOB 심볼들은 6에서 순차적을 시작하면서 넘버링 될 것이다. 이 실시예에서, 어떤 주어진 EOBoffset에 대해 사용되는 심볼은 블록별로 가변될 수 있다. 본 발명의 다른 실시예에서, 한 EOB 및 1보다 큰 크기는 없다는 것을 가리키는 심볼이 첫째 불허용 심볼로 제한될 수 있다. 예를 들어 심볼 "5"가, 1보다 큰 크기가 없는 EOB를 가리키도록 할당되고 두 계수들이 블록 내에서 코딩되기 위해 남아 있어 ("3"이 최초 불허용 심볼이 되는) 경우, 1보다 큰 크기의 계수들을 갖고 있지 않은 EOB를 가리키기 위해 "5"가 아닌 심볼 "3"이 사용될 것이다.
본 발명의 또 다른 실시예에서, 1보다 큰 크기를 가리키는 최초 EOB 심볼은 코딩될 남은 계수들의 개수가, 1보다 큰 크기의 계수들을 갖고 있지 않은 EOB를 나타내는 심볼을 초과하는지 여부에 따라 1씩 쉬프트 된다. 예를 들어, 심볼 "5"가 1보다 큰 크기들이 없는 EOB를 의미하도록 할당되고, 다섯 개 미만의 계수들이 코딩되도록 남아 있을 때, 테이블 4의 "EOB 심볼" 열의 값들은 1씩 증가될 것이다.
도 8 및 9는 본 발명이 구현될 수 있는 한 대표적 모바일 전화(12)를 도시한 것이다. 그러나, 본 발명이 한 특정 타입의 모바일 전화(12)나 다른 전자 기기에 한정되도록 의도된 것은 아님을 알아야 한다. 그와 달리, 본 발명은 랩 탑 및 데스크 탑 컴퓨터, PDA (personal digital assistants), 통합 메시징 장치, 프린터, 스캐너, 팩스 머신 및 다른 장치들과 같이 실질적으로 어떠한 타입의 전자 기기에라도 포함될 있으며, 또한 상기 나열된 예들에 국한되지 않는다.
도 8 및 9의 모바일 전화(12)는 하우징(30), 액정 디스플레이 형태의 디스플레이(32), 키패드(34), 마이크로폰(36), 이어 폰(38), 배터리(40), 적외선 포트(42), 안테나(44), 본 발명의 일 실시예에 따른 UICC 형태의 스마트 카드(36), 카드 리더(48), 라디오 인터페이스 회로(52), 코덱 회로(54), 제어기(56) 및 메모리(58)를 포함한다. 개별 회로들과 구성요소들은 노키아의 모바일 전화들과 같이, 모두 이 기술분야에 잘 알려져 있는 타입의 것들이다.
본 발명은 네트워킹 된 환경하에서 컴퓨터들에 의해 실행되는 프로그램 코드 같은 컴퓨터 실행가능 명령들을 포함하는 프로그램 제품에 의해 일 실시예로서 구현될 수 있는 일반적인 맥락의 방법의 단계들로서 기술되고 있다.
일반적으로, 프로그램 모듈에는, 특정 작업을 수행하거나 특정한 추상적 데이터 타입들을 구현하는 루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등등이 포함된다. 컴퓨터 실행가능 명령들, 관련 데이터 구조들, 및 프로그램 모듈들은 여기 개시된 방법의 단계들을 실행하기 위한 프로그램 코드의 예들을 나타낸다. 그러한 특정 시퀀스의 실행가능 명령들이나 관련 데이터 구조들은 상기 단계들로 나타낸 기능들을 구현하기 위한 상응하는 동작들의 예들을 나타낸다.
본 발명의 소프트웨어 및 웹 구성물들은 다양한 데이터베이스 서치 단계들, 상관 단계들, 비교 단계들 및 결정 단계들을 수행하기 위한 규칙 기반 로직 및 기타 로직을 가진 표준 프로그래밍 기술들로서 얻어질 수 있을 것이다. 명세서 및 청구범위에 사용된 "컴포넌트" 및 "모듈"이라는 말들은 소프트웨어 코드 중 하나 이상의 라인들, 및/또는 하드웨어 구성, 및/또는 수동 입력을 받기 위한 장치를 이용하는 구현물들을 포괄하도록 의도된 것이다.
본 발명의 실시예들에 대한 상기 내용은 예시 및 설명을 위해 주어졌다. 그것이 본 발명의 전부라거나 개시된 그대로의 형식에 한정되는 것은 아니며, 상기 내용에 비춰 여러 변형 및 치환이 가능할 수도 있고, 혹은 본 발명의 실시로부터 그것들이 획득될 수도 있다. 실시예들은 본 발명의 원리들 및, 이 분야의 당업자로 하여금 본 발명을 여러 실시예들 및 숙고된 특정 사용에 맞도록 다양하게 변경한 것들로써 활용할 수 있게 하는 실제적 어플리케이션을 설명하기 위해 선택되고 기술되었다.

Claims (43)

  1. 비트 스트림으로부터 압축 데이터를 디코딩하는 방법에 있어서,
    상기 비트 스트림으로부터 적어도 한 심볼을 포함하는 심볼 벡터를 나타내는 코드워드를 가져오는 단계;
    가변 길이 코드를 사용해 코드워드를 디코딩하여, 적어도 한 심볼을 포함하는 상기 심볼 벡터를 산출하는 단계;
    상기 심볼 벡터로부터 적어도 한 심볼을 버퍼에 추가하는 단계;
    이전에 디코딩된 심볼들의 확률 분포에 적어도 일부 기반하여, 상기 가변 길이 코드를 업데이트하는 단계; 및
    상기 버퍼로부터 다음 심볼을 리턴하는 단계를 포함함을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 가변 길이 코드를 업데이트하기 전에, 버퍼에 추가된 심볼들을 반영하기 위해 심볼 카운터들을 업데이트하는 단계; 및
    이전에 디코딩된 심볼들의 확률 분포를 판단하는데 상기 심볼 카운터들을 이용하는 단계를 더 포함함을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 비트 스트림으로부터 코드워드를 가져오기 전에, 상기 버퍼가 비어 있는지를 판단하는 단계;
    상기 버퍼가 비어 있으면, 코드워드를 가져오는 단계로 진행하는 단계; 및
    상기 버퍼가 비어 있지 않으면, 버퍼로부터 다음 심볼을 즉시 리턴하고 상기 코드워드를 디코딩하지 않거나, 심볼들을 추가하거나, 현재의 가변 길이 코드를 업데이트하는 단계를 더 포함함을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 코드워드를 디코딩한 후에, 요청된 심볼이 제1값을 가질 확률이 그 심볼이 특정한 제2값을 가질 확률보다 큰지 여부를 판단하는 단계; 및
    상기 심볼이 제1값을 가질 확률이 제2값을 가질 확률보다 크면, 심볼 벡터를 인버팅하는 단계를 더 포함함을 특징으로 하는 방법.
  5. 제1항에 있어서,
    상기 비트 스트림으로부터 상기 코드워드를 가져오기 전에, 가변 길이 코드에 대응하는 심볼 벡터들 내 심볼들의 개수를 판단하는 단계;
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 큰지 여부를 판단하는 단계; 및
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크면, 심볼 벡터 내 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크지 않은 데 대한 새로운 가변 길이 코드를 제공하는 단계를 더 포함함을 특징으로 하는 방법.
  6. 제1항에 있어서, 이전에 디코딩된 심볼들의 확률 분포에 대해 이용가능한 가변 길이 코드들로부터 심볼 당 최소수의 비트들을 처리하도록, 상기 업데이트되는 가변 길이 코드가 선택됨을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 가변 길이 코드는 주기적으로만 업데이트 됨을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 주기는, 가변 길이 코드의 한 번 이상의 이전 업데이트시 선택된 가변 길이 코드에 적어도 일부 기초하여 정해짐을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 가변 길이 코드의 업데이트는, 비트 스트림 상의 명시적 신호나, 소스 데이터의 추론된 특성들에 의해 유발됨을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 가변 길이 코드는 디코딩된 심볼들의 개수가 소정 문턱치에 도달할 때까지는 업데이트 되지 않음을 특징으로 하는 방법.
  11. 제2항에 있어서, 상기 심볼 카운터들은 스케일링 팩터에 의해, 주기적으로 나, 하나 이상의 심볼 카운터들이 소정 문턱치에 도달할 때 스케일링 됨을 특징으로 하는 방법.
  12. 비트 스트림으로부터 압축 데이터를 디코딩하기 위한 컴퓨터 프로그램 제품에 있어서,
    상기 비트 스트림으로부터 적어도 한 심볼을 포함하는 심볼 벡터를 나타내는 코드워드를 가져오기 위한 컴퓨터 코드;
    가변 길이 코드를 사용해 코드워드를 디코딩하여, 적어도 한 심볼을 포함하는 상기 심볼 벡터를 산출하도록 하는 컴퓨터 코드;
    상기 심볼 벡터로부터 적어도 한 심볼을 버퍼에 추가하도록 하는 컴퓨터 코드;
    이전에 디코딩된 심볼들의 확률 분포에 적어도 일부 기반하여, 상기 가변 길이 코드를 업데이트하도록 하는 컴퓨터 코드; 및
    상기 버퍼로부터 다음 심볼을 리턴하도록 하는 컴퓨터 코드를 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  13. 제12항에 있어서,
    상기 가변 길이 코드를 업데이트하기 전에, 버퍼에 추가된 심볼들을 반영하기 위해 심볼 카운터들을 업데이트 하도록 하는 컴퓨터 코드; 및
    이전에 디코딩된 심볼들의 확률 분포를 판단하는데 상기 심볼 카운터들을 이 용하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  14. 제12항에 있어서,
    상기 비트 스트림으로부터 코드워드를 가져오기 전에, 상기 버퍼가 비어 있는지를 판단하도록 하는 컴퓨터 코드;
    상기 버퍼가 비어 있으면, 코드워드를 가져오도록 진행하기 위한 컴퓨터 코드; 및
    상기 버퍼가 비어 있지 않으면, 버퍼로부터 다음 심볼을 즉시 리턴하고 상기 코드워드를 디코딩하지 않거나, 심볼들을 추가하거나, 현재의 가변 길이 코드를 업데이트하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  15. 제12항에 있어서,
    상기 코드워드를 디코딩한 후에, 요청된 심볼이 제1값을 가질 확률이 그 심볼이 특정한 제2값을 가질 확률보다 큰지 여부를 판단하도록 하는 컴퓨터 코드; 및
    상기 심볼이 제1값을 가질 확률이 제2값을 가질 확률보다 크면, 심볼 벡터를 인버팅하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  16. 제12항에 있어서,
    상기 비트 스트림으로부터 상기 코드워드를 가져오기 전에, 가변 길이 코드에 대응하는 심볼 벡터들 내 심볼들의 개수를 판단하도록 하는 컴퓨터 코드;
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 큰지 여부를 판단하도록 하는 컴퓨터 코드; 및
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크면, 심볼 벡터 내 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크지 않은 데 대한 새로운 가변 길이 코드를 제공하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  17. 제12항에 있어서, 이전에 디코딩된 심볼들의 확률 분포에 대해 이용가능한 가변 길이 코드들로부터 심볼 당 최소수의 비트들을 처리하도록, 상기 업데이트되는 가변 길이 코드가 선택됨을 특징으로 하는 컴퓨터 프로그램 제품.
  18. 제12항에 있어서, 상기 가변 길이 코드는 주기적으로만 업데이트 됨을 특징으로 하는 컴퓨터 프로그램 제품.
  19. 제18항에 있어서, 상기 주기는, 가변 길이 코드의 한 번 이상의 이전 업데이트시 선택된 가변 길이 코드에 적어도 일부 기초하여 정해짐을 특징으로 하는 컴퓨터 프로그램 제품.
  20. 제12항에 있어서, 상기 가변 길이 코드는, 디코딩된 심볼들의 개수가 소정 문턱치에 도달할 때까지는 업데이트되지 않음을 특징으로 하는 컴퓨터 프로그램 제품.
  21. 제12항에 있어서, 상기 심볼 카운터들은 스케일링 팩터에 의해, 주기적으로나, 하나 이상의 심볼 카운터들이 소정 문턱치에 도달할 때 스케일링 됨을 특징으로 하는 컴퓨터 프로그램 제품.
  22. 전자 기기에 있어서,
    프로세서; 및
    상기 프로세서와 상호 동작하도록 연결되어 있고, 비트 스트림으로부터 압축 데이터를 디코딩하기 위한 컴퓨터 프로그램 제품을 포함하는 메모리를 포함하고,
    상기 컴퓨터 프로그램 제품은,
    상기 비트 스트림으로부터 적어도 한 심볼을 포함하는 심볼 벡터를 나타내는 코드워드를 가져오기 위한 컴퓨터 코드;
    가변 길이 코드를 사용해 코드워드를 디코딩하여, 적어도 한 심볼을 포함하는 상기 심볼 벡터를 산출하도록 하는 컴퓨터 코드;
    상기 심볼 벡터로부터 적어도 한 심볼을 버퍼에 추가하도록 하는 컴퓨터 코드;
    이전에 디코딩된 심볼들의 확률 분포에 적어도 일부 기반하여, 상기 가변 길이 코드를 업데이트하도록 하는 컴퓨터 코드; 및
    상기 버퍼로부터 다음 심볼을 리턴하도록 하는 컴퓨터 코드를 포함함을 특징으로 하는 전자 기기.
  23. 제22항에 있어서, 상기 컴퓨터 프로그램 제품은,
    상기 가변 길이 코드를 업데이트하기 전에, 버퍼에 추가된 심볼들을 반영하기 위해 심볼 카운터들을 업데이트 하도록 하는 컴퓨터 코드; 및
    이전에 디코딩된 심볼들의 확률 분포를 판단하는데 상기 심볼 카운터들을 이용하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 전자 기기.
  24. 제22항에 있어서, 상기 컴퓨터 프로그램 제품은,
    상기 비트 스트림으로부터 코드워드를 가져오기 전에, 상기 버퍼가 비어 있는지를 판단하도록 하는 컴퓨터 코드;
    상기 버퍼가 비어 있으면, 코드워드를 가져오도록 진행하기 위한 컴퓨터 코드; 및
    상기 버퍼가 비어 있지 않으면, 버퍼로부터 다음 심볼을 즉시 리턴하고 상기 코드워드를 디코딩하지 않거나, 심볼들을 추가하거나, 현재의 가변 길이 코드를 업데이트하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 전자 기기.
  25. 제22항에 있어서, 상기 컴퓨터 프로그램 제품은,
    상기 코드워드를 디코딩한 후에, 요청된 심볼이 제1값을 가질 확률이 그 심볼이 특정한 제2값을 가질 확률보다 큰지 여부를 판단하도록 하는 컴퓨터 코드; 및
    상기 심볼이 제1값을 가질 확률이 제2값을 가질 확률보다 크면, 심볼 벡터를 인버팅하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 전자 기기.
  26. 제22항에 있어서, 상기 컴퓨터 프로그램 제품은,
    상기 비트 스트림으로부터 상기 코드워드를 가져오기 전에, 가변 길이 코드에 대응하는 심볼 벡터들 내 심볼들의 개수를 판단하도록 하는 컴퓨터 코드;
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 큰지 여부를 판단하도록 하는 컴퓨터 코드; 및
    상기 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크면, 심볼 벡터 내 심볼들의 개수가 처리될 남은 심볼들의 개수보다 크지 않은 데 대한 새로운 가변 길이 코드를 제공하도록 하는 컴퓨터 코드를 더 포함함을 특징으로 하는 전자 기기.
  27. 제22항에 있어서, 이전에 디코딩된 심볼들의 확률 분포에 대해 이용가능한 가변 길이 코드들로부터 심볼 당 최소수의 비트들을 처리하도록, 상기 업데이트되는 가변 길이 코드가 선택됨을 특징으로 하는 전자 기기.
  28. 제22항에 있어서, 상기 가변 길이 코드는 주기적으로 업데이트 됨을 특징으 로 하는 전자 기기.
  29. 제28항에 있어서, 상기 주기는, 가변 길이 코드의 한 번 이상의 이전 업데이트시 선택된 가변 길이 코드에 적어도 일부 기초하여 정해짐을 특징으로 하는 전자 기기.
  30. 제22항에 있어서, 상기 가변 길이 코드는, 디코딩된 심볼들의 개수가 소정 문턱치에 도달할 때까지는 업데이트되지 않음을 특징으로 하는 전자 기기.
  31. 제22항에 있어서, 상기 심볼 카운터들은 스케일링 팩터에 의해, 주기적으로나, 하나 이상의 심볼 카운터들이 소정 문턱치에 도달할 때 스케일링 됨을 특징으로 하는 전자 기기.
  32. 비트 스트림으로 전송할 데이터를 인코딩하는 방법에 있어서,
    인코딩 될 복수의 심볼들을 검사하는 단계; 및
    상기 복수의 심볼들 중 적어도 하나를 나타낼 코드워드를 선택하는 단계를 포함하고,
    상기 코드워드는, 적어도 상기 복수의 심볼들 각각이 이전에 인코딩되었던 경우들의 횟수에 기초해 선택됨을 특징으로 하는 방법.
  33. 제32항에 있어서, 상기 코드워드의 길이는, 적어도 일부가, 상기 복수의 심볼들 각각이 이전에 인코딩되었던 경우들의 횟수에 기반함을 특징으로 하는 방법.
  34. 데이터를 비트 스트림으로 인코딩하는 방법에 있어서,
    한 심볼을 버퍼에 추가하는 단계;
    버퍼 내 심볼들의 개수가, 한 가변 길이 코드에 대한 한 심볼 벡터 내의 심볼들의 개수와 같은지 여부를 판단하는 단계;
    버퍼 내 심볼들의 개수가 상기 심볼 벡터 내 심볼들의 개수와 같으면,
    버퍼 내 심볼들로부터 심볼 벡터를 형성하는 단계;
    상기 가변 길이 코드를 이용해 상기 심볼 벡터를 인코딩하는 단계;
    버퍼를 플러시하는 (flushing) 단계; 및
    이전에 인코딩된 심볼들의 확률 분포에 적어도 일부 기초하여, 상기 가변 길이 코드를 업데이트하는 단계를 포함함을 특징으로 하는 방법.
  35. 제34항에 있어서,
    상기 가변 길이 코드를 업데이트 하기 전에, 상기 버퍼에 추가되었던 심볼들을 반영하기 위해 심볼 카운터들을 업데이트하는 단계; 및
    이전에 인코딩되었던 심볼들의 확률 분포를 판단할 때 상기 심볼 카운터들을 이용하는 단계를 더 포함함을 특징으로 하는 방법.
  36. 제34항에 있어서,
    상기 가변 길이 코드를 이용해 상기 심볼 벡터를 인코딩하기 전에, 한 심볼이 제1값을 가질 확률이 그 심볼이 제2값을 가질 확률보다 큰지 여부를 판단하는 단계; 및
    상기 심볼이 제1값을 가질 확률이 제2값을 가질 확률보다 큰 경우, 상기 심볼 벡터를 인버팅하는 단계를 더 포함함을 특징으로 하는 방법.
  37. 제34항에 있어서,
    상기 버퍼 내 심볼들의 개수가, 한 가변 길이 코드에 대한 심볼 벡터 내 심볼들의 개수와 같은지 여부를 판단하기 전에, 어떤 추가 심볼들이 인코딩되도록 남아 있는지 여부를 판단하는 단계; 및
    어떤 추가 심볼도 인코딩하기 위해 남아 있지 않은 경우, 심볼 벡터 내 심볼들의 개수가 상기 버퍼 내 심볼들의 개수보다 크지 않은 데 대한 새 가변 길이 코드를 제공하는 단계를 더 포함함을 특징으로 하는 방법.
  38. 제34항에 있어서, 이전에 인코딩된 심볼들의 확률 분포에 대해 이용가능한 가변 길이 코드들로부터 심볼 당 최소수의 비트들을 처리하도록, 상기 업데이트되는 가변 길이 코드가 선택됨을 특징으로 하는 방법.
  39. 제34항에 있어서, 상기 가변 길이 코드는 주기적으로만 업데이트 됨을 특징 으로 하는 방법.
  40. 제39항에 있어서, 상기 주기는, 가변 길이 코드의 한 번 이상의 이전 업데이트시 선택된 가변 길이 코드에 적어도 일부 기초하여 정해짐을 특징으로 하는 방법.
  41. 제34항에 있어서, 상기 가변 길이 코드의 업데이트는, 비트 스트림 상의 명시적 신호나, 소스 데이터의 추론된 특성들에 의해 유발됨을 특징으로 하는 방법.
  42. 제40항에 있어서, 상기 가변 길이 코드는, 심볼들의 개수가 소정 문턱치에 도달할 때까지는 업데이트되지 않음을 특징으로 하는 방법.
  43. 제35항에 있어서, 상기 심볼 카운터들은 스케일링 팩터에 의해, 주기적이거나, 하나 이상의 심볼 카운터들이 소정 문턱치에 도달할 때, 스케일링됨을 특징으로 하는 방법.
KR1020087010634A 2005-10-03 2006-08-29 독립 변수들에 대한 적응적 가변 길이 코드들 KR20080067637A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72306005P 2005-10-03 2005-10-03
US60/723,060 2005-10-03

Publications (1)

Publication Number Publication Date
KR20080067637A true KR20080067637A (ko) 2008-07-21

Family

ID=37905967

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087010634A KR20080067637A (ko) 2005-10-03 2006-08-29 독립 변수들에 대한 적응적 가변 길이 코드들

Country Status (8)

Country Link
US (1) US20070126853A1 (ko)
EP (1) EP1932361A1 (ko)
JP (1) JP2009510962A (ko)
KR (1) KR20080067637A (ko)
CN (1) CN101313585A (ko)
MY (1) MY143016A (ko)
TW (1) TW200729744A (ko)
WO (1) WO2007039795A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007035070A1 (en) * 2005-09-26 2007-03-29 Samsung Electronics Co., Ltd. Method and apparatus for enhancing performance of entropy coding, and video coding method and apparatus using the entropy coding performance enhancing method
WO2007102147A2 (en) * 2006-03-07 2007-09-13 Bitband Technologies Ltd. Personalized insertion of advertisements in streaming media
US20070283132A1 (en) * 2006-04-06 2007-12-06 Nokia Corporation End-of-block markers spanning multiple blocks for use in video coding
US7586425B2 (en) * 2006-07-11 2009-09-08 Nokia Corporation Scalable video coding and decoding
US8411734B2 (en) 2007-02-06 2013-04-02 Microsoft Corporation Scalable multi-thread video decoding
US9648325B2 (en) * 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8700792B2 (en) * 2008-01-31 2014-04-15 General Instrument Corporation Method and apparatus for expediting delivery of programming content over a broadband network
US8752092B2 (en) 2008-06-27 2014-06-10 General Instrument Corporation Method and apparatus for providing low resolution images in a broadcast system
FR2935865B1 (fr) * 2008-09-05 2010-10-15 Commissariat Energie Atomique Procede de transcodage entropique d'un premier train de donnees binaires en un second train de donnees binaires compresse, programme d'ordinateur et dispositif de capture d'images correspondants
MX2012004572A (es) 2009-10-20 2012-06-08 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar informacion de audio, metodo para decodificar informacion de audio y programa de computacion que usa una regla dependiente de la region para un mapeado mediante codificacion aritmetica.
KR101339057B1 (ko) 2010-01-12 2013-12-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩과 디코딩 방법, 및 이전에 디코딩된 스펙트럼 값들의 놈에 기초하여 콘텍스트 서브구역 값을 획득하는 컴퓨터 프로그램
US9357244B2 (en) 2010-03-11 2016-05-31 Arris Enterprises, Inc. Method and system for inhibiting audio-video synchronization delay
WO2011121715A1 (ja) * 2010-03-30 2011-10-06 株式会社 東芝 画像復号化方法
US8885729B2 (en) 2010-12-13 2014-11-11 Microsoft Corporation Low-latency video decoding
US9706214B2 (en) 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
RU2587467C2 (ru) 2011-06-30 2016-06-20 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Сокращение задержки при кодировании и декодировании видео
US8731067B2 (en) 2011-08-31 2014-05-20 Microsoft Corporation Memory management for video decoding
US20130114685A1 (en) * 2011-11-07 2013-05-09 Sharp Laboratories Of America, Inc. Video decoder with constrained dynamic range
US9167261B2 (en) 2011-11-07 2015-10-20 Sharp Laboratories Of America, Inc. Video decoder with constrained dynamic range
KR102641723B1 (ko) 2011-11-11 2024-02-29 지이 비디오 컴프레션, 엘엘씨 깊이-맵 추정 및 업데이트를 사용한 효율적인 멀티-뷰 코딩
US9819949B2 (en) 2011-12-16 2017-11-14 Microsoft Technology Licensing, Llc Hardware-accelerated decoding of scalable video bitstreams
US10129540B2 (en) * 2012-04-10 2018-11-13 Texas Instruments Incorporated Reduced complexity coefficient transmission for adaptive loop filtering (ALF) in video coding
KR102379609B1 (ko) 2012-10-01 2022-03-28 지이 비디오 컴프레션, 엘엘씨 향상 레이어 모션 파라미터들에 대한 베이스-레이어 힌트들을 이용한 스케일러블 비디오 코딩

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030169816A1 (en) * 2002-01-22 2003-09-11 Limin Wang Adaptive universal variable length codeword coding for digital video content
EP1467491B1 (de) * 2002-05-02 2007-01-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Arithmetische Codierung von Transformationskoeffizienten
CN1714576A (zh) * 2002-11-22 2005-12-28 皇家飞利浦电子股份有限公司 用于可变长度编码数据流的转码器

Also Published As

Publication number Publication date
TW200729744A (en) 2007-08-01
EP1932361A1 (en) 2008-06-18
MY143016A (en) 2011-02-14
US20070126853A1 (en) 2007-06-07
JP2009510962A (ja) 2009-03-12
CN101313585A (zh) 2008-11-26
WO2007039795A1 (en) 2007-04-12

Similar Documents

Publication Publication Date Title
KR20080067637A (ko) 독립 변수들에 대한 적응적 가변 길이 코드들
US20070046504A1 (en) Adaptive variable length codes for independent variables
US10425644B2 (en) Entropy coding of motion vector differences
US8401321B2 (en) Method and apparatus for context adaptive binary arithmetic coding and decoding
US6894628B2 (en) Apparatus and methods for entropy-encoding or entropy-decoding using an initialization of context variables
US8520965B2 (en) Context adaptive hybrid variable length coding
US8340448B2 (en) Locally variable quantization and hybrid variable length coding for image and video compression
US11012695B2 (en) Context initialization in entropy coding
AU2024201207A1 (en) Context initialization in entropy coding
US20070223826A1 (en) Fine grained scalability ordering for scalable video coding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application