KR20100115238A - Device and method for codec design - Google Patents
Device and method for codec design Download PDFInfo
- Publication number
- KR20100115238A KR20100115238A KR1020090033875A KR20090033875A KR20100115238A KR 20100115238 A KR20100115238 A KR 20100115238A KR 1020090033875 A KR1020090033875 A KR 1020090033875A KR 20090033875 A KR20090033875 A KR 20090033875A KR 20100115238 A KR20100115238 A KR 20100115238A
- Authority
- KR
- South Korea
- Prior art keywords
- decoder
- bitstream
- bsdl
- data
- codec
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
- H04N2007/246—Bitstream transport arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 발명은 영상 코덱에 관한 것으로서, 특히 입력된 비트스트림에 기반하여 신규코덱을 설계하는 방법 및 장치에 관한 것이다.The present invention relates to an image codec, and more particularly, to a method and apparatus for designing a new codec based on an input bitstream.
일반적으로 동영상은 부호화기(encoder, 인코더)에 의해 비트스트림(Bit-stream) 형태로 변환된다. 이때, 비트스트림은 부호화기의 제약 조건을 만족하는 부호화 유형에 따라 저장된다.In general, a video is converted into a bitstream form by an encoder. In this case, the bitstream is stored according to an encoding type satisfying the constraint of the encoder.
MPEG은 비트스트림의 제약 조건으로서 구문(syntax, 이하 'syntax'라 칭함) 및 의미(semantics, 이하 'semantics'라 칭함)를 요구한다. MPEG requires syntax (hereinafter referred to as 'syntax') and semantics (hereinafter referred to as 'semantics') as constraints of the bitstream.
syntax는 데이터의 구조나 형식 및 길이를 나타내며, 데이터가 어떤 순서로 표현되는지를 나타낸다. 즉, syntax는 부호화(encoding)/복호화(decoding) 작업을 위한 문법을 맞추기 위한 것으로, 비트스트림에 포함된 각 요소들(elements)의 순서와 각 요소의 길이, 데이터 형식 등을 정의한다. syntax indicates the structure, format, and length of the data, and in what order the data is represented. That is, syntax is to fit a grammar for encoding / decoding, and defines the order of each element included in the bitstream, the length of each element, and the data format.
Semantics는 데이터를 구성하는 각 비트가 의미하는 뜻을 나타낸다. 즉, semantics는 비트스트림 내의 각 요소들의 의미가 무엇인지를 나타낸다.Semantics means what each bit of data means. That is, semantics indicates what the meaning of each element in the bitstream is.
따라서, 부호화기의 부호화 조건 또는 적용된 표준(또는 코덱)에 따라 다양한 형태의 비트스트림이 생성될 수 있다. 일반적으로 각 표준(예를 들어 MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)은 각각 상이한 비트스트림 syntax를 가진다. Therefore, various types of bitstreams may be generated according to encoding conditions of an encoder or an applied standard (or codec). In general, each standard (eg MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.) has a different bitstream syntax.
따라서, 각 표준이나 부호화 조건에 따라 부호화된 비트스트림은 각각 다른 형식(즉, syntax 및 semantics)을 가진다고 할 수 있으며, 해당 비트스트림의 복호화를 위해서는 부호화기에 대응되는 복호화기가 사용되어야 한다. Accordingly, bitstreams encoded according to each standard or encoding condition may have different formats (ie, syntax and semantics), and a decoder corresponding to an encoder should be used to decode the bitstream.
상술한 바와 같이, 종래의 비트스트림 복호화기는 부호화기의 제약 조건을 만족하여야 하는 제한이 있었으며, 이러한 제한은 복수의 표준에 대응되는 통합 복호화기를 구현하기 어려운 원인이 된다.As described above, the conventional bitstream decoder has a limitation of satisfying the constraints of the encoder, and this limitation causes a difficulty in implementing an integrated decoder corresponding to a plurality of standards.
따라서 본 발명은 상술한 문제점을 해결하기 위한 것으로, 각 표준(예를 들어, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)할 수 있는 비트스트림 디코딩 방법 및 장치를 제공하기 위한 것이다.Accordingly, the present invention is to solve the above-described problem, and is encoded in various formats (syntax, semantics) according to each standard (for example, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.) It is an object of the present invention to provide a bitstream decoding method and apparatus capable of decoding a bitstream in the same information recognition scheme.
또한, 본 발명은 입력된 비트스트림에 기반하여 신규 코덱을 설계 할 수 있는 방법 및 장치를 제공하기 위한 것이다.The present invention also provides a method and apparatus for designing a new codec based on an input bitstream.
본 발명의 일 측면에 따르면, 입력 데이터에 기반하여 신규 코덱을 설계하는 방법 및 장치가 제공된다.According to one aspect of the present invention, a method and apparatus for designing a new codec based on input data are provided.
상술한 바와 같이 본 발명에 따른 통합 코덱 장치 및 방법은 각 표준(예를 들어, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC 등)에 따른 다양한 형식(syntax, semantics)으로 부호화된 비트스트림을 동일한 정보 인식 방식으로 복호화(decoding)할 수 있는 효과가 있다.As described above, the integrated codec apparatus and method according to the present invention are encoded in various formats (syntax, semantics) according to each standard (for example, MPEG-1, MPEG-2, MPEG-4, MPEG-4 AVC, etc.). The decoded bitstream can be decoded with the same information recognition scheme.
또한, 본 발명은 입력된 비트스트림에 기반하여 신규 코덱을 설계할 수 있다.In addition, the present invention can design a new codec based on the input bitstream.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용 된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. Terms including ordinal numbers such as first and second may be used to describe various components, but the components are not limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component. The term “and / or” includes any combination of a plurality of related items or any item of a plurality of related items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is referred to as being "connected" or "connected" to another component, it may be directly connected to or connected to that other component, but it may be understood that other components may be present in between. Should be. On the other hand, when a component is said to be "directly connected" or "directly connected" to another component, it should be understood that there is no other component in between.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in the commonly used dictionaries should be construed as having meanings consistent with the meanings in the context of the related art and shall not be construed in ideal or excessively formal meanings unless expressly defined in this application. Do not.
이하, 첨부한 도면들을 참조하여 본 발명에 따른 통합 코덱 방법 및 장치의 바람직한 실시예를 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어 도면 부호에 상관없이 동일하거나 대응하는 구성 요소에 대한 중복되는 설명은 생략할 수 있다.Hereinafter, preferred embodiments of the integrated codec method and apparatus according to the present invention will be described in detail with reference to the accompanying drawings, and in the following description with reference to the accompanying drawings, overlapping of the same or corresponding components regardless of reference numerals will be described. The description may be omitted.
도 1은 일반적인 복호화기의 구성을 개략적으로 나타낸 도면이고, 도 2는 일반적인 부호화기의 구성을 개략적으로 나타낸 도면이다.FIG. 1 is a diagram schematically showing a configuration of a general decoder, and FIG. 2 is a diagram schematically showing a configuration of a general encoder.
도 1에 도시된 바와 같이, 일반적으로 MPEG-4 복호화기(100)는 가변장 디코딩부(Variable Length Decoding, 110), 역 스캔부(Inverse Scan, 115), 역 DC/AC 예측부(Inverse DC/AC Prediction, 120), 역 양자화부(Inverse Quantization, 125), 역 DCT부(Inverse Discrete Cosine Transform, 역 이산 여현 변환부, 130), 동영상 복원부(VOP Reconstruction, 135)를 포함한다. 복호화기(100)의 구성은 적용되는 표준에 따라 상이할 수 있음은 자명하며, 또한 일부 구성요소는 타 구성요소로 대체될 수도 있을 것이다.As shown in FIG. 1, the MPEG-4
전달된 비트스트림(105)이 syntax 파싱(parsing)되어 헤더 정보 및 인코딩된 비디오 데이터(encoded video data)가 추출되면, 가변장 디코딩부(110)는 미리 저장된 허프만 테이블(Huffman Table)을 이용하여 양자화된 DCT 계수를 만들고, 역 스캔부(115)는 역 스캔을 수행하여 동영상(140)과 동일한 순서의 데이터를 생성한다. 즉, 역 스캔부(115)는 인코딩시 여러 가지 방법으로 스캔된 순서의 역으로, 값을 출력한다. 인코딩 시 양자화(Quantization)를 수행한 후, 주파수 대역 값의 분포에 따라 스캔 방향이 정의될 수 있다. 일반적으로는 지그-재그(zig-zag) 스캔 방식이 사용되나, 스캔 방식은 코덱별로 다양할 수 있다. When the transmitted
Syntax 파싱은 가변장 디코딩부(110)에서 통합적으로 수행되거나, 가변장 디코딩부(110)에 선행하여 비트스트림(105)을 처리하는 임의의 구성 요소에서 수행될 수 있다. 이 경우, Syntax 파싱은 부호화기와 복호화기간에 적용되는 표준이 동일하므로 해당 표준에 상응하도록 미리 지정된 기준에 의해서만 처리된다.Syntax parsing may be performed integrally in the variable
역 DC/AC 예측부(120)는 주파수 대역에서 DCT 계수의 크기를 이용하여 예측을 위한 참조 블록의 방향성을 결정한다. The inverse DC /
역 양자화부(125)는 역 스캔된 데이터를 역 양자화한다. 즉, 인코딩시 지정된 양자화값(QP, Quantization Parameter)을 이용하여 DC와 AC 계수를 환원한다. The
역 DCT부(130)는 역 이산 여현 변환(Inverse Discrete Cosine Transform)을 수행함으로써 실제의 동영상 픽셀 값을 구하여 VOP(Video Object Plane)를 생성한다. The
동영상 복원부(135)는 역 DCT부(130)에 의해 생성된 VOP를 이용하여 동영상 신호를 복원하여 출력한다. The
도 2에 도시된 바와 같이, 일반적으로 MPEG-4 부호화기(200)는 DCT부(210), 양자화부(215), DC/AC 예측부(220), 스캔부(230), 가변장 인코딩부(235)를 포함한 다. As shown in FIG. 2, the MPEG-4
부호화기(200)에 포함된 각 구성요소는 각각 대응되는 복호화기(100)의 구성 요소의 역 기능을 수행하며, 이는 당업자에게 자명하다. 간단히 설명하면, 부호화기(200)는 동영상 신호(즉, 디지털 영상 픽셀 값)를 이산 여현 변환(Discrete Cosine Transform), 양자화(Quantization) 등을 통해 주파수 값으로 변환하여 부호화를 수행한 후, 이를 정보의 빈도 수에 따라 비트 길이를 차별화하는 가변장 인코딩을 수행하여 압축된 비트스트림 상태로 출력한다. Each component included in the
도 3은 본 발명의 일 실시예에 따른 부호화기의 블록 구성도이다.3 is a block diagram of an encoder according to an embodiment of the present invention.
본 발명에 따른 부호화기는 앞서 도 2를 참조하여 설명한 종래의 부호화기(200)에 비해 확장 비트스트림 생성 및 출력부(2410)를 더 포함한다. 확장 비트스트림 생성 및 출력부(2410)는 전단까지의 처리에 의해 생성된 종래 비트스트림(316) 생성 과정에서의 제어 정보(예를 들어, 사용한 기능부들의 목록 및 연결 관계, 해당 기능부들의 입력 데이터, 신택스 정보, 신택스 연결 정보 등)를 이용하여 디코더 디스크립션을 생성한다. 또한, 생성된 디코더 디스크립션(313) 및 종래 비트스트림(316)를 이용하여 확장 비트스트림(305)을 생성하여 복호화기(300)로 전송한다. The encoder according to the present invention further includes an extended bitstream generation and
부호화기는 복수의 부호화 기능부들을 포함하는 툴 박스를 구비하도록 하고, 툴 박스 내에 포함된 기능부들의 순차적 조합 또는 유기적 조합을 통해 하나 이상의 부호화 표준에 따른 비트스트림을 생성할 수 있다.The encoder may include a tool box including a plurality of encoding functions and generate a bitstream according to one or more encoding standards through sequential or organic combinations of the functions included in the tool box.
또한, 본 명세서에서 가변장 인코딩부(235)는 부호화기 내에서 종래 비트스트림(316)을 생성하기 위하여 최종적으로 부호화를 수행하는 임의의 구성 요소(예를 들어, 부호화부)를 지칭한 것일 뿐 이에 제한되는 것은 아니며, 또한 이로 인해 본 발명의 권리범위가 제한되지는 않는다.In addition, the
도 3은 디코더 디스크립션 정보 및 종래 비트스트림을 이용하여 생성한 확장 비트스트림이 복호화기로 제공되는 경우를 가정한 도면이다.3 is a diagram illustrating a case in which an extended bitstream generated by using decoder description information and a conventional bitstream is provided to a decoder.
하지만, 디코더 디스크립션은 별도의 데이터 또는 비트스트림 등의 형태로 복호화기(300)로 전달될 수도 있다. 이 경우는 가변장 인코딩부(235) 후단에 인코딩된 디코더 디스크립션 생성 및 출력부(도시되지 않음)가 위치하여, 종래의 인코딩부와 독립적으로 생성한 인코딩된 디코더 디스크립션을 복호화기(300)로 제공할 수도 있음은 자명하다.However, the decoder description may be delivered to the
한편, 상기 디코더 디스크립션은 해당 기능부들의 기능부 식별 정보(FUID)를 포함한다. 상기 기능부 식별 정보(FUID)는 툴박스 유닛 내에서 해당 기능부가 속하는 툴박스를 나타내는 툴박스 넘버(TBN) 필드 및 해당 기능부의 고유 식별 정보를 나타내는 FU 넘버(FU Number) 필드를 포함하여 구성된다. Meanwhile, the decoder description includes functional unit identification information (FUID) of the corresponding functional units. The functional unit identification information (FUID) includes a tool box number (TBN) field indicating a tool box to which a corresponding function part belongs in the tool box unit, and a FU number field indicating unique identification information of the corresponding function part.
상기 기능부 식별 정보 및 툴박스 유닛에 대하여는 관련 도면(도 10 내지 도 12) 및 관련 표(표 5)를 참조하여 후술하기로 한다.The functional unit identification information and the toolbox unit will be described later with reference to related drawings (FIGS. 10 to 12) and related tables (Table 5).
도 4는 본 발명에 따른 복호화기의 일실시예 블록 구성도이고, 도 5는 도4의 복호화부에서 비트스트림 처리 과정의 일실시예를 구체적으로 나타낸 도면이다.4 is a block diagram of an embodiment of a decoder according to the present invention, and FIG. 5 is a diagram illustrating an embodiment of a bitstream processing process in the decoder of FIG. 4.
도 4에 예시된 디코더 디스크립션 및 영상 비트스트림은 예를 들어 부호화기에 의해 생성되어 제공되는 정보일 수 있다.The decoder description and the image bitstream illustrated in FIG. 4 may be, for example, information generated and provided by an encoder.
도 4을 참조하면, 복호화기(300)는 복호화부(305) 및 분리부(310)을 포함한다. 복호화부(305)는 BSDL 파서(320), 디코더 형성부(330), 툴박스(335) 및 디코딩 솔루션(340)을 포함한다.Referring to FIG. 4, the
BSDL 파서(320)는 분리부(310)로부터 입력된 BSDL 스키마(schema)를 이용하여 외부로부터 입력된 영상 비트스트림의 구문정보를 해석한다. BSDL 파서(320)로 입력되는 영상 비트스트림은 임의의 부호화 방식(예를 들어, MPEG-4, AVS 등)에 의해 부호화된 데이터이다. 본 명세서를 통해 BSDL 파서(320)가 자체적으로 BSDL Schema를 해석할 수 있거나, 또는 외부 알고리즘에 의해 구성될 수 있음을 당업자는 쉽게 이해할 수 있을 것이다.The
BSDL 파서(320)는 XML 문법으로 기술된 BSDL 스키마를 읽어들여 BSDL 파서(320)의 구조를 재정의하기 위한 내부 처리부인 BSDL 해석 처리부를 포함한다. The
BSDL 스키마를 이용해 재정의하는 규칙은 제작자가 적용하는 방법에 따라 다양할 수 있으므로, 그 기본적인 목적만을 제시하면 다음과 같다. 첫째, BSDL 스키마 상에 기록되어 있는 비트스트림의 길이 및 의미에 대한 정보를 인식할 수 있도록 하기 위한 것이다. 둘째, BSDL 스키마 상에 정의된 반복 구조 및 조건적 실행 구조를 읽어 들여 같은 반복 또는 조건문에 의해 실제 동작하는 프로그램적인 루틴을 구현하기 위한 것이다. 따라서, 재정의되기 이전의 BSDL 파서(320)는 위와 같은 목적을 달성하기 위한 기능들만이 구현된 상태라고 정의할 수도 있을 것이며, 상술 한 파싱 기능을 활용해 실제로 구동하는 BSDL 파서(320)를 구현하는 과정을 재정의 하는 과정이라 할 수 있다.The rules to redefine using the BSDL schema can vary depending on the method applied by the producer. Therefore, the basic purpose is as follows. First, it is to be able to recognize the information about the length and meaning of the bitstream recorded on the BSDL schema. Second, to read the repetition structure and conditional execution structure defined in the BSDL schema, and to implement the programmatic routine that actually operates by the same repetition or conditional statement. Accordingly, the
BSDL 파서(320)는 BSDL 해석 처리부의 제어에 의해 유동적인 데이터 흐름을 구성할 수 있는 프로그램으로 구현되며, 예를 들어, CAL(Caltrop Actor Language), C, C++, Java 등 프로그램 언어를 이용하여 구현될 수 있다.The
BSDL 내부 처리부(2525) 및 BSDL 파서(320)는 디코더 설계자의 설계 기준에 따라 제한없이 구현될 수 있다. 물론, BSDL 레퍼런스 소프트웨어와 같이 기존에 제시되어 있는 BSDL 운용 프로그램을 응용할 수도 있을 것이다. BSDL 레퍼런스 소프트웨어는 MPEG 표준화 단체에 의해 표준화된 BSDL의 원활한 운용을 위하여 제작된 공식 소프트웨어로서, BSDL 스키마를 입력받는 BSDL 파서(320) 역시 이러한 소프트웨어 자원을 이용하여 보다 용이하게 구현될 수 있음은 자명하다.BSDL internal processing unit 2525 and
본 명세서에서 언급되는 바와 같이, BSDL 파서(320)의 기본적인 구조는 디코더 설계자가 선택한 다양한 방법에 의해 설계될 수 있다. 즉, 디코더 설계자는 BSDL 파서(320)의 지정된 기능을 수행하도록 하기 위한 상세한 알고리즘의 적용 및 설계를 자율적으로 선택할 수 있다. 다만, BSDL 파서(320)는 BSDL 스키마를 읽어들인 결과에 의해 재정의될 수 있으며, 재정의된 결과물이 복호화부(305)의 다른 구성 요소들과 협업(예를 들어, 통신 등)될 수 있어야 한다. As mentioned herein, the basic structure of
BSDL 파서(320)가 입력받는 BSDL 스키마에는 비트스트림에 포함된 구문 정보들에 대한 상세한 내역이 기술되며, 이 내역에는 예를 들어 구문 정보의 길이, 구문 정보의 의미, 구문 정보의 출현 조건 및 반복 출현 횟수 등이 포함될 수 있다. 여기서, 정보의 길이는 비트스트림 상에서 특정 정보가 차지하는 비트 길이를 의미하며, 구문 정보의 의미는 해당 정보가 어떤 의미를 가지는 정보인지를 나타낸다. 예를 들어, 임의의 기능부에서 A라는 정보를 요청하고 있을 경우 어느 것이 정보 A인지를 구별하는 데 필요할 수 있기 때문이다. 또한, 출현 조건이나 반복 출현 횟수의 경우, 하나의 BSDL 스키마를 이용해 동일한 규격의 동영상 비트스트림을 처리할 경우에도 비트스트림의 속성에 따라 일부 구문 정보의 출현 여부나 반복 횟수 등이 달라질 수 있으므로 이러한 경우를 정의하기 위해 BSDL 스키마에 첨부될 수 있는 정보이다. 예를 들어, 출현 조건은 인트라 프레임을 처리할 때는 모션 벡터 정보를 읽어들이지 않도록 하는 데에 필요할 수 있고, 반복 출현 횟수는 해당 매크로블록이 동일한 구조의 블록을 6개 지닌다고 할 경우 해당 블록을 반복시키는 데 사용될 수 있다.The BSDL schema input by the
도 5에 예시된 바와 같이, BSDL 해석 처리부는 상세한 내역에 관하여 해독한 결과 정보를 BSDL 파서(320)에 전달하여 BSDL 파서(320)가 BSDL 스키마에 지정된 순서에 따라 비트스트림에 포함된 정보를 읽어들이도록 지원한다.As illustrated in FIG. 5, the BSDL interpretation processor delivers the decoded result information regarding the details to the
BSDL 파서(320)는 BSDL 해석 처리부로부터 제공된 결과 정보를 참조하여 입력된 비트스트림의 내용을 의미 있는 데이터로 바꾸어 디코더 형성부(330) 및/또는 디코딩 솔루션(340)에 제공한다. 또한, BSDL 파서(320)가 디코더 형성부 또는/및 디코딩 솔루션(340)으로 제공하는 의미있는 데이터들로는 예를 들어, 미리 지정된 매크로블록 사이즈의 인코딩된 영상 데이터, 인트라 코딩된 매크로블록들에 대한 AC 예측 플래그(ACpred_flag), MCBPC(MB type & coded block pattern for chrominance), CBPY (coded block pattern for luminance) 등이 포함될 수 있다. 이러한 데이터 제공 과정은 디코더 형성부(330)나 디코딩 솔루션(340)의 구동 여부와 무관하게 진행될 수도 있다.The
본 실시예는 디코더(복호화기)가 디코더 디스크립션을 이용하여 비트스트림을 디코딩하되, 디코더 디스크립션이 BSDL 언어 체계 및 이와 연동 가능한 XML 기반 서식을 사용하는 구조로 구현되도록 하기 위한 것이다. 본 실시예를 통해 디코더 디스크립션이 BSDL, CALML 등의 XML 서식을 가질 수 있고, BSDL 스키마는 Syntax Parsing 과정에, CALML은 기능부간의 연결 제어를 위해 사용되도록 그 역할이 구분될 수 있음을 당업자는 쉽게 이해할 수 있을 것이다.This embodiment is intended to allow the decoder (decoder) to decode the bitstream using the decoder description, but to implement the decoder description using a BSDL language scheme and an XML-based format interoperable therewith. In this embodiment, the decoder description may have an XML format such as BSDL, CALML, BSDL schema, Syntax Parsing process, CALML can be distinguished its role to be used for the connection control between the functional part easily skilled in the art I can understand.
BSDL 언어는 비트스트림의 구조와 구성 방식에 대한 정보를 포함한 XML 문서 또는 XML 스키마 형태로 기술된다. 이 언어는 각각이 하나 이상의 영상 비트스트림 구조를 표현할 수 있도록 제작된다. BSDL 언어를 사용함으로서, 디코더는 종래의 MPEG 표준에서 검증되어 사용되고 있는 비트스트림 기술 방식을 그대로 적용할지라도, 타 기술들과 높은 호환성을 획득할 수 있게 된다. BSDL에 관련된 언어 서식 및 문법은 MPEG-B Part 5에 기술되어 있으므로 이에 대한 상세한 설명은 생략한다. The BSDL language is described in the form of an XML document or XML schema that contains information about the structure and organization of the bitstream. The language is designed so that each can represent one or more video bitstream structures. By using the BSDL language, the decoder can obtain a high compatibility with other technologies even if the decoder applies the bitstream technology method that has been verified and used in the conventional MPEG standard. Since the language format and grammar related to BSDL are described in MPEG-B Part 5, the detailed description thereof will be omitted.
BSDL과 XML을 이용한 BSDL 스키마와 연결 제어 정보의 구성예를 나타내면 아래와 같다. 물론, BSDL 스키마와 연결 제어 정보의 구성 형식이 이에 제한되지 않음은 자명하다.An example configuration of BSDL schema and connection control information using BSDL and XML is as follows. Of course, the configuration format of the BSDL schema and connection control information is not limited thereto.
BSDL 스키마BSDL Schema
<xsd:element name="VideoObject"><xsd: element name = "VideoObject">
<xsd:complexType><xsd: complexType>
<xsd:sequence> <xsd: sequence>
<xsd:element name="VOStartCode" <xsd: element name = "VOStartCode"
type="m4v:StartCodeType"/>type = "m4v: StartCodeType" />
<xsd:element name="VOL"> <xsd: element name = "VOL">
<xsd:complexType> <xsd: complexType>
<xsd:sequence> <xsd: sequence>
<xsd:element name="header" type="VOLHeaderType" <xsd: element name = "header" type = "VOLHeaderType"
bs2:ifNext="&volSC;" rvc:port="0"/>bs2: ifNext = "&volSC;" rvc: port = "0" />
<xsd:element name="VOP" <xsd: element name = "VOP"
type="VideoObjectPlaneType" type = "VideoObjectPlaneType"
maxOccurs="unbounded" maxOccurs = "unbounded"
bs2:ifNext="&vopSC;" rvc:port="1"/>bs2: ifNext = "&vopSC;" rvc: port = "1" />
</xsd:sequence> </ xsd: sequence>
</xsd:complexType> </ xsd: complexType>
</xsd:element> </ xsd: element>
</xsd:sequence> </ xsd: sequence>
</xsd:complexType> </ xsd: complexType>
</xsd:element></ xsd: element>
연결 제어 정보Connection control information
<Network name="Decoder"><Network name = "Decoder">
<Package><Package>
<QID><QID>
<ID id="MPEG4 Simple Profile" /><ID id = "MPEG4 Simple Profile" />
</QID></ QID>
</Package></ Package>
<Port kind="Input" name="BITSTREAM" /><Port kind = "Input" name = "BITSTREAM" />
<Port kind="Ouput" name="YUV" /><Port kind = "Ouput" name = "YUV" />
<Instance id="1"><Instance id = "1">
<Class name="Parser"><Class name = "Parser">
<QID><QID>
<ID id="c" /><ID id = "c" />
</QID></ QID>
</Class></ Class>
<Note kind="label" name="Stream Parser" /><Note kind = "label" name = "Stream Parser" />
</Instance></ Instance>
<Instance id="2"><Instance id = "2">
<Class name="VS"><Class name = "VS">
<QID><QID>
<ID id="c" /><ID id = "c" />
</QID></ QID>
<Note kind="label" name="Video Session" /><Note kind = "label" name = "Video Session" />
</Class></ Class>
</Instance></ Instance>
<Connection src="" src-port="BITSTREAM" dst="1" dst-port="BITSTREAM" /><Connection src = "" src-port = "BITSTREAM" dst = "1" dst-port = "BITSTREAM" />
<Connection src="1" src-port="CSCI" dst="2" dst-port="CSCI" /><Connection src = "1" src-port = "CSCI" dst = "2" dst-port = "CSCI" />
<Connection src="1" src-port="DATA" dst="2" dst-port="DATA" /><Connection src = "1" src-port = "DATA" dst = "2" dst-port = "DATA" />
<Connection src="2" src-port="YUV" dst="" dst-port="YUV" /><Connection src = "2" src-port = "YUV" dst = "" dst-port = "YUV" />
</Network></ Network>
본 발명의 또 다른 실시예에서는 ECMAScript에 기반한 스크립트 프로그램으로 영상 비트스트림의 일부 또는 전체를 디코딩하도록 하는 방법으로 디코더 디스크립션을 제작한다. In another embodiment of the present invention, a decoder description is produced by a method of decoding a part or all of an image bitstream by a script program based on ECMAScript.
BSDL 스키마는 MPEG-B Part 5 표준에 따라 영상 비트스트림 구성 요소를 기술하는 방법으로 XML 이외에 ECMAScript 언어로 작성된 스크립트 프로그램 또한 사용할 수 있다. The BSDL schema is a method for describing video bitstream components according to the MPEG-B Part 5 standard. In addition to XML, script programs written in the ECMAScript language can also be used.
BSDL 스키마 안에서 ECMAScript 언어로 된 스크립트 프로그램을 호출하는 방법의 예는 다음과 같다.An example of calling a script program in the ECMAScript language within a BSDL schema is as follows:
<xsd:simpleType name="macroblock"> <xsd: simpleType name = "macroblock">
<xsd:restriction base="bs1x:userType"> <xsd: restriction base = "bs1x: userType">
<xsd:annotation><xsd:appinfo> <xsd: annotation> <xsd: appinfo>
<bs1x:script ref="macroblock.js"/> <bs1x: script ref = "macroblock.js" />
</xsd:appinfo></xsd:annotation> </ xsd: appinfo> </ xsd: annotation>
</xsd:restriction> </ xsd: restriction>
</xsd:simpleType> </ xsd: simpleType>
상기 예에서 호출되는 ECMAScript 언어로 된 스크립트 프로그램의 예는 다음과 같다.An example of a script program in the ECMAScript language called in the above example is as follows.
function parserMain () {function parserMain () {
CSCI.CBP=new Array(6);CSCI.CBP = new Array (6);
var MV_X, MV_Y, MV_rX, MV_rY;var MV_X, MV_Y, MV_rX, MV_rY;
var read_length;var read_length;
var return_value;var return_value;
//var temp;// var temp;
var i;var i;
if (CSCI.VOP_coding_type!=0) {if (CSCI.VOP_coding_type! = 0) {
return_value=readBits(1);return_value = readBits (1);
if (return_value) {if (return_value) {
// Not coded MB: Default CBP (all 0)// Not coded MB: Default CBP (all 0)
CSCI.MBtype=0;CSCI.MBtype = 0;
for (i=0; i<6; i++) CSCI.CBP[i]=0;for (i = 0; i <6; i ++) CSCI.CBP [i] = 0;
return; return;
}}
}}
/*MCBPC (MBtype & CBPC)*/ {/ * MCBPC (MBtype & CBPC) * / {
if (CSCI.VOP_coding_type==0) {if (CSCI.VOP_coding_type == 0) {
return_value = HuffmanVLD("B-6");return_value = HuffmanVLD ("B-6");
} else {} else {
return_value = HuffmanVLD("B-7");return_value = HuffmanVLD ("B-7");
}}
CSCI.MBtype = return_value[0];CSCI.MBtype = return_value [0];
CSCI.CBP[4]=return_value[1];CSCI.CBP [4] = return_value [1];
CSCI.CBP[5]=return_value[2];CSCI.CBP [5] = return_value [2];
}}
if (CSCI.MBtype==3 || CSCI.MBtype==4) {if (CSCI.MBtype == 3 || CSCI.MBtype == 4) {
readBits(1); // AC pred. flagreadBits (1); // AC pred. flag
}}
/*CBPY*/ {/ * CBPY * / {
if (CSCI.MBtype==3 || CSCI.MBtype==4) {if (CSCI.MBtype == 3 || CSCI.MBtype == 4) {
return_value=HuffmanVLD("B-8"); // CBPY Intrareturn_value = HuffmanVLD ("B-8"); // CBPY Intra
CSCI.CBP[0]=return_value[0] ? 1 : 0;CSCI.CBP [0] = return_value [0]? 1: 0;
CSCI.CBP[1]=return_value[1] ? 1 : 0;CSCI.CBP [1] = return_value [1]? 1: 0;
CSCI.CBP[2]=return_value[2] ? 1 : 0;CSCI.CBP [2] = return_value [2]? 1: 0;
CSCI.CBP[3]=return_value[3] ? 1 : 0;CSCI.CBP [3] = return_value [3]? 1: 0;
} else {} else {
return_value=HuffmanVLD("B-8"); // CBPY Interreturn_value = HuffmanVLD ("B-8"); // CBPY Inter
CSCI.CBP[0]=return_value[0] ? 0 : 1;CSCI.CBP [0] = return_value [0]? 0: 1;
CSCI.CBP[1]=return_value[1] ? 0 : 1;CSCI.CBP [1] = return_value [1]? 0: 1;
CSCI.CBP[2]=return_value[2] ? 0 : 1;CSCI.CBP [2] = return_value [2]? 0: 1;
CSCI.CBP[3]=return_value[3] ? 0 : 1;CSCI.CBP [3] = return_value [3]? 0: 1;
}}
}}
if (CSCI.MBtype==1 || CSCI.MBtype==4) {if (CSCI.MBtype == 1 || CSCI.MBtype == 4) {
readBits(2); //DQuantreadBits (2); // DQuant
}}
if (! (CSCI.MBtype==3 || CSCI.MBtype==4 || CSCI.VOP_coding_type==0) ) {if (! (CSCI.MBtype == 3 || CSCI.MBtype == 4 || CSCI.VOP_coding_type == 0)) {
i=0; //R121i = 0; // R121
do {do {
// Motion Vector// motion vector
read_length = CSCI.VOP_Fcode_foward-1;read_length = CSCI.VOP_Fcode_foward-1;
MV_X = HuffmanVLD("B-12");MV_X = HuffmanVLD ("B-12");
if (CSCI.VOP_Fcode_foward!=1 && MV_X!=0) {if (CSCI.VOP_Fcode_foward! = 1 && MV_X! = 0) {
MV_rX = readBits(read_length);MV_rX = readBits (read_length);
} else {} else {
MV_rX = 0;MV_rX = 0;
}}
MV_Y = HuffmanVLD("B-12");MV_Y = HuffmanVLD ("B-12");
if (CSCI.VOP_Fcode_foward!=1 && MV_Y!=0) {if (CSCI.VOP_Fcode_foward! = 1 && MV_Y! = 0) {
MV_rY = readBits(read_length);MV_rY = readBits (read_length);
} else {} else {
MV_rY = 0;MV_rY = 0;
}}
token_output("MV_X", MV_X)token_output ("MV_X", MV_X)
token_output("MV_Y", MV_Y);token_output ("MV_Y", MV_Y);
token_output("MV_rX", MV_rX);token_output ("MV_rX", MV_rX);
token_output("MV_rY", MV_rY);token_output ("MV_rY", MV_rY);
i++;i ++;
} while (CSCI.MBtype==2 && i<4); //R121.b} while (CSCI.MBtype == 2 && i <4); //R121.b
}}
// BLOCK// BLOCK
for (i=0; i<6; i++) {for (i = 0; i <6; i ++) {
B_MP4_SP (CSCI, i)B_MP4_SP (CSCI, i)
}}
}}
상기 예와 같은 스크립트 프로그램을 기술하는 언어는 종래에 ECMA 262 표준에 정의된 언어 체계를 따르므로 자세한 설명은 생략한다.Since the language describing the script program as in the above example follows the language system defined in the ECMA 262 standard, a detailed description thereof will be omitted.
종래 BSDL 표준에서는 한 번의 스크립트 프로그램 호출로 하나의 신택스 엘리먼트 정보만을 디코딩 하는 것을 전제하였으며, 해석된 정보가 도 5에서 나타나듯 데이터 인터페이스를 통해 기능부로 전달되는 방법을 정의하고 있지 않다. 따라서, 본 실시예에서는 ECMAScript를 이용하여 비트스트림의 신택스 파싱 과정 일부 또는 전체를 나타내기 위하여 다음과 같은 프로그램 내 함수가 신택스 파서에 의해 정의된다.The conventional BSDL standard presupposes that only one syntax element information is decoded by one script program call, and does not define a method in which the interpreted information is transferred to a functional unit through a data interface as shown in FIG. 5. Therefore, in the present embodiment, the following in-program functions are defined by the syntax parser to represent some or all of the syntax parsing process of the bitstream using ECMAScript.
- parserMain(): ECMAScript로 짜여진 신택스 파싱 알고리즘을 구동하기 위해 맨 처음 호출되는 함수 (Entry point) 로, 가령 C언어에서의 main() 과 같은 역할parserMain (): The first entry point to run the syntax parsing algorithm written in ECMAScript, such as main () in C.
- readBits(bit_length): parserMain() 함수 내에서 호출될 수 있으며, 입력되는 비트스트림으로부터 bit_length만큼의 비트를 읽어 그 값을 반환하는 함수readBits (bit_length): Can be called in parserMain () function and reads bit_length bit from input bitstream and returns the value.
- tokenOutput(token_name, token_data: parserMain() 함수 내에서 호출될 수 있으며, token_name이라는 출력 값 식별자와 token_data의 데이터 값을 가지는 출력을 신택스 파서가 출력하게 하는 함수. 출력된 데이터는 이후 도 10의 데이터 인터페이스로 전달됨tokenOutput (token_name, token_data: A function that can be called within the parserMain () function and causes the syntax parser to output an output having an output value identifier called token_name and a data value of token_data. Sent to
아울러, 다음과 같은 프로그램 내 함수를 추가적으로 정의함으로써 디코더 디스크립션 설계 상의 편의를 제공한다.In addition, the function of the decoder description is provided by additionally defining the following functions in the program.
- peekBits(bit_length): parserMain() 함수 내에서 호출될 수 있으며, 입력되는 비트스트림으로부터 bit_length만큼의 비트를 미리 살펴보고 그 값을 반환하는 함수-peekBits (bit_length): It can be called in parserMain () function. It checks bit_length bit from input bitstream and returns the value.
- getToken(): parserMain() 함수 내에서 호출될 수 있으며, 현재 신택스 파서가 데이터 인터페이스를 통해 출력할 수 있는 데이터 종류의 전체 목록을 배열 형식으로 반환하는 함수getToken (): A function that can be called from within the parserMain () function and returns an array of the full list of data types that the current syntax parser can output through the data interface.
위와 같이 ECMAScript로 작성된 신택스 파싱 과정 기술을 포함한 BSDL 스키마를 입력받는 BSDL 파서는 ECMAScript 기반 스크립트 프로그램을 구동할 수 있어야 함은 자명하며, 위의 각 함수들은 상기 스크립트 프로그램 구동 과정에서 각 함수의 역할에 맞는 방식으로 호출되고 처리되어야 함은 당업자에게 자명할 것이다.It is obvious that the BSDL parser that receives the BSDL schema including syntax parsing process description written in ECMAScript should be able to run an ECMAScript-based script program. Each of the above functions corresponds to the role of each function in the script program driving process. It will be apparent to those skilled in the art that they should be called and handled in a manner.
상기 예에서는 ECMAScript가 BSDL 표준에 정의된 방식에 따라 BSDL 스키마의 일부 또는 전체로서 전달되는 경우에 대해 설명하였다. 그러나, ECMAScript는 독립적으로 표준으로 정의되어 있는 범용 스크립트 언어이므로, BSDL이 아닌 다른 전달매체에 포함되거나 독립적으로 전송되는 것이 가능하다. 또한, ECMAScript 표준 (ECMA 262) 에 표준 적합성을 검증받은 ECMAScript의 방언 언어 (Dialects) 들의 문법 또한 신택스 파서의 스크립트 프로그램 구동 과정을 소폭 변경함으로서 사용 가능하다.In the above example, the case where ECMAScript is delivered as part or all of BSDL schema according to the manner defined in BSDL standard. However, ECMAScript is a general-purpose scripting language that is independently defined as a standard, so that it can be included in a transmission medium other than BSDL or transmitted independently. In addition, the syntax of ECMAScript dialects (Dialects), which have been tested to conform to the ECMAScript standard (ECMA 262), can also be used by making minor changes to the syntax program execution process of the syntax parser.
본 실시예에서는 디코더 디스크립션(2560), 인코딩된 비디오 데이터(2580) 등의 정보가 외부로부터 입력되는 경우를 가정하여 설명하나, 그 중 하나 이상의 정보가 복호화부(305)의 임의의 구성 요소 내에 이미 내장되어 구현될 수도 있음은 자명하다.In the present embodiment, a description will be given on the assumption that information such as a decoder description 2560 and encoded video data 2580 is input from the outside, but one or more of the information is already present in an arbitrary component of the
다시 도 4을 참조하면, 디코더 형성부(330)는 분리부(310)로부터 입력받은 연결 제어 정보 또는/및 BSDL 파서(320)로부터 입력받은 비트스트림 데이터의 일부(예를 들어, 미리 지정된 매크로블록 사이즈의 인코딩된 영상 데이터, 인트라 코 딩된 매크로블록들에 대한 AC 예측 플래그(ACpred_flag), MCBPC(MB type & coded block pattern for chrominance), CBPY (coded block pattern for luminance) 등 중 하나 이상)을 이용하여 디코딩 솔루션(340)이 구현되도록 제어한다. Referring back to FIG. 4, the
즉, 디코더 형성부(330)는 연결 제어 정보 등을 이용하여 툴박스(335)에 구비된 기능부들 중 일부 또는 전체가 유기적인 연결 관계로서 디코딩 솔루션(340) 내에 로드되어 정렬되도록 제어한다. 여기서, 연결 제어 정보는 CALML(CAL Markup Language)로 작성될 수 있다. CALML이란 MPEG 표준화 단체에서 현재 논의중인 CAL언어(Caltrop Markup Language) 방식의 디코더 구성을 기술할 수 있는 XML 포맷이다. CAL언어는 프로그램 객체인 Actor와 각 Actor간의 연결 관계로 구성되는데, 이러한 CAL언어의 구조를 XML 서식에 의해 표현한 것이다. 이에 대한 표현 예는 앞서 BSDL 스키마와 연결 제어 정보의 표현 예로서 이미 제시하였다.That is, the
구체적으로, 디코더 형성부(330)는 여러 기능부의 집합으로 구성된 툴박스(335)에 접근할 권한을 가지며, 툴박스(335)에 구비된 기능부들간에 입, 출력 연결을 설정하여 그 결과물에 해당하는 디코딩 솔루션(340)을 구성한다. 이 때 기능부들간 입/출력 연결 구조 및 실행 순서는 연결 제어 정보를 참고하여 설정된다. 또한, 입력된 비트스트림의 종류를 구별하기 위한 일부 정보를 BSDL 파서(320)로부터는 전달받아, 기능부 연결 과정에서 참조할 수 있다. 기능부들간의 연결 구조가 모두 확정되면, 그 연결 구조는 외부로부터의 지속적인 데이터 입력이 전제될 경우 해당 디코더 디스크립션 제작자가 의도한 모든 종류의 영상 비트스트림을 해석, 디코딩 할 수 있는 독립적인 디코더로 간주할 수 있다. 이 때 이 완결된 기능부 연결 구조를 디코딩 솔루션(340)이라 명명할 수 있다.In detail, the
툴박스(335)는 미리 지정된 프로세스를 수행하도록 각각 구현된 복수의 기능부들을 포함한다. 각각의 기능부들은 각각 프로그램 코드들의 조합으로 구현될 수도 있다. The
툴박스(335)에 포함되는 각 기능부들은 적용되는 용도별 집합으로 구분된 복수의 세부 툴박스로 세분화될 수도 있다. 예를 들어, MPEG용 기능부들이 포함되는 제1 툴박스, MPEG용 기능부들 이외의 기능부들이 포함되는 제2 툴박스 등으로 세분화될 수 있다. 또는 MPEG-2용 기능부들의 집합인 제1 툴박스, MPEG-4용 기능부들의 집합인 제2 툴박스, 중국의 디지털 TV 압축 표준인 AVS용 기능부들의 집합인 제3 툴박스 등으로 세분화될 수 있다.Each functional unit included in the
물론, 툴박스(335) 자체가 복수로 구현되어 디코더 형성부(330) 및 디코딩 솔루션(340)과 독립된 연결 관계를 가질 수도 있다. 이 경우, 도시되지는 않았으나 상술한 제1 툴박스, 제2 툴박스 등이 독립된 형식의 툴박스로 구현될 수 있을 것이다.Of course, the
다만, 이하에서는 설명의 편의를 위해 하나의 툴박스(335) 내에 복수의 세부 툴박스들이 포함되거나 모든 기능부들이 집합체 구성없이 산재되어 포함되는 경우를 중심으로 설명하기로 한다. However, hereinafter, for convenience of description, a plurality of detailed toolboxes are included in one
툴박스(335)는 각각의 기능(즉, 미리 설정된 프로세스)을 수행하도록 구현된 기능부(FU, Functional Unit)들이 포함되는 영역으로, 각 기능부들은 디코더 형성부(330)의 연결 제어에 의해 디코딩 솔루션(340)에 로드(load)되어 순차적인 연결 동작 관계를 형성함으로써 영상 비트스트림(380)에 포함된 인코딩된 영상 데이터를 디코딩된 영상 데이터로 출력한다. The
툴박스(335) 내에는 예를 들어, DF(De-blocking Filter) 기능부, VR(VOP Reconstructor) 기능부, FFR(Frame Field Reordering) 기능부, IPR(Intra prediction and Picture Reconstruction) 기능부, IT(Inverse Transform) 기능부, IQ(Inverse Quantization) 기능부, IAP(Inverse AC Prediction) 기능부, IS(Inverse Scan) 기능부, DCR(DC Reconstruction) 기능부 등의 기능부가 포함될 수 있다.The
IT4x4 기능부, IQ4x4 기능부) 및 DCR4x4 기능부는 처리하는 블록 사이즈가 4x4인 것을 특징으로 한다. 이는 MPEG-1/2/4의 경우에는 Transform, Quantization, Prediction 시에 8x8 블록 사이즈로 데이터를 처리함에 비해, MPEG-4 AVC는 4x4 블록 사이즈로 데이터를 처리하는 경우가 존재하기 때문이다. IT4x4 function unit, IQ4x4 function unit) and DCR4x4 function unit is characterized in that the block size to be processed is 4x4. This is because MPEG-4 AVC processes data with 4x4 block size, whereas MPEG-1 / 2/4 processes data with 8x8 block size during Transform, Quantization, and Prediction.
툴박스(335)에는 데이터 디코딩 기능을 수행하기 위한 기능부라면 적용되는 표준에 관계없이 모두 포함될 수 있을 뿐 아니라 기술 발전과정에서 필요한 기능부는 추가될 수 있고, 기존 기능부의 수정도 가능하며, 불필요한 기능부는 제거될 수 있음은 자명하다. 예를 들어, 복호화 처리를 위해 4x4 블록 사이즈로 데이터를 처리하는 IS4x4 기능부 등이 추가로 필요한 경우 해당 기능부들이 툴박스(335)에 추가될 수 있다. 또한, MPEG-4 AVC에서 인트라 예측(Intra Prediction) 수행을 위한 SPR(Special Prediction) 기능부 등이 더 추가될 수도 있을 것이다.The
툴박스(335) 내에 구비된 각 기능부는 각 표준에 독립적으로 존재하지 않고, 표준에 관계없이 동일한 처리가 가능한 기능부의 경우에는 하나의 기능부로 통합되어 구비될 수도 있음은 자명하다. 각 기능부의 기능은 당업자에게 자명한 사항이므로 간략히 설명하기로 한다.Each functional unit provided in the
DF 기능부는 MPEG-4 AVC의 디-블록킹 필터(de-blocking filter)이고, VR 기능부는 복원된 픽셀값을 저장하는 기능부이다. The DF function is a de-blocking filter of MPEG-4 AVC, and the VR function is a function that stores the reconstructed pixel values.
FFR 기능부는 interlaced 모드를 위한 기능부이고, IPR 기능부는 MPEG-4 AVC의 인트라 예측(Intra prediction)을 한 후 복원된 픽셀값을 저장하는 기능부이다. 상술한 바와 같이, MPEG-4 AVC의 인트라 예측은 SPR 기능부에 의해 수행될 수 있을 것이다. The FFR function is a function for interlaced mode, and the IPR function is a function for storing the reconstructed pixel value after intra prediction of MPEG-4 AVC. As described above, intra prediction of MPEG-4 AVC may be performed by the SPR function.
IT 기능부는 DC값 및 AC값들의 역 변환(inverse transform)을 수행하는 기능부이고, IQ 기능부는 AC 값들을 역 양자화(inverse quantization)하는 기능부이다.The IT function unit is a function unit that performs inverse transform of DC values and AC values, and the IQ function unit is a function unit that inverse quantizes AC values.
IAP 기능부는 AC값들을 역 예측(inverse AC prediction)하는 기능부이고, IS 기능부는 AC값들을 역 스캔(inverse scan)하는 기능부이다. DCR 기능부는 DC값들의 역 예측 및 역 양자화를 수행하는 기능부이다.The IAP function is a function for inverse AC prediction of AC values, and the IS function is a function for inverse scan of AC values. The DCR function is a function that performs inverse prediction and inverse quantization of DC values.
디코딩 솔루션(340)은 디코더 형성부(330)에 의해 생성된 결과물로, BSDL 파서(320)에서 구문 정보 단위로 분리된 비트스트림 데이터(또는 미리 지정된 매크로블록 크기의 인코딩된 비디오 데이터)를 입력 받는다.The
도 5에 예시된 바와 같이, 입력된 비트스트림 데이터는 데이터를 입/출력하기 위한 유, 무형의 데이터 인터페이스를 통해 입력될 수 있다. 데이터 인터페이스는 소프트웨어의 경우 특정 메모리 버퍼이거나, 자료의 흐름을 정의하는 가상 포 트(Port)이거나, 프로그램 상의 파라미터일 수 있고. 하드웨어의 경우에는 회로 상의 연결선일 수 있으며, 이외에도 다양하게 구현될 수 있다.As illustrated in FIG. 5, the input bitstream data may be input through a tangible or intangible data interface for inputting / outputting data. The data interface can be a specific memory buffer for software, a virtual port defining the flow of data, or a parameter on a program. The hardware may be a connection line on a circuit, and may be variously implemented.
데이터의 입력은 해당 인터페이스를 통해 지속적으로, 그리고 특정 기능부의 프로세스 수행과 무관하게 지속적으로 입력(예를 들어, 병렬 처리가 가능하도록 입력)될 수 있다. 디코딩 솔루션(340)은 입력되는 데이터를 처리하여 디코딩된 영상 데이터로 출력한다. 도 5에 도시된 바와 같이, 데이터는 데이터 인터페이스로부터 시작해 각 기능부로 전달될 수 있으며, 기능부는 해당 데이터를 가공하여 후속하는 기능부로 전달할 수 있다. 이러한 데이터의 흐름은 모두 디코더 형성부(330)에 의해 사전 정의된 바에 의하여 처리된다.Data can be input continuously through the interface and continuously (for example, parallel processing) without regard to the performance of a particular function. The
디코딩 솔루션(340)내에는 BSDL 파서(320)로부터 제공받은 데이터(예를 들어, 비트스트림의 syntax 파싱에 의해 추출된 정보 등), 각 기능부의 처리 결과 데이터를 저장하기 위한 저장부가 포함될 수 있다. 디코더 형성부(330)의 제어에 의해 로드된 각 기능부는 BSDL 파서(320)로부터 제공된 데이터 및 선행하여 동작된 기능부의 결과 데이터 중 하나 이상을 이용하여 지정된 프로세스를 수행할 수 있다. 이 경우, 후속하여 프로세스를 수행할 기능부는 선행하는 기능부의 동작이 완료되었음을 인식하여야 한다. 이를 위해, 디코더 형성부(330)는 각 기능부의 동작 완료 여부를 지속적으로 모니터링하여 후속하는 기능부의 동작 개시 여부를 제어할 수 있다. 또한, 저장부 내에 각 기능부별로 독립된 영역이 구비되도록 하고, 선행하는 기능부의 처리 결과 데이터를 디코더 형성부(330)의 제어에 의해 후속하는 기능부를 위한 저장 영역에 저장되도록 하면, 후속하는 기능부는 자신의 저장 영역에 프로세스 수행을 위해 필요한 데이터가 저장되는 즉시 프로세스를 수행할 수도 있을 것이다. 이외에도, 기능부간의 처리 개시 시점을 제어하기 위한 다양한 방법이 추가적으로 고려될 수 있음은 자명하다.The
물론, 해당 저장부는 디코더 형성부(330) 내에 구비될 수도 있으며, 디코더 형성부(330)는 현재 프로세스를 수행할 기능부로 BSDL 파서(320)로부터 제공받은 데이터(예를 들어, 비트스트림의 syntax 파싱에 의해 추출된 정보 등), 각 기능부의 처리 결과 데이터를 해당 기능부로 제공할 수도 있다.Of course, the storage unit may be provided in the
이하, 도 5를 참조하여 복호화부(305)의 동작 과정을 간략히 설명하면 다음과 같다. Hereinafter, an operation process of the
외부로부터 입력 영상 비트스트림과 BSDL 스키마가 입력되면(비트스트림의 임의 지점에 정보 A 와 정보 B가 존재하는 것으로 가정함), BSDL 파서(320)은 BSDL 스키마를 읽어 들여 정보 A에 해당하는 지점에 5bit의 MB type 데이터가 존재하고, 정보 B에 해당하는 지점에는 2bit의 CBPY 데이터가 존재함을 인식한다.When the input video bitstream and BSDL schema are input from the outside (assuming that information A and B exist at any point in the bitstream), the
이어서, BSDL 파서(320)는 파서는 인식한 정보를 이용해 각 지점에서 지정된 수 만큼의 비트를 읽어 들이고, 읽어들인 정보를 부여된 의미에 따라 디코딩 솔루션(340)에 전달한다.The
디코딩 솔루션(340)은 BSDL 파서(320)로부터 MB Type과 CBPY로 명명된 데이터를 제공받아 처리하게 된다. 디코딩 솔루션(340)은 디코더 형성부(330)의 연결 제어에 의해 각 기능부들이 로딩되어 구현됨은 앞서 설명한 바와 같다.The
디코딩 솔루션(340)에 존재하는 데이터 인터페이스는 외부로부터 전달된 데 이터를 받아들여, 연결 제어 정보에 의해 사전에 구성된 기능부들의 연결 관계를 참조하여, 해당 데이터를 요구하는 기능부들에 전달한다.The data interface present in the
각 기능부는 역시 미리 지정된 연결 관계(즉, 데이터 처리를 위한 연결 관계)에 따라 디코딩 과정을 수행한다. 모든 데이터 흐름과 기능부 간의 연결 관계는 디코더 형성부(330)가 사전에 구성한 내역에 의한다. 각 기능부들의 순차적 처리에 의해 출력 영상 프레임이 외부로 출력된다.Each functional unit also performs a decoding process according to a predetermined connection relationship (ie, a connection relationship for data processing). The connection relationship between all data flows and the functional units is based on the details previously configured by the
상술한 바와 같이, 디코더 형성부(330) 또는/및 디코딩 솔루션(340) 내에는 저장부가 구비될 수 있다. BSDL 파서(320)로부터 데이터를 제공받음에 있어, 그 전달 과정에 끊김이 없고 또한 디코딩 과정과는 병렬적으로 데이터 제공이 수행될 수 있기 때문이다. 또한, 각 기능부는 필요한 데이터를 저장부로부터 독출하여 사용할 수도 있을 것이다. As described above, a storage unit may be provided in the
또한, BSDL 파서(320)는 인코딩된 영상 데이터의 디코딩 처리를 위해 상응하는 데이터를 디코더 형성부(330)로 제공하여 디코더 형성부(330)가 디코딩 솔루션(340)으로 제공하도록 하거나, BSDL 파서(320)가 직접 해당 데이터를 디코딩 솔루션(340)으로 제공할 수도 있을 것이다. In addition, the
다시 도 4을 참조하면, 분리부(310)는 입력된 디코더 디스크립션(2560)을 각각의 정보로 분리하여 복호화부(305)로 입력한다. 분리부(310)에 입력된 디코더 디스크립션(2560)은 비트스트림의 구조를 기술하기 위한 BSDL 스키마(2565)와 비트스트림의 디코딩 과정을 기술하기 위한 CALML 데이터(2570)를 포함할 수 있다. 상술한 두 가지 종류의 데이터는 각각 독립적으로 XML 문법에 의해 기술될 수도 있으 며, 효율적인 디코더의 운용을 위하여 두 종류의 데이터가 통합되어 전송될 수 있다. Referring back to FIG. 4, the
도 6는 본 발명의 바람직한 다른 실시예에 따른 디코더 디스크립션 입력 과정을 나타낸 도면이다.6 is a diagram illustrating a decoder description input process according to another embodiment of the present invention.
도 6에 예시된 바와 같이, 복호화기(300)는 디스크립션 디코더(510)를 더 포함할 수 있다. 디스크립션 디코더(510)는 입력된 인코딩된 디코더 디스크립션(520)을 디코딩 처리하여 디코더 디스크립션(2560)을 생성하여 분리부(310)로 제공할 수 있다.As illustrated in FIG. 6, the
디코더 디스크립션(2560)을 인코딩하여 송수신함으로써 송수신되는 데이터량을 절감할 수 있는 효과가 있다.By encoding and transmitting the decoder description 2560, the amount of data transmitted and received can be reduced.
도 7은 본 발명에 따른 복호화기의 다른 실시예 블록 구성도이다.7 is a block diagram of another embodiment of a decoder according to the present invention.
앞서 도 4을 참조하여 디코더 디스크립션(2560)과 영상 비트스트림이 복호화부(305)로 입력되는 경우와, 도 6를 참조하여 인코딩된 디코더 디스크립션(520)과 영상 비트스트림(380)이 복호화부(305)로 입력되는 경우를 설명하였다.Referring to FIG. 4, the decoder description 2560 and the image bitstream are input to the
그러나, 도 7에 예시된 바와 같이, 디코더 디스크립션(2560)의 구성 정보들이 원시적으로 분리되어 복호화부(305)로 입력될 수도 있음은 자명하다. 이 경우, 앞서 설명한 분리부(310), 디코더 디스크립션(2560) 등이 생략될 수 있음은 자명하다. 도 8은 본 발명의 다른 실시예에 따른 복호화부의 구성을 나타낸 도면이다.However, as illustrated in FIG. 7, it is apparent that configuration information of the decoder description 2560 may be input to the
앞서 도 4 내지 도 7을 참조하여 툴박스(335) 및 디코더 형성부(330)가 분리되어 구현된 복호화부(305)에 대하여 설명하였다.The
그러나 도 8 에 예시된 바와 같이, 툴박스(335)가 디코더 형성부(330)의 일 구성 요소로 포함되어 구현될 수도 있음은 자명하다.However, as illustrated in FIG. 8, it is obvious that the
이 경우, 디코더 형성부(330)는 기능부간의 연결 구조 제어 기능 뿐 아니라 사용될 기능부의 선별 기능까지도 포함할 수 있으며, 이를 통해 구현 가능한 디코딩 솔루션(340)의 유형도 다양해질 수 있을 것이다.In this case, the
도 9는 본 발명의 또 다른 실시예에 따른 BSDL 파서의 구성을 나타낸 도면이다.9 is a diagram showing the configuration of a BSDL parser according to another embodiment of the present invention.
앞서 도 4을 참조하여, BSDL 해석 처리부를 포함하는 BSDL 파서(320)에 대하여 설명하였다.The
그러나, 본 발명에 따른 BSDL 파서(320)는 비트스트림의 디코딩을 개시하기 이전에 복호화기(300) 외부로부터 사전 정의되어 제공될 수도 있다. 따라서, 앞서 설명한 BSDL 해석 처리부가 생략될 수 있다. 이때, BSDL 파서 제작기(2610)는 BSDL 레퍼런스 소프트웨어와 같은 기존의 응용 프로그램을 활용하여 구성될 수 있을 것이다.However, the
이제까지, BSDL 파서가 독립된 구성 요소로서 지정된 동작을 처리하는 경우를 중심으로 설명하였다. 다만, BSDL 파서는 툴박스 내에 포함되는 하나의 기능부 로서 구현되거나, 디코딩 솔루션 내에 독립된 구성 요소로서 미리 포함되도록 구현될 수도 있을 것이다. 만일, BSDL 파서가 툴박스 내에 구비되는 경우 디코더 형성부는 연결 제어 정보를 이용하여 BSDL 파서가 비트스트림 디코딩을 위해 동작하는 기능부들의 동작 이전에 프로세스를 수행하도록 로드 및 제어하여야 할 것이다. 마찬가지로, BSDL 파서가 디코딩 솔루션 내에 미리 포함되는 경우, 디코더 형성부는 로드한 각 기능부들의 프로세스 수행 개시 이전에 BSDL 파서가 먼저 프로세스 수행하도록 제어하여야 할 것이다. 각각의 경우에도 BSDL 파서의 동작 및 기능은 앞서 관련 도면을 참조하여 설명한 바와 동일하므로 상세한 설명은 생략하기로 한다. 다만, BSDL 스키마 또는/및 비트스트림을 초기에 입력받는 주체가 디코더 형성부 또는/및 디코딩 솔루션으로 변경될 필요가 있을 수 있다.So far, the description has been focused on the case where the BSDL parser processes the designated operation as an independent component. However, the BSDL parser may be implemented as one functional unit included in the toolbox or may be implemented to be included in advance as an independent component in the decoding solution. If the BSDL parser is provided in the toolbox, the decoder forming unit should load and control the BSDL parser to perform a process before the operation of the functional units operating for the bitstream decoding using the connection control information. Similarly, if the BSDL parser is previously included in the decoding solution, the decoder forming unit should control the BSDL parser to perform the process first before starting the process execution of each loaded functional unit. In each case, since the operation and function of the BSDL parser are the same as described above with reference to the related drawings, a detailed description thereof will be omitted. However, the subject initially receiving the BSDL schema or / and bitstream may need to be changed to a decoder forming unit and / or a decoding solution.
이제까지 본 발명에 따른 복호화 장치 및 비트스트림 복호화를 위한 구문 해석 방법을 설명함에 있어 MPEG-4 AVC를 기준으로 설명하였으나, MPEG-1, MPEG-2, MPEG-4, AVS 및 이외의 동영상 부호화/복호화 표준에 아무런 제한없이 동일하게 적용할 수 있음은 당연하다.Although the decoding apparatus and the syntax parsing method for bitstream decoding according to the present invention have been described with reference to MPEG-4 AVC, video encoding / decoding of MPEG-1, MPEG-2, MPEG-4, AVS, and others are described. Naturally, the same can be applied without any limitation to the standard.
또한, 연결 제어 정보에 포함되는 정보 역시 하나의 표준에 의한 디코딩 수행을 위한 기능부들의 연결 관계, 해당 기능부에 요구되는 처리 프로세스 등에 관한 정보만으로 기술되지 않고, 복수의 표준에 의한 디코딩 수행을 위한 정보로 기술될 수도 있음은 자명하다.In addition, the information included in the connection control information is not described only with information about the connection relationship between the functional units for performing decoding by one standard, the processing process required for the corresponding functional unit, and the like. It is obvious that information may be described.
예를 들어, 영상 비트스트림의 초기 복수의 프레임은 MPEG-2로 인코딩되고, 후속하는 복수의 프레임은 MPEG-4로 인코딩되며, 나머지 프레임은 MPEG-1으로 인코딩되었다고 가정하자. 이 경우, 인코딩된 영상 데이터의 디코딩을 위해 연결 제어 정보는 인코딩 방법을 달리하는 각 프레임들이 툴박스(335)에 포함된 각 표준에 따른 기능부들이 유기적으로 결합되어 동작될 수 있도록 정의될 것임은 자명하다.For example, suppose that an initial plurality of frames of an image bitstream are encoded in MPEG-2, subsequent frames are encoded in MPEG-4, and the remaining frames are encoded in MPEG-1. In this case, for the decoding of the encoded image data, the connection control information will be defined such that each frame having a different encoding method can be functionally combined and operated in accordance with each standard included in the
이하, 관련 도면을 참조하여, 본 발명에 따른 복호화기의 또 다른 실시예를 설명하기로 한다. 다만, 또 다른 실시예를 설명함에 있어, 전술한 실시예와 동일하거나 극히 유사한 기능을 수행하는 구성에 대한 설명은 그 명칭 및 도면 참조 부호를 동일하게 표시하는 것으로서 중복된 설명을 생략하기로 한다. 예를 들어, 도 11에 도시된 툴박스(335), 디코더 형성부(330) 및 디코딩 솔루션(330)은 기본적으로 전술한 구성과 동일하다.Hereinafter, another embodiment of a decoder according to the present invention will be described with reference to related drawings. However, in describing another embodiment, the description of the configuration that performs the same or extremely similar functions as the above-described embodiment will be omitted by the same description as the same reference numerals and reference numerals. For example, the
전술한 바와 같은 복호화 프로세서에서 해당 기능부들을 로드하고 재조합하여 디코더를 형성하기 위하여는 효율적이고 신속하게 기능부들을 구분하고 로드할 수 있는 메커니즘이 필요하다. 이하, 본 발명에 따른 기능부(FU)들의 구체적인 구분 식별 방법 및 툴박스의 상세 구성을 설명하기로 한다.In order to form the decoder by loading and recombining the corresponding functional units in the decoding processor as described above, a mechanism capable of distinguishing and loading functional units is required. Hereinafter, a detailed configuration of the method for identifying and classifying the functional units FU according to the present invention will be described.
도 10는 본 발명의 일실시예에 따른 툴박스의 상세 구성을 나타내는 예시도이다.10 is an exemplary view showing a detailed configuration of a toolbox according to an embodiment of the present invention.
도 10에 도시된 바와 같이, 본 발명에 따른 툴박스는 복수의 기능부들을 유 형에 따라 저장/관리하기 위하여 별도로 구분된 복수의 툴박스의 집합으로 구성될 수 있다. 이하, 상기 복수의 툴박스의 집합을 툴박스 유닛이라 칭하기로 한다. 즉, 기능부들은 그 유형에 따라 툴박스 유닛 내에서 다수의 툴박스에 구분되어 저장/관리되며, 각각의 툴박스(Toolbox)는 툴박스 넘버(Tool Box Number, TBN)로 구분되고 식별되어 관리된다. 즉, 상기 툴박스 넘버는 일종의 툴박스 식별 정보이다.As shown in FIG. 10, the toolbox according to the present invention may be configured as a set of a plurality of toolboxes separately separated to store / manage a plurality of functional units according to types. Hereinafter, the set of the plurality of tool boxes will be referred to as a tool box unit. That is, the functional units are divided and stored / managed into a plurality of toolboxes in the toolbox unit according to their types, and each toolbox is divided into toolbox numbers (TBNs) and identified and managed. That is, the toolbox number is a kind of toolbox identification information.
즉, 본 발명에 따른 툴박스 유닛은 MPEG 비디오 복호화와 관련된 기능부들을 저장하는 MPEG 비디오 툴박스; MPEG 오디오 복호화와 관련된 기능부들을 저장하는 MPEG 오디오 툴박스; MPEG 그래픽 복호화와 관련된 기능부들을 저장하는 MPEG 그래픽스 툴박스; 및 시스템 복호화와 관련된 기능부들을 저장하는 시스템 툴박스(System toolbox)등 멀티미디어 복호화에 관련된 기능부로 구성될 수 있으며, 상기 툴박스 유닛은 복수의 상기 툴박스들을 포함하여 구성될 수 있다.That is, the toolbox unit according to the present invention includes an MPEG video toolbox for storing functional units related to MPEG video decoding; An MPEG audio toolbox that stores functional parts related to MPEG audio decoding; An MPEG graphics toolbox for storing functional parts related to MPEG graphic decoding; And a functional unit related to multimedia decryption such as a system toolbox storing functional units related to system decryption, and the toolbox unit may include a plurality of toolboxes.
상기 툴박스의 툴박스 넘버는 아래의 표 1과 같이 정의될 수 있다.The toolbox number of the toolbox may be defined as shown in Table 1 below.
[표 1]TABLE 1
상기 툴박스 유닛 및 툴박스들은 하나의 저장 수단 내에서 논리적으로 구분되어 구현될 수도 있고, 복수의 저장 수단으로 물리적으로 구분되어 구현될 수도 있다.The toolbox unit and the toolbox may be logically divided into one storage means, or may be physically divided into a plurality of storage means.
도 11은 본 발명의 일실시예에 따른 기능부 식별 정보(FUID)를 나타내는 예시도이다.11 is an exemplary diagram illustrating functional unit identification information (FUID) according to an embodiment of the present invention.
도 11에 도시된 바와 같이 본 발명에 따른 기능부 식별 정보(FUID)는 해당 기능부가 속하는 툴박스를 나타내는 툴박스 넘버(TBN) 필드 및 해당 기능부의 고유 식별 정보를 나타내는 FU 넘버(FU Number) 필드를 포함하여 구성된다.As illustrated in FIG. 11, the functional part identification information (FUID) according to the present invention includes a tool box number (TBN) field indicating a toolbox to which the corresponding function part belongs, and a FU number field indicating unique identification information of the corresponding function part. It is configured by.
상기 툴박스 넘버 필드는 4 비트로 구현되고, 상기 FU 넘버 필드는 28 비트로 구현될 수 있다. 28비트로 FU 넘버 필드를 구현함으로써, 268,435,456개의 기능부들을 하나의 툴박스에 저장하고 식별하여 이용할 수 있다.The toolbox number field may be implemented with 4 bits, and the FU number field may be implemented with 28 bits. By implementing the FU number field with 28 bits, 268,435,456 functions can be stored, identified and used in one toolbox.
상기 FUID는 위에서 언급하였던 VNT에서의 FUID 필드에 적용되는 등의 방법을 통해 디코더 디스크립션에 포함되어 표현될 수 있다. 또한, 동일한 의미의 정보를 담고 있는 XML 기반의 연결 제어 정보에서도, 디코더 구성에 사용되는 각 기능부를 지칭하는 데에 사용될 수 있음은 자명하다.The FUID may be included in the decoder description through a method such as applied to the FUID field in the VNT mentioned above. In addition, it is obvious that even in XML-based connection control information containing information of the same meaning, it may be used to refer to each functional unit used in the decoder configuration.
도 12은 본 발명에 따른 기능부 구분/식별 메커니즘을 설명하기 위한 개념도이다.12 is a conceptual diagram illustrating a functional unit classification / identification mechanism according to the present invention.
도 12을 참조하면, 복호화부의 BSDL 파서 또는 디코더 디스크립션 해석부는 수신된 디코더 디스크립션을 해석하여 기능부 식별 정보(FUID)(1950)을 추출하고, 디코더 형성부는 상기 기능부 식별 정보(FUID)(1950)로부터 디코더를 조합하는데 필요한 기능부들의 TBN 및 FU 넘버를 리딩하고, 리딩된 TBN 및 FU 넘버에 해당하는 기능부를 해당 툴박스로 요청하면, 요청된 기능부들은 디코딩 솔루션에 로딩되고 연결됨으로써 재조합 디코더를 형성하여 입력 데이터를 복호화한다.Referring to FIG. 12, the BSDL parser or decoder description analyzer of the decoder interprets the received decoder description to extract functional unit identification information (FUID) 1950, and the decoder forming unit of the functional unit identification information (FUID) 1950. Reading the TBN and FU numbers of the functions required to combine the decoders from them, and requesting the corresponding toolbox corresponding to the read TBN and FU numbers, the requested functions are loaded and connected to the decoding solution to form a recombinant decoder. To decode the input data.
예를 들어, 첫번째 FUID가 TBN이 0이고 FU 넘버가 69이므로, 툴박스 내의 MPEG 비디오 툴박스(MPEG video toolbox)(1910)에 저장된 기능부들 중에서 FU 넘버가 69인 기능부가 요청되어 로딩된다.For example, since the first FUID is TBN is 0 and the FU number is 69, among the functional units stored in the
도 13은 본 발명의 실시예에 따른 입력된 비트스트림에 기반하여 신규 코덱을 설계하는 방법을 나타낸 순서도이다. 13 is a flowchart illustrating a method of designing a new codec based on an input bitstream according to an embodiment of the present invention.
아래와 같은 일반적인 디자인 절차가 RVC 프레임워크를 이용한 새로운 코덱 또는 프로파일 지원에 있어 적용될 수 있다. 향후 RVC를 이용한 새로운 코덱의 지원이 계속될 것으로 보이며, 이 때 아래와 같은 단계 구분이 작업 및 업무 관리에 도움이 될 것으로 예상한다. RVC를 이용해 제작하고자 하는 대상 코덱이 확정된 뒤, 아래와 같은 절차를 밟을 수 있다. The following general design process can be applied to support new codecs or profiles using the RVC framework. Support of new codecs using RVC is expected to continue in the future, and it is expected that the following steps will help to manage tasks and tasks. After the target codec to be produced using RVC is determined, the following procedure can be performed.
단계 1310에서 코덱 설계 장치는 가장 유사한 RVC 코덱 구성을 찾는다. 가능한 한, 기존에 사용 가능한 RVC 기반 코덱 정보 중 만들고자 하는 코덱에 가장 가까운 것을 선정하여 작업을 개시한다. 예를 들자면, MPEG-4 ASP는 MPEG-4 SP 구성으로부터 도출 가능하다.In
단계 1315에서 코덱 설계 장치는 새로운 코덱을 위한 비트스트림 구문 정보 (BSD)를 기술한다. 대상 코덱의 비트스트림 구문 정보를 RVC의 BSD (Bitstream Syntax Description) 서식으로 기술한다.In
단계 1320에서 코덱 설계 장치는 BSD를 검증한다. 즉, 2단계에서 만든 BSD가 대상 코덱 표준에 부합하는지 검증한다. 제작된 BSD가 대상 코덱에서 출현 가능한 모든 비트스트림 구성 방법을 지원하는지 확인한다..In
단계 1325에서 코덱 설계 장치는 토큰 풀 업데이트한다. FU 간의 네트워크 구성과 정보 교환을 위해, 토큰 풀을 업데이트한다. BSD 디자인의 결과로 만일 새로운 토큰이 추가되거나, 기존 토큰의 역할이 변경되거나, 일부 토큰이 삭제되었다면, 이를 토큰 풀에 반영한다.In
단계 1330에서 코덱 설계 장치는 추가 또는 수정이 필요한 FU를 확인한다. 대상 코덱의 동작을 RVC에서 구현하기 위하여, 기존 VTL에 있는 일부 FU가 수정을 요하거나, 또는 새로운 FU가 필요할 수 있다. 어떤 FU가 수정 또는 추가되어야 하는지, 그리고 각각의 FU들은 구체적으로 어떤 새로운 기능을 포함하여야 하는지 정리한다.In
단계 1335에서 코덱 설계 장치는 FU의 신규 기능을 구체화한다. 5단계의 결과를 토대로, 각 FU의 Textual Description (규격서)를 새로 작성한다. 이 단계에서는 FU의 입/출력 및 내부 처리 알고리즘을 새롭게 정의하거나 기존에서 변경하는 작업이 진행된다. 이 과정은 이후 새로운 FU 네트워크의 구성에 필수적이다. In
보다 상세하게 코덱 설계 장치는 FU의 정밀도를 결정한다. 새로운 FU를 정의할 경우에는, 해당 FU의 정밀도를 반드시 결정해야만 한다. 지나치게 정밀한 FU는 향후 구현 시의 자유도를 침해하며, 지나치게 뭉뚱그려진 FU는 코덱의 세부 기능을 파악하는 것을 어렵게 할 수 있다. 예제 또는 가이드라인을 위해서는 기존의 RVC 표준 (MPEG-B Part 4, MPEG-C Part 4)을 참고한다. In more detail, the codec design apparatus determines the precision of the FU. When defining a new FU, you must determine the precision of that FU. Overly precise FUs may compromise the freedom of future implementations, and overly packed FUs can make it difficult to understand the codec's detailed features. For examples or guidelines, see the existing RVC standards (MPEG-B Part 4, MPEG-C Part 4).
그리고, 코덱 설계 장치는 표준 적합성 검증 정보를 제작한다.The codec design device produces standard conformance verification information.
만일 이 단계에서 각 FU의 “최적 반응 (Golden response, 특정 FU가 정상적으로 동작할 때 정해진 입력에 대해 반드시 내놓아야 하는 성공적인 수행 결과)” 을 정의할 수 있다면, 이후 FU의 검증 단계에서 유용하게 사용할 수 있을 것이다.If at this stage you can define the “optimal response” of each FU (a successful outcome that must be given for a given input when a particular FU is operating normally), it can be useful in subsequent verification phases of the FU. There will be.
단계 1340에서 코덱 설계 장치는 새로운 코덱을 위한 FU 네트워크 정보 (FND) 를 기술한다. 대상 코덱의 전체 처리 과정을 FND로 기술한다. 이 때 6단계에서 정의한 새로운 FU들과 4단계에서 정의한 새로운 토큰들이 사용될 수 있다.In
단계 1345에서 코덱 설계 장치는 FND를 검증한다. 제작된 FND를 검증한다. FU의 연결이 불량하여 데드락이 발생할 수 있지는 않은지, 입/출력 포트의 토큰이 서로 일치하지 않는 것은 아닌지 확인한다.In
단계 1350에서 코덱 설계 장치는 시뮬레이션 환경에서 FU를 셋업한다. 6단계에서 정의한 FU들과 이를 이용해 7단계에서 정의한 FND를, 기존의 시뮬레이션 환경에서 사용할 수 있도록 셋업한다.In
보다 상세하게 코덱 설계 장치는 비트스트림 구문 파서 FU를 제작한다. RVC 디코더의 동작을 위해서는 신택스 파서 FU가 시뮬레이션 모델에서 동작할 수 있어야 한다. 2단계의 BSD를 파서 FU로 Convert하거나, BSD를 입력으로 동작할 수 있는 범용 파서 (Generic syntax parser) FU를 사용하라.In more detail, the codec design apparatus manufactures a bitstream syntax parser FU. For the operation of the RVC decoder, the syntax parser FU must be able to operate on the simulation model. Convert the two stage BSDs to a parser FU, or use a generic syntax parser FU that can run BSD as input.
이어서, 코덱 설계 장치는 새로운 FU를 구현한다. 5단계의 FU 규격서에 따 라, 새로 추가되거나 변경되는 FU들을 구현한다.The codec design device then implements a new FU. Implement new or changed FUs according to the five-stage FU specification.
코덱 설계 장치는 FU의 표준 적합성을 검증한다. 만일 6.2단계의 표준 적합성 검증 정보가 제작되어 있다면, 이를 이용하여 9.2단계에서 구현한 FU가 의도한 대로 정상 동작하는지 확인한다.The codec design device verifies the FU's standard conformance. If the standard conformance verification information of step 6.2 has been produced, it is used to verify that the FU implemented in step 9.2 is working as intended.
단계 1355에서 코덱 설계 장치는 디코더 구성 전체를 검증한다. 최종적으로, 디코딩 솔루션을 제작하여, 구현된 RVC 코덱의 모든 기능이 정상적으로 동작하는지 검증한다. 모든 FU가 정상적으로 동작하고, FU 간의 연결이 정상적으로 데이터를 주고받는지 확인한다. Conformance bitstream 및 코덱 단위의 “최적 반응” 데이터가 검증을 위해 활용될 수 있을 것이다.In
상술한 방법에서 제시한 각 단계를 실제 RVC 기반 코덱 자체 프로젝트에 적용시 현 상태를 하기와 같은 테이블로 나타낼 수 있다. 하기의 표는 MPEG-4 ASP를 대상으로 적용한 것이다.Each step presented in the above method can be represented in the following table when the actual RVC-based codec is applied to the project itself. The following table applies to MPEG-4 ASP.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the invention as defined in the appended claims. It will be understood that the invention may be varied and varied without departing from the scope of the invention.
도 1은 일반적인 복호화기의 구성을 개략적으로 나타낸 도면.1 is a diagram schematically showing a configuration of a general decoder.
도 2는 일반적인 부호화기의 구성을 개략적으로 나타낸 도면.2 is a diagram schematically illustrating a configuration of a general encoder.
도 3는 본 발명에 따른 부호화기의 일실시예 블록 구성도.3 is a block diagram of an embodiment of an encoder according to the present invention;
도 4는 본 발명에 따른 복호화기의 일실시예 블록 구성도.4 is a block diagram of an embodiment of a decoder in accordance with the present invention.
도 5는 본 발명의 일 실시예에 따른 복호화부에서 비트스트림 처리 과정을 구체적으로 나타낸 도면.5 is a diagram illustrating in detail a bitstream processing in a decoder according to an embodiment of the present invention.
도 6은 본 발명의 바람직한 다른 실시예에 따른 디코더 디스크립션 입력 과정을 나타낸 도면.6 is a diagram illustrating a decoder description input process according to another embodiment of the present invention.
도 7은 본 발명에 따른 복호화기의 다른 실시예 블록 구성도.7 is a block diagram of another embodiment of a decoder according to the present invention;
도 8은 도 4의 복호화부의 다른 실시예 블록 구성도.8 is a block diagram of another embodiment of the decoder of FIG. 4;
도 9은 본 발명의 다른 실시예에 따른 BSDL 파서의 구성을 나타낸 도면.9 illustrates a configuration of a BSDL parser according to another embodiment of the present invention.
도 10은 본 발명의 일실시예에 따른 툴박스의 상세 구성을 나타내는 예시도.10 is an exemplary view showing a detailed configuration of a toolbox according to an embodiment of the present invention.
도 11은 본 발명의 일실시예에 따른 기능부 식별 정보(FUID)를 나타내는 예시도.11 is an exemplary view showing functional unit identification information (FUID) according to an embodiment of the present invention.
도 12는 본 발명에 따른 기능부 구분/식별 메커니즘을 설명하기 위한 개념도.12 is a conceptual diagram for explaining a functional unit classification / identification mechanism according to the present invention.
도 13은 본 발명의 실시예에 따른 입력된 비트스트림에 기반하여 신규 코덱을 설계하는 방법을 나타낸 순서도.13 is a flowchart illustrating a method of designing a new codec based on an input bitstream according to an embodiment of the present invention.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090033875A KR20100115238A (en) | 2009-04-17 | 2009-04-17 | Device and method for codec design |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090033875A KR20100115238A (en) | 2009-04-17 | 2009-04-17 | Device and method for codec design |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20100115238A true KR20100115238A (en) | 2010-10-27 |
Family
ID=43134185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090033875A KR20100115238A (en) | 2009-04-17 | 2009-04-17 | Device and method for codec design |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20100115238A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2455599A2 (en) | 2010-11-18 | 2012-05-23 | Hyundai Motor Company | Method for predicting NOx amount and exhaust system using the same |
EP2460994A2 (en) | 2010-12-02 | 2012-06-06 | Hyundai Motor Company | Method for predicting regeneration of DeNOx catalyst and exhaust system using the same |
EP2461000A2 (en) | 2010-12-02 | 2012-06-06 | Hyundai Motor Company | Method for predicting nox loading at denox catalyst and exhaust system using the same |
-
2009
- 2009-04-17 KR KR1020090033875A patent/KR20100115238A/en not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2455599A2 (en) | 2010-11-18 | 2012-05-23 | Hyundai Motor Company | Method for predicting NOx amount and exhaust system using the same |
EP2460994A2 (en) | 2010-12-02 | 2012-06-06 | Hyundai Motor Company | Method for predicting regeneration of DeNOx catalyst and exhaust system using the same |
EP2461000A2 (en) | 2010-12-02 | 2012-06-06 | Hyundai Motor Company | Method for predicting nox loading at denox catalyst and exhaust system using the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101305491B1 (en) | Bitstream decoding device and method | |
KR101232780B1 (en) | Device and Method for unified codecs | |
US20110044410A1 (en) | Device and method for encoding/decoding | |
KR101305514B1 (en) | Bitstream decoding device and method | |
US20100208829A1 (en) | Bitstream decoding device and method having decoding solution | |
KR101372418B1 (en) | Bitstream decoding device and method | |
KR100970145B1 (en) | Device and Method for encoding/decoding | |
KR20100115238A (en) | Device and method for codec design | |
KR101477218B1 (en) | Device and Method for encoding/decoding | |
US9031136B2 (en) | Device and method for encoding/decoding | |
KR101380825B1 (en) | Bitstream decoding device and method having decoding solution | |
US8565320B2 (en) | Device and method for encoding/decoding video data | |
KR20090002508A (en) | Device and method for encoding/decoding video data | |
KR100807100B1 (en) | Device and Method for unified codecs | |
KR101305517B1 (en) | Bitstream decoding device and method having decoding solution | |
KR20080006430A (en) | Device and method for unified codecs | |
KR20070098374A (en) | Device and method for unified codecs | |
KR101305516B1 (en) | Bitstream decoding device and method having decoding solution | |
KR20090002507A (en) | Device and method for encoding/decoding video data | |
KR20070098459A (en) | Device and method for unified codecs | |
KR20070075270A (en) | Device and method for unified codecs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |