Nothing Special   »   [go: up one dir, main page]

KR100643126B1 - Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법 - Google Patents

Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법 Download PDF

Info

Publication number
KR100643126B1
KR100643126B1 KR1020040056821A KR20040056821A KR100643126B1 KR 100643126 B1 KR100643126 B1 KR 100643126B1 KR 1020040056821 A KR1020040056821 A KR 1020040056821A KR 20040056821 A KR20040056821 A KR 20040056821A KR 100643126 B1 KR100643126 B1 KR 100643126B1
Authority
KR
South Korea
Prior art keywords
prediction mode
prediction
size
block
decoded
Prior art date
Application number
KR1020040056821A
Other languages
English (en)
Other versions
KR20060008527A (ko
Inventor
최윤식
서동완
Original Assignee
학교법인연세대학교
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인연세대학교 filed Critical 학교법인연세대학교
Priority to KR1020040056821A priority Critical patent/KR100643126B1/ko
Publication of KR20060008527A publication Critical patent/KR20060008527A/ko
Application granted granted Critical
Publication of KR100643126B1 publication Critical patent/KR100643126B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

DCT 계수를 기초로 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법이 개시된다. 복호화부는 입력 동영상 스트림을 복호한다. 정보추출부는 복호화부에 의해 복호된 제1크기의 블록에 대한 DCT 계수를 추출한다. 에지방향산출부는 추출된 DCT 계수를 기초로 제1크기의 블록내에 존재하는 에지의 방향을 산출한다. 예측모드결정부는 산출된 에지방향에 대응하는 예측모드를 결정한다. 부호화부는 결정된 예측모드를 기초로 동영상을 부호화하여 출력한다. 본 발명에 따르면, 인트라 예측 모드를 효율적으로 추정하여 계산량을 최소화하며 부호화 효율을 유지할 수 있다.
트랜스코더, MPEG, 인트라 예측 모드, AC 계수, 에지

Description

DCT 계수를 기초로 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법{Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same}
도 1은 MPEG-4 Part 10(H.264)에서 사용하는 인트라 예측 모드를 도시한 도면,
도 2는 본 발명에 따른 트랜스코더의 바람직한 실시예의 상세한 구성을 도시한 블록도,
도 3은 가변길이디코더에 의해 복호된 4개의 8×8 블록을 1개의 8×8 블록으로 다운샘플링하는 경우에 복호된 블록의 AC 계수와 추출방향을 도시한 도면,
도 4는 에지의 방향과 AC01, AC10, AC02, 및 AC20의 값의 조합과의 관계를 도시한 도면, 그리고,
도 5는 본 발명에 따른 트랜스코딩 방법의 바람직한 실시예의 수행과정을 도시한 흐름도이다.
본 발명은 DCT 계수를 기초로 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법에 관한 것으로, 보다 상세하게는, 동영상의 트랜스코딩 시 계산의 복잡도 감소 및 화질의 극대화를 위해 입력 스트림에서 복호화된 DCT 계수를 기초로 출력 부호화 파라미터인 인트라예측모드를 결정하는 트랜스코더 및 트랜스코딩 방법에 관한 것이다.
이동 통신 기술의 발전 및 디지털 미디어 서비스의 다양화로 인해 멀티미디어 전송 및 저장 시 전송 환경이나 어플리케이션에 따라 동영상 데이터의 변형의 필요성이 증가하고 있다. 트랜스코딩 시스템이란 동영상 데이터를 적절한 포맷으로 변형하거나 비트율을 변화시키는 시스템이다. 하지만 실시간으로 동영상 데이터를 변경함에 있어서 데이터의 변경을 위한 계산의 복잡도를 감소시키는 동시에 화질을 극대화시키기는 용이하지 않다. 즉, 입력 동영상을 복호화한 후 다시 부호화하는 트랜스코딩 시스템에서의 복호화 및 부호화에 따른 많은 계산량으로 인해 실시간으로 동영상을 변경하면서 최대의 화질을 얻은 것은 거의 불가능에 가깝다. 따라서 트랜스코딩 시스템에 관한 연구는 부호화 과정에서 많은 계산량을 필요로 하는 움직임 예측 및 매크로블록 종류 결정을 효율적으로 개선하는데 그 목표를 두고 있다.
기존에 제안된 트랜스코딩 알고리즘에는 그 처리 영역에 따라 공간 영역 트랜스코딩 기법과 DCT 영역의 트랜스코딩 기법이 존재한다. 또한 각각의 트랜스코딩 기법에 있어서 부호화 과정에서 사용하게 될 출력 파라미터들을 효과적으로 설정하기 위한 알고리즘들이 제안된 바 있다. 출력 파라미터 산출 알고리즘은 트랜스코딩 처리 영역과는 무관하게 적용할 수 있는 알고리즘이다. 출력 파라미터 산출 알고리즘은 주로 부호화 과정에서 복잡한 연산을 필요로 하는 매크로블록 종류와 움직임벡터 설정에 초점을 두고 개발되었다.
한편 기존의 트랜스코더에는 인트라 예측 모드를 효율화하는 알고리즘이 존재하지 않았다. 따라서 기존의 트랜스코더에서의 인트라 예측 모드 결정은 부호화 알고리즘에 기반하여 행해졌다. MPEG-4 Part 10(H.264)의 부호화 압축 방식에서 인트라 예측 모드는 도 1에 도시된 같이 9개의 4Х4 예측 모드와 4개의 8Х8 예측 모드를 가지고 있다. Intra 4×4 모드의 9가지 예측모드는 각각의 모드 이름에 대응되도록, 수직방향, 수평방향 또는 대각선 방향 등으로 블록의 예측이 수행된다.
Intra 4×4 모드는 vertical 모드, horizontal 모드, DC 모드, diagonal_down_left 모드, diagonal_down_right 모드, vertical_right 모드, horizontal_down 모드, vertical_up 모드, 및 horizontal_up 모드가 있다. 이 때, Intra 4×4 모드에서는 9가지 예측방향에 대해서 모두 비트율-왜곡을 구하기 위해 소요되는 비용을 계산하여 최적의 모드를 선택한다. 예를 들어, 4Х4 예측 모드 중 예측 모드 0을 설명하면, 예측 모드 0은 90° 방향으로 예측을 실시한다. 4Х4 블록 내의 픽셀 값은 열(column)로 분류하여 첫 번째 열은 A값을 프리딕터(predictor)로 하여 예측을 실행하게 된다. 즉, 도 1에 도시된 바와 같이 화살표 방향에 따라 프리딕터를 결정하고, 화살표 방향에 속한 픽셀 값은 그 프리딕터에 의해 예측을 실행하게 된다. MPEG-4 Part 10(H.264)에서는 이와 같이 모든 예측 모드에 따라 예측을 실행한 후 비트율과 왜곡이 최적화되는 인트라 예측 모드를 선택 하게 된다.
이와 같은 기존의 트랜스코더는 인트라 예측 모드를 종류별로 실행한 후 비트율-왜곡(Rate-Distortion) 최적화에 기반하여 비교하여 최적인 예측 모드를 선정한다. 이 때, 예측 모드 별로 비트율과 왜곡을 구하는 과정은 많은 계산량을 요구하게 되므로, 실시간으로 동영상을 변경하면서 최대의 화질을 얻기가 곤란하다는 문제가 있다.
본 발명이 이루고자 하는 기술적 과제는, 어플리케이션에 따라 해상도 감소 및 비트율 감소를 위한 동영상 트랜스코딩에 적합한 트랜스코더 및 트랜스코딩 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 어플리케이션에 따라 해상도 감소 및 비트율 감소를 위한 동영상 트랜스코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 트랜스코더는 입력 동영상 스트림을 복호하는 복호화부; 상기 복호화부에 의해 복호된 제1크기의 블록에 대한 DCT 계수를 추출하는 정보추출부; 상기 추출된 DCT 계수를 기초로 상기 제1크기의 블록내에 존재하는 에지의 방향을 산출하는 에지방향산출부; 상기 산출된 에지방향에 대응하는 예측모드를 결정하는 예측모드결정부; 및 상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 부호화부;를 구비한다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 트랜스코딩 방법은 입력 동영상 스트림을 복호하는 단계; 상기 복호된 제1크기의 블록에 대한 DCT계수를 추출하는 단계; 상기 추출된 DCT 계수를 기초로 상기 제1크기의 블록내에 존재하는 에지의 방향을 산출하는 단계; 상기 산출된 에지방향에 대응하는 예측모드를 결정하는 단계; 및 상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 단계;를 포함한다.
이에 의해, 입력 동영상 스트림을 복호화 시 추출된 정보를 통하여 선택한 에지의 방향에 따라 인트라 예측 모드를 결정하여 트랜스코더의 복잡도를 최소화하고 화질을 유지할 수 있다.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 트랜스코더 및 트랜스코딩 방법의 바람직한 실시예에 대해 상세하게 설명한다.
도 2는 본 발명에 따른 트랜스코더의 바람직한 실시예의 상세한 구성을 도시한 블록도이다.
도 2를 참조하면, 본 발명에 따른 트랜스코더(200)는 복호화부(210), 정보추출부(230), 에지방향산출부(240), 예측모드결정부(250), 다운샘플러(260), 및 부호화부(270)를 구비한다.
복호화부(210)는 입력 동영상 스트림을 복호한다. 입력 동영상 스트림은 MPEG, H.26x 등의 압축표준에 의해 압축된 프레임 단위의 영상 신호이다. 복호화부(210)는 가변길이디코더(Variable Length Decoder : VLD)(212), 역양자화부(214), 역DCT부(216), 프레임메모리(218), 움직임보상부(220), 및 가산부(222)를 갖는다. 이러한 복호화부(210)는 가변길이디코더(212)의 출력을 정보추출부(230)에 제공하는 구성을 제외하고 기존의 MPEG 동영상을 복호하는 장치의 구성과 동일하므로 상세한 설명은 생략한다.
부호화부(270)는 예측모드결정부(250)에 의해 결정된 예측모드를 기초로 동영상을 부호화하여 출력한다. 도 2에 도시된 부호화부(270)는 H.264 부호화기(encoder)로서 DCT/양자화부(272), 가변길이코더(274), 역DCT/역양자화부(276), 프레임메모리(278), 움직임추정부(280), 인트라예측부(282), 및 감산기(284)를 구비한다.
다운샘플러(260)로부터 입력된 영상은 DCT/양자화부(272)로 입력되어 DCT와 양자화가 수행된 후 가변길이코더(274)에서 컨텍스트 기반의 적응 가변길이코딩(Context-based adaptive variable length coding)된다. 가변길이코더(274)로부터 출력되는 동영상 스트림은 MPEG-4 Part 10(H.264)의 압축표준에 의해 압축된 프레임 단위의 영상 신호이다. 이때 입력영상은 역DCT/역양자화부(276)에도 입력되어 (DCT+Q)-1가 수행된다. (DCT+Q)-1 가 수행된 영상은 선택적으로 블록경계를 스무딩처리를 거친 후 프레임메모리(278)에 저장된다. 움직임추정부(280)는 프레임메모리(278)에 저장되어 있는 참조영상과 입력영상을 가지고 움직임 추정을 수행하여 인코딩할 입력영상이 인터 프레임인가 인트라 프레임인가의 여부에 따라 입력영상에서 참조영상을 뺄 것인가의 여부를 결정하고, 결정내용에 기초하여 선택적으로 참조영상을 감산기(284)에 제공한다. 인트라예측부(282)는 움직임추정부(280)로부터 입력받은 추정결과, 예측모드결정부(250)로부터 입력받은 예측결과, 및 다운샘플러(260)로부터 입력받은 입력영상을 기초로 인트라 매크로블록의 부호화를 위한 인트라 예측방향을 설정하여 가산기(260)로 출력한다.
본 발명에 따른 트랜스코더(200)는 정보추출부(230), 에지방향산출부(240), 및 예측모드결정부(250)의 효율성에 따라 성능이 결정된다. 따라서 정보추출부(230)가 복호화부(210)로부터 의미있는 정보를 추출하기 위한 알고리즘은 전체 트랜스코더(210) 내의 복호화 과정의 복잡도를 증가시키지 않으면서 정보를 효율적으로 추출하여야 한다. 또한 에지방향산출부(240) 및 예측모드결정부(250)는 추출된 정보를 활용하여 부호화 파라미터를 최적에 가깝도록 산출하여야 한다. 트랜스코더 (200)내의 부호화부(210)에서 전체 부호화 파라미터를 계산하면 화질은 최적이지만 전체 복잡도가 증가하여 실시간 응용에 있어 문제점을 야기하게 된다. 나아가, 부호화 파라미터를 잘못 선정하면 전체적인 화질이 떨어져 실제 동영상 서비스의 품질을 떨어뜨리게 된다.
정보추출부(230)는 복호화부(210)에 의해 복호된 8×8 블록에 대한 DCT 계수 AC 계수를 추출한다. 이 때 정보추출부(230)는 AC 계수를 지그재그 스캔순서로 추출한다. 도 3에는 가변길이디코더(212)에 의해 복호된 4개의 8×8 블록을 1개의 8×8 블록으로 다운샘플링하는 경우에 복호된 블록의 AC 계수와 추출방향이 도시되어 있다. 도 3을 참조하면, 정보추출부(230)는 복호된 블록 중에서 왼쪽 상단에 도시된 8×8 블록으로부터 순차적으로 AC01, AC10, AC02, 및 AC20 을 추출한다. 도 3에 도시된 8Х8 블록은 트랜스코더(200)의 부호화부(270)의 4Х4 블록에만 영향을 주게 된다. 비록 도 3에는 입력영상에 비해 출력영상의 해상도가 감소되는 경우가 도시되어 있으나, 본 발명서 제시하는 인트라 예측 모드 결정 알고리즘은 해상도감소가 이루어지지 않은 경우에도 적용될 수 있다.
에지방향산출부(240)는 정보추출부(230)에 의해 추출된 AC 계수를 기초로 복호된 8×8 블록내에 존재하는 에지의 방향을 산출한다. 이 때 에지방향산출부(240)는 다음의 수학식에 의해 블록내에 존재하는 일정한 방향의 에지 성분의 존재 유무를 파악한다. 도 3에 도시된 바와 같은 블록에서 추출된 DCT 계수의 특성을 알아보기 위해 AC 계수들을 계산하는 변환식은 수학식 1과 같이 정의된다.
Figure 112004032317699-pat00001
수학식 1에서 AC01, AC10의 식을 변형하여 나타내면 각각 수학식 2와 수학식 3으로 표현할 수 있다.
Figure 112004032317699-pat00002
Figure 112004032317699-pat00003
수학식 2의 AC01은 가로 방향의 픽셀 정보의 차이를 DCT의 합으로 표현한 것 과 같으므로 블록 내의 세로 방향 에지의 존재 유무를 판단할 수 있는 정보로 제공된다. 수학식 3의 AC10은 세로 방향의 픽셀 정보의 차이를 DCT의 합으로 표현한 것과 같으므로 블록 내의 가로 방향 에지의 존재 유무를 판단할 수 있는 정보로 제공된다. 따라서 AC01이 "0"이면 세로 방향 에지가 존재하지 않는 것을 의미하며, AC 10이 "0"이면 가로 방향 에지가 존재하지 않는 것을 의미한다. 결론적으로, AC01 , AC10, AC02, 및 AC20의 값의 조합을 통해 0°, 90°, 45°, 135°, 67.5°, 112.5°방향의 에지 성분의 존재 유무를 파악할 수 있다.
예측모드결정부(250)는 산출된 에지방향에 대응하는 예측모드를 결정한다. 도 4에는 에지의 방향과 AC01, AC10, AC02, 및 AC20의 값의 조합과의 관계가 도시되어 있다. 예측모드결정부(250)는 도 3에 도시된 4개의 8Х8 블록이 모두 같은 방향의 에지를 가지면 그 에지 방향에 일치하는 모드로 선언하여 4Х4 예측 모드와 8Х8 예측 모드를 비교하여 선택하게 된다. 예를 들어, 도 3에 도시된 블록 중에서 왼쪽 상단의 블록에서 AC10>0, AC01>0, 그리고, AC02=0이면, 예측모드결정부(250)는 출력되는 4Х4 블록의 예측 모드를 도 4에 도시된 4Х4 예측 모드 중에서 "7"로 결정하게 된다. 또한, 도 3에 도시된 모든 블록이 4Х4 예측 모드 중에서 "0"으로 결정되면 예측모드결정부(250)는 4개의 블록의 4Х4 예측 모드 "7"로 예측한 결과와 4개의 블록을 하나의 8Х8로 묶어 8Х8 예측모드 "0"으로 예측한 결과와 비교하여 더 나은 성능을 가지는 것으로 예측 모드를 결정한다. 도 3에 도시된 모든 블록이 4Х4 예측 모드 중 "0", "1", "2", "3"으로 결정되는 경우도 동일하다.
상술한 바와 같은 방법에 의해 에지의 방향과 일치되는 방향으로 예측 모드를 결정하면, 인트라 예측에 의해서 차이 값이 크게 존재하는 픽셀 값이 존재할 확률이 낮아지므로 실제 모든 인트라 예측을 해보지 않고도 최적에 가까운 인트라 예측 모드를 설정해 줄 수 있다. 인트라 예측 모드는 예측에 의한 차이 값이 적으면 적을수록 양호한 출력영상을 산출할 수 있다.
도 5는 본 발명에 따른 트랜스코딩 방법의 바람직한 실시예의 수행과정을 도시한 흐름도이다.
도 5를 참조하면, 가변길이디코더(212)는 입력 동영상 스트림을 복호하여 출력한다(S500). 정보추출부(230)는 복호된 블록으로부터 에지 방향을 산출하기 위한 DCT 계수를 추출한다(S510). 이 때, 정보추출부(230)는 DCT 계수 중에서 지그재그 스캔순서로 AC 계수인 AC01, AC10, AC02, 및 AC20만을 추출한다. 에지방향산출부(240)는 추출된 AC 계수의 특성을 이용하여 블록 내의 에지의 방향을 산출한다(S520). 에지는 블록 내에서 존재하는 에지를 의미하며, 에지의 방향은 0°, 90°, 45°, 135°, 67.5°, 112.5° 방향 중 하나로만 선택된다. 예측모드결정부(250)는 산출된 에지의 방향성에 따라서 인트라 예측 모드를 결정한다(S530). 인트라 예측 모드의 효율은 예측에 사용되는 값(Predictor)이 현재 블록의 픽셀 값과 비슷하면 효율이 높게 되므로 예측 모드에 의한 방향이 에지 방향과 일치하게 되면 실제 예측에 사용되는 값과 예측되는 현재 블록의 픽셀 값의 차이가 줄어들므로 효율이 높아진 다. 이러한 성질에 의해 실제 부호화 알고리즘과는 달리 전체 예측 모드에 의한 비트율-왜곡을 구하지 않고 간단한 계산에 의해서 예측 모드를 결정하므로, 트랜스코더(200) 내의 예측모드결정부(250)에서 수행되는 계산의 복잡도를 감소시키는 장점이 있다. 부호화부(270)는 결정된 인트라 예측 모드를 기초로 다운샘플링된 영상을 부호화하여 출력한다(S540).
이상에서 출력이 MPEG-4 Part 10(H.264)이며 가로와 세로 1/2로 다운 샘플링하는 트랜스코더에서 MPEG-4 Part 10(H.264)의 인트라 매크로블록의 부호화 파라미터인 인트라 예측 모드를 결정하는 경우에 대해 설명하였으나, 본 발명서 제시하는 인트라 예측 모드 결정 알고리즘은 해상도감소가 이루어지지 않은 경우에도 적용될 수 있다.
본 발명에 따른 DCT 계수의 특성에 따른 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법은 컴퓨터 프로그램으로 작성 가능하며 칩으로 구현 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보 저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 트랜스코딩 방법을 구현한다. 정보 저장매체는 자기 기록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다. 또한 컴퓨터가 읽을 수 있는 저장매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발 명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
본 발명에 따른 트랜스코더 및 트랜스코딩 방법에 의하면, 동영상 스트림을 저장매체에 알맞은 매체로 저장하기 위해 포맷을 변환하거나 디지털 TV 서비스를 무선 인터넷 방송이나 DMB(Digital Multimedia Broadcasting)서비스로 변환하거나 네트워크의 대역폭에 맞도록 비트율을 조정하기 위해 MPEG-4 Part 10(H.264)으로 트랜스코딩을 수행할 때, 입력 동영상 스트림의 복호화 시 추출된 정보를 기초로 에지의 방향을 선택하고, 선택한 에지 방향에 따라 인트라 예측 모드를 결정함으로써 트랜스코더의 복잡도를 최소화하고 화질을 유지할 수 있다. 또한, 네트워크 게이트웨이 등에서 비트율의 조정이나 포맷변환을 하여 네트워크의 대역에 맞는 서비스를 가능하게 하며, 기존의 MPEG-1,2,4로 부호화된 동영상 컨텐츠를 MPEG-4 Part 10(H.264) 동영상 컨텐츠로 효율적으로 변형할 수 있다.

Claims (12)

  1. 입력 동영상 스트림을 복호하는 복호화부;
    상기 복호화부에 의해 복호된 제1크기의 블록에 대한 DCT 계수를 추출하고, 이 DCT 계수 중에서 AC 계수를 추출하는 정보추출부;
    상기 추출된 AC 계수를 기초로 복호된 상기 제1크기의 블록내에 존재하는 에지의 방향을 결정하는 에지방향산출부;
    상기 산출된 에지방향에 대응하는 예측모드를 결정하는 예측모드결정부; 및
    상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 부호화부를 포함하되,
    상기 에지방향산출부는 상기 추출된 DCT 계수들의 값을 기초로 가로 또는 세로 방향의 에지존재여부를 파악하고, 각각의 DCT 계수들에 대해 파악된 에지방향의 조합에 의해 상기 복호된 제1크기의 블록의 에지방향을 결정하며,
    상기 예측모드결정부는 상기 추출된 DCT 계수들 중에서 지그재그 스캔방향으로 선택된 AC 계수들의 값과 소정의 기준값에 대한 비교결과를 기초로 제2크기의 블록에 대해 소정의 예측방향이 지정된 복수의 제1인트라예측모드 중에서 상기 복호된 제1크기의 블록에 대응하는 예측모드를 결정하는 것을 특징으로 하는 트랜스코더.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서, 상기 AC 계수의 값은 다음의 수학식에 의해 산출되는 것을 특징으로 하는 트랜스코더.
    Figure 112006039998110-pat00004
    .
  6. 제1항에 있어서, 상기 복수의 복호된 제1크기의 블록 각각에 대응하는 상기 제2크기의 예측모드 모두가 상기 제1크기의 블록에 대해 소정의 예측방향이 지정된 복수의 제2인트라예측모드와 예측방향이 동일한 제1인트라예측모드로 구성되는 제1모드그룹에 속하는 예측모드 중에서 하나로 결정되면, 상기 예측모드결정부는 상기 복수개의 복호된 제1크기의 블록을 상기 제1모드그룹에 속하지 않는 상기 제1인트라예측모드 중에서 선택된 예측모드로 예측한 결과와 상기 복수개의 복호된 제1크기의 블록으로 구성되는 제2크기의 블록을 상기 제1모드그룹에 속하는 예측모드 중에서 결정된 예측모드에 대응하는 제2인트라예측모드로 예측한 결과를 비교하여 성능이 우수한 모드를 최종적인 예측모드로 결정하는 것을 특징으로 하는 트랜스코더.
  7. 입력 동영상 스트림을 복호하는 단계;
    상기 복호된 제1크기의 블록에 대한 DCT 계수를 추출하는 단계;
    상기 추출된 DCT 계수들의 값을 기초로 가로 또는 세로 방향의 에지존재여부를 파악하는 단계와, 상기 DCT 계수 각각에 대해 파악된 에지방향의 조합에 의해 상기 복호된 제1크기의 블록의 에지방향을 결정하는 단계를 포함하는, 에지방향 산출단계;
    상기 추출된 DCT 계수들 중에서 지그재그 스캔방향으로 선택된 AC 계수들의 값과 소정의 기준값을 비교하는 단계와, 상기 비교결과를 기초로 제2크기의 블록에 대해 소정의 예측방향이 지정된 복수의 제1인트라예측모드 중에서 상기 복호된 제1크기의 블록에 대응하는 예측모드를 결정하는 단계를 포함하여, 상기 산출된 에지방향에 대응하는 예측모드를 결정하는 단계; 및
    상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 단계를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
  8. 삭제
  9. 삭제
  10. 제7항에 있어서, 상기 AC 계수의 값은 다음의 수학식에 의해 산출되는 것을 특징으로 하는 트랜스코딩 방법.
    Figure 112006039998110-pat00005
    .
  11. 제7항에 있어서, 상기 예측모드결정단계는,
    상기 복수의 복호된 제1크기의 블록 각각에 대응하는 상기 제2크기의 예측모드 모두가 상기 제1크기의 블록에 대해 소정의 예측방향이 지정된 복수의 제2인트라예측모드와 예측방향이 동일한 제1인트라예측모드로 구성되는 제1모드그룹에 속하는지 여부를 확인하는 단계;
    상기 복수의 복호된 제1크기의 블록 각각에 대응하는 상기 제2크기의 예측모드 모두가 상기 제1모드그룹에 속하면, 상기 복수개의 복호된 제1크기의 블록을 상기 제1모드그룹에 속하지 않는 상기 제1인트라예측모드 중에서 선택된 예측모드로 예측한 결과와 상기 복수개의 복호된 제1크기의 블록으로 구성되는 제2크기의 블록을 상기 제1모드그룹에 속하는 예측모드 중에서 결정된 예측모드에 대응하는 제2인트라예측모드로 예측한 결과를 비교하여 성능이 우수한 모드를 최종적인 예측모드로 결정하는 단계;를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
  12. 제7항에 기재된 트랜스코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터 기록매체.
KR1020040056821A 2004-07-21 2004-07-21 Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법 KR100643126B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040056821A KR100643126B1 (ko) 2004-07-21 2004-07-21 Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040056821A KR100643126B1 (ko) 2004-07-21 2004-07-21 Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법

Publications (2)

Publication Number Publication Date
KR20060008527A KR20060008527A (ko) 2006-01-27
KR100643126B1 true KR100643126B1 (ko) 2006-11-10

Family

ID=37119541

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040056821A KR100643126B1 (ko) 2004-07-21 2004-07-21 Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법

Country Status (1)

Country Link
KR (1) KR100643126B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087589A3 (ko) * 2009-01-29 2010-09-23 엘지전자 주식회사 경계 인트라 코딩을 이용한 비디오 신호 처리 방법 및 장치

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750145B1 (ko) * 2005-12-12 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR100739790B1 (ko) * 2006-02-02 2007-07-13 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
KR101380777B1 (ko) * 2008-08-22 2014-04-02 정태우 영상에 포함된 객체를 색인하는 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020008335A (ko) * 2000-07-22 2002-01-30 김형수 움직임 보상 예측 블록의 경계 방향성을 고려한 고압축장치 및 그 방법
KR20040027047A (ko) * 2002-09-27 2004-04-01 삼성전자주식회사 예측 스캐닝을 이용한 영상 부호화/복호화 방법 및 장치
KR20040110755A (ko) * 2003-06-20 2004-12-31 서종수 예측 모드 선택 방법과 그 장치, 그 방법을 이용한 동영상압축 방법과 그 장치를 포함한 동영상 부호화기 및 상기방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 기록매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020008335A (ko) * 2000-07-22 2002-01-30 김형수 움직임 보상 예측 블록의 경계 방향성을 고려한 고압축장치 및 그 방법
KR20040027047A (ko) * 2002-09-27 2004-04-01 삼성전자주식회사 예측 스캐닝을 이용한 영상 부호화/복호화 방법 및 장치
KR20040110755A (ko) * 2003-06-20 2004-12-31 서종수 예측 모드 선택 방법과 그 장치, 그 방법을 이용한 동영상압축 방법과 그 장치를 포함한 동영상 부호화기 및 상기방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 기록매체

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1020040056821 - 639803 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087589A3 (ko) * 2009-01-29 2010-09-23 엘지전자 주식회사 경계 인트라 코딩을 이용한 비디오 신호 처리 방법 및 장치
US9196059B2 (en) 2009-01-29 2015-11-24 Lg Electronics Inc. Method and apparatus for processing video signals using boundary intra coding

Also Published As

Publication number Publication date
KR20060008527A (ko) 2006-01-27

Similar Documents

Publication Publication Date Title
KR101471831B1 (ko) 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램
KR100750136B1 (ko) 영상의 부호화, 복호화 방법 및 장치
KR101246294B1 (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR100850706B1 (ko) 적응적 동영상 부호화 및 복호화 방법과 그 장치
KR100850705B1 (ko) 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
US8311095B2 (en) Method and apparatus for transcoding between hybrid video codec bitstreams
US7933334B2 (en) Image encoder and method thereof, computer program of image encoder, and mobile terminal
KR20190009408A (ko) 영상 부호화/복호화 방법 및 장치
KR20110047697A (ko) 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
KR20110017302A (ko) 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치
KR20030058873A (ko) 움직임 추정 및 모드 결정 장치 및 방법
US8155203B2 (en) Method for transcoding a data stream comprising one or more coded, digitised images
KR100809603B1 (ko) 화소 단위 기반 영상 부호화 및 복호화 장치 및 방법
JP5004180B2 (ja) 動画像符号化装置および復号装置
JP2004215275A (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
KR100643126B1 (ko) Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법
KR20040079084A (ko) 시간적 복잡도를 고려한 적응적 동영상 부호화와 그 장치
KR100508975B1 (ko) 다층 레벨 연속 제거 알고리즘을 이용한 동영상 움직임추정 방법
KR100672958B1 (ko) 해상도 변환모듈과 움직임 예측모듈의 공동 최적화가가능한 트랜스코딩 시스템 및 방법
JP2914607B2 (ja) 画像信号復号化装置
KR100924779B1 (ko) 적응적 동영상 부호화 및 복호화 방법과 그 장치
JP4561701B2 (ja) 動画像符号化装置
CN116980609A (zh) 视频数据处理方法、装置、存储介质及设备
Matsuda et al. A lossless re-encoding scheme for MPEG-1 video

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120903

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131015

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160105

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20171023

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20200107

Year of fee payment: 14