KR20060011281A - Apparatus for converting resolution of image applied to transcoder and method of the same - Google Patents
Apparatus for converting resolution of image applied to transcoder and method of the same Download PDFInfo
- Publication number
- KR20060011281A KR20060011281A KR1020040060035A KR20040060035A KR20060011281A KR 20060011281 A KR20060011281 A KR 20060011281A KR 1020040060035 A KR1020040060035 A KR 1020040060035A KR 20040060035 A KR20040060035 A KR 20040060035A KR 20060011281 A KR20060011281 A KR 20060011281A
- Authority
- KR
- South Korea
- Prior art keywords
- resolution
- size
- image
- transcoder
- image data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000006243 chemical reaction Methods 0.000 claims abstract description 41
- 238000005070 sampling Methods 0.000 claims abstract description 24
- 238000012952 Resampling Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 abstract description 20
- 230000006870 function Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 11
- 230000000750 progressive effect Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000004088 simulation Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101000642671 Homo sapiens Spermatid perinuclear RNA-binding protein Proteins 0.000 description 1
- 102100035935 Spermatid perinuclear RNA-binding protein Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/403—Edge-driven scaling; Edge-based scaling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/10—Selection of transformation methods according to the characteristics of the input images
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
트랜스코더에 적용되는 해상도 변환장치 및 방법이 개시된다. 큐빅 컨볼루션 보간부는 제1해상도를 갖는 제1크기의 복호된 이산 영상데이터를 종단 기울기를 고정된 값으로 만들도록 수정된 큐빅 컨볼루션 보간 함수에 의해 제2해상도를 갖는 제2크기의 연속 영상데이터로 변환한다. 샘플링부는 연속 영상데이터를 소정의 크기변환계수에 의해 재샘플링한다. 본 발명에 따르면, 재건된 영상의 품질을 높일 수 있고, 크기변환과정에서 발생하는 정보손실을 줄일 수 있으며, 임의의 크기변환 계수에 의해 신뢰성있는 해상도 변환이 가능하다.Disclosed are a resolution converting apparatus and method applied to a transcoder. The cubic convolution interpolator is a second size continuous image data having a second resolution by a cubic convolution interpolation function modified to make the terminal gradient a fixed value of the decoded discrete image data of the first size having the first resolution. Convert to The sampling unit resamples the continuous image data by a predetermined size conversion coefficient. According to the present invention, it is possible to increase the quality of the reconstructed image, to reduce information loss generated during the size conversion process, and to perform reliable resolution conversion by an arbitrary size conversion coefficient.
해상도 변환, 큐빅 컨볼루션, 보간, 트랜스코더, MPEGResolution Conversion, Cubic Convolution, Interpolation, Transcoder, MPEG
Description
도 1은 본 발명에 따른 해상도 변환기가 적용된 트랜스코더의 일 실시예의 상세한 구성을 도시한 블록도,1 is a block diagram showing a detailed configuration of an embodiment of a transcoder to which a resolution converter according to the present invention is applied;
도 2는 이용가능한 포맷들을 도시한 도면,2 illustrates the available formats;
도 3 내지 도 5는 각각 1920×1080i에서 720×480i로, 1920×1080i에서 1280×720p로, 그리고, 1280×720p에서 720×480i로 해상도를 변환하는 과정을 도시한 도면,3 to 5 are views illustrating a process of converting a resolution from 1920 × 1080i to 720 × 480i, from 1920 × 1080i to 1280 × 720p, and from 1280 × 720p to 720 × 480i, respectively;
도 6은 본 발명에 따른 해상도 변환장치에 대한 바람직한 실시예의 상세한 구성을 도시한 블록도,6 is a block diagram showing a detailed configuration of a preferred embodiment of a resolution converting apparatus according to the present invention;
도 7은 순차주사포맷의 영상을 해상도가 다른 순차주사포맷의 영상으로 크기변환하는 과정을 도시한 도면,7 is a diagram illustrating a process of converting an image of a progressive scan format into an image of a progressive scan format having different resolutions;
도 8은 비월주사포맷의 영상을 해상도가 다른 비월주사포맷의 영상으로 크기변환하는 과정을 도시한 도면,8 is a diagram illustrating a process of converting an image of an interlaced scan format into an image of an interlaced scan format having different resolutions;
도 9는 하나의 비월주사포맷의 프레임을 두개의 순차주사포맷의 프레임으로 크기변환하는 과정을 도시한 도면,9 is a diagram illustrating a process of converting a frame of one interlaced scan format into a frame of two progressive scan formats;
도 10은 두개의 순차주사포맷의 프레임을 하나의 비월주사포맷의 프레임으로 크기변환하는 과정을 도시한 도면,FIG. 10 is a diagram illustrating a process of resizing two progressive scan format frames to one interlaced scan format frame; FIG.
도 11 및 도 12는 확대 실험에 대한 종래의 해상도 변환기법과 본 발명에 따른 해상도 변환기법의 실험 결과를 도시한 도면, 11 and 12 are diagrams showing experimental results of a conventional resolution converter method for an enlarged experiment and a resolution converter method according to the present invention;
도 13 및 도 14는 각각 "mobile and calendar" 영상과 "flower garden" 영상에 대한 시뮬레이션 결과를 도시한 도면,13 and 14 illustrate simulation results of a "mobile and calendar" image and a "flower garden" image, respectively.
도 15는 도 4 및 도 5에 도시된 해상도 변환기법으로 구성된 혼성 트랜스코더의 성능에 대한 실험결과를 도시한 도면, 그리고,FIG. 15 is a diagram showing experimental results on the performance of a hybrid transcoder composed of the resolution converter method shown in FIGS. 4 and 5;
도 16은 B-spline 필터를 사용하는 트랜스코더의 성능평가결과를 도시한 도면이다. FIG. 16 is a diagram illustrating performance evaluation results of a transcoder using a B-spline filter. FIG.
본 발명은 트랜스코더에 적용되는 해상도 변환장치 및 방법에 관한 것으로, 보다 상세하게는, 트랜스코더에서 다종의 포맷 변환을 위한 변경된 큐빅 컨볼루션 해상도 변환장치에 관한 것이다. The present invention relates to a resolution converting apparatus and method applied to a transcoder, and more particularly, to a modified cubic convolution resolution converting apparatus for converting a variety of formats in a transcoder.
트랜스코딩은 대역폭이 상이한 이종의 네트워크를 통한 다양한 영상 통신에 있어 중요한 기술이다. 비디오 온 디맨드 서버에서 영상이 사전에 부호화되어 저잘될 때 채널특성이 고려되지 않는다. 이러한 사실은 이종의 네트워크를 통해 사전에 부호화된 영상 스트림 전송의 유연성에 있어서의 결여를 낳는다. 이와 같은 문제를 극복하기 위한 효과적인 방식은 사전에 부호화된 MPEG 비트 스트림과 전송 채널 사 이의 정합을 제공하는 트랜스코더를 사용하는 것이다. 예를 들어, 트랜스코더는 입력으로 사전에 높은 비트율로 부호화된 MPEG-2 비트 스트림을 수신하고 새로운 대역폭 제한에 부합하는 낮은 비트율의 다른 비트 스트림을 생성한다. 트랜스코딩은 공간 도메인과 주파수(DCT) 도메인에서의 트랜스코딩의 두가지가 있다. 공간 도메인에서의 처리시 먼저 저장되어 있는 비트 스트림의 압축이 해제되며, 다운 스케일링이 픽셀 도메인 상에서 수행된다. 다음으로, 도출된 데이터가 목표 비트율로 재압축된다. I. Shandbleh와 M. Ghanbari는 시간적, 공간적 해상도의 변환시간을 단축할 수 있는 트랜스코딩 기법을 제시한 바 있다. 이들이 제신한 기법은 DCT 도메인상에서 직접 동작한다. C. Yim과 M, A, Isnardi는 스케일링 비가 2:1인 DCT 도메인의 영상의 크기변경을 위한 효율적인 방법을 제시했다. N. Merhav는 비율이 2:1인 다운 샘플링 모듈을 포함하는 시스템에서 증가없는 기법을 사용하여 압축 영역에서 영상에 대한 근사선형연산을 수행하기 위한 방법을 제안한 바 있다. 이상의 연구에 의하면 트랜스코딩된 영상이 높은 품질을 유지하기 위해 해상도 변환이 상당히 중요함을 알 수 있다. 상술한 바와 같은 기존에 제안된 트랜스코더는 공간 해상도를 ½, ¼ 등과 같은 정수 비율로만 변경할 수 있다는 단점이 존재한다. Transcoding is an important technique for various video communications over heterogeneous networks with different bandwidths. Channel characteristics are not taken into account when an image is pre-encoded and corrected in a video on demand server. This creates a lack of flexibility in the transmission of pre-encoded video streams over heterogeneous networks. An effective way to overcome this problem is to use a transcoder that provides a match between a precoded MPEG bit stream and a transport channel. For example, the transcoder receives, as input, a MPEG-2 bit stream that has been previously encoded at a high bit rate and generates another low bit rate bit stream that meets the new bandwidth limit. There are two types of transcoding: transcoding in the spatial domain and the frequency (DCT) domain. During processing in the spatial domain, the stored bit stream is first decompressed and downscaling is performed on the pixel domain. Next, the derived data is recompressed at the target bit rate. I. Shandbleh and M. Ghanbari have proposed a transcoding technique that can reduce the conversion time of temporal and spatial resolution. Their technique works directly on the DCT domain. C. Yim, M, A, and Isnardi presented an efficient method for resizing images in the DCT domain with a scaling ratio of 2: 1. N. Merhav has proposed a method for performing approximate linear operations on images in the compressed region using an incremental technique in a system that includes a 2: 1 ratio down sampling module. According to the above studies, resolution conversion is very important for maintaining high quality of transcoded images. The conventionally proposed transcoder as described above has a disadvantage in that the spatial resolution can be changed only by an integer ratio such as ½, ¼, and the like.
한편, 해상도 변환 모듈은 스케일러라 불리운다. 일반적인 스케일링은 이산 데이터를 연속모델로 변경하고 이러한 함수를 새로운 샘플링 격자상에서 재샘플링한다. 샘플링 이론에 따르면 원신호는 sinc 함수에 의한 컨볼루션에 의해 샘플로부터 완벽하게 재생될 수 있다. 그러나, sinc 커널은 지나치게 느리게 무한대로 감소하기 때문에 함수를 물리적으로 구현하는 것이 곤란하다. 따라서,bilinear, bicubic, cubic splines, 및 3차 이상의 고차 B-spline 연산 등과 같은 근사법이 제안된 바 있다. 보다 양호한 품질의 크기변환된 영상을 얻기 위해 S. K. Park 등은 큐빅 컨볼루션 보간 파라미터를 처리될 측정한 영상의 주파수 크기에 적응시켰으며, G. Ramponi는 warped distance의 개념을 도입한 공간가변기법을 제안했다.On the other hand, the resolution conversion module is called a scaler. Typical scaling transforms discrete data into a continuous model and resamples these functions on a new sampling grid. According to the sampling theory, the original signal can be perfectly reproduced from the sample by convolution by the sinc function. However, since the sinc kernel is reduced to infinity too slowly, it is difficult to physically implement the function. Therefore, approximation methods such as bilinear, bicubic, cubic splines, and higher-order B-spline operations of more than three orders have been proposed. To obtain better quality scaled images, SK Park et al. Adapted cubic convolution interpolation parameters to the frequency magnitudes of measured images to be processed, and G. Ramponi proposed a spatial variable technique that introduced the concept of warped distance. did.
본 발명이 이루고자 하는 기술적 과제는 영상의 크기를 임의의 비율로 변경할 수 있고 다양한 크기의 영상과 포맷을 지원하는 트랜스코더에 적용되는 해상도 변환장치 및 방법을 제공하는 데 있다.An object of the present invention is to provide a resolution converting apparatus and method applied to a transcoder that can change the size of an image at an arbitrary ratio and support various sizes of images and formats.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 트랜스코더에 적용되는 해상도 변환장치는, 제1해상도를 갖는 제1크기의 복호된 이산 영상데이터를 종단 기울기를 고정된 값으로 만들도록 수정된 큐빅 컨볼루션 보간 함수에 의해 제2해상도를 갖는 제2크기의 연속 영상데이터로 변환하는 큐빅 컨볼루션 보간부; 및 상기 연속 영상데이터를 소정의 크기변환계수에 의해 재샘플링하는 샘플링부;를 구비한다. In order to achieve the above technical problem, a resolution converting apparatus applied to a transcoder according to the present invention includes: a cubic modified to make a terminal gradient a fixed value of decoded discrete image data of a first size having a first resolution; A cubic convolution interpolation unit for converting the second sized continuous image data having the second resolution by a convolution interpolation function; And a sampling unit for resampling the continuous image data by a predetermined size conversion coefficient.
상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 트랜스코더에 적용되는 해상도 변환방법은, 제1해상도를 갖는 제1크기의 복호된 이산 영상데이터를 종단 기울기를 고정된 값으로 만들도록 수정된 큐빅 컨볼루션 보간 함수에 의해 제2해상도를 갖는 제2크기의 연속 영상데이터로 변환하는 단계; 및 상기 연속 영상데이터를 소정의 크기변환계수에 의해 재샘플링하는 단계;를 포함한다.In order to achieve the above technical problem, a resolution converting method applied to a transcoder according to the present invention is modified to make a terminal gradient a fixed value of a first size of decoded discrete image data having a first resolution. Converting into second size continuous image data having a second resolution by a cubic convolution interpolation function; And resampling the continuous image data by a predetermined size conversion coefficient.
이에 의해, 재건된 영상의 품질을 높일 수 있고, 크기변환과정에서 발생하는 정보손실을 줄일 수 있으며, 임의의 크기변환 계수에 의해 신뢰성있는 해상도 변환이 가능하다.As a result, the quality of the reconstructed image can be improved, information loss generated during the size conversion process can be reduced, and the resolution can be reliably converted by an arbitrary size conversion coefficient.
이하에서, 첨부된 도면들을 참조하여 본 발명에 따른 트랜스코더에 적용되는 해상도 변환장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.Hereinafter, exemplary embodiments of a resolution converting apparatus and method applied to a transcoder according to the present invention will be described in detail with reference to the accompanying drawings.
MPEG-2 표준에 정의되어 있는 일반적인 영상 부호화 알고리즘은 다양한 크기의 영상과 포맷을 지원하는 것으로 알려져 있다. 다양한 포맷의 영상을 다루기 위해 본 발명에 따른 해상도 변환기는 신호의 샘플링 위치간의 관계를 고려한다. 특히, 보간 커널의 위상을 정정하기 위해 본 발명에 따른 해상도 변환기에 다음과 같은 변경이 가해진다. The general image encoding algorithm defined in the MPEG-2 standard is known to support various sizes of images and formats. In order to handle images of various formats, the resolution converter according to the present invention considers the relationship between sampling positions of signals. In particular, the following changes are made to the resolution converter according to the invention to correct the phase of the interpolation kernel.
첫째, 종래의 트랜스코딩 시스템이 영상의 크기를 정수비율로 변환하는 반면 본 발명에 따른 해상도 변환기가 적용된 트랜스코딩 시스템은 1920×1080i부터 704×480i까지 임의의 비율로 영상의 크기를 변환한다. 둘째, 다양한 트랜스코딩 케이스를 지원하기 위해 순차주사포맷간, 비월주사포맷간, 순차주사포맷과 비월주사포맷간의 화면변환 등과 같은 다양한 케이스를 위한 재샘플링 위치의 변경기법이 제안된다. First, while the conventional transcoding system converts the size of the image into an integer ratio, the transcoding system to which the resolution converter according to the present invention is applied converts the size of the image at an arbitrary ratio from 1920 × 1080i to 704 × 480i. Second, in order to support various transcoding cases, a resampling position change method for various cases such as sequential scanning format, interlaced scanning format, sequential scanning format and interlaced scanning format conversion, etc. is proposed.
디지털 저장매체와 대역폭이 제한되어 있는 채널을 통한 MPEG-2 비트 스트림의 전송에 있어서 비트율 감소는 저장의 효율성과 전송품질의 보장을 위한 필수적인 과정이다. 이러한 비트율 감소는 트랜스코더에 의해 수행된다. 트랜스코더는 양자화 스텝의 크기와 공간적/시간적 해상도와 같은 코딩 파라미터를 저정하여 비트 율을 감소시킨다. In the transmission of MPEG-2 bit streams over digital storage media and bandwidth-limited channels, bit rate reduction is an essential process to ensure storage efficiency and transmission quality. This bit rate reduction is performed by the transcoder. The transcoder reduces the bit rate by storing coding parameters such as the size of the quantization step and the spatial / temporal resolution.
도 1은 본 발명에 따른 해상도 변환기가 적용된 트랜스코더의 일 실시예의 상세한 구성을 도시한 블록도이다.1 is a block diagram illustrating a detailed configuration of an embodiment of a transcoder to which a resolution converter according to the present invention is applied.
도 1을 참조하면, 본 발명에 따른 해상도 변환기가 적용된 트랜스코더(100)은 디코딩부(110), 해상도 변환부(130), 및 인코딩부(140)를 구비한다.Referring to FIG. 1, a
디코딩부(110)는 입력 동영상 스트림을 복호한다. 디코딩부(110)는 가변길이디코더(Variable Length Decoder : VLD)(112), 역양자화부(114), 역DCT부(116), 프레임메모리(118), 움직임보상부(120), 및 가산부(122)를 갖는다. 입력된 동영상 스트림은 VLD(112)를 통과해 역양자화되어 DCT도메인까지 복호된다. 이러한 데이터는 역DCT부(116)에 의해 역DCT가 수행된 후 움직임보상부(120)에 의한 움직임보상이 이루어진다. 움직임보상부(120)에 의한 보상이 완료된 데이터는 픽셀 도메인상의 데이터이다. 이러한 디코딩부(110)의 구성 및 동작은 기존의 MPEG 동영상을 디코더의 구성과 동일하므로 상세한 설명은 생략한다.The
해상도 변환부(130)는 복호된 영상 데이터의 크기를 변환한다. 크기가 변환된 영상은 인코딩부(140)로 입력되어 다른 비트율을 가진 비트 스트림으로 다시 인코딩된다. The
인코딩부(140)는 해상도가 변환된 동영상을 부호화하여 출력한다. 인코딩부(140)는 DCT/양자화부(142), 가변길이코더(144), 역DCT/역양자화부(146), 프레임메모리(148), 움직임추정부(150), 감산기(152), 및 비트율 조절부(154)를 구비한다.The
해상도 변환부(130)로부터 입력된 영상은 DCT/양자화부(142)로 입력되어 DCT 와 양자화가 수행된 후 가변길이코더(144)에서 컨텍스트 기반의 적응 가변길이코딩(Context-based adaptive variable length coding)된다. 이때 입력영상은 역DCT/역양자화부(146)에도 입력되어 (DCT+Q)-1가 수행된다. (DCT+Q)-1 가 수행된 영상은 선택적으로 블록경계를 스무딩처리를 거친 후 프레임메모리(148)에 저장된다. 움직임추정부(150)는 프레임메모리(158)에 저장되어 있는 참조영상과 입력영상을 가지고 움직임 추정을 수행하여 인코딩할 입력영상이 인터 프레임인가 인트라 프레임인가의 여부에 따라 입력영상에서 참조영상을 뺄 것인가의 여부를 결정하고, 결정내용에 기초하여 선택적으로 참조영상을 감산기(152)에 제공한다. 비트율 조절부(154)는 채널의 상황에 따라 비트율을 조절하여 양자화가 적응적으로 수행되도록 한다. The image input from the
한편, 디코더 측에서 얻어지는 움직임 벡터와 모드 데이터는 인코더 측에서 재사용된다. 많은 트랜스코더에 있어서 입력되는 움직임 벡터의 재사용 기법이 널리 채용되고 있다. 본 발명에 따른 해상도 변환기를 구비한 트랜스코더(100)는 움직임 벡터를 재사용하기 위해 화면의 해상도 변환비율과 동일하게 움직임 벡터도 같은 비율의 크기로 변환시키며, 크기가 변환된 움직임 벡터는 좁은 검색영역(예를 들면, ±2 픽셀) 상에서 정의된다.On the other hand, motion vectors and mode data obtained at the decoder side are reused at the encoder side. Many transcoders are widely used to reuse input motion vectors. The
이하에서는 MPEG-2 MP@HL과 MP@ML에서 SDTV를 포함하는 다양한 영상 스트림을 처리할 수 있는 시스템을 중심으로 설명한다. 이러한 시스템은 MPEG 표준에 정의되어 있는 포맷으로의 변환을 지원한다. MPEG 표준에 정의되어 있는 포맷은 1920×1080i, 1280×720p, 704×480p, 704×480i, 그리고, 640×480p를 포함한다. 도 2 에는 이용가능한 포맷들이 도시되어 있으며, i와 p는 각각 비월주사포맷과 순차주사포맷을 나타낸다. 영상의 해상도는 가로와 세로방향의 비정수형 인자에 의해 변환되며, 따라서 해상도 변환부(130)는 비정수형 비율 변환이 가능하도록 설계되어야 한다. 한편, 종래의 비월주사포맷을 순차주사포맷으로 변환하는 IPC는 단지 세로방향으로 영상의 해상도를 2배 변경하며, 가로 및 세로방향으로 정수 비율로 변환한다. Hereinafter, a description will be given of a system capable of processing various video streams including SDTV in MPEG-2 MP @ HL and MP @ ML. Such a system supports conversion to a format defined in the MPEG standard. Formats defined in the MPEG standard include 1920x1080i, 1280x720p, 704x480p, 704x480i, and 640x480p. 2 shows the available formats, i and p represent interlaced and progressive scan formats, respectively. The resolution of the image is converted by non-integer factors in the horizontal and vertical directions, and therefore, the
도 3 내지 도 5는 각각 1920×1080i에서 720×480i로, 1920×1080i에서 1280×720p로, 그리고, 1280×720p에서 720×480i로 해상도를 변환하는 과정을 도시한 도면이다. 원영상이 비월주사포맷인 경우에 짝수필드와 홀수필드를 생성하기 위해 스플리터가 사용된다. 그리고, 재건된 영상이 비월주사포맷인 경우에 두개의 필드영상으로부터 하나의 프레임을 생성하기 위해 결합기가 사용된다. 도 4에서 해상도 변환기는 1920×1080i에서 1280×720p로 해상도를 변경하며, 이 때, 가로방향으로 영상의 크기는 축소되나 세로방향의 해상도는 증가한다. 따라서, 업/다운 해상도 변환기가 가로방향과 세로방향에 대해 별도로 사용되어야 한다. 도 4에 도시된 변환과정에서는 하나의 i프레임이 두개의 p프레임으로 크기변환되는 반면, 도 5에 도시된 변환과정에서는 두개의 p프레임이 하나의 i프레임으로 변환된다.3 to 5 illustrate a process of converting a resolution from 1920 × 1080i to 720 × 480i, from 1920 × 1080i to 1280 × 720p, and from 1280 × 720p to 720 × 480i, respectively. When the original image is an interlaced scan format, a splitter is used to generate even and odd fields. When the reconstructed image is an interlaced scan format, a combiner is used to generate one frame from two field images. In FIG. 4, the resolution converter changes the resolution from 1920 × 1080i to 1280 × 720p. At this time, the image size is reduced in the horizontal direction but the resolution in the vertical direction is increased. Therefore, up / down resolution converters must be used separately for the transverse and longitudinal directions. In the conversion process illustrated in FIG. 4, one i frame is converted into two p frames, while in the conversion process illustrated in FIG. 5, two p frames are converted into one i frame.
이하에서는 해상도 변환기의 설계에 대해 상세하게 살펴본다. 해상도 변환과정은 원래의 이산 데이터를 연속함수에 적용시키는 단계와 새로운 샘플링 위치에서 이 함수를 재샘플링하는 단계로 구성된다. 동등하게 떨어져 있는 샘플링된 데이터 에 대해 많은 보간 함수들이 다음과 같이 정의될 수 있다.Hereinafter, the design of the resolution converter will be described in detail. The resolution conversion process consists of applying the original discrete data to the continuous function and resampling this function at the new sampling position. Equally Spaced Sampled Data Many interpolation functions can be defined as
여기서, 는 대응하는 보간 함수이고, 는 보간 커널이다. 또한, x와 xk는 각각 연속값과 이산값을 나타낸다. 이와 같은 특징을 갖는 보간함수에는 큐빅 스프라인(cubic spline)과 선형 보간 함수가 있다. 수학식 1에서 xk는 보간 노드이고, ck는 샘플링된 데이터 에 의존하는 파라미터이다. 보간 커널 는 컨볼루션과 유사한 연산에 의해 이산 데이터 을 연속 함수 로 변환한다. here, Is the corresponding interpolation function, Is the interpolation kernel. In addition, x and x k represent a continuous value and a discrete value, respectively. Interpolation functions with these characteristics include cubic splines and linear interpolation functions. In
고전적인 샤논의 샘플링 이론에 따르면, f(x)가 (-π, +π)의 범위에서 대역제한되어 있다면 다음의 식이 충족된다.According to classical Shannon's sampling theory, if f (x) is band-limited in the range of (−π, + π), the following equation is satisfied.
여기서, sinc 함수는 다음과 같이 정의된다.Here, the sinc function is defined as
즉, 수학식 1에서 ck와 β(x)는 각각 와 sinc(x)로 대체된다. 수학적 계산에 있어서, 수학식 2로 표현되는 이상적인 보간 공식은 보간 커널 sinc(x)의 감 소가 느린 비율로 진행되므로 실질적이지 못하다. 따라서, 폴리노미얼 스프라인 보간에 의해 재건하는 것이 유력한 대안이다.That is, c k and β (x) in
가장 실질적인 접근법은 가장 가까운 이웃 픽셀의 소집합을 이용하여 각각의 알려지지 않은 픽셀의 값을 추정하는 것이다. 일례로, 스프라인 함수에 기초한 방법에 있어서 알려진 데이터 샘플들은 거리의 역함수에 따라 결정되는 값에 영향을 준다.The most practical approach is to estimate the value of each unknown pixel using a subset of the nearest neighboring pixels. In one example, in a method based on a spline function, known data samples influence a value determined by the inverse of the distance function.
를 이용가능한 데이터로 가정하고, 를 보간될 값이라 가정한다. 또한, 가장 가까운 이용가능한 픽셀은 좌표상에서 xk와 xk +1에 위치하며, 샘플링 격자의 간격이 이러한 데이터에 대해 하나라고 가정한다. 한편, x, xk, 그리고, xk +1 사이의 거리는 다음식으로 정의된다. Is assumed to be the available data, Let is the value to be interpolated. Also, the nearest available pixel is located at x k and x k +1 on the coordinates, assuming that the spacing of the sampling grid is one for this data. On the other hand, the distance between x, x k , and x k +1 is defined by the following equation.
여기서, 0≤s≤1이고, xk≤x≤xk +1이다. Here, 0 ≦ s ≦ 1 and x k ≦ x ≦ x k +1 .
보간된 픽셀 를 얻기 위해 사용될 수 있는 많은 알고리즘 중에서 가장 간단한 것은 다음의 수학식과 같다.Interpolated pixels The simplest of the many algorithms that can be used to obtain is
보다 복잡하나 보다 효과적인 다른 방법은 bicubic이다. 이러한 접근법에 존재하는 문제는 파형의 종단에서 기울기의 불연속이 재건된 함수에서 크기상의 리플을 낳게된다는 것이다. 이러한 문제는 보간의 종단 기울기를 고정된 값으로 만드는 큐빅 컨볼루션 함수를 생성함으로써 제거될 수 있다. 큐빅 컨볼루션 보간 함수는 다음식으로 표현될 수 있다.Another more complex but more effective method is bicubic. The problem with this approach is that the discontinuity of the slope at the end of the waveform results in magnitude ripple in the reconstructed function. This problem can be eliminated by creating a cubic convolution function that makes the end slope of the interpolation fixed. The cubic convolution interpolation function can be expressed by the following equation.
Rifman과 Bernstein은 α를 -1로 설정하였으며, 이에 의해 x=1에서 sinc(x) 함수와 마찬가지로 β(x)가 동일한 기울기인 -1이 된다. Keys는 α=-½로 설정할 것을 제안했으며, 이에 의해 멱급수의 관점에서 보간 함수가 원래의 샘플링되지 않은 영상에 상당히 근접한다. 수학식 7에서 β(x)는 (-2, 2) 구간을 제외하고 0이므로, 수학식 4와 수학식 7을 수학식 1에 대입하면 다음과 같이 정리된다. Rifman and Bernstein set α to -1, so that, at x = 1, β (x) has the same slope -1, as with the sinc (x) function. Keys suggested setting α = −½, whereby the interpolation function is very close to the original unsampled image in terms of power series. In
여기서, xk≤x≤xk+1, s=x-xk, 0≤s≤1이며, 보간 함수는 보간 노드에서 샘플 링된 데이터와 일치한다. 즉, 이다. 나아가, 이들은 임의의 계수(정수, 유리수, 또는 무리수)에 의한 보간에 사용될 수 있다. Keys가 설정한 바와 같이 α=-½이라 하면, 수학식 8은 다음과 같이 변경된다.Here, x k ≤ x ≤ x k + 1 , s = xx k , 0 ≤ s ≤ 1 , and the interpolation function matches the data sampled at the interpolation node. In other words, to be. Furthermore, they can be used for interpolation by any coefficient (integer, rational, or irrational). If? =-½ as set by Keys, Equation 8 is changed as follows.
수학식 7에서 계수 α는 가장 가시적인 보간을 얻기 위한 조절 파라미터로 사용될 수 있다. Park 등은 파라미터 α를 처리될 특정한 영상의 주파수에 적응시켰다. In
도 6은 본 발명에 따른 해상도 변환기에 대한 바람직한 실시예의 상세한 구성을 도시한 블록도이다. 본 발명에 따른 해상도 변환기는 bilinear 보간기보다 성능이 양호하고 B-spline보다 간단하기 때문에 수학식 9에 의해 정의되는 큐빅 컨볼루션 변환기를 이용한다. 6 is a block diagram showing a detailed configuration of a preferred embodiment of a resolution converter according to the present invention. The resolution converter according to the present invention uses a cubic convolution converter defined by
도 6을 참조하면, 본 발명에 따른 해상도 변환기(600)는 큐빅 컨볼루션 보간부(610) 및 샘플링부(620)를 구비한다. Referring to FIG. 6, the
큐빅 컨볼루션 보간부(610)는 연속함수 를 생성하며, 샘플링부(620)는 새로운 격자 yn상에서 연속함수 를 재샘플링한다. 본 발명에 따른 해상도 변환기(600)는 이산 데이터 를 다른 해상도를 갖는 크기변환된 데이터 으 로 변환한다. δ>1인 경우에 크기변환된 데이터 는 원래의 데이터 가 확대된 데이터에 해당한다. 이 때, δ는 다음식과 같이 정의된다.The
여기서, M과 N은 각각 원영상의 크기와 크기변환된 신호이다.Here, M and N are the size of the original image and the converted signal, respectively.
보간된 연속 함수 는 수학식 9에 의해 계산된다. 크기변환은 연속함수 를 크기변환 계수 δ로 재샘플링하는 과정이며, 다음식과 같이 표현된다.Interpolated Continuous Function Is calculated by equation (9). Scaling is a continuous function Is a process of resampling by the size conversion coefficient δ and is expressed as follows.
xk≤yn≤xk +1이고, s=yn-xk일 때, 수학식 11은 다음과 같이 변환된다. k x n ≤y ≤x and k +1, s = y n -x k one time, Equation 11 is converted as follows.
이와 같은 기법을 그레이 레벨 영상과 같은 다차원 데이터에 적용하는 것은 간단하다. 도 6에 도시된 해상도 변환기에 의한 크기변환과정은 각각의 축에 따라 개별적으로 적용될 수 있다. 즉, 가로축에 대해 크기변환을 수행한 후 세로축에 대해 크기변환을 수행할 수 있다. It is simple to apply this technique to multidimensional data such as gray level images. The size conversion process by the resolution converter shown in FIG. 6 may be applied separately along each axis. That is, the size transformation may be performed on the vertical axis after the size transformation on the horizontal axis.
본 발명에 따른 해상도 변환기는 도 7에 도시된 바와 같이 순차주사포맷의 영상을 해상도가 다른 순차주사포맷의 영상으로 크기변환하는데 이용될 수 있다. 도 7에서 는 각각 원영상의 폭과 높이, 그리고 크기변환된 영상의 폭과 높이를 의미한다. 가로방향으로의 재심플링은 를 만족하는 크기변환 계수 에 의해 수행되며, 이를 수식으로 표현하면 다음과 같다.The resolution converter according to the present invention may be used to convert the size of the progressive scan format to the image of the progressive scan format having different resolution as shown in FIG. In Figure 7 Denotes the width and height of the original image and the width and height of the resized image, respectively. Re-sampling in landscape It is performed by the size conversion factor that satisfies the equation.
여기서, 와 은 각각 영상의 가로방향으로 주어진 이산 데이터와 크기변환된 데이터이다. 그리고, yn은 재샘플링 위치이다.here, Wow Are discrete data and size-converted data given in the horizontal direction of the image, respectively. And y n is the resampling position.
한편, 세로방향으로의 크기변환은 다음의 수학식에 의해 수행된다.On the other hand, the size conversion in the vertical direction is performed by the following equation.
여기서, 와 은 각각 영상의 세로방향으로 주어진 이산 데이터와 크기변환된 데이터이다. 그리고, yn은 재샘플링 위치이다.here, Wow Are discrete data and size-converted data given in the vertical direction of the image, respectively. And y n is the resampling position.
또한, 본 발명에 따른 해상도 변환기가 비월주사포맷의 영상에 적용될 때, 수학식 12 및 수학식 15에 따른 연산은 프레임 영상이 두개의 필드(즉, 짝수필드 와 홀수필드 )로 분리된 후에 수행된다. 본 발명에 따른 해상도 변환기는 도 8에 도시된 바와 같이 비월주사포맷의 영상을 해상도가 다른 비월주사포맷의 영상으로 크기변환하는 데 이용될 수 있다. 도 8에서 는 각각 짝수 및 홀수필드에 대한 가로 및 세로방향의 데이터이다. 가로방향으로의 재심플링은 다음의 수학식에 의해 수행된다.In addition, when the resolution converter according to the present invention is applied to an image of an interlaced scan format, the calculation according to
도 8에 도시된 바와 같이 크기변경된 필드들이 결합된다. 한편, 세로방향으로의 재심플링은 다음의 수학식에 의해 수행된다.The resized fields are combined as shown in FIG. On the other hand, the resampling in the longitudinal direction is performed by the following equation.
다음으로 결합된 세로방향 데이터는 다음의 식에 의해 표현된다.The combined longitudinal data is then represented by the following equation.
수학식 21에서 에 대한 샘플링 위치 는 원프레임 데이터 에서 에 대응된다. 그리고, 에 대한 샘플링 위치 는 원프레임 데이터 에서 에 대응된다. 이는 원프레임 데이터 에서의 재샘플링 위치가 임을 의미하며, 이는 곧 재샘플링 위치가 동일한 간격이 아님을 의미한다. 따라서, 세로방향의 데이터가 크기변경될 때 재샘플링 위치는 불규칙성을 보상하기 위해 다음과 같이 수정되어야 한다.In Equation 21 Sampling location for Is one-frame data in Corresponds to. And, Sampling location for Is one-frame data in Corresponds to. This is one frame data The resampling position in This means that the resampling positions are not equally spaced. Therefore, the resampling position should be modified as follows to compensate for irregularities when the longitudinal data is resized.
여기서, 는 천이된 샘플링 격자이다.here, Is the transitioned sampling grid.
원프레임 영상의 세로축에서 볼 때, 수학식 22와 수학식 23의 샘플링 위치는 가 된다. 샘플링 위치 는 , 즉, 프레임 영상의 세로방향으로 동일하게 이격된 점들인 를 구성 하므로, d는 다음의 수학식과 같이 정의된다.In the vertical axis of the one-frame image, the sampling positions of
따라서, 홀수필드의 세로방향으로 샘플링 격자는 수학식 24의 d와 같이 수정되어야 한다. 결합된 가로방향 데이터는 다음식에 의해 얻어진다.Therefore, the sampling grid in the longitudinal direction of the odd field should be modified as shown in equation (24). The combined transverse data is obtained by the following equation.
또한, 본 발명에 따른 해상도 변환기는 도 9에 도시된 바와 같이 하나의 비월주사포맷의 프레임을 두개의 순차주사포맷의 프레임으로 크기변환하기 위해 사용된다. 이 때, 결합연산은 수행되지 않는다. 크기변환은 짝수 및 홀수필드에 대해 다음의 수학식들에 의해 수행된다.In addition, the resolution converter according to the present invention is used to resize one interlaced frame into two frames of progressive scan format as shown in FIG. At this time, the binding operation is not performed. The size conversion is performed by the following equations for even and odd fields.
각각의 필드 데이터에 있어서, 수학식 27과 수학식 29의 샘플링 위치는 원프레임 데이터 이 세로축에서 볼 때 과 에 대응된다. 이 경우 결합 연산이 수행되지 않기 때문에 대응되는 위치 와 는 가 되어야 한다. 따라서, d는 다음의 수학식과 같이 정의된다.In each field data, the sampling positions of Equations 27 and 29 are one-frame data. In this vertical axis and Corresponds to. In this case, the corresponding position because no join operation is performed. Wow Is Should be Therefore, d is defined as follows.
또한, 본 발명에 따른 해상도 변환기는 도 10에 도시된 바와 같이 두개의 순차주사포맷의 프레임을 하나의 비월주사포맷의 프레임으로 크기변환하기 위해 사용된다. 이 때, 스플리터는 사용되지 않는다. 이 경우 크기변환은 다음의 수학식들에 의해 수행된다.In addition, a resolution converter according to the present invention is used to resize two progressive scan frames to one interlaced frame as shown in FIG. At this time, the splitter is not used. In this case, the size conversion is performed by the following equations.
수학식 32와 수학식 34의 샘플링 위치 는 원래의 순차주사포맷의 프레임의 세로축에서 볼 때 를 구성한다. 따라서, d는 다음의 수학식과 같이 정의된다.Sampling Positions in Equations 32 and 34 Is viewed from the vertical axis of the frame in the original progressive scan format. Configure Therefore, d is defined as follows.
종래의 해상도 변환기법과 본 발명에 따른 해상도 변환기법의 연산량은 수학 식 11 또는 23으로 표현된 샘플링 위치 yn의 결정, 수학식 12의 위상 S의 계산, 수학식 9에 표현된 필터 커널의 구축, 수학식 9에 따른 FIR 필터링 등에 달려있다. yn의 산출과정에서 샘플값 을 얻기 위해 수학식 11에 따른 종래의 해상도 변환기법에서는 한번의 곱셈이 수행되어져야 한다. 한편, 본 발명에 따른 해상도 변환기법에서 수학식 23의 yn을 얻기 위해 한번의 곱셈과 한번의 덧셈이 요구된다. yn의 산출을 제외하면 s의 계산, 필터 커널의 생성, 및 필터링의 수행을 포함하는 다른 단계에서는 종래의 해상도 변환기법과 본 발명에 따른 해상도 변환기법이 동일한 복잡성을 갖는다. 다음의 표에는 수학식 9, 수학식 11, 수학식 12, 수학식 22, 및 수학식 23에 의해 샘플 를 얻기 위해 요구되는 수학적 복잡도가 기재되어 있다.The calculation amount of the conventional resolution converter method and the resolution converter method according to the present invention includes the determination of the sampling position y n represented by
크기변환된 영상의 크기가 라 하면, 영상의 크기변환에 대한 전체 복잡도는 다음의 식에 의해 계산된다.The size of the resized image In this case, the overall complexity of the image size conversion is calculated by the following equation.
이는 본 발명에 따른 해상도 변환기법이 종래의 해상도 변환기법에 비해 에 더해 추가적인 덧셈연산이 필요함을 의미한다. 곱셈연산(P)은 덧셈연산(A)보다 훨씬 긴 CPU 시간을 소모하므로, 덧셈연산에 의한 복잡성의 증가는 중요성이 떨어진다.The resolution converter method according to the present invention Compared to the conventional resolution converter method In addition, this means that additional addition operations are required. Since the multiplication operation P consumes much longer CPU time than the addition operation A, the increase in complexity by the addition operation is less important.
본 발명에 따른 해상도 변환기법의 성능을 평가하기 위해 실제 영상을 사용한 컴퓨터 시뮬레이션이 수행되었다. "mobile and calender" 영상, "flewer garden" 영상, 그리고, "susie" 영상이 실험에 사용되었다. 본 발명에 따른 해상도 변환기법에 대해 객관적인 평가를 얻기 위해 연속적인 크기변환으로 초래되는 정보손실양을 점검하였다. 정보손실을 산출하기 위해 PSNR(Peak-to-Peak Signal to Noise Ratio), SNR(Signal to Noise Ratio), MSE(Mean Squared Error) 등과 같은 다양한 기준이 고려될 수 있다. 이 가운데 PSNR과 MSE가 기존의 논문에서 사용된 바 있다. 따라서, 본 실험에서 정보손실을 산출하기 위한 기준으로 PSNR과 MSE를 사용한다. PSNR은 도 12, 도 14, 도 15, 및 도 16에 도시된 다른 컴퓨터 시뮬레이션에 대한 기준으로 적용된다. Computer simulations using real images were performed to evaluate the performance of the resolution converter method according to the present invention. "mobile and calender" images, "flewer garden" images, and "susie" images were used in the experiment. In order to obtain an objective evaluation of the resolution converter method according to the present invention, the amount of information loss caused by continuous size conversion was checked. Various criteria such as peak-to-peak signal to noise ratio (PSNR), signal to noise ratio (SNR), mean squared error (MSE), etc. may be considered to calculate information loss. Among these, PSNR and MSE have been used in previous papers. Therefore, PSNR and MSE are used as criteria for calculating information loss in this experiment. PSNR is applied as a reference for the other computer simulations shown in FIGS. 12, 14, 15, and 16.
실험 영상은 저역통과 필터링된 후 종래의 해상도 변환기법 및 본 발명에 따른 해상도 변환기법을 각각 사용하여 반으로 축소된다. 다음으로, 원영상크기를 복 원하기 위해 가로 및 세로방향으로 계수 δ=2에 의한 보간이 수행된다. 다음의 표에는 "mobile and calender" 영상, "flewer garden" 영상, 그리고, "susie" 영상을 실험 영상으로 사용하여 원영상에 대해 산출된 PSNR과 MSE가 기재되어 있다.The experimental images are lowpass filtered and then reduced in half using the conventional resolution converter method and the resolution converter method according to the present invention, respectively. Next, interpolation by the coefficient δ = 2 is performed in the horizontal and vertical directions to restore the original image size. The following table lists the PSNR and MSE calculated for the original image using the "mobile and calender" image, the "flewer garden" image, and the "susie" image as the experimental image.
표 2를 참조하면, 본 발명에 따른 해상도 변환기법에 의해 보간된 영상의 PSNR은 종래의 해상도 변환기법에 의해 확대된 영상의 PSNR보다 크다. 또 다른 실험에서 실험 영상은 490×350i 영상으로 축소된 후 원영상의 크기를 복원하기 위해 크기변환이 수행된다. 여러가지 경우에 본 발명에 따른 해상도 변환기법이 종래의 해상도 변환기법보다 우수한 성능을 보였다. "mobile and calendar" 영상에 대한 실험의 PSNR의 경향은 "flower garden" 영상과 "susie" 영상에 대한 시뮬레이션에서도 반복된다. 이는 종래의 해상도 변환기법이 관계정보에 관심을 두지 않은 반면, 본 발명에 따른 해상도 변환기법의 보간 커널이 크기변환된 영상과 원영상의 포맷 사이의 관계에 따라 수정되었다는 사실에 기인한다. 이러한 실험 결과는 본 발명에 따른 해상도 변환 알고리즘이 종래의 보간기법과 비교할 때 정보손실의 최 소화의 측면에서 상당한 개선이 있음을 의미한다. 따라서, 본 발명에 따른 해상도 변환기법이 영상 해상도의 크기변환에 있어서 상당히 효과적임을 인정할 수 있다.Referring to Table 2, the PSNR of the image interpolated by the resolution converter method according to the present invention is larger than the PSNR of the image enlarged by the conventional resolution converter method. In another experiment, the experimental image is reduced to a 490 × 350i image, and then the size conversion is performed to restore the original image size. In many cases, the resolution converter method according to the present invention showed better performance than the conventional resolution converter method. The PSNR trend in experiments for "mobile and calendar" images is repeated in simulations for "flower garden" and "susie" images. This is due to the fact that the conventional resolution converter method is not concerned with the relational information, while the interpolation kernel of the resolution converter method according to the present invention has been modified according to the relationship between the format of the sized picture and the original picture. These experimental results indicate that the resolution conversion algorithm according to the present invention has a significant improvement in terms of minimizing information loss when compared with the conventional interpolation technique. Accordingly, it can be appreciated that the resolution converter method according to the present invention is quite effective in the size conversion of the image resolution.
본 발명에 따른 해상도 변환기법의 질적 평가를 보여주기 위한 다른 시뮬레이션에 있어서 확대 실험에 대한 종래의 해상도 변환기법과 본 발명에 따른 해상도 변환기법의 실험 결과가 도 11 및 도 12에 도시되어 있다. 크기변환 비율은 5.7이며, 결과 영상은 순차주사포맷의 영상이다. 도 11 및 도 12에는 "mobile and calendar" 영상에서 담장과 말의 잡음 영역이 나타나있다. 결과 영상을 비교하기 위해 네 개의 연속적인 그림이 하나의 영상으로 결합된다. 도면에는 차이를 강조하기 위해 몇개의 가로선이 부가되어 있다. 종래의 해상도 변환기법에 의한 확대된 영상의 가로선은 수직방향으로 일치하지 않는 반면, 본 발명에 따른 해상도 변환기법은 크기변환된 영상이 데이터가 수직으로 규칙적이 되도록 영상을 생성한다. In other simulations for showing qualitative evaluation of the resolution converter method according to the present invention, experimental results of the conventional resolution converter method for the enlargement experiment and the resolution converter method according to the present invention are shown in FIGS. 11 and 12. The size conversion ratio is 5.7, and the resulting image is a sequential scan format. 11 and 12 illustrate noise areas of fences and horses in "mobile and calendar" images. Four consecutive pictures are combined into one image to compare the resulting images. Several horizontal lines are added in the figure to emphasize the differences. Whereas the horizontal lines of the enlarged image by the conventional resolution converter method do not coincide in the vertical direction, the resolution converter method according to the present invention generates an image such that the size-converted image is vertically regular in data.
트랜스코딩에서 본 발명에 따른 해상도 변환기법의 유용성을 점검하기 위해 도 1에 도시된 트랜스코더의 성능을 평가하였다. 시뮬레이션에 사용된 비디오 코덱은 MPEG-2 MP@ML이다. 원래의 영상 시퀀스는 비트율 RO(=15M 또는 10M bps)로 코딩되며, 영상의 크기는 704×480i이다. 비트 스트림이 디코딩된 후 영상 시퀀스는 480×336i 영상으로 크기변환된다. 그리고, 크기변환된 영상은 비트율 RT(=10M 또는 5M bps)로 트랜스코딩된다. 이러한 시뮬레이션은 도 3에 도시된 바와 같은 비월주사포맷의 프레임을 다른 비원주사포맷의 프레임으로 변환하는 과정중의 하나이다. SPNR에 의해 영상 품질을 평가하기 위해 크기변환 과정이 704×480i의 크기를 갖는 원영상의 복원에 이용된다. 도 13 및 도 14에는 각각 "mobile and calendar" 영상과 "flower garden" 영상에 대한 시뮬레이션 결과가 도시되어 있다. 도 13 및 도 14를 참조하면, 본 발명에 따른 해상도 변환기법은 종래의 해상도 변환기법에 비해 각각의 영상에 대해 평균적으로 0.7㏈ 및 0.8㏈ 양호한 PSNR을 낳는다.In order to check the usefulness of the resolution converter method according to the invention in transcoding, the performance of the transcoder shown in FIG. 1 was evaluated. The video codec used for the simulation is MPEG-2 MP @ ML. The original image sequence is coded at a bit rate R 0 (= 15M or 10M bps) and the size of the image is 704 × 480i. After the bit stream is decoded, the video sequence is resized to a 480x336i video. The scaled image is then transcoded at a bit rate R T (= 10M or 5M bps). This simulation is one of the processes of converting a frame of an interlaced scan format as shown in FIG. 3 into a frame of another non-circular scan format. In order to evaluate image quality by SPNR, a size conversion process is used for reconstruction of an original image having a size of 704 × 480i. 13 and 14 show simulation results of the "mobile and calendar" image and the "flower garden" image, respectively. 13 and 14, the resolution converter method according to the present invention produces an average PSNR of 0.7 dB and 0.8 dB on average for each image as compared with the conventional resolution converter method.
도 4 및 도 5에 도시된 해상도 변환과정을 갖는 트랜스코더의 성능을 평가하기 위해 도 4에 도시된 비월주사포맷의 영상을 순차주사포맷의 영상으로 트랜스코딩하는 과정과 도 5에 도시된 순차주사포맷의 영상을 비월주사포맷의 영상으로 트랜스코딩하는 과정을 하나로 결합한다. 원래의 영상 시퀀스("mobile and calendar" 영상)는 비트율 RO=15M bps로 코딩되며, 영상의 크기는 704×480i이다. 인코딩된 비트 스트림은 비트율 R1=10M bps인 480×360p 비트 스트림으로 트랜스코딩된 후 트랜스코딩된 480×360p의 영상은 비트율 R2=5M bps인 704×480i의 영상으로 재차 트랜스코딩된다. 도 15에는 도 4 및 도 5에 도시된 해상도 변환기법으로 구성된 혼성 트랜스코더의 성능에 대한 실험결과가 도시되어 있다. 도 15를 참조하면, 본 발명에 따른 해상도 변환기법은 종래의 해상도 변환기법에 비해 평균적으로 0.7㏈ 및 1.2㏈ 양호한 PSNR을 낳는다.In order to evaluate the performance of the transcoder having the resolution conversion process shown in FIGS. 4 and 5, the process of transcoding the image of the interlaced scan format shown in FIG. It combines the process of transcoding an image in a format into an interlaced image. The original image sequence ( "mobile and calendar" picture) is coded with a bit rate R O = 15M bps, the size of the image is 704 × 480i. The encoded bit stream is transcoded into a 480 × 360p bit stream having a bit rate R 1 = 10M bps, and then the transcoded 480 × 360p picture is transcoded again into a 704 × 480i picture having a bit rate R 2 = 5M bps. FIG. 15 shows experimental results of the performance of the hybrid transcoder composed of the resolution converter method shown in FIGS. 4 and 5. Referring to Fig. 15, the resolution converter method according to the present invention produces an average PSNR of 0.7 mW and 1.2 mW on average compared with the conventional resolution converter method.
본 발명에 따른 위상 변환기법이 B-spline 필터에 적용될 수 있음을 보여주기 위해 B-spline 필터를 사용하는 트랜스코더의 성능평가결과가 도 16에 도시되어 있다. 다른 시뮬레이션 조건이 도 15에 도시된 바와 같이 유지될 때 B-spline 필터는 공간적인 해상도 변환기로 사용된다. 시뮬레이션 결과에 따르면 본 발명에 따른 해상도 변환기법은 종래의 해상도 변환기법보다 양호한 품질을 갖는 비트 스트림을 생성한다는 것을 알 수 있다. 이는 본 발명에 따른 해상도 변환기법이 영상 시퀀스의 비트율뿐만 아니라 공간적인 해상도를 변경하는 트랜스코더에 유용하게 적용될 수 있음을 의미한다.The performance evaluation of the transcoder using the B-spline filter to show that the phase shifter method according to the present invention can be applied to the B-spline filter is shown in FIG. The B-spline filter is used as a spatial resolution converter when other simulation conditions are maintained as shown in FIG. According to the simulation results, it can be seen that the resolution converter method according to the present invention produces a bit stream having a better quality than the conventional resolution converter method. This means that the resolution converter method according to the present invention can be usefully applied to a transcoder for changing the spatial resolution as well as the bit rate of an image sequence.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific preferred embodiments described above, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.
본 발명에 따른 해상도 변환장치 및 방법에 의하면, 수정된 큐빅 컨볼루션 해상도 변환기에 의해 MPEG 표준에 정의되어 있는 다양한 영상의 크기를 변경함으 로써 재건된 영상의 품질을 높일 수 있고, 크기변환과정에서 발생하는 정보손실을 줄일 수 있다. 또한, 임의의 크기변환 계수에 의해 신뢰성있는 해상도 변환이 가능하다.According to the resolution converting apparatus and method according to the present invention, the quality of the reconstructed image can be improved by changing the size of various images defined in the MPEG standard by the modified cubic convolution resolution converter, and generated during the size conversion process. Information loss can be reduced. In addition, a reliable resolution conversion is possible by an arbitrary size conversion factor.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040060035A KR20060011281A (en) | 2004-07-30 | 2004-07-30 | Apparatus for converting resolution of image applied to transcoder and method of the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040060035A KR20060011281A (en) | 2004-07-30 | 2004-07-30 | Apparatus for converting resolution of image applied to transcoder and method of the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060011281A true KR20060011281A (en) | 2006-02-03 |
Family
ID=37121348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040060035A KR20060011281A (en) | 2004-07-30 | 2004-07-30 | Apparatus for converting resolution of image applied to transcoder and method of the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20060011281A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101019010B1 (en) * | 2006-04-03 | 2011-03-04 | 퀄컴 인코포레이티드 | Preprocessor method and apparatus |
US8654848B2 (en) | 2005-10-17 | 2014-02-18 | Qualcomm Incorporated | Method and apparatus for shot detection in video streaming |
US8780957B2 (en) | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
US8879856B2 (en) | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Content driven transcoder that orchestrates multimedia transcoding using content information |
US8948260B2 (en) | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US9131164B2 (en) | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
US9197912B2 (en) | 2005-03-10 | 2015-11-24 | Qualcomm Incorporated | Content classification for multimedia processing |
KR20150135637A (en) * | 2014-05-22 | 2015-12-03 | 주식회사 칩스앤미디어 | An appratus for scaling a resoltion using decoding information and a method thereof |
KR20160091102A (en) * | 2015-01-23 | 2016-08-02 | 한국외국어대학교 연구산학협력단 | Apparatus and method for high speed interleaving of signals |
-
2004
- 2004-07-30 KR KR1020040060035A patent/KR20060011281A/en active IP Right Grant
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8780957B2 (en) | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
US9197912B2 (en) | 2005-03-10 | 2015-11-24 | Qualcomm Incorporated | Content classification for multimedia processing |
US9071822B2 (en) | 2005-09-27 | 2015-06-30 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
US9113147B2 (en) | 2005-09-27 | 2015-08-18 | Qualcomm Incorporated | Scalability techniques based on content information |
US9088776B2 (en) | 2005-09-27 | 2015-07-21 | Qualcomm Incorporated | Scalability techniques based on content information |
US8879856B2 (en) | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Content driven transcoder that orchestrates multimedia transcoding using content information |
US8879857B2 (en) | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Redundant data encoding methods and device |
US8879635B2 (en) | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
US8948260B2 (en) | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US8654848B2 (en) | 2005-10-17 | 2014-02-18 | Qualcomm Incorporated | Method and apparatus for shot detection in video streaming |
KR101019010B1 (en) * | 2006-04-03 | 2011-03-04 | 퀄컴 인코포레이티드 | Preprocessor method and apparatus |
KR101377370B1 (en) * | 2006-04-03 | 2014-03-26 | 퀄컴 인코포레이티드 | Preprocessor method and apparatus |
KR101373896B1 (en) * | 2006-04-03 | 2014-03-12 | 퀄컴 인코포레이티드 | Preprocessor method and apparatus |
US9131164B2 (en) | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
KR20150135637A (en) * | 2014-05-22 | 2015-12-03 | 주식회사 칩스앤미디어 | An appratus for scaling a resoltion using decoding information and a method thereof |
KR20160091102A (en) * | 2015-01-23 | 2016-08-02 | 한국외국어대학교 연구산학협력단 | Apparatus and method for high speed interleaving of signals |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9547886B2 (en) | Method and apparatus for performing interpolation based on transform and inverse transform | |
RU2456761C1 (en) | Operations of repeated digitisation and variation of image size for video coding and decoding with alternating defining power | |
US6243421B1 (en) | Apparatus for decoding coded video data with reduced memory size | |
US7379496B2 (en) | Multi-resolution video coding and decoding | |
US6072834A (en) | Scalable encoding apparatus and method with improved function of energy compensation/inverse compensation | |
JP3385077B2 (en) | Motion vector detection device | |
US7899120B2 (en) | Method for selecting output motion vector based on motion vector refinement and transcoder using the same | |
US20060280372A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
JP2006246474A (en) | Prediction image generation method and apparatus using single coding mode for all color components, and image and video encoding and decoding methods and apparatuses using the same | |
US7903731B2 (en) | Methods and transcoders that estimate an output macroblock and motion vector for video transcoding | |
KR20030090308A (en) | Method for adaptive encoding and decoding motion image and apparatus thereof | |
EP2368368B1 (en) | Method for browsing video streams | |
KR20060011281A (en) | Apparatus for converting resolution of image applied to transcoder and method of the same | |
KR20050049964A (en) | Apparatus for high speed resolution changing of compressed digital video | |
JP4776505B2 (en) | Image encoding device, image decoding device, and image processing program | |
JP2006511138A (en) | Digital filter with spatial scalability | |
JP2016208281A (en) | Video encoding device, video decoding device, video encoding method, video decoding method, video encoding program and video decoding program | |
JP4559811B2 (en) | Information processing apparatus and information processing method | |
JP4762486B2 (en) | Multi-resolution video encoding and decoding | |
EP0955609B1 (en) | Decoding compressed image information | |
JP3403724B2 (en) | Image reproducing apparatus and method | |
JP2000115765A (en) | Video signal coder | |
KR100672958B1 (en) | Transcoding system and method capable of optimizing resolution converting module and motion estimating module commonly | |
WO2006132509A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
Chau et al. | Motion vector re-estimation for fractional-scale video transcoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
NORF | Unpaid initial registration fee |