Nothing Special   »   [go: up one dir, main page]

KR102271118B1 - Apparatus and method for recording video data - Google Patents

Apparatus and method for recording video data Download PDF

Info

Publication number
KR102271118B1
KR102271118B1 KR1020200008843A KR20200008843A KR102271118B1 KR 102271118 B1 KR102271118 B1 KR 102271118B1 KR 1020200008843 A KR1020200008843 A KR 1020200008843A KR 20200008843 A KR20200008843 A KR 20200008843A KR 102271118 B1 KR102271118 B1 KR 102271118B1
Authority
KR
South Korea
Prior art keywords
bitstream
frame
idr
frames
update
Prior art date
Application number
KR1020200008843A
Other languages
Korean (ko)
Inventor
이선영
Original Assignee
주식회사 아틴스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아틴스 filed Critical 주식회사 아틴스
Priority to KR1020200008843A priority Critical patent/KR102271118B1/en
Priority to PCT/KR2020/013182 priority patent/WO2021149892A1/en
Application granted granted Critical
Publication of KR102271118B1 publication Critical patent/KR102271118B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

An image storing device and a method thereof are disclosed. The image storing device includes: a transcoder which transcodes at least a portion of a first bitstream provided from a video transmitter and processes the same into a second bitstream having an updated IDR period of a time length different from that of the IDR period of the first bitstream; and a storage unit configured to store the second bitstream. The image storing device can significantly reduce the construction cost of a CCTV system.

Description

영상 저장 장치 및 방법{Apparatus and method for recording video data}Video storage device and method {Apparatus and method for recording video data}

본 발명은 영상 저장 장치 및 방법에 관한 것이다. The present invention relates to an image storage device and method.

최근 정부 및 공공기관 등에 영상 감시 및 보안 목적으로 CCTV 시스템 설치가 증가하고 있으며, 이러한 CCTV 시스템은 교통량 수집이나 사회 안전망 확보를 위해 교차로, 주택가 골목 등 다양한 위치까지 확대 설치되고 있다.Recently, the installation of CCTV systems for the purpose of video surveillance and security is increasing in government and public institutions, and these CCTV systems are being expanded to various locations such as intersections and alleys in residential areas to collect traffic volume or secure a social safety net.

일반적으로 CCTV 시스템은 도 1에 예시된 바와 같이 지정된 각 위치에 설치되는 IP 카메라들로 이루어지는 카메라 그룹(110)과, 영상 분배 장치(120)와, 영상 저장 장치(130)를 포함하여 구성되며, 각 IP 카메라에 의해 촬영된 영상은 원격지에 위치한 관제 센터(140)에서 확인될 수 있다.In general, the CCTV system is configured to include a camera group 110, an image distribution device 120, and an image storage device 130 consisting of IP cameras installed in each designated location as illustrated in FIG. An image captured by each IP camera may be checked at the control center 140 located at a remote location.

여기서, 영상 분배 장치(120)는 예를 들어 다수의 IP 카메라의 디지털 영상 데이터를 모니터링하고 관리하는 장치일 수 있고, 영상 저장 장치(130)는 네트워크상에 설치된 IP 카메라의 영상 녹화, 모니터링, 이벤트 관리를 위한 장치일 수 있다.Here, the image distribution device 120 may be, for example, a device that monitors and manages digital image data of a plurality of IP cameras, and the image storage device 130 records, monitors, and events images of IP cameras installed on a network. It may be a device for management.

도시된 바와 같이, 각각의 IP 카메라는 유무선 통신망을 통해 예를 들어 VMS(Video Management System)인 영상 분배 장치(120)와 연결되며, 영상 분배 장치(120)는 각 IP 카메라에 의해 촬영된 영상(즉, 각 채널의 영상)을 비트스트림 형태로 수신하여 관제 센터(140)로 제공한다.As shown, each IP camera is connected to a video distribution device 120 that is, for example, a VMS (Video Management System) through a wired/wireless communication network, and the video distribution device 120 is connected to an image ( That is, the video of each channel) is received in the form of a bitstream and provided to the control center 140 .

아울러, 영상 분배 장치(120)는 수신한 비트스트림을 예를 들어 NVR(Network Video Recorder) 장치인 영상 저장 장치(130)로 제공하여 비트스트림이 저장되도록 하고, 또한 관제 센터(140)로부터 요청된 비트스트림이 영상 저장 장치(130)로부터 독출되어 관제 센터(140)에 제공될 수 있도록 한다. In addition, the video distribution device 120 provides the received bitstream to the video storage device 130 , which is, for example, a Network Video Recorder (NVR) device so that the bitstream is stored, and also requested from the control center 140 . The bitstream may be read from the image storage device 130 and provided to the control center 140 .

영상 저장 장치(130)는 비트스트림을 제공받아 저장한다. 영상 저장 장치(130)는 비트스트림이 정상적으로 수신되고 있는지를 확인하기 위해 모니터와 연결될 수 있다. 영상 저장 장치(130)에는 비트스트림에 상응하는 영상이 모니터에 출력될 수 있도록 하기 위해 디코더가 포함될 수 있다. The image storage device 130 receives and stores the bitstream. The image storage device 130 may be connected to a monitor to check whether the bitstream is being normally received. The image storage device 130 may include a decoder to output an image corresponding to a bitstream to a monitor.

일반적으로, 영상 저장 장치(130)는 수신된 비트스트림을 미리 지정된 기간(예를 들어 30일) 동안 저장하고 유지하도록 설정된다. In general, the image storage device 130 is set to store and maintain the received bitstream for a predetermined period (eg, 30 days).

그러나, 최근의 CCTV 영상은 FHD급으로 처리되고 있어, 대용량의 저장 공간이 필요하다. 예를 들어, 1시간 분량의 30fps(frames per second) 정보를 FHD 영상으로 저장하기 위해서는 약 2GB 가량의 저장 공간이 필요하고, 따라서 한 채널 정보로서 24시간의 30일간 데이터를 저장하기 위해서는 약 1.44TB의 저장 공간이 필요시 된다. 마찬가지로 800채널을 대상으로 하는 CCTV 시스템이라면, 영상 저장 장치(130)에는 적어도 1,152TB 이상의 저장 공간이 구비되어야 한다. However, recent CCTV images are processed in FHD level, so a large-capacity storage space is required. For example, to store one hour of 30 fps (frames per second) information as an FHD image, about 2 GB of storage space is required. Therefore, to store data for 30 days of 24 hours as one channel information, about 1.44 TB storage space is required. Similarly, in the case of a CCTV system targeting 800 channels, the image storage device 130 must have a storage space of at least 1,152 TB.

따라서, 비트스트림이 저장되어야 하는 IP 카메라가 복수개, 즉 복수 채널로 설정된 경우라면, 영상 저장 장치(130)에는 채널 수에 비례하는 대용량의 저장 공간이 충분히 확보되어야 하며, 이는 CCTV 시스템의 구축 비용을 크게 증가시키는 원인이 되고 있다. 또한, CCTV 영상이 점차 4K, 8K 급으로 개선되고 있어, 장기적으로는 보다 큰 저장 공간의 확보가 요구될 것이며, 이로 인해 CCTV 시스템의 구축 비용은 기하급수적으로 증가될 수 밖에 없다. Therefore, if a plurality of IP cameras in which the bitstream is to be stored are set, that is, a plurality of channels, a large-capacity storage space proportional to the number of channels must be sufficiently secured in the image storage device 130, which reduces the cost of constructing a CCTV system. causing a significant increase. In addition, as CCTV images are gradually being improved to 4K and 8K grades, it will be required to secure a larger storage space in the long term, which inevitably increases the construction cost of the CCTV system exponentially.

그러나, 이제까지 CCTV 시스템에 관한 기술 개발은 정보 보안의 필요성으로 인해 저장될 비트스트림의 암호화에 집중하고 있을 뿐, 보다 효율적으로 비트스트림을 압축하고 저장하는 기술에 대한 개발 노력은 미흡한 실정이다. However, technology development related to the CCTV system so far has focused only on encryption of the bitstream to be stored due to the need for information security, and development efforts for technology for more efficiently compressing and storing the bitstream are insufficient.

한국등록특허 제10-2012037호Korean Patent Registration No. 10-2012037

본 발명은 고해상도 및 고화질 영상의 방대한 데이터를 화질 열화없이 효과적으로 압축, 저장 및 이용할 수 있어 CCTV 시스템의 구축 비용을 현저히 절감할 수 있는 영상 저장 장치 및 방법을 제공하기 위한 것이다. An object of the present invention is to provide an image storage apparatus and method that can significantly reduce the construction cost of a CCTV system by effectively compressing, storing, and using large amounts of high-resolution and high-definition image data without deterioration in image quality.

본 발명의 이외의 목적들은 하기의 설명을 통해 쉽게 이해될 수 있을 것이다.Objects other than the present invention will be easily understood through the following description.

본 발명의 일 측면에 따르면, 영상 전송기로부터 제공된 제1 비트스트림의 적어도 일부를 트랜스코딩하여 상기 제1 비트스트림의 IDR 주기(IDR Period)의 시간 길이와 상이한 시간 길이의 갱신 IDR 주기를 가지는 제2 비트스트림으로 가공하는 트랜스코더; 및 상기 제2 비트스트림을 저장하는 저장부를 포함하는 영상 저장 장치가 제공된다. According to an aspect of the present invention, by transcoding at least a portion of a first bitstream provided from an image transmitter, a second having an updated IDR period of a time length different from that of an IDR period of the first bitstream Transcoder that processes bitstream; and a storage unit configured to store the second bitstream.

상기 트랜스코더는 제2 비트스트림이 갱신 IDR 주기를 가지도록 하기 위해 하나 이상의 인트라 프레임(Intra frame)을 트랜스코딩 대상 프레임으로 하여 인터 프레임(Inter frame)으로 변경하되, 갱신 IDR 주기는 상기 제2 비트스트림 내에서 전체적으로 동일하게 적용되거나 미리 지정된 비트스트림 특성 해석 규칙에 따라 상기 제1 비트스트림을 해석하여 결정될 수 있다. The transcoder converts one or more intra frames into an inter frame by using one or more intra frames as a frame to be transcoded so that the second bitstream has an updated IDR period, wherein the updated IDR period is the second bit It may be determined by analyzing the first bitstream according to a predetermined bitstream characteristic interpretation rule that is equally applied as a whole within the stream.

상기 제2 비트스트림 내에서 전체적으로 동일한 시간 길이의 갱신 IDR 주기가 미리 지정되어 적용되는 경우, 상기 트랜스코더는 상기 제1 비트스트림 내에서 각 갱신 IDR 주기에 속하는 복수의 GOP(Group of Picture)들 중 두번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들만을 상기 트랜스코딩 대상 프레임으로 한정하고, 각 갱신 IDR 주기에 속하는 복수의 GOP들 각각에 포함된 인트라 프레임들이 미리 지정된 구조의 참조 관계를 가지는 상기 제2 비트스트림이 가공되도록 하되, 상기 미리 지정된 구조의 참조 관계는 IPPP 구조, IBBB 구조 및 IBBP 구조 중 어느 하나일 수 있다.When an update IDR period of the same time length is designated and applied in advance in the second bitstream, the transcoder is configured to select one of a plurality of Groups of Pictures (GOPs) belonging to each updated IDR period in the first bitstream. In the second GOP, only the intra frames included in the last GOP are limited to the transcoding target frame, and the intra frames included in each of the plurality of GOPs included in each update IDR period have a reference relationship of a predetermined structure. The bitstream is processed, but the reference relationship of the predetermined structure may be any one of an IPPP structure, an IBBB structure, and an IBBP structure.

상기 갱신 IDR 주기의 시간 길이는, 상기 저장부에 저장될 비트스트림이 제공되는 채널의 수, 상기 저장부의 총 저장용량 크기, 상기 저장부의 여유 저장용량 크기 및 비트스트림이 상기 저장부에 저장되어 유지되는 기간 중 하나 이상을 고려 팩터(factor)로 가지도록 미리 규정된 수학식에 의해 산출될 수 있다. The length of time of the update IDR cycle includes the number of channels through which the bitstream to be stored in the storage unit is provided, the total storage capacity size of the storage unit, the free storage capacity size of the storage unit, and the bitstream is stored and maintained in the storage unit It can be calculated by a predefined equation to have one or more of the time periods as a factor to be considered.

상기 갱신 IDR 주기를 적응적으로 결정하기 위한 상기 비트스트림 특성 해석 규칙은, 제1 비트스트림에 속하는 복수의 GOP(Group of Picture)들 중 두번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들 각각에 대해 첫번째 GOP 내의 인트라 프레임 또는 참조하고자 하는 프레임의 대응되는 픽셀과의 차이값을 산출하여, 프레임간의 차이값이 미리 지정된 임계값 이하인 경우에만 트랜스코딩 대상 프레임으로 특정하여 인터 프레임으로 변경하도록 하는 것일 수 있다.The bitstream characteristic interpretation rule for adaptively determining the update IDR period is for each of the intra frames included in each of the second GOP to the last GOP among a plurality of Groups of Pictures (GOPs) belonging to the first bitstream. It may be to calculate a difference value from a corresponding pixel of an intra frame in the first GOP or a frame to be referenced, and specify the frame to be transcoded as a frame to be transcoded and change it to an inter frame only when the difference between frames is less than or equal to a predetermined threshold value .

상기 트랜스코더는 트랜스코딩 대상 프레임으로 지정된 인트라 프레임을 무손실 부호화(lossless coding) 기법으로 인터 프레임으로 변경시키도록 설정될 수 있다.The transcoder may be configured to change an intra frame designated as a transcoding target frame into an inter frame using a lossless coding technique.

상기 트랜스코더의 인코더부가 무손실 부호화 기법으로 동작하도록 하기 위해, SPS(Sequence Parameter Set), PPS(Picture Parameter Set), PH(Picture Header) 및 CU 신택스(Coding Unit Syntax) 중 하나 이상의 플래그값이 조정될 수 있다.In order for the encoder unit of the transcoder to operate in a lossless coding scheme, one or more flag values of a sequence parameter set (SPS), a picture parameter set (PPS), a picture header (PH), and a CU syntax (Coding Unit Syntax) can be adjusted have.

본 발명의 다른 측면에 따르면, 영상 저장 방법을 수행하도록 하는 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 단계들을 수행하도록 하며, 상기 단계들은, (a) 영상 전송기로부터 제1 비트스트림을 제공받는 단계; 및 (b) 상기 제1 비트스트림의 적어도 일부를 트랜스코딩하여 상기 제1 비트스트림의 IDR 주기(Period)의 시간 길이와 상이한 시간 길이의 갱신 IDR 주기를 가지는 제2 비트스트림으로 가공하는 단계를 포함하되, 상기 단계 (b)에서, 제2 비트스트림이 갱신 IDR 주기를 가지도록 하기 위해 하나 이상의 인트라 프레임(Intra frame)을 트랜스코딩 대상 프레임으로 하여 인터 프레임(Inter frame)으로 변경되되, 갱신 IDR 주기는 상기 제2 비트스트림 내에서 전체적으로 동일하게 적용되거나 미리 지정된 비트스트림 특성 해석 규칙에 따라 상기 제1 비트스트림을 해석하여 결정되는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램이 제공된다. According to another aspect of the present invention, there is provided a computer program stored on a computer-readable medium for performing an image storage method, the computer program causing a computer to perform the following steps, the steps comprising: (a) an image transmitter receiving a first bitstream from and (b) transcoding at least a part of the first bitstream into a second bitstream having an updated IDR period of a time length different from that of an IDR period of the first bitstream. However, in step (b), one or more intra frames are used as transcoding target frames so that the second bitstream has an updated IDR cycle, and are changed to an inter frame, but with an updated IDR cycle. A computer program stored in a computer-readable medium is provided, which is determined by interpreting the first bitstream according to a pre-specified bitstream characteristic interpretation rule that is equally applied as a whole within the second bitstream.

상기 제2 비트스트림 내에서 전체적으로 동일한 시간 길이의 갱신 IDR 주기가 미리 지정되어 적용되는 경우, 상기 단계 (b)에서, 상기 제1 비트스트림 내에서 각 갱신 IDR 주기에 속하는 복수의 GOP(Group of Picture)들 중 두번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들만을 상기 트랜스코딩 대상 프레임으로 한정되고, 각 갱신 IDR 주기에 속하는 복수의 GOP들 각각에 포함된 인트라 프레임들이 미리 지정된 구조의 참조 관계를 가지는 상기 제2 비트스트림으로 가공되되, 상기 미리 지정된 구조의 참조 관계는 IPPP 구조, IBBB 구조 및 IBBP 구조 중 어느 하나일 수 있다. When an update IDR period of the same length of time is designated and applied in advance in the second bitstream, in step (b), a plurality of Group of Pictures (GOPs) belonging to each updated IDR period in the first bitstream ), only intra frames included in each of the second to last GOPs are limited to the transcoding target frame, and intra frames included in each of a plurality of GOPs belonging to each update IDR period have a reference relationship of a predetermined structure. It is processed into the second bitstream, and the reference relation of the predetermined structure may be any one of an IPPP structure, an IBBB structure, and an IBBP structure.

상기 갱신 IDR 주기의 시간 길이는, 저장부에 저장될 비트스트림이 제공되는 채널의 수, 상기 저장부의 총 저장용량 크기, 상기 저장부의 여유 저장용량 크기 및 비트스트림이 상기 저장부에 저장되어 유지되는 기간 중 하나 이상을 고려 팩터(factor)로 가지도록 미리 규정된 수학식에 의해 산출될 수 있다.The length of time of the update IDR cycle includes the number of channels through which the bitstream to be stored in the storage unit is provided, the total storage capacity size of the storage unit, the free storage capacity size of the storage unit and the bitstream is stored and maintained in the storage unit. It may be calculated by an equation predefined to have one or more of the periods as a factor to be considered.

상기 적용될 갱신 IDR 주기를 적응적으로 결정하기 위한 상기 비트스트림 특성 해석 규칙은, 제1 비트스트림에 속하는 복수의 GOP(Group of Picture)들 중 두번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들 각각에 대해 첫번째 GOP 내의 인트라 프레임 또는 참조하고자 하는 프레임의 대응되는 픽셀과의 차이값을 산출하여, 프레임간의 차이값이 미리 지정된 임계값 이하인 경우에만 트랜스코딩 대상 프레임으로 특정하여 인터 프레임으로 변경하도록 하는 것일 수 있다.The bitstream characteristic interpretation rule for adaptively determining the update IDR period to be applied is applied to each of the intra frames included in each of the second GOP to the last GOP among a plurality of Groups of Pictures (GOPs) belonging to the first bitstream. In the first GOP, the difference value with the corresponding pixel of the intra frame or frame to be referenced is calculated, and only when the difference value between frames is less than or equal to a predetermined threshold value, it is specified as a frame to be transcoded and changed to an inter frame. have.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.Other aspects, features and advantages other than those described above will become apparent from the following drawings, claims, and detailed description of the invention.

본 발명의 실시예에 따르면, 고해상도 및 고화질 영상의 방대한 데이터를 화질 열화없이 효과적으로 압축, 저장 및 이용할 수 있어 CCTV 시스템의 구축 비용을 현저히 절감하는 효과가 있다. According to an embodiment of the present invention, it is possible to effectively compress, store, and use massive data of high-resolution and high-definition images without deterioration in picture quality, thereby significantly reducing the construction cost of a CCTV system.

도 1은 일반적인 CCTV 시스템의 구성을 개략적으로 나타낸 도면.
도 2는 본 발명의 일 실시예에 따른 영상 저장 장치의 블록 구성도.
도 3은 IPPP 구조의 비트스트림을 설명하기 위한 도면.
도 4는 고정 위치의 IP 카메라에 의해 촬영된 감시 영상을 예시한 도면.
도 5는 본 발명의 일 실시예에 따른 비트스트림 트랜스코딩 기법을 설명하기 위한 도면.
도 6은 본 발명의 일 실시예에 따른 재구성된 HEVC 인코더 구조를 설명하기 위한 도면.
1 is a diagram schematically showing the configuration of a general CCTV system.
2 is a block diagram of an image storage device according to an embodiment of the present invention;
3 is a diagram for explaining a bitstream of an IPPP structure;
4 is a diagram illustrating a surveillance image captured by an IP camera in a fixed position.
5 is a diagram for explaining a bitstream transcoding technique according to an embodiment of the present invention.
6 is a diagram for explaining a reconstructed HEVC encoder structure according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to a specific embodiment, it should be understood to include all modifications, equivalents and substitutes included in the spirit and scope of the present invention.

본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used herein are used only to describe specific embodiments, and are not intended to limit the present invention. The singular expression includes the plural expression unless the context clearly dictates otherwise. In this specification, terms such as "comprises" or "have" are intended to designate that the features, numbers, steps, operations, components, parts, or combinations thereof described in the specification exist, but one or more other features It should be understood that this does not preclude the existence or addition of numbers, steps, operations, components, parts, or combinations thereof.

도 2는 본 발명의 일 실시예에 따른 영상 저장 장치의 블록 구성도이고, 도 3은 IPPP 구조의 비트스트림을 설명하기 위한 도면이며, 도 4는 고정 위치의 IP 카메라에 의해 촬영된 감시 영상을 예시한 도면이다. 도 5는 본 발명의 일 실시예에 따른 비트스트림 트랜스코딩 기법을 설명하기 위한 도면이고, 도 6은 본 발명의 일 실시예에 따른 재구성된 HEVC 인코더 구조를 설명하기 위한 도면이다.FIG. 2 is a block diagram of an image storage device according to an embodiment of the present invention, FIG. 3 is a diagram for explaining a bitstream of an IPPP structure, and FIG. 4 is a surveillance image captured by an IP camera in a fixed position. It is an exemplified drawing. 5 is a diagram for explaining a bitstream transcoding technique according to an embodiment of the present invention, and FIG. 6 is a diagram for explaining a structure of a reconstructed HEVC encoder according to an embodiment of the present invention.

도 2를 참조하면, 본 실시예에 따른 영상 저장 장치(130)는 디코더(210), 트랜스코더(220) 및 저장부(230)를 포함할 수 있다. Referring to FIG. 2 , the image storage device 130 according to the present embodiment may include a decoder 210 , a transcoder 220 , and a storage unit 230 .

디코더(210)는 영상 전송기(Network Video Transmitter, NVT)(240)로부터 각 채널의 비트스트림이 정상적으로 수신되는지를 확인할 수 있도록, 수신된 비트스트림을 디코딩한 영상을 모니터에 제공한다. 관리자는 모니터에서 출력되는 영상을 참조하여 비트스트림의 정상 수신 여부를 쉽게 확인할 수 있을 것이다. The decoder 210 provides a decoded image of the received bitstream to the monitor so that it can be checked whether the bitstream of each channel is normally received from the video transmitter (Network Video Transmitter, NVT) 240 . The administrator will be able to easily check whether the bitstream is normally received by referring to the image output from the monitor.

여기서, 영상 전송기(240)는 영상 저장 장치(130)에 저장될 비트스트림을 제공하는 장치로서, 예를 들어 영상 분배 장치(120), IP 카메라 등 중 하나 이상일 수 있다. 만일, 영상 전송기(240)에서 촬영한 영상에 상응하는 고해상도의 비트스트림과 저해상도의 비트스트림을 함께 제공하는 경우라면, 디코더(210)는 처리 효율성을 증진시키기 위해 저해상도의 비트스트림을 디코딩하여 모니터에 제공할 수 있을 것이다. Here, the image transmitter 240 is a device that provides a bitstream to be stored in the image storage device 130 , and may be, for example, one or more of the image distribution device 120 and an IP camera. If the video transmitter 240 provides both a high-resolution bitstream and a low-resolution bitstream corresponding to the captured image, the decoder 210 decodes the low-resolution bitstream to improve processing efficiency and displays it on the monitor. will be able to provide

트랜스코더(220)는 일반적인 구성으로서 디코더부와 인코더부를 포함하여 구현되며, 후술되는 바와 같이 입력된 비트스트림을 상대적으로 작은 데이터량을 가지면서도 동일한 화질로 유지되는 비트스트림으로 트랜스코딩하며, 트랜스코딩된 비트스트림은 저장부(230)에 저장된다. The transcoder 220 is a general configuration and is implemented including a decoder unit and an encoder unit, and as will be described later, transcodes an input bitstream into a bitstream that has a relatively small data amount and maintains the same image quality. The obtained bitstream is stored in the storage unit 230 .

일반적으로 IP 카메라에서 생성되어 전송되는 비트스트림 내의 압축된 영상 포맷은 도 3의 (a)에 예시된 바와 같이 인트라 프레임(Intra frame)과 인터프레임(Inter frame)이 IPPP 구조로 정렬되고, I 프레임은 IDR 프레임으로서 미리 지정된 시간 간격(즉, IDR 주기(Period))으로 배치되는 형태를 가진다. 설명의 편의상 본 명세서에서는 IPPP 구조인 경우를 중심으로 설명하지만, 이미 널리 알려진 바와 같이 영상 포맷은 IPPP 구조, IBBB 구조, IBBP 구조 등으로 다양하며, 다양한 영상 포맷에 대해 본 발명이 아무런 제한없이 동일하게 적용될 수 있음은 당연하다. In general, in the compressed video format in the bitstream generated and transmitted by the IP camera, an intra frame and an inter frame are arranged in an IPPP structure as illustrated in FIG. 3(a), and the I frame is is an IDR frame, which is arranged at a predetermined time interval (ie, an IDR period (Period)). For convenience of explanation, in this specification, the case of the IPPP structure will be mainly described, but as is well known, the video format is various, such as an IPPP structure, an IBBB structure, an IBBP structure, etc., and the present invention is the same without any limitation for various video formats. Of course, it can be applied.

예를 들어, IDR 주기가 1초로 설정된 30fps의 비트스트림은 1초의 시간 구간 내에 1개의 I 프레임과 후속하는 29개의 P 프레임이 위치된다. For example, in a bitstream of 30 fps in which the IDR period is set to 1 second, one I frame and the following 29 P frames are located within a time interval of 1 second.

여기서, I 프레임은 카메라 이동이나 장면 변화 등에 따른 화질 열화 현상을 줄이거나, 랜덤 억세스(random access)가 가능하도록 하기 위해 반드시 필요한 프레임이다. 따라서, 드라마나 영화 등의 일반적인 컨텐츠를 부호화하는 경우 1초에 1 프레임 정도의 I 프레임이 포함되도록 부호화되고 있다. Here, the I frame is an essential frame to reduce image quality degradation caused by camera movement or scene change, or to enable random access. Accordingly, in the case of encoding general content such as a drama or a movie, the encoding is performed so that about one frame per second is included.

I 프레임은 다른 이미지로부터 독립적으로 부호화되는 반면, P 프레임은 선행하는 다른 프레임을 참조하여 비독립적으로 부호화되는 특징을 가진다. 따라서, 도 3의 (b)에 예시된 바와 같이, 압축된 I 프레임은 압축된 P 프레임에 비해 현저히 많은 데이터량을 가지게 된다. I-frames are encoded independently from other images, whereas P-frames are encoded non-independently with reference to other preceding frames. Accordingly, as illustrated in (b) of FIG. 3 , the compressed I frame has a significantly larger amount of data than the compressed P frame.

도 4에는 고정 위치의 IP 카메라에 의해 촬영된 4장의 감시 영상들이 예시되어 있다. 참고로, 예시된 감시 영상들은 교차로 영역에 설치된 IP 카메라에서 약 30초에서 1분 사이의 간격으로 촬영된 것이다. 4 exemplifies four surveillance images captured by an IP camera in a fixed position. For reference, the exemplified surveillance images are taken at intervals of about 30 seconds to 1 minute by an IP camera installed in an intersection area.

감시 영상들에서 보이는 것과 같이, 일부 움직이는 물체들만이 시간 경과에 따라 위치와 형상이 변경될 뿐, 대부분의 배경 영상은 고정적으로 유지된다. 이는 고정된 위치에서 지정된 감시 영역을 지속적으로 촬영하도록 설치되는 IP 카메라의 촬영 영상에서의 전형적인 특성인 것이다.As seen in the surveillance images, only some moving objects change their positions and shapes over time, while most of the background images remain fixed. This is a typical characteristic in the captured image of an IP camera installed to continuously capture a designated surveillance area at a fixed location.

또한, 이러한 IP 카메라는 기본적으로 카메라 이동이나 장면 전환이 거의 발생하지 않을 뿐 아니라, IP 카메라에 의해 촬영된 영상의 특정 시각 위치로 랜덤 억세스할 필요성도 현저히 낮은 특징도 있다. In addition, such an IP camera basically hardly causes camera movement or scene change, but also has a feature that the need for random access to a specific visual position of an image captured by the IP camera is remarkably low.

이와 같은 CCTV 시스템에서 생성된 영상의 특성을 반영하여 본 실시예에 따른 영상 저장 장치(130)는 저장부(230)에 저장되는 비트스트림의 데이터량을 현저히 감소시키도록 동작한다. By reflecting the characteristics of the image generated by the CCTV system as described above, the image storage device 130 according to the present embodiment operates to significantly reduce the data amount of the bitstream stored in the storage unit 230 .

도 5에는 영상 저장 장치(130)의 트랜스코더(220)에 의한 비트스트림 트랜스코딩 기법을 설명하기 위한 도면이 예시되어 있다.5 is a diagram illustrating a bitstream transcoding technique by the transcoder 220 of the image storage device 130 .

도 5의 (a)에 예시된 바와 같이, IP 카메라에 의해 촬영된 영상에 상응하는 비트스트림 내의 압축된 영상 포맷은 IPPP 구조로서, 미리 지정된 IDR 주기(IDR Period)마다 I 프레임(즉, IDR 프레임)이 최선의 위치에 배치되는 형태를 가진다. 본 명세서에서는 설명의 편의상, 모든 P 프레임의 참조 프레임이 선행하는 직전 프레임 하나로 설정되는 경우를 예로 들어 설명하지만, 이에 제한되지 않고 P 프레임이 다수 개의 참조 프레임을 가지도록 설정될 수도 있음은 당연하다.As illustrated in (a) of FIG. 5 , the compressed image format in the bitstream corresponding to the image captured by the IP camera is an IPPP structure, and is an I frame (ie, IDR frame) every predetermined IDR period (IDR Period). ) is arranged in the best position. In the present specification, for convenience of description, a case in which the reference frames of all P frames are set to one preceding frame will be described as an example, but the present disclosure is not limited thereto, and it is natural that the P frames may be set to have a plurality of reference frames.

여기서, I 프레임이 압축된 데이터량은 P 프레임에 비해 현저히 크기 때문에, 본 실시예에 따른 트랜스코더(220)는 상대적으로 길게 갱신된 IDR 주기가 적용되도록 하며, 갱신된 IDR 주기 내에 하나의 I 프레임만 존재하도록 비트스트림을 재가공함으로써 저장부(230)에 저장되는 비트스트림의 데이터량을 감소시킨다.Here, since the amount of compressed data of the I frame is significantly larger than that of the P frame, the transcoder 220 according to the present embodiment applies a relatively long updated IDR period, and one I frame within the updated IDR period. The amount of data of the bitstream stored in the storage unit 230 is reduced by reprocessing the bitstream so that only the bitstream exists.

이때 고려할 수 있는 방안들 중 일 예로서, 도 5의 (b)에 예시된 바와 같이, 트랜스코더(220)는 갱신된 IDR 주기 내의 GOP(Group of Pictures)들 중 두번째 GOP부터 마지막 GOP까지의 모든 프레임들을 각각 선행하는 직전 프레임을 참조하여 비독립적으로 부호화하는 P 프레임으로 트랜스코딩함으로써 저장될 비트스트림의 데이터량을 감소시키는 방법을 고려할 수 있다. As an example of the methods that can be considered at this time, as illustrated in FIG. 5( b ), the transcoder 220 includes all of the GOPs from the second GOP to the last GOP among Groups of Pictures (GOPs) in the updated IDR period. A method of reducing the amount of data in the bitstream to be stored may be considered by transcoding the frames into P frames that are non-independently encoded with reference to the immediately preceding frame.

이때, 두번째 GOP에 속하는 프레임들을 P 프레임으로 재가공하기 위해, 가장 선행하는 I 프레임을 복호화한 후, 직전 P 프레임(즉, 첫번째 GOP의 마지막 P 프레임)을 참조하는 PT10 프레임으로 부호화하게 된다. At this time, in order to reprocess the frames belonging to the second GOP into P frames, the preceding I frame is decoded and then encoded as a P T10 frame referring to the immediately preceding P frame (ie, the last P frame of the first GOP).

이 경우, 두번째 GOP에서 기존의 I 프레임을 참조하는 P 프레임의 경우에도, 기존의 I 프레임이 PT10 프레임으로 변경됨으로써 PT10 프레임의 복원된 픽셀값이 기존의 I 프레임과 달라졌기 때문에 미스매치(mismatch)의 방지를 위해, 해당 P 프레임 역시 복호화한 후 PT10 프레임을 참조하여 다시 부호화한 PT11 프레임으로 변경되어야 한다. 이러한 처리는 두번째 GOP의 나머지 P 프레임들뿐 아니라, 갱신된 IDR 주기 내에 후속하는 GOP 들에 대해서도 공통적으로 실시될 수 밖에 없다. In this case, even in the case of a P frame to reference the existing I-frame in the second GOP, whereby the existing I-frame change in P T10 frame because the restored pixel value for P T10 frame changed from the existing I frame mismatch ( In order to prevent mismatch), the corresponding P frame must also be decoded and then changed to a P T11 frame re-encoded with reference to the P T10 frame. Such processing must be commonly performed not only for the remaining P frames of the second GOP, but also for GOPs that follow within the updated IDR period.

또한, 트랜스코더(220)에 의한 트랜스코딩 처리 중에 PT10 프레임이 선행하는 P 프레임을 참조하고자 하는 경우에는, 프레임들간의 참조 관계로 인하여 첫번째 GOP 내의 모든 프레임들까지 앞선 프레임들 모두에 대한 복호화 작업이 요구된다. In addition, in the case where the P frame preceding the P T10 frame is to be referred to during the transcoding process by the transcoder 220 , the decoding operation for all preceding frames up to all frames in the first GOP due to the reference relationship between the frames this is required

이와 같이, 갱신된 IDR 주기 내에 속하는 두번째 GOP부터 마지막 GOP에 포함된 각 프레임들 모두를 직전 프레임을 각각 참조하는 P 프레임으로 재가공하는 것은 대상이 되는 각 프레임에 대한 복호화 및 부호화를 개별적으로 수행하여야 하고, 또한 대상 프레임 이전의 프레임들에 대해서도 별도의 디코딩 과정을 수행하여야 하므로 트랜스 코딩의 복잡도가 현저히 증가하는 문제점이 있다. 또한, 다수개의 프레임을 복호화하고 다시 부호화하는 과정에서 화질 열화가 발생될 수 있는 문제점도 있다. In this way, to reprocess all of the frames included in the second GOP to the last GOP included in the updated IDR period into P frames each referencing the previous frame, decoding and encoding of each target frame must be performed individually, and Also, since a separate decoding process must be performed for frames before the target frame, there is a problem in that the complexity of transcoding is significantly increased. Also, there is a problem in that image quality may be deteriorated in the process of decoding and re-encoding a plurality of frames.

전술한 문제점을 개선하면서도 현저히 작은 데이터량의 비트스트림으로 재가공하기 위해, 본 실시예에 따른 트랜스코더(220)는 IP 카메라에 의해 촬영된 감시 영상에서 확인되는 전형적인 특성을 이용하여 비트스트림을 재가공하는 특징을 가진다. In order to improve the above problems and reprocess the bitstream with a significantly smaller data amount, the transcoder 220 according to the present embodiment reprocesses the bitstream using typical characteristics found in the surveillance image captured by the IP camera. have characteristics.

즉, 트랜스코더(220)는 재가공 대상인 I 프레임에 대해 변환(Transform), 양자화(Transform), 역변환(Inv. Transform), 역양자화(Inv. Transform), 인루프 필터(In-loop Filter)에 해당하는 모듈의 동작을 중지(disabled)시킨 간략한 인코더 구조를 적용하여 P 프레임으로 무손실 부호화 처리를 수행한다(도 6의 (b) 참조). 이를 통해, 트랜스코딩 과정에서 발생될 수 있는 복잡도를 현저히 개선하고, 또한 화질 열화 문제를 해결할 수 있다. That is, the transcoder 220 corresponds to Transform, quantization, Inv. Transform, Inv. Transform, and In-loop Filter for the I frame, which is a reprocessing target. The lossless encoding process is performed on the P frame by applying a simple encoder structure in which the operation of the module is disabled (refer to (b) of FIG. 6). Through this, it is possible to remarkably improve complexity that may occur in the transcoding process, and also to solve the problem of image quality degradation.

구체적으로 설명하면, 트랜스코더(220)는 갱신된 IDR 주기 내에 속하는 프레임들 중 두번째 GOP 이후의 I 프레임들만을 트랜스코딩 대상 프레임으로 한정하여 무손실 부호화처리에 의한 P 프레임으로 각각 변경하되, 갱신된 IDR 주기 내의 I 프레임들간에 IPPP 구조의 참조 관계를 가지는 비트스트림으로 재가공한다(도 5의 (c) 참조). Specifically, the transcoder 220 limits only I frames after the second GOP among the frames belonging to the updated IDR period as the target frame to be transcoded and changes them to P frames by lossless encoding, respectively, but the updated IDR It is reprocessed into a bitstream having a reference relationship of an IPPP structure between I frames in a period (refer to (c) of FIG. 5).

즉, 트랜스코더(220)는 갱신된 IDR 주기 내의 GOP(Group of Pictures)들 중 두번째 GOP의 I 프레임을 복호화한 후 첫번째 GOP의 I 프레임을 참조하는 PT1 프레임으로 부호화한다. That is, the transcoder 220 decodes the I frame of the second GOP among Groups of Pictures (GOPs) in the updated IDR period, and then encodes it into a P T1 frame referring to the I frame of the first GOP.

이때, 부호화 대상 픽셀값과 해당 픽셀값을 부호화한 후 복원하였을 때의 픽셀값이 동일해지도록 하는 무손실 부호화(lossless coding) 처리가 수행되기 때문에, 트랜스코딩 대상 프레임인 I 프레임의 복원된 값(즉, 부호화 대상 픽셀값)과 재가공된 PT1 프레임을 복원한 값이 동일한 특징이 있다. At this time, since a lossless coding process is performed so that the encoding target pixel value and the pixel value obtained after encoding and restoring the pixel value become the same, the restored value of the I frame, which is the transcoding target frame (that is, , the encoding target pixel value) and the value obtained by reconstructing the reprocessed P T1 frame have the same characteristics.

따라서, 기존의 두번째 GOP에서 I 프레임을 참조하던 직후의 P 프레임이 참조하는 픽셀값에서 미스매치가 발생되지 않기 때문에, 트랜스코딩 대상 프레임인 I 프레임만을 트랜스코딩하면 충분하다. Accordingly, since mismatch does not occur in pixel values referenced by the P frame immediately after referring to the I frame in the existing second GOP, it is sufficient to transcode only the I frame, which is the frame to be transcoded.

이는 후속하는 GOP에서도 동일하다. 다만, 기존의 세번째 GOP에서의 트랜스코딩 대상 프레임인 I 프레임은 직전 GOP에서 트랜스코딩된 PT1 프레임을 참조하여 PT2 프레임으로 트랜스코딩되는 규칙, 즉 세번째 GOP 부터는 트랜스코딩 대상 프레임이 직전 트랜스코딩 대상 프레임을 참조하여 트랜스코딩되는 규칙이 적용되어 갱신된 IDR 주기 내의 I 프레임들이 IPPP 구조의 참조 관계를 가지게 된다. The same is true for the subsequent GOP. However, the I frame, which is the transcoding target frame in the existing third GOP, is transcoded into the P T2 frame with reference to the P T1 frame transcoded in the previous GOP, that is, from the third GOP, the transcoding target frame is the immediately preceding transcoding target. A rule of transcoding with reference to a frame is applied so that I frames in the updated IDR period have a reference relationship of the IPPP structure.

따라서, 트랜스코딩 대상 프레임을 부호화하기 위해서는 선행하는 P 프레임과 무관하게 첫번째 GOP 내의 I 프레임 및/또는 선행하는 트랜스코딩 대상 프레임만을 선택적으로 참조하면 충분하다. 이는, CCTV 시스템의 IP 카메라에 의해 촬영된 영상의 전형적인 특징(즉, 대부분의 영상에서 동일한 배경 영역을 상당 부분 포함하고 있는 점)에 착안하여, 시간적으로 떨어진 선행 I 프레임을 참조할 수 있도록 한 것이다. Therefore, in order to encode the transcoding target frame, it is sufficient to selectively refer only to the I frame and/or the preceding transcoding target frame in the first GOP regardless of the preceding P frame. This is to make it possible to refer to the preceding I frame, which is temporally separated, paying attention to the typical characteristics of the image captured by the IP camera of the CCTV system (that is, the point that most of the images contain a significant part of the same background area). .

전술한 바와 같이, 본 실시예에 따른 트랜스코더(220)는 트랜스코딩 대상 프레임(즉, 두번째 GOP 이후의 I 프레임들)만을 대상으로 트랜스코딩 처리를 수행하며, 복원 시에는 독립적으로 부호화된 I 프레임이므로 독립적으로 복호화하고, 부호화 시에는 첫번째 GOP 내 I 프레임 및/또는 선행하는 트랜스코딩 대상 프레임만을 참조하도록 함으로써 트랜스코딩 처리의 복잡성을 획기적으로 개선하면서도 압축률을 현저히 향상시킬 수 있는 장점이 있다. 또한 트랜스코딩 과정에서 무손실 부호화 기법을 적용함으로써 I 프레임의 복호화 및 P 프레임으로 부호화하는 과정에서 발생되는 화질 열화 현상도 억제하는 장점도 있다. As described above, the transcoder 220 according to the present embodiment performs a transcoding process on only the target transcoding frame (ie, I frames after the second GOP), and at the time of restoration, the independently coded I frame Therefore, by independently decoding and encoding only the I frame in the first GOP and/or the preceding transcoding target frame, there is an advantage of remarkably improving the compression rate while remarkably improving the complexity of the transcoding process. In addition, by applying a lossless coding technique in the transcoding process, there is an advantage in suppressing image quality degradation that occurs during decoding of I-frames and encoding of P-frames.

IP 카메라에서 촬영한 영상에 상응하는 비트스트림을 저장하는 종래의 영상 저장 장치와 본 실시예에 따른 영상 저장 장치의 압축 성능을 산술적으로 비교하면 아래와 같다. 참고로, 30fps의 FHD급 영상으로서 압축 이미지 포맷은 IPPP 구조이며, IDR 주기는 1초인 것으로 가정한다. 일반적으로 I 프레임 대비 P 프레임의 데이터양은 약 수십대 1로 평가되고 있으나, 계산 편의상 20:1의 비율로서 I 프레임의 데이터 량은 20으로, P 프레임의 데이터 량은 1로 각각 설정한다.An arithmetic comparison of the compression performance of a conventional image storage device for storing a bitstream corresponding to an image captured by an IP camera and an image storage device according to the present embodiment is as follows. For reference, it is assumed that the compressed image format is an IPPP structure as an FHD video at 30 fps and the IDR period is 1 second. In general, the data amount of the P frame compared to the I frame is estimated to be about tens to 1, but for convenience of calculation, the data amount of the I frame is set to 20 and the data amount of the P frame is set to 1 as a ratio of 20:1.

또한, 비교의 편의를 위해, CCTV 시스템 영상의 특성을 감안하여 갱신 IDR 주기를 10초로 변경시키는 경우로 특정한다.In addition, for the convenience of comparison, it is specified that the update IDR period is changed to 10 seconds in consideration of the characteristics of the CCTV system image.

이 경우, 종래의 영상 장치는 1초당 1개의 I 프레임과 29개의 P 프레임이 존재하므로 데이터량은 49(즉, 20x1+1x29)에 해당하며, 10초 구간이므로 총 데이터량은 490에 해당된다. In this case, since there are one I frame and 29 P frames per second in the conventional imaging apparatus, the data amount corresponds to 49 (ie, 20x1+1x29), and since it is a 10-second period, the total data amount corresponds to 490.

그러나, 본 실시예에 따른 영상 저장 장치(130)는 트랜스코더(220)에 의해 갱신 IDR 주기에 상응하도록 후속하는 GOP의 I 프레임들이 P 프레임으로 트랜스코딩되었으므로 10초 구간에서 I 프레임은 1개이고, P 프레임은 299개(즉, 첫번째 GOP의 29개와 나머지 9개 GOP의 270개)이며, 총 데이터량은 319(즉, 20x1+1x299)가 되어, 종래의 영상 저장 장치에 비해 약 35%의 압축 성능 개선 효과를 나타낸다. However, in the image storage device 130 according to the present embodiment, since I frames of the subsequent GOP are transcoded into P frames to correspond to the update IDR period by the transcoder 220, there is one I frame in the 10-second interval, There are 299 P frames (that is, 29 of the first GOP and 270 of the remaining 9 GOPs), and the total data amount is 319 (ie, 20x1+1x299), which is about 35% of compression compared to the conventional image storage device. It shows the performance improvement effect.

여기서, 갱신 IDR 주기를 상대적으로 크게 설정할수록, 램덤 억세스의 제약은 커질지라도 압축 성능은 상대적으로 현저히 향상될 수 있다. Here, as the update IDR period is set to be relatively large, the compression performance may be relatively remarkably improved even though the random access restriction increases.

따라서, 일 예로서, 갱신 IDR 주기는 관리자가 IP 카메라에 의해 촬영된 영상의 전형적인 특성을 감안하여 설정한 특정 값으로 고정될 수 있다.Accordingly, as an example, the update IDR period may be fixed to a specific value set by an administrator in consideration of typical characteristics of an image captured by an IP camera.

또한, 다른 예로서, 갱신 IDR 주기가 영상 저장 장치(130)에 구비된 컨트롤러에 의해 비트스트림의 특성을 감안하여 비트스트림 내에서 적응적으로 정해지도록 할 수도 있다. Also, as another example, the update IDR period may be adaptively determined in the bitstream by the controller included in the image storage device 130 in consideration of the characteristics of the bitstream.

즉, 영상 저장 장치(130)에 구비된 컨트롤러는 수신된 비트스트림에서 트랜스코딩 대상 인트라 프레임(즉, I 프레임)을 인터 프레임(즉, P 프레임 또는 B 프레임)으로 변경할지 말지 여부를 적응적으로 결정함으로써 재가공된 비트스트림 내에 복수개의 상이한 갱신 IDR 주기(예를 들어, 3초, 10초, 7초, 20초 등의 시간 길이로 각각 적응적 정해진 갱신 IDR 주기)가 적용되도록 할 수도 있다. That is, the controller provided in the image storage device 130 adaptively determines whether or not to change the transcoding target intra frame (ie, I frame) into an inter frame (ie, P frame or B frame) in the received bitstream. By determining, a plurality of different update IDR periods (eg, an update IDR period adaptively determined with a time length of 3 seconds, 10 seconds, 7 seconds, 20 seconds, etc., respectively) may be applied in the reprocessed bitstream.

이때, 컨트롤러는 트랜스코딩 대상 인트라 프레임이 첫 번째 GOP 내의 인트라 프레임과의 차이값 또는 참조하고자 하는 프레임(인트라 프레임 또는 인터 프레임)과의 차이값을 산출하고, 산출된 차이값이 미리 지정된 임계값을 초과하면 트랜스코딩을 생략하여 인트라 프레임으로 유지하도록 하되, 임계값 이하이면 트랜스코더(220)에서 트랜스코딩을 수행하여 인터 프레임으로 가공하도록 제어할 수 있다. 컨트롤러는 적응적으로 갱신 IDR 주기를 조절할 수 있으며, 프레임 간의 차이값은 SAD(Sum of Absolute Difference), MSE(Mean Squared Error), SSE(Sum of Squared Error), SAE(Sum of Absolute Error) 등과 같이 대응되는 픽셀 사이의 차이값을 산출하는 에러 측정 기법을 이용하여 산출될 수 있다. At this time, the controller calculates a difference value between the intra frame to be transcoded and the intra frame in the first GOP or a reference frame (intra frame or inter frame), and sets the calculated difference value to a predetermined threshold. If it exceeds, transcoding is omitted to maintain an intra frame, but if it is less than a threshold value, the transcoder 220 may perform transcoding to control processing into an inter frame. The controller can adaptively adjust the update IDR period, and the difference between frames is SAD (Sum of Absolute Difference), MSE (Mean Squared Error), SSE (Sum of Squared Error), SAE (Sum of Absolute Error), etc. It may be calculated using an error measurement technique of calculating a difference value between corresponding pixels.

경우에 따라, 프레임들간에 차이값이 모두 임계값 이하라면 가공된 비트스트림은 전체적으로 하나의 인트라 프레임만이 존재하여 하나의 갱신 IDR 주기에 속하게 될 수도 있다. 이 경우, 랜덤 억세스 측면에서 불리한 상황이 발생될 수 있으므로, 적응적으로 선정될 수 있는 갱신 IDR 주기의 최대값을 미리 규정함으로써 최소 수준 이상의 랜덤 억세스가 가능한 비트스트림으로 가공되도록 할 수도 있음은 당연하다. In some cases, if all the difference values between frames are less than or equal to a threshold value, only one intra frame exists in the processed bitstream as a whole, and thus, it may belong to one update IDR period. In this case, since a disadvantageous situation may occur in terms of random access, it is natural that the maximum value of the update IDR period that can be adaptively selected can be pre-determined so that the bitstream can be processed into a bitstream capable of random access above the minimum level. .

또한, 또 다른 예로서, 관제 센터(140) 및/또는 영상 저장 장치(130)에 구비된 컨트롤러(도시되지 않음)가 영상 저장 장치(130)에 비트스트림이 저장될 채널의 수량, 저장부(230)의 총 저장용량 크기, 저장부(230)의 여유 저장용량 크기 및 비트스트림이 저장부(230)에 저장되어 유지되는 기간을 고려 팩터(factor)로 가지도록 미리 규정된 수학식에 의해 현재 시점에서 최적의 갱신 IDR 주기를 적응적으로 산출하여 적용되도록 할 수도 있을 것이다. In addition, as another example, the controller (not shown) provided in the control center 140 and/or the image storage device 130 determines the number of channels in which the bitstream is to be stored in the image storage device 130 , the storage unit ( The total storage capacity size of 230 , the free storage capacity size of the storage unit 230 , and the period during which the bitstream is stored and maintained in the storage unit 230 are taken into consideration by a pre-defined equation It may be possible to adaptively calculate and apply an optimal update IDR period at a time point.

이 경우, 저장부(230)의 총 저장용량의 크기나 여유 저장용량의 크기에 비해 상대적으로 채널의 수가 크거나 비트스트림의 저장 유지 기간이 긴 경우에 상대적으로 갱신 IDR 주기는 크게 산출될 수도 있을 것이다. 물론, 수학식에 의해 산출되는 갱신 IDR 주기의 한계 범위는 미리 설정될 수 있으며, 한계 범위 이내의 갱신 IDR 주기가 적용되도록 미리 제약될 수도 있을 것이다. In this case, when the number of channels is relatively large or the storage and maintenance period of the bitstream is long compared to the size of the total storage capacity or the size of the free storage capacity of the storage unit 230, the update IDR period may be calculated relatively large. will be. Of course, the limit range of the update IDR period calculated by the equation may be preset, and may be limited in advance so that the update IDR period within the limit range is applied.

다음으로, 본 실시예에 따른 영상 저장 장치(130)는 트랜스코더(220)에 의한 트랜스코딩 처리가 실시되기 때문에 종래의 영상 저장 장치에 비해 처리 복잡성을 가질 수 있다. Next, the image storage device 130 according to the present embodiment may have processing complexity compared to the conventional image storage device because transcoding processing is performed by the transcoder 220 .

트랜스코더(220)는 초당 30개의 프레임들 중 1개인 I 프레임만을 트랜스코딩(즉, 디코딩 및 인코딩)하며, 1개 프레임에 대한 인코딩 처리의 복잡도가 디코딩 처리의 복잡도의 약 5배로 가정하면, 트랜스코더(220)는 디코딩 처리 복잡도를 기준으로 약 6개 프레임을 디코딩하는 것으로 산정할 수 있다. The transcoder 220 transcodes (ie, decodes and encodes) only one I frame out of 30 frames per second, and assuming that the complexity of the encoding process for one frame is about 5 times the complexity of the decoding process, The coder 220 may estimate that about 6 frames are decoded based on the decoding processing complexity.

따라서, 트랜스코더(220)는 종래의 영상 저장 장치에 비해 추가적으로 수행하는 트랜스코딩 처리에 의해 6개 프레임을 더 처리하는 복잡도를 유발시키게 된다. 따라서 종래의 영상 저장 장치가 초당 30 프레임을 디코딩처리한다고 할 때 본 실시예에 따른 영상 저장 장치(130)는 36 프레임을 디코딩처리하는 것으로 볼 수 있으며, 이때 최대 20% 정도의 복잡도가 증가하는 것으로 산출될 수 있다. Accordingly, the transcoder 220 induces complexity of processing 6 frames more by additional transcoding compared to the conventional image storage device. Therefore, when the conventional image storage device decodes 30 frames per second, it can be seen that the image storage device 130 according to the present embodiment decodes 36 frames, and in this case, the complexity increases by up to 20%. can be calculated.

그러나, 트랜스코더(220)를 종래의 영상 저장 장치에 포함시켜 복잡도를 야기시킬 때의 프로세서 비용 증가액에 비하여 비트스트림의 압축률을 증가시켜 저장 용량의 증설을 방지하여 절감되는 금액이 현저히 크기 때문에, 본 실시예에 따른 영상 저장 장치의 산업상 이용 가능성은 충분하다 할 것이다. However, compared to the increase in processor cost when the transcoder 220 is included in the conventional image storage device to cause complexity, the amount saved by increasing the compression rate of the bitstream to prevent expansion of the storage capacity is significantly large. Industrial applicability of the image storage device according to the embodiment will be sufficient.

본 실시예에 따른 트랜스코더(220)를 영상 저장 장치(130)에 탑재할 때, 트랜스코더(220)의 인코더부는 전술한 처리를 수행할 수 있도록 신규 개발될 수도 있다. 이 경우, 트랜스코더(220)의 인코더부의 구성과 동작 구조는 전술한 설명을 통해 당업자가 쉽게 이해할 수 있으르므로 이에 대한 상세한 설명은 생략한다. When the transcoder 220 according to the present embodiment is mounted on the image storage device 130 , the encoder unit of the transcoder 220 may be newly developed to perform the above-described processing. In this case, the configuration and operation structure of the encoder unit of the transcoder 220 can be easily understood by those skilled in the art through the foregoing description, and thus a detailed description thereof will be omitted.

또 다른 방식으로, 트랜스코더(220)의 인코더부를 도 6의 (a)에 예시된 바와 같이 종래의 인코더 구조를 동일하게 이용하되, 플래그 설정을 통해 본 실시예에 따른 동작이 가능하도록 변형하여 적용할 수도 있다. In another method, the encoder unit of the transcoder 220 uses the same conventional encoder structure as illustrated in FIG. 6( a ), but by setting a flag, it is modified so that the operation according to the present embodiment is possible. You may.

도 6의 (a)에는 HEVC 인코더 구조가 예시되어 있다. 도시된 바와 같이, 인코더 구조를 형성하는 모듈들로는 블록 구조(Block Structure), 화면내 예측(Intra Prediction), 화면간 예측(Inter Prediction), 변환(Transform), 양자화(Quantization), 역변환(Inverse Transform), 역양자화(Inverse Quantization), 인루프 필터(In-loop Filter) 및 엔트로피 코딩(Entrophy Coding)이 있다. 6A illustrates an HEVC encoder structure. As shown, the modules forming the encoder structure include Block Structure, Intra Prediction, Inter Prediction, Transform, Quantization, and Inverse Transform. , inverse quantization, in-loop filter, and entropy coding.

전술한 블록들로 구성된 인코더는 일반적으로 손실 부호화(lossy coding) 방식으로 처리되며, 이로 인해 최종 부호화 결과물에서는 손실이 발생된다. 특히 양자화(Quantization) 블록에서 많은 손실이 발생되고, 변환(Transform)과 인루프 필터(In-loop Filter)에서도 약간의 손실이 발생될 수 있다. The encoder composed of the above-described blocks is generally processed by a lossy coding method, which causes loss in the final encoding result. In particular, a lot of loss may occur in the quantization block, and some loss may also occur in the transform and in-loop filter.

따라서, 시퀸스 레벨의 정보를 포함하고 있는 파라미터 세트인 SPS(Sequence Parameter Set), 픽쳐 레벨의 정보를 포함하고 있는 파라미터 세트인 PPS(Picture Parameter Set), 픽처 헤더 정보인 PH(Picture Header), 및/또는 CU 신택스(Coding Unit Syntax)의 플래그값을 조정함으로써, 트랜스코더(220)의 인코더부가 무손실 부호화 처리를 수행하도록 조정할 수 있다.Accordingly, SPS (Sequence Parameter Set), which is a parameter set including sequence level information, PPS (Picture Parameter Set), which is a parameter set including picture level information, PH (Picture Header), which is picture header information, and/ Alternatively, by adjusting a flag value of a CU syntax (Coding Unit Syntax), the encoder unit of the transcoder 220 may be adjusted to perform lossless encoding processing.

구체적으로, HEVC 인코더의 파라미터 세트인 PPS 내의 transquant_bypass_enabled_flag(즉, transquant bypass 기능의 온/오프를 지정하는 플래그)를 온(on) 지정하여 코딩 유닛(CU)별로 transquant bypass할 수 있도록 하고, 트랜스코딩 대상 프레임 내의 모든 블록(즉, 코딩 유닛)을 무손실 부호화하도록 CU 신택스의 코딩 유닛용 플래그인 cu_transquant_bypass_flag를 온(on) 지정한다. Specifically, transquant_bypass_enabled_flag (that is, a flag that specifies on/off of the transquant bypass function) in the PPS, which is the parameter set of the HEVC encoder, is turned on to enable transquant bypass for each coding unit (CU), and to be transcoded cu_transquant_bypass_flag, which is a flag for a coding unit of a CU syntax, is turned on to losslessly encode all blocks (ie, coding units) in a frame.

이를 통해, 트랜스코더(220)의 인코더부는 도 6의 (b)에 예시된 바와 같이, 무손실을 보장하는 최소한의 모듈(즉, 블록 구조(Block Structure), 화면내 예측(Intra Prediction), 화면간 예측(Inter Prediction) 및 엔트로피 코딩(Entrophy Coding))만이 동작하는 인코더 구조를 이용할 수 있다. Through this, the encoder unit of the transcoder 220, as exemplified in FIG. 6(b), has a minimum module that guarantees losslessness (that is, a block structure, an intra prediction, and an inter-screen operation). An encoder structure in which only prediction (Inter Prediction) and entropy coding (Entrophy Coding) operates may be used.

이와 같이 개선된 인코더 구조는 여러개의 모듈의 동작을 생략함으로써 인코딩 복잡도를 크게 저감시킬 수 있고, 또한 트랜스코더(220)의 인코더부를 신규 개발할지라도 최소한의 모듈이 포함되도록 할 수 있어 구현 간소화가 가능한 장점도 있다.The improved encoder structure can greatly reduce encoding complexity by omitting the operation of a plurality of modules, and, even if the encoder unit of the transcoder 220 is newly developed, a minimum number of modules can be included, thereby simplifying implementation. there is also

전술한 개선된 인코더 구조를 활용하는 영상 저장 장치(130)는 재가공된 비트스트림을 저장부(230)에 저장하는 과정에서 트랜스코딩과 관련된 참조 관계를 나타내는 비트스트림의 헤더 정보들을 수정하여 전술한 방식으로 가공된 비트스트림을 저장부(230)에 저장한 후, 관제 센터(140)로부터 특정 영상을 요청하는 경우 상응하는 비트스트림을 저장부(230)에서 검색하여 관제 센터(140)로 제공할 수 있을 것이다. 이 경우, 저장부(230)에 저장된 재가공된 비트스트림 형태로 관제 센터(140)로 제공함으로써 관리 효율성을 높일 수는 있으나, 관제 센터(140)에서 해당 영상의 이용시 상대적으로 랜덤 억세스가 제약될 수 있다. In the process of storing the reprocessed bitstream in the storage unit 230 , the image storage device 130 utilizing the improved encoder structure described above modifies header information of a bitstream indicating a reference relation related to transcoding in the above-described manner. After storing the processed bitstream in the storage unit 230 , when a specific image is requested from the control center 140 , the corresponding bitstream is retrieved from the storage unit 230 and provided to the control center 140 . There will be. In this case, management efficiency can be increased by providing the image to the control center 140 in the form of a reprocessed bitstream stored in the storage unit 230 , but relatively random access may be restricted when the video is used in the control center 140 . have.

이외에도, 영상 저장 장치(130)는 영상 전송기(240)로부터 수신된 비트스트림을 재가공하여 저장부(230)에 저장하되, 관제 센터(140)로부터 특정 영상을 요청하는 경우 상응하는 비트스트림에서 트랜스코딩되어 P 프레임으로 변경된 트랜스코딩 대상 프레임을 다시 I 프레임으로 트랜스코딩하여 비트스트림을 재가공하여 관제 센터(140)로 제공할 수 있을 것이다. 이 경우, 무손실 코딩 기법을 적용하여 화질 열화없이 비트스트림을 재가공하는 처리 복잡도는 증가될 수 있으나, 관제 센터(140)에서 해당 영상의 이용시 상대적으로 랜덤 억세스 성능이 향상될 수 있다. In addition, the image storage device 130 reprocesses the bitstream received from the image transmitter 240 and stores it in the storage unit 230 , but when a specific image is requested from the control center 140 , it is transcoded from the corresponding bitstream. By transcoding the target transcoding frame changed to the P frame back into the I frame, the bitstream may be reprocessed and provided to the control center 140 . In this case, the processing complexity of reprocessing the bitstream without degrading the image quality by applying the lossless coding technique may be increased, but the random access performance may be relatively improved when the corresponding image is used in the control center 140 .

이제까지, 본 실시예에 따른 트랜스코더(220)가 구비된 영상 저장 장치(130)가 CCTV 시스템에 적용되는 경우를 중심으로 설명하였으나, 이외에도 본 발명은 장면 전환 없이 고정된 IP 카메라가 촬영한 영상에 상응하는 비트스트림을 수신하여 저장하는 영상 저장 장치가 필요시되는 다양한 분야에 제한없이 적용될 수 있음은 당연하다. So far, the description has been focused on the case where the image storage device 130 equipped with the transcoder 220 according to the present embodiment is applied to a CCTV system, but in addition, the present invention provides an image captured by a fixed IP camera without a scene change. It goes without saying that an image storage device for receiving and storing a corresponding bitstream can be applied to various fields without limitation.

상술한 영상 저장 방법은 영상 처리 장치 등의 디지털 처리 장치에 내장된 소프트웨어 프로그램, 어플리케이션 등으로 구현되어 시계열적 순서에 따른 자동화된 절차로 수행될 수도 있음은 당연하다. 상기 프로그램 등을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 상기 방법을 구현한다. It goes without saying that the above-described image storage method may be implemented as a software program or an application embedded in a digital processing device such as an image processing device, and may be performed as an automated procedure according to a time-series sequence. Codes and code segments constituting the program or the like can be easily inferred by a computer programmer in the art. In addition, the program is stored in a computer readable media (computer readable media), is read and executed by the computer to implement the method.

상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the above has been described with reference to the embodiments of the present invention, those of ordinary skill in the art can variously modify and change the present invention within the scope without departing from the spirit and scope of the present invention described in the claims below. You will understand that it can be done.

110 : 카메라 그룹 120 : 영상 분배 장치
130 : 영상 저장 장치 140 : 관제 센터
210 : 디코더 220 : 트랜스코더
230 : 저장부 240 : 영상 전송기
110: camera group 120: video distribution device
130: video storage device 140: control center
210: decoder 220: transcoder
230: storage unit 240: video transmitter

Claims (11)

제1 비트스트림의 IDR 주기(IDR Period)의 시간 길이와 상이한 시간 길이의 갱신 IDR 주기를 가지는 제2 비트스트림이 가공되도록 하기 위해, 상기 제1 비트스트림의 적어도 일부를 트랜스코딩하는 트랜스코더; 및
상기 제2 비트스트림을 저장하는 저장부를 포함하되,
상기 트랜스코더는 상기 제1 비트스트림에 IDR 주기에 따라 연속 배열된 GOP(Group of Picture)들 중 1번째를 제외한 GOP들에 각각 포함된 인트라 프레임(Intra frame) 중 하나 이상을 트랜스코딩 대상 프레임으로 선택하여 인터 프레임(inter frame)으로 트랜스코딩함으로써 갱신 IDR 주기를 가지는 상기 제2 비트스트림으로 가공하고,
트랜스코딩 대상 프레임으로 선택되어 상기 트랜스코더에 의해 인트라 프레임이 트랜스코딩된 인터 프레임은 선행하여 위치된 인트라 프레임 및 트랜스코딩된 인터 프레임 중 하나 이상과 참조 관계를 가지게 되는, 영상 저장 장치.
a transcoder for transcoding at least a portion of the first bitstream so as to process a second bitstream having an update IDR period of a time length different from a time length of an IDR period of the first bitstream; and
A storage unit for storing the second bitstream,
The transcoder converts at least one of intra frames included in each of the GOPs except the first among Group of Pictures (GOPs) consecutively arranged according to the IDR period in the first bitstream as a target frame for transcoding. Processed into the second bitstream having an updated IDR period by selectively transcoding into an inter frame,
An inter frame selected as a target frame to be transcoded and an intra frame transcoded by the transcoder has a reference relationship with at least one of an intra frame and a transcoded inter frame positioned previously.
제1항에 있어서,
상기 제2 비트스트림 내에서 갱신 IDR 주기들 각각의 시간 길이는 전체적으로 동일하게 적용되거나, 미리 지정된 비트스트림 특성 해석 규칙에 따라 상기 제1 비트스트림을 해석하여 적응적으로 결정되어 적용되는, 영상 저장 장치.
According to claim 1,
The time length of each of the update IDR periods in the second bitstream is equally applied as a whole, or is adaptively determined and applied by analyzing the first bitstream according to a predetermined bitstream characteristic interpretation rule. .
제2항에 있어서,
상기 제2 비트스트림 내에서 전체적으로 동일한 시간 길이의 갱신 IDR 주기를 가지도록 미리 지정되는 경우,
상기 트랜스코더는 상기 제2 비트스트림 내의 각 갱신 IDR 주기의 시간 길이에 해당되는 상기 제1 비트스트림 내의 복수개의 GOP(Group of Picture)들 중 2번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들만을 트랜스코딩 대상 프레임으로 한정하고, 1번째 GOP 내의 인트라 프레임과 트랜스코딩 대상 프레임으로 한정한 인트라 프레임들 사이에 상기 참조 관계를 가지도록, 상기 제1 비트스트림을 상기 제2 비트스트림으로 가공하는, 영상 저장 장치.
3. The method of claim 2,
When it is previously designated to have an update IDR period of the same time length as a whole in the second bitstream,
The transcoder receives only intra frames respectively included in the second GOP to the last GOP among a plurality of GOPs (Group of Pictures) in the first bitstream corresponding to the time length of each update IDR period in the second bitstream. A video of processing the first bitstream into the second bitstream so as to have the reference relation between the intra frame defined as the transcoding target frame and the intra frame within the first GOP and the transcoding target frame storage device.
제2항에 있어서,
상기 갱신 IDR 주기의 시간 길이는, 상기 저장부에 저장될 비트스트림이 제공되는 채널의 수, 상기 저장부의 총 저장용량 크기, 상기 저장부의 여유 저장용량 크기 및 비트스트림이 상기 저장부에 저장되어 유지되는 기간 중 하나 이상을 고려 팩터(factor)로 가지도록 미리 규정된 수학식에 의해 산출되는, 영상 저장 장치.
3. The method of claim 2,
The length of time of the update IDR cycle includes the number of channels through which the bitstream to be stored in the storage unit is provided, the total storage capacity size of the storage unit, the free storage capacity size of the storage unit, and the bitstream is stored and maintained in the storage unit An image storage device, calculated by a pre-defined equation to have one or more of the periods of time as a factor to be taken into account.
제2항에 있어서,
상기 갱신 IDR 주기의 시간 길이를 적응적으로 결정하기 위한 상기 비트스트림 특성 해석 규칙은,
상기 제1 비트스트림에 속하는 복수의 GOP(Group of Picture)들 중 2번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들 각각에 대해 선행하여 위치된 1번째 GOP 내의 인트라 프레임 또는 참조하고자 하는 프레임과의 차이값을 산출하여, 프레임간의 차이값이 미리 지정된 임계값 이하인 경우에만 트랜스코딩 대상 프레임으로 특정하여 인터 프레임으로 변경하되,
프레임 간의 차이값은 SAD(Sum of Absolute Difference), MSE(Mean Squared Error), SSE(Sum of Squared Error) 및 SAE(Sum of Absolute Error) 중 하나 이상을 이용하여 산출되는, 영상 저장 장치.
3. The method of claim 2,
The bitstream characteristic interpretation rule for adaptively determining the time length of the update IDR period is,
Among the plurality of groups of pictures (GOPs) belonging to the first bitstream, the intra frame in the first GOP positioned prior to each of the intra frames included in the second GOP to the last GOP, or a frame to be referenced By calculating a difference value, only when the difference value between frames is less than or equal to a predetermined threshold value, it is specified as a frame to be transcoded and changed to an inter frame
The difference value between frames is calculated using one or more of Sum of Absolute Difference (SAD), Mean Squared Error (MSE), Sum of Squared Error (SSE), and Sum of Absolute Error (SAE).
제1항에 있어서,
상기 트랜스코더는 트랜스코딩 대상 프레임으로 선택된 인트라 프레임을 무손실 부호화(lossless coding) 기법으로 인터 프레임으로 변경시키는, 영상 저장 장치.
According to claim 1,
and the transcoder converts an intra frame selected as a transcoding target frame into an inter frame using a lossless coding technique.
제6항에 있어서,
상기 트랜스코더의 인코더부가 무손실 부호화 기법으로 동작하도록 하기 위해, SPS(Sequence Parameter Set), PPS(Picture Parameter Set), PH(Picture Header) 및 CU 신택스(Coding Unit Syntax) 중 하나 이상의 플래그값이 조정되는, 영상 저장 장치.
7. The method of claim 6,
In order for the encoder unit of the transcoder to operate in a lossless coding scheme, one or more flag values of a sequence parameter set (SPS), a picture parameter set (PPS), a picture header (PH), and a CU syntax (Coding Unit Syntax) are adjusted. , video storage.
영상 저장 방법을 수행하도록 하는 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 단계들을 수행하도록 하며, 상기 단계들은,
(a) 영상 전송기로부터 제1 비트스트림을 제공받는 단계; 및
(b) 제1 비트스트림의 IDR 주기(IDR Period)의 시간 길이와 상이한 시간 길이의 갱신 IDR 주기를 가지는 제2 비트스트림이 가공되도록 하기 위해, 상기 제1 비트스트림의 적어도 일부를 트랜스코딩하는 단계를 포함하되,
상기 단계 (b)에서,
상기 제1 비트스트림에 IDR 주기에 따라 연속 배열된 GOP(Group of Picture)들 중 1번째를 제외한 GOP들에 각각 포함된 인트라 프레임(Intra frame) 중 하나 이상이 트랜스코딩 대상 프레임으로 선택되어 인터 프레임(inter frame)으로 트랜스코딩됨으로써 갱신 IDR 주기를 가지는 상기 제2 비트스트림으로 가공되고,
트랜스코딩 대상 프레임으로 선택되어 트랜스코더에 의해 인트라 프레임이 트랜스코딩된 인터 프레임은 선행하여 위치된 인트라 프레임 및 트랜스코딩된 인터 프레임 중 하나 이상과 참조 관계를 가지게 되며,
상기 제2 비트스트림 내에서 갱신 IDR 주기들 각각의 시간 길이는 전체적으로 동일하게 적용되거나, 미리 지정된 비트스트림 특성 해석 규칙에 따라 상기 제1 비트스트림을 해석하여 적응적으로 결정되어 적용되는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
A computer program stored on a computer-readable medium for performing an image storage method, the computer program causing a computer to perform the following steps, the steps comprising:
(a) receiving a first bitstream from an image transmitter; and
(b) transcoding at least a part of the first bitstream so that a second bitstream having an update IDR period of a time length different from a time length of an IDR period of the first bitstream is processed including,
In step (b),
At least one of intra frames included in each of the GOPs except for the first among groups of pictures (GOPs) consecutively arranged according to the IDR period in the first bitstream are selected as the transcoding target frame, and the inter frame By transcoding into (inter frame), it is processed into the second bitstream having an updated IDR period,
An inter frame in which the intra frame is transcoded by the transcoder selected as the target frame for transcoding has a reference relationship with at least one of an intra frame and a transcoded inter frame positioned previously,
The time length of each of the update IDR periods in the second bitstream is equally applied as a whole, or is adaptively determined and applied by interpreting the first bitstream according to a predetermined bitstream characteristic interpretation rule. A computer program stored on a capable medium.
제8항에 있어서,
상기 제2 비트스트림 내에서 전체적으로 동일한 시간 길이의 갱신 IDR 주기를 가지도록 미리 지정되는 경우,
상기 단계 (b)에서, 상기 제2 비트스트림 내의 각 갱신 IDR 주기의 시간 길이에 해당되는 상기 제1 비트스트림 내의 복수개의 GOP(Group of Picture)들 중 2번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들만을 트랜스코딩 대상 프레임으로 한정하고, 트랜스코딩 대상 프레임으로 한정한 인트라 프레임들 사이에 상기 참조 관계를 가지도록, 상기 제1 비트스트림이 상기 제2 비트스트림으로 가공되는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
9. The method of claim 8,
When it is previously designated to have an update IDR period of the same time length as a whole in the second bitstream,
In step (b), intras included in each of the second GOP to the last GOP among a plurality of GOPs (Group of Pictures) in the first bitstream corresponding to the time length of each update IDR cycle in the second bitstream wherein the first bitstream is processed into the second bitstream to define only frames as to-be-transcoded frames, and to have the reference relationship between intra frames defined as frames to be transcoded. stored in a computer program.
제8항에 있어서,
상기 갱신 IDR 주기의 시간 길이는, 저장부에 저장될 비트스트림이 제공되는 채널의 수, 상기 저장부의 총 저장용량 크기, 상기 저장부의 여유 저장용량 크기 및 비트스트림이 상기 저장부에 저장되어 유지되는 기간 중 하나 이상을 고려 팩터(factor)로 가지도록 미리 규정된 수학식에 의해 산출되는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
9. The method of claim 8,
The length of time of the update IDR cycle includes the number of channels through which the bitstream to be stored in the storage unit is provided, the total storage capacity size of the storage unit, the free storage capacity size of the storage unit and the bitstream is stored and maintained in the storage unit. A computer program stored on a computer-readable medium, calculated by an equation predefined to have one or more of the time periods as a factor of consideration.
제8항에 있어서,
상기 갱신 IDR 주기의 시간 길이를 적응적으로 결정하기 위한 상기 비트스트림 특성 해석 규칙은,
상기 제1 비트스트림에 속하는 복수의 GOP(Group of Picture)들 중 2번째 GOP부터 마지막 GOP에 각각 포함된 인트라 프레임들 각각에 대해 선행하여 위치된 1번째 GOP 내의 인트라 프레임 또는 참조하고자 하는 프레임과의 차이값을 산출하여, 프레임간의 차이값이 미리 지정된 임계값 이하인 경우에만 트랜스코딩 대상 프레임으로 특정하여 인터 프레임으로 변경하되,
프레임 간의 차이값은 SAD(Sum of Absolute Difference), MSE(Mean Squared Error), SSE(Sum of Squared Error) 및 SAE(Sum of Absolute Error) 중 하나 이상을 이용하여 산출되는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
9. The method of claim 8,
The bitstream characteristic interpretation rule for adaptively determining the time length of the update IDR period is,
Among the plurality of groups of pictures (GOPs) belonging to the first bitstream, the intra frame in the first GOP positioned prior to each of the intra frames included in the second GOP to the last GOP, or a frame to be referenced By calculating a difference value, only when the difference value between frames is less than or equal to a predetermined threshold value, it is specified as a transcoding target frame and changed to an inter frame,
The difference value between frames is calculated using one or more of Sum of Absolute Difference (SAD), Mean Squared Error (MSE), Sum of Squared Error (SSE), and Sum of Absolute Error (SAE) on a computer-readable medium. stored computer programs.
KR1020200008843A 2020-01-22 2020-01-22 Apparatus and method for recording video data KR102271118B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200008843A KR102271118B1 (en) 2020-01-22 2020-01-22 Apparatus and method for recording video data
PCT/KR2020/013182 WO2021149892A1 (en) 2020-01-22 2020-09-28 Apparatus and method for recording video data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200008843A KR102271118B1 (en) 2020-01-22 2020-01-22 Apparatus and method for recording video data

Publications (1)

Publication Number Publication Date
KR102271118B1 true KR102271118B1 (en) 2021-06-30

Family

ID=76601943

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200008843A KR102271118B1 (en) 2020-01-22 2020-01-22 Apparatus and method for recording video data

Country Status (2)

Country Link
KR (1) KR102271118B1 (en)
WO (1) WO2021149892A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102510454B1 (en) * 2022-09-02 2023-03-16 주식회사 솔디아 Video streaming delivery system with reduced transmission volume

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4383705A1 (en) * 2022-12-06 2024-06-12 Axis AB A method and device for pruning a video sequence

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070038700A (en) * 2005-10-06 2007-04-11 삼성전자주식회사 Method for coding of moving picture frame with less flickering and apparatus therefor
KR20070051757A (en) * 2005-11-15 2007-05-18 한국전자통신연구원 A method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same
KR20080033813A (en) * 2006-10-13 2008-04-17 삼성전자주식회사 / Method and apparatus for encoding /decoding data
JP2014064124A (en) * 2012-09-20 2014-04-10 Casio Comput Co Ltd Video processing device, video processing method, and program
JP2018019186A (en) * 2016-07-26 2018-02-01 Kddi株式会社 Transcoding system, transcoding method, computer readable recording medium, decoder and encoder
KR102012037B1 (en) 2019-05-16 2019-08-19 주식회사 경림이앤지 Transcoding and encryption transmission device of video and audio data of IP based CCTV camera

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070038700A (en) * 2005-10-06 2007-04-11 삼성전자주식회사 Method for coding of moving picture frame with less flickering and apparatus therefor
KR20070051757A (en) * 2005-11-15 2007-05-18 한국전자통신연구원 A method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same
KR20080033813A (en) * 2006-10-13 2008-04-17 삼성전자주식회사 / Method and apparatus for encoding /decoding data
JP2014064124A (en) * 2012-09-20 2014-04-10 Casio Comput Co Ltd Video processing device, video processing method, and program
JP2018019186A (en) * 2016-07-26 2018-02-01 Kddi株式会社 Transcoding system, transcoding method, computer readable recording medium, decoder and encoder
KR102012037B1 (en) 2019-05-16 2019-08-19 주식회사 경림이앤지 Transcoding and encryption transmission device of video and audio data of IP based CCTV camera

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102510454B1 (en) * 2022-09-02 2023-03-16 주식회사 솔디아 Video streaming delivery system with reduced transmission volume

Also Published As

Publication number Publication date
WO2021149892A1 (en) 2021-07-29

Similar Documents

Publication Publication Date Title
US20220303583A1 (en) Video coding using constructed reference frames
US10225549B1 (en) System and method for video coding
US8649431B2 (en) Method and apparatus for encoding and decoding image by using filtered prediction block
US9414086B2 (en) Partial frame utilization in video codecs
US20150201208A1 (en) Image encoding and decoding apparatus and method
KR102518627B1 (en) Image encoding method, decoding method, encoder and decoder
WO2013001013A1 (en) Method for decoding a scalable video bit-stream, and corresponding decoding device
KR102271118B1 (en) Apparatus and method for recording video data
US20140029663A1 (en) Encoding techniques for banding reduction
JP6480310B2 (en) Video encoding method, video encoding apparatus, and video encoding program
US20100329336A1 (en) Method and apparatus for encoding and decoding based on inter prediction using image inpainting
JP2024102338A (en) Image decoding method and apparatus for coding image information including picture header
JP2017126896A (en) Monitoring system, monitoring device, and reproducer
US20090245386A1 (en) Method and apparatus for encoding a flash picture occurring in a video sequence, and for decoding corresponding data for a flash picture
KR102020953B1 (en) Image Reencoding Method based on Decoding Data of Image of Camera and System thereof
RU2795812C1 (en) Method and device for image coding/decoding using adaptive color conversion and method for bitstream transmission
US20240276023A1 (en) Encoding of pre-processed image frames
KR20090078114A (en) Multi-view image coding method and apparatus using variable gop prediction structure, multi-view image decoding apparatus and recording medium storing program for performing the method thereof
KR20240084469A (en) A method and device for prunning a video sequence
KR100459274B1 (en) Apparatus and method for encoding an image
CN110572680A (en) Video decoding method, video encoding device, storage medium, video decoder, and video encoder
JP2007336138A (en) Video recording apparatus and video recording program
JP2018113525A (en) Moving picture encoding device and moving picture encoding method
Freedman Video Compression
JP2014023081A (en) Image encoding device and method thereof

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant