VC-6
VC-6SMPTE ST 2117-1은 [1]비디오 코딩 형식입니다.[2]
개요
VC-6 코덱은 중간,[2] 메자닌 또는 기여 코딩 애플리케이션에 최적화되어 있습니다.통상, 이러한 애플리케이션에는, 편집, 투고, 프라이머리 배포, 아카이브, 및 그 외의 애플리케이션용으로 완성된 구성을 압축하는 것과 동시에, 가능한 한 원래의 화질을 유지하면서, 비트 레이트를 삭감해, 처리, 전력, 스토리지 요건을 최적화할 필요가 있는 것이 포함됩니다.VC-6은 이 카테고리의[3][4] 다른 코덱과 마찬가지로 프레임 내 압축만을 사용합니다.각 프레임은 개별적으로 저장되며 다른 [5]프레임에 의존하지 않고 디코딩할 수 있습니다.코덱은 선택된 부호화 파라미터에 따라 무손실 압축과 무손실 압축을 구현합니다.그것은 2020년에 표준화되었다.V-Nova는 2015년부터 Perseus라는 상표명으로 이전 버전의 코덱을 배포했습니다.코덱은 s-tree라고 불리는 계층형 데이터 구조를 기반으로 하며 DCT 또는 wavelet 변환 압축은 포함하지 않습니다.압축 메커니즘은 압축되는 데이터와 독립적이며 픽셀뿐만 아니라 다른 비이미지 [6]데이터에도 적용할 수 있습니다.
DCT 기반의 코덱과는 달리 VC-6은 변경된 쿼드리와 유사한 계층형 반복 가능한S 트리 구조를 기반으로 합니다.이러한 단순한 구조는 대규모 병렬[7] 처리 및 저해상도 [8]이미지에서 고해상도 이미지를 재구성하는 데 사용되는 필터링 유형 선택과 같은 고유한 기능을 제공합니다.VC-6[2] 표준에서는 인루프 컨볼루션 뉴럴 네트워크로 개발된 업샘플러가 제공되어 큰 계산 오버헤드를 필요로 하지 않고 재구성된 영상의 디테일을 최적화한다.또한 VC-6 비트스트림 내에서 여러[2] 레벨로 공간적으로 네비게이트할 수 있기 때문에 디코딩 디바이스가 이미지의 다른 영역에 더 많은 리소스를 적용할 수 있기 때문에 Region-of-Interest 어플리케이션이 풀 [9]해상도 이미지의 디코딩 없이 압축 비트스트림 상에서 동작할 수 있습니다.
역사
2015년 NAB Show에서 V-Nova는 "H.264, HEVC 및 JPEG2000에 비해 [10]실제 실시간 운영 시나리오에서 모든 품질 수준에서 평균 2-3배 압축 이득"이라고 주장했다.주요 무역 박람회가 열리기 전인 4월 1일에 이 발표를 한 것은 많은 압축 [11]전문가들의 관심을 끌었다.그 이후 V-Nova는 Sky Italia,[12] Fast Filmz,[13][14] Harmonic Inc. 등을 포함한 전 세계 기여 및 배급 애플리케이션에 Perseus로 [10]알려진 기술을 배포하고 라이센스를 부여했습니다.디스트리뷰션코덱을 강화하기 위해 최적화된 테크놀로지의 변종이 곧 MPEG-5 Part-2 LCEVC로 [15][16][17]표준화됩니다.
핵심 개념
평면
이 표준은[2] 독립적인 데이터 평면에 적용되는 압축 알고리즘을 설명합니다.이러한 평면은 카메라에서 발생하는 RGB 또는 RGBA 픽셀, 기존 TV 중심 비디오 소스의 YCbCr 픽셀 또는 기타 데이터 평면일 수 있습니다.최대 255개의 독립된 데이터 평면이 있을 수 있으며 각 평면은 최대 65535 x 65535의 [18]데이터 값의 그리드를 가질 수 있습니다.SMPTE ST 2117-1 표준은 데이터 값(일반적으로 픽셀)의 평면을 압축하는 데 초점을 맞춥니다.각 플레인의 데이터를 압축 및 압축 해제하기 위해 VC-6은 다른 트리를 예측하기 위해 사용되는 메타데이터를 전송하는 작은 트리 같은 구조의 계층적 표현을 사용합니다.각 [2]평면에 3개의 기본 구조가 반복됩니다.
S트리
VC-6의 핵심 압축 구조는 s-tree입니다.이는 다른 스킴에서 일반적인 쿼드트리 구조와 유사합니다.s-트리는 트리 구조 내에 배치된 노드로 구성되며, 각 노드는 다음 층의 4개의 노드로 링크된다.루트 노드 위의 레이어 총수는 s-트리의 상승이라고 불립니다.비트스트림에서 annaudment 데이터를 선택적으로 반송함으로써 레벨을 예측할 수 있는지 여부를 메타데이터를 사용하여 s-tree에서 압축한다.예측 가능한 데이터가 많을수록 전송되는 정보가 적어지고 [6][2]압축률이 향상됩니다.
타블로
표준에서는[2] tableau를 다른 s-트리의 노드를 포함하는 루트노드 또는 s-트리의 최상위 레이어로 정의하고 있습니다.tableaux는 구성원의 일반적인 s-tree와 마찬가지로 노드 내의 메타데이터를 가진 계층으로 배열되어 상위 계층이 예측되는지 비트스트림에서 [6]전송되는지 여부를 나타냅니다.
에셜론
표준의[2] 계층형 s-tree 및 tableau 구조는 비트스트림 페이로드로 전송해야 하는 미가공 데이터의 양을 줄이기 위해 확장 기능(레지던트밸이라고 불린다) 및 기타 메타데이터를 전송하기 위해 사용됩니다.마지막 계층적 도구는 각 평면(즉, 픽셀)의 데이터를 다른 분해능으로 역양자화하고 더 높은 분해능을 위한 예측 변수로 사용할 수 있도록 테이블을 배열하는 기능입니다.각 해상도는 표준에서[2] echelon으로 정의됩니다.평면 내의 각 에켈론은 지수에 의해 식별되며, 여기서 음의 지수가 낮은 분해능을 나타내고, 더 크고 양의 지수가 높은 분해능을 나타낸다.
비트스트림의 개요
VC-6은 프레임 내 코딩의 일례입니다.각 화상은 다른 화상을 참조하지 않고 코딩됩니다.또한 한 평면의 정보가 다른 평면을 예측하는 데 사용되지 않는 평면 내이기도 합니다.그 결과 VC-6 비트스트림에는 단일 [2]이미지의 모든 평면에 대한 모든 정보가 포함됩니다.화상 시퀀스는 복수의 화상에 대한 비트스트림을 연결하거나 MXF, Quicktime 또는 Matroska 등의 용기에 패키지함으로써 작성됩니다.
VC-6 비트스트림은 [2]표준에서 의사 코드에 의해 정의되며, 참조 디코더는 이 정의에 기초하여 시연되었습니다.프라이머리 헤더는 표준에 [2]의해 정의된 유일한 고정 구조입니다.세컨더리 헤더에는 프라이머리 헤더 값에 따라 마커와 사이징 정보가 포함됩니다.세 번째 헤더는 완전히 계산되며, 다음으로 payload 구조는 헤더[2] 디코딩 중에 계산된 파라미터에서 도출됩니다.
디코딩 개요
표준에서는[2] 비트스트림에서 영상을 디코딩하기 위한 평면 재구성이라는 프로세스를 정의합니다.프로세스는 지수가 가장 낮은 echelon부터 시작합니다.이 계산에는 예측이 사용되지 않습니다.먼저 비트스트림 규칙을 사용하여 잔차를 재구성합니다.다음으로 각 좌표의 데이터 값으로 그리드를 채우는 데스파라이제이션 및 엔트로피 복호화 처리를 실시한다.그런 다음 이러한 값을 역양자화하여 다음으로 높은 지수를 가진 경제계층에 대한 예측으로 사용할 수 있는 전체 범위 값을 생성한다.각 echelon은 헤더에 지정된 업샘플러를 사용하여 아래의 echelon에서 예측된 평면을 작성합니다.이 평면은 다음 echelon에 [19]대한 예측으로 현재 echelon의 나머지 그리드에 추가됩니다.
표준에 의해 정의된 최종 최대 분해능 echelon은 지수 0에 있으며, 다른 [2]echelon에 사용되는 대신 결과가 표시된다.
업샘플러 옵션
기본 옵션
이 규격에서는[2] 저해상도로부터 고해상도 예측을 작성하기 위한 다수의 기본적인 업앰프를[20] 정의하고 있습니다.리니어 업샘플러는 바이큐빅과 샤프, 그리고 가장 가까운 이웃 업샘플러가 있습니다.
컨볼루션 뉴럴 네트워크 업샘플러
6개의 서로 [20]다른 비선형 업앰프는 JSON 형식으로 제공되는 프로세스 및 계수 세트에 의해[2] 정의됩니다.이러한 계수는 Convolutional Neural[21] Network 기술을 사용하여 생성되었다.
레퍼런스
- ^ "IEEE Xplore Search Results". ieeexplore.ieee.org. Retrieved 17 September 2020.
- ^ a b c d e f g h i j k l m n o p q r "ST 2117-1:2020 - SMPTE Standard - VC-6 Multiplanar Picture Format — Part 1. Elementary Bitstream". St 2117-1:2020: 1–156. July 2020. doi:10.5594/SMPTE.ST2117-1.2020. ISBN 978-1-68303-219-9.
- ^ "ST 2042-1:2012 - SMPTE Standard - VC-2 Video Compression". St 2042-1:2012: 1–137. August 2012. doi:10.5594/SMPTE.ST2042-1.2012. ISBN 978-1-61482-890-7.
- ^ "ST 2019-1:2016 - SMPTE Standard - VC-3 Picture Compression and Data Stream Format". St 2019-1:2016: 1–108. June 2016. doi:10.5594/SMPTE.ST2019-1.2016. ISBN 978-1-68303-020-1.
- ^ "ST 2073-1:2014 - SMPTE Standard - VC-5 Video Essence - Part 1: Elementary Bitstream". St 2073-1:2014: 1–50. March 2014. doi:10.5594/SMPTE.ST2073-1.2014. ISBN 978-1-61482-797-9.
- ^ a b c "SMPTE Ratifies V-Nova's AI-Powered VC-6 Video Codec". Digital Media World.
- ^ Hung, Yubin; Rosenfeld, Azriel (1 August 1989). "Parallel processing of linear quadtrees on a mesh-connected computer". Journal of Parallel and Distributed Computing. 7 (1): 1–27. doi:10.1016/0743-7315(89)90049-X. ISSN 0743-7315.
- ^ Samet, Hanan (1988), "An Overview of Quadtrees, Octrees, and Related Hierarchical Data Structures", Theoretical Foundations of Computer Graphics and CAD, Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 51–68, doi:10.1007/978-3-642-83539-1_2, ISBN 978-3-642-83541-4, retrieved 9 September 2020
- ^ S., V. G. "SMPTE Publishes New VC-6 Video Production Codec Standard". Sports Video Group.
- ^ a b "Review: V-Nova Perseus: Does its Compression Live Up to the Hype?". Streaming Media Magazine. 17 June 2016. Retrieved 4 September 2020.
- ^ "Historical timeline of video coding standards and formats". Vcodex. Retrieved 30 July 2021.
- ^ "Sky Italia chooses V-Nova to extend IPTV reach". Digital TV Europe.
- ^ "India's FastFilmz taps V-Nova to deliver OTT to 2G phones". Digital TV Europe. 7 April 2016. Retrieved 9 September 2020.
- ^ "SHAREit Acquires Fastfilmz To Increase Video Content, Regional Users". Inc42 Media. 8 May 2018. Retrieved 17 September 2020.
- ^ "MPEG-5 LCEVC".
- ^ "V-Nova announces MPEG-5 Part 2 LCEVC". TVB Europe.
- ^ "Perseus politics leak out at NAB in wake of MPEG-5 revelation". Rethnk Research. 11 April 2019.
- ^ "VC-6 Overview". mrmxf.com.
- ^ "ST 2117-1:2020 - SMPTE Standard - VC-6 Multiplanar Picture Format — Part 1. Elementary Bitstream". ST 2117-1:2020. July 2020. pp. 1–156. doi:10.5594/SMPTE.ST2117-1.2020.
- ^ a b ST 2117-1 upsampler media element. St 2117-1:2020. 21 July 2020. pp. 1–156. doi:10.5594/SMPTE.ST2117-1.2020. ISBN 978-1-68303-219-9.
- ^ Arabshahi, P. (May 1996). "Fundamentals of Artificial Neural Networks [Book Reviews]". IEEE Transactions on Neural Networks. 7 (3): 793. doi:10.1109/tnn.1996.501738. ISSN 1045-9227. S2CID 6576607.