data 압축
Data compression정보 이론에서 데이터 압축, 소스 코딩 [1]또는 비트레이트 감소는 원래 [2]표현보다 적은 비트를 사용하여 정보를 인코딩하는 과정입니다.특정 압축은 손실 또는 무손실 중 하나입니다.무손실 압축은 통계적 용장성을 식별하고 제거함으로써 비트를 줄입니다.무손실 압축에서는 정보가 손실되지 않습니다.손실 압축은 불필요하거나 덜 중요한 [3]정보를 제거하여 비트를 줄입니다.일반적으로 데이터 압축을 실행하는 디바이스를 인코더라고 하며 프로세스의 반전(압축 해제)을 실행하는 디바이스를 디코더라고 합니다.
데이터 파일의 크기를 줄이는 프로세스를 데이터 압축이라고 합니다.데이터 전송에서는 소스 코딩이라고 합니다.데이터가 저장 또는 [4]전송되기 전에 데이터의 소스에서 부호화가 이루어집니다.소스 코딩은 오류 검출 및 수정을 위한 채널 코딩 또는 데이터를 신호에 매핑하는 수단인 라인 코딩과 혼동해서는 안 됩니다.
압축은 데이터 저장 및 전송에 필요한 리소스를 줄여주므로 유용합니다.계산 리소스는 압축 및 압축 해제 프로세스에서 소비됩니다.데이터 압축은 시공간 복잡성의 트레이드오프를 따릅니다.예를 들어, 비디오의 압축 스킴에서는, 비디오가 압축 해제되고 있을 때에, 비디오의 압축 해제 속도가 빨라지기 위해서 고가의 하드웨어가 필요하게 되는 경우가 있습니다.또, 비디오를 보기 전에, 비디오를 완전하게 압축 해제하는 옵션이 불편하거나, 추가의 스토리지가 필요한 경우도 있습니다.데이터 압축 스킴 설계에는 압축 정도, 왜곡량(손실 데이터 압축 사용 시), 데이터 압축[5] 및 압축 해제에 필요한 계산 리소스 등 다양한 요소 간의 트레이드오프가 포함됩니다.
무손실
무손실 데이터 압축 알고리즘은 일반적으로 통계적 용장성을 이용하여 정보를 잃지 않고 데이터를 나타내므로 프로세스가 되돌릴 수 있습니다.대부분의 실제 데이터는 통계적으로 중복되기 때문에 무손실 압축이 가능합니다.예를 들어, 이미지에는 여러 픽셀에 걸쳐 변하지 않는 색 영역이 있을 수 있습니다.데이터는 "빨간색 픽셀, 빨간 픽셀..."로 부호화되는 대신 "279 빨간색 픽셀"로 부호화될 수 있습니다.이것은 런렝스 부호화의 기본적인 예입니다.용장성을 배제하고 파일사이즈를 줄이는 방법이 많이 있습니다.
LZ(Lempel-Ziv) 압축 방법은 무손실 [6]스토리지에 가장 많이 사용되는 알고리즘 중 하나입니다.DEFLATE는 압축 속도 및 압축 비율에 최적화된 LZ의 변형이지만 압축 속도가 느릴 수 있습니다.1980년대 중반 Terry Welch의 연구에 따라 Lempel-Ziv-Welch(LZW) 알고리즘은 대부분의 범용 압축 시스템에서 빠르게 선택되는 방법이 되었습니다.LZW는 GIF 이미지, PKZIP 등의 프로그램 및 [7]모뎀 등의 하드웨어 디바이스에서 사용됩니다.LZ 메서드는 테이블엔트리가 반복되는 데이터 문자열로 대체되는 테이블 기반 압축 모델을 사용합니다.대부분의 LZ 방식에서 이 테이블은 입력의 이전 데이터에서 동적으로 생성됩니다.테이블 자체는 종종 Huffman 부호화 됩니다.이와 같은 문법 기반 코드는 매우 효과적으로 반복적인 입력을 압축할 수 있습니다. 예를 들어, 동일하거나 밀접한 관련이 있는 종의 생물학적 데이터 수집, 방대한 버전의 문서 수집, 인터넷 보관 등입니다.문법 기반 코드의 기본 작업은 단일 문자열을 파생하는 문맥 없는 문법을 구성하는 것입니다.다른 실용적인 문법 압축 알고리즘으로는 Sequitur와 Re-Pair가 있습니다.
가장 강력한 최신 무손실 압축기는 부분 일치를 통한 예측과 같은 확률론적 모델을 사용한다.버로우스 가족휠러 변환은 통계 [8]모델링의 간접적인 형태로도 볼 수 있다.확률론적 모델링의 직접적인 사용을 더욱 정교하게 하기 위해 통계 추정치는 산술 부호화라고 불리는 알고리즘과 결합될 수 있다.산술 부호화는 유한 상태 기계의 수학적 계산을 사용하여 일련의 입력 데이터 기호로부터 일련의 부호화된 비트를 생성하는 보다 현대적인 부호화 기술입니다.더 잘 알려진 Huffman 알고리즘과 같은 다른 기술에 비해 우수한 압축을 달성할 수 있습니다.내부 메모리 상태를 사용하여 정수 수의 비트를 사용하는 개별 입력 심볼과 개별 입력 심볼의 일대일 매핑을 수행할 필요가 없습니다.또, 데이터 심볼의 스트링 전체를 부호화한 후에만, 내부 메모리를 클리어합니다.산술 부호화는 통계치가 변화하고 상황에 따라 달라지는 적응형 데이터 압축 태스크에 특히 잘 적용된다. 이는 입력 데이터의 확률 분포의 적응형 모델과 쉽게 결합될 수 있기 때문이다.산술 부호화의 초기 사용 예는 JPEG 영상 부호화 표준의 [9]옵션 기능(다만 널리 사용되지 않음)에 있었습니다.이후 H.263, H.264/MPEG-4 AVC 및 HEVC를 포함한 다양한 설계에 적용되어 [10]왔다.
아카이브 소프트웨어에는 일반적으로 "사전 크기"를 조정할 수 있는 기능이 있습니다.이 경우 크기가 클수록 압축 및 압축 해제 시 더 많은 랜덤 액세스 메모리가 필요하지만 특히 파일 [11][12]컨텐츠의 반복 패턴에 대해 더 강하게 압축됩니다.
손실
1980년대 후반에는 디지털 이미지가 보편화되면서 무손실 이미지 압축의 표준이 등장했습니다.1990년대 초에 손실 압축 방법이 널리 [13]사용되기 시작했다.이러한 방식에서는 불필요한 세부 정보를 삭제하면 스토리지 공간을 절약할 수 있으므로 일부 정보 손실이 허용됩니다.정보의 보존과 사이즈의 축소 사이에는, 대응하는 트레이드 오프가 있습니다.손실 데이터 압축 방식은 사람들이 문제의 데이터를 어떻게 인식하는지에 대한 연구를 통해 설계되었습니다.예를 들어 인간의 눈은 색상의 변화보다 휘도의 미묘한 변화에 더 민감하다.JPEG 이미지 압축은 부분적으로 불필요한 정보를 [14]반올림함으로써 작동합니다.소리에는 심리음향학, 이미지와 비디오에는 심리음향학 등 많은 일반적인 압축 형식이 이러한 지각적 차이를 이용합니다.
손실 압축의 대부분은 변환 부호화, 특히 이산 코사인 변환(DCT)에 기초하고 있습니다.1972년 Nasir Ahmed에 의해 처음 제안되었으며, 1973년 T. 나타라잔 및 K. R. Rao와 함께 작업 알고리즘을 개발한 후 1974년 [15][16]1월에 도입하였다.DCT는 가장 널리 사용되는 손실 압축 방식이며 이미지(JPEG, HEIF [17]등), 비디오(MPEG, AVC, HEVC 등), 오디오(MP3, AAC, Vorbis 등)의 멀티미디어 형식으로 사용됩니다.
손실 이미지 압축은 저장 용량을 늘리기 위해 디지털 카메라에서 사용됩니다.마찬가지로 DVD, Blu-ray 및 스트리밍 비디오에서도 손실 비디오 코딩 형식을 사용합니다.손실 압축은 비디오에서 광범위하게 사용됩니다.
손실 오디오 압축에서는 음성 신호의 비청각(또는 덜청각) 컴포넌트를 제거하기 위해 정신 음향학 방법이 사용됩니다.인간의 음성 압축은 종종 훨씬 더 전문화된 기술로 수행된다. 음성 부호화는 범용 오디오 압축과는 별개의 분야로 구별된다.음성 부호화는 인터넷 텔레포니에서 사용됩니다.예를 들어 오디오 압축은 CD 리핑에 사용되며 오디오 [8]플레이어에 의해 디코딩됩니다.
손실 압축으로 인해 생성 손실이 발생할 수 있습니다.
이론.
압축의 이론적 근거는 정보 이론, 특히 무손실 압축에 대한 알고리즘 정보 이론과 손실 압축에 대한 속도 왜곡 이론에 의해 제공됩니다.이러한 연구 분야는 1940년대 후반과 1950년대 초반에 이 주제에 관한 기초 논문을 발표한 클로드 섀넌에 의해 근본적으로 만들어졌다.압축과 관련된 다른 주제로는 부호화 이론과 통계적 [18]추론이 있다.
기계 학습
기계 학습과 압축 사이에는 밀접한 관계가 있습니다.전체 이력이 주어진 시퀀스의 사후 확률을 예측하는 시스템은 최적의 데이터 압축에 사용할 수 있습니다(출력 분포에 산술 부호화를 사용).최적의 압축기는 예측에 사용할 수 있습니다(이전 이력을 고려할 때 가장 잘 압축되는 기호를 찾아냄).이러한 동등성은 데이터 압축을 "일반 인텔리전스"[19][20][21]의 벤치마크로 사용하기 위한 정당성으로 사용되어 왔습니다.
대체 뷰에서는 압축 알고리즘을 암묵적으로 문자열을 암묵적인 특징 공간 벡터에 매핑할 수 있으며 압축 기반의 유사성 측정으로 이들 특징 공간 내의 유사성을 계산할 수 있습니다.각 압축기 C(.)에 대해 우리는 C(.)가 벡터 노름 ~x에 대응하는 입력 문자열 x를 매핑하도록 관련 벡터 공간 θ를 정의한다. 모든 압축 알고리즘의 기초가 되는 특징 공간의 철저한 검사는 공간에 의해 배제된다. 대신, 특징 벡터는 세 가지 대표적인 무손실 압축 방법을 조사하도록 선택한다.LZW, LZ77 및 [22]PPM.
AIXI 이론에 따르면, 허터 상(Hutter Prize)에서 더 직접적으로 설명되는 연결은 x를 생성하는 가장 작은 소프트웨어입니다.예를 들어 이 모델에서 zip 파일의 압축 크기에는 zip 파일과 압축 해제 소프트웨어가 모두 포함되어 있습니다. 둘 다 없으면 압축을 풀 수 없지만 조합된 형식이 훨씬 더 작을 수 있습니다.
데이터 차이점 보관
데이터 압축은 데이터 차이점 [23][24]보관의 특별한 경우로 볼 수 있습니다.데이터 차이점 보관은 소스와 타겟이 주어진 차이를 생성하고, 소스와 차이가 주어진 타겟을 패치 적용으로 재현하는 것으로 구성됩니다.데이터 압축에는 별도의 소스 및 타깃이 없기 때문에 데이터 압축은 빈 소스 데이터와 데이터 차이, 즉 0과 차이에 해당하는 압축 파일로 간주할 수 있습니다.이는 절대 엔트로피(데이터 압축에 대응)를 초기 데이터가 없는 상대 엔트로피(데이터 차이 발생에 대응)의 특수한 경우로 간주하는 것과 같습니다.
차분 압축이라는 용어는 데이터 차분 연결을 강조하기 위해 사용됩니다.
사용하다
이미지
엔트로피 부호화는 [26]1950년에 개발된 허프만 부호화의 기초인 섀넌-파노 [25]부호화의 도입으로 1940년대에 시작되었다.변환 부호화는 1960년대 후반으로 거슬러 올라가 1968년에 고속 푸리에 변환(FFT) 부호화가 도입되었고 [27]1969년에 하다마르 변환이 도입되었습니다.
중요한 이미지 압축 기술은 1970년대 [15]초에 개발된 기술인 이산 코사인 변환(DCT)입니다.DCT는 [28]JPEG(Joint Photographic Experts Group)가 1992년에 도입한 손실 압축 형식인 JPEG의 기반입니다.JPEG는, 화질의 저하를 비교적 작게 해, 화상을 나타내는 데 필요한 데이터의 양을 큰폭으로 삭감해, 가장 널리 사용되고 있는 화상 파일 [29][30]형식이 되었습니다.디지털 이미지와 디지털 [31]사진의 광범위한 확산에는 매우 효율적인 DCT 기반 압축 알고리즘이 크게 기여했습니다.
Lempel-Ziv-Welch(LZW)는 1984년에 개발된 무손실 압축 알고리즘이다.1987년에 [32]도입된 GIF 형식으로 사용됩니다.DEFLATE는 1996년에 지정된 무손실 압축 알고리즘으로 Portable Network Graphics([33]PNG) 형식으로 사용됩니다.
이미지 압축에서 웨이브릿을 사용하는 웨이브릿 압축은 DCT [34]코딩 개발 이후 시작되었습니다.JPEG 2000 표준은 [35]2000년에 도입되었습니다.원래의 JPEG 형식에서 사용되는 DCT 알고리즘과 달리 JPEG 2000은 이산 웨이브릿 변환([36][37][38]DWT) 알고리즘을 사용합니다.Motion JPEG 2000 확장을 포함한 JPEG 2000 기술은 [39]2004년 디지털 시네마의 비디오 코딩 표준으로 선정되었습니다.
오디오
오디오 데이터 압축은 다이내믹 레인지 압축과 혼동하지 않고 오디오 데이터의 전송 대역폭 및 저장 요건을 줄일 수 있습니다.오디오 압축 알고리즘은 오디오코덱으로서 소프트웨어에 실장됩니다.무손실 압축에서는 부호화, 양자화, 이산 코사인 변환 및 선형 예측 등의 방법을 사용하여 비압축 데이터 표현에 사용되는 정보의 양을 감소시킴으로써 정보의 용장성을 감소시킨다.
손실 오디오 압축 알고리즘은 높은 압축을 제공하며 Vorbis 및 MP3를 비롯한 다양한 오디오 애플리케이션에서 사용됩니다.이러한 알고리즘은 거의 모두 심리음향학에 의존하여 덜 들리는 소리의 충실도를 제거하거나 줄여 [2][40]저장 또는 전송에 필요한 공간을 줄입니다.
오디오 품질 손실과 전송 또는 저장 크기 사이의 허용 가능한 균형은 애플리케이션에 따라 달라집니다.예를 들어, 640 MB의 콤팩트디스크(CD)에는 약 1시간의 비압축 고음질 음악, 2시간 미만의 무손실 압축 음악, 또는 7시간의 MP3 포맷으로 압축된 음악이 중간 비트환율로 저장됩니다.디지털 사운드 레코더는 일반적으로 640MB에 [41]200시간 분량의 명확하게 이해할 수 있는 음성을 저장할 수 있습니다.
무손실 오디오 압축은 원본의 정확한 디지털 복제로 디코딩할 수 있는 디지털 데이터를 생성합니다.압축률은 원래 크기의 [42]약 50~60%로 일반적인 무손실 데이터 압축과 비슷합니다.무손실 코덱은 신호를 추정하기 위한 기준으로 곡선 피팅 또는 선형 예측을 사용합니다.추정 및 추정과 실제 신호의 차이를 기술하는 파라미터는 [43]별도로 코드화된다.
무손실 오디오 압축 형식에는 여러 가지가 있습니다.리스트에 대해서는, 무손실 코덱의 리스트를 참조해 주세요.슈퍼 오디오 CD에 사용되는 Direct Stream Transfer 및 DVD-Audio, Dolby TrueHD, Blu-ray 및 HD DVD에 사용되는 Meridian Lossless Packing과 같은 일부 형식은 고유한 시스템과 관련되어 있습니다.
일부 오디오 파일 형식에는 손실 형식과 손실 없는 보정이 조합되어 있습니다.이를 통해 수정 내용을 삭제하여 손실 파일을 쉽게 얻을 수 있습니다.이러한 형식에는 MPEG-4 SLS(Scalable to Lossless), Wav Pack 및 Optim이 포함됩니다.PROG 듀얼 스트림
오디오 파일을 추가 압축 또는 편집하기 위해 처리하는 경우 변경되지 않은 원본(압축되지 않았거나 무손실 압축)에서 작업하는 것이 좋습니다.어떤 목적으로 압축된 손실 파일을 처리하면 일반적으로 압축되지 않은 원본에서 동일한 압축 파일을 생성하는 것보다 더 낮은 최종 결과가 생성됩니다.사운드 편집 또는 믹싱과 더불어 무손실 오디오 압축은 아카이브 스토리지 또는 마스터 복사본으로 사용되는 경우가 많습니다.
손실 오디오 압축
손실 오디오 압축은 다양한 애플리케이션에서 사용됩니다.MP3 플레이어 또는 컴퓨터에서 파일을 재생하는 독립형 오디오 전용 애플리케이션 외에 디지털 압축 오디오 스트림은 대부분의 비디오 DVD, 디지털 텔레비전, 인터넷상의 스트리밍 미디어, 위성 및 케이블 라디오, 지상파 라디오 방송에서도 사용되고 있습니다.손실 압축은 일반적으로 심리 음향 최적화에 [44]기반하여 덜 중요한 데이터를 폐기함으로써 손실 압축보다 훨씬 더 큰 압축을 달성합니다.
정신 음향학은 오디오 스트림의 모든 데이터가 인간의 청각 시스템에 의해 인식될 수 있는 것은 아니라는 것을 인정한다.대부분의 손실 압축은 우선 지각적으로 무관한 소리, 즉 매우 듣기 어려운 소리를 식별함으로써 중복성을 줄입니다.일반적인 예로는 고주파나 더 큰 소리와 동시에 발생하는 소리가 있습니다.이러한 관련 없는 소리는 정확도가 떨어지거나 전혀 그렇지 않은 상태로 코드화됩니다.
손실 알고리즘의 특성상 파일이 압축 해제 및 재압축될 때 오디오 품질은 디지털 생성 손실을 입습니다.이로 인해 손실 압축은 사운드 편집이나 멀티트랙 레코딩 등의 전문 오디오 엔지니어링 애플리케이션에서 중간 결과를 저장하기에 적합하지 않습니다.그러나 MP3와 같은 손실형 포맷은 파일 크기가 원래 크기의 5~20%로 축소되고 1메가바이트는 약 1분 분량의 음악을 적절한 품질로 저장할 수 있기 때문에 최종 사용자에게 매우 인기가 있습니다.
부호화 방법
대부분의 손실 압축 알고리즘은 오디오 신호의 어떤 정보가 인식적으로 무관한지 판단하기 위해 수정 이산 코사인 변환(MDCT) 등의 변환을 사용하여 시간 도메인 샘플링된 파형을 변환 도메인(일반적으로 주파수 도메인)으로 변환합니다.변환된 컴포넌트 주파수는 가청 정도에 따라 우선순위를 지정할 수 있습니다.스펙트럼 성분의 가청성은 청각의 절대 임계값과 동시 마스킹 원리(신호가 주파수로 분리된 다른 신호로 마스킹되는 현상, 그리고 경우에 따라서는 시간 마스킹)를 사용하여 평가된다.또한 구성요소의 지각적 중요도를 측정하기 위해 등가명도 등고선을 사용할 수 있습니다.이러한 효과를 포함하는 인간의 귀-뇌 결합 모델은 종종 정신 음향 [45]모델이라고 불립니다.
음성과 함께 사용되는 LPC(Linear Predictive Coding)와 같은 손실 압축기의 다른 유형은 소스 기반 코드입니다.LPC는 인간의 성관 모델을 사용하여 음성 소리를 분석하고 모델이 사용하는 매개 변수를 유추하여 순간순간을 생성합니다.이러한 변경 매개 변수는 전송 또는 저장되며, 소리를 재생하는 디코더 내의 다른 모델을 구동하는 데 사용됩니다.
손실 형식은 스트리밍 오디오 또는 인터랙티브 통신(휴대전화 네트워크 등)의 배포에 자주 사용됩니다.이러한 응용 프로그램에서는 전체 데이터 스트림이 전송된 후가 아니라 데이터 흐름에 따라 데이터를 압축 해제해야 합니다.스트리밍 [44]어플리케이션에는 모든 오디오코덱을 사용할 수 없습니다.
지연은 데이터 인코딩 및 디코딩에 사용되는 메서드에 의해 도입됩니다.일부 코덱은 프레임이라고 불리는 더 긴 세그먼트의 데이터를 분석하여 효율성을 최적화한 후 한 번에 더 큰 세그먼트의 데이터를 디코딩하는 방식으로 데이터를 코드화합니다.부호화 알고리즘의 고유의 지연은 중요한 경우가 있습니다.예를 들어, 전화 통화와 같은 양방향 데이터 전송이 있는 경우, 현저한 지연은 인식 품질을 심각하게 저하시킬 수 있습니다.
알고리즘에 필요한 동작 수에 비례하는 압축 속도와는 대조적으로 여기서 지연은 오디오 블록을 처리하기 전에 분석해야 하는 샘플의 수를 나타냅니다.최소의 경우 지연은 제로 샘플입니다(예를 들어 코더/디코더가 단순히 신호를 양자화하는 데 사용되는 비트 수를 줄이는 경우).LPC 등의 시간 영역 알고리즘도 지연 시간이 짧은 경우가 많기 때문에 텔레포니용 음성 코딩에서 인기가 있습니다.그러나 MP3와 같은 알고리즘에서는 주파수 영역에서 정신 음향 모델을 구현하기 위해 다수의 샘플을 분석해야 하며 지연 시간은 약 23ms입니다.
음성 부호화
음성 부호화는 오디오 데이터 압축의 중요한 카테고리입니다.인간의 귀가 들을 수 있는 말의 양상을 추정하는 데 사용되는 지각 모델은 일반적으로 음악에 사용되는 것과 다소 다르다.사람의 목소리를 전달하는 데 필요한 주파수의 범위는 보통 음악에 필요한 주파수보다 훨씬 좁고, 소리는 보통 덜 복잡하다.그 결과 비교적 낮은 비트레이트를 사용하여 음성을 고품질로 부호화할 수 있다.
이것은, 일반적으로, 다음의 2개의 어프로치를 조합하는 것으로 실현됩니다.
- 한 사람의 목소리로만 들리는 부호화 소리.
- 신호에서 더 많은 데이터를 버립니다. 즉, 전체 주파수 범위가 아닌 "알 수 있는" 음성을 재구성할 수 있을 정도로만 유지합니다.
음성 부호화(및 일반적으로 오디오 데이터 압축)에 사용된 최초의 알고리즘은 A-law 알고리즘과 μ-law 알고리즘이었습니다.
역사
초기 오디오 연구는 Bell Labs에서 수행되었습니다.1950년에 C. 차핀 커틀러는 DPCM(Differential Pulse-Code Modulation)[46] 특허를 출원했다.1973년에 P에 의해 Adaptive DPCM(ADPCM)이 도입되었습니다.Cummiskey, Nikil S. Jayant, 그리고 James L. 플래너건.[47][48]
지각 부호화는 선형 예측 부호화(LPC)[49]를 사용한 음성 부호화 압축에 처음 사용되었다.LPC의 초기 개념은 1966년 [50]이타쿠라 후미타다(나고야 대학)와 사이토 슈조(일본전신전화)의 작품으로 거슬러 올라간다.1970년대에 비슈누 S. 아탈과 맨프레드 R. Bell Labs의 Schroeder는 인간의 귀의 마스킹 특성을 이용한 지각 코딩 알고리즘인 적응 예측 코딩(APC)이라고 불리는 LPC의 형태를 개발했으며,[49] 1980년대 초에 상당한 압축률을 달성한 코드 들뜸 선형 예측(CELP) 알고리즘이 뒤를 이었다.지각 코딩은 MP3[49] 및 AAC와 같은 최신 오디오 압축 형식에서 사용됩니다.
Nasir Ahmed, T. Natarajan 및 K. R. Rao에 의해 [16]1974년에 개발된 이산 코사인 변환(DCT)은 MP3,[51] Dolby [52][53]Digital 및 AAC [54]등의 최신 오디오 압축 포맷에서 사용되는 Modified Discrete Cosine Transform(MDCT; 수정 이산 코사인 변환)의 기반이 되었습니다.MDCT는 J.[56] P. Princen, A. W. Johnson 및 A. B. Bradley에 의해 1986년 Princen과 Bradley의 이전 연구에 이어 [55]1987년에 제안되었습니다.
세계 최초의 상업방송 자동화 오디오 압축 시스템은 부에노스아이레스 [57][failed verification]대학의 공학 교수인 오스카 보넬로에 의해 개발되었다.1983년 1967년 [58]발표된 임계 대역 마스킹이라는 정신음향학적 원리를 이용해 최근 개발된 IBM PC를 기반으로 한 실용적 응용 프로그램을 개발하기 시작했고 1987년 Audicom이라는 이름으로 방송 자동화 시스템이 출범했다.20년 후, 세계의 거의 모든 라디오 방송국들은 많은 회사들에 의해 만들어진 비슷한 기술을 사용하고 있었다.
다양한 오디오 코딩 시스템에 대한 문헌 요약은 1988년 2월에 IEEE의 Journal on Selected Areas in Communications (JSAC)에 발표되었습니다.이전에도 몇 가지 종이가 있었지만, 이 컬렉션은 거의 모든 종류의 완성된 작동 오디오 코더를 기록했습니다. 이 코더는 지각 기법과 일종의 주파수 분석 및 백엔드 노이즈 없는 [59]코딩을 사용합니다.
비디오
비압축 비디오는 매우 높은 데이터 레이트를 필요로 합니다.무손실 비디오 압축 코덱은 5 ~12의 압축률로 동작하지만 일반적인 H.264 손실 압축 비디오의 압축률은 20 ~[60]200입니다
비디오 부호화 표준에서 사용되는 2가지 주요 비디오 압축 기술은 이산 코사인 변환(DCT)과 모션 보정(MC)입니다.H.26x 및 MPEG 형식 등 대부분의 비디오 부호화 표준에서는 일반적으로 모션 보정 DCT 비디오 부호화(블록 모션 보정)[61][62]를 사용합니다.
대부분의 비디오 코덱은 오디오 압축 기술과 함께 사용되며, 이른바 컨테이너 [63]형식을 사용하여 개별적이지만 상호 보완적인 데이터 스트림을 하나의 결합된 패키지로 저장합니다.
부호화 이론
비디오 데이터는 일련의 정지화면 프레임으로 나타낼 수 있다.그러한 데이터는 일반적으로 충분한 양의 공간적 및 시간적 중복성을 포함한다.비디오 압축 알고리즘은 용장성을 줄이고 정보를 보다 콤팩트하게 저장하려고 합니다.
대부분의 비디오 압축 형식과 코덱은 (예를 들어 움직임 보상에 의한 차분 코딩을 통해) 공간적 및 시간적 중복성을 모두 활용합니다.유사성은 예를 들어 시간적으로 인접한 프레임(프레임 간 부호화) 또는 공간적으로 인접한 픽셀(프레임 내 부호화) 간의 차이만 저장함으로써 부호화할 수 있다.프레임간 압축(일시적 델타 부호화)(re)에서는, 현재의 프레임을 나타내기 위해서, 1개 또는 복수의 이전 프레임으로부터의 데이터를 시퀀스로 사용합니다.한편, 프레임내 부호화에서는, 현재의 프레임내의 데이터만을 사용하고 있기 때문에, 사실상 정지화면 [45]압축이 됩니다.
캠코더 및 비디오 편집에 사용되는 프레임 내 비디오 코딩 형식은 프레임 내 예측만 사용하는 단순한 압축을 사용합니다.이것에 의해, 압축 프레임이 편집자가 삭제한 데이터를 참조하는 상황을 회피할 수 있기 때문에, 비디오 편집 소프트웨어가 심플화됩니다.
일반적으로 비디오 압축은 양자화와 같은 손실 압축 기술을 추가로 채택하여 인간의 시각의 지각적 특징을 이용하여 인간의 시각 지각과 무관한 소스 데이터의 측면을 감소시킨다.예를 들어, 색의 작은 차이는 밝기의 변화보다 인지하기가 더 어렵습니다.압축 알고리즘은 JPEG 이미지 [9]압축에 사용되는 것과 유사한 방법으로 이러한 유사한 영역의 색상을 평균화할 수 있습니다.모든 손실 압축과 마찬가지로 비디오 품질과 비트레이트, 압축 및 압축 해제 처리 비용 및 시스템 요건 사이에는 트레이드오프가 있습니다.고도로 압축된 비디오는 눈에 보이거나 주의를 산만하게 하는 아티팩트를 나타낼 수 있습니다.
프랙탈 압축, 일치 추적 및 이산 웨이브릿 변환(DWT) 사용 등 일반적인 DCT 기반 변환 형식 이외의 다른 방법이 일부 연구의 대상이 되어 왔지만, 일반적으로 실제 제품에서는 사용되지 않는다.웨이브릿 압축은 움직임 보정 없이 정지화면 코더 및 비디오 코더에 사용됩니다.프랙탈 압축에 대한 관심은 그러한 [45]방법의 효과성이 상대적으로 부족하다는 것을 보여주는 최근의 이론적 분석으로 인해 줄어드는 것으로 보인다.
프레임간 부호화
프레임간 부호화에서는 비디오 시퀀스의 개별 프레임을 1프레임에서 다음 프레임으로 비교하고 비디오 압축 코덱은 그 차이를 기준 프레임에 기록한다.프레임에 아무것도 이동하지 않은 영역이 포함되어 있는 경우 시스템은 단순히 이전 프레임의 일부를 다음 프레임으로 복사하는 짧은 명령을 발행할 수 있습니다.프레임의 단면이 간단한 방법으로 이동하는 경우 컴프레서는 복사를 이동, 회전, 밝게 또는 어둡게 하도록 압축 해제기에 지시하는 (약간 긴) 명령을 내보낼 수 있습니다.이 긴 명령어는 프레임 내 압축에 의해 생성된 데이터보다 훨씬 짧은 상태로 유지됩니다.일반적으로 인코더는 나머지 더 미묘한 차이를 설명하는 잔류 신호도 기준 이미지에 전송합니다.엔트로피 부호화를 사용하면 이들 잔여 신호는 전체 신호보다 더 콤팩트하게 표현됩니다.움직임이 많은 비디오 영역에서는, 변화하는 픽셀수의 증가에 대응하기 위해서, 압축에 의해서 더 많은 데이터를 부호화할 필요가 있습니다.일반적으로 폭발, 화염, 동물 떼 및 일부 패닝 샷에서는 고주파 디테일이 품질 저하 또는 가변 비트 전송률 증가로 이어집니다.
하이브리드 블록 기반 변환 형식
오늘날 일반적으로 사용되는 거의 모든 비디오 압축 방식(예를 들어 ITU-T 또는 ISO에 의해 승인된 표준)은 1988년에 ITU-T에 의해 표준화되었던 H.261 이전의 것과 동일한 기본 아키텍처를 공유하고 있습니다.이들은 대부분 DCT, 인접 픽셀의 직사각형 블록에 적용되며 모션 벡터를 이용한 시간 예측, 그리고 최근에는 인루프 필터링 단계에 의존합니다.
예측 단계에서는 데이터를 꾸미고 이미 전송된 데이터를 바탕으로 새로운 데이터를 기술하는 데 도움이 되는 다양한 중복제거 및 차분 부호화 기법을 적용한다.
그런 다음 나머지 픽셀 데이터의 직사각형 블록이 주파수 영역으로 변환됩니다.주손실처리단계에서는 인간의 시각지각과 무관한 정보를 줄이기 위해 주파수 영역 데이터를 양자화한다.
마지막 단계에서 통계적 중복성은 종종 어떤 형태의 산술 부호화를 적용하는 엔트로피 코더에 의해 대부분 제거된다.
추가 루프 내 필터링 단계에서는 재구성된 화상 신호에 다양한 필터를 적용할 수 있다.이들 필터를 부호화 루프 내부에서도 계산함으로써 예측 프로세스에서 사용하기 전에 표준물질에 적용할 수 있고 원래 신호를 사용하여 유도할 수 있기 때문에 압축에 도움이 된다.가장 일반적인 예는 변환 블록 경계에서 양자화 중단으로 인한 블록 아티팩트를 흐리게 하는 디블로킹 필터입니다.
역사
1967년, A.H. 로빈슨과 C.체리는 아날로그 텔레비전 신호 전송을 위한 [64]런렝스 부호화 대역폭 압축 방식을 제안했다.Nasir [65]Ahmed, T. Natarajan 및 K. Rao가 1974년에 [16][66]도입한 DCT(Discrete cosine transform)는 현대 비디오 압축의 기본입니다.
1988년에 첫선을 보인 H.261은 널리 보급된 비디오 압축 [67]기술의 기본 아키텍처를 상업적으로 도입했습니다.이것은 DCT [65]압축을 기반으로 한 최초의 비디오 코딩 형식입니다.H.261은 Hitachi, Picture를 포함한 많은 기업에서 개발되었습니다.Tel, NTT, BT 및 [68]도시바.
코덱에 사용되는 가장 일반적인 비디오 코딩 표준은 MPEG 표준입니다.MPEG-1은 1991년 MPEG(Motion Picture Experts Group)에 의해 개발되었으며 VHS 품질의 비디오를 압축하도록 설계되었습니다.1994년 소니, 톰슨, 미쓰비시 전기 [69]등 여러 회사가 개발한 MPEG-2/H.262가 [67]그 뒤를 이었다.MPEG-2는 DVD와 SD 디지털 [67]텔레비전의 표준 비디오 형식이 되었습니다.1999년에는 MPEG-4/H.263이 [67]그 뒤를 이었다.또, 주로 미쓰비시 전기, 히타치,[70] 파나소닉 등, 많은 기업에 의해서도 개발되고 있습니다.
H.264/MPEG-4 AVC는 주로 파나소닉, 고도카이샤 IP 브릿지,[71] LG전자 등 많은 기관에서 2003년에 개발되었습니다.AVC는, 최신의 콘텍스트 적응 바이너리 산술 부호화(CABAC) 알고리즘과 콘텍스트 적응 가변 길이 부호화(CAVLC) 알고리즘을 상업적으로 도입했습니다.AVC는 Blu-ray 디스크의 주요 비디오 인코딩 표준으로 YouTube, Netflix, Vimeo, iTunes Store 등의 비디오 공유 웹사이트와 스트리밍 인터넷 서비스, Adobe Flash Player, Microsoft Silverlight 등의 웹 소프트웨어, 지상파 및 위성 TV를 통한 다양한 HDTV 방송 등에 널리 사용됩니다.
유전학
유전학적 압축 알고리즘은 기존의 압축 알고리즘과 특정 데이터 유형에 적합한 유전 알고리즘을 모두 사용하여 데이터(일반적으로 뉴클레오티드의 배열)를 압축하는 최신 세대의 무손실 알고리즘입니다.2012년, 존스 홉킨스 대학의 과학자 팀은 압축을 위해 참조 게놈을 사용하지 않는 유전자 압축 알고리즘을 발표했다.HAPZIPPER는 HapMap 데이터에 맞게 설계되었으며 20배 이상의 압축(파일 크기 95% 감소)을 달성하여 주요 범용 압축 유틸리티보다 2~4배 더 나은 압축을 제공하고 계산 집약도가 낮습니다.이를 위해 Chanda, Elhaik 및 Bader는 사소한 대립 유전자 빈도로 SNP를 정렬하여 데이터 [72]세트를 균질화함으로써 데이터 세트의 이질성을 줄이는 MAFE(MaF-based encoding)를 도입했습니다.2009년과 2013년에 개발된 다른 알고리즘(DNAZIP 및 GenomeZip)은 최대 1200배의 압축률을 가지고 있어 60억 개의 염기쌍의 인간 게놈을 2.5 메가바이트(기준 게놈에 상대적이거나 많은 [73][74]게놈에 평균)로 저장할 수 있습니다.유전학/게노믹스 데이터 압축기의 벤치마크에 대해서는, 을 참조해 주세요.
Outlook 및 현재 사용되지 않는 가능성
전 세계 스토리지 장치에 저장된 총 데이터 양은 기존 압축 알고리즘으로 4.5:[76]1의 나머지 평균 계수를 더 압축할 수 있을 것으로 추정됩니다.2007년에는 정보를 저장하는 전 세계의 기술 용량을 합치면 1,300엑사바이트의 하드웨어 숫자를 얻을 수 있을 것으로 추정되지만, 대응하는 콘텐츠를 최적으로 압축할 경우 이는 295엑사바이트의 섀넌 [77]정보에 불과합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Wade, Graham (1994). Signal coding and processing (2 ed.). Cambridge University Press. p. 34. ISBN 978-0-521-42336-6. Retrieved 2011-12-22.
The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.
- ^ a b Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (PDF). International Journal of Computer Science Issues. 9 (6, No. 3): 53–59. Retrieved 6 March 2013.
- ^ Pujar, J.H.; Kadlaskar, L.M. (May 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.
- ^ Salomon, David (2008). A Concise Introduction to Data Compression. Berlin: Springer. ISBN 9781848000728.
- ^ Tank, M.K. (2011). "Implementation of Lempel-ZIV algorithm for lossless compression using VHDL". Implementation of Limpel-Ziv algorithm for lossless compression using VHDL. Thinkquest 2010: Proceedings of the First International Conference on Contours of Computing Technology. Berlin: Springer. pp. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7.
- ^ Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (April 2011). "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (PDF). Electrical Review. 2011 (4): 279–285.
- ^ Stephen, Wolfram (2002). New Kind of Science. Champaign, IL. p. 1069. ISBN 1-57955-008-8.
- ^ a b Mahmud, Salauddin (March 2012). "An Improved Data Compression Method for General Data" (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Retrieved 6 March 2013.
- ^ a b Lane, Tom. "JPEG Image Compression FAQ, Part 1". Internet FAQ Archives. Independent JPEG Group. Retrieved 6 March 2013.
- ^ G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (December 2012). "Overview of the High Efficiency Video Coding (HEVC) Standard". IEEE Transactions on Circuits and Systems for Video Technology. IEEE. 22 (12): 1649–1668. doi:10.1109/TCSVT.2012.2221191.
- ^ "How to choose optimal archiving settings – WinRAR".
- ^ "(Set compression Method) switch – 7zip".
- ^ Wolfram, Stephen (2002). A New Kind of Science. Wolfram Media, Inc. p. 1069. ISBN 978-1-57955-008-0.
- ^ Arcangel, Cory. "On Compression" (PDF). Retrieved 6 March 2013.
- ^ a b Ahmed, Nasir (January 1991). "How I Came Up With the Discrete