Nothing Special   »   [go: up one dir, main page]

KR100991450B1 - 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 - Google Patents

스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 Download PDF

Info

Publication number
KR100991450B1
KR100991450B1 KR1020107009429A KR20107009429A KR100991450B1 KR 100991450 B1 KR100991450 B1 KR 100991450B1 KR 1020107009429 A KR1020107009429 A KR 1020107009429A KR 20107009429 A KR20107009429 A KR 20107009429A KR 100991450 B1 KR100991450 B1 KR 100991450B1
Authority
KR
South Korea
Prior art keywords
spectral
spectral components
signal
subband
audio information
Prior art date
Application number
KR1020107009429A
Other languages
English (en)
Other versions
KR20100063141A (ko
Inventor
마이클 미드 트루만
그랜트 알렌 데이비슨
매튜 콘라드 펠레스
마크 스튜어트 빈톤
매튜 오브리 왓슨
찰스 퀴토 로빈슨
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20100063141A publication Critical patent/KR20100063141A/ko
Application granted granted Critical
Publication of KR100991450B1 publication Critical patent/KR100991450B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Elements Other Than Lenses (AREA)
  • Stereophonic System (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Adornments (AREA)
  • Optical Communication System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Optical Filters (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

양자화 같은 오디오 코딩 프로세스는 엔코딩된 오디오 신호의 스펙트럼 성분을 제로로 설정하여 신호에서 스펙트럼 홀을 생성시킨다. 생성된 스펙트럼 홀은 오디오 코딩 시스템에 의해 재생되는 오디오 신호의 인식 품질을 저하시킬 수 있다. 개선된 디코더는 동기화된 스펙트럼 성분으로 스펙트럼 홀을 충전함으로써 인식 품질 저하를 회피하거나 감소시킨다. 개선된 엔코더는 디코더에서 개선을 실현하는데 또한 사용될 수 있다.

Description

스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템{AUDIO CODING SYSTEM USING SPECTRAL HOLE FILLING}
본 발명은 일반적으로 오디오 코딩 시스템에 관한 것으로서, 특히 오디오 코딩 시스템으로부터 얻어지는 오디오 신호의 인식 품질을 개선하는 것에 관한 것이다.
오디오 코딩 시스템은 오디오 신호를 전송 또는 저장하는데 적합한 엔코딩된 신호로 엔코딩하고 나서, 이 엔코딩된 신호를 수신 또는 검색하고 이 신호를 디코딩하여 재생을 위한 원래의 오디오 신호 버전을 얻는데 사용된다. 인식 오디오 코딩 시스템은 오디오 신호를 원래의 오디오 신호보다 낮은 정보 용량 요구조건을 지닌 엔코딩된 신호로 엔코딩하고 나서, 이 엔코딩된 신호를 디코딩하여 원래의 오디오 신호와 인식할 정도로 구별할 수 없는 출력을 제공하고자 하는 것이다. 인식 오디오 코딩 시스템의 일 예가 Dolby AC-3라 칭하는 Advanced Television Standards Committee (ATSC) A52 document (1994)에 기재되어 있다. 또 다른 예는 Bosi 등이 발표한 Advanced Audio Coding (AAC)라 칭하는 "ISO/IEC MPEG2 Advanced Audio Coding." J.AES, vol.45, no.10, October 1997, pp.789-814에 기재되어 있다. 이들 두 가지 코딩 시스템뿐만 아니라 다른 인식 코딩 시스템은 분석 필터뱅크를 오디오 신호에 적용하여 주파수 대역 또는 그룹으로 배열된 스펙트럼 성분을 얻는다. 이 대역폭은 전형적으로 가변하고, 통상적으로 인간 청각 시스템의 소위 임계 대역폭과 동일하다.
인식 코딩 시스템은 주관적이거나 인식된 오디오 품질 측정을 유지하면서 오디오 신호의 정보 용량 요구조건을 감소시켜, 오디오 신호의 엔코딩된 표현이 보다 작은 대역폭을 사용하여 통신 채널을 통해서 전달되거나 보다 적은 공간을 사용하여 기록매체 상에 저장되도록 하는데 사용된다. 정보 용량 요구조건은 스펙트럼 성분의 양자화에 의해 감소된다. 양자화는 양자화된 신호에 잡음을 발생시키지만, 인식 오디오 코딩 시스템은 일반적으로 양자화 잡음 진폭을 제어하고자 시도시 사이코아쿠스틱 모델(psychoacoustic models)을 사용하여, 이 잡음을 마스킹하거나 신호에서 스펙트럼 성분에 의해 가청 불가능하게 한다.
소정 대역 내의 스펙트럼 성분은 종종 동일한 양자화 해상도(quantizing resoultion)로 양자화되고 양자화 모델은 가청 레벨의 양자화 잡음을 발생시킴이 없이 가능하게 되는 가장 큰 최소 양자화 해상도 즉, 최소 신호-대-잡음 비(SNR)를 결정하는데 사용된다. 이 기술은 협 대역에서 상당히 양호하게 작동하지만, 정보 용량 요구조건이 상대적으로 대충적인 양자화 해상도를 사용하도록 코딩 시스템을 제한할 때, 보다 넓은 대역에 대해선 양호하게 작동하지 못한다. 광 대역에서, 보다 큰 값의 스펙트럼 성분은 통상적으로 소정의 해상도를 갖는 비제로(non-zero) 값으로 양자화되지만, 이 대역의 보다 작은 값의 스펙트럼 성분은 최소 양자화 레벨보다 작은 크기를 갖는 경우 제로로 양자화된다. 제로로 양자화되는 대역 내의 스펙트럼 성분의 수는 일반적으로 대역폭이 증가함에 따라서, 이 대역 내의 최대 및 최소 스펙트럼 성분 값 간의 차가 증가함에 따라서, 그리고 최소 양자화 레벨이 증가함에 따라서 증가한다.
불행하게도, 엔코딩된 신호 내에 많은 제로로 양자화된(QTZ) 스펙트럼 성분이 존재하면, 최종 양자화 잡음이 가청 불가능하게 되거나 이 신호 내의 스펙트럼 성분에 의해 사이코아쿠스틱적으로 마스킹될 정도로 충분히 낮을지라도 오디오 신호의 인식 품질을 저하시킬 수 있다. 이 저하는 적어도 세 가지 원인을 갖는다. 첫 번째 원인은, 사이코아쿠스틱 마스킹 레벨이 양자화 해상도를 결정하는데 사용되는 사이코아쿠스틱 모델에 의해 예측된 것보다 작기 때문에 양자화 잡음이 가청될 수 있다는 것이다. 두 번째 원인은 많은 QTZ 스펙트럼 성분의 생성이 원래 오디오 신호의 에너지 또는 전력과 비교할 때 디코딩된 오디오 신호의 에너지 또는 전력을 가청가능하게 감소시킬 수 있다는 것이다. 세 번째 원인은 직교 반사 필터(QMT: Quadrature Mirror Filter) 또는 시간 도메인 에일리어싱 소거(TDAC) 변환으로서 공지된 특정 수정된 이산 코사인 변환(DCT) 및 수정된 역이산 코사인 변환(IDCT)(이들은 Princen 등이 발표한 "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation," ICASSP 1987 Conf.Proc.,May 1987, pp.2161-64에 서술되어 있다)과 같은 왜곡-소거 필터뱅크를 사용하는 코딩 공정과 관련된다.
QMF 또는 TDAC 변환과 같은 왜곡-소거 필터뱅크를 사용하는 코딩 시스템은 왜곡 또는 의사 성분을 엔코딩된 신호로 도입하는 엔코딩 공정에서 분석 필터뱅크를 사용하지만, 적어도 이론적으로 왜곡을 소거할 수 있는 디코딩 공정에서 합성 필터뱅크를 사용한다. 그러나 실제에 있어선, 하나 이상의 스펙트럼 성분의 값이 엔코딩 공정에서 크게 변경되는 경우, 왜곡을 소거하는 합성 필터뱅크의 성능은 크게 손상될 수 있다. 이 때문에, 양자화 잡음이 가청 불가능한 경우조차도 QTZ 스펙트럼 성분은 디코딩된 오디오 신호의 인식 품질을 저하시킬 수 있는데, 그 이유는 스펙트럼 성분의 변화가 분석 필터뱅크에 의해 야기되는 왜곡을 소거하는 합성 필터뱅크의 성능을 손상시킬 수 있기 때문이다.
공지된 코딩 시스템에 사용되는 기술은 이들 문제들을 부분적으로 해결하였다. 예를 들어, Dolby AC-3 및 AAC 변환 코딩 시스템은 디코더 내에서 어떤 QTZ 스펙트럼 성분을 잡음을 대체함으로써 원래 오디오 신호의 신호 레벨을 유지하는 엔코딩된 신호로부터 출력 신호를 발생시키는 어떤 성능을 지닌다. 이들 시스템 둘 다에서, 엔코더는 주파수 대역을 위한 전력 표시를 엔코딩된 신호로 제공하고 디코더는 이 전력 표시를 사용하여 주파수 대역 내의 QTZ 스펙트럼 성분을 적절한 잡음 레벨로 대체한다. Dolby AC-3 엔코더는 적절한 잡음 레벨을 발생시키는데 사용될 수 있는 단기간 전력 스펙트럼의 대충적인 추정을 제공한다. 대역 내의 모든 스펙트럼 성분이 제로로 설정될 때, 디코더는 단기간 전력 스펙트럼의 대충적인 추정으로 표시된 전력과 거의 동일한 전력을 갖는 잡음으로 대역을 채운다. AAC 코딩 시스템은 소정 대역을 위한 전력을 명시적으로(explicitly) 전송하는 인식 잡음 치환(PNS: Perceptual Noise Substitution)이라 칭하는 기술을 사용한다. 디코더는 이 정보를 사용하여 이 전력을 정합시키도록 잡음을 부가한다. 2개의 시스템은 비제로 스펙트럼 성분을 갖지 않는 대역에서만 잡음을 부가한다.
불행하게도, 이들 시스템은 QTZ 및 비제로 스펙트럼 성분의 혼합을 포함하는 대역 내에서 전력을 유지하도록 지원하지 않는다. 표 1은 원래 오디오 신호를 위한 스펙트럼 성분의 가상 대역(hypothetical band), 엔코딩된 신호로 어셈블링되는 각 스펙트럼 성분의 3-비트 양자화된 표현 및 상기 엔코딩된 신호로부터 디코더에 의해 얻어진 대응하는 스펙트럼 성분을 나타낸다. 엔코딩된 신호에서 양자화된 대역은 QTZ 및 비제로 스펙트럼 성분의 조합을 갖는다.
[표 1]
Figure 112010027705219-pat00001
이 표의 제1 칼럼은 단일 대역으로 그룹화되는 원래 오디오 신호 내의 스펙트럼 성분을 표시하는 부호가 없는 2진수의 세트를 나타낸다. 제2 칼럼은 3비트로 양자화된 스펙트럼 성분의 표현을 나타낸다. 이 예에서, 3-비트 해상도 아래의 각 스펙트럼 성분의 부분은 절사(truncation)에 의해 제거되어 있다. 양자화된 스펙트럼 성분은 디코더로 전송된 후, 제로 비트를 부가함으로써 역양자화되어, 원래 스펙트럼 성분 길이를 복구한다. 역양자화된 스펙트럼 성분은 제3 칼럼에 나타나 있다. 대다수의 스펙트럼 성분이 제로로 양자화되기 때문에, 역양자화된 스펙트럼 성분의 대역은 원래 스펙트럼 성분의 대역보다 적은 에너지를 포함하고 이 에너지는 몇 개의 비제로 스펙트럼 성분에 집중된다. 이 에너지 감소는 상술된 바와 같이 디코딩된 신호의 인식 품질을 저하시킬 수 있다.
본 발명의 목적은 제로 값의 양자화된 스펙트럼 성분과 관계되는 저하를 피하거나 감소시킴으로써 오디오 코딩 시스템으로부터 얻어지는 오디오 신호의 인식 품질을 개선하는 것이다.
본 발명의 한 양상에서, 오디오 정보는, 입력 신호를 수신하고 오디오 신호의 스펙트럼 내용을 표시하는 하나 이상의 스펙트럼 성분을 각각 갖는 서브대역 신호의 세트를 상기 입력 신호로부터 얻는 단계; 하나 이상의 스펙트럼 성분이 비제로 값을 갖고 임계값에 대응하는 최소 양자화 레벨을 갖는 양자화기에 의해 양자화되고 다수의 스펙트럼 성분이 제로값을 갖는 특정 서브대역 신호를 상기 서브대역 신호 세트내에서 식별하는 단계; 상기 특정 서브대역 신호에서 각각 제로-값의 스펙트럼 성분에 대응하고 상기 임계값 이하인 스케일링 인벨롭(scaling envelope)에 따라서 스케일링되는 합성된 스펙트럼 성분을 발생시키는 단계; 상기 특정 서브대역 신호에서 대응하는 제로-값의 스펙트럼 성분을 상기 합성된 스펙트럼 성분으로 대체함으로써 수정된 서브대역 신호의 세트를 발생시키는 단계; 및 상기 수정된 서브대역 신호 세트에 합성 필터뱅크를 적용함으로써 오디오 정보를 발생시키는 단계;에 의해 제공된다.
본 발명의 또 다른 양상에서, 출력 신호, 바람직하게는 엔코딩된 출력 신호는, 분석 필터뱅크를 오디오 정보에 적용함으로써 얻어지는 정보를 양자화함으로써 오디오 신호의 스펙트럼 내용을 표시하는 하나 이상의 스펙트럼 성분을 각각 갖는 서브대역 신호 세트를 발생시키는 단계; 하나 이상의 스펙트럼 성분이 비제로 값을 갖고 임계값에 대응하는 최소 양자화 레벨을 갖는 양자화기에 의해 양자화되고 다수의 스펙트럼 성분이 제로값을 갖는 특정 서브대역 신호를 상기 서브대역 신호의 세트 내에서 식별하는 단계; 상기 오디오 신호의 스펙트럼 내용으로부터 스케일링 제어 정보를 도출하는 단계로서, 상기 스케일링 제어 정보는 출력 신호에 응답하여 오디오 정보를 발생시키는 수신기에서 제로값을 갖는 스펙트럼 성분을 합성되어 대체하는 합성된 스펙트럼 성분의 스케일링을 제어하는, 도출 단계; 및 상기 스케일링 제어 정보 및 상기 서브대역 신호의 세트를 표시하는 정보를 어셈블링함으로써 상기 출력 신호를 발생시키는 단계;에 의해 제공된다.
본 발명의 각종 특징 및 바람직한 실시예는 이하의 설명 및 여러 도면에서 동일한 소자에 동일한 참조 번호가 병기되어 있는 첨부 도면을 통해서 더욱 잘 이해할 수 있을 것이다. 이하의 설명 내용 및 전체 도면은 단지 예로서 설명된 것이지, 본 발명의 영역을 제한하고자 하는 것으로 이해되어서는 안 된다.
도 1a는 오디오 엔코더의 개요적인 블록도.
도 2b는 오디오 디코더의 개요적인 블록도.
도 2a-2c는 양자화 함수의 그래프.
도 3은 가상 오디오 신호의 스펙트럼의 개요적인 그래프.
도 4는 제로로 설정된 어떤 스펙트럼 성분 세트를 지닌 가상 오디오 신호의 스펙트럼의 개요적인 그래프.
도 5는 제로-값의 스펙트럼 성분을 대체하는 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스펙트럼의 개요적인 그래프.
도 6은 분석 필터뱅크 내의 필터용 가설 주파수 응답의 개요적인 그래프.
도 7은 도6에 도시된 스펙트럼 누설의 롤 오프(roll off)를 근사화하는 스케일링 인벨롭의 개요적인 그래프.
도 8은 적응가능한 필터의 출력으로부터 도출되는 스켈일링 인벨롭의 개요적인 그래프.
도 9는 도6에 도시된 스펙트럼 누설의 롤 오프를 근사화하는 스케일링 인벨롭에 의해 가중되는 합성된 스펙트럼 성분을 지닌 가설 오디오 신호의 스펙트럼의 개요적인 그래프.
도 10은 가상 사이코아쿠스틱 마스킹 임계값의 개요적인 그래프.
도 11은 사이코아쿠스틱 마스킹 임계값을 근사화하는 스케일링 인벨롭에 의해 가중되는 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스펙트럼의 개요적인 그래프.
도 12는 가상 서브대역 신호의 개요적인 그래프.
도 13은 제로로 설정된 어떤 스펙트럼 성분을 지닌 가상 서브대역 신호의 개요적인 그래프.
도 14는 가상 일시적 사이코아쿠스틱 마스킹의 개요적인 그래프.
도 15는 일시적 사이코아쿠스틱 마스킹 임계값을 근사화하는 스케일링 인벨롭에 의해 가중되는 합성된 스펙트럼 성분을 지닌 가상 서브대역 신호의 개요적인 그래프.
도 16은 스펙트럼 복제에 의해 발생되는 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스펙트럼의 개요적인 그래프.
도 17은 엔코더 또는 디코더에서 본 발명의 각종 양상을 구현하는데 사용될 수 있는 장치의 개요적인 블록도.
A. 개요
본 발명의 각종 양상은 다양한 신호 처리 방법 및 도 1a와 도 1b에 도시된 장치들과 유사한 장치를 포함하는 다양한 신호 처리 장치와 관련될 수 있다. 일부 양상은 단지 디코딩 방법 또는 장치에서만 수행되는 처리에 의해 실행될 수 있다. 다른 양상은 엔코딩 뿐만 아니라 디코딩 방법 또는 장치 둘 다에서 수행되는 협동적인 처리를 필요로 한다. 본 발명의 이들 각종 양상을 실행하는데 사용될 수 있는 공정에 대한 설명이 이들 공정을 수행하는데 사용될 수 있는 통상적인 장치를 개략적으로 설명한 다음에 설명된다.
1. 엔코더
도 1a는 분석 필터뱅크(12)가 경로(11)로부터 오디오 신호를 표시하는 오디오 정보를 수신하고, 이에 응답하여, 이 오디오 신호의 주파수 서브대역을 표시하는 디지털 정보를 제공하는 대역 분할 오디오 엔코더(split-band audio encoder)의 한 가지 구현방식을 도시한 것이다. 주파수 서브대역 각각에서 디지털 정보는 각각의 양자화기(14, 15, 16)에 의해 양자화되어 엔코더(17)로 통과된다. 엔코더(17)는 포맷화기(18)로 통과되는 양자화된 정보의 엔코딩된 표현을 발생시킨다. 도면에 도시된 특정 구현방식에서, 양자화기(14, 15, 16) 내의 양자화 함수는 모델(13)로부터 수신되는 양자화 제어 정보에 응답하여 적응되는데, 이 모델은 경로(11)로부터 수신되는 오디오 정보에 응답하여 양자화 제어 정보를 발생시킨다. 포맷화기(18)는 양자화된 정보 및 양자화 제어 정보의 엔코딩된 표현을 전송 또는 저장하는데 적합한 출력 신호로 어셈블링하여 이 출력 신호를 경로(19)를 따라서 통과시킨다.
많은 오디오 응용들은 도 2a에 도시된 3-비트 미드-트레드(mid-tread) 비대칭 양자화 함수와 같은 균일한 선형 양자화 함수 q(x)를 사용한다. 그러나 특정한 형태의 양자화가 본 발명에 중요한 것은 아니다. 사용될 수 있는 2개의 다른 함수 q(x)의 예들이 도 2b 및 도 2c에 도시되어 있다. 이들 예 각각에서, 양자화 함수 q(x)는 구간 내에서 임의의 입력값(x)에 대해서 제로와 동일한 출력값을 지점(30)에서의 값으로부터 지점(31)에서의 값으로 제공한다. 많은 응용에서, 지점(30, 31)에서의 2개의 값은 크기에 있어서 동일하고 부호에 있어서 서로 상반되지만, 이는 도 2b에 도시된 바와 같이 반드시 그럴 필요는 없다. 설명을 간단히 하기 위하여, 특정 양자화 함수 q(x)에 의해 제로로 양자화되는(QTZ) 입력값의 구간 내에 있는 값(x)은 이 양자화 함수의 최소 양자화 레벨보다 작은 것으로서 간주된다.
이 설명에서, "엔코더" 및 "엔코딩"과 같은 용어는 임의의 특정 유형의 정보 처리를 의미하지는 않는다. 예를 들어, 엔코딩은 종종, 정보 용량 요구조건을 감소시키는데 사용된다. 그러나 이 설명에서 이들 용어는 반드시 이 유형의 처리와 관련되는 것은 아니다. 엔코더(17)는 본질적으로, 바람직한 모든 유형의 공정을 수행할 수 있다. 한가지 구현방식에서, 양자화된 정보는 공통 스케일링 팩터를 갖는 스케일링되는 수의 그룹으로 엔코딩된다. Dolby AC-3 코딩 시스템에서, 예를 들어, 양자화된 스펙트럼 성분은 각 대역 내의 수가 부동 소수점 지수를 공유하는 부동 소수점 수의 그룹 또는 대역으로 배열된다. AAC 코딩 시스템에서, 허프만 코딩과 같은 엔트로피 코딩이 사용된다. 또 다른 구현방식에서, 엔코더(17)는 제거되고 양자화된 정보는 출력 신호로 직접 어셈블링된다. 특정 유형의 엔코딩이 본 발명에 중요한 것은 아니다.
모델(13)은 본질적으로, 바람직한 모든 유형의 공정을 수행할 수 있다. 한가지 예는 사이코아쿠스틱 모델을 오디오 정보에 적용하여 이 오디오 신호 내의 상이한 스펙트럼 성분의 사이코아쿠스틱 마스킹 효과를 제거하는 공정이다. 많은 수정들이 가능하다. 예를 들어, 이 모델(13)은 필터뱅크의 입력에서 이용가능한 오디오 정보 대신 또는 이 오디오 정보 이외에 분석 필터뱅크(12)의 출력에서 이용가능한 주파수 서브밴드 정보에 응답하여 양자화 제어 정보를 발생시킬 수 있다. 또 다른 예로서, 이 모델(13)은 제거될 수 있고, 양자화기(14, 15, 16)는 적응되지 않는 양자화 함수를 사용한다. 특정 모델링 공정이 본 발명에 중요한 것은 아니다.
2. 디코더
도 1b는 역포맷화기(22)가 경로(21)로부터 오디오 신호의 주파수 서브대역을 표시하는 양자화된 디지털 정보의 엔코딩된 표현을 전달하는 입력 신호를 수신하는 대역 분할 오디오 디코더의 한가지 구현방식을 도시한 것이다. 역포맷화기(22)는 입력 신호로부터 엔코딩된 표현을 얻어 이를 디코더(23)로 통과시킨다. 디코더(23)는 양자화된 정보의 주파수 서브대역으로 엔코딩된 표현을 디코딩한다. 각 주파수 서브대역에서 양자화된 디지털 정보는 각 역양자화기(25, 26, 27)에 의해 역양자화되어 합성 필터뱅크(28)로 통과되는데, 이 필터뱅크는 오디오 신호를 표시하는 오디 정보를 경로(29)를 따라서 발생시킨다. 이 도면에 도시된 특정 구현방식에서, 역양자화기(25, 26, 27) 내의 역양자화 함수는 모델(24)로부터 수신되는 양자화 제어 정보에 응답하여 적응되는데, 이 모델은 입력 신호로부터 역포맷화기(22)에 의해 얻어진 제어 정보에 응답하여 양자화 제어 정보를 발생시킨다.
이 설명에서, "디코더" 및 "디코딩"과 같은 용어는 임의의 특정 유형의 정보 처리를 의미하지는 않는다. 디코더(23)는 본질적으로, 필요하거나 바람직한 모든 유형의 공정을 수행할 수 있다. 상술된 엔코딩 공정의 역인 한가지 구현방식에서, 공유된 지수를 갖는 부동 소수점 수의 그룹에서 양자화된 정보는 공유된 지수를 갖지 않는 개개 양자화된 성분으로 디코딩된다. 또 다른 구현방식에서, 허프만 디코딩과 같은 엔트로피 디코딩이 사용된다. 또 다른 구현방식에서, 디코더(23)는 제거되고 양자화된 정보는 역포맷화기(22)에 의해 직접 얻어진다. 특정 유형의 디코딩이 본 발명에 중요한 것은 아니다.
모델(24)은 본질적으로, 바람직한 모든 유형의 공정을 수행할 수 있다. 한가지 예는 사이코아쿠스틱 모델을 입력 신호로부터 얻어진 정보에 적용하여 오디오 신호 내의 상이한 스펙트럼 성분의 사이코아쿠스틱 마스킹 효과를 제거하는 공정이다. 또 다른 예로서, 이 모델(24)은 제거되고 역양자화기(25, 26, 27)는 적응되지 않는 양자화 함수를 사용하거나 역포맷화기(22)에 의해 입력 신호로부터 직접 얻어진 양자화 제어 정보에 응답하여 적응되는 양자화 함수를 사용할 수 있다. 특정 공정이 본 발명에 중요한 것은 아니다.
3. 필터뱅크
도 1a 및 도 1b에 도시된 장치는 3개의 주파수 서브대역을 위한 성분을 나타낸다. 보다 많은 서브대역이 전형적인 응용에서 사용되지만, 간결하게 예시하기 위하여 단지 3개만을 나타내었다. 특정 수가 본 발명에 원칙적으로 중요한 것은 아니다.
분석 및 합성 필터뱅크는 본질적으로, 광범위의 디지털 필터 기술, 블록 변환 및 웨이브렛 변환을 포함한 바람직한 방식으로 수행될 수 있다. 상술된 바와 같은 엔코더 및 디코더를 갖는 한가지 오디오 코딩 시스템에서, 분석 필터뱅크(12)는 TDAC 수정된 DCT에 의해 수행되고 합성 필터뱅크(28)는 상술된 TDAC 수정된 IDCT에 의해 수행된다. 그러나 특정 구현방식이 원칙적으로 중요한 것은 아니다.
블록 변환에 의해 수행되는 분석 필터뱅크는 입력 신호의 블록 또는 구간을 신호의 구간의 스펙트럼 내용을 표시하는 변환 계수의 세트로 분할한다. 하나 이상의 인접 변환 계수의 그룹은 이 그룹 내의 계수의 수와 동일한 대역폭을 갖는 특정 주파수 서브대역 내에서 스펙트럼 내용을 표시한다.
블록 변환이라기보다 오히려 다상 필터와 같은 어떤 유형의 디지털 필터에 의해 수행되는 분석 필터뱅크는 입력 신호를 서브대역 신호의 세트로 분할한다. 각 서브대역 신호는 특정 주파수 서브대역 내의 입력 신호의 스펙트럼 내용의 시간-기반으로 한 표현이다. 이 서브대역 신호는 10진화되어, 각 서브대역 신호가 시간 단위 구간 동안 서브대역 신호 내의 샘플 수와 동일한 대역폭을 갖도록 하는 것이 바람직하다.
이하의 설명은 특히, 상술된 TDAC 변환과 같은 블록 변환을 사용하는 구현방식에 관한 것이다. 이 설명에서, 용어 "서브대역 신호"는 하나 이상의 인접 변환 계수의 그룹에 관한 것이고, 용어 "스펙트럼 성분"은 변환 계수에 관한 것이다. 본 발명의 원리는 다른 유형의 구현방식에 적용될 수 있지만, 용어 "서브대역 신호"는 일반적으로, 신호의 특정 주파수 서브대역의 스펙트럼 내용을 표시하는 시간-기반으로 한 신호와 관계하는 것으로 이해되어야 하고, 용어 "스펙트럼 성분"은 일반적으로 시간-기반으로 한 서브대역 신호의 샘플과 관련되는 것으로 이해될 수 있다.
4. 구현방식
본 발명의 각종 양상은 범용 컴퓨터 시스템, 또는 범용 컴퓨터 시스템에서 발견되는 구성요소들과 유사한 구성요소들에 결합되는 디지털 신호 처리기(DSP) 회로와 같은 보다 특수한 구성요소를 포함하는 일부 다른 장치 내의 소프트웨어를 포함한 다양한 방식으로 구현될 수 있다. 도 17은 오디오 엔코더 또는 오디오 디코더에서 본 발명의 각종 양상을 구현하는데 사용될 수 있는 장치(70)의 블록도이다. DSP(72)는 계산 자원을 제공한다. RAM(73)은 신호 처리를 위하여 DSP(72)에 의해 사용되는 시스템 랜덤 액세스 메모리(RAM)이다. ROM(74)은 장치(70)를 동작시켜 본 발명의 각종 양상을 실행하는데 필요로 되는 프로그램을 저장하기 위하여 판독 전용 메모리(ROM)와 같은 어떤 형태의 영구 저장장치를 표시한다. I/O 제어장치(75)는 통신 채널(76, 77)에 의해 신호를 수신하여 전송하는 인터페이스 회로를 표시한다. 아날로그-디지털 변환기 및 디지털-아날로그 변환기는 원하는 경우 I/O 제어 장치(75)에 포함되어 아날로그 오디오 신호를 수신 및/또는 전송한다. 도시된 실시예에서, 모든 주요한 시스템 구성요소들은 버스(71)에 접속되는데, 이 버스는 하나 이상의 물리적인 버스를 표시할 수 있지만, 버스 구조는 본 발명을 구현하는데 필요로 되지 않는다.
범용 컴퓨터 시스템에서 구현되는 실시예에서, 부가적인 구성요소들은 키보드 또는 마우스 및 디스플레이와 같이 장치에 인터페이스하고 자기 테이프 또는 디스크와 같은 저장 매체 또는 광학 매체를 갖는 저장 장치를 제어하기 위하여 포함될 수 있다. 이 저장 매체는 응용, 유틸리티 및 시스템을 운영하기 위한 명령의 프로그램을 기록하는데 사용될 수 있고, 본 발명의 각종 양상을 구현하는 프로그램의 실시예를 포함할 수 있다.
본 발명의 각종 양상을 실시하는데 필요로 되는 기능은 이산 논리 구성요소, 하나 이상의 ASICs 및/또는 프로그램-제어된 프로세서를 포함한 광범위한 다양한 방식으로 구현되는 구성요소들에 의해 수행될 수 있다. 이들 구성요소를 구현하는 방식이 본 발명에 중요한 것은 아니다.
본 발명의 소프트웨어 구현방식은 초음파로부터 자외선 주파수까지의 스펙트럼에 걸쳐서 기저대역 또는 변조된 통신 경로와 같은 다양한 기계 판독가능한 매체 또는 자기 테이프, 자기 디스크 및 광 디스크를 포함한 본질적으로 모든 자기 또는 광 기록 기술을 사용하여 정보를 전달하는 매체를 포함한 저장 매체에 의해 이루어질 수 있다. 각종 형태의 ROM 또는 RAM 및 이외 다른 기술에서 구현되는 프로그램에 의해 제어되는 마이크로프로세서, 범용 집적회로, ASIC와 같은 처리 회로에 의해 컴퓨터 시스템(70)의 각종 구성요소로 각종 양상들이 또한 구현될 수 있다.
B. 디코더
본 발명의 각종 양상은 엔코더로부터의 임의의 특수한 공정 또는 정보를 필요로 하지 않는 디코더에서 실행될 수 있다. 이들 양상은 본 명세서의 이 장에서 설명된다. 엔코더로부터의 특수한 공정 또는 정보를 필요로 하는 다른 양상은 다음 장에서 설명된다.
1. 스펙트럼 홀
도 3은 변환 코딩 시스템에 의해 엔코딩될 가상 오디오 신호의 구간의 스펙트럼을 도시한 그래프이다. 스펙트럼(41)은 스펙트럼 성분 또는 변환 계수의 크기의 인벨롭을 표시한다. 엔코딩 공정 동안, 임계값(40)보다 작은 크기를 갖는 모든 스펙트럼 성분은 제로로 양자화된다. 도 2a에 도시된 함수 q(x)와 같은 양자화 함수가 사용되면, 임계값(40)은 최소 양자화 레벨(30,31)에 대응한다. 임계값(40)은 예시를 간편하게 하기 위하여 전체 주파수 범위에 걸쳐서 균일한 값을 갖는 것으로 도시된다. 이는 많은 코딩 시스템에서 전형적인 것은 아니다. 각 서브대역 신호 내에서 스펙트럼 성분을 균일하게 양자화하는 인식 코딩 시스템에서, 예를 들어, 임계값(40)은 각 주파수 서브대역 내에서 균일하지만, 서브대역 전체에 걸쳐서 가변한다. 다른 구현방식에서, 임계값(40)은 또한 소정 주파수 서브대역 내에서 가변할 수 있다.
도 4는 양자화된 스펙트럼 성분으로 표시되는 가상 오디오 신호의 스펙트럼을 도시한 그래프이다. 스펙트럼(42)은 양자화되는 스펙트럼 성분의 크기의 인벨롭을 표시한다. 이 도면뿐만 아니라 다른 도면에 도시된 스펙트럼은 임계값(40) 이상의 크기를 갖는 스펙트럼 성분을 양자화하는 효과를 나타내지 않는다. 양자화된 신호의 QTZ 스펙트럼 성분 및 원래 신호에서 이에 상응하는 스펙트럼 성분 간의 차이는 해칭으로 나타나 있다. 이들 해칭된 영역은 합성된 스펙트럼 성분으로 채워질 양자화된 표현에서 "스펙트럼 홀(spectral holes)"을 표시한다.
본 발명의 한 가지 구현방식에서, 디코더는 도 4에 도시된 바와 같은 양자화된 서브대역 신호의 엔코딩된 표현을 전달하는 입력 신호를 수신한다. 이 디코더는 엔코딩된 표현을 디코딩하고 하나 이상의 스펙트럼 성분이 비제로 값을 갖고 다수의 스펙트럼 성분이 제로 값을 갖는 이들 서브대역 신호를 식별한다. 바람직하게는, 모든 서브대역 신호의 주파수 범위는 선험적으로 공지된 디코더이거나 이들은 입력 신호의 제어 정보에 의해 한정된다. 디코더는 후술되는 바와 같은 공정을 사용하여 제로-값의 스펙트럼 성분에 대응하는 합성된 스펙트럼 성분을 발생시킨다. 합성된 성분은 임계값(40) 이하의 스케일링 인벨롭에 따라서 스케일링되고 스케일링된 합성된 스펙트럼 성분은 서브대역 신호의 제로-값 스펙트럼 성분으로 대체된다. 스펙트럼 성분을 양자화하는데 사용되는 양자화 함수 q(x)의 최소 양자화 레벨(30, 31)이 공지되면, 디코더는 임계값(40)의 레벨을 명시적으로 나타내는 엔코더로부터 어떠한 정보를 필요로 하지 않는다.
2. 스케일링
스케일링 인벨롭은 광범위한 다양한 방식으로 설정될 수 있다. 몇 가지 방식이 후술된다. 한 가지 이상의 방식이 사용될 수 있다. 예를 들어, 복합 스케일링 인벨롭(composite scaling envelope)이 도출되는데, 이는 다양한 방식으로부터 또는 스케일링 인벨롭에 대한 상한 및/또는 하한을 설정하는 여러 가지 방식을 사용함으로써 얻어진 모든 인벨롭의 최대값과 동일하다. 이 방식은 엔코딩된 신호의 특성에 응답하여 적응되거나 선택될 수 있고, 이들은 주파수 함수에 따라서 적응되거나 선택될 수 있다.
a) 균일한 인벨롭
한가지 방식은 오디오 변환 코딩 시스템 및 다른 필터뱅크 구현방식을 사용하는 시스템 내의 디코더에 적합하다. 이 방식은 균일한 스케일링 인벨롭을 임계(40)과 동일하게 설정함으로써 이 인벨롭을 설정한다. 이와 같은 스케일링 인벨롭의 예가 도 5에 도시되어 있는데, 이 도면은 합성된 스펙트럼 성분으로 채워진 스펙트럼 홀을 도시하기 위한 해칭된 영역을 사용한다. 스펙트럼(43)은 합성된 스펙트럼 성분으로 채워진 스펙트럼 홀로 오디오 신호의 스펙트럼 성분의 인벨롭을 표시한다. 이 도면 뿐만 아니라 나중 도면에 도시된 해칭된 영역의 상한은 합성된 스펙트럼 성분 자신들의 실제 레벨을 표시하는 것이 아니라 단지 합성된 성분에 대한 스케일링 인벨롭을 표시한다. 스펙트럼 홀을 채우도록 사용되는 합성된 성분은 스케일링 인벨롭을 초과하지 않는 스펙트럼 레벨을 갖는다.
b) 스펙트럼 누설
스케일링 인벨롭을 설정하는 두 번째 방식은 블록 변환을 사용하는 오디오 코딩 시스템에서 디코더에 매우 적합하지만, 다른 유형의 필터뱅크 구현방식에 적용될 수 있는 원리를 기반으로 한다. 이 방식은 블럭 변환시 프로토타입 필터 주파수 응답의 스펙트럼 누설 특성에 따라서 가변하는 불균일한 스케일링 인벨롭을 제공한다.
도 6에 도시된 응답(50)은 계수들간의 스펙트럼 누설을 나타내는 변환 프로토타입 필터에 대한 가상 주파수 응답을 도시한 그래프이다. 이 응답은 통상적으로 프로토타입 필터의 통과대역이라 칭하는 주 로브(main lobe) 및 이 통과대역의 중심으로부터 멀리 떨어진 주파수에 대해서 레벨이 감소되는 주 로브에 인접한 다수의 사이드 로브를 포함한다. 이 사이드 로브는 통과대역으로부터 인접 주파수 대역으로 누설되는 스펙트럼 에너지를 표시한다. 이들 사이드 로브의 레벨이 감소되는 레이트는 스펙트럼 누설의 롤 오프(roll off)의 레이트라 칭한다.
필터의 스펙트럼 누설 특성은 인접 주파수 서브대역 간의 스펙트럼 분리(spectral isolation)를 제약한다. 필터가 대량의 스펙트럼 누설을 갖는 경우, 인접 서브대역에서 스펙트럼 레벨은 보다 낮은 스펙트럼 누설량을 지닌 필터에 대해서 가능한 상이하지 않도록 할 수 있다. 도 7에 도시된 인벨롭(51)은 도 6에 도시된 스펙트럼 누설의 롤 오프를 근사화한다. 합성된 스펙트럼 성분은 이와 같은 인벨롭으로 스케일링되거나, 대안적으로, 이 인벨롭은 다른 기술들에 의해 유도되는 스케일링 인벨롭을 위한 하한으로서 사용될 수 있다.
도 9의 스펙트럼(44)은 스펙트럼 누설 롤 오프를 근사화하는 인벨롭에 따라서 스케일링되는 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스텍트럼을 도시한 그래프이다. 스펙트럼 에너지에 의해 양측상에서 한정되는 스펙트럼 홀을 위한 스케일링 인벨롭은 2개의 개별적인 인벨롭의 복합이다. 이 복합은 보다 큰 2개의 개별적인 인벨롭을 취함으로써 형성된다.
c) 필터
스케일링 인벨롭을 설정하는 3번째 방법은 또한 블록 변환을 사용하는 오디오 코딩 시스템 내의 디코더에 매우 적합하지만 다른 유형의 필터뱅크 구현방식에 적용될 수 있는 원리를 기반으로 한다. 이 방식은 주파수 도메인에서 변환 계수에 적용되는 주파수-도메인 필터의 출력으로부터 도출되는 불균일한 스케일링 인벨롭을 제공한다. 이 필터는 예측 필터, 저역통과 필터, 또는 소정의 스케일링 인벨롭을 제공하는 본질적으로 이와 다른 어떤 유형의 필터일 수 있다. 이 방식은 통상적으로, 상술된 2가지 방식에 필요로 되지만 스케일링 인벨롭이 주파수 함수로서 가변하도록 하는 보다 많은 계산 자원을 필요로 한다.
도 8은 적응가능한 주파수-도메인 필터의 출력으로부터 도출되는 2개의 스케일링 인벨롭을 도시한 그래프이다. 예를 들어, 스케일링 인벨롭(52)은 신호 내의 스펙트럼 홀 또는 오히려 톤(tone)과 유사한 것으로 간주되는 신호의 부분을 채우는데 사용될 수 있고, 스케일링 인벨롭(53)은 신호 내의 스펙트럼 홀 오히려 잡음과 유사한 것으로 간주되는 신호의 부분을 채우는데 사용될 수 있다. 신호의 톤 및 잡음 특성은 다양한 방식으로 평가될 수 있다. 이들 방식 중 일부 방식이 후술된다. 대안적으로, 스케일링 인벨롭(52)은 오디오 신호가 종종 오히려 톤에 유사한 보다 낮은 주파수에서 스펙트럼 홀을 채우는데 사용될 수 있고 스케일링 인벨롭(53)은 오디오 신호가 종종 오히려 잡음에 유사한 보다 높은 주파수에서 스펙트럼 홀을 채우는데 사용될 수 있다.
d) 인식 마스킹
스케일링 인벨롭을 설정하는 네 번째 방식은 블록 변환에 의한 필터뱅크 및 이와 다른 유형의 필터를 구현하는 오디오 코딩 시스템 내의 디코더에 적용될 수 있다. 이 방식은 추정된 사이코아쿠스틱 마스킹 효과에 따라서 가변하는 불균일한 스케일링 인벨롭을 제공한다.
도 10은 2개의 가상 사이코아쿠스틱 마스킹 임계값을 도시한다. 임계값(61)은 보다 낮은 주파수 스펙트럼 성분(60)의 사이코아쿠스틱 마스킹 효과를 표시하고, 임계값(64)은 보다 높은 주파수 스펙트럼 성분(63)의 사이코아쿠스틱 마스킹 효과를 표시한다. 이들과 같은 마스킹 임계값은 스케일링 인벨롭의 정형(shape)을 도출하는데 사용될 수 있다.
도 11의 스펙트럼(45)은 사이코아쿠스틱 마스킹을 기반으로 한 인벨롭에 따라서 스케일링되는 대체 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스펙트럼을 도시한 그래프이다. 도시된 예에서, 최저-주파수 스펙트럼 홀에서 스케일링 인벨롭은 마스킹 임계값(61)의 보다 낮은 부분으로부터 도출된다. 이 중심 스펙트럼 홀 내의 스케일링 인벨롭은 마스킹 임계값(61)의 상부 부분 및 마스킹 임계값(64)의 하부 부분의 복합이다. 최고-주파수 스펙트럼 홀 내의 스케일링 인벨롭은 마스킹 임계값(64)의 상부 부분으로부터 도출된다.
e) 음조
스케일링 인벨롭을 설정하는 다섯번째 방식은 하나 이상의 서브대역 신호에 대한 것과 같이 전체 오디오 신호 또는 신호의 일부분의 음조(tonality)의 평가를 기반으로 한다. 음조는 스펙트럼 평활성 측정값 계산을 포함한 다양한 방식으로 평가될 수 있는데, 이 측정값은 신호 샘플의 기하학적 평균으로 나눠진 신호 샘플의 산술 평균의 정규화 지수(normalized quotient)이다. 1에 근접한 값은 신호가 매우 잡음과 유사하다는 것을 표시하고 제로에 인접한 값은 신호가 매우 톤에 인접하다는 것을 표시한다. SFM은 스케일링 인벨롭을 적응시키는데 직접적으로 사용될 수 있다. SFM이 제로와 동일할 때, 합성된 성분은 스펙트럼 홀을 채우는데 사용되지 않는다. SFM이 1과 동일할 때, 합성된 성분의 최대 허용되는 레벨은 스펙트럼 홀을 채우는데 사용된다. 그러나 일반적으로, 엔코더는 보다 양호한 SFM을 계산할 수 있는데, 그 이유는 이 엔코더가 엔코딩에 앞서 전체 원래 오디오 신호에 액세스하기 때문이다. 디코더는 QTZ 스펙트럼 성분의 존재로 인해 정확한 SFM을 계산하지 않을 것으로 여겨진다.
디코더는 또한, 비제로값 및 제로값 스펙트럼 성분의 배열 또는 분포를 분석함으로써 음조를 평가할 수 있다. 한 가지 구현방식에서, 이 배열이 스펙트럼 피크의 구조를 의미하기 때문에, 제로값 스펙트럼 성분의 긴 실행이 소수의 큰 비제로 값 성분 간에 분포되면, 신호는 잡음과 유사한 것이 아니라 톤에 오히려 유사한 것으로 간주된다.
또 다른 구현방식에서, 디코더는 예측 필터를 하나 이상의 서브대역 신호에 적용하여 예측 이득을 결정한다. 신호는 예측 이득이 증가함에 따라서 톤에 오히려 유사한 것으로 간주된다.
f) 일시적 스케일링(temporal scaling)
도 12는 엔코딩되어야 하는 가상 서브대역 신호를 도시한 그래프이다. 라인(46)은 스펙트럼 성분의 크기의 일시적 인벨롭을 표시한다. 이 서브대역 신호는 블록 변환에 의해 수행되는 분석 필터뱅크로부터 얻어진 블록의 시퀀스에서 변환 계수 또는 공통 스펙트럼 성분으로 이루어지거나, QMF와 같은 블록 변환과 다른 디지털 필터에 의해 수행되는 또 다른 유형의 분석 필터뱅크로부터 얻어지는 서브대역 신호일 수 있다. 엔코딩 공정 동안, 임계값(40)보다 작은 크기를 갖는 모든 스펙트럼 성분은 제로로 양자화된다. 임계값(40)은 예시를 간편하게 하기 위하여 전체 시간 구간에 걸쳐서 균일한 값을 갖는 것으로 나타낸다. 이는 블록 변환에 의해 수행되는 필터뱅크를 사용하는 많은 코딩 시스템에서 전형적인 것은 아니다.
도 13은 양자화된 스펙트럼 성분으로 표시되는 가상 서브대역 신호를 도시한 그래프이다. 라인(47)은 양자화되는 스펙트럼 성분의 크기의 일시적 인벨롭을 표시한다. 이 도면뿐만 아니라 다른 도면에 도시된 라인은 임계값(40) 이상의 크기를 갖는 스펙트럼 성분을 양자화하는 효과를 나타내지 않는다. 양자화된 신호 내의 QTZ 스펙트럼 성분 및 원래 신호 내의 이에 상응하는 스펙트럼 성분 간의 차는 해칭으로 도시되어 있다. 이 해칭된 영역은 합성된 스펙트럼 성분으로 채워져야되는 스펙트럼 홀을 시간 구간 내에서 표시한다.
본 발명의 한 가지 구현방식에서, 디코더는 도 13에 도시된 바와 같은 양자화된 서브대역 신호의 엔코딩된 표현을 전달하는 입력 신호를 수신한다. 디코더는 엔코딩된 표현을 디코딩하고 다수의 스펙트럼 성분이 제로값을 갖고 비제로 값을 갖는 스펙트럼 성분 다음 또는 이 보다 앞서 있는 이들 서브대역 신호를 식별한다. 디코더는 후술되는 바와 같은 공정을 사용하여 제로값의 스펙트럼 성분에 대응하는 합성된 스펙트럼 성분을 발생시킨다. 스케일링 인벨롭은 인간 청각 시스템의 일시적 마스킹 특성을 고려하는 것이 바람직하다.
도 14는 가상 일시적 사이코아쿠스틱 마스킹 임계값을 도시한 것이다. 이 임계값(68)은 스펙트럼 성분(67)의 일시적 사이코아쿠스틱 마스킹 효과를 표시한다. 스펙트럼 성분(67)의 좌측으로의 임계값 부분은 일시적 마스킹 전 특성을 표시하거나, 스펙트럼 성분 발생보다 앞서 있는 마스킹을 표시한다. 스펙트럼 성분(67)의 우측으로의 임계값 부분은 일시적 마스킹 후 특성을 표시하거나 스펙트럼 성분 발생에 후속되는 마스킹을 표시한다. 마스킹 후 효과는 일반적으로, 마스킹 전 효과의 지속기간보다 훨씬 긴 지속기간을 갖는다. 이와 같은 일시적 마스킹 임계값은 스케일링 인벨롭의 일시적 정형(temporal shape)을 도출하는데 사용될 수 있다.
도 15의 라인(48)은 일시적 사이코아쿠스틱 마스킹 효과를 기반으로 한 인벨롭에 따라서 스케일링되는 대체 합성된 스펙트럼 성분을 지닌 가상 서브대역 신호를 도시한 그래프이다. 도시된 예에서, 스케일링 인벨롭은 2개의 개별적인 인벨롭의 복합이다. 스펙트럼 홀의 보다 낮은 주파수 부분을 위한 개별적인 인벨롭은 임계값(68)의 마스킹 후 부분으로부터 도출된다. 스펙트럼 홀의 보다 높은 주파수 부분을 위한 개별적인 인벨롭은 임계값(68)의 마스킹 후 부분으로부터 도출된다.
3. 합성 성분의 발생
합성된 스펙트럼 성분은 다양한 방식으로 발생될 수 있다. 2가지 방식이 후술된다. 여러 가지 방식이 사용될 수 있다. 예를 들어, 엔코딩 신호의 특성에 응답하여 또는 주파수의 함수에 따라서 여러 가지 방식이 선택될 수 있다.
첫 번째 방식은 잡음형 신호를 발생시키는 것이다. 본질적으로, 의사-잡음 신호를 발생시키는 임의의 광범위한 다양한 방식이 사용될 수 있다.
두 번째 방식은 하나 이상의 주파수 서브대역으로부터 스펙트럼 성분을 복제하는 스펙트럼 복제 또는 스펙트럼 해석(spectral translation)이라 칭하는 기술을 사용한다. 보다 낮은 주파수 스펙트럼 성분은 통상적으로 복제되어 보다 높은 주파수에서의 스펙트럼 홀을 채우도록 하는데, 그 이유는 보다 높은 주파수 성분은 종종 어떤 방식으로 보다 낮은 주파수 성분과 관계되기 때문이다. 그러나 원칙적으로, 스펙트럼 성분은 보다 높거나 낮은 주파수로 복제될 수 있다.
도 16의 스펙트럼(49)은 스펙트럼 복제에 의해 발생된 합성된 스펙트럼 성분을 지닌 가상 오디오 신호의 스펙트럼을 도시한 그래프이다. 스펙트럼 피크의 일부분은 주파수 배수에서 하향 및 상향으로 복제되어 저 및 중간 주파수 각각에서의 스펙트럼 홀을 채운다. 스펙트럼의 높은 단부(high end) 근처의 스펙트럼 성분의 일부분은 주파수에서 상향으로 복제되어 스펙트럼의 높은 단부에서의 스펙트럼 홀을 채우도록 한다. 도시된 예에서, 복제된 성분은 균일한 스케일링 인벨롭에 의해 스케일링된다. 그러나 본질적으로 임의 형태의 스케일링 인벨롭이 사용될 수 있다.
C. 엔코더
상술된 본 발명의 양상은 기존 엔코더에 대해 어떠한 수정을 행함이 없이도 디코더에서 실행될 수 있다. 엔코더가 디코더에 이용될 수 없는 부가적인 제어 정보를 제공하도록 수정된다면 이들 양상들은 개선될 수 있다. 부가적인 제어 정보는 합성된 스펙트럼 성분을 발생시켜 디코더에서 스케일링되는 방식을 적응시키도록 사용될 수 있다.
1. 제어 정보
엔코더는, 디코더가 합성된 스펙트럼 성분을 위한 스케일링 인벨롭을 적응시키도록 사용되는 다양한 스케일링 제어 정보를 제공할 수 있다. 후술되는 각각의 예는 신호의 주파수 서브대역 및/또는 전체 신호를 위하여 제공될 수 있다.
서브대역인 최소 양자화 레벨보다 상당히 낮은 스펙트럼 성분을 포함하면, 엔코더는 이 상태를 나타내는 정보를 디코더에 제공할 수 있다. 이 정보는 디코더가 2개 이상의 스케일링 레벨로부터 선택하도록 사용할 수 있는 인덱스 유형이거나, 이 정보는 평균 또는 제곱근 평균(RMS) 전력과 같은 스펙트럼 레벨의 어떤 측정값을 전달할 수 있다. 디코더는 이 정보에 응답하여 스케일링 인벨롭을 적응시킬 수 있다.
상술된 바와 같이, 디코더는 엔코딩된 신호 자체로부터 추정된 사이코아쿠스틱 마스킹 효과에 응답하여 스케일링 인벨롭을 적응시킬 수 있다. 그러나 엔코더가 엔코딩 공정에 의해 상실되는 신호의 특징들에 액세스할 때, 디코더는 엔코더가 이들 마스킹 효과의 보다 양호한 추정을 제공하도록 할 수 있다. 이는 엔코딩 신호로부터 이용될 수 없는 사이코아쿠스틱 정보를 포맷화기(18)에 제공하는 모델(13)을 가짐으로써 행해질 수 있다. 이 유형의 정보를 사용하면, 디코더는 하나 이상의 사이코아쿠스틱 기준에 따라서 합성된 스펙트럼 성분을 정형화하도록 스케일링 인벨롭을 적응시킬 수 있다.
스케일링 인벨롭은 또한 신호 또는 서브대역 신호의 잡음-형 또는 음-형 품질에 대한 어떤 평가에 응답하여 적응될 수 있다. 이 평가는 엔코더 또는 디코더에 의해 여러 가지 방식으로 행해질 수 있다. 그러나 엔코더는 통상적으로 보다 양호한 평가를 행할 수 있다. 이 평가 결과는 엔코딩된 신호와 어셈블링될 수 있다. 한가지 평가는 상술된 SFM이다.
SFM의 표시는 또한 디코더에 의해 사용되어 합성된 스펙트럼 성분을 발생시키는데 어느 공정을 사용할지를 선택한다. SFM이 1에 근접하면, 잡음 발생기술이 사용될 수 있다. SFM이 제로에 근접하면, 스펙트럼 복제 기술이 사용될 수 있다.
엔코더는 이들 2개의 전력의 비와 같이 비제로 및 QTZ 스펙트럼 성분에 어떤 전력 표시를 제공할 수 있다. 디코더는 비제로 스펙트럼 성분의 전력을 계산하고 나서 이 비 또는 다른 표시를 사용하여 스케일링 인벨롭을 적절하게 적응시킨다.
2. 제로 스펙트럼 계수
앞선 설명은 때때로, QTZ(제로로 양자화된) 성분으로서 제로-값의 스펙트럼 성분이라 칭하는데, 그 이유는 양자화가 엔코딩된 신호에서 제로-값의 성분의 공통 소스이기 때문이다. 이는 필수적인 것은 아니다. 엔코딩된 신호에서 스펙트럼 성분의 값은 본질적으로 어떤 공정에 의해 제로로 설정될 수 있다. 예를 들어, 엔코더는 특정 주파수 위의 각 서브대역 신호에서 최대 하나 또는 2개의 스펙트럼 성분을 식별할 수 있고 이들 서브대역 신호에서 모든 다른 스펙트럼 성분을 제로로 설정할 수 있다. 대안적으로, 엔코더는 어떤 임계값보다 작은 어떤 서브대역에서 모든 스펙트럼 성분을 제로로 설정할 수 있다. 상술된 바와 같은 본 발명의 각종 양상을 포함하는 디코더는 스펙트럼 홀을 생성하는 역할을 하는 공정과 관계없이 스펙트럼 홀을 채울 수 있다.
12 : 분석 필터뱅크 13 : 모델
14, 15, 16 : 양자화기 17 : 엔코더
18 : 포맷화기 22: 역포맷화기
23 : 디코더 25, 26, 27 : 역양자화기
28: 합성 필터뱅크

Claims (13)

  1. 오디오 정보를 발생시키는 방법으로서,
    양자화된 서브대역 신호들의 엔코딩된 표현을 전달하는 입력 신호를 수신하는 단계로서, 임계값보다 작은 크기를 가졌던 스펙트럼 성분들은 제로 값으로 양자화되었음;
    상기 엔코딩된 표현을 디코딩하고, 하나 이상의 스펙트럼 성분이 비제로 값을 갖고 복수의 스펙트럼 성분이 제로 값을 갖는 특정 서브대역 신호를 식별하는 단계;
    주파수 함수로서 적응 또는 선택된 별개의 방식을 사용하여, 상기 임계값보다 작거나 상기 임계값과 동일한 스케일링 인벨롭을 설정하는 단계;
    상기 스케일링 인벨롭에 따라 스케일링되는, 상기 제로 값을 갖는 스펙트럼 성분들에 대응하는 합성 스펙트럼 성분들을 발생시키는 단계;
    상기 특정 서브대역 신호 내의 제로 값을 갖는 대응하는 스펙트럼 성분들을 상기 합성 스펙트럼 성분들로 대체함으로써 수정된 서브대역 신호들의 세트를 발생시키는 단계; 및
    상기 수정된 서브대역 신호들의 세트에 합성 필터뱅크를 적용함으로써 오디오 정보를 발생시키는 단계;
    를 포함하는 것을 특징으로 하는 오디오 정보 발생 방법.
  2. 제1항에 있어서, 상기 합성 필터뱅크는 인접한 서브대역 성분들 간에 스펙트럼 누설이 있는 블록 변환에 의해 수행되고, 상기 스케일링 인벨롭은 상기 블록 변환의 스펙트럼 누설의 롤 오프 레이트와 동일한 레이트로 가변하는 것을 특징으로 하는 오디오 정보 발생 방법.
  3. 제1항 또는 제2항에 있어서, 상기 합성 필터뱅크는 블록 변환에 의해 수행되고, 상기 방법은,
    상기 서브대역 신호들의 세트 내의 하나 이상의 스펙트럼 성분에 주파수 영역 필터를 적용하는 단계; 및
    상기 주파수 영역 필터의 출력으로부터 상기 스케일링 인벨롭을 도출하는 단계;
    를 포함하는 것을 특징으로 하는 오디오 정보 발생 방법.
  4. 제3항에 있어서, 상기 주파수 영역 필터의 응답을 주파수 함수로서 가변시키는 단계를 포함하는 것을 특징으로 하는 오디오 정보 발생 방법.
  5. 제1항 또는 제2항에 있어서, 상기 방법은,
    상기 서브대역 신호들의 세트에 의해 표현되는 오디오 신호의 음조의 측정값을 구하는 단계; 및
    상기 음조의 측정값에 응답하여 상기 스케일링 인벨롭을 적응시키는 단계;
    를 포함하는 것을 특징으로 하는 오디오 정보 발생 방법.
  6. 제5항에 있어서, 상기 음조의 측정값을 상기 입력 신호로부터 구하는 것을 특징으로 하는 오디오 정보 발생 방법.
  7. 제5항에 있어서, 상기 제로 값을 갖는 스펙트럼 성분들이 상기 특정 서브대역 신호에 배열되는 방식으로부터 상기 음조의 측정값을 도출하는 것을 특징으로 하는 오디오 정보 발생 방법.
  8. 제1항 또는 제2항에 있어서, 상기 합성 필터뱅크는 블록 변환에 의해 수행되고, 상기 방법은,
    상기 입력 신호로부터 서브대역 신호들의 세트들의 시퀀스를 얻는 단계;
    상기 시퀀스 내의 각각의 세트에 대하여 하나 이상의 스펙트럼 성분이 비제로 값을 갖고 복수의 스펙트럼 성분이 제로 값을 갖는 공통 서브대역 신호를 상기 시퀀스 내에서 식별하는 단계;
    비제로 값을 갖는 공통 스펙트럼 성분들의 세트에 선행 또는 후행하는 상기 시퀀스 내의 복수의 인접하는 세트 내의 제로 값을 갖는 공통 스펙트럼 성분을 상기 공통 서브대역 신호 내에서 식별하는 단계;
    인간 청각 시스템의 일시적 마스킹 특성에 따라 상기 시퀀스 내의 전체 세트에 걸쳐 가변하는 상기 스케일링 인벨롭에 따라서, 상기 제로 값을 갖는 공통 스펙트럼 성분들에 대응하는 상기 합성 스펙트럼 성분들을 스케일링하는 단계;
    상기 서브대역 신호들의 세트들 내의 비제로 값을 갖는 대응하는 공통 스펙트럼 성분들을 상기 합성 스펙트럼 성분들로 대체함으로써 수정된 서브대역 신호들의 세트들의 시퀀스를 발생시키는 단계; 및
    상기 수정된 서브대역 신호들의 세트들의 시퀀스에 상기 합성 필터뱅크를 적용함으로써 상기 오디오 정보를 발생시키는 단계;
    를 포함하는 것을 특징으로 하는 오디오 정보 발생 방법.
  9. 제1항 또는 제2항에 있어서, 상기 합성 필터뱅크는 블록 변환에 의해 수행되고, 상기 합성 스펙트럼 성분들은 상기 서브대역 신호들의 세트 내의 다른 스펙트럼 성분들의 스펙트럼 해석에 의해 발생하는 것을 특징으로 하는 오디오 정보 발생 방법.
  10. 제1항 또는 제2항에 있어서, 상기 스케일링 인벨롭은 인간 청각 시스템의 일시적 마스킹 특성에 따라 가변하는 것을 특징으로 하는 오디오 정보 발생 방법.
  11. 제1항 또는 제2항에 있어서, 상기 스케일링 인벨롭은 추정된 사이코아쿠스틱 마스킹 효과에 따라 가변하도록 설정되는 것을 특징으로 하는 오디오 정보 발생 방법.
  12. 제1항 또는 제2항의 방법의 단계들을 수행하기 위한 수단들을 포함하는 오디오 정보 발생 장치.
  13. 제1항 또는 제2항의 방법의 단계들을 수행하기 위한 명령들의 프로그램을 실행하는 장치에 의해 판독가능하고 명령들의 프로그램을 전달하는 컴퓨터 판독가능 매체.
KR1020107009429A 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 KR100991450B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling
US10/174,493 2002-06-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020047020570A Division KR100991448B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템

Publications (2)

Publication Number Publication Date
KR20100063141A KR20100063141A (ko) 2010-06-10
KR100991450B1 true KR100991450B1 (ko) 2010-11-04

Family

ID=29733607

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020047020570A KR100991448B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107009429A KR100991450B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107013897A KR100986152B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020107013899A KR100986153B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020047020587A KR100986150B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020047020570A KR100991448B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020107013897A KR100986152B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020107013899A KR100986153B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020047020587A KR100986150B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템

Country Status (20)

Country Link
US (4) US7447631B2 (ko)
EP (6) EP1736966B1 (ko)
JP (6) JP4486496B2 (ko)
KR (5) KR100991448B1 (ko)
CN (1) CN100369109C (ko)
AT (7) ATE536615T1 (ko)
CA (6) CA2736055C (ko)
DE (3) DE60333316D1 (ko)
DK (3) DK1514261T3 (ko)
ES (1) ES2275098T3 (ko)
HK (6) HK1070729A1 (ko)
IL (2) IL165650A (ko)
MX (1) MXPA04012539A (ko)
MY (2) MY159022A (ko)
PL (1) PL208344B1 (ko)
PT (1) PT2216777E (ko)
SG (3) SG10201702049SA (ko)
SI (2) SI2209115T1 (ko)
TW (1) TWI352969B (ko)
WO (1) WO2003107328A1 (ko)

Families Citing this family (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20060025993A1 (en) * 2002-07-08 2006-02-02 Koninklijke Philips Electronics Audio processing
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE378677T1 (de) * 2004-03-12 2007-11-15 Nokia Corp Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
EP1782419A1 (en) * 2004-08-17 2007-05-09 Koninklijke Philips Electronics N.V. Scalable audio coding
JP2008513845A (ja) * 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1805891B1 (en) 2004-10-26 2012-05-16 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US20070053603A1 (en) * 2005-09-08 2007-03-08 Monro Donald M Low complexity bases matching pursuits data coding and decoding
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
CN101467203A (zh) * 2006-04-24 2009-06-24 尼禄股份公司 先进音频编码装置
JP5129806B2 (ja) 2006-04-27 2013-01-30 ドルビー ラボラトリーズ ライセンシング コーポレイション 特定ラウドネスに基づく聴覚イベント検出を使用する音声ゲイン制御
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
US8849433B2 (en) 2006-10-20 2014-09-30 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5192544B2 (ja) 2007-07-13 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 聴覚情景分析とスペクトルの歪みを用いた音響処理
WO2009029036A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
US8538763B2 (en) * 2007-09-12 2013-09-17 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
CN101802910B (zh) * 2007-09-12 2012-11-07 杜比实验室特许公司 利用话音清晰性的语音增强
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US9659568B2 (en) * 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
ES2526767T3 (es) 2008-07-11 2015-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimiento para codificar una señal de audio y programa de ordenador
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
ES2654433T3 (es) * 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
JP5419876B2 (ja) * 2008-08-08 2014-02-19 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
TWI614989B (zh) * 2009-02-18 2018-02-11 杜比國際公司 用於高頻重建之複指數調變濾波器組
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
EP2407965B1 (en) * 2009-03-31 2012-12-12 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
BR112012009445B1 (pt) 2009-10-20 2023-02-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método para codificar uma informação de áudio, método para decodificar uma informação de áudio que utiliza uma detecção de um grupo de valores espectrais previamente decodificados
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2644141C2 (ru) 2010-01-12 2018-02-07 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая модификацию числового представления числового значения предыдущего контекста
BR122019025154B1 (pt) * 2010-01-19 2021-04-13 Dolby International Ab Sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
EP2555192A4 (en) * 2010-03-30 2013-09-25 Panasonic Corp AUDIO DEVICE
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
PT2681734T (pt) 2011-03-04 2017-07-31 ERICSSON TELEFON AB L M (publ) Correção de ganho de pós quantificação em codificação de áudio
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012121638A1 (en) 2011-03-10 2012-09-13 Telefonaktiebolaget L M Ericsson (Publ) Filing of non-coded sub-vectors in transform coded audio signals
US8706509B2 (en) * 2011-04-15 2014-04-22 Telefonaktiebolaget L M Ericsson (Publ) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
TWI562133B (en) 2011-05-13 2016-12-11 Samsung Electronics Co Ltd Bit allocating method and non-transitory computer-readable recording medium
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP2013007944A (ja) * 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013188562A2 (en) * 2012-06-12 2013-12-19 Audience, Inc. Bandwidth extension via constrained synthesis
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
CN105103226B (zh) * 2013-01-29 2019-04-16 弗劳恩霍夫应用研究促进协会 低复杂度音调自适应音频信号量化
PT2951817T (pt) * 2013-01-29 2019-02-25 Fraunhofer Ges Forschung Preenchimento de ruído na codificação de áudio de transformada perceptual
BR112015025009B1 (pt) * 2013-04-05 2021-12-21 Dolby International Ab Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar
JP6157926B2 (ja) * 2013-05-24 2017-07-05 株式会社東芝 音声処理装置、方法およびプログラム
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
MY188538A (en) 2013-12-27 2021-12-20 Sony Corp Decoding device, method, and program
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2572664C2 (ru) * 2014-06-04 2016-01-20 Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации Устройство активного гашения вибрации
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
DK3177281T3 (da) 2014-08-08 2024-03-11 Ali Res S R L Blanding af fedtsyrer og palmitoylethanolamid til brug i behandlingen af betændelses og allergiske patologier
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
US10460736B2 (en) * 2014-11-07 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for restoring audio signal
US9830927B2 (en) * 2014-12-16 2017-11-28 Psyx Research, Inc. System and method for decorrelating audio data
WO2016123560A1 (en) 2015-01-30 2016-08-04 Knowles Electronics, Llc Contextual switching of microphones
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US20170024495A1 (en) * 2015-07-21 2017-01-26 Positive Grid LLC Method of modeling characteristics of a musical instrument
ES2797092T3 (es) * 2016-03-07 2020-12-01 Fraunhofer Ges Forschung Técnicas de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
TWI702241B (zh) * 2016-12-09 2020-08-21 南韓商Lg化學股份有限公司 封裝組成物
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3544005B1 (en) 2018-03-22 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding with dithered quantization
IL313391A (en) 2018-04-25 2024-08-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
KR20240042120A (ko) 2018-04-25 2024-04-01 돌비 인터네셔널 에이비 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
TW202334940A (zh) * 2021-12-23 2023-09-01 紐倫堡大學 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備
WO2023118605A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering
WO2023117146A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering
WO2023117145A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
EP0746116B1 (en) 1995-06-01 2003-07-09 Mitsubishi Denki Kabushiki Kaisha MPEG audio decoder

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (en) * 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH02183630A (ja) * 1989-01-10 1990-07-18 Fujitsu Ltd 音声符号化方式
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
US5394466A (en) * 1993-02-16 1995-02-28 Keptel, Inc. Combination telephone network interface and cable television apparatus and cable television module
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3186489B2 (ja) * 1994-02-09 2001-07-11 ソニー株式会社 ディジタル信号処理方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
US5758315A (en) * 1994-05-25 1998-05-26 Sony Corporation Encoding/decoding method and apparatus using bit allocation as a function of scale factor
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
CA2185745C (en) * 1995-09-19 2001-02-13 Juin-Hwey Chen Synthesis of speech signals in the absence of coded parameters
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1091199A (ja) * 1996-09-18 1998-04-10 Mitsubishi Electric Corp 記録再生装置
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6415251B1 (en) * 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP4843142B2 (ja) * 1999-04-16 2011-12-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
JP2001324996A (ja) * 2000-05-15 2001-11-22 Japan Music Agency Co Ltd Mp3音楽データ再生方法及び装置
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
JP3538122B2 (ja) 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
EP0746116B1 (en) 1995-06-01 2003-07-09 Mitsubishi Denki Kabushiki Kaisha MPEG audio decoder

Also Published As

Publication number Publication date
MY159022A (en) 2016-11-30
US20030233236A1 (en) 2003-12-18
EP1514261A1 (en) 2005-03-16
CA2736060A1 (en) 2003-12-24
HK1070728A1 (en) 2005-06-24
KR100986153B1 (ko) 2010-10-07
JP2012212167A (ja) 2012-11-01
KR20100063141A (ko) 2010-06-10
JP5063717B2 (ja) 2012-10-31
HK1146145A1 (en) 2011-05-13
CA2489441C (en) 2012-04-10
EP2209115A1 (en) 2010-07-21
PT2216777E (pt) 2012-03-16
KR20050010950A (ko) 2005-01-28
KR100991448B1 (ko) 2010-11-04
EP1514261B1 (en) 2006-12-27
DE60310716D1 (de) 2007-02-08
ATE470220T1 (de) 2010-06-15
SI2207169T1 (sl) 2012-05-31
DE60310716T2 (de) 2007-10-11
US20090144055A1 (en) 2009-06-04
DE60310716T8 (de) 2008-01-31
HK1146146A1 (en) 2011-05-13
WO2003107328A1 (en) 2003-12-24
EP1736966A3 (en) 2007-11-07
MY136521A (en) 2008-10-31
MXPA04012539A (es) 2005-04-28
EP2207170A1 (en) 2010-07-14
US7337118B2 (en) 2008-02-26
TW200404273A (en) 2004-03-16
HK1141624A1 (en) 2010-11-12
HK1141623A1 (en) 2010-11-12
JP2010156990A (ja) 2010-07-15
DK1514261T3 (da) 2007-03-19
US20090138267A1 (en) 2009-05-28
EP2216777B1 (en) 2011-12-07
KR20100086068A (ko) 2010-07-29
US7447631B2 (en) 2008-11-04
SG177013A1 (en) 2012-01-30
DK2207169T3 (da) 2012-02-06
SG2014005300A (en) 2016-10-28
EP1736966A2 (en) 2006-12-27
CA2736055C (en) 2015-02-24
PL372104A1 (en) 2005-07-11
JP2005530205A (ja) 2005-10-06
EP2207169B1 (en) 2011-10-19
ATE473503T1 (de) 2010-07-15
ATE529858T1 (de) 2011-11-15
JP2013214103A (ja) 2013-10-17
ATE349754T1 (de) 2007-01-15
CA2736060C (en) 2015-02-17
US20030233234A1 (en) 2003-12-18
ATE526661T1 (de) 2011-10-15
HK1070729A1 (en) 2005-06-24
DK1736966T3 (da) 2010-11-01
JP5345722B2 (ja) 2013-11-20
EP2216777A1 (en) 2010-08-11
CN1662958A (zh) 2005-08-31
CA2736065C (en) 2015-02-10
KR100986150B1 (ko) 2010-10-07
SG10201702049SA (en) 2017-04-27
ATE536615T1 (de) 2011-12-15
DE60333316D1 (de) 2010-08-19
EP1736966B1 (en) 2010-07-07
DE60332833D1 (de) 2010-07-15
JP5253565B2 (ja) 2013-07-31
EP2207170B1 (en) 2011-10-19
KR100986152B1 (ko) 2010-10-07
CA2489441A1 (en) 2003-12-24
CA2735830C (en) 2014-04-08
TWI352969B (en) 2011-11-21
ES2275098T3 (es) 2007-06-01
SI2209115T1 (sl) 2012-05-31
IL216069A0 (en) 2011-12-29
JP4486496B2 (ja) 2010-06-23
JP5253564B2 (ja) 2013-07-31
JP2012103718A (ja) 2012-05-31
IL216069A (en) 2015-11-30
AU2003237295A1 (en) 2003-12-31
EP2209115B1 (en) 2011-09-28
ATE529859T1 (de) 2011-11-15
IL165650A0 (en) 2006-01-15
JP2012078866A (ja) 2012-04-19
CA2735830A1 (en) 2003-12-24
EP2207169A1 (en) 2010-07-14
CA2736055A1 (en) 2003-12-24
IL165650A (en) 2010-11-30
JP5705273B2 (ja) 2015-04-22
PL208344B1 (pl) 2011-04-29
US8032387B2 (en) 2011-10-04
CA2736065A1 (en) 2003-12-24
CN100369109C (zh) 2008-02-13
US8050933B2 (en) 2011-11-01
CA2736046A1 (en) 2003-12-24
KR20100086067A (ko) 2010-07-29
KR20050010945A (ko) 2005-01-28

Similar Documents

Publication Publication Date Title
KR100991450B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
US20080140405A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
AU2003237295B2 (en) Audio coding system using spectral hole filling

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131010

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141010

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151008

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161014

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171017

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181012

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 10