KR100707184B1 - 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 - Google Patents
오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 Download PDFInfo
- Publication number
- KR100707184B1 KR100707184B1 KR1020050020136A KR20050020136A KR100707184B1 KR 100707184 B1 KR100707184 B1 KR 100707184B1 KR 1020050020136 A KR1020050020136 A KR 1020050020136A KR 20050020136 A KR20050020136 A KR 20050020136A KR 100707184 B1 KR100707184 B1 KR 100707184B1
- Authority
- KR
- South Korea
- Prior art keywords
- harmonic
- audio signal
- encoding
- linear prediction
- module
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims abstract description 184
- 244000309466 calf Species 0.000 claims abstract description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 47
- 238000003786 synthesis reaction Methods 0.000 claims description 47
- 241000512259 Ascophyllum nodosum Species 0.000 claims description 43
- 238000013139 quantization Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 10
- 230000005284 excitation Effects 0.000 claims description 9
- 230000001149 cognitive effect Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 29
- 239000013598 vector Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000010257 thawing Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 하모닉이 포함된 오디오 신호의 질을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것으로, 본 발명에 따른 부호화 장치는, 2차의 하모닉 부호화 모듈과 캘프 모듈을 결합한 구조로 입력되는 오디오 신호를 부호화하고, 1차 하모닉 부호화 모듈은 LPC 계수를 분석하지 않고 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하고, 2차 하모닉 부호화 모듈은 LPC 계수를 분석하여 입력되는 오디오 신호에 대한 하모닉 부호화를 하도록 구성된다.
Description
도 1은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 2는 도 1의 제 1 하모닉 부호화 모듈의 상세 블록도이다.
도 3은 도 1의 제 2 하모닉 부호화 모듈의 상세 블록도이다.
도 4는 도 1의 CELP 모듈의 상세 블록도이다.
도 5는 본 발명의 바람직한 실시 예에 따른 오디오 복호화 장치의 기능 블록 도이다.
도 6은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 7은 본 발명의 바람직한 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
본 발명은 오디오 부호화 및 복호화 장치와 그 방법 및 기록매체에 관한 것 으로서, 특히 하모닉(Harmonic)을 포함한 오디오 신호의 질(quality)을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것이다.
음성 부호화기 응용 분야가 다양해지면서 저전송률 부호화기에 대한 요구가 증대되었다. 이에 따라 4kbps 이상의 전송률에서 CLEP(Code Excited Linear Prediction)방식의 부호화기가 사용되고, 4kbps 미만의 전송률에서 하모닉-CELP 방식의 부호화기가 사용되고 있다. 4kbps 미만의 전송률에서 하모닉-CELP 방식의 부호화기를 사용하는 이유는 CELP 부호화 알고리즘이 양자화 비트가 부족하여 음질이 저하되는데 반해 하모닉 부호화 알고리즘은 적은 비트로도 음질에 큰 영향을 주는 유성음의 주기성을 잘 모델링하기 때문이다.
하모닉-CELP 부호화기의 대표적인 예로 MPEG-4의 음성부호화 표준안인 HVXC(Harmonic Vector eXcitation Coder)가 있다. HVXC는 가변차원 하모닉 벡터의 양자화와 고속 하모닉 합성, 실수 피치를 이용한 하모닉 크기 추정, 잡음 혼합을 통한 자연성 제어 등을 특징으로 한다.
그러나 하모닉-CELP 부호화기에서 하모닉이 포함된 오디오 신호 구간(또는 유성음 구간)은 과거 프레임과 현재 프레임의 표준 파형을 보간하여 이루어지므로 전이 구간에서 피치 주기가 반으로 주는 피치 해빙(pitch halving) 예측이 이루어지거나 피치 주기가 두배로 늘어나는 피치 더블링(pitch doubling) 예측이 이루어질 가능성이 높다. 상기 피치 해빙 예측이나 피치 더블링 예측이 이루어질 경우에, 피치 주기의 심한 변화량에 의해 파형 왜곡 및 프레임 경계에서의 불연속이 발생된다.
또한, 하모닉 합성을 할 때 삼각 윈도우에 의한 중첩-합산(overlap-add) 방법을 사용하기 때문에 전이 구간에서의 하모닉이 포함된 오디오 신호 구간의 신호가 순간적으로 증가 또는 감소할 경우 삼각 윈도우의 영향으로 합성 여기 신호가 선형 증가 또는 감소하는 단점이 있다.
본 발명이 이루고자 하는 기술적 과제는 하모닉이 포함된 오디오 신호의 질을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 하모닉이 포함된 오디오 신호 구간에서의 피치 해빙 예측이나 피치 더블링 예측을 방지할 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 하모닉 크기 정보를 LPC 계수영역으로 변환하여 양자화하고, 양자화된 LPC 계수를 2차 하모닉 부호화 모듈과 캘프 모듈에서 필요한 LPC 계수를 추출하는데 사용하는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 입력되는 오디오 신호에 하모닉 포함여부에 따라 복수개의 부호화 모듈에 대한 비트 할당을 다르게 하는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 확장성(scalability) 적용이 용이한 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있 다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 입력되는 오디오 신호의 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하는 제 1 하모닉 부호화 모듈; 상기 제 1 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 제 1 차이 오디오 신호로 검출하는 제 1 검출기; 상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수와 이전의 하모닉 부호화 결과를 이용하여 상기 제 1 차이 오디오 신호를 하모닉 부호화하는 제 2 하모닉 부호화 모듈; 상기 제 2 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 제 1 차이 오디오 신호간의 차이 오디오 신호를 제 2 차이 영상 신호로 검출하는 제 2 검출기; 상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 차이 오디오 신호를 켈프 부호화하는 켈프 모듈; 상기 입력되는 오디오 신호가 하모닉을 포함하는 오디오 신호인지 여부에 따라 상기 제 1 하모닉 부호화 모듈, 제 2 하모닉 부호화 모듈 및 켈프 모듈에 대한 비트를 할당하는 비트 할당부를 포함하고,
제 1 하모닉 부호화 모듈은 하모닉 크기를 선형 예측 코딩 계수로 변환하고, 선형 예측 코딩 계수를 양자화하여 제 2 하모닉 부호화 모듈 및 켈프 모듈로 제공하고, 양자화된 선형 예측 코딩 계수를 하모닉 크기 벡터로 변환하여 하모닉 합성을 수행하고,
상기 제 2 하모닉 부호화 모듈 및 켈프 모듈은 상기 양자화된 선형 예측 코 딩 계수를 이용하여 각각 부호화시 필요한 선형 예측 코딩 계수를 추출하는 오디오 부호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 상기 오디오 신호를 복원하기 위한 복수의 파라미터들을 각각 역양자화하는 역양자화 유니트; 상기 역양자화 유니트로부터 출력되는 선형 예측 코딩 계수와 위상 값을 이용하여 하모닉 복호화를 수행하는 제 1 하모닉 복호화 모듈; 상기 역양자화 유니트로부터 출력되는 상기 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 제 2 하모닉 복호화 모듈; 상기 제 1 하모닉 복호화 모듈에서 출력되는 신호와 상기 제 2 하모닉 복호화 모듈에서 출력되는 신호를 가산하는 제 1 가산기; 상기 역양자화 유니트로부터 출력되는 스토캐스틱 코드북 인덱스 및 제 2 이득 값을 토대로 켈프 복호화를 수행하는 켈프 복호화 모듈; 및 상기 제 1 가산기로부터 출력되는 신호와 상기 켈프 복호화 모듈로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력하는 제 2 가산기를 포함하는 오디오 복호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 상기 입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계; 상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계; 상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 오디오 부호화 방법을 제 공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계; 상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계; 상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계; 상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계; 상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및 상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 오디오 복호화 방법을 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서, 상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계; 상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계; 상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 기록 매체를 제공한다.
이하 본 발명에 따른 오디오 부호화 및 복호화 장치와 그 방법을 살펴보면 다음과 같다.
도 1은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치는 피치 분석부(110), 신호 분류부(120), 비트 할당부(130), 제 1 하모닉 부호화 모듈(140), 제 1 검출기(150), 제 2 하모닉 부호화 모듈(160), 제 2 검출기(170), 및 켈프(CELP, Code Excited Linear Prediction) 모듈(180)을 포함한다.
피치 분석부(110)는 입력되는 오디오 신호의 피치를 분석하여 피치 주기(pitch lag) tp를 검출한다. 피치 주기 tp는 수학식 1과 같이 정규화된 자기 상관 함수(normalized auto-correlation)를 이용하여 구한다.
수학식 1에서 s(n)은 입력되는 오디오 신호이고, Lf는 오디오 신호 s(n)에서 분석할 부분의 길이, LMIN 및 LMAX는 각각 피치의 최대 및 최소를 나타낸다. 일반적인 경우에 LMIN과 LMAX는 각각 20과 143의 값을 갖는다. R(i)가 최대가 되는 i를 범위 LMIN-LMIN+19, LMIN+20 ~ LMIN+39, LMIN+40 ~ LMAX에서 각각 하나씩 찾는다. 상기 범위에서 찾아진 i를 각각 t3, t2, t1이라 하면 수학식 2와 같은 관계식을 토대로 t3, t2, t1중 하나의 값이 피치 주기 tp로 선택된다.
R(tp) = R(t1)
if R(t2) = 0.85 R(tp)
R(tp) = R(t2)
tp = t2
End
if R(t3) = 0.85R(tp)
R(tp) = R(t3)
tp = t3
end
피치 분석부(110)에서 검출된 피치 주기는 제 1 하모닉 부호화 모듈(140)로 제공된다.
신호 분류부(120)는 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판단한다. 즉, 신호 분류부(120)는 입력되는 오디오 신호 s(n)의 선명함 비율(sharpness rate), 좌우 에너지 비율, 영 교차율(zero-crossing rate), 및 1차 예측 계수(First-order Prediction Coefficient)와 같은 특성 값을 검출하고, 사전에 설정된 각 특성 값에 대한 문턱 값과 검출된 특성 값들을 비교하고, 그 비교결과가 사전에 정의된 조건을 만족하면 입력되는 오디오 신호에 하모닉 성분이 포함된 것으로 판단할 수 있다. 상기 비교는 부 프레임 단위로 수행될 수 있다. 신호 분류부(120)의 판단 결과는 비트 할당부(130)로 제공된다.
비트 할당부(130)는 신호 분류부(120)에서 제공되는 판단 결과에 따라 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대한 할당 비트 정보를 제공한다. 비트 할당부(130)는 만약 신호 분류부(120)로부터 입력되는 오디오 신호에 하모닉이 포함된 것을 나타내는 신호가 제공되면, 상기 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대해 예를 들어 3:3:2비율로 비트를 할당한 정보를 제공할 수 있다. 만약 신호 분류부(120)로부터 입력되는 오디오 신호에 하모닉이 포함되지 않은 것을 나타내는 신호가 제공되면, 상기 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대해 예를 들어 2:2:4비율로 비트를 할당한 정보를 제공할 수 있다. 상기 비트 할당 정보는 사전에 설정될 수 있다.
제 1 하모닉 부호화 모듈(140)은 피치 주기를 이용하여 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하고, 오디오 복호화를 위하여 양자화된 선형 예측 코딩(Linear Prediction Coding, LPC라고 약함) 계수, 양자화된 LPC 계수 인덱스 및 양자화된 위상 인덱스를 출력한다.
이를 위하여 제 1 하모닉 부호화 모듈(140)은 도 2에 도시된 바와 같이 제 1 하모닉 분석부(201), 크기/LPC 계수 변환기(202), LPC 계수 양자화기(203), QLPC/크기 변환기(204), 위상 양자화기(205), 및 제 1 하모닉 합성부(206)를 포함한다.
제 1 하모닉 분석부(201)는 피치 주기(또는 피치 딜레이)를 이용하여 입력되는 오디오 신호의 하모닉을 분석한다. 즉, 피치 주기를 이용하여 기본 주파수(fundamental frequency) ω0를 찾고, 정현파 사전(sine dictionary)을 사용하여 하모닉 파라미터를 탐색한다. 하모닉 파라미터는 크기 A와 위상 φ를 포함한다.
정현파 사전의 크기 A와 위상 φ는 오디오 신호 s(n)을 목적신호로 한 MP(Matching Pursuit) 알고리즘을 이용하여 탐색된다. 정현파 사전으로 표현된 오디오 신호 sH(n)은 수학식 3과 같이 정의할 수 있다.
수학식 3에서 Ak는 k번째 정현파의 크기, ωk는 k번째 정현파의 각 주파수, φk는 k번째 정현파의 위상, wham(n)은 해밍 윈도우(hamming window), K는 정현파 사전의 개수를 나타내며 일반적으로 수학식 4와 같다.
정현파 사전의 각 주파수 ωk는 수학식 5에 의해 구할 수 있다.
MP알고리즘을 이용한 탐색은 k번째 목적 신호를 k번째 사전에 투영하여 성분 크기(component amplitude)를 추출하는 과정과 추출된 성분 크기를 k번째 목적 신호에 상쇄시켜 새로운 k+1번째 목적 신호를 만들어 내는 과정을 반복적으로 수행한다. 상기 MP 알고리즘을 이용한 정현파 사전의 크기와 위상 탐색은 수학식 6과 같이 정의할 수 있다.
수학식 6에서 rh,k는 k번째 목적신호이고, Ek는 rh,k와 k번째 정현파 사전과의 평균 자승 에러(mean squared error)에 해밍 윈도우(hamming window) wham을 취한 값이다. k=0이라면, rh,k(n)는 원래 오디오 신호 s(n)과 동일하다. Ek가 최소가 되는 Ak와 φk는 수학식 7과 같이 정의할 수 있다.
제 1 하모닉 분석부(201)는 상기 정현파 사전의 크기는 크기/LPC 계수 변환기(202)로 전송하고, 상기 정현파 사전의 위상은 위상 양자화기(205)로 전송한다.
크기/LPC계수 변환기(202)는 입력된 정현파 사전의 크기 A를 LPC 계수로 변환한다. LPC 계수 양자화기(203)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 이용하여 상기 선형 예측 코딩 계수를 양자화하고, 양자화된 선형 예측 코딩 계수(QLPC)와 양자화된 선형 예측 계수 인덱스를 출력한다.
위상 양자화기(205)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 토대로 제 1 하모닉 분석부(201)로부터 출력되는 위상을 양자화하고, 양자화된 위상 벡터 와 양자화된 위상 인덱스를 출력한다.
제 1 하모닉 합성부(206)는 QLPC/크기 변환기(204)로부터 출력되는 양자화된 정현파 사전의 크기 벡터 와 위상 양자화기(205)로부터 출력되는 양자화된 위상 벡터 을 수학식 8에 의해 합성하여 상기 입력되는 오디오 신호에 대한 합성된 오디오 신호 을 얻는다.
제 1 검출기(150)는 입력되는 오디오 신호와 제 1 하모닉 부호화 모듈(140)로부터 출력되는 합성된 오디오 신호간의 제 1 차이 오디오 신호를 검출하여 출력한다.
제 2 하모닉 부호화 모듈(160)은 제 1 하모닉 부호화 모듈(140)에서 얻은 양자화된 LPC 계수와 제 2 하모닉 부호화 모듈(160)의 이전 출력신호를 이용하여 제 1 검출기(150)에서 검출된 제 1 차이 오디오 신호를 하모닉 부호화하여 합성된 오디오 신호를 출력하면서 오디오 신호 복호화를 위하여 양자화된 하모닉 인덱스 및 양자화된 제 1 이득 인덱스를 출력한다.
이를 위하여 제 2 하모닉 부호화 모듈(160)은 도 3에 도시된 바와 같이 LPC계수 분석기(301), 역합성 필터(inverse synthesis filter)(302), 제 2 하모닉 분 석부(303), 인덱스 양자화기(304), 제 2 하모닉 합성부(305), 및 합성 필터(306)를 포함한다.
LPC 계수 분석기(301)는 제 1 하모닉 부호화 모듈(140)로부터 제공되는 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 검출기(150)로부터 출력되는 제 1차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하여 제 2 하모닉 부호화 모듈(160)에서 필요한 LPC 계수를 추출한다.
LPC 계수 분석기(301)는 해당되는 음성 부호화 장치의 동작 조건에 따라 제 1 하모닉 부호화 모듈(140)로부터 제공된 양자화된 선형 예측 코딩 계수의 차수를 줄일 필요가 있을 때 필요한 만큼 줄인 LPC 계수를 추출하도록 구성될 수 있다. LPC 계수를 줄이는 방식은 전송된 계수에서 앞부분의 필요한 만큼만 취하는 방식으로 구현될 수 있다. 예를 들어, 상기 양자화된 LPC계수의 차수가 P차이고 제 2 하모닉 부호화 모듈(160)에서 사용하고 싶은 LPC 계수의 차수가 Q차라고 할 때, 전체 P개의 LPC 계수 중에서 앞부분의 Q개의 LPC 계수를 추출하면 된다. 이 때, LPC 계수의 개수는 반드시 짝수를 유지하여야 한다. 추출된 LPC 계수는 역합성 필터(302)와 합성 필터(306)로 각각 제공된다.
역합성 필터(302)는 제 1 검출기(150)에 의해 검출된 제 1 차이 오디오 신호에 대해 합성 필터의 역과정을 수행하여 제 1 차이 오디오 신호의 여기 신호를 생성하고, 생성된 여기신호를 제 2 하모닉 분석부(303)로 전송한다.
제 2 하모닉 분석부(303)는 도 2의 제 1 하모닉 분석부(201)와 동일하게 구성되어 상기 역합성 필터(302)로부터 출력되는 여기 신호에 대한 정현파 사전의 크 기 A와 위상 φ를 탐색하고, 탐색된 정현파 사전의 크기 A와 위상 φ를 포함하는 하모닉 인덱스를 출력한다. 출력된 하모닉 인덱스는 인덱스 양자화기(304)로 전송된다.
인덱스 양자화기(304)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 이용하여 제 2 하모닉 분석부(303)로부터 출력되는 하모닉 인덱스를 양자화하고, 양자화된 하모닉 인덱스와 양자화된 이득 인덱스를 출력한다.
제 2 하모닉 합성부(305)는 도 2의 제 1 하모닉 합성부(206)와 동일하게 구성되어 인덱스 양자화기(304)로부터 출력되는 상기 양자화된 하모닉 인덱스를 합성하여 합성된 오디오 신호를 출력한다.
합성 필터(308)는 상기 LPC 계수 분석기(301)로부터 출력되는 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 하모닉 합성부(305)로부터 출력되는 합성된 오디오 신호를 합성 필터링하여 합성된 제 1 차이 오디오 신호를 출력한다. 출력되는 합성된 제 1 차이 오디오 신호는 제 2 검출기(170)로 출력된다.
제 2 검출기(170)는 제 1 검출기(150)에서 출력되는 제 1 차이 오디오 신호와 제 2 하모닉 부호화 모듈(160)로부터 출력되는 합성된 제 1 차이 오디오 신호간의 차이 오디오 신호를 검출하여 제 2 차이 오디오 신호로 출력한다.
캘프 모듈(180)은 제 1 하모닉 부호화 모듈(140)에서 얻은 양자화된 LPC 계수를 이용하여 제 2 검출기(170)로부터 출력되는 제 2 차이 오디오 신호를 캘프 부호화하면서, 오디오 신호 복호화를 위하여 양자화된 스토캐스틱 인덱스와 양자화된 제 2 이득 인덱스를 출력한다.
이를 위하여 캘프 모듈(180)은 도 4에 도시된 바와 같이 제 3 검출기(401), 인지가중 필터(402), 스토캐스틱 코드북 탐색기(403), 인덱스 양자화기(404), 스토캐스틱 코드북(405), 승산기(406), LPC 계수 분석기(407), 및 합성 필터(408)를 포함한다.
제 3 검출기(401)는 제 2 검출기(170)로부터 출력되는 재 2 차이 오디오 신호와 상기 켈프 모듈(180)에 의해 이전에 얻은 합성된 오디오 신호간의 차이 오디오 신호를 검출한다.
인지 가중 필터(402)는 청취적 마스킹 효과를 이용하여 제 4 검출기(401)로부터 출력되는 차이 오디오 신호에 대한 양자화 잡음이 마스킹 레벨 이하가 되도록, LPC 계수 분석기(407)로부터 제공되는 LPC계수를 이용하여 상기 차이 오디오 신호를 인지 가중 필터링한다.
스토캐스틱 코드북 탐색기(403)는 인지 가중 필터(402)로부터 출력되는 신호를 토대로 상응하는 하나의 스토캐스틱 코드북을 탐색하고, 탐색된 스토캐스틱 코드북의 인덱스를 출력한다.
인덱스 양자화기(404)는 스토캐스틱 코드북 탐색기(403)로부터 제공되는 인덱스를 양자화하고, 양자화된 스토캐스틱 코드북 인덱스 및 양자화된 이득 인덱스를 출력한다.
스토캐스틱 코드북(405)은 복수개의 스토캐스틱 코드북을 구비하고, 인덱스 양자화기(404)로부터 제공되는 양자화된 스토캐스틱 코드북 인덱스에 대응된 스토캐스틱 코드북을 출력한다.
승산기(406)는 인덱스 양자화기(404)로부터 출력되는 양자화된 이득을 상기 스토캐스틱 코드북(405)으로부터 출력되는 스토캐스틱 코드북에 승산한다.
LPC 계수 분석기(407)는 제 1 하모닉 부호화 모듈(140)로부터 제공되는 양자화된 선형 예측 코딩 계수에 의해 상기 제 3 검출기(401)로부터 출력되는 신호의 양자화된 선형 예측 코딩 계수를 분석하여 양자화된 LPC 계수를 추출한다. 양자화된 LPC 계수 추출 방식은 상기 제 2 하모닉 부호화 모듈(160)에 구비되어 있는 LPC 계수 분석기(301)에서와 같다.
추출된 LPC 계수는 인지가중 필터(402)와 합성 필터(408)로 각각 제공된다.
합성 필터(408)는 상기 LPC 계수 분석기(407)로부터 출력되는 양자화된 LPC 계수에 의해 상기 승산기(406)로부터 출력되는 신호를 합성 필터링하고, 합성 필터링된 결과를 제 3 검출기(401)로 제공한다. 상기 합성 필터링은 양자화된 LPC 계수로부터 합성 필터의 임펄스 응답을 구한 후, 상기 임펄스 응답과 상기 승산기(406)로부터 출력되는 신호의 컨벌루션을 수행하여 합성된 오디오 신호를 얻는다.
도 5는 본 발명의 바람직한 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다. 도 5를 참조하면, 상기 오디오 복호화 장치는 LPC 계수 역양자화기(501), 위상 인덱스 역양자화기(502), 하모닉 인덱스 역양자화기(503), 제 1 이득 인덱스 역양자화기(504), 스토캐스틱 인덱스 역양자화기(505), 및 제 2 이득 인덱스 역양자화기(506), 제 1 하모닉 복호화 모듈(510), 제 2 하모닉 복호화 모듈(520), 제 1 가산기(530), 캘프 복호화 모듈(540), 및 제 2 가산기(550)를 포함한다.
상기 역양자화기들(501∼506)은 오디오 신호를 복원하기 위한 복수의 파라미 터들을 각각 역양자화하는 역양자화 유니트로 정의할 수 있다.
제 1 하모닉 복호화 모듈(510)은 LPC 계수 역양자화기(501)로부터 출력되는LPC 계수와 위상 인덱스 역양자화기(502)로부터 출력되는 위상 값을 이용하여 하모닉 복호화를 수행하여, 하모닉을 포함한 복원된 오디오 신호를 출력한다.
이를 위하여, 제 1 하모닉 복호화 모듈(510)은 LPC 계수/크기 변환부(511)와 하모닉 합성부(512)를 포함한다.
LCP 계수/크기 변환부(511)는 LPC 계수를 정현파 사전의 크기 벡터 로 변환한다. 하모닉 합성부(512)는 위상 인덱스 역양자화기(502)로부터 출력되는 위상 벡터 와 LPC/크기 변환기(511)로부터 출력되는 정현파 사전의 크기 벡터 를 상기 수학식 8에 의해 합성하여 하모닉을 포함한 오디오 신호를 출력한다. 출력된 하모닉을 포함한 오디오 신호는 제 1 가산기(530)로 출력된다.
제 2 하모닉 복호화 모듈(520)은 LPC 계수 역양자화기(501)로부터 출력되는 LPC 계수, 하모닉 인덱스 역양자화기(503)로부터 출력되는 하모닉 인덱스 및 제 1 이득 인덱스 역양자화기(504)로부터 출력되는 제 1 이득 값을 토대로 하모닉 복호화를 수행한다.
이를 위하여 제 2 하모닉 복호화 모듈(520)은 하모닉 코드 생성기(521), 제 1 승산기(522), 및 제 1 합성 필터(523)를 포함한다.
하모닉 코드 생성기(521)는 복수개의 하모닉 코드를 구비하고, 입력되는 하모닉 인덱스를 토대로 하모닉 코드를 생성한다. 제 1 승산기(522)는 생성된 하모닉 코드와 제 1 이득값을 승산한다.
제 1 합성 필터(523)는 입력되는 LPC 계수를 토대로 제 1 승산기(522)로부터 출력되는 신호를 합성 필터링하고, 합성된 필터링된 오디오 신호를 제 1 가산기(530)로 출력한다. 제 1 승산기(522)로부터 출력되는 오디오 신호를 sh(n), LPC 계수를 a, 합성 필터링된 오디오 신호를 s1(n)라 하면 상기 합성 필터링 과정은 수학식 9와 같이 정의될 수 있다.
수학식 9에서 p는 LPC 계수의 차수를 나타낸다.
제 1 가산기(530)는 제 1 하모닉 복호화 모듈(510)에서 출력되는 신호와 제 2 하모닉 복호화 모듈(520)에서 출력되는 신호를 가산하여 출력한다. 출력된 신호는 제 2 가산기(550)로 전송된다.
캘프 복호화 모듈(540)은 스토캐스틱 인덱스 역양자화기(505)로부터 출력되는 스토캐스틱 인덱스와 제 2 이득 인덱스 역양자화기(506)로부터 출력되는 제 2 이득 값을 토대로 켈프 복호화를 수행한다.
이를 위하여 캘프 복호화 모듈(540)은 스토캐스틱 코드북(541), 승산기(542) 및 제 2 합성 필터(543)를 포함한다.
스토캐스틱 코드북(541)은 복수개의 스토캐스틱 코드북을 구비하고, 스토캐스틱 인덱스를 토대로 상응하는 스토캐스틱 코드북을 출력한다.
제 2 승산기(542)는 제 2 이득 값과 스토캐스틱 코드북을 승산한다. 제 2 합성 필터(543)는 LPC 계수를 토대로 제 2 승산기(542)로부터 출력되는 신호를 상기 수학식 9에 의해 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기(550)로 제공한다.
제 2 가산기(550)는 제 1 가산기(530)로부터 출력되는 신호와 상기 켈프 복호화 모듈(540)로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력한다.
도 6은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 1를 참조하여 설명하면 다음과 같다.
입력되는 오디오 신호의 피치를 분석하여 피치 주기를 구한다(601).
입력되는 오디오 신호에 하모닉이 포함되어 있는지 여부를 판단하여 입력되는 오디오 신호를 분류하고, 분류된 결과를 토대로 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(160) 및 캘프 모듈(180)에 대한 비트를 할당한다(602).
LPC 계수를 분석하지 않고, 601 단계에서 얻은 피치 주기를 이용하여 입력되는 오디오 신호에 대한 하모닉 부호화를 제 1 하모닉 부호화 모듈(140)에서와 같이 수행한다(603). 즉, 입력되는 오디오 신호에 대한 하모닉 분석을 수행하고, 하모닉 분석에 의해 검출되는 정현파 사전의 크기를 LPC계수로 변환하고, 변환된 LPC 계수를 양자화하고, 이를 다시 크기 벡터로 변환하여 하모닉 합성을 수행한다. 양자화된 LPC계수는 2차 하모닉 부호화 및 켈프 부호화시 이용된다.
입력되는 오디오 신호와 603 단계에서의 하모닉 부호화 결과간의 차이 오디오 신호를 제 1 차이 오디오 신호로 하고, 상기 제 1 차이 오디오 신호에 대한 선 형 예측 코딩 계수를 분석하면서 상기 제 1 차이 오디오 신호에 대한 하모닉 부호화를 제 2 하모닉 부호화 모듈(160)에서와 같이 수행한다(604). 이 때, 제 1 차이 오디오 신호에 대한 선형 예측 코딩 계수는 제 603 단계에서 검출된 양자화된 LPC 계수를 이용하여 추출된다.
그 다음, 상기 제 1 차이 오디오 신호에 대한 하모닉 부호화 결과와 입력되는 오디오 신호간의 차이 오디오 신호를 제 2 차이 오디오 신호로 하고, 상기 제 2 차이 오디오 신호를 켈프 모듈(180)에서와 같이 켈프 부호화한다(605). 켈프 부호화 시, 제 2 차이 오디오 신호에 대한 선형 예측 코딩 계수는 제 603 단계에서 검출된 양자화된 LPC계수를 이용하여 추출된다.
603 단계, 604 단계 및 605 단계에서 각각 얻은 복수의 파라미터들을 오디오 신호 복호화를 위해 전송한다(606). 상기 복수의 파라미터들은 양자화된 LPC 계수 인덱스, 양자화된 위상 인덱스, 양자화된 하모닉 인덱스, 양자화된 제 1 이득 인덱스, 양자화된 스토캐스틱 인덱스, 및 양자화된 제 2 이득 인덱스를 포함한다.
도 7은 본 발명의 바람직한 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도5를 참조하여 설명하면 다음과 같다.
오디오 신호를 복원하기 위한 복수의 파라미터가 수신되면(701), 수신된 복수의 파라미터들을 각각 역양자화한다(702).
702 단계에 의해 얻어진 LPC 계수와 위상 값을 토대로 하모닉 복호화를 도 5의 제 1 하모닉 복호화 모듈(510)과 같이 수행한다(703). 702 단계에 의해 얻어진 LPC 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 도 5의 제 2 하모닉 복호화 모듈(520)과 같이 수행한다(704). 703 단계에서 얻은 1차 하모닉 복호화 결과와 704 단계에서 얻은 2차 하모닉 복호화 결과를 가산한 오디오 신호를 얻는다(705). 상기 702 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 도 5의 캘프 복호화 모듈(540)과 같이 수행한다(706).
705 단계에서 얻은 가산 결과와 706 단계에서 얻은 캘프 복호화 결과를 가산하여 오디오 신호를 복원한다(707).
본원 발명에 따른 고대역 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본 질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 본 발명에 따르면, 2차에 걸쳐 하모닉 분석을 수행함으로써 동일한 비트를 이용하여 더 많은 하모닉을 찾을 수 있다.
입력되는 오디오 신호에 하모닉 포함여부에 따라 하모닉 부호화시 이용되는 비트의 할당을 가변적으로 운영함으로써, CGS(Coarse Granularity Scalability) 기능을 용이하게 지원할 수 있을 뿐 아니라 하모닉 음질을 최적화시킬 수 있다.
또한, 하모닉 부호화를 LPC 계수를 분석하지 않는 하모닉 부호화 후, LPC 계수를 분석하는 하모닉 부호화를 수행한 후, 켈프 부호화를 수행함으로써, 피치 해빙 예측이나 피치 더블링 예측을 방지할 있어 음질 저하를 최소화 할 수 있다.
Claims (25)
- 오디오 부호화 장치에 있어서,입력되는 오디오 신호의 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하는 제 1 하모닉 부호화 모듈;상기 제 1 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 제 1 차이 오디오 신호로 검출하는 제 1 검출기;상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수와 이전의 하모닉 부호화 결과를 이용하여 상기 제 1 차이 오디오 신호를 하모닉 부호화하는 제 2 하모닉 부호화 모듈;상기 제 2 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 제 1 차이 오디오 신호간의 차이 오디오 신호를 제 2 차이 오디오 신호로 검출하는 제 2 검출기;상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 차이 오디오 신호를 켈프 부호화하는 켈프 모듈을 포함하는 오디오 부호화 장치.
- 제 1 항에 있어서, 상기 제 1 하모닉 부호화 모듈은 상기 입력되는 오디오 신호의 하모닉의 크기를 선형 예측 코딩 계수로 변환하고, 상기 변환된 선형 예측 코딩 계수를 양자화하고, 상기 양자화된 선형 예측 코딩 계수를 상기 제 2 하모닉 부호화 모듈과 상기 켈프 모듈로 각각 제공하는 것을 특징으로 하는 오디오 부호화 장치.
- 제 1 항 또는 제 2 항에 있어서, 상기 제 2 하모닉 부호화 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 제 2 하모닉 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
- 제 3 항에 있어서, 상기 켈프 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 켈프 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
- 제 1 항에 있어서, 상기 켈프 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 켈프 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
- 제 1 항 또는 제 2 항에 있어서, 상기 오디오 부호화 장치는,상기 입력되는 오디오 신호가 하모닉을 포함하는 오디오 신호인지 여부에 따라 상기 제 1 하모닉 부호화 모듈, 제 2 하모닉 부호화 모듈 및 켈프 모듈에 대한 비트를 할당하는 비트 할당부를 더 포함하는 오디오 부호화 장치.
- 제 6 항에 있어서, 상기 입력되는 오디오 신호가 하모닉을 포함하면, 상기 비트 할당부는 상기 제 1 하모닉 부호화 모듈, 상기 제 2 하모닉 부호화 모듈, 및 상기 켈프 모듈중 상기 켈프 모듈에 가장 작은 비트를 할당하고, 상기 입력되는 오디오 신호가 하모닉을 포함하지 않으면, 상기 제 1 하모닉 부호화 모듈, 상기 제 2 하모닉 부호화 모듈, 및 상기 켈프 모듈중 상기 켈프 모듈에 가장 많은 비트를 할당하는 것을 특징으로 하는 오디오 부호화 장치.
- 제 6 항에 있어서, 상기 제 1 하모닉 부호화 모듈은,상기 피치 주기를 이용하여 상기 입력되는 오디오 신호의 하모닉을 분석하는 제 1 하모닉 분석부;상기 제 1 하모닉 분석부로부터 출력되는 오디오 신호의 크기를 선형 예측 코딩 계수로 변환하는 제 1 변환기;상기 비트 할당부로부터 제공되는 할당된 비트 정보를 이용하여 상기 선형 예측 코딩 계수를 양자화하여 상기 양자화된 선형 예측 코딩 계수와 양자화된 선형 예측 계수 인덱스를 출력하는 선형 예측 코딩 계수 양자화기;상기 양자화된 선형 예측 코딩 계수를 크기로 변환하여 양자화된 크기 값을 출력하는 제 2 변환기;상기 비트 할당부로부터 제공되는 할당된 비트 정보를 토대로 상기 제 1 하모닉 분석부로부터 출력되는 위상을 양자화하여 양자화된 위상과 양자화된 위상 인덱스를 출력하는 위상 양자화기; 및상기 양자화된 위상과 상기 제 2 변환기로부터 출력되는 양자화된 크기를 합성하여 상기 입력되는 오디오 신호에 대한 합성된 오디오 신호를 출력하는 제 1 하모닉 합성부를 포함하는 오디오 부호화 장치.
- 제 8 항에 있어서, 상기 제 2 하모닉 부호화 모듈은,상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호에 대한 양자화된 선형 예측 코딩 계수를 얻는 선형 예측 코딩 계수 분석기;상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호를 역합성 필터링하는 상기 제 1 차이 오디오 신호의 여기신호를 출력하는 역합성 필터;상기 여기신호의 하모닉을 분석하는 제 2 하모닉 분석부;상기 제 2 하모닉 분석부로부터 출력되는 하모닉 인덱스를 양자화하는 인덱스 양자화기;상기 인덱스 양자화기로부터 출력되는 상기 양자화된 하모닉 인덱스를 토대로 하모닉 합성을 수행하는 제 2 하모닉 합성부; 및상기 선형 예측 코딩 계수를 토대로 상기 제 2 하모닉 합성부로부터 출력되는 하모닉 합성된 신호를 합성 필터링하여 상기 제 1 차이 오디오 신호에 대한 합성된 오디오 신호를 출력하는 합성 필터를 포함하는 오디오 부호화 장치.
- 제 9 항에 있어서, 상기 켈프 모듈은,상기 제 2 차이 오디오 신호와 상기 켈프 모듈에 의해 이전에 얻은 합성된 오디오 신호간의 차이 오디오 신호를 검출하는 제 3 검출기;상기 제 1 하모닉 부호화 모듈로부터 제공되는 양자화된 선형 예측 코딩 계수에 의해 상기 제 3 검출기로부터 출력되는 신호의 선형 예측 코딩 계수를 추출하는 선형 예측 코딩 계수 분석기;상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 3 검출기로부터 출력되는 차이 오디오 신호를 인지 가중 필터링하는 인지 가중 필터;상기 인지 가중 필터로부터 출력되는 신호를 토대로 스토캐스틱 코드북을 탐색하는 스토캐스틱 코드북 탐색기;상기 스토캐스틱 코드북 탐색기로부터 제공되는 인덱스를 양자화하여, 양자화된 스토캐스틱 코드북 인덱스 및 양자화된 이득 인덱스를 출력하는 인덱스 양자화기;인덱스 양자화기로부터 제공되는 양자화된 스토캐스틱 코드북 인덱스에 대응된 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;상기 인덱스 양자화기로부터 출력되는 양자화된 이득을 상기 스토캐스틱 코드북으로부터 출력되는 스토캐스틱 코드북에 승산하는 승산기; 및상기 선형 예측 코딩 계수 분석기로부터 출력되는 선형 예측 코딩 계수에 의해 상기 승산기로부터 출력되는 신호를 합성 필터링하여 상기 제 2 차이 신호에 대 한 합성된 오디오 신호를 얻고, 상기 합성된 오디오 신호를 제 3 검출기로 제공하는 합성 필터를 포함하는 오디오 부호화 장치.
- 제 1 항 또는 제 2 항에 있어서, 상기 제 2 하모닉 부호화 모듈은,상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호에 대한 양자화된 선형 예측 코딩 계수를 얻는 선형 예측 코딩 계수 분석기;상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호를 역합성 필터링하는 상기 제 1 차이 오디오 신호의 여기신호를 출력하는 역합성 필터;상기 여기신호의 하모닉을 분석하는 제 2 하모닉 분석부;상기 제 2 하모닉 분석부로부터 출력되는 하모닉 인덱스를 양자화하는 인덱스 양자화기;상기 인덱스 양자화기로부터 출력되는 상기 양자화된 하모닉 인덱스를 토대로 하모닉 합성을 수행하는 제 2 하모닉 합성부; 및상기 선형 예측 코딩 계수를 토대로 상기 제 2 하모닉 합성부로부터 출력되는 하모닉 합성된 신호를 합성 필터링하여 상기 제 1 차이 오디오 신호에 대한 합성된 오디오 신호를 출력하는 합성 필터를 포함하는 오디오 부호화 장치.
- 제 6 항에 있어서, 상기 음성 부호화 장치는,상기 입력되는 오디오 신호의 피치를 분석하여 상기 피치 주기를 출력하는 피치 분석부;상기 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판별하고, 판별결과를 상기 비트 할당부로 제공하는 신호 분류부를 더 포함하는 오디오 부호화 장치.
- 제 6 항에 있어서, 상기 음성 부호화 장치는,상기 입력되는 오디오 신호의 피치를 분석하여 상기 피치 주기를 출력하는 피치 분석부;상기 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판별하고, 판별결과를 상기 비트 할당부로 제공하는 신호 분류부를 더 포함하는 오디오 부호화 장치.
- 오디오 복호화 장치에 있어서,상기 오디오 신호를 복원하기 위한 복수의 파라미터들을 각각 역양자화하는 역양자화 유니트;상기 역양자화 유니트로부터 출력되는 선형 예측 코딩 계수와 위상 값을 이용하여 하모닉 복호화를 수행하는 제 1 하모닉 복호화 모듈;상기 역양자화 유니트로부터 출력되는 상기 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 제 2 하모닉 복호화 모듈;상기 제 1 하모닉 복호화 모듈에서 출력되는 신호와 상기 제 2 하모닉 복호화 모듈에서 출력되는 신호를 가산하는 제 1 가산기;상기 역양자화 유니트로부터 출력되는 스토캐스틱 코드북 인덱스 및 제 2 이득 값을 토대로 켈프 복호화를 수행하는 켈프 복호화 모듈; 및상기 제 1 가산기로부터 출력되는 신호와 상기 켈프 복호화 모듈로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력하는 제 2 가산기를 포함하는 오디오 복호화 장치.
- 제 14 항에 있어서, 상기 제 1 하모닉 복호화 모듈은,상기 선형 예측 코딩 계수를 크기로 변환하는 변환기; 및상기 위상 값과 상기 변환기로부터 출력되는 크기를 합성하여 하모닉을 포함한 오디오 신호를 상기 제 1 가산기로 출력하는 하모닉 합성부를 포함하는 오디오 복호화 장치.
- 제 14 항 또는 제 15 항에 있어서, 상기 제 2 하모닉 복호화 모듈은,상기 하모닉 인덱스를 토대로 하모닉 코드를 생성하는 하모닉 코드 생성기;상기 하모닉 코드와 상기 제 1 이득값을 승산하는 제 1 승산기; 및상기 선형 예측 코딩 계수를 토대로 상기 제 1 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 1 가산기로 제공하는 제 1 합성 필터를 포함하는 오디오 복호화 장치.
- 제 16 항에 있어서, 상기 켈프 복호화 모듈은,상기 스토캐스틱 인덱스를 토대로 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;상기 제 2 이득 값과 상기 스토캐스틱 코드북을 승산하는 제 2 승산기; 및상기 선형 예측 코딩 계수를 토대로 상기 제 2 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기로 제공하는 제 2 합성 필터를 포함하는 오디오 복호화 장치.
- 제 14 항 또는 제 15 항에 있어서, 상기 켈프 복호화 모듈은,상기 스토캐스틱 인덱스를 토대로 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;상기 제 2 이득 값과 상기 스토캐스틱 코드북을 승산하는 제 2 승산기; 및상기 선형 예측 코딩 계수를 토대로 상기 제 2 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기로 제공하는 제 2 합성 필터를 포함하는 오디오 복호화 장치.
- 오디오 부호화 방법에 있어서,입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계;상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계;상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 오디오 부호화 방법.
- 제 19 항에 있어서, 상기 하모닉 부호화 단계는,상기 입력되는 오디오 신호의 하모닉의 크기를 선형 예측 코딩 계수로 변환하고,상기 변환된 선형 예측 코딩 계수를 양자화하는 단계를 더 포함하고,상기 차이 오디오 신호에 대한 하모닉 부호화 단계 및 상기 켈프 부호화 단계는 상기 양자화된 선형 예측 코딩 계수를 이용하여 각각의 부호화 시 필요한 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 방법.
- 제 19 항 또는 제 20 항에 있어서, 오디오 부호화 방법은,상기 입력되는 오디오 신호에 하모닉이 포함되었는지 여부를 판단하여 상기 부호화 단계들에 대한 비트를 할당하는 단계를 더 포함하는 오디오 부호화 방법.
- 제 19 항 또는 제 20 항에 있어서, 상기 오디오 부호화 방법은,상기 입력되는 오디오 신호의 피치를 분석하여 피치 주기를 얻는 단계를 더 포함하고,상기 선형 예측 코딩 계수 분석 없는 하모닉 부호화 단계는 상기 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 분석을 수행하는 것을 특징으로 하는 오디오 부호화 방법.
- 오디오 복호화 방법에 있어서,오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계;상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계;상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계;상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계;상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 오디오 복호화 방법.
- 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서,상기 오디오 부호화 방법은,입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계;상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계;상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 기록 매체.
- 오디오 복호화 방법을 수행하는 프로그램이 저장된 기록 매체에 있어서,상기 오디오 복호화 방법은,오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계;상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계;상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계;상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계;상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 기록 매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050020136A KR100707184B1 (ko) | 2005-03-10 | 2005-03-10 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
US11/333,342 US20060206316A1 (en) | 2005-03-10 | 2006-01-18 | Audio coding and decoding apparatuses and methods, and recording mediums storing the methods |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050020136A KR100707184B1 (ko) | 2005-03-10 | 2005-03-10 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060099107A KR20060099107A (ko) | 2006-09-19 |
KR100707184B1 true KR100707184B1 (ko) | 2007-04-13 |
Family
ID=36972148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050020136A KR100707184B1 (ko) | 2005-03-10 | 2005-03-10 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060206316A1 (ko) |
KR (1) | KR100707184B1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100868763B1 (ko) | 2006-12-04 | 2008-11-13 | 삼성전자주식회사 | 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
US8532803B2 (en) * | 2009-03-06 | 2013-09-10 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
GB2474076B (en) * | 2009-10-05 | 2014-03-26 | Sonnox Ltd | Audio repair methods and apparatus |
EP2369861B1 (en) * | 2010-03-25 | 2016-07-27 | Nxp B.V. | Multi-channel audio signal processing |
SG10201802826QA (en) * | 2013-12-02 | 2018-05-30 | Huawei Tech Co Ltd | Encoding method and apparatus |
CN106409300B (zh) | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09127991A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 音声符号化方法及び装置、音声復号化方法及び装置 |
KR19980042556A (ko) * | 1996-11-19 | 1998-08-17 | 이데이노브유끼 | 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체 |
KR20020022257A (ko) * | 2000-09-19 | 2002-03-27 | 오길록 | 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법 |
JP2002366195A (ja) | 2001-06-04 | 2002-12-20 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化パラメータ符号化方法及び装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6188979B1 (en) * | 1998-05-28 | 2001-02-13 | Motorola, Inc. | Method and apparatus for estimating the fundamental frequency of a signal |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
US7027980B2 (en) * | 2002-03-28 | 2006-04-11 | Motorola, Inc. | Method for modeling speech harmonic magnitudes |
KR100446242B1 (ko) * | 2002-04-30 | 2004-08-30 | 엘지전자 주식회사 | 음성 부호화기에서 하모닉 추정 방법 및 장치 |
US20060015329A1 (en) * | 2004-07-19 | 2006-01-19 | Chu Wai C | Apparatus and method for audio coding |
-
2005
- 2005-03-10 KR KR1020050020136A patent/KR100707184B1/ko not_active IP Right Cessation
-
2006
- 2006-01-18 US US11/333,342 patent/US20060206316A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09127991A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 音声符号化方法及び装置、音声復号化方法及び装置 |
KR19980042556A (ko) * | 1996-11-19 | 1998-08-17 | 이데이노브유끼 | 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체 |
KR20020022257A (ko) * | 2000-09-19 | 2002-03-27 | 오길록 | 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법 |
JP2002366195A (ja) | 2001-06-04 | 2002-12-20 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化パラメータ符号化方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US20060206316A1 (en) | 2006-09-14 |
KR20060099107A (ko) | 2006-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8548801B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
KR101413968B1 (ko) | 오디오 신호의 부호화, 복호화 방법 및 장치 | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
KR102626320B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
KR20080101873A (ko) | 부호화/복호화 장치 및 방법 | |
JP4599558B2 (ja) | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 | |
US20090192789A1 (en) | Method and apparatus for encoding/decoding audio signals | |
KR20130007485A (ko) | 대역폭 확장신호 생성장치 및 방법 | |
JP6763849B2 (ja) | スペクトル符号化方法 | |
KR101216098B1 (ko) | 신호 처리 방법 및 장치 | |
KR102593442B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
US20060206316A1 (en) | Audio coding and decoding apparatuses and methods, and recording mediums storing the methods | |
KR100789368B1 (ko) | 잔차 신호 부호화 및 복호화 장치와 그 방법 | |
KR102052144B1 (ko) | 음성 신호의 대역 선택적 양자화 방법 및 장치 | |
KR100651712B1 (ko) | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 | |
KR101413969B1 (ko) | 오디오 신호의 복호화 방법 및 장치 | |
KR101377667B1 (ko) | 오디오/스피치 신호의 시간 도메인에서의 부호화 방법 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
KR20080034818A (ko) | 부호화/복호화 장치 및 방법 | |
CN112927702B (zh) | 对线性预测系数量化的方法和装置及解量化的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment | ||
FPAY | Annual fee payment | ||
FPAY | Annual fee payment |
Payment date: 20160330 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |