Nothing Special   »   [go: up one dir, main page]

KR100417836B1 - 과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스 - Google Patents

과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스 Download PDF

Info

Publication number
KR100417836B1
KR100417836B1 KR10-2001-7005324A KR20017005324A KR100417836B1 KR 100417836 B1 KR100417836 B1 KR 100417836B1 KR 20017005324 A KR20017005324 A KR 20017005324A KR 100417836 B1 KR100417836 B1 KR 100417836B1
Authority
KR
South Korea
Prior art keywords
tilt
white noise
signal
spectral
scaled
Prior art date
Application number
KR10-2001-7005324A
Other languages
English (en)
Other versions
KR20010090803A (ko
Inventor
베세테브루노
사라미레드완
레페브레로치
Original Assignee
보이세지 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4162966&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100417836(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 보이세지 코포레이션 filed Critical 보이세지 코포레이션
Publication of KR20010090803A publication Critical patent/KR20010090803A/ko
Application granted granted Critical
Publication of KR100417836B1 publication Critical patent/KR100417836B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Error Detection And Correction (AREA)
  • Dc Digital Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Television Systems (AREA)
  • Installation Of Indoor Wiring (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Networks Using Active Elements (AREA)
  • Package Frames And Binding Bands (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Image Processing (AREA)
  • Inorganic Insulating Materials (AREA)
  • Parts Printed On Printed Circuit Boards (AREA)
  • Coils Or Transformers For Communication (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Optical Communication System (AREA)

Abstract

인코딩 중에 과거에 다운-샘플된(down-sampled) 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼(full-spectrum) 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 것 내부에 상기 고주파 내용을 주입하기위한 방법 및 디바이스에서, 백색 잡음 생성기는 백색 잡음 순서를 생성한다. 직렬로 연결된 이득 조절 유닛, 스펙트럴 형성기 및 대역-통과 필터는 유성음 요소, 에너지 스케일링 요소, 틸트 스케일링 요소, 스리고 선형 예측 필터 계수와 같은 다운-샘플된 광대역 신호를 타나내는 형태 파라메터들 집단과 연관해서 상기 백색 잡음 순서를 형성한다. 마지막으로, 신호 주입 회로는 과다-샘플되고 합성된 신호에 상기 스펙트럴적으로-형성된 백색 잡음 순서를 주입하고, 그로인해 전체-스펙트럼 합성된 광대역 신호를 생성한다.

Description

과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구 방법 및 디바이스{HIGH FREQUENCY CONTENT RECOVERING METHOD AND DEVICE FOR OVER-SAMPLED SYNTHESIZED WIDEBAND SIGNAL}
음향/화상(audio/video) 원격회의(teleconferencing), 무선 응용제품들, 그리고 인터넷 및 패킷(packet) 네트워크 응용제품과 같은 다양한 응용제품들에 있어서 좋은 주관적인 품질/비트율 균형을 가지는 효율적인 디지털 광대역 음성/음향(speech/audio) 인코딩(encoding) 기법들에 대한 요구는 증가해 왔다. 최근까지, 200~3400 Hz 영역으로 필터링되는 전화 대역들은 음성 코딩 응용들에 주로 사용되었다. 그러나, 음성 신호의 명료도와 자연스러움을 증가시키기 위해서 광대역 음성 응용의 필요성이 증가되고 있다. 직접 마주대하고 말하는 것과 같은 품질로 전달하기에 50-7000 Hz 영역의 대역폭으로 충분하다는 것이 밝혀졌다. 음향 신호에 있어서, 상기 영역은 들을 만한 음향 품질을 제공하지만, 20-20000 Hz 영역에서 동작하는 CD품질보다는 여전히 낮다.
음성 인코더는 음성 신호를 통신 채널(channel) 상으로 전달되는(혹은 저장 매체에 저장되는) 디지털 비트 스트림(bitstream)으로 변환한다. 상기 음성 신호는 (샘플되고 일반적으로 샘플당 16-비트로 양자화되어) 디지털화(digitized)되고, 상기 음성 인코더는 좋은 주관적인 음성 품질을 유지하면서 더 작은 수의 비트들로 이러한 디지털 샘플들을 나타내는 역할을 한다. 상기 음성 인코더 또는 합성기는 상기 전송되거나 저장되는 비트 스트림 상에서 동작하거나 이를 다시 음향 신호로 변환한다.
좋은 품질/비트율 균형을 달성할 수 있는 최적의 종래 기술 중 하나는 코드 여기된 선형 예측(Code Excited Linear Prediction:CELP) 기법이라 불린다. 상기 기법에 따르면, 상기 샘플된 신호는 일반적으로 프레임(frame)이라 블리는 L샘플들의 연속하는 블록들에서 처리되며, 여기서 L은 (10-30ms의 음성에 해당하는)소정의 기 설정된 수이다. CELP에서, 선형 예측(LP) 합성 필터는 각 프레임에서 연산되고 예측된다. 그 다음, 상기 L-샘플 프레임은 N샘플들의 크기인 서브프레임(subframe)이라 불리는 더 작은 블록들로 나누어지며, 여기서 L=kN이고, k는 한 프레임에서 서브프레임의 수이다(N은 일반적으로 4-10ms의 음성에 해당한다). 여기 신호는 각 서브프레임에서 결정되며, 이는 일반적으로 두개의 요소들로 구성되는데, 하나는 과거 여기(피치 기여(contribution) 또는 적응성 코드책(adaptive codebook)이라고도 불림)에서 나오고 다른 하나는 혁신적인 코드책(또는 고정된 코드책이라 불림)에서 나온 것이다. 이러한 여기 신호는 전송되거나, 상기 합성된 음성을 획득하기위해서 상기 LP 합성 필터의 입력으로서 상기 디코더에서 사용된다.
상기 CELP 환경(context)의 혁신적인 코드책은 N-차원적인 코드 벡터들로 나타내어지는 N-샘플-길이 순서들의 인덱스된 셋이다. 각 코드책 순서는 1에서 M영역의 정수 k로 인덱스되며, 여기서 M은 상기 코드책의 크기를 나타내고, 종종 비트들의 수로 표시되어 M=2b이다.
상기 CELP 기법에 따라 음성을 합성하기 위해서, N샘플들의 각 블록은 상기 음성 신호의 스팩트럴 특성들을 모델링(modeling)하는 시간 변동(time varing) 필터들을 통해서 코드책으로부터 적절한 코드벡터를 필터링하는 것으로 합성된다. 상기 인코더 종단에서, 상기 합성 출력은 상기 코드책의 코드벡터들 모두, 혹은 서브셋(subset)에 대해서(코드책 검색) 연산된다. 유지되는(retained) 코드벡터는 인식적으로(perceptually) 가중된 왜곡(distortion) 측정을 통해서 상기 원본 음성 신호에 가장 가까운 상기 합성 출력을 생성하는 것이다. 상기 인식적 가중치는 인식적 가중 필터라 불리는 것을 이용하여 수행되며, 이는 일반적으로 LP 합성 필터로부터 파생된다.
상기 CELP 모델은 전화 대역 음향 신호들을 인코딩하는데 대단히 성공적이었으며, 몇몇 CELP-기반 표준들은 특히 디지털 셀룰라(cellular) 응용제품들을 비롯한 응용제품들에 다양하게 사용된다. 상기 전화 대역에서, 상기 음향 신호는 200-3400 Hz로 대역-제한되고, 8000 샘플/초로 샘플된다. 광대역 음성/음향 응용에서, 상기 음향 신호는 50-7000 Hz로 대역-제한되고 16000 샘플/초로 샘플된다.
상기 전화-대역 최적화된 CELP 모델을 광대역 신호들에 적용하는 경우 몇가지 어려움들이 발생하며, 고품질 광대역 신호들을 획득하기 위하여 상기 모델에 부가적으로 첨가해야할 특징들이 필요하다. 광대역 신호들은 전화-대역 신호들에 비해서 대단히 넓은 동적(dynamic) 영역을 가지며, 이는 상기 알고리즘의 고정 소숫점 연산이 요구되는 경우(이는 무선 응용에 필수적임) 정밀도 문제들을 야기한다. 또한, 상기 CELP 모델은 종종 그 인코딩 비트들의 대부분을 저주파 영역에서 사용하며, 이는 일반적으로 더 높은 에너지(energy) 내용을 가지는, 저역 통과 출력 신호가 된다. 이러한 문제를 극복하기 위해서, 상기 인식적 가중치 필터는 광대역 신호들에 적절하게 변경되어져야 하며, 더 간단한 고정-소숫점 연산을 가져오면서 상기 동적 영역을 줄이고, 상기 신호의 고주파 내용들의 더 나은 인코딩을 보장하기 위해서 중요해지는 고주파 영역들을 증폭하기위한 선-강조(pre-emphasis) 기법을 가져야 한다. 또한, 광대역 신호들에서 유성음 세그먼트(voiced segment)들 스팩트럼의 피치 내용들은 전체 스팩트럼 영역을 통해 확장되지 않으며, 음성의 총량은 협-대역 신호들에 비해서 더 많은 변화를 보인다. 그래서, 상기 음성 레벨(level)의 변동들을 혁신적으로 조절하도록 상기 폐-루프(closed-loop) 피치 분석을 개선하는것은 중요하다.
상기 전화-대역 최적화된 CELP 모델을 광대역 신호들에 적용하는 경우 몇가지 어려움들이 발생하며, 고품질 광대역 신호들을 획득하기 위하여 상기 모델에 부가적으로 첨가해야할 특징들이 필요하다.
예를 들어서, 상기 코딩 효율을 개선하고 상기 광대역 인코딩 알고리즘의 상기 알고리즘적인 복잡성을 감소시키기 위해서, 상기 입력 광대역 신호는 16kHz에서 약 12.8kHz로 다운-샘플된다. 이는 한 프레임에서 샘플되는 수, 처리 시간과 신호 대역 폭을 7000Hz 이하로 줄이고, 그로인해 대단히 고품질의 디코드된 음향 신호를 유지하면서 비트율을 12k비트/초 이하로 줄일 수 있다. 음성 프레임 단 더 작은 샘플들의 수를 사용하기 때문에 복잡성 역시 줄어든다. 상기 디코더에서, 상기 신호의 고주파 내용들은 상기 디코드된 합성 신호로부터 상기 저역 통과 필터링 효과를 제거하고, 광대역 신호들의 자연스러운 음향 품질을 회복하기위해 다시 도입될(reintroduced) 필요가 있다. 이러한 목적에 따라서, 상기 광대역 신호의 상기 고주파 내용을 복구하기위한 효율적인 기법은 그로인해 원본 신호에 근접하는 품질을 유지하면서 전체-스팩트럼 광대역 합성 신호를 생성하기위해 필요하다.
본 발명은 과거에 다운-샘플된(down-sampled) 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼(full-spectrum) 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 것 내부에 상기 고주파 내용을 주입하기위한 방법 및 디바이스에 관한 것이다.
도 1은 광대역 인코딩 디바이스의 바람직한 실시예를 간단한 블록다이어그램으로 나타낸 것이다.
도 2는 광대역 디코딩 디바이스의 바람직한 실시예를 간단한 블록다이어그램으로 나타낸 것이다.
도 3은 피치 분석 디바이스의 바람직한 실시예를 간단한 블록다이어그램으로 나타낸 것이다.
도 4는 도 1의 광대역 인코딩 디바이스와 도 2의 광대역 디코딩 디바이스가 사용될 수 있는 셀룰라 통신 시스템의 간략화된 블록 다이어그램으로 나타낸 것이다.
그래서, 본 발명의 목적은 이러한 효율적인 고주파 내용 복구 기법을 제공하는 것이다.
좀더 구체적으로, 본 발명에 따르면, 과거에 다운-샘플된 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 경우 내부에 상기 고주파 내용을 주입하기위한 방법이 제공된다. 상기 고주파 내용 복구 방법은, 잡음 순서를 생성하는 단계와; 상기 잡음 순서를 상기 다운-샘플된 광대역 신호를 나타내는 형태 파라메터(shaping parameter)들에 연관시켜 스펙트럴적으로 형성하는 단계와; 그리고 결과적으로 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하는 단계를 포함한다.
또한, 본 발명은 이전에 다운-샘플된 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 경우 내부에 상기 고주파 내용을 주입하기위한 디바이스에도 관련된다. 상기 고주파 내용 복구 디바이스는 잡음 순서를 생성하기위한 잡음 생성기와, 상기 잡음 순서를 상기 다운-샘플된 광대역 신호를 나타내는 형태 파라메터들에 연관시켜 스펙트럴적으로 형성하기위한 스펙트럴 형성 유닛과, 그리고 결과적으로 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 신호 주입 회로를 포함한다.
바람직한 실시에에서, 상기 잡음 순서는 백색 잡음 순서이다.
바람직하게, 상기 잡음 순서의 스팩트럴 형성단계는, 백색 잡음 순서와 상기 형태 파라메터들의 제 1서브셋에 대한 응답으로 스케일된 백색 잡음을 생성하는 단계와; 상기 스케일된 백색 잡음 순서를 상기 과다-샘플된 합성 신호 경우의 주파수 대역폭 보다 일반적으로 더 높은 주파수 대역폭에 의해서 특징 지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 대역폭 확장된 합성 필터 계수들을 포함하는 상기 형태 파라메터들의 제 2서브셋에 대하여 필터링하는 단계와; 그리고 상기 필터되고 스케일된 백색 잡음 순서를 상기 스펙트럴적으로 형성된 백색 잡음 순서로서 상기 과다-샘플된 합성 신호 경우에 후속적으로 주입되어야 하는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역-통과 필터링하는 단계를 포함한다.
또한, 본 발명에 따르면, 합성된 광대역 신호를 생성하기위한 디코더를 제공하며, 이는,
a) 인코딩하는 동안 이전에 다운-샘플된 광대역 신호의 인코드된 경우를 수신하고, 인코드된 광대역 신호 경우로부터 적어도 피치 코드책 파라메터들, 혁신적 코드책 파라메터들, 그리고 합성 필터 계수들을 추출하기위한 신호 분해(fragmenting) 디바이스와;
b) 피치 코드벡터를 생성하기위하여 상기 피치 코드책 파라메터들에 대해 응답하는 피치 코드책과,
c) 혁신된 코드벡터를 생성하기위하여 상기 혁신된 코드책 파라메터들에 대해 응답하는 혁신된 코드책과,
d) 결과적으로 여기 신호를 생성하도록 상기 피치 코드벡터와 상기 혁신된 코드벡터를 병합하기위한 병합기 회로와,
e) 결과적으로 합성된 광대역 신호를 생성하도록 합성 필터 계수들로 상기 여기 신호를 필터링하기위한 합성 필터와, 상기 합성된 광대역 신호의 과다-샘플된 신호 경우를 생성하도록 상기 합성된 광대역 신호에 응답하는 과다 샘플러(oversampler)를 포함하는 신호 합성 디바이스와, 그리고
f) 상기 설명된 바와 같이, 상기 광대역 신호의 고주파 내용을 복구하고, 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 고주파 내용 복구 디바이스를 포함한다.
바람직한 실시예에 따르면, 상기 디코더는,
a) 이득 조절 모듈(module)로 전송하도록 음성 요소(factor)를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
c) 상기 이득 조절 모듈로 전송하도록 틸트(tilt) 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 포함한다. 상기 형태 파라메터의 제 1서브셋은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하고, 상기 형태 파라메터의 제 2서브셋은 선형 예측 계수들을 포함한다.
상기 디코더의 다른 바람직한 실시예에 따르면:
- 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하고:
rv= (Ev- Ec) / (Ev+ Ec)
여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지이며:
- 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산한다:
에너지 스케일링 요소 =, n=0,..,N'-1.
여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된(enhanced) 여기 신호이고;
- 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하며:
gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
여기서
틸트 =, 틸트≥0이고 틸트≥rv'인 조건
또는 다음식:
gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
여기서
틸트 =, 틸트≥0이고 틸트≥rv'인 조건.
상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을가지는 것이 바람직하다.
또한, 본 발명에 따르면, 합성 광대역 신호를 생성하기위한 디코더는,
a) 인코딩하는 동안 이전에 다운-샘플된 광대역 신호의 인코드된 경우를 수신하고, 인코드된 광대역 신호 경우로부터 적어도 피치 코드책 파라메터들, 혁신적 코드책 파라메터들, 그리고 합성 필터 계수들을 추출하기위한 신호 분해 디바이스와;
b) 피치 코드벡터를 생성하기위하여 상기 피치 코드책 파라메터들에 대해 응답하는 피치 코드책과;
c) 혁신된 코드벡터를 생성하기위하여 상기 혁신된 코드책 파라메터들에 대해 응답하는 혁신된 코드책과;
d) 결과적으로 여기 신호를 생성하도록 상기 피치 코드벡터와 상기 혁신된 코드벡터를 병합하기위한 병합기 회로와; 그리고
e) 결과적으로 합성된 광대역 신호를 생성하도록 합성 필터 계수들로 상기 여기 신호를 필터링하기위한 합성 필터와, 상기 합성된 광대역 신호의 과다-샘플된 신호 경우를 생성하도록 상기 합성된 광대역 신호에 응답하는 과다 샘플러를 포함하는 신호 합성 디바이스를 포함하며;
상기 설명된 바와 같이, 상기 광대역 신호의 고주파 내용을 복구하고, 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 고주파 내용 복구 디바이스를 혁신적으로 포함한다.
마지막으로, 본 발명은 셀룰라 통신 시스템, 셀룰라 이동 송신/수신 유닛, 셀룰라 네트워크 소자(element), 그리고 상기 설명된 디코더를 포함하는 양방향 무선 동신 서브-시스템을 포함한다.
본 발명의 목적들, 이점들 및 다른 특징들은 첨부되는 도면들을 참조하여 예시적인 방편으로서 제공되는 후속하는 바람직한 실시예들의 제한적인 설명을 읽는 것으로 더 명백해질 것이다.
당 업계에서 일반적인 기술을 가진 업자에게는 공지된 것으로, 401과 같은(도 4참조) 셀룰라 통신 시스템은 넓은 지리학적 영역을 C개의 작은 셀들로 분리하는 것으로 넓은 지리학적 영역에 원거리통신 서비스를 제공한다. 상기 C개의 작은셀들은 각 셀에 무선 신호(signalling), 음향 및 데이터 채널들을 제공하기위해 개별적인 셀룰라 베이스 스테이션(base station)들(4021, 4022..402c)을 통해서 서비스된다.
무선 신호 채널들은 상기 셀룰라 베이스 스테이션(402)의 범위 영역(coverage area)(셀)의 한계 내에서 403과 같은 이동 무선전화기(radiotelephone)(이동 송신기/수신기 유닛)를 검색(page)하고, 그리고 상기 베이스 스테이션 셀의 내부 혹은 외부 중 하나에 위치된 다른 이동 무선전화기들(403)로 셀들을 위치시키거나, 공중 전환 전화 네트워크(Public Switched Telephone Network:PSTN)(404)와 같은 다른 네트워크에 셀들을 위치시키는데 사용된다.
일단, 무선전화기(403)가 성공적으로 셀에 위치되거나 수신하면, 상기 무선전화기(403)와 상기 무선전화기(403)가 놓인 셀에 해당하는 상기 셀룰라 베이스 스테이션(402) 간에 음향 또는 데이터 채널이 설정되고, 상기 베이스 스테이션(402)과 무선전화기(403) 간의 통신은 상기 음향 또는 데이터 채널을 통해 실시된다. 상기 무선전화기(403)는 통화가 진행중인 동안 신호 채널을 통해 제어 또는 타이밍(timing) 정보도 수신할 수 있다.
만일 무선전화기(403)가 통화가 진행중인 동안 셀을 떠나거나 인접하는 셀로 진입하는 경우, 상기 무선전화기(403)는 상기 통화를 상기 새로운 셀 베이스 스테이션(402)의 가용한 음향 또는 데이터 채널로 넘겨진다(hand over). 만일 무선전화기(403)가 통화가 진행되지 않는 동안 셀을 떠나거나 인접하는 셀로 진입하는 경우, 상기 무선전화기(403)는 상기 새로운 셀의 베이스 스테이션(402)에 입장(log into)하도록 상기 신호 채널을 통해 제어 메세지(message)를 전달한다. 이러한 방식으로 이동 통신을 광범위한 지리학적 영역에서 사용할 수 있다.
상기 셀룰라 통신 시스템(401)은 예를 들어서 무선전화기(403)와 상기 PSTN(404) 간의 통신 도중, 또는 제 1셀에 위치한 무선전화기(403)와 제 2셀에 위치한 무선전화기(403) 간의 통신 도중과 같은 상기 셀룰라 베이스 스테이션들(402)과 상기 PSTN(404) 간의 통신을 제어하기위한 제어 터미널(terminal)(405)을 더 포함한다.
물론, 양방향 무선 통신 서브시스템은 한 셀의 베이스 스테이션(402)과 그 셀에 위치되는 무선전화기(403) 간에 음향 또는 데이터 채널을 설정할 필요가 있다. 도 4에서 매우 간단한 형태로 예시한 바와 같이, 이러한 양방향 무선 통신 서브시스템은 전형적으로 무선 전화기(403)를 포함하는데, 이는:
- 다음이 포함된 송신기(406):
- 음성 신호를 인코딩하기위한 인코더(407)와; 그리고
- 409와 같은 안테나를 통해서 상기 인코더(407)로부터 상기 인코드된 음성 신호를 전송하기위한 전송회로(408)를 포함하고; 그리고
- 다음이 포함된 수신기(410)를 포함하며 이는:
- 일반적으로 상기와 동일한 안테나(409)를 통해서 송신되는 인코드된 음성 신호를 수신하기위한 수신 회로(411)와; 그리고
- 상기 수신 회로(411)로부터 상기 수신되는 인코드된 음성 신호를 디코딩하기위한 디코더(412)를 포함한다.
상기 무선전화기는 상기 인코더(407)와 디코더(412)가 연결되고 이로부터 신호들을 처리하기위한 다른 일반적인 무선전화 회로들(413)을 더 포함하며, 이러한 회로들(413)은 당 업자들에게는 공지된 것으로 본 명세서에서는 더이상 설명하지 않는다.
또한, 이러한 양방향 무선 통신 서브시스템은 전형적으로 다음과 같은 베이스 스테이션(402)을 포함하는데, 이는:
- 다음이 포함된 송신기(414):
- 음성 신호를 인코딩하기위한 인코더(415)와; 그리고
- 417과 같은 안테나를 통해서 상기 인코더(415)로부터 상기 인코드된 음성 신호를 전송하기위한 전송회로(416)를 포함하고; 그리고
- 다음이 포함된 수신기(418)를 포함하며 이는:
- 상기와 동일한 안테나(417)를 통하거나 다른 안테나(미도시)를 통해서 송신되는 인코드된 음성 신호를 수신하기위한 수신 회로(419)와; 그리고
- 상기 수신 회로(419)로부터 상기 수신되는 인코드된 음성 신호를 디코딩하기위한 디코더(420)를 포함한다.
전현적으로, 상기 베이스 스테이션(402)은 상기 제어 터미널(405)과 상기 송신기(414) 및 수신기(418) 간의 통신을 제어하기 위해서 그에 관련되는 데이터베이스(422)에 따르는 베이스 스테이션 제어기(412)를 더 포함한다.
당 업자들에게 공지된 바와 같이, 예를 들어 양방향 무선 통신 서브시스템, 즉 무선 전화기(403)와 베이스 스테이션(402)사이를 통한 대화와 같은 음성 신호는 그 음향 신호를 전송하는데 필요한 대역폭을 줄이기 위해서 음성 인코딩이 필요하다.
LP 음성 인코더(415 및 407과 같은)는 전형적으로 13k비트/초 미만에서 동작하고, CELP 인코더들은 전형적으로 상기 음성 신호의 단기(short-term) 스펙트럴 외피(envelope)를 모델하기위해서 LP 합성 필터를 이용한다. 상기 LP정보는 전형적으로 매 10 또는 20ms 마다 상기 디코더(420과 412와 같은)로 전송되고 상기 디코더 종단에서 추출된다.
본 발명의 새로운 기법들은 상이한 LP-기반 코딩 시스템들에 적용할 수 있다. 그러나, CELP-형 코딩 시스템은 이러한 기법들의 제한없는 예제를 보이기위한 목적으로 바람직한 실시예에 사용될 것이다. 동일한 방식으로, 이러한 기법들은 다른 종류의 광대역 신호들에도 적용할 수 있도록 음성 및 대화 외적인 음향 신호들에도 사용될 수 있다.
도 1은 광대역 신호들을 개선적으로 수용하기위해서 변경된 CELP-형 음성 인코딩 디바이스의 일반적인 블록 다이어그램을 도시한다.
샘플된 입력 음성 신호(114)는 "프레임"이라 불리는 후속적인 L-샘플 블록들로 나누어진다. 각 프레임에서, 상기 프레임의 음성 신호를 나타내는 상이한 파라메터들이 연산되고, 인코드되고, 그리고 전송된다. LP 합성 필터를 나타내는 LP 파라메터들은 일반적으로 각 프레임당 한번 연산된다. 상기 프레임은 N샘플들의 더작은 블록들(길이 N인 블록들)로 분리되고, 여기서 여기 파라메터들(피치와 혁신(innovation))이 결정된다. 상기 CELP 논문에서, 길이 N의 블록들은 "서브프레임"이라 불리며, 상기 서브프레임의 N-샙플 신호들은 N-차원 벡터들로 나타내어진다. 이러한 바람직한 실시예에서, 상기 길이 N은 5ms에 해당하는 반면 상기 길이 L이 20ms에 해당하며, 이는 한 프레임이 4개의 서브프레임을 포함한다는 것이다(16kHz의 샘플링 율에서 N=80이고 12.8kHz로 다운-샘플링한 후에는 64이다). 가변적인 N-차원 벡터들은 상기 인코딩 순서에서 발생한다. 도 1과 2에 나타나는 모든 벡터들의 목록 및 송신되는 파라메터들을 나열한다.
주(main) N-차원 벡터들의 목록
s 광대역 신호 입력 음성 벡터(다운-샘플링, 선-처리, 그리고 선-강조 이후)
sw가중된 음성 벡터
so가중된 합성 필터의 영-입력(zero-input) 응답
sp다운-샘플된 선-처리 신호
과다 샘플된 합성 음성 신호
s' 강조-제거(deemphasis) 이전 합성 신호
sd강조-제거된 합성 신호
sh강조-제거 및 후처리된 이후의 합성 신호
x 피치 검색을 위한 목표 벡터
x' 혁신 검색을 위한 목표 벡터
h 가중된 합성 필터 충격(impulse) 응답
vT지연 T에서의 적응성(피치) 코드책 벡터
yT필터된 피치 코드책 벡터(h와 합성곱된(convolved) vT)
ck인덱스 k에서의 혁신된 코드백터(상기 혁신적인 코드북의 k번째 구성원)
cf개선되고 스케일된 혁신 코드벡터
u 여기 신호(스케일된 혁신 및 피치 코드벡터들)
u' 개선된 여기
z 대역-통과 잡음 순서
w' 백색 잡음 순서
w 스케일된 잡음 순서
송신되는 파라메터들의 목록
STP 단기 예측 파라메터(A(z)로 정의)
T 피치 지연(lag) (또는 피치 코드책 인덱스)
b 피치 이득 (또는 피치 코드책 이득)
j 상기 피치 코드벡터에 사용되는 저역-통과 필터 인덱스
k 코드벡터 인덱스(혁신 코드책 구성원)
g 혁신 코드책 이득
본 바람직한 실시예에서, 상기 STP 파라메터들은 프레임당 한번 송신되고 나머지 파라메터들은 프레임당 4번(모든 서브프레임) 송신된다.
인코더 측면
샘플된 신호는 도 1의 인코더 디바이스(100)에 의해서 블록을 기반으로 블록 상에서 인코드되고, 이는 101에서 111로 번호 매겨지는 11개의 모듈들로 분리된다.
도 1에서, 상기 샘플된 입력 음성 신호(114)는 다운-샘플 모듈(101)에서 다운-샘플된다. 예를 들어서, 상기 신호는 당 업자들에게 공지된 기법을 사용하여 16kHz에서 12.8kHz로 다운-샘플된다. 다른 주파수로 다운되는 다운 샘플링도 물론 생각할 수 있다. 다운-샘플링은 코딩 효율을 높이는데, 이는 더 작은 주파수 대역폭이 인코드되기 때문이다. 이는 또한 프레임의 샘플들 수가 줄어들기 때문에 상기 알고리즘의 복잡성이 줄어든다. 다운-샘플링의 사용은 비록 다운-샘플링이 16k비트/초 이상일 필요가 없다면, 16k비트/초 미만으로 줄어드는 경우 그 효과가 대단하다.
다운-샘플링 이후, 상기 20ms의 320-샘플 프레임은 256-샘플 프레임으로 줄어든다(다운-샘플링 비율 4/5).
그 다음, 상기 입력 프레임은 선택적인 선-처리 블록(102)에 제공된다. 선-처리 블록(102)은 50Hz 차단 주파수를 가진 고역-통과 필터를 포함할 수 있다. 고역-통과 필터(102)는 50Hz이하의 원하지 않는 음향을 제거한다.
상기 다운-샘플되고 선-처리된 신호는 Sp(n), n=0,1,2,..,L-1로 나타내어지고, 여기서 L은 프레임의 길이이다(12.8kHz의 샘플링 주파수에서 256). 상기 선-강조 필터(103)의 바람직한 실시예에서, 상기 신호 Sp(n)는 다음의 전달함수를 가지는 필터를 이용하여 선-강조된다:
P(z) = 1 - μz-1
여기서 μ는 0에서 1(전형적으로 μ=0.7)사이에 위치한 값을 가지는 선-강조 요소이다. 고차 필터역시 사용될 수 있다. 고역-통과 필터(102)와 선-강조 필터(103)는 더 효율적인 고정-소숫점 연산들을 획득하기 위해서 교환되어질 수 있다는 것을 지적한다.
상기 선-강조 필터(103)의 함수는 상기 신호의 고주파 내용들을 개선하기위한 것이다. 이는 또한 상기 입력 음성 신호의 동적 영역을 줄이며, 이를 고정-소숫점 연산에 더 적절하도록 만든다. 선-강조 없이, 단일-정확성(single-precision) 산술을 이용한 고정-소숫점에서 LP 분석은 수행이 어렵다.
또한, 선-강조는 양자화 오차의 인식적인 가중치를 적절히 부여하는데 중요한 역할을 하며, 이는 개선된 음질을 제공한다. 이는 다음에 더 자세히 설명할 것이다.
선-강조 필터(103)의 출력은 s(n)으로 나타낸다. 상기 신호는 연산 모듈(104)의 LP 분석을 수행하기위해 사용된다. LP 분석은 당 업자들에게 공지된 사항이다. 본 바람직한 실시예에서는, 자동상호관계(autocorrelation) 접근법이 사용된다. 상기 자동상호관계 접근에서, 상기 신호(s(n))는 해밍(Hamming) 윈도우(window)(일반적으로 약 30-40ms 길이를 가짐)를 이용하여 처음 윈도우된다. 상기 자동상호관계들은 상기 윈도우된 신호로부터 연산되고, 레빈슨-더빈(Levinson-Durbin) 재귀가 LP 필터 계수들, aj, 여기서 j=1,..p, 여기서 p는 LP의 차수로 광대역 코딩에서 전형적으로 16,을 연산하는데 사용된다. 상기 파라메터들 aj는 상기 LP 필터의 전달함수 계수들이고, 이는 다음과 같은 관계식으로부터 주어진다:
LP 분석은 연산 모듈(104)에서 수행되고, 이는 또한 상기 LP 필터 계수들의 양자화 및 보간법(interpolation)을 수행한다. 상기 LP 필터 계수들은 양자화 및 보간법을 수행하기 적절한 다른 동등 영역(equivalent domain)으로 처음 전송된다. 상기 라인 스펙트럴 쌍(LSP)과 이미턴스(immittance) 스펙트럴 쌍(ISP) 영역들은 양자화와 보간법이 효율적으로 수행될 수 있는 두 영역들이다. 상기 16 LP 필터 계수들, aj는 분리 또는 다중-스테이지 양자화, 혹은 이들의 조합을 이용하여 약 30에서 50 비트들로 양자화 될 수 있다.상기 보간법의 목적은 각 서브프레임의 상기 LP 필터 계수들을 갱신하기위한 것이며, 이는 비트 율을 증가시키지 않고도 인코더 성능을 향상시킨다. 상기 LP 필터 계수들의 양자화 및 보간법은 당 업자들에게 공지된 것으로 믿어지므로 더이상 본 명세서에서 설명하지 않는다.
다음 단락들은 서브프레임 기반 상에서 실시되는 나머지 코딩을 설명할 것이다. 다음의 설명에서, 상기 필터 A(z)는 상기 서브프레임의 양자화되지 않고 보간되지 않은 LP 필터를 나타내며, 필터(z)는 상기 서브프레임의 양자화되고 보간된 LP 필터를 나타낸다.
인식적인 가중치:
분석-합성(analysis-by-synthesis) 인코더들에서, 상기 최적 피치 및 혁명 파라메터들은 인식적으로 가중되는 영역에서 입력 음성과 합성 음성 간의 평균 제곱 오차를 최소화 하는 것으로 검색된다. 이는 상기 가중된 입력 음성과 가중된 합성 음성 간의 오차를 최소화 하는 것과 동일하다.
상기가중된 신호 sw(n)은 인식적인 가중치 필터(105)에서 연산된다. 전통적으로, 상기 가중된 신호 sw(n)는 다음 형태인 전달함수 W(z)를 가지는 가중치 필터에 의해서 연산된다:
W(z)=A(z/γ1)/A(z/γ2) 여기서 0<γ21≤1
당 업자에게 공지된 바와 같이, 종래 분석-합성(AbS) 인코더들에서, 분석은 상기 양자화 오차가 전달함수 W-1(z)로 가중된다는 것을 보이며, 이는 상기 인식적인 가중치 필터(105)의 전달함수의 역이다. 이 결과는 IEEE 트랜섹션 ASSP 제 27권, 3호, 247-254페이지, 1979년 6월, 비. 에스. 아탈(Atal)과 엠. 알. 슈레더(Schroeder)의 "음성의 예측적인 코딩과 주관적 오차 기준(Predictivecoding of speech and subjective error criteria)"에서 잘 설명되어 있다. 전달함수 W-1(z)는 입력 음성 신호의 포르만트(formant) 구조를 나타낸다. 그래서, 상기 인간의 귀의 차폐(masking) 특성은 상기 양자화 오차를 형성하는 것에 의해 이용되고, 그로인해 이는 상기 포르만트 영역에서 더 많은 에너지를 가지며, 이는 이러한 영역에 존재하는 강한 신호 에너지에의해서 차폐된다. 가중치의 합은 요소 γ1과 γ2에 의해서 제어된다.
상기 전통적인 인식적 가중치 필터(105)는 전화 대역 신호에 대해서는 잘 동작한다. 하지만, 이러한 전통적인 인식적 가중치 필터(105)는 광대역 신호들의 효율적인 인식적 가중치에는 부적절하다는 것이 밝혀졌다. 또한 상기 전통적인 인식적 가중치 필터(105)는 상기 포르만트 구조의 모델링과, 동시적으로 요구되는 스펙트럴 틸트에서 고유한 제한을 가진다. 상기 스펙트럴 틸트는 상기 저주파에서 고주파까지의 동적 영역 때문에 광대역 신호들에서 더 많이 나타난다. 종래 기술은 상기 틸트와 상기 광대역 입력 신호들 분리적으로 제어하기위해서 틸트 필터를 W(z)에 부가하도록 권해왔다.
이러한 문제의 새로운 해법은, 본 발명에 따르면, 입력에 선-강조 필터(103)를 도입하고, 상기 LP 필터 A(z)를 상기 선-강조된 음성 s(n)을 기반으로 연산하며, 그리고 그 공통부분을 고정하는 것에의해 변경된 필터 W(z)를 이용한다.
LP 분석은 상기 LP 필터 A(z)를 획득하기위해서 상기 선-강조된 신호 s(n) 상의 모듈(104)에서 수행된다. 또한, 고정된 공통부분을 가지는 새로운 인식적 가중치 필터(105)가 사용된다. 상기 인식적 가중치 필터(104)에 대한 전달함수의 예제는 다음의 식에의해 주어진다:
W(z)=A(z/γ1)/(1-γ2z-1) 여기서 0<γ21≤1
상기 공통부분에서 높은 차수가 이용될 수 있다. 실질적으로 이러한 구조는 상기 틸트로부너 상기 포르만트 가중치를 분리한다.
A(z)가 상기 선-강조된 음성 신호 s(n)을 기반으로 연산되기 때문에, 상기 필터 1/A(z/γ1)의 틸트는 A(z)는 상기 원본 음성을 기반으로 연산되는 경우 발생하는 것에 비해 덜 나타난다는 것에 유의한다. 강조-제거는 다음과 같은 전달함수를 가지는 필터를 이용하여 상기 디코더 종단에서 수행되기 때문에, 양자화 오차 스팩트럼은 전달함수 W-1(z)P-1(z)를 가지는 필터에 의해서 형성된다:
P-1(z)=1/(1-μz-1)
전형적인 경우에서, γ2가 μ와 동일하게 설정되는 경우, 상기 양자화 오차의 스펙트럼은 그 전달함수가 1/A(z/γ1)이고 선-강조된 음성 신호를 기반으로 연산되는 A(z)를 가진 필터로 형성된다. 선-강조와 변경된 가중치 필터링의 조합에 의한 오차 형성을 달성하는 구조를 보이는 주관적인 청취(listening)는 광대역 신호들의 인토딩에 대단히 효율적이며, 고정-소숫점 알고리즘 연산을 쉽게 할 수 있다는 부가적인 이점도 있다.
피치 분석:
상기 피치 분석을 간략화 하기위해서, 개-루프 피치 지연(TOL)이 상기 가중된 음성 신호 sw(n)를 이용하여 상기 개-루프 피치 검색 모듈(106)에서 처음 추정된다. 그 다음, 서브프레임 기반 폐-루프 피치 검색 모듈(107)에서 수행되는 상기 폐-루프 피치 분석은 상기 LPT 파라메터들(T와 b)(피치 지연과 피치 이득)의 검색 복잡성을 대단히 줄이는 상기 개-루프 피치 지연(TOL) 근방에서 제한된다. 개-루프 피치 분석은 일반적으로 당 업자들에게 공지된 기법들을 이용하여 매 10ms(서브프레임 2개)마다 한번씩 모듈(106)에서 실시된다.
LPT(장기 예측(long Term Prediction))을 위한 상기 목표 벡터(x)가 먼저 연산된다. 이는 일반적으로 가중된 합성 필터 W(z)/(z)의 영-입력 응답(s0)을 상기 가중된 음성 신호 sw(n)에서 빼는 것으로 계산된다. 상기 영-입력 응답(s0)은 영-입력 응답 연산기(108)에서 연산된다. 좀더 구체적으로, 상기 목표 벡터(x)는 다음 식을 이용하여 연산된다:
x = sw- s0
여기서 x는 상기 N-차원 목표 벡터이고, sw은 서브프레임에서 가중된 음성 벡터, 그리고 s0은 그 초기 상태들에의한 상기 조합 필터 W(z)/(z)의 출력인 필터 W(z)/(z)의 영-입력 응답이다. 상기 영-입력 응답 연산기(108)는 상기 LP 분석, 양자화 및 보간법 연산기(104)로부터 양자화되고 보간된 LP 필터(z)에 응답하고, 필터 W(z)/(z)의 영-입력 응답(s0)을 연산하기 위하여(이러한 부분의 응답은 상기 입력을 0으로 설정하는 것으로 결정되는 초기 상태에 기인한다) 메모리 모듈(111)에 저장되는 상기 가중된 합성 필터 W(z)/(z)의 초기 상태들에 응답한다. 상기 동작은 당 업자들에게 공지된 것으로 더이상 설명하지 않는다.
물론, 상기 목표 벡터(x)를 연산하는데 수학적으로 동등한 접근들도 대안으로 사용될 수 있다.
상기 가중된 합성 필터 W(z)/(z)의 N-차원 충격 응답 벡터(h)는 모듈(104)로부터 상기 LP 필터 계수들A(z)과(z)을 이용하여 상기 충격 응답 생성기(109)에서 연산된다. 역시, 상기 동작도 당 업자들에게 공지된 것이므로 본 명세서에서는 더 설명하지 않는다.
상기 폐-루프 피치(또는 피치 코드책) 파라메터들(b, T 그리고 j)은 상기 폐=루프 피치 검색 모듈(107)에서 연산되고, 이는 상기 목표 벡터(x), 충격 응답 벡터(h) 그리고 입력으로서 상기 개-루프 피치 지연(TOL)을 이용한다. 전통적으로, 상기 피치 예측은 다음과 같은 전달함수를 가지는 피치 필터에 의해서 나타내어진다:
1/(1-bz-T)
여기서 b는 피치 이득이고, T는 피치 지연이다. 이러한 경우에서, 상기 여기 신호 u(n)에 대한 상기 피치 기여는 bu(n-T)에 의해서 주어지며, 여기서 상기 전체 여기는 다음을 통해 주어진다:
u(n) = bu(n-T)+gck(n)
여기서 g는 혁신적 코드책 이득이고 ck(n)은 인덱스 k에서의 혁신적 코드벡터이다.
이러한 표현은 만일 피치 지연(T)이 상기 서브프레임 길이(N)보다 짧다면 제한을 가진다. 다른 표현에 있어서, 상기 피치 기여는 상기 이전 여기 신호를 포함하는 피치 코드책으로 보여질 수 있다. 일반적으로, 상기 피치 코드책의 각 벡터는 이전 벡터에서 하나 이동된(shift-by-one) 것(한 샘플을 버리고 새로운 샘플을 추가함)이다. 피치 지연들 T>N 에 있어서, 상기 피치 코드책은 상기 필터 구조(1/(1-bz-1))와 동등하고, 피치 지연(T)에서 피치 코드책 벡터 vT(n)은 다음과 같이 주어진다:
vT(n) = u(n-T) , n=0,..,N-1
N 보다 작은 피치 지연(T)에 있어서, 벡터 vT(n)는 상기 벡터가 완결되기까지(이는 상기 필터 구조와 동등한 것이 아님) 상기 과거 여기로부터 가능한 샙플들을 반복하는 것에의해 만들어진다.
최근 인코더들에서, 높은 피치 해상도가 유성음(voiced) 음향 신호의 품질을 획기적으로 개선하는데 사용된다. 다상(polyphase) 보간 필터들을 이용하여 상기 과거 여기 신호를 과다 샘플하는 것으로 달성된다. 이러한 경우에 있어서, 상기 벡터 vT(n)는 일반적으로 정수적이지 않은 지연(예를 들어 50.25)인 피치 지연(T)을가지는 상기 과거 여기가 보간된 것에 해당한다.
상기 피치 검색은 목표 벡터(x)와 스케일되고 필터된 과거 여기 간의 평균 제곱되고 가중된 오차(E)를 최소화 하는 최적의 이득(b) 및 피치 지연(T)의 검색을 포함한다. 오차(E)는 다음과 같이 표현된다:
E=∥x-byT2
여기서 yT는 피치 지연(T)에서 필터된 피치 코드책 벡터이며:
, n=0,..N-1.
상기 오차(E)는 다음과 같은 검색 기준을 최대화 하는 것으로 최소화 할 수 있다:
여기서 t는 벡터 이항(transpose)을 나타낸다.
본 발명의 이러한 바람직한 실시예에서, 1/3 서브샘플 피치 해상도가 사용되고, 그리고 상기 피치(피치 코드책) 검색은 3 스테이지들의 조합이다.
제 1스테이지에서, 개-루프 피치 지연(TOL)이 상기 가중된 음성 신호sw(n)에 대한 응답으로 개-루프 검색 모듈(106)에서 설정된다. 상기 설명한 바에서 지적한 대로, 상기 개-루프 피치 분석은 일반적으로 당 업자들에게 공지된 바와 같이 매 10ms(서브프레임 2개)당 한번씩 실시된다.
제 2스테이지에서, 상기 검색 기준(C)은 상기 추정된 개-루프 피치 지연(TOL)(일반적으로 ±5) 근방의 정수 피치 지연들에 대하여 상기 폐-루프 피치 검색 모듈(107)에서 검색되며, 이는 상기 검색 순서를 대단히 간략화 한다. 상기 간단한 절차는 각 피치 지연에 대한 합성곱을 연산할 필요 없이 상기 필터된 코드벡터(yT)를 갱신하는데 사용된다.
상기 제 2스테이지에서 최적 정수 피치 지연이 검출되면, 상기 검색의 제 3스테이지(모듈(107))는 상기 최적 정수 피치 지연 근방에서 단편들(fraction)을 검사한다.
상기 피치 예측기가 1/(1-bz-1) 형태의 필터로 나타내어지면, 이는 피치 지연들 T에 대한 유효 가정이>N이고, 상기 피치 필터의 스펙트럼은 상기 전체 주파수 영역 상에서 하모닉(harmonic) 구조를 보이며, 이때 하모닉 주파수는 1/T에 비례한다. 광대역 신호들에서, 이러한 구조는 그다지 효율적이지 못한데, 광대역 신호들에서 상기 하모닉 구조는 전테 확장 스펙트럼을 포괄하지 못하기 때문이다. 상기 하모닉 구조는 특정 주파수 이상에서만 존재하고, 이는 유성음 세그먼트에 달려있다. 그래서, 광대역 음성에서 유성음 세그먼트의 피치 기여를 효율적으로 나타내기 위해서, 상기 피치 예측 필터는 상기 광대역 스펙트럼 상의 가변 주기량이 탄력적일 필요가 있다.
광대역 신호들에서 상기 음성 스펙트럼의 하모닉 구조를 효과적으로 모델링할 수 있는 새로운 방법이 본 명세서에서 설명될 것이고, 그로인해 몇몇 형태의 저역 통과 필터들이 상기 과거 여기에 적용되고, 높은 예측 이들을 가진 상기 저역 통과 필터들이 선택된다.
서브샘플 피치 해상도가 사용되는 경우, 상기 저역 통과 필터들은 더 높은 피치 해상도를 획득하기 위하여 상기 보간 필터들에 삽입될 수 있다. 이러한 경우, 상기 선택된 정수 피치 지연 근방의 단편들에서, 상기 피치 검색의 제 3스테이지는 상이한 저역-통과 특성들을 가지는 몇몇 보간 필터들에서 반복되고, 상기 검색 기준(C)을 최소화하는 필터 인덱스와 상기 단편들이 선택된다.
간단한 접근은 특정 주파수 응답을 가지는 단 하나의 보간 필터를 이용하여 최적 단편적 피치 지연을 결정하기 위하여 상기 언급된 3 스테이지에서 검색을 완료하고, 상기 상이한 기 설정된 저역-통과 필터들을 상기 선택된 피치 코드책 벡터(vT)에 적용하는 것을 통해서 상기 종단에서 최적 저역-통과 필터 형태를 선택하고, 상기 피치 예측 오류를 최소화하는 저역-통과 필터를 선택한다.
도 3은 상기 제안된 접근의 바람직한 실시예의 간략한 블록 다이어그램을 예시한 것이다.
메모리 모듈(303)에서, 상기 과거 여기 신호u(n), n<0,가 저장된다. 상기 피치 코드책 검색 모듈(301)은 상기-정의된 검색 기준(C)을 최소화하는 피치 토드책(피치 코드책) 검색을 수행하기 위하여 메모리 모듈(303)로부터 상기 목표 벡터(x), 상기 개-루프 피치 지연(TOL) 및 과거 여기 신호 u(n),n<0,에 응답한다. 상기 모듈(301)에서 실시되는 상기 검색의 결과로부터, 모듈(302)은 최적 피치 코드책벡터(VT)를 생성한다. 서브-샘플된 피치 해상도가 이용되기 때문에(단편적 피치), 상기 과거 여기 신호 u(n),n<0,가 보간되고, 상기 피치 코드책 벡터(vT)는 상기 보간된 과거 여기 신호에 해당한다는 것에 주의한다. 이러한 바람직한 실시예에서, 상기 보간 필터(모듈(301) 내에 있으며 미도시)는 약 7000Hz 이상의 주파수 내용을 제거하는 저역-통과 특성을 가진다.
바람직한 실시예에서, K 필터 특성들이 이용되는데; 이러한 필터 특성들은 저역-통과 또는 대역-통과 필터 특성일 수 있다. 상기 최적 코드책 벡터(vT)가 설정되고 상기 피치 코드벡터 생성기(302)로부터 제공되면, vT의 K 필터된 것은 305(j)와 같은 K 상이한 주파수 형성 필터들을 이용하여 개별적으로 연산되며, 여기서 j=1,2,..,K이다. 이러한 필터된 것들은 Vf (j)로 나타내어지며, 여기서 j=1,2,..,K이다. 상기 상이한 벡터들 Vf (j)은 개별적인 모듈들(304(j))에서, 상기 벡터들(y(j))를 획득하기 위해서, 여기서 j=1,2,..,K이고, 상기 충격 응답(h)와 논리곱되며, 여기서 j=1,2,..,K이다. 각 벡터(y(j))에 대한 평균 제곱된 피치 예측 오차를 연산하기 위해서, 상기 값(y(j))은 해당 증폭기(307(j))를 이용하여 이득(b)과 곱해지고, 상기 값(by(j))은 해당 뺄샘기(308(j))를 이용하여 상기 목표 벡터(x)에서 뺄셈된다. 선택기(309)는 평균 제곱된 피치 예측 오차를 최소화 하는 상기 주파수 형태필터(305(j))를 선택하며, 상기 오차는
e(j)=∥x-b(j)y(j)2, j=1,2,..,K이다.
y(j)의 각 값에 대한 상기 평균 제곱된 피치 예측 오차(e(j))를 연산하기 위해서, 상기 값(y(j))은 해당하는 증폭기(307(j))를 이용하여 이득(b)과 곱해지고, 상기 값(b(j)y(j))은 해당하는 뺄샘기(308(j))를 이용하여 상기 목표 벡터(x)에서 뺄셈된다. 각 이득(b(j))은 인덱스(j)에서 주파수 형태 필터와 관계하는 해당 이득 연산기(306(j))에서 다음과 같은 관계식을 이용한다:
b(j)=xty(j)/∥y(j)2
선택기(309)에서, 상기 파라메터들(b, T, 그리고 j)은 평균 제곱된 피치 예측 오차(e)를 최소화 하는 vT또는 vf (j)를 기반으로 선택된다.
도 1에서, 상기 피치 코드책 인덱스(T)는 인코드된 후 멀티플렉서(multiplexer)(112)로 전달된다. 상기 피치 이득(b)은 양자화된 후 멀티플렉서(112)로 전달된다. 이러한 새로운 접근법으로, 별도(extra) 정보가 상기 멀티플렉서(112) 내의 상기 선택된 주파수 형태 필터의 상기 인덱스(j)를 인코드하는데 필요하다. 예를 들어서, 만일 3개의 필터들이 사용된다면(j=0,1,2,3), 이 정보를 나타내기 위해서 2비트가 필요하다. 상기 필터 인덱스 정보(j)는 상기 피치 이득(b)과 같이 결부되어 인코드될 수 있다.
혁신적 코드책 검색:
상기 피치 또는 LTP(장기 예측) 파라메터들(b, T 그리고 j)이 결정되면, 상기 다음 단계는 도 1의 검색 모듈(110) 수단에 의해서 최적 혁신적 여기에 대해 검색하는 것이다. 먼저, 상기 목표 벡터(x)는 상기 LTP 기여를 빼는 것으로 갱신된다:
x'=x-byT
여기서 b는 피치 이득이고, yT는 필터된 피치 코드책(도 3을 참조하여 설명한 바와 같이, 상기 충격 응답(h)와 합성곱되고 상기 선택된 저역 통과 필터로 필터된 지연(T)에서의 과거 여기)이다.
CELP에서의 검색 절차는 상기 목표 벡터와 상기 스케일되고 필터된 코드벡터 간의 평균 제곱 오차
E=∥x'-gHck2
를 최소화 하는 최적 여기 코드벡터(ck)와 이득(g)을 검출하는 것으로 수행되며, 여기서 H는 상기 충격 응답 벡터(h)로부터 파생되는 낮은 삼각 논리곱 행렬이다.
본 발명의 바람직한 실시예에서, 상기 혁신적인 코드책 검색은 1995년 8월 22일 발행된 미국 특허 제 5,444,816호(아도울(Adoul) 등); 1997년 12월 17일 아도울 등에게 승인된 제 5,699,482호; 1998년 5월 19일 아도울 등에게 승인된 제 5,754,976호; 그리고 1997년 12월 23일의 제 5,701,392(아도울 등)에 설명된 바와 같이 대수적 코드책의 수단에 의해서 모듈(110)에서 실시된다.
최적 여기 코드벡터(ck)와 그 이득(g)이 모듈(110)에서 선택되면, 상기 코드책 인덱스(k)와 이득(g)은 인코드되고 멀티플렉서(112)로 전달된다.
도 1에서, 상기 파라메터들(b, T, j,(z), k 그리고 g)은 통신 채널을 통해서 송신되기 전에 상기 멀티플렉서(112)를 거쳐 멀티플렉스된다.
메모리 갱신:
메모리 모듈(111)(도 1)에서, 상기 가중된 합성 필터 W(z)/(z)의 상태들은 상기 가중된 합성 필터를 통해 상기 여기 신호 u=gck+bvT를 필터링하는 것에 의해서 갱신된다. 이러한 필터링 후, 상기 필터의 상태들은 기억되고 다음 서브프레임에서 연산기 모듈(108)에서 영-입력 응답을 연산하기위한 초기값으로 사용된다.
상기 목표 벡터(x)의 경우에서와 같이, 당 업자들에게 공지된 수학적으로 동등한 접근들도 다른 대안으로 사용될 수 있다.
디코더 측면
도 2의 음성 디코딩 디바이스(200)은 디지털 입력(222)(멀티플렉서(217)로의 입력 스트림)과 출력 샘플된 음성(223)(가산기(221) 출력) 간에 실시되는 다양한 단계들을 예시한다.
디멀티플렉서(217)는 상기 합성된 모델 파라메터들을 디지털 입력 채널로부터 수신된 이진 정보로부터 추출한다. 수신된 각 이진 프레임으로부터, 상기 추출된 파라메터들은:
- 단기 예측 파라메터들(STP)(z)(프레임당 한번)과;
- 장기 예측(LTP) 파라메터들(T, b, 그리고 j)(각 서브프레임에 대해서)과;그리고
- 혁명 코드책 인텍스(k)와 이득(g)(각 서브프레임에 대해서)이다.
현재 음성 신호는 이후 설명될 이러한 파라메터들을 기반으로 합성된다.
혁명적 코드책(218)은 증폭기(224)를 통해 디코드된 이득 요소(g)로 스케일된 혁명 코드벡터(ck)를 생성하도록 상기 인덱스(k)에 응답한다. 바람직한 실시예에서, 이전에 언급한 미국 특허 제 5,444,816호; 제 5,699,482호; 제 5,754,976호; 그리고 제 5,701,392호에 설명된 바와 같은 혁명적 코드책(218)은 상기 혁명적인 코드벡터(ck)를 나타내는데 사용된다.
상기 증폭기(224)의 출력에서 상기 생성된 스케일되는 코드벡터(gck)는 혁명적인 필터(205)를 통해 처리된다.
주기 개선(periodicity enhancement):
상기 증폭기(224)의 출력에서 상기 생성된 스케일되는 코드벡터는 주파수-종속 피치 개선기(enhancer)(205)를 통해 처리된다.
상기 여기 신호(u)의 주기 개선은 유성음 세그먼트의 품질을 개선한다. 이는1/(1-εbz-T)형태의 필터를 통해 혁신적인 코드책(고정된 코드책)(218)으로부터 혁신 벡터를 필터링 하는 것으로 이전에 완료되며, 여기서 ε는 도입되는 주기의 양을 제어하는 0.5 미만의 요소이다. 상기 접근은 광대역 신호들의 경우 비효율적인데, 이는 전체 스펙트럼 상의 주기를 도입하기 때문이다. 본 발명의 일부인 새로운 대안적 접근이 설명되며, 그로인해 주기 개선은 저주파들 보다 고주파들을 강조하는 주파수 응답의 혁신 필터(205)(F(z))를 통해 상기 혁신적인(고정된) 코드책으로부터 혁신적인 코드벡터(ck)를 필터링하는 것으로 달성된다. 상기 F(z)의 계수들은 상기 여기 신호(u)의 주기 량에 관련된다.
당 업자들에게 공지된 많은 방법들이 유효한 주기 계수들을 얻는데 사용될 수 있다. 예를 들어서, 이득 값(b)이 1에 가까우면, 상기 여기 신호(u)의 주기는 높고, 그리고 만약 이득(b)이 0.5 미만이면 주기는 낮다.
본 바람직한 실시예에서, 상기 필터(F(z)) 계수들을 유도하는 다른 효율적인 방법은 이들을 상기 전체 여기 신호(u)의 피치 기여량에 연관시키는 것이다. 그 결과 상기 서브프레임 주기에 종속되는 주파수 응답이 나타나며, 여기서 높은 주파수들은 높은 피치 이득들에 대해 더 강하게 강조된다(전체 기울기가 강해짐). 혁신 필터(205)는 상기 여기 신호(u)가 더 주기적인 경우 낮은 주파수들에서 상기 혁신 코드벡터(ck)의 에너지를 낮추고, 이는 상기 여기 신호(u)의 주기를 높은 주파수들에 비해 낮은 주파수들에서 더 개선한다. 혁신 필터(205)에 대해 제안되는 필터(205)는
(1) F(z)=1-σz-1, (2) F(z)=-αz+1-αz-1
여기서 σ또는 α는 상기 여기 신호(u)의 주기 레벨로부터 파생되는 주기 요소들이다.
상기 두번째 F(z)의 3-용어는 바람직한 실시예에서 사용된다. 상기 주기 요소(α)는 유성음 요소 생성기(204)에서 연산된다. 몇몇 방법들도 상기 여기 신호(u)의 주기를 기반으로 상기 주기 요소(α)를 유도하는데 사용될 수 있다. 두가지 방법들을 다음에 나타내었다.
방법 1:
상기 전체 여기 신호(u)에 대한 피치 기여의 비율은 다음에 의해서 유성음 요소 생성기(204)에서 먼저 연산되며
여기서 vT는 피치 코드책 벡터이고, b는 피치 이득, 그리고 u는
u = gck+bvT
에 의해서 가산기(219)의 출력에서 주어지는 상기 여기 신호(u)이다.
상기 용어 bvT는 메모리(203)에 저장되는 상기 피치 지연(T)과 u의 과거 값에 응답하는 상기 피치 코드책(피치 코드책)(200)에서 그 소스를 가진다. 그 다음, 상기 피치 코드책(201)로부터 상기 피치 코드벡터(vT)는 상기 디멀티플렉서(217)로부터 인덱스(j)를 수단으로 하여 조절되는 차단 주파수를 가지는 저역-통과 필터(202)를 통해 처리된다. 그 다음, 상기 결과 코드벡터(217)는 상기 신호(bvT)를 획득하기 위해서 증폭기(226)를 통해 상기 디멀티플렉서(217)로부터의 이득(b)과 곱해진다.
상기 요소(α)는
α=qRp, α<q
에 의해서 유성음 요소 생성기(204)에서 연산되고, 여기서 q는 개선의 양을 제어하는 요소이다(q는 본 바람직한 실시예에서 0.25로 설정된다).
방법 2:
주기 요소(α)를 연산하기위해서 본 발명의 바람직한 실시예에서 사용되는 다른 방법이 이하 논의된다.
먼저, 음성 벡터(rv)는 다음과 같은 식을 이용하여 상기 유성음 요소 생성기(204)에서 연산되고
rv= (Ev- Ec) / (Ev+ Ec)
여기서 Ev는 스케일된 피치 코드벡터(bvT)의 에너지이고 Ec는 상기 스케일된 혁신적 코드벡터(gck)의 에너지이다. 다시 말해서
Ev = b2vT tvT=
그리고
Ec = g2ck tck=
rv의 값이 -1에서 1사이에 있다는 것을 유의한다(1은 순수한 유성음 신호들에 해당하고 -1은 순수한 비유성음 신호들에 해당한다).
그 다음, 상기 바람직한 실시예에서, 상기 요소(α)가
α = 0.125(1+rv)
유성음 요소 생성기(204)에 의해서 연산되고, 여기서 순수한 비유성 신호들은 0의 값에 해당하고 순수한 유성 신호들은 0.25에 해당한다.
이러한 처음에서, F(z)의 2-용어, 주기 요소(σ)는 σ = 2α를 이용하여 상기 방법 1과 2에서 대략적으로 구해질 수 있다. 이러한 경우에서, 상기 주기 요소(σ)는 상기 방법 1에 따라서 연산되고:
σ=2qRp, σ<2q
방법 2에서, 상기 주기 요소(σ)는 다음과 같이 연산된다:
σ = 0.25(1+rv)
그래서 상기 개선된 신호(cf)는 상기 개선 필터(205)(F(z))를 통해서 상기 스케일된 혁신 코드벡터(gck)를 필터링하는 것으로 연산된다.
상기 개선된 여기 신호(u')는 다음을 통해서 상기 가산기(220)에 의해 연산된다:
u' = cf+ bvT
상기 처리는 상기 인코더(100)에서 수행되지 않는다는 것을 유의한다. 그래서, 상기 인코더(100)와 디코더(200) 간의 동시성(synchronism)을 유지하면서 개선 없이 상기 여기 신호(u)를 이용하여 상기 피치 코드책(201)의 내용을 갱신하는 것이 필수적이다. 그래서, 상기 여기 신호(u)는 상기 피치 코드책(201)의 상기 메모리(203)를 갱신하는데 사용되고, 상기 개선된 여기 신호(u')는 상기 LP 합성 필터(206)의 입력에서 사용된다.
합성 및 강조제거
합성된 신호(s')는 현재 서브시스템의 보간된 LP필터가(z)이며, 1/(z)형태를 가지는 상기 LP 합성 필터(206)를 통해 상기 개선된 여기 신호(u')를 필터링하는 것에의해 연산된다. 도 2에서 볼 수 있는 바와 같이, 디멀티플렉서(217)로부터 라인(225) 상의 상기 양자화된 LP 계수들(z)이 상기 LP 합성 필터(206)의 상기 파라메터들을 조절하기위해서 상기 LP 합성 필터(206)에 공급된다. 상기 강조제거 필터(207)는 도 1의 상기 선-강조 필터(103)의 역이다. 상기 강조제거 필터(207)의 전달함수는 다음과 같이 주어지며:
D(z) = 1 / (1-μz-1)
여기서 μ는 0에서 1(전형적으로 μ=0.7)사이에 위치한 값을 가지는 선-강조 요소이다. 고차 필터역시 사용될 수 있다.
벡터(s')는 50Hz 이하의 원하지 않는 주파수들을 제거하고 sh를 획득하기 위해서 상기 고역-통과 필터(208)를 지나는 상기 벡터(sd)를 획득하기 위해서 상기 강조제거 필터(D(z))(모듈(207))를 지나 필터된다.
과다 샘플링과 고주파 재생성
상기 과다-샘플링 모듈(209)은 도 1의 다운-샘플링 모듈(101)의 역 처리를 수행한다. 본 바람직한 실시예에서, 과다 샘플링은 당 업자에게 공지된 기법을 이용하여 12.8kHz 샘플링 비율에서 원본 16kHz 샘플링 비율로 변환한다. 상기 과다 샘플된 합성 신호는로 나타내어진다. 신호는 합성된 광대역 중간 신호로서 간주될 수 있다.
상기 과다 샘플된 합성신호는 상기 인코더(100)에서 상기 다운샘플링 처리(도 1의 모듈 101)를 통해 상실된 고주파 내용들을 포함하지 않는다. 이는 상기 합성된 음성 신호에 대해 저역-통과 인식(perception)을 제공한다. 상기 원본 신호의 전체 대역을 저장하기위해서, 고주파 생성 절차를 설명한다. 상기 절차는 모듈들(210에서 216), 그리고 가산기(221)에서 수행되며, 유성음 요소 생성기(204)(도2)로부터의 입력을 요구한다.
새로운 접근에서, 상기 고주파 내용들은 상기 여기 영역에서 적절히 스케일된 백색 잡음으로 상기 스팩트럼의 상부를 필터링하는 것에 의해서 생성되고, 이는 상기 다운 샘플된 신호()를 합성하기위해 사용되는 상기 동일한 LP 합성 필터로 형성되는 것이 바람직하다.
본 발명에 따르는 상기 고주파 생성 과정은 다음에 설명될 것이다.
상기 임의(random) 잡음 생성기(213)는 당 업자들에게 공지된 기법들을 이용하여 상기 전체 주파수 대역폭 상에 평탄한 스팩트럼을 이용하여 백색 잡음(w')을 생성한다. 상기 생성된 절차는 원본 영역 서브프레임의 길이(N')이다. N은 상기 다운-샘플된 영역에서의 서브프레임 길이이다. 본 바람직한 실시예에서, 5ms에 해당하는 N=64이고 N'=80이다.
상기 백색 잡음 순서는 이득 조절 모듈(214)에서 적절하게 스케일된다. 이득 조절은 다음 단계들을 포함한다. 먼저, 상기 생성된 잡음 순서(w')의 에너지는 에너지 연산 모듈에 의해서 연산되는 상기 개선된 여기 신호(u')의 에너지와 동등하게 설정되며, 그리고 상기 결과 스케일된 잡음 순서는
w(n) =, n=0,..,N'-1
로 주어진다.
상기 이득 스케일링의 두번째 단계는 유성음 세그먼트들인 경우 상기 생성된 잡음의 에너지를 줄이기 위해서(여기서 더 작은 에너지는 유성음이 아닌 세그먼트들과 비교해서 더 높은 주파수에서 제공된다)상기 유성음 요소 생성기(204)의 출력에서 상기 합성된 신호의 고주파 내용들을 고려하기위한 것이다. 본 바람직한 실시예에서, 상기 고주파 내용들의 측정은 스펙트럴 필트 연산기(212)를 통해 상기 합성된 신호의 틸트를 측정하는 것으로 수행되고, 그에 따르는 에너지를 줄인다. 여교차 측정법(zero crossing measurement)들과 같은 다른 측정법들도 동일하게 사용될 수 있다. 상기 틸트가 대단히 강한 경우, 유성음 세그먼트들에 해당하는 상기 잡음 에너지가 더 줄어든다. 상기 틸트 요소는 상기 합성 신호(sh)의 관련 계수로서 모듈(212)에서 연산되며, 이는
틸트 =, 틸트≥0이고 틸트≥rv'인 조건
으로 주어지며, 여기서 유성음 요소(rv)는
rv= (Ev- Ec) / (Ev+ Ec)
여기서 Ev는 스케일된 피치 코드벡터(bvT)의 에너지이고 Ec는 상기 스케일된 혁신적 코드벡터(gck)의 에너지이다. 유성음 요소(rv)는 대부분의 경우 틸트보다 작지만, 이러한 조건은 고주파에 대한 경계로서 도입되며, 여기서 상기 틸트 값이 음의 값이고 상기 rv의 값은 높다. 그러므로, 이러한 조건은 이러한 전체 신호들에 대해서 상기 잡음 에너지를 줄인다.
평탄 스펙트럼의 경우 상기 틸트 값은 0이고, 강한 유성음 신호들의 경우 1이며, 이는 무성음 신호들에서 음의 값이며, 여기서 더 많은 에너지가 고주파들에서 나타난다.
고주파 내용들의 양에서 상기 스케일링 요소(gt)를 유추하는데 상이한 방법들이 사용될 수 있다. 본 발명에서, 두가지 방법들은 상기 설명된 신호의 틸트를 기반으로 주어진다.
방법 1:
상기 스케일링 요소(gt)는
gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
에 의해서 파생된다.
상기 틸트가 1에 근접하는 강한 유성음에 대해서, gt는 0.2이고 강한 무성음에 대해서 gt는 1.0이 된다.
방법 2:
상기 틸트 요소(gt)는 0보다 크거나 같은 제 1경계이고, 상기 스케일링 요소는
gt= 10-0.6틸트
에 의해서 상기 필트로부터 파생된다.
이득 조절 모듈(214)에서 생성된 상기 스케일된 잡음 순서(wg)가 생성되고, 그로인해
wg= gtw
로 주어진다.
상기 틸트가 0에 가까우면, 상기 스케일링 요소(gt)는 1에 가깝고, 이는 에너지 감소가 나타나지 않는다. 상기 틸트 값이 1인 경우, 상기 스케일링 요소(gt)는 상기 생성된 잡음의 에너지에서 12dB의 감소를 가져온다.
상기 잡음이 적절히 스케일되면(wg), 상기 스펙트럴 형성기(215)를 이용하여 상기 음성 영역으로 옮겨진다. 바람직한 실시예에서, 이는 상기 다운-샘플된 영역(1/(z/0.8))에 사용되는 동일한 LP 합성 필터의 밴드폭 확장된 것을 통해 상기 잡음(wg)을 필터링하는 것으로 달성된다. 상기 해당하는 밴드폭 확장된 LP필터 계수들은 스팩트럴 형태기(215)에서 연산된다.
그 다음, 상기 필터되고 스케일된 잡음 순서(wf)는 상기 대역-통과 필터(216)를 이용하여 저장되는 요구되는 주파수 영역으로 대역-통과 필터된다. 바람직한 실시예에서, 상기 대역-통과 필터(216)는 주파수 영역 5.6-7.2kHz로 상기 잡음 순서를 제한한다. 상기 결과 대역-통과 필터되는 잡음 순서(z)는 상기 출력(223) 상의 최종 재구성된 음향 신호(sout)를 획득하기위해서 상기 과다 샘플되고 합성된 음성 신호()로 상기 가산기(221)를 통해 가산된다.
비록 본 발명이 바람직한 실시예들의 방법으로 상기 설명되었지만, 이러한 바람직한 실시예들은 첨부되는 청구항의 범위 내에서 발명의 사상과 특성을 벗어나지 않으면서 변경될 수 있다. 비록 상기 바람직한 실시예는 광대역 음성 신호들의 사용을 논의했지만, 본 발명이 음성 적용 제품들로 제한될 필요가 없는 일반적인광대역 신호들을 이용하는 다른 실시예들에도 직접 사용될 수 있다는 것은 당 업자들에게 명백할 것이다.

Claims (60)

  1. 과거에 다운-샘플된 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 경우 내부에 상기 고주파 내용을 주입하기위한 디바이스에 있어서, 상기 고주파 내용 복구 디바이스는,
    a) 주어진 스펙트럼을 가지는 노이즈 순서를 생성하기위한 임의(random) 잡음 생성기와,
    b) 상기 잡음 순서의 스펙트럼을 상기 다운-샘플된 광대역 신호에 관련되는 선형 예측 필터 계수들에 연관시켜 스펙트럴적으로 형성하기위한 스펙트럴 형성 유닛과, 그리고
    c) 결과적으로 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 신호 주입 회로를 포함하는 것을 특징으로 하는 고주파 내용 복구 디바이스.
  2. 제 1항에 있어서, 상기 임의 잡음 생성기는 상기 광대역 신호의 전체 주파수 대역 상에서 평탄한 스펙트럼을 가진 백색 잡음 순서를 생성하기위한 임의 잡음 생성기이며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 고주파 내용 복구 디바이스.
  3. 제 2항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 상기 형성 파라메터들의 제 1서브셋에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 상기 선형 예측 필터 계수들을 포함하는 상기 형성 파라메터들의 제 2서브셋에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하는 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 고주파 내용 복구 디바이스.
  4. 과거에 다운-샘플된 광대역 신호의 고주파 내용을 복구하고, 전체 스펙트럼 합성된 광대역 신호를 생성하기위해 상기 다운-샘플된 광대역 신호의 과다-샘플되어 합성된 경우 내부에 상기 고주파 내용을 주입하기위한 방법에 있어서, 상기 고주파 내용 복구 방법은,
    a) 주어진 스펙트럼을 가지는 잡음 순서를 임의적으로 생성하는 단계와,
    b) 상기 잡음 순서를 상기 다운-샘플된 광대역 신호와 연관되는 선형 예측 필터 계수들에 연관시켜 스펙트럴적으로 형성하는 단계와; 그리고
    c) 결과적으로 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하는 단계를 포함하는 것을 특징으로 하는 고주파 내용 복구 방법.
  5. 제 4항에 있어서, 상기 잡음 순서 생성단계는 백색 잡음 순서를 임의적으로 생성하는 단계를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 고주파 내용 복구 방법.
  6. 제 5항에 있어서, 상기 잡음 순서의 스펙트럴 형성 단계는,
    a) 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 스케일된 백색 잡음 순서를 생성하는 단계와,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 성형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하는 단계와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터링 단계를 더 포함하는 것을 특징으로 하는 고주파 내용 복구 방법.
  7. 합성된 광대역 신호를 생성하기위한 디코더에 있어서,
    a) 인코딩하는 동안 이전에 다운-샘플된 광대역 신호의 인코드된 경우를 수신하고, 인코드된 광대역 신호 경우로부터 적어도 피치 코드책 파라메터들, 혁신적 코드책 파라메터들, 그리고 선형 예측 필터 계수들을 추출하기위한 신호 분해(fragmenting) 디바이스와;
    b) 피치 코드벡터를 생성하기위하여 상기 피치 코드책 파라메터들에 대해 응답하는 피치 코드책과,
    c) 혁신된 코드벡터를 생성하기위하여 상기 혁신된 코드책 파라메터들에 대해 응답하는 혁신된 코드책과,
    d) 결과적으로 여기 신호를 생성하도록 상기 피치 코드벡터와 상기 혁신된 코드벡터를 병합하기위한 병합기 회로와,
    e) 결과적으로 합성된 광대역 신호를 생성하도록 선형 예측 필터 계수들에 연관되는 상기 여기 신호를 필터링하기위한 선형 예측 필터와, 상기 합성된 광대역 신호의 과다-샘플된 신호를 생성하도록 상기 합성된 광대역 신호에 응답하는 과다-샘플기(oversampler)를 포함하는 신호 합성 디바이스와, 그리고
    f) 제 1항에서 설명된 바와 같이, 상기 광대역 신호의 고주파 내용을 복구하고, 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 고주파 내용 복구 디바이스를 포함하는 것을 특징으로 하는 디코더.
  8. 제 7항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 디코더.
  9. 제 8항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 선형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 디코더.
  10. 제 9항에 있어서, 상기 디코더는,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 디코더.
  11. 제 10항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 디코더.
  12. 제 10항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된개선된(enhanced) 여기 신호인 것을 특징으로 하는 디코더.
  13. 제 10항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 디코더.
  14. 제 10항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 디코더.
  15. 제 9항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 디코더.
  16. 합성된 광대역 신호를 생성하기위한 디코더에 있어서,
    a) 인코딩하는 동안 이전에 다운-샘플된 광대역 신호의 인코드된 경우를 수신하고, 인코드된 광대역 신호 경우로부터 적어도 피치 코드책 파라메터들, 혁신적 코드책 파라메터들, 그리고 선형 예측 필터 계수들을 추출하기위한 신호 분해 디바이스와;
    b) 피치 코드벡터를 생성하기위하여 상기 피치 코드책 파라메터들에 대해 응답하는 피치 코드책과,
    c) 혁신된 코드벡터를 생성하기위하여 상기 혁신된 코드책 파라메터들에 대해 응답하는 혁신된 코드책과,
    d) 결과적으로 여기 신호를 생성하도록 상기 피치 코드벡터와 상기 혁신된 코드벡터를 병합하기위한 병합기 회로와, 그리고
    e) 결과적으로 합성된 광대역 신호를 생성하도록 선형 예측 필터 계수들에 연관되는 상기 여기 신호를 필터링하기위한 선형 예측 필터와, 상기 합성된 광대역 신호의 과다-샘플된 신호 경우를 생성하도록 상기 합성된 광대역 신호에 응답하는 과다 샘플러를 포함하는 신호 합성 디바이스를 포함하며,
    제 1항에서 설명된 바와 같이, 상기 광대역 신호의 고주파 내용을 복구하고, 상기 전체-스펙트럼 합성된 광대역 신호를 생성하기위해서 상기 과대-샘플된 합성 신호 경우에 상기 스펙트럴적으로 형성된 잡음 순서를 주입하기위한 고주파 내용 복구 디바이스를 포함하는 개선점을 가지는 것을 특징으로 하는 디코더.
  17. 제 16항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 디코더.
  18. 제 17항에 있어서, 상기 스펙트럴 형성 유닛은
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위한 대역폭 확장된 합성 필터 계수들을 포함하는 상기 형성 파라메터들의 제 2서브셋에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 디코더.
  19. 제 18항에 있어서, 상기 디코더는,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 디코더.
  20. 제 19항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 디코더.
  21. 제 19항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된 여기 신호인 것을 특징으로 하는 디코더.
  22. 제 19항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 디코더.
  23. 제 19항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 디코더.
  24. 제 18항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 디코더.
  25. 다수의 셀들로 나뉘어진 넓은 지리학적 영역을 서비스하기위한 셀룰라 통신 시스템에 있어서,
    a) 휴대용 송신기/수신기 유닛들과,
    b) 상기 셀들에 적합한 개별적인 셀룰라 베이스 스테이션들과,
    c) 상기 셀룰라 베이스 스테이션들 간의 통신을 제어하기위한 제어 터미널과,
    d) 한 셀에 위치한 각 휴대용 유닛과 상기 한 셀의 셀룰라 베이스 스테이션 간의 양방향 무선 통신 서브-시스템을 포함하고, 상기 양방향 무선 통신 서브 시스템은 상기 휴대용 유닛과 상기 셀룰라 베이스 스테이션 모두에서,
    i) 광대역 신호를 인코딩하기위한 인코더와 상기 인코드된 광대역 신호를 송신하기위한 송신 회로를 가지는 송신기와, 그리고
    ii) 송신되고 인코드된 광대역 신호를 수신하기위한 수신 회로와 상기수신되고 인코드된 광대역 신호를 디코딩하기위한 제 7항에 보인 것과 같은 디코더를 가지는 수신기를 포함하는 것을 특징으로 하는 셀룰라 통신 시스템.
  26. 제 25항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 셀룰라 통신 시스템.
  27. 제 26항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 선형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 셀룰라 통신 시스템.
  28. 제 27항에 있어서, 상기 셀룰라 통신 시스템은,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 셀룰라 통신 시스템.
  29. 제 28항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 셀룰라 통신 시스템.
  30. 제 28항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된 여기 신호인 것을 특징으로 하는 셀룰라 통신 시스템.
  31. 제 28항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 셀룰라 통신 시스템.
  32. 제 28항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv인 조건을 가지는 것을 특징으로 하는 셀룰라 통신 시스템.
  33. 제 27항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 셀룰라 통신 시스템.
  34. 셀룰라 이동 송신기/수신기 유닛에 있어서, 이는,
    a) 광대역 신호를 인코딩하기위한 인코더와 상기 인코드된 광대역 신호를 송신하기위한 송신 회로를 가지는 송신기와, 그리고
    b) 송신되고 인코드된 광대역 신호를 수신하기위한 수신 회로와 상기수신되고 인코드된 광대역 신호를 디코딩하기위한 제 7항에 보인 것과 같은 디코더를 가지는 수신기를 포함하는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  35. 제 34항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  36. 제 35항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 선형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  37. 제 36항에 있어서, 상기 셀룰라 이동 송신기/수신기 유닛은,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  38. 제 37항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  39. 제 37항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된 여기 신호인 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  40. 제 37항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  41. 제 37항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv인 조건을 가지는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  42. 제 36항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 셀룰라 이동 송신기/수신기 유닛.
  43. 셀룰라 네트워크 소자에 있어서, 이는,
    a) 광대역 신호를 인코딩하기위한 인코더와 상기 인코드된 광대역 신호를 송신하기위한 송신 회로를 가지는 송신기와, 그리고
    b) 송신되고 인코드된 광대역 신호를 수신하기위한 수신 회로와 상기수신되고 인코드된 광대역 신호를 디코딩하기위한 제 7항에 보인 것과 같은 디코더를 가지는 수신기를 포함하는 것을 특징으로 하는 셀룰라 네트워크 소자.
  44. 제 43항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 셀룰라 네트워크 소자.
  45. 제 44항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 선형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 셀룰라 네트워크 소자.
  46. 제 45항에 있어서, 상기 셀룰라 네트워크 소자는,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 셀룰라 네트워크 소자.
  47. 제 46항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 셀룰라 네트워크 소자.
  48. 제 46항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된 여기 신호인 것을 특징으로 하는 셀룰라 네트워크 소자.
  49. 제 46항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 셀룰라 네트워크 소자.
  50. 제 46항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv인 조건을 가지는 것을 특징으로 하는 셀룰라 네트워크 소자.
  51. 제 45항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 셀룰라 네트워크 소자.
  52. 휴대용 송신기/수신기 유닛들과, 셀들에 적합한 개별적인 셀룰라 베이스 스테이션들과, 상기 셀룰라 베이스 스테이션들 간의 통신을 제어하기위한 제어 터미널을 포함하며 다수의 셀들로 나뉘어진 넓은 지리학적 영역을 서비스하기위한 셀룰라 통신 시스템 내부에,
    한 셀에 위치한 각 휴대용 유닛과 상기 한 셀의 셀룰라 베이스 스테이션 간의 양방향 무선 통신 서브-시스템을 포함하며, 상기 양방향 무선 통신 서브 시스템은 상기 휴대용 유닛과 상기 셀룰라 베이스 스테이션 모두에서:
    a) 광대역 신호를 인코딩하기위한 인코더와 상기 인코드된 광대역 신호를 송신하기위한 송신 회로를 가지는 송신기와, 그리고
    b) 송신되고 인코드된 광대역 신호를 수신하기위한 수신 회로와 상기수신되고 인코드된 광대역 신호를 디코딩하기위한 제 7항에 보인 것과 같은 디코더를 가지는 수신기를 포함하는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  53. 제 52항에 있어서, 상기 임의 잡음 생성기는 백색 잡음 순서를 생성하기위한 임의 백색 잡음 생성기를 포함하며, 그로인해 상기 스펙트럴 형성 유닛은 스펙트럭적으로-생성되는 백색 잡음 순서를 생성하는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  54. 제 53항에 있어서, 상기 스펙트럴 형성 유닛은,
    a) 스케일된 백색 잡음 순서를 생성하기 위하여, 상기 백색 잡음 순서와 이득 조절 파라메터들의 집합에 응답하는 이득 조절 모듈과,
    b) 과다-샘플되고 합성된 신호의 주파수 대역폭 보다 일반적으로 높은 주파수 대역폭으로 특징지어지는 필터되고 스케일된 백색 잡음 순서를 생성하기 위하여 대역폭 확장된 선형 예측 필터 계수들에 관련되는 상기 스케일된 백색 잡음 순서를 필터링하기위한 스펙트럴 형성기와, 그리고
    c) 상기 과다-샘플되고 합성된 신호에 실질적으로 상기 스펙트럴적으로-형성된 백색 잡음 순서로서 주입되는 대역-통과 필터되고 스케일된 백색 잡음 순서를 생성하기위하여 상기 필터되고 스케일된 백색 잡음 순서에 응답하는 대역-통과 필터를 더 포함하는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  55. 제 54항에 있어서, 상기 양방향 무선 통신 서브-시스템은,
    a) 이득 조절 모듈로 전송하도록 음성 요소를 연산하기위한 적응성 및 혁신적인 코드벡터들에 응답하는 유성음 요소 생성기와;
    b) 상기 이득 조절 모듈로 전송하도록 여기 에너지를 연산하기위한 여기 신호에 응답하는 에너지 연산 모듈과; 그리고
    c) 상기 이득 조절 모듈로 전송하도록 틸트 스케일 요소를 연산하기위한 상기 합성 신호에 응답하는 스팩트럴 틸트 연산기를 더 포함하며;
    여기서 상기 이득 조절 파라메터들의 집합은 상기 음성 요소, 상기 에너지 스케일링 요소, 그리고 상기 틸트 스케일링 요소를 포함하는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  56. 제 55항에 있어서, 상기 유성음 요소 생성기는 다음과 같은 식을 이용하여 상기 음성 요소(rv)를 연산하는 수단을 포함하고:
    rv= (Ev- Ec) / (Ev+ Ec)
    여기서 Ev는 상기 이득 스케일된 피치 코드벡터의 에너지이고 Ec는 상기 이득 스케일된 혁신적 코드벡터의 에너지인 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  57. 제 55항에 있어서, 상기 이득 조절 유닛은 다음과 같은 식을 이용하여 에너지 스케일링 요소를 연산하기위한 수단을 포함하며:
    에너지 스케일링 요소 =, n=0,..,N'-1.
    여기서 w'는 백색 잡음 순서이고 u'는 상기 여기 신호로부터 파생된 개선된 여기 신호인 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  58. 제 55항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 1 - 틸트 0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv'인 조건을 가지는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  59. 제 55항에 있어서, 상기 스펙트럴 틸트 연산기는 다음의 식을 이용하여 상기 틸트 스케일링 요소(gt)를 연산하는 수단을 포함하며:
    gt= 10-0.6틸트0.2 ≤ gt≤ 1.0
    여기서
    틸트 =, 틸트≥0이고 틸트≥rv인 조건을 가지는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
  60. 제 54항에 있어서, 상기 대역-통과 필터는 5.6kHz에서 7.2kHz 사이에 위치된 주파수 대역폭을 가지는 것을 특징으로 하는 양방향 무선 통신 서브-시스템.
KR10-2001-7005324A 1998-10-27 1999-10-27 과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스 KR100417836B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2,252,170 1998-10-27
CA002252170A CA2252170A1 (en) 1998-10-27 1998-10-27 A method and device for high quality coding of wideband speech and audio signals

Publications (2)

Publication Number Publication Date
KR20010090803A KR20010090803A (ko) 2001-10-19
KR100417836B1 true KR100417836B1 (ko) 2004-02-05

Family

ID=4162966

Family Applications (3)

Application Number Title Priority Date Filing Date
KR10-2001-7005325A KR100417634B1 (ko) 1998-10-27 1999-10-27 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
KR10-2001-7005324A KR100417836B1 (ko) 1998-10-27 1999-10-27 과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스
KR10-2001-7005326A KR100417635B1 (ko) 1998-10-27 1999-10-27 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR10-2001-7005325A KR100417634B1 (ko) 1998-10-27 1999-10-27 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR10-2001-7005326A KR100417635B1 (ko) 1998-10-27 1999-10-27 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스

Country Status (20)

Country Link
US (8) US6795805B1 (ko)
EP (4) EP1125285B1 (ko)
JP (4) JP3869211B2 (ko)
KR (3) KR100417634B1 (ko)
CN (4) CN1172292C (ko)
AT (4) ATE246836T1 (ko)
AU (4) AU763471B2 (ko)
BR (2) BR9914890B1 (ko)
CA (5) CA2252170A1 (ko)
DE (4) DE69910058T2 (ko)
DK (4) DK1125276T3 (ko)
ES (4) ES2212642T3 (ko)
HK (1) HK1043234B (ko)
MX (2) MXPA01004181A (ko)
NO (4) NO318627B1 (ko)
NZ (1) NZ511163A (ko)
PT (4) PT1125276E (ko)
RU (2) RU2217718C2 (ko)
WO (4) WO2000025304A1 (ko)
ZA (2) ZA200103366B (ko)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
ES2318820T3 (es) * 2000-04-24 2009-05-01 Qualcomm Incorporated Procedimiento y aparatos de cuantificacion predictiva del habla de voces.
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR100393899B1 (ko) * 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
US7680665B2 (en) * 2001-08-24 2010-03-16 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal adaptively
CN1279512C (zh) 2001-11-29 2006-10-11 编码技术股份公司 用于改善高频重建的方法和装置
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN100531259C (zh) * 2002-12-27 2009-08-19 冲电气工业株式会社 语音通信设备
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US6947449B2 (en) * 2003-06-20 2005-09-20 Nokia Corporation Apparatus, and associated method, for communication system exhibiting time-varying communication conditions
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
DE602004021266D1 (de) * 2003-09-16 2009-07-09 Panasonic Corp Kodier- und dekodierapparat
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101143724B1 (ko) * 2004-05-14 2012-05-11 파나소닉 주식회사 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치
US8463602B2 (en) * 2004-05-19 2013-06-11 Panasonic Corporation Encoding device, decoding device, and method thereof
KR20070051878A (ko) 2004-09-06 2007-05-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
DE102005000828A1 (de) 2005-01-05 2006-07-13 Siemens Ag Verfahren zum Codieren eines analogen Signals
EP1814106B1 (en) * 2005-01-14 2009-09-16 Panasonic Corporation Audio switching device and audio switching method
CN100592389C (zh) 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
EP1895516B1 (en) * 2005-06-08 2011-01-19 Panasonic Corporation Apparatus and method for widening audio signal band
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
JP2009534713A (ja) * 2006-04-24 2009-09-24 ネロ アーゲー 低減ビットレートを有するデジタル音声データを符号化するための装置および方法
EP2038884A2 (en) * 2006-06-29 2009-03-25 Nxp B.V. Noise synthesis
US8358987B2 (en) * 2006-09-28 2013-01-22 Mediatek Inc. Re-quantization in downlink receiver bit rate processor
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
BRPI0814129A2 (pt) * 2007-07-27 2015-02-03 Panasonic Corp Dispositivo de codificação de áudio e método de codificação de áudio
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
CN101836253B (zh) * 2008-07-11 2012-06-13 弗劳恩霍夫应用研究促进协会 一种使用频谱倾斜控制成帧技术来计算带宽扩展数据的装置及方法
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
CN101770778B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 一种预加重滤波器、感知加权滤波方法及系统
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
MX2011008685A (es) * 2009-02-26 2011-09-06 Panasonic Corp Codificador, decodificador y metodo para los mismos.
EP2402938A1 (en) * 2009-02-27 2012-01-04 Panasonic Corporation Tone determination device and tone determination method
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JPWO2011048810A1 (ja) * 2009-10-20 2013-03-07 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
WO2011083849A1 (ja) * 2010-01-08 2011-07-14 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
CN101854236B (zh) 2010-04-05 2015-04-01 中兴通讯股份有限公司 一种信道信息反馈方法和系统
DK2559028T3 (en) 2010-04-14 2015-11-09 Voiceage Corp FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder
JP5749136B2 (ja) 2011-10-21 2015-07-15 矢崎総業株式会社 端子圧着電線
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
CN103295578B (zh) 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
BR112016008544B1 (pt) 2013-10-18 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.
CA2927716C (en) 2013-10-18 2020-09-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US9922660B2 (en) * 2013-11-29 2018-03-20 Sony Corporation Device for expanding frequency band of input signal via up-sampling
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN105047201A (zh) * 2015-06-15 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于分段扩展的宽带激励信号合成方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法
US20230318881A1 (en) * 2022-04-05 2023-10-05 Qualcomm Incorporated Beam selection using oversampled beamforming codebooks and channel estimates

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
EP0331858B1 (en) * 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2621376B2 (ja) 1988-06-30 1997-06-18 日本電気株式会社 マルチパルス符号化装置
JP2900431B2 (ja) 1989-09-29 1999-06-02 日本電気株式会社 音声信号符号化装置
JPH03123113A (ja) * 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5113262A (en) * 1990-08-17 1992-05-12 Samsung Electronics Co., Ltd. Video signal recording system enabling limited bandwidth recording and playback
US6134373A (en) * 1990-08-17 2000-10-17 Samsung Electronics Co., Ltd. System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium
US5235669A (en) 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5392284A (en) * 1990-09-20 1995-02-21 Canon Kabushiki Kaisha Multi-media communication device
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
GB9218864D0 (en) * 1992-09-05 1992-10-21 Philips Electronics Uk Ltd A method of,and system for,transmitting data over a communications channel
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
IT1257431B (it) 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
DE4343366C2 (de) 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5956624A (en) * 1994-07-12 1999-09-21 Usa Digital Radio Partners Lp Method and system for simultaneously broadcasting and receiving digital and analog signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals

Also Published As

Publication number Publication date
EP1125276B1 (en) 2003-08-06
US20060277036A1 (en) 2006-12-07
DK1125285T3 (da) 2003-11-10
DE69913724D1 (de) 2004-01-29
CN1127055C (zh) 2003-11-05
JP2002528775A (ja) 2002-09-03
BR9914890B1 (pt) 2013-09-24
NO20012068L (no) 2001-06-27
NO20012066L (no) 2001-06-27
CA2347668A1 (en) 2000-05-04
KR100417635B1 (ko) 2004-02-05
DE69910240T2 (de) 2004-06-24
CA2347667C (en) 2006-02-14
NO20012067L (no) 2001-06-27
HK1043234A1 (en) 2002-09-06
AU752229B2 (en) 2002-09-12
CA2347667A1 (en) 2000-05-04
NO20045257L (no) 2001-06-27
DK1125284T3 (da) 2003-12-01
NO318627B1 (no) 2005-04-18
US20050108007A1 (en) 2005-05-19
KR20010099764A (ko) 2001-11-09
EP1125284A1 (en) 2001-08-22
NZ511163A (en) 2003-07-25
US7260521B1 (en) 2007-08-21
DE69913724T2 (de) 2004-10-07
DE69910058T2 (de) 2004-05-19
EP1125285B1 (en) 2003-07-30
JP3869211B2 (ja) 2007-01-17
CN1328682A (zh) 2001-12-26
EP1125286A1 (en) 2001-08-22
JP3490685B2 (ja) 2004-01-26
JP2002528776A (ja) 2002-09-03
US7151802B1 (en) 2006-12-19
ES2212642T3 (es) 2004-07-16
WO2000025305A1 (en) 2000-05-04
EP1125286B1 (en) 2003-12-17
NO20012067D0 (no) 2001-04-26
ATE246389T1 (de) 2003-08-15
CA2347743C (en) 2005-09-27
BR9914890A (pt) 2001-07-17
MXPA01004181A (es) 2003-06-06
AU6457099A (en) 2000-05-15
WO2000025298A1 (en) 2000-05-04
CN1172292C (zh) 2004-10-20
EP1125276A1 (en) 2001-08-22
ZA200103366B (en) 2002-05-27
US20100174536A1 (en) 2010-07-08
ZA200103367B (en) 2002-05-27
DK1125276T3 (da) 2003-11-17
AU6455599A (en) 2000-05-15
WO2000025304A1 (en) 2000-05-04
DK1125286T3 (da) 2004-04-19
CN1328683A (zh) 2001-12-26
ATE246836T1 (de) 2003-08-15
NO319181B1 (no) 2005-06-27
NO20012066D0 (no) 2001-04-26
AU763471B2 (en) 2003-07-24
CN1165892C (zh) 2004-09-08
KR100417634B1 (ko) 2004-02-05
JP3936139B2 (ja) 2007-06-27
EP1125285A1 (en) 2001-08-22
RU2217718C2 (ru) 2003-11-27
BR9914889A (pt) 2001-07-17
NO20012068D0 (no) 2001-04-26
WO2000025303A1 (en) 2000-05-04
DE69910239D1 (de) 2003-09-11
RU2219507C2 (ru) 2003-12-20
ES2205891T3 (es) 2004-05-01
KR20010090803A (ko) 2001-10-19
US6795805B1 (en) 2004-09-21
CA2347743A1 (en) 2000-05-04
ES2205892T3 (es) 2004-05-01
AU6457199A (en) 2000-05-15
CA2347668C (en) 2006-02-14
CA2347735A1 (en) 2000-05-04
HK1043234B (zh) 2004-07-16
BR9914889B1 (pt) 2013-07-30
CN1328681A (zh) 2001-12-26
CA2252170A1 (en) 2000-04-27
AU6456999A (en) 2000-05-15
US7672837B2 (en) 2010-03-02
CN1165891C (zh) 2004-09-08
DE69910058D1 (de) 2003-09-04
CN1328684A (zh) 2001-12-26
ES2207968T3 (es) 2004-06-01
PT1125285E (pt) 2003-12-31
ATE256910T1 (de) 2004-01-15
US6807524B1 (en) 2004-10-19
DE69910240D1 (de) 2003-09-11
NO317603B1 (no) 2004-11-22
PT1125284E (pt) 2003-12-31
JP3566652B2 (ja) 2004-09-15
DE69910239T2 (de) 2004-06-24
PT1125276E (pt) 2003-12-31
EP1125284B1 (en) 2003-08-06
MXPA01004137A (es) 2002-06-04
ATE246834T1 (de) 2003-08-15
CA2347735C (en) 2008-01-08
KR20010099763A (ko) 2001-11-09
PT1125286E (pt) 2004-05-31
JP2002528983A (ja) 2002-09-03
US8036885B2 (en) 2011-10-11
US20050108005A1 (en) 2005-05-19
JP2002528777A (ja) 2002-09-03

Similar Documents

Publication Publication Date Title
KR100417836B1 (ko) 과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121231

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140127

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150107

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160111

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170104

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20180105

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20181221

Year of fee payment: 16