KR100284562B1 - 음성 부호화기의 피치 탐색방법 - Google Patents
음성 부호화기의 피치 탐색방법 Download PDFInfo
- Publication number
- KR100284562B1 KR100284562B1 KR1019970066451A KR19970066451A KR100284562B1 KR 100284562 B1 KR100284562 B1 KR 100284562B1 KR 1019970066451 A KR1019970066451 A KR 1019970066451A KR 19970066451 A KR19970066451 A KR 19970066451A KR 100284562 B1 KR100284562 B1 KR 100284562B1
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- integer
- search
- fractional
- pitch search
- Prior art date
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 음성을 코딩 및 디코딩 하는 보코더에서 피치(Pitch) 탐색(Search)시 인테져(Integer) 피치 탐색을 한후 찾은 점의 근접 위치에 대해서만 프렉셔널(Fractional) 피치 탐색을 수행함으로써 피치 탐색시 소요되는 탐색시간을 감소시켜 프로세서 오버로드(Overload)를 줄이도록 한 음성 부호화기의 피치 탐색 방법에 관한 것으로서, 이러한 본 발명은 원음성 신호로부터 포르만트 성분을 제거하는 포르만트 성분 제거과정과; 포르만트 성분이 제거된 신호에서 인테져 피치 탐색을 수행하여 최소 에러를 갖는 인테져 피치를 찾는 인테져 피치 탐색과정과; 인테져 피치 탐색에 의해 찾은 인테져 피치의 근방 영역에 대해서만 프렉셔널 피치 탐색을 수행하여 최소 에러를 갖는 프렉셔널 피치를 찾는 프렉셔널 피치 탐색과정과; 탐색한 인테져 피치와 프렉셔널 피치를 상호 비교하여 그 값이 작은 것을 피치 파라미터로 선정하는 피치 파라미터 선택과정을 순차 실행시킴으로써 피치 탐색시간을 줄이게되는 것이다.
Description
본 발명은 음성 부호화기(VOCODER)에 관한 것으로, 특히 음성을 코딩 및 디코딩 하는 보코더에서 피치(Pitch) 탐색(Search)시 인테져(Integer) 피치 탐색을 한후 찾은 점의 근접 위치에 대해서만 프렉셔널(Fractional) 피치 탐색을 수행함으로써 피치 탐색시 소요되는 탐색시간을 감소시켜 프로세서 오버로드(Overload)를 줄이도록 한 음성 부호화기의 피치 탐색 방법에 관한 것이다.
상기에서, 피치(Pitch)는 음성을 시간 영역의 도메인 상에서 볼 때 주기적인 특성을 말한다.
일반적으로, 음성 부호화 기술은 크게 소스(Source) 부호화, 웨이브폼(Waveform) 부호화, 하이브리드(Hybrid) 부호화로 대별되며, 그 중에서 소스 부호화는 원음성 파형의 발생 과정을 몇 가지 성분으로 모델링하여 각각의 파라미터(Parameter)를 추출한다.
여기서, 파라미터는 포르만트 파라미터(Formant Parameter), 피치 파라미터(Pitch Parameter) 그리고 잔여 성분인 Residual Signal로 구성된다.
상기에서, 포르만트는 모음 또는 이에 가까운 유성음의 단음을 주파수 분석하였을 때 공진으로 인하여 몇 군데의 특정 주파수 영역에 생기는 에너지의 산(山)을 말한다. 이 영역의 중심 주파수를 포르만트 주파수라고 하는데, 이것이 낮은 것으로부터 제1 포르만트, 제2 포르만트, ... 라고 이름을 붙인다. 단음의 언어음으로서의 구별은 포르만트의 구성에 크게 의존한다. 성도의 전달 함수를 수식으로 표시할 때 포르만트 주파수는 그 극(極)을 나타내는 주파수가 된다.
또한, 정확한 피치 성분을 찾기 위해 프렉셔널 피치 파라미터(Fractional Pitch Parameter)를 찾게 된다.
첨부한 도면 도 1은 일반적인 음성 부호화기의 구성도 이다.
이에 도시된 바와 같이, 입력되는 원음성(S(n))으로부터 포르만트 성분을 제거하는 포르만트 필터링부(10)와, 상기 포르만트 필터링부(10)를 통한 신호로부터 피치 파라미터를 추출하는 피치 파라미터 추출부(20)로 구성되었다.
상기에서, 포르만트 필터링부(10)는 입력되는 원음성으로부터 포르만트 주파수를 제거하기 위한 포르만트 계수를 출력하는 포르만트 필터(11)와, 상기 입력되는 원음성에서 상기 포르만트 필터(11)에서 얻어지는 필터 계수를 가산하여 그 결과치를 포르만트 주파수가 제거된 신호로 출력하는 가산기(12)로 구성되었다.
또한, 상기 피치 파라미터 추출부(20)는 파라미터의 모든 조합을 하나씩 상기 포르만트 필터부(10)에서 얻어지는 신호와 조합한 후 최소 에러치를 탐색하는 피치 탐색부(21)와, 상기 피치 탐색부(21)에서 얻어지는 파라미터 조합의 피치 신세시스를 필터링 하는 피치 신세시스 필터(22)와, 상기 피치 신세시스 필터(22)에서 얻어지는 신호에서 포르만트 신세시스 필터계수를 필터링 하는 포르만트 필터(23)와, 상기 포르만트 신세시스 필터(23)에서 얻어지는 신호와 상기 포르만트 필터링부(10)에서 얻어지는 신호를 가산하여 그 결과치를 에러 신호(E(n))로 출력하는 가산기(24)로 구성되었다.
이와 같이 구성된 일반적인 음성 부호화기의 동작을 첨부한 도면 도 2 및 도 4를 참조하여 설명하면 다음과 같다.
먼저, 원음성 S(n)이 포르만트 필터링부(10)내의 포르만트 필터(11)에서 필터링 되면 필터 계수가 추출되며, 가산기(12)는 상기 원음성 S(n)에서 상기 필터 계수(-값)를 가산하여 포르만트 성분을 제거하게 된다.
이와 같이 포르만트 성분이 제거된 신호는 피치 파라미터 추출부(20)에 전달되어 분석 및 합성(Analysis - by - Synthesis) 과정에 의해 피치 파라미터가 추출된다.
여기서, 인테져 피치 파라미터(Integer Pitch Parameter는 프렉셔널 피치 파라미터와 구분하기 위해서 인테져라는 표기를 사용함)는 도 4a에 도시된 바와 같이, 인테져 피치 레그(Integer Pitch Lag : L)와 인테져 피치 게인(Integer Pitch gain : G)으로 구성되고, 각 인테져 피치 파라미터는 일반적으로 다음과 같이 일정 정수 범위 내로 미리 정의된다.
Lmin< L < Lmax, 여기서 Lmin, Lmax는 정수,
Gmin< G < Gmax, 여기서 Gmin,Gmax는 정수.
한편, 피치 탐색부(21)는 파라미터의 모든 조합(L, G)을 하나씩 피치 신세시스 필터(22)에 넣어 필터 계수를 추출토록 하며, 그 추출된 필터 계수에 의해 포르만트 신세시스 필터(23)는 필터링을 수행하여 복원된 신호를 만들게 된다.
그러면 가산기(24)는 상기 포르만트 필터링부(10)에서 출력되는 신호에서 상기 포르만트 신세시스 필터(23)를 통한 복원된 신호(-값)를 가산하여 그 결과치를 에러 값(E(n))으로 출력시키게 된다.
즉, 피크 탐색부(21)는 원음성에서 포르만트 성분이 제거된 신호의 에러가 최소가 되는 L*과 G*의 조합을 찾게 된다.
이후 더 정밀한 피치 파라미터를 추출하기 위해 프렉셔널 피치 탐색을 수행한다. 여기서, 프렉셔널 피치 파라미터도 프렉셔널 피치 레그(l)와 프렉셔널 피치 게인(g)으로 구성되며, 일반적으로 다음과 같이 미리 정의된다.
lmin< l < lmax, 여기서 lmin, lmax는 소수,
gmin< g < gmax,여기서 gmin, gmax는 소수.
그리고, 프렉셔널 피치 탐색 루틴도 앞에서 설명한 인테져 피치 탐색 루틴과 동일하게 되며, 이때 최소 에러를 갖는 l*과 g*를 구한다.
결론적으로, 인테져/프렉셔널 피치 탐색에서 얻은 각 최소 에러값 중에서 더 작은 값을 갖는 피치 파라미터를 최종적으로 선택하게 된다.
즉, 도 4a에 도시된 바와 같이, 인테져 피치 탐색시 빗금 친 전체 영역을 탐색하여 최소 에러를 갖는 점 A(L*, G*)를 찾고, 다음으로 프렉셔널 피치 탐색시에도 상기 인테져 피치 탐색 방법과 동일하게 빗금 친 전체 영역을 탐색하여 최소 에러를 갖는 점 B(l*, g*)를 찾는다.
다시 말해, 피치 탐색시 전체 빗금 친 영역을 2회 탐색하게 된다.
그런데, 상기와 같은 종래 음성 부호화기의 피치 탐색 방법은 피치 파라미터를 결정하기 위해 인테져 피치 탐색과 프렉셔널 피치 탐색을 각 파라미터의 조합수 만큼 전체 영역을 반복하여 수행하므로 피치 탐색시간이 길다는 단점이 있었다.
실제적으로 전체 음성 부호화에서 걸리는 시간중 80% 이상이 상기와 같은 피치 탐색에 소모된다.
이에 본 발명은 상기와 같은 종래 음성 부호화기의 피치 탐색시 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로,
본 발명은 음성을 코딩 및 디코딩 하는 보코더에서 피치(Pitch) 탐색(Search)시 인테져(Integer) 피치 탐색을 한후 찾은 점의 근접 위치에 대해서만 프렉셔널(Fractional) 피치 탐색을 수행함으로써 피치 탐색시 소요되는 탐색시간을 감소시켜 프로세서 오버로드(Overload)를 줄이도록 한 음성 부호화기의 피치 탐색 방법을 제공하는 데 그 목적이 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 의한 방법은,
원음성 신호로부터 포르만트 성분을 제거하는 포르만트 성분 제거과정과;
상기 포르만트 성분이 제거된 신호에서 인테져 피치 탐색을 수행하여 최소 에러를 갖는 인테져 피치를 찾는 인테져 피치 탐색과정과;
상기 인테져 피치 탐색과정에서 찾은 인테져 피치를 중심으로 프렉셔널 피치가 존재할 확률이 가장 많은 인접 영역에 대해서만 프렉셔널 피치 탐색을 수행하여 최소 에러를 갖는 프렉셔널 피치를 찾는 프렉셔널 피치 탐색과정과;
상기 탐색한 인테져 피치와 프렉셔널 피치를 상호 비교하여 그 값이 작은 것을 피치 파라미터로 선정하는 피치 파라미터 선택과정으로 이루어진다.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.
도 1 은 일반적인 음성 부호화기의 구성도,
도 2 는 종래 음성 부호화기의 피치 탐색방법을 보인 흐름도,
도 3 은 본 발명에 의한 음성 부호화기의 피치 탐색방법을 보인 흐름도,
도 4 는 종래 피치 탐색 영역과 본 발명에 의한 피치 탐색 영역을 보여주는 도면.
<도면의 주요 부분에 대한 부호의 설명>
10:포르만트 필터링부 11:포르만트 필터
12,24:가산기 20:피치 파라미터 추출부
21:피치 탐색부 22:피치 신세시스 필터
23:포르만트 신세시스 필터
첨부한 도면 도 3은 본 발명에 의한 음성 부호화기의 피치 탐색방법을 보인 흐름도이다.
이에 도시된 바와 같이, 원음성 신호로부터 포르만트 성분을 제거하는 포르만트 성분 제거과정과; 상기 포르만트 성분이 제거된 신호에서 인테져 피치 탐색을 수행하여 최소 에러를 갖는 인테져 피치를 찾는 인테져 피치 탐색과정과; 상기 인테져 피치 탐색에 의해 찾은 인테져 피치를 중심으로 프렉셔널 피치가 존재할 확률이 가장 많은 인접 영역에 대해서만 프렉셔널 피치 탐색을 수행하여 최소 에러를 갖는 프렉셔널 피치를 찾는 프렉셔널 피치 탐색과정과; 상기 탐색한 인테져 피치와 프렉셔널 피치를 상호 비교하여 그 값이 작은 것을 피치 파라미터로 선정하는 피치 파라미터 선택과정으로 이루어진다.
이와 같이 이루어지는 본 발명에 의한 음성 부호화기의 피치 탐색방법을 첨부한 도면 도 1 및 도 4b를 참조하여 설명하면 다음과 같다.
먼저, 본 발명의 작용을 설명하기에 앞서 본 발명의 전체적인 개념을 간략히 언급하면 다음과 같다.
본 발명은 포르만트 성분이 제거된 신호에서 피치 파라미터를 탐색하는 경우, 일차적으로 전체 영역에 대해 인테져 피치 탐색을 수행하여 에러가 최소인 점 A(L*, G*)를 찾은 후 그 점 A의 인접한 영역에 대해서만 프렉셔널 피치 탐색을 수행하여 에러가 최소치인 점 B(l*, g*)를 찾게 된다.
이를 첨부한 도면 도 3에 의거 좀 더 상세히 설명하면 다음과 같다.
원음성이 입력되면, 포르만트 분석 필터를 통과시켜 포르만트 계수를 구한다. 다음으로 포르만트 성분이 제거된 신호를 피치 탐색 루틴에 기준 신호로 사용한다. 이후 피치 탐색 알고리즘을 적용하여 피치를 찾게 된다.
먼저 인테져 피치 탐색을 다음과 같은 범위 내에서 수행한다.
Lmin< L < Lmax, 여기서 Lmin, Lmax는 정수,
Gmin< G < Gmax, 여기서 Gmin,Gmax는 정수.
이 범위 내에서 기준신호와 L, G의 각각의 조합에 의해 복원된 신호와의 에러가 최소가 되는 L*, G*를 구한다.
다음으로, 프렉셔널 피치 탐색을 상기 인테져 피치 탐색 알고리즘에 의해 구해진 L*, G*의 인접 영역에 대해서만 수행한다.
여기서, 근방 범위는 다음과 같다.
L*-a < l < L*+a, 여기서 a는 정수,
G*-b < g < G*+b, 여기서 b는 정수.
상기에서, a, b는 적절히 정해질 수 있고, 이 범위 내에서 기준신호와 l, g의 각 조합에 의해 복원된 신호와의 에러가 최소가 되는 l*, g*를 구하여 그 점을 피치 파라미터로 결정하게 된다.
상기에서, 인접 영역은 인테져 피치를 중심으로 프렉셔널 피치가 존재할 확률이 가장 많은 근접 영역을 말한다.
첨부한 도면 도 4b는 본 발명에 의한 프렉셔널 피치 탐색 영역을 보여주는 도면으로서, 기존 프렉셔널 피치 탐색 영역과 비교하여 보면 수배로 탐색 영역이 감소되었음을 알 수 있으며, 이러한 프렉셔널 피치 탐색 영역의 축소로 탐색시 소요되는 시간을 단축시키게 된다.
이상에서 상술한 바와 같이 본 발명은, 포르만트 성분이 제거된 신호로부터 인테져 피치 탐색을 수행하여 에러가 최소치가 되는 점을 찾고, 그 찾은 점의 인접 영역으로 프렉셔널 피치 탐색 영역을 설정하여 프렉셔널 피치를 찾으므로 써 탐색 영역의 축소로 전체적인 탐색시간을 줄일 수 있는 효과가 있다.
또한, 상기와 같은 탐색시간의 단축으로 피치 탐색 알고리즘의 지연 시간을 줄일 수 있어 상기 피치 탐색 알고리즘을 수행하는 프로세서의 오버로드를 줄일 수 있는 이점도 있다.
Claims (2)
- 전송할 음성을 부호화 하는 음성 부호화기(VOCODER)에 있어서,원음성 신호로부터 포르만트 성분을 제거하는 포르만트 성분 제거과정과;상기 포르만트 성분이 제거된 신호에서 인테져 피치 탐색을 수행하여 최소 에러를 갖는 인테져 피치를 찾는 인테져 피치 탐색과정과;상기 인테져 피치 탐색과정에서 찾은 인테져 피치를 중심으로 프렉셔널 피치가 존재할 확률이 가장 많은 인접 영역에 대해서만 프렉셔널 피치 탐색을 수행하여 최소 에러를 갖는 프렉셔널 피치를 찾는 프렉셔널 피치 탐색과정과;상기 탐색한 인테져 피치와 프렉셔널 피치를 상호 비교하여 그 값이 작은 것을 피치 파라미터로 선정하는 피치 파라미터 선택과정을 포함하여 이루어짐을 특징으로 하는 음성 부호화기의 피치 탐색방법.
- 제 1 항에 있어서, 상기 프렉셔널 피치 탐색과정의 인접 영역은 하기한 수식(1)에 의해 설정하는 것을 특징으로 하는 음성 부호화기의 피치 탐색방법.L*-a < l < L*+a,G*-b < g < G*+b. ...........수식(1)상기에서, a, b는 정수이고, L*은 인테져 피치 탐색과정에서 얻어지는 시간축영역에서의 피치 지연이고, G*는 인테져 피치 탐색과정에서 얻어지는 시간축영역에서의 피치 이득을 나타내며, l, g는 프렉셔널 피치 탐색시 최소 에러가 되는 프렉셔널 피치 위치를 나타낸 것이다.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970066451A KR100284562B1 (ko) | 1997-12-05 | 1997-12-05 | 음성 부호화기의 피치 탐색방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970066451A KR100284562B1 (ko) | 1997-12-05 | 1997-12-05 | 음성 부호화기의 피치 탐색방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990047896A KR19990047896A (ko) | 1999-07-05 |
KR100284562B1 true KR100284562B1 (ko) | 2001-03-15 |
Family
ID=66088907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970066451A KR100284562B1 (ko) | 1997-12-05 | 1997-12-05 | 음성 부호화기의 피치 탐색방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100284562B1 (ko) |
-
1997
- 1997-12-05 KR KR1019970066451A patent/KR100284562B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR19990047896A (ko) | 1999-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4653098A (en) | Method and apparatus for extracting speech pitch | |
JP3321971B2 (ja) | 音声信号処理方法 | |
JP3475446B2 (ja) | 符号化方法 | |
DK1342230T3 (da) | Forbedring af den perceptuelle præstation af fremgangsmåder til höjfrekvensrekonstruktionskodning ved adaptiv filtrering | |
KR100922702B1 (ko) | 음향 신호 부호화 방법 및 장치, 음향 신호 복호화 방법및 장치, 및 기록 매체 | |
CA2455059A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
US5884251A (en) | Voice coding and decoding method and device therefor | |
KR100406674B1 (ko) | 음성합성방법 및 장치 | |
JP2000155597A (ja) | デジタル音声符号器において使用するための音声符号化方法 | |
KR100284562B1 (ko) | 음성 부호화기의 피치 탐색방법 | |
JP3756864B2 (ja) | 音声合成方法と装置及び音声合成プログラム | |
JP6962269B2 (ja) | ピッチ強調装置、その方法、およびプログラム | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
KR0176623B1 (ko) | 연속 음성의 유성음부와 무성자음부의 자동 추출방법 및 장치 | |
KR100346732B1 (ko) | 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 | |
JP3346200B2 (ja) | 音声認識装置 | |
JP3576794B2 (ja) | 音声符号化/復号化方法 | |
KR0133467B1 (ko) | 한국어 음성 합성기의 벡터 양자화 방법 | |
JP2007505346A (ja) | 遷移のオーディオ信号成分の符号化 | |
KR100263252B1 (ko) | 양자화 오차 추림에 의한 피치검색방법 | |
JPH0736491A (ja) | ピッチ抽出装置 | |
KR101626280B1 (ko) | 합성음의 고조파 성분 제거 방법 및 장치 | |
JPH06202695A (ja) | 音声信号処理装置 | |
Yaghmaie | Prototype waveform interpolation based low bit rate speech coding | |
Gu et al. | A method for automatic extraction of F/sub 0/contour generation process model parameters for Mandarin |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20061214 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |