Nothing Special   »   [go: up one dir, main page]

KR100393899B1 - 2-단계 피치 판단 방법 및 장치 - Google Patents

2-단계 피치 판단 방법 및 장치 Download PDF

Info

Publication number
KR100393899B1
KR100393899B1 KR10-2001-0045563A KR20010045563A KR100393899B1 KR 100393899 B1 KR100393899 B1 KR 100393899B1 KR 20010045563 A KR20010045563 A KR 20010045563A KR 100393899 B1 KR100393899 B1 KR 100393899B1
Authority
KR
South Korea
Prior art keywords
pitch
autocorrelation
error range
range
candidate
Prior art date
Application number
KR10-2001-0045563A
Other languages
English (en)
Other versions
KR20030010898A (ko
Inventor
정도일
서헌석
Original Assignee
어뮤즈텍(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어뮤즈텍(주) filed Critical 어뮤즈텍(주)
Priority to KR10-2001-0045563A priority Critical patent/KR100393899B1/ko
Priority to AT02758908T priority patent/ATE338330T1/de
Priority to PCT/KR2002/001423 priority patent/WO2003017250A1/en
Priority to CN028172248A priority patent/CN1216362C/zh
Priority to US10/485,001 priority patent/US7012186B2/en
Priority to DE60214409T priority patent/DE60214409T2/de
Priority to EP02758908A priority patent/EP1436805B1/en
Priority to JP2003522079A priority patent/JP4217616B2/ja
Publication of KR20030010898A publication Critical patent/KR20030010898A/ko
Application granted granted Critical
Publication of KR100393899B1 publication Critical patent/KR100393899B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Bridges Or Land Bridges (AREA)

Abstract

본 발명은 피치 판단 방법 및 장치에 관한 것으로서, 외부에서 입력되는 디지털 신호를 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 피치후보를 도출하는 과정과, 상기 피치후보의 오차범위와, 상기 피치후보의 오차범위에 의해 산출된 자기상관범위에 대한 자기상관 결과의 오차범위를 비교하는 과정과, 상기 비교 결과 자기상관 결과의 오차범위가 피치후보의 오차범위 이하인 경우, 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 주파수 분석에 의한 주파수 범위와 그 주파수 범위 내에서 자기 상관치가 가장 큰 주파수 범위의 교집합을 최종 피치로 결정하는 과정을 포함하는 것을 특징으로 한다. 따라서, 외부에서 입력되는 디지털 신호에 대한 주파수 분석 및 자기상관을 순차적으로 수행하여 피치판단 결과에 대한 오차범위를 줄임으로써, 보다 정확한 피치판단 결과를 기대할 수 있다는 효과가 있다.

Description

2-단계 피치 판단 방법 및 장치{2-phase pitch detection method and apparatus}
본 발명은 피치 판단 방법 및 장치에 관한 것으로서, 특히, 외부에서 입력되는 디지털 신호에 대한 주파수 분석 및 자기상관을 순차적으로 수행함으로써, 피치판단 결과에 대한 오차범위를 줄이는 것을 특징으로 하는 2-단계 피치 판단 방법 및 장치에 관한 것이다.
실시간으로 연주되어지는 악기의 연주음 또는 사람의 목소리에 대한 피치(주파수)를 판단하는 기술은 그 악기의 연주음 또는 사람의 목소리에 대한 연주정보 데이터를 추출하거나, 실시간 음악과의 합주 등을 위해 계속해서 개발되고 있는 실정이다.
이러한 피치 판단을 위해 일반적으로 사용되는 방법으로는 디지털 신호로 변환된 연주음 또는 목소리에 대한 주파수를 분석하는 방법, 반복되는 웨이브의 주기 계산을 위한 웨이브 파형의 피크(peak) 또는 0점(zero-crossing) 주기 계산 방법, 웨이브 파형의 자기 상관을 이용하는 방법 등이 있다.
이 때, 상기 주파수 분석 방법의 경우 고주파 대역과 저주파 대역에서의 오차는 같지만, 이를 악기의 피치 도출에 이용할 경우 음간 주파수 간격이 상대적으로 가까운 저주파 대역에서 오차에 의한 피치판단 오류 확률이 커진다는 단점이 있다. 또한, 자기 상관을 이용한 방법의 경우 그 계산상의 특성상 고주파 대역에서 오차가 크다는 단점이 있다.
한편, 피크(peak) 또는 0점(zero-crossing) 주기 계산 방법의 경우 잡음(noise)등에 의해 정확한 주기를 산출하는 것이 어려우며 그 결과가 부정확하다는 단점이 있다.
따라서, 본 발명은 상기한 바와 같은 종래의 제반 문제점을 해결하기 위해안출된 것으로서, 외부에서 입력되는 디지털 신호에 대하여 주파수 분석을 한 후, 그 주파수 분석 결과에 의해 선택된 소정의 시간영역에 대한 자기상관을 수행함으로써, 보다 정확한 피치를 도출하도록 하는 것을 특징으로 하는 2-단계 피치 판단 방법 및 장치를 제공하는 것을 목적으로 한다.
도 1은 본 발명의 일 실시예에 따른 2-단계 피치 판단 장치에 대한 개략적인 블록도,
도 2는 본 발명의 일 실시예에 따른 2-단계 피치 판단 방법에 대한 처리 흐름도,
도 3a 내지 도 3d는 본 발명의 2-단계 피치 판단 방법을 설명하기 위한 예시적인 파형도.
♣ 도면의 주요 부분에 대한 부호의 설명 ♣
10 : 음악정보 입력부 20 : 음의 유무 판별부
30 : 주파수 분석부 40 : 오차범위 비교부
50 : 자기상관 계산부 60 : 결과 출력부
상기 목적을 달성하기 위한 본 발명의 2-단계 피치 판단 방법은 외부에서 입력되는 디지털 신호를 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 제1 피치후보를 도출하는 제1 과정과, 상기 제1 피치후보의 오차범위와, 상기 제1 피치후보의 오차범위에 의해 산출된 자기상관범위에 대한 자기상관 결과의 오차범위를 비교하는 제2 과정과, 상기 비교 결과 자기상관 결과의 오차범위가 피치후보의 오차범위 이하인 경우, 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 피치를 도출하는 제3 과정을 포함하는 것을 특징으로 한다.
한편, 상기 목적을 달성하기 위한 본 발명의 2-단계 피치 판단 장치는 외부에서 입력되는 디지털 신호를 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 제1 피치후보를 도출하는 주파수 분석부와, 상기 제1 피치후보의 오차범위와 상기 제1 피치후보의 오차범위에 의해 산출된 자기상관범위에 대한 자기상관 결과의 오차범위를 비교하는 오차범위 비교부와, 상기 오차범위 비교부의 비교 결과 상기 자기상관 결과의 오차범위가 상기 제1 피치후보의 오차범위 이하인 경우 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 제2 피치후보를 도출하는 자기상관 계산부와, 상기 제1 피치후보의 오차범위 및 상기 제2 피치후보의오차범위에 의거하여 피치를 결정하는 피치 결정부와, 상기 피치 결정부에서 결정된 피치를 출력하는 결과 출력부를 포함하는 것을 특징으로 한다.
이하, 본 발명에 따른 2-단계 피치 판단 방법 및 장치에 대한 바람직한 실시예를 첨부된 도면에 의거하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 2-단계 피치 판단 장치에 대한 개략적인 블록도이다. 도 1을 참조하면, 본 발명의 실시예에 따른 2-단계 피치 판단 장치는 음악정보 입력부(10), 음의 유무 판별부(20), 주파수 분석부(30), 오차범위 비교부(40), 자기상관 계산부(50), 피치 결정부(60), 결과 출력부(70)를 포함하여 구성된다.
음악정보 입력부(10)는 마이크를 통한 아날로그 신호를 디지털 신호로 변환하거나, 변환과정을 거쳐 생성된 디지털 신호를 받아들인다.
음의 유무 판별부(20)는 음악정보 입력부(10)를 통해 받아들여진 신호의 세기를 감지하여 음의 유무를 판단한다. 즉, 음악정보 입력부(10)를 통해 받아들여진 신호의 세기가 주변환경 등을 고려하여 기 설정된 잡음(noise)의 세기 보다 클 경우에 음악소리의 신호가 입력된 것으로 간주한다.
주파수 분석부(30)는 음의 유무 판별부(20)를 통해 입력되는 디지털 음향을 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 제1 피치후보를 도출한다. 이 때, 주파수 분석에 의한 피치 도출 방법은 이미 공지된 기술로서, 다양한 방법의 적용이 가능한데, 예를 들면, 주파수 성분값들을 분석하여, 피크들의 위치를 추출한 후, 그 피크들 간의 간격을 피치후보로 도출하는 방법이나, 다수개의 피크들 중 최대 피크의 위치를 피치후보로 도출하는 방법 등을 적용하는 것이 가능하다. 한편, 디지털 음향을 주파수 성분으로 분해하는 방법으로는 일반적으로 고속 푸리에 변환(FFT)을 이용하지만, 웨이브렛(wavelet) 변환과 같은 다른 방법을 이용하는 것도 가능하다.
오차범위 비교부(40)는 주파수 분석부(30)를 통해 도출된 제1 피치후보의 오차범위(R1)와, 그 오차범위(R1)에 의해 산출된 자기상관범위(L1)에 대한 자기상관 결과의 오차범위(R2)를 비교한다. 이 때, 제1 피치후보의 오차범위(R1), 자기상관범위(L1), 그 자기상관범위(L1)에 대한 자기상관 결과의 오차범위(R2)는 실시간으로 산출되거나, 사전에 계산되어 분류 저장된 값을 이용하는 것을 특징으로 한다.
자기상관 계산부(50)는 오차범위 비교부(40)의 비교 결과, 자기상관 결과의 오차범위(R2)가 제1 피치후보의 오차범위(R1) 이하인 경우, 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 제2 피치후보를 도출한다. 이 때, 소정 시간영역이란 오차범위 비교부(40)에서 산출된 자기상관범위에 의거하여 결정되며, 소정 범위 내에서 그 자기상관범위를 변동 적용하는 것도 가능하다. 즉, 디지털 신호의 근원이 무엇인지(예컨대, 악기의 종류 또는 사람의 목소리) 그리고 어떤 목적에 쓸것인지에 따라 자기상관범위를 변동 적용할 수 있는 것이다.
이와 같이 자기상관범위를 결정하였으면, 자기상관 계산부(50)는 해당 범위에 대하여 자기상관을 수행한 후, 그 자기상관계수가 최고인 래그(Lag)를 도출하고, 그 래그(Lag)에 의해 해당 디지털 신호에 대한 제2 피치후보를 도출한다.
피치 결정부(60)는 제1 피치후보의 오차범위 및 제2 피치후보의 오차범위에의거하여 피치를 결정하는데, 오차범위 비교부(40)의 비교결과를 참조한다. 즉, 오차범위 비교부(40)의 비교 결과 자기상관 결과의 오차범위가 제1 피치후보의 오차범위 이하인 경우 제2 피치후보의 오차범위 내에서 피치를 결정하고, 그렇지 않은 경우 제1 피치후보의 오차범위 내에서 피치를 결정한다. 그런데, 상기 제2 피치후보를 도출하기 위한 래그(Lag)값이 상기 제1 후보의 오차범위에 의해 산출된 자기상관 범위의 상한값 또는 하한값인 경우는 상기 제1 피치후보의 오차범위와 제2 피치후보의 오차범위의 교집합 영역 내에서 피치를 결정한다.
결과 출력부(70)는 피치 결정부(60)에서 결정된 피치를 출력한다.
한편, 도 2는 본 발명의 일 실시예에 따른 2-단계 피치 판단 방법에 대한 처리 흐름도로서, 도 2를 참조하여 본 발명의 일 실시예에 따른 2-단계 피치 판단 방법을 설명하면 다음과 같다.
우선, 외부에서 디지털 신호가 입력되면(s210) 그 신호의 레벨과 주변 환경 등에 의해 사전에 설정된 잡음(noise)의 레벨을 비교하여, 신호의 레벨이 잡음의 레벨 보다 높을 경우 신호가 입력된 것으로 간주하여 주파수 분석을 수행하도록 한다(s220). 즉, 입력된 디지털 신호에 대한 주파수 분석을 수행하여 제1 피치후보를 도출한다. 이 때, 주파수 분석에 의해 피치후보를 도출하기 위한 구체적인 방법 및 주파수 변환 방법은 이미 공지된 기술을 이용하며, 도 1의 '주파수 분석부(30)'에 대한 설명시 언급되었다.
이와 같이 주파수 분석에 의한 제1 피치후보가 도출되었으면, 그 제1 피치후보에 대한 오차범위(R1)를 산출하고(s230), 그 오차범위에 의한 자기상관범위(Lag범위)(L1)를 산출한 후(s240), 그 자기상관범위(Lag 범위)에 대한 자기상관 결과의 오차 범위(R2)를 산출하는(s250) 일련의 과정을 수행한다. 이 때, 상기 제1 피치후보에 대한 오차범위(R1), 자기상관범위(L1) 및 자기상관 결과의 오차범위(R2)는 사전에 계산된 값을 이용할 수도 있으며, 이 경우 상기 과정들(s230 내지 s250)은 생략할 수 있다.
그리고, 제1 피치후보의 오차범위(R1)와 자기상관 결과의 오차범위(R2)를 비교하여(s260), 자기상관 결과의 오차범위(R2)가 피치후보의 오차범위(R1) 이하의 값을 가질 경우 해당 자기상관범위에 의해 결정된 소정 시간영역에 대한 디지털 신호의 자기상관을 수행하여 제2 피치후보를 도출한(s270) 후, 제1 피치후보의 오차범위와 제2 피치후보의 오차범위의 교집합 영역에서 피치를 결정한다(s280). 그렇지 않을 경우 주파수 분석에 의해 도출된 제1 피치후보를 피치로 결정한다(s290).
이 때, 상기 제1 피치후보의 오차범위와 제2 피치후보의 오차범위의 교집합 영역은 일반적인 경우 별도로 계산할 필요가 없지만, 상기 제2 피치후보를 도출하기 위한 래그(Lag)값이 상기 과정(s240)에 의해 산출된 자기상관범위(Lag 범위)의 상한값 또는 하한값인 경우 상기 교집합 영역을 별도로 계산하는 과정을 수행하여야 한다.
즉, 해당 디지털 신호에 대한 주파수 분석과 자기상관을 순차적으로 수행함으로써, 보다 정확한 피치를 도출할 수 있는 것이다.
이하, 샘플링 비율(Sampling Rate)이 22,050 Hz이고, FFT 변환을 위한 윈도우 크기(Window Size)가 1024일 경우, 본 발명에 의해 피치를 도출하기 위한 처리과정을 수학식을 참조하여 설명하면 다음과 같다.
우선, 상기 조건에 의해 주파수 분석을 수행할 경우 FFT 변환을 위한 단위 구간(이하, 'index'라 함)내에서의 주파수 도출 방법은 (수학식 1)과 같다. 이 때, FFT 변환을 위한 단위 구간(index)은 FFT 변환을 위한 윈도우 크기(Window size)에 의해 결정되며, FFT 변환을 위한 윈도우 크기(Window size)가 1024일 경우, index는 1~1024내에서 결정된다.
그리고, 이 때 실제 주파수의 범위(FR)는 (수학식 2)에 의해 결정된다.
따라서, 피아노의 C3 노트를 FFT 분석한 결과 기본 주파수에 대한 피크의 index가 '7'인 경우, 그 값과 상기 조건들을 (수학식 1) 및 (수학식 2)에 대입하여 index가 '7'인 경우 즉 7번째 주파수에 대한 주파수 변환 결과 및 실제 주파수의 범위를 구하면 다음과 같다.
(수학식 3)은 주파수 변환 결과에 대한 계산 결과를 나타내고, (수학식 4)는 그 오차범위에 대한 계산 결과를 나타낸다.
따라서, 상기 조건에 의해 임의의 디지털 신호에 대한 FFT 변환결과 후보 주파수는 139.96 Hz(129.19~150.73)이 되고, 그 후보 주파수의 오차범위(R1)는 그 주파수의 범위(FRFFT)에 의해 21.53 Hz((150.73-129.19))이 된다.
한편, 이러한 오차범위(R1)에 의한 자기상관범위(L1)는 (수학식 5)에 의해 계산할 수 있다.
상기 예의 경우 주파수 범위의 최대 주파수는 150.73 Hz이고, 최소 주파수는 129.19 Hz 이므로, 이들 값을 (수학식 5)에 적용하여 계산할 경우 상기 예에 대한 자기상관 범위(L1)는 (수학식 6)과 같다.
즉, 상기 예의 경우 자기상관범위는 147 ~ 171이 된다.
한편, 자기상관에 의한 오차범위(R2)는 래그(Lag)값에 의해 변동되는데, 자기상관에 의해 도출되는 주파수의 범위(FRCOR)는 (수학식 7)에 의해 계산할 수 있다.
따라서, 상기 자기상관범위에 해당되는 래그값들(147-171) 중 가장 낮은 래그의 값이 가장 큰 주파수의 범위를 가지게 된다. 래그가 147일 때의 주파수의 범위는 (수학식 8)과 같다.
따라서, 상기 조건에 의해 래그가 147 ~ 171일 때의 디지털 신호에 대한 자기상관 결과 도출되는 가장 큰 오차를 가지는 주파수의 범위는 (150.51 ~ 149.49)Hz 가 되고, 그 주파수의 오차범위(R2)는 그 주파수의 범위(FRCOR)에 의해1.02 Hz(150.51-149.49)이 된다.
즉, 자기상관 결과의 오차범위(R2, 1.02 Hz)가 주파수 변환 결과의 오차범위(R1, 21.53 Hz)이하임을 알 수 있다. 따라서, 이 경우 자기상관을 적용하여 피치를 도출하게 되는 것이다.
만약, 자기상관 결과의 오차범위(R2)가 주파수 변환 결과의 오차범위(R1) 보다 클 경우는 자기상관을 수행하지 않고 주파수 변환 결과 값을 피치로 결정한다.
즉, 다시 말하면 주파수 변환 결과의 오차범위 내에서 피치 주파수를 결정한다.
이들 값들은 새로운 음이 입력되어 이들에 대한 피치를 검출하는 것이 요구될 때마다 실시간으로 산출할 수도 있고, 미리 설정된 샘플링 비율(Sampling Rate) 및 FFT 변환을 위한 윈도우의 크기(FFT Window Size)에 의해 사전에 미리 계산하여 별도의 저장 장치에 저장하는 것도 가능하다.
도 3a 내지 도 3d는 본 발명의 2-단계 피치 판단 방법을 설명하기 위한 예시적인 파형도이다.
도 3a는 외부로부터 입력되는 웨이브(wave) 파형을 나타내고, 도 3b는 도 3a에 나타난 웨이브 파형을 자기상관하여 나타난 결과를 나타내고, 도 3c는 도 3a에 나타난 웨이브 파형에 대한 주파수 분석 결과를 나타내고, 도 3d는 도 3a에 대한 주파수 분석 결과 결정된 자기상관범위에 대한 자기상관 결과를 나타낸다.
즉, 도 3b는 외부로부터 입력된 파형 전체에 대한 자기상관 결과를 나타내는 도면으로서, 이 경우 래그 타임이 100 ~ 200 인 지점의 최고 피크 위치가 실제 피치임에도 불구하고, 래그 타임이 0 ~ 100 인 지점에서 최고 피크치를 나타내는 지점 또는 래그 타임이 300 ~ 400 인 지점에서 최고 피크치를 나타내는 지점을 피치로 판별하는 오류를 범하게 된다.
한편, 도 3c는 외부로부터 입력된 파형에 대한 주파수 분석 결과를 나타내는 도면으로서, 이 경우에는 두 번째 피크가 피치임에도 불구하고, 해당 피치의 2배수 하모닉 주파수인 네 번째 피크를 피치로 판독하는 오류를 범하게 된다.
도 3d는 본 발명의 실시예에 의해 주파수 분석 결과에 의해 결정된 자기상관범위(즉, 래그 타임)에 대하여 자기 상관을 수행한 결과를 나타내는 도면으로서, 이 경우 정확한 피치를 판독할 수 있다.
특히, 도 3c와 도 3d를 참조하면, 피아노의 C3음인 경우에 가장 큰 피크의 FFT Index는 7이며 래그가 171인 경우에 가장 큰 자기 상관치를 가지며, 그 래그값을 (수학식 7)에 대입할 경우 해당 주파수의 범위는 128.57~129.32 Hz임을 알 수 있다. 한편, (수학식 3)에 의해 상기 피아노 C3음에 대한 FFT 결과에 의한 주파수 범위는 129.19~150.73 Hz이다. 따라서, 피아노 C3음에 대한 FFT 결과의 주파수 범위와 자기상관 결과의 주파수 범위의 교집합을 구하면, 최종 피치의 범위는 129.19~129.32 Hz이다.
이 때, FFT 결과의 주파수 범위와 자기상관 결과의 주파수범위에 대한 교집합을 구하는 것은 자기상관시 참조된 래그값이 그 래그범위(147~171)의 상한값이기 때문이다.
상기 예의 경우는 미디노트 C3에서의 기본 주파수가 130.8Hz라는 것을 감안할 때, 사용된 피아노의 튜닝(tuning)이 조금 낮게 되어 있다는 것을 알 수 있으며, 보통 이러한 피아노의 튜닝에서의 오차로 인해 피아노의 노트의 기본 주파수가 미디노트에서의 기본 주파수와 어느 정도 차이가 나는 것은 일반적이다. 따라서, 본 발명에 의한 피치도출시 이와 같이 정확한 결과값을 얻을 수 있는 것이다.
이상의 설명은 하나의 실시예를 설명한 것에 불과한 것으로서, 본 발명은 상술한 실시예에 한정되지 않으며 첨부한 특허청구범위 내에서 다양하게 변경 가능하다. 예를 들어 본 발명의 실시예에 구체적으로 나타난 각 구성 요소의 형상 및 구조는 변형하여 실시할 수 있다.
상기와 같은 본 발명의 2-단계 피치 판단 방법 및 장치는 외부에서 입력되는 디지털 신호에 대하여 주파수 분석을 한 후, 그 주파수 분석 결과에 의해 선택된 소정의 시간영역에 대한 자기상관을 선택적으로 수행하도록 함으로써, 저주파 대역에서 오차에 의한 피치 도출 오류가 큰 주파수 분석 방법의 단점과, 고주파 대역에서 오차가 큰 자기상관 방법의 단점을 해결하여, 보다 정확한 피치를 도출할 수 있다는 효과가 있다.
또한, 자기상관 수행시 샘플 크기의 전체 디지털 신호에 대한 자기상관계수를 모두 구하여 그 값을 비교하는 것이 아니고 주파수 분석 결과에 의해 선택된 소정 시간영역에 대한 자기상관계수를 구한 후 그 값을 비교하도록 함으로써, 자기상관계수를 구하고 그 들 중 최대값을 구하는 데 소요되는 시간을 줄일 수 있다는 부수적인 효과도 있다.

Claims (13)

  1. 외부에서 입력되는 디지털 신호를 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 제1 피치후보를 도출하는 제1 과정과,
    상기 제1 피치후보의 오차범위와, 상기 제1 피치후보의 오차범위에 의해 산출된 자기상관범위에 대한 자기상관 결과의 오차범위를 비교하는 제2 과정과,
    상기 비교 결과 자기상관 결과의 오차범위가 피치후보의 오차범위 이하인 경우, 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 피치를 도출하는 제3 과정을 포함하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  2. 제1항에 있어서, 상기 제2 과정은
    상기 제1 피치후보의 오차범위를 산출하는 제2-1 과정과,
    상기 제1 피치후보의 오차범위에 의해 상기 디지털 신호에 대한 자기상관범위를 산출하는 제2-2 과정과,
    상기 자기상관범위에 대한 자기상관 결과의 오차범위를 산출하는 제2-3 과정과,
    상기 제1 피치후보의 오차범위와 상기 자기상관 결과의 오차범위를 비교하는 제2-4 과정을 포함하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  3. 제1항 또는 제2항에 있어서, 상기 제2 과정은
    사전에 계산되어 분류 저장된 정보에 의거하여, 주파수 분석에 의해 결정된 모든 주파수들에 대한 오차범위와, 그 오차범위에 의한 자기상관범위 및 그 자기상관 결과값을 도출하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  4. 제1항에 있어서, 상기 제3 과정은
    상기 제2 과정에서 산출된 자기상관범위에 의해 결정된 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하는 제3-1 과정과,
    상기 자기상관 수행 결과 자기상관계수가 최고인 래그(Lag)를 도출하는 제3-2 과정과,
    상기 래그(Lag)에 의해 해당 디지털 신호에 대한 제2 피치후보를 도출한 후, 그 제2 피치후보로부터 피치를 도출하는 제3-3 과정을 포함하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  5. 제4항에 있어서, 상기 제3-1 과정은
    상기 디지털 신호에 대한 자기상관을 위한 시간영역을 소정 범위내에서 변동하여 적용하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  6. 제4항에 있어서, 상기 제3-3 과정은
    상기 제3-2 과정에서 도출된 래그(Lag)가 상기 제2 과정에서 산출된 자기상관 범위의 상한값 또는 하한값인 경우 경우, 상기 제2 피치후보의 오차범위와 상기제1 피치후보의 오차범위의 교집합 영역에서 피치를 결정하고, 그렇지 않은 경우 상기 제2 피치후보의 오차범위에서 피치를 결정하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  7. 제1항 또는 제4항 또는 제5항 또는 제6항에 있어서, 상기 제3 과정은
    상기 제2 과정의 비교결과 자기상관 결과의 오차범위가 제1 피치후보의 오차범위 보다 큰 경우 상기 제1 피치후보의 오차범위 영역에서 피치를 결정하는 것을 특징으로 하는 2-단계 피치 판단 방법.
  8. 외부에서 입력되는 디지털 신호를 주파수 성분으로 분해한 후, 그 주파수 성분값들에 의거하여 제1 피치후보를 도출하는 주파수 분석부와,
    상기 제1 피치후보의 오차범위와, 상기 제1 피치후보의 오차범위에 의해 산출된 자기상관범위에 대한 자기상관 결과의 오차범위를 비교하는 오차범위 비교부와,
    상기 오차범위 비교부의 비교 결과, 상기 자기상관 결과의 오차범위가 상기 제1 피치후보의 오차범위 이하인 경우 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여 제2 피치후보를 도출하는 자기상관 계산부와,
    상기 제1 피치후보의 오차범위 및 상기 제2 피치후보의 오차범위에 의거하여 피치를 결정하는 피치 결정부와,
    상기 피치 결정부에서 결정된 피치를 출력하는 결과 출력부를 포함하는 것을특징으로 하는 2-단계 피치 판단 장치.
  9. 제8항에 있어서, 상기 오차범위 비교부는
    사전에 계산되어 분류 저장된 정보에 의거하여, 주파수 분석에 의해 결정된 모든 주파수들에 대한 오차범위와, 그 오차범위에 의한 자기상관범위 및 그 자기상관 결과값을 도출하는 것을 특징으로 하는 2-단계 피치 판단 장치.
  10. 제8항에 있어서, 상기 자기상관 계산부는
    상기 오차범위 비교부에서 산출된 자기상관범위에 의해 결정된 상기 디지털 신호의 소정 시간영역에 대한 자기상관을 수행하여, 자기상관계수가 최고인 래그(Lag)를 도출한 후, 그 래그(Lag)에 의해 해당 디지털 신호에 대한 제2 피치후보를 도출하는 것을 특징으로 하는 2-단계 피치 판단 장치.
  11. 제10항에 있어서, 상기 자기상관 계산부는
    상기 디지털 신호의 자기상관범위를 소정 범위내에서 변동 적용하는 것을 특징으로 하는 2-단계 피치 판단 장치.
  12. 제8항에 있어서, 상기 피치 결정부는
    상기 오차범위 비교부의 비교 결과, 상기 자기상관 결과의 오차범위가 상기 제1 피치후보의 오차범위 이하인 경우, 상기 제1 피치후보 및 제2 피치후보에 의거하여 피치를 결정하고,
    상기 오차범위 비교부의 비교 결과, 상기 자기상관 결과의 오차범위가 상기 제1 피치후보의 오차범위 보다 큰 경우, 상기 제1 피치후보의 오차범위 내에서 피치를 결정하는 것을 특징으로 하는 2-단계 피치 판단 장치.
  13. 제8항 또는 제10항 또는 제12항에 있어서, 상기 피치 결정부는
    자기상관계수가 최고인 래그(Lag)가 상기 오차범위 비교부에서 산출된 자기상관범위의 상한값 또는 하한값인 경우, 상기 제2 피치후보의 오차범위와 상기 제1 피치후보의 오차범위의 교집합 영역에서 피치를 결정하고, 그렇지 않은 경우 상기 제2 피치후보의 오차범위에서 피치를 결정하는 것을 특징으로 하는 2-단계 피치 판단 장치.
KR10-2001-0045563A 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치 KR100393899B1 (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR10-2001-0045563A KR100393899B1 (ko) 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치
AT02758908T ATE338330T1 (de) 2001-07-27 2002-07-26 Verfahren und vorrichtung zur zweiphasen- grundfrequenzdetektion
PCT/KR2002/001423 WO2003017250A1 (en) 2001-07-27 2002-07-26 2-phase pitch detection method and appartus
CN028172248A CN1216362C (zh) 2001-07-27 2002-07-26 2阶段音调检测方法和装置
US10/485,001 US7012186B2 (en) 2001-07-27 2002-07-26 2-phase pitch detection method and apparatus
DE60214409T DE60214409T2 (de) 2001-07-27 2002-07-26 Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion
EP02758908A EP1436805B1 (en) 2001-07-27 2002-07-26 2-phase pitch detection method and appartus
JP2003522079A JP4217616B2 (ja) 2001-07-27 2002-07-26 二段階ピッチ判断方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0045563A KR100393899B1 (ko) 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20030010898A KR20030010898A (ko) 2003-02-06
KR100393899B1 true KR100393899B1 (ko) 2003-08-09

Family

ID=19712642

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0045563A KR100393899B1 (ko) 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치

Country Status (8)

Country Link
US (1) US7012186B2 (ko)
EP (1) EP1436805B1 (ko)
JP (1) JP4217616B2 (ko)
KR (1) KR100393899B1 (ko)
CN (1) CN1216362C (ko)
AT (1) ATE338330T1 (ko)
DE (1) DE60214409T2 (ko)
WO (1) WO2003017250A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738370B2 (en) * 2005-06-09 2014-05-27 Agi Inc. Speech analyzer detecting pitch frequency, speech analyzing method, and speech analyzing program
US7563975B2 (en) * 2005-09-14 2009-07-21 Mattel, Inc. Music production system
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8666734B2 (en) 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
WO2013096900A1 (en) 2011-12-21 2013-06-27 Huawei Technologies Co., Ltd. Very short pitch detection and coding
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
US10249209B2 (en) * 2017-06-12 2019-04-02 Harmony Helper, LLC Real-time pitch detection for creating, practicing and sharing of musical harmonies
US11282407B2 (en) 2017-06-12 2022-03-22 Harmony Helper, LLC Teaching vocal harmonies
CN109813264A (zh) * 2019-02-21 2019-05-28 重庆潍柴发动机有限公司 测量结果误差评估的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JPH0736491A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd ピッチ抽出装置
US5864795A (en) * 1996-02-20 1999-01-26 Advanced Micro Devices, Inc. System and method for error correction in a correlation-based pitch estimator
KR100225687B1 (ko) * 1990-09-20 1999-10-15 존 씨. 하드웍 음성 분석 및 음성 합성 방법
WO2000025298A1 (en) * 1998-10-27 2000-05-04 Voiceage Corporation A method and device for adaptive bandwidth pitch search in coding wideband signals

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2940835B2 (ja) * 1991-03-18 1999-08-25 日本電信電話株式会社 ピッチ周波数差分特徴量抽出法
US5619004A (en) * 1995-06-07 1997-04-08 Virtual Dsp Corporation Method and device for determining the primary pitch of a music signal
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
KR100269216B1 (ko) 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US6124544A (en) * 1999-07-30 2000-09-26 Lyrrus Inc. Electronic music system for detecting pitch
US6917912B2 (en) * 2001-04-24 2005-07-12 Microsoft Corporation Method and apparatus for tracking pitch in audio analysis
US6653546B2 (en) * 2001-10-03 2003-11-25 Alto Research, Llc Voice-controlled electronic musical instrument

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100225687B1 (ko) * 1990-09-20 1999-10-15 존 씨. 하드웍 음성 분석 및 음성 합성 방법
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JPH0736491A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd ピッチ抽出装置
US5864795A (en) * 1996-02-20 1999-01-26 Advanced Micro Devices, Inc. System and method for error correction in a correlation-based pitch estimator
WO2000025298A1 (en) * 1998-10-27 2000-05-04 Voiceage Corporation A method and device for adaptive bandwidth pitch search in coding wideband signals

Also Published As

Publication number Publication date
CN1216362C (zh) 2005-08-24
US7012186B2 (en) 2006-03-14
JP2005503580A (ja) 2005-02-03
EP1436805B1 (en) 2006-08-30
US20040159220A1 (en) 2004-08-19
EP1436805A1 (en) 2004-07-14
JP4217616B2 (ja) 2009-02-04
EP1436805A4 (en) 2005-06-01
WO2003017250A1 (en) 2003-02-27
ATE338330T1 (de) 2006-09-15
DE60214409T2 (de) 2007-09-20
KR20030010898A (ko) 2003-02-06
DE60214409D1 (de) 2006-10-12
CN1552058A (zh) 2004-12-01

Similar Documents

Publication Publication Date Title
McLeod et al. A smarter way to find pitch
Sukhostat et al. A comparative analysis of pitch detection methods under the influence of different noise conditions
US7493254B2 (en) Pitch determination method and apparatus using spectral analysis
KR20030064733A (ko) 피치 주파수 추정 방법 및 장치 및 컴퓨터 소프트웨어 제품
US20040133424A1 (en) Processing speech signals
KR100393899B1 (ko) 2-단계 피치 판단 방법 및 장치
CN107210029B (zh) 用于处理一连串信号以进行复调音符辨识的方法和装置
KR100766170B1 (ko) 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법
Coyle et al. Onset detection using comb filters
US20060150805A1 (en) Method of automatically detecting vibrato in music
CN111599345B (zh) 语音识别算法评估方法、系统、移动终端及存储介质
Benetos et al. Auditory spectrum-based pitched instrument onset detection
KR20050003814A (ko) 음정 인식 장치
Dziubinski et al. Octave error immune and instantaneous pitch detection algorithm
Dziubiński et al. High accuracy and octave error immune pitch detection algorithms
Lao et al. Computationally inexpensive and effective scheme for automatic transcription of polyphonic music
JP3019603B2 (ja) 音声の基本周波数の抽出装置
Sarlin Pitch Detection Algorithms and their application on tom drums
KR100212453B1 (ko) 양자화 오차를 이용한 음성 신호의 피치 검출 방법
Kharvatkar et al. Detection of Pitch Frequency of Indian Classical Music Based on Hilbert-Huang Transform for Automatic Note Transcription
Rychlicki-Kicior et al. Multipitch estimation using multiple transformation analysis
Wang et al. Extraction of Timbre Features of Ethnic Plucked Instruments
KR20150084332A (ko) 클라이언트 단말기의 음정인식기능 및 이를 이용한 음악컨텐츠제작 시스템
NSKI et al. High accuracy and octave error immune pitch detection algorithms
Vinod et al. A Comprehensive Review of Fourier Series Applications in Music Theory and Practice

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110720

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee