KR100188381B1 - 디지탈 신호 인코딩 장치 - Google Patents
디지탈 신호 인코딩 장치 Download PDFInfo
- Publication number
- KR100188381B1 KR100188381B1 KR1019910008405A KR910008405A KR100188381B1 KR 100188381 B1 KR100188381 B1 KR 100188381B1 KR 1019910008405 A KR1019910008405 A KR 1019910008405A KR 910008405 A KR910008405 A KR 910008405A KR 100188381 B1 KR100188381 B1 KR 100188381B1
- Authority
- KR
- South Korea
- Prior art keywords
- digital signal
- noise level
- band
- signal
- encoding apparatus
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M9/00—Parallel/series conversion or vice versa
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/007—Transform coding, e.g. discrete cosine transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Discrete Mathematics (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
본 발명은 디지탈 신호 인코딩 장치에 관한 것으로서, 입력 디지탈 신호는 대역폭이 고주파의 주파수 대역을 향해 더 넓어지게 되도록 다수의 주파수 대역으로 분할된 주파수 범위를 갖고 있으며, 한 대역씩 에너지에 근거한 제1허용가능 잡음 레벨과 고려중인 주파수 대역의 신호에 적시에 인접한 신호의 에너지를 근거로한 제2허용가능 잡음 레벨이 셋트되고, 각 주파수 대역의 신호 성분은 제1및 제2잡음 레벨로부터 합성된 출려과 각 주파수 대역의 에너지 사이의 차의 레벨에 대응하는 비트 수로 양자화된다. 이런 방식으로, 음질에서의 왜곡이 최소로되면서 비트 비율이 저하될 수 있다.
Description
제1도는 오디오 신호의 스펙트럼을 도시하는 도면.
제2도는 일시적 마스킹을 도시하는 도면.
제3도는 본 발명의 한 실시예에 따른 디지탈 신호 인코딩 장치의 구성을 도시하는 블럭 회로도.
제4도는 임계 대역을 도시하는 도면.
제5도는 버크(Burke)스펙트럼을 도시하는 도면.
제6도는 필터 회로를 도시하는 회로도.
제7도는 마스킹 스펙트럼을 도시하는 도면.
제8도는 최소 가청 곡선과 마스킹 스펙트럼의 합성을 도시하는 도면.
제9도는 변형된 실시예의 구성을 도시하는 블럭 회로도.
제10도는 주파수 도메인과 시간 도메인의 해상도를 도시하는 도면.
* 도면의 주요부분에 대한 부호의 설명
12 : 진폭 위상 정보 발생 회로 13 : 대역 분할 회로
14 : 합계 검출 회로 15 : 필터
16 : 감산 회로 17 : 분할 회로
18 : 합성 회로 21 : 지연 회로
24 : 양자화 회로
본 발명은 입력 디지탈 신호를 인코딩하기 위한 장치에 관한 것이다.
오디오 또는 보이스 신호의 고효율 인코딩을 위해 오디오 또는 보이스 신호와 같은 입력 신호가 시간축이나 또는 주파수 축상에서 다수의 채널로 분할되고 다수의 비트가 각 채널에 적응하여 할당되는 적응형 비트 할당에 의한 인코딩 기술이 알려져 있다. 적응형 비트 할당에 의한 오디오 신호의 인코딩 기술중에는, 시간축상의 오디오 신호가 인코딩을 위한 다수의 주파수 대역으로 분할되는 서브-밴드 인코딩(sub-band encoding : SBC)과, 시간축상의 신호가 직교 변환에 의해 주파수 축상의 신호로 변환되고 다수의 주파수 대역으로 분할되어 각 대역에서 적응형 신호 인코딩이 수행되는 적응형 변환 코딩(adaptive transform coding: ATC) 및, 시간축상의 신호가 주파수 대역으로 분할되고 각 대역의 신호가 기초대역 신호로 변환되어 n 차(여기서, n은 2 이상의 정수)선형 예측(predictive)분석에 의해 예측적으로 인코딩되도록 서브-밴드 인코딩과 적응형 변환 인코딩이 결합되어 있는 소위 적응형 비트 코딩(adaptive bit coding : APC-AB)이 있다.
고효율 인코딩 분야에서, 사람의 청각의 소위 마스킹 특성이 고려된 고효율 인코딩 기술이 널리 채택되어져 왔다. 마스킹 효과는 한 신호가 다른 신호에 의해 마스크되어 들리지 않게 되는 현상을 의미한다. 마스킹 효과는 시간축상의 오디오 신호에 대한 효과와 주파수 축상의 신호에 대한 효과로 분류된다.
주파수 축상의 오디오 신호에 대한 마스킹 효과를 설명하면, 주파수 fs를 가진 사인파 Ws의 경우에 사람의 청각에 의한 마스킹 효과를 나타내는 마스킹 스펙트럼 또는 마스킹 곡선 MS이 제1도에 도시되어 있다. 이 마스킹 스렉트럼 MS 에 의해 빗줄친 영역이 마스크된다. 그러므로, 만일 있다면 마스킹 스펙트럼 MS 내의 잡음은 들리지 않게 되며, 그래서 실제 오디오 신호에 있어 마스킹 스펙트럼 MS 내의 어떤 잡음도 허용될 수 있다. 그러므로 사인파 Ws의 경우에 허용 가능한 잡음 레벨은 제9도에서 j로 도시된 레벨 이하가 된다. 또한 마스킹 효과는 사인파 Ws의 주파수 fs에서 최대가 되며, 사인파 Ws의 주파수 fs로부터 더많이 주파수가 이동될수록 낮아지게 된다.
시간축상의 오디오 신호에 대한 마스킹은 일시적(temporal) 마스킹과 동시적(concurrent)마스킹으로 분류된다. 동시적 마스킹은 큰 음향(sound)과 동시에 발생되는 작은 음향(또는 잡음)이 큰 음향에 의해 마스크되어 들리지 않게 되는 효과를 의미한다. 일시적 마스킹은 제2도에 도시된 바와 같이, 큰 음향(도면에서 고레벨 신호 부분C)전후의 작은 음향 또는 잡음이 큰 음향에 의해 마스크되어 들리지 않게 되는 효과를 의미한다. 일시적 마스킹에 있어서, 큰 음향 후의 음향의 마스킹은 순방향 마스킹으로 불리고 큰 음향 전의 음향의 마스킹은 역방향 마스킹으로 불린다. 일시적 마스킹에서, 제2도의 순방향 마스킹 FM의 효과는 긴 시간 동안(예를 들어 100msec 정도)지속되지만, 역방향 마스킹 BM의 효과는 사람의 청각 특성으로 인해 짧은 지속기간(예를 들어, 5msec 정도)을 갖는다. 마스킹 레벨 또는 마스킹 양은 순방향 마스킹에 있어서는 20dB정도가 되어 역방향 마스킹에 대해서는 30dB 정도가 된다.
한편, 전술한 고효율 인코딩에 있어서, 비트 압축 비율 L 또는 비트 축소량에서의 더이상의 증가를 실현하는 것이 바람직하다. 그러나, 전술한 마스킹 효과의 장점을 취함으로써 비트 압축이 실현되는 고효율 인코딩에 있어서는, 주파수 축상의 신호에 대한 마스킹 효과나 또는 시간축상의 신호에 대한 마스킹 효과중 오직 하나만이 고려되는데, 즉, 두가지 마스킹 효과 모두를 동시에 고려하기 위한 시도가 이루어지지 않고 있다.
그러므로 본 발명의 목적은 비트 축소량에서의 증가를 실현하거나 비트 비율을 낮추기 위해 주파수 축상의 신호의 마스킹 효과와 시간축상의 신호의 마스킹 효과 모두가 효과적으로 이용되는 디지탈 신호 인코딩 장치를 제공하는 것이다.
본 발명의 다른 목적은 음질에서의 왜곡이 낮은 비트 비율에도 불구하고 최소로될 수 있는 디지탈 신호 인코딩 장치를 제공하는 것이다.
전술한 목적을 수행하기 위해, 본 발명은, 입력 디지탈 신호가 인가되도록 되어 있으며 상기 입력 디지탈 신호의 주파수 범위를 다수의 주파수 대역으로 분할하기에 적합하게 되어 있는 분할 수단과, 각 주파수 대역의 에너지를 기초로하여 각 주파수 대역의 제1허용 가능 잡음 레벨을 셋팅하기 위한 제1잡음 레벨 셋팅 수단과, 양자화를 위한 고려중인 주파수 대역의 신호에 시간적으로 인접한 신호의 에너지를 기초로하여 각 주파수 대역의 제2허용가능 잡음 레벨을 셋팅하기 위한 제2잡음 레벨 셋팅 수단과, 제1 및 제2허용가능 잡음 레벨을 합성하기 위한 합성 수단 및, 각 주파수 대역의 에너지와 상기 합성 수단의 출력 사이의 차의 레벨에 대응하는 비트 수로 각 주파수 대역의 신호 성분을 양자화하기 위한 수단을 구비하고 있는, 입력 디지탈 신호를 인코딩하기 위한 디지탈 신호 인코딩 장치를 제공한다.
본 발명에 따르면, 주파수 축상의 마스킹을 고려한 허용가능 잡음 레벨은 양자화를 위한 고려중인 주파수 대역의 신호에 대해 제1잡음 레벨 셋팅 수단에 의해 셋트되고, 고려중인 주파수 대역의 신호에 시간적으로 인접한 신호에 대한 마스킹을 고려한 다른 허용가능 잡음 레벨은 양자화를 위한 고려중인 주파수 대역의 동일 신호에 대해 제2잡음 레벨 셋팅 수단에 의해 셋트된다.
본 발명의 디지탈 신호 인코딩 장치에 있어서, 입력 디지탈 신호의 주파수 범위는 보다높은 주파수의 주파수 대역쪽을 통해 대역폭이 넓어지도록 다수의 주파수 대역으로 분할된다. 제1허용가능 잡음 레벨은 각 주파수 대역의 에너지를 기초로하여 한 주파수 대역으로부터 다른 주파수 대역으로 셋트되며, 제2허용가능 잡음 레벨은 양자화를 위해 고려중에 있는 대역의 신호에 시간적으로 인접한 신호의 에너지를 기초로하여 셋트된다. 각 주파수 대역의 신호 성분은 제1및 제2허용가능 잡음 레벨의 합계 출력과 각 주파수 대역의 에너지 사이의 차의 레벨에 대응하는 수로 양자화 된다.
이와 같은 방식으로, 비트수가 감소된다 할지라도 음질의 왜곡를 최소화시키면서 비트 축소의 정도를 증가시키거나 비트 비율을 낮추기 위해 주파수 축상의 고려중인 주파수 대역의 신호에 대한 마스킹 효과와 시간축상의 신호에 대한 마스킹 효과 모두가 효과적으로 이용될 수 있다.
첨부 도면을 참조하여, 본 발명의 실시예가 상세하게 설명되게 된다.
제3도를 참조하면, 본 발명에 따른 디지탈 신호 인코딩 장치는 대역-분할 회로(13)와, 합계 검출 회로(14), 필터(15), 감산 회로(16), 분할 회로(17) 및, 합성 회로(18)를 포함하고 있는데, 이들 회로는 보다 높은 주파수의 주파수 대역쪽을 향해 대역폭이 더 넓어지게 되도록 압력 디지탈 신호를 다수의 주파수 대역으로 분할하고 각 대역의 에너지를 기초로하여 한 대역씩 제1허용가능 잡음 레벨을 세팅하기 위한 제1잡음 레벨 셋팅 수단으로서 연대하여 동작한다. 또한 디지탈 신호 인코딩 장치는 메모리(51, 52)와 계수 증배 유니트(53, 54) 및 합성 회로(55)를 포함하고 있는데, 이들 회로는 양자화하기 위한 고려중인 주파수의 신호에 시간적으로 인접한 신호의 에너지를 기초로하여 제2허용가능 잡음 레벨을 셋팅 하기 위한 제2잡음 레벨 셋팅 수단으로서 연대하여 동작한다. 상기 신호 인코딩 장치는 또한 제1 및 제2잡음 레벨 셋팅 수단의 허용가능 잡음 레벨을 합성하기 위한 합성 수단으로서의 합성 회로(50)와, 각 주파수 대역의 에너지와 합성 회로(56)로 부터의 출력 사이의 차의 레벨에 대응하는 비트수로 각 주파수 대역의 신호 성분을 양자화하기 위한 양자화 회로(24)를 포함하고 있다. 그러므로, 본 장치에 있어서, 주파수 축에 대한 마스킹을 고려하는 최소 가청 곡선을 고려한 제1허용가능 잡음 레벨은 양자화를 위한 고려중인 주파수 대역의 신호에 대해 제1 잡음 레벨 셋팅 수단에 의해 셋트되며, 고려중인 주파수 대역의 신호에 시간적으로 인접한 신호에 의한 일시적 마스킹을 고려한 제2 허용가능 잡음 레벨은 고려중인 주파수 대역의 동일신호에 대해 제2 잡음 레벨 셋팅 수단에 의해 셋트된다. 양자화 회로(24)로부터의 양자화 출력은 본 디지탈 신호 인코딩 장치의 출력 단자(2)에서 버퍼 메모리(25)를 통해 출력된다.
제3도에 도시된 본 인코딩 장치에서는 예를들어 오디오 신호가 시간 축상의 신호를 주파수 축상의 신호로 변환시키기 위해 FFT(fast Fourrier transform)에 의해 처리되고 주파수 축상의 그 생성 신호는 인코드되거나 재양자화되는 적응형 변환 인코딩(ATC)이 사용된다. 특히, 제3도를 참조하면, 시간축상의 신호인 오디오 신호는 입력 단자(1)에 공급되어 FFT 회로(11)로 전송된다. FFT 회로(11)에서, 시간축 상의 오디오 신호는 실수 성분 Re과 허수 성분 Im으로 각각 이루어진 FFT 계수를 발생하기 위해 소정의 시간 간격, 예를들어 매 512 샘플마다 주파수 축상의 신호로 변환된다. 이들 FFT 계수는 진폭 위상 정보로 발생 회로(12)로 전송되는데, 여기서는 실수 성분 Re과 허수 성분 Im으로부터 진폭 값 Am과 위상값이 만들어되며, 진폭 값 Am의 정보는 본 장치에 입력 다지탈 신호로서 입력된다. 일반적으로 사람의 청각은 위상에는 다소 둔감하다할지라도 주파수 도메인에서의 전력에 대한 진폭에는 민감하다는 것을 주목하자, 이런 관점에서 전술한 입력 디지탈 신호로서 오직 진폭 값 Am만이 진폭 위상 정보 발생 회로(12)의 출력으로부터 취해진다.
이렇게 해서 발생된 진폭 값 Am의 입력 디지탈 신호는 대역-분할 회로(13)로 전송되며, 여기서 진폭 값 Am으로 표현된 입력 디지탈 신호는 예를들어 소위 임계(critical)대역으로 분할된다. 임계 대역은 사람의 청각 특성 또는 주파수-분석 능력을 고려한 것이다. 그러므로 0-24㎑의 주파수 범위는 대역의 대역폭이 보다 높은 주파수 대역 방향으로 더 넓어지게 되도록 24 주파수 대역으로 분할된다. 사람의 청각은 일종의 대역통과 필터의 특성을 갖고 있으며 필터에 의해 분할된 주파수 범위의 대역은 제4도에 도시된 임계 대역으로 불린다는 것을 주목하자. 제4도에서, 임계 대역의 수는 12이며, 대역은 B1내지 B12로 불린다.
대역-분할 회로(13)에서 얻어진, 예를들어 24 임계 대역과 같은, 임계 대역에 대한 진폭 값 Am은 합계 검출 회로(14)에 전송되며, 여기서 각 대역의 진폭 값의 합계(진폭 값 Am의 피크 값 또는 평균 값이나, 각 대역의 에너지 합계)를 취함으로써 각 대역의 에너지나 스펙트럼 강도가 구해진다. 대역의 합계의 스펙트럼이 되는 합계 검출 회로(14)의 출력은 일반적으로 버크(Burke)스펙트럼으로 불리며, 그 값은 예를들어 제5도에 도시되어 있다.
마스킹에 대한 버크 스펙트럼의 효과를 고려하기 위해, 소정의 가중 함수가 버크 스펙트럼에 대해 컨벌브된다(convolution). 이런 취지로, 버크 스펙트럼 SB의 값이 되는 합계 검출 회로(14)의 출력은 예를들어 512 샘플로 각각 이루어진 합계 검출 회로(14)의 출력은 판독 및/또는 기록하는 메모리(51)를 이용하여 필터 회로(15)에 전송된다. 필터 회로(15)는 입력 데이타를 순차적으로 지연시키기 위한 지연(Z-1) 소자(101m-1내지 101m+3)와, 지연 소자로부터의 출력을 필터 계수(가중 함수)로 증배시키기 위한 증배 유니트(102m-3내지 102m+3) 및, 합산 회로(104)로 구성된다. 특히, 지연 소자의 출력은 버크 스펙트럼 SB의 컨벌류션을 수행함으로써, 예를들어 필터 계수 0.0000086, 0.0019, 0.15, 1, 0.4, 0.06, 0.007로 증배 유니트(102m-3내지 102m+3)에서 각각 증배된다. 이와 같은 컨벌루션에 의해, 제5도에서 점선으로 도시된 바와 같이 고려중인 버크 스펙트럼의 값에 대한 버크 스펙트럼의 인접한 값으로부터의 효과의 합계가 합산 회로(104)로 부터의 출력으로서 구해지며, 컨벌루션의 결과는 출력 단자(105)에서 출력된다.
한편, 만일 버크 스펙트럼 SB의 마스킹 스펙트럼(허용 가능한 잡음 스펙트럼)을 계산하기 위해 이용되는 제1허용가능 잡음 레벨에 대응하는 레벨 α가 낮으면(low), 주파수 축상의 신호에 관한 마스킹 스펙트럼 또는 마스킹 곡선도 또한 낮으며, 그래서 양자화 회로(24)에 의한 양자화를 위해 할당된 비트수를 증가시킬 필요가 있게 된다. 역으로, 만일 레벨 α가 높으면, 마스킹 스펙트럼이 증가되며, 그래서 양자화를 위해 할당된 비트수를 축소시키는 것이 가능해진다. 레벨 α는 후술되게 되는 디컨벌루션(deconvolution)시 각 임계 대역에 대한 상기 제1 허용가능 잡음 레벨이 되는 잡음 레벨이라는 것을 주목하자. 일반적으로, 오디오 신호의 스펙트럼 강도 또는 에너지는 고주파 범위에서 낮아진다. 이것을 염두에 두고, 고주파 범위에 할당된 비트수를 축소시키기 위해 낮은 에너지 값을 가진 고주파 범위를 향해 더 높아지도록 레벨 α가 셋트된다. 그러므로, 제1잡음 레벨 셋팅 수단에서, 레벨 α는 고주파수의 임계 대역에 대한 동일한 에너지 값에 대해 더 높아지게 되도록 셋트된다.
본 인코딩 장치는 제1허용가능 잡음 레벨에 대응하는 레벨 α를 계산하고, 고주파 대역쪽을 향해 높아지게 되도록 레벨 α를 제어한다. 이 때문에 필터 회로(15)의 출력은 컨벌브된 영역에서의 레벨 α를 구하기에 적합한 감산기(16)에 공급된다. 이 감산기(16)에는 레벨 α를 구하기 위해 허용 함수(마스킹 레벨을 표현하는 함수)가 공급된다. 레벨 α는 함수 발생 회로(29)로부터 공급되는 허용 함수를 증가 또는 감소시킴으로써 제어된다.
허용가능 잡음 레벨에 대응하는 레벨 α는 공식(1)로 부터 구해질 수 있는데, 여기서 i는 증가 주파수의 순서로 임계 대역에 주어지는 수이다.
공식(1)에서, n과 a는 상수이고, a>0 이며, S는 컨벌루션에 수반되는 버크 스펙트럼의 강도이고, 공식(1)에서 (n-ai)는 허용 함수가 된다. 전술한 바와 같이 전체적으로 비트수를 감소시키기 위해 보다낮은 에너지양을 가진 보다 높은 범위로부터 비트수를 감소시키는 것이 더욱 유익하기 때문에, 값 n과 a는 본 실시예에서 n=38이 되고 a=1이 되도록 셋트되며, 그래서 음질에서의 왜곡없이 만족한 인코딩이 실현될 수 있다.
이런 방식으로 구해진 레벨 α는 분할 유니트(17)에 전송된다. 분할 유니트는 컨벌브된 영역에서 레벨 α를 디컨벌브하는 작용을 한다. 그러므로, 이 디컨벌루션에 의해 레벨 α로부터 마시킹 스펙트럼이 얻어질 수 있다. 즉, 이 마스킹 스펙트럼은 한 대역으로부터 다른 대역까지 구해진 허용 가능 잡음 스펙트럼이 된다. 비록 디컨벌루션은 복잡한 처리 동작이 필요하게 하지만, 본 실시예에서는 간단한 분할 유니트(17)의 이용으로 수행된다.
마스킹 스펙트럼은 합성 회로(18, 56)를 이용하여 감산기(19)에 전송된다. 이 감산기(19)에는 버크 스펙트럼 SB이 되는 합계 검출 회로(14)의 출력이 지연 회로(21)에 의해 공급된다. 그러므로, 마스킹 스펙트럼과 버크 스펙트럼 SB은 감산 동작에 의해 감산기(19)로 처리되며, 그래서 제7도에 도시된 바와 같이, 버크 스펙트럼 SB은 마스킹 스펙트럼 MS로 표시된 레벨보다 낮은 레벨에서 마스크된다.
감산기(19)의 출력은 ROM(20)을 이용하여 양자화 회로(24)에 공급된다. 이 양자화 회로(24)에서는, 지연 회로(23)에 의해 공급된 진폭 Am이 감산기(19)로부터의 출력에 따른 비트수로 양자화된다. 다시말해, 각 주파수 대역의 신호 성분은 각 주파수 대역의 에너지와 합성 회로(56)의 출력 사이의 레벨차에 따라 할당된 비트수로 양자화된다. 한편, 지연 회로(21)는 합성 회로(56)의 각 회로 업스트림에서의 지연을 고려하여 합계 검출 회로(14)로부터의 버크 스펙트럼 SB을 지연시키기 위한 것이며, 지연 회로(23)는 ROM(20)의 각 회로 업스트림에서 야기되는 지연을 고려하여 진폭 Am을 지연시키기 위한 것이다. ROM(20)은 양자화 회로(24)에서의 양자화를 위해 할당된 비트수의 데이타를 기억하고 감산기(19)의 출력에 따른 할당된 비트수의 데이타를 출력한다.
합성 회로(18)에 의한 합성시, 제8도에 도시된 최소 가청 곡선 발생 회로(22)로부터의 사람의 청각 특성을 나타내는 소위 최소 가청 곡선(동일 큰소리 곡선) RC를 표시하는 데이타와 마스킹 스펙트럼 MS가 합성된다. 이런 방식으로 최소 가청 곡선 RC과 마스킹 스펙트럼 MS를 합성함으로써, 허용가능 잡음 레벨이 도면에서 빗금친 부분으로 표시된 영역의 상부 경계로서 한정될 수 있으며, 그래서 이 영역에 할당된 비트 수가 감소될 수 있다. 한편, 제8도에서, 주파수 범위는 제4도에 도시된 임계 대역으로 분할되었고, 신호 스펙트럼 SS도 동시에 도시되어 있다.
본 디지탈 신호 인코딩 장치에 있어서, 허용가능 잡음 레벨은 증가되고, 할당된 비트 수는 보다 낮은 에너지양을 가진 고주파 쪽을 향해 감소되었으며, 신호 성분은 한 대역에서 다른 대역으로 주파수 축상의 신호의 마스킹을 고려한 비트수로 양자화되며, 그래서 비트 축소량이 증가될 수 있으며, 즉 비트 비율이 감소될 수 있다.
또한 본 실시예에서, 양자화를 위해 할당된 비트수는 주파수 축상의 전술한 마스킹을 고려하여 결정되며, 고려중인 대역의 제2허용가능 잡음 레벨은 양자화를 위해 고려중인 대역에 시간적으로 인접한 신호의 에너지를 근거로하여 셋트 된다. 이런 방식으로, 시간축상의 일시적 마스킹을 고려한 양자화를 위한 할당된 비트수도 동시에 결정될 수 있다. 즉, 제1허용가능 잡음 레벨이 제1잡음 레벨 셋팅 수단에서 셋트되었던 현재의 시간점에서 고려중인 주파수 대역에 대해 추가적으로 제2허용가능 잡음 레벨이 셋트되며, 그래서 시간축상의 시간적으로 인접한 전후점에 놓인 신호에 의한 일시적 마스킹이 또한 고려될 수 있다. 이런 취지로, 합성 회로(18)의 출력 뿐 아니라 제2잡음 레벨 셋팅 수단의 합성 회로(55)의 출력도 합성 회로(56)에 출력된다.
이런 방식으로, 고려중인 대역의 현재 시간점에 있는 신호에 대한 인접한 시간점에 놓인 신호의 에너지를 기초로 한 일시적 마스킹 레벨은 제2허용가능 잡음 레벨의 신호로서 계산되어 합성 회로(55)에 공급되며, 그래서 이들 시간적으로 인접한 신호에 의한 허용가능 잡음 레벨이 합성 회로(55)에 의해 형성된다.
제2허용가능 잡음 레벨을 얻기 위해, 본 장치는 매 512 샘플에 대한 합계 검출 회로(14)의 출력을 기록/판독하기에 적합한 메모리(51), 이 메모리(51)와 비슷한 메모리(52), 계수 증배 유니트(53, 54) 및, 합성 회로(55)를 갖추고 있다. 즉, 만일 메모리(51)의 출력이 얻어진 시간점이 현재 시간점 To이면, 합계 검출 회로(14)의 출력이 메모리(51)에 공급되는 시간점은 시간적으로 현재 시간점 To 후에 있는 후시간점 T+1(현재 시간점 To에 대해 미래 시간)이 되며, 메모리(52)로부터 출력되는 시간점은 시간적으로 현재 시간점 To전의 전시간점 T-1(현재 시간 To에 대해 과거시간)이 된다.
후시간점 T+1의 신호, 즉 합계 검출 회로(14)의 출력은 계수 증배 유니트(T3)에 공급된다. 이 계수 증배 유니트(53)에서 후시간점 T+1의 신호는 현재 시간점 To에서 고려중인 대역의 신호에 대한 유니트(53)에 후시간점 T+1에서 공급되는 고려중인 대역의 신호에 의한 일시적 마스킹(배경 마스킹)을 고려하여 결정된 증배 계수로 증배된다. 즉, 증배 계수는 합성 회로(55), (56)에서 초래된 효과를 고려하여 셋트된다. 만일 후 시간점 T+1의 신호가 1로 정규화되면, 후시간점 T+1의 신호는 후시간점 T+1의 신호에 의한 역방향 마스킹이 현재 시간점 To의 신호에 작용하는 레벨에 대응하는 증배 계수 KB로 증배된다. 메모리(52)로부터의 출력이 되는 전시간점 T-1의 신호는 계수 증배 유니트(54)에 공급된다. 이 계수 증배 유니트(54)에서, 전시간점 T-1의 신호는 계수 증배 유니트(54)에 전시간점 T-1에서 공급되는 고려중인 대역의 신호에 의한 현재 시간점 To에서 고려중인 대역의 신호의 일시적 마스킹 효과(순방향 마스킹)를 고려하여 결정된 증배 계수로 증배된다. 그러므로, 증배 계수는 또한 합성 회로(55)에서 일어나는 효과를 고려하여 결정된다. 만일 전시간점 T-1의 신호가 정규화되면, 전시간점 T-1의 신호는 전시간점 T-1의 신호에 의한 순방향 마스킹이 현재 시간점 To의 신호에 작용하는 레벨에 대응하는 증배 계수 KF로 증배된다. 계수 증배 유니트(53)의 출력은 합성 회로(55)에서 전술한 제2허용가능 잡음 레벨로 합성된다. 합성 회로(55)는 계수 증배 유니트(53, 54)의 출력을 함께 가산하는 동작을 한다. 그래서 발생된 합성 회로(55)의 출력은 합성 회로(56)에 공급된다.
합성 회로(56)에서는, 합성 회로(55 또는 18)의 출력중 큰 출력이 선택되거나, 또는 대안으로, 소정의 가중 계수로 중배한 후에 합성 회로(55, 18)의 출력이 함께 가산된다. 후자의 가산에 의한 합성 동작은 또한 제2허용가능 잡음 레벨을 구하는데 있어 전체 주파수 대역의 에너지가 고려되어야 하므로 수행될 수도 있다.
전술한 최소 가청 곡선 합성 동작은 생략될 수도 있는데, 이 경우에 제3도에 도시된 최소 가청 곡선 발생 회로(22) 및 합성 회로(18)가 제거될 수 있다. 그러므로 감산기(16)의 출력은 분할 회로(17)에 의한 디컨벌루션후에 합성 회로(56)에 직접 전송된다.
전술한 디지탈 신호 인코딩 장치에 있어서, 주파수 축상의 마스킹을 고려한 제1허용가능 잡음 레벨은 양자화를 위해 고려중인 신호에 대해 제1잡음 레벨 셋팅 수단에 의해 셋트되며, 이와 동시에, 고려중인 대역의 신호에 시간적으로 인접한 신호에 의한 일시적 마스킹을 고려한 제2허용 가능 잡음 레벨로 또한 양자화를 위해 고려중인 동일 신호에 대해 제2잡음 레벨 셋팅 수단에 의해 셋트된다. 양자화 회로(24)에 의한 양자화를 위해 할당된 비트수는 이들 제1 및 제2허용 가능 잡음 레벨을 근거로하여 한 대역에서 다른 대역으로 셋트되며, 그래서 음질을 저하시키지 않고 비트 축소량이 증가될 수 있으며, 역으로 비트 비율은 낮아질 수 있다.
본 발명은 제3도의 예에 도시된 적응형 변환 및 인코딩을 위한 장치외에도 제9도의 예에 도시된 대역-분할 및 인코딩 장치에도 적용될 수 있다.
제9도를 참조하면, 시간축상의 오디오 신호는 입력 단자(61)를 통해 대역통과 필터(BPF)(621-623)에 공급된다. BPF(621)는 통과 대역으로서 0-6㎑의 입력 오디오 신호의 주파수 범위를 갖고 있고, BPF(622)는 통과 대역으로서 6-12㎑의 입력 오디오 신호의 주파수 범위를 갖고 있으며, BPF(623)는 통과 대역으로서 12-24㎑의 입력 오디오 신호의 주파수 범위를 갖고 있다. 이들 BPF의 출력은 고속 퓨리에 변환(FFT)회로(631-632)에 전송된다. FFT회로(631)에서는 예를들어 매 128 샘플에 대해 FFT처리가 수행되고, FFT회로(632, 633)에서는, 예를들어 매 64 샘플에 대해 FFT처리가 수행된다. 이들 FFT회로의 출력은 선행 실시예와 비슷하게 처리되도록 하기 위해, 제3도의 FFT회로(11)의 회로 다운스트림과 비슷한 양자화 회로(641-643)에 전송된다. 양자화 회로(641-643)의 출력은 합성 회로(65)에서 합성되어 출력 단자(66)에서 출력된다. 제9도에 도시된 구성으로도, 제1도에 도시된 장치와 비슷하게, 음질에서의 왜곡을 최소화하면서 비트 축소량을 증가시키는 것이 가능하다.
제10도는 제9도에 도시된 장치에서의 주파수 도메인과 시간 도메인에서의 해상도를 도시하고 있는데 여기에는 대역 분할 또는 고속 퓨리에 변환에 의한 처리가 도시되어 있으며, 각 블럭은 2개의 파라미터 m과 n으로 지정되는데 b(m, n)에서 m은 대역 번호이고 n은 시간 번호이다. 제8도로부터, 0-6㎑의 저주파 범위에 대해, 각 주파수 대역에서의 각 블럭은 10, 67msec의 시간 지속기간(시간 해상도)를 갖고 있고, 6-12㎑와 12-24㎑의 중간 및 고주파 범위에 대해서 각각의 블럭은 5.3msec의 시간 지속 기간과 2.67msec의 시간 지속기간을 각각 갖고 있다는 것을 알 수 있다.
Claims (10)
- 입력 다지탈 신호를 인코딩하기 위한 디지탈 신호 인코딩 장치에 있어서, 상기 입력 디지탈 신호가 공급되며, 상기 입력 디지탈 신호의 주파수 범위를 다수의 주파수 대역으로 분할하기에 적합하게 되어 있는 분할 수단과, 각 주파수 대역의 에너지를 근거로하여 각 주파수 대역의 제1허용가능 잡음 레벨을 셋팅하기 위한 제1잡음 레벨 셋팅 수단과, 적시에 인접한 대응하는 주파수 대역의 신호의 에너지를 근거로하여 각 주파수 대역의 제2허용가능 잡음 레벨을 셋팅하기 위한 제2잡음 레벨 셋팅 수단과, 합성된 허용 가능 잡음 레벨을 발생하기 위해 상기 제1 및 제2허용가능 잡음 레벨을 합성하기 위한 합성 수단 및, 상기 합성된 허용가능 잡음 레벨에 따르는 비트수로 각 주파수 대역의 신호 성분을 양자화하기 위한 양자화 수단으로 구성되는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 분할 수단은, 각 주파수 대역의 대역폭이 선택되어 고주파수의 주파수 대역쪽을 향해 보다 넓어지게 되도록 상기 입력 디지탈 신호의 주파수 범위를 다수의 주파수 대역으로 분할하는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 분할 수단은 계수 데이타를 발생하기 위해 상기 입력 디지탈 신호의 소정 수의 샘플을 변환 코딩하기 위한 변환 코딩 수단을 포함하는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제3항에 있어서, 각각의 상기 다수의 주파수 대역이 임계 대역에 대응하는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 입력 디지탈 신호는 오디오 신호의 직교 변환시 얻어지는 계수 데이타가 되는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 입력 디지탈 신호가 상기 오디오 신호의 직교 변환시 얻어지는 계수 데이타에 근거한 진폭 값 정보가 되는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제5항 또는 제6항에 있어서, 직교 변환에 의해 처리될 상기 오디오 신호는 대역-분할 필터에 의해 소정의 주파수 범위로 분할된 오디오 신호인 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 제1허용가능 잡음 레벨은 소정의 가중 함수가 컨벌브되는 각 주파수 대역의 에너지를 근거로하여 구해지도록 되어 있는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 제1 및 제2허용가능 잡음 레벨이 각 주파수 대역에 대한 마스킹 효과를 근거로하여 구해지도록 되어 있는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
- 제1항에 있어서, 상기 제1허용가능 잡음 레벨이 동일 고성 곡선을 근거로 하여 정정되어 있는 것을 특징으로 하는 디지탈 신호 인코딩 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP90-133980 | 1990-05-25 | ||
JP2133980A JP2751564B2 (ja) | 1990-05-25 | 1990-05-25 | ディジタル信号符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR910021054A KR910021054A (ko) | 1991-12-20 |
KR100188381B1 true KR100188381B1 (ko) | 1999-06-01 |
Family
ID=15117577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019910008405A KR100188381B1 (ko) | 1990-05-25 | 1991-05-24 | 디지탈 신호 인코딩 장치 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5241603A (ko) |
EP (1) | EP0458645B1 (ko) |
JP (1) | JP2751564B2 (ko) |
KR (1) | KR100188381B1 (ko) |
AT (1) | ATE143543T1 (ko) |
AU (1) | AU640780B2 (ko) |
CA (1) | CA2043133A1 (ko) |
DE (1) | DE69122306T2 (ko) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
JPH03139700A (ja) * | 1989-10-25 | 1991-06-13 | Sony Corp | オーディオ信号再生装置 |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
GB2257606B (en) * | 1991-06-28 | 1995-01-18 | Sony Corp | Recording and/or reproducing apparatuses and signal processing methods for compressed data |
EP0786874B1 (en) * | 1991-09-30 | 2000-08-16 | Sony Corporation | Method and apparatus for audio data compression |
JP3446216B2 (ja) * | 1992-03-06 | 2003-09-16 | ソニー株式会社 | 音声信号処理方法 |
JP3104400B2 (ja) * | 1992-04-27 | 2000-10-30 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
JP3153933B2 (ja) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
JP3186292B2 (ja) * | 1993-02-02 | 2001-07-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JP3186307B2 (ja) * | 1993-03-09 | 2001-07-11 | ソニー株式会社 | 圧縮データ記録装置及び方法 |
JP3123290B2 (ja) * | 1993-03-09 | 2001-01-09 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 |
TW232116B (en) * | 1993-04-14 | 1994-10-11 | Sony Corp | Method or device and recording media for signal conversion |
US5581654A (en) * | 1993-05-25 | 1996-12-03 | Sony Corporation | Method and apparatus for information encoding and decoding |
EP0692880B1 (en) * | 1993-11-04 | 2001-09-26 | Sony Corporation | Signal encoder, signal decoder, recording medium and signal encoding method |
CN1111959C (zh) * | 1993-11-09 | 2003-06-18 | 索尼公司 | 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置 |
JP3404837B2 (ja) * | 1993-12-07 | 2003-05-12 | ソニー株式会社 | 多層符号化装置 |
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
GB2327582B (en) * | 1994-03-31 | 1999-03-17 | Ceridian Corp | Apparatus and method for including codes in audio signals |
JP3186412B2 (ja) * | 1994-04-01 | 2001-07-11 | ソニー株式会社 | 情報符号化方法、情報復号化方法、及び情報伝送方法 |
JP3277699B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置並びに信号復号化方法及び装置 |
TW295747B (ko) * | 1994-06-13 | 1997-01-11 | Sony Co Ltd | |
JP3277705B2 (ja) | 1994-07-27 | 2002-04-22 | ソニー株式会社 | 情報符号化装置及び方法、並びに情報復号化装置及び方法 |
JP3341474B2 (ja) * | 1994-07-28 | 2002-11-05 | ソニー株式会社 | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
IT1271240B (it) * | 1994-10-04 | 1997-05-27 | Alcatel Italia | Metodo e sistema psicoacustico di codifica del segnale audio |
JP3557674B2 (ja) * | 1994-12-15 | 2004-08-25 | ソニー株式会社 | 高能率符号化方法及び装置 |
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
JP3082625B2 (ja) * | 1995-07-15 | 2000-08-28 | 日本電気株式会社 | 音声信号処理回路 |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
JPH1083623A (ja) * | 1996-09-10 | 1998-03-31 | Sony Corp | 信号記録方法、信号記録装置、記録媒体および信号処理方法 |
FR2768586B1 (fr) * | 1997-09-12 | 1999-12-03 | Nortel Matra Cellular | Estimation previsionnelle du rapport signal a interferences dans un reseau cellulaire de radiocommunications |
DE19823235A1 (de) * | 1998-05-25 | 1999-12-02 | Abb Research Ltd | Verfahren zur Mehrkanalübertragung über ein Medium gegebener Bandbreite |
DE19914645A1 (de) * | 1999-03-31 | 2000-10-26 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Codierung/Decodierung |
KR100547113B1 (ko) * | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
-
1990
- 1990-05-25 JP JP2133980A patent/JP2751564B2/ja not_active Expired - Lifetime
-
1991
- 1991-05-21 AU AU77206/91A patent/AU640780B2/en not_active Expired
- 1991-05-21 US US07/703,830 patent/US5241603A/en not_active Expired - Lifetime
- 1991-05-23 DE DE69122306T patent/DE69122306T2/de not_active Expired - Lifetime
- 1991-05-23 AT AT91304699T patent/ATE143543T1/de not_active IP Right Cessation
- 1991-05-23 CA CA002043133A patent/CA2043133A1/en not_active Abandoned
- 1991-05-23 EP EP91304699A patent/EP0458645B1/en not_active Expired - Lifetime
- 1991-05-24 KR KR1019910008405A patent/KR100188381B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
AU7720691A (en) | 1991-11-28 |
EP0458645B1 (en) | 1996-09-25 |
CA2043133A1 (en) | 1991-11-26 |
ATE143543T1 (de) | 1996-10-15 |
DE69122306T2 (de) | 1997-03-06 |
DE69122306D1 (de) | 1996-10-31 |
KR910021054A (ko) | 1991-12-20 |
JPH0435123A (ja) | 1992-02-05 |
EP0458645A3 (en) | 1993-03-17 |
EP0458645A2 (en) | 1991-11-27 |
AU640780B2 (en) | 1993-09-02 |
US5241603A (en) | 1993-08-31 |
JP2751564B2 (ja) | 1998-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100188381B1 (ko) | 디지탈 신호 인코딩 장치 | |
KR100221892B1 (ko) | 디지탈 신호 인코더 | |
US5157760A (en) | Digital signal encoding with quantizing based on masking from multiple frequency bands | |
EP0570131B1 (en) | Compression encoding and decoding of digital audio signals | |
JP3134337B2 (ja) | ディジタル信号符号化方法 | |
KR100241498B1 (ko) | 디지털신호 부호화장치 | |
AU648656B2 (en) | High efficiency digital data encoding and decoding apparatus | |
RU2090973C1 (ru) | Способ кодирования сигналов | |
KR970007663B1 (ko) | 신호 양자화 장치 및 방법 | |
EP0421259B1 (en) | Digital signal encoding apparatus | |
US5752224A (en) | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium | |
JPH03256411A (ja) | ディジタルデータの高能率符号化方法 | |
US5588089A (en) | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal | |
JP3041967B2 (ja) | ディジタル信号符号化装置 | |
JP3089692B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3033157B2 (ja) | ディジタル信号符号化装置 | |
JP3033158B2 (ja) | デイジタル信号符号化装置 | |
JP2998196B2 (ja) | オーディオ信号の量子化誤差低減装置 | |
JP3070123B2 (ja) | ディジタル信号符号化装置及び方法 | |
JP2797524B2 (ja) | デイジタル信号符号化方法 | |
JP2913695B2 (ja) | ディジタル信号符号化方法 | |
JP2913696B2 (ja) | ディジタル信号符号化方法 | |
KR0179427B1 (ko) | 노이즈 스펙트럼 변경방법 및 장치 | |
JPH03139923A (ja) | ディジタルデータの高能率符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110131 Year of fee payment: 13 |
|
EXPY | Expiration of term |