TWI517562B - 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 - Google Patents
用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 Download PDFInfo
- Publication number
- TWI517562B TWI517562B TW096108528A TW96108528A TWI517562B TW I517562 B TWI517562 B TW I517562B TW 096108528 A TW096108528 A TW 096108528A TW 96108528 A TW96108528 A TW 96108528A TW I517562 B TWI517562 B TW I517562B
- Authority
- TW
- Taiwan
- Prior art keywords
- loudness
- channel
- scaling
- perceived
- gain
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims description 45
- 238000004590 computer program Methods 0.000 title claims description 9
- 238000012886 linear function Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 31
- 230000005284 excitation Effects 0.000 description 20
- 238000012937 correction Methods 0.000 description 16
- 238000005259 measurement Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000008447 perception Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000000695 excitation spectrum Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical group O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/02—Manually-operated control
- H03G3/04—Manually-operated control in untuned amplifiers
- H03G3/10—Manually-operated control in untuned amplifiers having semiconductor devices
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Electrophonic Musical Instruments (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本發明是關於音訊信號處理的技術。特別是關於調整一多聲道音訊信號之全面感知響度,同時近似保留在所有聲道之間的相關感知響度以保持感知的空間平衡的技術。本發明不僅包括方法也包括相對應的電腦程式和裝置。
在較佳地理解本發明之各層面中有用的用於測量和調整感知(聽覺心理學響度)的某些技術在以下申請案和文獻中被描述,該申請案是2004年12月23日公開的Alan Jeffrey Seefeldt等人的國際專利申請案WO 2004/111994 A2,名為”Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal”,該文獻是Alan Seefeldt在2004年10月28日在San Francisco的Audio Engineering Society Convention Paper 6236中的”A New Objective Measure of Perceived Loudness”。該WO 2004/111994 A2申請案和該文獻的全部內容在此被併入本案作為參考資料。
在較佳地理解本發明之各層面中有用的用於測量和調整感知(聽覺心理學響度)的某些其他技術在以下申請案中被描述,該申請案是2006年5月4日公開的Alan Jeffrey Seefeldt等人的國際專利申請案WO 2006/047600 A1,名為”Calculating and Adjusting the Perceived Loudness and/or the Perceived spectral Balance of an Audio Signal”。該WO 2006/047600 A1申請案的全部內容在此被併入本案以為參考資料。
很多方法用於客觀地測量音訊信號被感知的響度。該等方法的範例包括A、B和C加權功率測量以及響度的聽覺心理學模型,如”Acoustics-Method for calculating loudness level”,ISO 532(1975)和該PCT/US2005/038579申請案。藉由接收該輸入音訊信號,應用一已知的濾波器,該濾波器加重感知上較敏感的頻率同時降低感知上較不敏感的頻率,然後在一預定的時間長度上平均化該被濾波之信號的功率,以執行加權功率測量。聽覺心理學方法典型地較複雜且針對較好的人耳工作方式的模型。它們將信號分為數個模擬頻率響應及耳朵敏感度的頻帶,然後操作且整合這些頻帶,同時考慮聽覺心理學現象如頻率和時間遮罩(temporal masking),以及隨著變化的信號強度之響度的非線性感知。所有方法的目的是導出一接近符合該音訊信號之主觀印象的數字化的測量。
對非線性的人耳聽覺系統的精確建模形成響度之感知模型的基礎。在1930年代,Fletcher和Munson發現當音量增加時敏感度的相對變化減少。在1950年代,Zwicker和Stevens擴大了Fletcher和Munson的成果且發展出更精確和實際的模型。第1圖(由Zwicker公開的)顯示1kHz音調和均勻的激發雜訊(uniform exciting noise,UEN,在所有臨界頻帶內具有相等功率的雜訊)二者的響度增長。對於一低於通常稱作“聽覺臨界”的信號位準來說,沒有響度被感知到。在此臨界之上,被感知到的響度快速增長到一響度在此隨著信號位準線性增長的漸近線。第1圖顯示1kHz音調的非線性行為,第2圖中的ISO 226的等響度曲線顯示相同的行為,但是為正弦曲線音調的頻率之函數。該等以10方(phon)之增量的等值線顯示橫跨被人耳感知成相同響度之頻率的聲壓位準。最低線代表作為一頻率之函數的“聽覺臨界”。在較低位準上的等響度線較緊密地壓縮在一起,從而與較高位準相比,聲壓位準之相對較小的變化引起被感知之響度之較明顯的變化。
人類聽覺系統的非線性及頻率變化行為在被感知的音質及音訊信號的成像上具有直接影響。在一特定聲壓位準上呈現的一複合的寬頻音訊信號(如音樂)被感知為具有一特定頻譜平衡或音質。如果相同的音訊信號被呈現在不同等的聲壓位準上且如第2圖所示,被感知之響度的增長對於不同的頻率是不同的,則該音訊信號之被感知的頻譜平衡或音質將不同。一複合的寬頻多聲道音訊信號(被呈現在多個揚聲器上)也被感知為具有一特定的空間平衡。空間平衡指的是混音(mix)中的聲音成分之位置的印象以及由於在兩個或多個揚聲器之間的音訊信號之相對位準引起的混音的全面擴散。如果相同的多聲道音訊信號被呈現在一不同的全面聲壓位準上,則感知響度內的非線性增長及橫跨頻率之響度的不同增長導致在該多聲道音訊信號之感知空間平衡中的變化。當在聲道之間的位準存在重大差異時這是尤其明顯的。相對較響的聲道而言,較安靜的聲道可被不同地影響,例如,這可導致安靜的聲道降到該聽覺臨界之下且在該全面位準被減小時無法被聽見。
在很多情況下,想要調整或縮放(scale)一音訊信號的感知響度。最明顯的範例是出現在很多裝置上的傳統音量或位準控制,該等裝置包括消費者音樂播放器、家庭劇院接收器/放大器和專業的混音控制臺。此簡單的音量或位準控制增益在不考慮人類聽覺系統的情況下調整該音訊信號且導致在感知音質和空間平衡中的變化。
最近,Seefeldt等人(該WO 2004/111994 A2申請案)和Seefeldt(該PCT/US2005/038579申請案)已揭露數個發明,其層面致能一單聲道音訊信號之感知響度的縮放,且根據其實現是寬頻或是多頻來保持該感知的音質。依據此等發明的各層面,一期望的響度縮放比例或目標響度可被實現,本質上藉由反轉該響度測量模型及計算可被施加到該音訊信號的一寬頻增益或多頻增益。
儘管此等方法解決了調整一單聲道音訊信號之響度的問題,但如何調整一多聲道音訊信號之響度的問題仍存在。
多聲道響度被典型地計算成每一聲道內功率之和的一函數。對於如上述的A、B和C加權測量之加權功率方法而言,多聲道響度是每一聲道內加權功率的一簡單求和。一般地對於響度之聽覺心理學模型而言,一臨界頻帶功率頻譜或激發頻譜對於每一聲道被首先計算出,且接著該等激發頻譜橫跨所有聲道被求和以構建一個單一激發頻譜。每一激發頻帶通過一非線性度,如第1圖所示,以構建每一頻帶的一響度測量,已知為特定響度,且該特定響度橫跨頻率被求和以計算一個單一的寬頻響度值。對於加權功率和聽覺心理學方法二者而言,對每一聲道內之功率求和的函數可包括每一聲道額外的加權,以考慮頭部相關轉移函數(HRTF)影響。
因為一多聲道信號的響度可被相對簡單地計算出,因此可能計算一個單一增益,當該單一增益被施加到所有聲道時引起響度中的一全面期望的變化。然而,此單一增益可能具有對該多聲道呈現之其他屬性不想要的影響。如果在該多聲道表達中的聲道之間的相關信號位準內存在差異,且如果所有聲道被相同的增益縮放,則相對於較響的聲道而言,較安靜聲道在其等響度內具有較大的感知變化。這可引起在感知的空間平衡內的變化,當一些聲道降到該聽覺臨界之下時這是最差的。例如,在電影的很多5.1音訊混音中,前面的聲道包含的信號之位準比環繞聲道包含的信號之位準高得多。特別是中央聲道一般被用於重現(reproduce)對話。然而,較低位準的環繞聲道可包含產生一混音中之擴散的信號。例如,其等可包含對話的迴響部分以模擬某人在大房間內說話的效果。因為藉由對所有聲道施加相同的增益,此信號的響度被降低,因此環繞聲道的響度比前面聲道的響度降低的更快,最後降到聽覺臨界之下。該結果導致期望的擴散空間平衡的大幅崩潰。
依據本發明的各層面,在一多聲道呈現之全面感知響度的一期望的縮放比例可達到一期望的精確性,同時對於一期望的精確性保留在聲道之間的相關感知響度以保持一感知的空間平衡或音質。
本發明提供一種用於經由一期望量sm
縮放一多聲道音訊信號的全面感知響度Lm
,其中感知響度是信號功率P的一非線性函數,藉由以一數量縮放每一個別聲道的感知響度Lc
,該數量實質上等於縮放所有聲道之全面感知響度之期望量sm
,取決於計算精確性及該全面感知響度縮放比例sm
之期望的精確性。每一個別聲道的感知響度可被縮放,藉由改變每一個別聲道的增益,其中增益是一聲道之功率的縮放比例。
另外,可取捨地,施加到每一聲道的響度縮放比例被修改,以致減少在實際的全面響度縮放比例和全面響度縮放比例之期望量之間的差異。
施加到每一聲道的響度縮放比例可被修改,藉由施加一共同的乘數到每一聲道的增益或藉由對每一聲道的縮放比例增加一共同的縮放比例偏移量。
每一聲道的感知響度和全面的感知響度都可在複數個頻帶之每一內被測量,且每一聲道的振幅在此等頻帶內被調整。該等頻帶可以是臨界頻帶。另外,每一聲道的感知響度和全面感知響度都可在一個單一寬頻頻帶內被測量。
在另一層面,本發明可被適用於執行上述方法之任何一種的裝置實現。
在又一層面,本發明可被一電腦程式實現,該電腦程式被儲存在一電腦可讀媒體上,用於使電腦執行上述方法中的任一種。
第1圖顯示對於1kHz音調和均勻激發雜訊(UEN)二者之響度的非線性增長。
第2圖顯示ISO 226的等響度曲線。水平刻度是以赫茲為單位的頻率(10為底的對數),垂直刻度是以分貝為單位的聲壓位準。
第3圖顯示用於計算一聽覺心理學響度模型之激發信號的一組臨界頻帶濾波器響應。
第4a-4f圖描述從修改一多聲道音訊信號之特定響度中獲得的特定響度頻譜和增益。
一般而言,響度L的測量可被描述為信號功率P的一函數F。信號功率P是音訊信號的一功率測量。這可以是A、B或C加權功率或一多頻帶激發頻譜。例如,見ANSI S1.42-2001(R2006)用於聽覺測量之加權網路的美國國家標準設計響應(American National Standard Design Response)所示。該函數F是非線性設計的以近似響度增長中的變化。此函數可簡單如第1圖所示的單一UEN函數,被施加到一個單一、寬頻的功率測量,或可複雜如響度之一聽覺心理學模型,在此激發頻譜透過不同的每一頻帶非線性度被轉換為一特定響度頻譜然後轉換為一個單一響度值(如該PCT/US2005/038579申請案中所示)。需要注意的是儘管傳統的加權功率響度測量(如A加權功率)嘗試考慮人類聽覺系統的頻變敏感度,但它們沒有考慮位準敏感度的變化。因此傳遞一傳統的加權功率測量經過一非線性度(如上所描述的一個)是有用的。
L=F{P} (1)
假定該響度函數是可逆的,則該信號功率P的一增益縮放比例(scaling)g可被計算出,從而該增益變化產生該感知響度的一特定期望的縮放比例s。
s.L=F{g.P} (2a)
因此,增益g是功率P的一縮放比例,而s是響度L的一縮放比例。
如果該函數F是線性的,則方程式2a可簡化成sL=gF{P}=gL,從而產生明顯解g=s,與該信號功率P無關。然而,根據一非線性函數F,一般而言,該增益g是該信號功率P的一函數,如方程式2b所示。換句話說,不同的信號功率P對於相同的響度縮放比例s需要不同的增益g。
一多聲道音訊信號之響度的全面(所有聲道)測量Lm
實際上可被近似為該多聲道音訊信號內之每一聲道之每一聲道功率Pc
之和的函數。該聲道總數是C。
需注意每一聲道功率之總和可被加權以考慮頭部相關轉移函數(HRTF)影響。也就是說,來自不同空間方向的信號可具有稍微不同的相關感知響度。如果已知或假定收聽者與重現該等多個聲道之揚聲器間的相關位置,則可建立到達一收聽者之耳朵的信號的一模型為該等個別聲道信號的一函數(一般而言,是該等聲道信號被濾波及被求和的版本)。然後響度可從此等耳朵信號被計算出。然而,實際上對於大多數收聽環境而言,執行該等聲道信號的一功率和可良好執行。
現在再次假定該響度函數是可逆的,則被施加到所有聲道的一個單一增益gm
可被計算出,從而該結果是該全面感知響度的一期望縮放比例sm
。
然而,施加相同的增益縮放比例gm
到所有聲道可能非期望地影響該被修改之音訊的空間平衡。特別是,該增益gm
的計算將對具有最大功率的聲道具有最大影響。如果其他聲道具有非常小的功率,則與較高位準的聲道相比,該增益gm
可在這些較低位準的聲道內引起一大幅不同的感知變化,這是由於非線性的人類響度感知引起的。如果該縮放比例sm
對應於響度內的一衰減,則太多衰減可能被施加到這些較低位準的聲道。因此,此等低位準聲道對該混音之空間平衡的相對貢獻將變小,且最差的情況可能該等聲道變得完全聽不見。
本發明解決了保持一多聲道音訊信號之空間平衡的問題,同時對全面響度給出了一期望的改變。精確測量及描繪一多聲道音訊信號之空間平衡是非常複雜的。各聲道的頻譜之部分可感知地融合成位於揚聲器之間的虛擬來源,透過該等虛擬來源該等聲道被播放,同時該等聲道的其他部分可相組合以形成對環繞該收聽者之一擴散聲場的感知。測量這些不同成分相關於其他成分的感知響度不是一個已被深刻理解的問題,因為其包括某些音訊信號成分部分遮罩其他成分之複雜現象。遮罩度是每一來源之位準以及每一來源之空間位置和擴散的一函數。即使能夠精確測量該空間平衡的所有這些層面,則該全面響度被縮放時,嘗試保持其等相關測量可能包括一複雜的非線性最佳化過程。
然而,考慮一個二聲道信號的一簡單範例,其中每一聲道包含一沒有與另一聲道內的信號頻譜重疊的信號。然後每一聲道被感知為一不同的來源,且沒有來源遮罩另一個來源。在此簡單情形下,清楚的是可實現保持兩個成分之相關響度,藉由以相同的量縮放每一個別聲道的響度(而不是每一個聲道的增益)。該等發明人已發現將此解決方法一般地應用到一多聲道信號中可幫助保持空間平衡,而不會引入任何不適宜的副作用。
在本發明各層面的基本實現中,每一個別聲道的感知響度Lc
(分開來看)可被一縮放量sc
縮放,該縮放量sc
實質上等於所有聲道之全面感知響度的一期望的縮放量sm
,這易受計算精確性和該全面感知響度縮放比例的期望精確性所影響。此解決方法減輕了上述由於較高位準聲道之影響使低位準聲道降到聽覺臨界之下的問題。在每一個別聲道之感知響度Lc
內的縮放比例可藉由控制每一聲道之個別增益gc
被實現(此增益gc
是該聲道之功率Pc
的一縮放比例)。需注意的是如以下進一步的討論,此等個別聲道增益gc
一般不同於上述與方程式4a和4b關聯的增益gm
。這可被較好的理解,例如藉由參考方程式5a和5b:s m
.L c
=F
{g c
.P c
}對於C個聲道的每一而言 (5a)或者對於C個聲道的每一而言 (5b)其中sc
=sm
。
儘管本發明的一基本實現實質上保持該空間平衡且在很多應用中是有用的,但此等實現由於函數F的非線性而無法確保達成該多聲道感知響度Lm
的全面縮放比例sm
。因為F是非線性的,因此由方程式4b給出的增益gm
一般而言不等於由方程式5b給出的增益gc
。因此,在施加gm
到所有聲道之後所有聲道的響度一般而言不等於在施加該增益gc
到每一各自聲道之後的所有聲道之響度:
以方程式4a替換方程式6a的左手邊且以方程式5b替換gc
產生等效的運算式:
因此,在以下之間可能存在差異或誤差:(1)所有聲道之感知響度,從由期望之全面感知響度縮放因數sm
縮放該等個別聲道之每一的感知響度Lc
得到的(例如由方程式6b右邊部分所表示的)以及(2)所有聲道之感知響度,從由該全面響度縮放因數sm
直接縮放得到的(例如由方程式6b左邊部分表示的)。可將此誤差表示為一縮放差量△sm
,該縮放差量△sm
在與期望的全面響度縮放比例sm
求和時將方程式6b轉為一等式:
或重新整理為(6d)對於任何實際模型化人類感知之非線性位準行為的函數F而言,此等誤差一般較小,因為在一大的範圍上響度的增長接近於線性。然而,為了最小化此等誤差,可能想要的是增加一可選擇之校正到本發明的基本實現。在沒有失去一般性的情況下,可將一校正表示為引入到每一個別聲道之響度縮放中的縮放差量△sc
,從而在方程式6d中的該全面響度縮放誤差△sm
被減少。一般而言,該縮放差量△sc
在聲道間是不同的。將這些聲道縮放差量△sc
合併進方程式6d產生一修改過的運算式:
具有此校正應用的該等個別聲道增益然後可由以下方程式給出:對於C個聲道之每一 (6f)
在一些可忍受的範圍內可使用任何適合的技術來達到聲道縮放差量△sc
,從而方程式6e內的該全面響度縮放誤差△sm
的絕對值比方程式6d內的小。因此,使得△sm
的絕對值較小。在以下給出的兩個實現範例中,理想地,其可被減小到零。然而,△sm
之絕對值的減少度相對每一聲道縮放差量△sc
的大小可被取捨(trade off),以便最小化聽得見的聲道響度變化的人工因素,在此情形下△sm
的理想值不是零。校正實現的兩個範例接下來在下文被描述。
一種實現此一校正之方式的範例是首先依據本發明一基本實現來計算該等個別聲道增益gc
,如方程式5b,以及接著對於所有聲道計算一個單一校正增益G,其與每一聲道增益gc
相乘以產生校正的聲道增益。該增益G被計算出,從而在施加該等增益到每一聲道之後該全面響度等於由期望量縮放的初始全面響度:
解G產生:
此校正減少了該全面響度縮放誤差△sm
的絕對值。理想地,如從察看方程式7a明顯的是(沒有△sm
因數-縮放誤差被設定為零),其被減少到零。在一實際安排中,由於計算的精確性、信號處理時間滯後等,該縮放誤差可不為零。此外,如上所述,每一聲道縮放差量△sc
的大小在限制該△sm
誤差因數的減少度時可被考慮到。相對應的聲道縮放差量△sc
不被直接指定,而是經由計算G被隱含指定。給出G,可重新排列方程式6f以解出每一聲道之縮放差量△sc
為,在施加該校正的聲道增益後的該特定聲道之響度與該原始聲道之響度的比率減去該期望的全面響度縮放比例:
需注意的是不須解出△sc
(藉由施加該共同的G因數來調整每一聲道之增益,對該全面(多聲道)響度的該期望之校正被實現)。方程式7c被顯示,出於在解釋該第一校正範例中說明的目的。
因為在實際中藉由該等個別聲道增益所達成的該全面響度縮放比例接近於該期望之全面響度縮放比例sm
,因此產生的校正增益G典型地接近於一,而相對應的聲道縮放差量接近於零。因此,該校正不可能會引起任何不適宜的空間改變。
另一種應用一校正之方式的一範例是找到一對於所有聲道共同的聲道縮放差量△s,從而對於所有聲道△sc
=△s,這導致減少該全面響度縮放誤差△sm
的絕對值。理想地,如從察看方程式8明顯的是(沒有△sm
因數-該縮放誤差被設定為零),其被減少至零。在實際安排中,由於計算的精確性、信號處理時間滯後等,該縮放誤差可能不是零。將這些限制插入到方程式6e中產生該條件:
可以利用方程式8解出△s,然後利用方程式6f(其中對於所有聲道△sc
=△s)計算出相對應的校正聲道增益。實際上,利用方程式8解出△s需要一疊代數值技術且因此沒有已描述的第一校正實現方式合意。
兩個上述校正範例的層面可在下表中被總結:
存在其他技術用於近似地施加相同的響度縮放比例給一多聲道信號的每一個別聲道,同時近似地施加期望的變化給該全面響度,且本發明意謂涵蓋所有此等技術。
在該WO 2004/111994 A2申請案和該PCT/US2005/038579申請案中,Seefeldt等人和Seefeldt在其他事件中揭露了根據一聽覺心理學模型的感知響度的一客觀測量。從一單聲道音訊信號,x[n],該方法首先計算出一激發信號E[b,t],近似於在時間區塊t期間在臨界頻帶b上沿著內耳之耳底膜的能量分佈。該激發可從該音訊信號的短時離散傅立葉轉換(STDFT)被計算出,如下:
其中X[k,t]代表在時間區塊t和箱塊(bin)k時x[n]的STDFT。T[k]代表模擬音訊傳輸經過外耳和中耳的一濾波器的頻率響應,Cb
[k]代表在對應於臨界頻帶b的一位置上的耳底膜之頻率響應。第3圖描述一組適合的臨界頻帶濾波器響應,其中四十個頻帶沿著等效矩形頻寬(ERB)比例被均勻隔開,如Moore和Glasberg所定義的,(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”Journal of the Audio Engineering Society,Vol.45,No.4,1997年4月,pp.224-240)。每一濾波器的形狀由一圓形指數函數(rounded exponential function)描述,該等頻帶利用1 ERB的間距被分佈開。最後,在(9)中的平滑時間常數λb
可被有利地選擇為正比於在頻帶b內人類響度感知的積分時間。
利用等響度曲線,如在第2圖中被描述的那些,在每一頻帶上的激發被轉換為可在1kHz時產生相同響度的一激發位準。特定響度(橫跨頻率和時間分佈的感知響度的一測量)然後從該轉換的激發,E1kHz
[b,t],經由一壓縮非線性度被計算出。一個計算該特定響度的適合函數N[b,t]被以下方程式給出:
其中TQ1kHz
是在1kHz時的靜音臨界,常數β和α被選擇以匹配響度資料的增長,如第1圖中所示。最後,以單位宋(sone)表示的總響度L[t]藉由橫跨頻帶對特定響度求和被計算出:
出於調整該音訊信號的目的,可能希望計算出一寬頻增益g[t],其在與該音訊信號相乘時,使得該被調整之音訊的響度等於一些期望的目標響度[t],如由已描述的聽覺心理學技術所測量的。該目標響度[t]可以多種方式被計算出。例如,在一音量控制的情形下,其可被計算為該初始響度L[t]的一固定縮放比例。另外,該響度L[t]的更多複雜函數可被使用,如一自動增益控制(AGC)或動態範圍控制(DRC)。不管[t]如何被計算出,相對應的增益g[t]以相同的方式被計算出。
令該函數FL
代表從激發到響度的轉換,從而L[t]=FL
{E[b,t]} (12a)該增益g[t]被計算出,從而
重新整理(12a-b),可對任何b解出:
其中s[t]是與[t]有關的響度縮放比例,從而
且反函數被強制以產生是該初始激發E[b,t]之一寬頻縮放比例的一激發。由於該函數FL
的本性(被施加到每一頻帶之一非線性度接著進行一跨頻帶之加總),該反函數的一封閉形式解答不存在。相反地,在該WO 2004/111994 A2申請案中描述的一疊代技術可被用於解出該增益g[t]。
替代計算一寬頻增益g[t]以修改該音訊,一種方法可計算一多頻增益g[b,t],其在被施加到該初始音訊時產生一被修改的音訊信號,該被修改的音訊信號之特定響度實質上等於某一期望的目標特定響度[b,t]。藉由計算一多頻增益而不是一寬頻增益,控制該音訊之感知頻譜平衡或音質可被實現。例如,根據一音量控制,該目標特定響度可被計算為該初始特定響度N[b,t]的一頻帶獨立性縮放比例,從而當該音量改變時保持該音訊的初始音質。在該PCT/US2005/038579申請案中,多個用於計算[b,t]為N[b,t]之一函數的其他技術被描述,包括AGC、多頻DRC和動態EQ(DEQ)。令函數FN
代表自激發到特定響度的轉換,從而:N[b,t]=FN
{E[b,t]} (13a)該增益g[b,t]被計算出,從而
重新整理(13a-b),可解出:
其中s[b,t]是與[b,t]有關的該特定響度縮放比例,從而:
在該PCT/US2005/038579申請案中,用於計算(12c)中之的數個技術被描述,包括一封閉形式運算式、一查詢表和疊代搜尋。
現在考慮一多聲道音訊信號xc
[n],c=1...C,自該信號對於每一聲道c一激發Ec
[b,t]可被計算出。對於多聲道信號的一總激發Em
[b,t]可被計算出,藉由對所有該等聲道激發求和:
且依據以下方程式,一相對應的總響度和特定響度可自該總激發被計算出:Lm
[t]=FL
{Em
[b,t]} (14b) Nm
[b,t]=FN
{Em
[b,t]} (14c)同樣地,每一個別聲道的響度和特定響度可自每一聲道激發被計算出:Lc
[t]=FL
{Ec
[b,t]} (15a) Nc
[b,t]=FN
{Ec
[b,t]} (15b)
現在假定希望修改該多聲道音訊信號,從而該總響度Lm
[t]被sm
[t]縮放,或該總的特定響度Nm
[b,t]被sm
[b,t]縮放。在第一種情形下,可解答一寬頻增益gm
[t],從而:sm
[t]Lm
[t]=FL
{gm
[t]Em
[b,t]} (16a)而在第二情形下,解答一多頻增益gm
[b,t],從而:sm
[b,t]Nm
[b,t]=FN
{gm
[b,t]Em
[b,t]} (16b)
在兩種情形下,相同的增益然後被施加到所有聲道c,但如先前所討論的,這可導致該多聲道信號之感知空間平衡的一失真。為了保持該空間平衡,可改對每一聲道計算增益gc
[t]或gc
[b,t],從而每一個別聲道響度或特定響度由期望量縮放:sm
[t]Lc
[t]=FL
{gc
[t]Ec
[b,t]} (17a) sm
[b,t]Nc
[b,t]=FN
{gc
[b,t]Ec
[b,t]} (17b)
因此,在所有聲道之間的相關響度或特定響度被保持。然而,當這些增益gc
[t]或gc
[b,t]被施加到該初始多聲道音訊之相對應的聲道時,從而產生的被修改的多聲道音訊信號之總響度可能不是正好等於由該期望量縮放之該初始多聲道音訊信號的總響度。更特別地:
以及
在很多情形下,方程式18a和18b的兩邊幾乎相等,從而對於一些應用而言,產生的誤差可被忽視。然而,對於最佳的結果而言,可計算被施加到所有聲道的一校正增益G[t]或G[b,t],從而:
以及
因此,期望的總響度縮放比例可被達到。在大多數情形下,該校正增益G[t]或G[b,t]是小的,且從而該多聲道信號的空間平衡被大部分保持住。
在第4a-4f圖中,描述了對於一多聲道音訊信號之被修改的特定響度和多頻帶增益的標繪,該多聲道音訊信號由五個聲道組成:左、中央、右、左環繞以及右環繞。此特殊音訊信號由中央聲道內的對話主要控制,餘下的四個聲道包含非常低之位準的周圍信號(用於傳達位於大廳內之效果)。對於此特定情形而言,該等多頻帶增益gm
[b,t]和gc
[b,t](c=1...5)被計算出,以對所有頻帶b達到一特定響度縮放比例sm
[b,t]=0.16。在第4b圖中檢查該中央聲道(c=2),注意到自對於所有聲道增益gm
[b,t]和特定聲道增益g2
[b,t]施加相同增益得到的兩個特定響度頻譜幾乎一樣。這是因為該中央聲道包含該信號的大多數能量,且因此自該組合的激發Em
[b,t]計算gm
[b,t]主要受此聲道影響。然而,檢查餘下的聲道注意到自施加gm
[b,t]和gc
[b,t]得到的兩個特定響度頻譜之間存在巨大差異。在這些情形下,因為該等信號與該中央聲道相比時非常小,因此施加gm
[b,t]導致一遠遠小於該期望之縮放比例0.16的被修改的特定響度。對於很多頻帶而言,該被修改的特定響度降到聽覺臨界之下。在左環繞聲道和右環繞聲道(c=4和5)中這是尤其明顯的。另一方面,施加gc
[b,t]產生該期望的特定響度縮放比例。在第4f圖中,描述了在施加gm
[b,t]到所有聲道及施加gc
[b,t]到每一各自的聲道之後,所有被組合聲道的特定響度。需要注意的是在第一種情形下,該被修改的特定響度等於由該期望量縮放之初始組合的特定響度,如所期望的那樣。施加gc
[b,t]到每一各自的聲道產生一接近此結果的被修改的特定響度,但是在較低和較高的頻帶上存在一小誤差。此誤差經由進一步施加該校正增益G[b,t]被消除,其對於大多數頻帶b而言接近於0dB。G[b,t]橫跨頻帶的平均絕對值是0.6dB,G[b,t]的最大絕對值僅為3.7dB。返回到第4a-4e圖,注意到施加該校正增益對每一個別聲道之被修改的特定響度僅有較小的影響。
本發明可以硬體或軟體或二者的組合(例如可程式化的邏輯陣列)被實施。除非另外指定,否則被包括作為本發明之部分的運算法和程序並不與任何特定電腦或其他裝置固有地相關。特別是,不同一般用途的機器可以依據本文的教示撰寫的程式來使用,或可以是較方便的建構較專用的裝置(例如積體電路),以執行需要的方法步驟。因此,本發明可被一或多個在一或多個可程式化之電腦系統上執行的電腦程式實現,每一電腦系統包含至少一處理器、至少一資料儲存系統(包括依電性或非依電性記憶體及/或儲存元件)、至少一輸入裝置或埠以及至少一輸出裝置或埠。程式碼被應用到輸入資料上以執行此處描述的函數且產生輸出資訊。該輸出資訊以一種已知的方式被應用到一或多個輸出裝置。
每一此種程式可以任何想要的電腦語言(包括機器、組合或高階程序、邏輯或物件導向程式語言)被實現以與一電腦系統相通訊。在任何情形下,該語言可以是一編譯或解釋語言。
每一此種電腦程式較佳地被儲存在或被下載到可被一個一般用途或專用的可程式化電腦讀取的一儲存媒體或裝置(例如固態記憶體或媒體,或磁性或光學媒體)上,用於在該儲存媒體或裝置被該電腦系統讀取時組配且操作該電腦,以執行此處描述的程序。該發明的系統也可考慮成以一電腦可讀儲存媒體(被一電腦程式組配)被實現,其中被如此組配的該儲存媒體使得一電腦系統以一種特定及預定的方式操作,以執行此處描述的該等功能。
本發明的數個實施例已被描述。然而,需要理解的是可做出不同修改而不脫離本發明的精神和範圍。例如,此處描述的一些步驟可與順序無關,且從而可以一種不同於此處描述之順序被執行。
第1圖顯示對於1kHz音調和均勻激發雜訊(UEN)二者之響度的非線性增長。
第2圖顯示ISO 226的等響度曲線。水平刻度是以赫茲為單位的頻率(10為底的對數),垂直刻度是以分貝為單位的聲壓位準。
第3圖顯示用於計算一聽覺心理學響度模型之激發信號的一組臨界頻帶濾波器響應。
第4a-4f圖描述從修改一多聲道音訊信號之特定響度中獲得的特定響度頻譜和增益。
Claims (13)
- 一種用於將多聲道音訊信號之全面感知響度縮放一期望量的方法,其中感知響度是信號功率的一非線性函數,該方法包含以下步驟:將每一個別聲道的該感知響度縮放實質上等於縮放所有聲道之該全面感知響度的該期望量之一數量,取決於計算精確性和該全面感知響度縮放比例之期望精確性。
- 如申請專利範圍第1項所述之方法,其中每一個別聲道的該感知響度藉由改變該每一個別聲道的增益被縮放,其中增益是一聲道之功率的一縮放比例。
- 如申請專利範圍第1項所述之方法,進一步包含修改施加到每一聲道的該響度縮放比例,以減少實際的全面響度縮放比例及該期望的全面響度縮放比例量之間的差異。
- 如申請專利範圍第2項所述之方法,進一步包含修改施加到每一聲道的該響度縮放比例,以減少實際的全面響度縮放比例及該期望的全面響度縮放比例量之間的差異。
- 如申請專利範圍第3項所述之方法,其中施加到每一聲道的該響度縮放比例被修改,係藉由施加一共同的乘數到每一聲道的該增益,或藉由增加一共同的縮放比例偏移量到每一聲道的該縮放比例。
- 如申請專利範圍第4項所述之方法,其中施加到每一聲道的該響度縮放比例被修改,係藉由施加一共同的乘數到每一聲道的該增益,或藉由增加一共同的縮放比例偏移量到每一聲道的該縮放比例。
- 如申請專利範圍第1至6項中任一項所述之方法,其中每一聲道的該感知響度及該全面感知響度都在多個頻帶之每一頻帶中被測量,且每一聲道的振幅在該等頻帶中被調整。
- 如申請專利範圍第7項所述之方法,其中該等頻帶是臨界頻帶。
- 如申請專利範圍第1至6項中任一項所述之方法,其中每一聲道的該感知響度及該全面感知響度都在一單一寬頻頻帶中被測量。
- 如申請專利範圍第1項所述之方法,其中該感知響度係以從該多聲道音訊信號之該信號功率之一增益縮放比例(g)導出的一縮放比例因數(s)來縮放。
- 如申請專利範圍第10項所述之方法,其中藉信號功率之該非線性函數產生的該感知響度幫助保持該多聲道音訊信號之空間平衡。
- 一種用於將多聲道音訊信號之全面感知響度縮放一期望量的裝置,其中感知響度是信號功率的一非線性函數,該裝置適於執行申請專利範圍第1至9項中任一項所述之方法。
- 一種用於將多聲道音訊信號之全面感知響度縮放一期望量的電腦程式,其中感知響度是信號功率的一非線性函數,該電腦程式被儲存在一電腦可讀媒體上,用於使一電腦執行申請專利範圍第1至9項中任一項所述之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78952306P | 2006-04-04 | 2006-04-04 | |
US85761706P | 2006-11-07 | 2006-11-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200810349A TW200810349A (en) | 2008-02-16 |
TWI517562B true TWI517562B (zh) | 2016-01-11 |
Family
ID=38278892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW096108528A TWI517562B (zh) | 2006-04-04 | 2007-03-13 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
Country Status (8)
Country | Link |
---|---|
US (4) | US8019095B2 (zh) |
EP (1) | EP2002539B1 (zh) |
JP (1) | JP5006384B2 (zh) |
CN (1) | CN101411060B (zh) |
AT (1) | ATE490596T1 (zh) |
DE (1) | DE602007010912D1 (zh) |
TW (1) | TWI517562B (zh) |
WO (1) | WO2007123608A1 (zh) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1805891B1 (en) | 2004-10-26 | 2012-05-16 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
JP5129806B2 (ja) | 2006-04-27 | 2013-01-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 特定ラウドネスに基づく聴覚イベント検出を使用する音声ゲイン制御 |
US8849433B2 (en) | 2006-10-20 | 2014-09-30 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
JP5192544B2 (ja) | 2007-07-13 | 2013-05-08 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 聴覚情景分析とスペクトルの歪みを用いた音響処理 |
EP2232700B1 (en) * | 2007-12-21 | 2014-08-13 | Dts Llc | System for adjusting perceived loudness of audio signals |
KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
JP5273688B2 (ja) | 2008-09-19 | 2013-08-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 小型セル無線ネットワーク内のクライアントデバイスのための上流の信号処理 |
EP2329492A1 (en) | 2008-09-19 | 2011-06-08 | Dolby Laboratories Licensing Corporation | Upstream quality enhancement signal processing for resource constrained client devices |
JP5270006B2 (ja) * | 2008-12-24 | 2013-08-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 周波数領域におけるオーディオ信号ラウドネス決定と修正 |
JP5439586B2 (ja) | 2009-04-30 | 2014-03-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 低複雑度の聴覚イベント境界検出 |
US8761415B2 (en) | 2009-04-30 | 2014-06-24 | Dolby Laboratories Corporation | Controlling the loudness of an audio signal in response to spectral localization |
TWI503816B (zh) * | 2009-05-06 | 2015-10-11 | Dolby Lab Licensing Corp | 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術 |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
KR20110089020A (ko) * | 2010-01-29 | 2011-08-04 | 주식회사 팬택 | 휴대용 단말기의 무선 헤드셋을 통한 음성 출력의 조절 방법 및 그 방법이 구현된 휴대용 단말기 |
US8855322B2 (en) * | 2011-01-12 | 2014-10-07 | Qualcomm Incorporated | Loudness maximization with constrained loudspeaker excursion |
EP2503800B1 (en) | 2011-03-24 | 2018-09-19 | Harman Becker Automotive Systems GmbH | Spatially constant surround sound |
US20130253923A1 (en) * | 2012-03-21 | 2013-09-26 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry | Multichannel enhancement system for preserving spatial cues |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
BR112015017064B1 (pt) | 2013-01-21 | 2022-03-22 | Dolby Laboratories Licensing Corporation | Método, meio legível em computador e aparelho para otimizar o nível de intensidade do som e a faixa dinâmica através de dispositivos de reprodução diferentes |
US9516418B2 (en) | 2013-01-29 | 2016-12-06 | 2236008 Ontario Inc. | Sound field spatial stabilizer |
US9271100B2 (en) * | 2013-06-20 | 2016-02-23 | 2236008 Ontario Inc. | Sound field spatial stabilizer with spectral coherence compensation |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
US10063207B2 (en) | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
US9503803B2 (en) | 2014-03-26 | 2016-11-22 | Bose Corporation | Collaboratively processing audio between headset and source to mask distracting noise |
CN105336341A (zh) * | 2014-05-26 | 2016-02-17 | 杜比实验室特许公司 | 增强音频信号中的语音内容的可理解性 |
US10842418B2 (en) | 2014-09-29 | 2020-11-24 | Starkey Laboratories, Inc. | Method and apparatus for tinnitus evaluation with test sound automatically adjusted for loudness |
CN107112023B (zh) | 2014-10-10 | 2020-10-30 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US10861481B2 (en) | 2016-07-04 | 2020-12-08 | Harman Becker Automotive Systems Gmbh | Automatic correction of loudness level in audio signals containing speech signals |
US9860644B1 (en) | 2017-04-05 | 2018-01-02 | Sonos, Inc. | Limiter for bass enhancement |
CN109040885B (zh) * | 2017-06-09 | 2019-08-20 | 中国科学院声学研究所 | 一种基于音量的个性化响度补偿方法及耳机均衡系统 |
US10389323B2 (en) | 2017-12-18 | 2019-08-20 | Tls Corp. | Context-aware loudness control |
CN115002644A (zh) | 2018-01-09 | 2022-09-02 | 杜比实验室特许公司 | 降低不需要的声音传输 |
CN112750444B (zh) * | 2020-06-30 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 混音方法、装置及电子设备 |
Family Cites Families (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2808475A (en) * | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
US4281218A (en) * | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
DE3314570A1 (de) * | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US4739514A (en) * | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US4887299A (en) * | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
US5043970A (en) * | 1988-01-06 | 1991-08-27 | Lucasarts Entertainment Company | Sound system with source material and surround timbre response correction, specified front and surround loudspeaker directionality, and multi-loudspeaker surround |
US4953112A (en) | 1988-05-10 | 1990-08-28 | Minnesota Mining And Manufacturing Company | Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model |
US5027410A (en) * | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
JPH02118322U (zh) * | 1989-03-08 | 1990-09-21 | ||
US5097510A (en) * | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
US5369711A (en) * | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
AU653582B2 (en) * | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
EP0517233B1 (en) | 1991-06-06 | 1996-10-30 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
US5278912A (en) * | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
US5363147A (en) * | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
JPH06133390A (ja) * | 1992-10-21 | 1994-05-13 | Sony Corp | 音質制御回路 |
DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
GB2272615A (en) | 1992-11-17 | 1994-05-18 | Rudolf Bisping | Controlling signal-to-noise ratio in noisy recordings |
US5548638A (en) | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5706352A (en) * | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
US5434922A (en) * | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
BE1007355A3 (nl) * | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (zh) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
US5530760A (en) * | 1994-04-29 | 1996-06-25 | Audio Products International Corp. | Apparatus and method for adjusting levels between channels of a sound system |
US5574791A (en) | 1994-06-15 | 1996-11-12 | Akg Acoustics, Incorporated | Combined de-esser and high-frequency enhancer using single pair of level detectors |
US5500902A (en) * | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
GB9419388D0 (en) * | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
US5548538A (en) * | 1994-12-07 | 1996-08-20 | Wiltron Company | Internal automatic calibrator for vector network analyzers |
US5682463A (en) * | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
CA2167748A1 (en) * | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
EP0661905B1 (de) | 1995-03-13 | 2002-12-11 | Phonak Ag | Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
AU5663296A (en) | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
US6301555B2 (en) * | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
US5601617A (en) * | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5663727A (en) * | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
US5712954A (en) * | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
US6002776A (en) * | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5907622A (en) * | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
US6108431A (en) * | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
US6430533B1 (en) * | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
JPH09312540A (ja) * | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
JP3765622B2 (ja) * | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
EP0820212B1 (de) * | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
JP2953397B2 (ja) * | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JPH10284964A (ja) | 1997-01-09 | 1998-10-23 | Sony Corp | 音量調節装置 |
US5862228A (en) * | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US5930373A (en) | 1997-04-04 | 1999-07-27 | K.S. Waves Ltd. | Method and system for enhancing quality of sound signal |
US6125343A (en) * | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) * | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6185309B1 (en) * | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
KR100261904B1 (ko) * | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
AU750877C (en) * | 1997-09-05 | 2004-04-29 | Lexicon, Inc. | 5-2-5 matrix encoder and decoder system |
US6088461A (en) * | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
US6055502A (en) * | 1997-09-27 | 2000-04-25 | Ati Technologies, Inc. | Adaptive audio signal compression computer system and method |
TW391148B (en) | 1997-12-01 | 2000-05-21 | Central Research Lab Ltd | Stereo sound expander |
US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) * | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6201875B1 (en) | 1998-03-17 | 2001-03-13 | Sonic Innovations, Inc. | Hearing aid fitting system |
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
AU758242B2 (en) * | 1998-06-08 | 2003-03-20 | Cochlear Limited | Hearing instrument |
EP0980064A1 (de) * | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
GB2340351B (en) * | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) * | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
FI113935B (fi) * | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) * | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
DE69933929T2 (de) * | 1999-04-09 | 2007-06-06 | Texas Instruments Inc., Dallas | Bereitstellen von digitalen Audio- und Videoprodukten |
WO2000065872A1 (en) * | 1999-04-26 | 2000-11-02 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
US6263371B1 (en) * | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
US6985594B1 (en) | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US6442278B1 (en) * | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US7558391B2 (en) * | 1999-11-29 | 2009-07-07 | Bizjak Karl L | Compander architecture and methods |
FR2802329B1 (fr) * | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
DE10018666A1 (de) * | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
AUPQ952700A0 (en) * | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
US6625433B1 (en) * | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) * | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
DK1206104T3 (da) * | 2000-11-09 | 2006-10-30 | Koninkl Kpn Nv | Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk |
US7457422B2 (en) * | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
DE10107385A1 (de) * | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
US6915264B2 (en) * | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
AU2001244029A1 (en) * | 2001-04-10 | 2001-07-09 | Phonak Ag | Method for adjustment of a hearing aid to suit an individual |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7283954B2 (en) * | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
DK1251715T4 (da) | 2001-04-18 | 2011-01-10 | Sound Design Technologies Ltd | Flerkanalshøreapparat med kommunikation mellem kanalerne |
US7177803B2 (en) * | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
JP2003158800A (ja) * | 2001-11-22 | 2003-05-30 | Kenwood Corp | 多チャンネルオーディオ再生装置 |
US20040037421A1 (en) * | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
US7068723B2 (en) * | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
DE60326782D1 (de) | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
MXPA05008317A (es) | 2003-02-06 | 2005-11-04 | Dolby Lab Licensing Corp | Audio con respaldo continuo. |
DE10308483A1 (de) * | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7551745B2 (en) * | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
AU2004248544B2 (en) * | 2003-05-28 | 2010-02-18 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
JP4583781B2 (ja) * | 2003-06-12 | 2010-11-17 | アルパイン株式会社 | 音声補正装置 |
US20040146167A1 (en) | 2003-10-21 | 2004-07-29 | Sony Corporation/Sony Electronics Inc. | Method and apparatus for processing audio from various sources |
CN100530351C (zh) * | 2003-12-03 | 2009-08-19 | 扬智科技股份有限公司 | 动态范围控制的混音输出装置及方法 |
JP2005184154A (ja) * | 2003-12-16 | 2005-07-07 | Sony Corp | 自動利得制御装置及び自動利得制御方法 |
WO2005086139A1 (en) | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
GB2413906A (en) | 2004-04-21 | 2005-11-09 | Imagination Tech Ltd | Radio volume control system |
JP4557594B2 (ja) * | 2004-04-26 | 2010-10-06 | 富士通テン株式会社 | 情報再生処理システム及びそのプログラム |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
JP4347153B2 (ja) * | 2004-07-16 | 2009-10-21 | 三菱電機株式会社 | 音響特性調整装置 |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
EP1805891B1 (en) | 2004-10-26 | 2012-05-16 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8265295B2 (en) * | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
BRPI0709877B1 (pt) | 2006-04-04 | 2019-12-31 | Dolby Laboratories Licensing Corp | método e aparelho para controlar uma característica de intensidade acústica particular de um sinal de áudio |
WO2007120452A1 (en) | 2006-04-04 | 2007-10-25 | Dolby Laboratories Licensing Corporation | Audio signal loudness measurement and modification in the mdct domain |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
JP5129806B2 (ja) | 2006-04-27 | 2013-01-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 特定ラウドネスに基づく聴覚イベント検出を使用する音声ゲイン制御 |
US8849433B2 (en) | 2006-10-20 | 2014-09-30 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US8194889B2 (en) | 2007-01-03 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Hybrid digital/analog loudness-compensating volume control |
EP2130019B1 (en) | 2007-03-19 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
BRPI0808965B1 (pt) | 2007-06-19 | 2020-03-03 | Dolby Laboratories Licensing Corporation | Método e aparelho para medir a intensidade sonora percebida de um sinal de áudio e meio legível por computador |
-
2007
- 2007-03-13 TW TW096108528A patent/TWI517562B/zh active
- 2007-03-14 WO PCT/US2007/006444 patent/WO2007123608A1/en active Application Filing
- 2007-03-14 AT AT07753095T patent/ATE490596T1/de not_active IP Right Cessation
- 2007-03-14 EP EP07753095A patent/EP2002539B1/en active Active
- 2007-03-14 CN CN2007800110565A patent/CN101411060B/zh active Active
- 2007-03-14 US US12/225,988 patent/US8019095B2/en active Active
- 2007-03-14 DE DE602007010912T patent/DE602007010912D1/de active Active
- 2007-03-14 JP JP2009504190A patent/JP5006384B2/ja active Active
-
2011
- 2011-08-22 US US13/215,058 patent/US8600074B2/en active Active
- 2011-12-27 US US13/338,143 patent/US8731215B2/en active Active
-
2014
- 2014-03-31 US US14/230,232 patent/US9584083B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009532982A (ja) | 2009-09-10 |
ATE490596T1 (de) | 2010-12-15 |
EP2002539B1 (en) | 2010-12-01 |
CN101411060A (zh) | 2009-04-15 |
US8731215B2 (en) | 2014-05-20 |
US20110311062A1 (en) | 2011-12-22 |
WO2007123608A1 (en) | 2007-11-01 |
JP5006384B2 (ja) | 2012-08-22 |
US9584083B2 (en) | 2017-02-28 |
CN101411060B (zh) | 2011-04-13 |
US8600074B2 (en) | 2013-12-03 |
EP2002539A1 (en) | 2008-12-17 |
US20140211946A1 (en) | 2014-07-31 |
US20100202632A1 (en) | 2010-08-12 |
DE602007010912D1 (de) | 2011-01-13 |
US20120106743A1 (en) | 2012-05-03 |
TW200810349A (en) | 2008-02-16 |
US8019095B2 (en) | 2011-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI517562B (zh) | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 | |
US8194889B2 (en) | Hybrid digital/analog loudness-compensating volume control | |
US10411668B2 (en) | Methods and apparatus for adjusting a level of an audio signal | |
US9253586B2 (en) | Devices, methods and computer program products for controlling loudness | |
JP2023551222A (ja) | オーディオ信号の正規化を行う方法及びそのための装置 | |
KR20210053236A (ko) | 주파수 스펙트럼 보정을 위한 오디오 신호 처리 방법 및 장치 |