TWI334736B - Apparatus and method for generating a level parameter, apparatus and method for generating a multi-channel representation and a storage media stored parameter representation - Google Patents
Apparatus and method for generating a level parameter, apparatus and method for generating a multi-channel representation and a storage media stored parameter representation Download PDFInfo
- Publication number
- TWI334736B TWI334736B TW094126936A TW94126936A TWI334736B TW I334736 B TWI334736 B TW I334736B TW 094126936 A TW094126936 A TW 094126936A TW 94126936 A TW94126936 A TW 94126936A TW I334736 B TWI334736 B TW I334736B
- Authority
- TW
- Taiwan
- Prior art keywords
- parameter
- channel
- channels
- level
- energy
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000011144 upstream manufacturing Methods 0.000 claims description 34
- 238000012937 correction Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 abstract description 11
- 239000011159 matrix material Substances 0.000 description 33
- 239000010410 layer Substances 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 239000012792 core layer Substances 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000009434 installation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 102220195236 rs1057518512 Human genes 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Radio Relay Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Circuits Of Receivers In General (AREA)
Description
1334736 九、發明說明: 【發明所屬之技術領域】 本發明係有關於使用空間參數對音頻信號的多聲道表 示的編碼。本發明教示用以估計及界定可用以從—些聲道 (少於輸出聲道的數目)重建一多聲道信號之適當參數的新 方法。特別地,著重在最小化該多聲道表示之位元率及提供 該多聲道信號之一編碼表示,其能夠容易地針對所有可能聲 道配置編碼及解碼該資料。 • 【先前技術】 發明名稱爲「用於低位元率音頻編碼應用之有效及可調 式參數立體聲編碼」之PCT/SE02/01 372已顯示可從一單聲 道信號重建一非常相似於原始立體聲圖像之立體聲圖像(假 設具有該立體聲圖像之非常緊密表示)。基本原理係將輸入 信號分割成頻帶及時間區段,以及針對這些頻帶及時間區段 估計聲道間強度差(IID)及聲道間同調性(ICC)。第一參數係 在特定頻帶中之兩個聲道間的功率分佈之測量,以及第二參 # 數係該特定頻帶之兩個聲道間的相關性之估計。在解碼器側 上,藉由依據該IID資料在兩個輸出聲道間分配該單聲道信 號及藉由加入一解相關信號以便保持原始立體聲道之聲道 相關性,以從該單聲道信號重建該立體聲圖像。 對於一多聲道情況(在上下文中之多聲道表示兩個輸出 聲道以上)而言,必須說明幾個額外問題。現在有幾個多聲 道配置。最通常所知道的是5·1配置(中間聲道、前左/右聲 道、環繞左/右聲道及LEE聲道)。然而’亦現在有許多其它 1334736 I > 配置。從完整的編碼器/解碼器系統觀點來說,期望具有一 可針對所有聲道配置使用相同參數組(例如:IID及ICC)或 其子組。ITU-R BS.775界定幾個下行混音架構(down-mix schemes),以便能從一特定聲道配置獲得一包括較少聲道之 聲道配置。取代經常必須解碼所有聲道及依據一下行混音, 期望具有一多聲道表示,其能使一接收器在解碼該等聲道前 擷取有關於手上聲道配置之參數。再者,從一可調式或內嵌 式編碼觀點而言期望有一固有可調之參數組,在該觀點中例 • 如可將對應於該等環繞聲道之資料儲存在位元流之一加強 層中。 相反於以上所述,亦可期望能依據所處理之信號的特性 來使用不同參數界定,以便在會對所處理之目前信號區段導 致最低位元率負擔的參數化間做切換。 使用一加總信號或下行混音信號及額外參數附加資訊 之多聲道信號的另一表示係爲本技藝中所知之雙聲道信號 編碼(Binaural Cue Coding,BCC)。此技術被描述於2003年 修 11月第6期第11卷IEEE語音處理會刊之作者爲F. Baumgarte及C· Faller的「雙聲道信號編碼-第一篇:聽覺 心理學基礎及設計原理」及2003年11月第6期第11卷IEEE 語音處理會刊之作者爲C. Fall er及F. Baum g arte的「雙聲 道信號編碼-第二篇:架構及應用」中。 通常,雙聲道信號編碼係一種依據一下行混音聲道及附 加資訊的多聲道空間表示之方法。針對音頻重建或音頻提供 以一 BCC編碼器所計算及以一BCC解碼器所使用之幾個參 -6- 1334736 數包括聲道間電平差、聲道.間時間差及聲道間同調參數。這 . 些聲道間信號係一空間圖像之感知的決定因數。這些參數係 提供給該原始多聲道信號之時間樣本的區塊及亦提供有頻 率選擇性,以便多聲道信號樣本之每一區塊對於數個頻帶而 言具有數個信號。在c播放聲道之一般情況中,在複數對聲 道間之每一子頻帶中(亦即,針對相對於一參考聲道之每一 聲道)考量該等聲道電平差及該等聲道間時間差。將一聲道 界定成對每一聲道間電平差之參考聲道。由於該等聲道間電 0 平差及該等聲道間時間差,因而可提供一音源至一所使用之 播放裝設的複數對揚聲器中之一對揚聲器間的任何方向。爲 了決定一已提供音源之擴散的寬度,考量所有音頻聲道之每 一子頻帶的一參數係足夠的。此參數係該聲道間同調參數。 該已提供音源之寬度係藉由修改該等子頻帶信號來控制,以 便所有可能聲道對具有相同聲道間同調參數。 在BCC編碼中,決定在該參考聲道1與任何其它聲道 間之所有聲道間電平差。當例如決定該中央聲道爲該參考聲 ® 道時,計算在該左聲道與該中央聲道間之第一聲道間電平 差、在該右左聲道與該中央聲道間之第二聲道間電平差、在 該左環繞聲道與該中央聲道間之第三聲道間電平差及在該 右環繞聲道與該中央聲道間之第四聲道間電平差。此情節描 述一 5-聲道架構。當該5-聲道架構額外地包括一低頻增強 型聲道(亦爲所知之「超低音喇叭(sub-woofer)」聲道)時,計 算在該低頻增強型聲道與該中央聲道(該單一參考聲道)間 之第五聲道間電平差。 1334736 當使用該單一下行混音聲道(亦稱爲「單」聲道)及傳輸 . 信號’例如:ICLD(聲道間電位差、ICTD(聲道間時間差)及 . ICC(聲道間同調))來重建該原始多聲道時,使用這些信號來 修改該單信號之頻譜係數。使用一用以決定每一頻譜係數之 電平修改的正實數以實施該電平修改。使用一複數之大小來 決定每一頻譜係數的相位修改以產生該聲道間時間差。另一 功能決定該同調影響。藉由先計算該參考聲道之因數以計算 每一聲道之電平修改的因數。計算該參考聲道之因數,以便 • 對於每一頻率部分而言所有聲道之功率的總和相同於該合 量信號之功率。然後,依據該參考聲道之電平修改因數,使 用個別ICLD參數來計算其它聲道之電平修改因數。 因此,爲了實施BCC合成,計算該參考聲道之電平修 改因數。爲了此計算,需要一頻帶之所有ICLD參數。然後, 依據該單聲道之電平修改,可計算其它聲道(亦即,非該參 考聲道之聲道)之電平修改因數。 此方法之缺點在於:對於一完整重建而言,需要每一聲 # 道間電平差。當出現一易出錯傳輸聲道時,此需求會造成更 大問題。因爲需要每一聲道間電平差以計算每一多聲道輸出 信號,所以在一傳送聲道間電平差內之每一錯誤將導致在該 重建多聲道信號中之錯誤。在另一情況中,雖然一聲道間電 平差僅是例如該左環繞聲道或右環繞聲道所需,但是當在傳 輸期間遺失此聲道間電平差時,則無法實施重建,其中因爲 重要資訊係包含在該前左聲道(下面稱爲左聲道)、該前石聲 道(下面稱爲右聲道)及該中央聲道中,所以該左環繞聲道 1334736 > 及右環繞聲道對於多聲道重建並非是重要的。當在輸輸期間 遺失該低頻增強型聲道之聲道間電甲差時,此情況變得更 糟。在此情況中,雖然該低頻增強型聲道對收聽者之收聽舒 適並非是決定性的,但是可能不會有多聲道重建或僅有一錯 誤多聲道重建。因爲,將在單一聲道間電平差中之錯誤傳播 至每一重建輸出聲道內之錯誤。 參數多聲道表示之問題在於··通常提供聲道間電平差 (例如:在BCC編碼中之ICLD或在其它參數多聲道表示中 • 之平衡値)做爲相對値而非絕對値。在BCC中,一ICLD參 數描述在一聲道與一參考聲道間之電平差。亦可提供平衡値 以做爲在一聲道對中之兩個聲道間的比率。當重建該多聲道 信號時,將此等電平差或平衡參數應用至一基本聲道,該基 本聲道係可以是一單聲基本聲道或一具有兩個基本聲道之 立體聲基本聲道信號。因此,在至少一基本聲道中所包含之 能量係沿著5個或6個重建輸出聲道來分配。因此,在一重 建輸出聲道中之絕對能量係由該聲道間電平差或該平衡參 ® 數及在該接收器輸入上之下行混音信號的能量來決定。 當在該接收器輸入上之下行混音信號的能量相對於一 編碼器所輸出之一下行混音信號變化的情況出現時,將發生 電平變化。在此上下文中,強調當該等參數具有頻率選擇性 時’依據所使用之參數化架構,此電平變化不僅導致所建立 信號之一般音量變化,而且亦會導致大量的人工因素。當例 如:在頻率範圍中相較於在另外位置之一頻帶而言較常操控 該下行混音信號之某一頻帶時,因爲在該某一頻帶之輸出聲 1334736 道中的頻率成分具有一太低或太高之電平,所以此操控在該 重建輸出信號中係明顯易見的。 _ 此外,適時改變電平操作亦將導致該重建輸出信號之總 電平隨著時間變化及因此被認爲是一惱人的人工因素。 雖然上述情況係集中在藉由編碼、傳輸及解碼一下行混 音信號所造成之電平操作,但是亦會發生其它電平偏移。由 於在要被下行混音成一個或兩個聲道之不同聲道間的相位 相依性,因而會發生下列情況:該單聲信號具有一不等於在 • 該原始信號中之能量的總和。因爲通常例如藉由加入時間波 形以取樣式(sample-wise)來實施該下行混音,所以雖然左信 號與右信號當然具有某一信號能量,但是在該兩個信號間之 例如180度的相位差將導致在該下行混音信號中之兩個聲道 的完全抵消,進而導致零的能量。雖然在正常情況中,將非 常不可能發生此種情形,但是因爲所有信號當然不是完全不 相關的,所以仍然會發生能量變化。因爲該重建輸出信號之 能量將不同於該原始多聲道信號之能量,所以此等變化亦會 0導致在該重建輸出信號中之音量變動及亦將導致人工因素。 【發明內容】 本發明之一目的在於提供一種可造成一具有改善輸出 品質之多聲道重建的參數化觀念。 此目的係藉由依據申請專利範圍第1項之一種用以產生 電平參數之裝置、依據申請專利範圍第7項之一種用以產生 一重建多聲道表示之裝置、依據申請專利範圍第9項之一種 用以產生電平參數之方法、依據申請專利範圍第10項之一 -10- 1334736 種用以產生一重建多聲道表.示之方法、依據申請專利範圍第 .11項之一種電腦程式或依據申請專利範圍第12項之一種參 , 數表示來達成。 本發明係依據下面之硏究結果:爲了高品質重建及有鑑 於彈性編碼/傳輸及解碼架構,將一額外電平參數與一多聲 道信號之下行混音信號或參數表示一起傳送,以致於一多聲 道重建器可一起使用此電平參數與該等電平差參數及該下 行混音信號,以便再生一多聲道輸出信號,而不會遭遇電平 #變化或頻率選擇性電平所引起之人工因素。 依據本發明,計算該電平參數,以便以該電平參數加權 (例如:乘或除)之至少一下行混音聲道的能量等於該等原始 聲道之能量的加總。 在一實施例中,該電平參數係由在該(等)下行混音聲道 之能量與該等原始聲道之能量的加總間之比率所獲得。在此 實施例中,在該編碼器側上計算該(等)下行混音聲道與該原 始多聲道信號間之任何電平差及將其輸入至該資料流以做 #爲一電平校正因數,該電平校正因數被視爲一額外參數,該 額外參數亦可被提供給該(等)下行混音聲道之樣本的一區 塊及被提供給某一頻帶》因此,針對每一區域及頻帶(存在 有聲道間電平差或平衡參數),加入一新電平參數。 因爲本發明允許傳送一多聲道信號之一不同於該等參 數所根據之下行混音的下行混音,所以本發明亦提供彈性。 當例如:一廣播站不希望播放一多聲道解碼器所產生之一下 行混音信號,然而希望播放在一播音室由一音效工程師所產 -11- 1334736 生之一下行混音信號(係一依據人類之主 行混音)時,會出現此等情況。不過,播 送有關於此「主下行混音」之多聲道參數 由該電平參數提供該參數組與該主下行湄 情況中,該電平參數係在該主下行混音與 之電平差,其中該參數組係根據該參數7 本發明之優點在於:因爲亦可使有關 之參數組適應於另一下行混音,其中該另 • 參數計算期間所產生,所以該額外電平參 品質及改善之彈性。 爲了位元率之減少,最好應用該新電 及量化及熵編碼。特別地,因爲頻帶間或 將不會那麼高,以致於可獲得相對小的差 編碼(例如:霍夫曼編碼器)之使用以允許 能性,所以△-編碼將導致高編碼增益。 在本發明之一較佳實施例中,使用一 ®平衡參數之多聲道信號參數表示,該至少 表示兩個不同聲道對間之平衡。特別地, 抗錯誤及甚至位元率率效率係下面事實之 (第一平衡參數之根據)係不同於第二聲3 之根據),其中形成這些聲道對之四個聲j 因此,本發明觀念不同於該單一參考 多平衡或超平衡觀念,該多平衡或超平衡 印象更直學及更自然。特別地,構成該第 觀及創造印象之下 放者可能亦希望傳 。依據本發明,藉 :音間之適應,在此 該參數下行混音間 行混音。 於一下行混音信號 一下行混音並非在 數提供改善之輸出 平參數之△-編碼以 時間區塊間之變化 値,此連合隨後熵 良好編碼增益之可 包括至少兩個不同 兩個不同平衡參數 彈性、可調能力、 •結果:第一聲道對 I對(第二平衡參數 箕皆彼此不同。 聲道觀念及使用一 觀念對人類之聲音 一及第二平衡參數 -12- 1334736 之聲道對可包括原始聲道、.下行混音聲道或最好是輸入聲道 間之某些組合。 已發現到一從該中央聲道(做爲該第一聲道)所獲得之 平衡參數以及該左原始聲道與該右原始聲道(做爲該聲道對 之第二聲道)之加總對於在該中央聲道與該左及右聲道間提 供一精確能量分佈是特別有用的。注意到在此上下文中這三 個聲道通常包括聲場之大部分資訊,其中特別地該左·右立 體聲局部化不僅受左與右間之平衡的影響,而且亦受中央與 Φ 左右之加總間的平衡之影響。依據本發明之一較佳實施例藉 由使用此平衡參數來反映此觀察。 最好,當傳送一單一單下行混音信號時,已發現到除該 中央/左+右平衡參數之外,還有一左/右平衡參數、一後-左/ 後-右平衡參數及一前/後平衡參數係一位元率-有效參數表 示之最佳解答,其係彈性、抗錯誤及可免於大程度人工因素。 在接收器側上,相較於單獨藉由該已傳輸資訊來計算每 —聲道之BCC合成,本發明之多平衡表示額外地使用在用 ^ 以產生該下行混音聲道之下行混音架構上的資訊。因此,在 該下行混音架構(未使用於習知技藝系統中)上之資料亦使 用於除該平衡參數之外還有上行混音。因此,實施該上行混 音操作,以便藉由該平衡參數來決定在一重建多聲道信號 (針對一平衡參數形成一聲道對)內之聲道間的平衡。 此觀念(亦即,不同平衡參數具有不同聲道對)可產生一 些聲道而不需知道每一傳輸平衡參數。特別地,可重建該 左、右及中央聲道而不需知道任何後-左/後-右平衡或不需知 •13- 1334736 道前/後平衡。因爲從一位元流擷取一額外參數或傳送一額 外平衡參數至一接收器因而允許一個或多個額外聲道之重 建,所以此結果允許非常微調之可調能力》此與該習知技藝 單一參考系統成對比,在該習知技藝單一參考系統中需要每 一聲道間電平差以重建所有已重建輸出聲道之所有子群或 只有一子群》 因爲可使該等平衡參數之選擇適應於某一重建環境,所 以本發明觀念亦是有彈性的。當例如:一 5 -聲道裝設形成該 φ 原始多聲道信號裝設時及當一 4-聲道裝設形成一重建多聲 道裝設時,一前-後平衡參數允許計算該組合環繞聲道而不 需要對該左環繞聲道及該左環繞聲道有任何了解,其中該重 建多聲道裝設只具有一單一環繞揚聲器,而該單一環繞揚聲 器例如是設置在收聽者之後面。此與一單一參考聲道系統成 對比,在該單一參考聲道系統中必須從該資料流擷取該左環 繞聲道之聲道間電平差及該右環繞聲道之聲道間電平差。然 後,必須計算該左環繞聲道及該右環繞聲道。最後,必須加 # 入兩個聲道以針對一4-聲道重建裝設獲得該單一環繞揚聲 器聲道。因爲由於該更直覺及更使用者導向之平衡參數表示 並非受限於一單一參考聲道而亦可允許使用原始聲道之組 合以做爲一平衡參數聲道對之一聲道因而可自動地發送該 組合環繞聲道,所以不必在該平衡參數表示中實施所有這些 步驟》 本發明係有關於音頻信號之參數化多聲道表示的問 題。本發明提供一有效方式以界定該多聲道表示之適當參數 -14- 1334736 及亦提供可擷取用以表示所期望聲道組態之參數的能力而 不需解碼所有聲道。本發明進一步解決針對一特定信號區段 以選擇最佳參數組態之問題,以便最小化要針對該特定信號 區段編碼該空間參數所需之位元率。本發明亦槪述如何在一 般多聲道環境中應用在先前只可應用於兩個聲道情況之解 相關方法。 在較佳實施例中,本發明包括下面特徵: -在該等編碼器側上將該多聲道信號下行混音成爲一個或 • 兩個聲道表示; -已知有該多聲道信號,界定用以表示該等多聲道信號之參 數’以便在一彈性每幀基礎中最小化位元率或使該解碼器 能擷取在一位元流位準上之聲道組態; -假設該聲道組態目前係由該解碼器來支援,在該解碼器側 上擷取該相關參數組: -假設有該目前聲道組態,產生所需數目之相互解相關信
Ow^ · m, ® -假設該參數組係由該位元流資料及該等解相關信號所解 碼,重建該等輸出信號; -界定該多聲道音頻信號之參數化,以便可使用相同參數或 該等參數之一子組,而無關於該聲道組態; -界定該多聲道音頻信號之參數化,以便可在一可調式編碼 架構中使用該等參數,在該架構處將該參數組之子組傳送 於該可調式流之不同層中; -界定該多聲道音頻信號之參數化,以便來自該解碼器之輸 1334736 出信號的能量重建不會受下面音頻編解碼器所損害,該音 頻編解碼器係用以編碼該下行混音信號; -該多聲道音頻信號之不同參數化間做切換,以便最小化用 以編號該參數化之位元率負擔; -界定該多聲道音頻信號之參數化,其中包括一用以表示該 下行混音信號之能量校正因數的參數; -使用數個相互解相關之解相關器,以重建該多聲道信號; 以及 •-從一依據該傳送參數組所計算之上行混音矩陣重建該多 聲道信號。 現將藉由有關於所附圖式之說明範例來描述本發明,其 中該等說明範例並非用以限定本發明之範圍或精神》 1:實施方式】 下面描述之實施例僅用以說明本發明在音頻信號之多 聲道表示的原理。可了解到在此所述之配置及細節的修改及 變化對熟習該項技藝者而言係顯而易知的。因此,意思僅由· • 即將描述之申請專利範例所限定,而非由在此之實施例的描 述及說明所呈現之特定細節來限定。 在槪述如何參數化IID及ICC參數及如何應用這些參數 以便重建音頻信號之多聲道表示的本發明之下面描述中,假 設所有提及之信號係在一濾波器阻中之子頻帶信號或對應 聲道之整個頻率範圍的一部分之一些其它頻率選擇性表 示。因此,了解到本發明並非局限在一特定濾波器組,以及 下面針對該信號之子頻帶表示的一頻帶來槪述本發明,以及 -16- 1334736 相同操作應用至所有子頻帶信號。 雖然一平衡參數亦稱爲一「聲道間強度差(II D)」參數, 但是強調在一聲道對間之一平衡參數沒有必要是在該聲道 對之第一聲道中的能量或強度及在該聲道對中之第二聲道 的能量或強度。通常,該平衡參數表示在該聲道對之兩個聲 道間的一聲音源的局部化。雖然此局部化通常係由能量/電 平/強度差所提供,但是可使用信號之其它特性(例如:兩個 聲道之功率測量或該等聲道之時間或頻率包封等)。 在第1圖中,顯現一5.1聲道組態之不同聲道,其中a(t) 101表示該左環繞聲道,b(t) 102表示該左前聲道,c(t) 103 表示該中央聲道,d(t) 104表示該右前聲道,e(t) 105表示 該右環繞聲道,以及f(t) 106表示該LEF(低頻音效(l〇w frequency effect))聲道 ° 假設我們界定期望運算子爲: E\f{x)] = ^\f{x{t))dt Y 0 以及因此上面所槪述之聲道的能量可依據下面來界定 (在此以左環繞聲道做爲範例): ^ = 。 在該編碼器側上將5-聲道下行混音成爲一 2·聲道表示 或一 1-聲道表示》此能夠以幾個方式來完成,以及一通常所 使用之方式爲由下面所界定之ITU下行混音: 5.1至2-聲道下行混音: ld = ab(t) + Pa(t) + yc(t) + 8f (t) -17- 1334736 rd (t) = ad(t) + βε(ί) + yc(t) + 6f (t) 以及5.1至1-聲道下行混音: ^(0 = ^(/,(0 + ^(0) 常數<χ、β、γ及δ之通常所使用之値爲: a=1,月=y =晶,以及各=〇。 將該IID參數界定成爲兩個任意選擇聲道或加權群之聲 道的能量比。假如有上述針對該5. 1聲道組態之所槪述的聲 道之能量,則可界定幾組之IID參數。 第7圖表示一普通下行混音器7 00,其使用上述方程 式,以便計算一單聲道m或兩個最佳立體聲道“及rd。通 常,該下行混音器使用某些下行混音資訊。在一線性下行混 音之較佳實施例中,此下行混音資訊包括加權因數α、β、γ 及δ。在本技藝中已知可使用更多或更少常數或非常數加權 因數。 在一ITU建議下行混音中,a係設定爲1,β及γ係設定 爲等於〇·5之平方根,以及δ係設定爲0。通常,因素a可在 1.5與0.5之間變化。此外,因素β與γ係彼此不同的及在〇 與1之間變化。該低頻增強型聲道f(t)具有相同之事實。此 聲道之因數δ可在0與1之間變化。此外,該左-下行混音及 該右-下行混音之因數不必彼此相等。當考量一例如藉由一 音效工程師所實施之非自動下行混音時,此變得更清楚。進 一步指導該音效工程實施一創造性下行混音而非—由任何 數學定律所支配之下行混音。取而代之,該音效工程師係由 -18- 1334736 他本身自己的創造感覺來支.配。當某一參數組記錄此「創造 性的」下行混音時,將依據本發明由第8圖所示之一發明上 行混音器來使用該「創造性的」下行混音,此不僅由該等參 數來支配,而且亦由該下行混音架構之額外資訊來支配。 當如同在第7圖中已實施一線性下行混音時,該等加權 參數係在該下行混音架構上要由該上行混音器所使用之最 佳資訊。然而,當呈現在該下行混音架構中所使用之其它資 訊時,一上行混音器亦可使用此其它資訊以做爲該下行混音 • 架構之資訊。此其它資訊例如亦可以是在一上行混音-矩陣 之矩陣元素內之某些矩陣元素或某些因素或函數(例如:如 第1 1圖所示)。 假設有第1圖所槪述之5 · 1聲道組態及觀察其它聲道組 態如何相關於該5 . 1聲道組態:對於不可獲得環繞聲道之3 -聲道情況而言,亦即可依據上述記號獲得B、C及D。對於 —4-聲道組態而言,可獲得B、C及D,然而亦可獲得用以 表示該單環繞聲道或在此上下文中所一般表示之後聲道的 ® A與E之組合。 本發明使用應用至所有這些聲道之IID參數,亦即,該 5.1聲道組態之4-聲道子組在描述該5.1聲道之IID參數組 內具有一對應子組。下面IID參數組解決此問題:
_L _ a2B + fi2A + Y2C + S2F r]~ R~ a2D + fi2E + y2C + 52F
r y22C ~ a\B + D) -19- 1334736 β2{Α + Ε) r3 = a\B + D) + y22C · β2Λ_Α
___S22F
h = a\B-¥D) + fi\A^E) + Y22C 明顯可知h參數對應於該左下行混音聲道與該右下行 混音聲道間之能量比。Γ2參數對應於中央聲道與該左及右前 聲道間之能量比。r3參數對應於該三個前聲道與該兩個環繞 # 聲道間之能量比。r4參數對應於該兩個環繞聲道間之能量 比。r5參數對應於該LFE聲道與所有其它聲道間之能量比。 在第4圖中,描述上面所述之能量比。不同輸出聲道係 由101至105所表示及相同於第1圖所示以及因而在此不做 詳細陳述。將該揚聲器裝設分割成左及右半部,其中該中央 聲道103係兩個半部之部分。該左半部平面與該右半部平面 間之能量比正好是η參數。此係藉由第4圖中之η下方的 實體線來表示。再者,在該中央聲道1〇3與該左前102及右 ® 前1 03聲道間之能量分佈係由!·2所表示。最後,在該整個前 聲道裝設(102、103及104)與該後聲道(101及105)間之能量 分佈係以r3參數由第4圖中之箭頭來描述。 假設有上述參數化及該傳輸單下行混音聲道之能量: M =-(a\B + D) + β\Α + E) + 2r2C + 2S2F) 2 , 該等重建聲道之能量可表示成爲: F = 丄丄 2γ2 1 + r5
2M -20- 1334736 A = J__rj__rj__L. /?2 1 + r4 1 + r3 1 + r5
2M E = J__1__rA__1_ β2 \ + r4\ + r3\ + r5
2M c ~ J____1__1_ 2γ2 1 + r2 1 + r3 1 + r5
2M
\ M-P2A^y2C-S2F J if 1 、
D = -y 2——M~fi2E-v2C-S2F
a K 1 + /i J 因此,可將M信號之能量分配至該等重建聲道,導致重 建聲道具有相同於該等原始聲道之能量。 上述較佳上行混音架構係描述於第8圖中。從F、A、E、 C、B及D之方程式可清楚知道該下行混音架構之由該上行 混音器所使用的資訊係該等加權因數α、β、γ及δ,在使此加 權或未加權聲道一起加入或彼此扣減以便獲得某一數目之 下行混音聲道前,使用該等加權因數以加權該等原始聲道, φ 其中下行混音聲道之數目小於原始聲道之數目。因此,從第 8圖可清楚知道依據本發明該等重建聲道之能量不僅由從一 編碼側傳送至一解碼側之平衡參數所決定,而且可由該下行 混音因數(X、β、γ及δ。 當考量第8圖時,變成可清楚知道爲了計算該左及右能 量Β及D,可在該方程式中使用已計算之聲道能量f、A、Ε 及C。然而’此沒有必要包含一連續上行混音架構。取而代 之’爲了獲得一例如使用某一上行混音矩陣(具有某些上行 混音矩陣元素)來實施之完全平行上行混音架構,將A、C、 -21- 1334736 E及F之方程式插入B及D·之方程式。因此,變得可清楚知 道重建聲道能量僅由平衡參數、下行混音聲道及該下行混音 架構之資訊(例如:該等下行混音因數)來決定。 如從下面將可明顯知道,假設有上述IID參數,則明顯 易知已解決用以界定一參數組之IID參數(可用於數個聲道 組態)的問題。觀察該三個聲道組態(亦即,從一可獲得聲道 重建三個前聲道)來做爲一個範例,可明顯易知因爲A、E及 F聲道不存在,所以r3、r4及r5參數係不顯著的。亦可明顯 • 易知因爲參數η描述該左與右前聲道間之能量比及參數r2 描述該中央聲道與該左及右前聲道間之能量比,所以參數η 及r2係足以從一下行混音單聲道重建該三個聲道。 在更一般情況中,可容易地看到上述之IID參數(n... r5) 係應用至用以從m個聲道重建η個聲道之所有子組,其中 m<nS6。觀察第4圖,可以說: -對於一從1聲道重建2聲道之系統而言,從η參數獲得用 以保持該等聲道間之正確能量比的充分資訊; ® -對於一從1聲道重建3聲道之系統而言,從η及〇參數 獲得用以保持該等聲道間之正確能量比的充分資訊; -對於一從1聲道重建4聲道之系統而言,從n、r2及r3 參數獲得用以保持該等聲道間之正確能量比的充分資訊; -對於一從1聲道重建5聲道之系統而言,從ri、r2、r3及 h參數獲得用以保持該等聲道間之正確能量比的充分資 訊; -對於一從1聲道重建5.1聲道之系統而言,從ri、r2、r3、 -22 - 1334736 Γ4及r5參數獲得用以保持該等聲道間之正確能量比的充 分資訊; -對於一從2聲道重建5.1聲道之系統而言,從r2、r3、U 及r5參數獲得用以保持該等聲道間之正確能量比的充分 資訊。 上述可調能力特徵可藉由第圖中之列表來描述。第 l〇a圖中所述且在稍後所說明之可調位元流亦可適用於第 1 Ob圖中之列表,以便獲得比第1 0a圖所述者更細之可調能 _力。 本發明之優點特別在於:可容易地從一單平衡參數r! 重建該左及右聲道,而無需知道或擷取任何其它平衡參數。 爲此目的,在第8圖中之B、D的方程式中,將聲道A、C、 F及E簡單地設定成爲零。 在另一情況中,當只考量該平衡參數^時,該等重建聲 道係該中央聲道與該低頻聲道(此聲道未被設定成零)間之 加總及該左與右聲道間之加總。因此,可只使用一單一參數 ® 來重建該中央聲道及該單音信號。此特徵對於一簡單3-聲道 表示是有用的,其中例如藉由對分以從左及右之加總獲得該 左及右信號,以及其中藉由該平衡參數r2正確地決定該中央 與該左右之加總間的能量。 在此上下文中’該等平衡參數1^或1"2係位於一較低調 整層中。
至於第l〇b圖之列表中的第二項,表示如何只使用兩個 平衡參數取代所有5個平衡參數來產生三個聲道b、D及C -23- 1334736 與F間之加總,相較位於該較低調整層中之參數η或〇 ’ 這些參數η及r2中之一可以已經在一較高調整層中。 當考量第8圖中之方程式時,變得清楚知道:爲了計算 C,將未擷取參數r5及另一非擷取參數r3設定成零。在另— 情況中,亦將該等未使用聲道A、E及F亦設定成零’以便 可計算該三個聲道B、D及該中央聲道與該低頻增強型聲道 F之組合。 當使一4_聲道表示上行混音時,只從該參數資料流擷取 φ ri、r2及r3係足夠的。在此上下文中,相較於參數^或^, r3可以在一下一較高調整層中。因爲如同稍後有關於第6圖 所述,已從該等前聲道與該等後聲道之組合獲得第三平衡參 數Γ3,所以該4-聲道組態特別適合相關於本發明之超平衡參 數表示。此乃是基於下面事實:該參數r3係一從該聲道對所 獲得之前-後平衡參數,該聲道對具有該等後聲道A與E之 組合(做爲第一聲道)及具有左聲道B、右聲道E及中央聲道 C之組合(做爲該等前聲道)。 # 因此’如同是在一單一參數聲道裝設中之情況,可自動 地獲得兩個環繞聲道之組合聲道能量,而無需任何進一步分 離計算及隨後組合。 當必須從一單聲道重建五個聲道時,需要另一平衡參數 r4。此參數r4可再次位於一下一較高調整層中。 當必須實施一 5.1重建時,需要每一平衡參數。因此, 必須將一下一較高調整層(包括該下一平衡參數r5)傳送至一 接收器及由該接收器來估計。 -24- 1334736 然而,使用依據聲道之擴充數目來擴充該IID參數的相 同方法,可擴充上述IID參數以涵蓋具有比該5.1組態大之 數目的聲道之聲道組態。因此,本發明並非局限於上面槪述 之範例。 現在觀察該聲道組態係一 5 · 1聲道組態之情況,此爲最 通常使用情況中之一。再者,假設從兩個聲道重建該5.1聲 道。對於此情況而言,可藉由以下面式子來取代該等參數Γ3 及N以界定一不同組之參數: Q4=~^d 該等參數q3及q4表示該前與後左聲道間之能量比及該 前與後右聲道間之能量比。可想像幾個其它參數化》 在第5圖中,可見到修改之參數化。取代具有一用以槪 述該前與後聲道間之能量分佈的參數(如第4圖中之r3所槪 述)及一用以描述該左環繞聲道與該右環繞聲道間之能量分 佈(如第4圖中之r4所槪述),使用該等參數q3及q4以描述 該左前102與左環繞101聲道間之能量比及該右前聲道1〇4 與該右環繞聲道1 05間之能量比。 本發明教示可使用幾個參數組以表示該等多聲道信 號。本發明之一額外特徵係可依據所使用之參數的量化之型 態以選擇不同參數化。 以一使用參數化之粗量化的系統做爲一個範例,由於高 位元率限制,因而應該使用一在該上行混音程序中不會擴大 -25- 1334736 誤差之參數化》 觀察在一用以從一聲道重建5.1聲道之系統中上述重建 能量的兩個表示式: 1 ( r Λ
B = ^r 2-^—M-fi2A-Y2C~57F α V 1 + η )
\ M-0lE-r1C-51F ) 明顯可知由於該Μ ' A ' C及F參數之相當小量化效應, ^ 因而該等減算會產生該B及D能量之大變化^ 依據本發明,應該使用一幾乎對該等參數之量化不會有 敏感之不同參數化。因此’如果使用粗量化,則上述所界定 之η參數: _ L α2Β + β2Α+γ2€ + δ2Ρ
r'~~R~ a2D + /32E + r2C + S2F 可由依據下式之替代界定來取代:
B 此產生依據下式之重建能量的方程式: Β = ~~^——1——ί———2Μ a 1 + r, l + r2 l + r3 l + r5 D = ~———1——-———2M a 1 + r, 1 + r2 1 + r3 1 + r5 及A、E、C及F之重建能量的方程式保持與上述相同。明 顯可知此參數從量化觀點來看表示一最佳狀態系統。 在第6圖中,描述上述所說明之能量比。不同輸出聲道 -26- 1334736 以101至105來表示且相同.於第1圖以及因此在此不做進一 步詳述。將該揚聲器裝設分割成前部及後部。藉由第6圖中 由r3參數所表示之箭頭來描述該整個前聲道裝設(1〇2、103 及104)與該等後聲道(1〇1及1〇5)間之能量分佈。 本發明之另一重要顯著特徵在於當觀察該參數化 r r22C ri~a\B + D)
B
r' = D 時,從量化觀點來看它不僅是一更佳狀態系統。上述參數化 亦具有下列優點:可獲得用以重建三個前聲道之參數而不會 對該等環繞聲道有任何影響。可相像一參數r2係描述該中央 聲道與所有其它聲道間之關係。然而,此將具有下例缺點: 該等環繞聲道將包含在該等前聲道所述之參數的估計中。 記住在本發明中所描述之參數化亦可應用至聲道間之 關聯或同調的測量,明顯可知在r2之計算中包含該等後聲道 φ 對精確地重建該等前聲道之成功有顯著的負面影響。 可相像在所有前聲道中之相同信號及在該等後聲道中 之完全無相關信號的情況,以做爲一個範例。此並非罕見 的,假設經常使用該等後聲道以重建該原始聲音之周圍環境 資訊。 如果描述該中央聲道係有關於所有其它聲道,則因爲該 等後聲道完全不相關,所以該中央與所有其它聲道之加總間 之相關程度將相當低。對於一用以估計該前左/右聲道與該 -27 - 1334736 後左/右聲道間之相關性的參數具有相同之事實。 因此’我們達成一可正確地重建該等能量之參數化,然 而該參數化並沒有包括所有前聲道係相同(亦即,非常相關) 的資訊。該參數化確實包括將該左及右前聲道解相關至該等 後聲道及亦將該中央聲道解相關至該等後聲道之資訊。然 而,所有前聲道係相同之事實係無法從此一參數化來推論。 因爲該等後聲道未包含在該解碼器側上所使用之參數 的估計中以重建該等前聲道,所以此可藉由使用下列本發明 # 所教示之式子來克服:
Y22C r2~ a2 (B + D)
B r'=~5 依據本發明藉由r2來表示該中央聲道103與該左前102 及右前103聲道間之能量分佈。藉由r4來描述該左環繞聲道 101與該右環繞聲道105間之能量分佈。最後,藉由Γι來提 φ供該左前聲道102與該右前聲道104間之能量分佈。明顯可 知’除Π在此對應於該左前揚聲器與該右前揚聲器間之能量 分佈(因相對於整個左側及整個右側)之外,所有參數相同於 第4圖中所述。基於完整性,該參數Γ5亦提供用以槪述該中 央聲道103與該LFE聲道106間之能量分佈。 第6圖顯示本發明之較佳參數化實施例的槪要。該第一 平衡參數η(由實線所表示)構成一前-左/前-右平衡參數。該 第二平衡參數!>2係一中央左-右平衡參數。該第三平衡參數 Π構成一前/後平衡參數。該第四平衡參數r4構成一後-左/ -28 - 1334736 後-右平衡參數。最後,該第五參數r5構成—中央/LFE平衡 參數。 第4圖顯示一相關情況。該第一平衡參數ri(在一下行 混音左/右平衡中藉由第4圖中之實線來描述)可由一在該等 聲道B與D(下面聲道對)間所界定之原始前-左/前-右平衡參 數來取代。此以第4圖中之虛線η來描述及對應於第5圖及 第6圖中之實線Γι。 在一雙聲道情況中,該等參數r3及r4(亦即,該前/後平 •衡參數及該後-左/右平衡參數)由兩個單側前/後參數所取 代。該第一單側前/後參數q 3亦可被視爲該第一平衡參數, 其中該第一平衡參數係從該左環繞聲道A及該左聲道b所構 成之聲道對所獲得。該第二單側前/左平衡參數係該參數 其可被視爲該第二參數,該第二參數係根據該右聲道D 及該右環繞聲道E所構成之第二聲道對。再者,兩個聲道對 係彼此不相關的。該中央/左-右平衡參數1*2亦具有相同之事 實,該中央/左-右平衡參數rz具有一中央聲道C以做爲一第 ® 一聲道及該左及右聲道B及D之加總以做爲一第二聲道。 依據本發明界定另一參數化’該另一參數化針對一從— 個或兩個聲道重建5.1聲道之系統本身相當適合於粗量化。 至於一個聲道至5.1聲道而言:
2B r2c 2d Μ Μ Μ ^ Μ 以及至於二個聲道至5.1聲道之情況: β2Α 2Β r2c
2D
L
L
R β2Ε -29- 9, % 1334736 明顯可知上述參數化包括比嚴格理論觀點所需要要多 之參數,以正確地再分配該等傳輸信號之能量至該等重建之 信號。然而,該參數化對量化誤差之敏感係非常遲鈍的。 上述針對一 2-聲道裝設所提及之參數組使用幾個參考 聲道。然而,相較於第6圖中之參數組態,第7圖中之參數 組僅依據下行混音聲道而非原始聲道來做爲參考聲道。該等 平衡參數q!、q3及q4係由完全不同聲道對所獲得。 雖然已描述幾個本發明實施例,其中用以獲得平衡參數 # 之聲道對僅包括原始聲道(第4圖、第5圖及第6圖)或包括 原始聲道及下行混音聲道(第4圖及第5圖)或僅依據該下行 混音聲道以做爲在第7圖之底部所表示的參考聲道,但是最 好在第2圖之環繞資料編碼器206內所包括之參數產生器係 操作以僅使用原始聲道或原始聲道之組合而非在該等聲道 對中之聲道的一基本聲道或基本聲道之組合,其中該等平衡 參數係根據該等聲道對。此乃是由於無法完全保證該單一基 本聲道或該兩個立體聲基本聲道不在會在從一環繞編碼器 ^傳輸至一環繞解碼器期間發生能量變化。可藉由一音頻編碼 器2 05 (第2圖)或一音頻解碼器302(第3圖)在一低-位元率 狀態下操作以造成該下行混音聲道或該單一下行混音聲道 之能量變化。此情況會導致該單下行混音聲道或該等立體下 行混音聲道之能量的操控,該操控在該左與右立體聲下行混 音聲道間可以是不同的或甚至可以是頻率選擇性的或時間 選擇性的。 爲了完全安全地反對此能量變化,依據本發明針對每一 -30 - 1334736 下行混音聲道之每一區域及.頻帶傳送一額外電平參數。所以 當該等平衡參數係根據該原始信號而非該下行混音信號 時,因爲任何能量校正將不影響該等原始聲道間之平衡情 況,所以一單一校正因數對每一頻帶係足夠的。甚至當沒有 傳送額外電平參數時,任何下行混音聲道能量變化將不會在 該音頻圖像中導致音源之失真局部化,然而將只會導致一般 音量變化,該一般音量變化不會像藉由改變平衡狀態所造成 之音源的遷移一樣惱人。 重要的是要注意需要小心,以便(該等下行混音聲道之) 能量Μ係上面所槪述之能量B、D、A、E、C及F之加總。 由於在被下行混音至一個聲道之不同聲道間的相位相依 性,所以不會經常是這種情況。可傳送該能量校正因數以做 爲一額外參數rM,以及因此將在該解碼器側上所接收之下行 混音信號界定成爲: rMM = Ua2(B + D) + fi\A + E) + 2y2C + 252F) ^ ο 在第9圖中,槪述依據本發明之額外參數ΓΜ的應用。 在將該下行混音信號傳送至該上行混音模組70 1 -705前在 901中藉由該額外參數rM修改該下行混音信號。這些係相同 於第7圖所述者及在此將不做進一步詳述。熟習該項技藝者 明顯可知上面單聲道下行混音範例之參數rM可擴充至每一 下行混音一個參數及因此並非局限於一單一下行混音聲道。 第9a圖描述一發明電平參數計算器900,然而第9b圖 表示一發明電平校正器902。第9a圖表示在該編碼器側上之 1334736 情況,以及第9b圖描述在該解碼器側上之對應情況。該電 平參數或「額外」參數rM係一用以提供某一能量比之校正 因數。假設下面示範性情節來做解釋。針對某一原始多聲道 信號,一方面具有一「主下行混音」及另一方面具有一「參 數下行混音」。已依據例如主觀品質印象由在一播音室中之 音效工程師產生該主下行混音。此外,某一音頻儲存媒體亦 包括該參數下行混音,該參數下行混音已藉由例如第2圖之 環繞編碼器2 0 3來實施。該參數下行混音包括一基本聲道或 ^ 兩個基本聲道,上述基本聲道使用該原始多聲道信號之平衡 參數組或任何其它參數表示來形成該多聲道重建之基礎。 例如可以是下面情況:廣播員希望不要傳送該參數下行 混音,然而希望將該主下行混音從一發送器傳送至接收器。 此外,爲了將該主下行混音提升至多聲道表示,該廣播員亦 傳送該原始多聲道信號之一參數表示。因爲(在一頻帶中及 在一區塊中之)能量可(或通常將)在該主下行混音與該參數 下行混音間做變化,所以在區塊900中產生一相對電平參數 ® rM及將其傳送至該接收器以做爲一額外參數。該電平參數係 從該主下行混音及該參數下行混音所獲得及最好是在該主 下行混音及該參數下行混音之一區塊及一頻帶內之能量的 比率。 通常,計算該電平參數以成爲該等原始聲道之能量 (E〇rig)的加總與該(等)下行混音聲道之能量間的比率,其中 此(等)下行混音聲道可以是該參數下行混音(EPD)或該主下 行混音(EMD)或任何其它下行混音信號。通常,使用從一編 -32- 1334736 碼器傳送至一解碼器之特定、下行混音信號的能量。 第9b圖描述該電平參數使用之一解碼器側實施。將該 電平參數及該下行混音信號輸入至該電平校正器區塊902 » 該電平校正器依據該電平參數校正該單一基本聲道或該幾 個基本聲道。因爲該額外參數rM係一相對値,所以此相對 値係藉由該對應基本聲道之能量來操控。 雖然第9a及9b圖表示一對該下行混音聲道或該等下行 混音聲道施加電平校正之情況,但是該亦可將該電平參數整 # 合至該上行混音矩陣中。爲此目的,在第8圖之方程式中的 m之每次出現係由「rMM」來取代》 硏究當從2聲道重建5.1聲道之情況,可觀察下面描述。 如果使用具有第2圖及第3圖所槪述之編解碼器205及 3 02的本發明,需要一些更多考量。觀察稍早所界定之IID 參數,其中依據下面式子來界定η:
L a2B + fi2A + Y2C + S2F r'~~R~ a2D + fi2E + r2C + S2F φ 因爲該系統從2聲道重建5.1聲道,其中假設該兩個傳 輸聲道係該等環繞聲道之立體聲下行混音,所以此參數係暗 示地可在該解碼器側上獲得。 然而,在一位元率限制下操作之音頻編解碼器可以修改 該頻譜分佈,以便在該解碼器側上所測量之L及R能量不同 於在該編碼器側上之數値。依據本發亦可針對從兩個聲道重 建5.1聲道時之情況藉由傳送下列參數以使對該重建聲道之 能量分佈的影響消失: -33 - 1334736
B r\ =— D。 如果提供發信手段’則該解碼器可使用不同參數組編碼 目前信號區段及選擇用以對所要處理之特定信號區段提供 最低負擔之IID參數。該右前與後聲道間之能量電平可能係 相似的,以及該前與後左聲道間之能量電平可能係相似的, 然而在該右前與後聲道中之電平係顯著不同的。假設有參數 之差量編碼(delta coding)及隨後熵編碼(entropy coding),則 使用參數q3及q4以取代r3及r4係更有效的》對於另一具有 不同特性之信號區段而言,一不同參數組可以提供一較低位 元率負擔。本發明允許自由地在不同參數表示間做切換,以 便最小化該目前已編碼信號區段之位元率負擔,其中該信號 區段之特性係已知的。切換於該等IID參數之不同參數化間 以便獲得最低可能位元率負擔及提供發信手段以表示目前 使用什麼參數化的能力係本發明之基本特徵。 再者,可在頻率方向或在時間方向完成該等參數之差量 編碼,以及完成不同參數間之差量編碼。依據本發明,假設 提供發信手段以表示所使用之特定差量編碼,則可對一參數 相對於任何其它參數實施差量編碼。 任何編碼架構之一重要特徵係實施可調編碼之能力。此 意味著可將該已編碼位元流分割成幾個不同層。核心層可由 本身來解碼,以及可解碼較高層以增強該已解碼核心層信 號。對於不同情況而言,可獲得層之數目可以是變化的,然 而只要該核心層係可獲得的,該解碼器可產生輸出樣本。使 用該η至Γ5參數之上面所槪述的多聲道編碼之參數化本身 -34 - 1334736 « * 相當適合於可調式編碼。因此,可將例如該兩個環繞聲道(A 及E)之資料儲存在一增強層(亦即,該等參數r3及r4及在— 核心層中對應於該等前聲道之參數(由參數ri及r2所表示)) 中。 在第10圖中,槪述依據本發明之可調位元流實施。該 等位元流層係以1 〇 〇 1及1 0 〇 2來描述,其中1 〇 〇 !係該核心 層,其持有該波形編碼下行混音信號及持有用以重建該等前 聲道(102、103及104)之參數ri及r2。1002所描述之增強層 φ 持有用以重建該等後聲道(1〇1及105)之參數。 本發明之另一動要觀點係在一多聲道組態中使用解相 關器。在PCT/SE02/01 3 72專利文件中已針對一個或兩個聲 道情況詳細一解相關器之使用的觀點。然而,當將此理論擴 充至多於兩個聲道時,會產生本發明所要解決之數個問題。 基本數學顯示:爲了從N個信號完成Μ個相互解相關 信號’需要Μ-Ν個解相關器,其中所有不同解相關器用以 從一共同輸入信號產生複數個相互正交輸出信號。假設一輸 费入X⑴產生一輸出y(t)且ψ|2]=ψ|2]及幾乎使交互相關 消失,則一解相關器通常是一全通或幾乎全通濾波器。另外 的知覺準則可獲得一良好解相關器之設計,設計方法之一些 範例在加入該原始信號至該解相關信號時亦可最小化梳形 濾波器特性及最小化在暫態信號上之一有時太長之脈衝響 應的效應。一些習知技藝解相關器使用一人造反射鏡來解相 關。習知技藝亦可藉由例如修改複雜子頻帶樣本之相位以包 括分數延遲,進而達到較高回聲密度及因而完成更長時間之 -35 - 1334736 擴散》 本發明提出用以修改一以反射鏡爲主之解相關器以便 達到多個可從一共同輸入信號產生複數個相互解相關輸出 信號之解相關器的方法。如果兩個解相關器之輸出y1(t)及 yz(t)具有消失或幾乎消失之交互相關(假設有相同輸入),則 使該兩個解相關器相互地解相關。假設該輸入係靜態白雜 訊’則接著在消失或幾乎消失之感知中該等脈衝響h 及h2必須是正交的。複數組之成對相互解相關解相關器可 以數個方式來建構。實施此修改之一有效方式係改變相位旋 轉因數q(爲該分數延遲之部分)。 本發明特定相位旋轉因數可以是在該等全通濾波器中 之延遲線的部分或剛好是一總分數延遲。在該後者情況中, 此方法並非局限於全通或反射鏡式濾波器,然而亦可應用至 例如包括一分數延遲部之簡單延遲。可在一Z-域中將該解相 關器中之一全通濾波器連結描述成爲: H{z) = φ 1-呼, 其中q係複數相位旋轉因數(Μ = 1),m係在樣本中之延 遲線長度,以及a係濾波器係數。其於穩定理由,該濾波器 係數之大小必須限制在|α| <1。然而,藉由使用替代瀘波器係 數a’ = -a,以界定一新反射鏡,其具有相同反射延遲特性’ 然而具有一與該未修改反射鏡之輸出顯著不相關之輸出。再 者,該相位旋轉因數q之修改可藉由例如加入一固定相位偏 移q' = qejc來完成。該常數C可用以做爲一固定相位偏移或 -36 - 1334736 可以下列方式來調整:針對所有被施加有該常數c之頻帶而 言,該常數c將對應於一固定時間偏移。該相位偏移常數c 亦可以是一隨機値’其對於所有頻帶而言係不同的β 依據本發明’藉由將一具有nx(m+p)大小之上行混音矩 陣Η應用至一具有(m + p)xl大小之行向量信號,以實施從m 個聲道產生η個聲道。 m 少= s • 其中!!1係1«個已下行混音及編碼信號,以及使在S中 之P信號兩者相互地解相關及與在m中之所有信號解相關。 這些解相關信號係藉由解相關器由在m中之信號所產生。然 後,使η個重建信號b'、…包含在該行向量中。 X , = Hy。 藉由第11圖來描述上述情況,其中該等解相關信號係 由該等解相關器1 102、1 103及1 104所產生。該上行混音矩 陣Η係由1101所提供,用以對該向量y操作以提供該輸出 ®信號X ·。 假設R = E [XX”爲該原始信號向量之相關矩陣,假設 R' = E[x'x〃]爲該重建信號之相關矩陣。在此及在下面中,對 於一具有複數項之向量X的矩陣而言,χΦ表示伴隨矩陣---X 之複數共軛轉置。 R之對角線包含該等能量値A、B、C...及可由上面所界 定之能量定額解碼成一總能量電平。因爲R/ = R,所以只有 n (n-1)/2個不同非對角線交互相關値,其包含將藉由調整該 -37- 1334736 上行混音矩陣Η來完全地或部分地重建之資訊。該完整相關 結構之重建對應於該情況R’ = R。正確能量電平之重建僅對 應於下列情況,其中R1及R在對角線上係相等的。 在從m = l聲道成爲n聲道之情況中,藉由使用p = n-l 個相互解相關解相關器(一上行混音矩陣Η)達成該完整相關 結構之重建,其中該上行混音矩陣Η滿足下列條件: HH' =—R Μ g 其中Μ係該單傳輸信號之能量。因爲R係正半定矩陣, 所以已熟知現在一個解答。再者,針對Η之設計保留η(η·1)/2 自由度,其係使用於本發明中以獲得該上行混音矩陣之另外 期望特性。一中心設計準則爲Η對該傳輸相關資料之相依性 應該是平順的。 參數化該上行混音矩陣之一傳統方式爲H = UDV,其中U 及V係正交矩陣以及D係一對角矩陣。可選擇D之絕對値 的平方等於R/M之特徵値。刪去V及挑選該等特徵値以便 φ將最大値應用至第一座標將最小化在該輸出中之解相關信 號的總能量。在實數情況中該正交矩陣U係藉由n(n-l)/2 旋轉角度來參數化。傳送在那些角度之形式中的相關資料及 D之η個對角値將立即提供Η之期望平順相依性。然而,因 爲能量資料必須被變換成特徵値,所以此方法犧牲可調能 力。 本發明所教示之第二方法係藉由以R = GR〇G來界定一正 規化相關矩陣R〇以使在R中之能量部與相關部分離,其中 G係一具有等於R之對角項的平方根之對角値(亦即,7^、 -38 - 1334736 #··.)的對角矩陣,R〇在對角線上具有相同對角値。假設HO 係一正交上行混行矩陣,其在同等能量之完全無關信號的情 況中界定較佳正規化上行混音》此較佳上行混音矩陣之範例 爲· Ί 1 1111 '1 -Γ 1 ,一 1 1 -72 1 » 一 11-1-1 1 1 2 >/2 — V2 0 2 1 一1 一1 1 1 _1 1 1 然後,以打=G57/。來界定上行混音,其中該矩陣S解 暑出SS'Ro。選擇此解答對在R〇中之正規化交互相關値的相 依性爲連續的,以便在R〇 = I之情況中S等於單位矩陣。 將該η個聲道分割成較少聲道之群係一種重建部分交互 相關結構之合宜方式。依據本發明,對於從1聲道重建5.1 聲道之情況而言,一特別有利編組爲{a,e},{c},{b,d}, {Π,其中沒有解相關應用至該等群{c}及{f},以及該等群{a, e}及{b,d}係藉由相同下行混音/解相關對之上行混音所產 生。對於這兩個子系統而言,選擇在完全未相關情況中之較 φ佳正規化上行混音分別成爲: 丄「1 -Γ]丄「1 1 ' 1」,万l· -1」。 因此,將只傳送及重建15個交互相關之總數中的兩個,亦 即,在聲道{a,e}與{b,d}間之交互相關。在上述所使用之術 語中,此對於n = 6、m=l及P=1之情況而言是設計上的一個 範例。該上行混音矩陣Η係6x2之大小且在第3及第6列上 的第2行中之對應於輸出c·及Γ的兩個項爲零。 -39- 1334736 本發明所教示之用以倂入解相關信號的第三方法係一 較簡單觀點:每一輸出聲道具有一不同解相關器,以造成解 相關信號Sa、Sb…。然後使該等重建信號成爲: a = 4 At M (/wcos% + sin%), b = 4bTM (m cos % + sb sin ), 等等。 該等參數cpa、(Pb…控制在輸出聲道a'、b'...中所呈現之 解相關信號的數量。該相關資料係以這些角度之形式來傳 送。可易於計算:在例如聲道a’與b·間之結果正規化交互相 關係等於乘積COS(paCOSCpb »當成對交互相關之數目爲 n(n-1)/2及具有η個解相關器時,如果n>3,則通常不可能 以此方法來匹配一特定相關結構,然而優點是一非常簡單且 穩定解碼方法及對在每一輸出聲道中所呈現之解相關信號 的所產生數量之直接控制。此能使解相關信號之混合係根據 倂入有例如聲道對之能量電平差的感知準則。 對於從m>l聲道重建n聲道之情況而言,不再將相關矩 陣Ry = E[y〆]假設爲對角矩陣,以及必須考慮到R' = HRylT對 該目標R之匹配。因爲Ry具有分塊矩陣結構
Rv = m y ί〇 所以產生簡化,其中% = £[111111*]及RS = E[SS·]。再者, 假設爲相互解相關解相關器,該矩陣Rs爲對角矩陣。注意 到此亦會影響有關於正確能量之重建的上行混音設計。解決 方法係要在該解碼器中計算或從編碼器傳送有關於該等下 -40 - 1334736 行混音信號之相關結構11„1的資訊。 對於從2聲道重建5.1聲道之情況,上行混音之較佳方 法爲: 〇 κ 0 κ 0 ' b· κ 0 心 0 C κ Κ 0 0 cf 0 Κ 0 Κ s\ e 0 κ 0 Κ -si. /. Λ Κι 0 0 _ 其中Si可從mpld之解相關來獲得及S2可從m2 = rd之解 相關來獲得。 在此’將該等群{a,b}及{d,e}視爲已考量成對交互相關 之分離1^2聲道系統。對於聲道c及f而言,調整加權,以 便 冰31 泔1+、2 所2N=C, ψ61»ί 丨 +;762«72|2j=F。 本發明可針對各種用於類比或數位信號之儲存或傳輸 的使用任意編解碼器之系統實施在硬體晶片及DSP中。第2 圖及第3圖顯示本發明之可能實施。在此範例中,顯示一用 以操作6個輸入信號之系統(一5 · 1聲道組態)。在顯示該編 碼器側之第2圖中’將該等分離聲道之類比輸入信號轉換成 爲數位信號201及使用每一聲道之濾波器組來分析202。將 該濾波器組之輸出饋入該環繞編碼器203,該環繞編碼器203 包括一參數產生器,其實施一下行混音以產生由該音頻編碼 器205所編碼之一個或二個聲道。再者,依據本發明擷取像 -41- 1334736 IID及ICC參數之環繞參數’以及依據本發明擷取用以槪述 資料之時間頻率格(time frequency grid)及哪一個參數化被 使用的控制資料204 »如本發明所教示,編碼該等擷取參數 2 06 ’以切換於不同參數化之間或以可調方式配置該等參 數。將該等環繞參數207、控制信號及編號下行混音信號208 多工處理209成爲一串列位元流。 在第3圖中,顯示一典型解碼器實施(亦即,一用以產 生多聲道重建之裝置)》在此,假設該音頻解碼器以一頻域 Φ 表示法輸出一信號,例如:在QMF合成濾波器組前之MPEG-4 高效率AAC解碼器的輸出。對該串列位元流實施解多工處 理301及將該編碼環繞資料饋入該環繞資料解碼器303及將 該等下行混音編碼聲道饋入該音頻解碼器3 02(在此範例中 爲MPEG-4高效率AAC解碼器)。該環繞資料解碼器解碼該 環繞資料及將其饋入該環繞解碼器305,該環繞解碼器305 包括一上行混音器,其依據該解碼下行混音聲道及該環繞資 料與該等控制信號以重建6個聲道。合成3 06該環繞解碼器 ® 之頻域輸出以成爲時域信號,接著將該等時域信號藉由DAC 307轉換成爲類比信號。 雖然主要已描述有關於平衡參數之產生及使用的本發 明’但是在此要強調用以獲得平衡參數之聲道對的相同編組 最好亦是用以計算聲道間同調參數或這兩個聲道對間之「寬 度」參數。此外,使用相同於該平衡參數計算所用之聲道對 亦可獲得聲道間時間差或一種「相位信號」。在接收器側上, 亦可使用除該等平衡參數之外或做爲該等平衡參數之替代 -42 - 1334736 的這些參數’以產生一多聲道重建。在另一情況中,除其它 參考聲道所決定之其它聲道間電平差之外,還可使用該等聲 道間同調參數或甚至該等聲道間時間差。然而,有鑑於如第 l〇a圖及第1 Ob圖所述之本發明的可調能力特徵,最好對所 有參數使用相同聲道對,以便在一可調位元流中每一調整層 包括用以重建該子群之輸出聲道的所有參數,其中該子群之 輸出聲道可藉由在第l〇b圖之列表的倒數第二行中所槪述之 個別調整層來產生。本發明在只計算在個別聲道對間之同調 ® 參數或時間差參數及將其傳送至一解碼器時係有用的。在此 情況中’當實施一多聲道重建時,該等電平參數已存在於該 解碼器以供使用。 可依據本發明方法之某些實施需求,以硬體或軟體方式 實施本發明方法。可使用一數位儲存媒體(特別是儲存有電 子可讀取控制信號之磁碟或光碟)來實施,該等電子可讀取 控制信號與一可程式電腦系統配合,以便實施本發明方法。 因此’本發明通常係一具有儲存在一機械可讀取載體中之程 ®式碼的電腦程式產品’當該電腦程式產品在一電腦上執行 時’該程式碼係操作用以實施本發明方法。因此,換句話說, 本發明方法係~具有程式碼之電腦程式,該程式碼用以在該 電腦程式在一電腦上執行時實施本發明方法中之至少一方 法。 【圖式簡單說明】 第1圖描述在本發明中之一 5 · 1聲道組態所使用的學術 用語; -43 - 1334736 第2圖描述本發明之一較佳實施例的一合適編碼器實 施; 第3圖描述本發明之一較佳實施例的一合適解碼器實 施; 第4圖描述依據本發明之多聲道信號的一較佳參數化; 第5圖描述依據本發明之多聲道信號的一較佳參數化; 第6圖描述依據本發明之多聲道信號的一較佳參數化; 第7圖描述一用以產生一單一基本聲道或兩個基本聲道 •之下行混音架構的示意裝設; 第8圖描述一上行混音架構之示意表示,該上行混音架 構係依據本發明平衡參數及該下行混音架構之資訊; 第9a圖剛要性地描述依據本發明在該編碼器側上之電 平參數的決定; 第9b圖剛要性地描述依據本發明在該解碼器側上之電 平參數的使用; 第10a圖描述一在位元流之不同層中具有該多聲道參數 Φ化之不同部分的可調式位元流; 第10b圖描述一可調能力表,其表示使用哪些平衡參數 來建構哪些聲道及不使用及計算哪些平衡參數及聲道;以及 第11圖描述依據本發明之上行混音矩陣的應用。 【主要元件符號說明】 101 左環繞聲道 102 左前聲道 103 中央聲道 -44- 右前聲道 右環繞 LEF聲 ADC 分析濾 環繞編 控制信 音頻編 環繞資 環繞參 編號下 多工器 解多工 音頻解 環繞資 控制信 環繞解 合成濾 D AC 下行混 電平參 電平校 位元流 位元流 聲道 道 波器組 碼器 號 碼器 料編碼器 數 行混音信號 器 碼器 料解碼器
Wi 碼器 波器組 音器 數計算器 正器 層 層 -45 - 1334736
1101 解 相 關 器 1103 解 相 關 器 1104 解 相 關 器 Id, rd 最 佳 體 聲 道 m 3 1, n 單 聲 道 r l 參 數 Γ2 參 數 Γ3 參 數 Γ4 參 數 Γ5 參 數 ΓΜ 額 外 參 數 a 加 權 因 數 β 加 權 因 數 Ί 加 權 因 數 δ 加 權 因 數 A 聲 道 B 聲 道 C 聲 道 D 聲 道 E 聲 道 E M D 主 下 行 混 音 E 〇 r i g 原 始 聲 道 之 能 量 E p D 參 數 下 行 混 音 F 重 建 聲 道 之 能 里 -46 -
Claims (1)
1334736 月修(更)正替換衷 ^______^ 第94126936號「用以產生電平參數之裝置及方法、用以產 生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體」 專利案 (2010年6月25日修正) 十、申請專利範圍:
1.—種用以在一多聲道信號之一參數表示內產生一電平參 數之裝置,該多聲道信號具有數個原始聲道,該參數表示 包括一參數組,該參數組在與至少一下行混音聲道一起使 用時允許一多聲道重建,該裝置包括: —電平參數計算器(900) ’用以計算一電平參數(rM),該 電平參數被計算以便由該電平參數所加權之該至少一下 行混音聲道的能量等於該等原始聲道之能量的加總;以及 一輸出介面,用以產生輸出資料,該輸出資料包括該電 平參數及該參數組或該電平參數及該至少一下行混音聲 道0 2.如申請專利範圍第1項之裝置,其中該電平參數計算器 係操作以計算該等原始聲道之能量的加總與該至少 ~下行混音聲道之能量間之比例的測量以做爲該電平參 數。 3·如申請專利範圍前述項中任一項之裝置,其中該參數表示 該至少一下行混音聲道之多個頻帶中的每一頻帶而言 包括一參數組,以及 其中該參數計算器(9 00)係操作以針對該等頻帶之每一 頻帶計算一電平參數》 1334736 4 ·如申請專利範圍第i項之裝置其中該參數表示包括針對 在該至少一下行混音聲道之一連續期間中之一期間的一 參數組’以及其中該電平參數計算器(则)係操作以針對在 該至少下行混音聲道之—連續期間中的每一期間,計算 一電平參數。 5 ·如申J專利範圍第!項之裝置其中該輸出介面係操作以 產生可調資料流’該可調資料流在—較低調整層中包括 該參數組之第-子群的參數,該第—子群之參數允許第— 子群之輸出聲道的重建, 該可調資料流在一較高調整層中包括該參數組之第二 子群的參數,該第二子群與該第一子群一起允許第二子群 之輸出聲道的重建,以及 其中該輸出介面進一步操作使該電平參數進入至該較 低調整層。 6.如申請專利範圍第1項之裝置,其中進—步包括一參數產 生器’該參數產生器係形成用以產生一左/右平衡參數以做 爲一第一平衡參數、一中央平衡參數做爲一第二平衡參 數、一前/後平衡參數做爲一第三平衡參數、一後-左/右平 衡參數做爲一第四平衡參數及一低頻增強平衡參數做爲 一第五平衡參數。 7·—種使用一參數表示以產生一原始多聲道信號之一重建 多聲道表示之裝置’該原始多聲道信號具有至少三個原始 聲道’該參數表示具有一參數組,該參數組在與至少一下 行混音聲道一起使用時允許一多聲道重建,該參數表示包 1334736 括一電平參數’該電平參數被計算,以便由該電平參數所 加權之該至少一下行混音聲道的能量等於該等原始聲道 之能量的加總,該裝置包括: —電平校正器(902) ’用以使用該電平參數以應用該至少 —下行混音聲道之電平校正’以便可藉由使用在該參數組 中之參數實施上行混音以獲得一校正多聲道重建。
8. 如申請專利範圍第7項之裝置,其中該電平參數係在複數 個聲道之能量間的比率,以及其中該電平校正器(902)係操 作以使用該電平參數來加權該至少一下行混音聲道。 9. 一種在一多聲道信號之一參數表示內產生一電平參數的 方法,該多聲道信號具有數個原始聲道,該參數表示包括 一參數組,該參數組在與至少一下行混音聲道一起使用時 允許一多聲道重建,該方法包括:
計算(900)—電平參數(rM),該電平參數被計算,以便由 該電平參數所加權之該至少一下行混音聲道的能量等於 該等原始聲道之能量的加總;以及 產生輸出資料,該輸出資料包括該電平參數及該參數組 或該電平參數及該至少一下行混音聲道。 10.—種使用一參數表示以產生一原始多聲道信號之—重建 多聲道表示的方法,該原始多聲道信號具有至少三個原始 聲道,該參數表示具有一參數組,該參數組在與至少一下 行混音聲道一起使用時允許一多聲道重建,該參數表示包 括一電平參數,計算該電平參數,以便由該電平參數所加 權之該至少一下行混音聲道的能量等於該等原始聲道之 1334736 能量的加總,該方法包括: 使用該電平參數以實施(9〇2)該至少一下行混音聲道之 電平校正’以便可藉由使用在該參數組中之參數實施上行 混音以獲得一校正多聲道重建。 11. 一種具有機械可讀取指令之電腦程式的記錄媒體,可在一 電腦上執行實施如申請專利範圍第9項或第10項所述之 方法。 .
12.—種儲存一參數表示之儲存媒體,其中該參數表示具有一 參數組,該參數組在與至少一下行混音聲道一起使用時允 許一多聲道重建,該參數表示包括一電平參數,該電平參 數被計算,以便由該電平參數所加權之該至少一下行混音 聲道的能量等於該等原始聲道之能量的加總,其中該儲存 媒體用以在輸入至如申請專利範圍第7項之裝置時控制一 多聲道重建。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0400998A SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Method for representing multi-channel audio signals |
PCT/EP2005/003848 WO2005101370A1 (en) | 2004-04-16 | 2005-04-12 | Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200637415A TW200637415A (en) | 2006-10-16 |
TWI334736B true TWI334736B (en) | 2010-12-11 |
Family
ID=32294334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094126936A TWI334736B (en) | 2004-04-16 | 2005-08-09 | Apparatus and method for generating a level parameter, apparatus and method for generating a multi-channel representation and a storage media stored parameter representation |
Country Status (13)
Country | Link |
---|---|
US (24) | US8223976B2 (zh) |
EP (2) | EP1695338B1 (zh) |
JP (4) | JP4589962B2 (zh) |
KR (2) | KR100848367B1 (zh) |
CN (4) | CN101860784B (zh) |
AT (2) | ATE373301T1 (zh) |
DE (2) | DE602005002942T2 (zh) |
ES (2) | ES2294703T3 (zh) |
HK (3) | HK1093594A1 (zh) |
PL (2) | PL1695338T3 (zh) |
SE (1) | SE0400998D0 (zh) |
TW (1) | TWI334736B (zh) |
WO (2) | WO2005101371A1 (zh) |
Families Citing this family (161)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60129742T2 (de) * | 2000-12-19 | 2008-04-30 | Azoteq (Proprietary) Ltd. | Verfahren und vorrichtung zum datentransfer |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
KR101283525B1 (ko) * | 2004-07-14 | 2013-07-15 | 돌비 인터네셔널 에이비 | 오디오 채널 변환 |
TWI498882B (zh) * | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
CN101151660B (zh) * | 2005-03-30 | 2011-10-19 | 皇家飞利浦电子股份有限公司 | 多通道音频编码器、解码器以及相应方法 |
ATE473502T1 (de) | 2005-03-30 | 2010-07-15 | Koninkl Philips Electronics Nv | Mehrkanal-audiocodierung |
PL1866911T3 (pl) * | 2005-03-30 | 2010-12-31 | Koninl Philips Electronics Nv | Skalowalne, wielokanałowe kodowanie dźwięku |
US7961890B2 (en) | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
EP1899958B1 (en) | 2005-05-26 | 2013-08-07 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
WO2007026821A1 (ja) * | 2005-09-02 | 2007-03-08 | Matsushita Electric Industrial Co., Ltd. | エネルギー整形装置及びエネルギー整形方法 |
WO2007046660A1 (en) | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
CN1993002B (zh) * | 2005-12-28 | 2010-06-16 | 雅马哈株式会社 | 声像定位设备 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
KR100803212B1 (ko) | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
TWI333386B (en) | 2006-01-19 | 2010-11-11 | Lg Electronics Inc | Method and apparatus for processing a media signal |
EP3267439A1 (en) * | 2006-02-03 | 2018-01-10 | Electronics and Telecommunications Research Institute | Method and apparatus for control of rendering multiobject or multichannel audio signal using spatial cue |
US8160258B2 (en) | 2006-02-07 | 2012-04-17 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100773562B1 (ko) * | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
JP5051782B2 (ja) * | 2006-03-13 | 2012-10-17 | フランス・テレコム | 音声合成と空間化との結合方法 |
EP1990800B1 (en) * | 2006-03-17 | 2016-11-16 | Panasonic Intellectual Property Management Co., Ltd. | Scalable encoding device and scalable encoding method |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
US8619998B2 (en) * | 2006-08-07 | 2013-12-31 | Creative Technology Ltd | Spatial audio enhancement processing method and apparatus |
CN101578654B (zh) | 2006-07-04 | 2013-04-24 | 韩国电子通信研究院 | 用于恢复多通道音频信号的设备和方法 |
FR2903562A1 (fr) * | 2006-07-07 | 2008-01-11 | France Telecom | Spatialisation binaurale de donnees sonores encodees en compression. |
EP2038878B1 (en) | 2006-07-07 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for combining multiple parametrically coded audio sources |
KR100763920B1 (ko) | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
EP2070392A2 (en) * | 2006-09-14 | 2009-06-17 | Koninklijke Philips Electronics N.V. | Sweet spot manipulation for a multi-channel signal |
JP4946305B2 (ja) * | 2006-09-22 | 2012-06-06 | ソニー株式会社 | 音響再生システム、音響再生装置および音響再生方法 |
WO2008044916A2 (en) * | 2006-09-29 | 2008-04-17 | Avinity Systems B.V. | Method for streaming parallel user sessions, system and computer software |
BRPI0711102A2 (pt) | 2006-09-29 | 2011-08-23 | Lg Eletronics Inc | métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto |
EP2575129A1 (en) | 2006-09-29 | 2013-04-03 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
US8687829B2 (en) * | 2006-10-16 | 2014-04-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for multi-channel parameter transformation |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
KR101128815B1 (ko) | 2006-12-07 | 2012-03-27 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
EP2632165B1 (en) | 2007-01-12 | 2015-09-30 | ActiveVideo Networks, Inc. | Interactive encoded content system including object models for viewing on a remote device |
EP2111618A4 (en) * | 2007-02-13 | 2010-04-21 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL |
WO2008114984A1 (en) | 2007-03-16 | 2008-09-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US8612237B2 (en) * | 2007-04-04 | 2013-12-17 | Apple Inc. | Method and apparatus for determining audio spatial quality |
US8644970B2 (en) | 2007-06-08 | 2014-02-04 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US20090037386A1 (en) * | 2007-08-03 | 2009-02-05 | Dietmar Theobald | Computer file processing |
US8295494B2 (en) | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
CN101889307B (zh) * | 2007-10-04 | 2013-01-23 | 创新科技有限公司 | 相位-幅度3d立体声编码器和解码器 |
DE102007048973B4 (de) | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
WO2009050896A1 (ja) * | 2007-10-16 | 2009-04-23 | Panasonic Corporation | ストリーム合成装置、復号装置、方法 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
EP2215629A1 (en) * | 2007-11-27 | 2010-08-11 | Nokia Corporation | Multichannel audio coding |
WO2009069228A1 (ja) * | 2007-11-30 | 2009-06-04 | Pioneer Corporation | センターチャンネル定位装置 |
US8615316B2 (en) | 2008-01-23 | 2013-12-24 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
WO2009093866A2 (en) | 2008-01-23 | 2009-07-30 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
CN102027535A (zh) * | 2008-04-11 | 2011-04-20 | 诺基亚公司 | 信号处理 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
CN102099854B (zh) * | 2008-07-15 | 2012-11-28 | Lg电子株式会社 | 处理音频信号的方法和装置 |
TWI559786B (zh) | 2008-09-03 | 2016-11-21 | 杜比實驗室特許公司 | 增進多聲道之再生 |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
US9330671B2 (en) | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
DE102008056704B4 (de) * | 2008-11-11 | 2010-11-04 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2010082471A1 (ja) * | 2009-01-13 | 2010-07-22 | パナソニック株式会社 | 音響信号復号装置及びバランス調整方法 |
AU2015246158B2 (en) * | 2009-03-17 | 2017-10-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding. |
GB2470059A (en) | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
WO2010140350A1 (ja) * | 2009-06-02 | 2010-12-09 | パナソニック株式会社 | ダウンミックス装置、符号化装置、及びこれらの方法 |
US9393412B2 (en) | 2009-06-17 | 2016-07-19 | Med-El Elektromedizinische Geraete Gmbh | Multi-channel object-oriented audio bitstream processor for cochlear implants |
US20100322446A1 (en) * | 2009-06-17 | 2010-12-23 | Med-El Elektromedizinische Geraete Gmbh | Spatial Audio Object Coding (SAOC) Decoder and Postprocessor for Hearing Aids |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
JP2011066868A (ja) * | 2009-08-18 | 2011-03-31 | Victor Co Of Japan Ltd | オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置 |
US8786852B2 (en) | 2009-12-02 | 2014-07-22 | Lawrence Livermore National Security, Llc | Nanoscale array structures suitable for surface enhanced raman scattering and methods related thereto |
TWI444989B (zh) * | 2010-01-22 | 2014-07-11 | Dolby Lab Licensing Corp | 針對改良多通道上混使用多通道解相關之技術 |
RU2586851C2 (ru) * | 2010-02-24 | 2016-06-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа |
JP5604933B2 (ja) * | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
DE102010015630B3 (de) * | 2010-04-20 | 2011-06-01 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
CN102314882B (zh) * | 2010-06-30 | 2012-10-17 | 华为技术有限公司 | 声音信号通道间延时估计的方法及装置 |
WO2012009851A1 (en) | 2010-07-20 | 2012-01-26 | Huawei Technologies Co., Ltd. | Audio signal synthesizer |
US8908874B2 (en) | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
CA2814070A1 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
TWI573131B (zh) * | 2011-03-16 | 2017-03-01 | Dts股份有限公司 | 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器 |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
TWI450266B (zh) * | 2011-04-19 | 2014-08-21 | Hon Hai Prec Ind Co Ltd | 電子裝置及音頻資料的解碼方法 |
EP2523472A1 (en) | 2011-05-13 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels |
EP2530956A1 (en) * | 2011-06-01 | 2012-12-05 | Tom Van Achte | Method for generating a surround audio signal from a mono/stereo audio signal |
KR102115723B1 (ko) | 2011-07-01 | 2020-05-28 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법 |
US9118999B2 (en) * | 2011-07-01 | 2015-08-25 | Dolby Laboratories Licensing Corporation | Equalization of speaker arrays |
KR101842257B1 (ko) * | 2011-09-14 | 2018-05-15 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
JP5505395B2 (ja) * | 2011-10-28 | 2014-05-28 | ヤマハ株式会社 | 音響処理装置 |
WO2013064957A1 (en) | 2011-11-01 | 2013-05-10 | Koninklijke Philips Electronics N.V. | Audio object encoding and decoding |
CN103188595B (zh) * | 2011-12-31 | 2015-05-27 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
US10409445B2 (en) | 2012-01-09 | 2019-09-10 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
CN103220058A (zh) * | 2012-01-20 | 2013-07-24 | 旭扬半导体股份有限公司 | 音频数据与视觉数据同步装置及其方法 |
US9436929B2 (en) * | 2012-01-24 | 2016-09-06 | Verizon Patent And Licensing Inc. | Collaborative event playlist systems and methods |
ITTO20120067A1 (it) | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
US9395304B2 (en) | 2012-03-01 | 2016-07-19 | Lawrence Livermore National Security, Llc | Nanoscale structures on optical fiber for surface enhanced Raman scattering and methods related thereto |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
BR112015018522B1 (pt) * | 2013-02-14 | 2021-12-14 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix. |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
US20150371646A1 (en) * | 2013-02-14 | 2015-12-24 | Dolby Laboratories Licensing Corporation | Time-Varying Filters for Generating Decorrelation Signals |
WO2014126688A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
US9093064B2 (en) | 2013-03-11 | 2015-07-28 | The Nielsen Company (Us), Llc | Down-mixing compensation for audio watermarking |
US10275128B2 (en) | 2013-03-15 | 2019-04-30 | Activevideo Networks, Inc. | Multiple-mode system and method for providing user selectable video content |
CN109509478B (zh) * | 2013-04-05 | 2023-09-05 | 杜比国际公司 | 音频处理装置 |
EP2989631A4 (en) * | 2013-04-26 | 2016-12-21 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER |
CA3123374C (en) | 2013-05-24 | 2024-01-02 | Dolby International Ab | Coding of audio scenes |
CN105229731B (zh) | 2013-05-24 | 2017-03-15 | 杜比国际公司 | 根据下混的音频场景的重构 |
EP3005351A4 (en) * | 2013-05-28 | 2017-02-01 | Nokia Technologies OY | Audio signal encoder |
US9326047B2 (en) | 2013-06-06 | 2016-04-26 | Activevideo Networks, Inc. | Overlay rendering of user interface onto source video |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9386558B2 (en) * | 2013-06-27 | 2016-07-05 | Microsoft Technology Licensing, Llc | Radio channel utilization |
EP3028274B1 (en) | 2013-07-29 | 2019-03-20 | Dolby Laboratories Licensing Corporation | Apparatus and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
CN103413553B (zh) * | 2013-08-20 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、编码端、解码端和系统 |
CN117767898A (zh) | 2013-09-12 | 2024-03-26 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
EP4379714A3 (en) * | 2013-09-12 | 2024-08-14 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
WO2015036350A1 (en) | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
EP3061089B1 (en) * | 2013-10-21 | 2018-01-17 | Dolby International AB | Parametric reconstruction of audio signals |
JP6201047B2 (ja) | 2013-10-21 | 2017-09-20 | ドルビー・インターナショナル・アーベー | オーディオ信号のパラメトリック再構成のための脱相関器構造 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
US9391575B1 (en) * | 2013-12-13 | 2016-07-12 | Amazon Technologies, Inc. | Adaptive loudness control |
CN106170991B (zh) * | 2013-12-13 | 2018-04-24 | 无比的优声音科技公司 | 用于音场增强的设备及方法 |
US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
US9779739B2 (en) | 2014-03-20 | 2017-10-03 | Dts, Inc. | Residual encoding in an object-based audio system |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US9984693B2 (en) * | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
WO2016196211A1 (en) | 2015-05-29 | 2016-12-08 | Armo Biosciences, Inc. | Methods of using interleukin-10 for treating diseases and disorders |
US12125492B2 (en) | 2015-09-25 | 2024-10-22 | Voiceage Coproration | Method and system for decoding left and right channels of a stereo sound signal |
WO2017049400A1 (en) | 2015-09-25 | 2017-03-30 | Voiceage Corporation | Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget |
JP6620235B2 (ja) * | 2015-10-27 | 2019-12-11 | アンビディオ,インコーポレイテッド | サウンドステージ拡張のための機器及び方法 |
MY196198A (en) | 2016-11-08 | 2023-03-22 | Fraunhofer Ges Forschung | Apparatus and Method for Downmixing or Upmixing a Multichannel Signal Using Phase Compensation |
US10979844B2 (en) * | 2017-03-08 | 2021-04-13 | Dts, Inc. | Distributed audio virtualization systems |
CN108665902B (zh) * | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
EP3422738A1 (en) * | 2017-06-29 | 2019-01-02 | Nxp B.V. | Audio processor for vehicle comprising two modes of operation depending on rear seat occupation |
CN109215667B (zh) | 2017-06-29 | 2020-12-22 | 华为技术有限公司 | 时延估计方法及装置 |
SG11202000510VA (en) * | 2017-07-28 | 2020-02-27 | Fraunhofer Ges Forschung | Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
GB201718341D0 (en) * | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
GB2574667A (en) * | 2018-06-15 | 2019-12-18 | Nokia Technologies Oy | Spatial audio capture, transmission and reproduction |
GB2580057A (en) * | 2018-12-20 | 2020-07-15 | Nokia Technologies Oy | Apparatus, methods and computer programs for controlling noise reduction |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
KR20210060253A (ko) | 2019-11-18 | 2021-05-26 | 삼성전자주식회사 | 메모리 컨트롤러, 메모리 시스템 및 이의 동작 방법 |
EP4243015A4 (en) | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | AUDIO PROCESSING APPARATUS AND METHOD |
US11451919B2 (en) | 2021-02-19 | 2022-09-20 | Boomcloud 360, Inc. | All-pass network system for colorless decorrelation with constraints |
EP4320615A1 (en) * | 2021-04-06 | 2024-02-14 | Dolby International AB | Encoding of envelope information of an audio downmix signal |
CN113301329B (zh) * | 2021-05-21 | 2022-08-05 | 康佳集团股份有限公司 | 基于图像识别的电视声场校正方法、装置及显示设备 |
CN116962955A (zh) * | 2022-04-15 | 2023-10-27 | 华为技术有限公司 | 多通道的混音方法、设备及介质 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
AU653582B2 (en) * | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5291557A (en) * | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
EP0688113A2 (en) * | 1994-06-13 | 1995-12-20 | Sony Corporation | Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio |
JP3397001B2 (ja) * | 1994-06-13 | 2003-04-14 | ソニー株式会社 | 符号化方法及び装置、復号化装置、並びに記録媒体 |
US6029129A (en) * | 1996-05-24 | 2000-02-22 | Narrative Communications Corporation | Quantizing audio data using amplitude histogram |
EP0924962B1 (en) * | 1997-04-10 | 2012-12-12 | Sony Corporation | Encoding method and device, decoding method and device, and recording medium |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6437944B2 (en) | 1997-10-20 | 2002-08-20 | Fujitsu Limited | Head slider supporting device, disk device and suspension |
US6122619A (en) | 1998-06-17 | 2000-09-19 | Lsi Logic Corporation | Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor |
US6322189B1 (en) | 1999-01-13 | 2001-11-27 | Hewlett-Packard Company | Multiple printhead apparatus with temperature control and method |
US6578074B1 (en) | 1999-06-25 | 2003-06-10 | Mediaone Group, Inc. | Provisioning server enhancement |
JP2001100792A (ja) * | 1999-09-28 | 2001-04-13 | Sanyo Electric Co Ltd | 符号化方法、符号化装置およびそれを備える通信システム |
JP4424566B2 (ja) | 1999-10-26 | 2010-03-03 | ザ・インクテック株式会社 | アルカリ可溶性接着剤 |
JP2002175097A (ja) * | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
JP3951690B2 (ja) * | 2000-12-14 | 2007-08-01 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
TW569551B (en) | 2001-09-25 | 2004-01-01 | Roger Wallace Dressler | Method and apparatus for multichannel logic matrix decoding |
GB0124580D0 (en) | 2001-10-12 | 2001-12-05 | Univ Reading | New composition |
AU2002343151A1 (en) | 2001-11-23 | 2003-06-10 | Koninklijke Philips Electronics N.V. | Perceptual noise substitution |
US6890125B1 (en) | 2002-01-30 | 2005-05-10 | Calder Brothers Corporation | Adjustable screed system |
AU2003202773A1 (en) | 2002-03-07 | 2003-09-16 | Koninklijke Philips Electronics N.V. | User controlled multi-channel audio conversion system |
DE60331535D1 (de) * | 2002-04-10 | 2010-04-15 | Koninkl Philips Electronics Nv | Kodierung und Dekodierung für mehrkanalige Signale |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
ES2280736T3 (es) * | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
US8498422B2 (en) * | 2002-04-22 | 2013-07-30 | Koninklijke Philips N.V. | Parametric multi-channel audio representation |
CA2473343C (en) * | 2002-05-03 | 2012-03-27 | Harman International Industries, Incorporated | Multichannel downmixing device |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
CN1671292A (zh) | 2002-07-23 | 2005-09-21 | 嘉吉有限公司 | 处理谷物和黍类的方法 |
KR20040043743A (ko) * | 2002-11-19 | 2004-05-27 | 주식회사 디지털앤디지털 | 멀티채널 검색장치와 방법 |
RU2006111442A (ru) | 2003-09-10 | 2006-09-10 | Эй.Ди.Ай. ВИДЕО ТЕКНОЛОДЖИЗ ЛТД. (IL) | Устройство, система и способ многоканальной обработки |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US20050169846A1 (en) | 2004-01-31 | 2005-08-04 | Bart Kennington | Enhancement of fragrance release from candles |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
US7961890B2 (en) | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
JP2007096002A (ja) * | 2005-09-29 | 2007-04-12 | Matsushita Electric Ind Co Ltd | 半導体装置の製造方法および半導体装置 |
TWI333386B (en) * | 2006-01-19 | 2010-11-11 | Lg Electronics Inc | Method and apparatus for processing a media signal |
JP2008003007A (ja) * | 2006-06-23 | 2008-01-10 | Fujitsu Ltd | 個体認識方法及び装置、個体認識範囲調整方法、及びプログラム |
JP5228305B2 (ja) | 2006-09-08 | 2013-07-03 | ソニー株式会社 | 表示装置、表示方法 |
US8687829B2 (en) | 2006-10-16 | 2014-04-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for multi-channel parameter transformation |
KR101290394B1 (ko) | 2007-10-17 | 2013-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다운믹스를 이용한 오디오 코딩 |
JP5428564B2 (ja) | 2009-06-18 | 2014-02-26 | 東洋紡株式会社 | 車両内装材用部材およびそれを用いた車両用内装材 |
-
2004
- 2004-04-16 SE SE0400998A patent/SE0400998D0/xx unknown
-
2005
- 2005-04-12 CN CN201010183360.1A patent/CN101860784B/zh active Active
- 2005-04-12 EP EP05743164A patent/EP1695338B1/en active Active
- 2005-04-12 CN CN201110097029.2A patent/CN102157155B/zh active Active
- 2005-04-12 CN CN2005800186599A patent/CN1965351B/zh active Active
- 2005-04-12 CN CN2005800073514A patent/CN1930608B/zh active Active
- 2005-04-12 PL PL05743164T patent/PL1695338T3/pl unknown
- 2005-04-12 JP JP2007505521A patent/JP4589962B2/ja active Active
- 2005-04-12 JP JP2007507735A patent/JP4603037B2/ja active Active
- 2005-04-12 DE DE602005002942T patent/DE602005002942T2/de active Active
- 2005-04-12 ES ES05735201T patent/ES2294703T3/es active Active
- 2005-04-12 EP EP05735201A patent/EP1735775B8/en active Active
- 2005-04-12 PL PL05735201T patent/PL1735775T3/pl unknown
- 2005-04-12 AT AT05743164T patent/ATE373301T1/de not_active IP Right Cessation
- 2005-04-12 WO PCT/EP2005/003849 patent/WO2005101371A1/en active IP Right Grant
- 2005-04-12 DE DE602005002451T patent/DE602005002451T2/de active Active
- 2005-04-12 ES ES05743164T patent/ES2293578T3/es active Active
- 2005-04-12 KR KR1020067017536A patent/KR100848367B1/ko active IP Right Grant
- 2005-04-12 WO PCT/EP2005/003848 patent/WO2005101370A1/en active IP Right Grant
- 2005-04-12 AT AT05735201T patent/ATE376240T1/de not_active IP Right Cessation
- 2005-04-12 KR KR1020067021198A patent/KR100848365B1/ko active IP Right Grant
- 2005-08-09 TW TW094126936A patent/TWI334736B/zh active
-
2006
- 2006-09-08 US US11/517,900 patent/US8223976B2/en active Active
- 2006-10-16 US US11/549,963 patent/US7986789B2/en active Active
-
2007
- 2007-01-10 HK HK07100363A patent/HK1093594A1/xx unknown
-
2010
- 2010-08-09 JP JP2010178268A patent/JP5185337B2/ja active Active
- 2010-08-19 JP JP2010183775A patent/JP5185340B2/ja active Active
- 2010-08-31 US US12/872,507 patent/US8693696B2/en active Active
- 2010-09-15 US US12/882,894 patent/US8538031B2/en active Active
- 2010-11-11 HK HK10110525.1A patent/HK1144043A1/zh unknown
-
2012
- 2012-02-02 HK HK12100944.3A patent/HK1163911A1/zh unknown
-
2013
- 2013-04-19 US US13/866,947 patent/US10015597B2/en active Active
-
2014
- 2014-01-16 US US14/157,117 patent/US9743185B2/en active Active
-
2016
- 2016-03-22 US US15/077,798 patent/US9635462B2/en active Active
- 2016-03-24 US US15/079,653 patent/US9621990B2/en active Active
-
2017
- 2017-02-07 US US15/426,867 patent/US10271142B2/en active Active
- 2017-04-26 US US15/498,413 patent/US10440474B2/en active Active
- 2017-04-26 US US15/498,407 patent/US9972329B2/en active Active
- 2017-04-26 US US15/498,350 patent/US10244319B2/en active Active
- 2017-04-26 US US15/498,393 patent/US10129645B2/en active Active
- 2017-04-26 US US15/498,417 patent/US9972330B2/en active Active
- 2017-04-26 US US15/498,362 patent/US10250984B2/en active Active
- 2017-04-26 US US15/498,389 patent/US10250985B2/en active Active
- 2017-04-26 US US15/498,376 patent/US10244320B2/en active Active
- 2017-04-26 US US15/498,384 patent/US10244321B2/en active Active
- 2017-04-26 US US15/498,401 patent/US9972328B2/en active Active
-
2019
- 2019-06-27 US US16/454,250 patent/US10499155B2/en active Active
- 2019-09-26 US US16/584,655 patent/US10623860B2/en active Active
-
2020
- 2020-04-13 US US16/846,828 patent/US11184709B2/en active Active
-
2021
- 2021-11-22 US US17/532,962 patent/US11647333B2/en active Active
-
2023
- 2023-05-03 US US18/311,854 patent/US12075224B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI334736B (en) | Apparatus and method for generating a level parameter, apparatus and method for generating a multi-channel representation and a storage media stored parameter representation | |
TWI313857B (en) | Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals | |
TWI458365B (zh) | 用以產生電平參數之裝置及方法、用以產生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體 |