Nothing Special   »   [go: up one dir, main page]

DE602006000239T2 - Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter - Google Patents

Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter Download PDF

Info

Publication number
DE602006000239T2
DE602006000239T2 DE602006000239T DE602006000239T DE602006000239T2 DE 602006000239 T2 DE602006000239 T2 DE 602006000239T2 DE 602006000239 T DE602006000239 T DE 602006000239T DE 602006000239 T DE602006000239 T DE 602006000239T DE 602006000239 T2 DE602006000239 T2 DE 602006000239T2
Authority
DE
Germany
Prior art keywords
parameter
channel
channels
energy
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602006000239T
Other languages
English (en)
Other versions
DE602006000239D1 (de
Inventor
Jonas Roeden
Jonas Engdegard
Heiko Purnhagen
Jeroen Breebaart
Erik Schuijers
Steven Van De Par
Johannes Hilpert
Jürgen HERRE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Koninklijke Philips NV
Coding Technologies Sweden AB
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Koninklijke Philips Electronics NV, Coding Technologies Sweden AB filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of DE602006000239D1 publication Critical patent/DE602006000239D1/de
Application granted granted Critical
Publication of DE602006000239T2 publication Critical patent/DE602006000239T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Quantisierung von räumlichen Audioparametern und insbesondere auf ein Konzept zum Ermöglichen einer effizienteren Komprimierung, ohne die Wahrnehmungsqualität eines unter Verwendung der quantisierten räumlichen Audioparameter rekonstruierten Audiosignals beträchtlich zu verringern.
  • Hintergrund der Erfindung und Stand der Technik
  • In letzter Zeit werden Mehrkanalaudioreproduktionstechniken immer wichtiger. Angesichts einer effizienten Übertragung von Mehrkanalaudiosignalen, die 5 oder mehr separate Audiokanäle aufweisen, wurden mehrere Arten und Weisen, ein Stereo- oder Mehrkanalsignal zu komprimieren, entwickelt. Lösungsansätze jüngeren Datums bezüglich des parametrischen Codierens von Mehrkanalaudiosignalen (parametric stereo (PS – parametric stereo), „Binaural-Cue-Codierung" (BCC, Binaural-Hinweis-Codierung) etc.) stellen ein Mehrkanalaudiosignal mittels eines Abwärtsmischsignals (könnte monophon sein oder mehrere Kanäle aufweisen) und parametrischer Nebeninformationen, auch als „räumliche Hinweise" bezeichnet, die seine wahrgenommene räumliche Klangstufe charakterisieren, dar.
  • Eine Mehrkanalcodierungsvorrichtung empfängt allgemein – als Eingang – zumindest zwei Kanäle und gibt einen oder mehrere Trägerkanäle und parametrische Daten aus. Die parametrischen Daten werden derart abgeleitet, dass in einem Decodierer eine Annäherung des ursprünglichen Mehrkanalsignals berechnet werden kann. Normalerweise umfasst der Trägerkanal (umfassen die Trägerkanäle) Teilbandabtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte usw., die eine vergleichsweise feine Darstellung des zu Grunde liegenden Signals liefern, während die parametrischen Daten keine derartigen Abtastwerte von spektralen Koeffizienten umfassen, sondern stattdessen Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus umfassen. Eine derartige Rekonstruktion könnte ein Gewichten mittels Multiplikation, Zeitverschiebung, Frequenzverschiebung, Phasenverschiebung usw. umfassen. Somit umfassen die parametrischen Daten lediglich eine vergleichsweise grobe Darstellung des Signals oder des zugeordneten Kanals.
  • Die Binaural-Cue-Codierung-Technik (BCC-Technik) wird in einer Anzahl von Veröffentlichungen beschrieben, beispielsweise in „Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES Convention Paper 5574, Mai 2002, München, in den 2 ICASSP-Veröffentlichungen „Estimation of auditory spatial cues for binaural cue coding" und „Binaural cue coding: a normal and efficient representation of spatial audio", die beide von C. Faller und F. Baumgarte, Orlando, FL, Mai 2002, verfasst wurden.
  • Bei der BCC-Codierung wird eine Anzahl von Audioeingangskanälen unter Verwendung einer auf DFT (Discrete Fourier Transform – diskrete Fourier-Transformation) beruhenden Transformation mit überlappenden Fenstern in eine spektrale Darstellung umgewandelt. Das sich ergebende einheitliche Spektrum wird dann in nicht-überlappende Partitionen aufgeteilt. Jede Partition weist eine Bandbreite auf, die zu der äquivalenten rechteckigen Bandbreite (ERB – equivalent rectangular bandwidth) proportional ist. Dann werden für jede Partition räumliche Parameter geschätzt, die als ICLD (Inter-Channel Level Difference – Zwischen-Kanal-Pegeldifferenz) und ICTD (Inter-Channel Time Difference – Zwischen-Kanal-Zeitdifferenz) bezeichnet werden. Der ICLD-Parameter beschreibt eine Pegeldifferenz zwischen zwei Kanälen, und der ICTD-Parameter beschreibt die Zeitdifferenz (Phasenverschiebung) zwischen zwei Signalen verschiedener Kanäle. Die Pegeldifferenzen und die Zeitdifferenzen werden normalerweise für jeden Kanal bezüglich eines Referenzkanals angegeben. Nach der Ableitung dieser Parameter werden die Parameter quantisiert und schließlich zum Senden codiert.
  • Obwohl ICLD- und ICTD-Parameter die wichtigsten Schallquellenlokalisierungsparameter darstellen, kann eine räumliche Darstellung unter Verwendung dieser Parameter durch eine Einführung zusätzlicher Parameter verbessert werden.
  • Eine verwandte Technik, die als „parametrisches Stereo" bezeichnet wird, beschreibt das parametrische Codieren eines Zweikanal-Stereosignals auf der Basis eines gesendeten Monosignals plus Parameternebeninformationen. Dort werden 3 Arten von räumlichen Parametern, die als inter-channel intensity difference (IIDs – Zwischen-Kanal-Intensitätsdifferenz), inter-channel Phase differences (IPDs – Zwischen-Kanal-Phasendifferenzen) und inter-channel coherence (IC – Zwischen-Kanal-Kohärenz) bezeichnet werden, eingeführt. Die Erweiterung des räumlichen Parametersatzes mit einem Kohärenzparameter (Korrelationsparameter) ermöglicht eine Parametrisierung der wahrgenommenen räumlichen „Unschärfe" oder räumlichen „Kompaktheit" der Tonstufe. Parametrisches Stereo wird ausführlicher bei "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, S. 1305–1322)", bei "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116th Convention, Preprint 6072, Berlin, Mai 2004, and bei "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, Preprint 6073, Berlin, Mai 2004, beschrieben.
  • Die internationale Veröffentlichung WO 2004/008805 A1 lehrt, wie ein Mehrkanalaudiosignal vorteilhafterweise komprimiert werden kann, indem mehrere Parametrisches- Stereo-Module kombiniert werden, wodurch eine hierarchische Struktur verwirklicht wird, um eine Darstellung des ursprünglichen Mehrkanalaudiosignals abzuleiten, das ein Abwärtsmischsignal und parametrische Nebeninformationen aufweist.
  • Bei dem Lösungsansatz der BCC und des parametrischen Stereo (PS) ist eine Darstellung der Pegeldifferenzen (auch als Intensitätsdifferenzen ICLD oder Energiedifferenzen IID bezeichnet) zwischen Audiokanälen ein wesentlicher Bestandteil einer parametrischen Darstellung eines stereophonen/Mehrkanalaudiosignals. Derartige Informationen und andere räumliche Parameter werden für jeden Zeit-/Frequenzschlitz von dem Codierer an den Decodierer gesendet. Angesichts der Codierungseffizienz besteht somit ein großes Interesse daran, diese Parameter so kompakt wie möglich darzustellen und dabei die Audioqualität beizubehalten.
  • Bei der BCC-Codierung werden die Pegeldifferenzen relativ zu einem so genannten „Referenzkanal" dargestellt und werden auf einer einheitlichen Skala in dB-Einheiten relativ zu einem Referenzkanal quantisiert. Die Tatsache, dass Kanäle mit einem niedrigen Pegel bezüglich des Referenzkanals einem beträchtlichen Maskierungseffekt unterworfen sind, wenn menschliche Zuhörer ihnen zuhören, wird damit nicht optimal genutzt. In dem extremen Fall eines Kanals, der überhaupt kein Signal aufweist, ist die Bandbreite, die von Parametern benutzt wird, die diesen bestimmten Kanal beschreiben, vollständig verschwendet. In dem häufigeren Fall, bei dem ein Kanal viel schwächer ist als ein anderer Kanal, das heißt ein Zuhörer den schwachen Kanal während der Wiedergabe kaum hören kann, würde eine weniger präzise Reproduktion des schwachen Kanals ebenfalls zu derselben Wahrnehmungsqualität des Zuhörers führen, da das schwache Signal hauptsächlich durch das stärkere Signal maskiert wird.
  • Um die Situation und die Probleme, die beim Codieren eines Mehrkanalsignals entstehen, zu erläutern, wird auf 10a Bezug genommen, bei der ein häufig verwendetes 5-Kanal-Signal veranschaulicht ist. Die 5-Kanal-Konfiguration weist einen linken rückwärtigen Kanal 101 (A, der ein Signal a(t) aufweist), einen Links-Vorne-Kanal 102 (B, der ein Signal b(t) aufweist), einen Mittekanal 103 (C, der ein Signal c(t) aufweist), einen Rechts-Vorne-Kanal 104 (D, der ein Signal d(t) aufweist) und einen Rechts-Hinten-Kanal 105 (E, der ein Signal e(t) aufweist), auf. Intensitätsbeziehungen zwischen Einzelkanälen oder Kanalpaaren sind mit Pfeilen markiert. Somit ist die Intensitätsverteilung zwischen dem Vorne-Links-Kanal 102 und dem Vorne-Rechts-Kanal 104 mit r1 (110) markiert, die Intensitätsverteilung zwischen dem Links-Hinten-Kanal und dem Rechts-Hinten-Kanal ist mit r4 (112) markiert. Die Intensitätsverteilung zwischen der Kombination des Links-Vorne-Kanals 102 und des Rechts-Vorne-Kanals 104 und dem Mittekanal 103 ist mit r2 (114) markiert, und die Intensitätsverteilung zwischen der Kombination der hinteren Kanäle und der Kombination der vorderen Kanäle ist mit r3 (116) markiert.
  • Wenn beispielsweise ein einfacher Monolog aufgezeichnet wird, ist ein Großteil der Energie in dem Mittekanal 103 enthalten. Bei diesem Beispiel enthalten vor allem die hinteren Kanäle nur wenig (oder 0) Energie. Somit sind Parameter, die die Eigenschaften der hinteren Kanäle beschreiben, bei diesem Beispiel nahezu verschwendet, da hauptsächlich der Mittekanal 102 oder die vorderen Kanäle während der Wiedergabe aktiv sind.
  • Auf der Basis der 10a werden in dem folgenden Absatz Möglichkeiten zum Berechnen der Energieverteilung zwischen Kanälen oder Kanalkombinationen beschrieben.
  • 10a veranschaulicht eine Mehrkanalparametrisierung für einen Fünf-Kanal-Lautsprecher-Aufbau, bei dem die verschiedenen Audiokanäle mit 101 bis 105 angegeben sind; a(t) 101 stellt Signal des Links-Surround-Kanals (surround = Umgebung) dar, b(t) 102 stellt das Signal des Links-Vorne-Kanals dar, c(t) 103 stellt das Signal des Mittekanals dar, d(t) 104 stellt das Signal des Rechts-Vorne-Kanals dar, e(t) 105 stellt das Signal des Rechts-Surround-Kanals dar. Der Lautsprecheraufbau ist in einen vorderen Teil und einen hinteren Teil unterteilt. Die Energieverteilung zwischen dem gesamten vorderen Kanalaufbau (102, 103 und 104) und den hinteren Kanälen (101 und 105) sind in 10a durch den Pfeil veranschaulicht und durch den r3-Parameter angegeben. Die Energieverteilung zwischen dem Mittekanal 103 und dem Links-Vorne-102- und dem Rechts-Vorne-103-Kanal ist durch r2 angegeben. Die Energieverteilung zwischen dem Links-Surround-Kanal 101 und dem Rechts-Surround-Kanal 105 ist durch r4 veranschaulicht. Schließlich ist die Energieverteilung zwischen dem Links-Vorne-Kanal 102 und dem Rechts-Vorne-Kanal 104 durch r1 angegeben. Da r1 bis r4 Parametrisierungen verschiedener Regionen sind, leuchtet auch ein, dass neben einer Energieverteilung auch andere wesentliche Regionseigenschaften parametrisiert werden können, beispielsweise die Korrelation zwischen den Regionen. Außerdem kann für jeden Parameter r1 bis r4 eine lokale Energie berechnet werden. Beispielsweise ist die lokale Energie von r4 die summierte Energie des Kanals A 101 und E 105. Lokale Energier4 = E[a2(t)] + E[e2(t)],wobei E[.] der erwartete Wert gemäß der Definition durch
    Figure 00060001
    ist.
  • 10b zeigt einen Mehrkanalaudiodecodierer, der dadurch gebaut wird, dass Parametrisches-Stereo-Module hierarchisch geordnet werden, wie beispielsweise in der WO 2004/008805 A1 beschrieben ist. Hier werden die Audiokanäle 101 bis 105, wie sie in der 10a eingeführt wurden, Schritt für Schritt durch einen ersten Zweikanalddecodierer 122, einen zweiten Zweikanalddecodierer 124, einen dritten Zweikanalddecodierer 126 und einen vierten Zweikanalddecodierer 128 aus einem einzigen monophonen Abwärtsmischsignal 120 (M) und entsprechenden Nebeninformationen reproduziert. Wie zu sehen ist, zerlegt der erste Zweikanalddecodierer bei der baumähnlichen Struktur der 10b das monophone Abwärtsmischsignal 120 in zwei Signale, die in den zweiten und den dritten Zweikanalddecodierer 124 und 126 eingespeist werden. Dabei ist der dem dritten Zweikanalddecodierer 126 zugeführte Kanal ein kombinierter Kanal, der aus dem Links-Hinten-Kanal 101 und dem Rechts-Hinten-Kanal 105 kombiniert ist. Der dem zweiten Zweikanalddecodierer 124 zugeführte Kanal ist eine Kombination des Mittekanals 103 und eines kombinierten Kanals, der wiederum eine Kombination des Vorne-Links-Kanals 102 und des Vorne-Rechts-Kanals 104 ist.
  • Somit, nach dem zweiten Schritt des hierarchischen Decodierens, werden der Links-Hinten-Kanal 102, der Rechts-Hinten-Kanal 105, der Mittekanal 103 und ein kombinierter Kanal, der eine Kombination des Vorne-Links-Kanals 102 und des Vorne-Rechts-Kanals 104 ist, unter Verwendung der gesendeten räumlichen Parameter, die einen Pegelparameter zur Verwendung durch jeden der Zweikanaldecodierer 122, 124 und 126 aufweisen, rekonstruiert.
  • Bei dem dritten Schritt der hierarchischen Decodierung leitet der vierte Zweikanalddecodierer 128 den Vorne-Links-Kanal 102 und den Vorne-Rechts-Kanal 104 unter Verwendung von als Nebeninformationen für den vierten Zweikanalddecodierer 128 gesendeten Pegelinformationen ab. Unter Verwendung eines hierarchischen Decodierers des Standes der Technik, wie er in 10b gezeigt ist, ergibt sich die gewünschte Energie für jeden einzelnen Ausgangskanal aus verschiedenen Parametrisches-Stereo-Modulen zwischen dem Eingangssignal und jedem Ausgangssignal. Mit anderen Worten kann die Energie eines spezifisches Ausgangskanals von den IID/ICLD-Parametern mehrerer Parametrisches-Stereo-Modulen abhängen. Bei einer derartigen baumähnlichen Struktur von verbundenen Parametrisches-Stereo-Modulen kann auch eine nicht-einheitliche Quantisierung von IID-Parametern innerhalb jedes Parametrisches-Stereo-Moduls angewendet werden, um IID-Werte zu erzeugen, die anschließend durch einen Decodierer als Teil der Nebeninformationen verwendet werden. Dadurch würden die Vorteile einer nicht-einheitlichen IID-Quantisierung lokal (d. h. einzeln in jedem Parametrisches-Stereo-Modul) genutzt, trotzdem ist dies nicht ideal, da eine Quantisierung in jedem Modul („Blätter") unabhängig von den Energien/dem Pegel anderer Audiokanäle, die eventuell einen hohen relativen Pegel aufweisen und somit eine Maskierung erzeugen, durchgeführt wird.
  • Dies ist möglich, da sich „Blatt"-Module der globalen Pegelverteilung auf einer höheren Baumebene (z. B. dem „Wurzel"-Modul) nicht bewusst sind. Jedes Blatt weist seinen eigenen entsprechenden IID/ICLD-Parameter auf, der die Energieverteilung von seinen Eingangs- hin zu seinen Ausgangskanälen angibt. Beispielsweise kann der IID/ICLD-Parameter des Blattes „r3” (durch den ersten Zweikanalddecodierer 122 verarbeitet) angeben, dass 90 der ankommenden Energie zu Blatt r2 gesendet werden sollten, während die restliche Energie (10%) an das Blatt r4 gesendet werden sollte. Dieser Vorgang wird für jedes Blatt in dem Baum wiederholt. Da jeder Energieverteilungsparameter mit begrenzter Genauigkeit dargestellt wird, hängt die Abweichung zwischen der gewünschten und der tatsächlichen Energie jedes Ausgangskanals A bis E von den Quantisierungsfehlern bei den IID/ICLD-Parametern sowie von der Energieverteilung (und somit der Ausbreitung von Quantisierungsfehlern) ab. Mit anderen Worten wird die IID/ICLD-Quantisierung im Idealfall nur lokal optimal durchgeführt, da dieselbe Quantisierungstabelle für einen bestimmten Parametertyp, z. B. ICC oder IID, in allen Parametrisierungsstufen r1 bis r4 verwendet wird. Dies bedeutet, dass für jede Parametrisierungsstufe r1 bis r4 der Fehler bezüglich der Ausgangsenergie der (lokalen) Ausgangskanäle bei Implementierungen des Standes der Technik für den schwächsten Ausgangskanal maximal ist.
  • Wie in den bisherigen Absätzen erläutert wurde, ist die Quantisierung von Pegelparametern (IID oder ICLD) oder sonstigen Parametern wie z. B. ICC, Phasendifferenzen oder Zeitdifferenzen, die die räumliche Wahrnehmung eines Mehrkanalaudiosignals beschreiben, immer noch suboptimal, da für räumliche Parameter, die Kanäle beschreiben, die auf Grund einer niedrigen Energie in dem Kanal hauptsächlich maskiert sind, Bandbreite verschwendet werden kann.
  • Zusammenfassung der Erfindung
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zur Quantisierung von räumlichen Parametern eines Mehrkanalaudiosignals zu liefern.
  • Gemäß einem ersten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch einen Parameterquantisierer zum Quantisieren eines Eingangsparameters gelöst, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, mit folgenden Merkmalen: einem Quantisierungsregelgenerator zum Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und einem Wertquantisierer zum Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  • Gemäß einem zweiten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch einen Parameterdequantisierer zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanä len bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, gelöst, mit folgenden Merkmalen: einem Dequantisierungsregelgenerator zum Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und einem Wertdequantisierer zum Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  • Gemäß einem dritten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Verfahren zum Quantisieren eines Eingangsparameters gelöst, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei das Verfahren folgende Schritte umfasst: Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  • Gemäß einem vierten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Verfahren zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, gelöst, wobei das Verfahren folgende Schritte umfasst: Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  • Gemäß einem fünften Aspekt der vorliegenden Erfindung wird diese Aufgabe durch eine Darstellung eines Mehrkanalsignals gelöst, das einen quantisierten Parameter aufweist, der eine quantisierte Darstellung eines Parameters ist, der ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen ist, wobei der Parameter ein Maß einer Charakteristik des Einzelkanals oder des Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei der quantisierte Parameter unter Verwendung. einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals abgeleitet wird.
  • Gemäß einem sechsten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein maschinenlesbares Speichermedium, auf dem eine Darstellung eines Mehrkanalsignals gemäß der obigen Beschreibung gespeichert ist, gelöst.
  • Gemäß einem siebten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch einen Sender oder Audioaufzeichnungsvorrichtung gelöst, der beziehungsweise die einen Parameterquantisierer zum Quantisieren eines Eingangsparameters aufweist, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, mit folgenden Merkmalen: einem Quantisierungsregelgenerator zum Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und einem Wertquantisierer zum Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  • Gemäß einem achten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch einen Empfänger oder Audiowiedergabevorrichtung gelöst, der beziehungsweise die einen Parame terdequantisierer zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, aufweist, mit folgenden Merkmalen: einem Dequantisierungsregelgenerator zum Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und einem Wertdequantisierer zum Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  • Gemäß einem neunten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Verfahren zum Senden oder Audio-Aufzeichnen gelöst, wobei das Verfahren ein Verfahren zum Quantisieren eines Eingangsparameters aufweist, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei das verfahren folgende Schritte umfasst: Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  • Gemäß einem zehnten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Verfahren zum Empfangen oder Audio-Wiedergeben gelöst, wobei das Verfahren ein Verfahren zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, aufweist, wobei das Verfahren folgende Schritte umfasst: Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines E nergiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  • Gemäß einem elften Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Übertragungssystem gelöst, das einen Sender und einen Empfänger aufweist, wobei der Sender einen Parameterquantisierer zum Quantisieren eines Eingangsparameters aufweist; und der Empfänger einen Parameterdequantisierer zum Dequantisieren eines quantisierten Parameters aufweist.
  • Gemäß einem zwölften Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Verfahren zum Senden und Empfangen gelöst, wobei das Verfahren ein Sendeverfahren umfasst, das ein Verfahren zum Quantisieren eines Eingangsparameters aufweist; und wobei das Verfahren ein Verfahren zum Empfangen umfasst, das ein Verfahren zum Dequantisieren eines quantisierten Parameters umfasst.
  • Gemäß einem dreizehnten Aspekt der vorliegenden Erfindung wird diese Aufgabe durch ein Computerprogramm zum Durchführen eines der obigen Verfahren, wenn das Computerprogramm auf einem Computer abläuft, gelöst.
  • Die vorliegende Erfindung beruht auf der Erkenntnis, dass Parameter, die eine Maßzahl für eine Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals sind, unter Verwendung einer Quantisierungsregel, die auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals erzeugt wird, effizienter quantisiert werden können.
  • Das erfindungsgemäße Konzept weist den Hauptvorteil auf, dass eine Quantisierungsregel entweder erzeugt wird oder eine entsprechende Quantisierungsregel aus einer Gruppe von verfügbaren Quantisierungsregeln ausgewählt wird, je nach der Energie des zu beschreibenden Signals. Somit kann ein psychoakustisches Modell während eines Codierens an einen Quantisierer oder während eines Decodierens an einen Dequantisierer angelegt werden, um eine an die Erfordernisse des tatsächlichen Signals angepasste Quantisierungsregel zu verwenden. Vor allem wenn ein Kanal im Vergleich zu anderen Kanälen in dem Mehrkanalsignal sehr wenig Energie enthält, kann die Quantisierung viel grober sein als für Signale, die hohe Energien aufweisen. Dies ist darauf zurückzuführen, dass die energiereichen Signale die energiearmen Signale während der Wiedergabe maskieren, d. h. ein Zuhörer erkennt kaum Einzelheiten des Signals einer niedrigen Energie, und somit kann das energiearme Signal durch eine grobe Quantisierung stärker beeinträchtigt werden, ohne dass der Zuhörer auf Grund der hohen Maskierung des energiearmen Signals in der Lage ist, die Verfälschung zu erkennen.
  • Bei einem Ausführungsbeispiel der vorliegenden Erfindung weist ein Parameterquantisierer zum Quantisieren von Parametern einen Quantisierungsregelgenerator zum Erzeugen einer Quantisierungsregel und einen Wertquantisierer zum Ableiten quantisierter Parameter von Eingangsparametern unter Verwendung der erzeugten Quantisierungsregel auf. Um eine geeignete Quantisierungsregel zu erzeugen, empfängt der Quantisiererselektor als Eingang die Gesamtenergie des zu codierenden Mehrkanalaudiosignals und die lokale Energie des Kanals oder des Paares von Kanälen, dessen bzw. deren räumliche Parameter zu quantisieren sind. Kennt er die Gesamtenergie und die lokale Energie, kann der Quantisiererselektor entscheiden, welche Quantisierungsregel verwendet werden soll, d. h. grobere Quantisierungsregeln für Kanäle oder Kanalpaare, die eine relativ niedrige lokale Energie aufweisen, auswählen. Alternativ dazu könnte der Quantisiererselektor auch eine algorithmische Regel ableiten, um eine existierende Quantisierungsregel zu modifizieren oder um eine völlig neue Quantisierungsregel zu berechnen, in Ab hängigkeit von der lokalen und der Gesamtenergie. Eine Möglichkeit wäre beispielsweise, einen allgemeinen Skalenfaktor zu berechnen, der an ein Signal vor einem linearen Quantisierer oder einem nicht-linearen Quantisierer angelegt werden soll, um das Ziel des Verringerns der Größe der zu sendenden Nebeninformationen zu erzielen.
  • Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird ein Mehrkanalsignal paarweise codiert, d. h. durch Verwendung einer hierarchischen Struktur, die mehrere 2-zu-1-Abwärtsmischer aufweist, die in einer baumähnlichen Struktur geordnet sind, wobei jeder Abwärtsmischer einen Monokanal aus den beiden in den Abwärtsmischer eingegebenen Kanälen erzeugt. Gemäß dem erfindungsgemäßen Konzept kann eine energieabhängige Quantisierung nun nicht nur lokal implementiert werden, d. h. bei jedem 2-zu-1-Abwärtsmischer, der die Informationen aufweist, die lediglich an dem Eingang des 2-zu-1-Abwärtsmischers verfügbar sind, sondern auf der Basis des globalen Wissens über die Summe der Signalenergien. Dies verbessert die Wahrnehmungsqualität eines Wahrnehmungssignals beträchtlich.
  • Es ist offensichtlich, dass gemäß dem erfindungsgemäßen Konzept die Größe von Nebeninformationen verringert werden kann, während die Qualität des codierten Mehrkanalaudiosignals kaum beeinflusst wird.
  • Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung ist ein erfindungsgemäßer Parameterquantisierer vor einem Differenzcodierer und einem Huffman-Codierer in einen Parametercodierer integriert, wobei ein Differenzcodierer und ein Huffman-Codierer beide zur weiteren Codierung der quantisierten Parameter verwendet werden, um einen Parameterbitstrom abzuleiten. Ein derartiger erfindungsgemäßer Codierer weist den großen Vorteil auf, dass zusätzlich dazu, dass die Größe von Codewörtern, die zum Beschreiben der quantisierten Parameter benötigt werden, verringert wird, eine gröbere Quantisierung die Häufigkeit von identischen Codewörtern, die in den Differenzcodierer und den Huffman-Codierer eingespeist werden, automatisch erhöht, was eine bessere Komprimierung der quantisierten Parameter ermöglicht und ferner die Größe der Nebeninformationen verringert.
  • Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung weist ein erfindungsgemäßer Parameterquantisierer einen Quantisiererfaktorfunktionsgenerator und einen Parametermultiplizierer auf. Der Quantisiererfaktorfunktionsgenerator empfängt die Gesamt- und die lokale Energie als Eingang und leitet einen Einzelskaliererwert von den Eingangsquantitäten ab. Der Parametermultiplizierer empfängt die Parameter und den abgeleiteten Quantisiererfaktor f, um die Parameter durch den Quantisiererfaktor zu dividieren, bevor er die modifizierten Parameter an den Quantisierer transferiert, der eine feststehende Quantisierungsregel auf die modifizierten Parameter anwendet.
  • Eine Variation dieses Ausführungsbeispiels besteht darin, einen Parametermultiplizierer nach dem Quantisierer zu haben und somit den abgeleiteten Quantisiererfaktor f dazu zu verwenden, den aus dem Quantisierer resultierenden Index heraus zu dividieren. Das Ergebnis hieraus muss dann wiederum zu einem Ganzzahlindex gerundet werden.
  • Eine Anwendung eines Skalierungsfaktors auf die Parameter hat dieselbe Wirkung wie ein Auswählen verschiedener Quantisierungsregeln, da beispielsweise eine Division durch einen großen Faktor den Eingangsparameterraum derart komprimiert, dass effektiv lediglich ein kleinerer Teil einer bereits existierenden Quantisierungsregel effektiv wäre. Diese Lösung weist den Vorteil auf, dass auf der Decodierer- und der Codiererseite zusätzlicher Speicher eingespart werden kann, da lediglich eine Quantisierungsregel gespeichert oder verarbeitet werden soll, da das Skalieren durch eine einfache Multiplikation erfolgt, die lediglich begrenzte zusätzliche Hard- oder Software erfordert. Ein zusätzlicher Vorteil besteht darin, dass durch Anwenden eines Quantisiererfaktors der Quantisiererfaktor unter Verwendung einer beliebigen möglichen funktionellen Abhängigkeit abgeleitet werden kann. Somit kann eine Quantisierer- oder Dequantisiererempfindlichkeit in dem gesamten möglichen Eingangsparameterraum kontinuierlich angepasst werden, statt vordefinierte Quantisierungsregeln aus einem gegebenen Abtastwert auszuwählen.
  • Kurze Beschreibung der Zeichnungen
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden anschließend unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben, bei denen:
  • 1 ein Blockdiagramm eines erfindungsgemäßen Parameterquantisierers zeigt;
  • 2a bis c mehrere mögliche anzuwendende Quantisierungsregeln zeigen;
  • 3 einen Parametercodierer zeigt, der einen erfindungsgemäßen Parameterquantisierer aufweist;
  • 4a, 4b ein alternatives Ausführungsbeispiel eines Parametercodierers zeigen, der einen erfindungsgemäßen Parameterquantisierer aufweist;
  • 5 Beispiele von Skalenfaktorfunktionen zeigt;
  • 6 eine nicht-lineare Quantisierungsregel zeigt;
  • 7 einen erfindungsgemäßen Parameterdequantisierer zeigt;
  • 8 einen Parameterdekomprimierer zeigt, der einen erfindungsgemäßen Parameterdequantisierer aufweist;
  • 9a ein Ausführungsbeispiel eines erfindungsgemäßen Parameterdequantisierers zeigt;
  • 9b ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Parameterdequantisierers zeigt;
  • 9c ein Beispiel zum Implementieren einer energieabhängigen Dequantisierung zeigt;
  • 9d ein weiteres Beispiel zum Implementieren einer energieabhängigen Dequantisierung zeigt;
  • 9e Beispiele einer Quantisierung und Dequantisierung von Parametern zeigt;
  • 10a eine Darstellung eines 5-Kanal-Mehrkanalaudiosignals zeigt; und
  • 10b einen hierarchischen parametrischen Mehrkanaldecodierer gemäß dem Stand der Technik zeigt.
  • Ausführliche Beschreibung bevorzugter Ausführungsbeispiele
  • 1 zeigt einen erfindungsgemäßen Parameterquantisierer 199, der einen Quantisierer 200 und einen Quantisiererselektor 202 aufweist. Der Quantisiererselektor 202 empfängt die lokale Energie des Kanals oder des Paares von Kanälen, der bzw. das den zu codierenden Parametern zu Grunde liegt, und die Gesamtenergie des Mehrkanalaudiosignals. Auf der Basis beider Energieinformationen erzeugt der Quantisiererselektor 202 eine Quantisierungsregel, die durch den Quantisierer 200 dazu verwendet wird, einen quantisierten Parameter 204 von einem in den Quantisierer 200 eingegebenen Parameter 206 abzuleiten. Somit dient der Quantisiererselektor 202 in diesem Fall als Quantisierungsregelgenerator.
  • Die in den Quantisiererselektor 202 eingegebenen Parameter sind die Gesamtenergie des ursprünglichen Mehrkanalsignals und die lokale Energie für den Kanal, der durch den zu quantisierenden Parameter beschrieben wird. Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung gibt das Verhältnis zwischen der lokalen Energie und der Gesamtenergie eine Maßzahl an, die dazu verwendet werden kann, zu entscheiden, welcher Quantisierer verwendet werden soll. Als Beispiel kann dieses Verhältnis q (relative lokale Energie, relative local energy) unter Verwendung der folgenden Gleichung in dB berechnet werden:
    Figure 00190001
  • Der ausgewählte Quantisierer wird anschließend dazu verwendet, den Parameter 206 mit dem Quantisierer zu quantisieren.
  • Die vorliegende Erfindung lehrt, dass eine gröbere Quantisierung von IID/ICLD-Parametern (und dergleichen) verwendet werden kann, wenn eine Parametrisierungsstufe im Vergleich zu der Gesamtenergie weniger Energie aufweist, d. h. wenn die relative lokale Energie q gering ist. Die vorliegende Erfindung nutzt die psychoakustische Beziehung, dass es wichtiger ist, die dominanten/energiereichen Signale mit hoher Genauigkeit zu parametrisieren, als das Audiosignal mit geringerer Bedeutung/niedriger Energie. Um dies noch zu verdeutlichen, wird erneut auf 10a verwiesen. Wenn in einer Audioszene bei dem ursprünglichen Mehrkanalsignal die Energie/das Signal vorwiegend in dem vorderen Bild vorliegt, nämlich in dem Links-Vorne-Kanal 102, dem Mittekanal 103 und dem Rechts-Vorne-Kanal 104, können die Surround-Kanäle mit geringerer Genauigkeit quantisiert werden, da die Surround-Kanäle viel weniger Energie aufweisen. Der aus der gröberen Quantisierung resultierende zusätzliche Quantisierungsfehler kann nicht wahrgenommen werden, da die vorderen Kanäle eine viel höhere Energie aufweisen, und somit ist der Quantisierungsfehler von r4 (und sind die resultierenden Energiefehler für die Surround-Kanäle A und E) durch die Kanäle B, D und/oder C maskiert.
  • Bei dem extremsten Beispiel weisen die Surround-Kanäle A und E lediglich ein schwaches Rauschen auf, und die vorderen Kanäle B, C und D weisen Signale mit einer vollen Amplitude auf. In einem solchen Fall würde ein ursprüngliches PCM-Signal von 16 Bits eine Energiedifferenz von mehr als 80 dB angeben. Deshalb könnte der Parameter r4 beliebig grob quantisiert werden, ohne dass hörbare. Differenzen verursacht werden, die auf die (grobe) Quantisierung zurückzuführen sind.
  • 2a bis 2c zeigen drei mögliche Quantisierungsregeln, die verschiedene Pegel von Quantisierungsfehlern einführen. Alle Figuren zeigen den ursprünglichen Parameter auf ihrer x-Achse, und die den Parametern zugewiesenen Ganzzahlwerte auf ihrer y-Achse. Ferner zeigen die 2a bis 2c gestrichelte Linien, die Indizes für jeden Quantisierungsschritt entsprechen und somit zum Senden oder zur Speicherung verwendet werden können. Die gesendeten Indizes können anschließend auf der Decodiererseite, beispielsweise in Kombination mit einer Nachschlagtabelle, zur Dequantisierung verwendet werden.
  • Die feinste Quantisierung ist in 2a durch die Quantisierungskurve 230 angegeben, die diskrete Parameterintervalle der x-Achse auf 13 Ganzzahlwerte abbildet. Eine mittlere Quantisierung wird durch die Quantisierungskurve 232 in 2b erzielt, wohingegen die gröbste Quantisierung durch die Quantisierungskurve 234 der 2c erzielt wird. Es ist offensichtlich, dass der verursachte Quantisierungsfehler bei dem in 2c gezeigten Beispiel am größten ist und bei dem in 2a gezeigten Beispiel am kleinsten ist.
  • Diese drei Quantisierungsregeln sind Beispiele von Quantisierungsregeln, die durch den Quantisiererselektor 202 ausgewählt werden können. Mit anderen Worten veranschaulichen 2a bis c drei verschiedene lineare Quantisierungsregeln, bei denen die x-Achse den Eingangswert beschreibt und die y-Achse den entsprechenden quantisierten Wert angibt. 2a bis 2c weisen alle dieselbe Skala auf der x-Achse und der y-Achse auf, und somit weist 2a die feinste Quantisierung der drei und somit den kleinsten Quantisierungsfehler auf. 2c weist die gröbste Quantisierung und somit den größten Quantisierungsfehler auf. Sie würde auch die niedrigste Bitrate nach einem Differenzcodieren und Huffman-Codieren ergeben, da sie die kleinste Anzahl von Quantisierungsschritten aufweist.
  • Als Beispiel könnte eine mögliche Quantisierungsregelerzeugung auf der relativen lokalen Energie q zwischen der lokalen Energie und der Gesamtenergie beruhen, wie oben erläutert wurde. Eine mögliche Bandbreite von q-Werten mit entsprechenden Auswahlen von Quantisierungsregeln ist beispielsweise in der folgenden Tabelle zusammengefasst:
    Wert von q [dB] Ausgewählter Quantisierer
    0 <= q < –10 Feine Quantisierung Fig. 2A
    –10 <= q < –20 Mittlere Quantisierung Fig. 2B
    –20 <= q Grobe Quantisierung Fig. 2C
  • 3 zeigt einen erfindungsgemäßen Parameterkomprimierer, der einen erfindungsgemäßen Parameterquantisierer 199, einen Differenzcodierer 220 und einen Huffman-Codierer 222 aufweist. Der erfindungsgemäße Parametercodierer der 3 erweitert den Parameterquantisierer der 1, indem er die quantisierten Parameter als Eingang für den Differenzcodierer 220 verwendet, der die quantisierten Parameter 204 differentiell codiert, um differentiell codierte quantisierte Parameter abzuleiten, die anschließend in den Huff man-Codierer 222 eingegeben werden, der ein Huffman-Codierungsschema auf die differentiell codierten quantisierten Parameter anwendet und dabei ein Parameterbitstromelement 224 eines abschließenden Parameterbitstroms als Ausgang ableitet.
  • Die Kombination eines erfindungsgemäßen Parameterquantisierers mit einem Differenzcodierer und einem Huffman-Codierer ist besonders attraktiv, da eine gröbere Quantisierung zu einer größeren Häufigkeit von gleichen Symbolen (quantisierten Parametern) führt. Die Kombination des Differenzcodierers 220 und des Huffman-Codierers 222 liefert offensichtlich eine codierte Darstellung der quantisierten Parameter (Parameterbitstromelement 224), die kompakter ist, wenn die maximale Anzahl möglicher Eingangssymbole durch eine gröbere Quantisierung verringert ist.
  • 4a zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Parametercodierers, der einen erfindungsgemäßen Parameterquantisierer 250, einen Differenzcodierer 252 und einen Huffman-Codierer 254 verwendet.
  • Der Parameterquantisierer 250 weist einen Quantisiererfaktorgenerator 256, einen Parameterskalierer 258 und einen Quantisierer 260 auf. In diesem Fall dient der Quantisiererfaktorgenerator 256 zusammen mit dem Parameterskalierer 258 als Quantisierungsregelgenerator.
  • Der Quantisiererfaktorgenerator 256 empfängt als Eingang die Gesamtenergie des Mehrkanalaudiosignals und die lokale Energie des Kanals oder des Kanalpaares für den zu quantisierenden Parameter. Der Quantisiererfaktorgenerator 256 erzeugt einen Skalenfaktor 262 (f) auf der Basis der lokalen Energie und der Gesamtenergie. Bei einem bevorzugten Ausführungsbeispiel erfolgt dies auf der Basis eines Verhältnisses zwischen der lokalen Energie und der Gesamtenergie, das zu einer relativen lokalen Energie q führt, wie folgt:
    Figure 00230001
  • Dieses Verhältnis q kann in dem Quantisiererfaktorgenerator 256 dazu verwendet werden, den Quantisiererfaktor f (262) zu berechnen, der als Eingang für den Parameterskalierer 258 verwendet wird, der zusätzlich den zu quantisierenden Parameter empfängt.
  • Der Parameterskalierer 258 wendet eine Skalierung auf den Eingangsparameter an, die beispielsweise eine Division des Parameters durch den Quantisiererfaktor 262 sein könnte. Die Skalierung des Parameters ist äquivalent zu einem Auswählen verschiedener Quantisierungsregeln. Der skalierte Parameter wird anschließend in einen Quantisierer 260 eingegeben, der bei diesem Ausführungsbeispiel der vorliegenden Erfindung eine feststehende Quantisierungsregel anwendet. Die Weiterverarbeitung des quantisierten Parameters ist gleich der Verarbeitung der 3, der Parameter wird differentiell codiert und anschließend Huffman-codiert, um schließlich ein Parameterbitstromelement zu ergeben.
  • Ein Anwenden eines Skalierungsfaktors auf die Parameter weist den Vorteil auf, dass die Quantisierungsregel auf kontinuierliche Weise an die Anforderungen angepasst werden könnte, da eine analytische Funktion, die den Quantisiererfaktor 262 ableitet, im Grunde jegliche Form aufweisen kann.
  • 4b zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Parametercodierers 270, der dem in 4a gezeigten erfindungsgemäßen Parametercodierer 250 ähnlich ist. Deshalb werden in dem folgenden Absatz lediglich die Unterschiede zu dem Parametercodierer 250 erläutert.
  • Der erfindungsgemäße Parametercodierer 270 weist keinen Parameterskalierer (Parameterskalierer 258 des Parameterco dierers 250) auf. Um eine Energieabhängigkeit der Quantisierung zu erzielen, weist der Parameterquantisierer 270 stattdessen eine Komprimierungsvorrichtung 272 auf. Dies bedeutet, dass der Quantisiererfaktorgenerator 256 zusammen mit der Komprimierungsvorrichtung 258 in diesem Fall als Quantisierungsregelgenerator dient. Die Komprimierungsvorrichtung 272 ist mit dem Quantisierer 260 und mit dem Quantisiererfaktorgenerator 256 verbunden. Die Komprimierungseinheit 272 empfängt als Eingang einen quantisierten Parameter, der durch den Quantisierer 260 gemäß einer Verwendung eines feststehenden Quantisierungsschemas quantisiert wird. Um die Energieabhängigkeit zu implementieren, verwendet die Komprimierungseinheit den quantisierten Parameter als Eingang und skaliert den quantisierten Parameter unter Verwendung des Skalenfaktors 262. Dies stellt eine Einsparung bezüglich der Bitrate dar, indem die mögliche Anzahl von quantisierten Parametern, die an den Deltacodierer 252 gesendet werden sollen, verringert wird. Diese Komprimierung kann beispielsweise durch eine Division des Quantisierter-Parameter-Indizes durch den Skalierungsfaktor 262 erzielt werden.
  • Mögliche Funktionen, um den Skalenfaktor 262 von dem Relative-Lokale-Energie-Verhältnis q abzuleiten, sind in 5 gezeigt. 5 zeigt als Beispiel vier verschiedene mögliche Funktionen 300, 302, 303 und 304, die dazu verwendet werden können, den Skalenfaktor f abzuleiten. Die erste Faktorfunktion 300 ist eine konstante Funktion und weist somit keine Energieabhängigkeit auf.
  • Die Faktorfunktionen 302 und 304 zeigen zwei Möglichkeiten, Faktorfunktionen zu implementieren, wobei die Faktorfunktion 302 die weniger aggressive ist und somit den eingebrachten Quantisierungsfehler weniger stark erhöhen würde als eine Verwendung der Faktorfunktion 304. Dagegen würde die Faktorfunktion 302 weniger Bitrate einsparen als die Faktorfunktion 304. Die Faktorfunktion 303 zeigt eine vierte Möglichkeit, den Quantisiererfaktor von der Energiequote q abzuleiten, wohingegen die Faktorfunktion 303 eine stufenartige Form aufweist und somit Intervalle der Energiequote q demselben Quantisiererfaktor zuweist.
  • 6 veranschaulicht einen nicht-einheitlichen Quantisierer, bei dem der Eingang auf der x-Achse in dB gemäß der Funktion 310 quantisiert wird, um zu dem Ausgang y in dB zu führen, der auf der y-Achse eingezeichnet ist. Eine derartige Nicht-Einheitlicher-Quantisierer-Funktion kann dazu verwendet werden, auch räumliche Parameter zu quantisieren. Dies ist dann von besonderem Interesse, wenn der Referenzkanal in einem BCC-Codierungsschema dahin gehend ausgewählt wird, der stärkste Kanal in einem Mehrkanalsignal zu sein. Der nicht-einheitliche Quantisierer, wie er in 6 gezeigt ist, veranschaulicht eine Quantisiererfunktion 310, die den Bedürfnissen dann entsprechen würde, da die Quantisierungsschritte zunehmen, wenn der Energiepegel im Vergleich zu dem Kanal, auf den Bezug genommen wird, abnimmt. Dies ist eine besonders attraktive Eigenschaft, da die Energiepegelquantisierungsfehler für Kanäle mit weniger Energie größer sein können als für die stärksten Kanäle.
  • 7 zeigt einen erfindungsgemäßen Parameterdequantisierer 500, der einen Dequantisierer 502 und einen Dequantisiererselektor 504 aufweist. Der Dequantisiererselektor 504 empfängt die Gesamtenergie des Mehrkanalaudiosignals und die lokale Energie des Kanals oder der Kanalpaare zusammen mit einem quantisierten Parameter 505, der zu dequantisieren ist. Auf der Basis der empfangenen Energieinformationen leitet der Dequantisiererselektor 504 eine Dequantisierungsregel ab, die durch den Dequantisierer 502 dazu verwendet wird, den quantisierten Parameter 505 zu dequantisieren. Somit dient der Dequantisiererselektor 504 in diesem Fall als Dequantisierungsregelgenerator.
  • Es kann angemerkt werden, dass der Dequantisiererselektor 504 auf verschiedene Art und Weise operieren kann. Eine erste Möglichkeit besteht darin, dass der Dequantisiererse lektor 504 die Quantisierungsregel direkt ableitet und die abgeleitete Quantisierungsregel an den Dequantisierer 502 transferiert. Eine weitere Möglichkeit besteht darin, dass der Dequantisiererselektor 504 eine Dequantisierungsregelentscheidung trifft, die an den Dequantisierer 502 transferiert wird, der die Dequantisierungsregelentscheidung dazu verwenden kann, die entsprechende Dequantisierungsregel aus einer Anzahl von Quantisierungsregeln, die beispielsweise in dem Dequantisierer 502 gespeichert sind, auszuwählen.
  • 8 zeigt einen erfindungsgemäßen Parameterdecodierer, der einen Parameterdequantisierer 500, einen Differenzdecodierer 510 und einen Huffman-Decodierer 512 aufweist.
  • Der Huffman-Decodierer 512 empfängt ein Parameterbitstromelement 513, und in Verbindung damit empfängt der Dequantisiererselektor 504 die lokale Energie eines Kanals oder eines Paares von Kanälen, der bzw. das durch das Parameterbitstromelement 513 beschrieben wird, und die Gesamtenergie des Mehrkanalaudiosignals. Das Parameterbitstromelement 513 wird durch einen erfindungsgemäßen Parametercodierer erzeugt, wie in 3 gezeigt ist. Deshalb wird das Parameterbitstromelement 513 durch den Huffman-Decodierer 512 Huffman-decodiert und durch einen Differenzdecodierer 512 differentiell decodiert, bevor es an den Dequantisierer 502 geliefert wird. Nach dem Decodieren durch den Huffman-Decodierer 512 und den Differenzdecodierer 510 wird die Dequantisierung durch den erfindungsgemäßen Parameterdequantisierer 500 durchgeführt, wie bereits bei der Beschreibung des erfindungsgemäßen Parameters der 7 beschrieben wurde.
  • Mit anderen Worten veranschaulicht 8 einen Decodierer, der einen energieabhängigen Dequantisierer 500 verwendet, wobei der Decodierer einem erfindungsgemäßen Codierer entspricht. Das Parameterbitstromelement wird zu Indizes Huffman-decodiert und differentiell decodiert. Der richtige Dequantisierer wird bei dem Dequantisiererselektor 504 unter Verwendung derselben Regel und Funktion, die bei dem Codierer verwendet wurde, mit der Gesamtenergie und der lokalen Energie als Eingang, ausgewählt. Der ausgewählte Dequantisierer wird dann dazu verwendet, die Indizes (unter Verwendung des Dequantisierers 502) zu dequantisierten Parametern zu dequantisieren.
  • 9a zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Parameterdecodierers, der einen erfindungsgemäßen energieabhängigen Dequantisierer 520, einen Huffman-Decodierer 512 und einen Differenzdecodierer 510 aufweist. Der Parameterdequantisierer 520 weist einen Quantisiererfaktorgenerator 522, einen Dequantisierer 524 und einen Parameterskalierer 526 auf. In diesem Fall dient der Dequantisiererfaktorgenerator 522 zusammen mit dem Parameterskalierer 526 als Dequantisierungsregelgenerator.
  • Nach dem Decodieren des Parameterbitstromelements 513 durch den Huffman-Decodierer und den Differenzdecodierer wird der quantisierte Parameter durch den Dequantisierer 524 dequantisiert, wobei der Dequantisierer 524 eine Dequantisierungsregel verwendet, die mit einer Quantisierungsregel übereinstimmt, die zum Erzeugen des quantisierten Parameters verwendet wird. Der Quantisiererfaktorgenerator 522 leitet einen Skalenfaktor 528 (f) von einem Verhältnis der lokalen Energie und der Gesamtenergie des Mehrkanalaudiosignals ab. Der Parameterskalierer 526 wendet den Skalenfaktor 528 anschließend durch eine Multiplikation des Skalenfaktors mit dem dequantisierten Parameter auf den dequantisierten Parameter an.
  • Nach dem Skalieren durch den Parameterskalierer 526 stehen die dekomprimierten dequantisierten Parameter an einem Ausgang des erfindungsgemäßen Parameterdecodierers zur Verfügung.
  • 9b zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Parameterdecodierers 530, der dem erfindungs gemäßen Parameterdecodierer 520 ähnlich ist. Deshalb soll in dem folgenden Absatz lediglich auf die Unterschiede zu dem Parameterdecodierer 520 eingegangen werden.
  • Der erfindungsgemäße Parameterdecodierer 530 weist einen Dekomprimierer 532 auf, wobei der Dekomprimierer 532 dasselbe funktionale Ergebnis erzielt wie der Parameterskalierer 526 bei dem erfindungsgemäßen Parameterdecodierer 520. Der Dekomprimierer 532 empfängt als Eingang die quantisierten Parameter und als weiteren Eingang den Skalenfaktor 528 von dem Faktorgenerator 522. Dies bedeutet, dass der Faktorgenerator 522 zusammen mit dem Dekomprimierer 532 in diesem Fall als Dequantisierungsregelgenerator dient. Um die energiegewichtete Dequantisierungsfunktionalität zu implementieren, wird der quantisierte Parameter durch den Dekomprimierer 532 skaliert, bevor der auf diese Weise abgeleitete skalierte quantisierte Parameter in den Dequantisierer 524 eingegeben wird. Der Dequantisierer 524 dequantisiert anschließend den skalierten quantisierten Parameter, um unter Verwendung einer feststehenden Dequantisierungsregel den dequantisierten Parameter abzuleiten. Diese Dekomprimierung kann beispielsweise durch eine Multiplikation des quantisierten Parameterindizes mit dem Skalenfaktor 528 erzielt werden.
  • Obwohl die Skalierung durch den Parameterskalierer 258 und den Parameterskalierer 526 während der Codierung und Decodierung als Division während des Codierens und als Multiplikation während des Decodierens beschrieben wird, kann jegliche andere Art von Skalierung, die denselben Effekt wie eine Verwendung einer anderen Quantisierungsregel hat, während des Codierens oder Decodierens auf die Parameter angewendet werden.
  • Im Fall einer gestapelten Parametrisierung (hierarchische Decodierung oder Codierung), wie sie beispielsweise in 10b veranschaulicht ist, ist zu beachten, dass, da der Decodierer die Energieverteilung von den Wurzeln (dem Ab wärtsmischkanal) hinaus zu den Blättern decodieren kann, bei jeder Parametrisierung r1 bis r4 (Zweikanalddecodierer 122, 124, 126 und 128) eine hinreichend definierte lokale Energie vorliegt, die als die lokale Energie auf der Decodiererseite verwendet werden kann. Außerdem kann, falls ein Codierer auch von Wurzel zu Blatt quantisiert, genau dieselbe lokale Energie an dem Codierer als lokale Energie für den Quantisiererselektor und die Quantisiererfaktorfunktion verwendet werden.
  • Mit anderen Worten kann ein Decodierer unter Verwendung der Gesamtenergie und der lokalen Energie entweder autonom entscheiden, welche Dequantisierungsregel zu verwenden ist. Alternativ dazu könnte dem Decodierer durch gewisse zusätzliche Nebeninformation signalisiert werden, welche Dequantisierungsregel die geeignete zum Dequantisieren der Parameter ist.
  • Obwohl sie bei verschiedenen Ausführungsbeispielen der vorliegenden Erfindung beschrieben ist, können die Anwendung eines Skalenfaktors und die Auswahl einer geeigneten Dequantisierungsregel bei einem Ausführungsbeispiel eines erfindungsgemäßen Codierers oder Decodierers auch kombiniert werden.
  • Um ein ausführlicheres Beispiel zu liefern, sind in den 9c und 9d zwei mögliche Arten einer Implementierung einer energieabhängigen Dequantisierung für die Rekonstruktion eines Mehrkanalsignals aus einem transferierten monophonen Signal M unter Verwendung von zusätzlich gesendeten räumlichen Parametern (CLD, ICC) gezeigt. Bevor die Figuren erläutert werden, sei darauf hingewiesen, dass die in den Figuren gezeigte baumähnliche Struktur lediglich für die Rekonstruktion der räumlichen Parameter wichtig ist, bei denen die tatsächliche Aufwärtsmischung zur Erzeugung der einzelnen Kanäle eines Mehrkanalsignals normalerweise in einem einzigen Schritt durchgeführt wird.
  • 9c zeigt die Situation, bei der die Parameter CLD derart abgeleitet sind, dass angenommen wird, dass ein Parameter CLD0 die Energieverteilung zwischen Kanälen beschreibt, die unter Verwendung einer Anzahl von Kanälen des ursprünglichen Signals kombiniert werden.
  • Bei der ersten hierarchischen Aufwärtsmischposition 1000 beschreibt CLD0 die Energiebeziehung zwischen zwei Kanälen, bei denen ein erster Kanal eine Kombination 1002 eines Vorne-Links-, eines Vorne-Rechts-, eines Mitte- und eines Niederfrequenzverbesserungskanals ist. Der zweite Kanal ist eine Kombination eines Hinten-Links- und eines Hinten-Rechts-Kanals. Mit anderen Worten beschreibt der Parameter CLD0 die Energieverteilung zwischen allen hinteren Kanälen und allen vorderen Kanälen.
  • Deshalb ist es offensichtlich, dass, wenn CLD0 angibt, dass in den hinteren Kanälen lediglich geringe Energien enthalten sind, die Parameter, die die räumlichen Eigenschaften zwischen dem Hinten-Links- und dem Hinten-Rechts-Kanal beschreiben, stärker quantisiert werden können, da die zusätzlich eingebrachte Verzerrung durch die grobe Quantisierung kaum hörbar ist, wenn alle Kanäle gleichzeitig wiedergegeben werden.
  • Ein erfindungsgemäßer Parameterquantisierer, wie er in 9b gezeigt ist, berechnet beispielsweise einen Skalenfaktor 528, um die Dequantisierung durch Multiplizieren eines zu dequantisierenden Parameters mit einem Parameterindex, bevor die tatsächliche Dequantisierung durchgeführt wird, zu implementieren. Deshalb kann man, falls ein Parameter CLD0 gesendet wird, wenn man beispielsweise den Decodierer der 9b verwendet, die abschließend verwendeten CLD-Parameter anderer hierarchischer Schritte gemäß der folgenden Formel berechnen.
  • Im Folgenden beschreibt der Ausdruck „DEQ" die Anwendung einer feststehenden Dequantisierungstabelle auf einen Para meter, der bei der Prozedur DEQ gegeben ist. Dies bedeutet, dass ein gesendeter Parameter IDX CLD (0, L) direkt dequantisiert werden kann, was durch den folgenden Ausdruck angegeben ist:
    Figure 00310001
  • Da der CLD-Parameter eine Energieverteilung zwischen zwei Kanälen beschreibt und die Kanäle Kombinationen von Kanälen, wie sie in 9c angegeben sind, sind, kann man die relative lokale Energie FC nun gemäß:
    Figure 00310002
    ableiten.
  • Die relative lokale Energie der hinteren Kanäle lautet demgemäß:
    Figure 00310003
  • Angesichts des Obigen und erfindungsgemäßen Konzepts kann nun CLD1 berechnet werden, wobei die in dem Kombinationssignal 1002 enthaltene Gesamtenergie berücksichtigt wird: idxCLDEdQ(1, l, m) = max (–15, min(15, Rund(idxCLD(1, l, m)·facFunc(RelativeLokaleEnergieFC5151(l, m)))))
  • Bei der oben gegebenen Formel beschreibt der Begriff "fac-Func" eine Funktion, die eine Echtwertunabhängigkeit der relativen lokalen Energie FC liefert. Mit anderen Worten beschreibt die Formel 4, dass vor einer Dequantisierung der Gesendeter-Parameter-Index IDX CLD (l, l, m) mit einem Ska lenfaktor (facFunc) multipliziert wird, um einen quantisierten Zwischenparameter abzuleiten. Da der quantisierte Zwischenparameter nicht unbedingt einen Ganzzahlwert aufweist, muss der quantisierte Zwischenparameter gerundet werden, um IdxClDEdQ abzuleiten, das dann unter Verwendung der folgenden Operation zu dem abschließenden Parameter dequantisiert wird:
    Figure 00320001
  • Die Dequantisierung wird anhand einer standardmäßigen Dequantisierungstabelle, beispielsweise der folgenden, durchgeführt:
    Idx –15 – 14 – 13 – 12 – 11 – 10 –9 –8 –7 –6 –5
    CLD[idx] – 150 – 45 – 40 – 35 – 30 – 25 – 22 – 19 –16 – 13 – 10
    Idx –4 –3 –2 –1 0 1 2 3 4 5 6
    CLD[idx] –8 –6 –4 –2 0 2 4 6 8 10 13
    Idx 7 8 9 10 11 12 13 14 15
    CLD[idx] 16 19 22 25 30 35 40 45 150
  • Der abgeleitete Parameter CLD1 beschreibt eine Energiebeziehung zwischen einem Kanal, der eine Kombination eines Vorne-Links- und eines Vorne-Rechts-Kanals ist, und einem Kanal, der eine Kombination eines Mitte- und eines Niederfrequenzverbesserungskanals ist, wie aus der Kanalzerlegung bei dem zweiten hierarchischen Schritt 1004 zu ersehen ist. Somit kann eine relative lokale Energie F, die eine in den vorderen Kanälen, vorne links und vorne rechts, enthaltene Energie beschreibt, gemäß der folgenden Formel berechnet werden:
    Figure 00330001
  • Bisher wurde eine relative lokale Energie S, die die Energie der hinteren Kanäle beschreibt, so abgeleitet, dass ein quantisierter Zwischenparameter IDX CLD EDQ gemäß der folgenden Formeln für den hierarchischen Kasten 1006 berechnet werden kann:
    Figure 00330002
  • Da nun, wie zuvor beschrieben wurde, eine relative lokale Energie, die die Energie lediglich der vorderen Kanäle (F5151) beschreibt, zur Verfügung steht, kann nun ein Parameter CLD3, der eine Energiebeziehung zwischen dem Vorne-Links- und dem Vorne-Rechts-Kanal beschreibt, nun gemäß der folgenden Formeln auf eine energieabhängige Art und Weise abgeleitet werden:
    Figure 00330003
  • Bei einer möglichen Implementierung kann nun unter Verwendung von keiner Faktorfunktion ein Parameter CLD4 abgeleitet werden, der eine Energiebeziehung zwischen dem Mitte- und dem Niederfrequenzverbesserungskanal beschreibt:
    Figure 00330004
  • Bei alternativen Ausführungsbeispielen ist es selbstverständlich auch denkbar, eine Energieabhängigkeit auch bei der Ableitung des Parameters CLD4 zu implementieren.
  • 9d zeigt eine weitere Möglichkeit, eine Hierarchie für die Ableitung der räumlichen Parameter zu definieren.
  • Analog zu der Beschreibung der 9c können die einzelnen CLD-Parameter gemäß der folgenden Formeln abgeleitet werden:
    Figure 00340001
    Figure 00350001
  • Es sei angemerkt, dass verschiedene Faktorfunktionen dazu verwendet werden können, das erfindungsgemäße Konzept als beispielsweise eine der in 5 gezeigten Funktionen zu implementieren.
  • Allgemein, wie oben bereits erwähnt wurde, besteht das erfindungsgemäße Konzept darin, eine energieabhängige Quantisierung in dem Sinne anzuwenden, dass Parameter (CLD) von Teilen des Signals, die im Vergleich zu anderen Signalteilen eine relativ niedrige Energie enthalten, auf gröbere Art und Weise quantisiert werden. Das heißt, dass die Faktorfunktion so sein muss, dass der angewendete Faktor bei Niedrigenergiekomponenten groß ist.
  • Um dies ausführlicher zu erläutern, wird ein Beispiel bei 9e angegeben, das die Manipulationen während einer Codierung und einer Decodierung zeigt, wobei ferner auf das Konzept der Erfindung hingewiesen wird. Ferner wird auf die zuvor vorgestellte Quantisierungstabelle zum Berechnen der gezeigten Beispiele verwiesen.
  • Die Tabelle 9d zeigt die Manipulation des Quantisierungsindizes auf der Quantisiererseite in einer linken Spalte 1100 und die Rekonstruktion des gesendeten Parameters auf der Quantisiererseite in einer Spalte 1102. Der gesendete Parameter ist in einer Spalte 1104 angegeben. Zwei Beispiele einer Kombination von Kanälen, die eine relativ niedrige Energie aufweisen, sind gezeigt. Dies wird durch den gemeinsamen Skalenfaktor 4,5 angegeben, der beträchtlich höher ist als 1 (siehe 4). Gemäß dem erfindungsgemäßen Konzept wird der Quantisierungsindex IDX nach der Quantisierung auf der Quantisiererseite durch den Skalenfaktor dividiert. Danach muss das Ergebnis auf einen Ganzzahlwert gerundet werden, um differentiell und Huffman-codiert zu werden (siehe 4a). Deshalb führen beide Beispielsindizes 10 und 9 zu einem gesendeten Index IDXtransm von 2.
  • Der Dequantisierer multipliziert den gesendeten Index mit dem Skalenfaktor, um einen rekonstruierten Index IDXrek abzuleiten, der zur Dequantisierung verwendet wird. Wie man bei dem ersten Beispiel eines Indizes 10 auf der Quantisiererseite sehen kann, entsteht auf Grund der Rundung des dividierten Indizes auf der Quantisiererseite ein zusätzlicher Fehler von 1. Dagegen wird kein zusätzlicher Fehler eingebracht, wenn die Division des Skalenfaktors auf der Quantisiererseite zufällig einen zu sendenden ganzzahlwertigen Index IDXtransm ergibt.
  • Selbstverständlich nimmt mit einem steigenden Skalenfaktor f die Gefahr, dass zusätzliche Fehler eingebracht werden, zu. Dies bedeutet, dass die Wahrscheinlichkeit eines Hinzufügens zusätzlicher Fehler zu Niedrigenergiesignalen ziemlich hoch ist. Wenn Signale, die durch den betreffenden CLD-Parameter beschrieben werden, eine vergleichsweise gleiche Energie aufweisen, liegt der CLD-Wert nahe bei eins, und dies gilt auch für den Skalenfaktor (siehe beispielsweise 5). Dies bedeutet, dass, wenn die Kanäle, für die die Parameter auf eine energieabhängige Weise codiert sind, im Großen und Ganzen beide dieselbe Energie aufweisen, normalerweise keine zusätzlichen Fehler bei der Quantisierung eingebracht werden. Dies ist selbstverständlich äußerst zweckmäßig, da, wenn jeder Kanal in etwa dieselbe Energie in einem Mehrkanalsignal aufweist, jeder einzelne Kanal während einer gleichzeitigen Wiedergabe hörbar ist und somit ein eingebrachter Fehler für die Zuhörerschaft deutlich hörbar wäre.
  • Es ist offensichtlich ein enormer Vorteil der vorliegenden Erfindung, dass Fehler lediglich für Kanäle akzeptiert werden, die eine relativ niedrige Energie aufweisen. Für diese Kanäle bringt dagegen ein Dividieren der Indizes der zuge ordneten Parameter durch einige große Zahlen die Indexwerte dieser Kanäle durchschnittlich näher an die Zahl null heran. Dies kann durch die folgende Differenzcodierungs- und Huffman-Codierungsprozedur auf perfekte Weise ausgenutzt werden, um die Bitrate, die für die gesendeten Parameter eines Mehrkanalsignals verbraucht wird, auf effiziente Weise zu verringern.
  • Die Beziehung der lokalen und der Gesamtenergie, auf der die Entscheidung, welche De-/Quantisierungsregel zu verwenden ist, beruht, wird in den vorherigen Abschnitten als logarithmische Maßzahl beschrieben. Dies ist selbstverständlich nicht die einzige mögliche Maßzahl, die zum Verwirklichen des erfindungsgemäßen Konzepts verwendet werden kann. Jegliche andere Maßzahl, die eine Energiedifferenz zwischen der lokalen Energie oder der Gesamtenergie beschreibt, beispielsweise die einfache Differenz, kann zum Treffen der Entscheidung verwendet werden.
  • Ein weiteres wichtiges Merkmal bei der vorliegenden Erfindung besteht darin, dass in Kombination mit einem Zweikanalddecodierer-(PS-)Entwurf, der die ankommende Energie auf die zwei Ausgangskanäle verteilt, die üblicherweise durch einen z. B. CLD-ähnlichen Parameter gesteuert werden (was bedeutet, dass die ankommende Energie gleich der Summe der Energien für die zwei Ausgangskanäle ist), die Differenz bezüglich der Energie, relative lokale Energie zwischen der Gesamtenergie und der lokalen Energie für alle Zweikanaldecodierer (122, 124, 126 und 128) durch die CLD-Parameter definiert ist. Dies bedeutet, dass kein Erfordernis besteht, die Gesamtenergie und die lokale Energie tatsächlich zu messen, da die Energiedifferenz in dB, die üblicherweise dazu verwendet wird, den Skalenfaktor zu berechnen, durch die CLD-Parameter definiert ist.
  • In Abhängigkeit von bestimmten Implementierungsanforderungen der erfindungsgemäßen Verfahren können die erfindungsgemäßen Verfahren in Hardware oder in Software implemen tiert werden. Die Implementierung kann unter Verwendung eines digitalen Speichermediums, insbesondere einer Diskette, DVD oder CD, durchgeführt werden, auf dem elektronisch lesbare Steuersignale gespeichert sind, die mit einem programmierbaren Computersystem derart zusammenwirken, dass die erfindungsgemäßen Verfahren durchgeführt werden. Allgemein ist die vorliegende Erfindung somit ein Computerprogrammprodukt mit einem Programmcode, der auf einem maschinenlesbaren Träger gespeichert ist, wobei der Programmcode dahin gehend wirksam ist, die erfindungsgemäßen Verfahren auszuführen, wenn das Computerprogrammprodukt auf einem Computer abläuft. Mit anderen Worten sind die erfindungsgemäßen Verfahren somit ein Computerprogramm, das einen Programmcode zum Durchführen zumindest eines der erfindungsgemäßen Verfahren, wenn das Computerprogramm auf einem Computer abläuft, aufweist.
  • Obwohl das Vorstehende besonders unter Bezugnahme auf bestimmte Ausführungsbeispiele desselben gezeigt und beschrieben wurde, wird Fachleuten einleuchten, dass verschiedene andere Änderungen bezüglich der Form und in Bezug auf Einzelheiten vorgenommen werden können, ohne von dem Schutzumfang der Erfindung gemäß der Definition durch die angehängten Patentansprüche abzuweichen.

Claims (44)

  1. Parameterquantisierer zum Quantisieren eines Eingangsparameters, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, mit folgenden Merkmalen: einem Quantisierungsregelgenerator zum Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und einem Wertquantisierer zum Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  2. Parameterquantisierer gemäß Anspruch 1, bei dem der Quantisierungsregelgenerator dahin gehend wirksam ist, die Quantisierungsregel zu erzeugen, so dass eine Quantisierung für einen Kanal oder ein Kanalpaar, der beziehungsweise das ein niedriges Energiemaß aufweist, gröber ist als für einen Kanal oder ein Kanalpaar, der beziehungsweise das ein hohes Energiemaß aufweist.
  3. Parameterquantisierer gemäß Anspruch 1, bei dem der Quantisierungsregelgenerator dahin gehend wirksam ist, eine Quantisierungsregel aus zwei oder mehr vorbestimmten Quantisierungsregeln auszuwählen.
  4. Parameterquantisierer gemäß Anspruch 1, bei dem der Quantisierungsregelgenerator dahin gehend wirksam ist, eine neue Quantisierungsregel auf der Basis einer Be ziehung des Energiemaßes des Kanals oder des Paares von Kanälen und des Energiemaßes des Mehrkanalsignals zu berechnen.
  5. Parameterquantisierer gemäß Anspruch 4, bei dem der Quantisierungsregelgenerator dahin gehend wirksam ist, dass die Berechnung der Quantisierungsregel eine Berechnung eines Skalenfaktors umfasst.
  6. Parameterquantisierer gemäß Anspruch 5, der ferner einen Parameterskalierer zum Modifizieren des Eingangsparameters unter Verwendung des Skalenfaktors umfasst.
  7. Parameterquantisierer gemäß Anspruch 6, bei dem der Parameterskalierer dahin gehend wirksam ist, den Eingangsparameter so zu modifizieren, dass die Modifizierung eine Teilung des Eingangsparameters durch den Skalenfaktor umfasst.
  8. Parameterquantisierer gemäß Anspruch 5, der ferner eine Komprimierungsvorrichtung umfasst, wobei der Parameterquantisierer dahin gehend wirksam ist, einen quantisierten Zwischenparameter unter Verwendung einer vorbestimmten Quantisierungsregel abzuleiten; und wobei die Komprimierungsvorrichtung dahin gehend wirksam ist, den quantisierten Parameter unter Verwendung des quantisierten Zwischenparameters und des Skalenfaktors abzuleiten.
  9. Parameterquantisierer gemäß Anspruch 1, bei dem der Quantisierungsregelgenerator dahin gehend wirksam ist, eine Quantisierungsregel zu erzeugen, so dass eine Anwendung der Quantisierungsregel auf den Eingangsparameter eine Zuweisung desselben quantisierten Parame ters zu allen Eingangsparametern innerhalb eines gegebenen Eingangsparameterbereichs umfasst.
  10. Parameterquantisierer gemäß Anspruch 1, bei dem der Eingangsparameter ein räumlicher Parameter ist, der eine räumliche Wahrnehmung des Mehrkanalaudiosignals beschreibt, und bei dem der Eingangsparameter aus der folgenden Liste von Parametern ausgewählt ist: Zwischen-Kanal-Korrelation/Kohärenz (ICC – interchannel correlation/coherence), Zwischen-Kanal-Pegel-/Intensitätsdifferenz (ICLD oder IID – inter-channel level/intensity difference), Zwischen-Kanal-Phasendifferenz (IPD – inter-channel Phase difference) und Zwischen-Kanal-Zeitdifferenz (ICTD – inter-channel time difference).
  11. Parameterquantisierer gemäß Anspruch 1, der ferner einen Differenzcodierer und einen Huffman-Codierer umfasst, wobei der Differenzcodierer dahin gehend wirksam ist, eine unterschiedlich codierte Darstellung des quantisierten Parameters abzuleiten; und wobei der Huffman-Codierer dahin gehend wirksam ist, eine Huffman-codierte Darstellung der unterschiedlich codierten Darstellung abzuleiten.
  12. Parameterdequantisierer zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, mit folgenden Merkmalen: einem Dequantisierungsregelgenerator zum Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Einzelkanals oder des Paares von Kanälen und eines Energiemaßes, das von Kanälen des Mehrkanalsignals abgeleitet ist; und einem Wertdequantisierer zum Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  13. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, ein Energiemaß zu verwenden, das von Kanälen des Mehrkanalsignals abgeleitet ist, das von einer Kombination von Kanälen abgeleitet ist, die nicht den Kanal oder das Paar von Kanälen aufweist.
  14. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, die Dequantisierungsregel zu erzeugen, so dass eine Dequantisierung für einen Kanal oder ein Kanalpaar, der beziehungsweise das ein niedriges Energiemaß aufweist, gröber ist als für einen Kanal oder ein Kanalpaar, der beziehungsweise das ein hohes Energiemaß aufweist.
  15. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, eine Dequantisierungsregel aus zwei oder mehr feststehenden Dequantisierungsregeln, die in einem Speicher gespeichert sind, auszuwählen.
  16. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, die neue Dequantisierungsregel auf der Basis ei ner Beziehung des Energiemaßes des Kanals oder des Paares von Kanälen und des Energiemaßes, das von Kanälen des Mehrkanalsignals abgeleitet ist, zu berechnen.
  17. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, dass die Berechnung der Dequantisierungsregel eine Berechnung eines Skalenfaktors umfasst.
  18. Parameterdequantisierer gemäß Anspruch 17, bei dem der Dequantisierungsregelgenerator ferner einen Parameterskalierer zum Modifizieren des Parameters unter Verwendung des Skalenfaktors umfasst.
  19. Parameterdequantisierer gemäß Anspruch 17, bei dem der Parameterskalierer dahin gehend wirksam ist, den Parameter derart zu modifizieren, dass die Modifizierung eine Multiplikation des Parameters mit dem Skalenfaktor umfasst.
  20. Parameterdequantisierer gemäß Anspruch 17, bei dem der Dequantisierungsregelgenerator ferner einen Dekomprimierer zum Ableiten eines quantisierten Zwischenparameters von dem quantisierten Parameter unter Verwendung des Skalenfaktors umfasst; und bei dem der Wertdequantisierer dahin gehend wirksam ist, den Parameter unter Verwendung einer feststehenden Dequantisierungsregel von dem quantisierten Zwischenparameter abzuleiten.
  21. Parameterdequantisierer gemäß Anspruch 20, bei dem der Dekomprimierer dahin gehend wirksam ist, den quantisierten Zwischenparameter durch Multiplikation des Skalenfaktors und des quantisierten Parameters abzuleiten.
  22. Parameterdequantisierer gemäß Anspruch 20, bei dem der Dequantisierungsregelgenerator ferner einen Runder umfasst, um einen ganzzahlwertigen quantisierten Zwischenparameter von dem quantisierten Zwischenparameter abzuleiten; und bei dem der Wertdequantisierer dahin gehend wirksam ist, den Parameter unter Verwendung einer feststehenden Dequantisierungsregel von dem ganzzahlwertigen quantisierten Zwischenparameter abzuleiten.
  23. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einer Kombination eines Links-Vorne-Kanals und eines Rechts-Vorne-Kanals und einer Kombination eines Mitte-Kanals und eines Niederfrequenzverbesserungskanals ist; wobei das Energiemaß ein Energiemaß eines Paares von Kanälen ist, das einen ersten Kanal, der aus dem Vorne-Links- und dem Vorne-Rechts-Kanal kombiniert ist, und einen zweiten Kanal, der aus dem Mitte-Kanal und dem Niederfrequenzverbesserungskanal kombiniert ist, aufweist; und wobei das Energiemaß, das von Kanälen des Mehrkanalsignals abgeleitet ist, ein Energiemaß ist, das von einer Kombination eines Hinten-Links- und eines Hinten-Rechts-Kanals abgeleitet ist.
  24. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einem Hinten-Links- und einem Hinten-Rechts-Kanal ist; wobei das Energiemaß ein Energiemaß eines Paares von Kanälen ist, das den Hinten-Links- und den Hinten-Rechts-Kanal aufweist; und wobei das von Kanälen des Mehrkanalsignals abgeleitete Energiemaß ein Energiemaß ist, das von einer Kombination eines Links-Vorne-, eines Rechts-Vorne-, eines Mitte- und eines Niederfrequenzverbesserungskanals abgeleitet ist.
  25. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einem Vorne-Links- und einem Vorne-Rechts-Kanal ist; wobei das Energiemaß ein Maß eines Paares von Kanälen ist, das den Vorne-Links- und den Vorne-Rechts-Kanal aufweist; und wobei das von Kanälen des Mehrkanalsignals abgeleitete Energiemaß ein Energiemaß ist, das von einer Kombination eines Mitte- und eines Niederfrequenzverbesserungskanals abgeleitet ist.
  26. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einer Kombination eines Links-Vorne- und eines Links-Hinten-Kanals und einer Kombination eines Rechts-Vorne- und eines Rechts-Hinten-Kanals ist; wobei das Energiemaß ein Energiemaß eines Paares von Kanälen ist, das einen aus dem Links-Vorne- und dem Links-Hinten-Kanal kombinierten ersten Kanal aufweisen und einen aus dem Rechts-Vorne- und dem Rechts-Hinten-Kanal kombinierten zweiten Kanal aufweist; und wobei das von Kanälen des Mehrkanalsignals abgeleitete Energiemaß ein Energiemaß ist, das von einer Kombination eines Mitte- und eines Niederfrequenzverbesserungskanals abgeleitet ist.
  27. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einem Links-Vorne- und einem Links-Hinten-Kanal ist; wobei das Energiemaß ein Energiemaß eines Paares von Kanälen ist, das den Links-Vorne- und den Links-Hinten-Kanal aufweist; und wobei das von Kanälen des Mehrkanalsignals abgeleitete Energiemaß ein Energiemaß ist, das von einer Kombination eines Rechts-Vorne- und eines Rechts-Hinten-Kanals abgeleitet ist.
  28. Parameterdequantisierer gemäß Anspruch 12, bei dem der quantisierte Parameter ein Maß einer Energiebeziehung zwischen einem Rechts-Vorne- und einem Rechts-Hinten-Kanal ist; wobei das Energiemaß ein Energiemaß eines Paares von Kanälen ist, das den Rechts-Vorne- und den Rechts-Hinten-Kanal aufweist; und wobei das von Kanälen des Mehrkanalsignals abgeleitete Energiemaß ein Energiemaß ist, das von einer Kombination eines Links-Vorne- und eines Links-Hinten-Kanals abgeleitet ist.
  29. Parameterdequantisierer gemäß Anspruch 12, bei dem der Dequantisierungsregelgenerator dahin gehend wirksam ist, eine Dequantisierungsregel zu erzeugen, derart, dass eine Anwendung der Dequantisierungsregel auf die quantisierten Parameter eine Zuweisung der quantisierten Parameter zu einem Parameter umfasst.
  30. Parameterdequantisierer gemäß Anspruch 12, der ferner einen Differenzdecodierer und einen Huffman-Decodierer umfasst, wobei der Huffman-Decodierer dahin gehend wirksam ist, eine Huffman-decodierte Darstellung einer empfangenen Huffman-codierten Darstellung abzuleiten; und wobei der Differenzdecodierer dahin gehend wirksam ist, den quantisierten Parameter von der Huffman-decodierten Darstellung abzuleiten.
  31. Parameterdequantisierer gemäß Anspruch 12, bei dem der Parameter ein räumlicher Parameter ist, der eine räumliche Wahrnehmung des Mehrkanalaudiosignals beschreibt, und bei dem der Eingangsparameter aus der folgenden Liste von Parametern ausgewählt ist: Zwischen-Kanal-Korrelation/Kohärenz (ICC – interchannel correlation/coherence), Pegel-/Intensitätsdifferenz zwischen den Kanälen (ICLD oder IID – inter-channel level/intensity difference), Phasendifferenz zwischen den Kanälen (IPD – interchannel Phase difference) und Zeitdifferenz zwischen den Kanälen (ICTD – interchannel time difference).
  32. Verfahren zum Quantisieren eines Eingangsparameters, bei dem der Eingangsparameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei das Verfahren folgende Schritte umfasst: Erzeugen einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals; und Ableiten eines quantisierten Parameters von dem Eingangsparameter unter Verwendung der erzeugten Quantisierungsregel.
  33. Verfahren zum Dequantisieren eines quantisierten Parameters, um einen Parameter abzuleiten, bei dem der Parameter ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei das Verfahren folgende Schritte umfasst: Erzeugen einer Dequantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines. Energiemaßes des Mehrkanalsignals; und Ableiten des Parameters von dem quantisierten Eingangsparameter unter Verwendung der erzeugten Dequantisierungsregel.
  34. Darstellung eines Mehrkanalsignals, das einen quantisierten Parameter aufweist, der eine quantisierte Darstellung eines Parameters ist, der ein Maß einer Charakteristik eines Einzelkanals oder eines Paares von Kanälen ist, wobei der Parameter ein Maß einer Charakteristik des Einzelkanals oder des Paares von Kanälen bezüglich eines anderen Einzelkanals oder eines Paares von Kanälen eines Mehrkanalsignals ist, wobei der quantisierte Parameter unter Verwendung einer Quantisierungsregel auf der Basis einer Beziehung eines Energiemaßes des Kanals oder des Paares von Kanälen und eines Energiemaßes des Mehrkanalsignals abgeleitet wird.
  35. Maschinenlesbares Speichermedium, auf dem eine Darstellung eines Mehrkanalsignals gemäß Anspruch 34 gespeichert ist.
  36. Sender oder Audioaufzeichnungsvorrichtung, der beziehungsweise die einen Parameterquantisierer gemäß Anspruch 1 aufweist.
  37. Empfänger oder Audiowiedergabevorrichtung, der beziehungsweise die einen Parameterdequantisierer gemäß Anspruch 12 aufweist.
  38. Verfahren zum Senden oder Audio-Aufzeichnen, wobei das Verfahren ein Verfahren zum Quantisieren gemäß Anspruch 32 umfasst.
  39. Verfahren zum Empfangen oder Audio-Wiedergeben, wobei das Verfahren ein Verfahren zum Dequantisieren gemäß Anspruch 33 aufweist.
  40. Übertragungssystem, das einen Sender und einen Empfänger aufweist, wobei der Sender einen Parameterquantisierer gemäß Anspruch 1 aufweist und der Empfänger einen Parameterdequantisierer gemäß Anspruch 12 aufweist.
  41. Verfahren zum Senden und Empfangen, wobei das Verfahren ein Sendeverfahren, das ein Verfahren zum Quantisieren gemäß Anspruch 32 aufweist, und ein Empfangsverfahren, das ein Verfahren zum Dequantisieren gemäß Anspruch 33 aufweist, umfasst.
  42. Computerprogramm, das dahin gehend angepasst ist, ein Verfahren gemäß einem der Verfahrensansprüche 32, 33, 38, 39 oder 41 auszuführen, wenn es auf einem Computer läuft.
  43. Mehrkanaldecodierer zum Erzeugen einer Rekonstruktion eines Mehrkanalsignals: ein Parameterdequantisierer gemäß Anspruch 12; und ein Aufwärtsmischer zum Aufwärtsmischen der Rekonstruktion des Mehrkanalsignals aus einem gesendeten abwärtsgemischten Signal unter Verwendung von Parametern, die durch den Parameterdequantisierer dequantisiert werden.
  44. Mehrkanalcodierer zum Erzeugen einer codierten Darstellung eines Mehrkanalsignals, der folgende Merkmale aufweist: einen Parameterquantisierer gemäß Anspruch 1; und einen Abwärtsmischer zum Erzeugen eines Abwärtsmischsignals aus dem Mehrkanalsignal unter Verwendung von Parametern, die durch den Quantisierer quantisiert werden, wobei dieses Abwärtsmischsignal weniger Kanäle aufweist als das Mehrkanalsignal.
DE602006000239T 2005-04-19 2006-04-10 Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter Active DE602006000239T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67294305P 2005-04-19 2005-04-19
US672943P 2005-04-19
PCT/EP2006/003284 WO2006111294A1 (en) 2005-04-19 2006-04-10 Energy dependent quantization for efficient coding of spatial audio parameters

Publications (2)

Publication Number Publication Date
DE602006000239D1 DE602006000239D1 (de) 2007-12-27
DE602006000239T2 true DE602006000239T2 (de) 2008-09-18

Family

ID=36581679

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602006000239T Active DE602006000239T2 (de) 2005-04-19 2006-04-10 Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter

Country Status (15)

Country Link
US (1) US8054981B2 (de)
EP (1) EP1754222B1 (de)
JP (1) JP4521032B2 (de)
KR (1) KR100878371B1 (de)
CN (1) CN1993733B (de)
AT (1) ATE378675T1 (de)
BR (1) BRPI0605857A (de)
DE (1) DE602006000239T2 (de)
ES (1) ES2297825T3 (de)
HK (1) HK1095993A1 (de)
MY (1) MY141427A (de)
PL (1) PL1754222T3 (de)
RU (1) RU2376655C2 (de)
TW (1) TWI327306B (de)
WO (1) WO2006111294A1 (de)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006104017A1 (ja) * 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
WO2007037613A1 (en) * 2005-09-27 2007-04-05 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
KR20080071971A (ko) * 2006-03-30 2008-08-05 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8265941B2 (en) * 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2009125046A1 (en) * 2008-04-11 2009-10-15 Nokia Corporation Processing of signals
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
JP5752134B2 (ja) * 2009-10-15 2015-07-22 オランジュ 最適化された低スループットパラメトリック符号化/復号化
JP2012023540A (ja) * 2010-07-14 2012-02-02 Asahi Kasei Electronics Co Ltd マルチビットデルタシグマ変調器及びadコンバータ
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
CN103718466B (zh) * 2011-08-04 2016-08-17 杜比国际公司 通过使用参量立体声改善fm立体声无线电接收器
CN103534753B (zh) 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
US9799339B2 (en) 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder
US9154785B2 (en) 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US9544566B2 (en) 2012-12-14 2017-01-10 Qualcomm Incorporated Disparity vector derivation
JP6250071B2 (ja) 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
RU2640722C2 (ru) 2013-04-05 2018-01-11 Долби Интернешнл Аб Усовершенствованный квантователь
US9821908B2 (en) * 2013-06-07 2017-11-21 Bell Helicopter Textron Inc. System and method for assisting in rotor speed control
EP3011562A2 (de) * 2013-06-17 2016-04-27 Dolby Laboratories Licensing Corporation Mehrstufige quantisierung von parametervektoren aus ungleichen signalgrössen
US9530422B2 (en) 2013-06-27 2016-12-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
EP3095117B1 (de) * 2014-01-13 2018-08-22 Nokia Technologies Oy Multikanal-audiosignalklassifizierer
JP6732739B2 (ja) * 2014-10-01 2020-07-29 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびデコーダ
CN106796804B (zh) * 2014-10-02 2020-09-18 杜比国际公司 用于对话增强的解码方法和解码器
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
WO2018086948A1 (en) * 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
ES2968494T3 (es) 2018-10-31 2024-05-09 Nokia Technologies Oy Determinación de codificación de parámetros de audio espacial y decodificación asociada
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
GB2595883A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2598773A (en) * 2020-09-14 2022-03-16 Nokia Technologies Oy Quantizing spatial audio parameters

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0500913B1 (de) * 1990-09-19 1998-01-21 Koninklijke Philips Electronics N.V. System mit einem aufzeichnungsträger und einer wiedergabevorrichtung
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
RU2004118840A (ru) * 2001-11-23 2005-10-10 Конинклейке Филипс Электроникс Н.В. (Nl) Способ замещения воспринимаемого шума
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
BR0305434A (pt) * 2002-07-12 2004-09-28 Koninkl Philips Electronics Nv Métodos e arranjos para codificar e para decodificar um sinal de áudio multicanal, aparelhos para fornecer um sinal de áudio codificado e um sinal de áudio decodificado, sinal de áudio multicanal codificado, e, meio de armazenagem
US7181019B2 (en) * 2003-02-11 2007-02-20 Koninklijke Philips Electronics N. V. Audio coding
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
JP2006528482A (ja) * 2003-07-24 2006-12-21 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸の逆転写及び/または増幅方法

Also Published As

Publication number Publication date
ATE378675T1 (de) 2007-11-15
EP1754222A1 (de) 2007-02-21
US8054981B2 (en) 2011-11-08
JP4521032B2 (ja) 2010-08-11
HK1095993A1 (en) 2007-05-25
EP1754222B1 (de) 2007-11-14
TW200703238A (en) 2007-01-16
KR20070062502A (ko) 2007-06-15
CN1993733A (zh) 2007-07-04
DE602006000239D1 (de) 2007-12-27
RU2007106874A (ru) 2008-08-27
US20070016416A1 (en) 2007-01-18
JP2008517339A (ja) 2008-05-22
WO2006111294A1 (en) 2006-10-26
PL1754222T3 (pl) 2008-04-30
ES2297825T3 (es) 2008-05-01
BRPI0605857A (pt) 2007-12-18
TWI327306B (en) 2010-07-11
KR100878371B1 (ko) 2009-01-15
CN1993733B (zh) 2010-12-08
RU2376655C2 (ru) 2009-12-20
MY141427A (en) 2010-04-30

Similar Documents

Publication Publication Date Title
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE60318835T2 (de) Parametrische darstellung von raumklang
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE602005002256T2 (de) Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion
DE69431622T2 (de) Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren
DE69210689T2 (de) Kodierer/dekodierer für mehrdimensionale schallfelder
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
EP0931386A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE102005014477A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
CN1981326A (zh) 音频信号解码装置及音频信号编码装置
CN116741186A (zh) 立体声音频编码器和解码器
DE20321886U1 (de) Inverse Quantisierung für Audio
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE112019003358T5 (de) Verfahren und vorrichtung zum codieren und/oder decodieren immersiver audiosignale
Baumgarte et al. Audio coder enhancement using scalable binaural cue coding with equalized mixing
Helmrich Efficient Perceptual Audio Coding Using Cosine and Sine Modulated Lapped Transforms
DE102004009628A1 (de) Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD

Legal Events

Date Code Title Description
8364 No opposition during term of opposition