DE69810361T2 - Verfahren und Vorrichtung zur mehrkanaligen akustischen Signalkodierung und -dekodierung - Google Patents
Verfahren und Vorrichtung zur mehrkanaligen akustischen Signalkodierung und -dekodierungInfo
- Publication number
- DE69810361T2 DE69810361T2 DE69810361T DE69810361T DE69810361T2 DE 69810361 T2 DE69810361 T2 DE 69810361T2 DE 69810361 T DE69810361 T DE 69810361T DE 69810361 T DE69810361 T DE 69810361T DE 69810361 T2 DE69810361 T2 DE 69810361T2
- Authority
- DE
- Germany
- Prior art keywords
- decoding
- coefficients
- signal sample
- quantization
- sample sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 97
- 230000003595 spectral effect Effects 0.000 claims description 143
- 238000013139 quantization Methods 0.000 claims description 125
- 238000001228 spectrum Methods 0.000 claims description 106
- 239000013598 vector Substances 0.000 claims description 101
- 230000003044 adaptive effect Effects 0.000 claims description 51
- 230000009466 transformation Effects 0.000 claims description 28
- 230000005284 excitation Effects 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000010606 normalization Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 230000002441 reversible effect Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims 3
- 108091006146 Channels Proteins 0.000 description 102
- 238000010586 diagram Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein Kodierverfahren, das wirksames Kodieren mehrerer Kanäle eines akustischen Signals, wie Sprache oder Musik erlaubt und besonders geeignet ist für deren Übertragung mit niedrigen Bitraten. Die Erfindung bezieht sich auch auf ein Verfahren zum Dekodieren eines solchen kodierten Signals sowie einen Kodierer und Dekodierer, die das Kodier- bzw. Dekodierverfahren anwenden.
- Es ist allgemein bekannt, ein Sprach-Musik- oder ähnliches akustisches Signal im Frequenzbereich zu kodieren, um die Anzahl Bits für das Kodieren des Signals zu verringern. Die Transformation vom Zeit- zum Frequenzbereich wird üblicherweise mittels DFT (Discrete Fourier Transform) DCT (Discrete Cosine Transform) und MDCT (Modified Discrete Transform), das ist eine Art LOT (Lapped Orthogonal Transform) durchgeführt. Es ist ebenfalls allgemein bekannt, daß eine LPC (Linear Predictive Coding) Analyse beim Abflachen von Frequenzbereichskoeffizienten (das heißt Spektrumabtastwerten) vor dem Quantisieren wirksam ist. Als ein Beispiel eines Verfahrens für hochqualitatives Kodieren einer großen Vielfalt akustischer Signale durch kombinierte Anwendung dieser Techniken sind Kodier- und Dekodierverfahren für die Transformation akustischer Signale zum Beispiel in der japanischen Patentanmeldung JP-A-8044399 (entsprechend US-Patent 5 684 920) offenbart. Die Konfiguration einer Kodiervorrichtung, die das offenbarte Verfahren nutzt, ist in Fig. 1 in vereinfachter Form dargestellt.
- In Fig. 1 wird ein akustisches Signal von einem Eingabeanschluß 11 an einen Orthogonal-Transformationsteil 12 angelegt, in dem es durch Verwendung des oben genannten Schemas in Koeffizienten im Frequenzbereich transformiert wird. Die Frequenzbereichskoeffizienten werden nachfolgend als Spektrumabtastwerte bezeichnet. Das eingegebene akustische Signal wird in einem Spektralhüllkurven-Schätzteil 13 auch einer LPC-Analyse unterzogen. Hierdurch wird die spektrale Hüllkurve des eingegebenen akustischen Signals erfaßt. Das bedeutet, daß im Orthogonal-Transformationsteil 12 das akustische digitale Signal vom Eingabeanschluß 11 durch LOT-Transformation (zum Beispiel MDCT) Nter Ordnung in Spektrumabtastwerte transformiert wird, indem alle N Abtastwerfe eine Eingabesequenz der vergangenen 2N Abtastwerte aus dem akustischen Signal extrahiert wird. Auch in einem LPC-Analyseteil 13A eines Spektralhüllkurven-Schätzteils 13 wird ähnlich alle N Abtastwerte eine Sequenz von 2N Abtastwerten aus dem eingegebenen digitalen akustischen Signal extrahiert. Aus den so extrahierten Abtastwerten d werden prädiktive Koeffizienten Pter Ordnung α&sub0; ... αp abgeleitet. Diese prädiktiven Koeffizienten α&sub0; ... αp werden zum Beispiel in LSP-Parameter oder k-Parameter transformiert und dann in einem Quantisierteil 13B quantisiert, wodurch ein Index In&sub1; erhalten wird, der die spektrale Hüllkurve der prädiktiven Koeffizienten anzeigt. In einem LPC- Spektrumrechenteil 13C wird aus den quantisierten prädiktiven Koeffizienten die spektrale Hüllkurven des eingegebenen Signals errechnet. Die so erhaltene spektrale Hüllkurve wird einem Spek trumabflach- oder Spektrum-Normierteil 14 sowie einem Gewichtungsfaktor-Rechenteil 15D zugeleitet.
- Im Spektrum-Normierteil 14 werden die Spektrumabtastwerte vom Orthogonal-Transformationsteil 12 je durch den entsprechenden Abtastwert der spektralen Hüllkurve vom Spektralhüllkurven-Schätzteil 13 (abflachen oder normieren) dividiert, womit Spektrumrestkoeffizienten bereitgestellt werden. Ein Restkoeffizientenhüllkurven-Schätzteil 15A errechnet auch eine spektrale Restkoeffizientenhüllkurve aus den Spektrumrestkoeffizienten und stellt sie einem Restkoeffizientenabflach- oder Normierteil 15B und dem Gewichtungsfaktor-Rechenteil 15D zur Verfügung. Gleichzeitig errechnet der Restkoeffizientenhüllkurven-Schätzteil 15A einen Vektorquantisierindex In&sub2; der Spektrumrestkoeffizientenhüllkurve und gibt ihn aus. Im Restkoeffizientennormierteil 15B werden die Spektrumrestkoeffizienten vom Spektrum-Normierteil 14 durch die spektrale Restkoeffizientenhüllkurve dividiert, um spektrale Feinstrukturkoeffizienten zu erhalten, die an einen gewichteten Vektorquantisierteil 15C gegeben werden. Im Gewichtungsfaktor-Rechenteil 15D wird die spektrale Restkoeffizientenhüllkurve vom Restkoeffizientenhüllkurven-Schätzteil 15A und die LPC spektrale Hüllkurve vom Spektralhüllkurven-Schätzteil 13 für jeden entsprechenden Spektrumabtastwert multipliziert, um Gewichtungsfaktoren W = W&sub1; ... WN zu erhalten, die dem gewichteten Vektorquantisierteil 15C zur Verfügung gestellt werden. Es ist auch möglich, als Gewichtungsfaktoren W Koeffizienten zu benutzen, die durch Multiplizieren der multiplizierten Ergebnisse mit psychoakustischen oder perzeptuellen Koeffizienten auf der Grundlage psychoakustischer oder perzeptueller Modelle erhalten werden. Im gewichteten Vektorquantisierteil 15C werden die gewichteten Faktoren W benutzt, um eine gewichtete Vektorquantisierung der Feinstrukturkoeffizienten vom Restkoeffizientennormierteil 15B durchzuführen. Und der gewichtete Vektorquantisierteil 15C gibt einen Index In&sub3; dieser gewichteten Vektorquantisierung aus. Ein Satz der so erhaltenen Indizes In&sub1;, In&sub2; und In&sub3; steht als Ergebnis des Kodierens eines Rahmens des eingegebenen akustischen Signals zur Verfügung.
- Auf der in Fig. 1B gezeigten Dekodierseite werden die spektralen Feinstrukturkoeffizienten vom Index In&sub3;, in einem Vektorquantisier-Dekodierteil 21A dekodiert. In Dekodierteilen 22 und 21B wird die LPC-Spektralhüllkurve und die spektrale Restkoeffizientenhüllkurve aus den Indizes In&sub1;, bzw. In&sub2; dekodiert. Ein Restkoeffizientenentabflachungs- oder Entnormierteil 21C (Umkehrabflachung oder Umkehrnormierung) multipliziert die spektrale Restkoeffizientenhüllkurve und die spektralen Feinstrukturkoeffizienten für jeden entsprechenden Spektrumabtastwert, um die spektralen Restkoeffizienten wieder herzustellen. Ein Spektrumentabflachungs- oder Entnormierteil 25 (Umkehrabflachung oder Umkehrnormierung) multipliziert die so wiederhergestellten Spektrumrestkoeffizienten mit der dekodierten LPC-Spektralhüllkurve, um die Spektrumabtastwerte des akustischen Signals wiederherzustellen. In einem Orthogonal-Umkehrtransformationsteil 26 werden die Spektrumabtastwerte einer orthogonalen Umkehrtransformation in Zeitbereichssignale unterzogen, die als dekodierte akustische Signale eines Rahmens an einem Anschluß 27 bereitgestellt werden.
- Beim Kodieren von Eingabesignalen mehrerer Kanäle mit Hilfe solcher, in der oben genannten japanischen Patentanmeldung beschriebenen Kodier- und Dekodierverfahren wird das Eingabesignal jedes Kanals in den Satz Indizes In&sub1;, In&sub2; und In&sub3; kodiert, wie oben beschrieben. Es ist möglich, die kombinierte Verzerrung durch Steuern der Bitzuteilung für das Kodieren gemäß unausgegli chener Leistungsverteilung unter den Kanälen zu reduzieren. Was Stereosignale betrifft, ist unter den Namen MS Stereo bereits ein Schema in Gebrauch, welches das Ungleichgewicht in der Leistung zwischen rechten und linken Signalen nutzt, indem diese in Summen- und Differenzsignale transformiert werden.
- Das MS Stereoschema ist wirksam, wenn die rechten und linken Signale nahe analog zueinander sind; aber es reduziert die Quantisierungsverzerrung nicht genügend, wenn sie außer Phase sind. Ein Mehrkanal-Differential-Impulskodiermodulationssystem (PCM) ist in US-A-4039948 offenbart. Dieses System schafft Kommunikation zwischen einer Vielzahl analoger Signalquellen und entsprechender Senken und benutzt dazu Differential-PCM-Kodierer und Dekodierer um Zeitenteilbetrieb. Es gibt keinen Vorschlag einer Mehrkanalsignalkodierung durch Ausnutzen der Korrelation zwischen Mehrkanalsignalen, wenn sie nicht miteinander in Beziehung stehen.
- Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Kodierverfahren gemäß Anspruch 1 zu schaffen, welches durch Verringerung der Quantisierverzerrung beim Kodieren von Mehrkanaleingabesignalen, beispielsweise Stereosignalen eine verbesserte Signalqualität bietet, sowie ein Dekodierverfahren dafür gemäß Anspruch 23 und Kodier- und Dekodiervorrichtungen, die das Verfahren anwenden, gemäß Anspruch 38 bzw. 60.
- Fig. 1A ist ein Blockschaltbild einer herkömmlichen Kodiervorrichtung;
- Fig. 1B ist ein Blockschaltbild einer herkömmlichen Dekodiervorrichtung;
- Fig. 2A ist ein Blockschaltbild, welches das Prinzip der Kodiervorrichtung gemäß der vorliegenden Erfindung zeigt;
- Fig. 2B ist ein Blockschaltbild, welches die der Kodiervorrichtung in Fig. 2A entsprechende Dekodiervorrichtung zeigt;
- Fig. 3A ist ein Blockschaltbild eines konkreten Ausführungsbeispiels der Kodiervorrichtung gemäß der vorliegenden Erfindung;
- Fig. 3B ist ein Blockschaltbild eines konkreten Ausführungsbeispiels der der Kodiervorrichtung in Fig. 3A entsprechenden Dekodiervorrichtung;
- Fig. 4 ist ein Diagramm zur Erläuterung der Verschachtelung von Signalabtastwerten aus zwei Kanälen;
- Fig. 5A ist eine Kurvendarstellung eines Beispiels des Spektrums eines Signals einer einzigen Folge, mit der Zweikanalsignale etwa des gleichen Pegels verschachtelt wurden;
- Fig. 5B ist eine Kurvendarstellung eines Beispiels des Spektrums eines Signals einer einzigen Folge, mit der Zweikanalsignale stark unterschiedlicher Pegel verschachtelt wurden;
- Fig. 6A ist ein Blockschaltbild eines Ausführungsbeispiels einer Kodiervorrichtung, die mit einem Transformationskodierverfahren arbeitet;
- Fig. 6B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 6A entsprechenden Dekodiervorrichtung;
- Fig. 7A ist ein Blockschaltbild eines weiteren Ausführungsbeispiels der Kodiervorrichtung, die mit dem Transferkodierverfahren arbeitet;
- Fig. 7B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 7A entsprechenden Dekodiervorrichtung;
- Fig. 8A ist ein Blockschaltbild eines weiteren Ausführungsbeispiels der Kodiervorrichtung, die mit dem Transferkodierverfahren arbeitet;
- Fig. 8B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 8A entsprechenden Dekodiervorrichtung;
- Fig. 9A ist ein Blockschaltbild eines weiteren Ausführungsbeispiels der Kodiervorrichtung, die mit dem Transferkodierverfahren arbeitet;
- Fig. 9B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 9A entsprechenden Dekodiervorrichtung;
- Fig. 10A ist ein Blockschaltbild noch eines weiteren Ausführungsbeispiels der Kodiervorrichtung, die mit dem Transferkodierverfahren arbeitet;
- Fig. 10B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 10A entsprechenden Dekodiervorrichtung;
- Fig. 11 ist eine Kurvendarstellung der Ergebnisse subjektiver Bewertungstests der Signalqualität der Ausführungsbeispiele gemäß Fig. 3A und 3B;
- Fig. 12A ist ein Blockschaltbild einer modifizierten Form des Ausführungsbeispiels gemäß Fig. 2A, welches die Differenz in der Leistung zwischen Kanälen verringert;
- Fig. 12B ist ein Blockschaltbild der der Kodiervorrichtung in Fig. 12A entsprechenden Dekodiervorrichtung;
- Fig. 13 ist eine Tabelle, die Beispiele von Ausgleichsfaktoren zeigt;
- Fig. 14A und 14B sind Kurvendarstellungen des Verhältnisses zwischen Leistungsungleichgewicht zwischen Kanälen und einer eindimensionalen Signalabtastwertfolge nach dem Verschachteln; und
- Fig. 15 ist eine Kurvendarstellung der Ergebnisse von Rechnersimulationen an den Rauschabständen eingegebener und dekodierter akustischer Signale.
- Fig. 2A zeigt in Blockform den Grundaufbau der auf den Prinzipien der vorliegenden Erfindung beruhenden Kodiervorrichtung. Fig. 2B zeigt gleichfalls in Blockform den Grundaufbau der Dekodiervorrichtung, die einen von der Kodiervorrichtung ausgegebenen Code C dekodiert. Wie aus Fig. 2A hervorgeht, werden gemäß dem Grundsatz des Kodierschemas der vorliegenden Erfindung an M (wobei M eine ganze Zahl gleich oder größer als 2 ist) Anschlüsse 31&sub1; bis einschließlich 31M angelegte Eingabesignalabtastwerte von M Kanälen (d. h. mehrdimensional) von einem Verschachtelungsteil 30 in einer sequentiellen Reihenfolge zu einer Folge (d. h. eindimensional) von Signalabtastwerten verschachtelt. Ein Kodierteil 10 kodiert die eine Folge der Signalabtastwerte mittels eines Kodierverfahrens, welches die Korrelation zwischen den Signalen der M Kanäle nutzt, und gibt dann den Code C aus. Der Kodierteil 10 braucht nur das Kodierschema anzuwenden, welches die Korrelation zwischen Signalen ausnutzt, wie oben erwähnt. Folglich kann das Kodierschema des Kodierteils 10 ein Schema sein, welches Signale im Zeitbereich oder im Frequenzbereich oder einer Kombination derselben kodiert. Wichtig ist es, Signalabtastwerte von M Kanälen zu einer Folge von Signalabtastwerten zu verschachteln und durch Nutzung der Korrelation der Signale zwischen den M Kanälen zu kodieren. Ein mögliches, die Korrelation zwischen Signalen nutzendes Kodierverfahren ist eines, das mit LPG-Techniken arbeitet. Das LPC-Schema macht Signalvorhersagen in erster Linie auf der Grundlage der Korrelation zwischen Signalen und ist folglich auf das Kodierverfahren der vorliegenden Erfindung anwendbar. Als Kodierschema, welches die Korrelation zwischen Signalen im Zeitbereich nutzt, kann zum Beispiel ein ADPCM (Adaptive Differential Pulse Code Modulation) oder ein CELP (Code-Excited Linear Prediction coding) Verfahren angewandt werden.
- In Fig. 2B ist eine Vorrichtung zum Dekodieren des von der Kodiervorrichtung gemäß Fig. 2A kodierten Codes gezeigt. Die Dekodiervorrichtung dekodiert den ihr zugeleiteten Code C zu einer eindimensionalen Abtastwertfolge mit einem Verfahren, welches zu dem Kodieren im Kodierteil 10 gemäß Fig. 2A umgekehrt ist. Die so dekodierte Abtastwertfolge wird an einen Umkehrverschachtelungsteil 40 geliefert. Der Umkehrverschachtelungsteil 40 verteilt die Abtastwerte der einzigen Folge auf M Kanal Ausgangsanschlüsse 41&sub1; bis 41M mittels eines Verfahrens, welches zu dem zum Verschachteln im Verschachtelungsteil 30 gemäß Fig. 2A benutzten umgekehrt ist. Das hat zur Folge, daß an den Ausgangsanschlüssen 41&sub1; bis 41M Signalabtastwertfolgen der M Kanäle bereitgestellt werden.
- Als nächstes sollen konkrete Beispiele der auf den Grundsätzen der vorliegenden Erfindung beruhenden Kodier- und Dekodiervorrichtungen beschrieben werden, wie sie in Fig. 2A bzw. 2B dargestellt sind. Aus Gründen der Kürze werden die Kodier- und Dekodiervorrichtungen so beschrieben, als hätten sie zwei rechte und linke Stereoeingabekanäle, obwohl auch mehr als zwei Eingabekanäle benutzt werden können.
- Fig. 3A zeigt ein Ausführungsbeispiel, bei dem der Kodierteil 10 Transformationskodieren im Frequenzbereich durchführt. Zu dem Kodierteil 10 gehört ein Orthogonal-Transformationsteil 12, ein Spektralhüllkurven-Schätzteil 13, ein Spektrum-Normierteil 14 und ein Spektrumrestkoeffizienten- Kodierteil 15. Der Spektralhüllkurven-Schätzteil 13 besteht aus dem LPC-Analyseteil 13A, dem Quantisierteil 13B und dem LPC-Spektralhüllkurven-Rechenteil 13C, wie im Beispiel aus dem Stand der Technik gemäß Fig. 1A. Der Spektrumrestkoeffizienten-Kodierteil 15 besteht gleichfalls aus dem Restkoeffizientenhüllkurven-Schätzteil 15A, dem Restkoeffizientennormierteil 15B, dem gewichteten Vektorquantisierteil 15C und dem Gewichtungsfaktor-Rechenteil 15D, wie bei dem in Fig. 1 gezeigten Beispiel aus dem Stand der Technik. Mit anderen Worten, der Kodierteil 10 gemäß Fig. 3 hat genau die gleiche Konfiguration wie die herkömmliche, in Fig. 1A gezeigte Kodiervorrichtung.
- Das Ausführungsbeispiel gemäß Fig. 3A arbeitet mit Linkskanal und Rechtskanal Stereosignalen als akustische Mehrkanalsignale. Die Signalabtastwertfolgen des linken Kanals und die Signalabtastwertfolgen des rechten Kanals werden an Eingangsanschlüsse 31L bzw. 31R des Verschachtelungsteils 30 angelegt. Die Signalabtastwertfolgen des linken und rechten Kanals werden gemäß bestimmten Regeln zu einer eindimensionalen Zeitsequenz von Signalabtastwerten verschachtelt.
- Zum Beispiel werden die Signalabtastwertfolgen L&sub1;, L&sub2;, L&sub3; ... des rechten Kanals und die Signalabtastwertfolgen R&sub1;, R&sub2;, R&sub3; ... des rechten Kanals, die auf Reihen A bzw. B in Fig. 4 dargestellt sind, zu einer solchen Folge von Signalen verschachtelt, wie sie in der Reihe C in Fig. 3 dargestellt sind, in der Abtastwerte von Signalen des linken und rechten Kanals abwechselnd in zeitlicher Folge verschachtelt sind. Auf diese Weise wird das Stereosignal als eindimensionales Signal in einem so üblichen Format synthetisiert, wie es zur Datenverschachtelung in einem elektronischen Rechner angewandt wird.
- Bei der vorliegenden Erfindung wird diese künstlich synthetisierte eindimensionale Signalabtastwertfolge intakt wie folgt kodiert. Das kann nach dem gleichen Schema wie beim herkömmlichen Kodierverfahren geschehen. In diesem Fall ist es allerdings möglich, das Transformationskodierverfahren, das LPG-Verfahren oder irgendwelche anderen Kodierverfahren anzuwenden, sofern sie eingegebene Abtastwerte in Frequenzbereichskoeffizienten oder LPC-Koeffizienten (die LPC- Koeffizienten sind auch Parameter, welche die Spektralhüllkurve wiedergeben) für jeden Rahmen transformieren und eine Vektorkodierung an ihnen vornehmen, um die Verzerrung auf ein Minimum einzuschränken.
- Wie im Stand der Technik wird auch bei dem in Fig. 3A gezeigten Ausführungsbeispiel vom Orthogonal-Transformationsteil 12 wiederholt eine aneinandergrenzende Folge von 2N Abtastwerten aus der eingegebenen Signalabtastwertfolge in N-Abtastwertintervallen extrahiert und Frequenzbereichskoeffizienten von N Abtastwerten aus jeder Folge von 2N Abtastwerten beispielsweise mittels MDCT abgeleitet. Die so erhaltenen Frequenzbereichskoeffizienten werden quantisiert. Auf der anderen Seite wird vom LPC-Analyseteil 13A des Spektralhüllkurven-Schätzteils 13 ähnlich alle N Abtastwerte eine 2N-Abtastwertfolge aus dem eingegebenen digitalen akustischen Signal extrahiert und wie in dem in Fig. 1A gezeigten Beispiel aus dem Stand der Technik, die prädiktiven Koeffizienten Pter Ordnung α&sub0; ... αP aus den extrahierten Abtastwerten berechnet. Diese prädiktiven Koeffizienten α&sub0; ... αP werden an den Quantisierteil 13B geliefert, wo sie beispielsweise in LSP- Parameter oder PARCOR Koeffizienten transformiert und dann quantisiert werden, um den Index In&sub1; zu erhalten, der die Spektralhüllkurve der prädiktiven Koeffizienten darstellt. Ferner berechnet der LPC-Spektralhüllkurven-Rechenteil 13C die Spektralhüllkurve aus den quantisierten prädiktiven Koeffizienten und gibt sie an den Spektrum-Normierteil 14 und den Gewichtungsfaktor-Rechenteil 15D weiter.
- Im Spektrum-Normierteil 14 werden die Spektrumabtastwerte vom Orthogonal-Transformationsteil 12 je durch den entsprechenden Abtastwert der Spektralhüllkurve vom Spektralhüllkurven-Schätzteil 13 dividiert. Hiermit werden Spektrumrestkoeffizienten erhalten. Der Restkoeffizientenhüllkurven- Schätzteil 15A schätzt ferner die Spektralhüllkurve der Spektrumrestkoeffizienten und liefert sie dem Restkoeffizientennormierteil 15B sowie dem Gewichtungsfaktor-Rechenteil 15D. Zur gleichen Zeit berechnet der Restkoeffizientenhüllkurven-Schätzteil 15A den Vektorquantisierungsindex In&sub2; der Spektralhüllkurve und gibt ihn aus. Im Restkoeffizientennormierteil 15B werden die vom Spektrum- Normierteil 14 eingegebenen Spektrumrestkoeffizienten durch die Spektrumrestkoeffizientenhüllkurve dividiert, um spektrale Feinstrukturkoeffizienten zu schaffen, die in den gewichteten Vektorquantisierteil 15C eingegeben werden. Im Gewichtungsfaktor-Rechenteil 15D wird die spektrale Restkoeffizientenhüllkurve vom Restkoeffizientenhüllkurven-Schätzteil 5A und die LPC-Spektralhüllkurve vom Spektralhüllkurven-Schätzteil 13 für jeden entsprechenden Spektrumabtastwert multipliziert, um eine perzeptuelle Korrektur vorzunehmen. Als Ergebnis dessen wird der Gewichtungsfaktor W = W&sub1; ... WN erhalten und dem gewichteten Vektorquantisierteil 15C zugeleitet. Es ist auch möglich, als Gewichtungsfaktor W einen Wert zu benutzen, der durch Multiplizieren des obigen multiplizierten Wertes mit einem psychoakustischen oder perzeptuellen Koeffizienten auf der Basis psychoakustischer Modelle erhalten wird. Der gewichtete Vektorquantisierteil 15C benutzt den Gewichtungsfaktor W, um eine gewichtete Vektorquantisierung der Feinstrukturkoeffizienten vom Restkoeffizientennormierteil 15B durchzuführen und gibt den Index In&sub3; aus. Der so berechnete Satz der Indizes In1, In2 und In3 wird als Ergebnis des Kodierens eines Rahmens des akustischen Eingabesignals ausgegeben.
- Wie oben beschrieben, werden bei diesem Ausführungsbeispiel die Signale des linken und rechten Kanals in den Kodierteil 10 eingegeben, während sie für jeden Abtastwert abwechselnd verschachtelt werden, und deshalb bringt die LPC-Analyse oder MDCT eines derartig verschachtelten Eingabesignals eine Wirkung hervor, die sich von der gewöhnlicher Einkanal-Signalverarbeitung unterscheidet. Mit anderen Worten, die lineare Vorhersage (Prädiktion) im LPC-Analyseteil 13A dieses Ausführungsbeispiels benutzt vergangene oder vorherige Abtastwerte rechter und linker Kanäle, um einen Abtastwert des rechten Kanals beispielsweise vorherzusagen. Folglich ist die erhaltene Spektralhüllkurve, wenn die Signale des linken und rechten Kanals im wesentlichen den gleichen Pegel haben, die gleiche wie im Fall eines eindimensionalen akustischen Signals, wie in Fig. 5A gezeigt. Da diese LPC-Analyse auch die Korrelation zwischen den Kanälen benutzt, ist der Prädiktionsgewinn (ursprüngliche Signalenergie/Spektrumrestsignalenergie) größer als im Fall des eindimensionalen Signals. Anders ausgedrückt, der Effekt der Beseitigung von Verzerrung mittels der Transformationskodierung ist groß.
- Wenn sich die Signale des linken und rechten Kanals im Pegel stark unterscheiden, wird die Spektralhüllkurve häufig fast symmetrisch zur Mittenfrequenz fc des gesamten Bandes, wie in Fig. 5B dargestellt. Hierbei ist die Komponente, die oberhalb der Mittenfrequenz fc liegt, der Differenz zwischen den Signalen des linken und rechten Kanals zuzuschreiben, während die Komponente unterhalb der Mittenfrequenz fc der Summe der beiden Signale zuzuschreiben ist. Wenn sich die Signalpegel des linken und rechten Kanals stark unterscheiden, ist auch ihre Korrelation gering. Auch in einem solchen Fall kommt es zu einem Prädiktionsgewinn entsprechend der Größe der Korrelation zwischen den Signalen des linken und rechten Kanals; die vorliegende Erfindung erzeugt auch in dieser Hinsicht einen Effekt. Übrigens ist es mathematisch bekannt, daß bei einem Signal der Größe Null entweder aus dem linken oder dem rechten Kanal das Spektrum des eindimensionalen Signals, welches aus der oben beschriebenen Verschachtelungsverarbeitung hervorgeht, eine solche Form annimmt, daß die niederfrequenten und hochfrequenten Komponenten gegenüber der Mittenfrequenz symmetrisch sind fc = fs/4, wobei fs die Abtastfrequenz ist.
- In einem solchen Fall wird, wie in Fig. 5B gezeigt, die Summe der Signale des linken und rechten Kanals, das heißt der Ton lediglich einer durchschnittlichen Version beider Signale wiedergegeben, wenn nicht die notwendige Information gesandt wird, nachdem die die Mittenfrequenz fc übersteigende Komponente auf Null gedrängt wurde. Bei der adaptiven Bitzuteilung zu jedem Kanal gemäß der Verkehrsdichte beispielsweise oder im Fall der Verringerung einer festen Anzahl Bits oder einer Menge Informationen für jeden Kanal, um die Anzahl Kanäle zu vergrößern, damit in bestehenden Kommunikationseinrichtungen ein erhöhtes Verkehrsaufkommen gehandhabt werden kann, werden die Frequenzbereichskoeffizienten derjenigen Frequenzkomponente der orthogonal transformierten Ausgabe des Orthogonal-Transformationsteils 12, die über der Mittenfrequenz fc liegt, entfernt. Dann werden im Spektrum-Normierteil 14 nur die Frequenzbereichskoeffizienten der niederfrequenten Komponente dividiert (abgeflacht), und die dividierten Ausgaben werden durch Quantisieren kodiert. Die Koeffizienten der hochfrequenten Komponente können auch nach der Division im Spektrum- Normierteil 14 entfernt werden. Wenn die Informationsmenge gering ist, wird gemäß diesem Verfahren kein Stereosignal erzeugt; aber die Verzerrung kann verhältnismäßig klein gemacht werden.
- Die logarithmische Spektrumkurve, die durch abwechselndes Verschachteln von Zweikanalsignalen für jeden Abtastwert und die anschließende Transformation in Frequenzbereichskoeffizienten erzeugt wird, enthält in steigender Reihung der Frequenz: einen Bereich (I) durch die Summe LL + RL der niederfrequenten Komponenten der Signale L und R des linken und rechten Kanals, einen Bereich (II) durch die Summe LH + RH der hochfrequenten Komponenten der Signale L und R des linken und rechten Kanals, einen Bereich (III) durch die Differenz LH - RH zwischen den hochfrequenten Komponenten der Signale L und R des linken und rechten Kanals und einen Bereich (IV), der auf der Differenz LL - RL zwischen den niederfrequenten Komponenten der Signale L und R des linken und rechten Kanals beruht. Die gesamten Bandkomponenten der Signale des linken und rechten Kanals können durch Vektorquantisierung der Signale aller Bereiche (I) bis (IV) und Übermitteln der quantisierten Codes gesandt werden. Es ist aber auch möglich, den Vektorquantisierungsindex In&sub3; nur für die erforderliche Bandkomponente zusammen mit dem prädiktiven Koeffizientenquantisierungsindex In&sub1; und dem geschätzten Spektralquantisierungsindex In&sub2; zu senden, wie nachfolgend beschrieben.
- (A) Jeweilige vektorquantisierte Codes der vier Frequenzbereiche (I) bis (IV) senden. Da die gesamten Bandsignale der beiden Kanäle in diesem Fall an der Dekodierseite dekodiert werden, kann ein Breitbandstereosignal dekodiert werden.
- (B) Die vektorquantisierten Codes nur der Bereiche (I), (II) und (IV) mit Ausnahme des Bereichs (III) senden. In diesem Fall ist die niederfrequente Komponente der dekodierten Ausgabe stereo, aber die hochfrequente Komponente ist nur die Summenkomponente der Signale des linken und rechten Kanals.
- (C) Die vektorquantisierten Codes der Bereiche (I) und (IV) oder (II) mit Ausnahme der Bereiche (III) und (II) oder (IV) senden. Im zuerst genannten Fall (Senden der Bereiche (I) und (IV)) ist die dekodierte Ausgabe stereo, aber die hochfrequente Komponente fällt ab. Im letzteren Fall (Senden der Bereiche (I) und (II)) ist das dekodierte Ausgabesignal ein Breitbandsignal, aber vollständig monophon.
- (D) Den vektorquantisierten Code nur des Bereichs (I) mit Ausnahme der Bereiche (II), (III) und (IV) senden. In diesem Fall ist die dekodierte Ausgabe ein monophones Signal, welches nur aus der niederfrequenten Komponente zusammengesetzt ist.
- Die Menge an Informationen, die zum Senden des kodierten Signals erforderlich ist, nimmt in alphabetischer Reihenfolge der oben genannten Fälle (A) bis (D) ab. Wenn es beispielsweise wenig Verkehr gibt, kann eine große Menge an Informationen gesendet werden und folglich werden die vektorquantisierten Codes aller Bereiche gesendet (A). Ist das Verkehrsvolumen groß, wird der vektorquantisierte Code des ausgewählten Bereichs oder der ausgewählten Bereiche (I) bis (IV) entsprechend gesendet, wie oben in (B) bis (D) erläutert. Mit solcher Vektorquantisierung der Frequenzbereichskoeffizienten der Zweikanalstereosignale in den vier Bereichen kann unabhängig von individueller Verarbeitung zum Kodieren bestimmt werden, welches Band oder welche Bänder gesendet werden sollen, und ob die kodierten Ausgaben stereo oder monophon gesendet werden sollen, in Übereinstimmung mit dem tatsächlichen Verkehrsvolumen. Natürlich kann der Bereich, dessen Code gesendet wird, unabhängig vom Kanalverkehr bestimmt werden, er kann aber auch allein in Abhängigkeit von der Qualität des akustischen Signals, die am Empfangsende erforderlich ist (Dekodierseite), ausgewählt werden. Als Alternative können wahlweise nach Bedarf die am Empfangsende empfangenen Codes der vier Bereiche benutzt werden.
- Vorstehend wurde ein Ausführungsbeispiel der Kodiervorrichtung unter dem Gesichtspunkt der Informationskompression beschrieben. Wenn man den Koeffizienten der hochfrequenten Komponente in der Dekodiervorrichtung steuert, kann der stereophone Effekt eingestellt werden. Die Polaritätsumkehr der Koeffizienten im Frequenzbereich oberhalb der Mittenfrequenz fc bedeutet zum Beispiel Polaritätsumkehr der Differenzkomponente des linken und rechten Signals. In diesem Fall ist das linke und rechte Signal im wiedergegebenen Ton umgekehrt. Diese Polaritätsumkehrsteuerung kann auf die Koeffizienten entweder vor oder nach dem Abflachen im Dividierteil angewandt werden. Das erlaubt es, den Lokalisierungseffekt einer Tonabbildung zu steuern. Diese Steuerung kann auch an den Koeffizienten entweder vor oder nach dem Abflachen vorgenommen werden.
- In Fig. 3B ist in Blockform die Dekodiervorrichtung gemäß der vorliegenden Erfindung gezeigt, mit der die Codebitkette der Indizes In&sub1;, In&sub2; und In&sub3;, die, wie vorstehend unter Hinweis auf Fig. 3A beschrieben, kodiert wurden, dekodiert wird. Diejenigen Teile, die denen in Fig. 1B entsprechen, sind mit den gleichen Bezugszeichen gekennzeichnet. Wie im Fall der herkömmlichen Dekodiervorrichtung gemäß Fig. 1B wird im Vektorquantisier-Dekodierteil 21A der Index In&sub3; dekodiert, um Feinstrukturkoeffizienten des Spektrums an N Punkten zu dekodieren. Andererseits werden in den Dekodierteilen 22 und 21B die LPC-Spektralhüllkurve und die Spektrumrestkoeffizienten-Hüllkurve aus den Indizes In&sub1; bzw. In&sub2; wiederhergestellt. Der Restkoeffizienten-Entnormierteil 21C bewirkt eine Multiplikation (Ent-Abflachung) der Spektrumrestkoeffizientenhüllkurve und der Spektrumfeinstrukturkoeffizienten für jeden entsprechenden Spektrumabtastwert, womit die Spektrumrestkoeffizienten wieder hergestellt werden. Der Spektrumentnormierteil 25 bewirkt eine Multiplikation (Entabflachung) der Spektrumrestkoeffizienten mittels der wiederhergestellten LPC-Spektralhüllkurve, um die Spektrumabtastwerte des akustischen Signals wiederherzustellen. Die erhaltenen wiederhergestellten Spektrumabtastwerte werden in Zeitbereichssignalabtastwerte an 2N Punkten mittels Orthogonal-Umkehrtransformation im Orthogonal-Umkehrtransformationsteil 26 transformiert. Diese Abtastwerte werden mit N Abtastwerten vorhergehender und nachfolgender Rahmen überlappt. Gemäß der vorliegenden Erfindung führt der Umkehrverschachtelungsteil 40 eine Verschachtelung umgekehrt zu der im Verschachtelungsteil 30 am Kodierende durch. In diesem Beispiel werden die dekodierten Abtastwerte abwechselnd an Ausgabeanschlüsse 41L und 41R abgegeben, um dekodierte Signale des linken und rechten Kanals zu erhalten.
- Auch bei diesem Dekodierverfahren können die Frequenzkomponenten der dekodierten, transformierten Koeffizienten oberhalb der Mittenfrequenz fc entweder vor oder nach der Entabflachung im Spektrumentnormierteil 25 entfernt werden, so daß an den Anschlüssen 41L und 41R gemittelte Signale der Signale des linken und rechten Kanals bereitgestellt werden. Gemäß einer Alternative können die Werte der hochfrequenten Komponenten der Koeffizienten entweder vor oder nach der Entabflachung gesteuert werden.
- Wie in Fig. 6A und 6B gezeigt, können aus den Ausführungsbeispielen gemäß Fig. 3A und 3B der Restkoeffizientenhüllkurven-Schätzteil 15A, der Restkoeffizientennormierteil 15B, der Dekodierteil 21B und der Restkoeffizientenentnormierteil 21C weggelassen werden.
- Die Kodiervorrichtung gemäß Fig. 6A führt auch eine Transferkodierung durch, wie das bei dem Ausführungsbeispiel gemäß Fig. 3A der Fall ist, aber sie normiert die Spektrumrestkoeffizienten nicht im Spektrumrestkoeffizienten-Kodierteil 15. Statt dessen wird der Spektrumrest SR vom Spektrum-Normierteil 14 in einem Vektorquantisierteil 15' intakt vektorquantisiert und dann der Index In&sub2; ausgegeben. Bei diesem Ausführungsbeispiel wird auch die Spektralhüllkurve der Abtastwertfolge im Spektralhüllkurven-Schätzteil 13 geschätzt, wie beim Ausführungsbeispiel gemäß Fig. 3A. Insgesamt kann die Spektralhüllkurve der eingegebenen Signalabtastwertfolge mit einem beliebigen der drei nachfolgend beschriebenen Verfahren erhalten werden.
- (a) Die LPC-Koeffizienten α der eingegebenen Signalabtastwertfolge werden Fourier-transformiert, um die Spektralhüllkurve zu erhalten.
- (b) Die Spektrumabtastwerte, in die die eingegebene Signalabtastwertfolge transformiert wurde, werden in mehrere Bänder unterteilt, und der Skalierfaktor in jedem Band wird als Spektralhüllkurve erhalten.
- (c) Die LPC-Koeffizienten α einer Zeitbereichsabtastwertfolge, erhalten durch Umkehrtransformation absoluter Werte von Spektrumabtastwerten, welche mittels Transformation der eingegebenen Signalabtastwertfolge erhalten wurden, werden berechnet, und die LPC-Koeffizienten werden Fourier-transformiert, um die Spektralhüllkurve zu erhalten.
- Die Verfahren (a) und (c) beruhen auf den nachfolgend beschriebenen Tatsachen. Die LPC- Koeffizienten α geben das Impulsverhalten (oder den Frequenzgang) eines Umkehrfilters wieder, der das Abflachen des Frequenzganges der eingegebenen Signalabtastwertfolge bewirkt. Folglich entspricht die Spektralhüllkurve der LPC-Koeffizienten α der Spektralhüllkurve der eingegebenen Signalabtastwertfolge. Genauer gesagt, die aus der Fourier-Transformation der LPC-Koeffizienten α resultierende Spektralamplitude ist die Umkehr der Spektralhüllkurve der eingegebenen Signalabtastwertfolge.
- Während für das Ausführungsbeispiel gemäß Fig. 3A beschrieben wurde, wie die Spektralhüllkurve mittels LPC-Analyse berechnet wird, berechnet das Ausführungsbeispiel gemäß Fig. 6A die Spektralhüllkurve im Spektralhüllkurven-Rechenteil 13D unter Anwendung des Verfahrens (b). Die errechnete Spektralhüllkurve wird im Quantisierteil 13B quantisiert, der dann den entsprechenden Quantisierindex In&sub1; ausgibt. Die quantisierte Spektralhüllkurve wird gleichzeitig dem Spektrum- Normierteil 14 zur Verfügung gestellt, um die Frequenzbereichskoeffizienten vom Orthogonal- Transformationsteil 12 zu normieren. Natürlich kann der Spektralhüllkurven-Schätzteil 13 in Fig. 6A den gleichen Aufbau haben wie im Ausführungsbeispiel gemäß Fig. 3A.
- In der in Fig. 6B gezeigten Dekodiervorrichtung werden die Indizes In&sub1; und In&sub2; in einem Dekodierteil 22 und einem Vektordekodierteil 21 dekodiert, um die Spektralhüllkurve und den Spektrumrest zu erhalten, die miteinander im Spektrumentnormierteil 25 multipliziert werden, um Spektrumabtastwerte zu erhalten. Diese Spektrumabtastwerte werden vom Orthogonal-Umkehrtransformationsteil 26 in eine eindimensionale Zeitbereichsabtastwertfolge transformiert, die einem Umkehrverschachtelungsteil 40 zugeleitet wird. Der Umkehrverschachtelungsteil 40 verteilt die eindimensionale Abtastwertfolge auf den linken und rechten Kanal entsprechend einem Verfahren, das gegenüber dem des Verschachtelungsteils 30 in Fig. 6A umgekehrt ist. Als Ergebnis werden Signale des linken und rechten Kanals an den Anschlüssen 41L bzw. 41R erhalten.
- In einem in Fig. 7A gezeigten Ausführungsbeispiel werden die vom Orthogonal-Transformationsteil 12 aus der eindimensionalen Abtastwertfolge transformierten Spektrumabtastwerte nicht zu Spektrumresten normiert. Statt dessen werden die Spektrumabtastwerte einer Quantisierung mit adaptiver Bitzuordnung in einem adaptiven Bitzuordnungs-Quantisierteil 19 auf der Basis der im Spektralhüllkurven-Schätzteil 13 erhaltenen Spektralhüllkurve unterzogen. Der Spektralhüllkurven- Schätzteil 13 kann so ausgelegt sein, daß er die Spektralhüllkurve mittels des vorstehend erwähnten Verfahrens (b) durch Dividieren jedes vom Orthogonal-Transformationsteil 12 gemäß durchgezogener Linie gelieferten Frequenzbereichskoeffizienten in eine Vielzahl von Bändern schätzt. Als Alternative kann der Spektralhüllkurven-Schätzteil 13 so angepaßt sein, daß er die Spektralhüllkurve aus der eingegebenen Abtastwertfolge gemäß dem vorstehend beschriebenen Verfahren (a) oder (b) schätzt, wie mittels der gestrichelten Linie gezeigt.
- Die entsprechende Dekodiervorrichtung weist den Umkehrverschachtelungsteil 40 und den Dekodierteil 20 auf, wie Fig. 7B zeigt. Der Dekodierteil 20 besteht aus dem Orthogonal-Umkehrtransformationsteil 26 und einem adaptiven Bitzuordnungs-Dekodierteil 29. Der adaptive Bitzuordnungs-Dekodierteil 29 benutzt den Bitzuordnungsindex In&sub1; und den Quantisierindex In&sub2; und den Quantisierindex In&sub2; von der in Fig. 7A gezeigten Kodiervorrichtung, um eine Dekodierung mit adaptiver Bitzuordnung durchzuführen, damit die Spektrumabtastwerte dekodiert werden, die dem Orthogonal-Umkehrtransformationsteil 26 zugeleitet werden. Im Orthogonal-Umkehrtransformationsteil 26 werden die Spektrumabtastwerte durch eine Bearbeitung der orthogonalen Umkehrtransformation in die Zeitbereichsabtastwertfolge transformiert. Auch bei diesem Ausführungsbeispiel verarbeitet der Umkehrverschachtelungsteil 40 die Abtastwertfolge in umgekehrter Reihenfolge gegenüber der Verschachtelung der Spektrumabtastwerte im Verschachtelungsteil 30 der Kodiervorrichtung. Folglich werden Signalfolgen für den linken und rechten Kanal an den Anschlüssen 41L bzw. 41R bereitgestellt.
- Bei dem in Fig. 7A gezeigten Ausführungsbeispiel der Kodiervorrichtung kann der adaptive Bitzuordnungs-Quantisierteil 19 durch einen gewichteten Vektorquantisierteil ersetzt werden. Dann führt der gewichtete Vektorquantisierteil eine Vektorquantisierung der Frequenzbereichskoeffizienten unter Benutzung der vom Spektralhüllkurven-Schätzteil 13 bereitgestellten Spektralhüllkurve als Gewichtungsfaktoren aus und gibt den Quantisierindex In&sub2; aus. In der Dekodiervorrichtung gemäß Fig. 7B ist der adaptive Bitzuordnungs-Dekodierteil 29 durch einen gewichteten Vektorquantisierteil ersetzt, der eine gewichtete Vektorquantisierung der Spektralhüllkurve vom Spektralhüllkurven-Rechenteil 24 durchführt.
- Ein in Fig. 8A gezeigtes Ausführungsbeispiel arbeitet gleichfalls nach dem Transformationskodierschema. Allerdings weist bei diesem Ausführungsbeispiel der Kodierteil 10 der Spektralhüllkurven- Schätzteil 13, ein Umkehrfilter 16, den Orthogonal-Transformationsteil 12 und den adaptiven Bitzuordnungs-Quantisierteil 17 auf. Der Spektralhüllkurven-Schätzteil 13 ist aus dem LPC-Analyseteil 13A, dem Quantisierteil 13B und dem Spektralhüllkurven-Rechenteil 13C zusammengesetzt, wie bei dem Ausführungsbeispiel gemäß Fig. 3A.
- Die eindimensionale Abtastwertfolge vom Verschachtelungsteil 30 wird der LPC-Analyse im LPC- Analyseteil 13A unterzogen, um die prädiktiven Koeffizienten α zu berechnen. Diese prädiktiven Koeffizienten α werden im Quantisierteil 13B quantisiert und danach der Index In&sub3; ausgegeben, der die Quantisierung wiedergibt. Gleichzeitig werden die quantisierten prädiktiven Koeffizienten αq dem Spektralhüllkurven-Rechenteil 13C geliefert, in welchem die Spektralhüllkurve berechnet wird. Andererseits werden die quantisierten prädiktiven Koeffizienten αq als Filterkoeffizienten dem Umkehrfilter 16 geliefert. Im Umkehrfilter 16 wird die angelieferte eindimensionale Abtastwertzeitfolge im Zeitbereich aufgehellt, um ihr Spektrum abzuflachen, und dann wird eine Zeitfolge von Restabtastwerten ausgegeben. Im Orthogonal-Transformationsteil 12 wird die Restabtastwertfolge in Zeitbereichsrestkoeffizienten transformiert und dann dem adaptiven Bitzuordnungs-Quantisierteil 17 zugeleitet. Der adaptive Bitzuordnungs-Quantisierteil 17 ordnet Bits adaptiv zu und quantisiert sie in Übereinstimmung mit der vom Spektralhüllkurven-Rechenteil 13C zur Verfügung gestellten Spektralhüllkurve und gibt den entsprechenden Index In&sub2; aus.
- Fig. 8B zeigt eine Dekodiervorrichtung, die der Kodiervorrichtung gemäß Fig. 8A entspricht. Der Dekodierteil 20 besteht in diesem Ausführungsbeispiel aus einem Dekodierteil 23, einem Spektralhüllkurven-Rechenteil 24, einem adaptiven Bitzuordnungs-Dekodierteil 27, dem orthogonalen Umkehrtransformationsteil 26 und einem LPC-Synthesefilter 28. Der Dekodierteil 23 dekodiert den Index In&sub1; von der in Fig. 8A gezeigten Kodiervorrichtung, um die quantisierten prädiktiven Koeffizienten αq zu erhalten, die dem Spektralhüllkurven-Rechenteil 24 übermittelt werden, um die Spektralhüllkurve zu berechnen. Der adaptive Bitzuordnungs-Dekodierteil 27 führt auf der Grundlage der berechneten Spektralhüllkurve eine adaptive Bitzuordnung durch und dekodiert den Index In&sub2;, womit quantisierte Spektrumabtastwerte erhalten werden. Die so erhaltenen quantisierten Spektrumabtastwerte werden vom Orthogonal-Umkehrtransformationsteil 26 in eine eindimensionale Restabtastwertfolge im Zeitbereich transformiert, die dann dem LPC-Synthesefilter 28 zur Verfügung gestellt wird. Das LPC-Synthesefilter 28 erhält die dekodierten prädiktiven Quantisationskoeffizienten αq als Filterkoeffizienten vom Dekodierteil 23 und benutzt die eindimensionale Restkoeffizientenabtastwertfolge als ein Erregerquellensignal zum Synthetisieren einer Signalabtastwertfolge. Die so synthetisierte Signalabtastwertfolge wird vom Umkehrverschachtelungsteil 40 in Abtastwertfolgen des rechten und linken Kanals verschachtelt, die dann an die Anschlüsse 41L bzw. 41R angelegt werden.
- Fig. 9A zeigt den Grundaufbau einer Kodiervorrichtung, in der der Kodierteil 10 das ADPCM Schema verwendet, um eine Kodierung durch Ausnutzen der Signalkorrelation im Zeitbereich durchzuführen. Der Kodierteil 10 besteht aus einem Subtrahierer 111, einem adaptiven Quantisierteil 112, einem Dekodierteil 113, einem adaptiven Prädiktionsteil 114 sowie einem Addierer 115. Diese Signalabtastwertfolgen des linken und rechten Kanals werden an die Eingabeanschlüsse 31L und 31R angelegt und, wie auch im Fall von Fig. 2A, in einer vorherbestimmten sequentiellen Reihenfolge im Verschachtelungsteil 30 verschachtelt, von dem eine eindimensionale Abtastwertfolge ... .
- Die eindimensionale Abtastwertfolge vom Verschachtelungsteil 30 wird für jeden Abtastwert dem Subtrahierer 111 des Kodierteils 10 zugeleitet. Ein Abtastwert Se, der vom adaptiven Prädiktionsteil 114 anhand des vorhergehenden Abtastwertes vorhergesagt wurde, wird vom gegenwärtigen Abtastwert abgezogen, und das Subtraktionsergebnis wird vom Subtrahierer 111 als ein Prädiktionsfehler eS ausgegeben. Der Prädiktionsfehler eS wird dem adaptiven Quantisierteil 112 zugeleitet, wo er in einem adaptiv bestimmten Quantisierschritt quantisiert und aus dem ein Index In des quantisierten Codes als kodiertes Ergebnis ausgegeben wird. Der Index In wird vom Dekodierteil 113 zu einem quantisierten Prädiktionsfehlerwert eq dekodiert, der dem Addierer 115 zugeleitet wird. Der Addierer 115 addiert den quantisierten Prädiktionsfehlerwert eq zum Abtastwert Se, den der adaptive Prädiktionsteil 114 zu dem vorhergehenden Abtastwert vorhergesagt hatte, und erhält dadurch den laufenden quantisierten Abtastwert Sq, der dem adaptiven Prädiktionsteil 114 zur Verfügung gestellt wird. Der adaptive Prädiktionsteil 114 generiert aus dem laufenden quantisierten Abtastwert Sq einen vorhergesagten Abtastwert für den nächsten Eingabeabtastwert und liefert diesen an den Subtrahierer 111.
- Im Kodierteil 10, der das ADPCM Schema anwendet, wird vom adaptiven Prädiktionsteil 114 der nächste Eingabeabtastwert durch Ausnutzen der Korrelation zwischen einander benachbarten Abtastwerten adaptiv vorhergesagt und nur der Prädiktionsfehler eS kodiert. Das bedeutet eine Nutzung der Korrelation zwischen einander benachbarten Abtastwerten des linken und rechten Kanals, denn die eingegebene Abtastwertfolge ist aus abwechselnd verschachtelten Abtastwerten des linken und rechten Kanals zusammengesetzt.
- Fig. 9B zeigt eine Dekodiervorrichtung zur Verwendung mit der in Fig. 9A gezeigten Kodiervorrichtung. Wie aus Fig. 9B hervorgeht, besteht die Dekodiervorrichtung aus einem Dekodierteil 20 und einem Umkehrverschachtelungsteil 40, wie im Fall von Fig. 2B. Der Dekodierteil 20 besteht aus einem Dekodierteil 211, einem Addierer 212 und einem adaptiven Prädiktionsteil 213. Der Index In von der Kodiervorrichtung wird im Dekodierteil 211 zu dem quantisierten Fehler eq dekodiert, der in den Addierer 212 eingegeben wird. Der Addierer 212 addiert den vorherigen vorhergesagten Abtastwert Se vom adaptiven Prädiktionsteil 213 und den quantisierten Prädiktionsfehler eq, um den quantisierten Abtastwert Sq zu erhalten. Der quantisierte Abtastwert Sq wird dem Umkehrverschachtelungsteil 40 ebenso wie dem adaptiven Prädiktionsteil 213 bereitgestellt, in welchem er zur adaptiven Prädiktion des nächsten Abtastwertes benutzt wird. Wie im Fall von Fig. 2B bearbeitet der Umkehrverschachtelungsteil 40 die Abtastwertfolge in umgekehrter Reihenfolge im Vergleich zum Verschachtelungsteil 30 gemäß Fig. 3A, um die Abtastwerte auf die Folgen des linken und rechten Kanals abwechselnd für jeden Abtastwert zu verteilen und stellt die Abtastwertfolgen des linken und rechten Kanals an den Ausgabeanschlüssen 41L und 41R zur Verfügung.
- Als weiteres Beispiel des Kodierschemas, welches die Signalkorrelation im Zeitbereich ausnutzt, ist in Fig. 10 ein Ausführungsbeispiel dargestellt, bei dem im Kodierteil 10 gemäß Fig. 2A ein beispielsweise im US Patent 5 195 137 offenbarter CELP Sprachkodierer vorgesehen ist. Die Stereosignalabtastfolgen des linken und rechten Kanals werden an die Eingangsanschlüsse 31L bzw. 31R und von dort an den Verschachtelungsteil 30 angelegt, wo sie wie vorstehend unter Hinweis auf Fig. 4 beschrieben verschachtelt werden und von dem eine eindimensionale Abtastwertfolge Ss an einen LPC-Analyseteil 121 des Kodierteils 10 weitergegeben wird. Die Abtastwertfolge Ss wird für jeden Rahmen einer festen Länge LPC-analysiert, um die LPC-Koeffizienten a zu berechnen, die einem LPC-Synthesefilter 122 als Filterkoeffizienten zur Verfügung gestellt werden. In einem adaptiven Codebuch 123 ist ein vorherbestimmter Anregungsvektor E gespeichert, der den gesamten, an das Synthesefilter 122 gegebenen Rahmen abdeckt. Aus dem Anregungsvektor E wird ein Segment einer Länge S wiederholt extrahiert, und die jeweiligen Segmente werden verbunden, bis die Gesamtlänge der Rahmenlänge T gleicht. Hiermit wird vom adaptiven Codebuch 123 ein adaptiver Codevektor (auch als periodischer Komponentenvektor oder Tonhöhenkomponentenvektor bezeichnet), der der periodischen Komponente des akustischen Signals entspricht, erzeugt und ausgegeben. Durch Ändern der Segmentlänge S ist es möglich, einen adaptiven Codevektor auszugeben, der einer anderen periodischen Komponente entspricht. In einem Zufallscodebuch 125 ist eine Vielzahl von Zufallscodevektoren der Rahmenlänge 1 aufgezeichnet. Wenn der Index In bezeichnet wird, wird der entsprechende zum Zufallscodevektor aus dem Zufallscodebuch 125 gelesen. Sowohl der adaptive Codevektor als auch der Zufallscodevektor aus dem adaptiven Codebuch 123 und dem Zufallscodebuch 125 wird an einen Multiplizierer 124 bzw. 125 weitergegeben, wo eine Multiplikation mit Gewichtungsfaktoren (Verstärkungen) g&sub0; und g&sub1; aus einem Verzerrungsberechnungs/Codebuch- Suchteil 131 vorgenommen wird. Die multiplizierten Ausgaben werden von einem Addierer 127 addiert und die addierte Ausgabe als Anregungsvektor E dem Synthesefilter 122 zugeleitet, der ein synthetisches Sprachsignal erzeugt.
- In erster Linie wird der Gewichtungsfaktor gi auf Null gesetzt, und die Differenz zwischen einem synthetischen akustischen Signal (Vektor), ausgegeben vom Synthesefilter 122, der durch den aus dem Segment der gewählten Länge S erzeugten adaptiven Codevektor erregt wurde, und der eingegebenen Abtastwertfolge (Vektor) Ss wird von einem Subtrahierer 128 berechnet. Der so erhaltene Fehlervektor wird, wenn nötig, in einem perzeptuellen Gewichtungsteil 129 perzeptuell gewichtet und dann an den Verzerrungsberechnungs/Codebuch-Suchteil 131 weitergegeben, der die Quadratsumme von Elementen (den Zwischensymbolabstand) als Verzerrung des synthetischen Signals berechnet und hält. Der Verzerrungsberechnungs/Codebuch-Suchteil 131 wiederholt diesen Vorgang für verschiedene Segmentlängen S und bestimmt die Segmentlänge S und den Gewichtungsfaktor g&sub0;, mit denen die Verzerrung minimiert wird. Der resultierende Anregungsvektor E wird in das Synthesefilter 122 eingegeben, und das von diesem gelieferte synthetische akustische Signal wird im Subtrahierer 128 von einem Eingabesignal AT abgezogen, um eine Rausch- oder Zufallskomponente zu erhalten. Dann wird aus dem Zufallscodebuch 125 ein Rauschcodevektor ausgewählt, der die Verzerrung minimiert, wobei die Rauschkomponente als Zielwert des synthetischen Rauschens gesetzt wird, wenn der Rauschcodevektor als Anregungsvektor E benutzt wird. Hiermit wird der Index In erhalten, der dem ausgewählten Rauschcodevektor entspricht. Aus dem so festgelegten Rauschcodevektor wird der Gewichtungsfaktor g&sub1; berechnet, der die Verzerrung minimiert. Die in der oben erwähnten Weise bestimmten Gewichtungsfaktoren g&sub0; und g&sub1; werden als Gewichtungscode G = (g&sub0;, G&sub1;) in einem Kodierteil 132 berechnet. Die LPC-Koeffizienten α, die Segmentlänge S, der Rauschcodevektorindex In und der Gewichtungscode G, die für jeden Rahmen der Abtastwertfolge Ss in der oben beschriebenen Weise bestimmt wurden, werden von der Kodiervorrichtung gemäß Fig. 10A als Codes ausgegeben, die der Abtastwertfolge Ss entsprechen.
- In der in Fig. 10B gezeigten Dekodiervorrichtung werden die LPC-Koeffizienten α in einem LPC- Synthesefilter 221 als Filterkoeffizienten gesetzt. Basierend auf der Segmentlänge S und dem Index In von der in Fig. 10A gezeigten Kodiervorrichtung wird von einem adaptiven Codebuch 223 und einem Zufallscodebuch 222 ein adaptiver Codevektor bzw. ein Rauschcodevektor ausgegeben, wie im Fall der Kodiervorrichtung. Diese Codevektoren werden mit den Gewichtungsfaktoren G&sub0; und G&sub1; von einem Gewichtungsfaktordekodierteil 222 in Multiplizierern 224 bzw. 226 multipliziert. Die multiplizierten Ausgaben werden von einem Addierer 227 zusammenaddiert. Die addierte Ausgabe wird dem LPC-Synthesefilter 221 als Anregungsvektor zur Verfügung gestellt. Infolgedessen wird die Abtastwertfolge Ss wiederhergestellt oder rekonstruiert und dem Umkehrverschachtelungsteil 40 bereitgestellt. Im Umkehrverschachtelungsteil 40 wird die gleiche Verarbeitung wie im Fall von Fig. 3B vorgenommen.
- Aus dem Vorstehenden geht hervor, daß das Kodierverfahren für den Kodierteil 10 der Kodiervorrichtung gemäß der vorliegenden Erfindung ein beliebiges Kodierverfahren sein kann, welches die Korrelation zwischen Abtastwerten ausnutzt, zum Beispiel das Transferkodierverfahren und das LPG-Verfahren. Das Mehrkanalsignal, welches in den Verschachtelungsteil 30 eingegeben wird, ist nicht speziell auf ein Stereosignal beschränkt, sondern es können auch andere akustische Signale sein. Auch in einem solchen Fall gibt es häufig eine zeitweilige Korrelation zwischen dem Abtastwert eines Signals eines bestimmten Kanals und irgendwelchen Abtastwerten irgendwelcher anderer Kanäle. Das Kodierverfahren gemäß der vorliegenden Erfindung erlaubt eine Prädiktion anhand einer größeren Anzahl vorhergehender Abtastwerte als es bei der LPC-Analyse der Fall ist, die nur ein Kanalsignal benutzt, und deshalb bietet es einen erhöhten Prädiktionsgewinn und gewährleistet eine effiziente Kodierung.
- Fig. 11 stellt die Ergebnisse subjektiver Bewertungstests der Signalqualität dar, denen mittels des Kodierverfahrens der Ausführungsbeispiele gemäß Fig. 3A und 3B erzeugte Stereosignale unterzogen wurden. Es wurden MOS-Werte (Mean Opinion Score - durchschnittliche Meinungsbewertungsziffern) in fünf Stufen benutzt, und Prüflinge oder Zuhörer im Alter von 19 bis 25 Jahren waren 15 in der Musikindustrie beschäftigte Personen. Die Bitrate ist 28 kbit/s bei TwinVQ. In Fig. 11 ist mit dem Bezugszeichen 3a der Fall bezeichnet, wo das Ausführungsbeispiel aus Fig. 3A und 3B benutzt wurde, während 3b den Fall betrifft, wo das Quantisierungsverfahren unter Berücksichtigung des Energieunterschiedes zwischen Signalen des linken und rechten Kanals angewandt wurde, und 3c den Fall, bei dem die Signale aus dem linken und rechten Kanal unabhängig voneinander kodiert waren. Aus den in Fig. 11 dargestellten Ergebnissen geht hervor, daß die Bewertung der Signalqualität am höchsten ist für das Kodierverfahren gemäß der vorliegenden Erfindung.
- Bei jedem vorstehend beschriebenen Ausführungsbeispiel nimmt der Einfluß der relativen Quantisierungsverzerrung auf ein Kanalsignal kleiner Leistung während des Zeitintervalls zu, während dessen aufgrund einer zeitlichen Schwankung in dem vom Verschachtelungsteil 30 eingegebenen akustischen Signal ein starker Leistungsunterschied zwischen den Kanälen auftritt. Das macht es unmöglich, eine hohe Signalqualität einzuhalten. Als Modifikationen des in Fig. 2A und 2B gezeigten Grundaufbaus der vorliegenden Erfindung sind in Fig. 12A und 12B in Blockform Ausführungsbeispiele von Kodier- und Dekodierverfahren gezeigt, mit denen der oben erwähnte Mangel beseitigt wird und selbst bei einem auftretenden Ungleichgewicht der Signalleistung zwischen den Kanälen verhindert wird, daß nur der Kanal mit kleiner Leistung einer Quantisierungsverzerrung unterliegt. Hiermit wird ein hochqualitatives kodiertes akustisches Signal erzeugt. Die gezeigten Ausführungsbeispiele werden für den Fall des Gebrauchs von zwei Signalendes linken und rechten Kanals beschrieben.
- In Fig. 12A und 12B sind die den Teilen in Fig. 2A und 2B entsprechenden Teile mit den gleichen Bezugszeichen gekennzeichnet. Die in Fig. 12A gezeigte Kodiervorrichtung unterscheidet sich von der in Fig. 2A gezeigten durch die Anordnung von Leistungsberechnungsteilen 32L und 32R, einem Leistungsentscheidungsteil 33 und Leistungsausgleichsteilen 34L und 34R. Die in Fig. 12B gezeigte Dekodiervorrichtung unterscheidet sich von der gemäß Fig. 2A durch die Anordnung eines Indexdekodierteils 43 und Leistungsumkehrausgleichsteile 42L und 42R. Das Kodieren und Dekodieren wird, auf die oben erwähnten Teile konzentriert, beschrieben.
- Die Signale des linken und rechten Kanals an den Eingabeanschlüssen 31L und 31R werden in Leistungsberechnungsteile 32L bzw. 32R eingegeben, in denen ihre Leistungswerte für jedes Zeitintervall, das heißt für jede Kodierrahmenperiode berechnet werden. Anhand der von den Leistungsrechenteilen 32L und 32R eingegebenen Leistungswerte bestimmt der Leistungsentscheidungsteil 33 Koeffizienten, mit denen die Signale des linken und rechten Kanals in den Leistungsausgleichsteilen 34L und 34R multipliziert werden, so daß der Unterschied in der Leistung zwischen den beiden Signalen verringert wird. Der Leistungsentscheidungsteil 33 sendet die Koeffizienten an die Leistungsausgleichsteile 34L und 34R und gibt Indizes In&sub1; aus, welche die beiden Koeffizienten darstellen.
- Da der Ausgleich die Leistungsdifferenz zwischen dem Signal des linken und rechten Kanals verringern soll, liegt auf der Hand, daß die Leistungsgrößen der Signale des linken und rechten Kanals zum Beispiel durch Multiplizieren nur des Kanalsignals der kleineren Leistungsgröße mit einem Koeffizienten g ausgeglichen werden können. Wenn angenommen zum Beispiel die Leistung des Signals des linken Kanals: WL und die Leistung des Signals des rechten Kanals: WR, wird k = WL/WR berechnet. Wenn k > 1, wird das Signal des rechten Kanals im Leistungsausgleichsteil 34R mit g = kr multipliziert (worin r eine Konstante ist, die zum Beispiel etwa von 0,2 bis 0,4 reicht). Dem Verschachtelungsteil 30 wird die multiplizierte Ausgabe zugeleitet, während das Signal des linken Kanals intakt an den Verschachtelungsteil 30 angelegt wird. Wenn 0 < k < 1, wird das Signal des linken Kanals im Leistungsausgleichsteil 34L mit 1/g = k-r multipliziert, und die multiplizierte Ausgabe an den Verschachtelungsteil 30 angelegt. Das Signal des rechten Kanals wird dem Verschachtelungsteil 30 intakt zugeleitet. Wenn r = 1 gesetzt wird, wird die Verzerrung des Signals der kleineren Amplitude auf ein Minimum eingeschränkt, aber die Verzerrung des Signals der größeren Amplitude nimmt zu. Wenn r = 0 gesetzt wird, ist das Signal der kleineren Amplitude natürlich verzerrt. Infolgedessen kann die Konstante r vorzugsweise in die Mitte zwischen 1 und 0 gesetzt werden. Wenn zum Beispiel die Leistung des eingegebenen akustischen Signals rasch eine starke Schwankung erlebt, ist der entsprechende rasche Leistungsausgleich zwischen den Signalen des linken und rechten Kanals unter dem perzeptuellen Gesichtspunkt nicht immer optimal. Wenn man die Konstante r in den Bereich von 0,2 bis 0,4 setzt, kann es manchmal möglich sein, was die Perzeption betrifft, das beste akustische Signal zu erhalten.
- In den Leistungsausgleichsteilen 34L und 34R wird das Signal des rechten oder linken Kanals mit dem durch den Index bestimmten Koeffizienten 8 von 1/g multipliziert, wodurch der Leistungsunterschied zwischen den Signalen der beiden Kanäle verringert wird. Die multiplizierte Ausgabe geht an den Verschachtelungsteil 30. Das anschließende Kodierverfahren im Kodierteil 10 verläuft genauso wie das Kodierverfahren mit Hilfe des in Fig. 2A gezeigten Kodierteils 10. In der Praxis kann irgend eins der Kodierverfahren mit den Kodiervorrichtungen aus Fig. 3A, 6A, 7A, 8A und 10A benutzt werden.
- In der in Fig. 12B gezeigten Dekodiervorrichtung werden die Signalabtastwertfolgen des linken und rechten Kanals an den Ausgabeanschlüssen 41L und 41R des Umkehrverschachtelungsteils 40 nach der gleichen Verarbeitung wie in dem in Fig. 2B gezeigten Dekodierteil 20 und dem Umkehrverschachtelungsteil 40 bereitgestellt. Im Indexdekodierteil 43 ... der Koeffizient g oder 1/g, der dem vom Leistungsentscheidungsteil 33 in Fig. 12A bereitgestellten Index In&sub1; entspricht. Im Leistungsumkehrausgleichsteil 42L oder 42R wird das Signal des linken oder rechten Kanals durch Dividieren mit dem entsprechenden Koeffizienten g oder 1/g einem Umkehrausgleich unterzogen, das heißt, daß an den Ausgabeanschlüssen 44L bzw. 44R Signale des linken und rechten Kanals zur Verfügung gestellt werden, zwischen denen der Leistungsunterschied verstärkt ist.
- Im Leistungsentscheidungsteil 33 kann der Koeffizient für den Leistungsausgleich in der nachfolgend beschriebenen Weise bestimmt werden. Wie die Tabelle in Fig. 13 zeigt, ist der Bereich des Wertes k = WL oder 1/g in eine Vielzahl von Unterbereichen aufgeteilt, und der Koeffizient g oder 1/g, mit dem die Signalleistung WR oder WL multipliziert wird, ist in jedem Unterbereich so festgelegt, daß der Koeffizient g oder 1/g mit einer Zunahme von k oder 1/k zunimmt. Im Leistungsentscheidungsteil 33 ist die Tabelle aus Fig. 13 im voraus gespeichert, und er wählt aus der im voraus gespeicherten Tabelle den Koeffizienten g oder 1/g in Abhängigkeit von dem Unterbereich aus, zu dem der Wert k oder 1/k gehört. Der Leistungsentscheidungsteil 33 gibt als Index In&sub1; einen Code aus, der dem ausgewählten Koeffizienten entspricht. Im Indexdekodierteil 43 der in Fig. 12B gezeigten Dekodiervorrichtung ist auch die Tabelle gemäß Fig. 13 vorgesehen, aus der der Koeffizient g oder 1/g entsprechend dem Index In&sub1; vom Leistungsentscheidungsteil 33 ausgewählt und an den Umkehrausgleichsteil 42L oder 42R weitergegeben wird.
- Wenn zum Beispiel bei einem akustischen Zweikanalstereosignal die Signale des linken Kanals L1, L2 ... während einer gewissen Zeitdauer merklich klein in der Leistung sind, aber die Signale des rechten Kanals in der Leistung beträchtlich groß sind, wird die Ausgabe des Verschachtelungsteils 30 gemäß Fig. 2A ein solches eindimensionales Signal, wie es in Fig. 14A gezeigt ist, und die relative Quantisierungsverzerrung der Signale des linken Kanals nimmt zu, was dazu führt, daß die Qualität des dekodierten akustischen Signals des linken Kanals verschlechtert wird. Wenn aber im Fall der Kodier- und Dekodiervorrichtung gemäß Fig. 12A bzw. 12B das Signal des linken Kanals eine kleine Leistung, aber das Signal des rechten Kanals eine große Leistung hat, wird die Ausgabe des Verschachtelungsteils 30 gemäß Fig. 12A ausgeglichen, wie zum Beispiel in Fig. 14B gezeigt. Der Leistungsunterschied nimmt entsprechend ab, und damit wird verhindert, daß nur das Signal des linken Kanals durch die Quantisierungsverzerrung stark beeinflußt wird.
- Fig. 15 ist eine Kurvendarstellung der Rauschabstände zwischen eingegebenen und dekodierten akustischen Signalen für die Fälle (A), wo die Signale des linken und rechten Kanals die gleiche Leistung haben, (B), wo die Signale des linken und rechten Kanals einen Leistungsunterschied von 10 dB haben, und (C), wo nur eines der Signale des linken und rechten Kanals Leistung aufweist, bei den Ausführungsbeispielen des Kodier- und Dekodierverfahrens gemäß Fig. 2A, 2B und 12A, 12B. Die gestrichelten Balken weisen auf die Rauschabstände für die Ausführungsbeispiele der Fig. 2A und 2B hin und die nichtgestrichelten Balken auf die Rauschabstände für die Ausführungsbeispiele gemäß Fig. 12A und 12B. Beim Kodierteil 10 und Dekodierteil 20 handelt es sich um die in Fig. 3A und 3B gezeigten. Die Übertragungsrate der kodierten Ausgabe wurde auf 20 kbit/s gesetzt, und Rechnersimulationen wurden mit der auf 40 ms gesetzten Rahmenlänge und der Abtastfrequenz von 16 kHz vorgenommen. Der Signalpegel des einen Kanals wurde von Hand eingestellt, um das dekodierte akustische Signal zu optimieren zu der Zeit lag im wesentlichen im Bereich von 0,2 bis 0,4. Aus der Kurvendarstellung in Fig. 15 geht hervor, daß die Rauschabstände für die Ausführungsbeispiele gemäß Fig. 12A und 12B besser sind als für die Ausführungsbeispiele gemäß Fig. 2A und 2B.
- Die in Fig. 12A und 12B gezeigten Ausführungsbeispiele der vorliegenden Erfindung sind zwar in Anwendung auf ein Stereosignal mit zwei linken und zwei rechten Kanälen beschrieben worden; aber die Erfindung ist auch auf Signale von drei oder mehr Kanälen anwendbar. Die Kodier- und Dekodiervorrichtungen 10 und 20 werden häufig dazu bestimmt, ein Programm mittels DSP (Digital Signal Processor) zu dekodieren und durchzuführen. Die vorliegende Erfindung ist auch auf einen Träger anwendbar, auf dem ein solches Programm aufgezeichnet ist.
- Wie vorstehend beschrieben, werden gemäß der vorliegenden Erfindung Signalabtastwertfolgen mehrerer Kanäle zu einer eindimensionalen Signalabtastwertfolge verschachtelt, die durch das Ausnutzen der Korrelation zwischen dem Abtastwert als eine Signalabtastwertfolge eines einzigen Kanals kodiert wird. Das erlaubt es, mit einem hohen Prädiktionsgewinn zu kodieren und stellt infolgedessen ein wirksames Kodieren sicher. Ferner kann eine derartige wirksam kodierte Codefolge dekodiert werden.
- Durch das Verschachteln der Signalabtastwertfolgen nach dem Verringern des Leistungsungleichgewichts zwischen den Kanälen in der Kodiervorrichtung ist es möglich, zu verhindern, daß nur das Signal des Kanals mit kleiner Leistung durch die Quantisierungsverzerrung stark beeinflußt wird, wenn das Leistungsungleichgewicht aufgrund von Leistungsschwankungen mehrerer Kanäle auftritt. Folglich ermöglicht es die vorliegende Erfindung, daß beliebige Mehrkanalsignale mit hoher Qualität kodiert und dekodiert werden.
- Es liegt auf der Hand, daß viele Abwandlungen und Änderungen vorgenommen werden können, ohne den Bereich der durch die beigefügten Ansprüche bestimmten vorliegenden Erfindung zu verlassen.
Claims (74)
1. Kodierverfahren für ein akustisches Mehrkanalsignal mit den Schritten:
(a) Verschachteln akustischer Signalabtastwertfolgen mehrerer Kanäle zu einer
eindimensionalen Signalfolge nach einer bestimmten Regel; und
(b) Kodieren der eindimensionalen Signalabtastwertfolge mit einem Kodierverfahren, das
die Korrelation zwischen Abtastwerten von verschiedenen Kanälen nutzt und einen Code ausgibt.
2. Kodierverfahren nach Anspruch 1, ferner mit den dem Schritt (a) vorausgehenden
Schritten:
(0-1) Berechnen der Leistung der akustischen Signalabtastwertfolge jedes der mehreren
Kanäle für jede gewisse Zeitperiode; und
(0-2) Reduzieren der Leistungsdifferenz zwischen den akustischen Signalabtastwertfolgen
der mehreren Kanäle auf der Basis der für jeden Kanal berechneten Leistung und Benutzen der
akustischen Signalabtastwertfolgen der mehreren Kanäle mit ihrer reduzierten Leistungsdifferenz als
die akustischen Signalabtastwertfolgen der mehreren Kanäle im Schritt (a).
3. Kodierverfahren nach Anspruch 1 oder 2, bei dem das Kodieren im Schritt (b) folgende
Schritte aufweist:
(b-1) Erzeugen von Frequenzbereichskoeffizienten durch Orthogonal-Transformation der
eindimensionalen Signalabtastwertfolge;
(b-2) Schätzen einer Spektralhüllkurve der Frequenzbereichskoeffizienten und Ausgeben
eines ersten Quantisierungscodes, der die geschätzte Spektralhüllkurve darstellt;
(b-3) Erzeugen von Spektrumrestkoeffizienten durch Normieren der
Frequenzbereichskoeffizienten mit der geschätzten Spektralhüllkurve; und
(b-4) Quantisieren der Spektrumrestkoeffizienten und Ausgeben eines
Quantisierungscodes.
4. Kodierverfahren nach Anspruch 3, bei dem der Schritt (b-2) einen Schritt aufweist, bei
dem die Spektralhüllkurve durch LPC-Analysieren der eindimensionalen Signalabtastwertfolge
geschätzt wird.
5. Kodierverfahren nach Anspruch 3, bei dem der Schritt (b-2) einen Schritt aufweist, bei
dem die Spektralhüllkurve aus den Frequenzbereichskoeffizienten geschätzt wird.
6. Kodierverfahren nach Anspruch 3, bei dem die Quantisierung im Schritt (b-4) eine
Vektorquantisierung ist.
7. Kodierverfahren nach Anspruch 3, bei dem die Quantisierung im Schritt (b-4) folgende
Schritte aufweist:
(b-4-1) Schätzen einer Restkoeffizientenhüllkurve aus den Spektrumrestkoeffizienten;
(b-4-2) Erzeugen von Feinstrukturkoeffizienten durch Normieren der
Spektrumrestkoeffizienten mit der Restkoeffizientenhüllkurve;
(b-4-3) Erzeugen von auf der Restkoeffizientenhüllkurve basierenden Gewichtungsfaktoren
lind Ausgeben eines die Gewichtungsfaktoren anzeigenden Index als Teil des Codes; und
(b-4-4) Durchführen gewichteter Vektorquantisierung der Feinstrukturkoeffizienten durch
die Benutzung der Gewichtungsfaktoren und Ausgeben ihres Quantisierungsindex als den anderen
Teil des Codes.
8. Kodierverfahren nach Anspruch 1 oder 2, bei dem das Kodieren im Schritt (b) folgende
Schritte aufweist:
(b-1) Erzeugen von Frequenzbereichskoeffizienten durch Orthogonal-Transformation der
eindimensionalen Signalabtastwertfolge;
(b-2) Schätzen einer Spektralhüllkurve der Frequenzbereichskoeffizienten und Ausgeben
eines die geschätzte Spektralhüllkurve darstellenden Index als Teil des Codes; und
(b-3) Durchführen einer auf der mindestens einen Spektralhüllkurve basierenden
Bitzuordnung, Durchführen einer Quantisierung der Frequenzbereichskoeffizienten mit adaptiver
Bitzuordnung und Ausgeben eines die Quantisierung anzeigenden Index als den anderen Teil des Codes.
9. Kodierverfahren nach Anspruch 8, bei dem der Schritt (b-2) einen Schritt umfaßt, bei
dem die Spektralhüllkurve durch LPC-Analysieren der eindimensionalen Signalabtastwertfolge
geschätzt wird.
10. Kodierverfahren nach Anspruch 8, bei dem der Schritt (b-2) einen Schritt umfaßt, bei
dem die Spektralhüllkurve aus den Frequenzbereichskoeffizienten geschätzt wird.
11. Kodierverfahren nach Anspruch 1 oder 2, bei dem das Kodieren im Schritt (b) folgende
Schritte aufweist:
(b-1) Erhalten prädiktiver Koeffizienten durch LPC-Analysieren der eindimensionalen
Signalabtastwertfolge;
(b-2) Erzeugen prädiktiver Quantisierungskoeffizienten durch Quantisieren der prädiktiven
Koeffizienten und Ausgeben eines die Quantisierung anzeigenden Index als Teil des Codes;
(b-3) Erzeugen einer Restabtastwertfolge durch Umkehrfiltern der eindimensionalen
Signalabtastwertfolge unter Benutzung der prädiktiven Quantisierungskoeffizienten als
Filterkoeffizienten;
(b-4) Erzeugen eines Restspektrums durch Orthogonal-Transformation der
Restabtastwertfolge;
(b-5) Erzeugen einer Spektralhüllkurve aus den prädiktiven Quantisierungskoeffizienten;
und
(b-6) Bestimmen einer auf der mindestens einen Spektralhüllkurve basierenden
Bitzuord
nung, Durchführen einer Quantisierung des Restspektrums mit adaptiver Bitzuordnung und
Ausgeben eines die Quantisierung anzeigenden Index als den anderen Teil des Codes.
12. Kodierverfahren nach Anspruch 1 oder 2, bei dem das Kodieren im Schritt (b) folgende
Schritte aufweist:
(b-1) Erhalten prädiktiver Koeffizienten durch LPC-Analysieren der eindimensionalen
Signalabtastwertfolge;
(b-2) Erzeugen prädiktiver Quantisierungskoeffizienten durch Quantisieren der prädiktiven
Koeffizienten und Ausgeben eines die Quantisierung anzeigenden Index als Teil des Codes;
(b-3) Erzeugen einer Restabtastwertfolge im Zeitbereich durch ein auf die eindimensionale
Signalabtastwertfolge angewandtes Umkehrfilter unter Verwendung der prädiktiven
Quantisierungskoeffizienten als Filterkoeffizienten;
(b-4) Erzeugen eines Restspektrums durch Orthogonal-Transformation der
Restabtastwertfolge;
(b-5) Erzeugen einer Spektralhüllkurve aus den prädiktiven Quantisierungskoeffizienten;
und
(b-6) Bestimmen von mindestens auf der Spektralhüllkurve basierenden
Gewichtungsfaktoren, Durchführen einer gewichteten Vektorquantisierung des Restkoeffizientenspektrums und
Ausgeben eines die Quantisierung anzeigenden Index als den anderen Teil des Codes.
13. Kodierverfahren nach Anspruch 1 oder 2, bei dem der Schritt (b) einen Schritt umfaßt,
bei dem die eindimensionale Signalabtastwertfolge durch ADPCM kodiert wird.
14. Kodierverfahren nach Anspruch 13, bei dem der Schritt (b) folgende Schritte aufweist:
(b-1) Berechnen eines Prädiktionsfehlers eines Prädiktionswertes für jeden Abtastwert der
eindimensionalen Signalabtastwertfolge;
(b-2) adaptives Quantisieren des Prädiktionsfehlers und Ausgeben eines die Quantisierung
anzeigenden Index als Teil des Codes;
(b-3) Erhalten des quantisierten Prädiktionsfehlers durch Dekodieren des Index;
(b-4) Erzeugen eines quantisierten Abtastwertes durch Addieren des Prädiktionswertes zu
dem quantisierten Prädiktionsfehler; und
(b-5) Erzeugen eines Prädiktionswertes für den nächsten Abtastwert der eindimensionalen
Signalabtastwertfolge auf der Basis des quantisierten Abtastwertes.
15. Kodierverfahren nach Anspruch 1 oder 2, bei dem das Kodieren im Schritt (b) Kodieren
der eindimensionalen Signalabtastwertfolge durch CELP ist.
16. Kodierverfahren nach Anspruch 15, bei dem der Schritt (b) folgende Schritte aufweist:
(b-1) Erhalten prädiktiver Koeffizienten durch LPC-Analysieren der eindimensionalen
Signalabtastwertfolge für jeden Rahmen, Abgeben der prädiktiven Koeffizienten als
Filterkoeffizienten an ein Synthesefilter und Ausgeben derselben als Teil des Codes; und
(b-2) Erzeugen eines Anregungsvektors für den laufenden Rahmen durch ein aus einem
Anregungsvektor für den vorhergehenden Rahmen extrahiertes Anregungsvektorsegment für jedes
Synthesefilter, so daß die Verzerrung zwischen der eindimensionalen Signalabtastwertfolge und
einer synthetisierten akustischen Signalabtastwertfolge durch das Synthesefilter minimiert wird, und
Ausgeben eines die extrahierte Segmentlänge anzeigenden Index als den anderen Teil des Codes.
17. Kodierverfahren nach Anspruch 3, bei dem das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt wird, das Kodieren für
jedes Frequenzband durchgeführt wird und eine Kombination von Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben wird.
18. Kodierverfahren nach Anspruch 8, bei dem das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt wird/das Kodieren für
jedes Frequenzband durchgeführt wird und eine Kombination von Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben wird.
19. Kodierverfahren nach Anspruch 12, bei dem das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt wird, das Kodieren für
jedes Frequenzband durchgeführt wird und eine Kombination von Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben wird.
20. Kodierverfahren nach Anspruch 2, bei dem die mehrere Kanäle zwei Kanäle, ein linker
und ein rechter sind, und bei dem der Schritt (0-2) einen Schritt aufweist, bei dem diejenige
akustische Signalabtastwertfolge der linken und rechten Kanäle, die die kleinere Leistung hat, mit
einem Ausgleichsfaktor gleich oder größer als 1 multipliziert wird und als Teil des Codes ein den
Ausgleichsfaktor anzeigender Index ausgegeben wird.
21. Kodierverfahren nach Anspruch 20, bei dem ein Leistungsverhältnis k zwischen dem
linken und dem rechten Kanal und, wenn dieses Verhältnis gleich oder größer ist als 1, die
akustische Signalabtastwertfolge des Kanals der kleineren Leistung mit 8 = kr als Ausgleichsfaktor
multipliziert wird, und wenn 0 < k < 1, die akustische Signalabtastwertfolge des Kanals der kleineren
Leistung mit 1/g als Ausgleichsfaktor multipliziert wird, wobei r eine durch 0 < r < 1 definierte Konstante
ist.
22. Kodierverfahren nach Anspruch 20, ferner mit den Schritten:
Berechnen eines Leistungsverhältnisses k zwischen dem linken und dem rechten Kanal;
Entscheiden, zu welchem einer Vielzahl vorherbestimmter Unterbereiche der Wert k
gehört, wobei die Vielzahl Unterbereiche aus einem Bereich herausgeteilt sind, über den der Wert k
möglich gemacht ist; und
Multiplizieren der akustischen Signalabtastwertfolge des Kanals der kleineren Leistung mit
derjenigen der vorherbestimmten für jeweilige Unterbereiche, der dem entschiedenen Unterbereich
entspricht, und Bereitstellen eines Codes, der den entschiedenen Unterbereich anzeigt, als einen
den Ausgleichsfaktor anzeigenden Index.
23. Dekodierverfahren zum Dekodieren von Codes, die durch Verschachteln akustischer
Signalabtastwertfolgen mehrerer Kanäle zu einer eindimensionalen Signalabtastwertfolge nach einer
bestimmten Regel kodiert wurden, mit den Schritten:
(a) Dekodieren einer Eingabecodefolge in die eindimensionale Signalabtastwertfolge durch
ein Dekodierverfahren entsprechend einem Kodierverfahren unter Nutzung der Korrelation zwischen
Abtastwerten von verschiedenen Kanälen; und
(b) Verteilen der dekodierten eindimensionalen Signalabtastwertfolge auf die mehreren
Kanäle durch ein gegenüber dem der bestimmten Regel umgekehrtes Verfahren, wodurch die
akustischen Signalabtastwertfolgen der mehreren Kanäle erhalten werden.
24. Dekodierverfahren nach Anspruch 23, ferner mit den Schritten:
Dekodieren eines Eingabeleistungskorrekturindex zum Erhalten eines Ausgleichsfaktors;
und
Korrigieren der akustischen Signalabtastwertfolgen der mehreren Kanäle mit dem
Ausgleichsfaktor zum Erhöhen einer Leistungsdifferenz zwischen denselben, wodurch dekodierte
akustische Signalabtastwertfolgen mehrerer Kanäle erhalten werden.
25. Dekodierverfahren nach Anspruch 23 oder 24, bei dem das Dekodieren im Schritt (a)
folgende Schritte aufweist:
(a-1) Dekodieren eines eingegebenen ersten Quantisierungscodes zum Erhalten eines
Spektrumrests;
(a-2) Dekodieren eines eingegebenen zweiten Quantisierungscodes zum Erhalten einer
Spektralhüllkurve;
(a-3) Multiplizieren des Spektrumrests und der Spektralhüllkurve zum Erhalten von
Frequenzbereichskoeffizienten; und
(a-4) Durchführen einer Orthogonal-Umkehrtransformation der
Frequenzbereichskoeffizienten zum Erhalten der eindimensionalen Signalabtastwertfolge in einem Zeitbereich.
26. Dekodierverfahren nach Anspruch 25, bei dem der Schritt (a-2) einen Schritt aufweist,
bei dem der zweite Quantisierungscode dekodiert wird, um LPC-Koeffizienten zu erhalten, und die
Spektralhüllkurve aus den LPC-Koeffizienten berechnet wird.
27. Dekodierverfahren nach Anspruch 25, bei dem das Dekodieren im Schritt (a-1)
Vektordekodieren ist.
28. Dekodierverfahren nach Anspruch 26, bei dem der erste Quantisierungscode einen
ersten und einen zweiten Index umfaßt und der Schritt (a-1) folgende Schritte aufweist:
(a-1-1) Dekodieren des ersten Index zum Wiederherstellen von
Spektrumfeinstrukturkoeffizienten;
(a-1-2) Dekodieren des zweiten Index zum Erhalten einer Restkoeffizientenhüllkurve; und
(a-1-3) Entnormieren der Spektrumfeinstrukturkoeffizienten mit der
Restkoeffizientenhüllkurve zum Erhalten des Spektrumrests.
29. Dekodierverfahren nach Anspruch 23 oder 24, bei dem der Schritt (a) folgende Schritte
aufweist:
(a-1-1) Frequenzbereichskoeffizienten durch Dekodieren mit adaptiver Bitzuordnung aus
einem eingegebenen ersten Quantisierungscode, der quantisierte Frequenzbereichskoeffizienten
anzeigt, und einem eingegebenen zweiten Quantisierungscode, der eine quantisierte
Spektralhüllkurve anzeigt; und
(a-1-2) Durchführen einer Orthogonal-Umkehrtransformation der
Frequenzbereichskoeffizienten zum Erhalten der eindimensionalen Signalabtastwertfolge.
30. Dekodierverfahren nach Anspruch 23 oder 24, bei dem der Schritt (a) folgende Schritte
aufweist:
(a-1-1) Erhalten von LPC-Koeffizienten durch Dekodieren eines eingegebenen ersten
Quantisierungscodes, der quantisierte LPC-Koeffizienten anzeigt;
(a-1-2) Schätzen einer Spektralhüllkurve aus den LPC-Koeffizienten;
(a-1-3) Erhalten eines Restkoeffizientenspektrums durch Dekodieren mit adaptiver
Bitzuordnung eines eingegebenen zweiten Quantisierungscodes, der ein quantisiertes
Restkoeffizientenspektrum anzeigt, durch Bitzuordnungen, die auf der Spektralhüllkurve basieren;
(a-1-4) Durchführen einer Orthogonal-Umkehrtransformation des
Restkoeffizientenspektrums zum Erhalten einer Anregungssignalabtastwertfolge; und
(a-1-5) Erhalten der eindimensionalen Signalabtastwertfolge durch Verarbeiten der
Anregungssignalabtastwertfolge mit einem Synthesefilter unter Verwendung der LPC-Koeffizienten als
Filterkoeffizienten.
31. Dekodierverfahren nach Anspruch 23 oder 24, bei dem der Schritt (a) folgende Schritte
aufweist:
(a-1-1) Erhalten eines Spektralrestes durch Vektordekodieren eines eingegebenen ersten
Vektorquantisierungscodes, der vektorquantisierten Spektralrest anzeigt;
(a-1-2) Erhalten einer Spektralhüllkurve durch Vektorkodieren eines eingegebenen zweiten
Vektorquantisierungscodes, der eine vektorquantisierte Spektralhüllkurve anzeigt;
(a-1-3) Erhalten von Frequenzbereichskoeffizienten durch Multiplizieren des Spektralrests
und der Spektralhüllkurve für entsprechende Abtastwerte derselben; und
(a-1-4) Durchführen einer Orthogonal-Umkehrtransformation der
Frequenzbereichskoeffizienten zum Erhalten der eindimensionalen Signalabtastwertfolge.
32. Dekodierverfahren nach Anspruch 23 oder 24, bei dem der Schritt (a) folgende Schritte
aufweist:
(a-1-1) Erhalten eines quantisierten Prädiktionsfehlers durch Dekodieren eines
eingegebenen, den quantisierten Prädiktionsfehler anzeigenden Quantisierungscodes;
(a-1-2) adaptives Vorhersagen des laufenden Abtastwertes aus dem vorherigen
dekodierten Abtastwert;
(a-1-3) Addieren des quantisierten Prädiktionsfehlers zu einer vorhergesagten Version des
Abtastwertes zum Erhalten des laufenden dekodierten Abtastwertes; und
(a-1-4) Wiederholen der Schritte (a-1-1), (a-1-2) und a-1-3) zum Erhalten der
eindimensionalen Signalabtastwertfolge.
33. Dekodierverfahren nach Anspruch 23 oder 24, bei dem der Schritt (a) folgende Schritte
aufweist:
(a-1-1) Erzeugen eines Anregungsvektors des laufenden Rahmens durch Extrahieren eines
Segmentes aus einem Anregungsvektor des vorherigen Rahmens, dessen Länge von einem
eingegebenen Index bezeichnet ist, der die Segmentlänge des Anregungsvektors anzeigt; und
(a-1-2) Setzen von eingegebenen LPC-Koeffizienten als Filterkoeffizienten in einem
Synthesefilter und Verarbeiten des Anregungsvektors des laufenden Rahmens mit dem
Synthesefilter zum Erhalten der eindimensionalen Signalabtastwertfolge.
34. Dekodierverfahren nach Anspruch 25, bei dem ein Satz der ersten und zweiten
Quantisierungscodes für jedes einer Vielzahl vorherbestimmter Frequenzbänder eingegeben wird, der Satz
der Quantisierungscodes für ein gewünschtes der Vielzahl von Frequenzbändern ausgewählt und
dekodiert wird, um Frequenzbereichskoeffizienten des ausgewählten Frequenzbandes zu erhalten,
und Durchführen einer Orthogonal-Umkehrtransformation der Frequenzbereichskoeffizienten.
35. Dekodierverfahren nach Anspruch 29, bei dem ein Satz der ersten und zweiten
Quantisierungscodes für jedes einer Vielzahl vorherbestimmter Frequenzbänder eingegeben wird, der Satz
der Quantisierungscodes für ein gewünschtes der Vielzahl von Frequenzbändern ausgewählt und
dekodiert wird, um Frequenzbereichskoeffizienten des ausgewählten Frequenzbandes zu erhalten,
und Durchführen einer Orthogonal-Umkehrtransformation der Frequenzbereichskoeffizienten.
36. Dekodierverfahren nach Anspruch 31, bei dem ein Satz der ersten und zweiten
Quantisierungscodes für jedes einer Vielzahl vorherbestimmter Frequenzbänder eingegeben wird, der Satz
der Quantisierungscodes für ein gewünschtes der Vielzahl von Frequenzbändern ausgewählt und
dekodiert wird, um Frequenzbereichskoeffizienten des ausgewählten Frequenzbandes zu erhalten,
und Durchführen einer Orthogonal-Umkehrtransformation der Frequenzbereichskoeffizienten.
37. Dekodierverfahren nach Anspruch 24, bei dem die mehreren Kanäle zwei linke und
rechte Kanäle sind, der dekodierte Ausgleichsfaktor gleich oder größer als 1 ist und diejenige der
akustischen Signalabtastwertfolgen der linken und rechten Kanäle mit der kleineren Leistung durch
den Ausgleichsfaktor dividiert wird, um dekodierte akustische Signalabtastwertfolgen der linken und
rechten Kanäle zu erhalten.
38. Kodiervorrichtung für ein akustisches Mehrkanalsignal, aufweisend:
eine Verschachtelungseinrichtung zum Verschachteln akustischer Signalabtastwertfolgen
mehrerer Kanäle zu einer eindimensionalen Signalabtastwertfolge nach einer bestimmten Regel; und
eine Kodiereinrichtung zum Kodieren der eindimensionalen Signalabtastwertfolge mit
einem Kodierverfahren, welches die Korrelation zwischen Abtastwerten von verschiedenen Kanälen
nutzt, und zum Ausgeben des Codes.
39. Kodiervorrichtung nach Anspruch 38, die in einer der Verschachtelungseinrichtung
vorhergehenden Stufe ferner folgendes aufweist:
eine Leistungsrecheneinrichtung zum Berechnen der Leistung jeder der akustischen
Signalabtastwertfolgen der mehreren Kanäle für jede gewisse Zeitperiode;
eine Leistungsentscheidungseinrichtung zum Bestimmen der Korrektur der Leistung auf
der Basis der berechneten Leistung, so daß eine Leistungsdifferenz zwischen eingegebenen
akustischen Signalabtastwertfolgen der mehreren Kanäle reduziert wird; und
eine Leistungskorrektureinrichtung, die in jedem Kanal vorgesehen ist, um die Leistung der
eingegebenen akustischen Signalabtastwertfolge jedes Kanals mit dem Leistungsausgleichsfaktor zu
korrigieren und den korrigierten eingegebenen akustischen Signalabtastwert bereitzustellen.
40. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiervorrichtung folgendes
aufweist:
eine Orthogonal-Transformationseinrichtung für die Orthogonal-Transformation der
eindimensionalen Signalabtastwertfolge in Frequenzbereichskoeffizienten;
eine Spektralhüllkurvenschätzeinrichtung zum Schätzen einer Spektralhüllkurve der
Frequenzbereichskoeffizienten und zum Ausgeben eines ersten, die geschätzte Spektralhüllkurve
anzeigenden Quantisierungscodes;
eine Frequenzbereichskoeffizientennormiereinrichtung zum Normieren der
Frequenzbereichskoeffizienten mit der Spektralhüllkurve zum Erzeugen eines Spektrumrests; und
eine Quantisiereinrichtung zum Quantisieren des Spektrumrests und zum Ausgeben ihres
Quantisierungscodes.
41. Kodiervorrichtung nach Anspruch 40, bei der die Spektralhüllkurvenschätzeinrichtung
LPC-Analyseeinrichtungen zum LPC-Analysieren der eindimensionalen Signalabtastwertfolge
aufweist, um die Spektralhüllkurve zu schätzen.
42. Kodiervorrichtung nach Anspruch 40, bei der die Spektralhüllkurvenschätzeinrichtung
Einrichtungen zum Schätzen der Spektralhüllkurve aus den Frequenzbereichskoeffizienten aufweist.
43. Kodiervorrichtung nach Anspruch 40, bei der die Quantisierungseinrichtung eine
Vektorquantisierungseinrichtung ist.
44. Kodiervorrichtung nach Anspruch 40, bei der die Quantisierungseinrichtung folgendes
aufweist:
eine Restkoeffizientenhüllkurvenschätzeinrichtung zum Schätzen einer
Restkoeffizientenhüllkurve aus dem Spektrumrest und zum Ausgeben eines die Restkoeffizientenhüllkurve
anzeigenden Index als Teil des Codes;
eine Spektrumnormiereinrichtung zum Normieren des Spektrumrests mit der
Restkoeffizientenhüllkurve zum Erzeugen von Feinstrukturkoeffizienten;
eine Gewichtungsfaktorrecheneinrichtung zum Erzeugen von Gewichtungsfaktoren auf der
Basis mindestens der Restkoeffizientenhüllkurve; und
eine Quantisierungseinrichtung zum gewichteten Vektorquantisieren der
Feinstrukturkoeffizienten durch die Nutzung der Gewichtungsfaktoren und zum Ausgeben ihres Quantisierungsindex
als den anderen Teil des Codes.
45. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiereinrichtung folgendes
aufweist:
eine Orthogonal-Transformationseinrichtung zur Orthogonal-Transformation der
eindimensionalen Signalabtastwertfolge zum Erzeugen von Frequenzbereichskoeffizienten;
eine Spektralhüllkurvenschätzeinrichtung zum Schätzen einer Spektralhüllkurve der
Frequenzbereichskoeffizienten und zum Ausgeben eines die geschätzte Spektralhüllkurve anzeigenden
Index als Teil des Codes; und
eine Quantisierungseinrichtung zum Durchführen einer Bitzuordnung auf der Basis
mindestens der Spektralhüllkurve, zum Durchführen einer Quantisierung der
Frequenzbereichskoeffizienten mit adaptiver Bitzuordnung und zum Ausgeben eines die Quantisierung anzeigenden Index als
den anderen Teil des Codes.
46. Kodiervorrichtung nach Anspruch 45, bei der die Spektralhüllkurvenschätzeinrichtung
Einrichtungen zum LPC-Analysieren der eindimensionalen Signalabtastwertfolge umfaßt, um die
Spektralhüllkurve zu schätzen.
47. Kodiervorrichtung nach Anspruch 45, bei der die Spektralhüllkurvenschätzeinrichtung
Einrichtungen zum Schätzen der Spektralhüllkurve aus den Frequenzbereichskoeffizienten umfaßt.
48. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiereinrichtung folgendes
aufweist:
eine LPC-Analyseeinrichtung zum LPC-Analysieren der eindimensionalen
Signalabtastwertfolge zum Erhalten prädiktiver Koeffizienten;
eine prädiktive Koeffizientenquantisierungseinrichtung zum Quantisieren der prädiktiven
Koeffizienten zum Erzeugen quantisierter prädiktiver Koeffizienten und zum Ausgeben eines die
Quantisierung anzeigenden Index als Teil des Codes;
eine mit den quantisierten prädiktiven Koeffizienten als Filterkoeffizienten belieferte
Umkehrfiltereinrichtung zum Umkehrfiltern der eindimensionalen Signalabtastwertfolge zur Erzeugung
einer Restabtastwertfolge;
eine Orthogonal-Transformationseinrichtung zur Orthogonal-Transformation der
Restabtastwertfolge zum Erzeugen von Restspektrum;
eine Spektralhüllkurvenschätzeinrichtung zum Schätzen einer Spektralhüllkurve aus den
quantisierten prädiktiven Koeffizienten; und
eine Quantisierungseinrichtung mit adaptiver Bitzuordnung zum Bestimmen einer
Bitzuordnung auf der Basis mindestens der Spektralhüllkurve zum Durchführen einer Quantisierung mit
adaptiver Bitzuordnung des Restspektrums und zum Ausgeben eines die Quantisierung anzeigenden
Index als den anderen Teil des Codes.
49. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiereinrichtung folgendes
aufweist:
eine LPC-Analyseeinrichtung zum LPC-Analysieren der eindimensionalen
Signalabtastwertfolge, um prädiktive Koeffizienten zu erhalten;
eine prädiktive Koeffizientenquantisierungseinrichtung zum Quantisieren der prädiktiven
Koeffizienten, um quantisierte prädiktive Koeffizienten zu erzeugen und zum Ausgeben eines die
Quantisierung anzeigenden Index als Teil des Codes;
eine mit den quantisierten prädiktiven Koeffizienten als Filterkoeffizienten belieferte
Umkehrfiltereinrichtung zum Umkehrfiltern der eindimensionalen Signalabtastwertfolge, um eine
Restabtastwertfolge zu erzeugen;
eine Orthogonal-Transformationseinrichtung zur Orthogonal-Transformation der
Restabtastwertfolge, um Restspektrumabtastwerte zu erzeugen;
eine Spektralhüllkurvenschätzeinrichtung zum Schätzen einer Spektralhüllkurve aus den
quantisierten prädiktiven Koeffizienten, und
eine gewichtete Vektorquantisierungseinrichtung zum Bestimmen von Gewichtungsfaktoren
auf der Basis mindestens der Spektralhüllkurve zum gewichteten Vektorquantisieren des
Restspektrums und zum Ausgeben eines die Quantisierung anzeigenden Index als den anderen Teil des
Codes.
50. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiereinrichtung eine
Einrichtung zum Kodieren der eindimensionalen Signalabtastwertfolge durch ADPCM ist.
51. Kodiervorrichtung nach Anspruch 50, bei der die Kodiereinrichtung folgendes aufweist:
eine Subtraktionseinrichtung zum Berechnen eines Prädiktionsfehlers eines prädiktiven
Wertes für jeden Abtastwert der eindimensionalen Signalabtastwertfolge;
eine adaptive Quantisierungseinrichtung zum adaptiven Quantisieren des
Prädiktionsfehlers und zum Ausgeben eines die Quantisierung anzeigenden Index als Teil des Codes;
eine Dekodiereinrichtung zum Dekodieren des Index, um den quantisierten
Prädiktionsfehler zu erhalten;
eine Additionseinrichtung zum Addieren des Prädiktionswertes zu dem quantisierten
Prädiktionsfehler, um einen quantisierten Abtastwert zu erzeugen; und
eine adaptive Prädiktionseinrichtung zum Erzeugen eines Prädiktionswertes für den
nächsten Abtastwert der eindimensionalen Signalabtastwertfolge auf der Basis des quantisierten
Abtastwertes.
52. Kodiervorrichtung nach Anspruch 38 oder 39, bei der die Kodiereinrichtung eine
Einrichtung zum Kodieren der eindimensionalen Signalabtastwertfolge durch CELP ist.
53. Kodiervorrichtung nach Anspruch 52, bei der die Kodiereinrichtung folgendes aufweist:
eine LPC-Analyseeinrichtung zum LPC-Analysieren der eindimensionalen
Signalabtastwertfolge für jeden Rahmen, um prädiktive Koeffizienten zu erhalten, und zum Ausgeben der
prädiktiven Koeffizienten als Teil des Codes;
ein adaptives Codebuch zum Halten eines Anregungsvektors des vorherigen Rahmens und
zum Erzeugen eines Anregungsvektors des laufenden Rahmens aus einem aus dem
Anregungsvektor des vorherigen Rahmens extrahierten Vektorsegment;
eine mit den prädiktiven Koeffizienten als Filterkoeffizienten belieferte
Synthesefiltereinrichtung zum Erzeugen einer synthetischen akustischen Signalabtastwertfolge aus dem
Anregungsvektor des laufenden Rahmens; und
eine Verzerrungsberechnungs/Codebuchsucheinrichtung zum Steuern der Länge des aus
dem Anregungsvektor des vorherigen Rahmens zu extrahierenden Vektorsegments auf solche
Weise, daß die Verzerrung zwischen der eindimensionalen Signalabtastwertfolge und der
synthetischen akustischen Signalabtastwertfolge minimiert wird, und zum Ausgeben eines die Länge des zu
extrahierenden Vektorsegments anzeigenden Index als den anderen Teil des Codes.
54. Kodiervorrichtung nach Anspruch 40, bei der das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt ist, das Kodieren für
jedes Frequenzband durchgeführt ist und eine Kombination der Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben ist.
55. Kodiervorrichtung nach Anspruch 45, bei der das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt ist, das Kodieren für
jedes Frequenzband durchgeführt ist und eine Kombination der Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben ist.
56. Kodiervorrichtung nach Anspruch 49, bei der das die Frequenzbereichskoeffizienten
abdeckende Frequenzband in eine Vielzahl von Frequenzbändern unterteilt ist, das Kodieren für
jedes Frequenzband durchgeführt ist und eine Kombination der Codes der Vielzahl von
Frequenzbändern entsprechend der Ausgabeumgebung des Codes wahlweise ausgegeben ist.
57. Kodiervorrichtung nach Anspruch 39, bei der die mehreren Kanäle zwei linke und
rechte Kanäle sind; die Leistungsentscheidungseinrichtung eine Einrichtung ist, die denjenigen der
linken und rechten Kanäle bestimmt, der die kleinere Leistung hat, die einer
Leistungskorrektureinrichtung dieses Kanals einen Ausgleichsfaktor gleich oder größer als 1 bereitstellt, und die als Teil
des Codes einen den Ausgleichsfaktor anzeigenden Index ausgibt; und die
Leistungskorrektureinrichtung eine Einrichtung ist, die die akustische Signalabtastwertfolge dieses Kanals mit dem
bereitgestellten Ausgleichsfaktor multipliziert.
58. Kodiervorrichtung nach Anspruch 57, bei der die Leistungsentscheidungseinrichtung
eine Einrichtung ist, durch die ein Leistungsverhältnis k zwischen dem linken und dem rechten Kanal
berechnet wird, und, wenn das Verhältnis gleich oder größer ist als 1, die akustische
Signalabtastwertfolge des Kanals mit der kleineren Leistung mit 8 = kr als Ausgleichsfaktor multipliziert wird, und,
wenn 0 < k < 1, die akustische Signalabtastwertfolge des Kanals der kleineren Leistung mit 1/g als
Ausgleichsfaktor multipliziert wird, wobei r eine durch 0 < r < 1 definierte Konstante ist.
59. Kodiervorrichtung nach Anspruch 57, bei der die Leistungsentscheidungseinrichtung
eine Einrichtung ist, die ein Leistungsverhältnis k zwischen dem linken und dem rechten Kanal
berechnet; entscheidet, zu welchem einer vorherbestimmten Vielzahl von Unterbereichen der Wert k
gehört, wobei die Vielzahl von Unterbereichen aus einem Bereich herausgeteilt sind, über den der
Wert k möglich gemacht ist; und die akustische Signalabtastwertfolge des Kanals mit der kleineren
Leistung mit derjenigen der vorherbestimmten für jeweilige Unterbereiche multipliziert, die dem
ent
schiedenen Unterbereich entspricht, und einen Code bereitstellt, der den entschiedenen
Unterbereich als einen den Ausgleichsfaktor anzeigenden Index anzeigt.
60. Dekodiervorrichtung zum Dekodieren eines Codes, der durch Verschachteln
akustischer Signalabtastwertfolgen mehrerer Kanäle zu einer eindimensionalen Signalabtastwertfolge
nach einer bestimmten Regel kodiert wurde, aufweisend:
eine Dekodiereinrichtung zum Dekodieren einer eingegebenen Codefolge zu einer
eindimensionalen Signalabtastwertfolge mit einem Dekodierverfahren entsprechend einem
Kodierverfahren unter Nutzung der Korrelation zwischen Abtastwerten von verschiedenen Kanälen; und
eine Umkehrverschachtelungseinrichtung zum Verteilen der eindimensionalen
Signalabtastwertfolge auf die mehreren Kanäle durch ein gegenüber dem der bestimmten Regel umgekehrtes
Verfahren, wodurch akustische Signalabtastwertfolgen der mehreren Kanäle erhalten werden.
61. Dekodiervorrichtung nach Anspruch 60, ferner aufweisend:
eine Leistungsindexdekodiereinrichtung zum Dekodieren eines eingegebenen
Leistungskorrekturindex, um einen Ausgleichsfaktor zu erhalten; und
eine Leistungsumkehrkorrektureinrichtung zum Korrigieren der akustischen
Signalabtastwertfolgen der mehreren Kanäle mittels des Ausgleichsfaktors, um eine Leistungsdifferenz zwischen
ihnen zu erhöhen, wodurch dekodierte akustische Signalabtastwertfolgen mehrerer Kanäle erhalten
werden.
62. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
eine Spektrumrestdekodiereinrichtung zum Dekodieren eines eingegebenen ersten
Quantisierungscodes, um einen Spektrumrest zu erhalten;
eine Spektralhüllkurvendekodiereinrichtung zum Dekodieren eines eingegebenen zweiten
Quantisierungscodes, um eine Spektralhüllkurve zu erhalten;
eine Entnormierungseinrichtung zum Multiplizieren des Spektrumrestes mit der
Spektralhüllkurve, um Frequenzbereichskoeffizienten zu erhalten; und
eine Orthogonal-Umkehrtransformationseinrichtung zum Durchführen einer Orthogonal-
Umkehrtransformation der Frequenzbereichskoeffizienten, um die eindimensionale
Signalabtastwertfolge in einem Zeitbereich zu erhalten.
63. Dekodiervorrichtung nach Anspruch 62, bei der die
Spektralhüllkurvendekodiereinrichtung eine LPC-Analyseeinrichtung zum Dekodieren des zweiten Quantisierungscodes aufweist, um
LPC-Koeffizienten zu erhalten, und eine Spektralhüllkurvenrecheneinrichtung zum Berechnen der
Spektralhüllkurve aus den LPC-Koeffizienten.
64. Dekodiervorrichtung nach Anspruch 62, bei der die Spektrumrestdekodiereinrichtung im
Schritt (a-1) eine Vektordekodiereinrichtung ist.
65. Dekodiervorrichtung nach Anspruch 63, bei der der erste Quantisierungscode einen
ersten und zweiten Index umfaßt und die Spektrumrestdekodiereinrichtung folgendes aufweist:
eine Feinstrukturkoeffizientendekodiereinrichtung zum Dekodieren des ersten Index, um
Spektrumfeinstrukturkoeffizienten wieder herzustellen;
eine Restkoeffizientenhüllkurvendekodiereinrichtung zum Dekodieren des zweiten Index,
um eine Restkoeffizientenhüllkurve zu erhalten; und
eine Entnormiereinrichtung zum Multiplizieren der Spektrumfeinstrukturkoeffizienten mit
der Restkoeffizientenhüllkurve, um den Spektrumrest zu erhalten.
66. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
eine Dekodiereinrichtung zum Erhalten von Frequenzbereichskoeffizienten durch
Dekodieren mit adaptiver Bitzuordnung aus einem eingegebenen ersten Quantisierungscode, der
quantisierte Frequenzbereichskoeffizienten anzeigt, und einem eingegebenen zweiten
Quantisierungscode, der eine quantisierte Spektralhüllkurve anzeigt; und
eine Orthogonal-Umkehrtransformationseinrichtung zum Durchführen einer Orthogonal-
Umkehrtransformation der Frequenzbereichskoeffizienten, um die eindimensionale
Signalabtastwertfolge zu erhalten.
67. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
eine prädiktive Koeffizientendekodiereinrichtung zum Erhalten von LPC-Koeffizienten durch
Dekodieren eines eingegebenen ersten Quantisierungscodes, der quantisierte LPC-Koeffizienten
anzeigt,
eine Spektralhüllkurvenschätzeinrichtung zum Schätzen einer Spektralhüllkurve aus den
LPC-Koeffizienten;
eine Dekodiereinrichtung mit adaptiver Bitzuordnung zum Erhalten eines
Restkoeffizientenspektrums durch Dekodierung mit adaptiver Bitzuordnung eines eingegebenen zweiten
Quantisierungscodes, der ein quantisiertes Restkoeffizientenspektrum anzeigt, durch Bitzuordnungen auf der
Basis der Spektralhüllkurve;
eine Orthogonal-Umkehrtransformationseinrichtung zum Durchführen einer Orthogonal-
Umkehrtransformation des Restkoeffizientenspektrums, um eine Anregungssignalabtastwertfolge zu
erhalten; und
eine Synthesefiltereinrichtung zum Erhalten der eindimensionalen Signalabtastwertfolge
durch Verarbeiten der Anregungssignalabtastwertfolge mit einem Synthesefilter unter Benutzung der
LPC-Koeffizienten als Filterkoeffizienten.
68. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
eine Vektordekodiereinrichtung zum Erhalten eines Spektralrestes durch Vektordekodieren
eines eingegebenen ersten Vektorquantisierungscodes, der vektorquantisierten Spektralrest anzeigt;
eine zweite Vektordekodiereinrichtung zum Erhalten einer Spektralhüllkurve durch
Vektordekodieren eines eingegebenen zweiten Vektorquantisierungscodes, der eine vektorquantisierte
Spektralhüllkurve anzeigt;
eine Umkehrnormiereinrichtung zum Erhalten von Frequenzbereichskoeffizienten durch
Multiplizieren des Spektralrestes und der Spektralhüllkurve für entsprechende Abtastwerte
derselben; und
eine Orthogonal-Umkehrtransformationseinrichtung zum Durchführen einer Orthogonal-
Umkehrtransformation der Frequenzbereichskoeffizienten, um die eindimensionale
Signalabtastwertfolge zu erhalten.
69. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
eine Dekodiereinrichtung zum Erhalten eines quantisierten Prädiktionsfehlers durch
Dekodieren eines eingegebenen Quantisierungscodes, der den quantisierten Prädiktionsfehler anzeigt;
eine adaptive Prädiktionseinrichtung zur adaptiven Prädiktion des laufenden Abtastwertes
aus dem vorherigen dekodierten Abtastwert; und
eine Additionseinrichtung zum Addieren des quantisierten Prädiktionsfehlers zu einer
vorhergesagten Version des Abtastwertes, um den laufenden dekodierten Abtastwert zu erhalten.
70. Dekodiervorrichtung nach Anspruch 60 oder 61, bei der die Dekodiereinrichtung
folgendes aufweist:
ein adaptives Codebuch zum Erzeugen eines Anregungsvektors des laufenden Rahmens
durch Extrahieren eines Segmentes aus einem Anregungsvektor des vorhergehenden Rahmens,
dessen Länge von einem eingegebenen Index bezeichnet ist, der die Segmentlänge des
Anregungsvektors anzeigt; und
eine mit eingegebenen LPC-Koeffizienten als Filterkoeffizienten belieferte
Synthesefiltereinrichtung zum Verarbeiten des Anregungsvektors des laufenden Rahmens, um die
eindimensionale Signalabtastwertfolge zu erhalten.
71. Dekodiervorrichtung nach Anspruch 62, ferner mit einer mit einem Satz der ersten und
zweiten Quantisierungscodes für jedes der vorherbestimmten Vielzahl von Frequenzbändern
belieferten Einrichtung zum Auswählen und Dekodieren des Satzes der Quantisierungscodes für ein
gewünschtes der Vielzahl von Frequenzbändern, um Frequenzbereichskoeffizienten des
ausgewählten Frequenzbandes zu erhalten.
72. Dekodiervorrichtung nach Anspruch 66, ferner mit einer mit einem Satz der ersten und
zweiten Quantisierungscodes für jedes der vorherbestimmten Vielzahl von Frequenzbändern
belieferten Einrichtung zum Auswählen und Dekodieren des Satzes der Quantisierungscodes für ein
gewünschtes der Vielzahl von Frequenzbändern, um Frequenzbereichskoeffizienten des
ausgewählten Frequenzbandes zu erhalten.
73. Dekodiervorrichtung nach Anspruch 68, ferner mit einer mit einem Satz der ersten und
zweiten Quantisierungscodes für jedes der vorherbestimmten Vielzahl von Frequenzbändern
belieferten Einrichtung zum Auswählen und Dekodieren des Satzes der Quantisierungscodes für ein
gewünschtes der Vielzahl von Frequenzbändern, um Frequenzbereichskoeffizienten des
ausgewählten Frequenzbandes zu erhalten.
74. Dekodiervorrichtung nach Anspruch 61, bei der die mehreren Kanäle zwei linke und
rechte Kanäle sind, der dekodierte Ausgleichsfaktor gleich oder größer als 1 ist und die
Leistungsumkehrkorrektureinrichtung eine Einrichtung ist, mittels der diejenige der akustischen
Signalabtastwertfolgen des linken und rechten Kanals mit der kleineren Leistung durch den Ausgleichsfaktor
dividiert wird, um dekodierte akustische Signalabtastwertfolgen der linken und rechten Kanäle zu
erhalten.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2233997 | 1997-02-05 | ||
JP19420497 | 1997-07-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69810361D1 DE69810361D1 (de) | 2003-02-06 |
DE69810361T2 true DE69810361T2 (de) | 2003-09-11 |
Family
ID=26359542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69810361T Expired - Lifetime DE69810361T2 (de) | 1997-02-05 | 1998-02-04 | Verfahren und Vorrichtung zur mehrkanaligen akustischen Signalkodierung und -dekodierung |
Country Status (3)
Country | Link |
---|---|
US (1) | US6345246B1 (de) |
EP (1) | EP0858067B1 (de) |
DE (1) | DE69810361T2 (de) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
JP3541680B2 (ja) * | 1998-06-15 | 2004-07-14 | 日本電気株式会社 | 音声音楽信号の符号化装置および復号装置 |
GB2345233A (en) * | 1998-10-23 | 2000-06-28 | John Robert Emmett | Encoding of multiple digital audio signals into a lesser number of bitstreams, e.g. for surround sound |
WO2001006509A1 (en) * | 1999-07-20 | 2001-01-25 | Koninklijke Philips Electronics N.V. | Record carrier carrying a stereo signal and a data signal |
JP4005359B2 (ja) * | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
SE519985C2 (sv) | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ATE288617T1 (de) | 2001-11-29 | 2005-02-15 | Coding Tech Ab | Wiederherstellung von hochfrequenzkomponenten |
WO2003046889A1 (en) * | 2001-11-30 | 2003-06-05 | Koninklijke Philips Electronics N.V. | Signal coding |
US20030216921A1 (en) * | 2002-05-16 | 2003-11-20 | Jianghua Bao | Method and system for limited domain text to speech (TTS) processing |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7949057B2 (en) * | 2003-10-23 | 2011-05-24 | Panasonic Corporation | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof |
JP4555299B2 (ja) * | 2004-09-28 | 2010-09-29 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
DE602005016130D1 (de) * | 2004-09-30 | 2009-10-01 | Panasonic Corp | Einrichtung für skalierbare codierung, einrichtung für skalierbare decodierung und verfahren dafür |
EP1801785A4 (de) * | 2004-10-13 | 2010-01-20 | Panasonic Corp | Skalierbarer codierer, skalierbarer decodierer und skalierbares codierungsverfahren |
CN101044553B (zh) * | 2004-10-28 | 2011-06-01 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置及其方法 |
KR20070090217A (ko) * | 2004-12-28 | 2007-09-05 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치 및 스케일러블 부호화 방법 |
EP1872364B1 (de) * | 2005-03-30 | 2010-11-24 | Nokia Corporation | Quellencodierung und/oder -decodierung |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8296134B2 (en) * | 2005-05-13 | 2012-10-23 | Panasonic Corporation | Audio encoding apparatus and spectrum modifying method |
RU2008114382A (ru) | 2005-10-14 | 2009-10-20 | Панасоник Корпорэйшн (Jp) | Кодер с преобразованием и способ кодирования с преобразованием |
JPWO2007116809A1 (ja) * | 2006-03-31 | 2009-08-20 | パナソニック株式会社 | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
US8442836B2 (en) * | 2008-01-31 | 2013-05-14 | Agency For Science, Technology And Research | Method and device of bitrate distribution/truncation for scalable audio coding |
US8630848B2 (en) * | 2008-05-30 | 2014-01-14 | Digital Rise Technology Co., Ltd. | Audio signal transient detection |
US8924220B2 (en) * | 2009-10-20 | 2014-12-30 | Lenovo Innovations Limited (Hong Kong) | Multiband compressor |
BE1019445A3 (fr) * | 2010-08-11 | 2012-07-03 | Reza Yves | Procede d'extraction d'information audio. |
FR3049084B1 (fr) * | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
CN107895580B (zh) * | 2016-09-30 | 2021-06-01 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
CN109102799B (zh) * | 2018-08-17 | 2023-01-24 | 信阳师范学院 | 一种基于频域系数对数和的语音端点检测方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4039948A (en) | 1974-06-19 | 1977-08-02 | Boxall Frank S | Multi-channel differential pulse code modulation system |
US4521907A (en) * | 1982-05-25 | 1985-06-04 | American Microsystems, Incorporated | Multiplier/adder circuit |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
JPH06332499A (ja) | 1993-05-24 | 1994-12-02 | Sharp Corp | ステレオ音声符号化装置 |
JP3199142B2 (ja) | 1993-09-22 | 2001-08-13 | 日本電信電話株式会社 | 音声の励振信号符号化方法および装置 |
US5673291A (en) * | 1994-09-14 | 1997-09-30 | Ericsson Inc. | Simultaneous demodulation and decoding of a digitally modulated radio signal using known symbols |
JP3087814B2 (ja) | 1994-03-17 | 2000-09-11 | 日本電信電話株式会社 | 音響信号変換符号化装置および復号化装置 |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
US5734724A (en) | 1995-03-01 | 1998-03-31 | Nippon Telegraph And Telephone Corporation | Audio communication control unit |
US5706392A (en) * | 1995-06-01 | 1998-01-06 | Rutgers, The State University Of New Jersey | Perceptual speech coder and method |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5799272A (en) * | 1996-07-01 | 1998-08-25 | Ess Technology, Inc. | Switched multiple sequence excitation model for low bit rate speech compression |
KR100265112B1 (ko) * | 1997-03-31 | 2000-10-02 | 윤종용 | 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법 |
-
1998
- 1998-02-03 US US09/018,042 patent/US6345246B1/en not_active Expired - Lifetime
- 1998-02-04 DE DE69810361T patent/DE69810361T2/de not_active Expired - Lifetime
- 1998-02-04 EP EP98101892A patent/EP0858067B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6345246B1 (en) | 2002-02-05 |
EP0858067A2 (de) | 1998-08-12 |
DE69810361D1 (de) | 2003-02-06 |
EP0858067B1 (de) | 2003-01-02 |
EP0858067A3 (de) | 1999-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69810361T2 (de) | Verfahren und Vorrichtung zur mehrkanaligen akustischen Signalkodierung und -dekodierung | |
DE69915400T2 (de) | Vorrichtung zur Kodierung und Dekodierung von Audiosignalen | |
DE69531471T2 (de) | Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung | |
DE69518452T2 (de) | Verfahren für die Transformationskodierung akustischer Signale | |
DE19811039B4 (de) | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen | |
EP2022043B1 (de) | Informationssignalcodierung | |
DE69724126T2 (de) | Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer | |
DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
DE4320990B4 (de) | Verfahren zur Redundanzreduktion | |
DE69431622T2 (de) | Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren | |
DE69932460T2 (de) | Sprachkodierer/dekodierer | |
DE69317958T2 (de) | Kodierer von Audiosignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken | |
DE3710664C2 (de) | ||
DE60308567T2 (de) | Dekodierungsgerät, Kodierungsgerät, Dekodierungsverfahren und Kodierungsverfahren | |
DE69832358T2 (de) | Verfahren zur Sprachkodierung und -dekodierung | |
DE69826529T2 (de) | Schnelle datenrahmen-optimierung in einem audio-kodierer | |
DE69426860T2 (de) | Sprachcodierer und Verfahren zum Suchen von Codebüchern | |
DE69121411T2 (de) | Methode und gerät zur codierung von analogen signalen | |
DE60017825T2 (de) | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür | |
DE69015105T2 (de) | Kompressionseinrichtung für transformiertes, digitales Audiosignal mit adaptiver Quantisierung auf Grund eines psycho-akustischen Kriteriums. | |
EP0962015B1 (de) | Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen | |
DE69420682T2 (de) | Sprachdekodierer | |
DE69708191T2 (de) | Vorrichtung zur Signalkodierung | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE68913691T2 (de) | System zur Sprachcodierung und -decodierung. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |