JP3636094B2 - 信号符号化装置及び方法、並びに信号復号装置及び方法 - Google Patents
信号符号化装置及び方法、並びに信号復号装置及び方法 Download PDFInfo
- Publication number
- JP3636094B2 JP3636094B2 JP2001136487A JP2001136487A JP3636094B2 JP 3636094 B2 JP3636094 B2 JP 3636094B2 JP 2001136487 A JP2001136487 A JP 2001136487A JP 2001136487 A JP2001136487 A JP 2001136487A JP 3636094 B2 JP3636094 B2 JP 3636094B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- bit allocation
- allocation information
- signal
- orthogonal transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013139 quantization Methods 0.000 claims abstract description 186
- 238000006243 chemical reaction Methods 0.000 claims description 80
- 239000013598 vector Substances 0.000 claims description 77
- 230000009466 transformation Effects 0.000 claims description 18
- 230000001131 transforming effect Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 13
- 238000010606 normalization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000002087 whitening effect Effects 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化装置及びその方法、並びに符号化された直交変換係数を復号する信号復号装置及びその方法に関する。
【0002】
【従来の技術】
従来において、オーディオ信号(音声信号や音楽信号を含む)の時間領域や周波数領域における統計的性質と人間の聴覚上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法としては、大別して時間領域での符号化、周波数領域での符号化、分析合成符号化等が挙げられる。
【0003】
ところで、時間軸の入力信号を周波数軸の信号に直交変換して符号化を行う変換符号化において、低レート化を目的として、入力信号に応じたダイナミックなビット割当を行い、周波数軸上の係数データの量子化を行うことが提案されているが、このビット割当の計算が煩雑であり、特に周波数軸上の係数データを幾つかずつ区切ってサブベクトルとしてベクトル量子化するような場合に、各係数毎のビット配分が変化すると、量子化のためのビット割当の計算が煩雑である。
【0004】
また、直交変換の変換単位となるフレーム毎にビット割当が極端に変化するような場合には、再生音が不安定になりやすいという欠点がある。
【0005】
このため、本件出願人は、先に特開平12−132194号公報(以下、従来技術という。)において、直交変換を伴う符号化の際に入力信号に応じたダイナミックなビット割当を行いながらも、ビット割当の計算が簡単に行え、また、フレーム間でビット割当が大きく変化しても再生音が不安定とならないような信号符号化装置及び方法、並びに信号復号装置及び方法を提案している。
【0006】
この従来技術においては、時間軸上の入力信号に対して直交変換を用いて符号化を行う際に、入力信号に応じて重みを算出し、この重みの順に従って、直交変換されて得られた係数データに順位をつけ、この順位に従って精度の高い量子化を行っているため、入力信号に応じてダイナミックにビット割当を行っても、各係数に割り当てるビット数の計算が簡単で済む。
【0007】
また、ビット割当を計算するためのパラメータを予め規定し、これらのパラメータをデコーダ側に送ることにより、ビット割当の情報自体をデコーダ側に送る必要がなくなり、付加情報の低減が図れ、ビットレートの低下が実現できる。
【0008】
【発明が解決しようとする課題】
ところで、上述した従来技術では、符号化装置と復号装置とでバンド別ビット割当の計算結果が全く同一である必要があるため、双方でこの計算のための演算精度を厳密に合わせなければならない。
【0009】
しかし、例えば、固定小数点演算を行うDSP(Digital Signal Processor)で実装された符号化装置で符号化されたものを、パーソナルコンピュータ等で実装された復号装置で復号する場合、復号装置で浮動小数点演算を用いると、全く同じLSPコードブックを参照し同一のコードワードを入力しているのにも関わらず、符号化装置と復号装置とで演算誤差に起因するバンド別ビット割当の食い違いが起こる結果となる。従って、この場合、DSPと同様の固定小数点演算をパーソナルコンピュータ上で実現する等により精度合わせをし、誤差をなくす必要がある。
【0010】
しかしながら、一般的な40ビットのアキュムレータを持つ固定小数点DSPで行う演算を、通常の32ビットプロセッサを搭載したパーソナルコンピュータで実現する場合は、プロセッサのビット幅の制約等から、同じ計算を浮動小数点演算で行うよりも極端に演算量が多くなってしまう等の問題点があった。
【0011】
本発明は、このような従来の実情に鑑みて提案されたものであり、符号化側と復号側とでバンド別ビット割当の計算結果を全く同一とする信号符号化装置及び方法、並びに信号復号装置及び方法を提供することを目的とする。
【0016】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る信号符号化装置は、時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化装置であって、上記入力信号に基づく信号を直交変換する直交変換手段と、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化手段と、上記パラメータ量子化手段によって量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化手段によるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照手段と、上記直交変換手段により得られた直交変換係数を上記テーブル参照手段により求めた上記ビット割当情報に基づいてビット割当量子化する量子化手段とを備え、上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めることを特徴としている。
【0017】
このような信号符号化装置は、コードブックを参照してN段のマルチステージベクトル量子化で量子化されたパラメータに基づいてビット割当情報を求める際に、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、パラメータ量子化手段によるM(M≦N)段目までの量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求め、入力信号に基づく信号を直交変換して得られた直交変換係数をビット割当情報に基づいてビット割当量子化する。特に、上記変換が非線形である場合、テーブル参照手段は、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求める。
【0018】
また、上述した目的を達成するために、本発明に係る信号符号化方法は、時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化方法であって、上記入力信号に基づく信号を直交変換する直交変換工程と、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化工程と、上記パラメータ量子化工程にて量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化工程におけるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照工程と、上記直交変換工程で得られた直交変換係数を上記テーブル参照工程にて求めた上記ビット割当情報に基づいてビット割当量子化する量子化工程とを有し、上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めることを特徴としている。
【0019】
このような信号符号化方法は、コードブックを参照してN段のマルチステージベクトル量子化で量子化されたパラメータに基づいてビット割当情報を求める際に、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、パラメータ量子化工程におけるM(M≦N)段目までの量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求め、入力信号に基づく信号を直交変換して得られた直交変換係数をビット割当情報に基づいてビット割当量子化する。特に、上記変換が非線形である場合、テーブル参照工程では、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求める。
【0024】
また、上述した目的を達成するために、本発明に係る信号復号装置は、時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とが入力される信号復号装置であって、N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照手段と、上記テーブル参照手段によって生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化手段と、上記逆量子化手段によって逆量子化された上記直交変換係数を逆直交変換する逆直交変換手段とを備え、上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成することを特徴としている。
【0025】
このような信号復号装置は、信号符号化装置から少なくともパラメータの量子化出力のインデックスと符号化された直交変換係数とを入力し、N段目までのインデックスのうち、M(M≦N)段目までのインデックスに基づいてテーブルを参照することによりビット割当情報を生成し、生成されたビット割当情報に基づいて直交変換係数を逆量子化し、逆量子化された直交変換係数を逆直交変換する。特に、上記変換が非線形である場合、テーブル参照手段は、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を生成する。
【0026】
また、上述した目的を達成するために、本発明に係る信号復号方法は、時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とを入力し、上記インデックスに基づいて上記直交変換係数を復号する信号復号方法であって、N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照工程と、上記テーブル参照工程にて生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化工程と、上記逆量子化工程にて逆量子化された上記直交変換係数を逆直交変換する逆直交変換工程とを有し、上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成することを特徴としている。
【0027】
このような信号復号方法は、信号符号化装置から少なくともパラメータの量子化出力のインデックスと符号化された直交変換係数とを入力し、N段目までのインデックスのうち、M(M≦N)段目までのインデックスに基づいてテーブルを参照することによりビット割当情報を生成し、生成されたビット割当情報に基づいて直交変換係数を逆量子化し、逆量子化された直交変換係数を逆直交変換する。特に、上記変換が非線形である場合、テーブル参照工程では、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を生成する。
【0028】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態では、マルチステージベクトル量子化によりLSP係数の量子化を行い、量子化されたLSP係数からパラメータ変換によってバンド別のビット割当情報を求める本発明の説明に供する信号処理装置について説明し、併せて、本発明が適用された信号符号化装置、信号復号装置について説明する。なお、以下では簡単のため、信号処理装置では3段のマルチステージベクトル量子化が行われるものとして説明するが、N段(Nは1以上の整数)のマルチステージベクトル量子化について適用できるのは勿論である。
【0029】
先ず、本発明の説明に供する信号処理装置の説明をする前に、従来の信号処理装置について説明する。従来の信号処理装置は、図1にその概略構成を示すように、量子化器101乃至103と、パラメータ変換部104と、減算器105,106と、加算器107,108とを備える。
【0030】
入力された第1のパラメータであるLSP係数は、量子化器101で量子化され、量子化出力c1が出力される。入力LSP係数から量子化出力c1が減算器105にて減算され、この量子化誤差が量子化器102で量子化される。
【0031】
同様にして、量子化器102の入力値から量子化出力c2が減算器106にて減算され、この量子化誤差が量子化器103で量子化される。
【0032】
量子化出力c1,c2,c3は、加算器107,108にて加算され、量子化済LSPとなる。また、量子化済LSPは、パラメータ変換部104においてパラメータ変換関数Fにより第2のパラメータであるバンド別ビット割当情報dに変換される。
【0033】
各量子化ステージ毎のLSPインデックスn1,n2,n3は、デコーダ側に供給される。
【0034】
デコーダ側は、図2にその概略構成を示すように、逆量子化器111乃至113と、パラメータ変換部114と、加算器115,116とを備える。
【0035】
逆量子化器111乃至113には、それぞれエンコーダ側から供給されたLSPインデックスn1,n2,n3が入力され、逆量子化済出力c1,c2,c3が出力される。逆量子化出力c1,c2,c3は、加算器115,116で加算され、逆量子化済LSPとなる。また、逆量子化済LSPは、パラメータ変換部114においてパラメータ変換関数によりバンド別ビット割当情報dに変換される。
【0036】
ここで、パラメータ変換部104,114は、図3のような処理を行うことによりバンド別ビット割当情報dを算出している。先ずステップS10において、LSP係数がLPC(Linear Predictive Coding)係数に変換される。次にステップS11において、周波数応答が算出され、続くステップS12において、ビット割当情報が算出される。
【0037】
なお、上述の説明では、3段の量子化結果を用いてパラメータ変換を行ったが、1段目の量子化済出力c1のみを用いて十分に量子化LSPが近似される場合には、1段目の量子化済出力c1のみをパラメータ変換するようにしてもよい。
【0038】
以下、この場合における信号処理装置の回路構成を図4に示す。図4に示すように、入力されたLSP係数は、量子化器101で量子化され、量子化出力c1が出力される。1段階目の量子化誤差は、量子化器102で量子化され、2段階目の量子化誤差は、量子化器103で量子化される。量子化出力c1,c2,c3は、加算器107,108にて加算され、量子化済LSPとなる。
【0039】
ここで、量子化出力c1は、パラメータ変換部104においてパラメータ変換関数Fによりバンド別ビット割当情報dに変換される。また、各量子化ステージ毎のLSPインデックスn1,n2,n3は、デコーダ側に供給される。
【0040】
デコーダ側では、図5に示すように、逆量子化器111乃至113にそれぞれエンコーダ側から供給されたLSPインデックスn1,n2,n3が入力され、逆量子化済出力c1,c2,c3が出力される。逆量子化出力c1,c2,c3は、加算器115,116で加算され、逆量子化済LSPとなる。また、逆量子化出力c1は、パラメータ変換部114においてパラメータ変換関数によりバンド別ビット割当情報dに変換される。
【0041】
次に、上述した信号処理装置が適用された信号符号化装置を図6に示す。この信号符号化装置は、本件出願人が先に出願した特開平12−132194号公報における信号符号化装置と同様の構成である。
【0042】
図6において、入力端子200には、例えば、0〜8kHz程度のいわゆる広帯域音声信号をサンプリング周波数Fs=16kHzでA/D変換したディジタルオーディオ信号が供給されている。この入力信号は、正規化(白色化)回路部201のLPC逆フィルタ202に送られると共に、例えば1024サンプルずつ切り出され、LPC分析・量子化部220に送られている。このLPC分析・量子化部220では、ハミング窓掛けをした上で、20次程度のLPC係数、すなわちαパラメータを算出し、LPC逆フィルタ202によりLPC残差を求めている。このLPC分析の際には、分析の単位となる1フレーム1024サンプルのうちの一部サンプル、例えば1/2の512サンプルを次のブロックとオーバーラップさせており、フレームインターバルは512サンプルとなっている。これは、後段の直交変換として採用されているMDCT(改良離散コサイン変換)のエリアシングキャンセレーションを利用するためである。このLPC分析・量子化部220では、LPC係数であるαパラメータをLSPパラメータに変換して量子化したものを伝送するようにしている。
【0043】
LPC分析回路222からのαパラメータは、α→LSP変換回路223に送られて、LSPパラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば20個、すなわち10対のLSPパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このLSPパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【0044】
α→LSP変換回路223からのLSPパラメータは、LSP量子化器224によりベクトル量子化される。このとき、フレーム間差分をとってからベクトル量子化してもよい。なお、このLSP量子化器224が上述したエンコーダ側の信号処理装置に相当する。但し、信号処理装置のうちパラメータ変換部は、後述するLSP→α変換回路228及びビット割当算出回路(ビットアロケーション決定回路)231に相当する。
【0045】
このLSP量子化器224からの量子化出力、すなわちLSPベクトル量子化のインデクスは、端子221を介して取り出され、また量子化済みのLSPベクトルあるいは逆量子化出力は、LSP補間回路226及びLSP→α変換回路228に送られる。
【0046】
LSP補間回路226は、LSP量子化器224で上記フレーム毎にベクトル量子化されたLSPのベクトルの前フレームと現フレームとの組を補間し、後の処理で必要となるレートにするためのものであり、この例では、8倍のレートに補間している。
【0047】
このような補間が行われたLSPベクトルを用いて入力音声の逆フィルタリングを実行するために、LSP→α変換回路227により、LSPパラメータを例えば20次程度の直接型フィルタの係数であるαパラメータに変換する。このLSP→α変換回路227からの出力は、上記LPC残差を求めるためのLPC逆フィルタ回路202に送られ、このLPC逆フィルタ202では、8倍のレートで更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。
【0048】
また、LSP量子化回路224からの1倍レートのLSP係数は、LSP→α変換回路228に送られてαパラメータに変換され、ビット割当を行わせるためのビット割当算出回路231に送られる。ビット割当算出回路231では、割当ビットの他に、後述するMDCT係数の量子化に使用する重みw(ω) の計算も行っている。
【0049】
正規化(白色化)回路部201のLPC逆フィルタ202からの出力は、長期予測であるピッチ予測のためのピッチ逆フィルタ203及びピッチ分析回路205に送られる。
【0050】
長期予測は、ピッチ分析により求められたピッチ周期あるいはピッチラグ分だけ時間軸上でずらした波形を元の波形から減算してピッチ予測残差を求めることにより行っており、この例では3点ピッチ予測によって行っている。なお、ピッチラグとは、サンプリングされた時間軸データのピッチ周期に対応するサンプル数のことである。
【0051】
すなわち、ピッチ分析回路205では1フレームに1回の割合、すなわち分析長が1フレームでピッチ分析が行われ、ピッチ分析結果のうちのピッチラグはピッチ逆フィルタ203及びビット割当算出回路231に送られ、ピッチゲインはピッチゲイン量子化器206に送られる。また、ピッチ分析回路205からのピッチラグインデクスは端子242から取り出されてデコーダ側に送られる。
【0052】
ピッチゲイン量子化器206では、上記3点予測に対応する3点でのピッチゲインがベクトル量子化され、コードブックインデクス(ピッチゲインインデクス)が出力端子243より取り出され、代表値ベクトルあるいは逆量子化出力がピッチ逆フィルタ203に送られる。ピッチ逆フィルタ203は、上記ピッチ分析結果に基づいて3点ピッチ予測されたピッチ予測残差を出力する。このピッチ予測残差は、割り算回路204及びエンベロープ抽出回路207にそれぞれ送られている。
【0053】
さらに、信号符号化装置は、正規化(白色化)回路部201において、フレーム内データのゲインの平滑化を行っている。これは、ピッチ逆フィルタ203からエンベロープ抽出回路207によりエンベロープを抽出し、抽出されたエンベロープを、スイッチ209を介してエンベロープ量子化器210に送り、量子化されたエンベロープの値によりピッチ逆フィルタ203からの残差を割り算器204で割り込むことにより、時間軸で平滑化された信号を得ている。この割り算器204からの信号が、正規化(白色化)回路部201の出力として、次段の直交変換回路部215に送られる。
【0054】
この平滑化により、量子化後の直交変換係数を時間信号に逆変換したときの量子化誤差の大きさをオリジナル信号のエンベロープに追従させる、いわゆるノイズシェイピングが実現できる。
【0055】
エンベロープ抽出回路207では、エンベロープ抽出回路207に供給される信号、すなわち上記LPC逆フィルタ202及びピッチ逆フィルタ203により正規化処理された残差信号を、x(n),n=0〜N−1(Nは上記1フレームFRのサンプル数、直交変換窓長、例えばN=1024)とするとき、この変換窓長Nより短い長さM、例えばM=N/8の窓で切り出された各サブブロックあるいはサブフレーム毎のrms(二乗平均の平方根)値をエンベロープとしている。エンベロープ量子化器210では、i番目のサブブロック(i=0〜M−1)のrmsiを1つのベクトルとしてベクトル量子化を行っており、そのインデックスが時間軸ゲインコントロールのためのパラメータ、すなわちエンベロープインデックスとして端子211より取り出され、デコーダ側に伝送される。
【0056】
ゲインコントロールを行うか否かの判別は、ゲインコントロールオン/オフ決定回路208により行われ、その判別出力(ゲインコントロールSW)は、エンベロープ量子化器210の入力側のスイッチ209のスイッチング制御信号として送られるとともに、後述する係数量子化部230内の係数量子化回路235に送られて、ゲインコントロールがオンのときとオフのときの係数の割当ビット数の切り換えに使用される。また、このゲインコントロールオン/オフ判別出力(ゲインコントロールSW)は、端子212を介して取り出され、デコーダ側に送られる。
【0057】
割り算器204でゲインコントロール(あるいはゲイン圧縮)されて時間軸で平滑化された信号xs(n) は、正規化回路部201の出力として、直交変換回路部215に送られ、例えばMDCTにより周波数軸パラメータ(係数データ)に変換される。この直交変換回路部215は、窓掛け回路216とMDCT回路217とからなる。窓掛け回路216では、1/2フレームオーバーラップによるMDCTのエリアシングキャンセレーションが利用できるような窓関数による窓掛けが施される。
【0058】
直交変換回路部215のMDCT回路217でMDCT処理されて得られたMDCT係数データは、係数量子化部230のフレームゲイン正規化回路233及びフレームゲイン算出・量子化回路237に送られる。本実施の形態の係数量子化部230では、先ず上記MDCT変換ブロックである1フレームの係数全体のフレームゲイン(ブロックゲイン)を算出してゲイン正規化を行った後、さらに聴覚に合わせて高域ほどバンド幅を広くしたサブバンドである臨界帯域(クリティカルバンド)に分割して、それぞれのバンド毎のスケールファクタ、いわゆるバークスケールファクタを算出し、これによって再び正規化を行っている。上記バークスケールファクタとしては、各帯域毎にその帯域内の係数のピーク値や、あるいは二乗平均の平方根(rms)等を用いることができ、各バンドのバークスケールファクタはまとめてベクトル量子化される。
【0059】
すなわち、係数量子化部230のフレームゲイン算出・量子化回路237では、上記MDCT変換ブロックであるフレーム毎のゲインが算出されて量子化され、そのコードブックインデクス(フレームゲインインデクス)が端子245を介して取り出されてデコーダ側に送られると共に、量子化された値のフレームゲインがフレームゲイン正規化回路233に送られて、入力をフレームゲインで割ることによる正規化が行われる。このフレームゲインで正規化された出力は、バークスケールファクタ算出・量子化回路232及びバークスケールファクタ正規化回路234に送られる。
【0060】
バークスケールファクタ算出・量子化回路232では、上記各臨界帯域毎のバークスケールファクタが算出されて量子化され、コードブックインデクス(バークスケールファクタインデクス)が端子244を介して取り出されてデコーダ側に送られると共に、量子化された値のバークスケールファクタがビット割当算出回路231及びバークスケールファクタ正規化回路234に送られる。バークスケールファクタ正規化回路234では、上記臨界帯域毎に帯域内の係数の正規化が行われ、バークスケールファクタで正規化された係数が係数量子化回路235に送られる。
【0061】
係数量子化回路235では、ビット割当算出回路231からのビット割当情報に従って各係数に量子化ビット数が割り当てられて量子化が行われ、このとき、上述したゲインコントロールオン/オフ決定回路208からのゲインコントロールSW情報に応じて全体の割当ビット数の切り換えが行われる。これは、例えばベクトル量子化を行う場合には、上記ゲインコントロールオン時用と、オフ時用との2組のコードブックを用意しておき、上記ゲインコントロールSW情報に応じてこれらのコードブックを切り換えるようにすればよい。係数量子化回路235で量子化された係数インデクスは、端子241を介して取り出されてデコーダ側に送られる。
【0062】
信号符号化装置は、以上のような構成により入力した信号を符号化する。続いて、信号符号化装置(エンコーダ側)に対応する信号復号装置(デコーダ側)の構成の一例を図7に示す。
【0063】
図7において、各入力端子250〜257には上記図6の各出力端子からのデータが供給されており、図7の入力端子250には、上記図6の出力端子241からの直交変換係数(例えばMDCT係数)のインデクスが供給されている。入力端子251には、図6の出力端子221からのLSPインデクスが供給され、入力端子252〜255には、図6の各出力端子242〜245からのデータ、すなわち、ピッチラグインデクス、ピッチゲインインデクス、バークスケールファクタインデクス、フレームゲインインデクスがそれぞれ供給され、入力端子256、257には、図6の各出力端子211、212からのエンベロープインデクス、ゲインコントロールSWがそれぞれ供給されている。
【0064】
入力端子250からの係数インデクスは、係数逆量子化回路261で逆量子化され、掛け算器263を介して、例えばIMDCT(逆MDCT)等の逆直交変換回路264に送られる。
【0065】
入力端子251からのLSPインデクスは、LPCパラメータ再生部270の逆量子化器271に送られてLSPデータに逆量子化され、LSP→α変換回路272及びLSP補間回路273に送られる。LSP→α変換回路272からのαパラメータ(LPC係数)は、ビット割当回路262に送られる。LSP補間回路273からのLSPデータは、LSP→α変換回路274でαパラメータ(LPC係数)に変換され、後述するLPC合成回路267に送られる。
【0066】
ビット割当回路262には、LSP→α変換回路272からの上記LPC係数の他に、入力端子252からのピッチラグと、入力端子253から逆量子化器281を介して得られたピッチゲインと、入力端子254から逆量子化器282を介して得られたバークスケールファクタとが供給されており、これらのパラメータのみに基づいて、エンコーダ側と同一のビット割当を再現することができる。ビット割当回路262からのビット割当情報は、係数逆量子化器261に送られて、各係数の量子化割当ビットの決定に使用される。
【0067】
入力端子255からのフレームゲインインデクスは、フレームゲイン逆量子化器276に送られて逆量子化され、得られたフレームゲインが掛け算器263に送られる。
【0068】
入力端子256からのエンベロープインデクスは、スイッチ277を介してエンベロープ逆量子化器278に送られて逆量子化され、得られたエンベロープデータがオーバーラップ加算回路265に送られる。また、入力端子257からのゲインコントロールSW情報は、上記係数逆量子化器261及びオーバーラップ加算回路265に送られると共に、スイッチ277の制御信号として用いられる。逆量子化器271は、上述したようなゲインコントロールのオン/オフに応じて、全体の割当ビット数を切り換えており、逆ベクトル量子化の場合には、ゲインコントロールのオン時のコードブックとオフ時のコードブックとを切り換えるようにしてもよい。
【0069】
オーバラップ加算回路265は、IMDCT等の逆直交変換回路264からの上記フレーム毎に時間軸に戻された信号を、1/2フレームずつオーバーラップさせながら加算するものであり、ゲインコントロールのオン時には、上記エンベロープ逆量子化器278からのエンベロープデータによるゲインコントロール(上述したゲイン伸長あるいはゲイン復元)処理しながらオーバーラップ加算する。
【0070】
オーバラップ加算回路265からの時間軸信号は、ピッチ合成回路266に送られて、ピッチ成分が復元される。これは、図6のピッチ逆フィルタ203での処理の逆処理に相当するものであり、端子252からのピッチラグ及び逆量子化器281からのピッチゲインが用いられる。
【0071】
ピッチ合成回路266からの出力は、LPC合成回路267に送られて、図6のLPC逆フィルタ202での処理の逆の処理に対応するLPC合成処理が施され、出力端子268より取り出される。
【0072】
信号復号装置は、以上のような構成により、エンコーダ側から入力した信号を復号する。
【0073】
ところで、前述したように、信号処理装置においては、エンコーダとデコーダとでバンド別ビット割当の計算結果が全く同一である必要があるため、双方でこの計算のための演算精度を厳密に合わせなければならない。
【0074】
しかし、例えば、固定小数点演算を行うDSP(Digital Signal Processor)で実装されたエンコーダでエンコードされたものを、パーソナルコンピュータ等で実装されたデコーダでデコードする場合、デコーダで浮動小数点演算を用いると、全く同じLSPコードブックを参照し同一のコードワードを入力しているのにも関わらず、エンコーダとデコーダとで演算誤差に起因する量子化重みの食い違いが起こる結果となる。従って、この場合、DSPと同様の固定小数点演算をパーソナルコンピュータ上で実現する等により精度合わせをし、誤差をなくす必要があり、演算量が極端に増加するという問題があった。
【0075】
すなわち、コードブックをC、Cのコードベクトルをcとし、cを入力として目的のパラメータdに変換する関数をFとすると、
F(c)=d
であるが、Fと数学的に等価な関数F’で計算をすると、
F’(c)=d+δ
のように誤差δを含む結果を出力することになる。このとき、あるプロセッサでFにより変換する場合と比べて、別のプロセッサで誤差のない完全に同値な計算をしようとすると演算量の極端な増加という問題が生じる。
【0076】
そこで、本実施の形態における信号処理装置は、コードブックCに含まれる全てのコードベクトルについて予めF(c)の計算をしておき、その結果dを別のコードブックに蓄積しておく。そして、符号化の際には、コードブックCの量子化インデックスでコードブックDのコードベクトルを引くことにより、cからdへのパラメータの変換を行う。また、復号の際にも、コードブックCの量子化インデックスでコードブックDのコードベクトルを引くことにより、cからdへのパラメータの変換を行う。
【0077】
この手法をマルチステージベクトル量子化において適用する場合、例えば各段8ビットで3段のマルチステージベクトル量子化では、出力されるコードベクトルは、28*3(=16777216)通りの組み合わせが存在するため、この全ての組み合わせについてコードベクトルの変換を行う必要がある。しかし、これは、コードブックの記憶量が膨大となってしまい、現実的ではない。
【0078】
ここで、一般的なN段のマルチステージベクトル量子化の量子化出力cは、以下の式(1)に示すように、各段のコードブックのコードベクトルciの線形和で表現される。
【0079】
【数1】
【0080】
従って、パラメータの変換を行う関数Fが線形であれば、以下の式(2)が成り立つ。
【0081】
【数2】
【0082】
このため、各段それぞれのコードブックCiをFで変換してコードブックDiを作成しておき、i段目のインデックスでコードブックDiを引いたdiの線形和をとれば、変換先のパラメータを得ることが可能である。なお、マルチステージベクトル量子化に限らず、複数のコードブックを持ち量子化結果を各コードブックのコードベクトルの線形和として出力するようなベクトル量子化についても適用可能である。
【0083】
ここで、一般的なマルチステージベクトル量子化では、前段の量子化誤差を後段の量子化器が量子化する構造になっているため、上述した式(2)を以下の式(3)のようにM段目までの量子化結果を用いることにより近似することが可能である。
【0084】
【数3】
【0085】
しかし、前述したパラメータ変換関数Fは、非線形であるため、上述した式(2)に基づいてコードブックDを作成することができない。この場合は、上述した式(3)においてMを1とし、以下の式(4)に基づいてコードブックDを作成する。
【0086】
【数4】
【0087】
このように、1段目の量子化結果のみを用いて量子化結果cが十分近似される場合には、パラメータ変換関数が非線形であっても適用可能である。
【0088】
以下では、1段目の量子化結果のみを用いる場合の信号処理装置について説明する。先ず、予めLSP量子化の1段目のコードブックC1に含まれる全てのコードベクトルcについてパラメータ変換することによりコードブックD1を作成する。量子化ビット数をbとしたときには、図8に示すようにコードブックD1が作成される。すなわち、コードブックC1のあるインデックス位置のコードベクトルを取り出してパラメータ変換関数Fで変換し、コードブックD1の同じインデックス位置に蓄積する。
【0089】
このコードブックD1の作成手順を図9に示す。先ずステップS1において、iの初期値を0とする。
【0090】
次にステップS2において、コードブックC1のi番目のコードベクトルciを取り出し、ステップS3において、コードベクトルciをパラメータ変換関数Fで変換してコードベクトルdiを作成する。
【0091】
続いてステップS4において、コードベクトルdiをコードブックD1のi番目に追加する。
【0092】
続いて、ステップS5において、iに1を加え、続くステップS6において、iが2bに達したか否かが判別される。ステップS6において、iが2bに達していない場合には、ステップS2に戻り、同様の処理を繰り返す。ステップS6においてiが2bに達している場合には、コードブックD1の作成を終了する。
【0093】
本実施の形態における信号処理装置では、以上のようにして作成されたコードブックD1のルックアップによりパラメータの変換を行う。
【0094】
この信号処理装置の概略構成を図10に示す。図10に示すように、本実施の形態における信号処理装置は、量子化器10乃至12と、コードブック参照部13と、減算器14,15と、加算器16,17とを備える。
【0095】
入力された第1のパラメータであるLSP係数は、量子化器10で量子化され、量子化出力c1が出力される。入力LSP係数から量子化出力c1が減算器14にて減算され、この量子化誤差が量子化器11で量子化される。
【0096】
同様にして、量子化器11の入力値から量子化出力c2が減算器15にて減算され、この量子化誤差が量子化器12で量子化される。
【0097】
量子化出力c1,c2,c3は、加算器16,17にて加算され、量子化済LSPとなる。また、コードブック参照部13において1段目のLSPインデックスn1によりコードブックD1のルックアップが行われ、第2のパラメータであるバンド別ビット割当情報dが生成される。
【0098】
各量子化ステージ毎のLSPインデックスn1,n2,n3は、デコーダ側に供給される。
【0099】
ここで、コードブック参照部13におけるコードブックD1のルックアップは、図11に示すように、量子化器10において量子化出力c1が出力されたLSPインデックスn1によりコードブックD1をルックアップすることにより行われ、バンド別ビット割当情報dが生成される。
【0100】
デコーダ側は、図12にその概略構成を示すように、逆量子化器20乃至22と、コードブック参照部23と、加算器24,25とを備える。
【0101】
逆量子化器20乃至22には、それぞれエンコーダ側から供給されたLSPインデックスn1,n2,n3が入力され、逆量子化済出力c1,c2,c3が出力される。逆量子化出力c1,c2,c3は、加算器24,25で加算され、逆量子化済LSPとなる。また、コードブック参照部23には、LSPインデックスn1が入力され、コードブックD1をルックアップすることによりバンド別ビット割当情報dが生成される。
【0102】
以上のように、本発明の説明に供する信号処理装置によれば、パラメータ変換のための計算を行わないため、エンコーダ側とデコーダ側とで演算誤差が生じることがない。また、信号処理装置における演算量を削減することができる。
【0103】
次に、上述した信号処理装置を図6、図7に示した信号符号化装置、信号復号装置に適用した場合について説明する。なお、図6、図7に示した信号符号化装置、信号復号装置に限らず、他の信号符号化装置、信号復号装置にも適用可能であることは勿論である。以下では、主要部のみについて説明する。
【0104】
先ず、信号符号化装置の主要部の概略構成を図13に示す。なお、この図13は、図6に示した信号符号化装置の係数量子化回路235の構成に相当する。この図13において、入力端子30には、時間軸信号が直交変換されて得られた周波数軸上の係数データが供給されており、入力端子31には、例えばLPC係数、ピッチパラメータ、バークスケールファクタ等のパラメータに基づいて計算された重みwが入力されている。また、入力端子32には、図10のコードブック参照部13で生成されたバンド別ビット割当情報dが入力されている。ここで、直交変換の1フレーム分の係数をベクトルy、1フレーム分の重みをベクトルwで表すものとする。また、1フレーム分のビット割当情報をベクトルdで表すものとする。
【0105】
これらの係数ベクトルy、重みベクトルwを、必要に応じてバンド分割回路33に送ることにより、M個(M≧1)のバンドに分割する。バンド数としては、例えば低域、中域、高域の3バンド程度(M=3)が挙げられるが、これに限定されず、またバンド分割しなくてもよい。この各バンド毎の係数、例えば第k番目のバンドの係数をyk、 重みをwk (0≦k≦M−1)とするとき、
y=(y0,y1,...,yM−1)
w=(w0,w1,...,wM−1)
となる。このバンド分割のバンド数や各バンド毎の係数の個数は、予め設定された数値に固定されている。
【0106】
次に、各バンドの係数ベクトルy0,y1,...,yM−1 をそれぞれソート回路340,341,...,34M−1 に送って、各バンド毎に、それぞれのバンド内の係数に対して、重みの順に従って順位をつける。これは、各バンド内の係数自体を、重みの順に従って並び替え(ソート)すればよいが、各係数の周波数軸上での位置あるいは順番を表す指標(インデクス)のみを重みの順にソートするようにしてもよい。係数自体をソートする場合には、任意の第k番目のバンドについて、係数ベクトルyk の各係数を重みの順にソートし、重み順にソートされた係数ベクトルy'kを得る。
【0107】
次に、各バンド毎に重みの順に従ってソートされた係数ベクトルy'0,y'1,...,y'M−1 をそれぞれベクトル量子化器350,351,...,35M−1 に送る。ベクトル量子化器350,351,...,35M−1には、入力端子32に入力されたビット割当情報のベクトルd0,d1,...,dM−1 もそれぞれ入力され、このビット割当情報d0,d1,...,dM−1 に従ってベクトル量子化が行われる。
【0108】
次に、図13の各ベクトル量子化器350,351,...,35M−1 からの各バンド毎の係数インデクスのベクトルc0,c1,...,cM−1 をまとめて、全バンドの係数インデクスのベクトルcとし、端子36から取り出している。
【0109】
このような構成により、信号符号化装置は、入力した係数データをビット割当情報に基づいて量子化する。
【0110】
なお、この図13の信号符号化装置は、ハードウェア構成として示しているが、いわゆるDSP(ディジタル信号プロセッサ)等を用いてソフトウェア的に実現することも可能である。
【0111】
次に、信号復号装置の主要部の構成を図14に示す。なお、この図14は、図7に示した係数逆量子化回路261の構成に相当する。この図14において、入力端子40には、係数インデクス(MDCT係数等の直交変換係数が量子化されることで得られたコードブックインデクス)が入力されている。また、入力端子41には、αパラメータ(LPC係数)、ピッチラグ、ピッチゲイン、バークスケールファクタ等に基づいて計算された重みW(ω)が入力されている。入力端子42には、周波数軸上の係数の位置あるいは順番を示す指標(インデクス)、すなわち全帯域でN個の係数データがある場合には、0〜N−1の数値(これをベクトルIとする)が供給されている。なお、入力端子41に入力されるN個の各係数に対するN個の重みをベクトルwで表す。また、入力端子43には、図12のコードブック参照部23で生成されたバンド別ビット割当情報dが入力されている。入力端子43に入力されるN個の各係数に対するN個のビット割当情報をベクトルdで表す。
【0112】
重みw及び指標Iは、バンド分割回路44に送られて、エンコーダ側と同様にM個のバンドに分割される。エンコーダ側で例えば低域、中域、高域の3バンド(M=3)に分割されていれば、デコーダ側でも同じく3バンドに分割する。これらのバンド分割された各バンド毎の指標及び重みは、それぞれソート回路450,451,...,45M−1 に送られる。例えば第k番目のバンド内の指標Ik 及び重みwk は、第k番目のソート回路45k に送られる。ソート回路45kでは、第k番目のバンド内の指標Ik が、各係数の重みwk の順序に従って並べ替え(ソート)され、ソートされた指標I'k が出力される。各ソート回路450,451,...,45M−1 からのそれぞれのバンド毎にソートされた指標I0,I1,...,IM−1 は、係数再構成回路47に送られる。
【0113】
また、入力端子40に入力された直交変換係数のインデクスは、エンコーダ側で量子化される際に、Mバンドにバンド分割され、各バンド毎に重み順にソートされた係数が、1つのバンド内で予め定められた規則に基づく個数毎に区切られたサブベクトル毎にベクトル量子化されて得られたものである。具体的には、M個のバンドについて、それぞれのバンド毎の係数インデクスの集合をそれぞれベクトルc0,c1,...,cM−1 としたものであり、これらの各バンドの係数インデクスのベクトルc0,c1,...,cM−1 が、それぞれ逆量子化器460,461,...,46M−1 に送られている。逆量子化器460,461,...,46M−1には、入力端子43に入力されたビット割当情報のベクトルd0,d1,...,dM−1もそれぞれ入力され、このビット割当情報d0,d1,...,dM−1 に従って逆量子化が行われる。
【0114】
これらの逆量子化器460,461,...,46M−1 で逆量子化されて得られた係数データは、各バンド内で上記重みの順にソートされているもの、すなわち図13の各ソート回路340,341,...,34M−1 からの係数ベクトルy'0,y'1,...,y'M−1に相当するものであり、配列順序は周波数軸上の位置とは異なっている。そこで、係数の時間軸上での位置を表す指標Iを上記重みに従って先にソートしておき、このソートされた指標と、逆量子化されて得られた係数データとを対応させて、元の時間軸上の順序に戻すのが係数再構成回路47の機能である。すなわち、係数再構成回路47では、各逆量子化器460,461,...,46M−1 からの、各バンド内で重み順にソートされた係数データに対して、各ソート回路450,451,...,45M−1 からのそれぞれのバンド毎にソートされた指標を対応させ、このソートされた指標に従って逆量子化された係数データを並べ替える(逆ソートする)ことにより、元の時間軸上の順序に並んだ係数データyを得て、出力端子48より取り出している。
【0115】
以上のように、本実施の形態における信号符号化装置及び信号復号装置によれば、パラメータ変換のための計算を行わないため、エンコーダ側とデコーダ側とで演算誤差が生じることがなく、また、演算量を削減することができる。
【0116】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0117】
例えば、上述の説明では、ソートのための重みwとバンド別ビット割当情報dとを区別して説明したが、これに限定されず、直交変換係数を重み付けして量子化し、符号化するような信号符号化装置にも本実施の形態における信号処理装置を適用することができる。この場合、第2のパラメータとしての重み付け量子化の重みを求める際に、テーブルを参照することができる。
【0118】
また、上述の説明では、LSP係数に基づいてバンド別ビット割当情報を求めたが、これに限定されず、例えばLPC係数等の他のパラメータに基づいてバンド別ビット割当情報を求めるようにしても構わない。
【0123】
【発明の効果】
以上詳細に説明したように、本発明に係る信号符号化装置は、時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化装置であって、上記入力信号に基づく信号を直交変換する直交変換手段と、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化手段と、上記パラメータ量子化手段によって量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化手段によるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照手段と、上記直交変換手段により得られた直交変換係数を上記テーブル参照手段により求めた上記ビット割当情報に基づいてビット割当量子化する量子化手段とを備え、上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めることを特徴としている。
【0124】
このような信号符号化装置は、コードブックを参照してN段のマルチステージベクトル量子化で量子化されたパラメータに基づいてビット割当情報を求める際に、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、パラメータ量子化手段によるM(M≦N)段目までの量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求め、入力信号に基づく信号を直交変換して得られた直交変換係数をビット割当情報に基づいてビット割当量子化するため、パラメータ変換のための演算を行う必要がない。特に、上記変換が非線形である場合には、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求めるため、パラメータ変換が非線形であっても適用可能である。また、デコーダ側でも同様にパラメータ変換を行うことにより、エンコーダ側とデコーダ側とにおける演算誤差を防止することができる。
【0125】
また、本発明に係る信号符号化方法は、時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化方法であって、上記入力信号に基づく信号を直交変換する直交変換工程と、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化工程と、上記パラメータ量子化工程にて量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化工程におけるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照工程と、上記直交変換工程で得られた直交変換係数を上記テーブル参照工程にて求めた上記ビット割当情報に基づいてビット割当量子化する量子化工程とを有し、上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めることを特徴としている。
【0126】
このような信号符号化方法は、コードブックを参照してN段のマルチステージベクトル量子化で量子化されたパラメータに基づいてビット割当情報を求める際に、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、パラメータ量子化工程におけるM(M≦N)段目までの量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求め、入力信号に基づく信号を直交変換して得られた直交変換係数をビット割当情報に基づいてビット割当量子化するため、パラメータ変換のための演算を行う必要がない。特に、上記変換が非線形である場合には、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求めるため、パラメータ変換が非線形であっても適用可能である。また、デコーダ側でも同様にパラメータ変換を行うことにより、エンコーダ側とデコーダ側とにおける演算誤差を防止することができる。
【0131】
また、本発明に係る信号復号装置は、時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とが入力される信号復号装置であって、N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照手段と、上記テーブル参照手段によって生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化手段と、上記逆量子化手段によって逆量子化された上記直交変換係数を逆直交変換する逆直交変換手段とを備え、上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成することを特徴としている。
【0132】
このような信号復号装置は、信号符号化装置から少なくともパラメータの量子化出力のインデックスと符号化された直交変換係数とを入力し、N段目までのインデックスのうち、M(M≦N)段目までのインデックスに基づいてテーブルを参照することによりビット割当情報を生成し、生成されたビット割当情報に基づいて直交変換係数を逆量子化し、逆量子化された直交変換係数を逆直交変換する。エンコーダ側でも同様にしてビット割当情報が生成されているため、エンコーダ側とデコーダ側とにおける演算誤差を防止することができる。特に、上記変換が非線形である場合には、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求めるため、パラメータ変換が非線形であっても適用可能である。
【0133】
また、本発明に係る信号復号方法は、時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とを入力し、上記インデックスに基づいて上記直交変換係数を復号する信号復号方法であって、N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照工程と、上記テーブル参照工程にて生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化工程と、上記逆量子化工程にて逆量子化された上記直交変換係数を逆直交変換する逆直交変換工程とを有し、上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成することを特徴としている。
【0134】
このような信号復号方法は、信号符号化装置から少なくともパラメータの量子化出力のインデックスと符号化された直交変換係数とを入力し、N段目までのインデックスのうち、M(M≦N)段目までのインデックスに基づいてテーブルを参照することによりビット割当情報を生成し、生成されたビット割当情報に基づいて直交変換係数を逆量子化し、逆量子化された直交変換係数を逆直交変換する。エンコーダ側でも同様にしてビット割当情報が生成されているため、エンコーダ側とデコーダ側とにおける演算誤差を防止することができる。特に、上記変換が非線形である場合には、1段目の量子化出力のインデックスを用いてテーブルを参照することによりビット割当情報を求めるため、パラメータ変換が非線形であっても適用可能である。
【図面の簡単な説明】
【図1】従来の信号処理装置において、3段目までの量子化出力を用いてパラメータ変換する場合の構成を説明する図である。
【図2】従来の信号処理装置において、エンコーダ側で3段目までの量子化出力を用いてパラメータ変換する場合のデコーダ側の構成を説明する図である。
【図3】パラメータの変換手順について説明するフローチャートである。
【図4】従来の信号処理装置において、1段目までの量子化出力を用いてパラメータ変換する場合の構成を説明する図である。
【図5】従来の信号処理装置において、エンコーダ側で1段目までの量子化出力を用いてパラメータ変換する場合のデコーダ側の構成を説明する図である。
【図6】従来の信号符号化装置の構成を説明する図である。
【図7】従来の信号復号装置の構成を説明する図である。
【図8】 本発明の説明に供する信号処理装置におけるコードブックの作成について説明する図である。
【図9】同信号処理装置におけるコードブックの作成手順を説明するフローチャートである。
【図10】同信号処理装置のエンコーダ側の概略構成を説明する図である。
【図11】同信号処理装置のコードブック参照部におけるコードブックのルックアップを説明する図である。
【図12】同信号処理装置のデコーダ側の概略構成を説明する図である。
【図13】同信号処理装置の適用された信号符号化装置の主要部の構成を説明する図である。
【図14】同信号処理装置の適用された信号復号装置の主要部の構成を説明する図である。
【符号の説明】
10,11,12 量子化器、 13,23 コードブック参照部、 20,21,22 逆量子化器、 33,44 バンド分割回路、 340,341,...,34M−1,450,451,...,45M−1 ソート回路、 350,351,...,35M−1 ベクトル量子化器、 460,461,...,46M−1 逆量子化器、 47 係数再構成回路
Claims (7)
- 時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化装置であって、
上記入力信号に基づく信号を直交変換する直交変換手段と、
上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化手段と、
上記パラメータ量子化手段によって量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化手段によるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照手段と、
上記直交変換手段により得られた直交変換係数を上記テーブル参照手段により求めた上記ビット割当情報に基づいてビット割当量子化する量子化手段とを備え、
上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求める
ことを特徴とする信号符号化装置。 - 上記直交変換手段の入力側に、上記入力信号を線形予測符号化(LPC)分析して得られたLPC係数に基づき上記入力信号のLPC予測残差を出力するLPC逆フィルタを備えること
を特徴とする請求項1記載の信号符号化装置。 - 上記パラメータが上記LPC係数に基づくLSP係数であることを特徴とする請求項2記載の信号符号化装置。
- 時間軸上の入力信号に基づく信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う信号符号化方法であって、
上記入力信号に基づく信号を直交変換する直交変換工程と、
上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化するパラメータ量子化工程と、
上記パラメータ量子化工程にて量子化されたパラメータに基づいてビット割当情報を求める際に、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを用意し、上記パラメータ量子化工程におけるM(M≦N)段目までの量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求めるテーブル参照工程と、
上記直交変換工程で得られた直交変換係数を上記テーブル参照工程にて求めた上記ビット割当情報に基づいてビット割当量子化する量子化工程とを有し、
上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を求める
ことを特徴とする信号符号化方法。 - 時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とが入力される信号復号装置であって、
N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照手段と、
上記テーブル参照手段によって生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化手段と、
上記逆量子化手段によって逆量子化された上記直交変換係数を逆直交変換する逆直交変換手段とを備え、
上記変換が非線形である場合、上記テーブル参照手段は、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成する
ことを特徴とする信号復号装置。 - 上記パラメータがLSP係数であり、
上記インデックスを逆量子化してLSP係数を生成するパラメータ逆量子化手段と、
上記LSP係数をLPC係数に変換する係数変換手段と、
上記LPC係数に基づいて上記逆直交変換手段によって逆直交変換された上記係数に対してLPC合成を行うLPC合成手段とを備えること
を特徴とする請求項5記載の信号復号装置。 - 時間軸上の入力信号を直交変換し、得られた直交変換係数をビット割当量子化することにより符号化を行う際に、上記入力信号に基づくパラメータをコードブックを参照してN段のマルチステージベクトル量子化で量子化し、量子化された上記パラメータに基づいて、上記コードブックの各代表値をビット割当情報に変換した変換結果を予め格納したテーブルを参照することにより、生成されたビット割当情報により上記直交変換係数をビット割当量子化する信号符号化装置から少なくとも上記パラメータの量子化出力のインデックスと上記符号化された直交変換係数とを入力し、上記インデックスに基づいて上記直交変換係数を復号する信号復号方法であって、
N段目までの上記インデックスのうち、M(M≦N)段目までの上記インデックスに基づいて上記テーブルを参照することによりビット割当情報を生成するテーブル参照工程と、
上記テーブル参照工程にて生成された上記ビット割当情報に基づいて上記直交変換係数を逆量子化する逆量子化工程と、
上記逆量子化工程にて逆量子化された上記直交変換係数を逆直交変換する逆直交変換工程とを有し、
上記変換が非線形である場合、上記テーブル参照工程では、1段目の量子化出力のインデックスを用いて上記テーブルを参照することにより上記ビット割当情報を生成する
ことを特徴とする信号復号方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136487A JP3636094B2 (ja) | 2001-05-07 | 2001-05-07 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
US10/135,106 US6593872B2 (en) | 2001-05-07 | 2002-04-29 | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136487A JP3636094B2 (ja) | 2001-05-07 | 2001-05-07 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002335161A JP2002335161A (ja) | 2002-11-22 |
JP3636094B2 true JP3636094B2 (ja) | 2005-04-06 |
Family
ID=18983754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001136487A Expired - Fee Related JP3636094B2 (ja) | 2001-05-07 | 2001-05-07 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6593872B2 (ja) |
JP (1) | JP3636094B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100493199C (zh) * | 2003-06-16 | 2009-05-27 | 松下电器产业株式会社 | 编码装置、编码方法和码本 |
JP4618634B2 (ja) * | 2004-10-07 | 2011-01-26 | Kddi株式会社 | 圧縮オーディオデータ処理方法 |
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
CN101283407B (zh) * | 2005-10-14 | 2012-05-23 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
ES2840349T3 (es) * | 2014-05-01 | 2021-07-06 | Nippon Telegraph & Telephone | Descodificación de una señal de sonido |
EP3723085B1 (en) * | 2016-03-21 | 2022-11-16 | Huawei Technologies Co., Ltd. | Adaptive quantization of weighted matrix coefficients |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4005154B2 (ja) * | 1995-10-26 | 2007-11-07 | ソニー株式会社 | 音声復号化方法及び装置 |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
JP3842432B2 (ja) * | 1998-04-20 | 2006-11-08 | 株式会社東芝 | ベクトル量子化方法 |
-
2001
- 2001-05-07 JP JP2001136487A patent/JP3636094B2/ja not_active Expired - Fee Related
-
2002
- 2002-04-29 US US10/135,106 patent/US6593872B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002335161A (ja) | 2002-11-22 |
US20030004713A1 (en) | 2003-01-02 |
US6593872B2 (en) | 2003-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
EP0942411B1 (en) | Audio signal coding and decoding apparatus | |
JP3391686B2 (ja) | 符号化されたオーディオ信号を復号する方法及び装置 | |
US6484140B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding signal | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JPH11143499A (ja) | 切替え型予測量子化の改良された方法 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JP3357829B2 (ja) | 音声符号化/復号化方法 | |
JP2645465B2 (ja) | 低遅延低ビツトレート音声コーダ | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JP3248668B2 (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR100513815B1 (ko) | 신호부호화방법및장치 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2003233397A (ja) | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP4327420B2 (ja) | オーディオ信号符号化方法、及びオーディオ信号復号化方法 | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP6712643B2 (ja) | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム | |
JP2006317549A (ja) | 音声符号化装置及び方法、並びに音声復号装置及び方法 | |
JPH0594200A (ja) | コード励振線形予測符号化装置 | |
JPH09127997A (ja) | 音声符号化方法及び装置 | |
JPH08254999A (ja) | ゲイン量子化装置および音声符号化/復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041227 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080114 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090114 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100114 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100114 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110114 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120114 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130114 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |