Nothing Special   »   [go: up one dir, main page]

JPH0833759B2 - 複数レート音声エンコーデイング方法 - Google Patents

複数レート音声エンコーデイング方法

Info

Publication number
JPH0833759B2
JPH0833759B2 JP63316617A JP31661788A JPH0833759B2 JP H0833759 B2 JPH0833759 B2 JP H0833759B2 JP 63316617 A JP63316617 A JP 63316617A JP 31661788 A JP31661788 A JP 31661788A JP H0833759 B2 JPH0833759 B2 JP H0833759B2
Authority
JP
Japan
Prior art keywords
signal
term
coding
value
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63316617A
Other languages
English (en)
Other versions
JPH01233500A (ja
Inventor
フランソワ・ボトー
クロード・ギヤラン
ミシエール・ロツソ
Original Assignee
インタ‐ナシヨナル・ビジネス・マシ‐ンズ・コ‐ポレ‐シヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インタ‐ナシヨナル・ビジネス・マシ‐ンズ・コ‐ポレ‐シヨン filed Critical インタ‐ナシヨナル・ビジネス・マシ‐ンズ・コ‐ポレ‐シヨン
Publication of JPH01233500A publication Critical patent/JPH01233500A/ja
Publication of JPH0833759B2 publication Critical patent/JPH0833759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 A.産業上の利用分野 本発明は音声コード化技術、より詳細に言えば、複数
レート(multi-rate)の音声コード化の方法に関する。
B.従来の技術 デイジタル・ネツトワークは、音声信号をデジタル的
にエンコードするのが望ましい場合に、伝送したり記憶
したりするのに使用される。その目的のために、取り扱
われる各音声信号は、最初にサンプルされ、そして各サ
ンプル・パルスはデジタル的にバイナリ・ビツトにエン
コードされる。理論的に言えば、各サンプル・パルスを
コード化するのに用いられるビツト数を増加すればする
ほど、少なくともコード化は向上する、即ちエンド・ユ
ーザに与えられる前にデコードされたとき、音声に最も
近い信号が得られる。然しながら、経済的な観点からみ
て効果的なネツトワークにするために、ネツトワークの
トラヒツクの数、換言すればユーザの数は、ネツトワー
クの混乱を生ずることのない範囲で、最大限に増加する
必要がある。このために、トラヒツクがネツトワーク内
で増加した時に、ユーザの使用を拒絶しないで、コーデ
イング歪み(ノイズ)を受忍可能な範囲まで拡げること
により、音声のコードのビツト・レートを低める方法が
用いられているけれども、これが、何故上述の方法を使
うかの1つの理由である。トラヒクツの状態が許す限り
において、音声のコード化の質を上げ、トラヒツクの密
度が高い状態の下では、予め決められた許容レベルまで
上記の質を下げることは妥当性があると考えられる。一
方のコード化の質(1ビツト・レート)から他の質へ切
換えるこのスチツチングは、ネツトワーク内のすべての
ノードで出来るだけ簡単に、且つ迅速に行われるべきで
ある。この目的を達成するために、複数レートのコード
化装置に組込みビツト・ストリームを持つフレームを与
えることによつて、予め決められた一方のビツト・レー
トからより低い所定のビツト・レートへの切換えが、フ
レームの所定の部分を降下するだけで行えるようにする
ことが必要である。
C.発明が解決しようとする問題点 従つて、本発明の目的はコード信号励起エンコーデイ
ング(Code-Excited encoding:コード駆動符号化)技術
を用いて、音声信号を複数レートでコード化する手法を
提供することにある。
D.問題点を解決するための手段 本発明は、コード励起長期間予測コード化信号発生装
置(Code-Excited Long-term Prediction Coder:コード
駆動長期間予測符号器)(CE/LTP装置という)を含む複
数レートの音声コード化の方法及びその装置に関する。
音声信号は、短期間残差信号を誘出するために短期間
フイルタで濾過される。この短期間残差信号は、第1の
CE/LTP装置に与えられてコード化される。そして、この
コード化信号をデコードし、このデコード結果から、第
1のCE/LTP装置への入力信号を差し引いてエラー信号を
生成する。上記のエラー信号は、転じて第2のCE/LTP装
置に印加されて、コード化信号を誘導する。複数レート
・フレームは、上記の第1のCE/LTP装置からのコード化
信号と、上記の第2のCE/LTP装置からのコード化信号の
両方を含んでいる。
より詳細にいえば、本発明は、音声信号に基づいて発
生される短期間残差信号を誘出するために、オリジナル
の音声信号を短期間フイルタ作用によつて処理した後、
第1のCE/LTP装置に印加することを含んでおり、この第
1のCE/LTP装置の動作は、上記第1の長期間残信号を誘
出するために、上記の端期間残差信号から、第1の予測
残差信号を差し引くことと、上記第1の長期間残差信号
を利得g1及びアドレスk1にコード化することと、第1の
長期間残差信号から第1のエラー信号を誘出するため
に、第1の長期間残差信号から、第1の再構成された残
差信号(コード化された後の信号)を差し引くことと、
上記の第1のエラー信号を、第2のCE/LTP装置に供給し
て、利得g2及びアドレスk2にコード化することと、同じ
複数レート・コード化フレームに(g1、k1)及び(g2、
k2)を綜合させることとを含み、これにより、より低い
コード化フレームへの切換えを(g2、k2)の廃棄によつ
て達成する。すなわち(g1、k1)のみ伝送することによ
り達成する。
上述した本発明の原理に従つて、第3の、第4の...
等々のCE/LTP装置を設けることによつて、明らかに、よ
り高いレートへ拡大することができる。
E.実施例 第1図を参照すると2レート(bi-rate)コード化装
置の実施例の単純化されたブロツク図が示されており、
既に説明したように、この装置によつて、ビツト・レー
トは、より高いレート数に拡大される。
第1図の装置にいおて、電話用の帯域幅(300ヘルツ
乃至3300ヘルツ)に制限された音声信号が、8キロ・ヘ
ルツでサンプルされ、そして、月並なデジタル・アナロ
グ・コンバータ(図示せず)において、毎サンプル・パ
ルス当り12ビツトでデジタル的にエンコードされたPCM
によつて、サンプル・パルス列の信号、s(n)が入力
として与えられている。これらのサンプル信号は最初の
装置10において先ずプリエンフアシスされ、次に、部分
的自己相関で誘導される係数ai(PARCOR誘導)を発生
するために演算装置12で処理される。上記の係数a
iは、信号s(n)を濾過する短期間予測フイルタ(ST
P)13を同調するのに用いられ、そして、その装置13は
短期間残差信号r(n)を与える。上記の短期間残差信
号は第1のCE/LTP装置Aに与えられてコード化される。
CE/LTP装置Aに与えられたこの入力信号は、上記の短期
間残差信号r(n)から、第1の長期間残差信号e
(n)を誘出するために、予め決められた遅延値M(音
声ピツチ期間の倍数に等しい値によつて遅延され、且つ
利得係数b.r1(n−M)を乗算することによつて合成さ
れた(再構成された)残差信号に対応する第1の予測残
差信号を、短期間残差信号r(n)から差し引くことに
よつて、第1の長期間残差信号e(n)を誘出するよう
処理される。
このブロツク・コーデイング技術が、本発明の目的の
ために、160サンプル長さのr(n)のブロツクにわた
つて使用されることは、注意を払う必要がある。パラメ
ータb及びMは80個のサンプル・パルス毎に評価され
る。長期間残差信号e(n)の流れは、L個の順次付け
られたサンプル・パルスのブロツクに再分割され、そし
て次に、上記の各ブロツクは、コード励起コード化第1
装置(CELP1)15により処理されて、L個のサンプル・
パルスのK個のシーケンス(列)によつて標準化された
コードワードとして利用可能にされる。次の時点におい
て、第1の長期間残差信号e(n)をコード化すること
は、不変分散エラー基準の観点から、e(n)信号の列
に最も良く適合したコードワードを選択すること、そし
てコードワードの参照数字(reference number)k1で信
号e(n)を置き換えることを含んでいる。事前に記憶
されたコードワードが標準化されているものとして、次
に、第1の利得係数g1が決められ、テストされるのがよ
い。
コードワードの参照数字k1が決められた後、第1のデ
コード装置(DECODE1)16において発生され、再構成さ
れた第1の残差信号e1(n)=g1.CB(k1)は上記の長
期間予測装置14に供給される。
また、この再構成された残差信号は減算装置17におい
て、信号e(n)から差し引かれ、その出力としてエラ
ー信号r′(n)を与える。
次に、エラー信号r′(n)は、既に述べたCE/LTP装
置Aと同様な第2のCE/LTP装置Bに印加される。この第
2のCE/LTP装置は、エラー信号r′(n)が印加される
減算器18を含み、コード励起コード化第2装置(CELP
2)19をアドレスするエラー残差信号e′(n)を発生
する。この装置19は、信号e′(n)を第2の利得係数
g2とコードワードのアドレスk2とにコード化する。ま
た、上記のコード化装置19は、コードワードCB(k2)及
び利得g2を第2のデコード装置(DECODE2)20に印加す
るように作動し、このデコード装置20は下記の数式で表
わされるデコーされたエラー信号を与える。
e2(n)=g2.CB(k2) また、上記の信号e2(n)は第1のLTP1と同じ第2の
長期間予測装置(LTP2)に印加され、その出力は減算装
置18においてr′(n)から差し引かれる。
最後に、ai、b、M、(g1、k1)及び(g2、k2)の
データを複数レート(2レート)フレームに多重化する
ことによつて、全レートのフレームが発生される。
既に述べたように、この処理はCE/LTP装置AまたはCE
/LTP装置Bのような付加的なコード励起長期間予測コー
ダを直列に挿入することによつて容易に拡張することが
できる。
第2図に示した流れ図は、プリエンフアシスと、PARC
OR関連の計算の両方に含まれる動作の詳細を説明するた
めの図である。160個の信号サンプル・パルスs(n)
の各ブロツクは先ず、信号自己相関関数の2つの第1値
を誘導するために処理される。
プリエンフアシス係数Rは、 R=R1/R2 で計算され、そして160個のサンプル・パルスs(n)
のオリジナルの組はプリエンフアシスされた組sp(n)
に変換される。sp(n)は次式で与えられる。
sp(n)=s(n)−R.s(n−1) プリエンフアシスされたaiパラメータは、いわゆるP
ARCOR係数Kiから、逓昇プロシージヤによつて誘導さ
れ、これは転じて月並なレローグーゲン(Leroux-Guege
n)法を用いてプリエンフアシスされた信号sp(n)か
ら誘導される。8個のai、またはPARCOR係数KiはUn・
Yangアルゴリズムを用いて28ビツトでコード化される。
これらの方法及びアルゴリズムについては、以下の刊行
物を参照されたい。
− J.Leroux and C.Guegen:IEEE Transaction on ASSP
pp.257〜259,June 1977の「部分相関係数の固定少数点
計算」(A fixed point computation of partial corre
ction coefficients)と題する刊行物。
− C.K.UN and S.C Yang:Proceedings,International
Conference on QSSP Hartford,May 1977の「LPCリフレ
クシヨン係数の小片的な線形量子化」(Piecewise line
ar quantization of LPC reflexion coefficents)と題
する刊行物。
− L.D.Markel and A.H.Gray:Springer Verlag 1976,S
tep-up procedure pp.94〜95の「スピーチのリニヤ予
測」(Liner predictiion of speech)と題する刊行
物。
− 米国特許第4216354号(欧州特許2998)。
短期間フイルタ13は次式で与えられる短期間残差サン
プル・パルス信号r(n)を発生する。
長期間係数のb値及びM値を計算するためには、幾つ
かの方法がある。例えば、1つの方法は、1982年4月の
IEEE Trans.on Communication,Vol.COM-30の「低ビツト
・レートにおけるスピーチの予測的コード化」(Predic
tive Coding of Speech at low Bit Rate)と題する文
献、及び1970年のBell System Technical Journal,Vol.
49の「スピーチ信号の適合予測コード化」(Adaptive p
rediction coding of speech signals)と題する文献を
参照されたい。
一般的にいえば、Mはピツチ値、またはその高調波で
あり、それを計算する方法は当業者には公知である。
また、非常に異なつた方法が欧州特許出願FR987004に
記載されている。
上記の特許出願に従つて、 上式において、値、b及びMは、80個のサンプル・パ
ルスと、それらよりも先行する前の80個のサンプル・パ
ルスとを使用して、160個のサンプル・パルスの各ブロ
ツクにわたつて2度決定される。
Mの値、即ちピツチに関連する値Mは2つの処理ステ
ツプに基づいて計算される。その第1のステツプは、粗
調整ピツチに関連したM値のおおざつぱな決定を行い、
それに続く第2のステツプ(微調整ステツプ)は、限ら
れた数の値について自己相関方法を使用してM値を調節
する。
1.第1のステツプ おおざつぱな決定は可変閾値及びゼロ交差検出を含む
非直線性技術を用いることに基礎を置いており、より詳
細に言えば以下のステツプを含んでいる。
− ゼロ、または予め決められた値L、または前の微調
整値MにL値を強制することによつて可変M値を初期化
すること。
− 現在のサブ・ブロツクの80個のサンプル・パルス
と、80個の先行する前のサンプル・パルスを含む160個
のサンプル・パルスのブロツクのベクトルをロードする
こと。
− 160個のサンプル・パルス中の正のピーク値(Vma
x)と、負のピーク値(Vmin)とを検出すること。
− 以下の閾値を計算すること。
正の閾値Th+=α.Vmax 負ま閾値Th-=α.Vmin αは経験的に選択された値(例えばα=0.5) − 以下の条件に従つた現在のサブ・ブロツクを表わす
新しいベクトルX(n)を設定すること。
若し、r(n)≧Th+ならば、X(n)=1 若し、r(n)≦Th-ならば、X(n)=1 その他の場合、X(n)=0 − 1,0または1の値のみを含むこの新しいベクトルは
「清浄ベクトル(cleaned vector)」と呼ばれる。
− 清浄ベクトルの2つの値の間の有効ゼロ交差(sign
ificant zero crossing)(即ち符号が変化すること)
を検出すること、換言すれば、相互に近接したゼロ交差
を検出すること。
− 連続して検出されたゼロ交差の間のr(n)サンプ
ル区間の数を表わすM′の値を計算すること。
− ΔM=|M′−M|を計算し、そしてΔMが所定の値D
(例えばD=5)よりも大きい任意のM′を捨て去つた
後、前のおおざつぱな値MとM′とを比較すること。
− 捨て去らなかつたM′の平均値を求めるため、Mの
粗調整値を計算すること。
2.第2のステツプ 微調整値Mの決定は、ピツチ付けされたパルスの近く
に位置したサンプル・パルスの囲りで取り上げたサンプ
ル・パルスのみについて演算が施される自己相関方法を
用いることに基礎を置いている。
第2のステツプは以下のステツプを含んでいる。
− 丁度いま計算されたおおまかなM値(粗調整値)
(但しゼロではないものとする)に等しいM値か、また
は、前に測られた微調整値Mに等しいM値を取つて初期
化すること。
− 清浄ベクトル、即ち粗ピツチに関する所定数のサン
プル・パルスを自己相関ゾーンにロードすること。
− 以下の式から誘導された一組のR(k′)値を計算
すること。
上式において、k′は、選択された自己相関ゾーンの
下限Mminから上限Mmaxまでに変化する清浄ベクトルのサ
ンプル・パルス・インデツクスであり、自己相関ゾーン
の範囲は例えば、Mmin=Lで、Mmax=120であるとす
る。
b及びMが計算されると、それらの値は、以下に説明
される変換長期間予測装置14を同調するのに使用され
る。この装置14の出力、即ち信号r(n)に対して減算
演算れ予測された第1の長期間残差信号は、第1の長期
間残差信号e(n)を与える。この信号e(n)は転じ
て、係数k1及び利得係数g1にコード化される。係数k1は
装置(CELP1)15にあるテーブル中に事前に記憶されて
いるコードワードCB(k1)のアドレスを表わしている。
コードワード及び利得係数の選択は、平均二乗誤差を選
択基準の基礎としている。換言すれば、それらは、以下
の式で与えられる最小値Eを与えるkテーブル・アドレ
スを見ることによつて与えられる。
E=[e(n)−g1.CB(k,n)]T.[e(n)−g1.CB
(k,n)] (1) 上式において、Tは平均数学的移項演算(means math
ematical transposition operation)を表わす。
CB(k,n)は第1図のコード化装置15内のアドレスk
に位置するコードワードを表わす。
換言すれば、Lを各コードワードCBのサンプル・パル
ス数とした場合、EはLの2つのコンポーネント・ベク
トルのスカラー量である。
Eを最小化する最適スケール係数G(k)[(1)式
中のg1]は次式をセツトすることによつて決定される。
及び 等式、G(k)の分母は、事前に記憶されたテーブル中
のコードワードを事前に標準化することによつて回避す
ることができる標準化のフアクタである。
上式(1)は次式のように簡単化することができる。
そして、最適コードワードは等式(2)の最後の項を
最大にするkの値を見出すことによつて得られる。
CB2(k)は|CB(k,n)|2を表わし、そして、 SP(k)はスカラー量eT(n).CB(k,n)であると
すると、 先ず、次式を最大にするkの値を見出すことが必要と
なり、 そして、次に、以下の式からG(k)の値を決定す
る。即ち、 上式は以下のような異なつた数式で表わすことができ
る。
n=1、2、...、Lを持つ{en}は、エンコードされ
るべきe(n)個のサンプル・パルスのシーケンスを表
わすものとする。そして、n=1、2、...、L及びk
=1、2、...、Kを持つ{▲Yk n▼}は夫々L個のサ
ンプル・パルスのK個のコードワードを含むテーブルを
表わすものとする。但しK=2cヒ゛ツトとする。
CELPにおいてエンコードする処理動作は以下の結果を
もたらす。
− 以下の相関項を計算すること。
上式において、k=1、...、Kとする。
− 以下の条件を最適化するためのkの値を選択するこ
と。
Ekopt=Max(Ek) 但しk=1、...、Kとする。
− e(n)シーケンスをcビツトのブロツク=log2
ビツト+G(k)コーデイング・ビツトに変換するこ
と。
上述の動作を遂行するアルゴリズムは第3図に示され
ている。
第1の2つのインデツクス・カウンタi及びjはi=
1及びj=1にセツトされる。コードワードCB(1,n)
はテーブルから読取られる。
第1のスカラー量は次式から計算される。
この値は二乗されてSP(2)の値とされ、対応するコ
ードワード[即ちCB(1)]の二乗値で割り算される。
次に、iは1つづつ増加され、そして、Kをコード・ブ
ツク中のコードワード数とした場合、i=Kになるま
で、上記の動作が反復される。i=1、...、Kとした
場合、以下のシーケンス の範囲内で、以下の最大値 を与える最適値のコードワードCB(k)が選択される。
この動作はテーブルの参照数字kを検出して可能とな
る。
kが選択されると、利得係数は以下の式を用いて計算
される。
シーケンスe(n)の内のサンプル・パルスの数がL
の倍数に選択された場合、上記のシーケンスe(n)
は、夫々のウインドーがL個のサンプル・パルスの長さ
を持つものとして、JL個のウインドーに2次分割され、
次にj=JLになるまで、jが1つづつ増加される。
各コードワードのエネルギを単位値にセツトするため
に、コード・ブツクを標準化することによつて、計算を
簡単化し、コード化装置の複雑性の単純化を計ることが
できる。換言すれば、i=1、...、Kとして、Lのコ
ンポーネント・ベクトルの振幅が、次式で1に標準化さ
れる。
CB2(i)=1 この場合、最良のコードワードkを決定する数式は単
純化される(アルゴリズムに含まれるすべての分母を単
位値と等しくする)。スケール係数G(k)は変更され
るのに反して、最適のシーケンスのための参照数字kは
修正されない。
この方法はテーブルを記憶するために非常に大きなメ
モリを必要とする。例えば、上記のサイズK×Lは、K
=256でL=20とした場合、4万バイトの程度になる。
異なつたアプローチを以下に説明する。システムを初
期化する際に、残差信号のL+K個のサンプル・パルス
の第1のブロツク、例えばe(n)がテーブル中に記憶
される。次に後続するL個のワード長さの各列e(n)
は、(L+K)個のサンプル・パルスの長さのテーブル
にわたつて、次の1つのサンプル・パルス位置から{e
n}その列をシフトすることによつて、(L+K)個の
サンプル・パルスの長いテーブルの列に相関される。
上式において、k=1、...、Kとする。
この方法はテーブルに必要とするメモリの大きさを、
K=256でL=20の場合、2万バイトに減少する。
第4図は長期間予測装置14のブロツク図を示す。コー
ド化装置15において選択され、デコード装置16によつて
与えられる第1の再構成残差信号、即ち e1(n)=g1.CB(k1) が加算器30に供給されると、その出力は、長さが値Mま
で調節可能な可変遅延線32に印加される。可変遅延線32
のM値で遅延された出力は、乗算器34において利得係数
bにより乗算演算される。この演算結果の出力は加算器
30に印加される。
第1図に示されたように、計算されたb及びMの値は
また、長期間残差信号から再構成された誘導信号から差
し引いて誘導されたエラー信号として、後続するCE/LTP
装置のために使用することが出来る。
第5図は本発明に従つた複数レート・コーデイングに
含まれる動作のアルゴリズムを示す図である。この例
は、説明を簡明にするために、複数レートは2レートと
してある。
この処理は以下に述べるステツプを含んでいる。
(1) 短期間残差の部分: s(n)信号はa(i)係数を持つデイジタル・フイ
ルタを用いて短期間フイルタ動作を通じて短期間残差信
号r(n)に変換される。上記の係数は短期間分析動作
を通じてプリエンフアシスされた信号sp(n)から誘導
された信号に従属する係数である。
(2) 第1の長期間予測の部分: 短期間残差信号r(n)は以下の条件によつて第1の
長期間残差信号e(n)に変換される。
e(n)=r(n)−b.r1(n−M) 上式において、bは長期間残差分析から誘導される利
得であり、Mはピツチ倍数であり、r1(n−M)はMに
よつて遅延され再構成された長期間残差信号から誘導さ
れる。
(3) コード励起コード化の第1の部分: 第1の長期残差信号は第1のコードワード・テーブル
のアドレス(k1)と、第1の利得係数(g1)にコード化
される。これは、e(n)サンプル・パルスの所定の長
さのブロツクに最も良く適合したコードワードのアドレ
スk1を決定するために、上記のブロツクを事前に記憶さ
れたコードワードと相関させることによつて達成され
る。
(4) コード励起コード化信号のエラーの第1の部
分: コード化のエラー信号r′(n)はコード化されてい
ないe(n)からデコードされたe1(n)を差し引くこ
とによつて誘導される。
(5) 第2の長期間予測の部分: 次に、エラー信号は、前の動作と同様に、即ち既に計
算されたM及びb係数を使用して第2の長期間残差のた
めの演算処理を施すことによつて、下記のエラー残差
e′(n)に変換される。
e′(n)=r′(n)−b.r2(n−M) (この第2のステツプのために、前に計算したb及び
M値を保持することは、演算動作の仕事を軽減する助け
になることは言うまでもない。これらの再計算も同様に
考慮するのが好ましい。) (6) コード励起コード化の第2部分: 転じて、エラー残差信号は、最も良く適合した第2の
コードワードのアドレス(k2)及び第2の利得係数(g
2)を得るために第2のCE/LTP装置に与えられる。
上述の処理は月並な多重化アプローチを使用して2レ
ートのフレームに挿入されるデータ、ai、b、M、(g
1、k1)及び(g2、k2)を与える。この処理は、(g3、k
3)、(g4、k4)、...等々を発生するために、最後の3
つのステツプを繰り返すことによつて、更に高いレート
数に拡大することができるのは、これ以上の説明を要す
ることなく明らかである。
月並なデマルチプレキシング動作を介して種々のデー
タが相互に分離されているものと仮定して、第6図のア
ルゴリズムに示されたように、複数レート(2レート)
フレームから元の音声を合成し戻すことが出来る。k1及
びk2の値は、コード化装置の説明と関連して既に述べた
ように、設定されたテーブルから、コードワードCB(k
1)及びCB(k2)を取出すために、上記のテーブルをア
ドレスするのに用いられる。これらの動作は以下の信号
を再構成することができる。
e1(n)=g1.CB(k1,n) e2(n)=g2.CB(k2,n) 従つて、e″(n)=e1(n)+e2(n)である。
次に、上記の信号e″(n)は、b及びMに同調された
長期間合成フイルタ1/B(z)に供給された後、これに
より、r″(n)を発生する。
次に、信号r″(n)は、一組のai係数に同調され
た短期間合成デジタル・フイルタ1/A(z)によつて濾
過されて、合成された音声信号s″(n)を与える。
上述の音声合成装置(受信装置)のブロツク図が第7
図に示されている。デマルチプレクサ60はデータ信号を
相互に分離する。k1及びk2はテーブル61及び62をアドレ
スするのに使用され、その出力はマルチプレクサ63及び
64に供給されて、e1(n)及びe2(n)を与える。加算
器65はe1(n)及びe2(n)を加算し、そしてその出力
は、長さMに調節された可変遅延線68及びマルチプレク
サ69を通つた出力と加算器67で加算し、その結果値はデ
イジタル・フイルタ70[1/A(z)]に供給される。従
つて、加算器67の出力は、aiに設定された係数によつ
てデイジタル・フイルタ70で濾過されて、合成された復
元音声信号s″(n)を与える。
本発明の複数レートのアプローチはより巧妙なコーデ
イング方法によつて実現することが出来る。例えば、第
8図に示したような通常のベース・バンド・コードに適
用することができる。元の音声信号s(n)が短期間残
差信号r(n)を誘導するように処理されたのち、それ
は、低減フイルタ(LPF)70と加算器71を使用して、低
周波数幅(LF)信号r1(n)と、高周波帯域幅(HF)信
号rh(n)とに分離される。高周波帯域幅のエネルギは
装置(HFE)72により計算され、そして装置73におい
て、Eによつて指定されたデータにコード化される。装
置73の出力は番号(3)で示されている。帯域幅LF及び
HFの夫々の信号、即ちr1(n)及びrh(n)は第1図の
ブロツクA及びBで表示されているような複数レートの
CE/LTPコード化装置75及び76に供給される。分離(b、
M)計算装置のいずれも両方の帯域幅に使用することが
できる。
最後に、マルチプレクサ77に供給される信号は下記に
示すデータである。
− PARCORに関連する係数:aI − ピツチ、または長期間に関連するデータ:b及びM − 高周波エネルギのデータ:E − 低周波帯域幅の複数レートCE/LTP:▲g1 1▼;▲k1
1▼;▲g1 2▼;▲k1 2▼ − 高周波帯域幅の複数レートCE/LTP:▲g2 1▼;▲k2
1▼;▲g2 2▼;▲k2 2▼ このアプローチは、全てのレートに共通なデータの
組、即ちai、b、及びMパラメータと、例えば以下の
アプローチに従つた出力フレーム中に挿入され、または
挿入されない残りのデータとによつて、幾つかのレート
でコード化することができる。
− 16Kbps(毎秒16キロ・バイト)のビツト・レートで
全帯域幅のコード化装置:▲g1 1▼;▲k1 1▼;▲g1 2
▼;▲k1 2;▲g2 1▼;▲k2 1▼;▲g2 2▼及び▲k2 2
▼を加算する。
− 中間的帯域幅のコード化装置:▲g1 1▼;▲k
1 1▼;▲g1 2▼;▲k1 2▼;▲g2 1▼及び▲k2 1▼の
み。
− 低周波帯域幅のコード化装置:▲g1 1▼;▲k
1 1▼;▲g1 2▼;▲k1 2及びE。
− 低レートのコード化装置:▲g1 1▼;▲k1 1▼及び
E 本発明の技術的範囲内で、出力(1)、(2)及び
(3)と、ai、b、M及びEの他の組合せを考えるこ
とは、当業者であれば容易になし得ることは明らかであ
る。
F.発明の効果 本発明は音声信号を複数レートでコード化した音声伝
達用のデイジタル・ネツトワークにおいて、簡単な構成
で、一方のレートから他方のレートへの切換を、ネツト
ワーク内のすべてのノードについて迅速に行うことがで
きる。
【図面の簡単な説明】 第1図は本発明に従つたコード化装置を説明するための
ブロツク図、第2図は第1図の装置10、12及び13に含ま
れた動作を説明するための流れ図、第3図はコード励起
コード化動作を説明するための流れ図、第4図は第1図
の装置14を具体化したブロツク図、第5図は第1図に示
した本発明の装置の動作を説明するための流れ図、第6
図は本発明に使用されるデコータを示す図、第7図は第
6図のデコータのブロツク図、第8図は本発明に従つ
て、ベース・バンド・コード化を行うコード化装置のブ
ロツク図である。 10……プリエンフアシス、13……短期間フイルタ、14…
…第1の長期間予測装置、15……コード誘起コード化第
1装置、16……第1のデコード装置、17、18……減算
器、19……コード誘起コード化第2装置、20……第2の
デコード装置、A、B……CE/LTP装置。
フロントページの続き (72)発明者 ミシエール・ロツソ フランス国06300ニース、ブロツク・エヌ、 ル・ギユゴニ2番地

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】音声起原信号からサンプル・ブロックを生
    成し、各サンプル・ブロックを予め記憶されているテー
    ブル・アドレスkおよび利得係数gに変換するコード励
    起エンコーディング手法を用いて、該音声起原信号を複
    数レートでエンコーディングする方法において、 上記音声起原信号から生成されたサンプル・ブロックに
    第1のコード励起エンコーディングを実行して第1のテ
    ーブル・アドレスk1および第1の利得係数g1を生成する
    ステップと、 上記第1のテーブル・アドレスk1および第1の利得係数
    g1をデコードするステップと、 上記音声起原信号から上記デコードの結果信号を差し引
    いてエラー信号を生成するステップと、 上記エラー信号に第2のコード励起エンコーディングを
    実行して第2のテーブル・アドレスk2および第2の利得
    係数g2を生成するステップと、 上記第1のテーブル・アドレスk1および第1の利得係数
    g1と第2のテーブル・アドレスk2および第2の利得係数
    g2とを多重化するステップとを有し、 低いレートでエンコーディングを行うときには第2のテ
    ーブル・アドレスk2および第2の利得係数g2を廃棄する
    ようにした複数レート音声エンコーディング方法。
JP63316617A 1988-03-08 1988-12-16 複数レート音声エンコーデイング方法 Expired - Fee Related JPH0833759B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP88480007.9 1988-03-08
EP88480007A EP0331858B1 (en) 1988-03-08 1988-03-08 Multi-rate voice encoding method and device

Publications (2)

Publication Number Publication Date
JPH01233500A JPH01233500A (ja) 1989-09-19
JPH0833759B2 true JPH0833759B2 (ja) 1996-03-29

Family

ID=8200489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63316617A Expired - Fee Related JPH0833759B2 (ja) 1988-03-08 1988-12-16 複数レート音声エンコーデイング方法

Country Status (4)

Country Link
US (1) US4965789A (ja)
EP (1) EP0331858B1 (ja)
JP (1) JPH0833759B2 (ja)
DE (1) DE3883519T2 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0401452B1 (en) * 1989-06-07 1994-03-23 International Business Machines Corporation Low-delay low-bit-rate speech coder
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
FR2657741B1 (fr) * 1990-01-29 1992-04-03 Cit Alcatel Interface de restructuration de trames pour trains numeriques multiplexes par multiplexage temporel d'affluents numeriques a differents debits.
JP3194930B2 (ja) * 1990-02-22 2001-08-06 日本電気株式会社 音声符号化装置
JP3256215B2 (ja) * 1990-02-22 2002-02-12 日本電気株式会社 音声符号化装置
US5115429A (en) * 1990-08-02 1992-05-19 Codex Corporation Dynamic encoding rate control minimizes traffic congestion in a packet network
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
CA2054849C (en) * 1990-11-02 1996-03-12 Kazunori Ozawa Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
DE69233397T2 (de) * 1991-06-11 2005-08-11 Qualcomm, Inc., San Diego Vorrichtung und Methode zur Maskierung von Fehlern in Datenrahmen
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
WO1993006592A1 (en) * 1991-09-20 1993-04-01 Lernout & Hauspie Speechproducts A linear prediction speech coding device
US5864560A (en) * 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5546395A (en) * 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5453986A (en) * 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US6009082A (en) * 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5535204A (en) * 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5617423A (en) * 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5754589A (en) * 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
JPH06250697A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置
BR9404725A (pt) * 1993-03-26 1999-06-15 Motorola Inc Processo de quantificação por vetor de um vetor de coeficiente de reflexão ótimo processo de codificação de fala sistema de comunicação de rádio e processo de armazenagem de vetores de coeficiente de reflexão
IT1270439B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la quantizzazione dei parametri spettrali in codificatori numerici della voce
US5452015A (en) * 1994-02-10 1995-09-19 Philips Electronics North America Corporation Method and apparatus for combating co-channel NTSC interference for digital TV transmission
US6134521A (en) * 1994-02-17 2000-10-17 Motorola, Inc. Method and apparatus for mitigating audio degradation in a communication system
US5682386A (en) * 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
US5757801A (en) * 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
US5546448A (en) * 1994-11-10 1996-08-13 Multi-Tech Systems, Inc. Apparatus and method for a caller ID modem interface
US5508708A (en) * 1995-05-08 1996-04-16 Motorola, Inc. Method and apparatus for location finding in a CDMA system
US5648822A (en) * 1995-05-19 1997-07-15 Philips Electronics North America Corporation Method and apparatus for combating co-channel NTSC interference using a variable-comb filter for digital TV transmission
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US5905794A (en) * 1996-10-15 1999-05-18 Multi-Tech Systems, Inc. Caller identification interface using line reversal detection
US6128506A (en) * 1997-09-24 2000-10-03 Telefonaktiebolaget Lm Ericsson Integrated power control and congestion control in a communication system
US6104998A (en) * 1998-03-12 2000-08-15 International Business Machines Corporation System for coding voice signals to optimize bandwidth occupation in high speed packet switching networks
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
AU3589100A (en) * 1999-02-08 2000-08-25 Qualcomm Incorporated Speech synthesizer based on variable rate speech coding
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
CN101615396B (zh) * 2003-04-30 2012-05-09 松下电器产业株式会社 语音编码设备、以及语音解码设备
JP5145852B2 (ja) * 2007-10-15 2013-02-20 日本電気株式会社 係数決定装置、無線通信システム、係数決定方法及び係数決定プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251881A (en) * 1978-06-05 1981-02-17 Storage Technology Corporation Centralized automatic gain control circuit
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CH637510A5 (de) * 1978-10-27 1983-07-29 Ibm Verfahren und anordnung zur uebertragung von sprachsignalen sowie anwendung des verfahrens.
EP0064119B1 (fr) * 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
EP0085820B1 (fr) * 1982-02-09 1985-11-21 International Business Machines Corporation Procédé de transmission numérique multi-vitesses et dispositif de mise en oeuvre dudit procédé
JPS60116000A (ja) * 1983-11-28 1985-06-22 ケイディディ株式会社 音声符号化装置
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
US4897855A (en) * 1987-12-01 1990-01-30 General Electric Company DPCM system with adaptive quantizer having unchanging bin number ensemble
US4866510A (en) * 1988-09-30 1989-09-12 American Telephone And Telegraph Company Digital video encoder

Also Published As

Publication number Publication date
EP0331858B1 (en) 1993-08-25
JPH01233500A (ja) 1989-09-19
EP0331858A1 (en) 1989-09-13
US4965789A (en) 1990-10-23
DE3883519T2 (de) 1994-03-17
DE3883519D1 (de) 1993-09-30

Similar Documents

Publication Publication Date Title
JPH0833759B2 (ja) 複数レート音声エンコーデイング方法
EP0763818B1 (en) Formant emphasis method and formant emphasis filter device
US6704702B2 (en) Speech encoding method, apparatus and program
CA1218745A (en) Speech signal processing system
KR101000345B1 (ko) 음성 부호화 장치, 음성 복호화 장치 및 그 방법
EP0331857B1 (en) Improved low bit rate voice coding method and system
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
JP4097699B2 (ja) 複雑さが軽減された信号送信システム
US5359696A (en) Digital speech coder having improved sub-sample resolution long-term predictor
US5214741A (en) Variable bit rate coding system
US5007092A (en) Method and apparatus for dynamically adapting a vector-quantizing coder codebook
EP1221694A1 (en) Voice encoder/decoder
JP4263412B2 (ja) 音声符号変換方法
JP2003512654A (ja) 音声の可変レートコーディングのための方法およびその装置
JP2002202799A (ja) 音声符号変換装置
JPS63223799A (ja) ピツチ検出方法
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
EP0450064B1 (en) Digital speech coder having improved sub-sample resolution long-term predictor
EP0396121B1 (en) A system for coding wide-band audio signals
JP3970327B2 (ja) 複雑さが軽減された信号送信システム
JPH11504731A (ja) 複雑さが軽減された合成フィルタを有する符号励振線形予測符号化スピーチコーダ
KR100255533B1 (ko) 적응 변환 코딩 시스템, 적응 변환 디코딩 시스템 및 적응 변환 코딩/디코딩 시스템
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
Woo et al. Low delay tree coding of speech at 8 kbit/s

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees