JPS5912186B2 - 雑音の影響を減少した予測音声信号符号化 - Google Patents
雑音の影響を減少した予測音声信号符号化Info
- Publication number
- JPS5912186B2 JPS5912186B2 JP54500642A JP50064279A JPS5912186B2 JP S5912186 B2 JPS5912186 B2 JP S5912186B2 JP 54500642 A JP54500642 A JP 54500642A JP 50064279 A JP50064279 A JP 50064279A JP S5912186 B2 JPS5912186 B2 JP S5912186B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- formant
- difference
- audio signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000005236 sound signal Effects 0.000 claims description 75
- 238000013139 quantization Methods 0.000 claims description 63
- 238000012545 processing Methods 0.000 claims description 30
- 238000001228 spectrum Methods 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 17
- 230000005284 excitation Effects 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims 2
- 238000001914 filtration Methods 0.000 claims 1
- 230000015654 memory Effects 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 208000019300 CLIPPERS Diseases 0.000 description 3
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002542 deteriorative effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
- H04B14/046—Systems or methods for reducing noise or bandwidth
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/04—Differential modulation with several bits, e.g. differential pulse code modulation [DPCM]
- H03M3/042—Differential modulation with several bits, e.g. differential pulse code modulation [DPCM] with adaptable step size, e.g. adaptive differential pulse code modulation [ADPCM]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】
技術分野 3
本発明は音声信号のデジタル通信に関し、特に雑音の影
響を減少するよう構成された予測音声信号処理装置に関
する。
響を減少するよう構成された予測音声信号処理装置に関
する。
背景技術
電話又は他の通信システムにおけるデジタルチヤネルを
介しての伝送のための信号の符号化には、入力信号のサ
ンプリング、サンプルの量子化及び量子化されたサンプ
ルの各々に対するデジタルコードの発生が要求される。
介しての伝送のための信号の符号化には、入力信号のサ
ンプリング、サンプルの量子化及び量子化されたサンプ
ルの各々に対するデジタルコードの発生が要求される。
音声信号は高度に相関があり、従つてその過去の値から
予測できる部分を含んでいる。デジタルエンコーダ送信
機及びデコーダ受信機がともに、高度に相関のある音声
信号の予測部分を形成する装置を含んでいれば、音声信
号の予測できない部分のみをエンコードして伝送すれば
良い。この結果、音声信号の予測符号化によつて信号を
劣化させることなくデジタルチャネルを効率良く利用で
きる。米国特許第3502986号及び第 ・3631520号に示されている予測音声信号符号化
方式では一連の音声信号サンプルから予測パラメータを
発生し、この発生したパラメータと先行する音声信号サ
ンプルとから各音声信号サンプルの予測値を形成する。
予測できる部分を含んでいる。デジタルエンコーダ送信
機及びデコーダ受信機がともに、高度に相関のある音声
信号の予測部分を形成する装置を含んでいれば、音声信
号の予測できない部分のみをエンコードして伝送すれば
良い。この結果、音声信号の予測符号化によつて信号を
劣化させることなくデジタルチャネルを効率良く利用で
きる。米国特許第3502986号及び第 ・3631520号に示されている予測音声信号符号化
方式では一連の音声信号サンプルから予測パラメータを
発生し、この発生したパラメータと先行する音声信号サ
ンプルとから各音声信号サンプルの予測値を形成する。
各サンプルとその予測値との差が量子化され、デジタル
符号化されて受信器に送られる。受信器では差信号が復
号され、受信器内で形成された対応する予測値と結合さ
れる。この方法では、すでに符号化された信号からは予
測できない信号部分のみが量子化されて送信されるため
に、チャネル容量の節約が達成できる。すなわち、音声
信号を直接符号化して送信すると速いビット速度を必要
とするのに対し、冗長な音声信号の予測できない部分の
みを伝送するのに必要なビット速度ははるかに低速で良
い。(1信号サンプルの量子化は、一般に、一群の指定
された振幅レベルのうちで信号サンプルの振幅に最も近
いレベルに対応する信号を選択的に発生する。
符号化されて受信器に送られる。受信器では差信号が復
号され、受信器内で形成された対応する予測値と結合さ
れる。この方法では、すでに符号化された信号からは予
測できない信号部分のみが量子化されて送信されるため
に、チャネル容量の節約が達成できる。すなわち、音声
信号を直接符号化して送信すると速いビット速度を必要
とするのに対し、冗長な音声信号の予測できない部分の
みを伝送するのに必要なビット速度ははるかに低速で良
い。(1信号サンプルの量子化は、一般に、一群の指定
された振幅レベルのうちで信号サンプルの振幅に最も近
いレベルに対応する信号を選択的に発生する。
しかし、この量子化によつて導入される誤差のために伝
送される信号に歪を受ける。米国特許に従つて一連のフ
イルタパラメータ信号F,,f2,・・・・・・・・・
,F,,f,+,を形成することを含むことを特徴とす
る音声信号を処理する方法。4請求の範囲第3項に従つ
て音声信号を処理する方法において、該フオルマント荷
重量子化誤差信号の形成が、Wnを該フオルマント荷重
量子化誤差信号の値とし、Enを量子化誤差信号の現在
の値とする時に、関係に従つて該量子化誤差信号を▲波
することを含むことを特徴とする音声信号を処理する方
法。
送される信号に歪を受ける。米国特許に従つて一連のフ
イルタパラメータ信号F,,f2,・・・・・・・・・
,F,,f,+,を形成することを含むことを特徴とす
る音声信号を処理する方法。4請求の範囲第3項に従つ
て音声信号を処理する方法において、該フオルマント荷
重量子化誤差信号の形成が、Wnを該フオルマント荷重
量子化誤差信号の値とし、Enを量子化誤差信号の現在
の値とする時に、関係に従つて該量子化誤差信号を▲波
することを含むことを特徴とする音声信号を処理する方
法。
請求の範囲第2乃至4項の任意の項目に従つて音声信
号を処理する方法において、該音声信号の解析が各間隔
に対して一群のピツチ関連予測パラメータ信号Bl,b
2,b3及びピツチ周期関連信号mを形成することを含
むことと、該差信号の修正が、Dnを予測された差信号
とし、もを量子化信号とする時、関係に従つて該差信号
の予測値に対応する信号を発生することを含むことと、
該差信号の該予測値が該差信号と該フオルマント荷重誤
差信号とに結合されて該修正された差信号内のピツチ関
連冗長性を減少していることとを特徴とする音声信号を
処理する方法。
号を処理する方法において、該音声信号の解析が各間隔
に対して一群のピツチ関連予測パラメータ信号Bl,b
2,b3及びピツチ周期関連信号mを形成することを含
むことと、該差信号の修正が、Dnを予測された差信号
とし、もを量子化信号とする時、関係に従つて該差信号
の予測値に対応する信号を発生することを含むことと、
該差信号の該予測値が該差信号と該フオルマント荷重誤
差信号とに結合されて該修正された差信号内のピツチ関
連冗長性を減少していることとを特徴とする音声信号を
処理する方法。
6請求の範囲第5項に従つて音声信号を処理するために
、さらに該量子化信号に応動して励起信号を発生するス
テツプと、該励起信号を該フオルマント関連予測パラメ
ータ信号と結合することによつて該音声信号の復製を形
成するステツブとを含む方法において、該励起信号を発
生するステツプが、該量子化信号の先行する部分と該ピ
ツチ関連予測パラメータ信号Bl,b2,b3と該ピツ
チ周期関連信号mとから該差信号の予測値に対応する信
号を形成することと、現在の量子化信号を該差信号の該
予測値と結合することとを含むことを特徴とする音声信
号を処理する方法。
、さらに該量子化信号に応動して励起信号を発生するス
テツプと、該励起信号を該フオルマント関連予測パラメ
ータ信号と結合することによつて該音声信号の復製を形
成するステツブとを含む方法において、該励起信号を発
生するステツプが、該量子化信号の先行する部分と該ピ
ツチ関連予測パラメータ信号Bl,b2,b3と該ピツ
チ周期関連信号mとから該差信号の予測値に対応する信
号を形成することと、現在の量子化信号を該差信号の該
予測値と結合することとを含むことを特徴とする音声信
号を処理する方法。
技術分野
本発明は音声信号のデジタル通信に関し、特に雑音の影
響を減少するよう構成された予測音声信号処理装置に関
する。
響を減少するよう構成された予測音声信号処理装置に関
する。
背景技術
電話又は他の通信システムにおけるデジタルチヤネルを
介しての伝送のための信号の符号化には、入力信号のサ
ンプリング、サンプルの量子化及び量子化されたサンプ
ルの各々に対するデジタルコードの発生が要求される。
介しての伝送のための信号の符号化には、入力信号のサ
ンプリング、サンプルの量子化及び量子化されたサンプ
ルの各々に対するデジタルコードの発生が要求される。
音声信号は高度に相関があり、従つてその過去の値から
予測できる部分を含んでいる。デジタルエンコーダ送信
機及びデコーダ受信機がともに、高度に相関のある音声
信号の予測部分を形成する装置を含んでいれば、音声信
号の予測できない部分のみをエンコードして伝送すれば
良い。この結果、音声信号の予測符号化によつて信号を
劣化させることなくデジタルチャネルを効率良く利用で
きる。米国特許第3502986号及び第 3631520号に示されている予測音声信号符号化方
式では一連の音声信号サンプルから予測パラメータを発
生し、この発生したパラメータと先行する音声信号サン
プルとから各音声信号サンプルの予測値を形成する。
予測できる部分を含んでいる。デジタルエンコーダ送信
機及びデコーダ受信機がともに、高度に相関のある音声
信号の予測部分を形成する装置を含んでいれば、音声信
号の予測できない部分のみをエンコードして伝送すれば
良い。この結果、音声信号の予測符号化によつて信号を
劣化させることなくデジタルチャネルを効率良く利用で
きる。米国特許第3502986号及び第 3631520号に示されている予測音声信号符号化方
式では一連の音声信号サンプルから予測パラメータを発
生し、この発生したパラメータと先行する音声信号サン
プルとから各音声信号サンプルの予測値を形成する。
各サンプルとその予測値との差が量子化され、デジタル
符号化されて受信器に送られる。受信器では差信号が復
号され、受信器内で形成された対応する予測値と結合さ
れる。この方法では、すでに符号化された信号からは予
測できない信号部分のみが量子化されて送信されるため
に、チヤネル容量の節約が達成できる。すなわち、音声
信号を直接符号化して送信すると速いビツト速度を必要
とするのに対し、冗長な音声信号の予測できない部分の
みを伝送するのに必要なビツト速度ははるかに低速で良
い。信号サンプルの量子化は、一般に、一群の指定され
た振幅レベルのうちで信号サンプルの振幅に最も近いレ
ベルに対応する信号を選択的に発生する。
符号化されて受信器に送られる。受信器では差信号が復
号され、受信器内で形成された対応する予測値と結合さ
れる。この方法では、すでに符号化された信号からは予
測できない信号部分のみが量子化されて送信されるため
に、チヤネル容量の節約が達成できる。すなわち、音声
信号を直接符号化して送信すると速いビツト速度を必要
とするのに対し、冗長な音声信号の予測できない部分の
みを伝送するのに必要なビツト速度ははるかに低速で良
い。信号サンプルの量子化は、一般に、一群の指定され
た振幅レベルのうちで信号サンプルの振幅に最も近いレ
ベルに対応する信号を選択的に発生する。
しかし、この量子化によつて導入される誤差のために伝
送される信号に歪を受ける。米国特許第2927962
号で述べられているように、量子化によつて導入される
雑音は、量子化された信号サンプルと元の信号サンプル
との差に対応する誤差信号を作り、予め定めた方法によ
りこの誤差信号に応じて信号サンプルを修正することに
よつて減少させることができる。この修正装置によつて
合計の量子化雑音電力は変化しないが、雑音電力は、信
号スペクトル内でその影響が最小であるような部分に集
中させることができる。テレビジヨン信号の符号化で、
この原理を用いて量子化雑音を信号帯域の上の周波数帯
に移すためのフイードバツクフイルタについては、IE
EETransactiOnsOnCircuitTh
eOry誌の1963年9月号の頁405−413にあ
る、E.G.Kimme及びF.F.KuO著の論文ゞ
シンセシス オブ オプチマル プールダース フオ
フイードバツク クオンタイゼーシヨン システム7に
示されている。
送される信号に歪を受ける。米国特許第2927962
号で述べられているように、量子化によつて導入される
雑音は、量子化された信号サンプルと元の信号サンプル
との差に対応する誤差信号を作り、予め定めた方法によ
りこの誤差信号に応じて信号サンプルを修正することに
よつて減少させることができる。この修正装置によつて
合計の量子化雑音電力は変化しないが、雑音電力は、信
号スペクトル内でその影響が最小であるような部分に集
中させることができる。テレビジヨン信号の符号化で、
この原理を用いて量子化雑音を信号帯域の上の周波数帯
に移すためのフイードバツクフイルタについては、IE
EETransactiOnsOnCircuitTh
eOry誌の1963年9月号の頁405−413にあ
る、E.G.Kimme及びF.F.KuO著の論文ゞ
シンセシス オブ オプチマル プールダース フオ
フイードバツク クオンタイゼーシヨン システム7に
示されている。
RMS誤差電力を最小化するために、一般に誤差電力を
周波数スペクトルの一定の部分に集中させるという上記
の量子化誤差減少方式は、音声信号符号方式においては
最適の雑音減少方式とはならない。
周波数スペクトルの一定の部分に集中させるという上記
の量子化誤差減少方式は、音声信号符号方式においては
最適の雑音減少方式とはならない。
その理由は、音声信号スペクトルの性質にあり、音声信
号スペクトルは、音声エネルギーが集中した短時間スペ
クトル包絡線に相当し、時間的に変動する複数個のフオ
ルマント周波数部分と、フオルマント間部分とを含んで
いるためである。音声の有声音領域ではフオルマント部
分は口腔の共振に直接関連する。従つて音声信号電力は
該フオルマント部分に集中し、フオルマント間領域は少
い音声信号電力しか含んでいない。よつて、量子化誤差
電力を周波数スペクトルの一定の部分に集中させる方式
は、電子化雑音スペクトルと変化する音声スペクトルと
の関係を考慮に入れてないために、知覚できる雑音の影
響が残されてしまう。発明の簡単な要旨 本発明は音声信号符号化装置に関し、選択された時間間
隔において音声信号を解析することによつてフオルマン
ト関連予測パラメータ信号が作られる。
号スペクトルは、音声エネルギーが集中した短時間スペ
クトル包絡線に相当し、時間的に変動する複数個のフオ
ルマント周波数部分と、フオルマント間部分とを含んで
いるためである。音声の有声音領域ではフオルマント部
分は口腔の共振に直接関連する。従つて音声信号電力は
該フオルマント部分に集中し、フオルマント間領域は少
い音声信号電力しか含んでいない。よつて、量子化誤差
電力を周波数スペクトルの一定の部分に集中させる方式
は、電子化雑音スペクトルと変化する音声スペクトルと
の関係を考慮に入れてないために、知覚できる雑音の影
響が残されてしまう。発明の簡単な要旨 本発明は音声信号符号化装置に関し、選択された時間間
隔において音声信号を解析することによつてフオルマン
ト関連予測パラメータ信号が作られる。
音声信号とその予測値との差を表わす信号が、音声信号
の現在及び先行する部分と該予測パラメータ信号とから
形成される。この差信号は雑音を選択的に制御するよう
修正される。修正された差信号は量子化され、また量子
化された信号と、量子化されていない元の修正された差
信号との差に対応する量子化誤差信号が作られる。差信
号の修正においては、量子化誤差信号とフオルマント関
連予測パラメータ信号と差信号との結合が行われ、量子
化誤差が音声信号スペクトルのフオルマント部分に集中
され、これによつて伝送された量子化雑音が音声信号フ
オルマントによつてマスクされる。本発明の1つの特徴
に従えば、量子化誤差信号は フオルマント関連予測パ
ラメータ信号に応動して修正されて、フオルマント荷重
誤差信号が作られる。
の現在及び先行する部分と該予測パラメータ信号とから
形成される。この差信号は雑音を選択的に制御するよう
修正される。修正された差信号は量子化され、また量子
化された信号と、量子化されていない元の修正された差
信号との差に対応する量子化誤差信号が作られる。差信
号の修正においては、量子化誤差信号とフオルマント関
連予測パラメータ信号と差信号との結合が行われ、量子
化誤差が音声信号スペクトルのフオルマント部分に集中
され、これによつて伝送された量子化雑音が音声信号フ
オルマントによつてマスクされる。本発明の1つの特徴
に従えば、量子化誤差信号は フオルマント関連予測パ
ラメータ信号に応動して修正されて、フオルマント荷重
誤差信号が作られる。
このフオルマント荷重誤差信号は差信号と結合されて、
量子化誤差が音声信号スペクトルのフオルマント部分に
集中され、これによつて音声信号対量子化雑音比が音声
信号スペクトルの全般にわたつて予め定めたレベル以上
に維持される。本発明の他の特徴に従えば、一群のフイ
ルタパラメータ信号がフオルマント関連予測パラメータ
信号Akから形成され、またフオルマント荷重誤差信号
が該フイルタパラメータ信号及び該誤差信号に応じて作
られる。フオルマント荷重誤差信号は誤差信号から減算
されることによつて、量子化誤差信号が音声信号スペク
トルのフオルマント部分に集中される。本発明のさらに
他の特徴に従えば、一群のフイルタパラメータ信号Fk
は一群のフオルマント予測パラメータ信号Akから、関
係に従つて形成される。
量子化誤差が音声信号スペクトルのフオルマント部分に
集中され、これによつて音声信号対量子化雑音比が音声
信号スペクトルの全般にわたつて予め定めたレベル以上
に維持される。本発明の他の特徴に従えば、一群のフイ
ルタパラメータ信号がフオルマント関連予測パラメータ
信号Akから形成され、またフオルマント荷重誤差信号
が該フイルタパラメータ信号及び該誤差信号に応じて作
られる。フオルマント荷重誤差信号は誤差信号から減算
されることによつて、量子化誤差信号が音声信号スペク
トルのフオルマント部分に集中される。本発明のさらに
他の特徴に従えば、一群のフイルタパラメータ信号Fk
は一群のフオルマント予測パラメータ信号Akから、関
係に従つて形成される。
ただしZ−1は1サンプル間隔の遅延を表わし、pは予
測パラメータ信号の数を表わす。誤差信号はフイルタパ
ラメータ信号Fkによつて修正されて、フオルマント荷
重誤差信号が作られ、差信号から減算される。
測パラメータ信号の数を表わす。誤差信号はフイルタパ
ラメータ信号Fkによつて修正されて、フオルマント荷
重誤差信号が作られ、差信号から減算される。
ただしEnは量子化雑音信号の現在の値である。音声信
号のフオルマント構造に基因する冗長性をζフオルマン
ト関連予測パラメータ信号に応じて作られた現在の音声
信号の予測値を、現在の音声信号の実際の値から減算す
ることによつて除去される。
号のフオルマント構造に基因する冗長性をζフオルマン
ト関連予測パラメータ信号に応じて作られた現在の音声
信号の予測値を、現在の音声信号の実際の値から減算す
ることによつて除去される。
しかし、1973年6月19日に提出された米国特許第
3740476号で示されているように、ピツチ関連冗
長性は結果として得られる差信号に残されている。本発
明のさらに他の特徴に従えば、一群のピツチ関連予測パ
ラメータ信号が選択された時間間隔ごとに該音声信号を
解析することによつて形成される。量子化された信号は
該ピツチ関連予測パラメータ信号と結合されて、予測差
信号が作られる。この予測差信号は差信号修正手段に印
加されて量子化信号のピツチ関連冗長性が減少させられ
る。
3740476号で示されているように、ピツチ関連冗
長性は結果として得られる差信号に残されている。本発
明のさらに他の特徴に従えば、一群のピツチ関連予測パ
ラメータ信号が選択された時間間隔ごとに該音声信号を
解析することによつて形成される。量子化された信号は
該ピツチ関連予測パラメータ信号と結合されて、予測差
信号が作られる。この予測差信号は差信号修正手段に印
加されて量子化信号のピツチ関連冗長性が減少させられ
る。
第1図は本発明の一実施例である予測音声信号符号化回
路のプロツク図を示し、第2図は第1図の回路とともに
用いられる予測音声信号復号回路のプロツク図を示し、
第3図は第1図の予測計算機のプロツク図を示し、第4
図は第1図のフイルタ係数発生・メモリ回路の詳細なプ
ロツク図を示し、第5図は第1図及び第2図のフオルマ
ント予測器の詳細なプロツク図を示し、第6図は第1図
の荷重フイルタの詳細なプロツク図を示し、第7図は第
1図及び第2図の音声周期予測器の詳細なプロツク図を
示し、第8図は第3図の予測計算機の動作を説明する波
形を示し、第9図は第1図の符号化回路の量子減少方式
を説明するグラフを示し、第10図は第1図で得られる
信号波形を示す。 詳細な説明本発明の一実施例である予測音声信号エンコ
ーダが第1図に示されている。 音声信号源101からの音声信号S(t)はフイルタ・
サンプリング回路103に印加され、ここで信号S(t
)は低域・▲波され、高周波ブレエンフアシス装置によ
つて修正され、予め定めた速度によつてサンプリングさ
れる。回路103は4kHzのしや断周波数を持つた低
域フイルタと、700Hzで始まりオクターブ当り6d
Bの勾配を持つたプレエンフアシス回路と、8kHzの
サンプリング速度CLlを持つたサンプラとを含んでい
る。フイルタ・サンプリング回路103からの相続く信
号サンプルはアナログ・デジタル変換器105に印加さ
れ、エンコーダで用いるのに適したデジタルコードSn
が各信号サンプルに対して作られる。変換器105から
の相続くコードサンプルSnは、予測バラメータ計算機
135の1つの入力に直接印加されるとともに、サンプ
ル遅延106を介してフオルマント予測器107の信号
入力及び減算回路109の加算入力に印加される。 遅延106としては、シフトレジスタ又は当業者には公
知の他の遅延素子を用いることができる。予測器107
は遅延されたコードサンプルSn及び計算機135から
の予測信号群A=Al,a2,・・・・・・・・・,A
k,・・・・・・・・・,APに応動して各サンプルご
とに、予測値コードを発生する。 ただし、Akはk番目の線形予測パラメータ係数であり
、pは予測器の次元である。当業者には公知のように、
予測器107は、1式に従い、多数の以前のサンプルの
荷重和を取る方式によつて、各信号サンプルSnの現在
の値を予測する。この予測は音声信号の短時間スペクト
ル包絡線に基づいており、予測バラメータ信号AlFa
2ツ1゜″1″?APは口腔伝達関数のフオルマント構
造に関連する。第5図は、フオルマント予測器107と
して用いることのできる、当業者には公知のトランスバ
ーサルフイルタを示している。 第5図の予測器はZ変換記号の形でとして表わすことが
できる。 ただし、Z−1は、1サンプル間隔の遅延を表わし、A
,,a2,・・・・・・・・・,Ak,・・・・・・・
・・,A,はp個の予測器係数である。第5図ではPは
10に等しい。シフトレジスタ503は10段のシフト
レジスタであり、8kHzのサンプリング速度CLlで
動作して遅延106から線501を介して送られる一連
のサンプルSnを受信する。線504−1土の、1段目
のシフトレジスタ段からの出力は、乗算器5051の1
つの入力に印加される。同様に、他のシフトレジスタ段
から線504−2乃至504一10に印加される出力は
、それぞれ乗算器505−2乃至505−10に印加さ
れる。計算機135からの線形予測係数信号A=A,,
a2,...・・・・・・AlOは線510を介して乗
算器505−1乃至505−10に印加される。各乗算
器は積Sn−Kakを作るように動作し、これらの積は
加算器507−2乃至507−10によつて同時に加算
される。よつて、出力線512には、1式で示される積
の和を表わす信号が得られる。線512からの予測信号
は減算回路109の負入力に印加され、この信号が現在
のコードサンプルSnから減算される。この結果得られ
る差信号は、そのフオルマント冗長性が除去された音声
信号に対応する。フオルマント冗長性の除去は第10に
示されており、同図で波形1001は情報源101から
の音声信号でフオルマント及びピツチの冗長性を共に持
つているものを示している。波形1003は式3の差信
号に対応しており、予測されたフオルマント成分は音声
信号から除去されているが、ピツチ周期に関連する冗長
性は残されている。減算回路109からの差信号Dnは
修正回路137に印加される。 回路137は差信号に残されているピツチ周期冗長性を
除去するための音声周期予測器128及びその識別効果
を減少させるために差信号内の量子化雑音を分散させる
ための重みづけフイルタ120を含んでいる。修正回路
137の出力Qnは量子化器111の入力に印加される
。量子化器111は当業者には公知のように、その入力
における差信号サンプルの各々の大きさに応じて予め定
めた振幅レベルの群の1つを選択する。量子化器111
において、ステツプ幅Δ、すなわち量子化器振幅レベル
間の差は、修正された差信号の統計的性質によつて決定
され、予測パラメータ計算機135によつて作られる。
量子化器111の出力介。はデジタルエンコーダ112
を介して減算回路113及び加算器131に印加される
。加算器131及び音声周期予測器128は一連の以前
の差コード、量子化器出力信号、予測器パラメータ信号
B=Bl,b2,b3及び現在の音声信号セグメントの
ピツチ周期を表わすコードmに応動して、差信号サンプ
ルDn各々に対して、予測値コードd′nを形成するよ
う構成されている。加算器131は信号介。と予測差信
号との和を作り、これを予測器128に印加する。予測
器128は次式に従い、またZ変換形式では で特徴づけられる方式によつて、現在の差信号の予測し
た値を発表する。 ただしz−mはmサンプル分の遅れであり、Bl,b2
及びB3は、差信号Dnと、その予測値との差の2乗平
均予測誤差を最小にすることによつて決定される予測係
数信号である。信号m及びBl,b2及びB3は、各音
声信号の間隔において、計算機135で作られる。 現在の差信号に対する予測値コードは減算回路126に
おいて現在の差信号Dnから減算され、これによつピツ
チ周期に関連する冗長性は差信号から除去される。第1
0図の波形1005は減算回路126でピツチ周期を除
去した後での差信号を示している。音声波形1001及
び差信号波形1003とは対照的、波形1005はその
性質が雑音的であり、フオルマント及びピツチに関連す
る冗長性を両方共に除去したことを示している。第7図
は予測器128を詳細に示している。第7図で、シフト
レジスタ703は120段から成り、これらの段は加算
器131から受信される一連のサンプルを蓄える。12
0段は、15msの時間長を表わし、これは想定される
最も長いピツチ間隔である。 各シフトレジスタ段の出力は選択回路705に印加され
る。回路705は、4a式及び4b式に従つて計算機1
35で作られたピツチ周期関連コードmに応動して、3
つの隣り合つたシフトレジスタ段の出力を選択してゲー
トする。選択された段のうちの最も左の段の出力は乗算
器706−1に印加される。同様に選択された隣接する
シフトレジスタ段の出力はそれぞれ乗算器706−2及
び706−3に印加される。予測パラメータ信号B,,
b2及びB3は計算機135から線711を介して乗算
器706−1,706−2及び706−3に印加される
。乗算器706−1,706−2及び706−3からの
積コードは加算器707−2及び707−3によつて加
算され、現在の差信号に対する予測値コードが線712
に現れる。予測パラメータ計算機135は、フオルマン
ト予測器107及び音声周期予測器128で必要な予測
パラメータ信号や、コータで使われるステツプ幅や他の
信号を発生する。 当業者には公知のように、音声信号は定常的ではない。
しかし、音声の時間的な変化特性は比較的ゆつくりして
いるため、8kHzのサンプリング速度においては、変
化する信号に対して10msごとに予測パラメータを適
用すれば十分である。よつて、予測パラメータ計算機1
35は10m8の時間フレームの間において音声サンプ
ルSnを受信し、10msの時間フレームの各々に対す
る予測パラメータ信号を作つて信号変化状態に適合させ
る。第3図は、計算機135に適した処理装置を示して
いる。 第3図において、処理装置309はサンプルメモリ32
0に蓄えられた信号情報を受信し、またリードオンリメ
モリ303及び305に永久に蓄えられているプログラ
ム情報を制御器307を介して受信する。受信された信
号及びプログラム情報に応動して、処理装置309は一
群のフオルマント関連線形予測係数A=Al,a2,・
・・・・・・・・,A,O、一群のピツチ関連予測係数
信号B=Bl,b2,b3、一群のフオルマント関連部
分相関係数信号Rl,r2,・・・・・・・・・,Rl
O,及びRMS値信号2R、ピツチ周期関連信号m、及
びステツプ幅信号を発生し、これらは第1図のエンコー
ダの他の部分で用いられる。処理装置309からの出力
信号は、第3図に示した出力メモリ331乃至336に
蓄えられる。処理装置309としては、CSP社のマク
ロアリスメテイツクプロセツサシステム100や、他の
、当業者には公知のプロセツサ装置を用いることができ
る。第3図の制御器307は音声信号の10msの時間
フレームの各々を3つの予め定めた時間間隔に分割する
。これらの間隔は特定の動作モードのために用いられる
。この動作モードは第8図に示されている。第1図のク
ロツク140からのクロツクパルスCL2は、10ms
間隔であり、10ms時間フレームを定義している。第
8図でCL2クロツクパルスは、時刻T,に生じ、これ
が10ms時間フレームの始まりとなる。このCL2ク
ロツクパルスは、波形805で示したように、制御器3
07をそのデータ入力モードに置く。データ入力モード
中、制御器307は処理装置309及び音声サンプルメ
モリ320に接続される。先行する10ms時間フレー
ム中にサンプルメモリ320に書込まれた80個のSn
サンプルコードが、制御器307からの制御信号に応動
して入出力インターフエイス318を介してデータメモ
リ316に転送される。波形805で示したように、デ
ータ入力モードは時刻T2で終了するが、この時点にお
いてはサンプルメモリ320からの80個のサンプルコ
ードはデータメモリ316の予め定めたアドレスに格納
されている。蓄えられた80ケのサンプルがデータメモ
リに転送されている間に、現在のフレームのサンプルは
クロツクパルスCLlの制御の下にメモリ320へ書込
まれている。時刻T2の直後、制御器307は、波形8
07で示すようにそのフオルマント予測パラメータモー
ドに入る。 フオルマント予測パラメータモード中においては、予測
パラメータプログラムメモリ303が、制御器307、
制御器インターフエイス回路310及びバス340を介
して中央処理装置312に接続される。ROM3O3か
らの、永久に蓄えられた命令に応動して、処理装置30
9はフオルマント部分相関係数信号咄=R,,r2,・
・・・・・・・・,RlO、及びフオルマント線形予測
係数信号A=a1乃至AlOを発生する。信号A及びR
mはそれぞれメモリ331及び333に転送される。フ
オルマント予測信号を発生するためにROM3O3に蓄
えられている命令は付録1にフオートラン言語の形で示
されている。当業者には公知のように、パラメータ信号
は、その要素がであるような共分散マトリクスp、及び
音声相関係数を形成することによつて作られる。 次に要素g1乃至G,。がに基づいて計算される。 ただし、Tは三角分確 をとることによつて得られる下三角マトリクスである。 次に、部分相関係数Rmはに従つて計算される。 ただし、COはによつて求められ、10ms時間フレー
ム内の音声信号のエネルギーに対応する。 フオルマント予測パラメータ信号A=A,,a2,・・
・・・・・・・,AlOは次のような再帰式に従つて部
分相関パラメータ信号Rmから計算される。すなわちフ
オルマント予測パラメータモード沖において処理装置3
09によつて作られた部分相関パラメータ信号Rrrl
及び線形予測パラメータ信号Aiは、データメモリ31
6から、メモリ331及び333に転送されて、次の1
0ms時間フレームにおいて用いられる。 信号Aは、フイルタ係数発生器・メモリ122にも送ら
れる。フオルマント予測パラメータモード中、制御器3
07はクロツク140からのCLlクロツクパルスを計
数してこのモードの終了時刻を決定する。部分相関及び
線形予測の両万のパラメータ信号がメモリ331及び3
33へ転送された後の、時刻T3において、制御器30
7は波形809で示したようにそのピツチ予測パラメー
タモードに入る。 時刻T3とT4の間で、制御器307はピツチ予測プロ
グラムメモリ305を制御器インターフエイス310及
びバス340を介して中央処理装置312に接続してい
る。ROM3O5内の命令コードは、付録2にフオート
ラン言語の形で示されているが、これは、第1図の音声
周期予測器128で用いられるピツチパラメータ信号B
l,b2及びB3及びピツチ関連信号mを形成する。付
録2のフオートランプログラムに従えば、処理装置30
9はピツチ予測モード中において、次の式11で示すよ
うに、予め定めた時間間隔内における差信号DnとDn
−1の間の相関を計算し、ζiが最大であるような時間
インデツクスiを決定する。ζiが最大である時刻一が
、制御器30Tの制御の下でデータメモリ316から送
出される。 処理装置309はからに、を最小にする方法により、ピ
ツチ了測パラメータB,,b2及びB3を計算する。 ピーククリツパ124に対する数値2Rは、に従つて計
算される。 量子化器111で用いられるステツブ幅値Δはに基づい
て計算される。 これは、IRETransactiOnsOnInfO
rmatiOnTheOry誌の1960年3月号、I
T−6巻、頁7一121にあるJOelM&x著の論文
゛Q鳳NtizimgfOrMinimumDistO
rtiOn″に示されている3レベル量子化器のための
ものである。 2R及びΔは時刻T4までにそれぞれメモリ334及び
336に送られる。 時刻T,乃至T,の間の10ms時間フレームにおいて
、メモリ331乃至336の出力は、時刻T,に先行す
る10ms時間フレームに得られた信号値Snに対応す
るものである。時間T,乃至T4においてこれらのメモ
リに入れられたパラメータ信号は、時刻T,において制
御器30Tからの制御信号に応動してこれらのメモリの
出力に出される。時間T,乃至T,において計算された
これらのパラメータ信号は、次の時間フレームにおいて
第1図のエンコーダを制御するのに用いられる。アナロ
グ・デジタル変換器105からのサンプル信号は遅延1
06において10msだけ遅延されているため、計算機
135からのパラメータ信号は、予測器IOT及び12
8、及び量子化器111で処理中のサンプル信号Snの
ものに対応している。量子化器111で作られるデジタ
ルコータ112からの出力は、一連のデジタルコード介
nであり、これは音声信号の予測されなかつた成分、す
なわちフオルマント及びピツチに関連する冗長性を除去
した音声信号を表わす。 量子化器111で用いられている予め定めた振幅レベル
は、量子化器111に印加されるサンプルQnの大きさ
には等しくないため、に相当する歪すなわち量子化雑音
が、デジタルコータ112からの信号分nに存在する。 この歪は、通信チャネル150を介して伝送され、第2
図のデコーダ回路の出力で再構成される音声信号合(t
)にも現われる。伝送された信号内の量子化雑音は効率
の良い予測をすることによつて減少させることができる
。 しかし、このような減少は、再構成された音声信号内で
感知される歪を小さくすることを保証するものではない
。なぜなら、歪は、音声スペクトルとの関連においてみ
た量子化雑音のスペクトルに依存するためである。音声
信号のスペクトルは時間的に変化するフオルマント領域
、すなわち音声信号電力が集中している領域と、信号電
力が比較的小さいフオルマント間領域とによつて特徴づ
けられる。音声信号の一部分の典型的なスペクトルを第
9図の波形901に示す。しかし、量子化雑音Enの周
波数は波形903に示したように、一般に一様に分布し
ている。第9図の波形901及び903から用らかなよ
うに、波形903の量子化雑音はフオルマント領域では
音声信号電力より小さいが、音声信号レベルの小さいフ
オルマント間領域では優位である。 特に周波数Fa及びFbのオルマントピークの間のフオ
ルマント間領域では、波形903の量子化雑音は音声信
号より大きい。さらに、音声信号対量子化雑音比は、フ
オルマント周波数の位置では比較的大きいのに、1フオ
ルマント間領域でははるかに小さい。当業者には公知の
ように、量子化雑音スペクトルは、平均量子化雑音が一
定という条件のもとでフイルタによつて変形させること
ができる。 従来技術によるフィルタ方式では、量子化雑音をスペク
トル上の高い周波数部分へシフトするか、あるいは雑音
のRMS値を最小にするという特性を持つていた。しか
しこのようなフイルタ方式は、特性を変化させることが
できないため、フオルマントが時間的に変動するような
音声信号での知覚雑音を減少させるのには効率が悪い。
本発明に従い、フオルマントに関連した予測パラメータ
信号によつて制御される特徴を持つた適応フイードバツ
クフイルタが導入される。 適応フイルタは、量子化雑音を音声信号の時間的に変化
するフオルマント部分に集中させる動きをし、このため
量子化雑音は変動する音声信号のフオルマントによつて
常にマスクされてしまう。このようにして望ましい形で
再分散させた量子化雑音のスペクトルを波形905に示
す。波形905に示すように、量子化雑音電力は波形9
01の音声信号スペクトルのフオルマント部分に集中し
、この結果、知覚雑音の影響の大きいフオルマント間領
域での量子化雑音電力が減少している。このようにして
、音声信号対量子化雑音比は、音声信号スペクトルの全
般にわたつて許容値以上に維持される。この方法により
、量子化雑音による知覚歪が減少させられる。第1図で
、量子化雑音マスク装置は、適応荷重フイルタ120を
含み、このフイルタ120は減算回路113で作られる
量子化誤差信号Enを係数発生器122からのパーラメ
ータ信号に従つて変形させる。 これらのパラメータ信号は計算機135で作られるフオ
ルマント予測パラメータ信号Δ=Al,a2,・・・・
・・・・・,A,に応動して作られる。第1図の回路内
での量子化に原因する歪は15式の量子化誤差Enを、
フオルマント予測器107とフイードバツクフイルタ1
20との伝達関数で修正したもので次式のように表わす
ことができる。ただし、Eは誤差信号Enの短時間フー
リエ変換であり、Fは荷重フイルタ120の伝達関数の
短時間フーリエ変換であり、P8はフオルマント予測器
107の伝達関数の短時間フーリエ変換を表わす。 よつて、エンコーダ出力信号の量子化雑音電力スペクト
ルは、式16に従つて変形される。z変換の形での関数
が波形905の雑音スペクトル分布を得るために必要な
量子化雑音沢波を与えることが判つている。 式17は次のように簡単になる。フオルマント予測器1
07の伝達関数はZ変換形式ではとなり、 式18のフイルタ伝達関数は となる。 式20から、荷重フィルタ120を制御するためのパラ
メータ信号はとなる。 式21を見ると、荷重フイルタパラメータ信号f1乃至
F,,はフオルマント予測パラメータ信号a1乃至Al
Oに直接関係することがわかる。 フオルマント予測パラメータ信号A,乃至AlOは、時
間的に変動する音声信号に応動して変化するため、荷重
フイルタパラメータ信号f1乃至Fllは、波形905
の量子化雑音スペクトルが波形901の音声信号の変化
しているフオルマント特性に追随するように変化する。
このような方法により、介。信号内の量子化雑音スペク
トルは、音声信号のフオルマント周波数部分によつて常
にマスクされ、音声スペクトルの全般にわたつて最大の
音声信号対量子化雑音比が得られる。フイルタ係数発生
器・メモリ122は第4図に詳細に示されている。 第4図において、パラメータ信号a1は2で除算する回
路422−1に直接印加されており、この回路422−
1は右に1ビツトだけシフトするシフトレジスタによつ
て構成できる。当業者には公知のように、2進コードを
右にlビツトシフトすることは該コードを2で割ること
に相当する。2除算回路422−1の出力はパラメータ
信号f1である。 パラメータ信号a1及びA2は加算回路420−2で加
算され、その結果は回路422−2において2で除算さ
れる。同様に、加算器420−3はA2及びA3バラメ
ータの和をとり、2除算回路422−3の出力はフイル
タパラメータF3となる。同様に、フイルタパラメータ
F4乃至F,は第4図には示されていない同様の回路に
おいて作られる。フイルタパラメータFlOは加算器4
20−10からの出力を受信する2除算回路422−1
0から得られる。パラメータ信号AlOは回路422−
11で2で除算されてフィルタパラメータ信号Fl,と
なる。フイルタパラメータ信号f1乃至Fllは式21
に従つて第4図の回路で作られ、荷重フイルタ120で
これらのフイルタパラメータ信号を用いる時間フレーム
に先行する10ms時間フレームにおいてメモリ430
の入力部に転送される。次の10msフレームの開始時
において、クロツク140からのクロツク信号CL2に
応動して、メモリ430の入力部のフイルタパラメータ
信号はその出力部へ転送される。このようにして、フイ
ルタパラメータ信号は正しい10ms時間フレームにお
いてフイルタ120内の80サンプル群の各々に割当て
られる。フイルタ係数発生器・メモリ122からのフイ
ルタ係数信号f1乃至F,lは線123を介してフイル
タ120に印加される。 荷重フイルタ回路120は第6図に詳細に示されている
。第6図において、減算器113からの誤差信号サンプ
ルEnは線6旧を介して11段シフトレジスタ603に
順次印加される。信号Enは、当業者には公知のように
、クロツク140からのクロツクパルスCLlによつて
右に順次シフトされる。フイルタパラメータ信号f1乃
至Fllは線610を介してそれぞれ乗算器605−1
乃至605一11に印加される。誤差信号En,en−
,,・・・・・・・・・,En−1,はシフトレジスタ
603の各段からそれぞれ線604−1乃至604−1
1を介して乗算器605−1乃至605−11に印加さ
れる。乗算器605−1は予測コードFlenを形成す
る。同様に乗算器605−11は積コードFllen−
11を形成する。 乗算器605−1乃至605−11の出力は加算器60
5−2乃至607−11で順次加算され、フオルマント
荷重誤差信号が線612に現われる。 フオルマント荷重誤差信号Wnはピーククリツパ回路1
24を介して減算器126に印加される。 ピーククリツパ回路124において、コード信号wは計
算機135のメモリ337からのRMS信号2Rと比較
される。現在の荷重誤差信号の値が(wl〈2R(23
) であると、wは直接減算器126に印加される。 しかし、であると、もし信号wが正であれば、信号2R
が減算器126に印加される。 またwが負であると、信号−2Rが減算器126に印加
される。このようにして、誤差荷重フイルタ120によ
つて作られるフイードバツク信号の大きさは、差信号D
n(7)RMS値の2倍に制限される。減算器126の
出力は、音声信号の予測されていない成分を、フイード
バツクフイルタによる量子化誤差信号で修正したものに
相当する。 この結果コータ112から得られる出力介1は、音声信
号の量子化された非予測成分で、修正された量子化雑音
スペクトルを持つものになる。介。は、ピツチパラメー
タ信号B及びm1部分相関パラメータ信号Rm及びステ
ツプ幅信号Δとともにマルチプレクサ・変調回路115
に印加される。回路115は適切な変調信号を形成し、
この信号は通信チヤンネル150を介して第2図のデコ
ーダ回路に送信される。第2図に示したデコーダ回路は
通信チヤネル150からの伝送信号を受信して、情報源
101から第1図のエンコーダに最初印加された音声信
号S(t)を復製する。 第2図で、復調・デマルチプレクサ回路20.1は通信
チャネル150上の信号に応動して量子化された非予側
信号介1及びステツプ幅信号Δをデジタルデコーダ20
3に印加する。当業者には公知のように、デコーダ20
3は信号介。をステップ幅信号Δをものさしにして計り
、計られた量子化信号が加算回路205の1つの入力に
印加される。加算回路205の他の入力には、音声周期
予測器217からの信号が印加される。復調・デマルチ
プレクサ201からの、各10ms時間フレームに対す
るピツチ関連パラメータ信号B=Bl,b2,b3及び
mは、ピツチ係数メモリ213に蓄えられ、ここから予
測器217に印加される。予測器217は、その詳細を
第7図に示した第1図の予測器128と同じものである
。加算器205からの一連の信号コードと、メモリ21
3からの予測パラメータ信号Bl,b2,b3及びmと
に応動して、予測器217は音声信号のピツチ関連予測
成分を形成して、この成分を加算器205に印加する。
加算器205の出口は励起信号を表わし、音声信号の非
予測成分及びピツチ関連予測成分を含んでいる。加算器
205からの励起信号は次に加算器207の一方の入力
に印加され、またその他方の入力はフオルマント予測器
219から得られる。有利なことに、音声周期予測器2
17を用いた励起信号形成手法は、音声信号の有声音及
び無声音セグメントの検出で必要とせず、また無声音励
起のために雑音源を必要としない。デマルチプレクサ2
01からの、各10ms時間フレームに対するフオルマ
ント関連部分相関パラメータ信号Rmは係数変換器・メ
モリ215に転送される。 変換器215は部分相関パラメータ信号Rmを線形予測
パラメータ信号A=Al,a2,・・・・・・・・・,
AlOに変換する。係数変換器215は、第1図の計算
器135で用いられたような処理装置あるいは当業者に
公知の他のマイクロプロセツサを用いることができる。
変換器215は、式10の再帰式に基づいて部分相関パ
ラメータ信号Rmから、フオルマント線形予測パラメー
タ信号Al,a2,・・・・・・・・・,AlOを形成
する信号Rmは、当業者には公知のように安定度を増す
ために第2図の受信器に伝送される。フオルマント予測
器219はその詳細を第5図に示した第1図の予測器1
07と同じものである。 加算器207からの励起信号列と変換器215からのフ
オルマント予測パラメータ信号Al,a2,・・・・・
・・・・,A,Oとに応動して、フオルマント予測器2
19は音声信号の予測されたフオルマント成分を発生す
るよう動作する。この結果加算器207の出力は復製信
号コード営。の列に対応する。加算器207の出力はフ
イルタ209に印加される。フイルタ209は、フイル
タ103内のプレエンフアシス回路の効果を相殺するた
めの逆エンフアシス回路と、第1図のフイルタ103の
フイルタ機構に対応する低減フイルタとを含んでいる。
フイルタ209からの一連の信号サンプルは、テジタル
・アナログ変換器211によつてアナログ復製信号営(
t)に変換される。本発明についてその一実施例を参照
して説明した。
路のプロツク図を示し、第2図は第1図の回路とともに
用いられる予測音声信号復号回路のプロツク図を示し、
第3図は第1図の予測計算機のプロツク図を示し、第4
図は第1図のフイルタ係数発生・メモリ回路の詳細なプ
ロツク図を示し、第5図は第1図及び第2図のフオルマ
ント予測器の詳細なプロツク図を示し、第6図は第1図
の荷重フイルタの詳細なプロツク図を示し、第7図は第
1図及び第2図の音声周期予測器の詳細なプロツク図を
示し、第8図は第3図の予測計算機の動作を説明する波
形を示し、第9図は第1図の符号化回路の量子減少方式
を説明するグラフを示し、第10図は第1図で得られる
信号波形を示す。 詳細な説明本発明の一実施例である予測音声信号エンコ
ーダが第1図に示されている。 音声信号源101からの音声信号S(t)はフイルタ・
サンプリング回路103に印加され、ここで信号S(t
)は低域・▲波され、高周波ブレエンフアシス装置によ
つて修正され、予め定めた速度によつてサンプリングさ
れる。回路103は4kHzのしや断周波数を持つた低
域フイルタと、700Hzで始まりオクターブ当り6d
Bの勾配を持つたプレエンフアシス回路と、8kHzの
サンプリング速度CLlを持つたサンプラとを含んでい
る。フイルタ・サンプリング回路103からの相続く信
号サンプルはアナログ・デジタル変換器105に印加さ
れ、エンコーダで用いるのに適したデジタルコードSn
が各信号サンプルに対して作られる。変換器105から
の相続くコードサンプルSnは、予測バラメータ計算機
135の1つの入力に直接印加されるとともに、サンプ
ル遅延106を介してフオルマント予測器107の信号
入力及び減算回路109の加算入力に印加される。 遅延106としては、シフトレジスタ又は当業者には公
知の他の遅延素子を用いることができる。予測器107
は遅延されたコードサンプルSn及び計算機135から
の予測信号群A=Al,a2,・・・・・・・・・,A
k,・・・・・・・・・,APに応動して各サンプルご
とに、予測値コードを発生する。 ただし、Akはk番目の線形予測パラメータ係数であり
、pは予測器の次元である。当業者には公知のように、
予測器107は、1式に従い、多数の以前のサンプルの
荷重和を取る方式によつて、各信号サンプルSnの現在
の値を予測する。この予測は音声信号の短時間スペクト
ル包絡線に基づいており、予測バラメータ信号AlFa
2ツ1゜″1″?APは口腔伝達関数のフオルマント構
造に関連する。第5図は、フオルマント予測器107と
して用いることのできる、当業者には公知のトランスバ
ーサルフイルタを示している。 第5図の予測器はZ変換記号の形でとして表わすことが
できる。 ただし、Z−1は、1サンプル間隔の遅延を表わし、A
,,a2,・・・・・・・・・,Ak,・・・・・・・
・・,A,はp個の予測器係数である。第5図ではPは
10に等しい。シフトレジスタ503は10段のシフト
レジスタであり、8kHzのサンプリング速度CLlで
動作して遅延106から線501を介して送られる一連
のサンプルSnを受信する。線504−1土の、1段目
のシフトレジスタ段からの出力は、乗算器5051の1
つの入力に印加される。同様に、他のシフトレジスタ段
から線504−2乃至504一10に印加される出力は
、それぞれ乗算器505−2乃至505−10に印加さ
れる。計算機135からの線形予測係数信号A=A,,
a2,...・・・・・・AlOは線510を介して乗
算器505−1乃至505−10に印加される。各乗算
器は積Sn−Kakを作るように動作し、これらの積は
加算器507−2乃至507−10によつて同時に加算
される。よつて、出力線512には、1式で示される積
の和を表わす信号が得られる。線512からの予測信号
は減算回路109の負入力に印加され、この信号が現在
のコードサンプルSnから減算される。この結果得られ
る差信号は、そのフオルマント冗長性が除去された音声
信号に対応する。フオルマント冗長性の除去は第10に
示されており、同図で波形1001は情報源101から
の音声信号でフオルマント及びピツチの冗長性を共に持
つているものを示している。波形1003は式3の差信
号に対応しており、予測されたフオルマント成分は音声
信号から除去されているが、ピツチ周期に関連する冗長
性は残されている。減算回路109からの差信号Dnは
修正回路137に印加される。 回路137は差信号に残されているピツチ周期冗長性を
除去するための音声周期予測器128及びその識別効果
を減少させるために差信号内の量子化雑音を分散させる
ための重みづけフイルタ120を含んでいる。修正回路
137の出力Qnは量子化器111の入力に印加される
。量子化器111は当業者には公知のように、その入力
における差信号サンプルの各々の大きさに応じて予め定
めた振幅レベルの群の1つを選択する。量子化器111
において、ステツプ幅Δ、すなわち量子化器振幅レベル
間の差は、修正された差信号の統計的性質によつて決定
され、予測パラメータ計算機135によつて作られる。
量子化器111の出力介。はデジタルエンコーダ112
を介して減算回路113及び加算器131に印加される
。加算器131及び音声周期予測器128は一連の以前
の差コード、量子化器出力信号、予測器パラメータ信号
B=Bl,b2,b3及び現在の音声信号セグメントの
ピツチ周期を表わすコードmに応動して、差信号サンプ
ルDn各々に対して、予測値コードd′nを形成するよ
う構成されている。加算器131は信号介。と予測差信
号との和を作り、これを予測器128に印加する。予測
器128は次式に従い、またZ変換形式では で特徴づけられる方式によつて、現在の差信号の予測し
た値を発表する。 ただしz−mはmサンプル分の遅れであり、Bl,b2
及びB3は、差信号Dnと、その予測値との差の2乗平
均予測誤差を最小にすることによつて決定される予測係
数信号である。信号m及びBl,b2及びB3は、各音
声信号の間隔において、計算機135で作られる。 現在の差信号に対する予測値コードは減算回路126に
おいて現在の差信号Dnから減算され、これによつピツ
チ周期に関連する冗長性は差信号から除去される。第1
0図の波形1005は減算回路126でピツチ周期を除
去した後での差信号を示している。音声波形1001及
び差信号波形1003とは対照的、波形1005はその
性質が雑音的であり、フオルマント及びピツチに関連す
る冗長性を両方共に除去したことを示している。第7図
は予測器128を詳細に示している。第7図で、シフト
レジスタ703は120段から成り、これらの段は加算
器131から受信される一連のサンプルを蓄える。12
0段は、15msの時間長を表わし、これは想定される
最も長いピツチ間隔である。 各シフトレジスタ段の出力は選択回路705に印加され
る。回路705は、4a式及び4b式に従つて計算機1
35で作られたピツチ周期関連コードmに応動して、3
つの隣り合つたシフトレジスタ段の出力を選択してゲー
トする。選択された段のうちの最も左の段の出力は乗算
器706−1に印加される。同様に選択された隣接する
シフトレジスタ段の出力はそれぞれ乗算器706−2及
び706−3に印加される。予測パラメータ信号B,,
b2及びB3は計算機135から線711を介して乗算
器706−1,706−2及び706−3に印加される
。乗算器706−1,706−2及び706−3からの
積コードは加算器707−2及び707−3によつて加
算され、現在の差信号に対する予測値コードが線712
に現れる。予測パラメータ計算機135は、フオルマン
ト予測器107及び音声周期予測器128で必要な予測
パラメータ信号や、コータで使われるステツプ幅や他の
信号を発生する。 当業者には公知のように、音声信号は定常的ではない。
しかし、音声の時間的な変化特性は比較的ゆつくりして
いるため、8kHzのサンプリング速度においては、変
化する信号に対して10msごとに予測パラメータを適
用すれば十分である。よつて、予測パラメータ計算機1
35は10m8の時間フレームの間において音声サンプ
ルSnを受信し、10msの時間フレームの各々に対す
る予測パラメータ信号を作つて信号変化状態に適合させ
る。第3図は、計算機135に適した処理装置を示して
いる。 第3図において、処理装置309はサンプルメモリ32
0に蓄えられた信号情報を受信し、またリードオンリメ
モリ303及び305に永久に蓄えられているプログラ
ム情報を制御器307を介して受信する。受信された信
号及びプログラム情報に応動して、処理装置309は一
群のフオルマント関連線形予測係数A=Al,a2,・
・・・・・・・・,A,O、一群のピツチ関連予測係数
信号B=Bl,b2,b3、一群のフオルマント関連部
分相関係数信号Rl,r2,・・・・・・・・・,Rl
O,及びRMS値信号2R、ピツチ周期関連信号m、及
びステツプ幅信号を発生し、これらは第1図のエンコー
ダの他の部分で用いられる。処理装置309からの出力
信号は、第3図に示した出力メモリ331乃至336に
蓄えられる。処理装置309としては、CSP社のマク
ロアリスメテイツクプロセツサシステム100や、他の
、当業者には公知のプロセツサ装置を用いることができ
る。第3図の制御器307は音声信号の10msの時間
フレームの各々を3つの予め定めた時間間隔に分割する
。これらの間隔は特定の動作モードのために用いられる
。この動作モードは第8図に示されている。第1図のク
ロツク140からのクロツクパルスCL2は、10ms
間隔であり、10ms時間フレームを定義している。第
8図でCL2クロツクパルスは、時刻T,に生じ、これ
が10ms時間フレームの始まりとなる。このCL2ク
ロツクパルスは、波形805で示したように、制御器3
07をそのデータ入力モードに置く。データ入力モード
中、制御器307は処理装置309及び音声サンプルメ
モリ320に接続される。先行する10ms時間フレー
ム中にサンプルメモリ320に書込まれた80個のSn
サンプルコードが、制御器307からの制御信号に応動
して入出力インターフエイス318を介してデータメモ
リ316に転送される。波形805で示したように、デ
ータ入力モードは時刻T2で終了するが、この時点にお
いてはサンプルメモリ320からの80個のサンプルコ
ードはデータメモリ316の予め定めたアドレスに格納
されている。蓄えられた80ケのサンプルがデータメモ
リに転送されている間に、現在のフレームのサンプルは
クロツクパルスCLlの制御の下にメモリ320へ書込
まれている。時刻T2の直後、制御器307は、波形8
07で示すようにそのフオルマント予測パラメータモー
ドに入る。 フオルマント予測パラメータモード中においては、予測
パラメータプログラムメモリ303が、制御器307、
制御器インターフエイス回路310及びバス340を介
して中央処理装置312に接続される。ROM3O3か
らの、永久に蓄えられた命令に応動して、処理装置30
9はフオルマント部分相関係数信号咄=R,,r2,・
・・・・・・・・,RlO、及びフオルマント線形予測
係数信号A=a1乃至AlOを発生する。信号A及びR
mはそれぞれメモリ331及び333に転送される。フ
オルマント予測信号を発生するためにROM3O3に蓄
えられている命令は付録1にフオートラン言語の形で示
されている。当業者には公知のように、パラメータ信号
は、その要素がであるような共分散マトリクスp、及び
音声相関係数を形成することによつて作られる。 次に要素g1乃至G,。がに基づいて計算される。 ただし、Tは三角分確 をとることによつて得られる下三角マトリクスである。 次に、部分相関係数Rmはに従つて計算される。 ただし、COはによつて求められ、10ms時間フレー
ム内の音声信号のエネルギーに対応する。 フオルマント予測パラメータ信号A=A,,a2,・・
・・・・・・・,AlOは次のような再帰式に従つて部
分相関パラメータ信号Rmから計算される。すなわちフ
オルマント予測パラメータモード沖において処理装置3
09によつて作られた部分相関パラメータ信号Rrrl
及び線形予測パラメータ信号Aiは、データメモリ31
6から、メモリ331及び333に転送されて、次の1
0ms時間フレームにおいて用いられる。 信号Aは、フイルタ係数発生器・メモリ122にも送ら
れる。フオルマント予測パラメータモード中、制御器3
07はクロツク140からのCLlクロツクパルスを計
数してこのモードの終了時刻を決定する。部分相関及び
線形予測の両万のパラメータ信号がメモリ331及び3
33へ転送された後の、時刻T3において、制御器30
7は波形809で示したようにそのピツチ予測パラメー
タモードに入る。 時刻T3とT4の間で、制御器307はピツチ予測プロ
グラムメモリ305を制御器インターフエイス310及
びバス340を介して中央処理装置312に接続してい
る。ROM3O5内の命令コードは、付録2にフオート
ラン言語の形で示されているが、これは、第1図の音声
周期予測器128で用いられるピツチパラメータ信号B
l,b2及びB3及びピツチ関連信号mを形成する。付
録2のフオートランプログラムに従えば、処理装置30
9はピツチ予測モード中において、次の式11で示すよ
うに、予め定めた時間間隔内における差信号DnとDn
−1の間の相関を計算し、ζiが最大であるような時間
インデツクスiを決定する。ζiが最大である時刻一が
、制御器30Tの制御の下でデータメモリ316から送
出される。 処理装置309はからに、を最小にする方法により、ピ
ツチ了測パラメータB,,b2及びB3を計算する。 ピーククリツパ124に対する数値2Rは、に従つて計
算される。 量子化器111で用いられるステツブ幅値Δはに基づい
て計算される。 これは、IRETransactiOnsOnInfO
rmatiOnTheOry誌の1960年3月号、I
T−6巻、頁7一121にあるJOelM&x著の論文
゛Q鳳NtizimgfOrMinimumDistO
rtiOn″に示されている3レベル量子化器のための
ものである。 2R及びΔは時刻T4までにそれぞれメモリ334及び
336に送られる。 時刻T,乃至T,の間の10ms時間フレームにおいて
、メモリ331乃至336の出力は、時刻T,に先行す
る10ms時間フレームに得られた信号値Snに対応す
るものである。時間T,乃至T4においてこれらのメモ
リに入れられたパラメータ信号は、時刻T,において制
御器30Tからの制御信号に応動してこれらのメモリの
出力に出される。時間T,乃至T,において計算された
これらのパラメータ信号は、次の時間フレームにおいて
第1図のエンコーダを制御するのに用いられる。アナロ
グ・デジタル変換器105からのサンプル信号は遅延1
06において10msだけ遅延されているため、計算機
135からのパラメータ信号は、予測器IOT及び12
8、及び量子化器111で処理中のサンプル信号Snの
ものに対応している。量子化器111で作られるデジタ
ルコータ112からの出力は、一連のデジタルコード介
nであり、これは音声信号の予測されなかつた成分、す
なわちフオルマント及びピツチに関連する冗長性を除去
した音声信号を表わす。 量子化器111で用いられている予め定めた振幅レベル
は、量子化器111に印加されるサンプルQnの大きさ
には等しくないため、に相当する歪すなわち量子化雑音
が、デジタルコータ112からの信号分nに存在する。 この歪は、通信チャネル150を介して伝送され、第2
図のデコーダ回路の出力で再構成される音声信号合(t
)にも現われる。伝送された信号内の量子化雑音は効率
の良い予測をすることによつて減少させることができる
。 しかし、このような減少は、再構成された音声信号内で
感知される歪を小さくすることを保証するものではない
。なぜなら、歪は、音声スペクトルとの関連においてみ
た量子化雑音のスペクトルに依存するためである。音声
信号のスペクトルは時間的に変化するフオルマント領域
、すなわち音声信号電力が集中している領域と、信号電
力が比較的小さいフオルマント間領域とによつて特徴づ
けられる。音声信号の一部分の典型的なスペクトルを第
9図の波形901に示す。しかし、量子化雑音Enの周
波数は波形903に示したように、一般に一様に分布し
ている。第9図の波形901及び903から用らかなよ
うに、波形903の量子化雑音はフオルマント領域では
音声信号電力より小さいが、音声信号レベルの小さいフ
オルマント間領域では優位である。 特に周波数Fa及びFbのオルマントピークの間のフオ
ルマント間領域では、波形903の量子化雑音は音声信
号より大きい。さらに、音声信号対量子化雑音比は、フ
オルマント周波数の位置では比較的大きいのに、1フオ
ルマント間領域でははるかに小さい。当業者には公知の
ように、量子化雑音スペクトルは、平均量子化雑音が一
定という条件のもとでフイルタによつて変形させること
ができる。 従来技術によるフィルタ方式では、量子化雑音をスペク
トル上の高い周波数部分へシフトするか、あるいは雑音
のRMS値を最小にするという特性を持つていた。しか
しこのようなフイルタ方式は、特性を変化させることが
できないため、フオルマントが時間的に変動するような
音声信号での知覚雑音を減少させるのには効率が悪い。
本発明に従い、フオルマントに関連した予測パラメータ
信号によつて制御される特徴を持つた適応フイードバツ
クフイルタが導入される。 適応フイルタは、量子化雑音を音声信号の時間的に変化
するフオルマント部分に集中させる動きをし、このため
量子化雑音は変動する音声信号のフオルマントによつて
常にマスクされてしまう。このようにして望ましい形で
再分散させた量子化雑音のスペクトルを波形905に示
す。波形905に示すように、量子化雑音電力は波形9
01の音声信号スペクトルのフオルマント部分に集中し
、この結果、知覚雑音の影響の大きいフオルマント間領
域での量子化雑音電力が減少している。このようにして
、音声信号対量子化雑音比は、音声信号スペクトルの全
般にわたつて許容値以上に維持される。この方法により
、量子化雑音による知覚歪が減少させられる。第1図で
、量子化雑音マスク装置は、適応荷重フイルタ120を
含み、このフイルタ120は減算回路113で作られる
量子化誤差信号Enを係数発生器122からのパーラメ
ータ信号に従つて変形させる。 これらのパラメータ信号は計算機135で作られるフオ
ルマント予測パラメータ信号Δ=Al,a2,・・・・
・・・・・,A,に応動して作られる。第1図の回路内
での量子化に原因する歪は15式の量子化誤差Enを、
フオルマント予測器107とフイードバツクフイルタ1
20との伝達関数で修正したもので次式のように表わす
ことができる。ただし、Eは誤差信号Enの短時間フー
リエ変換であり、Fは荷重フイルタ120の伝達関数の
短時間フーリエ変換であり、P8はフオルマント予測器
107の伝達関数の短時間フーリエ変換を表わす。 よつて、エンコーダ出力信号の量子化雑音電力スペクト
ルは、式16に従つて変形される。z変換の形での関数
が波形905の雑音スペクトル分布を得るために必要な
量子化雑音沢波を与えることが判つている。 式17は次のように簡単になる。フオルマント予測器1
07の伝達関数はZ変換形式ではとなり、 式18のフイルタ伝達関数は となる。 式20から、荷重フィルタ120を制御するためのパラ
メータ信号はとなる。 式21を見ると、荷重フイルタパラメータ信号f1乃至
F,,はフオルマント予測パラメータ信号a1乃至Al
Oに直接関係することがわかる。 フオルマント予測パラメータ信号A,乃至AlOは、時
間的に変動する音声信号に応動して変化するため、荷重
フイルタパラメータ信号f1乃至Fllは、波形905
の量子化雑音スペクトルが波形901の音声信号の変化
しているフオルマント特性に追随するように変化する。
このような方法により、介。信号内の量子化雑音スペク
トルは、音声信号のフオルマント周波数部分によつて常
にマスクされ、音声スペクトルの全般にわたつて最大の
音声信号対量子化雑音比が得られる。フイルタ係数発生
器・メモリ122は第4図に詳細に示されている。 第4図において、パラメータ信号a1は2で除算する回
路422−1に直接印加されており、この回路422−
1は右に1ビツトだけシフトするシフトレジスタによつ
て構成できる。当業者には公知のように、2進コードを
右にlビツトシフトすることは該コードを2で割ること
に相当する。2除算回路422−1の出力はパラメータ
信号f1である。 パラメータ信号a1及びA2は加算回路420−2で加
算され、その結果は回路422−2において2で除算さ
れる。同様に、加算器420−3はA2及びA3バラメ
ータの和をとり、2除算回路422−3の出力はフイル
タパラメータF3となる。同様に、フイルタパラメータ
F4乃至F,は第4図には示されていない同様の回路に
おいて作られる。フイルタパラメータFlOは加算器4
20−10からの出力を受信する2除算回路422−1
0から得られる。パラメータ信号AlOは回路422−
11で2で除算されてフィルタパラメータ信号Fl,と
なる。フイルタパラメータ信号f1乃至Fllは式21
に従つて第4図の回路で作られ、荷重フイルタ120で
これらのフイルタパラメータ信号を用いる時間フレーム
に先行する10ms時間フレームにおいてメモリ430
の入力部に転送される。次の10msフレームの開始時
において、クロツク140からのクロツク信号CL2に
応動して、メモリ430の入力部のフイルタパラメータ
信号はその出力部へ転送される。このようにして、フイ
ルタパラメータ信号は正しい10ms時間フレームにお
いてフイルタ120内の80サンプル群の各々に割当て
られる。フイルタ係数発生器・メモリ122からのフイ
ルタ係数信号f1乃至F,lは線123を介してフイル
タ120に印加される。 荷重フイルタ回路120は第6図に詳細に示されている
。第6図において、減算器113からの誤差信号サンプ
ルEnは線6旧を介して11段シフトレジスタ603に
順次印加される。信号Enは、当業者には公知のように
、クロツク140からのクロツクパルスCLlによつて
右に順次シフトされる。フイルタパラメータ信号f1乃
至Fllは線610を介してそれぞれ乗算器605−1
乃至605一11に印加される。誤差信号En,en−
,,・・・・・・・・・,En−1,はシフトレジスタ
603の各段からそれぞれ線604−1乃至604−1
1を介して乗算器605−1乃至605−11に印加さ
れる。乗算器605−1は予測コードFlenを形成す
る。同様に乗算器605−11は積コードFllen−
11を形成する。 乗算器605−1乃至605−11の出力は加算器60
5−2乃至607−11で順次加算され、フオルマント
荷重誤差信号が線612に現われる。 フオルマント荷重誤差信号Wnはピーククリツパ回路1
24を介して減算器126に印加される。 ピーククリツパ回路124において、コード信号wは計
算機135のメモリ337からのRMS信号2Rと比較
される。現在の荷重誤差信号の値が(wl〈2R(23
) であると、wは直接減算器126に印加される。 しかし、であると、もし信号wが正であれば、信号2R
が減算器126に印加される。 またwが負であると、信号−2Rが減算器126に印加
される。このようにして、誤差荷重フイルタ120によ
つて作られるフイードバツク信号の大きさは、差信号D
n(7)RMS値の2倍に制限される。減算器126の
出力は、音声信号の予測されていない成分を、フイード
バツクフイルタによる量子化誤差信号で修正したものに
相当する。 この結果コータ112から得られる出力介1は、音声信
号の量子化された非予測成分で、修正された量子化雑音
スペクトルを持つものになる。介。は、ピツチパラメー
タ信号B及びm1部分相関パラメータ信号Rm及びステ
ツプ幅信号Δとともにマルチプレクサ・変調回路115
に印加される。回路115は適切な変調信号を形成し、
この信号は通信チヤンネル150を介して第2図のデコ
ーダ回路に送信される。第2図に示したデコーダ回路は
通信チヤネル150からの伝送信号を受信して、情報源
101から第1図のエンコーダに最初印加された音声信
号S(t)を復製する。 第2図で、復調・デマルチプレクサ回路20.1は通信
チャネル150上の信号に応動して量子化された非予側
信号介1及びステツプ幅信号Δをデジタルデコーダ20
3に印加する。当業者には公知のように、デコーダ20
3は信号介。をステップ幅信号Δをものさしにして計り
、計られた量子化信号が加算回路205の1つの入力に
印加される。加算回路205の他の入力には、音声周期
予測器217からの信号が印加される。復調・デマルチ
プレクサ201からの、各10ms時間フレームに対す
るピツチ関連パラメータ信号B=Bl,b2,b3及び
mは、ピツチ係数メモリ213に蓄えられ、ここから予
測器217に印加される。予測器217は、その詳細を
第7図に示した第1図の予測器128と同じものである
。加算器205からの一連の信号コードと、メモリ21
3からの予測パラメータ信号Bl,b2,b3及びmと
に応動して、予測器217は音声信号のピツチ関連予測
成分を形成して、この成分を加算器205に印加する。
加算器205の出口は励起信号を表わし、音声信号の非
予測成分及びピツチ関連予測成分を含んでいる。加算器
205からの励起信号は次に加算器207の一方の入力
に印加され、またその他方の入力はフオルマント予測器
219から得られる。有利なことに、音声周期予測器2
17を用いた励起信号形成手法は、音声信号の有声音及
び無声音セグメントの検出で必要とせず、また無声音励
起のために雑音源を必要としない。デマルチプレクサ2
01からの、各10ms時間フレームに対するフオルマ
ント関連部分相関パラメータ信号Rmは係数変換器・メ
モリ215に転送される。 変換器215は部分相関パラメータ信号Rmを線形予測
パラメータ信号A=Al,a2,・・・・・・・・・,
AlOに変換する。係数変換器215は、第1図の計算
器135で用いられたような処理装置あるいは当業者に
公知の他のマイクロプロセツサを用いることができる。
変換器215は、式10の再帰式に基づいて部分相関パ
ラメータ信号Rmから、フオルマント線形予測パラメー
タ信号Al,a2,・・・・・・・・・,AlOを形成
する信号Rmは、当業者には公知のように安定度を増す
ために第2図の受信器に伝送される。フオルマント予測
器219はその詳細を第5図に示した第1図の予測器1
07と同じものである。 加算器207からの励起信号列と変換器215からのフ
オルマント予測パラメータ信号Al,a2,・・・・・
・・・・,A,Oとに応動して、フオルマント予測器2
19は音声信号の予測されたフオルマント成分を発生す
るよう動作する。この結果加算器207の出力は復製信
号コード営。の列に対応する。加算器207の出力はフ
イルタ209に印加される。フイルタ209は、フイル
タ103内のプレエンフアシス回路の効果を相殺するた
めの逆エンフアシス回路と、第1図のフイルタ103の
フイルタ機構に対応する低減フイルタとを含んでいる。
フイルタ209からの一連の信号サンプルは、テジタル
・アナログ変換器211によつてアナログ復製信号営(
t)に変換される。本発明についてその一実施例を参照
して説明した。
Claims (1)
- 【特許請求の範囲】 1 音声信号を処理するために、 該音声信号を選択された時間間隔で解析し各間隔に対し
て一群のフオルマント関連予測パラメータを発生するス
テップと、該音声信号と該フオルマント関連予測パラメ
ータ信号とに応動して現在の音声信号とその予測値との
差を表わす信号を作るステップと、該差信号を修正する
ステップと、 該修正された差信号を量子化するステップと、該量子化
信号と該修正された差信号との差に対応する量子化誤差
信号を形成するステップとを含む方法において、該差信
号の修正が、 該フオルマント関連予測パラメータ信号と該量子化誤差
信号とからフオルマント荷重量子化誤差信号を形成する
ことと、該フオルマント荷重誤差信号を該差信号と結合
して量子化誤差を該音声信号スペクトルのフオルマント
部分に集中させこれによつて音声信号対量子化雑音比を
該音声信号スペクトルの全般にわたつて予め定めたレベ
ル以上に維持し、該量子化誤差を該フオルマント部分に
集中させることによつて該量子化誤差を該音声信号フオ
ルマントによつてマスクしてしまうこととを含むことを
特徴とする音声信号を処理する方法。 2 請求の範囲第1項に従つて音声信号を処理する方法
において、該フオルマント荷重誤差信号の形成が、該フ
オルマント関連予測パラメータ信号に応動して一群の適
応フィルタパラメータ信号を発生することと、該量子化
誤差信号が該適応フィルタパラメータ信号で重み付ける
こととを含むことと、該差信号と該フオルマント荷重誤
差信号との結合が、該フオルマント荷重誤差信号を該差
信号から減算することを含むこととを特徴とする音声信
号を処理する方法。 3 請求の範囲第2項に従つて音声信号を処理する方法
において、該適応フィルタパラメータ信号の発生がZ^
−^1を予め定めた遅延、a_kをk番目のフオルマン
ト関連予測パラメータ信号、pをフオルマント関連予測
パラメータ信号とする時、関係▲数式、化学式、表等が
あります▼ に従つて一連のフィルタパラメータ信号f_1,f_2
,………,f_p,f_p_+_1を形成することを含
むことを特徴とする音声信号を処理する方法。 4 請求の範囲第3項に従つて音声信号を処理する方法
において、該フオルマント荷重量子化誤差信号の形成が
、w_nを該フオルマント荷重量子化誤差信号の値とし
、e_nを量子化誤差信号の現在の値とする時に、関係
▲数式、化学式、表等があります▼ に従つて該量子化誤差信号を濾波することを含むことを
特徴とする音声信号を処理する方法。 5 請求の範囲第2乃至4項の任意の項目に従つて音声
信号を処理する方法において、該音声信号の解析が各間
隔に対して一群のピッチ関連予測パラメータ信号b_1
,b_2,b_3及びピッチ周期関連信号mを形成する
ことを含むことと、該差信号の修正が、d_nを予測さ
れた差信号とし、■_nを量子化信号とする時、関係d
′_n=b_1d′_n_−_m_+_1+b_2d′
_n_−_m+b_3d′_n_−_m_−_1+■_
nに従つて該差信号の予測値に対応する信号を発生する
ことを含むことと、該差信号の該予測値が該差信号と該
フオルマント荷重誤差信号とに結合されて該修正された
差信号内のピッチ関連冗長性を減少していることとを特
徴とする音声信号を処理する方法。 6 請求の範囲第5項に従つて音声信号を処理するため
に、さらに該量子化信号に応動して励起信号を発生する
ステップと、該励起信号を該フオルマント関連予測パラ
メータ信号と結合することによって該音声信号の復製を
形成するステップとを含む方法において、該励起信号を
発生するステップが、該量子化信号の先行する部分と該
ピッチ関連予測パラメータ信号b_1,b_2,b3と
該ピッチ周期関連信号mとから該差信号の予測値に対応
する信号を形成することと、現在の量子化信号を該差信
号の該予測値と結合することとを含むことを特徴とする
音声信号を処理する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US05/894,329 US4133976A (en) | 1978-04-07 | 1978-04-07 | Predictive speech signal coding with reduced noise effects |
US000000894329 | 1978-04-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS55500402A JPS55500402A (ja) | 1980-07-10 |
JPS5912186B2 true JPS5912186B2 (ja) | 1984-03-21 |
Family
ID=25402929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54500642A Expired JPS5912186B2 (ja) | 1978-04-07 | 1979-03-28 | 雑音の影響を減少した予測音声信号符号化 |
Country Status (8)
Country | Link |
---|---|
US (1) | US4133976A (ja) |
EP (1) | EP0012766A1 (ja) |
JP (1) | JPS5912186B2 (ja) |
CA (1) | CA1119724A (ja) |
DE (1) | DE2945414C2 (ja) |
FR (1) | FR2475264B1 (ja) |
GB (1) | GB2036515B (ja) |
WO (1) | WO1979000901A1 (ja) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
NL180895C (nl) * | 1978-11-30 | 1987-05-04 | Philips Nv | Analoog-digitaal-omzetter. |
US4354057A (en) * | 1980-04-08 | 1982-10-12 | Bell Telephone Laboratories, Incorporated | Predictive signal coding with partitioned quantization |
USRE32124E (en) * | 1980-04-08 | 1986-04-22 | At&T Bell Laboratories | Predictive signal coding with partitioned quantization |
US4509150A (en) * | 1980-12-31 | 1985-04-02 | Mobil Oil Corporation | Linear prediction coding for compressing of seismic data |
US4381428A (en) * | 1981-05-11 | 1983-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Adaptive quantizer for acoustic binary information transmission |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
JPS60116000A (ja) * | 1983-11-28 | 1985-06-22 | ケイディディ株式会社 | 音声符号化装置 |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4675863A (en) * | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4726037A (en) * | 1986-03-26 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4933675A (en) * | 1987-03-19 | 1990-06-12 | Beard Terry D | Audio digital/analog encoding and decoding |
FR2624675B1 (fr) * | 1987-12-15 | 1990-05-11 | Charbonnier Alain | Dispositif et procede de traitement d'un signal de base echantillonne, en particulier representatif de sons |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
ATE145775T1 (de) * | 1988-02-29 | 1996-12-15 | Sony Corp | Verfahren und einrichtung zur digitalsignalverarbeitung |
US4882585A (en) * | 1988-03-17 | 1989-11-21 | Beard Terry D | Method and apparatus for high resolution analog-digital-analog transformations |
JPH0797753B2 (ja) * | 1989-01-24 | 1995-10-18 | 日本ビクター株式会社 | 符号化出力データ量の制御方式 |
JPH02309820A (ja) * | 1989-05-25 | 1990-12-25 | Sony Corp | デイジタル信号処理装置 |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
US5195168A (en) * | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
US5546383A (en) | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
DE19729494C2 (de) * | 1997-07-10 | 1999-11-04 | Grundig Ag | Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte |
US6047035A (en) * | 1998-06-15 | 2000-04-04 | Dspc Israel Ltd. | Method and device for quantizing the input to soft decoders |
US6360239B1 (en) * | 1999-01-13 | 2002-03-19 | Creative Technology Ltd. | Noise-shaped coefficient rounding for FIR filters |
WO2001084536A1 (de) * | 2000-04-28 | 2001-11-08 | Deutsche Telekom Ag | Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector) |
DE10026904A1 (de) * | 2000-04-28 | 2002-01-03 | Deutsche Telekom Ag | Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
DE102005039621A1 (de) * | 2005-08-19 | 2007-03-01 | Micronas Gmbh | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System |
CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
US9215538B2 (en) * | 2009-08-04 | 2015-12-15 | Nokia Technologies Oy | Method and apparatus for audio signal classification |
EP3079151A1 (en) | 2015-04-09 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and method for encoding an audio signal |
US10308447B2 (en) * | 2016-08-12 | 2019-06-04 | Sierra Pacific Industries | Stick placer assembly |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2927962A (en) * | 1954-04-26 | 1960-03-08 | Bell Telephone Labor Inc | Transmission systems employing quantization |
US3502986A (en) * | 1967-12-14 | 1970-03-24 | Bell Telephone Labor Inc | Adaptive prediction for redundancy removal in data transmission systems |
US3631520A (en) * | 1968-08-19 | 1971-12-28 | Bell Telephone Labor Inc | Predictive coding of speech signals |
US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
-
1978
- 1978-04-07 US US05/894,329 patent/US4133976A/en not_active Expired - Lifetime
-
1979
- 1979-03-28 GB GB7944218A patent/GB2036515B/en not_active Expired
- 1979-03-28 WO PCT/US1979/000197 patent/WO1979000901A1/en unknown
- 1979-03-28 JP JP54500642A patent/JPS5912186B2/ja not_active Expired
- 1979-03-28 DE DE2945414A patent/DE2945414C2/de not_active Expired
- 1979-03-29 CA CA000324451A patent/CA1119724A/en not_active Expired
- 1979-11-08 EP EP79900392A patent/EP0012766A1/en not_active Withdrawn
-
1980
- 1980-09-17 FR FR8020155A patent/FR2475264B1/fr not_active Expired
Also Published As
Publication number | Publication date |
---|---|
FR2475264B1 (fr) | 1986-08-01 |
DE2945414C2 (de) | 1985-09-05 |
FR2475264A1 (fr) | 1981-08-07 |
EP0012766A1 (en) | 1980-07-09 |
US4133976A (en) | 1979-01-09 |
GB2036515B (en) | 1982-08-18 |
WO1979000901A1 (en) | 1979-11-15 |
CA1119724A (en) | 1982-03-09 |
JPS55500402A (ja) | 1980-07-10 |
GB2036515A (en) | 1980-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5912186B2 (ja) | 雑音の影響を減少した予測音声信号符号化 | |
KR950014622B1 (ko) | 입력 신호처리 방법 | |
AU763471B2 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
RU2255380C2 (ru) | Способ и устройство воспроизведения речевых сигналов и способ их передачи | |
US4933957A (en) | Low bit rate voice coding method and system | |
US4852169A (en) | Method for enhancing the quality of coded speech | |
US5774835A (en) | Method and apparatus of postfiltering using a first spectrum parameter of an encoded sound signal and a second spectrum parameter of a lesser degree than the first spectrum parameter | |
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
JP4097699B2 (ja) | 複雑さが軽減された信号送信システム | |
US4716592A (en) | Method and apparatus for encoding voice signals | |
US4354057A (en) | Predictive signal coding with partitioned quantization | |
USRE32124E (en) | Predictive signal coding with partitioned quantization | |
KR100513815B1 (ko) | 신호부호화방법및장치 | |
JP3168238B2 (ja) | 再構成音声信号の周期性を増大させる方法および装置 | |
US4908863A (en) | Multi-pulse coding system | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP3662597B2 (ja) | 一般化された合成による分析音声符号化方法と装置 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JPS6134697B2 (ja) | ||
JPH0566800A (ja) | 音声符号化・復号化方法 | |
JPH0675598A (ja) | 音声符号化方法及び音声合成方法 | |
JPH0448240B2 (ja) | ||
JPH05273997A (ja) | コード励振線形予測符号化器及び復号化器 |