JPH07311597A - 音声信号合成方法 - Google Patents
音声信号合成方法Info
- Publication number
- JPH07311597A JPH07311597A JP7079358A JP7935895A JPH07311597A JP H07311597 A JPH07311597 A JP H07311597A JP 7079358 A JP7079358 A JP 7079358A JP 7935895 A JP7935895 A JP 7935895A JP H07311597 A JPH07311597 A JP H07311597A
- Authority
- JP
- Japan
- Prior art keywords
- excitation signal
- signal
- samples
- gain
- excitation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005236 sound signal Effects 0.000 title claims abstract description 6
- 239000000203 mixture Substances 0.000 title description 5
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000004044 response Effects 0.000 claims abstract description 17
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 12
- 230000005284 excitation Effects 0.000 claims description 118
- 230000015572 biosynthetic process Effects 0.000 claims description 63
- 238000003786 synthesis reaction Methods 0.000 claims description 63
- 230000008569 process Effects 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims 3
- 230000003044 adaptive effect Effects 0.000 claims 1
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical group OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 claims 1
- 238000001308 synthesis method Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 abstract description 15
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006731 degradation reaction Methods 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 55
- 239000000872 buffer Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000006872 improvement Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 230000008034 disappearance Effects 0.000 description 5
- 238000013213 extrapolation Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- NRZWYNLTFLDQQX-UHFFFAOYSA-N p-tert-Amylphenol Chemical compound CCC(C)(C)C1=CC=C(O)C=C1 NRZWYNLTFLDQQX-UHFFFAOYSA-N 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 101100449758 Onchocerca volvulus GST1 gene Proteins 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 101150116770 vht1 gene Proteins 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
フレーム消失による音声品質の劣化を軽減する。 【構成】 この音声信号合成方法で使用する復号器は、
入力ビットに応答する第1励振信号発生器と、利得を生
成する励振信号利得アダプタと、励振信号に応答する合
成フィルタと、合成フィルタ係数信号を生成する合成フ
ィルタアダプタとを有する。まず、第1励振信号発生器
によって発生された第1励振信号のサンプルを記憶す
る。入力ビットの消失を示す信号に応答して、以前に記
憶された第1励振信号のサンプルに基づいて第2励振信
号を合成する。第2励振信号をフィルタリングして音声
信号を合成する。現在の消失フレームにおいて、アダプ
タは、将来の非消失フレームにおける利得および係数信
号を生成する際にアダプタによって使用される信号を記
憶する信号処理動作を行う。
Description
ステムで使用する音声符号化方式に関し、特に、無線伝
送におけるバースト誤り時に音声符号器が機能する方式
に関する。
ムのような多くの通信システムは、無線チャネルによっ
て情報を通信する。このような情報を通信している間
に、無線通信チャネルは、マルチパスフェージングのよ
うな、いくつかの誤り源からの影響を受ける。このよう
な誤り源は、とりわけ、フレーム消失という問題を引き
起こすことがある。消失とは、受信機へ通信される一連
のビットの全部の損失または大部分の破壊をいう。フレ
ームとは、所定数のビットである。
受信機には解釈すべきビットがない。このような状況で
は、受信機は無意味な結果を生じることになる。受信し
たビットのフレームが破壊されたために信頼性がなくな
った場合、受信機はひどく歪んだ結果を生じることがあ
る。
につれて、利用可能な無線システム帯域幅の最適な利用
法が必要とされてきている。システム帯域幅の利用の効
率を高める1つの方法は、信号圧縮技術を使用すること
である。音声信号を伝送する無線システムでは、音声圧
縮(すなわち音声符号化)技術をこの目的のために使用
することができる。このような音声符号化技術には、周
知の符号励振線形予測(CELP)音声符号器のよう
な、合成による分析の音声符号器がある。
ットワークにおけるパケット損失の問題は、無線の場合
のフレーム消失と非常に類似している。すなわち、パケ
ット損失によって、音声復号器はフレームを受信するこ
とができないか、または、多数のビットが抜けたフレー
ムを受信することになる。いずれの場合にも、音声復号
器には、同じ本質的問題が提示される。すなわち、圧縮
された音声情報の損失にもかかわらず音声を合成する必
要性である。「フレーム消失」および「パケット損失」
はいずれも、送信されたビットの損失を引き起こした通
信チャネル(すなわちネットワーク)の問題に関係す
る。従って、本明細書の目的のためには、「フレーム消
失」という用語はパケット損失と同義とみなすことがで
きる。
化するために励振信号のコードブック(符号帳)を使用
する。この励振信号は、励振に応答して音声信号(また
は音声信号のプリカーサ)を合成する線形予測(LP
C)フィルタを「励振」するために使用される。合成さ
れた音声信号を、符号化すべき信号と比較する。原信号
と最もよく一致するコードブック励振信号を識別する。
その後、識別した励振信号のコードブックインデックス
がCELP復号器へ通信される(CELPシステムのタ
イプに応じて、他のタイプの情報を通信することも可能
である)。復号器は、CELP符号器と同一のコードブ
ックを含む。復号器は、送信されたインデックスを使用
して、自己のコードブックから励振信号を選択する。こ
の選択した励振信号を使用して、復号器のLPCフィル
タを励振する。このようにして励振されることにより、
復号器のLPCフィルタは復号された(すなわち量子化
された)音声信号を生成する。これは、前に原音声信号
に最も近いと判定されたのと同じ音声信号である。
無線システムなどのシステムは、音声を圧縮しないシス
テムよりもフレーム消失の問題の影響を受けやすい。こ
の影響の受けやすさは、通信される各ビットの損失の可
能性を大きくするような、符号化された音声の冗長性の
少なさ(符号化されていない音声に比べて)による。フ
レーム消失を受けるCELP音声符号器の場合でいえ
ば、励振信号コードブックインデックスは損失してしま
うか、または、大きく破壊されることがある。消失した
フレームのために、CELP復号器は、コードブック内
のどのエントリを使用して音声を合成すべきかを信頼性
よく識別することができなくなる。その結果、音声符号
化システムの性能は大幅に劣化することになる。
使用した通信システムにおけるフレーム消失による音声
品質の劣化を軽減する。本発明によれば、符号化された
音声の隣接するフレームが利用不能になった場合または
信頼性がなくなった場合、復号器において、そのフレー
ム消失の前に決定された励振信号に基づいて、代用励振
信号が合成される。励振信号の合成の一例は、フレーム
消失前に決定された励振信号の外挿によって与えられ
る。このようにして、復号器では、音声(またはそのプ
リカーサ)を合成するための励振が利用可能となる。
音声を合成するために通常使用される圧縮されたビット
ストリーム中の一群の連続するビットの損失)を受けて
いる音声符号化システムの動作に関する。以下の説明
は、CCITTによって国際標準G.728として採用
された周知の16kbit/s低遅延CELP(LD−
CELP)音声符号化方式に例として適用した本発明の
特徴に関する。しかし、当業者には理解されるように、
本発明の特徴は他の音声符号化方式にも適用可能であ
る。
符号器および復号器の詳細な記述が含まれている(G.
728標準草案、第3節および第4節参照)。第1の実
施例は、この標準の復号器への改良に関する。本発明を
実現するためには符号器の改良は不要であるが、本発明
は、符号器の改良によってさらに効果が得られる。実
際、以下で説明する一実施例の音声符号化システムは改
良した符号器を含む。
明の実施例への入力である。このような情報は従来技術
で周知の任意の方法によって得られる。例えば、フレー
ム消失は、従来の誤り検出符号の使用により検出可能で
ある。このような符号は、無線通信システムの従来の無
線送受信サブシステムの一部として実装される。
フィルタの出力信号は、音声領域にあるか、それとも、
音声領域へのプリカーサの領域にあるかにかかわらず、
「音声信号」ということにする。また、説明を明確にす
るため、実施例のフレームは、G.728標準の適応サ
イクルの長さの整数倍とする。この実施例のフレーム長
は、実際に妥当であり、一般性を失うことなく、本発明
の開示を可能にする。例えば、フレームの長さは10m
s、すなわち、G.728適応サイクルの長さの4倍と
仮定することができる。適応サイクルは20サンプルで
あり、2.5msの継続時間に相当する。
は、個別の機能ブロックからなるものとして提示する。
それらのブロックが表す機能は、共用または専用のハー
ドウェアを用いて実現可能である。このハードウェアに
は、ソフトウェアを実行可能なハードウェアも含まれる
が、それに制限されるものではない。例えば、図1、図
2、図6および図7に示されたブロックは、単一の共用
プロセッサによって実現することも可能である。(「プ
ロセッサ」という用語の使用は、ソフトウェアを実行可
能なハードウェアを限定的に指すものと解釈してはなら
ない。)
DSP32Cのようなディジタル信号プロセッサ(DS
P)ハードウェアと、以下で説明する作用を実行するソ
フトウェアを記憶する読み出し専用メモリ(ROM)
と、DSPの結果を記憶するランダムアクセスメモリ
(RAM)とを含む。超大規模集積(VLSI)ハード
ウェア実施例や、カスタムVLSI回路と汎用DSP回
路の組合せも可能である。
改良されたG.728のLD−CELP復号器のブロッ
ク図を示す(図1は、G.728標準草案の図3の改良
版である)。正常動作時(すなわち、フレーム消失がな
いとき)には、この復号器はG.728に従って動作す
る。まず復号器は、通信チャネルからコードブックイン
デックスiを受信する。各インデックスは励振VQコー
ドブック29から得られる5個の励振信号サンプルのベ
クトルを表す。コードブック29は、G.728標準草
案に記載された利得および形状のコードブックからな
る。コードブック29は、受信した各インデックスを使
用して、励振コードベクトルを抽出する。抽出したコー
ドベクトルは、符号器によって、原信号に最もよく一致
すると判定されたものである。抽出された各励振コード
ベクトルは利得増幅器31によってスケーリングされ
る。増幅器31は、励振ベクトルの各サンプルに、ベク
トル利得アダプタ300によって決定される利得を乗じ
る(ベクトル利得アダプタ300の動作は後述)。スケ
ーリングされた各励振ベクトルETは、励振合成器10
0に入力される。フレーム消失が起きていない場合、合
成器100は単に変更なしに、スケーリングした励振ベ
クトルを出力する。次に、スケーリングされた各励振ベ
クトルはLPC合成フィルタ32に入力される。LPC
合成フィルタ32は、スイッチ120を通じて合成フィ
ルタアダプタ330によって供給されるLPC係数を使
用する(スイッチ120は、フレーム消失が起きていな
いときは破線側に設定される。合成フィルタアダプタ3
30、スイッチ120、および帯域幅拡大器115につ
いては後述する)。フィルタ32は復号した(すなわち
「量子化した」)音声を生成する。フィルタ32は、復
号音声信号に周期性を導入することが可能な50次合成
フィルタである(このような周期性の強化は一般に20
より大きい次数のフィルタでは必要である)。G.72
8標準によれば、この復号された音声は次に後置フィル
タ34および後置フィルタアダプタ35の作用によって
後置フィルタリングされる。後置フィルタリングされる
と、復号音声のフォーマットはフォーマット変換器28
によって適当な標準フォーマットに変換される。このフ
ォーマット変換は、他のシステムによってこの復号音声
を後で使用することを容易にする。
レーム消失がある場合、図1の復号器は、どの励振信号
サンプルのベクトルをコードブック29から抽出すべき
かに関する信頼性のある情報を(復号器が仮に何かを受
信するとしても)受信しない。この場合、復号器は、音
声信号を合成する際に使用するための代用励振信号を得
なければならない。フレーム消失期間中の代用励振信号
の生成は励振合成器100によって実行される。
実施例のブロック図を示す。フレーム消失中、励振合成
器100は、以前に決定した(決定済み)励振信号サン
プルに基づいて励振信号サンプルのベクトルを1個以上
生成する。これらの決定済み励振信号サンプルは、通信
チャネルから受信した、受信済みコードブックインデッ
クスを用いて抽出されたものである。図2に示したよう
に、励振合成器100は、タンデムスイッチ110、1
30および励振合成プロセッサ120を有する。スイッ
チ110、130はフレーム消失信号に応答して合成器
100のモードを正常モード(フレーム消失なし)と合
成モード(フレーム消失あり)の間で切り替える。フレ
ーム消失信号は、現在のフレームが正常である(例えば
値0)か、または消失しているか(例えば値1)のいず
れかを示す2進フラグである。この2進フラグはフレー
ムごとにリフレッシュされる。
110および130では破線で示す)では、合成器10
0は、利得でスケーリングした(利得スケールド)励振
信号ベクトルET(それぞれ5個の励振サンプル値から
なる)を受信し、そのベクトルを出力に送る。ベクトル
サンプル値は励振合成プロセッサ120にも送られる。
プロセッサ120は、後でフレーム消失時に使用するた
めに、このサンプル値をバッファETPASTに記憶す
る。ETPASTは、最近の励振信号サンプル値を20
0個(すなわち40個のベクトル)保持し、最近に受信
した(または合成した)励振信号値の履歴を提供する。
ETPASTが満杯になると、引き続くベクトルの5個
のサンプルがバッファにプッシュされることにより、最
も古いベクトルの5個のサンプルがバッファから落ち
る。(後で合成モードについて説明するように、このベ
クトルの履歴は、フレーム消失時に生成されるベクトル
も含むことがある。)
110および130では実線で示す)では、合成器10
0は利得スケールド励振信号ベクトルの入力を切り離
し、励振合成プロセッサ120を合成器出力に結合す
る。プロセッサ120は、フレーム消失信号に応答し
て、励振信号ベクトルを合成するように作用する。
20の動作のブロック流れ図を示す。処理のはじめに、
プロセッサ120は、消失したフレームが有声音声を含
んでいた可能性が高いかどうかを判断する(ステップ1
201)。これは、過去の音声サンプルに対する通常の
有声音性検出によって実行可能である。G.728復号
器の場合、有声音声判定プロセスで使用可能な信号PT
APが(後置フィルタから)利用可能である。PTAP
は、復号音声に対する単一タップピッチ予測器の最適重
みを表す。PTAPが大きい(例えば1に近い)場合、
消失した音声は有声であった可能性が高い。PTAPが
小さい(例えば0に近い)場合、消失した音声は非有声
(すなわち、無声音声、無音、雑音)であった可能性が
高い。経験的に決定されるしきい値VTHが、有声と非
有声の音声の間の判定のために使用される。このしきい
値は0.6/1.4に等しい(ここで、0.6はG.7
28後置フィルタによって使用される有声しきい値であ
り、1.4は、有声音声側に誤るようにしきい値を小さ
くするための経験的に決定された数である)。
であろうと判定された場合、バッファETPAST内で
サンプルのベクトルを探索することによって、新たな利
得スケールド励振ベクトルETを合成する。最初に探索
されるのは過去のKP個のサンプルである(ステップ1
204)。KPは、有声音声の1ピッチ周期に対応する
サンプル数である。KPは復号音声から通常のように決
定することも可能である。しかし、G.728復号器の
後置フィルタはこの値を既に計算している。従って、新
たなベクトルETの合成は、5個の連続するサンプルの
セットを現在へ外挿(例えば複写)することからなる。
バッファETPASTは、最後に合成したサンプル値の
ベクトルETを反映するように更新される(ステップ1
206)。このプロセスは、良好な(消失していない)
フレームを受信するまで反復する(ステップ1208お
よび1209)。ステップ1204、1206、120
8、および1209のプロセスの結果、ETPASTの
最後のKP個のサンプルが周期的に反復することにな
り、消失したフレームにはETベクトルの周期的な列が
生じる(ここでKPがその周期である)。良好な(消失
していない)フレームを受信すると、このプロセスは終
了する。
(ステップ1201によって)判定されると、別の合成
手続きが実行される。実施例のETベクトルの合成は、
ETPAST内の5個のサンプルのグループのランダム
化外挿に基づく。このランダム化外挿手続きは、ETP
ASTの最近の40個のサンプルの平均絶対値の計算か
ら始まる(ステップ1210)。この平均絶対値をAV
MAGで表す。AVMAGは、外挿されたETベクトル
サンプルがETPASTの最近40個のサンプルと同じ
平均絶対値を持つことを保証するプロセスで使用され
る。
にある程度のランダム性を導入するために発生される。
消失フレームは(ステップ1201で判定されたよう
に)無声音声に含まれているため、このランダム性は重
要である。NUMRは5〜40の任意の整数値をとりう
る(ステップ1212)。次に、ETPASTの5個の
連続するサンプルを選択する。そのうちの最も古いもの
はNUMR個前のサンプルである(ステップ121
4)。次に、これらの選択したサンプルの平均絶対値を
計算する(ステップ1216)。この平均絶対値をVE
CAVと呼ぶ。VECAVに対するAVMAGの比とし
てスケールファクタSFが計算される(ステップ121
8)。次に、ETPASTから選択された各サンプルに
SFを乗じる。このスケールされたサンプルはETの合
成されたサンプルとして使用される(ステップ122
0)。これらの合成されたサンプルは、上記のようにE
TPASTを更新するためにも使用される(ステップ1
222)。
合成されたサンプルが必要な場合(ステップ122
4)、消失フレームが満たされるまでステップ1212
〜1222が反復する。連続する後続のフレームも消失
している場合(ステップ1226)、ステップ1210
〜1224を反復して、後続の消失フレームを満たす。
すべての連続する消失フレームが合成されたETベクト
ルで満たされると、プロセスは終了する。
モード]図4に、励振合成モードにおけるプロセッサ1
20のもう1つの動作のブロック流れ図を示す。この代
替例では、有声音声の処理は図3を参照して既に説明し
たのと同一である。この代替例の相違点は、非有声音声
に対するETベクトルの合成にある。このため、非有声
音声に関する処理のみを図4に示す。
ベクトルの合成は、バッファETPASTに記憶された
最近の30個のサンプルのブロックと、その最近のブロ
ックから31〜170個のサンプルだけ離れたETPA
STの30個のサンプルとの間の相関を計算することか
ら始まる(ステップ1230)。例えば、ETPAST
の最近30個のサンプルはまず、ETPASTサンプル
の32〜61のサンプルのブロックと相関をとられる。
次に、最近30個のサンプルのブロックは、ETPAS
Tサンプル33〜62と相関をとられる、などとなる。
このプロセスは、171〜200のサンプルを含むブロ
ックまでのすべての30個のサンプルのブロックに対し
て継続される。
大きいすべての相関値に対して、最大相関に対応する時
間差(MAXI)を決定する(ステップ1232)。
示していた可能性が高いかどうかを判定するテストを行
う。このような低い周期性の状況では、ETベクトル合
成プロセスに人工的な周期性を導入することを避けるの
が有利である。これは、時間差MAXIの値を変えるこ
とによって行われる。(i)PTAPがしきい値VTH
1より小さい場合(ステップ1234)、または、(i
i)MAXIに対応する最大相関が定数MAXCより小
さい場合(ステップ1236)、非常に低い周期性であ
ることがわかる。その結果、MAXIは1だけインクリ
メントされる(ステップ1238)。条件(i)および
(ii)のいずれも満たされない場合、MAXIはイン
クリメントされない。VHT1およびMAXCの例示的
な値はそれぞれ0.3および3×107である。
プルのベクトルを抽出するためのインデックスとして使
用される。抽出されるサンプルのうち最も早いものはM
AXI個前のサンプルである。これらの抽出されたサン
プルは、次のETベクトルとして使用される(ステップ
1240)。以前のように、バッファETPASTは、
最新のETベクトルサンプルで更新される(ステップ1
242)。
ルが必要な場合(ステップ1244)、ステップ123
4〜1242を反復する。消失フレーム内のすべてのサ
ンプルが満たされると、後続の消失した各フレーム内の
サンプルが、ステップ1230〜1244を反復するこ
とによって満たされる(ステップ1246)。連続する
すべての消失フレームが合成したETベクトルで満たさ
れると、プロセスは終了する。
タ係数]利得スケールド励振ベクトルETの合成に加え
て、消失フレーム期間中にLPCフィルタ係数を生成し
なければならない。本発明によれば、消失フレームに対
するLPCフィルタ係数は、帯域幅拡大手続きによって
生成される。この帯域幅拡大手続きは、消失フレームに
おけるLPCフィルタ周波数応答の不確定性を補償する
のに有用である。帯域幅拡大は、LPCフィルタ周波数
応答におけるピークの鋭さをやわらげる。
れるLPC係数に基づいたLPCフィルタ周波数応答の
例を示す。図からわかるように、この応答はいくつかの
「ピーク」を含む。不確定性の問題となるのは、フレー
ム消失期間中のこれらのピークの正確な位置である。例
えば、連続するフレームに対する正しい周波数応答は、
図10の応答でピークが右または左にシフトしたものの
ようになる可能性もある。フレーム消失中には、復号音
声はLPC係数を決定するために利用できないため、こ
れらの係数(従ってフィルタ周波数応答)を推定しなけ
ればならない。このような推定は、帯域幅拡大によって
実現される。実施例の帯域幅拡大の結果を図11に示
す。図11からわかるように、周波数応答のピークは減
衰し、ピークの帯域幅は3dB拡大されている。このよ
うな減衰は、フレーム消失のために決定できない「正し
い」周波数応答におけるシフトを補償するのに有用であ
る。
4個のベクトル適応サイクルの第3ベクトルにおいて更
新される。消失フレームの存在は必ずしもこのタイミン
グを乱さない。通常のG.728の場合のように、新た
なLPC係数はフレーム中の第3ベクトルETにおいて
計算される。しかし、この場合、ETベクトルは消失フ
レーム期間中に合成される。
20、バッファ110、および帯域幅拡大器115を有
する。正常動作中は、スイッチ120は破線で示した位
置にある。これは、LPC係数aiが、合成フィルタア
ダプタ33によってLPC合成フィルタに提供されるこ
とを意味する。新たに適応した係数の各セットaiはバ
ッファ110に記憶される(新しい各セットは、前に保
存された係数のセットを上書きする)。帯域幅拡大器1
15は正常モードでは動作する必要がないので有利であ
る(動作しても、スイッチ120が破線の位置にあるの
で、その出力は使用されない)。
は状態変化する(実線の位置)。バッファ110は、最
後の良好なフレームからの音声信号サンプルで計算した
LPC係数の最後のセットを含む。消失フレームの第3
ベクトルにおいて、帯域幅拡大器115は新しい係数a
i´を計算する。
に帯域幅拡大器115によって実行される処理のブロッ
ク流れ図を示す。図示したように、拡大器115は、バ
ッファ110から、前に保存したLPC係数を抽出する
(ステップ1151)。新しい係数ai´は式(1)に
従って生成される。 ai´=(BEF)iai, 1≦i≦50 (1) ただし、BEFは帯域幅拡大係数であり、例示的には
0.95〜0.99の範囲の値をとるが、特に0.97
または0.98に設定するのが有利である(ステップ1
153)。続いて、これらの新しく計算した係数は出力
される(ステップ1155)。係数ai´は、各消失フ
レームごとにただ1回だけ計算されることに注意すべき
である。
体にわたってLPC合成フィルタ32によって使用され
る。LPC合成フィルタは、新しく計算された係数を、
正常状況下でアダプタ33によって計算されたものであ
るかのように使用する。また、図1に示したように、新
しく計算されたLPC係数はバッファ110にも記憶さ
れる。連続するフレーム消失がある場合には、バッファ
110に記憶された新しく計算されたLPC係数が、図
5に示したプロセスに従ってさらに帯域幅拡大のプロセ
スを行う基礎として使用されることになる。このよう
に、連続する消失フレームの数が多くなるほど、適用さ
れる帯域幅拡大も多くなる(すなわち、消失フレームの
列のk番目の消失フレームに対して、実質的な帯域幅拡
大係数はBEFkとなる)。
る他の技術を、上記の帯域幅拡大技術の代わりに使用す
ることも可能である。そのような技術には、(i)最後
の良好なフレームからのLPC係数の最後のセットの反
復使用、および、(ii)通常のG.728LPCアダ
プタ33における合成励振信号の使用がある。
作]G.728標準の復号器は、合成フィルタアダプタ
およびベクトル利得アダプタを有する(それぞれ図3の
ブロック33および30。また、それぞれG.728標
準草案の図5および図6)。正常動作(すなわち、フレ
ーム消失のない動作)では、これらのアダプタは、復号
器に存在する信号に基づいて、あるパラメータ値を動的
に変化させる。実施例の復号器もまた、合成フィルタア
ダプタ330およびベクトル利得アダプタ300を有す
る。フレーム消失が起きていないとき、合成フィルタア
ダプタ330およびベクトル利得アダプタ300はG.
728標準に従って動作する。アダプタ330、300
の動作は、消失フレーム期間中にのみ、G.728の対
応するアダプタ33、30とは異なる。
C係数への更新、および、アダプタ300による利得予
測器パラメータへの更新はいずれも消失フレームがある
間は不要となる。LPC係数の場合、その理由は、その
ような係数は帯域幅拡大手続きによって生成されるため
である。利得予測器パラメータの場合、その理由は、励
振合成が利得スケールド領域で実行されるためである。
ブロック330および300の出力は消失フレーム期間
中は不要であるため、これらのブロック330、300
によって実行される信号処理動作は、計算量を縮小する
ように変更可能である。
に、アダプタ330および300はそれぞれブロックに
よって示されるいくつかの信号処理ステップを有する
(図6のブロック49〜51、図7のブロック39〜4
8および67)。これらのブロックは一般にG.728
標準草案によって定義されているものと同一である。1
個以上の消失フレームの後の最初の良好なフレームにお
いて、ブロック330および300は、消失フレーム期
間中にメモリに記憶した信号に基づいて出力信号を形成
する。記憶前に、これらの信号は消失フレーム期間中に
合成された励振信号に基づいてアダプタによって生成さ
れたものである。合成フィルタアダプタ330の場合、
励振信号はまず、アダプタによって使用される前に量子
化音声へと合成される。ベクトル利得アダプタ300の
場合、励振信号は直接使用される。いずれの場合にも、
アダプタは、次の良好なフレームが生じたときにアダプ
タ出力が決定されるように、消失フレーム期間中に信号
を生成する必要がある。
タによって通常実行されるより少ない数の信号処理動作
が、消失フレーム期間中に実行されることが可能とな
る。実行される動作は、(i)後続の良好な(すなわ
ち、非消失)フレームにおいてアダプタ出力を形成する
際に使用される信号の形成および記憶のために必要な動
作であるか、または、(ii)消失フレーム期間中に復
号器の他の信号処理ブロックによって使用される信号の
形成に必要な動作であるかのいずれかである。これ以外
の信号処理動作は不要である。ブロック330および3
00は、図1、図6、および図7に示したように、フレ
ーム消失信号の受信に応じて、少ない数の信号処理動作
を実行する。フレーム消失信号は、改良した処理を起動
するか、または、モジュールが動作しないようにするか
のいずれかである。
答した信号処理動作の数の減少は正常動作には不要であ
る。ブロック330および300は、あたかもフレーム
消失が起きなかったかのように正常に動作し、上記のよ
うに、その出力信号は無視される。正常条件下では、動
作(i)および(ii)が実行される。しかし、信号処
理動作の減少によって、復号器の全体の複雑さを、正常
動作でのG.728復号器に対して確定している複雑さ
のレベル以内に抑えることが可能である。動作の減少が
なければ、励振信号を合成しLPC係数を帯域幅拡大す
るために必要な追加動作が復号器の全体の複雑さを引き
上げることになる。
の場合、G.728標準草案の第28〜29ページの
「ハイブリッド窓モジュール(HYBRID WINDOWING MODUL
E)」の説明に提示されている擬似コードを参照すれば、
動作の縮小セットの実施例は、(i)合成音声(これは
最後の良好なLPCフィルタの帯域幅拡大版に外挿した
ETベクトルを通過させることによって得られる)を使
用してバッファメモリSBを更新すること、および、
(ii)更新したSBバッファを使用して、指定された
方法でREXPを計算することからなる。
ム期間中の10次LPC係数および第1反射係数を用い
た後置フィルタを使用するため、縮小動作セットの実施
例はさらに、(iii)信号値RTMP(1)〜RTM
P(11)の生成(RTMP(12)〜RTMP(5
1)は不要)を含み、(iv)G.728標準草案の第
29〜30ページの「レヴィンソン−ダービン再帰モジ
ュール(LEVINSON-DURBINRECURSION MODULE)」の説明に
提示された擬似コードを参照すれば、1次から10次ま
でレヴィンソン−ダービン再帰が実行される(11次か
ら50次までの再帰は不要である)。注意すべき点であ
るが、帯域幅拡大は実行されない。
の場合、動作の縮小セットの実施例は以下の動作からな
る。(i)ブロック67、39、40、41、および4
2の動作。これらはともに、(合成したETベクトルに
基づいて)オフセット除去対数利得と、GTMP(ブロ
ック43への入力)とを計算する。(ii)第32〜3
3ページの「ハイブリッド窓モジュール(HYBRID WINDOW
ING MODULE)」の説明に提示されている擬似コードを参
照すれば、バッファメモリSBLGをGTMPで更新
し、REXPLG(自己相関関数の再帰成分)を更新す
る動作。(iii)第34ページの「対数利得線形予測
器(LOG-GAIN LINEAR PREDICTOR)」の説明に提示されて
いる擬似コードを参照すれば、フィルタメモリGSTA
TEをGTMPで更新する動作。注意すべき点である
が、モジュール44、45、47および48の機能は実
行されない。
なく)動作の縮小したセットを実行する結果、復号器
は、次の良好なフレームに対して適切に準備し、復号器
の計算量を縮小させつつ、消失フレーム期間中に必要な
信号を提供することが可能となる。
明はG.728標準の符号器に対する改良を要求しな
い。しかし、このような改良はある状況では有利となる
ことがある。例えば、フレーム消失が発話の初めに(例
えば、無音から有声音声の開始時に)起きた場合、外挿
した励振信号から得られる合成音声信号は一般にもとの
音声の良好な近似ではない。さらに、次の良好なフレー
ムが生起すると、復号器の内部状態と符号器の内部状態
の間に大きな不一致が生じる可能性が高い。符号器と復
号器の状態のこの不一致は収束するのに時間がかかるこ
とがある。
728復号器のアダプタへの上記の改良に加えて)収束
速度を改善するように符号器のアダプタを改良すること
である。符号器のLPCフィルタ係数アダプタおよび利
得アダプタ(予測器)の両方が、スペクトル平滑化技術
(SST)を導入し帯域幅拡大の量を増加させることに
よって改良される。
28標準草案の図5のLPC合成フィルタアダプタの改
良版を示す。改良した合成フィルタアダプタ230は、
自己相関係数を生成するハイブリッド窓モジュール49
と、窓モジュール49からの自己相関係数のスペクトル
平滑化を実行するSSTモジュール495と、合成フィ
ルタ係数を生成するレヴィンソン−ダービン再帰モジュ
ール50と、LPCスペクトルのスペクトルピークの帯
域幅を拡大する帯域幅拡大モジュール510とを有す
る。SSTモジュール495は、自己相関係数のバッフ
ァRTMP(1)〜RTMP(51)に、標準偏差が6
0Hzのガウシアン窓の右半分を乗じることによって自
己相関係数のスペクトル平滑化を実行する。自己相関係
数のこの窓処理をしたセットは次に通常のようにレヴィ
ンソン−ダービン再帰モジュール50に送られる。帯域
幅拡大モジュール510は、G.728標準草案のモジ
ュール51のように合成フィルタ係数に作用するが、
0.988ではなく0.96という帯域幅拡大係数を使
用する。
28標準草案の図6のベクトル利得アダプタの改良版を
示す。アダプタ200は、ハイブリッド窓モジュール4
3と、SSTモジュール435と、レヴィンソン−ダー
ビン再帰モジュール44と、帯域幅拡大モジュール45
0とを有する。図9のすべてのブロックは、新しいブロ
ック435および450を除いては、G.728標準の
図6のものと同一である。全体的に、モジュール43、
435、44、および450は上記の図8のモジュール
と同様に配置される。図8のSSTモジュール495と
同様に、図9のSSTモジュール435は、自己相関係
数のバッファR(1)〜R(11)にガウシアン窓の右
半分を乗じることによって自己相関係数のスペクトル平
滑化を実行する。しかし、今度は、このガウシアン窓の
標準偏差は45Hzである。図9の帯域幅拡大モジュー
ル450は、G.728標準草案の図6の帯域幅拡大モ
ジュール51のように合成フィルタ係数に作用するが、
0.906ではなく0.87という帯域幅拡大係数を使
用する。
本発明は、無線音声通信システムへの応用を有する。図
12に、本発明の実施例を使用した無線通信システムの
例を示す。図12は、送信器600および受信器700
を含む。送信器600の実施例は無線基地局である。受
信器700の実施例は、セルラ(無線)電話機、または
その他のパーソナル通信システム装置のような、移動ユ
ーザ端末である。(当然、無線基地局およびユーザ端末
はそれぞれ受信回路および送信回路を含むことも可能で
ある。)送信器600は音声符号器610を有する。音
声符号器610は、例えば、CCITT標準G.728
による符号器である。送信器はさらに、誤り検出(また
は検出および訂正)能力を備えた従来のチャネル符号器
620と、従来の変調器630と、従来の無線送信回路
とを有する。これらはすべて当業者には周知である。送
信器600によって送信された無線信号は伝送チャネル
を通じて受信器700によって受信される。例えば伝送
された信号に起こり得るさまざまなマルチパス成分の破
壊的干渉により、受信器700は深いフェージングを受
け、送信されたビットを明瞭に受信できない可能性があ
る。このような状況で、フレーム消失が起こり得る。
0と、従来の復調器720と、チャネル復号器730
と、本発明による音声復号器740とを有する。注意す
べき点であるが、チャネル復号器は、ビット誤り(また
は受信されないビット)が相当数存在すると判定すると
フレーム消失信号を発生する。あるいは(またはチャネ
ル復号器からのフレーム消失信号に加えて)復調器72
0が復号器740にフレーム消失信号を送ることも可能
である。
て説明したが、さらにさまざまな変形例が可能である。
LP音声符号化方式に関して説明したが、本発明の特徴
は他の音声符号化方式にも同様に適用可能である。例え
ば、そのような符号化方式では、利得スケールド励振信
号を、ピッチ周期性を有する信号に変換する長期予測器
(あるいは長期合成フィルタ)が含まれる。または、そ
のような符号化方式は後置フィルタを含まないことも可
能である。
た利得スケールド励振信号サンプルに基づいて励振信号
サンプルを合成するものとして説明した。しかし、本発
明は、利得スケーリングの前に(すなわち、利得増幅器
31の作用の前に)励振信号サンプルを合成するように
実装することも可能である。このような状況では、利得
値もまた合成(例えば外挿)しなければならない。
する上記の説明では、合成は例として外挿手続きによっ
て実現されている。当業者には明らかなように、内挿の
ような他の合成技術も使用可能である。
は、信号合成のための従来の構造のみならず、フィルタ
のような合成作用を実行する他のプロセスも指す。この
ような他のプロセスには、フーリエ変換係数の操作(知
覚的に重要でない情報を除去することもしないことも可
能)がある。
声符号化を使用した通信システムにおけるフレーム消失
による音声品質の劣化が軽減される。本発明によれば、
符号化された音声の隣接するフレームが利用不能になっ
た場合または信頼性がなくなった場合、復号器におい
て、そのフレーム消失の前に決定された励振信号に基づ
いて、代用励振信号が合成される。励振信号の合成の一
例は、フレーム消失前に決定された励振信号の外挿によ
って与えられる。このようにして、復号器では、音声
(またはそのプリカーサ)を合成するための励振が利用
可能となる。
ブロック図である。
図である。
ブロック流れ図である。
ード動作のブロック流れ図である。
パラメータ帯域幅拡大のブロック流れ図である。
る信号処理のブロック図である。
る信号処理のブロック図である。
タの改良版の図である。
良版の図である。
図である。
である。
Claims (22)
- 【請求項1】 入力ビットに応答する第1励振信号発生
器と励振信号に応答する合成フィルタとを有する復号器
で人間の音声を反映する信号を合成する方法において、 第1励振信号発生器によって発生された第1励振信号の
サンプルを記憶するステップと、 入力ビットの消失を示す信号に応答して、以前に記憶さ
れた第1励振信号のサンプルに基づいて第2励振信号を
合成するステップと、 第2励振信号をフィルタリングして前記音声を反映する
信号を合成するステップとからなることを特徴とする音
声信号合成方法。 - 【請求項2】 合成フィルタが線形予測合成フィルタで
あることを特徴とする請求項1の方法。 - 【請求項3】 合成フィルタの次数が20より大きいこ
とを特徴とする請求項1の方法。 - 【請求項4】 合成フィルタの次数が50であることを
特徴とする請求項3の方法。 - 【請求項5】 復号器が後方適応復号器であることを特
徴とする請求項1の方法。 - 【請求項6】 第1励振信号が利得スケールド励振信号
からなることを特徴とする請求項1の方法。 - 【請求項7】 第1励振信号発生器がコードブックメモ
リからなることを特徴とする請求項6の方法。 - 【請求項8】 第1励振信号発生器が利得増幅器をさら
に有することを特徴とする請求項7の方法。 - 【請求項9】 前記第2励振信号を合成するステップ
が、 有声音声のピッチ周期に基づいて、記憶されている励振
信号サンプルのセットを指定するステップと、 指定した励振信号サンプルのセットに基づいて第2励振
信号を形成するステップとからなることを特徴とする請
求項1の方法。 - 【請求項10】 前記第2励振信号を形成するステップ
が、第2励振信号のサンプルとして使用するために、前
記指定した励振信号サンプルのセットを複写するステッ
プからなることを特徴とする請求項9の方法。 - 【請求項11】 前記指定した励振信号サンプルのセッ
トが、連続して記憶されている5個のサンプルからなる
ことを特徴とする請求項9の方法。 - 【請求項12】 第2励振信号のサンプルをメモリに記
憶するステップをさらに有することを特徴とする請求項
9の方法。 - 【請求項13】 消失した入力ビットが有声音声を表す
可能性が高いかどうかを判定するステップをさらに有す
ることを特徴とする請求項9の方法。 - 【請求項14】 前記第2励振信号を合成するステップ
が、 ランダム過程に基づいて、記憶されている励振信号サン
プルのセットを指定するステップと、 指定した励振信号サンプルのセットに基づいて第2励振
信号を形成するステップとからなることを特徴とする請
求項1の方法。 - 【請求項15】 前記第2励振信号を形成するステップ
が、第2励振信号のサンプルとして使用するために、前
記指定した励振信号サンプルのセットを複写するステッ
プからなることを特徴とする請求項14の方法。 - 【請求項16】 前記指定した励振信号サンプルのセッ
トが、連続して記憶されている5個のサンプルからなる
ことを特徴とする請求項14の方法。 - 【請求項17】 第2励振信号のサンプルをメモリに記
憶するステップをさらに有することを特徴とする請求項
14の方法。 - 【請求項18】 消失した入力ビットが非有声音声を表
す可能性が高いかどうかを判定するステップをさらに有
することを特徴とする請求項14の方法。 - 【請求項19】 ランダム過程が乱数を発生するステッ
プからなることを特徴とする請求項14の方法。 - 【請求項20】 前記第2励振信号を形成するステップ
が、 メモリ内の複数の励振信号サンプルの平均絶対値を計算
するステップと、 前記平均絶対値に基づいて前記指定したセット内のサン
プルの絶対値をスケーリングするステップとからなるこ
とを特徴とする請求項14の方法。 - 【請求項21】 入力ビットに応答する第1励振信号発
生器と、利得を生成する励振信号利得アダプタと、励振
信号に応答する合成フィルタと、合成フィルタ係数信号
を生成する合成フィルタアダプタとを有する復号器で人
間の音声を反映する信号を合成する方法において、 第1励振信号発生器によって発生された第1励振信号の
サンプルを記憶するステップと、 入力ビットの消失を示す信号に応答して、以前に記憶さ
れた第1励振信号のサンプルに基づいて第2励振信号を
合成するステップと、 第2励振信号をフィルタリングして前記音声を反映する
信号を合成するステップと、 入力ビットの消失に対応して、生成された利得または係
数信号を第1励振信号発生器および合成フィルタが使用
しないようにして、入力ビットの消失がなかったかのよ
うに励振信号利得アダプタおよび合成フィルタアダプタ
を動作させるステップとからなることを特徴とする音声
信号合成方法。 - 【請求項22】 入力ビットに応答する第1励振信号発
生器と、利得を生成する励振信号利得アダプタと、励振
信号に応答する合成フィルタと、合成フィルタ係数信号
を生成する合成フィルタアダプタとを有する復号器で人
間の音声を反映する信号を合成する方法において、 第1励振信号発生器によって発生された第1励振信号の
サンプルを記憶するステップと、 入力ビットの消失を示す信号に応答して、以前に記憶さ
れた第1励振信号のサンプルに基づいて第2励振信号を
合成するステップと、 第2励振信号をフィルタリングして前記音声を反映する
信号を合成するステップと、 現在の消失フレームにおいて、励振信号利得アダプタお
よび合成フィルタアダプタが、利得および係数信号を生
成するのに必要なすべての信号処理動作以外の信号処理
動作であって、将来の非消失フレームにおける利得およ
び係数信号を生成する際に励振信号利得アダプタおよび
合成フィルタアダプタによって使用される信号を記憶す
る信号処理動作を含む信号処理動作を実行するステップ
とからなることを特徴とする音声信号合成方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/212,408 US5615298A (en) | 1994-03-14 | 1994-03-14 | Excitation signal synthesis during frame erasure or packet loss |
US212408 | 1994-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07311597A true JPH07311597A (ja) | 1995-11-28 |
JP3439869B2 JP3439869B2 (ja) | 2003-08-25 |
Family
ID=22790887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07935895A Expired - Lifetime JP3439869B2 (ja) | 1994-03-14 | 1995-03-13 | 音声信号合成方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5615298A (ja) |
EP (1) | EP0673017B1 (ja) |
JP (1) | JP3439869B2 (ja) |
KR (1) | KR950035132A (ja) |
AU (1) | AU1367395A (ja) |
CA (1) | CA2142393C (ja) |
DE (1) | DE69531642T2 (ja) |
ES (1) | ES2207643T3 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100438167B1 (ko) * | 2000-11-10 | 2004-07-01 | 엘지전자 주식회사 | 인터넷 전화통신을 위한 음성신호 송수신장치 |
WO2008007700A1 (fr) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
JP2012098740A (ja) * | 2005-01-31 | 2012-05-24 | Qualcomm Inc | 音声通信におけるフレーム消失キャンセル |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5550543A (en) | 1994-10-14 | 1996-08-27 | Lucent Technologies Inc. | Frame erasure or packet loss compensation method |
DE69419515T2 (de) * | 1994-11-10 | 2000-01-20 | Telefonaktiebolaget L M Ericsson (Publ), Stockholm | Verfahren und Einrichtung zur Tonwiederherstellung während Auslöschungen |
SE504397C2 (sv) * | 1995-05-03 | 1997-01-27 | Ericsson Telefon Ab L M | Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering |
FR2734389B1 (fr) * | 1995-05-17 | 1997-07-18 | Proust Stephane | Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme |
WO1996037964A1 (en) * | 1995-05-22 | 1996-11-28 | Ntt Mobile Communications Network Inc. | Sound decoding device |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
FI105001B (fi) * | 1995-06-30 | 2000-05-15 | Nokia Mobile Phones Ltd | Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
US5943347A (en) * | 1996-06-07 | 1999-08-24 | Silicon Graphics, Inc. | Apparatus and method for error concealment in an audio stream |
US7788092B2 (en) * | 1996-09-25 | 2010-08-31 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
US6134265A (en) * | 1996-12-31 | 2000-10-17 | Cirrus Logic, Inc. | Precoding coefficient training in a V.34 modem |
JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
FR2774827B1 (fr) * | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
DE19814633C2 (de) * | 1998-03-26 | 2001-09-13 | Deutsche Telekom Ag | Verfahren zur Verschleierung von Sprachsegmentverlusten bei paketorientierter Übertragung |
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP4249821B2 (ja) * | 1998-08-31 | 2009-04-08 | 富士通株式会社 | ディジタルオーディオ再生装置 |
US6275798B1 (en) * | 1998-09-16 | 2001-08-14 | Telefonaktiebolaget L M Ericsson | Speech coding with improved background noise reproduction |
US6661848B1 (en) | 1998-09-25 | 2003-12-09 | Intel Corporation | Integrated audio and modem device |
AU4169200A (en) * | 1999-03-04 | 2000-09-21 | American Towers, Inc. | Method and apparatus for determining the perceptual quality of speech in a communications network |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
US6233552B1 (en) * | 1999-03-12 | 2001-05-15 | Comsat Corporation | Adaptive post-filtering technique based on the Modified Yule-Walker filter |
US6952668B1 (en) * | 1999-04-19 | 2005-10-04 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
WO2000063882A1 (en) * | 1999-04-19 | 2000-10-26 | At & T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
US7047190B1 (en) | 1999-04-19 | 2006-05-16 | At&Tcorp. | Method and apparatus for performing packet loss or frame erasure concealment |
US7117156B1 (en) | 1999-04-19 | 2006-10-03 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
GB2358558B (en) * | 2000-01-18 | 2003-10-15 | Mitel Corp | Packet loss compensation method using injection of spectrally shaped noise |
US6842733B1 (en) | 2000-09-15 | 2005-01-11 | Mindspeed Technologies, Inc. | Signal processing system for filtering spectral content of a signal for speech coding |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US7039716B1 (en) * | 2000-10-30 | 2006-05-02 | Cisco Systems, Inc. | Devices, software and methods for encoding abbreviated voice data for redundant transmission through VoIP network |
US20070055498A1 (en) * | 2000-11-15 | 2007-03-08 | Kapilow David A | Method and apparatus for performing packet loss or frame erasure concealment |
EP1217613A1 (fr) * | 2000-12-19 | 2002-06-26 | Koninklijke Philips Electronics N.V. | Reconstitution de trames manquantes ou mauvaises en téléphonie cellulaire |
DE10124421C1 (de) * | 2001-05-18 | 2002-10-17 | Siemens Ag | Verfahren zur Schätzung eines Codecparameters |
US7673223B2 (en) * | 2001-06-15 | 2010-03-02 | Qualcomm Incorporated | Node processors for use in parity check decoders |
US6938196B2 (en) * | 2001-06-15 | 2005-08-30 | Flarion Technologies, Inc. | Node processors for use in parity check decoders |
US6633856B2 (en) * | 2001-06-15 | 2003-10-14 | Flarion Technologies, Inc. | Methods and apparatus for decoding LDPC codes |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US7590525B2 (en) * | 2001-08-17 | 2009-09-15 | Broadcom Corporation | Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US6961888B2 (en) | 2002-08-20 | 2005-11-01 | Flarion Technologies, Inc. | Methods and apparatus for encoding LDPC codes |
US20040122680A1 (en) * | 2002-12-18 | 2004-06-24 | Mcgowan James William | Method and apparatus for providing coder independent packet replacement |
US20040157626A1 (en) * | 2003-02-10 | 2004-08-12 | Vincent Park | Paging methods and apparatus |
US20070234178A1 (en) * | 2003-02-26 | 2007-10-04 | Qualcomm Incorporated | Soft information scaling for interactive decoding |
US6957375B2 (en) * | 2003-02-26 | 2005-10-18 | Flarion Technologies, Inc. | Method and apparatus for performing low-density parity-check (LDPC) code operations using a multi-level permutation |
KR100959425B1 (ko) * | 2003-02-26 | 2010-05-26 | 콸콤 인코포레이티드 | 반복 디코딩을 위한 소프트 정보 스케일링 |
US7411985B2 (en) * | 2003-03-21 | 2008-08-12 | Lucent Technologies Inc. | Low-complexity packet loss concealment method for voice-over-IP speech transmission |
US7231557B2 (en) * | 2003-04-02 | 2007-06-12 | Qualcomm Incorporated | Methods and apparatus for interleaving in a block-coherent communication system |
US8196000B2 (en) * | 2003-04-02 | 2012-06-05 | Qualcomm Incorporated | Methods and apparatus for interleaving in a block-coherent communication system |
US7434145B2 (en) * | 2003-04-02 | 2008-10-07 | Qualcomm Incorporated | Extracting soft information in a block-coherent communication system |
US7379864B2 (en) * | 2003-05-06 | 2008-05-27 | Lucent Technologies Inc. | Method and apparatus for the detection of previous packet loss in non-packetized speech |
CA2475283A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Method for recovery of lost speech data |
US7478040B2 (en) * | 2003-10-24 | 2009-01-13 | Broadcom Corporation | Method for adaptive filtering |
US7324937B2 (en) * | 2003-10-24 | 2008-01-29 | Broadcom Corporation | Method for packet loss and/or frame erasure concealment in a voice communication system |
US7237181B2 (en) * | 2003-12-22 | 2007-06-26 | Qualcomm Incorporated | Methods and apparatus for reducing error floors in message passing decoders |
US20050147131A1 (en) * | 2003-12-29 | 2005-07-07 | Nokia Corporation | Low-rate in-band data channel using CELP codewords |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
ATE523876T1 (de) * | 2004-03-05 | 2011-09-15 | Panasonic Corp | Fehlerverbergungseinrichtung und fehlerverbergungsverfahren |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7395490B2 (en) * | 2004-07-21 | 2008-07-01 | Qualcomm Incorporated | LDPC decoding methods and apparatus |
US7346832B2 (en) * | 2004-07-21 | 2008-03-18 | Qualcomm Incorporated | LDPC encoding methods and apparatus |
US7127659B2 (en) * | 2004-08-02 | 2006-10-24 | Qualcomm Incorporated | Memory efficient LDPC decoding methods and apparatus |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
KR100612889B1 (ko) * | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
JP2007114417A (ja) * | 2005-10-19 | 2007-05-10 | Fujitsu Ltd | 音声データ処理方法及び装置 |
JP5142727B2 (ja) * | 2005-12-27 | 2013-02-13 | パナソニック株式会社 | 音声復号装置および音声復号方法 |
US8280728B2 (en) * | 2006-08-11 | 2012-10-02 | Broadcom Corporation | Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform |
KR100772547B1 (ko) * | 2006-08-31 | 2007-11-02 | 주식회사 하이닉스반도체 | 반도체 장치 및 그의 테스트 방법 |
US20080117959A1 (en) * | 2006-11-22 | 2008-05-22 | Qualcomm Incorporated | False alarm reduction in detection of a synchronization signal |
JP5489711B2 (ja) * | 2007-03-02 | 2014-05-14 | パナソニック株式会社 | 音声符号化装置及び音声復号装置 |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
US20080231557A1 (en) * | 2007-03-20 | 2008-09-25 | Leadis Technology, Inc. | Emission control in aged active matrix oled display using voltage ratio or current ratio |
CN101325537B (zh) * | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
US8386246B2 (en) * | 2007-06-27 | 2013-02-26 | Broadcom Corporation | Low-complexity frame erasure concealment |
US20090055171A1 (en) * | 2007-08-20 | 2009-02-26 | Broadcom Corporation | Buzz reduction for low-complexity frame erasure concealment |
JP2009063928A (ja) * | 2007-09-07 | 2009-03-26 | Fujitsu Ltd | 補間方法、情報処理装置 |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) * | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
DE602007004504D1 (de) * | 2007-10-29 | 2010-03-11 | Harman Becker Automotive Sys | Partielle Sprachrekonstruktion |
US8209514B2 (en) * | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
WO2011065741A2 (ko) | 2009-11-24 | 2011-06-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
US8149529B2 (en) * | 2010-07-28 | 2012-04-03 | Lsi Corporation | Dibit extraction for estimation of channel parameters |
RU2675777C2 (ru) | 2013-06-21 | 2018-12-24 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ улучшенного плавного изменения сигнала в различных областях во время маскирования ошибок |
ES2661732T3 (es) * | 2013-10-31 | 2018-04-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo |
ES2746034T3 (es) | 2013-10-31 | 2020-03-04 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de error sobre la base de una señal de excitación de dominio de tiempo |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN104934035B (zh) | 2014-03-21 | 2017-09-26 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
KR102102764B1 (ko) | 2018-12-27 | 2020-04-22 | 주식회사 세원정공 | 카울 크로스 부품의 성형 및 체결부 접합 겸용 금형장치 |
US11087778B2 (en) * | 2019-02-15 | 2021-08-10 | Qualcomm Incorporated | Speech-to-text conversion based on quality metric |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
EP1239456A1 (en) * | 1991-06-11 | 2002-09-11 | QUALCOMM Incorporated | Variable rate vocoder |
CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
-
1994
- 1994-03-14 US US08/212,408 patent/US5615298A/en not_active Expired - Lifetime
-
1995
- 1995-02-13 CA CA002142393A patent/CA2142393C/en not_active Expired - Lifetime
- 1995-02-28 ES ES95301298T patent/ES2207643T3/es not_active Expired - Lifetime
- 1995-02-28 EP EP95301298A patent/EP0673017B1/en not_active Expired - Lifetime
- 1995-02-28 DE DE69531642T patent/DE69531642T2/de not_active Expired - Lifetime
- 1995-03-07 AU AU13673/95A patent/AU1367395A/en not_active Abandoned
- 1995-03-13 KR KR1019950005088A patent/KR950035132A/ko not_active Application Discontinuation
- 1995-03-13 JP JP07935895A patent/JP3439869B2/ja not_active Expired - Lifetime
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100438167B1 (ko) * | 2000-11-10 | 2004-07-01 | 엘지전자 주식회사 | 인터넷 전화통신을 위한 음성신호 송수신장치 |
JP2012098740A (ja) * | 2005-01-31 | 2012-05-24 | Qualcomm Inc | 音声通信におけるフレーム消失キャンセル |
WO2008007700A1 (fr) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
JPWO2008007700A1 (ja) * | 2006-07-12 | 2009-12-10 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
US8255213B2 (en) | 2006-07-12 | 2012-08-28 | Panasonic Corporation | Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method |
JP5190363B2 (ja) * | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
Also Published As
Publication number | Publication date |
---|---|
EP0673017A3 (en) | 1997-08-13 |
JP3439869B2 (ja) | 2003-08-25 |
DE69531642D1 (de) | 2003-10-09 |
CA2142393A1 (en) | 1995-09-15 |
DE69531642T2 (de) | 2004-06-24 |
KR950035132A (ko) | 1995-12-30 |
EP0673017A2 (en) | 1995-09-20 |
CA2142393C (en) | 1999-01-19 |
US5615298A (en) | 1997-03-25 |
EP0673017B1 (en) | 2003-09-03 |
ES2207643T3 (es) | 2004-06-01 |
AU1367395A (en) | 1995-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3439869B2 (ja) | 音声信号合成方法 | |
JP3241962B2 (ja) | 線形予測係数信号生成方法 | |
US5450449A (en) | Linear prediction coefficient generation during frame erasure or packet loss | |
JP3459133B2 (ja) | 復号器の動作方法 | |
AU739238B2 (en) | Speech coding | |
EP0747882B1 (en) | Pitch delay modification during frame erasures | |
JP3955600B2 (ja) | 背景ノイズエネルギーレベルを見積もる方法と装置 | |
EP0707308B1 (en) | Frame erasure or packet loss compensation method | |
US6606593B1 (en) | Methods for generating comfort noise during discontinuous transmission | |
US7554969B2 (en) | Systems and methods for encoding and decoding speech for lossy transmission networks | |
US8214203B2 (en) | Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same | |
US20080069016A1 (en) | Packet based echo cancellation and suppression | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
JP2004138756A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
KR20010073069A (ko) | 음성코딩을 위한 적응성 표준 | |
EP0747884A2 (en) | Codebook gain attenuation during frame erasures | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
JP3206497B2 (ja) | インデックスによる信号生成型適応符号帳 | |
JP3225256B2 (ja) | 擬似背景雑音生成方法 | |
JP3508850B2 (ja) | 疑似背景雑音生成方法 | |
CN100349395C (zh) | 用于语音帧误差降低的语音通信单元和方法 | |
JPH0651799A (ja) | 音声メッセージ符号化装置と復号化装置とを同期化させる方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080613 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090613 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090613 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100613 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |