Nothing Special   »   [go: up one dir, main page]

JP2856185B2 - 音声符号化復号化システム - Google Patents

音声符号化復号化システム

Info

Publication number
JP2856185B2
JP2856185B2 JP860697A JP860697A JP2856185B2 JP 2856185 B2 JP2856185 B2 JP 2856185B2 JP 860697 A JP860697 A JP 860697A JP 860697 A JP860697 A JP 860697A JP 2856185 B2 JP2856185 B2 JP 2856185B2
Authority
JP
Japan
Prior art keywords
speech
filter
term
short
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP860697A
Other languages
English (en)
Other versions
JPH10210043A (ja
Inventor
靖浩 和気
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP860697A priority Critical patent/JP2856185B2/ja
Priority to US09/009,163 priority patent/US5974374A/en
Publication of JPH10210043A publication Critical patent/JPH10210043A/ja
Application granted granted Critical
Publication of JP2856185B2 publication Critical patent/JP2856185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化復号化
システムに関し、特に符号化側に入力される信号を監視
することによって、入力音声の有音/無音を検出し、有
音部分の符号化データのみをセル化し伝送する無音圧縮
の音声符号化復号化システムに関するものである。
【0002】
【従来の技術】近年、音声符号化装置で行われる音声符
号化処理として、音声分析合成法の一つであるコード駆
動LPC符号化(CELP:Code Excited Linear Pred
iction)方式や、共役構造−代数的符号励振線形予測
(CS−ACELP:conjugate-structure algebraic-
code-exited linear-prediction)方式が用いられるつ
つある。CS−ACELP方式は、ITU−T勧告G.
729に示されるように励振パルスを順に、短期合成フ
ィルタと、長期合成フィルタに通し、最も入力信号に近
い復号音声の得られるパルスの位置と極性を符号化し伝
送する方式である。
【0003】従来、このような符号化方式と音声検出器
を組み合わせ、有音区間のみ符号化データを伝送するよ
うな無音圧縮音声符号化装置では、無音から有音に変化
する部分で、音声符号化側と音声復号化側とで内部状態
の不一致が発生し、話頭部分の音声品質が劣化するとい
う問題があり、これに対応するための方法が提案されて
いる。例えば、第1の方法として、音声の無音区間で符
号化器、復号化器の動作を停止し、有音開始と同時に符
号化器、復号化器の動作を再開することにより、有音開
始部分で、それぞれの内部状態を一致させ音声品質劣化
を改善するものが考えられている(例えば、特開平03
−064235号公報,特開平02−272850号公
報など)。
【0004】また、第2の方法として、符号化用フィル
タと、復号化用フィルタの遅延要素を、無音区間ではメ
モリに退避しておき、有音の開始時点でメモリからロー
ドすることにより同様の目的を達成するものが提案され
ている(例えば、特開平03−0210845号公報な
ど)。また、第3の方法として、無音区間にて符号化
器、復号化器をそれぞれリセットし、あるいは規定値に
初期化して、有音開始位置での内部状態を一致させるこ
とにより音声の劣化を防ぐ構成のものが提案されている
(例えば、特開平05−292121号公報、特開平0
4−167635号公報、特開平02−244935号
公報など)。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声符号化復号化システムでは、それぞれ以
下のような問題点があった。まず、従来の第1の方法に
よれば、音声の無音区間で符号化器、復号化器の動作を
停止しておくことにより、有音開始で、それぞれの内部
状態を一致させ、また従来の第2の方法によれば、有音
から無音に切り替わった時点での内部状態をメモリに退
避しておくことにより、それぞれの内部状態を一致させ
るものとなっていることから、音声が入力されることに
よって有音状態が開始されて、本来の符号化処理、復号
化処理が開始されるが、その入力音声から得られる符号
化、復号化の内部状態と保持された内部状態との間には
何ら相関が無いため、なめらかに内部状態が遷移せず、
そのため音声品質が劣化してしまうという問題点があっ
た。
【0006】特に、これら従来の第1または第2の方法
を、最近のCS−ACELP等の高能率音声符号化方式
で採用されている短期予測フィルタと、長期予測フィル
タ(復号化側の短期合成フィルタと、長期合成フィルタ
に対応する)とを組み合わせた符号化方式に適用した場
合、短期予測フィルタの内部状態は、そのインパルス応
答が比較的短いため、従来技術でも顕著な劣化は無いと
思われる。しかし、長期予測フィルタのインパルス応答
は非常に長くなるため有音区間が始まり、保持されてい
た内部状態を初期値として、本来の符号化復号化処理に
よる内部状態に収束するまでにはかなりの時間を要し、
収束するまでの区間、音声品質の劣化が顕著になってし
まうという問題が指摘される。
【0007】本来、長期予測フィルタは音声の母音等に
おける定常的な部分の周期性を利用した予測であり、母
音定常部では十分な効果が期待できるが、無声・無音部
分での予測効果は期待できず、予測ゲインは0(ゼロ)
に近づく特性を示す。したがって、このような特徴をも
つ長期予測フィルタに、従来の第1または第2の方法を
適用した場合には、有音開始部における長期予測フィル
タの初期値は、一つ前の有音末尾部分の母音定常部等に
対応した値を持ってしまうことが容易に理解できる。
【0008】また従来の第3の方法によれば、無音区間
の間は、符号化器と復号化器をリセットしたり、規定値
に初期化することで、有音開始位置での内部状態を一致
させている。しかし、前述の通り、音声が入力されるこ
とによって有音状態が開始し、その入力音声から得られ
る符号化、復号化の内部状態と、前記初期値の内部状態
との間には、なんら相関が無いため、なめらかに内部状
態が遷移せず、そのため音声品質が劣化してしまうとい
う問題点があった。
【0009】前述したように、CS−ACELP等の高
能率音声符号化方式で採用されている短期予測フィルタ
と、長期予測フィルタ(復号化側の短期合成フィルタ
と、長期合成フィルタに対応する)とを組み合わせた符
号化方式においては、有音開始時点では、短期予測フィ
ルタの予測ゲインに依存して有効な符号化が実行され
る。一方、長期予測フィルタは予測ゲイン0(ゼロ)の
状態から始まり、徐々に入力信号が定常的な音声信号に
遷移していって初めて長期予測フィルタの効果が発揮さ
れるように動作する。
【0010】このため、従来の第3の方法を、短期予測
フィルタと長期予測フィルタとを持つ符号化方式に適用
した場合、本来、効果が期待できない有音開始部分での
長期予測フィルタには有効であるが、期待すべき短期予
測フィルタの効果が得られず、音声品質劣化が劣化して
しまうという問題点があった。したがって、従来技術で
は、ADPCM(adaptive differential PCM )や、A
PC(adaptive predictive coding)等の、短期予測だ
けに頼った符号化方式と音声検出器を組み合わせた無音
圧縮音声符号化復号化システムにおいて有効に動作して
も、最近の短期予測と長期予測を組み合わせて符号化効
率を上げるような符号化方式に適用すると、かえって有
音開始部分の音声品質劣化を招くという欠点があった。
本発明はこのような課題を解決するためのものであり、
無音区間から有音区間に変化した場合でもなめらかに内
部状態が遷移し、音声品質の劣化を回避できる音声符号
化復号化システムを提供することを目的としている。
【0011】
【課題を解決するための手段】このような目的を達成す
るために、本発明による音声符号化復号化システムは、
音声符号化部として、入力された音声信号から抽出した
線形予測係数をフィルタ係数とする短期予測フィルタ、
およびこの音声信号から抽出した音声の基本周波数であ
るピッチ周期をタップ係数としこの音声信号から抽出し
たピッチ予測係数をフィルタ係数とする長期予測フィル
タを有し、これら短期予測フィルタおよび長期予測フィ
ルタを用いて音声信号を符号化しディジタル音声信号と
して出力する音声符号化器と、音声信号の有音/無音を
検出しその検出結果として有音/無音情報を出力する音
声検出器と、この有音/無音情報に基づいて音声符号化
器の短期予測フィルタおよび長期予測フィルタの動作を
制御する音声符号化器制御手段と、ディジタル音声信
号、線形予測係数、ピッチ周期およびピッチ予測係数
と、有音/無音情報とを多重化して多重符号化データと
して出力する多重化器と、多重符号化データに多重化さ
れている有音/無音情報が有音を示す場合のみ、多重符
号化データをセル化してATM伝送路に送出するセル組
立器とを備えるものである。
【0012】さらに音声復号化部として、ATM伝送路
から受信したセルを分解して多重符号化データを出力す
るとともに、セルの受信状態としてセル受信/セル非受
信を示す受信状態情報を出力するセル分解器と、セル分
解器からの多重符号化データから復号化した線形予測係
数をフィルタの係数とする短期合成フィルタ、およびこ
の多重符号化データから復号化したピッチ周期をタップ
係数としこの多重符号化データから復号化したピッチ予
測係数をフィルタ係数とする長期合成フィルタを有し、
これら短期合成フィルタおよび長期合成フィルタを用い
て多重符号化データを音声信号に復号化する音声符号化
器と、受信状態情報に基づいて音声復号化器の短期合成
フィルタおよび長期合成フィルタの動作を制御する音声
復号化器制御手段と、無音区間の音声信号として所定の
雑音信号を出力する雑音発生器と、受信状態情報がセル
受信を示す場合には音声復号化器からの音声信号を選択
出力し、受信状態情報がセル非受信を示す場合には雑音
発生器からの雑音信号を選択出力する選択器とを備える
ものである。
【0013】したがって、音声符号化部では、音声符号
化器にて符号化されたディジタル音声信号と、短期予測
フィルタにてフィルタ係数として用いた線形予測係数
と、長期予測フィルタにてタップ係数およびフィルタ係
数として用いたピッチ周期およびピッチ予測係数と、入
力された音声信号の有音/無音を示す有音/無音情報と
が多重化器にて多重化されて多重符号化データとして出
力され、セル組立器にて、この多重符号化データに多重
化されている有音/無音情報が有音を示す場合のみ、こ
の多重符号化データがセル化されてATM伝送路に送出
される。また、音声復号化部では、ATM伝送路から受
信したセルがセル分解器にて分解されて多重符号化デー
タとして出力され、この多重符号化データから復号化さ
れた線形予測係数をフィルタ係数とする短期合成フィル
タと、多重符号化データから復号化されたピッチ周期お
よびピッチ予測係数をタップ係数およびフィルタ係数と
する長期合成フィルタとにより、多重符号化データから
音声信号が復号化され、セル分解器からの受信状態情報
がセル受信を示す場合には音声信号が出力され、セル非
受信を示す場合には雑音発生器からの雑音信号が選択器
から出力される。
【0014】また、音声符号化器制御手段は、有音/無
音情報が有音を示す場合には短期予測フィルタおよび長
期予測フィルタにてフィルタリング処理を実行させ、無
音を示す場合には短期予測フィルタを停止させてフィル
タ遅延要素を保持するとともに、長期予測フィルタのフ
ィルタ遅延要素とピッチ予測係数を初期化し、音声復号
化器制御手段は、受信状態情報がセル受信を示す場合に
は短期合成フィルタおよび長期合成フィルタにてフィル
タリング処理を実行させ、セル非受信を示す場合には短
期合成フィルタを停止させてフィルタ遅延要素を保持す
るとともに、長期合成フィルタのフィルタ遅延要素とピ
ッチ予測係数を初期化するようにしたものである。
【0015】したがって、有音/無音情報が有音を示す
場合には短期予測フィルタおよび長期予測フィルタにて
フィルタリング処理が実行され、無音を示す場合には短
期予測フィルタが停止してフィルタ遅延要素が保持され
るとともに、長期予測フィルタのフィルタ遅延要素とピ
ッチ予測係数とが初期化される。さらに、受信状態情報
がセル受信を示す場合には短期合成フィルタおよび長期
合成フィルタにてフィルタリング処理が実行され、セル
非受信を示す場合には短期合成フィルタが停止してフィ
ルタ遅延要素が保持されるとともに、長期合成フィルタ
のフィルタ遅延要素とピッチ予測係数とが初期化され
る。
【0016】また、音声符号化器制御手段は、有音/無
音情報が有音を示す場合には短期予測フィルタおよび長
期予測フィルタにてフィルタリング処理を実行させ、無
音を示す場合には短期予測フィルタにてフィルタリング
処理を実行させるとともに長期予測フィルタのフィルタ
遅延要素を初期化し、無音から有音に変化した場合には
短期予測フィルタのフィルタ遅延要素を多重化器に出力
させ、音声復号化器制御手段は、受信状態情報がセル受
信を示す場合には短期合成フィルタおよび長期合成フィ
ルタにてフィルタリング処理を実行させ、セル非受信を
示す場合には短期合成フィルタのフィルタ遅延要素を初
期化し、セル非受信からセル受信に変化した場合には多
重符号化データを復号化して得られた短期予測フィルタ
のフィルタ遅延要素にて短期合成フィルタを初期化する
ようにしたものである。
【0017】したがって、有音/無音情報が有音を示す
場合には短期予測フィルタおよび長期予測フィルタにて
フィルタリング処理が実行され、無音を示す場合には短
期予測フィルタにてフィルタリング処理が実行されると
ともに長期予測フィルタのフィルタ遅延要素が初期化さ
れ、無音から有音に変化した場合には短期予測フィルタ
のフィルタ遅延要素が多重化器に出力される。さらに、
受信状態情報がセル受信を示す場合には短期合成フィル
タおよび長期合成フィルタにてフィルタリング処理が実
行され、セル非受信を示す場合には短期合成フィルタの
フィルタ遅延要素が初期化され、セル非受信からセル受
信に変化した場合には多重符号化データが復号化されて
得られた短期予測フィルタのフィルタ遅延要素にて短期
合成フィルタが初期化される。
【0018】
【発明の実施の形態】次に、本発明について図面を参照
して説明する。図1は本発明の一実施の形態である音声
符号化復号化システムのブロック図であり、同図におい
て、音声符号化部1は、入力音声を各種符号化データに
変換する音声符号化器10と、入力音声(電話帯域音声
信号)の有音/無音を検出して有音/無音情報を出力す
る音声検出器13と、音声検出器13からの有音/無音
情報に基づき音声符号化器10を制御する音声検出器制
御手段104と、音声符号化器10からの各種符号化デ
ータと音声検出器13からの有音/無音情報とを多重符
号化データとして多重化し出力する多重化器(MUX)
12と、有音/無音情報に基づき有音区間にのみ多重符
号化データを固定長のATMセル(以下、セルという)
にセル化(アセンブリ)し、ATM伝送路に出力するセ
ル組立器11とを備えている。
【0019】また音声符号化器10は、入力音声から線
形予測係数を抽出し第1の符号化データとして送出する
線形予測係数抽出部100と、入力音声から音声の基本
周波数を示すピッチ周期とピッチ予測係数とを抽出し第
2の符号化データとして出力するピッチ抽出部101
と、ピッチ抽出部101の出力であるピッチ周期をフィ
ルタのタップ数としピッチ予測係数をフィルタ係数とし
入力音声をフィルタリング処理して出力する長期予測フ
ィルタ103と、線形予測係数抽出部100の出力であ
る線形予測係数をフィルタ係数とし長期予測フィルタ1
03からの出力をフィルタリング処理し第3の符号化デ
ータすなわちディジタル音声信号として出力する短期予
測フィルタ102とを備えている。
【0020】一方、音声復号化部2は、ATM伝送路の
データ受信状態を監視することによりセル受信/非受信
の受信状態情報と受信したセルとを分解(ディスアセン
ブリ)し、多重符号化データを抽出するセル分解器21
と、受信した多重符号化データを元の音声信号に復号化
する音声復号化器20と、無音区間を示す所定の雑音信
号を出力する雑音発生器22と、セル受信/非受信の受
信状態情報に基づき音声復号化器20を制御する音声復
号化器制御手段202と、セル受信/非受信の受信状態
情報に基づき雑音発生器22の出力か音声復号化器20
の出力かのどちらか一方を選択出力するセレクタ23と
を備えている。
【0021】また音声復号化器20は、セル分解器21
から出力された多重符号化データから第1の符号化デー
タである線形予測計数を復号化して出力する線形予測計
数復号化部204と、セル分解器21から出力された多
重符号化データから第2の符号化データであるピッチ周
期とピッチ予測係数とを復号化して出力するピッチ復号
化部と、線形予測計数復号化部204からの線形予測計
数をフィルタ係数としてセル分解器21から出力された
多重符号化データをフィルタリング処理する短期合成フ
ィルタ200と、ピッチ復号化部203からのピッチ周
期とピッチ予測係数とに基づき短期合成フィルタ200
からの出力をフィルタリング処理し音声信号として出力
する長期合成フィルタ201を備えている。
【0022】次に、図1および図2を参照して、本発明
の動作を説明する。図2は本発明の符号化復号化システ
ムを用いた構成例を示す図である。図2において、電話
機300からの音声信号は、A局交換機302を経由し
て、図1の音声符号化部1と同等の構成を有する音声符
号化装置304に入力される。この音声信号は、音声符
号化装置304において音声検出器13および、音声符
号化器10により有音部分だけが多重符号化データに変
換された後、ATMセル化され、有音セルとして、非同
期転送モード(ATM)でディジタルデータの送受信が
行われるATM伝送路308に送出される。
【0023】ATM伝送路308を経由した有音セル
は、図1の音声復号化部2と同等の構成を有する音声復
号化装置307に入力され、音声復号化器20により多
重符号化データから音声信号に復号化された後、B局交
換機303を経由して電話機301に伝送される。音声
復号化装置307では、セルを受信する有音区間だけは
音声復号化器20の出力を交換機303に対して選択出
力し、セル非受信の区間は、音声復号化装置307内部
の雑音発生器22の出力を交換機303に対して選択出
力することで、無音圧縮による通話音声の断続感を軽減
している。
【0024】以下、図1を参照して、音声符号化装置3
04および音声復号化装置307内部の動作について説
明する。音声符号化装置304(音声符号化部1)に入
力された音声信号は、図1に示すように、音声符号化器
10と音声検出器13とに同時に入力される。ここで、
音声符号化器10への入力には、音声検出器13での音
声入力から音声検出結果出力までの遅延時問を吸収する
ために、音声符号化器10への入力に対してのみ遅延バ
ッファを介する場合もある。音声検出器13では入力信
号を常時監視することにより、有音/無音の判定を実行
し、判定結果を有音/無音情報として音声符号化器制御
手段104と多重化器12とに出力する。
【0025】音声符号化器10では、線形予測係数抽出
部100により入力音声のLPC分析が実行されて線形
予測係数を抽出し、第1の符号化データとして多重化器
12に出力するとともに、線形予測係数をフィルタ係数
とする短期予測フィルタ102に入力される。短期予測
フィルタ102の伝達関数Hは、以下に示す数1として
表現できる。ここで、z-iはフィルタの遅延要素、ai
は線形予測係数、Pは線形予測の次数をそれぞれ示して
おり、例えばITU−T標準G.729のCS−ACE
LP符号化方式ではP=10としている。
【0026】
【数1】
【0027】また、入力音声からピッチ抽出部101に
よりピッチ分析が実行され、入力音声のピッチ周期とピ
ッチ予測係数とが求められる。このピッチ抽出部101
の出力は、第2の符号化データとして多重化器12に出
力するとともに、長期予測フィルタ103に入力され、
ピッチ予測係数をフィルタ係数とするとともにピッチ周
期をフィルタのタップ数とする長期予測フィルタが構築
される。長期予測フィルタの伝達関数は、以下に示す数
2として表現できる。なお、z-Tはフィルタの遅延要
素、Tはピッチ周期、βはピッチ予測係数をそれぞれ示
している。
【0028】
【数2】
【0029】ピッチ予測の長期予測フィルタは、ITU
−T標準G.729のCS−ACELP符号化方式にて
適応コードブック(adaptive codebook )と呼ばれてい
る。音声符号化器制御手段104は、音声検出器13か
らの有音/無音情報が無音を示す区間では、数1で示さ
れる短期予測フィルタ102のフィルタリングの処理を
停止し、遅延要素を保持するように制御する。また、こ
の無音区間では、数2で示される長期予測フィルタ10
3の遅延要素と、ピッチ予測係数を0(ゼロ)にクリア
しておくよう制御する。
【0030】このような音声符号化器制御手段104に
よる制御によって、無音から有音に変化した場合の、そ
れぞれのフィルタ初期値は、短期予測フィルタ102に
ついては前回の有音区間の最終部分の遅延要素の状態と
なり、長期予測フィルタについては予測ゲインが0(ゼ
ロ)で、遅延要素もクリアされた状態となり、それぞれ
の状態から符号化処理が開始される。
【0031】一方、ATM伝送路308に接続された音
声復号化装置307(音声復号化部2)では、セル分解
器21によりセルの受信/非受信を常時、監視してお
り、その監視結果としてセル受信/非受信を示す受信状
態情報を音声復号化器制御手段202とセレクタ23と
に出力する。ここでセレクタ23は、セル分解器21か
らの受信状態情報が、セル受信状態にあることを示す場
合、音声復号化器20の出力を交換機303に対して選
択出力し、セル非受信にあるときは雑音発生器22の出
力を選択出力する。
【0032】音声復号化器20では、線形予測係数復号
化部204にて、セル分解器21の出力する多重符号化
データから第1の符号化データとして線形予測係数を抽
出する。得られた線形予測係数は、短期合成フィルタ2
00のフィルタ係数として使用される。したがって、短
期合成フィルタ200の伝達関数は、前述の数1の逆関
数に等しくなる。
【0033】また音声復号化器20では、ピッチ復号器
203にて、セル分解器21の出力する符号化データか
ら第2の符号化データとしてピッチ予測係数とピッチ周
期とを抽出する。得られたピッチ情報は長期合成フィル
タ201に入力され、符号化側と同様の合成フィルタを
構築する。したがって、長期合成フィルタの伝達関数
は、前述した数2の逆関数に等しくなる。
【0034】音声復号化器制御手段202は、セル受信
/非受信の受信状態情報がセル非受信を示す区間では、
符号化側における無音区間と同様に短期合成フィルタ2
00のフィルタリング処理を停止して遅延要素を保持す
るよう制御し、また、同時に長期合成フィルタ201の
遅延要素とピッチ係数とを0(ゼロ)にクリアしておく
ように制御する。このような音声復号化器制御手段20
2の制御によって、セル非受信からセル受信に変化した
時点のそれぞれのフィルタ初期状態は、符号化側におけ
る短期予測フィルタ102および長期予測フィルタ10
3と一致する。
【0035】次に、図3を参照して、本発明の第2の実
施の形態について説明する。図3は、本発明の第2の実
施の形態による音声符号化復号化システムのブロック図
であり、図1に示した第1の実施の形態の変形例とし
て、その短期予測フィルタ102の遅延要素を、無音か
ら有音に変化するタイミングに合わせてATM伝送路に
送出するようにしたものである。図5に遅延要素送出タ
イミングを示す。この第2の実施の形態では、短期予測
フィルタ102の遅延要素を伝送するため、第1の実施
の形態(図1参照)にて説明した短期予測フィルタの停
止、遅延要素保持の制御が必須ではなくなる。
【0036】また、復号化側では、セル受信開始の最初
のデータに短期合成フィルタの初期状態が格納されてい
ることから、受信したこの符号化データにて短期合成フ
ィルタを初期化することにより、符号化側と復号化側の
有音開始時における初期状態を一致させることができ
る。なお、第1の実施の形態と同様に、第2の実施の形
態でも、符号化側の音声符号化器制御手段104によ
り、無音区間における長期予測フィルタ103の遅延要
素およびピッチ予測係数が0(ゼロ)にクリアされ、ま
た復号化側の音声復号化器制御手段202により、長期
合成フィルタ201の遅延要素とピッチ係数とが0(ゼ
ロ)にクリアされる。
【0037】次に、図4を参照して、本発明の第3の実
施の形態について説明する。図4は、本発明の第3の実
施の形態による音声符号化復号化システムのブロック図
であり、第1の実施の形態(図1参照)の変形例とし
て、その短期予測フィルタと長期予測フィルタの位置を
前後させたものである。したがって、音声符号化部1で
は、入力音声が短期予測フィルタ102にてフィルタリ
ング処理された後、長期予測フィルタ103にてフィル
タリング処理されて第3の符号化データすなわちディジ
タル音声信号が生成される。
【0038】また、音声復号化部2では、セル分解器2
1からの符号化データが、長期合成フィルタ201にて
フィルタリング処理された後、短期合成フィルタ200
にてフィルタリング処理されて音声信号が生成される。
図4に示す符号化復号化システムのその他の動作は、第
1の実施の形態と全く等価であり、また第1の実施の形
態と同様の作用効果が得られる。
【0039】
【発明の効果】以上説明したように、本発明は、音声符
号化部では、音声符号化器にて符号化されたディジタル
音声信号と、短期予測フィルタにてフィルタ係数として
用いた線形予測係数と、長期予測フィルタにてタップ係
数およびフィルタ係数として用いたピッチ周期およびピ
ッチ予測係数と、入力された音声信号の有音/無音を示
す有音/無音情報とを多重化器にて多重符号化データと
し、この多重符号化データに多重化されている有音/無
音情報が有音を示す場合のみ、この多重符号化データを
セル化してATM伝送路に送出するようにしたものであ
る。また、音声復号化部では、ATM伝送路から受信し
たセルをセル分解器にて分解して多重符号化データと
し、この多重符号化データから復号化された線形予測係
数をフィルタ係数とする短期合成フィルタと、多重符号
化データから復号化されたピッチ周期およびピッチ予測
係数をタップ係数およびフィルタ係数とする長期合成フ
ィルタとにより、多重符号化データから音声信号を復号
化し、セル分解器からの受信状態情報がセル受信を示す
場合には音声信号を出力し、セル非受信を示す場合には
雑音発生器からの雑音信号を出力するようにしたもので
ある。
【0040】したがって、従来のように、音声の無音区
間で符号化器、復号化器の動作を停止しておくことによ
り有音開始でそれぞれの内部状態を一致させ(従来の第
1の方法)、有音から無音に切り替わった時点での内部
状態をメモリに退避しておくことによりそれぞれの内部
状態を一致させるもの(従来の第2の方法)、および無
音区間の間は符号化器と復号化器をリセットしたり規定
値に初期化することで有音開始位置での内部状態を一致
させるもの(従来の第3の方法)と比較して、無音から
有音に変化した場合の音声符号化器と音声復号化器との
内部状態を一致させることができ、無音区間から有音区
間に変化した場合でもなめらかに内部状態が遷移し、音
声品質の劣化を回避することができる。
【0041】また、有音/無音情報が有音を示す場合に
は短期予測フィルタおよび長期予測フィルタにてフィル
タリング処理を実行し、無音を示す場合には短期予測フ
ィルタが停止してフィルタ遅延要素を保持するととも
に、長期予測フィルタのフィルタ遅延要素とピッチ予測
係数とを初期化し、さらに受信状態情報がセル受信を示
す場合には短期合成フィルタおよび長期合成フィルタに
てフィルタリング処理を実行し、セル非受信を示す場合
には短期合成フィルタを停止してフィルタ遅延要素を保
持するとともに、長期合成フィルタのフィルタ遅延要素
とピッチ予測係数とを初期化するようにしたので、無音
区間から有音区間に変化した瞬間の話頭部分の音質劣化
を抑制することができる。
【0042】また、有音/無音情報が有音を示す場合に
は短期予測フィルタおよび長期予測フィルタにてフィル
タリング処理を実行し、無音を示す場合には短期予測フ
ィルタにてフィルタリング処理を実行するとともに長期
予測フィルタのフィルタ遅延要素を初期化し、無音から
有音に変化した場合には短期予測フィルタのフィルタ遅
延要素を多重化器に出力し、さらに、受信状態情報がセ
ル受信を示す場合には短期合成フィルタおよび長期合成
フィルタにてフィルタリング処理を実行し、セル非受信
を示す場合には短期合成フィルタのフィルタ遅延要素を
初期化し、セル非受信からセル受信に変化した場合には
多重符号化データを復号化して得られた短期予測フィル
タのフィルタ遅延要素にて短期合成フィルタを初期化す
るようにしたので、無音区間から有音区間に変化した瞬
間の話頭部分の音質劣化を抑制することができるととも
に、無音区間およびセル非受信区間における短期予測フ
ィルタおよび短期合成フィルタの動作停止制御と、これ
らフィルタの遅延要素の保持が必要なくなり、制御処理
が簡略化できる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態による音声符号化
復号化システムのブロック図である。
【図2】 本発明の音声符号化復号化システムを用いた
構成例を示す図である。
【図3】 本発明の第2の実施の形態による音声符号化
復号化システムのブロック図である。
【図4】 本発明の第3の実施の形態による音声符号化
復号化システムのブロック図である。
【図5】 遅延要素送出タイミングを示す説明図であ
る。
【符号の説明】
1…音声符号化部、10…音声符号化器、11…セル組
立器、12…多重化器、13…音声検出器、100…線
形予測係数抽出部、101…ピッチ予測係数抽出部、1
02…短期予測フィルタ、103…長期予測フィルタ、
104…音声符号化器制御手段、2…音声復号化部、2
0…音声復号化器、21…セル分解器、22…雑音発生
器、23…セレクタ、200…短期合成フィルタ、20
1…長期合成フィルタ、202…音声復号化器制御手
段、203…ピッチ復号化部、204…線形予測係数復
号化部、300,301…電話機、302,303…交
換機、304,306…音声符号化装置、305,30
7…音声復号化装置、308…ATM伝送路。
フロントページの続き (56)参考文献 特開 平10−207496(JP,A) 特開 平8−146999(JP,A) 特開 平3−64235(JP,A) 特開 平2−272850(JP,A) 特開 平3−210845(JP,A) 特開 平5−292121(JP,A) 特開 平4−167635(JP,A) 特開 平2−244935(JP,A) 特開 平8−227300(JP,A) 特開 平1−303940(JP,A) NTT R&D Vol.45 No. 4 p317−348 (58)調査した分野(Int.Cl.6,DB名) H04L 12/28 H04L 12/56

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 固定長のセルを用いて非同期転送モード
    でディジタルデータの送受信が行われるATM伝送路
    と、音声信号の自局内交換を行う交換機との間に設けら
    れ、音声信号を符号化データに高能率符号化した後、セ
    ル化してATM伝送路に送出する音声符号化部と、この
    ATM伝送路から受信したセルを分解して得られた符号
    化データを音声信号に復号化する音声復号化部とを有す
    る音声符号化復号化システムにおいて、 音声符号化部は、 入力された音声信号から抽出した線形予測係数をフィル
    タ係数とする短期予測フィルタ、およびこの音声信号か
    ら抽出した音声の基本周波数であるピッチ周期をタップ
    係数としこの音声信号から抽出したピッチ予測係数をフ
    ィルタ係数とする長期予測フィルタを有し、これら短期
    予測フィルタおよび長期予測フィルタを用いて前記音声
    信号を符号化しディジタル音声信号として出力する音声
    符号化器と、 前記音声信号の有音/無音を検出しその検出結果として
    有音/無音情報を出力する音声検出器と、 この有音/無音情報に基づいて音声符号化器の短期予測
    フィルタおよび長期予測フィルタの動作を制御する音声
    符号化器制御手段と、 前記ディジタル音声信号、前記線形予測係数、前記ピッ
    チ周期およびピッチ予測係数と、前記有音/無音情報と
    を多重化して多重符号化データとして出力する多重化器
    と、 前記多重符号化データに多重化されている前記有音/無
    音情報が有音を示す場合のみ、前記多重符号化データを
    セル化してATM伝送路に送出するセル組立器とを備
    え、 音声復号化部は、 ATM伝送路から受信したセルを分解して多重符号化デ
    ータを出力するとともに、セルの受信状態としてセル受
    信/セル非受信を示す受信状態情報を出力するセル分解
    器と、 セル分解器からの多重符号化データから復号化した線形
    予測係数をフィルタ係数とする短期合成フィルタ、およ
    びこの多重符号化データから復号化したピッチ周期をタ
    ップ係数としこの多重符号化データから復号化したピッ
    チ予測係数をフィルタ係数とする長期合成フィルタを有
    し、これら短期合成フィルタおよび長期合成フィルタを
    用いて前記多重符号化データを音声信号に復号化する音
    声復号化器と、 前記受信状態情報に基づいて音声復号化器の短期合成フ
    ィルタおよび長期合成フィルタの動作を制御する音声復
    号化器制御手段と、 無音区間の音声信号として所定の雑音信号を出力する雑
    音発生器と、 前記受信状態情報がセル受信を示す場合には音声復号化
    器からの音声信号を選択出力し、前記受信状態情報がセ
    ル非受信を示す場合には雑音発生器からの雑音信号を選
    択出力する選択器とを備えることを特徴とする音声符号
    化復号化システム。
  2. 【請求項2】 請求項1記載の音声符号化復号化システ
    ムにおいて、 音声符号化器制御手段は、 前記有音/無音情報が有音を示す場合には短期予測フィ
    ルタおよび長期予測フィルタにてフィルタリング処理を
    実行させ、無音を示す場合には短期予測フィルタを停止
    させてフィルタ遅延要素を保持するとともに、長期予測
    フィルタのフィルタ遅延要素とピッチ予測係数を初期化
    し、 音声復号化器制御手段は、 前記受信状態情報がセル受信を示す場合には短期合成フ
    ィルタおよび長期合成フィルタにてフィルタリング処理
    を実行させ、セル非受信を示す場合には短期合成フィル
    タを停止させてフィルタ遅延要素を保持するとともに、
    長期合成フィルタのフィルタ遅延要素とピッチ予測係数
    を初期化することを特徴とする音声符号化復号化システ
    ム。
  3. 【請求項3】 請求項1記載の音声符号化復号化システ
    ムにおいて、 音声符号化器制御手段は、 前記有音/無音情報が有音を示す場合には短期予測フィ
    ルタおよび長期予測フィルタにてフィルタリング処理を
    実行させ、無音を示す場合には短期予測フィルタにてフ
    ィルタリング処理を実行させるとともに長期予測フィル
    タのフィルタ遅延要素を初期化し、無音から有音に変化
    した場合には短期予測フィルタのフィルタ遅延要素を多
    重化器に出力させ、 音声復号化器制御手段は、 前記受信状態情報がセル受信を示す場合には短期合成フ
    ィルタおよび長期合成フィルタにてフィルタリング処理
    を実行させ、セル非受信を示す場合には短期合成フィル
    タのフィルタ遅延要素を初期化し、セル非受信からセル
    受信に変化した場合には多重符号化データを復号化して
    得られた短期予測フィルタのフィルタ遅延要素にて短期
    合成フィルタを初期化するすることを特徴とする音声符
    号化復号化システム。
JP860697A 1997-01-21 1997-01-21 音声符号化復号化システム Expired - Lifetime JP2856185B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP860697A JP2856185B2 (ja) 1997-01-21 1997-01-21 音声符号化復号化システム
US09/009,163 US5974374A (en) 1997-01-21 1998-01-20 Voice coding/decoding system including short and long term predictive filters for outputting a predetermined signal as a voice signal in a silence period

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP860697A JP2856185B2 (ja) 1997-01-21 1997-01-21 音声符号化復号化システム

Publications (2)

Publication Number Publication Date
JPH10210043A JPH10210043A (ja) 1998-08-07
JP2856185B2 true JP2856185B2 (ja) 1999-02-10

Family

ID=11697629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP860697A Expired - Lifetime JP2856185B2 (ja) 1997-01-21 1997-01-21 音声符号化復号化システム

Country Status (2)

Country Link
US (1) US5974374A (ja)
JP (1) JP2856185B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1049199A (ja) * 1996-08-02 1998-02-20 Nec Corp 無音圧縮音声符号化復号化装置
JPH10290200A (ja) * 1997-04-11 1998-10-27 Fujitsu Ltd 音声符号化/復号化回路及びこれを用いた移動体通信装置
US6122271A (en) * 1997-07-07 2000-09-19 Motorola, Inc. Digital communication system with integral messaging and method therefor
JP3039779B2 (ja) * 1998-06-19 2000-05-08 日本電気株式会社 音声中継装置及びその中継方法
US6502071B1 (en) * 1999-07-15 2002-12-31 Nec Corporation Comfort noise generation in a radio receiver, using stored, previously-decoded noise after deactivating decoder during no-speech periods
WO2001086820A1 (en) * 2000-05-09 2001-11-15 Sony Corporation Data processing device and data processing method, and recorded medium
SE522261C2 (sv) * 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
US6865162B1 (en) 2000-12-06 2005-03-08 Cisco Technology, Inc. Elimination of clipping associated with VAD-directed silence suppression
US7917356B2 (en) * 2004-09-16 2011-03-29 At&T Corporation Operating method for voice activity detection/silence suppression system
CN101548319B (zh) * 2006-12-13 2012-06-20 松下电器产业株式会社 后置滤波器以及滤波方法
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
WO2010003663A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
GB0920729D0 (en) 2009-11-26 2010-01-13 Icera Inc Signal fading
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57147697A (en) * 1981-03-09 1982-09-11 Oki Electric Ind Co Ltd Voice backet decoding system
US4550425A (en) * 1982-09-20 1985-10-29 Sperry Corporation Speech sampling and companding device
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
US4581746A (en) * 1983-12-27 1986-04-08 At&T Bell Laboratories Technique for insertion of digital data bursts into an adaptively encoded information bit stream
JPH0244935A (ja) * 1988-08-05 1990-02-14 Clarion Co Ltd スペクトラム拡散受信装置
JPH02272850A (ja) * 1989-04-13 1990-11-07 Mitsubishi Electric Corp 音声パケット変換装置
JPH0364235A (ja) * 1989-08-02 1991-03-19 Nec Corp 音声パケット組立分解システム
JPH03210845A (ja) * 1990-01-16 1991-09-13 Hitachi Ltd 音声伝送方式
JPH04167635A (ja) * 1990-10-26 1992-06-15 Nec Corp 適応予測形adpcm符復号化装置
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
JP3291004B2 (ja) * 1991-07-16 2002-06-10 株式会社日立国際電気 音声符号化回路
JP3167385B2 (ja) * 1991-10-28 2001-05-21 日本電信電話株式会社 音声信号伝送方法
JPH05292121A (ja) * 1992-04-14 1993-11-05 Matsushita Electric Ind Co Ltd 音声パケット伝送装置
US5509102A (en) * 1992-07-01 1996-04-16 Kokusai Electric Co., Ltd. Voice encoder using a voice activity detector
JPH0736497A (ja) * 1993-07-20 1995-02-07 Matsushita Electric Ind Co Ltd 音声復号装置
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
DE4342425A1 (de) * 1993-12-13 1995-06-14 Philips Patentverwaltung Verfahren und Anordnung zum Übertragen von Sprachsignalen
JP2697642B2 (ja) * 1994-11-24 1998-01-14 日本電気株式会社 Atm音声符号化装置
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NTT R&D Vol.45 No.4 p317−348

Also Published As

Publication number Publication date
US5974374A (en) 1999-10-26
JPH10210043A (ja) 1998-08-07

Similar Documents

Publication Publication Date Title
JP3157116B2 (ja) 音声符号化伝送システム
EP0920693B1 (en) Method and apparatus for improving the voice quality of tandemed vocoders
JP3996213B2 (ja) 入力標本列処理方法
JP2856185B2 (ja) 音声符号化復号化システム
KR100383051B1 (ko) 디지털정보코딩방법및장치
Andersen et al. iLBC-a linear predictive coder with robustness to packet losses
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
EP0364647B1 (en) Improvement to vector quantizing coder
US20010034601A1 (en) Voice activity detection apparatus, and voice activity/non-activity detection method
JP2697642B2 (ja) Atm音声符号化装置
US7302385B2 (en) Speech restoration system and method for concealing packet losses
EP0856185B1 (en) Repetitive sound compression system
US6104994A (en) Method for speech coding under background noise conditions
WO1997015046A9 (en) Repetitive sound compression system
US5694519A (en) Tunable post-filter for tandem coders
JP2861889B2 (ja) 音声パケット伝送システム
JPH1049199A (ja) 無音圧縮音声符号化復号化装置
JP3487158B2 (ja) 音声符号化伝送システム
RU2792658C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JPH02146100A (ja) 音声符号化・復号化装置
JPH0651799A (ja) 音声メッセージ符号化装置と復号化装置とを同期化させる方法
JP2885225B2 (ja) 音声符号化復号化装置
KR100392258B1 (ko) Celp 보코더의 처리 지연시간을 감소하기 위한 인코딩및 디코딩 블럭 구조 및 그 구조를 이용한 인코딩 및디코딩 방법
CA2235275C (en) Repetitive sound compression system