JP2856185B2

JP2856185B2 - 音声符号化復号化システム

Info

Publication number: JP2856185B2
Application number: JP860697A
Authority: JP
Inventors: 靖浩和気
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1997-01-21
Filing date: 1997-01-21
Publication date: 1999-02-10
Anticipated expiration: 2017-01-21
Also published as: JPH10210043A; US5974374A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声符号化復号化
システムに関し、特に符号化側に入力される信号を監視
することによって、入力音声の有音／無音を検出し、有
音部分の符号化データのみをセル化し伝送する無音圧縮
の音声符号化復号化システムに関するものである。

【０００２】

【従来の技術】近年、音声符号化装置で行われる音声符
号化処理として、音声分析合成法の一つであるコード駆
動ＬＰＣ符号化（ＣＥＬＰ：Code Excited Linear Pred
iction)方式や、共役構造−代数的符号励振線形予測
（ＣＳ−ＡＣＥＬＰ：conjugate-structure algebraic-
code-exited linear-prediction）方式が用いられるつ
つある。ＣＳ−ＡＣＥＬＰ方式は、ＩＴＵ−Ｔ勧告Ｇ．
７２９に示されるように励振パルスを順に、短期合成フ
ィルタと、長期合成フィルタに通し、最も入力信号に近
い復号音声の得られるパルスの位置と極性を符号化し伝
送する方式である。

【０００３】従来、このような符号化方式と音声検出器
を組み合わせ、有音区間のみ符号化データを伝送するよ
うな無音圧縮音声符号化装置では、無音から有音に変化
する部分で、音声符号化側と音声復号化側とで内部状態
の不一致が発生し、話頭部分の音声品質が劣化するとい
う問題があり、これに対応するための方法が提案されて
いる。例えば、第１の方法として、音声の無音区間で符
号化器、復号化器の動作を停止し、有音開始と同時に符
号化器、復号化器の動作を再開することにより、有音開
始部分で、それぞれの内部状態を一致させ音声品質劣化
を改善するものが考えられている（例えば、特開平０３
−０６４２３５号公報，特開平０２−２７２８５０号公
報など）。

【０００４】また、第２の方法として、符号化用フィル
タと、復号化用フィルタの遅延要素を、無音区間ではメ
モリに退避しておき、有音の開始時点でメモリからロー
ドすることにより同様の目的を達成するものが提案され
ている（例えば、特開平０３−０２１０８４５号公報な
ど）。また、第３の方法として、無音区間にて符号化
器、復号化器をそれぞれリセットし、あるいは規定値に
初期化して、有音開始位置での内部状態を一致させるこ
とにより音声の劣化を防ぐ構成のものが提案されている
（例えば、特開平０５−２９２１２１号公報、特開平０
４−１６７６３５号公報、特開平０２−２４４９３５号
公報など）。

【０００５】

【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声符号化復号化システムでは、それぞれ以
下のような問題点があった。まず、従来の第１の方法に
よれば、音声の無音区間で符号化器、復号化器の動作を
停止しておくことにより、有音開始で、それぞれの内部
状態を一致させ、また従来の第２の方法によれば、有音
から無音に切り替わった時点での内部状態をメモリに退
避しておくことにより、それぞれの内部状態を一致させ
るものとなっていることから、音声が入力されることに
よって有音状態が開始されて、本来の符号化処理、復号
化処理が開始されるが、その入力音声から得られる符号
化、復号化の内部状態と保持された内部状態との間には
何ら相関が無いため、なめらかに内部状態が遷移せず、
そのため音声品質が劣化してしまうという問題点があっ
た。

【０００６】特に、これら従来の第１または第２の方法
を、最近のＣＳ−ＡＣＥＬＰ等の高能率音声符号化方式
で採用されている短期予測フィルタと、長期予測フィル
タ（復号化側の短期合成フィルタと、長期合成フィルタ
に対応する）とを組み合わせた符号化方式に適用した場
合、短期予測フィルタの内部状態は、そのインパルス応
答が比較的短いため、従来技術でも顕著な劣化は無いと
思われる。しかし、長期予測フィルタのインパルス応答
は非常に長くなるため有音区間が始まり、保持されてい
た内部状態を初期値として、本来の符号化復号化処理に
よる内部状態に収束するまでにはかなりの時間を要し、
収束するまでの区間、音声品質の劣化が顕著になってし
まうという問題が指摘される。

【０００７】本来、長期予測フィルタは音声の母音等に
おける定常的な部分の周期性を利用した予測であり、母
音定常部では十分な効果が期待できるが、無声・無音部
分での予測効果は期待できず、予測ゲインは０（ゼロ）
に近づく特性を示す。したがって、このような特徴をも
つ長期予測フィルタに、従来の第１または第２の方法を
適用した場合には、有音開始部における長期予測フィル
タの初期値は、一つ前の有音末尾部分の母音定常部等に
対応した値を持ってしまうことが容易に理解できる。

【０００８】また従来の第３の方法によれば、無音区間
の間は、符号化器と復号化器をリセットしたり、規定値
に初期化することで、有音開始位置での内部状態を一致
させている。しかし、前述の通り、音声が入力されるこ
とによって有音状態が開始し、その入力音声から得られ
る符号化、復号化の内部状態と、前記初期値の内部状態
との間には、なんら相関が無いため、なめらかに内部状
態が遷移せず、そのため音声品質が劣化してしまうとい
う問題点があった。

【０００９】前述したように、ＣＳ−ＡＣＥＬＰ等の高
能率音声符号化方式で採用されている短期予測フィルタ
と、長期予測フィルタ（復号化側の短期合成フィルタ
と、長期合成フィルタに対応する）とを組み合わせた符
号化方式においては、有音開始時点では、短期予測フィ
ルタの予測ゲインに依存して有効な符号化が実行され
る。一方、長期予測フィルタは予測ゲイン０（ゼロ）の
状態から始まり、徐々に入力信号が定常的な音声信号に
遷移していって初めて長期予測フィルタの効果が発揮さ
れるように動作する。

【００１０】このため、従来の第３の方法を、短期予測
フィルタと長期予測フィルタとを持つ符号化方式に適用
した場合、本来、効果が期待できない有音開始部分での
長期予測フィルタには有効であるが、期待すべき短期予
測フィルタの効果が得られず、音声品質劣化が劣化して
しまうという問題点があった。したがって、従来技術で
は、ＡＤＰＣＭ（adaptive differential PCM ）や、Ａ
ＰＣ（adaptive predictive coding）等の、短期予測だ
けに頼った符号化方式と音声検出器を組み合わせた無音
圧縮音声符号化復号化システムにおいて有効に動作して
も、最近の短期予測と長期予測を組み合わせて符号化効
率を上げるような符号化方式に適用すると、かえって有
音開始部分の音声品質劣化を招くという欠点があった。
本発明はこのような課題を解決するためのものであり、
無音区間から有音区間に変化した場合でもなめらかに内
部状態が遷移し、音声品質の劣化を回避できる音声符号
化復号化システムを提供することを目的としている。

【００１１】

【課題を解決するための手段】このような目的を達成す
るために、本発明による音声符号化復号化システムは、
音声符号化部として、入力された音声信号から抽出した
線形予測係数をフィルタ係数とする短期予測フィルタ、
およびこの音声信号から抽出した音声の基本周波数であ
るピッチ周期をタップ係数としこの音声信号から抽出し
たピッチ予測係数をフィルタ係数とする長期予測フィル
タを有し、これら短期予測フィルタおよび長期予測フィ
ルタを用いて音声信号を符号化しディジタル音声信号と
して出力する音声符号化器と、音声信号の有音／無音を
検出しその検出結果として有音／無音情報を出力する音
声検出器と、この有音／無音情報に基づいて音声符号化
器の短期予測フィルタおよび長期予測フィルタの動作を
制御する音声符号化器制御手段と、ディジタル音声信
号、線形予測係数、ピッチ周期およびピッチ予測係数
と、有音／無音情報とを多重化して多重符号化データと
して出力する多重化器と、多重符号化データに多重化さ
れている有音／無音情報が有音を示す場合のみ、多重符
号化データをセル化してＡＴＭ伝送路に送出するセル組
立器とを備えるものである。

【００１２】さらに音声復号化部として、ＡＴＭ伝送路
から受信したセルを分解して多重符号化データを出力す
るとともに、セルの受信状態としてセル受信／セル非受
信を示す受信状態情報を出力するセル分解器と、セル分
解器からの多重符号化データから復号化した線形予測係
数をフィルタの係数とする短期合成フィルタ、およびこ
の多重符号化データから復号化したピッチ周期をタップ
係数としこの多重符号化データから復号化したピッチ予
測係数をフィルタ係数とする長期合成フィルタを有し、
これら短期合成フィルタおよび長期合成フィルタを用い
て多重符号化データを音声信号に復号化する音声符号化
器と、受信状態情報に基づいて音声復号化器の短期合成
フィルタおよび長期合成フィルタの動作を制御する音声
復号化器制御手段と、無音区間の音声信号として所定の
雑音信号を出力する雑音発生器と、受信状態情報がセル
受信を示す場合には音声復号化器からの音声信号を選択
出力し、受信状態情報がセル非受信を示す場合には雑音
発生器からの雑音信号を選択出力する選択器とを備える
ものである。

【００１３】したがって、音声符号化部では、音声符号
化器にて符号化されたディジタル音声信号と、短期予測
フィルタにてフィルタ係数として用いた線形予測係数
と、長期予測フィルタにてタップ係数およびフィルタ係
数として用いたピッチ周期およびピッチ予測係数と、入
力された音声信号の有音／無音を示す有音／無音情報と
が多重化器にて多重化されて多重符号化データとして出
力され、セル組立器にて、この多重符号化データに多重
化されている有音／無音情報が有音を示す場合のみ、こ
の多重符号化データがセル化されてＡＴＭ伝送路に送出
される。また、音声復号化部では、ＡＴＭ伝送路から受
信したセルがセル分解器にて分解されて多重符号化デー
タとして出力され、この多重符号化データから復号化さ
れた線形予測係数をフィルタ係数とする短期合成フィル
タと、多重符号化データから復号化されたピッチ周期お
よびピッチ予測係数をタップ係数およびフィルタ係数と
する長期合成フィルタとにより、多重符号化データから
音声信号が復号化され、セル分解器からの受信状態情報
がセル受信を示す場合には音声信号が出力され、セル非
受信を示す場合には雑音発生器からの雑音信号が選択器
から出力される。

【００１４】また、音声符号化器制御手段は、有音／無
音情報が有音を示す場合には短期予測フィルタおよび長
期予測フィルタにてフィルタリング処理を実行させ、無
音を示す場合には短期予測フィルタを停止させてフィル
タ遅延要素を保持するとともに、長期予測フィルタのフ
ィルタ遅延要素とピッチ予測係数を初期化し、音声復号
化器制御手段は、受信状態情報がセル受信を示す場合に
は短期合成フィルタおよび長期合成フィルタにてフィル
タリング処理を実行させ、セル非受信を示す場合には短
期合成フィルタを停止させてフィルタ遅延要素を保持す
るとともに、長期合成フィルタのフィルタ遅延要素とピ
ッチ予測係数を初期化するようにしたものである。

【００１５】したがって、有音／無音情報が有音を示す
場合には短期予測フィルタおよび長期予測フィルタにて
フィルタリング処理が実行され、無音を示す場合には短
期予測フィルタが停止してフィルタ遅延要素が保持され
るとともに、長期予測フィルタのフィルタ遅延要素とピ
ッチ予測係数とが初期化される。さらに、受信状態情報
がセル受信を示す場合には短期合成フィルタおよび長期
合成フィルタにてフィルタリング処理が実行され、セル
非受信を示す場合には短期合成フィルタが停止してフィ
ルタ遅延要素が保持されるとともに、長期合成フィルタ
のフィルタ遅延要素とピッチ予測係数とが初期化され
る。

【００１６】また、音声符号化器制御手段は、有音／無
音情報が有音を示す場合には短期予測フィルタおよび長
期予測フィルタにてフィルタリング処理を実行させ、無
音を示す場合には短期予測フィルタにてフィルタリング
処理を実行させるとともに長期予測フィルタのフィルタ
遅延要素を初期化し、無音から有音に変化した場合には
短期予測フィルタのフィルタ遅延要素を多重化器に出力
させ、音声復号化器制御手段は、受信状態情報がセル受
信を示す場合には短期合成フィルタおよび長期合成フィ
ルタにてフィルタリング処理を実行させ、セル非受信を
示す場合には短期合成フィルタのフィルタ遅延要素を初
期化し、セル非受信からセル受信に変化した場合には多
重符号化データを復号化して得られた短期予測フィルタ
のフィルタ遅延要素にて短期合成フィルタを初期化する
ようにしたものである。

【００１７】したがって、有音／無音情報が有音を示す
場合には短期予測フィルタおよび長期予測フィルタにて
フィルタリング処理が実行され、無音を示す場合には短
期予測フィルタにてフィルタリング処理が実行されると
ともに長期予測フィルタのフィルタ遅延要素が初期化さ
れ、無音から有音に変化した場合には短期予測フィルタ
のフィルタ遅延要素が多重化器に出力される。さらに、
受信状態情報がセル受信を示す場合には短期合成フィル
タおよび長期合成フィルタにてフィルタリング処理が実
行され、セル非受信を示す場合には短期合成フィルタの
フィルタ遅延要素が初期化され、セル非受信からセル受
信に変化した場合には多重符号化データが復号化されて
得られた短期予測フィルタのフィルタ遅延要素にて短期
合成フィルタが初期化される。

【００１８】

【発明の実施の形態】次に、本発明について図面を参照
して説明する。図１は本発明の一実施の形態である音声
符号化復号化システムのブロック図であり、同図におい
て、音声符号化部１は、入力音声を各種符号化データに
変換する音声符号化器１０と、入力音声（電話帯域音声
信号）の有音／無音を検出して有音／無音情報を出力す
る音声検出器１３と、音声検出器１３からの有音／無音
情報に基づき音声符号化器１０を制御する音声検出器制
御手段１０４と、音声符号化器１０からの各種符号化デ
ータと音声検出器１３からの有音／無音情報とを多重符
号化データとして多重化し出力する多重化器（ＭＵＸ）
１２と、有音／無音情報に基づき有音区間にのみ多重符
号化データを固定長のＡＴＭセル（以下、セルという）
にセル化（アセンブリ）し、ＡＴＭ伝送路に出力するセ
ル組立器１１とを備えている。

【００１９】また音声符号化器１０は、入力音声から線
形予測係数を抽出し第１の符号化データとして送出する
線形予測係数抽出部１００と、入力音声から音声の基本
周波数を示すピッチ周期とピッチ予測係数とを抽出し第
２の符号化データとして出力するピッチ抽出部１０１
と、ピッチ抽出部１０１の出力であるピッチ周期をフィ
ルタのタップ数としピッチ予測係数をフィルタ係数とし
入力音声をフィルタリング処理して出力する長期予測フ
ィルタ１０３と、線形予測係数抽出部１００の出力であ
る線形予測係数をフィルタ係数とし長期予測フィルタ１
０３からの出力をフィルタリング処理し第３の符号化デ
ータすなわちディジタル音声信号として出力する短期予
測フィルタ１０２とを備えている。

【００２０】一方、音声復号化部２は、ＡＴＭ伝送路の
データ受信状態を監視することによりセル受信／非受信
の受信状態情報と受信したセルとを分解（ディスアセン
ブリ）し、多重符号化データを抽出するセル分解器２１
と、受信した多重符号化データを元の音声信号に復号化
する音声復号化器２０と、無音区間を示す所定の雑音信
号を出力する雑音発生器２２と、セル受信／非受信の受
信状態情報に基づき音声復号化器２０を制御する音声復
号化器制御手段２０２と、セル受信／非受信の受信状態
情報に基づき雑音発生器２２の出力か音声復号化器２０
の出力かのどちらか一方を選択出力するセレクタ２３と
を備えている。

【００２１】また音声復号化器２０は、セル分解器２１
から出力された多重符号化データから第１の符号化デー
タである線形予測計数を復号化して出力する線形予測計
数復号化部２０４と、セル分解器２１から出力された多
重符号化データから第２の符号化データであるピッチ周
期とピッチ予測係数とを復号化して出力するピッチ復号
化部と、線形予測計数復号化部２０４からの線形予測計
数をフィルタ係数としてセル分解器２１から出力された
多重符号化データをフィルタリング処理する短期合成フ
ィルタ２００と、ピッチ復号化部２０３からのピッチ周
期とピッチ予測係数とに基づき短期合成フィルタ２００
からの出力をフィルタリング処理し音声信号として出力
する長期合成フィルタ２０１を備えている。

【００２２】次に、図１および図２を参照して、本発明
の動作を説明する。図２は本発明の符号化復号化システ
ムを用いた構成例を示す図である。図２において、電話
機３００からの音声信号は、Ａ局交換機３０２を経由し
て、図１の音声符号化部１と同等の構成を有する音声符
号化装置３０４に入力される。この音声信号は、音声符
号化装置３０４において音声検出器１３および、音声符
号化器１０により有音部分だけが多重符号化データに変
換された後、ＡＴＭセル化され、有音セルとして、非同
期転送モード（ＡＴＭ）でディジタルデータの送受信が
行われるＡＴＭ伝送路３０８に送出される。

【００２３】ＡＴＭ伝送路３０８を経由した有音セル
は、図１の音声復号化部２と同等の構成を有する音声復
号化装置３０７に入力され、音声復号化器２０により多
重符号化データから音声信号に復号化された後、Ｂ局交
換機３０３を経由して電話機３０１に伝送される。音声
復号化装置３０７では、セルを受信する有音区間だけは
音声復号化器２０の出力を交換機３０３に対して選択出
力し、セル非受信の区間は、音声復号化装置３０７内部
の雑音発生器２２の出力を交換機３０３に対して選択出
力することで、無音圧縮による通話音声の断続感を軽減
している。

【００２４】以下、図１を参照して、音声符号化装置３
０４および音声復号化装置３０７内部の動作について説
明する。音声符号化装置３０４（音声符号化部１）に入
力された音声信号は、図１に示すように、音声符号化器
１０と音声検出器１３とに同時に入力される。ここで、
音声符号化器１０への入力には、音声検出器１３での音
声入力から音声検出結果出力までの遅延時問を吸収する
ために、音声符号化器１０への入力に対してのみ遅延バ
ッファを介する場合もある。音声検出器１３では入力信
号を常時監視することにより、有音／無音の判定を実行
し、判定結果を有音／無音情報として音声符号化器制御
手段１０４と多重化器１２とに出力する。

【００２５】音声符号化器１０では、線形予測係数抽出
部１００により入力音声のＬＰＣ分析が実行されて線形
予測係数を抽出し、第１の符号化データとして多重化器
１２に出力するとともに、線形予測係数をフィルタ係数
とする短期予測フィルタ１０２に入力される。短期予測
フィルタ１０２の伝達関数Ｈは、以下に示す数１として
表現できる。ここで、ｚ^-iはフィルタの遅延要素、ａ_i
は線形予測係数、Ｐは線形予測の次数をそれぞれ示して
おり、例えばＩＴＵ−Ｔ標準Ｇ．７２９のＣＳ−ＡＣＥ
ＬＰ符号化方式ではＰ＝１０としている。

【００２６】

【数１】

【００２７】また、入力音声からピッチ抽出部１０１に
よりピッチ分析が実行され、入力音声のピッチ周期とピ
ッチ予測係数とが求められる。このピッチ抽出部１０１
の出力は、第２の符号化データとして多重化器１２に出
力するとともに、長期予測フィルタ１０３に入力され、
ピッチ予測係数をフィルタ係数とするとともにピッチ周
期をフィルタのタップ数とする長期予測フィルタが構築
される。長期予測フィルタの伝達関数は、以下に示す数
２として表現できる。なお、ｚ^-Tはフィルタの遅延要
素、Ｔはピッチ周期、βはピッチ予測係数をそれぞれ示
している。

【００２８】

【数２】

【００２９】ピッチ予測の長期予測フィルタは、ＩＴＵ
−Ｔ標準Ｇ．７２９のＣＳ−ＡＣＥＬＰ符号化方式にて
適応コードブック（adaptive codebook ）と呼ばれてい
る。音声符号化器制御手段１０４は、音声検出器１３か
らの有音／無音情報が無音を示す区間では、数１で示さ
れる短期予測フィルタ１０２のフィルタリングの処理を
停止し、遅延要素を保持するように制御する。また、こ
の無音区間では、数２で示される長期予測フィルタ１０
３の遅延要素と、ピッチ予測係数を０（ゼロ）にクリア
しておくよう制御する。

【００３０】このような音声符号化器制御手段１０４に
よる制御によって、無音から有音に変化した場合の、そ
れぞれのフィルタ初期値は、短期予測フィルタ１０２に
ついては前回の有音区間の最終部分の遅延要素の状態と
なり、長期予測フィルタについては予測ゲインが０（ゼ
ロ）で、遅延要素もクリアされた状態となり、それぞれ
の状態から符号化処理が開始される。

【００３１】一方、ＡＴＭ伝送路３０８に接続された音
声復号化装置３０７（音声復号化部２）では、セル分解
器２１によりセルの受信／非受信を常時、監視してお
り、その監視結果としてセル受信／非受信を示す受信状
態情報を音声復号化器制御手段２０２とセレクタ２３と
に出力する。ここでセレクタ２３は、セル分解器２１か
らの受信状態情報が、セル受信状態にあることを示す場
合、音声復号化器２０の出力を交換機３０３に対して選
択出力し、セル非受信にあるときは雑音発生器２２の出
力を選択出力する。

【００３２】音声復号化器２０では、線形予測係数復号
化部２０４にて、セル分解器２１の出力する多重符号化
データから第１の符号化データとして線形予測係数を抽
出する。得られた線形予測係数は、短期合成フィルタ２
００のフィルタ係数として使用される。したがって、短
期合成フィルタ２００の伝達関数は、前述の数１の逆関
数に等しくなる。

【００３３】また音声復号化器２０では、ピッチ復号器
２０３にて、セル分解器２１の出力する符号化データか
ら第２の符号化データとしてピッチ予測係数とピッチ周
期とを抽出する。得られたピッチ情報は長期合成フィル
タ２０１に入力され、符号化側と同様の合成フィルタを
構築する。したがって、長期合成フィルタの伝達関数
は、前述した数２の逆関数に等しくなる。

【００３４】音声復号化器制御手段２０２は、セル受信
／非受信の受信状態情報がセル非受信を示す区間では、
符号化側における無音区間と同様に短期合成フィルタ２
００のフィルタリング処理を停止して遅延要素を保持す
るよう制御し、また、同時に長期合成フィルタ２０１の
遅延要素とピッチ係数とを０（ゼロ）にクリアしておく
ように制御する。このような音声復号化器制御手段２０
２の制御によって、セル非受信からセル受信に変化した
時点のそれぞれのフィルタ初期状態は、符号化側におけ
る短期予測フィルタ１０２および長期予測フィルタ１０
３と一致する。

【００３５】次に、図３を参照して、本発明の第２の実
施の形態について説明する。図３は、本発明の第２の実
施の形態による音声符号化復号化システムのブロック図
であり、図１に示した第１の実施の形態の変形例とし
て、その短期予測フィルタ１０２の遅延要素を、無音か
ら有音に変化するタイミングに合わせてＡＴＭ伝送路に
送出するようにしたものである。図５に遅延要素送出タ
イミングを示す。この第２の実施の形態では、短期予測
フィルタ１０２の遅延要素を伝送するため、第１の実施
の形態（図１参照）にて説明した短期予測フィルタの停
止、遅延要素保持の制御が必須ではなくなる。

【００３６】また、復号化側では、セル受信開始の最初
のデータに短期合成フィルタの初期状態が格納されてい
ることから、受信したこの符号化データにて短期合成フ
ィルタを初期化することにより、符号化側と復号化側の
有音開始時における初期状態を一致させることができ
る。なお、第１の実施の形態と同様に、第２の実施の形
態でも、符号化側の音声符号化器制御手段１０４によ
り、無音区間における長期予測フィルタ１０３の遅延要
素およびピッチ予測係数が０（ゼロ）にクリアされ、ま
た復号化側の音声復号化器制御手段２０２により、長期
合成フィルタ２０１の遅延要素とピッチ係数とが０（ゼ
ロ）にクリアされる。

【００３７】次に、図４を参照して、本発明の第３の実
施の形態について説明する。図４は、本発明の第３の実
施の形態による音声符号化復号化システムのブロック図
であり、第１の実施の形態（図１参照）の変形例とし
て、その短期予測フィルタと長期予測フィルタの位置を
前後させたものである。したがって、音声符号化部１で
は、入力音声が短期予測フィルタ１０２にてフィルタリ
ング処理された後、長期予測フィルタ１０３にてフィル
タリング処理されて第３の符号化データすなわちディジ
タル音声信号が生成される。

【００３８】また、音声復号化部２では、セル分解器２
１からの符号化データが、長期合成フィルタ２０１にて
フィルタリング処理された後、短期合成フィルタ２００
にてフィルタリング処理されて音声信号が生成される。
図４に示す符号化復号化システムのその他の動作は、第
１の実施の形態と全く等価であり、また第１の実施の形
態と同様の作用効果が得られる。

【００３９】

【発明の効果】以上説明したように、本発明は、音声符
号化部では、音声符号化器にて符号化されたディジタル
音声信号と、短期予測フィルタにてフィルタ係数として
用いた線形予測係数と、長期予測フィルタにてタップ係
数およびフィルタ係数として用いたピッチ周期およびピ
ッチ予測係数と、入力された音声信号の有音／無音を示
す有音／無音情報とを多重化器にて多重符号化データと
し、この多重符号化データに多重化されている有音／無
音情報が有音を示す場合のみ、この多重符号化データを
セル化してＡＴＭ伝送路に送出するようにしたものであ
る。また、音声復号化部では、ＡＴＭ伝送路から受信し
たセルをセル分解器にて分解して多重符号化データと
し、この多重符号化データから復号化された線形予測係
数をフィルタ係数とする短期合成フィルタと、多重符号
化データから復号化されたピッチ周期およびピッチ予測
係数をタップ係数およびフィルタ係数とする長期合成フ
ィルタとにより、多重符号化データから音声信号を復号
化し、セル分解器からの受信状態情報がセル受信を示す
場合には音声信号を出力し、セル非受信を示す場合には
雑音発生器からの雑音信号を出力するようにしたもので
ある。

【００４０】したがって、従来のように、音声の無音区
間で符号化器、復号化器の動作を停止しておくことによ
り有音開始でそれぞれの内部状態を一致させ（従来の第
１の方法）、有音から無音に切り替わった時点での内部
状態をメモリに退避しておくことによりそれぞれの内部
状態を一致させるもの（従来の第２の方法）、および無
音区間の間は符号化器と復号化器をリセットしたり規定
値に初期化することで有音開始位置での内部状態を一致
させるもの（従来の第３の方法）と比較して、無音から
有音に変化した場合の音声符号化器と音声復号化器との
内部状態を一致させることができ、無音区間から有音区
間に変化した場合でもなめらかに内部状態が遷移し、音
声品質の劣化を回避することができる。

【００４１】また、有音／無音情報が有音を示す場合に
は短期予測フィルタおよび長期予測フィルタにてフィル
タリング処理を実行し、無音を示す場合には短期予測フ
ィルタが停止してフィルタ遅延要素を保持するととも
に、長期予測フィルタのフィルタ遅延要素とピッチ予測
係数とを初期化し、さらに受信状態情報がセル受信を示
す場合には短期合成フィルタおよび長期合成フィルタに
てフィルタリング処理を実行し、セル非受信を示す場合
には短期合成フィルタを停止してフィルタ遅延要素を保
持するとともに、長期合成フィルタのフィルタ遅延要素
とピッチ予測係数とを初期化するようにしたので、無音
区間から有音区間に変化した瞬間の話頭部分の音質劣化
を抑制することができる。

【００４２】また、有音／無音情報が有音を示す場合に
は短期予測フィルタおよび長期予測フィルタにてフィル
タリング処理を実行し、無音を示す場合には短期予測フ
ィルタにてフィルタリング処理を実行するとともに長期
予測フィルタのフィルタ遅延要素を初期化し、無音から
有音に変化した場合には短期予測フィルタのフィルタ遅
延要素を多重化器に出力し、さらに、受信状態情報がセ
ル受信を示す場合には短期合成フィルタおよび長期合成
フィルタにてフィルタリング処理を実行し、セル非受信
を示す場合には短期合成フィルタのフィルタ遅延要素を
初期化し、セル非受信からセル受信に変化した場合には
多重符号化データを復号化して得られた短期予測フィル
タのフィルタ遅延要素にて短期合成フィルタを初期化す
るようにしたので、無音区間から有音区間に変化した瞬
間の話頭部分の音質劣化を抑制することができるととも
に、無音区間およびセル非受信区間における短期予測フ
ィルタおよび短期合成フィルタの動作停止制御と、これ
らフィルタの遅延要素の保持が必要なくなり、制御処理
が簡略化できる。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態による音声符号化
復号化システムのブロック図である。

【図２】本発明の音声符号化復号化システムを用いた
構成例を示す図である。

【図３】本発明の第２の実施の形態による音声符号化
復号化システムのブロック図である。

【図４】本発明の第３の実施の形態による音声符号化
復号化システムのブロック図である。

【図５】遅延要素送出タイミングを示す説明図であ
る。

【符号の説明】

１…音声符号化部、１０…音声符号化器、１１…セル組
立器、１２…多重化器、１３…音声検出器、１００…線
形予測係数抽出部、１０１…ピッチ予測係数抽出部、１
０２…短期予測フィルタ、１０３…長期予測フィルタ、
１０４…音声符号化器制御手段、２…音声復号化部、２
０…音声復号化器、２１…セル分解器、２２…雑音発生
器、２３…セレクタ、２００…短期合成フィルタ、２０
１…長期合成フィルタ、２０２…音声復号化器制御手
段、２０３…ピッチ復号化部、２０４…線形予測係数復
号化部、３００，３０１…電話機、３０２，３０３…交
換機、３０４，３０６…音声符号化装置、３０５，３０
７…音声復号化装置、３０８…ＡＴＭ伝送路。

フロントページの続き (56)参考文献特開平10−207496（ＪＰ，Ａ) 特開平８−146999（ＪＰ，Ａ) 特開平３−64235（ＪＰ，Ａ) 特開平２−272850（ＪＰ，Ａ) 特開平３−210845（ＪＰ，Ａ) 特開平５−292121（ＪＰ，Ａ) 特開平４−167635（ＪＰ，Ａ) 特開平２−244935（ＪＰ，Ａ) 特開平８−227300（ＪＰ，Ａ) 特開平１−303940（ＪＰ，Ａ) ＮＴＴＲ＆ＤＶｏｌ．45 Ｎｏ. ４ｐ317−348 (58)調査した分野(Int.Cl.⁶，ＤＢ名) H04L 12/28 H04L 12/56

Claims

(57)【特許請求の範囲】

【請求項１】固定長のセルを用いて非同期転送モード
でディジタルデータの送受信が行われるＡＴＭ伝送路
と、音声信号の自局内交換を行う交換機との間に設けら
れ、音声信号を符号化データに高能率符号化した後、セ
ル化してＡＴＭ伝送路に送出する音声符号化部と、この
ＡＴＭ伝送路から受信したセルを分解して得られた符号
化データを音声信号に復号化する音声復号化部とを有す
る音声符号化復号化システムにおいて、音声符号化部は、入力された音声信号から抽出した線形予測係数をフィル
タ係数とする短期予測フィルタ、およびこの音声信号か
ら抽出した音声の基本周波数であるピッチ周期をタップ
係数としこの音声信号から抽出したピッチ予測係数をフ
ィルタ係数とする長期予測フィルタを有し、これら短期
予測フィルタおよび長期予測フィルタを用いて前記音声
信号を符号化しディジタル音声信号として出力する音声
符号化器と、前記音声信号の有音／無音を検出しその検出結果として
有音／無音情報を出力する音声検出器と、この有音／無音情報に基づいて音声符号化器の短期予測
フィルタおよび長期予測フィルタの動作を制御する音声
符号化器制御手段と、前記ディジタル音声信号、前記線形予測係数、前記ピッ
チ周期およびピッチ予測係数と、前記有音／無音情報と
を多重化して多重符号化データとして出力する多重化器
と、前記多重符号化データに多重化されている前記有音／無
音情報が有音を示す場合のみ、前記多重符号化データを
セル化してＡＴＭ伝送路に送出するセル組立器とを備
え、音声復号化部は、ＡＴＭ伝送路から受信したセルを分解して多重符号化デ
ータを出力するとともに、セルの受信状態としてセル受
信／セル非受信を示す受信状態情報を出力するセル分解
器と、セル分解器からの多重符号化データから復号化した線形
予測係数をフィルタ係数とする短期合成フィルタ、およ
びこの多重符号化データから復号化したピッチ周期をタ
ップ係数としこの多重符号化データから復号化したピッ
チ予測係数をフィルタ係数とする長期合成フィルタを有
し、これら短期合成フィルタおよび長期合成フィルタを
用いて前記多重符号化データを音声信号に復号化する音
声復号化器と、前記受信状態情報に基づいて音声復号化器の短期合成フ
ィルタおよび長期合成フィルタの動作を制御する音声復
号化器制御手段と、無音区間の音声信号として所定の雑音信号を出力する雑
音発生器と、前記受信状態情報がセル受信を示す場合には音声復号化
器からの音声信号を選択出力し、前記受信状態情報がセ
ル非受信を示す場合には雑音発生器からの雑音信号を選
択出力する選択器とを備えることを特徴とする音声符号
化復号化システム。
【請求項２】請求項１記載の音声符号化復号化システ
ムにおいて、音声符号化器制御手段は、前記有音／無音情報が有音を示す場合には短期予測フィ
ルタおよび長期予測フィルタにてフィルタリング処理を
実行させ、無音を示す場合には短期予測フィルタを停止
させてフィルタ遅延要素を保持するとともに、長期予測
フィルタのフィルタ遅延要素とピッチ予測係数を初期化
し、音声復号化器制御手段は、前記受信状態情報がセル受信を示す場合には短期合成フ
ィルタおよび長期合成フィルタにてフィルタリング処理
を実行させ、セル非受信を示す場合には短期合成フィル
タを停止させてフィルタ遅延要素を保持するとともに、
長期合成フィルタのフィルタ遅延要素とピッチ予測係数
を初期化することを特徴とする音声符号化復号化システ
ム。
【請求項３】請求項１記載の音声符号化復号化システ
ムにおいて、音声符号化器制御手段は、前記有音／無音情報が有音を示す場合には短期予測フィ
ルタおよび長期予測フィルタにてフィルタリング処理を
実行させ、無音を示す場合には短期予測フィルタにてフ
ィルタリング処理を実行させるとともに長期予測フィル
タのフィルタ遅延要素を初期化し、無音から有音に変化
した場合には短期予測フィルタのフィルタ遅延要素を多
重化器に出力させ、音声復号化器制御手段は、前記受信状態情報がセル受信を示す場合には短期合成フ
ィルタおよび長期合成フィルタにてフィルタリング処理
を実行させ、セル非受信を示す場合には短期合成フィル
タのフィルタ遅延要素を初期化し、セル非受信からセル
受信に変化した場合には多重符号化データを復号化して
得られた短期予測フィルタのフィルタ遅延要素にて短期
合成フィルタを初期化するすることを特徴とする音声符
号化復号化システム。