Nothing Special   »   [go: up one dir, main page]

JP2002149198A - 音声符号化装置及び音声復号化装置 - Google Patents

音声符号化装置及び音声復号化装置

Info

Publication number
JP2002149198A
JP2002149198A JP2000345720A JP2000345720A JP2002149198A JP 2002149198 A JP2002149198 A JP 2002149198A JP 2000345720 A JP2000345720 A JP 2000345720A JP 2000345720 A JP2000345720 A JP 2000345720A JP 2002149198 A JP2002149198 A JP 2002149198A
Authority
JP
Japan
Prior art keywords
signal
sound source
noise
linear prediction
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000345720A
Other languages
English (en)
Inventor
Tadashi Yonezaki
正 米崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000345720A priority Critical patent/JP2002149198A/ja
Publication of JP2002149198A publication Critical patent/JP2002149198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 ディジタル電話で必要となる音声符号化
装置及び音声復号化装置において、特に広帯域音声信号
が入力されたときに顕著となる周波数帯域に依存した信
号パワーの減衰による音声品質の劣化低減すること。 【解決手段】 線形予測残差を音源情報として伝送する
音声符号化装置及び音声復号化装置において、音源生成
器4で生成した音源信号に対して加算することで平坦な
振幅スペクトル特性となるような雑音を雑音生成器14
で生成する。この雑音信号を加算器15で音源信号に加
算し合成フィルタ16で復号音声を合成する。この構成
により特に高周波数帯域で生じる周波数帯域に依存した
信号の減衰を防ぐことができ、復号音声品質の向上を図
った音声符号化装置及び音声復号化装置を実現すること
ができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタル携帯電
話等で用いられる音声符号化装置及び音声復号化装置に
関する。
【0002】
【従来の技術】図17は、従来の線形予測分析を利用し
た合成による分析(AbS:Analysis-by-Synthesis)
型の音声符号化装置及び音声復号化装置の構成を示すブ
ロック図である。
【0003】この図において、音声符号化装置100
は、線形予測分析器101と、音源生成器102と、合
成フィルタ103と、誤差算出器104と、音源符号記
憶器105と、多重化器106とを備えて構成される。
また、音声復号化装置110は、逆多重化器107と、
合成フィルタ108と、音源再生器109とを備えて構
成される。
【0004】音声符号化装置100において、線形予測
分析器101は、入力された音声信号を線形予測分析
し、その結果を合成フィルタ103及び多重化器106
へ出力する。音源生成器102は、生成可能な音源信号
を順次生成して合成フィルタ103及び音源符号記憶器
105へ出力する。
【0005】合成フィルタ103は、音源信号に対して
分析により得られた線形予測フィルタ係数に基づいたフ
ィルタリングをする。誤差算出器104は、入力音声信
号と合成信号の誤差を算出し、その結果を音源符号記憶
器105へ出力する。音源符号記憶器105は、算出さ
れた誤差が最小となる音源信号を生成する符号群を記憶
する。多重化器106は、線形予測フィルタ係数と音源
符号を多重化し通信路へ送出する。
【0006】音声復号化装置110において、逆多重化
器107は、通信路から受信したビット列を復号化に用
いるモデルに対応するパラメータの符号群へ分割する。
合成フィルタ108は、受信符号から線形予測フィルタ
係数を復号し音源信号にフィルタリングする。音源再生
器109は、受信符号から音源信号を生成する。
【0007】次に、上記構成の音声符号化装置100の
動作について説明する。音声符号化装置100は、入力
音声信号との誤差が最小となる合成音声信号を生成する
符号群を選択して音声復号化装置110へ伝送する。そ
のために、まず線形予測分析器101で、入力された音
声信号を線形予測分析する。合成フィルタ103では、
線形予測分析器101の分析で得られたフィルタ係数を
用いて音源生成器102により生成された音源信号をフ
ィルタリングし、音声復号化装置110で再現される合
成音声信号を生成する。音源符号記憶器105は、誤差
算出器104で算出された入力音声信号と合成音声信号
の誤差が最小となる音源信号を生成する符号群を記憶す
る。このようにして得られる音源符号と線形予測フィル
タ係数は多重化器106で多重化され音声復号化装置1
10へ伝送される。
【0008】音声復号化装置110では、逆多重化器1
07で受信したビット列を、音源信号を表す符号群と線
形予測フィルタ係数に分離する。これらの受信符号を用
いて音源再生器109で生成した音源信号に合成フィル
タ108でフィルタリングすることで合成音声を出力す
る。
【0009】このように、時間的に緩やかに変化する線
形予測フィルタ係数と、急激に変化する音源信号を分離
して伝送することで、それぞれの信号の特性に応じた伝
送法が可能となる。また、合成フィルタ103によっ
て、信号に対して短期相関成分を付与することができる
ため、音源生成器102では白色雑音信号、あるいはイ
ンパルス信号に代表される短期的な相関を含まない平坦
な周波数特性を有する信号のみを生成すればよいことと
なる。
【0010】以上の動作により、少ない情報量で入力音
声信号との誤差が小さくなる合成音声を実現する音声符
号化及び復号化が可能となる。
【0011】
【発明が解決しようとする課題】ところで、従来の音声
符号化装置及び音声復号化装置においては、次のような
問題がある。すなわち、入力音声信号との誤差が小さく
なるように音源符号群を選択するため、大きなパワーを
有する低周波数帯域信号に対して誤差を最小化すること
に伝送情報量が費やされて高周波数帯域信号のパワーが
減衰する問題がある。特に、50Hz〜7kHzの信号
帯域を有する広帯域音声信号に対する音声符復号化装置
においてこの問題は顕著となる。
【0012】本発明はかかる点に鑑みてなされたもので
あり、周波数帯域に依存したパワーの減衰を抑制するこ
とができる音声符号化装置及び音声復号化装置を提供す
ることを目的とする。
【0013】
【課題を解決するための手段】本発明の音声符号化装置
は、入力された音声信号を線形予測分析する線形予測分
析手段と、入力された音声信号に対して前記線形予測分
析手段の分析により得られた線形予測フィルタ係数に基
づいた逆フィルタリングをする逆フィルタと、前記逆フ
ィルタによって得られた残差の周波数特性を分析する振
幅スペクトル算出手段と、生成可能な音源信号を生成す
る音源生成手段と、前記音源生成手段で生成された音源
の周波数特性を分析する振幅スペクトル算出手段と、前
記音源生成手段にて生成された音源に対して前記線形予
測フィルタ係数に基づいたフィルタリングをする合成フ
ィルタ手段と、前記合成フィルタ手段により得られた合
成信号の前記入力音声信号に対する誤差を算出する誤差
算出手段と、前記誤差算出手段にて算出された誤差が最
小となる音源信号を生成する符号群を記憶する音源符号
記憶手段と、前記誤差算出手段にて算出された誤差が最
小となるときの残差と前記音源信号の周波数特性との差
を求める差分スペクトル算出手段と、前記差分スペクト
ル算出手段にて算出された差分スペクトルを量子化する
差分スペクトル量子化手段と、前記音源符号と前記線形
予測フィルタ係数と前記差分スペクトルを多重化して通
信路へ送出する多重化手段と、を具備する構成を採る。
【0014】本発明の音声復号化装置は、通信路から受
信した多重化信号のビット列を、復号化に用いるモデル
に対応するパラメータの符号群へ分割する逆多重化手段
と、受信符号から音源信号を再生する音源再生手段と、
量子化された差分スペクトルを実現する雑音信号を生成
する雑音生成手段と、前記音源再生手段で再生された音
源信号と前記雑音生成手段で生成された雑音信号を加算
する加算手段と、受信符号を復号して得られる線形予測
フィルタ係数を用いて前記加算手段で加算された信号に
対してフィルタリングする合成フィルタ手段と、を具備
する構成を採る。
【0015】上記構成によれば、従来の符復号化処理で
減衰する信号を復元し周波数帯域に依存した信号の減衰
を防ぐことができる。これにより、復号音声品質の向上
が図れる。
【0016】また、本発明の音声符号化装置は、上記音
声符号化装置において、差分スペクトル量子化手段は、
差分スペクトルを幾つかの帯域に分割し帯域毎の平均振
幅値を算出する平均振幅値算出手段と、前記平均振幅値
算出手段で算出された振幅値を量子化する量子化手段
と、を具備する構成を採る。
【0017】上記構成によれば、差分スペクトルの量子
化対象点数を削減することで量子化に要する処理量を削
減することができる。これにより、少ない処理量で復号
音声品質の向上が図れる。
【0018】また、本発明の音声符号化装置は、上記音
声符号化装置において、差分スペクトル量子化手段は、
差分スペクトルに対して最尤スペクトル推定する最尤ス
ペクトル推定手段と、前記最尤スペクトル推定手段にて
推定された最尤スペクトルを量子化する量子化手段と、
を具備する構成を採る。
【0019】上記構成によれば、効率良く差分スペクト
ルの概形を量子化することができる。これにより、復号
音声品質の向上が図れる。
【0020】また、本発明の音声符号化装置は、入力さ
れた音声信号を線形予測分析する線形予測分析手段と、
入力された音声信号に対して分析により得られた線形予
測フィルタ係数に基づき逆フィルタリングをすることで
残差信号を得る逆フィルタ手段と、生成可能な音源信号
を生成する音源生成手段と、前記音源生成手段で生成さ
れた音源信号に対して前記線形予測フィルタ係数に基づ
いたフィルタリングをする合成フィルタ手段と、前記合
成フィルタ手段により得られた合成信号の前記入力音声
信号に対する誤差を算出する誤差算出手段と、前記誤差
算出手段で算出された誤差が最小となる音源信号を生成
する符号群を記憶する音源符号記憶手段と、前記誤差算
出手段で算出された誤差が最小となるときの残差信号と
前記音源生成手段で生成された音源信号の差信号を求め
る減算手段と、前記減算手段で得られた差信号の振幅ス
ペクトルの概形を量子化する残差量子化手段と、前記線
形予測フィルタ係数と前記音源符号と前記差信号情報を
多重化して通信路へ送出する多重化手段と、を具備する
構成を採る。
【0021】また、本発明の音声復号化装置は、通信路
から受信した多重化信号のビット列を、復号化に用いる
モデルに対応するパラメータの符号群へ分割する逆多重
化手段と、前記逆多重化手段からの受信符号から音源信
号を再生する音源再生手段と、前記差信号情報に基づい
て雑音信号を生成する雑音生成手段と、前記音源再生手
段で生成された音源信号と前記雑音生成手段で生成され
た雑音信号を加算する加算手段と、受信符号を復号して
得られる線形予測フィルタ係数を用いて前記加算手段で
加算された信号に対してフィルタリングする合成フィル
タ手段と、を具備する構成を採る。
【0022】上記構成によれば、音源信号と残差信号の
双方の振幅スペクトルを算出する必要がないので、処理
量を削減しつつ周波数帯域に依存した信号の減衰を防ぐ
ことができる。これにより、少ない処理量で復号音声品
質の向上が図れる。
【0023】また、本発明の音声符号化装置は、上記音
声符号化装置において、残差量子化手段は、差信号に対
して帯域通過フィルタリングする周波数ろ波手段と、前
記周波数ろ波手段でフィルタリングされた信号の振幅ス
ペクトルの概形を量子化するろ波信号量子化手段と、を
具備する構成を採る。
【0024】上記構成によれば、特に減衰しやすい帯域
の信号の情報のみを伝送することができる。これによ
り、効率良く復号音声品質の向上を図った音声符号化装
置を実現できる。
【0025】また、本発明の音声符号化装置は、上記音
声符号化装置において、残差量子化手段は、差信号に対
して帯域通過フィルタリングする周波数ろ波手段と、前
記周波数ろ波手段でフィルタリングされた信号が占める
パワー比を量子化するパワー比量子化手段と、を具備す
る構成を採る。
【0026】上記構成によれば、少ない処理量で帯域毎
のパワー減衰を推定することができる。これにより、効
率良く復号音声品質の向上を図った音声符号化装置を実
現できる。
【0027】また、本発明の音声符号化装置は、入力さ
れた音声信号を線形予測分析する線形予測分析手段と、
生成可能な音源信号を生成する音源生成手段と、前記音
源生成手段で生成された音源信号に対して前記線形予測
分析手段の分析により得られた線形予測フィルタ係数に
基づいたフィルタリングをする合成フィルタ手段と、前
記合成フィルタ手段により得られた合成信号の前記入力
音声信号に対する誤差を算出する誤差算出手段と、前記
誤差算出手段で算出された誤差が最小となる音源信号を
生成する符号群を記憶する音源符号記憶手段と、前記線
形予測フィルタ係数と前記音源符号記憶手段に記憶され
た音源符号を多重化して通信路へ送出する多重化手段
と、を具備する構成を採る。
【0028】また、本発明の音声復号化装置は、通信路
から受信した多重化信号のビット列を、復号化に用いる
モデルに対応するパラメータの符号群へ分割する逆多重
化手段と、前記逆多重化手段からの受信符号から音源信
号を再生する音源再生手段と、加算することで前記音源
信号が平坦な振幅スペクトル特性となるような雑音を生
成する雑音生成手段と、前記音源再生手段で生成された
音源信号と前記雑音生成手段で生成された雑音信号を加
算する加算手段と、受信符号を復号して得られる線形予
測フィルタ係数を用いて前記加算手段で加算された信号
に対してフィルタリングする合成フィルタ手段と、を具
備する構成を採る。
【0029】上記構成によれば、減衰した信号に関する
情報を伝送することなく周波数帯域に依存した信号の減
衰を防ぐことができる。これにより、復号音声品質の向
上が図れる。
【0030】また、本発明の音声復号化装置は、上記音
声復号化装置において、雑音生成手段は、音源信号のパ
ワーから付加する雑音のゲインを推定する雑音ゲイン算
出手段と、前記雑音ゲイン算出手段で算出されたゲイン
の雑音を生成する基本雑音生成手段と、前記基本雑音生
成手段で生成された雑音を予め定められた周波数特性に
整形する雑音整形手段と、を具備する構成を採る。
【0031】上記構成によれば、付加する雑音について
周波数特性を予め定めておいて、ゲインのみを調整する
ことで周波数帯域に依存した信号の減衰を防ぐことがで
きる。これにより、少ない処理量で復号音声品質の向上
が図れる。
【0032】また、本発明の音声復号化装置は、上記音
声復号化装置において、雑音ゲイン算出手段は、音源信
号を帯域通過フィルタによって所望する周波数帯域の信
号にろ波する帯域分割手段と、前記帯域分割手段で音源
信号に対してろ波された帯域の信号のパワーが占める割
合を算出する音源パワー分布推定手段と、音源再生手段
で生成された音源信号のパワーと前記音源パワー分布推
定手段で算出されたパワー比より、生成する雑音のゲイ
ンを推定する雑音ゲイン推定手段と、を具備する構成を
採る。
【0033】上記構成によれば、付加する雑音信号のゲ
インを少ない処理量で適応的に算出することができる。
これにより、復号音声品質の向上が図れる。
【0034】また、本発明の音声復号化装置は、上記音
声復号化装置において、雑音生成手段は、音源信号を線
形予測分析する音源信号線形予測分析手段と、音源再生
手段で生成された音源信号のパワーにより、付加する雑
音のゲインを推定する雑音ゲイン算出手段と、前記雑音
ゲイン算出手段で算出されたゲインの雑音を生成する基
本雑音生成手段と、前記基本雑音生成手段で生成された
雑音に対して分析により得られた線形予測係数を用いて
逆フィルタリングする逆フィルタ手段と、を具備する構
成を採る。
【0035】上記構成によれば、線形予測分析を用いて
効率良く付加する雑音信号の振幅スペクトルを制御する
ことができる。これにより、復号音声品質の向上が図れ
る。
【0036】また、本発明の音声符号化装置は、入力さ
れた音声信号を線形予測分析する線形予測分析手段と、
生成可能な音源信号を生成する音源生成手段と、前記音
源生成手段で生成された音源信号に対して前記線形予測
分析手段の分析により得られた線形予測フィルタ係数に
基づいたフィルタリングをする合成フィルタ手段と、前
記合成フィルタ手段により得られた合成信号の前記入力
音声信号に対する誤差を算出する誤差算出手段と、前記
誤差算出手段で算出された誤差が最小となる音源信号を
生成する符号群を記憶する音源符号記憶手段と、前記線
形予測フィルタ係数と前記音源符号記憶手段に記憶され
た音源符号を多重化して通信路へ送出する多重化手段
と、を具備する構成を採る。
【0037】また、本発明の音声復号化装置は、通信路
から受信した多重化信号のビット列を、復号化に用いる
モデルに対応するパラメータの符号群へ分割する逆多重
化手段と、前記逆多重化手段からの受信符号から音源信
号を再生する音源再生手段と、前記音源再生手段で復号
された音声より、処理中の信号が有音であるか無音であ
るかを判定する有音/無音判定手段と、加算することで
音源信号が平坦な振幅スペクトル特性となるような雑音
を生成する雑音生成手段と、前記音源再生手段で生成さ
れた音源信号に対して無音時のみ前記雑音生成手段で生
成された雑音信号を加算する条件付加算手段と、受信符
号を復号して得られる線形予測フィルタ係数を用いて前
記条件付加算手段で加算された信号に対してフィルタリ
ングする合成フィルタ手段と、を具備する構成を採る。
【0038】上記構成によれば、入力音声信号のエネル
ギーが低周波数帯域に集中し周波数に依存したパワーの
減衰が少ない有音部で雑音を付加することを避けること
ができる。これにより、有音部での明瞭性の向上が図れ
る。
【0039】また、本発明の音声復号化装置は、上記音
声復号化装置において、条件付加算手段は、加算する雑
音のパワーを制御するパワー制御手段と、音源信号にパ
ワーを制御しつつ雑音信号を加算する平滑化加算手段
と、を具備する構成を採る。
【0040】上記構成によれば、有音区間と無音区間の
境界において滑らかに雑音信号を付加することができ
る。これにより、聴感上の違和感を押えつつ復号音声品
質の向上が図れる。
【0041】また、本発明の音声符号化装置は、入力さ
れた音声信号を線形予測分析する線形予測分析手段と、
生成可能な音源信号を生成する音源生成手段と、前記音
源生成手段で生成された音源信号に対して前記線形予測
分析手段の分析により得られた線形予測フィルタ係数に
基づいたフィルタリングをする合成フィルタ手段と、前
記合成フィルタ手段により得られた合成信号の前記入力
音声信号に対する誤差を算出する誤差算出手段と、前記
誤差算出手段で算出された誤差が最小となる音源信号を
生成する符号群を記憶する音源符号記憶手段と、前記線
形予測フィルタ係数と前記音源符号記憶手段からの音源
符号を多重化して通信路へ送出する多重化手段と、を具
備する構成を採る。
【0042】また、本発明の音声復号化装置は、通信路
から受信した多重化信号のビット列を、復号化に用いる
モデルに対応するパラメータの符号群へ分割する逆多重
化手段と、前記逆多重化手段からの受信符号から音源信
号を再生する音源再生手段と、前記音源再生手段で復号
された音声より、処理中の信号が有音であるか無音であ
るかを判定する有音/無音判定手段と、前記音声が無音
で減衰している信号の大きさを音源信号から推定する雑
音パワー推定手段と、予め定められた周波数特性を有す
る雑音を前記雑音パワー推定手段で推定されたパワーを
もとに生成する雑音生成手段と、前記音源再生手段で生
成された音源信号に対して前記雑音生成手段で生成され
た雑音信号を加算する加算手段と、受信符号を復号して
得られる線形予測フィルタ係数を用いて前記条件付加算
手段で加算された信号に対してフィルタリングする合成
フィルタ手段と、を具備する構成を採る。
【0043】上記構成によれば、付加する雑音に対して
調整するゲインを周波数帯域に依存したパワーの減衰が
顕著に生じる無音区間のみから推定することで定常的な
信号を付加することができる。これにより、復号音声品
質の向上が図れる。
【0044】また、本発明の音声復号化装置は、上記音
声復号化装置において、雑音生成手段は、音源信号を半
波整流することで周波数帯域を拡張した信号を雑音とし
て生成する半波整流手段を具備する構成を採る。
【0045】この構成によれば、音源信号の周期性を保
ちつつ帯域を拡張した信号を用いて減衰した信号を復元
することができる。したがって、周期的な信号を劣化さ
せることなく復号音声品質の向上が図れる。
【0046】本発明の移動局装置は、上記音声符号化装
置と、上記音声復号化装置とを具備する構成を採る。
【0047】本発明の基地局装置は、上記音声符号化装
置と、上記音声復号化装置とを具備する構成を採る。
【0048】本発明の音声符号化装置と音声符号化装置
を具備することで、復号音声品質の向上が図れる。
【0049】本発明の記録媒体は、コンピュータを、上
記音声符号化装置の各手段として機能させるためのプロ
グラムを記憶したことを特徴とする。
【0050】本発明の記録媒体は、コンピュータを、上
記音声復号化装置の各手段として機能させるためのプロ
グラムを記憶したことを特徴とする。
【0051】
【発明の実施の形態】本発明の骨子は、減衰した信号に
関する情報の概形のみを復号化部へ少ない情報量で伝
送、あるいは理想的な音源信号が平坦な振幅スペクトル
特性を有することを利用して復号化部で減衰した信号を
推定し音源信号へ付加することで、減衰した信号を復元
させることである。これにより、周波数帯域に依存した
パワーの減衰を低減し聴感的な品質向上を図った復号音
声を合成する音声符号化装置及び音声復号化装置を実現
することができる。
【0052】以下、本発明の実施の形態について、図面
を参照して詳細に説明する。 (実施の形態1)図1は、本発明の実施の形態1に係る
音声符号化装置及び音声復号化装置の構成を示すブロッ
ク図である。
【0053】この図において、本実施の形態の音声符号
化装置120は、線形予測分析器1と、逆フィルタ2
と、振幅スペクトル算出器3と、音源生成器4と、振幅
スペクトル算出器5と、誤差算出器7と、音源符号記憶
器8と、差分スペクトル算出器9と、差分スペクトル量
子化器10と、多重化器11とを備えて構成される。ま
た、本実施の形態の音声復号化装置130は、逆多重化
器12と、音源再生器13と、雑音生成器14と、加算
器15と、合成フィルタ16とを備えて構成される。
【0054】音声符号化装置120において、線形予測
分析器1は、入力された音声信号を線形予測分析する。
逆フィルタ2は、入力された音声信号に対して、線形予
測分析器1の分析により得られた線形予測フィルタ係数
に基づき逆フィルタリングをする。振幅スペクトル算出
器3は、逆フィルタ2によって得られた残差の周波数特
性を分析する。音源生成器4は、生成可能な音源信号を
順次生成する。振幅スペクトル算出器5は、生成した音
源の周波数特性を分析する。
【0055】合成フィルタ6は、音源生成器4で生成さ
れた音源信号に対して、線形予測分析器1の分析により
得られた線形予測フィルタ係数に基づきフィルタリング
をする。誤差算出器7は、入力音声信号と合成信号との
誤差を算出する。音源符号記憶器8は、誤差算出器7で
算出された誤差が最小となる音源信号を生成する符号群
を記憶する。差分スペクトル算出器9は、誤差算出器7
で算出された算出された誤差が最小となるときの残差と
振幅スペクトル算出器5で分析された音源信号の周波数
特性との差を求める。
【0056】差分スペクトル量子化器10は、差分スペ
クトル算出器9で算出された誤差が最小となるときの残
差と音源信号の周波数特性との差を量子化する。差分ス
ペクトル量子化器10は、図2のブロック図に示すよう
に、差分スペクトルを幾つかの帯域に分割して各帯域毎
の平均振幅値を算出する平均振幅値算出器17と、平均
振幅値算出器17で算出された振幅値を量子化する量子
化器18とを備えて構成される。図1に戻り、多重化器
11は、線形予測フィルタ係数と音源符号と差分スペク
トル情報を多重化し通信路へ送出する。
【0057】音声復号化装置130において、逆多重化
器12は、通信路から受信したビット列を復号化に用い
るモデルに対応するパラメータの符号群へ分割する。音
源再生器13は、受信符号から音源信号を再生する。雑
音生成器14は、量子化された差分スペクトルを実現す
る雑音信号を生成する。加算器15は、音源再生器13
で再生された音源信号と雑音生成器14で生成された雑
音信号を加算する。合成フィルタ16は、受信符号から
線形予測フィルタ係数を復号し、加算器15にて加算さ
れた信号にフィルタリングする。
【0058】以上のような構成の音声符号化装置120
及び音声復号化装置130の動作について、図3の周波
数−振幅特性図を参照しながら説明する。
【0059】(音声符号化装置120の動作)まず、音
声符号化装置120における処理を説明する。入力され
た音声信号が線形予測分析器1で線形予測分析される。
音源生成器4で生成された音源信号が合成フィルタ6で
線形予測フィルタ係数に基づく合成フィルタリングされ
復号音声信号が得られる。この信号と入力信号の誤差が
誤差算出器7で算出され、誤差が最小となる音源信号を
生成する符号が音源符号記憶器8で記憶される。
【0060】一方、入力された音声信号に対して、逆フ
ィルタ2で線形予測フィルタ係数に基づく逆フィルタリ
ングされて線形予測残差が求められ、その周波数特性が
振幅スペクトル算出器3にて例えばフーリエ変換により
算出される(図3(a)参照)。
【0061】同様に、振幅スペクトル算出器5におい
て、音源生成器4で生成された音源信号の周波数特性が
算出される(図3(b))。これら2つの振幅スペクト
ルの差が差分スペクトル算出器9にて求められる。そし
て、その差分が線形予測残差の振幅スペクトルに対する
音源信号の振幅スペクトル減衰量として算出され、負の
場合は「0」とされる(図3(c))。このようにして
得られた差分スペクトルが差分スペクトル量子化器10
にてベクトル量子化される。
【0062】以上の処理で得られた線形予測フィルタ係
数と音源符号と差分スペクトル情報が多重化器11で多
重化され通信路へ送出される。
【0063】なお、差分スペクトル量子化器10では、
平均振幅値算出器17で、入力された差分スペクトルが
周波数帯域分割され、各帯域毎に振幅値の平均が算出さ
れる(図4の周波数−振幅特性図を参照)。そして、得
られた差分スペクトルの概形が量子化器18で量子化さ
れる。
【0064】(音声復号化装置130の動作)次に、音
声復号化装置130における処理を説明する。受信した
ビット列が逆多重化器12で各パラメータ値へ分離さ
れ、音源再生器13で音源信号が生成される。また、雑
音生成器14で差分スペクトル情報を満たす信号が生成
される。なお、この手法として、差分スペクトル情報を
逆フーリエ変換してFIRフィルタを作成し、乱数によ
って生成した白色雑音をフィルタリングすることで所望
の信号を得る方法がある。生成する雑音として音源信号
を半波整流したものを用いてもよい。
【0065】このようにして得られた音源信号と雑音信
号が加算器15で加算され、合成フィルタ16で復号音
声が合成される。以上の動作により、従来の符復号化処
理で減衰する信号を復元し周波数帯域に依存した信号の
減衰を防ぐことができる。また、差分スペクトルの量子
化対象点数を削減することで量子化に要する処理量を削
減することができる。したがって、少ない処理量で復号
音声品質の向上を図った音声符号化装置及び音声復号化
装置を実現できる。
【0066】なお、上記実施の形態の差分スペクトル量
子化器10は、差分スペクトルに対して最尤スペクトル
推定する最尤スペクトル推定手段と、推定された最尤ス
ペクトルを量子化する量子化手段とを具備して構成され
るものであってもよい。この構成によれば、効率良く差
分スペクトルの概形を量子化することができる。
【0067】(実施の形態2)図5は、本発明の実施の
形態2に係る音声符号化装置及び音声復号化装置の構成
を示すブロック図である。なお、この図において前述し
た図1と共通する部分には同一の符号を付けている。
【0068】この図において、本実施の形態の音声符号
化装置140は、線形予測分析器1と、逆フィルタ2
と、音源生成器4と、合成フィルタ6と、誤差算出器7
と、音源符号記憶器8と、減算器20と、残差量子化器
21と、多重化器22とを備えて構成される。また、音
声復号化装置150は、逆多重化器12と、音源再生器
13と、雑音生成器14と、加算器15と、合成フィル
タ16とを備えて構成される。
【0069】音声符号化装置140において、線形予測
分析器1は、入力された音声信号を線形予測分析する。
逆フィルタ2は、入力された音声信号に対して、線形予
測分析器1の分析により得られた線形予測フィルタ係数
に基づき逆フィルタリングし残差信号を得る。音源生成
器4は、生成可能な音源信号を順次生成する。合成フィ
ルタ6は、音源生成器4で生成された音源信号に対し、
線形予測分析器1の分析により得られた線形予測フィル
タ係数に基づいてフィルタリングをする。
【0070】誤差算出器7は、入力音声信号と合成信号
の誤差を算出する。音源符号記憶器8は、誤差算出器7
で算出された誤差が最小となる音源信号を生成する符号
群を記憶する。減算器20は、誤差算出器7で算出され
た誤差が最小となるときの残差信号と音源信号との差信
号を求める。残差量子化器21は、減算器20で算出さ
れた差信号の振幅スペクトルの概形を量子化する。
【0071】残差量子化器21は、図6のブロック図に
示すように、減算器20からの差信号に対して帯域通過
フィルタリング処理を施す周波数ろ波器23と、フィル
タリング処理された信号の振幅スペクトルの概形を量子
化するろ波信号量子化器24とを備えて構成される。図
5に戻り、多重化器22は、線形予測フィルタ係数と音
源符号と差信号情報とを多重化して通信路へ送出する。
【0072】音声復号化装置150において、逆多重化
器12は、通信路から受信したビット列を復号化に用い
るモデルに対応するパラメータの符号群に分割する。音
源再生器13は受信符号から音源信号を生成する。雑音
生成器14は、差信号情報に基づき雑音信号を生成す
る。加算器15は音源信号と雑音信号を加算する。合成
フィルタ16は、受信符号から線形予測フィルタ係数を
復号し加算された信号にフィルタリングする。
【0073】次に、上記構成による音声符号化装置14
0及び音声復号化装置150の動作を説明する。 (音声符号化装置140の動作)まず、入力された音声
信号が線形予測分析器1にて線形予測分析されて、その
結果が合成フィルタ6及び逆フィルタ2に力される。一
方、音源生成器4で生成された音源信号が合成フィルタ
6で線形予測フィルタ係数に基づく合成フィルタリング
されて、復号音声信号が得られる。そして、この復号音
声信号と入力音声信号との誤差が誤差算出器7で算出さ
れて、誤差が最小となる音源信号を生成する符号が音源
符号記憶器8に記憶される。
【0074】入力された音声信号が逆フィルタ2によっ
て、線形予測フィルタ係数に基づく逆フィルタリングさ
れて線形予測残差が求められる。そして、求められた線
形予測残差信号と音源信号との差信号が減算器20で算
出される。算出された差信号は、例えばフーリエ変換さ
れて、振幅スペクトルが残差量子化器21で量子化され
る。
【0075】残差量子化器21では、減算器20からの
差信号が周波数ろ波器23で帯域通過フィルタリングさ
れる。この場合、パワーの減衰の影響が聴感的に顕著と
なる周波数帯域を知見により求めておき、この特性を満
たすフィルタを周波数ろ波器23で用いる帯域通過フィ
ルタとする。帯域通過フィルタリングされた差信号は、
ろ波信号量子化器24で、その振幅スペクトルの概形が
量子化される。
【0076】以上の処理で得られた線形予測フィルタ係
数と音源符号と差信号情報とが多重化器22で多重化さ
れて通信路へ送出される。
【0077】(音声復号化装置150の動作)次に、音
声復号化装置150における処理を説明する。多重化器
22から送信されたビット列が逆多重化器12で各パラ
メータ値に分離され、音源再生器13で音源信号が生成
される。また、雑音生成器14で差信号情報を満たす信
号が生成される。なお、この手法としては、実施の形態
1と同様に、差信号情報を逆フーリエ変換しFIRフィ
ルタを作成して、乱数によって生成した白色雑音をフィ
ルタリングすることで所望の信号を得る方法がある。生
成する雑音として音源信号を半波整流したものを用いて
もよい。このようにして得られた音源信号が雑音信号と
加算器15で加算される。そして、加算された音源信号
と雑音信号とが、合成フィルタ16にて復号音声と合成
される。
【0078】以上の動作により、音源信号と残差信号の
双方の振幅スペクトルを算出する必要がなくなり、処理
量を削減しつつ周波数帯域に依存した信号の減衰を防ぐ
ことが可能となる。特に、減衰しやすい帯域の信号の情
報のみを伝送することができる。これにより、少ない処
理量で復号音声品質の向上を図った音声符号化装置及び
音声復号化装置を実現できる。
【0079】(実施の形態3)図7は、本発明の実施の
形態3に係る音声符号化装置の残差量子化器の構成を示
すブロック図である。なお、本実施の形態においては、
残差量子化器25以外の各部は上述した実施の形態2の
音声符復号化装置と同様の構成となっている。
【0080】この図において、残差量子化器25は、減
算器20(図5参照)からの差信号に対して帯域通過フ
ィルタリングする周波数ろ波器26と、減算器20から
の差信号に対してフィルタリングされた信号が占めるパ
ワー比を量子化するパワー比量子化器27とを備えて構
成される。
【0081】次に、上記構成の残差量子化器25の動作
を説明する。まず、減算器20からの差信号が周波数ろ
波器26で帯域通過フィルタリングされる。この場合、
上記同様にパワーの減衰の影響が聴感的に顕著となる周
波数帯域を知見により求めておき、この特性を満たすフ
ィルタを周波数ろ波器26で用いる帯域通過フィルタと
する。帯域通過フィルタリングされた差信号は、パワー
比量子化器27で、その信号が占めるパワー比が算出さ
れて量子化される。
【0082】以上の動作により、特に聴感上影響が大き
い帯域の信号出力の減衰量を推定し少ない情報量で表す
ことができ、効率良く復号音声品質の向上を図った音声
符復号化装置を実現できる。
【0083】(実施の形態4)図8は、本発明の実施の
形態4に係る音声符号化装置及び音声復号化装置の構成
を示すブロック図である。なお、この図において前述し
た図1と共通する部分には同一の符号を付けている。
【0084】この図において、本実施の形態の音声符号
化装置160は、線形予測分析器1と、音源生成器4
と、合成フィルタ6と、誤差算出器7と、音源符号記憶
器8と、多重化器11とを備えて構成される。また、音
声復号化装置170は、逆多重化器12と、音源再生器
13と、雑音生成器14と、加算器15と、合成フィル
タ16とを備えて構成される。
【0085】音声符号化装置160において、線形予測
分析器1は、入力された音声信号を線形予測分析する。
音源生成器4は、生成可能な音源信号を順次生成する。
合成フィルタ6は、音源信号に対して、線形予測分析器
1の分析により得られた線形予測フィルタ係数に基づい
たフィルタリングを行う。誤差算出器7は、入力音声信
号と合成信号の誤差を算出する。音源符号記憶器8は、
誤算算出器7で算出された誤差が最小となる音源信号を
生成する符号群を記憶する。多重化器11は、線形予測
フィルタ係数と音源符号を多重化して通信路へ送出す
る。
【0086】音声復号化装置170において、逆多重化
器12は、通信路から受信したビット列を復号化に用い
るモデルに対応するパラメータの符号群に分割する。音
源再生器13は、受信符号から音源信号を生成する。雑
音生成器14は、加算することで音源信号が平坦な振幅
スペクトル特性となるような雑音を生成する。加算器1
5は、音源信号と雑音信号を加算する。合成フィルタ1
6は、受信符号から線形予測フィルタ係数を復号し加算
された信号にフィルタリングする。
【0087】雑音生成器14は、図9のブロック図に示
すように、音源信号のパワーを算出する雑音ゲイン算出
器30と、雑音ゲイン算出器30で算出されたゲインの
雑音を生成する基本雑音生成器31と、基本雑音生成器
31で生成された雑音を予め定められた周波数特性に整
形する雑音整形器32とを備えて構成される。
【0088】雑音ゲイン算出器30は、図10のブロッ
ク図に示すように、音源信号を帯域通過フィルタによっ
て所望する周波数帯域の信号にろ波する帯域分割器33
と、音源信号に対してろ波した帯域の信号のパワーが占
める割合を算出する音源パワー分布推定器34と、音源
信号のパワーから生成する雑音のゲインを推定する雑音
ゲイン推定器35とを備えて構成される。
【0089】次に、上記構成の音声符号化装置160及
び音声復号化装置170の動作を説明する。 (音声符号化装置160の動作)まず、入力された音声
信号が線形予測分析器1にて線形予測分析されて、その
結果が合成フィルタ6及び多重化器11へ出力される。
音源生成器4で生成された音源信号が合成フィルタ6で
線形予測フィルタ係数に基づく合成フィルタリングされ
て復号音声信号が得られる。そして、この復号音声信号
と入力音声信号の誤差が誤差算出器7で算出され、その
誤差が最小となる音源信号を生成する符号が音源符号記
憶器8に記憶される。以上の処理で得られた線形予測フ
ィルタ係数と音源符号が多重化器11で多重化されて通
信路へ送出される。
【0090】(音声復号化装置170の動作)次に、音
声復号化装置170における処理を説明する。多重化器
11から送信されたビット列が逆多重化器12で各パラ
メータ値に分離されて音源再生器13で音源信号が生成
される。雑音生成器14からは、加算することで音源信
号が平坦な振幅スペクトル特性となる雑音が生成され
る。
【0091】なお、この手法として、音源信号をフーリ
エ変換して得られる振幅スペクトルと加算することで周
波数特性が平坦になる振幅スペクトルを求め、このスペ
クトルを逆フーリエ変換してFIRフィルタを作成し、
乱数により生成した白色雑音をフィルタリングすること
で、所望の信号を得る方法がある。生成する雑音として
音源信号を半波整流したものを用いてもよい。
【0092】音源再生器13で再生された音源信号と雑
音生成器14で生成された雑音信号とが加算器15で加
算された後、合成フィルタ16で復号音声が合成され
る。
【0093】雑音生成器14では、音源信号のパワーが
算出されて、この値が予め求められた数だけ倍数されて
雑音のゲインが決定される。そして、決定されたゲイン
に従って雑音が生成された後、所定の周波数特性に整形
される。この周波数特性は、付加することで聴感的な品
質向上が得られる特性を予め知見により求めたものを使
用する。
【0094】雑音ゲイン算出器30では、帯域分割器3
3で、帯域通過フィルタによって音源信号に占める所望
する周波数帯域の信号にろ波される。なお、所望する周
波数帯域とは、例えば統計的または聴感上パワーの減衰
が著しい帯域を対象とする。
【0095】次に、音源パワー分布推定器34で、音源
信号に対してろ波された帯域の信号のパワーが占める割
合が算出される。これにより対象とする周波数帯域での
パワーの減衰率が求められて、付加すべき雑音のゲイン
が決定される。付加すべき雑音のゲインが決定された
後、雑音ゲイン推定器35で、音源信号のパワーに対し
て減衰率の逆数を乗ずることで雑音のゲインが推定され
る。
【0096】以上の動作により、減衰した信号に関する
情報を伝送することなく、周波数帯域に依存した信号の
減衰を防ぐことができる。また、付加する雑音について
周波数特性を予め定めておいてゲインのみを調整するこ
とで、周波数帯域に依存した信号の減衰を防ぐことがで
きる。また、付加する雑音信号のゲインを少ない処理量
で適応的に算出するができる。したがって、少ない処理
量で復号音声品質の向上を図った音声符号化装置及び音
声復号化装置を実現できる。
【0097】(実施の形態5)図11は、本発明の実施
の形態5に係る音声復号化装置の雑音生成器の構成を示
すブロック図である。なお、本実施の形態においては、
雑音生成器40以外の部分は上述した実施の形態4の音
声復号化装置と同様である。
【0098】この図において、雑音生成器40は、音源
信号を線形予測分析する音源信号線形予測分析器41
と、音源信号のパワーから付加する雑音のゲインを推定
する雑音ゲイン算出器30と、雑音ゲイン算出器30で
算出されたゲインの雑音を生成する基本雑音生成器31
と、基本雑音生成器31で生成された雑音に対して、音
源信号線形予測分析器41の分析により得られた線形予
測係数を用いて逆フィルタリングする逆フィルタ42と
を備えて構成される。
【0099】次に、上記構成の雑音生成器40を有する
音声復号化装置の動作を説明する。実施の形態4と同様
に、雑音ゲイン算出器30で音源信号のパワーから付加
する雑音のゲインを推定し、基本雑音生成器31で算出
されたゲインの雑音を生成する。一方、音源信号線形予
測分析器41で音源信号を線形予測分析する。この線形
予測分析によって、例えば図12の(a)に示すような
音源信号のスペクトル包絡を持つフィルタ係数が得られ
る。
【0100】このフィルタ係数を用いて逆フィルタ42
が構成される。例えば、図12の(b)のような振幅ス
ペクトル特性を持つフィルタが構成される。この振幅ス
ペクトル特性を有する雑音が音源信号に加算されること
で、平坦な振幅スペクトルを有する信号が得られる。逆
フィルタ42にて、基本雑音生成器31で生成された雑
音が逆フィルタリングされる。
【0101】以上の動作により、付加する雑音信号の振
幅スペクトルを線形予測分析にて制御することで、平坦
な振幅スペクトル特性を有する信号を容易に実現でき
る。これにより、復号音声品質の向上が図れる。
【0102】(実施の形態6)図13は、本発明の実施
の形態6に係る音声符号化装置及び音声復号化装置の構
成を示すブロック図である。なお、この図において前述
した図8と共通する部分には同一の符号を付けている。
【0103】この図において、本実施の形態の音声符号
化装置180は、線形予測分析器1と、音源生成器4
と、合成フィルタ6と、誤差算出器7と、音源符号記憶
器8と、多重化器11とを備えて構成される。また、音
声復号化装置190は、逆多重化器12と、音源再生器
13と、雑音生成器14と、有音/無音判定器50と、
条件付加算器51と、合成フィルタ16とを備えて構成
される。
【0104】音声符号化装置180を構成する線形予測
分析器1、音源生成器4は、合成フィルタ6、誤差算出
器7、音源符号記憶器8及び多重化器11は、上述した
実施の形態4の符号化部と同様であるので、説明を省略
する。
【0105】また、音声復号化装置190においても、
有音/無音判定器50と条件付加算器51を除いては、
実施の形態4の復号化部と同様であるので、説明を省略
する。有音/無音判定器50は、音源再生器13で再生
された音声より、処理中の信号が有音であるか無音であ
るかを判定する。条件付加算器51は、音源再生器13
で生成された音源信号に対して無音時のみ雑音生成器1
4で生成された雑音信号を加算する。条件付加算器51
は、図14のブロック図に示すように、加算する雑音の
パワーを制御するパワー制御器52と、音源信号にパワ
ーを制御しつつ雑音信号を加算する平滑化加算器53と
を備えている。
【0106】この構成によれば、入力音声信号のエネル
ギーが低周波数帯域に集中し周波数に依存したパワーの
減衰が少ない有音部で雑音を付加することを避けること
ができる。これにより、有音部での明瞭性の向上が図れ
る。
【0107】(実施の形態7)図15は、本発明の実施
の形態7に係る音声符号化装置及び音声復号化装置の構
成を示すブロック図である。なお、この図において前述
した図8と共通する部分には同一の符号を付けている。
【0108】この図において、本実施の形態の音声符号
化装置200は、線形予測分析器1と、音源生成器4
と、合成フィルタ6と、誤差算出器7と、音源符号記憶
器8と、多重化器11とを備えて構成される。また、音
声復号化装置210は、逆多重化器12と、音源再生器
13と、有音/無音判定器50と、雑音パワー推定器5
5と、雑音生成器56と、加算器15と、合成フィルタ
16とを備えて構成される。
【0109】音声符号化装置200を構成する線形予測
分析器1、音源生成器4は、合成フィルタ6、誤差算出
器7、音源符号記憶器8及び多重化器11は、上述した
実施の形態4の符号化部と同様であるので、説明を省略
する。
【0110】また、音声復号化装置210においても、
有音/無音判定器50と雑音パワー推定器55と雑音生
成器56を除いては、実施の形態4の復号化部と同様で
あるので、説明を省略する。
【0111】有音/無音判定器50は、音源再生器13
で再生された音声より、処理中の信号が有音であるか無
音であるかを判定する。雑音パワー推定器55は、音声
が無音で減衰している信号の大きさを音源信号から推定
する。雑音生成器56は、予め定められた周波数特性を
有する雑音を雑音パワー推定器55で推定されたパワー
をもとに生成する。雑音生成器56は、図16のブロッ
ク図に示すように、音源信号を半波整流することで周波
数帯域を拡張した信号を雑音として生成する半波整流器
57を備えている。
【0112】この構成によれば、付加する雑音に対して
調整するゲインを周波数帯域に依存したパワーの減衰が
顕著に生じる無音区間のみから推定することで定常的な
信号を付加することができる。これにより、復号音声品
質の向上が図れる。
【0113】なお、上記実施の形態1から実施の形態7
の音声符号化装置及び音声復号化装置の適用例として
は、ディジタル携帯電話の移動局装置や基地局装置であ
るが、特に広帯域音声信号を対象とした符号化処理の過
程で損失する可能性がある高周波帯域信号を復号する無
線機器にも勿論適用できる。
【0114】また、上記実施の形態1から実施の形態7
に係る音声符号化装置又は音声復号化装置の機能をプロ
グラム化することで、コンピュータを用いた音声符号化
装置又は音声復号化装置に適用することができる。この
場合、コンピュータを、上記音声符号化装置又は音声復
号化装置の各手段として機能させるためのプログラムを
記録媒体に記憶させることで実現可能である。記録媒体
としては、磁気記録媒体、光磁気記録媒体、半導体、光
記録媒体等が挙げられる。
【0115】
【発明の効果】以上のように本発明によれば、符復号化
処理において減衰する周波数帯域の信号を復元すること
ができ復号音声品質の向上を図るという効果が得られ
る。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声符号化装置及
び音声復号化装置の構成を示すブロック図
【図2】実施の形態1に係る音声符号化装置の差分スペ
クトル量子化器の構成を示すブロック図
【図3】実施の形態1に係る音声符号化装置において量
子化対象となる振幅スペクトル算出を説明するための図
【図4】実施の形態1に係る音声符号化装置において量
子化対象となる振幅スペクトル算出を説明するための図
【図5】本発明の実施の形態2に係る音声符号化装置及
び音声復号化装置の構成を示すブロック図
【図6】実施の形態2に係る音声符号化装置の残差量子
化器の構成を示すブロック図
【図7】本発明の実施の形態3に係る音声符号化装置の
残差量子化器の構成を示すブロック図
【図8】本発明の実施の形態4に係る音声符号化装置及
び音声復号化装置の構成を示すブロック図
【図9】実施の形態4に係る音声復号化装置の雑音生成
器の構成を示すブロック図
【図10】図9の雑音生成器を構成する雑音ゲイン算出
器の構成を示すブロック図
【図11】本発明の実施の形態5に係る音声復号化装置
の雑音生成器の構成を示すブロック図
【図12】実施の形態5に係る音声復号化装置の動作を
説明するための図
【図13】本発明の実施の形態6に係る音声符号化装置
及び音声復号化装置の構成を示すブロック図
【図14】実施の形態6に係る音声復号化装置の条件付
加算器の構成を示すブロック図
【図15】本発明の実施の形態7に係る音声符号化装置
及び音声復号化装置の構成を示すブロック図
【図16】実施の形態7に係る音声復号化装置の雑音生
成器の構成を示すブロック図
【図17】従来の音声符号化装置及び音声復号化装置の
構成を示すブロック図
【符号の説明】
1 線形予測分析器 2 逆フィルタ 3、5 振幅スペクトル算出器 4 音源生成器 6 合成フィルタ 7 誤差算出器 8 音源符号記憶器 9 差分スペクトル算出器 10 差分スペクトル量子化器 11 多重化器 12 逆多重化器 13 音源再生器 14 雑音生成器 15 加算器 16 合成フィルタ 17 平均振幅値算出器 18 量子化器 20 減算器 21、25 残差量子化器 22 多重化器 23 周波数ろ波器 24 ろ波信号量子化器 26 周波数ろ波器 27 パワー比量子化器 30 雑音ゲイン算出器 31 基本雑音生成器 32 雑音整形器 33 帯域分割器 34 音源パワー分布推定器 35 雑音ゲイン推定器 40、56 雑音生成器 41 音源信号線形予測分析器 42 逆フィルタ 50 有音/無音判定器 51 条件付加算器 52 パワー制御器 53 平滑化加算器 55 雑音パワー推定器 57 半波整流器 120、140、160、180、200 音声符号化
装置 130、150、170、190、210 音声復号化
装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 1/253 G10L 9/18 B

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号を線形予測分析する
    線形予測分析手段と、入力された音声信号に対して前記
    線形予測分析手段の分析により得られた線形予測フィル
    タ係数に基づいた逆フィルタリングをする逆フィルタ
    と、前記逆フィルタによって得られた残差の周波数特性
    を分析する振幅スペクトル算出手段と、生成可能な音源
    信号を生成する音源生成手段と、前記音源生成手段で生
    成された音源の周波数特性を分析する振幅スペクトル算
    出手段と、前記音源生成手段にて生成された音源に対し
    て前記線形予測フィルタ係数に基づいたフィルタリング
    をする合成フィルタ手段と、前記合成フィルタ手段によ
    り得られた合成信号の前記入力音声信号に対する誤差を
    算出する誤差算出手段と、前記誤差算出手段にて算出さ
    れた誤差が最小となる音源信号を生成する符号群を記憶
    する音源符号記憶手段と、前記誤差算出手段にて算出さ
    れた誤差が最小となるときの残差と前記音源信号の周波
    数特性との差を求める差分スペクトル算出手段と、前記
    差分スペクトル算出手段にて算出された差分スペクトル
    を量子化する差分スペクトル量子化手段と、前記音源符
    号と前記線形予測フィルタ係数と前記差分スペクトルを
    多重化して通信路へ送出する多重化手段と、を具備する
    ことを特徴とする音声符号化装置。
  2. 【請求項2】 通信路から受信した多重化信号のビット
    列を、復号化に用いるモデルに対応するパラメータの符
    号群へ分割する逆多重化手段と、受信符号から音源信号
    を再生する音源再生手段と、量子化された差分スペクト
    ルを実現する雑音信号を生成する雑音生成手段と、前記
    音源再生手段で再生された音源信号と前記雑音生成手段
    で生成された雑音信号を加算する加算手段と、受信符号
    を復号して得られる線形予測フィルタ係数を用いて前記
    加算手段で加算された信号に対してフィルタリングする
    合成フィルタ手段と、を具備することを特徴とする音声
    復号化装置。
  3. 【請求項3】 差分スペクトル量子化手段は、差分スペ
    クトルを幾つかの帯域に分割し帯域毎の平均振幅値を算
    出する平均振幅値算出手段と、前記平均振幅値算出手段
    で算出された振幅値を量子化する量子化手段と、を具備
    することを特徴とする請求項1記載の音声符号化装置。
  4. 【請求項4】 差分スペクトル量子化手段は、差分スペ
    クトルに対して最尤スペクトル推定する最尤スペクトル
    推定手段と、前記最尤スペクトル推定手段にて推定され
    た最尤スペクトルを量子化する量子化手段と、を具備す
    ることを特徴とする請求項1記載の音声符号化装置。
  5. 【請求項5】 入力された音声信号を線形予測分析する
    線形予測分析手段と、入力された音声信号に対して分析
    により得られた線形予測フィルタ係数に基づき逆フィル
    タリングをすることで残差信号を得る逆フィルタ手段
    と、生成可能な音源信号を生成する音源生成手段と、前
    記音源生成手段で生成された音源信号に対して前記線形
    予測フィルタ係数に基づいたフィルタリングをする合成
    フィルタ手段と、前記合成フィルタ手段により得られた
    合成信号の前記入力音声信号に対する誤差を算出する誤
    差算出手段と、前記誤差算出手段で算出された誤差が最
    小となる音源信号を生成する符号群を記憶する音源符号
    記憶手段と、前記誤差算出手段で算出された誤差が最小
    となるときの残差信号と前記音源生成手段で生成された
    音源信号の差信号を求める減算手段と、前記減算手段で
    得られた差信号の振幅スペクトルの概形を量子化する残
    差量子化手段と、前記線形予測フィルタ係数と前記音源
    符号と前記差信号情報を多重化して通信路へ送出する多
    重化手段と、を具備することを特徴とする音声符号化装
    置。
  6. 【請求項6】 通信路から受信した多重化信号のビット
    列を、復号化に用いるモデルに対応するパラメータの符
    号群へ分割する逆多重化手段と、前記逆多重化手段から
    の受信符号から音源信号を再生する音源再生手段と、前
    記差信号情報に基づいて雑音信号を生成する雑音生成手
    段と、前記音源再生手段で生成された音源信号と前記雑
    音生成手段で生成された雑音信号を加算する加算手段
    と、受信符号を復号して得られる線形予測フィルタ係数
    を用いて前記加算手段で加算された信号に対してフィル
    タリングする合成フィルタ手段と、を具備することを特
    徴とする音声復号化装置。
  7. 【請求項7】 残差量子化手段は、差信号に対して帯域
    通過フィルタリングする周波数ろ波手段と、前記周波数
    ろ波手段でフィルタリングされた信号の振幅スペクトル
    の概形を量子化するろ波信号量子化手段と、を具備する
    ことを特徴とする請求項5記載の音声符号化装置。
  8. 【請求項8】 残差量子化手段は、差信号に対して帯域
    通過フィルタリングする周波数ろ波手段と、前記周波数
    ろ波手段でフィルタリングされた信号が占めるパワー比
    を量子化するパワー比量子化手段と、を具備することを
    特徴とする請求項5記載の音声符号化装置。
  9. 【請求項9】 入力された音声信号を線形予測分析する
    線形予測分析手段と、生成可能な音源信号を生成する音
    源生成手段と、前記音源生成手段で生成された音源信号
    に対して前記線形予測分析手段の分析により得られた線
    形予測フィルタ係数に基づいたフィルタリングをする合
    成フィルタ手段と、前記合成フィルタ手段により得られ
    た合成信号の前記入力音声信号に対する誤差を算出する
    誤差算出手段と、前記誤差算出手段で算出された誤差が
    最小となる音源信号を生成する符号群を記憶する音源符
    号記憶手段と、前記線形予測フィルタ係数と前記音源符
    号記憶手段に記憶された音源符号を多重化して通信路へ
    送出する多重化手段と、を具備することを特徴とする音
    声符号化装置。
  10. 【請求項10】 通信路から受信した多重化信号のビッ
    ト列を、復号化に用いるモデルに対応するパラメータの
    符号群へ分割する逆多重化手段と、前記逆多重化手段か
    らの受信符号から音源信号を再生する音源再生手段と、
    加算することで前記音源信号が平坦な振幅スペクトル特
    性となるような雑音を生成する雑音生成手段と、前記音
    源再生手段で生成された音源信号と前記雑音生成手段で
    生成された雑音信号を加算する加算手段と、受信符号を
    復号して得られる線形予測フィルタ係数を用いて前記加
    算手段で加算された信号に対してフィルタリングする合
    成フィルタ手段と、を具備することを特徴とする音声復
    号化装置。
  11. 【請求項11】 雑音生成手段は、音源信号のパワーか
    ら付加する雑音のゲインを推定する雑音ゲイン算出手段
    と、前記雑音ゲイン算出手段で算出されたゲインの雑音
    を生成する基本雑音生成手段と、前記基本雑音生成手段
    で生成された雑音を予め定められた周波数特性に整形す
    る雑音整形手段と、を具備することを特徴とする請求項
    10記載の音声復号化装置。
  12. 【請求項12】 雑音ゲイン算出手段は、音源信号を帯
    域通過フィルタによって所望する周波数帯域の信号にろ
    波する帯域分割手段と、前記帯域分割手段で音源信号に
    対してろ波された帯域の信号のパワーが占める割合を算
    出する音源パワー分布推定手段と、音源再生手段で生成
    された音源信号のパワーと前記音源パワー分布推定手段
    で算出されたパワー比より、生成する雑音のゲインを推
    定する雑音ゲイン推定手段と、を具備することを特徴と
    する請求項11記載の音声復号化装置。
  13. 【請求項13】 雑音生成手段は、音源信号を線形予測
    分析する音源信号線形予測分析手段と、音源再生手段で
    生成された音源信号のパワーにより、付加する雑音のゲ
    インを推定する雑音ゲイン算出手段と、前記雑音ゲイン
    算出手段で算出されたゲインの雑音を生成する基本雑音
    生成手段と、前記基本雑音生成手段で生成された雑音に
    対して分析により得られた線形予測係数を用いて逆フィ
    ルタリングする逆フィルタ手段と、を具備することを特
    徴とする請求項11記載の音声復号化装置。
  14. 【請求項14】 入力された音声信号を線形予測分析す
    る線形予測分析手段と、生成可能な音源信号を生成する
    音源生成手段と、前記音源生成手段で生成された音源信
    号に対して前記線形予測分析手段の分析により得られた
    線形予測フィルタ係数に基づいたフィルタリングをする
    合成フィルタ手段と、前記合成フィルタ手段により得ら
    れた合成信号の前記入力音声信号に対する誤差を算出す
    る誤差算出手段と、前記誤差算出手段で算出された誤差
    が最小となる音源信号を生成する符号群を記憶する音源
    符号記憶手段と、前記線形予測フィルタ係数と前記音源
    符号記憶手段に記憶された音源符号を多重化して通信路
    へ送出する多重化手段と、を具備することを特徴とする
    音声符号化装置。
  15. 【請求項15】 通信路から受信した多重化信号のビッ
    ト列を、復号化に用いるモデルに対応するパラメータの
    符号群へ分割する逆多重化手段と、前記逆多重化手段か
    らの受信符号から音源信号を再生する音源再生手段と、
    前記音源再生手段で復号された音声より、処理中の信号
    が有音であるか無音であるかを判定する有音/無音判定
    手段と、加算することで音源信号が平坦な振幅スペクト
    ル特性となるような雑音を生成する雑音生成手段と、前
    記音源再生手段で生成された音源信号に対して無音時の
    み前記雑音生成手段で生成された雑音信号を加算する条
    件付加算手段と、受信符号を復号して得られる線形予測
    フィルタ係数を用いて前記条件付加算手段で加算された
    信号に対してフィルタリングする合成フィルタ手段と、
    を具備することを特徴とする音声復号化装置。
  16. 【請求項16】 条件付加算手段は、加算する雑音のパ
    ワーを制御するパワー制御手段と、音源信号にパワーを
    制御しつつ雑音信号を加算する平滑化加算手段と、を具
    備することを特徴とする請求項15記載の音声復号化装
    置。
  17. 【請求項17】 入力された音声信号を線形予測分析す
    る線形予測分析手段と、生成可能な音源信号を生成する
    音源生成手段と、前記音源生成手段で生成された音源信
    号に対して前記線形予測分析手段の分析により得られた
    線形予測フィルタ係数に基づいたフィルタリングをする
    合成フィルタ手段と、前記合成フィルタ手段により得ら
    れた合成信号の前記入力音声信号に対する誤差を算出す
    る誤差算出手段と、前記誤差算出手段で算出された誤差
    が最小となる音源信号を生成する符号群を記憶する音源
    符号記憶手段と、前記線形予測フィルタ係数と前記音源
    符号記憶手段からの音源符号を多重化して通信路へ送出
    する多重化手段と、を具備することを特徴とする音声符
    号化装置。
  18. 【請求項18】 通信路から受信した多重化信号のビッ
    ト列を、復号化に用いるモデルに対応するパラメータの
    符号群へ分割する逆多重化手段と、前記逆多重化手段か
    らの受信符号から音源信号を再生する音源再生手段と、
    前記音源再生手段で復号された音声より、処理中の信号
    が有音であるか無音であるかを判定する有音/無音判定
    手段と、前記音声が無音で減衰している信号の大きさを
    音源信号から推定する雑音パワー推定手段と、予め定め
    られた周波数特性を有する雑音を前記雑音パワー推定手
    段で推定されたパワーをもとに生成する雑音生成手段
    と、前記音源再生手段で生成された音源信号に対して前
    記雑音生成手段で生成された雑音信号を加算する加算手
    段と、受信符号を復号して得られる線形予測フィルタ係
    数を用いて前記条件付加算手段で加算された信号に対し
    てフィルタリングする合成フィルタ手段と、を具備する
    ことを特徴とする音声復号化装置。
  19. 【請求項19】 雑音生成手段は、音源信号を半波整流
    することで周波数帯域を拡張した信号を雑音として生成
    する半波整流手段を具備することを特徴とする請求項
    2、請求項6、請求項10、請求項11、請求項12、
    請求項13、請求項15、請求項16又は請求項18の
    いずれかに記載の音声復号化装置。
  20. 【請求項20】 請求項1、請求項3、請求項4、請求
    項5、請求項7、請求項8、請求項9、請求項14又は
    請求項17のいずれかに記載の音声符号化装置と、請求
    項2、請求項6、請求項10、請求項11、請求項1
    2、請求項13、請求項15、請求項16、請求項18
    又は請求項19のいずれかに記載の音声復号化装置と、
    を具備することを特徴とする移動局装置。
  21. 【請求項21】 請求項1、請求項3、請求項4、請求
    項5、請求項7、請求項8、請求項9、請求項14又は
    請求項17のいずれかに記載の音声符号化装置と、請求
    項2、請求項6、請求項10、請求項11、請求項1
    2、請求項13、請求項15、請求項16、請求項18
    又は請求項19のいずれかに記載の音声復号化装置と、
    を具備することを特徴とする基地局装置。
  22. 【請求項22】 コンピュータを、請求項1、請求項
    3、請求項4、請求項5、請求項7、請求項8、請求項
    9、請求項14又は請求項17のいずれかに記載の音声
    符号化装置の各手段として機能させるためのプログラム
    を記憶したことを特徴とする記録媒体。
  23. 【請求項23】 コンピュータを、請求項2、請求項
    6、請求項10、請求項11、請求項12、請求項1
    3、請求項15、請求項16、請求項18又は請求項1
    9のいずれかに記載の音声復号化装置の各手段として機
    能させるためのプログラムを記憶したことを特徴とする
    記録媒体。
JP2000345720A 2000-11-13 2000-11-13 音声符号化装置及び音声復号化装置 Pending JP2002149198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000345720A JP2002149198A (ja) 2000-11-13 2000-11-13 音声符号化装置及び音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000345720A JP2002149198A (ja) 2000-11-13 2000-11-13 音声符号化装置及び音声復号化装置

Publications (1)

Publication Number Publication Date
JP2002149198A true JP2002149198A (ja) 2002-05-24

Family

ID=18819699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000345720A Pending JP2002149198A (ja) 2000-11-13 2000-11-13 音声符号化装置及び音声復号化装置

Country Status (1)

Country Link
JP (1) JP2002149198A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006349848A (ja) * 2005-06-14 2006-12-28 Oki Electric Ind Co Ltd 帯域拡張装置及び不足帯域信号生成器
KR100788706B1 (ko) 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
JP2008015356A (ja) * 2006-07-07 2008-01-24 Toshiba Corp 復号装置およびスペクトル整形方法
JP2011033717A (ja) * 2009-07-30 2011-02-17 Secom Co Ltd 雑音抑圧装置
JP2013228459A (ja) * 2012-04-24 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> 音声聴取装置とその方法とプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006349848A (ja) * 2005-06-14 2006-12-28 Oki Electric Ind Co Ltd 帯域拡張装置及び不足帯域信号生成器
JP4604864B2 (ja) * 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
JP2008015356A (ja) * 2006-07-07 2008-01-24 Toshiba Corp 復号装置およびスペクトル整形方法
KR100788706B1 (ko) 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
WO2008066268A1 (en) * 2006-11-28 2008-06-05 Samsung Electronics Co, . Ltd. Method, apparatus, and system for encoding and decoding broadband voice signal
US8271270B2 (en) 2006-11-28 2012-09-18 Samsung Electronics Co., Ltd. Method, apparatus and system for encoding and decoding broadband voice signal
JP2011033717A (ja) * 2009-07-30 2011-02-17 Secom Co Ltd 雑音抑圧装置
JP2013228459A (ja) * 2012-04-24 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> 音声聴取装置とその方法とプログラム

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP5226777B2 (ja) 音声信号中に埋め込まれた隠れデータの回復
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
KR100882771B1 (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP4176349B2 (ja) マルチモードの音声符号器
JP4777918B2 (ja) 音声処理装置及び音声を処理する方法
JP2009530685A (ja) Mdct係数を使用する音声後処理
JP2006011464A (ja) 紛失フレームを取扱うための音声符号化装置および方法
JP4296753B2 (ja) 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP2008058667A (ja) 信号処理装置および方法、記録媒体、並びにプログラム
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
JPH1028057A (ja) オーディオ復号化装置及びオーディオ符号化復号化システム
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JPWO2006059567A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
JP4963965B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
US7606702B2 (en) Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
JP3270922B2 (ja) 符号化,復号化方法及び符号化,復号化装置
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2002149198A (ja) 音声符号化装置及び音声復号化装置
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4558734B2 (ja) 信号復号化装置
JP4099879B2 (ja) 帯域幅拡張方法及び装置
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法