Nothing Special   »   [go: up one dir, main page]

JPH02146100A - 音声符号化・復号化装置 - Google Patents

音声符号化・復号化装置

Info

Publication number
JPH02146100A
JPH02146100A JP63299822A JP29982288A JPH02146100A JP H02146100 A JPH02146100 A JP H02146100A JP 63299822 A JP63299822 A JP 63299822A JP 29982288 A JP29982288 A JP 29982288A JP H02146100 A JPH02146100 A JP H02146100A
Authority
JP
Japan
Prior art keywords
voiced sound
sound
voiced
voice
transient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63299822A
Other languages
English (en)
Other versions
JP2797348B2 (ja
Inventor
Shigeru Hosoi
茂 細井
Yoshio Sato
佐藤 好男
Koichi Honma
光一 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63299822A priority Critical patent/JP2797348B2/ja
Publication of JPH02146100A publication Critical patent/JPH02146100A/ja
Application granted granted Critical
Publication of JP2797348B2 publication Critical patent/JP2797348B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明はディジタル通信、ボイスメール等に利用する音
声符号化装置と音声復号化装置に関する。
従来の技術 第6図(a)は、従来の音声符号化装置を示し、第6図
(b)は、従来の音声復号化装置を示す。
第6図(a)において、14は、リニアPCMによりA
/D変換された音声信号により予測誤差と短期/長期予
測フィルタ係数を求める予測器、15は、第7図に示す
ように、一定長の複数の信号列(代表ベクトル)が予め
格納されたコードブック15aと、予測器14からの予
測誤差をベクトル量子化して代表ベクトルの番号を出力
するベクトル量子化器15bを備えた量子化器、16は
、予測器14からの短期/長期予測フィルタ係数の量子
化値と、量子化器15からの代表ベクトルの番号を多重
化する多重化器である。
第6図(b)において、17は、上記符号器からの短期
予測フィルタ係数及び長期予測フィルタ係数と、代表ベ
クトルの番号を分離する分離器、18は、符号器のコー
ドブック15aと同一のコードブック(不図示)を備え
、分離器17からの番号に対応する代表ベクトルを予測
誤差として出力する逆量子化器、19は、短期予測フィ
ルタ係数及び長期予測フィルタ係数と逆量子化器18か
らの代表ベクトルにより音声信号を合成する合成器であ
る。
次に、上記従来例の動作を説明する。
第6図(a)において、リニアPCMによりA/D変換
された音声信号が入力すると、予測器14では、音声信
号の近接サンプル値間の相関を除去するために短期予測
フィルタ係数を求め、この短期予測フィルタ係数により
短期予測誤差を求める。
更に、音声信号の音源ピンチの周期的な相関を除去する
ために、短期予測誤差により長期予測フィルタ係数を求
め、この長期予測フィルタ係数により予測誤差を求める
量子化器15では、この予測誤差の信号列とコードブッ
ク15aの各代表ベクトルの2乗距離を計算し、その値
が最も小さい代表ベクトルの番号を量子化値として出力
する。
しだがって、多重化器16からは、音声信号が短期予測
フィルタ係数及び長期予測フィルタ係数と、代表ベクト
ルの番号に圧縮されたデータとして復号器に送出される
第6図(b)において、合成器19は、符号器の予測器
14のフィルタと逆特性のフィルタを備えており、した
がって、符号器からの短期/長期予測フィルタ係数に応
じたフィルタにより代表ベクトルを音声信号に復号する
ことができる。
発明が解決しようとする課題 しかしながら、上記従来の音声符号化装置と音声復号化
装置では、有声音、無声音、無音等の音声の特性にかか
わらず同じ処理を行うので、低ビツトレートで音声符号
化する場合、音声の特性に応じて符号化しないので、復
号された音声の品質が良好でなく、符号化効率を向上す
ることができないという問題点がある。
本発明はこのような問題点を解決するものであり、符号
化効率を向上することができる音声符号化装置と音声復
号化装置を提供することを目的とする。
課題を解決するための手段 本発明の音声符号化装置は、上記目的を達成するために
、音声信号を有声音定常部と、有声音過渡部と無声音等
に分類し、有声音定常部を時間軸上に圧縮し、有声音過
渡部と、圧縮された有声音定常部の予測誤差を出力し、
無声音等と、有声音定常部と有声音過渡部の予測誤差を
量子化するようにしだものである。
また、本発明の音声復号化装置は、上記目的を達成する
だめに、無声音等と、有声音定常部と有声音過渡部の量
子化値を逆量子化し、この逆量子化された有声音定常部
と有声音過渡部を音声信号に合成し、この合成された有
声音定常部を時間軸上で伸張するようにしたものである
作用 本発明は上記構成により、有声音、無声音、無音等の音
声の特性に応じて量子化することができるので、復号さ
れた音声の品質が良好となり、また、符号化効率を向上
することができる。
実施例 以下、図面を参照して本発明の詳細な説明する。第1図
(a)は、本発明に係る音声符号化装置の一実施例を示
すブロック図、第1図(b)は、本発明に係る音声復号
化装置の一実施例を示すブロック図、第2図は、第1図
(a)の予測器を示す詳細なフロック図、第3図は、第
1図(a)の量子化器を示す詳細なブロック図、第4図
は、一般的な音声信号の波形図、第5図は、第1図(a
)の分類器の動作を説明するためのフローチャートであ
る。
第1図(a)において、1は、後述するように、入力し
た音声信号の特性を分析し、有声音定常部、有声音過渡
部、無声音、無音に分類する分類器、2は、分類器2か
らの判定データにより音声信号の有声音定常部の類似波
形を間引き、時間軸上で圧縮する時間軸圧縮器である。
3は、音声信号の有声音により、その予測誤差と短期/
長期予測フィルタ係数を求める予測器であり、予測器3
は、第2図に示すように、有声音により短期予測誤差を
求めるだめの短期予測フィルタ21と、有声音の近接サ
ンプル値間の相関を除去するために短期予測フィルタ2
1の短期予測フィルタ係数を求める短期予測分析器22
と、短期予測フィルタ21からの短期予測誤差により予
測誤差を求めるだめの長期予測フィルタ23と、有声音
の音源ピッチの周期的な相関を除去するために、短期予
測誤差により長期予測フィルタ23の長期予測フィルタ
係数を求める長期予測分析器(ピッチ予測器)24と、
短期予測フ(ルタ係数と長期予測フィルタ係数をそれぞ
れ量子化する量子化器25より構成されている。
4は、予測器3からの予測誤差を例えばベクトル量子化
する量子化器であり、量子化器4は、第3図に示すよう
に、有声音定常部用、有声音過渡部用、無声音用、無音
用の代表ベクトルがそれぞれ格納されたコードブック3
1〜34と、分類器1により分類された音声信号の判定
データによりコードブック31〜34の1つを選択し、
予測器3からの予測誤差の信号列と当該コードブックの
各代表ベクトルの2乗距離を計算し、その値が最も小さ
い代表ベクトルの番号を量子化値として出力するベクト
ル量子化器35より構成されている。
5は、分類器1により分類された音声信号の判定データ
と、予測器3からの短期/長期予測フィルタ係数の量子
化値と、量子化器4からの代表ベクトルの番号を多重化
する多重化器、10.11はそれぞれ、分類器1により
分類された音声の特性に応じて切り替えられるスイッチ
である。
第1図(b)において、符号化装置からの伝送データを
音声信号の判定データと、短期/長期予測フィルタ係数
の量子化値と代表ベクトルの番号に分離する分離器、7
は、符号器のコードブ7り31〜34と同一のコードブ
ック(不図示)を備え、分離器6からの音声信号の判定
データにより、当該コードブックを選択し、分離器6か
らの番号に対応する代表ベクトルを予測誤差として出力
する逆量子化器、8は、短期予測フィルタ係数及び長期
予測フィルタ係数と逆量子化器8からの代表ベクトルに
より、音声信号の有声音を合成する合成器、9は、音声
信号の有声音定常部を時間軸上で伸張する時間軸伸張器
、12.13はそれぞれ、分離器6からの音声信号の判
定データに応じて切り替えられるスイッチである0 次に、上記実施例の動作を説明する。
第1図(a)において、リニアPCMによりA/D変換
された音声信号は、一定の時間長(フレーム)毎に符号
化装置に入力する。
音声信号(アナログ信号)は、第4図に示すように、無
音と、音声の始まりである比較的長い無声音と、無声音
と有声音定常部の間に続く比較的短い有声音過渡部と、
有声音定常部より構成されている。
この音声信号においては、(1)有声音定常部は、類似
した波形が連続して周期性を示し、サンプル間、ピッチ
周期間で相関が強いという特性があり、(2)有声音過
渡部は、類似波形は連続しないが、サンプル間、ピンチ
周期間で相関が強いという特性があり、(3)無声音は
、サンプル間、ピッチ周期間で相関が弱く、信号の変化
が激しいという特性があり、(4)無音は、信号の振幅
が小さいという特性がある。
このような音声信号が入力すると、分類器1は、第5図
に示すように、1フレーム内の波形のパワーPwを計算
しくステップ51)、パワーPwが閾値以上か否かを判
別する(ステップ52)。パワーPwが閾値未満の場合
には、そのフレームを無音と判別しくステップ53)、
閾値以上の場合には有音と判定してステップ54以下に
進む。
ステップ55では、1フレーム内の波形の自己相関係数
r (i)を計算し、計算した自己相関係数r(i)に
より、指定されたiにおける最大値rmaxを求め(ス
テップ56)、この最大値rmaxが閾値以上か否かを
判別する(ステップ57)。最大値rmaxが閾値未満
の場合には、そのフレームを無声音部と判別しくステッ
プ58)、閾値以上の場合には有声音と判定してステッ
プ59以下に進む。
ステップ60では、前のフレームが有声音か否かを判定
し、NOの場合にはそのフレームを有声音過渡部と判定
しくステップ61)、YESの場合にはステップ62以
下に進む。
ステップ62では、自己相関係数r (i)によりピッ
チ周期Pnを計算し、前のフレームのピッチ周期Pn−
1との変化率ρを計算しくステップ63)、変化率ρが
閾値以上か否かを判別する(ステップ64)。変化率ρ
が閾値未満の場合には、そのフレームを有声音定常部と
判定し、閾値以上の場合には有声音過渡部と判定する。
分類器1は、この音声信号の4種類の特性に応じて、例
えば2ビツトの判定データをスイッチ、10.11、量
子化器4、多重化器5に出力する。
有声音定常部と判定されたフレームにおいては、スイッ
チ10は時間軸圧縮器2側に切り替わり、有声音と判定
したフレームにおいては、スイッチ11は予測器3側に
切り替わる。
しだがって、音声信号の無音と無声音は直接量子化器4
に入力してそれぞれ無音用コードブック34、無声音用
コードブック33の代表ベクトルの番号に量子化され、
有声音過渡部は予測器3を介して量子化器4に入力して
有声音過渡部用コードブック32の代表ベクトルの番号
に量子化され、有声音定常部は時間軸圧縮器2により圧
縮された後予測器3を介して量子化器4に入力して有声
音定常部用コードブック310代表ベクトルの番号に量
子化される。
ここで、無音と無声音を符号化する場合には、予測器3
を用いないので、予測フィルタ係数等に割り当てられた
ビットを量子化器4のピントに割り当て、伝送されるビ
ット数を一定にする。
音声信号の判定データは、予測フィルタ係数と代表ベク
トルの番号とともに復号器に伝送されるので、復号化装
置は元の音声信号に復号することができ、また、有声音
、無声音、無音等の特性に応じて量子化された値を復号
するので、復号された音声の品質が良好となる。
発明の詳細 な説明したように、本発明の音声符号化装置は、音声信
号を有声音定常部と、有声音過渡部と無声音等に分類し
、有声音定常部を時間軸上に圧縮し、有声音過渡部と、
圧縮された有声音定常部の予測誤差を出力し、無声音等
と、有声音定常部と有声音過渡部の予測誤差を量子化す
るようにし、また、本発明の音声復号化装置は、無声音
等と、有声音定常部と有声音過渡部の量子化値を逆量子
化し、この逆量子化された有声音定常部と有声音過渡部
を音声信号に合成し、この合成された有声音定常部を時
間軸上で伸張するようにしたので、有声音、無声音、無
音等の音声の特性に応じて量子化することができるので
、復号された音声の品質が良好となり、また、符号化効
率を向上することができる。
【図面の簡単な説明】
第1図(a)は、本発明に係る音声符号化装置の一実施
例を示すブロック図、第1図(b)は、本発明に係る音
声復号化装置の一実施例を示すブロック図、第2図は、
第1図(a)の予測器を示す詳細なブロック図、第3図
は、第1図(a)の量子化器を示す詳細なブロック図、
第4図は、一般的な音声信号の波形図、第5図は、第1
図(a)の分類器の動作を説明するだめのフローチャー
ト、第6図(a)は、従来の音声符号化装置を示すブロ
ック図、第6図(b)は、従来の音声復号化装置を示す
ブロック図、第7図は、第6図(a)の量子化器を示す
詳細なブロック図である。 1・・・分類器、2・・時間軸圧縮器、3・・・予測器
、4・・・量子化器、5・・・多重化器、6・分離器、
7・・・逆量子化器、8・・・合成器、9・・・時間軸
伸張器、31・・有声音定常部用コードブック、32・
・有声音過渡部用コードブック、33・・・無声音用コ
ードブック、34・・無音用コードブック。 代理人の氏名 弁理士 粟野重孝 ほか1名−へ ■ 4N1犀剖 ■ 塙P魯慰這郡 ■ ν盾 ■ 熱盾 第 図

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号を有声音定常部と、有声音過渡部と無声
    音等に分類する手段と、前記分類手段により分類された
    音声信号の有声音定常部を時間軸上に圧縮する手段と、
    前記分類手段により分類された音声信号の有声音過渡部
    と、前記圧縮手段により圧縮された有声音定常部の予測
    誤差を出力する手段と、前記分類手段により分類された
    音声信号の無声音等と、前記有声音定常部と有声音過渡
    部の予測誤差を量子化する手段とを有する音声符号化装
    置。
  2. (2)量子化手段は、有声音定常部と、有声音過渡部と
    無声音等用の代表ベクトルが格納されたコードブックを
    備え、有声音定常部と、有声音過渡部と無声音等を前記
    コードブックによりベクトル量子化して代表ベクトルの
    番号を出力することを特徴とする請求項(1)記載の音
    声符号化装置。
  3. (3)無声音等と、有声音定常部と有声音過渡部の量子
    化値を逆量子化する手段と、前記逆量子化された有声音
    定常部と有声音過渡部を音声信号に合成する手段と、前
    記合成された有声音定常部を時間軸上で伸張する手段と
    を有する音声復号化装置。
JP63299822A 1988-11-28 1988-11-28 音声符号化・復号化装置 Expired - Fee Related JP2797348B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63299822A JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63299822A JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Publications (2)

Publication Number Publication Date
JPH02146100A true JPH02146100A (ja) 1990-06-05
JP2797348B2 JP2797348B2 (ja) 1998-09-17

Family

ID=17877341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63299822A Expired - Fee Related JP2797348B2 (ja) 1988-11-28 1988-11-28 音声符号化・復号化装置

Country Status (1)

Country Link
JP (1) JP2797348B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0563580A (ja) * 1991-09-02 1993-03-12 Mitsubishi Electric Corp 音声信号処理方法
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
JP2002311980A (ja) * 2001-04-18 2002-10-25 Nec Corp 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5511616A (en) * 1978-07-10 1980-01-26 Nippon Telegr & Teleph Corp <Ntt> Transmission system for redundancy-eliminated pcm voice
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPS6359127A (ja) * 1986-08-29 1988-03-15 Fujitsu Ltd 音声符号化方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5511616A (en) * 1978-07-10 1980-01-26 Nippon Telegr & Teleph Corp <Ntt> Transmission system for redundancy-eliminated pcm voice
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
JPS6359127A (ja) * 1986-08-29 1988-03-15 Fujitsu Ltd 音声符号化方式

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0563580A (ja) * 1991-09-02 1993-03-12 Mitsubishi Electric Corp 音声信号処理方法
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
JP2002311980A (ja) * 2001-04-18 2002-10-25 Nec Corp 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム

Also Published As

Publication number Publication date
JP2797348B2 (ja) 1998-09-17

Similar Documents

Publication Publication Date Title
JP4731775B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
KR100873836B1 (ko) Celp 트랜스코딩
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
JP2011237809A (ja) フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ
KR20080083718A (ko) 부호화 모델 선택
JP2006525533A (ja) 可変ビットレート広帯域通話符号化における利得量子化方法および装置
JP4874464B2 (ja) 遷移音声フレームのマルチパルス補間的符号化
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
EP1096476A2 (en) Speech decoding gain control for noisy signals
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
JP2797348B2 (ja) 音声符号化・復号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2558876B2 (ja) 音声符号化装置
Ojala et al. Variable model order LPC quantization
JP2581050B2 (ja) 音声分析合成装置
JP3330178B2 (ja) 音声符号化装置および音声復号化装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JPH01258000A (ja) 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置
JPH0458299A (ja) 音声符号化装置
JPS6019520B2 (ja) 音声処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees