JP2004020675A - 音声符号化/復号化方法及び音声符号化/復号化装置 - Google Patents
音声符号化/復号化方法及び音声符号化/復号化装置 Download PDFInfo
- Publication number
- JP2004020675A JP2004020675A JP2002172264A JP2002172264A JP2004020675A JP 2004020675 A JP2004020675 A JP 2004020675A JP 2002172264 A JP2002172264 A JP 2002172264A JP 2002172264 A JP2002172264 A JP 2002172264A JP 2004020675 A JP2004020675 A JP 2004020675A
- Authority
- JP
- Japan
- Prior art keywords
- fixed code
- code vector
- fixed
- adaptive
- subframe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】従来の音声符号化方法では、演算量の増加や再生音声品質劣化という問題点があったが、本発明は、演算量を増加することなく、再生音声品質劣化を極力抑え、ビットレートを軽減できる音声符号化/復号化方法及び音声符号化/復号化装置を提供する。
【解決手段】固定符号帳探索部5において、通常処理サブフレームでは、符号帳処理部11で固定符号帳探索を行って固定符号及び固定符号ベクトルを出力し、代替処理サブフレームでは、バッファ切り出し処理部13が、固定符号ベクトル格納バッファ12に記憶されている過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとして出力する音声符号化/復号化方法及び音声符号化/復号化装置である。
【選択図】 図2
【解決手段】固定符号帳探索部5において、通常処理サブフレームでは、符号帳処理部11で固定符号帳探索を行って固定符号及び固定符号ベクトルを出力し、代替処理サブフレームでは、バッファ切り出し処理部13が、固定符号ベクトル格納バッファ12に記憶されている過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとして出力する音声符号化/復号化方法及び音声符号化/復号化装置である。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、ディジタル移動体通信に用いられるディジタル音声圧縮の為の音声符号化/復号化方法及び音声符号化/復号化装置に係り、特に代数的符号励振予測方式による符号化において、再生音声品質の劣化を極力抑えつつ伝送効率を向上できる音声符号化/復号化方法及び音声符号化/復号化装置に関する。
【0002】
【従来の技術】
現在、世界各国で公衆移動体通信に用いられている音声符号化方式は、代数的符号励振予測方式(Algebraic Code Excitation Linear Prediction:ACELP)を基本方式としたものが主流である。
例として挙げるならば、ヨーロッパの移動電話ディジタル符号化の標準であるGSM(Global System for Mobile)で制定されているディジタル音声符号化方式は、AMR(Adaptive Multi−Rate)はACELPを基本方式としてビットレートを伝送路の状況に合わせて可変させる方式であり、またITU−T(International Telecommunications Union−Telecommunications Standards Sector)で標準化されているG.729も、ACELPを基本方式として利得量子化に共役構造を用いることで伝送路誤りへの耐性および再生音声品質を向上させた方式である。
【0003】
また、米国のディジタル移動電話のEFR(Enhanced Full Rate)もACELPを基本方式としたディジタル音声符号化方式である。
更に、2001年より日本でサービスを開始した第3世代におけるディジタル音声符号化方式もGSMで採用されているAMRを参考に制定された可変ビットレート方式であり基本方式はACELPである。
このように世界的に見て現在公衆移動体通信向けディジタル音声符号化の標準方式として採用されている方式は、そのほとんどがACELPを基本方式としている。
【0004】
ACELPは、フレーム毎に音声信号を分析し、CELPモデルで使用するパラメータである線形予測フィルタ係数(LPC係数)、適応符号帳及び固定符号帳のインデックス、利得を抽出し、これらのパラメータを符号化して送信する。そして、復号器においては、受信した上記パラメータを用いて励振信号や合成フィルタのパラメータを再構築し、励振信号を短期合成フィルタに通すことによって音声を再生し、ポストフィルタを通すことによって音声の品質が改善されるようになっている。短期合成フィルタは線形予測(LP)フィルタを基に構成され、長期すなわちピッチ合成フィルタはいわゆる適応符号帳を用いて実現される。
【0005】
ACELPは、CELPにおけるLPC(Linear Predictive Coding)フィルタを駆動する音源信号として、パルスの組み合わせを用いる方式であり、符号帳と呼ばれるベクトル量子化コードブックを用いる従来のCELP方式と比較して、音源信号の探索に必要な演算量の低減と音声品質の改善が実現されている。
【0006】
ACELPはパルスの組み合わせにより音源信号を表現する方式であるが、以下の点がACELPの特徴である。
(1)パルスの位置は各パルス毎に予め限定して定めてある複数個の候補から最適な一つのパルス位置をパルス毎に探索する。表1に参考としてITU−T標準G.729のパルス位置表を示すが、ITU−T標準G.729では、5msのサブフレームにおけるパルス数が4つで、40サンプルを重複することなくカバーするパルス位置構成を持っている。
【0007】
【表1】
【0008】
(2)パルスの振幅は極性(±)のみを1bitで表現する。これにより送信情報量を低減している。
(3)パルス位置探索は極性を決定した後に、全ての候補に対して総組み合わせ探索を実施し、最小歪みを実現するパルス位置の組み合わせを選択する。
【0009】
G.729の音声品質は、クリーン環境、背景雑音環境および話者依存性等の面で、G.726の適応差分PCM(Adaptive Differential Pulse Code Modulation:ADPCM)と同等以上であることが確認されている。
【0010】
現在、ACELPを低ビットレート化する場合の方法として実施されている手法として、パルス数を削減する方法や、パルス位置候補を間引きするなどの方法が考案されており、これらの方法が4kbps〜8kbpsの方式として採用されている。
【0011】
一例としてG.729AnnexDが挙げられる。このG.729AnnexDは5msのサブフレームにおけるパルス数を2つとして、パルス数の減少による音声品質の劣化に対しては後処理にパルス拡散フィルタを追加することによって補い、6.4kbpsのビットレートを実現している。
また、AMRの低ビットレート方式でも1サブフレームにおけるパルス数を2つとし、かつパルス位置候補を1サンプルおきに配置して最小歪み探索を行うことで5.15kbpsや4.75kbpsを実現している。
【0012】
尚、ACELP方式における音声符号化方法の従来技術としては、平成10年11月24日公開の特開平10−312198号「音声符号化方法」(出願人:日本電信電話株式会社、発明者:林 伸二他)がある。
この従来技術は、雑音成分ベクトルの符号化において、各フレームを構成する2つのサブフレームに対し、雑音符号帳を構成する各雑音ベクトルをサブフレーム毎に3つ以下の単位振幅のパルスで構成し、それらの位置を各サブフレーム内で予め決めた取りうる複数の位置から歪みが最小となるように決める音声符号化方法であり、これにより、音声品質を劣化させずにビットレートを低減できるものである。
【0013】
【発明が解決しようとする課題】
しかしながら、従来の音声符号化方法及び音声符号化装置では、パルス数の減少による音声品質の劣化に対してパルス拡散フィルタを追加すると演算量が増加してしまうという問題点があり、また、パルス位置候補の間引きでは再生音声品質が劣化するという問題点があった。
【0014】
本発明は上記実情に鑑みて為されたもので、演算量を増加することなく、再生音声品質劣化を極力抑え、ビットレートを軽減できるACELP方式における音声符号化方法及び音声符号化装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
上記従来例の問題点を解決するための本発明は、音声符号化方法において、
1フレームを複数のサブフレームで構成する入力音声信号について、フレーム単位で音声信号を分析して線形予測フィルタ係数を求め、入力音声信号と合成された再生音声信号との誤差信号に対して聴覚重み付けした聴覚重み付け誤差を求め、サブフレーム単位で聴覚重み付け誤差を最小化するような適応符号及び固定符号及び適応符号利得及び固定符号利得とを取得して励振信号パラメータとし、フレーム単位の線形予測フィルタ係数とサブフレーム単位の励振信号パラメータとを音声符号化データとすると共に、取得した励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて再生音声信号を合成する代数的符号励振予測方式の音声符号化方法であって、
聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、
フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、
代替処理サブフレームでは、固定符号帳の探索処理は行わず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、代替固定符号ベクトルのパルス数をカウントして、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとし、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する取得制御方法であることを特徴とするものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0016】
上記従来例の問題点を解決するための本発明は、音声復号化方法において、本発明の音声符号化方法で符号化された音声符号化データについて、音声符号化データにおける励振信号パラメータに含まれる適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び励振信号パラメータに含まれる適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて音声信号を再生する音声復号化方法であって、
励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、
代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする取得方法であることを特徴とするものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0017】
上記従来例の問題点を解決するための本発明は、音声符号化装置において、
1フレームを複数のサブフレームで構成する音声信号を入力し、フレーム単位で音声信号を線形予測分析して線形予測フィルタ係数を求める線形予測分析手段と、
音声信号と合成された再生音声信号との誤差信号を求める減算手段と、
誤差信号に聴覚重み付けを行い聴覚重み付け誤差信号を出力する聴覚重み付け手段と、
聴覚重み付け誤差信号を入力し、サブフレーム単位で、聴覚重み付け誤差を最小化するような、適応符号及び固定符号と適応符号利得及び固定符号利得とを取得するための制御を行い、取得された適応符号及び固定符号及び適応符号利得及び固定符号利得を励振信号パラメータとして出力する励振信号パラメータ抽出手段と、
励振信号パラメータ抽出手段の制御に従い、過去の駆動音源信号から聴覚重み付け誤差信号を最小化するようなピッチ周期を検出し、検出されたピッチ周期の情報を適応符号として出力すると共に、ピッチ周期の情報と過去の駆動音源信号から求めた適応符号ベクトルを出力する適応符号ベクトル出力手段と、
励振信号パラメータ抽出手段の制御に従い、聴覚重み付け誤差信号を最小化するような固定符号及び固定符号ベクトルを出力する固定符号ベクトル出力手段と、
励振信号パラメータ抽出手段からの制御に従い、適応符号ベクトルに関する適応符号利得と、固定符号ベクトルに関する固定符号利得とを求めて出力する利得出力手段と、
適応符号ベクトル出力手段からの適応符号ベクトルと、固定符号ベクトル出力手段からの固定符号ベクトルと、利得出力手段からの適応符号利得及び固定符号利得とから駆動音源信号を生成する駆動音源信号生成手段と、
駆動音源信号と、線形予測分析手段からの線形予測フィルタ係数に基づいて再生音声信号を合成する再生音声合成手段とを備え、
励振信号パラメータ抽出手段が、
フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び取得した固定符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、
代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含める励振信号パラメータ抽出手段であり、
固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、
励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、
励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、符号帳処理部からの固定符号ベクトルを外部に出力し、励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とするものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0018】
上記従来例の問題点を解決するための本発明は、音声復号化装置において、本発明の音声符号化装置で符号化された音声符号化データから適応符号と固定符号と、適応符号及び固定符号の利得と、線形予測フィルタ係数とを分離する分離手段と、
分離された適応符号を復号してピッチ周期の情報を出力すると共に、ピッチ周期の情報に基づき過去の駆動音源信号から適応符号ベクトルを出力する適応符号ベクトル出力手段と、
分離された固定符号に基づき、固定符号ベクトルを出力する固定符号ベクトル出力手段と、
分離された適応符号及び固定符号の利得に基づき適応符号帳利得及び固定符号帳利得を出力する利得ベクトル出力手段と、
適応符号ベクトル及び固定符号ベクトル及び適応符号帳利得及び固定符号帳利得とから駆動音源信号を生成する駆動音源信号生成手段と、
駆動音源信号と線形予測フィルタ係数とから音声信号を再生する音声再生手段とを備え、
固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
切替制御手段の制御で通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、
切替制御手段の制御で代替処理サブフレームの場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、
切替制御手段の制御で、通常処理サブフレームの場合に符号帳処理部からの固定符号ベクトルを外部に出力し、代替処理サブフレームの場合に切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とするものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0019】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。
尚、以下で説明する機能実現手段は、当該機能を実現できる手段であれば、どのような回路又は装置であっても構わず、また機能の一部又は全部をソフトウェアで実現することも可能である。更に、機能実現手段を複数の回路によって実現してもよく、複数の機能実現手段を単一の回路で実現してもよい。
【0020】
上位概念的に説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、代替処理サブフレームでは、固定符号帳の探索処理は行わず、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとし、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含める取得制御方法であるので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0021】
また、本発明に係る音声復号化方法及び音声復号化装置は、本発明の音声符号化方法で符号化された音声符号化データにおける励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする取得方法であるので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0022】
機能実現手段で説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、励振信号パラメータ抽出手段が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号及び固定符号ベクトル出力手段から出力される固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めるものであり、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、乗数を切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器と、励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、符号帳処理部からの固定符号ベクトルを外部に出力し、励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有するものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0023】
また、本発明に係る音声復号化方法及び音声復号化装置は、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、切替制御手段の制御で通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、切替制御手段の制御で代替処理サブフレームの場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、乗数を切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器と、切替制御手段の制御で、通常処理サブフレームの場合に符号帳処理部からの固定符号ベクトルを外部に出力し、代替処理サブフレームの場合に切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有するものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0024】
尚、本発明の実施の形態における音声符号化側の主要な各手段と図1の各部との対応を示すと、励振信号パラメータ抽出手段は自乗誤差最小化部8に相当し、適応符号ベクトル出力手段は適応符号帳探索部4に相当し、固定符号ベクトル出力手段は固定符号帳探索部5に相当し、利得出力手段は利得算出部6に相当し、駆動音源信号生成手段は乗算器21、乗算器22、加算器23に相当し、再生音声合成手段はLPC合成部7に相当している。
【0025】
また、固定符号ベクトル出力手段内の各構成要素と図2、図3の各部との対応を示すと、固定符号ベクトル格納バッファが固定符号ベクトル格納バッファ12に、バッファシフト処理部がバッファシフト処理部14に、切替制御手段が切替制御部18に相当し、符号帳処理部が符号帳処理部11に、切り出し処理部がバッファ切り出し処理部13に、パルス数カウント乗算決定部がパルス数カウント乗算決定部16に、乗算器が乗算器17に、スイッチがスイッチ15に相当している。
【0026】
また、本発明の実施の形態における音声復号化側の主要な各手段と図4の各部との対応を示すと、分離手段が分離部31に、適応符号ベクトル出力手段が適応符号ベクトル出力部32に、固定符号ベクトル出力手段が固定符号ベクトル出力部33に、利得ベクトル出力手段が利得ベクトル出力部34に、駆動音源信号生成手段が乗算器35、乗算器36,加算器37に、音声再生手段がLPC合成部38、ポストフィルタ39に相当している。
【0027】
そして、固定符号ベクトル出力手段内の各構成要素と、図5、図6の各部との対応を示すと、固定符号ベクトル格納バッファが固定符号ベクトル格納バッファ42に、バッファシフト処理部がバッファシフト処理部44に、切替制御手段が切替制御部48に相当し、符号帳処理部が符号帳処理部41に、切り出し処理部がバッファ切り出し処理部43に、パルス数カウント乗算決定部がパルス数カウント乗算決定部46に、乗算器が乗算器47に、スイッチがスイッチ45に相当している。
【0028】
まず、本発明の前提となる代数的符号励振予測方式(ACELP)の音声符号化装置の一般的な概略構成例について図1を使って説明する。図1は、本発明に係る音声符号化装置の概略構成ブロック図である。
【0029】
本実施の形態に係る音声符号化装置(本装置)は、図1に示すように、前処理部1と、LPC分析量子化補間処理部2と、聴覚重み付け処理部3と、適応符号帳探索部4と、固定符号帳探索部5と、利得算出部6と、LPC合成部7と、自乗誤差最小化部8と、多重化処理部9とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声符号化装置全体を制御している。
【0030】
本装置の各部について簡単に説明する。
前処理部1は、信号のスケーリングと高域通過フィルタリングを行うものである。
LPC分析量子化補間処理部2は、1フレーム毎に線形予測(Linear Prediction:LP)分析を行ってLPフィルタ係数(LPC係数)の算出を行い、算出されたLPC係数を線スペクトル対(Linear Spectrum Pair:LSP)に変換して量子化し、LSP係数の符号(D)を出力すると共に、更に補間して、量子化及び補間結果に基づいて逆変換されたLPC係数を出力するものである。
【0031】
加算器20は、前処理が施された音声入力信号と、前フレームの再生音声信号との差分を取って、誤差信号を出力するものである。
聴覚重み付け処理部3は、入力される誤差信号に対し、サブフレーム単位でLPC係数を用いて聴覚重み付け処理(公知の技術)を行い、聴覚重み付け誤差信号を出力するものである。
【0032】
適応符号帳探索部4は、サブフレーム毎に、ピッチ周期成分を探索するもので、具体的には、後述する自乗誤差最小化部8からの制御信号に従い、過去の駆動音源信号に対してある遅延(ピッチ周期)だけさかのぼり、その点からサブフレーム長のサンプルを切り出して現サブフレームに充当し、これに基づいて作成された再生音声信号と入力音声信号との誤差が最小となるピッチ周期を検出し、検出されたピッチ周期の情報を適応符号(A)として自乗誤差最小化部8に出力する。
また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し、適応符号ベクトルとして利得算出のために利得算出部6へ出力すると共に、過去の駆動音源信号生成の為にも出力する。
【0033】
固定符号帳探索部5は、サブフレーム毎に、ピッチ周期成分以外のランダムな成分を探索するもので、入力音声信号から前記適応符号帳探索部4で検出されたピッチ周期及び後述する利得算出部6で算出された適応符号帳利得に基づく適応符号ベクトル寄与分を減算した目標信号に対して探索を行う。
具体的には、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を固定符号帳として保持し、後述する自乗誤差最小化部8からの制御信号に従い、固定符号帳のインデックス候補に対応する複数のパルスに極性を与え、パルス波形信号を固定符号ベクトルとして出力し、当該固定ベクトルに基づいて作成された再生音声信号と上記目標信号との自乗誤差が最小化されるような固定符号帳のインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力する。
【0034】
また、検出された固定符号帳のインデックスに対応する複数のパルスから成るパルス波形信号を固定符号ベクトルとし、利得算出のために重み付けを行った重み付け固定符号ベクトルを利得算出部6へ出力すると共に、固定符号ベクトルを過去の駆動音源信号生成の為にも出力する。
尚、本発明の固定符号帳探索部5では、自乗誤差最小化部8からの制御信号に従い、固定符号ベクトルを出力する方法が従来とは異なっているが、詳細は後述する。
【0035】
利得算出部6は、後述する自乗誤差最小化部8からの制御信号に従い、適応符号帳探索部4から入力される適応符号ベクトルと固定符号帳探索部5からの(重み付け)固定符号ベクトルより、入力音声と再生音声との重み付け平均自乗誤差を最小にする適応符号帳利得および固定符号帳利得を求め、利得符号として自乗誤差最小化部8に出力する。
また、検出された適応符号帳利得および固定符号帳利得を過去の駆動音源信号生成の為にも出力する。
【0036】
自乗誤差最小化部8は、聴覚重み付け処理部3で重み付けされた聴覚重み付け誤差信号を入力し、聴覚重み付け誤差を最小にするような各符号を探索するように適応符号帳探索部4、固定符号帳探索部5、利得算出部6に制御信号を出力し、各々における探索結果である聴覚重み付け誤差を最小とするような適応符号帳のインデックスである適応符号(A)、固定符号帳のインデックスである固定符号(B)、適応符号利得及び固定符号利得からなる利得符号(C)を受け取って、励振パラメータとして多重化処理部9に出力するものである。
尚、本発明の自乗誤差最小化部8では、固定符号帳探索部5への制御方法が従来とは異なっているが、詳細は後述する。
【0037】
乗算器21は、適応符号帳探索部4から出力される適応符号化ベクトルと、利得算出部6から出力される適応符号利得との乗算を行うものである。
乗算器22は、固定符号帳探索部5から出力される固定符号化ベクトルと、利得算出部6から出力される固定符号利得との乗算を行うものである。
加算器23は、乗算器21から出力される適応符号化ベクトルと適応符号利得との乗算結果と、乗算器22から出力される固定符号化ベクトルと固定符号利得との乗算結果とを加算して、駆動音源信号を出力するものである。
【0038】
LPC合成部7は、LPC分析量子化補間処理部2から出力されるLPC係数、及び加算器23から出力される駆動音源信号により音声信号を再生し、符号化側における再生音声信号を出力するものである。
【0039】
多重化処理部9は、自乗誤差最小化部8からの適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと、LPC分析量子化補間処理部2からのLSP係数の符号(D)とが多重化されてビットストリーム化され、音声符号化データとして送信するものである。
【0040】
次に、本実施の形態に係る音声符号化装置(本装置)の基本動作について図1を使って説明する。
本装置では、送信する音声信号が入力されると、前処理部1でスケーリング及び高域通過フィルタリングの前処理が施され、LPC分析量子化補間処理部2でLPC分析され、LSP係数に変換されて量子化され、補間されて、LPC係数とLSP係数の符号(D)とが出力され、LPC係数の符号(D)は、多重化処理部9に出力されて、適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと共に多重化されて、ビットストリーム化されて音声符号化データとして送信される。
【0041】
一方、前処理部1から出力された前処理後の音声信号は、加算器20で1フレーム前の符号化側における再生音声信号との差分が取られて誤差信号が出力され、聴覚重み付け処理部3において、LPC分析量子化補間処理部2からのLPC係数を用いて誤差信号に聴覚重み付けが為され、聴覚重み付け誤差信号が自乗誤差最小化部8に入力される。
【0042】
自乗誤差最小化部8では、まず適応符号帳探索部4に対して聴覚重み付け誤差を最小にするようなピッチ周期の適応符号を探索する指示の制御信号(図では点線矢印)を出力し、適応符号帳探索部4で誤差信号が最小となるピッチ周期が検出され、検出されたピッチ周期の情報が適応符号(A)として自乗誤差最小化部8に出力される。また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の信号を切り出した適応符号ベクトルが出力される。
【0043】
そして、自乗誤差最小化部8では、利得算出部6に対して適応符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得算出部6で、適応符号帳探索部4から出力される適応符号ベクトルより、適応符号帳利得が求められて出力される。
【0044】
次に、自乗誤差最小化部8では、通常、固定符号帳探索部5に対して入力音声信号から適応符号ベクトル寄与分を減算した目標信号に対して聴覚重み付け誤差を最小にするような固定符号を探索する指示の制御信号(図では点線矢印)を出力し、固定符号帳探索部5で誤差信号が最小となる固定符号帳インデックスが固定符号(B)として自乗誤差最小化部8に出力される。
【0045】
そして、自乗誤差最小化部8では、利得算出部6に対して固定符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得算出部6では、固定符号帳探索部5から入力される重み付け固定符号ベクトルより、固定符号帳利得が求められ、既に求めた適応符号帳利得と固定符号帳利得とが利得符号として自乗誤差最小化部8に出力される。
【0046】
上記動作の結果、自乗誤差最小化部8では、サブフレーム毎に聴覚重み付け誤差を最小化する適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータが決定されて多重化処理部9に出力され、多重化処理部9ではフレーム毎にLPC分析量子化補間処理部2から出力されるLPC係数と、サブフレーム毎に自乗誤差最小化部8から出力される励振信号パラメータが多重化されて、ビットストリーム化されて送信される。
【0047】
そして、サブフレームにおける励振信号パラメータが決定されると、適応符号帳探索部4からの適応符号ベクトルと利得算出部6からの適応符号帳利得とが乗算器21で乗算され、固定符号帳探索部5からの固定符号ベクトルと利得算出部6からの固定符号帳利得とが乗算器22で乗算され、乗算器21の乗算結果と乗算器22の乗算結果とが加算器23で加算されて、1サブフレーム前の駆動音源信号として出力される。
【0048】
駆動音源信号は、適応符号帳探索部4に入力されて、次のサブフレームのピッチ周期検出に用いられると共に、LPC合成部7に入力され、LPC合成部7でLPC分析量子化補間処理部2から出力されるLPC係数と駆動音源信号により音声信号を再生され、符号化側における再生音声信号として出力され、加算器20で入力音声信号との差分が取られるようになっている。
【0049】
上記図1を用いて説明した構成及び動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声符号化装置の一般的な構成及び動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号の取り扱い、及びそれに伴う固定符号ベクトルの取得方法が従来のそれとは異なっている。
【0050】
具体的に説明すると、従来ACELP方式の音声符号化方法において、サブフレーム毎に行っていた固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を、本発明ではフレーム内の一部のサブフレームのみで行うものとし、残りのサブフレームでは、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないようにするものである。
【0051】
ここで、従来通りの固定符号帳の探索処理により固定符号及び固定符号ベクトルの取得を行うサブフレームを通常処理サブフレームと呼び、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないサブフレームを代替処理サブフレームと呼んで、以降説明する。
尚、フレーム内の複数サブフレームを、どの様に通常処理サブフレームと代替処理サブフレームに割り振るかに付いては、後で詳しく述べることにする。
【0052】
即ち、本発明の音声符号化方法では、フレームを構成する複数のサブフレームの内、通常処理サブフレームでは従来通りの固定符号帳の探索処理により固定符号の取得を行って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データを作成し、代替処理サブフレームでは、固定符号帳の探索処理による固定符号の取得を行わず、固定符号を含まない適応符号及び適応符号利得及び固定符号利得を励振信号パラメータとして音声符号化データを作成する。
これにより、代替サブフレームにおける固定符号分のデータ量を軽減し、ビットレートを軽減できるものである。
【0053】
そして、本発明の音声符号化方法では、代替処理サブフレームにおいて通常の固定符号帳の探索処理による固定符号の取得を行わないために、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0054】
また、本発明の音声符号化方法に対応した音声復号化方法では、音声符号化データ中で、代替処理サブフレームにおいて固定符号のデータが存在しないため、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、符号化の場合と同様に、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0055】
上記説明した本発明の音声符号化方法を実現するために、本発明の音声符号化装置では、図1に示したACELP方式の音声符号化装置の一般的な構成において、自乗誤差最小化部8の動作と、固定符号帳探索部5の内容が従来のものとは異なっている。
尚、本発明では、通常処理サブフレームと代替処理サブフレームの設け方を限定するものではないが、1つの例として、通常処理サブフレームと代替処理サブフレームを交互に設ける場合、即ち、通常処理サブフレームを奇数サブフレームとし、代替処理サブフレームを偶数サブフレームとした例で、以降説明する。
【0056】
本発明の自乗誤差最小化部8は、聴覚重み付け誤差信号を最小にするような適応符号(A)、固定符号(B)、利得符号(C)を取得する制御を行うものであるが、特に固定符号を取得する制御において、通常処理サブフレーム(例えば奇数サブフレーム)のタイミングでは、固定符号帳探索部5に対して通常通りの手順で固定符号帳探索を行わせる固定符号帳探索処理の指示を出力して、聴覚重み付け誤差信号が最小となる固定符号帳のインデックスを探索させ、固定符号帳探索部5から出力される固定符号を受け取って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データとして送信する制御を行う。
【0057】
そして、代替処理サブフレーム(例えば偶数サブフレーム)のタイミングでは、固定符号帳探索部5に対して固定符号帳の探索処理は行わせず、固定符号を励振パラメータに含めず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データとして送信し、音声符号化データのビットレートを軽減し、固定符号帳探索部5には代替の固定符号ベクトルを出力させる代替固定符号ベクトル出力処理の指示を行うようになっている。
【0058】
本発明の固定符号帳探索部5は、自乗誤差最小化部8からの制御指示に従い、通常処理サブフレームのタイミングでは固定符号帳探索処理の指示を受けて、従来通り固定符号帳を探索して、固定符号ベクトル及び固定符号を取得する処理を行う。
また、代替処理サブフレームのタイミングでは、代替固定符号ベクトル出力処理の指示を受けて、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得する処理を行うものである。
【0059】
ここで、本発明の音声符号化装置における固定符号帳探索部5の第1の内部構成例について第1の実施の形態として、図2を使って説明する。図2は、本発明の第1の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
本発明の第1の音声符号化装置における固定符号帳探索部5(第1の固定符号帳探索部)の内部は、図2に示すように、符号帳処理部11と、固定符号ベクトル格納バッファ12と、バッファ切り出し処理部13と、バッファシフト処理部14と、スイッチ15と、切替制御部18とから構成されている。
【0060】
各部について説明する。
符号帳処理部11は、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトルを保持している固定符号帳を備えており、自乗誤差最小化部8からの制御信号に従って、自乗誤差最小化部8からの指示が通常の探索処理の指示であった場合には、固定符号帳の中で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出する最小歪みパルス組み合わせ探索処理を行い、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックスに対応するパルス波形信号を固定符号ベクトルとして出力するものである。
【0061】
尚、従来の音声符号化装置における固定符号帳探索部5では、この符号帳処理部11における最小歪みパルス組み合わせ探索処理をサブフレーム毎に行っていたが、本発明の固定符号帳探索部5では、フレームを構成する複数サブフレームの内の通常処理サブフレーム(例えば、奇数サブフレーム)で最小歪みパルス組み合わせ探索処理を行うようにしている点が特徴である。
【0062】
固定符号ベクトル格納バッファ12は、符号帳処理部11から出力される固定符号ベクトル、又は後述するバッファ切り出し処理部13から出力される代替固定符号ベクトルを、複数サブフレーム分だけ格納するバッファである。
尚、固定符号ベクトル格納バッファ12は、シフトレジスタなどで構成され、バッファシフト処理部14と接続されて、内容をシフトすることによって、順次新しいサブフレームにおける固定符号ベクトルを格納して更新していき、また読み出し(切り出し)位置を調整しながら、読み出せるようになっている。
【0063】
バッファ切り出し処理部13は、自乗誤差最小化部8からの指示が代替の探索処理の指示であった場合に、適応符号帳探索部4からのピッチ周期の情報に従って、固定符号ベクトル格納バッファ12及びバッファシフト処理部14に記憶されている過去の固定符号ベクトルのデータ系列でピッチ周期の情報分さかのぼった個所からサブフレームにおけるサンプル数分切り出し、代替固定符号ベクトルとして出力するものである。
【0064】
バッファシフト処理部14は、固定符号ベクトル格納バッファ12に過去の固定符号ベクトル又は代替固定符号ベクトルを記憶し、また切り出し位置を調整するために、固定符号ベクトル格納バッファ12の内容をシフトするための処理部分である。
尚、バッファシフト処理部14は、シフトレジスタなどで構成され、固定符号ベクトル格納バッファ12と接続されて、内容をシフトすることによって、順次新しいサブフレームにおける固定符号ベクトルを格納して更新していき、また読み出し(切り出し)位置を調整しながら、読み出せるようになっている。
【0065】
スイッチ15は、切替制御部18からの制御で符号帳処理部11から出力される固定符号ベクトルと、バッファ切り出し処理部13から出力される代替固定符号ベクトルとをサブフレーム毎に切り替えて、固定符号ベクトルとして出力するスイッチである。
【0066】
切替制御部18は、自乗誤差最小化部8からの指示に従い、通常の固定符号帳探索処理の指示であった場合には、符号帳処理部11を動作させて通常の固定符号ベクトルを出力させ、それと共にスイッチ15を符号帳処理部11側に切り替えて、符号帳処理部11からの固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とし、また代替の探索処理の指示であった場合には、バッファ切り出し処理部13を動作させて代替固定符号ベクトルを出力させ、それと共にスイッチ15をバッファ切り出し処理部13側に切り替えて、代替固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とするものである。
【0067】
次に、本発明の音声符号化装置における第1の固定符号帳探索部5の動作について、図2を参照しながら説明する。
本発明の音声符号化装置における第1の固定符号帳探索部5では、自乗誤差最小化部8からサブフレーム毎に入力される制御信号に基づいて、通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングで自乗誤差最小化部8から固定符号帳探索処理の指示があった場合には、符号帳処理部11で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックス候補に対応する固定符号ベクトルが出力され、切替制御部18の制御によって、スイッチ15が符号帳処理部11側に接続されて、符号帳処理部11から出力された固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0068】
そして、この時、符号帳処理部11から出力された固定符号ベクトルは、固定符号ベクトル格納バッファ12に格納されるが、その際、固定符号ベクトル格納バッファ12に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部14を用いて1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0069】
一方、代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングで自乗誤差最小化部8から代替固定符号ベクトル出力処理の指示があった場合には、切替制御部18の制御によってバッファ切り出し処理部13が動作し、適応符号帳探索部4からのピッチ周期の情報に従い、固定符号ベクトル格納バッファ12内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるように、バッファシフト処理部14を用いてピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0070】
バッファ切り出し処理部13から出力された代替固定符号ベクトルは、切替制御部18の制御によって、スイッチ15がバッファ切り出し処理部13側に接続されて、バッファ切り出し処理部13から出力された代替固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0071】
更に、この時、バッファ切り出し処理部13から出力された代替固定符号ベクトルは、固定符号ベクトル格納バッファ12に格納されるが、その際、固定符号ベクトル格納バッファ12に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部14を用いて1サブフレーム分にシフトされて新しいて代替固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0072】
上記説明では、例として奇数サブフレームでは符号帳処理部11からの固定符号ベクトルが出力され、偶数サブフレームではバッファ切り出し処理部13からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0073】
次に、本発明の音声符号化装置における固定符号帳探索部5の第2の内部構成例について第2の実施の形態として、図3を使って説明する。図3は、本発明の第2の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
本発明の第2の音声符号化装置における固定符号帳探索部5(第2の固定符号帳探索部)の内部は、図3に示すように、第1の固定符号帳探索部5と同様の構成である符号帳処理部11と、固定符号ベクトル格納バッファ12と、バッファ切り出し処理部13と、バッファシフト処理部14と、スイッチ15と、切替制御部18とから構成され、更に第2の実施の形態の特徴部分として、パルス数カウント乗算決定部16と乗算器17とを設けている。
【0074】
各部について説明するが、符号帳処理部11,固定符号ベクトル格納バッファ12、バッファ切り出し処理部13、バッファシフト処理部14、スイッチ15、切替制御部18については、第1の固定符号帳探索部と同様であるので説明を省略する。
パルス数カウント乗算決定部16は、バッファ切り出し処理部13から出力される代替符号ベクトルについて、パルス数をカウントし、各サブフレームにおける固定符号ベクトルのパワーが均一化されるように、代替符号ベクトルに乗じる値(乗数)を決定するものである。尚、乗数の決定方法については、予めパルス数に乗数を対応付けて記憶しておいても良いし、パルス数から計算によって乗数を算出するようにしても良い。
【0075】
乗算器17は、バッファ切り出し処理部13から出力される代替固定符号ベクトルにパルス数カウント乗算決定部16から出力される乗数を乗算する一般的な乗算器である。
【0076】
次に、本発明の音声符号化装置における第2の固定符号帳探索部5の動作は、概ね第1の固定符号帳探索部5の動作動作と同様であるが、自乗誤差最小化部8から制御指示に従い、代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングで、代替固定符号ベクトル出力処理の指示があると、バッファ切り出し処理部13から代替固定符号ベクトルが出力され、パルス数カウント乗算決定部16が代替固定符号ベクトルを入力してパルス数がカウントされ、カウント結果に応じた乗数が決定されて出力され、乗算器17で代替固定符号ベクトルに乗数が乗算されて、ベクトルのパワーが均一化された代替固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力されることになる。
【0077】
上記自乗誤差最小化部8及び固定符号帳探索部5における通常処理サブフレームと代替処理サブフレームとの切替制御により、代替処理サブフレームにおける励振パラメータから固定符号が削減されるので、送信する音声符号化データのビットレートを軽減することができ、また固定符号帳探索部5における固定符号帳探索の負荷を軽減することができる。
【0078】
上記説明したように本発明の音声符号化方法及び音声符号化装置では、フレームを構成する複数サブフレームの中で、代替処理サブフレームにおける励振パラメータから固定符号を削減した音声符号化データを作成することになる。
それに伴い、この固定符号が削減された音声符号化データを受けて復号化する音声復号化方法及び音声復号化装置について説明する。
【0079】
本発明の音声復号化方法は、基本的には、符号化された励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び符号化された励振信号パラメータに基づく適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて音声信号を再生するものであるが、本発明の特徴として、励振信号パラメータの固定符号に基づいて固定符号ベクトルを生成する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、固定符号帳を用いて固定符号に対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとするものである。
【0080】
次に、上記説明した本発明に係る代数的符号励振予測方式(ACELP)の音声符号化に対応する音声復号化装置の概略構成例について図4を使って説明する。図4は、本発明に係る音声復号化装置の概略構成ブロック図である。
本発明の音声復号化装置は、図4に示すように、分離部31と、適応符号ベクトル出力部32と、固定符号ベクトル出力部33と、利得ベクトル出力部34と、乗算器35と、乗算器36と、加算器37と、LPC合成部38と、ポストフィルタ39とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声復号化装置全体を制御している。
【0081】
本発明の音声復号化装置の各部について簡単に説明する。
分離部31は、受信した音声符号化データを適応符号(A)、固定符号(B)、利得符号(C)、LSP係数の符号(D)に分離して出力するものである。
【0082】
適応符号ベクトル出力部32は、適応符号(A)を復号してピッチ周期を求め出力すると共に、ピッチ周期に基づき過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し適応符号ベクトルとして出力するものである。
【0083】
固定符号ベクトル出力部33は、予め音声符号化側と同様の複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を記憶している固定符号帳を保持し、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づき、固定符号帳を用いてパルスを配置したパルス波形信号を固定符号ベクトルとして出力するものである。
但し、本発明の固定符号ベクトル出力部33では、通常処理サブフレーム(例えば、奇数サブフレーム)に付いては通常通り固定符号が送信されてくるが、代替処理サブフレームに付いては、固定符号が送信されてこないため、それに対応した動作で固定符号ベクトルを出力する点が、従来とは異なっている。詳細は、後述する。
【0084】
利得ベクトル出力部34は、利得符号(C)に基づき適応符号帳利得及び固定符号帳利得を出力するものである。
【0085】
乗算器35は、適応符号ベクトル出力部32からの適応符号ベクトルに、利得ベクトル出力部34からの適応符号帳利得を乗算するものである。
乗算器36は、固定符号ベクトル出力部33からの固定符号ベクトルに利得ベクトル出力部34からの固定符号帳利得を乗算するものである。
加算器37は、乗算器35による乗算結果と、乗算器36による乗算結果とを加算して後述するLPC合成部38の駆動音源信号を出力するものである。
【0086】
LPC合成部38は、LSP係数の符号(D)から求めたLPC係数と加算器37から出力される駆動音源信号とにより音声信号を再生し、再生音声信号を出力するものである。
ポストフィルタ39は、LSP係数の符号(D)から求めたLPC係数を用いて、LPC合成部38から出力される再生音声信号に対し、スペクトル整形等の処理を行い、音質が改善された再生音声を出力するものである。
【0087】
次に、本実施の形態に係る音声復号化装置の基本動作について図4を使って説明する。
本発明の音声復号化装置では、受信した音声符号化データが、分離部31で適応符号(A)、固定符号(B)、利得符号(C)、LSP係数の符号(D)に分離される。
【0088】
そして、適応符号(A)は、適応符号ベクトル出力部32で復号されてピッチ周期が求められ出力されると共に、ピッチ周期に基づき記憶されている過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出した適応符号ベクトルが出力される。
【0089】
一方、固定符号(B)は、固定符号ベクトル出力部33に入力され、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づきパルスを配置したパルス波形信号、又は過去の固定符号ベクトルを用いて生成された代替固定符号ベクトルの何れかが、固定符号ベクトルとして出力される。尚、詳細は、後述する。
【0090】
また、利得符号(C)は、利得ベクトル出力部34に入力されて適応符号帳利得及び固定符号帳利得が求められて出力される。
【0091】
そして、適応符号ベクトル出力部32からの適応符号ベクトルには乗算器35で利得ベクトル出力部34からの適応符号帳利得が乗算され、固定符号ベクトル出力部33からの固定符号ベクトルには乗算器36で利得ベクトル出力部34からの固定符号帳利得が乗算され、双方が加算器37により加算されてLPC合成部38の駆動音源信号として出力され、LPC合成部38に入力されると共に、適応符号ベクトル出力部32に入力されて過去の駆動音源信号として記憶される。
【0092】
加算器37から出力された駆動音源信号は、LPC合成部38で分離部31によって分離されたLSP係数の符号(D)から求めたLPC係数を用いて音声信号が再生され、再生音声信号となり、ポストフィルタ39で、LSP係数の符号(D)から求めたLPC係数を用いてスペクトル整形等の処理が行われ、音質が改善された再生音声が出力されるようになっている。
【0093】
上記図4を用いて説明した構成及び動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声復号化装置の一般的な構成及び動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号が代替処理サブフレームでは削減されているので、それに伴い固定符号ベクトルの取得方法が従来のそれとは異なっている。
【0094】
具体的には、フレームを構成する複数サブフレームの内、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)に付いては、通常通り固定符号が送信されてくるので、符号化側と同様の固定符号帳を用いて固定符号ベクトルを取得するが、符号化側で代替固定符号ベクトル出力処理を行った代替処理サブフレーム(例えば偶数サブフレーム)に付いては、固定符号が送信されてこないので、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0095】
まず、本発明の音声復号化装置における固定符号ベクトル出力部33の第1の内部構成例について第1の実施の形態として、図5を使って説明する。図5は、本発明の第1の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。尚、図5の構成は、図2で説明した音声符号化側の第1の固定符号帳探索部5に対応する構成である。
【0096】
本発明の第1の音声復号化装置における固定符号ベクトル出力部33(第1の固定符号ベクトル出力部)の内部は、図5に示すように、符号帳処理部41と、固定符号ベクトル格納バッファ42と、バッファ切り出し処理部43と、バッファシフト処理部44と、スイッチ45と、切替制御部48とから構成されている。
【0097】
図5に示した第1の音声復号化装置における固定符号ベクトル出力部33の内部構成は、図2に示した音声符号化装置における固定符号帳探索部5の内部構成と基本的には同様であるが、但し、音声符号化装置における固定符号帳探索部5の符号帳処理部11は、自乗誤差最小化部8からの制御信号に従って誤差を最小化する固定符号帳を探索するが、音声復号化装置における固定符号ベクトル出力部33の符号帳処理部41は、分離部31からの固定符号(B)に対応する固定符号ベクトルを出力する点が異なっている。
【0098】
また、切替制御部48は、予め符号化側で定めた通常処理サブフレームと代替処理サブフレームとの設け方に従って、各動作系を切り替えるものである。
【0099】
その他の構成要素については、図2に示した音声符号化装置における固定符号帳探索部5の対応する構成要素と同様の動作をするものであるので、ここでは説明を省略する。
【0100】
次に、本発明の音声復号化装置における第1の固定符号ベクトル出力部33の動作について、図5を参照しながら説明する。
本発明の音声復号化装置における第1の固定符号ベクトル出力部33では、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングでは、切替制御部48からの動作指示に従い、符号帳処理部41で分離部31から入力される固定符号(B)に対応する固定符号ベクトルが出力され、切替制御部48の制御によってスイッチ45が符号帳処理部41側に接続されて、符号帳処理部41から出力された固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0101】
そして、この時、符号帳処理部41から出力された固定符号ベクトルが固定符号ベクトル格納バッファ42に格納されるが、その際、固定符号ベクトル格納バッファ42に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部44を用いて1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0102】
一方、符号化側で代替の探索処理を行ったサブフレーム(例えば、偶数サブフレーム)のタイミングでは、切替制御部48からの動作指示に従い、バッファ切り出し処理部43が動作し、バッファ切り出し処理部43で適応符号ベクトル出力部32からのピッチ周期情報を入力し、固定符号ベクトル格納バッファ42内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるように、バッファシフト処理部44を用いてピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0103】
バッファ切り出し処理部43から出力された代替固定符号ベクトルは、切替制御部48の制御によって、スイッチ45がバッファ切り出し処理部43側に接続されて、バッファ切り出し処理部43から出力された代替固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0104】
更に、この時、バッファ切り出し処理部43から出力された代替固定符号ベクトルは、固定符号ベクトル格納バッファ42に格納されるが、その際、固定符号ベクトル格納バッファ42に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部44を用いて1サブフレーム分にシフトされて新しいて代替固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0105】
上記説明では、例として奇数サブフレームでは符号帳処理部41からの固定符号ベクトルが出力され、偶数サブフレームではバッファ切り出し処理部43からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0106】
次に、本発明の音声復号化装置における固定符号ベクトル出力部33の第2の内部構成例について第2の実施の形態として、図6を使って説明する。図6は、本発明の第2の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。尚、図6の構成は、図3で説明した音声符号化側の第2の固定符号帳探索部5に対応する構成である。
【0107】
本発明の第2の音声復号化装置における固定符号ベクトル出力部33(第2の固定符号ベクトル出力部)の内部は、図6に示すように、第1の固定符号ベクトル出力部33と同様の構成である符号帳処理部41と、固定符号ベクトル格納バッファ42と、バッファ切り出し処理部43と、バッファシフト処理部44と、スイッチ45と、切替制御部48とから構成され、更に第2の実施の形態の特徴部分として、パルス数カウント乗算決定部46と乗算器47とを設けている。
【0108】
ここで、符号帳処理部41,固定符号ベクトル格納バッファ42、バッファ切り出し処理部43、バッファシフト処理部44、スイッチ45、切替制御部48については、第1の固定符号ベクトル出力部33と同様であり、またパルス数カウント乗算決定部46、乗算器47は、符号化側で説明した第2の固定符号帳探索部5におけるパルス数カウント乗算決定部16及び乗算器17と同様のものである。
【0109】
次に、本発明の音声復号化装置における第2の固定符号ベクトル出力部33の動作は、概ね第1の固定符号ベクトル出力部33の動作動作と同様であるが、符号化側で代替固定符号ベクトル出力処理を行った代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングでは、バッファ切り出し処理部43から代替固定符号ベクトルが出力されると、パルス数カウント乗算決定部46が代替固定符号ベクトルを入力してパルス数がカウントされ、カウント結果に応じた乗数が決定されて出力され、乗算器47で代替固定符号ベクトルに乗数が乗算されて、ベクトルのパワーが均一化された代替固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力されることになる。
【0110】
次に、本発明の音声符号化方法において、通常の最小歪みパルス組み合わせ探索処理を行って探索結果の固定符号を送信する通常処理サブフレームと、固定符号を送信せず、過去の固定符号ベクトルから切り出した代替固定符号ベクトルを固定符号ベクトルとして用いる代替処理サブフレームとの設け方について、図7を使って説明する。図7は、本発明の音声符号化方法における通常処理サブフレームと代替処理サブフレームとの設け方を示す説明図である。
【0111】
ACELP方式の音声符号化を行う際に、LPC分析を行う単位であるフレームを複数(図7ではN個)のサブフレームで構成し、サブフレーム単位で、適応符号帳探索、固定符号帳探索、利得算出を行うものとする。
そして、N個のサブフレームをM(M≦N)個のサブフレームのグループに分け、本発明の音声符号化方法では、グループ内のM個のサブフレームの内、前半(前より)の一部(例えば1〜L)(1≦L<N)のサブフレームを、通常の最小歪みパルス組み合わせ探索を行う固定符号帳探索処理を行って探索結果の固定符号を送信する通常処理サブフレームとし、残りのサブフレーム(L+1〜M)を過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる代替処理サブフレームとする。
【0112】
最も簡単な例としては、1フレームが2サブフレームで構成されるような場合に、第1サブフレームを通常処理サブフレームとし、第2サブフレームを代替処理サブフレームとする。
また、1フレームが4サブフレームで構成されるような場合に、2サブフレーム毎にグループ分けし、奇数サブフレームを通常処理サブフレームとし、偶数サブフレームを代替サブフレームとしても良いし、4サブフレームを1グループとして第1,2サブフレームを通常処理サブフレームとし、第3,4サブフレームを代替処理サブフレームとしても良い。
【0113】
また、1フレームが6サブフレームで構成されるような場合に、3サブフレーム毎にグループ分けし、第1、第4サブフレームを通常処理サブフレームとし、第2、第3、第5、第6サブフレームを代替処理サブフレームとしても良いし、第1,第2、第4,第5サブフレームを通常処理サブフレームとし、第3,第6サブフレームを代替処理サブフレームとしても良い。
【0114】
通常処理サブフレームと代替処理サブフレームとの配分を如何にするかは、再生音声精度とビットレート軽減率との兼ね合いであるが、通常処理サブフレームに対して代替処理サブフレームの割合を多くすると、ビットレート軽減率は向上するが、再生音声が劣化する可能性が増えることになり、逆に通常処理サブフレームに対して代替処理サブフレームの割合を少なくすると、再生音声の劣化は少なくなるがビットレート軽減率は余り向上しないことになる。
尚、本発明ではこの通常処理サブフレームと代替処理サブフレームとの具体的な配分方法については限定しないものとする。
【0115】
本発明をDSPプログラムなどによりハードウェア上で実現する場合、演算処理量の増加はほとんど生じず、使用メモリについても500ワード程度の増加のみで済むため、汎用固定小数点演算DSPで十分実現可能である。
【0116】
本発明の音声符号化方法によれば、従来はサブフレーム毎に行っていた固定符号帳探索処理を一部のサブフレーム(通常処理サブフレーム)(例えば奇数サブフレーム)で行って、当該通常処理サブフレームについては探索された固定符号を送信するものとし、残りのサブフレーム(代替処理サブフレーム)(例えば偶数サブフレーム)では、固定符号帳探索処理を行わず、固定符号を送信しないこととしているので、ビットレートを軽減できる効果がある。その結果、6.3kbpsを実現することができる。
【0117】
そして、本発明の音声符号化方法では、送信側及び受信側における音声再生の際の代替処理サブフレームの固定符号ベクトルは、記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0118】
本発明の音声符号化方法の実現する音声符号化装置によれば、自乗誤差最小化部8の制御によって、通常処理サブフレーム(例えば奇数サブフレーム)では、固定符号帳探索部5に対して通常の固定符号ベクトル探索を行わせて、探索された固定符号を送信し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号を送信しないこととし、固定符号帳探索部5に対して代替の固定符号ベクトル探索処理を行わせ、固定符号帳探索部5における代替の固定符号ベクトル探索処理は、固定符号ベクトル格納バッファ12及びバッファシフト処理部14に記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0119】
また、本発明の音声符号化方法に対応する音声復号化装置によれば、固定符号ベクトル出力部33において、通常処理サブフレーム(例えば奇数サブフレーム)では、受信した固定符号に従って固定符号ベクトルを出力し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号が受信されないので、固定符号ベクトル格納バッファ42及びバッファシフト処理部44に記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0120】
本発明の音声符号化装置における第1の実施の形態に係る固定符号帳探索部によれば、通常サブフレーム(例えば奇数サブフレーム)では、符号帳処理部11で通常の固定符号ベクトル探索を行って固定符号を検出すると共に、固定符号ベクトルを出力し、固定符号ベクトルを過去分として固定符号ベクトル格納バッファ12及びバッファシフト処理部14を使って記憶しておき、代替サブフレーム(例えば偶数サブフレーム)では、バッファ切り出し処理部13が適応符号帳探索部4からのピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトル(代替固定符号ベクトル)を切り出して固定符号ベクトルとし、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ12及びバッファシフト処理部14を使って記憶していくので、固定符号ベクトル探索処理の回数を半減させて、負荷を軽減できる効果がある。
【0121】
また、本発明の音声符号化装置における第2の実施の形態に係る固定符号帳探索部によれば、バッファ切り出し処理部13で求めた代替固定符号ベクトルに対してパルス数に応じた乗数を乗算してパワーを均一化するので、再生音声品質を向上できる効果がある。
【0122】
本発明の音声復号装置における第1の実施の形態に係る固定符号ベクトル出力部によれば、通常処理サブフレーム(例えば奇数サブフレーム)では、符号帳処理部11で受信した固定符号に従って固定符号ベクトルを出力し、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ42及びバッファシフト処理部44を使って記憶しておき、代替処理サブフレーム(例えば偶数サブフレーム)では、バッファ切り出し処理部43が適応符号ベクトル出力部32からのピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトル(代替固定符号ベクトル)を切り出して固定符号ベクトルとし、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ42及びバッファシフト処理部44を使って記憶していくので、ビットレートを軽減しながら、再生音声品質の劣化は極力抑えることができる効果がある。
【0123】
また、本発明の音声復号化装置における第2の実施の形態に係る固定符号ベクトル出力部によれば、バッファ切り出し処理部43で求めた代替固定符号ベクトルに対してパルス数に応じた乗数を乗算してパワーを均一化するので、再生音声品質を向上できる効果がある。
【0124】
【発明の効果】
本発明によれば、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、代替処理サブフレームでは、固定符号帳の探索処理は行わず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、代替固定符号ベクトルのパルス数をカウントして、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとし、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する音声符号化方法としているので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる効果がある。
【0125】
本発明によれば、励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする音声復号化方法としているので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる効果がある。
【0126】
本発明によれば、励振信号パラメータ抽出手段が、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び取得した固定符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含めるように制御し、固定符号ベクトル出力手段が、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、符号帳処理部が固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルをスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納し、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、切り出し処理部が固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとしてスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する音声符号化装置としているので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0127】
本発明によれば、固定符号ベクトル出力手段が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、切替制御手段の制御で通常処理サブフレームの場合に、固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、取得した固定符号ベクトルをスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納し、切替制御手段の制御で代替処理サブフレームの場合に、切り出し処理部が固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとしてスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する音声復号化装置としているので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる効果がある。
【図面の簡単な説明】
【図1】本発明に係る音声符号化装置の概略構成ブロック図である。
【図2】本発明の第1の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
【図3】本発明の第2の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
【図4】本発明に係る音声復号化装置の概略構成ブロック図である。
【図5】本発明の第1の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。
【図6】本発明の第2の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。
【図7】本発明の音声符号化方法における通常サブフレームと代替サブフレームとの設け方を示す説明図である。
【符号の説明】
1…前処理部、 2…LPC分析量子化補間処理部、 3…聴覚重み付け処理部、 4…適応符号帳探索部、 5…固定符号帳探索部、 6…利得算出部、 7…LPC合成部、 8…自乗誤差最小化部、 9…多重化処理部、 11…符号帳処理部、 12…固定符号ベクトル格納バッファ、 13…バッファ切り出し処理部、 14…バッファシフト処理部、 15…スイッチ、 16…パルス数カウント乗算決定部、 17…乗算器、 18…切替制御部、 20…加算器、 21…乗算器、 22…乗算器、 23…加算器、 31…分離部、 32…適応符号ベクトル出力部、 33…固定符号ベクトル出力部、 34…利得ベクトル出力部、 35…乗算器、 36…乗算器、 37…加算器、 38…LPC合成部、 39…ポストフィルタ、 41…符号帳処理部、 42…固定符号ベクトル格納バッファ、 43…バッファ切り出し処理部、 44…バッファシフト処理部、 45…スイッチ、 46…パルス数カウント乗算決定部、 47…乗算器、 48…切替制御部
【発明の属する技術分野】
本発明は、ディジタル移動体通信に用いられるディジタル音声圧縮の為の音声符号化/復号化方法及び音声符号化/復号化装置に係り、特に代数的符号励振予測方式による符号化において、再生音声品質の劣化を極力抑えつつ伝送効率を向上できる音声符号化/復号化方法及び音声符号化/復号化装置に関する。
【0002】
【従来の技術】
現在、世界各国で公衆移動体通信に用いられている音声符号化方式は、代数的符号励振予測方式(Algebraic Code Excitation Linear Prediction:ACELP)を基本方式としたものが主流である。
例として挙げるならば、ヨーロッパの移動電話ディジタル符号化の標準であるGSM(Global System for Mobile)で制定されているディジタル音声符号化方式は、AMR(Adaptive Multi−Rate)はACELPを基本方式としてビットレートを伝送路の状況に合わせて可変させる方式であり、またITU−T(International Telecommunications Union−Telecommunications Standards Sector)で標準化されているG.729も、ACELPを基本方式として利得量子化に共役構造を用いることで伝送路誤りへの耐性および再生音声品質を向上させた方式である。
【0003】
また、米国のディジタル移動電話のEFR(Enhanced Full Rate)もACELPを基本方式としたディジタル音声符号化方式である。
更に、2001年より日本でサービスを開始した第3世代におけるディジタル音声符号化方式もGSMで採用されているAMRを参考に制定された可変ビットレート方式であり基本方式はACELPである。
このように世界的に見て現在公衆移動体通信向けディジタル音声符号化の標準方式として採用されている方式は、そのほとんどがACELPを基本方式としている。
【0004】
ACELPは、フレーム毎に音声信号を分析し、CELPモデルで使用するパラメータである線形予測フィルタ係数(LPC係数)、適応符号帳及び固定符号帳のインデックス、利得を抽出し、これらのパラメータを符号化して送信する。そして、復号器においては、受信した上記パラメータを用いて励振信号や合成フィルタのパラメータを再構築し、励振信号を短期合成フィルタに通すことによって音声を再生し、ポストフィルタを通すことによって音声の品質が改善されるようになっている。短期合成フィルタは線形予測(LP)フィルタを基に構成され、長期すなわちピッチ合成フィルタはいわゆる適応符号帳を用いて実現される。
【0005】
ACELPは、CELPにおけるLPC(Linear Predictive Coding)フィルタを駆動する音源信号として、パルスの組み合わせを用いる方式であり、符号帳と呼ばれるベクトル量子化コードブックを用いる従来のCELP方式と比較して、音源信号の探索に必要な演算量の低減と音声品質の改善が実現されている。
【0006】
ACELPはパルスの組み合わせにより音源信号を表現する方式であるが、以下の点がACELPの特徴である。
(1)パルスの位置は各パルス毎に予め限定して定めてある複数個の候補から最適な一つのパルス位置をパルス毎に探索する。表1に参考としてITU−T標準G.729のパルス位置表を示すが、ITU−T標準G.729では、5msのサブフレームにおけるパルス数が4つで、40サンプルを重複することなくカバーするパルス位置構成を持っている。
【0007】
【表1】
【0008】
(2)パルスの振幅は極性(±)のみを1bitで表現する。これにより送信情報量を低減している。
(3)パルス位置探索は極性を決定した後に、全ての候補に対して総組み合わせ探索を実施し、最小歪みを実現するパルス位置の組み合わせを選択する。
【0009】
G.729の音声品質は、クリーン環境、背景雑音環境および話者依存性等の面で、G.726の適応差分PCM(Adaptive Differential Pulse Code Modulation:ADPCM)と同等以上であることが確認されている。
【0010】
現在、ACELPを低ビットレート化する場合の方法として実施されている手法として、パルス数を削減する方法や、パルス位置候補を間引きするなどの方法が考案されており、これらの方法が4kbps〜8kbpsの方式として採用されている。
【0011】
一例としてG.729AnnexDが挙げられる。このG.729AnnexDは5msのサブフレームにおけるパルス数を2つとして、パルス数の減少による音声品質の劣化に対しては後処理にパルス拡散フィルタを追加することによって補い、6.4kbpsのビットレートを実現している。
また、AMRの低ビットレート方式でも1サブフレームにおけるパルス数を2つとし、かつパルス位置候補を1サンプルおきに配置して最小歪み探索を行うことで5.15kbpsや4.75kbpsを実現している。
【0012】
尚、ACELP方式における音声符号化方法の従来技術としては、平成10年11月24日公開の特開平10−312198号「音声符号化方法」(出願人:日本電信電話株式会社、発明者:林 伸二他)がある。
この従来技術は、雑音成分ベクトルの符号化において、各フレームを構成する2つのサブフレームに対し、雑音符号帳を構成する各雑音ベクトルをサブフレーム毎に3つ以下の単位振幅のパルスで構成し、それらの位置を各サブフレーム内で予め決めた取りうる複数の位置から歪みが最小となるように決める音声符号化方法であり、これにより、音声品質を劣化させずにビットレートを低減できるものである。
【0013】
【発明が解決しようとする課題】
しかしながら、従来の音声符号化方法及び音声符号化装置では、パルス数の減少による音声品質の劣化に対してパルス拡散フィルタを追加すると演算量が増加してしまうという問題点があり、また、パルス位置候補の間引きでは再生音声品質が劣化するという問題点があった。
【0014】
本発明は上記実情に鑑みて為されたもので、演算量を増加することなく、再生音声品質劣化を極力抑え、ビットレートを軽減できるACELP方式における音声符号化方法及び音声符号化装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
上記従来例の問題点を解決するための本発明は、音声符号化方法において、
1フレームを複数のサブフレームで構成する入力音声信号について、フレーム単位で音声信号を分析して線形予測フィルタ係数を求め、入力音声信号と合成された再生音声信号との誤差信号に対して聴覚重み付けした聴覚重み付け誤差を求め、サブフレーム単位で聴覚重み付け誤差を最小化するような適応符号及び固定符号及び適応符号利得及び固定符号利得とを取得して励振信号パラメータとし、フレーム単位の線形予測フィルタ係数とサブフレーム単位の励振信号パラメータとを音声符号化データとすると共に、取得した励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて再生音声信号を合成する代数的符号励振予測方式の音声符号化方法であって、
聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、
フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、
代替処理サブフレームでは、固定符号帳の探索処理は行わず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、代替固定符号ベクトルのパルス数をカウントして、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとし、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する取得制御方法であることを特徴とするものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0016】
上記従来例の問題点を解決するための本発明は、音声復号化方法において、本発明の音声符号化方法で符号化された音声符号化データについて、音声符号化データにおける励振信号パラメータに含まれる適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び励振信号パラメータに含まれる適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて音声信号を再生する音声復号化方法であって、
励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、
代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする取得方法であることを特徴とするものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0017】
上記従来例の問題点を解決するための本発明は、音声符号化装置において、
1フレームを複数のサブフレームで構成する音声信号を入力し、フレーム単位で音声信号を線形予測分析して線形予測フィルタ係数を求める線形予測分析手段と、
音声信号と合成された再生音声信号との誤差信号を求める減算手段と、
誤差信号に聴覚重み付けを行い聴覚重み付け誤差信号を出力する聴覚重み付け手段と、
聴覚重み付け誤差信号を入力し、サブフレーム単位で、聴覚重み付け誤差を最小化するような、適応符号及び固定符号と適応符号利得及び固定符号利得とを取得するための制御を行い、取得された適応符号及び固定符号及び適応符号利得及び固定符号利得を励振信号パラメータとして出力する励振信号パラメータ抽出手段と、
励振信号パラメータ抽出手段の制御に従い、過去の駆動音源信号から聴覚重み付け誤差信号を最小化するようなピッチ周期を検出し、検出されたピッチ周期の情報を適応符号として出力すると共に、ピッチ周期の情報と過去の駆動音源信号から求めた適応符号ベクトルを出力する適応符号ベクトル出力手段と、
励振信号パラメータ抽出手段の制御に従い、聴覚重み付け誤差信号を最小化するような固定符号及び固定符号ベクトルを出力する固定符号ベクトル出力手段と、
励振信号パラメータ抽出手段からの制御に従い、適応符号ベクトルに関する適応符号利得と、固定符号ベクトルに関する固定符号利得とを求めて出力する利得出力手段と、
適応符号ベクトル出力手段からの適応符号ベクトルと、固定符号ベクトル出力手段からの固定符号ベクトルと、利得出力手段からの適応符号利得及び固定符号利得とから駆動音源信号を生成する駆動音源信号生成手段と、
駆動音源信号と、線形予測分析手段からの線形予測フィルタ係数に基づいて再生音声信号を合成する再生音声合成手段とを備え、
励振信号パラメータ抽出手段が、
フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び取得した固定符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、
代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含める励振信号パラメータ抽出手段であり、
固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、
励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、
励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、符号帳処理部からの固定符号ベクトルを外部に出力し、励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とするものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0018】
上記従来例の問題点を解決するための本発明は、音声復号化装置において、本発明の音声符号化装置で符号化された音声符号化データから適応符号と固定符号と、適応符号及び固定符号の利得と、線形予測フィルタ係数とを分離する分離手段と、
分離された適応符号を復号してピッチ周期の情報を出力すると共に、ピッチ周期の情報に基づき過去の駆動音源信号から適応符号ベクトルを出力する適応符号ベクトル出力手段と、
分離された固定符号に基づき、固定符号ベクトルを出力する固定符号ベクトル出力手段と、
分離された適応符号及び固定符号の利得に基づき適応符号帳利得及び固定符号帳利得を出力する利得ベクトル出力手段と、
適応符号ベクトル及び固定符号ベクトル及び適応符号帳利得及び固定符号帳利得とから駆動音源信号を生成する駆動音源信号生成手段と、
駆動音源信号と線形予測フィルタ係数とから音声信号を再生する音声再生手段とを備え、
固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
切替制御手段の制御で通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、
切替制御手段の制御で代替処理サブフレームの場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、
切替制御手段の制御で、通常処理サブフレームの場合に符号帳処理部からの固定符号ベクトルを外部に出力し、代替処理サブフレームの場合に切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とするものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0019】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。
尚、以下で説明する機能実現手段は、当該機能を実現できる手段であれば、どのような回路又は装置であっても構わず、また機能の一部又は全部をソフトウェアで実現することも可能である。更に、機能実現手段を複数の回路によって実現してもよく、複数の機能実現手段を単一の回路で実現してもよい。
【0020】
上位概念的に説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、代替処理サブフレームでは、固定符号帳の探索処理は行わず、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとし、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含める取得制御方法であるので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0021】
また、本発明に係る音声復号化方法及び音声復号化装置は、本発明の音声符号化方法で符号化された音声符号化データにおける励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする取得方法であるので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0022】
機能実現手段で説明すれば、本発明に係る音声符号化方法及び音声符号化装置は、励振信号パラメータ抽出手段が、フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号及び固定符号ベクトル出力手段から出力される固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めるものであり、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、乗数を切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器と、励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、符号帳処理部からの固定符号ベクトルを外部に出力し、励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有するものなので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0023】
また、本発明に係る音声復号化方法及び音声復号化装置は、固定符号ベクトル出力手段が、過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、切替制御手段の制御で通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納する符号帳処理部と、切替制御手段の制御で代替処理サブフレームの場合に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する切り出し処理部と、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、乗数を切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器と、切替制御手段の制御で、通常処理サブフレームの場合に符号帳処理部からの固定符号ベクトルを外部に出力し、代替処理サブフレームの場合に切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有するものなので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる。
【0024】
尚、本発明の実施の形態における音声符号化側の主要な各手段と図1の各部との対応を示すと、励振信号パラメータ抽出手段は自乗誤差最小化部8に相当し、適応符号ベクトル出力手段は適応符号帳探索部4に相当し、固定符号ベクトル出力手段は固定符号帳探索部5に相当し、利得出力手段は利得算出部6に相当し、駆動音源信号生成手段は乗算器21、乗算器22、加算器23に相当し、再生音声合成手段はLPC合成部7に相当している。
【0025】
また、固定符号ベクトル出力手段内の各構成要素と図2、図3の各部との対応を示すと、固定符号ベクトル格納バッファが固定符号ベクトル格納バッファ12に、バッファシフト処理部がバッファシフト処理部14に、切替制御手段が切替制御部18に相当し、符号帳処理部が符号帳処理部11に、切り出し処理部がバッファ切り出し処理部13に、パルス数カウント乗算決定部がパルス数カウント乗算決定部16に、乗算器が乗算器17に、スイッチがスイッチ15に相当している。
【0026】
また、本発明の実施の形態における音声復号化側の主要な各手段と図4の各部との対応を示すと、分離手段が分離部31に、適応符号ベクトル出力手段が適応符号ベクトル出力部32に、固定符号ベクトル出力手段が固定符号ベクトル出力部33に、利得ベクトル出力手段が利得ベクトル出力部34に、駆動音源信号生成手段が乗算器35、乗算器36,加算器37に、音声再生手段がLPC合成部38、ポストフィルタ39に相当している。
【0027】
そして、固定符号ベクトル出力手段内の各構成要素と、図5、図6の各部との対応を示すと、固定符号ベクトル格納バッファが固定符号ベクトル格納バッファ42に、バッファシフト処理部がバッファシフト処理部44に、切替制御手段が切替制御部48に相当し、符号帳処理部が符号帳処理部41に、切り出し処理部がバッファ切り出し処理部43に、パルス数カウント乗算決定部がパルス数カウント乗算決定部46に、乗算器が乗算器47に、スイッチがスイッチ45に相当している。
【0028】
まず、本発明の前提となる代数的符号励振予測方式(ACELP)の音声符号化装置の一般的な概略構成例について図1を使って説明する。図1は、本発明に係る音声符号化装置の概略構成ブロック図である。
【0029】
本実施の形態に係る音声符号化装置(本装置)は、図1に示すように、前処理部1と、LPC分析量子化補間処理部2と、聴覚重み付け処理部3と、適応符号帳探索部4と、固定符号帳探索部5と、利得算出部6と、LPC合成部7と、自乗誤差最小化部8と、多重化処理部9とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声符号化装置全体を制御している。
【0030】
本装置の各部について簡単に説明する。
前処理部1は、信号のスケーリングと高域通過フィルタリングを行うものである。
LPC分析量子化補間処理部2は、1フレーム毎に線形予測(Linear Prediction:LP)分析を行ってLPフィルタ係数(LPC係数)の算出を行い、算出されたLPC係数を線スペクトル対(Linear Spectrum Pair:LSP)に変換して量子化し、LSP係数の符号(D)を出力すると共に、更に補間して、量子化及び補間結果に基づいて逆変換されたLPC係数を出力するものである。
【0031】
加算器20は、前処理が施された音声入力信号と、前フレームの再生音声信号との差分を取って、誤差信号を出力するものである。
聴覚重み付け処理部3は、入力される誤差信号に対し、サブフレーム単位でLPC係数を用いて聴覚重み付け処理(公知の技術)を行い、聴覚重み付け誤差信号を出力するものである。
【0032】
適応符号帳探索部4は、サブフレーム毎に、ピッチ周期成分を探索するもので、具体的には、後述する自乗誤差最小化部8からの制御信号に従い、過去の駆動音源信号に対してある遅延(ピッチ周期)だけさかのぼり、その点からサブフレーム長のサンプルを切り出して現サブフレームに充当し、これに基づいて作成された再生音声信号と入力音声信号との誤差が最小となるピッチ周期を検出し、検出されたピッチ周期の情報を適応符号(A)として自乗誤差最小化部8に出力する。
また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し、適応符号ベクトルとして利得算出のために利得算出部6へ出力すると共に、過去の駆動音源信号生成の為にも出力する。
【0033】
固定符号帳探索部5は、サブフレーム毎に、ピッチ周期成分以外のランダムな成分を探索するもので、入力音声信号から前記適応符号帳探索部4で検出されたピッチ周期及び後述する利得算出部6で算出された適応符号帳利得に基づく適応符号ベクトル寄与分を減算した目標信号に対して探索を行う。
具体的には、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を固定符号帳として保持し、後述する自乗誤差最小化部8からの制御信号に従い、固定符号帳のインデックス候補に対応する複数のパルスに極性を与え、パルス波形信号を固定符号ベクトルとして出力し、当該固定ベクトルに基づいて作成された再生音声信号と上記目標信号との自乗誤差が最小化されるような固定符号帳のインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力する。
【0034】
また、検出された固定符号帳のインデックスに対応する複数のパルスから成るパルス波形信号を固定符号ベクトルとし、利得算出のために重み付けを行った重み付け固定符号ベクトルを利得算出部6へ出力すると共に、固定符号ベクトルを過去の駆動音源信号生成の為にも出力する。
尚、本発明の固定符号帳探索部5では、自乗誤差最小化部8からの制御信号に従い、固定符号ベクトルを出力する方法が従来とは異なっているが、詳細は後述する。
【0035】
利得算出部6は、後述する自乗誤差最小化部8からの制御信号に従い、適応符号帳探索部4から入力される適応符号ベクトルと固定符号帳探索部5からの(重み付け)固定符号ベクトルより、入力音声と再生音声との重み付け平均自乗誤差を最小にする適応符号帳利得および固定符号帳利得を求め、利得符号として自乗誤差最小化部8に出力する。
また、検出された適応符号帳利得および固定符号帳利得を過去の駆動音源信号生成の為にも出力する。
【0036】
自乗誤差最小化部8は、聴覚重み付け処理部3で重み付けされた聴覚重み付け誤差信号を入力し、聴覚重み付け誤差を最小にするような各符号を探索するように適応符号帳探索部4、固定符号帳探索部5、利得算出部6に制御信号を出力し、各々における探索結果である聴覚重み付け誤差を最小とするような適応符号帳のインデックスである適応符号(A)、固定符号帳のインデックスである固定符号(B)、適応符号利得及び固定符号利得からなる利得符号(C)を受け取って、励振パラメータとして多重化処理部9に出力するものである。
尚、本発明の自乗誤差最小化部8では、固定符号帳探索部5への制御方法が従来とは異なっているが、詳細は後述する。
【0037】
乗算器21は、適応符号帳探索部4から出力される適応符号化ベクトルと、利得算出部6から出力される適応符号利得との乗算を行うものである。
乗算器22は、固定符号帳探索部5から出力される固定符号化ベクトルと、利得算出部6から出力される固定符号利得との乗算を行うものである。
加算器23は、乗算器21から出力される適応符号化ベクトルと適応符号利得との乗算結果と、乗算器22から出力される固定符号化ベクトルと固定符号利得との乗算結果とを加算して、駆動音源信号を出力するものである。
【0038】
LPC合成部7は、LPC分析量子化補間処理部2から出力されるLPC係数、及び加算器23から出力される駆動音源信号により音声信号を再生し、符号化側における再生音声信号を出力するものである。
【0039】
多重化処理部9は、自乗誤差最小化部8からの適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと、LPC分析量子化補間処理部2からのLSP係数の符号(D)とが多重化されてビットストリーム化され、音声符号化データとして送信するものである。
【0040】
次に、本実施の形態に係る音声符号化装置(本装置)の基本動作について図1を使って説明する。
本装置では、送信する音声信号が入力されると、前処理部1でスケーリング及び高域通過フィルタリングの前処理が施され、LPC分析量子化補間処理部2でLPC分析され、LSP係数に変換されて量子化され、補間されて、LPC係数とLSP係数の符号(D)とが出力され、LPC係数の符号(D)は、多重化処理部9に出力されて、適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータと共に多重化されて、ビットストリーム化されて音声符号化データとして送信される。
【0041】
一方、前処理部1から出力された前処理後の音声信号は、加算器20で1フレーム前の符号化側における再生音声信号との差分が取られて誤差信号が出力され、聴覚重み付け処理部3において、LPC分析量子化補間処理部2からのLPC係数を用いて誤差信号に聴覚重み付けが為され、聴覚重み付け誤差信号が自乗誤差最小化部8に入力される。
【0042】
自乗誤差最小化部8では、まず適応符号帳探索部4に対して聴覚重み付け誤差を最小にするようなピッチ周期の適応符号を探索する指示の制御信号(図では点線矢印)を出力し、適応符号帳探索部4で誤差信号が最小となるピッチ周期が検出され、検出されたピッチ周期の情報が適応符号(A)として自乗誤差最小化部8に出力される。また、検出されたピッチ周期を元に過去の駆動音源信号からサブフレームにおけるサンプル数分の信号を切り出した適応符号ベクトルが出力される。
【0043】
そして、自乗誤差最小化部8では、利得算出部6に対して適応符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得算出部6で、適応符号帳探索部4から出力される適応符号ベクトルより、適応符号帳利得が求められて出力される。
【0044】
次に、自乗誤差最小化部8では、通常、固定符号帳探索部5に対して入力音声信号から適応符号ベクトル寄与分を減算した目標信号に対して聴覚重み付け誤差を最小にするような固定符号を探索する指示の制御信号(図では点線矢印)を出力し、固定符号帳探索部5で誤差信号が最小となる固定符号帳インデックスが固定符号(B)として自乗誤差最小化部8に出力される。
【0045】
そして、自乗誤差最小化部8では、利得算出部6に対して固定符号の利得算出を指示する制御信号(図では点線矢印)が出力され、利得算出部6では、固定符号帳探索部5から入力される重み付け固定符号ベクトルより、固定符号帳利得が求められ、既に求めた適応符号帳利得と固定符号帳利得とが利得符号として自乗誤差最小化部8に出力される。
【0046】
上記動作の結果、自乗誤差最小化部8では、サブフレーム毎に聴覚重み付け誤差を最小化する適応符号(A)、固定符号(B)、利得符号(C)から成る励振信号パラメータが決定されて多重化処理部9に出力され、多重化処理部9ではフレーム毎にLPC分析量子化補間処理部2から出力されるLPC係数と、サブフレーム毎に自乗誤差最小化部8から出力される励振信号パラメータが多重化されて、ビットストリーム化されて送信される。
【0047】
そして、サブフレームにおける励振信号パラメータが決定されると、適応符号帳探索部4からの適応符号ベクトルと利得算出部6からの適応符号帳利得とが乗算器21で乗算され、固定符号帳探索部5からの固定符号ベクトルと利得算出部6からの固定符号帳利得とが乗算器22で乗算され、乗算器21の乗算結果と乗算器22の乗算結果とが加算器23で加算されて、1サブフレーム前の駆動音源信号として出力される。
【0048】
駆動音源信号は、適応符号帳探索部4に入力されて、次のサブフレームのピッチ周期検出に用いられると共に、LPC合成部7に入力され、LPC合成部7でLPC分析量子化補間処理部2から出力されるLPC係数と駆動音源信号により音声信号を再生され、符号化側における再生音声信号として出力され、加算器20で入力音声信号との差分が取られるようになっている。
【0049】
上記図1を用いて説明した構成及び動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声符号化装置の一般的な構成及び動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号の取り扱い、及びそれに伴う固定符号ベクトルの取得方法が従来のそれとは異なっている。
【0050】
具体的に説明すると、従来ACELP方式の音声符号化方法において、サブフレーム毎に行っていた固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を、本発明ではフレーム内の一部のサブフレームのみで行うものとし、残りのサブフレームでは、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないようにするものである。
【0051】
ここで、従来通りの固定符号帳の探索処理により固定符号及び固定符号ベクトルの取得を行うサブフレームを通常処理サブフレームと呼び、固定符号帳の探索処理による固定符号及び固定符号ベクトルの取得を行わないサブフレームを代替処理サブフレームと呼んで、以降説明する。
尚、フレーム内の複数サブフレームを、どの様に通常処理サブフレームと代替処理サブフレームに割り振るかに付いては、後で詳しく述べることにする。
【0052】
即ち、本発明の音声符号化方法では、フレームを構成する複数のサブフレームの内、通常処理サブフレームでは従来通りの固定符号帳の探索処理により固定符号の取得を行って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データを作成し、代替処理サブフレームでは、固定符号帳の探索処理による固定符号の取得を行わず、固定符号を含まない適応符号及び適応符号利得及び固定符号利得を励振信号パラメータとして音声符号化データを作成する。
これにより、代替サブフレームにおける固定符号分のデータ量を軽減し、ビットレートを軽減できるものである。
【0053】
そして、本発明の音声符号化方法では、代替処理サブフレームにおいて通常の固定符号帳の探索処理による固定符号の取得を行わないために、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0054】
また、本発明の音声符号化方法に対応した音声復号化方法では、音声符号化データ中で、代替処理サブフレームにおいて固定符号のデータが存在しないため、固定符号ベクトルが生成されず再生音声の品質劣化を招かないように、符号化の場合と同様に、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0055】
上記説明した本発明の音声符号化方法を実現するために、本発明の音声符号化装置では、図1に示したACELP方式の音声符号化装置の一般的な構成において、自乗誤差最小化部8の動作と、固定符号帳探索部5の内容が従来のものとは異なっている。
尚、本発明では、通常処理サブフレームと代替処理サブフレームの設け方を限定するものではないが、1つの例として、通常処理サブフレームと代替処理サブフレームを交互に設ける場合、即ち、通常処理サブフレームを奇数サブフレームとし、代替処理サブフレームを偶数サブフレームとした例で、以降説明する。
【0056】
本発明の自乗誤差最小化部8は、聴覚重み付け誤差信号を最小にするような適応符号(A)、固定符号(B)、利得符号(C)を取得する制御を行うものであるが、特に固定符号を取得する制御において、通常処理サブフレーム(例えば奇数サブフレーム)のタイミングでは、固定符号帳探索部5に対して通常通りの手順で固定符号帳探索を行わせる固定符号帳探索処理の指示を出力して、聴覚重み付け誤差信号が最小となる固定符号帳のインデックスを探索させ、固定符号帳探索部5から出力される固定符号を受け取って、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データとして送信する制御を行う。
【0057】
そして、代替処理サブフレーム(例えば偶数サブフレーム)のタイミングでは、固定符号帳探索部5に対して固定符号帳の探索処理は行わせず、固定符号を励振パラメータに含めず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて音声符号化データとして送信し、音声符号化データのビットレートを軽減し、固定符号帳探索部5には代替の固定符号ベクトルを出力させる代替固定符号ベクトル出力処理の指示を行うようになっている。
【0058】
本発明の固定符号帳探索部5は、自乗誤差最小化部8からの制御指示に従い、通常処理サブフレームのタイミングでは固定符号帳探索処理の指示を受けて、従来通り固定符号帳を探索して、固定符号ベクトル及び固定符号を取得する処理を行う。
また、代替処理サブフレームのタイミングでは、代替固定符号ベクトル出力処理の指示を受けて、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得する処理を行うものである。
【0059】
ここで、本発明の音声符号化装置における固定符号帳探索部5の第1の内部構成例について第1の実施の形態として、図2を使って説明する。図2は、本発明の第1の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
本発明の第1の音声符号化装置における固定符号帳探索部5(第1の固定符号帳探索部)の内部は、図2に示すように、符号帳処理部11と、固定符号ベクトル格納バッファ12と、バッファ切り出し処理部13と、バッファシフト処理部14と、スイッチ15と、切替制御部18とから構成されている。
【0060】
各部について説明する。
符号帳処理部11は、予め候補配置を定められた複数のパルスに関するパルスの組み合わせベクトルを保持している固定符号帳を備えており、自乗誤差最小化部8からの制御信号に従って、自乗誤差最小化部8からの指示が通常の探索処理の指示であった場合には、固定符号帳の中で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出する最小歪みパルス組み合わせ探索処理を行い、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックスに対応するパルス波形信号を固定符号ベクトルとして出力するものである。
【0061】
尚、従来の音声符号化装置における固定符号帳探索部5では、この符号帳処理部11における最小歪みパルス組み合わせ探索処理をサブフレーム毎に行っていたが、本発明の固定符号帳探索部5では、フレームを構成する複数サブフレームの内の通常処理サブフレーム(例えば、奇数サブフレーム)で最小歪みパルス組み合わせ探索処理を行うようにしている点が特徴である。
【0062】
固定符号ベクトル格納バッファ12は、符号帳処理部11から出力される固定符号ベクトル、又は後述するバッファ切り出し処理部13から出力される代替固定符号ベクトルを、複数サブフレーム分だけ格納するバッファである。
尚、固定符号ベクトル格納バッファ12は、シフトレジスタなどで構成され、バッファシフト処理部14と接続されて、内容をシフトすることによって、順次新しいサブフレームにおける固定符号ベクトルを格納して更新していき、また読み出し(切り出し)位置を調整しながら、読み出せるようになっている。
【0063】
バッファ切り出し処理部13は、自乗誤差最小化部8からの指示が代替の探索処理の指示であった場合に、適応符号帳探索部4からのピッチ周期の情報に従って、固定符号ベクトル格納バッファ12及びバッファシフト処理部14に記憶されている過去の固定符号ベクトルのデータ系列でピッチ周期の情報分さかのぼった個所からサブフレームにおけるサンプル数分切り出し、代替固定符号ベクトルとして出力するものである。
【0064】
バッファシフト処理部14は、固定符号ベクトル格納バッファ12に過去の固定符号ベクトル又は代替固定符号ベクトルを記憶し、また切り出し位置を調整するために、固定符号ベクトル格納バッファ12の内容をシフトするための処理部分である。
尚、バッファシフト処理部14は、シフトレジスタなどで構成され、固定符号ベクトル格納バッファ12と接続されて、内容をシフトすることによって、順次新しいサブフレームにおける固定符号ベクトルを格納して更新していき、また読み出し(切り出し)位置を調整しながら、読み出せるようになっている。
【0065】
スイッチ15は、切替制御部18からの制御で符号帳処理部11から出力される固定符号ベクトルと、バッファ切り出し処理部13から出力される代替固定符号ベクトルとをサブフレーム毎に切り替えて、固定符号ベクトルとして出力するスイッチである。
【0066】
切替制御部18は、自乗誤差最小化部8からの指示に従い、通常の固定符号帳探索処理の指示であった場合には、符号帳処理部11を動作させて通常の固定符号ベクトルを出力させ、それと共にスイッチ15を符号帳処理部11側に切り替えて、符号帳処理部11からの固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とし、また代替の探索処理の指示であった場合には、バッファ切り出し処理部13を動作させて代替固定符号ベクトルを出力させ、それと共にスイッチ15をバッファ切り出し処理部13側に切り替えて、代替固定符号ベクトルを固定符号帳探索部5からの固定符号ベクトル出力とするものである。
【0067】
次に、本発明の音声符号化装置における第1の固定符号帳探索部5の動作について、図2を参照しながら説明する。
本発明の音声符号化装置における第1の固定符号帳探索部5では、自乗誤差最小化部8からサブフレーム毎に入力される制御信号に基づいて、通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングで自乗誤差最小化部8から固定符号帳探索処理の指示があった場合には、符号帳処理部11で、聴覚重み付け誤差を最小にするようなベクトルのインデックスを検出し、固定符号帳のインデックスを固定符号(B)として自乗誤差最小化部8に出力すると共に、検出された固定符号帳のインデックス候補に対応する固定符号ベクトルが出力され、切替制御部18の制御によって、スイッチ15が符号帳処理部11側に接続されて、符号帳処理部11から出力された固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0068】
そして、この時、符号帳処理部11から出力された固定符号ベクトルは、固定符号ベクトル格納バッファ12に格納されるが、その際、固定符号ベクトル格納バッファ12に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部14を用いて1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0069】
一方、代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングで自乗誤差最小化部8から代替固定符号ベクトル出力処理の指示があった場合には、切替制御部18の制御によってバッファ切り出し処理部13が動作し、適応符号帳探索部4からのピッチ周期の情報に従い、固定符号ベクトル格納バッファ12内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるように、バッファシフト処理部14を用いてピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0070】
バッファ切り出し処理部13から出力された代替固定符号ベクトルは、切替制御部18の制御によって、スイッチ15がバッファ切り出し処理部13側に接続されて、バッファ切り出し処理部13から出力された代替固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力される。
【0071】
更に、この時、バッファ切り出し処理部13から出力された代替固定符号ベクトルは、固定符号ベクトル格納バッファ12に格納されるが、その際、固定符号ベクトル格納バッファ12に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部14を用いて1サブフレーム分にシフトされて新しいて代替固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0072】
上記説明では、例として奇数サブフレームでは符号帳処理部11からの固定符号ベクトルが出力され、偶数サブフレームではバッファ切り出し処理部13からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0073】
次に、本発明の音声符号化装置における固定符号帳探索部5の第2の内部構成例について第2の実施の形態として、図3を使って説明する。図3は、本発明の第2の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
本発明の第2の音声符号化装置における固定符号帳探索部5(第2の固定符号帳探索部)の内部は、図3に示すように、第1の固定符号帳探索部5と同様の構成である符号帳処理部11と、固定符号ベクトル格納バッファ12と、バッファ切り出し処理部13と、バッファシフト処理部14と、スイッチ15と、切替制御部18とから構成され、更に第2の実施の形態の特徴部分として、パルス数カウント乗算決定部16と乗算器17とを設けている。
【0074】
各部について説明するが、符号帳処理部11,固定符号ベクトル格納バッファ12、バッファ切り出し処理部13、バッファシフト処理部14、スイッチ15、切替制御部18については、第1の固定符号帳探索部と同様であるので説明を省略する。
パルス数カウント乗算決定部16は、バッファ切り出し処理部13から出力される代替符号ベクトルについて、パルス数をカウントし、各サブフレームにおける固定符号ベクトルのパワーが均一化されるように、代替符号ベクトルに乗じる値(乗数)を決定するものである。尚、乗数の決定方法については、予めパルス数に乗数を対応付けて記憶しておいても良いし、パルス数から計算によって乗数を算出するようにしても良い。
【0075】
乗算器17は、バッファ切り出し処理部13から出力される代替固定符号ベクトルにパルス数カウント乗算決定部16から出力される乗数を乗算する一般的な乗算器である。
【0076】
次に、本発明の音声符号化装置における第2の固定符号帳探索部5の動作は、概ね第1の固定符号帳探索部5の動作動作と同様であるが、自乗誤差最小化部8から制御指示に従い、代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングで、代替固定符号ベクトル出力処理の指示があると、バッファ切り出し処理部13から代替固定符号ベクトルが出力され、パルス数カウント乗算決定部16が代替固定符号ベクトルを入力してパルス数がカウントされ、カウント結果に応じた乗数が決定されて出力され、乗算器17で代替固定符号ベクトルに乗数が乗算されて、ベクトルのパワーが均一化された代替固定符号ベクトルが固定符号帳探索部5からの固定符号ベクトル出力として外部に出力されることになる。
【0077】
上記自乗誤差最小化部8及び固定符号帳探索部5における通常処理サブフレームと代替処理サブフレームとの切替制御により、代替処理サブフレームにおける励振パラメータから固定符号が削減されるので、送信する音声符号化データのビットレートを軽減することができ、また固定符号帳探索部5における固定符号帳探索の負荷を軽減することができる。
【0078】
上記説明したように本発明の音声符号化方法及び音声符号化装置では、フレームを構成する複数サブフレームの中で、代替処理サブフレームにおける励振パラメータから固定符号を削減した音声符号化データを作成することになる。
それに伴い、この固定符号が削減された音声符号化データを受けて復号化する音声復号化方法及び音声復号化装置について説明する。
【0079】
本発明の音声復号化方法は、基本的には、符号化された励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、適応符号ベクトル及び固定符号ベクトル及び符号化された励振信号パラメータに基づく適応符号利得及び固定符号利得とから駆動音源信号を生成し、駆動音源信号と線形予測フィルタ係数を用いて音声信号を再生するものであるが、本発明の特徴として、励振信号パラメータの固定符号に基づいて固定符号ベクトルを生成する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、固定符号帳を用いて固定符号に対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとするものである。
【0080】
次に、上記説明した本発明に係る代数的符号励振予測方式(ACELP)の音声符号化に対応する音声復号化装置の概略構成例について図4を使って説明する。図4は、本発明に係る音声復号化装置の概略構成ブロック図である。
本発明の音声復号化装置は、図4に示すように、分離部31と、適応符号ベクトル出力部32と、固定符号ベクトル出力部33と、利得ベクトル出力部34と、乗算器35と、乗算器36と、加算器37と、LPC合成部38と、ポストフィルタ39とから構成されている。
尚、図には示していないが、フレームタイミング、サブフレームタイミングに従って、各部の動作をトータルに制御するようなタイミング制御部が音声復号化装置全体を制御している。
【0081】
本発明の音声復号化装置の各部について簡単に説明する。
分離部31は、受信した音声符号化データを適応符号(A)、固定符号(B)、利得符号(C)、LSP係数の符号(D)に分離して出力するものである。
【0082】
適応符号ベクトル出力部32は、適応符号(A)を復号してピッチ周期を求め出力すると共に、ピッチ周期に基づき過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出し適応符号ベクトルとして出力するものである。
【0083】
固定符号ベクトル出力部33は、予め音声符号化側と同様の複数のパルスに関するパルスの組み合わせベクトル(固定符号ベクトル)を記憶している固定符号帳を保持し、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づき、固定符号帳を用いてパルスを配置したパルス波形信号を固定符号ベクトルとして出力するものである。
但し、本発明の固定符号ベクトル出力部33では、通常処理サブフレーム(例えば、奇数サブフレーム)に付いては通常通り固定符号が送信されてくるが、代替処理サブフレームに付いては、固定符号が送信されてこないため、それに対応した動作で固定符号ベクトルを出力する点が、従来とは異なっている。詳細は、後述する。
【0084】
利得ベクトル出力部34は、利得符号(C)に基づき適応符号帳利得及び固定符号帳利得を出力するものである。
【0085】
乗算器35は、適応符号ベクトル出力部32からの適応符号ベクトルに、利得ベクトル出力部34からの適応符号帳利得を乗算するものである。
乗算器36は、固定符号ベクトル出力部33からの固定符号ベクトルに利得ベクトル出力部34からの固定符号帳利得を乗算するものである。
加算器37は、乗算器35による乗算結果と、乗算器36による乗算結果とを加算して後述するLPC合成部38の駆動音源信号を出力するものである。
【0086】
LPC合成部38は、LSP係数の符号(D)から求めたLPC係数と加算器37から出力される駆動音源信号とにより音声信号を再生し、再生音声信号を出力するものである。
ポストフィルタ39は、LSP係数の符号(D)から求めたLPC係数を用いて、LPC合成部38から出力される再生音声信号に対し、スペクトル整形等の処理を行い、音質が改善された再生音声を出力するものである。
【0087】
次に、本実施の形態に係る音声復号化装置の基本動作について図4を使って説明する。
本発明の音声復号化装置では、受信した音声符号化データが、分離部31で適応符号(A)、固定符号(B)、利得符号(C)、LSP係数の符号(D)に分離される。
【0088】
そして、適応符号(A)は、適応符号ベクトル出力部32で復号されてピッチ周期が求められ出力されると共に、ピッチ周期に基づき記憶されている過去の駆動音源信号からサブフレームにおけるサンプル数分の波形信号を切り出した適応符号ベクトルが出力される。
【0089】
一方、固定符号(B)は、固定符号ベクトル出力部33に入力され、固定符号(B)に示されたパルス位置及び極性(±)の組み合わせに基づきパルスを配置したパルス波形信号、又は過去の固定符号ベクトルを用いて生成された代替固定符号ベクトルの何れかが、固定符号ベクトルとして出力される。尚、詳細は、後述する。
【0090】
また、利得符号(C)は、利得ベクトル出力部34に入力されて適応符号帳利得及び固定符号帳利得が求められて出力される。
【0091】
そして、適応符号ベクトル出力部32からの適応符号ベクトルには乗算器35で利得ベクトル出力部34からの適応符号帳利得が乗算され、固定符号ベクトル出力部33からの固定符号ベクトルには乗算器36で利得ベクトル出力部34からの固定符号帳利得が乗算され、双方が加算器37により加算されてLPC合成部38の駆動音源信号として出力され、LPC合成部38に入力されると共に、適応符号ベクトル出力部32に入力されて過去の駆動音源信号として記憶される。
【0092】
加算器37から出力された駆動音源信号は、LPC合成部38で分離部31によって分離されたLSP係数の符号(D)から求めたLPC係数を用いて音声信号が再生され、再生音声信号となり、ポストフィルタ39で、LSP係数の符号(D)から求めたLPC係数を用いてスペクトル整形等の処理が行われ、音質が改善された再生音声が出力されるようになっている。
【0093】
上記図4を用いて説明した構成及び動作が、本発明の前提となる代数的符号励振予測方式(ACELP)の音声復号化装置の一般的な構成及び動作であるが、本発明の特徴部分は、励振パラメータ中の固定符号が代替処理サブフレームでは削減されているので、それに伴い固定符号ベクトルの取得方法が従来のそれとは異なっている。
【0094】
具体的には、フレームを構成する複数サブフレームの内、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)に付いては、通常通り固定符号が送信されてくるので、符号化側と同様の固定符号帳を用いて固定符号ベクトルを取得するが、符号化側で代替固定符号ベクトル出力処理を行った代替処理サブフレーム(例えば偶数サブフレーム)に付いては、固定符号が送信されてこないので、代替固定符号ベクトル出力処理として、過去の固定符号ベクトルを蓄積記憶しておき、過去の固定符号ベクトルを該当サブフレームにおける遅延(ピッチ周期)に同期した位置から切り出した代替固定符号ベクトルを取得し、この代替固定符号ベクトルを固定符号ベクトルとして出力するようにするものである。
【0095】
まず、本発明の音声復号化装置における固定符号ベクトル出力部33の第1の内部構成例について第1の実施の形態として、図5を使って説明する。図5は、本発明の第1の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。尚、図5の構成は、図2で説明した音声符号化側の第1の固定符号帳探索部5に対応する構成である。
【0096】
本発明の第1の音声復号化装置における固定符号ベクトル出力部33(第1の固定符号ベクトル出力部)の内部は、図5に示すように、符号帳処理部41と、固定符号ベクトル格納バッファ42と、バッファ切り出し処理部43と、バッファシフト処理部44と、スイッチ45と、切替制御部48とから構成されている。
【0097】
図5に示した第1の音声復号化装置における固定符号ベクトル出力部33の内部構成は、図2に示した音声符号化装置における固定符号帳探索部5の内部構成と基本的には同様であるが、但し、音声符号化装置における固定符号帳探索部5の符号帳処理部11は、自乗誤差最小化部8からの制御信号に従って誤差を最小化する固定符号帳を探索するが、音声復号化装置における固定符号ベクトル出力部33の符号帳処理部41は、分離部31からの固定符号(B)に対応する固定符号ベクトルを出力する点が異なっている。
【0098】
また、切替制御部48は、予め符号化側で定めた通常処理サブフレームと代替処理サブフレームとの設け方に従って、各動作系を切り替えるものである。
【0099】
その他の構成要素については、図2に示した音声符号化装置における固定符号帳探索部5の対応する構成要素と同様の動作をするものであるので、ここでは説明を省略する。
【0100】
次に、本発明の音声復号化装置における第1の固定符号ベクトル出力部33の動作について、図5を参照しながら説明する。
本発明の音声復号化装置における第1の固定符号ベクトル出力部33では、符号化側で通常の固定符号帳探索処理を行った通常処理サブフレーム(例えば、奇数サブフレーム)のタイミングでは、切替制御部48からの動作指示に従い、符号帳処理部41で分離部31から入力される固定符号(B)に対応する固定符号ベクトルが出力され、切替制御部48の制御によってスイッチ45が符号帳処理部41側に接続されて、符号帳処理部41から出力された固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0101】
そして、この時、符号帳処理部41から出力された固定符号ベクトルが固定符号ベクトル格納バッファ42に格納されるが、その際、固定符号ベクトル格納バッファ42に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部44を用いて1サブフレーム分シフトされて新しいて固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0102】
一方、符号化側で代替の探索処理を行ったサブフレーム(例えば、偶数サブフレーム)のタイミングでは、切替制御部48からの動作指示に従い、バッファ切り出し処理部43が動作し、バッファ切り出し処理部43で適応符号ベクトル出力部32からのピッチ周期情報を入力し、固定符号ベクトル格納バッファ42内に格納されているデータ系列を、入力されたピッチ周期の情報分さかのぼった個所から読み出せるように、バッファシフト処理部44を用いてピッチ周期の情報分シフトさせてから読み出し、代替固定符号ベクトルとして出力する。
【0103】
バッファ切り出し処理部43から出力された代替固定符号ベクトルは、切替制御部48の制御によって、スイッチ45がバッファ切り出し処理部43側に接続されて、バッファ切り出し処理部43から出力された代替固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力される。
【0104】
更に、この時、バッファ切り出し処理部43から出力された代替固定符号ベクトルは、固定符号ベクトル格納バッファ42に格納されるが、その際、固定符号ベクトル格納バッファ42に既に記憶されていた過去の代替符号ベクトルは、バッファシフト処理部44を用いて1サブフレーム分にシフトされて新しいて代替固定符号ベクトルが格納され、過去の固定符号ベクトルが更新されるようになっている。
【0105】
上記説明では、例として奇数サブフレームでは符号帳処理部41からの固定符号ベクトルが出力され、偶数サブフレームではバッファ切り出し処理部43からの代替固定符号ベクトルが現サブフレームにおける固定符号ベクトルとして選択されるように記述してきたが、逆の状態でも動作的には変わらない。
【0106】
次に、本発明の音声復号化装置における固定符号ベクトル出力部33の第2の内部構成例について第2の実施の形態として、図6を使って説明する。図6は、本発明の第2の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。尚、図6の構成は、図3で説明した音声符号化側の第2の固定符号帳探索部5に対応する構成である。
【0107】
本発明の第2の音声復号化装置における固定符号ベクトル出力部33(第2の固定符号ベクトル出力部)の内部は、図6に示すように、第1の固定符号ベクトル出力部33と同様の構成である符号帳処理部41と、固定符号ベクトル格納バッファ42と、バッファ切り出し処理部43と、バッファシフト処理部44と、スイッチ45と、切替制御部48とから構成され、更に第2の実施の形態の特徴部分として、パルス数カウント乗算決定部46と乗算器47とを設けている。
【0108】
ここで、符号帳処理部41,固定符号ベクトル格納バッファ42、バッファ切り出し処理部43、バッファシフト処理部44、スイッチ45、切替制御部48については、第1の固定符号ベクトル出力部33と同様であり、またパルス数カウント乗算決定部46、乗算器47は、符号化側で説明した第2の固定符号帳探索部5におけるパルス数カウント乗算決定部16及び乗算器17と同様のものである。
【0109】
次に、本発明の音声復号化装置における第2の固定符号ベクトル出力部33の動作は、概ね第1の固定符号ベクトル出力部33の動作動作と同様であるが、符号化側で代替固定符号ベクトル出力処理を行った代替処理サブフレーム(例えば、偶数サブフレーム)のタイミングでは、バッファ切り出し処理部43から代替固定符号ベクトルが出力されると、パルス数カウント乗算決定部46が代替固定符号ベクトルを入力してパルス数がカウントされ、カウント結果に応じた乗数が決定されて出力され、乗算器47で代替固定符号ベクトルに乗数が乗算されて、ベクトルのパワーが均一化された代替固定符号ベクトルが固定符号ベクトル出力部33からの固定符号ベクトル出力として外部に出力されることになる。
【0110】
次に、本発明の音声符号化方法において、通常の最小歪みパルス組み合わせ探索処理を行って探索結果の固定符号を送信する通常処理サブフレームと、固定符号を送信せず、過去の固定符号ベクトルから切り出した代替固定符号ベクトルを固定符号ベクトルとして用いる代替処理サブフレームとの設け方について、図7を使って説明する。図7は、本発明の音声符号化方法における通常処理サブフレームと代替処理サブフレームとの設け方を示す説明図である。
【0111】
ACELP方式の音声符号化を行う際に、LPC分析を行う単位であるフレームを複数(図7ではN個)のサブフレームで構成し、サブフレーム単位で、適応符号帳探索、固定符号帳探索、利得算出を行うものとする。
そして、N個のサブフレームをM(M≦N)個のサブフレームのグループに分け、本発明の音声符号化方法では、グループ内のM個のサブフレームの内、前半(前より)の一部(例えば1〜L)(1≦L<N)のサブフレームを、通常の最小歪みパルス組み合わせ探索を行う固定符号帳探索処理を行って探索結果の固定符号を送信する通常処理サブフレームとし、残りのサブフレーム(L+1〜M)を過去の固定符号ベクトルから切り出した代替固定符号ベクトルを用いる代替処理サブフレームとする。
【0112】
最も簡単な例としては、1フレームが2サブフレームで構成されるような場合に、第1サブフレームを通常処理サブフレームとし、第2サブフレームを代替処理サブフレームとする。
また、1フレームが4サブフレームで構成されるような場合に、2サブフレーム毎にグループ分けし、奇数サブフレームを通常処理サブフレームとし、偶数サブフレームを代替サブフレームとしても良いし、4サブフレームを1グループとして第1,2サブフレームを通常処理サブフレームとし、第3,4サブフレームを代替処理サブフレームとしても良い。
【0113】
また、1フレームが6サブフレームで構成されるような場合に、3サブフレーム毎にグループ分けし、第1、第4サブフレームを通常処理サブフレームとし、第2、第3、第5、第6サブフレームを代替処理サブフレームとしても良いし、第1,第2、第4,第5サブフレームを通常処理サブフレームとし、第3,第6サブフレームを代替処理サブフレームとしても良い。
【0114】
通常処理サブフレームと代替処理サブフレームとの配分を如何にするかは、再生音声精度とビットレート軽減率との兼ね合いであるが、通常処理サブフレームに対して代替処理サブフレームの割合を多くすると、ビットレート軽減率は向上するが、再生音声が劣化する可能性が増えることになり、逆に通常処理サブフレームに対して代替処理サブフレームの割合を少なくすると、再生音声の劣化は少なくなるがビットレート軽減率は余り向上しないことになる。
尚、本発明ではこの通常処理サブフレームと代替処理サブフレームとの具体的な配分方法については限定しないものとする。
【0115】
本発明をDSPプログラムなどによりハードウェア上で実現する場合、演算処理量の増加はほとんど生じず、使用メモリについても500ワード程度の増加のみで済むため、汎用固定小数点演算DSPで十分実現可能である。
【0116】
本発明の音声符号化方法によれば、従来はサブフレーム毎に行っていた固定符号帳探索処理を一部のサブフレーム(通常処理サブフレーム)(例えば奇数サブフレーム)で行って、当該通常処理サブフレームについては探索された固定符号を送信するものとし、残りのサブフレーム(代替処理サブフレーム)(例えば偶数サブフレーム)では、固定符号帳探索処理を行わず、固定符号を送信しないこととしているので、ビットレートを軽減できる効果がある。その結果、6.3kbpsを実現することができる。
【0117】
そして、本発明の音声符号化方法では、送信側及び受信側における音声再生の際の代替処理サブフレームの固定符号ベクトルは、記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0118】
本発明の音声符号化方法の実現する音声符号化装置によれば、自乗誤差最小化部8の制御によって、通常処理サブフレーム(例えば奇数サブフレーム)では、固定符号帳探索部5に対して通常の固定符号ベクトル探索を行わせて、探索された固定符号を送信し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号を送信しないこととし、固定符号帳探索部5に対して代替の固定符号ベクトル探索処理を行わせ、固定符号帳探索部5における代替の固定符号ベクトル探索処理は、固定符号ベクトル格納バッファ12及びバッファシフト処理部14に記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0119】
また、本発明の音声符号化方法に対応する音声復号化装置によれば、固定符号ベクトル出力部33において、通常処理サブフレーム(例えば奇数サブフレーム)では、受信した固定符号に従って固定符号ベクトルを出力し、代替処理サブフレーム(例えば偶数サブフレーム)では、固定符号が受信されないので、固定符号ベクトル格納バッファ42及びバッファシフト処理部44に記憶されている過去の固定符号ベクトルを用いて、当該サブフレームにおけるピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトルを切り出した代替固定符号ベクトルを固定符号ベクトルとするので、再生音声品質の劣化を極力抑えながら、ビットレートを軽減できる効果がある。
【0120】
本発明の音声符号化装置における第1の実施の形態に係る固定符号帳探索部によれば、通常サブフレーム(例えば奇数サブフレーム)では、符号帳処理部11で通常の固定符号ベクトル探索を行って固定符号を検出すると共に、固定符号ベクトルを出力し、固定符号ベクトルを過去分として固定符号ベクトル格納バッファ12及びバッファシフト処理部14を使って記憶しておき、代替サブフレーム(例えば偶数サブフレーム)では、バッファ切り出し処理部13が適応符号帳探索部4からのピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトル(代替固定符号ベクトル)を切り出して固定符号ベクトルとし、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ12及びバッファシフト処理部14を使って記憶していくので、固定符号ベクトル探索処理の回数を半減させて、負荷を軽減できる効果がある。
【0121】
また、本発明の音声符号化装置における第2の実施の形態に係る固定符号帳探索部によれば、バッファ切り出し処理部13で求めた代替固定符号ベクトルに対してパルス数に応じた乗数を乗算してパワーを均一化するので、再生音声品質を向上できる効果がある。
【0122】
本発明の音声復号装置における第1の実施の形態に係る固定符号ベクトル出力部によれば、通常処理サブフレーム(例えば奇数サブフレーム)では、符号帳処理部11で受信した固定符号に従って固定符号ベクトルを出力し、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ42及びバッファシフト処理部44を使って記憶しておき、代替処理サブフレーム(例えば偶数サブフレーム)では、バッファ切り出し処理部43が適応符号ベクトル出力部32からのピッチ周期の情報に従ってピッチ周期の情報分さかのぼった過去の固定符号ベクトル(代替固定符号ベクトル)を切り出して固定符号ベクトルとし、当該固定符号ベクトルを過去分として固定符号ベクトル格納バッファ42及びバッファシフト処理部44を使って記憶していくので、ビットレートを軽減しながら、再生音声品質の劣化は極力抑えることができる効果がある。
【0123】
また、本発明の音声復号化装置における第2の実施の形態に係る固定符号ベクトル出力部によれば、バッファ切り出し処理部43で求めた代替固定符号ベクトルに対してパルス数に応じた乗数を乗算してパワーを均一化するので、再生音声品質を向上できる効果がある。
【0124】
【発明の効果】
本発明によれば、聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、探索処理の結果から固定符号及び固定符号に対応する固定符号ベクトルを取得し、適応符号及び取得した固定符号及び適応符号利得及び固定符号利得を励振信号パラメータに含めて、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、代替処理サブフレームでは、固定符号帳の探索処理は行わず、適応符号及び適応符号利得及び固定符号利得を励振信号パラメータに含め、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得し、代替固定符号ベクトルのパルス数をカウントして、パルス数に基づいて代替固定符号ベクトルのエネルギーを均一にして固定符号ベクトルとし、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する音声符号化方法としているので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる効果がある。
【0125】
本発明によれば、励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームでは、予め備えている固定符号帳を用いて、励振信号パラメータに含まれる固定符号を固定符号帳のインデックスとして、インデックスに対応する固定符号ベクトルを取得し、代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする音声復号化方法としているので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる効果がある。
【0126】
本発明によれば、励振信号パラメータ抽出手段が、通常処理サブフレームでは、固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び取得した固定符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、代替処理サブフレームでは、固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、適応符号ベクトル出力手段からの適応符号及び利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含めるように制御し、固定符号ベクトル出力手段が、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、符号帳処理部が固定符号帳を探索して、聴覚重み付け誤差を最小化する固定符号ベクトル及び固定符号ベクトルに対応する固定符号帳のインデックスを検出し、検出された固定符号帳のインデックスを固定符号として出力し、検出された固定符号ベクトルをスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納し、励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、切り出し処理部が固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとしてスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する音声符号化装置としているので、演算量を増加することなく、再生音声品質劣化を極力抑えて、ビットレートを軽減でき、且つ固定符号帳探索処理の負荷を軽減できる。
【0127】
本発明によれば、固定符号ベクトル出力手段が、音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、通常処理サブフレームの場合の動作系と代替処理サブフレームの場合の動作系とを切替制御手段で切り替え、切替制御手段の制御で通常処理サブフレームの場合に、固定符号帳を用いて、分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、取得した固定符号ベクトルをスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した固定符号ベクトルを固定符号ベクトル格納バッファに格納し、切替制御手段の制御で代替処理サブフレームの場合に、切り出し処理部が固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを固定符号ベクトルとしてスイッチを介して外部に出力すると共に、固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、取得した代替固定符号ベクトルを固定符号ベクトル格納バッファに格納する音声復号化装置としているので、ビットレートが軽減されていても、演算量を増加することなく、再生音声品質劣化を極力抑えることができる効果がある。
【図面の簡単な説明】
【図1】本発明に係る音声符号化装置の概略構成ブロック図である。
【図2】本発明の第1の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
【図3】本発明の第2の実施の形態の音声符号化装置における固定符号帳探索部5の内部構成を示すブロック図である。
【図4】本発明に係る音声復号化装置の概略構成ブロック図である。
【図5】本発明の第1の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。
【図6】本発明の第2の実施の形態の音声復号化装置における固定符号ベクトル出力部33の内部構成を示すブロック図である。
【図7】本発明の音声符号化方法における通常サブフレームと代替サブフレームとの設け方を示す説明図である。
【符号の説明】
1…前処理部、 2…LPC分析量子化補間処理部、 3…聴覚重み付け処理部、 4…適応符号帳探索部、 5…固定符号帳探索部、 6…利得算出部、 7…LPC合成部、 8…自乗誤差最小化部、 9…多重化処理部、 11…符号帳処理部、 12…固定符号ベクトル格納バッファ、 13…バッファ切り出し処理部、 14…バッファシフト処理部、 15…スイッチ、 16…パルス数カウント乗算決定部、 17…乗算器、 18…切替制御部、 20…加算器、 21…乗算器、 22…乗算器、 23…加算器、 31…分離部、 32…適応符号ベクトル出力部、 33…固定符号ベクトル出力部、 34…利得ベクトル出力部、 35…乗算器、 36…乗算器、 37…加算器、 38…LPC合成部、 39…ポストフィルタ、 41…符号帳処理部、 42…固定符号ベクトル格納バッファ、 43…バッファ切り出し処理部、 44…バッファシフト処理部、 45…スイッチ、 46…パルス数カウント乗算決定部、 47…乗算器、 48…切替制御部
Claims (8)
- 1フレームを複数のサブフレームで構成する入力音声信号について、フレーム単位で音声信号を分析して線形予測フィルタ係数を求め、前記入力音声信号と合成された再生音声信号との誤差信号に対して聴覚重み付けした聴覚重み付け誤差を求め、サブフレーム単位で前記聴覚重み付け誤差を最小化するような適応符号及び固定符号及び適応符号利得及び固定符号利得とを取得して励振信号パラメータとし、前記フレーム単位の線形予測フィルタ係数と前記サブフレーム単位の励振信号パラメータとを音声符号化データとすると共に、前記取得した励振信号パラメータの適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて再生音声信号を合成する代数的符号励振予測方式の音声符号化方法であって、
前記聴覚重み付け誤差を最小化するような固定符号及び固定符号ベクトルの取得制御方法が、
前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
前記通常処理サブフレームでは、予め備えている固定符号帳について探索処理を行い、前記探索処理の結果から固定符号及び前記固定符号に対応する固定符号ベクトルを取得し、前記適応符号及び前記取得した固定符号及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含めて、
前記代替処理サブフレームでは、前記固定符号帳の探索処理は行わず、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとし、前記適応符号及び前記適応符号利得及び前記固定符号利得を励振信号パラメータに含める取得制御方法であることを特徴とする音声符号化方法。 - 固定符号及び固定符号ベクトルの取得制御方法が、
通常処理サブフレームでは、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、前記聴覚重み付け誤差を最小化する固定符号ベクトル及び前記固定符号ベクトルに対応する固定符号帳のインデックスを検出し、前記検出された固定符号帳のインデックスを固定符号として出力し、前記検出された固定符号ベクトルを出力すると共に、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを過去の固定符号ベクトルとして記憶し、
代替処理サブフレームでは、記憶されている過去の固定符号ベクトルを当該サブフレームにおけるピッチ周期に同期した位置からサブフレームにおけるサンプル数分切り出して代替固定符号ベクトルを取得し、前記代替固定符号ベクトルを当該サブフレームにおける固定符号ベクトルとして出力すると共に、既に記憶されている過去の固定符号ベクトルをサブフレームにおけるサンプル数分シフトしてから、前記代替固定符号ベクトルを過去の固定符号ベクトルとして記憶する取得制御方法であることを特徴とする請求項1記載の音声符号化方法。 - 代替処理サブフレームにおいて、代替固定符号ベクトルのパルス数をカウントし、前記パルス数に基づいて前記代替固定符号ベクトルのエネルギーを均一にすることを特徴とする請求項2記載の音声符号化方法。
- 請求項1記載の音声符号化方法で符号化された音声符号化データについて、前記音声符号化データにおける励振信号パラメータに含まれる適応符号に基づく適応符号ベクトル及び固定符号に基づく固定符号ベクトルを取得し、前記適応符号ベクトル及び前記固定符号ベクトル及び前記励振信号パラメータに含まれる適応符号利得及び固定符号利得とから駆動音源信号を生成し、前記駆動音源信号と前記線形予測フィルタ係数を用いて音声信号を再生する音声復号化方法であって、
前記励振信号パラメータに含まれる固定符号に基づいて固定符号ベクトルを取得する方法が、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
前記通常処理サブフレームでは、予め備えている固定符号帳を用いて、前記励振信号パラメータに含まれる固定符号を前記固定符号帳のインデックスとして、前記インデックスに対応する固定符号ベクトルを取得し、
前記代替処理サブフレームでは、過去の固定符号ベクトルを該当サブフレームにおけるピッチ周期に基づいて切り出した代替固定符号ベクトルを取得して固定符号ベクトルとする取得方法であることを特徴とする音声復号化方法。 - 1フレームを複数のサブフレームで構成する音声信号を入力し、フレーム単位で前記音声信号を線形予測分析して線形予測フィルタ係数を求める線形予測分析手段と、
前記音声信号と合成された再生音声信号との誤差信号を求める減算手段と、
前記誤差信号に聴覚重み付けを行い聴覚重み付け誤差信号を出力する聴覚重み付け手段と、
前記聴覚重み付け誤差信号を入力し、サブフレーム単位で、前記聴覚重み付け誤差を最小化するような、適応符号及び固定符号と適応符号利得及び固定符号利得とを取得するための制御を行い、取得された適応符号及び固定符号及び適応符号利得及び固定符号利得を励振信号パラメータとして出力する励振信号パラメータ抽出手段と、
前記励振信号パラメータ抽出手段の制御に従い、過去の駆動音源信号から前記聴覚重み付け誤差信号を最小化するようなピッチ周期を検出し、前記検出されたピッチ周期の情報を適応符号として出力すると共に、前記ピッチ周期の情報と過去の駆動音源信号から求めた適応符号ベクトルを出力する適応符号ベクトル出力手段と、
前記励振信号パラメータ抽出手段の制御に従い、前記聴覚重み付け誤差信号を最小化するような固定符号及び固定符号ベクトルを出力する固定符号ベクトル出力手段と、
前記励振信号パラメータ抽出手段からの制御に従い、前記適応符号ベクトルに関する適応符号利得と、前記固定符号ベクトルに関する固定符号利得とを求めて出力する利得出力手段と、
前記適応符号ベクトル出力手段からの適応符号ベクトルと、前記固定符号ベクトル出力手段からの固定符号ベクトルと、前記利得出力手段からの適応符号利得及び固定符号利得とから駆動音源信号を生成する駆動音源信号生成手段と、
前記駆動音源信号と、前記線形予測分析手段からの線形予測フィルタ係数に基づいて再生音声信号を合成する再生音声合成手段とを備え、
前記励振信号パラメータ抽出手段が、
前記フレームを構成する複数のサブフレームを同数のサブフレームで構成されるグループに分割し、前記グループ内の前半の一部のサブフレームを通常処理サブフレームとし、残りのサブフレームを代替処理サブフレームとして、
前記通常処理サブフレームでは、前記固定符号ベクトル出力手段に対して、固定符号帳探索処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記取得した固定符号及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含め、
前記代替処理サブフレームでは、前記固定符号ベクトル出力手段に対して、代替固定符号ベクトル出力処理を行わせる指示を出力し、前記適応符号ベクトル出力手段からの適応符号及び前記利得出力手段からの適応符号利得及び固定符号利得を励振信号パラメータに含める励振信号パラメータ抽出手段であり、
前記固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
励振信号パラメータ抽出手段からの指示が固定符号帳探索処理の指示であった場合に、予め複数の固定符号ベクトルが定められている固定符号帳を探索して、前記聴覚重み付け誤差を最小化する固定符号ベクトル及び前記固定符号ベクトルに対応する固定符号帳のインデックスを検出し、前記検出された固定符号帳のインデックスを固定符号として出力し、前記検出された固定符号ベクトルを出力すると共に、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記固定符号ベクトル格納バッファに格納する符号帳処理部と、
前記励振信号パラメータ抽出手段からの指示が代替固定符号ベクトル出力処理の指示であった場合に、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、前記取得した代替固定符号ベクトルを前記固定符号ベクトル格納バッファに格納する切り出し処理部と、
前記励振信号パラメータ抽出手段からの指示が通常の探索処理の指示であった場合に、前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記励振信号パラメータ抽出手段からの指示が代替の探索処理の指示であった場合に、前記切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とする音声符号化装置。 - 固定符号ベクトル出力手段が、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、前記パルス数に基づいて前記代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、前記乗数を前記切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器とを設けた固定符号ベクトル出力手段であることを特徴とする請求項5記載の音声符号化装置。
- 請求項4記載の音声符号化装置で符号化された音声符号化データから適応符号と固定符号と、適応符号及び固定符号の利得と、線形予測フィルタ係数とを分離する分離手段と、
前記分離された適応符号を復号してピッチ周期の情報を出力すると共に、前記ピッチ周期の情報に基づき過去の駆動音源信号から適応符号ベクトルを出力する適応符号ベクトル出力手段と、
前記分離された固定符号に基づき、固定符号ベクトルを出力する固定符号ベクトル出力手段と、
前記分離された適応符号及び固定符号の利得に基づき適応符号帳利得及び固定符号帳利得を出力する利得ベクトル出力手段と、
前記適応符号ベクトル及び前記固定符号ベクトル及び前記適応符号帳利得及び前記固定符号帳利得とから駆動音源信号を生成する駆動音源信号生成手段と、
前記駆動音源信号と前記線形予測フィルタ係数とから音声信号を再生する音声再生手段とを備え、
前記固定符号ベクトル出力手段が、
過去の固定符号ベクトルを記憶する固定符号ベクトル格納バッファと、
前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルをシフトするためのバッファシフト処理部と、
音声符号化側で定められた通常処理サブフレームと代替処理サブフレームについて、
前記通常処理サブフレームの場合の動作系と前記代替処理サブフレームの場合の動作系とを切り替える切替制御手段と、
前記切替制御手段の制御で前記通常処理サブフレームの場合に、予め複数の固定符号ベクトルが定められている固定符号帳を用いて、前記分離手段で分離された固定符号に対応する固定符号ベクトルを取得し、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、前記取得した固定符号ベクトルを前記固定符号ベクトル格納バッファに格納する符号帳処理部と、前記切替制御手段の制御で前記代替処理サブフレームの場合に、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてシフトさせて、適応符号ベクトル出力手段からのピッチ周期の情報に同期した位置から切り出した代替固定符号ベクトルを出力すると共に、前記固定符号ベクトル格納バッファに記憶されている過去の固定符号ベクトルを、前記バッファシフト処理部を用いてサブフレームにおけるサンプル数分シフトしてから、前記取得した代替固定符号ベクトルを前記固定符号ベクトル格納バッファに格納する切り出し処理部と、
前記切替制御手段の制御で、前記通常処理サブフレームの場合に前記符号帳処理部からの固定符号ベクトルを外部に出力し、前記代替処理サブフレームの場合に前記切り出し処理部からの代替固定符号ベクトルを外部に出力するように切り替えるスイッチとを有する固定符号ベクトル出力手段であることを特徴とする音声復号化装置。 - 固定符号ベクトル出力手段が、切り出し処理部から出力される代替固定符号ベクトルのパルス数をカウントし、前記パルス数に基づいて前記代替固定符号ベクトルのエネルギーを均一にする乗数を決定するパルス数カウント乗算決定部と、前記乗数を前記切り出し処理部から出力される代替固定符号ベクトルに乗算する乗算器とを設けた固定符号ベクトル出力手段であることを特徴とする請求項7記載の音声復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172264A JP2004020675A (ja) | 2002-06-13 | 2002-06-13 | 音声符号化/復号化方法及び音声符号化/復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172264A JP2004020675A (ja) | 2002-06-13 | 2002-06-13 | 音声符号化/復号化方法及び音声符号化/復号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004020675A true JP2004020675A (ja) | 2004-01-22 |
Family
ID=31171878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002172264A Pending JP2004020675A (ja) | 2002-06-13 | 2002-06-13 | 音声符号化/復号化方法及び音声符号化/復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004020675A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107516530A (zh) * | 2012-10-01 | 2017-12-26 | 日本电信电话株式会社 | 编码方法、编码装置、程序以及记录介质 |
-
2002
- 2002-06-13 JP JP2002172264A patent/JP2004020675A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107516530A (zh) * | 2012-10-01 | 2017-12-26 | 日本电信电话株式会社 | 编码方法、编码装置、程序以及记录介质 |
CN107516530B (zh) * | 2012-10-01 | 2020-08-25 | 日本电信电话株式会社 | 编码方法、编码装置以及记录介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2737465C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
JP4263412B2 (ja) | 音声符号変換方法 | |
US20020077812A1 (en) | Voice code conversion apparatus | |
KR20010099763A (ko) | 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법 | |
JP2004514182A (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
JP4304360B2 (ja) | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 | |
KR20070028373A (ko) | 음성음악 복호화 장치 및 음성음악 복호화 방법 | |
KR20070029754A (ko) | 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
JPH09319398A (ja) | 信号符号化装置 | |
JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
JP4236675B2 (ja) | 音声符号変換方法および装置 | |
JP2004020675A (ja) | 音声符号化/復号化方法及び音声符号化/復号化装置 | |
JP2004020676A (ja) | 音声符号化/復号化方法及び音声符号化/復号化装置 | |
US20040049381A1 (en) | Speech coding method and speech coder | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
RU2792658C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
RU2776261C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
JP2004109803A (ja) | 音声符号化装置及び方法 | |
JPH04301900A (ja) | 音声符号化装置 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP2018124304A (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 | |
JP2004061558A (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 | |
JP2004157381A (ja) | 音声符号化装置及び方法 | |
JPH043878B2 (ja) |