JPH0944195A

JPH0944195A - 音声符号化装置

Info

Publication number: JPH0944195A
Application number: JP7192176A
Authority: JP
Inventors: Shinichi Taumi; 真一田海; Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1995-07-27
Filing date: 1995-07-27
Publication date: 1997-02-14
Anticipated expiration: 2015-07-27
Also published as: CA2182159C; US6006178A; EP0756268A2; EP0756268A3; DE69630177D1; JP3616432B2; CA2182159A1; DE69630177T2; EP0756268B1

Abstract

(57)【要約】【課題】音声符号化装置において伝送ビット数を増や
すことなく、実質的にコードブックサイズを増加させ
る。【解決手段】ゲインコードブック切替え回路１１２０
は短期予測ゲイン計算回路１１１０から短期予測ゲイン
を、入力端子１０５０からモード情報を受け、所定のモ
ードの際、短期予測ゲインを所定の閾値と比べゲインコ
ードブック切替情報をゲイン量子化回路１１３０へ出力
する。ゲイン量子化回路は適応コードベクトル、音源コ
ードベクトル、インパルス応答情報、及びゲインコード
ブック切替え情報を受け、入力端子１０６０又は入力端
子１０７０のうちゲインコードブック切替え情報で選択
された入力端子に接続されるゲインコードブックからゲ
インコードベクトルを受け、選択された音源コードベク
トルに対して音源コードベクトルとゲインコードブック
切替え情報とにより切り替えられたゲインコードブック
中のゲインコードベクトルとの組み合わせを選択する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声信号を低遅
延、特に、５ｍｓ−１０ｍｓ以下の短いフレーム単位で
高品質に符号化するための音声符号化装置に関する。

【０００２】

【従来の技術】従来、音声信号を符号化する方式とし
て、例えば、Ｋ．Ｏｚａｗａ氏らによる”Ｍ−ＬＣＥＬ
ＰＳｐｅｅｃｈＣｏｄｉｎｇａｔ４ｋｂ／ｓ
ｗｉｔｈＭｕｌｔｉ−ＭｏｄｅａｎｄＭｕｌｔ
ｉ−Ｃｏｄｅｂｏｏｋ”（ＩＥＩＣＥＴｒａｎｓ．Ｃ
ｏｍｍｕｎ．，ｖｏｌ．Ｅ７７−Ｂ，Ｎｏ．９，ｐｐ．
１１１４−１１２１，１９９４年）と題した論文（文献
１）が知られている。

【０００３】この従来例では、送信側で、線形予測（Ｌ
ＰＣ）分析を用いて、フレーム毎（例えば４０ｍｓ）に
音声信号からスペクトル特性を表すスペクトルパラメー
タを抽出し、フレーム単位の信号又はフレーム単位の信
号に聴感重み付けを行った信号からその特徴量を計算し
て、この特徴量を用いてモード判別（例えば、母音部と
子音部）を行って、モード判別結果に応じてアルゴリズ
ムあるいはコードブックを切りかえて音声符号化を行っ
ている。

【０００４】符号化部では、フレームをさらにサブフレ
ーム（例えば８ｍｓ）に分割し、サブフレーム毎に過去
の音源信号を基に適応コードブックにおけるパラメータ
（ピッチ周期に対応する遅延パラメータとゲインパラメ
ータ）を抽出し適応コードブックにより前記サブフレー
ムの音声信号をピッチ予測し、ピッチ予測して求めた残
差信号に対して、予め定められた種類の雑音信号からな
る音源コードブック（ベクトル量子化コードブック）か
ら最適音源コードベクトルを選択し最適なゲインを計算
することにより、音源信号を量子化する。音源コードベ
クトルの選択の仕方は、選択した雑音信号により合成し
た信号と、前記残差信号との誤差電力を最小化するよう
に行う。そして、選択されたコードベクトルの種類を表
すインデクスとゲインならびに、前記スペクトルパラメ
ータと適応コードブックのパラメータをマルチプレクサ
部により組み合わせて伝送する。

【０００５】

【発明が解決しようとする課題】ところで、従来の音声
符号化では、コードブックサイズが限られている関係
上、十分な音質性能を得ることができないという問題点
がある。

【０００６】本発明の目的は、伝送するビット数を増や
すことなしに、数倍のサイズのコードブックを有するこ
とと等しい機能を有する音声符号化装置を提供すること
にある。

【０００７】

【課題を解決するための手段】本発明によれば、音声信
号を予め定めたフレーム単位に区切るフレーム分割部
と、前記音声信号から少なくとも１種類の第１の特徴量
を計算しモード判別を行なうモード判別部と、前記モー
ド判別結果に応じて前記音声信号の符号化処理を行う符
号化部を有する音声符号化装置において、予め定められ
たモードが選択された場合に、前記音声信号から求めた
少なくとも１種類の第２の特徴量に応じて、予め格納さ
れた複数の符号帳を切替える符号帳切り替え部を有する
ことを特徴とする音声符号化装置が得られる。

【０００８】また、本発明によれば、音声信号を予め定
めたフレーム単位に区切るフレーム分割部と、前記音声
信号から少なくとも１種類の第１の特徴量を計算しモー
ド判別を行なうモード判別部と、前記モード判別結果に
応じて前記音声信号の符号化処理を行う符号化部を有す
る音声符号化装置において、予め定められたモードが選
択された場合に、前記音声信号から求めた少なくとも１
種類の第２の特徴量に応じて、予め格納された複数の符
号帳を切替える符号帳切り替え部を有し、前記第２の特
徴量には、少なくとも１種類以上の特徴量の時間変化比
が特徴量として含まれる音声符号化装置が得られる。

【０００９】さらに、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも１種類の第１の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
１種類の第２の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第２の
特徴量には、現フレーム又は過去の少なくとも１つ以上
のフレームのいずれかの２フレーム分のそれぞれの特徴
量に対して、前記２つの特徴量の比が特徴量として含ま
れる音声符号化装置が得られる。

【００１０】加えて、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも１種類の第１の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
１種類の第２の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第２の
特徴量には、上記の特徴量の時間変化比又は２つの特徴
量の比の他に、ピッチ予測ゲイン、短期予測ゲイン、レ
ベル、及びピッチの少なくとも１種が特徴量として含ま
れる音声符号化装置が得られる。

【００１１】そして、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも１種類の第１の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
１種類の第２の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第２の
特徴量には、上記の特徴量の時間変化比又は２つの特徴
量の比が含まれ、前記複数の符号帳として、複数のＲＭ
Ｓコードブック、複数のＬＳＰコードブック、複数の適
応コードブック、複数の音源コードブック、及び複数の
ゲインコードブックのいずれかが備えられていることを
特徴とする音声符号化装置が得られる。

【００１２】前記構成により、伝送するビット数を増や
すことなしに、予め定められたモードにおいて複数のコ
ードブックを切り替えることにより、数倍のサイズのコ
ードブックを有することと等しい機能を有するため、音
質の改善が行われる。

【００１３】

【発明の実施の形態】以下本発明について図面を参照し
て説明する。ここでは、一例として、予め定められたモ
ードにおいて、複数のゲインコードブックを切り替える
例について説明する。

【００１４】本発明による音声符号化装置の実施例１を
図１に示す。ここでは、予め定められたモードにおい
て、第２の特徴量を用いてゲインコードブックを切替え
る構成について説明する。

【００１５】図１を参照して、入力端子１００から音声
信号を入力し、フレーム分割回路１１０では音声信号を
所定のフレーム長（例えば５ｍｓ）毎に分割し、サブフ
レーム分割回路１２０では、１フレームの音声信号をフ
レームよりも短いサブフレーム（例えば２．５ｍｓ）に
分割する。

【００１６】スペクトルパラメータ計算回路２００で
は、少なくとも１つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓（例えば２４ｍｓ）を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数（例えばＰ＝１０次）計算する。こ
こでスペクトルパラメータの計算には、周知のＬＰＣ分
析又はＢｕｒｇ分析等を用いることができる。ここで
は、Ｂｕｒｇ分析を用いることとする。Ｂｕｒｇ分析の
詳細については、例えば、”信号解析とシステム同定”
（コロナ社１９８８年刊、中溝著）の８２〜８７頁（文
献２）に記載されているので説明は略する。さらに、ス
ペクトルパラメータ計算部では、Ｂｕｒｇ法により計算
された線形予測係数α_i（ｉ＝１，…，１０）を量子化
及び補間に適したＬＳＰパラメータに変換する。ここ
で、線形予測係数からＬＳＰへの変換は、菅村他によ
る”線スペクトル対（ＬＳＰ）音声分析合成方式による
音声情報圧縮”と題した論文（電子通信学会論文誌、Ｊ
６４−Ａ、ｐｐ．５９９−６０６、１９８１年）（文献
３）を参照することができる。つまり、第２サブフレー
ムでＢｕｒｇ法により求めた線形予測係数を、ＬＳＰパ
ラメータに変換し、第１サブフレームのＬＳＰを直線補
間により求めて、第１サブフレームのＬＳＰを逆変換し
て線形予測係数に戻し、第１、２サブフレームの線形予
測係数α_il（ｉ＝１，…，１０，ｌ＝１，…，５）を聴
感重み付け回路２３０に出力する。また、第１、２サブ
フレームのＬＳＰをスペクトルパラメータ量子化回路２
１０へ出力する。

【００１７】スペクトルパラメータ量子化回路２１０で
は、予め定められたサブフレームのＬＳＰパラメータを
効率的に量子化する。以下では、量子化法として、ベク
トル量子化を用いるものとし、第２サブフレームのＬＳ
Ｐパラメータを量子化するものとする。ＬＳＰパラメー
タのベクトル量子化の手法は周知の手法を用いることが
できる。具体的な方法として、例えば、特開平４−１７
１５００号公報（文献４）、特開平４−３６３０００号
公報（文献５）、特開平５−６１９９号公報（文献
６）、又はＴ．Ｎｏｍｕｒａｅｔａｌ．，による”
ＬＳＰＣｏｄｉｎｇＵｓｉｎｇＶＱ−ＳＶＱＷｉ
ｔｈＩｎｔｅｒｐｏｌａｔｉｏｎｉｎ４．０７５
ｋｂｐｓＭ−ＬＣＥＬＰＳｐｅｅｃｈＣｏｄｅ
ｒ”と題した論文（Ｐｒｏｃ．ＭｏｂｉｌｅＭｕｌｔ
ｉｍｅｄｉａＣｏｍｍｕｎｉｃａｔｉｏｎｓ，ｐｐ．
Ｂ．２．５，１９９３）（文献７）を参照できるのでこ
こでは説明を省略する。また、スペクトルパラメータ量
子化回路２１０では、第２サブフレームで量子化したＬ
ＳＰパラメータをもとに、第１、２サブフレームのＬＳ
Ｐパラメータを復元する。ここでは、現フレームの第２
サブフレームの量子化ＬＳＰパラメータと１つ過去のフ
レームの第２サブフレームの量子化ＬＳＰを直線補間し
て、第１、２サブフレームのＬＳＰを復元する。ここ
で、量子化前のＬＳＰと量子化後のＬＳＰとの誤差電力
を最小化するコードベクトルを１種類選択した後に、直
線補間により第１〜第４サブフレームのＬＳＰを復元で
きる。さらに性能を向上させるためには、前記誤差電力
を最小化するコードベクトルを複数候補選択したのち
に、各々の候補について、累積歪を評価し、累積歪を最
小化する候補と補間ＬＳＰの組を選択するようにするこ
とができる。

【００１８】以上により復元した第１、２サブフレーム
のＬＳＰと第２サブフレームの量子化ＬＳＰをサブフレ
ーム毎に線形予測係数α′_il（ｉ＝１，…，１０，ｌ＝
１，…，５）に変換し、インパルス応答計算回路３１０
へ出力する。また、第２サブフレームの量子化ＬＳＰの
コードベクトルを表すインデクスをマルチプレクサ４０
０に出力する。

【００１９】上記において、直線補間のかわりに、ＬＳ
Ｐの補間パターンをあらかじめ定められたビット数（例
えば２ビット）分用意しておき、これらのパターンの各
々に対して１、２サブフレームのＬＳＰを復元して累積
歪を最小化するコードベクトルと補間パターンの組を選
択するようにしてもよい。このようにすると補間パター
ンのビット数だけ伝送情報が増加するが、ＬＳＰのフレ
ーム内での時間的な変化をより精密に表すことができ
る。ここで、補間パターンは、トレーニング用のＬＳＰ
データを用いて予め学習して作成してもよいし、予め定
められたパターンを格納しておいてもよい。予め定めら
れたパターンとしては、例えば、Ｔ．Ｔａｎｉｇｕｃｈ
ｅｔａｌによる”ＩｍｐｒｏｖｅｄＣＥＬＰ
ｓｐｅｅｃｈｃｏｄｉｎｇａｔ４ｋｂ／ｓａｎ
ｄｂｅｌｏｗ”と題した論文（Ｐｒｏｃ．ＩＣＳＬ
Ｐ，ｐｐ．４１−４４，１９９２）（文献８）に記載さ
れたパターンを用いることができる。また、さらに性能
を改善するためには、補間パターンを選択した後に、予
め定められたサブフレームにおいて、ＬＳＰの真の値と
ＬＳＰの補間値との誤差信号を求め、前記誤差信号をさ
らに誤差コードブックで表すようにしてもよい。

【００２０】聴感重み付け回路２３０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に量子
化前の線形予測係数α_il（ｉ＝１，…，１０，ｌ＝１，
…，５）を入力し、前記文献１にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行い、聴感重み付
け信号を出力する。

【００２１】モード判別回路２５０は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号を受取り
ピッチ予測ゲインと、予め定めた閾値に対し、モードを
決め（例えば母音部と子音部）、モード判別結果を適応
コードブック回路５００、音源量子化回路３５０へ出力
する。

【００２２】図１にもどり、応答信号計算回路２４０
は、スペクトルパラメータ計算回路２００から、各サブ
フレーム毎に線形予測係数α_ilを入力し、スペクトルパ
ラメータ量子化回路２１０から、量子化、補間して復元
した線形予測係数α′_ilをサブフレーム毎に入力し、保
存されているフィルタメモリの値を用いて、入力信号ｄ
（ｎ）＝０とした応答信号を１サブフレーム分計算し、
減算器２３５へ出力する。ここで、応答信号ｘ_z（ｎ）
は数１で表される。

【００２３】

【数１】ここで、γは、聴感重み付け量を制御する重み係数であ
り、下記の数３と同一の値である。

【００２４】減算器２３５は、数２により、聴感重み付
け信号から応答信号を１サブフレーム分減算し、ｘ′_w
（ｎ）を適応コードブック回路３００へ出力する。

【００２５】

【数２】インパルス応答計算回路３１０は、ｚ変換が数３で表さ
れる重み付けフィルタのインパルス応答ｈ_w（ｎ）を予
め定められた点数Ｌだけ計算し、適応コードブック回路
３００、音源量子化回路３５０へ出力する。

【００２６】

【数３】適応コードブック回路５００は、ピッチパラメータを求
める。詳細は前記文献２を参照することができる。ま
た、適応コードブックによりピッチ予測を数４に従い行
い、適応コードブック予測残差信号ｚ（ｎ）を出力す
る。

【００２７】

【数４】ここで、ｂ（ｎ）は、適応コードブックピッチ予測信号
であり、数５で表せる。

【００２８】

【数５】ここで、β、Ｔは、それぞれ、適応コードブックのゲイ
ン、遅延を示す。ｖ（ｎ）は適応コードベクトルであ
る。記号＊は畳み込み演算を示す。

【００２９】不均一パルス数型スパース音源コードブッ
ク３５１は、各々のベクトルの０でない成分の個数が異
なるスパースコードブックである。

【００３０】音源量子化回路３５０では、音源コードブ
ック３５１に格納された音源コードベクトルの全部ある
いは一部に対して、数６を最小化するように、最良の音
源コードベクトルｃ_j（ｎ）を選択する。このとき、最
良のコードベクトルを１種選択してもよいし、２種以上
のコードベクトルを選んでおいて、ゲイン量子化の際
に、１種に本選択してもよい。ここでは、２種以上のコ
ードベクトルを選んでおくものとする。数６において、
ｚ（ｎ）は選ばれた適応コードベクトルとの予測残差信
号である。

【００３１】

【数６】なお、一部の音源コードベクトルに対してのみ、数６を
適用するときには、複数個の音源コードベクトルをあら
かじめ予備選択しておき、予備選択された音源コードベ
クトルに対して、数６を適用することもできる。

【００３２】ゲイン量子化回路３６５は、モード判別回
路２５０からモード判別情報を、スペクトルパラメータ
計算回路２００からスペクトルパラメータを受け取り、
モード判別情報が予め定められたモードのときに、第２
の特徴量を用いてゲインコードブック３７１とゲインコ
ードブック３７２のいずれか一方を選択し、選択された
ゲインコードブックからゲインコードベクトルを読みだ
して、インデクスをマルチプレクサ４００に出力する。

【００３３】図２を参照して、ゲイン量子化回路３６５
を説明する。短期予測ゲイン計算回路１１１０は入力端
子１０４０からスペクトルパラメータを受け取り、第２
の特徴量として、数７に従い短期予測ゲインＧを計算
し、ゲインコードブック切替え回路１１２０に出力す
る。

【００３４】

【数７】ゲインコードブック切替え回路１１２０は、短期予測ゲ
イン計算回路１１１０から、短期予測ゲインを、入力端
子１０５０からモード情報を受け取り、予め定められた
モードの場合に、短期予測ゲインを、予め定めた閾値と
比べてゲインコードブック切替え情報をゲイン量子化回
路１１３０へ出力する。ゲイン量子化回路１１３０は、
入力端子１０１０から適応コードベクトルを、入力端子
１０２０から音源コードベクトルを、入力端子１０３０
からインパルス応答情報を、ゲインコードブック切替え
回路１１２０からゲインコードブック切替え情報を入力
し、入力端子１０６０あるいは入力端子１０７０のう
ち、ゲインコードブック切替え情報により選択された入
力端子に接続されるゲインコードブックからゲインコー
ドベクトルを受け取り、選択された音源コードベクトル
に対して、数８を最小化するように、音源コードベクト
ルと、ゲインコードブックに切替え情報により切り替え
られた、ゲインコードブック中のゲインコードベクトル
との組み合わせを選択する。

【００３５】

【数８】ここでβ′k ，γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブックに格納さ
れた２次元ゲインコードブックにおけるｋ番目のコード
ベクトルである。選択された音源コードベクトルとゲイ
ンコードベクトルを表すインデクスを出力端子１０８０
に出力する。

【００３６】重み付け信号計算回路３６０は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず、数９にもとづき駆動
音源信号ｖ（ｎ）を求める。

【００３７】

【数９】次に、スペクトルパラメータ計算回路２００の出力パラ
メータ、スペクトルパラメータ量子化回路２１０の出力
パラメータを用いて数１０により重み付け信号ｓw
（ｎ）をサブフレーム毎に計算し、応答信号計算回路２
４０へ出力する。

【００３８】

【数１０】次に、本発明による音声符号化装置の実施例２について
説明する。

【００３９】本実施例は、実施例１のゲイン量子化回路
３６５のみが異なるため、ここでは、ゲイン量子化回路
の説明のみを図３を用いて行う。

【００４０】図において、短期予測ゲイン計算回路２１
１０は入力端子２０４０からスペクトルパラメータを受
け取り、第２の特徴量として、数１１に従い短期予測ゲ
インＧを計算し、短期予測ゲイン比計算回路２１４０と
遅延器２１５０に出力する。

【００４１】

【数１１】短期予測ゲイン比計算回路２１４０は、短期予測ゲイン
計算回路２１１０から現フレームの短期予測ゲインを、
遅延器２１５０から過去のフレームの短期予測ゲインを
受け取り、その時間比を計算し、ゲインコードブック切
り替え回路２１２０に出力する。ゲインコードブック切
替え回路２１２０は、短期予測ゲイン比計算回路２１４
０から短期予測ゲイン比を、入力端子２０５０からモー
ド情報を受け取り、予め定められたモードの場合に、短
期予測ゲインを予め定めた閾値と比べてゲインコードブ
ック切替え情報をゲイン量子化回路２１３０へ出力す
る。ゲイン量子化回路２１３０は、入力端子２０１０か
ら適応コードベクトルを、入力端子２０２０から音源コ
ードベクトルを、入力端子２０３０からインパルス応答
情報を、ゲインコードブック切り替え回路２１２０から
ゲインコードブック切替え情報を入力し、入力端子２０
６０あるいは入力端子２０７０のうち、ゲインコードブ
ック切替え情報により選択された入力端子に接続される
ゲインコードブックからゲインコードベクトルを受け取
り、選択された音源コードベクトルに対して数１２を最
小化するように、音源コードベクトルと、ゲインコード
ベクトル切替え情報により切り替えられた、ゲインコー
ドブック中のゲインコードベクトルとの組み合わせを選
択する。

【００４２】

【数１２】ここでβ′k ，γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブックに格納さ
れた２次元ゲインコードブックにおけるｋ番目のコード
ベクトルである。選択された音源コードベクトルとゲイ
ンコードベクトルを表すインデクスを出力端子２０８０
に出力する。

【００４３】本発明による音声符号化装置の実施例３に
ついて説明する。

【００４４】本実施例は、実施例１に対してゲイン量子
化回路のみが異なるので、ここでは、図４を参照して、
ゲイン量子化回路の説明のみを行う。

【００４５】図において、短期予測ゲイン計算回路３１
１０は入力端子３０４０からスペクトルパラメータを受
け取り、第２の特徴量として、数１３に従い短期予測ゲ
インＧを計算し、短期予測ゲイン比計算回路３１４０と
遅延器３１５０に出力する。

【００４６】

【数１３】短期予測ゲイン比計算回路３１４０は、短期予測ゲイン
計算回路３１１０から現フレームの短期予測ゲインを、
遅延器３１６０から２つ前の過去のフレームの短期予測
ゲインを受け取り、その比を計算し、ゲインコードブッ
ク切替え回路３１２０に出力する。ゲインコードブック
切替え回路３１２０は短期予測ゲイン比計算回路３１４
０から、短期予測ゲイン比を、入力端子３０５０からモ
ード情報を受け取り、予め定められたモードの場合に、
短期予測ゲインを、予め定めた閾値と比べてゲインコー
ドブック切替え情報をゲイン量子化回路３１３０へ出力
する。ゲイン量子化回路３１３０は、入力端子３０１０
から適応コードベクトルを、入力端子３０２０から音源
コードベクトルを、入力端子３０３０からインパルス応
答情報を、ゲインコードブック切替え回路３１２０から
ゲインコードブック切替え情報を入力し、入力端子３０
６０あるいは入力端子３０７０のうち、ゲインコードブ
ック切替え情報により選択された入力端子に接続される
ゲインコードブックからゲインコードベクトルを受け取
り、選択された音源コードベクトルに対して、数１４を
最小化するように、音源コードベクトルと、ゲインコー
ドブック切替え情報により切り替えられた、ゲインコー
ドブック中のゲインコードベクトルとの組み合わせを選
択する。

【００４７】

【数１４】ここでβ′k ，γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブック３５５に
格納された２次元ゲインコードブックにおけるｋ番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子３
０８０に出力する。

【００４８】本発明による音声符号化装置の実施例４に
ついて説明する。

【００４９】本実施例では、実施例１に対してゲイン量
子化回路のみが異なるので、ここでは、図５を参照し
て、ゲイン量子化回路の説明のみを行う。

【００５０】図において、短期予測ゲイン計算回路４１
１０は入力端子４０４０からスペクトルパラメータを受
け取り、第２の特徴量として、数１５に従い短期予測ゲ
インＧを計算し、遅延器４１７０と遅延器４１５０に出
力する。

【００５１】

【数１５】短期予測ゲイン比計算回路４１４０は、遅延器４１７０
から過去のフレームの短期予測ゲインを、遅延器４１６
０から２つ前の過去のフレームの短期予測ゲインを受け
取り、その比を計算し、ゲインコードブック切替え回路
４１２０に出力する。ゲインコードブック切替え回路４
１２０は短期予測ゲイン比計算回路４１４０から、短期
予測ゲイン比を、入力端子４０５０からモード情報を受
け取り、予め定められたモードの場合に、短期予測ゲイ
ンを、予め定めた閾値と比べてゲインコードブック切替
え情報をゲイン量子化回路４１３０へ出力する。ゲイン
量子化回路４１３０は、入力端子４０１０から適応コー
ドベクトルを、入力端子４０２０から音源コードベクト
ルを、入力端子４０３０からインパルス応答情報を、ゲ
インコードブック切り替え回路４１２０からゲインコー
ドブック切替え情報を入力し、入力端子４０６０あるい
は入力端子４０７０のうち、ゲインコードブック切替え
情報により選択された入力端子に接続されるゲインコー
ドブックからゲインコードベクトルを受け取り、選択さ
れた音源コードベクトルに対して、数１６を最小化する
ように、音源コードベクトルと、ゲインコードブック切
替え情報により切り替えられた、ゲインコードブック中
のゲインコードベクトルとの組み合わせを選択する。

【００５２】

【数１６】ここで、β′k ，γ′k は、ゲインコードブック切替え
情報により切り替えられたゲインコードブック３５５に
格納された２次元ゲインコードブックにおけるｋ番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子４
０８０に出力する。

【００５３】本発明のよる音声符号化装置の実施例５に
ついて説明する。

【００５４】本実施例では、実施例１に対してゲイン量
子化回路とゲインコードブックの構成が異なる。ここで
は、図６及び図７を参照して説明する。

【００５５】ゲイン量子化回路９３６５は、モード判別
回路２５０からモード判別情報を、スペクトルパラメー
タ計算回路２００からスペクトルパラメータを受け取
り、モード判別情報が予め定められたモードのときに、
第２の特徴量を用いてゲインコードブック９３７１とゲ
インコードブック９３７２あるいはゲインコードブック
９３７３のいずれか一方を選択し、選択されたゲインコ
ードブックからゲインコードベクトルを読みだして、イ
ンデクスをマルチプレクサ４００に出力する。

【００５６】図７において、短期予測ゲイン計算回路５
１１０は入力端子５０４０からスペクトルパラメータを
受け取り、第２の特徴量として、数１７に従い短期予測
ゲインＧを計算し、遅延器５１７０と遅延器５１５０に
出力する。

【００５７】

【数１７】短期予測ゲイン比計算回路５１４０は、遅延器５１７０
から過去のフレームの短期予測ゲインを、遅延器５１６
０から２つ前の過去のフレームの短期予測ゲインを受け
取り、その比を計算し、ゲインコードブック切替え回路
５１２０に出力する。ゲインコードブック切替え回路５
１２０は、短期予測ゲイン比計算回路５１４０から、短
期予測ゲイン比を、入力端子５０５０からモード情報を
受け取り、予め定められたモードの場合に、短期予測ゲ
インを、予め定めた閾値と比べてゲインコードブック切
替え情報をゲイン量子化回路５１３０へ出力する。ゲイ
ン量子化回路５１３０は、入力端子５０１０から適応コ
ードベクトルを、入力端子５０２０から音源コードベク
トルを、入力端子５０３０からインパルス応答情報を、
ゲインコードブック切替え回路５１２０からゲインコー
ドブック切替え情報を入力し、入力端子５０６０あるい
は入力端子５０７０、入力端子５０９０のうち、ゲイン
コードブック切替え情報により選択された入力端子に接
続されるゲインコードブックからゲインコードベクトル
を受け取り、選択された音源コードベクトルに対して、
数１８を最小化するように、音源コードベクトルと、ゲ
インコードブック切替え情報により切り替えられた、ゲ
インコードブック中のゲインコードベクトルとの組み合
わせを選択する。

【００５８】

【数１８】ここで、β′k ，γ′k は、ゲインコードブック切替え
情報により切り替えられたゲインコードブック３５５に
格納された２次元ゲインコードブックにおけるｋ番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子５
０８０に出力する。

【００５９】

【発明の効果】以上説明したように、本発明によれば、
伝送するビット数を増やすことなしに、予め定められた
モードにおいて複数のコードブックを切り替えることに
より、数倍のサイズのコードブックを有することと等し
い機能を有するため、音質の改善が可能となるという効
果がある。

【図面の簡単な説明】

【図１】本発明による音声符号化装置の一実施例を示す
ブロック図である。

【図２】図１に示すゲイン量子化回路の一例を示すブロ
ック図である。

【図３】図１に示すゲイン量子化回路の他の例を示すブ
ロック図である。

【図４】図１に示すゲイン量子化回路のさらに他の例を
示すブロック図である。

【図５】図１に示すゲイン量子化回路の別の例を示すブ
ロック図である。

【図６】本発明による音声符号化装置の他の一実施例を
示すブロック図である。

【図７】図６に示すゲイン量子化回路の一例を示すブロ
ック図である。

【符号の説明】

１１０フレーム分割回路１２０サブフレーム分割回路２００スペクトルパラメータ計算回路２１０スペクトルパラメータ量子化回路２１１ＬＳＰコードブック２３０重み付け回路２３５減算回路２４０応答信号計算回路２５０モード判別回路３１０インパルス応答計算回路３５０音源量子化回路３５１不均一パルス数型スパース音源コードブック３６０重み付け信号計算回路３６５，９３６５ゲイン量子化回路３７１，３７２，９３７１，９３７２，９３７３ゲイ
ンコードブック４００マルチプレクサ５００適応コードブック回路

Claims

【特許請求の範囲】

【請求項１】音声信号を予め定めたフレーム単位に区
切るフレーム分割部と、前記フレーム単位毎に前記音声
信号から少なくとも１種類の第１の特徴量を計算しモー
ド判別を行なうモード判別部と、前記モード判別結果に
応じて前記音声信号の符号化処理を行う符号化部とを有
する音声符号化装置において、前記モード判別部で予め
定められたモードが選択されると前記音声信号から求め
られた少なくとも１種類の第２の特徴量に応じて予め格
納された複数の符号帳を切替制御する符号帳切替部を有
することを特徴とする音声符号化装置。
【請求項２】請求項１に記載された音声符号化装置に
おいて、前記第２の特徴量には、少なくとも１種類以上
の特徴量の時間変化比が特徴量として含まれていること
を特徴とする音声符号化装置。
【請求項３】請求項１に記載された音声符号化装置に
おいて、前記第２の特徴量には、現フレーム又は過去の
少なくとも１つ以上のフレームのいずれかの２フレーム
分のそれぞれの特徴量に対して、前記２つの特徴量の比
が特徴量として含まれていることを特徴とする音声符号
化装置。
【請求項４】請求項１乃至３のいずれかに記載された
音声符号化装置において、前記第２の特徴量には、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、及びピッチの
少なくとも１種が特徴量として含まれていることを特徴
とする音声符号化装置。
【請求項５】請求項１乃至３のいずれかに記載された
音声符号化装置において、前記複数の符号帳は、複数の
ＲＭＳコードブック、複数のＬＳＰコードブック、複数
の適応コードブック、複数の音源コードブック、及び複
数のゲインコードブックのいずれかを備えているいるこ
とを特徴とする音声符号化装置。