JP2913696B2

JP2913696B2 - ディジタル信号符号化方法

Info

Publication number: JP2913696B2
Application number: JP25580089A
Authority: JP
Inventors: 義仁藤原; 知子梅沢; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1989-09-30
Filing date: 1989-09-30
Publication date: 1999-06-28
Anticipated expiration: 2014-06-28
Also published as: JPH03117921A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、入力ディジタル信号の符号化を行うディジ
タル信号符号化方法に関するものである。

〔発明の概要〕

本発明は、入力ディジタル信号を複数の周波数帯域に
分割すると共に、高い周波数帯域ほどバンド幅を広く選
定し、各バンド毎のエネルギに基づいて各バンド単位の
許容ノイズレベルを設定し、各バンドのエネルギと設定
された許容ノイズレベルの差のレベルに応じたビット数
で各バンドの成分を量子化するディジタル信号符号化方
法において、量子化後の出力情報量を検出し、この検出
出力と目標値の誤差に応じて量子化の際の割当てビット
数を補正するようにして、所定期間における情報量を一
定化するようにしたことにより、簡単な構成で、信号劣
化の目立たないビットレート調整（ビットパッキング）
を行うことが可能なディジタル信号符号化方法を提供す
るものである。

〔従来の技術〕

オーディオ，音声等の信号の高能率符号化において
は、オーディオ，音声等の入力信号を時間軸又は周波数
軸で複数のチャンネルに分割すると共に、各チャンネル
毎のビット数を適応的に割当てるビットアロケーシヨン
（ビット割当て）による符号化技術がある。例えば、オ
ーディオ信号等の上記ビット割当てによる符号化技術に
は、時間軸上のオーディオ信号等を複数の周波数帯域に
分割して符号化する帯域分割符号化（サブ・バンド・コ
ーディング:SBC）や、時間軸の信号を周波数軸上の信号
に変換（直交変換）して複数の周波数帯域に分割し各帯
域毎で適応的に符号化するいわゆる適応変換符号化（AT
C）、或いは、上記SBCといわゆる適応予測符号化（AP
C）とを組み合わせ、時間軸の信号を帯域分割して各帯
域信号をベースバンド（低域）に変換した後複数次の線
形予測分析を行って予測符号化するいわゆる適応ビット
割当て（APC−AB）等の符号化技術がある。

ここで例えば、上記帯域分割符号化においては、圧縮
効率を上げるために、一定の単位時間ブロック毎のビッ
トレートを一定に保ちながら、帯域分割した各バンドに
与えるビット数を信号スペクトル強度の時間変動に応じ
てダイナミックに（適応的に）変化させている。また、
上記適応変換符号化においては、周波数軸上でダイナミ
ックに割当てビット数を変化させている。

〔発明が解決しようとする課題〕

上述のようなビット数を適応的に割当てる高能率符号
化においては、ビット数の割当ての仕方しだいで単位ブ
ロック（単位時間ブロック或いは単位周波数ブロック）
当たりのビットレートが一定にならない場合が生じ、ビ
ットの過不足が起こる場合がある。すなわち、与えられ
たビットレートに対して、時間軸或いは周波数軸上で信
号レベルの低い所ではビットが余り、信号レベルの高い
所ではビットが足りないという現象が起こることがあ
る。

このようなビット数の過不足があった場合には、効果
的にビット数を調整するようなビットレート調整（いわ
ゆるビットパッキング）の手法を用いる必要があった。

このビットレート調整とは、単位ブロックでビットが
余ったときには、該単位ブロックに与えるビット数を減
らし、ビットが足りないときには与えるビット数を増加
させるようにすることにより、全体のビットレートを一
定に調整するものである。当該ビットレート調整は、例
えば、第９図に示すような機能ブロックを用いて行うこ
とができると考えられる。この第９図において、入力デ
ィジタル信号に対して、割当てビット数決定機能ブロッ
ク90で量子化の際の割当てビット数を決定し、ビットレ
ート調整機能ブロック91で、入力ディジタル信号の単位
ブロックのスペクトル強度に応じたビットレートの調整
（ビットパッキング）を行う。その後、ビットレート調
整されて決定されたビット数を用いて符号化機能ブロッ
ク92で符号化（再量子化）が行われて出力される。

ところが、上記ビットレート調整機能ブロック92で行
われるビットレートの調整としては、未だ、簡単でかつ
信号の劣化が目立たない効果的な方法がなく、このた
め、従来より、効果的なビットレート調整の方法の確立
が望まれている。

そこで、本発明は、上述のような事情に鑑みて提案さ
れたものであり、簡単な構成で、信号の劣化の目立たな
いビットレート調整（ビットパッキング）を行うことが
できるディジタル信号符号化方法を提供することを目的
とするものである。

［課題を解決するための手段］本発明に係るディジタル信号符号化方法は、上述の課
題を解決するために提案されたものであり、入力ディジ
タル信号を複数の周波数帯域に分割すると共に、高い周
波数帯域ほどバンド幅を広く選定し、当該各バンド毎の
エネルギに基づいて各バンド単位の許容ノイズレベルを
設定するノイズレベル設定工程と、上記各バンドのエネ
ルギと上記設定された許容ノイズレベルとの差のレベル
に応じたビット数で上記各バンドの成分を量子化する量
子化工程とを有するディジタル信号符号化方法であっ
て、上記量子化工程により得られる出力情報量を検出
し、この検出された誤差に応じで、上記量子化工程での
割当てビット数を、全帯域で均等に増減するように補正
して、所定期間における情報量を一定化するようにした
ことを特徴とするものである。

［作用］本発明によれば、量子化手段の出力情報量の検出出力
と目標値の誤差に応じて量子化の際の割当てビット数を
一定量増減することで、全体のビットレートが一定に保
たれている。

〔実施例〕

以下、本発明を適用した実施例について図面を参照し
ながら説明する。

本実施例のディジタル信号符号化方法が適用されたデ
ィジタル信号符号化装置、オーディオ或いは音声等の入
力ディジタル信号を、例えば、帯域分割符号化（SBC）
や、適応変換符号化（ATC）、適応ビット割当て（APC−
AB）等により高能率符号化するものである。そのため、
本実施例装置では、入力ディジタル信号を複数の周波数
帯域に分割すると共に、高い周波数帯域ほどバンド幅を
広く選定している。すなわち、後述する人間の聴覚特性
を考慮したいわゆる臨界帯域幅（クリティカルバンド）
で上記入力ディジタル信号を分割している。また、第１
図に示すように、当該クリティカルバンドの各バンド毎
のエネルギ（又はピーク値，平均値）に基づいて各バン
ド単位の許容ノイズレベルを設定するノイズレベル設定
手段としての総和検出回路14及びフィルタ回路15と、上
記各バンドのエネルギと上記ノイズレベル設定手段の差
のレベルに応じて割当てられたビット数で上記各バンド
の成分を量子化する量子化回路24とを有するものであ
る。ここで、上記量子化回路24の出力情報量を後述する
データ量演算回路26で検出し、該検出出力と端子３から
の所定の目標値（ビットレート調整のためのビットレー
トの目標値）との誤差が後述する誤差検出回路27で検出
される。その後、割算器28でこの誤差出力を割り込むこ
とにより、本実施例装置では、当該誤差出力に応じて上
記量子化回路24の割当てビット数を補正するようにし
て、所定期間における情報量を一定化（ビットレートの
調整）を行うようにしている。

ところで、このビットレート調整を行った結果、例え
ば、ビット数が不足してビットを取り上げた（減らし
た）場合にはオーディオ信号のS/Nは悪化し、逆に、ビ
ット数が余ってビット数を増やした場合にはS/Nは良く
なる。すなわち、ビットレート調整を行うことで、信号
スペクトルに対するノイズスペクトルの形状が変化して
しまうために、S/Nの良い所と悪い所が発生してしま
う。このため、本実施例のディジタル信号符号化装置で
は、このオーディオ信号のS/Nの変化の周波数軸上での
変化を一定に保つことにより、再量子化時に発生するノ
イズスペクトルの形状が変化しないようにしている。

換言すれば、第２図に示すように、信号スペクトルSS
に対して、ノイズスペクトルNSは図中一点鎖線で示すよ
うになるが、ダイナミックなビット割当てにより、単位
ブロックでビットレートが一定にならないときに該ビッ
ト割当ての調整を周波数軸上で行っているものである。
例えば、信号の周波数分析を行って、ノイズスペクトル
NSから均等にビットを取り上げたり増やしたりすること
で、第３図に示すように、ビット数を取り上げた（減ら
した）場合には第３図中の点線で示すノイズスペクトル
NS_-のように補正され、ビット数を増やした場合にはノ
イズスペクトルNS₊のように補正される。

その後、上記量子化回路24からの量子化出力は、バッ
ファメモリ25を介して本実施例のディジタル信号符号化
装置の出力端子２から出力されるようになる。

ここで、第１図に示す本実施例のディジタル信号符号
化装置は、オーディオ信号，音声信号等を高速フーリエ
変換（FFT）して、時間軸の信号を周波数軸に変換し、
符号化（再量子化）を行うものである。

第１図において、入力端子１には、例えばオーディオ
信号が供給されており、該時間軸上のオーディオ信号が
高速フーリエ変換回路11に伝送される。この高速フーリ
エ変換回路11では、該時間軸上のオーディオ信号が所定
時間毎に周波数軸上の信号に変換され、実数成分値Reと
虚数成分値ImとからなるFFT係数が得られる。これらFFT
係数は振幅位相情報発生回路12に伝送され、当該振幅位
相情報発生回路12では上記実数成分値Reと虚数成分値Im
とから振幅値Amと位相値とが得られて、この振幅値Amの
情報が出力されるようになる。すなわち、一般の人間の
聴覚は周波数領域の振幅（パワー）には敏感であるが、
位相についてはかなり鈍感であるため、本実施例では上
記振幅位相情報発生回路12の出力から上記振幅値Amのみ
を取り出し、これを本発明実施例での入力ディジタル信
号としている。

このようにして得られた振幅値Am等の入力ディジタル
信号は、帯域分割回路13に伝送される。この帯域分割回
路13では、上記振幅値Amで表現された入力ディジタル信
号をいわゆる臨界帯域幅（クリティカルバンド）に分割
している。当該クリティカルバンドとは、人間の聴覚特
性（周波数分析能力）を考慮したものであり、例えば０
〜16kHzを24バンドに分け、高い周波数帯域ほどバンド
幅を広く選定しているものである。すなわち人間の聴覚
は、一種のバンドパスフィルタのような特性を有してい
て、この各フィルタによって分けられたバンドを臨界帯
域と呼んでいる。ここで、第４図に上記クリティカルバ
ンドを示す。ただし、この第４図では図示を簡略化する
ため、上記クリティカルバンドのバンド数を12バンド
（B₁〜B₁₂）で表現している。

上記帯域分割回路13でクリティカルバンドに分割され
た各バンド（例えば24バンド）毎の上記振幅値Amは、各
々上記総和検出回路14に伝送される。この総和検出回路
14では、上記各バンド毎のエネルギ（各バンドでのスペ
クトル強度）が、各バンドのそれぞれの振幅値Amの総和
（振幅値Amのピーク又は平均或いはエネルギ総和）をと
ることにより求められる。該総和検出回路14の出力すな
わち各バンドの総和のスペクトルは、一般にバークスペ
クトルと呼ばれ、この各バンドのバークスペクトルSBは
例えば第５図に示すようになる。

ここで、上記バークスペクトルSBのいわゆるマスキン
グに於ける影響を考慮するため、該バークスペクトルSB
に所定の重みづけの関数を畳込む（コンボリューショ
ン）。このため、上記総和検出回路14の出力すなわち該
バークスペクトルSBの各値は、フィルタ回路15に送られ
る。該フィルタ回路15は、第６図に示すように、入力端
子100からの入力データを順次遅延させる遅延素子
（z^-1）101₁,101₂‥‥101_m-2〜101_m+3‥‥101₂₃,101₂₄
（クリティカルバンドに対応した例えば24個の遅延素
子）と、各遅延素子101₁〜101₂₄からの出力にフィルタ
係数（重みづけの関数）を乗算する例えば24個の乗算器
102₁,102₂‥‥102_m-3〜102_m+3‥‥102₂₃,102₂₄と、総和
加算器104とから構成されるものである。この時、上記
乗算器102_m-3〜102_m+3において、例えば、乗算器102_m-3
でフィルタ係数0.0000086を乗算し、乗算器102_m-2でフ
ィルタ係数0.0019を、乗算器102_m-1でフィルタ係数0.15
を、乗算器102_mでフィルタ係数１を、乗算器102_m+1でフ
ィルタ係数0.4を、乗算器102_m+2でフィルタ係数0.06
を、更に乗算器102_m+3でフィルタ係数0.007を各遅延素
子の出力に乗算することにより、上記バークスペクトル
SBの畳込み処理が行われる。この畳込み処理により、第
５図中点線で示す部分の総和がとられる。なお、上記マ
スキングとは、人間の聴覚上の特性により、ある信号に
よって他の信号がマスクされて聞こえなくなる現象をい
うものであり、このマスキング効果には、時間軸上のオ
ーディオ信号に対するマスキング効果と周波数軸上の信
号に対するマスキング効果とがある。すなわち、該マス
キング効果により、マスキングされる部分にノイズが合
ったとしても、このノイズは聞こえないことになる。こ
のため、実際のオーディオ信号では、このマスキングさ
れる部分内のノイズは許容可能なノイズとされる。

その後、上記フィルタ回路15の出力は引算器16に送ら
れる。当該引算器16は、上記畳込んだ領域での後述する
許容可能なノイズレベルに対応するレベルαを求めるも
のである。なお、当該許容可能なノイズレベル（許容ノ
イズレベル）に対応するレベルαは、後述するように、
逆コンボリューション処理を行うことによって、クリテ
ィカルバンドの各バンド毎の許容ノイズレベルとなるよ
うなレベルである。ここで、上記引算器16には、上記レ
ベルαを求めるための許容関数（マスキングレベルを表
現する関数）が供給される。この許容関数を増減させる
ことで上記レベルαの制御を行っている。当該許容関数
は、後述する関数発生回路29から供給されているもので
ある。

すなわち、許容ノイズレベルに対応するレベルαは、
クリティカルバンドのバンドの低域から順に与えられる
番号をｉとすると、第（１）式で求めることができる。

α＝Ｓ−（ｎ−ai） ‥‥‥‥（１）この第（１）式において、n,aは定数でａ＞０、Ｓは
畳込み処理されたバークスペクトルの強度であり、第
（１）式中（ｎ−ai）が許容関数となる。本実施例では
ｎ＝38,a＝１としており、この時の音質劣化はなく、良
好な符号化が行えた。

このようにして、上記レベルαが求められ、このデー
タは、割算器17に伝送される。当該割算器17では、上記
畳込み処理された領域での許容ノイズスペクトルを逆コ
ンボリューションするためのものである。したがって、
この逆コンボリューション処理を行うことにより、上記
レベルαからマスキングスペクトルが得られるようにな
る。すなわち、このマスキングスペクトルが許容ノイズ
スペクトルとなる。なお、上記逆コンボリューション処
理は、複雑な演算を必要とするが、本実施例では、簡略
化した割算器17を用いて逆コンボリューションを行って
いる。

次に、上記マスキングスペクトルは、合成回路18を介
して減算器19に伝送される。ここで、当該減算器19に
は、上記総和検出回路14の出力すなわち前述した総和検
出回路14からのバークスペクトルSBが、遅延回路21を介
して供給されている。したがって、この減算器19で上記
マスキングスペクトルとバークスペクトルSBとの減算演
算が行われることで、第７図に示すように、バースクペ
クトルSBは、該マスキングスペクトルMSの各レベルで示
すレベル以下がマスキングされることになる。

当該減算器19の出力は、ROM20を介して量子化回路24
に供給されており、上記量子化回路24では、この減算器
19の出力に基づいて割当てられたビット数で、遅延回路
23を介して供給されている振幅値Amの量子化を行うこと
になる。すなわち、換言すれば、当該量子化回路24で
は、上記クリティカルバンドの各バンドのエネルギと上
記ノイズレベル設定手段の差のレベルに応じて割当てら
れたビット数で上記各バンドの成分を量子化することに
なる。なお、上記遅延回路21は上記合成回路18以前の各
回路での遅延量を考慮して上記総和検出回路14からのバ
ークスペクトルSBを遅延させ、上記遅延回路23は上記RO
M20以前の各回路での遅延量を考慮して上記振幅値Amを
遅延させるために設けられている。また、上記ROM20は
量子化の際の所定時間毎の上記減算器19の出力を一時格
納して送り出すために設けられている。

ここで、上記量子化回路24の量子化の際には、前述し
たように、上記量子化回路24の出力情報量を検出し、該
検出出力と目標値の誤差に応じて量子化の際に割当てビ
ット数を補正するようにして、所定期間における情報量
を一定化するようにしている。

このようなことを行うため、本実施例装置において
は、上記バッファメモリ25からのデータは、データ量演
算回路26によってデータ量が求められた後、誤差検出回
路27に送られる。当該誤差検出回路27では、上記データ
量と端子３からの所定の目標値（ビットレート調整のた
めのビットレートの目標値）との誤差が検出され、その
誤差データは割算回路28に伝送される。当該割算回路28
では、所定期間としての単位時間ブロック（１フレー
ム）内の総サンプル数で上記誤差データが割り込まれ、
この割算データが、足算器31に伝送される。したがっ
て、当該足算器31では、上記ROM20の出力に上記割算デ
ータが加算されることで、量子化の際の割当てビット数
の補正（ビットレートの調整）が行われることになり、
上記所定期間における情報量を一定化するようになる。
ここで、当該足算器31の出力は、四捨五入回路32を介し
て上記量子化回路24に供給されているため、ビット数の
細かな変化が矯正されている。

なお、上述した合成回路18での合成の際には、最小可
聴カーブ発生回路22から供給される第８図に示すような
人間の聴覚特性であるいわゆる最小可聴カーブ（等ラウ
ドネス曲線）RCを示すデータと、上記マスキングスペク
トルMSとを合成することができる。したがって、この最
小可聴カーブRCとマスキングスペクトルMSとを共に合成
することで、許容ノイズレベルは図中斜線で示す部分ま
でとすることができるようになり、量子化の際に図中鎖
線で示す部分の割当てビット数を減らすことができるよ
うになる。なお、この第８図は、前述の第４図に示した
クリティカルバンドで表わされており、信号スペクトル
SSも同時に示している。

ただし、本実施例においては、上述した最小可聴カー
ブの合成処理を行わない構成とすることもできる。すな
わち、この場合には、最小可聴カーブ発生回路22,合成
回路18が不要となり、上記引算器16からの出力は、割算
器17で逆コンボリューションされた後、すぐに減算器19
に伝送されることになる。

すなわち、本実施例のディジタル信号符号化装置にお
いては、オーディオ信号を符号化する際に、上述したよ
うにビットレート調整を行い、この時、ノイズスペクト
ルの形状が変化しないので、ビット数を減らした場合で
も、聴感上の劣化が少なくてすむ。また、ビットレート
調整のアルゴリズムが容易なのでハードウェアを簡単に
構成することができる。

本発明は、上述した第１図の実施例のように、入力デ
ィジタル信号を高速フーリエ変換して処理するいわゆる
適応変換符号化の他に、例えば、帯域分割符号化（SB
C）を行う装置にも適用することができる。この場合
は、信号をバンドパスフィルタ等で帯域分割して、この
各チャンネルに割り当てるビット数を量子化手段の出力
情報量の検出出力と目標値の誤差に応じて一定増減させ
るものとなる。当該帯域分割符号化の場合も上述同様の
効果を得ることができる。

［発明の効果］本発明のディジタル信号符号化方法によれば、量子化
後の出力情報量を検出し、該検出出力と目標値との誤差
を検出し、この検出されたに応じて、上記量子化工程で
の割当てビット数を、全帯域で均等に増減するように補
正して、所定期間における情報量を一定化するようにし
たことにより、計算量が少なく、簡単な構成にも拘ら
ず、信号劣化の目立たないビットレート調整（ビットパ
ッキング）を行うことが可能となる。したがって、例え
ば、量子化のビット数を減らしても聴感上の劣化を少な
くすることができるようになる。

【図面の簡単な説明】

第１図は本発明の一実施例のディジタル信号符号化方法
が適用されたディジタル信号符号化装置の概略構成を示
すブロック回路図、第２図はビットレート調整する前の
ノイズスペクトルを示す特性図、第３図はビットレート
調整後のノイズスペクトルを示す特性図、第４図はクリ
ティカルバンドを示す図、第５図はバークスペクトルを
示す図、第６図はフィルタ回路を示す回路図、第７図は
マスキングスペクトルを示す図、第８図は最小可聴カー
ブ，マスキングスペクトルを合成した図、第９図はビッ
トレート調整のための機能ブロック図である。 11……高速フーリエ変換回路 12……振幅位相情報発生回路 13……帯域分割回路 14……総和検出回路 15……フィルタ回路 16……引算器 17,28……割算器 18……合成回路 19……減算器 20……ROM 21,23……遅延回路 22……最小可聴カーブ発生回路 24……量子化回路 25……バッファメモリ 26……データ量演算回路 27……誤差検出回路 29……関数発生回路 31……足算器 32……四捨五入回路

フロントページの続き (56)参考文献特開平３−117920（ＪＰ，Ａ) 特開昭60−96041（ＪＰ，Ａ) 特開昭62−57621（ＪＰ，Ａ) 特開昭61−110200（ＪＰ，Ａ) Ｐｒｏｃｅｅｄｉｎｇｓ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（1988）Ｖｏｌ．５，ｐ．2524−2527 Ｐｒｏｃｅｅｄｉｎｇｓ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（1989）Ｖｏｌ．３，ｐ．1993−1996 昭和59年度電子通信学会通信部門全国大会講演論文集［分冊１］第１−389〜 390

Claims

(57)【特許請求の範囲】

【請求項１】入力ディジタル信号を複数の周波数帯域に
分割すると共に、高い周波数帯域ほどバンド幅を広く選
定し、当該各バンド毎のエネルギに基づいて各バンド単
位の許容ノイズレベルを設定するノイズレベル設定工程
と、上記各バンドのエネルギと上記設定された許容ノイズレ
ベルとの差のレベルに応じたビット数で上記各バンドの
成分を量子化する量子化工程とを有するディジタル信号
符号化方法であって、上記量子化工程により得られる出力情報量を検出し、該
検出出力と目標値との誤差を検出し、この検出された誤
差に応じて、上記量子化工程での割当てビット数を、全
帯域で均等に増減するように補正して、所定期間におけ
る情報量を一定化するようにしたことを特徴とするディジタル信号符号化方法。