JP2998196B2

JP2998196B2 - オーディオ信号の量子化誤差低減装置

Info

Publication number: JP2998196B2
Application number: JP31261790A
Authority: JP
Inventors: 健三赤桐; 誠阿久根
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1990-11-20
Filing date: 1990-11-20
Publication date: 2000-01-11
Anticipated expiration: 2015-01-11
Also published as: JPH04185017A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、オーディオ信号の量子化で発生する量子化
誤差を低減するオーディオ信号の量子化誤差低減装置に
関するものである。

〔発明の概要〕

本発明は、量子化誤差をノイズフィルタを介して量子
化器の入力側に帰還するようにしたオーディオ信号の量
子化誤差低減装置において、所定期間毎のブロックの入
力オーディオ信号を周波数分析し、各周波数成分のエネ
ルギに基づいた第１の許容ノイズレベルと、ブロックに
時間的に先後行するデータの少なくとも一方のエネルギ
に基づいた第２の許容ノイズレベルとの少なくとも一方
に基づいて、ノイズフィルタのフィルタ特性を設定する
ようにしたことにより、聴感上のノイズを低減すること
ができるオーディオ信号の量子化誤差低減装置を提供す
るものである。

〔従来の技術〕

現在、ディジタルのオーディオ信号を扱うディジタル
オーディオ機器には、例えばいわゆるコンパクトディス
ク（CD）の再生機、或いはいわゆるディジタル・オーデ
ィオ・テープレコーダ（DAT）等が存在する。これらデ
ィジタルオーディオ機器では各種統一規格が規定されて
おり、例えば、これら機器で扱われるディジタルオーデ
ィオ信号のビット長は、上記統一規格から16ビット長に
規定されている。また、これらディジタルオーディオ機
器におけるディジタルオーディオ信号としては、アナロ
グオーディオ信号（音声波形信号）を例えばいわゆるPC
M（パルス符号化）のような単純な量子化を用いて符号
化して得られたディジタルオーディオ信号を用いてい
る。

〔発明が解決しようとする課題〕

ところで、近年、上述のようなディジタルオーディオ
機器においては、上記統一規格から現実に得られる再生
音よりも、聴感上より品質の高い再生音が得られるよう
になることが望まれている。このような聴感上より良い
再生音を得るためには、例えば、これらディジタルオー
ディオ機器で扱われるディジタルオーディオ信号に含ま
れているノイズ成分を、低減しておくことが有効である
と考えられる。このように、ノイズ成分が低減されたデ
ィジタルオーディオ信号から得られる再生音は、ノイズ
の少ない聴感上より良いものとなる。このディジタルオ
ーディオ信号のノイズ成分低減処理としては、例えば、
オーディオ信号の量子化の際に行われるいわゆるエラー
フィードバックによる量子化誤差低減処理がある。すな
わち、このエラーフィードバックによる量子化誤差低減
処理には、例えば、オーディオ信号の量子化の際に、量
子化器によって発生する量子化誤差（量子化ノイズ，量
子化歪み）を、ノイズフィルタを介して該量子化器の入
力側に帰還（フィードバック）するようなエラーフィー
ドバックによって、量子化誤差を低減するいわゆるノイ
ズシェーピング処理が知られている。

ここで、上述したPCM符号化のような量子化での量子
化ノイズはオーディオ信号の全周波数帯域にフラットな
周波数特性を有するものとなっており、上記ノイズシェ
ーピング処理ではこの全帯域の量子化ノイズから単にオ
ーディオ帯域（可聴帯域）のノイズのみを減らすように
している。しかし、人間の耳は、例えばいわゆる等ラウ
ドネスカーブ或いはマスキング効果等により聞こえる感
度に差があるにもかかわらず、上述した従来のノイズシ
ェーピング処理では、この人間の耳の特性（聴覚特性）
の考慮がなされていない。このため、上述した従来のエ
ラーフィードバックによる量子化誤差低減処理が、人間
の聴感上必ずしも有効であるとは言い難い。

そこで、本発明は、上述のような実情に鑑みて提案さ
れたものであり、人間の耳の特性を考慮して聴感上効果
的に量子化誤差（量子化ノイズ）を低減することができ
るオーディオ信号の量子化誤差低減装置を低減すること
を目的とするものである。

〔課題を解決するための手段〕

本発明のオーディオ信号の量子化誤差低減装置は、上
述の目的を達成するために提案されたものであり、量子
化器で発生した量子化誤差をノイズフィルタを介して上
記量子化器の入力側に帰還するようにしたオーディオ信
号の量子化誤差低減装置において、入力オーディオ信号
を所定期間毎にブロック化するブロック化手段と、上記
ブロック化手段からの各ブロック毎に周波数分析を行う
周波数分析手段と、上記周波数分析手段の出力のうち、
上記ブロック内の各周波数成分のエネルギに基づいて第
１の許容ノイズレベルを設定する第１のノイズレベル設
定手段と、上記周波数分析手段の出力のうち、上記ブロ
ックに時間的に先行するデータ及び時間的に後行するデ
ータの少なくとも一方のエネルギに基づいて、当該ブロ
ックの各周波数成分の第２の許容ノイズレベルを設定す
る第２のノイズレベル設定手段とを有し、上記ノイズフ
ィルタのフィルタ特性を、上記第１及び第２のノイズレ
ベル設定手段の少なくとも一方の出力に基づいて設定す
るようにしたものである。

〔作用〕

本発明によれば、各周波数成分のエネルギに基づいた
第１の許容ノイズレベルが人間の聴覚特性におけるいわ
ゆる同時刻マスキング効果の量と対応し、ブロックに時
間的に先行及び後行するデータに基づいた第２の許容ノ
イズレベルがいわゆるテンポラルマスキング効果の量と
対応しており、これら両者に基づいてノイズフィルタの
フィルタ特性を決定しているため聴感上効果的に量子化
誤差（量子化ノイズ）を低減できる。

〔実施例〕

以下、本発明を適用した実施例について図面を参照し
ながら説明する。

第１図に、本実施例のオーディオ信号の量子化誤差低
減装置の概略構成のブロック図を示す。

この第１図の本実施例装置は、量子化器11で発生した
量子化誤差をノイズフィルタ13を介して上記量子化器11
の入力側に帰還するようにしたものであって、入力オー
ディオ信号を所定期間（例えば1ms〜10ms）毎にブロッ
ク化するブロック化回路15と、上記ブロック化回路15か
らの各ブロック毎に周波数分析を行う周波数分析回路16
と、上記周波数分析回路16の出力のうち、上記ブロック
内の各周波数成分のエネルギに基づいて第１の許容ノイ
ズレベルを設定する第１のノイズレベル設定回路17と、
上記周波数分析回路16の出力のうち、上記ブロックに時
間的に先行するデータ及び時間的に後行するデータの少
なくとも一方のエネルギに基づいて、当該ブロックの各
周波数成分の第２の許容ノイズレベルを設定する第２の
ノイズレベル設定回路18とを有し、上記ノイズフィルタ
13のフィルタ特性を、上記第１及び第２のノイズレベル
設定回路17,18の少なくとも一方の出力或いはそれらの
合成出力に基づいて設定するようにしたものである。

すなわち、本実施例装置は、上記量子化器11の出力か
ら量子化器11への入力を減算することで当該量子化器11
での量子化の際に発生する量子化誤差を得る加算器12
と、該加算器12の出力をフィルタリング処理して出力す
る上記ノイズフィルタ13と、該ノイズフィルタ13の出力
を上記量子化器11の入力側に加算する加算器10とでいわ
ゆるエラーフィードバック回路を構成している。ここ
で、上記ノイズフィルタ13のフィルタ特性は、具体的に
は上記第１及び第２のノイズレベル設定回路17,18から
の後述する許容ノイズレベル（或いは許容ノイズスペク
トル）の情報に基づいてフィルタ係数算出回路14で算出
されたフィルタ係数によって決定されている。したがっ
て、このエラーフィードバック回路では、上記許容ノイ
ズスペクトルに基づいて量子化誤差低減処理（いわゆる
ノイズシェーピング処理）が行われる。このノイズシェ
ーピング処理が行われた後の信号は、出力端子２から出
力される。

ところで、上記エラーフィードバック回路によってオ
ーディオ信号の量子化誤差低減処理（ノイズシェーピン
グ処理）を行う際には、該入力信号スペクトルのいわゆ
るマスキングを考慮した処理を行うことで、聴感上のダ
イナミックレンジを上げることができる。このマスキン
グを考慮したノイズシェーピングとしては、例えば、信
号スペクトルのパターンがある程度固定化した入力オー
ディオ信号のスペクトルに応じたノイズシェーピング、
すなわち、入力オーディオ信号スペクトルの後述するい
わゆるマスキングを考慮して得られた許容ノイズスペク
トルを用いたノイズシェーピングを挙げることができ
る。或いは、入力オーディオ信号のスペクトルが変化す
る場合の、当該スペクトルのマスキングを考慮して得ら
れたスペクトル変化に適応的な許容ノイズスペクトルを
用いたノイズシェーピング等がある。なお、上記マスキ
ングとは、人間の聴覚上の特性により、ある信号によっ
て他の信号がマスクされて聞こえなくなる現象を言うも
ので、このマスキング効果には、同時刻マスキング効果
とテンポラルマスキング効果とがある。このマスキング
効果により、マスキングされる部分にノイズがあったと
しても、このノイズは聞こえなくなる。上記同時刻マス
キング効果とはある大きな音と同時刻に発生する小さな
音（或いはノイズ）が該大きな音によってマスクされて
聞こえなくなるような効果である。また、ある周波数帯
域の信号成分によって他の帯域の信号成分がマスクされ
て、該他の帯域の信号成分の音が聞こえなくなるような
効果（周波数軸上のマスキング効果）も含まれる。上記
テンポラリマスキング効果とは、大きな音の時間的に前
後の小さな音（ノイズ）が、この大きな音にマスクされ
て聞こえなくなるような効果であり、当該大きな音の時
間的に後方のマスキングはフォワードマスキングと呼ば
れ、時間的に前方のマスキングはバックワードマスキン
グと呼ばれている。更に、このテンポラルマスキングに
おいては、人間の聴覚特性から、フォワードマスキング
の効果は長時間（例えば10msec程度）効くようになって
いるのに対し、バックワードマスキングの効果は短時間
（例えば5msec程度）となっている。更に上記マスキン
グ効果のレベル（マスキング量）は、フォワードマスキ
ングが20dB程度で、バックワードマスキングが30dB程度
となっている。

また、人間の聴覚特性を利用して入力信号を例えばい
わゆる臨界帯域（クリティカルバンド）で帯域分割し、
この各帯域毎に、上述したようなマスキングを考慮した
許容ノイズスペクトルを用いてノイズシェーピングを行
えば、より聴感上効果的なノイズシェーピングが行え
る。これにより、再生音の聴感上のダイナミックレンジ
を上げることが可能となる。

このようなことから、上記周波数分析回路16では、上
記ブロック化回路15からの各ブロック毎の入力オーディ
オ信号を、人間の聴覚特性を利用して、いわゆる臨界帯
域幅（クリティカルバンド）に分割し、この臨界帯域毎
に周波数分析を行っている。この時の上記臨界帯域幅で
の分割及び分析としては、先ず、例えば、入力オーディ
オ信号を例えば高速フーリエ変換（FFT）で周波数軸上
の成分（FFT係数）に変換した後、該FFT係数の振幅項Am
（以下、ｍ＝０〜1024）を、人間の聴覚特性を考慮した
高域程帯域幅が広くなる臨界帯域幅で、例えば上記25バ
ンドのグループGn（以下、ｎは各バンドの番号を示し、
ｎ＝０〜24）にグループ分け（バンド分け）する。次
に、これら各臨界帯域毎の信号からは、例えば、第
（１）式により各帯域毎のそれぞれの振幅項Amの総和
（振幅項Amのピーク又は平均或いはエネルギ総和）を取
ることで得られるいわゆるバークスペクトル（総和のス
ペクトル）SBを求める。

SB＝10log₁₀Cn（Pn）^２［dB］（１）ただし、ｎ＝０〜24であり、Cnは第ｎ番目のバンド内
の要素数すなわち振幅項（ポイント数）、Pnは各帯域の
ピーク値である。上記各帯域のバーススペクトルSBは、
例えば、第２図に示すようになる。ただし、この第２図
の例では、図示を簡略化するため、上記臨界帯域におけ
る全帯域数を、例えば12バンド（B₁〜B₁₂）で表現して
いる。当該周波数分析回路16では、上述したような臨界
帯域幅での分割と各帯域毎の周波数分析が行われ、その
出力情報を、上記第1,第２のノイズレベル設定回路17,1
8に送るようにしている。

これら第1,第２のノイズレベル設定回路17,18では、
後述するようにして、上記同時刻マスキング（周波数軸
上のマスキングも含む），テンポラルマスキングを考慮
した許容ノイズレベルの設定を行っている。

これら第1,第２のノイズレベル設定回路17,18からの
許容ノイズレベル（許容ノイズスペクトル）の情報が、
上記フィルタ係数算出回路14に送られ、該フィルタ係数
算出回路14から許容ノイズスペクトルに応じたフィルタ
係数が出力されて、上記ノイズフィルタ13に送られる。

ここで、上記ブロック化回路15、周波数分析回路16、
第１及び第２のノイズレベル設定回路17,18、フィルタ
係数算出回路14は、具体的には例えば以下に示す第３
図，第６図に示すような具体例回路で実現することがで
きる。

第３図に示す具体例回路において、高速フーリエ変換
（FFT）回路111,振幅位相情報発生回路112,帯域分割回
路113,総和検出回路114は、第１図のブロック化回路15
及び周波数分析回路16として動作している。フィルタ回
路76から合成回路80までの各構成要素は、第１図の第１
のノイズレベル設定回路17として動作している。ブロッ
ク遅延回路115,116及び係数乗算器117,118,合成回路119
は、第１図の第２のノイズレベル設定回路18として動作
している。合成回路120,減算器121,ROM122は、上記第１
図のフィルタ係数算出回路14として動作している。この
ROM122の出力が出力端子４を介して第１図のノイズフィ
ルタ13に送られる。

すなわち、本具体例回路では、任意の注目バンド（任
意の臨界帯域）の信号に対して、第１図の第１のノイズ
レベル設定回路17としての各回路によって同時刻マスキ
ング（周波数軸上のマスキング）を考慮した第１の許容
ノイズレベルを設定すると共に、第１図の第２のノイズ
レベル設定回路18としての各回路によって注目バンドの
時間的に先行後行する信号でのテンポラルマスキングを
考慮した第２の許容ノイズレベルを設定するようにして
いる。

すなわち、この第３図の本具体例回路において、入力
端子１には、オーディオ信号が供給されており、この時
間軸上のオーディオ信号が高速フーリエ変換（FFT）回
路111に伝送される。当該高速フーリエ変換回路111で
は、上記時間軸上のオーディオ信号が所定期間（すなわ
ち第１図におけるブロック化回路15でのブロック）毎に
周波数軸上の信号に変換されて、実数成分値Reと虚数成
分値ImとからなるFFT係数が得られる。これらFFT係数は
振幅位相情報発生回路112に伝送され、当該振幅位相情
報発生回路112では上記実数成分値Reと虚数成分値Imと
から振幅値Amと位相値とが得られて、当該振幅値Amの情
報が上記帯域分割回路113へ送られている。すなわち、
一般に人間の聴覚は周波数領域の振幅（パワー）には敏
感であるが、位相についてはかなり鈍感であるため、上
記振幅位相情報発生回路112の出力から上記振幅値Amの
みを取り出し、これを用いるようにしている。

上記帯域分割回路113では、上記振幅値Amのオーディ
オ信号を上記臨界帯域（クリティカルバンド）に分割し
ている。この帯域分割回路113で臨界帯域に分割された
各バンド毎の上記振幅値Amは、それぞれ上記総和検出回
路114に伝送される。当該総和検出回路114では、上記各
バンド毎のエネルギ（各バンドでのスペクトル強度）
が、各バンド内のそれぞれの振幅値Amの総和（振幅値Am
のピーク又は平均或いはエネルギ総和）をとることによ
り求められる。該総和検出回路114の出力が、第２図に
示した上記バークスペクトルSBである。

ここで、上記バークスペクトルSBの周波数軸上のマス
キングに於ける影響を考慮するため、上記バークスペク
トルSBに所定の重みづけの関数を畳込む（コンボリュー
ション）。このため、上記総和検出回路114の出力すな
わち上記バークスペクトルSBの各値は、上記総和検出回
路114の出力をブロック単位で遅延するブロック遅延回
路115を介してフィルタ回路76に送られる。該フィルタ
回路76は、例えば、入力データを順次遅延させる複数の
遅延（z^-1）素子と、各遅延素子からの出力にそれぞれ
フィルタ係数（重みづけの関数）を乗算する複数の乗算
器と、これら乗算器の出力の総和をとる総和加算器とか
ら構成されるものである。該フィルタ回路76により、上
記バークスペクトルSBの畳込み処理が行われる。該畳込
み処理により、第２図中点線で示す部分の総和がとられ
る。

ところで、上記バークスペクトルSBの周波数軸上のマ
スキングスペクトル（すなわち許容可能なノイズスペク
トル）を算出する場合のレベルαにおいては、このレベ
ルαが小さいと周波数軸上の信号に対するマスキングス
ペクトル（マスキングカーブ）が下降することになり、
逆に、上記レベルαが大きいとマスキングスペクトルが
上昇することになる。なお、該レベルαとは、後述する
ように逆コンボリューション処理を行うことによってク
リティカルバンドの各バンド毎の上記マスキングスペク
トルとなるようなレベルである。また、一般にオーディ
オ信号等では、高域部分のスペクトル強度（エネルギ）
が小さい。したがって本具体例においては、これらのこ
とを考慮して、エネルギの小さい高域にいく程、上記レ
ベルαを大きくしている。このようなことから、本具体
例回路における上記第１のノイズレベル設定回路17に対
する回路では、高い周波数程同一のエネルギに対する上
記レベルαを高く設定している。

すなわち、本具体例回路では、上記マスキングスペク
トルに対応するレベルαを算出し、該レベルαが高域程
高くなるように制御している。このため、上記フィルタ
回路76の出力は引算器78に送られる。該引算器78は、上
記畳込んだ領域でのレベルαを求めるものである。ここ
で、上記引算器78には、上記レベルαを求めるための許
容関数（マスキングレベルを表現する関数）が供給され
る。該許容関数を増減させることで上記レベルαの制御
を行っている。該許容関数は、関数発生回路77から供給
されている。

上記マスキングスペクトルに対応するレベルαは、ク
リティカルバンドのバンドの低域から順に与えられる番
号をｉとすると、第（２）式で求めることができる。

α＝Ｓ−（ｎ−ai） ……（２）この第（２）式において、n,aは定数でａ＞０、Ｓは
畳込み処理後のバークスペクトルの強度であり、第
（２）式中（ｎ−ai）が許容関数となる。本具体例では
ｎ＝38,a＝１としている。

このようにして、上記レベルαが求められ、このデー
タは、割算器79に伝送される。当該割算器79では、上記
畳込み処理された領域でのレベルαを逆コンボリューシ
ョンするためのものである。したがって、この逆コンボ
リューション処理を行うことにより、上記レベルαか
ら、マスキングスペクトルが得られるようになる。すな
わち、このマスキングスペクトルが各バンド毎に求めら
れた第１の許容ノイズレベル（許容ノイズスペクトル）
となる。なお、上記逆コンボリューション処理は、複雑
な演算を必要とするが、本具体例では簡略化した割算器
79を用いて逆コンボリューションを行っている。

次に、上記マスキングスペクトルは、合成回路80及び
合成回路120を介して減算器121に供給される。ここで、
当該減算器121には、上記総和検出回路114の出力すなわ
ち前述の総和検出回路114からのバークスペクトルSB
が、遅延回路127を介して供給されている。したがっ
て、この減算器121で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、第４図
に示すように、上記バークスペクトルSBは、該マスキン
グスペクトルMSの各レベルで示すレベル以下がマスキン
グされることになる。

該減算器121の出力は、ROM122に送られる。上記ROM12
2には、複数のフィルタ係数が格納されており、上記減
算器121の出力に応じたフィルタ係数を出力するもので
ある。このROM122の出力が、出力端子４を介して第１図
のノイズフィルタ13に送られる。なお、上記遅延回路12
7は上記合成回路120以前の各回路での遅延量を考慮して
上記総和検出回路114からのバークスペクトルSBを遅延
させるために設けられている。

また、上記合成回路80での合成の際には、最小可聴カ
ーブ発生回路129から供給される第５図に示すような人
間の聴覚特性であるいわゆる最小可聴カーブ（等ラウド
ネス曲線）RCを示すデータと、上記マスキングスペクト
ルMSとを合成することができる。この場合、該最小可聴
カーブRCとマスキングスペクトルMSとを共に合成するこ
とで、第１の許容ノイズレベルはこの図中斜線で示す部
分までとすることができる。なおこの第５図は、前述の
第２図に示したクリティカルバンドで表されており、信
号スペクトルSSも同時に示している。

上述したように、本具体例の上記第１のノイズレベル
設定回路17に対応する各回路においては、各バンド毎の
信号の周波数軸上のマスキングを考慮した第１の許容ノ
イズレベルを求めることができる。従って、該第１の許
容ノイズレベルに基づいたフィルタ係数を設定すること
ができる。

また、本具体例回路においては、上述した同時刻マス
キング（周波数軸上のマスキング）を考慮したフィルタ
係数決定と共に、注目バンド（臨界帯域）の時間的に先
行後行する信号のエネルギに基づいて、当該注目バンド
の上記第２の許容ノイズレベルを設定することで、時間
軸上のテンポラルマスキングを考慮したフィルタ係数の
決定も同時に行うようにしている。すなわち、本具体例
の上記第２のノイズレベル設定回路18に対応する各回路
では、上述したように、第１の許容ノイズレベルが設定
されている任意のバンド（注目バンド）の現時点の信号
に対して、その注目バンドの現時点の信号に時間軸上で
先行後行する前後の信号によるテンポラルマスキングを
考慮して、当該現時点の注目バンドの許容ノイズレベル
（第２の許容ノイズレベル）を設定するようにしてい
る。このため、上記合成回路120には、合成回路80の出
力と共に、上記第２のノイズレベル設定回路18に対応す
る回路の１つである合成回路119の出力も供給されるよ
うになっている。

すなわち、当該合成回路119には、上記第２の許容ノ
イズレベルの信号として上記注目バンドの現時点の信号
に対して時間的に前後の信号のエネルギに基づくテンポ
ラルマスキングのレベルがそれぞれ算出されて供給され
ており、これら時間的に前後の信号による許容ノイズレ
ベルが該合成回路119で合成されて出力されるようにな
っている。

このような第２の許容ノイズレベルを得るために、本
具体例回路では、上記総和検出回路114の出力をブロッ
ク単位で（遅延するブロックは複数であってもよい）遅
延するブロック遅延回路115及び116と、係数乗算器117,
118,上記合成回路119とを設けている。すなわち、上記
ブロック遅延回路115の出力が得られる時点を上記現時
点T₀とすると、当該ブロック遅延回路115に上記総和検
出回路114の出力が供給される時点が当該現時点T₀の時
間的に後（現時点T₀に対しては未来の時間となる）の後
時点T₊₁となり、上記ブロック遅延回路116から出力され
る時点が上記現時点T₀の時間的に前（現時点T₀に対して
は過去の時間となる）の前時点T_-1となる。

上記後時点T₊₁の信号すなわち総和検出回路114の出力
は、係数乗算器118に供給される。該係数乗算器118で
は、該係数乗算器118に信号が供給された該後時点T₊₁で
の上記注目バンドの信号による上記現時点T₀の注目バン
ドの信号に対するテンポラルマスキング（バックワード
マスキング）を考慮して決定された乗算係数が、上記後
時点T₊₁の信号に乗算される。すなわち、この乗算係数
は、合成回路119及び120での影響を考慮して設定される
係数であり、例えば上記後時点T₊₁の信号を正規化して
１とした場合、該後時点T₊₁の信号によるバックワーク
マスキングが上記現時点T₀の信号に対して作用するレベ
ルに対応した乗算係数k_Bが、該後時点T₊₁の信号に乗算
される。また、上記前時点T_-1の信号すなわちブロック
遅延回路116の出力は、係数乗算器117に供給される。該
係数乗算器117では、該係数乗算器117に信号が供給され
た該前時点T_-1での上記注目バンドの信号による上記現
時点T₀の注目バンドの信号に対するテンポラルマスキン
グ（フォワードマスキング）を考慮して決定された乗算
係数が、上記前時点T_-1の信号に乗算される。すなわち
該乗算係数は、上述同様に合成回路119,120での影響を
考慮して設定され、例えば前時点T_-1の信号を正規化し
た場合、該前時点T_-1の信号によるフォワードマスキン
グが上記現時点T₀の信号に対して作用するレベルに対応
した乗算係数k_Fが、当該前時点T_-1の信号に乗算され
る。これら各係数乗算器117,118の出力が合成回路119で
合成されて得られた出力が、上記第２の許容ノイズレベ
ルとなる。なお、上記合成回路119での合成は、例えば
各係数乗算器117,118の出力を加算するような処理が行
われる。このようにして得られた上記合成回路119の出
力が上記合成回路120に送られる。

当該合成回路120では、例えば、上記合成回路119の出
力と合成回路80の出力のうち少なくとも一方すなわち例
えば大きい方を選ぶような合成処理、或いは、各合成回
路119,80の出力をそれぞれ所定の重み付けを行って加算
するような合成処理が行われる。また、この加算による
合成処理の時は、例えば、全帯域のエネルギを考慮した
上記第２の許容ノイズレベルを求めて加算するようにし
てもよい。

なお、本具体例においては、上述した最小可聴カーブ
の合成処理を行わない構成とすることもできる。この場
合は、第３図の構成で最小可聴カーブ発生回路129と合
成回路80が不要となり、このため上記引算器78からの出
力は、割算器79で逆コンボリューションされた後、すぐ
に上記合成回路120に伝送されることになる。

上述したように、本具体例回路においては、注目バン
ドの信号に対して、前記第１図の第１のノイズレベル設
定回路17に対応する各回路によって周波数軸上のマスキ
ングを考慮した第１の許容ノイズレベルを設定すると共
に、第１図の第２のノイズレベル設定回路18に対応する
各回路によって注目バンドの時間的に先行後行する信号
でのテンポラルマスキングを考慮した第２の許容ノイズ
レベルを設定するようにしている。これら第1,第２の許
容ノイズレベルに基づいて減算器121での減算処理が行
われ、更に該減算器121の出力にもどづいてROM122から
フィルタ係数が出力されるため、人間の聴覚上良好なノ
イズシェーピングが可能となる。

第６図に示す他の具体例回路は、入力端子１に供給さ
れた入力オーディオ信号を非ブロック周波数分析するフ
ィルタバンク90と、当該フィルタバンク90によって分析
された各周波数成分を上記ブロック（所定期間）として
例えば10ms,5ms,2.5msのブロックでそれぞれ更に周波数
分析するFFT（高速フーリエ変換）回路20,40,60とを有
し、更に、上記第１の許容ノイズレベルを設定するマス
キングスペクトル算出回路75と、上記第２の許容ノイズ
レベルを設定する期間遅延回路23,43,63、合成回路50,7
0、5ms遅延（DL）回路51,2.5ms遅延回路71,72,73,選択
回路52、合成選択回路74、重付合成回路24,44,64とを有
してなるものである。また、上記フィルタバンク90は、
上記入力オーディオ信号を複数の周波数帯域に分割（本
具体例では３分割）する帯域分割手段として少なくとも
１つのフィルタ（例えばいわゆるQMF等のミラーフィル
タ）を有し、高域ほど帯域幅が大となるような分割を行
うものである。更に、上記FFT回路20,40,60は、高域ほ
ど上記高速フーリエ変換処理がなされるブロック時間長
を小となす処理を行う。本具体例回路の出力は出力端子
４を介して、第１図のノイズフィルタ13に送られる。

すなわち、この第６図において、入力端子１には、例
えばサンプリング周波数fs＝44.1kHzでサンプリングさ
れて得られたDC−22kHzの入力オーディオ信号が供給さ
れており、該入力オーディオ信号が、上記フィルタバン
ク90に供給されている。該フィルタバンク90は、例えば
第７図に示すように、QMF91,92が２段縦続接続されて構
成され、上記入力端子１に供給されたDC〜22kHzの入力
オーディオ信号が、QMF91に供給される。該QMF91は、入
力オーディオ信号を11kHzで２分割するものであり、し
たがって該QMF91からはDC〜11kHz,11kHz〜22kHzの帯域
の出力信号が得られることになる。上記11kHz〜22kHzの
帯域の出力信号は端子93を介して上記FFT回路60に送ら
れる。上記DC〜11kHzの出力信号は、QMF92に送られる。
該QMF92は、5.5kHzで入力信号を２分割するものであ
り、したがって該QMF92からは、DC〜5.5kHz,5.5kHz〜11
kHzの帯域の出力信号が得られることになる。5.5kHz〜1
1kHzの信号が端子94を介して上記FFT回路40へ、DC〜5.5
kHzの信号が端子95を介して上記FFT回路20へ送られる。
このように上記フィルタバンク90では、入力オーディオ
信号を非ブロックで３つの帯域に周波数分割し、高域ほ
ど帯域幅が大となるような分割を行っている。なお、第
７図の例では、フィルタをQMFとしているがBPF（バンド
パスフィルタ）を用いた構成とすることも可能である。

このフィルタバンク90からDC〜5.5kHzの帯域の信号が
供給されるFFT回路20では、供給された信号を10ms毎に
ブロック化してこのブロック毎にFFT処理を行う。ま
た、5.5kHz〜11kHzの帯域の信号が供給されるFFT回路40
では5ms毎のブロックでのFFT処理を行い、11kHz〜22kHz
の帯域の信号が供給されるFFT回路60では2.5ms毎のブロ
ックでのFFT処理を行う。すなわち、これらFFT回路20,4
0,60では、高域ほどFFTされるブロック長を小となす処
理が行われる。このように、本具体例では、各FFT回路2
0,40,60においてブロックを形成する際に、高域での時
間ブロック長を小となす処理を行うことにより、この高
域での時間分解能を上げ、かつ低域では時間分解能を下
げて１ブロック内のサンプル数を増やして周波分解能を
上げている。すなわち、通常の音声信号は高域で定常区
間が短いため上述のように高域での時間分解能を上げる
ことは有効であり、また、一般に、人間の聴覚における
周波数分解能は低域で高いものであるため、上述のよう
に低域での周波数分解能を上げることも有効となる。

ここで、第８図に、上記フィルタバンク90と各FFT回
路20,40,60とによる処理の時間ブロックを示す。すなわ
ちこの第８図には、上記帯域分割,FFT等のそれぞれの処
理単位（ブロック）を示しており、図中ｂ（p,q,r）に
おけるp,q,rの３つのパラメータにより、ブロックが指
定されている。ｐは時間経過を、ｑは帯域を、ｒは時間
ブロックを示している。この第８図において、DC〜5.5k
Hzの低域では各帯域の１つの時間ブロックが10msの時間
長（時間分解能）となることを示している。また5.5kHz
〜11kHzの中域では１つの時間ブロック長が5msとなるこ
とを、11kHz〜22kHzの高域では１つの時間ブロック長が
2.5msとなることを示している。

上記FFT回路20,40,60でFFT処理されて得られた各帯域
毎のFFT係数データは、前記第１図の第1,第２のノイズ
レベル設定回路17,18に対する各回路によって、同時刻
マスキング（周波数軸上のマスキング効果）及びテンポ
ラルマスキング効果を考慮した第1,第２の許容ノイズレ
ベルが設定される。

この第1,第２の許容ノイズレベルは、例えば、以下の
ようにして求められる。

上記FFT回路20,40,60の出力データは、全体として更
に上記クリティカルバンド（臨界帯域）に分割される。
この帯域分割を行うため、FFT回路20の出力データ（周
波数帯域DC〜5.5kHz）は、臨界帯域分割回路21によっ
て、更に上記クリティカルバンドの低域側の例えば20個
分のバンドに分割される。また、FFT回路40の出力デー
タ（5.5kHz〜11kHz）は、臨界帯域分割回路41によっ
て、更にクリティカルバンドの中域の例えば３つ分のバ
ンドに分割され、FFT回路60の出力データ（11kHz〜22kH
z）は、臨界帯域分割回路61により更にクリティカルバ
ンドの高域の例えば２つ分のバンドに分割される。

上記各臨界帯域分割回路21,41,61の出力は、それぞれ
エネルギ検出回路22,42,62に送られる。各エネルギ検出
回路22,42,62では、上記各FFT回路20,40,60での各時間
ブロック毎でかつ各クリティカルバンド毎のデータのエ
ネルギ（各バンドでのスペクトル強度）が、例えば、各
バンド内のそれぞれの振幅値の総和（振幅値のピーク又
は平均或いはエネルギ総和）をとることにより求められ
る。該エネルギ検出回路22,42,62の出力は、各クリティ
カルバンド毎の総和のスペクトル（バークスペクトルS
B、前述の第２図参照）である。

ここで、上記バークスペクトルのSBの周波数軸でのマ
スキングに於ける影響を考慮するため、上記バークスペ
クトルSBに所定の重みづけの関数を畳込む（コンボリュ
ーション）。このため上記エネルギ検出回路22,42,46の
出力すなわち上記バークスペクトルSBの各値は、上記第
１図の第１のノイズレベル設定回路17としてのマスキン
グスペクトル算出回路75に送られる。当該マスキングス
ペクトル算出回路75は、前述した第３図のフィルタ回路
76,引算器78,関数発生回路77,割算器79と同様に構成さ
れるものであるため、詳細な説明は省略する。ただし、
このマスキングスペクトル算出回路75に供給される信号
は、上述したように臨界帯域が３つにわけられたもので
ある。

また、本具体例回路においては、上述した周波数軸上
のマスキングを考慮した第１の許容ノイズレベルの設定
と共に、上記第２の許容ノイズレベルも設定するように
している。ここで、第８図において例えばブロックB2か
ら見ると、上記時間的に先行するデータはブロックB1
（それ以前のブロックも含む）のデータとなり、後行す
るデータはブロックB3（それ以後のブロックも含む）の
データとなる。これらブロックB1,B3（或いはより複数
のブロック）の少なくとも一方のデータにともづいて上
記ブロックB2内の各周波数成分に対する第２の許容ノイ
ズレベル（マスキングレベル）を設定するようにしてい
る。更に、本具体レベルでは、上記第２の許容ノイズレ
ベルでの上記少なくとも一方は、時間的に先行するデー
タとする。すなわち、テンポラルマスキングにおいてマ
スキング効果の時間が長いフォワードマスキングを考慮
して時間的に先行する上記ブロックB1のデータに基づい
てブロックB2への許容ノイズレベルを求めている。また
更に、本具体例では、時間的に異なる期間の周波数成分
的に同一のもののエネルギに基づいて上記第２の許容ノ
イズレベルを設定するようにしている。すなわち、クリ
ティカルバンドのうち同じ周波数バンドの時間的に先
行，後行するデータのエネルギに基づいて第２の許容ノ
イズレベルを設定している。

このため、上記エネルギ検出回路22,42,62の出力は、
それぞれ、上記第２のノイズレベル設定手段の期間遅延
回路23,43,63及び5ms遅延回路51,2.5ms遅延回路71に送
られる。

ここで、上記期間遅延回路23,43,63は、それぞれ供給
されたデータを例えば10msブロックの期間毎に遅延を行
うものである。また、上記期間遅延回路43及び63の出力
は、それぞれ合成回路50,70に送られる。該合成回路50
及び70は、上記FFT回路40,60での時間ブロック（5ms,2.
5msブロック）のデータをそれぞれ10msのデータに合成
するものである。更に、上記5ms遅延回路51は、上記5ms
ブロック毎に遅延を行うものであり、該5ms遅延回路51
の出力は選択回路52に送られる。当該選択回路52は、供
給された5msブロックのデータが、現在処理されている1
0msブロック内の前のブロックデータである場合には、
そのデータを通過させ、また、該10msブロックの先行す
る10msブロック内の後のブロックデータである場合は通
過させないような切換選択を行うものである。すなわち
上記現在処理されている10msブロックを第８図のブロッ
クB2とすると、上記選択回路52に供給された5msブロッ
クデータが第８図中ブロックｂ（2,2,1）である時はオ
ンとなり、ｂ（1,2,2）である時はオフとなる選択を行
う。上記2.5ms遅延回路71は、2.5msのブロック毎に遅延
を行うものであり、当該2.5ms遅延回路71の出力は、順
次2.5ms遅延回路72,73に送られる。各2.5ms遅延回路71,
72,73の出力はそれぞれ合成選択回路74に送られる。当
該合成選択回路74は、供給された2.5msブロックデータ
が、現在処理されている例えばブロックB2の先行するブ
ロックB1内の後のブロックｂ（1,3,4）である場合はオ
フとし、また上記ブロックB2内のブロックｂ（2,3,
1）、ｂ（2,3,2）、ｂ（2,3,3）である場合はオンとす
るような切換選択を行う。同時に当該合成選択回路74で
は、例えばブロックｂ（2,3,2）のデータが供給された
時はこのブロックと前のブロックｂ（2,3,1）との合成
を行い、ブロックｂ（2,3,3）のデータが供給される時
は該ブロックと前の２つのブロックｂ（2,3,1）,b（2,
3,2）との合成い、ブロックｂ（2,3,4）のデータが供給
される時は該ブロックと前の３つのブロックｂ（2,3,
1）,b（2,3,2）,b（2,3,3）との合成を行うようになっ
ている。

上記期間遅延回路23の出力は重付合成回路24に、上記
合成回路50,選択回路52の出力は重付合成回路44に、上
記合成回路70,合成選択回路74の出力は重付合成回路64
に送られる。また、各重付合成回路24,44,64には、前記
マスキングスペクトル算出回路75からのデータも供給さ
れるようになっている。ここで、各種付合成回路24,44,
64は、供給されたデータに対して同時刻及びスペクトル
マスキング効果を考慮した重み付けの係数を合成するも
のである。すなわち、この重み付けの係数は、マスキン
グ効果を考慮して設定される係数であり、例えば現在の
ブロックの信号に対して先行或いは後行するブロックの
信号を正規化して１とした場合、該先行或いは後行する
のブロックの信号による周波数軸上のマスキング及びテ
ンポラルマスキング等に基づいた上記現在のブロックの
信号に対して作用するレベルに対応した重み付けの係数
が、該先行或いは後行するブロックの信号に対して重み
付けられる。これにより、周波数軸上及びテンポラルマ
スキング効果を利用した許容ノイズレベル（マスキング
スペクトル）が設定可能となる。

なお、上述のマスキング効果を考慮したマスキングス
ペクトルは、同じクリティカルバンド内で求められてい
るが、他のクリティカルバンド間でのマスキングを考慮
したものとすることも可能である。

これら各重付合成回路24,44,64の出力は、更にそれぞ
れ合成回路25,45,65を介して減算器27,47,67に送られ
る。ここで、これら減算器27,47,67は、前述の第３図の
減算器121と略同様に機能するものであり詳細な説明は
省略する。ただし、これら減算器27,47,67で扱われる帯
域は、上述したようにクリティカルバンドを３つに分け
たそれぞれの帯域となっている。

該減算器27,47,67の出力は、ROM28,48,68に送られ
る。これらROM28,48,68も、第３図のROM122と略同様に
機能するものであり詳細な説明は省略する。ただし、こ
れらROM28,48,68で扱う帯域も、クリティカルバンドを
３つに分けたそれぞれの帯域となっている。

このようなことから、本具体例回路でも、上記クリテ
ィカルバンドの各バンド毎のエネルギによる同時刻マス
キングと、テンポラルマスキングとを考慮した第1,第２
の許容ノイズレベルに応じて上記ノイズフィルタ13のフ
ィルタ係数が定められている。

上述のようにして決定されたフィルタ係数が合成回路
85によって全帯域合成がなされ、その後出力端子４から
第１図のノイズフィルタ13に送られる。

なお、上記遅延回路30,55,80は上記臨界帯域分割回路
21,41,61以降の回路での遅延量を考慮して設けられてい
るものであり、遅延回路31,56,81は、期間遅延回路23,4
3,63、5ms遅延回路51、2.5ms遅延回路71、マスキングス
ペクトル算出回路75以降の各回路での遅延量を考慮して
設けられている。

また、上記合成回路25,45,65での合成の際には、前述
の第３図の最小可聴カーブ発生回路129と同様の最小可
聴カーブ発生回路26,46,66からのデータも供給されてい
る。ただし、これら最小可聴カーブ発生回路26,46,66か
らのデータも、クリティカルバンドを３つに分けたそれ
ぞれの帯域に対応するデータとなっている。

上述のようなことから、本実施例のオーディオ信号の
量子化誤差低減装置を、例えば規格統一されたディジタ
ルオーディオ機器（例えばいわゆるコンパクトディス
ク，ディジタル・オーディオ・テープレコーダ等）に適
用すれば、該統一規格から現実に得られるダイナミック
レンジよりも、聴感上でより高いダイナミックレンジの
再生音を得られるようになる。例えば、統一規格（上記
CD,DATの場合16ビットスロットワード長の規格）を維持
したままで（再生側には変更を加えず、コンパチビリテ
ィーを保ったままで）、このオーディオ信号の再生音の
聴感上のダイナミックレンジを上げることができるよう
になる。

〔発明の効果〕

本発明のオーディオ信号の量子化誤差低減装置におい
ては、所定期間毎のブロックの入力ディジタル信号を周
波数分析し、各周波数成分のエネルギに基づいた第１の
許容ノイズレベルと、ブロックに時間的に先後行するデ
ータの少なくとも一方のエネルギに基づいた第２の許容
ノイズレベルとの少なくとも一方に基づいて、ノイズフ
ィルタのフィルタ特性を設定するようにしたことによ
り、聴感上のノイズを低減して聴感上のダイナミックレ
ンジを上げることができるようになった。

したがって、本発明のオーディオ信号の量子化誤差低
減装置を、例えば規格統一されたディジタルオーディオ
機器に適用すれば、該統一規格から現実に得られるダイ
ナミックレンジよりも、聴感上でより高いダイナミック
レンジの再生音を得られるようになる。例えば、統一規
格を維持したままで（再生側には変更を加えず、コンパ
チビリティーを保ったままで）、このオーディオ信号の
再生音の聴感上のダイナミックレンジを上げることがで
きるようになる。

【図面の簡単な説明】

第１図は本発明実施例のオーディオ信号の量子化誤差低
減装置の概略構成のブロック図、第２図バークスペクト
ルを示す図、第３図は具体例回路を示すブロック図、第
４図マスキングスペクトルを示す図、第５図は最小可聴
カーブ，マスキングスペクトルを合成した図、第６図は
他の具体例回路を示すブロック図、第７図はフィルタバ
ンクの例を示すブロック回路図、第８図は他の具体例で
のブロックを説明するための図である。 10,12……加算器 11……量子化器 13……ノイズフィルタ 14……フィルタ係数算出回路 15……ブロック化回路 16……周波数分析回路 17……第１のノイズレベル設定回路 18……第２のノイズレベル設定回路

フロントページの続き (56)参考文献特開昭61−199345（ＪＰ，Ａ) 特開昭61−199346（ＪＰ，Ａ) 特開昭61−158220（ＪＰ，Ａ) 特開昭62−8629（ＪＰ，Ａ) 特開平２−143713（ＪＰ，Ａ) 特開平２−233024（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/30 H03M 7/36

Claims

(57)【特許請求の範囲】

【請求項１】量子化器で発生した量子化誤差をノイズフ
ィルタを介して上記量子化器の入力側に帰還するように
したオーディオ信号の量子化誤差低減装置において、入力オーディオ信号を所定期間毎にブロック化するブロ
ック化手段と、上記ブロック化手段からの各ブロック毎に周波数分析を
行う周波数分析手段と、上記周波数分析手段の出力のうち、上記ブロック内の各
周波数成分のエネルギに基づいて第１の許容ノイズレベ
ルを設定する第１のノイズレベル設定手段と、上記周波数分析手段の出力のうち、上記ブロックに時間
的に先行するデータ及び時間的に後行するデータの少な
くとも一方のエネルギに基づいて、当該ブロックの各周
波数成分の第２の許容ノイズレベルを設定する第２のノ
イズレベル設定手段とを有し、上記ノイズフィルタのフィルタ特性を、上記第１及び第
２のノイズレベル設定手段の少なくとも一方の出力に基
づいて設定することを特徴とするオーディオ信号の量子
化誤差低減装置。