JP3060576B2 - ディジタル信号符号化方法 - Google Patents
ディジタル信号符号化方法Info
- Publication number
- JP3060576B2 JP3060576B2 JP3091187A JP9118791A JP3060576B2 JP 3060576 B2 JP3060576 B2 JP 3060576B2 JP 3091187 A JP3091187 A JP 3091187A JP 9118791 A JP9118791 A JP 9118791A JP 3060576 B2 JP3060576 B2 JP 3060576B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- block
- bits
- critical
- critical band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】本発明は、入力ディジタル信号の
符号化を行うディジタル信号の高能率符号化装置に関す
るものである。
符号化を行うディジタル信号の高能率符号化装置に関す
るものである。
【0002】
【従来の技術】オーディオ, 音声等の信号の高能率符号
化においては、オーディオ,音声等の入力信号を時間軸
又は周波数軸で複数のチャンネルに分割すると共に、各
チャンネル毎のビット数を適応的に割当てるビットアロ
ケーシヨン(ビット割当て)による符号化技術がある。
例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化(サブ・
バンド・コーディング:SBC)や、時間軸の信号を周
波数軸上の信号に変換(直交変換)して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化(ATC)、或いは、上記SBCといわゆる
適応予測符号化(APC)とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド(低域)に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て(APC−AB)等の符号
化技術がある。
化においては、オーディオ,音声等の入力信号を時間軸
又は周波数軸で複数のチャンネルに分割すると共に、各
チャンネル毎のビット数を適応的に割当てるビットアロ
ケーシヨン(ビット割当て)による符号化技術がある。
例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化(サブ・
バンド・コーディング:SBC)や、時間軸の信号を周
波数軸上の信号に変換(直交変換)して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化(ATC)、或いは、上記SBCといわゆる
適応予測符号化(APC)とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド(低域)に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て(APC−AB)等の符号
化技術がある。
【0003】上記高能率符号化においては、時間軸上の
オーディオ信号等を、所定の単位時間毎に例えば高速フ
ーリエ変換(FFT)等の直交変換によって時間軸に直
交する軸(周波数軸)に変換し、その後複数の帯域に分
割して、これら分割された各帯域のFFT係数データを
適応的なビット割り当てによって符号化している。この
符号化データが伝送される。
オーディオ信号等を、所定の単位時間毎に例えば高速フ
ーリエ変換(FFT)等の直交変換によって時間軸に直
交する軸(周波数軸)に変換し、その後複数の帯域に分
割して、これら分割された各帯域のFFT係数データを
適応的なビット割り当てによって符号化している。この
符号化データが伝送される。
【0004】
【発明が解決しようとする課題】ところで、この各帯域
毎のFFT係数データを上記適応ビット割り当てにより
符号化する際には、例えば、上記周波数軸上のFFT係
数データをブロック化し、このブロック毎にいわゆるブ
ロックフローティング処理を施すことで、更にビット圧
縮を行う場合が多い。このため、後の復号化のための構
成には、上記帯域分割されると共に上記ブロック毎にブ
ロックフローティング処理されたFFT係数データと、
当該各ブロック毎のフローティング係数及び割り当てビ
ット数に応じたワード長情報からなるサブ情報とが伝送
されることになる。
毎のFFT係数データを上記適応ビット割り当てにより
符号化する際には、例えば、上記周波数軸上のFFT係
数データをブロック化し、このブロック毎にいわゆるブ
ロックフローティング処理を施すことで、更にビット圧
縮を行う場合が多い。このため、後の復号化のための構
成には、上記帯域分割されると共に上記ブロック毎にブ
ロックフローティング処理されたFFT係数データと、
当該各ブロック毎のフローティング係数及び割り当てビ
ット数に応じたワード長情報からなるサブ情報とが伝送
されることになる。
【0005】しかし、上記高能率符号化においては、更
に圧縮効率を高めることが望まれている。
に圧縮効率を高めることが望まれている。
【0006】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号符号化方法を提供することを目的とす
るものである。
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号符号化方法を提供することを目的とす
るものである。
【0007】
【課題を解決するための手段】本発明のディジタル信号
符号化方法は、上述の目的を達成するために提案された
ものであり、入力ディジタル信号を直交変換して臨界帯
域に分割し、当該臨界帯域毎のエネルギに基づいて設定
した各臨界帯域毎の許容ノイズレベルと当該各臨界帯域
毎のエネルギとの差分のレベルに応じたビット数で上記
各臨界帯域の信号成分を符号化すると共に、上記直交変
換後の信号成分をブロック化してこのブロック毎にブロ
ックフローティング処理を行い当該ブロック毎のフロー
ティング係数を伝送するディジタル信号符号化方法であ
って、上記ブロックフローティング処理を上記臨界帯域
よりも狭い帯域の小ブロック単位で行う場合には、上記
臨界帯域毎のフローティング係数の代わりに許容ノイズ
レベルに関する情報を伝送すると共に、上記小ブロック
毎に割り当てられるビット数に応じたワード長の情報を
伝送するようにしたものである。また、本発明は、上記
ブロックフローティング処理を上記臨界帯域よりも広い
帯域の大ブロック単位で行う場合には、上記大ブロック
毎のフローティング係数に関する情報を伝送すると共
に、上記臨界帯域毎に割り当てられるビット数に応じた
ワード長の情報を伝送するようにしたものである。ここ
で、上記割当ビット数決定の際には、例えば、各臨界帯
域毎のエネルギから人間の聴覚特性を考慮していわゆる
マスキング量を求め、このマスキング量に基づく許容ノ
イズレベルを用いて各臨界帯域の割当ビット数を決定す
ることが望ましい。
符号化方法は、上述の目的を達成するために提案された
ものであり、入力ディジタル信号を直交変換して臨界帯
域に分割し、当該臨界帯域毎のエネルギに基づいて設定
した各臨界帯域毎の許容ノイズレベルと当該各臨界帯域
毎のエネルギとの差分のレベルに応じたビット数で上記
各臨界帯域の信号成分を符号化すると共に、上記直交変
換後の信号成分をブロック化してこのブロック毎にブロ
ックフローティング処理を行い当該ブロック毎のフロー
ティング係数を伝送するディジタル信号符号化方法であ
って、上記ブロックフローティング処理を上記臨界帯域
よりも狭い帯域の小ブロック単位で行う場合には、上記
臨界帯域毎のフローティング係数の代わりに許容ノイズ
レベルに関する情報を伝送すると共に、上記小ブロック
毎に割り当てられるビット数に応じたワード長の情報を
伝送するようにしたものである。また、本発明は、上記
ブロックフローティング処理を上記臨界帯域よりも広い
帯域の大ブロック単位で行う場合には、上記大ブロック
毎のフローティング係数に関する情報を伝送すると共
に、上記臨界帯域毎に割り当てられるビット数に応じた
ワード長の情報を伝送するようにしたものである。ここ
で、上記割当ビット数決定の際には、例えば、各臨界帯
域毎のエネルギから人間の聴覚特性を考慮していわゆる
マスキング量を求め、このマスキング量に基づく許容ノ
イズレベルを用いて各臨界帯域の割当ビット数を決定す
ることが望ましい。
【0008】
【作用】本発明によれば、ブロックフローティング処理
が臨界帯域よりも狭い帯域の小ブロックについて行われ
る場合は、1つの臨界帯域内に複数の小ブロックが存在
することになり、この場合、各小ブロック毎のフローテ
ィング係数を伝送せずに、臨界帯域毎の許容ノイズレベ
ルに関する情報及びワード長情報を送るようにすること
で、フローティング係数のためのビット数を減らすこと
ができる。また、臨界帯域よりも広い大ブロックでフロ
ーティング処理を行う場合は、1つの大ブロック内に複
数の臨界帯域が存在することになり、この場合、各臨界
帯域毎のフローティング係数の情報を送らずに、大ブロ
ックで1つのフローティング係数に関する情報を伝送す
るようにすることで、各臨界帯域毎のフローティング係
数の情報を伝送するためのビット数を低減することがで
きる。
が臨界帯域よりも狭い帯域の小ブロックについて行われ
る場合は、1つの臨界帯域内に複数の小ブロックが存在
することになり、この場合、各小ブロック毎のフローテ
ィング係数を伝送せずに、臨界帯域毎の許容ノイズレベ
ルに関する情報及びワード長情報を送るようにすること
で、フローティング係数のためのビット数を減らすこと
ができる。また、臨界帯域よりも広い大ブロックでフロ
ーティング処理を行う場合は、1つの大ブロック内に複
数の臨界帯域が存在することになり、この場合、各臨界
帯域毎のフローティング係数の情報を送らずに、大ブロ
ックで1つのフローティング係数に関する情報を伝送す
るようにすることで、各臨界帯域毎のフローティング係
数の情報を伝送するためのビット数を低減することがで
きる。
【0009】
【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本発明のディジタル信号符号
化方法は、図1及び図2に示すように、入力ディジタル
信号を例えば高速フーリエ変換(FFT)で直交変換し
て人間の聴覚特性を考慮した高域ほど帯域幅が広くなる
ようないわゆる臨界帯域(クリティカルバンド)B(B
1〜B4)に分割し、当該臨界帯域毎のエネルギに基づ
いて設定した各臨界帯域毎の許容ノイズレベルNLと当
該各臨界帯域毎のエネルギとの差分のレベルに応じたビ
ット数で上記各臨界帯域の信号成分(FFT係数デー
タ)を符号化すると共に、上記直交変換後の信号成分を
ブロック化してこのブロックb毎にブロックフローティ
ング処理を行い当該ブロックb毎のフローティング係数
Fcを伝送するディジタル信号符号化方法である。
を参照しながら説明する。本発明のディジタル信号符号
化方法は、図1及び図2に示すように、入力ディジタル
信号を例えば高速フーリエ変換(FFT)で直交変換し
て人間の聴覚特性を考慮した高域ほど帯域幅が広くなる
ようないわゆる臨界帯域(クリティカルバンド)B(B
1〜B4)に分割し、当該臨界帯域毎のエネルギに基づ
いて設定した各臨界帯域毎の許容ノイズレベルNLと当
該各臨界帯域毎のエネルギとの差分のレベルに応じたビ
ット数で上記各臨界帯域の信号成分(FFT係数デー
タ)を符号化すると共に、上記直交変換後の信号成分を
ブロック化してこのブロックb毎にブロックフローティ
ング処理を行い当該ブロックb毎のフローティング係数
Fcを伝送するディジタル信号符号化方法である。
【0010】ここで、本実施例は、例えば図1のよう
に、上記ブロックフローティング処理を上記臨界帯域B
よりも狭い帯域の小ブロック単位(小ブロックb1〜b
4)で行う場合には、上記臨界帯域B毎のフローティン
グ係数の代わりに、許容ノイズレベルNLに関する情報
を伝送すると共に、上記小ブロックb1〜b4毎に割り
当てられるビット数に応じたワード長W1〜W4の情報
を伝送するようにしたものである。
に、上記ブロックフローティング処理を上記臨界帯域B
よりも狭い帯域の小ブロック単位(小ブロックb1〜b
4)で行う場合には、上記臨界帯域B毎のフローティン
グ係数の代わりに、許容ノイズレベルNLに関する情報
を伝送すると共に、上記小ブロックb1〜b4毎に割り
当てられるビット数に応じたワード長W1〜W4の情報
を伝送するようにしたものである。
【0011】また、例えば図2に示すように、上記ブロ
ックフローティング処理を臨界帯域B1〜B4よりも広
い帯域の大ブロック単位(大ブロックb)で行う場合に
は、当該大ブロックb毎のフローティング係数に関する
情報を伝送すると共に、上記臨界帯域B1〜B4毎に割
り当てられるビット数に応じたワード長W1〜W4の情
報を伝送するようにしたものである。
ックフローティング処理を臨界帯域B1〜B4よりも広
い帯域の大ブロック単位(大ブロックb)で行う場合に
は、当該大ブロックb毎のフローティング係数に関する
情報を伝送すると共に、上記臨界帯域B1〜B4毎に割
り当てられるビット数に応じたワード長W1〜W4の情
報を伝送するようにしたものである。
【0012】なお、図1の例は、当該臨界帯域の帯域幅
の広い高域側の1つの臨界帯域Bを抜き出して示したも
のであり、図2の例は、帯域幅の狭い低域側の各帯域を
示したものである。また、図1,図2には、上記割り当
てビット数を求めるためのレベル差とワード長W1〜W
4とが対応するものであるため、該ワード長W1〜W4
を便宜的に図中に示している。
の広い高域側の1つの臨界帯域Bを抜き出して示したも
のであり、図2の例は、帯域幅の狭い低域側の各帯域を
示したものである。また、図1,図2には、上記割り当
てビット数を求めるためのレベル差とワード長W1〜W
4とが対応するものであるため、該ワード長W1〜W4
を便宜的に図中に示している。
【0013】また、本実施例では前述したように、適応
的なビット割り当てによるFFT係数データの符号化処
理を行うようにしている。すなわち、本実施例での適応
的なビット割り当てによる符号化処理は、各臨界帯域毎
のエネルギに基づいて後述するような人間の聴覚特性を
考慮したいわゆるマスキング量を求め、このマスキング
量に基づいて設定される許容ノイズレベル(すなわち各
臨界帯域毎に略一定の許容ノイズレベル)と各臨界帯域
のエネルギとの差分のレベルに応じた割り当てビット数
を求めて、当該各臨界帯域毎の割り当てビット数に応じ
て行われる。
的なビット割り当てによるFFT係数データの符号化処
理を行うようにしている。すなわち、本実施例での適応
的なビット割り当てによる符号化処理は、各臨界帯域毎
のエネルギに基づいて後述するような人間の聴覚特性を
考慮したいわゆるマスキング量を求め、このマスキング
量に基づいて設定される許容ノイズレベル(すなわち各
臨界帯域毎に略一定の許容ノイズレベル)と各臨界帯域
のエネルギとの差分のレベルに応じた割り当てビット数
を求めて、当該各臨界帯域毎の割り当てビット数に応じ
て行われる。
【0014】更に、本実施例においては上記各臨界帯域
内の複数のFFT係数データの一定数毎にブロックを構
成し、このブロック毎にいわゆるブロックフローティン
グ処理を施して、ビット圧縮を行うようにしている。し
たがって、上記図1の例のように、臨界帯域の高域すな
わち帯域幅の広い臨界帯域B内には複数の上記ブロック
(例えば4つの上記小ブロックb1〜b4)が存在する
ようになり、また図2の例のように帯域幅が狭い(臨界
帯域の低域)場合には、1つの大ブロックb内に複数臨
界帯域(例えば4つの臨界帯域B1〜B4)が存在する
ようになる。
内の複数のFFT係数データの一定数毎にブロックを構
成し、このブロック毎にいわゆるブロックフローティン
グ処理を施して、ビット圧縮を行うようにしている。し
たがって、上記図1の例のように、臨界帯域の高域すな
わち帯域幅の広い臨界帯域B内には複数の上記ブロック
(例えば4つの上記小ブロックb1〜b4)が存在する
ようになり、また図2の例のように帯域幅が狭い(臨界
帯域の低域)場合には、1つの大ブロックb内に複数臨
界帯域(例えば4つの臨界帯域B1〜B4)が存在する
ようになる。
【0015】ところで、通常、このようにブロックフロ
ーティング処理を施すようにすると、後の復号化処理の
際には、該フローティング処理のフローティング係数
と、上記割り当てビット数に応じたワード長の情報とが
必要となる。すなわち、後の復号化のための構成に対し
ては、通常、上記ブロック毎のフローティング係数の情
報及び、該フローティング係数のレベルと該臨界帯域の
許容ノイズレベルとのレベル差に基づく割り当てビット
数に応じたワード長の情報を伝送することが必要とな
る。換言すれば、後の復号化の際には、上記フローティ
ング係数の情報から、上記ブロックフローティング処理
における最上位ビット(MSB)が決まり、上記ワード
長の情報から最下位ビット(LSB)が決まって上記許
容ノイズレベルが決定される。更に各ブロックのFFT
係数データ(メインデータ)から信号の大きさが決まる
ようになる。
ーティング処理を施すようにすると、後の復号化処理の
際には、該フローティング処理のフローティング係数
と、上記割り当てビット数に応じたワード長の情報とが
必要となる。すなわち、後の復号化のための構成に対し
ては、通常、上記ブロック毎のフローティング係数の情
報及び、該フローティング係数のレベルと該臨界帯域の
許容ノイズレベルとのレベル差に基づく割り当てビット
数に応じたワード長の情報を伝送することが必要とな
る。換言すれば、後の復号化の際には、上記フローティ
ング係数の情報から、上記ブロックフローティング処理
における最上位ビット(MSB)が決まり、上記ワード
長の情報から最下位ビット(LSB)が決まって上記許
容ノイズレベルが決定される。更に各ブロックのFFT
係数データ(メインデータ)から信号の大きさが決まる
ようになる。
【0016】ここで、通常、上記フローティング係数の
情報は例えば6ビットで表され、上記ワード長の情報は
それぞれ例えば4ビットで表される。なお、直交変換が
DFT(離散的フーリエ変換)の場合、上記ワード長情
報は、大きさ(振幅)と位相若しくは実数部と虚数部を
上記4ビットで表すことになる。このため、例えば、1
つの臨界帯域を複数のフローティングブロックで分割し
た場合、当該ブロックフローティング処理のブロック数
(すなわち帯域の分割数)に応じた当該臨界帯域の全体
の伝送ビット数は、表1に示すようになる。
情報は例えば6ビットで表され、上記ワード長の情報は
それぞれ例えば4ビットで表される。なお、直交変換が
DFT(離散的フーリエ変換)の場合、上記ワード長情
報は、大きさ(振幅)と位相若しくは実数部と虚数部を
上記4ビットで表すことになる。このため、例えば、1
つの臨界帯域を複数のフローティングブロックで分割し
た場合、当該ブロックフローティング処理のブロック数
(すなわち帯域の分割数)に応じた当該臨界帯域の全体
の伝送ビット数は、表1に示すようになる。
【表1】
【0017】この表1において、臨界帯域を1つのブロ
ックで表した場合(1分割)は、フローティング係数に
6ビットで、ワード長に4ビットの合計10ビットが伝
送されることになる。また、臨界帯域を2つのブロック
で表した場合(2分割)は、フローティング係数に6×
2(=12ビット)、ワード長に4×2(=8ビット)
で合計20ビットが伝送されることになる。以下同様
に、3分割した場合はフローティング係数に6×3(=
18ビット)でワード長に4×3(=12ビット)の合
計30ビット、また、4分割(図1の例)の場合はフロ
ーティング係数に6×4(=24ビット)でワード長に
4×4(=16ビット)の合計40ビットが伝送され
る。上述のように、1つの臨界帯域内のブロック数が増
加するほど伝送されるビット数も増加することになる。
ックで表した場合(1分割)は、フローティング係数に
6ビットで、ワード長に4ビットの合計10ビットが伝
送されることになる。また、臨界帯域を2つのブロック
で表した場合(2分割)は、フローティング係数に6×
2(=12ビット)、ワード長に4×2(=8ビット)
で合計20ビットが伝送されることになる。以下同様
に、3分割した場合はフローティング係数に6×3(=
18ビット)でワード長に4×3(=12ビット)の合
計30ビット、また、4分割(図1の例)の場合はフロ
ーティング係数に6×4(=24ビット)でワード長に
4×4(=16ビット)の合計40ビットが伝送され
る。上述のように、1つの臨界帯域内のブロック数が増
加するほど伝送されるビット数も増加することになる。
【0018】これに対し、本発明実施例の上記図1の例
においては、臨界帯域B内の上記各小ブロックのフロー
ティング係数Fc1〜Fc4の情報を伝送せずに、臨界
帯域Bに対して1つのみ設定される上記許容ノイズレベ
ルNLの情報と上記割り当てビット数に応じたワード長
W1〜W4の情報を伝送するようにしている。すなわ
ち、後の復号化処理の際には、上記臨界帯域Bの許容ノ
イズレベルNLの情報が伝送されて来れば、当該許容ノ
イズレベルNLの情報と上記各小ブロックb1〜b4の
ワード長W1〜W4の情報とに基づいて、上記各小ブロ
ックb1〜b4毎のフローティング係数Fc1〜Fc4
の情報を求めることができるため、このフローティング
係数Fc1〜Fc4の情報を伝送しないようにしてい
る。これにより、上記臨界帯域Bに対して4つ必要な上
記フローティング係数Fc1〜Fc4を伝送するための
ビット数が低減できるようになる。
においては、臨界帯域B内の上記各小ブロックのフロー
ティング係数Fc1〜Fc4の情報を伝送せずに、臨界
帯域Bに対して1つのみ設定される上記許容ノイズレベ
ルNLの情報と上記割り当てビット数に応じたワード長
W1〜W4の情報を伝送するようにしている。すなわ
ち、後の復号化処理の際には、上記臨界帯域Bの許容ノ
イズレベルNLの情報が伝送されて来れば、当該許容ノ
イズレベルNLの情報と上記各小ブロックb1〜b4の
ワード長W1〜W4の情報とに基づいて、上記各小ブロ
ックb1〜b4毎のフローティング係数Fc1〜Fc4
の情報を求めることができるため、このフローティング
係数Fc1〜Fc4の情報を伝送しないようにしてい
る。これにより、上記臨界帯域Bに対して4つ必要な上
記フローティング係数Fc1〜Fc4を伝送するための
ビット数が低減できるようになる。
【0019】ここで、上記許容ノイズレベルNLは、上
述したように、人間の聴覚特性を考慮した臨界帯域毎に
求められており、当該臨界帯域では、1つの臨界帯域内
で許容ノイズレベルが略一定と考えることができるもの
である。したがって、上記図1の臨界帯域B内の各小ブ
ロックb1〜b4においても、許容ノイズレベルNLは
同レベルであると考えることができる。ただし、全体の
ダイナミックレンジを例えば120dBとし、上記フロ
ーティング係数を上記6ビットで表すと、該フローティ
ング係数は約2dBの精度を持つことになり、また、上
記ワード長情報を上記4ビットで表すと、該ワード長情
報は約6dBの精度となる。このため、上記図1の各小
ブロックb1〜b4において、後の復号化の際には、フ
ローティング係数Fc1〜Fc4と、上記ワード長W1
〜W4の情報とから決まる許容ノイズレベルNLは、約
2dBステップのズレを持つようになる。しかし、許容
ノイズレベルNLは、通常、略±3dBの範囲内に収ま
る。このようなことから、本実施例では、許容ノイズレ
ベルNLを臨界帯域内で共通の荒い量子化と、臨界帯域
内のフローティング処理の各小ブロックそれぞれの持つ
細かい量子化との2段階で表して当該許容ノイズレベル
NLを精度高く共通値として設定している。すなわち、
本実施例では、許容ノイズレベルNLが4ビットlog
レベルであるため、この4ビットlogで表しきれなか
った許容ノイズレベルNLを2ビットlogで細かく表
すようにしている。したがって本実施例では、約6dB
を4分割して1.5dB精度とすることが可能となる。
このように、上記許容ノイズレベルNLが複数の小ブロ
ックに渡って略等しいことを用い、上記高精度のパラメ
ータを上記フローティング係数と許容ノイズレベルから
選択する事でビット数を低減することがてきることにな
る。このような図1の例におけるビット数低減の様子を
上記表1と比較して表2に示す。
述したように、人間の聴覚特性を考慮した臨界帯域毎に
求められており、当該臨界帯域では、1つの臨界帯域内
で許容ノイズレベルが略一定と考えることができるもの
である。したがって、上記図1の臨界帯域B内の各小ブ
ロックb1〜b4においても、許容ノイズレベルNLは
同レベルであると考えることができる。ただし、全体の
ダイナミックレンジを例えば120dBとし、上記フロ
ーティング係数を上記6ビットで表すと、該フローティ
ング係数は約2dBの精度を持つことになり、また、上
記ワード長情報を上記4ビットで表すと、該ワード長情
報は約6dBの精度となる。このため、上記図1の各小
ブロックb1〜b4において、後の復号化の際には、フ
ローティング係数Fc1〜Fc4と、上記ワード長W1
〜W4の情報とから決まる許容ノイズレベルNLは、約
2dBステップのズレを持つようになる。しかし、許容
ノイズレベルNLは、通常、略±3dBの範囲内に収ま
る。このようなことから、本実施例では、許容ノイズレ
ベルNLを臨界帯域内で共通の荒い量子化と、臨界帯域
内のフローティング処理の各小ブロックそれぞれの持つ
細かい量子化との2段階で表して当該許容ノイズレベル
NLを精度高く共通値として設定している。すなわち、
本実施例では、許容ノイズレベルNLが4ビットlog
レベルであるため、この4ビットlogで表しきれなか
った許容ノイズレベルNLを2ビットlogで細かく表
すようにしている。したがって本実施例では、約6dB
を4分割して1.5dB精度とすることが可能となる。
このように、上記許容ノイズレベルNLが複数の小ブロ
ックに渡って略等しいことを用い、上記高精度のパラメ
ータを上記フローティング係数と許容ノイズレベルから
選択する事でビット数を低減することがてきることにな
る。このような図1の例におけるビット数低減の様子を
上記表1と比較して表2に示す。
【表2】
【0020】この表2において、臨界帯域Bを1つのブ
ロックで表した場合(1分割)は、上記許容ノイズレベ
ルNLを4ビットで、ワード長Wを4ビットで伝送す
る。ただし、上記許容ノイズレベルNLにおいては、上
述したように、2dB分のズレを補償するための2ビッ
トを加えて(4+2ビット)いる。このため、該1分割
では合計10ビットが伝送されることになる。同じく、
臨界帯域Bを2つの小ブロックで表した場合(2分割)
は、許容ノイズレベルNLに4+2×2=8ビット、ワ
ード長Wに4×2=8ビットで合計16ビットが伝送さ
れることになる。以下同様に、3分割した場合は許容ノ
イズレベルNLに4+2×3=10ビット、ワード長W
に4×3=12ビットの合計22ビット、4分割(図1
の例)の場合は許容ノイズレベルNLに4+2×4=1
2ビット、ワード長Wに4×4=16ビットの合計28
ビットが伝送されることになる。このため、表1の例の
伝送ビット数を100%としてこの表2の例と比較する
と、表2の例の場合、1分割では同じく100%となる
のに対し、2分割では80%、3分割では73%、4分
割では70%のように、分割数(ブロック数)が増加す
る程、ビット低減率が向上するようになる。したがっ
て、本実施例の方法は非常に有効であることが理解でき
る。
ロックで表した場合(1分割)は、上記許容ノイズレベ
ルNLを4ビットで、ワード長Wを4ビットで伝送す
る。ただし、上記許容ノイズレベルNLにおいては、上
述したように、2dB分のズレを補償するための2ビッ
トを加えて(4+2ビット)いる。このため、該1分割
では合計10ビットが伝送されることになる。同じく、
臨界帯域Bを2つの小ブロックで表した場合(2分割)
は、許容ノイズレベルNLに4+2×2=8ビット、ワ
ード長Wに4×2=8ビットで合計16ビットが伝送さ
れることになる。以下同様に、3分割した場合は許容ノ
イズレベルNLに4+2×3=10ビット、ワード長W
に4×3=12ビットの合計22ビット、4分割(図1
の例)の場合は許容ノイズレベルNLに4+2×4=1
2ビット、ワード長Wに4×4=16ビットの合計28
ビットが伝送されることになる。このため、表1の例の
伝送ビット数を100%としてこの表2の例と比較する
と、表2の例の場合、1分割では同じく100%となる
のに対し、2分割では80%、3分割では73%、4分
割では70%のように、分割数(ブロック数)が増加す
る程、ビット低減率が向上するようになる。したがっ
て、本実施例の方法は非常に有効であることが理解でき
る。
【0021】なお、ワード長のW1〜W4の情報の量子
化は適応的でなく一様な量子化とされている。
化は適応的でなく一様な量子化とされている。
【0022】また、上述した図1のように臨界帯域より
も狭い帯域の小ブロックでフローティング処理を行う場
合に対して、例えば、ブロックフローティング処理を上
記臨界帯域よりも広い帯域の大ブロックで行う場合に
は、後の復号化の際にも、通常は、各臨界帯域毎のブロ
ックフローティング係数と、各臨界帯域毎に求められる
上記ワード長の情報が必要となる。これに対し、本実施
例においては、図2のようにブロックフローティング処
理を臨界帯域よりも広い帯域の大ブロックbで行う場合
には、前記フローティング係数に関する情報として当該
1つの大ブロックbのフローティング係数Fcの情報
と、臨界帯域B1〜B4毎に求められるワード長W1〜
W4の情報とを伝送するようにする。なお、各臨界帯域
B1〜B4の許容ノイズレベルNL1〜NL4の情報は
伝送しない。すなわち、各臨界帯域B1〜B4ではフロ
ーティング係数Fcが等しいため、該1つのフローティ
ング係数Fcの情報と各臨界帯域毎のワード長W1〜W
4の情報から、上記許容ノイズレベルNL1〜NL4を
求めることができる。したがって上記フローティング係
数Fcの情報と各ワード長W1〜W4の情報のみをサブ
情報として伝送することにより、通常よりもサブ情報の
ためのビット数を減らすことが可能となる。
も狭い帯域の小ブロックでフローティング処理を行う場
合に対して、例えば、ブロックフローティング処理を上
記臨界帯域よりも広い帯域の大ブロックで行う場合に
は、後の復号化の際にも、通常は、各臨界帯域毎のブロ
ックフローティング係数と、各臨界帯域毎に求められる
上記ワード長の情報が必要となる。これに対し、本実施
例においては、図2のようにブロックフローティング処
理を臨界帯域よりも広い帯域の大ブロックbで行う場合
には、前記フローティング係数に関する情報として当該
1つの大ブロックbのフローティング係数Fcの情報
と、臨界帯域B1〜B4毎に求められるワード長W1〜
W4の情報とを伝送するようにする。なお、各臨界帯域
B1〜B4の許容ノイズレベルNL1〜NL4の情報は
伝送しない。すなわち、各臨界帯域B1〜B4ではフロ
ーティング係数Fcが等しいため、該1つのフローティ
ング係数Fcの情報と各臨界帯域毎のワード長W1〜W
4の情報から、上記許容ノイズレベルNL1〜NL4を
求めることができる。したがって上記フローティング係
数Fcの情報と各ワード長W1〜W4の情報のみをサブ
情報として伝送することにより、通常よりもサブ情報の
ためのビット数を減らすことが可能となる。
【0023】該図2の例の場合のビット数低減の様子を
上記表1と比較して表3に示す。
上記表1と比較して表3に示す。
【表3】
【0024】この表3において、1つのブロックb内に
統合される臨界帯域の数(統合数)用いて説明すると、
1ブロックb内に統合される帯域が1つの場合(1帯
域)は、上記フローティング係数Fcのレベルに対する
情報に6ビット、ワード長Wに4ビットとして合計10
ビットを伝送する。同じく、臨界帯域数が2つ(2帯
域)の場合は、フローティング係数Fcに6ビット、ワ
ード長Wに4×2=8ビットで合計14ビットが伝送さ
れることになる。以下同様に、3帯域とした場合はフロ
ーティング係数Fcに6ビット、ワード長Wに4×3=
12ビットの合計18ビット、4帯域(図2の例)の場
合はフローティング係数Fcに6ビット、ワード長Wに
4×4=16ビットの合計22ビットが伝送されること
になる。このため、表2の例の伝送ビット数を100%
としてこの表3の例と比較すると、表3の例の場合、1
帯域は同じく100%となるのに対し、2帯域では70
%、3帯域では60%、4帯域では55%のように、帯
域数が増加する程、ビット低減率が向上するようにな
る。したがって、本実施例の方法は非常に有効であるこ
とが理解できる。
統合される臨界帯域の数(統合数)用いて説明すると、
1ブロックb内に統合される帯域が1つの場合(1帯
域)は、上記フローティング係数Fcのレベルに対する
情報に6ビット、ワード長Wに4ビットとして合計10
ビットを伝送する。同じく、臨界帯域数が2つ(2帯
域)の場合は、フローティング係数Fcに6ビット、ワ
ード長Wに4×2=8ビットで合計14ビットが伝送さ
れることになる。以下同様に、3帯域とした場合はフロ
ーティング係数Fcに6ビット、ワード長Wに4×3=
12ビットの合計18ビット、4帯域(図2の例)の場
合はフローティング係数Fcに6ビット、ワード長Wに
4×4=16ビットの合計22ビットが伝送されること
になる。このため、表2の例の伝送ビット数を100%
としてこの表3の例と比較すると、表3の例の場合、1
帯域は同じく100%となるのに対し、2帯域では70
%、3帯域では60%、4帯域では55%のように、帯
域数が増加する程、ビット低減率が向上するようにな
る。したがって、本実施例の方法は非常に有効であるこ
とが理解できる。
【0025】なお、上記各実施例において、許容ノイズ
レベルNLとして取り得るレベルはダイナミックレンジ
よりも小さい。すなわち、S/Nの最小値が約30dB
程度なのでダイナミックレンジのピーク値(0dB)か
ら約30dBの領域には、許容ノイズレベルが来ること
がなく、エンコーダではこのように設定することが可能
となる。
レベルNLとして取り得るレベルはダイナミックレンジ
よりも小さい。すなわち、S/Nの最小値が約30dB
程度なのでダイナミックレンジのピーク値(0dB)か
ら約30dBの領域には、許容ノイズレベルが来ること
がなく、エンコーダではこのように設定することが可能
となる。
【0026】上述した許容ノイズレベルを求め、更にこ
の許容ノイズレベルに基づいた上記割当ビット数で信号
を符号化する本実施例の符号化方法が適用される構成の
例を図3に示す。
の許容ノイズレベルに基づいた上記割当ビット数で信号
を符号化する本実施例の符号化方法が適用される構成の
例を図3に示す。
【0027】すなわちこの図3において、入力端子1に
供給された時間軸上のディジタルオーディオデータが、
高速フーリエ変換回路11に伝送される。この高速フー
リエ変換回路11では、上記時間軸上のオーディオデー
タが単位時間毎(単位ブロック)に周波数軸上のデータ
に変換され、実数成分値Reと虚数成分値Imとからな
るFFT係数データが得られる。これらFFT係数デー
タは振幅位相情報発生回路12に伝送され、当該振幅位
相情報発生回路12では上記実数成分値Reと虚数成分
値Imとから振幅情報Amと位相情報Phとが得られ
て、該振幅情報Amの情報のみが出力されるようにな
る。すなわち、一般に人間の聴覚は周波数領域の振幅
(パワー)には敏感であるが、位相についてはかなり鈍
感であるため、本実施例では上記振幅情報Amのみを用
いて上記割当ビット数情報を得るようにしている。
供給された時間軸上のディジタルオーディオデータが、
高速フーリエ変換回路11に伝送される。この高速フー
リエ変換回路11では、上記時間軸上のオーディオデー
タが単位時間毎(単位ブロック)に周波数軸上のデータ
に変換され、実数成分値Reと虚数成分値Imとからな
るFFT係数データが得られる。これらFFT係数デー
タは振幅位相情報発生回路12に伝送され、当該振幅位
相情報発生回路12では上記実数成分値Reと虚数成分
値Imとから振幅情報Amと位相情報Phとが得られ
て、該振幅情報Amの情報のみが出力されるようにな
る。すなわち、一般に人間の聴覚は周波数領域の振幅
(パワー)には敏感であるが、位相についてはかなり鈍
感であるため、本実施例では上記振幅情報Amのみを用
いて上記割当ビット数情報を得るようにしている。
【0028】上記振幅情報Amは、先ず帯域分割回路1
3に伝送される。該帯域分割回路13では、上記振幅情
報Amで表現された入力ディジタル信号をいわゆる臨界
帯域幅(クリティカルバンド)に分割している。この臨
界帯域幅とは、人間の聴覚特性(周波数分析能力)を考
慮したものであり、例えば0〜22kHzを25帯域に
分け、高い周波数帯域ほど帯域幅を広く選定しているも
のである。すなわち人間の聴覚は、一種のバンドパスフ
ィルタのような特性を有していて、この各フィルタによ
って分けられたバンドを臨界帯域と呼んでいる。
3に伝送される。該帯域分割回路13では、上記振幅情
報Amで表現された入力ディジタル信号をいわゆる臨界
帯域幅(クリティカルバンド)に分割している。この臨
界帯域幅とは、人間の聴覚特性(周波数分析能力)を考
慮したものであり、例えば0〜22kHzを25帯域に
分け、高い周波数帯域ほど帯域幅を広く選定しているも
のである。すなわち人間の聴覚は、一種のバンドパスフ
ィルタのような特性を有していて、この各フィルタによ
って分けられたバンドを臨界帯域と呼んでいる。
【0029】上記帯域分割回路13で臨界帯域に分割さ
れた各帯域毎の上記振幅情報Amは、各々上記総和検出
回路14に伝送される。この総和検出回路14では、各
帯域毎のエネルギ(各帯域でのスペクトル強度)が、各
帯域内のそれぞれの振幅情報Amの総和(振幅情報Am
のピーク又は平均或いはエネルギ総和)をとることによ
り求められる。該総和検出回路14の出力すなわち各帯
域の総和のスペクトルは、一般にバークスペクトルと呼
ばれ、この各帯域のバークスペクトルSBは例えば図4
に示すようになる。ただし、図4では図示を簡略化する
ため、上記クリティカルバンドのバンド数を12の帯域
(B1 〜B12)で表現している。
れた各帯域毎の上記振幅情報Amは、各々上記総和検出
回路14に伝送される。この総和検出回路14では、各
帯域毎のエネルギ(各帯域でのスペクトル強度)が、各
帯域内のそれぞれの振幅情報Amの総和(振幅情報Am
のピーク又は平均或いはエネルギ総和)をとることによ
り求められる。該総和検出回路14の出力すなわち各帯
域の総和のスペクトルは、一般にバークスペクトルと呼
ばれ、この各帯域のバークスペクトルSBは例えば図4
に示すようになる。ただし、図4では図示を簡略化する
ため、上記クリティカルバンドのバンド数を12の帯域
(B1 〜B12)で表現している。
【0030】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルSBに所定の重みづけの関数を畳込む(コン
ボリューション)。このため、上記総和検出回路14の
出力すなわち該バークスペクトルSBの各値は、フィル
タ回路15に送られる。該フィルタ回路15は、例え
ば、入力データを順次遅延させる複数の遅延素子と、こ
れら遅延素子からの出力にフィルタ係数(重みづけの関
数)を乗算する複数の乗算器(例えば各帯域に対応する
25個の乗算器)と、各乗算器出力の総和をとる総和加
算器とから構成されるものである。このフィルタ回路1
5の各乗算器において、例えば、任意の帯域に対応する
乗算器Mでフィルタ係数1を、乗算器M−1でフィルタ
係数0.15を、乗算器M−2でフィルタ係数0.00
19を、乗算器M−3でフィルタ係数0.000008
6を、乗算器M+1でフィルタ係数0.4を、乗算器M
+2でフィルタ係数0.06を、乗算器M+3でフィル
タ係数0.007を各遅延素子の出力に乗算することに
より、上記バークスペクトルSBの畳込み処理が行われ
る。ただし、Mは1〜25の任意の整数である。この畳
込み処理により、図4中点線で示す部分の総和がとられ
る。なお、上記マスキングとは、人間の聴覚上の特性に
より、ある信号によって他の信号がマスクされて聞こえ
なくなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号に対するマスキング効果
と周波数軸上の信号に対するマスキング効果とがある。
すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルSBに所定の重みづけの関数を畳込む(コン
ボリューション)。このため、上記総和検出回路14の
出力すなわち該バークスペクトルSBの各値は、フィル
タ回路15に送られる。該フィルタ回路15は、例え
ば、入力データを順次遅延させる複数の遅延素子と、こ
れら遅延素子からの出力にフィルタ係数(重みづけの関
数)を乗算する複数の乗算器(例えば各帯域に対応する
25個の乗算器)と、各乗算器出力の総和をとる総和加
算器とから構成されるものである。このフィルタ回路1
5の各乗算器において、例えば、任意の帯域に対応する
乗算器Mでフィルタ係数1を、乗算器M−1でフィルタ
係数0.15を、乗算器M−2でフィルタ係数0.00
19を、乗算器M−3でフィルタ係数0.000008
6を、乗算器M+1でフィルタ係数0.4を、乗算器M
+2でフィルタ係数0.06を、乗算器M+3でフィル
タ係数0.007を各遅延素子の出力に乗算することに
より、上記バークスペクトルSBの畳込み処理が行われ
る。ただし、Mは1〜25の任意の整数である。この畳
込み処理により、図4中点線で示す部分の総和がとられ
る。なお、上記マスキングとは、人間の聴覚上の特性に
より、ある信号によって他の信号がマスクされて聞こえ
なくなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号に対するマスキング効果
と周波数軸上の信号に対するマスキング効果とがある。
すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。
【0031】その後、上記フィルタ回路15の出力は引
算器16に送られる。該引算器16は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル(許容ノイズレベル)に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
算器16に送られる。該引算器16は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル(許容ノイズレベル)に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
【0032】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をiとすると、次の式で求めることができる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、該式中(n−
ai)が許容関数となる。本実施例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をiとすると、次の式で求めることができる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、該式中(n−
ai)が許容関数となる。本実施例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
【0033】このようにして、上記レベルαが求めら
れ、このデータは、割算器17に伝送される。当該割算
器17では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器17を用いて逆コンボリューションを行
っている。
れ、このデータは、割算器17に伝送される。当該割算
器17では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器17を用いて逆コンボリューションを行
っている。
【0034】次に、上記マスキングスペクトルは、合成
回路18を介して減算器19に伝送される。ここで、当
該減算器19には、上記総和検出回路14の出力すなわ
ち前述した総和検出回路14からのバークスペクトルS
Bが、遅延回路21を介して供給されている。したがっ
て、この減算器19で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図5
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
回路18を介して減算器19に伝送される。ここで、当
該減算器19には、上記総和検出回路14の出力すなわ
ち前述した総和検出回路14からのバークスペクトルS
Bが、遅延回路21を介して供給されている。したがっ
て、この減算器19で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図5
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
【0035】当該減算器19の出力は、上記許容ノイズ
レベル補正回路20を介してROM30に送られる。該
ROM30には、上記振幅情報Amの量子化に用いる複
数の割当ビット数情報が格納されており、上記減算回路
19の出力(上記各帯域のエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じた割当ビット
数情報を出力するようになっている。したがって、量子
化回路24では、この割当ビット数情報に基づいて、上
記振幅情報Amの量子化処理が行われ、この出力が出力
端子2から出力される。なお、遅延回路21は上記合成
回路18以前の各回路での遅延量を考慮して上記総和検
出回路14からのバークスペクトルSBを遅延させ、上
記遅延回路23は上記ROM30以前の各回路での遅延
量を考慮して上記振幅情報Amを遅延させるために設け
られている。
レベル補正回路20を介してROM30に送られる。該
ROM30には、上記振幅情報Amの量子化に用いる複
数の割当ビット数情報が格納されており、上記減算回路
19の出力(上記各帯域のエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じた割当ビット
数情報を出力するようになっている。したがって、量子
化回路24では、この割当ビット数情報に基づいて、上
記振幅情報Amの量子化処理が行われ、この出力が出力
端子2から出力される。なお、遅延回路21は上記合成
回路18以前の各回路での遅延量を考慮して上記総和検
出回路14からのバークスペクトルSBを遅延させ、上
記遅延回路23は上記ROM30以前の各回路での遅延
量を考慮して上記振幅情報Amを遅延させるために設け
られている。
【0036】また、上述した合成回路18での合成の際
には、最小可聴カーブ発生回路22から供給される図6
に示すような人間の聴覚特性であるいわゆる最小可聴カ
ーブRCを示すデータと、上記マスキングスペクトルM
Sとを合成することができる。この最小可聴カーブにお
いて、雑音絶対レベルがこの最小可聴カーブ以下ならば
該雑音は聞こえないことになる。更に、該最小可聴カー
ブは、コーディングが同じであっても例えば再生時の再
生ボリュームの違いで異なるものとなる。ただし、現実
的なディジタルシステムでは、例えば16ビットダイナ
ミックレンジへの音楽のはいり方にはさほど違いがない
ので、例えば4kHz付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。したがって、このように例
えばシステムの持つワードレングスの4kHz付近の雑
音が聞こえない使い方をすると仮定し、この最小可聴カ
ーブRCとマスキングスペクトルMSとを共に合成する
ことで許容ノイズレベルを得るようにすると、この場合
の許容ノイズレベルは、図中斜線で示す部分までとする
ことができるようになる。なお、本実施例では、上記最
小可聴カーブの4kHzのレベルを、例えば20ビット
相当の最低レベルに合わせている。また、この図6は、
信号スペクトルSSも同時に示している。
には、最小可聴カーブ発生回路22から供給される図6
に示すような人間の聴覚特性であるいわゆる最小可聴カ
ーブRCを示すデータと、上記マスキングスペクトルM
Sとを合成することができる。この最小可聴カーブにお
いて、雑音絶対レベルがこの最小可聴カーブ以下ならば
該雑音は聞こえないことになる。更に、該最小可聴カー
ブは、コーディングが同じであっても例えば再生時の再
生ボリュームの違いで異なるものとなる。ただし、現実
的なディジタルシステムでは、例えば16ビットダイナ
ミックレンジへの音楽のはいり方にはさほど違いがない
ので、例えば4kHz付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。したがって、このように例
えばシステムの持つワードレングスの4kHz付近の雑
音が聞こえない使い方をすると仮定し、この最小可聴カ
ーブRCとマスキングスペクトルMSとを共に合成する
ことで許容ノイズレベルを得るようにすると、この場合
の許容ノイズレベルは、図中斜線で示す部分までとする
ことができるようになる。なお、本実施例では、上記最
小可聴カーブの4kHzのレベルを、例えば20ビット
相当の最低レベルに合わせている。また、この図6は、
信号スペクトルSSも同時に示している。
【0037】ここで、上記許容ノイズレベル補正回路2
0では、補正値決定回路28から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器19か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路28からは、上記減算器19からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力さ
れ、この補正値データが上記許容ノイズレベル補正回路
20に伝送されることで、上記減算器19からの許容ノ
イズレベルの等ラウドネス曲線を考慮した補正がなされ
るようになる。なお、上記等ラウドネス曲線とは、人間
の聴覚特性に関するものであり、例えば1kHzの純音
と同じ大きさに聞こえる各周波数での音の音圧を求めて
曲線で結んだもので、ラウドネスの等感度曲線とも呼ば
れる。また、該等ラウドネス曲線は、図6に示した最小
可聴カーブRCと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば4kHz付近では1k
Hzのところより音圧が8〜10dB下がっても1kH
zと同じ大きさに聞こえ、逆に50kHz付近では1k
Hzでの音圧よりも約15dB高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音(許容ノイズレベル)は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは、人間の聴覚特性に適合していることがわ
かる。
0では、補正値決定回路28から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器19か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路28からは、上記減算器19からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力さ
れ、この補正値データが上記許容ノイズレベル補正回路
20に伝送されることで、上記減算器19からの許容ノ
イズレベルの等ラウドネス曲線を考慮した補正がなされ
るようになる。なお、上記等ラウドネス曲線とは、人間
の聴覚特性に関するものであり、例えば1kHzの純音
と同じ大きさに聞こえる各周波数での音の音圧を求めて
曲線で結んだもので、ラウドネスの等感度曲線とも呼ば
れる。また、該等ラウドネス曲線は、図6に示した最小
可聴カーブRCと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば4kHz付近では1k
Hzのところより音圧が8〜10dB下がっても1kH
zと同じ大きさに聞こえ、逆に50kHz付近では1k
Hzでの音圧よりも約15dB高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音(許容ノイズレベル)は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは、人間の聴覚特性に適合していることがわ
かる。
【0038】なお、本実施例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
22,合成回路18が不要となり、上記引算器16から
の出力は、割算器17で逆コンボリューションされた
後、すぐに減算器19に伝送されることになる。
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
22,合成回路18が不要となり、上記引算器16から
の出力は、割算器17で逆コンボリューションされた
後、すぐに減算器19に伝送されることになる。
【0039】
【発明の効果】本発明のディジタル信号符号化方法にお
いては、入力ディジタル信号を直交変換して臨界帯域に
分割し、各臨界帯域毎の許容ノイズレベルに基づいた適
応的な割り当てビット数で各臨界帯域の信号成分を符号
化すると共に、直交変換後の信号成分をブロックフロー
ティング処理して得たフローティング係数を伝送するも
のであり、フローティング処理を臨界帯域よりも狭い帯
域の小ブロックで行う場合には、各臨界帯域毎のフロー
ティング係数の代わりに、各臨界帯域毎の許容ノイズレ
ベルに関する情報及び各小ブロックのワード長情報を伝
送するようにしたことにより、フローティング係数のた
めのビット数を減らすことができ、また、ブロックフロ
ーティング処理を臨界帯域よりも広い帯域の大ブロック
で行う場合には、大ブロック毎のフローティング係数に
関する情報を伝送するようにしたことにより、伝送ビッ
ト数を低減することができるようになる。したがって、
より高いビット圧縮が可能となる。
いては、入力ディジタル信号を直交変換して臨界帯域に
分割し、各臨界帯域毎の許容ノイズレベルに基づいた適
応的な割り当てビット数で各臨界帯域の信号成分を符号
化すると共に、直交変換後の信号成分をブロックフロー
ティング処理して得たフローティング係数を伝送するも
のであり、フローティング処理を臨界帯域よりも狭い帯
域の小ブロックで行う場合には、各臨界帯域毎のフロー
ティング係数の代わりに、各臨界帯域毎の許容ノイズレ
ベルに関する情報及び各小ブロックのワード長情報を伝
送するようにしたことにより、フローティング係数のた
めのビット数を減らすことができ、また、ブロックフロ
ーティング処理を臨界帯域よりも広い帯域の大ブロック
で行う場合には、大ブロック毎のフローティング係数に
関する情報を伝送するようにしたことにより、伝送ビッ
ト数を低減することができるようになる。したがって、
より高いビット圧縮が可能となる。
【図1】本発明のフローティング処理を臨界帯域よりも
狭いブロックで行う場合を説明するための図である。
狭いブロックで行う場合を説明するための図である。
【図2】本発明のフローティング処理を臨界帯域よりも
広いブロックで行う場合を説明するための図である。
広いブロックで行う場合を説明するための図である。
【図3】許容ノイズレベル設定のための具体的構成を示
すブロック回路図である。
すブロック回路図である。
【図4】バークスペクトルを示す図である。
【図5】マスキングスペクトルを示す図である。
【図6】最小可聴カーブ,マスキングスペクトルを合成
した図である。
した図である。
B,B1〜B4・・・・帯域 b,b1〜b4・・・・ブロック W1〜W4・・・・・・ワード長 NL,NL1〜NL4・・・許容ノイズレベル
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30
Claims (2)
- 【請求項1】 入力ディジタル信号を直交変換して臨界
帯域に分割し、当該臨界帯域毎のエネルギに基づいて設
定した各臨界帯域毎の許容ノイズレベルと当該各臨界帯
域毎のエネルギとの差分のレベルに応じたビット数で上
記各臨界帯域の信号成分を符号化すると共に、上記直交
変換後の信号成分をブロック化してこのブロック毎にブ
ロックフローティング処理を行い当該ブロック毎のフロ
ーティング係数を伝送するディジタル信号符号化方法で
あって、上記ブロックフローティング処理を上記臨界帯
域よりも狭い帯域の小ブロック単位で行う場合には、上
記臨界帯域毎のフローティング係数の代わりに許容ノイ
ズレベルに関する情報を伝送すると共に、上記小ブロッ
ク毎に割り当てられるビット数に応じたワード長の情報
を伝送することを特徴とするディジタル信号符号化方
法。 - 【請求項2】 入力ディジタル信号を直交変換して臨界
帯域に分割し、当該臨界帯域毎のエネルギに基づいて設
定した各臨界帯域毎の許容ノイズレベルと当該各臨界帯
域毎のエネルギとの差分のレベルに応じたビット数で上
記各臨界帯域の信号成分を符号化すると共に、上記直交
変換後の信号成分をブロック化してこのブロック毎にブ
ロックフローティング処理を行い当該ブロック毎のフロ
ーティング係数を伝送するディジタル信号符号化方法で
あって、上記ブロックフローティング処理を上記臨界帯
域よりも広い帯域の大ブロック単位で行う場合には、上
記大ブロック毎のフローティング係数に関する情報を伝
送すると共に、上記臨界帯域毎に割り当てられるビット
数に応じたワード長の情報を伝送することを特徴とする
ディジタル信号符号化方法。
Priority Applications (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3091187A JP3060576B2 (ja) | 1991-03-29 | 1991-03-29 | ディジタル信号符号化方法 |
DK92906204T DK0531538T3 (da) | 1991-03-29 | 1992-02-28 | Fremgangsmåde til indkodning af digitale signaler |
KR1019920702997A KR100312664B1 (ko) | 1991-03-29 | 1992-02-28 | 디지탈신호부호화방법 |
HU9203759A HU213592B (en) | 1991-03-29 | 1992-02-28 | Coding methods for digital audio signals |
PCT/JP1992/000237 WO1992017942A1 (fr) | 1991-03-29 | 1992-02-28 | Procede de codage de signaux numeriques |
RU92016428/09A RU2090973C1 (ru) | 1991-03-29 | 1992-02-28 | Способ кодирования сигналов |
BR9204799A BR9204799A (pt) | 1991-03-29 | 1992-02-28 | Processo de codificacao para um sinal digital |
DE69225100T DE69225100T2 (de) | 1991-03-29 | 1992-02-28 | Reduzierung der Zusaztinformation bei Teilbandkodierungsverfahren |
AU13383/92A AU654533B2 (en) | 1991-03-29 | 1992-02-28 | Method of encoding digital signals |
EP92906204A EP0531538B1 (en) | 1991-03-29 | 1992-02-28 | Reduction of the size of side-information for Subband coding |
AT92906204T ATE165198T1 (de) | 1991-03-29 | 1992-02-28 | Reduzierung der zusaztinformation bei teilbandkodierungsverfahren |
CA002083709A CA2083709A1 (en) | 1991-03-29 | 1992-02-28 | Coding apparatus or method for digital audio signal |
US07/857,774 US5311561A (en) | 1991-03-29 | 1992-03-26 | Method and apparatus for compressing a digital input signal with block floating applied to blocks corresponding to fractions of a critical band or to multiple critical bands |
CS92926A CS92692A3 (en) | 1991-03-29 | 1992-03-27 | Method of digital signal encoding |
PL92294003A PL168474B1 (pl) | 1991-03-29 | 1992-03-27 | P L 168474 B 1 Sposób dokonywania kompresji cyfrowego sygnalu wejsciowego PL |
CN92102294A CN1032102C (zh) | 1991-03-29 | 1992-03-28 | 数字音频信号的编码方法 |
NO92924552A NO924552L (no) | 1991-03-29 | 1992-11-25 | Fremgangsmaate og anordning for koding av digitalt audiosignal |
FI925400A FI109627B (fi) | 1991-03-29 | 1992-11-27 | Menetelmä digitaalisten signaalien koodausta varten |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3091187A JP3060576B2 (ja) | 1991-03-29 | 1991-03-29 | ディジタル信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04302534A JPH04302534A (ja) | 1992-10-26 |
JP3060576B2 true JP3060576B2 (ja) | 2000-07-10 |
Family
ID=14019448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3091187A Expired - Fee Related JP3060576B2 (ja) | 1991-03-29 | 1991-03-29 | ディジタル信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3060576B2 (ja) |
-
1991
- 1991-03-29 JP JP3091187A patent/JP3060576B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04302534A (ja) | 1992-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100312664B1 (ko) | 디지탈신호부호화방법 | |
JP2861238B2 (ja) | ディジタル信号符号化方法 | |
JP3134338B2 (ja) | ディジタル音声信号符号化方法 | |
JP3134337B2 (ja) | ディジタル信号符号化方法 | |
KR100293855B1 (ko) | 고능률디지털데이터부호화및복호화장치 | |
JP3178026B2 (ja) | ディジタル信号符号化装置及び復号化装置 | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
JPH0435123A (ja) | ディジタル信号符号化装置 | |
JPH03117919A (ja) | ディジタル信号符号化装置 | |
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
JPH05248972A (ja) | 音声信号処理方法 | |
JP3041967B2 (ja) | ディジタル信号符号化装置 | |
JP3336619B2 (ja) | 信号処理装置 | |
JP3089692B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3060576B2 (ja) | ディジタル信号符号化方法 | |
JP3060578B2 (ja) | ディジタル信号符号化方法 | |
JP3060577B2 (ja) | ディジタル信号符号化方法 | |
JP3089691B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3070123B2 (ja) | ディジタル信号符号化装置及び方法 | |
JP3010663B2 (ja) | ノイズシェーピング回路 | |
JP2913695B2 (ja) | ディジタル信号符号化方法 | |
JP3132031B2 (ja) | ディジタル信号の高能率符号化方法 | |
JP2913696B2 (ja) | ディジタル信号符号化方法 | |
JP3134335B2 (ja) | ディジタル信号符号化方法及びディジタル信号復号化装置 | |
JPH0519797A (ja) | 量子化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000328 |
|
LAPS | Cancellation because of no payment of annual fees |