Nothing Special   »   [go: up one dir, main page]

JP3070123B2 - ディジタル信号符号化装置及び方法 - Google Patents

ディジタル信号符号化装置及び方法

Info

Publication number
JP3070123B2
JP3070123B2 JP3092741A JP9274191A JP3070123B2 JP 3070123 B2 JP3070123 B2 JP 3070123B2 JP 3092741 A JP3092741 A JP 3092741A JP 9274191 A JP9274191 A JP 9274191A JP 3070123 B2 JP3070123 B2 JP 3070123B2
Authority
JP
Japan
Prior art keywords
band
level
allowable noise
critical
minimum audible
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3092741A
Other languages
English (en)
Other versions
JPH04304013A (ja
Inventor
健三 赤桐
京弥 筒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3092741A priority Critical patent/JP3070123B2/ja
Priority to KR1019920004796A priority patent/KR100233762B1/ko
Priority to EP92302616A priority patent/EP0506394A2/en
Publication of JPH04304013A publication Critical patent/JPH04304013A/ja
Priority to US08/159,122 priority patent/US5490170A/en
Application granted granted Critical
Publication of JP3070123B2 publication Critical patent/JP3070123B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、周波数軸上の入力信号
を複数の臨界帯域に分割し、各臨界帯域毎にビット配分
して符号化するようなディジタル信号符号化装置及び方
法に関する。
【0002】
【従来の技術】オーディオ信号等をビット圧縮して符号
化する技術の一つとして、周波数軸上の信号をいわゆる
臨界帯域(クリティカルバンド)毎に分割し、各帯域毎
に適応的にビット割当を行って量子化するような技術が
知られている。この割当ビット数は、通常の場合、いわ
ゆるマスキングを考慮した各臨界帯域毎の許容雑音レベ
ル等に応じて決定される。
【発明が解決しようとする課題】
【0003】ところで、上記マスキングを考慮して各臨
界帯域毎に求められた許容雑音レベルに対して、人間の
聴覚上のいわゆる最小可聴特性を考慮して該許容雑音レ
ベルを補正することが考えられており、すでに求められ
た許容雑音レベルと最小可聴レベルとを比較し、大きい
方を新たな許容雑音レベルとするようにしている。
【0004】ところで、マスキングを考慮した許容雑音
レベルは、上記臨界帯域内で同じレベルと考えてよい
が、上記最小可聴限の測定値は正弦波を用いて与えられ
たものであることから、特に高域のように臨界帯域幅が
広い領域においては、同一臨界帯域内の低周波数部分と
高周波数部分とで値が大きく異なってくる。このことか
ら、臨界帯域毎に単一の最小可聴限レベルを与えるので
は誤差が大きくなり、臨界帯域内の高周波数部分では割
当ビット数に無駄が生ずることにもなる。
【0005】また、臨界帯域内を細分割して各小分割帯
域毎に最小可聴限レベルを与えるようにすることも考え
られるが、伝送すべき情報量が増えるため好ましくな
い。
【0006】本発明は、このような実情に鑑みて提案さ
れたものであり、周波数軸上の入力信号を臨界帯域に分
割し各帯域毎にそれぞれ許容雑音レベルに基づいて適応
的にビット割当を行う場合に、許容雑音レベルとして最
小可聴レベルが採用されるときの臨界帯域内での最小可
聴レベルの誤差を少なくし得るようなディジタル信号符
号化装置及び方法の提供を目的とする。
【0007】
【課題を解決するための手段】本発明は、周波数軸上の
入力信号を臨界帯域にそれぞれ分割して各臨界低域毎に
許容雑音レベルに基づいてビット数を適応的に割り当て
て符号化を行うディジタル信号符号化装置であって、上
記臨界帯域内で既に得られている許容雑音レベルを最小
可聴レベルとを比較し、最小可聴レベルが高いときには
フラグを立てるようにし、復号化の際には、上記フラグ
の立っている臨界帯域での許容雑音レベルとして、上記
臨界帯域をさらに小さい領域に分割し、これらの小分割
帯域毎の最小可聴レベルを与えて各小分割帯域の許容雑
音レベルとすることにより、上述の課題を解決するもの
である。
【0008】
【作用】上記フラグの立っている臨界帯域では、許容雑
音レベルが最小可聴レベルにより決定されることから、
臨界帯域をさらに細分割した各小分割帯域の許容雑音レ
ベルによりビット配分を行うことで、伝送情報量を増や
すことなく当該臨界帯域内での正確な許容雑音レベルを
得ることができる。
【0009】
【実施例】図1は本発明のディジタル信号符号化装置の
一実施例としての高能率符号化装置を示している。この
図1に示す実施例の高能率符号化装置では、入力ディジ
タル信号を複数の周波数帯域に分割すると共に、高い周
波数帯域ほどバンド幅を広く選定し、各周波数帯域毎に
直交変換を行って、得られた周波数軸のスペクトルデー
タを、後述する人間の聴覚特性を考慮したいわゆる臨界
帯域幅(クリティカルバンド)毎に適応的にビット割当
して符号化している。これは、帯域分割符号化(SB
C)、適応変換符号化(ATC)及び適応ビット割当て
(APC−AB)の各技術を組み合わせた高能率符号化
技術である。
【0010】すなわち、図1において、入力端子10に
は例えば0〜20kHzのオーディオPCM信号が供給さ
れている。この入力信号は、例えばいわゆるQMFフィ
ルタ等の帯域分割フィルタ11により0〜10kHz帯域
と10k〜20kHz帯域とに分割され、0〜10kHz帯
域の信号は同じくいわゆるQMFフィルタ等の帯域分割
フィルタ12により0〜5kHz帯域と5k〜10kHz帯
域とに分割される。帯域分割フィルタ11からの10k
〜20kHz帯域の信号は直交変換回路の一例である高速
フーリエ変換(FFT)回路13に送られ、帯域分割フ
ィルタ12からの5k〜10kHz帯域の信号はFFT回
路14に送られ、帯域分割フィルタ12からの0〜5k
Hz帯域の信号はFFT回路15に送られることにより、
それぞれFFT処理される。
【0011】ここで、各FFT回路13、14、15に
供給する各帯域毎のブロックについての標準的な入力信
号に対する具体例を図2に示す。この図2の具体例にお
いては、高域側ほど周波数帯域を広げると共に時間分解
能を高め(ブロック長を短くし)ている。すなわち、低
域側の0〜5kHz帯域の信号に対しては1ブロックBL
L を例えば1024サンプルとし、また中域の5k〜1
0kHz帯域の信号に対しては、上記低域側の長さTBL
ブロックBLL のそれぞれ半分の長さTBL/2のブロッ
クBLM1、BLM2でブロック化し、高域側の10k〜2
0kHz帯域の信号に対しては、上記低域側のブロックB
L のそれぞれ1/4の長さTBL/4のブロックB
H1、BLH2、BLH3及びBLH4でブロック化してい
る。なお、入力信号として0〜22kHzの帯域を考慮す
る場合には、低域が0〜5.5kHz、中域が5.5k〜
11kHz、高域が11k〜22kHzとなる。
【0012】再び図1において、各FFT回路13、1
4、15にてFFT処理されて得られた周波数軸上のス
ペクトルデータあるいはFFT係数データは、いわゆる
臨界帯域(クリティカルバンド)毎にまとめられて適応
ビット割当符号化回路18に送られている。このクリテ
ィカルバンドとは、人間の聴覚特性を考慮して分割され
た周波数帯域であり、ある純音の周波数近傍の同じ強さ
の狭帯域バンドノイズによって当該純音がマスクされる
ときのそのノイズの持つ帯域のことである。このクリテ
ィカルバンドは、高域ほど帯域幅が広くなっており、上
記0〜20kHzの全周波数帯域は例えば25のクリティ
カルバンドに分割されている。
【0013】許容雑音算出回路20は、上記クリティカ
ルバンド毎に分割されたスペクトルデータに基づくいわ
ゆるマスキング効果等を考慮した許容ノイズ量と、人間
の聴覚の最小可聴特性とを考慮して、各クリティカルバ
ンド毎の許容雑音レベルを求め、この許容雑音レベルと
各クリティカルバンド毎のエネルギあるいはピーク値等
に基づいて、各クリティカルバンド毎に割当ビット数を
求めている。また適応ビット割当符号化回路18によ
り、各クリティカルバンド毎に割り当てられたビット数
に応じて各スペクトルデータ(あるいはFFT係数デー
タ)を再量子化するようにしている。このようにして符
号化されたデータは、出力端子19を介して取り出され
る。
【0014】ここで、上記許容雑音算出回路20には、
上記最小可聴カーブ発生回路32からの各帯域毎の最小
可聴レベルが供給され、上記マスキング効果を考慮した
許容ノイズレベルと比較器35で比較されて、最小可聴
レベルが高いときに該最小可聴レベルを許容雑音レベル
とするようにしている。このとき、特に高域のクリティ
カルバンド幅の広い帯域での最小可聴レベルの帯域内で
の誤差分を考慮して、クリティカルバンド(臨界帯域)
をさらに小さい領域に分割し、これらの小分割帯域毎の
最小可聴レベルを許容雑音レベルとするようにして各小
分割帯域毎にビット割当を行っている。
【0015】この動作を、図3及び図4を参照しながら
説明する。図3は動作説明フローチャートであり、図4
は1つの臨界帯域B内をさらに小さい領域BBに分割
(図4の例では4分割)した例を示している。
【0016】先ず、図3のステップS1において、1つ
の臨界帯域B内を4分割した小帯域BB1 〜BB4
内、最も低周波数側の小帯域BB1 の最小可聴カーブR
Cのレベルが、マスキングを考慮して求められた現在の
許容雑音であるマスキングスペクトルMSのレベルより
高い(RC>MS)か否かを判別している。このステッ
プS1でYES(最小可聴カーブRCのレベルの方がマ
スキングスペクトルMSのレベルより高い)と判別され
たときにはステップS2に進んで、許容雑音を最小可聴
カーブRCとし、次のステップS3でフラグFRCを立て
る(FRC=1)。次に、ステップS4に進んで、許容雑
音である最小可聴カーブRCのレベルに応じて適応的に
ビット割当して符号化を行う。これに対して、ステップ
S1でNOと判別されたときには、ステップS5に進ん
で許容雑音をマスキングスペクトルMSとし、ステップ
S6でフラグFRCを0とし、上記ステップS4に進む。
【0017】ここで、図4に示すような1つの臨界帯域
(クリティカルバンド)Bを見るとき、現在得られてい
る許容雑音としてのマスキングスペクトルMSに対し
て、最小可聴カーブがRCaのときが上記ステップS1
でYESと判別される場合に該当し、最小可聴カーブが
RCbやRCcのときには上記ステップS1でNOと判
別される場合に該当する。そして、最小可聴カーブがR
Caのときには、この最小可聴カーブRCaが許容雑音
となり、各小帯域BB1 〜BB4 毎に与えられる許容雑
音レベルに応じて、各小帯域BB1〜BB4 毎にビット
割当が行われる。これに対して、最小可聴カーブがRC
bやRCcのときには、許容雑音はマスキングスペクト
ルMSとなり、臨界帯域B内で一つの許容雑音レベルに
応じたビット割当が行われる。
【0018】ところで、量子化されたメイン情報と共に
補助情報として上記許容雑音レベルを伝送する場合にお
いては、上記最小可聴カーブRCaが許容雑音とされる
ときでも、伝送される情報は臨界帯域B内で一つの許容
雑音レベルのみである。これは、最小可聴カーブは人間
の聴覚特性から定まっているものであることから、RO
M等に最小可聴カーブ形状パターンあるいは相対値デー
タ等を予め記憶させておくことにより、例えば小帯域B
1 の最小可聴レベルに基づいて他の小帯域BB2 〜B
4 の最小可聴レベルも容易に求めることができるから
である。
【0019】次に図5は、デコーダ側での復号処理の要
部を説明するためのフローチャートである。この図5の
ステップS11において、上記フラグFRCが1か否かが
判別され、YESのとき、すなわち当該臨界帯域の許容
雑音が最小可聴カーブで与えられているとき、次のステ
ップS12で上記各小帯域BB1 〜BB4 毎の許容雑音
レベルを算出している。すなわち、図6に示すように、
1つの臨界帯域Bにつき1つの許容雑音レベル、例えば
最も低周波数側の小帯域BB1 の許容雑音レベルNL1
のみが送られてきたとしても、上述したように、ROM
等に蓄えられた最小可聴限値の相対値リスト等により、
最小可聴カーブRCのパターンから各小帯域BB2 〜B
4 毎の許容雑音レベルNL2 〜NL4を計算で求める
ことができるわけである。
【0020】また、ステップS11でNOと判別された
とき、すなわち当該臨界帯域の許容雑音が上記マスキン
グスペクトルMSで与えられるものであるとき、ステッ
プS13に進んで、1つの臨界帯域B内で一定の許容雑
音レベルとする。これらの各ステップS12、13で求
められた許容雑音レベルに基づき、次のステップS14
でビット割当復号化処理が実行される。
【0021】次に、図7は上記許容雑音算出回路20の
一具体例の概略構成を示すブロック回路図である。この
図7において、入力端子21には、上記FFT回路1
3、14、15からの周波数軸上のスペクトルデータが
供給されている。このデータとしては、FFT演算をし
て得られるFFT係数データの実数成分と虚数成分との
基づいて算出された振幅値と位相値との内の振幅値を用
いるようにしている。これは、一般に人間の聴覚は周波
数軸上の振幅(レベル、強度)には敏感であるが位相に
ついては鈍感であることを考慮したものである。
【0022】この周波数軸上の入力データは、帯域毎の
エネルギ算出回路22に送られて、上記クリティカルバ
ンド(臨界帯域)毎のエネルギが、例えば当該バンド内
での各振幅値の総和を計算すること等により求められ
る。この各バンド毎のエネルギの代わりに、振幅値のピ
ーク値、平均値等が用いられることもある。このエネル
ギ算出回路22からの出力として、例えば各バンドの総
和値のスペクトルは、一般にバークスペクトルと称され
ている。図8はこのような各クリティカルバンド毎のバ
ークスペクトルBSを示している。ただし、この図8で
は、図示を簡略化するため、上記クリティカルバンドの
バンド数を12バンド(B1 〜B12)で表現している。
【0023】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記総和検出回路14の出力すなわち該バーク
スペクトルSBの各値は、畳込みフィルタ回路23に送
られる。該畳込みフィルタ回路23は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフィルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図8中
点線で示す部分の総和がとられる。なお、上記マスキン
グとは、人間の聴覚上の特性により、ある信号によって
他の信号がマスクされて聞こえなくなる現象をいうもの
であり、このマスキング効果には、時間軸上のオーディ
オ信号による時間軸マスキング効果と、周波数軸上の信
号による同時刻マスキング効果とがある。これらのマス
キング効果により、マスキングされる部分にノイズがあ
ったとしても、このノイズは聞こえないことになる。こ
のため、実際のオーディオ信号では、このマスキングさ
れる範囲内のノイズは許容可能なノイズとされる。
【0024】ここで、上記畳込みフィルタ回路23の各
乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。
【0025】次に、上記畳込みフィルタ回路23の出力
は引算器24に送られる。該引算器24は、上記畳込ん
だ領域での後述する許容可能なノイズレベルに対応する
レベルαを求めるものである。なお、当該許容可能なノ
イズレベル(許容ノイズレベル)に対応するレベルα
は、後述するように、逆コンボリューション処理を行う
ことによって、クリティカルバンドの各バンド毎の許容
ノイズレベルとなるようなレベルである。ここで、上記
引算器24には、上記レベルαを求めるための許容関数
(マスキングレベルを表現する関数)が供給される。こ
の許容関数を増減させることで上記レベルαの制御を行
っている。当該許容関数は、次に説明するような(n−
ai)関数発生回路25から供給されているものであ
る。
【0026】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(1)式で求めるこ
とができる。 α=S−(n−ai) ・・・(1) この(1)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(1)
式中(n-ai)が許容関数となる。本実施例ではn=38,
a=1としており、この時の音質劣化はなく、良好な符
号化が行えた。
【0027】このようにして、上記レベルαが求めら
れ、このデータは、割算器26に伝送される。当該割算
器26では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器26を用いて逆コンボリューションを行
っている。
【0028】次に、上記マスキングスペクトルは、合成
回路27を介して減算器28に伝送される。ここで、当
該減算器28には、上記帯域毎のエネルギ検出回路22
からの出力、すなわち前述したバークスペクトルSB
が、遅延回路29を介して供給されている。したがっ
て、この減算器28で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図9
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
【0029】当該減算器28からの出力は、許容雑音補
正回路30を介し、出力端子31を介して取り出され、
例えば割当てビット数情報が予め記憶されたROM等
(図示せず)に送られる。このROM等は、上記減算回
路28から許容雑音補正回路30を介して得られた出力
(上記各バンドのエネルギと上記ノイズレベル設定手段
の出力との差分のレベル)に応じ、各バンド毎の割当ビ
ット数情報を出力する。この割当ビット数情報が上記適
応ビット割当符号化回路18に送られることで、FFT
回路13、14、15からの周波数軸上の各スペクトル
データがそれぞれのバンド毎に割り当てられたビット数
で量子化されるわけである。
【0030】すなわち要約すれば、適応ビット割当符号
化回路18では、上記クリティカルバンドの各バンドの
エネルギと上記ノイズレベル設定手段の出力との差分の
レベルに応じて割当てられたビット数で上記各バンド毎
のスペクトルデータを量子化することになる。なお、遅
延回路29は上記合成回路27以前の各回路での遅延量
を考慮してエネルギ検出回路22からのバークスペクト
ルSBを遅延させるために設けられている。
【0031】ところで、上述した合成回路27での合成
の際には、最小可聴カーブ発生回路32から供給される
図10に示すような人間の聴覚特性であるいわゆる最小
可聴カーブRCを示すデータと、上記マスキングスペク
トルMSとを合成することができる。この最小可聴カー
ブにおいて、雑音絶対レベルがこの最小可聴カーブ以下
ならば該雑音は聞こえないことになる。この最小可聴カ
ーブは、コーディングが同じであっても例えば再生時の
再生ボリュームの違いで異なるものとなが、現実的なデ
ィジタルシステムでは、例えば16ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば4kHz付近の最も耳に聞こえやすい周波数帯域の
量子化雑音が聞こえないとすれば、他の周波数帯域では
この最小可聴カーブのレベル以下の量子化雑音は聞こえ
ないと考えられる。したがって、このように例えばシス
テムの持つワードレングスの4kHz付近の雑音が聞こえ
ない使い方をすると仮定し、この最小可聴カーブRCと
マスキングスペクトルMSとを共に合成することで許容
ノイズレベルを得るようにすると、この場合の許容ノイ
ズレベルは、図10中の斜線で示す部分までとすること
ができるようになる。なお、本実施例では、上記最小可
聴カーブの4kHzのレベルを、例えば20ビット相当の
最低レベルに合わせている。また、この図10は、信号
スペクトルSSも同時に示している。
【0032】なお、前記図3〜図6と共に説明したよう
に、最小可聴カーブが許容ノイズとされるクリティカル
バンドでは、該クリティカルバンド内をより小さい帯域
で分割した小帯域単位でのビット割当が行われるわけで
ある。すなわち、比較回路35において最小可聴カーブ
発生回路32からの最小可聴カーブと割算回路28から
のマスキングスペクトルMSとが比較され、比較結果
は、合成回路27に送られると共に、上記フラグFRC
して出力端子36から取り出される。例えば図10のバ
ンドB11及びB12においては、マスキングスペクトルM
Sのレベルより最小可聴カーブRCのレベルの方が高い
ため、この最小可聴カーブRCが許容ノイズとされて上
記フラグFRC=1とされ、クリティカルバンド内を細分
割したときの例えば最も低周波数側の小帯域の最小可聴
カーブRCのレベルが伝送されるわけである。デコーダ
側で各小帯域毎の許容ノイズレベル算出が行われること
は、前述したとおりである。
【0033】また、上記許容雑音補正回路30では、補
正情報出力回路33から送られてくる例えば等ラウドネ
スカーブの情報に基づいて、上記減算器28からの出力
における許容雑音レベルを補正している。ここで、等ラ
ウドネスカーブとは、人間の聴覚特性に関する特性曲線
であり、例えば1kHzの純音と同じ大きさに聞こえる各
周波数での音の音圧を求めて曲線で結んだもので、ラウ
ドネスの等感度曲線とも呼ばれる。またこの等ラウドネ
ス曲線は、図10に示した最小可聴カーブRCと略同じ
曲線を描くものである。この等ラウドネス曲線において
は、例えば4kHz付近では1kHzのところより音圧が8
〜10dB下がっても1kHzと同じ大きさに聞こえ、逆
に、50kHz付近では1kHzでの音圧よりも約15dB
高くないと同じ大きさに聞こえない。このため、上記最
小可聴カーブのレベルを越えた雑音(許容ノイズレベ
ル)は、該等ラウドネス曲線に応じたカーブで与えられ
る周波数特性を持つようにするのが良いことがわかる。
このようなことから、上記等ラウドネス曲線を考慮して
上記許容ノイズレベルを補正することは、人間の聴覚特
性に適合していることがわかる。
【0034】ここで、補正情報出力回路33として、上
記符号化回路18での量子化の際の出力情報量(データ
量)の検出出力と、最終符号化データのビットレート目
標値との間の誤差の情報に基づいて、上記許容ノイズレ
ベルを補正するようにしてもよい。これは、全てのビッ
ト割当単位ブロックに対して予め一時的な適応ビット割
当を行って得られた総ビット数が、最終的な符号化出力
データのビットレートによって定まる一定のビット数
(目標値)に対して誤差を持つことがあり、その誤差分
を0とするように再度ビット割当をするものである。す
なわち、目標値よりも総割当ビット数が少ないときに
は、差のビット数を各単位ブロックに割り振って付加す
るようにし、目標値よりも総割当ビット数が多いときに
は、差のビット数を各単位ブロックに割り振って削るよ
うにするわけである。
【0035】このようなことを行うため、上記総割当ビ
ット数の上記目標値からの誤差を検出し、この誤差デー
タに応じて補正情報出力回路33が各割当ビット数を補
正するための補正データを出力する。ここで、上記誤差
データがビット数不足を示す場合は、上記単位ブロック
当たり多くのビット数が使われることで上記データ量が
上記目標値よりも多くなっている場合を考えることがで
きる。また、上記誤差データが、ビット数余りを示すデ
ータとなる場合は、上記単位ブロック当たり少ないビッ
ト数で済み、上記データ量が上記目標値よりも少なくな
っている場合を考えることができる。したがって、上記
補正情報出力回路33からは、この誤差データに応じ
て、上記減算器28からの出力における許容ノイズレベ
ルを、例えば上記等ラウドネス曲線の情報データに基づ
いて補正させるための上記補正値のデータが出力される
ようになる。上述のような補正値が、上記許容雑音補正
回路30に伝送されることで、上記減算器28からの許
容ノイズレベルが補正されるようになる。
【0036】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、オーディオPCM信号のみな
らず、ディジタル音声(スピーチ)信号やディジタルビ
デオ信号等の信号処理装置にも適用可能である。また、
上述した最小可聴カーブの合成処理を行わない構成とし
てもよい。この場合には、最小可聴カーブ発生回路3
2、合成回路27が不要となり、上記引算器24からの
出力は、割算器26で逆コンボリューションされた後、
直ちに減算器28に伝送されることになる。
【0037】
【発明の効果】本発明に係るディジタル信号符号化装置
及び方法によれば、臨界帯域(クリティカルバンド)毎
の許容雑音レベルが最小可聴レベルで決定されるとき、
該臨界帯域をさらに小帯域に分割た各小帯域毎の許容雑
音レベルにてビット割当を行うようにし、これを表すフ
ラグを伝送するだけで各小帯域毎に許容雑音レベルを送
る必要と回避している。従って、補助情報量を増加させ
ることなく正確な許容雑音レベルを得ることが可能とな
る。これはビット圧縮効率を劣化させることなく、信号
の品質を高めることができることでもある。また、最小
可聴限レベルの絶対値を後から変更しても互換性が保て
る。
【図面の簡単な説明】
【図1】本発明の一実施例のディジタル信号符号化装置
の概略構成を示すブロック回路図である。
【図2】該実施例における分割帯域及び各帯域での時間
軸方向のブロック化の具体例を示す図である。
【図3】該実施例のエンコード動作の要部を説明するた
めのフローチャートである。
【図4】該実施例のエンコード動作の説明に供する臨界
帯域を示す図である。
【図5】該実施例のデコード動作の要部を説明するため
のフローチャートである。
【図6】該実施例のデコード動作の説明に供する臨界帯
域を示す図である。
【図7】該実施例の許容雑音算出回路20の具体例を示
すブロック回路図である。
【図8】バークスペクトルを示す図である。
【図9】マスキングスペクトルを示す図である。
【図10】最小可聴カーブ、マスキングスペクトルを合
成した図である。
【符号の説明】
11、12・・・・・・・・帯域分割フィルタ 13、14、15・・・・・・・・直交変換回路 18・・・・・・・・適応ビット割当符号化回路 20・・・・・・・・許容雑音算出回路 22・・・・・・・・帯域毎のエネルギ検出回路 23・・・・・・・・畳込みフィルタ回路 27・・・・・・・・合成回路 28・・・・・・・・減算器 30・・・・・・・・許容雑音補正回路 32・・・・・・・・最小可聴カーブ発生回路 33・・・・・・・・補正情報出力回路 35・・・・・・・・比較回路 36・・・・・・・・フラグ出力回路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−201700(JP,A) 特開 平3−35298(JP,A) 特開 平3−35299(JP,A) 特開 平3−139923(JP,A) 特開 平3−263925(JP,A) 特開 平3−263926(JP,A) 特開 平4−302540(JP,A) 特開 平4−304029(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 周波数軸上の入力信号を臨界帯域にそれ
    ぞれ分割して各臨界低域毎に許容雑音レベルに基づいて
    ビット数を適応的に割り当てて符号化を行うディジタル
    信号符号化装置であって、 上記臨界帯域内で既に得られている許容雑音レベルを最
    小可聴レベルとを比較し、最小可聴レベルが高いときに
    はフラグを立てるようにし、 復号化の際には、上記フラグの立っている臨界帯域での
    許容雑音レベルとして、上記臨界帯域をさらに小さい領
    域に分割し、これらの小分割帯域毎の最小可聴レベルを
    与えて各小分割帯域の許容雑音レベルとすることを特徴
    とするディジタル信号符号化装置。
  2. 【請求項2】 周波数軸上の入力信号を臨界帯域にそれ
    ぞれ分割して各臨界低域毎に許容雑音レベルに基づいて
    ビット数を適応的に割り当てて符号化を行うディジタル
    信号符号化方法であって、 上記臨界帯域内で既に得られている許容雑音レベルを最
    小可聴レベルとを比較し、最小可聴レベルが高いときに
    はフラグを立てるようにし、 復号化の際には、上記フラグの立っている臨界帯域での
    許容雑音レベルとして、上記臨界帯域をさらに小さい領
    域に分割し、これらの小分割帯域毎の最小可聴レベルを
    与えて各小分割帯域の許容雑音レベルとすることを特徴
    とするディジタル信号符号化方法。
JP3092741A 1991-03-29 1991-03-30 ディジタル信号符号化装置及び方法 Expired - Lifetime JP3070123B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP3092741A JP3070123B2 (ja) 1991-03-30 1991-03-30 ディジタル信号符号化装置及び方法
KR1019920004796A KR100233762B1 (ko) 1991-03-30 1992-03-25 디지탈 신호 부호화 장치
EP92302616A EP0506394A2 (en) 1991-03-29 1992-03-26 Coding apparatus for digital signals
US08/159,122 US5490170A (en) 1991-03-29 1993-11-30 Coding apparatus for digital signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3092741A JP3070123B2 (ja) 1991-03-30 1991-03-30 ディジタル信号符号化装置及び方法

Publications (2)

Publication Number Publication Date
JPH04304013A JPH04304013A (ja) 1992-10-27
JP3070123B2 true JP3070123B2 (ja) 2000-07-24

Family

ID=14062844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3092741A Expired - Lifetime JP3070123B2 (ja) 1991-03-29 1991-03-30 ディジタル信号符号化装置及び方法

Country Status (2)

Country Link
JP (1) JP3070123B2 (ja)
KR (1) KR100233762B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0836399A (ja) * 1994-07-21 1996-02-06 Sony Corp オーディオ符号化データの処理装置

Also Published As

Publication number Publication date
KR920019187A (ko) 1992-10-22
JPH04304013A (ja) 1992-10-27
KR100233762B1 (ko) 1999-12-01

Similar Documents

Publication Publication Date Title
JP3134338B2 (ja) ディジタル音声信号符号化方法
JP3134337B2 (ja) ディジタル信号符号化方法
US5490170A (en) Coding apparatus for digital signal
AU640780B2 (en) Digital signal encoding apparatus
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
EP0575110B1 (en) Compressing and expanding digital signals
WO1992017942A1 (fr) Procede de codage de signaux numeriques
JPH05304479A (ja) オーディオ信号の高能率符号化装置
JP3041967B2 (ja) ディジタル信号符号化装置
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP3060578B2 (ja) ディジタル信号符号化方法
JP3134335B2 (ja) ディジタル信号符号化方法及びディジタル信号復号化装置
JP2913696B2 (ja) ディジタル信号符号化方法
JP2913695B2 (ja) ディジタル信号符号化方法
JP3060576B2 (ja) ディジタル信号符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JP3033157B2 (ja) ディジタル信号符号化装置
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JP3132031B2 (ja) ディジタル信号の高能率符号化方法
JPH04302538A (ja) ディジタル信号符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000425

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090526

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110526

Year of fee payment: 11

EXPY Cancellation because of completion of term