JP3942882B2 - ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 - Google Patents
ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 Download PDFInfo
- Publication number
- JP3942882B2 JP3942882B2 JP2001376308A JP2001376308A JP3942882B2 JP 3942882 B2 JP3942882 B2 JP 3942882B2 JP 2001376308 A JP2001376308 A JP 2001376308A JP 2001376308 A JP2001376308 A JP 2001376308A JP 3942882 B2 JP3942882 B2 JP 3942882B2
- Authority
- JP
- Japan
- Prior art keywords
- bit allocation
- allocation amount
- quantization error
- frequency band
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、ミニディスクなどの記録媒体に音楽や音声等のディジタル信号を記録する際に、これらの記録対象に適応して各周波数帯域のスペクトルに対するビット割り当てを行ってデータ量を圧縮するディジタル信号符号化装置に関するものである。
【0002】
【従来の技術】
音楽や音声等のディジタル信号を高能率で圧縮符号化する従来の方法として、ミニディスクで用いられているATRAC(Adaptive Transform Acoustic Coding)が挙げられる。このATRACでは、高能率で圧縮するために、ディジタル信号を複数の周波数帯域(サブバンド)に分割した後、可変長の時間単位で符号化ユニットにブロック化してMDCT(Modified Discrete Cosine Transform)処理を施し、スペクトル信号に変換し、さらに聴覚心理特性を利用して割り当てられたビット数で各スペクトル信号をそれぞれ符号化する。
【0003】
上記の圧縮符号化に適応することができる聴覚心理特性には、等ラウドネス特性やマスキング効果が挙げられる。等ラウドネス特性は、同じ音圧レベルの音であっても、人間が感じ取る音の大きさが周波数によって変化することを表す。従って、等ラウドネス特性は、人間が感じ取ることができる音の大きさである最小可聴限が周波数によって変化することを表している。
【0004】
一方、マスキング効果には、同時マスキングと経時マスキングとがある。同時マスキングは、複数の周波数成分の音が同時に発生しているときに、ある音が別の音を聞き取り難くさせる現象である。経時マスキングは、大きな音の時間軸方向の前後でマスキングを受ける現象である。
【0005】
また、ビット割り当ての方法は、上記の聴覚心理特性を利用して、要求される音質レベルと使用できるハードウェア能力とのバランスを考慮したアルゴリズムを採用する必要がある。
【0006】
例えば、反復法と呼ばれるビット割り当て法では、入力ディジタル信号に適応したビット割り当てが以下のようにして行われている。まず、各周波数帯域のパワーSを求め、そのパワーSによる他の周波数帯域に対するマスキングしきい値Mを求める。次に、このマスキングしきい値Mと、各周波数帯域をnビットで量子化したときの量子化雑音パワーN(n)とから、マスキングしきい値対雑音比MNR(n)=M/N(n)を求める。続いて、そのマスキングしきい値対雑音比MNR(n)が最小となる周波数帯域にビット割り当てを行った後、そのマスキングしきい値対雑音比MNR(n)を更新し、再び最小の周波数帯域にビット割り当てを行う。
【0007】
【発明が解決しようとする課題】
経時変化の小さい信号の入力時に、瞬間的に経時変化の大きい信号が入力されると、同一周波数の量子化誤差が隣接するフレーム間で変動し、それが異音として知覚されることがある。特に、自身がマスキング効果の影響を受けないピーク周波数の量子化誤差が変動した場合に異音として知覚される。
【0008】
上記のような異なるタイプの信号に対しては、エネルギー分布に応じたビットの配分が必要となるため、これが適切に行われないと上記のような異音が生じる。
【0009】
また、前述の反復法は、1フレーム(圧縮処理単位時間)内でビット割り当てを行うので、そのフレーム内では最適な量子化ビット数を算出することができるものの、前後のフレームの信号変化を的確にビット割り当てに反映させることができない。特に、固定ビットレートで圧縮を行う場合、隣接するフレームで信号エネルギー成分が異なれば、同一周波数で量子化誤差の揺らぎ(変動が)発生してしまう。
【0010】
本発明は、上記の事情に鑑みてなされたものであって、経時変化の小さい信号の入力時に入力された瞬間的に経時変化の大きい信号を符号化する際に、知覚可能な音質劣化を軽減するディジタル信号符号化装置を提供することを目的としている。
【0011】
【課題を解決するための手段】
本発明のディジタル信号符号化装置は、ディジタル信号を所定の複数の周波数帯域毎にスペクトルデータに変換し、各周波数帯域のスペクトルデータをそれぞれに応じて与えられたビット割当量で符号化するディジタル信号符号化装置において、上記の課題を解決するために、時間的に連続する各フレームのビット割当量を前記周波数帯域毎に算出するビット割当量算出手段と、このビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を所定値より小さくなるように修正することを特徴としている。
【0012】
上記の構成では、あるフレームのビット割当量が、ビット割当量算出手段によって算出されると、そのビット割当量の量子化誤差が、第1量子化誤差算出手段によって算出される。また、そのフレームに続くフレームのビット割当量の量子化誤差も同様にして算出される。これらの続く2つのフレームをそれぞれ前フレームと現フレームとして、ビット割当量修正手段によって、現フレームのビット割当量が前フレームのビット割当量を基に修正される。この結果、最終のビット割当量が得られる。そして、このビット割当量の量子化誤差が、第2量子化誤差算出手段によって算出される。
【0013】
ビット割当量修正手段による修正時には、現フレームのビット割当量の量子化誤差と、第2量子化誤差算出手段で算出された前フレームとのビット割当量の量子化誤差との差分が所定値より小さくなるように修正される。これにより、経時変化の小さい信号の入力時に入力された瞬間的に経時変化の大きい信号を符号化するような場合でも、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制される。
【0014】
上記のディジタル信号符号化装置は、前記スペクトルデータのパワー、エネルギーまたはスケールファクタの最大値を抽出する最大値抽出手段を備え、前記ビット割当量修正手段が、抽出された前記最大値が属する周波数帯域で前記差分を修正することが好ましい。このような構成では、スペクトルデータの上記の最大値が、最大値抽出手段によって抽出されると、その最大値でビット割当量修正手段による上記のビット割当量の修正が行われる。これにより、ピーク周波数の量子化誤差の変動が抑制される。
【0015】
ここで、スペクトルデータのパワー、エネルギーまたはスケールファクタの最大値が属する周波数帯域の周波数をピーク周波数と称する。このピーク周波数は、最小可聴限以上の信号レベルではマスキングされずに可聴周波数となるので、量子化誤差の揺らぎ(変動)が発生すると、最も異音として知覚されやすい周波数である。それゆえ、上記のようにピーク周波数の量子化誤差の変動を抑制することによって、マスキングしきい値対雑音非を用いたビット割当法、信号対雑音比を用いたビット割当法およびマスキングしきい値対雑音比と信号対雑音比とを併用するビット割当法のいずれにも、従来のビット割当法を用いた場合と比較して、同一周波数の量子化誤差の変動が抑制される。
【0016】
本発明の他のディジタル信号符号化装置は、ディジタル信号を所定の複数の周波数帯域毎にスペクトルデータに変換し、各周波数帯域スペクトルの大きさから、想定した各ビット数に対して各周波数帯域のマスキングしきい値対雑音比を求め、前記ビット数毎に前記マスキングしきい値対雑音比が最小となる周波数帯域から順に与えられたビット割当量で前記スペクトルデータを符号化するディジタル信号符号化装置において、上記の課題を解決するために、時間的に連続する各フレームのビット割当量を前記周波数帯域毎に算出するビット割当量算出手段と、このビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、前記量子化誤差を非マスキング周波数帯域について抽出する非マスキング周波数帯域抽出手段と、前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を前記非マスキング周波数帯域の量子化誤差について所定値より小さくなるように修正することを特徴としている。
【0017】
上記の構成では、あるフレームのビット割当量がビット割当量算出手段によって算出されると、そのビット割当量の量子化誤差が第1量子化誤差算出手段によって算出される。すると、マスキング周波数帯域抽出手段によって、その量子化誤差が聴覚心理を用いて非マスキング周波数帯域について抽出される。また、そのフレームに続くフレームのビット割当量の非マスキング周波数帯域についての量子化誤差も同様にして算出される。これらの2つの続くフレームをそれぞれ前フレームと現フレームとして、ビット割当量修正手段によって、現フレームのビット割当量が前フレームのビット割当量を基に修正される。この結果、最終のビット割当量が得られる。そして、このビット割当量の量子化誤差が第2量子化誤差算出手段によって算出される。
【0018】
ビット割当量修正手段による修正時には、現フレームのビット割当量の非マスキング周波数帯域についての量子化誤差と、第2量子化誤差算出手段で算出された前フレームのビット割当量の非マスキング周波数帯域についての量子化誤差との差分が所定値より小さくなるように修正される。これにより、経時変化の小さい信号の入力時に入力された瞬間的に経時変化の大きい信号を符号化するような場合でも、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制される。
【0019】
本発明のディジタル信号記録装置は、入力ディジタル信号を所定の符号化処理によって符号化して記録媒体に記録するディジタル信号記録装置であって、上記符号化処理を行うために、上記のいずれかのディジタル信号符号化装置を含んでいることを特徴としている。この構成では、上記の各ディジタル信号符号化装置によって、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制されることから、経時変化の小さい信号の記録時に経時変化の大きい信号が入力されても、量子化誤差に起因する上記のような音質の劣化の少ない信号を記録することができる。
【0020】
【発明の実施の形態】
本発明の実施の一形態について図1ないし図11に基づいて説明すれば、以下の通りである。
【0021】
まず、本実施の形態に係るミニディスク装置について説明する。
【0022】
図2に示すように、ディジタル信号記録装置としての本ミニディスク装置において、入力端子1から入力されたディジタル信号としてのディジタルオーディオ信号が、例えば、光信号としてシリアル入力される。この光信号は、光電素子2によって電気信号に変換された後、ディジタルPLL回路(Phase-Locked-Loop)3に入力される。
【0023】
ディジタルPLL回路3は、入力されたディジタルオーディオ信号からクロックの抽出を行うとともに、サンプリング周波数および量子化ビット数に対応したマルチビットデータを再現する。このマルチビットデータは、信号源毎に対応したサンプリングレート(コンパクトディスクでは44.1kHz、ディジタルオーディオテープレコーダでは48kHz、衛星放送(Aモード)では32kHz)で標本化されたディジタルデータである。そこで、ディジタルPLL回路3から出力されたマルチビットデータは、周波数変換回路4によって、そのサンプリングレートをミニディスクの規格に対応した44.1kHzに変換する。
【0024】
音声圧縮回路5は、前述のATRAC方式によって入力されたディジタルオーディオデータの圧縮符号化を行う。符号化されたディジタルオーディオデータは、ショックプルーフメモリコントローラ6を介して信号処理回路7に送出される。ショックプルーフメモリコントローラ6によって制御されるショックプルーフメモリ8は、音声圧縮回路5から出力されるディジタルオーディオデータの転送速度と、信号処理回路7に入力されるディジタルオーディオデータの転送速度との差を吸収するとともに、再生時における振動等の外乱による再生信号の中断を補間し、ディジタルオーディオデータを保護するために設けられている。
【0025】
信号処理回路7は、エンコーダおよびデコーダとしての機能を備えている。エンコーダとしての機能は、入力されたディジタルオーディオデータをシリアルの磁界変調信号にエンコードしてヘッド駆動回路9に与える。デコーダとしての機能は、後述するRFアンプ13からのシリアル信号をディジタルオーディオデータにデコードしてショックプルーフメモリコントローラ6に与える
ヘッド駆動回路9は、記録時に、記録ヘッド10をミニディスク11上の所定の記録位置に移動させるとともに、上記の磁界変調信号に対応した磁界を発生させる。この状態で、ミニディスク11上の所定の記録位置には、光ピックアップ12からレーザ光が照射されている。これにより、上記の磁界に対応した磁化パターンがミニディスク11上に形成される。
【0026】
光ピックアップ12は、ミニディスク11から上記の磁化パターンに対応したシリアル信号を読み取る。このシリアル信号は、高周波アンプ(以降、RFアンプと称する)13で増幅された後、信号処理回路7によってディジタルオーディオデータにデコードされる。このディジタルオーディオデータは、ショックプルーフメモリコントローラ6およびショックプルーフメモリ8によって外乱による影響が除去された後、音声伸長回路14に送出される。
【0027】
音声伸長回路14は、ATRAC方式による圧縮符号化の逆変換処理(伸長復号化)を行い、フルビットのディジタルオーディオデータを復調する。復調されたディジタルオーディオデータは、ディジタル/アナログ変換回路(以降、A/D変換回路と称する)15によってアナログオーディオ信号に変換され、出力端子16から外部へ出力される。
【0028】
RFアンプ13で増幅されたシリアル信号は、サーボ回路17にも入力される。サーボ回路17は、再生されたシリアル信号に応じてドライバ回路18に制御信号を送出し、そのドライバ回路18を介してスピンドルモータ19の回転速度をフィードバック制御する。このようなフィードバック制御により、ミニディスク11を線速度一定で回転させることができる。
【0029】
また、サーボ回路17は、ドライバ回路18を介して送りモータ20の回転速度もフィードバック制御する。このようなフィードバック制御により、ミニディスク11の半径方向に対する光ピックアップ12の変移制御、すなわちトラッキング制御を行うことができる。さらに、サーボ回路17は、ドライバ回路18を介して光ピックアップ12のフォーカシング制御も行う。
【0030】
上記の信号処理回路7、光ピックアップ12、RFアンプ14、サーボ回路17、ドライバ回路18等には、図示しない電源回路から電力が供給されるが、このような電力供給動作や後述する信号処理動作は、全てシステムコントロールマイクロコンピュータ21によって集中管理されている。このシステムコントロールマイクロコンピュータ21には、曲名入力、選曲操作、音質調整動作等を行うための入力装置22が接続されている。
【0031】
続いて、本実施の形態のディジタル信号符号化装置としての前述の音声圧縮回路5におけるディジタルデータ符号化処理について説明する。その前に、まず、ミニディスク11等で利用する前述のATRACによる符号化・復号化処理について説明する。
【0032】
図3に示すように、音声圧縮回路5は、スペクトル変換部51およびビット割当処理部52を有している。
【0033】
スペクトル変換部51は、符号化時、44.1kHzのサンプリング周波数でサンプリングされたオーディオ信号(マルチビットデータ)を、帯域分割フィルタであるQMF(Quadrature Mirror Filter)によって複数の周波数帯域(サブバンドフレーム)に分割する。また、スペクトル変換部51は、分割されたサブバンドフレーム単位で前述のMDCT処理を行い、各帯域の周波数成分のMDCT係数(スペクトルデータ)を生成する。このときのMDCT処理は、次式(1)で表される。
【0034】
Xm(k)=Σxm(i)h(i)cos(π/M(k+1/2)(i+M/2+1/2) …(1)
式(1)において、k=0,1,…,M−1、
m:ブロック番号、
xm(i):入力信号、
h(i):順変換用窓関数、
Xm(k):変換データ
である。
【0035】
ビット割当処理部52は、上記のMDCT係数を、i個の各周波数帯域のスペクトルパワーSi(i=1,2,…,I;例えばI=25)に変換し、各スペクトルパワーに対して後述のようにしてビット割当処理を行う。このスペクトルパワーSiは、臨界帯域(単位Bark)等が用いられる。臨界帯域は、周波数選択性、マスキングしきい値等の特定の音響心理学的規則性が有効な広帯域オーディオスペクトルの特性的部分のことである。
【0036】
以下に、上記のビット割当処理部52について詳細に説明する。
【0037】
ビット割当処理部52は、図1に示すように、パワー算出部52a、SNR算出部52b、1次量子化ビット数算出部52c、量子化ノイズ算出部52d、2次量子化ビット数算出部52eおよび量子化ノイズ保存部52fを備えている。
【0038】
パワー算出部52aは、帯域毎に設けられており、前述のMDCT処理によって得られたMDCT係数を臨界帯域等の各周波数帯域に分割し、各周波数帯域に属するMDCT係数の2乗和から、前記のスペクトルパワーSiをそれぞれの帯域について算出する。ここで、パワーとは、単位時間当たりのエネルギーのことをいう。
【0039】
SNR算出部52bは、スペクトルパワーSiとこのスペクトルパワーSiをnビットで量子化したときの量子化雑音パワーNi(n)とから、信号対雑音比SNRi(n)=Si/Ni(n)を算出する。このSNRi(n)は、統計的には、信号の特性に応じた定数となるので、統計処理によって予め求められていてもよい。
【0040】
ビット割当量算出手段としての1次量子化ビット数算出部52cは、所望のビットレートと上記のSNRi(n)とに基づいて前述の反復法を用いて量子化ビット数を算出する。ここでは、前述の反復法におけるマスキングしきい値Mを信号Sに置き換えて量子化ビット数を算出する。
【0041】
第1量子化誤差算出手段としての量子化ノイズ算出部52dは、現フレームにおいて、前記の処理で求めたnより量子化雑音パワーNi(n)を確定する。
【0042】
ビット割当量修正手段としての2次量子化ビット数算出部52eは、量子化ノイズ保存部52fに保存された前フレームの量子化雑音パワーNi(n)と、量子化ノイズ算出部52dで算出された現フレームの量子化雑音パワーNi(n)との差分の絶対値を求め、その絶対値が所定値より小さくなるように、周波数帯域の個数iを修正し、その個数iに基づいて、1次量子化ビット数算出部52cで算出された量子化ビット数を修正する。
【0043】
第2量子化誤差算出手段としての量子化ノイズ保存部52fは、2次量子化ビット数算出部52で算出された各周波数帯域の最終量子化ビット数nから前フレームの量子化雑音パワーNi(n)を算出し、保存する。この量子化ノイズ保存部52fは、保存した前フレームの量子化雑音パワーNi(n)を2次量子化ビット数算出部52eでの上記の差分を求めるために、2次量子化ビット数算出部52eに与える。
【0044】
上記のように構成されるビット割当処理部52においては、次のようにして割当処理が行われる。
【0045】
まず、図4に示すように、時間t1、すなわち、初期フレームの場合、2次量子化ビット数算出部52eでのビット数算出処理を行わずに、1次量子化ビット数算出部52cのnが最終量子化ビット数となる。次に、量子化ノイズ保存部52fは、時間t1のフレームを前フレームとして、各周波数帯域の最終量子化ビット数nから時間t1のフレームの量子化雑音パワーNit1(n)を算出して保存する。
【0046】
時間t2、すなわち時間t1の次のフレーム処理では、パワー算出部52a、SNR算出部52b、1次量子化ビット数算出部52cおよび量子化ノイズ算出部52dまで、初期フレームと同様の処理が行われ、量子化雑音パワーNit2'(n)が算出される。2次量子化ビット数算出部52eでは、まず、時間t1の量子化雑音パワーNit1(n)と時間t2の量子化雑音パワーNit2'(n)との差分が求められる。図4において、時間t1の全帯域のパワー(=Σsit1)と時間t2の全帯域のパワー(=Σsit2')との関係は、Σsit1<Σsit2'である。従って、固定ビットレートの場合には、おおむね、各周波数帯域でNit1(n)<Nit2'(n)の関係が成立している。
【0047】
次に、2次量子化ビット数算出部52eでは、例えば、Siの周波数帯域とパワーとを参照して、|Nit2'(n)−Nit1(n)|で表される差分を、|Nit2'(n)−Nit1(n)|<12dB(所定値)となるように、0〜25のiの値について修正する。図5に示す例では、時間t2にフレームについて、4つのサブバンドフレームSB1〜SB4に対し、低域のビット割当量が増加修正され、高域のビット割当量が削減修正されていることを示す。この補正においては、補正対象となる周波数帯域のビット割当量を聴覚心理特性や信号のパワーに応じて重み付けして修正するのがより好ましい。
【0048】
以上のように、本ビット割当処理部52は、1次量子化ビット数算出部52cで算出したビット割当量(量子化ビット数)を2次量子化ビット数算出部52eで修正する際に、量子化ノイズ保存部52fで算出して保存した前フレームの量子化雑音パワー(量子化誤差)と、量子化ノイズ算出部52dで算出した現フレームの量子化雑音パワー(量子化誤差)との差分が所定値より小さくなるように修正を行う。これにより、経時変化の小さい信号の入力時に、瞬間的に経時変化の大きい信号が入力されるような場合でも、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制される。
【0049】
続いて、他のビット割当処理部52について説明する。
【0050】
本ビット割当処理部52は、図6に示すように、図1に示すビット割当処理部52におけるパワー算出部52a、量子化ノイズ算出部52d、2次量子化ビット数算出部52eおよび量子化ノイズ保存部52fを備えるとともに、マスキング算出部52g、最小可聴限合成部52h、SMR算出部52i、MNR算出部52j、1次量子化ビット数算出部52kおよび非マスキング領域抽出部52mを備えている。
【0051】
マスキング算出部52gは、上記のスペクトルパワーSiより、公知の手段によってマスキングしきい値を算出する。例えば、MPEG1の聴覚心理モデル1を用いれば以下のような式になる。
【0052】
Vf=17×(dz+1)−(0.4×X〔z(i)〕+6) dB(-3≦dz<-1)Bark
Vf=(0.4×X〔z(i)〕+6) dB(-1≦dz<0)Bark
Vf=−17×dz dB(0≦dz<1)Bark
Vf=−(dz−1)×(17−0.15×X〔z(i)〕)−17 dB(1≦dz<8)Bark
Vf=−∞ dB(-3>dz,8<1dz)Bark
ここで、dz=z[j]−z[i]、
X[z(i)]=10log10Si
であり、Barkは臨界帯域の単位を表す。
【0053】
上記の各式のVfをi(臨界帯域のインデックス)毎に算出し、重複する周波数については最大のVfを選択することによってマスキングしきい値が求められる。マスキングしきい値を算出するための方法としては、その他、いくつかの公知の方法があるので、上記の方法には限定されない。
【0054】
最小可聴限合成部52hは、次式等で表される最小可聴限特性等と上記のマスキング算出部52gで求めたマスキングしきい値とを合成して、図7に示すような最終のマスキングしきい値Miを各周波数帯域について決定する。最小可聴限特性は、予めテーブルROMに格納されていてもよい。
【0055】
lt(f)=-0.6×3.64×(f/1000)-0.8+6.5×exp(-0.6(f/1000-3.3)2-10-3×(f/1000)4 …(2)
SMR算出部52iは、各周波数のインデックスを上記のiとすると、パワー算出部52aで求めたスペクトルパワーSiと、最小可聴限合成部52hで求めた各周波数帯域のマスキングしきい値Miとの比SMRi=Si/Miを全ての周波数帯域にわたって計算する。なお、上記のfは周波数(Hz)である。
【0056】
MNR算出部52jは、各周波数帯域の上記のスペクトルパワーSiをnビットで量子化したときの、このスペクトルパワーSiと量子化雑音パワーNi(n)との比SNRi(n)=Si/Ni(n)を算出し、この比SNRi(n)と前記のSMRiとの比から、マスキングしきい値と量子化雑音パワーとの比MNRi(n)=SNRi(n)/SMRiが求められる。上記の比SNR(n)は、統計的には、信号の特性に応じた特性となるので、統計処理によって求めておいてもよい。
【0057】
1次量子化ビット数算出部52kは、MNR算出部52jで求められたマスキングしきい値と量子化雑音パワーとの比MNRi(n)に基づいて、各周波数帯域の量子化ビット数を次のようにして割り当てる。ビット数nを0から大きくしていき、その都度、各周波数帯域のマスキングしきい値と量子化雑音パワーとの比MNRi(n)を計算し、その比MNRi(n)が最小となる周波数帯域から順にビットを割り当てていき、前記の量子化ビット数nを更新する毎に、同様に比MNRi(n)が最小となる周波数帯域にビットの割り当てを行い、ビットレートに応じた所定の割当可能ビット数となるまで割り当てを行う。すなわち、前記のスペクトルパワーSiが、しきい値Miを超えた部分が最も大きい周波数帯域から順次ビット割り当てが行われることになる。
【0058】
非マスキング周波数帯域抽出手段としての非マスキング領域抽出部52mは、前述の比SMRiに基づいて非マスキング領域(非マスキング周波数帯域)を聴覚心理を用いて抽出する。具体的には、前述の比SMRiが1を超える周波数帯域が非マスキング周波数帯域であり、比SMRiが1以下である周波数帯域がマスキング周波数帯域であることから、各周波数帯域についてSMRi>1を判定し、非マスキング周波数帯域を求める。
【0059】
ここでの、2次量子化ビット数算出部52eは、非マスキング周波数帯域のみに対し、|Nit2'(n)−Nit1(n)|>12dBとなるnについて|Nit2'(n)−Nit1(n)|<12dBとなるように、i=0,…,25まで修正を施す。
【0060】
修正によって削除または増加する量子化ビット数は、図8に示すマスキング周波数帯域SiM(斜線部)内で調整される。
【0061】
このように、本ビット割当処理部52は、図1のビット割当処理部52と同様に、1次量子化ビット数算出部52kで算出したビット割当量(量子化ビット数)を2次量子化ビット数算出部52eで修正するが、非マスキング領域抽出部52mで抽出した非マスキング周波数帯域に対してのみ修正を行う。これにより、音楽や音声のように非マスキング周波数帯域の成分を多く含むために聴覚心理特性を利用することが好ましいソースに対して、量子化誤差の変動によって発生する異音として知覚可能な音質の劣化を低減することができる。
【0062】
引き続き、さらに他のビット割当処理部52について説明する。
【0063】
本ビット割当処理部52は、図9に示すように、図1に示すビット割当処理部52と同様、パワー算出部52a、量子化ノイズ算出部52d、1次量子化ビット数算出部52c、量子化ノイズ算出部52d、2次量子化ビット数算出部52eおよび量子化ノイズ保存部52fを備えており、さらにパワー最大帯域抽出部52nを備えている。
【0064】
最大値抽出手段としてのパワー最大帯域抽出部52nは、パワー算出部52aで算出された前述のスペクトルパワーSiの中からスペクトルパワー最大値Max(Si)を抽出する。具体的には、パワー最大帯域抽出部52nは、スペクトルパワーSi(i=1,2,…,I)の中から最大となるSiのインデックスiを抽出することでスペクトルパワー最大値Max(Si)を抽出する。
【0065】
なお、パワー最大帯域抽出部52nは、後述するエネルギーの最大値を抽出する場合、エネルギーEi(i=1,2,…,I)の中から最大となるエネルギーEiのインデックスiを抽出する。また、パワー最大帯域抽出部52nは、後述するスケールファクタの最大値を抽出する場合、スケールファクタSFi(i=1,2,…,I)の中から最大となるスケールファクタSFiのインデックスiを抽出する。このスケールファクタは、スペクトルデータのスケール(大きさ)の因子を表しており、一般的には、量子化される周波数単位の中で、最大スペクトルの絶対値をコード化することによって算出される。
【0066】
ここでの2次量子化ビット数算出部52eは、上記のスペクトルパワー最大値Max(Si)に対してのみ、|Nit2'(n)−Nit1(n)|で表される差分が|Nit2'(n)−Nit1(n)|>12dBであれば、その差分を|Nit2'(n)−Nit1(n)|<12dBとなるように修正を施す。また、上記のスペクトルデータのエネルギーまたはスケールファクタの最大値がそれぞれ抽出される場合は、それらに対してのみ上記のようにして量子化ビット数を修正する。
【0067】
この修正によって減少または増加する量子化ビット数は、図10に示すパワー最大帯域SiE(斜線部)以外の帯域の量子化ビット数を用いて調整される。
【0068】
このように、本ビット割当処理部52は、図1のビット割当処理部52と同様に、1次量子化ビット数算出部52cで算出したビット割当量(量子化ビット数)を2次量子化ビット数算出部52eで修正するが、パワー最大帯域抽出部52nで抽出したスペクトルパワー最大値(ピーク周波数)に対してのみ修正を行う。これにより、ピーク周波数の量子化誤差の変動が抑制される。上記のピーク周波数は、スペクトルデータのパワー、エネルギーまたは指標(スケールファクタ)のいずれかの最大値が属する周波数帯域の周波数を総称したものである。
【0069】
ピーク周波数は、マスキングの影響を受けないため(最小可聴限の影響を受けることはある)、聴覚心理上重要な周波数である。つまり、ピーク周波数は、最小可聴限以上の信号レベルではマスキングされずに可聴周波数となるので、量子化誤差の揺らぎ(変動)が発生すると、最も異音として知覚されやすい周波数である。
【0070】
それゆえ、ピーク周波数の量子化誤差の変動を抑制することによって、マスキングしきい値対雑音非を用いたビット割当法、信号対雑音比を用いたビット割当法およびマスキングしきい値対雑音比と信号対雑音比とを併用するビット割当法のいずれにも、従来のビット割当法を用いた場合と比較して、同一周波数の量子化誤差の変動を抑制することができる。
【0071】
また、本実施の形態のミニディスク装置が、図1、図6および図9のビット割当処理部52を含む音声圧縮回路5を含むことによって、上記のように、量子化誤差の変動が抑制されたディジタルオーディオデータの圧縮符号化を行うことができる。それゆえ、経時変化の小さい信号の記録時に経時変化の大きい信号が入力されても、量子化誤差に起因する音質の劣化の少ない信号を記録することができる。
【0072】
なお、本発明のディジタル信号符号化装置は、実施の形態においてミニディスク装置に適用されているが、同様な符号化を必要とする他の装置にも適用できることは勿論である。
【0073】
【発明の効果】
以上のように、本発明のディジタル信号符号化装置は、時間的に連続する各フレームのビット割当量を周波数帯域毎に算出するビット割当量算出手段と、このビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を所定値より小さくなるように修正する構成である。
【0074】
これにより、ビット割当量修正手段による修正時には、現フレームのビット割当量の量子化誤差と、第2量子化誤差算出手段で算出された前フレームとのビット割当量の量子化誤差との差分が所定値より小さくなるように修正される。それゆえ、経時変化の小さい信号の入力時に、瞬間的に経時変化の大きい信号が入力されるような場合でも、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制される。したがって、その量子化誤差の変動によって発生する異音として知覚可能な音質の劣化を低減することができるという効果を奏する。
【0075】
上記のディジタル信号符号化装置は、前記スペクトルデータのパワー、エネルギーまたはスケールファクタの最大値を抽出する最大値抽出手段を備え、前記ビット割当量修正手段が、抽出された前記最大値が属する周波数帯域で前記差分を修正することによって、スペクトルデータのパワー、エネルギーまたはスケールファクタの最大値が属する周波数帯域の周波数であるピーク周波数の量子化誤差の変動が抑制される。これにより、マスキングしきい値対雑音非を用いたビット割当法、信号対雑音比を用いたビット割当法およびマスキングしきい値対雑音比と信号対雑音比とを併用するビット割当法のいずれにも、従来のビット割当法を用いた場合と比較して、同一周波数の量子化誤差の変動が抑制される。したがって、経時変化に起因する知覚可能な音質劣化を低減することができるという効果を奏する。
【0076】
本発明の他のディジタル信号符号化装置は、時間的に連続する各フレームのビット割当量を前記周波数帯域毎に算出するビット割当量算出手段と、このビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、前記量子化誤差を非マスキング周波数帯域について抽出する非マスキング周波数帯域抽出手段と、前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を前記非マスキング周波数帯域の量子化誤差について所定値より小さくなるように修正する構成である。
【0077】
これにより、ビット割当量修正手段による修正時には、現フレームのビット割当量の非マスキング周波数帯域についての量子化誤差と、第2量子化誤差算出手段で算出された前フレームのビット割当量の非マスキング周波数帯域についての量子化誤差との差分が所定値より小さくなるように修正される。それゆえ、経時変化の小さい信号の入力時に、瞬間的に経時変化の大きい信号が入力されるような場合でも、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制される。したがって、音楽や音声のように聴覚心理特性を利用することが好ましいソースに対して、量子化誤差の変動によって発生する異音として知覚可能な音質の劣化を低減することができるという効果を奏する。
【0078】
本発明のディジタル信号記録装置は、入力ディジタル信号を所定の符号化処理によって符号化して記録媒体に記録するディジタル信号記録装置であって、上記符号化処理を行うために、上記のいずれかのディジタル信号符号化装置を含んでいる構成である。
【0079】
上記の各ディジタル信号符号化装置によって、隣接するフレーム間での同一周波数の量子化誤差の変動が抑制されることから、経時変化の小さい信号の記録時に経時変化の大きい信号が入力されても、量子化誤差に起因する上記のような音質の劣化の少ない信号を記録することができる。したがって、高音質での記録が可能なディジタル信号記録装置を提供することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係るミニディスク装置における音声圧縮回路のビット割当処理部の構成を示すブロック図である。
【図2】上記ミニディスク装置の構成を示すブロック図であなる。
【図3】上記音声圧縮回路の構成を示すブロック図である。
【図4】上記ビット割当処理部におけるパワー算出部で求められた各周波数帯域のスペクトルパワーを示す図面である。
【図5】上記ビット割当処理部による各周波数帯域へのビット割り当てを示す図面である。
【図6】他のビット割当処理部の構成を示すブロック図である。
【図7】図6のビット割当処理部におけるパワー算出部で求められた各周波数帯域のスペクトルパワーを示す図面である。
【図8】図6のビット割当処理部による各周波数帯域へのビット割り当てを示す図面である。
【図9】さらに他のビット割当処理部の構成を示すブロック図である。
【図10】図9のビット割当処理部におけるパワー算出部で求められた各周波数帯域のスペクトルパワーを示す図面である。
【図11】図9のビット割当処理部による各周波数帯域へのビット割り当てを示す図面である。
【符号の説明】
5 音声圧縮回路(ディジタル信号符号化装置)
51 スペクトル変換部
52 ビット割当処理部
52a パワー算出部
52c 1次量子化ビット数算出部(ビット割当量算出手段)
52d 量子化ノイズ算出部(第1量子化誤差算出手段)
52e 2次量子化ビット数算出部(ビット割当量修正手段)
52f 量子化ノイズ保存部(第2量子化誤差算出手段)
52m 非マスキング領域抽出部(非マスキング周波数帯域抽出手段)
52n パワー最大帯域抽出部(最大値抽出手段)
Claims (4)
- ディジタル信号を所定の複数の周波数帯域毎にスペクトルデータに変換し、各周波数帯域のスペクトルデータをそれぞれに応じて与えられたビット割当量で符号化するディジタル信号符号化装置において、
時間的に連続する各フレームのビット割当量を前記周波数帯域毎に算出するビット割当量算出手段と、
前記ビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、
前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、
前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、
上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を所定値より小さくなるように修正することを特徴とするディジタル信号符号化装置。 - 前記スペクトルデータのパワー、エネルギーまたはスケールファクタの最大値を抽出する最大値抽出手段を備え、
前記ビット割当量修正手段が、抽出された前記最大値が属する周波数帯域で前記差分を修正することを特徴とする請求項1に記載のディジタル信号符号化装置。 - ディジタル信号を所定の複数の周波数帯域毎にスペクトルデータに変換し、各周波数帯域スペクトルの大きさから、想定した各ビット数に対して各周波数帯域のマスキングしきい値対雑音比を求め、前記ビット数毎に前記マスキングしきい値対雑音比が最小となる周波数帯域から順に与えられたビット割当量で前記スペクトルデータを符号化するディジタル信号符号化装置において、
時間的に連続する各フレームのビット割当量を前記周波数帯域毎に算出するビット割当量算出手段と、
前記ビット割当量算出手段によって算出されたビット割当量の量子化誤差を算出する第1量子化誤差算出手段と、
前記量子化誤差を非マスキング周波数帯域について抽出する非マスキング周波数帯域抽出手段と、
前記ビット割当量算出手段によって算出された、現フレームの1つ前の前フレームのビット割当量を基に、現フレームのビット割当量を修正するビット割当量修正手段と、
前記ビット割当量修正手段によって得られた最終のビット割当量の量子化誤差を算出する第2量子化誤差算出手段とを備え、
上記ビット割当量修正手段が、前記第1量子化誤差算出手段で算出された現フレームのビット割当量と前記第2量子化誤差算出手段で算出された前フレームのビット割当量との量子化誤差の差分を前記非マスキング周波数帯域の量子化誤差について所定値より小さくなるように修正することを特徴とするディジタル信号符号化装置。 - 入力ディジタル信号を所定の符号化処理によって符号化して記録媒体に記録するディジタル信号記録装置であって、
上記符号化処理を行うために、請求項1ないし3のいずれか1項に記載のディジタル信号符号化装置を含んでいることを特徴とするディジタル信号記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001376308A JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001376308A JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003177797A JP2003177797A (ja) | 2003-06-27 |
JP3942882B2 true JP3942882B2 (ja) | 2007-07-11 |
Family
ID=19184530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001376308A Expired - Fee Related JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3942882B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7406412B2 (en) * | 2004-04-20 | 2008-07-29 | Dolby Laboratories Licensing Corporation | Reduced computational complexity of bit allocation for perceptual coding |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
EP2161720A4 (en) * | 2007-06-20 | 2012-06-13 | Fujitsu Ltd | DECODER, DECODING METHOD AND ASSOCIATED PROGRAM |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
MX357353B (es) * | 2013-12-02 | 2018-07-05 | Huawei Tech Co Ltd | Metodo y aparato de codificacion. |
-
2001
- 2001-12-10 JP JP2001376308A patent/JP3942882B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003177797A (ja) | 2003-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3328532B2 (ja) | デジタルデータの符号化方法 | |
JP3173218B2 (ja) | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 | |
US7337027B2 (en) | Audio signal reproducing apparatus | |
JP3123290B2 (ja) | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 | |
US6850578B1 (en) | Digital signal processing apparatus and digital processing method | |
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
US6975732B2 (en) | Audio signal reproducing apparatus | |
JPH06268608A (ja) | 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データの圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体 | |
US6647063B1 (en) | Information encoding method and apparatus, information decoding method and apparatus and recording medium | |
JP3942882B2 (ja) | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 | |
US5754427A (en) | Data recording method | |
JP3776004B2 (ja) | ディジタルデータの符号化方法 | |
JP4271588B2 (ja) | ディジタルデータの符号化方法および符号化装置 | |
JP4293833B2 (ja) | ディジタル信号記録再生装置及びその制御プログラム | |
JP4822697B2 (ja) | ディジタル信号符号化装置およびディジタル信号記録装置 | |
JPH11330974A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP4732478B2 (ja) | ディジタル信号再生装置、及びその制御プログラム | |
JPH08125543A (ja) | ディジタル信号圧縮方法及び装置、並びに記録媒体 | |
JP3334375B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JPH11330973A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP3200886B2 (ja) | オーディオ信号処理方法 | |
JP3408140B2 (ja) | 情報符号化方法 | |
JPH08307277A (ja) | 可変レート音声符号化方法及び装置 | |
JP3552239B2 (ja) | 圧縮データ記録装置及び方法、並びに圧縮データ再生方法 | |
JP2002091500A (ja) | デジタルデータ符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060613 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070404 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100413 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110413 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130413 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130413 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |