JP3082625B2 - 音声信号処理回路 - Google Patents
音声信号処理回路Info
- Publication number
- JP3082625B2 JP3082625B2 JP07201593A JP20159395A JP3082625B2 JP 3082625 B2 JP3082625 B2 JP 3082625B2 JP 07201593 A JP07201593 A JP 07201593A JP 20159395 A JP20159395 A JP 20159395A JP 3082625 B2 JP3082625 B2 JP 3082625B2
- Authority
- JP
- Japan
- Prior art keywords
- mask
- power spectrum
- frequency
- sample
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】本発明は、音声信号処理装置に関
し、特に音声信号を周波数帯域毎に分割して符号化する
サブバンド符号化回路においてマスクレベルを算出する
音声信号処理回路に関する。
し、特に音声信号を周波数帯域毎に分割して符号化する
サブバンド符号化回路においてマスクレベルを算出する
音声信号処理回路に関する。
【0002】
【従来の技術】図6に、ISO/IEC11172−3
(以後、MPEG/Audioと表記する)で用いられ
ている従来の音声信号処理回路の全体の概略構成を示
す。以下、各部の説明をする。FFT回路62は入力音
声サンプル61が1024のサンプル入力されると、高
速フーリエ変換(Fast Fourler Transform)を施して5
12のパワースペクトルサンプルをサンプル出力する。
(以後、MPEG/Audioと表記する)で用いられ
ている従来の音声信号処理回路の全体の概略構成を示
す。以下、各部の説明をする。FFT回路62は入力音
声サンプル61が1024のサンプル入力されると、高
速フーリエ変換(Fast Fourler Transform)を施して5
12のパワースペクトルサンプルをサンプル出力する。
【0003】純音と雑音の分別を行なう分別回路63
は、入力されたパワースペクトルサンプルの中から、極
大となっているもの(隣接した周波数のパワースペクト
ルサンプルよりも大きくなっているパワースペクトルサ
ンプル)を純音成分として取り出し、また、そうでない
ものを雑音成分として取り出すことにより、入力された
スペクトルサンプルを純音成分と雑音成分とに分別す
る。
は、入力されたパワースペクトルサンプルの中から、極
大となっているもの(隣接した周波数のパワースペクト
ルサンプルよりも大きくなっているパワースペクトルサ
ンプル)を純音成分として取り出し、また、そうでない
ものを雑音成分として取り出すことにより、入力された
スペクトルサンプルを純音成分と雑音成分とに分別す
る。
【0004】サブサンプリング回路64は、人間の聴覚
特性が高い周波数ほど周波数分解能力が低いということ
を利用して、高域のスペトクルを決まった本数ずつまと
め、一本のスペクトルにまとめる部分である。まとめら
れるパワースペクトルの本数は、そのパワースペクトル
が純音成分かあるいは雑音成分かによって異なる。
特性が高い周波数ほど周波数分解能力が低いということ
を利用して、高域のスペトクルを決まった本数ずつまと
め、一本のスペクトルにまとめる部分である。まとめら
れるパワースペクトルの本数は、そのパワースペクトル
が純音成分かあるいは雑音成分かによって異なる。
【0005】マスク計算回路65は、サブサンプリング
された純音成分のパワースペクトルサンプルと雑音成分
のパワースペクトルサンプルから、マスクレベルを求め
る部分である。ここで、マスクレベルとは、それ以上小
さい音は人間の耳には聞こえないという音のレベルを示
しており、人間がそのときに聞いている音の周波数分布
により逐次変化する。
された純音成分のパワースペクトルサンプルと雑音成分
のパワースペクトルサンプルから、マスクレベルを求め
る部分である。ここで、マスクレベルとは、それ以上小
さい音は人間の耳には聞こえないという音のレベルを示
しており、人間がそのときに聞いている音の周波数分布
により逐次変化する。
【0006】従来におけるマスクレベルの計算について
図7を参照しながら説明する。人間の聴覚では、音が存
在した場合、つまりスペクトル71が存在した場合、そ
の近傍の周波数の音が聞こえにくくなる。つまり、スペ
クトルに隣接した周波数にマスク72ができる。従来に
おいては、このマスク72の形状(マスクの高さや直線
の傾きなど)は、スペクトルが純音成分かまたは雑音成
分かによって、またスペクトルの大きさによって変化す
る。
図7を参照しながら説明する。人間の聴覚では、音が存
在した場合、つまりスペクトル71が存在した場合、そ
の近傍の周波数の音が聞こえにくくなる。つまり、スペ
クトルに隣接した周波数にマスク72ができる。従来に
おいては、このマスク72の形状(マスクの高さや直線
の傾きなど)は、スペクトルが純音成分かまたは雑音成
分かによって、またスペクトルの大きさによって変化す
る。
【0007】このマスクをサブサンプリングされたパワ
ースペクトル1本1本について計算し、足し合わせる。
マスクの計算には、スペクトルがn本存在する場合、ス
ペクトル1本に対するマスクを求めるのに、nの1乗の
オーダーの計算が必要となる。そして、その計算を、n
本のパワースペクトルのそれぞれについて計算し、かつ
それらを足し合わせるためには、全体としてnの2乗の
オーダーの計算回数が必要となる。
ースペクトル1本1本について計算し、足し合わせる。
マスクの計算には、スペクトルがn本存在する場合、ス
ペクトル1本に対するマスクを求めるのに、nの1乗の
オーダーの計算が必要となる。そして、その計算を、n
本のパワースペクトルのそれぞれについて計算し、かつ
それらを足し合わせるためには、全体としてnの2乗の
オーダーの計算回数が必要となる。
【0008】実時間のMPEG/Audioエンコーダ
では、限られた時間内にこれらの処理を行う必要がある
ので、入力音声によってこのように処理量が大きく変化
してしまうことは非常に都合が悪い。
では、限られた時間内にこれらの処理を行う必要がある
ので、入力音声によってこのように処理量が大きく変化
してしまうことは非常に都合が悪い。
【0009】パワースペクトル数nは任意なので、十分
大きなnに耐え得るように、十分高速の演算装置を用い
なければならないが、演算量がnの2乗に比例して増え
るので、演算装置の規模が非常に大きくなってしまう。
また、nの値が予想以上に大きい入力音声に対しては処
理が間に合わずに破綻し雑音を発生させてしまう。
大きなnに耐え得るように、十分高速の演算装置を用い
なければならないが、演算量がnの2乗に比例して増え
るので、演算装置の規模が非常に大きくなってしまう。
また、nの値が予想以上に大きい入力音声に対しては処
理が間に合わずに破綻し雑音を発生させてしまう。
【0010】
【発明が解決しようとする課題】上述したように従来で
は、マスクの形状が、パワースペクトルが純音成分か雑
音成分か、また、パワースペクトルの大きさによって変
化するため、マスクレベルを求めるのに非常に多くの計
算量を必要とする問題点があった。このため、演算装置
の規模が非常に大きくなってしまう。さらに、入力音声
について、純音成分と雑音成分の分別を行なうことか
ら、演算処理量が入力される音声によって大きく変化
し、このため、入力音声に対しては処理が間に合わずに
破綻し雑音を発生させてしまうという問題点もあった。
は、マスクの形状が、パワースペクトルが純音成分か雑
音成分か、また、パワースペクトルの大きさによって変
化するため、マスクレベルを求めるのに非常に多くの計
算量を必要とする問題点があった。このため、演算装置
の規模が非常に大きくなってしまう。さらに、入力音声
について、純音成分と雑音成分の分別を行なうことか
ら、演算処理量が入力される音声によって大きく変化
し、このため、入力音声に対しては処理が間に合わずに
破綻し雑音を発生させてしまうという問題点もあった。
【0011】本発明は、上記従来の欠点を解決し、マス
クレベルの演算に必要な計算量を少なくすることができ
る音声信号処理回路を提供することを目的とする。ま
た、本発明の他の目的は、パワースペクトルサンプルの
本数が入力音声によって変化せず、このため、パワース
ペクトルサンプルの本数が決めれば、それに適した規模
の演算手段を備えればよく、処理量の増加を想定して大
規模な演算手段を備える必要をなくする音声信号処理回
路を提供することにある。
クレベルの演算に必要な計算量を少なくすることができ
る音声信号処理回路を提供することを目的とする。ま
た、本発明の他の目的は、パワースペクトルサンプルの
本数が入力音声によって変化せず、このため、パワース
ペクトルサンプルの本数が決めれば、それに適した規模
の演算手段を備えればよく、処理量の増加を想定して大
規模な演算手段を備える必要をなくする音声信号処理回
路を提供することにある。
【0012】
【課題を解決するための手段】上記目的を達成する本発
明は、予め量子化された第1所定数の入力音声サンプル
のマスクレベルを算出する音声信号処理回路において、
前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、前記第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング手段と、前記第2所定数のパワースペクトルサンプ
ル毎に一定の単位マスク関数を畳み込んだものをパワー
スペクトルサンプル毎のマスクとし、各々の前記パワー
スペクトルサンプルの前記マスクを足し合わせることに
より、前記第2の所定数からなるマスクレベルを算出す
るマスク計算手段とからなる構成としている。
明は、予め量子化された第1所定数の入力音声サンプル
のマスクレベルを算出する音声信号処理回路において、
前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、前記第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング手段と、前記第2所定数のパワースペクトルサンプ
ル毎に一定の単位マスク関数を畳み込んだものをパワー
スペクトルサンプル毎のマスクとし、各々の前記パワー
スペクトルサンプルの前記マスクを足し合わせることに
より、前記第2の所定数からなるマスクレベルを算出す
るマスク計算手段とからなる構成としている。
【0013】好ましい態様によれば、周波数f[0]から
f[n-1]のn個の前記パワースペクトルサンプルが存在
する場合、第i番目の前記パワースペクトルサンプルの
大きさをa[i]、周波数をf[i]、マスクの傾きをpとす
ると、周波数fの前記パワースペクトルサンプルに対す
る前記単位マスク関数は、 mi(f)=a[i]*10-p/10 f-fi で表される。
f[n-1]のn個の前記パワースペクトルサンプルが存在
する場合、第i番目の前記パワースペクトルサンプルの
大きさをa[i]、周波数をf[i]、マスクの傾きをpとす
ると、周波数fの前記パワースペクトルサンプルに対す
る前記単位マスク関数は、 mi(f)=a[i]*10-p/10 f-fi で表される。
【0014】さらに他の好ましい態様では、前記マスク
計算手段は、前記各パワースペクトルサンプルの右側の
マスクと、左側のマスクに分けてマスクレベルをそれぞ
れ算出する。また、前記マスク計算手段は、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、前記各パワースペクトルサンプルの右
側のマスクと、左側のマスクに分けると共に、前記各パ
ワースペクトルサンプルの右側のマスクについて、周波
数の低い前記パワースペクトルサンプルのマスクから順
にマスクレベルを算出し、前記各パワースペクトルサン
プルの左側のマスクについて、周波数の高い前記パワー
スペクトルサンプルのマスクから順にマスクレベルを算
出する。
計算手段は、前記各パワースペクトルサンプルの右側の
マスクと、左側のマスクに分けてマスクレベルをそれぞ
れ算出する。また、前記マスク計算手段は、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、前記各パワースペクトルサンプルの右
側のマスクと、左側のマスクに分けると共に、前記各パ
ワースペクトルサンプルの右側のマスクについて、周波
数の低い前記パワースペクトルサンプルのマスクから順
にマスクレベルを算出し、前記各パワースペクトルサン
プルの左側のマスクについて、周波数の高い前記パワー
スペクトルサンプルのマスクから順にマスクレベルを算
出する。
【0015】さらに、他の好ましい態様では、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、第i番目の前記パワースペクトルサン
プルの大きさをa[i]、周波数をf[i]、右側のマスクの
傾きを−q、左側のマスクの傾きをpとすると、周波数
f[i]の前記パワースペクトルサンプルの右側のマスク
は、mr[i]=a[i]+10-q/(f[i]-f[i1)*mr[i1]で
算出さされ、周波数f[i]の前記パワースペクトルサン
プルの左側のマスクは、ml[i]=10-p/(f[i+1]-f[i)
*(a[i+1]+ml[i+1])で算出される。
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、第i番目の前記パワースペクトルサン
プルの大きさをa[i]、周波数をf[i]、右側のマスクの
傾きを−q、左側のマスクの傾きをpとすると、周波数
f[i]の前記パワースペクトルサンプルの右側のマスク
は、mr[i]=a[i]+10-q/(f[i]-f[i1)*mr[i1]で
算出さされ、周波数f[i]の前記パワースペクトルサン
プルの左側のマスクは、ml[i]=10-p/(f[i+1]-f[i)
*(a[i+1]+ml[i+1])で算出される。
【0016】
【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。図1は、本発明の一実施例による音
声信号処理回路の構成を示すブロック図である。以下、
図1を参照して、各構成要素を説明する。本実施例の音
声信号処理回路は、FFT回路12、サブサンプリング
回路13、マスク計算回路14で構成される。
て詳細に説明する。図1は、本発明の一実施例による音
声信号処理回路の構成を示すブロック図である。以下、
図1を参照して、各構成要素を説明する。本実施例の音
声信号処理回路は、FFT回路12、サブサンプリング
回路13、マスク計算回路14で構成される。
【0017】FFT回路12は、1024の入力音声サ
ンプル11が入力されると、高速フーリエ変換を施し5
12のパワースペクトルサンプルをサンプル出力する。
入力音声サンプル11及びFFT回路12は、図6の従
来の回路と同じである。本発明では、従来のような純音
と雑音との分別は行わない。これにより、従来例の問題
点であった、入力される音声によって処理量が変化する
といった問題がなくなる。
ンプル11が入力されると、高速フーリエ変換を施し5
12のパワースペクトルサンプルをサンプル出力する。
入力音声サンプル11及びFFT回路12は、図6の従
来の回路と同じである。本発明では、従来のような純音
と雑音との分別は行わない。これにより、従来例の問題
点であった、入力される音声によって処理量が変化する
といった問題がなくなる。
【0018】サブサンプリング回路13は、FFT回路
12により計算された512サンプルのスペクトルサン
プルを高い周波数ほど周波数分解能力が低いという人間
の聴覚特性に従い、周波数の高域のスペクトルを決まっ
た本数ずつまとめ、一本のスペクトルにまとめる。
12により計算された512サンプルのスペクトルサン
プルを高い周波数ほど周波数分解能力が低いという人間
の聴覚特性に従い、周波数の高域のスペクトルを決まっ
た本数ずつまとめ、一本のスペクトルにまとめる。
【0019】マスク計算回路14は、サブサンプリング
回路13によりサブサンプルされたスペクトルサンプル
を用いて、それ以上小さい音は人間の耳には聞こえない
という音のレベルを示すマスク15を計算する。
回路13によりサブサンプルされたスペクトルサンプル
を用いて、それ以上小さい音は人間の耳には聞こえない
という音のレベルを示すマスク15を計算する。
【0020】このマスク15を計算するマスク計算回路
14の計算処理について、図2、図3、図4、図5を参
照して詳しく説明する。図2に、周波数f[i]に大きさ
がa[i]のパワースペクトル22が存在した場合のマス
ク21を示す。従来においては、マスクの形状は、パワ
ーススペクトルが純音成分であるか雑音成分であるかに
より、またはパワースペクトルの大きさにより形状を変
化させたが、本発明では、マスクの形状を全てのパワー
スペクトルについて同じ形状とする。
14の計算処理について、図2、図3、図4、図5を参
照して詳しく説明する。図2に、周波数f[i]に大きさ
がa[i]のパワースペクトル22が存在した場合のマス
ク21を示す。従来においては、マスクの形状は、パワ
ーススペクトルが純音成分であるか雑音成分であるかに
より、またはパワースペクトルの大きさにより形状を変
化させたが、本発明では、マスクの形状を全てのパワー
スペクトルについて同じ形状とする。
【0021】図2において、グラフの横軸が周波数軸
で、縦軸がマスクレベルである。グラフ中の縦軸の単位
はデシベルである。ここで、パワースペクトル22の値
A[i]は、以下の式で表される。
で、縦軸がマスクレベルである。グラフ中の縦軸の単位
はデシベルである。ここで、パワースペクトル22の値
A[i]は、以下の式で表される。
【0022】A[i]=10log10a[i]
【0023】このマスクの左側のマスク23の傾きを
p、右側のマスク24の傾きを−qとすると、マスクの
大きさm[i](f)は、以下のように求めることができ
る(デシベル表示ではなく実値による表現)。
p、右側のマスク24の傾きを−qとすると、マスクの
大きさm[i](f)は、以下のように求めることができ
る(デシベル表示ではなく実値による表現)。
【0024】 m[i](f)=a[i]*10-p/(f-f[i]) (f<f[i])
【0025】 m[i](f)=a[i] (f=f[i])
【0026】 m[i](f)=a[i]*10-q/(f-f[i]) (f>f[i])
【0027】このマスクm[i](f)を図3のように各
周波数の各パワースペクトルについて求めて足し合わせ
る(加算)ことにより、図3に示すようなマスクの加算
結果が得られる。
周波数の各パワースペクトルについて求めて足し合わせ
る(加算)ことにより、図3に示すようなマスクの加算
結果が得られる。
【0028】以下、マスク計算回路14によるマスクの
加算処理について図4と図5を用いて説明する。図3で
は、パワースペクトルがn個の周波数f[0]、f
[1]、・・・f[n]上に存在する。
加算処理について図4と図5を用いて説明する。図3で
は、パワースペクトルがn個の周波数f[0]、f
[1]、・・・f[n]上に存在する。
【0029】加算処理においては、図4、図5に示すよ
うに、マスクを図2の右側の部分(f≧f[i])と左側
の部分(f<f[i])にそれぞれ分けることによって加
算を行なう。
うに、マスクを図2の右側の部分(f≧f[i])と左側
の部分(f<f[i])にそれぞれ分けることによって加
算を行なう。
【0030】まず、マスクの右側の加算について説明す
る。周波数f[i]における加算されたマスクをmr[i]と
すると、このmr[i]を周波数の低い点から、つまりf
[0]から順番に計算する。
る。周波数f[i]における加算されたマスクをmr[i]と
すると、このmr[i]を周波数の低い点から、つまりf
[0]から順番に計算する。
【0031】周波数f[0]でのマスクmr[0]は、周波数
f[0]でのパワースペクトルによるマスクだけであるの
で、以下のように求まる。
f[0]でのパワースペクトルによるマスクだけであるの
で、以下のように求まる。
【0032】mr[0]=a[0]
【0033】周波数f[1]でのマスクマスクmr[1]は、
周波数f[1]でのパワースペクトルによるマスクと、f
[1]よりも低い周波数、つまり周波数f[0]でのパワース
ペクトルによるマスクとの加算となり、以下のように求
まる。
周波数f[1]でのパワースペクトルによるマスクと、f
[1]よりも低い周波数、つまり周波数f[0]でのパワース
ペクトルによるマスクとの加算となり、以下のように求
まる。
【0034】 mr[1]=a[1]+a[0]*10-q/(f[1]-f[0])
【0035】周波数f[2]でのマスクマスクマスクmr
[2]は、周波数f[2]でのパワースペクトルによるマスク
と、f[2]よりも低い周波数、つまり周波数f[1]でのパ
ワースペクトル及び周波数f[0]でのパワースペクトル
によるマスクとの加算となり、以下のように求まる。
[2]は、周波数f[2]でのパワースペクトルによるマスク
と、f[2]よりも低い周波数、つまり周波数f[1]でのパ
ワースペクトル及び周波数f[0]でのパワースペクトル
によるマスクとの加算となり、以下のように求まる。
【0036】 mr[2]=a[2]+a[1]*10-q/(f[2]-f[1])+a[0]*10-q/(f[2]-f[0]) =a[2]+10-q/(f[2]-f[1])*{a[1]+a[0]*10-q/(f[1]-f[0])} =a[2]+10-q/(f[2]-f[1])*mr[1]
【0037】従って、周波数f[i]でのマスクmr[i]
は、以下のように求める。
は、以下のように求める。
【0038】 mr[i]=a[i]+10-q/(f[i]-f[i1])*mr[i1]
【0039】この計算は、10-q(f[i]-f[i1])の部分を
予め計算して、テーブルとして用意しておけば、積和演
算(和と積だが、隣接する周波数での計算を組み合わせ
れば積和演算となる)1回で済む。つまり、n本のパワ
ースペクトルが存在する場合、これらのパワースペクト
ルのマスクの右側の部分の加算において、1つの周波数
点につき積和演算1回で計算することがで、従って、n
点の周波数について計算するにはn回の積和演算を行え
ばよいことになる。
予め計算して、テーブルとして用意しておけば、積和演
算(和と積だが、隣接する周波数での計算を組み合わせ
れば積和演算となる)1回で済む。つまり、n本のパワ
ースペクトルが存在する場合、これらのパワースペクト
ルのマスクの右側の部分の加算において、1つの周波数
点につき積和演算1回で計算することがで、従って、n
点の周波数について計算するにはn回の積和演算を行え
ばよいことになる。
【0040】次に、マスクの左側の加算について説明す
る。マスクの左側の加算は、右側の加算処理とほとんど
同じで、周波数f[i]において加算されたマスクをml
[i]とすると、このマスクml[i]を周波数の高い方か
ら、つまりf[n一1]から順番に計算する。
る。マスクの左側の加算は、右側の加算処理とほとんど
同じで、周波数f[i]において加算されたマスクをml
[i]とすると、このマスクml[i]を周波数の高い方か
ら、つまりf[n一1]から順番に計算する。
【0041】周波数f[n-1]でのマスクml[n-1]は、周
波数f[n-1]より高い周波数にパワースペクトルが存在
しないので、以下のように求まる。
波数f[n-1]より高い周波数にパワースペクトルが存在
しないので、以下のように求まる。
【0042】ml[n-1]=0
【0043】周波数f[n-2]でのマスクml[n-2]は、周
波数f[n-2]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
波数f[n-2]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
【0044】ml[n2]=10-p/(f[n1]-f[n2])
【0045】周波数f[n-3]でのマスクml[n-3]は、周
波数f[n-3]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
波数f[n-3]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
【0046】 ml[n3] =a[n-2]*10-p/(f[n2]-f[n3])+a[n-1]*10-p/(f[n1]-f[n3]) =10-p/(f[n2]-f[n3])*{a[n-2]+a[n-1]*10-p/(f[n1]-f[n3])} =10-p/(f[n2]-f[n3])*(a[n-2]+ml[n2])
【0047】従って、周波数f[i]でのマスクml[i]
は、以下のように求められる。
は、以下のように求められる。
【0048】ml[i]=10-p/(f[i+1]-f[i])*(a[i+
1]+ml[i+1])
1]+ml[i+1])
【0049】この計算についても、10
-p/(f[i+1]-f[i])を予め計算して、テーブルとして用意
しておけば、積和演算(和と積だが、隣接する周波数で
の計算を組み合わせれば積和演算となる)1回で済み、
n点の周波数について計算するにはn回の積和演算を行
えばよいことになる。
-p/(f[i+1]-f[i])を予め計算して、テーブルとして用意
しておけば、積和演算(和と積だが、隣接する周波数で
の計算を組み合わせれば積和演算となる)1回で済み、
n点の周波数について計算するにはn回の積和演算を行
えばよいことになる。
【0050】周波数f[i]におけるマスクの和mt[i]
は、周波数f[i]におけるマスクの右側の部分の和mr
[i]とマスクの左側の部分の和ml[i]とを加算すればよ
い。従って、n点の周波数のマスクの和を求めるには、
n回の加算処理を行えばよいことになる。
は、周波数f[i]におけるマスクの右側の部分の和mr
[i]とマスクの左側の部分の和ml[i]とを加算すればよ
い。従って、n点の周波数のマスクの和を求めるには、
n回の加算処理を行えばよいことになる。
【0051】従って、n本のパワーススペクトルサンプ
ルから、n点の周波数でのパワースペクトルサンプルに
ついて1つ1つのマスクの和を求めるのに必要な演算量
は、積和演算2n回、加算n回となる。
ルから、n点の周波数でのパワースペクトルサンプルに
ついて1つ1つのマスクの和を求めるのに必要な演算量
は、積和演算2n回、加算n回となる。
【0052】nの増加に対して、演算量はそれに比例し
て増えるだけであり、従来のようにnの二乗オーダで急
激に増えることはない。また、従来においては、nの値
が入力音声によって変化したが、本実施例では変化しな
い。従って、nの値が決まれば、それに適した規模のマ
スク計算回路を備えればよく、従来のようにnの値が予
想以上に大きくなることを想定して、それに合わせた演
算能力を有する計算回路を備える必要はない。また、従
来のように、入力音声によって処理量が極端に増加し処
理が破綻して雑音を発生することもない。
て増えるだけであり、従来のようにnの二乗オーダで急
激に増えることはない。また、従来においては、nの値
が入力音声によって変化したが、本実施例では変化しな
い。従って、nの値が決まれば、それに適した規模のマ
スク計算回路を備えればよく、従来のようにnの値が予
想以上に大きくなることを想定して、それに合わせた演
算能力を有する計算回路を備える必要はない。また、従
来のように、入力音声によって処理量が極端に増加し処
理が破綻して雑音を発生することもない。
【0053】なお、マスクの形状を全てのパワースペク
トルについて従来よりも単純な一定の形状(パワースペ
クトルの右側マスクの傾き−qと左側マスクの傾きpが
一定)にしたことにより、エンコード音の劣化が考えら
れるが、サブサンプリング処理においてパワースペクト
ルサンプルを一定の個数ずつまとめてパワースペクトル
サンプルの個数を減す場合に、1個にまとめるパワース
ペクトルサンプルの数を減らせば、周波数分解能が増加
するので、エンコード音の劣化を低く抑えることができ
る。
トルについて従来よりも単純な一定の形状(パワースペ
クトルの右側マスクの傾き−qと左側マスクの傾きpが
一定)にしたことにより、エンコード音の劣化が考えら
れるが、サブサンプリング処理においてパワースペクト
ルサンプルを一定の個数ずつまとめてパワースペクトル
サンプルの個数を減す場合に、1個にまとめるパワース
ペクトルサンプルの数を減らせば、周波数分解能が増加
するので、エンコード音の劣化を低く抑えることができ
る。
【0054】本発明の音声信号処理回路によってエンコ
ードした結果と、従来の音声信号処理回路によってエン
コードした結果とを、それぞれデコーダに入力して復号
し、オーディオシステムに入力して試聴した聴感評価で
は、一般的な聴感をもつ被験者3人がほとんど差を判別
することができなかった。この結果から、音質を劣化さ
せずに演算量を削減することができるという本発明の有
効性を確認することができであろう。
ードした結果と、従来の音声信号処理回路によってエン
コードした結果とを、それぞれデコーダに入力して復号
し、オーディオシステムに入力して試聴した聴感評価で
は、一般的な聴感をもつ被験者3人がほとんど差を判別
することができなかった。この結果から、音質を劣化さ
せずに演算量を削減することができるという本発明の有
効性を確認することができであろう。
【0055】
【発明の効果】以上説明したように本発明によれば、所
定数のパワースペクトルサンプル毎に一定の単位マスク
関数を畳み込んだものをパワースペクトルサンプル毎の
マスクとし、各々のパワースペクトルサンプルのマスク
を足し合わせることによりマスクレベルを算出するた
め、マスクレベルの演算に必要な計算量を少なくするこ
とができる。
定数のパワースペクトルサンプル毎に一定の単位マスク
関数を畳み込んだものをパワースペクトルサンプル毎の
マスクとし、各々のパワースペクトルサンプルのマスク
を足し合わせることによりマスクレベルを算出するた
め、マスクレベルの演算に必要な計算量を少なくするこ
とができる。
【0056】また、パワースペクトルサンプルの本数が
入力音声によって変化せず、このため、パワースペクト
ルサンプルの本数が決めれば、それに適した規模の演算
手段を備えればよく、処理量の増加を想定して大規模な
演算手段を備える必要をなくすることができる。
入力音声によって変化せず、このため、パワースペクト
ルサンプルの本数が決めれば、それに適した規模の演算
手段を備えればよく、処理量の増加を想定して大規模な
演算手段を備える必要をなくすることができる。
【図1】 本発明の一実施例による音声信号処理回路の
基本構成を示すブロック図である。
基本構成を示すブロック図である。
【図2】 本実施例の音声信号処理回路において用いる
マスクの形状を説明するための図である。
マスクの形状を説明するための図である。
【図3】 本実施例の音声信号処理回路におけるマスク
の加算処理を説明するための図である。
の加算処理を説明するための図である。
【図4】 パワースペクトルの右側のマスクの加算処理
を説明するための図である。
を説明するための図である。
【図5】 パワースペクトルの左側のマスクの加算処理
を説明するための図である。
を説明するための図である。
【図6】 従来の音声信号処理回路の基本構成を示すブ
ロック図である。
ロック図である。
【図7】 従来の音声信号処理回路で用いられるマスク
の形状を説明するための図である。
の形状を説明するための図である。
11 入力音声サンプル 12 FFT回路 13 サブサンプリング回路 14 マスク計算回路 21 マスク 22 パワースペクトル 23 左側のマスク 24 右側のマスク
Claims (4)
- 【請求項1】 予め量子化された第1所定数の入力音声
サンプルのマスクレベルを算出する音声信号処理回路に
おいて、 前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、 前記第1所定数の2分の1個のパワースペクトルサンプ
ルを定められた本数ずつ加算し、第2所定数のパワース
ペクトルサンプルにサブサンプルするサブサンプリング
手段と、 前記第2所定数のパワースペクトルサンプル毎に一定の
単位マスク関数を畳み込んだものをパワースペクトルサ
ンプル毎のマスクとし、各々の前記パワースペクトルサ
ンプルの前記マスクを足し合わせることにより、前記第
2の所定数からなるマスクレベルを算出するマスク計算
手段とからなり、 周波数f[0]からf[n−1]のn個の前記パワース
ペクトルサンプルが存在する場合、第i番目の前記パワ
ースペクトルサンプルの大きさをa[i]、周波数をf
[i]、マスクの傾きをpとすると、周波数fの前記パ
ワースペクトルサンプルに対する前記単位マスク関数
は、 mi(f)=a[i]*10 −p/|f−fi| で表される ことを特徴とする音声信号処理回路。 - 【請求項2】 前記マスク計算手段は、前記各パワース
ペクトルサンプルの右側のマスクと、左側のマスクに分
けてマスクレベルをそれぞれ算出することを特徴とする
請求項1に記載の音声信号処理回路。 - 【請求項3】 前記マスク計算手段は、周波数f[0]
からf[n−1]のn個の前記パワースペクトルサンプ
ルが存在する場合、前記各パワースペクトルサンプルの
右側のマスクと、左側のマスクに分けると共に、 前記各パワースペクトルサンプルの右側のマスクについ
て、周波数の低い前記パワースペクトルサンプルのマス
クから順にマスクレベルを算出し、前記各パワースペク
トルサンプルの左側のマスクについて、周波数の高い前
記パワースペクトルサンプルのマスクから順にマスクレ
ベルを算出する ことを特徴とする請求項1に記載の音声
信号処理回路。 - 【請求項4】 周波数f[0]からf[n−1]のn個
の前記パワースペクトルサンプルが存在する場合、第i
番目の前記パワースペクトルサンプルの大きさをa
[i]、周波数をf[i]、右側のマスクの傾きを−
q、左側のマスクの傾きをpとすると、 周波数f[i]の前記パワースペクトルサンプルの右側
のマスクは、 mr[i]=a[i]+10
−q(f[i]−f[i−1) *mr[i−1]で算出
さされ、 周波数f[i]の前記パワースペクトルサンプルの左側
のマスクは、 ml[i]=10 −p/(f[i+1]−f[i) *
(a[i+1]+ml[i+1])で算出されることを
特徴とする請求項3に 記載の音声信号処理回路。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07201593A JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
US08/679,578 US5890107A (en) | 1995-07-15 | 1996-07-15 | Sound signal processing circuit which independently calculates left and right mask levels of sub-band sound samples |
DE19628503A DE19628503A1 (de) | 1995-07-15 | 1996-07-15 | Audiosignal-Verarbeitungsschaltung zur Berechnung eines Maskenpegels von quantisierten Audiosignalwerten |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07201593A JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0934494A JPH0934494A (ja) | 1997-02-07 |
JP3082625B2 true JP3082625B2 (ja) | 2000-08-28 |
Family
ID=16443633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07201593A Expired - Fee Related JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5890107A (ja) |
JP (1) | JP3082625B2 (ja) |
DE (1) | DE19628503A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014700A (ja) * | 2000-06-30 | 2002-01-18 | Canon Inc | 音声信号処理方法、装置および記憶媒体 |
WO2004042722A1 (en) * | 2002-11-07 | 2004-05-21 | Samsung Electronics Co., Ltd. | Mpeg audio encoding method and apparatus |
KR100477701B1 (ko) * | 2002-11-07 | 2005-03-18 | 삼성전자주식회사 | Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치 |
US7720013B1 (en) * | 2004-10-12 | 2010-05-18 | Lockheed Martin Corporation | Method and system for classifying digital traffic |
JP2008052117A (ja) * | 2006-08-25 | 2008-03-06 | Oki Electric Ind Co Ltd | 雑音除去装置、方法及びプログラム |
JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03117919A (ja) * | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
JP3084721B2 (ja) * | 1990-02-23 | 2000-09-04 | ソニー株式会社 | 雑音除去回路 |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
US5687281A (en) * | 1990-10-23 | 1997-11-11 | Koninklijke Ptt Nederland N.V. | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal |
JP3089691B2 (ja) * | 1991-03-29 | 2000-09-18 | ソニー株式会社 | ディジタルデータの高能率符号化方法 |
ATE165198T1 (de) * | 1991-03-29 | 1998-05-15 | Sony Corp | Reduzierung der zusaztinformation bei teilbandkodierungsverfahren |
JP3134338B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル音声信号符号化方法 |
JP3446216B2 (ja) * | 1992-03-06 | 2003-09-16 | ソニー株式会社 | 音声信号処理方法 |
JP3278900B2 (ja) * | 1992-05-07 | 2002-04-30 | ソニー株式会社 | データ符号化装置及び方法 |
GB9213459D0 (en) * | 1992-06-24 | 1992-08-05 | British Telecomm | Characterisation of communications systems using a speech-like test stimulus |
JP3186331B2 (ja) * | 1993-05-25 | 2001-07-11 | ソニー株式会社 | 信号変換方法又は装置、並びに記録媒体 |
TW232116B (en) * | 1993-04-14 | 1994-10-11 | Sony Corp | Method or device and recording media for signal conversion |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
KR100269213B1 (ko) * | 1993-10-30 | 2000-10-16 | 윤종용 | 오디오신호의부호화방법 |
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
US5625743A (en) * | 1994-10-07 | 1997-04-29 | Motorola, Inc. | Determining a masking level for a subband in a subband audio encoder |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
EP0738441B1 (en) * | 1994-11-04 | 2002-03-13 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
-
1995
- 1995-07-15 JP JP07201593A patent/JP3082625B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-15 DE DE19628503A patent/DE19628503A1/de not_active Withdrawn
- 1996-07-15 US US08/679,578 patent/US5890107A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0934494A (ja) | 1997-02-07 |
DE19628503A1 (de) | 1997-02-20 |
US5890107A (en) | 1999-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4714416B2 (ja) | 空間的オーディオのパラメータ表示 | |
Viswanathan et al. | Quantization properties of transmission parameters in linear predictive systems | |
EP3739752B1 (en) | Filter system comprising a filter converter and a filter compressor and method for operating the filter system | |
KR100913987B1 (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
EP1433359B1 (en) | Dynamic range compression using digital frequency warping | |
JP2904472B2 (ja) | ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置 | |
JP3104400B2 (ja) | オーディオ信号符号化装置及び方法 | |
US20070121952A1 (en) | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods | |
JPH0697837A (ja) | ディジタル信号復号化装置 | |
EP2306453B1 (en) | Audio signal compression device, audio signal compression method, audio signal decoding device, and audio signal decoding method | |
US6430529B1 (en) | System and method for efficient time-domain aliasing cancellation | |
JP3082625B2 (ja) | 音声信号処理回路 | |
EP1249837A2 (en) | A method for decompressing a compressed audio signal | |
JP2776300B2 (ja) | 音声信号処理回路 | |
JP2001083995A (ja) | サブバンド符号化・復号方法 | |
JP3263484B2 (ja) | 音声帯域分割復号化装置 | |
EP0707761B1 (en) | Arrangement for determining a signal spectrum of a wideband digital signal and for deriving bit allocation information in response thereto | |
JP2993324B2 (ja) | 音声高能率符号化装置 | |
EP0720146A1 (en) | A method for measuring speech masking properties | |
JPH07225598A (ja) | 動的に決定された臨界帯域を用いる音響コード化の方法および装置 | |
JP2000244325A (ja) | Mpegオーディオの復号化方法 | |
JP3033158B2 (ja) | デイジタル信号符号化装置 | |
JP3504485B2 (ja) | 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体 | |
JP3089690B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP2002311997A (ja) | オーディオ信号符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |