JP5416173B2 - 周波数帯コピー方法、装置及びオーディオ復号化方法、システム - Google Patents
周波数帯コピー方法、装置及びオーディオ復号化方法、システム Download PDFInfo
- Publication number
- JP5416173B2 JP5416173B2 JP2011151189A JP2011151189A JP5416173B2 JP 5416173 B2 JP5416173 B2 JP 5416173B2 JP 2011151189 A JP2011151189 A JP 2011151189A JP 2011151189 A JP2011151189 A JP 2011151189A JP 5416173 B2 JP5416173 B2 JP 5416173B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- frequency range
- domain coefficient
- value
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 95
- 238000009499 grossing Methods 0.000 claims description 46
- 238000001228 spectrum Methods 0.000 claims description 45
- 238000004364 calculation method Methods 0.000 claims description 41
- 238000009826 distribution Methods 0.000 claims description 35
- 230000005236 sound signal Effects 0.000 claims description 27
- 238000013139 quantization Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 description 7
- 230000010076 replication Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000013367 dietary fats Nutrition 0.000 description 1
- 239000010520 ghee Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
A、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索すること、
B、音調の所在位置により周波数帯コピー周期及びソース周波数範囲を確定し、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、該ソース周波数範囲は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであること、
C、周波数帯コピー周期によりゼロビットの符号化サブバンドに対し周波数帯コピーを行うことを含む。
ステップAにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする、
方法を採用して、ある音調の位置を搜索する。
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
前記第1周波数範囲は周波数スペクトルの統計特性によって確定される、エネルギーが比較的に集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする方法によってフィルタ出力値の最大極値を確定する。
以下の方法を採用してフィルタ出力値の最大極値を確定し、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置によって異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得た場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値である場合、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする場合、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする。
ステップCにおける該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減りつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーからはじめとする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達するあと、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことである。
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するものでり、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、前記ソース周波数範囲 は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲でああり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーするためのものである。
前記音調位置捜索モジュールが音調位置を捜索する方法は、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在の位置が即ち音調の所在位置、
である。
前記音調位置捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算が
そのなか、
前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが比較的に集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
前記音調位置捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする。
前記音調位置捜索モジュールは、フィルタ出力値の最大極値を確定する時、該第1周波数範囲の中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、さらに該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算す過程は、現在に周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数領域コピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを減りつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことである。
A、復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対して復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップと、
B、各符号化サブバンドに対してビットを分配し、非ゼロビットの符号化サブバンドに対し復号化と逆量子化を行い、非ゼロビットの符号化サブバンドの周波数領域係数を得るステップと、
C、MDCT周波数領域係数なかにおいてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドを周波数帯コピーし、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対しエネルギー調整を行い、それにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得て、その中の前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるステップと、
D、非ゼロビットの符号化サブバンドの周波数領域係数と再建されたゼロビットの符号化サブバンドの周波数領域係数に対して逆修正離散コサイン変換(IMDCT)を行い、最終のオーディオ信号を得るステップとを含む。
ステップCにおいて、以下の方法を採用してある音調の位置を捜索し、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする。
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算式が
そのなか、
前記第1周波数範囲は周波数スペクトルの統計特性によって確定されるエネルギーが比較的に集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする方法によってフィルタ出力値の最大極値を確定する。
以下の方法を採用してフィルタ出力値の最大極値を確定し、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする時、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする。
ステップCにおいて該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減りつづけて、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を後へ続けて該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことである。
以上ような周波数帯コピー方法とノイズ充填を結合する方法を採用してすべてのゼロビットの符号化サブバンドに対して周波数スペクトル再建を行い、或いは、特定の周波数点の以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、特定の周波数点の以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーとノイズ充填を結合する方法を採用して周波数スペクトル再建を行う。
前記DeMUXは、復号化待ちビットストリームの中から振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離するためのものであり、
前記振幅エンベロープ復号化ユニットは、前記DeMUXと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープ符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得るためのものであり、
前記ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットの分配を行い、各符号化サブバンドにおける各の周波数領域係数に分配された符号化ビット数を得るためのものであり、
周波数領域係数復号化ユニットは、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、符号化サブバンドに対して復号化、逆量子化及び逆正規化を行い、周波数領域係数を得るためのものであり、
前記周波数帯コピーユニットは、前記DeMUX、周波数領域係数復号化ユニット、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーを行い、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるためのもので、さらに、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対してエネルギー調整を行うためのものであり、
ノイズ充填ユニットは、振幅エンベロープ復号化ユニット、ビット分配ユニット及び周波数帯コピーユニットと接続し、現在のゼロビットの符号化サブバンドの振幅エンベロープにより該符号化サブバンドにノイズを填充し、再建するゼロビットの符号化サブバンドの周波数領域係数を得るためのものであり、
IMDCTユニットは、前記ノイズ充填ユニットと接続し、ノイズ充填した後の周波数領域係数に対してIMDCTを行い、オーディオ信号を得るためのものである。
前記周波数帯コピーユニットは、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール及び周波数帯コピーモジュールを含み、その中に、
音調位置捜索モジュールは、MDCT周波数領域係数なかからオーディオ信号のある音調の所在位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するためのもので、該周波数帯コピー周期は0周波数点から音調位置までの周波数点の帯域幅であり、前記ソース周波数範囲は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲であり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーするためのものである。
前記音調捜索モジュールは、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在している位置が、即ち、音調の所在位置である、
方法を採用して音調の所在位置を捜索する。
前記音調捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタの計算が
そのなか、
前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが比較的に集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
前記音調捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする。
前記音調捜索モジュールは、フィルタ出力値の最大極値を確定すると、該第1周波数範囲のその中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、そして該最初の最大値に対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前のの周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する過程は、現在に周波数領域係数を再建することが必要があるゼロビットの符号化サブバンドの開始周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えることであり、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減って、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modであることを含む。
周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけて、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達するまでにして、その後再び第copyband_offset個の周波数点を開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことである。
前記周波数帯コピーユニットが採用する周波数領域係数コピーとノイズ充填ユニットのノイズ充填結合の方法は、すべてのゼロビットの符号化サブバンドのために周波数スペクトル再建を行い、或いは、前記ノイズ充填ユニットが特定周波数点以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、周波数帯コピーユニットが採用する周波数領域係数コピーとノイズ充填ユニットノイズ充填結合の方法は特定周波数点以上のゼロビットの符号化サブバンドに対し周波数スペクトル再建を行う。
101:MDCT周波数領域係数においてオーディオ信号のある音調の所在位置を捜索すること、
本発明の好ましい音調の所在位置を捜索する方法は、MDCT周波数領域係数を平滑化フィルタすることで、以下のステップを含み、
a1、低周波数のある特定周波数範囲のMDCT周波数領域係数に対し絶対値或は平方値を取り、平滑化フィルタを行い、
ここでいう特定の周波数範囲は周波数スペクトルの統計特性によって確定されたエネルギーが比較的に集中する低周波数の周波数範囲でもよく、第1周波数範囲と言われる。ここの低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
(1)直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値として、対応の周波数点のシリアルナンバーを最大極値(即ち音調)の位置とし、
(2)最大極値を捜索する際に、該第1周波数範囲のある一段を第2周波数範囲として、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値を第1周波数範囲フィルタ出力値の最大極値として、対応の周波数点のシリアルナンバーを最大極値(即ち音調)の位置とする。
(a)該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値がひとつ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数が音調の所在位置であることと考えられ、即ち、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最低周波数の周波数領域係数が音調の所在位置であることと考えられ、即ち、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
(b)該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、現在の周波数領域係数が音調の所在位置であることと考えられ、即ち、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数が音調の所在の位置であることと考えられ、即ち、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
(c)該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
第33から第56個までのMDCT周波数領域係数のフィルタ出力値中からその最大値を捜索し、最大値が第33個の周波数領域係数に対応すると、第32個の周波数領域係数の検波出力結果が第33個の周波数領域係数より大きいか否かを判断し、YESと、順次に前へ比較し続け、第31個の周波数領域係数の検波出力結果が第32個の周波数領域係数より大きいか否かを判断し、このような方法に従って、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前のものより大きい場合、或は、捜索しつづけて、第24個の周波数領域係数のフィルタ出力値が第25個の周波数領域係数のフィルタ出力値より大きい場合、現在の周波数領域係数或は第24個の周波数領域係数が音調の位置であり、
最大値が56であると、類似の方法によって、順次に後へ捜索しつづけて、現在の周波数領域係数のフィルタ出力値が一つ後のものより大きい場合、該現在の周波数領域係数が音調の位置であり、或は、捜索しつづけて、第64個の周波数領域係数のフィルタ出力値を見付け、且つその値は第63個の周波数領域係数のフィルタ出力値より大きい場合、該第64個の周波数領域係数が音調の位置であり、
最大値が33〜56の間にあると、該最大値が対応する周波数領域係数が音調の位置である。
周波数帯のコピー周期をcopy_periodとし、copy_periodがTonal_posに1を加えるものである。
周波数帯コピーを行なう際に、先ず、ソース周波数範囲と周波数帯コピーを行なう必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、次に、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからソース周波数範囲の周波数領域係を数周期的にゼロビットの符号化サブバンドにコピーする。
まず、コピーする必要があるの第1個のゼロビットの符号化サブバンドから初め、周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを取得して、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、Tonal_posに1を加えてコピー周期copy_periodを得る。周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを減りつづけ、その値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
copy_pos_mod = fillband_start_freqとし、
copy_pos_modが(Tonal_pos+copyband_offset)より大きいと
{
copy_pos_mod = copy_pos_mod - copy_period;
}
計算を完成した後、copy_pos_modがソース周波数範囲コピー開始シリアルナンバーである。
201:復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対し復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップ、
符号化端から送信した符号化ビットストリームの中に(即ちビットストリームデマルチプレクサDeMUXから)1フレームの符号化ビットを取り出し、符号化ビットを取り出した後、該フレームの中の各振幅エンベロープ符号化ビットを復号化して、各符号化サブバンドの振幅エンベロープ量子化指数Thq(j)、j=0,…,L−1を得る。振幅エンベロープ量子化指数に逆量子化して振幅エンベロープrms(r) ,r=0,…,L−1を得る。
各符号化サブバンドの振幅エンベロープ量子化指数によって各符号化サブバンドの重要性の初期値を算出し、符号化サブバンド重要性を利用して各符号化サブバンドに対しビットを分配し、符号化サブバンドのビット分配数を得て、復号化端のビット分配方法と符号化端のビット分配方法は完全に同様である。ビットを分配する過程に、ビット分配ステップサイズ及びビットを分配した後符号化サブバンド重要性が低下したステップサイズはいずれも可変ステップサイズである。
204:MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、且つ0周波数点が後へcopyband_offset個周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーするステップ、該ステップの詳しい過程は周波数帯コピー方法を参考して、ここで省略する、
205:現在の符号化サブバンドの振幅エンベロープによりコピーして得る周波数領域係数に対しエネルギー調整を行い、さらにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得るステップ、
符号化端から送信したノイズレベル符号化ビットにより、各のゼロビットの符号化サブバンド内部のコピーして得られる周波数領域係数に対してエネルギー調整を行い、
ゼロビットの符号化サブバンドrがコピーして得られる周波数領域係数の振幅エンベロープを計算して、
そのなか、
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在位置を捜索するためのものであり、具体的に、第1周波数範囲のMDCT周波数領域係数に対し絶対値または平方値を取り得て、平滑化フィルタを行い、平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在位置を捜索し、該最大極値の所在位置は、即ち音調所在位置である。
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーすることに用いられ、
さらに、
前記音調位置捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が以下のようであり
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値よりも大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけて、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことを含む。
ビットストリームデマルチプレクサ(DeMUX)は、復号化待ちビットストリームの中か
ら振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離することに用いられるものであり、
振幅エンベロープ復号化ユニットは、前記ビットストリームデマルチプレクサと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープの符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得ることに用いられるものであり、
ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットを分配し、各符号化サブバンドにおいて各の周波数領域係数に分配された符号化ビット数を得ることに用いられるものであり、
ビット分配ユニットは、重要性計算モジュール、ビット分配モジュール、及びビット分配修正モジュールを含み、その中で、
重要性計算モジュールは符号化サブバンド振幅エンベロープ量子化指数によって各符号化サブバンド重要性の最初値を計算することに用いられるものであり、
前記ビット分配モジュールは各符号化サブバンドの重要性の初期値によって、符号化サブバンドにおける各周波数領域係数に対しビット分配するためのものであり、且つビット分配する過程に、ビット分配ステップサイズ及びビット分配した後の重要性低下のステップサイズはともに変化するものであり、
ビット分配修正モジュールは、ビット分配を行なった後、符号化端のビット分配修正反復回数count値と各符号化サブバンドの重要性によって、符号化サブバンドに対し再びcount回ビット分配修正することに用いられる物である。
Claims (25)
- 周波数帯コピー方法であって、
A、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索すること、
B、音調の所在位置により周波数帯コピー周期及びソース周波数範囲を確定し、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、該ソース周波数範囲は、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであること、
C、周波数帯コピー周期によりゼロビットの符号化サブバンドに対し周波数帯コピーを行うことを含むことを特徴とする周波数帯コピー方法。 - ステップAにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする、
方法を採用して、ある音調の位置を搜索することを特徴とする請求項1に記載の方法。 - 前記第1周波数範囲は周波数スペクトルの統計特性によって確定される、エネルギーが集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項2に記載の方法。
- 直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置によって異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得た場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値である場合、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である方法によってフィルタ出力値の最大極値を確定することを特徴とする請求項2に記載の方法。 - ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする場合、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーすることを特徴とする請求項1〜5のいずれかに記載の方法。
- ステップCにおける該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを差し引きつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることであることを特徴とする請求項6に記載の方法。 - ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーからはじめとする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達したあと、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことであることを特徴とする請求項6に記載の方法。 - 周波数帯コピー装置であって、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール及び周波数帯コピーモジュールを含み、その中、
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するものでり、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、前記ソース周波数範囲は、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーするためのものであることを特徴とする周波数帯コピー装置。 - 前記音調位置捜索モジュールが音調位置を捜索する方法は、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在の位置が即ち音調の所在位置、
であることを特徴とする請求項9に記載の装置。 - 前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項10に記載の装置。
- 前記音調位置捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
前記音調位置捜索モジュールは、フィルタ出力値の最大極値を確定する時、該第1周波数範囲の中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、さらに該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値であることを特徴とする請求項10に記載の装置。 - 前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算す過程は、再生しようとする周波数係数に関るゼロビットの符号化サブバンドの開始周波数点のシリアル番号を獲得し、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数領域コピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを差し引きつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることを含むことを特徴とする請求項9〜13のいずれかに記載の装置。
- 周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことであることを特徴とする請求項9〜13中のいずれかに記載の装置。
- オーディオ復号化方法であって、
A、復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対して復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップと、
B、各符号化サブバンドに対してビットを分配し、非ゼロビットの符号化サブバンドに対し復号化と逆量子化を行い、非ゼロビットの符号化サブバンドの周波数領域係数を得るステップと、
C、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドを周波数帯コピーし、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対しエネルギー調整を行い、それにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得て、その中の前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるステップと、
D、非ゼロビットの符号化サブバンドの周波数領域係数と再建されたゼロビットの符号化サブバンドの周波数領域係数に対して逆修正離散コサイン変換(IMDCT)を行い、最終のオーディオ信号を得るステップとを含むことを特徴とするオーディオ復号化方法。 - ステップCにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする方法を採用してある音調の位置を捜索することを特徴とする請求項16に記載の方法。 - 前記第1周波数範囲は周波数スペクトルの統計特性によって確定されるエネルギーが集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項17に記載の方法。
- 直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である方法によってフィルタ出力値の最大極値を確定することを特徴とする請求項17に記載の方法。 - ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする時、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーすることを特徴とする請求項17〜20中のいずれかに記載の方法。
- ステップCにおいて該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを差し引きつづけて、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることであることを特徴とする請求項21に記載の方法。 - ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を後へ続けて該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことであることを特徴とする請求項21に記載の方法。 - 周波数帯コピー方法とノイズ充填を結合する方法を採用してすべてのゼロビットの符号化サブバンドに対して周波数スペクトル再建を行い、或いは、特定の周波数点以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、特定の周波数点以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーとノイズ充填を結合する方法を採用して周波数スペクトル再建を行うことを特徴とする請求項16に記載の方法。
- オーディオ復号化システムであって、ビットストリームデマルチプレクサ(DeMUX)、振幅エンベロープ復号化ユニット、ビット分配ユニット、周波数領域係数復号化ユニット、ノイズ充填ユニット、逆修正離散コサイン変換(IMDCT)ユニット、及び請求項9〜15中のいずれかに記載の周波数帯コピー装置を含み、
前記DeMUXは、復号化待ちビットストリームの中から振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離するためのものであり、
前記振幅エンベロープ復号化ユニットは、前記DeMUXと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープ符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得るためのものであり、
前記ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットの分配を行い、各符号化サブバンドにおける各の周波数領域係数に分配された符号化ビット数を得るためのものであり、
周波数領域係数復号化ユニットは、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、符号化サブバンドに対して復号化、逆量子化及び逆正規化を行い、周波数領域係数を得るためのものであり、
前記周波数帯コピー装置は、前記DeMUX、周波数領域係数復号化ユニット、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーを行い、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるためのもので、さらに、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対してエネルギー調整を行うためのものであり、
ノイズ充填ユニットは、振幅エンベロープ復号化ユニット、ビット分配ユニット及び周波数帯コピーユニットと接続し、現在のゼロビットの符号化サブバンドの振幅エンベロープにより該符号化サブバンドにノイズを填充し、再建するゼロビットの符号化サブバンドの周波数領域係数を得るためのものであり、
IMDCTユニットは、前記ノイズ充填ユニットと接続し、ノイズ充填した後の周波数領域係数に対してIMDCTを行い、オーディオ信号を得るためのものであることを特徴とするオーディオ復号化システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011151189A JP5416173B2 (ja) | 2011-07-07 | 2011-07-07 | 周波数帯コピー方法、装置及びオーディオ復号化方法、システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011151189A JP5416173B2 (ja) | 2011-07-07 | 2011-07-07 | 周波数帯コピー方法、装置及びオーディオ復号化方法、システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013019968A JP2013019968A (ja) | 2013-01-31 |
JP5416173B2 true JP5416173B2 (ja) | 2014-02-12 |
Family
ID=47691490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011151189A Active JP5416173B2 (ja) | 2011-07-07 | 2011-07-07 | 周波数帯コピー方法、装置及びオーディオ復号化方法、システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5416173B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7124049B2 (ja) * | 2018-02-22 | 2022-08-23 | リンテック株式会社 | フィルム状焼成材料、及び支持シート付フィルム状焼成材料 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091363A1 (en) * | 2001-05-08 | 2002-11-14 | Koninklijke Philips Electronics N.V. | Audio coding |
JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
ES2403410T3 (es) * | 2007-08-27 | 2013-05-17 | Telefonaktiebolaget L M Ericsson (Publ) | Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda |
DK2186089T3 (en) * | 2007-08-27 | 2019-01-07 | Ericsson Telefon Ab L M | Method and apparatus for perceptual spectral decoding of an audio signal including filling in spectral holes |
-
2011
- 2011-07-07 JP JP2011151189A patent/JP5416173B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013019968A (ja) | 2013-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6773737B2 (ja) | 音響信号の帯域幅拡張を行う装置及び方法 | |
JP2013015598A (ja) | オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法 | |
CA2698031C (en) | Method and device for noise filling | |
JP4950210B2 (ja) | オーディオ圧縮 | |
KR101586317B1 (ko) | 신호 처리 방법 및 장치 | |
JP6636574B2 (ja) | 雑音信号処理方法、雑音信号生成方法、符号化器、および、復号化器 | |
CN102194458B (zh) | 频带复制方法、装置及音频解码方法、系统 | |
JP2003216190A (ja) | 符号化装置および復号化装置 | |
JPWO2004010415A1 (ja) | オーディオ復号装置と復号方法およびプログラム | |
NZ593517A (en) | Buffering samples of input signals, producing transform coefficients, and applying inverse transform to the coefficents | |
US8838442B2 (en) | Method and system for two-step spreading for tonal artifact avoidance in audio coding | |
WO2010130225A1 (zh) | 一种音频解码方法和音频解码器 | |
MX2014000161A (es) | Aparato y metodo para generar señal extendida de ancho de banda. | |
KR20150108421A (ko) | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 | |
US20130006644A1 (en) | Method and device for spectral band replication, and method and system for audio decoding | |
CN101192410B (zh) | 一种在编解码中调整量化质量的方法和装置 | |
CN101436407A (zh) | 音频编解码方法 | |
JP5416173B2 (ja) | 周波数帯コピー方法、装置及びオーディオ復号化方法、システム | |
CN103165134B (zh) | 音频信号高频参数编解码装置 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
KR101786863B1 (ko) | 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계 | |
CN108630212B (zh) | 非盲带宽扩展中高频激励信号的感知重建方法与装置 | |
CN111210831A (zh) | 基于频谱拉伸的带宽扩展音频编解码方法及装置 | |
CN116189693A (zh) | 一种带宽扩展方法、装置、介质及设备 | |
DE102011106034A1 (de) | Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416173 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |