Nothing Special   »   [go: up one dir, main page]

JP5009910B2 - レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 - Google Patents

レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 Download PDF

Info

Publication number
JP5009910B2
JP5009910B2 JP2008522028A JP2008522028A JP5009910B2 JP 5009910 B2 JP5009910 B2 JP 5009910B2 JP 2008522028 A JP2008522028 A JP 2008522028A JP 2008522028 A JP2008522028 A JP 2008522028A JP 5009910 B2 JP5009910 B2 JP 5009910B2
Authority
JP
Japan
Prior art keywords
post
rate
signal
processed
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008522028A
Other languages
English (en)
Other versions
JP2009503559A5 (ja
JP2009503559A (ja
Inventor
ステファン・ラゴ
ダヴィド・ヴィレット
バラーツ・コヴシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2009503559A publication Critical patent/JP2009503559A/ja
Publication of JP2009503559A5 publication Critical patent/JP2009503559A5/ja
Application granted granted Critical
Publication of JP5009910B2 publication Critical patent/JP5009910B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、マルチレートオーディオ符号化システム、更に特に、ビットレート拡大縮小可能(スケーラブル)であると共に、適用できる場合には、帯域幅拡大縮小可能(スケーラブル)であるオーディオ符号化システムによって符号化されたオーディオ信号を復号化する際のビットレートの切り替えの方法に関係する。それは、更に、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ復号化システムに対する前記方法のアプリケーション、そしてビットレートスケーラブル及び帯域幅スケーラブルオーディオ復号器に関係する。
本発明は、ボイスオーバーアイピー(voice over IP:VoIP)タイプのパケットネットワークを介した音声信号及び/またはオーディオ信号の伝送の分野において、伝送路の容量の関数として変更され得る品質を提供するために、特に有利なアプリケーションを見い出す。
本発明の方法は、副作用(artifact)なしで、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ符号化/復号化(コーデック)の様々なビットレートの間の遷移、さらに具体的に言うと、ビットレートによって決まる後処理(bitrate-dependent post-processing)を備えた電話帯域のコアと1つ以上の広帯域拡張階層とを有するビットレートスケーラブル及び帯域幅スケーラブルオーディオ符号化に関連する電話帯域と広帯域との間の遷移を達成する。
通常の方法では、用語“電話帯域”と“狭帯域”は、周波数帯域300ヘルツ(Hz)から3400ヘルツ(Hz)のことを指すと共に、用語“広帯域”は、周波数帯域50ヘルツ(Hz)から7000ヘルツ(Hz)に確保されている。
今日では、オーディオ(音声及び/またはオーディオ)周波数信号をデジタル信号に変換するため、そしてのこのようにデジタル化された信号を処理するための多くの技術がある。
最も広く使用される技術は、PCMもしくはADPCM符号化のような“波形符号化”方法、CELP(符号励振線形予測)符号化のような“合成による分析を用いたパラメータ符号化(parametric coding by analysis by synthesis)”方法、及び“サブ帯域における、もしくは変換による知覚符号化(Perceptual coding in sub-bands or by transforms)”方法である。狭帯域CELP符号化は、一般的に、品質を強化するために、後処理を利用する。この後処理は、一般的に、適応型後フィルタ処理、及びハイパスフィルタ処理である。オーディオ周波数信号を符号化するための標準の技術は、例えば、“"Speech Coding and Synthesis", W.B. Kleijn and K.K. Paliwal editors, Elsevier, 1995”において説明される。ここでは、オーディオ周波数信号の双方向伝送において利用される技術だけが問題とされる。
従来の音声符号化において、符号器は、固定したビットレートのビットストリームを生成する。この固定したビットレートの制限事項は、符号器及び復号器の実装及び使用を単純化する。そのようなシステムの例は、64キロビット/秒(kbps)の“G.711”符号化、及び8キロビット/秒(kbps)の“G.729”符号化である。
携帯電話、ボイスオーバーアイピー(voice over IP:VoIP)、またはアドホックネットワーク(ad hoc network)を介した通信のような特定のアプリケーションにおいては、可変ビットレートのビットストリームを生成することが好ましいと共に、ビットレート値は、事前に定義されたセットから取得される。マルチレート符号化技術には、以下のような様々な技術がある。
・AMR−NBシステム、AMR−WBシステム、SMVシステム、またはVMR−WBシステムにおいて使用されるようなソース及び/またはチャンネルによって制御されたマルチモード符号化。
・それがコアビットレート及び1つ以上の拡張階層を含むので階層的と言われるビットストリームを生成する、“スケーラブル(拡大縮小可能)”符号化としても同様に知られている階層符号化(hierarchical coding)。
48[kbps]、56[kbps]、及び64[kbps]の“G.722”システムは、ビットレートスケーラブル符号化(bitrate-scalable coding)の簡単な例である。MPEG−4のCELPコーデックは、ビットレート拡大縮小可能(スケーラブル)及び帯域幅拡大縮小可能(スケーラブル)である(“T. Numura et al., A bitrate and bandwidth scalable CELP coder, ICASSP 1998”を参照)。
・MDC符号化(multiple description coding)(“A. Gersho, J.D. Gibson, V. Cuperman, H. Dong, A multiple description speech coder based on AMR-WB for mobile ad hoc networks, ICASSP 2004”を参照)。
マルチレート符号化においては、ある符号化ビットレートから他の符号化ビットレートへ切り替わる際に、エラーまたは副作用を生成しないことが、確かに必要である。
もし全てのビットレートにおける符号化が、同じ帯域幅におけるオーディオ信号の同じ符号化モデルによる表現に基づいているならば、ビットレートの切り替えは、簡単である。例えば、AMR−NBシステムにおいて、いずれにせよACELP(algebraic code excited linear prediction)モデルと互換性があるLPC(linear predictive coding)タイプのモデルによって扱われるコンフォート雑音(comfort noise:無音区間疑似背景雑音)生成を除けば、信号は、電話帯域(300[Hz]から3400[Hz])において定義されると共に、符号化は、ACELPモデルに依存する。AMR−NB符号化は、従来の方法では、適応型後フィルタ処理とハイパスフィルタ処理の形式の後処理を(post-processing)使用すると共に、適応型後フィルタ処理の係数は、復号化ビットレートによって決まることに注意が必要である。それでもなお、ビットレートに従って変化する後処理パラメータの使用に結び付けられたあらゆる問題を処理するための事前対策は、講じられない。対照的に、AMR−WBタイプの広帯域CELP符号化は、主に複雑さの理由のために、後処理を使用しない。
ビットレートの切り替えは、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ符号化においては、なおさら問題がある。符号化は、その場合に、ビットレートによって異なるモデル及び帯域幅に基づいている。
階層型オーディオ符号化(hierarchical audio coding)の基本概念は、例えば、論文“T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto, and A. Kataoka, Scalable Speech Coding Technology for High-Quality Ubiquitous Communications, NTT Technical Review, March 2004”において例証される。そのタイプの符号化において、ビットストリームは、基本階層(base layer)及び1つ以上の拡張階層(enhancement layer)を含む。基本階層は、最小の符号化品質を保証する“コアコーデック(core codec)”と呼ばれる固定された低ビットレートの符号化によって生成される。その階層は、合格品質水準を維持するために、デコーダによって受信されなければならない。拡張階層は、品質を強化するために使用される。それらは、全て符号器によって送信されるが、それらは、復号器によって全てが受信されない可能性がある。階層符号化の主な利点は、それが単にビットストリームを切り捨てることによって、ビットレートの適応を可能にすることである。階層の数、すなわちビットストリームの可能な切り捨て(truncation:トランケーション)の数は、符号化の精度を定義する。もしビットストリームが、2つから4つ程度の階層のいくつかの階層を含むならば、符号化は、安定した精度の符号化であると言われると共に、細かい精度の符号化は、1[kbps]程度の増加を可能にする。
ここでの更に大きい関心技術は、電話帯域CELPタイプコア符号器及び1つ以上の広帯域拡張階層を備える、ビットレート拡大縮小可能(スケーラブル)及び帯域幅拡大縮小可能(スケーラブル)な階層符号化技術である。そのようなシステムの例は、8[kbps]、14.2[kbps]、及び24[kbps]における優秀な精度を備えた、
Figure 0005009910
で開示される符号器において、そして32[kbps]において6.4の細かい精度を備えた、“B. Kovesi, D. Massaloux, A. Sollaud, A scalable speech and audio coding scheme with continuous bitrate flexibility, ICASSP 2004”で開示される符号化方式、またはMPEG−4のCELP符号化において示される。
ビットレートスケーラブル及び帯域幅スケーラブルオーディオ符号化との関連でビットレートの切り替えの問題に結び付けられた一番適切な参照するべき言及は、国際出願WO01/48931号明細書及びWO02/060075号明細書で構成され得る。
しかしながら、前述の2つの文書において説明された技術は、電話帯域符号化を使用する通信ネットワークと広帯域符号化を使用する通信ネットワークとの間のネットワーク間接続の問題のみに対処する。
特に、国際出願WO02/060075号明細書は、広帯域から電話帯域への変換のために最適化されたデシメーション(decimation)システムを説明する。
国際出願WO01/48931号明細書で提案された方法は、特に“スペクトルのプロファイル(spectral profile)”を抽出することによって、電話帯域信号から擬似広帯域信号を生成する帯域拡張技術である。従来技術の既知の類似した技術は、受信した電話帯域信号から広帯域信号を生成するための情報の伝送がない帯域拡張技術を使用して帯域の減少を回避しようとすることによって、主として広帯域から電話帯域への切り替えに結び付けられた問題に取り組む。それらの方法が実際に帯域幅の間の遷移を制御しようと試みないということ、そして、更にそれらが非常に変わりやすい品質の帯域拡張技術に依存するという欠点を有しているということ、そして、従ってそれらが安定した出力品質を保証し得ない、ということに注意が必要である。
従って、本発明の主題によって解決されるべき技術的な課題は、マルチレートオーディオ符号化システムによって符号化されたオーディオ信号を復号化する際のビットレートの切り替えの方法を提案することであり、前記復号化は、ビットレートに応じた少なくとも1つの後処理段階を含んでいると共に、復号化の際にビットレートの急速な変化が発生した場合に、特に敏感な副作用を消去するために、その方法は、それに関して使用される後処理が復号化ビットレートによって決まる、異なるビットレートの間の遷移が処理されることを可能にする。後処理は、信号に位相シフトを導入すると共に、後処理の2つの異なる形式の使用は、遷移の間の位相の連続性に関する問題を暗示する。
本発明によれば、提示された技術的課題に対する解決策は、初期のビットレートから最終のビットレートに対する切り替えの間に、前記方法が、前記初期のビットレートの信号から前記最終のビットレートの信号に対する連続的な変更の遷移段階を含み、前記信号の内の1つまたは両方が、後処理されることを特徴とする。
従って、本発明は、復号化がビットレートに応じた後処理を含むと共に、前記遷移段階の間に、初期のビットレートにおける後処理から最終のビットレートにおける後処理に対する連続的な変更が実行されるという利点を有する。本発明のこの特徴は、以下で詳細に説明されると共に、初期のビットレートで復号化されたオーディオ信号に適用された後処理においてクロスフェード(cross fade)を達成することに対応する。これは、復号化された信号が後処理される電話帯域と、一般的にオーディオ信号が後処理されない広帯域との間のビットレートの切り替えの際に特に有利であるということが理解され得る。
1つの特別な実施例において、前記連続的な変更は、初期のビットレートにおける信号の重みを減少させると共に、最終のビットレートにおける信号の重みを増加させる重み付けによって達成される。
更に、本発明は、初期のビットレートの信号及び最終のビットレートの信号の両方が後処理される状況をカバーする。
更に、本発明は、コンピュータプログラムであって、前記プログラムがコンピュータによって実行された場合に、本発明の方法を実行するためのコード命令を含むコンピュータプログラムを提供する。
本発明は、ビットレートスケーラブルオーディオ復号化システムに対する本発明の方法のアプリケーションを更に提供する。
本発明は、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ復号化システムに対する本発明の方法のアプリケーションであって、その中で、前記初期のビットレートが、第1の周波数帯域の第1の復号化階層で獲得され、前記最終のビットレートが、前記第1の周波数帯域を第2の周波数帯域に拡張する階層と見なされる第2の復号化階層で獲得されると共に、前記後処理段階が、前記初期のビットレートで実行される復号化に適用されることを特徴とするアプリケーションを更に提供する。
本発明は、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ復号化システムに対する本発明の方法のアプリケーションであって、その中で、前記最終のビットレートが、第1の周波数帯域の第1の復号化階層で獲得され、前記初期のビットレートが、前記第1の周波数帯域を第2の周波数帯域に拡張する階層と見なされる第2の復号化階層で獲得されると共に、前記後処理段階が、前記最終のビットレートで実行される復号化に適用されることを特徴とするアプリケーションを更に提供する。
“拡張された帯域”の特別な例は、上記で定義された“広帯域”であり、その場合に、前記第1の周波数帯域は、電話帯域である。
更に、本発明は、前記復号器が、ビットレートに応じた後処理ステージを備え、前記後処理ステージが、初期のビットレートから最終のビットレートへ切り替わる際に、前記初期のビットレートの信号から前記最終のビットレートの信号に対する連続的な変更による遷移を達成するように適合され、前記信号の内の少なくとも1が、後処理されるという点で特筆すべきマルチレートオーディオ復号器を提供する。
特に、前記後処理段階は、初期のビットレートにおける信号の重みを減少させると共に、最終のビットレートにおける信号の重みを増加させる重み付けによって、前記連続的な変更を達成するように適合される。
制限しない一例として提供される、添付の図面を参照した以下の説明は、本発明の本質的なものが何であり、それがどのように実行に移されることができるかを明瞭に説明する。
本発明は、ビットレートスケーラブル及び帯域幅スケーラブルオーディオ符号化との関連で説明される。ここで考えられるビットレートスケーラブル及び帯域幅スケーラブル符号化構造は、コアの復号化に電話帯域CELPタイプ符号器を使用すると共に、その特別な1つの事例は、“ITU-T Recommendation G.729, Coding of Speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP), March 1996”、及び“R. Salami et al., Description of ITU-T Recommendation G.729 Annex A: Reduced complexity 8 kbit/s CS-ACELP codec, ICASSP 1997”において説明されたような、G.729A符号器を使用する。
3つの拡張ステージ、すなわち電話帯域CELP符号化拡張ステージ、帯域拡張ステージ、及び予測変換符号化ステージが、CELPコア符号化に追加される。
ここで考察されたビットレートの切り替えは、電話帯域と広帯域との間の切り替えである。
図1は、使用される符号器の図である。
16[kHz]でサンプリングされた50[Hz]から7000[Hz]のオーディオ帯域を有するオーディオ信号は、320サンプルの20ミリセカンド(ms)のフレームに分割される。50[Hz]のカットオフ周波数を有するハイパスフィルタ処理101は、入力信号に適用される。獲得された信号“SWB”は、符号器の多くのブランチ回路で使用される。
最初に、第1のブランチ回路において、ローパスフィルタ処理及び16[kHz]から8[kHz]への係数“2”によるアンダーサンプリング(under sampling)102が、信号“SWB”に適用される。この操作は、8[kHz]でサンプリングされた電話帯域の信号を生成する。この信号は、CELPタイプの符号化を使用するコア符号器103によって処理される。ここで、その符号化は、ビットレート8[kbps]のビットストリームのコアを生成するG.729A符号器に対応する。
その次に、第1の拡張階層は、CELP符号化の第2のステージ103を導入する。この第2のステージの本質的なものは、CELP励振の拡張を達成すると共に、特に非有声音に対する品質強化を提供する革新者辞書(innovator dictionary)にある。この第2の符号化ステージのビットレートは、4[kbps]であると共に、関連するパラメータは、40サンプルの各サブフレーム(8[kHz]において5[ms])に対する関連する革新者辞書のパルスの符号と位置、及び利得である。
コア符号器及び第1の拡張階層の復号化104は、電話帯域における合成された12[kbps]信号を獲得するために実行される。8[kHz]から16[kHz]への係数“2”によるオーバーサンプリング(oversampling)及びローパスフィルタ処理105は、符号器の最初の2つのステージから、16[kHz]でサンプリングされたバージョンを生成する。
第3の拡張階層は、広帯域への帯域拡張106を達成する。入力信号“SWB”は、プリエンファシス(pre-emphasis)フィルタによって前処理(pre-process)されることができる。プリエンファシスフィルタは、広帯域の線形予測(linear prediction)フィルタから高周波数の更に良い表現を生成する。プリエンファシスフィルタの効果を補償するために、逆のディエンファシス(de-emphasis)フィルタが、その場合に、合成において使用される。この符号化及び復号化構造に対する代替物は、プリエンファシスフィルタ及びディエンファシスフィルタを使用しない。
以下の段階は、広帯域線形予測フィルタを計算して、量子化する。線形予測フィルタは、18次のフィルタであるが、しかしより低い予測次数、例えば16次の予測が選択されることができる。線形予測フィルタは、レビンソン・ダービンのアルゴリズム(Levinson-Durbin algorithm)を使用する自己相関方法によって計算され得る。
この広帯域線形予測フィルタ“AWB(z)”は、電話帯域コア符号器からのフィルタ
Figure 0005009910
が提供する係数の予測を用いて量子化される。その場合に、それらの係数は、論文“H. Ehara, T. Morii, M. Oshikiri, and K. Yoshida, Predictive VQ for bandwidth scalable LSP quantization, ICASSP 2005”において説明されたように、例えば、マルチステージベクトル量子化を使用すると共に、電話帯域コア符号器の逆量子化された(dequantized)LSF(線スペクトル周波数:line spectrum frequency)パラメータを使用して、量子化され得る。
広帯域励振は、コア符号器の電話帯域励振パラメータ、例えばピッチ期間遅延と、関連する利得と、コア符号器の代数の励振と、CELP励振の第1の拡張階層と、関連する利得とから獲得される。この励振は、電話帯域ステージの励振のパラメータのオーバーサンプリングされたバージョンを用いて生成される。
この広帯域励振は、その場合に、事前に計算された合成フィルタによってフィルタ処理される。もしプリエンファシスが入力信号に適用されていた場合、ディエンファシスフィルタが、合成フィルタの出力信号に適用される。獲得された信号は、エネルギーが調整されなかった広帯域信号である。高周波帯域(3400[Hz]〜7000[Hz])のエネルギーを均一にするための利得を計算するために、ハイパスフィルタ処理が、広帯域合成信号に適用される。これと並列に、同じハイパスフィルタ処理が、遅延されたオリジナル信号と先行する2つのステージの合成信号との間の差異に対応する誤差信号に適用される。これらの2つの信号は、その場合に、合成された広帯域信号に適用されるべき利得を計算するために使用される。この利得は、2つの信号の間のエネルギー比率を用いて計算される。量子化された利得“gWB”は、その次に、80サンプルのサブフレーム(16[kHz]の場合5[ms])のレベルの信号“S14 WB”に適用されると共に、このように獲得された信号は、その後、14[kbps]のビットレートに対応する広帯域信号を作成するために、先行するステージから提供される合成された信号に追加される。
符号化の残りは、予測変換符号化方式を使用する周波数領域にもたらされる。遅延された入力信号108、及び14[kbps]合成信号107は、一般的に“y=0.92”及び“μ=0.68”である“AWB(z/y)×(1−μz)”の知覚的重み付けフィルタ109、111によって、それぞれフィルタ処理される。これらの信号は、TDAC(time domain aliasing cancellation:時間領域折り返し歪み除去技術)オーバラップ変換符号化方式(overlap transform coding scheme)(“Y. Mahieux and J.P. Petit, Transform coding of audio signals at 64 kbit/s, IEEE GLOBECOM 1990”を参照)によって符号化される。
50[%]のオーバーラップの(MDCT解析のリフレッシュを20[ms]毎に行う)重み付けされた入力信号の640サンプルのブロックに対して、変形離散的コサイン変換(modified discrete cosine transform:MDCT)110が適用されると共に、同様に、先行する帯域拡張ステージが提供する14[kbps](同じブロック長で、同じオーバーラップ)の合成信号に対して、変形離散的コサイン変換(modified discrete cosine transform:MDCT)112が適用される。符号化されるべきMDCTスペクトル113は、0[Hz]から3400[Hz]の帯域に対する、重み付けされた入力信号と14[kbps]における合成信号との間の差異、及び3400[Hz]から7000[Hz]の帯域の重み付けされた入力信号に対応する。スペクトルは、最後の40個の係数をゼロに設定することによって(最初の280個の係数のみが符号化される)、7000[Hz]に制限される。スペクトルは、18個の帯域に分割されると共に、それは、8つの係数の1帯域と、16個の係数の17帯域である。スペクトルの各帯域に関して、MDCTの係数のエネルギーが計算される(倍率)。18個の倍率は、重み付けされた信号のスペクトル包絡線を構成すると共に、それは、その場合に、量子化されて、符号化されて、そしてフレームで送信される。図3は、ビットストリームのフォーマットを示す。
動的なビット割り当ては、スペクトル包絡線の逆量子化されたバージョンが提供するスペクトルの帯域のエネルギーに基づいている。これは、符号器の2進数の割り当てと復号器の2進数の割り当てとの間の互換性を達成する。各帯域における正規化された(微細構造)MDCT係数は、その場合に、サイズ及び長さでインタリーブされた辞書を使用するベクトル量子化によって量子化されると共に、辞書は、“["Vector quantization with variable dimension and resolution"], patent PCT FR 04 00219, 2004”で説明されるような、順列符号の組み合わせから構成される。最終的に、コア符号器、電話帯域CELP拡張ステージ、広帯域CELPステージ、そして最後にスペクトル包絡線と正規化された符号化係数に関する情報が、多重化されて、フレームで送信される。
図2は、図1が提供する符号器と関連付けられた復号器の構成図である。
モジュール201は、ビットストリームに含まれたパラメータを逆多重化する。1フレームで受信されたビットの数の関数として、復号化の複数の場合があると共に、図2を参照して、以下の4つの場合が説明される。
1.1つ目の場合は、8[kbps]の受信されたビットレートに対する、復号器による最小のビット数の受信に関係する。
この場合、第1のステージのみが復号化される。従って、CELP(G.729A+)タイプのコア復号器202に関するビットストリームのみが受信されると共に、復号化される。この合成は、G.729復号器による、適応型後フィルタ処理203及びハイパスフィルタ後処理204によって、処理されることができる。この実施例において、用語“後処理(post-processing)”は、これらの2つの操作の組み合わせのことを指す。しかしながら、用語“後処理(post-processing)”が、同様に、適応型後フィルタ処理だけ、またはハイパスフィルタ処理タイプの後処理だけのことを指し得ることは、明確である。この信号は、16[kHz]でサンプリングされた信号を生成するために、オーバーサンプリングされる(206)と共に、フィルタ処理される(207)。
2.2つ目の場合は、12[kbps]の受信されたビットレートに対する、第1及び第2の復号化ステージだけに関連するビット数の受信に関係する。
この場合には、コア復号器及び第1のCELP励振拡張ステージが復号化される。この合成は、G.729復号器による、後処理203、204によって、処理されることができる。前と同様に、この信号は、16[kHz]でサンプリングされた信号を生成するために、オーバーサンプルされる(206)と共に、フィルタ処理される(207)。
3.3つ目の場合は、14[kbps]の受信されたビットレートに対する、最初の3つの復号化ステージに関連するビット数の受信に対応する。
この場合には、後処理がCELP復号化出力には適用されないという事実は別として、上記2つ目の場合と同様に、最初の2つの復号化ステージが最初に達成されると共に、その後で、帯域拡張モジュールは、広帯域におけるスペクトル線の組のパラメータ(WB−LSF)を復号化した(209)後、励振と関連付けられた利得213と同様に、16[kHz]でサンプリングされた信号を生成する。広帯域励振は、コア符号器及び第1のCELP拡張ステージのパラメータから生成される(208)。この励振は、その場合に、合成フィルタ210と、もし符号器においてプリエンファシスフィルタが使用された場合には適切なディエンファシスフィルタ211によって、フィルタ処理される。ハイパスフィルタ212は、獲得された信号に適用されると共に、帯域拡張信号のエネルギーは、5[ms]毎に関連付けられた利得を用いて適合される(214)。この信号は、その場合に、最初の2つの復号化ステージから獲得される16[kHz]でサンプリングされた電話帯域信号215に加えられる。7000[Hz]に制限された信号を獲得する目的によって、この信号は、逆MDCT220及び重み付けされた合成フィルタ221の前に、最後の40個のMDCT係数をゼロに設定することによって、変換領域においてフィルタ処理される。
4.この最後の場合は、16[kbps]より大きいか、または16[kbps]に等しい受信されたビットレートに対する、復号器の全てのステージの復号化に対応する。
最終ステージは、予測変換復号器から構成される。上述のステップ3が最初に実行される。そして、受信された追加のビット数の関数として、予測変換復号化方式が適用される。
・もしビット数がスペクトル包絡線の一部分のみ、または受信された微細構造以外のスペクトル包絡線の全体に対応するならば、部分的な、もしくは完全なスペクトル包絡線が、帯域拡張ステージによって生成された信号215に対応する3400[Hz]から7000[Hz]の範囲において、MDCT係数(216、217)の帯域のエネルギーを調整するために使用される(218)。このシステムは、受信されたビット数の関数として、音質の進歩的な強化を達成する。
・もしビット数がスペクトル包絡線全体、及び微細構造の一部分または全体に対応するならば、ビット割り当ては、符号器におけるビット割り当てと同じ方法で達成される。微細構造が受信される帯域において、復号化されたMDCT係数は、スペクトル包絡線、及び逆量子化された微細構造から計算される。微細構造が受信されなかった範囲3400[Hz]から7000[Hz]におけるスペクトル帯域においては、前段落からの手順が使用され、すなわち、帯域の拡張によって獲得された信号から計算されたMDCT係数(216、217)は、受信されたスペクトル包絡線に基づいて、エネルギーが調整される(218)。合成のために使用されるMDCTスペクトルは、従って、0[Hz]と3400[Hz]との間の帯域では、復号化された誤差信号に加えられる最初の2つのステージにおける合成信号によって構成されると共に、そして更に、3400[Hz]から7000[Hz]の範囲の帯域上で、及び3400[Hz]から7000[Hz]の範囲の帯域に関しては、同様に、微細構造が受信された帯域において復号化されたMDCT係数と、他のスペクトル帯域に関してエネルギーが調整された帯域拡張ステージのMDCT係数とによって構成される。
逆MDCT220は、その場合に、復号化されたMDCT係数に適用されると共に、重み付けされた合成フィルタ221によるフィルタ処理が、出力信号を生成する。
本発明に従った切り替え方法は、図2で提供される復号器に照らして、以下で説明される。
ブロック205は、“クロスフェード(cross fade)”モジュールを表す。もし復号器によって受信されたビット数が、第1ステージ以外、または第1及び第2のステージを復号化するのに不十分であるならば、すなわち8[kbps]または12[kbps]の受信ビットレートに関して、復号器の最終出力の有効帯域幅は、電話帯域である。これらの状況において、合成信号の品質を強化するために、広い意味で“G.729A”復号器の一部分である後処理203、204が、オーバーサンプリングの前に、電話帯域において適用される。
対照的に、もし14[kps]より大きいかまたは等しい受信ビットレートに関して、広帯域ステージにおける復号化が同様に達成されるならば、符号器において、更に高いステージにおける符号化が、電話帯域の後処理なしのバージョンから計算されたので、この後処理は、活性化されない。
後処理203及び後処理204は、位相シフトを信号に導入する。後処理を備えるモードと後処理を備えないモードとの間の切り替えでは、従って、ソフトな遷移が実行されなければならない。図4は、クロスフェードを適用することによって、後処理された電話帯域信号と後処理されない電話帯域信号との間のこの遅い遷移を提供するブロック205の実装を示す。
ステップ401は、現在のフレームが電話帯域フレームであるか否かを調査、すなわち現在のフレームのビットレートが8[kbps]または12[kbps]であるか否かを確認する。否定応答の場合には、電話帯域において、先行するフレームが後処理されたか、または後処理されなかったかを確認するために、ステップ402が呼び出される(それは、結局、先行するフレームのビットレートが8[kbps]または12[kbps]であるか否かを確認することになる。)。否定応答の場合には、ステップ403において、後処理されなかった信号Sが、信号Sにコピーされる。対照的に、テスト402に対する肯定応答では、ステップ404において、信号Sは、クロスフェードの結果を含むことになり、ここでは、後処理されなかった成分Sの重みが増加される一方、後フィルタ処理された成分Sの重みが減少される。ステップ404の後には、フラグ“prevPF”を更新するステップ405が続いている。
ステップ401において肯定応答があるとき、ステップ406において、先行するフレームにおいて、電話帯域における後処理が活性化されていたか、または活性化されていなかったかに関して、確認が実行される。肯定応答の場合には、ステップ408において、後処理された信号Sが、信号Sにコピーされる。対照的に、ステップ406における否定応答の場合には、ステップ407において、信号Sが、クロスフェードの結果として計算され、ここでは、今度は、後処理されなかった成分Sの重みが減少される一方、後処理された成分Sの重みが増加される。ステップ407の後で、値“1”によってフラグ“prevPF”を更新するために、ステップ409が呼び出される。
この実施例の変形において、もし復号器によって受信されたビット数が、第1のステージのみ、または第1及び第2のステージが復号化されることを可能にするならば、すなわち8[kbps]または12[kbps]の受信ビットレートに関して、復号器の最終の出力の有効な帯域幅は、電話帯域(信号S)である。これらの状況において、合成信号の品質を強化するために、電話帯域における後処理が、オーバーサンプリングの前に適用される。
対照的に、もし広帯域ステージの復号化が、14[kbps]より大きいか、または14[kbps]に等しい受信ビットレートに関して、同様に実行されるならば、符号器において、異なる後処理(信号S)が活性化されると共に、更に高いステージの符号化が電話帯域のこの後処理によるバージョンから計算されていた。
8[kbps]または12[kbps]のビットレートに関して使用される後処理と、14[kbps]より大きいか、または14[kbps]に等しいビットレートに関して使用される後処理は、異なる位相シフトを信号に導入する。後処理の異なる形式を備えるモードの間の切り替えでは、従って、ソフトな遷移が実行されなければならない。後処理の様々な形式を有する電話帯域信号の間のこの遅い遷移は、クロスフェード(それは信号Sを生成する)を適用することによって達成される。
現在のフレームが電話帯域のフレームであるか否かが確認される。否定応答の場合には、先行するフレームが電話帯域のフレームであったか否かが確認される。否定応答の場合には、後処理された信号Sが、信号Sにコピーされる。対照的に、肯定応答の場合には、信号Sは、クロスフェードの結果を含むことになり、ここでは、後処理された成分Sの重みが増加される一方、後処理された成分Sの重みが減少される。
肯定応答があるとき、先行するフレームが電話帯域のフレームであったか否かが確認される。肯定応答の場合には、後処理された信号Sが、信号Sにコピーされる。対照的に、否定応答の場合には、信号Sが、クロスフェードの結果として計算され、ここでは、今度は、後処理された成分Sの重みが減少される一方、後処理された成分Sの重みが増加される。
ブロック209は、帯域拡張ステージ及び予測変換復号化ステージにとって必要な広帯域線形予測フィルタを計算する。もしフレームのビットストリームの電話帯域部分のみが受信されるならば、この計算が必要であると共に、広帯域フレームを受信した後で、帯域効果を維持するために帯域の拡張が必要とされる。“LSF”のセットは、その場合に、電話帯域コア復号器の“LSF”から推定される。例えば、8つの“LSF”は、電話帯域が提供する最後のLSFとナイキスト周波数との間の帯域にわたって一様に分散され得る。線形予測フィルタは、その場合に、高い周波数に関して平坦な振幅応答のフィルタである傾向があり得る。
ブロック213は、本発明による帯域拡張のために使用される利得適応を提供する。このブロックに対応するフローチャートは、図5及び図7を参照して説明される。
高周波数帯域に適用された利得の適応減衰の原理は、図5を参照して説明される。まず第一に、第1広帯域復号化階層(first wideband decoding layer)の利得は、2つの可能性に従って計算される(501)。もしこの帯域拡張階層に対応するビットストリームが受信されたならば、その利得は、復号化によって獲得される(503)。対照的に、もしこの利得がビットストリームにおいて得られなかったならば、この復号化階層と関連付けられた利得が推定される(502)。例えば、利得計算は、以前に実行された電話帯域の実際の復号化によって、広帯域復号化ステージのベースバンドのエネルギーを調整することにより実行され得る。
以前に受信された広帯域フレーム数のカウンタは、その場合に、図7を参照して説明された原理に従って更新される(504)。
最終的に、このカウンタは、第1広帯域復号化ステージの利得に適用された減衰のパラメータを設定するために使用される(505)。
図7は、受信された広帯域フレーム数の計数を管理するための手順のフローチャートを表す。カウンタは、以下の方法において更新される。もし現在のフレームが広帯域フレームであるならば、そして、もし第1広帯域復号化ステージに関連付けられた利得が受信されていた場合(図5におけるブロック501)、及び先行するフレームも同様に広帯域フレームである場合、その場合に、カウンタは、1つだけインクリメントされると共に、値“MAX_COUNT_RCV”で飽和状態になる。この値は、その間に、広帯域復号化信号が電話帯域ビットレートと広帯域ビットレートとの間で切り替わる間に減衰されることになるフレームの数に対応する。
対照的に、もし受信された現在のフレームが電話帯域のフレームであるならば、いくつかの可能な動作がある。もし先行するフレームが同様に電話帯域フレームであったならば、カウンタは、“0”に設定される。もしそうでなければ、そしてもし先行するフレームが広帯域フレームであり、更にカウンタが“MAX_COUNT_RCV”より小さい値を有するならば、カウンタは、同様に“0”に設定される。全ての他の状況において、カウンタは以前の値に留まる。
このフローチャートの機能は、図8の表において要約される。減衰係数によって使用される値は、“MAX_COUNT_RCV”が値“100”を有するとき、図9の表において示されると共に、このテーブルは、一例として提供される。電話帯域における復号化を拡張する段階に対応して、フレーム65まで減衰係数が“0”で保持される点に注意が必要である。固有の遷移段階が、減衰係数を次第に増加することによって、フレーム66から達成される。
図6を参照して説明されたように、ブロック219は、本発明に従った変換によって、予測符号化による強化階層の適応減衰を達成する。
この図は、予測変換復号化階層の適応減衰の手順のフローチャートである。第一に、この階層のスペクトル包絡線の全部が受信されたか否かが検証される(601)。もしそうであるならば、その場合に、0[Hz]〜3500[Hz]の低帯域補正MDCT補正係数は、受信された広帯域フレームのカウンタと図9の減衰表を使用して減衰される(602)。
そして、両方の場合において、受信された広帯域フレームの数が監視される(603)。もしその数が“MAX_COUNT_RCV”より少ない場合、情報の伝送による帯域拡張を備える第1広帯域復号化ステージに対応するMDCT係数は、予測変換復号化ステージのために使用される(605)。対照的に、もしカウンタが最大値を有するならば、その場合に、復号化されたスペクトル包絡線を有する予測変換復号化帯域のエネルギーを均一にするための手順が実行される(604)。
4階層のビットレートスケーラブル及び帯域幅スケーラブル符号器の図である。 図1が提供する符号器と関連付けられた本発明の復号器の図である。 図1の符号器と関連付けられたビットストリームの構造を示す図である。 本発明の復号器の電話帯域における後処理された信号と後処理されない信号との間の切り替えの方法のフローチャートである。 本発明による電話帯域と帯域拡張による広帯域との間の切り替えのための方法のフローチャートである。 本発明による電話帯域と予測変換復号化階層による広帯域との間の切り替えのための方法のフローチャートである。 本発明の方法による、ビットレートの間及び帯域の間の切り替えのための、受信された広帯域フレームの計数を管理するための手順のフローチャートである。 図7のフローチャートの動作を要約する表である。 電話帯域から広帯域への切り替えのための適応減衰係数を示す表である。
符号の説明
101 ハイパスフィルタ処理
102 アンダーサンプリング
103 コア符号器
104 第1の拡張階層の復号化
105 オーバーサンプリング及びローパスフィルタ処理
106 広帯域への帯域拡張
107 合成信号
108 遅延された入力信号
109、111 知覚的重み付けフィルタ
110、112 変形離散的コサイン変換(MDCT)
113 MDCTスペクトル
201 逆多重化モジュール
202 コア復号器
203 適応型後フィルタ処理
204 ハイパスフィルタ後処理
205 クロスフェードモジュール
206 オーバーサンプリング
207 フィルタ処理
208 広帯域励振生成
209 スペクトルエンベロープ復号化
210 合成フィルタ
211 ディエンファシスフィルタ
212 ハイパスフィルタ
213 利得適応ブロック
214 乗算
215 加算
216 知覚的重み付けフィルタ
217 MDCT
218 復号化及び逆量子化
219 適応減衰ブロック
220 逆MDCT
221 重み付けされた合成フィルタ

Claims (14)

  1. マルチレートオーディオ符号化システムによって符号化されたオーディオ信号の復号化の際のビットレートの切り替え方法であって、
    復号化信号から、第1信号及び第2信号と呼ばれる2つの信号が、クロスフェードモジュールの入力に供給され、前記2つの信号の内の少なくとも1つが後処理段階において後処理され、前記後処理が、異なるレートセットに適した後処理操作のセットの一部を形成すると共に、
    前記方法は、
    −第1のレートセットの中に含まれるレートにおける現在のフレームと第2のレートセットの中に含まれるレートにおける先行するフレームとの間のレートの切り替えを検出すると、出力信号を獲得するために、前記第2のレートセットに適した前記後処理に従って後処理がされた、または後処理がされなかった前記第2信号の重みを減らし、そして、前記第1のレートセットに適した前記後処理に従って後処理がされた、または後処理がされなかった前記第1信号の重みを増やすことによる重み付けによって、クロスフェード段階が実行され、
    −第2のレートセットの中に含まれるレートにおける現在のフレームと第1のレートセットの中に含まれるレートにおける先行するフレームとの間のレートの切り替えを検出すると、出力信号を獲得するために、前記第1のレートセットに適した前記後処理に従って後処理がされた、または後処理がされなかった前記第1信号の重みを減らし、そして、前記第2のレートセットに適した前記後処理に従って後処理がされた、または後処理がされなかった前記第2信号の重みを増やすことによる重み付けによって、クロスフェード段階が実行される
    ことを特徴とする方法。
  2. 前記後処理操作の内の1つが、ハイパスフィルタ処理である
    ことを特徴とする請求項1に記載の方法。
  3. 前記後処理操作の内の1つが、適応型後フィルタ処理である
    ことを特徴とする請求項1に記載の方法。
  4. 前記後処理操作の内の1つが、ハイパスフィルタ処理と適応型後フィルタ処理との組み合わせである
    ことを特徴とする請求項1に記載の方法。
  5. 前記クロスフェードモジュールの入力における単一の信号が後処理される
    ことを特徴とする請求項1に記載の方法。
  6. 前記クロスフェードモジュールの入力における2つの信号が異なるレートセットに適した異なる後処理操作によって後処理される
    ことを特徴とする請求項1に記載の方法。
  7. 請求項1から請求項6のいずれか一項に記載のビットレートの切り替え方法を実行することを特徴とするオーディオ信号のオーディオビットレートスケーラブル復号化システム。
  8. 請求項1から請求項6のいずれか一項に記載のビットレートの切り替え方法を実行するオーディオビットレートスケーラブル及び帯域幅スケーラブル復号化システムであって、
    前記システムが、
    その中で第1のレートが第1の周波数帯域で獲得される第1の復号化手段と、
    その中で第2のレートが獲得され、前記第1の周波数帯域を第2の周波数帯域に拡張する手段として見なされる第2の復号化手段と
    を備えることを特徴とするオーディオビットレートスケーラブル及び帯域幅スケーラブル復号化システム。
  9. マルチレートオーディオ復号器であって、
    前記復号器が、復号化信号から獲得された第1信号と第2信号を入力として受け取るクロスフェードモジュールを備え、前記2つの信号の内の少なくとも1つが、異なるレートセットに適した後処理操作のセットが提供する後処理を受けると共に、
    前記クロスフェードモジュールは、
    −第1のレートセットの中に含まれるレートにおける現在のフレームと第2のレートセットの中に含まれるレートにおける先行するフレームとの間のレートの切り替えを検出すると、前記クロスフェードモジュールからの出力信号を獲得するために、前記第2のレートセットに適した前記後処理操作に従って後処理がされた、または後処理がされなかった前記第2信号の重みを減らし、そして、前記第1のレートセットに適した前記後処理操作に従って後処理がされた、または後処理がされなかった前記第1信号の重みを増やすことによる重み付けによって、クロスフェードを実行することができ、
    −第2のレートセットの中に含まれるレートにおける現在のフレームと第1のレートセットの中に含まれるレートにおける先行するフレームとの間のレートの切り替えを検出すると、前記クロスフェードモジュールからの出力信号を獲得するために、前記第1のレートセットに適した前記後処理操作に従って後処理がされた、または後処理がされなかった前記第1信号の重みを減らし、そして、前記第2のレートセットに適した前記後処理操作に従って後処理がされた、または後処理がされなかった前記第2信号の重みを増やすことによる重み付けによって、クロスフェードを実行することができる
    ことを特徴とするマルチレートオーディオ復号器。
  10. 前記後処理操作の内の少なくとも1つが、ハイパスフィルタ処理である
    ことを特徴とする請求項9に記載の復号器。
  11. 前記後処理操作の内の少なくとも1つが、適応型後フィルタ処理である
    ことを特徴とする請求項9に記載の復号器。
  12. 前記後処理操作の内の少なくとも1つが、ハイパスフィルタ処理と適応型後フィルタ処理との組み合わせである
    ことを特徴とする請求項9に記載の復号器。
  13. 前記クロスフェードモジュールの入力における単一の信号が後処理される
    ことを特徴とする請求項9に記載の復号器。
  14. 前記クロスフェードモジュールの入力における2つの信号が異なるレートセットに適した異なる後処理操作によって後処理される
    ことを特徴とする請求項9に記載の復号器。
JP2008522028A 2005-07-22 2006-07-10 レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 Expired - Fee Related JP5009910B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0552286 2005-07-22
FR0552286 2005-07-22
PCT/FR2006/050697 WO2007010158A2 (fr) 2005-07-22 2006-07-10 Procede de commutation de debit en decodage audio scalable en debit et largeur de bande

Publications (3)

Publication Number Publication Date
JP2009503559A JP2009503559A (ja) 2009-01-29
JP2009503559A5 JP2009503559A5 (ja) 2012-01-05
JP5009910B2 true JP5009910B2 (ja) 2012-08-29

Family

ID=36177265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008522028A Expired - Fee Related JP5009910B2 (ja) 2005-07-22 2006-07-10 レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法

Country Status (10)

Country Link
US (1) US8630864B2 (ja)
EP (1) EP1907812B1 (ja)
JP (1) JP5009910B2 (ja)
KR (1) KR101295729B1 (ja)
CN (1) CN101263554B (ja)
AT (1) ATE490454T1 (ja)
DE (1) DE602006018618D1 (ja)
ES (1) ES2356492T3 (ja)
RU (1) RU2419171C2 (ja)
WO (1) WO2007010158A2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US20100076755A1 (en) * 2006-11-29 2010-03-25 Panasonic Corporation Decoding apparatus and audio decoding method
US8599981B2 (en) 2007-03-02 2013-12-03 Panasonic Corporation Post-filter, decoding device, and post-filter processing method
EP2132732B1 (en) * 2007-03-02 2012-03-07 Telefonaktiebolaget LM Ericsson (publ) Postfilter for layered codecs
EP2128858B1 (en) * 2007-03-02 2013-04-10 Panasonic Corporation Encoding device and encoding method
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
WO2009056027A1 (fr) * 2007-11-02 2009-05-07 Huawei Technologies Co., Ltd. Procédé et dispositif de décodage audio
US9872066B2 (en) * 2007-12-18 2018-01-16 Ibiquity Digital Corporation Method for streaming through a data service over a radio link subsystem
DE102008009720A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
WO2010003556A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US20100057473A1 (en) * 2008-08-26 2010-03-04 Hongwei Kong Method and system for dual voice path processing in an audio codec
US20100063825A1 (en) * 2008-09-05 2010-03-11 Apple Inc. Systems and Methods for Memory Management and Crossfading in an Electronic Device
CN102216982A (zh) * 2008-09-18 2011-10-12 韩国电子通信研究院 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP5489900B2 (ja) * 2010-07-27 2014-05-14 ヤマハ株式会社 音響データ通信装置
NO2669468T3 (ja) * 2011-05-11 2018-06-02
RU2480904C1 (ru) * 2012-06-01 2013-04-27 Анна Валерьевна Хуторцева Способ совместной фильтрации и дифференциальной импульсно-кодовой модуляции-демодуляции сигналов
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
RU2633107C2 (ru) * 2012-12-21 2017-10-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Добавление комфортного шума для моделирования фонового шума при низких скоростях передачи данных
EP3503095A1 (en) * 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
KR102244612B1 (ko) 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP3217612A4 (en) * 2014-04-21 2017-11-22 Samsung Electronics Co., Ltd. Device and method for transmitting and receiving voice data in wireless communication system
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
AU2018337086B2 (en) 2017-09-20 2023-06-01 Voiceage Corporation Method and device for allocating a bit-budget between sub-frames in a CELP codec
BR112020008223A2 (pt) 2017-10-27 2020-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. decodificador para decodificação de um sinal de domínio de frequência definido em um fluxo de bits, sistema que compreende um codificador e um decodificador, métodos e unidade de armazenamento não transitório que armazena instruções
WO2022009505A1 (ja) * 2020-07-07 2022-01-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、復号方法、及び、ハイブリッド符号化システム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728494A (ja) * 1993-07-09 1995-01-31 Nippon Steel Corp 圧縮符号化音声信号復号化方法および装置
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US7145898B1 (en) * 1996-11-18 2006-12-05 Mci Communications Corporation System, method and article of manufacture for selecting a gateway of a hybrid communication system architecture
US6904110B2 (en) * 1997-07-31 2005-06-07 Francois Trans Channel equalization system and method
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
JP2000259195A (ja) * 1999-01-08 2000-09-22 Matsushita Electric Ind Co Ltd デコード回路及びそれを用いた再生装置
JP2000267686A (ja) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd 信号伝送方式及び復号化装置
US6496794B1 (en) * 1999-11-22 2002-12-17 Motorola, Inc. Method and apparatus for seamless multi-rate speech coding
GB2357682B (en) 1999-12-23 2004-09-08 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US6590833B1 (en) * 2002-08-08 2003-07-08 The United States Of America As Represented By The Secretary Of The Navy Adaptive cross correlator
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
CN102113346B (zh) * 2008-07-29 2013-10-30 杜比实验室特许公司 用于电声通道的自适应控制和均衡的方法
US8924222B2 (en) * 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals

Also Published As

Publication number Publication date
KR101295729B1 (ko) 2013-08-12
RU2008106750A (ru) 2009-08-27
DE602006018618D1 (de) 2011-01-13
CN101263554A (zh) 2008-09-10
US20090306992A1 (en) 2009-12-10
WO2007010158A3 (fr) 2007-05-10
EP1907812B1 (fr) 2010-12-01
US8630864B2 (en) 2014-01-14
ES2356492T3 (es) 2011-04-08
ATE490454T1 (de) 2010-12-15
WO2007010158A2 (fr) 2007-01-25
KR20080033997A (ko) 2008-04-17
CN101263554B (zh) 2011-12-28
RU2419171C2 (ru) 2011-05-20
JP2009503559A (ja) 2009-01-29
EP1907812A2 (fr) 2008-04-09

Similar Documents

Publication Publication Date Title
JP5009910B2 (ja) レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
JP5149198B2 (ja) 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス
RU2469419C2 (ru) Способ и устройство для управления сглаживанием стационарного фонового шума
KR101092167B1 (ko) 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩
KR100956523B1 (ko) 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치
RU2584463C2 (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
WO2010028297A1 (en) Selective bandwidth extension
JP5097219B2 (ja) 非因果性ポストフィルタ
JP2004287397A (ja) 相互使用可能なボコーダ
CA2392640A1 (en) A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
KR101462293B1 (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
JP5457171B2 (ja) オーディオデコーダ内で信号を後処理する方法
CN105765653B (zh) 自适应高通后滤波器
US20100063801A1 (en) Postfilter For Layered Codecs
Sinder et al. Recent speech coding technologies and standards
Gibson Speech coding for wireless communications
Ogunfunmi et al. Scalable and Multi-Rate Speech Coding for Voice-over-Internet Protocol (VoIP) Networks
Lefebvre et al. Speech coders
Herre et al. 18. Perceptual Perceptual Audio Coding of Speech Signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees