Nothing Special   »   [go: up one dir, main page]

JP5089394B2 - 音声符号化装置および音声符号化方法 - Google Patents

音声符号化装置および音声符号化方法 Download PDF

Info

Publication number
JP5089394B2
JP5089394B2 JP2007537696A JP2007537696A JP5089394B2 JP 5089394 B2 JP5089394 B2 JP 5089394B2 JP 2007537696 A JP2007537696 A JP 2007537696A JP 2007537696 A JP2007537696 A JP 2007537696A JP 5089394 B2 JP5089394 B2 JP 5089394B2
Authority
JP
Japan
Prior art keywords
spectrum
encoding
unit
layer
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007537696A
Other languages
English (en)
Other versions
JPWO2007037361A1 (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007537696A priority Critical patent/JP5089394B2/ja
Publication of JPWO2007037361A1 publication Critical patent/JPWO2007037361A1/ja
Application granted granted Critical
Publication of JP5089394B2 publication Critical patent/JP5089394B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声符号化装置および音声符号化方法に関する。
移動体通信システムにおける電波資源等を有効に利用するために、音声信号を低ビットレートで圧縮することが要求されている。
一方で、通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現のためには、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声信号以外の信号をも高品質に符号化できることが望ましい。
このように相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤと、入力信号と第1レイヤ復号信号の差分信号を音声以外の信号にも適したモデルで符号化する第2レイヤとを階層的に組み合わせるアプローチである。このような階層構造を持つ符号化方式は、符号化されたビットストリームの一部を廃棄しても残りの情報から復号信号が得られる特徴(スケーラビリティ性)を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化は、この特徴から、ビットレートが互いに異なるネットワーク間の通信にも柔軟に対応することができる。また、この特徴は、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものといえる。
従来のスケーラブル符号化としては、MPEG−4(Moving Picture Experts Group phase-4)にて規格化された技術を用いるものがある(例えば非特許文献1参照)。非特許文献1記載のスケーラブル符号化では、音声信号に適したCELP(Code Excited Linear Prediction;符号励信線形予測)を第1レイヤに用い、原信号から第1レイヤ復号信号を減じて得られる残差信号に対する符号化としてAAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization)のような変換符号化を第2レイヤに用いる。
一方、変換符号化において、効率良くスペクトルを符号化する技術がある(例えば特許文献1参照)。特許文献1記載の技術では、音声信号の周波数帯域を低域部と高域部の2つのサブバンドに分割し、低域部のスペクトルを高域部に複製し、複製後のスペクトルに変形を加えて高域部のスペクトルとする。このとき、変形情報を少ないビット数で符号化することにより、低ビットレート化を図ることができる。
三木弼一編著,MPEG-4の全て,初版,(株)工業調査会,1998年9月30日,pp.126-127 特表2001−521648号公報
一般に、音声信号やオーディオ信号のスペクトルは、周波数と共に緩やかに変化する成分(スペクトル包絡)と細かく変化する成分(スペクトル微細構造)との積で表される。一例として、図1に音声信号のスペクトル、図2にスペクトル包絡、図3にスペクトル微細構造を示す。このスペクトル包絡(図2)は、10次のLPC(Linear Prediction Coding)係数を用いて算出したものである。これらの図から、スペクトル包絡(図2)とスペクトル微細構造(図3)との積が、音声信号のスペクトル(図1)になっていることが
分かる。
ここで、低域部のスペクトルを複製して高域部のスペクトルとする場合、複製元である低域部の帯域幅よりも複製先である高域部の帯域幅が広い場合には、低域部のスペクトルを2回以上高域部に複製することになる。例えば、図1の低域部(0−FL)から高域部(FL−FH)にスペクトルを複製する場合、この例ではFH=2*FLの関係があるため、低域部のスペクトルを高域部に2回複製する必要がある。このように低域部のスペクトルを高域部に複数回複製すると、図4に示すように、複製先のスペクトルの接続部においてスペクトルのエネルギーの不連続が生じてしまう。このような不連続が発生する原因は、スペクトル包絡にある。図2に示すように、スペクトル包絡では周波数が上がると共にエネルギーが減衰するため、スペクトルに傾きが生じる。このようなスペクトルの傾きの存在により、低域部のスペクトルを高域部に複数回複製すると、スペクトルのエネルギーの不連続が発生し、音声品質が劣化してしまう。この不連続をゲイン調整により補正することは可能であるが、ゲイン調整にて十分な効果を得るには多くのビット数を必要としてしまう。
本発明の目的は、低域部のスペクトルを高域部に複数回複製する場合でも、スペクトルのエネルギーの連続性を保ち、音声品質の劣化を防ぐことができる音声符号化装置および音声符号化方法を提供することである。
本発明の音声符号化装置は、音声信号の低域部のスペクトルを符号化する第1符号化手段と、前記音声信号のLPC係数を用いて前記低域部のスペクトルを平坦化する平坦化手段と、平坦化された低域部のスペクトルを用いて前記音声信号の高域部のスペクトルを符号化する第2符号化手段と、を具備する構成を採る。
本発明によれば、スペクトルのエネルギーの連続性を保ち、音声品質の劣化を防ぐことができる。
本発明では、低域部のスペクトルを利用して高域部を符号化するにあたり、低域部のスペクトルからスペクトル包絡の影響を取り除いてスペクトルを平坦化し、平坦化したスペクトルを用いて高域部のスペクトルを符号化する。
まず、本発明の動作原理について図5A〜Dを用いて説明する。
図5A〜Dにおいて、FLを閾値周波数として、0−FLを低域部、FL−FHを高域部とする。
図5Aは、従来の符号化/復号化処理によって得られる低域部の復号スペクトルを表し、図5Bは、図5Aに示す復号スペクトルをスペクトル包絡と逆の特性を持つ逆フィルタに通すことにより得られるスペクトルを示す。このように、低域部の復号スペクトルをスペクトル包絡と逆の特性を持つ逆フィルタに通すことにより、低域部のスペクトルの平坦化がなされる。そして、図5Cに示すように、平坦化された低域部のスペクトルを高域部に複数回(ここでは2回)複製し、高域部を符号化する。既に図5Bに示すように低域部のスペクトルが平坦化されているため、高域部の符号化では、上記のようなスペクトル包絡に起因するスペクトルのエネルギーの不連続は発生しない。そして、信号帯域が0−FHに拡張されたスペクトルに対してスペクトル包絡を付与することにより、図5Dに示すような復号信号のスペクトルが得られる。
なお、高域部の符号化方法としては、低域部のスペクトルをピッチフィルタの内部状態に用い、周波数軸上で低い周波数から高い周波数に向かってピッチフィルタ処理を行ってスペクトルの高域部を推定する方法を用いることができる。この符号化方法によれば、高域部の符号化では、ピッチフィルタのフィルタ情報を符号化すればよいため、低ビットレート化を図ることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
本実施の形態では、第1レイヤおよび第2レイヤの双方において周波数領域での符号化
を行う場合について説明する。また、本実施の形態では、低域部のスペクトルの平坦化を行った後に、平坦化後のスペクトルを繰り返し利用して高域部のスペクトルを符号化する。
図6に、本発明の実施の形態1に係る音声符号化装置の構成を示す。
図6に示す音声符号化装置100において、LPC分析部101は、入力音声信号のLPC分析を行い、LPC係数α(i)(1≦i≦NP)を算出する。ここで、NPはLPC係数の次数を表し、例えば10〜18が選択される。算出されたLPC係数は、LPC量子化部102に入力される。
LPC量子化部102は、LPC係数の量子化を行う。LPC量子化部102は、量子化効率や安定性判定の観点から、LPC係数をLSP(Line Spectral Pair)パラメータに変換した後に量子化する。量子化後のLPC係数は符号化データとしてLPC復号化部103および多重化部109に入力される。
LPC復号化部103は、量子化後のLPC係数を復号して復号LPC係数α(i)(1≦i≦NP)を生成し、逆フィルタ部104に出力する。
逆フィルタ部104は、復号LPC係数を用いて逆フィルタを構成し、この逆フィルタに入力音声信号を通すことにより、入力音声信号のスペクトルを平坦化する。
逆フィルタは式(1)または式(2)のように表される。式(2)は、平坦化の程度を制御する共振抑圧係数γ(0<γ<1)を利用した場合の逆フィルタである。
Figure 0005089394
Figure 0005089394
そして、式(1)で表される逆フィルタに音声信号s(n)を入力したときに得られる出力信号e(n)は、式(3)のように表される。
Figure 0005089394
同様に、式(2)で表される逆フィルタに音声信号s(n)を入力したときに得られる出力信号e(n)は、式(4)のように表される。
Figure 0005089394
よって、この逆フィルタ処理により入力音声信号のスペクトルが平坦化される。なお、以下の説明では、逆フィルタ部104の出力信号(スペクトルが平坦化された音声信号)を予測残差信号と呼ぶ。
周波数領域変換部105は、逆フィルタ部104から出力される予測残差信号の周波数分析を行い、変換係数として残差スペクトルを求める。周波数領域変換部105は
、例えば、MDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を用いて時間領域の信号を周波数領域の信号に変換する。残差スペクトルは第1レイヤ符号化部106および第2レイヤ符号化部108に入力される。
第1レイヤ符号化部106は、TwinVQ等を用いて残差スペクトルの低域部の符号化を行い、この符号化にて得られる第1レイヤ符号化データを第1レイヤ復号化部107および多重化部109に出力する。
第1レイヤ復号化部107は、第1レイヤ符号化データの復号を行って第1レイヤ復号スペクトルを生成し、第2レイヤ符号化部108に出力する。なお、第1レイヤ復号化部107は、時間領域に変換される前の第1レイヤ復号スペクトルを出力する。
第2レイヤ符号化部108は、第1レイヤ復号化部107で得られた第1レイヤ復号スペクトルを用いて、残差スペクトルの高域部の符号化を行い、この符号化にて得られる第2レイヤ符号化データを多重化部109に出力する。第2レイヤ符号化部108は、第1レイヤ復号スペクトルをピッチフィルタの内部状態に用い、ピッチフィルタリング処理により残差スペクトルの高域部を推定する。この際、第2レイヤ符号化部108は、スペクトルのハーモニクス構造を崩さないように残差スペクトルの高域部を推定する。また、第2レイヤ符号化部108は、ピッチフィルタのフィルタ情報を符号化する。さらに、第2レイヤ符号化部108では、スペクトルが平坦化された残差スペクトルを用いて残差スペクトルの高域部を推定する。このため、フィルタリング処理により再帰的にスペクトルが繰り返し使用されて高域部が推定されても、スペクトルのエネルギーの不連続の発生を防ぐことができる。よって、本実施の形態によれば、低ビットレートで高音質を得ることができる。なお、第2レイヤ符号化部108の詳細については後述する。
多重化部109は、第1レイヤ符号化データ、第2レイヤ符号化データおよびLPC係数符号化データを多重化してビットストリームを生成し、出力する。
次いで、第2レイヤ符号化部108の詳細について説明する。図7に、第2レイヤ符号化部108の構成を示す。
内部状態設定部1081には、第1レイヤ復号化部107より第1レイヤ復号スペクトルS1(k)(0≦k<FL)が入力される。内部状態設定部1081は、この第1レイヤ復号スペクトルを用いて、フィルタリング部1082で用いられるフィルタの内部状態を設定する。
ピッチ係数設定部1084は、探索部1083からの制御に従ってピッチ係数Tを予め定められた探索範囲Tmin〜Tmaxの中で少しずつ変化させながら、フィルタリング部1082に順次出力する。
フィルタリング部1082は、内部状態設定部1081で設定されたフィルタの内部状態と、ピッチ係数設定部1084から出力されるピッチ係数Tとに基づいて第1レイヤ復号スペクトルのフィルタリングを行い、残差スペクトルの推定値S2'(k)を算出する。このフィルタリング処理の詳細については後述する。
探索部1083は、周波数領域変換部105から入力される残差スペクトルS2(k)(0≦k<FH)とフィルタリング部1082から入力される残差スペクトルの推定値S
2'(k)との類似性を示すパラメータである類似度を算出する。この類似度の算出処理は、ピッチ係数設定部1084からピッチ係数Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数(最適なピッチ係数)T’(Tmin〜Tmaxの範囲)が多重化部1086に出力される。また、探索部1083は、このピッチ係数T’を用いて生成される残差スペクトルの推定値S2'(k)をゲイン符号化部1085に出力する。
ゲイン符号化部1085は、周波数領域変換部105から入力される残差スペクトルS2(k)(0≦k<FH)に基づいて残差スペクトルS2(k)のゲイン情報を算出する。なお、ここでは、このゲイン情報をサブバンド毎のスペクトルパワで表し、周波数帯域FL≦k<FHをJ個のサブバンドに分割する場合を例にとって説明する。このとき、第jサブバンドのスペクトルパワB(j)は式(5)で表される。式(5)において、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。このようにして求めた残差スペクトルのサブバンド情報を残差スペクトルのゲイン情報とみなす。
Figure 0005089394
また、ゲイン符号化部1085は、同様に、残差スペクトルの推定値S2'(k)のサブバンド情報B’(j)を式(6)に従い算出し、サブバンド毎の変動量V(j)を式(7)に従い算出する。
Figure 0005089394
Figure 0005089394
次に、ゲイン符号化部1085は、変動量V(j)を符号化して符号化後の変動量V(j)を求め、そのインデックスを多重化部1086に出力する。
多重化部1086は、探索部1083から入力される最適なピッチ係数T’とゲイン符号化部1085から入力される変動量V(j)のインデックスとを多重化して、第2レイヤ符号化データとして多重化部109に出力する。
次いで、フィルタリング部1082でのフィルタリング処理の詳細について説明する。図8に、フィルタリング部1082が、ピッチ係数設定部1084から入力されるピッチ係数Tを用いて、帯域FL≦k<FHのスペクトルを生成する様子を示す。ここでは、全周波数帯域(0≦k<FH)のスペクトルを便宜的にS(k)と呼び、フィルタ関数は式(8)で表されるものを使用する。この式において、Tはピッチ係数設定部1084より与えられたピッチ係数を表しており、またM=1とする。
Figure 0005089394
S(k)の0≦k<FLの帯域には、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態として格納される。一方、S(k)のFL≦k<FHの帯域には、以下の手順により求められた残差スペクトルの推定値S2'(k)が格納される。
S2'(k)には、フィルタリング処理により、kよりTだけ低い周波数のスペクトルS(k−T)に、このスペクトルを中心としてiだけ離れた近傍のスペクトルS(k−T−i)に所定の重み付け係数βを乗じたスペクトルβ・S(k−T−i)を全て加算したスペクトル、すなわち、式(9)により表されるスペクトルが代入される。そしてこの演算を、周波数の低い方(k=FL)から順にkをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける残差スペクトルの推定値S2'(k)が算出される。
Figure 0005089394
以上のフィルタリング処理は、ピッチ係数設定部1084からピッチ係数Tが与えられる度に、FL≦k<FHの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部1083に出力される。
ここで、図8に示す例では、ピッチ係数Tの大きさが帯域FL−FHより小さいため、高域部(FL≦k<FH)のスペクトルは低域部(0≦k<FL)のスペクトルを再帰的に用いて生成される。低域部のスペクトルは上記のように平坦化されているため、フィルタリング処理により低域部のスペクトルを再帰的に用いて高域部のスペクトルが生成される場合でも、高域部のスペクトルにはエネルギーの不連続が生じることがない。
このように、本実施の形態によれば、スペクトル包絡の影響により高域部で発生していたスペクトルのエネルギーの不連続を防ぐことができ、音声品質を改善することができる。
次いで、本実施の形態に係る音声復号化装置について説明する。図9に、本発明の実施の形態1に係る音声復号化装置の構成を示す。この音声復号化装置200は、図6に示す音声符号化装置100から送信されるビットストリームを受信するものである。
図9に示す音声復号化装置200において、分離部201は、図6に示す音声符号化装置100から受信されたビットストリームを、第1レイヤ符号化データ、第2レイヤ符号化データおよびLPC係数に分離して、第1レイヤ符号化データを第1レイヤ復号化部202に、第2レイヤ符号化データを第2レイヤ復号化部203に、LPC係数をLPC復号化部204に出力する。また、分離部201は、レイヤ情報(ビットストリームにどのレイヤの符号化データが含まれるかを表す情報)を判定部205に出力する。
第1レイヤ復号化部202は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号スペクトルを生成し、第2レイヤ復号化部203および判定部205に出力する。
第2レイヤ復号化部203は、第2レイヤ符号化データと第1レイヤ復号スペクトルとを用いて、第2レイヤ復号スペクトルを生成し判定部205に出力する。なお、第2レイヤ復号化部203の詳細については後述する。
LPC復号化部204は、LPC係数符号化データを復号して得た復号LPC係数を合成フィルタ部207に出力する。
ここで、音声符号化装置100は、ビットストリームに第1レイヤ符号化データと第2レイヤ符号化データの双方を含めて送信するが、通信経路の途中で第2レイヤ符号化データが廃棄される場合がある。そこで、判定部205は、レイヤ情報に基づき、ビットストリームに第2レイヤ符号化データが含まれているか否か判定する。そして、判定部205は、ビットストリームに第2レイヤ符号化データが含まれていない場合は、第2レイヤ復号化部203によって第2レイヤ復号スペクトルが生成されないため、第1レイヤ復号スペクトルを時間領域変換部206に出力する。但し、この場合、第2レイヤ符号化データが含まれている場合の復号スペクトルと次数を一致させるために、判定部205は、第1レイヤ復号スペクトルの次数をFHまで拡張し、FL−FHのスペクトルを0として出力する。一方、ビットストリームに第1レイヤ符号化データおよび第2レイヤ符号化データの双方が含まれている場合は、判定部205は、第2レイヤ復号スペクトルを時間領域変換部206に出力する。
時間領域変換部206は、判定部205から入力される復号スペクトルを時間領域の信号に変換して復号残差信号を生成し、合成フィルタ部207に出力する。
合成フィルタ部207は、LPC復号化部204から入力される復号LPC係数α(i)(1≦i<NP)を用いて合成フィルタを構成する。
合成フィルタH(z)は式(10)または式(11)のように表される。なお、式(11)においてγ(0<γ<1)は共振抑圧係数を表す。
Figure 0005089394
Figure 0005089394
そして、時間領域変換部206にて与えられる復号残差信号をe(n)として合成フィルタ部207へ入力すれば、式(10)で表される合成フィルタを用いた場合、出力される復号信号s(n)は式(12)のように表される。
Figure 0005089394
同様に、式(11)で表される合成フィルタを用いた場合、復号信号s(n)は式(13)のように表される。
Figure 0005089394
次いで、第2レイヤ復号化部203の詳細について説明する。図10に、第2レイヤ復号化部203の構成を示す。
内部状態設定部2031には、第1レイヤ復号化部202より第1レイヤ復号スペクトルが入力される。内部状態設定部2031は、第1レイヤ復号スペクトルS1(k)を用いて、フィルタリング部2033で用いられるフィルタの内部状態を設定する。
一方、分離部2032には、分離部201より第2レイヤ符号化データが入力される。分離部2032は、第2レイヤ符号化データをフィルタリング係数に関する情報(最適なピッチ係数T’)とゲインに関する情報(変動量V(j)のインデックス)とに分離し、フィルタリング係数に関する情報をフィルタリング部2033に出力するとともに、ゲインに関する情報をゲイン復号化部2034に出力する。
フィルタリング部2033は、内部状態設定部2031で設定されたフィルタの内部状態と、分離部2032から入力されるピッチ係数T’とに基づき第1レイヤ復号スペクトルS1(k)のフィルタリングを行い、残差スペクトルの推定値S2'(k)を算出する。フィルタリング部2033では、式(8)で示すフィルタ関数が用いられる。
ゲイン復号化部2034は、分離部2032から入力されるゲイン情報を復号し、変動量V(j)を符号化して得られる変動量V(j)を求める。
スペクトル調整部2035は、フィルタリング部2033から入力される復号スペクトルS'(k)に、ゲイン復号化部2034から入力される復号されたサブバンド毎の変動量V(j)を式(14)に従い乗じることにより、復号スペクトルS'(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、調整後の復号スペクトルS3(k)を生成する。この調整後の復号スペクトルS3(k)は、第2レイヤ復号スペクトルとして判定部205に出力される。
Figure 0005089394
このようにして、音声復号化装置200は、図6に示す音声符号化装置100から送信されたビットストリームを復号することができる。
(実施の形態2)
本実施の形態では、第1レイヤにおいて時間領域での符号化(例えばCELP符号化)を行う場合について説明する。また、本実施の形態では、第1レイヤでの符号化処理中に求められる復号LPC係数を用いて第1レイヤ復号信号のスペクトルの平坦化を行う。
図11に、本発明の実施の形態2に係る音声符号化装置の構成を示す。図11において、実施の形態1(図6)と同一の構成部分には同一符号を付し、説明を省略する。
図11に示す音声符号化装置300において、ダウンサンプリング部301は、入力音声信号のサンプリングレートをダウンサンプリングして、所望のサンプリングレートの音声信号を第1レイヤ符号化部302に出力する。
第1レイヤ符号化部302は、所望のサンプリングレートにダウンサンプリングされた音声信号に対して符号化処理を行って第1レイヤ符号化データを生成し、第1レイヤ復号化部303および多重化部109に出力する。第1レイヤ符号化部302は、例えば、CELP符号化を用いる。第1レイヤ符号化部302が、CELP符号化のようにLPC係
数の符号化処理を行う場合は、その符号化処理中に復号LPC係数を生成することができる。そこで、第1レイヤ符号化部302は、符号化処理中に生成される第1レイヤ復号LPC係数を逆フィルタ部304に出力する。
第1レイヤ復号化部303は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号信号を生成し、逆フィルタ部304に出力する。
逆フィルタ部304は、第1レイヤ符号化部302から入力される第1レイヤ復号LPC係数を用いて逆フィルタを構成し、この逆フィルタに第1レイヤ復号信号を通すことにより、第1レイヤ復号信号のスペクトルを平坦化する。なお、逆フィルタの詳細については実施の形態1と同様であるため説明を省略する。また、以下の説明では、逆フィルタ部304の出力信号(スペクトルが平坦化された第1レイヤ復号信号)を第1レイヤ復号残差信号と呼ぶ。
周波数領域変換部305は、逆フィルタ部304から出力される第1レイヤ復号残差信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ符号化部108に出力する。
なお、遅延部306は、入力音声信号に対し所定の長さの遅延を与えるためのものである。この遅延の大きさは、入力音声信号がダウンサンプリング部301、第1レイヤ符号化部302、第1レイヤ復号化部303、逆フィルタ部304および周波数領域変換部305を介した際に生じる時間遅れと同値とする。
このように、本実施の形態によれば、第1レイヤでの符号化処理中に求められる復号LPC係数(第1レイヤ復号LPC係数)を用いて第1レイヤ復号信号のスペクトルの平坦化を行うため、第1レイヤ符号化データの情報を用いて第1レイヤ復号信号のスペクトルを平坦化することができる。よって、本実施の形態によれば、第1レイヤ復号信号のスペクトルを平坦化するためのLPC係数に要する符号化ビットが不要となるため、情報量の増加を伴うことなく、スペクトルの平坦化を行うことができる。
次いで、本実施の形態に係る音声復号化装置について説明する。図12に、本発明の実施の形態2に係る音声復号化装置の構成を示す。この音声復号化装置400は、図11に示す音声符号化装置300から送信されるビットストリームを受信するものである。
図12に示す音声復号化装置400において、分離部401は、図11に示す音声符号化装置300から受信されたビットストリームを、第1レイヤ符号化データ、第2レイヤ符号化データおよびLPC係数符号化データに分離して、第1レイヤ符号化データを第1レイヤ復号化部402に、第2レイヤ符号化データを第2レイヤ復号化部405に、LPC係数符号化データをLPC復号化部407に出力する。また、分離部401は、レイヤ情報(ビットストリームにどのレイヤの符号化データが含まれるかを表す情報)を判定部413に出力する。
第1レイヤ復号化部402は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号信号を生成し、逆フィルタ部403およびアップサンプリング部410に出力する。また、第1レイヤ復号化部402は、復号処理中に生成される第1レイヤ復号LPC係数を逆フィルタ部403に出力する。
アップサンプリング部410は、第1レイヤ復号信号のサンプリングレートをアップサンプリングして、図11の入力音声信号のサンプリングレートと同一にしてローパスフィルタ部411および判定部413に出力する。
ローパスフィルタ部411は、通過域が0−FLに設定されており、アップサンプリング後の第1レイヤ復号信号の周波数帯域0−FLのみを通過させて低域信号を生成し、加算部412に出力する。
逆フィルタ部403は、第1レイヤ復号化部402から入力される第1レイヤ復号LPC係数を用いて逆フィルタを構成し、この逆フィルタに第1レイヤ復号信号を通すことにより第1レイヤ復号残差信号を生成し、周波数領域変換部404に出力する。
周波数領域変換部404は、逆フィルタ部403から出力される第1レイヤ復号残差信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ復号化部405に出力する。
第2レイヤ復号化部405は、第2レイヤ符号化データと第1レイヤ復号スペクトルとを用いて、第2レイヤ復号スペクトルを生成し時間領域変換部406に出力する。なお、第2レイヤ復号化部405の詳細については、実施の形態1の第2レイヤ復号化部203(図9)と同様であるため説明を省略する。
時間領域変換部406は、第2レイヤ復号スペクトルを時間領域の信号に変換して第2レイヤ復号残差信号を生成し、合成フィルタ部408に出力する。
LPC復号化部407は、LPC係数を復号して得た復号LPC係数を合成フィルタ部408に出力する。
合成フィルタ部408は、LPC復号化部407から入力される復号LPC係数を用いて合成フィルタを構成する。なお、合成フィルタ部408の詳細については、実施の形態1の合成フィルタ部207(図9)と同様であるため説明を省略する。合成フィルタ部408は、実施の形態1と同様にして第2レイヤ合成信号s(n)を生成し、ハイパスフィルタ部409に出力する。
ハイパスフィルタ部409は、通過域がFL−FHに設定されており、第2レイヤ合成信号の周波数帯域FL−FHのみを通過させて高域信号を生成し、加算部412に出力する。
加算部412は、低域信号と高域信号とを加算して第2レイヤ復号信号を生成し、判定部413に出力する。
判定部413は、分離部401より入力されるレイヤ情報に基づき、ビットストリームに第2レイヤ符号化データが含まれているか否か判定し、第1レイヤ復号信号または第2レイヤ復号信号のいずれかを選択して復号信号として出力する。判定部413は、ビットストリームに第2レイヤ符号化データが含まれていない場合は第1レイヤ復号信号を出力し、ビットストリームに第1レイヤ符号化データおよび第2レイヤ符号化データの双方が含まれている場合は第2レイヤ復号信号を出力する。
なお、ローパスフィルタ部411およびハイパスフィルタ部409は、低域信号と高域信号との間で互いに与える影響を緩和するために用いられる。よって、低域信号と高域信号との間で互いに与える影響が小さい場合は、音声復号化装置400を、これらのフィルタを用いない構成としてもよい。これらのフィルタを用いない場合、フィルタリングに係る演算が不要になるため、演算量を削減することができる。
このようにして、音声復号化装置400は、図11に示す音声符号化装置300から送信されたビットストリームを復号することができる。
(実施の形態3)
第1レイヤ音源信号のスペクトルは、入力音声信号からスペクトル包絡の影響を取り除いた予測残差信号のスペクトルと同様に平坦化されている。そこで、本実施の形態では、第1レイヤでの符号化処理中に求められる第1レイヤ音源信号を、スペクトルが平坦化された信号(すなわち、実施の形態2における第1レイヤ復号残差信号)とみなして処理を行う。
図13に、本発明の実施の形態3に係る音声符号化装置の構成を示す。図13において、実施の形態2(図11)と同一の構成部分には同一符号を付し、説明を省略する。
第1レイヤ符号化部501は、所望のサンプリングレートにダウンサンプリングされた音声信号に対して符号化処理を行って第1レイヤ符号化データを生成し、多重化部109に出力する。第1レイヤ符号化部501は、例えば、CELP符号化を用いる。また、第1レイヤ符号化部501は、符号化処理中に生成される第1レイヤ音源信号を周波数領域変換部502に出力する。なお、ここでいう音源信号とは、CELP符号化を行う第1レイヤ符号化部501の内部にある合成フィルタ(または聴覚重み付き合成フィルタ)に入力される信号を指し、駆動信号とも呼ばれる。
周波数領域変換部502は、第1レイヤ音源信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ符号化部108に出力する。
なお、遅延部503の遅延の大きさは、入力音声信号がダウンサンプリング部301、第1レイヤ符号化部501および周波数領域変換部502を介した際に生じる時間遅れと同値とする。
このように、本実施の形態によれば、実施の形態2(図11)に比べ、第1レイヤ復号化部303および逆フィルタ部304が不要となるため、演算量を削減することができる。
次いで、本実施の形態に係る音声復号化装置について説明する。図14に、本発明の実施の形態3に係る音声復号化装置の構成を示す。この音声復号化装置600は、図13に示す音声符号化装置500から送信されるビットストリームを受信するものである。図14において、実施の形態2(図12)と同一の構成部分には同一符号を付し、説明を省略する。
第1レイヤ復号化部601は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号信号を生成し、アップサンプリング部410に出力する。また、第1レイヤ復号化部601は、復号処理中に生成される第1レイヤ音源信号を周波数領域変換部602に出力する。
周波数領域変換部602は、第1レイヤ音源信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ復号化部405に出力する。
このようにして、音声復号化装置600は、図13に示す音声符号化装置500から送信されたビットストリームを復号することができる。
(実施の形態4)
本実施の形態では、第2レイヤで求めた第2レイヤ復号LPC係数を用いて、第1レイヤ復号信号および入力音声信号それぞれのスペクトルを平坦化する。
図15に、本発明の実施の形態4に係る音声符号化装置700の構成を示す。図15において、実施の形態2(図11)と同一の構成部分には同一符号を付し、説明を省略する。
第1レイヤ符号化部701は、所望のサンプリングレートにダウンサンプリングされた音声信号に対して符号化処理を行って第1レイヤ符号化データを生成し、第1レイヤ復号化部702および多重化部109に出力する。第1レイヤ符号化部701は、例えば、CELP符号化を用いる。
第1レイヤ復号化部702は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号信号を生成し、アップサンプリング部703に出力する。
アップサンプリング部703は、第1レイヤ復号信号のサンプリングレートをアップサンプリングして入力音声信号のサンプリングレートと同一にし、逆フィルタ部704に出力する。
逆フィルタ部704には、逆フィルタ部104と同様、LPC復号化部103から復号LPC係数が入力される。逆フィルタ部704は、復号LPC係数を用いて逆フィルタを構成し、この逆フィルタにアップサンプリング後の第1レイヤ復号信号を通すことにより、第1レイヤ復号信号のスペクトルを平坦化する。なお、以下の説明では、逆フィルタ部704の出力信号(スペクトルが平坦化された第1レイヤ復号信号)を第1レイヤ復号残差信号と呼ぶ。
周波数領域変換部705は、逆フィルタ部704から出力される第1レイヤ復号残差信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ符号化部108に出力する。
なお、遅延部706の遅延の大きさは、入力音声信号がダウンサンプリング部301、第1レイヤ符号化部701、第1レイヤ復号化部702、アップサンプリング部703、逆フィルタ部704および周波数領域変換部705を介した際に生じる時間遅れと同値とする。
次いで、本実施の形態に係る音声復号化装置について説明する。図16に、本発明の実施の形態4に係る音声復号化装置の構成を示す。この音声復号化装置800は、図15に示す音声符号化装置700から送信されるビットストリームを受信するものである。図16において、実施の形態2(図12)と同一の構成部分には同一符号を付し、説明を省略する。
第1レイヤ復号化部801は、第1レイヤ符号化データを用いて復号処理を行って第1レイヤ復号信号を生成し、アップサンプリング部802に出力する。
アップサンプリング部802は、第1レイヤ復号信号のサンプリングレートをアップサンプリングして図15の入力音声信号のサンプリングレートと同一にし、逆フィルタ部803および判定部413に出力する。
逆フィルタ部803には、合成フィルタ部408と同様、LPC復号化部407から復号LPC係数が入力される。逆フィルタ部803は、復号LPC係数を用いて逆フィルタ
を構成し、この逆フィルタにアップサンプリング後の第1レイヤ復号信号を通すことにより第1レイヤ復号信号のスペクトルを平坦化し、第1レイヤ復号残差信号を周波数領域変換部804に出力する。
周波数領域変換部804は、逆フィルタ部803から出力される第1レイヤ復号残差信号の周波数分析を行って第1レイヤ復号スペクトルを生成し、第2レイヤ復号化部405に出力する。
このようにして、音声復号化装置800は、図15に示す音声符号化装置700から送信されたビットストリームを復号することができる。
このように、本実施の形態によれば、音声符号化装置において、第2レイヤで求めた第2レイヤ復号LPC係数を用いて、第1レイヤ復号信号および入力音声信号それぞれのスペクトルを平坦化するため、音声復号化装置では、音声符号化装置と共通のLPC係数を用いて第1レイヤ復号スペクトルを求めることができる。よって、本実施の形態によれば、音声復号化装置では、復号信号を生成するにあたり、実施の形態2,3のような低域部と高域部とに分離した処理を行う必要がなくなるためローパスフィルタおよびハイパスフィルタが不要となり装置構成が簡単になるとともに、フィルタリング処理に係る演算量を削減することができる。
(実施の形態5)
本実施の形態は、スペクトルの平坦化を行う逆フィルタの共振抑圧係数を入力音声信号の特性に応じて適応的に変化させて平坦化の程度を制御するものである。
図17に、本発明の実施の形態5に係る音声符号化装置900の構成を示す。図17において、実施の形態4(図15)と同一の構成部分には同一符号を付し、説明を省略する。
音声符号化装置900において、逆フィルタ部904,905は、式(2)により表される。
特徴量分析部901は、入力音声信号を分析して特徴量を算出し、特徴量符号化部902に出力する。特徴量としては、共振による音声スペクトルの強度を表すパラメータを用いる。具体的には、例えば、隣り合うLSPパラメータ間の距離を用いる。一般に、この距離が小さいほど共振の程度が強く、共振周波数に対応するスペクトルのエネルギーが大きく現れる。共振が強く現れる音声区間では、平坦化処理により、共振周波数近傍でのスペクトルが過度に減衰されて音質劣化の原因となる。これを防ぐために、共振が強く現れる音声区間では上記の共振抑圧係数γ(0<γ<1)を小さく設定して平坦化の程度を弱める。これにより、平坦化処理による共振周波数近傍でのスペクトルの過度な減衰を防止でき、音声品質の劣化を抑えることができる。
特徴量符号化部902は、特徴量分析部901より入力される特徴量を符号化して特徴量符号化データを生成し、特徴量復号化部903および多重化部906に出力する。
特徴量復号化部903は、特徴量符号化データを用いて特徴量を復号し、復号特徴量に応じて逆フィルタ部904,905で用いる共振抑圧係数γを決定して逆フィルタ部904,905に出力する。特徴量として周期性の強さを表すパラメータが用いられる場合、入力音声信号の周期性が強いほど共振抑圧係数γを大きくし、入力音声信号の周期性が弱いほど共振抑圧係数γを小さくする。このように共振抑圧係数γを制御することにより、有声部ではより強くスペクトルの平坦化が行われ、無声部ではスペクトルの平坦化の程度
が弱まる。よって、無声部での過度なスペクトルの平坦化を防ぐことができ、音声品質の劣化を抑えることができる。
逆フィルタ部904,905は、特徴量復号化部903によって制御される共振抑圧係数γに応じて、式(2)に従って逆フィルタ処理を行う。
多重化部906は、第1レイヤ符号化データ、第2レイヤ符号化データ、LPC係数および特徴量符号化データを多重化してビットストリームを生成し、出力する。
なお、遅延部907の遅延の大きさは、入力音声信号がダウンサンプリング部301、第1レイヤ符号化部701、第1レイヤ復号化部702、アップサンプリング部703、逆フィルタ部905および周波数領域変換部705を介した際に生じる時間遅れと同値とする。
次いで、本実施の形態に係る音声復号化装置について説明する。図18に、本発明の実施の形態5に係る音声復号化装置の構成を示す。この音声復号化装置1000は、図17に示す音声符号化装置900から送信されるビットストリームを受信するものである。図18において、実施の形態4(図16)と同一の構成部分には同一符号を付し、説明を省略する。
音声符号化装置1000において、逆フィルタ部1003は、式(2)により表される。
分離部1001は、図17に示す音声符号化装置900から受信されたビットストリームを、第1レイヤ符号化データ、第2レイヤ符号化データ、LPC係数符号化データおよび特徴量符号化データに分離して、第1レイヤ符号化データを第1レイヤ復号化部801に、第2レイヤ符号化データを第2レイヤ復号化部405に、LPC係数をLPC復号化部407に、特徴量符号化データを特徴量復号化部1002に出力する。また、分離部1001は、レイヤ情報(ビットストリームにどのレイヤの符号化データが含まれるかを表す情報)を判定部413に出力する。
特徴量復号化部1002は、特徴量復号化部903(図17)同様、特徴量符号化データを用いて特徴量を復号し、復号特徴量に応じて逆フィルタ部1003で用いる共振抑圧係数γを決定して逆フィルタ部1003に出力する。
逆フィルタ部1003は、特徴量復号化部1002によって制御される共振抑圧係数γに応じて、式(2)に従って逆フィルタ処理を行う。
このようにして、音声復号化装置1000は、図17に示す音声符号化装置900から送信されたビットストリームを復号することができる。
なお、LPC量子化部102(図17)は、上記のように、LPC係数を一旦LSPパラメータに変換した後に量子化する。そこで、本実施の形態においては、音声符号化装置の構成を図19に示すようにしてもよい。すなわち、図19に示す音声符号化装置1100では、特徴量分析部901を設けずに、LPC量子化部102がLSPパラメータ間の距離を算出して特徴量符号化部902に出力する。
さらに、LPC量子化部102が復号LSPパラメータを生成する場合には、音声符号化装置の構成を図20に示すようにしてもよい。すなわち、図20に示す音声符号化装置1300では、特徴量分析部901、特徴量符号化部902および特徴量復号化部903
を設けずに、LPC量子化部102が、復号LSPパラメータを生成し、復号LSPパラメータ間の距離を算出して逆フィルタ部904,905に出力する。
また、図20に示す音声符号化装置1300から送信されたビットストリームを復号する音声復号化装置1400の構成を図21に示す。図21において、LPC復号化部407は、さらに、復号LPC係数から復号LSPパラメータを生成し、復号LSPパラメータ間の距離を算出して逆フィルタ部1003に出力する。
(実施の形態6)
音声信号やオーディオ信号では、複製元である低域部のスペクトルのダイナミックレンジ(スペクトルの振幅の最大値と最小値との比)が複製先である高域部のスペクトルのダイナミックレンジより大きくなる状況がよく発生する。このような状況において低域部のスペクトルを複製して高域部のスペクトルとする場合、高域部にスペクトルの過大なピークが発生する。そして、このように過大なピークを有するスペクトルを時間領域に変換して得られる復号信号には、鈴が鳴るように聞こえるノイズが発生し、その結果、主観品質が低下してしまう。
これに対し、主観品質の改善を図るために、低域部のスペクトルを変形して低域部のスペクトルのダイナミックレンジを高域部のスペクトルのダイナミックレンジに近づける技術が提案されている(例えば、押切,江原,吉田, “ピッチフィルタリングに基づくスペクトル符号化を用いた超広帯域スケーラブル音声符号化の改善”,2004年秋季音講論集2-4-13,pp.297-298,2004年9月、参照)。この技術では、低域部のスペクトルをどのように変形したかを表す変形情報を音声符号化装置から音声復号化装置へ送信する必要がある。
ここで、音声符号化装置においてこの変形情報を符号化する際に、符号化候補の数が十分でない場合、すなわち、低ビットレートの場合には大きな量子化誤差が発生する。そして、このような大きな量子化誤差が発生すると、その量子化誤差に起因して低域部のスペクトルのダイナミックレンジの調整が十分に行われず、その結果品質劣化を招くことがある。特に、高域部のスペクトルのダイナミックレンジより大きなダイナミックレンジを表す符号化候補が選択された場合、高域部のスペクトルに過大なピークが発生しやすくなり、品質劣化が顕著に現れてしまうことがある。
そこで、本実施の形態では、低域部のスペクトルのダイナミックレンジを高域部のスペクトルのダイナミックレンジに近づける技術を上記各実施の形態に適用する場合において、第2レイヤ符号化部108が変形情報を符号化する際に、ダイナミックレンジが小さくなる符号化候補をダイナミックレンジが大きくなる符号化候補よりも選択されやすくする。
図22に、本発明の実施の形態6に係る第2レイヤ符号化部108の構成を示す。図22において、実施の形態1(図7)と同一の構成部分には同一符号を付し、説明を省略する。
図22に示す第2レイヤ符号化部108において、スペクトル変形部1087には、第1レイヤ復号化部107より第1レイヤ復号スペクトルS1(k)(0≦k<FL)が入力され、周波数領域変換部105より残差スペクトルS2(k)(0≦k<FH)が入力される。スペクトル変形部1087は、復号スペクトルS1(k)のダイナミックレンジを適切なダイナミックレンジとするために、復号スペクトルS1(k)を変形させて復号スペクトルS1(k)のダイナミックレンジを変化させる。そして、スペクトル変形部1087は、復号スペクトルS1(k)をどのように変形したかを表す変形情報を符号化して多重化部1086に出力する。また、スペクトル変形部1087は、変形後の復号スペ
クトル(変形復号スペクトル)S1'(j,k)を内部状態設定部1081に出力する。
スペクトル変形部1087の構成を図23に示す。スペクトル変形部1087は、復号スペクトルS1(k)を変形して復号スペクトルS1(k)のダイナミックレンジを残差スペクトルS2(k)の高域部(FL≦k<FH)のダイナミックレンジに近づける。また、スペクトル変形部1087は、変形情報を符号化して出力する。
図23に示すスペクトル変形部1087において、変形スペクトル生成部1101は、復号スペクトルS1(k)を変形して変形復号スペクトルS1'(j,k)を生成し、サブバンドエネルギー算出部1102に出力する。ここで、jは符号帳1111の各符号化候補(各変形情報)を識別するためのインデックスであり、変形スペクトル生成部1101では、符号帳1111に含まれる各符号化候補(各変形情報)を用いて復号スペクトルS1(k)の変形が行われる。ここでは、指数関数を用いてスペクトルの変形を行う場合を一例に挙げる。例えば、符号帳1111に含まれる符号化候補をα(j)と表したとき、各符号化候補α(j)は0≦α(j)≦1の範囲にあるものとする。よって、変形復号スペクトルS1'(j,k)は、式(15)のように表される。
Figure 0005089394
ここで、sign()は正または負の符号を返す関数を表す。よって、符号化候補α(j)が0に近い値をとるほど変形復号スペクトルS1'(j,k)のダイナミックレンジは小さくなる。
サブバンドエネルギー算出部1102は、変形復号スペクトルS1'(j,k)の周波数帯域を複数のサブバンドに分割し、各サブバンドの平均エネルギー(サブバンドエネルギー)P1(j,n)を求めて分散算出部1103に出力する。ここでnはサブバンド番号を表す。
分散算出部1103は、サブバンドエネルギーP1(j,n)のばらつきの程度を表すために、サブバンドエネルギーP1(j,n)の分散σ1(j)を求める。そして、分散算出部1103は、符号化候補(変形情報)jにおける分散σ1(j)を減算部1106に出力する。
一方、サブバンドエネルギー算出部1104は、残差スペクトルS2(k)の高域部を複数のサブバンドに分割し、各サブバンドの平均エネルギー(サブバンドエネルギー)P2(n)を求めて分散算出部1105に出力する。
分散算出部1105は、サブバンドエネルギーP2(n)のばらつきの程度を表すために、サブバンドエネルギーP2(n)の分散σ2を求め、減算部1106に出力する。
減算部1106は、分散σ2から分散σ1(j)を減じ、この減算により得られる誤差信号を判定部1107および重み付き誤差算出部1108に出力する。
判定部1107は、誤差信号の符号(正または負)を判定し、判定結果に基づいて、重み付き誤差算出部1108に与える重み(ウェイト)を決定する。判定部1107は、誤差信号の符号が正である場合にはwposを、負である場合にはwnegを重みとして選択し、重み付き誤差算出部1108に出力する。wposとwnegとの間には式(16)に示す大小関係がある。
Figure 0005089394
重み付き誤差算出部1108は、まず、減算部1106から入力される誤差信号の2乗値を算出し、次に、判定部1107から入力される重みw(wposまたはwneg)を誤差信号の2乗値に乗じて重み付き2乗誤差Eを算出し、探索部1109に出力する。重み付き2乗誤差Eは式(17)のように表される。
Figure 0005089394
探索部1109は、符号帳1111を制御して符号帳1111に格納されている符号化候補(変形情報)を順次変形スペクトル生成部1101に出力させ、重み付き2乗誤差Eが最小となる符号化候補(変形情報)を探索する。そして、探索部1109は、重み付き2乗誤差Eが最小となる符号化候補のインデックスjoptを最適変形情報として変形スペクトル生成部1110および多重化部1086に出力する。
変形スペクトル生成部1110は、復号スペクトルS1(k)を変形して最適変形情報joptに対応する変形復号スペクトルS1'(jopt,k)を生成し、内部状態設定部1081に出力する。
次いで、本実施の形態に係る音声復号化装置の第2レイヤ復号化部203について説明する。図24に、本発明の実施の形態6に係る第2レイヤ復号化部203の構成を示す。図24において、実施の形態1(図10)と同一の構成部分には同一符号を付し、説明を省略する。
第2レイヤ復号化部203において、変形スペクトル生成部2036は、分離部2032から入力される最適変形情報joptに基づいて、第1レイヤ復号化部202から入力される第1レイヤ復号スペクトルS1(k)を変形して変形復号スペクトルS1'(jopt,k)を生成し、内部状態設定部2031に出力する。つまり、変形スペクトル生成部2036は、音声符号化装置側の変形スペクトル生成部1110に対応して備えられ、変形スペクトル生成部1110と同様の処理を行う。
上記のように、重み付き2乗誤差を算出するときの重みを誤差信号の符号に応じて決定し、かつ、その重みが式(16)に示す関係がある場合、次のことが言える。
すなわち、誤差信号が正の場合とは、変形復号スペクトルS1'のばらつきの程度が目標値である残差スペクトルS2のばらつきの程度よりも小さくなる場合である。つまりこれは、音声復号化装置側で生成される変形復号スペクトルS1'のダイナミックレンジが残差スペクトルS2のダイナミックレンジよりも小さくなることに相当する。
一方、誤差信号が負の場合とは、変形復号スペクトルS1'のばらつきの程度が目標値である残差スペクトルS2のばらつきの程度よりも大きくなる場合である。つまりこれは、音声復号化装置側で生成される変形復号スペクトルS1'のダイナミックレンジが残差スペクトルS2のダイナミックレンジよりも大きくなることに相当する。
よって、式(16)に示すように誤差信号が正の場合の重みwposを誤差信号が負の
場合の重みwnegよりも小さく設定することにより、2乗誤差が同程度の値の場合、残差スペクトルS2のダイナミックレンジよりも小さいダイナミックレンジとなる変形復号スペクトルS1'を生成するような符号化候補が選択されやすくなる。つまり、ダイナミックレンジを抑える符号化候補が優先的に選択されるようになる。よって、音声復号化装置で生成される推定スペクトルのダイナミックレンジが残差スペクトルの高域部のダイナミックレンジよりも大きくなる頻度が減少する。
ここで、変形復号スペクトルS1'のダイナミックレンジが目標となるスペクトルのダイナミックレンジよりも大きくなると、音声復号化装置では推定スペクトルに過大なピークが出現し人間の耳に品質劣化として知覚されやすくなるのに対し、変形復号スペクトルS1'のダイナミックレンジが目標となるスペクトルのダイナミックレンジよりも小さくなると、音声復号化装置では推定スペクトルに上記のような過大なピークが発生しにくくなる。よって、本実施の形態によれば、低域部のスペクトルのダイナミックレンジを高域部のスペクトルのダイナミックレンジに合わせる技術を実施の形態1に適用する場合において、聴感的な音質の劣化を防止することができる。
なお、上記説明では、スペクトル変形方法として指数関数を用いたものを一例に挙げたが、これに限定されず、例えば対数関数を用いたスペクトル変形等、他のスペクトル変形方法を用いてもよい。
また、上記説明ではサブバンドの平均エネルギーの分散を用いる場合について説明したが、スペクトルのダイナミックレンジの大きさを表す指標でさえあれば、サブバンドの平均エネルギーの分散に限定されるものではない。
(実施の形態7)
図25に、本発明の実施の形態7に係るスペクトル変形部1087の構成を示す。図25において、実施の形態6(図23)と同一の構成部分には同一符号を付し、説明を省略する。
図25に示すスペクトル変形部1087において、ばらつき度算出部1112−1は、復号スペクトルS1(k)の低域部の値の分布から復号スペクトルS1(k)のばらつき度を算出し、閾値設定部1113−1,1113−2に出力する。ばらつき度とは、具体的には復号スペクトルS1(k)の標準偏差σ1である。
閾値設定部1113−1は、標準偏差σ1を用いて第1閾値TH1を求めて平均スペクトル算出部1114−1および変形スペクトル生成部1110に出力する。ここで、第1閾値TH1とは、復号スペクトルS1(k)のうち比較的振幅の大きなスペクトルを特定するための閾値であり、標準偏差σ1に所定の定数aを乗じた値が使用される。
閾値設定部1113−2は、標準偏差σ1を用いて第2閾値TH2を求めて平均スペクトル算出部1114−2および変形スペクトル生成部1110に出力する。ここで、第2閾値TH2とは、復号スペクトルS1(k)の低域部のうち比較的振幅の小さなスペクトルを特定するための閾値であり、標準偏差σ1に所定の定数b(<a)を乗じた値が使用される。
平均スペクトル算出部1114−1は、第1閾値TH1よりも振幅が大きいスペクトルの平均振幅値(以下、第1平均値という)を求め、変形ベクトル算出部1115に出力する。具体的には、平均スペクトル算出部1114−1は、復号スペクトルS1(k)の低域部のスペクトルの値を、復号スペクトルS1(k)の平均値m1に第1閾値TH1を加えた値(m1+TH1)と比較し、この値よりも大きな値を有するスペクトルを特定する
(ステップ1)。次に、平均スペクトル算出部1114−1は、復号スペクトルS1(k)の低域部のスペクトルの値を、復号スペクトルS1(k)の平均値m1から第1閾値TH1を減じた値(m1−TH1)と比較し、この値よりも小さな値を有するスペクトルを特定する(ステップ2)。そして、平均スペクトル算出部1114−1は、ステップ1およびステップ2の双方で求まったスペクトルの振幅の平均値を求め、変形ベクトル算出部1115に出力する。
平均スペクトル算出部1114−2は、第2閾値TH2よりも振幅が小さいスペクトルの平均振幅値(以下、第2平均値という)を求め、変形ベクトル算出部1115に出力する。具体的には、平均スペクトル算出部1114−2は、復号スペクトルS1(k)の低域部のスペクトルの値を、復号スペクトルS1(k)の平均値m1に第2閾値TH2を加えた値(m1+TH2)と比較し、この値よりも小さな値を有するスペクトルを特定する(ステップ1)。次に、平均スペクトル算出部1114−2は、復号スペクトルS1(k)の低域部のスペクトルの値を、復号スペクトルS1(k)の平均値m1から第2閾値TH2を減じた値(m1−TH2)と比較し、この値よりも大きな値を有するスペクトルを特定する(ステップ2)。そして、平均スペクトル算出部1114−2は、ステップ1およびステップ2の双方で求まったスペクトルの振幅の平均値を求め、変形ベクトル算出部1115に出力する。
一方、ばらつき度算出部1112−2は、残差スペクトルS2(k)の高域部の値の分布から残差スペクトルS2(k)のばらつき度を算出し、閾値設定部1113−3,1113−4に出力する。ばらつき度とは、具体的には残差スペクトルS2(k)の標準偏差σ2である。
閾値設定部1113−3は、標準偏差σ2を用いて第3閾値TH3を求めて平均スペクトル算出部1114−3に出力する。ここで、第3閾値TH3とは、残差スペクトルS2(k)の高域部のうち比較的振幅の大きなスペクトルを特定するための閾値であり、標準偏差σ2に所定の定数cを乗じた値が使用される。
閾値設定部1113−4は、標準偏差σ2を用いて第4閾値TH4を求めて平均スペクトル算出部1114−4に出力する。ここで、第4閾値TH4とは、残差スペクトルS2(k)の高域部のうち比較的振幅の小さなスペクトルを特定するための閾値であり、標準偏差σ2に所定の定数d(<c)を乗じた値が使用される。
平均スペクトル算出部1114−3は、第3閾値TH3よりも振幅が大きいスペクトルの平均振幅値(以下、第3平均値という)を求め、変形ベクトル算出部1115に出力する。具体的には、平均スペクトル算出部1114−3は、残差スペクトルS2(k)の高域部のスペクトルの値を、残差スペクトルS2(k)の平均値m3に第3閾値TH3を加えた値(m3+TH3)と比較し、この値よりも大きな値を有するスペクトルを特定する(ステップ1)。次に、平均スペクトル算出部1114−3は、残差スペクトルS2(k)の高域部のスペクトルの値を、残差スペクトルS2(k)の平均値m3から第3閾値TH3を減じた値(m3−TH3)と比較し、この値よりも小さな値を有するスペクトルを特定する(ステップ2)。そして、平均スペクトル算出部1114−3は、ステップ1およびステップ2の双方で求まったスペクトルの振幅の平均値を求め、変形ベクトル算出部1115に出力する。
平均スペクトル算出部1114−4は、第4閾値TH4よりも振幅が小さいスペクトルの平均振幅値(以下、第4平均値という)を求め、変形ベクトル算出部1115に出力する。具体的には、平均スペクトル算出部1114−4は、残差スペクトルS2(k)の高域部のスペクトルの値を、残差スペクトルS2(k)の平均値m3に第4閾値TH4を加
えた値(m3+TH4)と比較し、この値よりも小さな値を有するスペクトルを特定する(ステップ1)。次に、平均スペクトル算出部1114−4は、残差スペクトルS2(k)の高域部のスペクトルの値を、残差スペクトルS2(k)の平均値m3から第4閾値TH4を減じた値(m3−TH4)と比較し、この値よりも大きな値を有するスペクトルを特定する(ステップ2)。そして、平均スペクトル算出部1114−4は、ステップ1およびステップ2の双方で求まったスペクトルの振幅の平均値を求め、変形ベクトル算出部1115に出力する。
変形ベクトル算出部1115は、第1平均値、第2平均値、第3平均値および第4平均値を用いて、以下のようにして変形ベクトルを算出する。
すなわち、変形ベクトル算出部1115は、第3平均値と第1平均値との比(以下、第1ゲインという)、および、第4平均値と第2平均値との比(以下、第2ゲインという)を算出し、第1ゲインおよび第2ゲインを変形ベクトルとして減算部1106に出力する。以下、変形ベクトルをg(i)(i=1,2)と表記する。つまり、g(1)は第1ゲインを表し、g(2)は第2ゲインを表す。
減算部1106は、変形ベクトルg(i)から、変形ベクトル符号帳1116に属する符号化候補を減じ、この減算により得られる誤差信号を判定部1107および重み付き誤差算出部1108に出力する。以下、符号化候補をv(j,i)と表す。ここで、jは変形ベクトル符号帳1116の各符号化候補(各変形情報)を識別するためのインデックスである。
判定部1107は、誤差信号の符号(正または負)を判定し、判定結果に基づいて、重み付き誤差算出部1108に与える重み(ウェイト)を第1ゲインg(1),第2ゲインg(2)毎に決定する。判定部1107は、第1ゲインg(1)に対しては、誤差信号の符号が正である場合にはwlightを、負である場合にはwheavyを重みとして選択し、重み付き誤差算出部1108に出力する。一方、第2ゲインg(2)に対しては、判定部1107は、誤差信号の符号が正である場合にはwheavyを、負である場合にはwlightを重みとして選択し、重み付き誤差算出部1108に出力する。wlightとwheavyとの間には式(18)に示す大小関係がある。
Figure 0005089394
重み付き誤差算出部1108は、まず、減算部1106から入力される誤差信号の2乗値を算出し、次に、誤差信号の2乗値と、第1ゲインg(1),第2ゲインg(2)毎に判定部1107から入力される重みw(wlightまたはwheavy)との積和を求めて重み付き2乗誤差Eを算出し、探索部1109に出力する。重み付き2乗誤差Eは式(19)のように表される。
Figure 0005089394
探索部1109は、変形ベクトル符号帳1116を制御して変形ベクトル符号帳1116に格納されている符号化候補(変形情報)を順次減算部1106に出力させ、重み付き2乗誤差Eが最小となる符号化候補(変形情報)を探索する。そして、探索部1109は、重み付き2乗誤差Eが最小となる符号化候補のインデックスjoptを最適変形情報と
して変形スペクトル生成部1110および多重化部1086に出力する。
変形スペクトル生成部1110は、第1閾値TH1、第2閾値TH2および最適変形情報joptを用いて復号スペクトルS1(k)を変形して最適変形情報joptに対応する変形復号スペクトルS1'(jopt,k)を生成し、内部状態設定部1081に出力する。
変形スペクトル生成部1110は、まず、最適変形情報joptを用いて第3平均値と第1平均値との比の復号値(以下、復号第1ゲインという)、および、第4平均値と第2平均値との比の復号値(以下、復号第2ゲインという)を生成する。
次に、変形スペクトル生成部1110は、復号スペクトルS1(k)の振幅値と第1閾値TH1とを比較し、第1閾値TH1よりも振幅が大きいスペクトルを特定し、これらのスペクトルに復号第1ゲインを乗じて変形復号スペクトルS1'(jopt,k)を生成する。同様に、変形スペクトル生成部1110は、復号スペクトルS1(k)の振幅値と第2閾値TH2とを比較し、第2閾値TH2よりも振幅が小さいスペクトルを特定し、これらのスペクトルに復号第2ゲインを乗じて変形復号スペクトルS1'(jopt,k)を生成する。
なお、復号スペクトルS1(k)のうち、第1閾値TH1と第2閾値TH2とに挟まれる領域に属するスペクトルに対しては、符号化情報が存在しない。そこで、変形スペクトル生成部1110は、復号第1ゲインと復号第2ゲインの中間的な値を有するゲインを使用する。例えば、変形スペクトル生成部1110は、復号第1ゲインと、復号第2ゲインと、第1閾値TH1と、第2閾値TH2とに基づく特性曲線から、ある振幅xに対応する復号ゲインyを求め、このゲインを復号スペクトルS1(k)の振幅に乗じる。すなわち、復号ゲインyは、復号第1ゲインおよび復号第2ゲインの線形補間値となっている。
このようにして本実施の形態によれば、実施の形態6と同様の作用・効果を得ることができる。
(実施の形態8)
図26に、本発明の実施の形態8に係るスペクトル変形部1087の構成を示す。図26において、実施の形態6(図23)と同一の構成部分には同一符号を付し、説明を省略する。
図26に示すスペクトル変形部1087において、修正部1117には、分散算出部1105から分散σ2が入力される。
修正部1117は、分散σ2の値を小さくする修正処理を施して減算部1106に出力する。具体的には、修正部1117は、0以上1未満の値を分散σ2に乗じる。
減算部1106は、修正処理後の分散から分散σ1(j)を減じ、この減算により得られる誤差信号を誤差算出部1118に出力する。
誤差算出部1118は、減算部1106から入力される誤差信号の2乗値(2乗誤差)を算出して、探索部1109に出力する。
探索部1109は、符号帳1111を制御して符号帳1111に格納されている符号化候補(変形情報)を順次変形スペクトル生成部1101に出力させ、2乗誤差が最小となる符号化候補(変形情報)を探索する。そして、探索部1109は、2乗誤差が最小とな
る符号化候補のインデックスjoptを最適変形情報として変形スペクトル生成部1110および多重化部1086に出力する。
このように、本実施の形態によれば、修正部1117での修正処理により、探索部1109では、修正処理後の分散、すなわち、値が小さくなった分散を目標値とした符号化候補の探索が行われるようになる。よって、音声復号化装置では、推定スペクトルのダイナミックレンジが抑えられるようになるため、上記のような過大なピークの発生頻度をさらに減少することができる。
なお、修正部1117では、入力音声信号の特性に応じて分散σ2に乗じる値を変化させてもよい。その特性としては、入力音声信号のピッチ周期性の強さを用いるのが適当である。つまり、修正部1117は、入力音声信号のピッチ周期性が弱い場合(例えば、ピッチゲインが小さい場合)には分散σ2に乗じる値を大きな値にし、入力音声信号のピッチ周期性が強い場合(例えば、ピッチゲインが大きい場合)には分散σ2に乗じる値を小さな値にしてもよい。このような適応化により、ピッチ周期性の強い信号(例えば母音部)に対してのみ過大なスペクトルピークが生じにくくなり、その結果、聴感的な音質を改善することができる。
(実施の形態9)
図27に、本発明の実施の形態9に係るスペクトル変形部1087の構成を示す。図27において、実施の形態7(図25)と同一の構成部分には同一符号を付し、説明を省略する。
図27に示すスペクトル変形部1087において、修正部1117には、変形ベクトル算出部1115から変形ベクトルg(i)が入力される。
修正部1117は、第1ゲインg(1)の値を小さくする修正処理および第2ゲインg(2)の値を大きくする修正処理の少なくとも一方を施して減算部1106に出力する。具体的には、修正部1117は、0以上1未満の値を第1ゲインg(1)に乗じ、1より大きい値を第2ゲインg(2)に乗じる。
減算部1106は、修正処理後の変形ベクトルから、変形ベクトル符号帳1116に属する符号化候補を減じ、この減算により得られる誤差信号を誤差算出部1118に出力する。
誤差算出部1118は、減算部1106から入力される誤差信号の2乗値(2乗誤差)を算出して、探索部1109に出力する。
探索部1109は、変形ベクトル符号帳1116を制御して変形ベクトル符号帳1116に格納されている符号化候補(変形情報)を順次減算部1106に出力させ、2乗誤差が最小となる符号化候補(変形情報)を探索する。そして、探索部1109は、2乗誤差が最小となる符号化候補のインデックスjoptを最適変形情報として変形スペクトル生成部1110および多重化部1086に出力する。
このように、本実施の形態によれば、修正部1117での修正処理により、探索部1109では、修正処理後の変形ベクトル、すなわち、ダイナミックレンジを小さくさせる変形ベクトルを目標値とした符号化候補の探索が行われるようになる。よって、音声復号化装置では、推定スペクトルのダイナミックレンジが抑えられるようになるため、上記のような過大なピークの発生頻度をさらに減少することができる。
なお、本実施の形態においても実施の形態8同様、修正部1117では、入力音声信号の特性に応じて変形ベクトルg(i)に乗じる値を変化させてもよい。このような適応化により、実施の形態8同様、ピッチ周期性の強い信号(例えば母音部)に対してのみ過大なスペクトルピークが生じにくくなり、その結果、聴感的な音質を改善することができる。
(実施の形態10)
図28に、本発明の実施の形態10に係る第2レイヤ符号化部108の構成を示す。図28において、実施の形態6(図22)と同一の構成部分には同一符号を付し、説明を省略する。
図28に示す第2レイヤ符号化部108において、スペクトル変形部1088には、周波数領域変換部105から残差スペクトルS2(k)が入力され、探索部1083から残差スペクトルの推定値(推定残差スペクトル)S2'(k)が入力される。
スペクトル変形部1088は、残差スペクトルS2(k)の高域部のダイナミックレンジを参照して、推定残差スペクトルS2'(k)を変形させて推定残差スペクトルS2'(k)のダイナミックレンジを変化させる。そして、スペクトル変形部1088は、推定残差スペクトルS2'(k)をどのように変形したかを表す変形情報を符号化して多重化部1086に出力する。また、スペクトル変形部1088は、変形後の推定残差スペクトル(変形残差スペクトル)をゲイン符号化部1085に出力する。なお、スペクトル変形部1088の内部構成は、スペクトル変形部1087と同一であるため、詳しい説明は省略する。
ゲイン符号化部1085での処理は、実施の形態1における「残差スペクトルの推定値S2'(k)」を「変形残差スペクトル」と読み替えたものになるため、詳しい説明は省略する。
次いで、本実施の形態に係る音声復号化装置の第2レイヤ復号化部203について説明する。図29に、本発明の実施の形態10に係る第2レイヤ復号化部203の構成を示す。図29において、実施の形態6(図24)と同一の構成部分には同一符号を付し、説明を省略する。
第2レイヤ復号化部203において、変形スペクトル生成部2037は、分離部2032から入力される最適変形情報jopt、すなわち、変形残差スペクトルに関する最適変形情報joptに基づいて、フィルタリング部2033から入力される復号スペクトルS'(k)を変形してスペクトル調整部2035に出力する。つまり、変形スペクトル生成部2037は、音声符号化装置側のスペクトル変形部1088に対応して備えられ、スペクトル変形部1088と同様の処理を行う。
このように、本実施の形態によれば、復号スペクトルS1(k)のみならず推定残差スペクトルS2'(k)も変形させるため、より適切なダイナミックレンジを有する推定残差スペクトルを生成することができる。
(実施の形態11)
図30に、本発明の実施の形態11に係る第2レイヤ符号化部108の構成を示す。図30において、実施の形態6(図22)と同一の構成部分には同一符号を付し、説明を省略する。
図30に示す第2レイヤ符号化部108において、スペクトル変形部1087は、音声
復号化装置と共有の所定の変形情報に従って復号スペクトルS1(k)を変形させて復号スペクトルS1(k)のダイナミックレンジを変化させる。そして、スペクトル変形部1087は、変形復号スペクトルS1'(j,k)を内部状態設定部1081に出力する。
次いで、本実施の形態に係る音声復号化装置の第2レイヤ復号化部203について説明する。図31に、本発明の実施の形態11に係る第2レイヤ復号化部203の構成を示す。図31において、実施の形態6(図24)と同一の構成部分には同一符号を付し、説明を省略する。
第2レイヤ復号化部203において、変形スペクトル生成部2036は、音声符号化装置と共有の所定の変形情報、すなわち、図30のスペクトル変形部1087が使用した所定の変形情報と同一の変形情報に従って、第1レイヤ復号化部202から入力される第1レイヤ復号スペクトルS1(k)を変形して内部状態設定部2031に出力する。
このように、本実施の形態によれば、音声符号化装置のスペクトル変形部1087と音声復号化装置の変形スペクトル生成部2036とが予め定められた同一の変形情報に従って変形処理を行うため、音声符号化装置から音声復号化装置への変形情報の送信が不要となる。よって、本実施の形態によれば、実施の形態6に比べ、ビットレートを低減させることができる。
なお、図28に示すスペクトル変形部1088と図29に示す変形スペクトル生成部2037とが予め定められた同一の変形情報に従って変形処理を行ってもよい。これにより、ビットレートをさらに低減させることができる。
(実施の形態12)
実施の形態10における第2レイヤ符号化部108が、スペクトル変形部1087を有しない構成を採ることも可能である。そこで、実施の形態12として、この場合の第2レイヤ符号化部108の構成を図32に示す。
また、第2レイヤ符号化部108がスペクトル変形部1087を有しない場合、音声復号化装置においても、スペクトル変形部1087に対応する変形スペクトル生成部2036が不要となる。そこで、実施の形態12として、この場合の第2レイヤ復号化部203の構成を図33に示す。
以上、本発明の実施の形態について説明した。
なお、実施の形態6〜12に係る第2レイヤ符号化部108は、実施の形態2(図11)、実施の形態3(図13)、実施の形態4(図15)、実施の形態5(図17,15,16)においても用いることができる。ただし、実施の形態4、5(図15,13,15,16)では、第1レイヤ復号信号をアップサンプリングした後に周波数領域変換を施しているため、第1レイヤ復号スペクトルS1(k)の周波数帯域は0≦k<FHとなる。しかし、単にアップサンプリングした後に周波数領域への変換を行っているため、帯域FL≦k<FHには有効な信号成分が含まれていない。よって、これらの実施形態においても、第1レイヤ復号スペクトルS1(k)の帯域を0≦k<FLとして扱うことができる。
また、実施の形態6〜12に係る第2レイヤ符号化部108は、実施の形態2〜5に記載した音声符号化装置以外の音声符号化装置の第2レイヤにおける符号化にも用いることができる。
また、上記実施の形態においては、第2レイヤ符号化部108内において多重化部10
86でピッチ係数やインデックス等を多重化して第2レイヤ符号化データとして出力した後、多重化部109で第1レイヤ符号化データ、第2レイヤ符号化データおよびLPC係数符号化データを多重化してビットストリームを生成しているが、これに限定されず、第2レイヤ符号化部108内に多重化部1086を設けずに、ピッチ係数やインデックス等を多重化部109へ直接入力して第1レイヤ符号化データ等との多重化を行なってもよい。また、第2レイヤ復号化部203に関しても、分離部201でビットストリームから一旦分離されて生成された第2レイヤ符号化データを第2レイヤ復号化部203内の分離部2032へ入力し、分離部2032でさらにピッチ係数やインデックス等に分離しているが、これに限定されず、第2レイヤ復号化部203内に分離部2032を設けずに、分離部201で直接ビットストリームをピッチ係数やインデックス等に分離して第2レイヤ復号化部203へ入力してもよい。
また、上記実施の形態においてはスケーラブル符号化の階層数が2である場合を例に挙げて説明したが、これに限定されず、本発明は3以上の階層を持つスケーラブル符号化にも適用することができる。
また、上記実施の形態においては第2レイヤにおける変換符号化の方式としてMDCTを用いる場合を例に挙げて説明したが、これに限定されず、本発明では、FFT、DFT、DCT、フィルタバンク、Wavelet変換等、他の変換符号化方式を用いることもできる。
また、上記実施の形態においては入力信号が音声信号である場合を例に挙げて説明したが、これに限定されず、本発明はオーディオ信号にも適用することができる。
また、上記実施の形態に係る音声符号化装置や音声復号化装置を移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置に備えて、移動体通信における音声品質の劣化を防ぐことができる。また、無線通信移動局装置はUE、無線通信基地局装置はNode Bと表されることがある。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
本明細書は、2005年9月30日出願の特願2005−286533及び2006年7月21日出願の特願2006−199616に基づく。この内容はすべてここに含めておく。
本発明は、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の用途に適用することができる。
音声信号のスペクトル(従来)を示す図 スペクトル包絡(従来)を示す図 スペクトル微細構造(従来)を示す図 低域部のスペクトルを高域部に複数回複製した場合のスペクトル(従来)を示す図 本発明の動作原理の説明図(低域部の復号スペクトル) 本発明の動作原理の説明図(逆フィルタ通過後のスペクトル) 本発明の動作原理の説明図(高域部の符号化) 本発明の動作原理の説明図(復号信号のスペクトル) 本発明の実施の形態1に係る音声符号化装置のブロック構成図 上記音声符号化装置の第2レイヤ符号化部のブロック構成図 本発明の実施の形態1に係るフィルタリング部の動作説明図 本発明の実施の形態1に係る音声復号化装置のブロック構成図 上記音声復号化装置の第2レイヤ復号化部のブロック構成図 本発明の実施の形態2に係る音声符号化装置のブロック構成図 本発明の実施の形態2に係る音声復号化装置のブロック構成図 本発明の実施の形態3に係る音声符号化装置のブロック構成図 本発明の実施の形態3に係る音声復号化装置のブロック構成図 本発明の実施の形態4に係る音声符号化装置のブロック構成図 本発明の実施の形態4に係る音声復号化装置のブロック構成図 本発明の実施の形態5に係る音声符号化装置のブロック構成図 本発明の実施の形態5に係る音声復号化装置のブロック構成図 本発明の実施の形態5に係る音声符号化装置のブロック構成図(変形例1) 本発明の実施の形態5に係る音声符号化装置のブロック構成図(変形例2) 本発明の実施の形態5に係る音声復号化装置のブロック構成図(変形例1) 本発明の実施の形態6に係る第2レイヤ符号化部のブロック構成図 本発明の実施の形態6に係るスペクトル変形部のブロック構成図 本発明の実施の形態6に係る第2レイヤ復号化部のブロック構成図 本発明の実施の形態7に係るスペクトル変形部のブロック構成図 本発明の実施の形態8に係るスペクトル変形部のブロック構成図 本発明の実施の形態9に係るスペクトル変形部のブロック構成図 本発明の実施の形態10に係る第2レイヤ符号化部のブロック構成図 本発明の実施の形態10に係る第2レイヤ復号化部のブロック構成図 本発明の実施の形態11に係る第2レイヤ符号化部のブロック構成図 本発明の実施の形態11に係る第2レイヤ復号化部のブロック構成図 本発明の実施の形態12に係る第2レイヤ符号化部のブロック構成図 本発明の実施の形態12に係る第2レイヤ復号化部のブロック構成図

Claims (13)

  1. 音声信号の線形予測符号化(LPC)分析を行って、前記音声信号のLPC係数を算出する分析手段と、
    前記LPC係数の量子化を行って、LPC係数の符号化データを出力する量子化手段と、
    前記LPC係数を用いて前記音声信号のスペクトル包絡と逆の特性を持つ逆フィルタを構成し、前記逆フィルタを用いて前記音声信号のスペクトルを平坦化する平坦化手段と、
    平坦化された前記音声信号のスペクトルの閾値周波数より低い帯域である低域部のスペクトルを符号化する第1符号化手段と、
    平坦化された前記低域部のスペクトルを複製することにより、前記音声信号の前記閾値周波数より高い帯域であり、平坦化された高域部のスペクトルを符号化する第2符号化手段と、
    を具備し、
    前記第2符号化手段は、
    平坦化された前記低域部のスペクトルを用いて、平坦化された前記音声信号のスペクトルの高域部と最も類似する低域部の帯域を示すピッチ係数を特定する、
    音声符号化装置。
  2. 前記平坦化手段は、前記音声信号のLPC係数を用いて前記逆フィルタを構成する、
    請求項1記載の音声符号化装置。
  3. 前記平坦化手段は、前記音声信号の共振の程度に応じて平坦化の程度を変化させる、
    請求項1記載の音声符号化装置。
  4. 前記平坦化手段は、前記共振が強いほど前記平坦化の程度を弱める、
    請求項3記載の音声符号化装置。
  5. 前記第2符号化手段は、前記平坦化された低域部のスペクトルを変形させ、変形後の低域部のスペクトルを用いて前記高域部のスペクトルを符号化する、
    請求項1記載の音声符号化装置。
  6. 前記第2符号化手段は、前記平坦化された低域部のスペクトルのダイナミックレンジを前記高域部のスペクトルのダイナミックレンジに近づける変形を前記平坦化された低域部のスペクトルに施す、
    請求項5記載の音声符号化装置。
  7. 前記第2符号化手段は、複数の符号化候補においてダイナミックレンジを大きくする符号化候補よりダイナミックレンジを小さくする符号化候補を優先して用いて、前記平坦化された低域部のスペクトルを変形させる、
    請求項6記載の音声符号化装置。
  8. 前記第2符号化手段は、符号化候補探索用の目標値を小さくする修正を行い、その修正後の目標値に基づいて、前記平坦化された低域部のスペクトルの変形に用いる符号化候補を前記複数の符号化候補に対して探索する、
    請求項7記載の音声符号化装置。
  9. 前記第2符号化手段は、前記変形後の低域部のスペクトルから前記高域部のスペクトルを推定し、推定した高域部のスペクトルを変形させ、変形後の高域部のスペクトルを用いて前記音声信号の高域部のスペクトルを符号化する、
    請求項5記載の音声符号化装置。
  10. 前記第2符号化手段は、前記平坦化された低域部のスペクトルから前記高域部のスペクトルを推定し、推定した高域部のスペクトルを変形させ、変形後の高域部のスペクトルを用いて前記音声信号の高域部のスペクトルを符号化する、
    請求項1記載の音声符号化装置。
  11. 請求項1記載の音声符号化装置を備える無線通信移動局装置。
  12. 請求項1記載の音声符号化装置を備える無線通信基地局装置。
  13. 音声信号の線形予測符号化(LPC)分析を行って、前記音声信号のLPC係数を算出する分析工程と、
    前記LPC係数の量子化を行って、LPC係数の符号化データを出力する量子化工程と、
    前記LPC係数を用いて前記音声信号のスペクトル包絡と逆の特性を持つ逆フィルタを構成し、前記逆フィルタを用いて前記音声信号のスペクトルを平坦化する平坦化工程と、
    平坦化された前記音声信号のスペクトルの閾値周波数より低い帯域である低域部のスペクトルを符号化する第1符号化工程と、
    平坦化された前記低域部のスペクトルを複製することにより、前記音声信号の前記閾値周波数より高い帯域であり、平坦化された高域部のスペクトルを符号化する第2符号化工程と、
    を具備し、
    前記第2符号化工程では、
    平坦化された前記低域部のスペクトルを用いて、平坦化された前記音声信号のスペクトルの高域部と最も類似する低域部の帯域を示すピッチ係数を特定する、
    音声符号化方法。
JP2007537696A 2005-09-30 2006-09-29 音声符号化装置および音声符号化方法 Expired - Fee Related JP5089394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007537696A JP5089394B2 (ja) 2005-09-30 2006-09-29 音声符号化装置および音声符号化方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2005286533 2005-09-30
JP2005286533 2005-09-30
JP2006199616 2006-07-21
JP2006199616 2006-07-21
PCT/JP2006/319438 WO2007037361A1 (ja) 2005-09-30 2006-09-29 音声符号化装置および音声符号化方法
JP2007537696A JP5089394B2 (ja) 2005-09-30 2006-09-29 音声符号化装置および音声符号化方法

Publications (2)

Publication Number Publication Date
JPWO2007037361A1 JPWO2007037361A1 (ja) 2009-04-16
JP5089394B2 true JP5089394B2 (ja) 2012-12-05

Family

ID=37899782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007537696A Expired - Fee Related JP5089394B2 (ja) 2005-09-30 2006-09-29 音声符号化装置および音声符号化方法

Country Status (8)

Country Link
US (1) US8396717B2 (ja)
EP (1) EP1926083A4 (ja)
JP (1) JP5089394B2 (ja)
KR (1) KR20080049085A (ja)
CN (1) CN101273404B (ja)
BR (1) BRPI0616624A2 (ja)
RU (1) RU2008112137A (ja)
WO (1) WO2007037361A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
EP1783743A4 (en) * 2004-07-13 2007-07-25 Matsushita Electric Ind Co Ltd TONE HEIGHT FREQUENCY ESTABLISHMENT APPARATUS AND TONE HEIGHT FREQUENCY ESTIMATE METHOD
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
MY153594A (en) * 2008-07-11 2015-02-27 Fraunhofer Ges Forschung An apparatus and a method for calculating a number of spectral envelopes
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
JP5419876B2 (ja) * 2008-08-08 2014-02-19 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
CN101741504B (zh) * 2008-11-24 2013-06-12 华为技术有限公司 一种确定信号线性预测编码阶数的方法和装置
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
BRPI1008484A2 (pt) * 2009-02-26 2018-01-16 Panasonic Corp codificador, decodificador e método para os mesmos
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US8924220B2 (en) * 2009-10-20 2014-12-30 Lenovo Innovations Limited (Hong Kong) Multiband compressor
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP5753893B2 (ja) 2010-07-19 2015-07-22 ドルビー・インターナショナル・アーベー 高周波再構成の際のオーディオ信号処理
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
KR20130108281A (ko) * 2010-09-10 2013-10-02 파나소닉 주식회사 부호화 장치 및 부호화 방법
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
EP2806423B1 (en) * 2012-01-20 2016-09-14 Panasonic Intellectual Property Corporation of America Speech decoding device and speech decoding method
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
RU2740359C2 (ru) * 2013-04-05 2021-01-13 Долби Интернешнл Аб Звуковые кодирующее устройство и декодирующее устройство
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN104282312B (zh) * 2013-07-01 2018-02-23 华为技术有限公司 信号编码和解码方法以及设备
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
RU2750644C2 (ru) * 2013-10-18 2021-06-30 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование положений спектральных пиков
MY188538A (en) 2013-12-27 2021-12-20 Sony Corp Decoding device, method, and program
CN106463143B (zh) * 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
PL3139380T3 (pl) * 2014-05-01 2019-09-30 Nippon Telegraph And Telephone Corporation Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący
ES2840349T3 (es) * 2014-05-01 2021-07-06 Nippon Telegraph & Telephone Descodificación de una señal de sonido
US10418042B2 (en) * 2014-05-01 2019-09-17 Nippon Telegraph And Telephone Corporation Coding device, decoding device, method, program and recording medium thereof
US9838700B2 (en) * 2014-11-27 2017-12-05 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, and method and program for the same
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP2005510772A (ja) * 2001-11-29 2005-04-21 コーディング テクノロジーズ アクチボラゲット 高周波再構成を改善する方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2004062410A (ja) 2002-07-26 2004-02-26 Nippon Seiki Co Ltd 表示装置の表示方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005062410A (ja) * 2003-08-11 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号化方法
JP2005286533A (ja) 2004-03-29 2005-10-13 Nippon Hoso Kyokai <Nhk> データ伝送システム、データ送信装置、データ受信装置
US7848921B2 (en) 2004-08-31 2010-12-07 Panasonic Corporation Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
CN101061533B (zh) 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
EP1806737A4 (en) 2004-10-27 2010-08-04 Panasonic Corp TONE CODIER AND TONE CODING METHOD
CN102184734B (zh) 2004-11-05 2013-04-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
DE602005017660D1 (de) 2004-12-28 2009-12-24 Panasonic Corp Audiokodierungsvorrichtung und audiokodierungsmethode
JP4397826B2 (ja) 2005-01-20 2010-01-13 株式会社資生堂 粉末化粧料の成型方法
BRPI0608306A2 (pt) * 2005-04-01 2009-12-08 Qualcomm Inc sistemas, métodos e equipamentos para supressão de rajada em banda alta
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP2005510772A (ja) * 2001-11-29 2005-04-21 コーディング テクノロジーズ アクチボラゲット 高周波再構成を改善する方法

Also Published As

Publication number Publication date
KR20080049085A (ko) 2008-06-03
RU2008112137A (ru) 2009-11-10
US8396717B2 (en) 2013-03-12
CN101273404B (zh) 2012-07-04
EP1926083A4 (en) 2011-01-26
WO2007037361A1 (ja) 2007-04-05
CN101273404A (zh) 2008-09-24
BRPI0616624A2 (pt) 2011-06-28
US20090157413A1 (en) 2009-06-18
JPWO2007037361A1 (ja) 2009-04-16
EP1926083A1 (en) 2008-05-28

Similar Documents

Publication Publication Date Title
JP5089394B2 (ja) 音声符号化装置および音声符号化方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
EP2012305B1 (en) Audio encoding device, audio decoding device, and their method
JP4977471B2 (ja) 符号化装置及び符号化方法
JP4871894B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
US8315863B2 (en) Post filter, decoder, and post filtering method
JP5449133B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2009084221A1 (ja) 符号化装置、復号装置およびこれらの方法
JPWO2008072670A1 (ja) 符号化装置、復号装置、およびこれらの方法
JP4976381B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP4859670B2 (ja) 音声符号化装置および音声符号化方法
JPWO2008084688A1 (ja) 符号化装置、復号装置及びこれらの方法
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JP5236033B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120911

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees