Nothing Special   »   [go: up one dir, main page]

JP5173800B2 - 音声符号化装置、音声復号化装置、およびこれらの方法 - Google Patents

音声符号化装置、音声復号化装置、およびこれらの方法 Download PDF

Info

Publication number
JP5173800B2
JP5173800B2 JP2008513267A JP2008513267A JP5173800B2 JP 5173800 B2 JP5173800 B2 JP 5173800B2 JP 2008513267 A JP2008513267 A JP 2008513267A JP 2008513267 A JP2008513267 A JP 2008513267A JP 5173800 B2 JP5173800 B2 JP 5173800B2
Authority
JP
Japan
Prior art keywords
filter
spectrum
pitch
unit
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008513267A
Other languages
English (en)
Other versions
JPWO2007126015A1 (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2008513267A priority Critical patent/JP5173800B2/ja
Publication of JPWO2007126015A1 publication Critical patent/JPWO2007126015A1/ja
Application granted granted Critical
Publication of JP5173800B2 publication Critical patent/JP5173800B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、音声符号化装置、音声復号化装置、音声符号化方法、および音声復号化方法に関する。
移動体通信システムにおける電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、ユーザからは通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。
このように相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤと、入力信号と第1レイヤ復号信号との差分信号を音声以外の信号にも適したモデルで符号化する第2レイヤとを階層的に組み合わせる構成が検討されている。このような階層構造を持つ符号化方式は、符号化部から得られるビットストリームにスケーラビリティ性、すなわち、ビットストリームの一部を廃棄しても残りの情報から所定品質の復号信号が得られる性質を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化は、その特徴から、ビットレートの異なるネットワーク間の通信にも柔軟に対応できるため、IP(インターネットプロトコル)で多様なネットワークが統合されていく今後のネットワーク環境に適している。
従来のスケーラブル符号化技術として非特許文献1記載のものがある。非特許文献1では、MPEG−4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を構成している。具体的には、第1レイヤでは、音声信号に適したCELP(Code Excited Linear Prediction;符号励振線形予測)符号化を用い、第2レイヤにおいて、原信号から第1レイヤ復号信号を減じた残差信号に対し、AAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization;周波数領域重み付きインターリーブベクトル量子化)のような変換符号化を用いる。
また、変換符号化において、高能率にスペクトルの高域部を符号化する技術が非特許文献2で開示されている。非特許文献2では、スペクトルの低域部をピッチフィルタのフィルタ状態として利用し、スペクトルの高域部をピッチフィルタの出力信号として表している。このように、ピッチフィルタのフィルタ情報を少ないビット数で符号化することにより低ビットレート化を図ることができる。
三木弼一編著、「MPEG−4の全て(初版)」(株)工業調査会、1998年9月30日、p.126−127 押切他、「ピッチフィルタリングによる帯域拡張技術を用いた7/10/15kHz帯域スケーラブル音声符号化方式」音講論集3−11−4、2004年3月、pp.327−328
図1は、音声信号のスペクトル特性を説明するための図である。図1を見ると、音声信号は、基本周波数F0とその整数倍の周波数とにおいてスペクトルのピークが現れる調波構造(ハーモニクス)を有していることが分かる。非特許文献2の技術は、スペクトルの
低域部、例えば0〜4000Hzの帯域のスペクトルをピッチフィルタのフィルタ状態として利用し、例えば4000〜7000Hzの高域部の調波構造を維持するように高域部の符号化が行われる。
一方、音声信号の調波構造は、周波数が高くなるほど減衰する傾向にある。これは、有声部の声帯音源の調波構造が高域にいくほど減衰しているためである。このような音声信号に対して、スペクトルの低域部をピッチフィルタのフィルタ状態に利用して高域部を高能率に符号化する手法では、高域部の調波構造が実際よりも強く現れてしまい、音声品質が劣化してしまうことがある。
また、図2は、別の音声信号のスペクトル特性を説明するための図である。この図に示すように、低域部では調波構造が存在するものの高域部では調波構造がほとんど消失してしまい、雑音的なスペクトル特性になっていることがわかる。例えばこの図では、約4500Hzが、スペクトル特性に違いが現れる境界となっている。このような音声信号において、スペクトルの低域部を利用して高域部を高能率に符号化する手法を適用した場合、高域部の雑音成分が不足してしまい、音声品質が劣化してしまうことがある。
本発明の目的は、スペクトルの低域部を利用して高域部を高能率に符号化する場合において、音声信号の一部の区間において調波構造が崩れている場合でも、復号信号の音質劣化を防止することができる音声符号化装置等を提供することである。
本発明の音声符号化装置は、入力信号の低域部を符号化して第1符号化データを生成する第1符号化手段と、前記第1符号化データを復号して第1復号信号を生成する第1復号化手段と、マルチタップを有し、かつ前記低域部の調波構造の鈍化を行うフィルタパラメータにより構成されるピッチフィルタと、前記第1復号信号のスペクトルに基づいて前記ピッチフィルタのフィルタ状態を設定し、前記入力信号の高域部の雑音性情報に基づいて前記フィルタパラメータを制御するとともに、前記ピッチフィルタにおける前記フィルタパラメータを用いたピッチフィルタリング処理により前記低域部から前記高域部を推定し、前記高域部の推定結果である前記ピッチフィルタのフィルタ情報を第2符号化データとする第2符号化手段と、を具備する構成を採る。
本発明によれば、スペクトルの低域部を利用して高域部を高能率に符号化する場合において、音声信号の一部の区間において調波構造が崩れている場合でも、復号信号の音質劣化を防止することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図3は、本発明の実施の形態1に係る音声符号化装置100の主要な構成を示すブロック図である。なお、ここでは、第1レイヤおよび第2レイヤ共に、周波数領域で符号化を行う構成を例にとって説明する。
音声符号化装置100は、周波数領域変換部101、第1レイヤ符号化部102、第1レイヤ復号化部103、第2レイヤ符号化部104、および多重化部105を備え、第1レイヤおよび第2レイヤ共に、周波数領域における符号化を行う。
音声符号化装置100の各部は以下の動作を行う。
周波数領域変換部101は、入力信号の周波数分析を行い、変換係数の形式で入力信号のスペクトル(入力スペクトル)を求める。具体的には、周波数領域変換部101は、例えば、MDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を用いて時間領域信号を周波数領域信号へ変換する。入力スペクトルは第1レイヤ符号化部102および第2レイヤ符号化部104へ出力される。
第1レイヤ符号化部102は、TwinVQ(Transform Domain Weighted Interleave
Vector Quantization)やAAC(Advanced Audio Coder)等を用いて入力スペクトルの低域部0≦k<FLの符号化を行い、この符号化にて得られる第1レイヤ符号化データを、第1レイヤ復号化部103および多重化部105へ出力する。
第1レイヤ復号化部103は、第1レイヤ符号化データの復号を行って第1レイヤ復号スペクトルを生成し、第2レイヤ符号化部104へ出力する。なお、第1レイヤ復号化部103は、時間領域に変換される前の第1レイヤ復号スペクトルを出力する。
第2レイヤ符号化部104は、第1レイヤ復号化部103で得られた第1レイヤ復号スペクトルを用いて、周波数領域変換部101から出力される入力スペクトル[0≦k<FH]の高域部FL≦k<FHの符号化を行い、この符号化にて得られる第2レイヤ符号化データを多重化部105へ出力する。具体的には、第2レイヤ符号化部104は、第1レ
イヤ復号スペクトルをピッチフィルタのフィルタ状態に用い、ピッチフィルタリング処理により入力スペクトルの高域部を推定する。この際、第2レイヤ符号化部104は、スペクトルの調波構造を崩さないように入力スペクトルの高域部を推定する。また、第2レイヤ符号化部104は、ピッチフィルタのフィルタ情報を符号化する。第2レイヤ符号化部104の詳細については後述する。
多重化部105は、第1レイヤ符号化データおよび第2レイヤ符号化データを多重化し、符号化データとして出力する。この符号化データは、音声符号化装置100を搭載する無線送信装置の送信処理部等(図示せず)を介してビットストリームに重畳され、無線受信装置に伝送される。
図4は、上記の第2レイヤ符号化部104内部の主要な構成を示すブロック図である。
第2レイヤ符号化部104は、フィルタ状態設定部112、フィルタリング部113、探索部114、ピッチ係数設定部115、ゲイン符号化部116、多重化部117、雑音性分析部118、およびフィルタ係数決定部119を備え、各部は以下の動作を行う。
フィルタ状態設定部112は、第1レイヤ復号化部103から第1レイヤ復号スペクトルS1(k)[0≦k<FL]が入力される。フィルタ状態設定部112は、この第1レイヤ復号スペクトルを用いて、フィルタリング部113で用いられるフィルタ状態を設定する。
雑音性分析部118は、周波数領域変換部101から出力される入力スペクトルS2(k)の高域部FL≦k<FHの雑音性を分析し、この分析結果を示す雑音性情報をフィルタ係数決定部119および多重化部117へ出力する。雑音性情報としては、例えば、スペクトラル・フラットネス・メジャー(SFM)を用いる。SFMは、振幅スペクトルの幾何平均に対する算術平均の比(=幾何平均/算術平均)で表され、スペクトルのピーク性が強いほどSFMは0.0に、雑音性が強いほど1.0に近づく。なお、雑音性情報としては、振幅スペクトルのエネルギーを正規化した後に分散値を求め、これを雑音性情報としても良い。
フィルタ係数決定部119は、複数のフィルタ係数の候補が記憶されており、雑音性分析部118から出力される雑音性情報に応じて、これら複数候補の中から1つのフィルタ係数を選択し、フィルタリング部113へ出力する。詳細は後述する。
フィルタリング部113は、マルチタップ(タップ数が1より多い)のピッチフィルタを備える。フィルタリング部113は、フィルタ状態設定部112で設定されたフィルタ状態と、ピッチ係数設定部115から出力されるピッチ係数、フィルタ係数決定部119から出力されるフィルタ係数とに基づいて、第1レイヤ復号スペクトルのフィルタリングを行い、入力スペクトルの推定スペクトルS2'(k)を算出する。詳細は後述する。
ピッチ係数設定部115は、探索部114の制御の下、ピッチ係数Tを予め定められた探索範囲Tmin〜Tmaxの中で少しずつ変化させながら、フィルタリング部113へ順次出力する。
探索部114は、周波数領域変換部101から出力される入力スペクトルS2(k)の高域部FL≦k<FHと、フィルタリング部113から出力される推定スペクトルS2'(k)との類似度を算出する。この類似度の算出は、例えば相関演算等により行われる。フィルタリング部113−探索部114−ピッチ係数設定部115の処理は閉ループとなっており、探索部114は、ピッチ係数設定部115から出力されるピッチ係数Tを種々に変
化させることにより、各ピッチ係数に対応する類似度を算出する。そして、算出される類似度が最大となるピッチ係数、すなわち最適なピッチ係数T’(但しTmin〜Tmaxの範囲)を多重化部117へ出力する。また、探索部114は、このピッチ係数T’に対応する入力スペクトルの推定値S2'(k)をゲイン符号化部116へ出力する。
ゲイン符号化部116は、周波数領域変換部101から出力される入力スペクトルS2(k)の高域部FL≦k<FHに基づいて、入力スペクトルS2(k)のゲイン情報を算出する。具体的には、ゲイン情報をサブバンド毎のスペクトルパワで表し、周波数帯域FL≦k<FHをJ個のサブバンドに分割する。このとき、第jサブバンドのスペクトルパワB(j)は以下の式(1)で表される。
Figure 0005173800
式(1)において、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。このようにして求めた入力スペクトルのサブバンド情報を入力スペクトルのゲイン情報とみなす。また、ゲイン符号化部116は、同様に、入力スペクトルの推定値S2'(k)のサブバンド情報B’(j)を以下の式(2)に従い算出し、サブバンド毎の変動量V(j)を式(3)に従い算出する。
Figure 0005173800
Figure 0005173800
そして、ゲイン符号化部116は、変動量V(j)を符号化し、符号化後の変動量V(j)に対応するインデックスを多重化部117へ出力する。
多重化部117は、探索部114から出力される最適なピッチ係数T’と、ゲイン符号化部116から出力される変動量V(j)のインデックスと、雑音性分析部118から出力される雑音性情報とを多重化し、第2レイヤ符号化データとして多重化部105へ出力する。なお、多重化部117で多重化せずに、多重化部105でまとめて多重化しても良い。
次いで、フィルタ係数決定部119の処理、すなわち、入力スペクトルS2(k)の高域部FL≦k<FHの雑音性に基づいてフィルタリング部113のフィルタ係数を決定する処理、について詳述する。
フィルタ係数決定部119に格納されているフィルタ係数の候補は、相互を比較すると、スペクトルを平滑化する程度がそれぞれ異なっている。スペクトルの平滑化の程度は、隣接するフィルタ係数同士の差の大きさで定まり、隣接するフィルタ係数同士の差が大きいフィルタ係数の候補はスペクトルの平滑化の程度が小さく、隣接するフィルタ係数同士の差が小さいフィルタ係数の候補はスペクトルの平滑化の程度が大きくなる。
そして、フィルタ係数決定部119において、フィルタ係数の候補は、隣接するフィル
タ係数同士の差が大きいものから小さいものへと順に、すなわち、スペクトルを平滑化する程度が弱いものから強いものへと順に配列されている。そこで、フィルタ係数決定部119は、雑音性分析部118から出力される雑音性情報を閾値判定することにより、その雑音性の程度を認識し、複数あるフィルタ係数の候補のうち、いずれの候補を対応させるべきか(用いるべきか)を決定する。
例えば、タップ数が3の場合、フィルタ係数の候補は(β−1、β、β)となる。そして、各成分が具体的には(β−1、β、β)=(0.1、0.8、0.1)、(0.2、0.6、0.2)、(0.3、0.4、0.3)であるとすると、各候補はフィルタ係数決定部119において、(0.1、0.8、0.1)、(0.2、0.6、0.2)、(0.3、0.4、0.3)の順に格納されている。
かかる場合、フィルタ係数決定部119は、雑音性分析部118から出力される雑音性情報を所定の複数の閾値と比較することにより、雑音性の程度が、弱いか、中程度か、あるいは強いかを判定する。そして、例えば、雑音性の程度が弱い場合には候補(0.1、0.8、0.1)を選択し、雑音性の程度が中程度の場合には候補(0.2、0.6、0.2)を選択し、雑音性の程度が強い場合には候補(0.3、0.4、0.3)を選択し、この選択したフィルタ係数をフィルタリング部113へ出力する。
次いで、フィルタリング部113でのフィルタリング処理の詳細について、図5を用いて説明する。
フィルタリング部113は、ピッチ係数設定部115から出力されるピッチ係数Tを用いて、帯域FL≦k<FHのスペクトルを生成する。ここで、全周波数帯域0≦k<FHのスペクトルを便宜的にS(k)と呼び、フィルタ関数は以下の式(4)で表されるものを使用する。
Figure 0005173800
この式において、Tはピッチ係数設定部115から与えられるピッチ係数、βはフィルタ係数決定部119から与えられるフィルタ係数を表している。またM=1とする。
S(k)の0≦k<FLの帯域には、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態(フィルタ状態)として格納される。
S(k)のFL≦k<FHの帯域には、以下の手順のフィルタリング処理により、入力スペクトルの推定値S2'(k)が格納される。すなわち、S2'(k)には、基本的に、このkよりTだけ低い周波数のスペクトルS(k−T)が代入される。但し、スペクトルの円滑性を増すために、実際には、スペクトルS(k−T)からiだけ離れた近傍のスペクトルS(k−T+i)に、所定のフィルタ係数βを乗じたスペクトルβ・S(k−T+i)を、全てのiについて加算したスペクトルをS2'(k)に代入する。この処理は以下の式(5)で表される。
Figure 0005173800
上記演算を、周波数の低いk=FLから順に、kをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける入力スペクトルの推定値S2'(k)を算出する。
以上のフィルタリング処理は、ピッチ係数設定部115からピッチ係数Tが与えられる度に、FL≦k<FHの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部114へ出力される。
このように、本実施の形態に係る音声符号化装置100は、フィルタリング部113で使用されるピッチフィルタのフィルタ係数を制御することにより、低域スペクトルに平滑化を施してから、この低域スペクトルを用いて高域部の符号化を行う。換言すると、本実施の形態では、低域スペクトルを平滑化することにより、この低域スペクトルに含まれる鋭敏なピーク、すなわち調波構造を鈍化させてから、この低域スペクトルに基づいて推定スペクトル(高域スペクトル)を生成している。よって、高域スペクトルの調波構造が鈍化する効果がある。本明細書では、特に、この処理を非調波構造化と呼ぶこととする。
次いで、音声符号化装置100に対応する本実施の形態に係る音声復号化装置150について説明する。図6は、音声復号化装置150の主要な構成を示すブロック図である。この音声復号化装置150は、図3に示した音声符号化装置100で生成された符号化データを復号するものである。各部は以下の動作を行う。
分離部151は、無線送信装置から伝送されたビットストリームに重畳された符号化データを、第1レイヤ符号化データおよび第2レイヤ符号化データに分離し、第1レイヤ符号化データを第1レイヤ復号化部152へ、第2レイヤ符号化データを第2レイヤ復号化部153へ出力する。また、分離部151は、上記ビットストリームから、どのレイヤの符号化データが含まれているかを表すレイヤ情報を分離し、判定部154へ出力する。
第1レイヤ復号化部152は、第1レイヤ符号化データに対して復号処理を行って第1レイヤ復号スペクトルS1(k)を生成し、第2レイヤ復号化部153および判定部154へ出力する。
第2レイヤ復号化部153は、第2レイヤ符号化データおよび第1レイヤ復号スペクトルS1(k)を用いて、第2レイヤ復号スペクトルを生成し、判定部154へ出力する。なお、第2レイヤ復号化部153の詳細については後述する。
判定部154は、分離部151から出力されるレイヤ情報に基づき、ビットストリームに重畳された符号化データに第2レイヤ符号化データが含まれているか否か判定する。ここで、音声符号化装置100を搭載する無線送信装置は、ビットストリームに第1レイヤ符号化データおよび第2レイヤ符号化データの双方を含めて送信するが、通信経路の途中において第2レイヤ符号化データが廃棄される場合がある。そこで、判定部154は、レイヤ情報に基づき、ビットストリームに第2レイヤ符号化データが含まれているか否かを判定する。そして、判定部154は、ビットストリームに第2レイヤ符号化データが含まれていない場合、第2レイヤ復号化部153によって第2レイヤ復号スペクトルが生成されないため、第1レイヤ復号スペクトルを時間領域変換部155へ出力する。但し、かかる場合、第2レイヤ符号化データが含まれている場合の復号スペクトルと次数を一致させるために、判定部154は、第1レイヤ復号スペクトルの次数をFHまで拡張し、FL〜FHの帯域のスペクトルを0として出力する。一方、ビットストリームに第1レイヤ符号化データおよび第2レイヤ符号化データの双方が含まれている場合、判定部154は、第2レイヤ復号スペクトルを時間領域変換部155へ出力する。
時間領域変換部155は、判定部154から出力される復号スペクトルを時間領域信号に変換して復号信号を生成し、出力する。
図7は、上記の第2レイヤ復号化部153内部の主要な構成を示すブロック図である。
分離部163は、分離部151から出力される第2レイヤ符号化データを、フィルタリングに関する情報(最適なピッチ係数T’)と、ゲインに関する情報(変動量V(j)のインデックス)と、雑音性情報とに分離し、フィルタリングに関する情報をフィルタリング部164へ出力し、ゲインに関する情報をゲイン復号化部165に出力し、雑音性情報をフィルタ係数決定部161へ出力する。なお、分離部151においてこれら情報を分離済みであれば、分離部163は用いなくて良い。
フィルタ係数決定部161は、図4に示した第2レイヤ符号化部104内部のフィルタ係数決定部119に対応する構成である。フィルタ係数決定部161は、複数のフィルタ係数(ベクトル値)の候補が記憶されており、分離部163から出力される雑音性情報に応じて、複数候補の中から1つのフィルタ係数を選択し、フィルタリング部164へ出力する。フィルタ係数決定部161に格納されているフィルタ係数の候補は、それぞれ、スペクトルを平滑化する程度が異なっている。また、これらフィルタ係数の候補は、スペクトルを平滑化する程度が弱いものから強いものへと順に並んでいる。フィルタ係数決定部161は、分離部163から出力される雑音性情報に応じて、非調波構造化の程度の異なる複数のフィルタ係数の候補の中から1つの候補を選択し、選択したフィルタ係数をフィルタリング部164へ出力する。
フィルタ状態設定部162は、音声符号化装置100内部のフィルタ状態設定部112に対応する構成である。フィルタ状態設定部162は、第1レイヤ復号化部152から出力される第1レイヤ復号スペクトルS1(k)を、フィルタリング部164で用いるフィルタ状態として設定する。ここで、全周波数帯域0≦k<FHのスペクトルを便宜的にS(k)と呼び、S(k)の0≦k<FLの帯域には、第1レイヤ復号スペクトルS1(k)がフィルタの内部状態(フィルタ状態)として格納される。
フィルタリング部164は、フィルタ状態設定部162で設定されたフィルタ状態と、分離部163から出力されるピッチ係数T’と、フィルタ係数決定部161から出力されるフィルタ係数とに基づき、第1レイヤ復号スペクトルS1(k)のフィルタリングを行い、上記式(5)に従う全帯域スペクトルS2(k)の推定値S2'(k)を算出する。フィルタリング部164でも、上記式(4)に示したフィルタ関数が用いられる。
ゲイン復号化部165は、分離部163から出力されるゲイン情報を復号し、変動量V(j)の量子化値である変動量V(j)を求める。
スペクトル調整部166は、フィルタリング部164から出力される推定スペクトルS2'(k)に、ゲイン復号化部165から出力されるサブバンド毎の変動量V(j)を、以下の式(6)に従って乗じることにより、推定スペクトルS2'(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、復号スペクトルS3(k)を生成する。
Figure 0005173800
なお、復号スペクトルS3(k)の低域部0≦k<FLは第1レイヤ復号スペクトルS1(k)から成り、復号スペクトルS3(k)の高域部FL≦k<FHは調整後の推定スペクトルS2'(k)から成る。この調整後の復号スペクトルS3(k)は、第2レイヤ復号
スペクトルとして判定部154へ出力される。
このようにして、音声復号化装置150は、音声符号化装置100で生成された符号化データを復号することができる。
以上説明したように、本実施の形態によれば、マルチタップのピッチフィルタを備え、スペクトルの低域部を利用して高域部を高能率に符号化する符号化/復号化方法において、フィルタ係数等のフィルタパラメータを制御することにより、スペクトルの低域部に非調波構造化を施した後に、高域部のスペクトルを符号化する。すなわち、スペクトルの高域部の調波構造を減衰させるピッチフィルタを用いて、低域スペクトルから高域スペクトルの予測を行う。なお、本実施の形態において非調波構造化とは、スペクトルに対し平滑化を行うことである。
これにより、ピッチフィルタ処理で生成されるスペクトルの高域部の調波構造が、強く現れ過ぎたり、高域部の雑音成分が不足したりすることによる音質劣化を回避することができ、復号信号の高音質化を実現することができる。
なお、本実施の形態では、フィルタパラメータとして、隣接するフィルタ係数同士の差が異なっているようなフィルタ係数を用いる構成を例にとって説明した。しかし、フィルタパラメータはこれに限定されず、ピッチフィルタのタップ数(フィルタ次数)、雑音ゲイン情報等を用いるような構成としても良い。例えば、フィルタパラメータとして、ピッチフィルタのタップ数を用いる場合、以下のようになる。なお、雑音ゲイン情報を用いる場合の構成については、実施の形態2において詳述する。
かかる場合、フィルタ係数決定部119に記憶されているフィルタ係数の各候補は、それぞれ異なるタップ数(フィルタ次数)を有することとなる。すなわち、雑音性情報に応じてフィルタ係数のタップ数を選択する。このような手法を採ることにより、ピッチフィルタのタップ数が大きい程、スペクトル平滑化の程度が大きくなるピッチフィルタを設計し易くなり、この性質を利用して、スペクトルの高域部の調波構造を大きく減衰させるピッチフィルタを構成することが可能になる。
例えば、各フィルタ係数が、タップ数として3または5のいずれかを採る場合の例を以下に示す。図8の(a)はフィルタ係数のタップ数が3の場合における高域スペクトルの生成処理の概要を示す図であり、図8の(b)はフィルタ係数タップ数が5の場合における高域スペクトルの生成処理の概要を示す図である。タップ数が3の場合のフィルタ係数を(β−1、β、β)=(1/3、1/3、1/3)、タップ数が5の場合のフィルタ係数を(β−2、β−1、β、β、β)=(1/5、1/5、1/5、1/5、1/5)とする。タップ数が大きいフィルタ係数ほどスペクトルの平滑化の程度は大きくなる。そこで、フィルタ係数決定部119は、雑音性分析部118から出力される雑音性情報に応じて、非調波構造化の程度の異なる複数のタップ数の候補の中から1つの候補を選択し、フィルタリング部113へ出力する。具体的には、雑音性が弱い場合にはタップ数3のフィルタ係数の候補を選択し、雑音性が強い場合にはタップ数5のフィルタ係数の候補を選択する。
このような手法によっても、スペクトルの平滑化の程度の異なる複数のフィルタ係数の候補を用意することができる。なお、ピッチフィルタのタップ数が奇数の場合を例にとって説明を行ったが、これに限らず、ピッチフィルタのタップ数は偶数であっても良い。
また、本実施の形態では、非調波構造化として、スペクトルの平滑化を行う構成を例にとって説明したが、非調波構造化として、当該スペクトルに雑音成分を付与するような処
理を行う構成であっても良い。
また、本実施の形態は、以下に示すような構成も採り得る。図9は、音声符号化装置100の別の構成100aを示すブロック図である。また、図10は、対応する音声復号化装置150aの主要な構成を示すブロック図である。音声符号化装置100および音声復号装置150と同様の構成については同一の符号を付し、基本的に、詳細な説明は省略する。
図9において、ダウンサンプリング部121は、時間領域の入力音声信号をダウンサンプリングして、所望のサンプリングレートに変換する。第1レイヤ符号化部102は、ダウンサンプリング後の時間領域信号に対し、CELP符号化を用いて符号化を行い、第1レイヤ符号化データを生成する。第1レイヤ復号化部103は、第1レイヤ符号化データを復号して第1レイヤ復号信号を生成する。周波数領域変換部122は、第1レイヤ復号信号の周波数分析を行って第1レイヤ復号スペクトルを生成する。遅延部123は、入力音声信号に対し、ダウンサンプリング部121−第1レイヤ符号化部102−第1レイヤ復号化部103−周波数領域変換部122で生じる遅延に相当する遅延を与える。周波数領域変換部124は、遅延後の入力音声信号の周波数分析を行って入力スペクトルを生成する。第2レイヤ符号化部104は、第1レイヤ復号スペクトルおよび入力スペクトルを用いて第2レイヤ符号化データを生成する。多重化部105は、第1レイヤ符号化データおよび第2レイヤ符号化データを多重化し、符号化データとして出力する。
また、図10において、第1レイヤ復号化部152は、分離部151から出力される第1レイヤ符号化データを復号して第1レイヤ復号信号を得る。アップサンプリング部171は、第1レイヤ復号信号のサンプリングレートを入力信号と同じサンプリングレートに変換する。周波数領域変換部172は、第1レイヤ復号信号を周波数分析して第1レイヤ復号スペクトルを生成する。第2レイヤ復号化部153は、分離部151から出力される第2レイヤ符号化データを、第1レイヤ復号スペクトルを用いて復号し、第2レイヤ復号スペクトルを得る。時間領域変換部173は、第2レイヤ復号スペクトルを時間領域信号に変換し、第2レイヤ復号信号を得る。判定部154は、分離部151から出力されるレイヤ情報に基づき、第1レイヤ復号信号または第2レイヤ復号信号の一方を出力する。
このように、上記バリエーションでは、第1レイヤ符号化部102が時間領域で符号化処理を行う。第1レイヤ符号化部102では、音声信号を低ビットレートで高品質に符号化できるCELP符号化が用いられる。よって、第1レイヤ符号化部102でCELP符号化が使用されるため、スケーラブル符号化装置全体のビットレートを小さくすることが可能となり、かつ高品質化も実現できる。また、CELP符号化は、変換符号化に比べて原理遅延(アルゴリズム遅延)を短くすることができるため、スケーラブル符号化装置全体の原理遅延も短くなり、双方向通信に適した音声符号化処理および復号化処理を実現することができる。
(実施の形態2)
本発明の実施の形態2では、フィルタパラメータとして雑音ゲイン情報を用いる。すなわち、入力スペクトルの雑音性に応じて、非調波構造化の程度の異なる複数の雑音ゲイン情報の候補の中から1つを決定する。
本実施の形態に係る音声符号化装置の基本的構成は、実施の形態1に示した音声符号化装置100(図3参照)と同様である。よって、その説明を省略し、実施の形態1と異なる構成である第2レイヤ符号化部104bについて以下説明する。
図11は、第2レイヤ符号化部104bの主要な構成を示すブロック図である。なお、
第2レイヤ符号化部104bの構成も、実施の形態1に示した第2レイヤ符号化部104(図4参照)と同様であり、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部104bは、雑音信号生成部201、雑音ゲイン乗算部202、およびフィルタリング部203を備える点が、第2レイヤ符号化部104と異なる。
雑音信号生成部201は、雑音信号を生成して雑音ゲイン乗算部202へ出力する。雑音信号としては、平均値がゼロとなるように算出されたランダム信号や、あらかじめ設計しておいた信号系列を用いる。
雑音ゲイン乗算部202は、雑音性分析部118から与えられる雑音性情報に応じて、複数の雑音ゲイン情報の候補の中から1つを選択し、この雑音ゲイン情報に対し雑音信号生成部201から与えられる雑音信号を乗じ、乗算後の雑音信号をフィルタリング部203へ出力する。この雑音ゲイン情報が大きい程、スペクトルの高域部の調波構造を減衰させることができる。雑音ゲイン乗算部202に格納されている雑音ゲイン情報の候補は、予め設計されており、通常は、音声符号化装置と音声復号化装置とで共通の候補が格納されている。例えば、雑音ゲイン情報の候補として、{G1、G2、G3}の3種類の候補が格納され、0<G1<G2<G3の関係があるものとすると、雑音ゲイン乗算部202は、雑音性分析部118から雑音性の程度が小さいという雑音情報が与えられた場合には候補G1、雑音性の程度が中程度の場合にはG2、雑音性の程度が大きい場合には候補G3を選択する。
フィルタリング部203は、ピッチ係数設定部115から出力されるピッチ係数Tを用いて、帯域FL≦k<FHのスペクトルを生成する。ここで、全周波数帯域0≦k<FHのスペクトルを便宜的にS(k)と呼び、フィルタ関数は式(7)で表されるものを使用する。
Figure 0005173800
この式において、Gnは選択された雑音ゲイン情報を表し、{G1、G2、G3}のいずれかである。また、Tはピッチ係数設定部115から与えられるピッチ係数を表している。なお、M=1とする。
S(k)の0≦k<FLの帯域には、第1レイヤ復号スペクトルS1(k)がフィルタのフィルタ状態として格納される。
S(k)のFL≦k<FHの帯域には、以下の手順のフィルタリング処理により、入力スペクトルの推定値S2'(k)が格納される(図12参照)。この図に示すように、S2'(k)には、基本的に、このkよりTだけ低い周波数のスペクトルS(k−T)に、雑音ゲイン情報G乗算後の雑音信号G・c(k)を加算したスペクトルが代入される。但し、スペクトルの円滑性を増すために、実際には、スペクトルS(k−T)からiだけ離れた近傍のスペクトルS(k−T+i)に、所定のフィルタ係数βを乗じたスペクトルβ・S(k−T+i)を、全てのiについて加算したスペクトルが、S(k−T)の代わりに使用される。すなわち、S2'(k)には、式(8)により表されるスペクトルが代入される。
Figure 0005173800
そしてこの演算を、周波数の低い方(k=FL)から順にkをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける入力スペクトルの推定値S2'(k)が算出される。
このように、本実施の形態に係る音声符号化装置は、雑音性分析部118で得られる雑音性情報に応じた雑音成分を、フィルタリング部203においてスペクトルの高域部に加算する。よって、入力スペクトルの高域部の雑音性が大きいほど、推定スペクトルの高域部に付与される雑音成分は大きくなる。換言すると、本実施の形態では、低域スペクトルから高域スペクトルを推定する過程において雑音成分を加算することにより、推定スペクトル(高域スペクトル)に含まれる鋭敏なピーク、すなわち調波構造を鈍化させている。本明細書では、この処理も非調波構造化と呼ぶこととする。
次いで、本実施の形態に係る音声復号化装置について説明する。なお、本実施の形態に係る音声復号化装置の基本的構成は、実施の形態1に示した音声復号化装置150(図7参照)と同様である。よって、その説明を省略し、実施の形態1と異なる構成である第2レイヤ復号化部153bについて以下説明する。
図13は、第2レイヤ復号化部153bの主要な構成を示すブロック図である。なお、第2レイヤ復号化部153bの構成も、実施の形態1に示した第2レイヤ復号化部153(図7参照)と同様であり、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ復号化部153bは、雑音信号生成部251および雑音ゲイン乗算部252を備える点が、第2レイヤ復号化部153と異なる。
雑音信号生成部251は、雑音信号を生成して雑音ゲイン乗算部252へ出力する。雑音信号としては、平均値がゼロとなるように算出されたランダム信号や、あらかじめ設計しておいた信号系列を用いる。
雑音ゲイン乗算部252は、分離部163から出力される雑音性情報に従い、格納されている複数の雑音ゲイン情報の候補の中から1つを選択し、この雑音ゲイン情報に対し雑音信号生成部251から与えられる雑音信号を乗じ、乗算後の雑音信号をフィルタリング部164へ出力する。以降の動作は、実施の形態1で示した通りである。
このようにして、本実施の形態に係る音声復号化装置は、本実施の形態に係る音声符号化装置で生成された符号化データを復号することができる。
以上説明したように、本実施の形態によれば、推定スペクトルの高域部に雑音成分を付与することにより調波構造の鈍化を行う。よって、本実施の形態によっても、実施の形態1と同様に、高域部の雑音性の不足に起因する音質劣化を回避し、高音質化を実現することができる。
なお、本実施の形態では、入力スペクトルの雑音性を用いる構成を例にとって説明したが、入力スペクトルの代わりに、第1レイヤ復号スペクトルの雑音性を用いるような構成としても良い。
また、雑音信号に乗じる雑音ゲイン情報は、入力スペクトルの推定値S2'(k)の平均振幅の大きさに応じて変わるような構成としても良い。すなわち、入力スペクトルの推定値S2'(k)の平均振幅に応じて雑音ゲイン情報を算出するようにする。
上記処理を具体的に説明すると、まず式(8)においてGn=0とおいて入力スペクトルの推定値S2'(k)を算出し(すなわち、式(5)を用いてS2'(k)を算出し)、この入力スペクトルの推定値S2'(k)の平均エネルギーES2'を求める。同様に、雑音信号c(k)の平均エネルギーECを求め、次式(9)に従い雑音ゲイン情報を求める。
Figure 0005173800
ここで、Anは雑音ゲイン情報の相対値を表し、例えば、雑音ゲイン情報の相対値の候補として、{A1、A2、A3}の3種類の候補が格納され、0<A1<A2<A3の関係があるものとする。そして、雑音性分析部118からの雑音性の程度が小さいという雑音情報が与えられた場合には候補A1、雑音性の程度が中程度の場合にはA2、雑音性の程度が大きい場合には候補A3を選択する。
このように雑音ゲイン情報を求めることにより、入力スペクトルの推定値S2'(k)の平均振幅値に応じて、雑音信号c(k)に乗じる雑音ゲイン情報が適応的に算出されるようになり、音声品質が改善されるようになる。
(実施の形態3)
本発明の実施の形態3に係る音声符号化装置の基本的構成も、実施の形態1に示した音声符号化装置100と同様である。よって、その説明を省略し、実施の形態1と異なる構成である第2レイヤ符号化部104cについて以下説明する。
図14は、第2レイヤ符号化部104cの主要な構成を示すブロック図である。なお、第2レイヤ符号化部104cの構成も、実施の形態1に示した第2レイヤ符号化部104と同様であり、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部104cは、雑音性分析部301に与えられる入力信号が第1レイヤ復号スペクトルになっている点が、第2レイヤ符号化部104と異なる。
雑音性分析部301は、第1レイヤ復号化部103から出力される第1レイヤ復号スペクトルの雑音性を、実施の形態1で示した雑音性分析部118と同様の手法により分析し、この分析結果を示す雑音性情報をフィルタ係数決定部119へ出力する。すなわち、本実施の形態では、第1レイヤの符号化で得られる第1レイヤ復号スペクトルの雑音性に応じて、ピッチフィルタのフィルタパラメータを決定する。
また、雑音性分析部301は、雑音性情報を多重化部117へ出力しない。すなわち、本実施の形態では、以下に示すように、音声復号化装置において雑音性情報を生成することができるため、本実施の形態に係る音声符号化装置から音声復号化装置へ雑音性情報は伝送されない。
本実施の形態に係る音声復号化装置の基本的構成も、実施の形態1に示した音声復号化装置150と同様であるため、説明を省略し、実施の形態1と異なる構成である第2レイヤ復号化部153cについて以下説明する。
図15は、第2レイヤ復号化部153cの主要な構成を示すブロック図である。実施の形態1に示した第2レイヤ復号化部153と同様の構成要素には同一の符号を付し、説明を省略する。
第2レイヤ復号化部153cは、雑音性分析部351に与えられる入力信号が第1レイヤ復号スペクトルになっている点が、第2レイヤ復号化部153と異なる。
雑音性分析部351は、第1レイヤ復号化部152から出力される第1レイヤ復号スペクトルの雑音性を分析し、この分析結果である雑音性情報をフィルタ係数決定部352へ出力する。よって、分離部163aからフィルタ係数決定部352へは付加情報は入力されない。
フィルタ係数決定部352は、複数のフィルタ係数(ベクトル値)の候補が記憶されており、雑音性分析部351から出力される雑音性情報に応じて、複数候補の中から1つのフィルタ係数を選択し、フィルタリング部164へ出力する。
このように、本実施の形態によれば、第1レイヤの符号化で得られる第1レイヤ復号スペクトルの雑音性に応じて、ピッチフィルタのフィルタパラメータを決定する。これにより、音声符号化装置は、付加情報を音声復号化装置に伝送する必要が無くなり、ビットレートを低減することができる。
(実施の形態4)
本発明の実施の形態4では、フィルタパラメータの候補を選択する際に、入力スペクトルの高域部との類似度が大きい推定スペクトルを生成することができるようなフィルタパラメータを選択する。すなわち、本実施の形態では、フィルタ係数の全候補に対して実際に推定スペクトルを生成してみて、各推定スペクトルと入力スペクトルとの類似度を最大とするフィルタ係数の候補を求める。
本実施の形態に係る音声符号化装置の基本的構成も、実施の形態1に示した音声符号化装置100と同様である。よって、その説明を省略し、実施の形態1と異なる構成である第2レイヤ符号化部104dについて以下説明する。
図16は、第2レイヤ符号化部104dの主要な構成を示すブロック図である。実施の形態1に示した第2レイヤ符号化部104と同様の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部104dは、フィルタ係数設定部402−フィルタリング部113−探索部401からなる新たな閉ループが存在する点が、第2レイヤ符号化部104と異なる。
フィルタ係数設定部402は、探索部401の制御の下、フィルタ係数の各候補β (j)[0≦j<J、jはフィルタ係数の候補番号、Jはフィルタ係数の候補数]に対して、次式(10)に従い、入力スペクトルの高域部の推定値S2'(k)を算出する。
Figure 0005173800
そして、この推定値S2'(k)と入力スペクトルの高域部S2(k)との類似度を算出
し、類似度が最大となるときのフィルタ係数の候補β (j)を決定する。なお、類似度の代わりに誤差を算出し、誤差が最小となるときのフィルタ係数の候補を求めても良い。
図17は、探索部401内部の主要な構成を示すブロック図である。
形状誤差算出部411は、フィルタリング部113から出力される推定スペクトルS2'(k)と、周波数領域変換部101から出力される入力スペクトルS2(k)との、形状に関する誤差Esを算出し、加重平均誤差算出部413へ出力する。形状誤差Esは、次式(11)により求めることができる。
Figure 0005173800
雑音性誤差算出部412は、フィルタリング部113から出力される推定スペクトルS2'(k)の雑音性と、周波数領域変換部101から出力される入力スペクトルS2(k)の雑音性との間の雑音性誤差Enを求める。この雑音性誤差Enは、入力スペクトルS2(k)のスペクトラル・フラットネス・メジャー(SFM_i)と、推定スペクトルS2'(k)のスペクトラル・フラットネス・メジャー(SFM_p)とをそれぞれ算出し、これらを用いて次式(12)に従い定量化される。
Figure 0005173800
加重平均誤差算出部413は、形状誤差算出部411で算出される形状誤差Esと、雑音性誤差算出部412で算出される雑音性誤差Enとを用いて、両者の加重平均誤差Eを算出し、判定部414へ出力する。例えば、加重平均誤差Eは、重みγとγとを用いて、次式(13)のように算出される。
Figure 0005173800
判定部414は、ピッチ係数設定部115およびフィルタ係数設定部402に対し制御信号を出力することにより、ピッチ係数およびフィルタ係数を様々に変化させ、最終的に、加重平均誤差Eを最も小さくする(類似度が最大となる)推定スペクトルに対応するピッチ係数の候補およびフィルタ係数の候補を求め、これらピッチ係数およびフィルタ係数の候補を表す情報(それぞれC1、C2)を多重化部117へ出力すると共に、最終的に得られた推定スペクトルをゲイン符号化部116へ出力する。
また、本実施の形態に係る音声復号化装置の構成は、実施の形態1に示した音声復号化装置150と同様である。よって説明を省略する。
このように、本実施の形態によれば、入力スペクトルの高域部と推定スペクトルとの類
似度が最大となるピッチフィルタのフィルタパラメータが選択されるため、より高音質化を実現することができる。また、類似度の算出式は、入力スペクトルの高域部の雑音性の程度をも考慮したものとなっている。
なお、本実施の形態において、重みγとγの大きさは、入力スペクトルもしくは第1レイヤ復号スペクトルの雑音性に応じて切替えられるようにしても良い。かかる場合、雑音性が大きい場合にはγよりもγを大きく設定し、雑音性が小さい場合にはγよりもγを小さく設定する。これにより、入力スペクトルもしくは第1レイヤ復号スペクトルの雑音性に適した重みを設定することができ、より音質を改善することができる。
また、本実施の形態において、サブバンド毎に形状誤差Esと雑音性誤差Enとを算出し、加重平均Eを算出する構成であっても良い。かかる場合、スペクトル高域部のサブバンド毎の雑音性に対応した重みの設定を行うことができるため、より音質を改善することができる。
また、本実施の形態において、類似度の算出の際に、形状誤差および雑音性誤差の両者を用いるのではなく、いずれか一方を用いるような構成としても良い。形状誤差のみを用いて類似度を算出する場合には、図17において、雑音性誤差算出部412および加重平均誤差算出部413が不要となり、形状誤差算出部411の出力が判定部414へ直接出力される。一方、雑音性誤差のみを用いて類似度を算出する場合には、形状誤差算出部411および加重平均誤差算出部413が不要となり、雑音性誤差算出部412の出力が判定部414へ直接出力される。
また、フィルタ係数の決定とピッチ係数の探索とを同時に行っても良い。かかる場合、フィルタ係数の候補とピッチ係数の候補との全組み合わせに対して、式(10)に従い推定スペクトルS2'(k)を算出し、入力スペクトルの高域部S2(k)との類似度が最大となるときのフィルタ係数の候補β (j)および最適なピッチ係数T’(Tmin〜Tmaxの範囲)を同時に決定することになる。
また、フィルタ係数を先に決定してからピッチ係数を決定したり、ピッチ係数を先に決定してからフィルタ係数を決定したりする方法を用いても良い。かかる場合、全組み合わせを探索する場合に比べて演算量を削減することができる。
(実施の形態5)
本発明の実施の形態5は、フィルタパラメータを選択する際に、スペクトルの高域部になるほど非調波構造化の程度の強いフィルタパラメータを選択するようにする。なお、ここでは、フィルタパラメータとしてフィルタ係数を用いる構成を例にとって説明を行う。
本実施の形態に係る音声符号化装置の基本的構成も、実施の形態1に示した音声符号化装置100と同様である。よって、その説明を省略し、実施の形態1と異なる構成である第2レイヤ符号化部104eについて以下説明する。
図18は、第2レイヤ符号化部104eの主要な構成を示すブロック図である。実施の形態1に示した第2レイヤ符号化部104と同様の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部104eは、周波数監視部501およびフィルタ係数決定部502を備える点が、第2レイヤ符号化部104と異なる。
本実施の形態において、スペクトルの高域部FL≦k<FH[FL≦k≦FH−1]は
、あらかじめ複数のサブバンドに分割されている(図19参照)。なお、ここでは、3分割の場合を例にとる。そして、フィルタ係数も各サブバンドごとに対応して予め設定されている(図20参照)。このフィルタ係数は、周波数の高いサブバンドほど非調波構造化の程度が強いフィルタ係数が設定されている。
周波数監視部501は、フィルタリング部113におけるフィルタリング処理において、現在どの周波数の推定スペクトルが生成されているかを監視し、その周波数情報をフィルタ係数決定部502へ出力する。
フィルタ係数決定部502は、周波数監視部501から出力される周波数情報を基に、フィルタリング部113で現在処理されている周波数がスペクトル高域部のいずれのサブバンドに属するかを判定し、図20に示したテーブルを参照することにより、使用するフィルタ係数を決定し、これをフィルタリング部113へ出力する。
次いで、第2レイヤ符号化部104eの処理の流れを、図21に示すフローチャートを用いて説明する。
始めに、周波数kの値をFLに設定する(ST5010)。次に、周波数kが第1サブバンドに含まれるか否か、すなわちFL≦k<F1の条件を満たすか否かを判定する(ST5020)。ST5020においてYESの場合には、第2レイヤ符号化部104eは非調波構造化の程度が「弱」のフィルタ係数を選択し(ST5030)、フィルタリングを行い入力スペクトルの推定値S2'(k)を算出し(ST5040)、変数kを1インクリメントする(ST5050)。
ST5020においてNOの場合には、周波数kが第2サブバンドに含まれるか否か、すなわちF1≦k<F2の条件を満たすか否かを判定する(ST5060)。ST5060においてYESの場合には、第2レイヤ符号化部104eは非調波構造化の程度が「中」のフィルタ係数を選択し(ST5070)、フィルタリングを行い入力スペクトルの推定値S2'(k)を算出し(ST5040)、変数kを1インクリメントする(ST5050)。
ST5060においてNOの場合には、周波数kが第3サブバンドに含まれるか否か、すなわちF2≦k<FHの条件を満たすか否かを判定する(ST5080)。ST5080においてYESの場合には、第2レイヤ符号化部104eは非調波構造化の程度が「強」のフィルタ係数を選択し(ST5090)、フィルタリングを行い入力スペクトルの推定値S2'(k)を算出し(ST5040)、変数kを1インクリメントする(ST5050)。ST5080においてNOの場合には、所定周波数の入力スペクトルの推定値S2'(k)が算出されたので、処理を終了する。
本実施の形態に係る音声復号化装置の基本的構成も、実施の形態1に示した音声復号化装置150と同様であるため、説明を省略し、実施の形態1と異なる構成である第2レイヤ復号化部153eについて以下説明する。
図22は、第2レイヤ復号化部153eの主要な構成を示すブロック図である。実施の形態1に示した第2レイヤ復号化部153と同様の構成要素には同一の符号を付し、説明を省略する。
第2レイヤ復号化部153eは、周波数監視部551およびフィルタ係数決定部552を備える点が、第2レイヤ復号化部153と異なる。
周波数監視部551は、フィルタリング部164におけるフィルタリング処理において、現在どの周波数の推定スペクトルが生成されているかを監視し、その周波数情報をフィルタ係数決定部552へ出力する。
フィルタ係数決定部552は、周波数監視部551から出力される周波数情報を基に、フィルタリング部164で現在処理されている周波数がスペクトル高域部のいずれのサブバンドに属するかを判定し、図20と同一内容のテーブルを参照することにより、使用するフィルタ係数を決定し、これをフィルタリング部164へ出力する。
第2レイヤ復号化部153eの処理の流れは、図21と同様である。
このように、本実施の形態によれば、フィルタパラメータを選択する際に、スペクトルの高域部になるほど非調波構造化の程度の強いフィルタパラメータを選択する。これにより、高域部になるほど非調波構造化が強くなるので、音声信号の高域部になるほど雑音性が高くなるという特徴により適合し易くなり、高音質化を実現することができる。また、本実施の形態に係る音声符号化装置は、音声復号化装置に付加情報を伝送する必要もない。
なお、本実施の形態では、高域スペクトルの全帯域に対して非調波構造化を施す構成を例にとって説明を行ったが、高域スペクトルに含まれる複数のサブバンドのうち、非調波構造化を行わないサブバンドが存在するような構成、すなわち非調波構造化を高域スペクトルの一部の帯域のみに施すような構成でも良い。
図23および図24は、サブバンド数が2で、かつ第1サブバンドに含まれる入力スペクトルの推定値S2'(k)を算出する場合に非調波構造化を行わないフィルタリング処理の具体例を示している。
また、このときの処理の流れを図25のフローチャートに示す。図21の場合と異なり、サブバンド数は2であるため、判断子はST5020およびST5120の2つである。また、ST5010、ST5020等は、図21に示したフローと同様の手順であるため同一の符号を付しており、その詳細な説明を省略する。
ST5020においてYESの場合、第2レイヤ符号化部104eは非調波構造化を行わないフィルタ係数を選択し(ST5110)、ST5040へ移行する。
ST5020においてNOの場合、周波数kが第2サブバンドに含まれるか否か、すなわちF1≦k<FHの条件を満たすか否かを判定し(ST5120)、YESの場合、第2レイヤ符号化部104eは非調波構造化の程度が「強」のフィルタ係数を選択するST5090へ移行する。ST5120においてNOの場合、第2レイヤ符号化部104eは処理を終了する。
以上、本発明の各実施の形態について説明した。
なお、本発明に係る音声符号化装置、音声復号化装置等は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、階層数が2以上のスケーラブル構成にも適用可能である。
また、本発明に係る音声符号化装置、音声復号化装置等は、低域部のスペクトル形状と高域部のスペクトル形状との類似性が低い場合に、低域部のスペクトルを変形して高域部のスペクトルを符号化するような構成であっても良い。
また、上記各実施の形態では、低域部のスペクトルを基に高域部のスペクトルを生成する構成について説明したが、これに限らず、高域部のスペクトルから低域部のスペクトルを生成する構成であっても良い。また、3帯域以上に分割した場合において、一方の帯域に含まれるスペクトルから他方の帯域に含まれるスペクトルを生成する構成であっても良い。
また、周波数変換として、DFT(Discrete Fourier Transform)、FFT(Fast Fourier Transform)、DCT(Discrete Cosine Transform)、MDCT(Modified Discrete Cosine Transform)、フィルタバンク等を使用することもできる。
また、本発明に係る音声符号化装置の入力信号は、音声信号だけでなく、オーディオ信号でも良い。また、入力信号の代わりに、LPC予測残差信号に対して本発明を適用する構成であっても良い。
また、本実施の形態における音声復号化装置は、本実施の形態における音声符号化装置において生成された符号化データを用いて処理を行うとしたが、本発明はこれに限定されず、必要なパラメータやデータを含むように適切に生成された符号化データであれば、必ずしも本実施の形態における音声符号化装置において生成された符号化データでなくても処理は可能である。
また、本発明に係る音声符号化装置および音声復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音声符号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る音声符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2006年4月27日出願の特願2006−124175の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る音声符号化装置等は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用することができる。
音声信号のスペクトル特性を説明するための図 別の音声信号のスペクトル特性を説明するための図 本発明の実施の形態1に係る音声符号化装置の主要な構成を示すブロック図 実施の形態1に係る第2レイヤ符号化部内部の主要な構成を示すブロック図 フィルタリング処理の詳細について説明する図 実施の形態1に係る音声復号化装置の主要な構成を示すブロック図 実施の形態1に係る第2レイヤ復号化部内部の主要な構成を示すブロック図 各フィルタ係数がタップ数として3または5のいずれかを採る場合の例を示す図 実施の形態1に係る音声符号化装置の別の構成を示すブロック図 実施の形態1に係る音声復号化装置の別の構成を示すブロック図 本発明の実施の形態2に係る第2レイヤ符号化部の主要な構成を示すブロック図 高域部の推定スペクトルの生成方法を説明する図 実施の形態2に係る第2レイヤ復号化部の主要な構成を示すブロック図 本発明の実施の形態3に係る第2レイヤ符号化部の主要な構成を示すブロック図 実施の形態3に係る第2レイヤ復号化部の主要な構成を示すブロック図 本発明の実施の形態4に係る第2レイヤ符号化部の主要な構成を示すブロック図 実施の形態4に係る探索部内部の主要な構成を示すブロック図 本発明の実施の形態5に係る第2レイヤ符号化部の主要な構成を示すブロック図 実施の形態5に係る処理を説明するための図 実施の形態5に係る処理を説明するための図 実施の形態5に係る第2レイヤ符号化部の処理の流れを示すフローチャート 実施の形態5に係る第2レイヤ復号化部の主要な構成を示すブロック図 実施の形態5のバリエーションを説明するための図 実施の形態5のバリエーションを説明するための図 実施の形態5のバリエーションの処理の流れを示すフローチャート

Claims (12)

  1. 入力信号の低域部を符号化して第1符号化データを生成する第1符号化手段と、
    前記第1符号化データを復号して第1復号信号を生成する第1復号化手段と、
    マルチタップを有し、かつ前記低域部の調波構造の鈍化を行うフィルタパラメータにより構成されるピッチフィルタと、
    前記第1復号信号のスペクトルに基づいて前記ピッチフィルタのフィルタ状態を設定し、前記入力信号の高域部の雑音性情報に基づいて前記フィルタパラメータを制御するとともに、前記ピッチフィルタにおける前記フィルタパラメータを用いたピッチフィルタリング処理により前記低域部から前記高域部を推定し、前記高域部の推定結果である前記ピッチフィルタのフィルタ情報を第2符号化データとする第2符号化手段と、
    を具備する音声符号化装置。
  2. 前記第2符号化手段は、
    前記高域部のスペクトルに対し、平滑化または雑音成分付与の少なくとも一方を施す、
    請求項1記載の音声符号化装置。
  3. 前記フィルタパラメータは、フィルタ係数を含み、
    当該フィルタ係数は、隣接する係数同士の差が小さい、
    請求項1記載の音声符号化装置。
  4. 前記フィルタパラメータは、所定数以上のタップ数を含む、
    請求項1記載の音声符号化装置。
  5. 前記フィルタパラメータは、閾値以上の雑音ゲイン情報を含む、
    請求項1記載の音声符号化装置。
  6. 前記ピッチフィルタは、
    調波構造の鈍化の程度の異なる複数のフィルタパラメータ候補を有し、
    前記第2符号化手段は、
    前記高域部の雑音性に応じて、前記複数のフィルタパラメータ候補の中から1つを選択する、
    請求項1記載の音声符号化装置。
  7. 前記ピッチフィルタは、
    調波構造の鈍化の程度の異なる複数のフィルタパラメータ候補を有し、
    前記第2符号化手段は、
    前記高域部のスペクトルとの類似度が最大となるフィルタパラメータを、前記複数のフィルタパラメータ候補の中から選択する、
    請求項1記載の音声符号化装置。
  8. 前記類似度は、前記入力信号のスペクトルの雑音性の程度を用いて算出される、
    請求項7記載の音声符号化装置。
  9. 前記ピッチフィルタは、
    調波構造の鈍化の程度の異なる複数のフィルタパラメータ候補を有し、
    前記第2符号化手段は、
    前記高域部のスペクトルに対し、より高域のスペクトルにはより調波構造の鈍化の程度が強いフィルタパラメータを、前記複数のフィルタパラメータ候補の中から選択する、
    請求項1記載の音声符号化装置。
  10. 第1符号化データを復号して音声信号の低域部である第1復号信号を得る第1復号化手段と、
    マルチタップを有し、かつ前記低域部の調波構造の鈍化を行うフィルタパラメータにより構成されるピッチフィルタと、
    前記第1復号信号のスペクトルに基づいて前記ピッチフィルタのフィルタ状態を設定し、第2符号化データに含まれる前記音声信号の高域部の雑音性情報に基づいて前記フィルタパラメータを設定するとともに、前記第2符号化データに含まれる前記高域部の推定結果である前記ピッチフィルタのフィルタ情報を用いて、前記ピッチフィルタにおいて前記第1復号信号のフィルタリングを行うことにより前記高域部である第2復号信号を得る第2復号化手段と、
    を具備する音声復号化装置。
  11. 入力信号の低域部を符号化して第1符号化データを生成するステップと、
    前記第1符号化データを復号して第1復号信号を生成するステップと、
    マルチタップを有し、かつ前記低域部の調波構造の鈍化を行うフィルタパラメータにより構成されるピッチフィルタのフィルタ状態を、前記第1復号信号のスペクトルに基づいて設定するステップと、
    前記入力信号の高域部の雑音性情報に基づいて前記フィルタパラメータを制御するとともに、前記ピッチフィルタにおける前記フィルタパラメータを用いたピッチフィルタリング処理により前記低域部から前記高域部を推定し、前記高域部の推定結果である前記ピッチフィルタのフィルタ情報を第2符号化データとするステップと、
    を具備する音声符号化方法。
  12. 第1符号化データを復号して音声信号の低域部である第1復号信号を得るステップと、
    マルチタップを有し、かつ前記低域部の調波構造の鈍化を行うフィルタパラメータにより構成されるピッチフィルタのフィルタ状態を、前記第1復号信号のスペクトルに基づいて設定するステップと、
    第2符号化データに含まれる前記音声信号の高域部の雑音性情報に基づいて前記フィルタパラメータを設定するとともに、前記第2符号化データに含まれる前記高域部の推定結果である前記ピッチフィルタのフィルタ情報を用いて、前記ピッチフィルタにおいて前記第1復号信号のフィルタリングを行うことにより前記高域部である第2復号信号を得るステップと、
    を具備する音声復号化方法。
JP2008513267A 2006-04-27 2007-04-26 音声符号化装置、音声復号化装置、およびこれらの方法 Active JP5173800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008513267A JP5173800B2 (ja) 2006-04-27 2007-04-26 音声符号化装置、音声復号化装置、およびこれらの方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006124175 2006-04-27
JP2006124175 2006-04-27
JP2008513267A JP5173800B2 (ja) 2006-04-27 2007-04-26 音声符号化装置、音声復号化装置、およびこれらの方法
PCT/JP2007/059091 WO2007126015A1 (ja) 2006-04-27 2007-04-26 音声符号化装置、音声復号化装置、およびこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2007126015A1 JPWO2007126015A1 (ja) 2009-09-10
JP5173800B2 true JP5173800B2 (ja) 2013-04-03

Family

ID=38655539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008513267A Active JP5173800B2 (ja) 2006-04-27 2007-04-26 音声符号化装置、音声復号化装置、およびこれらの方法

Country Status (6)

Country Link
US (1) US20100161323A1 (ja)
EP (2) EP2323131A1 (ja)
JP (1) JP5173800B2 (ja)
AT (1) ATE501505T1 (ja)
DE (1) DE602007013026D1 (ja)
WO (1) WO2007126015A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5404418B2 (ja) * 2007-12-21 2014-01-29 パナソニック株式会社 符号化装置、復号装置および符号化方法
US8452588B2 (en) * 2008-03-14 2013-05-28 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5928539B2 (ja) * 2009-10-07 2016-06-01 ソニー株式会社 符号化装置および方法、並びにプログラム
EP2704143B1 (en) * 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
WO2011121782A1 (ja) * 2010-03-31 2011-10-06 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP3422346B1 (en) 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8897352B2 (en) * 2012-12-20 2014-11-25 Nvidia Corporation Multipass approach for performing channel equalization training
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
MY188538A (en) 2013-12-27 2021-12-20 Sony Corp Decoding device, method, and program
CN106463143B (zh) 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
KR102400016B1 (ko) 2014-03-24 2022-05-19 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
JP7196993B2 (ja) * 2018-11-22 2022-12-27 株式会社Jvcケンウッド 音声処理条件設定装置、無線通信装置、および音声処理条件設定方法
JP7005848B2 (ja) * 2018-11-22 2022-01-24 株式会社Jvcケンウッド 音声処理条件設定装置、無線通信装置、および音声処理条件設定方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2588004B2 (ja) * 1988-09-19 1997-03-05 日本電信電話株式会社 後処理フィルタ
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US6256606B1 (en) * 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
EP1801785A4 (en) * 2004-10-13 2010-01-20 Panasonic Corp MODULAR ENCODER, MODULAR DECODER AND MODULATING CODING METHOD
JP2006124175A (ja) 2004-10-14 2006-05-18 Graphic Management Associates Inc 加速装置及び減速装置を備えた製品フィーダ
CN101061533B (zh) * 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
EP1806737A4 (en) * 2004-10-27 2010-08-04 Panasonic Corp TONE CODIER AND TONE CODING METHOD
CN102184734B (zh) * 2004-11-05 2013-04-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法

Also Published As

Publication number Publication date
WO2007126015A1 (ja) 2007-11-08
JPWO2007126015A1 (ja) 2009-09-10
EP2012305A1 (en) 2009-01-07
ATE501505T1 (de) 2011-03-15
EP2012305B1 (en) 2011-03-09
EP2323131A1 (en) 2011-05-18
DE602007013026D1 (de) 2011-04-21
US20100161323A1 (en) 2010-06-24
EP2012305A4 (en) 2010-04-14

Similar Documents

Publication Publication Date Title
JP5173800B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP5089394B2 (ja) 音声符号化装置および音声符号化方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP6371812B2 (ja) 符号化装置および符号化方法
US8112286B2 (en) Stereo encoding device, and stereo signal predicting method
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
JP5328368B2 (ja) 符号化装置、復号装置、およびこれらの方法
JP5448850B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4976381B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
US20100280833A1 (en) Encoding device, decoding device, and method thereof
WO2012081166A1 (ja) 符号化装置、復号装置およびそれらの方法
JP5565914B2 (ja) 符号化装置、復号装置およびこれらの方法
US20100017199A1 (en) Encoding device, decoding device, and method thereof
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121227

R150 Certificate of patent or registration of utility model

Ref document number: 5173800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350