JP7537511B2

JP7537511B2 - 音信号精製方法、音信号復号方法、これらの装置、プログラム及び記録媒体

Info

Publication number: JP7537511B2
Application number: JP2022560569A
Authority: JP
Inventors: 亮介杉浦; 健弘守谷; 優鎌本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2024-08-21
Anticipated expiration: 2040-11-05
Also published as: US20230386482A1; JPWO2022097235A1; WO2022097235A1

Description

本発明は、符号を復号して得た音信号を後処理する技術に関する。

モノラル符号とステレオ符号を効率良く用いてステレオ音信号を符号化／復号する技術としては、特許文献１の技術がある。特許文献１には、モノラル信号を表すモノラル符号と、ステレオ信号のモノラル信号からの差分を表すステレオ符号と、を符号化側で得て、復号側では符号化側に対応する復号処理を行うことでモノラル復号音信号とステレオ復号音信号を得るスケーラブル符号化／復号方式が開示されている（図７と８を参照）。
優先度が異なる２つの回線に接続された端末で音信号を符号化して伝送して復号する技術としては、特許文献２の技術がある。特許文献２には、最低限の品質を確保するための符号を優先度が高いパケットに含めて伝送し、それ以外の符号を優先度が低いパケットに含めて伝送する技術が開示されている（図１などを参照）。
特許文献２のシステムで特許文献１のスケーラブル符号化／復号方式を用いる場合には、送信側で、モノラル符号を優先度が高いパケットに含め、ステレオ符号を優先度が低いパケットに含めるようにすればよい。このようにすることで、受信側では、優先度が高いパケットのみが到着している場合にはモノラル符号のみを用いてモノラル復号音信号を得て、優先度が高いパケットに加えて優先度が低いパケットも到着している場合にはモノラル符号とステレオ符号の両方を用いてステレオ復号音信号を得ることができる。

国際公開第２００６／０７０７５１号特開２００５－１１７１３２号公報

優先度が異なる２つの回線に接続された端末で通信を行う場合には、スケーラブル符号化／復号方式を用いるのではなく、互いに独立したモノラル符号化／復号方式とステレオ符号化／復号方式を用いるケースも想定される。また、優先度が同じ１つの回線で互いに独立したモノラル符号化／復号方式とステレオ符号化／復号方式を用いるケースも想定される。これらのケースでは、受信側では、ステレオ符号に加えてモノラル符号も到着しているか否かに関わらず、ステレオ復号音信号を得るためにはステレオ符号のみを用いることなる。すなわち、モノラル復号と独立したステレオ復号を受信側で行うケースでは、同じ音信号に由来する互いに独立したモノラル符号とステレオ符号が入力されていたとしても、受信側の装置が出力するステレオの音信号を得る処理にモノラル符号に含まれる情報が生かされていないという課題がある。
そこで本発明では、復号音信号を得る元となった符号とは異なる符号であり、かつ、同じ音信号に由来する符号である別符号、から得られた音信号がある場合に、その別符号から得られた音信号を用いて復号音信号を改善することを目的とする。

本発明の一態様は、フレームごとに、ステレオ符号ＣＳを復号して得たステレオの各チャネルの復号音信号である第ｎチャネル復号音信号^X_n（nは1以上N以下の各整数）と、前記ステレオ符号ＣＳとは異なる符号であるモノラル符号ＣＭを復号して得たモノラルの復号音信号であるモノラル復号音信号^X_Mと、を少なくとも用いて、前記ステレオの前記各チャネルの音信号である第ｎチャネル精製済復号音信号~X_nを得る音信号精製方法であって、前記第ｎチャネル復号音信号^X_nは、前記モノラル符号ＣＭを復号して得た情報も前記モノラル符号ＣＭも用いずに、前記ステレオ符号ＣＳを復号して得たものであり、フレームごとに、1以上N以下の全ての第ｎチャネル復号音信号^X_nを少なくとも用いて、前記ステレオの全チャネルに共通する信号である復号音共通信号^Y_Mを得る復号音共通信号推定ステップと、フレームごとに、対応するサンプルtごとに、共通信号精製重みα_Mと前記モノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_M×^x_M(t)と、前記共通信号精製重みα_Mを1から減算した値(1-α_M)と前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値(1-α_M)×^y_M(t)と、を加算した値~y_M(t)=(1-α_M)×^y_M(t)＋α_M×^x_M(t)による系列を精製済共通信号~Y_Mとして得る共通信号精製ステップと、前記各チャネルnについて、フレームごとに、前記第ｎチャネル復号音信号^X_nの前記復号音共通信号^Y_Mに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得る第ｎチャネル分離結合重み推定ステップと、前記各チャネルnについて、フレームごとに、対応するサンプルtごとに、前記第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、前記第ｎチャネル分離結合重みβ_nと前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値β_n×^y_M(t)を減算し、前記第ｎチャネル分離結合重みβ_nと前記精製済共通信号~Y_Mのサンプル値~y_M(t)とを乗算した値β_n×~y_M(t)を加算した値~x_n(t)=^x_n(t)-β_n×^y_M(t)＋β_n×~y_M(t)による系列を前記第ｎチャネル精製済復号音信号~X_nとして得る第ｎチャネル分離結合ステップと、を含む。

本発明によれば、復号音信号を得る元となった符号とは異なる符号であり、かつ、同じ音信号に由来する符号である別符号、から得られた音信号がある場合に、その別符号から得られた音信号を用いて復号音信号を改善することができる。

音信号精製装置１１０１の例を示すブロック図である。音信号精製装置１１０１の処理の例を示す流れ図である。第ｎチャネル精製重み推定部１１１１－ｎの処理の例を示す流れ図である。第ｎチャネル精製重み推定部１１１１－ｎの処理の例を示す流れ図である。音信号精製装置１１０２の例を示すブロック図である。音信号精製装置１１０２の処理の例を示す流れ図である。音信号精製装置１１０３の例を示すブロック図である。音信号精製装置１１０３の処理の例を示す流れ図である。音信号精製装置１２０１の例を示すブロック図である。音信号精製装置１２０１の処理の例を示す流れ図である。音信号精製装置１２０２の例を示すブロック図である。音信号精製装置１２０２の処理の例を示す流れ図である。音信号精製装置１２０３の例を示すブロック図である。音信号精製装置１２０３の処理の例を示す流れ図である。音信号精製装置１３０１の例を示すブロック図である。音信号精製装置１３０１の処理の例を示す流れ図である。音信号精製装置１３０２の例を示すブロック図である。音信号精製装置１３０２の処理の例を示す流れ図である。音信号高域補償装置２０１の例を示すブロック図である。音信号高域補償装置２０１／２０２の処理の例を示す流れ図である。音信号高域補償装置２０２の例を示すブロック図である。音信号高域補償装置２０３の例を示すブロック図である。音信号高域補償装置２０３の処理の例を示す流れ図である。音信号後処理装置３０１の例を示すブロック図である。音信号後処理装置３０１の処理の例を示す流れ図である。音信号後処理装置３０２の例を示すブロック図である。音信号後処理装置３０２の処理の例を示す流れ図である。音信号復号装置６０１の例を示すブロック図である。音信号復号装置６０１の処理の例を示す流れ図である。音信号復号装置６０２の例を示すブロック図である。音信号復号装置６０２の処理の例を示す流れ図である。符号化装置５００と復号装置６００の例を示すブロック図である。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

各実施形態の説明に先立って、この明細書における表記方法について説明する。
ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

＜発明の適用先となる符号化装置と復号装置＞
まず、各実施形態を説明する前に、発明の適用先となる符号化装置と復号装置について、ステレオのチャネル数が2である場合の例を用いて説明する。

≪符号化装置５００≫
適用先となる符号化装置５００は、図３２に例示する通り、ダウンミックス部５１０とモノラル符号化部５２０とステレオ符号化部５３０を含む。符号化装置５００は、例えば20msの所定の時間長のフレーム単位で、入力された２チャネルステレオの時間領域の音信号を符号化して、後述するモノラル符号ＣＭとステレオ符号ＣＳを得て出力する。符号化装置に入力される２チャネルステレオの時間領域の音信号は、例えば、音声や音楽などの音を２個のマイクロホンそれぞれで収音してＡＤ変換して得られたディジタルの音声信号又は音響信号であり、左チャネルの入力音信号である第一チャネル入力音信号と右チャネルの入力音信号である第二チャネル入力音信号から成る。符号化装置５００が出力する符号であるモノラル符号ＣＭとステレオ符号ＣＳは復号装置６００へ入力される。符号化装置５００は、各フレームについて上述した各部が以下の処理を行う。例えば、フレーム長は20msであり、サンプリング周波数は32kHzである。フレーム当たりのサンプル数をTとすると、この例であれば、Tは640である。

［ダウンミックス部５１０］
ダウンミックス部５１０には、符号化装置５００に入力された第一チャネル入力音信号と第二チャネル入力音信号が入力される。ダウンミックス部５１０は、第一チャネル入力音信号と第二チャネル入力音信号から、第一チャネル入力音信号と第二チャネル入力音信号が混合された信号であるダウンミックス信号を得て出力する。ダウンミックス部５１０は、例えば、下記の第１の方法や第２の方法でダウンミックス信号を得る。

［［ダウンミックス信号を得る第１の方法］］
第１の方法では、ダウンミックス部５１０は、第一チャネル入力音信号X₁={x₁(1), x₁(2), ..., x₁(T)}と第二チャネル入力音信号X₂={x₂(1), x₂(2), ..., x₂(T)}の対応するサンプルごとのサンプル値の平均値による系列をダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}として得る（ステップＳ５１０Ａ）。すなわち、各サンプル番号（各サンプルのインデックス）をtとすると、x_M(t)=(x₁(t)+x₂(t))/2である。

［［ダウンミックス信号を得る第２の方法］］
第２の方法では、ダウンミックス部５１０は、以下のステップＳ５１０Ｂ－１からステップＳ５１０Ｂ－３を行う。

ダウンミックス部５１０は、まず、第一チャネル入力音信号と第二チャネル入力音信号から、チャネル間時間差τを得る（ステップＳ５１０Ｂ－１）。チャネル間時間差τは、同じ音信号が第一チャネル入力音信号と第二チャネル入力音信号のどちらにどれくらい先に含まれているかを表す情報である。ダウンミックス部５１０は、チャネル間時間差τを周知の何れの方法で求めてもよく、例えば、第２実施形態で後述するチャネル間関係情報推定部１１３２に例示した方法で求めればよい。第２実施形態で後述するチャネル間関係情報推定部１１３２に例示した方法をダウンミックス部５１０が用いると、同じ音信号が第二チャネル入力音信号よりも先に第一チャネル入力音信号に含まれている場合にはチャネル間時間差τは正の値となり、同じ音信号が第一チャネル入力音信号よりも先に第二チャネル入力音信号に含まれている場合にはチャネル間時間差τは負の値となる。

ダウンミックス部５１０は、次に、第一チャネル入力音信号のサンプル列と、チャネル間時間差τ分だけ当該サンプル列より後にずれた位置にある第二チャネル入力音信号のサンプル列と、の相関値をチャネル間相関係数γとして得る（ステップＳ５１０Ｂ－２）。

ダウンミックス部５１０は、次に、ダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}に、第一チャネル入力音信号X₁={x₁(1), x₁(2), ..., x₁(T)}と第二チャネル入力音信号X₂={x₂(1), x₂(2), ..., x₂(T)}のうちの先行しているチャネルの入力音信号のほうが、チャネル間相関係数γが大きいほど大きく含まれるように、第一チャネル入力音信号と第二チャネル入力音信号を重み付け平均してダウンミックス信号を得て出力する（ステップＳ５１０Ｂ－３）。例えば、ダウンミックス部５１０は、対応する各サンプル番号tに対して、チャネル間相関係数γで定まる重みを用いて第一チャネル入力音信号x₁(t)と第二チャネル入力音信号x₂(t)を重み付け加算したものをダウンミックス信号x_M(t)とすればよい。具体的には、ダウンミックス部５１０は、チャネル間時間差τが正の値である場合、すなわち第一チャネルが先行している場合には、x_M(t)=((1+γ)/2)×x₁(t)＋((1-γ)/2)×x₂(t)を、チャネル間時間差τが負の値である場合、すなわち第二チャネルが先行している場合には、x_M(t)=((1-γ)/2)×x₁(t)＋((1+γ)/2)×x₂(t)を、ダウンミックス信号x_M(t)として得ればよい。ダウンミックス部５１０は、チャネル間時間差τが0である場合、すなわち何れのチャネルも先行していない場合には、各サンプル番号tについて、第一チャネル入力音信号x₁(t)と第二チャネル入力音信号x₂(t)を平均したx_M(t)=(x₁(t)+x₂(t))/2をダウンミックス信号x_M(t)とすればよい。

［モノラル符号化部５２０］
モノラル符号化部５２０には、ダウンミックス部５１０が出力したダウンミックス信号が入力される。モノラル符号化部５２０は、入力されたダウンミックス信号を所定の符号化方式でb_Mビットで符号化してモノラル符号ＣＭを得て出力する。すなわち、入力されたTサンプルのダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}からb_Mビットのモノラル符号ＣＭを得て出力する。符号化方式としては、どのようなものを用いてもよく、例えば3GPP EVS規格のような符号化方式を用いればよい。

［ステレオ符号化部５３０］
ステレオ符号化部５３０には、符号化装置５００に入力された第一チャネル入力音信号と第二チャネル入力音信号が入力される。ステレオ符号化部５３０は、第一チャネル入力音信号と第二チャネル入力音信号を所定の符号化方式で合計b_sビットで符号化してステレオ符号ＣＳを得て出力する。すなわち、Tサンプルの第一チャネル入力音信号X₁={x₁(1), x₁(2), ..., x₁(T)}と、Tサンプルの第二チャネル入力音信号X₂={x₂(1), x₂(2), ..., x₂(T)}と、から合計b_Sビットのステレオ符号ＣＳを得て出力する。符号化方式としては、どのようなものを用いてもよく、例えばMPEG-4 AAC規格のステレオ復号方式に対応するステレオ符号化方式を用いてもよいし、入力された第一チャネル入力音信号と第二チャネル入力音信号それぞれを独立して符号化する符号化方式を用いてもよい。何れの符号化方式を用いた場合でも、符号化により得られた符号を全て合わせたものをステレオ符号ＣＳとすればよい。

モノラル符号ＣＭは上述した通りにモノラル符号化部５２０が得た符号であり、ステレオ符号ＣＳは上述した通りにステレオ符号化部５３０が得た符号であるので、モノラル符号ＣＭとステレオ符号ＣＳは、重複した符号を含まない異なる符号である。すなわち、モノラル符号ＣＭはステレオ符号ＣＳとは異なる符号であり、ステレオ符号ＣＳはモノラル符号ＣＭとは異なる符号である。

≪復号装置６００≫
適用先となる復号装置６００は、図３２に例示する通り、モノラル復号部６１０とステレオ復号部６２０を含む。復号装置６００は、対応する符号化装置５００と同じ時間長のフレーム単位で、入力されたモノラル符号ＣＭを復号してモノラルの時間領域の復号音信号であるモノラル復号音信号を得て出力し、入力されたステレオ符号ＣＳを復号して２チャネルステレオの時間領域の復号音信号である第一チャネル復号音信号と第二チャネル復号音信号を得て出力する。復号装置６００は、各フレームについて上述した各部が以下の処理を行う。

［モノラル復号部６１０］
モノラル復号部６１０には、復号装置６００に入力されたモノラル符号ＣＭが入力される。モノラル復号部６１０は、モノラル符号ＣＭを所定の復号方式で復号してモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}を得て出力する。すなわち、モノラル復号部６１０は、ステレオ符号ＣＳを復号して得られた情報もステレオ符号ＣＳも用いずに、ステレオ符号ＣＳとは異なる符号であるモノラル符号ＣＭを復号して、モノラル復号音信号^X_Mを得る。所定の復号方式としては、対応する符号化装置５００のモノラル符号化部５２０で用いた符号化方式に対応する復号方式を用いる。モノラル符号ＣＭのビット数はb_Mである。

［ステレオ復号部６２０］
ステレオ復号部６２０には、復号装置６００に入力されたステレオ符号ＣＳが入力される。ステレオ復号部６２０は、ステレオ符号ＣＳを所定の復号方式で復号して、左チャネルの復号音信号である第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と、右チャネルの復号音信号である第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}と、を得て出力する。すなわち、ステレオ復号部６２０は、モノラル符号ＣＭを復号して得られた情報もモノラル符号ＣＭも用いずに、モノラル符号ＣＭとは異なる符号であるステレオ符号ＣＳを復号して、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を得る。所定の復号方式としては、対応する符号化装置５００のステレオ符号化部５３０で用いた符号化方式に対応する復号方式を用いる。ステレオ符号ＣＳの合計ビット数はb_Sである。

符号化装置５００と復号装置６００は上述した通りに動作するので、モノラル符号ＣＭは、ステレオ符号ＣＳが由来する音信号と同じ音信号（すなわち、符号化装置５００に入力された第一チャネル入力音信号X₁と第二チャネル入力音信号X₂）に由来する符号ではあるが、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を得る元となった符号（すなわち、ステレオ符号ＣＳ）とは異なる符号である。

＜第１実施形態＞
第１実施形態の音信号精製装置は、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。以下、第１実施形態の音信号精製装置について、ステレオのチャネルの個数が２である場合の例を用いて説明する。

≪音信号精製装置１１０１≫
第１実施形態の音信号精製装置１１０１は、図１に例示する通り、第一チャネル精製重み推定部１１１１－１と第一チャネル信号精製部１１２１－１と第二チャネル精製重み推定部１１１１－２と第二チャネル信号精製部１１２１－２を含む。音信号精製装置１１０１は、例えば20msの所定の時間長のフレーム単位で、ステレオの各チャネルについて、モノラル復号音信号と当該チャネルの復号音信号から、当該チャネルの復号音信号を改善した音信号である精製済復号音信号を得て出力する。音信号精製装置１１０１にフレーム単位で入力される各チャネルの復号音信号は、例えば、上述した復号装置６００のステレオ復号部６２０が、モノラル符号ＣＭを復号して得られた情報もモノラル符号ＣＭも用いずに、モノラル符号ＣＭとは異なる符号であるb_Sビットのステレオ符号ＣＳを復号して得たTサンプルの第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}とTサンプルの第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}である。音信号精製装置１１０１にフレーム単位で入力されるモノラルの復号音信号は、例えば、上述した復号装置６００のモノラル復号部６１０が、ステレオ符号ＣＳを復号して得られた情報もステレオ符号ＣＳも用いずに、ステレオ符号ＣＳとは異なる符号であるb_Mビットのモノラル符号ＣＭを復号して得たTサンプルのモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}である。モノラル符号ＣＭは、ステレオ符号ＣＳが由来する音信号と同じ音信号（すなわち、符号化装置５００に入力された第一チャネル入力音信号X₁と第二チャネル入力音信号X₂）に由来する符号ではあるが、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を得る元となった符号（すなわち、ステレオ符号ＣＳ）とは異なる符号である。第一チャネルのチャネル番号n（チャネルのインデックスn）を1とし、第二チャネルのチャネル番号nを2とすると、音信号精製装置１１０１は、各フレームについて、図２に例示するステップＳ１１１１－ｎとステップＳ１１２１－ｎを各チャネルについて行う。すなわち、以降では、特に断りがない限りは、“－ｎ”が付された各部／各ステップは、各チャネルに対応するものが存在し、具体的には、“－ｎ”に代えて“－１”が付された第一チャネル用の各部／各ステップと、“－ｎ”に代えて“－２”が付された第二チャネルの各部／各ステップと、が存在する。同様に、以降では、特に断りがない限りは、添え字などに“n”との記載が付されているものは、各チャネル番号に対応するものが存在することを表し、具体的には、“n”に代えて“1”が付された第一チャネルに対応するものと、“n”に代えて“2”が付された第二チャネルに対応するものと、が存在する。

［第ｎチャネル精製重み推定部１１１１－ｎ］
第ｎチャネル精製重み推定部１１１１－ｎは、第ｎチャネル精製重みα_nを得て出力する（ステップ１１１１－ｎ）。第ｎチャネル精製重み推定部１１１１－ｎは、後述する量子化誤差を最小化する原理に基づく方法で第ｎチャネル精製重みα_nを得る。量子化誤差を最小化する原理とこの原理に基づく方法については後述する。第ｎチャネル精製重み推定部１１１１－ｎには、必要に応じて、図１に一点鎖線で示すように、音信号精製装置１１０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号精製装置１１０１に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、が入力される。第ｎチャネル精製重み推定部１１１１－ｎが得る第ｎチャネル精製重みα_nは、0以上1以下の値である。ただし、第ｎチャネル精製重み推定部１１１１－ｎは、フレームごとに後述する方法で第ｎチャネル精製重みα_nを得るので、全てのフレームで第ｎチャネル精製重みα_nが0や1になることはない。すなわち、第ｎチャネル精製重みα_nが0より大きく1未満の値となるフレームが存在する。言い換えると、全てのフレームのうちの少なくとも何れかのフレームでは、第ｎチャネル精製重みα_nは0より大きく1未満の値である。

［第ｎチャネル信号精製部１１２１－ｎ］
第ｎチャネル信号精製部１１２１－ｎには、音信号精製装置１１０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号精製装置１１０１に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、第ｎチャネル精製重み推定部１１１１－ｎが出力した第ｎチャネル精製重みα_nと、が入力される。第ｎチャネル信号精製部１１２１－ｎは、対応するサンプルtごとに、第ｎチャネル精製重みα_nとモノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_n×^x_M(t)と、第ｎチャネル精製重みα_nを1から減算した値(1-α_n)と第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)とを乗算した値(1-α_n)×^x_n(t)と、を加算した値~x_n(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}として得て出力する（ステップＳ１１２１－ｎ）。すなわち、~x_n(t)=(1-α_n)×^x_n(t)＋α_n×^x_M(t)である。

［量子化誤差を最小化する原理］
以下、量子化誤差を最小化する原理について説明する。ステレオ符号化部５３０とステレオ復号部６２０で用いる符号化方式／復号方式次第では、各チャネルの入力音信号の符号化に用いるビット数は陽に定まっていないこともあり得るが、以下では、第ｎチャネルの入力音信号X_nの符号化に用いるビット数がb_nであるとして説明する。

上述した各装置の各部の処理における符号のビット数と信号の概要は以下の通りである。音信号精製装置１１０１の適用先となる符号化装置５００のステレオ符号化部５３０は、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}を符号化してb_nビットの符号を得る。音信号精製装置１１０１の適用先となる符号化装置５００のモノラル符号化部５２０は、ダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}を符号化してb_Mビットの符号を得る。音信号精製装置１１０１の適用先となる復号装置６００のステレオ復号部６２０は、b_nビットの符号から第ｎチャネルの復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}を得る。音信号精製装置１１０１の適用先となる復号装置６００のモノラル復号部６１０は、b_Mビットの符号からモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}を得る。音信号精製装置１１０１の第ｎチャネル信号精製部１１２１－ｎは、対応するサンプルtごとに、第ｎチャネル精製重みα_nとモノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_n×^x_M(t)と、第ｎチャネル精製重みα_nを1から減算した値(1-α_n)と第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)とを乗算した値(1-α_n)×^x_n(t)と、を加算した値~x_n(t)=(1-α_n)×^x_n(t)＋α_n×^x_M(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}として得る。音信号精製装置１１０１は、以上の処理で得られる第ｎチャネル精製済復号音信号~X_nが有する量子化誤差のエネルギーが小さくなるように設計されるべきである。

入力信号を符号化・復号して得られる復号信号が有する量子化誤差（以下、便宜的に「符号化により生じる量子化誤差」ともいう）のエネルギーは、多くの場合、入力信号のエネルギーにおおよそ比例し、符号化に用いるサンプルごとのビット数の値に対して指数的に小さくなる傾向にある。したがって、第ｎチャネルの入力音信号X_nの符号化により生じる量子化誤差のサンプルあたりの平均エネルギーは正の数σ_n ²を用いて下記の式（１）のように推定できる。また、ダウンミックス信号X_Mの符号化により生じる量子化誤差のサンプルあたりの平均エネルギーは正の数σ_M ²を用いて下記の式（２）のように推定できる。

ここで仮に、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}が同一の系列とみなせるほど各サンプル値が近い値となっているとする。例えば、第１チャネルの入力音信号X₁={x₁(1), x₁(2), ..., x₁(T)}と第２チャネルの入力音信号X₂={x₂(1), x₂(2), ..., x₂(T)}が、背景雑音や反響が多くない環境下で、２個のマイクロホンから等距離にある音源が発した音を収音して得たものであるケースなどが、この条件に相当する。第ｎチャネルの復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}の各サンプル値に(1-α_n)を乗算して得た値からなる信号のエネルギーはダウンミックス信号のエネルギーの(1-α_n)²倍で表せることから、式（１）のσ_n ²は上記のσ_M ²を用いて(1-α)²×σ_M ²と置き換えることができるため、第ｎチャネルの復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}の各サンプル値に(1-α_n)を乗算して得た値の系列{(1-α_n)×^x_n(1), (1-α_n)×^x_n(2), ..., (1-α_n)×^x_n(T)}が有する量子化誤差のサンプルあたりの平均エネルギーは下記の式（３）のように推定できる。

また、モノラル復号音信号^X_Mの各サンプル値にα_nを乗算して得た値の系列{α_n×x_M(1), α_n×x_M(2), ..., α_n×x_M(T)}が有する量子化誤差のサンプルあたりの平均エネルギーは、下記の式（４）のように推定できる。

第ｎチャネルの入力音信号の符号化により生じる量子化誤差と、ダウンミックス信号の符号化により生じる量子化誤差と、が互いに相関を持たないと仮定すると、第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n (2), ..., ~x_n(T)}が有する量子化誤差のサンプルあたりの平均エネルギーは式（３）と式（４）の和で推定される。第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n (2), ..., ~x_n(T)}が有する量子化誤差のエネルギーを最小化する第ｎチャネル精製重みα_nは、下記の式（５）のように求められる。

つまり、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}が同一の系列とみなせるほど各サンプル値が近い値となっている条件において第ｎチャネル精製済復号音信号が有する量子化誤差を最小化するためには、第ｎチャネル精製重み推定部１１１１－ｎは第ｎチャネル精製重みα_nを式（５）で求めればよい。

［量子化誤差を最小化する原理に基づく方法］
以下、上述した量子化誤差を最小化する原理に基づいて第ｎチャネル精製重みα_nを得る方法の具体例を説明する。

［［第１例］］
第１例は、上述した量子化誤差を最小化する原理によって第ｎチャネル精製重みα_nを得る例である。第１例の第ｎチャネル精製重み推定部１１１１－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を用いて、式（５）により第ｎチャネル精製重みα_nを得る。第ｎチャネル精製重み推定部１１１１－ｎがビット数b_nとビット数b_Mを特定する方法は全ての例で共通するので、最後の具体例である第７例の後で説明する。

［［第２例］］
第２例は、第１例で得られる第ｎチャネル精製重みα_nと類似する特徴をもつ第ｎチャネル精製重みα_nを得る例である。第２例の第ｎチャネル精製重み推定部１１１１－ｎは、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nとモノラル符号ＣＭのビット数b_Mを少なくとも用いて、0より大きく1未満の値であり、b_nとb_Mが等しいときには0.5であり、b_nがb_Mよりも多いほど0.5より0に近い値であり、b_Mがb_nよりも多いほど0.5より1に近い値を、第ｎチャネル精製重みα_nとして得る。

［［第３例］］
第３例は、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}が同一の系列とみなせない場合も考慮して第ｎチャネル精製重みα_nを得る例である。第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}が同一の系列とみなせるほどには各サンプル値が近い値を有しない場合には、上述した重み付き平均(1-α_n)×^x_n(t)＋α_n×^x_M(t)により得られる信号は、量子化誤差がない場合でも第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とは異なる波形となってしまう。したがって、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}に全く相関がない場合には、上述した重み付き平均の処理を行わずに、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}をそのまま第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}としたほうが、精度を維持できる。

したがって、第ｎチャネルの入力音信号X_n={x_n(1), x_n(2), ..., x_n(T)}とダウンミックス信号X_M={x_M(1), x_M(2), ..., x_M(T)}が同一の系列とみなせない場合も考慮すると、第ｎチャネル信号精製部１１２１－ｎは、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}とモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}の間の相関に応じて、相関が高いほど上記の式（５）で得られる値に近く、相関が低いほど0に近い値である第ｎチャネル精製重みα_nに基づいた重み付き平均(1-α_n)×^x_n(t)＋α_n×^x_M(t)により第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}を得られるようにするとよい。上記の相関としては、例えば、下記の式（６）で表されるように、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}のモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}に対する正規化された内積値r_nを用いることができる。

そこで、第３例の第ｎチャネル精製重み推定部１１１１－ｎは、式（６）により得られる正規化された内積値r_nを用いて、第ｎチャネル精製重みα_nを下記の式（７）により得る。

例えば、第ｎチャネル精製重み推定部１１１１－ｎは、図３に示すステップＳ１１１１－１－ｎからステップＳ１１１１－３－ｎを行う。第ｎチャネル精製重み推定部１１１１－ｎは、まず、第ｎチャネル復号音信号^X_nとモノラル復号音信号^X_Mから、式（６）により正規化された内積値r_nを得る（ステップＳ１１１１－１－ｎ）。第ｎチャネル精製重み推定部１１１１－ｎは、また、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、から下記の式（８）により補正係数c_nを得る（ステップＳ１１１１－２－ｎ）。

第ｎチャネル精製重み推定部１１１１－ｎは、次に、ステップＳ１１１１－１－ｎで得た正規化された内積値r_nとステップＳ１１１１－２－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る（ステップＳ１１１１－３－ｎ）。すなわち、第３例の第ｎチャネル精製重み推定部１１１１－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を用いて式（８）により得られる補正係数c_nと、第ｎチャネル復号音信号^X_nのモノラル復号音信号^X_Mに対する正規化された内積値r_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第４例］］
第４例は、第３例で得られる第ｎチャネル精製重みα_nと類似する特徴をもつ第ｎチャネル精製重みα_nを得る例である。第４例の第ｎチャネル精製重み推定部１１１１－ｎは、第ｎチャネル復号音信号^X_nと、モノラル復号音信号^X_Mと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を少なくとも用いて、0以上1以下の値であり、第ｎチャネル復号音信号^X_nとモノラル復号音信号^X_Mの間の相関が高いほど1に近い値であり、当該相関が低いほど0に近い値であるr_nと、0より大きく1未満の値であり、b_nとb_Mが同じであるときには0.5であり、b_nがb_Mよりも多いほど0.5より0に近く、b_nがb_Mよりも少ないほど0.5より1に近い値である補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第５例］］
第５例は、第３例の正規化された内積値に代えて、過去のフレームの入力の値も考慮した値を用いる例である。第５例は、第ｎチャネル精製重みα_nのフレーム間の急激な変動を少なくして、当該変動に由来して精製済復号音信号に生じるノイズを低減するものである。例えば、第５例の第ｎチャネル精製重み推定部１１１１－ｎは、図４に示す通り、下記のステップＳ１１１１－１１－ｎからステップＳ１１１１－１３－ｎと、第３例と同様のステップＳ１１１１－２－ｎとステップＳ１１１１－３－ｎと、を行う。

第ｎチャネル精製重み推定部１１１１－ｎは、まず、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、前のフレームで用いた内積値E_n(-1)と、を用いて、下記の式（９）により、現在のフレームで用いる内積値E_n(0)を得る（ステップＳ１１１１－１１－ｎ）。

ここで、ε_nは、０より大きく１未満の予め定めた値であり、第ｎチャネル精製重み推定部１１１１－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１１１１－ｎは、得た内積値E_n(0)を、「前のフレームで用いた内積値E_n(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１１１１－ｎ内に記憶する。

第ｎチャネル精製重み推定部１１１１－ｎは、また、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、前のフレームで用いたモノラル復号音信号のエネルギーE_M(-1)と、を用いて、下記の式（１０）により、現在のフレームで用いるモノラル復号音信号のエネルギーE_M(0)を得る（ステップ１１１１－１２－ｎ）。

ここで、ε_Mは、０より大きく１未満で予め定めた値であり、第ｎチャネル精製重み推定部１１１１－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１１１１－ｎは、得たモノラル復号音信号のエネルギーE_M(0)を、「前のフレームで用いたモノラル復号音信号のエネルギーE_M(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１１１１－ｎ内に記憶する。なお、第１精製重み推定部１１１１－１でも第２精製重み推定部１１１１－２でもE_M(0)の値は同じであるため、第１精製重み推定部１１１１－１と第２精製重み推定部１１１１－２の何れか一方でE_M(0)を得て、得たE_M(0)をもう一方の第ｎ精製重み推定部１１１１－ｎで用いるようにしてもよい。

第ｎチャネル精製重み推定部１１１１－ｎは、次に、ステップＳ１１１１－１１－ｎで得た現在のフレームで用いる内積値E_n(0)と、ステップＳ１１１１－１２－ｎで得た現在のフレームで用いるモノラル復号音信号のエネルギーE_M(0)を用いて、正規化された内積値r_nを下記の式（１１）で得る（ステップＳ１１１１－１３－ｎ）。

第ｎチャネル精製重み推定部１１１１－ｎは、また、式（８）により補正係数c_nを得る（ステップＳ１１１１－２－ｎ）。第ｎチャネル精製重み推定部１１１１－ｎは、次に、ステップＳ１１１１－１３－ｎで得た正規化された内積値r_nとステップＳ１１１１－２－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る（ステップＳ１１１１－３－ｎ）。

すなわち、第５例の第ｎチャネル精製重み推定部１１１１－ｎは、第ｎチャネル復号音信号^X_nの各サンプル値^x_n(t)とモノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームの内積値E_n(-1)とを用いて式（９）により得られる内積値E_n(0)と、モノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームのモノラル復号音信号のエネルギーE_M(-1)とを用いて式（１０）により得られるモノラル復号音信号のエネルギーE_M(0)と、を用いて式（１１）により得られる正規化された内積値r_nと、フレーム当たりのサンプル数Tとステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nとモノラル符号ＣＭのビット数b_Mとを用いて式（８）により得られる補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

なお、上記のε_n及びε_Mは、１に近いほど正規化された内積値r_nには過去のフレームの第ｎチャネル復号音信号とモノラル復号音信号の影響が含まれやすくなり、正規化された内積値r_nや、正規化された内積値r_nにより得られる第ｎチャネル精製重みα_nのフレーム間の変動は小さくなる。

［［第６例］］
例えば、第一チャネル入力音信号に含まれている音声や音楽などの音と、第二チャネル入力音信号に含まれている音声や音楽などの音と、が異なる場合には、モノラル復号音信号には第一チャネル入力音信号の成分も第二チャネル入力音信号の成分も含まれる。このため、第一チャネル精製重みα₁として大きな値を用いるほど、第一チャネル精製済復号音信号の中に本来聴こえるはずのない第二チャネルの入力音信号に由来する音が含まれているように聴こえてしまうという課題がある。同様に、第二チャネル精製重みα₂として大きな値を用いるほど、第二チャネル精製済復号音信号の中に本来聴こえるはずのない第一チャネルの入力音信号に由来する音が含まれているように聴こえてしまうという課題がある。そこで、聴覚品質を考慮して、第６例の第ｎチャネル精製重み推定部１１１１－ｎは、上述した各例により求まる各チャネルの第ｎチャネル精製重みα_nより小さい値を、第ｎチャネル精製重みα_nとして得る。例えば、第３例または第５例に基づく第６例の第ｎチャネル精製重み推定部１１１１－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、0より大きく1未満の予め定めた値であるλとを乗算した値λ×c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第７例］］
第６例で説明した聴覚品質の課題が生じるのは第一チャネル入力音信号と第二チャネル入力音信号の相関が小さいときであって、この課題は第一チャネル入力音信号と第二チャネル入力音信号の相関が大きいときにはあまり生じない。そこで、第７例の第ｎチャネル精製重み推定部１１１１－ｎは、第６例の予め定めた値に代えて、第一チャネル復号音信号と第二チャネル復号音信号の相関係数であるチャネル間相関係数γを用いて、第一チャネル復号音信号と第二チャネル復号音信号の相関が大きいほど、精製済復号音信号が有する量子化誤差のエネルギーを小さくすることを優先し、第一チャネル復号音信号と第二チャネル復号音信号の相関が小さいほど、聴覚品質の劣化を抑えることを優先する。以下、第７例が第３例及び第５例と異なる点について説明する。

［［［第７例のチャネル間関係情報推定部１１３１］］］
第７例の音信号精製装置１１０１は、図１に破線で示すようにチャネル間関係情報推定部１１３１も含む。チャネル間関係情報推定部１１３１には、音信号精製装置１１０１に入力された第一チャネル復号音信号と、音信号精製装置１１０１に入力された第二チャネル復号音信号と、が少なくとも入力される。第７例のチャネル間関係情報推定部１１３１は、第一チャネル復号音信号と第二チャネル復号音信号を少なくとも用いてチャネル間相関係数γを得て出力する（ステップＳ１１３１）。チャネル間相関係数γは、第一チャネル復号音信号と第二チャネル復号音信号の相関係数であり、第一チャネル復号音信号のサンプル列{^x₁(1), ^x₁(2), ..., ^x₁(T)}と第二チャネル復号音信号のサンプル列{^x₂(1), ^x₂(2), ..., ^x₂(T)}の相関係数γ₀であってもよいし、時間差を考慮した相関係数、例えば、第一チャネル復号音信号のサンプル列と、τサンプルだけ当該サンプル列より後にずれた位置にある第二チャネル復号音信号のサンプル列と、の相関係数γ_τであってもよい。なお、チャネル間関係情報推定部１１３１は、チャネル間相関係数γを、周知の何れの方法で得てもよいし、後述する第２実施形態のチャネル間関係情報推定部１１３２で説明する方法で得てもよい。なお、チャネル間相関係数γを得る方法次第では、図１に二点鎖線で示すように、音信号精製装置１１０１に入力されたモノラル復号音信号も、チャネル間関係情報推定部１１３１に入力される。

このτは、ある空間に配置した第一チャネル用のマイクロホンで収音した音をＡＤ変換して得られた音信号が第一チャネル入力音信号X₁であり、当該空間に配置した第二チャネル用のマイクロホンで収音した音をＡＤ変換して得られた音信号が第二チャネル入力音信号X₂である、と仮定したときの、当該空間で主に音を発している音源から第一チャネル用のマイクロホンへの到達時間と、当該音源から第二チャネル用のマイクロホンへの到達時間と、の差（いわゆる到来時間差）に相当する情報である。以降では、このτをチャネル間時間差と呼ぶ。チャネル間関係情報推定部１１３１は、チャネル間時間差τを、第一チャネル入力音信号X₁に対応する復号音信号である第一チャネル復号音信号^X₁と第二チャネル入力音信号X₂に対応する復号音信号である第二チャネル復号音信号^X₂とから、周知の何れの方法で求めてもよく、第２実施形態のチャネル間関係情報推定部１１３２で説明する方法などで求めればよい。すなわち、上述した相関係数γ_τは、音源から第一チャネル用のマイクロホンに到達して収音された音信号と、当該音源から第二チャネル用のマイクロホンに到達して収音された音信号と、の相関係数に相当する情報である。

［［［第７例の第ｎチャネル精製重み推定部１１１１－ｎ］］］
第７例の第ｎチャネル精製重み推定部１１１１－ｎは、第３例と第５例のステップＳ１１１１－３－ｎに代えて、第３例のステップＳ１１１１－１－ｎまたは第５例のステップＳＳ１１１１－１３－ｎで得た正規化された内積値r_nと、ステップＳ１１１１－２－ｎで得た補正係数c_nと、ステップＳ１１３１で得たチャネル間相関係数γと、を乗算した値γ×c_n×r_nを第ｎチャネル精製重みα_nとして得る（ステップＳ１１１１－３’－ｎ）。すなわち、第７例の第ｎチャネル精製重み推定部１１１１－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、第一チャネル復号音信号と第二チャネル復号音信号の相関係数であるチャネル間相関係数γと、を乗算した値γ×c_n×r_nを第ｎチャネル精製重みα_nとして得る。

なお、第ｎチャネル精製重み推定部１１１１－ｎは、第３例から第７例で第ｎチャネル精製重みα_nを得る際に、第ｎチャネル復号音信号^X_nやモノラル復号音信号^X_Mの代わりに、これらのそれぞれにフィルタにかけて得られる信号を用いてもよい。当該フィルタは、例えば予め定めたローパスフィルタでもよいし、第ｎチャネル復号音信号^X_nやモノラル復号音信号^X_Mを分析して得られる線形予測係数を用いた線形予測フィルタでもよい。フィルタにかけることで、第ｎチャネル復号音信号^X_nやモノラル復号音信号^X_Mの各周波数成分に重みをかけることができ、第ｎチャネル精製重みα_nを求めるときに聴感的に重要な周波数成分の寄与を大きくすることができる。

［モノラル符号ＣＭのビット数b_Mを特定する方法］
モノラル復号部６１０が用いる復号方式におけるモノラル符号ＣＭのビット数b_Mが全てのフレームで同じである場合には（すなわち、モノラル復号部６１０が用いる復号方式が固定ビットレートの復号方式である場合には）、第ｎチャネル精製重み推定部１１１１－ｎ内の図示しない記憶部にモノラル符号ＣＭのビット数b_Mを記憶しておけばよい。モノラル復号部６１０が用いる復号方式におけるモノラル符号ＣＭのビット数b_Mがフレームによって異なることがある場合には（すなわち、モノラル復号部６１０が用いる復号方式が可変ビットレートの復号方式である場合には）、モノラル復号部６１０がモノラル符号ＣＭのビット数b_Mを出力するようにして、ビット数b_Mが第ｎチャネル精製重み推定部１１１１－ｎに入力されるようにすればよい。

［ステレオ符号ＣＳのビット数のうちのビット数b_nを特定する方法］
ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nが全てのフレームで同じである場合には、第ｎチャネル精製重み推定部１１１１－ｎ内の図示しない記憶部にステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nを記憶しておけばよい。ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nがフレームによって異なることがある場合には、ステレオ復号部６２０がビット数b_nを出力するようにして、ビット数b_nが第ｎチャネル精製重み推定部１１１１－ｎに入力されるようにすればよい。ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nが陽に定まっていない場合には、第ｎチャネル精製重み推定部１１１１－ｎは、例えば、下記の第１の方法や第２の方法により得た値をb_nとして用いればよい。なお、第１の方法でも第２の方法でも、ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sが全てのフレームで同じである場合には、第ｎチャネル精製重み推定部１１１１－ｎ内の図示しない記憶部にステレオ符号ＣＳのビット数b_Sを記憶しておけばよく、ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sがフレームによって異なることがある場合には、ステレオ復号部６２０がビット数b_Sを出力するようにして、ビット数b_Sが第ｎチャネル精製重み推定部１１１１－ｎに入力されるようにすればよい。

［［ステレオ符号ＣＳのビット数のうちのビット数b_nを特定する第１の方法］］
第ｎチャネル精製重み推定部１１１１－ｎは、ステレオ符号ＣＳのビット数b_sをチャネル数で除算して得られる値（すなわち、２チャネルステレオの場合には、b_s/2、b_sの２分の１）をb_nとして用いる。すなわち、ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sが全てのフレームで同じである場合には、第ｎチャネル精製重み推定部１１１１－ｎ内の図示しない記憶部にステレオ符号ＣＳのビット数b_Sをチャネル数で除算して得た値をビット数b_nとして記憶しておけばよい。ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sがフレームによって異なることがある場合には、第ｎチャネル精製重み推定部１１１１－ｎがビット数b_sをチャネル数で除算した値をb_nとして得るようにすればよい。

［［ステレオ符号ＣＳのビット数のうちのビット数b_nを特定する第２の方法］］
第ｎチャネル精製重み推定部１１１１－ｎは、音信号精製装置１１０１に入力された全チャネルの復号音信号を用いて、ステレオ符号ＣＳのビット数b_sをチャネル数で除算して得た値と、第ｎチャネルの復号音信号^X_nのエネルギーと全チャネルの復号音信号のエネルギーの相乗平均との比の対数値に比例する値と、を加算した値をb_nとして得る。一般にステレオ符号化では、各チャネルの入力音信号に対して各信号のエネルギーの対数値に比例したビット数を割り当てることで効率よく圧縮を行うことができる。このことから、ステレオ符号化部５３０が用いる符号化方式とステレオ復号部６２０が用いる復号方式においてもステレオ符号ＣＳにおいて前述したビット数の割り当てがされていると想定してビット数b_nを推定するのが第２の方法である。より具体的には、例えば、第ｎチャネル精製重み推定部１１１１－ｎは、第１チャネル復号音信号^X₁のエネルギーe₁と第２チャネルの復号音信号^X₂のエネルギーe₂を用いた下記の式（１２）によりビット数b_nを得ればよい。

［第１実施形態の変形例］
音信号精製装置１１０１がチャネル間相関係数γを用いる場合でも、復号装置６００のステレオ復号部６２０がチャネル間相関係数γを得た場合には、音信号精製装置１１０１にはチャネル間関係情報推定部１１３１を備えずに、復号装置６００のステレオ復号部６２０が得たチャネル間相関係数γが音信号精製装置１１０１に入力されるようにして、音信号精製装置１１０１は入力されたチャネル間相関係数γを用いるようにしてもよい。

また、音信号精製装置１１０１がチャネル間相関係数γを用いる場合でも、上述した符号化装置５００が備える図示しないチャネル間関係情報符号化部が得て出力したチャネル間関係情報符号ＣＣにチャネル間相関係数γを表す符号が含まれる場合には、音信号精製装置１１０１にはチャネル間関係情報推定部１１３１を備えずに、チャネル間関係情報符号ＣＣに含まれるチャネル間相関係数γを表す符号が音信号精製装置１１０１に入力されるようにして、音信号精製装置１１０１には図示しないチャネル間関係情報復号部を備えて、チャネル間関係情報復号部がチャネル間相関係数γを表す符号を復号してチャネル間相関係数γを得て出力するようにしてもよい。

＜第２実施形態＞
第２実施形態の音信号精製装置も、第１実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。第２実施形態の音信号精製装置が第１実施形態の音信号精製装置と異なる点は、モノラルの復号音信号そのものではなく、モノラルの復号音信号を各チャネル用にアップミックスした信号を用いることである。以下、第２実施形態の音信号精製装置について、ステレオのチャネルの個数が２である場合の例を用いて、第１実施形態の音信号精製装置と異なる点を中心に説明する。

≪音信号精製装置１１０２≫
第２実施形態の音信号精製装置１１０２は、図５に例示する通り、チャネル間関係情報推定部１１３２とモノラル復号音アップミックス部１１７２と第一チャネル精製重み推定部１１１２－１と第一チャネル信号精製部１１２２－１と第二チャネル精製重み推定部１１１２－２と第二チャネル信号精製部１１２２－２を含む。音信号精製装置１１０２は、各フレームについて、図６に例示する通り、ステップＳ１１３２とステップＳ１１７２と、各チャネルについてのステップＳ１１１２－ｎとステップＳ１１２２－ｎと、を行う。

［チャネル間関係情報推定部１１３２］
チャネル間関係情報推定部１１３２には、音信号精製装置１１０２に入力された第一チャネル復号音信号^X₁と、音信号精製装置１１０２に入力された第二チャネル復号音信号^X₂と、が少なくとも入力される。チャネル間関係情報推定部１１３２は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いてチャネル間関係情報を得て出力する（ステップＳ１１３２）。チャネル間関係情報は、ステレオのチャネル間の関係を表す情報である。チャネル間関係情報の例は、チャネル間時間差τ、チャネル間相関係数γ、である。チャネル間関係情報推定部１１３２は、複数種類のチャネル間関係情報を得てもよく、例えばチャネル間時間差τとチャネル間相関係数γを得てもよい。

チャネル間時間差τは、ある空間に配置した第一チャネル用のマイクロホンで収音した音をＡＤ変換して得られた音信号が第一チャネル入力音信号X₁であり、当該空間に配置した第二チャネル用のマイクロホンで収音した音をＡＤ変換して得られた音信号が第二チャネル入力音信号X₂である、と仮定したときの、当該空間で主に音を発している音源から第一チャネル用のマイクロホンへの到達時間と、当該音源から第二チャネル用のマイクロホンへの到達時間と、の差（いわゆる到来時間差）に相当する情報である。なお、到来時間差だけではなく、どちらのマイクロホンに早く到達しているかに相当する情報もチャネル間時間差τに含めるために、チャネル間時間差τは、何れか一方の音信号を基準として正の値も負の値も取り得るものとする。チャネル間関係情報推定部１１３２は、チャネル間時間差τを、第一チャネル入力音信号X₁に対応する復号音信号である第一チャネル復号音信号^X₁と第二チャネル入力音信号X₂に対応する復号音信号である第二チャネル復号音信号^X₂とから得る。すなわち、チャネル間関係情報推定部１１３２が得るチャネル間時間差τは、同じ音信号が第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂のどちらにどれくらい先に含まれているかを表す情報である。以下では、同じ音信号が第二チャネル復号音信号^X₂よりも第一チャネル復号音信号^X₁に先に含まれている場合には、第一チャネルが先行しているともいい、同じ音信号が第一チャネル復号音信号^X₁よりも第二チャネル復号音信号^X₂に先に含まれている場合には、第二チャネルが先行しているともいう。

チャネル間関係情報推定部１１３２は、チャネル間時間差τを周知の何れの方法で求めてもよい。例えば、チャネル間関係情報推定部１１３２は、予め定めたτ_maxからτ_minまで（例えば、τ_maxは正の数、τ_minは負の数）の各候補サンプル数τ_candについて、第一チャネル復号音信号^X₁のサンプル列と、候補サンプル数τ_cand分だけ当該サンプル列より後にずれた位置にある第二チャネル復号音信号^X₂のサンプル列と、の相関の大きさを表す値（以下、相関値という）γ_candを計算して、相関値γ_candが最大となる候補サンプル数τ_candをチャネル間時間差τとして得る。すなわち、この例では、第一チャネルが先行している場合にはチャネル間時間差τは正の値であり、第二チャネルが先行している場合にはチャネル間時間差τは負の値である。すなわち、チャネル間時間差τの絶対値|τ|は、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|であり、先行しているチャネルがもう一方のチャネルに対してどれくらい先行しているかを表す値（先行しているサンプル数）である。また、チャネル間時間差τが正の値であるか負の値であるかは、第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報である。したがって、チャネル間関係情報推定部１１３２は、チャネル間時間差τに代えて、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報と、第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報と、を得てもよい。

例えば、チャネル間関係情報推定部１１３２は、フレーム内のサンプルのみを用いて相関値γ_candを計算する場合には、τ_candが正の値の場合には、第二チャネル復号音信号^X₂の部分サンプル列{^x₂(1+τ_cand), ^x₂(2+τ_cand), ..., ^x₂(T)}と、候補サンプル数τ_cand分だけ当該部分サンプル列より前にずれた位置にある第一チャネル復号音信号^X₁の部分サンプル列{^x₁(1), ^x₁(2), ..., ^x₁(T-τ_cand)}と、の相関係数の絶対値を相関値γ_candとして計算し、τ_candが負の値の場合には、第一チャネル復号音信号^X₁の部分サンプル列{^x₁(1-τ_cand), ^x₁(2-τ_cand), ..., ^x₁(T)}と、候補サンプル数(-τ_cand)分だけ当該部分サンプル列より前にずれた位置にある第二チャネル復号音信号^X₂の部分サンプル列{^x₂(1), ^x₂(2), ..., ^x₂(T+τ_cand)}と、の相関係数の絶対値を相関値γ_candとして計算すればよい。もちろん、相関値γ_candを計算するために現在のフレームの復号音信号のサンプル列に連続する過去の復号音信号の１個以上のサンプルも用いてもよく、この場合には、チャネル間関係情報推定部１１３２は、過去のフレームの復号音信号のサンプル列を予め定めたフレーム数分だけチャネル間関係情報推定部１１３２内の図示しない記憶部に記憶しておくようにすればよい。

また例えば、相関係数の絶対値に代えて、以下のように信号の位相の情報を用いて相関値γ_candを計算してもよい。この例においては、チャネル間関係情報推定部１１３２は、まず、第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}を下記の式（２１）のようにフーリエ変換することにより、0からT-1の各周波数kにおける周波数スペクトルf₁(k)を得る。

チャネル間関係情報推定部１１３２は、また、第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}を下記の式（２２）のようにフーリエ変換することにより、0からT-1の各周波数kにおける周波数スペクトルf₂(k)を得る。

チャネル間関係情報推定部１１３２は、次に、0からT-1の各周波数kの周波数スペクトルf₁(k)とf₂(k)を用いて、下記の式（２３）により、各周波数kにおける位相差のスペクトルφ(k)を得る。

チャネル間関係情報推定部１１３２は、次に、0からT-1の位相差のスペクトルを逆フーリエ変換することにより、下記の式（２４）のようにτ_maxからτ_minまでの各候補サンプル数τ_candについて位相差信号ψ(τ_cand)を得る。

ここで得られた位相差信号ψ(τ_cand)の絶対値は、第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}の時間差の尤もらしさに対応したある種の相関を表すものである。そこで、チャネル間関係情報推定部１１３２は、次に、各候補サンプル数τ_candに対する位相差信号ψ(τ_cand)の絶対値を相関値γ_candとして得る。チャネル間関係情報推定部１１３２は、次に、位相差信号ψ(τ_cand)の絶対値である相関値γ_candが最大となる候補サンプル数τ_candをチャネル間時間差τとして得る。

なお、チャネル間関係情報推定部１１３２は、相関値γ_candとして位相差信号ψ(τ_cand)の絶対値をそのまま用いることに代えて、例えば各τ_candについて位相差信号ψ(τ_cand)の絶対値に対するτ_cand前後にある複数個の候補サンプル数それぞれについて得られた位相差信号の絶対値の平均との相対差のように、正規化された値を用いてもよい。具体的には、チャネル間関係情報推定部１１３２は、各τ_candについて、予め定めた正の数τ_rangeを用いて、下記の式（２５）により平均値を得て、得られた平均値ψ_c(τ_cand)と位相差信号ψ(τ_cand)を用いて下記の式（２６）により得られる正規化された相関値をγ_candとして得てもよい。

なお、式（２６）により得られる正規化された相関値は、0以上1以下の値であり、τ_candがチャネル間時間差として尤もらしいほど1に近く、τ_candがチャネル間時間差として尤もらしくないほど0に近い性質を示す値である。

予め定めた各候補サンプル数は、τ_maxからτ_minまでの各整数値であってもよいし、τ_maxからτ_minまでの間にある分数値や小数値を含んでいてもよいし、τ_maxからτ_minまでの間にある何れかの整数値を含まないでもよい。また、τ_max＝-τ_minであってもよいし、そうでなくてもよい。また、何れかのチャネルが必ず先行しているような特殊な復号音信号を対象とする場合には、τ_maxもτ_minも正の数としたり、τ_maxもτ_minも負の数としたりしてもよい。

なお、音信号精製装置１１０２が第１実施形態で説明した第７例で第ｎチャネル精製重みα_nを得る場合には、チャネル間関係情報推定部１１３２は、さらに、第一チャネル復号音信号のサンプル列と、チャネル間時間差τ分だけ当該サンプル列より後にずれた位置にある第二チャネル復号音信号のサンプル列と、の相関値、すなわち、τ_maxからτ_minまでの各候補サンプル数τ_candについて計算した相関値γ_candのうちの最大値、をチャネル間相関係数γとして出力する。

また例えば、チャネル間関係情報推定部１１３２は、モノラル復号音信号も用いてチャネル間相関係数γを得てもよい。この場合には、図５に二点鎖線で示すように、音信号精製装置１１０２に入力されたモノラル復号音信号も、チャネル間関係情報推定部１１３２に入力される。チャネル間関係情報推定部１１３２は、第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と、第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}と、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}を用いて、モノラル復号音信号^X_Mを第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂との重み付き和で近似するとしたときの最も適切な重みをチャネル間相関係数γとして得てもよい。つまり、チャネル間関係情報推定部１１３２は、-1以上1以下のw_candのうち下記の式（２７）により得られる値が最小となる重みw_candをチャネル間相関係数γとして得てもよい。

チャネル間の相関が高い場合、つまり、符号化装置５００に入力された第一チャネル入力音信号と符号化装置５００に入力された第二チャネル入力音信号が時間差を合わせれば似た波形である場合には、符号化装置５００のダウンミックス部５１０において効率よくダウンミックスがされていると想定すると、モノラル復号音信号は、第一チャネル復号音信号と第二チャネル復号音信号のうち先行するチャネルの復号音信号と時間的に同期する信号を多く含む。したがって、式（２７）により得られるチャネル間相関係数γは、第一チャネル復号音信号に含まれる音信号が先行している場合には1に近い値であり、第二チャネル復号音信号に含まれる音信号が先行している場合には-1に近い値であり、チャネル間の相関が低いほど絶対値が小さくなる。このことから、式（２７）により得られる値が最小となる重みw_candをチャネル間相関係数γとして用いることができる。なお、この方法では、チャネル間関係情報推定部１１３２は、チャネル間時間差τを得ずにチャネル間相関係数γを得ることが可能である。

［モノラル復号音アップミックス部１１７２］
モノラル復号音アップミックス部１１７２には、音信号精製装置１１０２に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、チャネル間関係情報推定部１１３２が出力したチャネル間関係情報と、が入力される。モノラル復号音アップミックス部１１７２は、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}とチャネル間関係情報を用いたアップミックス処理を行うことにより、モノラル復号音信号を各チャネル用にアップミックスした信号である第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}を得て出力する（ステップＳ１１７２）。モノラル復号音アップミックス部１１７２が用いるチャネル間関係情報は、ステレオのチャネル間の関係を表す情報であり、１種類であっても複数種類であってもよい。モノラル復号音アップミックス部１１７２は、例えば以下のように、チャネル間時間差τ、または、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報と第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報と、を用いたアップミックス処理を行えばよい。

［［チャネル間時間差τを用いたアップミックス処理の例］］
モノラル復号音アップミックス部１１７２は、第一チャネルが先行している場合（すなわち、チャネル間時間差τが正の値である場合、または、第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報が第一チャネルが先行していることを表す場合）には、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}をそのまま第一チャネルアップミックス済モノラル復号音信号^X_M1={^x_M1(1), ^x_M1(2), ..., ^x_M1(T)}として出力し、モノラル復号音信号を|τ|サンプル（チャネル間時間差τの絶対値分のサンプル数、チャネル間時間差τが表す大きさ分のサンプル数）遅らせた信号{^x_M(1-|τ|), ^x_M(2-|τ|), ..., ^x_M(T-|τ|)}を第二チャネルアップミックス済モノラル復号音信号^X_M2={^x_M2(1), ^x_M2(2), ..., ^x_M2(T)}として出力する。モノラル復号音アップミックス部１１７２は、第二チャネルが先行している場合（すなわち、チャネル間時間差τが負の値である場合、または、第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報が第二チャネルが先行していることを表す場合）には、モノラル復号音信号を|τ|サンプル遅らせた信号{^x_M(1-|τ|), ^x_M(2-|τ|), ..., ^x_M(T-|τ|)}を第一チャネルアップミックス済モノラル復号音信号^X_M1={^x_M1(1), ^x_M1(2), ..., ^x_M1(T)}として出力し、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}をそのまま第二チャネルアップミックス済モノラル復号音信号^X_M2={^x_M2(1), ^x_M2(2), ..., ^x_M2(T)}として出力する。モノラル復号音アップミックス部１１７２は、何れのチャネルも先行していない場合（すなわち、チャネル間時間差τが0である場合、または、第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報が何れのチャネルも先行していないことを表す場合）には、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}をそのまま第一チャネルアップミックス済モノラル復号音信号^X_M1={^x_M1(1), ^x_M1(2), ..., ^x_M1(T)}と第二チャネルアップミックス済モノラル復号音信号^X_M2={^x_M2(1), ^x_M2(2), ..., ^x_M2(T)}として出力する。すなわち、モノラル復号音アップミックス部１１７２は、第一チャネルと第二チャネルのうちの上述した到達時間が短いほうのチャネルについては、入力されたモノラル復号音信号をそのまま当該チャネルのアップミックス済モノラル復号音信号として出力し、第一チャネルと第二チャネルのうちの上述した到達時間が長いほうのチャネルについては、入力されたモノラル復号音信号をチャネル間時間差τの絶対値|τ|だけ遅らせた信号を当該チャネルのアップミックス済モノラル復号音信号として出力する。なお、モノラル復号音アップミックス部１１７２ではモノラル復号音信号を遅延させた信号を得るために過去のフレームのモノラル復号音信号を用いることから、モノラル復号音アップミックス部１１７２内の図示しない記憶部には、過去のフレームで入力されたモノラル復号音信号を予め定めたフレーム数分だけ記憶しておく。

［第ｎチャネル精製重み推定部１１１２－ｎ］
第ｎチャネル精製重み推定部１１１２－ｎは、第ｎチャネル精製重みα_nを得て出力する（ステップＳ１１１２－ｎ）。第ｎチャネル精製重み推定部１１１２－ｎは、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法と同様の方法で、第ｎチャネル精製重みα_nを得る。第ｎチャネル精製重み推定部１１１２－ｎが得る第ｎチャネル精製重みα_nは、0以上1以下の値である。ただし、第ｎチャネル精製重み推定部１１１２－ｎは、フレームごとに後述する方法で第ｎチャネル精製重みα_nを得るので、全てのフレームで第ｎチャネル精製重みα_nが0や1になることはない。すなわち、第ｎチャネル精製重みα_nが0より大きく1未満の値となるフレームが存在する。言い換えると、全てのフレームのうちの少なくとも何れかのフレームでは、第ｎチャネル精製重みα_nは0より大きく1未満の値である。

具体的には、下記の第１例から第７例のように、第ｎチャネル精製重み推定部１１１２－ｎは、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法においてモノラル復号音信号^X_Mを用いている箇所は、モノラル復号音信号^X_Mに代えて第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを用いて、第ｎチャネル精製重みα_nを得る。当然ながら、第ｎチャネル精製重み推定部１１１２－ｎは、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法においてモノラル復号音信号^X_Mに基づいて得られる値を用いている箇所は、モノラル復号音信号^X_Mに基づいて得られる値に代えて第ｎチャネルアップミックス済モノラル復号音信号^X_Mnに基づいて得られる値を用いる。例えば、第ｎチャネル精製重み推定部１１１２－ｎは、現在のフレームのモノラル復号音信号のエネルギーE_M(0)に代えて現在のフレームの第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を用い、前のフレームのモノラル復号音信号のエネルギーE_M(-1)に代えて前のフレームの第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)を用いる。

［［第１例］］
第１例の第ｎチャネル精製重み推定部１１１２－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を用いて、下記の式（２－５）により第ｎチャネル精製重みα_nを得る。

［［第２例］］
第２例の第ｎチャネル精製重み推定部１１１２－ｎは、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を少なくとも用いて、0より大きく1未満の値であり、b_nとb_Mが等しいときには0.5であり、b_nがb_Mよりも多いほど0.5より0に近い値であり、b_Mがb_nよりも多いほど0.5より1に近い値を、第ｎチャネル精製重みα_nとして得る。

［［第３例］］
第３例の第ｎチャネル精製重み推定部１１１２－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を用いて

より得られる補正係数c_nと、第ｎチャネル復号音信号^X_nの第ｎチャネルアップミックス済モノラル復号音信号^X_Mnに対する正規化された内積値r_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

第３例の第ｎチャネル精製重み推定部１１１２－ｎは、例えば、下記のステップＳ１１１２－３１－ｎからステップＳ１１１２－３３－ｎを行うことで第ｎチャネル精製重みα_nを得る。第ｎチャネル精製重み推定部１１１２－ｎは、まず、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}から、下記の式（２－６）により第ｎチャネル復号音信号^X_nの第ｎチャネルアップミックス済モノラル復号音信号^X_Mnに対する正規化された内積値r_nを得る（ステップＳ１１１２－３１－ｎ）。

第ｎチャネル精製重み推定部１１１２－ｎは、また、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nと、モノラル符号ＣＭのビット数b_Mと、を用いて、式（２－８）により補正係数c_nを得る（ステップＳ１１１２－３２－ｎ）。第ｎチャネル精製重み推定部１１１２－ｎは、次に、ステップＳ１１１２－３１－ｎで得た正規化された内積値r_nとステップＳ１１１２－３２－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る（ステップＳ１１１２－３３－ｎ）。

［［第４例］］
第４例の第ｎチャネル精製重み推定部１１１２－ｎは、ステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数をb_nとし、モノラル符号ＣＭのビット数をb_Mとして、0以上1以下の値であり、第ｎチャネル復号音信号^X_nと第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの間の相関が高いほど1に近い値であり、当該相関が低いほど0に近い値であるr_nと、0より大きく1未満の値であり、b_nとb_Mが同じであるときには0.5であり、b_nがb_Mよりも多いほど0.5より0に近く、b_nがb_Mよりも少ないほど0.5より1に近い値である補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第５例］］
第５例の第ｎチャネル精製重み推定部１１１２－ｎは、例えば、下記のステップＳ１１１２－５１－ｎからステップＳ１１１２－５５－ｎを行うことで第ｎチャネル精製重みα_nを得る。

第ｎチャネル精製重み推定部１１１２－ｎは、まず、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、前のフレームで用いた内積値E_n(-1)と、を用いて、下記の式（２－９）により、現在のフレームで用いる内積値E_n(0)を得る（ステップＳ１１１２－５１－ｎ）。

ここで、ε_nは、0より大きく1未満の予め定めた値であり、第ｎチャネル精製重み推定部１１１２－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１１１２－ｎは、得た内積値E_n(0)を、「前のフレームで用いた内積値E_n(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１１１２－ｎ内に記憶する。

第ｎチャネル精製重み推定部１１１２－ｎは、また、第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、前のフレームで用いた第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)と、を用いて、下記の式（２－１０）により、現在のフレームで用いる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を得る（ステップＳ１１１２－５２－ｎ）。

ここで、ε_Mnは、0より大きく1未満で予め定めた値であり、第ｎチャネル精製重み推定部１１１２－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１１１２－ｎは、得た第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を、「前のフレームで用いた第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１１１２－ｎ内に記憶する。

第ｎチャネル精製重み推定部１１１２－ｎは、次に、ステップＳ１１１２－５１－ｎで得た現在のフレームで用いる内積値E_n(0)と、ステップＳ１１１２－５２－ｎで得た現在のフレームで用いる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を用いて、正規化された内積値r_nを下記の式（２－１１）で得る（ステップＳ１１１２－５３－ｎ）。

第ｎチャネル精製重み推定部１１１２－ｎは、また、式（２－８）により補正係数c_Mを得る（ステップＳ１１１２－５４－ｎ）。第ｎチャネル精製重み推定部１１１２－ｎは、次に、ステップＳ１１１２－５３－ｎで得た正規化された内積値r_nとステップＳ１１１２－５４－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る（ステップＳ１１１２－５５－ｎ）。

すなわち、第５例の第ｎチャネル精製重み推定部１１１２－ｎは、第ｎチャネル復号音信号^X_nの各サンプル値^x_n(t)と第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの各サンプル値^x_Mn(t)と前フレームの内積値E_n(-1)とを用いて式（２－９）により得られる内積値E_n(0)と、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの各サンプル値^x_Mn(t)と前フレームの第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)とを用いて式（２－１０）により得られる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)と、を用いて式（２－１１）により得られる正規化された内積値r_nと、フレーム当たりのサンプル数Tとステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nとモノラル符号ＣＭのビット数b_Mとを用いて式（２－８）により得られる補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第６例］］
第６例の第ｎチャネル精製重み推定部１１１２－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、0より大きく1未満の予め定めた値であるλと、を乗算した値λ×c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［［第７例］］
第７例の第ｎチャネル精製重み推定部１１１２－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、第一チャネル復号音信号と第二チャネル復号音信号の相関係数であるチャネル間相関係数γと、を乗算した値γ×c_n×r_nを第ｎチャネル精製重みα_nとして得る。

［第ｎチャネル信号精製部１１２２－ｎ］
第ｎチャネル信号精製部１１２２－ｎには、音信号精製装置１１０２に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、モノラル復号音アップミックス部１１７２が出力した第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、第ｎチャネル精製重み推定部１１１２－ｎが出力した第ｎチャネル精製重みα_nと、が入力される。第ｎチャネル信号精製部１１２２－ｎは、対応するサンプルtごとに、第ｎチャネル精製重みα_nと第ｎチャネルアップミックス済モノラル復号音信号^X_Mnのサンプル値^x_Mn(t)とを乗算した値α_n×^x_Mn(t)と、第ｎチャネル精製重みα_nを1から減算した値(1-α_n)と第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)とを乗算した値(1-α_n)×^x_n(t)と、を加算した値~x_n(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n (2), ..., ~x_n(T)}として得て出力する（ステップＳ１１２２－ｎ）。すなわち、~x_n(t)=(1-α_n)×^x_n(t)＋α_n×^x_Mn(t)である。

＜第３実施形態＞
第３実施形態の音信号精製装置も、第１実施形態と第２実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。第３実施形態の音信号精製装置が第２実施形態の音信号精製装置と異なる点は、チャネル間関係情報を復号音信号からではなく符号から得ることである。以下、第３実施形態の音信号精製装置について、ステレオのチャネルの個数が２である場合の例を用いて、第２実施形態の音信号精製装置と異なる点を説明する。

≪音信号精製装置１１０３≫
第３実施形態の音信号精製装置１１０３は、図７に例示する通り、チャネル間関係情報復号部１１４３とモノラル復号音アップミックス部１１７２と第一チャネル精製重み推定部１１１２－１と第一チャネル信号精製部１１２２－１と第二チャネル精製重み推定部１１１２－２と第二チャネル信号精製部１１２２－２を含む。音信号精製装置１１０３は、各フレームについて、図８に例示する通り、ステップＳ１１４３とステップＳ１１７２と、各チャネルについてのステップＳ１１１２－ｎとステップＳ１１２２－ｎと、を行う。第３実施形態の音信号精製装置１１０３が第２実施形態の音信号精製装置１１０２と異なる点は、チャネル間関係情報推定部１１３２に代えてチャネル間関係情報復号部１１４３を備えて、ステップＳ１１３２に代えてステップＳ１１４３を行うことである。また、第３実施形態の音信号精製装置１１０３には、各フレームのチャネル間関係情報符号ＣＣも入力される。チャネル間関係情報符号ＣＣは、上述した符号化装置５００が備える図示しないチャネル間関係情報符号化部が得て出力した符号であってもよいし、上述した符号化装置５００のステレオ符号化部５３０が得て出力したステレオ符号ＣＳに含まれる符号であってもよい。以下、第３実施形態の音信号精製装置１１０３が第２実施形態の音信号精製装置１１０２と異なる点について説明する。

［チャネル間関係情報復号部１１４３］
チャネル間関係情報復号部１１４３には、音信号精製装置１１０３に入力されたチャネル間関係情報符号ＣＣが入力される。チャネル間関係情報復号部１１４３は、チャネル間関係情報符号ＣＣを復号してチャネル間関係情報を得て出力する（ステップＳ１１４３）。チャネル間関係情報復号部１１４３が得るチャネル間関係情報は、第２実施形態のチャネル間関係情報推定部１１３２が得るチャネル間関係情報と同じである。

［第３実施形態の変形例］
チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、ステップＳ１１４３で得られるのと同じチャネル間関係情報が、復号装置６００のステレオ復号部６２０内で復号により得られている。したがって、チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、復号装置６００のステレオ復号部６２０が得たチャネル間関係情報が第３実施形態の音信号精製装置１１０３に入力されるようにして、第３実施形態の音信号精製装置１１０３はチャネル間関係情報復号部１１４３を備えずにステップＳ１１４３を行わないようにしてもよい。

また、チャネル間関係情報符号ＣＣの一部だけがステレオ符号ＣＳに含まれる符号である場合には、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれる符号を復号装置６００のステレオ復号部６２０が復号して得たチャネル間関係情報が第３実施形態の音信号精製装置１１０３に入力されるようにして、第３実施形態の音信号精製装置１１０３のチャネル間関係情報復号部１１４３は、ステップＳ１１４３として、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれない符号を復号して、音信号精製装置１１０３に入力されなかったチャネル間関係情報を得て出力するようにすればよい。

また、音信号精製装置１１０３の各部が用いるチャネル間関係情報のうちの一部に対応する符号がチャネル間関係情報符号ＣＣに含まれない場合には、第３実施形態の音信号精製装置１１０３にはチャネル間関係情報推定部１１３２も備えて、チャネル間関係情報推定部１１３２がステップＳ１１３２も行うようにすればよい。この場合には、チャネル間関係情報推定部１１３２は、ステップＳ１１３２として、音信号精製装置１１０３の各部が用いるチャネル間関係情報のうちのチャネル間関係情報符号ＣＣを復号しても得られないチャネル間関係情報を、第２実施形態のステップＳ１１３２と同様に得て出力すればよい。

＜第４実施形態＞
第４実施形態の音信号精製装置も、第１実施形態から第３実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。以下、第４実施形態の音信号精製装置について、ステレオのチャネルの個数が2である場合の例を用いて、上述した各実施形態の音信号精製装置を適宜参照して説明する。

第４実施形態の音信号精製装置１２０１は、図９に例示する通り、復号音共通信号推定部１２５１と共通信号精製重み推定部１２１１と共通信号精製部１２２１と第一チャネル分離結合重み推定部１２８１－１と第一チャネル分離結合部１２９１－１と第二チャネル分離結合重み推定部１２８１－２と第二チャネル分離結合部１２９１－２を含む。音信号精製装置１２０１は、例えば20msの所定の時間長のフレーム単位で、ステレオの復号音の全チャネルに共通する信号である復号音共通信号について、復号音共通信号とモノラル復号音信号から、復号音共通信号を改善した音信号である精製済共通信号を得て、ステレオの各チャネルについて、復号音共通信号と精製済共通信号と当該チャネルの復号音信号とから、当該チャネルの復号音信号を改善した音信号である精製済復号音信号を得て出力する。音信号精製装置１２０１にフレーム単位で入力される各チャネルの復号音信号は、例えば、上述した復号装置６００のステレオ復号部６２０が、モノラル符号ＣＭを復号して得られた情報もモノラル符号ＣＭも用いずに、モノラル符号ＣＭとは異なる符号であるb_Sビットのステレオ符号ＣＳを復号して得たTサンプルの第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}とTサンプルの第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}である。音信号精製装置１２０１にフレーム単位で入力されるモノラルの復号音信号は、例えば、上述した復号装置６００のモノラル復号部６１０が、ステレオ符号ＣＳを復号して得られた情報もステレオ符号ＣＳも用いずに、ステレオ符号ＣＳとは異なる符号であるb_Mビットのモノラル符号ＣＭを復号して得たTサンプルのモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}である。モノラル符号ＣＭは、ステレオ符号ＣＳが由来する音信号と同じ音信号（すなわち、符号化装置５００に入力された第一チャネル入力音信号X₁と第二チャネル入力音信号X₂）に由来する符号ではあるが、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を得る元となった符号（すなわち、ステレオ符号ＣＳ）とは異なる符号である。第一チャネルのチャネル番号nを1とし、第二チャネルのチャネル番号nを2とすると、音信号精製装置１２０１は、各フレームについて、図１０に例示する通り、ステップＳ１２５１とステップＳ１２１１とステップＳ１２２１と、各チャネルについてのステップＳ１２８１－ｎとステップＳ１２９１－ｎと、を行う。

［復号音共通信号推定部１２５１］
復号音共通信号推定部１２５１には、音信号精製装置１２０１に入力された第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}が少なくとも入力される。復号音共通信号推定部１２５１は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いて、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}を得て出力する（ステップＳ１２５１）。復号音共通信号推定部１２５１は、例えば、下記の何れかの方法を用いればよい。

［［復号音共通信号を得る第１の方法］］
第１の方法では、復号音共通信号推定部１２５１は、音信号精製装置１２０１に入力されたモノラル復号音信号^X_Mも用いて、復号音共通信号^Y_Mを得て出力する。すなわち、第１の方法を用いる場合には、復号音共通信号推定部１２５１には、音信号精製装置１２０１に入力された第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}とモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}が入力される。復号音共通信号推定部１２５１は、まず、ステレオの全チャネルの復号音信号の重み付き平均（第1から第Nまでの全チャネルの復号音信号^X₁, ..., ^X_Nの重み付き平均）とモノラル復号音信号の差が最小となる重み係数を得る（ステップＳ１２５１Ａ－１）。例えば、復号音共通信号推定部１２５１は、-1以上1以下のw_candのうち下記の式（４１）により得られる値が最小となるw_candを重み係数wとして得る。

復号音共通信号推定部１２５１は、次に、ステップＳ１２５１Ａ－１で得た重み係数を用いたステレオの全チャネルの復号音信号の重み付き平均（第1から第Nまでの全チャネルの復号音信号^X₁, ..., ^X_Nの重み付き平均）を復号音共通信号として得る（ステップＳ１２５１Ａ－２）。例えば、復号音共通信号推定部１２５１は、各サンプル番号tについて、下記の式（４２）により復号音共通信号^y_M(t)を得る。

［［復号音共通信号を得る第２の方法］］
第２の方法は、符号化装置５００のダウンミックス部５１０が［［ダウンミックス信号を得る第２の方法］］でダウンミックス信号を得た場合に対応する方法である。第２の方法では、復号音共通信号推定部１２５１は、後述するステップＳ１２５１Ｂを行うことで復号音共通信号^Y_Mを得る。第２の方法を用いる場合には、音信号精製装置１２０１は、後述するステップＳ１２５１Ｂで用いるチャネル間相関係数γと先行チャネル情報を得るために、図９に破線で示すようにチャネル間関係情報推定部１２３１も含み、復号音共通信号推定部１２５１がステップＳ１２５１Ｂを行う前にチャネル間関係情報推定部１２３１が下記のステップＳ１２３１を行う。

［［［チャネル間関係情報推定部１２３１］］］
チャネル間関係情報推定部１２３１には、音信号精製装置１２０１に入力された第一チャネル復号音信号^X₁と、音信号精製装置１２０１に入力された第二チャネル復号音信号^X₂と、が少なくとも入力される。チャネル間関係情報推定部１２３１は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いてチャネル間相関係数γと先行チャネル情報をチャネル間関係情報として得て出力する（ステップＳ１２３１）。チャネル間相関係数γは、第一チャネル復号音信号と第二チャネル復号音信号の相関係数である。先行チャネル情報は、第一チャネルと第二チャネルの何れが先行しているかを表す情報である。例えば、チャネル間関係情報推定部１２３１は、下記のステップＳ１２３１－１からステップＳ１２３１－３を行う。

チャネル間関係情報推定部１２３１は、まず、第２実施形態のチャネル間関係情報推定部１１３２の説明箇所で例示した方法でチャネル間時間差τを得る（ステップＳ１２３１－１）。チャネル間関係情報推定部１２３１は、次に、第一チャネル復号音信号と、チャネル間時間差τ分だけ当該サンプル列より後にずれた位置にある第二チャネル復号音信号のサンプル列と、の相関値、すなわち、τ_maxからτ_minまでの各候補サンプル数τ_candについて計算した相関値γ_candのうちの最大値、をチャネル間相関係数γとして得て出力する（ステップＳ１２３１－２）。チャネル間関係情報推定部１２３１は、また、チャネル間時間差τが正の値である場合には、第一チャネルが先行していることを表す情報を先行チャネル情報として得て出力し、チャネル間時間差τが負の値である場合には、第二チャネルが先行していることを表す情報を先行チャネル情報として得て出力する（ステップＳ１２３１－３）。チャネル間関係情報推定部１２３１は、チャネル間時間差τが0である場合には、第一チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいし、第二チャネルが先行していることを表す情報を先行チャネル情報として得て出力してもよいが、何れのチャネルも先行していないことを表す情報を先行チャネル情報として得て出力するとよい。

［［［復号音共通信号推定部１２５１］］］
復号音共通信号推定部１２５１には、音信号精製装置１２０１に入力された第一チャネル復号音信号^X₁と、音信号精製装置１２０１に入力された第二チャネル復号音信号^X₂と、チャネル間関係情報推定部１２３１が出力したチャネル間相関係数γと、チャネル間関係情報推定部１２３１が出力した先行チャネル情報と、が入力される。復号音共通信号推定部１２５１は、復号音共通信号^Y_Mに、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂のうちの先行しているチャネルの復号音信号のほうが、チャネル間相関係数γが大きいほど大きく含まれるように、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を重み付け平均して復号音共通信号^Y_Mを得て出力する（Ｓ１２５１Ｂ）。

例えば、復号音共通信号推定部１２５１は、対応する各サンプル番号tに対して、チャネル間相関係数γで定まる重みを用いて第一チャネル復号音信号^x₁(t)と第二チャネル復号音信号^x₂(t)を重み付け加算したものを復号音共通信号^y_M(t)とすればよい。具体的には、復号音共通信号推定部１２５１は、先行チャネル情報が第一チャネルが先行していることを表す情報である場合、すなわち、第一チャネルが先行している場合には、各サンプル番号tについて、^y_M(t)=((1+γ)/2)×^x₁(t)＋((1-γ)/2)×^x₂(t)を復号音共通信号^y_M(t)として得ればよい。すなわち、復号音共通信号推定部１２５１は、第一チャネルが先行している場合には、^y_M(t)=((1+γ)/2)×^x₁(t)＋((1-γ)/2)×^x₂(t)による系列を復号音共通信号^Y_Mとして得ればよい。復号音共通信号推定部１２５１は、先行チャネル情報が第二チャネルが先行していることを表す情報である場合、すなわち、第二チャネルが先行している場合には、各サンプル番号tについて、^y_M(t)=((1-γ)/2)×^x₁(t)＋((1+γ)/2)×^x₂(t)を復号音共通信号^y_M(t)として得ればよい。すなわち、復号音共通信号推定部１２５１は、第二チャネルが先行している場合には、^y_M(t)=((1-γ)/2)×^x₁(t)＋((1+γ)/2)×^x₂(t)による系列を復号音共通信号^Y_Mとして得ればよい。なお、復号音共通信号推定部１２５１は、先行チャネル情報が何れのチャネルも先行していないことを表す場合には、各サンプル番号tについて、第一チャネル復号音信号^x₁(t)と第二チャネル復号音信号^x₂(t)を平均した^y_M(t)=(^x₁(t)+^x₂(t))/2を復号音共通信号^y_M(t)として得ればよい。すなわち、復号音共通信号推定部１２５１は、何れのチャネルも先行していない場合には、^y_M(t)=(^x₁(t)+^x₂(t))/2による系列を復号音共通信号^Y_Mとして得ればよい。

［共通信号精製重み推定部１２１１］
共通信号精製重み推定部１２１１は、共通信号精製重みα_Mを得て出力する（ステップ１２１１）。共通信号精製重み推定部１２１１は、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法と同様の方法で、共通信号精製重みα_Mを得る。共通信号精製重み推定部１２１１が得る共通信号精製重みα_Mは、0以上1以下の値である。ただし、共通信号精製重み推定部１２１１は、フレームごとに後述する方法で共通信号精製重みα_Mを得るので、全てのフレームで共通信号精製重みα_Mが0や1になることはない。すなわち、共通信号精製重みα_Mが0より大きく1未満の値となるフレームが存在する。言い換えると、全てのフレームのうちの少なくとも何れかのフレームでは、共通信号精製重みα_Mは0より大きく1未満の値である。

具体的には、下記の第１例から第７例のように、共通信号精製重み推定部１２１１は、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法において第ｎチャネル復号音信号^X_nを用いている箇所は、第ｎチャネル復号音信号^X_nに代えて復号音共通信号^Y_Mを用いて、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法においてステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nを用いている箇所は、ビット数b_nに代えてステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを用いて、共通成分信号重みα_Mを得る。すなわち、下記の第１例から第７例ではモノラル符号ＣＭのビット数b_Mとステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを用いる。モノラル符号ＣＭのビット数b_Mを特定する方法は第１実施形態と同じであるので、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを特定する方法を第１例から第７例を説明する前に説明する。共通信号精製重み推定部１２１１には、必要に応じて、図９に一点鎖線で示すように、復号音共通信号推定部１２５１が出力した復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、音信号精製装置１１０１に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、が入力される。

［ステレオ符号ＣＳのビット数のうちのビット数b_mを特定する方法］
［［ステレオ符号ＣＳのビット数のうちのビット数b_mを特定する第１の方法］］
共通信号精製重み推定部１２１１は、ステレオ符号ＣＳのビット数b_sと予め定めた0より大きく1未満の値とを乗算した値をb_mとして用いる。すなわち、ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sが全てのフレームで同じである場合には、共通信号精製重み推定部１２１１内の図示しない記憶部にステレオ符号ＣＳのビット数b_Sと予め定めた0より大きく1未満の値とを乗算した値をビット数b_mとして記憶しておけばよい。ステレオ復号部６２０が用いる復号方式におけるステレオ符号ＣＳのビット数b_sがフレームによって異なることがある場合には、共通信号精製重み推定部１２１１がビット数b_sと予め定めた0より大きく1未満の値とを乗算した値をb_mとして得るようにすればよい。例えば、共通信号精製重み推定部１２１１は、チャネル数の逆数を予め定めた0より大きく1未満の値として用いればよい。すなわち、共通信号精製重み推定部１２１１は、ステレオ符号ＣＳのビット数b_sをチャネル数で除算した値をb_mとして用いてもよい。

［［ステレオ符号ＣＳのビット数のうちのビット数b_mを特定する第２の方法］］
共通信号精製重み推定部１２１１は、チャネル間相関係数γを用いてフレーム毎にb_mを推定してもよい。チャネル間の相関が高い場合には、ステレオ符号ＣＳのビット数b_Sのうちの大半がチャネル間で共通する信号成分を表現するために用いられ、チャネル間の相関が低い場合には、チャネル数に対して均等に近いビット数が用いられていると予想される。したがって、第２の方法においては、共通信号精製重み推定部１２１１は、チャネル間相関係数γが1に近いほど、ビット数b_sに近い値をb_mとして得て、チャネル間相関係数γが0に近いほど、b_sをチャネル数で除算した値に近い値をb_mとして得るようにすればよい。なお、第２の方法を用いる場合には、音信号精製装置１２０１は、チャネル間相関係数γを得るために図９に破線で示すようにチャネル間関係情報推定部１２３１も含み、チャネル間関係情報推定部１２３１は［［復号音共通成分信号を得る第２の方法］］の説明箇所や第２実施形態のチャネル間関係情報推定部１１３２の説明箇所で上述したようにチャネル間相関係数γを得る。

［［第１例］］
第１例の共通信号精製重み推定部１２１１は、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を用いて、下記の式（４－５）により共通信号精製重みα_Mを得る。

［［第２例］］
第２例の共通信号精製重み推定部１２１１は、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を少なくとも用いて、0より大きく1未満の値であり、b_mとb_Mが等しいときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近い値であり、b_Mがb_mよりも多いほど0.5より1に近い値を、共通信号精製重みα_Mとして得る。

［［第３例］］
第３例の共通信号精製重み推定部１２１１は、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mとを用いて、

により得られる補正係数c_Mと、復号音共通信号^Y_Mのモノラル復号音信号^X_Mに対する正規化された内積値r_Mと、を乗算した値c_M×r_Mを共通信号精製重みα_Mとして得る。

第３例の共通信号精製重み推定部１２１１は、例えば、下記のステップＳ１２１１－３１－ｎからステップＳ１２１１－３３－ｎを行うことで共通信号精製重みα_Mを得る。共通信号精製重み推定部１２１１は、まず、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}とモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}から、下記の式（４－６）により復号音共通信号^Y_Mのモノラル復号音信号^X_Mに対する正規化された内積値r_Mを得る（ステップＳ１２１１－３１－ｎ）。

共通信号精製重み推定部１２１１は、また、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を用いて、式（４－８）により補正係数c_Mを得る（ステップＳ１２１１－３２－ｎ）。共通信号精製重み推定部１２１１は、次に、ステップＳ１２１１－３１－ｎで得た正規化された内積値r_MとステップＳ１２１１－３２－ｎで得た補正係数c_Mとを乗算した値c_M×r_Mを共通信号精製重みα_Mとして得る（ステップＳ１２１１－３３－ｎ）。

［［第４例］］
第４例の共通信号精製重み推定部１２１１は、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数をb_mとし、モノラル符号ＣＭのビット数をb_Mとして、0以上1以下の値であり、復号音共通信号^Y_Mとモノラル復号音信号^X_Mの間の相関が高いほど1に近い値であり、当該相関が低いほど0に近い値であるr_Mと、0より大きく1未満の値であり、b_mとb_Mが同じであるときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近く、b_mがb_Mよりも少ないほど0.5より1に近い値である補正係数c_Mと、を乗算した値c_M×r_Mを共通信号精製重みα_Mとして得る。

［［第５例］］
第５例の共通信号精製重み推定部１２１１は、下記のステップＳ１２１１－５１からステップＳ１２１１－５５を行うことで共通信号精製重みα_Mを得る。

共通信号精製重み推定部１２１１は、まず、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、前のフレームで用いた内積値E_m(-1)と、を用いて、下記の式（４－９）により、現在のフレームで用いる内積値E_m(0)を得る（ステップＳ１２１１－５１）。

ここで、ε_mは、０より大きく１未満の予め定めた値であり、共通信号精製重み推定部１２１１内に予め記憶されている。なお、共通信号精製重み推定部１２１１は、得た内積値E_m(0)を、「前のフレームで用いた内積値E_m(-1)」として次のフレームで用いるために、共通信号精製重み推定部１２１１内に記憶する。

共通信号精製重み推定部１２１１は、また、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、前のフレームで用いたモノラル復号音信号のエネルギーE_M(-1)と、を用いて、下記の式（４－１０）により、現在のフレームで用いるモノラル復号音信号のエネルギーE_M(0)を得る（ステップＳ１２１１－５２）。

ここで、ε_Mは、０より大きく１未満で予め定めた値であり、共通信号精製重み推定部１２１１内に予め記憶されている。なお、共通信号精製重み推定部１２１１は、得たモノラル復号音信号のエネルギーE_M(0)を、「前のフレームで用いたモノラル復号音信号のエネルギーE_M(-1)」として次のフレームで用いるために、共通信号精製重み推定部１２１１内に記憶する。

共通信号精製重み推定部１２１１は、次に、ステップＳ１２１１－５１で得た現在のフレームで用いる内積値E_m(0)と、ステップＳ１２１１－５２で得た現在のフレームで用いるモノラル復号音信号のエネルギーE_M(0)を用いて、正規化された内積値r_Mを下記の式（４－１１）で得る（ステップＳ１２１１－５３）。

共通信号精製重み推定部１２１１は、また、式（４－８）により補正係数c_Mを得る（ステップＳ１２１１－５４）。共通信号精製重み推定部１２１１は、次に、ステップＳ１２１１－５３で得た正規化された内積値r_MとステップＳ１２１１－５４で得た補正係数c_Mとを乗算した値c_M×r_Mを共通信号精製重みα_Mとして得る（ステップＳ１２１１－５５）。

すなわち、第５例の共通信号精製重み推定部１２１１は、復号音共通信号^Y_Mの各サンプル値^y_M(t)とモノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームの内積値E_m(-1)とを用いて式（４－９）により得られる内積値E_m(0)と、モノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームのモノラル復号音信号のエネルギーE_M(-1)とを用いて式（４－１０）により得られるモノラル復号音信号のエネルギーE_M(0)と、を用いて式（４－１１）により得られる正規化された内積値r_Mと、フレーム当たりのサンプル数Tとステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mとモノラル符号ＣＭのビット数b_Mとを用いて式（４－８）により得られる補正係数c_Mと、を乗算した値c_M×r_Mを共通信号精製重みα_Mとして得る。

［［第６例］］
第６例の共通信号精製重み推定部１２１１は、第３例で説明した正規化された内積値r_Mと補正係数c_M、または、第５例で説明した正規化された内積値r_Mと補正係数c_M、と、0より大きく1未満の予め定めた値であるλと、を乗算した値λ×c_M×r_Mを共通信号精製重みα_Mとして得る。

［［第７例］］
第７例の共通信号精製重み推定部１２１１は、第３例で説明した正規化された内積値r_Mと補正係数c_M、または、第５例で説明した正規化された内積値r_Mと補正係数c_M、と、第一チャネル復号音信号と第二チャネル復号音信号の相関係数であるチャネル間相関係数γと、を乗算した値γ×c_M×r_Mを共通信号精製重みα_Mとして得る。第７例の音信号精製装置１２０１は、チャネル間相関係数γを得るために図９に破線で示すようにチャネル間関係情報推定部１２３１も含み、チャネル間関係情報推定部１２３１は、［［復号音共通成分信号を得る第２の方法］］の説明箇所や第２実施形態のチャネル間関係情報推定部１１３２の説明箇所で上述したようにチャネル間相関係数γを得る。

［共通信号精製部１２２１］
共通信号精製部１２２１には、復号音共通信号推定部１２５１が出力した復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、音信号精製装置１２０１に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、共通信号精製重み推定部１２１１が出力した共通信号精製重みα_Mと、が入力される。共通信号精製部１２２１は、対応するサンプルtごとに、共通信号精製重みα_Mとモノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_M×^x_M(t)と、共通信号精製重みα_Mを1から減算した値(1-α_M)と復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値(1-α_M)×^y_M(t)と、を加算した値~y_M(t)による系列を精製済共通信号~Y_M={~y_M(1), ~y_M(2), ..., ~y_M(T)}として得て出力する（ステップＳ１２２１）。すなわち、~y_M(t)=(1-α_M)×^y_M(t)＋α_M×^x_M(t)である。

［第ｎチャネル分離結合重み推定部１２８１－ｎ］
第ｎチャネル分離結合重み推定部１２８１－ｎには、音信号精製装置１２０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号推定部１２５１が出力した復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、が入力される。第ｎチャネル分離結合重み推定部１２８１－ｎは、第ｎチャネル復号音信号^X_nと復号音共通信号^Y_Mとから、第ｎチャネル復号音信号^X_nの復号音共通信号^Y_Mに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得る（ステップＳ１２８１－ｎ）。第ｎチャネル分離結合重みβ_nは、具体的には式（４３）の通りである。

［第ｎチャネル分離結合部１２９１－ｎ］
第ｎチャネル分離結合部１２９１－ｎには、音信号精製装置１２０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号推定部１２５１が出力した復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、共通信号精製部１２２１が出力した精製済共通信号~Y_M={~y_M(1), ~y_M(2), ..., ~y_M(T)}と、第ｎチャネル分離結合重み推定部１２８１－ｎが出力した第ｎチャネル分離結合重みβ_nと、が入力される。第ｎチャネル分離結合部１２９１－ｎは、対応するサンプルtごとに、第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、第ｎチャネル分離結合重みβ_nと復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値β_n×^y_M(t)を減算し、第ｎチャネル分離結合重みβ_nと精製済共通信号~Y_Mのサンプル値~y_M(t)とを乗算した値β_n×~y_M(t)を加算した値~x_n(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}として得て出力する（ステップＳ１２９１－ｎ）。すなわち、~x_n(t)=^x_n(t)-β_n×^y_M(t)＋β_n×~y_M(t)である。

［第４実施形態の変形例］
音信号精製装置１２０１がチャネル間関係情報を用いる場合であって、音信号精製装置１２０１が用いるチャネル間関係情報の少なくとも何れかを復号装置６００のステレオ復号部６２０が得た場合には、復号装置６００のステレオ復号部６２０が得たチャネル間関係情報が音信号精製装置１２０１に入力されるようにして、音信号精製装置１２０１は入力されたチャネル間関係情報を用いるようにしてもよい。

また、音信号精製装置１２０１がチャネル間関係情報を用いる場合であって、上述した符号化装置５００が備える図示しないチャネル間関係情報符号化部が得て出力したチャネル間関係情報符号ＣＣに音信号精製装置１２０１が用いるチャネル間関係情報の少なくとも何れかが含まれる場合には、チャネル間関係情報符号ＣＣに含まれる音信号精製装置１２０１が用いるチャネル間関係情報を表す符号が音信号精製装置１２０１に入力されるようにして、音信号精製装置１２０１には図示しないチャネル間関係情報復号部を備えて、チャネル間関係情報復号部がチャネル間関係情報を表す符号を復号してチャネル間関係情報を得て出力するようにしてもよい。

すなわち、音信号精製装置１２０１が用いる全てのチャネル間関係情報が、音信号精製装置１２０１に入力されるかチャネル間関係情報復号部で得らえた場合には、音信号精製装置１２０１にはチャネル間関係情報推定部１２３１を備えないでよい。

＜第５実施形態＞
第５実施形態の音信号精製装置は、第４実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。第５実施形態の音信号精製装置が第４実施形態の音信号精製装置と異なる点は、モノラル復号音信号そのものではなく、モノラル復号音信号を各チャネル用にアップミックスした信号を用いることと、復号音共通信号そのものではなく、復号音共通信号を各チャネル用にアップミックスした信号を用いること、である。以下、第５実施形態の音信号精製装置について、ステレオのチャネルの個数が2である場合の例を用いて、第４実施形態の音信号精製装置と異なる点を中心に、上述した各実施形態の音信号精製装置を適宜参照して、説明する。

≪音信号精製装置１２０２≫
第５実施形態の音信号精製装置１２０２は、図１１に例示する通り、チャネル間関係情報推定部１２３２と復号音共通信号推定部１２５１と共通信号精製重み推定部１２１１と共通信号精製部１２２１と復号音共通信号アップミックス部１２６２と精製済共通信号アップミックス部１２７２と第一チャネル分離結合重み推定部１２８２－１と第一チャネル分離結合部１２９２－１と第二チャネル分離結合重み推定部１２８２－２と第二チャネル分離結合部１２９２－２を含む。音信号精製装置１２０２は、各フレームについて、図１２に例示する通り、ステップＳ１２３２とステップＳ１２５１とステップＳ１２１１とステップＳ１２２１とステップＳ１２６２とステップＳ１２７２と、各チャネルについてのステップＳ１２８２－ｎとステップＳ１２９２－ｎと、を行う。

［チャネル間関係情報推定部１２３２］
チャネル間関係情報推定部１２３２には、音信号精製装置１２０２に入力された第一チャネル復号音信号^X₁と、音信号精製装置１２０２に入力された第二チャネル復号音信号^X₂と、が少なくとも入力される。チャネル間関係情報推定部１２３２は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いてチャネル間関係情報を得て出力する（ステップＳ１２３２）。チャネル間関係情報は、ステレオのチャネル間の関係を表す情報である。チャネル間関係情報の例は、チャネル間時間差τ、チャネル間相関係数γ、先行チャネル情報、である。チャネル間関係情報推定部１２３２は、複数種類のチャネル間関係情報を得てもよく、例えばチャネル間時間差τとチャネル間相関係数γと先行チャネル情報を得てもよい。チャネル間関係情報推定部１２３２がチャネル間時間差τを得る方法とチャネル間相関係数γを得る方法としては、例えば、第２実施形態のチャネル間関係情報推定部１１３２の説明箇所で上述した方法を用いればよい。復号音共通信号推定部１２５１が先行チャネル情報を用いる場合には、チャネル間関係情報推定部１２３２は先行チャネル情報を得る。チャネル間関係情報推定部１２３２が先行チャネル情報を得る方法としては、例えば、第４実施形態のチャネル間関係情報推定部１２３１の説明箇所で上述した方法を用いればよい。なお、チャネル間関係情報推定部１１３２の説明箇所で上述した方法で得たチャネル間時間差τには、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報と第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報とが含まれているので、チャネル間関係情報推定部１２３２が先行チャネル情報も得て出力する場合には、チャネル間時間差τに代えて、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報を得て出力してもよい。

［復号音共通信号推定部１２５１］
復号音共通信号推定部１２５１は、第４実施形態の復号音共通信号推定部１２５１と同様に、復号音共通成分信号^Y_Mを得て出力する（ステップＳ１２５１）。

［共通信号精製重み推定部１２１１］
共通信号精製重み推定部１２１１は、第４実施形態の共通信号精製重み推定部１２１１と同様に、共通信号精製重みα_Mを得て出力する（ステップ１２１１）。

［共通信号精製部１２２１］
共通信号精製部１２２１は、第４実施形態の共通信号精製部１２２１と同様に、精製済共通信号~Y_Mを得て出力する（ステップＳ１２２１）。

［復号音共通信号アップミックス部１２６２］
復号音共通信号アップミックス部１２６２には、復号音共通信号推定部１２５１が出力した復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、チャネル間関係情報推定部１２３２が出力したチャネル間関係情報と、が少なくとも入力される。復号音共通信号アップミックス部１２６２は、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}とチャネル間関係情報を少なくとも用いたアップミックス処理を行うことにより、復号音共通信号を各チャネル用にアップミックスした信号である第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}を得て出力する（ステップＳ１２６２）。復号音共通信号アップミックス部１２６２は、例えば以下の第１の方法または第２の方法で第ｎチャネルアップミックス済共通信号^Y_Mnを得ればよい。

［［第ｎチャネルアップミックス済共通信号を得る第１の方法］
復号音共通信号アップミックス部１２６２は、第２実施形態のモノラル復号音アップミックス部１１７２と同じ処理を、モノラル復号音信号^X_Mを復号音共通信号^Y_Mと読み替え、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを第ｎチャネルアップミックス済共通信号^Y_Mnと読み替えて行うことで、第ｎチャネルアップミックス済共通信号^Y_Mnを得る。すなわち、復号音共通信号アップミックス部１２６２は、第一チャネルが先行している場合には、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}をそのまま第一チャネルアップミックス済共通信号^Y_M1={^y_M1(1), ^y_M1(2), ..., ^y_M1(T)}として出力し、復号音共通信号を|τ|サンプル遅らせた信号{^y_M(1-|τ|), ^y_M(2-|τ|), ..., ^y_M(T-|τ|)}を第二チャネルアップミックス済共通信号^Y_M2={^y_M2(1), ^y_M2(2), ..., ^y_M2(T)}として出力する。復号音共通信号アップミックス部１２６２は、第二チャネルが先行している場合には、復号音共通信号を|τ|サンプル遅らせた信号{^y_M(1-|τ|), ^y_M(2-|τ|), ..., ^y_M(T-|τ|)}を第一チャネルアップミックス済共通信号^Y_M1={^y_M1(1), ^y_M1(2), ..., ^y_M1(T)}として出力し、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}をそのまま第二チャネルアップミックス済共通信号^Y_M2={^y_M2(1), ^y_M2(2), ..., ^y_M2(T)}として出力する。復号音共通信号アップミックス部１２６２は、何れのチャネルも先行していない場合には、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}をそのまま第一チャネルアップミックス済共通信号^Y_M1={^y_M1(1), ^y_M1(2), ..., ^y_M1(T)}と第二チャネルアップミックス済共通信号^Y_M2={^y_M2(1), ^y_M2(2), ..., ^y_M2(T)}として出力する。

［［第ｎチャネルアップミックス済共通信号を得る第２の方法］
チャネル間の相関が小さい場合には、第１の方法のような復号音共通信号^Y_Mへの時間差の付与だけでは、良好な第ｎチャネルアップミックス済共通信号^Y_Mnを得られないことがある。そこで、復号音共通信号アップミックス部１２６２が、チャネル間の相関を考慮して、復号音共通信号^Y_Mと各チャネルの復号音信号^X_nとの重み付き平均をとって第ｎチャネルアップミックス済共通信号^Y_Mnを得るのが第２の方法である。第２の方法では、復号音共通信号アップミックス部１２６２は、第１の方法で得られる第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}それぞれを暫定第ｎチャネルアップミックス済共通信号Y'_Mn={y'_Mn(1), y'_Mn(2), ..., y'_Mn(T)}として（すなわち、第１の方法と同じ処理を、第ｎチャネルアップミックス済共通信号^Y_Mnを暫定第ｎチャネルアップミックス済共通信号Y'_Mnと読み替えて行うことで暫定第ｎチャネルアップミックス済共通信号Y'_Mn={y'_Mn(1), y'_Mn(2), ..., y'_Mn(T)}を得て）、対応するサンプルtごとに、第ｎチャネル復号音^x_n(t)と暫定第ｎチャネルアップミックス済共通信号y'_Mn(t)とチャネル間相関係数γを用いて以下の式（５１）により得られる^y_Mn(n)による系列を第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}として得る。

なお、復号音共通信号アップミックス部１２６２が第２の方法を行う場合には、図１１に破線で示すように、音信号精製装置１２０２に入力された第一チャネル復号音信号と音信号精製装置１２０２に入力された第二チャネル復号音信号も復号音共通成分アップミックス部１２６２に入力される。

［精製済共通信号アップミックス部１２７２］
精製済共通信号アップミックス部１２７２には、共通信号精製部１２２１が出力した精製済共通信号~Y_M={~y_M(1), ~y_M(2), ..., ~y_M(T)}と、チャネル間関係情報推定部１２３２が出力したチャネル間関係情報と、が入力される。精製済共通信号アップミックス部１２７２は、精製済共通信号~Y_M={~y_M(1), ~y_M(2), ..., ~y_M(T)}とチャネル間関係情報を用いたアップミックス処理を行うことにより、精製済共通信号を各チャネル用にアップミックスした信号である第ｎチャネルアップミックス済精製済信号~Y_Mn={~y_Mn(1), ~y_Mn(2), ..., ~y_Mn(T)}を得て出力する（ステップＳ１２７２）。精製済共通信号アップミックス部１２７２は、第２実施形態のモノラル復号音アップミックス部１１７２と同じ処理を、モノラル復号音信号^X_Mを精製済共通信号~Y_Mと読み替え、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを第ｎチャネルアップミックス済精製済信号~Y_Mnと読み替えて行えばよい。

［第ｎチャネル分離結合重み推定部１２８２－ｎ］
第ｎチャネル分離結合重み推定部１２８２－ｎには、音信号精製装置１２０２に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号アップミックス部１２６２が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、が入力される。第ｎチャネル分離結合重み推定部１２８２－ｎは、第ｎチャネル復号音信号^X_nと第ｎチャネルアップミックス済共通信号^Y_Mnとから、第ｎチャネル復号音信号^X_nの第ｎチャネルアップミックス済共通信号^Y_Mnに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得て出力する（ステップＳ１２８２－ｎ）。第ｎチャネル分離結合重みβ_nは、具体的には式（５２）の通りである。

［第ｎチャネル分離結合部１２９２－ｎ］
第ｎチャネル分離結合部１２９２－ｎには、音信号精製装置１２０２に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号アップミックス部１２６２が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、精製済共通信号アップミックス部１２７２が出力した第ｎチャネルアップミックス済精製済信号~Y_Mn={~y_Mn(1), ~y_Mn(2), ..., ~y_Mn(T)}と、第ｎチャネル分離結合重み推定部１２８２－ｎが出力した第ｎチャネル分離結合重みβ_nと、が入力される。第ｎチャネル分離結合部１２９２－ｎは、対応するサンプルtごとに、第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、第ｎチャネル分離結合重みβ_nと第ｎチャネルアップミックス済共通信号^Y_Mnのサンプル値^y_Mn(t)とを乗算した値β_n×^y_Mm(t)を減算し、第ｎチャネル分離結合重みβ_nと第ｎチャネルアップミックス済精製済信号~Y_Mnのサンプル値~y_Mn(t)とを乗算した値β_n×~y_Mn(t)を加算した値~x_n(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}として得て出力する（ステップＳ１２９２－ｎ）。すなわち、~x_n(t)=^x_n(t)-β_n×^y_Mn(t)＋β_n×~y_Mn(t)である。

＜第６実施形態＞
第６実施形態の音信号精製装置も、第４実施形態と第５実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。第６実施形態の音信号精製装置が第５実施形態の音信号精製装置と異なる点は、チャネル間関係情報を復号音信号からではなく符号から得ることである。以下、第６実施形態の音信号精製装置について、ステレオのチャネルの個数が2である場合の例を用いて、第５実施形態の音信号精製装置と異なる点を説明する。

≪音信号精製装置１２０３≫
第６実施形態の音信号精製装置１２０３は、図１３に例示する通り、チャネル間関係情報復号部１２４３と復号音共通信号推定部１２５１と共通信号精製重み推定部１２１１と共通信号精製部１２２１と復号音共通信号アップミックス部１２６２と精製済共通信号アップミックス部１２７２と第一チャネル分離結合重み推定部１２８２－１と第一チャネル分離結合部１２９２－１と第二チャネル分離結合重み推定部１２８２－２と第二チャネル分離結合部１２９２－２を含む。音信号精製装置１２０３は、各フレームについて、図１４に例示する通り、ステップＳ１２４３とステップＳ１２５１とステップＳ１２１１とステップＳ１２２１とステップＳ１２６２とステップＳ１２７２と、各チャネルについてのステップＳ１２８２－ｎとステップＳ１２９２－ｎと、を行う。第６実施形態の音信号精製装置１２０３が第５実施形態の音信号精製装置１２０２と異なる点は、チャネル間関係情報推定部１２３２に代えてチャネル間関係情報復号部１２４３を備えて、ステップＳ１２３２に代えてステップＳ１２４３を行うことである。また、第６実施形態の音信号精製装置１２０３には、各フレームのチャネル間関係情報符号ＣＣも入力される。チャネル間関係情報符号ＣＣは、上述した符号化装置５００が備える図示しないチャネル間関係情報符号化部が得て出力した符号であってもよいし、上述した符号化装置５００のステレオ符号化部５３０が得て出力したステレオ符号ＣＳに含まれる符号であってもよい。以下、第６実施形態の音信号精製装置１２０３が第５実施形態の音信号精製装置１２０２と異なる点について説明する。

［チャネル間関係情報復号部１２４３］
チャネル間関係情報復号部１２４３には、音信号精製装置１２０３に入力されたチャネル間関係情報符号ＣＣが入力される。チャネル間関係情報復号部１２４３は、チャネル間関係情報符号ＣＣを復号してチャネル間関係情報を得て出力する（ステップＳ１２４３）。チャネル間関係情報復号部１２４３が得るチャネル間関係情報は、第５実施形態のチャネル間関係情報推定部１２３２が得るチャネル間関係情報と同じである。

［第６実施形態の変形例］
チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、ステップＳ１２４３で得られるのと同じチャネル間関係情報が、復号装置６００のステレオ復号部６２０内で復号により得られている。したがって、チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、復号装置６００のステレオ復号部６２０が得たチャネル間関係情報が第６実施形態の音信号精製装置１２０３に入力されるようにして、第６実施形態の音信号精製装置１２０３はチャネル間関係情報復号部１２４３を備えずにステップＳ１２４３を行わないようにしてもよい。

また、チャネル間関係情報符号ＣＣの一部だけがステレオ符号ＣＳに含まれる符号である場合には、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれる符号を復号装置６００のステレオ復号部６２０が復号して得たチャネル間関係情報が第６実施形態の音信号精製装置１２０３に入力されるようにして、第６実施形態の音信号精製装置１２０３のチャネル間関係情報復号部１２４３は、ステップＳ１２４３として、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれない符号を復号して、音信号精製装置１２０３に入力されなかったチャネル間関係情報を得て出力するようにすればよい。

また、音信号精製装置１２０３の各部が用いるチャネル間関係情報のうちの一部に対応する符号がチャネル間関係情報符号ＣＣに含まれない場合には、第６実施形態の音信号精製装置１２０３にはチャネル間関係情報推定部１２３２も備えて、チャネル間関係情報推定部１２３２がステップＳ１２３２も行うようにすればよい。この場合には、チャネル間関係情報推定部１２３２は、音信号精製装置１２０３の各部が用いるチャネル間関係情報のうちのチャネル間関係情報符号ＣＣを復号しても得られないチャネル間関係情報を、第５実施形態のステップＳ１２３２と同様に得て出力すればよい。

＜第７実施形態＞
第７実施形態の音信号精製装置も、第１実施形態から第６実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。以下、第７実施形態の音信号精製装置について、ステレオのチャネルの個数が2である場合の例を用いて、上述した各実施形態の音信号精製装置を適宜参照して説明する。

第７実施形態の音信号精製装置１３０１は、図１５に例示する通り、チャネル間関係情報推定部１３３１と復号音共通信号推定部１３５１と復号音共通信号アップミックス部１３６１とモノラル復号音アップミックス部１３７１と第一チャネル精製重み推定部１３１１－１と第一チャネル信号精製部１３２１－１と第一チャネル分離結合重み推定部１３８１－１と第一チャネル分離結合部１３９１－１と第二チャネル精製重み推定部１３１１－２と第二チャネル信号精製部１３２１－２と第二チャネル分離結合重み推定部１３８１－２と第二チャネル分離結合部１３９１－２を含む。音信号精製装置１３０１は、例えば20msの所定の時間長のフレーム単位で、ステレオの各チャネルについて、ステレオの復号音の全チャネルに共通する信号である復号音共通信号をアップミックスして得た信号であるアップミックス済共通信号と、モノラル復号音信号をアップミックスして得たアップミックス済モノラル復号音信号と、からアップミックス済共通信号を改善した音信号である精製済アップミックス済信号を得て、復号音信号とアップミックス済共通信号と精製済アップミックス済信号とから、復号音信号を改善した音信号である精製済復号音信号を得て出力する。音信号精製装置１３０１にフレーム単位で入力される各チャネルの復号音信号は、例えば、上述した復号装置６００のステレオ復号部６２０が、モノラル符号ＣＭを復号して得られた情報もモノラル符号ＣＭも用いずに、モノラル符号ＣＭとは異なる符号であるb_Sビットのステレオ符号ＣＳを復号して得たTサンプルの第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}とTサンプルの第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}である。音信号精製装置１３０１にフレーム単位で入力されるモノラルの復号音信号は、例えば、上述した復号装置６００のモノラル復号部６１０が、ステレオ符号ＣＳを復号して得られた情報もステレオ符号ＣＳも用いずに、ステレオ符号ＣＳとは異なる符号であるb_Mビットのモノラル符号ＣＭを復号して得たTサンプルのモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}である。モノラル符号ＣＭは、ステレオ符号ＣＳが由来する音信号と同じ音信号（すなわち、符号化装置５００に入力された第一チャネル入力音信号X₁と第二チャネル入力音信号X₂）に由来する符号ではあるが、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を得る元となった符号（すなわち、ステレオ符号ＣＳ）とは異なる符号である。第一チャネルのチャネル番号nを1とし、第二チャネルのチャネル番号nを2とすると、音信号精製装置１３０１は、各フレームについて、図１６に例示する通り、ステップＳ１３３１とステップＳ１３５１とステップＳ１３６１とステップＳ１３７１と、各チャネルについてのステップＳ１３１１－ｎとステップＳ１３２１－ｎとステップＳ１３８１－ｎとステップＳ１３９１－ｎと、を行う。

［チャネル間関係情報推定部１３３１］
チャネル間関係情報推定部１３３１には、音信号精製装置１３０１に入力された第一チャネル復号音信号^X₁と、音信号精製装置１３０１に入力された第二チャネル復号音信号^X₂と、が少なくとも入力される。チャネル間関係情報推定部１３３１は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いてチャネル間関係情報を得て出力する（ステップＳ１３３１）。チャネル間関係情報は、ステレオのチャネル間の関係を表す情報である。チャネル間関係情報の例は、チャネル間時間差τ、チャネル間相関係数γ、先行チャネル情報、である。チャネル間関係情報推定部１３３１は、複数種類のチャネル間関係情報を得てもよく、例えばチャネル間時間差τとチャネル間相関係数γと先行チャネル情報を得てもよい。チャネル間関係情報推定部１３３１がチャネル間時間差τを得る方法とチャネル間相関係数γを得る方法としては、例えば、第２実施形態のチャネル間関係情報推定部１１３２の説明箇所で上述した方法を用いればよい。復号音共通信号推定部１３５１が先行チャネル情報を用いる場合には、チャネル間関係情報推定部１３３１は先行チャネル情報を得る。チャネル間関係情報推定部１３３１が先行チャネル情報を得る方法としては、例えば、第４実施形態のチャネル間関係情報推定部１２３１の説明箇所で上述した方法を用いればよい。なお、チャネル間関係情報推定部１１３２の説明箇所で上述した方法で得たチャネル間時間差τには、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報と第一チャネルと第二チャネルの何れのチャネルが先行しているかを表す情報とが含まれているので、チャネル間関係情報推定部１３３１が先行チャネル情報も得て出力する場合には、チャネル間時間差τに代えて、第一チャネルと第二チャネルの時間差に対応するサンプル数|τ|を表す情報を得て出力してもよい。

［復号音共通信号推定部１３５１］
復号音共通信号推定部１３５１には、音信号精製装置１３０１に入力された第一チャネル復号音信号^X₁={^x₁(1), ^x₁(2), ..., ^x₁(T)}と第二チャネル復号音信号^X₂={^x₂(1), ^x₂(2), ..., ^x₂(T)}が少なくとも入力される。復号音共通信号推定部１３５１は、第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂を少なくとも用いて、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}を得て出力する（ステップＳ１３５１）。復号音共通信号推定部１３５１が復号音共通信号^Y_Mを得る方法としては、例えば、第４実施形態の復号音共通信号推定部１２５１の説明箇所で上述した方法を用いればよい。

［復号音共通信号アップミックス部１３６１］
復号音共通信号アップミックス部１３６１には、復号音共通信号推定部１３５１が出力した復号音共通成分信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}と、チャネル間関係情報推定部１３３１が出力したチャネル間関係情報と、が少なくとも入力される。復号音共通信号アップミックス部１３６１は、復号音共通信号^Y_M={^y_M(1), ^y_M(2), ..., ^y_M(T)}とチャネル間関係情報を少なくとも用いたアップミックス処理を行うことにより、復号音共通信号を各チャネル用にアップミックスした信号である第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}を得て出力する（ステップＳ１３６１）。復号音共通信号アップミックス部１３６１は、第５実施形態の復号音共通信号アップミックス部１２６２と同じ処理を行えばよい。すなわち、例えば、第５実施形態の復号音共通信号アップミックス部１２６２の説明箇所で上述した第１の方法または第２の方法を行えばよい。なお、復号音共通信号アップミックス部１２６２が第２の方法を行う場合には、図１５に破線で示すように、音信号精製装置１３０１に入力された第一チャネル復号音信号と音信号精製装置１３０１に入力された第二チャネル復号音信号も復号音共通信号アップミックス部１３６１に入力される。

［モノラル復号音アップミックス部１３７１］
モノラル復号音アップミックス部１３７１には、音信号精製装置１３０１に入力されたモノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}と、チャネル間関係情報推定部１３３１が出力したチャネル間関係情報と、が入力される。モノラル復号音アップミックス部１３７１は、モノラル復号音信号^X_M={^x_M(1), ^x_M(2), ..., ^x_M(T)}とチャネル間関係情報を用いたアップミックス処理を行うことにより、モノラル復号音信号を各チャネル用にアップミックスした信号である第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}を得て出力する（ステップＳ１３７１）。モノラル復号音アップミックス部１３７１は、第２実施形態のモノラル復号音アップミックス部１１７２と同じ処理を行えばよい。

［第ｎチャネル精製重み推定部１３１１－ｎ］
第ｎチャネル精製重み推定部１３１１－ｎは、第ｎチャネル精製重みα_Mnを得て出力する（ステップ１３１１－ｎ）。第ｎチャネル精製重み推定部１３１１－ｎは、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法と同様の方法で、第ｎチャネル精製重みα_Mnを得る。第ｎチャネル精製重み推定部１３１１－ｎが得る第ｎチャネル精製重みα_Mnは、0以上1以下の値である。ただし、第ｎチャネル精製重み推定部１３１１－ｎは、フレームごとに後述する方法で第ｎチャネル精製重みα_Mnを得るので、全てのフレームで第ｎチャネル精製重みα_Mnが0や1になることはない。すなわち、第ｎチャネル精製重みα_Mnが0より大きく1未満の値となるフレームが存在する。言い換えると、全てのフレームのうちの少なくとも何れかのフレームでは、第ｎチャネル精製重みα_Mnは0より大きく1未満の値である。

具体的には、下記の第１例から第７例のように、第ｎチャネル精製重み推定部１３１１－ｎは、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法において第ｎチャネル復号音信号^X_nを用いている箇所は、第ｎチャネル復号音信号^X_nに代えて第ｎチャネルアップミックス済共通信号^Y_Mnを用いて、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法においてモノラル復号音信号^X_Mを用いている箇所は、モノラル復号音信号^X_Mに代えて第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを用いて、第１実施形態で説明した量子化誤差を最小化する原理に基づく方法においてステレオ符号ＣＳのビット数のうちの第ｎチャネルに相当するビット数b_nを用いている箇所は、ビット数b_nに代えてステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを用いて、第ｎチャネル精製重みα_Mnを得る。すなわち、下記の第１例から第７例ではモノラル符号ＣＭのビット数b_Mとステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを用いる。モノラル符号ＣＭのビット数b_Mを特定する方法は第１実施形態と同じであり、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mを特定する方法は第４実施形態と同じである。第ｎチャネル精製重み推定部１３１１－ｎには、必要に応じて、図１５に一点鎖線で示すように、復号音共通信号アップミックス部１３６１が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、モノラル復号音アップミックス部１３７１が出力した第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、が入力される。

［［第１例］］
第１例の第ｎチャネル精製重み推定部１３１１－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を用いて、下記の式（７－５）により第ｎチャネル精製重みα_Mnを得る。

なお、第１例で得られる第ｎチャネル精製重みα_Mnは全てのチャネルで同じ値であるので、音信号精製装置１３０１が、各チャネルの第ｎチャネル精製重み推定部１３１１－ｎに代えて、全てのチャネルに共通する精製重み推定部１３１１を備えて、精製重み推定部１３１１が式（７－５）により全てのチャネルに共通する第ｎチャネル精製重みα_Mnを得るようにしてもよい。

［［第２例］］
第２例の第ｎチャネル精製重み推定部１３１１－ｎは、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を少なくとも用いて、0より大きく1未満の値であり、b_mとb_Mが等しいときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近い値であり、b_Mがb_mよりも多いほど0.5より1に近い値を、第ｎチャネル精製重みα_Mnとして得る。なお、第２例で得られる第ｎチャネル精製重みα_Mnは全てのチャネルで同じ値であってもよいので、音信号精製装置１３０１が、各チャネルの第ｎチャネル精製重み推定部１３１１－ｎに代えて、全てのチャネルに共通する精製重み推定部１３１１を備えて、精製重み推定部１３１１が上述した条件を満たす全てのチャネルに共通する第ｎチャネル精製重みα_Mnを得るようにしてもよい。

［［第３例］］
第３例の第ｎチャネル精製重み推定部１３１１－ｎは、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mとを用いて、

により得られる補正係数c_nと、第ｎチャネルアップミックス済共通信号^Y_Mnの第ｎチャネルアップミックス済モノラル復号音信号^X_Mnに対する正規化された内積値r_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_Mnとして得る。

第３例の第ｎチャネル精製重み推定部１３１１－ｎは、例えば、下記のステップＳ１３１１－３１－ｎからステップＳ１３１１－３３－ｎを行うことで第ｎチャネル精製重みα_Mnを得る。第ｎチャネル精製重み推定部１３１１－ｎは、まず、第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}から、下記の式（７－６）により第ｎチャネルアップミックス済共通信号^Y_Mnの第ｎチャネルアップミックス済モノラル復号音信号^X_Mnに対する正規化された内積値r_nを得る（ステップＳ１３１１－３１－ｎ）。

第ｎチャネル精製重み推定部１３１１－ｎは、また、フレーム当たりのサンプル数Tと、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、モノラル符号ＣＭのビット数b_Mと、を用いて、式（７－８）により補正係数c_nを得る（ステップＳ１３１１－３２－ｎ）。第ｎチャネル精製重み推定部１３１１－ｎは、次に、ステップＳ１３１１－３１－ｎで得た正規化された内積値r_nとステップＳ１３１１－３２－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_Mnとして得る（ステップＳ１３１１－３３－ｎ）。

［［第４例］］
第４例の第ｎチャネル精製重み推定部１３１１－ｎは、ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数をb_mとし、モノラル符号ＣＭのビット数をb_Mとして、0以上1以下の値であり、第ｎチャネルアップミックス済共通信号^Y_Mnと第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの間の相関が高いほど1に近い値であり、当該相関が低いほど0に近い値であるr_nと、0より大きく1未満の値であり、b_mとb_Mが同じであるときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近く、b_mがb_Mよりも少ないほど0.5より1に近い値である補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_Mnとして得る。

［［第５例］］
第５例の第ｎチャネル精製重み推定部１３１１－ｎは、下記のステップＳ１３１１－５１－ｎからステップＳ１３１１－５５－ｎを行うことで第ｎチャネル精製重みα_Mnを得る。

第ｎチャネル精製重み推定部１３１１－ｎは、まず、第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、前のフレームで用いた内積値E_n(-1)と、を用いて、下記の式（７－９）により、現在のフレームで用いる内積値E_n(0)を得る（ステップＳ１３１１－５１－ｎ）。

ここで、ε_nは、０より大きく１未満の予め定めた値であり、第ｎチャネル精製重み推定部１３１１－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１３１１－ｎは、得た内積値E_n(0)を、「前のフレームで用いた内積値E_n(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１３１１－ｎ内に記憶する。

第ｎチャネル精製重み推定部１３１１－ｎは、また、第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、前のフレームで用いた第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)と、を用いて、下記の式（７－１０）により、現在のフレームで用いる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を得る（ステップＳ１３１１－５２－ｎ）。

ここで、ε_Mnは、０より大きく１未満で予め定めた値であり、第ｎチャネル精製重み推定部１３１１－ｎ内に予め記憶されている。なお、第ｎチャネル精製重み推定部１３１１－ｎは、得た第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を、「前のフレームで用いた第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)」として次のフレームで用いるために、第ｎチャネル精製重み推定部１３１１－ｎ内に記憶する。

第ｎチャネル精製重み推定部１３１１－ｎは、次に、ステップＳ１３１１－５１－ｎで得た現在のフレームで用いる内積値E_n(0)と、ステップＳ１３１１－５２－ｎで得た現在のフレームで用いる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)を用いて、正規化された内積値r_nを下記の式（７－１１）で得る（ステップＳ１３１１－５３－ｎ）。

第ｎチャネル精製重み推定部１３１１－ｎは、また、式（７－８）により補正係数c_nを得る（ステップＳ１３１１－５４－ｎ）。第ｎチャネル精製重み推定部１３１１－ｎは、次に、ステップＳ１３１１－５３－ｎで得た正規化された内積値r_nとステップＳ１３１１－５４－ｎで得た補正係数c_nとを乗算した値c_n×r_nを第ｎチャネル精製重みα_Mnとして得る（ステップＳ１３１１－５５－ｎ）。

すなわち、第５例の第ｎチャネル精製重み推定部１３１１－ｎは、第ｎチャネルアップミックス済共通信号^Y_Mnの各サンプル値^y_Mn(t)と第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの各サンプル値^x_Mn(t)と前フレームの内積値E_n(-1)とを用いて式（７－９）により得られる内積値E_n(0)と、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの各サンプル値^x_Mn(t)と前フレームの第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(-1)とを用いて式（７－１０）により得られる第ｎチャネルアップミックス済モノラル復号音信号のエネルギーE_Mn(0)と、を用いて式（７－１１）により得られる正規化された内積値r_nと、フレーム当たりのサンプル数Tとステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mとモノラル符号ＣＭのビット数b_Mとを用いて式（７－８）により得られる補正係数c_nと、を乗算した値c_n×r_nを第ｎチャネル精製重みα_Mnとして得る。

［［第６例］］
第６例の第ｎチャネル精製重み推定部１３１１－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、0より大きく1未満の予め定めた値であるλと、を乗算した値λ×c_n×r_nを第ｎチャネル精製重みα_Mnとして得る。

［［第７例］］
第７例の第ｎチャネル精製重み推定部１３１１－ｎは、第３例で説明した正規化された内積値r_nと補正係数c_n、または、第５例で説明した正規化された内積値r_nと補正係数c_n、と、チャネル間関係情報推定部１３３１が得たチャネル間相関係数γと、を乗算した値γ×c_n×r_nを第ｎチャネル精製重みα_Mnとして得る。

［第ｎチャネル信号精製部１３２１－ｎ］
第ｎチャネル信号精製部１３２１－ｎには、復号音共通信号アップミックス部１３６１が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、モノラル復号音アップミックス部１３７１が出力した第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、第ｎチャネル精製重み推定部１３１１－ｎが出力した第ｎチャネル精製重みα_Mnと、が入力される。第ｎチャネル信号精製部１３２１－ｎは、対応するサンプルtごとに、第ｎチャネル精製重みα_Mnと第ｎチャネルアップミックス済モノラル復号音信号^X_Mnのサンプル値^x_Mn(t)とを乗算した値α_Mn×^x_Mn(t)と、第ｎチャネル精製重みα_Mnを1から減算した値(1-α_Mn)と第ｎチャネルアップミックス済共通信号^Y_Mnのサンプル値^y_Mn(t)とを乗算した値(1-α_Mn)×^y_Mn(t)と、を加算した値~y_Mn(t)による系列を第ｎチャネル精製済アップミックス済信号~Y_Mn={~y_Mn(1), ~y_Mn(2), ..., ~y_Mn(T)}として得て出力する（ステップＳ１３２１－ｎ）。すなわち、~y_Mn(t)=(1-α_Mn)×^y_Mn(t)＋α_Mn×^x_Mn(t)である。

［第ｎチャネル分離結合重み推定部１３８１－ｎ］
第ｎチャネル分離結合重み推定部１３８１－ｎには、音信号精製装置１３０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号アップミックス部１３６１が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、が入力される。第ｎチャネル分離結合重み推定部１３８１－ｎは、第ｎチャネル復号音信号^X_nと第ｎチャネルアップミックス済共通信号^Y_Mnとから、第ｎチャネル復号音信号^X_nの第ｎチャネルアップミックス済共通信号^Y_Mnに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得て出力する（ステップＳ１３８１－ｎ）。第ｎチャネル分離結合重みβ_nは、具体的には式（７１）の通りである。

［第ｎチャネル分離結合部１３９１－ｎ］
第ｎチャネル分離結合部１３９１－ｎには、音信号精製装置１３０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、復号音共通信号アップミックス部１３６１が出力した第ｎチャネルアップミックス済共通信号^Y_Mn={^y_Mn(1), ^y_Mn(2), ..., ^y_Mn(T)}と、第ｎチャネル信号精製部１３２１－ｎが出力した第ｎチャネル精製済アップミックス済信号~Y_Mn={~y_Mn(1), ~y_Mn(2), ..., ~y_Mn(T)}と、第ｎチャネル分離結合重み推定部１３８１－ｎが出力した第ｎチャネル分離結合重みβ_nと、が入力される。第ｎチャネル分離結合部１３９１－ｎは、対応するサンプルtごとに、第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、第ｎチャネル分離結合重みβ_nと第ｎチャネルアップミックス済共通信号^Y_Mnのサンプル値^y_Mn(t)とを乗算した値β_n×^y_Mm(t)を減算し、第ｎチャネル分離結合重みβ_nと第ｎチャネル精製済アップミックス済信号~Y_Mnのサンプル値~y_Mn(t)とを乗算した値β_n×~y_Mn(t)を加算した値~x_n(t)による系列を第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}として得て出力する（ステップＳ１３９１－ｎ）。すなわち、~x_n(t)=^x_n(t)-β_n×^y_Mn(t)＋β_n×~y_Mn(t)である。

＜第８実施形態＞
第８実施形態の音信号精製装置も、第７実施形態の音信号精製装置と同様に、ステレオの各チャネルの復号音信号を、当該復号音信号を得る元となった符号とは異なる符号から得られたモノラルの復号音信号を用いて改善するものである。第８実施形態の音信号精製装置が第７実施形態の音信号精製装置と異なる点は、チャネル間関係情報を復号音信号からではなく符号から得ることである。以下、第８実施形態の音信号精製装置について、ステレオのチャネルの個数が2である場合の例を用いて、第７実施形態の音信号精製装置と異なる点を説明する。

≪音信号精製装置１３０２≫
第８実施形態の音信号精製装置１３０２は、図１７に例示する通り、チャネル間関係情報復号部１３４２と復号音共通信号推定部１３５１と復号音共通信号アップミックス部１３６１とモノラル復号音アップミックス部１３７１と第一チャネル精製重み推定部１３１１－１と第一チャネル信号精製部１３２１－１と第一チャネル分離結合重み推定部１３８１－１と第一チャネル分離結合部１３９１－１と第二チャネル精製重み推定部１３１１－２と第二チャネル信号精製部１３２１－２と第二チャネル分離結合重み推定部１３８１－２と第二チャネル分離結合部１３９１－２を含む。音信号精製装置１３０２は、各フレームについて、図１８に例示する通り、ステップＳ１３４２とステップＳ１３５１とステップＳ１３６１とステップＳ１３７１と、各チャネルについてのステップＳ１３１１－ｎとステップＳ１３２１－ｎとステップＳ１３８１－ｎとステップＳ１３９１－ｎと、を行う。第８実施形態の音信号精製装置１３０２が第７実施形態の音信号精製装置１３０１と異なる点は、チャネル間関係情報推定部１３３１に代えてチャネル間関係情報復号部１３４２を備えて、ステップＳ１３３１に代えてステップＳ１３４２を行うことである。また、第８実施形態の音信号精製装置１３０２には、各フレームのチャネル間関係情報符号ＣＣも入力される。チャネル間関係情報符号ＣＣは、上述した符号化装置５００が備える図示しないチャネル間関係情報符号化部が得て出力した符号であってもよいし、上述した符号化装置５００のステレオ符号化部５３０が得て出力したステレオ符号ＣＳに含まれる符号であってもよい。以下、第８実施形態の音信号精製装置１３０２が第７実施形態の音信号精製装置１３０１と異なる点について説明する。

［チャネル間関係情報復号部１３４２］
チャネル間関係情報復号部１３４２には、音信号精製装置１３０２に入力されたチャネル間関係情報符号ＣＣが入力される。チャネル間関係情報復号部１３４２は、チャネル間関係情報符号ＣＣを復号してチャネル間関係情報を得て出力する（ステップＳ１３４２）。チャネル間関係情報復号部１３４２が得るチャネル間関係情報は、第７実施形態のチャネル間関係情報推定部１３３１が得るチャネル間関係情報と同じである。

［第８実施形態の変形例］
チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、ステップＳ１３４２で得られるのと同じチャネル間関係情報が、復号装置６００のステレオ復号部６２０内で復号により得られている。したがって、チャネル間関係情報符号ＣＣがステレオ符号ＣＳに含まれる符号である場合には、復号装置６００のステレオ復号部６２０が得たチャネル間関係情報が第８実施形態の音信号精製装置１３０２に入力されるようにして、第８実施形態の音信号精製装置１３０２はチャネル間関係情報復号部１３４２を備えずにステップＳ１３４２を行わないようにしてもよい。

また、チャネル間関係情報符号ＣＣの一部だけがステレオ符号ＣＳに含まれる符号である場合には、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれる符号を復号装置６００のステレオ復号部６２０が復号して得たチャネル間関係情報が第８実施形態の音信号精製装置１３０２に入力されるようにして、第８実施形態の音信号精製装置１３０２のチャネル間関係情報復号部１３４２は、ステップＳ１３４２として、チャネル間関係情報符号ＣＣのうちのステレオ符号ＣＳに含まれない符号を復号して、音信号精製装置１３０２に入力されなかったチャネル間関係情報を得て出力するようにすればよい。

また、音信号精製装置１３０２の各部が用いるチャネル間関係情報のうちの一部に対応する符号がチャネル間関係情報符号ＣＣに含まれない場合には、第８実施形態の音信号精製装置１３０２にはチャネル間関係情報推定部１３３１も備えて、チャネル間関係情報推定部１３３１がステップＳ１３３１も行うようにすればよい。この場合には、チャネル間関係情報推定部１３３１は、ステップＳ１３３１として、音信号精製装置１３０２の各部が用いるチャネル間関係情報のうちのチャネル間関係情報符号ＣＣを復号しても得られないチャネル間関係情報を、第７実施形態のステップＳ１３３１と同様に得て出力すればよい。

＜第９実施形態＞
入力音信号を符号化・復号して得られる復号音信号は、符号化処理による歪みによって高い周波数成分の位相が入力音信号に対して回転している。モノラル復号音信号を得た符号化／復号方式とステレオの各チャネルの復号音信号を得た符号化／復号方式とは独立した異なる符号化／復号方式であることから、モノラル復号部６１０が得たモノラル復号音信号とステレオ復号部６２０が得たステレオの各チャネルの復号音信号の高域成分は相関が小さく、上述した音信号精製装置の信号精製部や各チャネルの分離結合部における時間領域での重み付き加算の処理（以下、便宜的に「時間領域での信号精製処理」という）により高域成分のエネルギーが低下してしまうことがあり、これにより各チャネルの精製済復号音信号がこもって聴こえる場合がある。信号精製処理前の信号の高域成分を用いて高域のエネルギーを補償することでこのこもりを解消するのが、第９実施形態の音信号高域補償装置である。

なお、高域成分のエネルギーの低下によって音信号がこもって聴こえる場合があるのは、上述した音信号精製装置による時間領域での信号精製処理を各チャネルの復号音信号に対して施して得た精製済復号音信号に限られず、上述した音信号精製装置による信号精製処理以外の時間領域での信号処理を各チャネルの復号音信号に対して施して得られた音信号もこもって聴こえる場合がある。第９実施形態の音信号高域補償装置では、上述した音信号精製装置による時間領域での信号精製処理であるか否かに関わらず、時間領域での信号処理前の信号の高域成分を用いて高域のエネルギーを補償することで、こもりを解消することができる。

以下では、上述した音信号精製装置による信号精製処理を各チャネルの復号音信号に対して施して得た精製済復号音信号に限らず、時間領域での信号処理を各チャネルの復号音信号に対して施して得られた音信号も便宜的に精製済復号音信号と呼んで、第９実施形態の音信号高域補償装置について、ステレオのチャネルの個数が2である場合の例を用いて説明する。

≪音信号高域補償装置２０１≫
第９実施形態の音信号高域補償装置２０１は、図１９に例示する通り、第一チャネル高域補償利得推定部２１１－１と第一チャネル高域補償部２２１－１と第二チャネル高域補償利得推定部２１１－２と第二チャネル高域補償部２２１－２を含む。音信号高域補償装置２０１には、上述した何れかの音信号精製装置が出力した第一チャネル精製済復号音信号~X₁と第二チャネル精製済復号音信号~X₂と、復号装置６００のステレオ復号部６２０が出力した第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂と、が入力される。音信号高域補償装置２０１は、例えば20msの所定の時間長のフレーム単位で、ステレオの各チャネルについて、当該チャネルの精製済復号音信号と当該チャネルの復号音信号を用いて、当該チャネルの精製済復号音信号の高域のエネルギーを補償した音信号である当該チャネルの補償済復号音信号を得て出力する。第一チャネルのチャネル番号n（チャネルのインデックスn）を1とし、第二チャネルのチャネル番号nを2とすると、音信号高域補償装置２０１は、各フレームについて、図２０に例示するステップＳ２１１－ｎとステップＳ２２１－ｎを各チャネルについて行う。なお、ここでいう高域とは、符号化処理によっても位相がある程度は維持される低い周波数の帯域（いわゆる「低域」）、ではない帯域のことである。高域は、低域と比べて、入力音信号と復号音信号の位相が違っていても、聴感上の差異は知覚されにくいため、符号化処理により約2kHz以上の成分は位相が回転していることが多い。したがって、音信号高域補償装置２０１は、例えば、周波数が約2kHz以上の成分を高域として扱えばよい。ただし、約2kHz以上を高域とするのは必須ではなく、音信号高域補償装置２０１は、各信号に含まれる可能性がある周波数帯域を２つに分割する予め定めた周波数以上の成分を高域として扱えばよい。これは以降の実施形態や変形例でも同様である。なお、音信号高域補償装置２０１に入力される第一チャネル精製済復号音信号~X₁と第二チャネル精製済復号音信号~X₂が上述した何れかの音信号精製装置が出力した信号であるのは必須ではなく、復号装置６００のステレオ復号部６２０が出力した第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂に対して時間領域の信号処理を施して得られた音信号である第一チャネル精製済復号音信号~X₁と第二チャネル精製済復号音信号~X₂であればよい。これも以降の実施形態や変形例でも同様である。

［第ｎチャネル高域補償利得推定部２１１－ｎ］
第ｎチャネル高域補償利得推定部２１１－ｎには、音信号高域補償装置２０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号高域補償装置２０１に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、が入力される。第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル復号音信号^X_nと第ｎチャネル精製済復号音信号~X_nから第ｎチャネル高域補償利得ρ_nを得て出力する（ステップＳ２１１－ｎ）。第ｎチャネル高域補償利得ρ_nは、後述する第ｎチャネル高域補償部２２１－ｎが得る第ｎチャネル補償済復号音信号~X'_nの高域のエネルギーを、第ｎチャネル復号音信号^X_nの高域のエネルギーに、近付けるための値である。第ｎチャネル高域補償利得推定部２１１－ｎが第ｎチャネル高域補償利得ρ_nを得る方法については後述する。

［第ｎチャネル高域補償部２２１－ｎ］
第ｎチャネル高域補償部２２１－ｎには、信号高域補償装置２０１に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号高域補償装置２０１に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、第ｎチャネル高域補償利得推定部２１１－ｎが出力した第ｎチャネル高域補償利得ρ_nと、が入力される。第ｎチャネル高域補償部２２１－ｎは、第ｎチャネル精製済復号音信号~X_nと、第ｎチャネル復号音信号^X_nの高域成分に第ｎチャネル高域補償利得ρ_nを乗算した信号と、を加算した信号を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x'_n(2), ..., ~x'_n(T)}として得て出力する（ステップＳ２２１－ｎ）。

例えば、第ｎチャネル高域補償部２２１－ｎは、第ｎチャネル復号音信号^X_nをハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得て、対応するサンプルtごとに、第ｎチャネル精製済復号音信号~X_nのサンプル値~x_n(t)と、第ｎチャネル高域補償利得ρ_nと第ｎチャネル補償用信号^X'_nのサンプル値^x'_n(t)とを乗算した値ρ_n×x'_n(t)と、を加算した値~x'_n(t)による系列を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x'_n(2), ..., ~x'_n(T)}として得て出力する。すなわち、~x'_n(t)=~x_n(t)+ρ_n×^x'_n(t)である。ハイパスフィルタとしては、各信号に含まれる可能性がある周波数帯域を２つに分割する予め定めた周波数以上を通過帯域とするハイパスフィルタを用いればよく、例えば、周波数が2kHz以上の成分を高域として扱う場合には、2kHz以上を通過帯域とするハイパスフィルタを用いればよい。

［第ｎチャネル高域補償利得推定部２１１－ｎが第ｎチャネル高域補償利得ρ_nを得る方法］
第ｎチャネル高域補償利得推定部２１１－ｎは、例えば下記の第１の方法や第２の方法で第ｎチャネル高域補償利得ρ_nを得る。

［［第ｎチャネル高域補償利得ρ_nを得る第１の方法］］
第１の方法では、第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル精製済復号音信号~X_nの高域のエネルギーが第ｎチャネル復号音信号^X_nの高域のエネルギーよりも小さいほど大きな値の第ｎチャネル高域補償利得ρ_nを得る。例えば、第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nを第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nで除算した値を1から減算した値(1-~EX_n/^EX_n)の平方根を第ｎチャネル高域補償利得ρ_nとして得る。すなわち、第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nと、第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nと、を用いて下記の式（９１）により第ｎチャネル高域補償利得ρ_nを得る。

［［第ｎチャネル高域補償利得ρ_nを得る第２の方法］］
信号をハイパスフィルタに通すと、信号の各周波数成分の位相が回転する。そのため、第ｎチャネル補償用信号^X'_nと第ｎチャネル精製済復号音信号~X_nでは高域成分の位相が合わず、第１の方法で得た第ｎチャネル高域補償利得ρ_nを用いて第ｎチャネル高域補償部２２１－ｎが各サンプルtについて~x'_n(t)=~x_n(t)+ρ_n×^x'_n(t)との加算をして第ｎチャネル補償済復号音信号~X'_nを得ても、第ｎチャネル補償用信号^X'_nの高域成分と第ｎチャネル精製済復号音信号~X_nの高域成分が打ち消し合うことで、第ｎチャネル補償済復号音信号~X'_nの高域のエネルギーが第ｎチャネル復号音信号^X_nの高域のエネルギーに想定していたほど近付かない可能性がある。そこで、上述した加算で高域成分が打ち消し合うことがあったとしても、第ｎチャネル補償済復号音信号~X'_nの高域のエネルギーを第ｎチャネル復号音信号^X_nの高域のエネルギーに近付けられるようにしたのが第２の方法である。第２の方法では、第ｎチャネル高域補償利得推定部２１１－ｎは、例えば下記のステップＳ２１１－２１－ｎからステップＳ２１１－２３－ｎを行うことで、第ｎチャネル高域補償利得ρ_nを得る。

第ｎチャネル高域補償利得推定部２１１－ｎは、まず、第ｎチャネル復号音信号^X_nを第ｎチャネル高域補償部２２１－ｎが用いるのと同じ特性のハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得る（ステップＳ２１１－２１－ｎ）。第ｎチャネル高域補償利得推定部２１１－ｎは、次に、対応するサンプルtごとに、第ｎチャネル精製済復号音信号~X_nのサンプル値~x_n(t)と、第ｎチャネル補償用信号^X'_nのサンプル値^x'_n(t)と、を加算した値~x"_n(t)による系列を第ｎチャネル暫定加算信号~X"_n={~x"_n(1), ~x"_n(2), ..., ~x"_n(T)}として得る（ステップＳ２１１－２２－ｎ）。すなわち、~x"_n(t)=~x_n(t)+^x'_n(t)である。第ｎチャネル高域補償利得推定部２１１－ｎは、次に、第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nが第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nよりも小さいほど大きな値であり、かつ、第ｎチャネル精製済復号音信号~X_nの高域のエネルギーと第ｎチャネル暫定加算信号~X"_nの高域のエネルギーとの差が第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nよりも小さいほど大きな値である、第ｎチャネル高域補償利得ρ_nを得る（ステップＳ２１１－２３－ｎ）。例えば、第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nと、第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nと、第ｎチャネル暫定加算信号~X"_nの高域のエネルギー~EX"_nから第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nを減算した値(~EX"_n-~EX_n)と、を用いて、下記の式（９２）により第ｎチャネル高域補償利得ρ_nを得る。

ただし、^ρ_n ²は下記の式（９２ａ）により得られる値であり、μ_nは下記の式（９２ｂ）により得られる値である。

もし、第ｎチャネル補償用信号^X'_nの高域成分と第ｎチャネル精製済復号音信号~X_nの高域成分が加算によりエネルギーを打ち消し合わない場合には、第ｎチャネル暫定加算信号~X"_nの高域のエネルギー~EX"_nから第ｎチャネル精製済復号音信号~X_nの高域のエネルギー~EX_nを減算した値(~EX"_n-~EX_n)は第ｎチャネル復号音信号^X_nの高域のエネルギー^EX_nと等しくなるため、μ_nは０となり、式（９２）で得られる第ｎチャネル高域補償利得ρ_nは［［第ｎチャネル高域補償利得ρ_nを得る第１の方法］］の式（９１）で得られる第ｎチャネル高域補償利得ρ_nと等しくなる。また、第ｎチャネル補償用信号^X'_nの高域成分と第ｎチャネル精製済復号音信号~X_nの高域成分が加算によりエネルギーを打ち消し合うほどμ_nは０より大きな値となり、式（９２）で得られる第ｎチャネル高域補償利得ρ_nは［［第ｎチャネル高域補償利得ρ_nを得る第１の方法］］の式（９１）で得られる第ｎチャネル高域補償利得ρ_nよりも大きな値となる。したがって、第ｎチャネル補償用信号^X'_nの高域成分と第ｎチャネル精製済復号音信号~X_nの高域成分は加算によりエネルギーの何らかの打ち消し合いは生じると想定されることからすると、第２の方法では、第ｎチャネル高域補償利得推定部２１１－ｎは、式（９１）で得られる値より大きな値を第ｎチャネル高域補償利得ρ_nとして得ているともいえる。

なお、第ｎチャネル高域補償利得推定部２１１－ｎは、式（９２）に代えて、下記の式（９３）や下記の式（９４）で第ｎチャネル高域補償利得ρ_nを得てもよい。式（９４）のAは予め定めた正の値であり、1の近傍の値であることが望ましい。

上述した第２の方法の例では、第ｎチャネル高域補償部２２１－ｎが用いるのと同じ第ｎチャネル補償用信号^X'_nを第ｎチャネル高域補償利得推定部２１１－ｎがステップＳ２１１－２１－ｎで得ている。したがって、第ｎチャネル高域補償利得推定部２１１－ｎがステップＳ２１１－２１－ｎで得た第ｎチャネル補償用信号^X'_nを出力するようにして、第ｎチャネル高域補償部２２１－ｎには、信号高域補償装置２０１に入力された第ｎチャネル復号音信号^X_nに代えて、第ｎチャネル高域補償利得推定部２１１－ｎが出力した第ｎチャネル補償用信号^X'_nが入力されるようにしてもよい。この場合には、第ｎチャネル高域補償部２２１－ｎは第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理は行わないでよい。また逆に、第ｎチャネル高域補償部２２１－ｎがハイパスフィルタ処理により得た第ｎチャネル補償用信号^X'_nを出力するようにして、第ｎチャネル高域補償利得推定部２１１－ｎには、第ｎチャネル高域補償部２２１－ｎが出力した第ｎチャネル補償用信号^X'_nも入力されるようにしてもよい。この場合には、第ｎチャネル高域補償利得推定部２１１－ｎは、第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理は行わないでよい。もちろん、信号高域補償装置２０１に図示しないハイパスフィルタ部を備えて、ハイパスフィルタ部が第ｎチャネル復号音信号^X_nをハイパスフィルタに通して第ｎチャネル補償用信号^X'_nを得て出力し、第ｎチャネル高域補償利得推定部２１１－ｎと第ｎチャネル高域補償部２２１－ｎに第ｎチャネル補償用信号^X'_nが入力されるようにして、第ｎチャネル高域補償利得推定部２１１－ｎと第ｎチャネル高域補償部２２１－ｎが第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理を行わないようにしてもよい。すなわち、信号高域補償装置２０１は、第ｎチャネル復号音信号^X_nをハイパスフィルタに通した信号を第ｎチャネル補償用信号^X'_nとして第ｎチャネル高域補償利得推定部２１１－ｎと第ｎチャネル高域補償部２２１－ｎが用いることができる構成であれば、どのような構成を採用してもよい。

＜第１０実施形態＞
符号化装置５００のモノラル符号化部５２０がステレオ符号化部５３０の各チャネルよりも高いビットレートで符号化を行っている場合には、復号装置６００のモノラル復号部６１０が得たモノラル復号音信号^X_Mを基にした第ｎチャネルモノラル復号音アップミックス信号^X_Mnのほうが、復号装置６００のステレオ復号部６２０が得た第ｎチャネル復号音信号^X_nよりも音質が高く、高域の補償に用いる信号として適している場合がある。そこで、第９実施形態の音信号高域補償装置が高域の補償に用いた第ｎチャネル復号音信号^X_nに代えて第ｎチャネルモノラル復号音アップミックス信号^X_Mnを高域の補償に用いるのが第１０実施形態の音信号高域補償装置である。以下、第１０実施形態の音信号高域補償装置について、ステレオのチャネルの個数が2である場合の例を用いて、第９実施形態の音信号高域補償装置と異なる点を中心に説明する。

≪音信号高域補償装置２０２≫
第１０実施形態の音信号高域補償装置２０２は、図２１に例示する通り、第一チャネル高域補償利得推定部２１２－１と第一チャネル高域補償部２２２－１と第二チャネル高域補償利得推定部２１２－２と第二チャネル高域補償部２２２－２を含む。音信号高域補償装置２０２には、上述した何れかの音信号精製装置が出力した第一チャネル精製済復号音信号~X₁と第二チャネル精製済復号音信号~X₂と、復号装置６００のステレオ復号部６２０が出力した第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂と、上述した何れかの音信号精製装置が出力した第一チャネルアップミックス済モノラル復号音信号^X_M1と第二チャネルアップミックス済モノラル復号音信号^X_M2と、が入力される。

すなわち、音信号精製装置がモノラル復号音アップミックス部を備えて各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ている場合に、モノラル復号音アップミックス部が得た各チャネルのアップミックス済モノラル復号音信号^X_Mnを音信号精製装置が出力して音信号高域補償装置２０２に入力されるようにする。なお、音信号精製装置がモノラル復号音アップミックス部を備えない場合については第１０実施形態の変形例で後述する。

音信号高域補償装置２０２は、例えば20msの所定の時間長のフレーム単位で、ステレオの各チャネルについて、当該チャネルの精製済復号音信号と当該チャネルの復号音信号と当該チャネルのアップミックス済モノラル復号音信号を用いて、当該チャネルの精製済復号音信号の高域のエネルギーを補償した音信号である当該チャネルの補償済復号音信号を得て出力する。第一チャネルのチャネル番号n（チャネルのインデックスn）を1とし、第二チャネルのチャネル番号nを2とすると、音信号高域補償装置２０２は、各フレームについて、図２０に例示するステップＳ２１２－ｎとステップＳ２２２－ｎを各チャネルについて行う。

［第ｎチャネル高域補償利得推定部２１２－ｎ］
第ｎチャネル高域補償利得推定部２１２－ｎには、音信号高域補償装置２０２に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号高域補償装置２０２に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、が少なくとも入力される。第ｎチャネル高域補償利得推定部２１２－ｎは、第ｎチャネル復号音信号^X_nと第ｎチャネル精製済復号音信号~X_nを少なくとも用いて第ｎチャネル高域補償利得ρ_nを得て出力する（ステップＳ２１２－ｎ）。第ｎチャネル高域補償利得推定部２１２－ｎは、例えば第９実施形態で説明した第１の方法や下記の第２の方法で第ｎチャネル高域補償利得ρ_nを得る。

［［第ｎチャネル高域補償利得ρ_nを得る第２の方法］］
第２の方法は、第９実施形態の第２の方法で第ｎチャネル復号音信号^X_nから第ｎチャネル補償用信号^X'_nを得ていた処理に代えて、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnから第ｎチャネル補償用信号^X'_nを得る処理を行う方法である。このため、第２の方法を用いる場合には、図２１に破線で示したように、第ｎチャネル高域補償利得推定部２１２－ｎには、音信号高域補償装置２０２に入力された第ｎチャネルアップミックス済モノラル復号音信号^X_Mnも入力される。第２の方法では、第ｎチャネル高域補償利得推定部２１２－ｎは、例えば、第９実施形態の第２の方法のステップＳ２１１－２１－ｎに代えて下記のステップＳ２１２－２１－ｎを行ってから、第９実施形態の第２の方法と同じステップＳ２１１－２２－ｎとステップＳ２１１－２３－ｎを行うことで、第ｎチャネル高域補償利得ρ_nを得る。すなわち、第ｎチャネル高域補償利得推定部２１２－ｎは、まず、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを第ｎチャネル高域補償部２２２－ｎが用いるのと同じ特性のハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得て（ステップＳ２１２－２１－ｎ）、次に第９実施形態の第２の方法の説明箇所で上述したステップＳ２１１－２２－ｎとステップＳ２１１－２３－ｎを行う。

［第ｎチャネル高域補償部２２２－ｎ］
第ｎチャネル高域補償部２２２－ｎは、第９実施形態の第ｎチャネル高域補償部２２１－ｎが用いた第ｎチャネル復号音信号^X_nに代えて、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnを用いて第ｎチャネル補償済復号音信号~X'_nを得る。第ｎチャネル高域補償部２２２－ｎには、信号高域補償装置２０２に入力された第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、音信号高域補償装置２０２に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、第ｎチャネル高域補償利得推定部２１２－ｎが出力した第ｎチャネル高域補償利得ρ_nと、が入力される。第ｎチャネル高域補償部２２２－ｎは、第ｎチャネル精製済復号音信号~X_nと、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの高域成分に第ｎチャネル高域補償利得ρ_nを乗算した信号と、を加算した信号を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x_n' (2), ..., ~x'_n(T)}として得て出力する（ステップＳ２２２－ｎ）。

例えば、第ｎチャネル高域補償部２２２－ｎは、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnをハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得て、対応するサンプルtごとに、第ｎチャネル精製済復号音信号~X_nのサンプル値~x_n(t)と、第ｎチャネル高域補償利得ρ_nと第ｎチャネル補償用信号^X'_nのサンプル値^x'_n(t)とを乗算した値ρ_n×x'_n(t)と、を加算した値~x'_n(t)による系列を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x'_n(2), ..., ~x'_n(T)}として得て出力する。すなわち、~x'_n(t)=~x_n(t)+ρ_n×^x'_n(t)である。

なお、第９実施形態と同様に、第ｎチャネル高域補償利得推定部２１２－ｎが［［第ｎチャネル高域補償利得ρ_nを得る第２の方法］］に例示した方法を用いる場合には、第ｎチャネル高域補償利得推定部２１２－ｎと第ｎチャネル高域補償部２２２－ｎの何れか一方が第ｎチャネルアップミックス済モノラル復号音信号^X_Mnをハイパスフィルタに通して第ｎチャネル補償用信号^X'_nを得て出力するようにして、もう一方では、第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理を行わずに、他方が得た第ｎチャネル補償用信号^X'_nを用いるようにしてもよい。また、信号高域補償装置２０２に図示しないハイパスフィルタ部を備えて、ハイパスフィルタ部が第ｎチャネルアップミックス済モノラル復号音信号^X_Mnをハイパスフィルタに通して第ｎチャネル補償用信号^X'_nを得て出力するようにして、第ｎチャネル高域補償利得推定部２１２－ｎと第ｎチャネル高域補償部２２２－ｎは、第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理を行わずに、ハイパスフィルタ部が得た第ｎチャネル補償用信号^X'_nを用いるようにしてもよい。すなわち、信号高域補償装置２０２は、第ｎチャネルアップミックス済モノラル復号音信号^X_Mnをハイパスフィルタに通した信号を第ｎチャネル補償用信号^X'_nとして第ｎチャネル高域補償利得推定部２１２－ｎと第ｎチャネル高域補償部２２２－ｎが用いることができる構成であれば、どのような構成を採用してもよい。

［第１０実施形態の変形例］
第１０実施形態では音信号精製装置がモノラル復号音アップミックス部を備えて各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ている場合について説明したが、音信号精製装置がモノラル復号音アップミックス部を備えずに各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ていない場合には、音信号精製装置２０２は、第１０実施形態で用いた各チャネルのアップミックス済モノラル復号音信号^X_Mnに代えて、復号装置６００のモノラル復号部６１０が出力したモノラル復号音信号^X_Mを用いればよい。また、音信号精製装置がモノラル復号音アップミックス部を備えて各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ている場合でも、音信号精製装置２０２は、第１０実施形態で用いた各チャネルのアップミックス済モノラル復号音信号^X_Mnに代えて、復号装置６００のモノラル復号部６１０が出力したモノラル復号音信号^X_Mを用いてもよい。

＜第１１実施形態＞
第ｎチャネル復号音信号^X_nと第ｎチャネルアップミックス済モノラル復号音信号^X_Mnの何れを高域の補償に用いるかをビットレートに応じて選択してもよい。この形態を第１１実施形態として、ステレオのチャネルの個数が2である場合の例を用いて、第９実施形態の音信号高域補償装置及び第１０実施形態の音信号高域補償装置と異なる点を中心に説明する。

≪音信号高域補償装置２０３≫
第１１実施形態の音信号高域補償装置２０３は、図２２に例示する通り、第一チャネル信号選択部２３３－１と第一チャネル高域補償利得推定部２１３－１と第一チャネル高域補償部２２３－１と第二チャネル信号選択部２３３－２と第二チャネル高域補償利得推定部２１３－２と第二チャネル高域補償部２２３－２を含む。音信号高域補償装置２０３には、上述した何れかの音信号精製装置が出力した第一チャネル精製済復号音信号~X₁と第二チャネル精製済復号音信号~X₂と、復号装置６００のステレオ復号部６２０が出力した第一チャネル復号音信号^X₁と第二チャネル復号音信号^X₂と、上述した何れかの音信号精製装置が出力した第一チャネルアップミックス済モノラル復号音信号^X_M1と第二チャネルアップミックス済モノラル復号音信号^X_M2と、ビットレート情報と、が入力される。

ビットレート情報は、各フレームについてのモノラル符号化部５２０とモノラル復号部６１０のビットレートに対応する情報と、ステレオ符号化部５３０とステレオ復号部６２０のチャネル当たりのビットレートに対応する情報、である。各フレームについてのモノラル符号化部５２０とモノラル復号部６１０のビットレートに対応する情報は、例えば、各フレームのモノラル符号ＣＭのビット数b_Mである。各フレームについてのステレオ符号化部５３０とステレオ復号部６２０のビットレートに対応する情報は、例えば、各フレームのステレオ符号ＣＳのビット数b_sのうちの各チャネルのビット数b_nである。なお、ビット数b_Mやビット数b_nが全てのフレームで同じである場合には、音信号高域補償装置２０３にビットレート情報を入力する必要は無く、第一チャネル信号選択部２３３－１内の図示しない記憶部と第二チャネル信号選択部２３３－２内の図示しない記憶部にビットレート情報を予め記憶しておけばよい。

音信号高域補償装置２０３は、例えば20msの所定の時間長のフレーム単位で、ステレオの各チャネルについて、当該チャネルの精製済復号音信号と当該チャネルの復号音信号と当該チャネルのアップミックス済モノラル復号音信号とビットレート情報を用いて、当該チャネルの精製済復号音信号の高域のエネルギーを補償した音信号である当該チャネルの補償済復号音信号を得て出力する。第一チャネルのチャネル番号n（チャネルのインデックスn）を1とし、第二チャネルのチャネル番号nを2とすると、音信号高域補償装置２０３は、各フレームについて、図２３に例示するステップＳ２３３－ｎとステップＳ２１３－ｎとステップＳ２２３－ｎを各チャネルについて行う。

［第ｎチャネル信号選択部２３３－ｎ］
第ｎチャネル信号選択部２３３－ｎには、音信号高域補償装置２０３に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号高域補償装置２０３に入力された第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}と、音信号高域補償装置２０３に入力されたビットレート情報が入力される。ただし、第ｎチャネル信号選択部２３３－ｎ内の図示しない記憶部にビットレート情報が予め記憶されている場合には、ビットレート情報は入力されなくてよい。第ｎチャネル信号選択部２３３－ｎは、ステレオ符号化部５３０とステレオ復号部６２０のチャネル当たりのビットレートのほうがモノラル符号化部５２０とモノラル復号部６１０のビットレートよりも高い場合、すなわち、b_nがb_Mより大きい場合には、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}を選択して第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}として出力し、ステレオ符号化部５３０とステレオ復号部６２０のチャネル当たりのビットレートのほうがモノラル符号化部５２０とモノラル復号部６１０のビットレートよりも低い場合、すなわち、b_nがb_Mより小さい場合には、第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}を選択して第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}として出力する（ステップＳ２３３－ｎ）。第ｎチャネル信号選択部２３３－ｎは、モノラル符号化部５２０とモノラル復号部６１０のビットレートとステレオ符号化部５３０とステレオ復号部６２０のチャネル当たりのビットレートが同じである場合、すなわち、b_Mとb_nが同じ値である場合には、第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と第ｎチャネルアップミックス済モノラル復号音信号^X_Mn={^x_Mn(1), ^x_Mn(2), ..., ^x_Mn(T)}の何れを選択して第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}として出力してもよい。

［第ｎチャネル高域補償利得推定部２１３－ｎ］
第ｎチャネル高域補償利得推定部２１３－ｎには、音信号高域補償装置２０３に入力された第ｎチャネル復号音信号^X_n={^x_n(1), ^x_n(2), ..., ^x_n(T)}と、音信号高域補償装置２０３に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、が少なくとも入力される。第ｎチャネル高域補償利得推定部２１３－ｎは、第ｎチャネル復号音信号^X_nと第ｎチャネル精製済復号音信号~X_nを少なくとも用いて第ｎチャネル高域補償利得ρ_nを得て出力する（ステップＳ２１３－ｎ）。第ｎチャネル高域補償利得推定部２１３－ｎは、例えば第９実施形態で説明した第１の方法や下記の第２の方法で第ｎチャネル高域補償利得ρ_nを得る。

［［第ｎチャネル高域補償利得ρ_nを得る第２の方法］］
第２の方法を用いる場合には、図２２に破線で示したように、第ｎチャネル高域補償利得推定部２１３－ｎには、第ｎチャネル信号選択部２３３－ｎが得た第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}も入力される。第２の方法では、第ｎチャネル高域補償利得推定部２１３－ｎは、例えば、第９実施形態の第２の方法のステップＳ２１１－２１－ｎに代えて下記のステップＳ２１３－２１－ｎを行ってから、第９実施形態の第２の方法と同じステップＳ２１１－２２－ｎとステップＳ２１１－２３－ｎを行うことで、第ｎチャネル高域補償利得ρ_nを得る。すなわち、第ｎチャネル高域補償利得推定部２１３－ｎは、まず、第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}を第ｎチャネル高域補償部２２３－ｎが用いるのと同じ特性のハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得て（ステップＳ２１３－２１－ｎ）、次に第９実施形態の第２の方法の説明箇所で上述したステップＳ２１１－２２－ｎとステップＳ２１１－２３－ｎを行う。

［第ｎチャネル高域補償部２２３－ｎ］
第ｎチャネル高域補償部２２３－ｎは、第ｎチャネル選択信号^X_Snを用いて第ｎチャネル補償済復号音信号~X'_nを得る。第ｎチャネル高域補償部２２３－ｎには、第ｎチャネル信号選択部２３３－ｎが得た第ｎチャネル選択信号^X_Sn={^x_Sn(1), ^x_Sn(2), ..., ^x_Sn(T)}と、音信号高域補償装置２０３に入力された第ｎチャネル精製済復号音信号~X_n={~x_n(1), ~x_n(2), ..., ~x_n(T)}と、第ｎチャネル高域補償利得推定部２１３－ｎが出力した第ｎチャネル高域補償利得ρ_nと、が入力される。第ｎチャネル高域補償部２２３－ｎは、第ｎチャネル精製済復号音信号~X_nと、第ｎチャネル選択信号^X_Snの高域成分に第ｎチャネル高域補償利得ρ_nを乗算した信号と、を加算した信号を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x_n' (2), ..., ~x'_n(T)}として得て出力する（ステップＳ２２３－ｎ）。

例えば、第ｎチャネル高域補償部２２３－ｎは、第ｎチャネル選択信号^X_Snをハイパスフィルタに通して第ｎチャネル補償用信号^X'_n={^x'_n(1), ^x'_n(2), ..., ^x'_n(T)}を得て、対応するサンプルtごとに、第ｎチャネル精製済復号音信号~X_nのサンプル値~x_n(t)と、第ｎチャネル高域補償利得ρ_nと第ｎチャネル補償用信号^X'_nのサンプル値^x'_n(t)とを乗算した値ρ_n×x'_n(t)と、を加算した値~x'_n(t)による系列を第ｎチャネル補償済復号音信号~X'_n={~x'_n(1), ~x'_n(2), ..., ~x'_n(T)}として得て出力する。すなわち、~x'_n(t)=~x_n(t)+ρ_n×^x'_n(t)である。

なお、第９実施形態及び第１０実施形態と同様に、第ｎチャネル高域補償利得推定部２１３－ｎが［［第ｎチャネル高域補償利得ρ_nを得る第２の方法］］に例示した方法を用いる場合には、第ｎチャネル高域補償利得推定部２１３－ｎと第ｎチャネル高域補償部２２３－ｎの何れか一方が第ｎチャネル選択信号^X_Snをハイパスフィルタに通して第ｎチャネル補償用信号^X'_nを得て出力するようにして、もう一方では、第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理を行わずに、他方が得た第ｎチャネル補償用信号^X'_nを用いるようにしてもよい。また、信号高域補償装置２０３に図示しないハイパスフィルタ部を備えて、ハイパスフィルタ部が第ｎチャネル選択信号^X_Snをハイパスフィルタに通して第ｎチャネル補償用信号^X'_nを得て出力するようにして、第ｎチャネル高域補償利得推定部２１３－ｎと第ｎチャネル高域補償部２２３－ｎは、第ｎチャネル補償用信号^X'_nを得るハイパスフィルタ処理を行わずに、ハイパスフィルタ部が得た第ｎチャネル補償用信号^X'_nを用いるようにしてもよい。すなわち、信号高域補償装置２０３は、第ｎチャネル選択信号^X_Snをハイパスフィルタに通した信号を第ｎチャネル補償用信号^X'_nとして第ｎチャネル高域補償利得推定部２１３－ｎと第ｎチャネル高域補償部２２３－ｎが用いることができる構成であれば、どのような構成を採用してもよい。

［第１１実施形態の変形例］
第１１実施形態では音信号精製装置がモノラル復号音アップミックス部を備えて各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ている場合について説明したが、音信号精製装置がモノラル復号音アップミックス部を備えずに各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ていない場合には、音信号精製装置２０３は、第１１実施形態で用いた各チャネルのアップミックス済モノラル復号音信号^X_Mnに代えて、復号装置６００のモノラル復号部６１０が出力したモノラル復号音信号^X_Mを用いればよい。また、音信号精製装置がモノラル復号音アップミックス部を備えて各チャネルのアップミックス済モノラル復号音信号^X_Mnを得ている場合でも、音信号精製装置２０３は、第１１実施形態で用いた各チャネルのアップミックス済モノラル復号音信号^X_Mnに代えて、復号装置６００のモノラル復号部６１０が出力したモノラル復号音信号^X_Mを用いてもよい。

＜第１２実施形態＞
第１２実施形態として、上述した各実施形態及び変形例に基づく様々な形態を説明する。

［チャネル数］
上述した各実施形態及び変形例では、説明を簡単化するために、2個のチャネルを扱う例で説明した。しかし、チャネル数はこの限りではなく2以上であればよい。このチャネル数をN（Nは2以上の整数）とすると、上述した各実施形態及び変形例は、チャネル数の2をNと読み替えて実施することができる。具体的には、上述した各実施形態及び変形例において、“－ｎ”が付された各部／各ステップは、1からNまでの各チャネルに対応するN個のものを含めるようにし、添え字などの“n”との記載が付されているものは、1からNまでの各チャネル番号に対応するN通りのものを含めるようにすることで、チャネル数Nの音信号精製装置やチャネル数Nの音信号高域補償装置とすることができる。ただし、上述した音信号精製装置の各実施形態及び変形例のうちのチャネル間時間差τやチャネル間相関係数γを用いて例示した処理を含む部分については、2個のチャネルに限定されることがある。

［音信号後処理装置］
第１実施形態から第８実施形態及び各変形例の何れかの音信号精製装置は、復号により得られた音信号を処理する装置であるので、音信号後処理装置であるといえる。すなわち、図２４に例示するように、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかが音信号後処理装置３０１であるともいえる（図２５もあわせて参照）。また、図２４に例示するように、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかを音信号精製部として含む装置が音信号後処理装置３０１であるともいえる。

同様に、第１実施形態から第８実施形態及び各変形例の何れかの音信号精製装置と第９実施形態から第１１実施形態及び各変形例の何れかの音信号高域補償装置を組み合わせた装置も、復号により得られた音信号を処理する装置であるので、音信号後処理装置であるといえる。すなわち、図２６に例示するように、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかと、第９実施形態から第１１実施形態及び各変形例の音信号高域補償装置２０１、２０２、２０３の何れかと、を組み合わせた装置が音信号後処理装置３０２であるともいえる（図２７もあわせて参照）。また、図２６に例示するように、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかを音信号精製部として含み、第９実施形態から第１１実施形態及び各変形例の音信号高域補償装置２０１、２０２、２０３の何れかを音信号高域補償部として含む装置が音信号後処理装置３０２であるともいえる。

［音信号復号装置］
第１実施形態から第８実施形態及び各変形例の何れかの音信号精製装置は、モノラル復号部６１０とステレオ復号部６２０とともに音信号復号装置に含めることができる。すなわち、図２８に例示するように、モノラル復号部６１０と、ステレオ復号部６２０と、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかと、を含むように音信号復号装置６０１を構成してもよい（図２９もあわせて参照）。また、図２８に例示するように、モノラル復号部６１０とステレオ復号部６２０に加えて、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかを音信号精製部として含むように音信号復号装置６０１を構成してもよい。

同様に、第１実施形態から第８実施形態及び各変形例の何れかの音信号精製装置と第９実施形態から第１１実施形態及び各変形例の何れかの音信号高域補償装置を組み合わせたものも、モノラル復号部６１０とステレオ復号部６２０とともに音信号復号装置に含めることができる。すなわち、図３０に例示するように、モノラル復号部６１０と、ステレオ復号部６２０と、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかと、第９実施形態から第１１実施形態及び各変形例の音信号高域補償装置２０１、２０２、２０３の何れかと、を含むように音信号復号装置６０２を構成してもよい（図３１もあわせて参照）。また、図３０に例示するように、モノラル復号部６１０とステレオ復号部６２０に加えて、第１実施形態から第８実施形態及び各変形例の音信号精製装置１１０１、１１０２、１１０３、１２０１、１２０２、１２０３、１３０１、１３０２の何れかを音信号精製部として含み、第９実施形態から第１１実施形態及び各変形例の音信号高域補償装置２０１、２０２、２０３の何れかを音信号高域補償部として含むように音信号復号装置６０２を構成してもよい。

［プログラム及び記録媒体］
上述した各装置の各部の処理をコンピュータにより実現してもよく、この場合は各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図３３に示すコンピュータ５０００の記憶部５０２０に読み込ませ、演算処理部５０１０、入力部５０３０、出力部５０４０などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体は、例えば、非一時的な記録媒体であり、具体的には、磁気記録装置、光ディスク、等である。

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の非一時的な記憶装置である補助記録部５０５０に格納する。そして、処理の実行時、このコンピュータは、自己の非一時的な記憶装置である補助記録部５０５０に格納されたプログラムを記憶部５０２０に読み込み、読み込んだプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを記憶部５０２０に読み込み、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。さらに、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、実行の順を入れ替えてもよい場合には、記載の順とは逆順に時系列に実行されるとしてもよい。

Claims

フレームごとに、ステレオ符号ＣＳを復号して得たステレオの各チャネルの復号音信号である第ｎチャネル復号音信号^X_n（nは1以上N以下の各整数、Nはチャネル数）と、前記ステレオ符号ＣＳとは異なる符号であるモノラル符号ＣＭを復号して得たモノラルの復号音信号であるモノラル復号音信号^X_Mと、を少なくとも用いて、前記ステレオの前記各チャネルの音信号である第ｎチャネル精製済復号音信号~X_nを得る音信号精製方法であって、
前記第ｎチャネル復号音信号^X_nは、前記モノラル符号ＣＭを復号して得た情報も前記モノラル符号ＣＭも用いずに、前記ステレオ符号ＣＳを復号して得たものであり、
フレームごとに、1以上N以下の全ての第ｎチャネル復号音信号^X_nを少なくとも用いて、前記ステレオの全チャネルに共通する信号である復号音共通信号^Y_Mを得る復号音共通信号推定ステップと、
フレームごとに、対応するサンプルtごとに、共通信号精製重みα_Mと前記モノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_M×^x_M(t)と、前記共通信号精製重みα_Mを1から減算した値(1-α_M)と前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値(1-α_M)×^y_M(t)と、を加算した値~y_M(t)=(1-α_M)×^y_M(t)＋α_M×^x_M(t)による系列を精製済共通信号~Y_Mとして得る共通信号精製ステップと、
前記各チャネルnについて、フレームごとに、前記第ｎチャネル復号音信号^X_nの前記復号音共通信号^Y_Mに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得る第ｎチャネル分離結合重み推定ステップと、
前記各チャネルnについて、フレームごとに、対応するサンプルtごとに、前記第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、前記第ｎチャネル分離結合重みβ_nと前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値β_n×^y_M(t)を減算し、前記第ｎチャネル分離結合重みβ_nと前記精製済共通信号~Y_Mのサンプル値~y_M(t)とを乗算した値β_n×~y_M(t)を加算した値~x_n(t)=^x_n(t)-β_n×^y_M(t)＋β_n×~y_M(t)による系列を前記第ｎチャネル精製済復号音信号~X_nとして得る第ｎチャネル分離結合ステップと、
を含むことを特徴とする音信号精製方法。
請求項１に記載の音信号精製方法であって、
前記復号音共通信号推定ステップは、
第1から第Nまでの全チャネルの前記復号音信号^X₁, ..., ^X_Nの重み付き平均と前記モノラル復号音信号^X_Mの差が最小となる重み係数を得て、
得た前記重み係数を用いた第1から第Nまでの全チャネルの前記復号音信号^X₁, ..., ^X_Nの重み付き平均を前記復号音共通信号^Y_Mとして得る
ことを特徴とする音信号精製方法。
請求項１に記載の音信号精製方法であって、
前記チャネル数Nは2であり、
前記復号音共通信号推定ステップは、
第1チャネル復号音信号^X₁のサンプル値^x₁(t)と、第2チャネル復号音信号^X₂のサンプル値^x₂(t)と、第1チャネルと第2チャネルのチャネル間相関係数γと、を用いて、
第1チャネルと第2チャネルの何れが先行しているかを表す情報に基づいて、
第1チャネルが先行している場合には、^y_M(t)=((1+γ)/2)×^x₁(t)＋((1-γ)/2)×^x₂(t)による系列を前記復号音共通信号^Y_Mとして得て、
第2チャネルが先行している場合には、^y_M(t)=((1-γ)/2)×^x₁(t)＋((1+γ)/2)×^x₂(t)による系列を前記復号音共通信号^Y_Mとして得て、
何れのチャネルも先行していない場合には、^y_M(t)=(^x₁(t)+^x₂(t))/2による系列を前記復号音共通信号^Y_Mとして得る
ことを特徴とする音信号精製方法。
請求項１から３の何れかに記載の音信号精製方法であって、
フレームごとに、
前記フレーム当たりのサンプル数Tと、前記ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、前記モノラル符号ＣＭのビット数b_Mと、を用いて、

により前記共通信号精製重みα_Mを得る共通信号精製重み推定ステップ
を更に含むことを特徴とする音信号精製方法。
請求項１から３の何れかに記載の音信号精製方法であって、
フレームごとに、
前記ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、前記モノラル符号ＣＭのビット数b_Mと、を少なくとも用いて、0より大きく1未満の値であり、b_mとb_Mが等しいときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近い値であり、b_Mがb_mよりも多いほど0.5より1に近い値を、前記共通信号精製重みα_Mとして得る共通信号精製重み推定ステップ
を更に含むことを特徴とする音信号精製方法。
請求項１から３の何れかに記載の音信号精製方法であって、
フレームごとに、
前記復号音共通信号^Y_Mの前記モノラル復号音信号^X_Mに対する正規化された内積値r_Mと、
前記フレーム当たりのサンプル数Tと、前記ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、前記モノラル符号ＣＭのビット数b_Mと、を用いて

より得られる補正係数c_Mと、
を乗算した値c_M×r_Mを前記共通信号精製重みα_Mとして得る共通信号精製重み推定ステップ
を更に含むことを特徴とする音信号精製方法。
請求項１から３の何れかに記載の音信号精製方法であって、
フレームごとに、
前記ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数をb_mとし、前記モノラル符号ＣＭのビット数をb_Mとして、
前記復号音共通信号^Y_Mと前記モノラル復号音信号^X_Mの間の相関が高いほど1に近い値であり、前記相関が低いほど0に近い値であるr_Mと、
0より大きく1未満の値であり、b_mとb_Mが同じであるときには0.5であり、b_mがb_Mよりも多いほど0.5より0に近く、b_mがb_Mよりも少ないほど0.5より1に近い値である補正係数c_Mと、
を乗算した値c_M×r_Mを前記共通信号精製重みα_Mとして得る共通信号精製重み推定ステップ
を更に含むことを特徴とする音信号精製方法。
請求項１から３の何れかに記載の音信号精製方法であって、
Tは前記フレーム当たりのサンプル数であり、ε_mとε_Mはそれぞれ0より大きく1未満の値であり、
フレームごとに、
前記復号音共通信号^Y_Mの各サンプル値^y_M(t)と前記モノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームの内積値E_m(-1)とを用いて

により得られる内積値E_m(0)と、
前記モノラル復号音信号^X_Mの各サンプル値^x_M(t)と前フレームの前記モノラル復号音信号のエネルギーE_M(-1)とを用いて

により得られる前記モノラル復号音信号のエネルギーE_M(0)と、を用いて

により得られる正規化された内積値r_Mと、
前記フレーム当たりのサンプル数Tと、前記ステレオ符号ＣＳのビット数のうちの共通信号に相当するビット数b_mと、前記モノラル符号ＣＭのビット数b_Mとを用いて

より得られる補正係数c_Mと、
を乗算した値c_M×r_Mを前記共通信号精製重みα_Mとして得る共通信号精製重み推定ステップ
を更に含むことを特徴とする音信号精製方法。
請求項６または８に記載の音信号精製方法であって、
前記共通信号精製重み推定ステップは、
前記正規化された内積値r_Mと、前記補正係数c_Mと、0より大きく1未満の予め定めた値であるλと、を乗算した値λ×c_M×r_Mを前記共通信号精製重みα_Mとして得る
ことを特徴とする音信号精製方法。
請求項６または８に記載の音信号精製方法であって、
前記チャネル数Nは2であり、
前記共通信号精製重み推定ステップは、
前記正規化された内積値r_Mと、前記補正係数c_Mと、第1チャネル復号音信号と第2チャネル復号音信号の相関係数であるチャネル間相関係数γと、を乗算した値γ×c_M×r_Mを前記共通信号精製重みα_Mとして得る
ことを特徴とする音信号精製方法。
請求項１から１０の何れかに記載の音信号精製方法を音信号精製ステップとして含む音信号復号方法であって、
前記モノラル符号ＣＭを復号して得られた情報も前記モノラル符号ＣＭも用いずに、前記ステレオ符号ＣＳを復号して前記各チャネルnの前記第ｎチャネル復号音信号^X_nを得るステレオ復号ステップと、
前記モノラル符号ＣＭを復号して前記モノラル復号音信号^X_Mを得るモノラル復号ステップと、
を更に含むことを特徴とする音信号復号方法。
フレームごとに、ステレオ符号ＣＳを復号して得たステレオの各チャネルの復号音信号である第ｎチャネル復号音信号^X_n（nは1以上N以下の各整数）と、前記ステレオ符号ＣＳとは異なる符号であるモノラル符号ＣＭを復号して得たモノラルの復号音信号であるモノラル復号音信号^X_Mと、を少なくとも用いて、前記ステレオの前記各チャネルの音信号である第ｎチャネル精製済復号音信号~X_nを得る音信号精製装置であって、
前記第ｎチャネル復号音信号^X_nは、前記モノラル符号ＣＭを復号して得た情報も前記モノラル符号ＣＭも用いずに、前記ステレオ符号ＣＳを復号して得たものであり、
フレームごとに、1以上N以下の全ての第ｎチャネル復号音信号^X_nを少なくとも用いて、前記ステレオの全チャネルに共通する信号である復号音共通信号^Y_Mを得る復号音共通信号推定部と、
フレームごとに、対応するサンプルtごとに、共通信号精製重みα_Mと前記モノラル復号音信号^X_Mのサンプル値^x_M(t)とを乗算した値α_M×^x_M(t)と、前記共通信号精製重みα_Mを1から減算した値(1-α_M)と前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値(1-α_M)×^y_M(t)と、を加算した値~y_M(t)=(1-α_M)×^y_M(t)＋α_M×^x_M(t)による系列を精製済共通信号~Y_Mとして得る共通信号精製部と、
前記各チャネルnについて、フレームごとに、前記第ｎチャネル復号音信号^X_nの前記復号音共通信号^Y_Mに対する正規化された内積値を第ｎチャネル分離結合重みβ_nとして得る第ｎチャネル分離結合重み推定部と、
前記各チャネルnについて、フレームごとに、対応するサンプルtごとに、前記第ｎチャネル復号音信号^X_nのサンプル値^x_n(t)から、前記第ｎチャネル分離結合重みβ_nと前記復号音共通信号^Y_Mのサンプル値^y_M(t)とを乗算した値β_n×^y_M(t)を減算し、前記第ｎチャネル分離結合重みβ_nと前記精製済共通信号~Y_Mのサンプル値~y_M(t)とを乗算した値β_n×~y_M(t)を加算した値~x_n(t)=^x_n(t)-β_n×^y_M(t)＋β_n×~y_M(t)による系列を前記第ｎチャネル精製済復号音信号~X_nとして得る第ｎチャネル分離結合部と、
を含むことを特徴とする音信号精製装置。
請求項１２に記載の音信号精製装置を音信号精製部として含む音信号復号装置であって、
前記モノラル符号ＣＭを復号して得られた情報も前記モノラル符号ＣＭも用いずに、前記ステレオ符号ＣＳを復号して前記各チャネルnの前記第ｎチャネル復号音信号^X_nを得るステレオ復号部と、
前記モノラル符号ＣＭを復号して前記モノラル復号音信号^X_Mを得るモノラル復号部と、
を更に含むことを特徴とする音信号復号装置。
請求項１から１０の何れかに記載の音信号精製方法または請求項１１に記載の音信号復号方法をコンピュータに実行させるためのプログラム。
請求項１から１０の何れかに記載の音信号精製方法または請求項１１に記載の音信号復号方法をコンピュータに実行させるためのプログラムを記録した記録媒体。