JP5148414B2 - 信号帯域拡張装置 - Google Patents
信号帯域拡張装置 Download PDFInfo
- Publication number
- JP5148414B2 JP5148414B2 JP2008222297A JP2008222297A JP5148414B2 JP 5148414 B2 JP5148414 B2 JP 5148414B2 JP 2008222297 A JP2008222297 A JP 2008222297A JP 2008222297 A JP2008222297 A JP 2008222297A JP 5148414 B2 JP5148414 B2 JP 5148414B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- wideband
- narrowband
- band
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は上記の問題を解決すべくなされたもので、原音に忠実で高音質な広帯域信号を生成することが可能な信号帯域拡張装置を提供することを目的とする。
図1は、この発明の一実施形態に係わる信号帯域拡張装置が適用された通信装置の構成を示すものである。この図に示す通信装置は、例えば携帯電話などの無線通信装置の受信系を示すものであって、無線通信部1と、デコーダ2と、帯域拡張処理部3と、D/A変換器4とを備えている。
デコーダ2は、無線通信部1が通信相手局から受信した受信データを、事前に決められた単位(1フレーム=Nサンプル)ごとに復号して、ディジタルの入力信号x[n] (n=0,1,…N-1)を得る。ここで1フレームをN=160サンプルとする。ただし、この入力信号x[n]は、サンプリング周波数はfs[Hz]でfs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限された狭帯域の信号である。このようにして得られたディジタルの入力信号x[n]は、フレーム単位で帯域拡張処理部3に出力される。
図3は、この発明に係わる帯域拡張処理部3の第1の構成例を示すものである。この第1の構成例では、帯域拡張処理部3で、サンプリング周波数をデコーダ2で用いたサンプリング周波数fs[Hz]からfs'[Hz]にアップサンプリングを伴う帯域拡張処理するものとする。すなわち、fs < fs'である。ただし、fs_wb_low ≦ fs_nb_low < fs_nb_high ≦ fs_wb_high < fs/2 を満たし、fs_nb_high < fs/2 < fs_wb_high < fs’/2 を満たすものとする。
帯域通過フィルタ305は、アップサンプリング部304の出力から広帯域化に用いる周波数帯域(例えば1k[Hz]〜4k[Hz])を通過させる特性であって、アップサンプリング部304で得たデータ長4Nの線形予測残差信号ew_us[n]を入力として、帯域通過フィルタ処理し、帯域通過処理した線形予測残差信号ew2_us[n]を広帯域化処理部306に出力する。
GMM格納部307bは、事前に学習された混合数Q(ここではQ=64)のGMM λq={wq,μq,Σq}(q=1,…,Q)を格納している。なお、wqはq番目の混合正規分布の混合重みを示し、μqはq番目の混合正規分布の平均ベクトル、Σqはq次数目の混合正規分布の共分散行列(対角共分散行列または全共分散行列)を表している。なお、平均ベクトルμqと共分散行列Σqの成分の数である次数は、Dn+Dwである。
GMMの生成に用いる信号は、サンプリング周波数fs’[Hz]でfs_wb_low[Hz]からfs_wb_high[Hz]までに対応する理想的な広帯域信号(原音)とし、なるべく多数の音声信号を用いた信号群を用意する。この信号群は、多数の話者、様々な音量、様々な発話内容であることが望ましい。以下では、GMMの生成に用いる理想的な広帯域信号の信号群をまとめて1つにして、広帯域信号データwb[n]と表記する。また、nは時刻(サンプル)を表す。
したがって、上記構成の信号帯域拡張装置によれば、広帯域化した信号のフォルマントの山と谷の差をはっきりすることができるので、原音に忠実で高音質な広帯域信号を生成することができる。
なお、図3に示した構成の変形例として、図8に示すような構成も考えられる。図8に示す信号帯域拡張装置の帯域拡張処理部は、図3に示した構成に加え、有声/無声推定部313と、雑音生成部314と、パワー制御部315と、パワー制御部316と、信号加算処理部317とを備え、信号合成部308が広帯域化処理部306の出力に代わって、信号加算処理部317の出力を入力として用いるようにしたものである。
雑音生成部314は、有声/無声推定部313の推定結果である推定情報vuv[f]が「無声音」の場合に、一様にランダムな乱数を生成し、それを信号の振幅値にすることにより、白色化された雑音信号wn[n]をデータ長4N分生成して出力する。
信号合成部308は、スペクトル包絡広帯域化処理部307から出力された広帯域スペクトルパラメータである上記線スペクトル周波数LSF_WB[f,d](d=1,…,Dw)に基づいて、線スペクトル対LSP_WB[f,d](d=1,…,Dw)を生成して、信号加算処理部317から出力される広帯域音源信号であるデータ長4Nの信号にLSP合成フィルタ処理を行い、データ長4Nの広帯域信号y1[n]を算出し、データ長4Nの広帯域信号y1[n]の時間的に前半のデータ(データ長2N)と、1フレーム前に信号合成部308が出力した広帯域信号y1[n]の時間的に後半のデータ(データ長2N)とを、これらのオーバーラップ分を考慮して加算し、データ長2Nの広帯域信号y1[n]を算出する。
なお、図3に示した構成のさらなる変形例として、図9に示すような構成も考えられる。図9に示す信号帯域拡張装置の帯域拡張処理部は、図3に示した構成に加え、広帯域フォルマント強調部318を備え、信号合成部308が広帯域化処理部306の出力に代わって、広帯域フォルマント強調部318の出力を入力に用いるようにしたものである。
したがって、上記構成の信号帯域拡張装置によれば、広帯域化されたスペクトル包絡を表す広帯域スペクトルパラメータによってフォルマントの山と谷の差が浅くなる傾向を防ぐことができ、広帯域化した信号のフォルマントの山と谷の差を第1の構成例よりもよりはっきりすることができるので、原音に忠実で高音質な広帯域信号を生成することができる。
さらに、図3では、帯域拡張処理部が高域拡張処理を行うものとして構成例を示したが、図10に示すように低域拡張処理を行う帯域拡張処理部に対しても本発明を適用することができる。
また、図3から図8に追加した構成を、図10に適用することも可能である。
また、図3から図9に追加した構成を、図10に適用することも可能である。
なお、この発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
Claims (7)
- 入力信号を分析し、狭帯域スペクトルパラメータと狭帯域音源信号を求める分析手段と、
前記分析手段が得た狭帯域音源信号に対して前記分析手段が求めた狭帯域スペクトルパラメータに基づくフォルマント強調を行うフォルマント強調手段と、
前記フォルマント強調手段でフォルマントが強調された狭帯域音源信号から広帯域音源信号に変換する広帯域化手段と、
前記分析手段が求めた狭帯域スペクトルパラメータに基づいた広帯域スペクトルパラメータと前記広帯域化手段が得た広帯域音源信号によって、広帯域信号を合成する合成手段と、
前記合成手段が合成した広帯域信号から拡張した帯域を抽出して前記入力信号に加算する加算手段とを具備することを特徴とする信号帯域拡張装置。 - 前記合成手段は、前記分析手段が求めた狭帯域スペクトルパラメータをそのまま広帯域スペクトルパラメータとして用いることを特徴とする請求項1に記載の信号帯域拡張装置。
- 入力信号を分析し、狭帯域スペクトルパラメータと狭帯域音源信号を求める分析手段と、
前記分析手段が得た狭帯域音源信号に対して前記分析手段が求めた狭帯域スペクトルパラメータに基づくフォルマント強調を行うフォルマント強調手段と、
前記フォルマント強調手段でフォルマントが強調された狭帯域音源信号をアップサンプリングする第1アップサンプリング手段と、
前記第1アップサンプリング手段でアップサンプリングされた狭帯域音源信号から広帯域音源信号に変換する広帯域化手段と、
前記分析手段が求めた狭帯域スペクトルパラメータと、予めモデル化しておいた狭帯域スペクトルパラメータと広帯域スペクトルパラメータの対応に基づいて、広帯域スペクトルパラメータを求めるスペクトルパラメータ広帯域化手段と、
前記スペクトルパラメータ広帯域化手段が求めた広帯域スペクトルパラメータと前記広帯域化手段が得た広帯域音源信号に基づいて、広帯域信号を合成する合成手段と、
前記入力信号をアップサンプリングする第2アップサンプリング手段と、
前記合成手段が合成した広帯域信号から拡張した帯域を抽出した信号を、前記第2アップサンプリング手段でアップサンプリングされた入力信号に加算する加算手段とを具備することを特徴とする信号帯域拡張装置。 - 前記広帯域化手段が得た広帯域音源信号に対してスペクトルパラメータ広帯域化手段が求めた広帯域スペクトルパラメータに基づくフォルマント強調を行う広帯域フォルマント強調手段をさらに有することを特徴とする請求項3に記載の信号帯域拡張装置。
- 前記広帯域化手段は、予め設定した非線形関数に基づいて、フォルマント強調手段でフォルマントが強調された狭帯域音源信号から広帯域音源信号に変換することを特徴とする請求項1乃至請求項4のいずれか1項に記載の信号帯域拡張装置。
- さらに、前記入力信号と前記分析手段が求めた狭帯域スペクトルパラメータとに基づいて、前記入力信号が有声か無声かを推定する推定手段と、
前記推定手段が無声と推定した場合に、雑音信号を生成する雑音生成手段と、
前記雑音生成手段が生成した雑音信号を、前記広帯域化手段が得た信号に加算する加算処理手段とを備え、
前記合成手段は、前記広帯域スペクトルパラメータと前記加算処理手段が得た信号を合成することを特徴とする請求項1乃至請求項5のいずれか1項に記載の信号帯域拡張装置。 - 前記分析手段は線形予測分析を行い、狭帯域スペクトルパラメータとして線形予測係数を得、狭帯域音源信号として線形予測残差信号を得ることを特徴とする請求項1乃至請求項6のいずれか1項に記載の信号帯域拡張装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222297A JP5148414B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222297A JP5148414B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055002A JP2010055002A (ja) | 2010-03-11 |
JP5148414B2 true JP5148414B2 (ja) | 2013-02-20 |
Family
ID=42070959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008222297A Expired - Fee Related JP5148414B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5148414B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5450298B2 (ja) * | 2010-07-21 | 2014-03-26 | Toa株式会社 | 音声検出装置 |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6284003B2 (ja) | 2013-03-27 | 2018-02-28 | パナソニックIpマネジメント株式会社 | 音声強調装置及び方法 |
BR112016008544B1 (pt) | 2013-10-18 | 2021-12-21 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio. |
CA2927716C (en) | 2013-10-18 | 2020-09-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
JP6386237B2 (ja) * | 2014-02-28 | 2018-09-05 | 国立研究開発法人情報通信研究機構 | 音声明瞭化装置及びそのためのコンピュータプログラム |
CN106992003A (zh) * | 2017-03-24 | 2017-07-28 | 深圳北斗卫星信息科技有限公司 | 语音信号自动增益控制方法 |
JP2019008206A (ja) * | 2017-06-27 | 2019-01-17 | 日本放送協会 | 音声帯域拡張装置、音声帯域拡張統計モデル学習装置およびそれらのプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2000206996A (ja) * | 1999-01-13 | 2000-07-28 | Sony Corp | 受信装置及び方法、通信装置及び方法 |
JP4047296B2 (ja) * | 2004-03-12 | 2008-02-13 | 株式会社東芝 | 音声復号化方法及び音声復号化装置 |
JP2005331783A (ja) * | 2004-05-20 | 2005-12-02 | Fujitsu Ltd | 音声強調装置,音声強調方法および通信端末 |
JP4447546B2 (ja) * | 2005-11-18 | 2010-04-07 | 三菱電機株式会社 | 広帯域音声復元方法及び広帯域音声復元装置 |
-
2008
- 2008-08-29 JP JP2008222297A patent/JP5148414B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010055002A (ja) | 2010-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JP4945586B2 (ja) | 信号帯域拡張装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
JP4892021B2 (ja) | 信号帯域拡張装置 | |
JP5148414B2 (ja) | 信号帯域拡張装置 | |
RU2552184C2 (ru) | Устройство для расширения полосы частот | |
JP5419876B2 (ja) | スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 | |
JP5535241B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
JP2004101720A (ja) | 音響符号化装置及び音響符号化方法 | |
JPH10124088A (ja) | 音声帯域幅拡張装置及び方法 | |
JPWO2010098112A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
Kornagel | Techniques for artificial bandwidth extension of telephone speech | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
KR20050049103A (ko) | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 | |
JP5443547B2 (ja) | 信号処理装置 | |
JP5711645B2 (ja) | オーディオ信号出力装置およびオーディオ信号出力方法 | |
JP2004151423A (ja) | 帯域拡張装置及び方法 | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
JP4413546B2 (ja) | 音声信号の雑音低減装置 | |
JP2015206958A (ja) | 音声信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |