JP2015141294A

JP2015141294A - 通信装置

Info

Publication number: JP2015141294A
Application number: JP2014013633A
Authority: JP
Inventors: 佐々木　均; Hitoshi Sasaki; 均佐々木; 遠藤　香緒里; Kaori Endo; 香緒里遠藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2014-01-28
Filing date: 2014-01-28
Publication date: 2015-08-03
Anticipated expiration: 2034-01-28
Also published as: US20150213812A1; JP6277739B2; EP2899722A1; US9620149B2; EP2899722B1

Abstract

【課題】疑似帯域を拡張する際に出力音声に雑音感をもたらさない通信装置を提供する。
【解決手段】通信装置は、入力された音声信号の一部の成分を抽出する抽出部と、音声信号の特性を検出する検出部と、検出部で検出した特性に基づき、抽出部が抽出した成分を調整する調整部と、調整部で調整した成分を音声信号に加算して音声信号の帯域を拡張する加算部とを備える。
【選択図】図３

Description

本発明は、通信装置に関する。

通信のために狭帯域化された音声信号の周波数帯域を、受信装置側で疑似的に拡張する技術が、下記の先行技術文献に開示されている。

特開２０１２−０２２１６６号公報特開２００３−２５５９７３号公報

しかしながら、従来の音声処理では、擬似帯域を拡張する音声信号に子音が集中した場合に高域成分が強調されるため、処理された出力音声に雑音感をもたらす場合があった。

そこで、一態様では、疑似帯域を拡張する際に出力音声に雑音感をもたらさない通信装置を提供することを目的とする。

一態様では、通信装置は、入力された音声信号の成分を抽出する抽出部と、前記音声信号の話速を検出する検出部と、前記検出部で検出した前記話速に基づき、前記抽出部が抽出した前記成分を調整する調整部と、前記調整部で調整した成分を前記音声信号に加算して前記音声信号の帯域を拡張する加算部とを備える。

一態様によれば、入力音声の帯域を拡張する際に出力音声に雑音感をもたらさない通信装置を提供することができる。

音声処理機能を備える通信装置の構成の一例を示す図制御部のハードウェア構成の一例を示す図第１の実施形態における音声処理機能の構成の一例を示す図話速検出部の構成の一例を示す図通信装置の動作の一例を示すフローチャート音声処理機能の動作の一例を示すフローチャート擬似帯域拡張処理を説明するための、入力音声からのデータ抽出を示すグラフ（ａ）、抽出したデータの整形及びレベル調整を示す図（ｂ）、データ加算を示すグラフ（ｃ）話速検出部の動作の一例を示すフローチャート入力音声の周波数特性を示すグラフ入力音声の子音の周波数特性を示すグラフ話速検出部の処理を説明するための、原音の時間推移を示すグラフ（ａ）、原音のホルマントを示すグラフ（ｂ）、原音のピッチ強度を示すグラフ（ｃ）第２の実施形態における音声処理機能の構成の一例を示す図

以下、図面に基づいて本発明の実施の形態を説明する。

先ず、図１を用いて、本実施形態における音声処理機能を備える通信装置の構成を説明する。図１は、音声処理機能を備える通信装置の構成の一例を示す図である。

図１において、通信装置１は、制御部１０、通信部２０、操作表示部３０、Ｄ／Ａ（Digital ／Analog）変換部４１、スピーカ４２、Ａ／Ｄ変換部４３、およびマイク４４を備える。

通信部２０は、アンテナ２１に接続されて、アンテナ２１を介した無線通信の通信制御を行う。通信部２０は、例えば専用の通信制御ハードウェアによって実現できる。

操作表示部３０は、通信装置１のユーザに対して各種のユーザインターフェイスを提供し、ユーザによる操作入力を可能にする。操作表示部３０は、例えばタッチパネルによって実現できる。

Ｄ／Ａ変換部４１は、例えば通信部２０を介して遠端（通信相手の端末）から入力されて制御部１０の音声処理機能１００によって処理された音声データをアナログ化して、スピーカ４２に対して音声を出力する。

Ａ／Ｄ変換部４３は、マイク４４から入力された音声をデジタルデータ化して制御部１０に入力する。

制御部１０は、通信装置１の動作を制御する。制御部１０は、音声処理機能１００を備える。制御部の詳細を図２を用いて説明する。図２は、制御部のハードウェア構成の一例を示す図である。

図２において、制御部１０は、ＣＰＵ（Central Processing Unit）１１、ＲＡＭ（Random Access Memory）１２、フラッシュメモリ１３、およびＣｏｄｅｃ（コーデック）１４を備える。ＣＰＵ１１は、ＲＡＭ１２またはフラッシュメモリ１３に記憶されたプログラムを実行する。フラッシュメモリ１３は、書き換え可能な不揮発性メモリであり、プログラムやデータを記憶することができる。Ｃｏｄｅｃ１４は、通信装置１で送受信するデータをエンコードまたはデコードするコーデック（Codec）処理を行う。本実施形態では、Ｃｏｄｅｃ１４は、専用のハードウェアを使用するが、例えばコーデックのプログラムをフラッシュメモリ１３に記憶させて、ＲＡＭ１２に読み出してＣＰＵ１１が実行することにより実現してもよい。

図１に戻り、制御部１０は、フラッシュメモリ１３等に格納されているプログラムを実行することにより音声処理機能１００を実現する。

音声処理機能１００は、遠端から入力された音声信号（以下、「入力音声」と省略する。）に対して、擬似帯域拡張処理を行う。擬似帯域拡張処理とは、通信部２０を介した無線通信の通信速度に応じて制限された周波数帯域による遠端からの入力音声に対して周波数の高い音声信号を加算することにより出力される音声信号（以下、「出力音声」と省略する。）に擬似的に周波数帯域を拡張する処理である。

本実施形態では、音声処理機能１００は、フラッシュメモリ１３等に格納されているプログラムで実現するものとして説明するが、例えば同じ機能をハードウェアまたはミドルウエアによって実現してもよい。

なお、図２で説明した制御部１０は、例えば、通信制御の用途に作成されたＡＳＩＣ（Application Specific Integrated Circuit）とすることができる。ＡＳＩＣには、ＣＰＵ（Central Processing Unit）またはメモリ等のデジタル回路の他に通信用のアナログ回路を含んでいてもよい。
［第１の実施形態］
次に、図３を用いて、第１の実施形態における音声処理機能１００の詳細を説明する。図３は、第１の実施形態における音声処理機能の構成の一例を示す図である。

図３において、音声処理機能１００は、話速検出部１０１、複写成分抽出部１０２、複写成分整形部１０３、レベル調整部１０４、および複写成分加算部１０５を備える。

話速検出部１０１は、通信部２０を介して遠端から入力されて、Ｃｏｄｅｃ１４によりデコードされた入力音声の話速を検出して決定する。話速とは、話者が発声する音声の発声速度である。話速の検出方法の詳細は後述する。

複写成分抽出部１０２は、入力音声の中で特定の周波数帯域の成分を擬似帯域拡張の処理で複写する複写成分として抽出する。複写成分の抽出は、入力音声に対してＦＦＴ（Fast Fourier Transform）処理を行い、予め設定された周波数帯域の音声を抽出する。ＦＦＴのサンプリング周波数は、例えば入力音声を８ＫＨｚ、出力音声を１６ＫＨｚで行う。

複写成分整形部１０３は、複写成分抽出部１０２で抽出された複写成分の波形を整形する。波形の整形は、入力音声に対して設定された周波数範囲を切り出すことにより行われる。

レベル調整部１０４は、話速検出部１０１から入力される補正値に応じて、複写成分整形部１０３から入力された複写成分に対して複写成分のレベル調整を行う。レベル調整の詳細について、図７を用いて説明する。図７は、擬似帯域拡張処理を説明するための、入力音声からのデータ抽出を示すグラフ（ａ）、抽出したデータの整形及びレベル調整を示す図（ｂ）、データ加算を示すグラフ（ｃ）である。

レベル調整部１０４によって行われるレベルの調整は、例えば、複写成分の音量（波高値）に対して所定の減衰率で減衰させることにより行う。図７（ａ）は、入力音声に対してＦＦＴの処理を行い、周波数特性として表したグラフである。

図７（ｂ）は、図７（ａ）に示す入力音声に対して複写成分抽出部１０２が１．５ＫＨｚ〜３．５ＫＨｚの範囲を複写成分として抽出し、複写成分整形部１０３から出力された複写成分の音量に対して、所定の減衰率を適用させた場合を示している。レベル調整部１０４は、話速検出部１０１から入力される補正値に応じて、減衰率を変えることができる。

また、レベル調整部１０４は、話速検出部１０１から入力される補正値に応じて、複写成分に対する周波数のシフト量の調整を行ってもよい。図７（ｂ）は、複写成分整形部から入力された複写成分の音量に対して、高音方向に２ＫＨｚのシフトを行っている場合を示している。複写成分整形部１０３から入力された複写成分は、１．５ＫＨｚ〜３．５ＫＨｚの周波数範囲であり、２ＫＨｚ高音側にシフトすると、複写成分は、３．５ＫＨｚ〜５．５ＫＨｚの周波数範囲となる。

また、レベル調整部１０４は、話速検出部１０１から入力される補正値に応じて、複写成分に対して周波数帯域の伸張あるいは圧縮を行ってもよい。図７（ｂ）に示す複写成分は１．５ＫＨｚ〜３．５ＫＨｚの周波数範囲であるために、２ＫＨｚの周波数帯域である。例えば、周波数帯域を３ＫＨｚに伸張した場合は、複写成分は図７（ｂ）の図示横方向に１．５倍伸張された波形となる。また、周波数帯域を１ＫＨｚに圧縮した場合は、複写成分は図示横方向に１／２に圧縮された波形となる。

複写成分加算部１０５は、入力音声に対して、レベル調整部１０４によって調整された複写成分を加算する。図７（ｃ）は、複写成分加算部１０５によって、入力音声に調整された複写成分を加算した図である。３．５ＫＨｚから高音側に調整された複写成分が加算され、周波数帯域が５．５ＫＨｚまで擬似的に拡張されている。

次に、図４を用いて、図３で説明した話速検出部１０１の詳細を説明する。図４は、話速検出部の構成の一例を示す図である。

図４において、話速検出部１０１は、ホルマント検出部１０１１、ピッチ検出部１０１２、変動検出部１０１３、および話速算出部１０１４を備える。

ホルマント検出部１０１１は、入力音声に対して、音声のフレーム単位でホルマント（Ｆ１周波数）を検出する。ホルマントとは、人が発する音声の周波数スペクトルのピークをいう。Ｆ１周波数とは、ホルマントの中で一番周波数が低いものである。ホルマントは人の発音に対して経時的に推移する。ホルマントの周波数が一定値以上変動した場合、音素が変化したものとして検出をすることができる。ホルマントの変化は、ホルマントを蓄積して平均し、その平均値に対して新たに計算されたホルマントの変化量で検出することができる。ホルマント検出部は、ホルマントを経時的に検出して変動検出部１０１３に出力する。

ピッチ検出部１０１２は、入力音声のピッチ強度を検出する。ピッチ検出部１０１２は、経時的にピッチ強度を検出して変動検出部１０１３に出力する。

ここで有声とは、声帯振動を伴う音声であり、周期的な振動として観測される。一方、無声とは、声帯振動を伴わない音声であり、非周期的な雑音として観測される。有声の周期は、声帯振動の周期で決まり、これをピッチ周波数という。ピッチ周波数は声の高低や抑揚によって変化する音声のパラメータである。

第１の実施形態において、ピッチ検出部１０１２は、ピッチ周波数について所定のサンプリング時間で自己相関係数を測定する。ピッチ検出部１０１２は、さらに自己相関係数のピークを検出することによりピッチ強度を求め、ピッチ強度の大きさによって音声の中の有声部と無声部とを判定することができる。

変動検出部１０１３は、ホルマント検出部１０１１で検出されたホルマントとピッチ検出部１０１２で検出されたピッチ強度の変化の有無を検出する。変動検出部１０１３は、ホルマントのＦ１情報をカウントするカウンタ１０１３１、音素の継続数、つまり音素の継続長をカウントするカウンタ１０１３２、および音素の切替数をカウントするカウンタ１０１３３を備える。

話速算出部１０１４は、変動検出部１０１３によって検出されたホルマントとピッチ強度の変化から話速を算出して決定する。なお、話速検出部１０１の動作の詳細は後述する。

次に、図５を用いて、制御部１０による通信装置１の動作を説明する。図５は、通信装置１の動作の一例を示すフローチャートである。

図５において、デコーダ処理、受話音声処理を行う（Ｓ１）。デコーダ処理および受話音声処理は図２で説明したＣｏｄｅｃ１４によって行われる。受話音声処理は、例えばデコードした音声に対して、レベル調整、ノイズ除去等の前処理を行う。

次に、制御部１０は、入力音声に対して擬似帯域拡張処理を行う（Ｓ２）。擬似帯域拡張処理の詳細は後述する。

次に、擬似帯域拡張処理を行った出力音声をＤ／Ａ変換部４１及びスピーカ４２を通じて音声出力をする（Ｓ３）。

次に、制御部１０は、終話判定を行う（Ｓ４）。終話判定は、例えば操作表示部３０の操作、あるいは遠端からのオンフックが行われたかどうかで判断する。終話判定がされない場合（Ｓ４でＮＯ）、再びステップＳ１に戻り処理が継続される。終話判定がされた場合（Ｓ４でＹＥＳ）、制御部１０による通信装置１の動作を終了する。

次に、図６ならびに先に説明した図３及び図７を用いて、図５で説明した擬似帯域拡張処理（Ｓ２）の詳細を説明する。図６は、音声処理機能の動作の一例を示すフローチャートである。

図６において、複写成分抽出部１０２は、複写成分を抽出する（Ｓ１１）。

複写成分抽出部１０２によるデータの抽出は、例えば、抽出範囲を周波数で設定することにより行われる。例えば、複写成分の抽出範囲を１．５ＫＨｚ〜３．５ＫＨｚに設定した場合、抽出対象は図７（ａ）に示す、１．５ＫＨｚ〜３．５ＫＨｚの周波数の範囲の入力音声である。なお、抽出範囲は、例えば、基準となる周波数値と帯域幅によって設定してもよい。図７（ａ）の例では、基準となる周波数を１．５ＫＨｚとして、２ＫＨｚの帯域幅として設定してもよい。複写成分抽出部１０２は、抽出した複写成分をレベル調整部１０４に対して出力する。

次に、複写成分整形部１０３は、複写成分抽出部１０２から入力された複写成分の整形を行う（Ｓ１２）。

図７（ａ）及び図７（ｂ）は、複写成分整形部１０３が、入力音声のデータの中で１．５ＫＨｚ以下と３．５ＫＨｚ以上のデータをカットして、１．５ＫＨｚ〜３．５ＫＨｚのデータのみを切り出すことにより複写成分のデータを整形している場合を例示している。

話速検出部１０１は、話速を検出して、検出した話速が高速話速であるかどうかの判定を行う（Ｓ１３）。ステップＳ１３の話速判定の詳細を、図８を用いて説明する。図８は、話速検出部１０１の動作の一例を示すフローチャートである。

図８において、話速検出部１０１は、初期設定を行う（Ｓ１）。初期設定は、図４で説明した、変動検出部１０１３のホルマントのＦ１情報をカウントするカウンタ１０１３１、音素の継続数をカウントするカウンタ１０１３２、および音素の切替数をカウントするカウンタ１０１３３をクリアすることにより行う。

変動検出部１０１３は、ピッチ検出部１０１２で検出されたピッチ強度から、入力音声が有声かどうかの判定を行う（Ｓ２２）。

変動検出部１０１３が有声と判定した場合には（Ｓ２２でＹＥＳ）、Ｆ１の変化が所定の閾値より小さいかどうかの判定を行う（Ｓ２３）。

Ｆ１の変化が所定値以下の場合（Ｓ２３でＹＥＳ）、カウンタ１０１３１及びカウンタ１０１３２をそれぞれ＋１カウントアップする（Ｓ２４）。ここで、有声でＦ１の変化が小さいということは、入力音声の音素が切り替わっていないことを意味する。カウンタ１０１３１及びカウンタ１０１３２は、所定のフレーム数をカウントして、所定のフレーム数が経過するまでは音素の切り替わりをカウントしない。カウンタ１０１３１及びカウンタ１０１３２は、音素が切り替わるまでカウントアップされる。

Ｆ１の変化が所定値より大きい場合（Ｓ２３でＮＯ）、音素の切替数をカウントするカウンタ１０１３３を＋１カウントアップする（Ｓ２７）。Ｆ１の変化が所定値より大きい場合は、音素が切り替わったと判断して切替数をカウントする。カウンタ１０１３３の音素切替数は、音声のモーラ数（拍数）を表す。モーラ数を求めることにより、その逆数である話速を算出可能にする。

次に、カウンタ１０１３１及びカウンタ１０１３２をクリアする（Ｓ２８）。カウンタ１０１３１及びカウンタ１０１３２をクリアすることにより、次の音素の切替を判断できるようになる。

次に、話速算出部１０１４は、カウンタ１０１３３の音素切替数から話速を算出して決定する。話速は、単位時間あたりの音素切替数によって求めることができる。話速が所定の閾値以上の場合は、「高速話速」であると判定し、話速が所定の閾値未満の場合は、「通常話速」であると判定する。

一方、変動検出部１０１３が無声と判定した場合には（Ｓ２２でＮＯ）、音素継続数が所定の閾値以上であるかどうかを判断する（Ｓ２６）。音素継続数が所定の閾値以上である場合（Ｓ２６でＹＥＳ）、音素の切替数をカウントするカウンタ１０１３３を＋１カウントアップする（Ｓ２７）。Ｆ１の変化が小さく音素の継続時間が長い場合には、無声の判定により音素の切替であると判断する。

音素継続数が所定の閾値より小さい場合（Ｓ２６でＮＯ）、カウンタ１０１３１及びカウンタ１０１３２をクリアして（Ｓ２８）、音素切替数から話速を算出する（Ｓ２５）。

次に、終話かどうかを判定する（Ｓ２６）。終話判定は、ステップＳ４と同様の処理により行う。終話判定がされない場合（Ｓ２６でＮＯ）、ステップＳ２２に戻り処理が繰り返される。終話判定がされた場合（Ｓ２６でＹＥＳ）、ステップＳ１３の話速判定の処理を終了する。

なお、話速検出部１０１は、たとえばピッチの周波数分布の広さによって高速話速を判定してもよい。早口で話すとピッチの周波数分布が広くなり、たとえば分散や標準偏差で求められる周波数分布の広がりに閾値を設けて、閾値以上の場合を高速話速として判断することができる。

再び図６に戻り、話速が通常話速であると判定された場合（Ｓ１３でＮＯ）、話速検出部１０１はレベル調整部１０４に対して、複写成分の減衰を通常減衰とする補正値を出力する（Ｓ１４）。これにより、通常話速の入力に対して擬似帯域拡張により音質の向上を図ることができる。

一方、話速が高速話速であると判定された場合（Ｓ１３でＹＥＳ）、話速検出部１０１はレベル調整部１０４に対して、複写成分の減衰を通常より大きい減衰とする補正値を出力する（Ｓ１５）。これにより、話速が速い場合に生じる高音の雑音感を低減し音質を向上させることができる。

ここで、図９および図１０を用いて、話速が速い場合に生じる高音の雑音感を低減させる作用について説明する。図９は、入力音声の周波数特性を示すグラフの一例である。図１０は、入力音声の子音の周波数特性を示すグラフの一例である。

図９において、入力音声は一般的に調波構造を持つ。調波構造とは，所定の周波数間隔で幾つものピークが存在する構造のことをいう。音声の中で特に母音部は調波構造を持つことが知られている。

音声通信では、利用可能な通信帯域に基づき、送受信されるデータ量を減らすために、入力音声を、たとえば３００Ｈｚ〜３．４ＫＨｚのみをサンプリングして、当該周波数帯域以外の音声をカットする。このため、出力音声は、サンプリングされた周波数帯域外の周波成分を持たない臨場感のない音となる。

一方、図１０において、入力音声の子音は、所定の周波数にピークを有し、母音の様な調波構造を持たない周波数特性を有する。

疑似帯域拡張とは、図７で説明したとおり、受信側装置が、受信した３００Ｈｚ〜３．４ＫＨｚの音声から疑似的に他の周波数帯域を生成することで元の音声を再生する技術である。

したがって、調波構造を持たない子音の音声信号を複写して他の周波数帯域の音声信号を疑似的に生成すると、もともと存在しない周波数帯域の音を作り出してしまうことになり、雑音感を生じさせてしまう原因となる。

話速が遅い場合は単位時間あたりの子音の数が少ないため、疑似帯域拡張による雑音感も少ない。一方、話速が速い場合は単位時間あたりの子音の数が多いため、高音での雑音感が増加することになる。

本実施形態においては、話速が速い時に複写成分の減衰を通常より大きくすることにより、帯域拡張をしつつも雑音成分のゲインが下がり雑音感を小さくすることが可能となる。

なお、図７で説明した複写成分のシフト量を調整すること、拡張する複写成分の周波数帯域の伸張、圧縮を調整することも、上記減衰を大きくすることと同様の効果、すなわち帯域拡張をしつつ雑音感を小さくする効果を得ることができる。

また、本実施形態では、話速判定に対して高速話速と通常話速の２段階の補正値を出力するようにしたが、例えば、減衰レベル話速に応じて３段階以上、あるいは無段階に調整するようにしてもよい。また、補正値に非線形の補正曲線を適用してレベル調整部１０４に対して出力するようにしてもよい。

再び図６に戻り、複写成分加算部１０５は、入力音声に対して、レベル調整部で調整された複写成分を加算して出力音声を出力する（Ｓ１６）。

次に、終話かどうかを判定する（Ｓ１７）。終話判定は、ステップＳ４と同様の処理により行う。終話判定がされない場合（Ｓ２６でＮＯ）、ステップＳ２２に戻り処理が繰り返される。終話判定がされた場合（Ｓ２６でＹＥＳ）、ステップＳ１３の話速判定の処理を終了する。終話判定は、ステップＳ４と同様の処理により行う。終話判定がされない場合（Ｓ１７でＮＯ）、ステップＳ１１に戻り処理が繰り返される。終話判定がされた場合（Ｓ１７でＹＥＳ）、ステップＳ２の擬似帯域拡張処理を終了する。

次に、図１１を用いて、図４で説明した話速検出部１０１のホルマント検出部及びピッチ検出部１０１２によるホルマントとピッチ強度の検出の例を説明する。図１１は、話速検出部の処理の一例を説明するための、原音の時間推移を示すグラフ（ａ）、原音のホルマントを示すグラフ（ｂ）、原音のピッチ強度を示すグラフ（ｃ）である。

図１１（ａ）において、入力音声の原音は経時で図示する波形を有している。なお、図１１（ａ）〜図１１（ｃ）の横軸は経過時間（秒）である。

ホルマント検出部１０１１は、図１１（ａ）の入力音声が入力されると、フレーム単位（本実施例では１０ｍｓ）でＦ１を算出する。図１１（ｂ）は原音に対するＦ１の算出結果である。図１１（ｂ）の縦軸は周波数（ＫＨｚ）である。Ｆ１の変化の大きさによって有声部の音素の切替を判断することができる。

ピッチ検出部１０１２は、図１１（ａ）の入力音声が入力されると、自己相関係数の最大値からピッチ強度を算出する。図１１（ｃ）は原音に対するピッチ強度の算出結果である。
［第２の実施形態］
次に、図１２を用いて、音声処理機能１００の第２の実施形態を説明する。図１２は、第２の実施形態における音声処理機能１００の構成の一例を示す図である。

図１２において、音声処理機能１００は、ピッチ分布検出部１１１、複写成分抽出部１１２、複写成分整形部１１３、レベル調整部１１４、および複写成分加算部１１５を備える。

第２の実施形態と第１の実施形態の差は、第１の実施形態における話速検出部１０１に代わってピッチ分布検出部１１１を備えたことである。複写成分抽出部１１２、複写成分整形部１１３、レベル調整部１１４、および複写成分加算部１１５については第１の実施形態と同じ構成であるため、説明を省略する。

ピッチ分布検出部１１１は、入力音声のピッチ周波数の分布を集計する。

ピッチ周波数は有声音の周波数によって計測することができる。例えば、音声の緊張状態が高い場合には音声の抑揚が小さくなり、ピッチの周波数分布の幅が狭くなる。一方、興奮状態にある場合にはピッチの周波数分布が広くなる。本実施形態では、ピッチ周波数の分布の大きさにより緊張状態や興奮状態を測定することができる。

ピッチ分布検出部１１１は、ピッチ周波数の分布が所定値の範囲内に入っているかどうかを検出し、所定の範囲内であるときは通常のピッチ分布であるとしてレベル調整部１１４に出力する補正値を通常の減衰率とする。これにより、通常のピッチ分布による入力音声に対して擬似帯域拡張により音質の向上を図ることができる。

一方、ピッチ周波数の分布が所定値の範囲内に入っていない場合は、ピッチ分布検出部１１１は、ピッチ分布が広い、又は狭いとして減衰率を高く、又は低く設定して補正値をレベル調整部１１４に出力する。これにより、例えば緊張度あるいは興奮度が高い場合に音質の低下を防止することができる。

なお、第２の実施形態においては、ピッチ分布検出部１１１は、ピッチ分布に対して２段階の補正値を出力するが、２段階の補正値に代えて多段階の補正値を出力するようにしてもよい。また、無段階の補正値を出力するようにしてもよい。

以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

１通信装置
１１ＣＰＵ
１２ＲＡＭ
１３フラッシュメモリ
１４Ｃｏｄｅｃ
１５バス
１０制御部
１００音声処理機能
１０１話速検出器
１０１１ホルマント検出部
１０１２ピッチ検出部
１０１３変動検出部
１０１４話速算出部
１０２複写成分抽出部
１０３複写成分整形部
１０４レベル調整部
１０５複写成分加算部
１００音声処理機能
１１１ピッチ分布検出器
１１２複写成分抽出部
１１３複写成分整形部
１１４レベル調整部
１１５複写成分加算部
２０通信部
２１アンテナ
３０操作表示部
４１Ｄ／Ａ変換部
４２スピーカ
４３Ａ／Ｄ変換部
４４マイク

Claims

入力された音声信号の成分を抽出する抽出部と、
前記音声信号の話速を検出する検出部と、
前記検出部で検出した前記話速に基づき、前記抽出部が抽出した前記成分を調整する調整部と、
前記調整部で調整した成分を前記音声信号に加算して前記音声信号の帯域を拡張する加算部と
を備える通信装置。
前記検出部は、前記音声信号のピッチ分布により前記話速を決定する、請求項１に記載の通信装置。
前記調整部は、前記成分を調整するときに前記成分の減衰率を調整する、請求項１または２に記載の通信装置。
前記調整部は、前記成分を調整するときに前記成分の周波数帯域を調整する、請求項１または２に記載の通信装置。
前記調整部は、前記成分を調整するときに前記成分の周波数のシフト量を調整する、請求項１または２に記載の通信装置。