JP3955967B2 - 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム - Google Patents
音声信号雑音除去装置、音声信号雑音除去方法及びプログラム Download PDFInfo
- Publication number
- JP3955967B2 JP3955967B2 JP2001298611A JP2001298611A JP3955967B2 JP 3955967 B2 JP3955967 B2 JP 3955967B2 JP 2001298611 A JP2001298611 A JP 2001298611A JP 2001298611 A JP2001298611 A JP 2001298611A JP 3955967 B2 JP3955967 B2 JP 3955967B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- pitch
- audio signal
- subband
- fundamental frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
この発明は、音声信号雑音除去装置、音声信号雑音除去方法及びプログラムに関する。
【0002】
【従来の技術】
音声を表す音声信号に混入している雑音を除去する場合、従来は、音声信号をフィルタを用いてフィルタリングすることにより、音声が占める帯域のうち主要な部分(たとえば、300ヘルツ〜2キロヘルツ)以外の成分を雑音とみなして除去していた。
【0003】
【発明が解決しようとする課題】
しかし、雑音は必ずしも上述の主要な帯域の外にのみ混入するわけではなく、この主要な帯域内に混入した雑音は、音声信号をフィルタリングする上述の手法では除去できない。
また、この主要な帯域の外にも音声のスペクトル成分は分布するのであり、このようなスペクトル成分を除去することにより、音声の音質は著しく悪化する。
【0004】
この発明は、上記実状に鑑みてなされたものであり、音声信号と重なる帯域に混入した雑音を除去し、あるいは音声信号に混入した雑音を、音質を損なうことなく除去する音声信号雑音除去装置及び音声信号雑音除去方法を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記目的を達成すべく、この発明の第1の観点にかかる音声信号雑音除去装置は、
雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成手段と、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド抽出手段が生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタ手段と、
前記フィルタ手段によりフィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元手段と、を備え、
前記サブバンド抽出手段は、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタと、
参照用の音声を表す音声サンプルを記憶する記憶手段と、
前記記憶手段が記憶する音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記可変フィルタを制御するフィルタ特性決定手段と、
前記入力音声信号を、前記可変フィルタが抽出した当該入力音声信号の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出手段と、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定部と、を備える、
ことを特徴とする。
【0007】
前記フィルタ特性決定手段は、前記音声サンプルのケプストラムが極大値をとる周波数を前記参照用の音声の基本周波数として特定するケプストラム分析手段を備えるものであってもよい。
【0008】
前記ピッチ抽出手段は、前記可変フィルタが抽出した前記入力音声信号の基本周波数成分が所定値に達するタイミングを特定し、特定したタイミングに基づいて、前記区間の範囲を特定するクロス検出手段を備えていてもよい。
【0009】
また、この発明の第2の観点にかかる音声信号雑音除去方法は、
雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成ステップと、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出ステップと、
生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタリングステップと、
フィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元ステップと、より構成され、
前記サブバンド抽出ステップは、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタリングステップと、
参照用の音声を表す音声サンプルを記憶する記憶ステップと、
前記入力音声信号を、前記可変フィルタリングステップで抽出された当該入力音声信号の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出ステップと、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定ステップと、より構成されており、
前記可変フィルタリングステップでは、前記記憶ステップで記憶される音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記フィルタリングを行う、
ことを特徴とする。
【0010】
また、この発明の第3の観点にかかるプログラムは、
コンピュータを、
雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成手段と、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド抽出手段が生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタ手段と、
前記フィルタ手段によりフィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元手段と、
して機能させるためのプログラムであって、
前記サブバンド抽出手段は、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタと、
参照用の音声を表す音声サンプルを記憶する記憶手段と、
前記記憶手段が記憶する音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記可変フィルタを制御するフィルタ特性決定手段と、
前記入力音声信号を、前記可変フィルタが抽出した当該入力音声信号の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出手段と、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定部と、を備える、
ことを特徴とする。
【0011】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態を説明する。
図1は、この発明の実施の形態に係る音声信号雑音除去器の構成を示す図である。図示するように、この音声信号雑音除去器は、音声データ入力部1と、音声サンプル記憶部2と、ケプストラム解析部3と、可変型BPF(Band Pass Filter)4と、ピッチ抽出部5と、ピッチ長固定部6と、サブバンド分割部7と、適応型LPF(Low Pass Filter)8と、サブバンド合成部9と、音声データ出力部10とより構成されている。
【0012】
音声データ入力部1は、例えば、記録媒体(例えば、フレキシブルディスクやMO(Magneto Optical disk)など)に記録されたデータを読み取る記録媒体ドライバ(フレキシブルディスクドライブや、MOドライブなど)等より構成されている。
音声データ入力部1は、音声の波形を表す音声データを取得して、可変型BPF4及びピッチ長固定部5に供給する。
【0013】
なお、音声データは、PCM(Pulse Code Modulation)変調されたディジタル信号の形式を有しており、音声のピッチより十分短い一定の周期でサンプリングされた音声を表しているものとする。
【0014】
音声サンプル記憶部2は、ハードディスク装置等の記憶装置と、ハードディスクコントローラ等の制御回路とより構成されている。
音声サンプル記憶部2は、雑音を除去する対象の音声と同一の話者が発声した音声の波形を表す音声サンプルを、ユーザの操作に従って記憶する。そして、記憶する音声サンプルを読み出し、ケプストラム解析部3へと供給する。
なお、音声サンプルも、PCM変調されたディジタル信号の形式を有しており、音声のピッチより十分短い一定の周期でサンプリングされた音声を表しているものとする。
【0015】
ケプストラム解析部3、可変型BPF4、ピッチ抽出部5、ピッチ長固定部6、サブバンド分割部7、適応型LPF8、サブバンド合成部9及び音声データ出力部10は、いずれも、DSP(Digital Signal Processor)やCPU(Central Processing Unit)等のデータ処理装置より構成されている。なお、ケプストラム解析部3、可変型BPF4、ピッチ抽出部5、ピッチ長固定部6、サブバンド分割部7、適応型LPF8、サブバンド合成部9及び音声データ出力部10の一部又は全部の機能を単一のデータ処理装置が行うようにしてもよい。
【0016】
ケプストラム解析部3は、音声サンプル記憶部2より供給される音声サンプルにケプストラム分析を施すことにより、この音声サンプルが表す音声の基本周波数を特定し、特定した基本周波数を可変型BPF4の中心周波数(可変型BPF4の通過帯域の中央の周波数)とするように、可変型BPF4の周波数特性を制御する。
【0017】
具体的には、ケプストラム解析部3は、音声サンプル記憶部2より音声サンプルを供給されると、まず、この音声サンプルの強度を、元の値の対数に実質的に等しい値へと変換する。(対数の底は任意であり、例えば常用対数などでよい。)
【0018】
次に、ケプストラム解析部3は、値が変換された音声サンプルのスペクトル(すなわち、ケプストラム)を、高速フーリエ変換の手法(あるいは、離散的変数をフーリエ変換した結果を表すデータを生成する他の任意の手法)により求める。
【0019】
そして、このケプストラムの極大値を与える周波数のうちの最小値を基本周波数として特定し、特定した基本周波数を可変型BPF4の中心周波数とするように、可変型BPF4の周波数特性を制御する。
【0020】
可変型BPF4は、中心周波数が可変なFIR(Finite Impulse Response)型のフィルタの機能を行う。
具体的には、可変型BPF4は、自己の中心周波数を、ケプストラム解析部3の制御に従った値に設定する。そして、音声データ入力部1より供給される音声データをフィルタリングして、フィルタリングされた音声データ(ピッチ信号)を、ピッチ抽出部5の後述するゼロクロス解析部51及び波形相関解析部52へと供給する。ピッチ信号は、音声データのサンプルリング間隔と実質的に同一のサンプリング間隔を有するディジタル形式のデータからなるものとする。
なお、可変型BPF4の帯域幅は、可変型BPF4の通過帯域の上限が音声データの表す音声の基本周波数の2倍以内に常に収まるような帯域幅であることが望ましい。
【0021】
ピッチ抽出部5は、機能的には、たとえば図2に示すように、ゼロクロス解析部51、波形相関解析部52及び位相調整部53より構成されている。なお、ゼロクロス解析部51、波形相関解析部52及び位相調整部53の一部又は全部の機能を単一のデータ処理装置が行うようにしてもよい。
【0022】
ゼロクロス解析部51は、可変型BPF4から供給されたピッチ信号の瞬時値が0となる時刻(ゼロクロスする時刻)が来るタイミングを特定し、特定したタイミングを表す信号(ゼロクロス信号)を、波形相関解析部52へと供給する。
ただし、ゼロクロス解析部51は、ピッチ信号の瞬時値が0でない所定の値となる時刻が来るタイミングを特定し、特定したタイミングを表す信号を、ゼロクロス信号に代えて波形相関解析部52へと供給するようにしてもよい。
【0023】
波形相関解析部52は、音声データ入力部1より音声データを供給され、波形相関解析部52よりピッチ信号を供給されると、ピッチ信号の単位周期(例えば1周期)の境界が来るタイミングで音声データを区切る。そして、区切られてできる区間のそれぞれについて、この区間内の音声データの位相を種々変化させたものとこの区間内のピッチ信号との相関を求め、最も相関が高くなるときの音声データの位相を、この区間内の音声データの位相として特定する。
【0024】
具体的には、波形相関解析部52は、それぞれの区間毎に、例えば、数式1の右辺により表される値corを、位相を表すφ(ただし、φは0以上の整数)の値を種々変化させた場合それぞれについて求める。そして、波形相関解析部52は、値corが最大になるようなφの値Ψを特定し、値Ψを示すデータを生成して、この区間内の音声データの位相を表す位相データとして位相調整部53に供給する。
【0025】
【数1】
【0026】
なお、区間の時間的な長さは、1ピッチ分程度であることが望ましい。区間が長いほど、区間内のサンプル数が増えてピッチ波形信号のデータ量が増大し、あるいは、サンプリング間隔が増大してピッチ波形信号が表す音声が不正確になる、という問題が生じる。
【0027】
位相調整部53は、音声データ入力部1より音声データを供給され、波形相関解析部52より音声データの各区間の位相Ψを示すデータを供給されると、それぞれの区間の音声データの位相を、位相データが示すこの区間の位相Ψに等しくなるように移相する。そして、移相された音声データをピッチ長固定部6に供給する。
【0028】
ピッチ長固定部6は、移相された音声データを位相調整部53より供給されると、この音声データの各区間をサンプリングし直し(リサンプリングし)、リサンプリングされた音声データを、サブバンド分割部7に供給する。なお、ピッチ長固定部6は、音声データの各区間のサンプル数が互いにほぼ等しくなるようにして、同一区間内では等間隔になるようリサンプリングする。
また、ピッチ長固定部6は、各区間の元のサンプル数を示すサンプル数データを生成し、音声データ出力部10に供給する。音声データ入力部1が取得し音声データのサンプリング間隔が既知であるとものとすれば、サンプル数データは、この音声データの単位ピッチ分の区間の元の時間長を表す情報として機能する。
【0029】
サブバンド分割部7は、ピッチ長固定部6より供給された音声データにDCT(Discrete Cosine Transform)等の直交変換を施すことにより、サブバンドデータを生成する。そして、生成したサブバンドデータを適応型LPF8へと供給する。
【0030】
サブバンドデータは、サブバンド分割部7に供給された音声データが表す音声の基本周波数成分の強度の時間変化を表すデータと、この音声のn個(nは自然数)の高調波成分の強度の時間変化を表すn個のデータとを含むデータである。従って、サブバンドデータは、音声の基本周波数成分(又は高調波成分)の強度の時間変化がないとき、この基本周波数成分(又は高調波成分)の強度を、直流信号の形で表す。
【0031】
適応型LPF8は、サブバンド分割部7より供給されるサブバンドデータを構成する上述の計(n+1)個のデータを、LMS(Least Mean Square)アルゴリズム等の手順に従ってそれぞれフィルタリングし、フィルタリングされたサブバンドデータを、サブバンド合成部9へと供給する。
適応型LPF8がフィルタリングを行うことにより、サブバンドデータが表す(n+1)個の各周波数成分(基本周波数成分又は高調波成分)の強度の時間変化のうち、周期性のある成分が実質的に除去される。
【0032】
サブバンド合成部9は、適応型LPF8より供給されたサブバンドデータに変換を施すことにより、このサブバンドデータにより各周波数成分の強度が表されるような音声データを生成する。そして、生成した音声データを音声データ出力部10へと供給する。なお、サブバンド合成部9が生成する音声データは、たとえばPCM変調されたディジタル信号の形式を有していればよい。
【0033】
サブバンド合成部9がサブバンドデータに施す変換は、このサブバンドデータを生成するために音声データに施した変換に対して実質的に逆変換の関係にあるような変換である。具体的には、たとえばこのサブバンドデータが音声データにDCTを施して生成されたものである場合、サブバンド合成部9は、このサブバンドデータにIDCT(Inverse DCT)を施すようにすればよい。
【0034】
音声データ出力部10は、サブバンド合成部9より供給された音声データの各区間を、ピッチ長固定部6より供給されるサンプル数データが示すサンプル数でリサンプリングすることにより、各区間の時間長を、ピッチ長固定部6で変更される前の時間長に復元する。そして、音声データ出力部10は、区間の時間長を復元された音声データを出力する。
【0035】
この音声信号雑音除去器に入力された音声データは、ピッチ長固定部6によって単位ピッチ分の区間の時間長を規格化され、ピッチのゆらぎの影響を除去される。このため、サブバンド分割部7により生成されるサブバンドデータは、音声データが表す、雑音除去の対象の音声の各周波数成分(基本周波数成分及び高調波成分)の強度の時間変化を正確に表すものとなる。
従って、各周波数成分をフィルタリングすることにより、雑音除去の対象である音声の各周波数成分を失うことなく、この音声の帯域内に混入した雑音が効果的に除去される。
【0036】
また、雑音除去の対象である音声のピッチを表すピッチ信号は、音声サンプルの基本周波数を中心周波数とする可変型BPFを用いて音声データをフィルタリングすることにより得られている。このため、音声サンプルの内容を、雑音除去の対象である音声と話者が同一な音声を表すものとしておくことにより、異なる話者の音声を雑音として効果的に除去することができる。
【0037】
なお、このピッチ波形抽出システムの構成は上述のものに限られない。
たとえば、音声データ入力部1は、電話回線、専用回線、衛星回線等の通信回線を介して外部より音声データを取得するようにしてもよい。この場合、音声データ入力部1は、例えばモデムやDSU(Data Service Unit)等からなる通信制御部を備えていればよい。
【0038】
また、音声データ入力部1は、マイクロフォン、AF(Audio Frequency)増幅器、サンプラー、A/D(Analog-to-Digital)コンバータ及びPCMエンコーダなどからなる集音装置を備えていてもよい。集音装置は、自己のマイクロフォンが集音した音声を表す音声信号を増幅し、サンプリングしてA/D変換した後、サンプリングされた音声信号にPCM変調を施すことにより、音声データを取得すればよい。なお、音声データ入力部1が取得する音声データは、必ずしもPCM信号である必要はない。
【0039】
また、音声データ出力部10は、音声データを、通信回線を介して外部に供給するようにしてもよい。この場合、音声データ出力部10は、モデムやDSU等からなる通信制御部を備えていればよい。
また、音声データ出力部10は、音声データを、外部の記録媒体や、ハードディスク装置等からなる外部の記憶装置に書き込むようにしてもよい。この場合、音声データ出力部10は、記録媒体ドライバや、ハードディスクコントローラ等の制御回路を備えていればよい。
【0040】
また、音声データ出力部10は、PCMデコーダ、D/A(Digital-to-Analog)コンバータ、AF増幅器及びスピーカなどからなる音声再生装置を備えていてもよい。音声再生装置は、区間の時間長を復元された音声データがPCM変調形式のデジタル信号である場合この音声データを復調し、D/A変換及び増幅を行い、得られたアナログ信号を用いてスピーカを駆動することにより音声を再生すればよい。
【0041】
以上、この発明の実施の形態を説明したが、この発明にかかる音声信号雑音除去装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
例えば、パーソナルコンピュータに上述の音声データ入力部1、音声サンプル記憶部2、ケプストラム解析部3、可変型BPF4、ピッチ抽出部5、ピッチ長固定部6、サブバンド分割部7、適応型LPF8、サブバンド合成部9及び音声データ出力部10の動作を実行させるためのプログラムを格納した媒体(CD−ROM、MO、フレキシブルディスク等)から該プログラムをインストールすることにより、上述の処理を実行する音声信号雑音除去器を構成することができる。
【0042】
また、例えば、通信回線の掲示板(BBS)にこのプログラムを掲示し、これを通信回線を介して配信してもよく、また、このプログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調してこのプログラムを復元するようにしてもよい。
そして、このプログラムを起動し、OSの制御下に、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行することができる。
【0043】
なお、OSが処理の一部を分担する場合、あるいは、OSが本願発明の1つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする。
【0044】
【発明の効果】
以上説明したように、この発明によれば、音声信号と重なる帯域に混入した雑音を除去し、あるいは音声信号に混入した雑音を、音質を損なうことなく除去する音声信号雑音除去装置及び音声信号雑音除去方法が実現される。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る音声信号雑音除去器の構成を示すブロック図である。
【図2】ピッチ抽出部の構成を示すブロック図である。
【符号の説明】
1 音声データ入力部
2 音声サンプル記憶部
3 ケプストラム解析部
4 可変型BPF
5 ピッチ抽出部
6 ピッチ長固定部
7 サブバンド分割部
8 適応型LPF
9 サブバンド合成部
10 音声出力部
51 ゼロクロス解析部
52 波形相関解析部
53 位相調整部
Claims (5)
- 雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成手段と、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド抽出手段が生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタ手段と、
前記フィルタ手段によりフィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元手段と、を備え、
前記サブバンド抽出手段は、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタと、
参照用の音声を表す音声サンプルを記憶する記憶手段と、
前記記憶手段が記憶する音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記可変フィルタを制御するフィルタ特性決定手段と、
前記入力音声信号を、前記可変フィルタが抽出した当該入力音声信号の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出手段と、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定部と、を備える、
ことを特徴とする音声信号雑音除去装置。 - 前記フィルタ特性決定手段は、前記音声サンプルのケプストラムが極大値をとる周波数を前記参照用の音声の基本周波数として特定するケプストラム分析手段を備える、
ことを特徴とする請求項1に記載の音声信号雑音除去装置。 - 前記ピッチ抽出手段は、前記可変フィルタが抽出した前記入力音声信号の基本周波数成分が所定値に達するタイミングを特定し、特定したタイミングに基づいて、前記区間の範囲を特定するクロス検出手段を備える、
ことを特徴とする請求項2に記載の音声信号雑音除去装置。 - 雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成ステップと、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出ステップと、
生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタリングステップと、
フィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元ステップと、より構成され、
前記サブバンド抽出ステップは、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタリングステップと、
参照用の音声を表す音声サンプルを記憶する記憶ステップと、
前記入力音声信号を、前記可変フィルタリングステップで抽出された当該入力音声信号 の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出ステップと、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定ステップと、より構成されており、
前記可変フィルタリングステップでは、前記記憶ステップで記憶される音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記フィルタリングを行う、
ことを特徴とする音声信号雑音除去方法。 - コンピュータを、
雑音除去の対象である音声の波形を表す入力音声信号を取得し、当該入力音声信号の単位ピッチ分にあたる区間の時間長を実質的に同一に揃えることにより、当該入力音声信号をピッチ波形信号へと加工するピッチ波形信号生成手段と、
ピッチ波形信号に基づき、前記入力音声信号の基本周波数成分及び高調波成分の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド抽出手段が生成したサブバンド信号をフィルタリングすることにより、当該サブバンド信号が表す基本周波数成分及び高調波成分の時間変化のうち周期性を有する成分を実質的に除去するフィルタ手段と、
前記フィルタ手段によりフィルタリングされたサブバンド信号が表す基本周波数成分及び高調波成分を有する音声を表す出力音声信号を生成する音声信号復元手段と、
して機能させるためのプログラムであって、
前記サブバンド抽出手段は、
制御に従って周波数特性を変化させ、入力音声信号をフィルタリングすることにより、当該入力音声信号の基本周波数成分を抽出する可変フィルタと、
参照用の音声を表す音声サンプルを記憶する記憶手段と、
前記記憶手段が記憶する音声サンプルに基づいて前記参照用の音声の基本周波数を特定し、特定した基本周波数近傍の成分以外が遮断されるような周波数特性になるように前記可変フィルタを制御するフィルタ特性決定手段と、
前記入力音声信号を、前記可変フィルタが抽出した当該入力音声信号の基本周波数成分の値に基づき、単位ピッチ分の音声信号からなる区間へと区切るピッチ抽出手段と、
前記入力音声信号の各前記区間内を互いに実質的に同数の標本でサンプリングすることにより、各該区間内の時間長が実質的に同一に揃ったピッチ波形信号を生成するピッチ長固定部と、を備える、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001298611A JP3955967B2 (ja) | 2001-09-27 | 2001-09-27 | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001298611A JP3955967B2 (ja) | 2001-09-27 | 2001-09-27 | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003108200A JP2003108200A (ja) | 2003-04-11 |
JP3955967B2 true JP3955967B2 (ja) | 2007-08-08 |
Family
ID=19119488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001298611A Expired - Lifetime JP3955967B2 (ja) | 2001-09-27 | 2001-09-27 | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3955967B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005266797A (ja) * | 2004-02-20 | 2005-09-29 | Sony Corp | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 |
EP1755111B1 (en) | 2004-02-20 | 2008-04-30 | Sony Corporation | Method and device for detecting pitch |
JP4599558B2 (ja) | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
JP2007110451A (ja) * | 2005-10-13 | 2007-04-26 | Kenwood Corp | 音声信号調整装置、音声信号調整方法及びプログラム |
WO2008001779A1 (fr) * | 2006-06-27 | 2008-01-03 | National University Corporation Toyohashi University Of Technology | procédé d'estimation de fréquence de référence et système d'estimation de signal acoustique |
JP5089295B2 (ja) | 2007-08-31 | 2012-12-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理システム、方法及びプログラム |
WO2014084162A1 (ja) * | 2012-11-27 | 2014-06-05 | 国立大学法人九州工業大学 | 信号雑音除去装置、その方法及びプログラム |
KR101626280B1 (ko) * | 2014-11-05 | 2016-06-01 | 주식회사 디오텍 | 합성음의 고조파 성분 제거 방법 및 장치 |
CN113948685B (zh) * | 2021-09-09 | 2023-11-28 | 广州理文科技有限公司 | 一种锂离子电池硅基复合负极材料及其制备方法 |
-
2001
- 2001-09-27 JP JP2001298611A patent/JP3955967B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003108200A (ja) | 2003-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7676361B2 (en) | Apparatus, method and program for voice signal interpolation | |
TWI505264B (zh) | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 | |
US6836739B2 (en) | Frequency interpolating device and frequency interpolating method | |
EP1422693A1 (en) | PITCH WAVEFORM SIGNAL GENERATION APPARATUS, PITCH WAVEFORM SIGNAL GENERATION METHOD, AND PROGRAM | |
JP4254479B2 (ja) | オーディオ帯域拡張再生装置 | |
KR20060004695A (ko) | 오디오 신호의 대역을 확장하기 위한 방법 및 장치 | |
JP3955967B2 (ja) | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム | |
US7400651B2 (en) | Device and method for interpolating frequency components of signal | |
JP3810257B2 (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
JPH07160299A (ja) | 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式 | |
JP3576941B2 (ja) | 周波数間引き装置、周波数間引き方法及び記録媒体 | |
JP3576942B2 (ja) | 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体 | |
CN101228578A (zh) | 高频信号插值方法以及高频信号插值装置 | |
JP3875890B2 (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP3976169B2 (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP2007110451A (ja) | 音声信号調整装置、音声信号調整方法及びプログラム | |
JP4256189B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法及びプログラム | |
JP5083884B2 (ja) | 周波数変換装置 | |
JP2007108440A (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
JP2003216171A (ja) | 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム | |
JP3576951B2 (ja) | 周波数間引き装置、周波数間引き方法及び記録媒体 | |
JP3397348B2 (ja) | 音信号処理方法 | |
AU2012216539B2 (en) | Device and method for manipulating an audio signal having a transient event | |
JP2003241777A (ja) | 楽音のフォルマント抽出方法、記録媒体及び楽音のフォルマント抽出装置 | |
JP2003233378A (ja) | 楽音生成装置および楽音生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20031217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070416 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3955967 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 5 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130518 Year of fee payment: 6 |