JP2007108440A - 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム - Google Patents
音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム Download PDFInfo
- Publication number
- JP2007108440A JP2007108440A JP2005299346A JP2005299346A JP2007108440A JP 2007108440 A JP2007108440 A JP 2007108440A JP 2005299346 A JP2005299346 A JP 2005299346A JP 2005299346 A JP2005299346 A JP 2005299346A JP 2007108440 A JP2007108440 A JP 2007108440A
- Authority
- JP
- Japan
- Prior art keywords
- component
- data
- signal
- audio
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】コンピュータC1は、圧縮する音声データの単位ピッチ分にあたる区間の時間長を同一に揃えることによりピッチ波形信号を生成し、このピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成する。そして、このサブバンド信号を、所定の基準に合致する程度の周期性を有する成分からなる連続成分と、その他の成分からなるランダム成分とに分離し、連続成分に、エントロピー符号化又は線形予測符号化を施す。
【選択図】図1
Description
音声合成では、例えば、テキストデータが表す文に含まれる単語、文節及び文節相互の係り受け関係が特定され、特定された単語、文節及び係り受け関係に基づいて、文の読み方が特定される。そして、特定した読み方を表す表音文字列に基づき、音声を構成する音素の波形や継続時間やピッチ(基本周波数)のパターンが決定され、決定結果に基づいて漢字かな混じり文全体を表す音声の波形が決定され、決定された波形を有するような音声が出力される。
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、を備える、
ことを特徴とする。
音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工する音声信号加工手段と、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、を備える、
ことを特徴とする。
前記成分分離手段は、抽出された前記ピッチ成分の強度に基づき、前記連続成分及び前記ランダム成分を分離するか否かを決定し、分離すると決定したとき、前記連続成分及び前記ランダム成分を前記サブバンド信号より分離するものであってもよい。
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元する復号化手段と、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元するサブバンド信号復元部と、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する音声信号復元手段と、を備える、
ことを特徴とする。
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成し、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離し、
前記連続成分にエントロピー符号化又は線形予測符号化を施す、
ことを特徴とする。
音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工し、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成し、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離し、
前記連続成分にエントロピー符号化又は線形予測符号化を施す、
ことを特徴とする。
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元し、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元し、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する、
ことを特徴とする。
コンピュータを、
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、
して機能させるためのものであることを特徴とする。
コンピュータを、
音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工する音声信号加工手段と、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、
して機能させるためのものであることを特徴とする。
コンピュータを、
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元する復号化手段と、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元するサブバンド信号復元部と、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する音声信号復元手段と、
して機能させるためのものであることを特徴とする。
(第1の実施の形態)
図1は、この発明の第1の実施の形態に係る音声データ圧縮システムの構成を示す図である。図示するように、この音声データ圧縮システムは、記録媒体(例えば、フレキシブルディスクやCD−R(Compact Disc-Recordable)など)に記録されたデータを読み取る記録媒体ドライブ装置(フレキシブルディスクドライブや、CD−ROMドライブなど)SMDと、記録媒体ドライブ装置SMDに接続されたコンピュータC1とより構成されている。
次に、この音声データ圧縮システムの動作を、図2及び図3を参照して説明する。図2及び図3は、図1の音声データ圧縮システムの動作の流れを示す図である。
記録媒体より読み出した音声データのサンプリング間隔が既知であるものとすれば、サンプル数データは、この音声データの単位ピッチ分の区間の元の時間長を表す情報として機能する。
(なお、以下では、k番目(kは0以上n以下の整数)のサブバンドデータより分離された連続成分データをk番目の連続成分データと呼び、また、k番目のサブバンドデータより分離されたランダム成分データをk番目のランダム成分データと呼ぶ。)
そして、ステップS114でコンピュータC1が行う処理は、「サブバンドデータ群のうち人が発声する音声に起因しない成分の存在を無視し、サブバンドデータ群の全成分を、人が発声する音声の成分を表すものとして扱ってよいか否か」を判定する処理に相当するものであって、人が発声する音声に起因しない成分を無視できない(具体的には、ピッチ信号の振幅が所定量に達していない)と判別した場合には、サブバンドデータを、人が発声する音声に起因すると考えられる成分と、起因しないと考えられる成分とに分離する、という処理に相当するものである。
また、ステップS117でコンピュータC1は、決定した圧縮特性を示す圧縮特性データを作成する。
(ただし、sgn(α)=(α/|α|)、xiは、連続成分データの波形の瞬時値、global_gain(xi)は、フルスケールを設定するためのxiの関数)
たとえば、コンピュータC1は、外部からシリアル伝送される音声データを、シリアル通信制御部を介して取得するようにしてもよい。また、電話回線、専用回線、衛星回線等の通信回線を介して外部より音声データを取得するようにしてもよく、この場合、コンピュータC1は、例えばモデムやDSU(Data Service Unit)等を備えていればよい。また、記録媒体ドライブ装置SMD以外から音声データを取得するならば、コンピュータC1は必ずしも記録媒体ドライブ装置SMDを備えている必要はない。
しかし、初期位相αを0とし、且つ、ピッチ信号がゼロクロスするタイミングで音声データを区切るようにすれば、各区間の始点の値は0に近い値になるので、音声データを各区間へと区切ることに各区間が含むようになるノイズの量が少なくなる。
また、圧縮する対象の音声データのピッチのゆらぎが無視できる程度であれば、コンピュータC1は、当該音声データの移相を行う必要はなく、当該音声データをピッチ波形データと同視してステップS113以降の処理を行うようにしてもよい。また、音声データの補間やリサンプリングも、必ずしも必要な処理ではない。
次に、この発明の第2の実施の形態に係る音声データ再生システムを説明する。
この音声データ再生システムは、図1に示す音声データ圧縮システムの構成と実質的に同一の物理的構成を有している。ただし、この音声データ再生システムを構成するコンピュータC1は音声データ再生プログラムを予め記憶していて、この音声データ再生プログラムを実行することにより、後述する処理を行うものとする。
そして、コンピュータC1は、各区間の時間長を変更されたピッチ波形データ、すなわち復元された音声データを出力する(ステップS207)。
たとえば、この音声データ再生システムを構成するコンピュータC1も、外部からシリアル伝送される連続成分圧縮データ、ランダム成分圧縮データ及びサンプル数データを、シリアル通信制御部を介して取得するようにしてもよい。また、通信回線を介して外部より連続成分圧縮データ、ランダム成分圧縮データ及びサンプル数データを取得するようにしてもよく、この場合、コンピュータC1は、例えばモデムやDSU等を備えていればよい。また、記録媒体ドライブ装置SMD以外から連続成分圧縮データ、ランダム成分データ及びサンプル数データを取得するならば、コンピュータC1は必ずしも記録媒体ドライブ装置SMDを備えている必要はない。
次に、この発明の第3の実施の形態を説明する。
図6は、この発明の第3の実施の形態に係る音声データ圧縮システムの構成を示す図である。図示するように、この音声データ圧縮システムは、音声入力部E1と、ピッチ波形抽出部E2と、サブバンド解析部E3と、成分分離部E4と、データ圧縮部E5と、出力部E6とより構成されている。
音声入力部E1は、音声の波形を表す音声データを、この音声データが記録された記録媒体から読み取る等して取得し、ピッチ波形抽出部E2に供給する。なお、音声データは、PCM変調されたディジタル信号の形式を有しており、音声のピッチより十分短い一定の周期でサンプリングされた音声を表しているものとする。
なお、ピッチ波形抽出部E2、サブバンド解析部E3、成分分離部E4及びデータ圧縮部E5の一部又は全部の機能を単一のプロセッサが行うようにしてもよい。
また、ピッチ波形抽出部E2は、後述するピッチ信号を生成し、後述するように自らこのピッチ信号を用いるととともに、このピッチ信号を成分分離部E4へと供給する。
また、ピッチ波形抽出部E2は、この音声データの各区間の元のサンプル数を示すサンプル数データを生成し、出力部E6へと供給する。
すなわち、まず、ケプストラム解析部E201は、音声入力部E1より供給される音声データにケプストラム解析を施すことにより、この音声データが表す音声の基本周波数を特定し、特定した基本周波数を示すデータを生成して重み計算部E203へと供給する。
次に、ケプストラム解析部E201は、値が変換された音声データのスペクトル(すなわち、ケプストラム)を、高速フーリエ変換の手法(あるいは、離散的変数をフーリエ変換した結果を表すデータを生成する他の任意の手法)により求める。
そして、このケプストラムの極大値を与える周波数のうちの最小値を基本周波数として特定し、特定した基本周波数を示すデータを生成して重み計算部E203へと供給する。
具体的には、バンドパスフィルタE205は、自己の中心周波数を、BPF係数計算部E204の制御に従った値に設定する。そして、音声入力部E1より供給される音声データをフィルタリングして、フィルタリングされた音声データ(ピッチ信号)を、ゼロクロス解析部E206、波形相関解析部E207及び成分分離部E4の後述する連続成分抽出部E41−0〜E41−nへと供給する。ピッチ信号は、音声データのサンプルリング間隔と実質的に同一のサンプリング間隔を有するディジタル形式のデータからなるものとする。
なお、バンドパスフィルタE205の帯域幅は、バンドパスフィルタE205の通過帯域の上限が音声データの表す音声の基本周波数の2倍以内に常に収まるような帯域幅であることが望ましい。
ただし、ゼロクロス解析部E206は、ピッチ信号の瞬時値が0でない所定の値となる時刻が来るタイミングを特定し、特定したタイミングを表す信号を、ゼロクロス信号に代えてBPF係数計算部E204へと供給するようにしてもよい。
連続成分抽出部E41−k(kは0以上n以下の整数)は、バンドパスフィルタE205より供給されるピッチ信号の振幅が所定量に達しているか否かを判別する。そして、所定量に達していないと判別された期間は、サブバンド解析部E3より供給されるサブバンドデータ群に含まれるk番目のサブバンドデータをフィルタリングすることにより、k番目のサブバンドデータのうち一定程度以上に強い周期性を有する成分(以下、k番目の連続成分データと呼ぶ)を抽出し、抽出されたk番目の連続成分データを、ランダム成分抽出部E42−k及びデータ圧縮部E5へと供給する。
一方、ピッチ信号の振幅が所定量に達していると判別された期間は、k番目のサブバンドデータのフィルタリングを行う代わりに、k番目のサブバンドデータをそのままk番目の連続成分データとしてランダム成分抽出部E42−k及びデータ圧縮部E5へと供給する。
従って、k番目のサブバンドデータについて、人が発声する音声に起因しない成分を無視できない判別されている場合には、当該k番目のサブバンドデータのうち周期性が一定程度に達しない成分がk番目のランダム成分データとなり、また、k番目のサブバンドデータが人の発声した音声の成分のみからなるとみなしてよい旨判別されている場合には、k番目の連続成分データの強度は実質的に0となる。
そして、非線形量子化部E51は、生成したこれらの非線形量子化連続成分データ及び非線形量子化ランダム成分データを、エントロピー符号化部E53へと供給する。ただし強度が0であるランダム成分については、非線形量子化ランダム成分データを生成する必要はない。
たとえば、音声入力部E1は、電話回線、専用回線、衛星回線等の通信回線を介して外部より音声データを取得するようにしてもよい。この場合、音声入力部E1は、例えばモデムやDSU等からなる通信制御部を備えていればよい。
また、補間部E209は移相された音声データの補間を必ずしもラグランジェ補間の手法により行う必要はなく、例えば直線補間の手法によってもよいし、補間部E209を省略し、位相調整部E208は音声データを直ちにピッチ長調整部E210に供給してもよい。
また、出力部E6は、記録媒体ドライブ装置を備えていてもよく、この場合、出力部E6は、連続成分圧縮データやランダム成分圧縮データやサンプル数データを、この記録媒体ドライブ装置にセットされた記録媒体の記憶領域に書き込むようにしてもよい。
なお、単一のモデムやDSUや記録媒体ドライブ装置が音声入力部E1及び出力部E6を構成していてもよい。
次に、この発明の第4の実施の形態を、音声データ再生システムを例として説明する。
この音声データ再生システムは、図10に示すように、データ入力部D1と、エントロピー符号復号化部D2と、非線形逆量子化部D3と、成分結合部D4と、サブバンド合成部D5と、音声データ復元部D6と、音声合成部D7とより構成されている。
そして、音声データ復元部D6は、各区間の時間長を変更されたピッチ波形データ、すなわち復元された音声データを出力する。
SMD 記録媒体ドライブ装置
E1 音声入力部
E2 ピッチ波形抽出部
E201 ケプストラム解析部
E202 自己相関解析部
E203 重み計算部
E204 BPF係数計算部
E205 バンドパスフィルタ
E206 ゼロクロス解析部
E207 波形相関解析部
E208 位相調整部
E209 補間部
E210 ピッチ長調整部
E3 サブバンド解析部
E4 成分分離部
E41−0〜E41−n 連続成分抽出部
E42−0〜E42−n ランダム成分抽出部
E5 データ圧縮部
E51 非線形量子化部
E52 圧縮率設定部
E53 エントロピー符号化部
E6 出力部
D1 データ入力部
D2 エントロピー符号復号化部
D3 非線形逆量子化部
D4 成分結合部
D5 サブバンド合成部
D6 音素データ復元部
D7 音声合成部
Claims (14)
- 音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、を備える、
ことを特徴とする音声信号圧縮装置。 - 音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工する音声信号加工手段と、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、を備える、
ことを特徴とする音声信号圧縮装置。 - 前記圧縮対象の音声信号より、前記音声のピッチ成分を抽出するピッチ成分抽出手段を備え、
前記成分分離手段は、抽出された前記ピッチ成分の強度に基づき、前記連続成分及び前記ランダム成分を分離するか否かを決定し、分離すると決定したとき、前記連続成分及び前記ランダム成分を前記サブバンド信号より分離する、
ことを特徴とする請求項1又は2に記載の音声信号圧縮装置。 - 前記成分分離手段は、前記連続成分及び前記ランダム成分を分離しないと決定したとき、前記サブバンド信号を前記連続成分として扱うことを決定する、
ことを特徴とする請求項3に記載の音声信号圧縮装置。 - 前記符号化手段は、前記連続成分を非線形量子化した結果、及び/又は前記ランダム成分を非線形量子化した結果にエントロピー符号化を施す、
ことを特徴とする請求項1乃至4のいずれか1項に記載の音声信号圧縮装置。 - 前記符号化手段は、前記非線形量子化の量子化特性を示すデータを生成する、
ことを特徴とする請求項5に記載の音声信号圧縮装置。 - 前記符号化手段は、過去にエントロピー符号化された連続成分及び/又はランダム成分のデータ量に基づいて、前記非線形量子化の量子化特性を決定し、決定した量子化特性に合致するように前記非線形量子化を行う、
ことを特徴とする請求項5又は6に記載の音声信号圧縮装置。 - 音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元する復号化手段と、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元するサブバンド信号復元部と、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する音声信号復元手段と、を備える、
ことを特徴とする音声信号復元装置。 - 音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成し、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離し、
前記連続成分にエントロピー符号化又は線形予測符号化を施す、
ことを特徴とする音声信号圧縮方法。 - 音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工し、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成し、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離し、
前記連続成分にエントロピー符号化又は線形予測符号化を施す、
ことを特徴とする音声信号圧縮方法。 - 音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元し、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元し、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する、
ことを特徴とする音声信号復元方法。 - コンピュータを、
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、
して機能させるためのプログラム。 - コンピュータを、
音声の波形を表す圧縮対象の音声信号を取得し、当該音声信号を当該音声の単位ピッチ分の複数の区間に区切った場合におけるこれらの区間の位相を実質的に同一に揃えることによって、当該音声信号をピッチ波形信号へと加工する音声信号加工手段と、
前記ピッチ波形信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号を生成するサブバンド抽出手段と、
前記サブバンド信号より、所定の基準に合致する程度の周期性を有する連続成分、及び、当該サブバンド信号より前記連続成分を除いたものに相当するランダム成分を分離する成分分離手段と、
前記連続成分にエントロピー符号化又は線形予測符号化を施す符号化手段と、
して機能させるためのプログラム。 - コンピュータを、
音声の波形を表す圧縮対象の音声信号の基本周波数成分及び高調波成分の強度の時間変化を表すサブバンド信号のうち所定の基準に合致する程度の周期性を有する連続成分を抽出してエントロピー符号化又は線形予測符号化を施したものに相当する入力信号を取得し、当該入力信号を復号化することにより当該連続成分を復元する復号化手段と、
復元された前記連続成分を前記サブバンド信号より除いたものに相当するランダム成分を取得し、当該連続成分に当該ランダム成分を加算することにより、当該サブバンド信号を復元するサブバンド信号復元部と、
復元されたサブバンド信号に基づいて前記圧縮対象の音声信号を復元する音声信号復元手段と、
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005299346A JP4736699B2 (ja) | 2005-10-13 | 2005-10-13 | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005299346A JP4736699B2 (ja) | 2005-10-13 | 2005-10-13 | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007108440A true JP2007108440A (ja) | 2007-04-26 |
JP4736699B2 JP4736699B2 (ja) | 2011-07-27 |
Family
ID=38034345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005299346A Expired - Fee Related JP4736699B2 (ja) | 2005-10-13 | 2005-10-13 | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4736699B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014084162A1 (ja) * | 2012-11-27 | 2017-01-05 | 国立大学法人九州工業大学 | 信号雑音除去装置、その方法及びプログラム |
JP2017501427A (ja) * | 2013-10-18 | 2017-01-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
CN112908345A (zh) * | 2019-01-29 | 2021-06-04 | 桂林理工大学南宁分校 | 一种物联网语音压缩与解压方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305388A (ja) * | 1995-04-28 | 1996-11-22 | Matsushita Electric Ind Co Ltd | 音声区間検出装置 |
JP2004294969A (ja) * | 2003-03-28 | 2004-10-21 | Kenwood Corp | 音声信号圧縮装置、音声信号圧縮方法及びプログラム |
-
2005
- 2005-10-13 JP JP2005299346A patent/JP4736699B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305388A (ja) * | 1995-04-28 | 1996-11-22 | Matsushita Electric Ind Co Ltd | 音声区間検出装置 |
JP2004294969A (ja) * | 2003-03-28 | 2004-10-21 | Kenwood Corp | 音声信号圧縮装置、音声信号圧縮方法及びプログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014084162A1 (ja) * | 2012-11-27 | 2017-01-05 | 国立大学法人九州工業大学 | 信号雑音除去装置、その方法及びプログラム |
JP2017501427A (ja) * | 2013-10-18 | 2017-01-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
US9892735B2 (en) | 2013-10-18 | 2018-02-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding of spectral coefficients of a spectrum of an audio signal |
US10115401B2 (en) | 2013-10-18 | 2018-10-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding of spectral coefficients of a spectrum of an audio signal |
JP2018205758A (ja) * | 2013-10-18 | 2018-12-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
US10847166B2 (en) | 2013-10-18 | 2020-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding of spectral coefficients of a spectrum of an audio signal |
JP2020190751A (ja) * | 2013-10-18 | 2020-11-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
JP7218329B2 (ja) | 2013-10-18 | 2023-02-06 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
CN112908345A (zh) * | 2019-01-29 | 2021-06-04 | 桂林理工大学南宁分校 | 一种物联网语音压缩与解压方法 |
CN112908345B (zh) * | 2019-01-29 | 2022-05-31 | 桂林理工大学南宁分校 | 一种物联网语音压缩与解压方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4736699B2 (ja) | 2011-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7630883B2 (en) | Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals | |
KR100848324B1 (ko) | 음성 부호화 장치 및 그 방법 | |
JP2006011456A (ja) | 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体 | |
EP1422693A1 (en) | PITCH WAVEFORM SIGNAL GENERATION APPARATUS, PITCH WAVEFORM SIGNAL GENERATION METHOD, AND PROGRAM | |
RU2289858C2 (ru) | Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник | |
JP3881932B2 (ja) | 音声信号補間装置、音声信号補間方法及びプログラム | |
JP4736699B2 (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
JP2009253706A (ja) | 符号化装置、復号装置、符号化方法、復号方法及びプログラム | |
JP4256189B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法及びプログラム | |
JP3994332B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4407305B2 (ja) | ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム | |
JP3875890B2 (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP3976169B2 (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
KR100928966B1 (ko) | 저비트율 부호화/복호화방법 및 장치 | |
JP2002049399A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP3994333B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及び、プログラム | |
KR100359528B1 (ko) | 엠피 쓰리 인코더/디코더 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
KR20080112000A (ko) | 음색 유사성을 활용한 부호화/복호화 방법 | |
JP2003216171A (ja) | 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム | |
JP2000132195A (ja) | 信号符号化装置及び方法 | |
KR100940532B1 (ko) | 저비트율 복호화방법 및 장치 | |
KR20050058024A (ko) | 오디오 신호 코딩장치 및 코딩방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081008 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110215 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110418 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |