Nothing Special   »   [go: up one dir, main page]

JP2884163B2 - 符号化伝送装置 - Google Patents

符号化伝送装置

Info

Publication number
JP2884163B2
JP2884163B2 JP62037304A JP3730487A JP2884163B2 JP 2884163 B2 JP2884163 B2 JP 2884163B2 JP 62037304 A JP62037304 A JP 62037304A JP 3730487 A JP3730487 A JP 3730487A JP 2884163 B2 JP2884163 B2 JP 2884163B2
Authority
JP
Japan
Prior art keywords
section
signal
pitch
audio signal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62037304A
Other languages
English (en)
Other versions
JPS63204300A (ja
Inventor
智彦 谷口
衡平 伊勢田
晃二 岡崎
文雄 天野
重之 海上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62037304A priority Critical patent/JP2884163B2/ja
Priority to CA000559026A priority patent/CA1301072C/en
Priority to US07/156,882 priority patent/US4890325A/en
Priority to DE88102446T priority patent/DE3883799T2/de
Priority to EP88102446A priority patent/EP0279451B1/en
Publication of JPS63204300A publication Critical patent/JPS63204300A/ja
Application granted granted Critical
Publication of JP2884163B2 publication Critical patent/JP2884163B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/662Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

【発明の詳細な説明】 〔概 要〕 本発明は、符号化伝送装置に関し、異なる圧縮方法で
処理した情報を混在させて伝送する場合に、その圧縮率
と伸長率を一定にするため、有声音と無声音間で、圧縮
率及び伸長率を同一にし、有声音の場合は、nピッチ周
期分(nは2以上)の音声信号を1ピッチ周期分の音声
信号に圧縮する符号化、無声音の場合はnサンプル周期
分の音声を1サンプル周期分の音声信号に圧縮する符号
化をそれぞれ行い、また、滑らかな音声信号再生を行う
ため、有声音についてはnピッチ周期分の音声信号の最
初と最後の振幅が保存される窓関数処理を行い、無声音
については間引きされた1サンプル周期分の音声信号か
らnサンプル周期分の音声信号の再生を、1サンプル前
あるいは後の音声信号の影響を考慮した補間を行い、圧
縮率・伸長率ともに有声音・無声音間で同一であるこ
と、及び滑らかな、音声再生を行うこと、の2点を特徴
とし、再生音全体の明瞭度を向上させる。 〔産業上の利用分野〕 本発明は音声信号の符号化伝送装置に係り、特に音声
信号のピッチ周期における繰り返しを利用して時間軸方
向に圧縮,伸長を行うTDHS(Time Domain Harmonic Sca
ling)方式高能率音声符号化伝送装置に関する。 〔従来の技術〕 TDHS方式は、音声波形のピッチ周期による周期性を利
用して時間軸方向に帯域の圧縮,伸長を行う符号化方式
であって、下記の文献(1),(2)に詳細に記載され
ており、また文献(3)にその概要が記載されている。
また文献(4)は同様に時間軸方向の圧縮,伸長を行う
方式でTDHS方式の改良案の一つと言えるものである。 高能率音声符号化伝送装置はこのようなTDHS方式を用
い、音声信号をその品質を保ったまま情報圧縮を行う装
置である。 移動通信,衛星通信あるいは企業内通信等における音
声情報の伝送においては、回線コストの削減が重要であ
り、音声蓄積,音声応答システム等において音声情報の
蓄積を行う場合には、蓄積用メモリ容量の削減が重要で
あるが、高能率音声符号化伝送装置はこれらの要求を可
能にするものである。 しかしながら、TDHS方式を用いた高能率音声符号化伝
送装置においては、無声音に対して再生音声の明瞭度が
悪いという問題があるため、このような音声の品質低下
を生じないような音声信号の符号化伝送装置が要望され
る。 〔参考文献〕 (1)D.Malah,“Time−domain algolithms for harmon
ic bandwidth reduction and time scaling of speech
signals"IEEE Trans.Acoust.Speech,Signal Processin
g,vol.ASSP−27,pp.121−133 Apr.1979 (2)R.V.Cox et al.,“An Implementation of Time D
omain Harmonic Scaling with Application to Speech
Coding"ICC 82,pp.4G.1.1−4 (3)古井貞熈「ディジタル音声処理」p.122−124 東
海大学出版会 (4)森田,板倉“自己相関法による音声の時間軸での
伸縮方式とその評価”電気音響研究会資料 EA86−5 第5図は、従来のTDHS方式を用いた音声符号化伝送装
置の模式的ブロック構成図を示したものであって、1は
時間軸圧縮部(TDHC部)、2はピッチ周期抽出部、3は
符号化部、4は伝送路、5は復号化部、6は時間軸伸長
部(TDHE部)である。 第5図において、音声信号入力S(n)はピッチ周期
抽出部2において、そのピッチ周期を抽出される。時間
軸圧縮部(TDHC部)1は抽出されたピッチ周期に応じて
入力S(n)を時間軸方向に圧縮し、圧縮信号Sc(n)
を生じる。圧縮信号Sc(n)は符号化部3に加えられ
て、任意の符号化方式で符号化される。 符号化された信号は伝送路4を経て伝送される。受信
側においては、復号化部5においてこれを復号して圧縮
再生信号c(n)を生じる。この圧縮再生信号c
(n)は時間軸伸長部(TDHE部)6に加えられて別に伝
送されたピッチ周期の信号を用いて時間軸方向に伸長さ
れて、再生出力(n)を生じる。 第6図は第5図の符号化伝送装置における時間軸圧縮
と時間軸伸長の処理の例を説明するものであって、
(a)は時間軸圧縮を示し、(b)は時間軸伸長を示し
ている。 すなわち時間軸圧縮を行う場合は、第6図(a)に示
すように抽出されたピッチ周期Pごとに入力S(n)を
切り出し、2周期を1組として前の周期の信号には重み
窓W(m)をかけ、後の周期の信号には逆特性の重み窓
1−W(m)をかけた出力をそれぞれ発生し、これを平
均化して1周期の信号を得ることによって、1/2に圧縮
が行われた圧縮信号Sc(n)が得られる。 一方時間軸伸長を行う場合は、第6図(b)に示すよ
うに圧縮再生信号c(n)を3周期分とり、前の2周
期に重み窓1−W(m)をかけ、後の2周期に重み窓W
(m)をかけた出力をそれぞれ発生し、これを平均化す
ることによって2周期の再生信号(n)を得ることに
よって、もとの帯域に伸長される。 従来のTDHS方式においては、音声信号の周期性を抽出
するための評価関数として、下記の(1)式に示すよう
に波形の相関を算出するもの、または下記の(2)式に
示すように波形の類似性を算出するものを用い、これに
よって最も相関が大きくなる周期をピッチ周期としてい
た。 S1(N)=Σxj・xj-N/Σxj 2 …(1) S2(N)=Σ|xj−xj-N| …(2) またこのようなピッチ周期の探索の範囲としては、ピ
ッチ周波数の上限,下限を規定し、例えば16≦N≦200
程度の範囲で探索を行っていた。 このような探索方法では、周期性のない無声音のよう
な場合、正しく周期の抽出を行うことができず、従って
ランダムな値に設定されたピッチ周期に応じて圧縮,伸
長が行われるため、波形の性質が保存されず再生音声の
明瞭度が悪くなる等の品質劣化を生じていた。 〔発明が解決しようとする課題〕 本発明の目的は無声音に対する再生音声品質が改善さ
れ、再生音全体の明瞭度を向上させることができる符号
化伝送装置を提供することにある。 〔課題を解決するための手段〕 本発明の符号化伝送装置は、第1図に示す原理的構成
を有し、音声信号を帯域圧縮して符号化して伝送し、復
号信号をもとの帯域に伸長して再生する音声信号の符号
化伝送装置において、音声識別部10と、ピッチ周期抽出
部2と、時間軸圧縮部1と、間引き部7とを送信側に具
えるとともに、時間軸伸長部6と、補間部8とを受信側
に具えたものである。 音声識別部10は、音声信号の有声音の区間と無声音の
区間とを識別する。 ピッチ周期抽出部2は、有声音の区間において音声信
号のピッチ周期を抽出する。 時間軸圧縮部1は、複数ピッチ周期分の音声信号から
1ピッチ周期分をとり出して伝送する。 間引き部7は、無声音の区間において複数サンプル周
期分の音声信号から1サンプル周期分をとり出して伝送
する。 時間軸伸長部6は、1ピッチ周期分の信号からもとの
複数ピッチ周期分に伸長する。 補間部8は、1サンプル周期分の信号からもとの複数
サンプル周期分に伸長する。 従って、本発明の構成は以下に示す通りである。即
ち、音声信号を帯域圧縮して符号化して送信し、受信し
た帯域圧縮された音声信号を復号化して再生する音声信
号の符号化伝送装置において、 音声信号の有声音の区間と無声音の区間とを識別する
音声識別識別手段(10)と、 有声音の区間において音声信号のピッチ周期を抽出す
るピッチ周期抽出手段(2)と、 該ピッチ周期の複数個分の有声音の区間の音声信号
を、最初と最後の振幅を保存しながら1ピッチ周期分の
有声音の区間の音声信号に圧縮する時間軸圧縮手段
(1)と、 無声音の区間において、前記1ピッチ周期分に圧縮さ
れた有声音の区間の音声信号のピッチ周期数と同数のサ
ンプル周期数分の無声音の区間の音声信号を平均化して
1サンプル周期分の無声音の区間の音声信号に圧縮する
間引き手段(7)とを送信側に具えるとともに、 該1ピッチ周期分の有声音の区間の音声信号からもと
の複数ピッチ周期分の有声音の区間の音声信号に、最初
と最後の振幅値を復元して伸長する時間軸伸長手段
(6)と、 該1サンプル周期分の無声音の区間の音声信号からも
との複数サンプル周期分の無声音の区間の音声信号に、
該音声信号の1サンプル前の音声信号あるいは1サンプ
ル後の音声信号に基づいて補間する補間手段(8)とを
受信側に具えてなることを特徴とする符号化伝送装置と
しての構成を有する。 〔作 用〕 音声信号の有声音の区間と無声音の区間とを識別し、
異なる圧縮方法で処理した情報を混在させて伝送する場
合には、この圧縮率と伸長率を一定にする必要があり、
そのため、有声音と無声音間で、圧縮率及び伸長率を同
一にしている。有声音の場合は、nピッチ周期分(nは
2以上)の音声信号を1ピッチ周期分の音声信号に圧縮
する符号化、無声音の場合はnサンプル周期分の音声を
1サンプル周期分の音声信号に圧縮する符号化をそれぞ
れ行う。 また、滑らかな音声信号再生を行うため、有声音につ
いてはnピッチ周期分の音声信号の最初と最後の振幅が
保存される窓関数処理を行う。 また、無声音については間引きされた1サンプル周期
分の音声信号からnサンプル周期分の音声信号の再生
を、1サンプル前あるいは後の音声信号の影響を考慮し
た補間を行う。 圧縮率・伸長率ともに有声音・無声音間で同一である
こと、及び滑らかな、音声再生を行うことによって有声
音と無声音の両方の区間において、信号の時間軸方向の
圧縮と伸長が正しく行われるので、再生音全体の明瞭度
が向上する。 〔実施例〕 第2図は本発明の一実施例としての符号化伝送装置の
模式的ブロック構成図を示したものであって、第5図に
おけると同じ部分を同じ番号で示し、7は間引き部、8
は補間部、91,92はスイッチである。 第3図は第2図の実施例における間引き部7,補間部8
の処理を説明する図である。 また第4図は第2図の実施例におけるピッチ周期抽出
部2の構成例を示したものであって、11は共分散算出
部、12は最大値検出部、13は共分散閾値設定部、14は比
較部、15は判定部、161,162はスイッチである。 第2図において、ピッチ周期抽出部2は入力S(n)
の周期性を検出して、周期性が大きい有性音の部分に対
してはそのピッチ周期P=p(pはピッチ周期に対応す
るサンプリング周波数)を抽出して出力し、周期性が小
さい有声音の部分に対してはピッチ周期P=1を出力す
る。 スイッチ91,92はピッチ周期P≠1のときは、それぞ
れ時間軸圧縮部1,時間軸伸長部6の側に切り替えられ、
時間軸圧縮部1はピッチ周期P=pによって第5図の場
合と同様にして時間軸圧縮を行い、時間軸伸長部6は同
様にピッチ周期P=pによって時間軸伸長の処理を行
う。 一方ピッチ周期P=1のときは、スイッチ91,92はそ
れぞれ間引き部7,補間部8の側に切り替えられ、ピッチ
周期P=1によって間引きと補間の処理を行う。ここで
ピッチ周期P=1は音声のサンプリング周期によって処
理を行うことを意味する。間引き処理においては、下記
の(3)式に示すように2サンプリング周期の音声信号
の平均値を算出し、1サンプリング周期の圧縮信号Sc
(n)を発生することによって、1/2に圧縮された圧縮
信号Sc(n)を得る。 Sc(i)=(S(i)+S(i+1))/2 …(3) 第3図(a)は、このような処理を模式的に示してい
る。 補間部8においては、圧縮再生信号c(i)に対し
1サンプリング周期後の信号を用いて(4−1),(4
−2)式に従って補間処理を行って、1サンプリング周
期の圧縮再生信号c(n)から2サンプリング周期の
再生出力(n)を再生することによって、もとの帯域
に伸長する。 (2i−1)=(c(i−1)+3・c(i))/4
…(4−1) (2i)=(3・c(i)+c(i+1))/4…
(4−2) 第3図(b)は、このような処理を模式的に示してい
る。 またこの場合におけるピッチ周期の抽出は、第4図に
示すようにして行われる。 すなわち共分散算出部11は入力S(n)に対して、下
記の(5)式の定義される共分散をM1次からM2次まで算
出する。 ここで通常M1=16,M2=200程度である。最大値検出部
12は、このようにして求められたC(M1)〜C(M2)の
うちの最大値maxC(i)(i=M1〜M2)を検出して、共
分散値C(P)とする。ここでPはピッチ周期である。 このようにして検出された共分散値C(P)を比較部
14に加え、共分散値閾値設定部13に設定された一定の閾
値Cthと比較する。比較部14はC(P)<CthまたはC
(P)≧Cthに応じて出力を発生する。ここでC(P)
<Cthならば周期性が小さいので無声音であり、C
(P)≧Cthならば周期性が大きいので有声音であるか
ら、判定部15は比較部14の出力に応じて無声音、有声音
の判定を行って、有声音の場合にピッチ周期P=p(p
はサンプリング周期数で示されたピッチ周期)を出力
し、無声音の場合はP=1を出力する。この場合、共分
散値閾値設定部13に設計される閾値Cthの値は、通常0.6
〜0.7程度である。 〔発明の効果〕 以上説明したように本発明によれば、有声音と無声音
間で、圧縮率及び伸長率を同一にしており、有声音の場
合は、nピッチ周期分(nは2以上)の音声信号を1ピ
ッチ周期分の音声信号に圧縮する符号化、無声音の場合
はnサンプル周期分の音声を1サンプル周期分の音声信
号に圧縮する符号化をそれぞれ行い、また、滑らかな音
声信号再生を行うため、有声音についてはnピッチ周期
分の音声信号の最初と最後の振幅が保存される窓関数処
理を行い、また、無声音については間引きされた1サン
プル周期分の音声信号からnサンプル周期分の音声信号
の再生を、1サンプル前あるいは後の音声信号の影響を
考慮した補間を行ため、圧縮率・伸長率ともに有声音・
無声音間で同一であり、滑らかな音声再生を行うことが
でき、無声音に対する再生音声品質が改善され、再生音
全体の明瞭度を向上させることができる。
【図面の簡単な説明】 第1図は本発明の符号化伝送装置の原理的構成を示す
図、 第2図は本発明の一実施例としての符号化伝送装置の模
式的ブロック構成を示す図、 第3図は第2図の実施例における間引き部7と補間部8
の処理を説明する図、 第4図は第2図の実施例におけるピッチ周期抽出部2の
構成例を示す図、 第5図は従来のTDHS方式を用いた符号化伝送装置の模式
的ブロック構成を示す図、 第6図は第5図の符号化伝送装置における(a)時間軸
圧縮と(b)時間軸伸長の処理の例を説明する図であ
る。 1……時間軸圧縮部(TDHC部) 2……ピッチ周期抽出部 3……符号化部 4……伝送路 5……復号化部 6……時間軸伸長部(TDHE部) 7……間引き部 8……補間部 91,92……スイッチ 10……音声識別部 11……共分散算出部 12……最大値検出部 13……共分散閾値設定部 14……比較部 15……判定部 161,162……スイッチ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天野 文雄 川崎市中原区上小田中1015番地 富士通 株式会社内 (72)発明者 海上 重之 川崎市中原区上小田中1015番地 富士通 株式会社内 (56)参考文献 特開 昭59−82608(JP,A) 特開 昭57−58198(JP,A) 特開 昭54−16105(JP,A) 特公 昭59−41599(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 3/02 G10L 9/00 - 9/18

Claims (1)

  1. (57)【特許請求の範囲】 1.音声信号を帯域圧縮して符号化して送信し、受信し
    た帯域圧縮された音声信号を復号化して再生する音声信
    号の符号化伝送装置において、 音声信号の有声音の区間と無声音の区間とを識別する音
    声識別識別手段と、 有声音の区間において音声信号のピッチ周期を抽出する
    ピッチ周期抽出手段と、 該ピッチ周期の複数個分の有声音の区間の音声信号を、
    最初と最後の振幅を保存しながら1ピッチ周期分の有声
    音の区間の音声信号に圧縮する時間軸圧縮手段と、 無声音の区間において、前記1ピッチ周期分に圧縮され
    た有声音の区間の音声信号のピッチ周期数と同数のサン
    プル周期数分の無声音の区間の音声信号を平均化して1
    サンプル周期分の無声音の区間の音声信号に圧縮する間
    引き手段とを送信側に具えるとともに、 該1ピッチ周期分の有声音の区間の音声信号からもとの
    複数ピッチ周期分の有声音の区間の音声信号に、最初と
    最後の振幅値を復元して伸長する時間軸伸長手段と、 該1サンプル周期分の無声音の区間の音声信号からもと
    の複数サンプル周期分の無声音の区間の音声信号に、該
    音声信号の1サンプル前の音声信号あるいは1サンプル
    後の音声信号に基づいて補間する補間手段とを受信側に
    具えてなることを特徴とする符号化伝送装置。
JP62037304A 1987-02-20 1987-02-20 符号化伝送装置 Expired - Fee Related JP2884163B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP62037304A JP2884163B2 (ja) 1987-02-20 1987-02-20 符号化伝送装置
CA000559026A CA1301072C (en) 1987-02-20 1988-02-16 Speech coding transmission equipment
US07/156,882 US4890325A (en) 1987-02-20 1988-02-18 Speech coding transmission equipment
DE88102446T DE3883799T2 (de) 1987-02-20 1988-02-19 Codierungseinrichtung zur Sprachübertragung.
EP88102446A EP0279451B1 (en) 1987-02-20 1988-02-19 Speech coding transmission equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62037304A JP2884163B2 (ja) 1987-02-20 1987-02-20 符号化伝送装置

Publications (2)

Publication Number Publication Date
JPS63204300A JPS63204300A (ja) 1988-08-23
JP2884163B2 true JP2884163B2 (ja) 1999-04-19

Family

ID=12493963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62037304A Expired - Fee Related JP2884163B2 (ja) 1987-02-20 1987-02-20 符号化伝送装置

Country Status (5)

Country Link
US (1) US4890325A (ja)
EP (1) EP0279451B1 (ja)
JP (1) JP2884163B2 (ja)
CA (1) CA1301072C (ja)
DE (1) DE3883799T2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6877791A (en) * 1989-10-25 1991-05-31 Motorola, Inc. Speech waveform compression technique
US5216744A (en) * 1991-03-21 1993-06-01 Dictaphone Corporation Time scale modification of speech signals
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
JPH06502928A (ja) * 1991-09-20 1994-03-31 レルナウト アンド ハウスピイ スピーチプロダクツ 音声コーディング素子
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
US6330334B1 (en) 1993-03-15 2001-12-11 Command Audio Corporation Method and system for information dissemination using television signals
KR100372208B1 (ko) * 1993-09-09 2003-04-07 산요 덴키 가부시키가이샤 음성신호의시간축압축/신장방법
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
US5694521A (en) * 1995-01-11 1997-12-02 Rockwell International Corporation Variable speed playback system
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
EP1164577A3 (en) * 1995-10-26 2002-01-09 Sony Corporation Method and apparatus for reproducing speech signals
US5809472A (en) * 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
US5815671A (en) * 1996-06-11 1998-09-29 Command Audio Corporation Method and apparatus for encoding and storing audio/video information for subsequent predetermined retrieval
US5956629A (en) * 1996-08-14 1999-09-21 Command Audio Corporation Method and apparatus for transmitter identification and selection for mobile information signal services
JP3439307B2 (ja) * 1996-09-17 2003-08-25 Necエレクトロニクス株式会社 発声速度変換装置
GB9720544D0 (en) * 1997-09-26 1997-11-26 Barnett Peter W Method and apparatus for inputting speech intelligibility
GB2344982A (en) * 1997-09-26 2000-06-21 Peter William Barnett Method and apparatus for improving speech intelligibility
JP3639461B2 (ja) * 1998-09-29 2005-04-20 三洋電機株式会社 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置
US6604071B1 (en) * 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6775372B1 (en) 1999-06-02 2004-08-10 Dictaphone Corporation System and method for multi-stage data logging
US6252946B1 (en) 1999-06-08 2001-06-26 David A. Glowny System and method for integrating call record information
US6246752B1 (en) * 1999-06-08 2001-06-12 Valerie Bscheider System and method for data recording
US6249570B1 (en) * 1999-06-08 2001-06-19 David A. Glowny System and method for recording and storing telephone call information
US6252947B1 (en) 1999-06-08 2001-06-26 David A. Diamond System and method for data recording and playback
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
CN1383614A (zh) * 2000-06-06 2002-12-04 酒井康江 压缩方法及装置、扩展方法及装置、压缩扩展系统、存储媒体、程序
US6869644B2 (en) * 2000-10-24 2005-03-22 Ppg Industries Ohio, Inc. Method of making coated articles and coated articles made thereby
JP2002217740A (ja) * 2001-01-19 2002-08-02 Sakai Yasue 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、記録媒体
JP2002312000A (ja) 2001-04-16 2002-10-25 Sakai Yasue 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、ピーク検出方法、プログラム、記録媒体
WO2002087137A2 (en) * 2001-04-24 2002-10-31 Nokia Corporation Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
US7412376B2 (en) * 2003-09-10 2008-08-12 Microsoft Corporation System and method for real-time detection and preservation of speech onset in a signal
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
DE102010041644B4 (de) 2010-09-29 2019-07-11 Sivantos Pte. Ltd. Verfahren zur Frequenzkompression mit harmonischer Korrektur und Vorrichtung

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5758198A (en) * 1980-09-25 1982-04-07 Suwa Seikosha Kk Voice synthesizer
US4475227A (en) * 1982-04-14 1984-10-02 At&T Bell Laboratories Adaptive prediction
US4550425A (en) * 1982-09-20 1985-10-29 Sperry Corporation Speech sampling and companding device
JPS5982608A (ja) * 1982-11-01 1984-05-12 Nippon Telegr & Teleph Corp <Ntt> 音声の再生速度制御方式
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus

Also Published As

Publication number Publication date
US4890325A (en) 1989-12-26
EP0279451A2 (en) 1988-08-24
EP0279451A3 (en) 1990-05-23
EP0279451B1 (en) 1993-09-08
DE3883799T2 (de) 1994-02-24
DE3883799D1 (de) 1993-10-14
CA1301072C (en) 1992-05-19
JPS63204300A (ja) 1988-08-23

Similar Documents

Publication Publication Date Title
JP2884163B2 (ja) 符号化伝送装置
CN112289333B (zh) 语音增强模型的训练方法和装置及语音增强方法和装置
EP0538877B1 (en) Voice coder/decoder and methods of coding/decoding
US5953696A (en) Detecting transients to emphasize formant peaks
US8244547B2 (en) Signal bandwidth extension apparatus
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
GB2357231A (en) Encoding and decoding speech signals
JP3354252B2 (ja) 音声認識装置
JP3806453B2 (ja) 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
CN111968627B (zh) 一种基于联合字典学习和稀疏表示的骨导语音增强方法
JP3058640B2 (ja) 符号化方法
JP2002297200A (ja) 話速変換装置
JP2744618B2 (ja) 音声符号化伝送装置、並びに音声符号化装置及び音声復号化装置
JPS6235680B2 (ja)
JP3218681B2 (ja) 背景雑音検出方法及び高能率符号化方法
JPH0736119B2 (ja) 区分的最適関数近似方法
Kurada et al. Speech Bandwidth Extension Using DWT-FFT-Based Data Hiding.
KR940002853B1 (ko) 음성신호의 시작점 및 끝점의 적응적 추출방법
JP2629762B2 (ja) ピッチ抽出装置
JPH07334189A (ja) 音声情報分析装置
CN115700875A (zh) 音频处理方法、装置、存储介质以及电子设备
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
Loo et al. An Adaptive silence deletion algorithm for compression of telephone speech
JPH02139600A (ja) 音声符号化復号化方式及びその装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees