JP2947685B2 - 音声コーデック装置 - Google Patents
音声コーデック装置Info
- Publication number
- JP2947685B2 JP2947685B2 JP4337650A JP33765092A JP2947685B2 JP 2947685 B2 JP2947685 B2 JP 2947685B2 JP 4337650 A JP4337650 A JP 4337650A JP 33765092 A JP33765092 A JP 33765092A JP 2947685 B2 JP2947685 B2 JP 2947685B2
- Authority
- JP
- Japan
- Prior art keywords
- maximum value
- signal
- audio
- circuit
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 description 15
- 238000013139 quantization Methods 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 5
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 206010067482 No adverse event Diseases 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
DEC:coderとdecoderとの合成語)装置
に関し、特に予測符号化を行う音声コーデック装置に関
する。
ーデック装置においては、復号化した出力信号の利得
(以下ゲインという)を制御する必要があり、一般に、
このゲイン制御は、符号化しようとする音声信号(入力
音声信号)を監視することにより行われる。
うとする音声信号の振幅を振幅検出回路で監視し、検出
されたその最大振幅値を用いる方法がある。この方法の
詳細は、特開昭59−44684号公報で提案された
「音声記憶機能付電子時計」に開示されており、そこで
は、符号化時に音声信号を監視し、検出された音声信号
の振幅の最大値を記憶しておき、復号化時に記憶した振
幅の最大値を基にゲインが最適になるように制御してい
る。
ように、入力信号である音声信号の振幅の最大値を検出
し、この最大値に基づきゲイン制御を行う従来例では、
符号化しようとする音声信号にインパルス性雑音が入っ
ている場合に、このインパルス性雑音と符号化しようと
する音声信号とを区別できないため、インパルス性雑音
を入力信号の最大値として誤検出するおそれがあり、ゲ
イン利得の制御を的確に行えないという問題がある。
(a)に示すように、入力信号Sにインパルス性雑音N
が存在する場合は、入力信号Nの監視を行っている振幅
検出回路がそのピーク値を入力信号Sの最大値Smax
として誤検出し、これを記憶装置であるRAMに蓄積す
る。そして、ゲイン自動調整回路が復号時にRAMに蓄
積された最大値Smaxを読み出し、この最大値Sma
xに基づき出力信号のゲインを決定するので、ゲイン制
御を的確に行うことができない。
できるように設計されている予測回路を用いた音声コー
デック装置に適用すると、音声と異なる性質を持つイン
パルス性雑音は追従できないため、復号化時にはインパ
ルス性雑音が再現されない。このため、符号化しようと
する音声信号の最大値、即ち、インパルス性雑音の最大
値Smaxを用いて復号化時のゲインを制御すると、図
3(b)に示すように、復号化時に本来の音声信号が更
に小さくなり(同図中の入力信号の最大値と予測波形の
最大値との差より明らか)、出力側で適正な音量が得ら
れないという問題がある。
路を用いた音声コーデック装置に適用すると、符号化さ
れる入力信号の最大値と復号化される信号の最大値との
間にギャップが存在するおそれがあるため、出力信号の
ゲイン制御を的確に行うことができない。
性雑音が追従できないのは、以下の理由による。すなわ
ち、予測符号化を行う場合、予測符号化に用いる音声の
性質として、音声信号の相関があり、この音声信号の相
関は、鈴木久喜訳:”音声のディジタル信号処理
(上)”コロナ社(昭53年)に詳しく記載されてお
り、インパルス性雑音や瞬断による雑音は、相関が小さ
いため追従せず低域通過フィルタによる雑音消去と同等
の効果が得られることによる。
決するものであり、簡潔なシステム構成で、復号化され
る信号の最大振幅を符号化時に検出でき、復号化時に出
力信号のゲイン制御を的確に行うことが可能な音声コー
デック装置を提供することを目的とする。
装置は、入力される音声信号の予測符号化を行う音声コ
ーデック装置において、入力される音声信号を符号化す
ると共に、該音声信号の振幅予測値を生成する予測符号
化装置(30、X)と、該予測符号化装置(30、X)
が生成した振幅予測値を監視し、符号化が終了した時点
で該振幅予測値の最大値を入力された音声信号の最大振
幅として検出する最大値検出回路(70、7)と、該最
大値および符号化された音声符号を蓄積する記憶装置
(80、8)と、該記憶装置(80、8)に蓄積された
該音声符号を読み出し、該音声符号を復号化する復号化
装置(100、Y)と、該復号化装置(100、Y)に
より復号化された音声信号が入力されると共に、該記憶
回路(80、8)に蓄積された該最大値が入力され、該
最大値に基づいて出力信号の利得を決定する利得決定回
路(130、13)とを有しており、そのことにより上
記目的が達成される。
(X)を、予測符号化を差分量子化で行う構成とする。
8)を、前記音声符号と前記最大値とをそれぞれ独立し
た記憶領域に記憶する固体記憶装置で構成する。
予測値の最大値を入力された音声信号の最大振幅として
記憶しておき、復号化時にこの最大値を読み出し、これ
に基づきゲイン制御を行うものとすると、この予測値は
復号化時の信号と等しいため、復号化時の最大振幅を符
号化時に得ることができる。従って、復号化学時のゲイ
ン調整を的確に行うことができる。
理が適用される本発明音声コーデック装置の概略構成を
その作用と共に説明する。まず、本発明音声コーデック
装置では、符号化時には入力信号、即ち音声信号そのも
のの振幅の最大値を検出するのではなく、符号化装置3
0が生成した予測値を最大値検出回路70で監視し、符
号化装置30の符号化が終了した時点で、最大値検出回
路70が符号化された予測値の最大値を検出し、検出し
た最大値を記憶装置(RAM)に蓄積する。
路130が記憶装置に蓄積された最大値を読み出し、こ
の最大値に基づき復号化装置100から与えられる出力
信号のゲインを決定する。これにより、最適な振幅で再
生された復号化信号が得られる。
測値(音声符号)は記憶装置80に一旦蓄積され、その
後、復号化装置100により復号されてゲイン決定回路
130に与えられる。
う音声コーデック装置に本発明を適用した実施例を示
す。
従来より良く知られており、例えば古井貞煕著:”ディ
ジタル信号処理”東海大学出版会(昭60年)にその詳
細が記載されている。この差分量子化を用いた予測符号
化は、入力信号から次の信号を予測して、その予測誤差
を符号化することにより高圧縮の符号化を実現する手法
である。
信号(入力信号)は隣接標本間のみならず、更に離れた
点の間でも相関がある。このため、隣接標本間の差信号
(差分)、或はその相関を利用して予測した値と実際の
標本値の差分(予測誤差)を符号化すれば標本化デー
タ、すなわち情報の高圧縮を行うことができる。
しなければならない音声符号(符号化データ)の量を小
さくできるので、記憶装置として、RAMに代表される
小容量の固体記憶装置を使用できる利点がある。
異なり任意の位置に蓄積されたデータをランダムに取り
出すことができるので、以下に示すような音声符号と最
大値検出回路7で検出された最大値を別々に記憶するこ
とができる。すなわち、ある音声列を記録再生する場
合、音声列の音声符号を記憶装置の記憶領域Aに、音声
列の最大値を記憶領域Bに、それぞれ区分けして記憶で
きる利点がある。
成を動作と共に説明する。入力信号である音声信号は、
減算器1、量子化回路2、符号化回路3、ステップ幅決
定回路4、加算器5および予測回路6で構成される予測
符号化装置Xによって上記した差分量子化の手法に従っ
て音声符号に符号化される。
信号と予測回路6の出力である予測値との差分が与えら
れ、この差分を量子化した信号が符号化回路3によって
符号化されて音声符号としてRAMからなる記憶装置8
の記憶領域Aに一旦蓄積される。すなわち、音声列を符
号化した音声符号を記憶装置8の記憶領域Aに蓄積す
る。
は、ステップ幅決定回路4よりステップ幅係数を設定す
るためのフィードバック信号が与えられ、これにより最
適の値のステップ幅係数が設定される。このようにステ
ップ幅係数を最適のものに設定すると、S/N比を向上
できる利点がある。
って監視されている。最大値検出回路7は、符号化回路
3による符号化が終了した時点で予測値の最大値を検出
し、この最大値を記憶装置8の記憶領域Bに蓄積する。
的な記憶手法は以下の通りである。すなわち、記憶領域
Aの位置は、16進数で0000からFFFFとし、記
憶領域Bの位置は、1000から1000Fとする。従
って、例えば3番目の音声列が入って来たとき、これを
符号した音声符号は0300から03FFに記憶する。
そして、予測値の最大値は音声符号を記憶する位置の先
頭の値の3を用いて1003の位置に記憶する。このよ
うな記憶方式により、F個の音声列の音声符号と最大値
を独立に、しかも共通の値で記憶することができる。従
って、復号化時に読み出しが容易に行える。
号化について説明する。再生時には、ステップ幅決定回
路9、復号化回路10、加算器11および予測回路12
で構成される復号化装置Yが記憶装置8の記憶領域Aよ
り音声符号を読み出してゲイン決定回路13に出力す
る。今少し具体的に説明すると、ステップ幅決定回路9
により決定されるステップ幅係数で復号化回路10が記
憶装置8の記憶領域Aに蓄積された音声符号を読み出
す。そして、加算器11および予測回路12により音声
符号が元の音声信号に対応した音声列に復号化され、こ
の音声列がゲイン決定回路13に与えられる。
記憶領域Bに蓄積された最大値を読み出し、この最大値
に基づき音声列のゲインを決定する。すなわち、音声列
の振幅の最大値が再生する音量の最適値になるようにゲ
イン制御する。ゲイン制御された出力信号はスピーカ等
の出力側に出力する。この時、記憶装置8の記憶領域B
は音声符号が蓄積されている記憶領域Aの位置とは独立
しているので、ゲインを制御する必要のない場合は、ゲ
イン決定回路13は最大値を読み出す必要がなく、この
場合に音声列に悪影響が及ぶことがない。
は音声コーデック部分に従来からの一般的な手法をその
まま利用でき、既存のシステムに予測値の最大値を検出
する最大値検出回路7と、この最大値に基づいて出力信
号のゲインを決定、制御するゲイン決定回路13を追加
するだけで、的確なゲイン制御が可能な音声コーデック
装置を実現できる。
実現されることが多いため、新たに追加される回路もハ
ードウェアを追加することなく、簡単に実現できる。す
なわち、該当するソフトウェアが搭載されたROM、M
PUおよびRAM等を備えたシステム構成で簡単に実現
できる。
差分量子化方式に限定されるものではない。
ば、復号化した信号の最大振幅を符号化時に検出できる
ので、復号化時に的確なゲイン制御で最適な出力信号の
振幅を得ることができる。従って、本発明の音声コーデ
ック装置が音声コーデック部に備えられた電話機や音響
機器等では、例えば、復号化した信号をスピーカで再生
する場合に、スピーカに過大入力を与えることのない最
大限の音量で精度よく再生することができる。それ故、
このような機器の信頼性を向上できる。
装置によれば、予測符号化を差分量子化方式で行うの
で、データの高圧縮化が図れ、記憶装置としてRAMに
代表される小容量の固体記憶装置を用いることができる
ので、かかる固体記憶装置が有する利点も併せて享受す
ることができる。
ック装置に本発明を適用した実施例を示すブロック図。
法の原理を説明するためのブロック図。
Claims (3)
- 【請求項1】 入力される音声信号の予測符号化を行う
音声コーデック装置において、 入力される音声信号を符号化すると共に、該音声信号の
振幅予測値を生成する予測符号化装置(30、X)と、 該予測符号化装置(30、X)が生成した振幅予測値を
監視し、符号化が終了した時点で該振幅予測値の最大値
を入力された音声信号の最大振幅として検出する最大値
検出回路(70、7)と、 該最大値および符号化された音声符号を蓄積する記憶装
置(80、8)と、該記憶装置(80、8)に蓄積された該音声符号を読み
出し、該音声符号を復号化する復号化装置(100、
Y)と、 該復号化装置(100、Y)により復号化された音声信
号が入力されると共に、 該記憶回路(80、8)に蓄積
された該最大値が入力され、該最大値に基づいて出力信
号の利得を決定する利得決定回路(130、13)とを
有する音声コーデック装置。 - 【請求項2】 前記予測符号化装置(X)が、予測符号
化を差分量子化で行う構成とされた請求項1記載の音声
コーデック装置。 - 【請求項3】 前記記憶装置(80、8)が、前記音声
符号と前記最大値とをそれぞれ独立した記憶領域に記憶
する固体記憶装置で構成された請求項1又は請求項2記
載の音声コーデック装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4337650A JP2947685B2 (ja) | 1992-12-17 | 1992-12-17 | 音声コーデック装置 |
US08/540,314 US5600755A (en) | 1992-12-17 | 1995-10-11 | Voice codec apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4337650A JP2947685B2 (ja) | 1992-12-17 | 1992-12-17 | 音声コーデック装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06186999A JPH06186999A (ja) | 1994-07-08 |
JP2947685B2 true JP2947685B2 (ja) | 1999-09-13 |
Family
ID=18310653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4337650A Expired - Lifetime JP2947685B2 (ja) | 1992-12-17 | 1992-12-17 | 音声コーデック装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5600755A (ja) |
JP (1) | JP2947685B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4814861B2 (ja) * | 2007-11-12 | 2011-11-16 | 日本電信電話株式会社 | 音量調整装置、方法及びプログラム |
TWI665659B (zh) * | 2010-12-03 | 2019-07-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
CN111081226B (zh) * | 2018-10-18 | 2024-02-13 | 北京搜狗科技发展有限公司 | 语音识别解码优化方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5944684A (ja) * | 1982-09-07 | 1984-03-13 | Seiko Epson Corp | 音声記憶機能付き電子機器 |
DE3783905T2 (de) * | 1987-03-05 | 1993-08-19 | Ibm | Verfahren zur grundfrequenzbestimmung und sprachkodierer unter verwendung dieses verfahrens. |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
JPH087597B2 (ja) * | 1988-03-28 | 1996-01-29 | 日本電気株式会社 | 音声符号化器 |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP2895895B2 (ja) * | 1989-12-29 | 1999-05-24 | シャープ株式会社 | 変復調装置 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
-
1992
- 1992-12-17 JP JP4337650A patent/JP2947685B2/ja not_active Expired - Lifetime
-
1995
- 1995-10-11 US US08/540,314 patent/US5600755A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06186999A (ja) | 1994-07-08 |
US5600755A (en) | 1997-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3334419B2 (ja) | ノイズ低減方法及びノイズ低減装置 | |
US5970443A (en) | Audio encoding and decoding system realizing vector quantization using code book in communication system | |
JPS6011360B2 (ja) | 音声符号化方式 | |
KR20010021226A (ko) | 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체 | |
JPH02288520A (ja) | 背景音再生機能付き音声符号復号方式 | |
US6246979B1 (en) | Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal | |
JP2947685B2 (ja) | 音声コーデック装置 | |
KR100529267B1 (ko) | 음성부호화복호화방법 | |
JP3227929B2 (ja) | 音声符号化装置およびその符号化信号の復号化装置 | |
JP2905215B2 (ja) | 録音再生装置 | |
KR0141237B1 (ko) | 음성신호 기록/재생방법 및 그 장치 | |
JPH05303399A (ja) | 音声時間軸圧縮伸長装置 | |
JP3753956B2 (ja) | 符号化装置 | |
JP2000049614A (ja) | 再生装置 | |
JP3341348B2 (ja) | 情報検出再生装置及び情報記録装置 | |
JPH01173100A (ja) | ディジタル音声再生装置 | |
JPS6253093B2 (ja) | ||
JP2002366197A (ja) | 音楽再生装置 | |
JP3418803B2 (ja) | 音声符号復号化装置 | |
JPH0816199A (ja) | 録音装置 | |
KR100776432B1 (ko) | 오디오 기록 재생 장치 및 그 장치에서 실행 가능한 압축률개선을 위한 오디오 코딩 방법 | |
JP2602641B2 (ja) | 音声符号化方式 | |
JP2730028B2 (ja) | 線形予測符号化方法 | |
JP3308955B2 (ja) | データ圧縮符号化装置 | |
JPS63127300A (ja) | 音声無音圧縮方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990617 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070702 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080702 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090702 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100702 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110702 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110702 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120702 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120702 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 14 |