Nothing Special   »   [go: up one dir, main page]

JP2006079107A - エンコードまたはデコードの方法および装置 - Google Patents

エンコードまたはデコードの方法および装置 Download PDF

Info

Publication number
JP2006079107A
JP2006079107A JP2005273821A JP2005273821A JP2006079107A JP 2006079107 A JP2006079107 A JP 2006079107A JP 2005273821 A JP2005273821 A JP 2005273821A JP 2005273821 A JP2005273821 A JP 2005273821A JP 2006079107 A JP2006079107 A JP 2006079107A
Authority
JP
Japan
Prior art keywords
value
speech
frame
pitch
estimate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005273821A
Other languages
English (en)
Other versions
JP3964915B2 (ja
Inventor
Paul E Jacobs
ポール・イー・ジェイコブス
William R Gardner
ウィリアム・アール・ガードナー
Chong U Lee
チョン・ユー・リー
Klein S Gilhousen
クライン・エス・ギルハウセン
S Katherine Lam
エス・キャサリン・ラム
Ming-Chang Tsai
ミン−チャン・ツァイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24866989&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2006079107(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2006079107A publication Critical patent/JP2006079107A/ja
Application granted granted Critical
Publication of JP3964915B2 publication Critical patent/JP3964915B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/16Time-division multiplex systems in which the time allocation to individual channels within a transmission cycle is variable, e.g. to accommodate varying complexity of signals, to vary number of channels transmitted
    • H04J3/1682Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers
    • H04J3/1688Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers the demands of the users being taken into account after redundancy removal, e.g. by predictive coding, by variable sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • H04L1/0017Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy where the mode-switching is based on Quality of Service requirement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • H04L1/0046Code rate detection or code type detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Amplifiers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Curing Cements, Concrete, And Artificial Stone (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Luminescent Compositions (AREA)
  • Dc Digital Transmission (AREA)
  • Table Devices Or Equipment (AREA)
  • Magnetic Record Carriers (AREA)
  • Endoscopes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Inorganic Insulating Materials (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Noise Elimination (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

【目的】可変速度ボコード化技術を使用してスピーチを圧縮する新しい改良された方法およびシステムを提供すること。
【構成】複数のフレームを含むスピーチ信号(S(n))のフレームにおける背景雑音の現在の推定値(B’)を生成する方法であって、スピーチ信号(S(n))のフレームのエネルギレベル(R(0))を計算し、スピーチ信号の前のフレームにおける背景雑音の推定値(B)を得、エネルギレベル(R(0))およびスピーチ信号の前のフレームにおける背景雑音の推定値(B)に基づいて背景雑音の現在の推定値(B’)を生成することを含む方法および装置が提供される。
【選択図】 図17

Description

本発明は、スピーチ処理に関する。特に、本発明は圧縮の量がダイナミックに変化し、一方において再構成されたスピーチの品質に最小の影響を与えるスピーチを圧縮する新しい改良された方法およびシステムに関する。さらに、圧縮されたスピーチデータはエラーを導入する可能性があるチャンネル上を伝送されるように意図されているため、本発明の方法およびシステムはまた音声品質に対するチャンネルエラーの影響を最小にする。
デジタル技術による音声の伝送は、特に長距離のデジタル無線電話の適用で広く普及してきている。したがって、予測される再構成スピーチの品質を維持するチャンネル上を伝送されることができる情報の最少量を決定することが重要である。スピーチがサンプルし、デジタル化するだけで伝送される場合、通常のアナログ電話のスピーチ品質を達成するために64キロビット/秒(kbps)程度のデータ速度が要求される。しかしながら、適切なコード化、伝送および受信機における再合成によって後続されるスピーチ解析の使用により、データ速度の著しい減少が実現可能である。
人間のスピーチ発生のモデルに関連したパラメータを抽出することによって発声されたスピーチを圧縮する技術を使用した装置は、典型的にボコーダと呼ばれている。このような装置は、適切なパラメータを抽出するために入来したスピーチを解析するエンコーダおよびをそれが伝送チャンネル上で受信したパラメータを使用してスピーチを再合成するデコーダから構成されている。正確であるためには、モデルが一定に変化していなければならない。したがって、スピーチはパラメータが計算される時間のブロック、すなわち解析フレームに分割される。その後、パラメータは新しい各フレームに対して更新される。
種々のクラスのスピーチコーダのうち、コード励起直線予測コード化(CELP)、ストカスティック(Stochastic )コード化またはベクトル励起スピーチコード化が1つのクラスである。この特定のクラスのコード化アルゴリズムの一例はトーマスE.トレメイン氏他による文献(“A 4.8kbps Code Excited linear Predictive Coder”,Proceedings of the Mobile Satellite Conference,1988年)に記載されている。
ボコーダの機能は、スピーチに固有の本来の冗長性を全て除去することによって低いビット速度の信号にデジタル化されたスピーチ信号を圧縮することである。スピーチは典型的に主に音声域のフィルタ処理動作による短い期間の冗長性および音声コードによる音声域の励起のための長い期間の冗長性を有している。CELPコーダにおいて、これらの動作は短期間フォーマットのフィルタおよび長期間ピッチのフィルタの2つのフィルタによってモデル化される。これらの冗長性が除去されると、結果的な残留信号は、エンコードされなければならない白色ガウス雑音としてモデル化されることができる。この技術のベースは、人間の音声域のモデルを使用してスピーチ波形の短期間の予測を実行するLPCフィルタと呼ばれるフィルタのパラメータを計算することである。さらに、スピーチのピッチに関連した長期間の効果は、人間の音声和音を本質的にモデル化するピッチフィルタのパラメータを計算することによってモデル化される。最後に、これらのフィルタは励起されなければならず、これは波形が上記の2つのフィルタを励起したときに、結果として元のスピーチに最も近いコードブック中の多数のランダム励起波形の1つを決定することによって実行される。このように伝送パラメータは(1)LPCフィルタ、(2)ピッチフィルタおよび(3)コードブック励起の3つの項目に関連している。
ボコーダ技術の使用はさらにチャンネル上を伝送される情報量を減少し、一方において再構成されたスピーチの品質を維持しようとすることを目的とするが、さらに減少するために別の技術が使用される必要がある。伝送される情報量を減少するために前に使用された1つの技術は音声活動のゲート化である。この技術において、スピーチの休止(pause) 中に伝送される情報はない。この技術はデータ減少の所望の結果を達成するが、いくつかの欠点がある。
多くの場合において、スピーチの品質はワードの最初の部分のクリッピングにより低下される。非活動中のチャンネルをオフにゲート制御することに関する別の問題は、システム利用者が通常スピーチに付随する背景雑音の欠如を知覚し、通常の電話機の呼びより低くチャンネルの品質を評価することである。活動ゲート制御に関する別の問題は、スピーチが生じないときに背景中の時々の突発的な雑音が送信機をトリガーし、結果的に受信機における雑音のバーストを除去することである。
音声活動ゲートシステム中で合成されたスピーチの品質を改良しようとする試みにおいて、合成された快適な雑音はデコード化プロセス中に付加される。品質のある改良は快適な雑音を付加することによって達成されるが、それは快適な雑音がエンコーダの実際の背景雑音をモデル化しないため全体的な品質を実質的に改良しない。
伝送される必要がある情報を結果的に減少するようにデータ圧縮を実現するさらに好ましい技術は、可変速度ボコード処理を行うことである。スピーチは沈黙期間すなわち休止の期間を本質的に含んでいるため、これらの期間を表すために要求されるデータ量は減少されることかできる。可変速度ボコーダは、これらの沈黙期間に対するデータ速度を減少することによってこの事実を非常に効果的に利用する。沈黙期間に対するデータ伝送中の完全な停止と対照的に、データ速度の減少は音声活動ゲート制御に関連した問題を克服し、一方において伝送された情報の減少を促進する。
したがって、本発明の目的は可変速度ボコード化技術を使用してスピーチを圧縮する新しい改良された方法およびシステムを提供することである。
本発明は、前に述べられたスピーチコーダのクラス、コード励起直線予測コード化(CELP)、ストカスティックコード化またはベクトル励起スピーチコード化のボコーダアルゴリズムを実行する。CELP技術自身は、再合成時に高品質のスピーチを結果的に生じさせるようにスピーチを表すために必要なデータの量を著しく減少する。上記のように、ボコーダパラメータは各フレームに対して更新される。本発明のボコーダは、モデルパラメータの周波数および正確さを変化することによって可変出力データ速度を提供する。
本発明は、スピーチ活動に基づいて可変出力データ速度を生成することによって基本的なCELP技術と最も顕著に異なっている。構造は、パラメータがスピーチの休止中に少数回または低い正確さで更新されるように定められる。この技術は、伝送される情報の量をかなり大幅に減少することを可能にする。データ速度を減少するために使用される現象は、所定の話し手が会話中に実際に話している時間の平均パーセンテージである音声活動係数である。典型的な2方向電話会話に対して、平均データ速度は2以上の係数だけ減少される。スピーチの休止中、背景雑音だけがボコーダによってコード化される。これらの期間において、人間の音声域モデルに関連したパラメータのいくつかは伝送される必要がない。
上記のように、沈黙中に伝送される情報の量を制限する従来の方法は音声活動ゲートと呼ばれ、沈黙の瞬間に伝送される情報がない技術である。受信側において、期間は合成された“快適な雑音”で満たされる。対照的に、可変速度ボコーダは好ましい実施例においてほぼ 8kbps乃至 1kbpsの範囲の速度でデータを連続的に伝送する。データの連続伝送を行うボコーダは、合成された“快適な雑音”を不要にし、背景雑音のコード化は再合成されたスピーチにさらに自然な性質を与える。したがって、本発明はスピーチと背景との間の滑らかな転移を可能にすることによって音声活動ゲートのものに対して再合成スピーチ品質を著しく改良する。
本発明はさらにエラーの発生をマスクする新しい技術を含む。データは例えば雑音の多い無線リンクであるチャンネル上を伝送されるため、それはデータ中のエラーを適合しなければならない。生じるエラー数を減少するためにチャンネルコード化を使用する従来の技術は、成功的にエラーを減少することができる。しかしながら、チャンネルコード化だけでは再構成されたスピーチの高品質を確保するのに必要なエラー保護のレベルに完全に達しない。ボコード処理が連続的に発生する可変速度ボコーダにおいて、エラーはワードまたは音節の開始等の重要なスピーチ事象に関連したデータを破壊する。ボコーダに基づいた直線予測コード化(LPC)に関する典型的な問題は、音声域モデルに関連したパラメータ中のエラーが曖昧に人間の声のようであり、聞き手を困惑させるのに十分に元のワードの音を変化させる音を生じさせることである。本発明において、聞き手に対する知覚可能性を減少するようにエラーがマスクされる。したがって、本発明において実行されるエラーマスキングはスピーチの明瞭さに対するエラーの影響を著しく減少させる。
任意のパラメータが変化する可能な最大量は低速で小さい範囲に制限されているため、これらの速度で伝送されるパラメータ中のエラーはスピーチ品質にほとんど影響を与えない。異なる速度のエラーはスピーチ品質に対して異なる知覚的影響を与えるため、伝送システムは高速データをさらに保護するように最適化されることができる。したがって、本発明は付加的な特徴としてチャンネルエラーに対する強さを提供する。
CELPアルゴリズムの可変速度出力変形を行う時の本発明は、結果的に音声活動に応じて 8:1 から64:1 にダイナミックに変化するスピーチ圧縮を実行させる。述べられた圧縮係数はμ法則入力を参照して引用され、圧縮係数は直線入力に対して2の係数だけ高い。速度決定は、音声活動係数を完全に利用するようにフレーム単位ベースで行われる。スピーチ中の休止に対して生成されるデータが少なくても、再合成された背景雑音の知覚される劣化は最小にされる。本発明の技術を使用すると、近い呼びの品質のスピーチが通常の会話において 8kbpsの最大データ速度および 3.5kbps程度の平均データ速度で達成されることができる。
本発明はスピーチ中の短い休止が検出されることを可能にするため、実効音声活動係数の減少が実現される。速度決定はハングオーバーなしにフレーム単位ベースで実行されることが可能であり、好ましい実施例においてデータ速度は典型的に20m秒のフレーム期間と同じ短さのスピーチ中の休止に対して低下される。したがって、音節間にあるような休止が捕捉される。この技術は、語句の間の長期間の休止だけでなく、短い休止もまた低速でエンコードされることができるため従来考えられるもの以上に音声活動係数を減少する。
速度決定はフレームベースで行われるため、音声活動ゲートシステムのようにワードの開始部分のクリッピングは存在しない。この特性のクリッピングは、スピーチの検出とデータの伝送の再スタートとの間の遅延のために音声活動ゲート化システムにおいて発生する。各フレームに基づいた速度決定の使用は、結果的に全ての転移が自然の音を有するスピーチを生じさせる。
常に伝送しているボコーダにより、話し手の周囲の背景雑音は連続的に受信端で聞取られ、それによってスピーチ休止中さらに自然な音を生成する。したがって、本発明は背景雑音に滑らかな転移を与える。聞き手がスピーチ中の背景雑音において聞取るものは、音声活動ゲートシステムのように休止中に合成された快適な雑音に突然変化しない。
背景雑音は伝送のために連続的にボコード化されるため、背景の重要な事象は完全に明瞭に送られることができる。ある場合には、重要な背景雑音は最高の速度でコード化されてもよい。最大速度のコード化は、例えば大声で話している者が背景にいる場合、または街路にいる利用者の側を救急車が通過した場合に発生する。しかしながら、一定な、または遅く変化する背景雑音は低速でエンコードされる。
可変速度ボコード化の使用は、デジタルセル電話機システムに基づいたコード分割多重アクセス(CDMA)の能力を2以上の係数だけ高めることを約束する。CDMAによりチャンネル間の干渉は任意のチャンネル上のデータ伝送の速度が減少すると自動的に低下するため、CDMAおよび可変速度ボコードが特に整合される。対照的に、TDMAまたはFDMAのような伝送スロットが割当てられるシステムを考慮すると、このようなシステムがデータ伝送速度の低下を利用するために、別の利用者に未使用のスロットの再割当てを調整するために外部的な介入が要求される。このような方式に固有の遅延はチャンネルが長いスピーチ休止中だけ再度割当てられることを示唆している。したがって、十分な利点が音声活動係数から得られることができない。しかしながら、外部調整により、可変速度ボコードは示された別の理由からCDMA以外のシステムで有効である。
CDMAシステムにおいて、スピーチ品質は余分のシステム容量が所望された時に少し劣化される可能性がある。概略的に述べると、ボコーダは異なる結果的なスピーチ品質で異なる速度で全て動作する多数のボコーダと考えられる。したがって、スピーチ品質はデータ伝送の平均速度をさらに減少するために混合されることがてきる。最初の実験は、全速度および半分の速度のボコード処理されたスピーチを混合することによって例えば最大の許容可能なデータ速度が 8kbpsと 4kbpsとの間でフレーム単位ベースで変化され、結果的にスピーチは最大 4kbpsの半分の速度の変数より良好であるが、最大 8kbpsの全速度変数ほど良くない品質を有することを示している。
大部分の電話機会話において、1人の人間だけが一時に話すことが良く知られている。完全な二重電話リンク用の付加的な機能として、速度インターロックが設けられてもよい。リンクの1方向が最高の伝送速度で送信している場合、リンクの他の方向の送信は強制的に最低速度にされる。リンクの2つ方向間のインターロックは、リンクの各方向の50%以下の平均使用を保証することができる。しかしながら、活動ゲート化時の速度インターロックの場合のように、チャンネルがゲート制御でオフされる場合、聞き手が話し手を遮って会話における話し手の役割を引継ぐ方法はない。本発明は、ボコード速度を設定する制御信号によって速度インターロックの能力を容易に提供する。
最後に、可変速度ボコード方式を使用することによって、信号情報はスピーチ品質に対する非常に小さい影響を与えるだけでスピーチデータとチャンネルを共有することができることに留意しなければならない。例えば、高速フレームは低速音声データを送る半分および信号伝送データ用の別の半分との2つの部分に分割される。好ましい実施例のボコーダにおいて、全速度および半分の速度のボコードされたスピーチ間のスピーチ品質における小さい劣化だけが実現される。したがって、別のデータと共有された伝送用の低速でのスピーチのボコードは結果的に利用者に対してほとんど知覚不可能な差を生じるだけである。
本発明によると、スピーチおよび、または背景雑音のような音は、良く知られた技術を使用してサンプルされ、デジタル化される。例えば、アナログ信号はμ法則/均一コード変換によって後続される標準方式の 8ビット/μ法則フォーマットによってデジタルフォーマットに変換される。その代わりとして、アナログ信号は均一なパルスコード変調(PCM)フォーマットでデジタル形態に直接変換されてもよい。したがって、好ましい実施例における各サンプルはデータの1つの16ビットワードによって表される。サンプルは、各フレームが予め定められた数のサンプルから成る入力データのフレームに構成される。ここに示された実施例において、 8kHzのサンプリング速度が考慮される。各フレームは、 8kHzのサンプル速度で 160個のサンプルまたは20m秒のスピーチから成る。別のサンプリング速度およびフレーム寸法が使用されてもよいことが理解されなければならない。
ボコードの分野はスピーチコード化用の多数の異なる技術を含み、そのうちの1つはCELPコード化技術である。CELPコード化技術の要約は、上記の文献(“A 4.8kbps Code Excited Linear Oredictive Coder”)に記載されている。本発明は、一定数のサンプルでLPC解析が実行され、ピッチおよびコードブック探索が伝送速度に応じて変化している数のサンプルで実行されるコード化されたスピーチデータにおける可変速度を提供するようにCELPコード化技術の形態を実行する。概念において、本発明に適用されるCELPコード化は図10および図12を参照して論じられる。
本発明の好ましい実施例において、スピーチ解析フレームは長さが20m秒であり、抽出されたパラメータは1秒当たり50回のバーストで伝送されることを意味する。さらに、データ伝送速度はほぼ 8kbpsから 4kbps、 2kbpsおよび 1kbpsに変化される。全速度(速度1と示す)で、データ伝送は8.55kbpsの速度であり、パラメータは11ビットの内部CRC(サイクル冗長検査)を含む 171ビットを使用する各フレームに対してエンコードされる。CRCビットがない場合、速度は 8kbpsである。半分の速度(速度1/2と示す)において、データ伝送は 4kbpsの速度であり、パラメータは80ビットを使用する各フレームに対してエンコードされる。1/4速度(速度1/4と示す)において、データ伝送は 2kbpsであり、パラメータは40ビットを使用する各フレームに対してエンコードされる。1/8速度(速度1/8と示す)において、データ伝送は 1kbpsであり、パラメータは16ビットを使用する各フレームに対してエンコードされる。
図1は、スピーチデータ10の一例の解析フレームおよびLPC解析で使用されるハミングウインドウ12の関係をグラフで示す。異なる速度に対するLPC解析フレームおよびピッチおよびコードブックサブフレームは図6乃至図9においてグラフで示されている。全ての速度に対するLPC解析フレームは、同じ大きさであることを理解しなければならない。
図面を参照すると、特に図1において、LPC解析はハミングウインドウ12を使用してウインドウ化されるフレーム10の 160個のスピーチデータサンプルを使用して行われる。図1に示されているように、サンプルs(n)は各フレーム内において 0乃至159 の番号を付けられる。ハミングウインドウ12は、それが60個のサンプルによってフレーム10内においてオフセットされるように位置される。したがって、ハミングウインドウ12は現在のデータフレム10の60番目のサンプル、s(59)でスタートして連続し、後続するデータフレーム14の59番目のサンプル、s(58)を含む。したがって、現在のフレームであるフレーム10に対して生成された加重されたデータはまた次のフレームであるフレーム14からのデータに基づいたデータを含む。
データ伝送速度に応じて、図2乃至図5に示されているようなデータフレーム10の異なるサブフレーム上で多数回ピッチフィルタおよびコードブック励起パラメータを計算するために探索が実行される。好ましい実施例において、以下説明されるようにピッチおよびコードブック探索が選択された速度に対応した種々の寸法のサブフレームにおいて実行されるように、1つの速度だけがフレーム10に対して選択されることが理解されなければならない。しかしながら、説明のために、フレーム10の好ましい実施例の種々の許容された速度に対するピッチおよびコードブックのサブフレーム構造探索は、図2乃至図5に示されている。
全ての速度において、図1に示されているように1フレーム10当り1つのLPC計算が存在する。図2に示されているように、全速度において各ピッチサブフレーム16に対して2つのコードブックサブフレーム18が存在している。全速度において4つの各ピッチサブフレーム16に対して1つづつであり、それぞれ40個のサンプル長( 5m秒)の4つのピッチ更新が存在する。さらに、全速度において8つの各ピッチサブフレーム16に対して1つづつであり、それぞれ20個のサンプル長( 2.5m秒)の8つのコードブック更新が存在している。
1/2速度において、図3に示されているように各ピッチサブフレーム20に対して2つのコードブックサブフレーム22が存在する。ピッチは2つの各ピッチフレーム20のそれぞれに対して1度づつ2度更新され、一方コードブックは4つの各コードブックサブフレーム22に対して1度づつ4度更新される。1/4の速度において、図4に示されているように、単一のピッチサブフレーム24に対して2つのコードブックサブフレーム26が存在する。ピッチはピッチサブフレーム24に対して1度更新され、一方コードブックは2つの各コードブックサブフレーム26に対して1度づつ2度更新される。図5に示されているように、1/8の速度においてピッチは決定されず、コードブックはフレーム10に対応したフレーム28において一度だけ更新される。
さらに、LPC係数は1フレーム当り1度だけ計算されるが、それらは各サブフレーム上に中心を持つハミングウインドウによりLPC解析の結果を近似するように前のフレームからの結果的なLSP周波数を使用して4度までラインスペクトル対(LSP)表示を使用して直線的に補間される。例外は、全速度においてLPC係数がコードブックサブフレームに対して補間されないことである。さらに、LSP周波数計算に関する詳細を以下説明する。
ピッチおよびコードブック探索を少ない頻度で実行することに加えて、少ないビットはまたLPC係数の伝送に割当てられる。種々の速度で割当てられたビットの数は図6乃至図9に示されている。図6乃至図9はそれぞれスピーチの各 160のサンプルフレームに割当てられるボコーダエンコードされたデータビットを表す。図6乃至図9において、各LPCブロック30a乃至30dの数は、短期間LPC係数をエンコードするために対応した速度で使用されるビットの数である。好ましい実施例において、全速度、1/2速度、1/4速度および1/8速度においてLPC係数をエンコードするために使用されたビットの数はそれぞれ40、20、10および10である。
可変速度コード化を実行するために、LPCは最初にラインスペクトル対(LSP)に変換され、結果的なLSP周波数はDPCMコーダを使用して個々にエンコードされる。LPCのオーダは10であるため、10個のLSP周波数および10個の独立したDPCMコーダが存在する。DPCMコーダに対するビット割当ては表Iに示されている。
Figure 2006079107
エンコーダおよびデコーダの両方において、LSP周波数はピッチおよびコードブック探索における使用の前にLPCフィルタ係数に変換される。
ピッチ探索に関して、図6に示されているような全速度において、ピッチ更新は各1/4のスピーチフレームに対して1度づつ4度計算される。全速度での各ピッチ更新に対して、10ビットは新しいピッチパラメータをエンコードするために使用される。ピッチ更新は図7乃至図9に示されているように別の速度に対して変化する回数で実行される。速度が減少すると、ピッチ更新の数もまた減少する。図7は、スピーチフレームの各半分に対して1度づつ2度計算される1/2速度に対するピッチ更新を示す。同様に、図8は全ての各スピーチフレームで一度計算される1/4速度に対するピッチ更新を示す。全速度に対するように、10ビットは1/2および1/4速度の各ピッチ更新に対して新しいピッチパラメータをエンコードするために使用される。しかしながら、図9に示されているように1/8速度に対して、この速度は少数のスピーチしかないか、或はスピーチが存在せず、ピッチ冗長性が存在しないときにフレームをエンコードするために使用されるため、ピッチ更新は計算されない。
各10ビットのピッチ更新に対して、7ビットはピッチ遅延を表し、3ビットはピッチ利得を表す。ピッチ遅延は17と143との間であるように限定される。ピッチ利得は、3ビット値による表示のために0と2の間に直線的に量子化される。
コードブック探索に関して、図6に示されたように全速度において、コードブック更新はスピーチフレームの各1/8に対して1度づつ8度計算される。全速度における各コードブック更新に対して、10ビットは新しいコードブックパラメータをエンコードするために使用される。コードブック更新は、図7乃至図9に示されているように他の速度において変化する回数行われる。しかしながら、速度が減少すると、コードブック更新の数も減少する。図7は、スピーチフレームの各1/4に対して1度づつ4度計算される1/2速度に対するコードブック更新を示す。図8は、スピーチフレームの各1/2に対して1度づつ2度計算される1/4に対するコードブック更新を示す。全速度に対するように、10ビットは1/2および1/4速度の各ピッチ更新に対して新しいコードブックパラメータをエンコードするために使用される。最後に、図9は全ての各スピーチフレームに対して1度計算される1/8速度に対するコードブック更新を示す。1/8速度で2ビットがコードブック利得を表し、他の4ビットがランダムビットである6ビットが伝送されることに留意しなければならない。以下、コードブック更新用のビット割当てに関してさらに詳細に説明する。
データビットを表すコードブック更新のために割当てられるビットは、ピッチ予測残留物をベクトル量子化することを必要とした。全速度、1/2および1/4速度に対して、各コードフック更新は、10ビット全体に対してコードブックインデクスの7ビットプラスコードブック利得の3ビットからなる。コードブック利得は、対数ドメインで動作する微分パルスコード変調(DPCM)コーダを使用してエンコードされる。類似したビット構造が1/8速度に対して使用されることができるが、別の方式が好ましい。1/8速度に対して、コードブック利得は2ビットによって表され、一方ランダムに発生された4ビットはコードブックと置換する疑似ランダム数発生器に対するシードとして受信されたデータと共に使用される。
図10に示されたエンコーダのブロック図を参照すると、開ループモードでLPC解析が行われる。入力スピーチサンプルs(n)の各フレームから、係数(α1 乃至α10)は、以下説明されるようにフォルマント合成フィルタ60における使用のためにLPC解析/量子化装置50によって計算される。
しかしながら、ピッチ探索の計算は解析合成方法と呼ばれる閉ループモードで行われる。しかしながら、構成において新しいハイブリッド閉ループ/開ループ技術がピッチ探索を行うために使用される。ピッチ探索において、エンコード処理は入力スピーチと合成スピーチとの間の2乗平均エラーを最小にするパラメータを選択することによって実行される。簡明化のために、この説明部分において速度の問題は考慮しない。しかしながら、ピッチおよびコードブック探索における選択された速度の影響に関する説明を以下さらに詳細に述べる。
図10に示された概念的な実施例において、知覚加重フィルタ52は以下の式を特徴とする:
Figure 2006079107
はフォルマント予測フィルタであり、μは知覚加重パラメータであり、実施例においてμ=0.8 である。ピッチ合成フィルタ58は以下の式によって特徴付けられる:
1/P(z)=1/(1−bz−L) (3)
以下に説明される加重フィルタであるフォルマント合成フィルタ60は、以下の式を特徴とする:
H(z)=[1/A(z)]W(z)
=1/A(z/μ) (4)
入力スピーチサンプルs(n)は、加重されたスピーチサンプルx(n)が加算器62の和入力に供給されるように知覚加重フィルタ52によって加重される。知覚加重は、小さい信号パワーしかない周波数でエラーに加重するために使用される。これらの低い信号パワー周波数において、雑音はさらに知覚的に顕著である。合成スピーチサンプルx´(n)は、サンプルx(n)から減算される加算器62の差入力にフォルマント合成フィルタ60から出力される。加算器62から出力されたサンプルの差は、それらが2乗され、その後加算される2乗平均エラー(MSE)素子64に入力される。MSE素子64の計算結果は、ピッチ遅延L、ピッチ利得b、コードブックインデクスIおよびコードブック利得に対する値を生成する最小化素子66に供給される。
最小化素子66において、P(z)中のピッチ遅延パラメータLに対する全ての可能な値は、乗算器56から値c(n)と共にピッチ合成フィルタ58に入力される。ピッチ探索中、コードブックからの影響はない。すなわちc(n)=0である。入力スピーチと合成スピーチとの間の加重されたエラーを最小化するLおよびbの値は最小化素子66によって選択される。ピッチ合成フィルタ58は値p(n)を生成し、フォルマント合成フィルタ60に出力する。ピッチフィルタに対するピッチ遅延Lおよびピッチ利得bが見出だされると、コードブック探索は同じ方法で行われる。
図10は、本発明において行われた解析合成方法を概念的に表したものであることを理解すべきである。本発明の実施例において、フィルタは典型的な閉ループフィードバック構造において使用されない。本発明において、フィードバック接続は探索中に破断され、開ループフォルマント残留物と置換され、以下においてこの詳細を述べる。
最小化素子66は、コードブックインデクスIおよびコードブック利得Gに対する値を生成する。コードブックインデクスIにしたがって複数のランダムガウスベクトル値から選択されたコードブック54からの出力値は、ピッチ合成フィルタ58において使用された値c(n)のシーケンスを生成するためにコードブック利得Gによって乗算器56において乗算される。2乗平均エラーを最小化するコードブックインデクスIおよびコードブック利得Gは伝送のために選択される。
知覚的加重W(z)は知覚加重フィルタ52によって入力スピーチに、またフォルマント合成フィルタ60内に含まれる加重関数によって合成スピーチに供給されることに留意すべきである。したがって、フォルマント合成フィルタ60は実際に典型的なフォルマント予測フィルタ特性1/[A(z)]と式1の加重関数を結合し、結果的に式3の加重されたフォルマント合成関数を生じさせる加重されたフォルマント合成フィルタである。
その代りに、知覚加重フィルタ52は加算器62とMSE素子64との間に位置されることが理解されるべきである。この場合、フォルマント合成フィルタ60は通常のフィルタ特性1/[A(z)]を有する。
図11は、図10のエンコーダによるスピーチのエンコード化に含まれるステップのフローチャートを示す。説明のために、速度決定を含むステップが図11のフローチャートに含まれる。デジタル化されたスピーチサンプルはブロック80でサンプリング回路から得られ、その後LPC係数がブロック82でサンプリング回路から計算される。LPC係数計算の一部分としてハミングウインドウおよび自己相関技術が使用される。開始速度決定は、好ましい実施例においてブロック84でフレームエネルギに基づいた重要なフレームに対して行われる。
小さい数のビットでLPC係数を効率的にコード化するために、LPC係数はブロック86でラインスペクトル対(LSP)周波数に変換され、その後ブロック88に伝送するために量子化される。選択として、付加的な速度決定はブロック90で行われ、ブロック92において最初の速度に対するLSPの量子化が不十分であると考えられた場合に速度の増加が行われる。
解析下のスピーチフレームの第1のピッチサブフレームに対して、LSP周波数はブロック94でピッチ探索の実行に使用するために挿入され、LPC係数に変換される。ピッチ探索において、コードブック励起はゼロに設定される。ピッチ探索において、可能な各ピッチ遅延Lに対する前述のような合成方法による解析であるブロック96および98において、合成スピーチは元のスピーチと比較される。整数値であるLの各値に対して、最適なピッチ利得bが決定される。Lおよびbの組のうち最適なLおよびb値の組は、合成スピーチと元のスピーチとの間に最小の知覚加重された2乗平均エラーを提供する。そのピッチサブフレームに対して決定されたLおよびbの最適値に対して、値bは対応したL値と共に伝送するためにブロック100 で量子化される。ピッチ探索の別の実施例において、値bはピッチ探索の一部分として量子化された値であり、これらの量子化された値はピッチ探索を行う時に使用される。したがって、この構成において、ブロック100 におけるピッチ探索後に選択されたb値の量子化は不要である。
解析下のスピーチフレームの第1のコードブックサブフレームに対して、ブロック102 においてコードブック探索の実行時に使用するために、LSP周波数が補間され、LPC係数に変換される。しかしながら、実施例において全速度でLSP周波数はピッチサブフレームレベルだけに補間される。この補間および変換ステップは、ピッチデータが計算されないため結果が実質的に意味のない速度1/8を除いて、各速度に対するピッチおよびコードブックサブフレーム寸法の差のためにピッチ探索のものに加えてコードブック探索のために実行される。コードブック探索において、ブロック104 および106 で最適ピッチ遅延Lおよびピッチ利得bの値は、可能な各コードブックインデクスIに対して合成スピーチが元のスピーチと比較されるようにピッチ合成フィルタにおいて使用される。整数値であるIの各値に対して、最適なコードブック利得Gが決定される。IおよびGの値の組のうち最適なIおよびG値の組が合成スピーチと元のスピーチとの間に最小エラーを提供する。そのコードブックサブフレームに対して決定されたIおよびGの最適な値に対して、値Gは対応したI値と共に伝送するためにブロック108 で量子化される。コードブック探索の別の実施例において、Gの値はコードブック探索の一部分として量子化され、これらの量子化された値はコードブック探索の実行時に使用される。この別の実施例において、ブロック108 におけるコードブック探索後に選択されたG値の量子化は不要である。
コードブック探索後、エンコーダ内のデコーダはI、G、Lおよびbの最適値でランされる。エンコーダのデコーダのランは、将来のサブフレームにおける使用のためにエンコーダフィルタメモリを再構成する。
ブロック110 において、解析が終了されたコードブックサブフレームがピッチ探索が行われたピッチサブフレームに対応したコードブックサブフレームの組の最後のコードブックサブフレームであるか否かを決定するために検査が行われる。換言すると、ピッチサブフレームに対応したコードブックサブフレームがさらに存在しているか否かに関する決定が行われる。実施例において、1ピッチサブフレーム当り2つのコードブックサブフレームだけが存在している。ピッチサブフレームに対応した別のコードブックサブフレームがあることが決定された場合、ステップ102 乃至ステップ108 はそのコードブックサブフレームに対して反復される。
ピッチサブフレームに対応したコードブックサブフレームがなければ、ブロック112 においてその他のピッチサブフレームが解析下のスピーチフレーム内に存在しているか否かを決定するために検査が行われ、各ピッチサブフレームおよび対応したコードブックサブフレームに対してステップ94乃至110 が反復される。解析下の現在のスピーチフレームに対する全ての計算が終了されたとき、スピーチフレームに対するLPC係数を表す値、各ピッチサブフレームに対するピッチ遅延Lおよび利得b、および各コードブックサブフレームに対するコードブックインデクスIおよび利得Gはブロック114 において伝送のためにパックされる。
図12を参照すると、LPC係数(αi)に対して受信された値、ピッチ遅延および利得(L&b)およびコードブックインデクスおよび利得(I&G)がスピーチを合成するために使用されるデコーダブロック図が示されている。図12において、図10のように速度情報は説明を簡単にするために考慮しない。データ速度情報はサイド情報として送信されることが可能であり、場合によってはチャンネル復調段で導出されることができる。
デコーダは、受信されたコードブックインデクスを備えた、すなわち1/8速度のランダムシードを提供するコードブック130 から構成されている。コードブック130 からの出力は乗算器132 の1つの入力に供給され、一方乗算器132 の別の入力はコードブック利得Gを受信する。乗算器132 の出力は、ピッチ遅延Lおよび利得bと共にピッチ合成フィルタ134 に供給される。ピッチ合成フィルタ134 からの出力は、LPC係数αと共にフォルマント合成フィルタ136 に供給される。フォルマント合成フィルタ136 からの出力は、再構成されたスピーチがフィルタ処理されて出力される適応ポストフィルタ138 に供給される。以下説明するように、デコーダの変形はエンコーダ内において行われる。エンコーダのデコーダは適応ポストフィルタ138 を含まないが、知覚加重フィルタを含んでいる。
図13は、図12のデコーダの動作に対応したフローチャートである。ブロック150 で、デコーダにおいてスピーチは受信されたパラメータから再構成される。特に、ブロック152 においてコードブックインデクスの受信された値は、コードベクトルまたはコードブック出力値を生成するコードブックに入力される。乗算器は受信されたコードブック利得Gと共にコードベクトルを受信し、ブロック154 でこれらの値を乗算し、結果的な信号がピッチ合成フィルタに供給される。コードブック利得Gは、受信されたDPCMパラメータをデコード化し、逆量子化することによって再構成されることに留意しなければならない。ピッチ合成フィルタは、ブロック156 で乗算器出力をフィルタ処理するように乗算器の出力信号と共に受信されたピッチ遅延Lおよび利得b値を供給される。
ピッチ合成フィルタによってコードブックベクトルをフィルタ処理することから結果的に生じた値は、フォルマント合成フィルタに入力される。ブロック158において、ピッチ合成フィルタ出力信号のフィルタ処理に使用するためにLPC係数αもまたフォルマント合成フィルタに供給される。LPC係数は、量子化されたLSP周波数に受信されたDPCMパラメータをデコード化し、LSP周波数を逆量子化し、LPC係数αiにLSP周波数を変換することによって補間のためにデコーダで再構成される。ブロック160 において、フォルマント合成フィルタからの出力は量子化雑音がマスクされる適応ポストフィルタに供給され、再構成されたスピーチが利得制御される。ブロック162 において、再構成されたスピーチはアナログ形態への変換のために出力される。
図14および図15のブロック図を参照すると、本発明のスピーチエンコード技術がさらに詳細に示されている。図14において、デジタル化されたスピーチサンプルの各フレームは、自己相関サブシステム202 における自己相関係数の計算前に入力スピーチがウインドウ処理されるハミングウインドウサブシステム200 に供給される。
図16においてハミングウインドウサブシステム200 および自己相関サブシステム202 の1実施例が示されている。ハミングウインドウサブシステム200 は検索表250 、典型的には80×16ビットの読取り専用メモリ(ROM)および乗算器252 から構成されている。各速度に対してスピーチのウインドウは、160 サンプル長である各解析フレームの139 番目と140 番目のサンプル間に中心を有する。したがって、自己相関係数を計算するウインドウは、60サンプルだけ解析フレームからずらされる。
ウインドウ処理は、ハミングウインドウが中心に関して対称的であるため、160 個のWH (n)値の80個を含むROM表を使用して実行される。ハミングウインドウのオフセットは、解析フレームの第1のサンプルに関して60個の位置だけROMのアドレスポインタを歪めることによって行われる。これらの値は、乗算器252 によって対応した入力スピーチサンプルと1度正確に乗算される。s(n)を解析ウインドウ中の入力スピーチ信号とする。ウインドウ処理されたスピーチ信号sw (n)は次のように定められる:
Figure 2006079107
検索表250 の内容の例示的な16進法の値は表IIに示されている。これらの値は、14の分数ビットを有する2の補数として表され、表は左から右、上から下の順序で読取られる。
Figure 2006079107
自己相関サブシステム202 はレジスタ254 、マルチプレクサ256 、シフトレジスタ258 、乗算器260 、加算器262 、循環シフトジスタ264 およびバッファ266から構成されている。ウインドウ化されたスピーチサンプルSw(n)は20m秒ごとに計算され、レジスタ254 にラッチされる。サンプルSw(0)において、LPC解析フレームの第1のサンプル、シフトレジスタ258 および264 は0にリセットされる。各新しいサンプルSw(n)において、マルチプレクサ256 はサンプルがレジスタ254 から入力することを可能にする新しいサンプル選択信号を受信する。新しいサンプルw(n)はまたシフトレジスタ258 の最後の位置SR10にあるサンプルSw(n−10)によって乗算される乗算器260 に供給される。結果的な値は循環シフトレジスタ264 の最後の位置CSR11にある値と加算器262 において加算される。
シフトレジスタ258 および260 が一度クロックされると、シフトレジスタ258の第1の位置SR1 においてSw (n)によりSw (n−1)を置換し、位置CSR10における前の値を置換する。シフトレジスタ258 のクロック時に、新しいサンプル選択信号は、シフトレジスタ260 の現在の位置SR10におけるサンプルSw (n−9)がマルチプレクサ256 に入力することが許容されるようにマルチプレクサ256 への入力から除去される。循環シフトレジスタ264 において、位置CSR11における前の値は第1の位置CSR1 にシフトされる。マルチプレクサから除去された新しいサンプル選択信号により、シフトレジスタ258 は循環シフトレジスタ264 と同様にシフトレジスタにおいてデータの循環シフトを行うように設定する。
シフトレジスタ258 および264 の両者は、11回の乗算/累算動作が実行されるように全ての各サンプルにおいて11回クロックされる。160 個のサンプルがクロックされた後、循環シフトレジスタ264 に含まれる自己相関結果は値R(0)−R(10)としてバッファ266 中にクロックされる。全てのシフトレジスタはゼロにリセットされ、プロセスはウインドウ化されたスピーチサンプルの次のフレームに対して反復する。
図14を参照すると、自己相関係数がスピーチフレームに対して一度計算されると、速度決定サブシステム204 およびLPC解析サブシステム206 はフレームデータ速度およびLPC係数をそれぞれ計算するためにこのデータを使用する。これらの動作は互いに独立しているため、それらは任意の順序で、または同時に計算される。ここにおいて説明のために、速度決定を最初に説明する。
速度決定サブシステム204 は(1)現在のフレームの速度を決定し、(2)背景雑音レベルの新しい評価を計算する2つの機能を有する。現在の解析フレームに対する速度は最初に現在のフレームエネルギ、背景雑音レベルの前の評価、前の速度および制御マイクロプロセッサからの速度命令に基づいて決定される。新しい背景雑音レベルは、背景雑音レベルの前の評価および現在のフレームエネルギを使用して評価される。
本発明は、速度決定のために適用しきい値技術を使用する。背景雑音が変化すると、速度を選択する時に使用されるしきい値はそのように変化する。実施例において、3つのしきい値は速度選択RTp を予備的に決定するために計算される。しきい値は前の背景雑音評価の直角位相関数であり、以下のように示される:
Figure 2006079107
ここで、Bは前の背景雑音評価である。
フレームエネルギは、3つのしきい値T1(B)、T2(B)およびT3(B)に対して比較される。フレームエネルギが3つの全てのしきい値より下である場合、伝送の最低速度(1kbps)、RTp =4である速度1/8が選択される。フレームエネルギが2つのしきい値より下である場合、伝送の第2の速度(2kbps)、RTp =3である速度1/4が選択される。フレームエネルギがただ1つのしきい値より下である場合、伝送の第3の速度(4kbps)、RTp =2である速度1/2が選択される。フレームエネルギが全てのしきい値より上である場合、伝送の最高速度(8kbps)、RTp =1である速度1が選択される。
予備速度RTp は前のフレームの最終速度RTr に基づいて修正されてもよい。予備速度RTp が前のフレームの最終速度マイナス1(RTr −1)より小さい場合、中間速度RTm が設定され、ここでRTm =(RTr −1)である。この修正プロセスは、高エネルギ信号から低エネルギ信号への転移が発生した場合に速度をゆっくりとして傾斜で低下させる。しかしながら、開始速度選択が前の速度マイナス1 (RTr −1)に等しいか、またはそれより大きい場合、中間速度RTm は予備速度RTp と同じに、すなわちRTm =RTp に設定される。この状況において、低エネルギ信号から高エネルギ信号への転移が発生したとき、速度は直に増加する。
最後に、中間速度RTm はさらにマイクロプロセッサからの速度制限命令によって修正される。速度RTm がマイクロプロセッサによって許容された最高速度より大きい場合、開始速度RTi は最高許容速度に設定される。同様に、中間速度RTm がマイクロプロセッサによって許容された最低速度より小さい場合、開始速度RTi は最低許容値に設定される。
ある場合、マイクロプロセッサによって決定された速度で全てのスピーチをコード化することが所望される。速度制限命令は、所望される速度に最大および最小許容速度を設定することによって所望される速度でフレーム速度を設定するために使用されることができる。速度制限命令は、速度インターロック並びにかすみおよびバースト伝送のような特別な速度制御状況に対して使用され、これら両者については以下説明される。
図17は速度決定アルゴリズムの1実施例を提供する。計算をスタートするために、レジスタ270 は加算器272 に供給される値1により予め負荷される。循環シフトレジスタ274 ,276 および278 はそれぞれ直角位相しきい値の式(7)乃至(9)の第1、第2および第3の係数により負荷される。例えば、循環シフトレジスタ274 の最後、中間および最初の位置はそれぞれT1 ,T2 およびT3 が計算される式の第1の係数により負荷される。同様に、循環シフトレジスタ276の最後、中間および最初の位置はそれぞれT1 ,T2 およびT3 が計算される式の第2の係数により負荷される。最後に、循環シフトレジスタ278 の最後、中間および最初の位置はそれぞれT1 ,T2 およびT3 が計算される式の定数の項により負荷される。各循環シフトレジスタ274 ,276 および278 において、値は最後の位置から出力される。
第1のしきい値T1 を計算する時、前のフレームの背景雑音評価Bは乗算器280 においてそれ自身の値を乗算することによって平方される。結果的な値B2 の値は、循環シフトレジスタ274 の最後の位置から出力された第1の係数 -5.544613(10-6)により乗算される。この結果的な値は、乗算器284 からの背景雑音Bと循環シフトレジスタ276 の最後の位置から出力された第2の係数4.047152の積と加算器286 において加算される。その後、加算器286 からの出力値は、循環シフトレジスタ278 の最後の位置から出力された定数項363.1293と加算器288 において加算される。加算器288 からの出力はT1 の計算された値である。
加算器288 から出力されたT1 の計算された値は、実施例では自己相関サブシステムから供給された直線ドメイン中の値R(0)であるフレームエネルギEfから加算器290 において減算される。
別の実施例において、フレームエネルギEf はそれが実効的なウインドウ長により正規化された第1の自己相関係数R(0)の対数によって近似されるdBの対数ドメインで表される:
Figure 2006079107
ここでLA は自己相関ウインドウ長である。音声活動はまたピッチ予測利得またはフォルマント予測利得Ga を含む種々の別のパラメータから測定されてもよいことが理解されなければならない:
Figure 2006079107
ここでE(10)は、10番目の反復後の予測残留エネルギであり、E(0) はR(0)と同じであるLPC解析に関して以下説明するように最初のLPC予測残留エネルギである。
加算器290 の出力から、結果的な2の補数差の符号ビットの補数は比較器またはリミタ292 によって抽出され、レジスタ270 の出力と加算される加算器272 に供給される。したがって、R(0)とT1 との間の差が正ならば、レジスタ270は1だけインクレメントされる。差が負ならば、レジスタ270 は同じ状態である。
循環レジスタ274 、276 および278 はその後循環され、T2 に対する式である式(8)の係数がその出力に現れる。しきい値T2 を計算し、フレームエネルギとそれを比較するプロセスはしきい値T1 に対するプロセスに関して述べられたように反復される。循環レジスタ274 、276 および278 は、T3 に対する式である式(9)の係数がその出力に現れるように循環。しきい値T3 に対する計算およびフレームエネルギに対する比較は上記のように行われる。3つのしきい値計算および比較の終了後、レジスタ270 は開始速度評価RTi を含む。予備速度評価RTp は速度ランプダウン論理回路294 に供給される。前のフレーム最終速度RTr はまたレジスタ298 に蓄積されるLSP周波数量子化サブシステムから論理回路294 に供給される。論理回路296 は値(RTr −1)を計算し、予備速度評価RTp および値(RTr −1)の大きいほうを出力として供給する。値RTm は速度リミタ論理回路296 に供給される。
上記のように、マイクロプロセッサはボコーダ、特に論理回路296 に速度制限命令を供給する。デジタル信号プロセッサ構造において、この命令はエンコード化プロセスのLPC解析部分が終了される前に論理回路296 において受信される。論理回路296 は速度が速度制限を越えず、それが制限を越えた場合には値RTm を修正することを保証する。値RTm が許容速度の範囲内にある場合、それは開始速度値RTi として論理回路296 から出力される。開始速度値RTi は、図14のLSP量子化サブシステム210 に論理回路296 から出力される。
上記のような背景雑音評価は、適用速度しきい値を計算する時に使用される。現在のフレームに対して、前のフレーム背景雑音評価Bは現在のフレームに対する速度しきい値を設定する時に使用される。しかしながら、各フレームに対して背景雑音評価は、次のフレームに対する速度しきい値の決定に使用するために更新される。新しい背景雑音評価B´は、前のフレーム背景雑音評価Bおよび現在のフレームエネルギEf に基づいて現在のフレームにおいて決定される。
次のフレーム中に使用するための新しい背景雑音評価B´の決定(前のフレームの背景雑音評価Bのように)において、2つの値が計算される。第1の値V1は現在のフレームエネルギEf だけである。第2の値V2 はB+1およびKBの大きいほうであり、ここでK=1.00547 である。第2の値が大きくなり過ぎることを阻止するために、それは強制的に大きい定数M=160,000 より下にされる。2つの値V1 またはV2 の小さいほうが新しい背景雑音評価B´として選択される。数学的には、
Figure 2006079107
ここで最小(x,y)はxおよびyの最小値であり、最大 (x,y)はxおよびyの最大値である。
図17はさらに背景雑音評価アルゴリズムの実施例を示す。第1の値V1 は、マルチプレクサ300 の1つの入力に直接供給される現在のフレームエネルギEfだけである。
第2の値V2 は、最初に計算された値KBおよびB+1から計算される。値KBおよびB+1を計算する時に、レジスタ302 に蓄積された前のフレーム背景雑音評価Bは、加算器304 および乗算器306 に出力される。現在のフレームにおける使用のためにレジスタ302 に蓄積された前のフレーム背景雑音評価Bは、前のフレームにおいて計算された新しい背景雑音評価B´と同じであることを留意しなければならない。加算器304 はまた項B+1を生成するように値Bとの加算のために1の入力値を供給される。乗算器306 はまた項KBを生成するように値Bとの乗算のためにKの入力値を供給される。項B+1およびKBはそれぞれ乗算器308 および加算器310 の別々の両入力に加算器304 および乗算器306 から出力される。
加算器310 および比較器またはリミタ312 は、項B+1およびKBの大きいほうの選択時に使用される。加算器310 はKBから項B+1を減算し、比較器またはリミタ312 に結果的な値を供給する。リミタ312 は、項B+1およびKBの大きいほうとして出力を選択するようにマルチプレクサ308 に制御信号を供給する。選択された項B+1またはKBは、定数値Mより下の場合に選択された項を、或いは値Mより上の場合には値Mを供給する飽和タイプのリミタであるリミタ314 にマルチプレクサ308 から出力される。リミタ314 からの出力は第2の入力としてマルチプレクサ300 に、また1入力として加算器316 に供給される。
加算器316 はまた別の入力においてフレームエネルギEf を受信する。加算器316 および比較器またはリミタ318 は、値Ef およびリミタ314 から出力された項の小さい方を選択する時に使用される。加算器316 は、リミタ314 から出力された値からフレームエネルギ値を減算し、比較器またはリミタ318 に結果的な値を供給する。リミタ318 は、Ef 値およびリミタ314 からの出力の小さいほうを選択するためにマルチプレクサ300 に制御信号を供給する。マルチプレクサ300から出力された選択された値は、前のフレーム背景雑音評価Bとして次のフレーム中に使用するために蓄積されるレジスタ302 に新しい背景雑音評価B´として供給される。
再び図14,15を参照すると、各自己相関係数R(0)乃至R (10)は自己相関サブシステム202 からLPC解析サブシステム206 に出力される。LPC係数は、知覚加重フィルタ52およびフォルマント合成フィルタ60の両者においてLPC解析サブシステム206 中で計算される。
LPC係数は、文献( RabinerおよびSchafer 氏による “ Digital Processing of Speech Signals ”,Prentice-Hall,Inc., 1978年)において論じられるようにダービンの循環を使用する自己相関方法によって得られる。この技術は、LPC係数を得るための効率的な計算方法である。アルゴリズムは以下の式で表されることができる:
Figure 2006079107
10個のLPC係数は、 1≦j≦10に対してαj (10)のラベルを付けられる。
LPC係数をエンコードする前に、フィルタの安定性が保証されなければならない。フィルタの安定性は、ピーク周波数応答の大きさを減少し、一方ピークの帯域幅を拡大する少量だけ内側にフィルタ極を放射方向にスケールすることによって達成される。この技術は一般に帯域幅拡大として知られており、さらに文献( Tohkura氏他による“SpectralSmoothing in PARCOR Speech Analysis−Synthesis”,ASSP Transactions ,1978年12月)に示されている。この場合、帯域幅拡大は各LPC係数にスケールすることによって効率的に実行されることができる。したがって、表III に示されているように、結果的なLPC係数はそれぞれLPC解析サブシステム206 の最終的な出力LPC係数α1 乃至α10を生成するように対応した6つの値によって乗算される。表III に与えられた値は2の補数表記で15の小数ビットを持つヘキサデシマールで与えられる。この形態において、値 0×8000は値-1.0を表し、値 0×7333(または29491 )は0.899994=29491/32768 を表す。
Figure 2006079107
動作は、二重正確度すなわち32ビット除算、乗算および加算で実行されることが好ましい。二重正確度の正確さは自己相関関数およびフィルタ係数のダイナミック範囲を維持するために好ましい。
図18において、上記の式(15)乃至(20)を実行するLPCサブシステム206 の実施例のブロック図が示されている。LPCサブシステム206 は、主計算回路330 および主計算回路330 のレジスタを更新するために使用される2つのバッファ更新回路332 および334 の3つの回路部分から構成されている。計算はバッファ340 に値R(1)乃至R(10)を最初に負荷することによって開始される。計算を開始するために、レジスタ348 はマルチプレクサ344 を介して値R(1)により予め負荷される。レジスタはマルチプレクサ350 を介してR(0)により初期化され、バッファ352 (10個のαj(i―1) 値を保持する)はマルチプレクサ354 を介して全てゼロに初期化され、バッファ356 (10個のαj (i) 値を保持する)はマルチプレクサ358 を介して全てゼロに初期化され、iは計算サイクルのために1に設定される。簡明化のために、iおよびjに対するカウンタおよびその他の計算サイクル制御装置は示されていないが、このタイプの論理回路の設計および集積はデジタル論理回路設計で当業者の能力内において容易に実行される。
αj(i―1)値は、式(14)に示されているような項ki E(i―1)を計算するためにバッファ356 から出力される。各値R(i-j) は、乗算器360 におけるαj(i―1)値との乗算のためにバッファ340 から出力される。各結果的な値は、レジスタ346 中の値から加算器362 において減算される。各減算の結果は、次の項が減算されるレジスタ346 に蓄積される。式(14)の合計項に示されているように、i番目のサイクルには(i−1)の乗算および累算が存在する。このサイクルの終りにおいて、レジスタ346 中の値は値ki を生成するようにレジスタ348からの値E(i―1)により除算器364 で除算される。
その後、値ki は、上記の式(19)のように値E(i) を計算するためにバッファ更新回路332 において使用され、これはki の次の計算サイクル中に値E(i―1) として使用される。現在のサイクル値ki は、値ki を得るためにそれ自身乗算器366 において乗算される。その後、値ki は加算器368 において1の値から減算される。この加算の結果値は、乗算器370 においてレジスタ348 からの値E(i) と乗算される。結果的な値E(i) は、次のサイクルのために値E(i―1)として蓄積するためにマルチプレクサ350 を介してレジスタ348 に入力される。
値ki は、式(15)のように値αi(i) を計算するために使用される。この場合、値ki はマルチプレクサ358 を介してバッファ356 に入力される。値ki はまた式(18)のように値αj (i-1) から値αj(i) を計算するためにバッファ更新回路334 において使用される。バッファ352 に現在蓄積されている値は値αj(i) の計算時に使用される。式(18)に示されているように、i番目のサイクルには(i−1)の計算がある。i=1の反復において、このような計算は不要である。i番目のサイクルに対するjの各値に対して、αj(i) の値が計算される。αj(i) の各値の計算時にαi-j(i―1) の各値は加算器374 への出力のために乗算器374 において値ki と乗算される。加算器374 において、値ki αi-j(i―1) は加算器374 に入力される値αj(i―1) から減算される。各乗算および加算の結果は、αj(i) の値としてマルチプレクサ358 を介してバッファ356 に供給される。
現在のサイクルに対して値αi(i) およびαj(i) が計算されると、計算されバッファ356 に蓄積された値は、マルチプレクサ354 を介してバッファ352 に出力される。バッファ356 に蓄積された値は、バッファ352 中の対応した位置に蓄積される。このようにしてバッファ352 は、i+1番目のサイクルに対して値ki を計算するために更新される。
前のサイクルの終了時に生成されるデータαj(i―1) は、次のサイクル用の更新αj(i) を生成するために現在のサイクル中に使用されることに注意することが重要である。この前のサイクルデータは、次のサイクルのために更新されたデータを完全に生成するために保存されなければならない。したがって、2つのバッファ356 および352 は、更新されたデータが完全に生成されるまでこの前のサイクルデータを保存するために使用される。
上記の説明は、更新された値の計算の終了時におけるバッファ356 からバッファ352 へのデータの並列伝送に関して示されている。この構造は、単一バッファ構造において発生するような完全な使用前に古いデータを損うことなく古いデータが新しいデータを計算するプロセス全体中に保存されることを保証する。示された構造は、同じ結果を得るために容易に利用できるいくつかの構造の1つである。例えばバッファ352 および356 は、第1のバッファに蓄積された値から現在のサイクルに対する値ki を計算する時に、更新が使用前に次の計算サイクル中第2のバッファに蓄積されるように多重化されてもよい。この次の計算サイクルにおいて、値ki は第2のバッファに蓄積された値から計算される。第2のバッファ中の値および値ki は、次の計算サイクルに対する更新を生成するために使用され、これらの更新は第1のバッファに蓄積される。このバッファの交互動作は、更新が生成され、一方において更新を生成するために必要とされる進行している値を重ね書きせずに、更新された値を蓄積する計算サイクルの進行の反復を可能にする。この技術の使用が次のサイクルに対する値ki の計算に関連した遅延を最小にする。したがって、ki の計算における乗算/累算の更新はαj(i−1) の次の値が計算されるのと同時に実行されてもよい。
最後の計算サイクル(i=10)の終了時にバッファ356 に蓄積された10個のLPC係数αj(10)は、対応した最終のLPC係数αj に到達するようにスケールされる。スケール化は、表III におけるヘックス値である検索表342 に蓄積されたスケール値がマルチプレクサ344 を通過する出力に対して選択されるようにマルチプレクサ344 ,376 および378 にスケール選択信号を供給することによって行われる。検索表342 に蓄積された値は連続的にクロックされ、乗算器360 に入力される。乗算器360 はまたレジスタ356 から連続的に出力されたαj(10)の値をマルチプレクサ376 を介して受信する。スケール化された値は、マルチプレクサ378 を介して乗算器360 からLPC・LSP変換サブシステム208 に出力として出力される(図14,15)。
10個の各スケールされたLPC係数を小さい数のビットで効率的にエンコードするために、係数は文献(SoongおよびJuang氏による“Line Spectrum Pair (LSP)and Speech Data Compression”,ICASSP´84)に示されているようにラインスペクトル対周波数に変換される。LSPパラメータの計算は表IVと共に式(21)および(22)で以下に示されている。
LSP周波数は、以下の式の0乃至πの間に存在する10個の根である:
Figure 2006079107
ここでpn およびqn 値はn=1,2,3,4に対するものであり、表IVにおいてそれぞれ定められている。
Figure 2006079107
表IVにおいて、α1 ,…,α10の値はLPC解析の結果生じたスケールされた係数である。式(21)および(22)の10個の根は、簡明化のために 0乃至0.5の間でスケールされる。LSP周波数の特性は、LPCフィルタが安定しているならば2つの関数の根は交互することである。すなわち最低の根ω1 はP(ω)の最低の根であり、次に低い根ω2 はQ(ω)の最低の根である。10個の周波数のうち、奇数周波数はP(ω)の根であり、偶数周波数はQ(ω)の根である。
根の探索は以下のようにして行われる。最初に、上記のようにLPC係数を加算することによって二重正確度でpおよびq係数が計算される。その後、P(ω)はπ/256 ラジアンごとに評価され、これらの値は符号変化に対して評価され、それはサブ領域中の根を識別する。根が見出された場合、この領域の2つの境界の間の直線的な補間が根の位置を近似するために実行される。1つのQの根は、周波数の整列特性のためにPの根の各対の間に存在する(第5のQの根は第5のPの根とπとの間に存在する)ことが保証されている。2進法探索は、Qの根の位置を決定するためにPの根の各対の間で実行される。構造を容易にするために、各Pの根は最も近いπ/256 値によって近似され、2進法探索がこれらの近似値間において実行される。根が見出されない場合、根が見出だされた最後のフレームからのLSP周波数の前の量子化されていない値が使用される。
図19を参照すると、LSP周波数を生成するために使用される回路の実施例が示されている。上記の動作は、モード256 でカウンタ402 によってアドレスされるコサイン検索表400 に二重正確度で蓄積される 0乃至πの間の全体で257 個の可能なコサイン値を必要とする。検索表400 に入力されるjの各値に対して、cos ω, cos 2ω, cos 3ω, cos 4ω, cos 5ωの出力が供給され、ここにおいて:ω=jπ/256 (23)
ここでjはカウント値である。
検索表400 から出力された値cos ω, cos 2ω, cos 3ω, cos 4ωは、各乗算器404 ,406 ,408 および410 に入力され、一方値 cos 5ωは合計器412 に直接入力される。これらの値は、マルチプレクサ414 ,416 ,418 および420を介してそれに入力された値p4 ,p3 ,p2 およびp1 のそれぞれと各乗算器404,406 ,408 および410 において乗算される。この乗算の結果的な値は、また合計器412 に入力される。さらに値p5 として、一定の値0.5 、すなわち1/2 が乗算器424 にマルチプレクサ422 を通って供給され、この一定の値もまた乗算器424 に供給される。乗算器424 から出力された結果的な値は別の入力として合計器412 に供給される。マルチプレクサ414 乃至422 は、P(ω)およびQ(ω)の両値の計算に対して同じ回路を使用するようにp/q係数選択信号に応答して値p1 乃至p5 またはq1 乃至q5 の間で選択する。p1 乃至p5 またはq1 乃至q5 の値を生成する回路は示されていないが、p1 乃至p5 またはq1 乃至q5の値を蓄積するレジスタと共にLPC係数およびp1 乃至p5 またはq1 乃至q5 の値を加算および減算する一連の加算器を使用して容易に構成される。
合計器412 は、場合に応じて出力P(ω)またはQ(ω)を提供するために入力値を合計する。以下の説明を容易にするために、P(ω)の値の場合を考える。Q(ω)の値は、q1 乃至q5 の値を使用して同様にして計算される。P(ω)の現在の値は合計器412 から出力され、レジスタ426 に蓄積される。レジスタ426 に前に蓄積されたP(ω)の先行した値は、レジスタ428 にシフトされる。P(ω)の現在および前の値の符号ビットは、直線補間装置434 に送られるエネーブル信号の形態でゼロ交差または符号変化を示すために排他的オアゲート430において排他的オアされる。P(ω)の現在および前の値はまたゼロ交差が発生するP(ω)の2つの値の間の点を補間するためにエネーブル信号に応答する直線補間装置434 にレジスタ426 および428 から出力される。値(j−1)からの距離であるこの直線補間部分的値の結果は、カウンタ256 からの値jと共にバッファ436 に供給される。ゲート430 はまた値jおよび対応した部分的な値FVjの蓄積を可能にするバッファ436 にエネーブル信号を供給する。
部分的な値は加算器438 においてバッファ436 からの出力として値jから減算されるか、或はその代りとしてバッファ436 への入力としてそれから減算される。別の実施例において、値(j−1)がバッファ436 に入力され、部分的な値も入力されるように、バッファ436 へのjライン入力におけるレジスタが使用されてもよい。部分的な値は、レジスタ436 における蓄積の前またはその出力時に値(j−1)に加算される。いずれの場合でも、j+FVj または(j−1)+FVjの結合された値は入力定数値512 によって除算される除算器440 に出力される。除算動作は、表記的な2進ワード中の2進法の少数点位置を単に変化するだけで簡単に実行される。この除算動作は、 0乃至0.5 の間のLSP周波数に到達するために必要なスケール処理を実行する。
P(ω)またはQ(ω)の各関数評価には、5つのコサイン検索表、4つの二重正確度乗算および4つの加算が必要とされる。計算された根は典型的に約13ビットまで正確であり、単一正確度で蓄積される。LSP周波数は量子化のためにLSP量子化サブシステム210 (図14,15)に供給される。
LSP周波数が計算されると、それらは伝送のために量子化されなければならない。10個の各LSP周波数はバイアス値を中心にほぼ囲んでいる。LSP周波数は、入力スピーチが平坦なスペクトル特性を有し、短期間予測が実行されることができないときにバイアス値を近似することに留意しなければならない。バイアスはエンコーダにおいて減算され、簡単なDPCM量子化器が使用される。デコーダにおいて、バイアスは再び加算される。LPCからLSPへの変換サブシステムに供給されたような各LSP周波数ω1 乃至ω10に対する16進法の負のバイアス値は、表Vに示されている。表Vに示された値は、部分的な15ビットを持つ2補数である。ヘックス値 0×8000(または-32768)は-1.0を表す。したがって、表Vの第1の値である値 0×fa2f(または-1489 )は -0.045441= -1489/32768 を表す。
Figure 2006079107
サブシステムにおいて使用された予測装置は、サブシステム中のバッファに蓄積された前のフレームからの量子化されたLSP周波数の0.9 倍である。この0.9 の減少定数は、チャンネルエラーが最終的になくなるように挿入される。
使用される量子化器は直線的であるが、速度と共にダイナミック範囲およびステップ寸法を変化させる。高速フレームにおいてもまたより多くのビットが各LSP周波数に対して伝送される。表VIにおいて、量子化器のビット割当ておよびダイナミック範囲が各速度で各周波数に対して示されている。例えば、速度1であるω1 は4ビット(すなわち16レベルに)を使用して均一に量子化され、最も高い量子化レベルは0.025 であり、最も低いものは-0.025である。
Figure 2006079107
速度決定アルゴリズムによって選択された速度に対する量子化範囲が十分に大きくなく、或は傾斜オーバーフローが発生した場合、速度は次に高い速度に高められる。速度はダイナミック範囲が適合されるか、或は全速度に達するまで連続的に高められる。図20において、任意選択速度増加技術の1実施例のブロック図が与えられている。
図20は、速度増加回路を含むLSP量子化サブシステム210 の一実施例をブロック図で示す。図20において、現在のフレームのLSP周波数は除算器440(図19)からレジスタ442 に出力され、これにおいて次のフレームにおける速度増加決定中の出力のために蓄積される。前のフレームのLSP周波数および現在のフレームのLSP周波数は、現在のフレーム速度増加決定のためにそれぞれレジスタ442 および除算器440 から速度増加論理回路444 に出力される。速度増加論理回路444 はまた速度決定サブシステム204 から速度制限命令と共に開始速度決定を受取る。速度増加が必要であるか否かを決定する時、論理回路444 は、現在および前のフレームのLSP周波数間の差の2乗の和に基づいて現在のフレームのLSP周波数と前のフレームのLSP周波数を比較する。その後、結果的な値はしきい値と比較され、しきい値が越された場合に、高品質のSSのエンコード化を保証するために速度の増加が指示される。しきい値を越えた時、論理回路444 はエンコーダにおいて使用される最終速度の出力を供給するように1速度レベルだけ開始速度をインクレメントする。
図20において、各LSP周波数の値ω1 乃至ω10は対応したバイアス値と共に一度に1つづつ加算器450 に入力される。バイアス値は入力LSP値から減算され、その結果的な値が加算器452 に出力される。加算器452 はまた減少定数と乗算された前のフレームの対応したLSP値である予測値を入力として受信する。予測値は、加算器452 によって加算器450 の出力値から減算される。加算器452 の出力は量子化器454 に入力として供給される。
量子化器454 は、リミタ456 、最小ダイナミック範囲検索表458 、反転ステップ寸法検索表460 、加算器462 、乗算器464 およびビットマスク466 から構成されている。量子化は、入力値が量子化器454 のダイナミック範囲内にあるか否かを最初に決定することによって量子化器454 において実行される。入力値は、入力が検索表458 にって与えられた境界を越えた場合に、ダイナミック範囲の上限および下限に入力値を制限するリミタ456 に供給される。検索表458 は速度入力およびそれに入力されたLSP周波数インデクスiに応答してリミタ456 に対して表VIにしたがって蓄積された境界を与える。リミタ456 から出力された値は加算器462 に入力され、検索表458 によって与えられた最小ダイナミック範囲の最小がそれから減算される。検索表458 から出力された値は、最小のダイナミック範囲の値にしたがって速度およびLSP周波数インデクスiによって決定され、表VIに示されたように値の符号を無視する。例えば(全速度,ω1 )に対する検索表458 中の値は0.025 である。
加算器462 からの出力は、検索表460 から選択された値により乗算器464 において乗算される。検索表460 は、表VIに示された値にしたがって各速度における各LSP値に対するステップ寸法の逆数に対応した値を含む。検索表460 から出力された値は、速度およびLSP周波数インデクスiによって選択される。各速度およびLSP周波数インデクスiに対して、検索表460 に蓄積された値は量[(2n −1)/ダイナミック範囲]であり、ここにおいてnは量子化された値を表すビットの数である。例えば、(速度1,ω1 )に対する検索表460 中の値は(15/0.05)または300 である。
乗算器464 からの出力は、ビットマスク466 に供給された0乃至2n −1の間の値である。速度およびLSP周波数インデクスiに応答するビットマスク466は、表VIにしたがって適切な数のビットを入力値から抽出する。抽出されたビットは、ビット制限出力Δωi を提供するように入力値のn整数値ビットである。値Δωi は、LSP係数を表すチャンネル上を伝送される量子化された非バイアス微分エンコード化LSP周波数である。
値Δωi はまた反転量子化器468 ,加算器470 ,バッファ472 および乗算器474 から構成された予測装置を通してフィードバックされる。反転量子化器468 は、ステップ寸法検索表476 ,最小ダイナミック範囲検索表478 ,乗算器480 および加算器482 から構成されている。
値Δωi は、検索表476 から選択された値と共に乗算器480 に入力される。検索表476 は、表VIに示された値にしたがって各速度における各LSP値に対するステップ寸法に対応した値を含む。検索表476 から出力された値は、速度およびLSP周波数インデクスiによって選択される。各速度およびLSP周波数インデクスiに対して、検索表460 に蓄積された値は量[ダイナミック範囲/(2n −1)]であり、ここにおいてnは量子化された値を表すビットの数である。乗算器480 は入力値を乗算し、加算器482 に出力を供給する。
加算器482 は、検索表478 から別の入力として値を受信する。検索表478 から出力された値は、最小ダイナミック範囲値にしたがって速度およびLSP周波数インデクスiによって決定され、表VIに示されたように値の符号を無視する。加算器482 は、検索表478 によって与えられた最小ダイナミック範囲値に乗算器480 から出力された値を加算し、結果な値が加算器470 に出力される。
加算器470 は、乗算器474 から出力された予測値を別の入力として受信する。これらの値は加算器470 において加算され、10ワード蓄積バッファ472 に蓄積される。現在のフレーム中にバッファ472 から出力された前のフレームの各値は、乗算器474 において定数0.9 により乗算される。乗算器474 から出力されたような予測値は上記のように両加算器452 および470 に供給される。
現在のフレームにおいて、バッファ472 に蓄積された値は前のフレームの再構成されたLPS値マイナスバイアス値である。現在のフレームにおいて同様に、加算器470 から出力された値はまたバイアス値のない現在のフレームの再構成されたLPS値である。現在のフレームにおいて、バッファ472 および加算器470からの出力は、バイアスが値に加算される加算器484 および486 にそれぞれ供給される。加算器484 および486 から出力された値はそれぞれ前のフレームの再構成されたLSP周波数値および現在のフレームの再構成されたLSP周波数値である。LSP平滑化は式(24)にしたがって低速度で行われる 平滑化されたLSP=a(現在のLSP)+(1−a)(前のLSP) (24)
ここにおいて、
a=全速度に対して0
a=1/2速度に対して0.1
a=1/4速度に対して0.5
a=1/8速度に対して0.85
前のフレーム(f−1)の再構成されたLSP周波数ω´i,f-1 の値および現在のフレーム(f)の再構成されたLSP周波数ω´i,f の値は量子化サブシステム210 からピッチサブフレームLSP補間サブシステム216 およびコードブックサブフレームLSP補間サブシステム226 に出力される。量子化されたLSP周波数値Δωi は、伝送のためにLSP量子化サブシステム210 からデータアセンブラサブシステム236 に出力される。
以下説明するように加重フィルタおよびフォルマント合成フィルタにおいて使用されたLPC係数は、エンコードされるピッチサブフレームに適している。ピッチサブフレームに対して、LPC係数の補間は各ピッチサブフレームに対して1度実行され、表VIIに示されている通りである:
Figure 2006079107
ピッチサブフレームカウンタ224 は、ピッチパラメータが計算されるピッチサブフレームの追跡を維持するために使用され、カウンタ出力はピッチサブフレームLSP補間時に使用するためにピッチサブフレームLSP補間サブシステム216 に供給される。ピッチサブフレームカウンタ224 はまた選択された速度に対するピッチサブフレームの終了を示す出力をデータパッキングサブシステム236 に供給する。
図21は、適切なピッチサブフレームに対してLSP周波数を補間するピッチサブフレームLSP補間サブシステム216 の1実施例を示す。図21において、前および現在のLSP周波数ω´i,f-1 およびω´i,f は、それぞれLSP量子化サブシステムから乗算器500 および502 に出力され、乗算器500 および502 においてメモリ504 から与えられた定数によりそれぞれ乗算される。メモリ504 は1組の定数値を蓄積し、以下説明するようにピッチサブフレームカウンタからのピッチサブフレーム数の入力にしたがって、前および現在のフレームLSP値との乗算のために表VIIに示されたように定数の出力を供給する。乗算器500 および502 の出力は、表VIIの式にしたがってピッチサブフレームにLSP周波数値を供給するために加算器506 において加算される。各ピッチサブフレームに対して、LSP周波数の補間が行われると、逆LSP・LPC変換がA(z)および知覚加重フィルタの現在の係数を得るために実行される。したがって、補間されたLSP周波数値は図14,15のLSP・LPC変換サブシステム218 に供給される。
LSP・LPC変換サブシステム218 は、スピーチを再合成する時に使用するためにLPC係数に補間されたLSP周波数を再度変換する。上記の参照文献(SoongおよびJuang氏による“ Line Spectrum Pair (LSP )and Speech DataCompression ”)において、変換プロセスにおいて本発明中で実行されたアルゴリズムが完全に説明され、また導き出される。計算は、P(z)およびQ(z)は式(25)によってLSP周波数に関して表されることができる:
Figure 2006079107
計算は最初に奇数周波数iの全てに対して値2cos(ωi )を計算することによって実行される。この計算は、ゼロ(0)に関して第5のオーダーの単一正確度のコサインのテイラー級数拡張を使用して行われる。コサイン表における最も近い点に関するテイラー拡張はより正確であることが潜在的に可能であるが、0に関する拡張は十分な正確さを達成し、過剰な量の計算を含まない。
次に、Pの多項式の係数が計算される。多項式の積の係数は、個々の多項式の係数のシーケンスの畳み込みである。その後、上記の式(25)におけるzの公称的な係数の6つのシーケンス:[1,-2cos (ω1 ),1]、[1,-2cos (ω3 ),1]、…、[1,-2cos(ω9 ),1]および[1,1]の畳み込みが計算される。
Pの多項式が計算されると、Qの多項式に対して同じ過程が反復され、上記の式(26)におけるzの公称的な係数の6つのシーケンス:[1,-2cos (ω2 ),1]、[1,-2cos (ω4 ),1]、…、[1,-2cos(ω10),1]および[1,-1]および適切な係数が合計され、2により除算される。すなわちLPC係数を生成するために1ビットだけシフトされる。
図21はさらにLSP・LPC変換サブシステムの一実施例を詳細に示す。回路部分508 は、ωi の入力値から -2cos(ωi )の値を計算する。回路部分508は、バッファ509 ;加算器510 および515 ;乗算器511 ,512 ,514 ,516 および518 並びにレジスタ513 および516 から構成されている。 -2cos(ωi )に対して値を計算する時、レジスタ513 および516 はゼロに初期化される。この回路は sin(ωi )を計算するため、ωi は加算器515 において最初に入力定数値π/2から減算される。この値は乗算器511 で2乗され、その後値(π/2−ωi2 ,(π/2−ωi4 ,(π/2−ωi6 および(π/2−ωi8 は、乗算器512 およびレジスタ513 を使用して連続的に計算される。
回路部分520 はpの多項式の係数の計算に使用される。回路部分520 は、メモリ521 、乗算器522 および加算器523 から構成されている。メモリ位置P(1)…P(11)のアレイは1に設定されるP(1)を除いて0に初期化される。古いインデクスの -2cos(ωi )の値は、1≦i≦5,1≦j≦2i+1,j<1に対してP(j)=0である[1, -2cos(ωi ),1]の畳み込みを実行するために乗算器524 に供給される。回路部分520 はQの多項式の係数を計算する時に複製される(示されていない)。結果的なP (1)…P(11)およびQ(1)…Q(11)の最終の新しい値は回路部分524 に供給される。
回路部分524 は、i=1 乃至i=10に対するピッチサブフレームの10個のLPC係数αi の計算を完了するために設けられている。回路部分524 は、バッファ525 および526 、加算器528 ,528 および529 、除算器またはビットシフタ530から構成されている。最終のP(i)およびQ(i)値は、バッファ525 および526 に蓄積される。P(i)およびP (i+1)の値は加算器527 において加算され、一方対応するQ(i)およびQ(i+1)の値は 1≦i≦10に対して加算器528 において減算される。加算器527 および528 の各出力P(z)およびQ(z)は加算器529 に入力されてそこで合計される。加算器の出力は1位置だけビットをシフトすることによって2で除算される。値[P(z)+Q(z)]/2として出力されるる。値[P(z)+Q(z)]/2 の各ビットシフトされた値は出力LPC係数αi である。ピッチサブフレームLPC係数は、図14,15のピッチ探索サブシステム220 に供給される。
LSP周波数はまた全速度を除いて選択された速度によって決定されるように各コードブックサブフレームに対して補間される。補間は、ピッチサブフレームLSP補間と同様に計算される。コードブックサブフレームLSP補間は、コードブックサブフレームLSP補間サブシステム226 において計算され、LSP・LPC変換サブシステム228 に供給され、そこにおける変換はLSP・LPC変換サブシステム218 の場合と同様に行われる。
図10を参照して示されているように、ピッチ探索はパラメータを使用して入力スピーチと合成スピーチとの間のエラーを最小にするこれらのパラメータを選択することによってエンコード処理が行われる合成技術による解析である。ピッチ探索において、スピーチは、応答が式(2)で表されるピッチ合成フィルタを使用して合成される。各20m秒のスピーチフレームは、上記に示されたようにフレームに対して選択されたデータ速度に依存する多数のピッチサブフレームにさらに分割される。1ピッチサブフレーム当り一度ピッチパラメータbとG、すなわちピッチ利得および遅延がそれぞれ計算される。実施例において、ピッチ遅延Lは伝送のために17乃至143 を範囲とし、L16はb=0の場合に反転される。
スピーチコーダは、式(1)で示された形態の知覚雑音加重フィルタを使用する。上記のように、知覚加重フィルタの目的はエラー関連雑音の影響を減少するように小さいパワーの周波数のエラーを加重することである。知覚加重フィルタは、前に見出だされた短期間予測フィルタから得られる。加重フィルタおよび以下説明されるフォルマント合成フィルタにおいて使用されるLPC係数は、エンコード処理されているサブフレームに適した補間値である。
解析合成動作の実行時、スピーチデコーダ/シンセサイザの複写がエンコーダにおいて使用される。スピーチエンコーダにおいて使用される合成フィルタの形態は式(3)および(4)によって与えられる。式(3)および(4)は、知覚加重フィルタによって後続されるデコーダスピーチ合成フィルタに対応し、したがって加重された合成フィルタと呼ぶ。
ピッチ探索は、現在のフレームにおけるコードブックからのゼロ供給すなわちG=0を仮定して実行される。各可能なピッチ遅延Lに対して、スピーチは合成され、元のスピーチと比較される。入力スピーチと合成されたスピーチとの間のエラーは、その2乗平均エラー(MSE)が計算される前に知覚加重フィルタによって加重される。その目的は知覚加重スピーチと知覚加重合成スピーチとの間のエラーを最小にする、Lおよびbの全ての可能な値からLおよびbの値を得ることである。エラーの最小化は次の式によって表される:
Figure 2006079107
ここにおいてLp は、実施例では全速度ピッチサブフレームに対して40であるピッチサブフレーム中のサンプルの数である。MSEを最小にするピッチ利得bが計算される。これらの計算はLの全ての許容値に対して繰返され、最小MSEを生成するLおよびbはピッチフィルタに対して選択される。
最適ピッチ遅延の計算は、n=−Lmax 乃至n=(Lp −Lmin )−1の間の全ての時間中フォルマント残留サンプル[図10中のp(n)]を含み、ここにおいてLmax は最大ピッチ遅延値であり、Lmin は最小ピッチ遅延値であり、Lp は選択された速度に対するピッチサブフレーム長であり、ここでn=0がピッチサブフレームのスタートである。実施例において、Lmax =143 およびLmin=17である。図22に示された符号付け方式を使用すると、速度1/4に対してn=-143乃至n=142 であり、速度1/2に対してn=-143乃至n=62であり、速度1に対してn=-143乃至n=22である。n<0に対して、フォルマント残留サンプルはピッチフィルタメモリに保持された前のピッチサブフレームからのピッチフィルタの出力だけであり、閉ループフォルマント残留サンプルと呼ばれる。n≧0に対して、フォルマント残留サンプルは入力が現在の解析フレームスピーチサンプルであるA(z)のフィルタ特性を有するフォルマント解析フィルタの出力である。n≧0に対して、フォルマント残留サンプルは開ループフォルマント残留サンプルと呼ばれ、ピッチフィルタおよびコードブックがこのサブフレームで完全な予測を行った場合、正確にp(n)である。関連したフォルマント残留サンプル値からの最適ピッチ遅延の計算の説明は、さらに図22乃至図25を参照して行われる。
ピッチ探索は143 個の再構成された閉ループフォルマント残留サンプルに対して行われ、すなわちn<0に対しp(n)およびn≧0に対してpo (n)であるLp −Lmin 非量子化開ループフォルマント残留サンプルに対してピッチ探索が実行される。探索はLが小さく、したがって使用される残留サンプルの大部分がn>0であるほぼ開ループ探索から、Lが大きく、したがって使用される全ての残留サンプルがn<0であるほぼ閉ルータ探索に漸次的に実効的に変化する。例えば、全速度で図22に与えられた符号付け方式を使用すると、ピッチサブフレームは40個のスピーチサンプルから構成され、ピッチ探索はn=-17 乃至n=22と番号付けされたフォルマント残留サンプルの組を使用して始まる。n-17 乃至n=-1のこの方式において、サンプルは閉ループフォルマント残留サンプルであり、一方n=0乃至n=22においてサンプルは開ループフォルマント残留サンプルである。最適ピッチ遅延を決定する時に使用される次の組のフォルマント残留サンプルは、n=-18 乃至n=21と番号付けされたサンプルである。n=-18乃至n=-1において、サンプルは閉ループフォルマント残留サンプルであり、一方n=0乃至n=21においてサンプルは開ループフォルマント残留サンプルである。このプロセスは、ピッチ遅延がフォルマント残留サンプルの最後の組n=-143乃至n=-104に対して計算されるまでサンプル組を通して連続される。
式(28)に関して上記に示されたように、その目的は、知覚加重スピーチマイナス加重フォルマントフィルタのゼロ入力応答(ZIP)であるx(n)と、Lおよびbの全ての可能な値に対するフィルタ中のメモリを与えられない、コードブックからのゼロ供給(G=0)を行われた知覚加重合成スピーチであるx´(n)との間のエラーを最小にすることである。式(28)はbに関して次のように書き直すことができる:
Figure 2006079107
ここにおいて、0≦n≦Lp −1に対して、
y(n)=h(n)*p(n-L) (30)
ここでy(n)はb=1のときピッチ遅延Lを持つ加重合成スピーチであり、およびh(n)は式(3)によるフィルタ特性を有する加重フォルマント合成フィルタのインパルス応答である。
この最小化プロセスは、値EL を最大化することに等しく、ここにおいて:
Figure 2006079107
であることが認められる。
この探索は、Lの全ての許容可能な値に対して繰返される。最適bは正に限定され、したがって結果的に任意の負であるExyにより生じるLは探索において無視される。最後に、EL を最大化する遅延Lおよびピッチ遅延bが伝送のために選択される。
上記のように、以下の式(35)乃至(38)において示された循環的な畳み込みに対して、フィルタA(z)がフィルタメモリにおいて常に0でスタートすると仮定するため、x(n)は実際に入力スピーチと加重フォルマントフィルタのZIRとの間の知覚加重された差である。しかしながら、フィルタメモリにおいて0でスタートするフィルタは実際にはない。合成において、フィルタは前のサブフレームから残っている状態を有する。実行時に、最初の状態の効果はスタート時に知覚加重スピーチから減算される。このようにして、p(n)に対して最初に全てのメモリ=0の定常状態のフィルタA(z)の応答だけが各Lに対して計算される必要があり、循環的な畳み込みが使用されることができる。x(n)のこの値はy(n)以外一度だけ計算される必要があり、ピッチフィルタの出力に対するフォルマントフィルタのゼロ状態応答は、各遅延Lに対して計算される必要がある。各y(n)の計算は、各遅延を計算される必要がない多数の冗長な乗算を含む。以下説明する循環的な畳み込みの方法は、要求される計算を最小にするために使用される。
循環的な畳み込みに関して値yL (n)は値y(n)によって定められる:
Figure 2006079107
が認められることができる。
このようにして、y17(n)に対する最初の循環的な畳み込みが実行されると、要求される計算数が大幅に減少される。上記の速度1に対して与えられた例に対して、値y17(n)は番号付けされたフォルマント残留サンプルの組n=-17乃至n=22を使用して式(36)によって計算される。
図23を参照すると、エンコーダは図12のデコーダの複製である図14,15のデコーダサブシステム235 を含み、適応ポストフィルタは存在しない。図23において、ピッチ合成フィルタ550 への入力はコードブック値cI (n)とコードブック利得Gの積である。出力フォルマント残留サンプルp(n)は、再構成されたスピーチサンプルs´(n)としてフィルタ処理され、出力されるフォルマント合成フィルタ552 に入力される。再構成されたスピーチサンプルs´(n)は、加算器554 において対応した入力スピーチサンプルs(n)から減算される。サンプルs´(n)とs(n)との間の差は、知覚加重フィルタ556 に入力される。ピッチ合成フィルタ550 に関して、フォルマント合成フィルタ552 および知覚加重フィルタ556 の各フィルタは、Mp がピッチ合成フィルタ550 中のメモリであり、Ma がフォルマント合成フィルタ552 中のメモリであり、Mw が知覚加重フィルタ556 中のメモリであるフィルタ状態のメモリを含む。
デコーダサブシステムのフォルマント合成フィルタ552 からのフィルタ状態Ma は、図14,15のピッチ探索サブシステム220 に供給される。図24において、フィルタ状態Ma は、フォルマント合成フィルタ552 のZIRを計算するフィルタ560 のゼロ入力応答(ZIR)を計算するために設けられる。計算されたZIR値は、加算器562 において入力スピーチサンプルs(n)から減算され、結果が知覚加重フィルタ564 によって加重される。知覚加重フィルタ564 からの出力xp (n)は式(28)乃至(34)において加重された入力スピーチとして使用され、ここでx(n)=xp (n)である。
図22および図23を参照すると、図22に示されているようなピッチ合成フィルタ550 は、本質的に上記のように計算された開および閉ループフォルマント残留サンプルを蓄積するメモリである適応コードブック568 に供給する。閉ループフォルマント残留サンプルはメモリ部分570 に蓄積され、一方開ループフォルマント残留サンプルはメモリ部分572 に蓄積される。サンプルは、上記の例示的な番号付け方式にしたがって蓄積される。閉ループフォルマント残留サンプルは各ピッチ遅延L探索に対する使用に関して上記のように構成される。開ループフォルマント残留サンプルは、po (n)値の計算時にデコーダサブシステムフォルマント合成フィルタ552 のメモリMa を使用するフォルマント解析フィルタ574 を使用して各ピッチサブフレームに対して入力スピーチサンプルs(n)から計算される。現在のピッチサブフレームに対するpo (n)の値は、適応コードブック568 のメモリ部分572 を提供するために一連の遅延素子576 を通してシフトされる。開ループフォルマント残留サンプルは、生成されて0として番号付けされ、最後の符号が142 である第1の残留サンプルと共に蓄積される。
図24を参照すると、フォルマントフィルタのインパルス応答h(n)はフィルタ566 において計算され、シフトレジスタ580 に出力される。フォルマントフィルタのインパルス応答h(n)に関して式(29)および(30)並びに(35)乃至(38)で上記に示されたように、これらの値はフィルタにおいて各ピッチサブフレームに対して計算される。ピッチフィルタサブシステムの計算要求をさらに減少するために、フォルマントフィルタのインパルス応答h(n)は頭部を切られて20個のサンプルにされる。
乗算器582 、加算器584 およびシフトレジスタ586 と共にシフトレジスタ580は、上記のようにシウトレジスタ580 からの値h(n)と適応コードブック568からの値c(m)との間において循環的な畳み込みを行なうように構成されている。畳み込み動作は、ピッチ利得が1に設定されると仮定して、ピッチフィルタメモリからの入力に対するフォルマントフィルタのゼロ状態応答(ZSR)を見出すために実行される。畳み込み回路の動作において、各mに対してn個のサイクルはLp から1までであり、一方m個のサイクルは(Lp −17)−1から−143 までである。レジスタ586 において、データはn=1のとき進められず、n=Lp のときにはデータはラッチされない。テータは、m≦−17のときに畳み込み回路から出力として供給される。
畳み込み回路に続いて、相関および比較回路が最適ピッチ遅延Lおよびピッチ利得bを見出すために探索を行う。2乗平均エラー(MSE)回路とも呼ばれる相関回路は、フォルマントフィルタのZIRと入力スピーチとの間の知覚加重差すなわちx(n)によりZSRの自己および交差相関を計算する。これらの値を使用して、相関回路はピッチ遅延の各値に対して最適ピッチ利得bの値を計算する。相関回路はシフトレジスタ588 、乗算器590 および592 、加算器594 および596 、レジスタ598 および600 並びに除算器602 から構成されている。相関回路において、計算はn個のサイクルがLp から1までであり、一方m個のサイクルは(Lp −17)−1から−143 までであるように行われる。
相関回路は、比較を実行し、ピッチ遅延Lおよびピッチ利得bの最適値を決定するためにデータを蓄積する比較回路によって後続される。比較回路は乗算器604 、比較器606 、レジスタ608 ,610 および612 並びに量子化器614 から構成されている。比較回路は、合成スピーチと入力スピーチとの間のエラーを最小にするLおよびbに対する値を各ピッチサブフレームに対して出力する。bの値は、量子化器614 によって8レベルに量子化され、3ビット値によって表され、付加的なレベルであるb=0レベルはL=16のときに示される。Lおよびbのこれらの値は、コードブック探索サブシステム230 およびデータバッファ222 に供給される。これらの値は、ピッチ探索に使用するためにデータパッキングサブシステム238 またはデータバッファ222 を介してデコーダ234 に供給される。
ピッチ探索と同様に、コードブック探索は、パラメータを使用して入力スピーチと合成されたスピーチとの間のエラーを最小にするパラメータを選択することによってエンコード処理が実行される合成コード処理システムによる解析である。速度1/8に対して、ピッチ利得はゼロに設定される。
上記のように、各20m秒は上述べられたようにフレームに対して選択されたデータ速度に依存する多数のコードブックサブフレームにサブ分割される。パラメータGおよびI、コードブック利得およびインデクスは1コードブックサブフレーム当り1度それぞれ計算される。これらのパラメータの計算時、LSP周波数はピッチサブフレームLSP補間サブシステム216 を参照して示されたものと同様にしてコードブックサブフレームLSP補間サブシステム226 において全速度を除いてサブフレームに対して補間される。コードブックサブフレームの補間されたLSP周波数はまた各コードブックサブフレームに対してLSP・LPC変換サブシステム228 によってLPC係数に変換される。コードブックサブフレームカウンタは232 は、コードブックパラメータが計算されるコードブックサブフレームの追跡を維持するために使用され、カウンタの出力はコードブックサブフレームLSP補間において使用するためにコードブックサブフレームLSP補間サブシステム226 に供給される。コードブックサブフレームカウンタは232 はまた選択された速度に対するコードブックサブフレームの終了を表す出力をピッチサブフレームカウンタ224 に供給する。
励起コードブックは、変数でないホワイトガウスランダムシーケンスから構成された2M のコードベクトルから成る。これらは、M=7に対してコードブック中の128 個のエントリィがある。コードブックは、各コードベクトルが1サンプルだけ隣接したコードベクトルと異なるように循環的に構成される。すなわちコードベクトル中のサンプルは、新しいサンプルが一方の端部でシフトされ、他方の端部においてサンプルが落とされるように1位置だけシフトされる。したがって、循環的なコードブックは、2M +(LC −1)長である直線アレイとして蓄積されることが可能であり、ここでLC はコードブックサブフレーム長である。しかしながら、構成を簡単にし、メモリ間隔を保存するために、循環的なコードブックの2M サンプル長(128 個のサンプル)が使用される。
計算を減少するために、コードブック中のガウス値は中心クリップされる。値は始めに変数1のホワイトガウスプロセスから選択される。その後、大きさが1.2 より小さい任意の値がゼロに設定される。これは効果的に約75%の値をゼロに設定し、インパルスのコードブックを生成する。このコードブックの中心クリップは、ゼロによる乗算が不要であるため4の係数だけコードブック探索における循環的な畳み込みを実行するために必要される乗算数を減少する。以下、現在の動作において使用されるコードブックを表VIII に示す。
Figure 2006079107
スピーチコーダは、式(3)で示された形態の加重合成フィルタを含む式(1)で示された形態の知覚雑音加重フィルタを使用する。各コードブックインデクスIに対して、スピーチは合成され、元のスピーチと比較される。エラーは、そのMSEが計算される前に知覚加重フィルタによって加重される。
上記のように、目的はIおよびGの全ての可能な値に対するx(n)とx´(n)との間のエラーを最小にすることである。エラーの最小化は以下の式によって表されてもよい:
Figure 2006079107
ここにおいてLC はコードブックサブフレーム中のサンプルの数である。式(38)はGに関して書き直される:
Figure 2006079107
ここにおいてyは、G=1と仮定してI番目のコードベクトルを持つフォルマントフィルタのインパルス応答を回旋することによって得られる。したがって、MSEの最小化は:
Figure 2006079107
この探索はIの全ての許容可能な値に対して繰返される。ピッチ探索と対照的に、最適利得Gは正または負のいずれであることも可能である。最後に、EI を最大化するインデクスIおよびコードブック利得Gが伝送のために選択される。
入力スピーチと加重ピッチおよびフォルマントフィルタのZIRとの間の知覚的に加重された差であるx(n)は、一度だけ計算される必要があることに留意しなければならない。しかしながら、各コードベクトルに対するピッチおよびフォルマントフィルタのゼロ状態応答であるy(n)は各インデクスIに対して計算される必要がある。循環的なコードブックが使用されるため、ピッチ探索に対して説明された循環的な回旋が要求される計算を最小にするために使用されることができる。
再び図23を参照すると、エンコーダは、フィルタ状態が計算される図12のデコーダの複製の図14,15のデコーダサブシステム235 を含み、ここにおいてMp はピッチ合成フィルタ550 中のメモリであり、Ma はフォルマント合成フィルタ552 中のメモリであり、Mw は知覚加重フィルタ556 中のメモリであるデコーダサブシステムのピッチおよびフォルマント合成フィルタ550 および552 (図23)からの各フィルタ状態Mp およびMa は、図14,15のコードブック探索サブシステム230 に供給される。図25において、フィルタ状態Mp およびMa は、ピッチおよびフォルマント合成フィルタ550 および552 のZIRを計算するゼロインパルス応答(ZIR)フィルタ620 に供給される。ピッチおよびフォルマント合成フィルタの計算されたZIRは加算器622 において入力スピーチサンプルs(n)から減算され、結果が知覚加重フィルタ624 によって加重される。知覚加重フィルタ564 からの出力xc (n)は上記のMSE式(39)乃至(44)において加重入力スピーチとして使用され、ここでx(n)=xc (n)である。
図25において、フォルマントフィルタのインパルス応答h(n)はフィルタ626 において計算され、シフトレジスタ628 に出力される。フォルマントフィルタ応答のインパルス応答h(n)は、各コードブックサブフレームに対して計算される。計算要求をさらに減少するために、フォルマントフィルタのインパルス応答h(n)は頭部を切られて20個のサンプルにされる。
乗算器630 、加算器632 およびシフトレジスタ634 と共にシフトレジスタ628は、シフトレジスタ628からの値h(n)と上記のようにコードブックベクトルを含むコードブック636 からの値c(m)との間において循環的な回旋を実行するように構成されている。この回旋動作は、コードブック利得が1に設定されると仮定して、各コードベクトルのフォルマントフィルタのゼロ状態応答(ZSR)を見出すために実行される。回旋回路の動作において、各mに対してn個のサイクルはLC から1までであり、一方m個のサイクルは 1から256 までである。レジスタ586 において、データはn=1のとき進められず、n=LC のときデータはラッチされない。テータは、m≦1のときに回旋回路から出力として供給される。したがって、回旋回路に後続する相関および比較回路をスタートする前に、回旋回路はm個のサブフレーム寸法時間を循環することによって循環的な回旋動作を導くために初期化されなければならないことに留意すべきである。
相関および比較回路は、コードブックインデクスIおよびコードブック利得Gの値を生成するように実際のコードブック探索を導く。2乗平均エラー(MSE)回路とも呼ばれる相関回路は、ピッチおよびフォルマントフィルタのZIRと入力スピーチx´(n)との間の知覚加重された差によりZSRの自己および交差相関を計算する。換言すると、相関回路はコードブックインデクスIの各値に対してコードブック利得Gの値を計算する。相関回路はシフトレジスタ638 、乗算回路640 および642 、加算器644 および646 、レジスタ648 および650 並びに除算器652 から構成されている。相関回路において、計算はn個のサイクルはLC から1までであり、一方m個のサイクルは1乃至256 までであるように行われる。
相関回路は、コードブックインデクスIおよび利得Gの最適値を決定するために比較およびデータの蓄積を実行する比較回路によって後続される。比較回路は、乗算器654 、比較器656 、レジスタ658 ,660 および662 並びに量子化器664から構成されている。比較回路は、合成スピーチと入力スピーチとの間のエラーを最小にするIおよびGに対する値を各コードブックサブフレームに供給する。コードブック利得Gは、図20を参照して示されたようにバイアスの除去されたLSP周波数量子化およびコード処理と同様にしてDPCMが量子化中に値をコード化する量子化器614 において量子化される。その後、IおよびGに対するこれらの値はデータバッファ222 に供給される。
コードブック利得Gの量子化およびDPCMエンコード処理は、以下の式にしたがって計算される:
Figure 2006079107
ここにおいて、20logGi-1 および20logGi-2 は直前のフレーム(i−1)および直前のフレームに先行するフレーム(i−2)に対して計算された各値である。
速度と共にLSP、I、G、Lおよびbの値は、データが伝送のために配列されるデータパッキングサブシステム236 に供給される。1つの構成において、速度と共にLSP、I、G、Lおよびbの値は、データパッキングサブシステム236 を介してデコーダ234 に供給される。別の構成において、これらの値はピッチ探索において使用するためにデータバッファ222 を介してデコーダ234 に供給される。しかしながら、好ましい実施例において、コードブック符号ビットの保護はコードブックインデクスに影響を与えるデータパッキングサブシステム236 内において使用される。したがって、この保護は、IおよびGデータがデータバッファ222 から直接供給された場合を考慮しなければならない。
データパッキングサブシステム236 において、データは伝送のために種々のフォルマントにしたがってパックされる。図26は、データパッキングサブシステム236 の機能素子の一実施例を示す。データパッキングサブシステム236 は、疑似ランダム発生器(PN)670 、サイクル冗長検査(CRC)計算素子672 、データ保護論理回路674 およびデータ結合器676 から構成されている。PN発生器670 は速度情報を受信し、1/8速度に対してデータ結合器676 に供給される4ビットランダム数を発生する。CRC素子672 は、速度と共にコードブック利得およびLSP値を受信し、全速度に対してデータ結合器676 に供給される11ビットの内部CRCコードを発生する。
データ結合器676 は速度と共にランダム数、CRCコードを受信し、データバッファ222 からのLSP,I,G,Lおよびbの値(図15)は伝送チャンネルデータプロセッササブシステム234 に出力を供給する。データが最小でデータバッファ222 からデコーダ234 に直接供給される構造において、PN発生器の4ビット数はPN発生器670 からデータ結合器676 を介してデコーダ234 に供給される。全速度において、CRCビットはデータ結合器674 からの出力としてフレームデータと共に含まれ、一方1/8速度においてコードブックインデクスの値は落とされ、ランダム4ビット数によって置換される。
実施例において、コードブック利得符号ビットに対して保護が与えられることが好ましい。このビットの保護は、このビット中の単一のビットエラーに対するベクトルデコーダの感度を低くすることである。符号ビットが検出されないエラーのために変化された場合、コードブックインデクスは最適に関連していないベクトルを示す。保護なしのエラー状況において、最適ベクトルの負のものが選択され、このベクトルは本質的に使用される最悪の可能なベクトルである。ここにおいて使用される保護方式は、利得符号ビット中の単一のビットエラーが最適ベクトルの負のものをエラー状況において選択させないことを保証する。データ保護論理回路674 はコードブックインデクスおよび利得を受信し、利得値の符号ビットを試験する。利得値符号ビットが負であると決定された場合、値89は関連したコードブックインデクスにモード128 で加算される。修正された、または修正されないコードブックインデクスは、データ保護論理回路674 からデータ結合器676 に出力される。
実施例において、全速度で圧縮された音声パケットデータの最も知覚的に感度の高いビットは、内部CRC(サイクル冗長検査)等によって保護されることが好ましい。11個の余分なビットは、保護されたブロック中の任意の単一のエラーを補正することができるこのエラー検出および補正機能を実行するために使用される。保護されたブロックは、10個のLSP周波数の最大桁ビットおよび8個のコードブック利得値の最大桁ビットから構成されている。補正不可能なエラーがこのブロックにおいて発生した場合、パケットは廃棄され、以下説明されるような削除が通知される。そうでなければ、ピッチ利得はゼロに設定されるが、しかし残りのパラメータは受信されたときに使用される。実施例において、サイクルコードは(31,21)サイクルコードを生じる発生器多項式を有するように選択される:
Figure 2006079107
しかしながら、別の発生器多項式が使用されてもよいことを理解しなければならない。全体的なパリティビットは、それを(32,21)コードにするように添付される。18情報ビットだけが存在しているため、コードワード中の最初の3デジットはゼロに設定され、伝送されない。この技術は、シンドロームがこれらの位置においてエラーを示した場合、それが補正不可能なエラーがあることを意味するように付加的な保護を提供する。システム形態のサイクルコードのエンコード処理は、×10u(x)モジュロg(x)としてパリティビットの計算を含み、ここでu(x)はメッセージ多項式である。
デコード処理終了時に、シンドロームは受信されたベクトルのg(x)による除算から余りとして計算される。シンドロームがエラーを示さない場合、パケットは全体的なパリティビットの状態にかかわらず受容される。シンドロームが単一のエラーを示した場合、エラーは全体的なパリティビットの状態が検査しない場合に補正される。シンドロームが1以上のエラーを示した場合、パケットは廃棄される。このようなエラー保護方式に関する詳細は、シンドローム計算の詳細に対するLinおよびCostello 氏による文献(“Error Con-trol coding:Fundamentals and Applications ”)において認められることができる。
CDMAセル電話機システムにおいて、データは20m秒のデータ伝送フレームでの伝送用のデータパッキングのためにデータ結合器674 から伝送チャンネルデータプロセッササブシステム238 に供給される。ボコーダが全速度に対して設定される伝送フレームにおいて、192 ビットは 9.6kbpsの実効ビット速度に対して伝送される。この場合の伝送フレームは、混合フレームタイプ(0=音声のみ,1=音声およびデータ/信号送信)を示すために使用される1つの混合モードビット、11内部CRCビットと共に160 のボコーダデータビット、12外部またはフレームCRCビットおよび8テールまたはフラッシュビットから構成されている。1/2速度において、80のボコーダデータビットは、 4.8kbpsの実効ビット速度に対して8フレームCRCビットおよび8テールビットと共に伝送される。1/4速度において、40のボコーダデータビットは、 2.4kbpsの実効ビット速度に対して8テールビットと共に伝送される。最後に、1/8速度に対して16のボコーダデータビットは、 1.2kbpsの実効ビット速度に対して8テールビットと共に伝送される。
本発明のボコーダが使用されるCDMAシステムにおいて使用された変調に関する詳細は、本出願人の別出願の米国特許出願07/543,496号明細書(1990年 6月25日出願,“SYSTEM AND METHOD FOR GENERATING SIGNAL WAVEFORMS IN A CDMACELLULAR TELEPHONE SYSTEM ”)に記載されている。このシステムにおいて、全速度以外の速度でデータビットが20m秒のデータ伝送フレーム内に疑似ランダム的に位置されたビットグループを持つグループに組織化される方式が使用される。別のフレーム速度およびビット表記は、ここにおいて説明のためにボコーダおよびCDMAシステム構造に関して示されたもの以外に容易に使用されてもよいため、別の構造がボコーダおよびその他のシステム適用に利用できることが理解されるべきである。
CDMAシステムおよび別のシステムにも適用可能なフレーム単位ベースのプロセッササブシステム238 は、信号送信データまたはその他の非スピーチ情報データ等の別のデータを伝送するためにボコーダデータの伝送を中断する可能性がある。この特定のタイプの伝送状況は“ブランクおよびバースト”と呼ばれる。プロセッササブシステム238 は、本質的にフレームに対して所望の伝送データとボコーダデータを置換する。
同じデータ伝送フレーム中にボコーダデータおよび別の伝送データの両方を伝送することが所望される別の状況が生じる。この特定のタイプの伝送状況は、“ディムおよびバースト”と呼ばれる。“ディムおよびバースト”伝送において、ボコーダは1/2速度のような所望の速度でボコーダ最終速度を設定する速度制限命令を与えられる。1/2速度のエンコーダボコーダデータは、データ伝送フレーム用のボコーダデータと共に付加的なデータを挿入するプロセッササブシステム238 に供給される。
全二重電話機リンクに与えられる付加的な機能は速度インターロックである。1つの方向のリンクが最高伝送速度で伝送している場合、別の方向のリンクは強制的に最低速度で伝送させられる。最低速度でも、話し手が中断されていると実感して話しを止めるのに十分な理解度が活動的な話し手に対して有効であり、それによって別の方向のリンクに活動的な話し手の役割を行なわせる。さらに、活動的な話し手が試みられた中断にかかわらず話を続ける場合、話し手自身のスピーチが品質を知覚する能力を“妨害する”ため、彼は恐らく品質の劣化を知覚しない。速度制限命令を使用することによって、ボコーダは通常の速度より低い速度でスピーチをボコード処理するように設定されることができる。
速度制限命令は、CDMAシステム中の付加的な容量が必要とされたとき、全速度より低いボコーダ最大速度を設定するために使用されることができることを理解すべきである。共通の周波数スペクトルが伝送に使用されるCDMAシステムにおいて、1つの利用者信号はシステム中に別の利用者信号に対する干渉として現れる。したがって、システム利用者容量はシステム利用者によって生じた全体的な干渉によって制限される。通常システム内における利用者の増加のために干渉のレベルが増加すると、品質の劣化は干渉の増加のために利用者によって経験される。
各利用者のCDMAシステム中の干渉に対する影響は、利用者伝送データ速度の関数である。通常の速度より低い速度でスピーチをエンコード処理するようにボコーダを設定することによって、エンコード処理されたデータは対応した減少した伝送データ速度で伝送され、その利用者によって発生させられた干渉のレベルを低下させる。したがって、システム容量は低速度でスピーチをボコード処理することによって実質的に増加される。システム要求が増加すると、利用者ボコーダはシステム制御装置またはセルベースステーションによってエンコード処理速度を低下するように命令される。本発明のボコーダは、全速度および1/2速度でエンコード処理されたスピーチ間の知覚可能な差があっても、非常に小さい品質のものである。したがって、スピーチが1/2速度のような低速度でボコード処理されるシステム利用者間の通信の品質における影響は、システムにおける利用者数の増加により生じた干渉のレベルの増加によって生じたものより重要ではない。
したがって、通常のボコード処理速度より低い速度に対して個々のボコーダ速度制限を設定する種々の方式が使用されてもよい。例えば、セル中の全ての利用者は1/2速度でスピーチをエンコード処理するように命令されてもよい。このような動作は利用者間の通信の品質に対してほとんど影響を与えずに実質的にシステム干渉を減少し、一方付加的な利用者に対して容量を実質的に増加する。システムにおける全体的な干渉は付加的な利用者によって劣化のレベルに増加されるまで、利用者間の通信の品質における影響はない。
上記のように、エンコーダはスピーチサンプルのフレームをエンコード処理する時に解析・合成技術を行なうためにデコーダの複製を含む。図14,15に示されているように、デコーダ234 はいるスピーチとの比較のために合成されたスピーチを再構成するためにデータパッキングサブシステム238 またはデータバッファ222 のいずれを介して値L,b,lおよびIを受信する。デコーダからの出力は上記のように値Mp ,Ma およびMw である。エンコーダにおいて、および伝送チャンネルの別の端部で合成されたスピーチを再構成する時に使用されるようなデコーダ234 に関する詳細は、図27乃至図37を参照して説明される。
図27は、本発明のデコーダの一実施例のフロー図である。エンコーダ内および受信機において構成されているようなデコーダの共通の構造のために、これらの構造は一緒に説明する。図27に関する説明は、そこで受信されたデータがデコーダにおいて予め処理されなければならず、またエンコーダのデコーダにおいて適切なデータ(速度,I,G,Lおよびb)がデータパッキングサブシステム238 またはデータバッファ222 から直接受信されるため、主に伝送チャンネルの端部におけるデコーダに関連している。しかしながら、デコーダの基本的な機能はエンコーダおよびデコーダ動作に対して同じである。
図12を参照して説明されたように、各コードブックサブフレームに対してコードブックインデクスIによって定められたコードブックベクトルは、蓄積されたコードブックから検索される。ベクトルはコードブック利得Gによって乗算され、その後フォルマント残留を生成するように各ピッチサブフレーム用のピッチフィルタによってフィルタ処理される。このフォルマント残留はフォルマントフィルタによってフィルタ処理され、その後出力スピーチ信号を生成するために自動利得制御装置(AGC)と共に適用フォルマントポストフィルタおよび輝度ポストフィルタを通過させられる。
コードブックおよびピッチサブフレームの長さは変化するが、デコード処理は実行を容易にするためにの40個のサンプルブロックで実行される。受信された圧縮データは、最初にコードブック利得、コードブックインデクス、ピッチ利得、ピッチ遅延およびLSP周波数にパック解除される。LSP周波数は、図35を参照して説明されるようにそれらの各反転量子化器およびDPCMデコーダを通して処理されなければならない。同様に、コードブック利得値はバイアスアスペクトがないことを除いてLSP周波数と同じ方法で処理されなければならない。また、ピッチ利得値は反転量子化される。その後、これらのパラメータは各デコード処理サブフレームに与えられる。各デコード処理サブフレームにおいて、2組のコードブックパラメータ(G&I)、1組のピッチパラメータ(b&L)および1組のLPC係数が40個の出力サンプルを生成するために必要とされる。図28,29,30,31および32,33,34は種々の速度および別のフレーム条件に対する例示的なサブフレームデコード処理パラメータを示す。
全速度フレームに対して、8組の受信されたコードブックパラメータおよび4組の受信されたピッチパラメータが存在する。LSP周波数は、4組のLSP周波数を生成するために4度補間される。受信されたパラメータおよび対応したサブフレーム情報は図28に示されている。
1/2速度フレームに対して、各組の4つの受信コードブックパラメータは一度反復され、各組の2つの受信ピッチパラメータは一度反復される。LSP周波数は、4組のLSP周波数を生成するために3度補間される。受信されたパラメータおよび対応したサブフレーム情報は図29に示されている。
1/4速度フレームに対して、各組の2つの受信コードブックパラメータは4度反復され、ピッチパラメータの組はまた4度反復される。LSP周波数は2組のLSP周波数を生成するために一度補間される。受信されたパラメータおよび対応したサブフレーム情報は図30に示されている。
1/8速度フレームに対して、受信コードブックパラメータの組はフレーム全体に対して使用される。ピッチパラメータは1/8速度フレームに対して存在せず、ピッチ利得は単にゼロに設定される。LSP周波数は1組のLSP周波数を生成するために一度補間される。受信されたパラメータおよび対応したサブフレーム情報は図31に示されている。
音声パケットは、CDMAセルまたは自動車ステーションが信号情報を伝送するためにためにしばしば無効にされる。ボコーダが無効フレームを受信したとき、それは前のフレームのパラメータを少し修正して連続する。コードブック利得はゼロに設定される。前のフレームのピッチ遅延および利得は、利得が1以下に限定されることを除いて現在のフレームピッチ遅延および利得として使用される。前のフレームのLSP周波数は、補間のないものとして使用される。エンコード端およびデコード端は依然として同期され、ボコーダは無効フレームから非常に速く回復できることに留意されたい。受信されたパラメータおよび対応したサブフレーム情報は図32に示されている。
フレームがチャンネルエラーのために失われた場合、ボコーダは前のフレームのエネルギの一部分を維持し、背景雑音に滑らかに転移することによってこのエラーをマスクすることを試みる。この場合、ピッチ利得はゼロに設定される。ランダムコードブックは前のサブフレームのコードブックインデクスプラス89を使用することによって選択される。コードブック利得は前のサブフレームのコードブック利得の0.7 倍である。数89に関して特別なことは何もなく、これは疑似ランダムコードブックベクトルを選択する単なる便利な方法である。前のフレームの
ωi= 0.9(前のωi −ωi のバイアス値+ωi のバイアス値)
に向かって強制的に減衰させられる。LSP周波数バイアス値は表5に示されている。受信されたパラメータおよび対応したサブフレーム情報は図33に示されている。
速度は受信機において決定されることができない場合、パケットは廃棄され、削除が通知される。しかしながら、受信機が決定する場合、エラーに関して以下のことが実行されるが、フレームは全速度で伝送された可能性が強い。上記に説明されたように全速度において、圧縮された音声パケットデータの最も知覚的に感度の高いビットは、内部CRCによって保護される。デコード端において、シンドロームは受信されたベクトルをg(x)で除算した余りとして式(46)から計算される。シンドロームが無エラーを示した場合、パケットは全体的なパリティビットの状態に関係なく受容される。シンドロームが単一エラーを示した場合、エラーは全体的なパリティビットの状態が検査しない場合に補正される。シンドロームが1以上のエラーを示した場合、パケットは廃棄される。補正不可能なエラーがこのブロック中で発生した場合、パケットは廃棄され、削除が通知される。そうでなければ、図34に示されているように、ピッチ利得はゼロに設定されるが、しかし残りのパラメータは補正されて受信されたときに使用される。
この構造において使用されたポストフィルタは最初にJ.H.Chen 氏他による文献(“Real-Time Vector APC Speech Coding At 4800 BPS with Adaptive postfiltering”,Proc.ICASSP ,1987年)において説明された。スピーチフォルマントはスペクトルの谷より知覚的に重要であるため、ポストフィルタはコード化されたスピーチの知覚的品質を改良するためにフォルマントを少し支援する。これは、フォルマント合成フィルタの極を原点に向って半径方向にスケール処理することによって実行される。しかしながら、全極ポストフィルタは一般に結果的にフィルタ処理されたスピーチの消音を生じさせるスペクトル傾斜を導入する。この全極ポストフィルタのスペクトル傾斜は、極と同じ位相角度を有するが、半径が小さいゼロを付加し、結果的に形態:
H(z)=A(z/ρ)/A(z/σ)
0<ρ<σ<1 (48)
のポストフィルタを生じさせることによって減少される。ここにおいて、A(z)はフォルマント予測フィルタであり、値ρおよびσはポストフィルタスケール処理係数であり、ここにおいてρは0.5 に設定され、σは0.8 に設定される。
適応輝度フィルタは、フォルマントポストフィルタによって導入されたスペクトル傾斜をさらに補償するために付加される。輝度フィルタは形態:
B(z)=(1−κz-1)/(1+κz-1) (49)
であり、ここにおいてκ(この1タップフィルタの係数)の値はA(z)のスペクトル傾斜の変化を近似するLSP周波数の平均値によって決定される。
ポストフィルタ処理の結果生じる任意の大きい利得変動を避けるために、AGCループはそれが非ポストフィルタ処理されたスピーチとほぼ同じエネルギを有するようにスピーチ出力をスケール処理するように構成されている。利得制御は、反転フィルタ利得を得るために40個のフィルタ出力サンプルの2乗の和で40個のフィルタ入力サンプルの2乗の和を除算することによって実行される。その後、この利得係数の平方根は滑らかにされる:
滑らかなβ=0.2 現在のβ+0.98前のβ (50)
また、フィルタ出力は出力スピーチを生成するようにこの滑らかな反転利得と乗算される。
図27において、データと共に伝送された、或いは別の手段によって導出された速度と共にチャンネルからのデータは、データパック解除サブシステム700 に供給される。CDMAシステムに対する一実施例において、速度決定は、それが各異なる速度でデコード処理されたときに受信されたデータであるエラー速度から導出されることができる。データアンパックサブシステム700 において、全速度でCRCの検査がエラーに対して行われ、この検査の結果がサブフレームデータアンパックサブシステム702 に供給される。サブシステム700 は、有効なデータを持つ無効フレーム、削除フレームまたはエラーフレーム等の異常フレーム状態の指示をサブシステム702 に与える。サブシステム700 はフレームに対するパラメータI,G,Lおよびbと共に速度をサブシステム702 に与える。コードブックインデクスIおよび利得Gの供給時に、利得値の符号ビットはサブシステム702 において検査される。符号ビットが負である場合、値89はモード128 で関連したコードブックインデクスから減算される。さらに、サブシステムにおいてコードブック利得は反転量子化され、DPCMデコード処理され、一方ピッチ利得が反転量子化される。
サブシステム700 はまたLSP反転量子化/補間サブシステム704 に速度およびLSP周波数を供給する。サブシステム700 は、さらに有効なデータを持つブランクフレーム、削除フレームまたはエラーフレームの指示をサブシステム704に与える。デコードサブフレームカウンタ706 はサブフレームカウント値iおよびjの指示を両サブシステム702 および704 に与える。
サブシステム704 において、LSP周波数は反転量子化され、補間される。図35は、サブシステム704 の反転量子化部分の構造を示し、一方補間部分は実質的に図20を参照して説明されたものと同じである。図35において、サブシステム704 の反転量子化部分は、図20の反転量子化器468 と同一に構成され、同様に動作する反転量子化器750 から構成されている。反転量子化器750 の出力は乗算器754 の出力として供給される。加算器752 の出力は、蓄積されて乗算器754 における定数0.9 との乗算のために出力されるレジスタ756 に供給される。加算器752 の出力はまたバイアス値がLSP周波数に加算される加算器758 に供給される。LSP周波数の順序は、LSP周波数を強制的に最小に分離させる論理回路760 によって保証される。一般に、エラーが伝送時に発生しなければ、分離を強制する必要性が生じない。LSP周波数は、図21、図28乃至31および図32乃至34を参照して説明されたように補間される。
図27を参照すると、メモリ708 は前のフレームLSP,ωi,f-1 を蓄積するためサブシステム704 に結合され、またバイアス値bωi を蓄積するために使用されてもよい。これらの前のフレーム値は、全ての速度に対する補間時に使用される。有効なデータを持つブランク、削除またはエラーフレームの状態に対して、前のフレームLSPωi,f-1 は図32乃至34のチャートにしたがって使用される。サブシステム700 からのブランクフレーム指示に応答して、サブシステム704は現在のフレームにおいて使用するためにメモリ708 に蓄積された前のフレームのLSP周波数を検索する。削除フレーム指示に応答して、サブシステム704 は上記のように現在のフレームのLSP周波数を計算するようにバイアス値と共にメモリ708 からの前のフレームのLSP周波数を検索する。この計算の実行時に、蓄積されたバイアス値は加算器において前のフレームのLSP周波数から減算され、結果が乗算器において0.9 の定数により乗算され、この結果が加算器において蓄積されたバイアス値に加算される。有用なデータ指示を持つエラーフレームに応答して、LSP周波数はCRCが成功した場合に全速度に対して行われたように補間される。
LSPは、LSP周波数がLPC値に変換されるLSP・LPC変換サブシステム710 に供給される。サブシステム710 は、図21を参照して説明された図14,15のLSP・LPC変換サブシステム218 および228 と実質的に同じである。その後、LPC係数αi はフォルマントフィルタ714 およびフォルマントポストフィルタ716 の両方に供給される。LSP周波数はまたLSP平均サブシステム712 中のサブフレームに対して平均され、適応輝度フィルタ718 に値κとして供給される。
サブシステム702 は、速度および異常フレーム状態指示と共にサブシステム700 からフレームに対するパラメータI,G,Lおよびbを受信する。サブシステム702 はまたサブフレームカウンタ706 から各デコードサブフレーム1乃至4中の各iカウントに対するjカウントを受信する。サブシステム702 はまた異常フレーム状態で使用するためにG,I,Lおよびbに対して前のフレーム値を蓄積するメモリ720 に結合される。1/8速度以外の通常フレーム状態下のサブシステム702 は、図28乃至31にしたがってコードブック722 にコードブックインデクス値Ij を供給し、乗算器724 にコードブック利得値Gj を供給し、またピッチフィルタ726 にピッチ遅延Lおよび利得b値を供給する。1/8速度に対して、送信されるコードブックインデクスに対する値がないため、1/8速度に対して16ビットパラメータ値(図31)であるパケットシードは、速度指示と共にコードブック722 に供給される。異常フレーム状態に対して、値は図32乃至34にしたがってサブシステム702 から供給される。さらに1/8速度に対して、図36を参照して説明されるようにコードブック722 に指示が与えられる。
サブシステム700 からのブランクフレーム指示に応答して、サブシステム702は、利得が1以下に制限され、現在のフレームデコードサブフレームにおいて使用するために蓄積されることを除いて、前のフレームピッチ遅延Lおよび利得bを検索する。さらに、コードブックインデクスIは供給されず、コードブック利得Gはゼロに設定される。削除フレーム指示に応答して、サブシステム702 はメモリ720 からの前のフレームのサブフレームコードブックインデクスを検索し、加算器において89の値を加算する。前のフレームのサブフレームコードブック利得は、Gの各サブフレーム値を生成するように乗算器において0.7 の定数により乗算される。ピッチ遅延値は供給されず、一方ピッチ利得はゼロに設定される。有用データ指示を持つエラーフレームに応答して、コードブックインデクスおよび利得は、CRCが成功した場合に全速度フレームにおける場合のように使用され、一方ピッチ遅延値は供給され、ピッチ利得はゼロに設定される。
解析・合成技術におけるエンコーダ・デコーダを参照して説明されたように、コードブックインデクスIは乗算器724 への出力のためにコードブック値に対する開始アドレスとして使用される。コードブック利得値はコードブック722 からの出力値と乗算器724 において乗算され、その結果はピッチフィルタ726 に供給される。ピッチフィルタ726 は、フォルマントフィルタ714 に出力されるフォルマント残留を生成するために入力ピッチ遅延Lおよび利得b値を使用する。フォルマントフィルタ714 において、LPC係数はスピーチを再構成するようにフォルマント残留をフィルタ処理する時に使用される。受信機デコーダにおいて、再構成スピーチはさらにフォルマントポストフィルタ716 および適応輝度フィルタ718 によってフィルタ処理される。AGCループ728 はフォルマントフィルタ714 およびフォルマントポストフィルタ716 の出力において使用され、その出力は適応輝度フィルタ718 の出力と乗算器730 において乗算される。乗算器730 の出力は、既知の技術を使用してアナログ形態に変換され、聞き手に提供される再構成されたスピーチである。エンコーダのデコーダにおいて、そのメモリを更新するために出力に知覚加重フィルタが配置されている。
図35を参照すると、デコーダ自身の構造の詳細が示されている。図36において、コードブック722 は、図25を参照して説明されたものと同じメモリ750から構成されている。しかしながら、説明のためにメモリ750 に対して少し異なる方法が示され、図36にはそのアドレス処理が示されている。コードブック722 はさらにスイッチ752 ,マルチプレクサ753 および疑似ランダム数(PN)発生器754 から構成されている。スイッチ752 は、図25を参照して説明されたようにメモリ750 のインデクスアドレス位置を示すコードブックインデクスに応答する。メモリ750 は、出力のためにメモリを通してシフトされた値で開始メモリ位置を示すスイッチ752 を備えた回路メモリである。コードブック値は、マルチプレクサ753 への1入力としてメモリ750 からスイッチ752 を通って出力される。マルチプレクサ753 は、コードブック利得増幅器、乗算器724 にスイッチ752を通って供給された値の出力を供給するために全、1/2および1/4の速度に応答する。マルチプレクサ753 はまたコードブック722 の乗算器724 への出力に対してPN発生器754 の出力を選択するために1/8速度指示に応答する。
CELPコード処理の高い音声品質を維持するために、エンコーダおよびデコーダはそれらの内部フィルタメモリに蓄積された同じ値を有していなければならない。これは、デコーダおよびエンコーダのフィルタが同じシーケンスの値によって励起されるようにコードブックインデクスを伝送することによって行われる。しかしながら、高いスピーチ品質に対して、これらのシーケンスはそれらの中に分布されたいくつかのスパイクを持つほぼゼロから構成される。このタイプの励起は、背景雑音をコード処理するのに最適ではない。
最低のデータ速度で実行される背景雑音のコード処理時に、疑似ランダムシーケンスはフィルタを励起するように構成されてもよい。フィルタメモリがエンコーダおよびデコーダにおいて同じであることを保証するために、2つの疑似ランダムシーケンスは同じでなければならない。シードは受信機デコーダに何とか伝送されなければならない。シードを送信するために使用されることができる付加的なビットは存在しないため、伝送されたパケットビットは、数を形成するかのようにシードとして使用されることができる。この技術は、低速度でコードブック利得およびインデクスを決定するために全く同じCELP解析・合成構造が使用されるため実行されることができる。相違は、コードブックインデクスが廃棄され、その代わりにエンコーダフィルタメモリが疑似ランダムシーケンスを使用して更新されることである。したがって、励起用のシードは解析が行われた後、決定されることができる。パケット自身が1組のビットパターンの間で周期的にサイクル化しないことを保証するために、4ランダムビットはコードブックインデクス値の代わりに1/8速度のパケットに挿入される。したがって、パケットシードは図17に示されたように16ビット値である。
PN発生器754 は、良く知られた技術を使用して構成され、種々のアルゴリズムによって実行されてもよい。実施例において、使用されたアルゴリズムは、Paul Mennen 氏による文献(“DPS chip can produce random numbers using proven algorithm”,EDN ,1991年 1月21日)において説明された性質のものである。伝送されたビットパケットは、シーケンスを生成するためにシード(図27のサブシステム700 から)として使用される。1構造において、シードは値521により乗算され、それに値259 を加算される。この結果的な値から、最小桁ビットが符号を付けられた16ビット数として使用される。その後、この値は次のコードブック値を生成する時にシードとして使用される。PN発生器によって生成されたシーケンスは、1の変数を有するように定常化される。
コードブック722 から出力された各値は、デコードサブフレーム中に供給されるとコードブック利得Gにより乗算器724 において乗算される。この値はピッチフィルタ726 の加算器756 への1入力として供給される。ピッチフィルタ726 はさらに乗算器758 およびメモリ760 から構成されている。ピッチ遅延Lは、乗算器758 に出力されるメモリ760 の分岐の位置を決定する。メモリ760 の出力はピッチ利得値bと乗算器758 において乗算され、その結果が加算器756 に出力される。加算器756 の出力は、シフトレジスタのような一連の遅延素子であるメモリ760 の入力に供給される。値はメモリ760 を通してシフトされ(矢印によって示されているような方向に)、選択された分岐出力においてLの値によって決定されたように供給される。値はメモリ760 を通してシフトされるため、143 シフトより古い値は廃棄される。加算器756 の出力はまたフォルマントフィルタ714 に入力として供給される。
加算器756 の出力はフォルマントフィルタ714 の加算器762 の1入力に供給される。フォルマントフィルタ714 はさらに乗算器764a乃至764jおよびメモリ766のバンクから構成されている。加算器762 の出力は、シフトレジスタのような一連の分岐された遅延素子として構成されたメモリ766 への入力として供給される。値はメモリ766 を通してシフトされ(矢印によって示されているような方向に)、端部において廃棄される。各素子は、乗算器764a乃至764jの対応したものへの出力としてそこに蓄積された値を供給する分岐を有する。乗算器764a乃至764jはまたそれぞれメモリ766 からの出力との乗算のために各LPC係数α1 乃至α10を受取る。加算器762 からの出力は、フォルマントフィルタ714 の出力として供給される。
フォルマントフィルタ714 の出力は、フォルマントポストフィルタ716 およびAGCサブシステム728 への入力として供給される。フォルマントポストフィルタ716 は、メモリ772 並びに乗算器774a乃至774j;776a乃至776jおよび782a乃至782jと共に加算器768 および770 から構成されている。値がメモリ772 を通してシフトされると、それらは加算器768 および770 における和に対してスケール処理されたLPC係数値との乗算のために対応した分岐において出力される。フォルマントポストフィルタ716 からの出力は、適応輝度フィルタ718 への入力として供給される。
適応輝度フィルタ718 は、加算器784 および786 、レジスタ788 および790 並びに乗算器792 および794 から構成されている。図37は、適応輝度フィルタの特性を示したチャートである。フォルマントポストフィルタ716 の出力は加算器784 に1入力として供給され、一方別の入力は乗算器792 の出力から供給される。加算器784 の出力はレジスタ788 に供給され、1サイクルの間蓄積され、次のサイクル中に図27のLSP平均サブシステム712 から供給された値−κと共に乗算器792 および794 に出力される。乗算器792 および794 からの両出力は、加算器784 および786 に供給される。加算器786 からの出力はAGCサブシステム728 およびシフトレジスタ790 に供給される。シフトレジスタ790 は、フォルマントフィルタ714 からAGCサブシステム728 へおよびフォルマントポストフィルタ716 を介して適応輝度フィルタ718 に供給されたデータ出力の調整を保証するために遅延ラインとして使用される。
AGCサブシステム728 は、フォルマントポストフィルタ716 および適応輝度フィルタ718 へのスピーチ入力エネルギに関してスピーチ出力エネルギをスケール処理するようにフォルマントポストフィルタ716 および適応輝度フィルタ718からデータを受信する。AGCサブシステム728 は乗算器798 ,800 ,802 および804 ;加算器806 ,808 および810 ;レジスタ812 ,814 および816 ;除算器818 並びに平方根素子820 から構成されている。フォルマントポストフィルタ716 から出力された40サンプルは、値“x”を生成するように乗算器798 において2乗され、加算器806 およびレジスタ812 から構成された累算器において合計される。同様に、レジスタ790 の前に行われる、適応輝度フィルタ718 から出力された40サンプルは値“y”を生成するように乗算器800 において2乗され、加算器808 およびレジスタ814 から構成された累算器において合計される。値“y”は、除算器816 において値“x”によって除算され、結果的にフィルタの反転利得を生じさせる。反転利得係数の平方根は素子818 において取られ、その結果が平滑にされる。平滑動作は、乗算器802 において定数値0.02により現在の値利得を乗算することによって行なわれ、この結果はレジスタ820 および乗算器804 を使用して計算されたときに前の利得の0.98倍の結果に加算器810 で加算される。その後、フィルタ718 の出力は出力再構成スピーチを提供するように乗算器730において平滑にされた反転利得と乗算される。出力スピーチは、利用者に出力するために種々の良く知られた変換技術を使用してアナログ形態に変換される。
ここに示された本発明の実施例は単なる一例に過ぎず、機能的に等価である実施例の変更が行なわれてもよいことを理解すべきである。本発明は、スピーチサンプルをエンコードし、エンコードされたスピーチをデコードするためにここに示されているような機能動作を提供するように適切なプログラム制御下においてデジタル信号プロセッサで実行されてもよい。別の態様において、本発明は良く知られた非常に大きいスケールインテグレーション(VLSI)技術を使用する適用限定集積回路(ASIC)に内蔵されてもよい。
上記の好ましい実施例の説明は、当業者が本発明を形成または使用できるように与えられている。当業者はこれらの実施例に対する種々の修正を容易に認識し、ここに限定された一般的な原理は発明能力を必要とせずに別の実施例に対して適用されてもよい。以上、本発明はここに示された実施例に限定されるものではなく、ここに記載された原理および新しい特徴と適合した非常に広い技術的範囲が提供される。
種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。 種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。 種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。 種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。 種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。 種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。 種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。 種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。 種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。 一例のエンコーダの一般化されたブロック図である。 エンコーダフローチャートである。 一例のデコーダの一般化されたブロック図である。 デコーダのフローチャートである。 エンコーダのさらに詳細な機能的なブロック図である。 エンコーダのさらに詳細な機能的なブロック図である。 ハミングウインドウおよび自己相関サブシステムの一例のブロック図である。 速度決定サブシステムの一例のブロック図である。 LPC解析サブシステムの一例のブロック図である。 LPCからLSP伝送サブシステムの一例のブロック図である。 LPC量子化サブシステムの一例のブロック図である。 LSP挿入およびLSPからLPC伝送サブシステムの一例のブロック図である。 ピッチ探索用の適用コードブックのブロック図である。 エンコーダデコーダのブロック図である。 ピッチ探索サブシステムのブロック図である。 コードブック探索サブシステムのブロック図である。 データパッキングサブシステムのブロック図である。 デコーダのさらに詳細な機能的ブロック図である。 種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。 種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。 種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。 種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。 特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。 特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。 特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。 LSP反転量子化サブシステムのブロック図である。 ポストフィルタ処理および自動利得制御を備えたデコーダのさらに詳細なブロック図である。 適応輝度フィルタ特性を示すチャートである。

Claims (14)

  1. 複数のフレームを含むスピーチ信号(S(n))のフレームにおける背景雑音の現在の推定値(B’)を生成する方法であって、
    スピーチ信号(S(n))のフレームのエネルギレベル(R(0))を計算し、
    スピーチ信号の前のフレームにおける背景雑音の推定値(B)を得、
    エネルギレベル(R(0))およびスピーチ信号の前のフレームにおける背景雑音の推定値(B)に基づいて背景雑音の現在の推定値(B’)を生成することを含む方法。
  2. 生成することが、スピーチ信号の前のフレームにおける背景雑音の推定値(B)を越える背景雑音の現在の推定値(B’)の増加を、予め定められた値未満に限定することを含む請求項1の方法。
  3. 限定することが、背景雑音の現在の推定値(B’)をエネルギレベル(R(0))以下である値に制限することを含む請求項2の方法。
  4. 増加がパーセンテージ増加を含む請求項2の方法。
  5. 増加が絶対値増加を含む請求項2の方法。
  6. 複数のフレームを含むスピーチ信号(S(n))を処理するように構成されたスピーチ処理装置であって、
    スピーチ信号のフレームのエネルギレベル(R(0))を計算する手段(202)と、
    スピーチ信号の前のフレームにおける背景雑音の推定値(B)を得る手段と、
    エネルギレベル(R(0))およびスピーチ信号の前のフレームにおける背景雑音の推定値(B)に基づいて背景雑音の現在の推定値(B’)を生成する手段とを含むスピーチ処理装置。
  7. 生成する手段が、スピーチ信号の前のフレームにおける背景雑音の推定値(B)を越える背景雑音の現在の推定値(B’)の増加を、予め定められた値未満に限定する手段(312、318)を含む請求項6のスピーチ処理装置。
  8. 限定する手段(312、318)が、背景雑音の現在の推定値(B’)をエネルギレベル(R(0))以下である値に制限する手段(318)を含む請求項7のスピーチ処理装置。
  9. 増加がパーセンテージ増加を含む請求項7のスピーチ処理装置。
  10. 増加が絶対値増加を含む請求項7のスピーチ処理装置。
  11. 前記計算する手段が、
    スピーチ信号のフレームの前記エネルギレベル(R(0))を計算するように構成された第1の回路(202)を含み、
    前記得る手段および前記生成する手段がさらに、
    スピーチ信号の前のフレームにおける背景雑音の前記推定値(B)を計算し、かつスピーチ信号の前のフレームにおける背景雑音の前記推定値(B)を予め定められた量だけ増加させて増加された推定値を生成するように構成された第2の回路と、
    第1および第2の回路に接続され、増加された推定値およびエネルギレベル(R(0))を受け、かつスピーチ信号の現在のフレームにおける背景雑音の推定値(B’)として、増加された推定値またはエネルギレベル(R(0))のいずれかを選択するように構成された第1のマルチプレクサ(300)とを含む請求項6のスピーチ処理装置。
  12. 第2の回路に接続され、増加された推定値を予め定められたレベル未満である値に限定するように構成された第1のリミタ(314)をさらに含む請求項11のスピーチ処理装置。
  13. 第1のマルチプレクサに接続され、スピーチ信号の現在のフレームにおける背景雑音の推定値をエネルギレベル(R(0))以下の値に限定するように構成された第2のリミタ(318)をさらに含む請求項12のスピーチ処理装置。
  14. 第2の回路が、
    スピーチ信号の前のフレームにおける背景雑音の推定値に公称の一定値を加算して絶対増加推定値を生成するように構成された第1の加算器(304)と、
    スピーチ信号の前のフレームにおける背景雑音の推定値に1よりわずかに大きい一定値(k)を乗算してパーセンテージ増加推定値を生成するように構成された乗算器(306)と、
    第1の加算器(304)および乗算器(306)に接続され、絶対増加推定値およびパーセンテージ増加推定値を受けるように構成された第2のマルチプレクサ(308)と、
    第1の加算器(304)、乗算器(306)および第2のマルチプレクサ(308)に接続され、第2のマルチプレクサ(308)を制御して、絶対増加推定値およびパーセンテージ増加推定値の大きい方を増加された推定値として選択するように構成された第3の回路とを含む請求項12のスピーチ処理装置。
JP2005273821A 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置 Expired - Lifetime JP3964915B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US71366191A 1991-06-11 1991-06-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003172114A Division JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置

Publications (2)

Publication Number Publication Date
JP2006079107A true JP2006079107A (ja) 2006-03-23
JP3964915B2 JP3964915B2 (ja) 2007-08-22

Family

ID=24866989

Family Applications (7)

Application Number Title Priority Date Filing Date
JP50090293A Expired - Lifetime JP3432822B2 (ja) 1991-06-11 1992-06-03 可変速度ボコーダ
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置
JP2003172114A Expired - Lifetime JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Expired - Lifetime JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP50090293A Expired - Lifetime JP3432822B2 (ja) 1991-06-11 1992-06-03 可変速度ボコーダ
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置
JP2003172114A Expired - Lifetime JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Country Status (21)

Country Link
US (3) US5414796A (ja)
EP (8) EP1239456A1 (ja)
JP (7) JP3432822B2 (ja)
CN (8) CN1196271C (ja)
AT (4) ATE294441T1 (ja)
AU (3) AU671952B2 (ja)
BR (1) BR9206143A (ja)
CA (6) CA2483324C (ja)
DE (4) DE69233794D1 (ja)
DK (2) DK0588932T3 (ja)
ES (4) ES2166355T3 (ja)
FI (5) FI120425B (ja)
HK (3) HK1014796A1 (ja)
HU (1) HU215861B (ja)
IL (4) IL113988A (ja)
MX (1) MX9202808A (ja)
NO (1) NO319559B1 (ja)
RU (1) RU2107951C1 (ja)
SG (1) SG70558A1 (ja)
WO (1) WO1992022891A1 (ja)
ZA (1) ZA924082B (ja)

Families Citing this family (500)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010050943A1 (en) * 1989-08-03 2001-12-13 Mahany Ronald L. Radio frequency communication network having adaptive communication parameters
US7606575B2 (en) * 1988-08-04 2009-10-20 Broadcom Corporation Remote radio data communication system with data rate switching
US6693951B1 (en) 1990-06-25 2004-02-17 Qualcomm Incorporated System and method for generating signal waveforms in a CDMA cellular telephone system
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
US5355450A (en) 1992-04-10 1994-10-11 Avid Technology, Inc. Media composer with adjustable source material compression
WO1993012613A1 (en) * 1991-12-13 1993-06-24 Avid Technology, Inc. Quantization table adjustment
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
TW224191B (ja) * 1992-01-28 1994-05-21 Qualcomm Inc
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
FI95086C (fi) * 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
US5617423A (en) 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US5546395A (en) 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
US5754589A (en) 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5453986A (en) 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US6009082A (en) 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5812534A (en) 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5535204A (en) 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5864560A (en) 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5452289A (en) 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
CA2160568A1 (en) * 1993-04-16 1994-10-27 James M. Hardiman Adaptive video compression using variable quantization
AU683056B2 (en) * 1993-04-16 1997-10-30 Media 100 Inc. Adaptive video decompression
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
ZA946674B (en) * 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
US5649299A (en) * 1993-10-27 1997-07-15 Motorola, Inc. Apparatus and method for adapting a digital radiotelephone system to increased subscriber traffic
US6005856A (en) 1993-11-01 1999-12-21 Omnipoint Corporation Communication protocol for spread spectrum wireless communication system
US6094575A (en) 1993-11-01 2000-07-25 Omnipoint Corporation Communication system and method
WO1995012945A1 (en) * 1993-11-01 1995-05-11 Omnipoint Corporation Despreading/demodulating direct sequence spread spectrum signals
US6088590A (en) 1993-11-01 2000-07-11 Omnipoint Corporation Method and system for mobile controlled handoff and link maintenance in spread spectrum communication
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
JP3889038B2 (ja) * 1994-02-17 2007-03-07 モトローラ・インコーポレイテッド 通信システムにおいて符号化レートを制御する方法および装置
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
US5757801A (en) 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
FI98162C (fi) * 1994-05-30 1997-04-25 Tecnomen Oy HMM-malliin perustuva puheentunnistusmenetelmä
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US5638412A (en) 1994-06-15 1997-06-10 Qualcomm Incorporated Method for providing service and rate negotiation in a mobile communication system
US5603096A (en) * 1994-07-11 1997-02-11 Qualcomm Incorporated Reverse link, closed loop power control in a code division multiple access system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5881100A (en) 1994-09-09 1999-03-09 Omnipoint Corporation Method and apparatus for coherent correlation of a spread spectrum signal
US5610940A (en) 1994-09-09 1997-03-11 Omnipoint Corporation Method and apparatus for noncoherent reception and correlation of a continous phase modulated signal
US5648982A (en) 1994-09-09 1997-07-15 Omnipoint Corporation Spread spectrum transmitter
US5963586A (en) 1994-09-09 1999-10-05 Omnipoint Corporation Method and apparatus for parallel noncoherent correlation of a spread spectrum signal
US5856998A (en) 1994-09-09 1999-01-05 Omnipoint Corporation Method and apparatus for correlating a continuous phase modulated spread spectrum signal
US5754585A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Method and apparatus for serial noncoherent correlation of a spread spectrum signal
US5754584A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Non-coherent spread-spectrum continuous-phase modulation communication system
US5680414A (en) 1994-09-09 1997-10-21 Omnipoint Corporation Synchronization apparatus and method for spread spectrum receiver
US5832028A (en) 1994-09-09 1998-11-03 Omnipoint Corporation Method and apparatus for coherent serial correlation of a spread spectrum signal
US5757847A (en) 1994-09-09 1998-05-26 Omnipoint Corporation Method and apparatus for decoding a phase encoded signal
US5629956A (en) 1994-09-09 1997-05-13 Omnipoint Corporation Method and apparatus for reception and noncoherent serial correlation of a continuous phase modulated signal
US5659574A (en) 1994-09-09 1997-08-19 Omnipoint Corporation Multi-bit correlation of continuous phase modulated signals
US5627856A (en) 1994-09-09 1997-05-06 Omnipoint Corporation Method and apparatus for receiving and despreading a continuous phase-modulated spread spectrum signal using self-synchronizing correlators
US5953370A (en) 1994-09-09 1999-09-14 Omnipoint Corporation Apparatus for receiving and correlating a spread spectrum signal
US5692007A (en) 1994-09-09 1997-11-25 Omnipoint Corporation Method and apparatus for differential phase encoding and decoding in spread-spectrum communication systems with continuous-phase modulation
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
ATE213864T1 (de) * 1994-10-05 2002-03-15 Advanced Micro Devices Inc Vorrichtung und verfahren zur sprachsignalanalyse zur parameterbestimmung von sprachsignalmerkmalen
US5546448A (en) * 1994-11-10 1996-08-13 Multi-Tech Systems, Inc. Apparatus and method for a caller ID modem interface
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5784403A (en) * 1995-02-03 1998-07-21 Omnipoint Corporation Spread spectrum correlation using saw device
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
US6292476B1 (en) 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
US6137840A (en) * 1995-03-31 2000-10-24 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
US6977967B1 (en) 1995-03-31 2005-12-20 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
TW347616B (en) 1995-03-31 1998-12-11 Qualcomm Inc Method and apparatus for performing fast power control in a mobile communication system a method and apparatus for controlling transmission power in a mobile communication system is disclosed.
US5548253A (en) * 1995-04-17 1996-08-20 Omnipoint Corporation Spectrally efficient quadrature amplitude modulator
US5508708A (en) * 1995-05-08 1996-04-16 Motorola, Inc. Method and apparatus for location finding in a CDMA system
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
US5745484A (en) 1995-06-05 1998-04-28 Omnipoint Corporation Efficient communication system using time division multiplexing and timing adjustment control
US5689502A (en) * 1995-06-05 1997-11-18 Omnipoint Corporation Efficient frequency division duplex communication system with interleaved format and timing adjustment control
US5959980A (en) 1995-06-05 1999-09-28 Omnipoint Corporation Timing adjustment control for efficient time division duplex communication
US5802046A (en) * 1995-06-05 1998-09-01 Omnipoint Corporation Efficient time division duplex communication system with interleaved format and timing adjustment control
US6356607B1 (en) 1995-06-05 2002-03-12 Omnipoint Corporation Preamble code structure and detection method and apparatus
US6526038B1 (en) * 1995-06-07 2003-02-25 Telcordia Technologies, Inc. Periodic wireless broadcast
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US7929498B2 (en) 1995-06-30 2011-04-19 Interdigital Technology Corporation Adaptive forward power control and adaptive reverse power control for spread-spectrum communications
ZA965340B (en) 1995-06-30 1997-01-27 Interdigital Tech Corp Code division multiple access (cdma) communication system
US7020111B2 (en) 1996-06-27 2006-03-28 Interdigital Technology Corporation System for using rapid acquisition spreading codes for spread-spectrum communications
US6885652B1 (en) 1995-06-30 2005-04-26 Interdigital Technology Corporation Code division multiple access (CDMA) communication system
FI100157B (fi) * 1995-07-12 1997-09-30 Nokia Mobile Phones Ltd Muuttuvanopeuksiset piirikytketyt siirtopalvelut TDMA-pohjaisissa solu kkojärjestelmissä
US6041046A (en) * 1995-07-14 2000-03-21 Omnipoint Corporation Cyclic time hopping in time division multiple access communication system
US5754733A (en) * 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
FR2737948B1 (fr) * 1995-08-16 1997-10-17 Alcatel Mobile Comm France Dispositif de commande de volume sonore pour recepteur de signaux de parole codes par blocs
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US6130888A (en) * 1995-08-31 2000-10-10 Ntt Mobile Communications Network, Inc. ATM transmission method having silence compression controlling function and system transmitter and receiver using the method
US5950164A (en) * 1995-09-29 1999-09-07 Olympus Optical Co., Ltd. Voice recording apparatus capable of displaying remaining recording capacity of memory according to encoding bit rates
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JPH09152896A (ja) * 1995-11-30 1997-06-10 Oki Electric Ind Co Ltd 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5822721A (en) * 1995-12-22 1998-10-13 Iterated Systems, Inc. Method and apparatus for fractal-excited linear predictive coding of digital signals
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5839052A (en) * 1996-02-08 1998-11-17 Qualcom Incorporated Method and apparatus for integration of a wireless communication system with a cable television system
US5867763A (en) * 1996-02-08 1999-02-02 Qualcomm Incorporated Method and apparatus for integration of a wireless communication system with a cable T.V. system
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
US5754537A (en) * 1996-03-08 1998-05-19 Telefonaktiebolaget L M Ericsson (Publ) Method and system for transmitting background noise data
KR100300688B1 (ko) * 1996-03-27 2001-09-06 비센트 비.인그라시아, 알크 엠 아헨 무선통신시스템에서다자간음성접속을제공하기위한방법및장치
SE506341C2 (sv) * 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US6205190B1 (en) * 1996-04-29 2001-03-20 Qualcomm Inc. System and method for reducing interference generated by a CDMA communications device
US5937374A (en) * 1996-05-15 1999-08-10 Advanced Micro Devices, Inc. System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
US6744882B1 (en) 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
US5883927A (en) * 1996-07-31 1999-03-16 Nextwave Telecom, Inc. Digital wireless telecommunication device for reduced interference with hearing aids
JPH1049199A (ja) * 1996-08-02 1998-02-20 Nec Corp 無音圧縮音声符号化復号化装置
US5726983A (en) * 1996-08-09 1998-03-10 Motorola, Inc. Communication device with variable frame processing time
US5812968A (en) * 1996-08-28 1998-09-22 Ericsson, Inc. Vocoder apparatus using the link margin
US5881053A (en) * 1996-09-13 1999-03-09 Qualcomm Incorporated Method for a wireless communications channel
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
KR20000048609A (ko) * 1996-09-25 2000-07-25 러셀 비. 밀러 디코딩된 음성 파라미터를 이용하여 이동전화에 의해 수신된 불량 데이터 패킷을 검출하는 방법 및 장치
US7788092B2 (en) * 1996-09-25 2010-08-31 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US6205130B1 (en) 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US6014622A (en) 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US5954834A (en) * 1996-10-09 1999-09-21 Ericsson Inc. Systems and methods for communicating desired audio information over a communications medium
US5905794A (en) * 1996-10-15 1999-05-18 Multi-Tech Systems, Inc. Caller identification interface using line reversal detection
US6496543B1 (en) 1996-10-29 2002-12-17 Qualcomm Incorporated Method and apparatus for providing high speed data communications in a cellular environment
US5781593A (en) * 1996-11-14 1998-07-14 Omnipoint Corporation Methods and apparatus for vocoder synchronization in mobile communication network
US6141373A (en) 1996-11-15 2000-10-31 Omnipoint Corporation Preamble code structure and detection method and apparatus
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6172965B1 (en) * 1996-12-23 2001-01-09 Nortel Networks Limited Duplex transmission scheme
JP2856185B2 (ja) * 1997-01-21 1999-02-10 日本電気株式会社 音声符号化復号化システム
CA2247429C (en) * 1997-01-23 2002-01-01 Motorola, Inc. Apparatus and method for non-linear processing in a communication system
US7751370B2 (en) 2001-07-13 2010-07-06 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US6335922B1 (en) 1997-02-11 2002-01-01 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US6014375A (en) * 1997-02-13 2000-01-11 Ericsson Inc. TDMA radio protocol with adaptive vocoder selection
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
DE59806449D1 (de) * 1997-02-27 2003-01-09 Siemens Ag Verfahren und anordnung zur rahmenfehlerdetektion zwecks fehlerverdeckung insbesondere bei gsm übertragungen
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6282228B1 (en) 1997-03-20 2001-08-28 Xircom, Inc. Spread spectrum codes for use in communication
US6480521B1 (en) * 1997-03-26 2002-11-12 Qualcomm Incorporated Method and apparatus for transmitting high speed data in a spread spectrum communications system
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
WO1998045833A1 (en) * 1997-04-07 1998-10-15 Koninklijke Philips Electronics N.V. Variable bitrate speech transmission system
KR100198476B1 (ko) * 1997-04-23 1999-06-15 윤종용 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법
US6014623A (en) * 1997-06-12 2000-01-11 United Microelectronics Corp. Method of encoding synthetic speech
US6075792A (en) 1997-06-16 2000-06-13 Interdigital Technology Corporation CDMA communication system which selectively allocates bandwidth upon demand
US6003003A (en) * 1997-06-27 1999-12-14 Advanced Micro Devices, Inc. Speech recognition system having a quantizer using a single robust codebook designed at multiple signal to noise ratios
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6175590B1 (en) 1997-08-08 2001-01-16 Qualcomm Inc. Method and apparatus for determining the rate of received data in a variable rate communication system
US6097972A (en) * 1997-08-29 2000-08-01 Qualcomm Incorporated Method and apparatus for processing power control signals in CDMA mobile telephone system
WO1999012155A1 (en) * 1997-09-30 1999-03-11 Qualcomm Incorporated Channel gain modification system and method for noise reduction in voice communication
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US5898696A (en) * 1997-09-05 1999-04-27 Motorola, Inc. Method and system for controlling an encoding rate in a variable rate communication system
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
US6920150B1 (en) * 1997-09-30 2005-07-19 Lucent Technologies Inc. Adaptive communications transcoding and error control
US5897613A (en) * 1997-10-08 1999-04-27 Lucent Technologies Inc. Efficient transmission of voice silence intervals
US6067515A (en) * 1997-10-27 2000-05-23 Advanced Micro Devices, Inc. Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition
US6070136A (en) * 1997-10-27 2000-05-30 Advanced Micro Devices, Inc. Matrix quantization with vector quantization error compensation for robust speech recognition
US5953695A (en) * 1997-10-29 1999-09-14 Lucent Technologies Inc. Method and apparatus for synchronizing digital speech communications
US9118387B2 (en) 1997-11-03 2015-08-25 Qualcomm Incorporated Pilot reference transmission for a wireless communication system
US7184426B2 (en) 2002-12-12 2007-02-27 Qualcomm, Incorporated Method and apparatus for burst pilot for a time division multiplex system
US6563803B1 (en) * 1997-11-26 2003-05-13 Qualcomm Incorporated Acoustic echo canceller
US6044339A (en) * 1997-12-02 2000-03-28 Dspc Israel Ltd. Reduced real-time processing in stochastic celp encoding
DE19753697B4 (de) * 1997-12-03 2006-04-27 Siemens Ag Verfahren und Funkstation zur Datenübertragung in einem Kommunikationssystem
US6049765A (en) * 1997-12-22 2000-04-11 Lucent Technologies Inc. Silence compression for recorded voice messages
US6104994A (en) * 1998-01-13 2000-08-15 Conexant Systems, Inc. Method for speech coding under background noise conditions
JPH11215006A (ja) * 1998-01-29 1999-08-06 Olympus Optical Co Ltd ディジタル音声信号の送信装置及び受信装置
US6799159B2 (en) * 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing
US6381569B1 (en) * 1998-02-04 2002-04-30 Qualcomm Incorporated Noise-compensated speech recognition templates
US6603751B1 (en) * 1998-02-13 2003-08-05 Qualcomm Incorporated Method and system for performing a handoff in a wireless communication system, such as a hard handoff
US6545989B1 (en) 1998-02-19 2003-04-08 Qualcomm Incorporated Transmit gating in a wireless communication system
US6104991A (en) * 1998-02-27 2000-08-15 Lucent Technologies, Inc. Speech encoding and decoding system which modifies encoding and decoding characteristics based on an audio signal
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
US6028541A (en) * 1998-03-12 2000-02-22 Liquid Audio Inc. Lossless data compression with low complexity
US6125348A (en) * 1998-03-12 2000-09-26 Liquid Audio Inc. Lossless data compression with low complexity
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6043763A (en) * 1998-03-12 2000-03-28 Liquid Audio, Inc. Lossless data compression with low complexity
US6118392A (en) * 1998-03-12 2000-09-12 Liquid Audio Inc. Lossless data compression with low complexity
US6169906B1 (en) * 1998-03-24 2001-01-02 Motorola, Inc. Method of transmitting messages in a dispatch call
US20030194033A1 (en) 1998-05-21 2003-10-16 Tiedemann Edward G. Method and apparatus for coordinating transmission of short messages with hard handoff searches in a wireless communications system
US6577645B2 (en) 1998-06-03 2003-06-10 Siemens Aktiengesellschaft Method and radio set for transmitting messages
CN1115076C (zh) * 1998-06-03 2003-07-16 西门子公司 用于传输消息的方法和无线设备
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US6081776A (en) * 1998-07-13 2000-06-27 Lockheed Martin Corp. Speech coding system and method including adaptive finite impulse response filter
DE19833318C2 (de) * 1998-07-24 2001-08-02 Bosch Gmbh Robert Verfahren zur Übertragung von digitalen Nutzdaten
US6163766A (en) * 1998-08-14 2000-12-19 Motorola, Inc. Adaptive rate system and method for wireless communications
US6173254B1 (en) * 1998-08-18 2001-01-09 Denso Corporation, Ltd. Recorded message playback system for a variable bit rate system
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6798736B1 (en) * 1998-09-22 2004-09-28 Qualcomm Incorporated Method and apparatus for transmitting and receiving variable rate data
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6219642B1 (en) 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
US6463407B2 (en) 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6754630B2 (en) * 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6233549B1 (en) 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6289099B1 (en) 1998-11-30 2001-09-11 Qualcomm Inc. Ringer for satellite user terminals
US6256606B1 (en) 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6512925B1 (en) * 1998-12-03 2003-01-28 Qualcomm, Incorporated Method and apparatus for controlling transmission power while in soft handoff
US6275485B1 (en) 1998-12-03 2001-08-14 Qualcomm Inc. Noise characterization in a wireless communication system
US6182030B1 (en) 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6542486B1 (en) * 1998-12-22 2003-04-01 Nortel Networks Limited Multiple technology vocoder and an associated telecommunications network
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
US7406098B2 (en) * 1999-01-13 2008-07-29 Qualcomm Incorporated Resource allocation in a communication system supporting application flows having quality of service requirements
US6330247B1 (en) 1999-02-08 2001-12-11 Qualcomm Incorporated Communication protocol between a communication device and an external accessory
US6411926B1 (en) 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
US6574596B2 (en) 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
US6324509B1 (en) 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise
US6226607B1 (en) * 1999-02-08 2001-05-01 Qualcomm Incorporated Method and apparatus for eighth-rate random number generation for speech coders
AU3589100A (en) * 1999-02-08 2000-08-25 Qualcomm Incorporated Speech synthesizer based on variable rate speech coding
US6587446B2 (en) * 1999-02-11 2003-07-01 Qualcomm Incorporated Handoff in a wireless communication system
US6260009B1 (en) 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6088347A (en) * 1999-03-10 2000-07-11 Massachusetts Institute Of Technology Variable chip rate code-division multiple access
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US6233552B1 (en) * 1999-03-12 2001-05-15 Comsat Corporation Adaptive post-filtering technique based on the Modified Yule-Walker filter
US6519479B1 (en) 1999-03-31 2003-02-11 Qualcomm Inc. Spoken user interface for speech-enabled devices
CN1186893C (zh) * 1999-04-12 2005-01-26 三星电子株式会社 码分多址通信系统中的选通传输装置和方法
US7058573B1 (en) * 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6260017B1 (en) 1999-05-07 2001-07-10 Qualcomm Inc. Multipulse interpolative coding of transition speech frames
US6766295B1 (en) 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6661832B1 (en) 1999-05-11 2003-12-09 Qualcomm Incorporated System and method for providing an accurate estimation of received signal interference for use in wireless communications systems
US6954727B1 (en) * 1999-05-28 2005-10-11 Koninklijke Philips Electronics N.V. Reducing artifact generation in a vocoder
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6393394B1 (en) 1999-07-19 2002-05-21 Qualcomm Incorporated Method and apparatus for interleaving line spectral information quantization methods in a speech coder
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6324503B1 (en) 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
US6397175B1 (en) 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6496706B1 (en) 1999-07-23 2002-12-17 Qualcomm Incorporated Method and system for transmit gating in a wireless communication system
US6704328B1 (en) * 1999-07-26 2004-03-09 Nortel Networks, Limited Signalling scheme and messaging structure to support the smoothing of large bit rate transmissions
US6603752B1 (en) * 1999-07-29 2003-08-05 Ahmed Saifuddin Method and system for controlling transmission energy in a variable rate gated communication system
US6658112B1 (en) 1999-08-06 2003-12-02 General Dynamics Decision Systems, Inc. Voice decoder and method for detecting channel errors using spectral energy evolution
US6633552B1 (en) 1999-08-06 2003-10-14 Qualcomm Incorporated Method and apparatus for determining the closed loop power control set point in a wireless packet data communication system
US6597667B1 (en) 1999-08-18 2003-07-22 Qualcomm Incorporated Network based muting of a cellular telephone
US6493329B1 (en) * 1999-08-23 2002-12-10 Qualcomm Incorporated Adaptive channel estimation in a wireless communication system
US8064409B1 (en) 1999-08-25 2011-11-22 Qualcomm Incorporated Method and apparatus using a multi-carrier forward link in a wireless communication system
US6426971B1 (en) 1999-09-13 2002-07-30 Qualcomm Incorporated System and method for accurately predicting signal to interference and noise ratio to improve communications system performance
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6574593B1 (en) 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6708024B1 (en) * 1999-09-22 2004-03-16 Legerity, Inc. Method and apparatus for generating comfort noise
US7054809B1 (en) * 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
AU766830B2 (en) * 1999-09-22 2003-10-23 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
AU2003262451B2 (en) * 1999-09-22 2006-01-19 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6772126B1 (en) * 1999-09-30 2004-08-03 Motorola, Inc. Method and apparatus for transferring low bit rate digital voice messages using incremental messages
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6850506B1 (en) 1999-10-07 2005-02-01 Qualcomm Incorporated Forward-link scheduling in a wireless communication system
US6621804B1 (en) 1999-10-07 2003-09-16 Qualcomm Incorporated Method and apparatus for predicting favored supplemental channel transmission slots using transmission power measurements of a fundamental channel
US6463274B1 (en) * 1999-10-26 2002-10-08 Denso Corporation Multiple class of service determination for digital cellular telephones
US7522631B1 (en) * 1999-10-26 2009-04-21 Qualcomm, Incorporated Method and apparatus for efficient data transmission control in a wireless voice-over-data communication system
US6438518B1 (en) 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US6496794B1 (en) * 1999-11-22 2002-12-17 Motorola, Inc. Method and apparatus for seamless multi-rate speech coding
US6772112B1 (en) 1999-12-10 2004-08-03 Lucent Technologies Inc. System and method to reduce speech delay and improve voice quality using half speech blocks
BR0006803A (pt) * 1999-12-10 2001-12-11 Lucent Technologies Inc Sistema e método para reduzir retardo de fala emelhorar a qualidade de fala utilizando meiosblocos
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US6745024B1 (en) 2000-01-10 2004-06-01 Qualcomm Incorporated System and method for preparing and sending an electronic mail communication using a wireless communications device
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
EP1126651A1 (en) * 2000-02-16 2001-08-22 Lucent Technologies Inc. Link adaptation for RT-EGPRS
US6721368B1 (en) 2000-03-04 2004-04-13 Qualcomm Incorporated Transmitter architectures for communications systems
BR0110253A (pt) * 2000-04-24 2006-02-07 Qualcomm Inc Método, codificador de fala, elemento de infra-estrutura e unidade de assinante configurados para quantizar informações sobre um parâmetro de fala; bem como, método e codificador de fala configurado para quantizar informações sobre um parâmetro de fase de fala
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US6980527B1 (en) 2000-04-25 2005-12-27 Cwill Telecommunications, Inc. Smart antenna CDMA wireless communication system
US6285682B1 (en) * 2000-05-01 2001-09-04 Motorola, Inc. Method and apparatus for determining the frame rate of a frame
US7080009B2 (en) * 2000-05-01 2006-07-18 Motorola, Inc. Method and apparatus for reducing rate determination errors and their artifacts
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US7089181B2 (en) 2001-05-30 2006-08-08 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
US6954745B2 (en) 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US7035790B2 (en) 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6735563B1 (en) 2000-07-13 2004-05-11 Qualcomm, Inc. Method and apparatus for constructing voice templates for a speaker-independent voice recognition system
US6671669B1 (en) * 2000-07-18 2003-12-30 Qualcomm Incorporated combined engine system and method for voice recognition
US6510142B1 (en) 2000-07-21 2003-01-21 Motorola, Inc. Method and apparatus for reduced reversed traffic in a cellular telephone system
US6856954B1 (en) * 2000-07-28 2005-02-15 Mindspeed Technologies, Inc. Flexible variable rate vocoder for wireless communication systems
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
EP1944759B1 (en) * 2000-08-09 2010-10-20 Sony Corporation Voice data processing device and processing method
US6477502B1 (en) 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US6842733B1 (en) 2000-09-15 2005-01-11 Mindspeed Technologies, Inc. Signal processing system for filtering spectral content of a signal for speech coding
US6802035B2 (en) * 2000-09-19 2004-10-05 Intel Corporation System and method of dynamically optimizing a transmission mode of wirelessly transmitted information
US6760882B1 (en) 2000-09-19 2004-07-06 Intel Corporation Mode selection for data transmission in wireless communication channels based on statistical parameters
US7171355B1 (en) 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US6973098B1 (en) 2000-10-25 2005-12-06 Qualcomm, Incorporated Method and apparatus for determining a data rate in a high rate packet data wireless communications system
US7068683B1 (en) 2000-10-25 2006-06-27 Qualcomm, Incorporated Method and apparatus for high rate packet data and low delay data transmissions
DK1206104T3 (da) * 2000-11-09 2006-10-30 Koninkl Kpn Nv Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US6999430B2 (en) * 2000-11-30 2006-02-14 Qualcomm Incorporated Method and apparatus for transmitting data traffic on a wireless communication channel
US6804218B2 (en) 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7505594B2 (en) * 2000-12-19 2009-03-17 Qualcomm Incorporated Discontinuous transmission (DTX) controller system and method
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7346918B2 (en) 2000-12-27 2008-03-18 Z-Band, Inc. Intelligent device system and method for distribution of digital signals on a wideband signal distribution system
EP1410513A4 (en) 2000-12-29 2005-06-29 Infineon Technologies Ag CHANNEL CODEC PROCESSOR CONFIGURABLE FOR MULTIPLE WIRELESS COMMUNICATION STANDARDS
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
US7120134B2 (en) 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
US20040204935A1 (en) * 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
US6760587B2 (en) 2001-02-23 2004-07-06 Qualcomm Incorporated Forward-link scheduling in a wireless communication system during soft and softer handoff
US7289461B2 (en) 2001-03-15 2007-10-30 Qualcomm Incorporated Communications using wideband terminals
US20020181546A1 (en) * 2001-03-23 2002-12-05 Odenwalder Joseph P. Preamble channels
US6760576B2 (en) 2001-03-27 2004-07-06 Qualcomm Incorporated Method and apparatus for enhanced rate determination in high data rate wireless communication systems
US8199696B2 (en) * 2001-03-29 2012-06-12 Qualcomm Incorporated Method and apparatus for power control in a wireless communication system
US7230941B2 (en) * 2001-04-26 2007-06-12 Qualcomm Incorporated Preamble channel decoding
US6625172B2 (en) 2001-04-26 2003-09-23 Joseph P. Odenwalder Rescheduling scheduled transmissions
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
US7170924B2 (en) * 2001-05-17 2007-01-30 Qualcomm, Inc. System and method for adjusting combiner weights using an adaptive algorithm in wireless communications system
US6990137B2 (en) * 2001-05-17 2006-01-24 Qualcomm, Incorporated System and method for received signal prediction in wireless communications systems
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
GB2387304B (en) 2001-06-28 2004-07-07 Samsung Electronics Co Ltd Apparatus and method for decoding TFCI bits for a hard split mode in a CDMA mobile communication system
US7489655B2 (en) * 2001-07-06 2009-02-10 Qualcomm, Incorporated Method and apparatus for predictive scheduling in a bi-directional communication system
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7406411B2 (en) * 2001-08-17 2008-07-29 Broadcom Corporation Bit error concealment methods for speech coding
US7162415B2 (en) * 2001-11-06 2007-01-09 The Regents Of The University Of California Ultra-narrow bandwidth voice coding
US7453801B2 (en) * 2001-11-08 2008-11-18 Qualcomm Incorporated Admission control and resource allocation in a communication system supporting application flows having quality of service requirements
KR100962153B1 (ko) * 2001-12-05 2010-06-10 퀄컴 인코포레이티드 통신 시스템에서 서비스 품질을 조정하기 위한 시스템 및방법
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
GB2383239B (en) * 2001-12-15 2004-03-17 Motorola Inc A method and apparatus for transmitting data
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP3778087B2 (ja) * 2002-01-18 2006-05-24 富士ゼロックス株式会社 データ符号化装置及びデータ復号装置
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US6957183B2 (en) * 2002-03-20 2005-10-18 Qualcomm Inc. Method for robust voice recognition by analyzing redundant features of source signal
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
GB2396271B (en) * 2002-12-10 2005-08-10 Motorola Inc A user terminal and method for voice communication
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7120447B1 (en) * 2003-02-24 2006-10-10 Nortel Networks Limited Selectable mode vocoder management algorithm for CDMA based networks
US6965859B2 (en) * 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
US7009999B2 (en) * 2003-03-28 2006-03-07 Qualcomm Incorporated Selective variable rate encoding to regulate data frame size
KR20050007977A (ko) * 2003-07-12 2005-01-21 삼성전자주식회사 이동 통신 시스템에서의 보코더의 모드 및 전송율 제어 방법
US7577756B2 (en) * 2003-07-15 2009-08-18 Special Devices, Inc. Dynamically-and continuously-variable rate, asynchronous data transfer
US7343291B2 (en) 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US7146309B1 (en) 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
US7505764B2 (en) * 2003-10-28 2009-03-17 Motorola, Inc. Method for retransmitting a speech packet
US20050147131A1 (en) * 2003-12-29 2005-07-07 Nokia Corporation Low-rate in-band data channel using CELP codewords
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
ATE523876T1 (de) * 2004-03-05 2011-09-15 Panasonic Corp Fehlerverbergungseinrichtung und fehlerverbergungsverfahren
JP2005337573A (ja) 2004-05-26 2005-12-08 Sanden Corp 熱交換器
ES2634511T3 (es) * 2004-07-23 2017-09-28 Iii Holdings 12, Llc Aparato de codificación de audio y procedimiento de codificación de audio
WO2006022124A1 (ja) * 2004-08-27 2006-03-02 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ、方法及びプログラム
CA2691762C (en) 2004-08-30 2012-04-03 Qualcomm Incorporated Method and apparatus for an adaptive de-jitter buffer
SE0402372D0 (sv) 2004-09-30 2004-09-30 Ericsson Telefon Ab L M Signal coding
SE528213C3 (sv) * 2004-09-30 2006-10-31 Ericsson Telefon Ab L M Förfaranden och arrangemang för adaptiva trösklar vid val av kodek
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US20060109819A1 (en) * 2004-11-22 2006-05-25 Marin James S Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US7697480B2 (en) * 2004-11-22 2010-04-13 Motorola, Inc Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
US7983301B2 (en) * 2005-06-24 2011-07-19 O2Micro International, Ltd. Method for extended transmission capabilities of short message service
US20070005347A1 (en) * 2005-06-30 2007-01-04 Kotzin Michael D Method and apparatus for data frame construction
US20080201689A1 (en) * 2005-06-30 2008-08-21 Freescale Semiconductor, Inc. Vector Crc Computatuion on Dsp
JP5035816B2 (ja) * 2005-07-14 2012-09-26 一般財団法人電力中央研究所 細孔内付着液体残留量推定方法
US7542421B2 (en) * 2005-09-09 2009-06-02 Tropos Networks Adaptive control of transmission power and data rates of transmission links between access nodes of a mesh network
CN1964244B (zh) * 2005-11-08 2010-04-07 厦门致晟科技有限公司 一种用声码器收发数字信号的方法
CN101317218B (zh) * 2005-12-02 2013-01-02 高通股份有限公司 用于频域波形对准的系统、方法和设备
ATE475171T1 (de) * 2005-12-05 2010-08-15 Qualcomm Inc Verfahren und vorrichtung zur erkennung tonaler komponenten von audiosignalen
KR100744542B1 (ko) * 2005-12-08 2007-08-01 한국전자통신연구원 가변대역 멀티코덱 QoS 제어 장치 및 방법
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US8036242B2 (en) * 2006-02-15 2011-10-11 Qualcomm Incorporated Dynamic capacity operating point management for a vocoder in an access terminal
US7720499B2 (en) * 2006-02-27 2010-05-18 Tropos Networks, Inc. Regulation of transmission power control in mitigate self interference by optimizing link transmission parameters in a wireless network
JP4771835B2 (ja) * 2006-03-06 2011-09-14 株式会社リコー トナー及び画像形成方法
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
US7778828B2 (en) * 2006-03-15 2010-08-17 Sasken Communication Technologies Ltd. Method and system for automatic gain control of a speech signal
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
DE102006025042B4 (de) * 2006-05-26 2008-08-14 Infineon Technologies Ag Datenratenfehler-tolerante Synchronisation eines digitalen Empfängers
US8036186B2 (en) * 2006-07-26 2011-10-11 Tropos Networks, Inc. Adaptively setting transmission power levels of nodes within a wireless mesh network
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
WO2008031458A1 (en) * 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8331329B2 (en) * 2006-10-06 2012-12-11 Viasat, Inc. Forward and reverse calibration for ground-based beamforming
JP5096474B2 (ja) * 2006-10-10 2012-12-12 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
KR100833499B1 (ko) * 2006-10-27 2008-05-29 한국전자통신연구원 가변 대역 멀티 코덱의 음성 품질 측정 장치 및 방법
CN100587186C (zh) * 2006-11-02 2010-02-03 邹家祥 一种保温组合墙板构筑墙体的方法
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
WO2009078093A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
US8452588B2 (en) * 2008-03-14 2013-05-28 Panasonic Corporation Encoding device, decoding device, and method thereof
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7949775B2 (en) 2008-05-30 2011-05-24 Microsoft Corporation Stream selection for enhanced media streaming
US7948887B2 (en) * 2008-06-24 2011-05-24 Microsoft Corporation Network bandwidth measurement
US8144602B2 (en) * 2008-08-06 2012-03-27 Jds Uniphase Corporation Network load tester with real-time detection and recording
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
US8964692B2 (en) * 2008-11-10 2015-02-24 Qualcomm Incorporated Spectrum sensing of bluetooth using a sequence of energy detection measurements
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
WO2010140940A1 (en) * 2009-06-04 2010-12-09 Telefonaktiebolaget Lm Ericsson (Publ) A method and arrangement for estimating the quality degradation of a processed signal
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
US8954320B2 (en) * 2009-07-27 2015-02-10 Scti Holdings, Inc. System and method for noise reduction in processing speech signals by targeting speech and disregarding noise
US8811200B2 (en) 2009-09-22 2014-08-19 Qualcomm Incorporated Physical layer metrics to support adaptive station-dependent channel state information feedback rate in multi-user communication systems
EP2491559B1 (en) * 2009-10-19 2014-12-10 Telefonaktiebolaget LM Ericsson (publ) Method and background estimator for voice activity detection
WO2011065741A2 (ko) * 2009-11-24 2011-06-03 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
WO2012110473A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
CA2827335C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
EP3471092B1 (en) 2011-02-14 2020-07-08 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Decoding of pulse positions of tracks of an audio signal
JP5914527B2 (ja) 2011-02-14 2016-05-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 過渡検出及び品質結果を使用してオーディオ信号の一部分を符号化する装置及び方法
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
CN103620672B (zh) * 2011-02-14 2016-04-27 弗劳恩霍夫应用研究促进协会 用于低延迟联合语音及音频编码(usac)中的错误隐藏的装置和方法
US8762136B2 (en) * 2011-05-03 2014-06-24 Lsi Corporation System and method of speech compression using an inter frame parameter correlation
US8990074B2 (en) * 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
US9208796B2 (en) * 2011-08-22 2015-12-08 Genband Us Llc Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same
US9015039B2 (en) * 2011-12-21 2015-04-21 Huawei Technologies Co., Ltd. Adaptive encoding pitch lag for voiced speech
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
RU2633107C2 (ru) * 2012-12-21 2017-10-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Добавление комфортного шума для моделирования фонового шума при низких скоростях передачи данных
WO2014096279A1 (en) 2012-12-21 2014-06-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
RU2640722C2 (ru) 2013-04-05 2018-01-11 Долби Интернешнл Аб Усовершенствованный квантователь
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9640185B2 (en) * 2013-12-12 2017-05-02 Motorola Solutions, Inc. Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
US9570095B1 (en) * 2014-01-17 2017-02-14 Marvell International Ltd. Systems and methods for instantaneous noise estimation
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
CN105023579A (zh) * 2014-04-30 2015-11-04 中国电信股份有限公司 语音通信中语音编码实现方法、装置和通信终端
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN104833105A (zh) * 2015-05-28 2015-08-12 芜湖美的厨卫电器制造有限公司 热水器和热水器系统
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
EP3398191B1 (en) * 2016-01-03 2021-04-28 Auro Technologies Nv A signal encoder, decoder and methods using predictor models
US11227214B2 (en) 2017-11-14 2022-01-18 Advanced Micro Devices, Inc. Memory bandwidth reduction techniques for low power convolutional neural network inference applications
EA038803B1 (ru) * 2017-12-25 2021-10-21 Федеральное государственное унитарное предприятие "Всероссийский научно-исследовательский институт автоматики им. Н.Л. Духова" Способ адаптивной цифровой фильтрации импульсных помех и фильтр для его реализации
US11948073B2 (en) 2018-04-20 2024-04-02 Advanced Micro Devices, Inc. Machine learning inference engine scalability
RU2691122C1 (ru) * 2018-06-13 2019-06-11 Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) Способ и устройство компандирования звуковых вещательных сигналов
US11775799B2 (en) 2018-08-02 2023-10-03 Advanced Micro Devices, Inc. Runtime extension for neural network training with heterogeneous memory
US11769041B2 (en) 2018-10-31 2023-09-26 Advanced Micro Devices, Inc. Low latency long short-term memory inference with sequence interleaving
US11063645B2 (en) 2018-12-18 2021-07-13 XCOM Labs, Inc. Methods of wirelessly communicating with a group of devices
US10756795B2 (en) 2018-12-18 2020-08-25 XCOM Labs, Inc. User equipment with cellular link and peer-to-peer link
CN111338974A (zh) 2018-12-19 2020-06-26 超威半导体公司 用于矩阵数学指令集的图块化算法
CN111353575A (zh) * 2018-12-20 2020-06-30 超威半导体公司 用于卷积神经网络的图块化格式
US11330649B2 (en) 2019-01-25 2022-05-10 XCOM Labs, Inc. Methods and systems of multi-link peer-to-peer communications
US10756767B1 (en) 2019-02-05 2020-08-25 XCOM Labs, Inc. User equipment for wirelessly communicating cellular signal with another user equipment
CN111723918A (zh) 2019-03-18 2020-09-29 超威半导体公司 用于卷积内核的自动生成和调谐工具
US11610142B2 (en) 2019-05-28 2023-03-21 Ati Technologies Ulc Safety monitor for image misclassification
US11210199B2 (en) 2019-05-31 2021-12-28 Ati Technologies Ulc Safety monitor for invalid image transform
US11250867B1 (en) * 2019-10-08 2022-02-15 Rockwell Collins, Inc. Incorporating data into a voice signal with zero overhead
JP7332890B2 (ja) 2019-11-19 2023-08-24 アイコム株式会社 音声通信システム、音声通信方法、および、音声通信プログラム
US11023390B1 (en) * 2020-03-27 2021-06-01 Arm Limited Resizing circuitry
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US32580A (en) * 1861-06-18 Water-elevatok
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ja) * 1973-06-15 1975-02-25
US3988674A (en) * 1975-03-17 1976-10-26 Communications Satellite Corporation (Comsat) Frame synchronization in speech predictive encoded communication system
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ja) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
US4379949A (en) * 1981-08-10 1983-04-12 Motorola, Inc. Method of and means for variable-rate coding of LPC parameters
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4831624A (en) * 1987-06-04 1989-05-16 Motorola, Inc. Error detection method for sub-band coding
US4802171A (en) * 1987-06-04 1989-01-31 Motorola, Inc. Method for error correction in digitally encoded speech
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
EP0306099B1 (en) * 1987-09-02 1992-09-30 MOLTECH Invent S.A. A ceramic/metal composite material
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US5077798A (en) * 1988-09-28 1991-12-31 Hitachi, Ltd. Method and system for voice coding based on vector quantization
DE3853161T2 (de) * 1988-10-19 1995-08-17 Ibm Vektorquantisierungscodierer.
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
AU6174290A (en) * 1989-10-06 1991-04-28 Motorola, Inc. Error detection/correction scheme for vocoders
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
CH680030A5 (ja) * 1990-03-22 1992-05-29 Ascom Zelcom Ag
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5566206A (en) * 1993-06-18 1996-10-15 Qualcomm Incorporated Method and apparatus for determining data rate of transmitted variable rate data in a communications receiver
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method

Also Published As

Publication number Publication date
EP1763020A3 (en) 2010-09-29
NO934544D0 (no) 1993-12-10
CN1286086C (zh) 2006-11-22
FI118702B (fi) 2008-02-15
BR9206143A (pt) 1995-01-03
US5778338A (en) 1998-07-07
CN1492395A (zh) 2004-04-28
DE69233794D1 (de) 2010-09-23
CA2483296C (en) 2008-01-22
FI20011508A (fi) 2001-07-10
HU215861B (hu) 1999-03-29
EP0588932A1 (en) 1994-03-30
HK1127152A1 (en) 2009-09-18
MX9202808A (es) 1992-12-01
IL102146A (en) 1996-03-31
CN1119796C (zh) 2003-08-27
EP0588932B1 (en) 2001-11-14
CN1909059A (zh) 2007-02-07
AU711484B2 (en) 1999-10-14
US5657420A (en) 1997-08-12
CN1220334C (zh) 2005-09-21
DE69232202D1 (de) 2001-12-20
AU6089396A (en) 1996-10-03
CA2483322C (en) 2008-09-23
JP3964915B2 (ja) 2007-08-22
CA2483322A1 (en) 1992-12-23
EP1107231A2 (en) 2001-06-13
FI935597A (fi) 1993-12-13
HUT70719A (en) 1995-10-30
CN1381956A (zh) 2002-11-27
JP3955600B2 (ja) 2007-08-08
NO934544L (no) 1993-12-10
IL113988A (en) 1996-11-14
CA2568984C (en) 2007-07-10
AU671952B2 (en) 1996-09-19
EP1126437A2 (en) 2001-08-22
ATE272883T1 (de) 2004-08-15
EP1107231B1 (en) 2005-04-27
AU2186592A (en) 1993-01-12
JP2002202800A (ja) 2002-07-19
DE69233502T2 (de) 2006-02-23
CN1071036A (zh) 1993-04-14
JPH06511320A (ja) 1994-12-15
CN1167309A (zh) 1997-12-10
EP1998319A3 (en) 2008-12-17
DK0588932T3 (da) 2002-03-11
ZA924082B (en) 1993-02-26
IL113986A (en) 1996-11-14
FI120425B (fi) 2009-10-15
CN1196271C (zh) 2005-04-06
DE69233502D1 (de) 2005-06-02
JP4191746B2 (ja) 2008-12-03
EP1162601A2 (en) 2001-12-12
EP1998319A2 (en) 2008-12-03
ES2166355T3 (es) 2002-04-16
CA2568984A1 (en) 1992-12-23
EP1107231A3 (en) 2001-12-05
IL113988A0 (en) 1995-10-31
EP1162601A3 (en) 2002-07-03
JP2006221186A (ja) 2006-08-24
CA2102099C (en) 2006-04-04
AU1482597A (en) 1997-05-15
AU693374B2 (en) 1998-06-25
ES2348319T3 (es) 2010-12-02
EP1239456A1 (en) 2002-09-11
FI20011509A (fi) 2001-07-10
ES2225321T3 (es) 2005-03-16
EP1763020A2 (en) 2007-03-14
JP3566669B2 (ja) 2004-09-15
WO1992022891A1 (en) 1992-12-23
CA2483296A1 (en) 1992-12-23
IL113987A (en) 1996-11-14
US5414796A (en) 1995-05-09
CA2483324A1 (en) 1992-12-23
CN1091535C (zh) 2002-09-25
DE69233397D1 (de) 2004-09-09
CA2483324C (en) 2008-05-06
EP1126437B1 (en) 2004-08-04
FI20061121A (fi) 2006-12-15
FI20061122L (fi) 2006-12-15
JP3432822B2 (ja) 2003-08-04
ATE208945T1 (de) 2001-11-15
DE69233397T2 (de) 2005-08-11
CA2635914A1 (en) 1992-12-23
JP2004004897A (ja) 2004-01-08
RU2107951C1 (ru) 1998-03-27
EP1998319B1 (en) 2010-08-11
ATE477571T1 (de) 2010-08-15
DE69232202T2 (de) 2002-07-25
JP2002023796A (ja) 2002-01-25
HK1014796A1 (en) 1999-09-30
EP1126437A3 (en) 2001-12-12
CA2102099A1 (en) 1992-12-12
JP2005182075A (ja) 2005-07-07
ATE294441T1 (de) 2005-05-15
HK1064785A1 (en) 2005-02-04
CN1112673C (zh) 2003-06-25
DK1126437T3 (da) 2004-11-08
CN1159639A (zh) 1997-09-17
NO319559B1 (no) 2005-08-29
CN1398052A (zh) 2003-02-19
ES2240252T3 (es) 2005-10-16
FI935597A0 (fi) 1993-12-13
IL113986A0 (en) 1995-10-31
JP3751957B2 (ja) 2006-03-08
IL113987A0 (en) 1995-10-31
EP1675100A2 (en) 2006-06-28
SG70558A1 (en) 2000-02-22

Similar Documents

Publication Publication Date Title
JP3964915B2 (ja) エンコードまたはデコードの方法および装置
AU685902B2 (en) Linear prediction coefficient generation during frame erasure or packet loss
US5615298A (en) Excitation signal synthesis during frame erasure or packet loss

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060613

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070205

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070524

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 5

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130601

Year of fee payment: 6