Nothing Special   »   [go: up one dir, main page]

JPH09500503A - 適応ビット配分符号化装置及び方法 - Google Patents

適応ビット配分符号化装置及び方法

Info

Publication number
JPH09500503A
JPH09500503A JP7504753A JP50475395A JPH09500503A JP H09500503 A JPH09500503 A JP H09500503A JP 7504753 A JP7504753 A JP 7504753A JP 50475395 A JP50475395 A JP 50475395A JP H09500503 A JPH09500503 A JP H09500503A
Authority
JP
Japan
Prior art keywords
encoder
signal
input signal
masking threshold
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7504753A
Other languages
English (en)
Other versions
JP3297051B2 (ja
Inventor
デビットソン、グランド・アレン
トッド、クレグ・キャンベル
ディビス、マーク・フランクリン
リンク、ブライアン・ディビット
フィルダー、ルイス・ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/145,975 external-priority patent/US5632003A/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JPH09500503A publication Critical patent/JPH09500503A/ja
Application granted granted Critical
Publication of JP3297051B2 publication Critical patent/JP3297051B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 本発明は、計算を効率的にする精巧な知覚モデルに関する。本発明の知覚モデルによって、高品質の低ビットレート符号化システムで有用な、符号化情報の適応ビット割当て及び量子化のための基礎を提供することができる。1つの実施例では、オーディオ分割帯域符号器によって、入力信号は周波数サブバンド信号に分割され、サブバンド信号は割当て関数で確定される値に従って量子化され、量子化サブバンド信号は符号化信号にアセンブルされる。割当て関数によって、割当て値がマスキングしきい値に基づく音響心理学原理に従って確定される。マスキングしきい値は、(イ) 入力信号の電力スペクトル密度(PSD)を推定し、(ロ) 拡散関数をPSDに適用することで刺激パターンを発生させ、(ハ) 刺激パターンを音響心理学的マスキングを達成するに足る信号対雑音比(SNR)オフセットに等しい量に調節し、(ニ) 調節済みパターンのレベルと聴覚のしきい値とを比較して、調節済みパターン・レベルと聴覚しきい値の何れか大きい方に等しいマスキングしきい値を発生させることによって確定される。拡散関数は、1つ又はそれ以上の非巡回型フィルタを入力信号PSDに適用することで実行できる。順方向適応符号化システムでは、割当て値は、符号化信号にアセンブルされた情報によって、明示的に復号器に伝達される。逆方向適応符号化システムでは、割当て値は、復号器割当て関数で割当て値を誘導できる符号化信号にアセンブルされた情報によって、明示的に復号器に伝達される。ハイブリッド適応符号化システムでは、基本割当て値は、明示的に伝達される改変割当て値と共に明示的に伝達される。

Description

【発明の詳細な説明】 適応ビット配分符号化装置及び方法 技術分野 本発明は概して、知覚モデルと、オーディオ信号のような情報の、知覚を基本 とする低ビットレート符号化及び復号に関する。更に詳しく言うと、本発明は、 電算上効率的な高性能知覚モデルに関する。同知覚モデルは、高品質の低ビット レート符号化システムで有用な符号化された情報の適応ビット配分及び量子化の ための基礎を提供することができる。 発明の背景 オーディオ及びビデオの信号処理分野の関係者の間では、信号を表すのに必要 な情報の量を信号の知覚上の質を損なわずに最少化することについて大きな関心 がある。情報の要件を低減させることによって、信号から要求される通信チャネ ル及び記憶媒体への情報容量要件は低下する。 例えば、オーディオの振幅の圧縮又はダイナミックレンジの低減を施したアナ ログ信号は、圧縮を施してない信号に比べて低い情報容量要件しか要しない。よ り少ない2進ビットで符号化されたディジタル信号は、同じ信号をより多くの数 のビットを用いて表す符号化信号よりも低い情報容量要件しか要しない。勿論、 信号の知覚上の質を劣化させずに実現できる情報の低減量には制約がある。以下 の論考の大部分は特にディジタル技法に向けられているが、対応する考察はアナ ログ技法にも同様に適用されることを理解すべきである。 ディジタル信号の各サンプルを表すのに使用可能なビットの数によってディジ タル信号表現の精度が確定される。ビットレートが低いことは、各サンプルを表 すのにより少ないビットしか使用できないことを意味する。したがって、ビット レートが低いことは、量子化の精度が低下するか或いは量子化エラーが増大する ことを意味する。多くの用途において、量子化エラーは量子化雑音として顕れ、 もしエラーが十分な大きさになると、量子化雑音が符号化信号の本質を劣化させ ることになる。 種々の「分割帯域」符号化技法では、種々の心理知覚効果を利用することに よって知覚上の質の劣化が一切ない状態で情報要件を低減しようと試みている。 例えば、オーディオ用では、人の聴覚システムは、可変の中心周波数と、中心周 波数の関数として変化する帯域幅とを具える高度に非対称に調整されたフィルタ の特性に似た周波数分析特性を示す。人の聴覚システムの別個の音を検出する能 力は、一般に、音と音との間の周波数の差が大きくなるにつれて高まるが、人の 聴覚システムの分解能は、上述のフィルタの帯域幅よりも狭い周波数差に対して は実質的に一定である。したがって、人の聴覚システムの周波数分解能は、オー ディオスペクトル全体にわたってこれらのフィルタの帯域幅に従って変化する。 かかる聴覚フィルタの有効帯域幅は、「臨界帯域」と呼ばれる。臨界帯域内の優 勢な信号で該臨界帯域内の他の信号の可聴度が阻げられる度合いは、臨界帯域内 の優勢な信号で該臨界帯域外の周波数の他の信号の可聴度が阻げられる度合いよ りも一層大きい。これについては、おおむね、サン・フランシスコのマッグロウ ヒル社1988年発行、K・ブレア・ベンソン編の「オーディオ・エンジニアリ ング・ハンドブック」の1.40ページから1.42ページまでと、4.8ペー ジから4.10ページまで(the Audio Engineering Handbook,K.Blair Benson ed.,McGraw-Hill,San Francisco,1988,pages 1.40-1.42 and 4.8-4.10)を参 照のこと。 有用な信号帯域幅を人の聴覚システムの臨界帯域に近似の帯域幅を具える周波 数帯域に分割するオーディオ分割帯域符号化技法は、広帯域技法よりも音響心理 学的効果を一層良く利用することができる。概念的には、このような分割帯域符 号化技法は一般的に、信号帯域幅をフィルタバンクで分割し、信号の劣化が丁度 聴取不可能になる程度まで各フィルタバンクを通過する信号の情報要件を低減し 、逆の過程を通して原信号の複製を再構築することから成る。このような技法と して、サブバンド符号化、及び変換符号化の2つがある。サブバンド符号器及び 変換符号器では、結果の人工物が1つ又はそれ以上のスペクトル成分で音響心理 学的にマスキングされる特定の周波数帯域で情報要件を低減することができるの で、符号化信号の本質を劣化させない。 サブバンド符号器(コーダ)では、アナログ又はディジタルフィルタでフィル タバンクを実行するのに種々の技法の何れをも用いることができる。ディジタル ・サブバンド符号器では、信号サンプルから成る入力信号はディジタルフィルタ のバンクを通過する。フィルタバンクのそれぞれのフィルタを通過した各サブバ ンド信号は、該当するサブバンドフィルタの帯域幅に従ってさらにサンプリング される。符号器では、量子化雑音が聴取不可能になるのに丁度足りる程度のビッ トを用いて各サブバンド信号の量子化が行われる。各サブバンド信号は、入力信 号スペクトルの一部を表すサンプルから成る。 変換符号器では、アナログ又はディジタルフィルタのフィルタバンクを実行す るのに、いわゆる時間領域対周波数領域変換の種々の技法の何れをも用いること ができる。変換から得られる個別の係数、又はグループ化された2つ又はそれ以 上の隣接する係数によって、個々の変換係数帯域幅の合計である実効帯域幅を有 する「サブバンド(小帯域)」が決定される。サブバンドの中の係数によって、 それぞれのサブバンド信号が構成される。符号器では、量子化雑音が聴取不可能 になるのに丁度足りる程度のビットを用いて各サブバンド信号の量子化が行われ る。 以下の論考の全体にわたって、「分割帯域符号器」という術語は、サブバンド 符号器、変換符号器、及び有用な信号帯域幅の部分に動作するその他の分割帯域 符号化に関するものとする。「サブバンド」という術語は、真正のサブバンド符 号器、変換符号器、及びその他の技法の何れで実行されるものであっても、有用 な信号帯域幅のこれらの部分に関するものとする。 上で論考したように、音響心理学原理を利用する多くのディジタル分割帯域符 号器では、フィルタバンクを入力信号に適用してサブバンド情報を発生させ、サ ブバンド情報の各要素を、結果の量子化雑音が音響心理学的マスキング効果によ り聴取不可能になるように要素に割り当てられる相当数のビットを用いて量子化 し、量子化情報を伝送又は記憶に適する形式にアセンブルすることによって、高 品質の符号化が低いビットレートで行われる。 相補形のディジタル分割帯域復号器では、量子化情報を符号化信号から抽出し 、量子化情報を逆量子化してサブバンド情報を得、逆フィルタバンクをサブバン ド情報に適用して原入力信号のレプリカを発生させることによって、原入力信号 のレプリカが復元される。 サブバンド情報の各要素を量子化するのに割当てられるビットの数は、復号器 でサブバンド情報を正確に逆量子化できるために使用可能なものでなければなら ない。「順方向適応」符号器では、配分関数を用いて配分値を確定し、これらの 配分値を「副次的情報」として復号器に明示的に伝える。「逆方向適応」では、 選択された情報に配分関数を適用して配分値を確定し、配分値を明示的に伝える のではなく、符号化信号中の選択情報を伝える。逆方向適応復号器では、符号化 信号から抽出される選択情報に配分関数を適用することによって、配分値が再確 定される。 概して言えば、精巧な心理知覚モデルに基づく複合配分関数では、より単純な モデルに基づく複合度の低い配分関数で確定される配分値よりも低いビットレー トで、等価の本質を有する符号化の質を達成する配分値を確定することができる 。したがって、実際的に実行できる限度一杯に精巧なモデルに基づく配分関数を 使用することが望ましい。 人の聴覚機構のかなり精巧な1つのモデルは、1979年12月のアメリカ音 響学会誌の1647ページから1652ページのシュレーダ、アタル、及びホー ルの論文、「人の耳のマスキング特性の利用によるディジタル音声符号器の適正 化」(Schroeder,Atal and Hall,“Optimizing Digital Speech Coder by Exp loiting Masking Properties of Human Ear”J.Acoust.Soc.Am.,December 1 979,pp.1647-1652)に記述されている。このモデルは、(1) 入力信号の短時間 スペクトル分析を短時間フーリエ変換を適用して行い、(2) 結果のスペクトル係 数を臨界帯域xにマッピング(写像)することにより入力信号の臨界帯域密度を 得、(3) 臨界帯域密度を基底膜の「拡散関数」でたたみ込むことにより基底膜の 「刺激パターン」を発生させることから成る。このモデルは、入力信号と、量子 化エラーを表す雑音信号とに適用されて、「信号刺激パターン」と「雑音刺激パ ターン」とが、それぞれ発生される。入力信号と雑音信号の音の大きさは、それ ぞれの刺激パターンの積分関数によって計算される。マスキングしきい値以下に 刺激パターンが下がる入力信号及び雑音信号の音の大きさはゼロ、すなわち聴取 不可能である。マスキング関数は、信号刺激パターンと、マスキングのしきい値 を決定する「感度関数」との積から得られる。符号化性能の客観的 尺度は、雑音信号の音の大きさを入力信号の音の大きさで除して得られる比であ る。この数学的モデルは、直截的であり、ほぼ5kHz以下のスペクトル・エネ ルギーに関してはかなりの良い結果を提供するが、計算上集約になる。 逆方向適応符号器・復号器システムの1つの実施例においては、符号器によっ て、入力信号スペクトルの包絡線の推定値が準備され、配分関数を包絡線推定値 に適用することによって配分値が確定され、包絡線推定値の要素を拡大縮小因子 として用いて信号情報が拡大縮小され、拡大縮小された信号情報が確定配分値に 従って量子化され、量子化情報及び包絡線推定値が符号化信号にアセンブルされ る。逆方向適応復号器では、量子化情報及び包絡線推定値が符号化信号から抽出 され、符号器で用いられたのと同じ配分関数を包絡線推定値に適用することによ って配分値が確定され、量子化情報が逆量子化され、信号情報の拡大縮小が逆転 される。拡大縮小は、量子化に使用可能な限られた数のビットで表すことのでき る情報のダイナミックレンジを増大させるために用いられる。逆方向適応符号器 ・復号器システムの開示例として、米国特許第4,790,016号及び米国特許第5,109 ,417号の2つがある。これらの特許の全体は、本明細書に引照されている。 逆方向適応技法は多くの低ビットレート符号化システムにおいて魅力的である 。何故ならば、明示的な配分値を伝えるのにビットを要しないからである。復号 器では、符号化信号から抽出される情報に配分関数を適用することによって配分 値が再現される。 都合の悪いことに、逆方向適応復号器では、符号器で用いられたのと同一、或 いは少なくとも同等の配分関数を用いなければならない。さもなければ、復号器 での正確な逆量子化は保証されない。その結果、復号器の複雑さ又は実行費用は 、符号器の複雑さと実行費用と似たものとなる。通常復号器の複雑さに係る制約 は、すべて符号器及び復号器の両方の配分関数の複雑さに制約を課し、それによ って符号器・復号器システムの総合的性能を制限することになる。復号器におけ る実際的考慮のために、多くの逆方向適応符号化システムでは、シュレーダらが 叙述しているような計算集約型のモデルに基づく配分関数を利用することができ ない。 順方向適応技法は、多くの高品質符号化システムにおいて魅力的である。何故 ならば、復号器では、配分値を確定するのに配分関数を動作させる必要がないか らである。順方向適応復号器では、計算上の複雑さがより少なく、符号器で行わ れる配分関数への制約を一切課する必要がない。これに加えて、改良型の配分関 数を、現存の復号器との両立性を維持しながら、順方向適応符号化システムの符 号器に組み込むことができる。符号器で用いる配分関数は、設計上の独自の選択 の結果であっても構わない。 符号器で配分関数を改良する能力を持つことは重要な意味がある。信号符号化 及び信号処理の技術が進歩するにつれて、ますます精巧な配分関数が経済的にも 実際的になってきている。配分関数の精巧さを増大させることによって、所与の 信号品質に対してビットレートを下げるか、或いはまた、所与のビットレートに 対して信号品質を上げることができる。 しかし、この利点にもかかわらず、順方向適応符号化システムは多くの低ビッ トレート用途には適さないことがある。何故ならば、順方向適応符号化システム では、副次情報を伝達するのに極めて多数のビットを必要とするからである。概 して、配分関数でより狭い帯域に、その結果、より多数の帯域にスペクトルを分 割することで符号化性能を向上させようとすると、副次情報を伝達するのに一層 多くのビットが必要となる。更に、改良された符号化技法で符号化信号の残りの 部分を搬送するのに必要なビットの数が減るので、この副情報を搬送するのに必 要なビット数は、符号化情報の大部分を表すであろう。 したがって、符号化システムを低費用で実行するのに適した効率的な配分関数 の基礎を提供できる、計算を効率的にする精巧な知覚モデルの開発が望まれてい る。また、符号化信号中に多くのオーバーヘッドを生じさせることなく明示的な 配分値を搬送するように配分関数を改良することについても望まれている。 効率的な知覚モデルはまた、例えば、上で論考したような分割帯域符号化シス テムを客観的に測定することのような他の用途にも用いることができる。 発明の概要 本発明の目的は、計算を効率的にする精巧な知覚モデルを提供することである 。 本発明の目的は、低ビットレートの高品質符号化・復号のシステム及び方法で の使用に適する、効率的な高性能の配分関数を提供することである。 オーディオ符号器についての第1の実施例における本発明の教示によれば、入 力信号は複数のサブバンドに分割されてサブバンド情報を発生させるようにし、 サブバンド情報は配分関数で確定される配分値に従って量子化され、量子化サブ バンド情報は伝送又は記憶に適する符号化信号にアセンブルされる。配分関数に よって、配分値がマスキング(隠蔽)しきい値に基づく音響心理学原理に従って 確定される。マスキングしきい値は、入力信号のパワースペクトル密度(PSD )を推定し、拡散関数をPSDに適用することで刺激パターンを発生させ、刺激 パターンを音響心理学的マスキングを達成するに足る周波数依存の信号対雑音比 (SNR)オフセットに等しい量に調節し、調節されたパターンのレベルを聴覚 のしきい値と比較して、調節パターンのレベルと聴覚しきい値の何れか大きい方 に等しいマスキングしきい値を発生させることによって確定される。 逆方向適応符号化システムにおいては、PSDは、これもまた符号化信号にア センブルされる情報から推定される。例えば、PSDはスペクトル包絡線から誘 導される拡大・縮小因子から推定することができる。順方向適応符号化システム においては、PSDを、符号化信号にアセンブルされる情報から、或いは符号化 信号にアセンブルされない情報からも推定することができる。例えば、PSDを 、高解像度包絡線は符号化信号の中には含まれてはいないが、入力信号の高解像 度包絡線から推定することができる。 特定の実行手段においては、サブバンド情報は、1組の量子化器から選択され る量子化器を用いて量子化される。この1組の量子化器の中の量子化器は、量子 化レベルの数、量子化関数の対称又は非対称の使用、量子化関数の線形又は非線 形の使用、予備量子化ディザーの使用とその振幅、極小振幅信号に対する保留し てある「スモール・ゼロ」量子化レベルの使用の点で互いに異なる。例えば、符 号化システムでは、スモール・ゼロ量子化レベルを用い、ディザー成分が信号の 振幅と同等程度若しくは信号の振幅よりも大きいために予備量子化ディザーが用 いられていないことを示すことができる。 別の実行方法においては、サブバンド情報のための配分値は、サブバンド情報 の振幅とマスキングしきい値のそれぞれの部分との間の差に応答して確定される 。 サブバンド情報のための配分値は、この差に比例して確定することができるし、 或いはまた、ルックアップ(参照)テーブルから確定される。 更に別の実行方法においては、刺激パターンは、1つ又はそれ以上のフィルタ を周波数領域のサブバンド情報に適用することによって発生される。これらのフ ィルタは、例えば、回帰又は無限インパルス応答(IIR)技法、非回帰又は有 限インパルス応答(FIR)技法、或いは、格子フィルター技法によって実行で きる。これらの技法の何れを用いるかは、本発明にとっては重要ではない。 符号器の第2の実施例における本発明の教示によれば、配分関数の結果に影響 する1つ又はそれ以上のパラメータは、入力信号又はサブバンド情報の何れかで 検出される特性に応答して改変される。例えば、上述のSNRオフセットを改変 して総合的な符号化品質に影響させることもできる。改変されたパラメータの表 示を含む副次情報は、符号化信号にアセンブルされる。 第2実施例のもう1つの実行においては、改変パラメータの使用で生じる改変 された配分値は、明示的な配分値として符号化信号にアセンブルされる。 本発明の教示による、符号器の更なる実施例が可能である。これらには、上述 の2つの実施例の組み合わせを取り入れた実施例が含まれるが、必ずしもそれだ けに限定はされない。更に、上述の特定の実行の多様な組み合わせが可能である 。 オーディオ復号器の第1の実施例における本発明の教示によれば、量子化サブ バンド情報は符号化信号から抽出され、量子化サブバンド情報は配分関数で確定 される配分値に従って逆量子化され、出力信号は逆量子化サブバンド情報に応答 して発生される。配分関数によって、配分値がマスキングしきい値に基づく音響 心理学原理に従って確定される。マスキングしきい値は、符号化信号で表される 原入力信号のPSDの推定値を得、拡散関数をPSDに適用することで刺激パタ ーンを発生させ、刺激パターンを音響心理学的マスキングを達成するに足るSN Rオフセットに等しい量に調節し、調節されたパターンのレベルを聴覚のしきい 値とを比較して、調節パターン・レベル及び聴覚しきい値の何れか大きい方に等 しいマスキングしきい値を発生させることによって確定される。 逆方向適応符号化システムにおいては、PSDは、符号化信号から抽出される サブバンド情報の振幅、パワーの尺度から推定することができる。しかし、順方 向適応符号化システムにおいては、復号器では一般に、配分関数を一切使用しな い。何故ならば、明示的な配分値は符号化信号の中に受け渡されているからであ る。 上で論考したオーディオ符号器の第1実施例に関する特徴は、この復号器の第 1実施例にも組み込むことができる。 復号器の第2の実施例における本発明の教示によれば、配分関数の結果に影響 する1つ又はそれ以上のパラメータは、符号化信号から抽出される。もう1つの 実行においては、改変された配分値を表す明示的な配分値は、符号化信号から抽 出される。 本発明の教示による、復号器の更なる実施例が可能である。これらには、上述 の2つの実施例の組み合わせを取り入れる実施例が含まれるが、必ずしもそれだ けに限定はされない。更に、上述の特定の実行の多様な組み合わせが可能である 。 ハイブリッド適応配分を用いる符号化システムにおいては、副次情報は、改変 配分値、改変パラメータだけを搬送すれば良い。符号器及び復号器にとって既知 の配分関数によって、基本的な配分値が復号器に与えられる。副次情報によって 基本的な配分値への調節が必要に応じて行われ、符号器で用いられたのと同じ配 分値が得られる。この方法によって、符号器での配分関数を、既存の復号器との 両立性を失うことなく変更することができ、符号器と復号器の間の両立性を維持 するのに副次情報で必要なビットの数を低減することができる。 本発明を、幾つかの技法の何れかによるフィルタバンクを実行して、分割帯域 符号器で用いることができる。人の聴覚システムの臨界帯域幅に相応する帯域幅 を具えるサブバンドの使用によって音響心理学的効果の大幅な利用が可能になる が、本発明の多様な局面はそれに限定されないことを理解すべきである。したが って、本明細書で使用する「サブバンド」という術語及びその同類は、入力信号 の有用な帯域幅内の1つ又はそれ以上の周波数帯域に関するものであると理解す べきである。 本発明及びその好ましい実施例の種々の特徴は、以下の論考及び添付図面を参 照することによってより良く理解されるであろう。論考及び添付図面においては 、 同じ数字は多くの数字における同じ要素を示す。以下の論考と図面の内容は、例 として説明しているだけであり、本発明の範囲に対する制約を表すものではない ことを理解すべきである。 図面の簡単な説明 図1は、順方向適応配分を組み込む符号器・復号器システムにおける符号器の 1つの実施例を表す構成図である。 図2は、順方向適応配分を組み込む符号器・復号器システムにおける復号器の 1つの実施例を表す構成図である。 図3は、順方向適応配分を組み込む符号器・復号器システムにおける符号器の もう1つの実施例を表す構成図である。 図4は、逆方向適応配分を組み込む符号器・復号器システムにおける符号器の 1つの実施例を表す構成図である。 図5は、逆方向適応配分を組み込む符号器・復号器システムにおける復号器の 1つの実施例を表す構成図である。 図6は、ハイブリッド適応配分を組み込む符号器・復号器システムにおける符 号器の1つの実施例を表す構成図である。 図7は、ハイブリッド適応配分を組み込む符号器・復号器システムにおける復 号器の1つの実施例を表す構成図である。 図8は、刺激パターンを効率的に得ることのできる過程の実施例を表す構成図 である。 図9aから図9cまでは、図8に示す構造に組み込むことのできる単極フィル タのインパルス応答の仮想図である。 図9dは、図9aから図9cまでに示すインパルス応答を有するフィルタから 成る図8の実施例の合成インパルス応答の仮想図である。 図10aは、単極であって1つ又はそれ以上のゼロを有するフィルタに関する インパルス応答の仮想図である。 図10bは、図8に示す実施例に類似であるが、2つのフィルタのみから成り 、2つのフィルタの1つが図10aに示すインパルス応答を有する、実施例の合 成インパルス応答の仮想図である。発明の実行モード 順方向適応配分 図1には、順方向適応配分を組み込む符号器・復号器システムで用いられる分 割帯域符号器の1実施例の基本的構造が示されている。フィルタバンク102に よって、通路100から受け取られる入力信号に応答してサブバンド情報が発生 される。配分関数110によって、入力信号に応答して配分値が確定され、配分 値が通路111に沿って量子化装置104及びフォーマッタ106に受け渡され る。量子化装置104によって、フィルタバンク102から受け取られるサブバ ンド情報が、配分値に応答して適用される量子化関数を用いて量子化され、フォ ーマッタ106によって、量子化サブバンド情報及び配分値が、伝送又は記憶に 適するフォーマットを有する符号化信号にアセンブルされる。符号化信号は、通 路108に沿って望みどおりに伝送チャネル又は記憶装置に受け渡される。 図2には、順方向適応配分を組み込む符号器・復号器システムで用いられる分 割帯域復号器の1実施例の基本的構造が示されている。デフォーマッタ202に よって、量子化情報及び配分値が、通路200で受け取られる符号化信号から抽 出される。配分値は、通路211に沿って逆量子化装置204に受け渡される。 逆量子化装置204によって、サブバンド情報が、デフォーマッタ202から受 け取られる量子化情報を配分値に応答して適用される逆量子化関数を用いて逆量 子化することで発生される。逆フィルタバンク206によって、出力信号が通路 208に沿って、逆量子化装置204から受け取られる逆量子化サブバンド情報 に応答して発生される。 符号器及び復号器の代替的な実施例が可能である。例えば、図3に示すように 、順方向適応符号器によって、フィルタバンク102で発生されるサブバンド情 報に応答して配分値を確定することができる。図には示していないが、もう1つ の実施例においては、配分値を、入力信号及びサブバンド情報の両方に応答して 確定することができる。 上で論考したように、配分値は符号化信号の中に明示的に伝えられるので、順 方向適応符号器の配分関数は、現存の順方向適応復号器との両立性を犠牲にする ことなく変更することができる。符号化信号のフォーマットだけは保存されなけ ればならない。逆方向適応配分 図4には、逆方向適応配分を組み込む符号器・復号器システムで用いられる分 割帯域符号器の1実施例の基本的構造が示されている。フィルタバンク102に よって、通路100から受け取られる入力信号に応答してサブバンド情報が発生 される。変換器112によって、Xワード及びYワードから成るサブバンド情報 の表現が発生される。Xワードは、通路113に沿って、配分関数110とフォ ーマッタ106とに入力として受け渡される。配分関数110によって、配分値 が、Xワードに応答して確定され、量子化装置104に受け渡される。量子化装 置104によって、量子化情報が、通路115から受け取られるYワードを配分 値に応答して適用される量子化関数を用いて逆量子化することで発生され、フォ ーマッタ106によって、量子化及びXワードが、伝送又は記憶に適するフォー マットを有する符号化信号にアセンブルされる。符号化信号は、通路108に沿 って望みどおりに伝送チャネル又は記憶装置に伝えられれる。 図5には、逆方向適応配分を組み込む符号器・復号器システムで用いられる分 割帯域復号器の1実施例の基本的構造が示されている。デフォーマッタ202に よって、量子化情報及びXワードが、通路200で受け取られる符号化信号から 抽出される。Xワードは、通路203に沿って配分関数210に受け渡される。 配分関数210によって、配分値が、Xワードに応答して確定され逆量子化装置 204に受け渡される。逆量子化装置204によって、Yワードが、デフォーマ ッタ202から受け取られる量子化情報を配分値に応答して適用される逆量子化 関数を用いて逆量子化することで発生される。逆変換器212によって、サブバ ンド情報が、Xワード及びYワードに応答して発生され、逆フィルタバンク20 6によって、出力信号が通路208に沿って、逆変換器212から受け取られる サブバンド情報に応答して発生される。 逆方向適応符号化システムでは、符号化信号の中の副次情報を搬送するのに必 要なオーバーヘッドを避けることができる。何故ならば、配分値は、符号化信号 の中にアセンブルされるXワードで明示的に表現されているからである。逆方向 適応復号器では、配分値を、直前に逆方向適応符号器で動作したのと等価の配分 関数を動作させることによってXワードから復元することができる。符号化信号 を正確に復号することにおいて、符号器及び復号器の配分関数それ自体は必ずし も等価である必要はないが、正確な復号は符号器及び復号器の配分関数が等価の 配分値を有する時にのみ保証されるということを理解して置くべきである。ハイブリッド適応配分 図6には、ハイブリッド適応配分を組み込む符号器・復号器システムで用いら れる分割帯域符号器の1実施例の基本的構造が示されている。上で論考した図4 の実施例の中での種々の素子の関数は、図6に示される構造のそれぞれの素子の 関数に対応する。これに加えて、アダプタ120によって、2つの基本的技法の 片方若しくは両方を用いて配分関数110で確定される1つ又はそれ以上の配分 値が改変される。両方の技法を実行するのに用いられる構造が図6に示されてい るが、これら2つの技法の何れも単独で用いることができるし、不必要な機能素 子は図6に示されている構造から除去しても良い。 第1の又は「パラメータ」技法においては、アダプタ120によって、配分関 数110の結果に影響する1つ又はそれ以上のパラメータが改変される。アダプ タ120で与えられる改変パラメータは、通路123に沿って配分関数110と フォーマッタ106とに受け渡される。フォーマッタ106によって、改変パラ メータ及び量子化情報の指示が、伝送又は記憶に適するフォーマットを有する符 号化信号にアセンブルされる。 第2の又は「値」技法においては、アダプタ120によって、1つ又はそれ以 上の配分値が改変される。アダプタ120で与えられる改変値は、通路121に 沿ってフォーマッタ106とマージ118とに受け渡される。マージ118によ って、改変値が配分関数110から受け取られる配分値と併合され、併合された 配分値が量子化装置104に受け渡される。フォーマッタ106によって、改変 値と量子化情報の指示が、伝送又は記憶に適するフォーマットを有する符号化信 号にアセンブルされる。 図6の実施例では、通路100から受け取られる入力信号に応答するアダプタ 120、通路103から受け取られるサブバンド情報、及び通路113から受け 取られるXワードが示されている。ハイブリッド適応符号器の代替的な実施例に おいては、アダプタ120は、3つの通路の何れかの1つ、3つの通路の組み合 わせの総て、その他の情報、これらの何れに対しても応答する。 図7には、ハイブリッド適応配分を組み込む符号器・復号器システムで用いら れる分割帯域復号器の1実施例の基本的構造が示されている。上で論考した図5 の実施例の中での種々の素子の機能は、図7に示される構造のそれぞれの素子の 機能に対応する。これに加えて、1つ又はそれ以上の配分値は、2つの基本的技 法の一方若しくは両方を用いて改変される。両方の技法を実行するのに用いられ る構造が図7に示されているが、これら2つの技法の何れも単独で用いることが できるし、不必要な機能素子は図7に示されている構造から除去しても良い。 第1の又は「パラメータ」技法においては、デフォーマッタ202によって、 配分関数210の結果に影響する1つ又はそれ以上の改変パラメータが、符号化 信号から抽出され、通路213に沿って配分関数210に伝えられる。 第2の又は「値」技法においては、デフォーマッタ202によって、符号化信 号からの1つ又はそれ以上の改変値が抽出され、改変値が通路205に沿ってマ ージ218に受け渡される。マージ218によって、改変値が、配分関数210 から受け取られる配分値と併合され、併合された改変値が逆量子化装置204に 渡される。実行 フィルタバンク 図1から図7に示す実施例は、種々多様な実行によって実現することができる 。例えば、フィルタバンク102及び逆フィルタバンク206は、以下の技法に 限定はされないが、直角ミラーフィルタ、多相フィルタ、及びフーリエ変換を含 む、当業界で既知の種々のディジタル濾波技法で実行することができる。好まし い実施例では、プリンセン、ジョンソン、及びブラッドレイの音響・音声・信号 処理国際学会誌1987年5月号、2161ページから2164ページまでの論 文、「時間領域アライアジング消去に基づくフィルタバンク設計を用いてのサブ バンド・変換符号化」(Princen,Johnson and Bradley,“Subband/Transform C oding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”, Proceedings Int.Conf.Acoust.,Speech,and Signal Proc .,May 1987,pp.2 161-2164)に開示されている時間領域エイリアシング相殺(TDAC)変換を用 いている。TDAC変換でフィルタバンクを実行する変換符号器・復号器システ ムについては、前に引照した米国特許第5,109,417号に記述されている。 本発明の実施にとって決定的となるような特定の実行はない。これまで述べて きた本発明の叙述はディジタル分割帯域符号化の実行に特に向けられていたが、 本発明の局面を組み込む符号器・復号器システムではアナログフィルタバンクも 同様に用い得ることを理解して置くべきである。例えば、フィルタバンク102 を、1つ又はそれ以上のアナログフィルタと、各サブバンド信号に対してディジ タルサンプルを発生するアナログ・ディジタル変換器(ADC)とで構成するこ とができる。逆フィルタバンク206は、ディジタル・サンプルに応答してアナ ログ・サブバンド信号を発生するディジタル・アナログ変換器(DAC)と、ア ナログ・サブバンド信号を合成アナログ出力に組み合わせるコンポーネント(成 分)とで構成することができる。変換器 Xワード及びYワードを発生し、復元する変換器112及び逆変換器212は 、種々多様な実行で実現することができる。上で論考したように、Xワードは、 符号器及び復号器の両方で配分関数を報知するのに使用可能であることで特徴付 けられる。Xワードを、一般に、拡大縮小因子に対応させ、Yワードを、拡大縮 小因子に従って拡大縮小される値に対応させることができる。数量の種々の浮動 小数点表現を利用する実施例においては、Xワードを浮動小数点指数に対応させ 、Yワードを浮動小数点小数部に対応させることができる。 幾つかの実施例においては、Yワードのグループ又はブロックは、共通のXワ ード成分と組み合わされて、ブロック浮動小数点(BFP)表現を形成する。し かし、好ましい実施例においては、各Yワード小数部をそれぞれのXワード指数 の1つと組み合わせることによって、より高解像のスペクトル包絡線がXワード から得られる。量子化装置 量子化装置104及び逆量子化装置204で用いられる特定の関数は本発明の 実施にとって決定的ではないが、これらの2つの関数は相補的でなければならな い。一般に、配分値が同じであると仮定して、逆量子化関数d(x)は、元の量xが ほぼd[q(x)]であるように、量子化関数q(x)の逆関数となる。厳密な等価性は期 待されない。何故ならば、量子化では、通常、或る程度の精度の損失を生じるも のであるからである。 配分値に応答して、量子化装置104では、量子化関数を幾つかある方法の中 の何れかで適用することができる。例えば、量子化装置104によって、量子化 レベルの数を配分値に従って設定することができる。8レベルの量子化関数及び 4レベルの量子化関数を、それぞれ、3ビット及び2ビットの配分を指示する値 に応答して用いることもできよう。もう1つの例を挙げると、量子化装置104 で、特定のレベルより大きいか或いは同等の配分値、例えば6ビットの値に応答 して対数量子化関数を用い、それよりも小さい値に応答して線形量子化関数を用 いることもできよう。 量子化装置104では、対称関数と非対称関数との間を切り替えることによっ て、或いは、1つ又はそれ以上の量子化レベルを用いて振幅の特別な領域を表す ことによって、量子化関数を適用することもできる。例えば、Nビットの量子化 関数によって、2N 量子化レベルの1つを前に論じた「スモール・ゼロ」量子化 レベルとして保存することができる、かかる量子化レベルは、さもなければ大き な振幅を表すところであるが、ここでは代わりに非常に小さな振幅を表すために 用いられる。かかる量子化関数を用いることで、符号器で、復号器に、ゼロの値 に量子化される小振幅信号と、特別な「スモール・ゼロ」量子化レベルに量子化 される非常に小振幅の信号との間を容易に区別させることが可能になる。 配分値に応答して、逆量子化装置204では、量子化装置104で量子化関数 を適用した方法に対して相補的な方法で逆量子化関数を適用する。併合 マージ118及びマージ218で用いられる方法は、本発明の実施にとって決 定的ではない。概念的には、マージ118及びマージ218によって、1組の配 分値及び1組の改変値からの対応する値が、1組の値に組み合わせられる。これ は種々の方法で行うことができる。例えば、配分値を、対応する改変値で置換す ることができる。分割帯域符号器においては、各配分値は、それぞれのサブバン ドの中でサブバンド情報を量子化するのに用いられる数値ビットを表す。各改変 値によって、対応する配分値が取って代わられ、各改変値が代わりに量子化装置 で用いられる。 もう1つの例を挙げると、これらの2組の値を改変値を用いてることによって 組み合わせ、対応する配分値を調整することができる。例えば、改変値によって 、対応する配分値を変更する増分量を表すこともできる。分割帯域符号器におい ては、特定のサブバンドの中のサブバンド情報を量子化するのに用いられるビッ トの数は、もし改変値が符号化信号の中にあるならば、それぞれの配分値とそれ ぞれの改変値の代数的合計によって定義することもできよう。これに替えて、改 変値によって、対応する配分値を拡大縮小する因子を表すことができる。フォーマッタ 符号化信号が直列ビットストリームで表される多くの符号化システムにおいて は、通路108及びデフォーマッタ202によって与えられる関数は、実質的に はそれぞれ、直列ビットストリームの多重化及び逆多重化に対応する。フォーマ ット化及び逆フォーマット化の関数の実行は特定の用途にとっては重要であるが 、本発明の実施にとって決定的ではない。その符号化信号を伝送又は記憶に適す る形式の中に収めることができ、その符号化信号をフォーマット化された表現か ら復元できる過程は、総て適切である。配分関数 概要 配分関数110によって、配分値が心理知覚原理に従って確定される。これら の配分値は、結果としての量子化雑音が、もし可能ならば、マスキングしきい値 を超えないように確定される。この過程に関しては、以下で更に詳細に論考する 。この論考は特にオーディオ符号化システムに向けられているが、ここで提示さ れる概念の多くは、ビデオ符号化のような広範な用途においても用いることがで きる。 マスキングしきい値は、ひとの知覚の数学モデルを適用することによって確定 される。種々多様なモデルを、本発明の種々の局面と共に用いることができる。 前に引用したシュレーダらによれば、音響エネルギーに対するひとの耳の応答特 性は、(1) 入力信号のパワースペクトル密度(PSD)を概算し、(2) PSDを 臨界帯域にマッピングすることで入力信号の臨界帯域密度を得、(3) 基底膜の拡 散関数を臨界帯域密度情報に適用することで基低膜の刺激パターンを発生させ、 (4) 音響心理学的マスキングを達成するに足る信号対雑音比(SNR)に等しい 量だけ刺激パターンを調整することで暫定マスキングしきい値を発生させ、(5) 暫定マスキングしきい値をひとの知覚のしきい値と比較し、(6) これら2つの中 の大きい方に等しいマスキングしきい値を発生させることによって、モデル化す ることができる。 これらの段階の幾つかは、組み合わせるか、或いは、異なる順序で行っても良 い。例えば、段階1及び段階2を、最初に入力信号のスペクトル成分を臨界帯域 の中にマッピング(写像)し、その後、マッピングされた成分から臨界帯域密度 を直接発生させるように逆にすることもできる。もう1つの例としては、段階2 から段階4までを単一の段階として組み合わせて、近似的に重みづけされた拡散 関数を入力信号PSDに直接適用することで暫定マスキングしきい値を発生させ ることもできる。 以下の論考は、上に挙げた6つの段階の変形を組み込む実施例に特に向けられ ている。これらの段階は、種々の概念を説明するために用いられるもので、本発 明を実行するために必要なものではない。代替的な実施例では、他の段階から成 る他の聴覚モデルを組み込んでいることもある。パワースペクトル密度 順方向適応システムの符号器では、入力信号のPSDを、通路100、通路1 03から受け取られる情報から概算することができる。例えば、高速フーリエ変 換(FFT)で実行されるフィルタバンクを組み込むシステムにおいては、PS Dを、結果の変換係数の各々の大きさの二乗から得ることができる。しかし、逆 方向適応システムの符号器では、一般にPSDを、通路113から受け取られる Xワードから概算する。 指数X及び小数部Yから成る従来の2進浮動小数点形式で各スペクトル成分Cの 振幅が表される1つの実施例においては、dBで表されるスペクトル成分のパワ ーは、指数の値から直接概算することができる。各指数の値は、組み合わされた 小数部を正規化するのに用いられる2のべき、或いは、C = Y・2-Xである。この 表現から、各スペクトル成分のパワーを以下のような式から概算することができ る。すなわち、 Xiは、スペクトル成分Ciの浮動小数点指数の値である。 好ましい実施例においては、各スペクトル成分Cは、正規化された小数部Yと指 数Xとから成る浮動小数点形式で表される。PSDは、1つ又はそれ以上のスペ クトル成分を帯域にグループ化し、各帯域の中のスペクトル成分の指数の「対数 和」を取ることで概算される。対数和を取る計算の1つの方法については、以下 で論考する。 概念的には、本発明の実施にとって決定的となるようなPSD概算の特定の方 法はない。しかし、実際的な事柄として、方法の持つ精度によって符号化システ ムの性能は著しく影響される。臨界帯域密度 分割帯域符号化システムでは、一般に、臨界帯域の半分以下の帯域幅を有する サブバンドに入力信号を分割することによって音響心理学的効果を一層良く利用 できる。これは通常必要なことである。何故ならば、符号化システムのサブバン ドは、可変の中心周波数を有するひとの聴覚システムと異なり、固定の中心周波 数を有するからである。支配的なスペクトル成分によって、臨界帯域幅を有する 分割帯域符号器のサブバンド全体を通して他の低レベルのスペクトル成分がマス キングされるとしばしば考え違いされている。この考えは正しくない。何故なら ば、支配的なスペクトル成分のマスキング効果は、スペクトル成分両側の各々の 上にある臨界帯域幅の半分の周波数間隔の外側では消滅するからである。もしこ の支配的なスペクトル成分が符号化システムのサブバンドの縁に生じると、サブ バンドの中の他のスペクトル成分は、サブバンド帯域幅が臨界帯域幅の半分以下 でない限り、実際の臨界帯域幅の外側に生じ得る。 1つの実施例においては、入力信号PSDは、ひとの聴覚システムの臨界帯域 幅のおよそ1つ分の帯域幅を各々が有する帯域の中にマッピングされる。帯域の 各々は1バークの幅を有する。好ましい実施例においては、入力信号PSDは、 ひとの聴覚システムのおよそ半分の臨界帯域幅、又は約1/2バークの幅の帯域 幅を有する、「サブ臨界帯域」の中にマッピングされる。この好ましいマッピン グは、表Iに示す項目で表現される。 代替的なマッピング関数及び帯域幅を、本発明の概念から逸脱せずに用いるこ とができる。例えば、シュレーダらによれば、約5kHz以下の周波数fは、以下の 式により、臨界帯域にマッピングすることができる。すなわち、 ここで、xは、臨界帯域数である。 以下の論考を単純化するために、「臨界帯域密度」という術語で、臨界帯域幅 及びサブ臨界帯域幅を含む総ての便宜な帯域幅の周波数帯域にマッピングされる 入力信号のPSDを指示することにする。入力信号の臨界帯域密度は、以下の式 による適切なマッピング関数から得ることができる。すなわち、 S(x)は、入力信号の臨界帯域密度である。刺激パターン 刺激パターンによって、入力信号の間隔で表される音響パワーから生じる基低 膜に沿うエネルギーの分布が近似的に記述される。刺激パターンは、以下のたた み込みで計算することができる。すなわち、 E(x) = S(x) * B(x) (4) ここで、E(x)は、入力信号から生じる刺激パターン、 B(x)は、基底膜の拡散関数である。 シュレーダらは、臨界帯域幅を有する周波数帯域を横切る拡散関数の便宜な分 析的式を提示している。この式によって、周波数帯域x0の中のスペクトル成分か ら生じる周波数帯域xの拡散のレベルが与えられるが、式は以下のとおりである 。すなわち、 ここで、Δx = x-x0である。 入力信号の臨界帯域密度S(x)及び拡散関数B(x)のたたみ込みは、NをS(x)中の 点の数、MをB(x)中の点の数として、N・Mの規模の計算の複雑さを有し、集約的 な計算を要する。その結果、多くの符号化システム、特に逆方向適応符号化シス テムでは、シュレーダのモデルを用いるのは実際的ではない。 実際的な方法では、刺激パターンを、入力信号のスペクトル表現を濾波するこ とによって得る。この濾波は、本明細書で論考した、マッピングされた周波数領 域及びマッピングされていない周波数領域のような「スペクトル領域」中で行わ れる。 図8には、刺激パターンを更に効率的に得ることのできる、Nの規模の計算の 複雑さを有する1つの実施例が示されている。この実施例によれば、入力信号臨 界帯域密度を伝達する情報は、通路500から受け取られ、3つのフィルタを通 して受け渡され、組み合わされて刺激パターンを形成する。 PSDは、線形、対数、又は他のパワーの表現として拡大・縮小することがで きる。もし、PSDが入力信号パワーの線形表現であり、より高い周波数の帯域 xが、実質的に一定であるバークで表現される帯域幅を有するならば、これらの フィルタは、以下の回帰表現によって表される変換関数を具える単極IIRとし て実現することができる。すなわち、 Fi(x) = ai(x)・S(x) + bi(x)・Fi(x-1) (6) ここで、ai(x)は、フィルタiの利得因子、 bi(x)は、フィルタiの減衰率、 F1(x)は、周波数帯域xにおけるフィルタ502の出力、 F2(x)は、周波数帯域xにおけるフィルタ504の出力、 F3(x)は、周波数帯域xにおけるフィルタ510の出力である。 フィルタ502、フィルタ504、及びフィルタ510の仮想インパルス応答特 性は、それぞれ、図9aから9cに示されている。 もしPSDが入力信号パワーの対数表現であるならば、フィルタ計算は、対数 パワー領域で一層効率的に行うことができる。これらの計算を行う1つの方法に ついては、以下で論考する。 もし、より高い周波数の帯域 xが、実質的に一定であるバークで表現される帯 域幅を有しないならば、一層複雑な変換関数が1つ又はそれ以上のフィルタに対 して必要になる。例えば、もし周波数帯域が一定の帯域幅を有するならば、フィ ルタ502では、以下の式のような変換関数に1つ又はそれ以上のゼロを具えて いることが望ましい。すなわち、 ここで、Mi(x)は、帯域xにおけるフィルタFiのゼロの数である。 式7の3項によって、実際には、インパルス応答における指数減衰が遅れる。 仮想インパルス応答特性は、10a図に示されている。1つのゼロごとに、1周 波数帯域の「遅延」が加えられる。一般的に、より高い周波数帯域に対してはよ り多くのゼロが用いられる。例えば、20kHz帯域幅の入力信号のPSDの中の 各要素がもし512点の変換で発生される変換係数に相当するとすれば、その結 果、最高の周波数帯域に対しては恐らく10個にも達するゼロが必要になるが、 約500Hz以下の帯域に対してはまったくゼロを必要としない。 拡散関数の精度は、周波数帯域数xの関数であるフィルタ係数を用いることに よって、計算の複雑さを増大させる犠牲を払いながら改善することができる。回 帰項係数bi(x)によって、周波数が高くなるにつれてスペクトル成分の拡散を一 層多くすることが望ましい。しかし、適切な帯域幅を有する1組の周波数帯域の 中に入力信号PSDをマッピングすることによって、妥当な精度の拡散関数を、 実質的に不変である回帰項係数biを用いて得ることができる。低い周波数帯域の ための多くの符号化システムにおいては、係数biの中の幾分かの変動が必要とな る可能性が高い。何故ならば、そこでは臨界帯域幅が一層狭いからである。 フィルタ特性は、符号化の用途の要求に従って確定することができる。これら のフィルタはマッピングされた周波数領域である周波数帯域領域の中で動作する ことを強調して置くべきであろう。フィルタに関する減衰項によって、基低膜に 沿う音響エネルギーの拡散が表され、拡散関数を用いてのたたみ込みで与えられ る効果と類似の効果が与えられる。 図8を参照すると、リバース(反転)508によって、通路500から受け取 られる情報をフィルタ510で濾波する前に周波数帯域の反転が行われ、リバー ス512によって、濾波出力の反転が行われる。これらの2つの反転素子及び介 在するフィルタによって、刺激周波数よりも低い周波数での基低膜に沿う拡散関 数が表される。 コンポーネント506及びコンポーネント514によって、それぞれの入力の 合計が得られる。コンポーネント514で生じる合計は、計算された刺激パター ンであるが、通路516に沿って受け渡される。図9dには、図9aから9cま でに示される特性を有するフィルタを組み込む、図8に示す構造体の合成応答特 性が示されている。もし通路500から受け取られる臨界帯域密度の情報が対数 パワー領域で表現されるならば、コンポーネント506及びコンポーネント51 4によって計算される合計は対数和になる。対数和を計算できる1つの方法につ いては、以下で論考する。 多くの代替的実施例が可能である。例えば、計算の複雑さが少ない1つの実施 例では、フィルタ502、フィルタ504、及びコンポーネント506だけで構 成され、コンポーネント506では、2つの濾波出力を、これら2つの中で大き い方を単純に選択することで組み合わせることができる。このより単純な実施例 によって得られる結果は、多くの高品質符号化用途において受容できる。例えば 、図10には、フィルタ502が図10aに示すインパルス応答特性を有し、フ ィルタ504が図9bに示すインパルス応答特性を有する、この実施例の仮想合 成インパルス応答特性が示されている。表IIには、表Iに示されるPSDマッピ ングを用いる1つの実施例での使用に適する、フィルタ502に関するフィルタ 係数a1(x)及びb1(x)、及びフィルタ504に関するフィルタ係数a2(x)及びb2(x) が示されている。これらの係数は、対数パワー領域での使用のためにdBで表現 さ れているが、表の項目を10で除し、商の逆対数を取ることによって、線形パワ ー領域での使用のための係数に容易に変換することができる。 フィルタは、IIRフィルタ、FIRフィルタ、又は格子型フィルタとして実 行することができるが、一般にIIRフィルタが好ましい。何故ならば、IIR フィルタは通常、計算上の効率が良いからである。計算の複雑さは、フィルタ計 算を対数パワー領域で行うことによって更に低減することができる。式6を対数 パワー領域で計算するのに要する乗算は、対数パワー領域での加算として、或い は以下の式で実行できる。すなわち、 logA = log[ai(x)・S(x)] = logai(x) + logS(x) (8) logB = log[bi(x)・Fi(x-1)] = logbi(x) + logFi(x-1) (9) である。式6の2つの項を加算するのは対数パワー領域では単純には行えない。 「対数和」と呼ばれるこの加算は、以下の恒等式を用いて行える。すなわち、 log(A+B) = max(logA,logB) + log[1 + exp(-|logA-logB|)] (10) ここで、exp(y)は、量yの真数である。値|logA - logB|の適切な範囲に関して 以下の式、 log[1 + exp(-|logA - logB|)] (11) のルックアップ、すなわち、参照用テーブルを構築することによって、式6にお ける加算は、対数パワー領域において、(1) logAとlogBとの間の差の絶対値を見 出だし、(2) 参照用テーブルからの値をこの差を鍵として得、(3) 参照用テーブ ルから得られる値をlogAとlogBの中の何れか大きい方に加算することで行うこと ができる。この実行は本発明の実施にとって決定的ではないが、多くの実施例に おいては、計算の複雑さを更に低減するのに有用である。 参照用テーブルは、妥当な程度に簡潔である。何故ならば、より小さい項は、 | logA-logB|における約24dBよりも大きい差に関しては基本的に無視でき るからである。言い換えると、対数和の妥当で正確な近似は、約24dBよりも 大きい差に関しては、表での項目がゼロに等しいと仮定することによって得られ る。感度関数 音響心理学的マスキング効果の根本原理は、人の聴覚システムが音響エネル ギーの存在によって鈍感になるという事実に則っている。低いレベルの信号は、 隔絶されている際には聴取可能であるが、より大きな信号が伴う際には聴取可能 でなくなる。シュレーダらによる「感度関数」w(x)では、人の聴覚システムが鈍 感になる程度を近似している。この関数は、臨界帯域x内の音響心理学的マスキ ングを保証するのに必要なSNRを与えるが、以下の式で表すことができる。 10 log10w(x) = -(15.5 + x) dB (12) 必要なSNRを単純に一定値20dBに設定する、より簡単な方法では、w(x) = -20 dBの感度関数を用いる。 最大ディジタル値で105dBのSPLを表す好ましい実施例においては、再 生システムの音量制御器を非常に高めに設定しても低振幅スペクトル成分による マスキングが保証されるように、控え目なレベルを用いている。以下の式で表さ れるこの感度関数は、表Iに示されるPSDマッピングを用いる実施例での使用 に適する。 暫定マスキングしきい値Z(x)は、感度関数w(x)で特定される量だけオフセット される刺激パターンE(x)に関連して定義される。暫定しきい値は、対数電力領域 においては、以下の式 Z(x) = w(x) + E(x) (14) 線形電力領域においては、以下の式 Z(x) = w(x)・E(x) (15) から得られる。マスキングしきい値 その定義に由来して、聴覚のしきい値を下回る音響エネルギーは聴取不可能で ある。したがって、量子化雑音がマスキングされることを保証するのに必要なS NRでは、聴覚のしきい値よりも低い一切の量子化雑音を抑制する必要はない。 聴覚のしきい値は、当分野では十分に定義されている。例えば、ISO標準22 6を参照して欲しい。ISO標準226では、1990年のISO標準ハン ドブック、音響編、20ページから25ページまで(ISO Standard Handbook,Ac oustics ,1990,pp.20-25)に、「最小可聴音場」の大きさの等感曲線に関する情 報を提示している。本明細書では、関数Θ(x)を用いてこのしきい値の分析的表 現を表す。 音響心理学的マスキングしきい値 M(x) は、聴覚のしきい値を暫定マスキング しきい値と比較し、これら2つのしきい値の大きい方を各点ごとに選ぶことによ って得ることができる。これは、以下の式、すなわち、 M(x) = max[Z(x),θ(x)] (16) で表すことができる。配分値 1つの単純な実施例においては、要求SNRの6dBごとに1ビットの割合、 或いは以下の式によって、ビットを配分ることができる。すなわち、 ここで、A(x)は、周波数帯域xにおける各スペクトル成分に対する配分値である 。 好ましい実施例においては、表を索引することによって、一層効率的な配分が 行える。マスキングしきい値M(x)に対する概算スペクトル電力S(x)の要求SNR は、参照用テーブルへの鍵として用いられ、表の各項目によって、要求SNRを 達成するのに必要な量子化レベルの数が表される。 ルックアップテーブルの項目は、当分野で既知の、種々の先行技術の符号化シ ステムで用いられている量子化関係に基づくことができる。概念的には、本発明 の実施にとって決定的となるような特定の参照テーブルはないが、参照用テーブ ルの中の項目は符号化システムの性能に大きく影響する。 特定の符号化システムのために表の項目を誘導できる1つの方法は、所与の数 の量子化レベルにスペクトル情報を量子化すべく強制される量子化関数を組み込 む当該符号化システムに生じるSNRを測定することである。例えば、表IIIで は、8.21dB及び11.62dBのSNRがそれぞれ、3つの量子化レベル 及び5つの量子化レベルを有する量子化関数を用いる符号化システムの特定の実 施例 で得られることが示されている。この表の項目によれば、8.21dB以上、1 1.62dB以下又は同等のSNRを要求するスペクトル成分は、5レベルに量 子化されるのに十分なビットを配分られなければならない。 この実行方法においては、表の低い限界は0dBでのゼロ量子化レベルであり 、表の高い限界は、当明細書で「配分シーリング」と呼ぶ、ビットの或る最大数 に設定されている。表IIIに示す例によれば、配分シーリングは65,536の 量子化レベルに相当するが、これは16ビットで表すことができる。 多くの符号化システムにおいては、配分関数によって、特定数のビットを配分 る配分値が確定される。この数を当明細書では「ビット予算」と呼ぶ。もし配分 関数で配分られるビットの総数がビット予算を超過するならば、配分関数ではこ れに対応して配分値を改定しなければならない。もし配分関数で配分られるビッ トの総数がビット予算よりも少なければ、配分値を改定して残留ビットの使用を 適正化することが好ましい。 幾つかの実施例においては、配分値は、マスキングしきい値M(x)のレベルを調 節し、配分値を再計算することによって、精密化される。マスキングしきい値が 上下される際には、聴覚のしきい値を考慮することが好ましい。1つの実施例に おいては、配分られたビットの総数がビット予算に十分接近するまで、暫定マス キングしきい値Z(x)をスペクトルの一部又は全体で上下させ、マスキングしきい 値を式16に従って再確定することによって、これが達成される。論考を容易に するために、記号M0(x)を、配分値を精密化するための一切の調節が行われる前 に聴覚モデルから得られる、初期又は「理想」マスキングしきい値を指示するの に用いる。 1つの実施例においては、マスキングしきい値は、M0(x)のマスキングしきい 値に対して、72dBまで下げられ、24dBまで上げられる。これらの調節は 、それぞれ、スペクトル成分当たりの配分での約12ビットの加増及び4ビット の削減に相当する。初期には、マスキングしきい値はM0(x)よりも24dB低く 設定される。これは、2つの局限値、72dB及び−24dBの丁度中間の値で ある。配分値は、計算され、ビット予算と比較される。2進法探索技法によって 、マスキングしきい値に対する粗調節が行われ、ビット予算と同等若しくは少な い 値に全ビット配分が収斂させられる。2進法探索は、全ビット配分がビット予算 と同等になるまで、或いは、マスキングしきい値への増分調節が1.5dB以下 になるまで反復される。これらの粗調節に続いて、2進法探索によって、マスキ ングしきい値に対する微調節が行われ、全ビット配分がビット予算に更に接近し て収斂するレベルの6dB低いレベルが確定される。この2進法探索は、全ビッ ト配分がビット予算と同等になるか、或いは、マスキングしきい値への増分調節 が0.375dB以下になるかの何れかになるまで反復される。調節されたしき い値とM0(x)との間の差は符号化信号に受け渡され、これにより、復号器で収斂 過程を繰り返すことなく配分値を直接確定することが可能になる。 上と同じ粗調節・微調節過程は、共通のビット溜めから総てのチャネルのスペ クトル成分にビットを配分する多チャネル符号化システムにおいても用いること ができる。代替的な実施例においては、粗調節は、総てのチャネルに共通のマス キングしきい値に対してのみ行われる。総てのチャネルのための総合的配分によ って十分に収斂が行われた後、全配分ビットがビット予算と同等になるまで、或 いは、ビット予算と十分に接近するまで、個々のチャネルに関連するマスキング しきい値に対して微調節が行われる。微調節は、(1) 全チャネルにわたって収斂 するまで調節しながら、各チャネルのそれぞれのマスキングしきい値に対する1 つの調節を代わる代わる完結することか、或いは、(2) 優先度の高いチャネルか ら始め優先度の低いチャネルに進めながら、各チャネルのそれぞれのマスキング しきい値を収斂するまで代わる代わる調節することによって、行うことができる 。 多チャネル符号化システムに関して上で叙述した過程に類似の過程を、1つ又 はそれ以上のチャネルを具える他の符号化システムで用いることができる。ビッ トは、共通のビット溜めからスペクトル成分に或る時間の期間にわたって配分る ことができる。例えば、変換符号化システムにおいては、粗調節は、多重ブロッ クのための全配分がビット予算と十分に接近して収斂するまで、変換係数の多重 ブロック全体にわたる配分に対して行われる。微調節は、ブロック全体にわたっ て収斂するまで調節しながら、各チャネルのそれぞれのマスキングしきい値を代 わる代わる調節することによって行うことができる。この過程は、サブバンド符 号化システムのような他の分割帯域符号化システムに対しても適用可能である。 この過程はまた、多チャネル符号化システムでの使用に対しても適合することが できる。 これらの例に示されるように、収斂過程の種々の変形が可能である。もし特定 の実行において配分シーリングが用いられるならば、収斂過程で配分値がこのシ ーリングを超えることは許されない。 もしマスキングしきい値が上げられても全ビット配分がビット予算内に押さえ られるならば、1つ又はそれ以上の「中間的」スペクトル成分は、初期のM0(x) を超えても良いが、調節されたしきい値M(x)を超えてはならない。式17によれ ば、これらの中間的スペクトル成分は、ビットが全く配分られていないので、符 号化信号から除外される。この除外は、特にもし除外が間欠的であると、聴取可 能となることがある。例えば、持続音の高調波は、スペクトルの中のどこかに際 立った音響エネルギーを有する時間区間で、間欠的に除外され得る。 もしビットがこれらの中間的スペクトル成分に配分られると、ビット予算はよ り大きなスペクトル成分への配分を低減することで均衡することができる。しか し、その結果として生じる、より大きなスペクトル成分の符号化品質の劣化は、 聴取可能になる可能性が高い。ビットを、中間的スペクトル成分を除外すること により聴取可能になる一方の効果と、より大きなスペクトル成分の符号化品質を 劣化させるもう一方の効果との間の均衡を取るように、配分るべきであろう。 1つの実施例においては、中間的スペクトル成分の総てに最少数のビットしか 配分ないことによって、かかる均衡を達成する試みが為されている。特定の実行 においては、この試みを、最少数の量子化レベルを有する量子化関数を用いて総 ての中間的スペクトル成分を量子化することで達成している。 もう1つの実施例においては、限定された周波数範囲内の中間的スペクトル成 分にのみ最少数のビットを配分ることによって、均衡を取ることが試みられてい る。この範囲は、調節されたマスキングしきい値を超える最高周波数のスペクト ル成分から、符号化信号帯域幅の上限まで広がる。 更にもう1つの実施例においては、或る一定のレベル、例えば9dB以下とい うようなレベルだけ調節されたマスキングしきい値よりも低い、中間的スペクト ル成分にのみビットを配分ることによって、均衡を取ることができる。この実施 例の変形においては、調節されたしきい値よりも低いレベルは、中間的スペクト ル成分に配分られるビットの数がビット予算の或る割合を超えないことを保証す るように改変されている。もう1つの例では、これらの中間的スペクトル成分に 配分られるビットの数を、これらの配分が行われる周波数範囲の帯域幅を制御す ることによって、均衡を取ることができる。 これらの中間的スペクトル成分へのビット配分の聴取可能性は、これらの配分 を変化させる速度を制御することによって、低めることができる。例えば、配分 帯域幅を数百msecの時間の間減少させることによって、中間的スペクトル成 分を配分から除外することができる。実際には、中間的スペクトル成分を除外す るのに用いられる条件を改変するには、低域通過フィルタが必要となる。残留ビット配分 もし一杯に配分られたビットの数がビット予算よりも少なければ、残留ビット はどのような方法で配分して良い。1つの実施例においては、2段階の過程が用 いられる。2段階は、(1) 最低周波数帯域から始めて周波数の高い方へと進め、 もし、(a) それぞれの配分値がゼロよりも大きく、配分シーリングよりも小さい か、或いは、(b) 配分値がゼロであり、隣接する両側の周波数帯域に対する配分 値が段階1の開始時点でゼロよりも大きかったかの何れかであるならば、周波数 帯域に対する配分を増大させ、(2) ビットが少しでも残っている間に、最低周波 数帯域から始めて周波数の高い方へと進め、もし、それぞれの配分値が配分シー リングよりも小さければ、各周波数帯域に対する配分を増大させる、過程である 。段階2は、残留ビットがなくなるまで反復される。 残留ビットの配分は、収斂過程で、もし残留ビットが少しあるとしても極く僅 かでしかないように、ビット予算に十分に接近して収斂できるようにすることで 、回避するか、若しくは最少化することができる。アダプタ 種々の心理知覚効果に基づく配分関数を用いる分割帯域符号化システムにおい ては、基盤となる心理知覚モデルに影響する総てのパラメータは、配分関数に適 合するように改変することができる。オーディオ符号化用途では、例えば、かか るパラメータには、以下の要素が含まれる。すなわち、(1) マスキング音よりも 大きいか或いは小さい音響心理学的マスキングのレベルをモデル化する式6又は 式7のフィルタ係数、(2) SNRオフセットを刺激パターンから与える感度関数 の特性、(3) 多チャネル・システムにおけるチャネル間マスキングのレベル、(4 ) 入力信号の帯域幅、(5) 周波数の関数としてサブバンド情報に配分られるビッ トの最少数、(6) 周波数の関数でもあり得る、配分シーリング、及び(7) スペク トル振幅の関数として振幅の各増分ごとにスペクトル成分に配分られる付加ビッ トの数である。経験によれば、より大きな振幅におけるマスキングを達成するに はより高いSNRが必要であることが分かっている。したがって、大きな振幅で は振幅6dBの増加ごとに1つの付加ビットの配分が必要であるが、小さな振幅 では振幅12dBの増加ごとに1ビットだけの配分で十分である。 アダプタ120では、「パラメータ」技法及び「値」技法の片方又は両方を利 用して配分関数の結果を適応させることができる。「パラメータ」技法では、上 で論考したような1つ又はそれ以上のパラメータを改変することを伴う。「値」 技法では、配分関数から得られる配分値と併合される1つ又はそれ以上の改変値 を発生させることを伴う。 両方の技法を実行するのに用いられる特定の過程は、本発明の実施にとって決 定的ではない。1つの方法は、代替的な配分関数を働かせ、代替的な配分関数の 結果を基本的な配分関数110から得られる「基本値」と比較し、各代替的な値 とそれぞれの基本値との間の差が顕著な点で、各代替的な値に対する改変値を形 成することから成る。基本的な配分関数の複雑さを制約して復号器を単純化する ことができるが、代替的な配分関数は好きなだけ複雑にしても良い。例えば、オ ーディオ符号化用途においては、代替的な関数では、入力信号スペクトルがどれ 程平坦であるか、入力信号が平均であるか又はピーク振幅であるか、また、マス キング成分が音状であるか雑音状であるかというような信号特性に関する考慮を 含む、一層精巧な音響心理学的モデルを用いることができる。 もう1つの例証的な適合過程では、基本的な配分値に対する調節を種々の信号 特性の検出に応答して行わせるだけで、完全な配分関数を動作させることを回避 している。例えば、基本的な配分値を音状のマスキング成分の検出に応答して増 加させたり、或いは、基本的な配分値を、入力信号スペクトルが基本的に平坦で あることを検出することに応答して減少させたりできる。 前に論考したように、アダプタ120を、入力信号、フィルタバンク102か ら得られるサブバンド情報、変換器112から得られるXワード、又は特定の用 途で意味のある他のあらゆる情報に応答させることができる。長距離電話ネット ワークのための符号化システムにおいては、例えば、アダプタ120を、日付、 時刻、週の日に関する情報に応答させて、ビット配分を低減する配分関数を提供 させることによって、ネットワークの交信量の予想される増加を予期して、低い 情報要件と高い忠実度の符号化とを交換することができる。 例えば、ディジタルビデオ表示システムにおいては、アダプタ120に、オペ レータ入力に応答する配分関数を提供させることによって、応答時間の短縮と高 い画像解像度とをオペレータが交換できるようにすることができる。 これらの例に示されるように、アダプタ120を、特定用途で望まれるあらゆ る情報に応答するようにすることができる。この情報の選択は、本発明の実施に とって決定的ではない。 本発明を種々多様な技法で実行される多数の実施例で実施できることを理解し て置くべきである。
【手続補正書】特許法第184条の8 【提出日】1995年7月26日 【補正内容】 人の聴覚機構のかなり精巧な1つのモデルは、1979年12月のアメリカ音 響学会誌の1647ページから1652ページのシュレーダ、アタル、及びホー ルの論文、「人の耳のマスキング特性の利用によるディジタル音声符号器の適正 化」(Schroeder,Atal and Hall,“Optimizing Digital Speech Coder by Expl oiting Masking Properties of Human Ear”J.Acoust.Soc.Am.,December 19 79,pp.1647-1652)に記述されている。このモデルは、(1) 入力信号の短時間ス ペクトル分析を短時間フーリエ変換を適用して行い、(2) 結果のスペクトル係数 を臨界帯域xにマッピングすることにより入力信号の臨界帯域密度を得、(3) 臨 界帯域密度をバシラー膜の「拡散関数」でたたみ込むことによりバシラー膜の「 刺激パターン」を発生させることから成る。このモデルは、入力信号と、量子化 エラーを表す雑音信号とに適用されて、「信号刺激パターン」と「雑音刺激パタ ーン」とが、それぞれ発生される。入力信号と雑音信号の音の大きさは、それぞ れの刺激パターンの積分関数によって計算される。マスキングしきい値以下に刺 激パターンが下がる入力信号及び雑音信号の音の大きさはゼロ、すなわち聴取不 可能である。マスキング関数は、信号刺激パターンと、マスキングのしきい値を 決定する「感度関数」との積から得られる。符号化性能の客観的尺度は、雑音信 号の音の大きさを入力信号の音の大きさで除して得られる比である。この数学的 モデルは、直截的であり、ほぼ5kHz以下のスペクトル・エネルギーに関して はかなりの良い結果を提供するが、計算する上では力の集約を要する。 シュレーダのモデルに類似の精巧な知覚モデルに基づく複雑な配分関数を用い る変換符号器の例は、1988年2月の電気・電子技術者学会誌の通信の選択さ れた分野、第6巻、第2号の314ページから323ページにジョンストン(Joh nston,IEEE J.Selected Areas in Comm.,vol.6,no.2,February 1988,pp .314-323)によって叙述されている。この例によれば、マスキングしきい値は、 以下の手順で計算される。すなわち、(1) 入力信号の臨界帯域分析を行い、(2) マトリックス乗算を用いて、シュレーダの拡散関数を臨界帯域スペクトルに適用 し、(3) 音のマスキングしきい値と雑音のマスキングしきい値の重み付け合計を 計算することによって雑音のマスキングしきい値を推定し、(4) 推定し きい値を本質的に逆たたみ込み又は「再正規化」することによってバーク領域の しきい値を得、(5) 聴覚のしきい値を考慮することで計算される。しきい値の重 み付け合計は、入力信号スペクトルの平坦さの尺度から計算される「音の係数」 αに基づく。マトリックス乗算、音の係数、及びしきい値のバーク領域への再正 規化は、総てこの開示されている符号器の計算の集約度に寄与している。 逆方向適応符号器・復号器システムの1つの実施例においては、符号器によっ て、入力信号スペクトルの包絡線の推定値が準備され、配分関数を包絡線推定値 に適用することによって配分値が確定され、包絡線推定値の要素を拡大縮小因子 として用いて信号情報が拡大縮小され、拡大縮小された信号情報が確定配分値に 従って量子化され、量子化情報及び包絡線推定値が符号化信号にアセンブルされ る。逆方向適応復号器では、量子化情報及び包絡線推定値が符号化信号から抽出 され、符号器で用いられたのと同じ配分関数を包絡線推定値に適用することによ って配分値が確定され、量子化情報が逆量子化され、信号情報の拡大縮小が反転 される。拡大縮小は、量子化に使用可能な限られた数のビットで表すことのでき る情報のダイナミックレンジを増大させるために用いられる。逆方向適応符号器 ・復号器システムの開示例として、米国特許第4,790,016号及び米国特許第5,109 ,417号の2つがある。これらの特許の全体は、本明細書に引照されている。 逆方向適応技法は多くの低ビットレート符号化システムにおいて魅力的である 。何故ならば、明示的な配分値を受け渡すのにビットを要しないからである。復 号器では、符号化信号から抽出される情報に配分関数を適用することによって配 分値が再現される。 都合の悪いことに、逆方向適応復号器では、符号器で用いられたのと同一、或 いは少なくとも同等の配分関数を用いなければならない。さもなければ、復号器 での正確な逆量子化は保証されない。その結果、復号器の複雑さ又は実行費用は 、符号器の複雑さと実行費用と似たものとなる。復号器の複雑さに係る制約は通 常、総て、符号器及び復号器の両方の配分関数の複雑さに係る制約となり、それ により、符号器・復号器システムの総合的性能を制限することになる。復号器へ の実際的な考慮が原因して、多くの逆方向適応符号化システムでは、シュレーダ らが 叙述しているような計算集約型のモデルに基づく配分関数を利用することができ ない。 順方向適応技法は、多くの高品質符号化システムにおいて魅力的である。何故 ならば、復号器では、配分値を確定するのに配分関数を動作させる必要がないか らである。順方向適応復号器では、計算上の複雑さがより少なく、符号器で行わ れる配分関数への制約を一切課する必要がない。これに加えて、改良型の配分関 数を、現存の復号器との両立性を維持しながら、順方向適応符号化システムの符 号器に組み込むことができる。符号器で用いる配分関数は、設計上の独自の選択 の結果であっても構わない。 符号器で配分関数を改良する能力を持つことは重要な意味がある。信号符号化 及び信号処理の技術が進歩するにつれて、ますます精巧な配分関数が経済的にも 実際的になってきている。配分関数の精巧さを増大させることによって、所与の 信号品質に対してビットレートを下げるか、或いはまた、所与のビットレートに 対して信号品質を上げることができる。 しかし、この利点にもかかわらず、順方向適応符号化システムは多くの低ビッ トレート用途には適さないことがある。何故ならば、順方向適応符号化システム では、副次情報を伝達するのに極めて多数のビットを必要とするからである。概 して、配分関数でより狭い帯域に、その結果、より多数の帯域にスペクトルを分 割することで符号化性能を向上させようとすると、副次情報を伝達するのに一層 多くのビットが必要となる。更に、この副次情報を搬送するのに必要なビットの 数で符号化情報の大部分が表されることになり、改良された符号化技法で符号化 信号の残りの部分を搬送するのに必要なビットの数が減ってしまう。 したがって、符号化システムを低い費用で実行するのに適した効率的な配分関 数の基礎を提供できる、計算を効率的にする精巧な知覚モデルの開発が望まれて いる。また、符号化信号中に多くのオーバーヘッドを生じさせることなく明示的 な配分値を搬送するように配分関数を改良することについても望まれている。 効率的な知覚モデルはまた、例えば、上で論考したような分割帯域符号化シス テムを客観的に測定することのような他の用途にも用いることができる。 発明の概要 本発明の目的は、計算を効率的にする精巧な知覚モデルを提供することである 。 本発明の目的は、低ビットレートの高品質符号化・復号のシステム及び方法で の使用に適する、効率的な高性能の配分関数を提供することである。 オーディオ符号器の第1の実施例においては、入力信号は複数のサブバンドに 分割されてサブバンド情報を発生させ、サブバンド情報は配分関数で確定される 配分値に従って量子化され、量子化サブバンド情報は伝送又は記憶に適する符号 化信号にアセンブルされる。配分関数によって、配分値がマスキングしきい値に 基づく音響心理学原理に従って確定される。マスキングしきい値は、入力信号の パワースペクトル密度(PSD)を推定し、拡散関数をPSDに適用することで 刺激パターンを発生させ、刺激パターンを音響心理学的マスキングを達成するに 足る周波数依存の信号対雑音比(SNR)オフセットに等しい量に調整し、調整 されたパターンのレベルを聴覚のしきい値と比較して、調整パターン・レベルと 聴覚しきい値の何れか大きい方に等しいマスキングしきい値を発生させることに よって確定される。拡散関数は、1つ又はそれ以上の有限インパルス応答(FI R)フィルタ又は無限インパルス応答(IIR)フィルタを適用することによっ て実行される。 逆方向適応符号化システムにおいては、PSDは、これもまた符号化信号にア センブルされる情報から推定される。例えば、PSDはスペクトル包絡線から誘 導される拡大・縮小因子から推定することができる。順方向適応符号化システム においては、PSDを、符号化信号にアセンブルされる情報から、或いは符号化 信号にアセンブルされない情報からも推定することができる。例えば、PSDを 、高解像度包絡線は符号化信号の中には含まれてはいないが、入力信号の高解像 度包絡線から推定することができる。 特定の実行においては、サブバンド情報は、1組の量子化器から選択される量 子化器を用いて量子化される。この1組の量子化器の中の量子化器は、量子化レ ベルの数、量子化関数の対称又は非対称の使用、量子化関数の線形又は非線形の 使用、予備量子化ディザーの使用とその振幅、極小振幅信号に対する保留された 「スモール・ゼロ」量子化レベルの使用の点で互いに異なる。符号化システムで は、スモール・ゼロ量子化レベルを用いて、例えば、予備量子化ディザーが用い られていないが、それはディザー成分が信号の振幅と同等程度若しくは信号の振 幅よりも大きいことが原因しているということを示すことができる。 別の実行においては、サブバンド情報のための配分値は、サブバンド情報の振 幅とマスキングしきい値のそれぞれの部分との間にある差に応答して確定される 。サブバンド情報のための配分値は、この差に比例して確定することができるし 、或いはまた、ルッククアップ(参照用)テーブルから確定される。 符号器の第2の実施例においては、配分関数の結果に影響する1つ又はそれ以 上のパラメータは、入力信号又はサブバンド情報の何れかの中で検出される特性 に応答して改変される。例えば、上述のSNRオフセットを改変して総合的な符 号化品質に影響させることもできる。改変されたパラメータの指示を含む副次情 報は、符号化信号にアセンブルされる。 第2実施例のもう1つの実行においては、改変パラメータの使用で生じる改変 された配分値は、明示的な配分値として符号化信号にアセンブルされる。 符号器の更なる実施例が可能である。これらには、上述の2つの実施例の組み 合わせを取り入れた実施例が含まれるが、必ずしもそれだけに限定はされない。 更に、上述の特定の実行の多様な組み合わせが可能である。 オーディオ復号器の第1の実施例においては、量子化サブバンド情報は符号化 信号から抽出され、量子化サブバンド情報は配分関数で確定される配分値に従っ て逆量子化され、出力信号は逆量子化サブバンド情報に応答して発生される。配 分関数によって、配分値がマスキングしきい値に基づく音響心理学原理に従って 確定される。マスキングしきい値は、符号化信号で表される原入力信号のPSD の推定値を得、拡散関数をPSDに適用することで刺激パターンを発生させ、刺 激パターンを音響心理学的マスキングを達成するに足るSNRオフセットに等し い量に調整し、調整されたパターンのレベルを聴覚のしきい値とを比較して、調 整パターン・レベル及び聴覚しきい値の何れか大きい方に等しいマスキングしき い値を発生させることによって確定される。拡散関数は、1つ又はそれ以上のF IRフィルタ又はIIRフィルタを適用することによって実行される。 逆方向適応符号化システムにおいては、PSDは、符号化信号から抽出される サブバンド情報の振幅、パワーの尺度から推定することができる。しかし、順方 向適応符号化システムにおいては、復号器では一般に、配分関数を一切使用しな い。何故ならば、明示的な配分値は符号化信号の中に受け渡されているからであ る。 上で論考したオーディオ符号器の第1実施例に関する特徴は、この復号器の第 1実施例にも組み込むことができる。 復号器の第2の実施例においては、配分関数の結果に影響する1つ又はそれ以 上のパラメータは、符号化信号から抽出される。もう1つの実行においては、改 変された配分値を表す明示的な配分値は、符号化信号から抽出される。 復号器の更なる実施例が可能である。これらには、上述の2つの実施例の組み 合わせを取り入れる実施例が含まれるが、必ずしもそれだけに限定はされない。 更に、上述の特定の実行の多様な組み合わせが可能である。 ハイブリッド適応配分を用いる符号化システムにおいては、副次情報は、改変 配分値、改変パラメータだけを搬送すれば良い。符号器及び復号器にとって既知 の配分関数によって、基本的な配分値が復号器に与えられる。副次情報によって 基本的な配分値への調整が必要に応じて行われ、符号器で用いられたのと同じ配 分値が得られる。この方法によって、符号器での配分関数を、既存の復号器との 両立性を失うことなく変更することができ、符号器と復号器の間の両立性を維持 するのに副次情報で必要なビットの数を低減することができる。 本発明を、幾つかの技法の何れかによるフィルタバンクを実行して、分割帯域 符号器で用いることができる。人の聴覚システムの臨界帯域幅に相応する帯域幅 を具えるサブバンドの使用によって音響心理学的効果の大幅な利用が可能になる が、本発明の多様な局面はそれに限定されないことを理解して置くべきである。 したがって、本明細書で使用する「サブバンド」という術語及びその同類は、入 力信号の有用な帯域幅内の1つ又はそれ以上の周波数帯域に関するものであると 理解して置くべきである。 PSDは、線形、対数、又は他のパワーの表現として拡大・縮小することがで きる。もし、PSDが入力信号パワーの線形表現であり、より高い周波数の帯域 xが、実質的に一定であるバークで表現される帯域幅を有するならば、これらの フィルタは、以下の回帰表現によって表される変換関数を具える単極IIRとし て実現することができる。すなわち、 Fi(x)=ai(x)・S(x) + bi(x)・Fi(x-1) (6) ここで、ai(x)は、フィルタiの利得因子、 bi(x)は、フィルタiの減衰率、 F1(x)は、周波数帯域xにおけるフィルタ502の出力、 F2(x)は、周波数帯域xにおけるフィルタ504の出力、 F3(x)は、周波数帯域xにおけるフィルタ510の出力 である。フィルタ502、フィルタ504、及びフィルタ510の仮想インパル ス応答特性は、それぞれ、図9aから9cに示されている。 もしPSDが入力信号パワーの対数表現であるならば、フィルタ計算は、対数 パワー領域で一層効率的に行うことができる。これらの計算を行う1つの方法に ついては、以下で論考する。 もし、より高い周波数の帯域xが、実質的に一定であるバークで表現される帯 域幅を有しないならば、一層複雑な変換関数が1つ又はそれ以上のフィルタに対 して必要になる。例えば、もし周波数帯域が一定の帯域幅を有するならば、フィ ルタ502では、以下の式のような変換関数に1つ又はそれ以上のゼロを具えて いることが望ましい。すなわち、 ここで、Mi(x)は、帯域xにおけるフィルタFiのゼロの数である。 式7の3項によって、実際には、インパルス応答における指数減衰が遅れる。 1仮想インパルス応答特性は、10a図に示されている。1つのゼロごとに、1 周波数帯域の「遅延」が加えられる。一般的に、より高い周波数帯域に対しては より多くのゼロが用いられる。例えば、20kHz帯域幅の入力信号のPSDの 中の各要素がもし512点の変換で発生される変換係数に相当するとすれば、そ の結果、最高の周波数帯域に対しては恐らく10個にも達するゼロが必要になる が、約500Hz以下の帯域に対してはまったくゼロを必要としない。 拡散関数の精度は、周波数帯域数 xの関数であるフィルタ係数を用いることに よって、計算の複雑さを増大させる犠牲を払いながら改善することができる。回 帰項係数bi(x))によって、周波数が高くなるにつれてスペクトル成分の拡散を一 層多くすることが望ましい。しかし、適切な帯域幅を有する1組の周波数帯域の 中に入力信号PSDをマッピングすることによって、妥当な精度の拡散関数を、 実質的に不変である回帰項係数biを用いて得ることができる。低い周波数帯域の ための多くの符号化システムにおいては、係数biの中の幾分かの変動が必要とな る可能性が高い。何故ならば、そこでは臨界帯域幅が一層狭いからである。 フィルタ特性は、符号化の用途の要求に従って確定することができる。これら のフィルタはマッピングされた周波数領域である周波数帯域領域の中で動作する ことを強調して置くべきであろう。フィルタに関する減衰項によって、基底膜に 沿う音響エネルギーの拡散が表され、拡散関数を用いてのたたみ込みで与えられ る効果と類似の効果が与えられる。 図8を参照すると、リバース508によって、通路500から受け取られる情 報をフィルタ510で濾波する前に周波数帯域の逆転が行われ、リバース512 によって、濾波出力の逆転が行われる。これらの2つの逆転素子及び介在するフ ィルタによって、刺激周波数よりも低い周波数での基底膜に沿う拡散関数が表さ れる。 コンポーネント506及びコンポーネント514によって、それぞれの入力の 合計が得られる。コンポーネント514で生じる合計は、計算された興奮パター ンであるが、通路516に沿って受け渡される。図9dには、図9aから9cま でに示される特性を有するフィルタを組み込む、図8に示す構造体の合成応答特 性が示されている。もし通路500から受け取られる臨界帯域密度の情報が対数 パワー領域で表現されるならば、コンポーネント506及びコンポーネント51 4によって計算される合計は対数和になる。対数和を計算できる1つの方法につ いては、以下で論考する。 多くの代替的実施例が可能である。例えば、計算の複雑さが少ない1つの実施 例では、フィルタ502、フィルタ504、及びコンポーネント506だけで構 成され、コンポーネント506では、2つの濾波出力を、これら2つの中で大き い方を単純に選択することで組み合わせることができる。このより単純な実施例 によって得られる結果は、多くの高品質符号化用途において受容できる。例えば 、図10には、フィルタ502が図10aに示すインパルス応答特性を有し、フ ィルタ504が図9bに示すインパルス応答特性を有する、この実施例の仮想合 成インパルス応答特性が示されている。表IIには、表Iに示されるPSDマッピ ングを用いる1つの実施例での使用に適する、フィルタ502に関するフィルタ 係数a1(x)及びb1(x)、及びフィルタ504に関するフィルタ係数a2(x)及びb2(x) が示されている。これらの係数は、対数パワー領域での使用のためにdBで表現 されているが、表の項目を10で除し、商の逆対数を取ることによって、線形パ ワー領域での使用のための係数に容易に変換することができる。 フィルタは、格子型フィルタを含むIIRフィルタ又はFIRフィルタとして 実行することができるが、一般にIIRフィルタが好ましい。 請求の範囲 1 入力信号を符号化するための装置であって、 該入力信号の周波数サブバンドを表すサブバンド信号を発生させ、該入力信 号のスペクトル表現を発生させるためのサブバンド装置(102)と、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生す るための刺激装置(502から514まで)であって、該拡散関数が、1以上の 有限インパルス応答フィルタ又は1以上の無限インパルス応答フィルタで実現さ れる装置と、 該刺激パターンに応答して初期のマスキングしきい値を確定するためのしき い値装置と、 該初期マスキングしきい値に関連する該サブバンド信号のレベルに従って、 それぞれの数のビットを該サブバンド信号に配分するための配分装置と、 該サブバンド信号に配分される該それぞれの数のビットに従って該サブバン ド信号を量子化することによって量子化情報を発生するための量子化装置(10 4)と、 該量子化情報を伝送又は記憶に適する符号化信号にアセンブルするためのフ ォーマット装置(106) とから成る、装置。 2 前記配分装置の結果に影響する1つ又はそれ以上のパラメータを改変するた めの装置(120)をさらに含み、前記フォーマット化装置によって該改変パラ メータの表示が前記符号化信号にアセンブルされる、請求項1の装置。 3 1以上の前記それぞれの数のビットを改変するための装置(120)lwお さらに含み、前記フォーマット装置によって該改変されたそれぞれの数のビット の表示が前記符号化信号にアセンブルされる、請求項1又は2の何れかの1つの 装置。 4 入力信号の符号化表現を復号するための装置であって、 量子化されたサブバンド情報を該符号化表現から抽出し、該入力信号のスペ クトル表現を発生させるための逆フォーマット化装置(202)と、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生さ せるための刺激装置(502から514まで)であって、該拡散関数が、1つ又 はそれ以上の有限インパルス応答フィルタ又は1つ又はそれ以上の無限インパル ス応答フィルタで実現される刺激装置と、 該刺激パターンに応答して初期のマスキングしきい値を確定するためのしき い値装置と、 該初期マスキングしきい値に関連する該量子化サブバンド情報のレベルに従 って、それぞれの数のビットを該量子化サブバンド情報に配分するための配分装 置と、 該それぞれの数のビットに従って該量子化サブバンド情報を逆量子化するこ とによってサブバンド信号を発生させるための逆量子化装置(204)と、 該サブバンド信号に応答する、該入力信号の複製を発生させるための逆サブ バンド装置(206)とから成る復号器。 5 前記逆フォーマット化装置によって、前記配分装置の結果に影響する1つ又 はそれ以上のパラメータが前記符号化表現から得る、請求項4の装置。 6 前記逆フォーマット装置が、前記符号化表現から1以上の改変されたそれぞ れの数のビットを入手し、前記配分装置が、1以上の該改変されたビット数を該 それぞれのビット数と併合する、請求項4又は5の装置。 7 前記逆フォーマット化装置が、前記符号化表現に応答して調節されたマスキ ングしきい値を確定するための装置から成り、前記配分装置が、前記初期マスキ ングしきい値を超えるが、該調節されたマスキングしきい値よりも低いレベルを 有する中間的スペクトル成分を確定するための装置と、それぞれのビット数を少 なくとも該中間的スペクトル成分の幾つかに配分するための中間的配分装置とか ら成る、請求項4から6までの何れか1つの装置。 8 前記配分装置が、前記初期マスキングしきい値のレベルを調節することによ って調節されたマスキングしきい値を確定するための装置と、該初期マスキング しきい値を超えるが、該調節されたマスキングしきい値よりも低いレベルを有す る中間的スペクトル成分を確定するための装置と、それぞれのビット数を少なく とも該中間的スペクトル成分の幾分かに配分するための中間的配分装 置とから成る、請求項1から6までの何れか1の装置。 9 前記中間的配分装置が、前記調節されたマスキングしきい値を超える最高周 波数のスペクトル成分から上限周波数までの範囲内の周波数を有し、前記初期マ スキングしきい値と該調節されたマスキングしきい値との間の中間的しきい値を 超えるレベルを有する、中間的スペクトル成分に配分を制限するための装置から 成る、請求項7又は8の何れか1つの装置。 10 前記配分装置が、配分られるビットの総数がビット予算と実質的に同等であ るように前記初期マスキングしきい値のレベルを調節するための装置から成る、 請求項1から6までの何れかの装置。 11 前記配分装置が、 前記初期マスキングしきい値のレベルを調節することによって、調節された マスキングしきい値を確定するための装置と、 該初期マスキングしきい値を超えるが、該調節されたマスキングしきい値よ りも低いレベルを有する中間的スペクトル成分を確定するための装置と、 それぞれの数のビットを少なくとも該中間的スペクトル成分の幾分かに配分 るための中間的配分装置であって、中間的スペクトル成分に配分られる該それぞ れのビットの総数が最大で前記ビット予算の特定された割合になる、装置 とから成る、請求項10の装置。 12 入力信号の聴覚をモデル化するための装置であって、 該入力信号のスペクトル表現を発生するための装置と、 拡散関数を該スペクトル表現に適用することによって聴覚剌激信号を発生す るための装置(502から514まで)であって、該拡散関数が1つ又はそれ以 上の有限インパルス応答フィルタ又は1つ又はそれ以上の無限インパルス応答フ ィルタで実現される装置とから成るモデル化装置。 13 前記スペクトル表現が、臨界帯域又は副臨界帯域写像関数を前記入力信号の 電力スペクトル密度の概算値に適用することによって発生される、請求項1から 12までの何れか1つの装置。 14 前記1つ又はそれ以上のフィルタが、周波数の関数として変化する多数のゼ ロを有する、請求項1から12までの何れか1つの装置。 15 周波数が高くなればなる程前記ゼロの数が多くなる、請求項14の装置。 16 前記スペクトル表現が写像関数を前記入力信号のパワースペクトル密度の概 算値に適用することによって発生され、該マッピング関数が項目の参照用テーブ ルとして実行され、該テーブルの項目の帯域幅対帯域周波数の対数対対数関数が 、該テーブルの低い周波数端に近い第1の項目と該テーブルの高い周波数端に近 い第2の項目との間で実質的に線形である、請求項1から13までの何れか1つ の装置。 17 入力信号を符号化するための方法であって、 該入力信号の周波数サブバンドを表すサブバンド信号を発生させ、該入力信 号のスペクトル表現を発生させ、 1つ又はそれ以上のフィルタを該スペクトル表現に適用することによって刺 激パターンを発生させ、該1つ又はそれ以上のフィルタが、有限インパルス応答 フィルタ又は無限インパルス応答フィルタであるようにし、 該刺激パターンに応答して初期マスキングしきい値を発生させ、 該初期マスキングしきい値に関連する該サブバンド信号のレベルに従ってそ れぞれのビット数を該サブバンド信号に配分し、 該サブバンド信号に配分される該それぞれのビット数に従って該サブバンド 信号を量子化することによって量子化情報を発生させ、 該量子化情報を伝送又は記憶に適する符号化信号にアセンブルすることから 成る符号化方法。 18 入力信号の符号化表現を復号するための方法であって、 該符号化表現を量子化されたサブバンド情報に逆アセンブルし、該入力信号 のスペクトル表現を発生させ、 1つ又はそれ以上のフィルタを該スペクトル表現に適用することによって刺 激パターンを発生させ、該1つ又はそれ以上のフィルタが、有限インパルス応答 フィルタ又は無限インパルス応答フィルタであるようにし、 該刺激パターンに応答して初期のマスキングしきい値を確定し、 該初期マスキングしきい値に関連する該量子化サブバンド情報のレベルに従 って、それぞれのビット数を該量子化サブバンド情報に配分し、 該それぞれのビット数に従って該量子化サブバンド情報を逆量子化すること によってサブバンド信号を発生させ、 該サブバンド信号に応答して該入力信号の複製を発生させることから成る復 号方法。 19 前記逆アセンブルが、前記符号化表現に応答して調節されたマスキングしき い値を確定することから成り、前記配分がが、前記初期マスキングしきい値を超 えるが、該調節されたマスキングしきい値よりも低いレベルを有する中間スペク トル成分を確定し、それぞれのビット数を少なくとも該中間スペクトル成分の幾 つかに配分するることから成る、請求項18の方法。 20 前記配分が、前記初期マスキングしきい値のレベルを調節することによって 調節されたマスキングしきい値を確定し、該初期マスキングしきい値を超えるが 、該調節されたマスキングしきい値よりも低いレベルを有する中間スペクトル成 分を確定し、それぞれのビット数を少なくとも該中間的スペクトル成分の幾つか に配分することから成る、請求項17又は18の何れか1つの方法。 21 少なくとも該中間的スペクトル成分の幾つかへの前記配分が、前記調節され たマスキングしきい値を超える最高周波数のスペクトル成分から上限周波数まで の範囲内の周波数を有し、前記初期マスキングしきい値と該調節されたマスキン グしきい値との間の中間しきい値を超えるレベルを有する、中間スペクトル成分 に配分を制限することから成る、請求項20の方法。 22 前記配分が、配分されるビットの総数がビット予算と実質的に同等であるよ うに前記初期マスキングしきい値のレベルを調節することから成る、請求項17 から21までの何れか1つの方法。 23 前記配分が、 前記初期マスキングしきい値のレベルを調節することによって、調節された マスキングしきい値を確定し、 該初期マスキングしきい値を超えるが、該調節されたマスキングしきい値よ りも低いレベルを有する中間スペクトル成分を確定し、 それぞれのビット数を少なくとも該中間的スペクトル成分の幾つかに配分し 、中間スペクトル成分に配分られる該それぞれのビットの総数が最大で前記ビッ ト予算の特定された割合になる用にすることから成る、請求項22の方法。 24 前記スペクトル表現が、臨界帯域又は副臨界帯域写像関数を前記入力信号の パワースペクトル密度の推定値に適用することによって発生される、請求項17 から23までの何れか1つの方法。 25 前記1つ又はそれ以上のフィルタが、周波数の関数として変化する多数のゼ ロを有する、請求項17から23までの何れか1つの方法。 26 周波数が高くなればなる程前記ゼロの数が多くなる、請求項25の方法。 27 前記スペクトル表現が、前記入力信号のパワースペクトル密度の推定値に写 像関数を適用することによって発生され、項目のルックアップテーブルを用いる ことによって該写像関数が適用され、該テーブルの項目中の帯域幅対帯域周波数 の対数・対数関数が、該テーブルの低い周波数端に近い第1の項目と該テーブル の高い周波数端に近い第2の項目との間で実質的に線形である、請求項17から 24までの何れかの1つ方法。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),AU,CA,JP,US (72)発明者 トッド、クレグ・キャンベル アメリカ合衆国、カリフォルニア州 94941、ミル・バレー、ドゥラン・ウェイ 304 (72)発明者 ディビス、マーク・フランクリン アメリカ合衆国、カリフォルニア州 94044、パスィフィカ、マンザニタ・ドラ イブ 1110 (72)発明者 リンク、ブライアン・ディビット アメリカ合衆国、カリフォルニア州 94602、オークランド、コーリッジ・アベ ニュー 4109 (72)発明者 フィルダー、ルイス・ダン アメリカ合衆国、カリフォルニア州 94030、ミルブロー、トゥールーン・ロー ド 1210 【要約の続き】 回型フィルタを入力信号PSDに適用することで実行で きる。順方向適応符号化システムでは、割当て値は、符 号化信号にアセンブルされた情報によって、明示的に復 号器に伝達される。逆方向適応符号化システムでは、割 当て値は、復号器割当て関数で割当て値を誘導できる符 号化信号にアセンブルされた情報によって、明示的に復 号器に伝達される。ハイブリッド適応符号化システムで は、基本割当て値は、明示的に伝達される改変割当て値 と共に明示的に伝達される。

Claims (1)

  1. 【特許請求の範囲】 1 入力信号を符号化するための符号器であって、 該入力信号の周波数サブバンドを表すサブバンド信号を発生し、該入力信号 のスペクトル表現を発生するためのサブバンド装置と、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生す るための刺激装置と、 該刺激パターンに応答して初期のマスキングしきい値を確定するためのしき い値装置と、 該初期マスキングしきい値に関連する該サブバンド信号のレベルに従ってそ れぞれの数のビットを該サブバンド信号に配分するための配分装置と、 該サブバンド信号に割当てられる該それぞれの数のビットに従って該サブバ ンド信号を量子化することによって量子化情報を発生するための量子化装置と、 該量子化情報を伝送又は記憶に適する符号化信号にアセンブルするためのフ ォーマット装置 とから成る、符号器。 2 請求項1の符号器であって、前記スペクトル表現が、前記入力信号の電力ス ペクトル密度の推定値にマッピング関数を適用することによって発生され、該マ ッピング関数が、以下の式、すなわち、 による、周波数f及び周波数帯域xの間の関係から誘導される、符号器。 3 請求項1の符号器であって、前記スペクトル表現が、前記入力信号の電力ス ペクトル密度の推定値にマッピング関数を適用することによって発生され、該マ ッピング関数が項目の参照用テーブルとして実行され、該テーブルの項目の帯域 幅の対数対対数関数が、該テーブルの低い周波数端に近い第1の項目と該テーブ ルの高い周波数端に近い第2の項目との間で実質的に線形である、符号器。 4 請求項1から3までの何れかの符号器であって、前記刺激装置で、1つ又は それ以上のフィルタを前記スペクトル表現に適用することによって前記拡散関 数が適用される、符号器。 5 請求項1から4までの何れかの符号器であって、前記初期マスキングしきい 値が、前記刺激パターンに関連するレベルではあるが、聴覚しきい値に実質的に 同等のレベルよりも低くないレベルに確定される、符号器。 6 請求項1から5までの何れかの符号器であって、前記配分装置が、割当てら れるビットの総数がビット予算と実質的に同等であるように前記初期マスキング しきい値のレベルを調節するための装置から成る、符号器。 7 請求項6の符号器であって、前記配分装置が、 前記初期マスキングしきい値のレベルを調節することによって、調節済みマ スキングしきい値を確定するための装置と、 該初期マスキングしきい値を超えるが、該調節済みマスキングしきい値より も低いレベルを有する、中間的スペクトル成分を確定するための装置と、 それぞれの数のビットを少なくとも該中間的スペクトル成分の幾分かに割当 てるための中間的配分装置であって、中間的スペクトル成分に割当てられる該そ れぞれの数のビットの総数が最大で前記ビット予算の特定された割合になる、装 置 とから成る、符号器。 8 請求項1から6までの何れかの符号器であって、前記配分装置が、前記初期 マスキングしきい値のレベルを調節することによって調節済みマスキングしきい 値を確定するための装置と、該初期マスキングしきい値を超えるが、該調節済み マスキングしきい値よりも低いレベルを有する中間的スペクトル成分を確定する ための装置と、それぞれの数のビットを少なくとも該中間的スペクトル成分の幾 分かに割当てるための中間的配分装置とから成る、符号器。 9 請求項8の符号器であって、前記中間的配分装置が、前記調節済みマスキン グしきい値を超える最高周波数のスペクトル成分から上限周波数までの範囲の周 波数を有し、前記初期マスキングしきい値と該調節済みマスキングしきい値との 間の中間的しきい値を超えるレベルを有する、中間的スペクトル成分に該割当て を限定するための装置から成る、符号器。 10 請求項1から9までの何れかの符号器であって、前記しきい値装置によって 、 刺激パターンに対して音響心理学的マスキングを保証するのに十分であるが、聴 覚のしきい値と実質的に等しいレベルよりも低くないレベルに前記マスキングし きい値が確定される、符号器。 11 請求項1から10までの何れかの符号器であって、前記配分装置の結果に影 響する1つ又はそれ以上のパラメータを改変するための装置から更に成り、前記 フォーマット装置によって、該改変済みパラメータの指示が前記符号化信号にア センブルされる、符号器。 12 請求項1から11までの何れかの符号器であって、前記それぞれの数のビッ トの1つ又はそれ以上を改変するための装置から更に成り、前記フォーマット装 置によって、該改変済みのそれぞれの数のビットの指示が前記符号化信号にアセ ンブルされる、符号器。 13 請求項1から12までの何れかの符号器であって、前記量子化装置で、前記 入力信号に応答して適用される量子化関数が用いられる、符号器。 14 入力信号の符号化表現を復号するための復号器であって、 量子化サブバンド情報及び該入力信号のスペクトル表現を該符号化表現から 抽出するための逆フォーマット装置と、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生す るための刺激装置と、 該刺激パターンに応答して初期のマスキングしきい値を確定するためのしき い値装置と、 該初期マスキングしきい値に関連する該量子化サブバンド情報のレベルに従 って、それぞれの数のビットを該量子化サブバンド情報に割当てるための配分装 置と、 該それぞれの数のビットに従って該量子化サブバンド情報を逆量子化するこ とによってサブバンド信号を発生するための逆量子化装置と、 該サブバンド信号に応答する、該入力信号の複製を発生するための逆サブバ ンド装置 とから成る、復号器。 15 請求項14の復号器であって、前記刺激装置で、1つ又はそれ以上のフィル タを前記スペクトル表現に適用することによって前記拡散関数を適用する、復号 器。 16 請求項14又は15の復号器であって、前記初期マスキングしきい値が、前 記刺激パターンに関連するレベルではあるが、聴覚しきい値に実質的に同等のレ ベルよりも低くないレベルに確定される、復号器。 17 請求項14から16までの何れかの復号器であって、前記逆フォーマット装 置が、調節済みマスキングしきい値を前記符号化表現に応答して確定するための 装置から成り、前記配分装置が、前記初期マスキングしきい値を超えるが該調節 済みマスキングしきい値よりも低いレベルを有する中間的スペクトル成分を確定 するための装置と、それぞれの数のビットを少なくとも該中間的スペクトル成分 の幾分かに割当てるための装置とから成る、復号器。 18 請求項14から17までの何れかの復号器であって、前記しきい値装置によ って、刺激パターンに対して音響心理学的マスキングを保証するのに十分である が、聴覚のしきい値と実質的に等しいレベルよりも低くないレベルに前記マスキ ングしきい値が確定される、復号器。 19 請求項14から18までの何れかの復号器であって、前記逆量子化装置で、 前記符号化表現から抽出される情報に応答して適用される逆量子化関数が用いら れる、復号器。 20 入力信号を符号化するための符号化方法であって、 該入力信号の周波数サブバンドを表すサブバンド信号を発生させ、該入力信 号のスペクトル表現を発生させ、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生さ せ、 該初期マスキングしきい値に関連する該サブバンド信号のレベルに従ってそ れぞれの数のビットを該サブバンド信号に割当て、 該サブバンド信号に割当てられる該それぞれの数のビットに従って該サブバ ンド信号を量子化することによって量子化情報を発生させ、 該量子化情報を伝送又は記憶に適する符号化信号にアセンブルする 段階から成る、方法。 21 入力信号の符号化表現を復号するための復号方法であって、 該符号化表現を、量子化サブバンド情報及び該入力信号のスペクトル表現に 逆アセンブルし、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生さ せ、 該刺激パターンに応答して初期マスキングしきい値を確定し、 該初期マスキングしきい値に関連する該量子化サブバンド情報のレベルに従 って、それぞれの数のビットを該量子化サブバンド情報に割当て、 該それぞれの数のビットに従って該量子化サブバンド情報を逆量子化するこ とによって、サブバンド信号を発生させ、 該サブバンド信号に応答して該入力信号の複製を発生させる 段階から成る、方法。 22 入力信号の聴覚をモデル化するための装置であって、 該入力信号のスペクトル表現を発生するための装置と、 拡散関数を該スペクトル表現に適用することによって刺激パターンを発生す るための装置であって、該スペクトル表現を濾波することによって該拡散関数が 適用される装置 とから成る、装置。 23 請求項22の装置であって、前記スペクトル表現が、前記入力信号の電力ス ペクトル密度の推定値にマッピング関数を適用することによって発生され、該マ ッピング関数が、以下の式、すなわち、 による、周波数f及び周波数帯域xの間の関係から誘導される、装置。 24 請求項22の装置であって、前記スペクトル表現が、前記入力信号の電力ス ペクトル密度の推定値にマッピング関数を適用することによって発生され、該マ ッピング関数が項目の参照用テーブルとして実行され、該テーブルの項目の帯域 幅の対数対対数関数が、該テーブルの低い周波数端に近い第1の項目と該テーブ ルの高い周波数端に近い第2の項目との間で実質的に線形である、装 置。 25 請求項22の装置であって、前記スペクトル領域がマッピングされた周波数 領域である、装置。 26 請求項22から25までの何れかの装置であって、前記濾波が回帰フィルタ 又は格子型フィルタで実行される、装置。
JP50475395A 1993-07-16 1994-07-18 適応ビット配分符号化装置及び方法 Expired - Lifetime JP3297051B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9226993A 1993-07-16 1993-07-16
US08/092,269 1993-07-16
US08/145,975 US5632003A (en) 1993-07-16 1993-11-01 Computationally efficient adaptive bit allocation for coding method and apparatus
US08/145,975 1993-11-01
PCT/US1994/008015 WO1995002930A1 (en) 1993-07-16 1994-07-18 Computationally efficient adaptive bit allocation for coding method and apparatus

Publications (2)

Publication Number Publication Date
JPH09500503A true JPH09500503A (ja) 1997-01-14
JP3297051B2 JP3297051B2 (ja) 2002-07-02

Family

ID=26785469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50475395A Expired - Lifetime JP3297051B2 (ja) 1993-07-16 1994-07-18 適応ビット配分符号化装置及び方法

Country Status (10)

Country Link
US (1) US5623577A (ja)
EP (1) EP0709005B1 (ja)
JP (1) JP3297051B2 (ja)
AT (1) ATE147909T1 (ja)
AU (1) AU694131B2 (ja)
CA (1) CA2166551C (ja)
DE (1) DE69401514T2 (ja)
DK (1) DK0709005T3 (ja)
ES (1) ES2096481T3 (ja)
WO (1) WO1995002930A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264811A (ja) * 2002-09-04 2004-09-24 Microsoft Corp オーディオの量子化および逆量子化
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測
JP2011172235A (ja) * 2008-04-18 2011-09-01 Dolby Lab Licensing Corp サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置
US8015001B2 (en) 2004-06-28 2011-09-06 Sony Corporation Signal encoding apparatus and method thereof, and signal decoding apparatus and method thereof
KR101520938B1 (ko) * 2013-04-26 2015-05-18 미디어젠(주) 음량 크기의 통계적 특성을 이용한 음량측정방법
JP2016206244A (ja) * 2015-04-15 2016-12-08 富士通株式会社 符号化装置、符号化方法、及びプログラム

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
EP0772925B1 (en) * 1995-05-03 2004-07-14 Sony Corporation Non-linearly quantizing an information signal
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
JPH09148937A (ja) * 1995-11-21 1997-06-06 Sony Corp 符号化処理方法、復号化処理方法、符号化処理装置および復号化処理装置
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
GB9700854D0 (en) * 1997-01-16 1997-03-05 Scient Generics Ltd Sub-audible acoustic data transmission mechanism
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
WO1999035758A1 (en) * 1998-01-12 1999-07-15 Sgs-Thomson Microelectronics Asia Pacific (Pte.)_Ltd. Method and apparatus for spectral exponent reshaping in a transform coder for high quality audio
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
US6128593A (en) * 1998-08-04 2000-10-03 Sony Corporation System and method for implementing a refined psycho-acoustic modeler
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US7003449B1 (en) 1999-10-30 2006-02-21 Stmicroelectronics Asia Pacific Pte Ltd. Method of encoding an audio signal using a quality value for bit allocation
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6647365B1 (en) * 2000-06-02 2003-11-11 Lucent Technologies Inc. Method and apparatus for detecting noise-like signal components
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
AUPR433901A0 (en) * 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
JP2002330075A (ja) * 2001-05-07 2002-11-15 Matsushita Electric Ind Co Ltd サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US7177803B2 (en) * 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7197083B2 (en) * 2001-12-21 2007-03-27 Intel Corporation Creation of spectral windows through the use of high rate code words
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7617100B1 (en) * 2003-01-10 2009-11-10 Nvidia Corporation Method and system for providing an excitation-pattern based audio coding scheme
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
EP1782419A1 (en) * 2004-08-17 2007-05-09 Koninklijke Philips Electronics N.V. Scalable audio coding
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
JP4800645B2 (ja) * 2005-03-18 2011-10-26 カシオ計算機株式会社 音声符号化装置、及び音声符号化方法
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
US8706507B2 (en) * 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
CN101425293B (zh) * 2008-09-24 2011-06-08 天津大学 一种高效感知音频比特分配方法
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
FR2973551A1 (fr) * 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
IN2015DN04001A (ja) 2012-11-07 2015-10-02 Dolby Int Ab
JP2016508298A (ja) * 2012-11-16 2016-03-17 ヴィド スケール インコーポレイテッド 視聴条件を意識したビデオ符号化のための知覚前処理フィルタ
US10045050B2 (en) 2014-04-25 2018-08-07 Vid Scale, Inc. Perceptual preprocessing filter for viewing-conditions-aware video coding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2002015C (en) * 1988-12-30 1994-12-27 Joseph Lindley Ii Hall Perceptual coding of audio signals
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264811A (ja) * 2002-09-04 2004-09-24 Microsoft Corp オーディオの量子化および逆量子化
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US8015001B2 (en) 2004-06-28 2011-09-06 Sony Corporation Signal encoding apparatus and method thereof, and signal decoding apparatus and method thereof
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測
JP2011172235A (ja) * 2008-04-18 2011-09-01 Dolby Lab Licensing Corp サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置
KR101520938B1 (ko) * 2013-04-26 2015-05-18 미디어젠(주) 음량 크기의 통계적 특성을 이용한 음량측정방법
JP2016206244A (ja) * 2015-04-15 2016-12-08 富士通株式会社 符号化装置、符号化方法、及びプログラム

Also Published As

Publication number Publication date
US5623577A (en) 1997-04-22
JP3297051B2 (ja) 2002-07-02
AU694131B2 (en) 1998-07-16
ES2096481T3 (es) 1997-03-01
WO1995002930A1 (en) 1995-01-26
EP0709005B1 (en) 1997-01-15
DK0709005T3 (da) 1997-07-14
CA2166551A1 (en) 1995-01-26
EP0709005A1 (en) 1996-05-01
CA2166551C (en) 2005-10-11
AU7364294A (en) 1995-02-13
DE69401514T2 (de) 1997-06-12
DE69401514D1 (de) 1997-02-27
ATE147909T1 (de) 1997-02-15

Similar Documents

Publication Publication Date Title
JPH09500503A (ja) 適応ビット配分符号化装置及び方法
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
Pan Digital audio compression
JP3390013B2 (ja) 広帯域デジタル情報信号の符号化及び復号化
JP2906646B2 (ja) 音声帯域分割符号化装置
US5664056A (en) Digital encoder with dynamic quantization bit allocation
KR100288460B1 (ko) 신호가중된 양자화비트할당을 사용하는 데이타 압축 장치 및 방법
EP0720148B1 (en) Method for noise weighting filtering
KR100361236B1 (ko) 차분코딩원리를구현하는전송시스템
KR100295217B1 (ko) 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치
KR100397690B1 (ko) 데이터부호화장치및그방법
EP1228506B1 (en) Method of encoding an audio signal using a quality value for bit allocation
MXPA96004161A (en) Quantification of speech signals using human auiditive models in predict encoding systems
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
Johnson et al. Adaptive transform coding incorporating time domain aliasing cancellation
CA2165450C (en) Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
KR970006827B1 (ko) 오디오신호 부호화장치
Lanciani et al. Psychoacoustically-based processing of MPEG-I layer 1-2 encoded signals

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080412

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140412

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term