Nothing Special   »   [go: up one dir, main page]

JP3404837B2 - 多層符号化装置 - Google Patents

多層符号化装置

Info

Publication number
JP3404837B2
JP3404837B2 JP30689893A JP30689893A JP3404837B2 JP 3404837 B2 JP3404837 B2 JP 3404837B2 JP 30689893 A JP30689893 A JP 30689893A JP 30689893 A JP30689893 A JP 30689893A JP 3404837 B2 JP3404837 B2 JP 3404837B2
Authority
JP
Japan
Prior art keywords
circuit
band
channel
signal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30689893A
Other languages
English (en)
Other versions
JPH07160292A (ja
Inventor
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP30689893A priority Critical patent/JP3404837B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to KR1019950703323A priority patent/KR960701577A/ko
Priority to PCT/US1994/014267 priority patent/WO1995016333A1/en
Priority to JP7516380A priority patent/JPH09500252A/ja
Priority to CN94191534A priority patent/CN1119902A/zh
Priority to EP95905899A priority patent/EP0682850A1/en
Priority to US08/446,689 priority patent/US5873065A/en
Publication of JPH07160292A publication Critical patent/JPH07160292A/ja
Application granted granted Critical
Publication of JP3404837B2 publication Critical patent/JP3404837B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • G11B2020/10601Audio or video recording specifically adapted for recording or reproducing multichannel signals surround sound signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、例えば、映画フィルム
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タルオーディオ信号を圧縮符号化する多層符号化装置に
関するものである。 【0002】 【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式、いわゆる
変換符号化(トランスフォームコーティング)や、時間
領域のオーディオ信号等を単位時間毎にブロック化しな
いで、複数の周波数帯域に分割して符号化する非ブロッ
ク化周波数帯域分割方式である帯域分割符号化(サブバ
ンドコーディング:SBC)等を挙げることができる。
また、上述の帯域分割符号化と変換符号化とを組み合わ
せた高能率符号化の手法及び装置も考えられており、こ
の場合には、例えば、上記帯域分割符号化で帯域分割を
行った後、該各帯域毎の信号を周波数領域の信号に直交
変換し、この直交変換された各帯域毎に符号化が施され
る。 【0003】ここで、上述した帯域分割符号化の帯域分
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは1976 R.E.Crochiere Digital coding of sp
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976に、述べられている。また、ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法及び装置が述べられている。 【0004】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、該ブロック毎に高速フーリエ変換(FF
T)、コサイン変換(DCT)、モディファイドDCT
変換(MDCT)などを行うことで時間軸を周波数軸に
変換するような直交変換がある。このMDCTについて
は、ICASSP 1987 Subband/Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation J.P.Princen A.B.Bradley Univ. ofSurrey R
oyal Melbourne Inst.of Tech.に述べられている。 【0005】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られた係数データを上記ビット
配分によって符号化する際には、上記各ブロック毎のM
DCT処理により得られる各帯域毎のMDCT係数デー
タに対して、適応的な配分ビット数で符号化が行われる
ことになる。 【0006】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。IEEE Tra
nsactions of Accoustics,Speech,and Signal Processi
ng,vol.ASSP-25,No.4,August 1977 では、各帯域毎の信
号の大きさをもとに、ビット配分を行っている。また、
ICASSP 1980 The critical band coder--digital encod
ing ofthe perceptual requirements of the auditory
system M.A. Kransner MIT では、聴覚マスキングを利
用することで、各帯域毎に必要な信号対雑音比を得て固
定的なビット配分を行う手法及び装置が述べられてい
る。 【0007】ここで、例えば上述したようなサブバンド
コーディング等を用いたオーディオ信号の高能率圧縮符
号化方式においては、人間の聴覚上の特性を利用し、オ
ーディオデータを約1/5に圧縮するような方式が既に
実用化されている。なお、このオーディオデータを約1
/5に圧縮する高能率符号化方式としては、例えばいわ
ゆるATRAC(Adaptive TRansform Acoustic Codin
g) と呼ばれる方式が存在する。 【0008】さらに、通常のオーディオ機器の場合のみ
ならず、例えば映画フィルム映写システム、高品位テレ
ビジョン、ビデオテープレコーダ、ビデオディスクプレ
ーヤ等のステレオないしはマルチサラウンド音響システ
ムにおいては、例えば4〜8チャネル等の複数チャネル
のオーディオ或いは音声信号を扱うようになりつつあ
り、この場合においても、ビットレートを削減する高能
率符号化を行うことが望まれている。 【0009】特に、業務用においては、ディジタルオー
ディオのマルチチャネル化が進んでおり、例えば8チャ
ネルのディジタルオーディオ信号を扱う機器が浸透して
きている。上記8チャネルのディジタルオーディオ信号
を扱う機器としては、例えば映画フィルム映写システム
等がある。また、高品位テレビジョン、ビデオテープレ
コーダ、ビデオディスクプレーヤ等のステレオないしは
マルチサラウンド音響システムにおいても、例えば4〜
8チャネル等の複数チャネルのオーディオ或いは音声信
号を扱うようになりつつある。 【0010】ここで、上記8チャネルのディジタルオー
ディオ信号を扱う映画フィルム映写システムにおいて
は、上記映画フィルムに対して、例えばレフトチャネ
ル,レフトセンタチャネル,センタチャネル,ライトセ
ンタチャネル,ライトチャネル,サラウンドレフトチャ
ネル,サラウンドライトチャネル,サブウーファチャネ
ルの8チャネルのディジタルオーディオ信号を記録する
ことが行われつつある。なお、上記映画フィルムに記録
する上記8チャネルの各チャネルは、例えば当該映画フ
ィルムの画像記録領域から再生された画像が映写機によ
って投影されるスクリーン側に配置されるレフトスピー
カ、レフトセンタースピーカ、センタスピーカ、ライト
センタスピーカ、ライトスピーカ、サブウーファスピー
カ、観客席を取り囲むように左側に配置されるサラウン
ドレフトスピーカ及び右側に配置されるサラウンドライ
トスピーカと対応するものである。 【0011】ただし、映画フィルムに上記8チャネルの
ディジタルオーディオ信号を記録する場合において、映
画フィルムには、例えばいわゆるCD(コンパクトディ
スク)などで用いているようなサンプリング周波数4
4.1kHzで16ビットの直線量子化されたオーディ
オデータを上記8チャネル分も記録できる領域を確保す
ることは困難であるため、上記8チャネルのオーディオ
データを圧縮して記録するようになされる。例えば、当
該8チャネルのディジタルオーディオデータを圧縮する
圧縮方法としては、上述したような人間の聴覚の特性を
考慮して最適なビット割り当てを行うことによって、例
えばいわゆるCD(コンパクトディスク)などに記録さ
れるようなサンプリング周波数44.1kHzで16ビ
ットのディジタルオーディオデータを約1/5に圧縮し
ながらも、CD並の音質を達成する前記高能率符号化方
式(いわゆるATRAC方式など)を適用するようにし
ている。 【0012】また、フィルムという媒体は、表面に傷な
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。 【0013】 【発明が解決しようとする課題】しかし、上述のような
マルチチャネルのオーディオ信号を高能率符号化する方
式では、各チャネル毎に圧縮が行われるため、全体とし
てのビット配分量(バイト配分量)が必ずしも有効に使
用されているとは言い難い。例えば、あるチャネルには
少ないビット配分でもよいが、他のチャネルではより多
くのビット配分を必要とする場合がある。このように、
従来の高能率符号化方式では、各チャネルにわたってビ
ット配分量(バイト配分量)を眺めると無駄が多いと思
われる。特に、各チャネル毎にビット配分量(或いはバ
イト配分量)が固定されている場合には、上記のような
無駄がさらに顕著になると考えられる。近年は、さらに
圧縮率を高めることも望まれている。 【0014】そこで、本発明は、上述したようなことに
鑑み、より圧縮率を高めることができると共に、チャネ
ル間のビット配分をも可能とする多層符号化装置を提供
することを目的としている。 【0015】 【課題を解決するための手段】本発明は、上述の目的を
達成するために提案されたものであり、本発明の多層符
号化装置は、複数チャネルのディジタルオーディオ信号
を多層符号化するものであり、各チャネルのディジタル
オーディオ信号が入力され、当該ディジタルオーディオ
信号を圧縮符号化する第1の符号化手段と、上記第1の
符号化手段の出力符号化信号が供給され、チャネル毎の
スペクトラルエンベロープに基づいて、各チャネルにビ
ット配分を行って符号化する第2の符号化手段とを有し
てなることを特徴とするものである。 【0016】 【作用】本発明によれば、第1の符号化手段で各チャネ
ルのディジタルオーディオ信号を圧縮符号化した後、こ
の第1の符号化手段の出力符号化信号に対して、さらに
第2の符号化手段によってチャネル毎のスペクトラルエ
ンベロープに基づいて、各チャネルにビット配分を行っ
符号化することでチャネル間のビット配分と高圧縮率
を実現している。 【0017】 【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。 【0018】図1には、本発明実施例の多層符号化装置
の要部の構成を示す。 【0019】本発明実施例の多層符号化装置は、この図
1に示すように、複数チャネルCH1〜CHnのディジ
タルオーディオ信号を多層符号化するものであり、各チ
ャネルCH1〜CHnのディジタルオーディオ信号が入
力され、当該ディジタルオーディオ信号を圧縮符号化す
る第1の符号化手段としての圧縮符号化回路202
202及びエントロピィ符号化回路203〜203
と、上記第1の符号化手段のエントロピィ符号化回路
203〜203からのメイン情報の符号化信号(圧
縮符号化回路202〜202からの圧縮符号化され
たディジタルオーディオ信号)が供給されてチャネルC
H1〜CHn毎のエネルギを検出するLogスペクトラ
ルエンベロープ検出回路208と、このLogスペクト
ラルエンベロープ検出回路208からの検出出力に略応
じた比率で各チャネルに割り当てる情報量を決定する
(ビット配分を行う)配分決定回路209と、この配分
決定回路209からのビット配分情報に基づいて、適応
量子化回路205〜205(回路205〜205
の図示は省略)において上記エントロピィ符号化回路
203〜203からのメイン情報の符号化信号を適
応的に量子化すると共に、サブ情報圧縮回路204
204において上記圧縮符号化回路202〜202
からのディジタルオーディオ信号の圧縮符号化に関連
するサブ情報(語長情報やスケールファクタの情報)を
適応的に圧縮符号化する第2の符号化手段(Logスペ
クトラルエンベロープ検出回路208,配分決定回路2
09,適応量子化回路205 〜205 ,サブ情報圧
縮回路204〜204)とを有してなることを特徴
とするものである。 【0020】なお、本発明の多層符号化装置によって圧
縮符号化された各チャネルのディジタルオーディオ信号
は、伝送路を介して伝送されたり、記録媒体に記録され
たりする。当該記録媒体として、例えば映画フィルムへ
の記録や、光ディスク,光磁気ディスク,相変化型光デ
ィスク,磁気ディスク等のディスク状記録媒体、磁気テ
ープ等のテープ状記録媒体への記録、半導体メモリ,I
Cカードなどへ記録される。 【0021】ここで、上記記録媒体として映画フィルム
を用い、この映画フィルムへの記録を行う場合の上記各
チャネルCH1〜CH8は、例えば図2に示すようにス
ピーカが配置されるディジタルサラウンドシステムに対
応することになる。各スピーカに対応するチャネルは、
センタ(C)チャネル、サブウーファ(SW)チャネ
ル、レフト(L)チャネル、レフトセンタ(CL)チャ
ネル、ライト(R)チャネル、ライトセンタ(CR)チ
ャネル、レフトサラウンド(LB)チャネル、ライトサ
ラウンド(RB)チャネルの8つである。 【0022】すなわちこの図2において、上記スピーカ
配置に対応する各チャネルは、例えば当該映画フィルム
の画像記録領域から再生された画像が映写機(プロジェ
クタ100)によって投影されるスクリーン101側に
配置されたレフトスピーカ106,レフトセンタースピ
ーカ104,センタースピーカ102,ライトセンター
スピーカ105,ライトスピーカ107,サラウンドレ
フトスピーカ108サラウンドライトスピーカ10
,サブウーファスピーカ103と対応するものであ
る。 【0023】上記センタスピーカ102は、スクリーン
101側の中央に配置され、センタチャネルのオーディ
オデータによる再生音を出力するもので例えば俳優のせ
りふ等の最も重要な再生音を出力する。上記サブウーフ
ァスピーカ103は、サブウーファチャネルのオーディ
オデータによる再生音を出力するもので、例えば爆発音
などの低域の音というよりは振動として感じられる音を
効果的に出力するものであり、爆発シーンなどに効果的
に使用されることが多いものである。上記レフトスピー
カ106及びライトスピーカ107は、上記スクリーン
101の左右に配置され、レフトチャネルのオーディオ
データによる再生音とライトチャネルのオーディオデー
タによる再生音を出力するもので、ステレオ音響効果を
発揮する。上記レフトセンタスピーカ104とライトセ
ンタスピーカ105は、上記センタスピーカ102と上
記レフトスピーカ106及びライトスピーカ107との
間に配置され、レフトセンタチャネルのオーディオデー
タによる再生音とライトセンタチャネルのオーディオデ
ータによる再生音を出力するもので、それぞれ上記レフ
トスピーカ106及びライトスピーカ107の補助的な
役割を果たす。特にスクリーン101が大きく収容人数
の多い映画館等では、座席の位置によって音像の定位が
不安定になりやすいが、上記レフトセンタスピーカ10
4とライトセンタスピーカ107を付加することによ
り、音像のよりリアルな定位を作り出すのに効果を発揮
する。さらに、上記サラウンドレフトスピーカ108と
サラウンドライトスピーカ109は、観客席を取り囲む
ように配置され、サラウンドレフトチャネルのオーディ
オデータによる再生音とサラウンドライトチャネルのオ
ーディオデータによる再生音を出力するもので、残響音
や拍手、歓声に包まれた印象を与える効果がある。これ
により、より立体的な音像を作り出すことができる。 【0024】図1に戻って、本実施例の多層符号化装置
について説明する。この図1において、各入力端子20
1 〜201n には、それぞれ対応する各チャネルのデ
ィジタルオーディオ信号が供給される。 【0025】各入力端子2011 〜201n に供給され
た各チャネルのディジタルオーディオ信号は、対応する
各圧縮符号化回路2021 〜202n に送られて、ここ
で各チャネル毎にそれぞれ圧縮符号化される。なお、各
圧縮符号化回路2021 〜202n の詳細な構成につい
ては後述する。 【0026】各圧縮符号化回路2021 〜202n で圧
縮符号化されたディジタルオーディオ信号は、メイン情
報としてエントロピィ符号化回路2031 〜203n
送られ、ここで、それぞれが可変長符号化される。ま
た、上記圧縮符号化回路202 1 〜202n でのディジ
タルオーディオ信号の圧縮符号化に関連する後述する語
長情報やスケールファクタの情報は、サブ情報としてサ
ブ情報圧縮回路2041〜204n に送られ、ここで各
チャネル毎のビット配分情報に基づいて圧縮される。 【0027】上記エントロピィ符号化回路2031 〜2
03n からのエントロピィ符号化された各メイン情報
は、適応量子化回路2051 〜205n に送られると共
に、Logスペクトラルエンベロープ検出回路208に
も送られる。なお、図1では、チャネルCH2〜CHn
の各エントロピィ符号化回路2032 〜203n からの
エントロピィ符号化されたメイン情報は、それぞれ対応
する端子2102 〜210n から、図示を省略している
各チャネルCH2〜CHnに対応する適応量子化回路2
052 〜205n に送られると共に、端子2152 〜2
15n を介して上記Logスペクトラルエンベロープ検
出回路208に送られるようになっている。 【0028】上記エントロピィ符号化された各メイン情
報が供給されるLogスペクトラルエンベロープ検出回
路208では、これら各チャネルのメイン情報からそれ
ぞれエネルギを検出して、各チャネルのLogスペクト
ラルエンベロープを検出する。当該各チャネルのLog
スペクトラルエンベロープ情報は、上記配分決定回路2
09に送られる。 【0029】当該配分決定回路209では、上記Log
スペクトラルエンベロープ検出回路208からの各チャ
ネルのLogスペクトラルエンベロープ情報に基づい
て、各チャネルのメイン情報に対するチャネル間ビット
配分情報と、各サブ情報に対するチャネル間ビット配分
情報を決定する。 【0030】上記配分決定回路209からの上記メイン
情報に対するチャネル間ビット配分情報は、適応量子化
回路2051 〜205n に送られ、上記サブ情報に対す
るチャネル間ビット配分情報は、上記サブ情報圧縮回路
2041 〜204n に送られる。なお、図1の例では、
チャネルCH2〜CHnのメイン情報に対するチャネル
間ビット配分情報は端子2142 〜214n を介して図
示を省略している適応量子化回路2052 〜205n
送られ、チャネルCH2〜CHnのサブ情報に対するチ
ャネル間ビット配分情報は端子2172 〜217n 及び
端子2162 〜216n を介してサブ情報圧縮回路20
2 〜204n に送られる。 【0031】上記適応量子化回路2051 〜205n
は、上記メイン情報に対するチャネル間ビット配分情報
を用いて、上記各エントロピィ符号化回路2031 〜2
03 n からのエントロピィ符号化されたディジタルオー
ディオ信号を適応的に量子化する。 【0032】また、上記サブ情報圧縮回路204 〜2
04 では、上記サブ情報に対するチャネル間ビット配
分情報を用いて、上記圧縮符号化回路202〜202
からのサブ情報(語長情報,スケールファクタ情報)
を圧縮符号化する。 【0033】上記適応量子化回路205〜205
サブ情報圧縮回路204 〜204 からの各出力は、
マルチプレクサ206に送られる。なお、チャネルCH
2〜CHnの図示を省略している適応量子化回路205
〜205からの各出力は、端子212〜212
を介して上記マルチプレクサ206に送られ、チャネル
CH2〜CHnのサブ情報圧縮回路204 〜204
からの各出力は、端子213〜213を介して上記
マルチプレクサ206に送られる。 【0034】当該マルチプレクサ206では、供給され
た各データをマルチプレクスして端子207から出力す
る。この出力データが符号化データとして例えば記録媒
体等に記録される。 【0035】また、図1の本実施例装置においては、例
えば図3に示すように、上記圧縮符号化回路2021
202n に対して供給する各チャネルのディジタルオー
ディオ信号から、少なくとも2チャネル毎(図3の例で
は全チャネル毎)に対応してそれぞれ設けたハイパスフ
ィルタ222によって高域成分のみを取り出した後、こ
れら各高域成分を加算回路223によって加算し、端子
225を介した当該高域成分の加算データに対して、所
定の処理、例えば圧縮符号化,エントロピィ符号化及び
量子化の処理を施すようにすることもできる。このと
き、上記高域成分を取り出す各チャネルの入力ディジタ
ルオーディオ信号からは、それぞれローパスフィルタ2
21によって低域成分も取り出し、端子224を介して
対応する圧縮符号化回路2021 〜202n に送るよう
にする。その後、上記高域及び低域成分を取り出す各チ
ャネルのうち、ある1つのチャネル(図3の例ではチャ
ネルCH1)の上記マルチプレクサ206へ入力するメ
イン情報に対して、上記所定の処理を施した加算データ
を加算する処理(チャネル間クロストーク処理)を行う
ようにする。 【0036】ここで、上記各チャネルの高域成分を加算
して、ある1つのチャネルの低域成分に加算することを
行うのは、以下の理由による。 【0037】すなわち、人間の耳は高域の成分に対する
定位感が少なく、このため高域成分については例えば複
数個のスピーカのうちのいずれか1つのスピーカからで
ていても人間にはどのスピーカから出てきているのか聞
き取り難いという性質がある。このため、複数チャネル
のオーディオ信号の各高域成分を、そのうちの例えば1
チャネルに対応するスピーカのみに送るようにしても、
人間には各チャネルのオーディオ信号の高域成分が当該
1つのスピーカのみから出力されているとは感じられな
い。したがって、上述のように、上記各チャネルの高域
成分の音声を加算して、この加算データをある1つのチ
ャネルの低域成分に加算することで、各チャネルの高域
成分を1つのチャネル分に圧縮できることになる。 【0038】次に、上記図1に示した圧縮符号化回路2
021 〜202n の具体的な構成について説明する。 【0039】これら圧縮符号化回路2021 〜202n
では、オーディオPCM信号等の入力ディジタル信号
を、帯域分割符号化(SBC)、適応変換符号化(AT
C)及び適応ビット配分(APC−AB)の各技術を用
いて圧縮符号化している。 【0040】以下、図4を用いて説明する。図4に示す
本実施例の圧縮符号化回路2021 〜202n では、入
力ディジタル信号をフィルタなどにより複数の周波数帯
域に分割すると共に、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に適応的にビット配分して符号化して
いる。この時、高域では臨界帯域幅を更に分割した帯域
を用いる。もちろんフィルタなどによる非ブロッキング
の周波数分割幅は等分割幅としてもよい。さらに、本実
施例においては、直交変換の前に入力信号に応じて適応
的にブロックサイズ(ブロック長)を変化させると共
に、クリティカルバンド単位もしくは高域では臨界帯域
幅(クリティカルバンド)を更に細分化したブロックで
フローティング処理を行っている。このクリティカルバ
ンドとは、人間の聴覚特性を考慮して分割された周波数
帯域であり、ある純音の周波数近傍の同じ強さの狭帯域
バンドノイズによって当該純音がマスクされるときのそ
のノイズの持つ帯域のことである。このクリティカルバ
ンドは、高域ほど帯域幅が広くなっており、上記0〜2
2kHzの全周波数帯域は例えば25のクリティカルバ
ンドに分割されている。 【0041】すなわち、図4において、入力端子10に
は例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMF等
の帯域分割フィルタ11により0〜11kHz帯域と1
1k〜22kHz帯域とに分割され、0〜11kHz帯
域の信号は同じくいわゆるQMF等の帯域分割フィルタ
12により0〜5.5kHz帯域と5.5k〜11kH
z帯域とに分割される。帯域分割フィルタ11からの1
1k〜22kHz帯域の信号は、直交変換回路の一例で
あるMDCT(Modified Discrete Cosine Transform)
回路13に送られ、帯域分割フィルタ12からの5.5
k〜11kHz帯域の信号はMDCT回路14に送ら
れ、帯域分割フィルタ12からの0〜5.5kHz帯域
の信号はMDCT回路15に送られることにより、それ
ぞれMDCT処理される。なお、各MDCT回路13、
14、15では、各帯域毎に設けたブロック決定回路1
9、20、21により決定されたブロックサイズに基づ
いてMDCT処理がなされる。 【0042】ここで、上記ブロック決定回路19、2
0、21により決定される各MDCT回路13、14、
15でのブロックサイズの具体例を図5のA及びBに示
す。なお、図5のAには直交変換ブロックサイズが長い
場合(ロングモードにおける直交変換ブロックサイズ)
を、図5のBには直交変換ブロックサイズが短い場合
(ショートモードにおける直交変換ブロックサイズ)を
示ししている。この図5の具体例においては、3つのフ
ィルタ出力は、それぞれ2つの直交変換ブロックサイズ
を持つ。すなわち、低域側の0〜5.5kHz帯域の信
号及び中域の5.5k〜11kHz帯域の信号に対して
は、長いブロック長の場合(図5のA)は1ブロック内
のサンプル数を128サンプルとし、短いブロックが選
ばれた場合(図5のB)には1ブロック内のサンプル数
を32サンプル毎のブロックとしている。これに対して
高域側の11k〜22kHz帯域の信号に対しては、長
いブロック長の場合(図5のA)は1ブロック内のサン
プル数を256サンプルとし、短いブロックが選ばれた
場合(図5のB)には1ブロック内のサンプル数を32
サンプル毎のブロックとしている。このようにして短い
ブロックが選ばれた場合には各帯域の直交変換ブロック
のサンプル数を同じとして高域程時間分解能を上げ、な
おかつブロック化に使用するウインドウの種類を減らし
ている。なお、上記ブロック決定回路19、20、21
で決定されたブロックサイズを示す情報は、後述の適応
ビット配分符号化回路16、17、18に送られると共
に、出力端子23、25、27から出力される。 【0043】再び図5において、各MDCT回路13、
14、15にてMDCT処理されて得られた周波数領域
のスペクトルデータあるいはMDCT係数データは、い
わゆる臨界帯域(クリティカルバンド)または高域では
更にクリティカルバンドを分割した帯域毎にまとめられ
て適応ビット配分符号化回路16、17、18に送られ
ている。 【0044】適応ビット配分符号化回路16、17、1
8では、上記ブロックサイズの情報、及び臨界帯域(ク
リティカルバンド)または高域では更にクリティカルバ
ンドを分割した帯域毎に割り当てられたビット数に応じ
て各スペクトルデータ(あるいはMDCT係数データ)
を再量子化(正規化して量子化)するようにしている。
適応ビット配分符号化回路16、17、18で符号化さ
れたデータは、出力端子22、24、26を介して取り
出される。また、当該適応ビット配分符号化回路16、
17、18では、どのような信号の大きさに関する正規
化がなされたかを示すスケールファクタ情報と、どのよ
うなビット長で量子化がされたかを示すビット長情報
(語長情報)も求めており、これらも同時に出力端子2
2、24、26から出力される。 【0045】また、図5における各MDCT回路13、
14、15の出力からは、上記臨界帯域(クリティカル
バンド)または高域では更にクリティカルバンドを分割
した帯域毎のエネルギが、例えば当該バンド内での各振
幅値の2乗平均の平方根を計算すること等により求めら
れる。もちろん、上記スケールファクタそのものを以後
のビット配分の為に用いるようにしてもよい。この場合
には新たなエネルギ計算の演算が不要となるため、ハー
ド規模の節約となる。また、各バンド毎のエネルギの代
わりに、振幅値のピーク値、平均値等を用いることも可
能である。 【0046】ここで、上記適応ビット配分回路16、1
7、18のより具体的な構成を図6で説明する。この図
6に示す適応ビット配分回路では、MDCT係数の大き
さが各ブロック毎に求められ、そのMDCT係数が入力
端子801に供給される。当該入力端子801に供給さ
れたMDCT係数は、帯域毎のエネルギ算出回路803
に与えられる。帯域毎のエネルギ算出回路803では、
クリティカルバンド又は高域においてはクリティカルバ
ンドを更に再分割したそれぞれの帯域に関する信号エネ
ルギを算出する。帯域毎のエネルギ算出回路803で算
出されたそれぞれの帯域に関するエネルギは、エネルギ
依存ビット配分回路804に供給される。 【0047】エネルギ依存ビット配分回路804では、
使用可能総ビット発生回路802からの使用可能総ビッ
ト、本実施例では128Kbpsの内のある割合(本実
施例では100Kbps)を用いて白色の量子化雑音を
作り出すようなビット配分を行う。このとき、入力信号
のトーナリティが高いほど、すなわち入力信号のスペク
トルの凸凹が大きいほど、このビット量が上記128K
bpsに占める割合が増加する。なお、入力信号のスペ
クトルの凸凹を検出するには、隣接するブロックのブロ
ックフローティング係数の差の絶対値の和を指標として
使う。そして、求められた使用可能なビット量につき、
各帯域のエネルギの対数値に比例したビット配分を行
う。 【0048】聴覚許容雑音レベルに依存したビット配分
算出回路805は、先ず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。このようにして求められたエネル
ギ依存ビットと聴覚許容雑音レベルに依存したビットは
加算されて、図4の適応ビット配分符号化回路16、1
7、18により各クリティカルバンド毎もしくは高域に
おいてはクリティカルバンドを更に複数帯域に分割した
帯域に割り当てられたビット数に応じて各スペクトルデ
ータ(あるいはMDCT係数データ)を再量子化するよ
うにしている。このようにして符号化されたデータは、
図4の出力端子22、24、26を介して取り出され
る。 【0049】さらに詳しく上記聴覚許容雑音スペクトル
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13、1
4、15で得られたMDCT係数が上記許容雑音算出回
路に与えられる。 【0050】図7は上記許容雑音算出回路をまとめて説
明した一具体例の概略構成を示すブロック回路図であ
る。この図7において、入力端子521には、MDCT
回路13、14、15からの周波数領域のスペクトルデ
ータが供給されている。 【0051】この周波数領域の入力データは、帯域毎の
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図8はこのような各クリティカルバンド
毎のバークスペクトルSBを示している。ただし、この
図8では、図示を簡略化するため、上記クリティカルバ
ンドのバンド数を12バンド(B1 〜B12)で表現して
いる。 【0052】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。なお、上記
マスキングとは、人間の聴覚上の特性により、ある信号
によって他の信号がマスクされて聞こえなくなる現象を
いうものであり、このマスキング効果には、時間領域の
オーディオ信号による時間軸マスキング効果と、周波数
領域の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分にノ
イズがあったとしても、このノイズは聞こえないことに
なる。このため、実際のオーディオ信号では、このマス
キングされる範囲内のノイズは許容可能なノイズとされ
る。 【0053】ここで、上記畳込みフィルタ回路523の
各乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。 【0054】次に、上記畳込みフィルタ回路523の出
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器524には、上記レベルαを求めるるための
許容関数(マスキングレベルを表現する関数)が供給さ
れる。この許容関数を増減させることで上記レベルαの
制御を行っている。当該許容関数は、次に説明するよう
な(n−ai)関数発生回路525から供給されている
ものである。 【0055】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n-ai)が
許容関数となる。例としてn=38,a=−0.5を用い
ることができる。 【0056】このようにして、上記レベルαが求めら
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。 【0057】次に、上記マスキングスレッショールド
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図3に示すように、上記バークス
ペクトルSBは、該マスキングスレッショールドMSの
レベルで示すレベル以下がマスキングされることにな
る。なお、遅延回路529は上記合成回路527以前の
各回路での遅延量を考慮してエネルギ検出回路522か
らのバークスペクトルSBを遅延させるために設けられ
ている。 【0058】当該減算器528からの出力は、許容雑音
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。 【0059】このようにしてエネルギ依存ビットと聴覚
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報を用いて当該適応ビット配分符号化回路1
6、17、18では符号化が行われる。 【0060】すなわち要約すれば、適応ビット配分符号
化回路16、17、18では、上記クリティカルバンド
の各バンド帯域(クリティカルバンド)毎もしくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域のエネルギもしくはピーク値と上記ノイズレベル
設定手段の出力との差分のレベルに応じて配分されたビ
ット数で上記各バンド毎のスペクトルデータを量子化す
ることになる。 【0061】ところで、上述した合成回路527での合
成の際には、最小可聴カーブ発生回路532から供給さ
れる図9に示すような人間の聴覚特性であるいわゆる最
小可聴カーブRCを示すデータと、上記マスキングスレ
ッショールドMSとを合成することができる。この最小
可聴カーブにおいて、雑音絶対レベルがこの最小可聴カ
ーブ以下ならば該雑音は聞こえないことになる。この最
小可聴カーブは、コーディングが同じであっても例えば
再生時の再生ボリュームの違いで異なるものとなが、現
実的なディジタルシステムでは、例えば16ビットダイ
ナミックレンジへの音楽のはいり方にはさほど違いがな
いので、例えば4kHz付近の最も耳に聞こえやすい周
波数帯域の量子化雑音が聞こえないとすれば、他の周波
数帯域ではこの最小可聴カーブのレベル以下の量子化雑
音は聞こえないと考えられる。したがって、このように
例えばシステムの持つダイナミックレンジの4kHz付
近の雑音が聞こえない使い方をすると仮定し、この最小
可聴カーブRCとマスキングスレッショールドMSとを
共に合成することで許容ノイズレベルを得るようにする
と、この場合の許容ノイズレベルは、図9中の斜線で示
す部分までとすることができるようになる。なお、本実
施例では、上記最小可聴カーブの4kHzのレベルを、
例えば20ビット相当の最低レベルに合わせている。ま
た、この図9は、信号スペクトルSSも同時に示してい
る。 【0062】また、上記許容雑音補正回路530では、
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図9に示した最小可聴カーブRC
と略同じ曲線を描くものである。この等ラウドネス曲線
においては、例えば4kHz付近では1kHzのところ
より音圧が8〜10dB下がっても1kHzと同じ大き
さに聞こえ、逆に、50Hz付近では1kHzでの音圧
よりも約15dB高くないと同じ大きさに聞こえない。
このため、上記最小可聴カーブのレベルを越えた雑音
(許容ノイズレベル)は、該等ラウドネス曲線に応じた
カーブで与えられる周波数特性を持つようにするのが良
いことがわかる。このようなことから、上記等ラウドネ
ス曲線を考慮して上記許容ノイズレベルを補正すること
は、人間の聴覚特性に適合していることがわかる。 【0063】以上述べた聴覚許容雑音レベルに依存した
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。 【0064】次にビット量分割手法について説明する。
図6に戻って、MDCT回路出力が供給される入力端子
801からの信号は、スペクトルの滑らかさ算出回路8
08にも与えられ、ここでスペクトルの滑らかさが算出
される。本実施例では、信号スペクトルの絶対値の隣接
値間の差の絶対値の和を、信号スペクトルの絶対値の和
で割った値を、上記スペクトルの滑らかさとして算出し
ている。 【0065】上記スペクトルの滑らかさ算出回路808
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールするマルチプ
ライヤ811及び812に対してコントロール出力を送
る。ここで、仮にスペクトルが滑らかであり、エネルギ
依存のビット配分に重きをおくように、マルチプライヤ
811へのビット分割率決定回路809の出力が0.8
の値を取ったとき、マルチプライヤ812へのビット分
割率決定回路809の出力は1−0.8=0.2とす
る。これら2つのマルチプライヤの出力はアダー806
で足し合わされて最終的なビット配分情報となって、出
力端子807から出力される。 【0066】次に、図10には、上記図4の圧縮符号化
回路に対応する伸張復号化回路の構成を示す。 【0067】この図10において、各帯域の量子化され
たMDCT係数は、入力端子122、124、126に
与えられ、使用されたブロックサイズ情報は、入力端子
123、125、127に与えられる。復号化回路11
6、117、118では適応ビット配分情報を用いてビ
ット割当を解除する。 【0068】次に、IMDCT回路113、114、1
15では周波数領域の信号が時間領域の信号に変換され
る。これらの部分帯域の時間領域信号は、IQMF回路
112、111により、全体域信号に復号化される。そ
の後、IQMF回路111,112で帯域合成がなさ
れ、出力端子110から出力される。 【0069】 【発明の効果】上述したように、本発明の多層符号化装
置においては、第1の符号化手段で各チャネルのディジ
タルオーディオ信号を圧縮符号化した後、この第1の符
号化手段の出力符号化信号に対して、さらに第2の符号
化手段によってチャネル毎のスペクトラルエンベロープ
に基づいて、各チャネルにビット配分を行って符号化
ことにより、チャネル間のビット配分と高圧縮率を可
能としている。
【図面の簡単な説明】 【図1】本発明実施例の多層符号化装置の概略構成を示
すブロック回路図である。 【図2】8チャネルディジタルサラウンドシステムにお
けるスピーカの配置を説明するための図である。 【図3】チャネル間クロストークを行う主要構成要素の
概略構成を示すブロック回路図である。 【図4】本実施例の圧縮符号化回路の構成例を示すブロ
ック回路図である。 【図5】圧縮符号化回路での信号の周波数及び時間分割
を示す図である。 【図6】情報信号の大きさ及び聴覚許容雑音スペクトル
の2者を用いたビット配分手法を実現する構成を示すブ
ロック回路図である。 【図7】許容雑音レベルを求める構成を示すブロック回
路図である。 【図8】各帯域の信号レベルによるマスキングスレショ
ールドの例を示す図である。 【図9】情報スペクトル、マスキングスレショールド、
最小可聴限を示す図である。 【図10】本実施例の圧縮符号化回路に対応する伸張復
号化回路の構成例を示すブロック回路図である。 【符号の説明】 2021 〜202n ・・・圧縮符号化回路 2031 〜203n ・・・エントロピィ符号化回路 2041 〜204n ・・・サブ情報圧縮回路 2051 〜205n ・・・適応量子化回路 206・・・マルチプレクサ 208・・・Logスペクトラルエンベロープ検出回路 209・・・分配決定回路 221・・・ローパスフィルタ 222・・・ハイパスフィルタ 223・・・加算回路 11,12・・・・・・・・帯域分割フィルタ 13,14,15・・・・・MDCT回路 16,17,18・・・・・適応ビット配分符号化回路 19,20,21・・・・・ブロックサイズ決定回路 22,24,26・・・・・符号化出力端子 23,25,27・・・・・ブロックサイズ情報出力端
子 116,117,118・・・適応ビット配分復号化回
路 113,114,115・・・IMDCT回路 112,111・・・IQMF回路 520・・・許容雑音算出回路 521・・・許容雑音算出回路入力端子 522・・・帯域毎のエネルギ検出回路 523・・・畳込みフィルタ回路 524・・・引算器 525・・・n−ai関数発生回路 526・・・割算器 527・・・合成回路 528・・・減算器 530・・・許容雑音補正回路 532・・・最小可聴カーブ発生回路 533・・・補正情報出力回路 801・・・MDCT回路出力端子 802・・・使用可能総ビット発生回路 803・・・帯域毎のエネルギ算出回路 804・・・エネルギ依存のビット配分回路 805・・・聴覚許容雑音レベル依存のビット配分回路 806・・・アダー 807・・・各帯域のビット割当量出力端子 808・・・スペクトルの滑らかさ算出回路 809・・・ビット分割率決定回路 811、812・・・マルチプライヤ

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 複数チャネルのディジタルオーディオ信
    号を多層符号化する多層符号化装置において、 各チャネルのディジタルオーディオ信号が入力され、当
    該ディジタルオーディオ信号を圧縮符号化する第1の符
    号化手段と、 上記第1の符号化手段の出力符号化信号が供給され、チ
    ャネル毎のスペクトラルエンベロープに基づいて、各チ
    ャネルにビット配分を行って符号化する第2の符号化手
    段とを有してなることを特徴とする多層符号化装置。
JP30689893A 1993-12-07 1993-12-07 多層符号化装置 Expired - Fee Related JP3404837B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP30689893A JP3404837B2 (ja) 1993-12-07 1993-12-07 多層符号化装置
PCT/US1994/014267 WO1995016333A1 (en) 1993-12-07 1994-12-07 Method and apparatus for compressing, method for transmitting, and method and apparatus for expanding compressed multi-channel sound signals, and recording medium for compressed multi-channel sound signals
JP7516380A JPH09500252A (ja) 1993-12-07 1994-12-07 圧縮方法及び装置、伝送方法、マルチチャンネル圧縮音声信号の伸長方法及び装置、並びにマルチチャンネル圧縮音声信号の記録媒体
CN94191534A CN1119902A (zh) 1993-12-07 1994-12-07 用于压缩的方法和装置,用于传输的方法以及用于扩展被压缩多声道声音信号的方法和装置,和用于被压缩多声道声音信号的记录媒体
KR1019950703323A KR960701577A (ko) 1993-12-07 1994-12-07 압축 방법 및 장치, 전송 방법, 압축된 멀티-채널 음성 신호 확장 방법 및 장치, 및 압축된 멀티-채널 음성 신호용 기록 매체(Method and apparatus for compressing, method for transmitting, and method and apparatus for expanding compressed multi-channel sound signals, and recording medium for compressed multi-channel sound signals)
EP95905899A EP0682850A1 (en) 1993-12-07 1994-12-07 Method and apparatus for compressing, method for transmitting, and method and apparatus for expanding compressed multi-channel sound signals, and recording medium for compressed multi-channel sound signals
US08/446,689 US5873065A (en) 1993-12-07 1994-12-07 Two-stage compression and expansion of coupling processed multi-channel sound signals for transmission and recording

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30689893A JP3404837B2 (ja) 1993-12-07 1993-12-07 多層符号化装置

Publications (2)

Publication Number Publication Date
JPH07160292A JPH07160292A (ja) 1995-06-23
JP3404837B2 true JP3404837B2 (ja) 2003-05-12

Family

ID=17962594

Family Applications (2)

Application Number Title Priority Date Filing Date
JP30689893A Expired - Fee Related JP3404837B2 (ja) 1993-12-07 1993-12-07 多層符号化装置
JP7516380A Ceased JPH09500252A (ja) 1993-12-07 1994-12-07 圧縮方法及び装置、伝送方法、マルチチャンネル圧縮音声信号の伸長方法及び装置、並びにマルチチャンネル圧縮音声信号の記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP7516380A Ceased JPH09500252A (ja) 1993-12-07 1994-12-07 圧縮方法及び装置、伝送方法、マルチチャンネル圧縮音声信号の伸長方法及び装置、並びにマルチチャンネル圧縮音声信号の記録媒体

Country Status (6)

Country Link
US (1) US5873065A (ja)
EP (1) EP0682850A1 (ja)
JP (2) JP3404837B2 (ja)
KR (1) KR960701577A (ja)
CN (1) CN1119902A (ja)
WO (1) WO1995016333A1 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050259833A1 (en) * 1993-02-23 2005-11-24 Scarpino Frank A Frequency responses, apparatus and methods for the harmonic enhancement of audio signals
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US8908872B2 (en) 1996-06-07 2014-12-09 That Corporation BTSC encoder
US6178405B1 (en) * 1996-11-18 2001-01-23 Innomedia Pte Ltd. Concatenation compression method
KR100251453B1 (ko) 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
JP3925993B2 (ja) * 1997-08-29 2007-06-06 パイオニア株式会社 信号処理装置
US6055502A (en) * 1997-09-27 2000-04-25 Ati Technologies, Inc. Adaptive audio signal compression computer system and method
JP3248679B2 (ja) * 1997-11-21 2002-01-21 日本ビクター株式会社 ディスク再生装置
WO1999033194A1 (en) * 1997-12-19 1999-07-01 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for phase estimation in a transform coder for high quality audio
DE69711102T2 (de) * 1997-12-27 2002-11-07 Stmicroelectronics Asia Pacific Pte Ltd., Singapur/Singapore Verfahren und gerät zur schätzung von koppelparametern in einem transformationskodierer für hochwertige tonsignale
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
DE60132853D1 (de) * 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
US7298852B2 (en) * 2001-07-11 2007-11-20 American Technology Corporation Dynamic power sharing in a multi-channel sound system
US8692695B2 (en) 2000-10-03 2014-04-08 Realtime Data, Llc Methods for encoding and decoding data
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
EP1206043B1 (en) * 2000-11-08 2009-12-23 Sony Deutschland GmbH Noise reduction in a stereo receiver
US7386046B2 (en) 2001-02-13 2008-06-10 Realtime Data Llc Bandwidth sensitive data compression and decompression
US20020152262A1 (en) * 2001-04-17 2002-10-17 Jed Arkin Method and system for preventing the infringement of intellectual property rights
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
ATE288617T1 (de) 2001-11-29 2005-02-15 Coding Tech Ab Wiederherstellung von hochfrequenzkomponenten
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
JP2004309921A (ja) 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
WO2005083889A1 (fr) * 2004-01-30 2005-09-09 France Telecom Quantification vectorielle en dimension et resolution variables
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
EP2632165B1 (en) 2007-01-12 2015-09-30 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
CA2814070A1 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source
US9204203B2 (en) 2011-04-07 2015-12-01 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN102982805B (zh) * 2012-12-27 2014-11-19 北京理工大学 一种基于张量分解的多声道音频信号压缩方法
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
CN104510492A (zh) * 2013-10-06 2015-04-15 吴伟 不可听信号的听诊方法及装置
JP2015149690A (ja) * 2014-02-10 2015-08-20 ソニー株式会社 信号処理装置および方法
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
JP6680029B2 (ja) * 2016-03-24 2020-04-15 ヤマハ株式会社 音響処理方法および音響処理装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5539829A (en) * 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
EP0405591B1 (en) * 1989-06-30 1997-10-01 Nec Corporation Varaible length block coding with changing characteristics of input samples
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
EP0525809B1 (en) * 1991-08-02 2001-12-05 Sony Corporation Digital encoder with dynamic quantization bit allocation
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
DE4136825C1 (ja) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4217276C1 (ja) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
JP3498375B2 (ja) * 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置

Also Published As

Publication number Publication date
JPH07160292A (ja) 1995-06-23
EP0682850A1 (en) 1995-11-22
KR960701577A (ko) 1996-02-24
WO1995016333A1 (en) 1995-06-15
CN1119902A (zh) 1996-04-03
US5873065A (en) 1999-02-16
JPH09500252A (ja) 1997-01-07

Similar Documents

Publication Publication Date Title
JP3404837B2 (ja) 多層符号化装置
JP3278900B2 (ja) データ符号化装置及び方法
JP3277679B2 (ja) 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
KR100310216B1 (ko) 다중채널오디오신호를위한코딩장치또는방법
KR100339324B1 (ko) 고능률부호화방법,고능률부호의복호화방법,고능률부호의부호화장치,고능률부호의복호화장치,및고능률부호화.복호화시스템
JP3397001B2 (ja) 符号化方法及び装置、復号化装置、並びに記録媒体
WO1995013660A1 (fr) Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
JPH0816195A (ja) ディジタルオーディオ符号化方法及び装置
JP3227942B2 (ja) 高能率符号化装置
JPH0846517A (ja) 高能率符号化及び復号化システム
US20010047256A1 (en) Multi-format recording medium
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
JP3318824B2 (ja) デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JP3227948B2 (ja) 復号化装置
JP3362476B2 (ja) 高能率符号化装置及びインタフェース装置
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JPH07161140A (ja) ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
JP3227945B2 (ja) 符号化装置
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
JP3341448B2 (ja) マルチチャンネルオーディオデータの高能率符号化方法
JPH07161142A (ja) 記録方法、記録媒体、及び再生方法
JP3141853B2 (ja) オーディオ信号処理方法
JPH0591062A (ja) オーデイオ信号処理方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030204

LAPS Cancellation because of no payment of annual fees