JP3387084B2 - Recording medium, audio decoding device - Google Patents
Recording medium, audio decoding deviceInfo
- Publication number
- JP3387084B2 JP3387084B2 JP32595799A JP32595799A JP3387084B2 JP 3387084 B2 JP3387084 B2 JP 3387084B2 JP 32595799 A JP32595799 A JP 32595799A JP 32595799 A JP32595799 A JP 32595799A JP 3387084 B2 JP3387084 B2 JP 3387084B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- channel
- audio signal
- synchronization information
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000000872 buffer Substances 0.000 claims description 25
- 230000005236 sound signal Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 21
- 238000013139 quantization Methods 0.000 claims description 15
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000006837 decompression Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 24
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- IWYDHOAUDWTVEP-UHFFFAOYSA-N mandelic acid Chemical compound OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000012856 packing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を圧縮して記録した記録媒体及び音声復号装置
に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recording medium in which a multi-channel audio signal is compressed and recorded, and an audio decoding device .
【0002】[0002]
【従来の技術】音声信号を圧縮する方法として、本発明
者は先の出願(特願平9−289159号)において1
チャネルの原デジタル音声信号に対して、特性が異なる
複数の予測器により時間領域における過去の信号から現
在の信号の複数の線形予測値を算出し、原デジタル音声
信号と、この複数の線形予測値から予測器毎の予測残差
を算出し、予測残差の最小値を選択する予測符号化方法
を提案している。2. Description of the Related Art As a method for compressing an audio signal, the present inventor has described in 1
For the original digital audio signal of the channel, multiple predictors with different characteristics are used to calculate multiple linear prediction values of the current signal from past signals in the time domain, and the original digital audio signal and the multiple linear prediction values. We propose a predictive coding method that calculates the prediction residual for each predictor and selects the minimum value of the prediction residual.
【0003】なお、上記方法では原デジタル音声信号が
サンプリング周波数=96kHz、量子化ビット数=2
0ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のDVDオーディオディスクではこの2
倍のサンプリング周波数(=192kHz)が使用さ
れ、また、量子化ビット数も24ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング
周波数と量子化ビット数はチャネル毎に異なることもあ
る。In the above method, the original digital audio signal has a sampling frequency = 96 kHz and a quantization bit number = 2.
Although it is possible to obtain a certain degree of compression effect when the number of bits is about 0, in recent DVD audio discs, this 2
The double sampling frequency (= 192 kHz) is used, and the number of quantization bits tends to be 24 bits. Further, the sampling frequency and the number of quantization bits in the multi-channel may be different for each channel.
【0004】[0004]
【発明が解決しようとする課題】ところで、予測符号化
方式のような圧縮方式は圧縮率が可変(VBR:バリア
ブル・ビット・レート)であるので、マルチチャネルの
音声信号を予測符号化するとチャネル毎のデータ量が時
間的に大きく変化する。また、このようなデータを伝送
する場合には、チャネル毎にパラレルではなくデータス
トリームとして伝送される。したがって、再生側(デコ
ード側)においてこのような可変長のデータストリーム
をチャネル毎に同期して再生(プレゼンテーション)可
能にする必要がある。By the way, since a compression method such as a predictive coding method has a variable compression rate (VBR: variable bit rate), when predictive coding a multi-channel audio signal, The data amount of changes greatly with time. Further, when transmitting such data, it is transmitted not as parallel for each channel but as a data stream. Therefore, it is necessary for the reproducing side (decoding side) to be capable of reproducing (presenting) such a variable-length data stream in synchronization with each channel.
【0005】そこで本発明は、マルチチャネルの音声信
号を圧縮符号化する場合に再生側の復号効率を改善する
ことができるデータを記録した記録媒体及び音声復号装
置を提供することを目的とする。Therefore, the present invention is directed to a recording medium and a voice decoding device which record data capable of improving the decoding efficiency on the reproducing side when compressing and coding a multi-channel voice signal.
The purpose is to provide storage .
【0006】本発明は上記目的を達成するために、以下
の1)〜4)の手段からなるものである。すなわち、In order to achieve the above object, the present invention comprises the following means 1 ) to 4) . That is,
【0007】1)あるサンプリング周波数と量子化ビッ
ト数のマルチチャネルの音声信号を、そのままのチャネ
ル又は互いに相関をとったチャネル毎に、入力される音
声信号に応答して先頭サンプル値を得ると共に、特性が
異なる複数の線形予測方法により時間領域の過去から現
在の信号の線形予測値がそれぞれ予測され、その予測さ
れる線形予測値と前記音声信号とから得られる予測残差
が最小となるような線形予測方法を選択して予測符号化
するステップと、前記ステップにより選択されたチャネ
ル毎の線形予測方法と予測残差と所定の先頭サンプル値
を含む予測符号化データを格納するサブパケットと、再
生側において元のアナログ音声信号に復元される際に用
いられるサンプリング周波数及び量子化ビット数を含む
同期情報部と、を有するデータ構造にフォーマット化す
るステップとにより、前記データ構造にフォーマット化
されたデータが記録され、その記録されたデータうち前
記予測符号化データは元の音声信号を復元するために用
いられる予測値を算出するためのデータとして記録され
ていることを特徴とする記録媒体。
2)請求項1記載のサブパケット及び同期情報部と、更
にSCR情報を含むパックヘッダと、を含んで一つのパ
ックとしてフォーマット化されて記録されると共に、前
記SCR情報は、前記パックを再生する際の時間管理情
報として用いられることを特徴とする記録媒体。
3)請求項1記載の記録媒体に記録されたデータから元
のマルチチャネルの音声信号を復号する音声復号装置で
あって、前記データ構造をサブパケットと同期情報部に
分離する手段と、前記サブパケット内の圧縮データをチ
ャネル毎に伸長する伸長手段と、前記チャネル毎に伸長
された音声データから元のマルチチャネルの伸長された
音声信号に変換する手段と、前記変換されたマルチチャ
ネルの音声データを前記同期情報部内のサンプリング周
波数及び量子化ビット数に基づいてアナログ音声信号に
変換する手段とを、有する音声復号装置。
4)請求項2記載の記録媒体に記録されたデータから元
のマルチチャネルの音声信号を復号する音声復号装置で
あって、前記ヘッダに含まれるSCR情報を分離する第
1の分離手段と、前記分離されたSCR情報に基づいて
前記サブパケット及び同期情報部を保持するためのバッ
ファと、前記バッファに保持された前記サブパケットと
同期情報部とを分離する第2の分離手段と、前記同期情
報部内の識別子に基づいて前記サブパケット内の圧縮デ
ータをチャネル毎に伸長する伸長手段と、前記チャネル
毎に伸長された音声データから元のマルチチャネルの伸
長された音声信号に変換する手段と、前記変換されたマ
ルチチャネルの音声データを前記同期情報部内のサンプ
リング周波数及び量子化ビット数に基づいてアナログ音
声信号に変換する手段とを、有する音声復号装置。1) A multi-channel audio signal having a certain sampling frequency and a quantized bit number is obtained in response to an input audio signal for a channel as it is or for each channel correlated with each other, and a head sample value is obtained. Linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal is minimized. A step of selecting a linear prediction method for predictive coding, a linear prediction method for each channel selected in the step, a subpacket for storing prediction coded data including a prediction residual and a predetermined head sample value, and reproduction A synchronization information part including a sampling frequency and a quantization bit number used when the original analog audio signal is restored on the side, Formatting into a data structure to record the formatted data in the data structure, the predictive coded data of the recorded data is a prediction value used to restore the original audio signal. Recorded as data for calculation
Recording medium characterized Tei Rukoto. 2) The sub-packet and the synchronization information part according to claim 1 and a pack header including SCR information are further formatted and recorded as one pack, and the SCR information reproduces the pack. A recording medium characterized by being used as time management information at the time. 3) A voice decoding device for decoding an original multi-channel voice signal from the data recorded on the recording medium according to claim 1, said means for separating said data structure into a sub-packet and a synchronization information part; Decompression means for decompressing the compressed data in the packet for each channel, means for converting the decompressed audio data for each channel into the original decompressed multi-channel audio signal, and the converted multi-channel audio data To an analog audio signal based on the sampling frequency and the number of quantization bits in the synchronization information section. 4) An audio decoding device for decoding an original multi-channel audio signal from the data recorded on the recording medium according to claim 2, wherein the first separating means separates the SCR information contained in the header; A buffer for holding the sub-packet and the synchronization information part based on the separated SCR information; a second separating means for separating the sub-packet and the synchronization information part held in the buffer; and the synchronization information. Decompressing means for decompressing the compressed data in the subpacket for each channel based on the identifier in the section; means for converting the decompressed audio data for each channel into an original multichannel decompressed audio signal; The converted multi-channel audio data is converted into an analog audio signal based on the sampling frequency and the number of quantization bits in the synchronization information section. A stage, having speech decoding apparatus.
【0008】[0008]
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明が適用される音声符
号化装置及び音声復号装置の第1の実施形態を示すブロ
ック図、図2は図1の符号化部を詳しく示すブロック
図、図3は図1、図2の符号化部により符号化されたビ
ットストリームを示す説明図、図4はDVDのパックの
フォーマットを示す説明図、図5はDVDのオーディオ
パックのフォーマットを示す説明図、図6は図5のオー
ディオデータエリアのフォーマットを詳しく示す説明
図、図7は図1の復号化部を詳しく示すブロック図、図
8は図7の入力バッファの書き込み/読み出しタイミン
グを示すタイミングチャート、図9はアクセスユニット
毎の圧縮データ量を示す説明図、図10はアクセスユニ
ットとプレゼンテーションユニットを示す説明図であ
る。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. 1 is a block diagram showing a first embodiment of a speech coding apparatus and speech decoding apparatus to which the present invention is applied , FIG. 2 is a block diagram showing the coding unit of FIG. 1 in detail, and FIG. 3 is FIG. 2 is an explanatory diagram showing a bitstream encoded by the encoding unit 2; FIG. 4 is an explanatory diagram showing a DVD pack format; FIG. 5 is an explanatory diagram showing a DVD audio pack format; and FIG. FIG. 7 is an explanatory diagram showing the format of the audio data area in detail, FIG. 7 is a block diagram showing the decoding section of FIG. 1 in detail, FIG. 8 is a timing chart showing the write / read timing of the input buffer of FIG. 7, and FIG. 9 is for each access unit. FIG. 10 is an explanatory diagram showing the amount of compressed data, and FIG. 10 is an explanatory diagram showing an access unit and a presentation unit.
【0009】ここで、マルチチャネル方式としては、例
えば次の4つの方式が知られている。
(1)4チャネル方式 ドルビーサラウンド方式の
ように、前方L、C、Rの3チャネル+後方Sの1チャ
ネルの合計4チャネル
(2)5チャネル方式 ドルビーAC−3方式のS
Wチャネルなしのように、前方L、C、Rの3チャネル
+後方SL、SRの2チャネルの合計5チャネル
(3)6チャネル方式 DTS(Digital Theater
System)方式や、ドルビーAC−3方式のように6チャ
ネル(L、C、R、SW(Lfe)、SL、SR)
(4)8チャネル方式 SDDS(Sony Dynamic D
igital Sound)方式のように、前方L、LC、C、R
C、R、SWの6チャネル+後方SL、SRの2チャネ
ルの合計8チャネルHere, as the multi-channel method, for example, the following four methods are known. (1) 4-channel method Like the Dolby Surround method, a total of 4 channels of 3 channels of front L, C, and R + 1 channel of rear S (2) 5-channel method S of Dolby AC-3 method
A total of 5 channels (3 channels of front L, C, and R + 2 channels of rear SL and SR) (3) 6-channel system DTS (Digital Theater)
System) and 6 channels (L, C, R, SW (Lfe), SL, SR) like the Dolby AC-3 system (4) 8 channel system SDDS (Sony Dynamic D
forward L, LC, C, R, like the igital Sound) method
6 channels of C, R and SW + 2 channels of rear SL and SR, total 8 channels
【0010】図1に示す符号化側の6チャネル(ch)ミ
クス&マトリクス回路1’は、マルチチャネル信号の一
例としてフロントレフト(Lf)、センタ(C)、フロ
ントライト(Rf)、サラウンドレフト(Ls)、サラ
ウンドライト(Rs)及びLfe(Low Frequency Effe
ct)の6chのPCMデータを次式(1)により前方グル
ープに関する2ch「1」、「2」と他のグループに関す
る4ch「3」〜「6」に分類して変換し、2ch「1」、
「2」を第1符号化部2’−1に、また、4ch「3」〜
「6」を第2符号化部2’−2に出力する。
「1」=Lf+Rf
「2」=Lf−Rf
「3」=C−(Ls+Rs)/2
「4」=Ls+Rs
「5」=Ls−Rs
「6」=Lfe−a×C
ただし、0≦a≦1 …(1)The 6-channel (ch) mix & matrix circuit 1'on the encoding side shown in FIG. 1 is a front left (Lf), center (C), front right (Rf), surround left ( Ls), surround light (Rs) and Lfe (Low Frequency Effe)
ct) 6ch PCM data are classified into 2ch “1” and “2” related to the front group and 4ch “3” to “6” related to other groups by the following formula (1), and converted to 2ch “1”,
"2" to the first encoding unit 2'-1 and 4ch "3" to
"6" is output to the second encoding unit 2'-2. “1” = Lf + Rf “2” = Lf−Rf “3” = C− (Ls + Rs) / 2 “4” = Ls + Rs “5” = Ls−Rs “6” = Lfe−a × C where 0 ≦ a ≦ 1 (1)
【0011】符号化部2’を構成する第1及び第2符号
化部2’−1、2’−2はそれぞれ、図2に詳しく示す
ように2ch「1」、「2」と4ch「3」〜「6」のPC
Mデータをチャネル毎に予測符号化し、予測符号化デー
タを図3に示すようなビットストリームで記録媒体5や
衛星回線や電話回線等の通信媒体6を介して復号側に伝
送する。復号側では復号化部3’を構成する第1及び第
2復号化部3’−1、3’−2により、図7に詳しく示
すようにそれぞれ前方グループに関する2ch「1」、
「2」と他のグループに関する4ch「3」〜「6」の予
測符号化データをチャネル毎にPCMデータに復号す
る。As shown in detail in FIG. 2, the first and second encoding units 2'-1, 2'-2 constituting the encoding unit 2'respectively have 2ch "1", "2" and 4ch "3". ] ~ "6" PC
The M data is predictively coded for each channel, and the predictively coded data is transmitted to the decoding side via a recording medium 5 and a communication medium 6 such as a satellite line or a telephone line as a bit stream as shown in FIG. On the decoding side, the first and second decoding units 3′-1 and 3′-2, which constitute the decoding unit 3 ′, respectively, as shown in detail in FIG.
Predicted coded data of 4 channels “3” to “6” related to “2” and other groups is decoded into PCM data for each channel.
【0012】次いでミクス&マトリクス回路4’により
式(1)に基づいて元の6ch(Lf、C、Rf、Ls、
Rs、Lfe)を復元するとともに、この元の6chと係
数mij(i=1,2,j=1,2〜6)により次式
(2)のようにステレオ2chデータ(L、R)を生成す
る。
L=m11・Lf+m12・Rf+m13・C
+m14・Ls+m15・Rs+m16・Lfe
R=m21・Lf+m22・Rf+m23・C
+m24・Ls+m25・Rs+m26・Lfe …(2)Then, based on the equation (1), the original 6ch (Lf, C, Rf, Ls,
Rs, Lfe) is restored, and stereo 2ch data (L, R) is generated by the original 6ch and coefficients mij (i = 1, 2, j = 1, 2 to 6) as shown in the following equation (2). To do. L = m11 ・ Lf + m12 ・ Rf + m13 ・ C + m14 ・ Ls + m15 ・ Rs + m16 ・ Lfe R = m21 ・ Lf + m22 ・ Rf + m23 ・ C + m24 ・ Ls + m25 ・ Rs + m26 ・ Lfe (2)
【0013】図2を参照して符号化部2’−1、2’−
2について詳しく説明する。各ch「1」〜「6」のPC
Mデータは1フレーム毎に1フレームバッファ10に格
納される。そして、1フレームの各ch「1」〜「6」の
サンプルデータがそれぞれ予測回路13D1、13D
2、15D1〜15D4に印加されるとともに、各ch
「1」〜「6」の各フレームの先頭サンプルデータ(後
述のリスタートヘッダ内に格納される)がアンパッキン
グ回路8及びフォーマット化回路19に印加される。ま
た、PCMデータがA/D変換されたときのサンプリン
グ周波数(fs)と量子化ビット数(Qb)がパッキン
グ回路18及びフォーマット化回路19に印加される。
予測回路13D1、13D2、15D1〜15D4はそ
れぞれ、各ch「1」〜「6」のPCMデータに対して、
特性が異なる複数の予測器(不図示)により時間領域に
おける過去の信号から現在の信号の複数の線形予測値を
算出し、次いで原PCMデータと、この複数の線形予測
値から予測器毎の予測残差を算出する。続くバッファ・
選択器14D1、14D2、16D1〜16D4はそれ
ぞれ、予測回路13D1、13D2、15D1〜15D
4により算出された各予測残差を一時記憶して、選択信
号/DTS(デコーディング・タイム・スタンプ)生成
器17により指定されたサブフレーム毎に予測残差の最
小値を選択する。Referring to FIG. 2, coding units 2'-1, 2'-
2 will be described in detail. PC of each channel "1" to "6"
The M data is stored in the frame buffer 10 for each frame. Then, the sample data of each channel “1” to “6” of one frame is input to the prediction circuits 13D1 and 13D, respectively.
2, 15D1 to 15D4 applied to each channel
The leading sample data (stored in a restart header described later) of each frame of “1” to “6” is applied to the unpacking circuit 8 and the formatting circuit 19. The sampling frequency (fs) and the number of quantization bits (Qb) when the PCM data is A / D converted are applied to the packing circuit 18 and the formatting circuit 19.
The prediction circuits 13D1, 13D2, and 15D1 to 15D4 respectively respond to the PCM data of each channel “1” to “6”,
A plurality of predictors (not shown) having different characteristics are used to calculate a plurality of linear prediction values of a current signal from a past signal in the time domain, and then original PCM data and prediction of each predictor from the plurality of linear prediction values. Calculate the residuals. Continued buffer
The selectors 14D1, 14D2, 16D1 to 16D4 are prediction circuits 13D1, 13D2, 15D1 to 15D, respectively.
The prediction residuals calculated in step 4 are temporarily stored, and the minimum value of the prediction residuals is selected for each subframe designated by the selection signal / DTS (decoding time stamp) generator 17.
【0014】選択信号/DTS生成器17は予測残差の
ビット数フラグをパッキング回路18とフォーマット化
回路19に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、式(1)における相関係
数aと、復号化側が入力バッファ22a(図7)からス
トリームデータを取り出す時間を示すDTSをフォーマ
ット化回路19に対して印加する。パッキング回路18
はバッファ・選択器14D1、14D2、16D1〜1
6D4により選択された6ch分の予測残差を、選択信号
/DTS生成器17により指定されたビット数フラグに
基づいて指定ビット数でパッキングする。またPTS生
成器17cは、復号化側が出力バッファ110(図7)
からPCMデータを取り出す時間を示すPTS(プレゼ
ンテーション・タイム・スタンプ)を生成してフォーマ
ット化回路19に出力する。The selection signal / DTS generator 17 applies a bit number flag of the prediction residual to the packing circuit 18 and the formatting circuit 19, and a predictor selection flag indicating a predictor with the minimum prediction residual. , The correlation coefficient a in Expression (1) and the DTS indicating the time at which the decoding side takes out the stream data from the input buffer 22a (FIG. 7) are applied to the formatting circuit 19. Packing circuit 18
Is the buffer / selector 14D1, 14D2, 16D1-1
The prediction residuals for 6 channels selected by 6D4 are packed with the specified number of bits based on the bit number flag specified by the selection signal / DTS generator 17. The decoding side of the PTS generator 17c is the output buffer 110 (FIG. 7).
PTS (Presentation Time Stamp) indicating the time to take out the PCM data is generated and output to the formatting circuit 19.
【0015】続くフォーマット化回路19は図3〜図6
に示すようなユーザデータにフォーマット化する。図3
に示すユーザデータ(サブパケット)は、前方グループ
に関する2ch「1」、「2」の予測符号化データを含む
可変レートビットストリーム(サブストリーム)BS0
と、他のグループに関する4ch「3」〜「6」の予測符
号化データを含む可変レートビットストリーム(サブス
トリーム)BS1と、サブストリームBS0、BS1の
前に設けられたビットストリームヘッダ(リスタートヘ
ッダ)により構成されている。また、サブストリームB
S0、BS1の1フレーム分は
・フレームヘッダと、
・各ch「1」〜「6」の1フレームの先頭サンプルデー
タと、
・各ch「1」〜「6」のサブフレーム毎の予測器選択フ
ラグと、
・各ch「1」〜「6」のサブフレーム毎のビット数フラ
グと、
・各ch「1」〜「6」の予測残差データ列(可変ビット
数)と、
・ch「6」の係数aとが、
多重化されている。このような予測符号化によれば、原
信号が例えばサンプリング周波数(fs)=96kH
z、量子化ビット数(Qb)=24ビット、6チャネル
の場合、71%の圧縮率を実現することができる。The following formatting circuit 19 is shown in FIGS.
Format the user data as shown in. Figure 3
The user data (sub-packet) shown in (1) is a variable rate bit stream (sub-stream) BS0 including predictive encoded data of 2ch “1” and “2” related to the front group.
And a variable rate bitstream (substream) BS1 including predictive coded data of 4ch "3" to "6" relating to other groups, and a bitstream header (restart header) provided before the substreams BS0 and BS1. ). Also, substream B
For one frame of S0 and BS1, a frame header, head sample data of one frame of each channel "1" to "6", and a predictor selection for each subframe of each channel "1" to "6" A flag, a bit number flag for each subframe of each ch “1” to “6”, a prediction residual data string (variable number of bits) of each ch “1” to “6”, and a ch “6” And the coefficient a of “. According to such predictive coding, the original signal has a sampling frequency (fs) = 96 kHz, for example.
In the case of z, the number of quantization bits (Qb) = 24 bits, and 6 channels, a compression rate of 71% can be realized.
【0016】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてDVDオーディオディスク
に記録する場合には、図4に示すオーディオ(A)パッ
クにパッキングされる。このパックは2034バイトの
ユーザデータ(Aパケット、Vパケット)に対して4バ
イトのパックスタート情報と、6バイトのSCR(Syst
em Clock Reference:システム時刻基準参照値)情報
と、3バイトのMux レート(rate)情報と1バイトのス
タッフィングの合計14バイトのパックヘッダが付加さ
れて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
先頭パックでは「1」として同一タイトル内で連続とす
ることにより同一タイトル内のAパックの時間を管理す
ることができる。When the variable rate bit stream data predictively coded by the coding units 2'-1 and 2'-2 shown in FIG. 2 is recorded on a DVD audio disc as an example of a recording medium, FIG. The audio (A) pack shown is packed. This pack includes pack start information of 4 bytes for user data (A packet and V packet) of 2034 bytes, and SCR (Syst of 6 bytes).
em Clock Reference: System time reference reference value information, 3-byte Mux rate information, and 1-byte stuffing, a total of 14-byte pack header is added (1 pack = 2048 bytes in total). . In this case, the SCR information, which is the time stamp,
In the first pack, "1" is set to be consecutive within the same title, so that the time of the A pack in the same title can be managed.
【0017】圧縮PCMのAパケットは図5に詳しく示
すように、9〜22バイトのパケットヘッダと、圧縮P
CMのプライベートヘッダと、図3に示すフォーマット
の1ないし2015バイトのオーディオデータ(圧縮P
CM)により構成されている。そして、DTSとPTS
は図5のパケットヘッダ内に(具体的にはパケットヘッ
ダの10〜14バイト目にPTSが、15〜19バイト
目にDTSが)セットされる。圧縮PCMのプライベー
トヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・4バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、より構成
されている。As shown in detail in FIG. 5, the compressed PCM A packet has a packet header of 9 to 22 bytes and a compressed P packet.
CM private header and 1 to 2015 bytes of audio data in the format shown in FIG. 3 (compressed P
CM). And DTS and PTS
Is set in the packet header of FIG. 5 (specifically, PTS is at the 10th to 14th bytes of the packet header and DTS is at the 15th to 19th bytes). The private header of the compressed PCM includes: 1-byte substream ID, 2-byte UPC / EAN-ISRC (Universal Pr
oduct Code / European Article Number-International S
tandard Recording Code) number and UPC / EAN-
ISRC data, 1-byte private header length, 2-byte first access unit pointer, 4-byte audio data information (ADI), and 0-7 bytes of stuffing bytes. ing.
【0018】そして、ADI内に1秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、1秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに1
バイトでセットされる。具体的には、ADIの1バイト
目に前方アクセスユニット・サーチポインタが、8バイ
ト目に後方アクセスユニット・サーチポインタがセット
される。このようにADIは、圧縮PCMでは4バイト
に減少させるためオーディオデータを2015バイトま
で収納できる。The forward access unit search pointer for searching the access unit one second later and the rear access unit search pointer for searching the access unit one second before are both 1 in the ADI.
Set in bytes. Specifically, the forward access unit search pointer is set at the 1st byte of the ADI and the backward access unit search pointer is set at the 8th byte. In this way, the ADI can store up to 2015 bytes of audio data because the compressed PCM is reduced to 4 bytes.
【0019】図5に示す圧縮PCM(PPCM)のオー
ディオパケットにおけるオーディオデータエリアは、図
6に示すように複数のPPCMアクセスユニットにより
構成され、PPCMアクセスユニットはPPCMシンク
情報とサブパケットにより構成されている。最初のPP
CMアクセスユニット内のサブパケットは、ディレクト
リと、サブストリーム「BS0」と、CRC(1バイト
又は2バイト)と、サブストリーム「BS1」と、CR
Cとエクストラ情報により構成され、サブストリーム
「BS0」、「BS1」はPPCMブロックのみにより
構成されている。2番目以降のPPCMアクセスユニッ
ト内のサブパケットも、ディレクトリと、サブストリー
ム「BS0」と、CRCと、サブストリーム「BS1」
と、CRCとエクストラ情報により構成され、サブスト
リーム「BS0」、「BS1」はリスタートヘッダとP
PCMブロックにより構成されている。そして、エクス
トラ情報は、少なくとも、サイズ調整機能を有してい
る。すなわち、入来データが固定レート(CBR)の場
合には、上述したようにサンプリング周波数fsによっ
て1パケット当たりのサンプリング数が40,80,1
60のいずれかに定められており、そのため、決定され
たサンプリング数によっては1パケット当たりのデータ
長とサブパケットのサイズとが合わない場合があり、そ
れをサブパケットのサイズに合わせるために、例えば、
0,0…等を付加してサイズ調整を行う。また、このサ
イズ調整用のデータはテキストデータ等を利用すること
も可能である。The audio data area in the compressed PCM (PPCM) audio packet shown in FIG. 5 is composed of a plurality of PPCM access units as shown in FIG. 6, and the PPCM access unit is composed of PPCM sync information and subpackets. There is. First PP
The subpacket in the CM access unit includes a directory, a substream "BS0", a CRC (1 byte or 2 bytes), a substream "BS1", and a CR.
The substreams "BS0" and "BS1" are composed of C and extra information, and are composed of only PPCM blocks. The subpackets in the second and subsequent PPCM access units are also the directory, the substream "BS0", the CRC, and the substream "BS1".
And the CRC and the extra information, the sub-streams “BS0” and “BS1” have a restart header and P
It is composed of PCM blocks. The extra information has at least a size adjusting function. That is, when the incoming data has a fixed rate (CBR), the sampling number per packet is 40, 80, 1 depending on the sampling frequency fs as described above.
It is set to any of 60, and therefore the data length per packet and the size of the subpacket may not match depending on the determined number of samplings. To match it with the size of the subpacket, for example, ,
Size adjustment is performed by adding 0, 0 ... Further, text data or the like can be used as the size adjusting data.
【0020】PPCMシンク情報(以下、同期情報とも
いう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数
fsに応じて40、80又は160が選択される。
・データレートがVBRの場合には「0」(サブパケッ
ト内のデータがVBRの圧縮データであることを示す識
別子)、CBRの場合には「1」(サブパケット内のデ
ータが固定レートであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報The PPCM sync information (hereinafter also referred to as synchronization information) includes the following information. Number of samples per packet: 40, 80 or 160 is selected according to the sampling frequency fs. “0” (data indicating that the data in the subpacket is compressed data of VBR) when the data rate is VBR, and “1” (the data in the subpacket has a fixed rate) when the data rate is CBR Identifier indicating that) -sampling frequency fs and quantization bit number Qb-channel allocation information
【0021】次に図7を参照して復号化部3’−1、
3’−2について説明する。上記フォーマットの可変レ
ートビットストリームデータBS0、BS1は、デフォ
ーマット化回路21により分離される。そして、各ch
「1」〜「6」の1フレームの先頭サンプルデータと予
測器選択フラグはそれぞれ予測回路24D1、24D
2、23D1〜23D4に印加され、各ch「1」〜
「6」のビット数フラグはアンパッキング回路22に印
加される。また、SCRと、DTSと予測残差データ列
は入力バッファ22aに印加され、PTSは出力バッフ
ァ110に印加される。また、データレートがVBRか
CBRかを示す識別子は各予測器24D1、24D2、
23D1、23D2、23D3、23D4に印加され、
これらにおいて識別子に応じた入出力データの処理プロ
グラムが決定されて処理されることになる。VBRであ
る場合には処理プログラムを切り換えると共に入力デー
タを毎回ロードする必要があり処理に時間を要すること
になるが、CBRの場合には固定レートであることから
処理プログラムを切り換える必要がなく処理が速くな
る。また、サンプリング周波数fs及び量子化ビット数
QbはD/A変換器102に印加される。ここで、予測
回路24D1、24D2、23D1〜23D4内の複数
の予測器(不図示)はそれぞれ、符号化側の予測回路1
3D1、13D2、15D1〜15D4内の複数の予測
器と同一の特性であり、予測器選択フラグにより同一特
性のものが選択される。Next, referring to FIG. 7, the decoding unit 3'-1,
3′-2 will be described. The variable rate bit stream data BS0 and BS1 in the above format are separated by the deformatting circuit 21. And each ch
The leading sample data of one frame of "1" to "6" and the predictor selection flag are prediction circuits 24D1 and 24D, respectively.
2, 23D1 to 23D4 are applied to each channel “1” to
The bit number flag of “6” is applied to the unpacking circuit 22. The SCR, DTS, and prediction residual data string are applied to the input buffer 22 a, and PTS is applied to the output buffer 110. The identifiers indicating whether the data rate is VBR or CBR are the predictors 24D1 and 24D2,
Applied to 23D1, 23D2, 23D3, 23D4,
In these, the processing program of the input / output data according to the identifier is determined and processed. In the case of VBR, it is necessary to switch the processing program and load the input data every time, and thus it takes time to process, but in the case of CBR, since the fixed rate is used, the processing program does not need to be switched and the processing is performed. Get faster Further, the sampling frequency fs and the quantization bit number Qb are applied to the D / A converter 102. Here, the plurality of predictors (not shown) in the prediction circuits 24D1, 24D2, and 23D1 to 23D4 are the prediction circuits 1 on the encoding side, respectively.
The characteristics are the same as those of the plurality of predictors in 3D1, 13D2, 15D1 to 15D4, and those having the same characteristics are selected by the predictor selection flag.
【0022】デフォーマット化回路21により、最初オ
ーディオパックからオーディオパケットが分離され、次
にオーディオパケットからストリームデータ(予測残差
データ列)が分離されてビットストリームBS0とBS
1が取り出される。またSCRが取り出され、図8に示
すようにSCRによるタイミングにしたがってアクセス
ユニット毎に入力バッファ22aに取り込まれて蓄積さ
れる。ここで、1つのアクセスユニットのデータ量は、
例えばfs=96kHzの場合には(1/96kHz)
秒分であるが、図9、図10(a)に詳しく示すように
可変長である。そして、入力バッファ22aに蓄積され
たストリームデータはDTSに基づいてFIFOで読み
出されてアンパッキング回路22に印加される。The deformatting circuit 21 first separates the audio packet from the audio pack, and then separates the stream data (prediction residual data string) from the audio packet to form the bit streams BS0 and BS.
1 is taken out. Further, the SCR is taken out, and taken in and stored in the input buffer 22a for each access unit according to the timing by the SCR as shown in FIG. Here, the data amount of one access unit is
For example, in the case of fs = 96 kHz (1/96 kHz)
Although it is seconds, it has a variable length as shown in detail in FIGS. 9 and 10A. Then, the stream data accumulated in the input buffer 22 a is read by the FIFO based on the DTS and applied to the unpacking circuit 22.
【0023】アンパッキング回路22は各ch「1」〜
「6」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路24D1、24D2、23
D1〜23D4に出力する。予測回路24D1、24D
2、23D1〜23D4ではそれぞれ、アンパッキング
回路22からの各ch「1」〜「6」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプルデータを基準として各サンプルのPC
Mデータが算出されて出力バッファ110に蓄積され
る。出力バッファ110に蓄積されたPCMデータはP
TSに基づいて読み出されて出力され、したがって、図
10(a)に示す可変長のアクセスユニットが伸長され
て、図10(b)に示す一定長のプレゼンテーションユ
ニットが出力される。The unpacking circuit 22 has channels "1" to
The prediction residual data string of "6" is separated based on each bit number flag, and the prediction circuits 24D1, 24D2, and 23 are respectively separated.
Output to D1 to D4. Prediction circuits 24D1 and 24D
2, 23D1 to 23D4, the current prediction residual data of each channel “1” to “6” from the unpacking circuit 22 and each of the plurality of internal predictors selected by the predictor selection flag. The previous predicted value predicted by one is added to calculate the current predicted value, and then the PC of each sample is based on the first sample data of one frame as a reference.
M data is calculated and stored in the output buffer 110. The PCM data stored in the output buffer 110 is P
It is read and output based on the TS, and thus the variable-length access unit shown in FIG. 10A is expanded and the constant-length presentation unit shown in FIG. 10B is output.
【0024】また、PPCMシンク情報内のサンプリン
グ周波数fs及び量子化ビット数Qbに基づいて、PC
MデータがD/A変換器102によりアナログ信号に変
換される。また、同時にPPCMシンク情報においてC
BRの識別子が検出され、ディレクトリ内のエクストラ
データの位置が検出されて、更に例えば0,0…のデー
タや、テキストデータ等のサイズ調整用のエクストラデ
ータが検出されると、それがテキストデータである場合
にはエクストラデータをこのアンパッキング回路22か
ら図示しないテキストデータデコード回路に供給し、そ
こで、デコード処理をしてテキストデータとして取り出
し、出力バッファ110を通じて出力されることにな
る。また一方、エクストラデータが0,0…データであ
った場合には、何の処理も施されないようになってい
る。また、テキストデータデコーダ回路が用意されてい
ない場合には、この処理はパスされる。また、ここで、
操作部101を介してサーチ再生が指示された場合に
は、制御部100により図5に示す前方アクセスユニッ
ト・サーチポインタ(1秒先)と後方アクセスユニット
・サーチポインタ(1秒前)に基づいてアクセスユニッ
トを再生する。このサーチポインタとしては、1秒先、
1秒前の代わりに2秒先、2秒前のものでよい。Further, based on the sampling frequency fs and the quantization bit number Qb in the PPCM sync information, the PC
The M data is converted into an analog signal by the D / A converter 102. At the same time, C in the PPCM sync information
When the BR identifier is detected, the position of the extra data in the directory is detected, and further, for example, data of 0, 0 ... Or extra data for size adjustment such as text data is detected, it is converted to text data. In some cases, the extra data is supplied from the unpacking circuit 22 to a text data decoding circuit (not shown), where it is subjected to decoding processing to be taken out as text data and output through the output buffer 110. On the other hand, if the extra data is 0, 0 ... Data, no processing is performed. If the text data decoder circuit is not prepared, this process is skipped. Also here
When the search reproduction is instructed through the operation unit 101, based on the front access unit search pointer (1 second ahead) and the rear access unit search pointer (1 second before) shown in FIG. Regenerate the access unit. For this search pointer, 1 second ahead,
Instead of 1 second ago, it may be 2 seconds ahead or 2 seconds ago.
【0025】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タをネットワークを介して伝送する場合には、符号化側
では図11に示すように伝送用にパケット化し(ステッ
プS41)、次いでパケットヘッダを付与し(ステップ
S42)、次いでこのパケットをネットワーク上に送り
出す(ステップS43)。When variable rate bit stream data predictively coded by the coding units 2'-1, 2'-2 shown in FIG. 2 are transmitted via a network, the coding side is as shown in FIG. Is packetized for transmission (step S41), a packet header is added (step S42), and this packet is then sent out on the network (step S43).
【0026】復号側では図12(A)に示すようにヘッ
ダを除去し(ステップS51)、次いでデータを復元し
(ステップS52)、次いでこのデータをメモリに格納
して復号を待つ(ステップS53)。そして、復号を行
う場合には図12(B)に示すように、デフォーマット
化を行い(ステップS61)、次いで入力バッファ22
aの入出力制御を行い(ステップS62)、次いでアン
パッキングを行う(ステップS63)。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い(ステップS64)、次いで出力バッフ
ァ110の入出力制御を行い(ステップS65)、次い
で元のマルチチャネルを復元し(ステップS66)、次
いでこれを出力し(ステップS67)、以下、これを繰
り返す。On the decoding side, as shown in FIG. 12A, the header is removed (step S51), the data is restored (step S52), this data is then stored in the memory and waits for decoding (step S53). . Then, when decoding is performed, as shown in FIG. 12B, the reformatting is performed (step S61), and then the input buffer 22
Input / output control of a is performed (step S62), and then unpacking is performed (step S63). At this time, if there is a search reproduction instruction, the search pointer is decoded. Next, a predictor is selected based on the flag to perform decoding (step S64), then input / output control of the output buffer 110 is performed (step S65), then the original multi-channel is restored (step S66), and then this is restored. It is output (step S67), and this is repeated thereafter.
【0027】なお、上記実施形態では、前方グループに
関する2ch「1」、「2」を
「1」=Lf+Rf
「2」=Lf−Rf
により変換して予測符号化したが、代わりに式(2)に
よりマルチチャネルをダウンミクスしてステレオ2chデ
ータ(L、R)を生成し、次いで次式(1)’
「1」=L+R
「2」=L−R
「3」〜「5」は同じ
「6」=Lfe−C …(1)’
により変換して予測符号化するようにしてもよい(第2
の実施形態)。この場合には、復号化側のミクス&マト
リクス回路4’はチャネル「1」、「2」を加算するこ
とによりチャネルLを、減算することによりチャネルR
を生成することができる。In the above embodiment, 2ch "1" and "2" relating to the front group are converted by "1" = Lf + Rf "2" = Lf-Rf and predictively coded. To down-mix the multi-channel to generate stereo 2ch data (L, R), and then the following equation (1) ′ “1” = L + R “2” = L−R “3” to “5” are the same as “6”. "= Lfe-C (1) 'and the prediction coding may be performed (second).
Embodiment). In this case, the mixing and matrix circuit 4'on the decoding side adds the channels "1" and "2" to the channel L, and subtracts the channel R to the channel R.
Can be generated.
【0028】また、第3の実施形態として図13に示す
ように、2ch「1」、「2」の代わりに式(2)により
マルチチャネルをダウンミクスしてステレオ2chデータ
(L、R)を生成して、このステレオ2ch(L、R)と
4ch「3」〜「6」を予測符号化するようにしてもよ
い。なお、第2、第3の実施形態では、フロントレフト
(Lf)とフロントライト(Rf)が復号化側に伝送さ
れないので、復号化側ではこれを式(1)、(2)によ
り生成する。As a third embodiment, as shown in FIG. 13, the stereo 2ch data (L, R) is downmixed by the formula (2) instead of 2ch "1", "2" to downmix the multichannel. The stereo 2ch (L, R) and the 4ch "3" to "6" may be generated and predictively encoded. Note that in the second and third embodiments, the front left (Lf) and the front right (Rf) are not transmitted to the decoding side, so the decoding side generates them by the equations (1) and (2).
【0029】次に図14、図15、図16を参照して第
4の実施形態について説明する。上記の実施形態では、
1グループの相関性の信号「1」〜「6」を予測符号化
するように構成されているが、この第4の実施形態では
複数グループの相関性のある信号を生成して予測符号化
し、圧縮率が最も高いグループの予測符号化データを選
択するように構成されている。また、この実施例ではそ
の1グループ内における符号化は、前述の各実施例の場
合のように前方グループに関する2chと他のグループ
に関する4chに分類して変換するようなことはせず
に、一つにまとめた符号化処理が行われる構成で、図1
4は前述の図1に対応した図として示してある。また、
図15は符号化部の詳細ブロックを示すものであるが、
本実施例の場合にはn個の相関回路1−1〜1−nまで
が、ミクス&マトリクス回路1’側に設けられている。
これらn個の相関回路1−1〜1−nは例えば6ch(L
f、C、Rf、Ls、Rs、Lfe)のPCMデータ
を、相関性が異なるn種類の6ch信号「1」〜「6」に
変換する。Next, a fourth embodiment will be described with reference to FIGS. 14, 15 and 16. In the above embodiment,
Although it is configured to predictively encode one group of correlated signals “1” to “6”, in the fourth embodiment, a plurality of groups of correlated signals are generated and predictively encoded, It is configured to select the predictive encoded data of the group having the highest compression rate. Further, in this embodiment, the coding within the one group is not performed by classifying and converting into 2ch related to the front group and 4ch related to other groups as in the case of each of the above-described embodiments. 1 is a configuration in which the encoding processing is put together into one.
4 is shown as a diagram corresponding to FIG. 1 described above. Also,
FIG. 15 shows a detailed block of the encoding unit.
In the case of this embodiment, n correlation circuits 1-1 to 1-n are provided on the side of the mix & matrix circuit 1 '.
These n correlation circuits 1-1 to 1-n are, for example, 6ch (L
The PCM data of f, C, Rf, Ls, Rs, and Lfe) is converted into n types of 6ch signals “1” to “6” having different correlations.
【0030】例えば第1の相関回路1−1は以下のよう
に変換し、
「1」=Lf
「2」=C−(Ls+Rs)/2
「3」=Rf−Lf
「4」=Ls−a×Lfe
「5」=Rs−b×Rf
「6」=Lfe
また、第nの相関回路1−nは以下のように変換する。
「1」=Lf+Rf
「2」=C−Lf
「3」=Rf−Lf
「4」=Ls−Lf
「5」=Rs−Lf
「6」=Lfe−CFor example, the first correlation circuit 1-1 converts as follows, "1" = Lf "2" = C- (Ls + Rs) / 2 "3" = Rf-Lf "4" = Ls-a × Lfe “5” = Rs−b × Rf “6” = Lfe Further, the nth correlation circuit 1-n performs conversion as follows. "1" = Lf + Rf "2" = C-Lf "3" = Rf-Lf "4" = Ls-Lf "5" = Rs-Lf "6" = Lfe-C
【0031】また、相関回路1−1〜1−n毎に予測回
路15とバッファ・選択器16が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器17bにより選択さ
れる。このとき、フォーマット化回路19はその選択フ
ラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。A prediction circuit 15 and a buffer / selector 16 are provided for each of the correlation circuits 1-1 to 1-n, and the group with the highest compression ratio is based on the data amount of the minimum value of the prediction residual for each group. Are selected by the correlation selection signal generator 17b. At this time, the formatting circuit 19 adds the selection flag (correlation circuit selection flag, correlation coefficients a and b of the correlation circuit) and multiplexes them.
【0032】そして、図16は前述の図6に対応したデ
ータエリアを示し、この実施例ではサブストリーム「B
S1」を用いず、サブストリーム「BS0」のみで構成
することになる。FIG. 16 shows a data area corresponding to the above-mentioned FIG. 6, and in this embodiment, the substream “B
S1 "is not used and only substream" BS0 "is used.
【0033】また、図17に示す復号化側では、符号化
側の相関回路1−1〜1−nに対してn個の相関回路4
−1〜4−n(又は係数a、bが変更可能な図示省略の
1つの相関回路)が設けられる。なお、図15に示すn
グループの予測回路が同一の構成である場合、復号装置
では図17に示すようにnグループ分の予測回路を設け
る必要はなく、1つのグループ分の予測回路でよい。そ
して、符号化装置から伝送された選択フラグに基づいて
相関回路4−1〜4−nの1つを選択、又は係数a、b
を設定して元の6ch(Lf、C、Rf、Ls、Rs、L
fe)を復元し、また、式(2)によりマルチチャネル
をダウンミクスしてステレオ2chデータ(L、R)を生
成する。Also, on the decoding side shown in FIG. 17, n correlation circuits 4 are provided for the correlation circuits 1-1 to 1-n on the encoding side.
-1 to 4-n (or one correlation circuit (not shown) whose coefficients a and b can be changed) are provided. Note that n shown in FIG.
When the prediction circuits of the groups have the same configuration, it is not necessary to provide the prediction circuits for n groups in the decoding device as shown in FIG. 17, and the prediction circuits for one group may be used. Then, one of the correlation circuits 4-1 to 4-n is selected based on the selection flag transmitted from the encoding device, or the coefficients a and b are selected.
To set the original 6ch (Lf, C, Rf, Ls, Rs, L
fe) is restored, and the multi-channel is downmixed by the equation (2) to generate stereo 2ch data (L, R).
【0034】また、上記の第1の実施形態では、1種類
の相関性の信号「1」〜「6」を予測符号化するように
構成されているが、この信号「1」〜「6」のグループ
と原信号(Lf、C、Rf、Ls、Rs、Lfe)のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。In the first embodiment, the signals "1" to "6" having one type of correlation are configured to be predictively coded, but the signals "1" to "6" are used. It is also possible to predictively code the group of and the group of the original signals (Lf, C, Rf, Ls, Rs, Lfe) and select the group having the higher compression rate.
【0035】[0035]
【発明の効果】以上説明したように本発明によれば、圧
縮データを含むサブパケットと、そのサンプリング周波
数及び量子化ビット数を含む同期情報部を有するデータ
構造にフォーマット化するようにしたので、マルチチャ
ネルの音声信号を可変の圧縮率で符号化する場合に再生
側の復号効率を改善することができる。As described above, according to the present invention, the data packet is formatted into the data structure having the sub-packet containing the compressed data and the synchronization information part containing the sampling frequency and the number of quantization bits. When a multi-channel audio signal is encoded with a variable compression rate, the decoding efficiency on the reproducing side can be improved.
【図1】本発明が適用される音声符号化装置及び音声復
号装置の第1の実施形態を示すブロック図である。FIG. 1 is a block diagram showing a first embodiment of a speech coding apparatus and speech decoding apparatus to which the present invention is applied .
【図2】図1の符号化部を詳しく示すブロック図であ
る。FIG. 2 is a block diagram showing in detail a coding unit of FIG.
【図3】図1、図2の符号化部により符号化されたビッ
トストリームを示す説明図である。FIG. 3 is an explanatory diagram showing a bitstream encoded by the encoding unit in FIGS. 1 and 2.
【図4】DVDのパックのフォーマットを示す説明図で
ある。FIG. 4 is an explanatory diagram showing a format of a DVD pack.
【図5】DVDのオーディオパックのフォーマットを示
す説明図である。FIG. 5 is an explanatory diagram showing a format of a DVD audio pack.
【図6】図5のオーディオデータエリアのフォーマット
を詳しく示す説明図である。6 is an explanatory diagram showing a format of an audio data area in FIG. 5 in detail.
【図7】図1の復号化部を詳しく示すブロック図であ
る。FIG. 7 is a block diagram showing in detail the decoding unit of FIG. 1.
【図8】図7の入力バッファの書き込み/読み出しタイ
ミングを示すタイミングチャートである。8 is a timing chart showing write / read timing of the input buffer of FIG.
【図9】アクセスユニット毎の圧縮データ量を示す説明
図である。FIG. 9 is an explanatory diagram showing a compressed data amount for each access unit.
【図10】アクセスユニットとプレゼンテーションユニ
ットを示す説明図である。FIG. 10 is an explanatory diagram showing an access unit and a presentation unit.
【図11】音声伝送方法を示すフローチャートである。FIG. 11 is a flowchart showing a voice transmission method.
【図12】音声伝送方法を示すフローチャートである。FIG. 12 is a flowchart showing a voice transmission method.
【図13】本発明が適用される音声符号化装置及び音声
復号装置の第3の実施形態を示すブロック図である。FIG. 13 is a block diagram showing a third embodiment of a speech coding apparatus and speech decoding apparatus to which the present invention is applied .
【図14】本発明が適用される音声符号化装置及び音声
復号装置の第4の実施形態を示すブロック図である。FIG. 14 is a block diagram showing a fourth embodiment of a speech coding apparatus and speech decoding apparatus to which the present invention is applied .
【図15】第4の実施形態の音声符号化装置を示すブロ
ック図である。FIG. 15 is a block diagram showing a speech coding apparatus according to a fourth embodiment.
【図16】図6に対応した別の実施例の説明図である。FIG. 16 is an explanatory diagram of another embodiment corresponding to FIG.
【図17】第4の実施形態の音声復号装置を示すブロッ
ク図である。FIG. 17 is a block diagram showing a speech decoding apparatus according to a fourth embodiment.
1’ 6chミクス&マトリクス回路
13D1,13D2,15D1〜15D4 予測回路
(バッファ・選択器14D1,14D2,16D1〜1
6D4と共に圧縮手段を構成する。)
14D1,14D2,16D1〜16D4 バッファ・
選択器
17 選択信号/DTS生成器(タイミング生成手段)
17c PTS生成器(タイミング生成手段)
19 フォーマット化回路(フォーマット化手段)
21 デフォーマット化回路(分離手段)
22 アンパッキング回路
22a 入力バッファ
24D1,24D2,23D1〜23D4 予測回路
(伸長手段)
100 制御部
102 D/A変換器
110 出力バッファ1'6ch mix & matrix circuit 13D1, 13D2, 15D1 to 15D4 Prediction circuit (buffer / selector 14D1, 14D2, 16D1 to 1)
A compression means is configured with 6D4. ) 14D1, 14D2, 16D1 to 16D4 buffers
Selector 17 Select signal / DTS generator (timing generating means) 17c PTS generator (timing generating means) 19 Formatting circuit (formatting means) 21 Deformatting circuit (separating means) 22 Unpacking circuit 22a Input buffer 24D1, 24D2, 23D1 to 23D4 Prediction circuit (expansion means) 100 Control unit 102 D / A converter 110 Output buffer
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−272393(JP,A) 特開 平3−24834(JP,A) 特開 平10−233058(JP,A) 特開 平10−320928(JP,A) 特開 昭64−44499(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/04 ─────────────────────────────────────────────────── ─── Continuation of the front page (56) Reference JP-A-8-272393 (JP, A) JP-A-3-24834 (JP, A) JP-A-10-233058 (JP, A) JP-A-10- 320928 (JP, A) JP-A 64-44499 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/04
Claims (4)
のマルチチャネルの音声信号を、そのままのチャネル又
は互いに相関をとったチャネル毎に、入力される音声信
号に応答して先頭サンプル値を得ると共に、特性が異な
る複数の線形予測方法により時間領域の過去から現在の
信号の線形予測値がそれぞれ予測され、その予測される
線形予測値と前記音声信号とから得られる予測残差が最
小となるような線形予測方法を選択して予測符号化する
ステップと、 前記ステップにより選択されたチャネル毎の線形予測方
法と予測残差と所定の先頭サンプル値を含む予測符号化
データを格納するサブパケットと、再生側において元の
アナログ音声信号に復元される際に用いられるサンプリ
ング周波数及び量子化ビット数を含む同期情報部と、を
有するデータ構造にフォーマット化するステップとによ
り、 前記データ構造にフォーマット化されたデータが記録さ
れ、その記録されたデータうち前記予測符号化データは
元の音声信号を復元するために用いられる予測値を算出
するためのデータとして記録されていることを特徴とす
る記録媒体。1. A multichannel audio signal having a certain sampling frequency and a quantized bit number is obtained in response to an input audio signal for a channel as it is or for each channel correlated with each other, and a head sample value is obtained. Linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal is minimized. A step of predictively encoding by selecting a linear prediction method; a linear prediction method for each channel selected in the step, a subpacket for storing prediction coded data including a prediction residual and a predetermined head sample value, and reproduction Side, a synchronization information part including a sampling frequency and a quantization bit number used when the original analog audio signal is restored. Formatting into a data structure according to the above, the data formatted in the data structure is recorded, and among the recorded data, the prediction coded data is a prediction value used for restoring the original audio signal. It is recorded as data for calculating be characterized Tei Rukoto
Recording medium .
報部と、更にSCR情報を含むパックヘッダと、を含ん
で一つのパックとしてフォーマット化されて記録される
と共に、前記SCR情報は、前記パックを再生する際の
時間管理情報として用いられることを特徴とする記録媒
体。2. The sub-packet and the synchronization information part according to claim 1, and a pack header including SCR information are further formatted and recorded as one pack, and the SCR information is recorded in the pack. A recording medium characterized by being used as time management information when reproducing.
ータから元のマルチチャネルの音声信号を復号する音声
復号装置であって、 前記データ構造をサブパケットと同期情報部に分離する
手段と、 前記サブパケット内の圧縮データをチャネル毎に伸長す
る伸長手段と、 前記チャネル毎に伸長された音声データから元のマルチ
チャネルの伸長された音声信号に変換する手段と、 前記変換されたマルチチャネルの音声データを前記同期
情報部内のサンプリング周波数及び量子化ビット数に基
づいてアナログ音声信号に変換する手段とを、有する音
声復号装置。3. A voice decoding device for decoding an original multi-channel voice signal from the data recorded on the recording medium according to claim 1, comprising means for separating the data structure into a subpacket and a synchronization information part. Decompressing means for decompressing the compressed data in the subpacket for each channel, means for converting the decompressed audio data for each channel into an original decompressed multichannel audio signal, and the converted multichannel Means for converting the audio data of 1. into an analog audio signal based on the sampling frequency and the number of quantization bits in the synchronization information part.
ータから元のマルチチャネルの音声信号を復号する音声
復号装置であって、 前記ヘッダに含まれるSCR情報を分離する第1の分離
手段と、 前記分離されたSCR情報に基づいて前記サブパケット
及び同期情報部を保持するためのバッファと、 前記バッファに保持された前記サブパケットと同期情報
部とを分離する第2の分離手段と、 前記同期情報部内の識別子に基づいて前記サブパケット
内の圧縮データをチャネル毎に伸長する伸長手段と、 前記チャネル毎に伸長された音声データから元のマルチ
チャネルの伸長された音声信号に変換する手段と、 前記変換されたマルチチャネルの音声データを前記同期
情報部内のサンプリング周波数及び量子化ビット数に基
づいてアナログ音声信号に変換する手段とを、 有する音声復号装置。4. An audio decoding device for decoding an original multi-channel audio signal from the data recorded on the recording medium according to claim 2, wherein the first separating means separates the SCR information contained in the header. A buffer for holding the sub-packet and the synchronization information part based on the separated SCR information, and a second separating means for separating the sub-packet and the synchronization information part held in the buffer, Decompression means for decompressing the compressed data in the subpacket for each channel based on the identifier in the synchronization information part, and means for converting the decompressed audio data for each channel into the original multichannel decompressed audio signal. And converting the converted multi-channel audio data into an analog audio signal based on the sampling frequency and the number of quantization bits in the synchronization information section. And a means for converting into a speech signal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32595799A JP3387084B2 (en) | 1998-11-16 | 1999-11-16 | Recording medium, audio decoding device |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10-342352 | 1998-11-16 | ||
JP34235298 | 1998-11-16 | ||
JP32595799A JP3387084B2 (en) | 1998-11-16 | 1999-11-16 | Recording medium, audio decoding device |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000325680A Division JP3346552B2 (en) | 1998-11-16 | 2000-10-25 | Audio coding method |
JP2000325681A Division JP3346553B2 (en) | 1998-11-16 | 2000-10-25 | Audio encoding method and audio decoding method |
JP2000325679A Division JP3346551B2 (en) | 1998-11-16 | 2000-10-25 | Audio coding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000214894A JP2000214894A (en) | 2000-08-04 |
JP3387084B2 true JP3387084B2 (en) | 2003-03-17 |
Family
ID=26572018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32595799A Expired - Lifetime JP3387084B2 (en) | 1998-11-16 | 1999-11-16 | Recording medium, audio decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3387084B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5536674B2 (en) * | 2008-03-04 | 2014-07-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Mixing the input data stream and generating the output data stream from it |
-
1999
- 1999-11-16 JP JP32595799A patent/JP3387084B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2000214894A (en) | 2000-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3387084B2 (en) | Recording medium, audio decoding device | |
JP3344571B2 (en) | Recording medium, audio decoding device | |
JP3344575B2 (en) | Recording medium, audio decoding device | |
JP3344572B2 (en) | Recording medium, audio decoding device | |
JP3344574B2 (en) | Recording medium, audio decoding device | |
JP3346547B2 (en) | Audio encoding method and audio decoding method | |
JP3346388B2 (en) | Audio encoding method and audio decoding method | |
JP3344569B2 (en) | Optical recording medium, audio decoding device | |
JP3344573B2 (en) | Recording medium, audio decoding device | |
JP3346384B2 (en) | Audio coding method | |
JP3346553B2 (en) | Audio encoding method and audio decoding method | |
JP3346390B2 (en) | Audio coding method | |
JP3346551B2 (en) | Audio coding device | |
JP3346387B2 (en) | Audio coding method | |
JP3346557B2 (en) | Audio coding method | |
JP3346381B2 (en) | Audio coding device | |
JP3346552B2 (en) | Audio coding method | |
JP3346550B2 (en) | Audio encoding method and audio decoding method | |
JP3346546B2 (en) | Audio coding method | |
JP3346389B2 (en) | Audio coding device | |
JP3346545B2 (en) | Audio coding device | |
JP3346383B2 (en) | Audio coding device | |
JP3346382B2 (en) | Audio encoding method and audio decoding method | |
JP3346549B2 (en) | Audio coding method | |
JP3346386B2 (en) | Audio coding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
R151 | Written notification of patent or utility model registration |
Ref document number: 3387084 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100110 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20200110 Year of fee payment: 17 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20200110 Year of fee payment: 17 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20200110 Year of fee payment: 17 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |