KR20170024581A - 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 - Google Patents
압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR20170024581A KR20170024581A KR1020167035529A KR20167035529A KR20170024581A KR 20170024581 A KR20170024581 A KR 20170024581A KR 1020167035529 A KR1020167035529 A KR 1020167035529A KR 20167035529 A KR20167035529 A KR 20167035529A KR 20170024581 A KR20170024581 A KR 20170024581A
- Authority
- KR
- South Korea
- Prior art keywords
- hoa
- dir
- rti
- subband
- sub
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 239000011159 matrix material Substances 0.000 claims abstract description 48
- 238000005520 cutting process Methods 0.000 claims abstract description 9
- 108091006146 Channels Proteins 0.000 claims description 42
- 230000015572 biosynthetic process Effects 0.000 claims description 34
- 238000003786 synthesis reaction Methods 0.000 claims description 34
- 238000004458 analytical method Methods 0.000 claims description 28
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000001149 cognitive effect Effects 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000000153 supplemental effect Effects 0.000 claims 3
- 238000013500 data storage Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 15
- NTABMUJQZABQGD-UHFFFAOYSA-N dimethylindole red Chemical compound CC1(C)C2=CC=CC=C2N(C)\C1=C\C=C\C1=CC=[N+](CCCS([O-])(=O)=O)C2=CC=CC=C12 NTABMUJQZABQGD-UHFFFAOYSA-N 0.000 description 14
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 230000006837 decompression Effects 0.000 description 11
- 238000013459 approach Methods 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 9
- 238000012937 correction Methods 0.000 description 7
- 238000009877 rendering Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 230000015654 memory Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 229910052709 silver Inorganic materials 0.000 description 4
- 239000004332 silver Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- TVZRAEYQIKYCPH-UHFFFAOYSA-N 3-(trimethylsilyl)propane-1-sulfonic acid Chemical compound C[Si](C)(C)CCCS(O)(=O)=O TVZRAEYQIKYCPH-UHFFFAOYSA-N 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 1은 공간 HOA 인코더의 아키텍쳐이다,
도 2는 방향 추정 블록의 아키텍쳐이다,
도 3은 인지 부가 정보 소스 인코더이다,
도 4는 인지 부가 정보 소스 디코더이다,
도 5는 공간 HOA 디코더의 아키텍쳐이다,
도 6은 구면 좌표계이다,
도 7은 방향 추정 처리 블록이다,
도 8은, 절삭된 HOA 표현의 방향, 궤적 인덱스 세트 및 계수들이다,
도 9는 MPEG에서 이용되는 종래의 오디오 인코더이다,
도 10은 MPEG에서 이용가능한 개선된 오디오 인코더이다,
도 11은 MPEG에서 이용되는 종래의 오디오 디코더이다,
도 12는 MPEG에서 이용가능한 개선된 오디오 디코더이다,
도 13은 인코딩 방법의 플로차트이다,
도 14는 디코딩 방법의 플로차트이다.
Claims (25)
- 압축된 HOA 표현을 디코딩하기 위한 방법으로서,
- 상기 압축된 HOA 표현으로부터 복수의 절삭된 HOA 계수 시퀀스들(), 상기 절삭된 HOA 계수 시퀀스들의 시퀀스 인덱스들을 나타내거나 포함하는 할당 벡터(), 부대역 관련 방향 정보(MDIR(k+1,f1),..., MDIR(k+1,fF)), 복수의 예측 행렬들(A(k+1,f1),...,A(k+1,fF)), 및 이득 제어 부가 정보()를 추출하는 단계(s41, s42, s43),
- 상기 복수의 절삭된 HOA 계수 시퀀스들(), 상기 이득 제어 부가 정보() 및 상기 할당 벡터()로부터, 절삭된 HOA 표현()을 재구성하는 단계(s51, s52),
- 분석 필터 뱅크들(53)에서, 상기 재구성된 절삭된 HOA 표현()을 복수의 F개의 주파수 부대역들에 대한 주파수 부대역 표현들( )로 분해하는 단계(s53),
- 방향 부대역 합성 블록들(54)에서, 상기 주파수 부대역 표현들 각각에 대해, 상기 재구성된 절삭된 HOA 표현의 각각의 주파수 부대역 표현(), 상기 부대역 관련 방향 정보(MDIR(k+1,f1),..., MDIR(k+1,fF)), 및 상기 예측 행렬들(A(k+1,f1),...,A(k+1,fF))로부터, 예측된 방향 HOA 표현()을 합성하는 단계(s54),
- 부대역 조성 블록들(55)에서, 상기 F개의 주파수 부대역들 각각에 대해, 계수 시퀀스가 상기 할당 벡터()에 포함되는 인덱스 n을 갖는 경우 절삭된 HOA 표현()의 계수 시퀀스들로부터 획득되거나, 그렇지 않으면 방향 부대역 합성 블록들(54) 중 하나에 의해 제공된 예측된 방향 HOA 성분()의 계수 시퀀스들로부터 획득되는 계수 시퀀스들(, )을 갖는 디코딩된 부대역 HOA 표현()을 조성하는 단계(s55); 및
- 합성 필터 뱅크들(56)에서, 디코딩된 HOA 표현()을 획득하기 위해 상기 디코딩된 부대역 HOA 표현들()을 합성하는 단계(s56)
를 포함하는 방법. - 제1항에 있어서, 상기 추출하는 단계는 인지 코딩된 부분 및 인코딩된 부가 정보 부분을 획득하기 위해 상기 압축된 HOA 표현을 디멀티플렉싱하는 단계(s41)를 포함하는, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 부대역 관련 방향 정보는, 활성 방향들의 세트(MDIR(k))와 제1 및 제2 인덱스를 갖는 인덱스들의 튜플(tuple)들을 포함하는 튜플 세트(MDIR(k+1,f1),..., MDIR(k+1,fF))를 포함하고, 상기 제2 인덱스는 현재의 주파수 부대역에 대한 상기 활성 방향들의 세트(MDIR(k)) 내의 활성 방향의 인덱스이며, 상기 제1 인덱스는 상기 활성 방향의 궤적 인덱스이고, 궤적은 특정한 사운드 소스의 방향들의 시간적 시퀀스인, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 적어도 하나의 주파수 부대역 표현은 2개 이상의 주파수 부대역으로 이루어진 부대역 그룹을 포함하는, 방법.
- 제6항에 있어서, 상기 압축된 HOA 표현으로부터 부대역 그룹 구성 정보가 수신되거나 추출되고, 상기 부대역 그룹 구성 정보는 상기 합성 필터 뱅크들(56)을 셋업하는데 이용되는, 방법.
- 주어진 개수의 계수 시퀀스들 ―각각의 계수 시퀀스는 인덱스를 가짐― 을 갖는 입력 HOA 신호의 프레임들을 인코딩하기 위한 방법은,
- 절삭된 HOA 표현에 포함될 활성 계수 시퀀스들(IC,ACT(k))의 인덱스들의 세트를 결정하는 단계(s111);
- 감소된 개수의 비제로 계수 시퀀스들을 갖는 절삭된 HOA 표현()을 계산하는 단계(s110);
- 상기 입력 HOA 신호로부터 제1 세트의 후보 방향들(MDIR(k))을 추정하는 단계(s16);
- 상기 입력 HOA 신호를 복수의 주파수 부대역들()로 분할 ―상기 주파수 부대역들의 계수 시퀀스들()이 획득됨― 하는 단계(s15);
- 상기 주파수 부대역들 각각에 대해 제2 세트의 방향들(MDIR(k,f1), ..., MDIR(k,fF))을 추정 ―상기 제2 세트의 방향들의 각각의 요소는 제1 및 제2 인덱스를 갖는 인덱스들의 튜플이고, 상기 제2 인덱스는 현재의 주파수 부대역에 대한 활성 방향의 인덱스이며, 상기 제1 인덱스는 상기 활성 방향의 궤적 인덱스이고, 각각의 활성 방향은 또한 상기 입력 HOA 신호의 상기 제1 세트의 후보 방향들(MDIR(k))에 포함됨― 하는 단계(s161);
- 상기 주파수 부대역들 각각에 대해, 각각의 주파수 부대역의 상기 제2 세트의 방향들(MDIR(k,f1),...,MDIR(k,fF))에 따라 상기 주파수 부대역의 계수 시퀀스들( )로부터 방향 부대역 신호들()을 계산하는 단계(s17);
- 상기 주파수 부대역들 각각에 대해, 각각의 주파수 부대역의 활성 계수 시퀀스들(IC,ACT(k))의 인덱스들의 세트를 이용하여 상기 주파수 부대역의 계수 시퀀스들()로부터 방향 부대역 신호들( )을 예측하기 위해 구성된 예측 행렬(A(k,f1),..., A(k,fF))을 계산하는 단계(s18); 및
- 상기 제1 세트의 후보 방향들(MDIR(k)), 상기 제2 세트의 방향들((MDIR(k,f1),..., MDIR(k,fF))), 상기 예측 행렬들(A(k,f1),...,A(k,fF)) 및 상기 절삭된 HOA 표현 ()을 인코딩하는 단계(s19)
를 포함하는 방법. - 제8항에 있어서, 2개 이상의 부대역으로 이루어진 적어도 하나의 그룹이 생성되고, 상기 적어도 하나의 그룹은 단일 부대역 대신에 이용되고 단일 부대역과 동일한 방식으로 취급되는, 방법.
- 제8항 또는 제9항에 있어서, 상기 절삭된 HOA 표현()을 인코딩하는 단계는,
- 상기 절삭된 HOA 채널 시퀀스들의 부분적 무상관화(s12);
- 상기 절삭된 HOA 채널 시퀀스들(y1(k),..., yI(k))을 전송 채널들에 할당하기 위한 채널 할당(s13);
- 전송 채널들 각각에 관한 이득 제어를 수행 ―각각의 전송 채널에 대한 이득 제어 부가 정보(, )가 생성됨―하는 단계(s14);
- 이득 제어된 절삭된 HOA 채널 시퀀스들(z1(k),..., zI(k))을 인지 인코더(31)에서 인코딩하는 단계(s31);
- 상기 이득 제어 부가 정보(, ), 상기 제1 세트의 후보 방향들(MDIR(k)), 상기 제2 세트의 방향들(MDIR(k,f1),..., MDIR(k,fF)) , 및 상기 예측 행렬들(A(k,f1),...,A(k,fF))을 부가 정보 소스 코더(32)에서 인코딩하는 단계(s32); 및
- 인코딩된 HOA 신호 프레임()을 획득하기 위해 상기 인지 인코더(31)와 상기 부가 정보 소스 코더(32)의 출력들을 멀티플렉싱하는 단계(s33)
를 포함하는 방법. - 제8항 내지 제10항 중 어느 한 항에 있어서, 상기 주파수 부대역들 각각에 대해 제2 세트의 방향들(MDIR(k,f1),..., MDIR(k,fF))을 추정하는 단계(s161)에 있어서, 주파수 부대역의 방향들은 전체 대역 HOA 신호의 방향들(MDIR(k)) 중에서만 탐색되는, 방법.
- 제8항 내지 제11항 중 어느 한 항에 있어서, 활성 방향의 궤적을 결정하는 단계를 더 포함하고, 상기 활성 방향은 사운드 소스의 방향이며, 궤적은 특정한 사운드 소스의 방향들의 시간적 시퀀스인, 방법.
- 제8항 내지 제12항 중 어느 한 항에 있어서, 절삭된 HOA 표현은 하나 이상의 계수 시퀀스들이 제로로 설정되는 HOA 신호인, 방법.
- HOA 신호를 디코딩하기 위한 장치(50)로서,
- 압축된 HOA 표현으로부터 복수의 절삭된 HOA 계수 시퀀스들(), 상기 절삭된 HOA 계수 시퀀스들의 시퀀스 인덱스들을 나타내거나 포함하는 할당 벡터(), 부대역 관련 방향 정보(MDIR(k+1,f1),..., MDIR(k+1,fF)), 복수의 예측 행렬들(A(k+1,f1),...,A(k+1,fF)), 및 이득 제어 부가 정보( )를 추출하도록 구성된 추출 모듈(40);
- 상기 복수의 절삭된 HOA 계수 시퀀스들(), 상기 이득 제어 부가 정보( ), 및 상기 할당 벡터()로부터, 절삭된 HOA 표현()을 재구성하도록 구성된 재구성 모듈(51, 52);
- 상기 재구성된 절삭된 HOA 표현()을 복수의 F개의 주파수 부대역에 대한 주파수 부대역 표현들()로 분해하도록 구성된 분석 필터 뱅크 모듈(53);
- 상기 주파수 부대역 표현들 각각에 대해, 상기 재구성된 절삭된 HOA 표현의 각각의 주파수 부대역 표현(), 상기 부대역 관련 방향 정보(MDIR(k+1,f1),...,MDIR(k+1,fF)), 및 상기 예측 행렬들(A(k+1,f1),...,A(k+1,fF))로부터, 예측된 방향 HOA 표현()을 합성하도록 구성된 적어도 하나의 방향 부대역 합성 모듈(54);
- 상기 F개의 주파수 부대역들 각각에 대해, 계수 시퀀스가 상기 할당 벡터()에 포함되는 인덱스 n을 갖는 경우 절삭된 HOA 표현()의 계수 시퀀스들로부터 획득되거나, 그렇지 않으면 방향 부대역 합성 모듈(54) 중 하나에 의해 제공된 예측된 방향 HOA 성분()의 계수 시퀀스들로부터 획득되는 계수 시퀀스들(, )을 갖는 디코딩된 부대역 HOA 표현( )을 조성하도록 구성된 적어도 하나의 부대역 조성 모듈(55); 및
- 디코딩된 HOA 표현()을 획득하기 위해 디코딩된 부대역 HOA 표현들()을 합성하도록 구성된 합성 필터 뱅크 모듈(56)
을 포함하는 장치. - 제14항에 있어서, 상기 추출 모듈(40)은, 적어도,
- 인코딩된 부가 정보 부분 및 인코딩된 절삭된 HOA 계수 시퀀스들()을 포함하는 인지 코딩된 부분을 획득하기 위한 디멀티플렉서(41);
- 상기 절삭된 HOA 계수 시퀀스들()을 획득하기 위해 상기 인코딩된 절삭된 HOA 계수 시퀀스들()을 인지 디코딩(s42)하도록 구성된 인지 디코더(42); 및
- 부대역 관련 방향 정보(MDIR(k+1,f1),...,MDIR(k+1,fF)), 예측 행렬들(A(k+1,f1),...,A(k+1,fF)), 이득 제어 부가 정보( ), 및 할당 벡터()를 획득하기 위해 상기 인코딩된 부가 정보 부분을 디코딩(s43)하도록 구성된 부가 정보 소스 디코더(43)
를 포함하는, 장치. - 제14항 내지 제16항 중 어느 한 항에 있어서, 상기 부대역 관련 방향 정보는, 활성 방향들의 세트(MDIR(k))와 제1 및 제2 인덱스를 갖는 인덱스들의 튜플(tuple)들을 포함하는 튜플 세트(MDIR(k+1,f1), ...,MDIR(k+1,fF))를 포함하고, 상기 제2 인덱스는 현재의 주파수 부대역에 대한 상기 활성 방향들의 세트(MDIR(k)) 내의 활성 방향의 인덱스이며, 상기 제1 인덱스는 상기 활성 방향의 궤적 인덱스이고, 궤적은 특정한 사운드 소스의 방향들의 시간적 시퀀스인, 장치.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 주파수 부대역 표현은 2개 이상의 주파수 부대역으로 이루어진 부대역 그룹을 포함하는, 장치.
- 제18항에 있어서, 상기 압축된 HOA 표현으로부터 부대역 그룹 구성 정보가 수신되거나 추출되고, 상기 부대역 그룹 구성 정보는 상기 합성 필터 뱅크들(56)을 셋업하는데 이용되는, 장치.
- 주어진 개수의 계수 시퀀스들 ―각각의 계수 시퀀스는 인덱스를 가짐― 을 갖는 입력 HOA 신호의 프레임들을 인코딩하기 위한 장치(10)로서,
- 감소된 개수의 비제로 계수 시퀀스들을 갖는 절삭된 HOA 표현()을 계산하도록 구성되고, 또한 상기 절삭된 HOA 표현에 포함된 활성 계수 시퀀스들(IC,ACT(k))의 인덱스들의 세트를 결정하도록 구성된 계산 및 결정 모듈(11);
- 상기 입력 HOA 신호를 복수의 주파수 부대역들()로 분할 ―상기 주파수 부대역들의 계수 시퀀스들()이 획득됨― 하도록 구성된 분석 필터 뱅크 모듈(15);
- 상기 입력 HOA 신호로부터 제1 세트의 후보 방향들(MDIR(k))을 추정하도록 구성되고, 또한 주파수 부대역들 각각에 대해 제2 세트의 방향들(MDIR(k,f1), ..., MDIR(k,fF))을 추정하도록 ―상기 제2 세트의 방향들의 각각의 요소는 제1 및 제2 인덱스를 갖는 인덱스들의 튜플이고, 상기 제2 인덱스는 현재 주파수 부대역에 대한 활성 방향의 인덱스이며, 상기 제1 인덱스는 상기 활성 방향의 궤적 인덱스이고, 각각의 활성 방향은 또한 상기 입력 HOA 신호의 상기 제1 세트의 후보 방향들(MDIR(k))에 포함됨― 구성된 방향 추정 모듈(16);
- 상기 주파수 부대역들 각각에 대해, 각각의 주파수 부대역의 상기 제2 세트의 방향들(MDIR(k,f1),...,MDIR(k,fF))에 따라 상기 주파수 부대역의 계수 시퀀스들()로부터 방향 부대역 신호들()을 계산하도록 구성된 적어도 하나의 방향 부대역 계산 모듈(17);
- 상기 주파수 부대역들 각각에 대해, 각각의 주파수 부대역의 활성 계수 시퀀스들(IC,ACT(k))의 인덱스들의 세트를 이용하여 상기 주파수 부대역의 계수 시퀀스들()로부터, 방향 부대역 신호들()을 예측하기 위해 구성된 예측 행렬(A(k,f1),..., A(k,fF))을 계산하도록 구성된 적어도 하나의 방향 부대역 예측 모듈(18); 및
- 상기 제1 세트의 후보 방향들(MDIR(k)), 상기 제2 세트의 방향들(MDIR(k,f1),..., MDIR(k,fF)), 상기 예측 행렬들(A(k,f1),...,A(k,fF)) 및 상기 절삭된 HOA 표현()을 인코딩하도록 구성된 인코딩 모듈(30)
을 포함하는 장치. - 제20항에 있어서, 2개 이상의 부대역으로 이루어진 적어도 하나의 그룹이 생성되고, 상기 적어도 하나의 그룹은 단일 부대역 대신에 이용되고 단일 부대역과 동일한 방식으로 취급되는, 장치.
- 제20항 또는 제21항에 있어서,
- 상기 절삭된 HOA 채널 시퀀스들을 부분적으로 무상관화하도록 구성된 부분적 무상관화기(12);
- 상기 절삭된 HOA 채널 시퀀스들(y1(k),..., yI(k))을 전송 채널들에 할당하도록 구성된 채널 할당 모듈(13); 및
- 상기 전송 채널들에 관한 이득 제어를 수행 ―각각의 전송 채널에 대한 이득 제어 부가 정보(, )가 생성됨―하도록 구성된 적어도 하나의 이득 제어 유닛(14)
을 더 포함하고,
상기 인코딩 모듈(30)은,
- 상기 이득 제어된 절삭된 HOA 채널 시퀀스들(z1(k),..., zI(k))을 인코딩하도록 구성된 인지 인코더(31);
- 상기 이득 제어 부가 정보(, ), 상기 제1 세트의 후보 방향들(MDIR(k)), 상기 제2 세트의 방향들(MDIR(k,f1),..., MDIR(k,fF)), 및 상기 예측 행렬들(A(k,f1),...,A(k,fF))을 인코딩하도록 구성된 부가 정보 소스 코더(32); 및
- 인코딩된 HOA 신호 프레임()을 획득하기 위해 상기 인지 인코더(31) 및 상기 부가 정보 소스 코더(32)의 출력들을 멀티플렉싱하도록 구성된 멀티플렉서(33)를 포함하는, 장치. - 제20항 내지 제22항 중 어느 한 항에 있어서, 상기 방향 추정 모듈(16)은, 상기 주파수 부대역들 각각에 대해 상기 제2 세트의 방향들(MDIR(k,f1),...,MDIR(k,fF))을 추정할 때, 전체 대역 HOA 신호의 방향들(MDIR(k)) 중에서만 주파수 부대역의 방향들을 탐색하는, 장치.
- 제20항 내지 제23항 중 어느 한 항에 있어서, 활성 방향의 궤적을 결정하도록 구성된 궤적 결정 모듈을 더 포함하고, 상기 활성 방향은 사운드 소스의 방향이며, 궤적은 특정한 사운드 소스의 방향들의 시간적 시퀀스인, 장치.
- 제20항 내지 제24항 중 어느 한 항에 있어서, 절삭된 HOA 표현은 하나 이상의 계수 시퀀스들이 제로로 설정되는 HOA 신호인, 장치.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14306080.4 | 2014-07-02 | ||
EP14306080 | 2014-07-02 | ||
EP14194186.4 | 2014-11-20 | ||
EP14194186.4A EP2963949A1 (en) | 2014-07-02 | 2014-11-20 | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
PCT/EP2015/065086 WO2016001356A1 (en) | 2014-07-02 | 2015-07-02 | Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170024581A true KR20170024581A (ko) | 2017-03-07 |
KR102296067B1 KR102296067B1 (ko) | 2021-09-01 |
Family
ID=51220514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167035529A KR102296067B1 (ko) | 2014-07-02 | 2015-07-02 | 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9774975B2 (ko) |
EP (2) | EP2963949A1 (ko) |
JP (1) | JP6542269B2 (ko) |
KR (1) | KR102296067B1 (ko) |
CN (1) | CN106663432B (ko) |
TW (1) | TWI657434B (ko) |
WO (1) | WO2016001356A1 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10893373B2 (en) | 2017-05-09 | 2021-01-12 | Dolby Laboratories Licensing Corporation | Processing of a multi-channel spatial audio format input signal |
CN109521731B (zh) * | 2017-09-19 | 2021-07-30 | 沈阳高精数控智能技术股份有限公司 | 一种基于公差带的G2连续Bézier刀具轨迹平滑算法 |
US11322164B2 (en) | 2018-01-18 | 2022-05-03 | Dolby Laboratories Licensing Corporation | Methods and devices for coding soundfield representation signals |
MX2020007820A (es) * | 2018-02-01 | 2020-09-25 | Fraunhofer Ges Forschung | Codificador de escena de audio, decodificador de escena de audio y metodos relacionados que utilizan el analisis espacial hibrido de codificador / decodificador. |
DE112019004193T5 (de) * | 2018-08-21 | 2021-07-15 | Sony Corporation | Audiowiedergabevorrichtung, audiowiedergabeverfahren und audiowiedergabeprogramm |
CN117241173A (zh) | 2018-11-13 | 2023-12-15 | 杜比实验室特许公司 | 沉浸式音频服务中的音频处理 |
JP7553355B2 (ja) | 2018-11-13 | 2024-09-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号及び関連するメタデータによる空間オーディオの表現 |
CN110476960B (zh) * | 2019-09-19 | 2021-06-15 | 河北省农林科学院植物保护研究所 | 噻虫胺薄膜缓释型种子处理悬浮剂及其制备方法与应用 |
CN115376527A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115376530A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CN115546323B (zh) * | 2022-08-31 | 2023-06-09 | 广东工业大学 | 一种基于球坐标主成分分析的图像压缩重构方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5075880A (en) * | 1988-11-08 | 1991-12-24 | Wadia Digital Corporation | Method and apparatus for time domain interpolation of digital audio signals |
JP3531178B2 (ja) * | 1993-05-27 | 2004-05-24 | ソニー株式会社 | ディジタル信号処理装置及び方法 |
US6931370B1 (en) * | 1999-11-02 | 2005-08-16 | Digital Theater Systems, Inc. | System and method for providing interactive audio in a multi-channel audio environment |
JP3995383B2 (ja) * | 2000-02-15 | 2007-10-24 | 三洋電機株式会社 | 水素吸蔵合金電極の製造方法 |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
ES2305852T3 (es) * | 2003-10-10 | 2008-11-01 | Agency For Science, Technology And Research | Procedimiento de codificacion de una señal digital en un flujo binario escalable, procedimiento para la descodificacion de un flujo binario escalable. |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
CN101202043B (zh) * | 2007-12-28 | 2011-06-15 | 清华大学 | 音频信号的编码方法和装置与解码方法和装置 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
US9288603B2 (en) * | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
EP2738962A1 (en) | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
-
2014
- 2014-11-20 EP EP14194186.4A patent/EP2963949A1/en not_active Withdrawn
-
2015
- 2015-07-01 TW TW104121236A patent/TWI657434B/zh active
- 2015-07-02 EP EP15732000.3A patent/EP3165005B1/en active Active
- 2015-07-02 KR KR1020167035529A patent/KR102296067B1/ko active IP Right Grant
- 2015-07-02 CN CN201580033215.6A patent/CN106663432B/zh active Active
- 2015-07-02 JP JP2016573839A patent/JP6542269B2/ja active Active
- 2015-07-02 US US15/320,461 patent/US9774975B2/en active Active
- 2015-07-02 WO PCT/EP2015/065086 patent/WO2016001356A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Also Published As
Publication number | Publication date |
---|---|
KR102296067B1 (ko) | 2021-09-01 |
JP2017523451A (ja) | 2017-08-17 |
CN106663432B (zh) | 2021-02-02 |
TWI657434B (zh) | 2019-04-21 |
US20170164131A1 (en) | 2017-06-08 |
US9774975B2 (en) | 2017-09-26 |
EP3165005A1 (en) | 2017-05-10 |
EP2963949A1 (en) | 2016-01-06 |
CN106663432A (zh) | 2017-05-10 |
TW201603004A (zh) | 2016-01-16 |
EP3165005B1 (en) | 2018-11-28 |
JP6542269B2 (ja) | 2019-07-10 |
WO2016001356A1 (en) | 2016-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102296067B1 (ko) | 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 | |
KR102460820B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
KR102327149B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
KR102433192B1 (ko) | 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 | |
KR102363275B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20161219 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200701 Comment text: Request for Examination of Application |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210526 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210825 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210826 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |