KR101038574B1 - 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 - Google Patents
3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 Download PDFInfo
- Publication number
- KR101038574B1 KR101038574B1 KR1020090003761A KR20090003761A KR101038574B1 KR 101038574 B1 KR101038574 B1 KR 101038574B1 KR 1020090003761 A KR1020090003761 A KR 1020090003761A KR 20090003761 A KR20090003761 A KR 20090003761A KR 101038574 B1 KR101038574 B1 KR 101038574B1
- Authority
- KR
- South Korea
- Prior art keywords
- value
- bumping
- panning
- frequency band
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004091 panning Methods 0.000 claims abstract description 116
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000003672 processing method Methods 0.000 claims abstract description 16
- 238000012546 transfer Methods 0.000 claims abstract description 8
- 238000012937 correction Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 210000005069 ears Anatomy 0.000 claims description 5
- 230000018199 S phase Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 210000003128 head Anatomy 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
Description
Claims (23)
- 푸리에 분석부가 입력된 음원 신호를 시간 영역의 신호에서 주파수 영역의 신호로 변환하는 푸리에 분석단계;주파수 추출부가 상기 음원 신호의 주파수 영역 신호로부터 귀간 시간 지연 차이(Interaural time difference; ITD)와 귀간 레벨 차이(Interaural level difference; ILD) 정보를 구현하는데 방해되는 범핑(Bumping)이 발생하는 범핑 주파수 대역을 추출하는 범핑 주파수 추출단계; 및패닝 계산부가 상기 범핑 주파수 대역의 신호에 대해 음상 정위가 이루어지도록 귀간 시간 지연 차이(Interaural time difference; ITD)를 재생하기 위한 위상 변조값인 채널간 시간 지연값(Inter channel time difference ;ICTD)과 귀간 레벨 차이(Interaural level difference; ILD)를 재생하기 위한 크기 변조값인 채널간 레벨 차이값(Inter channel level difference ;ICLD)을 계산하는 복소 패닝 계산(Vector Base Complex Amplitude Panning; VBCAP) 단계;를 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 1 항에 있어서,상기 3차원 음상 정위 처리 방법은패닝값 적용부가 상기 채널간 레벨 차이값(ICLD)과 채널간 시간 지연값(ICTD)을 복수의 스피커에 입력되는 신호 각각에 음상 정위가 이루어지도록 적용하는 범핑 주파수 패닝값 적용 단계;를 더 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 2 항에 있어서,상기 범핑 주파수 패닝값 적용 단계는상기 복수의 스피커가 2 개인 경우,상기 패닝값 적용부가 상기 2개의 스피커에 입력되는 각각의 신호의 크기는 ICLD 값과 1-ICLD값이고, 상기 복수의 스피커 중 음상 정위를 위해 시간 지연이 필요한 스피커에 입력되는 신호에는 ICTD값을 곱하는 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 1 항에 있어서,상기 범핑 주파수 대역은 1.1KHz~2.6KHz인 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 1 항에 있어서,상기 범핑 주파수 대역은 1.5KHz~1.9KHz의 N배수인 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 1 항에 있어서,상기 채널간 레벨 차이값(ICLD)인 a(θ,m,k)은 하기의 수학식 으로 표현되고, 여기서, 아래첨자 R은 청취자의 오른쪽 귀, L은 청취자의 왼쪽 귀이고, θ는 청취자의 정면과 스피커 사이의 각도, k는 크리티컬 밴드 인덱스(Critical band index), m은 시간 인덱스, A(k)는 미리 설정된 스피커의 크기 보정값, 는 스피커의 페이즈 응답 값, , 는 청취자의 양쪽 귀에서 원하는 각도 θ에 해당하는 머리 전달 함수(Head related transfer function; HRTF)인 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 삭제
- 제 2 항에 있어서,상기 주파수 영역의 신호는 상기 범핑 주파수 대역과 상기 범핑 주파수 대역을 제외한 비범핑 주파수 대역을 포함하고,상기 3차원 음상 정위 처리 방법은상기 주파수 추출부가 상기 음원 신호의 주파수 영역 신호로부터 비범핑 주파수 대역을 추출하는 비범핑 주파수 추출단계;상기 패닝 계산부가 상기 비범핑 주파수 대역의 신호에 대해 음상 정위가 이루어지도록 하기 위해 벡터 기반 크기 패닝 값을 계산하는 크기 패닝 계산(Vector Base Amplitude Panning; VBAP) 단계; 및상기 패닝값 적용부가 상기 비범핑 주파수 대역의 신호에 대한 크기 패닝 값을 복수의 스피커에 입력되는 신호 각각에 음상 정위가 이루어지도록 적용하는 비범핑 주파수 패닝값 적용 단계;를 더 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 제 9 항에 있어서,상기 3차원 음상 정위 처리 방법은합산부가 상기 범핑 주파수 패닝값이 적용된 주파수 대역의 신호와 상기 비범핑 주파수 패닝값이 적용된 주파수 대역의 신호를 합산하는 합산 단계;를 더 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 방법.
- 입력된 음원 신호를 시간 영역의 신호에서 주파수 영역의 신호로 변환하는 푸리에 분석부;상기 음원 신호의 주파수 영역 신호로부터 범핑(Bumping)이 발생하는 범핑 주파수 대역과 상기 범핑 주파수 대역을 제외한 비범핑 주파수 대역을 각각 추출하는 주파수 추출부; 및상기 음원 신호에 대해 음상 정위가 이루어지도록 하기 위해 상기 범핑 주파수 대역의 신호에 대해서는 위상 변조값인 채널간 시간 지연값(Inter channel time difference ;ICTD)과 크기 변조값인 채널간 레벨 차이값(Inter channel level difference ;ICLD)을 구하고, 상기 비범핑 주파수 대역의 신호에 대해서는 크기 변조값인 벡터 기반 크기 패닝(Vector Base Amplitude Panning; VBAP) 값을 계산하는 패닝 계산부;를 포함하는 3차원 음상 정위 처리 장치.
- 삭제
- 제 11 항에 있어서,상기 3차원 음상 정위 처리 장치는상기 범핑 주파수 패닝값이 적용된 주파수 대역의 신호와 상기 비범핑 주파수 패닝값이 적용된 주파수 대역의 신호를 합산하는 합산부;를 더 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 11 항에 있어서,상기 주파수 추출부는 상기 범핑 주파수 대역을 추출하는 범핑 주파수 추출부와 상기 비범핑 주파수 대역을 추출하는 비범핑 주파수 추출부를 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 14 항에 있어서,상기 범핑 주파수 대역은 1.1KHz~2.6KHz인 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 14 항에 있어서,상기 범핑 주파수 대역은 1.5KHz~1.9KHz의 N배수인 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 11 항에 있어서,상기 패닝 계산부는 복소 패닝 계산(Vector Base Complex Amplitude Panning; VBCAP)부와 크기 패닝 계산(Vector Base Amplitude Panning; VBAP)부를 포함하고,상기 복소 패닝 계산(VBCAP)부는 상기 범핑 주파수 대역의 신호에 대해 음상 정위가 이루어지도록 귀간 시간 지연 차이(Interaural time difference; ITD)를 재생하기 위한 위상 변조값인 채널간 시간 지연값(Inter channel time difference ;ICTD)과 귀간 레벨 차이(Interaural level difference; ILD)를 재생하기 위한 크기 변조값인 채널간 레벨 차이값(Inter channel level difference ;ICLD)을 계산하고,상기 크기 패닝 계산(VBAP)부는 상기 비범핑 주파수 대역의 신호에 대해 음상 정위가 이루어지도록 벡터 기반 크기 패닝 값을 계산하는 것것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 17 항에 있어서,상기 채널간 레벨 차이값(ICLD)인 a(θ,m,k)은 하기의 수학식 으로 표현되고, 여기서, 아래첨자 R은 청취자의 오른쪽 귀, L은 청취자의 왼쪽 귀이고, θ는 청취자의 정면과 스피커 사이의 각도, k는 크리티컬 밴드 인덱스(Critical band index), m은 시간 인덱스, A(k)는 미리 설정된 스피커의 크기 보정값, 는 스피커의 페이즈 응답 값, , 는 양쪽 귀에서 원하는 각도 θ에 해당하는 머리 전달 함수(Head related transfer function; HRTF)인 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 11 항에 있어서,상기 비범핑 주파수 대역의 신호에 대해서는 상기 크기 패닝 값을 복수의 스피커에 입력되는 신호 각각에 음상 정위가 이루어지도록 적용하는 패닝값 적용부;를 더 포함하는 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 20 항에 있어서,상기 패닝값 적용부는 범핑 주파수 패닝값 적용부와 비범핑 주파수 패닝값 적용부를 포함하고,상기 범핑 주파수 패닝값 적용부는 상기 채널간 레벨 차이값(ICLD)과 채널간 시간 지연값(ICTD)을 복수의 스피커에 입력되는 신호 각각에 음상 정위가 이루어지도록 적용하고,상기 비범핑 주파수 패닝값 적용부는 상기 비범핑 주파수 대역의 신호에 대 한 크기 패닝 값을 복수의 스피커에 입력되는 신호 각각에 음상 정위가 이루어지도록 적용하는 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 제 21 항에 있어서,상기 범핑 패닝값 적용부는상기 복수의 스피커가 2 개인 경우,상기 2개의 스피커에 입력되는 각각의 신호의 크기는 ICLD 값과 1-ICLD값이고, 상기 복수의 스피커 중 음상 정위를 위해 시간 지연이 필요한 스피커에 입력되는 신호에는 ICTD값을 곱하는 것을 특징으로 하는 3차원 음상 정위 처리 장치.
- 컴퓨터로 판독 가능한 기록매체에 있어서,제 1 항 내지 제 10 항 중 어느 한 항에 따른 방법을 구현하는 프로그램이 기록되는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090003761A KR101038574B1 (ko) | 2009-01-16 | 2009-01-16 | 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090003761A KR101038574B1 (ko) | 2009-01-16 | 2009-01-16 | 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100084332A KR20100084332A (ko) | 2010-07-26 |
KR101038574B1 true KR101038574B1 (ko) | 2011-06-02 |
Family
ID=42643761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090003761A KR101038574B1 (ko) | 2009-01-16 | 2009-01-16 | 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101038574B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109215667A (zh) * | 2017-06-29 | 2019-01-15 | 华为技术有限公司 | 时延估计方法及装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101871234B1 (ko) | 2012-01-02 | 2018-08-02 | 삼성전자주식회사 | 사운드 파노라마 생성 장치 및 방법 |
KR102160506B1 (ko) | 2013-04-26 | 2020-09-28 | 소니 주식회사 | 음성 처리 장치, 정보 처리 방법, 및 기록 매체 |
EP2991384B1 (en) | 2013-04-26 | 2021-06-02 | Sony Corporation | Audio processing device, method, and program |
CN115226005A (zh) * | 2021-11-18 | 2022-10-21 | 广州汽车集团股份有限公司 | 捡拾信号的声重放方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338086A (ja) * | 2004-05-26 | 2005-12-08 | Honda Research Inst Europe Gmbh | バイノーラル信号に基づいた音源定位 |
-
2009
- 2009-01-16 KR KR1020090003761A patent/KR101038574B1/ko not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338086A (ja) * | 2004-05-26 | 2005-12-08 | Honda Research Inst Europe Gmbh | バイノーラル信号に基づいた音源定位 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109215667A (zh) * | 2017-06-29 | 2019-01-15 | 华为技术有限公司 | 时延估计方法及装置 |
CN109215667B (zh) * | 2017-06-29 | 2020-12-22 | 华为技术有限公司 | 时延估计方法及装置 |
US11304019B2 (en) | 2017-06-29 | 2022-04-12 | Huawei Technologies Co., Ltd. | Delay estimation method and apparatus |
US11950079B2 (en) | 2017-06-29 | 2024-04-02 | Huawei Technologies Co., Ltd. | Delay estimation method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
KR20100084332A (ko) | 2010-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3542546B1 (en) | Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices | |
EP3103269B1 (en) | Audio signal processing device and method for reproducing a binaural signal | |
JP5813082B2 (ja) | モノラル信号を立体音響化するための装置及び方法 | |
GB2540175A (en) | Spatial audio processing apparatus | |
WO2016077317A1 (en) | Virtual sound systems and methods | |
TW201727623A (zh) | 聲場增強裝置及方法 | |
KR101871234B1 (ko) | 사운드 파노라마 생성 장치 및 방법 | |
EP2802161A1 (en) | Method and device for localizing multichannel audio signal | |
CN102550048B (zh) | 一种用于处理音频信号的方法和装置 | |
KR101038574B1 (ko) | 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체 | |
Akeroyd et al. | The binaural performance of a cross-talk cancellation system with matched or mismatched setup and playback acoustics | |
KR20220038478A (ko) | 공간 변환 도메인에서 음장 표현을 처리하기 위한 장치, 방법 또는 컴퓨터 프로그램 | |
Ogami et al. | Virtual sound source construction based on radiation direction control using multiple parametric array loudspeakers | |
JP2011211312A (ja) | 音像定位処理装置及び音像定位処理方法 | |
EP2268064A1 (en) | Device and method for converting spatial audio signal | |
KR20160039674A (ko) | 일정-파워 페어와이즈 패닝을 갖는 매트릭스 디코더 | |
EP3700233A1 (en) | Transfer function generation system and method | |
Winter et al. | Colouration in local wave field synthesis | |
CN109923877B (zh) | 对立体声音频信号进行加权的装置和方法 | |
Winter | Local sound field synthesis | |
Floros et al. | Spatial enhancement for immersive stereo audio applications | |
US10887717B2 (en) | Method for acoustically rendering the size of sound a source | |
KR20070108341A (ko) | 스테레오 스피커 환경에서 가상 스피커 기술을 사용한입체음향 재생 장치 및 방법 | |
Kamado et al. | Object-based stereo up-mixer for wave field synthesis based on spatial information clustering | |
Jin | A tutorial on immersive three-dimensional sound technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20090116 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20101029 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20110523 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20110526 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20110527 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20140514 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20140514 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160511 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20160511 Start annual number: 6 End annual number: 6 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20180306 |