KR102686742B1 - 객체 기반 오디오 신호 균형화 - Google Patents
객체 기반 오디오 신호 균형화 Download PDFInfo
- Publication number
- KR102686742B1 KR102686742B1 KR1020187014900A KR20187014900A KR102686742B1 KR 102686742 B1 KR102686742 B1 KR 102686742B1 KR 1020187014900 A KR1020187014900 A KR 1020187014900A KR 20187014900 A KR20187014900 A KR 20187014900A KR 102686742 B1 KR102686742 B1 KR 102686742B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- term
- conversation
- balance
- conversational
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 71
- 230000007774 longterm Effects 0.000 claims abstract description 122
- 238000000034 method Methods 0.000 claims abstract description 83
- 230000002452 interceptive effect Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 17
- 238000009877 rendering Methods 0.000 claims description 11
- 230000003068 static effect Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/005—Control by a pilot signal
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Stereophonic System (AREA)
Abstract
Description
도 1은 일반적으로 대화 제어 및 향상 시스템의 일례를 도시한다.
도 2는 일반적으로 다중 채널 음량 처리 스킴을 나타내는 블록도를 도시한다.
도 3은 일반적으로 대화 신호 및/또는 비대화 신호에 적용할 장기 이득 또는 감쇠를 결정하는 단계를 포함하는 방법을 도시한다.
도 4는 일반적으로 대화 신호 및/또는 비대화 신호의 음량을 조정하는 단계를 포함하는 방법을 도시한다.
도 5는 일반적으로 대화 신호 및/또는 비대화 신호에 단기 이득 또는 감쇠를 적용하는 단계를 포함하는 방법을 도시한다.
도 6은 일반적으로 대화 오디오 신호 파형 및 비대화 오디오 신호 파형의 일례를 도시한다.
도 7은 일반적으로 대화 오디오 신호 및/또는 비대화 오디오 신호의 단기 음량 척도들의 일례를 도시한다.
도 8은 일반적으로 단기 대화 균형 척도와 이득 또는 감쇠 오프셋 사이의 매핑의 일례를 도시한다.
도 9는 일반적으로 대화 신호 또는 비대화 신호에 대한 단기 균형 신호, 평탄화된 단기 균형 신호 및 이득 또는 감쇠 오프셋의 일례를 도시한다.
도 10은 일반적으로 향상된 대화 신호 파형 및 비대화 신호 파형의 일례를 도시한다.
도 11은 일반적으로 장기 및 단기 신호 균형화를 포함하는 방법을 도시한다.
Claims (20)
- 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법으로서,
클라이언트 디바이스의 프로세서 회로를 사용하여, 상기 오디오 프로그램에 대한 장기 대화 균형(long-term dialog balance)을 수신하는 단계 - 상기 장기 대화 균형은 상기 오디오 프로그램의 대화/비대화 음량(dialog-to-non-dialog loudness) 관계를 나타냄 -;
상기 프로세서 회로를 사용하여, 장기 대화 균형 선호(preference)를 수신하는 단계;
상기 프로세서 회로를 사용하여, 상기 오디오 프로그램의 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용할 장기 이득 또는 감쇠를 결정하는 단계 - 상기 장기 이득 또는 감쇠는, 상기 오디오 프로그램에 대한 상기 수신된 장기 대화 균형과 상기 수신된 장기 대화 균형 선호 간의 차이에 따라 결정됨 - ;
상기 프로세서 회로를 사용하여, 상기 오디오 프로그램의 다수의 세그먼트 각각에 대한 단기 대화 균형을 수신하거나 모니터링하는 단계 - 각각의 단기 대화 균형은 지정된 세그먼트에 대한 대화/비대화 음량 관계를 나타냄 -;
상기 프로세서 회로를 사용하여, 단기 대화 균형 선호를 수신하는 단계;
상기 프로세서 회로를 사용하여, 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용할 단기 이득 또는 감쇠를 결정하는 단계 - 상기 단기 이득 또는 감쇠는, 상기 세그먼트들 중 지정된 하나의 세그먼트에 대한 수신되거나 모니터링된 단기 대화 균형과 상기 단기 대화 균형 선호 간의 차이에 따라 결정됨 - ;
(1) 상기 결정된 장기 이득 또는 감쇠를 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용하고 (2) 상기 결정된 단기 이득 또는 감쇠를 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용함으로써, 이득 조정된 대화 신호 및 이득 조정된 비대화 신호 중 적어도 하나를 제공하는 단계; 및
상기 이득 조정된 대화 신호 및 상기 이득 조정된 비대화 신호 중 적어도 하나를 포함하는 오디오 출력 신호를 렌더링하는 단계
를 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 오디오 프로그램의 상기 대화 신호에 적용할 상기 장기 이득을 결정하는 단계;
상기 프로세서 회로를 사용하여 상기 대화 신호에 상기 결정된 장기 이득을 적용하여 이득 조정된 대화 신호를 생성하는 단계; 및
상기 이득 조정된 대화 신호와 상기 비대화 신호의 결합을 포함하는 오디오 출력 신호를 렌더링하는 단계
를 더 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 오디오 프로그램의 상기 대화 신호에 적용할 상기 장기 감쇠를 결정하는 단계;
상기 프로세서 회로를 사용하여 상기 대화 신호에 상기 결정된 장기 감쇠를 적용하여 조정된 대화 신호를 생성하는 단계; 및
상기 조정된 대화 신호와 상기 비대화 신호의 결합을 포함하는 오디오 출력 신호를 렌더링하는 단계
를 더 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 대화 신호 및 상기 비대화 신호에 적용할 상이한 각각의 장기 이득 또는 감쇠 양을 결정하는 단계
를 더 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 프로세서 회로를 사용하여, 상기 오디오 프로그램의 상기 대화 신호에 대응하는 장기 대화 음량 메트릭을 수신하는 단계;
상기 오디오 프로그램의 상기 비대화 신호에 대응하는 장기 비대화 음량 메트릭을 수신하는 단계; 및
상기 프로세서 회로를 사용하여, 상기 수신된 대화 음량 메트릭과 비대화 음량 메트릭 간의 차이에 기초하여 상기 장기 대화 균형을 제공하는 단계
를 더 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 프로세서 회로에서 상기 대화 신호를 수신하는 단계 - 상기 대화 신호는 상기 오디오 프로그램에 대한 상기 대화 신호의 전역적(global) 음량에 대한 정보를 갖는 제1 메타데이터를 포함함 -;
상기 프로세서 회로에서 상기 비대화 신호를 수신하는 단계 - 상기 비대화 신호는 상기 오디오 프로그램에 대한 상기 비대화 신호의 전역적 음량에 대한 정보를 갖는 제2 메타데이터를 포함함 -
를 더 포함하고;
상기 오디오 프로그램에 대한 상기 장기 대화 균형을 수신하는 단계는, 상기 프로세서 회로를 사용하여, 상기 대화 신호의 상기 전역적 음량 및 상기 비대화 신호의 상기 전역적 음량에 기초하여 상기 장기 대화 균형을 결정하는 단계를 포함하는 것인, 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 장기 이득 또는 감쇠를 결정하는 단계는, 상기 오디오 프로그램의 지속기간 동안 상기 대화 신호에 적용할 정적 이득 또는 감쇠를 결정하는 단계를 포함하는 것인, 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
대화 음량 선호를 수신하는 단계는, 장르 특유 대화 음량 선호를 수신하는 단계를 포함하고, 상기 장르 특유 대화 음량 선호는 상기 오디오 프로그램의 장르에 대응하는 것인, 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제8항에 있어서,
상기 대화 신호 및 상기 비대화 신호 중 적어도 하나로부터 복구된 메타데이터에 기초하여 상기 오디오 프로그램의 상기 장르를 결정하는 단계를 더 포함하는 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
대화 음량 선호를 수신하는 단계는, 재생 디바이스 고유 대화 음량 선호를 수신하는 단계를 포함하고, 상기 재생 디바이스 고유 대화 음량 선호는 상기 오디오 프로그램을 플레이하도록 구성되는 재생 디바이스에 대응하는 것인, 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 제1항에 있어서,
상기 단기 대화 균형 선호는 임계치를 정의하고,
상기 세그먼트들 중 지정된 하나의 세그먼트에 대한 수신되거나 모니터링된 단기 대화 균형과 상기 단기 대화 균형 선호 간의 차이에 따라 단기 이득 또는 감쇠를 결정하는 단계는, 상기 단기 대화 균형이 상기 임계치 아래로 떨어지지 않도록 상기 단기 이득 또는 감쇠를 결정하는 단계를 포함하는 것인, 오디오 프로그램 내의 대화 및 비대화 신호들 간의 관계를 조정하기 위한 방법. - 삭제
- 오디오 신호 처리 시스템으로서,
디코더 디바이스
를 포함하고, 상기 디코더 디바이스는,
대화 신호, 비대화 신호, 및 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 대응하는 메타데이터를 수신하도록 구성된 제1 데이터 입력;
장기 대화 균형 선호 및 단기 대화 균형 선호를 수신하도록 구성된 제2 데이터 입력;
오디오 신호 출력; 및
프로세서 회로
를 포함하고, 상기 프로세서 회로는,
상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 대응하는 상기 메타데이터를 사용하여, 상기 대화 신호 및 상기 비대화 신호를 포함하는 오디오 프로그램에 대한 장기 대화 균형을 식별하고 - 상기 장기 대화 균형은 상기 오디오 프로그램의 대화/비대화 음량 관계를 나타냄 -;
상기 오디오 프로그램의 상기 대화 신호 및 상기 비대화 신호 중 하나에 적용할 장기 이득 또는 감쇠를 결정하고 - 상기 장기 이득 또는 감쇠는 상기 오디오 프로그램에 대한 상기 식별된 장기 대화 균형과 상기 수신된 장기 대화 균형 선호 간의 차이에 기초함 -;
상기 오디오 프로그램의 다수의 세그먼트 각각에 대한 단기 대화 균형을, 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 대응하는 상기 메타데이터를 사용하여 식별하거나, 모니터링하고 - 각각의 단기 대화 균형은 지정된 세그먼트에 대한 대화/비대화 음량 관계를 나타냄 -;
상기 대화 신호 및 상기 비대화 신호 중 하나에 적용할 단기 이득 또는 감쇠를 결정하고 - 상기 단기 이득 또는 감쇠는, 상기 세그먼트들 중 지정된 하나의 세그먼트에 대한 식별되거나 모니터링된 단기 대화 균형과 상기 단기 대화 균형 선호 간의 차이에 기초함 - ;
(1) 상기 결정된 장기 이득 또는 감쇠를 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용하고 (2) 상기 결정된 단기 이득 또는 감쇠를 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 적용함으로써, 이득 조정된 대화 신호 및 이득 조정된 비대화 신호 중 적어도 하나를 제공하고;
상기 이득 조정된 대화 신호 및 상기 이득 조정된 비대화 신호 중 적어도 하나를 포함하는 오디오 출력 신호를 렌더링하도록 구성되는 것인 오디오 신호 처리 시스템. - 제13항에 있어서,
상기 디코더 디바이스는 상기 대화 신호 및 상기 비대화 신호 중 적어도 하나에 대응하는 오디오 프로그램 타입 표시를 수신하도록 구성된 제3 입력을 포함하고,
상기 프로세서 회로는, 상기 오디오 프로그램 타입 표시 및 상기 오디오 프로그램에 대한 상기 식별된 장기 대화 균형과 상기 수신된 대화 균형 선호 간의 차이에 기초하여 상기 장기 이득 또는 감쇠를 결정하도록 구성되는 것인, 오디오 신호 처리 시스템. - 제13항에 있어서,
상기 제1 데이터 입력은 상기 대화 신호 및 상기 비대화 신호에 대응하는 메타데이터를 수신하도록 구성되고,
상기 프로세서 회로는 상기 대화 및 비대화 신호들에 대응하는 상기 수신된 메타데이터에 기초하여 상기 대화 및 비대화 신호들의 각각의 장기 음량 특성을 식별하도록 구성되고,
상기 프로세서 회로는 상기 대화 및 비대화 신호들의 상기 장기 음량 특성들 간의 관계에 기초하여 상기 오디오 프로그램에 대한 상기 장기 대화 균형을 식별하도록 구성되는 것인, 오디오 신호 처리 시스템. - 제13항에 있어서,
상기 단기 대화 균형 선호는 임계치를 정의하고,
상기 세그먼트들 중 지정된 하나의 세그먼트에 대한 식별되거나 모니터링된 단기 대화 균형과 상기 단기 대화 균형 선호 간의 차이에 따라 단기 이득 또는 감쇠를 결정하는 것은, 상기 단기 대화 균형이 상기 임계치 아래로 떨어지지 않도록 상기 단기 이득 또는 감쇠를 결정하는 것을 포함하는 것인, 오디오 신호 처리 시스템. - 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562247678P | 2015-10-28 | 2015-10-28 | |
US62/247,678 | 2015-10-28 | ||
PCT/US2016/059175 WO2017075249A1 (en) | 2015-10-28 | 2016-10-27 | Object-based audio signal balancing |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180132032A KR20180132032A (ko) | 2018-12-11 |
KR102686742B1 true KR102686742B1 (ko) | 2024-07-19 |
Family
ID=58630724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187014900A KR102686742B1 (ko) | 2015-10-28 | 2016-10-27 | 객체 기반 오디오 신호 균형화 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10251016B2 (ko) |
EP (1) | EP3369175B1 (ko) |
JP (1) | JP7001588B2 (ko) |
KR (1) | KR102686742B1 (ko) |
CN (1) | CN108432130B (ko) |
WO (1) | WO2017075249A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2749832B1 (fr) * | 1996-06-12 | 1998-09-11 | Delmas | Systeme de recuperation d'eau de condensation a l'interieur de conteneurs, et conteneur equipe d'un tel systeme de recuperation |
JP7001588B2 (ja) | 2015-10-28 | 2022-01-19 | ジャン-マルク ジョット | オブジェクトベースのオーディオ信号バランシング法 |
CA3078420A1 (en) | 2017-10-17 | 2019-04-25 | Magic Leap, Inc. | Mixed reality spatial audio |
IL305799B2 (en) | 2018-02-15 | 2024-10-01 | Magic Leap Inc | Mixed reality virtual reverberation |
CN112236940B (zh) | 2018-05-30 | 2024-08-23 | 奇跃公司 | 用于滤波器参数的索引方案 |
KR102707037B1 (ko) | 2019-03-14 | 2024-09-19 | 가우디오랩 주식회사 | 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치 |
US11545166B2 (en) | 2019-07-02 | 2023-01-03 | Dolby International Ab | Using metadata to aggregate signal processing operations |
CN114586382A (zh) | 2019-10-25 | 2022-06-03 | 奇跃公司 | 混响指纹估计 |
US11533560B2 (en) | 2019-11-15 | 2022-12-20 | Boomcloud 360 Inc. | Dynamic rendering device metadata-informed audio enhancement system |
WO2021099363A2 (en) | 2019-11-20 | 2021-05-27 | Dolby International Ab | Methods and devices for personalizing audio content |
JP7587432B2 (ja) | 2020-01-31 | 2024-11-20 | 日本放送協会 | ラウドネス測定装置及びプログラム |
CN111327944A (zh) * | 2020-03-09 | 2020-06-23 | 上海电力大学 | 一种基于嵌入式cpu的广播语音响度检测的方法 |
JP2023521849A (ja) * | 2020-04-13 | 2023-05-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオディスクリプションの自動ミキシング |
US12177646B2 (en) | 2020-05-26 | 2024-12-24 | Dolby International Ab | Main-associated audio experience with efficient ducking gain application |
CN117280416A (zh) | 2021-03-08 | 2023-12-22 | 弗劳恩霍夫应用研究促进协会 | 用于自适应背景音频增益平滑的装置和方法 |
CN113963724A (zh) * | 2021-09-18 | 2022-01-21 | 赛因芯微(北京)电子科技有限公司 | 音频内容元数据和产生方法、电子设备及存储介质 |
US20240038256A1 (en) * | 2022-08-01 | 2024-02-01 | Lucasfilm Entertainment Company Ltd. LLC | Optimization for technical targets in audio content |
WO2024168003A1 (en) * | 2023-02-07 | 2024-08-15 | Dts, Inc. | Dialog intelligibility enhancement method and system |
CN115879422B (zh) * | 2023-02-16 | 2023-06-13 | 之江实验室 | 一种对话回复生成方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001058064A1 (en) * | 2000-02-04 | 2001-08-09 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (vra) in consumer applications |
WO2012039918A1 (en) * | 2010-09-22 | 2012-03-29 | Dolby Laboratories Licensing Corporation | Audio stream mixing with dialog level normalization |
US20150078585A1 (en) * | 2012-04-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | System and method for leveling loudness variation in an audio signal |
US20150146886A1 (en) | 2013-11-25 | 2015-05-28 | Apple Inc. | Loudness normalization based on user feedback |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9909675A (pt) * | 1998-04-14 | 2001-10-30 | Hearing Enhancement Co Llc | Controle de volume ajustável de usuário queacomoda a audição |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
JP4240805B2 (ja) * | 2000-12-01 | 2009-03-18 | 株式会社日立製作所 | ビデオカメラ |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
JP4016206B2 (ja) * | 2003-11-28 | 2007-12-05 | ソニー株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP4381892B2 (ja) * | 2004-06-04 | 2009-12-09 | 日本放送協会 | 音質補正伝送における送信装置、及び受信装置 |
JP4197344B2 (ja) * | 2006-02-20 | 2008-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声対話システム |
BRPI0716521A2 (pt) | 2006-09-14 | 2013-09-24 | Lg Electronics Inc | tÉcnicas de melhoria de diÁlogo |
US8489392B2 (en) * | 2006-11-06 | 2013-07-16 | Nokia Corporation | System and method for modeling speech spectra |
US20100046765A1 (en) * | 2006-12-21 | 2010-02-25 | Koninklijke Philips Electronics N.V. | System for processing audio data |
CN101606195B (zh) | 2007-02-12 | 2012-05-02 | 杜比实验室特许公司 | 用于年长或听力受损的收听者的改进的语音与非语音音频比值 |
SG189747A1 (en) | 2008-04-18 | 2013-05-31 | Dolby Lab Licensing Corp | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
PL2614586T3 (pl) * | 2010-09-10 | 2017-05-31 | Dts, Inc. | Dynamiczna kompensacja sygnałów audio dla poprawy postrzeganych braków balansu spektralnego |
TWI733583B (zh) * | 2010-12-03 | 2021-07-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
JP5279099B1 (ja) * | 2012-03-14 | 2013-09-04 | 住友電工ハードメタル株式会社 | 切削工具 |
CN103377656B (zh) * | 2012-04-16 | 2016-08-10 | 联想(北京)有限公司 | 一种音频文件的五音分析方法、播放器及电子设备 |
EP4207817A1 (en) * | 2012-08-31 | 2023-07-05 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US20140126736A1 (en) * | 2012-11-02 | 2014-05-08 | Daniel M. Gauger, Jr. | Providing Audio and Ambient Sound simultaneously in ANR Headphones |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN117767898A (zh) * | 2013-09-12 | 2024-03-26 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
US9578436B2 (en) | 2014-02-20 | 2017-02-21 | Bose Corporation | Content-aware audio modes |
JP7001588B2 (ja) | 2015-10-28 | 2022-01-19 | ジャン-マルク ジョット | オブジェクトベースのオーディオ信号バランシング法 |
-
2016
- 2016-10-27 JP JP2018522683A patent/JP7001588B2/ja active Active
- 2016-10-27 WO PCT/US2016/059175 patent/WO2017075249A1/en active Application Filing
- 2016-10-27 US US15/336,382 patent/US10251016B2/en active Active
- 2016-10-27 KR KR1020187014900A patent/KR102686742B1/ko active IP Right Grant
- 2016-10-27 CN CN201680073125.4A patent/CN108432130B/zh active Active
- 2016-10-27 EP EP16860811.5A patent/EP3369175B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001058064A1 (en) * | 2000-02-04 | 2001-08-09 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (vra) in consumer applications |
WO2012039918A1 (en) * | 2010-09-22 | 2012-03-29 | Dolby Laboratories Licensing Corporation | Audio stream mixing with dialog level normalization |
US20150078585A1 (en) * | 2012-04-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | System and method for leveling loudness variation in an audio signal |
US20150146886A1 (en) | 2013-11-25 | 2015-05-28 | Apple Inc. | Loudness normalization based on user feedback |
Also Published As
Publication number | Publication date |
---|---|
JP7001588B2 (ja) | 2022-01-19 |
EP3369175A1 (en) | 2018-09-05 |
EP3369175B1 (en) | 2024-01-10 |
JP2019501563A (ja) | 2019-01-17 |
CN108432130A (zh) | 2018-08-21 |
CN108432130B (zh) | 2022-04-01 |
EP3369175A4 (en) | 2019-05-08 |
EP3369175C0 (en) | 2024-01-10 |
US20170127212A1 (en) | 2017-05-04 |
WO2017075249A1 (en) | 2017-05-04 |
US10251016B2 (en) | 2019-04-02 |
KR20180132032A (ko) | 2018-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102686742B1 (ko) | 객체 기반 오디오 신호 균형화 | |
US10958229B2 (en) | Metadata for loudness and dynamic range control | |
US10276173B2 (en) | Encoded audio extended metadata-based dynamic range control | |
CN110675883B (zh) | 用于下混合音频内容的响度调整 | |
CN109036443B (zh) | 用于在不同回放设备之间优化响度和动态范围的系统和方法 | |
CN105556837B (zh) | 用于各种回放环境的动态范围控制 | |
EP3111677B1 (en) | Object-based audio loudness management | |
KR101538623B1 (ko) | 두 개의 입력 오디오 신호 믹싱 방법, 및 이를 실행하기 위한 디코더 및 컴퓨터 판독가능한 매체, 및 입력 오디오 신호 믹싱 디바이스 | |
US20150280676A1 (en) | Metadata for ducking control | |
US20220059102A1 (en) | Methods, Apparatus and Systems for Dual-Ended Media Intelligence | |
WO2024168003A1 (en) | Dialog intelligibility enhancement method and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20180525 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210909 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230911 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20240507 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240716 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240716 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |