Nothing Special   »   [go: up one dir, main page]

CN114051194A - 一种音频轨道元数据和生成方法、电子设备及存储介质 - Google Patents

一种音频轨道元数据和生成方法、电子设备及存储介质 Download PDF

Info

Publication number
CN114051194A
CN114051194A CN202111204386.4A CN202111204386A CN114051194A CN 114051194 A CN114051194 A CN 114051194A CN 202111204386 A CN202111204386 A CN 202111204386A CN 114051194 A CN114051194 A CN 114051194A
Authority
CN
China
Prior art keywords
audio
audio track
format
metadata
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111204386.4A
Other languages
English (en)
Inventor
吴健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saiyinxin Micro Beijing Electronic Technology Co ltd
Original Assignee
Saiyinxin Micro Beijing Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saiyinxin Micro Beijing Electronic Technology Co ltd filed Critical Saiyinxin Micro Beijing Electronic Technology Co ltd
Priority to CN202111204386.4A priority Critical patent/CN114051194A/zh
Publication of CN114051194A publication Critical patent/CN114051194A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开涉及一种音频轨道元数据和生成方法、电子设备及存储介质。该音频轨道元数据,包括:属性区,包括音频轨道名称、音频轨道标识和音频轨道格式描述信息;子元素区,包括音频流格式引用信息。音频数据在渲染时在空间中能够实现三维声音的复现,从而提高了声音场景的质量。

Description

一种音频轨道元数据和生成方法、电子设备及存储介质
技术领域
本公开涉及音频处理的技术领域,尤其涉及一种音频轨道元数据和生成方法、电子设备及存储介质。
背景技术
随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
本公开提供了一种音频轨道元数据和构造方法,以便提供一种能够解决上述技术问题的元数据。
发明内容
本公开的目的在于提出一种音频轨道元数据和生成方法、电子设备及存储介质,以解决上述技术问题之一。
为实现上述目的,本公开第一方面提供了一种音频轨道元数据,包括:
属性区,包括音频轨道名称、音频轨道标识和音频轨道格式描述信息;
子元素区,包括音频流格式引用信息。
为实现上述目的,本公开第二方面提供了一种音频轨道元数据的生成方法,包括:
生成包括如第一方面所述音频轨道元数据。
为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器生成包括如第一方面所述音频轨道元数据。
为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器生成包括如第一方面所述音频轨道元数据。
由上可见,本公开音频轨道元数据,用于描述音频数据的格式,允许渲染器正确解码信号。以在空间中能够实现三维声音的复现,从而提高了声音场景的质量。
附图说明
图1为本公开实施例1中提供了一种三维声音频制作模型的示意图;
图2为本公开实施例2中提供的一种音频轨道元数据的生成方法的流程图;
图3为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
如图1所示,三维声音频制作模型由一组制作元素组成,每个制作元素用于描述音频制作的一个阶段,三维声音频制作模型包括内容制作部分和格式制作部分。
其中,所述内容制作部分包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素;所述格式制作部分包括:音频包格式元素、音频通道格式元素、音频流格式元素和音频轨道格式元素;
所述音频节目元素引用至少一个所述音频内容元素;所述音频内容元素引用至少一个音频对象元素;所述音频对象元素引用对应的所述音频包格式元素和对应的所述音轨唯一标识元素;所述音轨唯一标识元素引用对应的所述音频轨道格式元素和对应的所述音频包格式元素;
所述音频包格式元素引用至少一个所述音频通道格式元素;所述音频流格式元素引用对应的所述音频通道格式元素和对应的所述音频包格式元素;所述音频轨道格式元素和对应的所述音频流格式元素相互引用。元素间的引用关系在图1中以箭头表示。
音频节目可以包括但不限于叙述、声音效果和背景音乐,所述音频节目元素可以用于描述节目,所述节目包括至少一个内容,所述音频内容元素用于描述所述音频节目元素中对应的一个内容。音频节目元素可以引用一个或多个音频内容元素,音频内容元素组合在一起以构建为完整的音频节目元素。
所述音频内容元素描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象元素将内容与其格式联系起来。
所述音频对象元素用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。
所述音频包格式元素,可以用于描述所述音频对象元素和原始音频数据依据通道分组打包时采用的格式。
流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式建立音频轨道格式集和音频通道格式集或音频包格式之间的关系。
所述音频通道格式元素可以用于表示单个音频采样序列和对其执行的预设操作,例如,在场景中渲染对象的移动。所述音频通道格式元素可以包含至少一个音频块格式元素。音频块格式元素可以视为音频通道格式元素的子元素,所以,音频通道格式元素和音频块格式元素之间为一种包含关系。
通过三维声音频制作模型对原始音频数据进行制作后生成包含元数据的合成音频数据。
所述元数据(Metadata)是描述数据特性的信息,元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
合成音频数据以通信方式传输到远端后,由远端基于元数据对合成音频数据进行渲染,还原原始声音场景。
图1中示出了内容制作部分、格式制作部分和BW64(Broadcast Wave-64bit,64位广播波)文件之间的划分。内容制作部分和格式制作部分都构成了XML格式的元数据,它通常包含在BW64文件的一个块(“axml”块)中。底部的BW64文件部分包含“通道分配(chna)”块,它是一个查找表,用于连接元数据和文件中的音频节目。
实施例1
本公开提供了三维声音频模型中的一种音频轨道元数据,并进行详细说明。
音频轨道格式元素对应于存储介质中单个音轨中的一组样本或数据。它用于描述数据的格式,允许渲染器正确解码信号。它来自音频流格式元素,用于识别成功解码音轨数据所需的音轨组合。
该音频轨道元数据,包括:
属性区,包括音频轨道名称、音频轨道标识和音频轨道格式描述信息;
子元素区,包括音频流格式引用信息。
其中,属性区包括对音频轨道元数据的通用定义。音频轨道名称可以是为音频轨道设置的名称,用户可以通过音频轨道名称来确定音频轨道。音频轨道标识为音频轨道的标识符号。音频轨道格式描述信息可以包括格式标签和/或格式定义,可以采用格式标签和/或格式定义表示轨道的类型,轨道的类型与音频轨道描述的音频的编码格式相对应。音频流格式的格式定义指定它所描述的音频的编码格式,所述格式定义可以包括PCM音频编码格式和非PCM音频编码格式。脉冲编码调制(Pulse Code Modulation,PCM)是音频数据的编码格式。格式标签可以是数字代码,每种流的类型可以有对应的数字代码表示。例如,PCM类型的流以0001表示。
对于PCM音频,音频流格式将指单个音频轨道格式,因此音频轨道格式和音频流格式这两个元素有效地描述了同一事物。对于非PCM音频,必须将多个音频轨道格式组合在一个音频流格式中以生成可解码数据。
解析模型的软件可以从音频轨道格式或音频流格式开始。为了实现这种灵活性,音频轨道格式还可以引用音频流格式。但是,严格要求的是,如果音频轨道格式使用此引用,音频流格式必须引用回引用它的音频轨道格式。所述音频流格式引用信息可以包括音频流标识,从而指示音频轨道格式所引用的音频流格式。
所述音频轨道标识可以包括:用于指示音频轨道所属音频流的音频流标识和用于指示所述音频轨道在所述音频流中的编号。其中,对于非PCM音频,必须将多个音频轨道格式组合在一个音频流格式中以生成可解码数据。所以,一个音频流中包含多个音频轨道,音频轨道标识中就需要包含该音频轨道在对应音频流中的编号。可以理解的是,对于PCM音频,音频流格式将指单个音频轨道格式,那么该音频轨道格式的音频轨道标识中,音频轨道在音频流中的编号就是唯一的,例如可以是01。
可选的,音频轨道标识可以包含一组8位十六进制数字和一组2位十六进制数字。8位十六进制数字在前的四位数字表示音频轨道中包含的音频类型,在后的四位数字表示相对应的音频流格式。例如,音频轨道标识为AT_yyyxxxx_nn,yyyy表示轨道中包含的音频类型,xxxx与音频流格式的音频流标识的数字相匹配,nn数字表示流中的音频轨道的编号(可以从01开始)。属性区包括的信息如表1所示,
表1
Figure BDA0003306253980000061
Figure BDA0003306253980000071
表1中,需求一项是指在生成音频轨道元数据时,是否需要设置该项属性,“是”表示该项属性为必须项,“可选”表示该项属性为可选项,而格式定义和格式标签至少需要设置其中之一。
子元素区包括的信息如表2所示,
表2
Figure BDA0003306253980000072
表2中数量一项表明子元素可以设置的数量,音频轨道格式可以引用音频流格式,audioStreamFormatIDRef的数量则为1。
实施例2
本公开还提供了与上述实施例承接的方法实施例,用于音频轨道元数据的生成方法,基于相同的名称含义的解释与如上实施例相同,具有与如上实施例相同的技术效果,此处不再赘述。
一种音频轨道元数据的生成方法,如图2所示,包括以下步骤:
步骤S110,响应于用户针对音频轨道元数据的设置操作,生成音频轨道元数据,所述音频轨道元数据包括:
属性区,包括音频轨道名称、音频轨道标识和音频轨道格式描述信息;
子元素区,包括音频流格式引用信息。
用户针对音频轨道元数据的设置操作,可以是用户针对音频轨道元数据的相关属性进行设置的操作,例如,接收用户逐项输入的音频轨道元数据的相关属性;或者,根据用户对预设元数据生成程序的操作自动生成音频轨道元数据,该预设元数据生成程序可以设置为根据系统默认属性设置音频轨道元数据的全部属性;或者,根据用户对预设元数据生成程序的操作自动生成音频轨道元数据,该预设元数据生成程序可以设置为根据系统默认属性设置音频轨道元数据的部分属性,然后接收用户输入的剩余属性。
可选的,所述音频轨道标识包括:用于指示音频轨道所属音频流的音频流标识和用于指示所述音频轨道在所述音频流中的编号。
可选的,所述音频轨道格式描述信息,包括格式标签和/或格式定义。
可选的,所述格式定义包括PCM音频编码格式和非PCM音频编码格式。
可选的,所述音频流格式引用信息包括音频流标识。
示例性,设置音频轨道元数据的方法可以采用如下编码方式:
<audioTrackFormat audioTrackFormatID="AT_00010001_01"
audioTrackFormatName="PCM_FrontLeft"
formatDefinition="PCM"formatLabel="0001">
<audioStreamFormatIDRef>AS_00010001</audioStreamFormatID Ref>
</audioTrackFormat>
本公开实施例音频轨道元数据的生成方法生成的音频轨道元数据,描述数据的格式,允许渲染器正确解码信号,在空间中能够实现三维声音的复现,从而提高了声音场景的质量。
实施例3
图3为本公开实施例3提供的一种电子设备的结构示意图。如图3所示,该电子设备包括:处理器30、存储器31、输入装置32以及输出装置33。该电子设备中处理器30的数量可以是一个或者多个,图3中以一个处理器30为例。该电子设备中存储器31的数量可以是一个或者多个,图3中以一个存储器31为例。该电子设备的处理器30、存储器31、输入装置32以及输出装置33可以通过总线或者其他方式连接,图3中以通过总线连接为例。该电子设备可以是电脑和服务器等。本公开实施例以电子设备为服务器进行详细说明,该服务器可以是独立服务器或集群服务器。
存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本公开任意实施例所述产生音频轨道元数据的程序指令/模块。存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置32可用于接收输入的数字或者字符信息,以及产生与电子设备的观众用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置33可以包括扬声器等音频设备。需要说明的是,输入装置32和输出装置33的具体组成可以根据实际情况设定。
处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即生成音频轨道元数据。
实施例4
本公开实施例4还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器生成包括如实施例1所述音频轨道元数据。
当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的电子方法操作,还可以执行本公开任意实施例所提供的电子方法中的相关操作,且具备相应的功能和有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本公开任意实施例所述的电子方法。
值得注意的是,上述电子装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“在一实施例中”、“在又一实施例中”、“示例性的”或“在具体的实施例中”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本公开作了详尽的描述,但在本公开基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本公开精神的基础上所做的这些修改或改进,均属于本公开要求保护的范围。

Claims (8)

1.一种音频轨道元数据,其特征在于,包括:
属性区,包括音频轨道名称、音频轨道标识和音频轨道格式描述信息;
子元素区,包括音频流格式引用信息。
2.根据权利要求1所述的音频轨道元数据,其特征在于,所述音频轨道标识包括:用于指示音频轨道所属音频流的音频流标识和用于指示所述音频轨道在所述音频流中的编号。
3.根据权利要求1所述的音频轨道元数据,其特征在于,所述音频轨道格式描述信息,包括格式标签和/或格式定义。
4.根据权利要求3所述的音频轨道元数据,其特征在于,所述格式定义包括PCM音频编码格式和非PCM音频编码格式。
5.根据权利要求1所述的音频轨道元数据,其特征在于,所述音频流格式引用信息包括音频流标识。
6.一种音频轨道元数据的生成方法,其特征在于,设置为生成包括如权利要求1-5任一项所述音频轨道元数据。
7.一种电子设备,其特征在于,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器生成包括如权利要求1-5任一项所述音频轨道元数据。
8.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器生成包括如权利要求1-5任一项所述音频轨道元数据。
CN202111204386.4A 2021-10-15 2021-10-15 一种音频轨道元数据和生成方法、电子设备及存储介质 Pending CN114051194A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111204386.4A CN114051194A (zh) 2021-10-15 2021-10-15 一种音频轨道元数据和生成方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111204386.4A CN114051194A (zh) 2021-10-15 2021-10-15 一种音频轨道元数据和生成方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114051194A true CN114051194A (zh) 2022-02-15

Family

ID=80205219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111204386.4A Pending CN114051194A (zh) 2021-10-15 2021-10-15 一种音频轨道元数据和生成方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114051194A (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101111894A (zh) * 2005-01-25 2008-01-23 尼禄股份公司 用于准备dvd视频格式数据的方法,用于重建dvd视频数据的方法和dvd视频数据的结构
CN101777370A (zh) * 2004-07-02 2010-07-14 苹果公司 音频数据的通用容器
CN101802823A (zh) * 2007-08-20 2010-08-11 诺基亚公司 用于流式多媒体数据的分段的元数据和位标
CN102246491A (zh) * 2008-10-08 2011-11-16 诺基亚公司 用于存储多源多媒体表示的系统和方法
US20110282650A1 (en) * 2010-05-17 2011-11-17 Avaya Inc. Automatic normalization of spoken syllable duration
WO2013006342A1 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation Synchronization and switchover methods and systems for an adaptive audio system
WO2013182901A1 (en) * 2012-06-07 2013-12-12 Actiwave Ab Non-linear control of loudspeakers
US20140123006A1 (en) * 2012-10-25 2014-05-01 Apple Inc. User interface for streaming media stations with flexible station creation
WO2018040102A1 (zh) * 2016-09-05 2018-03-08 华为技术有限公司 音频处理方法及设备
CN109273014A (zh) * 2015-03-13 2019-01-25 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
US20190265943A1 (en) * 2018-02-23 2019-08-29 Bose Corporation Content based dynamic audio settings
CN110600043A (zh) * 2013-06-19 2019-12-20 杜比实验室特许公司 音频处理单元、由音频处理单元执行的方法和存储介质
CN111542806A (zh) * 2017-10-12 2020-08-14 弗劳恩霍夫应用研究促进协会 用于高体验质量的音频消息的有效传递和使用的方法和装置
US20210050028A1 (en) * 2018-01-26 2021-02-18 Lg Electronics Inc. Method for transmitting and receiving audio data and apparatus therefor
WO2021047820A1 (en) * 2019-09-13 2021-03-18 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN112735445A (zh) * 2020-12-25 2021-04-30 广州朗国电子科技有限公司 自适应选择音轨的方法、装置及存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777370A (zh) * 2004-07-02 2010-07-14 苹果公司 音频数据的通用容器
CN101111894A (zh) * 2005-01-25 2008-01-23 尼禄股份公司 用于准备dvd视频格式数据的方法,用于重建dvd视频数据的方法和dvd视频数据的结构
CN101802823A (zh) * 2007-08-20 2010-08-11 诺基亚公司 用于流式多媒体数据的分段的元数据和位标
CN102246491A (zh) * 2008-10-08 2011-11-16 诺基亚公司 用于存储多源多媒体表示的系统和方法
US20110282650A1 (en) * 2010-05-17 2011-11-17 Avaya Inc. Automatic normalization of spoken syllable duration
WO2013006342A1 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation Synchronization and switchover methods and systems for an adaptive audio system
CN103621101A (zh) * 2011-07-01 2014-03-05 杜比实验室特许公司 用于自适应音频系统的同步化和切换方法及系统
WO2013182901A1 (en) * 2012-06-07 2013-12-12 Actiwave Ab Non-linear control of loudspeakers
US20140123006A1 (en) * 2012-10-25 2014-05-01 Apple Inc. User interface for streaming media stations with flexible station creation
CN110600043A (zh) * 2013-06-19 2019-12-20 杜比实验室特许公司 音频处理单元、由音频处理单元执行的方法和存储介质
CN109273014A (zh) * 2015-03-13 2019-01-25 杜比国际公司 解码具有增强的频谱带复制元数据的音频位流
WO2018040102A1 (zh) * 2016-09-05 2018-03-08 华为技术有限公司 音频处理方法及设备
CN111542806A (zh) * 2017-10-12 2020-08-14 弗劳恩霍夫应用研究促进协会 用于高体验质量的音频消息的有效传递和使用的方法和装置
US20210050028A1 (en) * 2018-01-26 2021-02-18 Lg Electronics Inc. Method for transmitting and receiving audio data and apparatus therefor
US20190265943A1 (en) * 2018-02-23 2019-08-29 Bose Corporation Content based dynamic audio settings
WO2021047820A1 (en) * 2019-09-13 2021-03-18 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN112735445A (zh) * 2020-12-25 2021-04-30 广州朗国电子科技有限公司 自适应选择音轨的方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
国际电信联盟: "音频定义模型", 《ITU-RBS.2076-1建议书 》 *
段卓骏: "广播系统流媒体传输的研究与实现", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Similar Documents

Publication Publication Date Title
JP6174326B2 (ja) 音響信号作成装置及び音響信号再生装置
CN114023339A (zh) 基于音床音频包格式元数据和产生方法、设备及介质
CN111164679B (zh) 编码装置和方法、解码装置和方法以及程序
CN113905321A (zh) 基于对象音频通道元数据和生成方法、设备及存储介质
CN114203189A (zh) 基于双耳音频包格式元数据和产生方法、设备及介质
CN114023340A (zh) 基于对象音频包格式元数据和产生方法、设备及介质
CN114979935A (zh) 一种对象输出渲染项确定方法、装置、设备及存储介质
CN114051194A (zh) 一种音频轨道元数据和生成方法、电子设备及存储介质
CN114203190A (zh) 基于矩阵音频包格式元数据和产生方法、设备及存储介质
CN114143695A (zh) 一种音频流元数据和生成方法、电子设备及存储介质
US20090088879A1 (en) Audio reproduction device and method for audio reproduction
CN114121036A (zh) 音轨唯一标识元数据和生成方法、电子设备及存储介质
CN114512152A (zh) 一种广播音频格式文件生成方法、装置、设备及存储介质
CN113905322A (zh) 基于双耳音频通道元数据和生成方法、设备及存储介质
CN115190412A (zh) 生成渲染器内部数据结构的方法、装置、设备及存储介质
CN114360556A (zh) 串行音频元数据帧生成方法、装置、设备及存储介质
CN113923264A (zh) 基于场景音频通道元数据和生成方法、设备及存储介质
CN113923584A (zh) 基于矩阵音频通道元数据和生成方法、设备及存储介质
CN113889128A (zh) 一种音频制作模型和生成方法、电子设备及存储介质
CN114530157A (zh) 音频元数据通道分配区块生成方法、装置、设备及介质
CN113938811A (zh) 基于音床音频通道元数据和生成方法、设备及存储介质
CN115426611A (zh) 利用元数据对基于对象的音频进行渲染的方法及装置
CN114363790A (zh) 串行音频块格式元数据生成方法、装置、设备及介质
CN115209310A (zh) 利用元数据对基于音床的音频进行渲染的方法及装置
CN114203188A (zh) 基于场景音频包格式元数据和产生方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220215

RJ01 Rejection of invention patent application after publication