一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频元数据通道分配区块生成方法、装置、设备及介质与流程

2022-05-26 23:41:09 来源:中国专利 TAG:


1.本公开涉及音频处理的技术领域,尤其涉及音频元数据通道分配区块生成方法、装置、设备及介质。


背景技术:

2.随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
3.音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
4.因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。


技术实现要素:

5.本公开的目的在于提出一种音频元数据通道分配区块生成方法、装置、设备及介质,以生成音频模型模式下的音频元数据通道分配区块,实现声音模型元数据的工作流。
6.本公开第一方面提供了一种音频元数据通道分配区块生成方法,包括:
7.获取音频元数据通道分配区块的标头属性和标头元素;
8.根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块;
9.其中,所述音频元数据通道分配区块用于连接音频模型元数据和广播音频格式文件中的音轨。
10.本公开第二方面提供了一种音频元数据通道分配区块生成装置,包括:
11.获取模块,用于获取音频元数据通道分配区块的标头属性和标头元素;
12.区块生成模块,用于根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块;
13.其中,所述音频元数据通道分配区块用于连接音频模型元数据和广播音频格式文件中的音轨。
14.本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
15.所述存储器,用于存储一个或多个程序;
16.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现如任意实施例提供的音频元数据通道分配区块生成方法。
17.本公开第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器实现如任意实施例提供的音频元数据通道分配区块生成方法。
18.由上可见,本公开音频元数据通道分配区块生成方法,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块;提供从广播波格式(bw64)文件中的每个音轨到元数据中唯一识别id的引用,如果id在标准音频模型配置预定义的值范围内,音频元数据通道分配区块还允许更快地访问音频模型唯一识别标识,而无须访问xml元数据。
附图说明
19.图1为本公开实施例中提供了一种三维声音频模型的示意图;
20.图2为本公开实施例中的音频元数据通道分配区块生成方法的流程图;
21.图3为本公开实施例中的音频元数据通道分配区块生成装置的结构示意图;
22.图4为本公开实施例中的一种电子设备的结构示意图。
具体实施方式
23.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
24.实施例
25.如图1所示,三维声音频模型由一组元素组成,每个元素用于描述音频制作的一个阶段,三维声音频模型包括内容部分和格式部分。
26.其中,所述内容部分包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素;所述格式部分包括:音频包格式元素、音频通道格式元素、音频流格式元素和音频轨道格式元素;
27.所述音频节目元素引用至少一个所述音频内容元素;所述音频内容元素引用至少一个音频对象元素;所述音频对象元素引用对应的所述音频包格式元素和对应的所述音轨唯一标识元素;所述音轨唯一标识元素引用对应的所述音频轨道格式元素和对应的所述音频包格式元素;
28.所述音频包格式元素引用至少一个所述音频通道格式元素;所述音频流格式元素引用对应的所述音频通道格式元素和对应的所述音频包格式元素;所述音频轨道格式元素和对应的所述音频流格式元素相互引用。元素间的引用关系在图1中以箭头表示。
29.音频节目可以包括但不限于叙述、声音效果和背景音乐,所述音频节目元素可以用于描述节目,所述节目包括至少一个内容,所述音频内容元素用于描述所述音频节目元素中对应的一个内容。音频节目元素可以引用一个或多个音频内容元素,音频内容元素组合在一起以构建为完整的音频节目元素。
30.所述音频内容元素描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象元素将内容与其格式联系起来。
31.所述音频对象元素用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。
32.格式部分包括:音频包格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
33.所述音频包格式元素,可以用于描述所述音频对象元素和原始音频数据依据通道分组打包时采用的格式。
34.所述音频通道格式元素可以用于表示单个音频采样序列和对其执行的预设操作,例如,在场景中渲染对象的移动。所述音频通道格式元素可以包含至少一个音频块格式元素。音频块格式元素可以视为音频通道格式元素的子元素,所以,音频通道格式元素和音频块格式元素之间为一种包含关系。
35.音频流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式元素用于建立音频轨道格式元素集和音频通道格式元素集之间的关系,或音频轨道格式集和音频包格式之间的关系。
36.所述音频轨道格式元素对应于单个音轨中的一组样本或数据,用于描述原始音频数据的格式,及渲染器的解码信号,还用于识别成功解码音轨数据所需的音轨组合。
37.通过三维声音频模型对原始音频数据进行制作后生成包含元数据的合成音频数据。
38.所述元数据(metadata)是描述数据特性的信息,元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
39.合成音频数据以通信方式传输到远端后,由远端基于元数据对合成音频数据进行渲染,还原原始声音场景。
40.图1中示出了内容制作部分、格式制作部分和64位广播波(broadcast wave-64bit,bw64)文件之间的划分。内容制作部分和格式制作部分都构成了xml格式的元数据,它通常包含在64位广播波文件的一个音频可扩展标记语言区块(axml区块)中。底部的64位广播波文件部分包含通道分配区块(chna区块),它是一个查找表,用于连接元数据和文件中的音频节目。
41.内容部分描述音频的技术内容,例如它是否包含对话或特定语言,以及响度元数据。格式部分描述音频曲目的通道类型以及它们是如何组合在一起的,例如立体声对中的左声道和右声道。内容部分的元索通常是音频和节目所独有的,而格式部分的元素可以复用。
42.本公开提供了一种音频元数据通道分配区块生成方法,如图2所示,该方法包括:
43.s210、获取音频元数据通道分配区块的标头属性和标头元素;
44.s220、根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块;
45.其中,所述音频元数据通道分配区块用于连接音频模型元数据和广播音频格式文件中的音轨;具体的,所述音频元数据通道分配区块从广播音频格式文件中的每个音轨到音频模型元数据中的标识的引用,并完成将广播音频格式文件中的每个音轨与其关联音频模型元数据链接的目的。
46.可选的,所述根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块,包括:
47.将所述标头元素设置在所述标头之后;
48.其中,所述音频元数据通道分配区块的标头属性包括音轨数量和使用音轨唯一标识值的数量;所述标头元素包括音频标识结构数组,所述音频标识结构数组中的每个音频标识结构包含与音频模型元素的唯一标识相对应的标识。
49.可选的,所述音频元数据通道分配区块中的音频模型元数据唯一标识(adm id)引用音频串行可扩展标记语言区块、广播可扩展标记语言(bxml)区块和串行可扩展标记语言(sxml)区块中的或外部通用定义文件中携带的音频元数据。
50.可选的,所述根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块,包括:
51.根据被定义的音轨唯一标识值数量确定所述音频元数据通道分配区块的大小;其中,所述音频标识结构的数量等于或大于使用的音轨唯一标识值数量,以用于音频元数据通道分配区块的更新和添加音频标识结构。
52.可选的,所述音频元数据通道分配区块中的所述音频标识结构包含一个对应数据区块所使用音轨的索引;所述音轨的索引包含音频样本,每个音轨包含相关联音轨的多个音轨唯一标识值,所述音频模型元数据将包含该音轨唯一标识值;所述音频标识结构中还包含对音频模型的音频轨道格式元素的引用和对音频包格式元素的唯一标识的引用。
53.具体地,音频标识结构(audioid)包含一个数据(data)区块中使用的音轨的索引,所述音轨的索引包含音频样本,第一个轨道的值从1开始。它包含音轨的音轨唯一标识值(uid),音频模型元数据将包含该音轨唯一标识。一个音轨的音频元素在一个文件的过程中可能是不同的;在这种情况下,每个定义都有一个不同的音轨唯一标识。因此,每个音轨可能有多个音轨唯一标识值。音频标识结构中的其他两个值是对音频模型(adm)的音频轨道格式(audiotrackformat)和音频包格式(audiopackformat)元素的id的引用。如果音频本质的格式类型是线性pcm,则允许省略音频轨道格式和音频流格式(audiostreamformat)。然后,引用音频通道格式(audiochannelformat)而不是音频轨道格式。
54.可选的,获取所述音频元数据通道分配区块的标头元素,包括:
55.获取区块标识、区块的数据段的长度、使用的音轨的数量、使用音轨唯一标识值的数量、包含音轨的音频参考唯一标识集的结构、音轨的索引、音轨的音轨唯一标识值唯一标识、音轨的音频轨道格式唯一标识引用、音轨的音频包格式唯一标识引用和确保音频唯一标识结构具有偶数个字节的单个字节。
56.可选的,所述音频元数据通道分配区块的标头元素,包括:
57.对于所述区块的数据段的长度,获取所述区块的数据段的长度的属性,还包括获取除区块标识和区块的数据段的长度以外的使用字节;
58.使用的音轨的数量表示一个音轨包含多个唯一标识唯一标识集;
59.使用音轨唯一标识值的数量表示一个单轨覆盖不同的时间段的多个音轨唯一标识值;所述音轨唯一标识值与音频标识中定义的唯一标识数相匹配;
60.音轨的索引表示对应于数据区块中交错的音轨的顺序。
61.标头元素包含的信息如表1所示:
62.表1
63.64.[0065][0066]
当一个参考唯一标识集的结构未被使用时,音轨的索引的值须为零,且其他字段须有空字符串(空字符串的长度与平常使用的包含音轨的音频参考唯一标识集的结构字符串相同)。所以,音轨的音频包格式唯一标识引用的空字符串将由11个空字符(ascii值零)组成,且音轨的音频轨道格式唯一标识引用将由14个空字符组成。
[0067]
图3为本公开实施例提供的一种音频元数据通道分配区块生成装置,包括:
[0068]
获取模块310,用于获取音频元数据通道分配区块的标头属性和标头元素;
[0069]
区块生成模块320,用于根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块;
[0070]
其中,所述音频元数据通道分配区块用于连接音频模型元数据和广播音频格式文件中的音轨;所述音频元数据通道分配区块从广播音频格式文件中的每个音轨到音频模型元数据中的标识的引用,完成将文件中的每个音轨与其关联音频模型元数据链接。
[0071]
可选地,所述根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块,包括:
[0072]
将所述标头元素设置在所述标头之后;
[0073]
其中,所述音频元数据通道分配区块的标头属性包括音轨数量和使用音轨唯一标识值的数量;所述标头元素包括音频标识结构数组,所述音频标识结构数组中的每个音频标识结构包含与音频模型元素的唯一标识相对应的标识。
[0074]
可选地,所述音频元数据通道分配区块中的音频模型元数据唯一标识引用音频串行可扩展标记语言区块、广播可扩展标记语言区块和串行可扩展标记语言区块中的或外部通用定义文件中携带的音频元数据。
[0075]
可选地,所述根据所述音频元数据通道分配区块的标头属性和标头元素,生成访问音频模型元数据唯一标识的所述音频元数据通道分配区块,包括:
[0076]
根据被定义的音轨唯一标识值数量确定所述音频元数据通道分配区块的大小;其中,所述音频标识结构的数量等于或大于使用的音轨唯一标识值数量,以用于音频元数据通道分配区块的更新和添加音频标识结构。
[0077]
可选地,所述音频元数据通道分配区块中的所述音频标识结构包含一个对应数据区块所使用音轨的索引;所述音轨的索引包含音频样本,每个音轨包含相关联音轨的多个音轨唯一标识值,所述音频模型元数据将包含该音轨唯一标识值;所述音频标识结构中还包含对音频模型的音频轨道格式元素的引用和对音频包格式元素的唯一标识的引用。
[0078]
可选地,获取所述音频元数据通道分配区块的标头元素,包括:
[0079]
获取区块标识、区块的数据段的长度、使用的音轨的数量、使用音轨唯一标识值的数量、包含音轨的音频参考唯一标识集的结构、音轨的索引、音轨的音轨唯一标识值、音轨的音频轨道格式唯一标识引用、音轨的音频包格式唯一标识引用和确保音频唯一标识结构具有偶数个字节的单个字节。
[0080]
可选地,所述音频元数据通道分配区块的标头元素,包括:
[0081]
对于所述区块的数据段的长度,获取所述区块的数据段的长度的属性,还包括获取除区块标识和区块的数据段的长度以外的使用字节;
[0082]
所述使用的音轨的数量表示一个音轨包含多个唯一标识唯一标识集;
[0083]
所述使用音轨唯一标识值的数量表示一个单轨覆盖不同的时间段的多个音轨唯一标识值;所述音轨唯一标识值与音频标识中定义的唯一标识数相匹配;
[0084]
所述音轨的索引表示对应于数据区块中交错的音轨的顺序。
[0085]
本发明实施例所提供的音频元数据通道分配区块生成装置可执行本发明任意实施例所提供的音频元数据通道分配区块生成方法,具备执行方法相应的功能模块和有益效果。
[0086]
图4为本公开实施例提供的一种电子设备的结构示意图。如图4所示,该电子设备包括:处理器410、存储器420、输入装置430以及输出装置440。该电子设备中处理器30的数量可以是一个或者多个,图4中以一个处理器410为例。该电子设备中存储器420的数量可以
是一个或者多个,图4中以一个存储器420为例。该电子设备的处理器410、存储器420、输入装置430以及输出装置440可以通过总线或者其他方式连接,图4中以通过总线连接为例。该电子设备可以是电脑和服务器等。本公开实施例以电子设备为服务器进行详细说明,该服务器可以是独立服务器或集群服务器。
[0087]
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本公开任意实施例所述音频元数据通道分配区块生成装置的程序指令/模块。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0088]
输入装置430可用于接收输入的数字或者字符信息,以及产生与电子设备的观众用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置440可以包括扬声器等音频设备。需要说明的是,输入装置430和输出装置440的具体组成可以根据实际情况设定。
[0089]
处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现音频元数据通道分配区块生成方法。
[0090]
本公开实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器生成包括任意实施例提供的音频元数据通道分配区块生成方法。
[0091]
当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的电子方法操作,还可以执行本公开任意实施例所提供的电子方法中的相关操作,且具备相应的功能和有益效果。
[0092]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本公开任意实施例所述的电子方法。
[0093]
值得注意的是,上述电子装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
[0094]
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场
可编程门阵列(fpga)等。
[0095]
在本说明书的描述中,参考术语“在一实施例中”、“在又一实施例中”、“示例性的”或“在具体的实施例中”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0096]
虽然,上文中已经用一般性说明、具体实施方式及试验,对本公开作了详尽的描述,但在本公开基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本公开精神的基础上所做的这些修改或改进,均属于本公开要求保护的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献