一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频节目元数据和产生方法、电子设备及存储介质与流程

2022-02-22 03:05:59 来源:中国专利 TAG:


1.本公开涉及音频处理的技术领域,尤其涉及一种音频节目元数据和产生方法、电子设备及存储介质。


背景技术:

2.随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
3.音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
4.因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
5.本公开提供了一种音频节目元数据和产生方法,以便提供一种能够解决上述技术问题的元数据。


技术实现要素:

6.本公开的目的在于提出一种音频节目元数据和产生方法、电子设备及存储介质,以解决上述技术问题之一。
7.为实现上述目的,本公开第一方面提供了一种音频节目元数据,包括:
8.属性区,包括音频节目的音频节目标识和音频节目名称,所音频节目标识包括引用一个或多个音频内容所创建的音频节目信息;
9.子元素区,包括:音频内容引用信息,所述音频内容引用信息包括音频节目播放时所引用的音频内容信息,所述音频内容引用信息包括引用的一个或多个音频内容信息。
10.为实现上述目的,本公开第二方面提供了一种音频节目元数据的产生方法,包括:
11.产生包括如第一方面所述音频节目元数据。
12.为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
13.所述存储器,用于存储一个或多个程序;
14.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器产生包括如第一方面所述音频节目元数据。
15.为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介
质,所述计算机可执行指令在由计算机处理器产生包括如第一方面所述音频节目元数据。
16.由上可见,本公开音频节目元数据,包括:属性区,包括音频节目的音频节目标识和音频节目名称,所音频节目标识包括引用一个或多个音频内容所创建的音频节目信息;子元素区,包括:音频内容引用信息,所述音频内容引用信息包括音频节目播放时所引用的音频内容信息,所述音频内容引用信息包括引用的一个或多个音频内容信息。所述音频节目元数据描述了音频节目播放的元数据格式,能够实现在音频节目播放时的音频内容获取,播放时间、播放响度、播放屏幕的控制,从而提高了音频播放场景的质量。
附图说明
17.图1为本公开实施例1中提供了一种多维声音频制作模型的示意图;
18.图2为本公开实施例1中提供了一种音频节目元数据的结构示意图;
19.图3为本公开实施例2中提供的一种音频节目元数据的产生方法的流程图;
20.图4为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
21.以下实施例用于说明本公开,但不用来限制本公开的范围。
22.元数据(metadata)是描述数据的结构特性的信息,而元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
23.如图1所示,多维声音频制作模型由一组制作元素组成,每个制作元素均通过元数据描述音频制作对应阶段的数据的结构特性的信息,多维声音频制作模型包括内容制作部分和格式制作部分。
24.内容制作部分的制作元素包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素。
25.所述音频节目包括叙述、声音效果和背景音乐,音频节目引用一个或多个音频内容,音频内容组合在一起以构建为完整的音频节目。所述音频节目元素也就是制作音频节目,生成音频节目的元数据用于描述音频节目的结构特性的信息。
26.所述音频内容描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象将内容与其格式联系起来。所述音频内容元素也就是制作音频内容,生成音频内容的元数据用于描述音频内容的结构特性的信息。
27.所述音频对象用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。所述音频对象元素也就是制作音频对象,生成音频对象的元数据用于描述音频对象的结构特性的信息。
28.所述音轨唯一标识元素也就是制作音轨唯一标识,生成音轨唯一标识的元数据用于描述音轨唯一标识的结构特性的信息。
29.格式制作部分的制作元素包括:音频节目格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
30.所述音频节目格式是将音频对象的元数据和音频流数据依据通道分组打包时所采用的格式,其中,音频节目格式中能够包括嵌套的音频节目格式。所述音频节目格式元素也就是制作音频节目数据。所述音频节目数据中包括音频节目元数据,所述音频节目元数
据用于描述音频节目格式的结构特性的信息。
31.所述音频通道格式表示单个音频采样序列,可以对其执行某种操作,例如,在场景中渲染对象的移动。音频通道格式中能够包括嵌套的音频通道格式。所述音频通道格式元素也就是制作音频通道数据。所述音频通道数据中包括音频通道格式的元数据,所述音频通道格式的元数据用于描述音频通道格式的结构特性的信息。
32.音频流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式用于建立音频轨道格式集和音频通道格式集或音频节目格式之间的关系。所述音频流格式元素也就是制作音频流数据。所述音频流数据中包括音频流格式的元数据,所述音频流格式的元数据用于描述音频流格式的结构特性的信息。
33.所述音频轨道格式对应于存储介质中单个音轨中的一组样本或数据,用于描述原始音频数据的轨道格式,及渲染器的解码信号。音频轨道格式来自原始音频数据,用于识别成功解码音轨数据所需的音轨组合。所述音频轨道格式元素也就是制作音频轨道数据。所述音频轨道数据中包括音频轨道格式的元数据,所述音频轨道格式的元数据用于描述音频轨道格式的结构特性的信息。
34.多维声音频制作模型的每个阶段均制作出描述该阶段特性的的元数据。
35.基于上述多维声音频制作模型制作出的音频通道数据以通信方式传输到远端后,由远端基于元数据对音频通道数据分阶段进行逐级渲染,还原制作的声音场景。
36.实施例1
37.本公开提供了多维声音频模型中的一种音频节目元数据,并进行详细说明。
38.音频节目(audioprogramme)是多维声音频模型中的顶级元素,音频节目代表整个节目或节目的一个版本,它由一个或多个音频内容构成,一个或多个音频节目可以构成一个音频文件,音频节目包含音频节目开始的时间和结束的时间,通过时间控制,可以实现音频与视频的同步,音频节目还包括响度元素,响度元素用于记录节目的响度信息,根据需要,还可以为制作中心或用户提供音频制作的屏幕尺寸信息。同时,如果一个音频文件中包含多个音频节目,如果没有制定音频节目的播放顺序以及播放的第一个音频节目,那么音频节目的播放顺序是按照音频节目的排序信息进行播放。
39.如图2所示,该音频节目元数据100包括属性区110和子元素区 120。
40.所述属性区110,包括音频节目的音频节目标识111和音频节目名称112。
41.所音频节目标识111包括引用一个或多个音频内容所创建的音频节目信息。
42.在本公开实施例中,音频节目标识111为音频节目的标识或标号,比如,某一音频节目的标识为“music001”,对应的音频节目名称可设为“一首歌曲”,那么通过标识“music001”,就可以获取到音频节目名称为“一首歌曲”的音频节目,音频节目标识111可用计算机语言描述为:
43.《audioprogramme audiocontentid=“apr_1001”》
44.表示为某一个音频节目的音频节目标识111为“apr_1001”音频节目标识111可以理解为,通过音频节目标识可以获取对应的音频节目名称及音频内容信息。
45.音频节目名称112表示为音频节目的具体名称,比如,一个音频节目的名称为“一首歌曲”,它对应的音频节目标识111为“music001”,那么通过音频节目标识111的“music001”可以获取音频节目的名称为“一首歌曲”的音频节目。
46.所述子元素区120包括:音频内容引用信息121,所述音频内容引用信息121包括音频节目播放时所引用的音频内容信息,所述音频内容引用信息121包括引用的一个或多个音频内容信息。
47.在本公开实施例中,音频节目可能是由一个或多个独立的音频内容所构成的,比如,在进行音频剪辑时,将一段完整的音频文件剪辑成多个小段的音频文件,此时如果需要播放完整的音频节目,就需要将这些小段的音频文件都作为音频节目的内容进行播放,此时,音频内容引用信息121的作用就是将这些小段的音频文件走位音频节目的音频内容进行播放,在具体执行时,每一个被引用的音频内容都要加入到音频节目播放的列表中,比如,其软件代码执行方式为:
48.《audiocontentidref》aco_1001《audiocontentidref》
49.《audiocontentidref》aco_1002《audiocontentidref》
50.《audiocontentidref》aco_1003《audiocontentidref》
51.标识音频内容引用信息121引用的音频内容包括三个,分别为“aco_1001”、“aco_1002”、“aco_1003”,“aco_1001”、“aco_1002”、“aco_1003”分别为三个音频内容的音频节目名称,在播放时按照“aco_1001”、“aco_1002”、“aco_1003”的顺序依次播放。
52.可选的,所述属性区110还包括指示音频节目播放的显示屏幕所显示的音频节目的音频语言信息113,音频语言信息113表示音频节目播放时所显示的语言,比如“en”代表英语、“cn”代表汉语、“jp”代表日本语、“kr”代表韩国语等等,当选择一个音频语言信息113以后,就会在频幕上按照选择的语言信息进行显示播放的文字内容,如果不选择,默认选项为“en”。
53.可选的,所述属性区110还包括指示音频节目播放的开始时间信息114,所述开始时间信息114的秒数位数不少于五位,通过将秒数位数设置为不少于五位,能够确保由足够的小数位来保证采集精确计时。在具体实施时,其计算机语言描述为:
54.《start=“00:01:00.00000”》
55.表示为音频节目播放的开始时间为第1分钟开始。
56.可选的,所述属性区110还包括指示音频节目播放的结束时间信息115,所述结束时间信息115的秒数位数不少于五位。通过将秒数位数设置为不少于五位,能够确保由足够的小数位来保证采集精确计时。在具体实施时,其计算机语言描述为:
57.《end=“00:10:00.00000”》
58.表示为音频节目播放的结束时间为第10分钟结束。
59.可选的,所述属性区110还包括指示音频节目播放所允许闪避的最大允许闪避信息116。
60.具体的,所述子元素区120还包括音频节目播放的节目响度信息 122,所述节目响度信息122为音频节目播放的分贝值。具体的,由于音频节目在播放时的响度需要调节,节目响度信息122就是测量并控制节目的响度,具体的,节目响度信息122包括:响度计算算法信息 (loudnessmethod)、响度遵循标准信息(loudnessrectype)、响度修正类型信息(loudnesscorrectiontype);
61.所述响度计算算法信息用于表征在音频节目播放时,调整音频节目响度所遵循的算法,比如采用“itu bs.1770”建议规范;
62.所述响度遵循标准信息用于表征音频节目播放时,在进行响度修正时所需要符合的行业标准,比如,“ebu r128”表示符合欧洲r128 标准等;
63.所述响度修正类型信息用于表征在音频节目播放时,在进行响度修正时所基于的修正类型,所述修正类型包括基于文件修正和实时修正。在具体实施时,其计算机程序描述为:
64.《loudnessmetadata loudnessmethod="itu-r bs.1770" loudnessrectype="ebu r128"》
65.《intergratedloudness》-23.0《intergratedloudness》
66.《/loudnessmetadata》
67.表示音频节目播放的分贝值为
“‑
23.0”。
68.可选的,所述子元素区120还包括音频节目播放的屏幕信息123,所述屏幕信息123用于表征在音频节目播放时显示屏幕的屏幕纵横比、中心点位置、屏幕宽度信息。
69.具体的,所述屏幕信息123包括:屏幕纵横比信息、屏幕中心位置信息和屏幕宽度信息;
70.所述屏幕纵横比信息表示在音频节目播放时,其屏幕的纵向和横向的比值,所述屏幕纵横比信息用于表征音频节目播放时所显示的屏幕纵横比,在具体实施时,其计算机语言描述为:
71.《aspectratio》1.778《aspectratio》
72.表示屏幕纵横比为1.778。
73.所述屏幕中心位置信息包括:中心位置方位角,用于表征屏幕中心的方位角;仰角,用于表征屏幕中心的仰角;距离,用于表征屏幕中心的距离;x值,用于表征屏幕中心在x轴的位置;y值,用于表征屏幕中心在y轴的位置;z值,用于表征屏幕中心在z轴的位置。在具体实施时,其计算机语言描述为:
74.《screencenterposition x=“0.0”y=“0.0”z=“0.0”/》
75.表示屏幕中心位置为原点坐标。
76.所述屏幕宽度信息包括:宽度方位角,用于表征屏幕宽度方向测量的方位角;宽度x值,用于表征屏幕在x轴方向的测量宽度。
77.本公开实施例通过音频节目元数据100描述了音频节目播放的元数据格式,能够实现在音频节目播放时的音频内容获取,播放时间、播放响度、播放屏幕的控制,从而提高了音频播放场景的质量。
78.实施例2
79.本公开还提供了与上述实施例承接的方法实施例,用于音频节目元数据的产生方法,基于相同的名称含义的解释与如上实施例相同,具有与如上实施例相同的技术效果,此处不再赘述。
80.如图3所示,一种音频节目元数据的产生方法,包括以下步骤:
81.步骤s210,产生音频节目元数据,所述音频节目元数据包括:
82.属性区,包括音频节目的音频节目标识和音频节目名称,所述音频节目标识包括引用一个或多个音频内容所创建的音频节目信息;
83.子元素区,包括:音频内容引用信息,所述音频内容引用信息包括音频节目播放时
所引用的音频内容信息,所述音频内容引用信息包括引用的一个或多个音频内容信息。
84.可选的,所述属性区还包括指示音频节目播放的显示屏幕所显示的音频节目的音频语言信息。
85.可选的,所述属性区还包括指示音频节目播放的开始时间信息,所述开始时间信息的秒数位数不少于五位。
86.可选的,所述属性区还包括指示音频节目播放的结束时间信息,所述结束时间信息的秒数位数不少于五位。
87.可选的,所述属性区还包括指示音频节目播放所允许闪避的最大允许闪避信息。
88.可选的,所述子元素区还包括音频节目播放的节目响度信息,所述节目响度信息为音频节目播放的分贝值。
89.可选的,所述子元素区还包括音频节目播放的屏幕信息,所述屏幕信息用于表征在音频节目播放时显示屏幕的屏幕纵横比、中心点位置、屏幕宽度信息。
90.可选的,所述节目响度信息包括:响度计算算法信息、响度遵循标准信息、响度修正类型信息,所述响度计算算法信息用于表征在音频节目播放时,调整音频节目响度所遵循的算法,所述响度遵循标准信息用于表征音频节目播放时,在进行响度修正时所需要符合的行业标准,所述响度修正类型信息用于表征在音频节目播放时,在进行响度修正时所基于的修正类型,所述修正类型包括基于文件修正和实时修正。
91.可选的所述屏幕信息包括:屏幕纵横比信息、屏幕中心位置信息和屏幕宽度信息,所述屏幕纵横比信息用于表征音频节目播放时所显示的屏幕纵横比,所述屏幕中心位置信息包括:中心位置方位角,用于表征屏幕中心的方位角;仰角,用于表征屏幕中心的仰角;距离,用于表征屏幕中心的距离;x值,用于表征屏幕中心在x轴的位置;y 值,用于表征屏幕中心在y轴的位置;z值,用于表征屏幕中心在z轴的位置;所述屏幕宽度信息包括:宽度方位角,用于表征屏幕宽度方向测量的方位角;宽度x值,用于表征屏幕在x轴方向的测量宽度。
92.本公开实施例产生音频节目元数据,音频节目元数据描述了音频节目播放的元数据格式,能够实现在音频节目播放时的音频内容获取,播放时间、播放响度、播放屏幕的控制,从而提高了音频播放场景的质量。
93.实施例3
94.图4为本公开实施例3提供的一种电子设备的结构示意图。如图4 所示,该电子设备包括:处理器30、存储器31、输入装置32以及输出装置33。该电子设备中处理器30的数量可以是一个或者多个,图4中以一个处理器30为例。该电子设备中存储器31的数量可以是一个或者多个,图4中以一个存储器31为例。该电子设备的处理器30、存储器 31、输入装置32以及输出装置33可以通过总线或者其他方式连接,图 4中以通过总线连接为例。该电子设备可以是电脑和服务器等。本公开实施例以电子设备为服务器进行详细说明,该服务器可以是独立服务器或集群服务器。
95.存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本公开任意实施例所述产生音频节目元数据的程序指令/模块。存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器
件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
96.输入装置32可用于接收输入的数字或者字符信息,以及产生与电子设备的观众用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置33可以包括扬声器等音频设备。需要说明的是,输入装置32和输出装置33 的具体组成可以根据实际情况设定。
97.处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即产生音频节目元数据。
98.实施例4
99.本公开实施例4还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器产生包括如实施例1所述音频节目元数据。
100.当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的电子方法操作,还可以执行本公开任意实施例所提供的电子方法中的相关操作,且具备相应的功能和有益效果。
101.通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory, rom)、随机存取存储器(random access memory,ram)、闪存 (flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备 (可以是机器人,个人计算机,服务器,或者网络设备等)执行本公开任意实施例所述的电子方法。
102.值得注意的是,上述电子装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
103.应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
104.在本说明书的描述中,参考术语“在一实施例中”、“在又一实施例中”、“示例性的”或“在具体的实施例中”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
105.虽然,上文中已经用一般性说明、具体实施方式及试验,对本公开作了详尽的描述,但在本公开基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见
的。因此,在不偏离本公开精神的基础上所做的这些修改或改进,均属于本公开要求保护的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献