一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于对象的音频元数据空间标识转换方法及装置与流程

2022-12-20 20:44:28 来源:中国专利 TAG:


1.本发明涉及音频处理技术领域,尤其涉及一种基于对象的音频元数据空间标识转换方法及装置。


背景技术:

2.音频渲染器与音响系统一起使用,通过对音频信号所对应的元数据以及本地环境的元数据进行渲染,以满足音响系统中对应的扬声器所需配置。其中,有些渲染项采用了元数据转换的模拟。
3.音频元数据是一种用于描述音频文件的数据。其参数主要包括增益、漫反射、通道锁定参数、跳转位置、插值长度参数、区域排除参数、对象发散参数以及阶梯与角度参数等。
4.但在使用音频元数据的过程中,扬声器的布局与点源声像定位器中使用的扬声器可能从属于不同的坐标系(如笛卡尔坐标系或极坐标系),因此,对于音频元数据的使用,需要一种统一坐标系的方法,从而保证音频渲染器的正常使用。


技术实现要素:

5.本发明提供一种基于对象的音频元数据空间标识转换方法及装置,以保证音频渲染器的正常使用。
6.本技术第一方面提供了一种基于对象的音频元数据空间标识转换方法,包括:
7.判定音频元数据的转换类型;
8.若转换类型为位置转换,根据第一扬声器与点源声像定位器所属第二扬声器之间的映射关系,获取坐标系映射关系下的第一转换函数;
9.根据第一转换函数,转换音频元数据的空间标识;
10.若转换类型为范围转换,获取范围参数的第二转换函数;
11.将第二转换函数应用于第一转换函数,转换音频元数据的空间标识。
12.可选地,映射关系包括方位角到线性坐标之间的映射以及线性坐标到方位角之间的逆映射。
13.可选地,第一转换函数包括极坐标-笛卡尔坐标第一转换函数以及笛卡尔坐标-极坐标第一转换函数。
14.可选地,在音频元数据采用极坐标-笛卡尔坐标第一转换函数的条件下,音频元数据的第一输入参数包括第一方位角、第一仰角以及第一距离。
15.可选地,第二转换函数包括极坐标-笛卡尔坐标第二转换函数以及笛卡尔坐标-极坐标第二转换函数。
16.可选地,音频元数据采用坐标-笛卡尔坐标第二转换函数的条件下,音频元数据的第二输入参数包括第二方位角、第二仰角、第二距离、极宽、高度以及深度。
17.可选地,还包括对象发散转换;
18.对象发散变换包括位置变化参数以及方位角变化参数。
19.本技术第二方面提供了一种基于对象的音频元数据空间标识转换装置,应用第一方面所提供的基于对象的音频元数据空间标识转换方法,包括:
20.转换类型判定模块,用于判定音频元数据的转换类型;
21.第一转换函数获取模块,用于若转换类型为位置转换,根据第一扬声器与点源声像定位器所属第二扬声器之间的映射关系,获取坐标系映射关系下的第一转换函数;
22.第一转换模块,用于根据第一转换函数,转换音频元数据的空间标识;
23.第二转换函数获取模块,用于若转换类型为范围转换,获取范围参数的第二转换函数;
24.第二转换模块,用于应用第二转换函数于第一转换函数,转换音频元数据的空间标识。
25.本技术第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
26.存储器,用于存储一个或多个程序;
27.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如任意实施例提供的基于对象的音频元数据空间标识转换方法。
28.本技术第四方面提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器实现如任意实施例提供的基于对象的音频元数据空间标识转换方法。
29.由上可见,本技术所提供的基于对象的音频元数据空间标识转换方法及装置,通过区分音频元数据的转换类型,进而在针对基于对象的音频元数据所对应的音频块格式集中,区分在位置转换和/或范围转化下的笛卡尔坐标-极坐标和/或极坐标-笛卡尔坐标的不同转换方式,通过获取相应转换函数实现音频元数据空间标识的转换,保证了音频渲染器的正常使用。
附图说明
30.图1为本发明实施例提供的一种基于对象的音频元数据空间标识转换方法的流程图;
31.图2为本发明实施例提供的一种基于对象的音频元数据空间标识转换装置的结构示意图;
32.图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
33.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
34.实施例一
35.如图1所示,本发明实施例提供了一种基于对象的音频元数据空间标识转换方法,包括:
36.s10:判定音频元数据的转换类型;其中转换的类型包括了具体位置的转换以及区域范围内的转换,因此对于前者需要获得该位置的位置信息,如果是极坐标和/或笛卡尔坐标,则转换为对应目标坐标系下的坐标信息,即音频元数据的转换;同理,对于后者需要获
得该区域的长宽高的信息,并相应转换为对应目标坐标系下的坐标信息,即音频元数据的转换。
37.这里需要说明的是,一般情况下音频元数据所涉及的渲染项包括基于对象、基于音床以及基于高阶环境音等。本技术主要针对基于对象的音频元数据所展开的空间标识转换方法。并且上述音频元数据的转换发生在音频块格式集中。这是由于音频元数据的一些参数,如增益、重要性参数、漫反射参数等均以音频块格式的形式存储。
38.如果应用该音频元数据空间标识转换方法所获取的位置信息和/或长宽高信息所属的坐标系与目标坐标系相同,例如位置信息的参数属于笛卡尔坐标系,而转换后的坐标系仍属于笛卡尔坐标系,则应用该音频元数据空间标识转换方法的处理直接跳过后续转换步骤。
39.s20:若转换类型为位置转换,根据第一扬声器与点源声像定位器所属第二扬声器之间的映射关系,获取映射关系下的第一转换函数;
40.以4 5 0的第一扬声器布局为例,如表1所示,其极坐标映射到点源声像定位器第二扬声器的笛卡尔坐标的映射关系不受渲染器通道布局的影响。
41.表1
42.通道xyzm 030-110m-030110m 000010m 110-1-10m-1101-10u 030-111u-030111u 110-1-11u-1101-11lfe1-11-1
43.其中上述映射关系包括方位角到线性坐标之间的映射map_az_to_linear以及线性坐标到方位角之间的逆映射map_linear_to_az。这里需要说明的是,上述映射应用于中间层扬声器位置之间。假设方位角的极性位置在0
°
与-30
°
之间,上述方位角与线性坐标x的关系如下公式:
[0044][0045]
进而上述映射以及逆映射可以定义如下:
[0046]
映射:
[0047]
其中:
[0048][0049]
[0050][0051][0052]
逆映射:
[0053]
其中:
[0054][0055][0056][0057][0058][0059][0060]
上述第一转换函数包括极坐标-笛卡尔坐标第一转换函数以及笛卡尔坐标-极坐标第一转换函数。
[0061]
之后执行步骤s30:根据第一转换函数,转换音频元数据的空间标识;具体地,上述极坐标-笛卡尔坐标第一转换函数其中为第一方位角,θ为第一仰角,d为第一距离,均属于音频元数据的第一输入参数。
[0062]
当|θ|>θ
top
时,使用:
[0063][0064]
z=dsgn(θ)
[0065][0066]
当|θ|<θ
top
时,使用:
[0067][0068]rxy
=d
[0069]
继而得到:
[0070][0071][0072][0073]
x=r
xy
(x
l
p(x
r-x
l
))
[0074]
y=r
xy
(y
l
p(y
r-y
l
))
[0075]
同理,上述笛卡尔坐标-极坐标第一转换函数
[0076][0077]
当|x|<ε并且|y|<ε时:
[0078][0079]
否则
[0080][0081][0082][0083]rxy
=g
l
gr[0084][0085][0086][0087][0088]
如果|θ’|>θ

top
,则:
[0089][0090]
θ=|θ|sgn(θ

)
[0091]
d=|z|
[0092]
否则:
[0093][0094]
d=r
xy
[0095]
s40:若转换类型为范围转换,获取范围参数的第二转换函数;其中上述第二转换函数包括极坐标-笛卡尔坐标第二转换函数whd2xyz以及笛卡尔坐标-极坐标第二转换函数xyz2whd。
[0096]
继而,执行步骤s50:将第二转换函数应用于第一转换函数,转换音频元数据的空间标识。
[0097]
其中,将极坐标-笛卡尔坐标第二转换函数whd2xyz应用于极坐标-笛卡尔坐标第一转换函数中,得到如下函数:
[0098][0099]
其中:表示第二方位角,θ表示第二仰角,d表示第二距离,width表示极宽,height表示高度,depth表示深度,均属于音频元数据的第二输入参数。
[0100][0101]
{s
x,f
,s
y,f
,s
z,f
}=whd2xyz(width,height,depth)
[0102][0103]
并且
[0104]
whd2xyz(width,height,depth)={s
x,w
,max(s
y,w
,s
y,h
,s
y,d
),s
z,h
}
[0105]
其中:
[0106][0107][0108]
[0109][0110]sy,d
=depth
[0111]
同理将笛卡尔坐标-极坐标第二转换函数xyz2whd应用于笛卡尔坐标-极坐标第一转换函数得到如下函数
[0112][0113]
其中:
[0114][0115][0116]sx,f
=‖m
x
‖2[0117]sy,f
=‖my‖2[0118]sz,f
=‖mz‖2[0119]
{width,height,depth}=xyz2whd(s
x,f
,s
y,f
,s
z,f
)
[0120]
并且xyz2whd(s
x
,sy,sz)={w,h,d}
[0121]
其中:
[0122][0123][0124]
w=w
sx
s
x
max(w
sy-w
sx
,0)
[0125][0126][0127]
h=h
sz
szmax(h
sy-h
sz
,0)
[0128]
{s
x,eq
,s
y,eq
,s
z,eq
}=whd2xyz(w,h,0)
[0129]
d=max(0,s
y-s
y,eq
)
[0130]
这里需要补充的是,还包括对象发散转换;
[0131]
对象发散变换包括位置变化参数postionrange以及方位角变化参数azimuthrange,其中
[0132][0133]
本技术所提供的基于对象的音频元数据空间标识转换方法,通过区分音频元数据的转换类型,进而区分在位置转换和/或范围转化下的笛卡尔坐标-极坐标和/或极坐标-笛
卡尔坐标的不同转换方式,通过获取相应转换函数实现音频元数据的转换,保证了音频渲染器的正常使用。
[0134]
实施例二
[0135]
图2为本发明实施例提供的一种基于对象的音频元数据空间标识转换装置的结构示意图,包括:
[0136]
转换类型判定模块01,用于判定音频元数据的转换类型;
[0137]
第一转换函数获取模块02,用于若转换类型为位置转换,根据第一扬声器与点源声像定位器所属第二扬声器之间的映射关系,获取坐标系映射关系下的第一转换函数;
[0138]
第一转换模块03,用于根据第一转换函数,转换音频元数据的空间标识;
[0139]
第二转换函数获取模块04,用于若转换类型为范围转换,获取范围参数的第二转换函数;
[0140]
第二转换模块05,用于应用第二转换函数于第一转换函数,转换音频元数据的空间标识。
[0141]
本发明实施例所提供的基于对象的音频元数据空间标识转换装置,应用实施例一所提供的音频元数据空间标识转换方法,采用相同的技术手段,解决了相同的技术问题,这里不再赘述。
[0142]
实施例三
[0143]
图3为本发明实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备包括:处理器310、存储器320、输入装置330以及输出装置340。该电子设备中存储器320的数量可以是一个或者多个,图3中以一个存储器320为例。该电子设备的处理器310、存储器320、输入装置330以及输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。该电子设备可以是电脑和服务器等。本技术实施例以电子设备为服务器进行详细说明,该服务器可以是独立服务器或集群服务器。
[0144]
存储器320作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本技术任意实施例音频元数据空间标识转换装置的程序指令/模块(例如,转换类型判定模块、第一转换函数获取模块、第一转换模块、第二转换函数获取模块、第二转换模块)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块,从而音频元数据空间标识转换装置的各种功能应用以及数据处理,即实现上述的基于对象的音频元数据空间标识转换方法。
[0145]
存储器320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器320可进一步包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0146]
输入装置330可用于接收输入的数字或者字符信息,以及产生与电子设备的观众用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置340可以包括扬声器等音频设备。需要说明的是,输入装置330和输出装置340的具体组成可以根据实际情况设定。
[0147]
实施例四
[0148]
本发明实施例四还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于对象的音频元数据空间标识转换方法,包括:
[0149]
判定音频元数据的转换类型;
[0150]
若转换类型为位置转换,根据第一扬声器与点源声像定位器所属第二扬声器之间的映射关系,获取映射关系下的第一转换函数;
[0151]
根据第一转换函数,转换音频元数据的空间标识;
[0152]
若转换类型为范围转换,获取范围参数的第二转换函数;
[0153]
将第二转换函数应用于第一转换函数,转换音频元数据。
[0154]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于对象的音频元数据空间标识转换方法中的相关操作。
[0155]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0156]
值得注意的是,上述遥操作音频元数据空间标识转换装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0157]
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献