一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频分离的方法、装置、设备、存储介质和程序产品与流程

2022-05-18 12:59:26 来源:中国专利 TAG:

技术特征:
1.一种音频分离的方法,其特征在于,所述方法包括:获取采集的音频数据;基于所述音频数据和经过训练的音频分离模型,确定多个子音频数据;基于所述多个子音频数据和经过训练的音频分组模型,确定每个子音频数据对应的分组信息,其中,所述分组信息用于指示对应的子音频数据与至少一个声源对象的关联关系;基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据。2.根据权利要求1所述的方法,其特征在于,所述子音频数据对应的分组信息包括所述子音频数据关联的声源对象;每个声源对象关联有多个子音频数据;所述基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据,包括:将每个声源对象关联的多个子音频数据进行合成,得到每个声源对象对应的声源对象音频数据。3.根据权利要求1所述的方法,其特征在于,所述子音频数据对应的分组信息包括所述子音频数据与至少一个声源对象的关联度;所述基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据,包括:确定每个子音频数据对应的关联度最高的声源对象,分别作为每个子音频数据关联的声源对象;每个声源对象关联有多个子音频数据;将每个声源对象关联的多个子音频数据进行合成,得到每个声源对象对应的声源对象音频数据。4.根据权利要求1所述的方法,其特征在于,所述子音频数据对应的分组信息包括所述子音频数据与至少一个声源对象的关联度;所述基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据,包括:对于每个声源对象,确定与所述声源对象存在关联度的多个关联子音频数据,基于所述多个关联子音频数据、以及每个关联子音频数据与所述声源对象的关联度,确定所述声源对象对应的声源对象音频数据。5.根据权利要求4所述的方法,其特征在于,所述基于所述多个关联子音频数据、以及每个关联子音频数据与所述声源对象的关联度,确定所述声源对象对应的声源对象音频数据,包括:以每个关联子音频数据与所述声源对象的关联度为权重值,对多个关联子音频数据进行加权合成,得到所述声源对象对应的声源对象音频数据。6.一种音频分离的方法,其特征在于,所述方法包括:提取音频数据的特征信息;将所述特征信息分别输入多个经过训练的声源对象音频提取模型,得到所述音频数据包括的多个声源对象音频数据。7.一种音频分离的装置,其特征在于,所述装置包括:分离模块,用于获取采集的音频数据;基于所述音频数据和经过训练的音频分离模型,
确定多个子音频数据;分组模块,用于基于所述多个子音频数据和经过训练的音频分组模型,确定每个子音频数据对应的分组信息,其中,所述分组信息用于指示对应的子音频数据与至少一个声源对象的关联关系;确定模块,用于基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据。8.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求6任一项所述的音频分离的方法所执行的操作。9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求6任一项所述的音频分离的方法所执行的操作。10.一种计算机程序产品,其特征在于,所述计算机程序产品中包括至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求6任一项所述的音频分离的方法所执行的操作。

技术总结
本申请公开了一种音频分离的方法、装置、设备、存储介质和程序产品,属于音频处理领域。所述方法包括:获取采集的音频数据;基于所述音频数据和经过训练的音频分离模型,确定多个子音频数据;基于所述多个子音频数据和经过训练的音频分组模型,确定每个子音频数据对应的分组信息,其中,所述分组信息用于指示对应的子音频数据与至少一个声源对象的关联关系;基于所述每个子音频数据和所述每个子音频数据对应的分组信息,确定每个声源对象对应的声源对象音频数据。采用本申请,可以提高音频识别的准确度。的准确度。的准确度。


技术研发人员:罗艺 王珺 林永业 李凯
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.02.09
技术公布日:2022/5/17
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献