一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音频分离网络的训练方法、装置、电子设备及存储介质与流程

2022-04-06 21:17:01 来源:中国专利 TAG:

技术特征:
1.一种音频分离网络的训练方法,其特征在于,所述方法包括:获取音频数据集;基于第一音频分离网络对所述音频数据集中的第一混合音频数据进行分离,输出目标音轨数据;基于预设混合策略对所述目标音轨数据进行混合,得到第二混合音频数据;基于所述目标音轨数据和所述第二混合音频数据对第二音频分离网络进行训练,计算损失函数;损失函数不满足收敛条件,更新所述第二音频分离网络的网络参数,并将更新后的第二音频分离网络作为第一音频分离网络;损失函数满足收敛条件,得到训练好的第二音频分离网络。2.根据权利要求1所述的方法,其特征在于,所述基于第一音频分离网络对所述音频数据集中的第一混合音频数据进行分离,输出目标音轨数据,包括:将所述第一混合音频数据中的其他音轨数据移除,得到所述第一混合数据中目标音轨的第一音轨数据;将所述第一音轨数据输入到所述第一音频分离网络进行分离,输出所述目标音轨的第二音轨数据;将所述第二音轨数据作为所述目标音轨数据。3.根据权利要求2所述的方法,其特征在于,所述目标音轨数据为人声音轨数据,所述其他音轨数据为乐器音轨数据。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述目标音轨数据中目标音轨的能量和其他音轨的能量;所述目标音轨的能量大于等于第一能量阈值,所述其他音轨的能量小于第二能量阈值时,保留所述目标音轨数据;所述目标音轨的能量小于所述第一能量阈值,所述其他音轨的能量大于等于所述第二能量阈值时,丢弃所述第二音轨数据;其中,所述第一能量阈值大于所述第二能量阈值。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:所述目标音轨的能量大于等于第一能量阈值,所述其他音轨的能量小于第二能量阈值时,保留时长大于时长阈值的目标音轨数据。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将保留的至少两段目标音轨数据进行拼接,得到最终的目标音轨数据。7.根据权利要求1所述的方法,其特征在于,所述基于预设混合策略对所述目标音轨数据进行混合之前,所述方法还包括:基于预设变换策略,对所述目标音轨数据进行变换;其中,所述预设变换策略包括以下至少一项:左声道和右声道平移,左声道和右声道互换,调整音量,调整频率,调整幅度,高通滤波,低通滤波,混响。8.一种音频分离网络的训练装置,其特征在于,所述装置包括:获取单元,获取音频数据集;第一处理单元,用于基于第一音频分离网络对所述音频数据集中的第一混合音频数据
进行分离,输出目标音轨数据;混合单元,用于基于预设混合策略对所述目标音轨数据进行混合,得到第二混合音频数据;第二处理单元,用于基于所述目标音轨数据和所述第二混合音频数据对第二音频分离网络进行训练,计算损失函数;损失函数不满足收敛条件,更新所述第二音频分离网络的网络参数,并将更新后的第二音频分离网络作为第一音频分离网络;损失函数满足收敛条件,得到训练好的第二音频分离网络。9.一种电子设备,其特征在于,所述电子设备包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器配置为运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。

技术总结
本申请实施例公开了一种音频分离网络的训练方法、装置、电子设备及存储介质,基于第一音频分离网络对音频数据集进行分离;基于分离出的目标音轨数据及其对应的混合音频数据对第二音频分离网络进行训练,以更新第二音频分离网络的网络参数,损失函数不满足收敛条件时,将更新后的第二音频分离网络作为第一音频分离网络执行下一次训练过程,直到训练结束。这里,在每次训练过程中先利用第一音频分离网络对混合音频数据进行分离,提取干净的音轨数据,对干净的音轨数据进行混合,得到训练数据用于训练第二音频分离网络,如此反复迭代,不断优化第二音频分离网络的同时,分离出更干净的音轨数据,提高训练数据质量,从而提高训练效果。效果。效果。


技术研发人员:毛俊伟 刘雪松
受保护的技术使用者:OPPO广东移动通信有限公司
技术研发日:2021.12.20
技术公布日:2022/4/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献