技术特征:
1.一种声音分离的增强方法,包括:
从给定数量的各类别的弱标签音频数据集中,利用第一限制条件,确定各类别的第一有效音频片段;
利用所述各类别的第一有效片段,训练通用声音分离系统;
针对选定的类别的弱标签音频数据集,利用第二限制条件,确定所述选定的类别的第二有效音频片段,其中,所述第二限制条件高于所述第一限制条件;
利所述选定的类别的所述第二有效片段以及其他类别的第一有效片段,训练类别适应增强系统;
利用所述类别适应增强系统对所述选定的类别进行声音分离。
2.根据权利要求1所述的方法,其中,所述第一限制条件通过基于声音事件种类的声音事件检测模型确定;
所述确定各类别的第一有效音频片段包括:
将所述弱标签音频数据集输入至所述声音事件检测模型;
在所述声音事件检测模型中,截取所述弱标签音频数据集内各音频数据中声音事件最高值的前后预设时间段的音频,确定为第一有效音频片段。
3.根据权利要求1所述的方法,其中,所述利用所述各类别的第一有效片段,训练通用声音分离系统包括:
将所述各类别的第一有效片段中不同类别的第一有效片段两两组合,对所述通用声音分离系统进行训练。
4.根据权利要求1所述的方法,其中,所述第二限制条件通过基于双阈值分割的声音事件检测模型确定。
5.一种声音分离的增强系统,包括:
第一有效音频片段确定程序模块,用于从给定数量的各类别的弱标签音频数据集中,利用第一限制条件,确定各类别的第一有效音频片段;
通用声音分离系统训练程序模块,用于利用所述各类别的第一有效片段,训练通用声音分离系统;
第二有效音频片段确定程序模块,用于针对选定的类别的弱标签音频数据集,利用第二限制条件,确定所述选定的类别的第二有效音频片段,其中,所述第二限制条件高于所述第一限制条件;
类别适应增强系统训练程序模块,用于利所述选定的类别的所述第二有效片段以及其他类别的第一有效片段,训练类别适应增强系统;
声音分离程序模块,用于利用所述类别适应增强系统对所述选定的类别进行声音分离。
6.根据权利要求5所述的系统,其中,所述所述第一限制条件通过基于声音事件种类的声音事件检测模型确定;
所述第一有效音频片段确定程序模块用于:
将所述弱标签音频数据集输入至所述声音事件检测模型;
在所述声音事件检测模型中,截取所述弱标签音频数据集内各音频数据中声音事件最高值的前后预设时间段的音频,确定为第一有效音频片段。
7.根据权利要求5所述的系统,其中,所述通用声音分离系统训练程序模块用于:
将所述各类别的第一有效片段中不同类别的第一有效片段两两组合,对所述通用声音分离系统进行训练。
8.根据权利要求5所述的系统,其中,所述所述第二限制条件通过基于双阈值分割的声音事件检测模型确定。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
技术总结
本发明实施例提供一种声音分离的增强方法。该方法包括:从给定数量的各类别的弱标签音频数据集中,利用第一限制条件,确定各类别的第一有效音频片段;利用各类别的第一有效片段,训练通用声音分离系统;针对选定的类别的弱标签音频数据集,利用第二限制条件,确定选定的类别的第二有效音频片段;利选定的类别的第二有效片段以及其他类别的第一有效片段,训练类别适应增强系统。本发明实施例还提供一种声音分离的增强系统。本发明实施例在对通用声音分离系统进行训练后,采用分段重新选择的方法将系统学习所有指定的特定类别的增强系统。进一步消除对应类别中不必要的声音,提升了模型的鲁棒性,并且摆脱了对强标签数据的依赖。
技术研发人员:吴梦玥;李光伟;徐薛楠;丁翰林;俞凯
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2021.05.28
技术公布日:2021.08.10
本文用于企业家、创业者技术爱好者查询,结果仅供参考。