一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于均衡器的语音数据增强方法、装置及可读介质与流程

2022-04-02 10:24:32 来源:中国专利 TAG:

技术特征:
1.一种基于均衡器的语音数据增强方法,其特征在于,包括以下步骤:s1,获取具有第一频响曲线的第一语音;s2,采用至少一个不同均衡器对所述第一语音进行处理,得到至少一个第二语音,每个第二语音具有一个与所述第一频响曲线不同的第二频响曲线,所述第一语音和第二语音对应于第一说话人;s3,重复步骤s1-s2得到对应于多个不同说话人的第一语音和第二语音,基于所述多个不同说话人的第一语音和第二语音得到语音模型的训练数据。2.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述步骤s1具体包括:采集所述第一说话人说话的所述第一语音。3.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述步骤s1具体包括:从所述第一说话人的语音数据中提取得到所述第一语音。4.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述步骤s2还包括:通过调节不同频段的增益数值生成所述至少一个不同均衡器。5.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述均衡器将具有所述第一频响曲线的所述第一语音调节成为具有所述第二频响曲线的所述第二语音。6.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述语音模型包括基于深度学习的语音识别模型或声纹识别模型。7.根据权利要求1所述的基于均衡器的语音数据增强方法,其特征在于,所述均衡器包括数字均衡器。8.一种基于均衡器的语音数据增强装置,其特征在于,包括:数据获取模块,被配置为获取具有第一频响曲线的第一语音;均衡器处理模块,被配置为采用至少一个不同均衡器对所述第一语音进行处理,得到至少一个第二语音,每个第二语音具有一个与所述第一频响曲线不同的第二频响曲线,所述第一语音和第二语音对应于第一说话人;训练数据生成模块,被配置为重复执行数据获取模块和均衡器处理模块得到对应于多个不同说话人的第一语音和第二语音,基于所述多个不同说话人的第一语音和第二语音得到语音模型的训练数据。9.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结
本发明公开了一种基于均衡器的语音数据增强方法、装置及可读介质,通过获取具有第一频响曲线的第一语音;采用至少一个不同均衡器对第一语音进行处理,得到至少一个第二语音,每个第二语音具有一个与第一频响曲线不同的第二频响曲线,第一语音和第二语音对应于第一说话人;重复上述步骤得到对应于多个不同说话人的第一语音和第二语音,基于多个不同说话人的第一语音和第二语音得到语音模型的训练数据。经过该训练数据训练得到的语音模型能够有效提高跨设备的准确率,减小设备音频响曲线不同所带来的误差。同所带来的误差。同所带来的误差。


技术研发人员:叶志坚 肖龙源 李稀敏
受保护的技术使用者:厦门快商通科技股份有限公司
技术研发日:2021.11.26
技术公布日:2022/4/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献