一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音增强方法、相关设备及可读存储介质与流程

2022-04-16 15:37:10 来源:中国专利 TAG:

技术特征:
1.一种语音增强方法,其特征在于,所述方法包括:获取待增强语音;对所述待增强语音进行预增强处理,得到预增强处理后的语音;判断所述预增强处理后的语音是否失真;当所述预增强处理后的语音失真时,对所述预增强处理后的语音进行修复,得到修复后的语音;基于所述修复后的语音,确定所述待增强语音对应的增强后的语音。2.根据权利要求1所述的方法,其特征在于,所述对所述待增强语音进行预增强处理,得到预增强处理后的语音,包括:对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码;基于所述待增强语音的估计时频掩码以及所述待增强语音,得到预增强处理后的语音。3.根据权利要求2所述的方法,其特征在于,所述对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:将所述待增强语音输入第一语音增强模型,所述第一语音增强模型输出所述待增强语音的估计时频掩码;所述第一语音增强模型是以第一训练用语音为训练样本,以第一训练用语音的真实时频掩码为样本标签,以第一语音增强模型输出的估计时频掩码趋近于所述第一训练用语音的真实时频掩码为训练目标训练得到的;所述第一训练用语音包括训练用纯净语音以及训练用噪声,所述第一训练用语音的真实时频掩码是基于所述第一训练用语音的信噪比计算得到的。4.根据权利要求3所述的方法,其特征在于,所述判断所述预增强处理后的语音是否失真,包括:基于所述第一语音增强模型输出的所述待增强语音的估计时频掩码计算得到所述待增强语音的信噪比;当所述待增强语音的信噪比小于预设信噪比阈值时,确定所述预增强处理后的语音失真。5.根据权利要求1所述的方法,其特征在于,对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:获取所述待增强语音的回声参考信号;将所述待增强语音以及所述待增强语音的回声参考信号,输入第二语音增强模型,所述第二语音增强模型输出所述待增强语音的估计时频掩码;所述第二语音增强模型是以第二训练用语音为训练样本,以第二训练用语音的真实时频掩码为样本标签,以第二语音增强模型输出的估计时频掩码趋近于所述第二训练用语音的真实时频掩码为训练目标训练得到的;所述第二训练用语音包括训练用纯净语音、训练用回声以及回声参考信号,所述训练用语音的真实时频掩码是基于所述训练用语音的信回比计算得到的。6.根据权利要求5所述的方法,其特征在于,所述判断所述预增强处理后的语音是否失真,包括:对所述待增强语音对应的采集模式进行检测;
当所述待增强语音对应的采集模式为双讲模式时,基于所述第二语音增强模型输出的所述待增强语音的估计时频掩码,计算得到所述待增强语音的信回比;当所述待增强语音的信回比小于预设信回比阈值时,确定所述预增强处理后的语音失真。7.根据权利要求1所述的方法,其特征在于,所述对所述预增强处理后的语音进行修复,得到修复后的语音,包括:将所述预增强处理后的语音输入语音修复模型,所述语音修复模型对所述预增强处理后的语音进行相位和幅度修复,输出修复后的语音;所述语音修复模型是以第三训练用语音为训练样本,以第三训练用语音对应的纯净语音的相位谱和幅度谱为样本标签,以语音修复模型对所述第三训练用语音只进行相位信息修复后输出的相位谱趋近于所述第三训练用语音对应的纯净语音的相位谱,且,所述语音修复模型对所述第三训练用语音只进行幅度信息修复后输出的幅度谱趋近于所述第三训练用语音对应的纯净语音的幅度谱为训练目标训练得到的。8.一种语音增强装置,其特征在于,所述装置包括:获取单元,用于获取待增强语音;预增强处理单元,用于对所述待增强语音进行预增强处理,得到预增强处理后的语音;失真判断单元,用于判断所述预增强处理后的语音是否失真;修复单元,用于当所述预增强处理后的语音失真时,对所述预增强处理后的语音进行修复,得到修复后的语音;基于所述修复后的语音,确定所述待增强语音对应的增强后的语音。9.一种语音增强设备,其特征在于,包括存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如权利要求1至7中任一项所述的语音增强方法的各个步骤。10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的语音增强方法的各个步骤。

技术总结
本申请公开了一种语音增强方法、相关设备及可读存储介质。在获取待增强语音之后,先对待增强语音进行预增强处理,得到预增强处理后的语音,然后判断预增强处理后的语音是否失真,当预增强处理后的语音失真时,对预增强处理后的语音进行修复,得到修复后的语音,最后基于修复后的语音,确定待增强语音对应的增强后的语音。本方案中,在确定预增强处理后的语音失真时,对预增强处理后的语音进行了修复,使得基于修复后的语音,确定的待增强语音对应的增强后的语音不存在失真问题,提升了语音增强的效果。强的效果。强的效果。


技术研发人员:黄远芳 李明子 马峰
受保护的技术使用者:西安讯飞超脑信息科技有限公司
技术研发日:2021.12.30
技术公布日:2022/4/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献