一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种笔触噪声处理方法、装置、设备及存储介质与流程

2023-01-14 16:32:43 来源:中国专利 TAG:

技术特征:
1.一种笔触噪声处理方法,其特征在于,包括:获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。2.根据权利要求1所述的笔触噪声处理方法,其特征在于,所述获取带有笔触噪声的原始语音数据,包括:确定交互平板处于书写模式,获取语音收集得到的带有笔触噪声的原始语音数据。3.根据权利要求1所述的笔触噪声处理方法,其特征在于,所述深度神经网络设置有多层编码卷积层和解码卷积层,所述编码卷积层和所述解码卷积层之间呈对称设置,所述编码卷积层的尺寸逐层减半。4.根据权利要求3所述的笔触噪声处理方法,其特征在于,对称的所述编码卷积层和所述解码卷积层之间残差连接。5.根据权利要求1所述的笔触噪声处理方法,其特征在于,所述笔触噪声处理方法还包括:获取笔触噪声数据,所述笔触噪声数据在笔触碰撞交互平板时进行声音采集得到;将所述笔触噪声数据与纯净人声数据合成为噪声语音样本;利用所述噪声语音样本和所述纯净人声数据,对深度神经网络进行训练。6.根据权利要求5所述的笔触噪声处理方法,其特征在于,所述将所述笔触噪声数据与纯净人声数据合成为噪声语音样本,包括:对所述笔触噪声数据进行切分,得到多个笔触噪声切片;将所述笔触噪声切片和与纯净人声数据合成为噪声语音样本。7.根据权利要求5所述的笔触噪声处理方法,其特征在于,所述深度神经网络训练所使用的损失函数为sdr损失函数,所述sdr损失函数基于以下公式确定:其中,y为所述纯净人声数据,为所述深度神经网络的输出。8.一种笔触噪声处理装置,其特征在于,包括语音处理模块、语音降噪模块和语音转换模块,其中:所述语音处理模块,用于获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;所述语音降噪模块,用于将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;所述语音转换模块,用于对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
9.一种笔触噪声处理设备,其特征在于,包括:存储器以及一个或多个处理器;所述存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一项所述的笔触噪声处理方法。10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一项所述的笔触噪声处理方法。

技术总结
本申请实施例公开了一种笔触噪声处理方法、装置、设备及存储介质。本申请实施例提供的技术方案通过对采集到的原始语音数据进行短时傅里叶变换,以将原始语音数据转换为时频域特征,并将时频域特征输入到深度神经网络中进行降噪处理,由深度神经网络输出降噪后的降噪语音特征,并对降噪语音特征进行逆短时傅里叶变换,得到降噪语音数据,此时降噪语音数据过滤掉了原始语音数据中的笔触噪声,有效提高录音效果。音效果。音效果。


技术研发人员:纪文波 李波
受保护的技术使用者:广州视睿电子科技有限公司
技术研发日:2021.06.28
技术公布日:2023/1/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献