一种基于注意力机制和卷积神经网络的单通道语音增强方法

2022-05-11 12:47:48 来源：中国专利 TAG：

技术特征：
1.一种基于注意力机制和卷积神经网络的单通道语音增强方法，其特征在于，包括训练阶段和增强阶段：训练阶段：首先将噪声与纯净语音合成带噪语音，接着对带噪语音进行特征提取，然后将纯净语音与特征提取后的带噪语音一并送入神经网络模型中学习带噪语音和纯净语音之间的映射关系，训练阶段结束后，将训练好的模型保存下来；增强阶段：首先对带噪语音进行特征提取，然后送入训练好的模型中进行语音增强，最后输出增强后的语音。2.如权利要求1所述的基于注意力机制和卷积神经网络的单通道语音增强方法，其特征在于，所述神经网络模型包括编码模块、降噪模块和解码模块，带噪语音首先经过编码模块处理，然后送入降噪模块，接着编码模块的输出与降噪模块的输出相乘最后送入解码模块获得增强后的语音。3.如权利要求2所述的基于注意力机制和卷积神经网络的单通道语音增强方法，其特征在于，所述编码模块的输出首先送入降噪模块中的注意力模块处理，然后再经过卷积模块处理后输出；在注意力模块中，语音特征经过层归一化、多头自注意力和dropout处理后和编码模块的输出逐点相加后输出；在卷积模块中，语音特征经过层归一化、逐点卷积、激活函数glu、深度卷积、批归一化、激活函数swish、逐点卷积和dropout处理后和注意力模块的输出逐点相加后输出。4.如权利要求2所述的基于注意力机制和卷积神经网络的单通道语音增强方法，其特征在于，在解码模块中：首先，语音特征经过二维反卷积、批归一化和激活函数prelu处理后大小变为[b,128,k,s]，接着语音特征经过重叠相加后大小变为[b,128,l]，最后语音特征经过一维反卷积处理大小还原为[b,1,l]。

技术总结
本发明公开了一种基于注意力机制和卷积神经网络的单通道语音增强方法，包括训练阶段和增强阶段：训练阶段：首先将噪声与纯净语音合成带噪语音，接着对带噪语音进行特征提取，然后将纯净语音与特征提取后的带噪语音一并送入神经网络模型中学习带噪语音和纯净语音之间的映射关系，训练阶段结束后，将训练好的模型保存下来；增强阶段：首先对带噪语音进行特征提取，然后送入训练好的模型中进行语音增强，最后输出增强后的语音。本发明的基于注意力机制和卷积神经网络的单通道语音增强方法可直接在时域上对带噪语音进行增强，不但可以节省傅里叶变换的计算时间还可以尽可能的保留增强语音的相位信息，能取得较好的降噪效果。果。果。

技术研发人员：沈学利田桂源马琳琳
受保护的技术使用者：辽宁工程技术大学
技术研发日：2022.02.10
技术公布日：2022/5/10

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种音频信号的杂音检测方法及相关电子设备与流程

一种基于注意力机制和卷积神经网络的单通道语音增强方法

相关文献

最热文献