多通道语音增强方法、系统、电子设备和存储介质与流程

2022-11-30 09:54:55 来源：中国专利 TAG：

技术特征：
1.一种多通道语音增强方法，包括：采集多通道语音信号；将所述多通道语音信号输入至第一信号处理模块，进行声源方向信号增强处理，得到在信噪比低于预设阈值或语音欠定情况下所述声源方向的频点级的时频掩蔽值；将所述多通道语音信号以及所述频点级的时频掩蔽值输入至第二信号处理模块，重建所述多通道语音信号的相位信息，得到第一增强语音；基于所述频点级的时频掩蔽值以及所述第一增强语音增强处理，得到减小失真的第二增强语音。2.根据权利要求1所述的方法，其中，所述第一信号处理模块由深度神经网络、循环神经网络、卷积神经网络中之一或多个神经网络组合构建，其中，所述第一信号处理模块输出的声源方向的频点级的时频掩蔽值与和所述声源方向相对应的干扰方向的噪声频点成反比。3.根据权利要求1所述的方法，其中，所述第二信号处理模块由多通道的波束形成模型和/或盲源分离模型构建。4.根据权利要求3所述的方法，其中，当所述第二信号处理模块由多通道的波束形成模型构建时，基于所述频点级的时频掩蔽值的大小控制波束形成滤波器的更新速率，其中，所述频点级的时频掩蔽值的大小与所述滤波器的更新速率成反比，以降低滤波处理的失真。5.一种多通道语音增强系统，包括：语音信号采集程序模块，用于采集多通道语音信号；神经网络处理程序模块，用于将所述多通道语音信号输入至第一信号处理模块，进行声源方向信号增强处理，得到在信噪比低于预设阈值或语音欠定情况下所述声源方向的频点级的时频掩蔽值；信号处理程序模块，用于将所述多通道语音信号以及所述频点级的时频掩蔽值输入至第二信号处理模块，重建所述多通道语音信号的相位信息，得到第一增强语音；语音增强程序模块，用于基于所述频点级的时频掩蔽值以及所述第一增强语音增强处理，得到减小失真的第二增强语音。6.根据权利要求5所述的系统，其中，所述第一信号处理模块由深度神经网络、循环神经网络、卷积神经网络中之一或多个神经网络组合构建，其中，所述第一信号处理模块输出的声源方向的频点级的时频掩蔽值与和所述声源方向相对应的干扰方向的噪声频点成反比。7.根据权利要求5所述的系统，其中，所述第二信号处理模块由多通道的波束形成模型和/或盲源分离模型构建。8.根据权利要求7所述的系统，其中，所述信号处理程序模块用于：当所述第二信号处理模块由多通道的波束形成模型构建时，基于所述频点级的时频掩蔽值的大小控制波束形成滤波器的更新速率，其中，所述频点级的时频掩蔽值的大小与所述滤波器的更新速率成反比，以降低滤波处理的失真。9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步
骤。10.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。

技术总结
本发明实施例提供一种多通道语音增强方法、系统、电子设备和存储介质。该方法包括：采集多通道语音信号；将多通道语音信号输入至第一信号处理模块，进行声源方向信号增强处理，得到在信噪比低于预设阈值或语音欠定情况下声源方向的频点级的时频掩蔽值；将多通道语音信号以及频点级的时频掩蔽值输入至第二信号处理模块，重建多通道语音信号的相位信息，得到第一增强语音；基于频点级的时频掩蔽值以及第一增强语音增强处理，得到减小失真的第二增强语音。本发明实施例能够更准确地估计掩蔽值，解决欠定条件下的信号处理，可以更好地实现相位重建，获得更好的降噪水平。获得更好的降噪水平。获得更好的降噪水平。

技术研发人员：邵雅婷周强
受保护的技术使用者：思必驰科技股份有限公司
技术研发日：2022.08.19
技术公布日：2022/11/29

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种细粒度韵律可控的情感语音合成方法、系统及存储介质与流程

多通道语音增强方法、系统、电子设备和存储介质与流程

相关文献

最热文献