语音增强方法、装置、设备及可读存储介质与流程

2022-11-30 15:46:29 来源：中国专利 TAG：

技术特征：
1.一种语音增强方法，其特征在于，所述方法包括：基于当前声学场景确定前置固定波束滤波器组；获取麦克风阵列在所述声学场景采集的原始多通道音频信号；利用所述前置固定波束滤波器组对所述原始多通道音频信号进行波束形成处理，得到波束形成信号；基于所述前置固定波束滤波器组，以及所述波束形成信号，计算后置滤波器的增益系数；利用所述后置滤波器的增益系数，对所述波束形成信号进行增强处理，得到增强后的语音信号。2.根据权利要求1所述的方法，其特征在于，所述基于当前声学场景确定前置固定波束滤波器组，包括：基于所述声学场景，确定所述前置固定波束滤波器的波束模式、所述前置固定波束滤波器组的波束数量，以及，所述前置固定波束滤波器组的波束空间排布和主瓣指向；基于所述前置固定波束滤波器的波束模式、所述前置固定波束滤波器组的波束数量，以及，所述前置固定波束滤波器组的波束空间排布和主瓣指向，确定所述前置固定波束滤波器组。3.根据权利要求2所述的方法，其特征在于，基于所述声学场景，确定所述前置固定波束滤波器组的波束数量，包括：根据所述声学场景包含的声源个数，确定相干函数矩阵方程组的未知量个数；根据所述函数矩阵方程组的未知量个数，确定所述前置固定波束滤波器组的波束数量。4.根据权利要求3所述的方法，其特征在于，所述基于所述前置固定波束滤波器组，以及所述波束形成信号，计算后置滤波器的增益系数，包括：获取所述前置固定波束滤波器组的波束空间排布和主瓣指向、所述前置固定波束滤波器组的系数矩阵；确定所述波束形成信号的自协方差矩阵；基于所述前置固定波束滤波器组的波束空间排布和主瓣指向、所述前置固定波束滤波器组的系数矩阵，以及，所述波束形成信号的自协方差矩阵，估计所述声学场景中包含的声源的功率；基于所述声学场景中包含的声源的功率，计算得到所述后置滤波器的增益系数。5.根据权利要求4所述的方法，其特征在于，所述基于所述前置固定波束滤波器组的波束空间排布和主瓣指向、所述前置固定波束滤波器组的系数矩阵，以及，所述波束形成信号的自协方差矩阵，估计所述声学场景中包含的声源的功率，包括：基于所述前置固定波束滤波器组的波束空间排布和主瓣指向、所述前置固定波束滤波器组的系数矩阵，以及，所述波束形成信号的自协方差矩阵，确定所述相干函数矩阵方程组的具体表达式；计算所述相干函数矩阵方程组的最小二乘解，得到所述声学场景中包含的声源的功率。6.根据权利要求5所述的方法，其特征在于，所述基于所述前置固定波束滤波器组的波
束空间排布和主瓣指向、所述前置固定波束滤波器组的系数矩阵，以及，所述波束形成信号的自协方差矩阵，确定所述相干函数矩阵方程组的具体表达式，包括：基于所述前置固定波束滤波器组的波束空间排布和主瓣指向，以及，所述前置固定波束滤波器组的系数矩阵，计算所述声学场景中各个点声源的波束后协方差矩阵、所述声学场景中扩散噪声的波束后协方差矩阵和所述声学场景中白噪声的波束后协方差矩阵；基于所述声学场景中各个点声源的波束后协方差矩阵、所述声学场景中扩散噪声的波束后协方差矩阵、所述声学场景中白噪声的波束后协方差矩阵，以及，所述波束形成信号的自协方差矩阵，确定所述相干函数矩阵方程组的具体表达式。7.根据权利要求6所述的方法，其特征在于，所述基于所述前置固定波束滤波器组的波束空间排布和主瓣指向，以及，所述前置固定波束滤波器组的系数矩阵，计算所述声学场景中各个点声源的波束后协方差矩阵，包括：基于所述前置固定波束滤波器组的波束空间排布和主瓣指向，确定所述声学场景中各个点声源的方位；针对所述声学场景中每个点声源，根据所述点声源的方位计算所述点声源的直接导向矢量，将所述点声源的直接导向矢量与所述前置固定波束滤波器组的系数矩阵进行矩阵乘，得到所述点声源的波束后导向矢量，对所述点声源的波束后导向矢量求自协方差，得到所述点声源的波束后协方差矩阵。8.一种语音增强装置，其特征在于，所述装置包括：前置固定波束滤波器组确定单元，用于基于当前声学场景确定前置固定波束滤波器组；获取单元，用于获取麦克风阵列在所述声学场景采集的原始多通道音频信号；波束形成处理单元，用于利用所述前置固定波束滤波器组对所述原始多通道音频信号进行波束形成处理，得到波束形成信号；增益系数计算单元，用于基于所述前置固定波束滤波器组，以及所述波束形成信号，计算后置滤波器的增益系数；增强处理单元，用于利用所述后置滤波器的增益系数，对所述波束形成信号进行增强处理，得到增强后的语音信号。9.一种语音增强设备，其特征在于，包括存储器和处理器；所述存储器，用于存储程序；所述处理器，用于执行所述程序，实现如权利要求1至7中任一项所述的语音增强方法的各个步骤。10.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1至7中任一项所述的语音增强方法的各个步骤。

技术总结
本申请公开了一种语音增强方法、装置、设备及可读存储介质。先基于当前声学场景确定前置固定波束滤波器组；在获取麦克风阵列在声学场景采集的原始多通道音频信号之后，先利用前置固定波束滤波器组对原始多通道音频信号进行波束形成处理，得到波束形成信号，再基于前置固定波束滤波器组，以及波束形成信号，计算后置滤波器的增益系数，使得计算得到的后置滤波器的增益系数误差较小，最后再利用后置滤波器的增益系数，对波束形成信号进行增强处理，得到增强后的语音信号，能够提升语音增强效果。果。果。

技术研发人员：刘卓付中华
受保护的技术使用者：西安讯飞超脑信息科技有限公司
技术研发日：2022.08.29
技术公布日：2022/11/29

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于联合感知损失的注意力生成对抗语音增强方法

语音增强方法、装置、设备及可读存储介质与流程

相关文献

最热文献