语音信号去混响方法、装置和电子设备与流程

2021-08-13 19:22:00 来源：中国专利 TAG：混响电子设备语音装置信号

技术特征：

1.一种语音信号去混响方法，其特征在于，包括：

将时域的混响语音信号转换到频域，得到频域的混响语音信号；

对所述时域的混响语音信号进行延时，将延时后的混响语音信号转换到频域，得到频域的延时混响语音信号；

利用所述频域的混响语音信号和所述频域的延时混响语音信号，确定频域直达声的估计值；

根据所述频域的混响语音信号和所述频域直达声的估计值，确定频域的无混响语音信号；

将所述频域的无混响语音信号转换到时域，得到时域的无混响语音信号。

2.根据权利要求1所述的方法，其特征在于，所述根据所述频域的混响语音信号和所述频域直达声的估计值，确定频域的无混响语音信号，包括：

根据所述频域的混响语音信号和所述频域直达声的估计值，确定无混响语音的掩膜，将所述掩膜和所述频域的混响语音信号相乘得到频域的无混响语音信号。

3.根据权利要求1所述的方法，其特征在于，所述利用所述频域的混响语音信号和所述频域的延时混响语音信号，确定频域直达声的估计值，包括：

根据所述频域的混响语音信号和所述频域的延时混响语音信号，确定语音信号的自相关功率谱和互相关功率谱；

根据所述自相关功率谱、所述互相关功率谱和预设的噪声空间相关函数，确定相干扩散能量比；

根据所述相干扩散能量比和所述频域的混响语音信号，确定频域直达声的估计值。

4.根据权利要求2所述的方法，其特征在于，所述根据所述频域的混响语音信号和所述频域直达声的估计值，确定无混响语音的掩膜，包括：

将所述频域的混响语音信号和所述频域直达声的估计值输入预先训练的增强网络中，得到无混响语音的掩膜。

5.根据权利要求4所述的方法，其特征在于，所述增强网络是通过如下步骤训练得到的：

获取训练样本集合，其中，训练样本包括：频域的样本混响语音信号、频域样本直达声信号和样本无混响语音的掩膜，频域样本直达声信号为将样本纯净语音信号转换到频域所得到的，频域的样本混响语音信号为将目标语音信号转换到频域所得到的，目标语音信号为将样本纯净语音信号与预设的房间冲击响应进行卷积操作所生成的，样本无混响语音的掩膜为频域的样本纯净语音信号与频域的样本混响语音信号之比；

基于训练样本集合执行以下训练步骤：将训练样本集合中的至少一个训练样本的频域的样本混响语音信号和频域样本直达声信号输入初始神经网络，得到所述至少一个训练样本中的每个训练样本对应的无混响语音的掩膜；将所述至少一个训练样本中的每个训练样本对应的无混响语音的掩膜与对应的样本无混响语音的掩膜进行比较；根据比较结果确定初始神经网络是否达到预设的优化目标；若初始神经网络达到所述优化目标，将初始神经网络确定为训练完成的增强网络。

6.根据权利要求5所述的方法，其特征在于，训练得到所述增强网络的步骤还包括：

若初始神经网络未达到所述优化目标，调整初始神经网络的网络参数，以及使用未用过的训练样本组成训练样本集合，使用调整后的初始神经网络作为初始神经网络，继续执行所述训练步骤。

7.根据权利要求4-6之一所述的方法，其特征在于，所述增强网络包括空间可变卷积网络和/或长短时记忆网络。

8.一种语音信号去混响装置，其特征在于，包括：

第一转换单元，用于将时域的混响语音信号转换到频域，得到频域的混响语音信号；

延时单元，用于对所述时域的混响语音信号进行延时，将延时后的混响语音信号转换到频域，得到频域的延时混响语音信号；

第一确定单元，用于利用所述频域的混响语音信号和所述频域的延时混响语音信号，确定频域直达声的估计值；

第二确定单元，用于根据所述频域的混响语音信号和所述频域直达声的估计值，确定频域的无混响语音信号；

第二转换单元，用于将所述频域的无混响语音信号转换到时域，得到时域的无混响语音信号。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结
本公开实施例公开了语音信号去混响方法、装置和电子设备。该方法的一具体实施方式包括：将时域的混响语音信号转换到频域，得到频域的混响语音信号；对时域的混响语音信号进行延时，将延时后的混响语音信号转换到频域，得到频域的延时混响语音信号；利用频域的混响语音信号和频域的延时混响语音信号，确定频域直达声的估计值；根据频域的混响语音信号和频域直达声的估计值，确定频域的无混响语音信号；将频域的无混响语音信号转换到时域，得到时域的无混响语音信号。该实施方式能够更有效地对语音信号去混响。

技术研发人员：范文之;徐杨飞;马泽君
受保护的技术使用者：北京有竹居网络技术有限公司
技术研发日：2021.05.10
技术公布日：2021.08.13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

语音信号去混响方法、装置和电子设备与流程

相关文章

最热文献