语音信号增强方法、装置、存储介质及电子设备与流程

2022-10-26 19:36:11 来源：中国专利 TAG：

技术特征：
1.一种语音信号增强方法，其特征在于，所述方法包括：对语音信号进行特征提取处理，得到语音特征信息；将所述语音特征信息输入目标模型进行增益信号提取，得到所述语音信号对应的增益信号；基于所述增益信号对所述语音信号进行增强，得到增强结果；其中，所述目标模型包括至少一个语音处理模块，所述语音处理模块由三个门循环单元构成，并且，所述门循环单元为所述目标模型中唯一使用的语音信号处理单元。2.根据权利要求1所述的方法，其特征在于，所述目标模型包括至少两个语音处理模块，所述目标模型中各语音处理模块形成单向链式连接；所述目标模型中任意相邻的两个语音处理模块之间设置有连接层，所述连接层由所述门循环单元构成。3.根据权利要求1或2所述的方法，其特征在于，每一语音处理模块均包括第一门循环单元、第二门循环单元和第三门循环单元，不同的语音处理模块中的具备对应关系的门循环单元具备相同的节点数。4.根据权利要求3所述的方法，其特征在于，所述第一门循环单元、所述第二门循环单元、所述第三门循环单元对应的激活函数分别是tanh、relu和relu。5.根据权利要求1至4中任意一项所述的方法，其特征在于，在所述目标模型包括一个语音处理模块的情况下，所述将所述语音特征信息输入目标模型进行增益信号提取，得到所述语音信号对应的增益信号，包括：将所述语音特征信息作为所述目标模型中的第一个语音处理模块的输入信号，得到所述第一个语音处理模块输出的处理结果；将所述处理结果输入所述目标模型的激活函数输出层，得到所述增益信号。6.根据权利要求2至4中任意一项所述的方法，其特征在于，所述目标模型包括至少两个语音处理模块的情况下，所述将所述语音特征信息输入目标模型进行增益信号提取，得到所述语音信号对应的增益信号，包括：将所述语音特征信息作为所述目标模型中的第一个语音处理模块的输入信号，得到所述第一个语音处理模块输出的处理结果；将所述处理结果输入所述连接层，得到第二个语音处理单元的输入信号：基于所述第二个语音处理单元输出的处理结果，得到最后一个语音处理单元输出的处理结果；将所述最后一个语音处理单元输出的处理结果输入所述目标模型的激活函数输出层，得到所述增益信号。7.根据权利要求5或6所述的方法，其特征在于，所述将所述语音特征信息作为所述目标模型中的第一个语音处理模块的输入信号，得到所述第一个语音处理模块输出的处理结果，包括：将所述输入信号输入所述第一门循环单元，得到第一信号；
将所述输入信号和所述第一信号输入所述第二门循环单元，得到第二信号；将所述第一信号、所述第二信号和所述输入信号均输入所述第三门循环单元，得到所述第一个语音处理模块输出的处理结果。8.根据权利要求1所述的方法，其特征在于，所述对语音信号进行特征提取处理，得到语音特征信息，包括：对所述语音信号进行频域带宽划分，得到第一数量个巴克频域带；针对每一巴克频域带，确定其对应的巴克频率倒谱系数；针对所述第一数量个巴克频域带的频域升序排列结果的前第二数量个巴克频域带中的每一巴克频域带，得到其对应的一阶差分参数、二阶差分参数、互相关参数；获取所述语音信号的基因周期和能量参数；根据获取到的各巴克频率倒谱系数、一阶差分参数、二阶差分参数、互相关参数、基因周期和能量参数，构建所述语音特征信息。9.根据权利要求1所述的方法，其特征在于，所述基于所述增益信号对所述语音信号进行增强，得到增强结果，包括：获取所述语音信号的功率谱；将所述增益信号与所述功率谱进行乘法运算，得到频域增益信号；对所述频域增益信号进行离散余弦变换，得到所述增强结果。10.根据权利要求1所述的方法，其特征在于，所述目标模型通过下述方法训练得到：获取语音样本信号以及所述语音样本信号对应的纯净样本信号，纯净样本信号为不包含噪声的所述语音样本信号；将所述语音样本信号输入预设模型，得到样本增益信号，所述预设模型与所述目标模型具备相同结构；根据所述语音样本信号和所述纯净样本信号，得到样本真值增益；根据所述样本增益信号和所述样本真值增益，确定所述预设模型的损失；根据所述损失调整所述预设模型的参数，得到所述目标模型。11.一种语音信号增强装置，其特征在于，所述装置包括：特征提取模块，用于对语音信号进行特征提取处理，得到语音特征信息；增益获取模块，用于将所述语音特征信息输入目标模型进行增益信号提取，得到所述语音信号对应的增益信号；增强模块，用于基于所述增益信号对所述语音信号进行增强，得到增强结果；其中，所述目标模型包括至少一个语音处理模块，所述语音处理模块由三个门循环单元构成，并且，所述门循环单元为所述目标模型中唯一使用的语音信号处理单元。12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1至11中任一项所述的一种语音信号增强方法。13.一种电子设备，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1至11中任一项所述的一种语音信号增强方法。
14.一种计算机程序产品，包括计算机程序或指令，其特征在于，该计算机程序或指令被处理器执行时实现权利要求1至11中任一项所述的一种语音信号增强方法。

技术总结
本申请实施例公开了语音信号增强方法、装置、存储介质及电子设备，可以应用于云领域、人工智能领域或者语音应用领域。上述方法包括：对语音信号进行特征提取处理，得到语音特征信息；将上述语音特征信息输入目标模型进行增益信号提取，得到上述语音信号对应的增益信号；基于上述增益信号对上述语音信号进行增强，得到增强结果；其中，上述目标模型包括至少一个语音处理模块，上述语音处理模块由三个门循环单元构成，并且，上述门循环单元为上述目标模型中唯一使用的语音信号处理单元。本申请既降低了异构程度和计算需求，又提升了去噪增强效果。果。果。

技术研发人员：鲍枫
受保护的技术使用者：腾讯云计算（北京）有限责任公司
技术研发日：2022.07.05
技术公布日：2022/10/25

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种列车车厢的语音播报系统的制作方法

语音信号增强方法、装置、存储介质及电子设备与流程

相关文献

最热文献