语音获取方法、装置、电子设备及存储介质与流程

2022-02-20 00:40:16 来源：中国专利 TAG：

技术特征：
1.一种语音获取方法，其特征在于，包括：根据混合信号的幅度信息执行分离处理，获得语音分离掩膜；根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息，获得语音耦合数据；针对所述语音耦合数据执行增强处理，获得语音增强掩膜；以及根据所述语音增强掩膜和所述语音分离掩膜，获得语音信号。2.根据权利要求1所述的语音获取方法，其特征在于，所述根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息，获得语音耦合数据包括：根据所述语音分离掩膜和所述混合信号的所述幅度信息，获得语音频谱图；耦合所述语音频谱图与所述混合信号的所述相位信息，获得语音复数谱。3.根据权利要求2所述的语音获取方法，其特征在于，所述针对所述语音耦合数据执行增强处理，获得语音增强掩膜包括：利用复数语音增强模型，针对所述语音复数谱执行增强预测，获得所述语音增强掩膜；其中，所述复数语音增强模型包括对称设置的多个卷积块和多个反卷积块。4.根据权利要求3所述的语音获取方法，其特征在于，所述利用复数语音增强模型针对所述语音复数谱执行增强预测，获得所述语音增强掩膜包括：将所述语音复数谱分别输入每个卷积块的实部卷积单元和虚部卷积单元中执行卷积处理，获得实部卷积信息和虚部卷积信息；将所述实部卷积信息和所述虚部卷积信息分别输入每个反卷积块的实部反卷积单元和虚部反卷积单元中执行反卷积处理，获得实部预测信息和虚部预测信息；根据所述实部预测信息和所述虚部预测信息，获得所述语音增强掩膜。5.根据权利要求4所述的语音获取方法，其特征在于，所述将所述语音复数谱分别输入每个卷积块的实部卷积单元和虚部卷积单元中执行卷积处理，获得实部卷积信息和虚部卷积信息包括：根据所述语音复数谱的第一实部信息和第一虚部信息，生成实部卷积输入，并根据所述语音复数谱的第二实部信息和第二虚部信息，生成虚部卷积输入；提供所述实部卷积单元针对所述实部卷积输入执行卷积处理，获得第一实部卷积输出和第二实部卷积输出，并提供所述虚部卷积单元针对所述虚部卷积输入执行卷积处理，获得第一虚部卷积输出和第二虚部卷积输出；根据所述第一实部卷积输出和所述第一虚部卷积输出，获得所述实部卷积信息，并根据所述第二实部卷积输出和所述第二虚部卷积输出，获得所述虚部卷积信息。6.根据权利要求4所述的语音获取方法，其特征在于，所述将所述实部卷积信息和所述虚部卷积信息分别输入每个反卷积块的实部反卷积单元和虚部反卷积单元中执行反卷积处理，获得实部预测信息和虚部预测信息包括：根据所述实部卷积信息的第一实部信息和第一虚部信息，生成实部反卷积输入，并根据所述虚部卷积信息的第二实部信息和第二虚部信息，生成虚部反卷积输入；提供所述实部反卷积单元针对所述实部反卷积输入执行反卷积处理，获得第一实部反卷积输出和第二实部反卷积输出，并提供所述虚部反卷积单元针对所述虚部反卷积输入执行反卷积处理，获得第一虚部反卷积输出和第二虚部反卷积输出；
根据所述第一实部反卷积输出和所述第一虚部反卷积输出，获得所述实部预测信息，并根据所述第二实部反卷积输出和所述第二虚部反卷积输出，获得所述虚部预测信息。7.根据权利要求4所述的语音获取方法，其特征在于，所述复数语音增强模型还包括瓶颈层，所述方法还包括：将所述卷积块输出的所述实部卷积信息和所述虚部卷积信息输入所述瓶颈层中，以建立上下文信息，并将建立有上下文信息的所述实部卷积信息和所述虚部卷积信息输入所述反卷积块的所述实部反卷积单元和所述虚部反卷积单元中执行反卷积处理，获得所述实部预测信息和所述虚部预测信息。8.根据权利要求1所述的语音获取方法，其特征在于，所述根据所述语音增强掩膜和所述语音分离掩膜，获得语音信号包括：将所述语音增强掩膜和所述语音分离掩膜进行点乘处理，获得待转换信号；针对所述待转换信号执行傅里叶逆变换，获得所述语音信号。9.根据权利要求1所述的语音获取方法，其特征在于，所述方法还包括：获取混合音频数据；基于预设帧长参数和预设帧移参数，对所述混合音频数据执行分帧处理，获得各音频数据帧；基于预设窗函数，对各音频数据帧执行加窗处理，以获得各混合信号；合成各混合信号对应的各语音信号，以获得所述混合音频数据的目标语音。10.一种语音获取装置，其特征在于，包括：语音分离模块，用于根据混合信号的幅度信息执行分离处理，获得语音分离掩膜；耦合模块，用于根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息，获得语音耦合数据；语音增强模块，用于针对所述语音耦合数据执行增强处理，获得语音增强掩膜；转换模块，用于根据所述语音增强掩膜和所述语音分离掩膜，获得语音信号。11.一种电子设备，包括：处理器；以及存储程序的存储器，其中，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-9中任一项所述的方法。12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

技术总结
本公开提供一种语音获取方法、装置、电子设备及存储介质，该语音获取方法包括：根据混合信号的幅度信息执行分离处理，获得语音分离掩膜；根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息，获得语音耦合数据；针对所述语音耦合数据执行增强处理，获得语音增强掩膜；以及根据所述语音增强掩膜和所述语音分离掩膜，获得语音信号。据此，可以提高语音获取效果。获取效果。获取效果。

技术研发人员：智鹏鹏陈昌滨
受保护的技术使用者：北京世纪好未来教育科技有限公司
技术研发日：2021.12.09
技术公布日：2022/1/6

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：吸音材料及应用该吸音材料的扬声器的制作方法

语音获取方法、装置、电子设备及存储介质与流程

相关文献

最热文献