语音处理方法及其装置和模型训练方法及其装置与流程

2021-11-29 14:08:00 来源：中国专利 TAG：

技术特征：
1.一种语音处理模型的训练方法，其特征在于，所述训练方法包括：获取利用高保真音频采集设备采集的无损语音信号；通过将所述无损语音信号与噪声信号进行混合得到混合信号并且向混合信号添加混响信号和麦克风冲击响应，以生成训练信号；利用所述训练信号和所述语音处理模型来获得语音预测信号；根据所述无损语音信号和所述语音预测信号来训练所述语音处理模型。2.如权利要求1所述的训练方法，其特征在于，利用所述训练信号和所述语音处理模型来获得语音预测信号，包括：通过对所述训练信号进行短时傅里叶变换来得到所述训练信号的实部数据和虚部数据；基于所述训练信号的实部数据和虚部数据通过所述语音处理模型来得到所述语音预测信号的实部数据和虚部数据；通过对所述语音预测信号的实部数据和虚部数据进行短时傅里叶逆变换来得到所述语音预测信号。3.如权利要求2所述的训练方法，其特征在于，训练所述语音处理模型，包括：根据所述无损语音信号的实部数据和虚部数据以及所述语音预测信号的实部数据和虚部数据来训练所述语音处理模型。4.如权利要求1所述的训练方法，其特征在于，利用所述训练信号和所述语音处理模型来获得语音预测信号，包括：获取所述训练信号的幅度谱；基于所述训练信号的幅度谱通过所述语音处理模型来得到所述语音预测信号的幅度谱；基于所述语音预测信号的幅度谱通过声码器来得到所述语音预测信号。5.如权利要求1所述的训练方法，其特征在于，利用所述训练信号和所述语音处理模型来获得语音预测信号，包括：通过对所述训练信号进行修正离散余弦变换来得到所述训练信号的修正离散余弦变换系数；基于所述训练信号的修正离散余弦变换系数通过所述语音处理模型来得到所述语音预测信号的修正离散余弦变换系数；通过对所述语音预测信号的修正离散余弦变换系数进行修正离散余弦逆变换来得到所述语音预测信号。6.一种语音处理方法，其特征在于，所述语音处理方法包括：获取语音信号；基于所述语音信号利用通过如权利要求1
‑
5中任一项所述的训练方法得到的语音处理模型来获得与所述语音信号相应的高音质语音信号。7.一种语音处理模型的训练装置，其特征在于，所述训练装置包括：获取模块，被配置为获取利用高保真音频采集设备采集的无损语音信号；生成模块，被配置为通过将所述无损语音信号与噪声信号进行混合得到混合信号并且向混合信号添加混响信号和麦克风冲击响应，以生成训练信号；
训练模块，被配置为利用所述训练信号和所述语音处理模型来获得语音预测信号，并且根据所述无损语音信号和所述语音预测信号来训练所述语音处理模型。8.一种语音处理装置，其特征在于，所述语音处理装置包括：获取模块，被配置为获取语音信号；处理模块，被配置为基于所述语音信号利用通过如权利要求1
‑
5中任一项所述的训练方法得到的语音处理模型来获得与所述语音信号相应的高音质语音信号。9.一种电子设备，其特征在于，包括：处理器；用于存储所述处理器可执行指令的存储器，其中，所述处理器被配置为执行所述指令，以实现如权利要求1至5中任一项所述的训练方法或如权利要求6所述的语音处理方法。10.一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至5中任一项所述的训练方法或如权利要求6所述的语音处理方法。

技术总结
提供一种语音处理方法及其装置和模型训练方法及其装置。一种语音处理模型的训练方法可包括以下步骤：获取利用高保真音频采集设备采集的无损语音信号；通过将无损语音信号与噪声信号进行混合得到混合信号并且向混合信号添加混响信号和麦克风冲击响应，以生成训练信号；利用训练信号和语音处理模型来获得语音预测信号；根据无损语音信号和语音预测信号来训练语音处理模型。通过使用本公开的语音处理模型可得到高质量的人声信号。型可得到高质量的人声信号。型可得到高质量的人声信号。

技术研发人员：郑羲光范欣悦张晨
受保护的技术使用者：北京达佳互联信息技术有限公司
技术研发日：2021.08.31
技术公布日：2021/11/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用户歌声的修音方法、装置及电子设备与流程

语音处理方法及其装置和模型训练方法及其装置与流程

相关文献

最热文献