一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音转换方法、装置、存储介质及电子设备与流程

2022-02-22 17:29:35 来源:中国专利 TAG:

技术特征:
1.一种语音转换方法,包括:接收待转换的源音频;对所述源音频进行内容信息编码,得到第一特征;获取目标发音人的指定音频;对所述指定音频进行语音识别,得到第二特征;将所述第一特征和所述第二特征输入至语音转换模型,得到目标音频。2.根据权利要求1所述的方法,其中,所述将所述第一特征和所述第二特征输入至语音转换模型,得到目标音频,包括:将所述第一特征和所述第二特征输入至语音转换模型,基于源音频的帧,在所述第一特征中添加所述第二特征,得到联合编码;对所述联合编码进行特征融合,得到融合特征;将所述融合特征进行信号转换,得到所述目标音频。3.根据权利要求1所述的方法,所述方法还包括:对所述源音频和所述指定进行基频提取,得到基频信息;相应的所述将所述第一特征和所述第二特征输入至语音转换模型,得到目标音频,包括:将所述基频信息、所述第一特征和所述第二特征输入至语音转换模型,得到目标音频。4.根据权利要求1所述的方法,所述方法还包括:对所述目标音频进行内容信息编码,得到内容特征;根据所述内容特征与所述第一特征,对所述目标音频行第一损失判别。5.根据权利要求1所述的方法,所述方法还包括:获取目标发音人的样本音频;基于所述样本音频和所述目标音频,进行判别模型训练;利用所述判别模型,对所述目标音频进行第二损失判别。6.根据权利要求1-5中任一项所述的方法,所述第二特征包括目标发音人的音色特征;所述第一特征包括所述源音频的内容特征信息。7.一种语音转换装置,包括:接收模块,用于接收待转换的源音频;内容信息编码模块,用于对所述源音频进行内容信息编码,得到第一特征;指定音频获取模块,用于获取目标发音人的指定音频;识别模块,用于对所述指定音频进行语音识别,得到第二特征;转换模块,用于将所述第一特征和所述第二特征输入至语音转换模型,得到目标音频。8.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述语音转换方法。9.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述语音转换方法。10.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根
据权利要求1-6中任一项所述语音转换方法。

技术总结
本公开涉及自然语音处理、语音和深度学习等人工智能技术领域,提供了一种语音转换方法、装置、存储介质及电子设备,包括:接收待转换的源音频;对源音频进行内容信息编码,得到第一特征;获取目标发音人的指定音频;对指定音频进行语音识别,得到第二特征;将第一特征和第二特征输入至语音转换模型,得到目标音频。这里采用端到端的语音转换训练,有效避免了单独训练声码器的繁琐过程,不再需要获取目标发音人的大量音频进行单独的声码器模型训练。由此,无需平行数据,即可实现任意源音频到目标发音人的音色转换。并且,将声学模型和声码器进行协同建模,语音转换的整体模型规模大幅减小。显著节存储资源和计算资源,有效提升语音转换效率。语音转换效率。语音转换效率。


技术研发人员:聂志朋 王俊超
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.09.23
技术公布日:2022/2/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献