一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音转换方法、装置、设备及存储介质

2022-04-24 22:57:40 来源:中国专利 TAG:

技术特征:
1.一种语音转换方法,其特征在于,包括:将源语音的梅尔语谱输入到语音转换模型,获得所述语音转换模型输出的目标语音的梅尔语谱;其中,所述语音转换模型在训练时以训练梅尔语谱为输入,获得所述语音转换模型的转换梅尔语谱损失和停止概率损失,以所述转换梅尔语谱损失和所述停止概率损失最小化为目标对所述语音转换模型进行迭代训练。2.按照权利要求1所述的语音转换方法,其特征在于,所述将源语音的梅尔语谱输入到语音转换模型,获得所述语音转换模型输出的目标语音的梅尔语谱前,还包括:构建语音转换模型;输入所述训练梅尔语谱到所述语音转换模型,获得当前时间步转换梅尔语谱帧和所述当前时间步转换梅尔语谱帧对应的停止概率;根据所述当前时间步转换梅尔语谱帧确定所述转换梅尔语谱损失,根据所述停止概率确定所述停止概率损失;根据所述当前时间步转换梅尔语谱损失和所述停止概率损失确定所述转换模型的总损失;以所述总损失最小化为目标,对所述语音转换模型进行迭代优化,获得训练后的语音转换模型。3.按照权利要求2所述的语音转换方法,其特征在于,所述输入所述训练梅尔语谱到所述语音转换模型,获得当前时间步转换梅尔语谱帧和所述当前时间步转换梅尔语谱帧对应的停止概率,还包括:输入上一时间步转换梅尔语谱帧到所述语音转换模型。4.按照权利要求2所述的语音转换方法,其特征在于,所述根据所述当前时间步转换梅尔语谱帧确定所述转换梅尔语谱损失,包括:对所述当前时间步转换梅尔语谱帧进行残差预测,获得残差值;根据所述当前时间步转换梅尔语谱帧和所述残差确定所述转换梅尔语谱损失。5.按照权利要求2所述的语音转换方法,其特征在于,所述以所述总损失最小化为目标,对所述语音转换模型进行迭代优化,获得训练后的语音转换模型,包括:通过梯度下降法更新所述语音转换模型的网络权重参数,直至所述总体损失收敛至最小。6.按照权利要求1所述的语音转换方法,其特征在于,所述语音转换模型,包括:编码器,所述编码器用于将所述源语音的梅尔语谱转换为特征向量;位置敏感的注意力模块,所述位置敏感的注意力模块用于确定所述特征向量的分布概率,根据所述特征向量的分布概率确定当前时间步的特征向量;解码器,所述解码器用于将所述当前时间步的特征向量转换为目标语音的梅尔语谱,并获取所述目标语音的梅尔语谱的停止概率。7.按照权利要求1所述的语音转换方法,其特征在于,所述将源语音的梅尔语谱输入到语音转换模型,获得所述语音转换模型输出的目标语音的梅尔语谱后,还包括:将所述目标语音的梅尔语谱通过预置的频谱恢复语音信号算法转换为目标语音。8.一种语音转换装置,其特征在于,包括:
转换模块,其用于将源语音的梅尔语谱输入到语音转换模型,获得所述语音转换模型输出的目标语音的梅尔语谱;其中,所述语音转换模型在训练时以训练梅尔语谱为输入,获得所述语音转换模型的转换梅尔语谱损失和停止概率损失,以所述转换梅尔语谱损失和所述停止概率损失最小化为目标对所述语音转换模型进行迭代训练。9.一种语音转换设备,其特征在于,其包括:处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的程序,其中所述程序被所述处理器执行时,实现如权利要求1至7中任一项所述的语音转换方法的步骤。10.一种存储介质,其特征在于,所述存储介质上存储有程序,其中所述程序被处理器执行时,实现如权利要求1至7中任一项所述的语音转换方法的步骤。

技术总结
本申请提供一种语音转换方法、装置、计算机设备及计算机可读存储介质,通过向语音转换模型中输入训练梅尔语谱,获得语音转换模型的转换梅尔语谱损失和停止概率损失;其中,所述语音转换模型在训练时以训练梅尔语谱为输入,获得所述语音转换模型的转换梅尔语谱损失和停止概率损失,以所述转换梅尔语谱损失和所述停止概率损失最小化为目标对所述语音转换模型进行迭代训练,以实现提升语音转换模型的转换性能,在使用该语音转换模型进行语音转换时能够生成音质更好的转换语音。能够生成音质更好的转换语音。能够生成音质更好的转换语音。


技术研发人员:唐存琛 曹宽 钟颖
受保护的技术使用者:武汉大学
技术研发日:2022.01.25
技术公布日:2022/4/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献