一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音合成方法、装置、电子设备和存储介质与流程

2022-04-02 03:48:58 来源:中国专利 TAG:

技术特征:
1.一种语音合成方法,其特征在于,包括:确定待合成的篇章文本的篇章音素序列;对所述篇章音素序列进行编码,得到所述篇章文本的语音学特征;基于所述语音学特征进行语音合成,得到所述篇章文本的合成语音。2.根据权利要求1所述的语音合成方法,其特征在于,所述基于所述语音学特征进行语音合成,得到所述篇章文本的合成语音,包括:基于所述语音学特征,以及所述篇章文本中各分句的语感特征,进行语音合成,得到所述篇章文本的合成语音。3.根据权利要求2所述的语音合成方法,其特征在于,所述篇章文本中各分句的语感特征基于如下步骤确定:基于样本篇章文本中各分句的样本语感特征,对所述篇章文本中各分句进行语感提取,得到所述篇章文本中各分句的语感特征;所述样本语感特征是对所述样本篇章文本对应的真实语音进行语感特征提取得到的。4.根据权利要求3所述的语音合成方法,其特征在于,所述基于样本篇章文本中各分句的样本语感特征,对所述篇章文本中各分句进行语感提取,得到所述篇章文本中各分句的语感特征,包括:对所述篇章文本中各分句进行语义提取,得到所述篇章文本中各分句的语义特征;基于语义语感转换关系,对所述篇章文本中各分句的语义特征进行语感转换,得到所述篇章文本中各分句的语感特征;所述语义语感转换关系是基于样本篇章文本中各分句的样本语义特征和样本语感特征确定的。5.根据权利要求3所述的语音合成方法,其特征在于,所述样本语感特征基于如下步骤确定:对所述样本篇章文本对应的真实语音的声学特征进行编码,得到所述真实语音的语音特征;基于语音语感转换关系,对所述语音特征进行语感转换,得到所述样本篇章文本中各分句的样本语感特征;所述语音语感转换关系是基于所述语音特征中各分句的句级特征,以所述语音特征中各分句的局部特征为正例点、以所述语音特征中其他分句的局部特征为反例点对比学习得到。6.根据权利要求2所述的语音合成方法,其特征在于,所述基于所述语音学特征,以及所述篇章文本中各分句的语感特征,进行语音合成,得到所述篇章文本的合成语音,包括:对所述语音学特征以及所述篇章文本中各分句的语感特征,以分句为单位进行融合,得到所述篇章文本中各分句的融合特征;基于所述篇章文本中各分句的融合特征,进行语音合成,得到所述篇章文本的合成语音。7.根据权利要求1至6中任一项所述的语音合成方法,其特征在于,所述对所述篇章音素序列进行编码,得到所述篇章文本的语音学特征,包括:对所述篇章音素序列进行编码,得到所述篇章文本的音素级矢量;
基于所述音素级矢量,预测所述篇章音素序列中每个音素的时长;基于所述篇章音素序列中每个音素的时长,对所述音素级矢量进行上采样,得到所述语音学特征。8.一种语音合成装置,其特征在于,包括:音素确定单元,用于确定待合成的篇章文本的篇章音素序列;篇章编码单元,用于对所述篇章音素序列进行编码,得到所述篇章文本的语音学特征;语音合成单元,用于基于所述语音学特征进行语音合成,得到所述篇章文本的合成语音。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音合成方法的步骤。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音合成方法的步骤。

技术总结
本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:确定待合成的篇章文本的篇章音素序列;对所述篇章音素序列进行编码,得到所述篇章文本的语音学特征;基于所述语音学特征进行语音合成,得到所述篇章文本的合成语音。本发明提供的方法、装置、电子设备和存储介质,通过对篇章文本的篇章音素序列进行编码,从而得到针对篇章文本整体建模的语音学特征,据此进行语音合成,能够保证合成语音在韵律、情感等语感层面的连贯性,提高合成语音的自然度。成语音的自然度。成语音的自然度。


技术研发人员:刘丹 伍芸荻
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2021.12.30
技术公布日:2022/4/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献