一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本的切分方法和文本的切分装置与流程

2022-06-30 02:40:35 来源:中国专利 TAG:

技术特征:
1.一种文本的切分方法,其特征在于,包括:将目标文本转化为韵律音素序列,所述韵律音素序列包括与所述目标文本对应的多个音素以及位于相邻所述音素之间的韵律标识符;基于多个所述韵律标识符在所述韵律音素序列中确定第一切分位置;基于所述第一切分位置对所述韵律音素序列进行切分,生成第一子韵律音素序列和第二子韵律音素序列,所述第一子韵律音素序列为所述韵律音素序列中位于所述第一切分位置之前的韵律音素序列,所述第二子韵律音素序列为所述韵律音素序列中位于所述第一切分位置之后的韵律音素序列,且所述第一子韵律音素序列对应的语音合成时长在目标时长内。2.根据权利要求1所述的文本的切分方法,其特征在于,所述基于多个所述韵律标识符在所述韵律音素序列中确定第一切分位置,包括:基于目标阈值范围,从所述多个韵律标识符中确定细粒度最大的所述韵律标识符;将所述细粒度最大的所述韵律标识符在所述韵律音素序列中的位置确定为所述第一切分位置。3.根据权利要求2所述的文本的切分方法,其特征在于,所述基于目标阈值范围,从所述多个韵律标识符中确定细粒度最大的所述韵律标识符,包括:获取所述韵律音素序列中目标子韵律音素序列全部音素的第一发音长度,所述目标子韵律音素序列为所述韵律音素序列中在目标位置之前的全部韵律音素序列;确定所述第一发音长度在所述目标阈值范围内,且确定所述第一发音长度对应的目标位置处的所述韵律标识符为第一次出现,将所述第一发音长度对应的目标位置确定为候选切分点位置,生成多个所述候选切分点位置;从所述多个所述候选切分点位置所对应的韵律标识符中确定细粒度最大的韵律标识符。4.根据权利要求1-3任一项所述的文本的切分方法,其特征在于,在所述生成第一子韵律音素序列和第二子韵律音素序列之后,所述方法还包括:对所述第一子韵律音素序列进行语音合成,生成第一语音;输出所述第一语音,并对所述第二子韵律音素序列进行语音合成,生成第二语音。5.根据权利要求1-3任一项所述的文本的切分方法,其特征在于,所述多个韵律标识符包括:用于表征音节、用于表征韵律词、用于表征韵律短语、用于表征语调短语和用于表征句末信息的标识符中的至少一种;且所述用于表征句末信息的标识符的细粒度大于所述用于所述语调短语的标识符的细粒度,所述用于表征语调短语的标识符的细粒度大于所述用于表征韵律短语的标识符的细粒度,所述用于表征韵律短语的标识符的细粒度大于所述用于表征韵律词的标识符的细粒度,所述用于表征韵律词的标识符的细粒度大于所述用于表征音节的标识符的细粒度。6.根据权利要求1-3任一项所述的文本的切分方法,其特征在于,在所述基于多个所述韵律标识符在所述韵律音素序列中确定第一切分位置之后,且在所述基于所述第一切分位置对所述韵律音素序列进行切分之前,所述方法包括:从所述韵律音素序列中位于所述第一切分位置之后的所述韵律标识符在所述韵律音素序列的位置中,确定第二切分位置;
所述基于所述第一切分位置对所述韵律音素序列进行切分,生成第一子韵律音素序列和第二子韵律音素序列,包括:基于所述第一切分位置和所述第二切分位置对所述韵律音素序列进行切分,生成所述第一子韵律音素序列和至少两个第二子韵律音素序列,所述至少两个第二子韵律音素序列为所述韵律音素序列中位于所述第一切分位置之后的韵律音素序列,相邻的所述第二子韵律音素序列基于所述第二切分位置确定。7.根据权利要求1-3任一项所述的文本的切分方法,其特征在于,所述将目标文本转化为韵律音素序列,包括:获取所述目标文本的音节、韵律词、韵律短语、语调短语和句末信息;将所述目标文本转化为音素序列;基于所述音节、所述韵律词、所述韵律短语、所述语调短语和所述句末信息中的至少两种,生成所述多个韵律标识符;基于所述多个韵律标识符标记所述音素序列,生成所述韵律音素序列。8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述文本的切分方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述文本的切分方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文本的切分方法。

技术总结
本申请涉及语音合成领域,提供一种文本的切分方法和文本的切分装置,所述文本的切分方法,包括:将目标文本转化为韵律音素序列,所述韵律音素序列包括与所述目标文本对应的多个音素以及位于相邻所述音素之间的韵律标识符;基于多个所述韵律标识符在所述韵律音素序列中确定第一切分位置;基于所述第一切分位置对所述韵律音素序列进行切分,生成第一子韵律音素序列和第二子韵律音素序列,且所述第一子韵律音素序列对应的语音合成时长在目标时长内。本申请的文本的切分方法,能够缩短合成系统的首句响应时间。首句响应时间。首句响应时间。


技术研发人员:高羽 涂建华
受保护的技术使用者:美的集团股份有限公司
技术研发日:2022.03.31
技术公布日:2022/6/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献