语音合成处理方法、装置和介质与流程

2021-11-20 03:47:00 来源：中国专利 TAG：

技术特征：
1.一种语音合成处理方法，其特征在于，所述方法包括：检测用户操作；在所述用户操作为语音合成编辑操作或时长获取操作的情况下，确定并展示音频时长信息；其中，所述音频时长信息为对文本信息进行时长预测得到。2.根据权利要求1所述的方法，其特征在于，所述语音合成编辑操作包括：文本信息对应的编辑操作；和/或语速参数对应的编辑操作；和/或语音合成效果参数对应的编辑操作。3.根据权利要求1所述的方法，其特征在于，所述确定并展示音频时长信息，包括：响应于文本信息的输入操作或修改操作，实时确定对应的音频时长信息并显示。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据音频时长信息与用户的设定时长，输出提示信息；所述提示信息包括如下信息中的至少一种：音频时长信息与用户的设定时长的差值信息；或者音频时长信息与用户的设定时长的差值信息对应的增删字符数量信息。5.根据权利要求1所述的方法，其特征在于，所述确定并展示音频时长信息，包括：在所述用户操作为语音合成编辑操作或时长获取操作的情况下，发送获取请求；所述获取请求用于获取音频时长信息。6.根据权利要求1至5中任一所述的方法，其特征在于，所述音频时长信息为根据语速参数和/或语音合成效果参数，对文本信息进行时长预测得到。7.一种语音合成处理方法，其特征在于，所述方法包括：在检测到语音合成编辑操作或时长获取操作的情况下，对文本信息进行时长预测，以得到音频时长信息；输出所述音频时长信息。8.根据权利要求7所述的方法，其特征在于，所述对文本信息进行时长预测，包括：在检测到语音合成编辑操作或时长获取操作的情况下，预测文本信息中字符分别对应的时长信息；对所述时长信息进行融合，以得到音频时长信息。9.根据权利要求7所述的方法，其特征在于，所述对文本信息进行时长预测，包括：在检测到语音合成编辑操作或时长获取操作的情况下，确定文本信息中字符分别对应的时长信息；根据所述字符对应的语速参数和/或语音合成效果参数，对所述时长信息进行调整；对调整后的时长信息进行融合，以得到音频时长信息。10.一种语音合成处理装置，其特征在于，包括：检测模块，用于检测用户操作；以及处理模块，用于在所述用户操作为语音合成编辑操作或时长获取操作的情况下，确定并展示音频时长信息；其中，所述音频时长信息为对文本信息进行时长预测得到。11.一种语音合成处理装置，其特征在于，包括：时长预测模块，用于在检测到语音合成编辑操作或时长获取操作的情况下，对文本信
息进行时长预测，以得到音频时长信息；以及输出模块，用于输出所述音频时长信息。12.一种用于语音合成处理的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，所述程序被一个或者一个以上处理器执行时，实现权利要求1至6中任一所述方法的步骤。13.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求1至6中一个或多个所述的语音合成处理方法。14.一种用于语音合成处理的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，所述程序被一个或者一个以上处理器执行时，实现权利要求7至9中任一所述方法的步骤。15.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求7至9中一个或多个所述的语音合成处理方法。

技术总结
本发明实施例提供了一种语音合成处理方法、装置和介质。其中的方法具体包括：检测用户操作；在所述用户操作为语音合成编辑操作或时长获取操作的情况下，确定并展示音频时长信息；其中，所述音频时长信息为对文本信息进行时长预测得到。本发明实施例可以提高音频时长的获取效率，以及能够提高语音合成编辑的效率。率。率。

技术研发人员：姜伟王宁刘恺程龙郎勇张爽
受保护的技术使用者：北京搜狗科技发展有限公司
技术研发日：2021.05.14
技术公布日：2021/11/19

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于确定音频输出设备类型的系统和方法与流程

语音合成处理方法、装置和介质与流程

相关文献

最热文献