一种文本数据处理方法、装置、设备及介质与流程

2023-01-15 08:36:55 来源：中国专利 TAG：

技术特征：
1.一种文本数据处理方法，其特征在于，所述方法包括：获取至少一个合成引擎，将所述至少一个合成引擎加载至合成管理器中，并通过合成管理对所述至少一个合成引擎进行初始化；创建合成会话，所述合成会话中携带有语音合成类型；启动所述合成会话，所述合成会话携带有合成文本和发音人虚拟id；根据所述发明人虚拟id获取语音合成配置信息，所述合成配置信息包括发音人信息、合成引擎信息；将所述合成配置信息发送至合成管理器中；根据所述合成引擎信息和语音合成类型从至少一个合成引擎中调用目标合成引擎；启动所述目标合成引擎，利用所述目标合成引擎对所述合成文本进行语音合成，得到目标语音数据，其中，所述目标语音数据的类型通过语音合成类型得到。2.根据权利要求1所述的文本数据处理方法，其特征在于，所述方法还包括：播放所述目标语音数据，在播放所述目标语音数据前，所述方法还包括：判断当前时刻是否存在语音播放任务，其中，所述语音播放任务用于播放语音数据；若当前时刻存在语音播放任务，则停止执行语音合成。3.根据权利要求2所述的文本数据处理方法，其特征在于，将所述目标语音数据定义为第一语音数据，将正在播放的语音数据定义为第二语音数据，所述方法还包括：判断所述第一语音数据的优先级与所述第二语音数据的优先级；若第一语音数据的优先级与第二语音数据的优先级相同或第一语音数据的优先级小于第二语音数据的优先级，则在第二语音数据播放完后播放所述第一语音数据；若第一语音数据的优先级大于第二语音数据的优先级，则暂停播放所述第二语音数据，对第一语音数据进行播放。4.根据权利要求2所述的文本数据处理方法，其特征在于，在播放所述目标语音数据前，所述方法还包括：audiotrack管理器通过缓存查询是否已有与目标语音数据的类型对应的audiotrack，若存在，则调用所述audiotrack，并将所述目标语音数据写入到audiotrack中进行播放，若不存则创建与目标语音数据的类型对应的audiotrack并缓存入audiotrack管理器中。5.根据权利要求1所述的文本数据处理方法，其特征在于，所述根据所述合成引擎信息和语音合成类型从至少一个合成引擎中调用目标合成引擎的步骤包括：根据所述合成引擎信息的工作模式从所述至少一个合成引擎中筛选出候选合成引擎集合；根据所述语音合成类型从所述候选合成引擎集合中筛选出目标合成引擎以供所述合成管理器调用。6.一种文本数据处理装置，其特征在于，所述装置包括：初始化模块，用于获取至少一个合成引擎，将所述至少一个合成引擎加载至合成管理器中，并通过合成管理对所述至少一个合成引擎进行初始化；会话创建模块，用于创建合成会话，所述合成会话中携带有语音合成类型；会话启动模块，用于启动所述合成会话，所述合成会话携带有合成文本和发音人虚拟id；
配置信息获取模块，用于根据所述发明人虚拟id获取语音合成配置信息，所述合成配置信息包括发音人信息、合成引擎信息；发送模块，用于将所述合成文本发送至所述合成管理器中；调用模块，用于根据所述合成引擎信息和语音合成类型从至少一个合成引擎中调用目标合成引擎；合成模块，用于启动所述目标合成引擎，利用所述目标合成引擎对所述合成文本进行语音合成，得到目标语音数据，其中，所述目标语音数据的类型通过语音合成类型得到。7.一种文本数据处理装置，其特征在于，所述装置包括：合成管理器、合成客户端；所述合成管理器预先加载有至少一个合成引擎；所述合成客户端用于会话创建模块，用于创建合成会话，所述合成会话中携带有语音合成类型；所述合成客户端启动所述合成会话，所述合成会话携带有合成文本和发音人虚拟id；根据所述发明人虚拟id获取语音合成配置信息，所述合成配置信息包括发音人信息、合成引擎信息；将所述合成配置信息发送至合成管理器中；设置语音合成配置信息，所述合成配置信息至少包括合成引擎的工作模式；所述合成管理器根据所述合成引擎信息和语音合成类型从至少一个合成引擎中调用目标合成引擎；以及所述合成管理器启动所述目标合成引擎，利用所述目标合成引擎对所述合成文本进行语音合成，得到目标语音数据，其中，所述目标语音数据的类型通过语音合成类型得到。8.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求1至5中任一项所述的文本数据处理方法的步骤。9.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行权利要求1至5中任一项所述的文本数据处理方法的步骤。

技术总结
本发明公开了一种文本数据处理方法，包括：将合成引擎加载至合成管理器中；创建合成会话，合成会话中携带有语音合成类型；启动合成会话，合成会话携带有合成文本和发音人虚拟ID；根据所述发明人虚拟ID获取语音合成配置信息，合成配置信息包括发音人信息、合成引擎信息；将合成配置信息发送至合成管理器中；根据合成引擎信息和语音合成类型从至少一个合成引擎中调用目标合成引擎；启动目标合成引擎，利用目标合成引擎对合成文本进行语音合成，得到目标语音数据。本发明可解决各家语音供应商的合成能力无法兼容问题，可扩大车厂对各供应商合成能力的选择范围，提高了语音合成效果，提升了用户的体验。提升了用户的体验。提升了用户的体验。

技术研发人员：权利要求书2页说明书9页附图3页
受保护的技术使用者：重庆长安汽车股份有限公司
技术研发日：2022.09.30
技术公布日：2023/1/13

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：预测模型的训练、口型动画生成方法、装置、设备及介质与流程

一种文本数据处理方法、装置、设备及介质与流程

相关文献

最热文献