语音生成方法、装置及存储介质与流程

2022-04-30 11:15:55 来源：中国专利 TAG：

技术特征：
1.一种语音生成方法，其特征在于，所述方法包括：对待处理文本进行文本分析处理，得到所述待处理文本中各个文本单元的文本信息；根据所述文本信息和所述待处理文本所包含的标点符号的符号信息，确定各个所述文本单元的目标韵律信息；根据所述文本信息和所述目标韵律信息，生成目标语音。2.根据权利要求1所述的方法，其特征在于，所述文本信息包括：文本音素和文本音调；所述根据所述文本信息和所述待处理文本所包含的标点符号的符号信息，确定各个所述文本单元的目标韵律信息，包括：根据各个所述文本单元的所述文本音素和所述文本音调，确定各个所述文本单元文本韵律信息；根据所述符号信息，确定各个所述文本单元的符号韵律信息；根据所述文本韵律信息和所述符号韵律信息，确定所述目标韵律信息。3.根据权利要求2所述的方法，其特征在于，所述符号信息包括：符号位置；所述根据所述符号信息，确定各个所述文本单元的符号韵律信息，包括：根据所述标点符号的符号位置，确定各个所述标点符号所作用的文本单元；其中，一个标点符号作用于至少一个文本单元；确定所述标点符号所作用的文本单元的符号韵律信息。4.根据权利要求2所述的方法，其特征在于，所述符号信息包括：符号类型和符号数量；所述根据所述符号信息，确定各个所述文本单元的符号韵律信息，包括：根据所述标点符号的符号类型，确定语气类型；根据所述标点符号的符号数量，确定语气程度；根据所述语气类型和/或所述语气程度，确定所述符号韵律信息。5.根据权利要求1所述的方法，其特征在于，所述根据所述文本信息和所述目标韵律信息，生成目标语音，包括：将所述文本信息和所述目标韵律信息与预设语音库中的预设文本信息和预设韵律信息进行匹配；其中，所述预设语音库用于存储音频片段，以及所述预设文本信息和所述预设韵律信息与所述音频片段之间的映射关系；利用与匹配结果对应的语音生成策略，根据所述文本信息和所述目标韵律信息，生成所述目标语音；其中，不同的匹配结果对应不同的语音生成策略。6.根据权利要求5所述的方法，其特征在于，所述利用与匹配结果对应的语音生成策略，根据所述文本信息和所述目标韵律信息，生成所述目标语音，包括：在所述匹配结果表征所述预设语音库中存在所述文本信息和所述目标韵律信息的情况下，从所述预设语音库确定与所述文本信息和所述目标韵律信息对应的音频片段；对各个所述音频片段进行拼接处理，生成所述目标语音。7.根据权利要求5所述的方法，其特征在于，所述利用与匹配结果对应的语音生成策略，根据所述文本信息和所述目标韵律信息，生成所述目标语音，包括：在所述匹配结果表征所述预设语音库中不存在所述文本信息和所述目标韵律信息的情况下，对各个所述文本单元的所述文本信息和所述目标韵律信息进行特征转换处理，得到声学特征；
对各个所述声学特征进行解码处理，生成所述目标语音。8.一种语音生成装置，其特征在于，包括：分析模块，配置为对待处理文本进行文本分析处理，得到所述待处理文本中各个文本单元的文本信息；确定模块，配置为根据所述文本信息和所述待处理文本所包含的标点符号的符号信息，确定各个所述文本单元的目标韵律信息；生成模块，配置为根据所述文本信息和所述目标韵律信息，生成目标语音。9.一种语音生成装置，其特征在于，包括：处理器；配置为存储处理器可执行指令的存储器；其中，所述处理器配置为：执行时实现上述权利要求1至7中任一种语音生成方法中的步骤。10.一种非临时性计算机可读存储介质，当所述存储介质中的指令由语音生成装置的处理器执行时，使得所述装置能够执行上述权利要求1至7中任一种语音生成方法中的步骤。

技术总结
本申请是关于一种语音生成方法、装置及存储介质。该方法包括：对待处理文本进行文本分析处理，得到所述待处理文本中各个文本单元的文本信息；根据所述文本信息和所述待处理文本所包含的标点符号的符号信息，确定各个所述文本单元的目标韵律信息；根据所述文本信息和所述目标韵律信息，生成目标语音。本申请通过将标点符号的符号信息和文本信息相结合，第一方面，能够使得待处理文本中的标点符号对生成的目标语音产生作用，进而使得生成的目标语音更符合书写文字时的情感场景等；第二方面，通过引入标点符号的符号信息，可以使得目标语音更加符合文本所在语境的需要，更自然真实且接近自然语言表达方式。自然语言表达方式。自然语言表达方式。

技术研发人员：杨扬邹一新
受保护的技术使用者：斑马网络技术有限公司
技术研发日：2021.12.08
技术公布日：2022/4/29

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

语音生成方法、装置及存储介质与流程

相关文献

最热文献