语音特征预测方法、装置、设备及可读存储介质与流程

2021-07-16 19:47:00 来源：中国专利 TAG：语音地说装置可读特征

技术特征：
1.一种语音特征预测方法，其特征在于，包括：提取文本数据的文本特征，得到文本特征序列；通过预先训练好的语音特征预测模型对所述文本特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列；根据所述文本特征序列，以及所述文本数据在各个韵律层级的隐变量序列，确定所述文本数据对应的语音特征序列。2.根据权利要求1所述的方法，其特征在于，通过预先训练好的语音特征预测模型得到所述文本数据在每一个韵律层级的隐变量序列，根据所述文本特征序列，以及所述文本数据在各个韵律层级的隐变量序列，确定所述文本数据对应的语音特征序列的过程，包括：通过所述语音特征预测模型的编码模块对所述文本特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列；通过所述语音特征预测模型的解码模块根据所述文本特征序列，以及所述文本数据在各个韵律层级的隐变量序列，确定所述文本数据对应的语音特征序列。3.根据权利要求2所述的方法，其特征在于，所述通过所述语音特征预测模型的解码模块根据所述文本特征序列，以及所述文本数据在各个韵律层级的隐变量序列，确定所述文本数据对应的语音特征序列，包括：对于每一个隐变量序列，通过所述语音特征预测模型的隐层特征获取模块，以预置处理方式对该隐变量序列中的各个隐变量分别进行处理，得到该隐变量序列对应的隐层特征序列；通过所述语音特征预测模型的预测模块，根据所述文本特征序列，以及各个隐变量序列对应的隐层特征序列，确定所述文本数据对应的语音特征序列。4.根据权利要求3所述的方法，其特征在于，所述通过所述语音特征预测模型的编码模块，对所述文本特征序列进行至少一个韵律层级的编码，包括：若所述语音特征序列为声学特征序列，或者，波形点特征序列，则通过所述编码模块，基于所述文本特征序列中的各个文本特征对应的语音时长对所述文本特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列；若所述语音特征序列为语音时长序列，则通过所述编码模块，直接对所述文本特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列。5.根据权利要求4所述的方法，其特征在于，所述通过所述语音特征预测模型的编码模块，基于所述文本特征序列中的各个文本特征对应的语音时长对所述文本特征序列进行至少一个韵律层级的编码，包括：通过所述语音特征预测模型的编码模块，对于所述文本特征序列中的每一个文本特征，将该文本特征对应的语音时长与该文本特征进行拼接，得到该文本特征对应的拼接特征；对由各个拼接特征构成的拼接特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列。6.根据权利要求3所述的方法，其特征在于，所述通过所述语音特征预测模型的预测模块，根据所述文本特征序列，以及各个隐变量序列对应的隐层特征序列，确定所述文本数据对应的语音特征序列，包括：
通过所述语音特征预测模型的预测模块，对应所述文本特征序列中的每一个文本特征，将该文本特征，以及各个韵律层级上的隐变量序列中基于该文本特征生成的隐变量对应的隐层特征进行拼接，得到该文本特征对应的隐层特征；对所述文本特征序列中的各个文本特征对应的隐层特征进行解码，得到所述文本数据的语音特征。7.根据权利要求3所述的方法，其特征在于，所述对于每一个隐变量序列，通过所述语音特征预测模型的隐层特征获取模块，以预置处理方式对该隐变量序列中的各个隐变量分别进行处理，包括：通过所述隐层特征获取模块，对该隐变量序列中的各个隐变量以相同的预置方式进行处理；或者，通过所述隐层特征获取模块，对该隐变量序列中的至少部分隐变量以不同的预置方式进行处理。8.根据权利要求7所述的方法，其特征在于，所述通过所述隐层特征获取模块，对该隐变量序列中的各个隐变量以相同的预置方式进行处理，包括：通过所述隐层特征获取模块，对该隐变量序列中的各个隐变量分别进行随机采样，得到该隐变量序列对应的隐层特征序列；或者，通过所述隐层特征获取模块，确定该隐变量序列中的每一个隐变量的均值，利用该隐变量序列中的每一个隐变量对应的可调系数，对该隐变量的均值进行调节，得到该隐变量序列中的各个隐变量对应的隐层特征。9.根据权利要求7所述的方法，其特征在于，所述通过所述隐层特征获取模块，对该隐变量序列中的至少部分隐变量以不同的预置方式进行处理，包括：通过所述隐层特征获取模块，对于每一个隐变量序列，对该隐变量序列中的部分隐变量分别进行随机采样，得到该部分隐变量中的各个隐变量对应的隐层特征；确定该隐变量序列中的另一部分隐变量中的各个隐变量的均值，利用所述另一部分隐变量中的每一个隐变量对应的可调系数，对该隐变量的均值进行调节，得到所述另一部分隐变量中的中的各个隐变量对应的隐层特征。10.一种语音特征预测装置，其特征在于，包括：文本特征提取模块，用于提取文本数据的文本特征，得到文本特征序列；编码控制模块，用于通过预先训练好的语音特征预测模型对所述文本特征序列进行至少一个韵律层级的编码，得到所述文本数据在每一个韵律层级的隐变量序列；解码控制模块，用于通过所述语音特征预测模型根据所述文本特征序列，以及所述文本数据在每一个韵律层级的隐变量序列，确定所述文本数据对应的语音特征序列。11.一种语音特征预测设备，其特征在于，包括存储器和处理器；所述存储器，用于存储程序；所述处理器，用于执行所述程序，实现如权利要求1-9中任一项所述的语音特征预测方法的各个步骤。12.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理
器执行时，实现如权利要求1-9中任一项所述的语音特征预测方法的各个步骤。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

语音特征预测方法、装置、设备及可读存储介质与流程

相关文章

最热文献