一种文本生成方法、装置、计算机设备及存储介质

2022-07-31 04:53:24 来源：中国专利 TAG：

技术特征：
1.一种文本生成方法，其特征在于，包括：将获取的原始文本输入训练后的文本编码模型，获得文本特征信息；基于所述文本特征信息，结合训练后的文本解码模型，生成所述原始文本对应的目标文本；其中，所述文本解码模型中包括文本预测图层，所述文本预测图层中所包括设定数量结点的结点信息通过对所述文本特征信息确定，且所述目标文本中包含的目标词以及各目标词的组合顺序，通过各所述结点的结点信息及结点间拓扑结构确定。2.根据权利要求1所述的方法，其特征在于，所述文本解码模型包括：位置信息输入层、基础解码子模型及文本预测图层；所述位置信息输入层中包括设定数量个结点位置参数，所述设定数量用于决定所述文本预测图层中所包含结点的结点数量；所述文本预测图层中所包括设定数量结点的结点信息通过各所述结点位置参数与所述文本特征信息，结合所述基础解码子模型确定。3.根据权利要求2所述的方法，其特征在于，所述基于所述文本特征信息，结合训练后的文本解码模型，生成所述原始文本对应的目标文本，包括：将所述文本特征信息及所述位置信息输入层中各所述结点位置参数，输入所述基础解码子模型；获得所述基础解码子模型输出的所述设定数量的初始文本预测向量，将各所述初始文本预测向量分别作为所述文本预测图层中各结点的结点信息；基于各所述结点构建有向无环图，确定结点间拓扑结构，并结合各结点信息确定所述原始文本的目标文本。4.根据权利要求3所述的方法，其特征在于，所述基于各所述结点构建有向无环图，确定结点间拓扑结构，并结合各结点信息确定所述原始文本的目标文本，包括：根据所述文本预测图层中各结点的结点标号，构建有向无环图，获得结点间拓扑结构；根据结点间拓扑结构及各所述结点的结点信息，确定所述文本预测图层对应的结点转移矩阵；根据各所述结点的结点信息，及所述结点转移矩阵，确定所述原始文本的目标文本。5.根据权利要求4所述的方法，其特征在于，所述根据结点间拓扑结构及各所述结点的结点信息，确定所述文本预测图层对应的结点转移矩阵，包括：针对每个结点，从结点间拓扑结构中确定所述结点有向连接的邻接结点；根据所述结点及各所述邻接结点的结点信息，确定所述结点到各邻接结点的转移概率；基于各所述转移概率形成所述文本预测图层对应的结点转移矩阵。6.根据权利要求4所述的方法，其特征在于，所述根据各所述结点的结点信息，及所述结点转移矩阵，确定所述原始文本的目标文本，包括：根据各所述结点的结点信息，通过所述文本预测图层中全连接层，确定各所述结点到预设词表中各词的匹配概率；根据所述结点转移矩阵及各结点到各词的匹配概率，确定预测结点及相应的目标词；基于各所述目标词，组合形成所述原始文本的目标文本。
7.根据权利要求6所述的方法，其特征在于，所述根据所述结点转移矩阵及各结点到各词的匹配概率，确定预测结点及相应的目标词，包括：根据所述结点转移矩阵中各结点对应的最大转移概率，确定至少一个预测结点；针对每个预测结点，从所述预测结点到各词的匹配概率中确定最大匹配概率，并将该最大匹配概率对应的词确定目标词。8.根据权利要求6所述的方法，其特征在于，所述根据所述结点转移矩阵及各结点到各词的匹配概率，确定预测结点及相应的目标词，包括：将起始结点标号对应的结点作为当前结点；从所述结点转移矩阵中获取所述当前结点到各邻接结点的当前转移概率；确定各所述当前转移概率分别与所述当前结点与各词所对应匹配概率的乘积值；从各所述乘积值中选定最大乘积值，并将所述最大乘积值关联的邻接结点及词分别作为预测结点和目标词，并将所述预测结点及目标词关联添加至缓存表；将所述预测结点作为新的当前结点，重新执行所述当前结点所对应当前邻接点的选定操作，直至达到循环结束条件。9.根据权利要求6所述的方法，其特征在于，所述根据所述结点转移矩阵及各结点到各词的匹配概率，确定预测结点及相应的目标词，包括：基于各结点到各词的匹配概率，确定相应的最大匹配概率，将各所述最大匹配概率对应的词，确定为相应结点的预测词；根据预先设定路径搜索算法，结合所述结点转移矩阵及各所述结点的预测词，确定权重最高的预测路径；将所述预测路径中各预测结点对应的预测词确定为相应的目标词。10.根据权利要求1-9任一项所述的方法，其特征在于，还包括：基于设定的损失函数生成策略，对所构建的文本解码模型进行学习参数训练，获得训练后的文本解码模型；其中，所述学习参数包括：所述文本解码模型所包括位置信息输入层中涉及的结点位置参数、所包括基础解码子模型中涉及的基础模型参数、以及所包括文本预测图层中所具备各结点涉及的结点相关参数。11.根据权利要求10所述的方法，其特征在于，所述基于设定的损失函数生成策略，对所构建的文本解码模型进行学习参数训练，获得训练后的文本解码模型，包括：获得至少一组样本数据，所述一组样本数据中包括一个原始样本文本及对应的单个目标样本文本；在当前迭代下，将一组样本数据中的原始样本文本使用文本编码模型编码后，输入至当前文本解码模型；基于所述当前文本解码模型，确定将所述原始样本文本通过各文本预测路径生成所述目标样本文本时所对应的概率值，其中，各文本预测路径基于所述文本预测图层中的结点结合设定算法形成；基于各所述概率值结合损失函数生成公式，确定当前损失函数值，并基于所述当前损失函数值通过反向传播调整所述当前文本解码模型中的学习参数，得到用于下一迭代的文本解码模型；
将下一迭代作为新的当前迭代，继续进行学习参数训练，直至满足迭代结束条件，获得训练后的文本解码模型。12.根据权利要求11所述的方法，所述损失函数生成公式表述为：对各所述概率值之和求对数，并将对数运算结果取负。13.一种文本生成装置，其特征在于，包括：编码执行模块，用于将获取的原始文本输入训练后的文本编码模型，获得文本特征信息；解码执行模块，用于基于所述文本特征信息，结合训练后的文本解码模型，生成所述原始文本对应的目标文本；其中，所述文本解码模型中包括文本预测图层，所述文本预测图层中所包括设定数量结点的结点信息通过对所述文本特征信息确定，且所述目标文本中包含的目标词以及各目标词的组合顺序，通过各所述结点的结点信息及结点间拓扑结构确定。14.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-12中任一所述的文本生成方法。15.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-12中任一所述的文本生成方法。

技术总结
本公开实施例公开了一种文本生成方法、装置、计算机设备及存储介质，方法包括：将获取的原始文本输入训练后的文本编码模型，获得文本特征信息；基于文本特征信息，结合训练后的文本解码模型，生成原始文本对应的目标文本；文本解码模型中包括文本预测图层，文本预测图层中所包括设定数量结点的结点信息通过对文本特征信息确定，且目标文本中包含的目标词以及各目标词的组合顺序，通过各所述结点的结点信息及结点间拓扑结构确定。利用该方法，实现了结点的结点信息并行确定以及所生成文本内各词的并行确定，降低了文本生成延迟，同时更好规避了所生成文本中连续重复词的出现，保证了所生成本文中上下文关联性，提高了所生成文本的生成质量。的生成质量。的生成质量。

技术研发人员：黄斐周浩黄民烈李航
受保护的技术使用者：清华大学
技术研发日：2022.03.31
技术公布日：2022/7/29

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于相空间和光流图像的多变量时间序列的分类方法与流程

一种文本生成方法、装置、计算机设备及存储介质

相关文献

最热文献