文本实体生成方法、模型训练方法及装置与流程

2021-10-29 20:53:00 来源：中国专利 TAG：文本方法实体装置生成

技术特征：
1.一种文本实体生成方法，其特征在于，包括：获取对话文本；提取所述对话文本中的目标文本实体向量；根据所述目标文本实体向量确定超图中对应的目标实体节点的向量表达，得到目标节点向量，其中，所述超图包括多条超边，每条所述超边包括至少三个实体节点；将所述目标节点向量输入至超图神经网络模型，通过所述超图神经网络模型对所述目标节点向量进行处理，生成预测文本实体。2.根据权利要求1所述的文本实体生成方法，其特征在于，所述超图通过以下步骤获得：获取多个实体节点；连接至少三个所述实体节点以形成超边；根据多个所述超边构建所述超图。3.根据权利要求2所述的文本实体生成方法，其特征在于，所述连接至少三个所述实体节点以形成超边，包括：获取对话数据集，根据所述对话数据集中当前轮次询问方涉及的第一文本实体以及上一轮次询问方与回答方涉及的第二文本实体得到实体集合，根据所述实体集合连接所述超图中对应的至少三个所述实体节点以形成超边，其中，所述第一文本实体与所述第二文本实体相互关联；或者，获取对话数据集，根据所述对话数据集中同一句话中涉及的所有相互关联的文本实体得到实体集合，根据所述实体集合连接所述超图中对应的至少三个所述实体节点以形成超边；或者，获取对话数据集，根据所述对话数据集中同一个完整对话涉及的所有相互关联的文本实体，得到实体集合，根据所述实体集合连接所述超图中对应的至少三个所述实体节点以形成超边。4.根据权利要求3所述的文本实体生成方法，其特征在于，所述根据所述实体集合连接所述超图中对应的至少三个所述实体节点以形成超边，包括：确定所述实体集合在所述对话数据集中的出现次数；当所述出现次数大于或者等于设定阈值，连接所述超图中与所述实体集合对应的至少三个所述实体节点以形成超边。5.根据权利要求1所述的文本实体生成方法，其特征在于，所述提取所述对话文本中的目标文本实体向量，包括：对所述对话文本中的每一个句子进行编码处理，得到所述每一个句子所对应的句子向量；根据所述句子向量得到所述对话文本中目标文本实体的词向量；对所述词向量进行最大池化处理，得到所述目标文本实体所对应的目标文本实体向量。6.根据权利要求1所述的文本实体生成方法，其特征在于，所述通过所述超图神经网络模型对所述目标节点向量进行处理，生成预测文本实体，包括：根据所述超图得到用于表示所述超图的第一矩阵；
对所述第一矩阵进行归一化处理，得到第二矩阵；对所述第一矩阵进行矩阵变换处理，并对矩阵变换处理后的第一矩阵进行归一化处理，得到第三矩阵；根据所述第二矩阵和所述第三矩阵的乘积更新所述目标节点向量；根据更新后的目标节点向量得到实体节点的概率分布，根据所述实体节点的概率分布确定预测实体节点，根据所述预测实体节点得到对应的预测文本实体。7.根据权利要求6所述的文本实体生成方法，其特征在于，所述根据所述第二矩阵和所述第三矩阵的乘积更新所述目标节点向量，包括：确定所述多条超边的权重；根据所述第二矩阵和所述第三矩阵的乘积以及所述多条超边的权重更新所述目标节点向量。8.根据权利要求6所述的文本实体生成方法，其特征在于：所述目标节点向量的更新方式为加权处理或者池化处理。9.根据权利要求1至8任意一项所述的文本实体生成方法，其特征在于，所述方法还包括：根据所述预测文本实体生成询问文本。10.根据权利要求9所述的文本实体生成方法，其特征在于，所述根据所述预测文本实体生成询问文本，包括：根据所述对话文本得到待生成词语的概率分布；根据所述待生成词语的概率分布确定目标词语；根据所述目标词语以及所述预测文本实体生成询问文本。11.根据权利要求1至8任意一项所述的文本实体生成方法，其特征在于，所述方法还包括：对所述预测文本实体进行排列；展示经过排列后的所述预测文本实体以生成选择列表。12.一种模型训练方法，其特征在于，包括：获取训练对话文本和已标注对话文本；提取所述训练对话文本中的相互关联的目标文本实体向量；提取所述已标注对话文本中的标注文本实体；根据所述目标文本实体向量确定超图中对应的目标实体节点的向量表达，得到目标节点向量，其中，所述超图包括多条超边，每条所述超边包括至少三个实体节点；将所述目标节点向量输入至超图神经网络模型，通过所述超图神经网络模型对所述目标节点向量进行处理，生成预测文本实体；根据所述预测文本实体和所述标注文本实体，对所述超图神经网络模型中的参数进行修正。13.根据权利要求12所述的模型训练方法，其特征在于，所述对所述超图神经网络模型中的参数进行修正，包括：对所述目标节点向量的向量维度进行修正；或者，对所述超边的权重进行修正。
14.一种文本实体生成装置，其特征在于，包括：文本获取模块，用于获取对话文本；向量提取模块，用于提取所述对话文本中的目标文本实体向量；初始化模块，用于根据所述目标文本实体向量确定超图中对应的目标实体节点的向量表达，得到目标节点向量，其中，所述超图包括多条超边，每条所述超边包括至少三个所述实体节点；实体生成模块，用于通过超图神经网络模型对所述目标节点向量进行处理，生成预测文本实体。15.一种电子设备，其特征在于，包括存储器、处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至11中任意一项所述的文本实体生成方法或者如权利要求12至13中任意一项所述的模型训练方法。

技术总结
本发明实施例公开了一种文本实体生成方法、模型训练方法及装置，文本实体生成方法包括获取对话文本，提取所述对话文本中的目标文本实体向量，根据所述目标文本实体向量确定超图中对应的目标实体节点的向量表达，得到目标节点向量，其中，所述超图包括多条超边，每条超边包括至少三个实体节点，将所述目标节点向量输入至超图神经网络模型，通过所述超图神经网络模型对所述目标节点向量进行处理，生成预测文本实体，上述文本实体生成方法在生成预测文本实体时能够考虑超图的实体节点之间的关系，从而提高文本实体生成的准确率，并且由于每条超边包括至少三个实体节点，可以引入多个实体节点之间的多元关系，有利于进一步提高文本实体生成的准确率。体生成的准确率。体生成的准确率。

技术研发人员：刘文阁梁小丹刘亚飞赵瑞辉陈曦郑冶枫
受保护的技术使用者：中山大学
技术研发日：2021.02.09
技术公布日：2021/10/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：使用复合手部图像的生物特征识别的制作方法

文本实体生成方法、模型训练方法及装置与流程

相关文献

最热文献