一种实体对象编码方法、装置、电子设备和存储介质与流程

2021-11-05 18:24:00 来源：中国专利 TAG：

技术特征：
1.一种实体对象编码方法，其特征在于，该方法包括：获取待编码知识图谱中的各个实体对象，其中，所述待编码知识图谱包括所述各个实体对象之间的关联关系；分别对所述各个实体对象进行编码，获得所述各个实体对象对应的实体嵌入特征，以及分别对所述各个实体对象的实体类别进行编码，获得所述各个实体对象的实体类别对应的类别嵌入特征，其中，所述各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的；分别将所述各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合，获得所述各个实体对象对应的实体编码信息。2.如权利要求1所述的方法，其特征在于，所述分别对所述各个实体对象进行编码，获得所述各个实体对象对应的实体嵌入特征，以及分别对所述各个实体对象的实体类别进行编码，获得所述各个实体对象的实体类别对应的类别嵌入特征，包括：将所述待编码知识图谱输入已训练的实体对象编码模型，基于所述实体对象编码模型中的实体对象嵌入子网络对所述各个实体对象进行编码，获得所述各个实体对象对应的实体嵌入特征；将所述各个实体对象对应的实体嵌入特征输入所述实体对象编码模型中的链接子网络，基于所述链接子网络对所述各个实体对象的实体嵌入特征进行类别语义分析，获得所述各个实体对象的实体类别对应的类别嵌入特征。3.如权利要求2所述的方法，其特征在于，所述实体对象编码模型是通过下列方式训练获得的：根据所述训练样本数据集中的训练样本，对实体对象编码模型执行循环迭代训练，并在训练完毕时，输出训练完毕的实体对象编码模型；其中，在一次循环迭代训练过程中执行以下操作：从所述训练样本数据集中选取一组训练样本，所述一组训练样本包括第一样本知识图谱和第二样本知识图谱，其中，所述第一样本知识图谱与所述第二样本知识图谱包含至少一对作为同义词的实体对象；将所述第一样本知识图谱以及所述第二样本知识图谱输入所述实体对象编码模型的实体对象嵌入子网络，基于所述实体对象嵌入子网络，对所述第一样本知识图谱，以及所述第二样本知识图谱中的各个实体对象进行编码，获得所述各个实体对象对应的实体嵌入特征；以及，基于所述各个实体对象对应的预测实体嵌入特征，对所述实体对象嵌入子网络进行参数调整；将所述各个实体对象对应的实体嵌入特征输入所述实体对象编码模型的链接子网络，基于所述链接子网络，对所述各个实体对象的预测实体嵌入特征进行类别语义分析，获得所述各个实体对象的实体类别对应的第一预测类别嵌入特征；以及，基于所述各个实体对象的实体类别对应的第一预测类别嵌入特征，对所述链接子网络进行参数调整。4.如权利要求3所述的方法，其特征在于，所述一组训练样本还包括实体类别知识集合，所述实体类别知识集合包含所述第一样本知识图谱以及所述第二样本知识图谱中的各个实体对象的实体类别，且实体类别之间具有层次化关系；所述实体对象编码模型还包括实体类别知识嵌入子网络；所述方法还包括：
将所述实体类别知识集合输入所述实体对象编码模型的实体类别知识嵌入子网络，基于所述实体类别知识嵌入子网络对所述实体类别知识集合中的各个实体类别进行编码，获得所述各个实体类别对应的第二预测类别嵌入特征；以及，基于所述各个实体类别对应的第二预测类别嵌入特征，对所述实体类别知识嵌入子网络进行参数调整。5.如权利要求4所述的方法，其特征在于，所述实体对象编码模型还包括嵌入优化子网络；在所述获得所述各个实体类别对应的第二预测类别嵌入特征之后，还包括：基于所述嵌入优化子网络，获取所述实体类别知识集合中的每两个实体类别之间的冲突概率，并基于所述冲突概率对所述每两个实体类别对应的第二预测类别嵌入特征进行调整；以及，基于调整后的各个第二预测实体类别嵌入特征对所述嵌入优化子网络进行参数调整；其中，所述冲突概率用于表征所述两个实体类别之间的类别冲突程度。6.如权利要求3所述的方法，其特征在于，所述基于所述各个实体对象对应的预测实体嵌入特征，对所述实体对象嵌入子网络进行参数调整，包括：基于所述各个实体对象对应的预测实体嵌入特征，确定包含所述各个实体对象的三元组对应的向量差，其中，所述预测实体嵌入特征为嵌入表示向量，包含所述各个实体对象的三元组对应的向量差为所述三元组中的头实体对象嵌入表示向量以及关系嵌入表示向量的和，与所述尾实体对象嵌入表示向量的差；基于第一正样本对应的向量差，以及第一负样本对应的向量差构建实体对象嵌入损失函数，并基于所述实体对象嵌入损失函数对所述实体对象嵌入子网络进行参数调整，其中，所述第一正样本为所述第一样本知识图谱或所述第二样本知识图谱中的三元组，所述第一负样本是通过随机替换所述第一正样本中的头实体对象或尾实体对象生成的。7.如权利要求4所述的方法，其特征在于，所述基于所述各个实体类别对应的第二预测类别嵌入特征，对所述实体类别知识嵌入子网络进行参数调整，包括：根据所述实体类别知识集合中的各个实体类别之间的层次化关系，获取多个实体类别对，其中，每个实体类别对包括子类，以及所述子类所属的父类；针对各个实体类别对都执行以下操作：对于所述各个实体类别对的一个实体类别对，获取所述一个实体类别对中的子类与所述子类所属的父类之间的非线性转换特征，其中，所述非线性转换特征用于表征所述一个实体类别对中的子类对应的第二预测类别嵌入特征与所述子类所属的父类对应的第二预测类别嵌入特征之间的非线性转换关系；基于第二正样本对应的非线性转换特征，以及第二负样本对应的非线性转换特征，构建实体类别知识嵌入损失函数，并基于所述实体类别知识嵌入损失函数对所述实体类别知识嵌入子网络进行参数调整，其中，所述第二正样本为所述实体类别知识集合中的实体类别对，所述第二负样本是通过随机替换所述第二正样本中的子类或父类生成的。8.如权利要求5所述的方法，其特征在于，所述基于调整后的各个第二预测类别嵌入特征对所述嵌入优化子网络进行参数调整，包括：针对所述实体类别知识集合中的每两个实体类别，分别执行以下操作：对于所述每两个实体类别中的两个实体类别，基于所述两个实体类别对应的调整后的第二预测类别嵌入特征之间的距离，与根据所述类别冲突矩阵确定的所述两个实体类别对应的冲突概率，构建负对数似然损失函数；
基于所述负对数似然损失函数对所述实体对象编码模型中的嵌入优化子网络进行参数调整，以使期望冲突的两个实体类别对应的第二预测类别嵌入特征之间的距离，大于不冲突的两个实体类别对应的第二预测类别嵌入特征之间的距离。9.如权利要求7或8所述的方法，其特征在于，所述基于所述各个实体类别对应的第一预测类别嵌入特征，对所述链接子网络进行参数调整，包括：针对所述第一样本知识图谱或所述第二样本知识图谱中的各个实体对象，分别执行以下操作：对于所述各个实体对象中的一个实体对象，基于所述一个实体对象对应的第一预测类别嵌入特征与对应的第二预测类别嵌入特征之间的误差，构建链接损失函数；基于所述链接损失函数对所述实体对象编码模型中的链接子网络进行参数调整。10.如权利要求3所述的方法，其特征在于，所述实体对象编码模型还包括联合表示子网络，所述方法还包括：将所述各个实体对象的实体编码信息输入所述联合表示子网络，基于所述联合表示子网络，对所述第一样本知识图谱和所述第二样本知识图谱中未被识别出的同义词进行标记；以及基于所述实体对象编码模型标记的同义词，对所述实体对象编码模型进行参数调整。11.如权利要求10所述的方法，其特征在于，所述基于所述实体对象编码模型标记的同义词，对所述实体对象编码模型进行参数调整，包括：对于两个作为同义词的实体对象，基于两个实体对象的实体编码信息构建联合表示损失函数；基于所述联合表示损失函数对所述实体对象编码模型进行参数调整。12.如权利要求1～8、10～11任一项所述的方法，其特征在于，所述方法还包括以下操作之一：基于所述各个实体对象的实体编码信息进行同义词挖掘，确定所述待编码知识图谱中的同义词；基于所述各个实体对象的实体编码信息进行知识聚类；基于所述各个实体对象的实体编码信息进行路径推断，得到对应的意图路径，将所述意图路径所指向的知识图谱结果作为问答结果。13.一种实体对象编码装置，其特征在于，包括：获取单元，用于获取待编码知识图谱中的各个实体对象，其中，所述待编码知识图谱包括所述各个实体对象之间的关联关系；编码单元，用于分别对所述各个实体对象进行编码，获得所述各个实体对象对应的实体嵌入特征，以及分别对所述各个实体对象的实体类别进行编码，获得所述各个实体对象的实体类别对应的类别嵌入特征，其中，所述各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的；融合单元，用于分别将所述各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合，获得所述各个实体对象对应的实体编码信息。14.一种电子设备，其特征在于，其包括处理器和存储器，其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行权利要求1～12中任一所述方法的步骤。
15.一种计算机可读存储介质，其特征在于，其包括程序代码，当所述程序产品在电子设备上运行时，所述程序代码用于使所述电子设备执行权利要求1～12中任一所述方法的步骤。

技术总结
本申请涉及计算机技术领域，尤其涉及一种实体对象编码方法、装置、电子设备和存储介质，用以提高实体对象编码的准确性。其中，方法包括：获取待编码知识图谱中的各个实体对象；分别对各个实体对象进行编码，获得对应的实体嵌入特征，以及分别对各个实体对象的实体类别进行编码，获得对应的类别嵌入特征，其中，各个实体对象的实体类别是通过对对应的实体嵌入特征进行类别语义分析确定的；分别将各个实体对象对应的实体嵌入特征和对应的类别嵌入特征进行融合，获得各个实体对象对应的实体编码信息。本申请借助用于表示实体类别的本体知识，为数据量较少的实体对象进行指导，从而克服其误差，提升实体对象的编码质量，提高实体对象编码的准确度。编码的准确度。编码的准确度。

技术研发人员：向玥佳张子恒陈曦林镇溪
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2021.02.02
技术公布日：2021/11/4

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于LCGAMP网络和1-Bit量化的大规模稀疏阵列DoA估计方法与流程

一种实体对象编码方法、装置、电子设备和存储介质与流程

相关文献

最热文献