一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

知识图谱构建方法、装置、电子设备及存储介质与流程

2023-03-31 23:46:59 来源:中国专利 TAG:

技术特征:
1.一种知识图谱构建方法,其特征在于,包括:解析文本数据,生成所述文本数据的抽象语义表示图;根据所述抽象语义表示图,抽取所述文本数据中的第一实体和第一实体关系,所述第一实体和所述第一实体关系之间具有对应关系;根据所述第一实体和所述第一实体关系,构建目标知识图谱。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一实体和所述第一实体关系,构建目标知识图谱,包括:对所述第一实体进行实体消歧,得到第二实体;根据所述第二实体和所述第一实体关系,构建所述目标知识图谱。3.根据权利要求2所述的方法,其特征在于,所述对所述第一实体进行实体消歧,得到第二实体,包括:根据所述第一实体与预设实体库中每个预设实体之间的字符串相似度,从所述预设实体库中筛选出多个第三实体;分别计算所述第一实体对应的抽象语义表示子图与所述多个第三实体各自对应的知识图谱子图之间的图相似度,所述抽象语义表示子图根据所述第一实体在所述抽象语义表示图中的邻接关系生成,所述知识图谱子图根据与所述知识图谱子图对应的第三实体在预设知识图谱中的邻接关系生成;将与所述抽象语义表示子图之间图相似度最高的知识图谱子图对应的第三实体与所述第一实体链接,得到第二实体。4.根据权利要求2所述的方法,其特征在于,所述根据所述第二实体和所述第一实体关系,构建所述目标知识图谱,包括:根据所述第一实体关系与预设实体关系库中每个实体关系的映射关系,将所述第一实体关系映射为第二实体关系,所述第二实体关系为存在于所述预设实体关系库中的实体关系;根据所述第二实体和所述第二实体关系,构建所述目标知识图谱。5.根据权利要求1所述的方法,其特征在于,所述目标知识图谱包括至少一个三元组,所述至少一个三元组中的每个三元组均包括头实体、关系和尾实体,其中,所述头实体和所述尾实体根据所述第一实体构建,所述关系根据所述第一实体关系构建;在所述根据所述第一实体和所述第一实体关系,构建目标知识图谱之后,还包括:对所述目标知识图谱中的所述至少一个三元组进行校验;将所述至少一个三元组中未通过校验的三元组从所述目标知识图谱中剔除。6.根据权利要求5所述的方法,其特征在于,所述对所述目标知识图谱中的所述至少一个三元组进行校验,包括:针对所述至少一个三元组中的每个三元组,分别对所述三元组中的头实体、关系和尾实体进行掩码预测,得到所述三元组中头实体的存在概率、所述三元组中关系的存在概率和所述三元组中尾实体的存在概率;根据所述三元组中头实体的存在概率、所述三元组中关系的存在概率和所述三元组中尾实体的存在概率,得到所述三元组的存在概率;根据所述三元组的存在概率,校验所述三元组。
7.根据权利要求6所述的方法,其特征在于,所述针对所述至少一个三元组中的每个三元组,分别对所述三元组中的头实体、关系和尾实体进行掩码预测,得到所述三元组中头实体的存在概率、所述三元组中关系的存在概率和所述三元组中尾实体的存在概率,包括:针对所述至少一个三元组中的每个三元组,分别对所述三元组中的头实体、关系和尾实体进行掩码处理,得到头实体掩码三元组、关系掩码三元组和尾实体掩码三元组;将所述头实体掩码三元组、所述关系掩码三元组和所述尾实体掩码三元组分别输入预训练的掩码预测模型,得到所述三元组中头实体的存在概率、所述三元组中关系的存在概率和所述三元组中尾实体的存在概率。8.根据权利要求6所述的方法,其特征在于,所述根据所述三元组的存在概率,校验所述三元组,包括:若所述三元组的存在概率不满足预设校验概率条件,则确定所述三元组未通过校验。9.根据权利要求1至8任一项所述的方法,其特征在于,所述文本数据为非结构化文本数据。10.一种知识图谱构建装置,其特征在于,包括:解析模块,用于解析文本数据,生成所述文本数据的抽象语义表示图;抽取模块,用于根据所述抽象语义表示图,抽取所述文本数据中的第一实体和第一实体关系,所述第一实体和所述第一实体关系之间具有对应关系;构建模块,用于根据所述第一实体和所述第一实体关系,构建目标知识图谱。11.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任一项所述的方法。12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9任一项所述的方法。

技术总结
本公开提供了一种知识图谱构建方法、装置、电子设备及存储介质,涉及自然语言处理技术领域。该方法包括解析文本数据,生成文本数据的抽象语义表示抽象语义表示图;根据抽象语义表示图,抽取文本数据中的第一实体和第一实体关系,第一实体和第一实体关系之间具有对应关系;根据第一实体和第一实体关系,构建三元组;对三元组进行校验;若三元组通过校验,则根据三元组,构建目标知识图谱。本公开实施例能够在无需人工标注的样本数据参与的前提下,构建出具有高准确性的知识图谱,不仅提升了知识图谱的构建效率,还可节省大量人工成本。还可节省大量人工成本。还可节省大量人工成本。


技术研发人员:杨磊 刘权
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2022.11.07
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献