一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于构建知识图谱的方法及装置、电子设备、存储介质与流程

2022-07-16 13:26:27 来源:中国专利 TAG:

技术特征:
1.一种用于构建知识图谱的方法,其特征在于,包括:获取第一语料数据;将所述第一语料数据输入预设的知识抽取模型,获得若干个第一实体向量、各所述第一实体向量对应的第一实体类型和各第一实体向量对应的第一实体关系;按照第一实体类型将各第一实体向量分成若干向量分组;对各向量分组中的第一实体向量进行语义聚类,获得各向量分组分别对应的实体类簇;根据各第一实体关系连接各实体类簇,获得知识图谱。2.根据权利要求1所述的方法,其特征在于,知识抽取模型通过以下方式获得:获取第二语料数据,所述第二语料数据被标记有实体样本、各实体样本对应的实体类型样本、各实体样本对应的实体关系样本;将第二语料数据输入预设的待训练模型进行训练,获得备选知识抽取模型;确定备选知识抽取模型分别对各实体类型样本对应的第二语料数据的识别准确率;根据识别准确率筛选第二语料数据获得待标注语料数据;确定待标注语料数据的各待标注实体和各待标注实体对应的待标注实体关系;响应于用户的修改指令调整待标注语料数据中的各待标注实体和各待标注实体对应的待标注实体关系,将调整后的待标注语料数据确定为第二语料数据;获取待标注语料数据中被修改的各待标注实体和待标注实体关系的总修改个数;在总修改个数小于预设数值的情况下,将备选知识抽取模型确定为知识抽取模型。3.根据权利要求2所述的方法,其特征在于,确定备选知识抽取模型分别对各实体类型对应的第二语料数据的识别准确率,包括:利用备选知识抽取模型分别识别不同的实体类型样本对应的第二语料数据,获得各实体类型对应的识别结果;所述识别结果包括备选实体样本、各备选实体样本对应的备选实体类型、各备选实体样本对应的备选实体关系样本;将识别结果与第二语料数据中的实体样本、各实体样本对应的实体类型、各实体样本对应的实体关系样本进行比较,获得比较结果;根据比较结果获取各实体类型对应的第二语料数据的识别准确率。4.根据权利要求1所述的方法,其特征在于,根据各实体关系连接各实体类簇,获得知识图谱,包括:从各实体类簇中选取一个实体类簇确定为目标实体类簇,将实体类簇对应的实体向量确定为目标实体向量;将各实体类簇中除目标实体类簇的实体类簇确定为备选实体类簇,将备选实体类簇对应的实体向量确定为第二实体向量;在目标实体向量与第二实体向量存在实体关系的情况下,连接目标实体向量对应的目标实体类簇与第二实体向量对应的备选实体类簇,获得知识图谱。5.根据权利要求1所述的方法,其特征在于,根据各实体关系连接各实体类簇,获得知识图谱后,还包括:获取第三语料数据;将所述第三语料数据输入预设的知识抽取模型,获得若干个第三实体向量;
根据第三实体向量与实体类簇对应的第一实体向量之间的相似度,将所述第三实体向量添加到知识图谱。6.根据权利要求5所述的方法,其特征在于,根据第三实体向量与实体类簇对应的第一实体向量之间的相似度,将所述第三实体向量添加到知识图谱,包括:在第三实体向量与实体类簇对应的第一实体向量之间的相似度小于预设阈值的情况下,将第三实体向量与所述实体类簇连接;和/或,在第三实体向量与实体类簇对应的第一实体向量之间的相似度大于预设阈值的情况下,将第三实体向量作为节点存储到知识图谱。7.根据权利要求1所述的方法,其特征在于,根据各实体关系连接各实体类簇,获得知识图谱后,还包括:将所述知识图谱展示给用户。8.一种用于构建知识图谱的装置,其特征在于,包括:获取模块,被配置为获取第一语料数据;确定模块,被配置为将所述第一语料数据输入预设的知识抽取模型,获得若干个第一实体向量、各所述第一实体向量对应的第一实体类型和各第一实体向量对应的第一实体关系;分类模块,被配置为按照第一实体类型将各第一实体向量分成若干向量分组;聚类模块,被配置为对各向量分组中的第一实体向量进行语义聚类,获得各向量分组分别对应的实体类簇;构建模块,被配置为根据各第一实体关系连接各实体类簇,获得知识图谱。9.一种电子设备,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至7任一项所述的用于构建知识图谱的方法。10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至7任一项所述的用于构建知识图谱的方法。

技术总结
本申请涉及知识图谱技术领域,公开一种用于构建知识图谱的方法,包括:获取第一语料数据;将第一语料数据输入预设的知识抽取模型,获得若干个第一实体向量、各第一实体向量对应的第一实体类型和各第一实体向量对应的第一实体关系;按照第一实体类型将各第一实体向量分成若干向量分组;对各向量分组中的第一实体向量进行语义聚类,获得各向量分组分别对应的实体类簇;根据各第一实体关系连接各实体类簇,获得知识图谱。这样,减少了知识图谱中冗杂的实体关系,使得知识图谱呈现的实体与实体之间的实体关系更简洁,更便于用户直观的查看实体与实体之间的联系。本申请还公开一种用于构建知识图谱的装置、服务器、存储介质。存储介质。存储介质。


技术研发人员:于皓 张杰
受保护的技术使用者:北京明略昭辉科技有限公司
技术研发日:2022.04.18
技术公布日:2022/7/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献