一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种知识图谱的构建更新方法与流程

2021-12-04 00:14:00 来源:中国专利 TAG:

技术特征:
1.一种知识图谱的构建更新方法,其特征在于,包括:对输入的非结构化数据或半结构化数据的数据文本进行分词处理,确定语句集合;抽取所述语句集合中的属性信息、关系信息和实体信息;通过共指消解和实体消歧技术将所述属性信息、关系信息和实体信息进行融合处理,确定融合信息,并基于预设的结构化数据和第三方知识库,验证所述融合信息;根据验证后的融合信息,构建知识图谱,并对所述知识图谱进行更新。2.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述对输入的非结构化数据或半结构化数据的数据文本进行分词处理,确定语句集合,包括以下步骤:获取所述非结构化数据或半结构化数据的数据文本,提取文本列表信息;根据所述文本列表信息,对所述数据文本进行单条过滤,确定过滤文本;将所述过滤文本通过hanlp分词处理,确定分词信息;根据所述分词信息,确定语句集合。3.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述抽取所述语句集合中的属性信息、关系信息和实体信息,包括:将所述句子集合以句子为单位进行遍历处理,确定遍历分词集合;根据所述遍历分词集合,确定实体信息;其中,所述实体信息包括:专家、领导、企业、行业、研究领域、地域、会议、研究机构、事件;根据所述实体信息,确定所述实体信息中每类信息的属性信息;根据所述实体信息和属性信息中的相同信息,确定所述语句集合的关系信息。4.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述抽取所述语句集合中的属性信息、关系信息和实体信息,还包括:根据所述关系信息,通过预设的关系数据库保存抽取过程中的时间因素;根据所述关系信息,通过预设的图数据库保存的关系本体信息。5.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述通过共指消解和实体消歧技术将所述属性信息、关系信息和实体信息进行融合处理,确定融合信息,并基于预设的结构化数据和第三方知识库,验证所述融合信息,包括:将所述实体信息通过共指消解,融合所述属性信息和关系信息;将所述实体信息和融合后的属性信息和关系信息和关系信息进行实体消歧,删除所述实体信息的不同含义,得到融合信息;根据所述结构化数据,判断所述结构化数据中是否包括所述融合信息;当所述结构化数据中不包含所述融合信息时,根据所述第三方知识库验证所述融合信息是否为真实信息;当所述融合信息为真实信息时,保存确定所述融合信息;当所述融合信息为错误信息时,将所述融合信息保存在错误信息数据库。6.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述根据验证后的融合信息,构建知识图谱,并对所述知识图谱进行更新包括:将所述验证后的融合信息通过质量评估,确定知识图谱;其中,将所述验证后的融合信息进行质量评估还包括;抽取所述验证后的融合信息的本体数据,对所述本体数据进行质量评估,根据评估后
的本体数据更新所述知识图谱;根据所述知识图谱,基于知识推理,获取推理数据,并将所述推理数据进行质量评估,根据评估后的推理数据更新所述知识图谱。7.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述方法还包括:根据所述语句集合,判断所述句子集合中的关键字;当所述语句集合存在关键字时,抽取实体信息;当所述语句集合不存在关键字时,执行无实体处理;其中,所述无实体处理包括:遍历所述语句集合,确定遍历分词前单词的词性信息;根据所述词性信息,筛选出符合组成实体信息的第一语句集合;根据所述第一语句集合,确定实体信息集合。8.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述方法还包括:根据所述语句集合,判断是否能够抽取所述语句集合中的属性信息、关系信息和实体信息;所述判断过程包括如下步骤:获取所述句子集合中的关键字;根据所述关键字,获取事件信息;对所述事件信息的完整度进行评分;将所述评分与预设的评分阈值进行比较,当所述评分大于等于所述评分阈值时,保存所述语句集合,并抽取所述语句集合中的属性信息、关系信息和实体信息;当所述评分小于所述评分阈值时,保存所述语句集合。9.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述方法还包括:获取所述数据文本的获取时间,并建立时间戳;根据所述时间戳,判断所述非结构化数据或半结构化数据在不同时间戳下是否存在增添;当存在增添时,对存在增添的数据文本进行更新个体标记,并根据所述更新个体标记进行知识图谱对应更新。10.根据权利要求1所述的一种知识图谱的构建更新方法,其特征在于:所述方法还包括:根据所述属性信息、关系信息和实体信息,进行数据预处理,将语句集合按照实体、关系和静态属性分别存储,并在分别存储时,等成对应的时间戳表;根据所述时间戳表,将不同数据文本的语句集合进行存储。

技术总结
本发明提供了一种知识图谱的构建更新方法,包括对输入的非结构化数据或半结构化数据的数据文本进行分词处理,确定语句集合;抽取所述语句集合中的属性信息、关系信息和实体信息;通过共指消解和实体消歧技术将所述属性信息、关系信息和实体信息进行融合处理,确定融合信息,并基于预设的结构化数据和第三方知识库,验证所述融合信息;根据验证后的融合信息,构建知识图谱,并对所述知识图谱进行更新。并对所述知识图谱进行更新。并对所述知识图谱进行更新。


技术研发人员:黄吉海 贾尽裴 黄大千 赵璟
受保护的技术使用者:国务院国有资产监督管理委员会研究中心
技术研发日:2021.09.24
技术公布日:2021/12/3
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献