一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于知识图谱补全的增量式多源实体解析方法与流程

2021-11-18 02:33:00 来源:中国专利 TAG:

技术特征:
1.一种用于知识图谱补全的增量式多源实体解析方法,其特征在于,包括:在增量式多源实体之间应用配对链接,导出相似度图谱;其中,所述相似度图谱用于将来自多个源的匹配实体进行分组,以形成实体集群;采用聚类方法,利用相似度图谱来确定增量式多源实体所属的实体簇,输出完全聚类图谱,完成对增量式多源实体的解析。2.根据权利要求1所述的用于知识图谱补全的增量式多源实体解析方法,其特征在于,在增量式多源实体之间应用配对链接,导出相似度图谱的步骤中,包括步骤:将源自现有源或源自新源的新实体作为输入工作流,输入已确定聚类的相似度图谱中进行迭代,输出已有的实体簇,新实体的组以及新创建的链接组成的分组相似图。3.根据权利要求1所述的用于知识图谱补全的增量式多源实体解析方法,其特征在于,所采用的聚类方法包括最大双向合并基方法和n

深度重新聚类法;其中,所述最大双向合并基方法是通过判断,将新的增量式多源实体分配到相似的现有簇中,或形成新簇;所述n

深度重新聚类法是通过对现有聚类图谱进行重新聚类,以修复现有聚类,从而为新的增量式多源实体实现更好的聚类分配,其中n是用来控制被考虑重聚类的相似图的部分的参数。4.根据权利要求1所述的用于知识图谱补全的增量式多源实体解析方法,其特征在于,相似度图谱公式表示为g=(e,l);其中,e的顶点表示实体,l的边缘表示相似实体之间的链接的图;边缘具有指示相似度的相似度值(区间[0,1]中的实数)的属性;同一源的实体之间没有边缘。5.根据权利要求4所述的用于知识图谱补全的增量式多源实体解析方法,其特征在于,聚类相似图谱cg是一个相似度图谱g,使得其所有实体都被聚类,相同的集群实体解析id被分配给同一簇的所有顶点。

技术总结
本发明公开了一种用于知识图谱补全的增量式多源实体解析方法,包括:在增量式多源实体之间应用配对链接,导出相似度图谱;采用聚类方法,利用相似度图谱来确定增量式多源实体所属的实体簇,输出完全聚类图谱,完成对增量式多源实体的解析。本发明目的是减少对添加新源和实体的顺序的依赖,为此考虑优化分配给实体集群的新实体集。本发明提出使用轻量级方法来修复实体簇,以纠正错误的簇,新方法集成在用于并行和可扩展的实体聚类的FAM实体解析框架中,对实际工作负载的新方法进行详细评估显示了其有效性,特别是,修复方法优于其他的增量式方法,并且与批处理式实体解析相比,其质量达到了相同的水平,这表明其结果与添加新实体的顺序无关。体的顺序无关。体的顺序无关。


技术研发人员:沈亮 高灵超 周春雷 朱广新 陈相舟
受保护的技术使用者:国家电网有限公司大数据中心
技术研发日:2021.07.22
技术公布日:2021/11/17
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献