一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种知识图谱构建方法、装置、系统及可读存储介质与流程

2022-04-30 17:01:06 来源:中国专利 TAG:


1.本发明实施例涉及知识图谱技术领域,特别是涉及一种知识图谱构建方法、装置、系统及计算机可读存储介质。


背景技术:

2.数据是促进生产的驱动力,目前工厂拥有大量的工业生产数据,并且每天还会产生大量的数据,它们被存储于工厂的各个数据库中,并且随着大数据技术的发展,工业生产数据已经被服务于设备寿命预测、优化生产、告警等场景。知识图谱作为一种能够展示知识结构关系,且具备逻辑推理和计算的技术,可以将特定领域中的知识概念、业务场景和实体结构化的串联起来,从而让碎片化的工业生产数据产生更多价值。
3.目前,知识图谱的数据获取一般分为三种,一种是全部数据存储于图数据库中,一种是数据分散存储于图数据库和其他非图数据库中,一种是全部数据存储于关系数据库中。其中,全部数据存储于图数据库时,形成的图谱不易与生产库同步;全部数据存储于关系数据库时,对已有数据库的现场来说需重新设计数据库或者改变部分数据库结构,但一般生产数据库的表数和单表存储量都比较大,因此为搭建知识图谱改变现有数据结构难以实现;数据分散存储于图数据库和其他非图数据库中的,通常建立图数据库中本体与关系型数据库的映射文件,在需要查找数据时,需要多次读取硬盘,查询效率低。
4.鉴于此,如何提供一种解决上述技术问题的知识图谱构建方法、装置、系统及计算机可读存储介质成为本领域技术人员需要解决的问题。


技术实现要素:

5.本发明实施例的目的是提供一种知识图谱构建方法、装置、系统及计算机可读存储介质,该知识图谱中的图谱能够与生产数据库同步,而且不需要改变生产数据库的结构,并且查询效率高。
6.为解决上述技术问题,本发明实施例提供了一种知识图谱构建方法,包括:
7.根据设备信息获取网络中本体、本体关联关系以及归属所述本体的实例对应的实例标识;
8.依据所述生产数据库确定出实例与对应的表结构,并基于所述实例与对应的表结构,得到与所述实例对应的表标识;所述表结构包括实例属性及属性值;
9.依据所述本体、所述本体关联关系、与所述本体对应的实例标识以及所述与实例对应的表标识建立知识图谱,所述知识图谱包括表标识与本体归属关系。
10.可选的,所述依据所述本体、所述本体关联关系、所述与本体对应的实例标识以及所述与实例对应的表标识建立知识图谱,包括:
11.依据所述本体以及所述本体关联关系,在图数据库中构建知识图谱的本体框架;
12.将所述与实例对应的表标识转换为ttl文件后导入至所述图数据库,并基于所述与本体对应的实例标识建立表标识与本体的归属关系,生成知识图谱。
13.可选的,还包括:
14.保存用户基于所述知识图谱查询的查询记录。
15.可选的,还包括:
16.获取所存储的各条查询记录;
17.针对每条所述查询记录,得到与所述查询记录对应的图数据;
18.将每个所述图数据分别映射至向量空间,一个图数据对应所述向量空间中的一个向量;
19.对所述向量空间中的各个向量进行余弦相似性分析,根据分析结果对每个所述图数据进行分类。
20.可选的,在所述将每个所述图数据分别映射至向量空间之前,还包括:
21.从每个所述图数据确定出不满足预设要求的节点,以对各个所述图数据进行清洗得到清洗后的图数据;
22.则,所述将每个所述图数据分别映射至向量空间为:
23.将每个所述清洗后的图数据分别映射至向量空间。
24.可选的,所述从每个所述图数据确定出不满足预设要求的节点,包括:
25.采用3σ法则对每个所述图数据进行分析,确定出不满足3σ法则的节点。
26.可选的,将每个所述清洗后的图数据分别映射至向量空间,包括:
27.通过异质图嵌入的方式将每个所述清洗后的图数据分别映射至向量空间。
28.本发明实施例还提供了一种知识图谱构建装置,包括:
29.获取模块,用于根据设备信息获取网络中本体、本体关联关系以及归属所述本体的实例对应的实例标识;
30.确定模块,用于依据所述生产数据库确定出实例与对应的表结构,并基于所述实例与对应的表结构,得到与所述实例对应的表标识;所述表结构包括实例属性及属性值;
31.建立模块,用于依据所述本体、所述本体关联关系、与所述本体对应的实例标识以及所述与实例对应的表标识建立知识图谱,所述知识图谱包括表标识与本体归属关系。
32.本发明实施例还提供了一种知识图谱构建系统,包括:
33.存储器,用于存储计算机程序;
34.处理器,用于执行所述计算机程序时实现如上述所述知识图谱构建方法的步骤。
35.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述知识图谱构建方法的步骤。
36.本发明实施例还提供了一种知识图谱构建方法、装置、系统及计算机可读存储介质,该方法包括:根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识;依据生产数据库确定出实例与对应的表结构,并基于实例与对应的表结构,得到与实例对应的表标识;表结构包括实例属性及属性值;依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,知识图谱包括表标识与本体归属关系。
37.可见,本发明实施例中根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识,然后依据生产数据库确定出实例与对应的表结构,并进一步基
于实例与对应的表结构,得到与实例对应的表标识,再依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,以便根据实例标识通过知识图谱查询到对应的表标识,进一步根据表标识从生产数据库中获取表结构中的实例属性及属性值展示给用户;本发明实施例中建立的知识图谱中的图谱不仅可以与生产数据库同步,而且不需要改变生产数据库的结构,并且查询效率高。
附图说明
38.为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
39.图1为本发明实施例提供的一种知识图谱构建方法的流程示意图;
40.图2为本发明实施例提供的一种知识图谱的本体架构示意图;
41.图3为本发明实施例提供的一种知识图谱构建装置的结构示意图。
具体实施方式
42.本发明实施例提供了一种知识图谱构建方法、装置、系统及计算机可读存储介质,该知识图谱中的图谱能够与生产数据库同步,而且不需要改变生产数据库的结构,并且查询效率高。
43.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
44.请参照图1,图1为本发明实施例提供的一种知识图谱构建方法的流程示意图。该方法包括:
45.s110:根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识;
46.需要说明的是,设备信息中包括设备名称、id等信息,还包括设备之间的关系信息,因此本发明实施例中可以通过获取设备信息(具体可以为工业设备信息),然后从该设备信息中获取到网络中的本体、本体关联关系以及归属于该本体的实例,以及实例对应的实例标识。
47.s120:依据生产数据库确定出实例与对应的表结构,并基于实例与对应的表结构,得到与实例对应的表标识;表结构包括实例属性及属性值;
48.具体的,在获取到上述信息后,可以从生产数据库中确定出实例以及与实例对应的表结构,其中,该表结构可以包括实例属性,以及对应的属性值,并且本发明实施例总的生产数据库具体可以为工业生产数据库(例如mysql)。
49.s130:依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,知识图谱包括表标识与本体归属关系。
50.具体的,本发明实施例中在建立知识图谱时,根据上述获取到的本体、本体关联关
系、与本体对应的实例标识、与实例对应的表标识即可构件出知识图谱,该知识图谱中包括本体与本体之间的关系、本体与对应的实例标识之间的关系,实例标识与对应的表标识之间的关系,从而可以确定表标识与本体之间的归属关系,整个知识图谱可以清楚的标识本体、实体标识、表标识的归属关系,从而可以在用户需要查询与某个实体标识对应的表结构中的实体属性及属性值时,可以直接通过知识图谱输入对应的实体标识,知识图谱可以获取到对应的表标识,进一步根据表标识从生产数据中获取与该表标识对应的表结构,并获取表结构中的实例属性及对应的属性值展示给用户,有利于提高用户查询效率。另外,本发明实施例中构建的知识图谱是基于生产数据库建立的,因此知识图谱与生产数据库可以同步,且不需要改变生产数据库的结构,简单易行。
51.进一步的,上述s130中依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱的过程,具体可以包括:
52.依据本体以及本体关联关系,在图数据库中构建知识图谱的本体框架;
53.将与实例对应的表标识转换为ttl文件后导入至图数据库,并基于与本体对应的实例标识建立表标识与本体的归属关系,生成知识图谱。
54.可以理解的是,本发明实施例中可以先根据本体以及本体关联关系,建立图数据库总的本体框架,在实际应用中可以采用neo4j.n10s插件将所获取到的本体及本体关联关系导入至neo4j图数据库中,并构件知识图谱的本体框架schema,具体请参照图2,该知识图谱的本体框架中的本体分别为设备类型1、设备类型2、设备类型3,并且每个设备类型1下分别包括多个子类(也即实例标识)。在构建本体框架后,将与实例对应的表标识转换为ttl文件(具体可以通过d2rq开源工具进行转换),并将转换后的ttl文件导入至图数据库(如neo4j图数据库),然后基于与本体对应的实例标识建立表标识与本体的归属关系,具体为建立本体与实例标识的关系,以及实例标识与表标识的归属关系,从而生成知识图谱。
55.进一步的,该方法还可以包括:
56.保存用户基于知识图谱查询的查询记录。
57.具体的,在用户(如专家等)通过本发明实施例中所提供的知识图谱进行查询时,本发明实施例可以保存对应的查询中的每个操作,也即对查询记录进行保存,具体可以通过web保存查询记录对应的表单,并将其存储至本地文档。
58.更进一步的,该方法还可以包括:
59.获取所存储的各条查询记录;
60.针对每条查询记录,得到与查询记录对应的图数据;
61.将每个图数据分别映射至向量空间,一个图数据对应向量空间中的一个向量;
62.对向量空间中的各个向量进行余弦相似性分析,根据分析结果对每个图数据进行分类。
63.需要说明的是,本发明实施例中可以根据所存储的所有查询记录得到与每条查询记录各自对应的图数据,并将每个图数据分别映射至向量空间,在向量空间中对应每个向量,具体的可以通过异质图嵌入的方式将图数据映射至向量空间,然后通过对向量空间中的各向量进行余弦相似性分析,并根据分析结果将各个图数据进行分类,以形成知识词典,在用户采用该知识图谱进行知识查找时,为不同的用户提供知识参考。
64.其中,基于图嵌入的方式保留图域信息,可以最小化重构误差学习映射,图嵌入的
4个关键点分别是:图域到嵌入域的映射函数、图域关键信息提取器、利用嵌入域重构所提取的图信息、两个信息的相互优化。具体以metapath2vec图嵌入算法为例进行说明,metapath2vec图嵌入算法的目标是最大化保留一个异构网络的结构和语义信息的似然,首先使用基于meta-path的随机游走获取异构网络中每种不同类型顶点的异构领域,然后使用扩展的skip-gram处理前面获取的顶点邻域,最终学习每个不同类型顶点的网络嵌入表示。
65.更进一步的,在上述将每个图数据分别映射至向量空间之前,该方法还可以包括:
66.从每个图数据确定出不满足预设要求的节点,以对各个图数据进行清洗得到清洗后的图数据;
67.则,将每个图数据分别映射至向量空间为:
68.将每个清洗后的图数据分别映射至向量空间。
69.也即在实际应用中,一条查询记录中可能存在无效查询,因此可以根据查询记录对应的图数据确定出不满足预设要求的节点,该节点即为无效节点,从而对图数据进行清洗得到清洗后的图数据,然后再将清洗后的图数据映射至向量空间。
70.其中,上述从每个图数据确定出不满足预设要求的节点,可以包括:
71.采用3σ法则对每个图数据进行分析,确定出不满足3σ法则的节点。
72.其中,根据3σ法则获取满足次数的节点的元图,对不满足3σ法则的节点认为无效节点,对应出查询即为无效查询。具体的,在正态分布中σ代表标准差,μ代表均值,数据分布在(μ-3σ,μ 3σ)区间的概率为0.9974,区间外的数据认为在操作过程中的无效操作。
73.可见,本发明实施例中根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识,然后依据生产数据库确定出实例与对应的表结构,并进一步基于实例与对应的表结构,得到与实例对应的表标识,再依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,以便根据实例标识通过知识图谱查询到对应的表标识,进一步根据表标识从生产数据库中获取表结构中的实例属性及属性值展示给用户;本发明实施例中建立的知识图谱中的图谱不仅可以与生产数据库同步,而且不需要改变生产数据库的结构,并且查询效率高。
74.在上述实施例的基础上,本发明实施例还提供了一种知识图谱构建装置,请参照图3,该装置包括:
75.获取模块21,用于根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识;
76.确定模块22,用于依据生产数据库确定出实例与对应的表结构,并基于实例与对应的表结构,得到与实例对应的表标识;表结构包括实例属性及属性值;
77.建立模块23,用于依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,知识图谱包括表标识与本体归属关系。
78.需要说明的是,本发明实施例中所提供的知识图谱构建装置具有与上述实施例中知识图谱构建方法具有相同的有益效果,并且对于本发明实施例所涉及到的知识图谱构建方法的具体介绍请参照上述实施例,本发明在此不再赘述。
79.在上述实施例的基础上,本发明实施例还提供了一种知识图谱构建系统,包括:
80.存储器,用于存储计算机程序;
81.处理器,用于执行计算机程序时实现如上述知识图谱构建方法的步骤。
82.例如,本发明实施例中的处理器可以用于实现根据设备信息获取网络中本体、本体关联关系以及归属本体的实例对应的实例标识;依据生产数据库确定出实例与对应的表结构,并基于实例与对应的表结构,得到与实例对应的表标识;表结构包括实例属性及属性值;依据本体、本体关联关系、与本体对应的实例标识以及与实例对应的表标识建立知识图谱,知识图谱包括表标识与本体归属关系。
83.在上述实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述知识图谱构建方法的步骤。
84.该计算机可读存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
85.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
86.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
87.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献