一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信息集成方法、装置、设备及可读存储介质与流程

2022-02-22 07:10:13 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,特别涉及一种信息集成方法、装置、设备及可读存储介质。


背景技术:

2.目前,一个局域网的应用系统众多,且不同应用系统的接口需要对接,页面需要相互嵌用。例如:一个企业内部的有人力资源管理系统、销售系统、财务系统等,这些系统之间既需要相互隔离,又需要建立联系。
3.但是,一个局域网内不同系统、不同接口之间的集成关系零散分布存储,使得局域网内的各系统、各接口之间的集成关系难以统一管理和维护。
4.因此,如何统一管理局域网内的各系统、各接口之间的集成关系,是本领域技术人员需要解决的问题。


技术实现要素:

5.有鉴于此,本技术的目的在于提供一种信息集成方法、装置、设备及可读存储介质,以统一管理局域网内的各系统、各接口之间的集成关系。其具体方案如下:
6.第一方面,本技术提供了一种信息集成方法,包括:
7.获取不同类型的多个数据源;任一数据源包括至少两个对象的集成关系,所述对象为目标局域网中的应用系统、数据库、数据表、api或页面;
8.对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据;
9.基于知识融合技术将所述rdf数据融合并转换为rdf图后,可视化展示所述rdf图。
10.优选地,所述获取不同类型的多个数据源,包括:
11.从不同类型的集成工具中获取结构化的集成配置信息,并将获取到的集成配置信息作为所述多个数据源。
12.优选地,不同数据源的数据格式和/或存储方式不同。
13.优选地,所述对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据,包括:
14.若任一数据源属于结构化库表,则利用d2r工具将该数据源中的数据直接映射为所述rdf数据;
15.若任一数据源不属于结构化库表,则将用户从该数据源中抽取的知识以rdf三元组格式记录,得到所述rdf数据。
16.优选地,所述利用d2r工具将该数据源中的数据直接映射为所述rdf数据,包括:
17.利用d2r工具将该数据源中的表映射为rdf类,将所述表的列映射为rdf属性,将所述表的行映射为资源,将所述表中单元格的值映射为文字值,并以rdf三元组格式记录所有映射结果,得到所述rdf数据。
18.优选地,所述将所述表中单元格的值映射为文字值,包括:
19.若所述表中单元格的值对应外键,则将所述表中单元格的值映射为所述外键指向的资源。
20.优选地,d2r工具为d2rq、triplify、d2rserver或openlink。
21.第二方面,本技术提供了一种信息集成装置,包括:
22.获取模块,用于获取不同类型的多个数据源;任一数据源包括至少两个对象的集成关系,所述对象为目标局域网中的应用系统、数据库、数据表、api或页面;
23.记录模块,用于对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据;
24.集成模块,用于基于知识融合技术将所述rdf数据融合并转换为rdf图后,可视化展示所述rdf图。
25.第三方面,本技术提供了一种电子设备,包括:
26.存储器,用于存储计算机程序;
27.处理器,用于执行所述计算机程序,以实现前述公开的信息集成方法。
28.第四方面,本技术提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的信息集成方法。
29.通过以上方案可知,本技术提供了一种信息集成方法,包括:获取不同类型的多个数据源;任一数据源包括至少两个对象的集成关系,所述对象为目标局域网中的应用系统、数据库、数据表、api或页面;对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据;基于知识融合技术将所述rdf数据融合并转换为rdf图后,可视化展示所述rdf图。
30.可见,本技术能够以某一局域网内包括多个对象集成关系的、不同类型的数据源作为图谱的知识来源,汇总了该局域网内全面的集成关系,后续对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据;基于知识融合技术将rdf数据融合并转换为rdf图后,可视化展示rdf图,使得该rdf图能够展示该局域网内应用系统、数据库、数据表、api或页面之间的关系,这些对象之间的关系可基于rdf图明确且细致地展现。也即:本技术得到的rdf图明确记录有局域网内的各系统、各接口等对象之间的集成关系,基于此rdf图可实现这些对象集成关系的统一管理和维护。
31.相应地,本技术提供的一种信息集成装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
32.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
33.图1为本技术公开的一种信息集成方法流程图;
34.图2为本技术公开的一种实体之间的关系示意图;
35.图3为本技术公开的一种rdf图示意图;
36.图4为本技术公开的另一种信息集成方法流程图;
37.图5为本技术公开的一种信息集成装置示意图;
38.图6为本技术公开的一种电子设备示意图。
具体实施方式
39.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
40.目前,一个局域网内不同系统、不同接口之间的集成关系零散分布存储,使得局域网内的各系统、各接口之间的集成关系难以统一管理和维护。为此,本技术提供了一种信息集成方案,能够统一管理局域网内的各系统、各接口之间的集成关系。
41.在介绍本技术之前,先就本技术涉及的专业术语进行如下介绍:
42.知识抽取:从数据源中抽取出知识。
43.知识存储:将获取到的知识进行物理存储。
44.知识融合:建立异构本体或异构实例之间的联系,从而使异构的知识图谱能相互融合,实现互操作。
45.知识表示:用计算机符号描述和表示人脑中的知识,决定了图谱构建的产出目标。
46.iri:国际化资源标识符(internationalized resource identifiers)。
47.rdf:资源描述框架(resource description framework)为标识web中的资源定义一种标准系统,这些资源包括系统、数据库、数据表、api、页面、文件等等。
48.本体:指一种形式化的,对于共享概念体系的明确而又详细的说明。也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系。
49.参见图1所示,本技术实施例公开了一种信息集成方法,包括:
50.s101、获取不同类型的多个数据源。
51.其中,任一数据源包括至少两个对象的集成关系,对象为目标局域网中的应用系统、数据库、数据表、api或页面。
52.在本实施例中,数据源包括:关联目标局域网中的两个系统、或关联目标局域网中的某个系统与某个接口,或关联目标局域网中的不同页面的集成关系。这些集成关系可以记录在结构化数据库中,也可以记录在文档中。因此在一种具体实施方式中,不同数据源的数据格式和/或存储方式可以不同,当然,也可以相同。任一数据源中的不同集成对象的种类可以相同或不同,如:某一数据源中的两个集成对象为:两个应用系统;而另一数据源中的两个集成对象为:一个应用系统和一个接口。
53.一般地,可以使用集成工具集成两个对象,此时该集成工具就可以记录这两个对象的集成关系。因此在一种具体实施方式中,获取不同类型的多个数据源,包括:从不同类型的集成工具中获取结构化的集成配置信息,并将获取到的集成配置信息作为多个数据源。此处所述的“不同类型”指:不同数据格式或不同存储方式。集成配置信息即:描述不同对象集成关系的信息。
54.s102、对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以
得到rdf数据。
55.需要说明的是,由于知识图谱中的数据通常为三元组格式,因此为了将数据以知识图谱的形式记录,首先需要将相关数据转换为rdf三元组格式的rdf数据,以统一数据。
56.具体的,三元组格式可参见表1所示,表1也称为三元表。
57.表1
58.主语谓语宾语系统:人力资源管理系统主管职员:张三系统:人力资源管理系统归属部门组织部门:人力资源部
………………
59.其中,从各个数据源中抽取的知识即:需要在知识图谱中记录的数据。如:目标局域网中的应用系统、数据库、数据表、api或页面等,应用系统、数据库、数据表、api或页面分别对应的属性等,具体可参见图2。
60.图2示意了应用系统、数据库、数据表、api和页面之间的关系及其属性。此时,应用系统、数据库、数据表、api或页面可称为实体。针对此5类实体,每一类实体具有不同或相同的属性。例如:应用系统具有主管部门、应用系统名称、应用系统编码、应用系统访问地址等属性。数据库具有数据库类型、数据库版本、数据库地址等属性。针对其他实体应该有实体名称等属性。这里不再展开描述。其中,业务对象、主管职员、主管部门等属性是这5类实体所共有的。
61.知识图谱技术对需要在知识图谱中记录的数据、属性有相应的规范要求,因此需要对数据源中的数据进行相应转换。为了提高数据转换效率,可以对不同的数据源采用不同的转换方式。在一种具体实施方式中,对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据,包括:若任一数据源属于结构化库表(如:mysql关系型数据库表),则利用d2r工具将该数据源中的数据直接映射为rdf数据,以实现快速转换;若任一数据源不属于结构化库表,则需要由用户手动从该数据源中抽取知识,之后将所抽取的知识以rdf三元组格式记录,得到rdf数据。
62.其中,利用d2r工具将该数据源中的数据直接映射为rdf数据,包括:利用d2r工具将该数据源中的表映射为rdf类,将表的列映射为rdf属性,将表的行映射为资源,将表中单元格的值映射为文字值,并以rdf三元组格式记录所有映射结果,得到rdf数据。其中,将表中单元格的值映射为文字值,包括:若表中单元格的值对应外键,则将表中单元格的值映射为外键指向的资源。
63.在一种具体实施方式中,d2r工具可以为d2rq、triplify、d2rserver或openlink等。
64.s103、基于知识融合技术将rdf数据融合并转换为rdf图后,可视化展示rdf图。
65.rdf图可参照图3,有图3可看出:不同系统之间的集成关系、某一系统与某一接口之间的集成关系等等。可见,rdf图能够明确且细致地展现一个局域网内应用系统、数据库、数据表、api或页面之间的关系,当需要更改它们之间的关系时,可以基于rdf图明确更改之前和更改之后的状态,有利于维护和管理。知识融合技术是知识图谱技术中的一部分。
66.本实施例能够以某一局域网内包括多个对象集成关系的、不同类型的数据源作为图谱的知识来源,汇总了该局域网内全面的集成关系,后续对每个数据源进行知识抽取,并
按照rdf三元组格式记录抽取到的知识,以得到rdf数据;基于知识融合技术将rdf数据融合并转换为rdf图后,可视化展示rdf图,使得该rdf图能够展示该局域网内应用系统、数据库、数据表、api或页面之间的关系,这些对象之间的关系可基于rdf图明确且细致地展现。也即:本技术得到的rdf图明确记录有局域网内的各系统、各接口等对象之间的集成关系,基于此rdf图可实现这些对象集成关系的统一管理和维护。
67.参见图4所示,本技术实施例公开了另一种信息集成方案,包括:本体模型构建、确定知识来源、知识抽取、知识存储等步骤。
68.1、首先根据局域网内的对象集成需要,确定知识图谱本体模型。即:确定集成对象有哪些。
69.如图2所示,对象集成主要存在三种方式:应用系统间集成、库表间集成、应用接口api集成、页面集成。所以可有应用系统、数据库、数据表、api、页面共5类实体。如图2所示,应用系统、数据库、数据表、api、页面这5类实体共有属性:业务对象、主管职员、主管部门。当然,各个实体还有自己独有的属性,具体可参照上文相关介绍。
70.2、将各种集成工具中的结构化集成配置信息作为知识来源。
71.3、知识抽取。
72.针对不具备特定数据结构的文档等数据源,由用户手动从该类数据源中进行知识抽取,并使用三元表的形式记录抽取所得的知识。
73.针对结构化库表类的数据源,通过d2r工具直接将表中数据转换为rdf数据。
74.直接映射规则包括:将数据库中的表映射为rdf类;将数据库中表的列映射为rdf属性,数据库表中每一行映射为一个资源或实体,并创建iri;将数据库表中每一个单元格的值映射为一个文字值,如果单元格的值对应一个外键,则将其替换为外键指向的资源或实体的iri。
75.4、对第3步所得rdf数据进行知识融合,并生成rdf图进行存储。
76.rdf图可参照图3,由图3可看出:不同系统之间的集成关系、某一系统与某一接口之间的集成关系等等。可见,rdf图能够明确且细致地展现一个局域网内应用系统、数据库、数据表、api或页面之间的关系,当需要更改它们之间的关系时,可以基于rdf图明确更改之前和更改之后的状态,有利于维护和管理。
77.基于rdf图,可以方便对企业局域网内的对象进行完整、及时且有效地管理。若某些数据源中的集成关系有更改,则可以重新生成rdf图,集成时效性将显著增加。且任一集成关系或集成对象的更改,都可以由rdf图明确展现,因此相应影响范围和影响强度可以进行预判。
78.可见,本实施例可以基于知识融合技术对企业局域网内的对象进行集成管理,将散落在各个系统中的、以不同形式存储的企业集成关系进行汇总,统一存储、统一管理,解决了以往集成关系无法管理的问题,并通过多数据源支持,真正实现不同部门之间集成数据的互联互通,还可以将不同数据源的不同数据格式、不同数据存储方式都转换为统一的rdf数据,解决了不同数据源的管理困难问题。通过构建完整的集成关系集成图谱,随时掌握企业内各种对象集成关系的集成现状,及时进行风险管控。同时以图的方式来展示、管理对象及其关系,为后继深入分析提供了可能。
79.下面对本技术实施例提供的一种信息集成装置进行介绍,下文描述的一种信息集
成装置与上文描述的一种信息集成方法可以相互参照。
80.参见图5所示,本技术实施例公开了一种信息集成装置,包括:
81.获取模块501,用于获取不同类型的多个数据源;任一数据源包括至少两个对象的集成关系,所述对象为目标局域网中的应用系统、数据库、数据表、api或页面;
82.记录模块502,用于对每个数据源进行知识抽取,并按照rdf三元组格式记录抽取到的知识,以得到rdf数据;
83.集成模块503,用于基于知识融合技术将rdf数据融合并转换为rdf图后,可视化展示rdf图。
84.在一种具体实施方式中,获取模块具体用于:
85.从不同类型的集成工具中获取结构化的集成配置信息,并将获取到的集成配置信息作为多个数据源。
86.在一种具体实施方式中,不同数据源的数据格式和/或存储方式不同。
87.在一种具体实施方式中,记录模块包括:
88.映射单元,用于若任一数据源属于结构化库表,则利用d2r工具将该数据源中的数据直接映射为rdf数据;
89.记录单元,用于若任一数据源不属于结构化库表,则将用户从该数据源中抽取的知识以rdf三元组格式记录,得到rdf数据。
90.在一种具体实施方式中,映射单元具体用于:
91.利用d2r工具将该数据源中的表映射为rdf类,将表的列映射为rdf属性,将表的行映射为资源,将表中单元格的值映射为文字值,并以rdf三元组格式记录所有映射结果,得到rdf数据。
92.在一种具体实施方式中,映射单元具体用于:
93.若表中单元格的值对应外键,则将表中单元格的值映射为外键指向的资源。
94.在一种具体实施方式中,d2r工具为d2rq、triplify、d2rserver或openlink。
95.其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
96.可见,本实施例提供了一种信息集成装置,该装置得到的rdf图明确记录有局域网内的各系统、各接口等对象之间的集成关系,基于此rdf图可实现这些对象集成关系的统一管理和维护。
97.下面对本技术实施例提供的一种电子设备进行介绍,下文描述的一种电子设备与上文描述的一种信息集成方法及装置可以相互参照。
98.参见图6所示,本技术实施例公开了一种电子设备,包括:
99.存储器601,用于保存计算机程序;
100.处理器602,用于执行所述计算机程序,以实现上述任意实施例公开的方法。
101.下面对本技术实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种信息集成方法、装置及设备可以相互参照。
102.一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的信息集成方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
103.本技术涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。
104.需要说明的是,在本技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本技术要求的保护范围之内。
105.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
106.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的可读存储介质中。
107.本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献