一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种人机友好的数据逻辑融合电力知识图谱及其构建方法与流程

2022-02-25 22:00:15 来源:中国专利 TAG:


1.本发明属于电力技术领域,具体涉及一种人机友好的数据逻辑融合电力知识图谱及其构建方法。


背景技术:

2.随着互联网、物联网、云计算等技术的发展,电力领域也进入了“大数据时代”,积累了大量的原始数据和电力知识。如何有效地利用电力领域中存在的海量数据和知识,提高电力信息的利用率,是未来电力系统智能化的重要研究方向。
3.知识图谱最初是在2012年由google所提出的概念,它最初的目的是为了使搜索引擎具备一定推理能力,增强搜索引擎的效果。其本质是一种结构化的语义知识库,用来描述物理世界中的概念、实体以及它们之间的关系。这种对于知识的结构化可以看作是对人理解知识的一种模拟,因此知识图谱具备一定的推理能力,可以很好地辅助人类进行决策。将知识图谱与电力领域相结合,对大规模电力知识进行结构化管理,可以有效串联起电力领域中的零散知识,更好的形成电力知识体系。
4.然而,现有的电力知识图谱存在着一定缺陷,即传统知识图谱中的“实体-关系-实体”此类核心型知识无法对电力领域中的逻辑知识进行刻画,例如故障处置一般性原则、n-1安全校核流程、负荷预测模型等电力逻辑知识均无法被传统的电力知识图谱所容纳。同时,由于核心型知识具有高度的概念性,很难与电力系统底层数据相互关联,达到一个知识-数据联合建模的目的。
5.基于以上分析,亟需对传统知识图谱模型加以改进,建立一个融合有逻辑信息的电力知识图谱。


技术实现要素:

6.为解决传统电力知识图谱中存在的问题,本发明的目的在于提供一种人机友好的数据逻辑融合电力知识图谱及其构建方法。本发明中提出的由物理信息库、外界因素库和电力知识库构成的电力知识图谱,可以以一种统一的范式对电力领域的相关数据或知识进行有效组织。同时,本发明所设计的逻辑节点及其构建方法,可以有效地对电力领域中已有的大量逻辑信息进行描述与提取,是电力知识的重要补充。经过逻辑-数据关联与图谱更新,最终构建起数据逻辑融合的电力知识图谱。
7.为实现上述目的,本发明采用如下技术方案:
8.一种人机友好的数据逻辑融合电力知识图谱的构建方法,包括以下过程:
9.将电力领域的相关数据和知识划分为物理信息数据、外界因素数据和电力知识数据;
10.对所述物理信息数据通过数据清洗与整合,构建得到物理信息库;
11.对所述外界因素数据通过数据清洗与整合,构建得到外界因素库;
12.对所述电力知识数据进行核心型知识抽取,得到核心型知识;
13.对所述电力知识数据进行逻辑型知识抽取,得到逻辑型知识,所述逻辑型知识为三元组(实体,目的,逻辑方法);
14.对核心型知识和逻辑型知识进行知识融合,得到电力知识库;
15.基于所述物理信息库、外界因素库以及电力知识库,通过数据库方式建立面向机器存取的数据知识接口;
16.针对所述物理信息库、外界因素库和电力知识库进行逻辑-数据关联,得到数据逻辑融合的电力知识图谱;
17.基于所述数据逻辑融合的电力知识图谱,建立面向人类存取和理解的数据知识接口,得到所述人机友好的数据逻辑融合电力知识图谱。
18.优选的,将电力领域的相关数据和知识根据物理属性、包含内容和应用意义的不同划分为物理信息数据、外界因素数据和电力知识数据;
19.其中,物理信息数据是指与电网物理状态本身相关的数据,包括电气设备参数、网架结构和电网稳态信息;
20.外界因素数据是指与电网物理本体密切相关的外界环境信息,包括气象监测数据、负荷预测数据和检修计划;
21.电力知识数据是指能够辅助调度员进行逻辑决策或者信息归纳的知识类数据,包括数学物理方程、电力百科网页、调度预案和运行方式报告。
22.优选的,对所述物理信息数据通过数据清洗与整合以及对所述外界因素数据通过数据清洗与整合时:
23.清洗的过程均包括一致化处理、缺失值和无效值处理以及异常值处理;
24.整合时,对经过清洗后的多方数据进行数据整合处理,并使用mysql关系型数据进行存储,完成物理信息库和外界因素库的构建与存储。
25.优选的,对所述电力知识数据进行核心型知识抽取,得到核心型知识时:
26.通过对电力知识数据进行实体抽取和关系抽取,定义核心型知识为具体物理对象及具体物理属性或者状态,对应相关实体或者关系,得到核心型知识;
27.对所述电力知识数据进行逻辑型知识抽取,得到逻辑型知识时:
28.定义逻辑型知识为推理、计算和操作逻辑演化行为,通过概念关联、逻辑构建,抽取出电力知识数据所包含的逻辑型知识。
29.优选的:所述实体抽取的过程包括:根据电力系统的专业知识构建电力专业词典,基于电力专业词典对电力知识文本进行实体匹配;利用深度学习模型自动抽取剩余电力实体;
30.关系抽取的过程包括:使用开放域关系抽取方法,随后筛选出其中质量较高的关系,得到初步关系集合;将初步关系集合与限定域关系抽取结果进行合并;
31.概念关联是将目标抽取逻辑方法划分为所属核心实体下,并确定其逻辑意图;
32.逻辑构建是对原始电力逻辑进行深层次分析,并通过编程语言实现原始电力逻辑完整逻辑步骤。
33.优选的,针对所述物理信息库、外界因素库和电力知识库进行逻辑-数据关联,得到数据逻辑融合的电力知识图谱时:
34.在所构建的逻辑代码中对该逻辑执行所需的物理信息数据或者外界因素数据进
行具体数据调用,实现电力知识库与物理信息库或外界因素库的链接,得到数据逻辑融合的电力知识图谱。
35.优选的,基于所述物理信息库、外界因素库以及电力知识库,通过数据库方式建立面向机器存取的数据知识接口时,通过mysql关系数据库、hbase非关系数据库以及neo4j图数据库结合的方式,存储结构数据、非结构数据和图数据,建立面向机器存取的数据知识接口。
36.优选的,基于所述数据逻辑融合的电力知识图谱,通过文字简报、图可视化和图上推理方法,建立面向人类存取和理解的数据知识接口。
37.优选的,本发明人机友好的数据逻辑融合电力知识图谱的构建方法还包括对所述电力知识图谱的更新,更新时,将新获取的电力领域的相关数据和知识划分为物理信息数据、外界因素数据和电力知识数据,利用新的物理信息数据、外界因素数据和电力知识数据对所述电力知识图谱进行更新;
38.利用新的物理信息数据、外界因素数据和电力知识数据对所述电力知识图谱进行更新时:
39.在图谱更新过程中,采用数据逻辑融合的电力知识图谱的各子成分设计与之相适应的更新策略进行更新,具体的:
40.对于电力知识库数据,当原有知识发生变更或者新知识产生时进行更新,更新的内容包含本体层更新与数据层更新,本体层的更新包含本体更新、属性更新及上下位关系的更新;数据层的更新包含核心型知识更新和逻辑型知识更新,更新时以增量更新的形式进行;所述本体层为对所述电力知识库进行加工得到;
41.对于物理信息库,更新时按照其所包含数据的更新频率对该部分数据进行局部更新;
42.对于外界因素库,在电力知识库中的逻辑节点对其进行数据调用时,对外界因素库进行更新。
43.本发明还提供了一种人机友好的数据逻辑融合电力知识图谱,该人机友好的数据逻辑融合电力知识图谱通过本发明如上所述的构建方法得到。
44.本发明还提供了一种人机友好的数据逻辑融合电力知识图谱的构建系统,包括:
45.数据划分模块:用于将电力领域的相关数据和知识划分为物理信息数据、外界因素数据和电力知识数据;
46.物理信息库建立模块:用于对所述物理信息数据通过数据清洗与整合,构建得到物理信息库;
47.外界因素库简建立模块:用于对所述外界因素数据通过数据清洗与整合,构建得到外界因素库;
48.核心型知识抽取模块:用于对所述电力知识数据进行核心型知识抽取,得到核心型知识;
49.逻辑型知识抽取模块:用于对所述电力知识数据进行逻辑型知识抽取,得到逻辑型知识,所述逻辑型知识为三元组(实体,目的,逻辑方法);
50.电力知识库建立模块:用于对核心型知识和逻辑型知识进行知识融合,构建得到电力知识库;
51.面向机器存取的数据知识接口建立模块:用于基于所述物理信息库、外界因素库以及电力知识库,通过数据库方式建立面向机器存取的数据知识接口;
52.电力知识图谱建立模块:用于针对所述物理信息库、外界因素库和电力知识库进行逻辑-数据关联,得到数据逻辑融合的电力知识图谱;
53.面向人类存取和理解的数据知识接口建立模块:基于所述数据逻辑融合的电力知识图谱,建立面向人类存取和理解的数据知识接口,得到所述人机友好的数据逻辑融合电力知识图谱。
54.相对于现有技术,本发明具有以下有益效果:
55.本发明中提出的由物理信息库、外界因素库和电力知识库构成的电力知识图谱,可以以一种统一的范式对电力领域的相关数据或知识进行有效组织。同时,本发明所设计的逻辑节点及其构建方法,可以有效地对电力领域中已有的大量逻辑信息进行描述与提取,是电力知识的重要补充。经过逻辑-数据关联与图谱更新,最终构建起数据逻辑融合的电力知识图谱。
附图说明
56.图1是本发明实施例中人机友好的数据逻辑融合电力知识图谱的示意图;
57.图2是本发明实施例中人机友好的数据逻辑融合电力知识图谱构建方法的示意图;
58.图3是本发明实施例中所构建的人机友好的数据逻辑融合电力知识图谱局部示意图。
具体实施方式
59.下面结合附图和实例对本发明的具体实施方式作进一步详细描写。以下实施用于解释本发明,但不用来限制本发明的范围。
60.本发明提出由物理信息库、外界因素库和电力知识库三部分组成的电力知识图谱,对电力领域的数据及知识进行描述与组织,使得电力知识与底层数据有机结合,为知识和数据的联合应用提供了基础。提出了逻辑型知识的建模方式,设计了相应逻辑节点的构建方法,并将此类知识与核心型知识相融合,有效地扩展了传统电力知识图谱的知识覆盖范围。
61.如图1所示,本发明数据逻辑融合的电力知识图谱包括物理信息库、外界因素库、电力知识库及对应的本体层。
62.如图2所示,本发明数据逻辑融合的电力知识图谱的构建方法,包括以下步骤:
63.步骤1:对电力领域的相关数据和知识,根据物理属性、包含内容、应用意义的不同划分为:物理信息数据、外界因素数据和电力知识数据。物理信息数据是指与电网物理状态本身相关的数据,包括电气设备参数和电网稳态信息。外界因素数据是指与电网物理本体密切相关的外界环境信息,包括气象监测数据、负荷预测数据和检修计划。电力知识数据是指可以辅助调度员进行逻辑决策或者信息归纳的知识类数据,包括电力百科网页、调度预案、运行方式报告和电力领域论文。
64.步骤2:针对步骤1所得的物理信息数据和外界因素数据,通过数据清洗与整合,完
成物理信息库和外界因素库的构建。
65.数据清洗的具体流程包括一致化处理、缺失值和无效值处理、异常值处理。
66.一致化处理需要对某些采集标准不一致或命名规则不一致的数据源进行标准化和一致性检验。缺失值和无效值的处理包括删除、均值填补和热卡填补这些方法,异常值的处理有简单统计分析、3σ原则和箱线图这些方法。
67.对经过清洗后的多方数据进行数据整合处理,并使用mysql关系型数据进行存储,完成物理信息库和外界因素库的构建与存储。
68.步骤3:针对步骤1所得的电力知识数据,进行核心型知识抽取和逻辑型知识抽取。首先通过对电力知识数据进行实体抽取、关系抽取,得到核心型知识,同时,通过概念关联、逻辑构建,抽取出数据源所包含的逻辑型知识。
69.具体的,实体抽取包含如下两步:
70.①
根据电力系统的专业知识构建电力专业词典,使用电力专业词典对电力知识文本进行实体匹配。
71.②
利用如bert的深度学习模型自动抽取剩余电力实体。
72.关系抽取包含如下两步:
73.①
使用开放域关系抽取技术,随后人工筛选出其中质量较高的关系,得到初步关系集合。
74.②
将初步关系集合与限定域关系抽取结果进行合并。
75.逻辑抽取是在领域专家的参与下,通过包含概念关联和逻辑构建的步骤,实现对电力知识源中的逻辑型知识的提取。
76.本发明创新性地通过三元组(实体,目的,逻辑方法)来对电力调度领域中的逻辑型知识进行建模,因此逻辑节点可以被描述为该实体概念下面对应某种目的的逻辑方法实现。逻辑型知识,例如不同故障类型的一般性处置策略或电网稳定分析方法,是对传统知识图谱中知识类型的扩充与丰富,可以更好地对电力专业知识进行描述与刻画。
77.概念关联是将目标抽取逻辑方法划分为所属核心实体下,并确定其逻辑意图,即实体节点与逻辑节点之间的边。
78.逻辑构建则是在领域专家的参与下对原始电力逻辑进行深层次分析,并通过编程语言实现其完整逻辑步骤,封装好的逻辑可以设置传入参数类型并返回执行结果,是对逻辑方法的具体工程实现。在具体的逻辑构建过程中,可以通过先前构建好的子逻辑节点进行调用从而减少逻辑的重复构建,降低电力知识库中逻辑型知识的冗余性。
79.步骤4:针对步骤3所得的核心型知识和逻辑型知识,进行知识融合与加工,完成电力知识库的构建。
80.知识融合包含两步骤:实体链接与知识合并。
81.在实体链接过程中,依靠人工筛选方法将不同文本所提取出的具有相同指代含义的关键词链接到同一实体,以防止知识图谱出现歧义现象。在知识合并过程中,对所提取的不同关系形式进行统一化处理,以解决电力知识库中知识冗余与扁平化问题。
82.在知识加工过程中,使用本体对知识库中的海量实例知识进行形式化的定义与抽象,形成本体层。本发明所设计的数据逻辑融合的电力知识图谱本体类型复杂,不仅包括核心型知识本体,例如增加发电机出力等调度操作指令本体及过载以及失稳电网或设备状态
本体,也包含逻辑型知识本体,例如故障处置逻辑本体。
83.将经过知识融合与加工后的知识存入neo4j图数据库,完成电力知识库的构建。
84.步骤5:结合步骤2构建的物理信息库和外界因素库,以及步骤4构建的电力知识库,通过数据库方式建立面向机器存取的数据知识接口;具体的:通过mysql关系数据库、hbase非关系数据库、neo4j图数据库结合的方式,存储结构数据、非结构数据和图数据,建立面向机器存取的数据知识接口;
85.步骤6:针对步骤2、步骤4所得的物理信息库、外界因素库和电力知识库进行逻辑-数据关联,得到数据逻辑融合的电力知识图谱。
86.逻辑-数据关联是指在所构建的逻辑代码中对该逻辑执行所需的物理信息数据或者外界因素数据进行具体数据调用,以此实现电力知识库与物理信息库或外界因素库的链接。
87.经过逻辑-数据关联后,电力知识库、物理信息库和外界因素库共同构成了最终的数据逻辑融合的电力知识图谱,是对电力相关领域从底层数据到知识的全面建模。
88.步骤7:基于步骤6构建的电力知识图谱,通过文字简报、图可视化和图上推理方法,建立面向人类存取和理解的数据知识接口。
89.步骤8:针对步骤1、步骤6得到的三种数据(知识)源和电力知识图谱,进行图谱更新。在图谱更新过程中,本发明为数据逻辑融合的电力知识图谱的各子成分设计与之相适应的更新策略,以减少更新成本。
90.具体的,电力知识库数据来源于各类电力文本,其所包含的知识具有长期性和稳定性特点,一般不更新,只有在原有知识发生变更或者新知识产生是进行更新,更新的内容包含本体层更新与数据层更新。本体层的更新步骤包含本体更新、属性更新及上下位关系的更新,通常采用如人工定义规则和人工处理冲突这些人工参与的方式进行更新。数据层的更新包含核心型知识更新和逻辑型知识更新,通常以增量更新的形式进行。
91.物理信息库的更新需要按照其所包含数据的更新频率对该部分数据进行局部更新,以减少更新所消耗资源,例如按照系统上报频率更新物理信息库中的潮流监测信息。
92.由于外界因素数据成分复杂且存在部分数据为电力机构向其他运营单位主动获取的现象,外界因素库的更新发生在电力知识库中的逻辑节点对其进行数据调用时,即在数据发生调用操作时主动更新。
93.以“赵峰,孙宏斌,and张伯明,基于电气分区的输电断面及其自动发现.电力系统自动化,2011.35(05):p.42-46 81.”论文作为电力知识源为例,所构建的数据逻辑融合的电力知识图谱局部示意图如图3所示。
94.在电力知识图谱实际应用时,电力从业人员可以对其进行可视化、智能检索以及知识推理,从而辅助工作人员快速理解复杂的电力知识或获取所需的相关数据,以有效提高其工作效率。
95.综上可以看出,本发明对电力领域相关数据(知识)源按划分为:物理信息数据、外界因素数据和电力知识数据;对于物理信息数据和外界因素数据,通过数据清洗与整合,完成物理信息库和外界因素库的构建;对于电力知识数据,首先进行核心型知识和逻辑型知识抽取,然后进行知识融合与加工,完成电力知识库的构建;通过mysql关系数据库、hbase非关系数据库、neo4j图数据库结合的方式,存储结构数据、非结构数据和图数据,建立面向
机器存取的数据知识接口;通过逻辑-数据关联,得到数据逻辑融合的电力知识图谱;基于电力知识图谱,通过文字简报、图可视化和图上推理方法,建立面向人类存取和理解的数据知识接口;针对不同数据(知识)源,采用特殊设计的更新策略进行图谱更新。本发明首次提出的由物理信息库、外界因素库和电力知识库构成的电力知识图谱,可以以一种统一的范式对电力领域的相关数据或知识进行有效组织。同时,本发明还创造性地设计了逻辑节点及其构建方法,可以有效地对电力领域中已有的大量逻辑信息进行描述与提取,是电力知识的重要补充。本发明所提出的人机友好的数据逻辑融合电力知识图谱及其构建方法,是知识图谱与关系型及非关系型数据库的有机结合,也是事实型(核心型)知识与逻辑知识的自然链接,在电力领域可视化、智能检索和知识推理等方向具有较高的应用价值,同时兼备领域迁移性。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献