一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于设备运行特征的电网监控知识图谱构建方法与流程

2023-02-18 23:36:24 来源:中国专利 TAG:


1.本发明涉及电力系统运行调度设备监控技术领域,尤其涉及一种基于设备运行特征的电网监控知识图谱构建方法。


背景技术:

2.随着智能电网建设的不断推进及对电力系统安全稳定运行的要求越来越高,对电力设备状态监测的广度和深度不断扩大。状态监测数据量大,来源多,可能有多个变量对同一状态特征进行描述,部分状态属性之间存在着冗余。从众多设备状态监测指标中提取最能反映设备状态的关键指标参量,删除无用、重复的状态指标,可以有效地降低设备状态分析的难度,提高监测数据处理效率。
3.为提高数据检索、数据管理、数据分析效率,基于标签技术开展电力业务数据辨识、数据治理、数据加工,相较于传统数据存储和治理模式,标签系统具备速度快、灵活性高、针对性强的特点,当整个数据架构越复杂,越是需要多个计算存储资源组合使用的场景下,标签系统的价值就越为明显。构建标签体系的良好基础是建立在对现有业务的精准把控上,因此,首先要通过梳理自身业务的需求,并根据需求来定制化的构建相应的标签,最终构建属于自身的标签体系。可以说,标签是来源于业务目标的,是服务于业务应用。
4.近年来,知识图谱作为人工智能技术分支“知识工程”在大数据环境中的成功应用,在国内外各领域已经引起广泛关注,知识图谱与深度学习方法的结合,也成为了推动互联网和人工智能发展的核心驱动力之一。通过深度融合人工智能技术,利用其在数据驱动、主动推理、人机融合、群体智能方面的优势,可实现电网调控海量信息快速处理,提升对复杂大电网特性和规律的认知能力,提高电网运行控制的智能化水平,具有广阔的应用前景,能更好地应对电网发展新形势带来的新挑战。
5.目前,知识图谱技术尚未在电网集中监控业务领域中有所涉及和应用。


技术实现要素:

6.本发明的目的是提供一种基于设备运行特征的电网监控知识图谱构建方法,从而提升设备运行状态风险分析能力。
7.为实现本发明的目的,本发明提供的技术方案如下:
8.本发明提供了一种基于设备运行特征的电网监控知识图谱构建方法,包括如下步骤:
9.步骤1:梳理电网监控业务需求,以电网关键设备为切入点,结合电网调度、设备部数据现状,分析数据范围,包含设备模型信息、运行监测信息、设备管理信息、检修试验信息、外部环境信息等共5大类数据,并根据数据确定影响设备运行状态的数据类型。
10.设备模型信息包括设备名称、电压等级、投运日期、退役日期、设备类型、设备型号、设备运行时间、额定电流、额定电压、额定容量、额定频率、空载电流、空载损耗、阻抗电压、负载损耗、温升和冷却方式等;
11.运行监测信息包括告警阈值、告警信号、告警次数、设备异常情况、越限情况、重过载情况、保护动作、电压、电流、负荷、频率、故障录波、油色谱等;
12.设备管理信息包括操作票编号、操作任务、操作顺序、发令人、受令人、操作人、监护人、操作时间、操作内容、设备缺陷次数、缺陷时间、缺陷原因、监控日志等;
13.检修试验信息包括设备试验报告(地理位置、现场图片、相关联系统中的设备信息等)、故障次数、故障时间、故障原因、检修内容、检修结果等;外部环境信息包括气温、降雨、雷电等。
14.将以上数据作为输入,通过业务分析和监督学习的人为特征标记,构建设备运行特征标签体系,完成特征提取,实现对设备状态关键特征的挖掘。
15.具体步骤为,
16.(1)分析设备运行状态业务需求,梳理状态分析关键数据;
17.(2)通过监督学习方法对相关数据类型进行人为标记;
18.(3)对这些离散的多维标签汇总并存储至数据标签中心。
19.具体的,数据标签中心包括与设备运行状态相关的数据类型和关键信息。
20.步骤2,从结构化、非结构化数据中抽取出知识实体、实体关系以及实体属性,形成事实表达,为上层模式层的构建奠定基础。
21.具体的,知识图谱采用自底向上的构建方法,从数据标签中心中提取实体、属性和关系,加入到知识图谱的数据层,然后将这些知识要素进行归纳组织,逐步往上抽象为概念,最后形成模式层。
22.模式层是知识图谱的概念模型和逻辑基础,对数据层进行规范约束,采用本体作为知识图谱的模式层,借助本体定义的规则和公理约束知识图谱的数据层。
23.数据层是以“实体-关系-实体”或“实体-属性-属性值”的三元组存储,形成一个图状知识库。
24.具体的,非结构化数据主要包括缺陷描述、检修记录、巡视记录、试验报告等,以文本形式存在,采用自然语言方法对其进行处理,转化为结构化数据再进行抽取。
25.转化的具体方法为,
26.(1)结合监控业务需求构建机器词典;
27.(2)通过基于字符串匹配的分词方法对文本数据进行分词;
28.(3)按照正向最大匹配法,将待分析的字符串与机器词典中的词条进行匹配;
29.(4)在词典中加入近义词、同义词规则,对语义相近的词汇进行歧义消除,得到最优的分词结果。
30.正向最大匹配法原则为,将文本信息从左向右扫描,遇到词典中的词就标识出来,遇到复合词找最长的词匹配,遇到不认识的字串就分割为单字词。
31.知识抽取包括实体抽取、关系抽取和属性抽取。
32.实体抽取,是指从数据集中自动识别出命名实体。
33.关系抽取,是指从数据集中提取出实体之间的关联关系。
34.属性抽取,是指从数据集中采集特定实体的属性信息。
35.具体的,实体和属性抽取由词典得到,并且由于电网监控业务知识图谱属于专业领域图谱,故通过标签根据业务给定关联关系。
36.步骤3:将来自不同知识源的知识在同一框架规范下进行异构数据整合加工,基于neo4j图数据库进行知识存储,形成高质量的监控业务知识库。
37.具体的,本发明基于电力系统建立原则,以设备为中心,通过主外键关联、设备编码对应等方式得到不同数据间关联关系,形成知识融合。
38.neo4j是一个高性能的图数据库,它将结构化数据存储在图形中。
39.步骤4:对电网监控知识图谱进行动态更新。
40.更新分为两个方面,包括知识图谱的逻辑结构和更新方式。
41.根据知识图谱的逻辑结构,知识图谱的更新可分为模式层更新和数据层更新。
42.具体的,模式层更新是指本体中元素的更新,包括概念的增加、修改、删除,概念属性的更新以及概念之间关系的更新等。结合业务通过人工定义规则,人工处理冲突,一般只在有需要时实施。
43.具体的,数据层更新指的是实体元素的更新,包括实体以及实体间关系和属性值的增加、修改、删除,通过知识抽取即可完成。
44.根据更新的方式,知识图谱的更新可分为增量更新和完全更新。本发明采用增量更新。
45.具体的,增量更新是指以数据集发布出的更新数据为基础对知识图谱进行部分更新,通过触发式方法,当数据库中有新数据时自动更新图谱。
46.与现有技术相比,本发明的有益效果如下:
47.本发明提供了一种基于设备运行特征的电网监控知识图谱构建方法,首先,通过梳理影响设备状态的多源数据,提取影响设备运行状态的关键数据;其次,从结构化、非结构化数据中抽取出知识实体、实体关系以及实体属性,形成事实表达,构建模式层;再者,将来自不同知识源的知识在同一框架规范下进行异构数据整合加工,基于neo4j图数据库进行知识存储,形成高质量的监控业务知识库;最后,对电网监控知识图谱进行模式层和数据层的增量更新。通过构建基于设备运行特征的电网监控知识图谱,辅助监控管理人员及其他领域人员及时掌握设备运行情况,为设备健康状态综合分析提供依据和数据支撑。
48.使用本发明,通过梳理和融合电网设备模型数据、运行数据、气象数据等结构化和非结构化数据,形成以设备为核心的图知识库,基于neo4j的图数据库存储模式,为设备监控知识的存储和管理提供了一种新思路。同时,通过深入挖掘知识的特征信息和隐含关系,最终实现集中监控知识图谱的深度学习和自我完善,可有效提升监控业务信息的检索效率。基于该知识图谱,可实现对变压器及开关等关键设备运行状态评价,辅助监控管理及其他人员及时掌握设备运行情况,为设备健康状态综合分析提供依据和数据支撑。
附图说明
49.图1为本技术提供的一种基于设备运行特征的电网监控知识图谱构建方法的流程示意图;
50.图2为本技术提供的一种基于设备运行特征的电网监控知识图谱构建方法具体实施例的流程示意图。
具体实施方式
51.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
52.以下结合附图和具体实施例对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
53.主要思想:
54.本发明将利用机器学习技术对关键设备运行特征标签进行提取,深入挖掘知识间的关联关系和特征信息;同时构建以电网关键设备为核心的监控知识图谱体系,通过对调控云、oms、pms等系统数据和气象、环境等外部数据的整合、提取,打通设备数据和监控数据之间的壁垒,实现多源数据在线采集、分析的同时,有效将其关联融合,形成专业知识。通过本研究,形成基于设备运行特征标签的电网监控知识图谱,辅助监控管理人员及其他领域人员及时掌握设备运行情况,为设备健康状态综合分析提供依据和数据支撑。所述设备运行特征是指,通过研究影响电网关键设备运行状态的多源数据,提取关键因素,挖掘关键特征进行实时分析。
55.本发明通过利用标签技术构建设备监控知识图谱,对设备运行状态进行监测,有利于辅助监控管理人员及其他领域人员及时掌握设备运行情况,为设备健康状态评估提供有力依据。
56.如图1所示,本实施例提供一种基于设备运行特征的电网监控知识图谱构建方法,包括:
57.首先,通过梳理影响设备状态的多源数据,提取相关数据的关键因素,确定影响设备运行状态的标签类型;
58.其次,从结构化、非结构化数据中抽取出知识实体、实体关系以及实体属性,形成事实表达,为上层模式层的构建奠定基础;
59.再者,将来自不同知识源的知识在同一框架规范下进行异构数据整合加工,基于neo4j图数据库进行知识存储,形成高质量的监控业务知识库;
60.最后,对电网监控知识图谱进行动态更新。
61.如图2所示,上述方法的具体步骤包括:
62.将电网监控知识图谱构建分为四个模块,包括特征提取模块、知识抽取模块、知识融合模块、知识更新模块。
63.具体的,标签特征提取模块是指,梳理电网监控业务需求,以电网关键设备为切入点,结合电网调度、设备部数据现状,分析数据范围,包含设备模型信息、运行监测信息、设备管理信息、检修试验信息、外部环境信息等共5大类数据。
64.设备模型信息包括设备名称、电压等级、投运日期、退役日期、设备类型、设备型号、设备运行时间、额定电流、额定电压、额定容量、额定频率、空载电流、空载损耗、阻抗电压、负载损耗、温升和冷却方式等;
65.运行监测信息包括告警阈值、告警信号、告警次数、设备异常情况、越限情况、重过载情况、保护动作、电压、电流、负荷、频率、故障录波、油色谱等;
66.设备管理信息包括操作票编号、操作任务、操作顺序、发令人、受令人、操作人、监护人、操作时间、操作内容、设备缺陷次数、缺陷时间、缺陷原因、监控日志等;
67.检修试验信息包括设备试验报告(地理位置、现场图片、相关联系统中的设备信息等)、故障次数、故障时间、故障原因、检修内容、检修结果等;
68.外部环境信息包括气温、降雨、雷电等。
69.将以上数据作为输入,通过业务分析和监督学习的人为特征标记,构建设备运行特征标签体系,完成特征提取,实现对设备状态关键特征的挖掘。具体步骤为:
70.(1)分析设备运行状态业务需求,梳理状态分析关键数据;
71.(2)通过监督学习方法对相关数据类型进行人为标记;
72.(3)对这些离散的多维标签汇总并存储至数据标签中心。
73.其中,数据标签中心包括与设备运行状态相关的数据类型和关键信息。如下表1所示。
74.表1
[0075][0076][0077]
知识抽取模块是指,从结构化、非结构化数据中抽取出知识实体、实体关系以及实体属性,形成事实表达,为上层模式层的构建奠定基础。
[0078]
知识图谱采用自底向上的构建方法,从数据标签中心中提取实体、属性和关系,加入到知识图谱的数据层,然后将这些知识要素进行归纳组织,逐步往上抽象为概念,最后形
成模式层。
[0079]
模式层是知识图谱的概念模型和逻辑基础,对数据层进行规范约束,多采用本体作为知识图谱的模式层,借助本体定义的规则和公理约束知识图谱的数据层。
[0080]
数据层是以“实体-关系-实体”或“实体-属性-属性值”的三元组存储,形成一个图状知识库。
[0081]
具体的,非结构化数据主要包括缺陷描述、检修记录、巡视记录、试验报告等,以文本形式存在,采用自然语言方法对其进行处理,转化为结构化数据再进行抽取。
[0082]
转化的具体方法为,
[0083]
(1)结合监控业务需求构建机器词典;
[0084]
(2)通过基于字符串匹配的分词方法对文本数据进行分词;
[0085]
(3)按照正向最大匹配法,将待分析的字符串与机器词典中的词条进行匹配;
[0086]
(4)在词典中加入近义词、同义词规则,对语义相近的词汇进行歧义消除,得到最优的分词结果。如下表2所示。
[0087]
表2
[0088][0089]
正向最大匹配法原则为,将文本信息从左向右扫描,遇到词典中的词就标识出来,遇到复合词找最长的词匹配,遇到不认识的字串就分割为单字词。
[0090]
知识抽取包括实体抽取、关系抽取和属性抽取。
[0091]
实体抽取,是指从数据集中自动识别出命名实体。
[0092]
关系抽取,是指从数据集中提取出实体之间的关联关系。
[0093]
属性抽取,是指从数据集中采集特定实体的属性信息。
[0094]
具体的,实体和属性抽取由词典得到,并且由于电网监控业务知识图谱属于专业领域图谱,故通过标签根据业务给定关联关系。
[0095]
具体的,知识融合模块是指,将来自不同知识源的知识在同一框架规范下进行异构数据整合加工,基于neo4j图数据库进行知识存储,形成高质量的监控业务知识库。
[0096]
具体的,本发明基于电力系统建立原则,以设备为中心,通过主外键关联、设备编码对应等方式得到不同数据间关联关系,形成知识融合。
[0097]
neo4j是一个高性能的图数据库,它将结构化数据存储在图形中。
[0098]
具体的,知识更新模块是指,对电网监控知识图谱进行动态更新。
[0099]
更新分为两个方面,包括知识图谱的逻辑结构和更新方式。
[0100]
根据知识图谱的逻辑结构,知识图谱的更新可分为模式层更新和数据层更新。
[0101]
具体的,模式层更新是指本体中元素的更新,包括概念的增加、修改、删除,概念属性的更新以及概念之间关系的更新等。结合业务通过人工定义规则,人工处理冲突,一般只在有需要时实施。
[0102]
具体的,数据层更新指的是实体元素的更新,包括实体以及实体间关系和属性值的增加、修改、删除,通过知识抽取即可完成。
[0103]
根据更新的方式,知识图谱的更新可分为增量更新和完全更新。本发明采用增量更新。
[0104]
具体的,增量更新是指以数据集发布出的更新数据为基础对知识图谱进行部分更新,通过触发式方法,当数据库中有新数据时自动更新图谱。
[0105]
上述提供的一种基于设备运行特征的电网监控知识图谱构建方法,针对电网监控多源数据,基于设备运行特征,建立动态更新的知识图谱库,辅助监控管理人员及其他领域人员及时掌握设备运行情况,为设备健康状态综合分析提供依据和数据支撑。
[0106]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
[0107]
需要说明的是,本技术中未详述的技术方案,采用公知技术。
[0108]
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献