一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于拓扑和业务特征点的检修申请结构化分析方法与流程

2022-03-16 16:45:33 来源:中国专利 TAG:


1.本发明属于电力调控技术领域,尤其是一种基于拓扑和业务特征点的检修申请结构化分析方法。


背景技术:

2.近年来,随着电网规模不断扩大、运行方式越来越复杂,调控运行管理的工作压力、精神压力越来越大,极度渴求云、大、物、移、智等新技术在电网调控运行管理过程中发挥更大的作用。随着电网的信息化水平越来越高,也给各种新技术的应用创造了一定的基础条件;然而,由于电力行业很多信息都是非结构化的文本数据,这些数据的自然语言处理、结构化解析成为了一项很重要的工作,也是难于处理的工作。
3.计划检修是调度运行管理过程中最主要的一项工作,其结构化处理尤为重要。有些地区的检修申请相关软件系统,通过管理手段,在检修申请的填报过程中,将停电设备等部分字段通过设备点选实现结构化;但是,对于各处室的批复意见这类对运行方式影响很大的数据,基本上都是直接填写文本。现在的检修申请结构化解析过程中,单纯的依靠对文本的分析,对部分内容进行结构化分析,分析的成功率、准确率存在较大的问题。因此,如何对检修申请进行全方位的结构化解析是目前迫切需要解决的问题。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,提供一种设计合理、准确可靠且效率高的基于拓扑和业务特征点的检修申请结构化分析方法。
5.本发明解决现有的技术问题是采取以下技术方案实现的:
6.一种基于拓扑和业务特征点的检修申请结构化分析方法,包括以下步骤:
7.步骤1、根据电力运行过程中的检修内容,建立检修申请对应的特征点知识库;
8.步骤2、对检修申请涉及到的停电范围进行提取或分析;
9.步骤3、基于检修内容对检修申请涉及的特征点进行分析;
10.步骤4、基于检修申请特征点及电网拓扑对可能的方式进行分析;
11.步骤5、结合可选方式对各处室意见进行结构化解析。
12.进一步,所述步骤1的具体实现方法包括以下步骤:
13.⑴
将检修申请按照操作任务要求,建立如下特征点:是否需要停电、是否需要停保护、保护是否需要测向量、是否需要核定相和是否停电倒负荷;
14.⑵
针对每类特征点,通过检修内容的常用描述,使用正则表达式建立特征点对应的辨识关键字语法,得出每个特征点对应的知识点,从而建立检修申请对应的特征点知识库。
15.进一步,所述特征点和知识点根据各地的检修申请业务特点进行补充、调整。
16.进一步,所述步骤2的具体实现方法包括以下步骤:
17.⑴
如果检修申请的停电范围本身是通过点选设备实现,点选的设备本身就是
d5000设备,则直接提取停电范围信息;
18.⑵
如果检修申请的停电范围本身是通过点选设备实现,点选的设备本身不是d5000设备,则通过建立两套模型设备之间的映射关系进行停电范围提取:通过设备类型、电压等级、所属厂站、设备编号这些特征点进行设备之间的映射匹配;
19.⑶
如果检修申请的停电范围是和设备没有关联的文本,则通过以下方法获取结构化的停电范围信息:提取厂站、电压等级信息,对待匹配的设备范围进行限定;对文本中设备类型进行标准化处理;对文本中的数字类文本进行标准化处理;根据设备类型的标识确定设备的类型,以及设备名称编号出现在文本中的位置;根据待匹配设备范围内设备名称编号进行匹配。
20.进一步,所述步骤3的具体实现方法包括以下步骤:
21.⑴
根据各地检修申请书写方式,建立检修申请内容断句标识符关键字;
22.⑵
将检修申请的工作内容进行断句,将一段文本分为若干段文本;
23.⑶
针对每一段文本,根据各个特征点的正则表达式语法,判断检修申请对应的特征点内容。
24.进一步,所述步骤4的具体实现方法包括以下步骤:
25.⑴
根据电网中设备之间的拓扑连接关系判断检修间隔对应的接线方式以及备选的操作设备;
26.⑵
根据电网中设备状态,对相关间隔对应的运行方式进行判断;
27.⑶
根据检修申请的特征点,自动分析可能的操作方式及内容;
28.⑷
根据拓扑,对检修设备、倒供过程中可能用到的设备进行分析、提取。
29.进一步,所述步骤

自动分析可能的操作方式及内容为:
30.⑴
是否需要停电:如果不需要停电,则不会涉及运行方式的调整;
31.⑵
是否需要停保护:如果需要停保护,则涉及到分析停保护的套别、型号;
32.⑶
保护是否需要测向量:如果需要测向量,则需要确定需要测向量的保护;
33.⑷
是否需要核定相:如果需要核定相,则需要确定核定相的地点;
34.⑸
是否停电倒负荷:如果是停电倒负荷,则需要先停电再通过其他路径送电;否则,需要先合环,再进行相应停电设备的解环操作。
35.进一步,所述步骤5的具体实现方法包括以下步骤:
36.⑴
对各处室的意见对应的文本内容,根据步骤3中建立的断句标识符关键字,将相应文本拆分为若干段文本;
37.⑵
针对每类特征点可能需要分析的具体知识点,建立相关知识点分析的规则库,相关分析过程使用关键字规则来实现;
38.⑶
根据上述的知识点分析规则库,对各处室意见进行结构化解析,使其能够对应到针对d5000设备的具体操作。
39.进一步,所述步骤5中的结构化解析是指对检修申请涉及到的检修设备、停电范围、各处室的调整要求进行结构化解析,将检修申请和d5000设备中相关设备的最终运行方式进行自动关联。
40.本发明的优点和积极效果是:
41.本发明根据电力数据的特点,对文本数据进行规范化处理,以消除不同的文本写
法造成的自然语言处理过程中造成的障碍;根据检修设备的接线方式、运行方式,结合从检修申请内容提取出来的工作特征点,可对文本内容的设备范围、分析内容进行限定、细化,便于采用具体的文本分析语法规则,对检修申请的各项内容进行有针对性的结构化解析,其主要处理过程为自动过程,可以大幅节约人力成本,提高工作效率。
附图说明
42.图1为本发明的分析方法流程图。
具体实施方式
43.以下结合附图对本发明实施例做进一步详述。
44.本发明的设计思想是:本发明基于电力系统d5000系统平台实现,其根据电力运行管理过程检修工作包含的内容,建立对于工作步骤有影响的特征点知识库;根据检修对象的接线方式、运行方式,对可选设备的范围进行设定;根据检修工作内容,对检修文本中包含的特征点进行自动筛选;根据包含的特征点,对要解析的知识点及具体语法进行汇总;结合预设的设备范围、待解析知识点语法列表,对检修工作内容(包括各处室的处置建议)进行结构化解析。
45.基于上述设计思想,本发明提出一种基于拓扑和业务特征点的检修申请结构化分析方法,如图1所示,包括:
46.步骤1、建立检修工作特征点模型。
47.根据检修工作可能包含的内容,分析对操作方式有影响的特征,形成检修工作的特征点模型,包括是否需要停电、是否需要停保护、保护是否需要测向量、是否需要核定相、是否停电倒负荷。这些特征点各地基本相同,根据一个地方的检修申请的历史数据,建立上述的特征点基础库;根据其他地方检修工作的内容,对基础库的内容进行补充,形成一个完整的检修工作特征点模型库。
48.步骤2、根据各地特点调整特征点辨识语法。
49.检修工作的每个特征点,需要根据检修内容进行解析判断。有些特征点在检修申请的编写过程中可能会已经通过结构化字段进行设置(比如针对“是否需要停电”特征点,有些地区已经通过专门的字段进行设置)。针对没有进行专门设置、需要通过文本进行结构化解析的特征点,需要建立相应特征点的辨识规则。这里需要利用正则表达式,根据各地不同的书写习惯建立对应的解析规则语法。
50.步骤3、形成检修工作特征点辨识知识库。
51.根据步骤2设置的内容,形成检修工作特征点辨识的知识库:
52.⑴
对于有明确字段进行标识的特征点,在知识库里面设置特征点对应数据库中的具体字段、字段的具体解析规则;
53.⑵
对于没有明确字段进行标识的特征点,将步骤2中设置的解析语法进行汇总,并和特征点进行对应。
54.步骤4、建立符合各类特征的检修申请相关知识点模型。
55.每类特征点,明确需要解析的内容,建立特征点对应知识点的模型库。以下表1是特征点对应知识点的模型库:
56.表1
[0057][0058]
以上特征点、特征点包含的知识点,需要根据各地的检修申请业务特点进行补充、调整。
[0059]
步骤5、建立各类特征点包含的知识点辨识知识库。
[0060]
针对每类知识点,建立辨识的规则库,便于后续进行相关知识的自动提取。知识点信息,有两类:
[0061]

对于需要进行“是/否”判断的知识点,根据必须包含的关键字、不能包含的关键字信息,设置正则表达式规则,进行是否判断;
[0062]

对于需要从文本中解析具体内容的知识点,需要设置具有位置关系的关键字组合,并设置待提取信息在文本中的位置,比如:对于“核定相位置”这一知识点,设置的其中一个辨识规则为“在{1}与{2}之间核相”,其中的“在、与、之间核相”是其中的关键字,并且是有位置关系的关键字,“{1}、{2}”是待提取信息的占位符,从具体的检修申请文本中对相关的信息进行提取。有可能需要从提取出来的信息中进一步分析,将相关信息和d5000的设备进行关联,通过文本解析关联设备的具体过程为:
[0063]

提取厂站、电压等级信息,对待匹配的设备范围进行限定;
[0064]

对文本中设备类型进行标准化处理(“断路器”标准化为“开关”,“主变”标准化为“变压器”);
[0065]

对文本中的数字类文本进行标准化处理(罗马数字、汉字转换为阿拉伯数字);
[0066]

根据设备类型的标识确定设备的类型,以及设备名称编号出现在文本中的位置(设备类型位置往前推);
[0067]

根据待匹配设备范围内设备名称编号进行匹配。
[0068]
步骤6、提取检修申请信息。
[0069]
和oms系统进行对接,获取检修申请相关的信息,包括:检修申请的停电范围、工作内容、各处室意见这些内容。计划开始时间、计划结束时间、实际开始时间、实际结束时间这类流程类信息,根据需要进行提取。
[0070]
步骤7、对各项信息进行断句,将文本内容拆分。
[0071]
根据检修申请文本的特点,对工作内容、各处室意见中断句的标识符进行设置,将
命令文本进行拆分,最终得到一系列文本子句。后面针对每个子句逐一进行解析。
[0072]
断句的标识符,包括标点符号类(句号、分号)、换行符、序号列(数字 顿号、数字加“.”)。
[0073]
步骤8、对停电设备信息进行提取或分析。
[0074]

如果检修申请的停电范围本身是通过点选设备实现,点选的设备本身就是d5000设备,则停电范围信息可以直接提取;
[0075]

如果检修申请的停电范围本身是通过点选设备实现,点选的设备本身不是d5000设备,可以通过建立两套模型设备之间的映射关系进行停电范围提取:通过设备类型、电压等级、所属厂站、设备编号这些特征点进行设备之间的映射匹配;
[0076]

如果检修申请的停电范围是和设备没有关联的文本,则通过前面步骤5中“通过文本解析关联设备”相同的方法进行解析。
[0077]
步骤9、提取电网拓扑和设备状态。
[0078]
根据检修设备或者安全措施中的停电范围中关联的设备,结合设备之间的拓扑连接关系进行分析,提取相关间隔的接线方式、运行方式、间隔的主要设备、相关间隔的设备;根据d5000定时发布的状态断面,结合开关、刀闸、地刀状态发生改变时实时推送的位置信号,对各个时间点开关、刀闸、地刀的设备状态进行准确辨识,进而得到任意时间点电网的运行方式。
[0079]
步骤10、分析停电设备拓扑,提取相关设备。
[0080]
结合电网的接线方式、运行方式,分析和停电设备有拓扑关联关系的设备,对停电设备相关检修任务可能涉及到的间隔名称、设备编号信息进行待选信息的辨识、提取。
[0081]
步骤11、提取工作内容特征点。
[0082]
在获取到检修申请对应的特征点之后,对相应检修工作特征点可能需要包含的知识点进行提取。在知识点提取的过程中,提取必须包含的知识点、可以包含的特征点两类:必须包含的知识点,如果没有正确提取,需要进行提醒,通过人工参与进行相关信息的准确提取;对于可以包含的特征点,根据关键字进行信息判断。
[0083]
步骤12、对检修申请工作内容、各处室意见进行结构化解析。
[0084]
对于步骤7中拆分后的子句的列表,根据步骤10中提取的待选设备列表、步骤11中提取的待分析知识点,利用步骤5中建立的辨识知识库进行信息的判断、提取、与d5000设备之间的关联。最终将检修申请的整体内容(包括工作内容、各处室处置建议)进行全面的结构化解析,使得原来纯粹的文本信息,转换为能够反映电网中设备的状态关系的、计算机能够识别的信息。
[0085]
本发明未述及之处适用于现有技术。
[0086]
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献