一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于电网故障事件推理的知识提取系统的制作方法

2022-11-12 11:44:19 来源:中国专利 TAG:


1.本发明涉及一种用于电网智能运维领域的用于电网故障事件推理的知识提取系统。


背景技术:

2.电网故障事件推理是使电网各类生产工作有序进行的有效管理手段。其主要功能是保证电网生产工作本身的安全稳定运行和对外可靠供电。具体内容包括各种信息采集设备反馈的数据信息,监测人员上报的信息,再结合电网实际运行中的电流、电压、负荷、频率等相关参数,并结合工作中的各种实际情况,判断电网运行状态,通过系统或其他方式自动发布运行指令,指导操作人员管理现场控制设备,或通过自动控制系统有效调整工作,包括调整发电机输出、调整负荷分配、开关电容器和电抗器等。最终目标是使电网连续、安全、稳定运行。现有的电网故障事件推理依赖于人工经验进行判断,准确性不高,且需要大量的实际工作经验累积,难以形成可推广的高效电网故障事件推理方法。


技术实现要素:

3.本发明的目的是为了克服现有技术的不足,提供一种用于电网故障事件推理的知识提取系统,以实线电网故障事件的推理协助和智能推理。
4.实现上述目的的一种技术方案是:一种用于电网故障事件推理的知识提取系统,包括:
5.数据采集模块,用于采集电网故障事件推理数据;
6.数据预处理模块,用于对所述数据采集模块采集到的电网故障事件推理数据进行预处理得到语料库;
7.知识提取模块,用于对语料库进行处理从其中提取出事件;
8.属性提取模块,用于对语料库进行处理从其中提取出的事件的属性;
9.关系提取模块,用于对语料库进行处理从其中提取出的事件之间的关系;
10.数据存储模块,用于存储提取出的信息。
11.进一步的,所述数据预处理模块包含:
12.数据清理单元,用于对所述数据采集模块采集到的电网故障事件推理数据进行数据清理;
13.数据降噪单元,用于对清理后的数据进行降噪处理;
14.数据拆分单元,用于将处理后数据中的句子按照单句和词组的形式组织成可用的语料库。
15.再进一步的,所述数据清理单元包含:
16.数据转换子单元,用于将非文本数据转换成文本数据;
17.数据处理子单元,用于处理文本数据中的异常数据。
18.再进一步的,所述处理文本数据中的异常数据是指处理文本数据中的缺失值、异
常值、脏数据和重复值中的至少一种。
19.进一步的,所述知识提取模块包含:
20.transformer模型处理单元,用于对所述数据预处理模块处理好的数据进行处理得到相关句子的位置嵌入;
21.bigru模型处理单元,用于接收所述transformer处理单元处理得到的相关句子的位置嵌入并进行处理得到标签序列;
22.第一crf模型处理单元,用于接收所述bigru模型处理单元处理得到的标签序列并进行处理确定事件。
23.再进一步的,所述属性提取模块接收所述bigru模型处理单元处理得到的标签序列,根据标签序列选择相应的词,去掉重复的部分,剩下的词作为从句子中提取的事件的属性。
24.进一步的,所述关系提取模块包含:
25.第二crf模型处理单元,用于接收所述bigru模型处理单元处理得到的标签序列,并通过多分类的方法提取事件之间的关系。
26.进一步的,所述数据存储模块为redis数据库。
27.再进一步的,所述数据存储模块将事件和事件对应的属性分别作为key-value对中的key和value存储在redis数据库中。
28.本发明的有益之处在于所提供的用于电网故障事件推理的知识提取系统,从电网故障事件数据中提取实体、关系和一些属性,且具有较高的数据处理的精度和速度。
29.本发明的有益之处还在于所提供的用于电网故障事件推理的知识提取系统,通过对数据中的重复值、异常值、缺失值和噪声数据进行处理,将数据处理为后续模块中可以直接使用的数据。
30.本发明的有益之处还在于所提供的用于电网故障事件推理的知识提取系统,通过tensorflow的基础,加速模型在后续训练过程中的训练速度。可以避免一些计算过程,减少开发过程中编写的代码数量。
附图说明
31.图1为本发明的本发明的一种用于电网故障事件推理的知识提取系统的示意图。
具体实施方式
32.为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例进行详细地说明:
33.如图1所示为本技术的一种用于电网故障事件推理的知识提取系统,其主要包含:数据采集模块、数据预处理模块、知识提取模块、属性提取模块、关系提取模块和数据存储模块。每个设计的模块基于tensorflow实现相应的功能。
34.其中,数据采集模块用于采集电网故障事件推理数据。数据预处理模块用于对数据采集模块采集到的电网故障事件推理数据进行预处理得到语料库。知识提取模块用于对语料库进行处理从其中提取出事件。属性提取模块用于对语料库进行处理从其中提取出的事件的属性。关系提取模块用于对语料库进行处理从其中提取出的事件之间的关系。数据
存储模块用于存储提取出的信息。以下具体介绍上述模块。
35.作为一种优选的实施方式,数据预处理模块包含:数据清理单元、数据降噪单元和数据拆分单元。
36.其中,数据清理单元用于对数据采集模块采集到的电网故障事件推理数据进行数据清理。
37.在本技术中,数据清理单元包含:数据转换子单元和数据处理子单元。
38.数据转换子单元用于将非文本数据转换成文本数据。其主要用于处理设备参数和图片组成的表格中记录的数据,数据转换子单元将表格中的描述性数据和图片中的数据整理成文本数据。
39.数据处理子单元用于处理文本数据中的异常数据。在本技术中,异常数据是指处理文本数据中的缺失值、异常值、脏数据和重复值等。
40.具体而言,缺失值是指接线方式下的开关设备母联开关未维护。异常值是指遥测数据不刷新、采集模块需现场排查,开关状态位异常等。脏数据是指退役设备台账未更新导致图模不一致。重复值是指开关告警信号重复发,采集装置异常。
41.数据降噪单元用于对清理后的数据进行降噪处理。这里,噪声是指数据中的随机误差。在实际的生产过程中,正常情况下产生的随机误差是正常的,但误差仍然会影响数据应用部分的功能,噪声数据的存在会影响数据集的真实值,所以仍然需要对数据中的噪声进行过滤。常见的噪声数据滤波方法有回归、均值平滑、异常值分析和小波方法。回归法是用一个函数拟合数据,然后对数据进行平滑,再用回归函数平滑后的函数值作为数据来替代原始数据。这种方法相对简单,易于实现。只需要找到相应的回归函数,但也可能因为回归模型简单粗暴而导致“假回归”的问题。当变量之间存在因果关系时,结果相对较差。因此,需要先用可视化的方法判断数据的趋势,然后再决定是否可以用回归来拟合相应的数据。对于具有序列特征的变量,均值平滑法用几个相邻数据的均值替换原始数据。对于具有正弦时间序列特征的数据,采用均值平滑法可以获得更好的结果。但是,数据的细节和边缘很容易被模糊。因此,数据降噪单元根据数据的具体情况,选择合适的降噪方法对对清理后的数据进行降噪处理。
42.除了对数据进行清洗和降噪,还需要做好数据的预处理工作,让数据可以直接使用。数据拆分单元用于将处理后数据中的句子按照单句和词组的形式组织成可用的语料库。
43.作为一种优选的实施方式,知识提取模块包含:transformer模型处理单元、bigru模型处理单元和第一crf模型处理单元。
44.其中,transformer模型处理单元用于对数据预处理模块处理好的数据进行处理得到相关句子的位置嵌入。输入的句子以单独组成的句子为单元,表示上一个模块处理过的语料库。
45.bigru模型处理单元用于接收transformer处理单元处理得到的相关句子的位置嵌入并进行处理得到标签序列。
46.根据bigru模型的原理,建立两层gru模型,并根据实际需要确定gru单元的数量。这个模型的目的是利用transformer模型前一部分的结果作为模型的输入,从而输出标签序列。在模型的输入方面,由于在模型训练过程中不可能根据位置嵌入的长度动态改变
bigru输入单元的大小,因此需要提前预留足够的输入长度,用0来补充。
47.第一crf模型处理单元用于接收bigru模型处理单元处理得到的标签序列并进行处理确定事件。标签序列通过最终的crf概率计算,确定哪些单词属于事件,哪些单词不属于事件。具体地,crf模型的作用是计算标签序列中每个序列的概率,并由概率最大的序列确定序列的哪一部分属于事件。其中,bigru模型的输出标签序列是一个矩阵,每一列有5个数字,列中的每一行数字代表bioes模式下的概率。crf模型的输入是一个序列,因此bigru的结果标签序列将每一行作为一个序列作为crf模型的输入。然后计算列的概率,比较标签序列中的最大值,然后根据标签序列中的概率确定哪些语句属于该事件。
48.作为一种优选的实施方式,属性提取模块接收bigru模型处理单元处理得到的标签序列,根据标签序列选择相应的词,去掉重复的部分,剩下的词作为从句子中提取的事件的属性。
49.作为一种优选的实施方式,关系提取模块包含:第二crf模型处理单元。
50.第二crf模型处理单元用于接收bigru模型处理单元处理得到的标签序列,并通过多分类的方法提取事件之间的关系。
51.具体而言,关系提取的功能是确定事件之间的关系。在本技术中,将知识抽取的bigru模型与另一个attention相结合,提取事件之间的关系。在bigru部分,得到句子对应的标签序列,然后利用attention对相关关系进行多分类的思想进行关系抽取。
52.在attention部分,以前面的标签序列为输入,多分类任务使用softmax分类器对句子的分类标签进行预测。损失函数表示真类别标签的负对数似然函数。构建相应的第二crf模型处理单元,然后对参数进行训练,最后提取事件中的关系。
53.作为一种优选的实施方式,数据存储模块为redis数据库。因为redis使用key-value形式来存储相关数据,所以使用一个事件作为key,使用属性作为key的值,然后形成相应的key-value对,存储在redis数据库中。
54.本技术中的用于电网故障事件推理的知识提取系统,对数据处理的精度和速度都有较大的提升。
55.本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献