一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电力信息通信系统运维数据的质量检测方法与流程

2022-02-19 13:32:51 来源:中国专利 TAG:


1.本发明公开涉及运维数据质量检测的技术领域,尤其涉及一种电力信息通信系统运维数据的质量检测方法。


背景技术:

2.信息通信系统的安全稳定运行一直是电网业务系统的重要保障,受到了国网公司和企业各界的高度关注。其中,信息通信系统的调度指挥是信通运维的核心技术之一,目标是实现故障快速诊断定位和检修方案优化选择,直接影响到故障的检修时间和电网业务系统的稳定运行。
3.随着我国电力系统的飞速发展,电力通信系统中的运维也不断发展升级,在现阶段的运维系统研究中发现,该系统的工作内容呈现出不规范的现状。目前信息通信系统在运设备种类多、数量大,正常运行依靠网络、主机、存储、中间件、数据库、业务应用等多个层面的协同配合,单一的故障现象对应着多种可能的原因,缺陷故障的定位过多依赖于人,而且人工分析相比自动化方式在时效性方面有很大的提升空间。而现阶段的运维系统应用中,由于一些电力数据特征差异较小,同时还隐藏大量未知异常,难以对其进行检测、分类并故障定位,所以电力数据的整理与分析依旧采用人工的经验方法,在实际的数据整合中也尚未存在可靠的使用技术,导致运维系统最终数据报告的科学性以及准确性无法得到保障,并对我国电力通信系统的发展进程起到消极的阻碍作用。
4.人工智能在数据异常检测中起着重要作用,可以显著提高检测速度和准确性,并且应用在众多领域例如电力数据。机器学习是人工智能的一个重要分支,而深度学习则是机器学习中最主要的一个算法,其旨在通过多层非线性变换,提取数据的高层抽象特征,学习数据潜在的分布规律,从而获取对新数据做出合理的判断或者预测的能力。深度学习凭借着强大的拟合能力,开始在各个领域崭露头角,特别是在数据异常检测领域同样可以借助深度学习的方法。
5.传统的一些机器学习方法可以实现电力数据异常检测智能化,异常检测大概分为以下四类:基于统计学、基于密度、基于聚类、基于邻近度,电力设备异常数据没有明确的判定标准,一般采用单一的聚类方法,比如:lof、k

means、knn进行异常检测。但由于电力设备特征维度比较高导致出现计算时间长、效率低、精度低等问题,无法满足电力数据快速异常检测的需求。
6.因此,如何研发一种新型的电力数据异常的智能检测方法,以解决上述问题,成为人们亟待解决的问题。


技术实现要素:

7.鉴于此,本发明提供了一种电力信息通信系统运维数据的质量检测方法,以解决以往的检测方法存在效率低、精度差等问题。
8.本发明提供的技术方案,具体为,一种电力信息通信系统运维数据的质量检测方
法,该质量检测方法包括如下步骤:
9.获取所述电力信息通信系统的历史故障数据;
10.采用生成对抗式网络gan对所述历史故障数据进行扩充,将扩充后的历史故障数据填充到历史运维数据中,得训练样本数据;
11.采用所述训练样本数据进行textcnn分类模型的训练,获得训练后的textcnn分类模型;
12.获取所述电力信息通信系统的实时运维数据;
13.采用所述训练后的textcnn分类模型对所述实时运维数据进行分类,依据所述分类结果,获得所述电力信息通信系统运维数据的质量检测结果。
14.优选,所述电力信息通信系统运维数据为文本数据。
15.进一步优选,获取所述电力信息通信系统的历史故障数据的步骤中,所述历史运维数据来源于故障诊断手册。
16.进一步优选,所述训练样本数据中历史故障数据量与历史正常数据量的比为1:5。
17.进一步优选,所述textcnn分类模型由卷积层、池化层、融合层以及全链接层构成;
18.其中,所述卷积层由卷积核为(2,3,4)的三个过滤器构成,用于分别提取不同的文本特征;
19.所述池化层的个数为三个,将所述卷积层输出的文本特征进行汇合操作;
20.所述融合层将三个所述池化层输出的特征进行拼接,融合获得具有代表性的向量;
21.所述全链接层在所述融合层之后加入隐含层和softmax层,进行最终的分类。
22.进一步优选,所述质量检测结果包括:正常数据和故障数据。
23.本发明提供的电力信息通信系统运维数据的质量检测方法,将生成对抗式网络gan与textcnn分类模型进行结合,基于电力信息通信系统中故障数据较少,存在异常数据样本少,导致模型训练样本不均衡的现状,首次提出将生成对抗式网络gan应用在文本类样本的扩充上,以解决由于模型训练样本不均衡,导致的检测结果不准确以及精度差的问题。同时鉴于电力信息通信系统运维数据多为文本类数据的现状,在众多分类模型中采用了textcnn分类模型进行数据分类,实现质量检测,完成正常数据和故障数据的分类,该电力信息通信系统运维数据的智能质量检测方法,具有检测效率高、精度好等优点。
24.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明的公开。
附图说明
25.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1为本发明公开实施例提供的一种电力信息通信系统运维数据的质量检测方法中textcnn分类模型的结构示意图;
28.图2为本发明公开实施例提供的一种电力信息通信系统运维数据的质量检测方法的整体流程图;
29.图3为本发明公开实施例提供的一种电力信息通信系统运维数据的质量检测方法的具体流程图;
30.图4为分别采用textcnn分类模型和生成对抗式网络gan与textcnn分类模型结合的方法进行质量检测的结果对比图。
具体实施方式
31.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
32.为了解决以往对于电力信息通信系统运维数据的质量检测,存在效率低、精度差等问题,本实施方案计划提供一种基于人工智能的新型质量检测方法。
33.在研究电力信息通信系统运维数据的过程中发现:关于电力的运维数据大多均为文本类数据,因此在众多分类模型中计划选用textcnn分类模型进行运维数据的分类,将正常数据和故障数据进行区分,实现故障数据的识别,以实现运维数据的质量检测。
34.其中,参见图1,textcnn分类模型由卷积1、池化层2、融合层3以及全链接层4构成;
35.其中,卷积层1由卷积核为(2,3,4)的三个过滤器构成,用于分别提取不同的文本特征。所述过滤器将大小为3*3*1的节点矩阵变化为单位节点矩阵,假设以wi
x,y
来表示对于输出单位节点矩阵中的第i个节点,过滤器输入节点(x,y)的权重,使用bi表示第i个输出节点对应的偏置项参数,那么单位矩阵中的第i个节点的取值a(i)为:
[0036][0037]
其中c
x,y
为过滤器中节点(x,y)的取值;f为激活函数。所有a(i)组成的单位向量就是卷积层所得的特征图记作a,a可以作为池化层的输入;
[0038]
池化层2的个数为三个,将卷积层1输出的文本特征进行汇合操作,可以让模型更加关注某些特征而不是特征的具体位置,同时能够得到降维的效果,减小计算量和参数的个数,在

一定程度上还能够防止过拟合的发生;
[0039]
融合层3将三个池化层输出的特征进行拼接,融合获得对于文本向量而言更具有代表性的向量;
[0040]
全链接层4在融合层之后加入隐含层和softmax层,来充当一个分类器,以进行文本的最终分类。
[0041]
基于上述的textcnn分类模型,本实施方案首先将上述的textcnn分类模型采用以往电力信息通信系统的历史运维数据作为学习样本进行训练,直至训练结束后,将训练好的textcnn分类模型用于电力信息通信系统的运维数据的质量检测,并对检测的结果分别进行准确率(accuracy)、精确率(查准率precision)、召回率(查全率recall)、特异性(specificity)以及f1分数(f1

score)的指标测评,具体结果见表1。
[0042]
表1:
[0043]
性能名称accuracyprecisionrecallspecificityf1

score测评结果78%80.45%76.19%79.04%78.26%
[0044]
从上表可见,在上述5项测评指标中,仅有精确率(查准率precision)达到了80.45%,其他的4项测评指标仍未达到80%以上,因此,该分类方法仍无法达到实际的要求。
[0045]
在后续的严重中发现,导致上述的原因主要在于,对于textcnn分类模型的训练不完备导致的。由于随着科技的进步,电力信息通信系统的运行稳定性越来越高,故障率越来越低,因此,在现有的运维数据中,大多为正常数据,故障数据较少,如果将现有的运维数据作为训练样本进行textcnn分类模型的训练,由于训练样本中故障数据较少,会存在训练样本的不均衡,进而导致textcnn分类模型的不完备,而出现了上述的4项测评指标均为达到80%的问题。
[0046]
生成对抗式网络gan虽然已经是现有的人工智能模型,但以往从未见过有将其应用在文本类数据的样本扩充上,本实施方案首次尝试将生成对抗式网络gan应用文本类数据的应用扩充上,以探究其究竟可实现文本类数据的扩充。
[0047]
下面首先对生成对抗式网络gan进行简单的说明,具体如下:
[0048]
生成对抗式网络gan通过使用生成器和判别器来生成图像。对于生成器,需要将输出结果通过判别器进行优化训练。对于判别器,需要生成器的输出和真实数据组合起来,作为有监督的输入完成训练。整个过程中,生成器的目的是生成更接近真实数据的结果。判别器的目的是提高判别能力,作为一个二分类器,将生成数据和真实数据进行区别。
[0049]
在生成对抗网络的框架中,生成器记为g,并将生成器生成的样本分布记录为pg(x),真实样本分布记为pdata(x)。鉴别器记为d,输出为一个标量,用于判断当前输入数据是否为真。通过采样足够的数据,函数d可用于隐式表达采样空间中pg(x)和pdata(x)之间的差异。生成对抗网络的整体优化的目标函数可以用公式(1)表示如下:
[0050][0051]
其中,函数v(g,d)是判别器辨别能力的度量,可以具体表示成公式(2):
[0052][0053]
若判别器的函数是连续的,那么依据概率密度函数与函数期望之间的关系,上式可以转化为公式(3):
[0054][0055]
对于这样的形式,将生成器固定,对判别器取得极大值,即公式中的多项式进行求导运算并取极值,可以得到判别器的解析解为公式(4):
[0056][0057]
将公式(4)带回公式(3)可得到公式(5):
[0058][0059]
其中,kl代表信息论中的kl散度,jsd代表信息论中的jensen

shannon散度(简称js散度)。根据定义可知,当jsd=log2时,表示两个概率分布完全不一样,当jsd=0时表示两个概率分布完全一样。由此可知,当pg(x)=pdata(x)时,可以得到符合要求的g。由公式5可知,判别器达到最优时,生成对抗网络实际优化的是js散度。生成器产生的分布pg(x)与真实分布pdata(x)一致时,生成器达到最优。
[0060]
基于采用生成对抗式网络gan进行文本数据的扩充,以解决以往由于训练样本数据不均衡,而最终导致检测效果差的问题,遂产生如下进行电力信息通信系统运维数据的质量检测方法,参见图2,该数据质量检测的整体可以分为两部分,分别为:数据扩充和质量分类两大部分,而具体的质量检测可参见图3包括如下步骤:
[0061]
s1:获取电力信息通信系统的历史故障数据;
[0062]
s2:采用生成对抗式网络gan对所述历史故障数据进行扩充,将扩充后的历史故障数据填充到历史运维数据中,得训练样本数据;
[0063]
s3:采用所述训练样本数据进行textcnn分类模型的训练,获得训练后的textcnn分类模型;
[0064]
s4:获取所述电力信息通信系统的实时运维数据;
[0065]
s5:采用所述训练后的textcnn分类模型对所述实时运维数据进行分类,依据所述分类结果,获得所述电力信息通信系统运维数据的质量检测结果。
[0066]
其中,步骤s1中电力信息通信系统的历史故障数据主要来源于故障诊断手册,将故障诊断手册里面的文档在去除无用的格式信息之后,得到的文本信息专业性强,且文本特征明显,用此数据集训练得出的模型在对专业领域内的文档进行分类整理有很大的参考作用。
[0067]
上述方法中,通过采用生成对抗式网络gan对故障数据进行扩充,将扩充后的故障数据填充到历史运维数据中,作为最终训练样本数据,以实现训练样本数据的样本均衡,通常样本训练数据中历史故障数据量与历史正常数据量的比为1:5。
[0068]
通过上述将生成对抗式网络gan与textcnn分类模型进行结合的方法,再次进行电力信息通信系统的运维数据的质量检测,并对检测的结果分别进行准确率(accuracy)、精确率(查准率precision)、召回率(查全率recall)、特异性(specificity)以及f1分数(f1

score)的指标测评,具体结果见表2。
[0069]
表2:
[0070]
性能名称accuracyprecisionrecallspecificityf1

score测评结果83%84.36%82.51%83.82%83.43%
[0071]
从表2可见,将生成对抗式网络gan与textcnn分类模型进行结合后,上述5项的测评结果均在80%以上,满足实际使用要求,表明了该方法的有效性。
[0072]
其中,单纯采用textcnn分类模型进行质量检测和使用生成对抗式网络gan与
textcnn分类模型结合的方法进行质量检测,具体的结果对比图可见图3。
[0073]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本技术旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
[0074]
应当理解的是,本发明并不局限于上面已经描述的内容,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献