一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

变电站运维管理信息系统健康诊断方法和系统

2022-07-16 15:44:40 来源:中国专利 TAG:


1.本发明涉及电力系统技术领域,具体涉及一种基于快速极限学习机和多源异构特征融合的变电站运维管理信息系统健康诊断方法和系统。


背景技术:

2.在电力系统中,变电站是对电能进行变换、集中和分配的重要场所,其运行可靠性直接影响电力系统的安全稳定运行,其中智能运维系统将在发挥重要作用。在超110kv高电压变电站运维管理领域,当前在系统健康诊断技术上需求迫切,发展迅速,且技术要求还在不断升级中,因此有必要在智能运维信息系统的健康诊断技术上实现进一步突破。
3.电站运维管理信息系统有如下几点问题:实时监管难、事件追溯困难、缺少时间预警机制等。电站运维管理信息系统面临巨大的运维压力,因此对电站运维管理信息系统进行健康诊断十分重要。
4.现有技术中一般通过专家评分等方法对电站运维管理信息系统进行健康诊断,实时性差。


技术实现要素:

5.(一)解决的技术问题
6.针对现有技术的不足,本发明提供了一种变电站运维管理信息系统健康诊断方法和系统,解决了现有的电站运维管理信息系统健康诊断方法实时性差的技术问题。
7.(二)技术方案
8.为实现以上目的,本发明通过以下技术方案予以实现:
9.第一方面,本发明提供一种变电站运维管理信息系统健康诊断方法,包括:
10.s1、实时获取变电站运维管理信息系统日志和其他信息,并采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化;
11.s2、通过改进的d-s证据理论模型对结构化后的所述变电站运维管理信息系统日志和其他信息进行融合,得到特征数据;
12.s3、基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理信息系统的评分。
13.优选的,所述预先构建的改进极限学习机模型的构建过程包括:
14.获取变电站运维管理信息系统的历史运行状况,并采用critic-熵权法对系统的历史运行状况进行分析,给出不同时间阶段的运行状况评分,并由此转化为标签数据;
15.通过标签数据训练极限学习机,得到改进极限学习机模型。
16.优选的,所述并采用critic-熵权法对系统的历史运行状况进行分析,包括:
17.构建如下所示的权重计算公式,其中wj即为critic法求得的第j种算法的权重值,r
ij
即为算法i和算法j之间的相关系数,σj即为算法j测算结果的标准差;
[0018][0019]
基于熵权法的计算原理,对原始数据进行无量纲化处理:
[0020]
x

ij
=(x
ij-minxj)/(maxx
j-minxj)
[0021]
x'
ij
和x
ij
分别表示第i年第j项指标的标准化值和原始值,maxxj和minxj分别表示第j项指标的最大值和最小值;
[0022]
根据如下公式求得5种算法结果的信息熵ej,并最终构建如下所示权重计算公式;
[0023][0024][0025]
将两种赋权法进行组合和改进,假设两种赋权法具有相同的地位,构建基于critic和熵权法的组合法,进而实现客观赋权法间的优势互补;
[0026][0027]
优选的,所述通过标签数据训练极限学习机,包括:
[0028]
给定一个包含n个不同的样本的训练集,γ={(xj,tj),xj∈rn,tj∈rm,j=1,

,n},其中x为n维的输入变量,t为m维的目标变量输入样本的第i个隐藏节点的输出结果,其作用是将输入层的数据由其原本的空间映射到elm的特征空间。
[0029]
优选的,所述基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理信息系统的评分,包括:
[0030]
将特征数据输入到预先构建的改进极限学习机模型中,得到变电站运维管理信息系统的评分,具体包括
[0031]
给定一个包含n个不同代表着变电站信息系统健康水平的特征数据,γ={(xj,tj)xj∈rn,tj∈rm,j=1,

,n},其中x为n维的输入变量,t为m维的目标变量,具有m个隐藏神经元slfn的数学模型的激励函数g(*)可表示为:
[0032][0033]
式中:wi,为连接第i个隐藏节点和输出节点的随机分配的输入权向量;
[0034]bi
为第i个隐藏节点的任意分配偏差;
[0035]
g(wi,bi,xj)为xj输入样本的第i个隐藏节点的输出结果,其作用是将输入层的数据由其原本的空间映射到elm的特征空间;
[0036]
当slfn模型完全逼近样本代表着变电站信息系统健康水平的特征数据,即当输出值与真值之间的误差为零,之间对应关系可表示为:
[0037][0038]
可写成矩阵式:
[0039]
hβ=t
[0040]
其中,
[0041][0042][0043]
电站信息系统健康水平评分的输出权值可利用上式通过寻找slfns最小二乘解得到,其表达式为:
[0044]
β=h
t
t
[0045]
其中,h
t
为信息系统健康水平的特征矩阵h的moore-penrose广义逆,若h
t
h为非奇异矩阵,那么上式可表示为:
[0046]
β=h
t
t=(h
t
h)-1ht
t。
[0047]
优选的,所述方法还包括:
[0048]
s4、变电站运维管理信息系统根据所述评分,进行更新维护。
[0049]
第二方面,本发明提供一种变电站运维管理信息系统健康诊断系统,包括:
[0050]
数据获取及结构化模块,用于实时获取变电站运维管理信息系统日志和其他信息,并采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化;
[0051]
数据融合模块,用于通过改进的d-s证据理论模型对结构化后的所述变电站运维管理信息系统日志和其他信息进行融合,得到特征数据;
[0052]
评分模块,用于基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理信息系统的评分。
[0053]
第二方面,本发明提供一种计算机可读存储介质,其存储用于变电站运维管理信息系统健康诊断的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~6任一所述的变电站运维管理信息系统健康诊断方法。
[0054]
第四方面,本发明提供一种电子设备,包括:
[0055]
一个或多个处理器;
[0056]
存储器;以及
[0057]
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述所述的变电站运维管理信息系统健康诊断方法。
[0058]
(三)有益效果
[0059]
本发明提供了一种基于博弈论的制造商绿色产品研发决策方法和系统。与现有技术相比,具备以下有益效果:
[0060]
本发明提供了一种性能良好的电力信息系统变电站运维管理信息系统健康评价诊断方法,该方法解决了变电站运维管理信息系统健康诊断无法实时进行、速度慢的技术问题,实现对电站运维管理信息系统的在线实时诊断,提高了变电站运维管理信息系统健康评价的效率和准确性。同时,将非结构化的变电站运维管理信息系统日志转化为直观简洁的信息和规范干净的结构化数据,有利于进行更加高级的分析和处理。
附图说明
[0061]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0062]
图1为本发明实施例一种变电站运维管理信息系统健康诊断方法的框图。
具体实施方式
[0063]
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0064]
本技术实施例通过提供一种变电站运维管理信息系统健康诊断方法和系统,解决了现有的电站运维管理信息系统健康诊断方法实时性差的技术问题,实现对电站运维管理信息系统的在线实时诊断。
[0065]
本技术实施例中的技术方案为解决上述技术问题,总体思路如下:
[0066]
电站运维管理信息系统有如下几点问题:1.实时监管难:日常巡检及检修作业无法实时监管,目前仍采用传统工作模式,一般只能事后回放查原因,无法实时跟踪进站人员,监管繁琐发智慧变电站解决方案。2.事件追溯困难:事件追溯智难,信息管理系统发生故障,无法准确追踪到具体问题发生的时间节点和确切位置,事件分析更多依赖于现场或后台的人工管理。3.缺少时间预警机制,工作安全无保障,系统故障无法预判,致使无法提前预防可能出现的危险事件。电站运维管理信息系统面临巨大的运维压力,因此对电站运维管理信息系统实际运行效果的检验和安全事件的预警十分重要。本发明实施例以基于字符串聚类和模板生成树将非结构化变电站运维管理信息系统日志,将结构化的变电站运维管理信息系统日志采用窗口技术构建变电站运维管理信息系统日志序列,生成事件技术矩阵,通过改进的d-s证据理论模型对所述结构化变电站运维管理信息系统日志及其他来源的多源异构数据进行全局融合,然后将融合处理过的特征数据带入优化后的极限学习机模型,计算得到评分,提供了一种性能良好的电力信息系统变电站运维管理信息系统健康评价诊断方法。解决了变电站运维管理信息系统健康诊断无法实时进行、速度慢的技术问题,提高了变电站运维管理信息系统健康评价的效率和准确性。
[0067]
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0068]
本发明实施例提供一种变电站运维管理信息系统健康诊断方法,如图1所示,该方法包括步骤s1~s3:
[0069]
s1、实时获取变电站运维管理信息系统日志和其他信息,并采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化;
[0070]
s2、通过改进的d-s证据理论模型对结构化后的所述变电站运维管理信息系统日志和其他信息进行融合,得到特征数据;
[0071]
s3、基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理
信息系统的评分。
[0072]
本发明实施例提供了一种性能良好的电力信息系统变电站运维管理信息系统健康评价诊断方法,该方法解决了变电站运维管理信息系统健康诊断无法实时进行、速度慢的技术问题,实现对电站运维管理信息系统的在线实时诊断,提高了变电站运维管理信息系统健康评价的效率和准确性。同时,将非结构化的变电站运维管理信息系统日志转化为直观简洁的信息和规范干净的结构化数据,有利于进行更加高级的分析和处理。
[0073]
下面对各个步骤进行详细描述:
[0074]
在步骤s1中,实时获取变电站运维管理信息系统日志和其他信息,并采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化。具体实施过程如下:
[0075]
s101、实时获取变电站运维管理信息系统日志和其他信息(如图像,日志和图像等构成多源异构数据)。
[0076]
s102、采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化,具体包括:
[0077]
(1)在每一条变电站运维管理信息系统日志的解析过程中,关于原始变电站运维管理信息系统日志的消息可以表示为m={mh,mc},其中mh表示为变电站运维管理信息系统日志头,mc表示为变电站运维管理信息系统日志内容。再利用正则表达式判别变电站运维管理信息系统日志头mh中和它相匹配的变量信息并且获得变电站运维管理信息系统日志内容mc。
[0078]
(2)采用预先定义好的分隔符对原始变电站运维管理信息系统日志的内容mc进行逐一划分,其中的空格分隔符能够基本解决大部分变电站运维管理信息系统日志的分割问题。利用分隔符将变电站运维管理信息系统日志划分成一个个单词的序列tm:
[0079]
tm=[t
m1
,t
m2


,t
ml
]
[0080]
其中,每个单词都用t
mi
表示。tm的大小即为变电站运维管理信息系统日志的长度,用字母l表示。最后,将tm分配到不同组别当中,每一个组别都包含所有拥有相同l的tm,用g
l
表示这些的组。
[0081]
(3)对于变电站运维管理信息系统日志长度一样但变电站运维管理信息系统日志模板却不同的的变电站运维管理信息系统日志集合,可以采用基于变电站运维管理信息系统日志字符串相似度的在线聚类方法将其划分。即使每一条变电站运维管理信息系统日志的长度都是相同的,但是其中包含的的变电站运维管理信息系统日志字符串是唯一的,通过计算它们的相似度,通过计算得到的相似度再对每个g
l
中的变电站运维管理信息系统日志进行再次聚类,就能得到与模板相似度更高的变电站运维管理信息系统日志集合,用gs表示。
[0082]
(4)tm当中的每一个t
mi
代表着一个单词,为了降低关于字符串的提取算法的时间复杂度,采取仅仅提取其中的每一个tm当中的第一个字符作为代表字符。为减少变电站运维管理信息系统日志字符串的种类数量,当其中的字符为数字或者标识符的时候,则用“*”将其替代。最后将所有涉及的字符和“*”按照所属的t
mi
在tm中的所在位置,将其组成一个字符串,将其命名为该原始变电站运维管理信息系统日志的变电站运维管理信息系统日志字符串,并采用sm表示。
[0083]
(5)在g
l
中通过创建变电站运维管理信息系统日志字符串集来用于存储字符串的种类数目,将其表示为s。再计算新生成的变电站运维管理信息系统日志的字符串和s当中的字符串的相似度。若计算所得的相似度大于预先所得的相似度的阈值st的字符串,那么就将变电站运维管理信息系统日志加入到该字符串所对应的变电站运维管理信息系统日志组gs中,假如不存在则新建变电站运维管理信息系统日志组gs并更新s。相似度的计算公式如公式(1)所示:
[0084][0085]
其中,s
m1
和s
m2
分别代表两条变电站运维管理信息系统日志字符串,len(s
m1
,s
m2
)分别代表两条变电站运维管理信息系统日志字符串的长度,ⅱf(x,y)的定义如公式(2)所示:
[0086][0087]
x,y分别表示两个字符。当sim(s
m1
,s
m2
)大于给定的st时,表示s
m1
和s
m2
变电站运维管理信息系统日志字符串相似。
[0088]
(6)采用基于trie树的思想构建关于gs的模板生成树,并将所生成的变电站运维管理信息系统日志作为搜索项与树中的模板匹配共同的节点。
[0089]
(7)对于变电站运维管理信息系统日志mc,通过上述的处理后已经被分割成了不同的序列tm,对序列tm进行遍历,并将遍历得到的tm依次插入到树的结构。再将每条分支最后的节点标记成特殊的字符

$’,那么从根节点到任意的一个

$’所经过的路径表示为一条变电站运维管理信息系统日志mc的匹配路径,其中树的深度为l 1,l表示为变电站运维管理信息系统日志的长度。
[0090]
(8)进一步对生成的变电站运维管理信息系统日志tm中的tm作为l询问,并采用先深度搜索遍历其中的每一条路径。即从根节点p开始进行搜索,从中取出要查找的t
mi
的所在的节点,若不存在相互匹配的节点,那么将该tm插入到树结构作为新的分支;若存在匹配的节点,根据该节点选择与之对应的子树并转到对应的子树继续进行搜索。
[0091]
(9)预先假设t
mi
和第i个节点q存储的tm相同,那么p=q,t
mi
就变为t
m(i 1)
并进行继续搜索。若t
m(i 1)
和第i 1个节点匹配不成功,那么将其记录为匹配失败的节点,更新的根节点p为第i 2个节点,t
m(i 2)
则继续匹配第i 2个节点,一直到完成l询问为止。之后提取匹配成功节点存储的tm,而匹配失败的节点则返回通配符

*’,并以此来得到变电站运维管理信息系统日志模板。
[0092]
为了判断模板是否生成成功,为此引入一个界定值x,如公式(3)所示:
[0093][0094]
其中,∑unmatch(t
mi
)表示匹配失败的节点数量,l表示为变电站运维管理信息系统日志的长度,σ作为该搜索路径上的通配符

*’的数量。当x小于或等于给定的阈值λ时,表示成功生成模板,并更新模板生成树,将未匹配的节点更新为通配符

*’。当x超过给定的阈值λ,那么将该条变电站运维管理信息系统日志作为新的分支插入到模板生成树。
[0095]
(10)通过对变电站运维管理信息系统日志的解析,已经将非结构化的变电站运维
管理信息系统日志转化为结构化的变电站运维管理信息系统日志。但为了进行提取特征,首先将变电站运维管理信息系统日志划分成不同的组,其中每个组代表一个变电站运维管理信息系统日志序列。因此,将窗口应用于将变电站运维管理信息系统日志数据集划分成有限块。利用窗口技术构建变电站运维管理信息系统日志序列之后,将生成事件计数矩阵x。在每一个变电站运维管理信息系统日志序列中,通过统计每一个变电站运维管理信息系统日志事件的发生次数,从而形成事件计数向量。
[0096]
在步骤s2中,通过改进的d-s证据理论模型对结构化后的所述变电站运维管理信息系统日志和其他信息进行融合,得到特征数据。具体实施过程如下:
[0097]
(1)识别框架
[0098]
在d-s证据理论中识别框架步骤是构建一个集合,包含了变电站运维管理系统中某个被处理问题所有可能的结果(例如日志、图像等),即来自变电站所产生的多源异构数据。识别框架用集合u表示,中所有的元素互不包含且集合内的元素不能被同时取得,该集合u也被称为假设空间,此互不相容的事件组成的完备集合u,其形式可以表示为:
[0099]
u={θ1,θ2,

,θn}
[0100]
其中,θi(i=1,2,3,4,
……
,n)为该集合u中的元素,集合u中元素所有可能的组合构成的集合则称为该识别框架u的幂集,其数学表达形式为2u,幂集包含集合u中所有的元素及他们的多子集。
[0101]
(2)基本概率分配(basic probabilityassignment,bpa)函数
[0102]
将基于识别框架u内的元素组成的所有的子集θ都分配一个0到1之间的数,即幂集2u满足映射2u→
[0,1],该子集θ在区间[0,1]上的数记为m(θ),这个映射关系称为mass函数,即基本概率分配函数,满足以下条件:
[0103][0104]
由上式可知:基本概率分配函数的m(θ)表示子集θ在幂集2u上的概率,所有基本概率分配函数的值m(θ)之和为1,其中空集的概率表示为0。在幂集2u上若元素概率值m(θ)大于0,则称该元素为焦元。m(θ)的值反映了整体对该子集θ的信任程度,m(θ)值越大,表示该焦元的可信程度越高;反之m(θ)值越小,即表示该焦元的可信程度越低。
[0105]
(3)信任函数(belief function)
[0106]
假设集合u为一个识别框架,且m(θ)满足映射2u→
[0,1]为u上的基本概率赋值,存在a∈p(u),b∈a,因此定义函数bel:2u→
[0,1]为:
[0107]
bel(a)=∑
b∈a
m(b)
[0108]
即信任函数的数学表达式,表示某个事件a的全部子集的bpa之和,其中:
[0109][0110]
对多源异构信息证据元中,某个证据的支持程度可以用bel函数表示,而对某个证据的不反对程度则用似然函数来描述。
[0111]
(4)似然函数(plausibility function)
[0112]
假设识别框架u中,若基本概率函数值m满足映射:2u→
[0,1],存在a∈p(u),b∈p
(u),定义函数pl:2u→
[0,1]为:
[0113][0114]
其中pl(a)表示似然函数,描述了对某个证据a的不反对程度。表示的信任程度。
[0115]
假设有一个需要判断的问题a,其识别框架为u,由上式计算得出问题a的信任函数bel(a)和似然函数pl(a),信任函数bel(a)表示问题a支持程度,似然函数pl(a)表示对问题a的不反对程度,因此对问题a的最大信任程度就是pl(a),最小的信任程度就是bel(a)。
[0116]
由此,对问题a的最小信任程度区间为[0,bel(a)],最大支持区间为[0,pl(a)],区间[bel(a),pl(a)]表示不确定空间,即在该区间内,证据对问题a既不支持也不反对。因此,由信任函数与似然函数的定义,在信任区间[bel(a),pl(a)]上可得:
[0117]

[0118]
②ꢀꢀ
bel(a)≤pl(a)
[0119]

[0120]

[0121]

bel(a)=pl(a)仅当证据中焦元a与其他的焦元相交为空集时。
[0122]
(5)d-s证据理论组合规则及推理过程
[0123]
对证据的基本信任分配函数使用正交和的方式进行运算,此方法被称为d-s证据理论合成规则。若已知在同一识别框架上存在多个不同证据的信度函数,即基本信任分配函数,如果它们没有彻底冲突,则可以通过使用此组合法则计算出一个新的基本信任分配函数实现多元异构证据信息之间的融合。
[0124]
用表示d-s证据理论组合规则,也可称之为正交规则,具体规则如下:
[0125]
假设证据的个数为n,识别框架为u,m1,m2,m3,m4,

,mn以分别表示每个证据的基本率分配函数,则组合规则的表达式为:
[0126][0127]
其中k为冲突系数,其定义如下所示:
[0128][0129]
冲突系数k描述了各个证据之间对命题支持的不一致性,体现在系数k越大,证据对命题的支持程度越不统一,k=1时,则表明各个证据对命题的支持程度完全相反,证据之间完全冲突,组合规则失效。
[0130]
d-s证据理论合成规则具有以下基本性质:
[0131]
性质1:交换律,交换组合顺序不影响结果,即
[0132]
性质2:结合律,多个证据可以随机组合,结果只与证据本身有关,与组合顺序无关。即
[0133]
性质3:极化性,组合规则合成过程中,增加证据数量会降低合成结果的不确定性,例如随着支持的证据数量增加,合成结果的支持度也会随即增高。
[0134]
性质4:单调性,当证据m1和证据m2都具有单调性,则证据m1和证据m2的融合结果同样具有单调性。
[0135]
d-s证据理论合成规则推理过程:
[0136]
给每个证据体分配bpa的值m(θ)、计算信任度函数bel(a)和似然函数pl(a),利用d-s组合规则对每个证据进行融合得到融合后的基本概率m(θ)、计算出新的信任度函数bel(a)和似然函数pl(a),根据相关判定准则和计算得到的结果做出融合评价。目标判定原则如下:
[0137]

判定的目标类型应具有最大的测度函数分配值;
[0138]

判定的目标类型和其它类型的测度函数分配值之差要大于某一阈值;
[0139]

不确定性测度函数分配值m(θ)必须小于某一阈值;
[0140]

判定的目标类型测度函数分配值必须大于不确定性测度函数分配值m(θ)。
[0141]
(6)证据冲突检测
[0142]
假设识别框架u中,证据mi、证据mj彼此独立,则证据mi和证据mj的余弦相似度如下所示:
[0143][0144]
由此可知,当余弦值=1时,表明两个向量之间的夹角为零,两个向量重合,即表示两个证据完全相同。增加两个证据向量的夹角,表示各证据之间的差异程度增加,即两个证据的冲突程度上升,表现为余弦值减小。当夹角为90
°
时,即表示两个证据之间相互没有关系;夹角为180
°
时,余弦值=-1,表示两个证据负相关完全冲突。
[0145]
将上述式生成的矩阵每一行相加,再计算平均值得到证据mi的平均相似度如下所示:
[0146][0147][0148]
平均相似度表明各个证据之间的相似程度,能够对各个证据之间的冲突情况做出精准判断。
[0149]
由此可知要判断各证据间是否存在冲突,可根据具体情况设定一个阈值,将计算的平均相似度结果与阈值进行比较,如果平均相似度比设定的阈值小,即说明证据存在冲突。
[0150]
(7)构建置信矩阵
[0151]
当利用上述夹角余弦公式判断出各证据间发生冲突时,即引入距离函数来重新分配焦元权重以得到新的bpa,用平均证据来代替冲突证据,最后构建置信矩阵完成多源异构
信息融合。
[0152]
首先,计算每个证据对第k个焦元的平均值,如下式所示:
[0153][0154]
计算每个证据到该焦元平均值的距离,如下式所示:
[0155][0156]
其中,m
ij
表示第i个证据对第j个焦元的基本概率函数值,由此可知若两个证据相似度越高,则dj的值越小。
[0157]
各证据间,每个证据的权重ωi和新的证据对焦元的平均值分别如下所示:
[0158][0159][0160]
其中,ωi为第i个证据的权值,且所有的权值之和为
[0161]
得到权值后,则可重新计算发生冲突的证据的bpa的值,主要过程为:
[0162]
构建置信度矩阵m,如下所示:
[0163][0164]
其中,m
ij
为证据i对焦元j的基本概率分配值,上式中对矩阵的每一行相加满足式如下:
[0165]mi1
m
i2
m
i3


m
im
=1,(i=1,2,3,

n)
[0166]
对矩阵m的第i行转置,然后与第j行相乘,即:
[0167][0168]
即可得到一个新的矩阵a(m*m维):
[0169][0170]
由此可知,新矩阵中对角线上的元素的乘积表示证据i和证据j的融合结果,而其他所有元素的和为融合结果的不确定系数,如下式所示:
[0171]
k'=∑
p≠qmip
×mjq
(p,q=1,2,

m)
[0172]
最后,对多个融合灌溉因子信息进行融合,得到特征数据:
[0173]
[0174]
在步骤s3中,基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理信息系统的评分。具体实施过程如下:
[0175]
需要说明的是,本发明实施例中的改进极限学习机模型是预先构建,并在运用过程中进行在线学习优化参数,其构建过程包括:
[0176]
a、获取变电站运维管理信息系统的历史运行状况(例如日志、图像等,其数据处理过程类同s1,此处不再赘述),并采用critic-熵权法对系统的历史运行状况进行分析,给出不同时间阶段的运行状况评分,并由此转化为标签数据。具体包括:
[0177]
基于critic赋权法,本发明实施例可以构建如下所示的权重计算公式。其中wj即为critic法求得的第j种算法的权重值,r
ij
即为算法i和算法j之间的相关系数,σj即为算法j测算结果的标准差。
[0178][0179]
基于熵权法的计算原理,对原始数据进行无量纲化处理。
[0180]
x

ij
=(x
ij-minxj)/(maxx
j-minxj)
[0181]
其中,x'
ij
和x
ij
分别表示第i年第j项指标的标准化值和原始值,maxxj和minxj分别表示第j项指标的最大值和最小值。
[0182]
根据如下公式求得5种算法结果的信息熵ej,并最终构建如下所示权重计算公式。
[0183][0184][0185]
将两种赋权法进行组合和改进,假设两种赋权法具有相同的地位,构建基于critic和熵权法的组合法,进而实现客观赋权法间的优势互补。
[0186][0187]
基于以上步骤,即可对对系统的历史运行状况进行分析,给出不同时间阶段的运行状况评分,由此转化为标签。
[0188]
权法进行组合,可以减少指标间的离散性,使得赋权结果更为可靠。
[0189]
b、通过标签数据训练极限学习机,得到改进极限学习机模型。具体包括:
[0190]
本发明实施例仅需要把神经网络的隐含层神经元的个数设为一个固定的值,在之后的运算过程中则无需对网络的输入权值和隐含层节点的阈值偏置进行调整,然后可以快速得出唯一的最优解。因此训练速度快且泛化性能好i,包括:
[0191]
给定一个包含n个不同的标签数据组成的训练集,γ={(xj,tj),xj∈rn,tj∈rm,j=1,

,n},其中x为n维的输入变量,t为m维的目标变量输入样本的第i个隐藏节点的输出结果,其作用是将输入层的数据由其原本的空间映射到elm的特征空间。
[0192]
将特征数据输入到预先构建的改进极限学习机模型中,得到变电站运维管理信息系统的评分,具体包括
[0193]
给定一个包含n个不同代表着变电站信息系统健康水平的特征数据的训练集,γ={(xj,tj)xj∈rn,tj∈rm,j=1,

,n},其中x为n维的输入变量,t为m维的目标变量。具有m个隐藏神经元slfn的数学模型的激励函数g(*)可表示为:
[0194][0195]
式中:wi,为连接第i个隐藏节点和输出节点的随机分配的输入权向量;
[0196]bi
为第i个隐藏节点的任意分配偏差;
[0197]
g(wi,bi,xj)为xj输入样本的第i个隐藏节点的输出结果,其作用是将输入层的数据由其原本的空间映射到elm的特征空间。
[0198]
当slfn模型完全逼近样本代表着变电站信息系统健康水平的特征数据,即当输出值与真值之间的误差为零,之间对应关系可表示为:
[0199][0200]
可写成矩阵式:
[0201]
hβ=t
[0202]
其中,
[0203][0204][0205]
电站信息系统健康水平评分的输出权值可利用上式通过寻找slfns最小二乘解得到,其表达式为:
[0206]
β=h
t
t
[0207]
其中,h
t
为信息系统健康水平的特征矩阵h的moore-penrose广义逆,若h
t
h为非奇异矩阵,那么上式可表示为:
[0208]
β=h
t
t=(h
t
h)-1ht
t
[0209]
elm算法的核心是求解输出权重使得误差函数最小,因此我们在elm的loss函数中引入l-2正则化约束提高模型的泛化能力和稳定性。上式可转化为:
[0210][0211]
式中:
[0212]
c为正则化系数;
[0213]
i为单位矩阵;
[0214]
n为变电站信息系统健康水平的特征数据样本个数;
[0215]
l为隐层神经元个数。
[0216]
为克服os-elm的泛化能力急剧退化这一缺点,将tikhonov正则化与os-elm相结合,提出了一种正则化的os-elm,以提高算法的稳定性和泛化能力。为解决样本增加在线学习过程中的时变性和量变性问题,故将遗忘因子(forgetting factor)引入到os-elm当中。
r-elm-ff算法在理论等价于最小化下列基于ff和l-2正则化的最小二乘误差函数:
[0217][0218]
式中:
[0219]
λ为新旧样本权重的ff参数;
[0220]
δ为提高算法稳定性和泛化能力的正则化参数。
[0221]
基于递推计算式,采用递推最小二乘法求解式(9)βk可推导为:
[0222][0223][0224]
然而,随着k的增加,δλk||βk||2呈指数递减趋于零,将导致正则化函数逐渐失效。因此,在fos-elm代价函数中引入一个新的常系数正则化项δ||βk||2代替指数正则化项δλk||βk||2,其代价函数表示为:
[0225][0226]
fos-elm的运行如下:设变电站信息系统健康水平的特征数据样本为数据流的形式,激励函数为g(w,b,x),隐藏神经元数为n,正则化参数为δ,遗忘因子为λ。具体包括:
[0227]
步骤1:初始化。
[0228]
给定初始变电站信息系统健康水平的特征数据训练子集ω
k-1
={(xj,tj)|xj∈rn,|tj∈rm,j=1,

,k-1},执行下述操作:
[0229]
(1)随机生成隐藏层神经元参数(wi,bi),i=1,2,

,n;
[0230]
(2)采用式(4)计算隐藏层输出矩阵
[0231][0232]
(3)计算初始输出权重矩阵
[0233][0234]
其中,
[0235]
t
k-1
=[t1,t2,

,t
k-1
,]
t
[0236]
步骤2:在线学习与预测。
[0237]
对新的变电站信息系统健康水平的特征数据样本(xk,tk)执行以下操作:
[0238]
(1)计算新变电站信息系统健康水平的特征数据样本输入xk:t
jk
=[g(ai,bi,xk)

g(a
nbn
,xk)]的隐含层输出向量;
[0239]
(2)计算网络输出,即xk:t
jk
=hkβ
k-1
的预测值;
[0240]
(3)根据真值tk调整输出权重。
[0241][0242]
[0243][0244]
(4)返回步骤2。
[0245]
在具体实施过程中,所述方法还包括s4,变电站运维管理信息系统根据所述评分,进行更新维护。具体实施过程如下:
[0246]
根据得到的健康状况评分,与历史评分进行对比,不仅仅给出当前的运行优良状况,而且可以根据自己的需要给出不同历史时刻与当前状况的横向对比。进一步的,根据不同历史时期得分的横向对比,找出细化的指标差异,可以对信息系统相应模块进行针对性的维护。
[0247]
本发明实施例还提供一种变电站运维管理信息系统健康诊断系统,包括:
[0248]
数据获取及结构化模块,用于实时获取变电站运维管理信息系统日志和其他信息,并采用基于字符串聚类和模板生成树对所述变电站运维管理信息系统日志进行结构化;
[0249]
数据融合模块,用于通过改进的d-s证据理论模型对结构化后的所述变电站运维管理信息系统日志和其他信息进行融合,得到特征数据;
[0250]
评分模块,用于基于预先构建的改进极限学习机模型和所述特征数据,得到变电站运维管理信息系统的评分。
[0251]
可理解的是,本发明实施例提供的变电站运维管理信息系统健康诊断系统与上述变电站运维管理信息系统健康诊断方法相对应,其有关内容的解释、举例、有益效果等部分可以参考变电站运维管理信息系统健康诊断方法中的相应内容,此处不再赘述。
[0252]
本发明实施例还提供一种计算机可读存储介质,其存储用于变电站运维管理信息系统健康诊断的计算机程序,其中,所述计算机程序使得计算机执行如上述所述的变电站运维管理信息系统健康诊断方法。
[0253]
本发明实施例还提供一种电子设备,包括:
[0254]
一个或多个处理器;
[0255]
存储器;以及
[0256]
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述所述的变电站运维管理信息系统健康诊断方法。
[0257]
综上所述,与现有技术相比,具备以下有益效果:
[0258]
1、本发明实施例采用基于字符串聚类和模板生成树的变电站运维管理信息系统日志解析方法能够准确而高效地从非结构化的变电站运维管理信息系统日志事件中提取出变电站运维管理信息系统日志模板,将非结构化的变电站运维管理信息系统日志转化为直观简洁的信息和规范干净的结构化数据,有利于进行更加高级的分析和处理。同时,本发明通过计算变电站运维管理信息系统日志字符串的相似度,对长度相同的系统变电站运维管理信息系统日志进行聚类,能够减少提取变电站运维管理信息系统日志模板时多余的步骤,提高变电站运维管理信息系统日志解析效率。
[0259]
2、本发明实施例在传统的d-s证据理论合成方法上分别从针对证据源的冲突情况及对从组合规则上进行改进来处理证据体冲突情况,克服证据间的冲突程度越大,融合结果的不确定性越高的一般冲突问题以及证据中某一个焦元的基本概率值为零时,即该证据
对该命题完全不支持,那么即使有其他证据对该命题支持,融合结果对该命题的支持度还是会为零的一票否决问题,找到了一种基于夹角余弦的冲突判断方法和引用距离函数重新分配焦元权重系数并构建置信矩阵的改进d-s证据理论融合算法,以提高算法的准确度和鲁棒性。以便更好地将电力信息系统变电站运维管理信息系统产生的多源异构数据融合,并采用critic-熵权法进行客观评分,将历史数据标签化,为其运维评价提供算法支持。
[0260]
3、本发明实施例为了将融合处理过的特征数据进行标签化,采用critic-熵权法进行客观评分。critic法比其他客观赋权法更为全面和客观,该方法可以考虑各个指标间的对比强度和冲突性,可以综合确定各个指标的客观权重数。critic法结合了均方差法、标准差系数法以及主成分分析法的优势,充分考虑了各个指标之间的对比强度及数据间的关联性,而熵权法则可以从离散程度间接反映指标的重要性。并且将critic法和熵权法进行组合,可以减少指标间的离散性,使得赋权结果更为可靠。
[0261]
4、本发明实施例在基础的极限学习机模型上进行了正则化,为克服os-elm的泛化能力急剧退化的缺点,将tikhonov正则化与os-elm相结合,提出了一种正则化的os-elm,以提高算法的稳定性和泛化能力。以便更好地为电力信息系统变电站运维管理信息系统评分,为其运维提供数据支持。
[0262]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0263]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献