一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于混合特征选择和深度学习的配网故障预测方法与流程

2022-02-20 13:15:15 来源:中国专利 TAG:


1.本发明属于电力系统及其自动化技术领域,尤其涉及一种基于混合特征选择和深度学习的配网故障预测方法。


背景技术:

2.配电网位于电力系统的末端,与用户紧密相连,其直接向用户配电和供电,配电网的运行状态将直接影响用户的用电质量,用户要求供电系统在任何时间内都能满足供电需求,对供电的可靠性要求较高,一旦出现停电事件将会影响用户的体验感,造成不良影响。统计结果表明,用户故障停电事件绝大多数是由配电网故障导致的,如能对配电网故障进行有效预测,提前进行运维检修,将减少停电事件,可提高供电可靠性。在现有技术中,电缆线路所占比例越来越大且电缆线埋藏在地下不宜直观的发现问题,一旦发生问题往往会影响多条线路,其影响力较大。同时,现有的配电网结构越来越复杂,规模越来越庞大,设备数量越来越多,而有限的人力物力只能放在重点线路的监测上,并不能及时的维护所有线路,导致有的线路只有在发生故障后才能进行运维。
3.配电自动化开始于20世纪70年代,早期主要是通过自动化开关设备的相互配合来实现配电的自动化。早期在欧美发达国家等地区,时限顺序送电装置得到应用,该装置用于自动隔离故障区间,加快查找馈线故障地点。随着电子及自动控制技术的发展,西方国家提出了配电自动化系统的概念,各种配电自动化设备相继被开发和应用,如智能化自动重合器、自动分段器及故障指示器等,实现了局部馈线自动化。后续进入了系统监控自动化阶段,实现了包括远程监控、故障自动隔离及恢复供电、电压调控、负荷管理等实时功能在内的配电自动化技术和终端设备,但也由于计算机技术的限制,当时的配电自动化系统多限于单项自动化系统。配电网监控与管理综合自动化,配电自动化受到广泛关注,地理信息系统技术有了很大的发展,开始应用于配电网的管理,形成了离线的自动绘图及设备管理系统、停电管理系统等,并逐步解决了管理的离线信息与实时scada/da系统的集成问题。在一些发达国家,出现了涉及配电自动化领域的系统设备厂家及其各具特色的配电自动化产品。进入21世纪以来,随着计算机技术的迅猛发展,欧美等发达国家提出了高级配电自动化及智能化电网的概念,把配电自动化提升到了一个新的高度。新技术的发展要求配电网具有互动化、信息化、自动化特征,同时具备接纳大量分布式能源的能力,配电网开始向智能化方向发展。
4.随着配电自动化技术逐步发展,配电自动化终端开始呈现井喷式增长,终端所记录的海量数据得以储存,如何利用配电自动化终端记录的海量数据进行配电网故障预测和判断,从而改变配电网运维人员日常巡检方式,改被动抢修为主动抢修,提高供电稳定性和用户满意度,减少停电时间,增加供电可靠性。


技术实现要素:

5.本发明的目的在于提供一种基于混合特征选择和深度学习的配网故障预测方法,
从而克服了现有配电网数据类型多样,不利于配电网故障预测及判断的缺点。
6.为实现上述目的,本发明提供了一种基于混合特征选择和深度学习的配网故障预测方法,包括以下步骤:
7.通过配电信息系统数据库获取配电网数据;
8.对所述配电网数据进行预处理,得到数据集;
9.采用混合模型特征选择方法对所述数据集进行特征选取,选取与配电网故障最为相关的数据类型作的特征;
10.构建深度信念网络预测模型;
11.对所述深度信念网络预测模型进行优化;
12.确定优化后的深度信念网络预测模型的输入为选取的特征,输出为配电网的故障类型。
13.优选地,所述配电网数据包括::配电信息系统数据库中的营销系统、调度自动化系统、配电自动化系统、计量自动化系统、资产管理系统、配电地理信息系统、配电线路在线监测系统以及智能公用配变监测系统记录的历史数据。
14.优选地,所述数据集包括配电网数据的类型和类型的个数。
15.优选地,对所述配电网数据进行预处理包括:采用平均插值法对所述配电网数据中缺失、遗漏数据进行修复与补齐,同时,采用最大值最小值归一化方法对数据进行归一化处理,并构建数据集。
16.优选地,采用改进免疫粒子群算法对所述深度信念网络预测模型进行优化。
17.优选地,所述改进免疫粒子群算法为采用汉明距离进行计算抗体浓度,对免疫粒子群优化算法进行改进。
18.优选地,所述混合模型故障特征选择方法包括以下步骤:
19.从数据集中选取特征;
20.通过皮尔逊系数的特征相关性计算方法计算所述特征的相关性;
21.通过余弦相似度的特征相关性计算方法计算所述特征的相关性;
22.通过改进互信息的特征相关性计算方法计算所述特征的相关性;
23.采用均值方法对三种特征相关性计算方法计算得到的相关性进行计算,得到总相关性值;
24.通过组合证据理论方法分析三种特征相关性方法在计算不同影响因素与对应故障类型的相关性的贡献程度得到特征总相关计算结果;
25.通过所述总相关性值和特征总相关计算结果计算出不同影响因素与对应故障类型的相关性,采用权重系数方法确定不同影响因素与对应故障类型的最终的相关值,根据所述最终的相关值对所述特征进行选取。
26.优选地,所述配电网的故障类型包括:单相接地故障、高阻接地故障和无故障三种类型。
27.与现有的技术相比,本发明具有如下有益效果:
28.本发明所提供的基于混合特征选择和深度学习的配网故障预测方法,通过配电网信息通过数据库获取电网数据,对配电网数据进行预处理,得到数据集;采用混合模型特征选择方法对数据集进行特征选取,选取与配电网故障最为相关的数据类型作的特征,配电
网故障数据类型繁多,不同的数据类型对配电网故障的影响程度不完全相同,需要对不同数据类型进行特征选择,筛选影响程度较高的数据类型;构建深度信念网络预测模型,并对深度信念网络预测模型进行优化,深度信念网络预测模型的关键性参数对预测结果的影响举足轻重,优化后的深度信念网络预测模型有利于提高深度信念网络预测模型的预测准确性;确定优化后的深度信念网络预测模型的输入为选取的特征,输出为配电网的故障类型,从而通过配电网数据能够对配电网故障预测。
29.本发明不但有效的解决了配电网故障预测过程中不同数据类型复杂,不利于预测模型的训练和预测,而且采用改进免疫粒子群算法对深度信念网络预测模型的关键性参数进行优化,避免深度信念网络预测模型训练过程中陷入局部最优解以及过拟合情况,有利于提高深度信念网络预测模型的准确性。
30.采用本发明不但可以有效的对多维配电网历史数据进行针对性选取和处理,优化深度信念网络预测模型输入,还可以筛选不同数据类型,以提高预测模型的准确性,对于配电网故障分析和预测具有强大的理论支撑。
附图说明
31.为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1是本发明一种基于混合特征选择和深度学习的配网故障预测方法的流程图。
具体实施方式
33.下面结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
34.图1示出了本发明所提供的其中一个实施例基于混合特征选择和深度学习的配网故障预测方法,包括以下步骤:
35.s1、通过配电信息系统数据库获取配电网数据;
36.s2、对配电网数据进行预处理,得到数据集;
37.s3、采用混合模型特征选择方法对数据集进行特征选取,选取与配电网故障最为相关的数据类型作的特征;
38.s4、构建深度信念网络预测模型;
39.s5、并对深度信念网络预测模型进行优化;
40.s6、确定优化后的深度信念网络预测模型的输入为选取的特征,输出为配电网的故障类型。
41.上述的基于混合特征选择和深度学习的配网故障预测方法,通过配电网信息通过数据库获取电网数据,对配电网数据进行预处理,得到数据集;采用混合模型特征选择方法对数据集进行特征选取,选取与配电网故障最为相关的数据类型作的特征,配电网故障数据类型繁多,不同的数据类型对配电网故障的影响程度不完全相同,需要对不同数据类型
进行特征选择,筛选影响程度较高的数据类型;构建深度信念网络预测模型,并对深度信念网络预测模型进行优化,深度信念网络预测模型的关键性参数对预测结果的影响举足轻重,优化后的深度信念网络预测模型有利于提高深度信念网络预测模型的预测准确性;确定优化后的深度信念网络预测模型的输入为选取的特征,输出为配电网的故障类型,从而通过配电网数据能够对配电网故障预测。
42.其中一个实施例,步骤s1中,数据集包括配电网数据的类型和类型的个数。
43.其中一个实施例,步骤s1中,配电网数据包括:配电信息系统数据库中的营销系统、调度自动化系统、配电自动化系统、计量自动化系统、资产管理系统、配电地理信息系统、配电线路在线监测系统以及智能公用配变监测系统记录的历史数据。
44.具体的,步骤s1形成的数据集表示为:
[0045][0046]
式(1)中,aa、bb、cc、dd、ee、ff、gg、hh分别为营销系统、调度自动化系统、配电自动化系统、计量自动化系统、资产管理系统、配电地理信息系统、配电线路在线监测系统、智能公用配变监测系统记录的数据类型及类型个数。
[0047]
每个系统记录的数据类型可以具体表示为:
[0048]ai
=(a
i1
,a
i2
,

,a
in
)
t
,1≤i≤a
[0049]bi
=(b
i1
,b
i2
,

,b
in
)
t
,1≤i≤b
[0050]ci
=(c
i1
,c
i2
,

,c
in
)
t
,1≤i≤c
[0051]di
=(d
i1
,d
i2
,

,d
in
)
t
,1≤i≤d
[0052]ei
=(e
i1
,e
i2
,

,e
in
)
t
,1≤i≤e
[0053]fi
=(f
i1
,f
i2
,

,f
in
)
t
,1≤i≤f
[0054]gi
=(g
i1
,g
i2
,

,g
in
)
t
,1≤i≤g
[0055]hi
=(h
i1
,h
i2
,

,h
in
)
t
,1≤i≤h
[0056]
其中一个实施例,构建的数据集来源于对原始数据的搜集,需要考虑数据搜集过程中的数据缺失、遗漏情况以及不同数据类型的量纲问题,步骤s2中,对所述配电网数据进行预处理包括:采用平均插值法对所述配电网数据中缺失、遗漏数据进行修复与补齐,同时,采用最大值最小值归一化方法对数据进行归一化处理,并构建数据集,降低不同数据类型因为量纲不同而导致预测误差。
[0057]
具体的,采用平均插值法进行缺失数据修复与补齐的计算公式为:
[0058][0059]
式(2)中,xi′
为第i个缺失数据被修复与补齐后的数值,x
i-1
为第i个缺失数据前一个数据值,x
i 1
为第i个缺失数据后一个数据值。
[0060]
对预处理数据的最大值最小值归一化方法计算公式为:
[0061][0062]
式(3)中,为归一化值,xi为原数据序列数值,x
min
为原数据序列最小值,x
max
为原数据序列最大值。
[0063]
其中一个实施例,配电网故障数据类型繁多,不同的数据类型对配电网故障的影响程度不完全相同,需要对不同数据类型进行特征选择,筛选影响程度较高的数据类型,步骤s3采用混合模型特征选择方法进行特征选择,选取与配电网故障最为相关的数据类型作为深度信念网络预测模型的输入。
[0064]
其中一个实施例,步骤s3中,混合模型故障特征选择方法包括以下步骤:
[0065]
s31、从数据集中选取特征;所述特征是指搜集所有的数据集中的每个数据类型,数据有多少个数据类型,就有多少个特征;
[0066]
s32、通过皮尔逊系数的特征相关性计算方法计算所述特征的相关性;
[0067]
具体的,基于皮尔逊系数的特征相关性计算,皮尔逊相关是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法,更多的是从线性角度出发研究能源需求的影响因素与能源需求本身的相关性,皮尔逊相关系数ρ1(x,y)计算公式为:
[0068][0069]
式(4)中,x和y均为变量;e(x)和e(y)分别为变量x和y的期望。
[0070]
s33、通过余弦相似度的特征相关性计算方法计算所述特征的相关性;
[0071]
具体的,余弦相似性通过测量两个向量夹角的余弦值来度量它们之间的相关性,将数据映射到二维向量空间。余弦相似度的特征相关性ρ2(x,y)计算公式为:
[0072][0073]
s34、通过改进互信息的特征相关性计算方法计算所述特征的相关性;
[0074]
具体的,互信息是信息论里一种有用的信息度量,它表示信息之间相互包含的内在联系,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。改进互信息的特征相关性ρ3(x,y)计算公式为:
[0075][0076]
式(6)中,p(x)和p(y)分别为变量x和y的边缘分布;p(x,y)为变量x和y的联合概率分布。
[0077]
当变量x和y相互独立时,通过引入kullback-leibler散度,改进互信息可以表示为:
[0078]
[0079]
s35、采用三种方法从不同角度计算故障类型的影响因素与故障类型本身的相关性,因而在三种方法的权重方面实施平均策略,采用均值方法对三种特征相关性计算方法计算得到的相关性进行计算,得到总相关性值;
[0080]
具体的,均值方法的公式为:
[0081][0082]
式(8)中,为总相关性值。
[0083]
s36、通过组合证据理论方法分析三种特征相关性方法在计算不同影响因素与对应故障类型的相关性的贡献程度得到特征总相关计算结果;
[0084]
具体的,基于组合证据理论的特征总相关性计算,组合证据理论方法是近年发展起来的一种不精确推理理论,属于人工智能范畴,最早大量应用于专家系统中,具有处理不确定信息的能力。作为一种不确定推理方法,证据理论满足比贝叶斯概率论更弱的条件,具有直接表达“不确定”和“不知道”的能力,广泛应用于多种算法的组合模型中。因此,通过组合证据理论方法分析皮尔逊相关系数、余弦相似度和改进互信息理论三种方法在计算不同影响因素与对应故障类型的相关性的贡献程度,从而确定不同影响因素与对应故障类型的相关值。
[0085]
组合证据理论方包括以下步骤:
[0086]
s3601、对组合证据理论的基本定义进行设定,包括:设定θ为识别框架,设定基本信任分配函数、信度函数、似真度函数和信度区间等。
[0087]
s3602、考虑不同子证据体的相对重要性不同,引入置信度系数κ来修正证据合成前的信度m(a)分配。修正过户的信度函数值m

(a)和不确定证据的信度函数值m

(θ)如式(9)所示;
[0088][0089]
s3603、给定同一个识别框架内不同证据体的信度函数,利用合成法则可以计算出不同子证据体合成后的信度函数。合成法则为:
[0090][0091]
式(10)中,an为第n个信度,mn为第n个mass函数。
[0092]
s3604、确定不同子证据体合成后的信度函数后,利用相应的推理规则进行评估目标判定,推理规则为:
[0093][0094]
式(11)中,fi为评估得到的状态等级;m(fi)为评估结果的信度函数值;m(fj)为其他状态的信度函数值;m(θ)为不确定信度函数值。κ1和κ2为根据专家经验和技术标准预先
设定的阈值,这里κ1和κ2取值分别为0.4和0.2。
[0095]
s3605、通过计算不同证据个体的最大信度函数值,按照最大值原则选取经过合成法则的最大信度函数值最高的,切满足推理规则的最大信度函数值作为特征总相关计算结果ρ
x,y

[0096]
ρ
x,y
=max(m(f1),m(f2),...,m(fn))
ꢀꢀ
(12)
[0097]
s37、通过所述总相关性值和特征总相关计算结果计算出不同影响因素与对应故障类型的相关性,采用权重系数方法确定不同影响因素与对应故障类型的最终的相关值,根据所述最终的相关值对所述特征进行选取。权重系数方法公式为:
[0098][0099]
式(13)中,α和β分别为两个不同的权重系数,α和β满足α β=1。一般情况下,α=β=0.5。
[0100]
其中一个实施例,步骤s4中,深度信念网络是以受限玻尔兹曼机为基础发展而来的,沿袭了受限玻尔兹曼机强大的特征提取能力,通过对多个受限玻尔兹曼机的堆栈叠加,可以有效地提取原始信号的深层特征,并通过顶层的分类器选择的不同实现对输入信号的分类和预测。构建深度信念网络预测模型包括以下步骤:
[0101]
s41、在算法中引进受限玻尔兹曼机,通过计算受限玻尔兹曼机具有的能量状态(v,h),能量状态(v,h)具体计算公式为:
[0102][0103]
式(14)中,θ=(ω
ij
,ai,bj)为受限玻尔兹曼机的关键性参数,n和m分别为明显层和隐藏层的神经元数量,xi和yi均为变量;vi为明显层第i个神经元;hi为隐藏层第i个神经元;ω
ij
为神经元i和j之间的权重值。
[0104]
s42、计算能量函数所决定的能量状态(v,h)受限玻尔兹曼机概率分布,具体计算公式为:
[0105][0106]
式(15)中,∑∑exp(-e(v,h|θ))为归一化因子。
[0107]
s43、分别计算不同层级内的受限玻尔兹曼机第j个隐藏神经元及第i个明显神经元被激活的概率:
[0108][0109][0110]
式(16)中,p(hj=1|v,θ)为受限玻尔兹曼机第j个隐藏神经元被激活的概率,p(vi=1|h,θ)为受限玻尔兹曼机第i个明显神经元被激活的概率。
[0111]
s44、引入对比散度和不同参数变化量计算准则,包括:考虑学习率ξ的参数更新准
则,具体的,更新准则包括以下步骤:
[0112]
s4401、通过引入对比散度来训练明显神经元与隐藏神经元的状态,利用对数似然函数对学习模型参数的θ进行求导,下面以权重参数ω
ij
的模型参数求导为例:
[0113][0114]
式(18)中,《v
ihj
》d为数据分布的期望,《v
ihj
》r为受限玻尔兹曼机定义的期望,p(vi|θ)为明显层第i个神经元的概率分布。
[0115]
s4402、根据不同参数变化量计算准则,更新不同关键性参数变化量计算准则为:
[0116][0117]
式(19)中,δw
ij
为偏差权重值,δai为神经元i的偏差偏置值,δbj为神经元j的偏差偏置值,《vi》d为神经元i的数据分布期望,《vi》r为神经元i的受限玻尔兹曼机定义期望,《hj》d为神经元j的数据分布期望,《hj》r为神经元j的受限玻尔兹曼机定义期望。
[0118]
s4403、考虑学习率γ的参数更新准则,更新考虑学习率γ的关键性参数更新准则为:
[0119][0120]
式(20)中,为神经元i和神经元j的第k 1次更新权重值;为神经元i和神经元j的第k次更新权重值;为神经元i的第k 1次更新偏置值;为神经元i的第k次更新偏置值;为神经元j的第k 1次更新偏置值;为神经元j的第k次更新偏置值。
[0121]
s4404、重复步骤s4401-s4403,实现多层栈式堆叠的受限玻尔兹曼机训练,计算层级之间的最为适宜的关键性参数,包括权重和阈值等,从而构建深度信念网络预测模型。
[0122]
其中一个实施例,采用改进免疫粒子群算法对所述深度信念网络预测模型进行优化。利用改进免疫粒子群算法对深度信念网络的关键性参数进行寻优,有利于提高预测模型的收敛速度,避免在寻优过程中陷入局部最优解,提升了深度信念网络预测模型的预测准确性。
[0123]
免疫粒子群算法是是鉴于生物自身的免疫反应而发展起来的一种算法。借助于模仿生物免疫机制,结合基因的进化机理,人工构造出的一种新型智能优化算法。考虑到免疫粒子群优化算法的抗体浓度基本上采用抗体适应度的近似程度来计算,并不能真实反映抗体间的本质关系。因此,改进免疫粒子群算法为采用汉明距离进行计算抗体浓度,对免疫粒子群优化算法进行改进。具体包括以下步骤:
[0124]
s51、抗体亲和力用来表示抗体对抗原的匹配程度,通过适应度函数评价,适应度越高,表示亲和力越高。抗体亲和力为:
[0125]ai
=f(xi)
ꢀꢀ
(21)
[0126]
式(21)中,ai表示第i个抗体的亲和力度。
[0127]
s52、抗体浓度通过抗体与抗体之间的亲和力计算。抗体与抗体间亲和力反映了抗体之间的相似程度,目前文献都以抗体适应度的近似程度来计算抗体浓度,并不能真实反映抗体间的本质关系。本技术采用汉明距离进行计算。汉明距离表示两个长度相同的字符串对应位数不同的数量,即汉明距离表示为两个抗体对应坐标不同的维的数量。由于此处采用整实数混合编码,抗体u和抗体v的汉明距离s
uv
计算公式为:
[0128][0129][0130]
式(22)和式(23)中,k
ud
表示公式中的中间变量;x
ud
和x
vd
表示抗体u和抗体v第d维的值;ld表示第d维的长度;n表示变量的维数;tol表示阈值。
[0131]
s53、据抗体间的汉明距离计算得到抗体浓度:
[0132][0133][0134]
式(24)和式(25)中,t
uv
表示公式中的中间变量;s表示阈值;cu表示第u次迭代中的浓度;n表示粒子总数。
[0135]
若抗体间的汉明距离s
uv
小于阈值,则认为其位置近似相同。抗体浓度为位置近似相同的粒子占总粒子数的比例。
[0136]
s54、抗体亲和力和和抗体浓度共同决定了群体中每个个体的期望选择概率,期望选择概率的计算公式为:
[0137][0138]
式(26)中,pu表示第u个个体的期望选择概率;α表示一个常数;au表示抗体u的亲和力;cu表示抗体u的抗体浓度。
[0139]
其中一个实施例,配电网的故障类型包括:单相接地故障、高阻接地故障和无故障三种类型。
[0140]
综上,本发明一种基于混合特征选择和深度学习的配网故障预测方法,利用混合模型特征选择方法对预处理得到的数据集进行特征选择,确定预测模型的输入,采用深度信念网络构建预测模型,并针对预测模型关键性过于随机化,采用改进免疫粒子群算法对预测模型关键性参数进行优化,得到优化后的深度信念网络预测模型,通过优化后的深度信念网络预测模型实现配电网故障预测,将故障类型具体划分为单相接地故障、高阻接地
故障和无故障三种类型。
[0141]
以上所揭露的仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或变型,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献