一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于集成深度生成模型的变电站设备故障诊断方法与流程

2022-11-28 11:27:16 来源:中国专利 TAG:


1.本发明涉及变电站设备故障诊断领域,更具体涉及基于集成深度生成模型的变电站设备故障诊断方法。


背景技术:

2.随着变电站建设的发展和完善,对数据处理提出了更高的要求。如何收集具有感知和监控能力的各类数据并进行故障检测是一个关键的研究问题。变电站设备作为变电站的重要组成部分,运行时会产生海量异构电力时序数据,对这些数据进行实时故障检测并分析故障形成的原因,有助于提高特高压设计、建设、运维水平,确保变电站的安全与稳定。
3.目前行业内已经开展了利用各种深度学习模型来检测电力时间序列数据的异常的研究。这些模型依靠多维网络结构来挖掘时空分布特征。特别是考虑到时间序列的时空特性,一些当前的模型,如隐马尔可夫和局部异常因子已经达到了较高的检测精度。
4.大多数现有的时间序列异常检测研究都受到电力数据的随机性和复杂性的限制。这些问题可以归纳如下:1、现有方法难以有效提取电力数据的时间信息,限制了数据特征表示的能力。时间关系和特征关系缺乏结合,限制了模型的准确性;2、现有的符号化检测方法,如中国专利公开号cn114218998a,公开的一种基于隐马尔可夫模型的电力系统异常行为分析方法,在符号化之前没有提取特征,因此忽略了数据的有效信息。长符号序列使噪得声影响计算效率,由于电压和电流波动引起的数据噪声,很容易被检测为异常的电力运行样本。这会导致异常检测的性能下降;现有的基于相似度的检测方法,如局部异常因子方法,适用于数据点的聚集程度高、离群点较少的情况。同时,因为相似度算法通常需要对每一个数据分别进行相应计算,所以这类算法通常计算量大,不太适用于数据量大、维度高的电力数据;3、由于电力数据的准确标注需要大量的人工成本,在现实中经常面临标注数据不足的问题。因此,如何充分利用少量的标注数据进一步提升模型性能是异常检测任务的关键问题。


技术实现要素:

5.本发明所要解决的技术问题在于如何充分利用少量的标注数据进一步提升故障诊断性能。
6.本发明通过以下技术手段实现解决上述技术问题的:基于集成深度生成模型的变电站设备故障诊断方法,所述方法包括:
7.步骤一:采集变电站设备运行数据,进行数据预处理,构建样本训练数据集和随机潜在数据集;
8.步骤二:构建基于双向长短期记忆网络和注意力机制的ambi-gan集成深度生成模型;
9.步骤三:训练ambi-gan集成深度生成模型;
10.步骤四:向训练好的模型输入测试数据,计算模型的总损失l
test

11.步骤五:通过1-l
test
得到鉴别分数,鉴别分数超过预设值则判断异常。
12.本发明对gan模型进行了相应的改进,提出了基于双向长短期记忆网络和注意力机制的生成对抗网络集成深度生成模型ambi-gan,该模型基于双向长短期记忆网络构建,可以捕获时间序列的依赖性,有效提取电力数据的时间特征,提高模型的准确性,并且基于gan模型固有性能,能够根据有限的真实电力数据生成大量模拟数据,从而充分利用了少量的标注数据,计算量小,原始的数据量小,人工成本小,且通过训练能够降低噪声对数据的影响,实现了对电力时间序列的异常检测,提高多维时间序列异常的检测精度,进一步提升故障诊断性能。
13.进一步地,所述步骤一中数据预处理包括:
14.将输入数据分为样本训练数据集和随机潜在数据集,样本训练数据集中的所有数据都是正常的,随机潜在数据集中存在异常数据,使用长度为n的滑动时间窗将所有数据划分为若干个等长的子序列。
15.进一步地,所述步骤二包括:
16.步骤2.1、构建bi-lstm结构;
17.步骤2.2、在bi-lstm结构加入注意力机制得到ambi-lstm结构;
18.步骤2.3、分别利用ambi-lstm结构得到生成器和鉴别器,生成器和鉴别器整体构成ambi-gan集成深度生成模型。
19.更进一步地,所述步骤2.1包括:
20.构建双向lstm网络作为bi-lstm结构,其中,双向lstm网络的输入为x={x1,...xn},xn表示第n个时刻的输入;
21.所述bi-lstm结构的隐藏层状态为
[0022][0023][0024]
其中,lstm
backward
为后向lstm,lstm
forward
为前向lstm,x
t
表示第t个时刻的输入,表示第t 1时刻后向lstm的隐藏状态,表示第t-1时刻前向lstm的隐藏状态;
[0025]
n个时刻的隐藏层状态输出为
[0026][0027]
更进一步地,所述步骤2.2包括:
[0028]
通过公式设置bi-lstm结构的输入权重,从而在bi-lstm结构加入注意力机制得到ambi-lstm结构;其中,wi表示第i个时刻bi-lstm结构的权重参数,softmax为归一化函数,bi-lstm(x,h)表示bi-lstm结构的输出;
[0029]
ambi-lstm结构的输出为
[0030]
[0031]
表示第i个时刻输入矩阵的转置,表示第i个时刻隐藏状态矩阵的转置。
[0032]
更进一步地,所述步骤三包括:
[0033]
步骤3.1、生成器的输入为随机潜在数据集,计算生成器的数据分布均值;
[0034]
步骤3.2、设计鉴别器的鉴别模型;
[0035]
步骤3.3、根据鉴别模型设置目标函数,不断调整网络的权重参数和数据分布均值,使生成器的输出样本的均值与样本训练数据集的均值不断接近,使目标函数迭代达到纳什均衡,则停止训练。
[0036]
更进一步地,所述步骤3.1包括:
[0037]
生成器的输入样本z={z1,
…zn
}为随机潜在数据集中的数据序列,生成器的输出样本的均值为
[0038][0039]
其中,zi为输入到生成器中的第i个数据,p(
·
)为输出的概率密度函数,log(
·
)为对数函数;
[0040]
在训练过程中,不断优化网络权重参数w,并且使输出样本e(z)与样本训练数据集的均值不断接近。
[0041]
更进一步地,所述步骤3.2包括:
[0042]
当鉴别器的输入为样本训练数据集,则鉴别器的鉴别模型为
[0043]ex
~p
data(x)
log(d(x))
[0044]
其中,p
data(x)
表示输入数据x的概率分布,e
x
~p
data(x)
表示满足p
data(x)
分布的变量x的均值,d(x)表示鉴别器对x的输出;
[0045]
当鉴别器的输入为生成器的输出g(z),则鉴别器的鉴别模型为
[0046]ex
~p
z(z)
log(1-d(g(z)))
[0047]
其中,p
z(z)
表示随机潜在数据z的概率分布,e
x
~p
z(z)
表示满足p
z(z)
分布的z的均值,d(g(z))表示鉴别器对g(z)的输出。
[0048]
更进一步地,所述步骤3.3包括:
[0049]
通过公式
[0050]
mingmaxdv(d,g)=e
x
~p
data(x)
log(d(x)) e
x
~p
z(z)
log(1-d(g(z)))
[0051]
构建目标函数;
[0052]
生成器的输出g(z)作为鉴别器的输入,不断调整网络的权重参数和数据分布均值,使生成器产生的数据可以被鉴别器判别为真实数据,即目标函数迭代达到纳什均衡,则停止训练。
[0053]
更进一步地,所述步骤四包括:
[0054]
将原始样本测试数据直接输入训练好的ambi-gan集成深度生成模型,通过公式计算鉴别损失值,其中,表示模型训练过程中第k次迭代输入到生成器中的模型子序列n={ni,i=1,2,

,n},x
test,i
代表原始测试数据中的第i个数据,代表生成器的输出;
[0055]
通过公式计算总损失,其中,λ表示可调参数,表示重建损失。
[0056]
本发明的优点在于:
[0057]
(1)本发明对gan模型进行了相应的改进,提出了基于双向长短期记忆网络和注意力机制的生成对抗网络集成深度生成模型ambi-gan,该模型基于双向长短期记忆网络构建,可以捕获时间序列的依赖性,有效提取电力数据的时间特征,提高模型的准确性,并且基于gan模型固有性能,能够根据有限的真实电力数据生成大量模拟数据,从而充分利用了少量的标注数据,计算量小,原始的数据量小,人工成本小,且通过训练能够降低噪声对数据的影响,实现了对电力时间序列的异常检测,提高多维时间序列异常的检测精度,进一步提升故障诊断性能。
[0058]
(2)本发明构建目标函数,生成器的输出g(z)作为鉴别器的输入,生成器期望减小目标函数值让其生成的数据分布无法被判别,鉴别器的输出d(x)希望增大目标函数值让其可以高效的判别出数据的真假类别,通过对生成器和鉴别器相互博弈,不断调整网络的权重参数和数据分布均值,使生成器产生的数据可以被鉴别器判别为真实数据,即目标函数迭代达到纳什均衡,从而实现异常数据的精准识别。
[0059]
(3)本发明通过计算鉴别损失和重建损失,从而计算总损失l
test
,总损失l
test
体现了真实值和预测值之间的差距,将1-l
test
定义为计算鉴别分数,当前超过预设值时判断存在故障,以此可以达到时间序列异常检测的目的,检测方式不需要复杂的计算过程,简单方便。
附图说明
[0060]
图1为基于集成深度生成模型的变电站设备故障诊断方法中逻辑过程框架图。
具体实施方式
[0061]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0062]
如图1所示,基于集成深度生成模型的变电站设备故障诊断方法,所述方法包括:
[0063]
s1:数据预处理,构建样本训练数据集和随机潜在数据集;
[0064]
采集变电站设备运行数据,使用长度为n的滑动时间窗将所有数据划分为若干个等长的子序列,以每个子序列为一个样本,检测每个子序列是否异常,选取所有正常的样本构建样本训练数据集,将掺杂异常样本的数据序列构建随机潜在数据集,从而保证样本训练数据集中的所有数据都是正常的,随机潜在数据集中存在异常数据。
[0065]
s2:构建基于双向长短期记忆网络和注意力机制的ambi-gan集成深度生成模型;
[0066]
步骤2.1、构建bi-lstm结构;
[0067]
构建双向lstm网络作为bi-lstm结构,双向lstm网络属于现有技术,本发明没有改进其网络架构,仅仅在步骤2.2中通过增加权重参数使得该网络结构增加注意力机制,其
中,双向lstm网络的输入为x={x1,

xn},xn表示第n个时刻的输入;
[0068]
所述bi-lstm结构的隐藏层状态为
[0069][0070][0071]
其中,lstm
backward
为后向lstm,lstm
forward
为前向lstm,x
t
表示第t个时刻的输入,表示第t 1时刻后向lstm的隐藏状态,表示第t-1时刻前向lstm的隐藏状态。
[0072]
n个时刻的隐藏层状态输出为
[0073][0074]
步骤2.2、在bi-lstm结构加入注意力机制得到ambi-lstm结构;
[0075]
通过公式设置bi-lstm结构的输入权重,从而在bi-lstm结构加入注意力机制得到ambi-lstm结构;其中,wi表示第i个时刻bi-lstm结构的权重参数,softmax为归一化函数,bi-lstm(x,h)表示bi-lstm结构的输出;
[0076]
ambi-lstm结构的输出为
[0077]
表示第i个时刻输入矩阵的转置,表示第i个时刻隐藏状态矩阵的转置。
[0078]
步骤2.3、分别利用ambi-lstm结构得到生成器和鉴别器,生成器和鉴别器整体构成ambi-gan集成深度生成模型,需要说明的是,生成器和鉴别器网络结构相同,都是ambi-lstm结构,只是输入数据不同,生成器输入的是随机潜在数据集,而鉴别器输入的是样本训练数据集以及生成器的输出。
[0079]
s3:训练ambi-gan集成深度生成模型;训练过程中通过更新权重参数和数据分布均值,使得目标函数达到纳什均衡,权重参数在上述步骤2.2中已经解释,下面详细介绍数据分布均值的计算,以及如何训练模型。
[0080]
步骤3.1、生成器的输入为随机潜在数据集,计算生成器的数据分布均值;
[0081]
生成器的输入样本z={z1,
…zn
}为随机潜在数据集中的数据序列,生成器的输出样本的均值为
[0082][0083]
其中,zi为输入到生成器中的第i个数据,p(
·
)为输出的概率密度函数,log(
·
)为对数函数;
[0084]
在训练过程中,不断优化网络权重参数w,并且使输出样本e(z)与样本训练数据集的均值不断接近。
[0085]
步骤3.2、设计鉴别器的鉴别模型;
[0086]
当鉴别器的输入为样本训练数据集,则鉴别器的鉴别模型为
[0087]ex
~p
data(x)
log(d(x))
[0088]
其中,p
data(x)
表示输入数据x的概率分布,e
x
~p
data(x)
表示满足p
data(x)
分布的变量x的均值,d(x)表示鉴别器对x的输出;
[0089]
当鉴别器的输入为生成器的输出g(z),则鉴别器的鉴别模型为
[0090]ex
~p
z(z)
log(1-d(g(z)))
[0091]
其中,p
z(z)
表示随机潜在数据z的概率分布,e
x
~p
z(z)
表示满足p
z(z)
分布的z的均值,d(g(z))表示鉴别器对g(z)的输出。
[0092]
步骤3.3、通过公式
[0093]
mingmaxdv(d,g)=e
x
~p
data(x)
log(d(x)) e
x
~p
z(z)
log(1-d(g(z)))
[0094]
构建目标函数;
[0095]
生成器g的输出g(z)作为鉴别器d的输入,期望减小v让其生成的数据分布无法被判别,鉴别器的输出d(x)希望增大v让其可以高效的判别出数据的真假类别。通过对生成器和鉴别器相互博弈,不断调整网络的权重参数和数据分布均值,使生成器产生的数据可以被鉴别器判别为真实数据,即目标函数迭代达到纳什均衡,则停止训练。
[0096]
s4:以上训练好模型以后,利用该训练好的模型进行异常数据检测,向训练好的模型输入测试数据,计算模型的总损失l
test
,通过该总损失l
test
进一步判断异常。主要过程如下:
[0097]
步骤4.1、鉴别损失计算。将原始样本测试数据直接输入鉴别器,计算测试空间残差r,函数表示为:
[0098][0099]
其中,nk表示模型子序列n={ni,i=1,2,...,n}在模型训练过程中进行了k次迭代的结果,x
test
代表原始测试数据,代表生成器amb
i-lstm网络的输出。通过计算i个时刻残差总和,异常检测模型得到鉴别损失值r(x
test
):
[0100][0101]
其中,表示模型训练过程中第k次迭代输入到生成器中的模型子序列n={ni,i=1,2,

,n},x
test,i
代表原始测试数据中的第i个数据,代表生成器的输出;
[0102]
步骤4.2、总损失计算。在时间序列异常检测过程中,检测结果由鉴别损失和重建损失两部分组成。通过计算鉴别损失和重建损失之和得到总损失,结果如下式:
[0103][0104]
其中,λ表示可调参数,表示重建损失,重建损失值是向鉴别器中输入测试数据以后鉴别器的直接输出结果。
[0105]
s5:得到的损失l
test
表示真实值与预测值之间的差距,将1-l
test
定义为计算鉴别分数,鉴别分数超过预设值则判断异常,以此可以达到时间序列异常检测的目的。1-l
test
大于
等于0.5时表示正常,小于0.5时表示异常。
[0106]
通过以上技术方案,本发明对gan模型进行了相应的改进,提出了基于双向长短期记忆网络和注意力机制的生成对抗网络集成深度生成模型ambi-gan,该模型基于双向长短期记忆网络构建,可以捕获时间序列的依赖性,有效提取电力数据的时间特征,提高模型的准确性,并且基于gan模型固有性能,能够根据有限的真实电力数据生成大量模拟数据,从而充分利用了少量的标注数据,计算量小,原始的数据量小,人工成本小,且通过训练能够降低噪声对数据的影响,实现了对电力时间序列的异常检测,提高多维时间序列异常的检测精度,进一步提升故障诊断性能。
[0107]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献