一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于改进式生成对抗网络的用户窃电检测方法与流程

2021-12-12 22:33:00 来源:中国专利 TAG:


1.本发明涉及一种基于改进式生成对抗网络的用户窃电检测方法。


背景技术:

2.现今为减少用电成本,国内外的窃电行为屡见不鲜。窃电行为不仅会影响电网健康稳定运行,还将造成难以估量的经济损失。因此,研究检测窃电行为具有十分重要的意义。
3.近年来,随着电力系统信息化、智能化程度不断提高,智能电表广泛应用于用户侧,采集了种类杂、维度高、数量多的电力负荷数据,为基于数据挖掘的用户窃电检测提供了数据支撑。
4.现有的用户窃电检测方法主要有两类:一种是基于系统状态的检测方法,一种是基于数据驱动的检测方法。
5.基于系统状态的检测方法是通过对比智能电表采集的用电数据和电网系统各个节点的真实数据之间的差异性,从而定位窃电用户。上述方法依赖于配电网的结构参数,而在电网实际运行中,其拓扑结果和节点数据处于不断变化中,导致此方法的窃电检测效率低下。
6.基于数据驱动的检测方法是根据窃电用户和正常用户的用电行为差异进行的,可具体划分为以下三类检测方式:一是基于分类的检测方法,其利用正常用户和窃电用户之间的特征差异进行检测;二是基于回归的检测方法,其利用用户实际用电量和预测用电量的偏差进行检测;三是基于聚类的方法,其通过特征提取寻找用电行为表现异常的用户。
7.上述方式虽在窃电检测方面取得一定成效,但在实际中,窃电样本占比小,数据类别不平衡问题突出,导致窃电检出率较低,难以直接应用于实际检测工作中。


技术实现要素:

8.本发明的目的在于提供一种基于改进式生成对抗网络的用户窃电检测方法,为窃电行为检测提供参考依据。
9.为实现上述目的,本发明的技术方案是:一种基于改进式生成对抗网络的用户窃电检测方法,针对正常用户和窃电用户用电行为的周期性差异,提取不同用户的周期用电特征,通过生成对抗网络模型学习窃电用户用电数据的复杂时空分布,生成窃电样本,并与原始训练集进行拼接,增强训练集中的窃电样本,而后训练窃电检测模型,实现用户窃电检测。
10.在本发明一实施例中,所述生成对抗网络模型,通过引入wasserstein距离,建立改进式生成对抗网络模型。
11.在本发明一实施例中,该方法具体实现方式如下:
12.步骤1、建立gan模型:
13.以窃电用户的历史日用电量为真实数据,定义一组随机噪声数据z作为gan中生成
器的输入,以p
z
(z)表示z的概率分布,以p
data
(x)表示历史窃电数据x的概率分布,以g(z)表示生成器输出的数据样本,以p
g
(z)表示g(z)的概率分布;
14.定义判别器的输入为历史窃电数据x或生成器生成的数据g(z),其输出为d(g(z)),表示输入数据服从历史窃电数据分布p
data
(x)的概率;
15.根据生成器与判别器的训练目标,分别构造生成器和判别器的损失函数l
g
和l
d
如下:
[0016][0017][0018]
式中,e表示分布函数的期望值,z~p
z
(z)表示z采样于随机噪声数据z的概率分布,x~p
data
(x)表示x采样于历史窃电数据x的概率分布;
[0019]
生成器的优化目标是将式(1)最小化,判别器的优化目标是将式(2)最大化;将式(1)和式(2)相结合,可得到gan训练过程中的目标函数:
[0020][0021]
步骤2、引入wasserstein距离,搭建wgan:
[0022]
wasserstein距离的定义如下:
[0023][0024]
式中,ω(p
data
,p
g
)是以p
data
和p
g
为边缘分布的联合概率分布γ的集合;(u,v)~γ表示从联合概率分布γ中随机抽取的历史样本和生成样本,||u

v||表示两个样本间的距离,e
(u,v)~γ
[||u

v||]表示样本对距离的期望,inf表示下界值,所有期望值的下界值即wasserstein距离;
[0025]
步骤3、周期性特征提取和归一化:
[0026]
分析正常用户和窃电用户的周期性用电表现的差异,以周、月、年为统计周期,提取所有用户包括用电量均值、标准差的特征指标作为周期用电特征,表征用户的平均用电水平、用电波动情况的用电表现;
[0027]
为消除因特征数据间量纲、数值水平不同造成的影响,统一各类周期特征数据对模型训练的贡献水平,对所有周期特征进行数据归一化处理,公式如下:
[0028][0029]
式中,x
i
表示周期用电特征,min(x
i
)表示相同维度下的周期用电特征最小值,max(x
i
)表示相同维度下的周期用电特征最小值,z表示经归一化处理后的周期用电特征;
[0030]
步骤4、以真实窃电样本中的训练样本作为条件y,与符合标准正态分布的高维噪声拼接后一并输入生成器,输出生成样本;
[0031]
步骤5、将真实窃电样本与生成样本拼接后作为生成数据样本,输入判别器,输出对真实数据样本和生成数据样本的判别值;
[0032]
步骤6、分别计算生成器和判别器的损失函数,采用rmsprop优化算法对生成器和判别器的网络权重参数进行优化更新;此时一轮训练结束,返回步骤4进行下一轮训练;
[0033]
rmsprop优化算法的公式如下:
[0034][0035]
式中,s
dw
和s
db
表示损失函数在前几次迭代过程中累积的梯度动量,α为学习率,β是一个代表梯度累积的参数;rmsprop算法计算了梯度的微分平方加权平均数,为防止权重或偏置变化量过大,当dw或者db中出现较大值时,将此变化量除以累积的梯度动量,以满足梯度摆动幅度值的要求;同时,为避免分母为零而造成奇异,在分母中加入一个较小的参数ε;
[0036]
步骤7、当训练结束后,保留wgan中的生成器模型,输入历史窃电样本,输出若干个生成窃电数据;将生成的窃电样本与原始训练集进行拼接,增强训练集中的窃电样本;训练窃电检测模型,将训练好的分类模型用以检测测试集中的窃电用户。
[0037]
在本发明一实施例中,所述wgan模型的生成器结构:生成器使用4层全连接网络,隐藏层神经元个数均为256个,激活函数选取relu,输出层神经元个数与真实窃电负荷序列维度一致,激活函数选取sigmoid。
[0038]
在本发明一实施例中,所述wgan模型的判别器结构:判别器网络采用4层全连接结构,隐藏层分别堆放256和128个神经元,激活函数为leakyrelu函数,输出层不用激活函数。
[0039]
在本发明一实施例中,步骤6中,rmsprop优化算法的学习率α=2
×
10
‑4,参数β=0.9。
[0040]
相较于现有技术,本发明具有以下有益效果:
[0041]
(1)传统生成对抗网络算法的损失函数和模型结构存在一定的不足,导致最终测试的效果表现不佳。本实施例所提出的方法通过引入wasserstein距离,增加生成对抗网络模型的稳定性。
[0042]
(2)与传统的生成对抗网络算法相比,本实施例所提出的方法扩充的窃电数据的准确度更高,能够更好地拟合历史窃电用户用电量数据的概率分布。同时,避免模型训练过程中少数类样本被多数类样本吞没的情况,提升检测模型的训练实效。
[0043]
(3)基于周期特征提取的方式可依据正常用户和窃电用户间的用电行为周期性差异,提取周期性用电特征,更好地表征不同用户的用电表现。同时进行数据降维,提升模型训练效率。
[0044]
综上,本发明提出的基于改进式生成对抗网络的用户窃电检测方法,仅需建立wgan模型学习历史窃电数据的概率分布,即可增强原始窃电数据,更高效地实现数据扩充,
简化算法流程;通过引入wasserstein距离,提升wgan模型的稳定性;增强窃电数据的同时,通过提取不同用户的周期用电特征,突出正常用户和窃电用户用电行为差异,更好地提升分类模型训练效果。因此本发明提出的方法具有优越性。
附图说明
[0045]
图1为本发明一种基于改进式生成对抗网络的用户窃电检测方法流程图。
具体实施方式
[0046]
下面结合附图,对本发明的技术方案进行具体说明。
[0047]
本发明一种基于改进式生成对抗网络的用户窃电检测方法,针对正常用户和窃电用户用电行为的周期性差异,提取不同用户的周期用电特征,通过生成对抗网络模型学习窃电用户用电数据的复杂时空分布,生成窃电样本,并与原始训练集进行拼接,增强训练集中的窃电样本,而后训练窃电检测模型,实现用户窃电检测。所述生成对抗网络模型,通过引入wasserstein距离,建立改进式生成对抗网络模型。
[0048]
以下为本发明具体实现过程。
[0049]
本发明方法以历史窃电用户的每日用电量为源数据,通过改进式生成对抗网络模型学习窃电数据的复杂时空分布,生成目标窃电样本,且所生成的数据符合真实窃电场景下的数据分布规律。
[0050]
(1)在生成对抗网络的基础上,引入wasserstein距离,建立改进式生成对抗网络(wasserstein generative adversarial networks,wgan)模型,提升wgan模型的训练稳定性。
[0051]
(2)基于所建立的wgan模型,提出了一种窃电数据生成方法,从而解决正常样本和窃电样本之间的类别不平衡问题。
[0052]
(3)提出了一种基于用户周期用电行为的特征提取方式,通过对比正常用户和窃电用户用电行为的周期性差异,提取月用电特征、年用电特征等周期指标作为分类器特征输入,使得分类模型更好地识别不同用户之间的用电差异,提升模型窃电检测效果。
[0053]
如图1所示,具体的本发明一实施例的实现步骤如下:
[0054]
步骤1:建立gan模型;
[0055]
以窃电用户的历史日用电量为真实数据,定义一组随机噪声数据z作为gan中生成器的输入,以p
z
(z)表示z的概率分布,以p
data
(x)表示历史窃电数据x的概率分布,以g(z)表示生成器输出的数据样本,以p
g
(z)表示其概率分布。
[0056]
定义判别器的输入为历史窃电数据x或生成器生成的数据g(z),其输出为d(g(z)),表示输入数据服从历史数据分布p
data
(x)的概率。
[0057]
根据生成器与判别器的训练目标,分别构造生成器和判别器的损失函数l
g
和l
d
如下:
[0058]
[0059][0060]
式中,e表示分布函数的期望值,z~p
z
(z)表示z采样于随机噪声数据z的概率分布,x~p
data
(x)表示x采样于历史窃电数据x的概率分布;
[0061]
生成器的优化目标是将式(1)最小化,判别器的优化目标是将式(2)最大化。将式(1)和式(2)相结合,可得到gan训练过程中的目标函数:
[0062][0063]
步骤2:引入wasserstein距离,搭建wgan;
[0064]
wasserstein距离的定义如下:
[0065][0066]
式中,ω(p
data
,p
g
)是以p
data
和p
g
为边缘分布的联合概率分布γ的集合;(u,v)~γ表示从联合概率分布γ中随机抽取的历史样本和生成样本,||u

v||表示两个样本间的距离,e
(u,v)~γ
[||u

v||]表示样本对距离的期望,inf表示下界值,所有期望值的下界值即wasserstein距离;
[0067]
步骤3:周期性特征提取和归一化;
[0068]
分析正常用户和窃电用户的周期性用电表现的差异,以周、月、年为统计周期,提取所有用户的用电量均值、标准差等特征指标作为周期用电特征,表征用户的平均用电水平、用电波动情况等用电表现。
[0069]
为消除因特征数据间量纲、数值水平不同造成的影响,统一各类周期特征数据对模型训练的贡献水平,对所有周期特征进行数据归一化处理,公式如下:
[0070][0071]
式中,x
i
表示周期用电特征,min(x
i
)表示相同维度下的周期用电特征最小值,max(x
i
)表示相同维度下的周期用电特征最小值,z表示经归一化处理后的周期用电特征。
[0072]
步骤4:以真实窃电样本中的训练样本作为条件y,与符合标准正态分布的高维噪声拼接后一并输入生成器,输出生成样本;
[0073]
wgan模型的生成器结构如下所示:
[0074]
生成器使用4层全连接网络,隐藏层神经元个数均为256个,激活函数选取relu,输出层神经元个数与真实窃电负荷序列维度一致,激活函数选取sigmoid;
[0075]
步骤5:将真实窃电样本与生成样本拼接后作为生成数据样本,输入判别器,输出对真实数据样本和生成数据样本的判别值;
[0076]
wgan模型的判别器结构如下所示:
[0077]
判别器网络采用4层全连接结构,隐藏层分别堆放256和128个神经元,激活函数为leakyrelu函数,输出层不用激活函数。
[0078]
步骤6:分别计算生成器和判别器的损失函数,采用rmsprop优化算法对生成器和判别器的网络权重参数进行优化更新。设定rmsprop优化算法的学习率=2
×
10
‑4,参数=0.9。
[0079]
此时一轮训练结束,返回步骤4进行下一轮训练;
[0080]
rmsprop优化算法的公式如下:
[0081][0082]
式中,s
dw
和s
db
表示损失函数在前几次迭代过程中累积的梯度动量,β是一个代表梯度累积的参数。rmsprop算法计算了梯度的微分平方加权平均数,为防止权重或偏置变化量过大,当dw或者db中出现较大值时,将此变化量除以累积的梯度动量,以满足梯度摆动幅度值的要求。同时,为避免分母为零而造成奇异,一般在分母中加入一个较小的参数ε。
[0083]
步骤7:当训练结束后,保留wgan中的生成器模型,输入历史窃电样本,输出若干个生成窃电数据。将生成的窃电样本与原始训练集进行拼接,增强训练集中的窃电样本。训练窃电检测模型,将训练好的分类模型用以检测测试集中的窃电用户。
[0084]
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献