一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于非侵入式负荷分解的用户异常用电行为检测方法与流程

2021-12-07 20:28:00 来源:中国专利 TAG:


1.本发明涉及电力设备检测领域,尤其是涉及一种基于非侵入式负荷分解的用户异常用电行为检测方法。


背景技术:

2.随着电力信息技术的发展,电力系统日益成为一个“电力

信息

社会”高度融合的复杂系统。在智能电网和能源互联网的背景下,电力用户扮演着至关重要的角色,仅仅关注电力系统的物理特性不足以对整个电力系统进行全面的建模,还要充分考虑电力用户行为的建模,从而挖掘其互动特性。如通过用户的用电情况,指导用户合理用电,从而减少碳排放量,对实现“双碳目标”具有重要意义。随着hart在20世纪80年代提出的非侵入式负荷监测(non

intrusive load monitor,nilm)的兴起,为用户的用电行为分析开辟一条新路。
3.非侵入式负荷监测,只需在电力用户入口处采集家庭总用电数据,进而采用负荷分解算法将总用电数据分解成单个电器用电数据。目前,国内外科研工作者已经对负荷分解算法进行了研究。主要包含两种模式,其中一种模式采用高频采样数据完成负荷分解工作,如以负荷的奇次电流谐波幅值、有功功率、无功功率、视在功率和电流波形等为特征建立特征库,采用k

nn结合核fisher算法、adaboost结合bp算法、多目标优化算法、贝叶斯分类模型等算法实现对家庭负荷的识别。但采用高频数据进行负荷分解存在的不足是采集到的电力负荷数据集比较庞大,对内存要求非常高,不适合长期监测及泛化使用。相对来说,另一种模式采用低频采样数据。首先提取用电设备的状态特征,然后采用深度学习算法实现负荷分解,现有的网络模型有序列到序列结合attention模型、seq2point模型、深度序列翻译模型、改进hmm模型和条件生成对抗网络等,此模式对内存要求不高,可行性强。
4.然而,以上研究仅停留在负荷分解算法层面,在进一步的电力用户用电行为分析,尤其是用户异常用电行为检测方面,国内外研究较少。随着对电力需求侧关注度的提高,从用电数据中发掘用户的日常行为习惯逐渐成为热点研究问题。面对当下独居老人增多的现状,此研究可通过用电数据实现对独居老年人安全及健康监测,具有重要意义。目前对用户异常行为检测的算法有高斯混合模型、ds证据理论算法和孤立森林算法。但是,高斯混合模型只给出关于用户日常行为正常性的单一分数,具有模糊性。ds证据理论算法只是对用户行为进行粗略估计,其误判率高。孤立森林算法只适用于少量数据,当数据量大且复杂时,准确率会降低。虽然用户的行为存在一定的规律性,但同时也伴随着不确定性和复杂性,这导致现有研究中仍然存在误判率高、稳定性低的问题。
5.经过检索,中国专利公开号cn112633421a公开了一种用户异常用电行为检测方法及装置,具体公开了包括:响应于获取的用户原始数据,对用户原始数据进行数据预处理,使得到优化用电数据;响应于获取的优化用电数据,对训练模型进行训练并生成xgboost检测模型;基于遗传算法对xgboost检测模型进行参数优化,使确定xgboost检测模型的最佳超参数组合;将待检测数据输入xgboost检测模型中,基于最佳超参数组合进行判断某一优化用电数据是否异常。采用遗传算法对xgboost检测模型的参数进行调优,实现对多个
xgboost模型超参数的同时优化,最终得到具有性能优良的异常用电检测模型。但是该现有技术存在误差较大,且检测率较低等问题。


技术实现要素:

6.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种精确度高、稳定性高的基于非侵入式负荷分解的用户异常用电行为检测方法。
7.本发明的目的可以通过以下技术方案来实现:
8.根据本发明的第一方面,提供了一种基于非侵入式负荷分解的用户异常用电行为检测方法,该方法包括以下步骤:
9.步骤s1:采用kmeans聚类算法提取负荷状态特征;
10.步骤s2:对经过kmeans聚类后所得各电器的状态特征进行状态编码;
11.步骤s3:采用序列到序列翻译模型seq2seq进行负荷分解;
12.步骤s4:采用支持向量机svm进行用户异常用电行为检测。
13.优选地,所述步骤s1具体为:采用kmeans聚类算法提取各电器状态特征,并以输出的聚类中心作为分解后各电器的状态功率值。
14.优选地,所述步骤s1具体包括以下步骤:
15.步骤s11:针对某个电器的用电数据,初步随机选出对于某电器的用电数据,初步随机选出k个聚类中心μ1,μ2,...,μ
k

16.步骤s12:假设该电器有m个样本点x1,x2,...,x
m
,计算各样本点x
i
到所选聚类中心的距离:
[0017][0018]
其中:f函数为各个样本点距离其所属样本中心点距离的平均值;c
(i)
为第i个样本所属类的中心点的下标k;
[0019]
步骤s13:对于中心点μ
j
,j=1,2,

,k,计算属于该中心点的所有样本的坐标平均值,把该平均值作为这些样本新的中心点;
[0020]
步骤s14:判断新中心点与原中心点是否一致,若不一致,重复步骤s12~s13;若一致,则输出聚类中心,并将聚类中心作为该电器的状态功率值。
[0021]
优选地,所述步骤s2具体为:将经过kmeans聚类后所得的各电器的状态进行状态编码;
[0022]
假设某一电器a有n个状态,则它的编码状态有:
[0023]
t
a
={0,1,

,n

1}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0024]
假设一家庭住宅中有m个家用电器,电器l(1≤l≤m)的工作状态有n
l
个,则总的状态组合数y为:
[0025][0026]
将每个电器的工作状态进行组合,得到一个对应的状态组合编码为:
[0027]
t
co
={t1,t2,

,t
m
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0028]
优选地,所述步骤s3中的seq2seq模型包括进行特征提取的编码器和进行特征分
解的解码器,用于实现总电力负荷数据和状态组合码之间一对一的映射训练,具体表现为:
[0029]
x
t

t
co
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0030]
其中:x
t
为模型的输入,代表为t时刻智能电表采集的总功率,t
co
为模型的输出,代表t时刻各电器的状态组合编码。
[0031]
优选地,所述编码器和解码器各为一个神经网络;所述神经网络为长短时记忆网络lstm。
[0032]
优选地,所述步骤s4包括以下步骤:
[0033]
步骤s41:计算各电器每小时功耗,并以天为单位,将电器用电数据转变为24维数据集;设给定一特征空间的p天的某一电器的训练集为b={(x
i
,y
i
)|i=1,2,...,p},其中x
i
∈r
p
,其中x
i
为24维向量,y
i
∈{

1,1},其中

1代表异常,1代表正常;建立分离超平面模型f(w):
[0034]
f(w)=w
t
x
i
b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0035]
其中:w为24为向量,b为常数;
[0036]
步骤s42:定义函数间隔为特征空间中的样本点到超平面的距离,表示为:
[0037][0038]
令γ表示训练集中所有样本点和超平面距离的最小值,为一非负常数;
[0039]
步骤s43:确定目标函数为:
[0040][0041]
步骤s43:引入松弛变量ξ
i
,则目标函数转化为:
[0042][0043]
其中:g为惩罚因子,g值越大,对误分类的惩罚就越大;
[0044]
步骤s44:针对目标函数构建拉格朗日函数,对每个不等式约束引入拉格朗日乘子λ
i

i
≥0,则拉格朗日函数可表示为:
[0045][0046]
引入kkt条件,具体为:
[0047][0048]
其中l为拉格朗日函数;
[0049]
将式(11)得到的结果代入式(10)可得:
[0050][0051]
由式(12)可得:
[0052][0053]
其中w*为所求超平面的系数;
[0054]
由于将式(13)带入可得:
[0055][0056]
其中b*为所求超平面的截距,(x
k
,y
k
)∈b,1≤k≤p;
[0057]
将式(13)和式(14)代入式(6)中即可得到分离超平面,将各电器用电数据分解为正常和异常两部分。
[0058]
优选地,所述步骤s42中的γ的取值不影响该问题的求解,故取γ=1。
[0059]
根据本发明的第二方面,提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现上述的方法。
[0060]
根据本发明的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的方法。
[0061]
与现有技术相比,本发明具有以下优点:
[0062]
本发明提出了一种基于seq2seq和svm双层融合的非侵入式用户异常用电行为检测算法。首先采用kmeans无监督聚类算法提取负荷状态特征,并以聚类中心作为用电器的状态值,减小了分解结果的误差;其次采用深度学习中的seq2seq模型进行负荷分解以达到提高分解准确率和降低分解误差的目的;最后采用支持向量机svm对能反映用户行为的多种家用电器的能耗数据进行用户异常行为检测,从而准确地检测出用户异常用电情况,此发明对未来监测独居老人的健康安全具有重大意义。
附图说明
[0063]
图1为基于非侵入式负荷分解的用户异常用电行为检测系统框图;
[0064]
图2为kmeans聚类算法流程图;
[0065]
图3为seq2seq网络模型图。
具体实施方式
[0066]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
[0067]
本发明针对现有问题,提出一种seq2seq与svm双层融合算法实现对用户异常的用电行为检测。首先通过kmeans聚类算法提取负荷状态特征,然后采用seq2seq模型,实现总电力负荷数据和状态组合码之间一对一映射训练,得到单个电器用电数据,最后将各电器数据转变为24维数据集,通过svm算法寻找最优分离超平面,将数据集分为正常和异常两部分。在分解性能方面达到减小分解结果误差和提高分解准确度的效果,而且多种电器结合分析实现了对用户的异常行为检测。具体包括以下步骤:
[0068]
步骤s1:kmeans聚类算法提取负荷状态特征
[0069]
由于kmeans聚类算法是无监督分类算法,只需在其输入端输入某个电器用电数据,聚类后可得到该电器工作状态;且kmeans算法以各样本点到聚类中心的最小值为目标函数,因此采用kmeans聚类算法提取各电器状态特征,并以聚类中心作为分解后各电器的状态功率值,可减小分解结果的误差。如图2所示为kmeans算法流程图,具体步骤如下:
[0070]
步骤s11:对于某电器的用电数据,初步随机选出k个聚类中心μ1,μ2,


k

[0071]
步骤s12:假设该电器有m个样本点x1,x2,

,x
m
,计算各样本点x
i
到所选聚类中心的距离,使得每个样本点距离其所属类的中心点的距离比距离其他类的中心点的距离都近。具体计算过程如下:
[0072][0073]
式中:f函数为各个样本点距离其所属样本中心点距离的平均值。c
(i)
为第i个样本所属类的中心点的下标k。
[0074]
步骤s13:对于中心点μ
j
,j=1,2,

,k,计算属于该中心点的所有样本的坐标平均值,把该平均值作为这些样本新的中心点。
[0075]
步骤s14:判断新中心点与原中心点是否一致,若不一致,重复步骤s12~s13,若一致,则输出聚类中心,并将聚类中心作为该电器的状态功率值,具体流程图如图2所示。则经过kmeans聚类之后提取出的各电器状态功率值如表1所示。
[0076]
表1提取出的各电器状态功率值(单位/w)
[0077] 状态1状态2状态3总状态数冰箱0121 2厨房灯03424253微波炉01554 2洗碗机011723293热水壶02329 2洗衣机018219023
[0078]
步骤s2:将经过kmeans聚类后所得的各电器的状态进行状态编码
[0079]
假设某一电器a有n个状态,则它的编码状态有:
[0080]
t
a
={0,1,...,n

1}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0081]
例如,热水壶只有开启和关闭两种状态,则它的状态编码为{0,1}。
[0082]
假设一家庭住宅中有m个家用电器,电器l(1≤l≤m)的工作状态有n
l
个,则总的状态组合数y为:
[0083][0084]
每个电器的工作状态进行组合得到一个对应的状态组合编码可以表示为:
[0085]
t
co
={t1,t2,...,t
m
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0086]
步骤s3:序列到序列翻译模型(seq2seq)
[0087]
经过状态编码后,通过序列到序列翻译模型(sequence to sequence,seq2seq)进行负荷分解,seq2seq模型是由谷歌公司提出的用于文本翻译的模型,它能够实现对字符串顺序的记忆,而数据的组成相比于字符串的组成更简单些,因此采用seq2seq模型可较好地实现总电力负荷数据和状态组合码之间一对一的映射训练。可以表示为:
[0088]
x
t

t
co
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0089]
式中:x
t
为t时刻智能电表采集的总功率,t
co
为t时刻各用电器的状态组合编码。
[0090]
该模型的结构如图3所示,它是一种序列到序列结构,主要由编码器和解码器两部分组成。编码器的作用是进行特征提取,即把输入序列压缩成一个包含序列语义的向量c;解码器的作用是进行特征分解,即把语义向量再转化成具体的序列,这个过程也叫做翻译。{x1,x2,

,x
t
}为模型的输入,代表电表采集到的各时刻的总电力负荷数据,{t
co1
,t
co2
,

,t
cot
}为模型的输出,代表各电器的状态组合码。
[0091]
编码器和解码器各为一个神经网络,本文使用的是长短时记忆网络(lstm),因为它具有记录序列前后顺序的功能,从而获得序列的顺序特点与意义特点,并且对这种特点进行解码,实现序列到序列的转换。:
[0092]
步骤s4:svm算法进行异常行为检测
[0093]
采用支持向量机算法进行用户异常用电行为检测。支持向量机(support vector machine,svm)可视为广义的线性分类器,它基于结构风险最小化对特征进行学习从而建立泛化能力强的分类预测模型,其核心思想是通过非线性变化将输入空间变换到一个高维的特征空间,svm通过在特征空间进行学习来寻找最优分离超平面,而其学习策略就是间隔最大化,可形式化为求解凸二次规划问题
[17]
。支持向量机常用来解决二分类问题,适用于本文区分用户的正常和异常用电行为的分类问题。
[0094]
选取能够反映用户行为习惯的家用电器微波炉、厨房灯、洗碗机、水壶进行异常行为分析。计算各电器每小时功耗,并以天为单位,将电器用电数据转变为24维数据集;设给定一特征空间的p天的某一电器的训练集为b={(x
i
,y
i
)|i=1,2,...,p},其中x
i
∈r
p
,其中x
i
为24维向量,y
i
∈{

1,1},其中

1代表异常,1代表正常;则该分离超平面模型f(w)可表示为:
[0095]
f(w)=w
t
x
i
b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0096]
式中:w为24维向量,b为常量。将特征空间中样本点到超平面的距离定义为函数间
隔,可表示为:
[0097][0098]
令γ表示训练集中所有样本点和超平面距离的最小值,由于γ的取值不会影响问题的求解,故取γ=1。
[0099]
则该问题转变成为一个带p个约束的凸二次规划问题,可表示为:
[0100][0101]
在实际问题中,训练样本集多为线性不可分,故引入一个松弛变量ξ
i
,则目标函数转化为:
[0102][0103]
式中:g为惩罚因子,g值越大,对误分类的惩罚就越大。
[0104]
为求解该问题,构建拉格朗日函数(lagrange function),利用拉格朗日函数的对偶性,对每个不等式约束引入拉格朗日乘子(lagrange multiplier)λ
i

i
≥0。拉格朗日函数可表示为:
[0105][0106]
为求解上述问题,需引入kkt(karush

kuhn

tucker)条件,具体为:
[0107][0108]
将式(11)得到的结果代入式(10)可得:
[0109][0110]
由式(12)可得:
[0111]
[0112]
由于将式(13)带入可得:
[0113][0114]
将式(13)和式(14)代入式(6)中即可得到分离超平面,将各电器用电数据分解为正常和异常两部分。
[0115]
本发明电子设备包括中央处理单元(cpu),其可以根据存储在只读存储器(rom)中的计算机程序指令或者从存储单元加载到随机访问存储器(ram)中的计算机程序指令,来执行各种适当的动作和处理。在ram中,还可以存储设备操作所需的各种程序和数据。cpu、rom以及ram通过总线彼此相连。输入/输出(i/o)接口也连接至总线。
[0116]
设备中的多个部件连接至i/o接口,包括:输入单元,例如键盘、鼠标等;输出单元,例如各种类型的显示器、扬声器等;存储单元,例如磁盘、光盘等;以及通信单元,例如网卡、调制解调器、无线通信收发机等。通信单元允许设备通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0117]
处理单元执行上文所描述的各个方法和处理,例如方法s1~s4。例如,在一些实施例中,方法s1~s4可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元。在一些实施例中,计算机程序的部分或者全部可以经由rom和/或通信单元而被载入和/或安装到设备上。当计算机程序加载到ram并由cpu执行时,可以执行上文描述的方法步骤s1~s4的一个或多个步骤。备选地,在其他实施例中,cpu可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法s1~s4。
[0118]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
[0119]
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0120]
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0121]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替
换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献