一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于电能参数特征和改进Boruta-XGBoost算法的窃电检测方法与流程

2022-09-04 05:52:30 来源:中国专利 TAG:

技术特征:
1.一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,具体步骤如下:步骤一、从电力计量大数据中提取正常用户和不同种类窃电用户的电能参数数据,并进行预处理;步骤二、对步骤一中预处理后的电能参数数据进行特征变换,并使用改进了特征评分方式的boruta算法对变换得到的特征数据进行优选,根据选择结果构造用于建立xgboost窃电类型检测模型的数据集;步骤三、使用步骤二中得到的数据集,对改进了正则项的xgboost模型进行训练,建立xgboost窃电类型检测模型,使用训练后的模型对用户是否存在窃电行为以及窃电的类型进行检测。2.根据权利要求1所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述步骤一中预处理具体为:对提取的电能参数进行剔除异常值和填充缺失值的处理。3.根据权利要求2所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述异常值剔除的方法为:对任一用户的任一种电能参数数据采用无监督学习的k-means聚类法进行聚类,直接删除聚类中心与其他聚类中心之间距离超出设定距离阈值的且其中样本数少于设定样本阈值的聚类簇内的所有样本;所述缺失值填充的方法为:(1)对负荷数据中的缺失值,使用拉格朗日插值法进行填充;(2)除负荷数据外的电能参数数据,按采集时间的顺序扫描存在的缺失,依次填充缺失值,具体为:

a
i
缺失且a
i 2
,a
i 1
,a
i-1
,a
i-2
不缺失时,

a
i
,a
i 1
缺失且a
i 2
,a
i-1
,a
i-2
不缺失时,

a
i
,a
i 1
,a
i 2
缺失且a
i-1
,a
i-2
不缺失时,

其他情况下,不进行缺失值填充;其中,a
i 2
,a
i 1
,a
i
,a
i-1
,a
i-2
分别为i 2,i 1,i,i-1,i-2时刻的电能参数数据,为i时刻的填充值。4.根据权利要求1所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述步骤二中使用不同特征指标对步骤一中预处理后的电能参数数据进行描述。5.根据权利要求4所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述特征指标包括:电压不平衡度、电流不平衡度、额定电压偏离度、失压缺相标记、功率因数异常指标、电流相关系数、电压稳定程度、电流稳定程度、用电量离散系数、负荷变化趋势。6.根据权利要求1所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,使用改进了特征评分方式的boruta算法对特征数据进行优选,具体为:根据xgboost分类器的误差定义boruta算法中特征的重要性评分:其中,z为重要性评分,是误差的平均值,sdmse是误差的标准差。7.根据权利要求1所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述步骤三中对xgboost分类器中正则项的改进为:对xgboost算法中
目标函数的正则项增加随机因子,增加随机因子后的目标函数如下:其中,obj是目标值,是损失函数,y
j
表示预测值以及真实值,ω(f
k
)是目标函数的正则项,f
k
表示第k颗树的复杂度,ρ为增加的随机因子,ρ的表达式如下:其中,σ为常量,n(0,1)为取值服从0-1的正态分布,rand(0,1)为0~1之间的随机数,μ为中间变量,μ
max
、μ
min
分别为预设中间变量的最大值和最小值。8.根据权利要求1所述的一种基于电能参数特征和改进boruta-xgboost算法的窃电检测方法,其特征在于,所述步骤三中采用贝叶斯搜索和k折交叉验证完成xgboost模型的训练。

技术总结
本发明公开了一种基于电能参数特征和改进Boruta-XGBoost算法的窃电检测方法,包括数据预处理、特征工程、模型训练三个步骤。在数据预处理中,对用户端计量电表采集的多种电能参数中的异常值和缺失值进行处理;在特征工程中,对预处理后的电能参数进行特征提取,然后使用改进的Boruta算法对特征进行优选,根据优选结果构造用于训练窃电检测模型的数据集;模型训练使用特征工程中得到的数据集,建立基于改进XGBoost算法的窃电类型检测模型。与现有技术相比,本发明的窃电检测方法能够根据电能参数的特征判断用户是否存在窃电行为以及窃电的类型,有助于技术人员对窃电用户进行有针对性的现场检查,提高窃电检测效率,降低窃电检测成本。检测成本。检测成本。


技术研发人员:陈霄 仇新宇 裴子霞 马云龙 杭银丽 方磊 施沩 张驰 鲁燕 薛海涛 李建刚
受保护的技术使用者:国网江苏省电力有限公司
技术研发日:2022.06.15
技术公布日:2022/9/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献