一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于DBSCAN聚类的负荷异常检测方法及系统与流程

2022-08-10 18:46:35 来源:中国专利 TAG:

技术特征:
1.一种基于dbscan聚类的负荷异常检测方法,其特征在于,所述方法包括:步骤1,采集负荷异常数据;步骤2,对负荷异常数据进行预处理后得到可靠数据集;将可靠数据集划分为训练集和测试集;步骤3,搭建dbscan聚类模型,以训练集为输入,以异常类型聚类簇为输出,对聚类模型进行训练;步骤4,使用训练好的聚类模型对测试集进行聚类,以轮廓系数作为聚类结果评价指标,以获得负荷异常的多个辨识类型簇。2.根据权利要求1所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤1中,负荷数据包括:有功功率和无功功率;异常数据主要包括两种类型:一种是由于数据缺损导致负荷数据波形中产生尖峰,另一种就是由于冲击负荷和信道噪声使得负荷数据波形中出现大量的毛刺。3.根据权利要求1所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤2包括:步骤2.1,采用拉格朗日插值法去除负荷异常数据中的间断点;步骤2.2,采用改进小波阈值去噪算法去除负荷异常数据中的噪声点;步骤2.3,经过步骤2.1和2.2处理后得到可靠数据集,对可靠数据集按2:1的比例划分为训练集和测试集。4.根据权利要求1所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤3包括:步骤3.1,建立输入集合d={x1,x2,

,x
m
}和邻域∈,j=1,2,

,m;步骤3.2,初始化核心对象集合,即令ω=φ;初始化聚类簇数,即令k=0;初始化未访问样本集合,即令γ=d;初始化异常类型聚类簇,即令c=φ;步骤3.3,每次迭代寻找时令k=k 1;利用距离度量方法,迭代寻找全部的核心对象;步骤3.4,若核心对象集合ω=φ,则迭代结束,进入步骤3.8;若核心对象集合ω≠φ,则进入步骤3.5;步骤3.5,在核心对象集合ω中,随机选择第一个核心对象o,初始化当前簇核心对象队列,即令ω
cur
={o},初始化当前簇样本集合,即令c
k
={o},更新未访问样本集合,即令γ=γ-{o};步骤3.6,如果当前簇核心对象队列则当前聚类簇c
k
生成完毕,更新簇划分集合c={c1,c2,...,c
k
},更新核心对象集合,即令ω=ω-c
k
,并转入步骤3.3;否则更新核心对象集合,即令ω=ω-c
k
;步骤3.7,在当前簇核心对象队列ω
cur
中取出第二个核心对象o

,通过邻域距离阈值找出第二个核心对象在邻域∈中中对应的子样本集n

(o

),令δ=n

(o

)∩γ,更新当前簇样本集合,即令c
k
=c
k
∪δ,更新未访问样本集合,即令γ=v-δ,更新当前簇核心对象队列,即令ω
cur
=ω
cur
∪(δ∩ω)-o

,并转入步骤3.3;步骤3.8,输出异常类型聚类簇c={c1,c2,...,c
k
}。5.根据权利要求4所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,
步骤3.1中,对于第j个样本x
j
在邻域∈中对应的子样本集n

(x
j
)至少包含minpts个样本,minpts=5。6.根据权利要求4所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤3.3中,距离度量方法包括kd树实现法;从训练集中提取w维特征以获得kd树模型;其中,计算w维特征的取值的方差,用方差最大的第w维特征作为根节点,并选取第w维特征的取值的中位数对应的样本作为划分点;对特征的取值小于第w维特征的取值的中位数的样本均划入左子树,对特征的取值大于第w维特征的取值的中位数的样本均划入右子树;对于左子树和右子树,再采用用方差最大的第v维特征作为父节点,递归生成kd树模型;利用kd树模型在测试集中预测样本目标点的最近邻;其中,对于一个样本目标点,首先在kd树模型里面找到包含样本目标点的叶子节点,以样本目标点为圆心,以样本目标点到叶子节点的距离为半径,得到一个超球体;返回叶子节点的父节点,检查父节点对应的另一个子节点包含的超矩形体是否和超球体相交,如果相交,则进入叶子节点寻找是否有更加接近的近邻;如果不相交;返回父节点的父节点,在另一个子树搜索最近邻;当回溯到根节点时,算法结束,此时保存的最近邻节点就是预测得到的样本目标点的最近邻。7.根据权利要求5所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤3.4中,如果子样本集n

(x
j
)中样本个数满足|n

(x
j
)|≥minpts,将第j个样本x
j
加入核心对象集合,即令ω=ω∪{x
j
}。8.根据权利要求1所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,步骤4中,根据轮廓系数公式计算出轮廓系数值。9.一种基于dbscan聚类的负荷异常检测系统,用于实现权利要求1至7中任一项所述的一种基于dbscan聚类的负荷异常检测方法,其特征在于,所述负荷异常检测系统包括存储器、处理器、无线通讯模块;所述存储器存储有计算机程序,处理器调用所述计算机程序执行权利要求1-7所述的各个步骤,以负荷异常数据为负荷异常检测系统的输入数据,以负荷异常的多个辨识类型簇为负荷异常检测系统的输出数据。

技术总结
一种基于DBSCAN聚类的负荷异常检测方法及系统,方法包括:步骤1,采集负荷异常数据;步骤2,对负荷异常数据进行预处理后得到可靠数据集;将可靠数据集划分为训练集和测试集;步骤3,搭建DBSCAN聚类模型,以训练集为输入,以异常类型聚类簇为输出,对聚类模型进行训练;步骤4,使用训练好的聚类模型对测试集进行聚类,以轮廓系数作为聚类结果评价指标,以获得负荷异常的多个辨识类型簇。本发明在经过数据预处理后,充分利用DBSCAN聚类算法的聚类优势,聚类结果的精确度得到进一步提升,聚类过程中,无需预设聚类簇数,通过寻找数据内在规律、及时发现数据异常点,从而实现对负荷异常数据的聚类,根据聚类结果准确辨识负荷异常类型。型。型。


技术研发人员:左强 陆婋泉 杨世海 段梅梅 孔月萍 周雨奇 王逸民 丁泽诚 苏慧玲 陈铭明 瞿亚运 张驰 曹晓冬 李波
受保护的技术使用者:国网江苏省电力有限公司营销服务中心
技术研发日:2022.04.28
技术公布日:2022/8/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献