一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于双重加权朴素贝叶斯的电气事故分类方法与流程

2022-03-16 15:42:11 来源:中国专利 TAG:

技术特征:
1.基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,包括:获取用户用电数据作为原始数据集,所述原始数据集包括用户用电数据的属性和实例;将原始数据集拆分为训练集和测试集,所述训练集包括属性和训练实例,所述测试集包括属性和测试实例;采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练,得到双重加权的朴素贝叶斯架构;采用双重加权的朴素贝叶斯架构对测试集进行测试,得到电气事故类别。2.根据权利要求1所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练得到的双重加权的朴素贝叶斯架构为:其中,a
i
为属性变量a
i
的取值,a
i
为训练集d={a1,a2,

,a
m
}中的属性变量,i=1,2,

,m,m为属性变量的个数,c
j
为类别集c={c1,c2,

,c
q
}中的类别,j=1,2,

,q,q为类别变量总数,为第i个属性的权重,为第j个训练实例的权重,为先验概率,为条件概率。3.根据权利要求2所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权训练时,按照训练实例与测试实例之间的距离为训练实例来分配不同的权值,权值大小与距离呈负相关。4.根据权利要求3所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权训练时采用积极实例进行权值设置,其基于属性值频度的实例加权滤波器来学习每个实例的权重,每个属性值的频率的计算公式为:其中,a
ji
为第j个实例第i个属性值,f
ji
为a
ji
的频率,n为训练实例的数量,a
rj
为第j个实例第r个属性值。令n
i
为第i个属性的值的数量,并且可表示为<n1,n2,...,n
m
>,然后将第j个实例的权重定义为属性值频率向量与属性值个数向量的内积,公式如下:5.根据权利要求3所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行实例加权训练时采用消极实例进行权值设置,其测试实例x与第j个训练实例y
j
间的相似性定义为:第j个训练实例的权重定义为:
6.根据权利要求1所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,获取用户用电数据作为原始数据集时还包括对异常数据进行清洗,以及通过在事故数据段内的每个属性叠加随机高斯噪声增加数据片段,叠加随机高斯噪声的公式如下:其中,gauss(x)为按照设定的均值及标注差产生的高斯噪声,μ为高斯噪声的均值,δ为高斯噪声的标准差。7.根据权利要求1所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,将原始数据集拆分为训练集和测试集后,还包括采用min-max归一化方法对训练集与测试集进行归一化。8.根据权利要求1~7中任意一项所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,采用训练集对朴素贝叶斯分类器进行属性加权训练时,根据属性在预测分类时的重要性分配权重,属性权重大小与其重要性高低成正比。9.根据权利要求8所述的基于双重加权朴素贝叶斯的电气事故分类方法,其特征在于,所述属性权重设置时利用互信息来度量属性-类之间、属性-属性之间的相关性,计算得到类关联度和属性间的相互关联度,每个属性的权重通过对归一化后的类关联度与平均相互关联度之间的差值进行sigmoid变换后获取。

技术总结
本发明公开了一种基于双重加权朴素贝叶斯的电气事故分类方法,包括:获取用户用电数据作为原始数据集,其中,原始数据集包括用户用电数据的属性和实例;将原始数据集拆分为训练集和测试集;采用训练集对朴素贝叶斯分类器进行实例加权和属性加权训练,得到双重加权的朴素贝叶斯架构;采用双重加权的朴素贝叶斯架构对测试集进行测试,得到电气事故类别。本发明将属性加权和实例加权有机结合在朴素贝叶斯统一框架内,能实现对电气事故快速、准确和动态的分类。动态的分类。动态的分类。


技术研发人员:舒一飞 郭汶昇 樊博 康洁滢 许诗雨 王登峰
受保护的技术使用者:国网宁夏电力有限公司营销服务中心(国网宁夏电力有限公司计量中心)
技术研发日:2021.12.13
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献