一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于SVM-WS的智能电表故障预测方法与流程

2022-09-10 12:17:45 来源:中国专利 TAG:

一种基于svm-ws的智能电表故障预测方法
技术领域
1.本发明属于智能电表故障预测技术领域,涉及一种智能电表的故障预测方法,特别是使用权重激励方法对svm进行改造,并进行智能电表故障预测的方法。


背景技术:

2.随着智能电表装置数量的大幅增加,装置的运行管理工作也越来越难,智能电表作为智能电网的神经末梢,具有数量多、分布广的特点,在电信息采集、能源监控方面发挥着不可替代的作用,同时智能电表的可靠性也关联着普通家庭的用电安全。由于难采集的大量样本信息和长时间的用户跟踪记录,导致对电能表故障预测难度较大。因此,对智能电表实行故障预测刻不容缓,建立一套科学有效的故障预测方案对电能表可靠性设计以及电网公司的使用与更换具有重要意义。
3.传统的故障预测大多以人的经验为基础,通过程序编写相关的逻辑脚本进行故障的分析与预测,此种方法不仅效无法得到保证,自动化程度底,且过度依赖于人工开展相关工作,例如一般由专业人员周期性对电表进行现场测试,难以全面评估、预测运行状态下智能电表的健康状况、运行状态、故障分析及可靠性评估,无法对电表的全生命周期做到科学、有效的管理。
4.公开号为cn113011530a专利名称为一种基于多分类器融合的智能电表故障预测方法,虽然它也涉及svm,做简单的相关性分析,删除一些特征,但是映射到高维空间,数据特征维度过多,这样就会出现特征稀疏或维度爆炸的问题,无法解决时最终导致故障预测不准确。


技术实现要素:

5.本发明提出一种基于svm-ws的智能电表故障预测方法,运用人工智能算法,构建智能电表故障预测模型。首先关联运行数据、故障数据、评价数据等,生成多源异构数据集,其次利用svm算法初步构建智能电表故障预测模型,再次利用权重激励思想,对svm的输出进行权重激励,降低高维空间中的特征数,最终获得基于svm-ws的智能电表故障预测模型,用以故障分析与预测。
6.本发明的技术方案是,一种基于svm-ws的智能电表故障预测方法,用于智能电表的故障预测,所述的方法包括对数据进行预处理、提取指标特征构建svm模型、用构建好后的模型进行智能电表的故障预测的步骤,关键是:在提取指标特征构建svm模型步骤后用熵权法对svm模型进行权重计算,优化模型权重,得到改进的svm模型后,再进行智能电表的故障预测。
7.所述的用熵权法对svm模型进行权重优化的具体步骤是:
8.将svm模型中每一个特征的权重进行优化,设置激励权重wi,优化公式为:其中ei为第i个特征的信息熵,f(xi)为是第i个特征的
非线性映射值,k为大于2的正整数,i为自然数。
9.在数据预处理步骤中对特征数据样本借助pca算法减少故障维度,删除数据信息含量低的数据样本,数据信息含量低的判断步骤包括:
10.a、将经过特征工程筛选的k个指标进行数据标准化统一处理,k为大于2的正整数;
11.b、对原始样本数据进行线性变换,并计算最大方差,选择最大方差值小于特征方差平方跟的均值的原始样本视为数据信息含量低的数据样本。
12.所述的对数据进行预处理的具体步骤为:
13.1)、对缺失数据处理;
14.2)、对离群点处理;
15.3)、数据规约,包括维度规约和维度变换。
16.本发明的有益效果是,
17.1、运用svm-ws方法,分析智能电表的台账数据、运行数据、故障数据、电量数据等,同时利用大数据技术构建多源异构数据集,计算不同特征间的样本权重,构建合理的设备画像,对智能电表进行合理的状态评估与故障预测,达到“从被动抢修到主动运维”的效果。
18.2、利用权重激励及降维思想,对传统svm算法进行优化,赋以样本特征权重,在将特征映射到高维空间前进行权重激励,避免因高维空间维度过多导致特征稀疏、特征爆炸等问题。
附图说明
19.图1是本发明的智能电表故障预测方法流程示意图。
20.图2是本发明中svm模型的构建方法流程示意图。
具体实施方式
21.相关英文或术语解释:
22.svm:支持向量机。ws:权重激励。
23.参看图1,本发明技术方案包括数据预处理、svm模型构建、权重激励这三个主要步骤,具体如下:
24.一、数据预处理步骤:
25.数据预处理主要是对各个业务系统数据进行关联,形成建模宽表。需从以下几个方面进行数据清洗转换:
26.(1)缺失数据处理:删除变量。若变量的缺失率较高,大于80%,覆盖率较低,且重要性较低,可以直接将变量删除;统计量填充。若缺失率较低,小于65%,且重要性较低,则根据数据分布的情况进行填充。对于数据符合均匀分布,用该变量的均值填补缺失,对于数据存在倾斜分布的情况,采用中位数进行填补。
27.(2)离群点处理:基于距离处理。通过定义对象之间的临近性度量,根据距离判断异常对象是否远离其他对象;基于密度处理。离群点的局部密度显著低于大部分近邻点,利用聚类算法,丢弃远离其他簇的小簇。
28.(3)数据规约:数据归约技术用来得到数据集的归约表示,它能够缩放数据集,但仍接近地保持原数据的完整性。这样,在归约后的数据集上挖掘将更有效,并产生相同的分
析结果。一般有如下策略:
29.维度规约。用于数据分析的数据会包含数以百计的属性,其中大部分属性与挖掘任务不相关,是冗余的。维度归约通过删除不相关的属性,来减少数据量,并保证信息的损失最小。
30.维度变换。维度变换将现有数据降低到更小的维度,尽量保证数据信息的完整性,并将大大地提高建模的效率。
31.在此步骤中,还需要对特征数据样本借助pca算法减少故障维度,删除数据信息含量低的数据样本,数据信息含量低的判断步骤包括:
32.步骤1:数据标准化。将经过特征工程筛选的k个指标进行数据标准化处理,其计算公式如下:
[0033][0034]
其中xi为第i个样本值,max(xi)为x特征最大值,max(xi)为x特征最小值。
[0035]
步骤2:构建线性变换。设原始数据维度为p,则可写为:
[0036]
x=(x1,x2,...,x
p
)
t

[0037]
其中x表示某一样本数据,设数据集共有n个维度,则样本的均值和方差分别为:
[0038][0039]
经过线性变换后,得到结果如下:
[0040][0041][0042]
……
[0043][0044]
步骤3:求解最大方差。经过线性变换后的数据为:
[0045]
y=(y1,y2,...,y
p
)
t

[0046]
其方差与协方差分别为:
[0047][0048]
则若y方差达到最大,约束优化为:
[0049]
max(μ
t
∑μ)。
[0050]
方差值越小,说明特征数据中含有的信息量越少;方差值越大,特征数据中含有的信息量越多。对方差值小于特征方差平方跟的均值的特征数据进行删除,从而降低故障类型的维度。
[0051]
二、svm模型构建步骤
[0052]
参看图2,通过对数据的预处理,融合运行数据、故障数据、台账数据等,构建多源异构数据集,结合具体业务规则提取相关指标特征,用以构建svm模型。划分训练集、验证
集、测试集,准备通过模型进行学习。
[0053]
步骤1:寻找最大超平面间隔。超平面公式如下:
[0054]wt
x b=0,
[0055]
结合超平面的表达式,计算样本点到平面的距离。假设p(x1,x2,...,xn)为样本中的一个点,其中xi表示第i个特征变量,则该点到超平面的距离d为:
[0056][0057]
其中||w||为超平面范数,b为常数截距。
[0058]
步骤2:最大间隔的优化模型。在超平面确定的情况下,就能够找出所有支持向量,然后计算出间隔margin。每一个超平面都对应着一个margin,计算的目标就是找出所有margin中最大的那个值对应的超平面。因此用数学语言描述就是确定w、b使得margin最大。这是一个优化问题其目标函数可以写成:
[0059][0060]
其中y表示数据点标签。
[0061]
步骤3:拉格朗日优化求解。为方便计算,将目标函数等价替换为:
[0062][0063]
令求关于l的偏导数可得结果:
[0064][0065]
步骤4:kkt假设。kkt条件如下:
[0066][0067]
通过kkt条件,可得:
[0068][0069]
因此在α
*
中,至少存在一个因此可得到:
[0070][0071]
步骤5:松弛变量约束。对于任意的训练样本(xi*yi),总有αi=0,或者yi(wi*xi b)=1,但几乎不存在完全线性可分的数据,为了解决这个问题,引入了“软间隔”的概念,即允
许某些点不满足约束,即:
[0072]
yi(wi,xi b)≥1,
[0073]
采用hinge损失,将原优化问题变为:
[0074][0075]
其中ξi为松弛变量,每一个样本都有一个对应的松弛变量,表征该样本不满足约束的程度。c称为惩罚参数,c值越大,对分类的惩罚越大。
[0076]
步骤6:非线性优化。对于输入空间中的非线性分类问题,可以通过非线性变换将它转化为某个维特征空间中的线性分类问题,在高维特征空间中学习线性支持向量机。通过利用核函数替换常规计算的内积。设核函数为k(x,z),则存在一个从输入空间到特征空间的映射对任意输入空间中的x,z有:
[0077][0078]
在线性支持向量机学习的对偶问题中,用核函数k(x,z)替代内积,求解得到的即非线性支持向量机,公式为:
[0079][0080]
步骤7:模型训练。输入训练数据,即训练数据集t={(x1,y1),(x2,y2),

(xn,yn)},其中xi∈r,yi∈{ 1,-1},i=1,2,

,n。
[0081]
输出即为分离超平面和分类决策函数。选取适当的核函数k(x,z)和惩罚参数c,构造并求解凸二次规划问题,公式为:
[0082][0083]
最终得到最优解:
[0084][0085]
三、权重激励
[0086]
结合降维方法,对svm模型的特征进行权重计算,筛选权重较高的特征因子,优化模型权重,避免svm将数据从低纬度空间映射到高纬度空间时导致维度稀疏等问题,经过特征筛选、权重判别后,获得最终svm-ws模型,用于智能电表故障预测。
[0087]
权重激励。将svm模型权重进行优化,设置激励行为,具体计算公式如下:
[0088]
其中ei为第i个特征的信息熵,计算公式为:
[0089]
[0090]
最后,将svm-ws用于智能电表故障预测。
[0091]
本发明将svm算法与熵权法、pca降维等思想进行结合,对传统的svm模型进行改造升级,经过特征筛选、权重判别后,获得最终svm-ws模型,用于智能电表故障预测。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献