一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于云计算的决策树配置寿命预测的方法及系统与流程

2021-10-24 08:59:00 来源:中国专利 TAG:寿命 配置 预测 电力 计算机


1.本发明涉及电力计算机技术领域,尤其涉及一种基于云计算的决策树配置寿命预测的方法及系统。


背景技术:

2.随着我国经济的飞速发展,各行各业对电的需求越来越大,不同时间用电量不均衡的现象也日益严重。为缓解我国日趋尖锐的电力供需矛盾,调节负荷曲线,改善用电量不均衡的现象,全面实行峰、平、谷分时电价制度,“削峰填谷”,提高全国的用电效率,合理利用电力资源。配网设备的使用量也飞速剧增,配网设备的检修安排问题日渐重要。
3.配网设备一般是发生故障之后,维修人员巡检并维修,例如微电网量测设备,维修人员在电能表故障之后拆回电能表,然后需要对智能表进行故障分析,找出智能表故障的原因。想要提前发现智能表的隐藏缺陷只能定期巡检,但是定期巡检效率不高,耗费时间长,在海量的电能表普及之下依靠大量人力资源支撑。其他的配网设备按照用处和体积不同,维修难易不同也都是由类似的巡检逻辑在进行维护,但始终无法做到资源的最佳利用,对配网设备的寿命预测就凸显其重要性。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,本发明提供了一种基于云计算的决策树配置寿命预测的方法及系统,通过云端算法进行寿命预测,实现了整体寿命预测的自动化和智能化。
5.为了解决上述技术问题,本发明实施例提供了一种基于云计算的决策树配置寿命预测的方法,所述方法包括:
6.获取配网设备属性和预设时间段的故障信息;
7.将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述配网设备的剩余寿命;
8.基于剩余寿命对所述配网设备划分不同的风险等级策略,并将风险等级策略推送至所对应的检修人员。
9.所述配网设备属性包括:设备码、生产厂家、服役市场;故障信息包括:故障现象、异常间隔、异常登记、采集异常代码。
10.所述将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述配网设备的剩余寿命包括:
11.第一步,决策树的生成:由训练样本集生成决策树的过程;
12.第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,用新的样本数据集中的数据校验决策树生成过程中产生的初步规则,将影响预衡准确性的分枝剪除。
13.所述将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述
配网设备的剩余寿命包括:
14.基于直方图的决策树算法计算出配网设备的剩余寿命。
15.所述基于直方图的决策树算法计算出配网设备的剩余寿命包括:
16.先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图;在遍历数据的时候,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。
17.所述基于剩余寿命对所述配网设备划分不同的风险等级策略包括:
18.将故障类型预测结果在第一等级以及剩余寿命预测结果在一周以内的电能表标记为高风险,针对高风险提示及时检修策略;
19.将剩余寿命预测结果小于30天的电能表标记为中风险,针对中风险提示计划检修策略;
20.剩余寿命预测结果小于半年的电能表标记为低风险,针对低风险进行抽样检修策略。
21.相应的,本发明还提供了一种基于云计算的决策树配置寿命预测的系统,所述系统包括:
22.处理模块,用于获取配网设备属性和预设时间段的故障信息;
23.计算模块,用于将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述配网设备的剩余寿命;
24.风险模块,用于基于剩余寿命对所述配网设备划分不同的风险等级策略,并将风险等级策略推送至所对应的检修人员。
25.所述配网设备属性包括:设备码、生产厂家、服役市场;故障信息包括:故障现象、异常间隔、异常登记、采集异常代码。
26.所述计算模块基于直方图的决策树算法计算出配网设备的剩余寿命。
27.所述基于直方图的决策树算法计算出配网设备的剩余寿命包括:先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图;在遍历数据的时候,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。
28.在本发明实施例中,一是充分利用故障数据,把配网设备在故障前会上传的异常信息和配网设备本身特征结合起来;二是使用云计算的决策树模型算法,可以调用云端算法快速帮助运维人员定位配网设备故障的原因并对配网设备的寿命进行预测,便于运维人员安排检修计划。
附图说明
29.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
30.图1是本发明实施例中的基于云计算的决策树配置寿命预测的方法流程图;
31.图2是本发明实施例中的决策树的结构示意图;
32.图3是本发明实施例中的直方图算法的示意图;
33.图4是本发明实施例中的基于云计算的决策树配置寿命预测的系统结构示意图。
具体实施方式
34.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
35.本发明实施例利用配网设备在故障前会上传的异常信息结合配网设备本身特征,利用这些特征通过机器学习的方法训练一个基于决策树模型的配网设备故障分析模型,对配网设备的故障类型进行判断,并使用配网设备记录对该模型进行训练对配网设备的寿命进行预测,便于运维人员安排检修计划。同时,随着云端计算技术的发展,可以通过api直接调用云端算法进行寿命预测,实现了整体寿命预测的自动化和智能化。
36.图1是本发明实施例中的基于云计算的决策树配置寿命预测的方法流程图,包括以下步骤:
37.本发明实施例中的决策树配网设备寿命预测技术是针对配网设备故障维修时间长且巡检依靠大量人力的问题,利用机器学习对配网设备的故障数据以及配网设备本身的模型特质数据特征进行分析,以实现寿命预测,协助运维人员安排检修计划。同时利用云计算的能力使算法以及运算封装提供api接口使预测技术的实现更加智能以及自动化。
38.实际算例是普及量极大的微电网量测设备,具体实现方法是利用输入的异常数据和电能表本身的特征数据,上传至云端,经过决策树算法,输出电能表的预测剩余寿命并划分风险等级,高度风即险迫切需要检修,中度风险是计划检修,低风险为可抽样检修。
39.s101、获取配网设备属性和预设时间段的故障信息;
40.这里配网设备属性包括:设备码、生产厂家、服役市场;故障信息包括:故障现象、异常间隔、异常登记、采集异常代码。
41.本发明实施例的配网设备可以是微电网量测设备,具体实现方法是利用输入的异常数据和电能表本身的特征数据,上传至云端,经过决策树算法,输出电能表的预测剩余寿命并划分风险等级,高度风即险迫切需要检修,中度风险是计划检修,低风险为可抽样检修。
42.配网设备的数据包括两类,第一类特征是配网设备本身的属性,第二类特征是最近一次报警信息即故障信息。
43.这里以微电网量测设备为例:
44.第一类特征包括设备码、生产厂家、服役时长。
45.其中服役时长是把安装时间和拆回时间都转化为时间戳,再把两者相减得到电能表的服役时长,这样处理有助于对比每个电能表的工作时长。生产厂家和设备码在输入过程中需要对其格式化处理,将这两个特征的数据编码计数,可以直观的看到生产厂家和设备码的分布情况。第一类特征代表着电能表本身的出厂属性以及工作的属性。
46.第二类特征包括故障现象、异常间隔、异常等级、采集异常代码。
47.其中异常间隔是把异常时间和安装时间转化为时间戳相减得到的,代表着上一次
异常报警距离安装时间过去了多久。故障现象和异常等级安装处理生产厂家和设备码的逻辑同样进行编码计数处理。至于采集异常代码本身就已经编码处理过不需要进一步处理。第二类特征是又电能表故障时发出的信息得到的,属于电能表运行中的动态特征以及故障时的故障特征。
48.大多数对配网设备寿命预测的研究是基于运行中配网设备的信息,从可靠性的角度对配网设备进行评估和寿命预测,并没有充分利用故障数据进行分析。而本专利不仅考虑到配网设备本身的属性对电能表寿命的影响,还充分考虑到故障信息,从两个方面综合考虑来对配网设备进行寿命预测。
49.s102、将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述配网设备的剩余寿命;
50.决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程,如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数据集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除。
51.图2示出了本发明实施例中的决策树的结构示意图,其中根节点是包含样本的全集,内部节点是对应特征属性测试,叶节点是决策的结果。内部节点到叶节点一般是当一个节点所代表的属性无法给出判断时,则选择将这一节点分成2个子节点(如不是二叉树的情况会分成n个子节点),而属性测试则是选择适当的阈值使得分类错误率最小。决策树的生成算法有id3,c4.5和cart等,最基础的id3是由增熵(entropy)原理来决定那个做父节点,那个节点需要分裂。对于一组数据,熵越小说明分类结果越好。熵定义如下:
[0052][0053]
其中,p(x
i
)是分类x
i
出现的概率,n是分类的数目。可以看出,熵的大小只和变量的概率分布有关。对于在x的条件下y的条件熵,是指在x的信息之后,y这个变量的信息量(不确定性)的大小,计算公式如下:
[0054][0055]
例如,当只有a类和b类,且概率一样,那么熵的大小为:
[0056]
entropy=

(0.5log2(0.5) 0.5log2(0.5))=1
[0057]
当只有a类或者b类时,
[0058]
entropy=

(1log2(1))=0
[0059]
所以当entropy最大为1的时候,是分类效果最差的状态,当它最小为0的时候,是完全分类的状态。因为熵等于零是理想状态,一般实际情况下,熵介于0和1之间。
[0060]
本发明实施例中采用gbdt(gradient boosting decision tree)模型,利用决策树迭代训练以得到最有模型,该模型具有训练效果好、不宜过拟合。实现gbdt算法的框架是
lightgbm(light gradient boosting machine),它持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。
[0061]
lightgbm是基于直方图的决策树算法,图3示出了本发明实施例中的直方图算法的示意图,直方图算法是先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图。在遍历数据的时候,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。
[0062]
直方图的好处是内存占用更小,且计算代价更小。并可以利用直方图做差加速,一个叶子的直方图可以由它的父亲节点的直方图与它兄弟的直方图做差得到,在速度上可以提升一倍。
[0063]
把清洗整理好的数据带入lightgbm框架,就利用配网设备的本身特征数据和故障信息数据来预测剩余寿命。
[0064]
s103、基于剩余寿命对所述配网设备划分不同的风险等级策略,并将风险等级策略推送至所对应的检修人员。
[0065]
这里基于剩余寿命对所述配网设备划分不同的风险等级策略包括:
[0066]
将故障类型预测结果在第一等级以及剩余寿命预测结果在一周以内的电能表标记为高风险,针对高风险提示及时检修策略;将剩余寿命预测结果小于30天的电能表标记为中风险,针对中风险提示计划检修策略;剩余寿命预测结果小于半年的电能表标记为低风险,针对低风险进行抽样检修策略。
[0067]
基于本发明实施例中的算法的输出结合配网设备可能出现的故障和预测的剩余寿命按来分档以合理安排维修人员检修。
[0068]
以微电网量测设备为例,在算法框架中预测电能表的故障现象,按照最有可能的n种故障类型中,命中真实故障的准确率大小计算结果,可以得到top

1为70.01%,top

3为89.32%,top

5为92.90%。使用数据库中的表计真实寿命对模型的寿命预测准确度进行评估,模型对微电网量测设备寿命预测的平均绝对百分比误差为8.6%,准确率超过90%。把同时故障类型预测结果在top

1以及剩余寿命预测结果在一周以内的电能表就标记为高风险,迫切需要检修,把剩余寿命预测结果小于30的其他电能表标记为中风险,需要计划检修。剩余寿命预测结果小于半年的电能表,可抽样检修。一般性的配网设备用此分类逻辑,按照具体的使用环境和具体的配网设备进行分档,更加合理的安排维修人员进行检修工作。同时预测算法被封装在云端,仅调用api即可实现寿命预测功能,这样整体的预测流程更加的自动化更加方便使用。
[0069]
相应的,图4示出了本发明实施例中的基于云计算的决策树配置寿命预测的系统,所述系统包括:
[0070]
处理模块,用于获取配网设备属性和预设时间段的故障信息;
[0071]
计算模块,用于将所述配网设备属性和预设时间段的故障信息基于决策树算法计算出所述配网设备的剩余寿命;
[0072]
风险模块,用于基于剩余寿命对所述配网设备划分不同的风险等级策略,并将风险等级策略推送至所对应的检修人员。
[0073]
所述配网设备属性包括:设备码、生产厂家、服役市场;故障信息包括:故障现象、
异常间隔、异常登记、采集异常代码。
[0074]
所述计算模块基于直方图的决策树算法计算出配网设备的剩余寿命。
[0075]
所述基于直方图的决策树算法计算出配网设备的剩余寿命包括:先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图;在遍历数据的时候,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。
[0076]
在本发明实施例中,一是充分利用故障数据,把配网设备在故障前会上传的异常信息和配网设备本身特征结合起来;二是使用云计算的决策树模型算法,可以调用云端算法快速帮助运维人员定位配网设备故障的原因并对配网设备的寿命进行预测,便于运维人员安排检修计划。
[0077]
以上对本发明实施例所进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜