一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于ARIMA的企业日常用电量异常检测方法与流程

2022-12-13 20:38:37 来源:中国专利 TAG:

一种基于arima的企业日常用电量异常检测方法
技术领域
1.本技术涉及大数据异常检测领域,尤其涉及一种基于arima的企业日常用电 量异常检测方法。


背景技术:

2.企业的用电量能够在一定程度上反映企业经营状况、用工情况以及运行状态。
3.企业的用电量异常检测可以检测出高耗能企业,对企业日常用电量异常检测, 可以规范企业用电,为公共安全、环境保护等相关政府部门管理企业提供指导意 见。
4.

技术实现要素:

5.本发明的目的是提供一种基于arima的企业日常用电量异常检测方法,实现 对附加性异常、临时性异常等检测,可以规范企业用电,为公共安全、环境保护 等相关政府部门管理企业提供指导意见。
6.本发明的目的通过以下技术方案实现:
7.一种基于arima的企业日常用电量异常检测方法,其特征在于:首先对企业 日常用电量数据,进行采样、缺失值处理;然后将处理后的数据分成节假日数据 和工作日数据,对数据进行白噪声评估,进行差分处理,计算acf与pacf函数, 确定自回归与移动平均的阶数,建立arima模型;利用建立的模型对时间序列样 本数据进行预测,再比较真实值与预测值,把差值超过预设的阈值的数据作为异 常检测的结果。
8.该方法包括以下步骤::
9.(1)采集目标用电单位在企业日常各个时刻的用电量数据;
10.(2)对采集的用电量数据就行纯随机性和平稳性检验;
11.(3)对采集的数据进行预处理,对非平稳序列进行差分处理,得到差分平 稳序列;
12.(4)建立自回归模型,根据自相关性分析,确定自回归阶数;
13.(5)建立移动平均模型,根据偏自相关性分析,确定移动平均的阶数;
14.(6)根据上述步骤得到的差分阶数、自回归阶数、移动平均阶数建立arima 模型,并训练模型。
15.(7)利用训练好的模型进行预测分析,通过比对真实值与预测值的偏差来 判断是否为异常。
16.进一步的,步骤(1)中各个时刻包含晚上20点到次日凌晨8点前的数据, 每15分钟记录一次用电量数据。数据范围包含节假日与工作日。根据企业用电 量数据趋势,把数据样本集分割为节假日数据样本与工作日数据样本。对不同企 业作息规则,设置不同节假日判定规则,一般分为国家法定假日 双休和国家法 定节假日 单休。对采集的数据进行数据清洗,如某时刻存在个别数据缺失,则 以周为单位,利用上下5周此时刻数据,采用拉格朗日插值法进行插值处理。如 果存在长时间段数据缺失则采用对应时刻用电量均值插值处
理。合计某时刻下4 个15分钟数据再取均值作为此时刻用电量
17.进一步的,步骤(2)中对数据进行白噪声检查,确定用电量数据非纯随机 序列;再进行时间序列数据平稳性检查,确定是否需要进行差分处理。
18.进一步的,步骤(3)具体包括对步骤(2)中检测出的非平稳序列进行差分 处理,并在差分后再进行平稳性检验,如1阶差分后仍然不平稳,则再进行差分 处理,获得平稳的时间序列数据。并将两类样本集按照一定的比例划分成训练集、 验证集和测试集。
19.进一步的,步骤(4)中建立自回归模型,并确定自回归阶数。
20.(4-1)对节假日样本进行偏自相关性分析,计算pacf函数值,画出pacf置 信区间图像,取首次进入pacf置信区间的阶数p1。
21.(4-2)对工作日样本进行偏自相关性分析,计算pacf函数值,画出pacf置 信区间图像,取首次进入pacf置信区间的阶数p2。
22.进一步的,步骤(5)建立移动平均模型,并确定移动平均阶数。
23.(5-1)对节假日样本进行自相关性分析,根据相关性结算公式,计算不同 阶数的acf函数值,画出acf置信区间图像,取首次进入acf置信区间的阶数q1。
24.(5-2)对工作日样本进行自相关性分析,根据相关性结算公式,计算不同 阶数的acf函数值,画出acf置信区间图像,取首次进入acf置信区间的阶数q2。
25.进一步的,步骤(6)中根据步骤(3)的得出的差分阶数、步骤(4)得出 的自回归阶数,步骤(5)中的得出的移动平均阶段,对节假日样本和工作日样 本数据分别建立差分自回归移动平均模型arima(p1,d1,q1)和 arima(p2,d2,q2)。并利训练模型,根据计算测试集预测结果的rsm,评估模型 预测效果。如果测试结果不及预期,可以通过遍历可能的lags,取模型aic(或 bic)值最小的模型去训练和做预测。
26.进一步的,步骤(7)中分析样本各时间段均值,方差以及业务痛点,设置 真实与预测值之间差值的阈值,筛选出差值波动大于预设阈值的数据条目,即样 本异常值。
27.本发明的有益效果:
28.本发明通过对企业日常用电量附加性异常、临时性异常等检测,可以规范企 业用电,为公共安全、环境保护等相关政府部门管理企业提供指导意见。
附图说明
29.图1为本发明的方法流程图。
具体实施方式
30.本实施例提供了一种基于arima的企业日常用电量异常检测方法,如图1 所示,包括:
31.(1)采集目标用电单位在企业日常各个时刻的用电量数据。
32.本实施例中,选取企业过去3年各个时刻包含晚上20点到次日凌晨8点前 的数据,每15分钟记录一次用电量数据。数据范围包含所有节假日与工作日。 根据企业用电量数据趋势,把数据样本集分割为节假日数据样本与工作日数据样 本。对不同企业作息规则,设置不同节假日判定规则,一般分为国家法定假日 双休和国家法定节假日 单休。对采集的数据进行数据清洗,如某时刻存在个别 数据缺失,则以周为单位,利用上下5周此时刻数
据,采用拉格朗日插值法进行 插值处理。如果存在长时间段数据缺失则采用对应时刻用电量均值插值处理。合 计某时刻下4个15分钟数据再取均值作为此时刻用电量。
33.(2)对采集的用电量数据就行纯随机性和平稳性检验,具体包括:
34.(2-1)本实施例中,先对样本进行白噪声检验。
35.(2-2)本实施例中,再对样本进行平稳性检验。
36.(3)对采集的数据进行预处理,对非平稳序列进行差分处理,得到差分平 稳序列,具体包括:
37.(4)建立自回归模型,根据自相关性分析,确定自回归阶数。
38.根据p阶自回归定义:其中y
t
为当前值,μ为常 数项,p是阶数,γi是自相关系数,∈
t
是误差项。即,根据自身的历史数据对自 身进行预测。
39.(4-1)对节假日样本进行偏自相关性分析,计算pacf函数值,画出pacf置 信区间图像,取首次进入pacf置信区间的阶数p1。
40.(4-2)对工作日样本进行偏自相关性分析,计算pacf函数值,画出pacf置 信区间图像,取首次进入pacf置信区间的阶数p2。
41.(5)建立移动平均模型,根据偏自相关性分析,确定移动平均的阶数。
42.根据q阶自回归定义:其中y
t
为当前值,μ为常 数项,q是阶数,∈
t
是误差项。使用移动平均模型消除预测中的随机波动。使用acf 函数确定q的阶数。
[0043][0044]
(5-1)对节假日样本进行自相关性分析,根据相关性结算公式,计算不同 阶数的acf函数值,画出acf置信区间图像,取首次进入acf置信区间的阶数q1。
[0045]
(5-2)对工作日样本进行自相关性分析,根据相关性结算公式,计算不同 阶数的acf函数值,画出acf置信区间图像,取首次进入acf置信区间的阶数q2。
[0046]
(6)根据arima定义,有
[0047]
根据上述步骤得到的差分阶数、自回归阶数、移动平均阶数建立arima模型, 并训练模型。根据步骤(3)的得出的差分阶数、步骤(4)得出的自回归阶数, 步骤(5)中的得出的移动平均阶段,对节假日样本和工作日样本数据分别建立 差分自回归移动平均模型arima(p1,d1,q1)和arima(p2,d2,q2)。并训练模型, 根据计算测试集预测结果的rsm,评估模型预测效果。如果测试结果不及预期, 可以通过遍历可能的lags,取模型aic(或bic)值最小的模型去训练和预测。
[0048]
(7)分析样本各时间段均值,方差以及业务痛点,设置真实与预测值之间 差值的阈值,筛选出差值波动大于预设阈值的数据条目,即样本异常值。
[0049]
以上所述仅为本发明的一种较佳实施例而已,不能以此来限定本发明之权利 范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献