一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于小波分解和傅立叶变换的多能用量数据补全方法

2022-11-16 07:31:29 来源:中国专利 TAG:


1.本发明涉及多能用量数据补全方法,属于数据分析领域。


背景技术:

2.人类自2010年便进入到大数据时代,大数据时代的来临,给各类含碳能源用量数据挖掘技术带来了许多机遇与挑战。如今,我们对各类含碳能源用量数据的研究不再采用抽样调查的方法,而是对所有各类含碳能源用量数据进行全面分析。各类含碳能源用量数据显著的特点是周期性和趋势性明显、种类多、流速快及数据量大,在日常采集各类含碳能源用量数据时,经常会出现各类含碳能源用量数据缺失的现象,造成各类含碳能源用量数据损失的原因有很多,如信息意外遗漏、无法获取等,各类含碳能源用量数据缺失会影响重点控排企业建立碳关联实时监测模型,目前常用的各类含碳能源用量数据缺失值处理方法有如下三类:
3.第一类方法直接删除各类含碳能源一个周期的用量数据。这种方法简单易行,若删除的一个周期的用量数据在整体数据中所占比较小,则该方法非常有效。然而,当缺失值所占比例波动很大时,该方法会降低数据挖掘算法的质量。同时,删除的一个周期的用量数据可能包含重要信息,使数据发生偏离,甚至得出错误的结论。
4.第二类方法对各类含碳能源用量数据进行推测和补齐。该方法一般基于统计学原理,用不同的算法对缺失值进行填充,常见的数据补齐算法有:平均值(或中位数)填充、特殊值填充、人工填充、k-最近邻法等,而以上算法仅适配各类含碳能源用量数据的整体趋势性,无法评估各类含碳能源用量数据的周期性波动。
5.第三类方法不做任何处理,利用深度挖掘方法运行,常见的方法有贝叶斯网络和人工神经网络等。该方法指直接在包含缺失数据的各类含碳能源用量数据序列上进行数据挖掘,但由于各类含碳能源用量数据海量,从而利用深度挖掘的方式会降低数据补全的效率,导致处理时间过长。


技术实现要素:

6.针对现有技术中的上述不足之处,本发明提供一种基于小波分解和傅立叶变换的多能用量数据补全方法,以期在满足数据补全的基础上,实现各类含碳能源用量海量数据处理时间最小化,从而能提高各类含碳能源用量海量数据补全的效率。
7.本发明为达到上述发明目的,采用如下技术方案:
8.本发明一种基于小波分解和傅立叶变换的多能用量数据补全方法的特点在于,包括以下步骤:
9.步骤一、按照采样周期对重点控排企业的各类含碳能源用量数据进行采集,得到特征含碳能源消耗数据集特征含碳能源消耗数据集表示第m个采样时刻采集的第j类含碳特征能源消耗数据;1≤m≤i,所述第m个采样时刻的含碳特征能源消耗数据的特征包括周
期性特征、趋势性特征;i表示总的采样时刻;
10.假设第m个采样时刻采集的第j类含碳能源消耗数据为缺失数据,则选取缺失数据之前的n个采样时刻的含碳能源消耗数据构成含碳能耗序列且n为能被8整除的偶数,1≤n《m;其中,表示第m-n 1个采样时刻采集的第j类含碳能源消耗数据;
11.通过式(1-1)-式(1-2)对n个采样时刻的含碳能耗序列进行3层小波分解,得到所述能耗序列p层小波分解的能耗周期特征序列和p层小波分解的能耗趋势特征序列
[0012][0013][0014]
式(1-1)-式(1-3)中,n
p
为第p层小波分解的采样时刻;s为小波空间横坐标,s≤2n
p
;为第p层小波分解的序列;z是全体整数数集,s∈z;为第p层小波分解得到的第j类能耗周期特征;为第p层小波分解得到的第j类能耗趋势特征;g(s-2n
p
)为高通滤波器函数;h(s-2n
p
)为低通滤波器函数;
[0015]
步骤二、利用式(2-1)得到能耗趋势特征序列的拟合预测函数并利用式(2-2)来确定所述能耗趋势特征预测函数的四个曲线拟合系数ω0、ω1、ω2、ω3;
[0016][0017][0018]
式(2-1)-式(2-2)中,ε为常数;
[0019]
步骤三、利用式(3-1)得到能耗周期特征序列的第k个主要频率1≤k《n-1,从而利用式(3-2)得到能耗周期特征序列的能耗周期特征预测函数
[0020][0021][0022]
式(3-1)-式(3-2)中,ωk是第k个主要频率的傅立叶级数的角频率;
[0023]
步骤四、利用步骤4.1-步骤4.5实现对缺失数据fm进行补全;
[0024]
步骤4.1、基于能耗周期特征预测函数得到(n1 1)、(n1 2)、(n1 3)和(n1 4)个时
刻的预测值分别为和从而得到(n2 4)个采样时刻的能耗周期特征预测序列
[0025]
步骤4.2、通过式(4-1)得到三层小波重构后的含碳能源消耗预测序列
[0026][0027]
式(4-1)中,为通过两层小波重构后的得到的能耗趋势特征预测序列;分别是第m个采样时刻到第m 7个采样时刻的第j类含碳能源消耗数据的预测值;
[0028]
步骤4.3、仅保留作为第m个采样时刻的含碳能源消耗数据的预测值,以实现对第m个采样时刻采集的第j类含碳能源消耗缺失数据的补全,从而得到完整的i个采样时刻采集的第j类含碳能源消耗特征数据集
[0029]
本发明一种电子设备,包括存储器以及处理器,其特点在于,所述存储器用于存储支持处理器执行所述多能用量数据补全方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
[0030]
本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特点在于,所述计算机程序被处理器运行时执行所述多能用量数据补全方法的步骤。
[0031]
与现有技术相比,本发明的有益效果在于:
[0032]
1.本发明分析出各类含碳能源用量数据共有的的两种独特特征,即趋势特征和周期特征,利用小波分解将各类含碳能源用量数据序列分解成具有趋势特征的序列和具有周期特征的序列,即能耗趋势特征序列和能耗周期特征序列,实现了为接下来各类含碳能源用量数据序列中缺失数据补全奠定数据基础。
[0033]
2.本发明通过分析能耗趋势特征序列的特性和能耗周期特征序列的特性,分别利用曲线拟合建立了适配能耗趋势特征序列的拟合函数模型,通过该拟合函数模型得到预测能耗趋势特征序列,和利用傅立叶级数建立了适配能耗周期特征序列的拟合函数模型,通过该拟合函数模型得到预测周期趋势特征序列,最终通过预测能耗趋势特征序列和预测周期趋势特征序列的重构得到缺失数据,实现了数据的补全。
附图说明
[0034]
图1为本发明方法步骤流程图。
具体实施方式
[0035]
本实施例中,一种基于小波分解和傅立叶变换的多能用量数据补全方法,如图1所示,包括以下步骤:
[0036]
步骤一、按照采样周期对重点控排企业的各类含碳能源用量数据进行采集,得到
含碳特征能源消耗数据集含碳特征能源消耗数据集表示第m个采样时刻采集的第j类含碳能源消耗数据;1≤m≤i,第m个采样时刻的含碳特征能源消耗数据的特征包括周期性特征、趋势性特征;i表示总的采样时刻,各类含碳能源用量数据集共有的两种独特特征,即趋势特征和周期特征;
[0037]
假设第m个采样时刻采集的第j类含碳能源消耗数据为缺失数据,则选取缺失数据之前的n个采样时刻的含碳能源消耗数据构成含碳能耗序列且n为能被8整除的偶数,且1≤n《m;其中,表示第m-n 1个采样时刻采集的第j类含碳能源消耗数据;
[0038]
通过式(1-1)-式(1-2)对n个采样时刻的含碳能耗序列进行3层小波分解,利用小波分解将含碳能耗序列分解成具有趋势特征的序列和具有周期特征的序列,得到能耗序列p层小波分解的能耗周期特征序列和p层小波分解的能耗趋势特征序列
[0039][0040][0041]
式(1-1)-式(1-3)中,n
p
为第p层小波分解的采样时刻;s为小波空间横坐标,s≤2n
p
,为第p层小波分解的序列;z是全体整数数集,s∈z;为第p层小波分解得到的能耗周期特征序列;为第p层小波分解得到的能耗趋势特征序列;g(s-2n
p
)为高通滤波器函数;h(s-2n
p
)为低通滤波器函数;
[0042]
步骤二、利用式(2-1)通过曲线拟合的方法得到能耗趋势特征序列的拟合预测函数并利用式(2-2)通过最小化预测值与能耗数据的差值来确定能耗趋势特征预测函数的四个曲线拟合系数ω0、ω1、ω2、ω3;
[0043][0044][0045]
式(2-1)-式(2-2)中,ε为常数;
[0046]
步骤三、利用式(3-1)通过傅里叶级数拟合的方法得到能耗周期特征序列的第k个主要频率1≤k《n-1,从而利用式(3-2)得到能耗周期特征序列的能耗周
期特征预测函数
[0047][0048][0049]
式(3-1)-式(3-2)中,ωk是第k个主要频率的傅立叶级数的角频率;
[0050]
步骤四、利用步骤4.1-步骤4.5实现对缺失数据fm进行补全;
[0051]
步骤4.1、基于能耗趋势特征预测函数得到第(n3 1)时刻的预测值从而得到(n3 1)个采样时刻的能耗趋势特征预测序列
[0052]
基于能耗周期特征预测函数得到(n3 1)个时刻的预测值从而得到(n3 1)个采样时刻的能耗周期特征预测序列
[0053]
基于能耗周期特征预测函数得到(n2 1)和(n2 2)个时刻的预测值分别为和从而得到(n2 2)个采样时刻的能耗周期特征预测序列
[0054]
基于能耗周期特征预测函数得到(n1 1)、(n1 2)、(n1 3)和(n1 4)个时刻的预测值分别为和从而得到(n2 4)个采样时刻的能耗周期特征预测序列
[0055]
通过式(4-1)-式(4-2),通过两层小波重构得到能耗趋势特征预测序列
[0056][0057][0058]
步骤4.2、通过式(4-3)得到三层小波重构后的含碳能源消耗预测序列其中,分别是第m个采样时刻到第m 7个采样时刻的含碳能源消耗数据的预测值:
[0059][0060]
步骤4.3、将的预测值舍去,仅保留作为第m个采样时刻的含碳能源消耗数据的预测值,实现对第m个采样时刻采集的第j类含碳能源消耗缺失数据的补全,最终得到完整的i个采样时刻采集的第j类含碳特征能源消耗数据集
[0061]
本实施例中,一种电子设备,包括存储器以及处理器,该存储器用于存储支持处理
器执行上述多能用量数据补全方法的程序,改处理器被配置为用于执行该存储器中存储的程序。
[0062]
本实施例中,一种计算机可读存储介质,是在计算机可读存储介质上存储有计算机程序,该述计算机程序被处理器运行时执行上述多能用量数据补全方法的步骤。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献