一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于prophet-LightGBM混合模型的大规模建筑能耗预测方法

2022-06-16 07:20:41 来源:中国专利 TAG:

基于prophet-lightgbm混合模型的大规模建筑能耗预测方法
技术领域
1.本发明属于建筑能耗预测技术领域,具体涉及一种基于prophet-lightgbm混合模型的大规模建筑能耗预测方法。


背景技术:

2.近年来,城市建筑群趋向密集化,超高层建筑鳞次栉比。种种变化对建筑服务、供电稳定性都有了更高的要求,大规模高集成程度的建筑群对电量的需求越来越大。电力系统的合理规划、实现科学调度则需要提前预测下一时刻的能耗数据,因此对建筑能耗数据预测的重要性也日益凸显。为确保超大型城市的健康发展与智能电网的科学调度,对用电量进行预测、提高预测的精准度就显得尤为重要。
3.对能耗的预测方法本质上是预测未来时间序列相对应的数值,通过挖掘已知时序数据的演化特征,找到时序变化的周期,特征变量之间的关联,从而预估时间序列的未来走势,如能耗的变化峰值、基金的每日赎回购买金额、城市主干道车流量等等。通过分析和挖掘过去时间序列的特征数据,来发现预测未来的变化趋势在建筑节能减排领域具有重大意义,尤其在我国建筑能耗比重越来越高,提出碳达峰、碳中和战略目标任务后,建筑节能领域也受到了更多的重视。
4.由于建筑能耗存在复杂的随机性,无法轻易得到精准的预测结果,近年来,针对能耗预测的方法有:工程方法、统计回归、人工智能三个方面,其中工程方法是使用热物理方程,精确输入建筑的环境、运行、空调设备等情况,此方法通过复杂的模拟工具得到的预测结果是相当有效且精确的,但是在实际应用方面存在诸多困难,许多精确参数我们很难获取,复杂的建模又需要耗费巨量的人力成本与时间成本,极大地提高了使用的便利性。而统计回归的方法则是能耗数据与影响其的变量关联起来,通过简化变量和估算能量使用的重要参数来预测能耗,统计回归模型更容易设计,但是缺乏鲁棒性,所以预测精度不够准确,常常满足不了工程要求。至于人工智能的方法,其具有易用性,可以根据环境气候,建筑特性等相关变量进行实时预测,相较于统计回归方法预测性能较优,相比工程法减少预测成本对物理参数要求较低,近年来越来越受到研究者们青睐,但单一的神经网络模型容易受到模型缺陷影响导致泛化能力或者预测精度不能够进一步提升,如rnn算法在长时间的预测过程中存在梯度消散现象;支持向量机、 knn等算法在海量数据下得不到较好的数据结果。混合预测模型在此时就显得尤为重要,可以结合多个算法的优势,提高预测精度。


技术实现要素:

5.针对上述问题,本发明的目的在于提供一种预测准确性高的基于prophet-lightgbm混合模型的大规模建筑能耗预测方法。
6.本发明将lightgbm(ke g,meng q,finley t,et al.lightgbm:a highly efficientgradient boosting decision tree[c]//advances in neural information processing systems. 2017:3146-3154.,基于决策树算法的分布式梯度提升框架)和
prophet(s.j.taylor andb.letham,“forecasting at scale,”the americanstatistician,vol.72,no.1,pp. 37

45,2018.[online].available:https://doi.org/10.1080/00031305.2017.1380080,先知模型)两种模型进行拟合,利用粒子群优化算法计算两种模型的组合系数以提高预测精度,充分发挥不同模型在时序预测方面的优势。
[0007]
本发明提供的基于prophet-lightgbm混合模型的大规模建筑能耗预测方法,具体步骤如下:
[0008]
(1)获取大规模建筑群的能耗数据和各种特征变量的每小时读表数据,组成数据集,并对数据集预处理;
[0009]
(2)以3:1的比例划分数据,作为测试集和训练集;
[0010]
(3)采用先知模型(prophet)和lightgbm的预测方法分别对能耗数据进行分析并预测未来一段时间的能耗数值;接着采用粒子群优化算法(pso)求出混合模型的相应系数,从而优化预测模型,得到prophet-lightgbm的混合模型;
[0011]
(4)通过均方根误差rmse:
[0012][0013]
平均绝对百分比误差mape:
[0014][0015]
评估预测精准度,再与使用单个模型预测的结果进行对比。
[0016]
步骤(1)中,所述特征变量,包括区域编号、楼宇编号、区域用途、楼宇面积、楼宇年限、楼宇层数、能耗抄表、时间及日期、室外温度、云层覆盖度、露点温度、大气压、风向和风速,共14个特征变量。
[0017]
所述对数据预处理,包括分析数据特征变量关系,对数据集中缺失的历史数据数值进行填补,填补方式按照缺失时间的长短采用复制上一时刻的数据或者使用线性插值法补充数据。
[0018]
步骤(3)中,所述prophet模型,是拟合出未来一段时间的能耗趋势与数值,输入历史抄表的能耗数值和与之相应的时间序列,再输入需要预测的时间长度,经过模型训练得到未来预测的能耗数据;模型构成为:
[0019]
y(t)=g(t) s(t) h(t) ∈
t

[0020]
其中,y(t)为预测的能耗值;g(t)为模型中的趋势项,s(t)为周期项,h(t)为节假日因素,∈
t
为误差项。
[0021]
趋势项g(t):
[0022][0023]
式中,c(t)为随时间变化的值,指环境能容许的最大值,即电网容许的最大电量;
[0024]
因为建筑能耗在很大程度上都受气候温度的影响,所以能耗数值会随着日期等季
节性或人群昼夜节律的变化而变化,故周期项s(t)的形式为:
[0025][0026]
式中:p为时间序列的周期长度,n为周期数;an,bn为需要估计的参数;
[0027]
建筑能耗在节假日期间明显属于异常值,商场居民建筑用电量会激增,办公写字楼会下降,因此针对节假日的分析也尤为重要,故节假日因素h(t)的基本形式为:
[0028][0029][0030]
式中:l为节假日个数,κi为节假日影响范围。
[0031]
所述lightgbm模型,首先分析特征关系,利用互斥特征捆绑算法融合绑定降低特征向量数量,达到降维目的;采用直方图算法将特征变量离散化方便运算,使模型更加稳定增加鲁棒性;在直方图处理的基础上采用抑制决策树生长深度的策略防止过拟合;接下来用单边梯度采样算法排除小梯度样本,具体为将分裂的特征值取绝对值后从大到小排序,选取最大值x
max
和随机取y个较小数据,再做如下处理:使算法更加关注训练不足的样本,最后使用y x
max
个数据计算信息增益。
[0032]
所述粒子群优化(pso)算法,在得到prophet模型和lightgbm模型预测结果后,使用 pso算法进行拟合优化两种模型,提高预测精度发挥不同模型的优势。首先设置算法的最大运行次数、迭代运行时的位置改变速度vi(k)、位置xi(k)、适应度函数:(k)、适应度函数:其迭代公式与位置公式为:
[0033][0034]
式中,w为惯性因子,c1,c2为加速常数,pi为单体最小距离,pg为全局最小距离,k为迭代轮数,i为粒子数,q(t)式中α为prophet模型系数,β为lightgbm模型系数,为prophet 模型预测值,lightgbm模型预测值,y
t
为真实值。
[0035]
步骤(4)中,评估的误差评判标准为:
[0036]
均方根误差rmse:
[0037][0038]
平均绝对百分比误差mape:
[0039][0040]
式中:yi为能耗的抄表数;为模型预测的未来一段时间内的能耗值;m为在不同时间分辨率下的预测数值个数。
[0041]
评估精准度后再与使用单个模型预测精度进行对比。
附图说明
[0042]
图1为本发明中prophet模型预测方法流程图。
[0043]
图2为本发明中lightgbm模型预测方法流程图。
[0044]
图3为本发明中prophet-lightgbm混合模型预测方法流程图。
[0045]
图4为本发明一个实施例的不同模型在一天24h时间分辨率下能耗预测结果示意图。其中, (a)为prophet模型,(b)为lightgbm模型,(c)为prophet-lightgbm混合模型,(d)综合各个模型与实际值的对比。
具体实施方式
[0046]
本发明提供的一种基于prophet-lightgbm混合模型的大规模建筑能耗预测方法,如图1-3 所示,包括:
[0047]
prophet模型预测方法步骤:
[0048]
s1,获取数据集:
[0049]
本案例所使用的数据可以通过https://www.kaggle.com/sumit261124/ashrae-great-energy-predictor-iii-dataset公开访问,数据集的建筑类型涵盖教育、商场、饭店、医疗、民房、工厂、写字楼、公共服务、礼拜堂、仓库等来自全球多个不同地点的一千多座建筑物的三年(2016-2018)每小时抄表数值;该数据集采集了全球不同大洲不同国家的1449座建筑物近三年的能耗数据以及来自不同建筑距离最近的机场或气象站的气象数据,气象数据和能耗数据均以每一个小时记录一次共 76159440组数据;数据集变量如表1所示;
[0050]
表1数据集变量信息
[0051]
特征数变量描述1site_id区域编号2building_id建筑编号3primary_use区域用途4square_feet建筑面积m25year_built建筑年限6floor_count建筑层数7meter_reading能耗抄表(kw*h)8timestamp时间及日期year/month/day hour/min9air_temperature室外温度(气象站)℃10cloud_coverage云层覆盖度11dew_temperature露点温度(气象站)℃12sea_level_pressure大气压(气象站)mmhg13wind_direction风向(气象站)(0
°‑
360
°
)14wind_speed风速(气象站)(m/s)
[0052]
s2,数据处理:分析特征变量之间的内在关系,对数据集中缺失的历史数据数值进行填补,剔除异常值,清洗原始数据;
[0053]
s3,划分数据集:以3:1的比例划分数据;
[0054]
s4,采用prophet模型,拟合数据进行预测;
[0055]
s5,通过误差分析评判预测精准度,进一步调整参数优化模型。
[0056]
lightgbm模型预测方法步骤:
[0057]
s1,获取数据集,同上;
[0058]
s2,数据处理:分析特征变量之间的内在关系,对数据集中缺失的历史数据数值进行填补,剔除异常值,清洗原始数据;
[0059]
s3,划分数据集,同上;
[0060]
s4,采用lightgbm模型对训练集进行训练建模,生成预测数据;
[0061]
s5,通过误差分析评判预测精准度,进一步调整参数优化模型。
[0062]
prophet-lightgbm混合模型预测方法步骤:
[0063]
s1,获取数据集,如上;
[0064]
s2,数据处理:分析特征变量之间的内在关系,对数据集中缺失的历史数据数值进行填补,剔除异常值,清洗原始数据;
[0065]
s3,划分数据集,同上;
[0066]
s4,采用lightgbm模型对训练集进行训练建模,生成预测数据;
[0067]
s5,采用prophet模型,拟合数据进行预测;
[0068]
s6,对经过步骤4、步骤5得到的预测结果,构建相应的适应度函数:构建相应的适应度函数:采用pso算法对混合模型的系数进行最优求解,得出α、β系数为0.1303、0.8433;
[0069]
s7,计算混合模型的预测结果;
[0070]
s8,通过误差分析评判预测精准度,使用rmse、mape,并将prophet-lightgbm混合模型与prophet模型、lightgbm模型、用电量的真实值对比,表2列出了不用模型在相同指标下的对比结果。
[0071]
表2各模型评估结果对比
[0072]
模型rmsemapeprophet13.5711.58lightgbm12.2210.20prophet-lightgbm10.458.76
[0073]
根据本发明实施例的基于prophet-lightgbm混合模型的大规模建筑能耗预测方法,能够提高预测精度,可以更好的协助电网实现智能调度。
[0074]
上述的技术细节与算法实施的步骤流程仅作为演示示例用来更好的阐述本发明提出的方法,不能理解为对本发明的限制,本领域的其他研究人员可以在本发明范围内进行变形重组,这些变形与组合仍在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献