一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于集成学习的在线机组负荷预测方法与流程

2022-02-22 19:06:08 来源:中国专利 TAG:


1.本发明属于火电站负荷预测领域,涉及一种基于集成学习的在线机组负荷预测方法。


背景技术:

2.受环境、季节等因素的影响,电网的用电需求随时间存在较大的波动,根据电力生产与消费的实际特点,需保持供需端的平衡关系。由此产生的供电侧发电量变化主要由火电机组通过机组负荷的变化调节,电网根据机组实际情况和相应的电力调度原则,向电厂下达负荷计划曲线,但因目前机组并网结构复杂,计划曲线与实际机组负荷指令存在较大偏差。因此准确的机组实际负荷预测有助于电厂选择调节方式,及时的响应电网的负荷调度,能够使电网保持高效、稳定、安全、经济地运行。
3.因负荷需求受各种条件因素的影响,具有不确定性、时间周期性和条件性等特点,目前主要采用以下几种负荷预测方法:(1)回归预测;(2)时间序列预测;(3)灰色预测;(4)人工神经网络;(5)支持向量机;(6)小波变化算法;(7)模糊回归模型。然而回归方法中系数的非线性,使模型的精确降低;时间预测模型受气象气候等因素影响大;灰色模型的预测精度与灰度成反比,当数据离散程度增大时,预测精度下降;人工神经网络的设计要求较高,隐含层个数难以判断,收敛速度慢;支持向量机难以处理大规模训练样本,无法反映机组负荷长时间的变化规律;小波变换算法过程较为复杂,对历史负荷数据准确性要求高,且难以克服复杂因素的干扰作用;模糊系统缺乏自学习能力,其模糊规则主要依赖专家系统,使用范围有较大的局限性。
4.因此为及时响应机组的负荷调度需求,需当前急需一种适合发电机组负荷特性并且预测精度较高的负荷预测方法,通过有效的数据处理和挖掘工具,从复杂无序的负荷运行数据中获取稳定而准确的时序变化趋势。


技术实现要素:

5.为了快速响应负荷调度指令,本发明提供一种基于集成学习的在线负荷预测方法,通过对结果预测判断负荷的变化趋势,决定负荷调节模式。
6.为解决上述技术问题,本发明采用如下技术方案:
7.一种基于集成学习的在线机组负荷预测方法,包括以下步骤:
8.(1)从机组sis数据库中获取前一个月的负荷历史运行数据,得到原始数据样本d;
9.(2)对原始数据样本d进行数据预处理,根据拉依达准则去除粗大误差,处理后的样本记为cd;
10.(3)对样本cd进行特征提取,包括时间特征相关性特征和聚合特征,建立特征数据样本td;
11.(4)将td输入极限梯度提升和轻量级高效梯度提升模型,对应输出结果分别记为xd和ld1;
12.(5)将td和ld1进行拼接并作为全连接层dense1,输入长短期记忆神经网络,输出结果记为ld2;
13.(6)最后将xd、ld1和ld2进行拼接并作为全连接层dense2,输入线性回归模型,得到最后的输出结果,即最终的机组负荷预测结果。
14.本发明进一步的改进在于,所述步骤(1)中取数间隔为1min。
15.本发明进一步的改进在于,所述步骤(1)中历史数据为机组负荷的时序历史数据。
16.本发明进一步的改进在于,所述步骤(2)中数据预处理过程为过滤原始样本d中的离群值。
17.本发明进一步的改进在于,所述步骤(2)中根据拉依达准则,对样本d计算处理得到标准偏差,超过偏差区间属于粗大误差,采用前一时刻的负荷值替代误差值。
18.本发明进一步的改进在于,所述步骤(3)中特征提取包括离散时间特征,当前值与其过去值之间的自相关特征和偏自相关特征以及不同时间窗平均值的聚合特征,其中,时间跨度均为3,即包括t-1、t-2、t-3。
19.本发明进一步的改进在于,所述步骤(5)中所述的拼接是将td和ld进行矩阵拼接,并非对应元素相加。
20.本发明进一步的改进在于,所述步骤(6)中线性回归模型通过加法模型将xd、ld1和ld2结果进行线性组合,训练时不断改变权值来减小预测残差以获得满意的训练结果。
21.本发明相对于现有技术而言具备以下优点:
22.(1)本发明是基于算法的在线预测方法,无需额外的硬件设备。
23.(2)本发明是一种基于运行数据、融合多种算法进行集成学习的机组负荷预测方法,预测精度较高且稳定性强,在长时间段最大预测误差小且保持稳定。
24.(3)本发明通过极限梯度提升(xgboost)法在训练模型时通过对模型的排序,建立block结构,降低迭代计算中的重复数据,降低计算复杂度,缩小计算时间。
25.(4)本发明通过轻量级高效梯度提升(lgbm)算法计算不同历史数据的权重,减少建模数据中权重较小的数据,提高模型精确度。
26.(5)本发明通过多模型输出结果的矩阵拼接,加强高权重数据的的比例,同时保存低权重数据,在保证模型精确度的基础上提高模型泛化能力,确保实施例中实际值与模型预测值的均方根误差减小。
附图说明
27.图1为本发明一种基于集成学习的在线机组负荷预测方法的流程图。
28.图2为实施例中的同一工况下机组负荷时序变化曲线。
29.图3为实施例中的预测机组负荷时序预测结果与实际机组负荷的对比图。
具体实施方式
30.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。需要说明的是,在不冲突的情况下,本发明中的实施例及
实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
31.本发明的框架主要由历史数据采样、数据预处理、特征提取、xgboost模型训练、lgbm模型训练、lstm模型训练、集成学习线性回归模型训练、机组负荷预测等核心步骤,详细流程如图1所示。以某燃煤机组为例,具体操作步骤如下:
32.从厂级监控信息系统(sis)的数据库采集2020年5月1日00:00至2020年5月31日00:00的负荷历史数据值,取数间隔为1min,所得的负荷值序列如图2所示。而后对数据进行预处理,根据拉依达准则计算标准偏差区间,清理粗大误差值。进一步地对数据进行特征提取,离散时间特征,提取当前值与其过去值之间的自相关特征和偏自相关特征以及不同时间窗平均值的聚合特征,其中,时间跨度均为3,包括t-1、t-2、t-3,并将特征数据按照4:1的比例划分数据集,前一部分作为训练数据,后一半部分作为测试数据。进一步地利用训练数据分别训练xgboost,lgbm两个模型,学习器均采用了四折交叉验证进行训练,并使用了sklearn类里面的gridsearch方法进行参数寻优。
33.将训练数据用于训练所构建的预测模型,模型的参数如表1所示。
34.表1:xgboost模型参数
35.n_estimators16000min_child_weight1learning_rate0.01max_depth6subsample0.6colsample_bytree0.4colsample_bylevel1
36.表2:lgbm模型参数
37.n_estimators9000min_child_samples20num_leaves20learning_rate0.005feature_fraction0.8subsample0.4
38.lgbm和xgboost中均设置了提前终止训练:当模型损失连续300次迭代均没有改进时停止训练。对于lstm模型,采用单层lstm,隐含层神经元数目为200,迭代次数为200。
39.图3给出了一段时间内(2020年5月9日00:00到2020年5月22日00:00)机组负荷预测结果和实际测点数据的对比。对于整个测试集,模型预测值的均方根误差(rmse)为3.2796,相对百分误差绝对值(mape)为2.147%。可以看到,模型预测误差很小,满足实际工程中的需要。同时,可以看到,实测的机组负荷时序数据具有较大的波动性,模型的预测结果能够较好的识别负荷的波动规律,与实测结果较好的贴合,表明本发明所提出的机组负荷预测方法能够提前判断负荷的变动趋势,解决机组运行过程中,负荷难以快速响应指令的问题。
40.以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应
视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献