一种电力系统短期负荷预测方法及相关装置与流程

2022-11-30 13:44:21 来源：中国专利 TAG：

1.本技术涉及电力技术领域，尤其涉及一种电力系统短期负荷预测方法及相关装置。

背景技术：

2.目前，常用的短期电力负荷方法主要有统计学习和机器学习两种。统计学习方法包括多元线性回归、时间序列法和多项式趋势预测技术等；机器学习方法包括神经网络、支持小波分析等。统计学习方法虽然在处理稳定序列时表现优异，但因其无法解决非线性问题，导致该方法不适用于现阶段的短期电力负荷预测研究。机器学习方法能很好地处理非线性问题，因此在预测领域应用较为广泛。xgboost(extreme gradient boosting)的算法广泛地应用于电力系统的负荷预测这个问题中，虽考虑到了数据的多维度特征，但单层 xgboost 模型在显著性特征数据筛选、特征间相关性挖掘等方面存在缺点，使得电力系统短期负荷预测结果的准确性和可靠性都无法得到保障。

技术实现要素：

3.本技术提供了一种电力系统短期负荷预测方法及相关装置，用于解决现有技术对电力系统短期负荷预测准确性低且可靠性差的技术问题。
4.有鉴于此，本技术第一方面提供了一种电力系统短期负荷预测方法，所述方法包括：获取电力系统中负荷相关数据，所述负荷相关数据包括日期、时刻、温度、湿度和电力负荷值；将所述负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，所述预置kelm模型包括xgboost层、kelm层和adaboost层；基于stacking-nn根据多个所述优化负荷特征向量进行融合预测，得到负荷预测结果。
5.可选地，所述获取电力系统中负荷相关数据，所述负荷相关数据包括日期、时刻、温度、湿度和电力负荷值之后，还包括：对所述负荷相关数据进行预处理操作，所述预处理操作包括数据清洗、异常值剔除和缺失值填充。
6.可选地，所述将所述负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，所述预置kelm模型包括xgboost层、kelm层和adaboost层，包括：通过xgboost层对所述负荷相关数据进行负荷影响特征筛选，得到负荷筛选特征向量；将所述负荷筛选特征向量输入kelm层进行深层特征提取，得到初始负荷特征向量；基于adaboost层的不同预设核函数根据所述初始负荷特征向量对所述xgboost层
和所述kelm层进行参数优化，直至得到优化负荷特征向量，所述预设核函数包括高斯核函数、小波核函数和多项式核函数。
7.可选地，所述基于stacking-nn根据多个所述优化负荷特征向量进行融合预测，得到负荷预测结果，还包括：采用预置pearson相关系数计算多个所述优化负荷特征向量之间的差异度，得到差异值。
8.本技术第二方面提供一种电力系统短期负荷预测装置，所述装置包括：数据获取单元，用于获取电力系统中负荷相关数据，所述负荷相关数据包括日期、时刻、温度、湿度和电力负荷值；特征提取单元，用于将所述负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，所述预置kelm模型包括xgboost层、kelm层和adaboost层；负荷预测单元，用于基于stacking-nn根据多个所述优化负荷特征向量进行融合预测，得到负荷预测结果。
9.可选地，还包括：预处理单元，用于对所述负荷相关数据进行预处理操作，所述预处理操作包括数据清洗、异常值剔除和缺失值填充。
10.可选地，所述特征提取单元，具体用于：通过xgboost层对所述负荷相关数据进行负荷影响特征筛选，得到负荷筛选特征向量；将所述负荷筛选特征向量输入kelm层进行深层特征提取，得到初始负荷特征向量；基于adaboost层的不同预设核函数根据所述初始负荷特征向量对所述xgboost层和所述kelm层进行参数优化，直至得到优化负荷特征向量，所述预设核函数包括高斯核函数、小波核函数和多项式核函数。
11.可选地，还包括：差异计算单元，用于采用预置pearson相关系数计算多个所述优化负荷特征向量之间的差异度，得到差异值。
12.本技术第三方面提供一种电力系统短期负荷预测设备，所述设备包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；所述处理器用于根据所述程序代码中的指令，执行如上述第一方面所述的电力系统短期负荷预测方法的步骤。
13.本技术第四方面提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行上述第一方面所述的电力系统短期负荷预测方法。
14.从以上技术方案可以看出，本技术具有以下优点：本技术提供了一种电力系统短期负荷预测方法，包括：获取电力系统中负荷相关数据，负荷相关数据包括日期、时刻、温度、湿度和电力负荷值；对负荷相关数据进行预处理操作，预处理操作包括数据清洗、异常值剔除和缺失值填充；将负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，预置kelm模型包括xgboost层、
kelm层和adaboost层；基于stacking-nn根据多个优化负荷特征向量进行融合预测，得到负荷预测结果。
15.与现有技术相比，本技术1）基于xgboost算法及特征工程，构建多个弱学习器逐层训练，提取电力负荷的周期性特征，得到总体的变化趋势。即避免了大量冗余数据流占用通道，又能够为智能电网运维服务提供重要支持；2）stacking-nn 框架综合考虑各基模型的预测差异，通过融合多个独立模型，可获得出色的泛化能力。通过引入rsm与adaboost，构成 ras-nn 框架可降低同质基模型间的相关程度，扩大 stacking 框架在各模型中的适用范围，提高模型的预测性能。从而解决了现有技术对电力系统短期负荷预测准确性低且可靠性差的技术问题。
附图说明
16.图1为本技术实施例中提供的一种电力系统短期负荷预测方法实施例的流程示意图；图2为本技术实施例中提供的一种电力系统短期负荷预测装置实施例的结构示意图；图3为本技术实施例中提供的电力负荷变化曲线示意图；图4为本技术实施例中提供的影响负荷的特征变量示意图；图5为本技术实施例中提供的负荷曲线、误差示意图；图6为本技术实施例中提供的10时至16时局部对比图。
具体实施方式
17.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
18.以下为本实施例中xgboost算法以及极限学习机的说明：xgboost，即极限梯度提升算法，用于监视和解决学习中存在的问题，利用训练资料对目标变量进行预测。其采用决策树方法作为基学习器，构建多个薄弱学习器，在迭代学习的过程中通过沿着一个降低梯度的方向不断地训练模型，利用二阶泰勒级数将损失函数展开，为求得整体最优解，在目标函数中添加一个正则项，以提高和控制该模型的精确性和其复杂度。该方法主要具有防止经过拟合、速度快、可多线程并行处理等优点，是目前最成功的机器学习方法之一。xgboost 算法作为有监督的集成学习算法，可理解为多棵决策树的求和模型，其公式为：
ꢀꢀ
（1）式(1)中，k指决策树的棵数；fk为函数空间的独立函数；f为函数空间，由决策树组成。
19.给定样本集有n个样本，m个特征，其公式为：
ꢀꢀ
（2）
式(2)中，xi表示第i个样本，y
i 表示第i个类别标签。d为样本集，r为实数集。上述决策树的函数空间f公式为：
ꢀꢀꢀ
（3）式(3)中，q(x)表示将样本x分配至某叶节点；为叶节点权重。xgboost算法目标函数大致可分为两个组成部分，损失误差函数和正则项，其中，损失误差函数描述了目标预测值与另一个目标真实值间的差值；正则项( f
k ) 控制树的复杂度，防止过拟合。目标函数公式为：
ꢀꢀ
（4）
ꢀꢀ
（5）式(5)中，t为决策树个数；为t的惩罚系数；为正则化惩罚项系数。由于目标函数的优化参数是模型，不能用传统的优化方法在欧氏空间进行优化，故在模型训练时，将其理解为一种加法方式，将f (t)加入模型，最小化目标函数，过程如下：
ꢀꢀ
（6）
ꢀꢀ
（7）
ꢀꢀ
（8）
ꢀꢀ
（9）训练时，新一轮加入一个新的f函数，以最大化降低目标函数，第t轮，目标函数为：（10）式10中，
ꢀꢀ
（11）求解之后将关于树模型的迭代转化为关于树的叶节点的迭代，并求出最优的叶节点分数：
ꢀꢀ
（12）
ꢀꢀ
（13）式13中，为t次迭代中所有的数据集合。
20.数据对于各种算法都非常重要，决定了各种算法的最终性能,有效地将训练出来的数据即使和简单模型结合在一起，也很有可能会对其起到很好的效果,而所谓的特征工程是将训练原始的数据直接转变成有效地模型，这个训练数据的一个过程，一般包括特征的构建、提取和选择三部分。将原始输入和数据转化为一个特征，选择有效的特征以期能够较优地描述出潜在的问题,有助于大幅度地提高了预测模型的准确度。在超短期电力负荷预测中，有效筛选出显著影响负荷的特征集对后续预测工作具有重要意义。xgboost算法可
以在创建树后，利用特征工程直接完成特征提取并调用权重和增益两个取值，完成特征选择。其中，权重表示某特征在整个树群节点中出现的次数；增益表示某特征在整个树群作为分裂节点的信息增益之和再除以某特征出现的频次。式(13)中令则增益公式为：，
ꢀꢀ
（14）式(14)中，l、r 分别表示分裂后的左子树和右子树。
21.极限学习机(extreme learning machine， elm)是一种单隐层前馈网络，该网络随机产生输入层权重矩阵与隐藏层偏置。随机映射的elm模型可表示为:
ꢀꢀ
（15）式中，y表示elm输出结果，g(x)为sigmod函数，ω表示输入层权重矩阵，x表示模型输入变量，b表示隐藏层偏置矩阵，h(x)为隐藏层映射函数，β表示输出层权重矩阵。elm 通过求解线性方程组hβ=t，并在优化阶段采用正则化系数，推导输出层权重矩阵β为:
ꢀꢀ
（16）式中，h为隐藏层映射矩阵，i为维数为n的单位矩阵，t为目标值矩阵。根据mercer条件，在隐藏层映射未知的情况下将kelm的核矩阵定义为:
ꢀꢀ
（17）式中，ω表示核矩阵，k (x)表示核函数，i，j均为随机值。常用的核函数有线性核、高斯核及小波核。在实际回归预测中，为充分挖掘复杂序列的非线性信息，通常采用高斯核、小波核及多项式核作为核映射函数。高斯核与小波核对输入采用范数处理的映射方式，通过求解范数距离，将输入映射至高维空间。而多项式核则利用矩阵乘法的方式对数据进行映射，与上两种波状函数构造不同，表现出异质性的结构。
22.请参阅图1，本技术实施例中提供的一种电力系统短期负荷预测方法，包括：步骤101、获取电力系统中负荷相关数据，负荷相关数据包括日期、时刻、温度、湿度和电力负荷值；需要说明的是，本实施例使用了佛山连续2020-2021年20个月每半个小时的电力负荷数据。数据集包含日期、时刻、温度、湿度、电价和电力负荷的数据。由于本发明主要关注于电力负荷预测，仅选择日期、时刻和电力负荷数据的时间序列作为训练数据。
23.由于电力负荷实际上数值都是在一个很高的范围，大数值不利于系统分析计算所以把所有数据全部整合归一化成0-1之间的数值经过归一化后的数据处理结果如图3所示。然后对应影响电力系统负荷的一些重要因素进行特征变量编辑如4所示。
24.步骤102、对负荷相关数据进行预处理操作，预处理操作包括数据清洗、异常值剔除和缺失值填充；需要说明的是，负荷预测中考虑的历史数据特征数量不足将影响预测的精度，但也并非考虑的特征越多越好，通过量测设备获得的某些特征可能与负荷存在弱相关或无相关关系，甚至有负面的“噪声”影响。另外还存在异常值、缺失值等。因此，对于电力负荷预测，特征的构建与提取对模型训练结果有很重要的影响。
25.采集数据中存在缺失值、离群值和罕见值等噪声数据，对原始数据集进行特征清
洗和填充，包含异常值检测与缺失值的填充两部分。搜集到的特征数据属性不一，主要分为数值属性(如负荷值、温度值等)，标称属性(如天气情况、风向参数等)，序数属性(如时间参数)。其中，数值属性的异常值检测和缺失值填充可以直接通过数值运算进行检测和填充，对于标称数据则需要将其先转化为二元属性再做后续处理。
26.异常值是指在各种特征下的数据中，明显地偏离了其它的数据节点。针对一些数值型的数据，出现前后比较差异巨大的取决于这些值，采用3原则，分别计算数据的四分位数q1和q3，设定可接受值的取值范围，设定方法如式18所示：
ꢀꢀ
（18）其中，k取3时检测极端异常值；对序数型数据，由于其存在取值区间，检测其取值范围外的值作为异常值剔除；对标称型数据，异常值检测与序数型数据同理。q1为第一四分位数，q3为第三四分位数，即将训练样本从小到大依次排序，q1为序列中第25%的数字，即q3为序列中第75%的数字。
27.虽尽管本发明中所采用的xgboost算法能够将少量的缺失值直接转换成其它的特征来进行处理，但是对于缺失值相比较多的情形，试验结果表明直接利用有缺失值的数据来进行预测则实际效果不理想。为了更好地使输入的数据更有效，本发明在模型预测前选择了对数据进行不确认值的填充。上述不符合正常值被剔除后，将作为不符合正常值的填充物。序数类型的数据直接按顺序填充；对于标称类的数据要综合考虑当年的季节性因素，采用了本月删除空值之后的大部分众数进行填充；数值类型的数据分别采用线性插补和均值插加计算方法进行填补，取其中的平均值作为填补所对应的缺失值。
28.最终具有显著性影响的特征变量通过由高分到低分取不同数量特征变量组合时，负荷预测结果的平均绝对误差百分比确定。平均绝对误差百分比越小，说明该特征组合对应的负荷预测精度越高。
29.步骤103、将负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，预置kelm模型包括xgboost层、kelm层和adaboost层；需要说明的是，本实施例具体的：通过xgboost层对负荷相关数据进行负荷影响特征筛选，得到负荷筛选特征向量；将负荷筛选特征向量输入kelm层进行深层特征提取，得到初始负荷特征向量；基于adaboost层的不同预设核函数根据初始负荷特征向量对xgboost层和kelm层进行参数优化，直至得到优化负荷特征向量，预设核函数包括高斯核函数、小波核函数和多项式核函数。
30.步骤104、基于stacking-nn根据多个优化负荷特征向量进行融合预测，得到负荷预测结果。
31.需要说明的是，本实施例同时在融合预测过程中采用预置pearson相关系数计算多个优化负荷特征向量之间的差异度，以此分析基学习器之间的关联程度和复杂程度。二维向量的pearson相关系数计算方法为：
ꢀꢀ
（19）式中，和分别为各向量中元素的平均值，m为特征向量的个数，n为预测迭代融合
的次数。
32.本实施例的xgboost 方法下的负荷预测过程主要由 6 个步骤组成：1）采集相关数据，包括历史负荷数据及对应的特征数据；2）完成数据清洗，去除异常值、离群值等噪声数据并对缺失值进行填充；3）建立考虑复杂影响因素的第一层 xgboost 模型，并结合特征工程得到预测结果及特征排序，筛选出显著影响负荷的8 个特征；4）基于交叉验证对数据进行分块，分为测试集和验证集；5）以第一层 xgboost 筛选出的特征集为输入，对超参数进行择优，建立考虑显著特征的第二层 xgboost负荷预测模型；6）输出预测结果并计算准确率。
33.本技术利用 ras-nn 框架异化-提升-组合各单核kelm 模型，提高同质模型间的不同性、多样性，使集成效果更加稳健、准确。首先引入xgboost 算法对筛选出的特征变量作为各核kelm模型的输入。通过不同的算法同时进行计算，降低同质化严重的模型间的相关性，最大程度上增加融合的效率。接着将前文所讲的过程进行多次迭代，使模型能够认知到经过xgboost 算法筛选的各种特征对结果的影响，然后用 adaboost 按照之前迭代中的预测误差，重新调整xgboost 算法数据筛选，提升各个模型在负荷预测中的整体预测效果。最后引入stacking-nn融合框架，组合不同核的强预测器，进一步提高预测精度。
34.进一步地，为验证本实施例所提框架在该数据集上优于其他模型，经查阅相关文献和部分仿真实验后针对该框架与随机森林、bp 神经网络、gru分别对该日的负荷量进行预测，所得负荷曲线、误差如图5。其中，gru 网络设计为仅考虑自身时序特性的单输入单输出结构，隐藏层设计为两层网络，每层网络神经元个数分别设置为48和24；随机森林设计为 30 棵树，叶子数设置为5；bp神经网络设计为单层结构，神经元个数设置为5。
35.由图6可知，当电力系统负荷波动平缓时，所有模型都具有良好表现，但是当电力系统抖动较大时，对比模型的整体预测表现较差。其中，在中午高温停止作业时，负荷表现出了一定的波动性。bpnn 和随机森林的学习能力不足，无法表现出较好的预测性能。gru作为代表性的时序模型，在处理该问题时表现出了优异的效果，同时也表明该地区负荷受时序性影响较大。然而该模型受时序长度影响，在傍晚时分表现较差，预测性能仍有待提高。ras-nn利用不同的输出泛化结果，综合三种不同核模型的预测误差后，整体上表现出较好的预测性能。
36.以上为本技术实施例中提供的一种电力系统短期负荷预测方法的实施例，以下为本技术实施例中提供的一种电力系统短期负荷预测系统的实施例。
37.请参阅图2，本技术实施例中提供的一种电力系统短期负荷预测方法，包括：数据获取单元201，用于获取电力系统中负荷相关数据，负荷相关数据包括日期、时刻、温度、湿度和电力负荷值；预处理单元202，用于对负荷相关数据进行预处理操作，预处理操作包括数据清洗、异常值剔除和缺失值填充；特征提取单元203，用于将负荷相关数据输入预置kelm模型中进行特征提取操作，得到多个优化负荷特征向量，预置kelm模型包括xgboost层、kelm层和adaboost层；负荷预测单元204，用于基于stacking-nn根据多个优化负荷特征向量进行融合预测，得到负荷预测结果。
38.进一步地，本技术实施例中还提供了一种电力系统短期负荷预测设备，所述设备
包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；所述处理器用于根据所述程序代码中的指令执行上述方法实施例所述的电力系统短期负荷预测方法。
39.进一步地，本技术实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行上述方法实施例所述的电力系统短期负荷预测方法。
40.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
41.本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
42.应当理解，在本技术中，“至少一个（项）”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“a和/或b”可以表示：只存在a，只存在b以及同时存在a和b三种情况，其中a，b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项（个）或复数项（个）的任意组合。例如，a，b或c中的至少一项（个），可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。
43.在本技术所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
44.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
45.另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
46.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式
体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器（英文全称：read-only memory，英文缩写：rom）、随机存取存储器（英文全称：random access memory，英文缩写：ram）、磁碟或者光盘等各种可以存储程序代码的介质。
47.以上所述，以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：网约车订单的利润分配方法、系统、设备及存储介质与流程

一种电力系统短期负荷预测方法及相关装置与流程

相关文献

最热文献