负荷数据的生成方法、装置、设备及存储介质与流程

2022-11-28 11:05:04 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，尤其涉及一种负荷数据的生成方法、装置、设备及存储介质。

背景技术：

2.多能互补园区作为能源互联网的重要物理载体，通过将电力与燃气、热力、冷系统进行紧密耦合，在规划、运行等过程中，对不同的能源环节实施有机协调与优化，进而形成以电为核心的能源产供销一体化系统。
3.多能互补园区的规划考虑到不同能源类型需求的差异，是系统能够充分发挥多能互补与梯级利用优势的重要前提，也是未来建设能源互联网以及吸引多能互补园区建设投资的有力保障。然而，目前多能互补园区的规划模型和方法需要对园区未来的冷热气电负荷数据进行长期准确的预测，冷热气电负荷数据存在负荷特性，导致增加对冷热气电负荷数据的生成难度。

技术实现要素：

4.本技术提供了一种负荷数据的生成方法、装置、设备及存储介质，以解决当前冷热气电负荷数据存在准确生成难度大的技术问题。
5.为了解决上述技术问题，第一方面，本技术提供了一种负荷数据的生成方法，包括：
6.基于目标园区的负荷样本数据和外部环境数据，生成第一数据集；
7.利用prophet算法，根据第一数据集，提取目标园区的负荷周期效应；
8.基于负荷周期效应，去除第一数据集中的负荷周期效应，得到第二数据集；
9.利用blending集成学习算法，根据第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型；
10.基于基础负荷生成模型，结合外部环境数据，生成目标园区的基础负荷数据，并将基础负荷数据与负荷周期效应结合，生成目标园区的负荷数据。
11.作为优选，利用prophet算法，根据第一数据集，提取目标园区的负荷周期效应，包括：
12.利用prophet算法，对第一数据集进行拟合，得到目标园区的负荷周期效应，prophet算法的表达式为：
13.yi(t)＝gi(t) si(t) ∈i(t)；
14.其中，yi(t)为第一数据集中第i种负荷样本在t时刻的实际值，gi(t)为第i种负荷样本在t时刻的基础值，si(t)为第i种负荷样本在t时刻的周期效应值，∈i(t)为t时刻的第i种负荷样本与生成数据之间的误差项。
15.作为优选，基于负荷周期效应，去除第一数据集中的负荷季节效应，得到第二数据集，包括：
16.利用预设计算公式，去除第一数据集中的负荷周期效应，得到第二数据集，预设计算公式为：
17.di(t)＝yi(t)-si(t)；
18.其中，di(t)表示第二数据集中第i种负荷在t时刻的基础值，yi(t)表示第一数据集中第i种负荷样本在t时刻的实际值，si(t)表示第i种负荷样本在t时刻的周期效应值。
19.作为优选，利用blending集成学习算法，根据第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型，包括：
20.将第二数据集划分为第一数据子集和第二数据子集；
21.基于基学习器，对第一数据子集进行训练，直至训练结果达到第一预设收敛条件，得到基学习器负荷生成模型；
22.利用基学习器负荷生成模型，对第二数据子集进行计算，并将计算结果与第二数据子集生成为第三数据子集；
23.基于元学习器，对第三数据子集进行训练，直至训练结果达到第二预设收敛条件，得到元学习器负荷生成模型；
24.将基学习器负荷生成模型和元学习器负荷生成模型整合为基础负荷生成模型。
25.作为优选，基于基础负荷生成模型，结合外部环境数据，生成目标园区的基础负荷数据，并将基础负荷数据与负荷周期效应结合，生成目标园区的负荷数据，包括：
26.以目标园区在t时刻的负荷样本数据和外部环境数据作为基础负荷生成模型的输入，以使基学习器和元学习器滚动计算生成目标园区在t 1时刻至t n时刻的基础负荷数据；
27.将目标园区在t 1时刻至t n时刻的基础负荷数据与对应时刻的负荷周期效应合成为负荷数据。
28.作为优选，方法还包括：
29.基于负荷样本数据和生成的负荷数据，验证负荷生成模型的准确性。
30.第二方面，本技术还提供一种负荷数据的生成装置，包括：
31.生成模块，用于基于目标园区的负荷样本数据和外部环境数据，生成第一数据集；
32.提取模块，用于利用prophet算法，根据第一数据集，提取目标园区的负荷周期效应；
33.去除模块，用于基于负荷周期效应，去除第一数据集的负荷周期效应，得到第二数据集；
34.训练模块，用于利用blending集成学习算法，根据第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型；
35.预测模块，用于基于基础负荷生成模型，结合外部环境数据，生成目标园区的基础负荷数据，并将基础负荷数据与负荷周期效应结合，生成目标园区的负荷数据。
36.作为优选，提取模块，具体用于：
37.利用prophet算法，对第一数据集进行拟合，得到目标园区的负荷周期效应，prophet算法的表达式为：
38.yi(t)＝gi(t) si(t) ∈i(t)；
39.其中，yi(t)为第一数据集中第i种负荷样本在t时刻的实际值，gi(t)为第i种负荷
样本在t时刻的基础值，si(t)为第i种负荷样本在t时刻的周期效应值，∈i(t)为t时刻的第i种负荷样本与生成数据之间的误差项。
40.第三方面，本技术提供一种计算机设备，包括处理器和存储器，存储器用于存储计算机程序，计算机程序被处理器执行时实现如第一方面的负荷数据的生成方法。
41.第四方面，本技术提供一种计算机可读存储介质，其存储有计算机程序，计算机程序被处理器执行时实现如第一方面的负荷数据的生成方法。
42.与现有技术相比，本技术至少具备以下有益效果：
43.通过基于目标园区的历史负荷曲线和外部环境数据，生成第一数据集，利用prophet算法，根据第一数据集，提取目标园区的负荷周期效应，从而考虑负荷数据的季节性、自相关性、非线性合随机性；再基于负荷周期效应，去除第一数据集中的负荷周期效应，得到第二数据集；以及利用blending集成学习算法，根据第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型；基于基础负荷生成模型，生成目标园区的负荷数据，并将基础负荷数据与负荷周期效应结合，生成目标园区的负荷数据，以利用智能算法学习冷热气电负荷的负荷特性，降低负荷生成难度，从而有效地生成或增强多能互补园区的各类负荷数据，为多能互补园区能源系统的规划运行提供数据性支撑，进一步保障了园区能源互联网的稳定性。
附图说明
44.图1为本技术实施例示出的负荷数据的生成方法的流程示意图；
45.图2为本技术实施例示出的另一种负荷数据的生成方法的流程示意图；
46.图3为本技术实施例示出的发电量曲线分解示意图；
47.图4为本技术实施例示出的发电负荷的实际结果和预测结果的示意图；
48.图5为本技术实施例示出的负荷数据的生成装置的结构示意图；
49.图6为本技术实施例示出的计算机设备的结构示意图。
具体实施方式
50.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
51.请参照图1，图1为本技术实施例提供的一种负荷数据的生成方法的流程示意图。本技术实施例的负荷数据的生成方法可应用于计算机设备，该计算机设备包括但不限于智能手机、笔记本电脑、平板电脑、桌上型计算机、物理服务器和云服务器等设备。如图1所示，本实施例的负荷数据的生成方法包括步骤s101至步骤s105，详述如下：
52.步骤s101，基于目标园区的负荷样本数据和外部环境数据，生成第一数据集。
53.在本步骤中，负荷样本数据为目标园区在一段时间内的一系列历史负荷数据，具有负荷季节效应，负荷样本数据包括但不限于冷系统、热力系统、电力系统和燃气系统的历史负荷曲线。外部环境数据包括但不限于天气曲线。
54.可选地，将负荷样本数据和外部环境数据按照时间序列一一对应，组成目标数据
集，再以时间序列分割方式，将目标数据集分割为多个时间段分别对应的多个数据集。可以理解的是，也可以不分割，目标数据集作为第一数据集data1。
55.可选地，所述步骤s101，包括：
56.对所述负荷样本数据和所述外部环境数据进行预处理，得到目标数据集；
57.基于所述目标数据集的负荷时间顺序，将所述目标数据集划分为各个时间段对应的数据集。
58.在本实施例中，预处理可以是非数值数据数值化和插值法填补空缺值等，以构成目标数据集。然后根据v1:v2的比例将目标数据集按时间顺序划分为(0,t1)、(t1,t2)两个时间段对应的数据集，并分别命名为data1和data2。
59.可选地，还可以根据v1:v2:v3的比例，将目标数据集按时间顺序划分为(0,t1)、(t1,t2)和(t2,t)三个时间段对应数据集，并分别命名为data1,data2和data3，时间断点的时间戳分别为t1和t2。
60.步骤s102，利用prophet算法，根据所述第一数据集，提取所述目标园区的负荷周期效应。
61.在本步骤中，prophet算法是一种基于加性模型(additivemodel)预测时间序列数据的算法。本实施例利用prophet算法提取目标园区的负荷样本数据中所隐含的负荷周期效应，采用的数据集为第一数据集data1。
62.需要说明的是，周期效应分解和基础负荷数据预测采用不同的数据集是因为周期性效应分解后第一数据集data1受到污染，所以采用第二数据集去除负荷周期效应，避免对基础负荷预测模型的训练造成影响，进而避免影响基础负荷数据生成的有效性。
63.在一些实施例中，所述步骤s102，包括：
64.利用所述prophet算法，对所述第一数据集进行拟合，得到所述目标园区的负荷周期效应，所述prophet算法的表达式为：
65.yi(t)＝gi(t) si(t) ∈i(t)；
66.其中，yi(t)为所述第一数据集中第i种负荷样本在t时刻的实际值，gi(t)为第i种负荷样本在t时刻的基础值，si(t)为第i种负荷样本在t时刻的周期效应值，∈i(t)为t时刻的第i种负荷样本与生成数据之间的误差项。
67.在本实施例中，第i种负荷样本数据的实际值yi(t)分成基础值gi(t)、周期效应值si(t)和误差项∈i(t)，t属于时间段(0,t1)的任意时刻，第i种负荷样本数据的周期效应值si(t)包含li个分量，分别表示周期步长为pr(r＝1,2,
…
,li)的季节效应，即：
[0068][0069]
令一天的时间步长为n
day
，当pr＝365.25*n
day
，(r＝1,2,
…
,li)时表示年度效应项；pr＝7*n
day
，(r＝1,2,
…
,li)时表示周度效应项；pr＝n
day
，(r＝1,2,
…
,li)时表示日度效应项。上述三个时间步长的周期效应项分量为本技术主要考虑的周期效应项分量，由于人们生产生活和外部气象条件在一天的不同时点存在一定季节性，因此考虑日度效应；同时生产生活在工作日和非工作日也有显著的不同，因此负荷也存在周度效应；而年度效应的考虑主要是为了去除年度气象因素的季节性性影响；本实施例不
考虑月度效应和节假日效应，将其纳入了误差项之中，误差项∈i(t)服从高斯分布。
[0070]
本实施例采用prophet算法拟合周期效应值、基础值和误差项，然后从一条负荷样本曲线提取出不同时间步长的周期效应。为了达到拟合的目的，还需要对基础值gi(t)和周期效应项分量(r＝1,2,
…
,li)做进一步计算。
[0071]
基础值gi(t)：为了能够实现负荷的分解，将gi(t)假设为分段线性函数，相连的两个分段函数所在的点为变化点，假设存在si个变化点，变化点的时间戳为s
i,j
(1≤j≤si)。线性函数的基础形式为y＝kx m，分段线性函数则是在每一个子区间上，函数都是线性函数，因此，分段线性函数就是一个折线的形状。
[0072]
对于第i种负荷，基础值具体的模型如下：
[0073]gi
(t)＝(ki ai(t)
t
δi)t (mi ai(t)
t
γi)；
[0074]
其中ki表示负荷的基础增长率；mi表示基础偏移参数；ai(t)是一个指示函数，是为了反映ki和mi，可以根据不同时间区间的变化情况而构造，可以根据不同时间区间的变化情况而构造si表示变化点的个数，s
i,j
表示第j个变化点所在位置的时间戳；δi表示负荷的增长率在不同变点的变化量集合，γi表示不同变点的正确调整集合，γ
i,j
＝-s
i,j
δ
i,j
；δ
i,j
表示在时间戳s
i,j
上的增长率的变化量，δ
i,j
～laplace(0,τi)；τi表示变点变化率范围，当τi趋近于零的时候，δ
i,j
也是趋向于零的，此时的增长函数将变成全段的线性函数。
[0075]
周期效应项分量prophet算法使用傅立叶级数来模拟时间序列的季节性。的傅立叶级数的形式为：
[0076][0077]
该算法对于常见的周期步长设定了特定的u，对于以年度效应的序列(pr＝365.25)而言，u＝10；对于周度效应的序列(pr＝7)而言，u＝3。周期步长为pr的参数可以形成列向量
[0078][0079]
将周期为pr的正弦项和余弦项合成向量其可以表示为：
[0080][0081]
因此，负荷曲线周期步长为pr的周期效应值为：
[0082][0083]
而的初始化是的初始化是表示周期为pr的周期效应的范围，值越大，表示周期效应越明显；值越小，表示周期效应越不明显。
[0084]
步骤s103，基于所述负荷周期效应，去除所述第一数据集中的负荷周期效应，得到第二数据集。
[0085]
在本步骤中，基于步骤s103，包括：
[0086]
利用预设计算公式，去除所述第一数据集中的负荷周期效应，得到所述第二数据集，所述预设计算公式为：
[0087]di
(t)＝yi(t)-si(t)；
[0088]
其中，di(t)表示所述第二数据集中第i种负荷在t时刻的基础值，yi(t)表示所述第一数据集中第i种负荷样本在t时刻的实际值，si(t)表示第i种负荷样本在t时刻的周期效应值。
[0089]
在本实施例中，将基于上述prophet算法的表达式在第一数据集data1上进行拟合，可以得到第i种负荷的在t时刻的周期效应值si(t)，而本技术还需要生成基础负荷项，利用第一数据集data1去除周期效应，得到第二数据集data
20
，用于基础负荷预测模型训练，令第二数据集中第i种负荷样本数据在t时刻(此阶段的t属于时间段(t1,t2)的任意时刻)的实际负荷和基础负荷分别为yi(t)和di(t)。
[0090]
步骤s104，利用blending集成学习算法，根据所述第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型。
[0091]
在本步骤中，blending集成学习算法是基于学习集成的集成学习方法，该集成学习方法进行两轮模型的学习(第一轮为基学习器的学习，第二轮为元学习器的学习)，将data
20
所有样本按照w1:w2的比例划分(样本划分的比例根据需求合理制定)为第一数据子集data
21
和第二数据子集data
22
，data
21
是基学习器的训练集；data
22
可以是基学习器的测试集，也可以是元学习器的训练集和测试集(将data
22
按照一定比例划分为训练集和测试集)。
[0092]
可选地，基学习器的学习模型为：
[0093]di
(t)＝f
i，z
(di(t-1)，xi(t))；
[0094]
其中f
i,z
表示第z个基学习器的模型，模型具体形式由对应的算法(包括但不限于lr、knn、catb、ridge、lasso、mlp、dt、et、xgb、lgbm、rf、adaboost、gdbt和bagging等算法)决定。此处仅表示滞后一阶的模型，即仅考虑di(t-1)，而在应用中可根据需求滞后多阶。
[0095]
可选地，元学习器的学习模型为：
[0096]di
(t)＝f
i，yuan
(d
i，pred1
(t))；
[0097]
其中，d
i,pred1
(t)是一个q维的向量，表示q个基学习器根据w2％的样本的特征项进行预测的结果。f
i,yuan
表示元学习器的模型，模型具体形式由对应的算法(包括但不限于lr、knn、catb、ridge、lasso、mlp、dt、et、xgb、lgbm、rf、adaboost、gdbt和bagging等算法)决定。模型训练结束后还可以在测试集上进行测试并辅助模型的调参。
[0098]
可选地，对基学习器和元学习器进行整合，可以得到t 1时刻的基础负荷预测模型：
[0099]di，pred
(t 1)＝fi(di(t)，xi(t 1))；
[0100]
即可通过第i种负荷t时刻的基础负荷值和t 1时刻的外部输入值获得t 1时刻的基础负荷预测值。
[0101]
在一些实施例中，所述步骤s104，包括：
[0102]
将所述第二数据集划分为第一数据子集和第二数据子集；
[0103]
基于所述基学习器，对所述第一数据子集进行训练，直至训练结果达到第一预设收敛条件，得到基学习器负荷生成模型；
[0104]
利用所述基学习器负荷生成模型，对所述第二数据子集进行计算，并将计算结果与第二数据子集生成为第三数据子集；
[0105]
基于所述元学习器，对所述第三数据子集进行训练，直至训练结果达到第二预设收敛条件，得到元学习器负荷生成模型；
[0106]
将所述基学习器负荷生成模型和元学习器负荷生成模型整合为所述基础负荷生成模型。
[0107]
在本实施例中，对于基学习器的训练：基学习器的标签项为t时刻的基础负荷值di(t)，特征项包括t-1时刻的基础负荷值di(t-1)和t时刻的外部数据xi(t)，利用第一数据子集data
21
，通过基学习器进行训练。在基学习器训练结束后，将data
22
作为测试集，根据不同基学习器的预测效果调整出合适的模型参数。
[0108]
对于元学习器的训练：将所有基学习器对data
22
的样本t时刻的预测结果d
i,pred1
(t)作为元学习器的特征项，t时刻的基础负荷值di(t)作为元学习器的标签项，组成新的第三数据子集data
23
；将data
23
按照一定比例划分为训练集和测试集，对元学习器进行训练和调参优化。
[0109]
步骤s105，基于所述基础负荷生成模型，结合所述外部环境数据，生成所述目标园区的基础负荷数据，并将所述基础负荷数据与所述负荷周期效应结合，生成所述目标园区的负荷数据。
[0110]
在本步骤中，将训练好的基学习器和元学习器滚动预测生成未来一段时间的基础负荷预测值，在基础负荷预测值的基础上根据其时间属性加上周期效应合成未来一段时间的未来负荷曲线。
[0111]
在一些实施例中，所述步骤s105，包括：
[0112]
以所述目标园区在t时刻的负荷样本数据和外部环境数据作为所述基础负荷生成模型的输入，以使所述基学习器和所述元学习器滚动计算生成所述目标园区在t 1时刻至t n时刻的基础负荷数据；
[0113]
将所述目标园区在t 1时刻至t n时刻的基础负荷数据与对应时刻的所述负荷周期效应合成为所述负荷数据。
[0114]
在本实施例中，若以t时刻为时间起点，可以以t时刻的基础负荷值和t 1时刻的外部数据为输入，生成t 1时刻的基础负荷预测值；然后以t 1时刻的基础负荷预测值和t 2时刻的外部数据为输入，生成t 2时刻的基础负荷预测值；如此循环，可滚动生成t 1时刻到t n时刻的基础负荷预测值。
[0115]
上述过程合成了一条未来基础负荷曲线d
i,pred
(t)(此阶段的t属于时间段(t 1,t n)的任意时刻)，然后根据t时刻的时间属性可以得到周期效应si(t)，最后合成一条负荷曲线y
i,pred
(t)。
[0116]
在一些实施例中，图2示出了另一种负荷数据的生成方法的流程示意图。与图1相同的步骤，在此不再赘述。如图2所示，所述方法还包括：
[0117]
步骤s201，基于所述负荷样本数据和生成的所述负荷数据，验证所述负荷生成模型的准确性。
[0118]
在本实施例中，根据步骤s101的负荷样本数据和步骤s105生成的负荷数据，对负荷生成模型进行验证，以验证负荷生成模型的准确性。
[0119]
作为示例而非限定，本技术实施例以电力负荷的生成为例验证上述基础负荷模型的生成效果，数据集包含2014年1月1日00点00分—2020年4月30日23点45分一共约6年半的爱尔兰能源系统数据，主要包括爱尔兰与北爱尔兰的总发电量、电力需求量、风电发电量、风电可用性和snsp(systemnon-synchronouspenetration)等指标的电力数据，数据为尚未进行质量控制的15分钟原始scada读数。数据集中负荷数据的单位为mw，数据更新频率为15分钟。
[0120]
将电力需求量、风电发电量、风电可用性和snsp等指标作为外部输入。考虑到真实数据沉淀较少，因此仅采用爱尔兰能源系统数据集中2019年1月1日00点00分—2020年4月30日23点45分一共一年零五个月的数据(共计46652个时点)。按照本技术的划分方式，data1为2019年1月1日00点00分—2019年6月30日23点45分的数据(共计17372个时点)，用于季节效应的提取；data2为2019年7月1日00点00分—2020年1月20日23点45分的数据(共计19680个时点)，用于构建基础负荷的预测模型；data3为2020年1月21日00点00分—2020年4月20日23点45分的数据(共计9600个时点)，用于测试整个生成模型的效果。
[0121]
采用六个评价指标模型晓玲，分别为决定系数(r2_score)、中位绝对误差(medianabsoluteerror)、均方根误差(rootmeansquareerror)、平均绝对误差(meanabsoluteerror)、平均绝对百分比误差(meanabsolutepercentageerror)和对称平均绝对百分比误差(symmetricmeanabsolutepercentageerror)。
[0122]
假设y(t)表示负荷实际值，y
pred
(t)表示预测值，y
mean
表示负荷实际值的均值，则上述评级指标可表示为：
[0123]
(1)决定系数(r2_score)
[0124]
r2_score反映因变量的全部变异能通过回归关系被自变量解释的比例，可以通俗地理解为以均值作为误差基准，预测误差是否大于或者小于均值基准误差。当r2_score＝1时，样本中预测值和真实值完全相等，没有任何误差，表示回归分析中自变量对因变量的解释越好。当r2_score＝0时，此时分子等于分母，样本的每项预测值都等于均值。
[0125][0126]
(2)中位绝对误差(medianabsoluteerror)
[0127]
mdae(中位绝对误差)是目标值和预测值之间的所有绝对差的中值，当预测值与真实值完全吻合时等于0，即完美模型；误差越大，该值越大。其表示为：
[0128]
mdae＝median(|y(t)-y
pre
(t)|)；
[0129]
(3)均方根误差(rootmeansquareerror)
[0130]
mse(均方误差)的范围为[0， ∞)，当预测值与真实值完全吻合时等于0，即完美模
型；误差越大，该值越大。
[0131][0132]
rmse(均方根误差)是mse的开方，这样数量级上比较直观，比如rmse＝10，可以认为回归效果相比真实值平均相差10。rmse的范围为[0， ∞)，当预测值与真实值完全吻合时等于0，即完美模型；误差越大，该值越大。
[0133][0134]
(4)平均绝对误差(meanabsoluteerror)
[0135]
mae(平均绝对误差)的范围为[0， ∞)，当预测值与真实值完全吻合时等于0，即完美模型；误差越大，该值越大。
[0136][0137]
(5)平均绝对百分比误差(meanabsolutepercentageerror)
[0138]
mape(平均绝对百分比误差)的范围为[0， ∞)，mape为0％表示完美模型，mape大于100％则表示劣质模型。相比rmse，mape相当于把每个点的误差进行了归一化，降低了个别离群点带来的绝对误差的影响。但是，当真实值有数据等于0时，存在分母0除问题，该公式不可用。
[0139][0140]
(6)对称平均绝对百分比误差(symmetricmeanabsolutepercentageerror)
[0141]
smape(对称平均绝对百分比误差)的范围为[0， ∞)，mape为0％表示完美模型，mape大于100％则表示劣质模型。当真实值有数据等于0，而预测值也等于0时，存在分母0除问题，该公式不可用。
[0142][0143]
由于data1的数据量不足以支持年度效应的提取，因此在实施例中仅考虑周度效应和日度效应。本技术利用prophet算法提取数据集data1的发电量负荷曲线的季节效应，分解出周度和日度的负荷曲线，其结果如图3所示，其中为了清晰地可视化结果，仅显示了前10000个时间步长的数据。(从上至下)第一幅图为负荷的实际值，第二幅图为三个分解结果的合成图，第三幅图到第五幅图为负荷的三个分解结果，分别为负荷的周度季节性、日度季节性和趋势项，由图3可知，发电量负荷有明显的周度和日度效应，模型的分解效果也非常理想。
[0144]
本实施例仅生成发电量负荷曲线，在预测过程中，基学习器采用的算法包括knn、catb、ridge、lasso、mlp、dt、et、xgb、lgbm、rf、adaboost、gdbt和bagging，元学习器采用了lr算法，自回归采用滞后五阶，基学习器和元学习器的所用样本按照7：3划分，元学习器的训练集和测试集按照7：3划分。所有学习器在训练集上的表现如下表所示，其中，lr为元学习器的算法，其余均为基学习器的算法。
[0145]
基学习器knncatbridgelassomlpdtetr2_score98.09％99.0499.12％99.05％98.97％97.97％97.94％基学习器xgblgbmrfadaboostgdbtbagginglrr2_score98.95％99.00％98.91％98.48％98.81％98.83％96.31％
[0146]
上表说明每一个学习器的预测性能都非常好，其r2_score都高于95％。值得注意的是，基学习器单点预测的准确度明显优于整个集成学习模型的单点预测的准确度，但是滚动预测的精度明显和稳定性都低于整个集成学习模型滚动预测的精度。以滚动预测100天(9600个时刻)为例，采用上表表现最好的ridge模型、lasso模型、catb模型以及lr模型单独训练进行滚动预测，其预测表现与集成学习的预测表现对比下表所示，由表可知，采用blending集成学习能够提高模型的预测精度和稳定性。
[0147][0148][0149]
根据训练好的blending集成学习模型结合data3的外部输入滚动预测100天(9600个时刻)的基础负荷。最后，再根据时间属性加上季节效应生成负荷曲线，整个过程依照本技术的流程完成，最终的负荷预测结果如图3所示。由图可知，实际值和预测值的幅值、波形非常接近，说明整个模型对于长期预测非常有效。
[0150]
最后是整个模型预测性能，其结果下表所示，由表可知，预测模型的预测效果非常好，其中后面五个相对指标相差不大，是因为加入季节效应之后分母变大导致，从r2_score可以看出模型的预测性能得到了提升。
[0151]
评价指标r2_scorermsemdaemaemapesmape基础负荷91.10％183.59119.17143.744.32％4.26％实际负荷93.66％183.58119.17143.744.36％4.30％
[0152]
为了执行上述方法实施例对应的负荷数据的生成方法，以实现相应的功能和技术效果。参见图5，图5示出了本技术实施例提供的一种负荷数据的生成装置的结构框图。为了便于说明，仅示出了与本实施例相关的部分，本技术实施例提供的负荷数据的生成装置，包括：
[0153]
生成模块501，用于基于目标园区的负荷样本数据和外部环境数据，生成第一数据集；
[0154]
提取模块502，用于利用prophet算法，根据所述第一数据集，提取所述目标园区的负荷周期效应；
[0155]
去除模块503，用于基于所述负荷周期效应，去除所述第一数据集中的负荷周期效应，得到第二数据集；
[0156]
训练模块504，用于利用blending集成学习算法，根据所述第二数据集，通过元学习器和基学习器训练，构建基础负荷生成模型；
[0157]
预测模块505，用于基于所述基础负荷生成模型，结合所述外部环境数据，生成所述目标园区的基础负荷数据，并将所述基础负荷数据与所述负荷周期效应结合，生成所述目标园区的负荷数据。
[0158]
在一些实施例中，所述提取模块502，具体用于：
[0159]
利用所述prophet算法，对所述第一数据集进行拟合，得到所述目标园区的负荷周期效应，所述prophet算法的表达式为：
[0160]
yi(t)＝gi(t) si(t) ∈i(t)；
[0161]
其中，yi(t)为所述第一数据集中第i种负荷样本在t时刻的实际值，gi(t)为第i种负荷样本在t时刻的基础值，si(t)为第i种负荷样本在t时刻的周期效应值，∈i(t)为t时刻的第i种负荷样本与生成数据之间的误差项。
[0162]
在一些实施例中，去除模块503，具体用于：
[0163]
利用预设计算公式，去除所述第一数据集中的负荷周期效应，得到所述第二数据集，所述预设计算公式为：
[0164]di
(t)＝yi(t)-si(t)；
[0165]
其中，di(t)表示所述第二数据集中第i种负荷在t时刻的基础值，yi(t)表示所述第一数据集中第i种负荷样本在t时刻的实际值，si(t)表示第i种负荷样本在t时刻的周期效应值。
[0166]
在一些实施例中，所述训练模块504，具体用于：
[0167]
将所述第二数据集划分为第一数据子集和第二数据子集；
[0168]
基于所述基学习器，对所述第一数据子集进行训练，直至训练结果达到第一预设收敛条件，得到基学习器负荷生成模型；
[0169]
利用所述基学习器负荷生成模型，对所述第二数据子集进行计算，并将计算结果与第二数据子集生成为第三数据子集；
[0170]
基于所述元学习器，对所述第三数据子集进行训练，直至训练结果达到第二预设收敛条件，得到元学习器负荷生成模型；
[0171]
将所述基学习器负荷生成模型和元学习器负荷生成模型整合为所述基础负荷生成模型。
[0172]
在一些实施例中，所述预测模块505，具体用于：
[0173]
以所述目标园区在t时刻的负荷样本数据和外部环境数据作为所述基础负荷生成模型的输入，以使所述基学习器和所述元学习器滚动计算生成所述目标园区在t 1时刻至t n时刻的基础负荷数据；
[0174]
将所述目标园区在t 1时刻至t n时刻的基础负荷数据与对应时刻的所述负荷周期效应合成为所述负荷数据。
[0175]
在一些实施例中，所述装置，还包括：
[0176]
验证模块，用于基于所述负荷样本数据和生成的所述负荷数据，验证所述负荷生成模型的准确性。
[0177]
上述的负荷数据的生成装置可实施上述方法实施例的负荷数据的生成方法。上述
方法实施例中的可选项也适用于本实施例，这里不再详述。本技术实施例的其余内容可参照上述方法实施例的内容，在本实施例中，不再进行赘述。
[0178]
图6为本技术一实施例提供的计算机设备的结构示意图。如图6所示，该实施例的计算机设备6包括：至少一个处理器60(图6中仅示出一个)处理器、存储器61以及存储在所述存储器61中并可在所述至少一个处理器60上运行的计算机程序62，所述处理器60执行所述计算机程序62时实现上述任意方法实施例中的步骤。
[0179]
所述计算机设备6可以是智能手机、平板电脑、桌上型计算机和云端服务器等计算设备。该计算机设备可包括但不仅限于处理器60、存储器61。本领域技术人员可以理解，图6仅仅是计算机设备6的举例，并不构成对计算机设备6的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入输出设备、网络接入设备等。
[0180]
所称处理器60可以是中央处理单元(centralprocessingunit，cpu)，该处理器60还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现成可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0181]
所述存储器61在一些实施例中可以是所述计算机设备6的内部存储单元，例如计算机设备6的硬盘或内存。所述存储器61在另一些实施例中也可以是所述计算机设备6的外部存储设备，例如所述计算机设备6上配备的插接式硬盘，智能存储卡(smartmediacard，smc)，安全数字(securedigital，sd)卡，闪存卡(flashcard)等。进一步地，所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
[0182]
另外，本技术实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述任意方法实施例中的步骤。
[0183]
本技术实施例提供了一种计算机程序产品，当计算机程序产品在计算机设备上运行时，使得计算机设备执行时实现上述各个方法实施例中的步骤。
[0184]
在本技术所提供的几个实施例中，可以理解的是，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意的是，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。
[0185]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等
各种可以存储程序代码的介质。
[0186]
以上所述的具体实施例，对本技术的目的、技术方案和有益效果进行了进一步的详细说明，应当理解，以上所述仅为本技术的具体实施例而已，并不用于限定本技术的保护范围。特别指出，对于本领域技术人员来说，凡在本技术的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于神经网络的在线签名鉴定方法与流程

负荷数据的生成方法、装置、设备及存储介质与流程

相关文献

最热文献