一种耦合Copula与LSTM的工企用能负荷预测方法与流程

2022-02-22 10:23:18 来源：中国专利 TAG：

一种耦合copula与lstm的工企用能负荷预测方法
技术领域
1.本发明涉及一种用能负荷预测技术，尤其是涉及一种耦合copula与lstm的工企用能负荷预测方法。

背景技术：

2.随着能源系统和能源技术的更新换代，综合能源系统和多能互补分布式能源系统已经得到了广泛的发展和应用，与此同时，能源技术也在逐步的智能化与多元化，供需体系也逐渐由需求侧主导供给侧，形成按需供能的模式，挖掘需求侧的用能特性，了解终端用户的用能行为，灵活的调配需求侧资源是解决供需平衡问题和提升系统能效的有效途径，特别是工业企业具有种类多、能耗大、用能特性明显等特点，且工业企业在集中供热过程中存在热负荷供需平衡问题，精准高效的热负荷动态预测技术是解决工业企业集中供热问题的前提和基础，可有效地支撑能源系统安全稳定运行和相关能源管理政策的制定。
3.各行各业用到的预测方式有很多种，但大部分都有各自的局限性和使用条件限制性，大多数的预测方法都是建立在对历史数据的分析基础上，不同之处在于对数据的处理方式和所适用的系统，传统的热负荷预测方式基本可以分为时间序列法和回归分析法，时间序列法需要大量的历史数据作为基础，气象因素对负荷预测的准确性影响较大，一般适用于短期的负荷预测；回归分析法从系统各种现象之间的相互关系出发，通过变动趋势推算出预测对象的未来状态数量，要以大量的历史数据作为参考；由于缺乏大量的历史数据支撑，传统的预测方法发展成为灰色系统预测，灰色预测通过灰色模块建模，利用关联分析替代回归分析，适用于小样本数据分析，但原始数据的离散程度会影响预测效果，适用于中长期预测；现在的负荷因子预测方法通常与负荷模拟软件相结合，通过构建用户模型，确定分配逐时、逐月的分配因子，对用能负荷进行预测；随着神经网络预测方法被引入到负荷预测领域，无需给出输入与输出之间的解析关系，通过建立输入与输出的非线性映射来进行用能负荷预测，逐渐发展成为bp神经网络、rbf神经网络等模型。单一的预测方法有其优点，但无法避免存在某一方面的缺陷和不足，适用条件也会影响负荷预测的精度。

技术实现要素：

4.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种耦合copula与lstm的工企用能负荷预测方法，精准性高，稳定性强。
5.本发明的目的可以通过以下技术方案来实现：
6.一种耦合copula与lstm的工企用能负荷预测方法，包括：
7.采集待预测工业企业的用能负荷历史数据和选定要素历史数据，并输入训练好的lstm深度神经网络模型，获得待预测工业企业的预测用能负荷；
8.其中，所述的选定要素的选定过程包括以下步骤：
9.1)采集多种类型的工业企业的用能负荷历史数据以及对应时间点的若干种待定要素历史数据，构成样本数据集；
10.2)对样本数据集进行预处理；
11.3)利用k-means算法对用能负荷历史数据进行聚类，获得若干个聚类；
12.4)通过copula算法对聚类与待定要素之间的非线性相关性进行分析，从所有待定要素中选出选定要素；
13.本发明首先利用k-means算法对各种类型工业企业的用能负荷历史数据进行聚类，厘清工业企业的用能特性，并通过copula算法对聚类与待定要素之间的非线性相关性进行分析，优选出最具影响负荷预测的要素，作为具有记忆功能的lstm网络的输入，实现工业企业用能负荷预测，能有效地对工业企业用能负荷进行精确化预测。
14.进一步地，所述的lstm深度神经网络模型的训练过程包括：
15.采集多种类型的工业企业的用能负荷历史数据以及对应时间点的选定要素历史数据，构成训练集；
16.利用训练集训练lstm深度神经网络模型。
17.进一步地，所述的步骤3)包括：
18.利用k-means算法对用能负荷历史数据进行全年用能逐时聚类、全年用能波动聚类和全年用能典型日聚类。
19.进一步地，通过相似度公式确定的k-means算法的最佳聚类数；
20.所述的相似度公式计算公式为：
[0021][0022]kmin
≤k≤k
max
[0023]
其中，k为聚类数，ch(k)为类之间的相似度，k
min
为设定值，n为用能负荷历史数据的数量，trb(k)为类之内离差矩阵的迹，trw(k)为类与类之间离差矩阵的迹；
[0024]
当ch(k)取值最大时，对应的聚类数为最佳聚类数。
[0025]
进一步地，所述的步骤4)包括：
[0026]
计算每个聚类与待定要素之间相关性参数，根据相关性参数的绝对值大小，从大到小选出若干个待定要素，作为选定要素；
[0027]
所述的相关性参数ρ的计算公式为：
[0028][0029][0030]
其中，x和y分别表示聚类和待定要素，n为样本数据集的总数量，f(x)和e(y)分别为聚类和待定要素的边缘分布函数，i
[]
表示示性函数，条件成立时，i
[]
＝1，反之则为0。
[0031]
进一步地，所述的步骤2)包括：
[0032]
对用能负荷历史数据进行去噪；
[0033]
对用能负荷历史数据和待定要素历史数据进行归一化处理；
[0034]
通过去噪减少数据噪点对lstm深度神经网络模型的训练过程的影响，通过归一化处理，减少计算量。
[0035]
进一步地，所述的去噪过程包括：
[0036]
从用能负荷历史数据中查找数据噪点，通过相似性计算公式对数据噪点进行数据修复。
[0037]
进一步地，判断用能负荷数据点是否满足判断不等式，若是则判定该用能负荷数据点为数据噪点，否则判定该用能负荷数据点不是数据噪点；
[0038]
所述的判断不等式为：
[0039][0040][0041][0042]
其中，ε为设定阈值，x
n,i
为第n天第i个用能负荷数据点。
[0043]
进一步地，所述的相似性计算公式为：
[0044][0045]
其中，α β γ＝1，n为样本数据集的总数量，为第n天第i个用能负荷数据点的修正值，x
n,i-1
和x
n,i 1
分别为x
n,i
最近的两个用能负荷数据点，为x
n,i
附近的四个用能负荷数据点。
[0046]
进一步地，所述的归一化处理过程包括：
[0047]
设定样本数据集为矩阵x，x的表达式为：
[0048][0049]
其中，u为样本数据集总数量，v为每组样本数据的数量；
[0050]
通过归一化计算公式对矩阵x中每列数据进行归一化处理，获得归一化矩阵xr，所述的xr的表达式为：
[0051][0052]
所述的归一化计算公式为：
[0053][0054]
与现有技术相比，本发明具有以如下有益效果：
[0055]
本发明工企用能负荷预测方法首先利用k-means算法对各种类型工业企业的用能负荷历史数据进行聚类，厘清工业企业的用能特性，并通过copula算法对聚类与待定要素之间的非线性相关性进行分析，优选出最具影响负荷预测的要素，作为具有记忆功能的lstm网络的输入佐证，增加lstm神经元对信息权重抓取的能力，实现工业企业用能负荷预测，能有效地对工业企业用能负荷进行精确化预测，提高用能负荷预测的精准性和稳定性。
附图说明
[0056]
图1为选定要素的选定流程示意图；
[0057]
图2为第一预测模型的预测值和真实值的对比图；
[0058]
图3为第二预测模型的预测值和真实值的对比图；
[0059]
图4为第一预测模型和第二预测模型的预测结果的mape对比图；
[0060]
图5为lstm深度神经网络模型的结构示意图。
具体实施方式
[0061]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。
[0062]
一种耦合copula与lstm的工企用能负荷预测方法，包括：
[0063]
采集待预测工业企业的用能负荷历史数据和选定要素历史数据，并输入训练好的lstm深度神经网络模型，获得待预测工业企业的预测用能负荷；
[0064]
其中，如图1，选定要素的选定过程包括以下步骤：
[0065]
1)采集多种类型的工业企业的用能负荷历史数据以及对应时间点的若干种待定要素历史数据，构成样本数据集；
[0066]
2)对样本数据集进行预处理；
[0067]
3)利用k-means算法对用能负荷历史数据进行聚类，获得若干个聚类；
[0068]
4)通过copula算法对聚类与待定要素之间的非线性相关性进行分析，从所有待定要素中选出选定要素。
[0069]
本实施例中，用能负荷为积算热量，待定要素包括各类工业企业的年耗气量、年运行小时、最大流量、平均流量、温度、压力和密度，采集多种类型的工业企业的全年积算热量历史数据以及对应时间点的待定要素历史数据，构成样本数据集，全年积算热量的时间分辨率为1小时。
[0070]
利用本实施例提出的工企用能负荷预测方法可获得工业企业全年积算热量的预测数据。
[0071]
步骤2)包括：
[0072]
对用能负荷历史数据进行去噪；
[0073]
对用能负荷历史数据和待定要素历史数据进行归一化处理；
[0074]
通过去噪减少数据噪点对lstm深度神经网络模型的训练过程的影响，通过归一化处理，减少计算量。
[0075]
去噪过程包括：
[0076]
从用能负荷历史数据中查找数据噪点，通过相似性计算公式对数据噪点进行数据修复。
[0077]
判断用能负荷数据点是否满足判断不等式，若是则判定该用能负荷数据点为数据噪点，否则判定该用能负荷数据点不是数据噪点；
[0078]
判断不等式为：
[0079][0080][0081][0082]
其中，ε为设定阈值，x
n,i
为第n天第i个用能负荷数据点，本实施例中，ε取1.2。
[0083]
相似性计算公式为：
[0084][0085]
其中，α β γ＝1，n为样本数据集的总数量，为第n天第i个用能负荷数据点的修正值，x
n,i-1
和x
n,i 1
分别为x
n,i
最近的两个用能负荷数据点，为x
n,i
附近的四个用能负荷数据点。
[0086]
归一化处理过程包括：
[0087]
设定样本数据集为矩阵x，x的表达式为：
[0088][0089]
其中，u为样本数据集总数量，v为每组样本数据的数量；
[0090]
通过归一化计算公式对矩阵x中每列数据进行归一化处理，获得无量纲化的归一化矩阵xr，xr的表达式为：
[0091][0092]
归一化计算公式为：
[0093][0094]
步骤3)包括：
[0095]
利用k-means算法对用能负荷历史数据进行全年用能逐时聚类、全年用能波动聚
类和全年用能典型日聚类。
[0096]
通过相似度公式确定的k-means算法的最佳聚类数；
[0097]
相似度公式计算公式为：
[0098][0099]kmin
≤k≤k
max
[0100]
其中，k为聚类数，ch(k)为类之间的相似度，k
min
＝2，n为用能负荷历史数据的数量，trb(k)为类之内离差矩阵的迹，trw(k)为类与类之间离差矩阵的迹；
[0101]
当ch(k)取值最大时，对应的聚类数为最佳聚类数。
[0102]
步骤4)包括：
[0103]
计算每个聚类与待定要素之间相关性参数，根据相关性参数的绝对值大小，从大到小选出若干个待定要素，作为选定要素；
[0104]
相关性参数ρ的计算公式为：
[0105][0106][0107]
其中，x和y分别表示聚类和待定要素，n为样本数据集的总数量，f(x)和e(y)分别为聚类和待定要素的边缘分布函数，i
[]
表示示性函数，条件成立时，i
[]
＝1，反之则为0；
[0108]
ρ＜0表式聚类和待定要素之间呈现负相关，ρ＞0表式聚类和待定要素之间呈现正相关，ρ＝0表示表式聚类和待定要素之间的相关性待定。
[0109]
lstm深度神经网络模型的结构如图5所示，lstm深度神经网络模型的表达式为：
[0110]it
＝s
·
(w
xi
x
t
w
hiht-1
w
cict-1
σi)
[0111]ft
＝s
·
(w
xf
x
t
w
hfht-1
w
cfct-1
σh)
[0112]ot
＝s
·
(w
xo
x
t
w
hoht-1
w
coct-1
σo)
[0113][0114]ht
＝t
·
(c
t
)o
t
[0115]
其中，i
t
表示输入门，f
t
表示遗忘门，o
t
表示输入门，u
t
表示记忆单元，h
t
表示最终输出，s
·
()和t
·
()表示激活函数，分别采用非线性sigmoid函数和tanh函数；w
xi
、w
xf
、w
xo
、w
xc
分别连接输入信息o
t
的权值矩阵，w
hi
、w
hf
、w
ho
和w
hc
分别为连接神经元激活函数输出o
t
和对角矩阵；σi、σh、σo和σc分别为输入门、遗忘门、输出门以及记忆单元的偏置；u
tit
为添加到新单元状态c
t
的待选值，c
t-1ft
是将前置信息c
t-1
进行筛选遗忘；u
tit
确定前置信息保留状态。简而言之，lstm网格在训练学习时，具有监督特性，通过特殊的门结构判断、决定输入各时步长的数据是否具有相关性，从而决定是否被储存、传递至下个神经环节。
[0116]
lstm深度神经网络模型的训练过程包括：
[0117]
采集多种类型的工业企业的用能负荷历史数据以及对应时间点的选定要素历史数据，并划分成训练集、验证集和测试集；
[0118]
利用训练集，在深度学习框架下对lstm深度学习网络模型进行训练，保存其训练的权值信息，在训练网络模型时设定最大的训练次数为5000次，采用学习率设为0.005，minibatchsize设置为130，maxepochs设置为180，损失函数为mse，隐含层激活函数默认为rule函数，并采用adam求解器。采用两层lstm输出结构，且层间输出通过return_sequences修改为true，达到3d数据输出。
[0119]
加载训练好的lstm深度神经网络模型，通过验证集验证训练模型，在满足模型泛化能力的情况下，对测试集进行用能负荷的预测模拟，并得到工业企业全年积算热量的预测数据，在模拟的过程中，不断地对修订参数进行优化，直到预测误差最小，得到最终的用能负荷预测数据；
[0120]
采用平均绝对值误差mape对全年积算负荷的预测结果进行评价，mape的计算公式为：
[0121][0122]
其中，n表示样本的数目，m(x)表示样本的平均值，xi表示第i个样本，平均绝对误差由于离差被绝对值化，不会出现正负相抵消的情况，因为平均绝对误差能更好地反映预测误差的实际情况。
[0123]
本实施例以用能负荷历史数据和选定要素历史数据作为训练集，训练lstm深度神经网络模型，获得第一预测模型，第一预测模型的预测值和真实值对比结果如图2所示，仅以用能负荷历史数据为训练集，训练lstm深度神经网络模型后，获得第二预测模型，第二预测模型的预测值和真实值对比结果如图3所示，lstm模型进行训练并在测试集中工业企业实际积算热量进行超短期一小时验证分析，图4为第一预测模型和第二预测模型的预测结果的mape对比图，总体表现出预测平均误差分别为5.57％和6.08％，结果表明当以能负荷历史数据和选定要素历史数据作为训练集时，模型拥有较为精确的预测能力，证明当增加选定要素作为预测输入佐证时，增加lstm神经元对信息权重抓取的能力。
[0124]
本实施例提出了一种耦合copula与lstm的工企用能负荷预测方法，首先利用k-means算法对各种类型工业企业的用能负荷历史数据进行聚类，厘清工业企业的用能特性，并通过copula算法对聚类与待定要素之间的非线性相关性进行分析，优选出最具影响负荷预测的要素，作为具有记忆功能的lstm网络的输入，实现工业企业用能负荷预测，能有效地对工业企业用能负荷进行精确化预测。
[0125]
以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：固态硬盘的映射表恢复方法、装置、计算机设备及存储介质与流程

一种耦合Copula与LSTM的工企用能负荷预测方法与流程

相关文献

最热文献