一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于组合策略的换热站负荷预测方法和系统与流程

2022-08-03 00:40:40 来源:中国专利 TAG:


1.本发明涉及供热负荷预测领域,具体涉及一种基于组合策略的换热站负荷预测方法和系统。


背景技术:

2.供热负荷预测是一个对供热负荷过去的信息收集,运用定性和定量的科学分析方法,揭示出其中的客观规律,构建模型对未来发展的趋势做出预测的过程。热负荷预测是集中供热系统的基础性工作,可以为供热系统的运行管理提供有力的数据支持,实现供热系统的供热量与建筑的需热量之间的平衡,从而合理的指导运行管理工作,最终实现按需供热。因此,供热负荷的预测是实现供热系统节能运行的主要途径之一,是供热系统设计、调控,实现供热节能的关键基础环节。
3.供热负荷预测按照预测期限长短,可分为长期、中期、短期三种。短期负荷预测是预测未来0~24h之内供热系统负荷的变化,主要用于保证热源的供热量与热用户需热量相匹配;中期负荷预测的周期为3~7天,目的是为供热系统制定生产、维修、运输及财务计划提供依据;长期负荷预测一般指年度负荷预测,主要为供热系统的优化及供热规划提供依据。
4.由于供热系统的复杂性及建筑物和系统的热惯性,力图通过物理模型来建立供热负荷预测的数学模型是很困难的,所以目前大多数的预测方法都是建立在对历史数据统计分析的基础上,不同之处只是数据处理方式及所适用的系统。目前通常使用的方法包括时间序列预测法、神经网络预测法、灰色系统预测法,各种方法都各自有优势和劣势。时间序列预测法按照一定的时间间隔对热负荷数据进行记录,建立供热负荷预测模型;神经网络预测法主要通过神经网络模型对供热负荷进行预测;灰色系统预测法根据供热信息不完全、影响供热负荷的各因素之间映射关系不确定的特征建立预测模型。然而目前多使用单一预测方法,泛化能力较差。


技术实现要素:

5.为了解决现有技术中供热负荷预测方法存在的泛化能力问题,本发明提供一种基于组合策略的换热站负荷预测方法和系统,提高了单一神经网络的泛化能力。
6.本发明为解决其技术问题所采用的技术方案是:一种基于组合策略的换热站负荷预测方法,包括如下步骤:
7.s1:获取换热站运行数据和室内温度数据并对获取的数据进行处理;
8.s2:将换热站运行数据和室内温度数据对齐,并进行归一化处理;
9.s3:获取气象预报数据,并对获取的数据进行归一化处理;
10.s4:使用处理后的换热站运行数据、室内温度数据、气象预报数据作为训练数据分别对径向基函数神经网络rbf、支持向量回归svr和长短期记忆神经网络lstm三种算法模型进行训练;
11.s5:分别使用径向基函数神经网络rbf、支持向量回归svr和长短期记忆神经网络lstm三种算法模型对供热负荷进行预测,获得三组预测数据;
12.s6:对上述三组预测数据进行加权组合,形成最终供热负荷预测数据。
13.作为本发明的进一步实施方案,
14.所述换热站运行数据的获取及处理包括:首先从生产调度系统获取换热站过去24小时内每小时的实际运行数据,实际运行数据包括实际气象数据和实际热负荷数据;然后剔除实际气象数据存在缺失值的数据,补充实际热负荷数据存在缺失值的数据;接着对换热站运行数据进行异常检测,并将检测出的异常值赋值为空值;最后使用相邻数据点的实际值来填充缺失值和空值。
15.作为本发明的进一步实施方案,
16.所述室内温度数据的获取及处理包括:从室温采集系统获取到零散的室内温度数据,检测零散的室内温度数据中的异常值,并将其剔除掉;然后将数据转换为一个小时一组的格式。
17.作为本发明的进一步实施方案,
18.所述的三种算法模型,采用均方误差mse作为损失函数;在算法模型训练时,设定训练周期次数和损失函数阈值,当经过设定训练周期次数后损失函数的下降幅度小于设定阈值时,训练终止;
19.算法模型在进行训练时,首先加载已训练模型;然后装载过去24小时的数据并继续进行训练;训练结束后,保存训练模型用于下次训练使用。
20.作为本发明的进一步实施方案,
21.使用三种算法模型对供热负荷进行预测,具体为:输入变量为影响供热负荷的各种因素,输出变量为待预测时刻的供热负荷;影响供热负荷的各种因素包括气象预报数据、实际热负荷数据和室内温度数据,气象预报数据包括天气状况e、室外温度to、太阳辐射强度s、湿度h、风向d、风速w,实际热负荷数据包括上一时刻实际热负荷q
t-1
和上上时刻的实际热负荷q
t-2
;室内温度数据为实际室内平均温度ti;
22.采用逐步预测的方式,上时刻预测的输出变量作为下时刻预测的输入变量;预测t时刻的供热负荷q
t
需要上一时刻实际热负荷q
t-1
和上上时刻的实际热负荷q
t-2
作为输入变量;假定过去24小时最后时刻为t,则预测目标时刻是t 1,t 2,

,t 24;t 1时刻需要输入变量q
t
和q
t-1
,从过去24小时实际运行数据中获取;t 2时刻需要输入变量q
t 1
和q
t
,q
t
从实际运行数据中获取,q
t 1
取上次预测的结果;从t 3时刻开始,需要的输入变量q
t 2
和q
t 1
均从上次预测结果获取。
23.作为本发明的进一步实施方案,
24.步骤s6具体为:三种算法模型经过逐步预测获得的三组供热负荷预测数据,确定每组数据的加权系数,通过加权平均法最终获得一组组合供热负荷预测数据。
25.作为本发明的进一步实施方案,
26.所述加权系数的确定采用熵值法,以过去24小时数据的实际值和预测值进行计算;设第i种单项预测方法在过去24小时第t时刻的预测值为t时刻的实际值为x
t
;第i种预测方法第t时刻的预测相对误差记为:
[0027][0028]
用熵值法确定组合预测加权系数的步骤如下:
[0029]

将各种单项预测方法预测相对误差单位化,即计算第i种单项预测方法第t时刻的预测相对误差的比重p
it

[0030][0031]

计算第i种单项预测方法的预测相对误差的熵值hi:
[0032][0033]

计算第i种单项预测方法的预测相对误差序列的变异程度系数di:
[0034]di
=1-hi,i=1,2,3;
[0035]

计算各种预测方法的加权系数fi:
[0036][0037]

计算组合预测值
[0038]
设为三种算法模型在未来24小时每个时刻的预测值,则t时刻的组合预测值为:
[0039][0040]
作为本发明的进一步实施方案,该方法所使用的系统,由气象预报系统、生产调度系统、室温采集系统、供热负荷预测系统组成;所述气象预报系统提供气象预报数据;生产调度系统提供实时换热站运行数据并使用负荷预测的结果进行生产调度;室温采集系统提供实时室内温度数据;供热负荷预测系统对获取到的数据进行处理,对算法模型进行训练,并利用算法模型进行预测,最后将预测结果反馈给生产调度系统。
[0041]
本发明的有益效果包括:人工神经网络模型都存在一定的泛化能力问题,本发明使用三种算法模型进行预测,并对三组预测结果进行加权平均,提高了单一神经网络的泛化能力。
附图说明
[0042]
图1是本发明系统构成示意图;
[0043]
图2是本发明整体流程示意图;
[0044]
图3是本发明换热站运行数据处理流程图;
[0045]
图4是本发明室内温度数据处理流程图;
[0046]
图5是本发明径向基函数神经网络rbf模型原理图;
[0047]
图6是本发明径向基函数神经网络rbf训练过程示意图。
具体实施方式
[0048]
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]
下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0050]
实施例1
[0051]
集中供热系统的主要调控单元是换热站,本实施例针对换热站的调控,基于从生产调度系统、室温采集系统获取的实际运行数据和气象预报系统提供的气象预报数据,利用三种人工智能算法,提出了一种基于组合策略的换热站负荷预测方法,包括如下步骤:
[0052]
(1)输入变量和输出变量的确定
[0053]
基于供热系统负荷的相关因素,输入变量为影响供热负荷的各种因素,输出变量为待预测时刻的供热负荷。
[0054]
影响供热负荷的各种因素包括气象预报数据、实际热负荷数据和室内温度数据。气象预报数据包括天气状况e、室外温度to、太阳辐射强度s、湿度h、风向d、风速w,t-1和t-2时刻的实际热负荷影响着t时刻的热负荷,因此实际热负荷数据包括上一时刻实际热负荷q
t-1
和上上时刻的实际热负荷q
t-2
;室内温度数据为实际室内平均温度ti;热负荷预测模型的结构可用下式表达:
[0055][0056]
其中,为预测t时刻的热负荷,下标t指某个具体时刻。
[0057]
具体输入输出变量及其来源参见表1。
[0058]
表1 输入输出变量及其来源表
[0059][0060]
(2)换热站运行数据的获取和处理
[0061]
从生产调度系统获取换热站过去24小时每小时的实际运行数据,一个小时一组数据,包括实际气象数据和实际热负荷数据。实际热负荷数据指本小时内的热负荷累积值,包括当前时刻的实际热负荷q
t
和上一时刻的实际热负荷q
t-1
、上上时刻的实际热负荷q
t-2
。对于q
t-1
和q
t-2
,如果是供热季初始时间,没有前期数据,则取上个供热季的数据;如果没有上个供热季的数据,则赋值为空。
[0062]
获取到的数据可能存在两种异常情况,一种是缺失值,即部分属性为空值;第二种是异常值,即由于设备故障等原因产生的随机错误或误差。如果实际气象数据存在缺失值,则整组数据删除;如果实际热负荷存在缺失值,则需要进行补充处理。对于异常值的检测,采用两种方式进行检测,并将检测出的异常值赋值为空值。首先采用基于统计学原理的3sigma准则,来判断和剔除含有粗大误差的异常值;然后采用基于人工智能的离群点检测方法,来剔除异常值。经过上述处理后,缺失值和异常值都归结到了缺失值,最后使用相邻数据点的实际值来进行填充。
[0063]
在进行异常值检测和缺失值填充时,只检测过去24小时的数据,由于数据量较小,片面性比较高。因此,需要提取前周期的数据作为检测背景,最大提取周期为一个供热季;如果本供热季数据量不足,则提取上供热季的数据进行补充。
[0064]
(3)室内温度数据的获取和处理
[0065]
从室温采集系统获取的过去24小时的室温数据是零散的、非标准化的,第一点是一个换热站对应多个室温采集设备,第二点是室温数据在时间维度上每小时采集多次。基于上述两点原因,需要将室内温度数据转换为每个换热站每小时一组的数据格式。
[0066]
首先采用基于统计学原理的3sigma准则检测出异常值,并将其剔除掉,使室温数据满足正态分布。然后,采用算术平均方法,将零散数据转换为每换热站每小时一组。
[0067]
在上述(2)和(3)的实施方案中:
[0068]
3sigma异常检测方法:
[0069]
在对换热站运行数据和室内温度数据进行异常检测时,首先采用基于统计学原理的3sigma准则来判断和剔除含有粗大误差的异常值。3sigma准则也称为基于正态分布的异常值检测。假定某数据集x{x1,x2,

,xn}的平均值为μ,标准差为σ,公式为:
[0070][0071][0072][0073]
该数据集具有以下特点:
[0074]
数据值落在(μ-σ,μ σ)范围内的概率是68.27%;
[0075]
数据值落在(μ-2σ,μ 2σ)范围内的概率是95.44%;
[0076]
数据值落在(μ-3σ,μ 3σ)范围内的概率是99.73%。
[0077]
即落在(μ-3σ,μ 3σ)范围以外的概率为0.27%。基于3sigma准则的异常值检测原理是,如果某数据的值落在(μ-3σ,μ 3σ)以外,它就是异常值。
[0078]
离群点异常检测方法:
[0079]
对换热站运行数据的异常检测,第二步是采用基于人工智能的离群点检测方法。离群点是一个数据对象,与其他数据分布有较为显著的不同。有时也称非离群点为“正常数据”,离群点为“异常数据”。基于人工智能的离群点检测方法有基于邻近性的方法、基于密度的方法、基于聚类的方法。本发明采用基于方差的鲁棒性的异常检测模型,该模型假设正常样本都服从高斯分布,其余为异常数据。
[0080]
相邻数据填充方法
[0081]
在对换热站运行数据进行缺失值填充和异常值替换时,使用了相邻数据填充方法。换热站运行数据的缺失值指实际供热负荷的缺失,实际供热负荷同实际气象数据共同组成了多维数据,要填充供热负荷数据的缺失值,需要借助欧几里德距离寻找其他维度数据的最近邻,取其供热负荷数据填充缺失值。
[0082]
设有两个时刻的运行数据x
t
={e
t
,to
t
,s
t
,h
t
,d
t
,w
t
}和x
p
={e
p
,to
p
,s
p
,h
p
,d
p
,w
p
},两个时刻数据之间的欧几里德距离为:
[0083]
d(t,p)2=(e
t-e
p
)2 (to
t-to
p
)2 (s
t-s
p
)2 (h
t-h
p
)2 (d
t-d
p
)2 (w
t-w
p
)2[0084][0085]
(4)数据的组合准备
[0086]
将处理后的换热站运行数据和室内温度数据按一个换热站一小时一组的方式对齐,本时刻的实际热负荷作为算法模型的输出变量,其余作为输入变量。为保证数据范围一致,并加快求解速度,需要将输入变量采用最小-最大值规范化方法对每个属性进行归一化处理。
[0087]
在上述实施方案中,最小-最大值规范化方法:
[0088]
换热站运行数据和室内温度数据组合后,要采用最小-最大值规范化方法进行归一化处理。本发明中,归一化的结果是将所有数据落到[0,1]区间。下面以一个属性太阳辐射强度s为例,介绍该方法的原理。假设有一组数据s={s1,s2,

,sn},其中mins和maxs分别表示其最小值和最大值,则最小-最大值规范化计算公式为:
[0089][0090]
其中,si表示原始属性值,s
′i表示规范化后的属性值。
[0091]
(5)算法模型的建立和训练
[0092]
本发明采用三种算法模型进行负荷预测,分别为:径向基函数神经网络rbf、支持向量回归svr和长短期记忆神经网络lstm,采用均方误差mse作为损失函数。在模型训练时,设定训练周期次数和损失函数阈值,当经过设定训练周期次数后损失函数的下降幅度小于设定阈值时,训练可以终止。
[0093]
为降低训练时长,优化运行效率,算法模型在进行训练时,首先加载已训练模型;然后装载过去24小时的数据并继续进行训练;训练结束后,保存训练模型为下次训练使用。如果是算法模型第一次训练,只过去24小时的数据量无法达到训练效果,需要加载前期更多数据进行训练,加载数据周期最多为一个供热季。
[0094]
(6)使用算法模型进行负荷预测
[0095]
采用算法模型进行预测的目的是预测未来24小时每小时的供热负荷,输入变量包括气象预报、室温设定值和上两个时刻的实际热负荷。
[0096]
未来24小时每小时的气象预报数据从气象预报系统获取,同样需要采用最小-最大值规范化方法对每个属性进行归一化处理。
[0097]
室内平均温度是评价供热效果的变量,在预测时使用预设值的方式,一般设置为18℃或20℃。
[0098]
本发明采用逐步预测的方式,上时刻预测的输出变量作为下时刻预测的输入变
量。
[0099]
预测t时刻的供热负荷q
t
需要上一时刻实际热负荷q
t-1
和上上时刻的实际热负荷q
t-2
作为输入变量;假定过去24小时最后时刻为t,则预测目标时刻是t 1,t 2,

,t 24;t 1时刻需要输入变量q
t
和q
t-1
,从过去24小时实际运行数据中获取;t 2时刻需要输入变量q
t 1
和q
t
,q
t
从实际运行数据中获取,q
t 1
取上次预测的结果;从t 3时刻开始,需要的输入变量q
t 2
和q
t 1
均从上次预测结果获取。
[0100]
svr和lstm的计算过程与判定方法同rbf类似,下面以rbf为例介绍其计算过程和判定方法。
[0101]

径向基函数神经网络rbf
[0102]
rbf神经网络是一种三层神经网络,包括输入层、隐藏层、输出层。其模型如图5所示。rbf神经网络的基本思想是:从输入层到隐藏层的变换是非线性的,用径向基函数(rbf,最常使用高斯核函数)作为隐藏层单元的“基”构成隐藏层空间,将输入矢量直接映射到隐藏层空间。隐藏层空间到输出层空间的映射是线性的,即网络的输出是隐藏层单元输出的线性加权和。其中,隐藏层的作用是把向量从低维度的n映射到高维度的p,这样低维度线性不可分的情况到高维度就可以变得线性可分了。网络由输入到输出的映射是非线性的,而网络输出对可调参数而言却又是线性的。网络的权就可由线性方程组直接解出,从而大大加快学习速度并避免局部极小问题。
[0103]
rbf神经网络的训练过程如图6所示。第一步加载已训练模型;第二步确定参数,包括输入变量、输出变量、初始化隐藏层至输出层的连接权值、初始化隐藏层各神经元的中心参数和宽度向量;第三步计算隐藏层的输出值;第四步计算输出层的输出值;第五步判断经过设定的训练周期后,均方误差mse下降幅度是否小于等于设定阈值;如果小于等于设定阈值则训练终止;否则调整权重参数,再重复执行第三步。
[0104]
均方误差mse是求解回归问题中最常用的损失函数,其计算公式为:
[0105][0106]
其中,q为实际热负荷,为预测热负荷,n为训练样本数量。
[0107]

支持向量回归svr
[0108]
svr全称是support vector regression,是svm(支持向量机support vector machine)对回归问题的一种运用。该模型的原理是在向量空间里用线性函数去拟合样本。该模型以所有样本实际位置到该线性函数的综合距离为损失,通过最小化损失来求取线性函数的参数。svr在线性函数两侧制造了一个“间隔带”,对于所有落入到间隔带内的样本,都不计算损失;只有间隔带之外的,才计入损失函数,之后再通过最小化间隔带的宽度与总损失来最优化模型。
[0109]

长短期记忆神经网络lstm
[0110]
lstm是递归神经网络的一种,特点是可以传递当前时刻处理的信息给下一时刻使用,特别适合于时序数据处理,可以很好地解决长时依赖问题。lstm主要包含了遗忘门、输入门、输出门三个门与一个记忆单元。遗忘门决定什么信息可以传递给下一时刻;输入门确定什么样的新信息被存放在记忆单元中;记忆单元丢弃确定需要丢弃的信息,生成新的信
息;输出门确定输出什么值。
[0111]
(7)组合预测结果的确定
[0112]
本发明对最终的预测结果,采用组合预测方法。分别采用三种算法模型,经过多步预测,获得三组未来24小时的供热负荷。然后采用组合预测方法,确定每组数据的加权系数,通过加权平均法最终获得一组未来24小时每小时的热负荷。
[0113]
设f={f1,f2,f3}为三种方法的加权系数,为三种方法在t时刻的预测值,则t时刻的组合预测值为:
[0114][0115]
组合预测是将若干种预测方法赋予不同的权重,从而形成综合的组合预测模型。理论研究和实际应用表明,组合预测模型比单个预测模型具有更高的预测精度,能增强预测的稳定性,具有较高的适应未来预测环境变化的能力。
[0116]
组合预测的核心问题是如何求出加权平均系数,使得组合预测模型更加有效地提升预测精度。本发明中加权系数的确定采用熵值法,以过去24小时数据的实际值和预测值进行计算。熵值法是从信息论的观点出发,根据各单项预测方法预测误差序列的变异程度,利用信息熵的概念,计算出组合预测加权平均系数。
[0117]
设第i种单项预测方法在过去24小时第t时刻的预测值为t时刻的实际值为x
t
;第i种预测方法第t时刻的预测相对误差记为:
[0118][0119]
用熵值法确定组合预测加权系数的步骤如下:
[0120]

将各种单项预测方法预测相对误差单位化,即计算第i种单项预测方法第t时刻的预测相对误差的比重p
it

[0121][0122]

计算第i种单项预测方法的预测相对误差的熵值hi:
[0123][0124]

计算第i种单项预测方法的预测相对误差序列的变异程度系数di:
[0125]di
=1-hi,i=1,2,3;
[0126]

计算各种预测方法的加权系数fi:
[0127][0128]

计算组合预测值
[0129]
设为三种算法模型在未来24小时每个时刻的预测值,则t时刻的组合预测值为:
[0130][0131]
该方法所使用的系统,由气象预报系统、生产调度系统、室温采集系统、供热负荷预测系统组成;所述气象预报系统提供气象预报数据;生产调度系统提供实时换热站运行数据并使用负荷预测的结果进行生产调度;室温采集系统提供实时室内温度数据;供热负荷预测系统对获取到的数据进行处理,对算法模型进行训练,并利用算法模型进行预测,最后将预测结果反馈给生产调度系统。
[0132]
上述实施方案中,产生有益效果包括:
[0133]
(1)对换热站运行数据的异常检测,首先采用基于统计学原理的3sigma准则,然后采用基于人工智能的离群点检测方法,规避了单一检测方法概率低、规则片面的问题。
[0134]
(2)算法模型每次训练时,加载历史训练结果,装载本次训练数据进行训练,并保存训练结果的方式,保证了算法模型持续改进,减少了训练时间,优化了训练效果。
[0135]
(3)人工神经网络模型都存在一定的泛化能力问题,本发明使用三种算法模型进行预测,并对三组预测结果进行加权平均,提高了单一神经网络的泛化能力。
[0136]
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献