一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于宽度学习和回归模型的蒸汽量预测方法及系统与流程

2022-05-18 11:43:28 来源:中国专利 TAG:


1.本发明涉及火力发电技术领域,特别是涉及一种基于宽度学习和回归模型的蒸汽量预测方法及系统。


背景技术:

2.火力发电过程是原料焚烧加热水产生水蒸汽,蒸汽推动汽轮机转动,汽轮机带动发电机旋转,产生电能。蒸汽量的精准测量,对于提升焚烧效率、提高汽轮机机组的经济稳定运行具有重要的意义。影响蒸汽量的因素很多,这些因素可分为外部因素和内部因素,外部因素包括燃料特性、环境温度、设备结构特性等,内部因素则包括炉膛温度、炉膛压力、一二次给风量、锅炉给水水量等。外部因素是固定的,可以通过不断调整内部因素来提高燃烧效率从而产生稳定的蒸汽量。
3.目前已有不少测量蒸汽量的方法,主要有传统测量装置、弗留格尔公式计算、智能算法等。传统测量装置包括流量孔板或者是喷嘴等标准节流装置,但节流装置在测量过程中容易造成节流损失,从而影响机组的出力。弗留格尔公式计算蒸汽量存在着局限性,例如使用弗留格尔公式的前提是假定通流面积不变,但是在实际生产过程中由于机组负荷的变动或者结垢导致通流面积是变化的,从而造成计算蒸汽量是存在着较大的误差。近年来,智能算法在电力系统中得到了广泛应用,其中最具代表的是基于神经网络的蒸汽量预测方法,该方法达到了较好的预测效果,但存在着全局寻优能力差、训练时间长、容易过拟合等缺点。
4.由于火力发电产生蒸汽是一个涉及多变量、非线性、复杂度较高的过程,很难根据一些理论依据和经验找到最合理的工艺参数,这导致在研发设计的过程中,工艺参数的验证和优化耗费大量的时间。电厂历史运行数据质量较差、蒸汽量与各特征变量是非线性关系的原因,增大了蒸汽量预测的工作量,使得预测效果较差。因此,如何开展快速、准确的蒸汽量预测是一个亟需解决的问题。


技术实现要素:

5.本发明的目的是提供一种基于宽度学习和回归模型的蒸汽量预测方法及系统,可提高蒸汽量预测的效率及准确度。
6.为实现上述目的,本发明提供了如下方案:
7.一种基于宽度学习和回归模型的蒸汽量预测方法,所述基于宽度学习和回归模型的蒸汽量预测方法包括:
8.采集待测火力发电厂的实际运行数据;
9.基于第一预测模型,根据所述实际运行数据,确定第一预测蒸汽量;其中,所述第一预测模型是通过初始样本数据集,对宽度学习系统进行训练得到,所述初始样本数据集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量;
10.基于第二预测模型,根据所述实际运行数据,确定第二预测蒸汽量;其中,所述第
二预测模型是通过初始样本数据集,对lasso回归模型进行训练得到;
11.将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量。
12.可选地,所述第一预测模型的建立方法包括:
13.采用one-class svm算法检测所述初始样本数据集中的异常值,并将异常值剔除,得到正常样本数据集;
14.采用最大信息系数方法,从所述正常样本数据集中的历史运行数据中选取与蒸汽量相关性大于阈值的历史运行数据,得到训练样本集;所述训练样本集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量;
15.采用所述训练样本集对宽度学习系统进行迭代训练,调整所述宽度学习系统的权重,直至所述宽度学习系统的误差小于误差阈值时,则当前权重对应的宽度学习系统为第一预测模型。
16.可选地,所述宽度学习系统包括依次连接的输入层、增强层和输出层;
17.所述采用所述训练样本集对宽度学习系统进行迭代训练,调整所述宽度学习系统的权重,直至所述宽度学习系统的误差小于误差阈值时,则当前权重对应的宽度学习系统为第一预测模型,具体包括:
18.通过所述输入层根据各组历史运行数据,确定多组映射特征;每组映射特征包括多个特征节点;
19.通过所述增强层根据多组映射特征确定对应的多组增强节点;每组增强节点包括多个增强节点;
20.根据各特征节点及各增强节点连接到输出层的权重,确定连接权重矩阵;所述连接权重矩阵为宽度学习系统的权重;
21.通过所述输出层根据各组映射特征、各组增强节点及所述连接权重矩阵,确定预测蒸汽量;
22.根据所述预测蒸汽量及历史运行数据样本对应的历史蒸汽量,确定所述宽度学习系统的预测误差;
23.根据所述预测误差调整所述连接权重矩阵,直至预测误差小于误差阈值时,则当前的宽度学习系统为第一预测模型。
24.可选地,根据以下公式,确定第φ组映射特征:
25.l
φ
=ω(xm
αφ
τ
αφ
),φ=1,2,

,n;
26.其中,l
φ
为第φ组映射特征,ω为第一映射函数,x为第φ组历史运行数据组成的矩阵,m
αφ
为第φ组历史运行数据的权重系数,τ
αφ
为偏置项,n为映射特征组的数量。
27.可选地,根据以下公式,确定第γ组增强节点:
[0028][0029]
其中,z
γ
为第γ组增强节点,为第φ组映射特征,μ为第二映射函数,m
χγ
为第γ组增强节点的权重系数,τ
χγ
为第γ组增强节点的偏置项,m为增强节点组的数量。
[0030]
可选地,根据以下公式,确定预测蒸汽量:
[0031]
y=[l1,l2,...,ln|z1,z2,...,zm]w;
[0032]
其中,y为预测蒸汽量,ln为第n组映射特征,zm为第m组增强节点,w为连接权重矩阵,[l1,l2,...,ln|z1,z2,...,zm]为矩阵拼接运算。
[0033]
可选地,所述将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量,具体包括:
[0034]
根据所述第一预测模型在训练时的预测误差及所述第二预测模型在训练时的预测误差,确定偏差矩阵;
[0035]
根据所述偏差矩阵,采用拉格朗日乘子法,确定第一预测模型及第二预测模型的权重系数;
[0036]
根据所述第一蒸汽量预测值、所述第二蒸汽量预测值、所述第一预测模型的权重系数及第二预测模型的权重系数,确定所述待测火力发电厂的蒸汽量。
[0037]
可选地,根据以下公式确定偏差矩阵:
[0038][0039]
其中,a为偏差矩阵,m为训练样本集中历史运行数据的数量,a
1t
为第一预测模型在历史运行数据t时的预测蒸汽量与历史蒸汽量的误差,a
2t
为第二预测模型在历史运行数据t时的预测蒸汽量与历史蒸汽量的误差。
[0040]
可选地,根据以下公式,确定所述待测火力发电厂的蒸汽量:
[0041][0042]
其中,为待测火力发电厂的蒸汽量,ω1为第一预测模型的权重系数,ω2为第二预测模型的权重系数,为第一蒸汽量预测值,为第二蒸汽量预测值。
[0043]
为实现上述目的,本发明还提供了如下方案:
[0044]
一种基于宽度学习和回归模型的蒸汽量预测系统,所述基于宽度学习和回归模型的蒸汽量预测系统包括:
[0045]
数据采集单元,用于采集待测火力发电厂的实际运行数据;
[0046]
第一预测单元,与所述数据采集单元连接,用于基于第一预测模型,根据所述实际运行数据,确定第一预测蒸汽量;其中,所述第一预测模型是通过初始样本数据集,对宽度学习系统进行训练得到,所述初始样本数据集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量;
[0047]
第二预测单元,与所述数据采集单元连接,用于基于第二预测模型,根据所述实际运行数据,确定第二预测蒸汽量;其中,所述第二预测模型是通过初始样本数据集,对lasso回归模型进行训练得到;
[0048]
蒸汽量确定单元,分别与所述第一预测单元及所述第二预测单元连接,用于将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量。
[0049]
根据本发明提供的具体实施例,本发明公开了以下技术效果:采用组合预测的方法,将火力发电厂的运行数据作为输入特征,分别输入第一预测模型和第二预测模型,得到第一预测蒸汽量和第二预测蒸汽量,然后将第一蒸汽量预测值及第二蒸汽量预测值线性组合,得出最终的蒸汽量预测结果,组合预测的结果更加契合蒸汽量的趋势,更能贴近真实
值,精度也更高,有效地缓解了单一模型在变化剧烈的峰值和谷值位置预测偏差较大的问题,提高了火力发电厂蒸汽量的预测效率及准确度。
附图说明
[0050]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0051]
图1为本发明基于宽度学习和回归模型的蒸汽量预测方法的流程图;
[0052]
图2为第一预测模型和第二预测模型建立方法的流程图;
[0053]
图3为特征锅炉压力异常值处理图;
[0054]
图4为本发明基于宽度学习和回归模型的蒸汽量预测的模块结构图。
[0055]
符号说明:
[0056]
数据采集单元-1,第一预测单元-2,第二预测单元-3,蒸汽量确定单元-4。
具体实施方式
[0057]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058]
本发明的目的是提供一种基于宽度学习和回归模型的蒸汽量预测方法及系统,通过将火力发电厂的运行数据分别输入第一预测模型和第二预测模型,得到第一预测蒸汽量和第二预测蒸汽量,然后将第一蒸汽量预测值及第二蒸汽量预测值线性组合,得出最终的蒸汽量预测结果,组合预测的结果更加契合蒸汽量的趋势,更能贴近真实值,精度也更高,有效地缓解了单一模型在变化剧烈的峰值和谷值位置预测偏差较大的问题,提高了火力发电厂蒸汽量的预测效率及准确度。
[0059]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0060]
如图1所示,本发明基于宽度学习和回归模型的蒸汽量预测方法包括:
[0061]
s1:采集待测火力发电厂的实际运行数据。
[0062]
s2:基于第一预测模型,根据所述实际运行数据,确定第一预测蒸汽量;其中,所述第一预测模型是通过初始样本数据集,对宽度学习系统进行训练得到,所述初始样本数据集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量。
[0063]
s3:基于第二预测模型,根据所述实际运行数据,确定第二预测蒸汽量;其中,所述第二预测模型是通过初始样本数据集,对lasso回归模型进行训练得到。
[0064]
s4:将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量。
[0065]
具体地,如图2所示,所述第一预测模型的建立方法包括:
[0066]
s21:采用one-class svm算法检测所述初始样本数据集中的异常值,并将异常值
剔除,得到正常样本数据集。
[0067]
在本实施例中,初始样本数据集来源于火力发电厂的历史运行数据,包括目标变量:历史蒸汽量,以及蒸汽量的特征变量:锅炉压力、锅炉温度、燃料给量、二次风给量、给水水量、一次风给量、过热器温度、炉膛压力、炉膛温度、引料风、返料风、炉膛压力、炉膛温度,共包含2888个样本数据。
[0068]
具体地,采用one-class svm算法检测异常值,通过数值的分布密度来区分正常值和异常值,当初始样本数据集中的数据落在密度大的分布区域则为正常值,反之则为异常值。如图3所示,为对锅炉压力进行异常值剔除的示意图。
[0069]
首先确定径向基核函数:
[0070][0071]
其中,yj为核函数的中心,xi为初始样本数据集中的数据,δ为带宽,控制了核函数的径向作用范围,||x
i-yj||2表示xi和yj之间的平方欧几里得距离,k(xi,yj)为约束条件。
[0072]
one-class svm算法的求解模型为:
[0073][0074]
其中,k(xi)为约束条件,在本实施例中,对于y没有约束条件,q为初始样本数据集中样本的数量,l为异常数据到分类超平面的距离,z为分类超平面的法向量,β为松弛变量,c为平滑因子。
[0075]
采用拉格朗日函数对偶求解z和l,可得到决策函数:
[0076]
g(x)=sgn((z
·
k(x))-l);
[0077]
其中,sgn()为取符号函数。对于任意输入的样本数据x,当g(x)≥0时,所输入样本的特征向量(历史运行数据)x为正常值,反之则为异常值,对于异常值直接剔除。
[0078]
本实施例中,利用one-class svm算法分别对训练集和测试集进行了异常值的检测,对于偏离密集点的数值直接剔除。剔除了异常值后,训练集和测试集分别包含2160、540个正常数据。
[0079]
s22:采用最大信息系数方法,从所述正常样本数据集中的各历史运行数据中选取与蒸汽量相关性大于阈值的历史运行数据,得到得到训练样本集;所述训练样本集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量;每组历史运行数据包括锅炉压力、锅炉温度、燃料给量、二次风给量、给水水量、一次风给量、过热器温度、炉膛压力及炉膛温度。
[0080]
具体地,定义存在变量h={h1,h2,...,h
λ
}和k={k1,k2,...,k
λ
},λ为正常样本数据集中的样本总数,集合d={(h1,k1),(h2,k2),...,(h
λ
,k
λ
),}为有限样本对。首先定义划分g把变量h和变量k分别划分为h段和k段,g为h
×
k的网格。然后在划分的每一种表格内对互信息i(h;k)进行计算,在相同的h
×
k内有很多种划分网格的方式,选取最大的i(h;k)作为g的
互信息。由此可以得到最大互信息可以表示为:
[0081]iλ
(h;k)=max(i(d|g));
[0082]
其中,d|g表示数据d在使用g进行划分,i(d|g)为数据d在使用g进行划分情况下的互信息。
[0083]
将不同划分下得到的最大互信息值组成特征矩阵,特征矩阵i(d)
x,y
为:
[0084][0085]iλ
(d,h,k)表示数据d和h、k之间的最大互信息值;x,y表示求取得到的特征矩阵i(d)
x,y
的变量。
[0086]
最大信息系数为:
[0087][0088]
其中,b为网格划分h
×
k的上限值,b=λ
0.6

[0089]
给定一个样本数为λ的特征集p={p1,p2,...,p
λ
,e},e为类别(p对应d,p
λ
和e分别对应h和k)。定义mic(p
λ
,e)为特征p
λ
和类别e间的相关性,mic(p
λ
,e)的值越大说明特征p
λ
和类别e之间的相关性就越大,相关特征p
λ
就越强,该特征就越倾向于保留;反之则说明相关特征p
λ
较弱,需要对其进行删除。
[0090]
s23:采用所述训练样本集对宽度学习系统进行迭代训练,调整所述宽度学习系统的权重,直至所述宽度学习系统的误差小于误差阈值时,则当前权重对应的宽度学习系统为第一预测模型。
[0091]
在模型训练之前,需要设置宽度学习系统和lasso回归模型的超参数,在本实施例中,利用网格搜索法分别确定宽度学习系统和lasso回归模型的最优超参数。其中,宽度学习系统的超参数包括特征映射nn、特征节点ng和增强节点nm,lasso回归模型的超参数为alpha值。
[0092]
采用5折交叉验证方法分别对宽度学习系统及lasso回归模型的性能进行评估,查验5折交叉验证下的验证误差均值是否最小,在验证误差均小于阈值时,确定最优超参数。在本实施例中,宽度学习系统的最优超参数为:特征映射nn为40组,特征节点ng为10个,增强节点nm为41个。lasso回归模型的alpha值取0.0015。
[0093]
进一步地,所述宽度学习系统包括依次连接的输入层、增强层和输出层。
[0094]
步骤s23具体包括:
[0095]
通过所述输入层根据各组历史运行数据,确定多组映射特征;每组映射特征包括多个特征节点。在本实施例中,根据以下公式,确定第φ组映射特征:
[0096]
l
φ
=ω(xm
αφ
τ
αφ
),φ=1,2,

,n;
[0097]
其中,l
φ
为第φ组映射特征,ω为第一映射函数,x为第φ组历史运行数据组成的矩阵,m
αφ
为第φ组历史运行数据的权重系数,τ
αφ
为偏置项,n为映射特征组的数量。
[0098]
通过所述增强层根据多组映射特征确定对应的多组增强节点;每组增强节点包括多个增强节点。在本实施例中,根据以下公式,确定第γ组增强节点:
[0099]
[0100]
其中,z
γ
为第γ组增强节点,为第φ组映射特征,μ为第二映射函数,m
χγ
为第γ组增强节点的权重系数(预先设定),τ
χγ
为第γ组增强节点的偏置项,m为增强节点组的数量。
[0101]
根据各特征节点及各增强节点连接到输出层的权重,确定连接权重矩阵;所述连接权重矩阵为宽度学习系统的权重。
[0102]
通过所述输出层根据各组映射特征、各组增强节点及所述连接权重矩阵,确定预测蒸汽量。在本实施例中,根据以下公式,确定预测蒸汽量:
[0103]
y=[l1,l2,...,ln|z1,z2,...,zm]w;
[0104]
其中,y为预测蒸汽量,ln为第n组映射特征,zm为第m组增强节点,w为连接权重矩阵,[l1,l2,...,ln|z1,z2,...,zm]为矩阵拼接运算。
[0105]
根据所述预测蒸汽量及历史运行数据样本对应的历史蒸汽量,确定所述宽度学习系统的预测误差。
[0106]
根据所述预测误差调整所述连接权重矩阵,直至预测误差小于误差阈值时,则当前的宽度学习系统为第一预测模型。
[0107]
具体地,宽度学习系统的求解过程等价于求解线性系统y'=qw的最小二乘解:
[0108][0109]
其中,q=[l1,l2,...,ln|z1,z2,...,zm],q

为矩阵q的moore-penrose广义逆矩阵,也称为伪逆矩阵,y'为历史蒸汽量,w为连接权重矩阵。
[0110]
在本实施例中,回归网络模型的建立方法采用现有对lasso回归模型进行训练的方法,不同的是模型的训练样本。本实施例中的训练样本为:采用one-class svm算法检测初始样本数据集中的异常值,并将异常值剔除,得到正常样本数据集;采用最大信息系数方法,从所述正常样本数据集中的历史运行数据中选取与蒸汽量相关性大于阈值的历史运行数据,得到训练样本集;所述训练样本集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量。
[0111]
首先对所有特征变量(历史运行数据样本)做标准化变换。
[0112]
然后在误差平方和最小的基础上在目标函数后面加了1范数约束,回归网络模型的目标函数为:
[0113][0114]
其中,σ和ω为回归参数,c
op
为特征变量(历史运行数据样本),do为受c
op
影响的蒸汽量,g为回归建模用到的数组,θ为调参系数,θ≥0。对于任意θ的取值,都有σ的截距估计为
[0115]
通过调整参数θ可以加大惩罚力度从而减少模型的变量数,达到调整模型复杂度的目的,降低模型复杂度可以防止训练时过拟合。参数θ的最优值可以通过交叉验证法估计得到。
[0116]
在本实施例中,利用最优加权法确定权重系数,将宽度学习系统模型和lasso回归
模型独立预测得到的结果进行线性组合,得到最终的蒸汽量预测结果。
[0117]
进一步地,s4:将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量,具体包括:
[0118]
根据所述第一预测模型在训练时的预测误差及所述第二预测模型在训练时的预测误差,确定偏差矩阵。具体地,根据以下公式确定偏差矩阵:
[0119][0120]
其中,a为偏差矩阵,m为训练样本集中历史运行数据的数量,a
1t
为第一预测模型在历史运行数据t时的预测蒸汽量与历史蒸汽量的误差,a
2t
为第二预测模型在历史运行数据t时的预测蒸汽量与历史蒸汽量的误差。
[0121]
根据所述偏差矩阵,采用拉格朗日乘子法,确定第一预测模型及第二预测模型的权重系数。具体采用以下公式:
[0122][0123]
其中,ω1为第一预测模型的权重系数,ω2为第二预测模型的权重系数,a为偏差矩阵,k=[1,1]
τ

[0124]
根据所述第一蒸汽量预测值、所述第二蒸汽量预测值、所述第一预测模型的权重系数及第二预测模型的权重系数,确定所述待测火力发电厂的蒸汽量。在本实施例中,根据以下公式,确定所述待测火力发电厂的蒸汽量:
[0125][0126]
其中,为待测火力发电厂的蒸汽量,ω1为第一预测模型的权重系数,ω2为第二预测模型的权重系数,为第一蒸汽量预测值,为第二蒸汽量预测值。
[0127]
本发明通过对火力发电厂历史运行数据进行挖掘,确定各特征变量与蒸汽量的非线性关系,并分别建立第一预测模型和第二预测模型对蒸汽量进行预测,运用第一预测模型和第二预测模型实现锅炉运行过程的模拟和验证,从而减少研发过程的工程更改量。通过预测结果,实现能耗的评估,为电厂运行操作提供指导性意见。进而提高燃烧效率,提高汽轮机机组的运行效率,提高电厂运行的经济效益。
[0128]
另外,本发明将组合预测的结果同真实值、单一模型的预测结果进行了比较,结果表明,组合预测的结果更加契合蒸汽量的趋势,更能贴近真实值,精度也更高,有效地缓解了单一模型在变化剧烈的峰值和谷值位置预测偏差较大的问题。
[0129]
如图4所示,本发明基于宽度学习和回归模型的蒸汽量预测系统包括:数据采集单元1、第一预测单元2、第二预测单元3及蒸汽量确定单元4。
[0130]
其中,所述数据采集单元1用于采集待测火力发电厂的实际运行数据。
[0131]
所述第一预测单元2与所述数据采集单元1连接,所述第一预测单元2用于基于第一预测模型,根据所述实际运行数据,确定第一预测蒸汽量;其中,所述第一预测模型是通过初始样本数据集,对宽度学习系统进行训练得到,所述初始样本数据集包括多组历史运行数据及各组历史运行数据对应的历史蒸汽量。
[0132]
所述第二预测单元3与所述数据采集单元1连接,所述第二预测单元3用于基于第二预测模型,根据所述实际运行数据,确定第二预测蒸汽量;其中,所述第二预测模型是通过初始样本数据集,对lasso回归模型进行训练得到。
[0133]
所述蒸汽量确定单元4分别与所述第一预测单元2及所述第二预测单元3连接,所述蒸汽量确定单元4用于将所述第一蒸汽量预测值及所述第二蒸汽量预测值线性组合,得到所述待测火力发电厂的蒸汽量。
[0134]
相对于现有技术,本发明基于宽度学习和回归模型的蒸汽量预测系统与上述基于宽度学习和回归模型的蒸汽量预测方法的有益效果相同,在此不再赘述。
[0135]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0136]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献