一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

混合模型框架下的水电机组运转状态预判方法

2022-06-05 07:58:59 来源:中国专利 TAG:


1.本发明属于水力发电状态监测技术领域,涉及一种混合模型框架下的水电机组运转状态预判方法。


背景技术:

2.在“双碳”目标的引导下,清洁能源在电力系统中的占比逐步提升。水电作为清洁且成熟的发电方式在电能供应以及新能源消纳和调节方面愈发重要,在满足清洁能源优先供应的基础上,更保障了电力系统安全稳定的供电和社会经济生活的平稳运行。而水电机组作为水电生产电能的核心设备,保障机组安全平稳运行、及时发现机组运行异常状态对保证水电站持续稳定发电有着重要意义。
3.在水电机组运转过程中,不同部件之间互相影响,使得水轮发电机运行过程呈现高度非线性、非平稳和时变等特性,通过对水轮发电机运行机理的归纳总结可知,实际运行中存在水力、机械、电气等多种因素的耦合作用,已有的机组运转状态的预判方法主要是通过研究非平稳、非线性振动信号的处理技术,挖掘有效的信号特征从而进行预判。
4.目前,较为常见的方法包括短时傅里叶变换、模态分解等。变分模态分解(variational mode decomposition,vmd)方法假定信号由具有不同中心频率的模态函数组成,在变分框架内通过自适应和准正交的方法实现信号分解。breiman等于2001年提出了随机森林理论:该方法在决策树的基础上,通过随机选择特征与样本,生成若干决策树,每个决策树单独训练后通过投票表决样本最终的状态类别。为尽可能减小人工设定参数对结果的影响,huang等于2004年提出了极限学习机(extreme learning machine,elm)的概念,该算法为一种只含有一层隐含层的前馈神经网络,且隐含层节点数可以是随机或人为指定,具有计算速度快、泛化性能强的特点,目前被广泛用于各种分类与回归问题。ali akbar abdoos结合了vmd和elm的优点,利用vmd对复杂非平稳的风电时间序列进行分解,对分解后的各个本征模态分量通过elm建立回归模型,最后聚合各个模型的预测结果实现了风电功率的短期预测。相比于上文介绍的机器学习方法,神经网络具备更优秀的非线性拟合能力,理论上能够拟合任意函数,适用于处理海量样本数据。
5.首先,对于时间序列的预测,他们对数据的分布(高斯分布、帕累托分布、指数分布等)进行假设,但实际数据不一定遵循一定的假设分布。其次,这些方法很难调整、纳入外生变量(exogenous variables),它们依赖于线性关系,而不包括复杂的非线性动态模式。此外,它们只支持固定的时间依赖性和单变量数据,而在水电机组实际运行过程中却要复杂得多。在实际的系统中,输入会包含多个协变量,如动态历史特征、特定于每个时间序列的静态属性和已知的未来事件。同时,在这些系统中,多个输入和输出之间可能存在长期和短期的依赖关系和非线性关系,使预判问题更加复杂。在这类系统中,对于一些特殊事件比如极端事件的预判,通常需要一个可靠的不确定性估计与概率展望,以量化预测的不确定性,从而使决策风险最小化。


技术实现要素:

6.本发明的目的是提供一种混合模型框架下的水电机组运转状态预判方法,解决了现有技术中存在的缺乏对于一些特殊事件比如极端事件的预测和对预测不确定性的量化,无法使决策风险最小化的问题。
7.本发明所采用的技术方案是:
8.混合模型框架下的水电机组运转状态预判方法,包括以下步骤:
9.步骤1,在水轮发电机组运行过程中,通过实时监测系统和设备参数获取各个物理量的特征数据集,特征数据集为不同时刻各个物理量的特征数据组成的时间序列的集合;
10.步骤2,建立基于cnn-lstm的trend网络模型;
11.步骤3,将特征数据集分为测试集和训练集,采用训练集对基于cnn-lstm的trend模型进行训练;
12.步骤4,采用训练好的基于cnn-lstm的trend网络模型对测试集进行运转状态的预测。
13.本发明的特点还在于:
14.所述步骤1中物理量包括如运行电压、电流、转速和温度以及包括齿轮、主轴、导叶的实体部件;所述时间序列用以下公式来描述:
15.(x
0:t
,y
0:t
,ε
0:t
)=[(x0,y0,e0),(x1,y1,e1),...,(x
t
,y
t
,e
t
)]
ꢀꢀꢀꢀ
(1)
[0016]
在该系统中,ε表示该系统中的部件实体(如主轴、齿轮),例如ε=ε0,ε1,ε2...εn。[t0,t)表示所观察事件的观察窗口即观测的时间长度,根据实际情况,一般假定t0=0。并且使用x
t-t:t
∈rm×
(t 1)
表示由t-t到t的观察序列{x
t-t
,x
t-t 1
,...,x
t
},使用和y表示预测值和测量到对应物理量的真实值。
[0017]
所述步骤2中基于cnn-lstm的trend网络模型包括依次连接的卷积层、池化层、lstm层和全连接层,其中每个池化层输出和对应的每个全连接层输入之间均连接有一个lstm细胞核,每个细胞核包括遗忘门,输入门,输出门;
[0018]
所述cnn-lstm的trend网络模型通过第i个滤波器扫过输入时间序列x
t
,产生输出为:
[0019][0020]
在这里代表卷积操作,zi表示输出特征向量,relu(
·
)表示激活函数返回值为max(0,(
·
));
[0021]
所述lstm细胞核表示为:
[0022]f{t}
=σ(wf*[c
t-1
,z
t
,h
t-1
] bf)i
t
=σ(wi*[c
t-1
,z
t
,h
t-1
] bi)c
t
=f
t
*c
t-1
i
t
*relu(wc*[z
t
,h
t-1
] bc)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0023]ot
=σ(wo*[c
t
,z
t
,h
t-1
] bo)h
t
=o
t
*relu(c
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0024]
这里的f,i,o,h,c,c,w,z,b,σ()分别表示遗忘门,输入门,输出门,隐状态向量,单元状态向量,权重矩阵,特征向量,偏置向量和sigmoid函数。
[0025]
所述特征数据集还包括极端情况的预测结果,通过以下公式完成:
[0026]
[0027]
其中,表示i项实体从时间t 1开始,窗口为m的时间段内的预测值;y
t-t:t,i
表示t-t到t时间段的输出;x
t-t:t,i
表示t-t到t时间段的输入;表示从时间t 1开始,窗口为m的时间段内将要输入的值,
[0028]
将上述计算结果送入lstm网络细胞核中进行特殊事件训练。
[0029]
所述基于cnn-lstm的trend网络模型在训练时采用分位数损失函数作为该模型的损失函数,分位数损失函数为:
[0030][0031]
其中为损失函数,τ为分位数,表示从时间t开始,窗口为m的时间段内的预测值。
[0032]
本发明的有益效果是:
[0033]
本发明所提出的方法具有非线性表示的能力,适用于模拟水电机组的实际运行状态,具较强的数据适应能力和实际运用价值。该方法中包含的长短期记忆(lstm)和门控递归单元(gru)可以处理消失梯度问题,从而建立了捕获长期依赖性的必要条件;且lstm支持端到端建模和自动特征提取能力,并通过大量数据可以对复杂的非线性特征进行建模,避免了人工进行参数设置,减少了工作量并增强了可行性。而无假设分位回归(qr)[17,18,19]能预测目标分布19]能预测目标分布的条件分位数不需要任何假设的分布,它可以描述整个条件分布的结果变量,更健壮的异常值和误差分布,能够扩大参数和非参数回归方法的灵活性。本发明提出的发法,符合实际应用场景,具有良好的适应性和可行性。较已有的方法,具有更好的准确度、更短的时间开销和更少的内存需求,同时还增加了极端事件预测的功能。
附图说明
[0034]
图1为本发明中基于cnn-lstm的trend网络模型的网络结构图
[0035]
图2为本发明中基于cnn-lstm的trend网络模型的网络运行示意图;
[0036]
图3为本发明方法的训练流程图;
[0037]
图4为本发明方法的预测流程图;
[0038]
图5为实施例1中采用本发明方法进行预测的结果图;
[0039]
图6为实施例1中采用本发明方法的收敛图;
[0040]
图7为采用cnn方法进行预测的结果图;
[0041]
图8为采用lstm方法进行预测的结果图;
[0042]
图9为采用gru方法进行预测的结果图;
[0043]
图10为采用本发明方法和其他方法进行预测的耗时对比图;
具体实施方式
[0044]
下面结合附图和具体实施方式对本发明进行详细说明。
[0045]
混合模型框架下的水电机组运转状态预判方法,包括以下步骤:
[0046]
步骤1,在水轮发电机组运行过程中,通过实时监测系统和设备参数获取各个物理
量的特征数据集,特征数据集为不同时刻各个物理量的特征数据组成的时间序列的集合;
[0047]
步骤2,建立基于cnn-lstm的trend网络模型;
[0048]
步骤3,将特征数据集分为测试集和训练集,采用训练集对基于cnn-lstm的trend模型进行训练;
[0049]
步骤4,采用训练好的基于cnn-lstm的trend网络模型对测试集进行运转状态的预测。
[0050]
步骤1中的特征数据集是一个时间序列集,其中齿轮和主轴在这个系统中作为实体,对于具体的水轮发电机组其给定的复杂非均质时间序列集合,
[0051]
步骤1中时间序列用以下公式来描述:
[0052]
(x
0:t
,y
0:t
,ε
0:t
)=[(x0,y0,e0),(x1,y1,e1),...,(x
t
,y
t
,e
t
)]
ꢀꢀꢀꢀ
(1)
[0053]
在该系统中,ε表示该系统中的部件实体(如主轴、齿轮),例如ε=ε0,ε1,ε2...εn。[t0,t)表示所观察事件的观察窗口即观测的时间长度,根据实际情况,一般假定t0=0。并且使用x
t-t:t
∈rm×
(t 1)
表示由t-t到t的观察序列{x
t-t
,x
t-t 1
,...,x
t
},使用和y表示预测值和测量到对应物理量的真实值。
[0054]
极端情况的预测公式为:
[0055][0056]
其中,表示i项实体从时间t 1开始,窗口为m的时间段内的预测值;y
t-t:t,i
表示t-t到t时间段的输出;x
t-t:t,i
表示t-t到t时间段的输入;表示从时间t 1开始,窗口为m的时间段内将要输入的值。
[0057]
预测公式用于预测极端事件,该结果将会送入lstm网络细胞核中进行特殊事件训练。
[0058]
步骤2中
[0059]
基于cnn-lstm的trend网络模型包括依次连接的卷积层、池化层、lstm层和全连接层,其中每个池化层输出和对应的每个全连接层输入之间均连接有一个lstm细胞核,每个细胞核包括遗忘门,输入门,输出门。
[0060]
卷积神经网络主要是由输入层、卷积层、池化层和全连接层组成。卷积层是对输入数据进行特征提取,其内部包含多个卷积核,组成卷积核的每个元素都对应一个权重系数和一个偏差量;特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。特征图在全连接层中会失去空间拓扑结构,被展开为向量并通过激励函数;卷积神经网络中输出层的上游通常是全连接层。输入数据序列通过核大小不同的卷积神经网络输入,学习并自动提取不同时间序列中包含的显著特征。每个通道由输入层、带有宽度w、高度h多个滤波器的一维卷积层和全连接层组成。从每个并行通道的输出被连接成一个单一的特征向量,并馈入lstm网络作为输入。第i个滤波器扫过输入时间序列x
t
,产生输出为:
[0061][0062]
在这里代表卷积操作,zi表示输出特征向量,relu(
·
)表示激活函数返回值为max(0,(
·
))。
[0063]
如果sigmoid输入门允许新信息输入,则它的值可以累加到状态。状态单元具有线性自循环性,其权重由遗忘门控制。细胞的输出可以被输出门关闭。状态单元也可用作门控单元的额外输入:
[0064]f{t}
=σ(wf*[c
t-1
,z
t
,h
t-1
] bf)i
t
=σ(wi*[c
t-1
,z
t
,h
t-1
] bi)c
t
=f
t
*c
t-1
i
t
*relu(wc*[z
t
,h
t-1
] bc)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0065]ot
=σ(wo*[c
t
,z
t
,h
t-1
] bo)h
t
=o
t
*relu(c
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0066]
这里的f,i,o,h,c,c,w,z,b,σ()分别表示遗忘门,输入门,输出门,隐状态向量,单元状态向量,权重矩阵,特征向量,偏置向量和sigmoid函数。本发明方法所用的基于cnn-lstm的trend网络模型其结构如图1所示。
[0067]
步骤3中在采用训练集对基于cnn-lstm的trend模型进行训练时,训练过程如图3,根据水轮发电机组运行的特点,建立分位数损失函数。使用该方法的目标是找到一个网络f最小化分位数损失函数,l
τ
(y0,...,y
t
,f(x0,...,x
t
)),因此在推测之后该模型可以最小化损失来预测以后的输出其中当τ=0.5,分位数损失简化为平均绝对误差(mae),而它的极小化函数将估计预测分布的中值。给定q分位数,在t-t到t这段时间里总的分位数损失可计算为:
[0068][0069]
分位数损失函数为:
[0070][0071]
其中为损失函数,τ为分位数,表示从t时刻的预测值,其中观测窗口为m;y
t
表示t时刻的真实值。如下图2所示,最后一个细胞的状态输入预测网络,该网络将会预测这里h是先前已经训练网络的隐状态,用于代表历史状况。该网络中可以保存异常值,可供之后的进一步分析。
[0072]
步骤4中的预测流程如图4。
[0073]
实施例1
[0074]
针对本发明所提出的预判方法,利用多个标准数据集和实际运行数据进行了实验和实际运用评价。本发明方法使用python调用keras框架搭基于cnn-lstm的trend网络模型。使用的数据集是西储大学数据中心的权威标准数据集。试验台由一台2马力的电机、一个扭矩传感器/编码器、一个测功)和控制电子设备组成。振动数据是用加速度计收集的,加速度计被放置在电机外壳的驱动端和风扇端的12点钟位置,采用16通道dat记录仪。驱动端轴承实验数据以每秒12000个采样点和每秒48000个采样点采集。所有风扇端轴承数据以1.2万个样本/秒采集。
[0075]
本实施例使用microsoft windows 10家庭版系统进行验证,cpu版本为intel(r)core(tm)i5-8300h cpu 2.30ghz,在训练的时候不需要大内存,所以8gddr43200mhz的内存足以满足需求,尽管数据集不是很大,因为显卡可以加速;表1为该方法实现环境张量计算,所以使用了geforce gtx 1050ti显卡进行gpu加速。该方法是在普通的个人电脑上实现的,不论对硬件还是软件环境的要求都较低。
[0076]
表1运行环境介绍
[0077][0078][0079]
adam优化器是sgd的扩展,这个名字来源于英文短语“adaptive moments”。在该算法中,与动量梯度下降算法一样,动量引入先前的梯度,并且进行指数加权。除此之外,自适应梯度算法对学习率进行自我调整的。
[0080]
在上述硬件条件和数据集条件下,执行上述步骤1~步骤4,基于cnn-lstm的trend网络模型中lstm网络用于解决消失梯度问题,支持端到端建模和具有非线性特征提取能力;而卷积神经网络(cnn)解决复杂非线性依赖的问题。其中针对普通的场景,全连接层的层数一般都设为1层。而卷积层的数目主要基于对预测精度和训练时间的需求考虑。在对该神经网络进行训练的过程中,误差界值对该模型的准确率特别是时间有直接影响,该参数需要在训练之前进行指定,指定的依据是该模型的收敛速度和该样本的学习精度。一般把该参数设置在10-4
~10-2
之间,当训练误差低于该值时认为训练已充分,停止训练。得到的预测结果如图5所示;图6为本发明方法中cnn-lstm的trend网络模型的收敛图;
[0081]
经过adam优化器计算后,得到不同方法在不同数据集上的误差如表2所示。
[0082]
表2本发明方法与其他方法在不同负载下数据集上的均方误差
[0083][0084][0085]
本实施例还在相同硬件条件和数据集条件下采用cnn方法、lstm方法、gru方法作为对比实验;其中如图7~9分别为cnn方法、lstm方法、gru方法的预测方法,通过对比,可以看出本发明方法在不同负载下的误差值均小于其他三种方法,即说明本发明方法较其它三种方法预测精度高。如图10为本发明方法和其他方法进行预测的耗时对比图,相较其他方法而言虽结构相对复杂,训练时间长于cnn方案、lstm方案和gru方案,但是预测的时间(128.6ms)却显著短于其他gru(163.6ms)、lstm(150.9ms)和cnn(149.5ms);
[0086]
综上所述,本发明方法相对其他方法,在性能上更加优异,在训练的时候使用的内
存较少,并且收敛速度较快。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献