一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于MI-VMD-DA-EDLSTM-VEC的多维特征组合预测方法与流程

2021-11-15 16:38:00 来源:中国专利 TAG:

一种基于mi

vmd

da

edlstm

vec的多维特征组合预测方法
技术领域
1.本发明涉及一种风力发电预测模型领域,具体的涉及一种基于 mi

vmd

da

edlstm

vec的多维特征组合预测方法。


背景技术:

2.随着全球能源结构的变化,风能在未来能源中的比重逐渐提高。风力发电的快速发展带 来了与电力系统可靠性和安全性相关的许多挑战。由于风速的间歇性和随机性,电力系统中 的电压和频率波动较大,导致风力发电过程的充满不确定性。因此,准确有效的预测风电功 率对于保障电力系统的不间断运行和充分利用风能资源至关重要。目前,风电功率的短期预 测方法可以分为3类:1)模型驱动;2)数据驱动;3)模型和数据集成驱动。
3.模型驱动基于数值天气预报(nwp)模型,通过计算热力学和流体动力学(cfd)模型的三维 空间和时间信息来预测气象变量,并使用适合于给定风电场的风电功率曲线转换为风功率。 这种模型驱动方法的准确性很大程度上取决于nwp模型,nwp模型需要提供气象数据和风 力发电机物理特性数据,但这些数据并不总是可用的,而且该模型需要大量计算和时间。因 此,这些方法可能不适合实际的风电功率预测(wpf)应用。
4.数据驱动则通过寻找输入变量和风电功率之间的映射关系来进行预测,许多统计模型和 机器学习模型都是为此而研究的。统计模型有持久性模型(pm),自回归差分移动平均模型 (arima),高斯进程(gp),卡尔曼滤波(kf)等;机器学习模型包括人工神经网络(ann),极 限学习机(elm),支持向量机(svm)等。随着大数据时代的到来,多元的海量时间序列数据爆 炸式增长。在大部分情况下,多变量时间序列数据具有高维度性、时空相关性、动态性和非 线性等特征,或者包含噪声数据,这使得传统的统计模型和机器学习模型在处理海量并且复 杂的数据时遇到困难,而深度学习算法比传统方法更能挖掘数据的深层特征。因此,尽管传 统方法依然可用,但是基于深度学习的预测方法正变得越来越流行。常见的深度学习模型有 卷积神经网络(cnn),层叠自编码器(sae),深度信念神经网络(dbn),循环神经网络(rnn) 等。
5.集成驱动是模型驱动和数据驱动的结合,集成了信号预处理技术,如小波变换和经验模 态分解;优化算法,如粒子群优化和网格搜索(gs);以及预测模型,如极限学习机(elm)、 反向传播神经网络(bpnn)和支持向量机(svm)。
6.由于风电功率和风速数据的随机性和复杂性而信号预处理算法能有效地提取信号的特 征,许多学者通过结合信号预处理方法和机器学习算法进行风电预测。比如,小波包分解 (wtd),经验模态分解(emd),完全集合经验模态分解(ceemd),eemd awnn(集合经验 模态分解和自适应小波神经网络),自适应噪声的完全集成经验模态分解等方法。结果表明, 与无信号预处理的单一模型相比,结合信号分解和机器学习方法的模型能有更高的稳定性和 预测精度。
7.深度学习被认为是最强大的表征学习算法,在过去几年,将信号预处理和深度学习算法 结合用于风电功率预测的研究逐渐增加。比如基于小波分解(wd)和变分模态分解
(vmd)的两 级分解和注意力机制(at)的wd

vmd

dlstm

at组合预测模型在短期风速预测上取得了较 高的精度和稳定性。
8.由于lstm会在递归多步预测时出现误差累积的问题,而编解码框架虽然能解决误差累 积问题,但在较长输入时间步长时预测精度会出现显著的降低。许多学者引入注意力机制提 升模型对于时间相关性的选择能力,
9.综上所述,传统的arma模型不能处理非线性、非平稳性的复杂数据,而单一的svr、 lstm模型会存在预测滞后的问题,并且在多步预测上存在误差累积,编码解码模型虽然能 较好地解决误差累积问题,但是不能把握输入特征间的长时序相关性。


技术实现要素:

10.本发明为了克服以上技术的不足,提供了一种基于mi

vmd

da

edlstm

vec的多维 特征组合预测方法,用于短期风电功率预测,对原始特征序列和预测误差序列进行变分模态 分解(vmd),利用基于两级注意力机制和编码解码架构的长短时记忆神经网络模型以及使用 误差分解预处理的误差修正模块,进行风电功率的预测所提出的预测模型具有最优的性能, 变分模态分解得到的误差序列可以提高矫正的效果。
11.本发明克服其技术问题所采用的技术方案是:
12.本发明提出的一种基于mi

vmd

da

edlstm

vec的多维特征组合预测方法,具体包 括:s1,对原始特征序列x(t)进行mi特征选择得到风电功率、风速和温度序列;s2,分别对风 电功率、风速和温度序列进行vmd分解得到模态分量;s3,基于使用了双层注意力机制的编 码解码da

edlstm模型对于vmd分解得到的模态分量进行模型训练和预测,得到初始预 测序列通过得到原始预测误差e(t);s4,对原始预测误差e(t)进行vmd分解 预处理,使用单层lstm模型进行再训练预测得到误差预测序列并对原始预测结果进 行修正得到最终预测结果
13.进一步的,步骤s1具体包括:s11,基于公式1计算原始风速序列x与目标序列y的互 信息,进行互信息量排序,其中原始风速序列包括风电、温度、气压、密度和风向,
[0014][0015]
其中,p(x,y)是x和y的联合概率密度函数,而p(x)和p(y)是边际密度函数,如果x与 y完全不相关,则p(x,y)将等于p(x)p(y),其互信息将等0,若i(x;y)越大,则表示两个变 量相关性越强;s12,基于特征序列x和目标序列y的互信息排序,选择互信息最大的3维 特征序列,其中3维特征序列为风电功率、风速和温度。
[0016]
进一步的,步骤s2具体包括:对风电功率、风速和温度序列分别分解成具有中心频率k 个模态分量u
k
(k=1,2,...,k),其中,每个模态分量的带宽估计之和被最小化,包括如下步骤: s21,通过对每个模态分量u
k
进行希尔伯特变换得到相应的频谱;s22,通过指数混合调制算 法将u
k
的频谱移动到各自的估计中心频率ω
k
;s23,使用信号的高斯平滑度和梯度平方准则 来解调和估计u
k
的带宽。
[0017]
进一步的,步骤s3中所述使用了双层注意力机制的编码解码模型da

edlstm包括依 次耦接的输入层、编码层、解码层和输出层,所述编码层对于输入特征使用注意力机制,
在的预测滞后的问题,提高模型的预测精度;
[0029]
3)vmd

da

edlstm提升模型在风电等数据急剧变化的时候的决策能力;
[0030]
4)更加准确地预测风电功率出现峰值或低谷的情况。
[0031]
5)用于编码层输入和解码层隐藏状态的双阶段注意力机制能够选择关键信息,通过第一 阶段at关注重要的特征维度,同时第二阶段at关注长期时序中的重要时刻,从而达到不仅 能把握长期时序依赖关系,关注重要时刻,也能实现重要特征因子的选取的效果,改进编码 解码模型在输入序列长度增加时性能变差的缺点,进一步提高模型性能。
[0032]
6)使用了信号预处理的误差修正机制能够进一步的提高预测的精度,vmd分解解决了 误差序列也存在的不平稳、复杂性强等问题,实现了对误差序列很好的特征提取,从而进一 个提高模型的预测性能。
附图说明
[0033]
图1为本发明实施例的模型流程示意图;
[0034]
图2为本发明实施例的模型整体架构图;
[0035]
图3为本发明实施例的lstm内部结构示意图;
[0036]
图4为本发明实施例的da

edlstm模型结构;
[0037]
图5为本发明实施例的编码层特征注意力机制示意图;
[0038]
图6为本发明实施例的解码层时间注意力机制示意图;
[0039]
图7为本发明实施例的风电功率趋势图与频谱图;
[0040]
图8为本发明实施例的风电功率acf和pacf图;
[0041]
图9为本发明实施例的6维特征的互信息排序;
[0042]
图10为本发明实施例的风速,温度趋势图;
[0043]
图11为本发明实施例的风电功率和风速序列vmd分解结果;
[0044]
图12为本发明实施例的bov站和ccrta站模型误差对比;
[0045]
图13为本发明实施例的注意力机制权重图;
[0046]
图14为本发明实施例的不同p和k的模型预测结果对比;
[0047]
图15为本发明实施例的20组实验稳定性比较。
具体实施方式
[0048]
为了便于本领域人员更好的理解本发明,下面结合附图和具体实施例对本发明做进一步 详细说明,下述仅是示例性的不限定本发明的保护范围。
[0049]
在描述本发明的一种基于mi

vmd

da

edlstm

vec的多维特征组合预测方法之前, 首先对一些专有名词进行解释:
[0050]
mi:互信息法特征选择
[0051]
vmd:变分模态分解;
[0052]
arma:自回归移动平均模型
[0053]
svr支持向量回归模型
[0054]
edlstm:编码解码神经网络
[0055]
double

attention:两级注意力机制
[0056]
encoder

decoder:编码解码架构;
[0057]
lstm:长短时记忆神经网络模型;
[0058]
error

correction:误差修正。
[0059]
如图1所示,是本发明的一种基于mi

vmd

da

edlstm

vec的多维特征组合预测方 法的实施例的流程图,图2为本发明的mi

vmd

da

edlstm

vec的多维特征组合预测方 法的实施例的模型整体架构图,具体包括:
[0060]
s1,对包括原始特征序列x(t)进行mi特征选择得到风电功率、风速和温度序列。
[0061]
互信息法是用于捕捉每个特征与标签之间的任意关系(包括线性和非线性关系)的过滤方 法[36]。互信息是两个随机变量x与y之间的度量,它量化了通过一个随机变量能获得的有 关另一个随机变量的信息量。对于连续型变量,互信息由下(1)式计算:
[0062][0063]
其中,p(x,y)是x和y的联合概率密度函数,而p(x)和p(y)是边际密度函数。互信息量确 定联合分布与分解的边际分布p(x,y)的乘积有多相似。如果x与y完全不相关,则p(x,y)将等 于p(x)p(y),其互信息将等于0。若i(x;y)越大,则表示两个变量相关性越强。使用mi分别 计算多维特征与标签风电功率之间的互信息量,排序后选择相关特征用于后续模型训练和预 测。
[0064]
原始特征序列x(t)为6维特征序列,包括风电、温度、气压、密度和风 向;基于特征序列x(t)和目标序列y的互信息排序,选择互信息最大的3维特征序列,其中3 维特征序列为风电功率、风速和温度。
[0065]
s2,分别对风电功率、风速和温度序列进行vmd分解得到模态分量;
[0066]
vmd具有计算效率高和鲁棒性强的优点,可以解决模态混合问题。通过应用vmd,信 号x(t)被分解成k个子序列或者模态分量u
k
(k=1,2,...,k),并且每个模态分量的带宽估计之和被 最小化。其步骤分为构造和求解变分问题:1)通过对每个模态函数u
k
进行希尔伯特变换得到 相应的频谱;2)通过指数混合调制算法将u
k
的频谱移动到各自的估计中心频率ω
k
;3)使用信 号的高斯平滑度和梯度平方准则来解调和估计u
k
的带宽。
[0067]
带约束的变分问题如式(2):
[0068][0069]
采用vmd算法对mi特征选择后选取的前3维特征进行分解,得到具有一定中心频率的 模态分量。
[0070]
在本发明的一个实施例中,分别对风电功率(power)、风速(speed)和温度(temperature) 序列进行vmd分解,得到3组模态分量:power imfs[imf1,imf2,

,imf
p
];speed imfs [imf1,imf2,

,imf
s
];temp imfs[ifm1,imf2,

,imf
t
]。
[0071]
s3,基于使用了双层注意力机制的编码解模型da

edlstm对于vmd分解得到的模态分 量进行模型训练和预测,得到初始预测序列通过得到原始预测误差e(t);
[0072]
标准的循环神经网络(rnn)在反向传播过程中存在梯度消失和梯度爆炸问题,使其难以 连续优化网络参数。长短时记忆神经网络lstm则可以有效地解决这个问题,lstm通过添 加对于历史信息和即时信息的控制单元,使网络模型可以保存和传输信息较长时间。lstm 存储单元由三个激活门结构(遗忘门、输入门和输出门)控制,以便有效的存储单元信息可以 被更新和利用。lstm单元结构如图3所示。三个控制门和单元信息更新公式如下:
[0073]
1)遗忘门:在单元信息更新中控制上一单元c
t
‑1哪些信息被遗忘。
[0074]
f
t
=σ(w
f
[h
t
‑1;x
t
] b
f
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0075]
2)输入门:控制哪些信息被输入到本单元中。
[0076]
i
t
=σ(w
i
[h
t
‑1;x
t
] b
i
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0077][0078]
3)单元信息更新:通过遗忘门和输入门有选择地更新c
t

[0079][0080]
4)输出门:将c
t
激活,并控制c
t
的过滤程度。
[0081]
o
t
=σ(w
o
[h
t
‑1;x
t
] b
o
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0082]
h
t
=o
t

tanh(c
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0083]
其中,w
*
为权重矩阵,b
*
为偏置项,e表示矩阵元素乘积,σ为sigmoid激活函数,tanh 为双曲正切激活函数,激活函数定义如下:
[0084][0085][0086]
最终,输出层依据下式得到最终预测值。
[0087]
y
t
=σ(w
y
h
t
b
y
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0088]
对于给定的n维特征风电功率时间序列,比如其 中t是观测时间序列的窗口长度,我们使用来表示其中的第k维特征序 列,表示第t时刻的n维特征序列。
[0089]
对于风电功率预测问题,给定观测序列历史值(x1,x2,...,x
t
‑1),其中其目标在于 寻找到观测特征变量和目标预测变量y
t
之间的非线性映射关系,即找到一个非线性映射函数 f(.)使得y
t
=f(x1,x2,...,x
t
‑1)。
[0090]
受到人类注意力机制理论的启发,在第一阶段选择基本刺激特征,通过第二阶段使用分 类信息来解码刺激。在模型编码层对于输入特征运用注意力机制,使得该编码器能够自适应 地关注相关特征,这在时间序列的预测中具有实际意义。
[0091]
因此,本发明结合注意力机制和编码解码模型(encoder

decoder),提出了基于双阶段注 意力机制编解码模型(da

edlstm)的风电功率预测方法,模型结构如图4所示。传统的注意 力机制仅对解码层不同时刻的输入参数产生不同的上下文向量,本发明在编码层也引入注意 力机制,对每个时刻的不同特征运用注意力机制,从而在把握长期时序依赖关系的同时,实 现对重要特征因子的选择。
[0092]
编码层特征注意力机制如图5所示,对于输入观测序列x中的第k维特征序列x
k
,可以 根据上一时刻编码器的隐藏状态h
t
‑1和单元状态s
t
‑1构造注意机制,如公式(12)和(13)所示:
[0093][0094][0095]
其中,和是模型需要学习的参数,和是编码层 的隐藏状态和单元状态,m是隐藏层的大小。得到之后,通过softmax函数将其归一化, 保证注意力权重之和为1,对于每个时刻的输入x
t
,为其中每个影响因子赋予一定的注意力 权重重衡量了时刻t的第k维特征的重要性。由于每个时刻的每个特征都有其对应的权 重,因此第一阶段注意力加权后的输出如公式(14):
[0096][0097]
于是,我们可以使用代替x
t
,输入到编码层中:
[0098][0099]
其中,函数f1为lstm网络,利用这种输入注意力机制,编码层就可以关注重要的特征 因子而不是对平等的对待所有特征属性。
[0100]
解码层时间注意力机制如图6所示,在传统编码解码结构中,编码层输出所有时刻都拥 有相同的上下文向量,然而,并不是每个时刻的输入序列x
t
和编码层的隐藏层隐藏状态h
t
对 上下文向量都做出了相同的贡献。因此,采用时间注意力机制来选择性的关注相关的输入序 列。该注意力机制如图所示,根据式(16)计算注意力权重向量e
i
。该向量可以用来表示未归 一化的输入重要性。
[0101]
e
i
=tanh(w
d
[h
i
;s
t
‑1] b
d
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0102]
其中,w
d
和u
d
是需要模型学习的权重参数。通过式(17)进行归一化,得到各个时刻的输 入序列的关注概率。
[0103][0104]
于是,在t时刻的上下文向量通过式(18)加权求和,得到最终进入lstm门控单元的向量 x
t1

[0105][0106]
该向量能够表示不同时刻的编码输入变量在预测输出时的重要性。总体而言,在解码结 构中实现时间注意力机制,学习不同时刻的隐藏状态之间的内在时间相关性,利用注意力机 制加权得到的信息进行预测。另外,注意力机制为前馈神经网络,可以与模型整体一起进行 参数的学习。
[0107]
如图6所示是解码层时间注意力机制示意图,在传统编码解码结构中,编码层输出所有 时刻都拥有相同的上下文向量,然而,并不是每个时刻的输入序列xt和编码层的隐藏
层隐藏 状态ht对上下文向量都做出了相同的贡献。因此,采用时间注意力机制来选择性的关注相关 的输入序列。该注意力机制如图所示,根据下式(19)计算注意力权重向量。该向量可以用来 表示未归一化的输入重要性。
[0108]
e
i
=tanh(w
d
[h
i
;s
t
‑1] b
d
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0109]
其中,w
d
和u
d
是需要模型学习的权重参数。通过式(20)进行归一化,得到各个时刻的 输入序列的关注概率。
[0110][0111]
于是,在t时刻的上下文向量通过式(21)加权求和,得到最终进入lstm门控单元的向量 x
t1

[0112][0113]
该向量能够表示不同时刻的编码输入变量在预测输出时的重要性。总体而言,在解码结 构中实现时间注意力机制,学习不同时刻的隐藏状态之间的内在时间相关性,利用注意力机 制加权得到的信息进行预测。另外,注意力机制为前馈神经网络,可以与模型整体一起进行 参数的学习。
[0114]
s4,对原始预测误差e(t)进行vmd分解预处理,使用单层lstm模型进行再训练预测得 到误差预测序列并对原始预测结果进行修正得到最终预测结果
[0115]
s5,还包括基于根均方误差rmse,平均绝对误差mae和对称平均绝对百分比误差 smape进行预测性能评估。
[0116]
本发明的一个实施例用于预测性能评估使用的数据集为美国国家可再生能源实验室 (nrel)提供的观测站站点数据,原始数据集时间跨度为2013年全年,包含风电功率、风向、 风速、空气温度,表面气压和密度等6个维度特征,每5分钟采样一次。实验数据集取自马 萨诸塞州南塔基特岛西部的巴特利特的海景风电场(bartlett`s ocean view wind farm,bov)以 及巴恩斯特布尔的丹尼斯的ccrta站点。
[0117]
从2013年1月到2013年12月,nrel提供每5分钟采样一次的数据集,我们对一小时 内的12个采样点进行平均值重采样,以获得小时数据。实验评估中会使用3个数据子集,训 练集、验证集和测试集根据固定比例7:1:2进行划分。于是,总共有8760个小时的数据样 本,其中6132个样本作为训练集,876个样本作为验证集,1752个样本则用于测试。
[0118]
在本发明的一个实施例中,我们使用3个评估指标来评估预测模型的性能。分别是:平 均绝对误差(mae)、根均方误差(rmse)和对称平均绝对百分比误差(smape)。rmse是预测 定量数据时测量模型误差的标准指标。smape是基于百分比误差的准确性度量。3个评估指 标分别由下式计算。其中,y(t)是时间t的实际风电值,是时间t的预测风电值,n表示 测试集中的数据样本数。
[0119]
1)平均绝对误差:
[0120]
2)平均方根误差:
[0121]
3)平均绝对百分比误差:
[0122]
为了验证本发明提出的mi

vmd

da

edlstm

vec的组合模型的预测效果,和自回 归移动平均模型arma、支持向量回归模型svr、长短时记忆神经网络lstm、 vmd lstm、vmd 编码解码器lstm、vmd 解码层注意力机制 edlstm、vmd 双 阶段注意力机制 edlstm、vmd 双阶段注意力机制 edlstm 误差修正、vmd 双阶段 注意力机制 edlstm 误差修正(vmd),针对于bov风电场的风电功率时间序列样本如 图7所示,可以发现,该风电场风电时间序列的变化幅度较大,并且波动频率也较大。这 是选择该风电场数据来验证所提出方法的有效性和推广能力的原因之一。从图中够可以看 出风电功率变化幅度较大;在频谱图中无法观察出风电功率的主要频率,并且频谱曲线变 化剧烈,说明风电功率中不同频率的信号相互干扰,受噪声印象较严重。
[0123]
为了确定时间序列预测模型的最佳阶数,需要分析时间序列数据的自相关性。从图8中 所示的风电功率的acf图和pacf图可以发现,acf图的特征是拖尾,而pacf图是截尾。 因此,该风电功率信号满足自回归(auto regressive,ar)模型的特性,从acf图可以看出数据 在滞后30步左右完全进入置信区间中,因此时序预测模型的最佳阶数p初步确定为30。
[0124]
首先进行mi特征选择。
[0125]
由于原始数据为6维,包含风电功率、风向、风速、空气温度,表面气压和密度等数据, 为了消除或者减弱冗余特性以及不相关特性带来的噪声对模型预测产生的影响,使用mi作 为特征选择方法进行特征选择,选择与pw相关性较强的特征作为主要特征参与模型预测。 图9为互信息法计算的每个特征维度的互信息量排序,可以发现风电功率、风速和空气温度 为前3维主要相关特征,如图10所示为风速和温度趋势图,后续模型使用这3维特征数据进 行信号分解、模型训练和预测。
[0126]
对不同维度特征使用单一lstm模型进行预测的结果。可以发现,mi选择出来的3维特 征的预测效果优于原始6维特征数据,但是仍然略逊于单维数据(pw)的预测结果,这是由于 加入的风速信号具有不平稳性和复杂性,导致模型的精度下降,后续采用vmd算法将信号 分解为不同频率的平稳分量,从而提高模型精度。
[0127]
vmd特征提取,使用vmd算法分别对风电、风速、空气温度数据分解为20、10,1个 imfs,使各个特征分解为不同频域上均匀分布的分量。风电、风速的vmd分解结果如图11 所示,可以看出风电和风速分解后的imfs在频域上均匀分布,表明了vmd分解能够很好地 提取信号在频域上的特征。
[0128]
预测的指标对比如图12所示,其中,vmd分解后模型预测的rmse和mae分别是1.117 和0.799,与3维特征直接使用lstm进行预测的指标rmse为2.229相比有明显的降低。vmd分解后的预测结果比使用lstm直接进行预测的结果更接近基准线,说明vmd分解后 进行预测有较高的精度。和其他模型的预测结果进行对比,可以看出vmd

lstm优于统计 模型arma和机器学习模型svr;vmd

edlstm的预测指标mae,rmse分别为0.568 和0.266,比使用单层lstm的vmd

lstm提高了0.533和0.549;而在解码层运用了attention 机制使用不同上下文向量的vmd

at

edlstm模型则由于能关注重要时刻的隐藏状态而拥 有比vmd

edlstm模型更好的预测精度,指标分别提升了0.034和0.049;在 vmd

at

edlstm模型的基础上,vmd

da

edlstm模型在编码层的输入阶段运用注意力 机制,使模型不仅能把握长期时序依赖关
系,关注重要时刻,也能实现重要特征因子的选取, 从图中可以看出,无误差修正模块的情况下,该模型拥有最优的预测性能,预测指标mae 和rmse分别为0.218和0.381,在vmd

edlstm模型的基础上降低了0.048和0.187,而 在vmd

at

edlstm模型的基础上降低了0.014和0.138。
[0129]
如图13为解码和编码两个阶段的attention机制的注意力权重比例图,在第一阶段的 attention机制中,注意力机制被运用来选择关键的imfs分量,风电功率、风速和空气温度 的imfs数量分别是20、10、1,从图13(a)中可以发现,模型主要关注每组imfs分量中的低 频趋势分量;在第二阶段的attention机制中,则是关注关键时间步的隐藏状态,从图13(b) 中可以发现,在第24步时拥有最大的注意力权重,并且靠后的时间步拥有较大的权重,说明 在第二阶段的解码层注意力机制可以选择出长时间相关性中的关键信息,并且该信息是靠后 时刻拥有的。
[0130]
在本发明的一个实施例中,在双阶段注意力机制的编码解码模型的基础上,加入了误差 修正模块,使用原始预测误差作为数据样本,使用单层lstm模型进行误差预测,最后将使 用误差预测序列对原始预测进行误差修正。考虑到预测误差具有不平稳的、波动性较强的特 点,使用vmd分解对误差序列进行预处理,实验结果表明基于vmd分解预处理的误差修 正模块能进一步提高模型的预测精度。从图12可以发现vmd

da

edlstm

vec模型的性 能指标rmse和mae达到了0.179和0.121,对比不使用vmd分解预处理的 vmd

da

edlstm

ec分别提高了0.175和0.076,在vmd

da

edlstm模型的基础上提高 了0.202和0.097。
[0131]
在一些实施方式中,不同的vmd分解层数k会影响imfs在频域上的分布情况,进而 影响模型的预测结果;不同的滞后时间步长同样也会影响预测精度。下面使用 vmd

da

edlstm模型来确定自相关阶数p和特征分解层数k。
[0132]
1)分解层数k的确定:假设p=30,贪心算法寻找风电、风速和温度的分解层数k
p
、k
s
、k
t
,先在k
p
取值在15

25间寻找误差相对较低的k
p
,在此基础上确定k
s
,进一步确定k
s
取值,
[0133]
2)自相关阶数p的确定:在确定了k值的基础上寻找p值,从图7的acf图和pacf 图上看,自相关阶数从30左右完全进入置信区间;从图13(a)中来看,自相关阶数p为30时 拥有相对最小的rmse和mae误差,和pacf图得出的结果一致。
[0134]
利用五种模型(vmd

lstm、vmd

edlstm、vmd

at

edlstm、vmd

da

edlstm、 vmd

da

edlstm

vec)在bov站点数据上分别进行20组预测实验,并对实验结果的误差 指标mae、rmse进行对比,如图15所示。
[0135]
从图15中20组实验的平均误差可以看出,增加解码层注意力机制的vmd

at

edlstm 的平均预测误差mae为0.23,rmse为0.52,优于vmd

lstm和vmd

edlstm,而进一 步增加编码层注意力机制的vmd

da

edlstm的平均误差mae为0.22,rmse为0.38,优 于单注意力机制模型,使用误差修正模块后预测误差进一步降低到mae为0.12,rmse为 0.17,同时模型也更加稳定。
[0136]
本发明提出了一种由mi、vmd、编码解码lstm模型、双阶段attention机制组合 而成的新型的短期风电功率预测模型,结合误差修正模块,提出mi

vmd

da

edlstm

vec 的多维特征组合模型,本发明所提出的组合模型的预测精度均为最优,并且具有较强的预测 稳定性。
[0137]
以上仅描述了本发明的基本原理和优选实施方式,本领域人员可以根据上述描述做出许 多变化和改进,这些变化和改进应该属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献