一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多周期特征的LSTM-SVR地铁车站温度预测方法与流程

2022-11-12 20:29:10 来源:中国专利 TAG:

svr模型;步骤2:采用改进的时间序列分解预测模型构建周期波动因素,并叠加预测结果输出。
6.进一步的,步骤1具体包括:s101:对温度时间序列数据做离散傅里叶变换,得到其不同频率分量的幅值。离散傅里叶变换公式为:傅里叶变换公式为:s102:结合时间序列分解法,提取各个特征分量。
7.时间序列特征y
t
,利用分解法分为四个因素,且存在以下关系:长期趋势因素t
t
:表示时间序列在较长持续期内表现出来的总态势,一般是由现象内在的根本性的、本质因素决定的,支配着现象沿着一个方向持续上升、下降或在原有水平上起伏波动。
8.周期波动因素s
t
:表示由于自然季节因素(气候条件)或人文习惯季节因素(节假日)更替的影响,时间序列随季节更替而呈现的周期性变动。
9.循环波动因素c
t
:表示时间序列中以若干年为周期、上升与下降交替出现的循环往复的运动。
10.不规则波动因素(随机性变化)i
t
:表示时间序列由于受偶然性因素的影响而表现出的不规则波动。
11.:对于长期趋势因素t
t
,采用lstm训练模型遗忘门:输入门:根据上一次的输出和本次输入来计算当前输入的单元状态:根据上一次的输出和本次输入来计算当前输入的单元状态:输出门:输出量:其中,运算符号表示sigmoid激活函数,输出0到1之间的数值,运算符号
×
表示
矩阵按元素相乘,表示上一时刻lstm的输出,表示上一时刻lstm的状态,表示当前时刻的输入,表示遗忘门对当前时刻的更新值,表示输入门对当前时刻的更新值,表示输出门对当前时刻的更新值,和分别表示它们各自的更新权重矩阵和偏置量;lstm与bp神经网络一样具有误差反向传播的特点,利用链式求导到每个权重的梯度,通过不断训练样本,利用随机梯度下降更新矩阵权重找到全局最优解。
12.:对于循环波动因素c
t
和周期波动因素s
t
,采用svr训练模型由于地铁车站温度数据平稳性较高,循环波动因素ct和周期波动因素s
t
的非线性特征和周期特征明显,且维度较小,因此本专利对于采用svr算法训练c
t
和s
t
数据模型,其泛化能力较强,可以有效避免过拟合问题。svr算法的基本思路是利用核函数将线性不可分的低维空间数据分映射到高维空间,进而实现线性回归,优点是在处理数据量较小且非线性特征明显的问题时具有独特的优势, 建立决策函数仅依赖于少量支持向量, 具有较好的鲁棒性。
13.进一步的,步骤2具体包括:s201:采用改进的时间序列分解预测模型构建周期波动因素s
t
常规时间序列分解法,只能对单周期性很强的时间序列进行季节性分析,对于多周期性很强的时间序列,忽略了其余周期中较强的周期特征,故本专利提出改进的时间序列分解法,将周期波动继续分解出周期分量和残差余项,并进一步提取其余周期项分量后构建周期波动因素的预测模型。
14.将分解为:,其中对应周期为的周期变化,且忽略影响(在预测时利用随机性进行叠加),则:,其中表示t1周期的周期分量,表示以t1周期分量为基准的其余周期分量的余项,即,且满足,整个数列的递推关系为,可得:
s202:利用改进的时间序列分解预测模型,和预测集数据分项预测,并叠加预测结果输出。
15.与现有技术相比,本发明具有以下有益效果:1、本发明针对地铁环境温度的时间序列数据用lstm-svr对各个趋势特征数据进行训练,通过观察其能否有效学习数据特征,并将预测结果叠加观察总的效果,与单一模型对比分析的结果表明,基于多周期特征的lstm-svr组合预测模型方法较单一模型具有较大优势,在更长的数据序列中,可以有效的分离出特征,更好的根据特征训练数据,且针对非平稳、非线性有明显周期性的时间序列预测有较高精度;本发明在另一方面可以将分解之后的各个时间序列作并行处理,提高训练速度;同时对于一些因节假日、突发事件导致的数据大幅变化,统一归到余项中,在预测时针对输入数据满足节假日、突发事件等外部条件时进行有效处置,从而进一步提升精度。
附图说明
16.图1为本实施例中原始数据时间序列图。
17.图2为本实施例中原始数据时间序列经离散傅里叶变换频谱图。
18.图3为本实施例中长短期记忆网络lstm模型训练图。
19.图4 为本实施例中训练集特征值分离流程与lstm-svr模型训练。
20.图5为本实施例中 基于lstm-svr组合模型的训练与预测过程。
21.图6 为本实施例中lstm模型预测结果图。
22.图7为本实施例中 svr模型预测结果图。
23.图8为本实施例中 lstm-svr模型预测结果图。
具体实施方式
24.为了使本领域技术人员能进一步了解本发明的技术特征及其技术内容,请参阅以下有关本发明的具体实施例与说明书附图,说明书附图提供参考及说明并非用来限制本发明。
25.本实施例数据说明:本发明以某地铁车站站台温度数据作为实验对象,该车站温度调节采用排风机、冷水机组以及通风空调等控制设备。利用综合监控系统后台集成环境监控系统采集数据,采集频率为10min/次,时间跨度2019-2020年,采集到的温度数据50142条,经检测和梳理,去除缺失,明显变化异常、超出范围的数据,还剩47839条有效温度数据,本发明中所有附图均基于此数据生成。
26.本实施例具体使用了一种基于多周期特征的lstm-svr地铁车站温度预测方法,将温度时间序列数据做离散傅里叶变换,根据频谱峰值提取明显处于峰值的周期特征;按最大幅值周期做滑动平均,消除周期性,做特征工程,再训练lstm模型,对长期趋势和循环波动做预测;然后将原时间序列数据与滑动平均值做商,得到周期性特征序列,根据其傅里叶变化频谱分析其剩余周期性,并提取剩余周期特征,做特征工程,训练svr模型,同时改进时间序列分解法,对周期性做预测,将结果叠加得到预测值。具体包含以下步骤:步骤1:进行训练集特征值分离,并通过循环交叉验证和参数优化不断训练lstm-svr模型;步骤2:采用改进的时间序列分解预测模型构建周期波动因素,并叠加预测结果输出。
27.进一步的,s101:对温度时间序列数据做离散傅里叶变换,得到其不同频率分量的幅值。离散傅里叶变换公式为:幅值。离散傅里叶变换公式为:由于离散傅里叶变换的逆变换不包含时域信息,即从图2中无法看出信号频域随时间变化的情况,不能做时频分析,所以不能直接从中分离出不同周期分量,只能看出各个周期大小,因此需结合时间序列分解法,提取各个特征分量,进行预测。
28.s102:结合时间序列分解法,提取各个特征分量。
29.时间序列特征y
t
,利用分解法分为四个因素,且存在以下关系:长期趋势因素t
t
:表示时间序列在较长持续期内表现出来的总态势,一般是由现象内在的根本性的、本质因素决定的,支配着现象沿着一个方向持续上升、下降或在原有水平上起伏波动。
30.周期波动因素s
t
:表示由于自然季节因素(气候条件)或人文习惯季节因素(节假日)更替的影响,时间序列随季节更替而呈现的周期性变动。
31.循环波动因素c
t
:表示时间序列中以若干年为周期、上升与下降交替出现的循环往复的运动。
32.不规则波动因素(随机性变化)i
t
:表示时间序列由于受偶然性因素的影响而表现出的不规则波动。
33.本专利中时间序列分解法采用乘法模型,即。
34.乘法模型具备以下特点:(1)s
t
具有周期性,;
(2),表示时间序列数据的滑动平均值;(3),对i
t
变量做滑动平均将消除大部分随机性;(4)i
t
是独立随机变量序列,服从均值为0的正态分布。
35.s103:对于长期趋势因素t
t
,采用lstm训练模型本专利对于长期趋势因素t
t
,采用lstm训练可以更有效提取非线性特征。长短期记忆网络lstm(long short-term memory )是一种特殊的循环神经网络rnn(recurrent neural network),主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。相比普通rnn,lstm添加了遗忘门,输入门,输出门,能够在更长的序列中有更好的表现。
36.其中,运算符号表示sigmoid激活函数,输出0到1之间的数值,运算符号
×
表示矩阵按元素相乘,表示上一时刻lstm的输出,表示上一时刻lstm的状态,表示当前时刻的输入,表示遗忘门对当前时刻的更新值,表示输入门对当前时刻的更新值,表示输出门对当前时刻的更新值,和分别表示它们各自的更新权重矩阵和偏置量。
37.遗忘门:输入门:根据上一次的输出和本次输入来计算当前输入的单元状态:根据上一次的输出和本次输入来计算当前输入的单元状态:输出门:输出量:其中,运算符号表示sigmoid激活函数,输出0到1之间的数值,运算符号
×
表示矩阵按元素相乘,表示上一时刻lstm的输出,表示上一时刻lstm的状态,表示当前时刻的输入,表示遗忘门对当前时刻的更新值,表示输入门对当前时刻的更新值,表示输出门对当前时刻的更新值,和分别表示它们各自的更新权重矩阵和偏置量;lstm与bp神经网络一样具有误差反向传播的特点,利用链式求导到每个权重的梯度,通过不断训练样本,利用随机梯度下降更新矩阵权重找到全局最优解。
38.:对于循环波动因素c
t
和周期波动因素s
t
,采用svr训练模型
由于地铁车站温度数据平稳性较高,循环波动因素ct和周期波动因素s
t
的非线性特征和周期特征明显,且维度较小,因此本专利对于采用svr算法训练c
t
和s
t
数据模型,其泛化能力较强,可以有效避免过拟合问题。svr算法的基本思路是利用核函数将线性不可分的低维空间数据分映射到高维空间,进而实现线性回归,优点是在处理数据量较小且非线性特征明显的问题时具有独特的优势, 建立决策函数仅依赖于少量支持向量, 具有较好的鲁棒性。
39.对于给定的地铁车站温度时间序列数据,划分一个超平面,则样本点到决策面的距离为:。
40.假设能容忍与之间最多有的误差,仅当与之间的差的绝对值大于时才计算损失,即:,另一方面,为了最大化间隔,需要加一个约束条件,得到两个异类支持向量到超平面的距离之和为:为了最大化间隔,仅需要最大化,,则其代价函数为:其中c为正则化常数,为不敏感损失函数,为了选择合适的核函数使得训练样本在特征空间中线性可分,引入“松弛变量”(slack variables) 和,
则目标函数转化为:通过引入拉格朗日乘子,即可转化为对偶问题,选取核函数,则svr可表示为:,其中,为拉格朗日乘子。
41.以上s101~s104过程为训练集特征值分离与lstm-svr模型的训练过程,流程如图4所示:s201:按照图4所述方案循环进行滑动平均、消除长期变化、残差判断、选取下一个周期,并不断训练lstm、svr模型,并通过循环交叉验证和参数优化,使lstm-svr组合模型达到最优。
42.s202:采用改进的时间序列分解预测模型构建周期波动因素s
t
常规时间序列分解法,只能对单周期性很强的时间序列进行季节性分析,对于多周期性很强的时间序列,忽略了其余周期中较强的周期特征,故本专利提出改进的时间序列分解法,将周期波动继续分解出周期分量和残差余项,并进一步提取其余周期项分量后构建周期波动因素的预测模型。
43.将分解为:,其中对应周期为的周期变化,且,忽略影响(在预测时利用随机性进行叠加),则:,其中表示t1周期的周期分量,表示以t1周期分量为基准的其余周期分量的余项,即,且满足,整个数列的递推关系为,
可得:s203:利用改进的时间序列分解预测模型,和预测集数据分项预测,并叠加预测结果输出。
44.取本实施例实验所用数据集的前40000条数据作为训练集,后7839条数据作为预测集,进行单一lstm、svr模型和基于多周期特征的lstm-svr组合模型的对比实验,选用mae(平均绝对误差)、rmse(均方根误差)、mape(平均绝对百分误差) 3种预测评价指标进行评估,预测和评估指标对比如表1所示:表1:三种模型预测结果评价指标对比表由此可见,针对地铁环境温度的时间序列数据用lstm-svr对各个趋势特征数据进行训练,通过观察其能否有效学习数据特征,并将预测结果叠加观察总的效果,与单一模型对比分析的结果表明,基于多周期特征的lstm-svr组合预测模型方法较单一模型具有较大优势,在更长的数据序列中,可以有效的分离出特征,更好的根据特征训练数据,且针对非平稳、非线性有明显周期性的时间序列预测有较高精度。另一方面,可以将分解之后的各个时间序列作并行处理,提高训练速度;同时对于一些因节假日、突发事件导致的数据大幅变化,统一归到余项中,在预测时针对输入数据满足节假日、突发事件等外部条件时进行有效处置,从而进一步提升精度。
45.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献