一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于时序卷积注意力的多路段列车客流预测方法及装置

2022-05-11 11:22:09 来源:中国专利 TAG:


1.本发明涉及铁路客流预测技术领域,尤其涉及一种基于时序卷积注意力的多路段列车客流预测方法及装置。


背景技术:

2.随着近几年铁路运营管理模式不断升级,高速铁路网络从“四纵四横”向“八纵八横”迈进,铁路客运也伴随着国内经济迅速发展,取得了辉煌成就。得益于铁路客运的快捷和便利,高铁已经逐渐成为旅客出行的首选之一。但面对日益增长的出行需求,如何将资源合理配置、根据市场的动态变化来调整运营策略、增加运营收益成了铁路部门面临的挑战。为了解决这些问题,需要更深入地了解客流变化趋势并对铁路客流做出准确的预测。因此铁路客流的分析与预测是铁路相关领域实行科学管理的基石,是把握客流动态变化趋势的必要措施。另一方面,随着国内经济快速发展,基于城市群的高速铁路网也基本成型,对基于铁路网的客流分布研究也越来越多。从客流预测的角度来说,如何设计深度学习模型从而更好地利用铁路网中多路段的客流数据成为了急需解决的问题。
3.传统的客流预测方法包括基于时间序列模型的方法、基于回归分析的方法和基于机器学习的方法。基于时间序列模型的方法是利用历史的客流资料,根据被预测事物过去和现在的变化特征建立时间序列模型,然后借助于模型进行外推以预测未来。基于回归分析的方法是建立客流量与主要影响因素之间的回归方程。在对主要因素预测的基础上,利用回归方程来进行客流量预测。基于机器学习的方法首先通过特征工程提取出符合铁路客流特征的特征,然后使用传统的机器学习回归方法进行预测。这些方法虽然都取得了一定的效果,但需要依赖人工设计的规则或特征,从而使得模型的性能取决于人工设计的规则或特征的质量。近年来,随着深度学习的发展,以神经网络为主的方法被应用到客流预测任务中,并取得了很多的研究成果。该方法不依赖人工设计特征,完全由神经网络自动学习相关的特征。
4.虽然以卷积神经网络和循环神经网络为代表的深度学习方法在客流预测任务上取得了一定的突破,但是仍然存在相当多的问题。例如,卷积神经网络虽然能够捕获客流中的短期时序特征和局部空间信息,但忽略了全局信息的作用。循环神经网络虽然可以有效学习客流中的长期时序关系,但无法处理长序列依赖问题。此外,由于神经网络的非线性,神经网络模型往往存在输出的规模对输入的规模不敏感的缺陷,通常在处理多种尺度的输入数据时,输出数据的范围可能都在一个比较小的区间内。输入数据如果不断发生非周期变化,就会降低神经网络模型的预测精度。


技术实现要素:

5.本发明提供一种基于时序卷积注意力的多路段列车客流预测方法及装置,用以解决现有技术中多路段列车客流预测任务中难以提取短期和长期两种时序模式,以及空间信息难以利用等导致预测效果不佳的缺陷,兼顾客流数据的长短期特征,提高了预测的精度。
6.本发明提供一种基于时序卷积注意力的多路段列车客流预测方法,包括:
7.获取多路段列车客流数据;
8.将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
9.其中,所述多路段客流预测模型通过多路段列车客流样本数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
10.根据本发明提供的一种基于时序卷积注意力的多路段列车客流预测方法,所述线性单元用于提取所述多路段列车客流数据中的线性特征,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征。
11.根据本发明提供的一种基于时序卷积注意力的多路段列车客流预测方法,所述线性单元用于提取所述多路段列车客流数据中的线性特征,包括:
12.所述线性单元用于通过自回归模型提取所述多路段列车客流数据中的线性特征,输出线性分量预测结果。
13.根据本发明提供的一种基于时序卷积注意力的多路段列车客流预测方法,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征,包括:
14.所述非线性单元用于通过卷积神经网络提取所述多路段列车客流数据短期时序特征和不同路段客流间的空间关系特征,获得卷积结果;
15.所述非线性单元还用于通过时序卷积注意力网络提取所述卷积结果的长期时序特征,输出非线性分量预测结果。
16.根据本发明提供的一种基于时序卷积注意力的多路段列车客流预测方法,所述时序卷积注意力网络包括四个扩张卷积层和四个自注意力层,每个扩张卷积层之后设置一个自注意力层。
17.本发明还提供一种基于时序卷积注意力的多路段列车客流预测装置,包括:
18.采集模块,用于获取多路段列车客流数据;
19.预测模块,用于将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
20.其中,所述多路段客流预测模型通过多路段列车客流样本数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
21.根据本发明提供的一种基于时序卷积注意力的多路段列车客流预测装置,所述预测模块中,所述线性单元用于提取所述多路段列车客流数据中的线性特征,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征。
22.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于时序卷积注意力的多路段列车客流预测方法的步骤。
23.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算
机程序被处理器执行时实现如上述任一种所述基于时序卷积注意力的多路段列车客流预测方法的步骤。
24.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于时序卷积注意力的多路段列车客流预测方法的步骤。
25.本发明提供的基于时序卷积注意力的多路段列车客流预测方法及装置,通过建立多路段客流预测模型实现对客流量的精准预测,该模型分为线性单元与非线性单元,可以兼顾客流数据中的不同特征。可以同时捕获多路段客流中的局部信息、短期时序和长期时序特征,对铁路客流的不同特征进行深入挖掘,从多个方面深度、完整地表示客流的时间和空间特征,提高客流预测的效果。
附图说明
26.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本发明实施例提供的基于时序卷积注意力的多路段列车客流预测方法的流程示意图;
28.图2是本发明实施例提供的多路段客流预测模型结构示意图;
29.图3是本发明实施例提供的时序卷积注意力网络的结构示意图;
30.图4是本发明实施例提供的自注意力层计算流程示意图;
31.图5是本发明实施例提供的基于时序卷积注意力的多路段列车客流预测装置的结构示意图;
32.图6是本发明实施例提供的电子设备的结构示意图。
具体实施方式
33.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
34.下面结合图1-图4描述本发明的基于时序卷积注意力的多路段列车客流预测方法,方法包括如下步骤:
35.步骤101、获取多路段列车客流数据;
36.步骤102、将所述多路段列车客流数据输入多路段客流预测(hanet)模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
37.其中,所述多路段客流预测模型通过多路段列车客流样本数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
38.需要说明的是,所述多路段列车客流数据是待预测的时间段之前的相近时间段内的历史数据,所述多路段列车客流样本数据包括多个时间段内的数据。
39.本发明提供的基于时序卷积注意力的多路段列车客流预测方法,通过建立多路段客流预测模型实现对客流量的精准预测,如图2所示,该模型分为线性单元与非线性单元,可以兼顾客流数据中的不同特征,对铁路客流的不同特征进行深入挖掘,从多个方面深度、完整地表示客流的时间和空间特征,提高客流预测的效果。
40.在本发明的至少一个实施例中,所述线性单元用于提取所述多路段列车客流数据中的线性特征,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征。对铁路客流的不同特征进行深入挖掘,从多个方面深度、完整地表示客流的时间和空间特征,提高客流预测的效果。
41.在本发明的至少一个实施例中,所述线性单元用于提取所述多路段列车客流数据中的线性特征,包括:
42.所述线性单元用于通过自回归模型(autoregressive model,ar模型)提取所述多路段列车客流数据中的线性特征,输出线性分量预测结果。
43.需要说明的是,本发明实施例为了解决神经网络非线性问题,构建模型引入了ar模型作为关注局部尺度问题(即空间关系问题)的线性部分。
44.在本发明的至少一个实施例中,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征,包括:
45.所述非线性单元用于通过卷积神经网络提取所述多路段列车客流数据短期时序特征和不同路段客流间的空间关系特征,获得卷积结果;
46.需要说明的是,客流数据中存在着短期和长期两种重复的时序模式,此外不同路段的客流之间还存在空间依赖,通过卷积可以更好的捕获这两类特征。所述卷积神经网络(cnn)由多个卷积核组成,宽度为w,长度为d,其中宽度表示卷积时选中的客流数据的天数,长度表示路段数。
47.所述非线性单元还用于通过时序卷积注意力网络(tcan)提取所述卷积结果的长期时序特征,输出非线性分量预测结果,所述的tcan如图3所示。
48.需要说明的是,tcan能够通过输入的长时间序列进行搜索,发现哪些特征与识别目标更相关,哪些特征不相关。
49.在本发明的至少一个实施例中,所述时序卷积注意力网络包括四个扩张卷积层和四个自注意力层,每个扩张卷积层之后设置一个自注意力层。tcan在每个扩张卷积层之后,都增加了一个自注意力层,可以更好地处理客流数据中的长序列依赖问题。
50.需要说明的是,tcan通过输入的长时间序列进行搜索,发现哪些特征与识别目标更相关,哪些特征不相关。本发明通过多次实验后,采用四层扩张卷积叠加四层自注意力,其中,自注意力层计算的流程如图4所示。
51.本发明实施例还公开了一种基于时序卷积注意力的多路段列车客流预测给出在模型训练好后,输入多个路段下的列车客流历史数据y
t
进行预测时的具体步骤:
52.步骤a、采集某一时段内多个路段下的列车客流数据y
t
={y1,y1,...,yd}∈r
d*t
,其中,d表示路段数,t为列车客流数据中跨越的天数;
53.步骤b、将所述某一时段内多个路段下的列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的某一天内多路段列车客流预测数据y
t

54.在本发明的至少一个实施例中,步骤b在模型的处理包括如下子步骤:
55.步骤b1、线性单元利用ar模型提取列车客流数据中的线性规律,如式1所示得到线性分量预测结果h
l

[0056][0057]
其中,表示ar权重系数,b
ar
∈r表示偏置项,yk表示第k天的多路段列车客流,q
ar
为ar模型输入数据中跨越的天数;
[0058]
步骤b2:非线性单元利用卷积神经网络cnn提取多个路段下的列车客流数据y
t
时间维度上的短期时序特征以及不同路段客流之间的空间关系特征;
[0059]
如式2所示,cnn中第i个卷积核对多个路段下的列车客流数据y
t
进行卷积并得到输出向量hi:
[0060]hi
=relu(wi*y
t
bi)
ꢀꢀꢀꢀꢀ
(式2)
[0061]
其中,*表示卷积操作,wi表示卷积核的权重系数,bi表示偏置项;
[0062]
卷积过程中对输入矩阵y
t
进行零填充,使得每个输出向量hi长度均为t,最后卷积层的输出矩阵大小为dc*t,dc表示卷积核的个数;
[0063]
步骤b3:利用时序卷积注意力网络tcan提取客流数据中的长期时序规律;
[0064]
需要说明的是,步骤b3具体包括:
[0065]
将cnn的输出作为输入传递给tcan,并通过三个线性变换将扩张卷积的输出c转换为keys、query和values,分别用k、q、v表示,然后通过softmax函数生成注意力权值w,如式3所示:
[0066]
w=f
softmax
(q
t
k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(式3)
[0067]
计算加权后的注意力层结果w
t
v,将最后一层的扩张卷积和自注意力层结果相加,得到tcan最终输出的结果如式4所示:
[0068]
ha=w
t
v c
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(式4)
[0069]
其中,w
t
为w的转置矩阵。
[0070]
步骤b4:将线性与非线性单元输出结果拼接,得到最终预测结果。
[0071]
需要说明的是,步骤b4具体包括:
[0072]
取tcan最后时刻的状态作为非线性部分的输出,之后将此结果送入全连接层,将全连接层输出与线性部分的结果相加,得到最终预测结果:
[0073]yt
=h
l
hd[0074]
其中,h
l
是线性部分输出,hd是tcan的输出ha经过全连接层后的输出。
[0075]
下面对本发明提供的基于时序卷积注意力的多路段列车客流预测装置进行描述,下文描述的基于时序卷积注意力的多路段列车客流预测装置与上文描述的基于时序卷积注意力的多路段列车客流预测方法可相互对应参照。如图5所示,本发明实施例还公开了一种基于时序卷积注意力的多路段列车客流预测装置,包括:
[0076]
采集模块501,用于获取多路段列车客流数据;
[0077]
预测模块502,用于将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
[0078]
其中,所述多路段客流预测模型通过多路段列车客流样本数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多
路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
[0079]
本发明提供的基于时序卷积注意力的多路段列车客流预测装置,通过建立多路段客流预测模型实现对客流量的精准预测,该模型分为线性单元与非线性单元,可以兼顾客流数据中的不同特征,对铁路客流的不同特征进行深入挖掘,从多个方面深度、完整地表示客流的时间和空间特征,提高客流预测的效果。
[0080]
在本发明的至少一个实施例中,所述预测模块502中线性单元用于提取所述多路段列车客流数据中的线性特征,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征。
[0081]
在本发明的至少一个实施例中,所述线性单元用于提取所述多路段列车客流数据中的线性特征,包括:
[0082]
所述线性单元用于通过自回归模型提取所述多路段列车客流数据中的线性特征,输出线性分量预测结果。
[0083]
在本发明的至少一个实施例中,所述非线性单元用于提取所述多路段列车客流数据短期时序特征、不同路段客流间的空间关系特征和长期时序特征,包括:
[0084]
所述非线性单元用于通过卷积神经网络提取所述多路段列车客流数据短期时序特征和不同路段客流间的空间关系特征,获得卷积结果;
[0085]
所述非线性单元还用于通过时序卷积注意力网络提取所述卷积结果的长期时序特征,输出非线性分量预测结果。
[0086]
在本发明的至少一个实施例中,所述时序卷积注意力网络包括四个扩张卷积层和四个自注意力层,每个扩张卷积层之后设置一个自注意力层。
[0087]
为了验证本发明方法的有效性,本实施例在京沪线列车数据集上,选择了14个路段的多辆列车客流进行实验,与7个多元时间序列预测模型进行了对比实验,对比模型的基本结构如下:
[0088]
(1)lstm:lstm是一种经典时间循环神经网络,擅长于捕获输入序列中的时间模式。
[0089]
(2)tcn:利用多层扩张卷积结构代替rnn处理序列建模任务,通过引入扩张卷积,并利用残差连接避免模型过拟合。
[0090]
(3)lstnet-skip:将预测模型分成线性和非线性两部分结构。在非线性部分提出一种新的跳跃rnn来捕获长期的时间规律。
[0091]
(4)lstnet-attn:结构同lstnet-skip相同,只是非线性部分用注意力机制代替skip-rnn。
[0092]
(5)tpa-lstm:在lstnet-attn基础上提出一种新注意力机制,用于筛选相关时间序列,并利用其频域信息进行多变量预测。
[0093]
(6)dsanet:利用两个并行的卷积组件,称为全局时间卷积和局部时间卷积,来捕捉全局和局部时间模式的复杂混合信息。
[0094]
(7)mtgnn:用于多元时间序列预测的通用图神经网络框架,通过图学习模块计算一个邻接矩阵,从而更好的学习变量之间的单向关系。此外,mtgnn提出了一个新的混合跳跃传播层和一个扩展的起始层来捕获时间序列中的空间和时间依赖性。
[0095]
本实施例中对比实验采用根相对平方误差(root relative squared error,rse)
和经验相关系数(empirical correlation coefficient,corr)两个评价指标,计算公式如下:
[0096][0097][0098]
其中y,分别为真实值和预测值,n是训练样本中变量的个数。rse取总平方误差并通过除以预测变量的总平方误差对其进行归一化,通过取相对平方误差的平方根,可以将误差减小到与预测量相同的尺寸。rse的值越低越好,corr的值越高越好。
[0099]
实验结果如表1所示:
[0100]
表1各模型对比实验结果
[0101][0102]
实验结果表明,由本发明实施例的方法构建的hanet模型在各个指标中均取得了更好的效果。表中tcn与lstm相比,两个评价指标也都明显好于后者,也间接说明了hanet使用tcn代替rnn是合理的。而hanet与单独的tcn相比,由于tcn没有ar组件学习客流中的线性规律,预测性能会明显下降。
[0103]
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(communications interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行基于时序卷积注意力的多路段列车客流预测方法,该方法包括:
[0104]
获取多路段列车客流数据;
[0105]
将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
[0106]
其中,所述多路段客流预测模型通过多路段列车客流数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
[0107]
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0108]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于时序卷积注意力的多路段列车客流预测方法,该方法包括:
[0109]
获取多路段列车客流数据;
[0110]
将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
[0111]
其中,所述多路段客流预测模型通过多路段列车客流数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
[0112]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于时序卷积注意力的多路段列车客流预测方法,该方法包括:
[0113]
获取多路段列车客流数据;
[0114]
将所述多路段列车客流数据输入多路段客流预测模型中,获得所述多路段客流预测模型输出的多路段列车客流预测数据;
[0115]
其中,所述多路段客流预测模型通过多路段列车客流数据训练获得,所述多路段客流预测模型包括线性单元和非线性单元,所述多路段列车客流预测数据是将所述多路段列车客流数据分别通过所述线性单元和非线性单元后输出的结果相加得到的。
[0116]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0117]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可
借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0118]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献