一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种OD客流短时预测方法、装置、设备及其存储介质

2022-07-30 17:02:37 来源:中国专利 TAG:

一种od客流短时预测方法、装置、设备及其存储介质
技术领域
1.本发明涉及深度学习神经网络与客流预测技术领域,具体涉及一种od 客流短时预测方法、装置、设备及其存储介质。


背景技术:

2.od(origin-destination,od)客流分布是一段时间内某起点到终点间的出行量,反应了乘客的出行需求和规律;为有效提高城市公共交通的吸引力和运营组织水平,对于运营商来说,通过od预测的结果进行车辆实时动态调度,有助于提高乘客的出行体验。目前,在短时od预测领域的研究较少,现在市面上的快速公交短时od预测方法多为时间序列方法、k最近邻法,这些方法虽然运算简单,但预测精度较低,并且这些适合处理时间序列的统计模型存在的普遍缺陷是假设时滞变量之间具有线性关系,不能像非线性模型那样用一个大的、一般的函数来表示内在结构,难以解决交通领域的动态和非线性特征。
3.为了解决现市面上的短时od预测方法出现的问题,深度学习方法应用于od预测近年来得到了广泛的发展,但是现有技术中的应用了深度学习方法的短时od预测方法,在客流分布影响因素和od预测具有独特特征的问题上考虑的不全面,其忽略了在解决od数据具有的稀疏性、可用性的问题的基础上,同时考虑客流具有时序特点,od分布与历史客流量以及出行外部因素如天气状况等之间的密切关系,导致od预测结果的精确度不高。
4.有鉴于此,提出本技术。


技术实现要素:

5.本发明公开了一种od客流短时预测方法、装置、设备及其存储介质,能够有效解决现有技术中的应用了深度学习方法的快速公交短时od预测方法,忽略了在解决od数据具有的稀疏性、可用性的问题的基础上,同时考虑客流具有时序特点,od分布与历史客流量以及出行外部因素如天气状况等之间的密切关系,导致od预测结果的精确度不高的问题。
6.本发明公开了一种od客流短时预测方法,包括:
7.获取历史乘客ic数据集以及外部影响因素特征数据,并对其进行od 匹配处理,生成历史od数据集;
8.将所述历史od数据集进行转换处理,生成时间序列,并对所述时间序列进行堆叠处理,生成输入数据集,其中,以δt作为预测时间间隔对预设时间段内的所述时间序列中进行划分,并将划分后数据进行堆叠;
9.调用训练好的神经网络模型对所述输入数据集进行处理,生成od客流预测数据;
10.根据所述od客流预测数据,对车辆实时动态调度进行调整。
11.优选地,将所述历史od数据集进行转换处理,生成时间序列,并对所述时间序列进行堆叠处理,生成输入数据集,具体为:
12.将所述历史od数据集进行转换处理,生成多组预设时间段的时间序列;
13.以δt作为预测时间间隔对每一预设时间段的时间序列进行划分,并将划分后的
每一预设时间段的所述时间序列分别进行堆叠,生成输入数据集,其中,所述输入数据集包括临近性数据、趋势性数据、周期性数据、实时进站客流数据、以及外部因素数据。
14.优选地,根据公式计算所述临近性数据;根据公式计算所述趋势性数据;根据公式计算所述周期性数据;根据公式计算所述实时进站客流数据;根据公式计算所述外部因素数据;其中,lm为外部因素特征长度,le为临近性序列长度,l
tr
为趋势性序列长度,l
pe
为周期性序列长度,p趋势性时间跨度,q周期性时间跨度,m
t
为在预测时间间隔t处的外部因素的特征向量。
15.优选地,在调用训练好的神经网络模型对所述输入数据集进行处理之前,还包括:
16.获取多组历史输入数据集;
17.对所述历史输入数据集进行数据处理,生成多组数据结果值;
18.将所述数据结果值按预设比例划分为训练集和测试集;
19.调用所述训练集作为神经网络的输入数据,对神经网络进行训练,调用所述测试集对训练后的神经网络进行测试,生成神经网络模型。
20.优选地,对所述历史输入数据集进行数据处理,生成多组数据结果值,具体为:
21.根据公式对所述历史输入数据集中的临近性数据、趋势性数据、周期性数据、实时进站客流数据进行min-max标准化处理,生成映射到[0,1]范围之间的数据结果值,其中,x
max
为单列特征数据的最大值, x
min
为单列特征数据的最小值;
[0022]
对所述历史输入数据集中的离散型外部因素数据进行one-hot编码数字化处理,生成数字化的数据结果值;
[0023]
对所述历史输入数据集中的连续型外部因素数据进行min-max线性归一化处理,生成缩放到[0,1]范围之间的数据结果值。
[0024]
优选地,调用所述训练集作为神经网络的输入数据,对神经网络进行训练,调用所述测试集对训练后的神经网络进行测试,生成神经网络模型,具体为:
[0025]
建立一个神经网络,将所述训练集作为输入数据,输入进神经网络中进行训练;
[0026]
将所述测试集输入进神经网络中,计算其均方根误差rmse和平均绝对误差mae,作为评判标准;
[0027]
当所述均方根误差rmse和所述平均绝对误差mae达到预设值时,保存所述神经网络的架构和网络参数,生成神经网络模型。
[0028]
优选地,根据公式计算所述均方根误差 rmse,根据公式计算所述平均绝对误差mae,式中: m
ij
和m
ij1
分为从i站到
j站客流量的真实值和预测值。
[0029]
本发明公开了一种od客流短时预测装置,包括:
[0030]
数据获取单元,用于获取历史乘客ic数据集以及外部影响因素特征数据,并对其进行od匹配处理,生成历史od数据集;
[0031]
输入参数获取单元,用于将所述历史od数据集进行转换处理,生成时间序列,并对所述时间序列进行堆叠处理,生成输入数据集,其中,以δt作为预测时间间隔对预设时间段内的所述时间序列中进行划分,并将划分后数据进行堆叠;
[0032]
预测数据生成单元,用于调用训练好的神经网络模型对所述输入数据集进行处理,生成od客流预测数据;
[0033]
调整单元,用于根据所述od客流预测数据,对车辆实时动态调度进行调整。
[0034]
本发明公开了一种od客流短时预测设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的od客流短时预测方法。
[0035]
本发明公开了一种可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被该存储介质所在设备的处理器执行,以实现如上任意一项所述的od客流短时预测方法。
[0036]
综上所述,本实施例提供的一种od客流短时预测方法、装置、设备及其存储介质,首先,根据客流具有时序的特点,依据时空分布特征,将od 数据集的时间属性分为时间临近性、周期性和趋势性三类分量;使用 convlstm网络来分别建模这三个属性,同时考虑了od分布与出行外部因素如天气状况等之间的密切关系,考虑因素较为全面,增加了模型的泛化能力,可以获得精度更佳的预测结果,并根据最终的预测结果对车辆实时动态调度进行调整。从而解决现有技术中的应用了深度学习方法的快速公交短时od预测方法,忽略了在解决od数据具有的稀疏性、可用性的问题的基础上,同时考虑客流具有时序特点,od分布与历史客流量以及出行外部因素如天气状况等之间的密切关系,导致od预测结果的精确度不高的问题。
附图说明
[0037]
图1是本发明第一方面提供的od客流短时预测方法的流程示意图。
[0038]
图2是本发明第二方面提供的od客流短时预测方法的流程示意图。
[0039]
图3是本发明实施例提供的神经网络模型的整体结构示意图。
[0040]
图4是本发明实施例提供的客流时序特点影响示意图。
[0041]
图5是本发明实施例提供的od客流短时预测装置的模块示意图。
具体实施方式
[0042]
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要
求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
[0043]
以下结合附图对本发明的具体实施例做详细说明。
[0044]
请参阅图1,本发明的第一实施例提供了一种od客流短时预测方法,包括:
[0045]
s101,获取历史乘客ic数据集以及外部影响因素特征数据,并对其进行od匹配处理,生成历史od数据集。
[0046]
s102,将所述历史od数据集进行转换处理,生成时间序列,并对所述时间序列进行堆叠处理,生成输入数据集,其中,以δt作为预测时间间隔对预设时间段内的所述时间序列中进行划分,并将划分后数据进行堆叠。
[0047]
具体地,步骤s102包括:
[0048]
将所述历史od数据集进行转换处理,生成多组预设时间段的时间序列;
[0049]
以δt作为预测时间间隔对每一预设时间段的时间序列进行划分,并将划分后的每一预设时间段的所述时间序列分别进行堆叠,生成输入数据集,其中,所述输入数据集包括临近性数据、趋势性数据、周期性数据、实时进站客流数据、以及外部因素数据。
[0050]
根据公式计算所述临近性数据;根据公式计算所述趋势性数据;根据公式计算所述周期性数据;根据公式计算所述实时进站客流数据;根据公式计算所述外部因素数据;其中,lm为外部因素特征长度,le为临近性序列长度,l
tr
为趋势性序列长度,l
pe
为周期性序列长度,p趋势性时间跨度,q周期性时间跨度,m
t
为在预测时间间隔 t处的外部因素的特征向量。
[0051]
近年来,短期网络流量预测得到了广泛的研究,各种基于数据驱动和基于模型的预测方法已经被用于预测交通的速度/流量、上/下车需求、进/ 出站需求、od需求。其中,不同于其他短期交通预测,od需求短期预测具有三个独特的特点,如表1所示:
[0052]
表1:
[0053][0054][0055]
相较于其他预测任务,od需求短期预测需要更为仔细设计模型的输入,并且考虑稀疏性问题。但现有技术中应用了深度学习方法的快速公交短时 od预测方法,存在忽略了在解决od数据具有的稀疏性、可用性的问题的基础上,同时考虑客流具有时序特点,od分布与历史客流量以及出行外部因素如天气状况等之间的密切关系,导致od预测结果的精确度不高的问题。
[0056]
具体地,在本实施例中,首先,获取外部影响因素(如天气情况等) 特征数据,以及
历史乘客ic刷卡数据并进行od匹配,以得到需要的od数据。其次,将od数据转换成时间序列,假设当前时间为t,以δt为预测时间间隔,为预测下一时刻快速公交od需求od
t 1
,对每一个分量获取以δt为时间间隔的数据,分别设置相应的时间序列长度,将其沿着时间维度进行拼接,构造odc、od
pe
、od
tr
、inflow、m
t
五个输入参数。
[0057]
具体地,在本实施例中,以厦门市快速公交的44个站点的od对和上海市地铁289个站点的od对为例:预测时间间隔δt=15min,所使用的历史 od数据集为厦门市2019年7月1日至8月3日和上海市2015年4月1日至4月29日6:00-23:00(工作日)的od数据以及天气数据。
[0058]
请参阅图2,在本发明一个可能的实施例中,在调用训练好的神经网络模型对所述输入数据集进行处理之前,还包括:
[0059]
s201,获取多组历史输入数据集;
[0060]
s202,对所述历史输入数据集进行数据处理,生成多组数据结果值;
[0061]
具体地,步骤s202包括:
[0062]
根据公式对所述历史输入数据集中的临近性数据、趋势性数据、周期性数据、实时进站客流数据进行min-max标准化处理,生成映射到[0,1]范围之间的数据结果值,其中,x
max
为单列特征数据的最大值, x
min
为单列特征数据的最小值;
[0063]
对所述历史输入数据集中的离散型外部因素数据进行one-hot编码数字化处理,生成数字化的数据结果值;
[0064]
对所述历史输入数据集中的连续型外部因素数据进行min-max线性归一化处理,生成缩放到[0,1]范围之间的数据结果值。
[0065]
具体地,在本实施例中,将所述历史输入数据集的odc、od
pe
、od
tr
、 inflow四个输入参数进行min-max标准化,使结果值映射到[0,1]之间,其中,使用的公式为对于所述历史输入数据集中为离散型变量的输入参数m
t
,利用one-hot编码进行数字化;对于所述历史输入数据集中为连续型变量的输入参数m
t
,同样通过min-max线性归一化缩放到[0,1]范围之间,以生成多组数据结果值。
[0066]
s203,将所述数据结果值按预设比例划分为训练集和测试集;
[0067]
具体地,在本实施例中,以上述厦门市快速公交的44个站点的od对和上海市地铁289个站点的od对为例:数据总共五周,以4:1的比例划分了训练集和测试集;其中,前四周数据用于训练模型,用最后一周的数据进行测试。
[0068]
s204,调用所述训练集作为神经网络的输入数据,对神经网络进行训练,调用所述测试集对训练后的神经网络进行测试,生成神经网络模型。
[0069]
具体地,步骤s204包括:
[0070]
建立一个神经网络,将所述训练集作为输入数据,输入进神经网络中进行训练;
[0071]
将所述测试集输入进神经网络中,计算其均方根误差rmse和平均绝对误差mae,作为评判标准;
[0072]
当所述均方根误差rmse和所述平均绝对误差mae达到预设值时,保存所述神经网
络的架构和网络参数,生成神经网络模型。
[0073]
根据公式计算所述均方根误差rmse,根据公式计算所述平均绝对误差mae,式中:m
ij
和m
ij1
分为从i站到j站客流量的真实值和预测值。
[0074]
具体地,在本实施例中,根据如图3所示的模型整体结构搭建神经网络模型。首先,依据客流时空分布特征,将od流的时间属性分为三类,包括时间临近性、周期性和趋势性分量。这三个分量具有相同的网络结构,由cas-cnn模块和时间演化模块组成。其次,结合通道注意力机制和分裂的cnn构建cas-cnn模块,用以缓解od矩阵存在数据稀疏性问题,并对输入数据进行加权,捕获不同时间下od之间重要性程度。再次,构建辅助信息编码模块,对辅助信息进行编码,包括为弥补od的数据可用性问题所融入的实时进站客流数据和外部影响因素数据。从次,构建时间演化模块,使用卷积长短期记忆网络(convlstm)来分别建模以上三个历史时空客流分量,建模时空数据的临近性、周期性和趋势性。最后,通过基于参数矩阵的方法动态地聚合上述三个分量,为不同的分量分配不同的权值,并与外部因素进一步融合,得到最终的预测结果。
[0075]
在本实施例中,将训练集作为输入参数对神经网络进行训练,将测试集的数据输入神经网络进行测试,并采用均方根误差rmse和平均绝对误差 mae作为预测结果的评价指标,当模型对测试集进行测试所达到的效果不理想时,需调整网络模型的参数直到测试效果理想;当模型对测试集进行测试所达到的效果理想时,保存训练好的网络模型架构和网络参数。
[0076]
具体地,在本实施例中,以上述厦门市快速公交的44个站点的od对和上海市地铁289个站点的od对为例:可以采用adam优化器对神经网络模型进行训练;其中,学习率设为0.0001,权重衰减参数设置为0.00002, batch-size设置为32,损失函数是mae,模型迭代次数为100,预测时间间隔δt=15min,te=t
tr
=t
p
=5,每日和每周趋势跨度q=p=1。
[0077]
s103,调用训练好的神经网络模型对所述输入数据集进行处理,生成 od客流预测数据。
[0078]
具体地,在本实施例中,通过将本模型与以往的ha模型、arima模型、 lstm模型、cas-cnn模型五种模型进行比较,并且将本模型与基于本模型构建的4个变体模型进行比较,根据评价指标好坏评价本模型有效性。其中,所述ha(历史平均)模型,使用计算结果作为所预测的 od;所述arima模型,对每一个od对构建auto arima模型;所述cas-cnn 模型和所述lstm模型都是一种短时轨道od预测方法,其参数值与本文模型保持一致。利用消融实验对结果进行验证,首先,去除周期性和趋势性客流数据,验证客流时序特点有助于提高预测精度;其次,去除cas-cnn 模块,验证数据稀疏性对预测结果影响;最后,去除实时进站客流数据,验证该数据可以缓解数据可用性问题。
[0079]
在本实施例中,以上述厦门市快速公交的44个站点的od对和上海市地铁289个站点的od对为例:分别在厦门市快速公交数据集和上海市轨道数据集上,基于rmse和mae的评
价指标对所述od客流短时预测方法和其余基准模型进行验证和比较。如表2所示:
[0080]
表2:
[0081][0082]
为验证所提模型cas-cnn-convlstm中各模块的有效性,进行了消融实验,构建了3个基于本模型的变体模型,并在两个数据集上进行实验。如表3所示:
[0083]
表3:
[0084][0085]
进一步,为验证客流时序特点对预测结果影响,在厦门市快速公交数据集基础上进行实验验证。
[0086]
如表2所示,从各个模型的预测结果来看,ha和arima预测效果较差, lstm和cas-cnn表现出较好的精度,表明时空特征有助于提高预测精度。本模型所提的基于cas-cnn-convlstm的所述od客流短时预测方法与5个模型相比,表现出较好的准确度,因为本模型更为全面的考虑了客流时空分布特征,学习了od流具有的空间特征和时间规律性。基于所述od客流短时预测方法基础上根据条件额外构建3个模型进行实验,如表3所示。从表3可以看出,去除senet、分裂cnn和实时进站客流后预测精度均有所降低,由此可见,cas-cnn模块有效缓解数据稀疏性问题和区别对待不同时间分量的重要性,同时,融入实时进站客流数据可以有效缓解数据可用性问题。如图4所示,以厦门市快速公交数据集为例验证客流时序特点对预测结果的影响。综合考虑客流时序特点以及天气因素所取得的预测效果显著,表明这些信息有助于提升预测精度。
[0087]
s104,根据所述od客流预测数据,对车辆实时动态调度进行调整。
[0088]
综上所述,所述神经网络模型是一种基于cas-cnn-convlstm的od短时客流预测模型,该模型不仅可以缓解数据稀疏性和可用性问题,还通过通道注意力机制建模不同时间分量重要性程度。此外,本型还对客流的时序特点即临近规律、周规律、趋势性规律和以及外部因素加以考虑。在不同城市的两个真实数据集上评估了本模型的有效性,其性能明显优于5个基准模型,证实了本文的模型更适合od客流短时预测,更能够满足工程上的需求。所述od客流短时预测方法缓解了数据稀疏性和可用性的问题,并且区别对待不同时间下od数据重要程度。
[0089]
请参阅图5,本发明的第二实施例提供了一种od客流短时预测装置,包括:
[0090]
数据获取单元101,用于获取历史乘客ic数据集以及外部影响因素特征数据,并对其进行od匹配处理,生成历史od数据集;
[0091]
输入参数获取单元102,用于将所述历史od数据集进行转换处理,生成时间序列,并对所述时间序列进行堆叠处理,生成输入数据集,其中,以δt作为预测时间间隔对预设时间段内的所述时间序列中进行划分,并将划分后数据进行堆叠;
[0092]
预测数据生成单元103,用于调用训练好的神经网络模型对所述输入数据集进行处理,生成od客流预测数据;
[0093]
调整单元104,用于根据所述od客流预测数据,对车辆实时动态调度进行调整。
[0094]
本发明的第三实施例提供了一种od客流短时预测设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的od客流短时预测方法。
[0095]
本发明的第四实施例提供了一种可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被该存储介质所在设备的处理器执行,以实现如上任意一项所述的od客流短时预测方法。
[0096]
示例性地,本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现一种od客流短时预测设备中的执行过程。例如,本发明第二实施例中所述的装置。
[0097]
所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种od客流短时预测方法的控制中心,利用各种接口和线路连接整个所述实现对一种od客流短时预测方法的各个部分。
[0098]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现一种od客流短时预测方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(smart mediacard,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0099]
其中,所述实现的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计
算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,randomaccess memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0100]
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0101]
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献