一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度聚合神经网络的网约车需求时空热度预测方法与流程

2022-02-20 13:50:50 来源:中国专利 TAG:


1.本发明属于交通时空预测领域,具体提出了基于深度聚合神经网络的网约车需求时空热 度预测方法。


背景技术:

2.随着移动设备的普及和互联网的快速发展,网络预约出租汽车(简称网约车)已成为城 镇居民的主要出行方式之一。面对数量巨大的服务提供者与用户需求,平衡供需分布成为网 约车平台亟待解决的问题。若服务车辆分布与乘客分布差异较大,不但会导致乘客候车时间 长、对平台的服务满意度降低,还会使服务车辆空驶距离增加、运营效率低下、运营利润减 少。如果可用服务车辆被提前调配至需求热度较高区域,则平台的资源利用率和服务质量可 得到显著提升。引导服务车辆的前提为预测不同空间位置在不同时间范围的需求热度,但需 求热度与时间、空间、环境等多种影响因素相关且动态变化,因此预测难度较高。在现实情 况中,进行网约车需求预测问题面临着如下挑战:(1)单一结构的网络较难捕捉时空数据的 关联性;(2)未全面完整地利用时空数据;(3)需求预测还存在空间关联性和环境关联性等 其他复杂因素。由于选择网约车出行有利于缓解城市交通拥堵,对提高交通资源的利用、减 少环境污染具有积极意义,所以实现网约车需求时空热度预测方法是一个重要的研究方向。


技术实现要素:

3.为解决现有技术的不足,提出了基于深度聚合神经网络的网约车需求时空热度预测方法, 实现了网约车需求时空热度的准确预测,包括以下步骤:
4.步骤1:获取相关数据;
5.利用互联网下载网约车订单数据,获取天气数据,通过在线地图api接口,获取城市区 域poi数据;
6.步骤2:数据预处理;
7.对获取到的网约车订单数据、poi数据和天气数据进行预处理,对获取每个时段的时间 特征值和气象特征值统一进行量化处理并统计为外部环境变量xe;获取每个时空网格每个时 段、前一天同一时段、上周同一时段的时空热度值分别为和统计为时空变量xs; 获取每个网格每日的poi数量特征值,统计为空间变量xg,将预处理完后的数据分成训练集 和测试集两部分;
8.步骤3:深度聚合神经网络模型包括依次序连接的一个隐藏层(分别为长短期记忆模型、 卷积长短期记忆模型和卷积神经网络模型)、融合层f1(包括一个reshape层、fusion1层和 fusion2层)、融合层f2,包括以下步骤:
9.步骤3.1:将训练集数据中的外部环境变量、时空变量和空间变量分别输入到长短期记 忆模型、卷积长短期记忆模型和卷积神经网络模型中,融合层f1采用基于参数矩阵的方法对 各个子模型的输出结果进行融合,则不同子模型的输出函数如下:
[0010][0011][0012][0013]
其中,表示外部环境变量的输出向量,分别为时空变量中近周期片段张量、日周期片段张量和周周期片段张量,分别为对应的参数矩阵,分别为空间变量中低密度子图张量,原密度子图和高密度子图,分别为对应的参 数矩阵;
[0014]
步骤3.2:根据步骤3.1得到的三个模型的输出,将模型(1)-模型(3)的输出在融合层 f2按照权重进一步融合,输出层得到的最终结果为:
[0015][0016]
其中,t表示第t时刻,即为当前时刻,we、ws、wg为融合权重,b
t
为偏置;
[0017]
步骤4:误差最小化;
[0018]
模型训练的目标为使预测值与真实值p
t
的均方误差最小化,从而获得上述全部权值w和 偏差b的最优取值,目标函数obj如下所示,其中加入l2范式正则化项以避免过度拟合,α为 平衡参数;
[0019][0020]
步骤5:预测网约车需求;
[0021]
设定的迭代次数为n次,重复步骤3和步骤4,直至精度达到设定阈值,保存训练完成 的网络模型,输入测试集的数据到训练完成的模型中预测网约车需求热度时空;
[0022]
步骤6:计算准确率用于模型评价;
[0023]
采用均方根误差(rmse)和平均绝对误差(mae)计算准确率:
[0024][0025][0026]
其中,n表示样本数量,通过计算真实值和预测值的准确率作为评价标准。
[0027]
有益技术效果
[0028]
本发明提出了基于深度聚合神经网络的网约车需求时空热度预测方法有以下有益技术效 果:
[0029]
1、以不同的子网络模型分别处理外部环境变量、时空变量和空间变量,最后将输出结果 融合,避免了单一神经网络多层堆叠引起梯度消失和梯度爆炸问题,提高了计算效率;
[0030]
2、利用基于周期的时空变量和基于图像点值的空间变量划分方法,缓解了卷积过程中损 失的需求细节,有效解决了周期性和密度差异性对预测结果带来的影响,通过这种方法可以 显著提升网约车需求预测精度;
[0031]
3、利用训练好的模型直接输入数据,得出最终的预测结果,对于网约车需求热度预测过 程是一种简化,预测效率提高。
附图说明
[0032]
图1为网约车需求时空热度预测方法流程图;
[0033]
图2为网约车需求时空热度灰度图像图;
具体实施方式
[0034]
下面结合附图和具体实施方式对本发明做进一步说明:
[0035]
基于深度聚合神经网络的网约车需求时空热度预测方法,如图1所示,包括以下步骤:
[0036]
步骤1:获取相关数据;
[0037]
利用互联网下载滴滴2016年成都网约车订单数据;通过百度地图api接口,获取成都二 环区域poi数据;通过中国天气网获取2016年成都的天气数据;
[0038]
步骤2:数据预处理;
[0039]
步骤2.1:定义数据;
[0040]
步骤2.1.1:定义空间网格;
[0041]
设有给定地理空间区域s,其纬度最大和最小值分别为lat
max
和lat
min
,经度最大和最小 值分别为lng
max
和lng
min
,则该空间区域s可被分割为pxq个二维网格,每个网格称为一个空 间网格s
i,j
,其中且s
i,j
的长度h
lat
=(lat
max-lat
min
)/p,宽度 h
lng
=(lng
max-lng
min
)/q;
[0042]
步骤2.1.2:定义需求;
[0043]
需求rk=(ek,latk,lngk)为乘客k的网约车出行订单,其中ek为乘客需要服务的时间(如 实时出行则ek为当前时间),latk和lngk为乘客出发地纬度和经度,若lat
min
h
lat
(i-1)≤ latk≤lat
min
h
lat
(i 1)且lng
min
h
lng
(j-1)≤lngk≤lng
min
h
lng
(j 1),则需求rk属 于空间网格s
i,j

[0044]
步骤2.1.3:定义时空热度;
[0045]
将一天的24小时分割为等长的δ段,每个时段的长度为24/δ小时,对于 每个空间网格s
i,j
和时段t
l
,其相应的时空需求热度p
i,j,l
可以定义为空间网格s
i,j
中在时段t
l
范 围内的需求数量;
[0046]
步骤2.2:对获取每个时段的时间特征值(不同月份、不同日期、不同星期、不同时间 段、是否为节假日)和气象特征值(最高温度、最低温度、当前温度、天气情况、风力等级、 空气污染指数)统一进行量化处理并统计为外部环境变量xe;获取每个时空网格每个时段、 前一天同一时段、上周同一时段的时空热度值分别为和制成16x16的灰度图像统 计为时空变量xs;获取每个网格每日的poi(美食、酒店、医院、商场、景点、运动健身、 休闲娱乐、小区、学校、火车站、飞机场、企业、政府机构)数量特征值,制成16x16的灰 度图像统计为空间变量xg,将预处理完后的数据分成训练集和测试集两部分;
[0047]
步骤3:深度聚合神经网络模型包括依次序连接的一个隐藏层(分别为长短期记忆模型、 卷积长短期记忆模型和卷积神经网络模型)、融合层f1(包括一个reshape层、
fusionl层和 fusion2层)、融合层f2;
[0048]
1)长短期记忆模型由3个隐藏层组成;
[0049]
a)隐藏层lstm1,隐藏单元数512;
[0050]
b)隐藏层lstm2,隐藏单元数256;
[0051]
c)隐藏层lstm3,隐藏单元数128;
[0052]
2)卷积长短期记忆模型由四个隐藏层组成;
[0053]
a)convlstm1层,隐藏单元数256,,卷积核个数32,卷积核大小3*3,无填充;
[0054]
b)convlstm2层,隐藏单元数128,,卷积核个数32,卷积核大小3*3,无填充;
[0055]
c)convlstm3层,隐藏单元数64,,卷积核个数32,卷积核大小3*3,无填充,
[0056]
d)conv3d层,卷积核个数1,卷积核大小3*3*3,无填充;
[0057]
3)卷积神经网络模型由6个隐藏层组成;
[0058]
a)卷积层conv1,步长为1,卷积核个数32,卷积核大小3*3,无填充;
[0059]
b)最大池化层maxpool1,步长为1,卷积核个数1,卷积核大小3*3,无填充;
[0060]
c)卷积层conv2,步长为1,卷积核个数64,卷积核大小3*3,无填充;
[0061]
d)池化层maxpool2,步长为1,卷积核个数1,卷积核大小3*3,无填充;
[0062]
e)卷积层conv3,步长为1,卷积核个数128,卷积核大小3*3,无填充;
[0063]
f)池化层maxpool3,步长为1,卷积核个数1,卷积核大小3*3,无填充;
[0064]
3)reshape层,将长短期记忆模型输出的一维向量转化为二维张量;
[0065]
4)fusion1层,将卷积长短期记忆模型三个输出结果按照参数矩阵的方式进行融合,输 出为二维张量;
[0066]
5)fusion2层,将卷积神经网络模型三个输出结果按照参数矩阵的方式进行融合,转化 为二维张量;
[0067]
6)f2层,将f1层的三个输出结果按照权重的方式融合,得到最终结果;
[0068]
步骤3.1:数据特征提取;
[0069]
步骤3.1.1:将训练集数据中的外部环境变量xe,输入到长短期记忆模型,输出向量记 为对于每个步长t,其迭代和计算过程如下所示:
[0070]dt
=σ(w
xd
x
t
w
ydyt-1
bd)
ꢀꢀ
(1)
[0071][0072]
p
t
=σ(w
xp
x
t
w
ypyt-1
b
p
)
ꢀꢀ
(3)
[0073][0074]qt
=σ(w
xq
x
t
w
yqyt-1
bq)
ꢀꢀ
(5)
[0075][0076]
定当前时刻为t,x
t
为输入的外部环境变量,y
t
为输出状态值,为记忆单元,p
t
为输入 门状态值,d
t
为遗忘门状态值,q
t
为输出门状态值,σ(x)和tanh(x)为非线性主动函数;
[0077]
步骤3.1.2:由步骤3.1.1可得t
l
时段不同区域s
i,j
的时空热度p
i,j,l
,令 将每个时段t
l
的时空热度s
l
转化为图像矩阵xs,然后依据周期性特
点将 xs划分为当前时刻前一时段前一天同时段和上周同时段的历史数据,即 将时空变量xs输入到卷积长短期记忆模型中,输出张量记为和卷积长短期记忆的计算过程与长短期记忆类似,其具体公式如下:
[0078]it
=σ(w
xi
*x
t
w
hi
*h
t-1
w
ci
*c
t-1
bi)
ꢀꢀ
(7)
[0079]ft
=σ(w
xf
*x
t
w
hf
*h
t-1
w
cf
*c
t-1
bf)
ꢀꢀ
(8)
[0080][0081]ot
=σ(w
xo
*x
t
w
ho
*h
t-1
w
co
*c
t-1
bo)
ꢀꢀꢀꢀꢀꢀ
(10)
[0082][0083]
假定当前时刻为t,x
t
表示时空需求热度输入张量,h
t
表示输出张量,c
t
表示记忆同量, i
t
表示输入门张量,f
t
表示遗忘门张量,o
t
表示输出门张量,表示hadamard乘法,*表示卷 积操作,w为卷积核,b为相应偏置;
[0084]
步骤3.1.3:将原始poi热度图xg划分为三个通道分别进行卷积处理,包括:低密度子 图(只保留poi数量小于θ的值)、原密度子图(原始值全部保留)和高密度子图(只 保留poi数量大于θ的值),θ为给定的poi数量值,输出张量记为和
[0085]
步骤3.2:通过步骤3.1得到三个子模型的输出,由于不同维度对于时空热度的影响程 度不同,因此在融合层f1本方法采用基于参数矩阵的方法对各个子模型的输出结果进行融合, 则不同子模型的输出结果如下:
[0086][0087][0088][0089]
其中,分别为时空变量中近周期片段、日周期片段和周周期片段的参数 矩阵,分别为空间变量中低密度子图,原密度子图和高密度子图参数矩阵;
[0090]
步骤3.3、根据步骤3.2得到的三个模型的输出,将这三个模型的输出在融合层f2按照 权重进一步融合,得到最终结果:
[0091][0092]
t表示第t时刻,即为当前时刻,we、ws、wg为融合权重,b
t
为偏置;
[0093]
步骤4、误差最小化;
[0094]
模型训练的目标为使预测值与真实值p
t
的均方误差最小化,从而获得步骤3.3中全部权 值w和偏差b的最优取值,目标函数obj为:
[0095][0096]
其中,加入l2范式正则化项以避免过度拟合,α为平衡参数,p
t
为真实值,为预测 值;
[0097]
步骤5:预测网约车需求;
[0098]
设定的迭代次数为n次,重复步骤3、4,直至精度达到设定的阈值24,保存训练完成的 网络模型,输入测试集的数据到训练完成的模型中,如图2所示,预测网约车需求时空热
度;
[0099]
步骤6:计算准确率用于模型评价;
[0100]
采用均方误差(mse)和均方误差(rmse)计算准确率:
[0101][0102][0103]
其中,n表示样本数量,通过计算真实值和预测值的准确率作为评价标准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献