一种利用网约车订单数据动态预测乘客等候时长的方法

2022-06-01 10:06:22 来源：中国专利 TAG：

1.本发明属于交通运输技术领域。可根据网约车用户的订单数据动态预测特定区域的乘客约车等候时长，为城市居民出行提供信息服务。

背景技术：

2.网约车已成为老百姓出行的常用交通工具，采用订单预约方式可以让乘客提前知晓预约车辆还有多长时间可以到达指定上车位置，大大减少了乘客提前到达上车地点的等候时间，提升了乘客出行的体验。但是，司机接单的时间预测往往难度较大，例如在交通枢纽机场、火车站等地，居住聚集区早高峰上班时段，就业聚集区晚高峰下班时段，经常出现长时间无司机接单，导致乘客等候时长无法预估等问题。事实上司机接单需要时长的影响因素很多，如出行时段在早高峰、平峰、晚高峰、夜间等，用地类型是居住、办公、商业、枢纽等，最近时段的预约订单数量、完成订单数量、历史订单负荷度等，这些因素交织在一起，综合影响着司机的接单排队时长。因此，本专利通过历史统计数据，对影响乘客等待的综合时间进行预测。

技术实现要素：

3.本发明提供一种利用网约车订单数据动态预测乘客等候时长的方法，为利用网约车订单数据推测任意情况下的等候时长，帮助乘客做出决策奠定了基础，方法分为两部分，过程如下：
4.一是建立朴素贝叶斯分类器，利用一定量的训练样本，计算乘客某类等候时长状态的概率以及发生某类停留状态时特征参数值(用车时段，用地类型，乘客所在网格i最近t分钟的预约订单数量、完成订单数量和累积负荷度)发生的概率；二是利用朴素贝叶斯分类器对网约车订单数据等候时长状态判别，先对数据进行预处理，确定每名乘客对应的网格，计算各个特征参数的值，最后利用建立好的朴素贝叶斯分类器，计算各类等候时长发生的条件概率，判断乘客等候时长状态的类别归属。
5.本方法包括以下步骤：
6.步骤1：构建乘客等候时长状态集合w，w可根据乘客日常的乘车等候感受进行划分w＝{w1,w2,w3,...wk}，其中wk表示等候时长的大小，k值越大，等候时间越长；
7.步骤2：城市道路网格划分，将城市路网按经度和纬度划分为m
×
n的网格地图，则区域的集合可表示为：
8.a＝{i1×1,i1×2,i1×3...i1×n,i2×1...im×n}
9.其中i表示m
×
n区域中某一个子区域。
10.步骤3：对数据进行预处理，网约车订单接收数据字段包括订单号、乘客下单时间、乘客用车地点经纬度、目的地经纬度、订单类型，单次运营数据记录了乘客乘坐网约车出行的完整信息，包括乘客下单时间、上车时间、下车时间，出发地点、到达地点；根据每条记录的唯一订单号，保留乘客的下单时间，上车时间、乘客用车地点经纬度、出发地点信息；若订
单未完成则仅保留经纬度和用车时间，上车时间减去下单时间即为用户的等候时间；根据乘客用车地点经纬度，与步骤一中所划分的网格进行匹配，确定每名乘客所处的网格i；
11.步骤3：计算特征参数，包括用车时段t，用地类型l，乘客所在网格i最近t分钟的预约订单数量qs、完成订单数量qc和累积负荷度g，过程如下：
12.(1)用车时段用来表示用户用车的时间特征，构建用车时段集合t＝{t1,t2,t3,t4}，将全天24小时划分为四个时段，t1为早高峰时段，t2为平峰时段，t3为晚高峰时段，t4为夜间时段。根据用户的下单时间确定用户的用车时段t；
13.(2)用地类型表示用户所属网格的用地属性特征，构建用地类型集合l＝{l1,l2,l3,l4,l5}，l1代表居住用地，l2代表办公用地，l3代表商业用地，l4代表交通枢纽用地，l5代表其它用地类型。确定每一个网格i的用地类型；
14.(3)乘客所在网格i最近t分钟的预约订单数量用截止乘客下单前t分钟内，所有预约订单的数量qs表示。其中即包括顺利完成的订单，也包括取消或违约的订单；
15.(4)乘客所在网格i最近t分钟的预约订单数量用截止乘客下单前t分钟内，所有完成订单的数量qc表示；
16.(5)累积负荷度指乘客下单日期前连续j天，同一区域和时段(乘客所在网格i最近t分钟)，所有完成订单的数量与所有预约订单的数量的比值；描述了截止乘客下单前t分钟内该区域整体订单完成程度，累积负荷度表示为其中j表示乘客用车日期前j天，q
sj
表示乘客用车日期前j天同一时段预约订单的数量qs，q
cj
表示乘客用车日期前j天同一时段完成订单的数量qc；
17.步骤4：建立面向不同类别的朴素贝叶斯分类器，分类器的关键指标计算过程如下：
18.(1)假定有一定样本量的r数据，用于训练分类器，已先验掌握其订单完成情况和等候时间，其中等候时间能够由顺利完成订单的乘客上车时间减去下单时间得到，定义特征属性集合d，它包括乘客用车时段t、用地类型l、预约订单数量qs、完成订单数量qc、累积负荷度g；
19.(2)针对任意一乘客数据，分别计算处于某类等候时长的概率(2)针对任意一乘客数据，分别计算处于某类等候时长的概率表示等候时长为wk的记录数量，q表示训练样本的总数量；
20.(3)计算每一类等候时长状态下不同用车时段t发生的离散概率(3)计算每一类等候时长状态下不同用车时段t发生的离散概率表示训练样本中，等候时长为wk的状态下停车时段为ti的样本量；计算每一类等候时长状态下用地类型l发生的离散概率状态下用地类型l发生的离散概率表示训练样本中，等候时长为wk状态下用地类型为li的样本量；计算每一类等候时长状态下预约订单数量qs发生的离散概率率表示训练样本中，等候时长为wk状态下预约订单数量为q
si
的样本量；计算每一类等候时长状态下完成订单数量qc发生的离散概率发生的离散概率表示训练样本中，等候时长为wk状态下完成订单数量为q
ci
的样本量；计算每一类等候时
长状态下累积负荷度g发生的离散概率长状态下累积负荷度g发生的离散概率表示训练样本中，等候时长为wk状态下累积负荷度为gi的样本量；
21.步骤5：计算r归属于每一类等候时长状态的概率pi(wk|ti,li,q
si
,q
ci
,gi)，表示乘客i，在用车时段为ti，用地类型为li，预约订单数量为q
si
，完成订单数量为q
ci
，累积负荷度为gi的条件下，乘客等候时长为wk的概率，计算过程如下：
[0022][0023]
其中：pd＝p(ti)
·
p(li)
·
p(q
si
)
·
p(q
ci
)
·
p(gi)，p(ti)表示用车时段为ti的概率，p(li)表示用地类型为li的概率，p(q
si
)表示预约订单数量为q
si
的概率，p(q
ci
)表示完成订单数量为q
ci
的概率，p(gi)表示累积负荷度为gi的概率，其它符号意义同前；
[0024]
步骤6：比较各等候时长状态下pi(wk|ti,li,q
si
,q
ci
,gi)值大小，最大者对应的等候时长状态wk为最终判断的乘客等候时长状态；
[0025]
该发明的基础数据来源于网约车app，通过建立朴素贝叶斯分类器，可快速、准确地预测网约车乘客的等候时长，帮助乘客做出决策。
附图说明
[0026]
图1.本方法的实施流程
具体实施方式
[0027]
以一个用户产生的手机定位数据为例进行说明。
[0028]
步骤1：构建乘客等候时长状态集合w，w根据乘客日常的乘车等候感受进行划分为w＝{w1,w2,w3}，其中0≤w1《5分钟，表示等候时长为短；5≤w2《15分钟，表示等候时长为长；w3≥15分钟，表示等候时长为更长。
[0029]
步骤2：城市道路网格划分，将城市路网按经度和纬度划分为m
×
n的网格地图，则区域的集合可表示为：
[0030]
l＝{i1×1,i1×2,i1×3...i1×n,i2×1...im×n}
[0031]
其中i表示m
×
n区域中某一个子区域；
[0032]
步骤3：对数据进行预处理，网约车订单接收数据字段包括订单号、乘客下单时间、乘客用车地点经纬度、目的地经纬度、订单类型、司机id，如表1所示；单次运营数据记录了乘客乘坐网约车出行的完整信息，包括乘客下单时间、上车时间、下车时间，出发地点、到达地点、订单时间、司机id、平台简称，如表2所示，根据每条记录的唯一订单号，保留乘客的下单时间，上车时间、乘客用车地点经纬度、出发地点信息，若订单未完成则仅保留经纬度和用车时间，上车时间减去下单时间即为用户的等候时间；根据乘客用车地点经纬度，与步骤一中所划分的网格进行匹配，确定每名乘客所处的网格i，如表3所示；
[0033]
表1：订单接收数据字段
[0034]
字段含义字段含义order_no订单号destination目的地passenger_tel乘客电话dest_lon目的地经度
use_locale乘客用车地点dest_lat目的地纬度use_lon乘客用车地点经度bespeaktype订单类型use_lat乘客用车地点纬度driveridcode司机idorder_time乘客下单时间data_source平台简称
[0035]
表2：单次运营数据字段
[0036]
字段含义字段含义orderno订单号ontime乘客实际上车时间passenger_tel乘客电话offtime乘客实际下车时间real_vehicle_lon车辆实际出发地点经度order_time订单时间real_vehicle_lat车辆实际出发地点纬度driveridcode司机iddest_veh_lon车辆实际到达地点经度data_source平台简称dest_veh_lat车辆实际到达地点纬度
ꢀꢀ
[0037]
表3：样本数据
[0038]
[0039][0040]
步骤3：计算特征参数，包括用车时段t，用地类型l，乘客所在网格i最近t分钟的预约订单数量qs、完成订单数量qc和累积负荷度g，过程如下：
[0041]
(1)计算用车时段，构建用车时段集合t＝{t1,t2,t3,t4}，将全天24小时划分为四个时段，t1为早高峰时段7:00-9:00，t2为平峰时段9:00-17:00，t3为晚高峰时段17:00-19:00，t4为夜间时段19:00-7:00(第二天)。例如订单号10的用户，下单时间为9:26，用车时段为t2平峰。
[0042]
(2)确定用地类型，构建用地类型集合l＝{l1,l2,l3,l4,l5}，l1代表居住用地，l2代表办公用地，l3代表商业用地，l4代表交通枢纽用地，l5代表其它用地类型，确定每一个网格i的用地类型；
[0043]
(3)计算乘客所在网格i最近15分钟的预约订单数量qs，其中即包括顺利完成的订单，也包括取消或违约的订单，例如订单号10的用户，预约订单的数量qs为7；
[0044]
(4)计算乘客所在网格i最近15分钟的完成订单数量qc，例如订单号10的用户，预约订单的数量qc为5。
[0045]
(5)计算累积负荷度，指乘客下单日期前连续7天，同一区域和时段(乘客所在网格i最近15分钟)，所有完成订单的数量与所有预约订单的数量的比值，累积负荷度表示为其中j表示乘客用车日期前j天，q
sj
表示乘客用车日期前j天同一时段预约订单的数量qs，q
cj
表示乘客用车日期前j天同一时段完成订单的数量qc，例如订单号10的用户，当日的负荷度为5/7＝0.71，假设前6相同时段的负荷度分别为0.83,1,0.92,0.77,0.87,0.73，那么累计负荷度
[0046]
步骤4：建立面向不同类别的朴素贝叶斯分类器，分类器的关键指标计算过程如下：
[0047]
(1)假定有10000个样本，用于训练分类器，已先验掌握其等候时间，该数据能够由顺利完成订单的乘客上车时间减去下单时间得到，定义特征属性集合d，它包括乘客用车时段t、用地类型l、预约订单数量qs、完成订单数量qc、累积负荷度g；
[0048]
(2)针对任意一乘客数据，分别计算处于某类等候时长的概率，等候
时长为w1的样本共6000个，等候时长为w2的样本共3000个，等候时长为w3的样本共1000个。那么处于等候时长w1的概率为处于等候时长w2的概率为处于等候时长w3的概率为
[0049]
(3)计算每一类等候时长状态下不同用车时段t发生的离散概率(3)计算每一类等候时长状态下不同用车时段t发生的离散概率表示训练样本中，等候时长为wk的状态下停车时段为ti的样本量，见表4；计算每一类等候时长状态下用地类型land发生的离散概率候时长状态下用地类型land发生的离散概率表示训练样本中，等候时长为wk状态下用地类型为li的样本量，见表5；计算每一类等候时长状态下预约订单数量qs发生的离散概率发生的离散概率表示训练样本中，等候时长为wk状态下预约订单数量为q
si
的样本量，见表6；计算每一类等候时长状态下完成订单数量qc发生的离散概率发生的离散概率表示训练样本中，等候时长为wk状态下完成订单数量为q
ci
的样本量，见表7；计算每一类等候时长状态下累积负荷度g发生的离散概率本量，见表7；计算每一类等候时长状态下累积负荷度g发生的离散概率表示训练样本中，等候时长为wk状态下累积负荷度为gi的样本量，见表8；
[0050]
表4：不同等候时长状态下不同用车时段t发生的离散概率
[0051][0052][0053]
表5：不同等候时长状态下不同用地类型l发生的离散概率
[0054]
lp(l|w1)p(l|w2)p(l|w3)居住用地0.130.120.18办公用地0.170.210.14商业用地0.10.210.33交通枢纽用地0.530.330.24其它用地0.070.130.11
[0055]
表6：不同等候时长状态下不同约订单数量qs发生的离散概率
[0056]qs
p(qs|w1)p(qs|w2)p(qs|w3)10.0220.0160.00120.0110.0310.00330.0420.0290.011
40.0540.0410.02550.1100.0850.04460.1570.1330.07270.1530.1710.05580.0870.0970.07590.0650.0530.045100.0540.0690.065110.0460.0410.071120.0350.0450.096130.0530.0350.084140.0440.0650.12150.0260.0450.075160.0090.0150.056170.0110.0080.014180.0140.0120.028190.0050.0030.026200.0020.0060.034
[0057]
表7：不同等候时长状态下不同完成订单数量qc发生的离散概率
[0058]
qcp(qc|w1)p(qc|w2)p(qc|w2)10.0080.0110.00520.0110.0140.00730.0240.0270.01840.0440.0470.03450.0920.080.06860.1430.1310.10770.1640.1220.10980.1160.1740.1190.0910.0840.068100.0500.0610.058110.0760.0410.064120.0280.0460.062130.0470.0330.065140.0220.0340.071150.0370.0480.051160.0130.0250.035170.0140.0110.014180.0110.0080.02190.0050.0020.015200.0040.0010.019
[0059]
表8：不同等候时长状态下不同累积负荷度g发生的离散概率
[0060]
[0061][0062]
步骤5：计算r归属于每一类等候时长状态的概率pi(wk|ti,li,q
si
,q
ci
,gi)，表示乘客i，在用车时段为ti，用地类型为li，预约订单数量为q
si
，完成订单数量为q
ci
，累积负荷度为gi的条件下，乘客等候时长为wk的概率。假设现在有一乘客的订单接收数据，计算得知其用车时段t为t2平峰时段，用地类型为l3商业用地，乘客所在网格i最近15分钟的预约订单数
量qs为7，完成订单数量qs为5，累积负荷度g为4.2，则计算过程如下：
[0063][0064][0065][0066]
其中：pd＝p(ti)
·
p(li)
·
p(q
si
)
·
p(q
ci
)
·
p(gi)，p(ti)表示用车时段为ti的概率，p(li)表示用地类型为li的概率，p(q
si
)表示预约订单数量为q
si
的概率，p(q
ci
)表示完成订单数量为q
ci
的概率，p(gi)表示累积负荷度为gi的概率，其它符号意义同前。
[0067]
步骤6：比较各等候时长状态下pi(wk|ti,li,q
si
,q
ci
,gi)值大小，pi(w1|ti,li,q
si
,q
ci
,gi)最大，最终判断该乘客等候时长状态为w1。
[0068]
最后应说明的是：以上示例仅用以说明本发明而并非限制本发明所描述的技术方案；因此，尽管本说明书参照上述的示例对本发明已进行了详细的说明，但是，本领域的普通技术人员应当理解，仍然可以对本发明进行修改或等同替换；而一切不脱离发明的精神和范围的技术方案及其改进，其均应涵盖在本发明的权利要求范围当中。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于语义理解的对话质量分析方法、装置、设备和介质与流程

一种利用网约车订单数据动态预测乘客等候时长的方法

相关文献

最热文献