一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于k-means聚类的网约车出行时空特性分析方法

2022-12-13 22:02:08 来源:中国专利 TAG:


1.本发明涉及交通运输规划与管理中的公共交通领域,特别涉及一种基于 k-means聚类的网约车出行时空特性分析方法。


背景技术:

2.随着社会经济的日益进步和人们生活水平的不断提高,网约车模式依靠移动大数据技术和互联网技术的使用,提高了乘客的出行舒适度并改善乘客的旅行体验,网约车的发展给出租车行业带来突破性发展。
3.较早的网约车模式主要集中在供需与规划角度、网约车公司和司机本身的理论型探讨,对于起终点时间、经纬度等时空数据结合土地利用或建筑环境的研究考虑较少。直到近年来,随着网约车使用者的数量增加,给交通秩序带来了不可忽视的影响,目前网约车运行所存在的效率不高以及道路网络拥挤等问题开始影响乘客的出行体验。针对网络经济时代下出行者的网约车出行行为,应多从减少道路拥挤、改善道路运行环境等方面出发,结合互联网和大数据挖掘技术发展的治理新模式,挖掘更多时空数据的实践性应用。如何结合土地利用和建筑环境有效地表征城市网约车出行现状,提升网约车的运行效率和优化乘客的出行体验,是当前亟待解决的问题。
4.在已有的出行网约车数据分析和应用中,关于网约车数据的时空分析以及应用还远远不够,相关管理部门往往对于网约车的时空分布特征掌握不足,可视化程度也不高,不能结合土地利用和建筑环境实现可视化的时空联合分布分析和基于载客强度划分的速度时空特征分析。


技术实现要素:

5.发明目的:针对以上问题,本发明目的是提供一种基于k-means聚类的网约车出行时空特性分析方法,以网约车为研究对象,通过基于k-means聚类和时空速度计算数据处理方式表征城市网约车出行现状,实现更好指导城市交通出行的要求,产生的可视化结果也利于对区域情况进行分析。
6.技术方案:本发明的一种基于k-means聚类的网约车出行时空特性分析方法,包括以下步骤:
7.步骤1,采集网约车历史订单数据,对历史订单数据进行预处理剔除异常数据,将预处理后的历史订单数据按照工作日和非工作日各划分到三个特征时段,统计各个特征时段上车需求量和出行频数,根据出行频数将不同特征时段的上车地点进行等级划分;
8.步骤2,根据网约车出行起终点的坐标计算起终点曼哈顿距离,根据曼哈顿距离计算网约车出行od表征速度;
9.步骤3,根据上车地点的等级划分结果确定上车点的需求热点区域,分别对需求热点区域、曼哈顿距离和od表征速度进行k-means聚类分析,划分载客区域强度;
10.步骤4,根据载客区域强度划分网约车的速度时空特征,获得工作日和非工作日网
约车在不同时段、不同运行方向的平均速度,同时段、不同运行方向的平均速度,以及不同时段、同运行方向的平均速度;
11.步骤5,根据需求热点区域、曼哈顿距离和od表征速度的分布情况这三个因素的k均值聚类结果,对网约车出行道路运行状态按照拥挤程度进行等级划分,定位城市各热点区域以及其拥挤程度。
12.进一步,所述步骤1具体包括:将采集到的历史订单数据中的重复数据、行程时间大于1小时、行程起终点经纬度超出研究区域地理坐标范围的订单进行剔除,将工作日和非工作日一天的出行需求划分到早高峰、午高峰和晚高峰三个时间段,统计三个时间段上车需求量和出行频数,采用自然断裂点法将不同特征时段的上车地点进行等级划分。
13.进一步,在步骤2中通过曼哈顿距离和订单数据中行程时间,计算该网约车的出行od表征速度。
14.进一步,所述步骤3具体包括:
15.步骤31,根据上车地点的等级划分结果确定出行需求主要集中的区域,根据区域数量确定需求热点区域的k值;根据行程距离将出行分为长途、中途和短途三种情况,确定曼哈顿距离的k值;以众数、平均数、85%分位数划分od表征速度,确定od表征速度的k值;
16.步骤32,通过k-means聚类确定需求热点区域、曼哈顿距离、od表征速度三个因素的不同聚类中心点,将聚类中心点处的曼哈顿距离作为基准值,根据聚类后每一类中包含的数据个数,按照数量比例确定三个因素中每个聚类的辐射范围;
17.步骤33,根据每个聚类的辐射范围,为需求热点区域、曼哈顿距离、od表征速度三个因素中每个聚类分别绘制影响缓冲区;
18.步骤34,基于三个因素的影响缓冲区依次做相交和裁剪,得到基于每个因素不同影响程度的强度区域,生成载客区域强度。
19.进一步,所述步骤5具体包括:以k均值聚类为依据,以max、mid和min 分别描述研究区域中对网约车的需求程度,根据需求程度和平均od速度将城市交通拥堵状况划分为6个等级,分别是非常拥挤、较拥挤、一般拥挤、通畅、较通畅和非常通畅。
20.有益效果:本发明与现有技术相比,其显著优点是:
21.1、本发明基于联网平台中的交通数据,从时间、空间以及时空联合的角度对网约车出行速度、需求热点区域进行分析,从定性分析到挖掘定量分析数据指标,深入分析居民网约车出行的时空特征与动态出行比例,为网约车出行时空联合分布提供相应的参考方法支撑,具有科学性、准确性、合理性和有效性;
22.2、本发明在出行需求大小、od运行速度、出行位移进行的网约车出行热点区域划分的基础上,对城市道路交通运行状态进行详细的判别,并划分拥堵等级,从宏观上整体把握城市网约车的道路交通网络规律,为城市交通策略的制定和道路运行状态的改进方法提出理论依据;
23.3、本发明中居民网约车出行需求随地块的土地性质而改变,因此可有效帮助交通管理者合理调整交通模式与公共交通运力,提升公共交通的竞争力。
附图说明
24.图1为本发明方法流程图;
25.图2为工作日网约车出行核密度分析热力图;
26.图3为非工作日网约车出行核密度分析热力图;
27.图4为工作日早、午、晚高峰时段出行需求空间分布3d热点图;
28.图5为非工作日早、午、晚高峰时段出行需求空间分布3d热点图;
29.图6为曼哈顿距离计算球面图示意图;
30.图7为需求强度、曼哈顿距离、od速度各因素聚类影响缓冲区示意图;
31.图8为网约车载客强度提取图。
具体实施方式
32.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。
33.如图1,本实施例所述的一种基于k-means聚类的网约车出行时空特性分析方法,该方法包括以下步骤:
34.步骤1,采集网约车历史订单数据,对历史订单数据进行预处理剔除异常数据,将预处理后的历史订单数据按照工作日和非工作日各划分到三个特征时段,统计各个特征时段上车需求量和出行频数,根据出行频数将不同特征时段的上车地点进行等级划分,具体包括:将采集到的历史订单数据中的重复数据、行程时间大于1小时、行程起终点经纬度超出研究区域地理坐标范围的订单进行剔除,将工作日和非工作日一天的出行需求划分到早高峰、午高峰和晚高峰,统计三个时间段上车需求量和出行频数,采用自然断裂点法将不同特征时段的上车地点进行等级划分。
35.步骤2,根据网约车出行起终点的坐标计算起终点曼哈顿距离,根据曼哈顿距离计算网约车出行od表征速度。
36.通过曼哈顿距离和订单数据中行程时间,计算该网约车的出行od表征速度。
37.步骤3,根据上车地点的等级划分结果确定上车点的需求热点区域,分别对需求热点区域、曼哈顿距离和od表征速度进行k-means聚类分析,划分载客区域强度,具体包括:
38.步骤31,根据上车地点的等级划分结果确定出行需求主要集中的区域,根据区域数量确定需求热点区域的k值;根据行程距离将出行分为长途、中途和短途出行,确定曼哈顿距离的k值;以众数、平均数、85%分位数划分od表征速度,确定od表征速度的k值;
39.步骤32,通过k-means聚类确定需求热点区域、曼哈顿距离、od表征速度三个因素不同的聚类中心点,将聚类中心点处的曼哈顿距离作为基准值,根据聚类后每一类中包含的数据个数,按照数量比例确定三个因素中每个聚类的辐射范围;
40.步骤33,根据每个聚类的辐射范围,为需求热点区域、曼哈顿距离、od表征速度三个因素中每个聚类分别绘制影响缓冲区;
41.步骤34,基于三个因素的影响缓冲区依次做相交和裁剪,得到每个因素不同影响程度的强度区域,生成载客区域强度。
42.步骤4,根据载客区域强度划分网约车的速度时空特征,获得工作日和非工作日网约车在不同时段、不同运行方向的平均速度,同时段、不同运行方向的平均速度,以及不同时段、同运行方向的平均速度。
43.步骤5,根据需求热点区域、曼哈顿距离和od表征速度的分布情况这三个因素的k
均值聚类结果,对网约车出行道路运行状态按照拥挤程度进行等级划分和评定,定位城市各热点区域以及其拥挤程度,具体包括:以k均值聚类为依据,以max、mid和min分别描述研究区域中对网约车的需求程度,根据需求程度和平均od速度将城市交通拥堵状况划分为6个等级,分别是非常拥挤、较拥挤、一般拥挤、通畅、较通畅和非常通畅。
44.为了使本技术中所述的网约车出行时空特性分析方法更加清楚明白,以下结合附图及实施例,进行进一步详细说明。本实施例中以成都市滴滴出行网约车为研究对象,所述的一种基于k-means聚类的网约车出行时空特性分析方法,具体包括以下步骤:
45.步骤1,选取盖亚开放数据滴滴平台中成都市2016年11月21日(星期一) 至2016年11月27日(星期日)共1689126条滴滴出行订单数据,剔除重复、行程时间大于1小时及经纬度超出成都市地理坐标范围的异常数据。根据投影计算,采用cgcs2000投影坐标系3度分带的105e,即东经103.5
°
~106.5
°
,并从bbbike网站中抓取成都市.shp格式的gis电子路网地图的路网数据加以辅助定位数据,便于网约车出行数据与电子地图匹配。将工作日和非工作日的一天出行需求划分为早高峰(6:00~10:00)、午高峰(12:00~15:00)和晚高峰(17:00~22:00) 这3个特征时间段,并利用arcgis软件中的spatial analyst工具统计工作日和非工作日3个时间段中的上车需求量。采用自然断裂点法,按照滴滴出行频数大小将不同时段的上车地点分为15个等级。
46.为便于可视化,根据划分的等级结果生成工作日和非工作日的核密度分析热力图,如图2和图3,以及工作日与非工作日三个时段网约车出行需求空间分布热点图,分别如图4和图5所示,确定需求热点区域。其中出行需求空间分布热点图上覆盖地铁、居住、商业等20类用地分布等情况,绘制带有轨道线网和用地分布的核密度热力图,反映网约车乘车需求与城市建筑环境之间的关系。
47.基于工作日出行需求特征的可视化热力图和3个时段的空间分布热点图,可确定早高峰出行热点区域主要分布在二环路内的核心商业圈和北部的核心居民区,北三环附近的居民集中区和旅游景点区也存在出行热点,而四环路以外的工业基地、运动公园等地的需求量较少。午高峰出行热点区域则主要分布在一环内的三大黄金商圈交汇处,峰值高达884人次/小时。在市中心以西北至北二环靠近居住用地的地区也有较大需求量。晚高峰的出行热点区域主要分布在核心办公区、体育中心等娱乐休闲场所和商业购物街区。基于非工作日出行需求特征的可视化热力图和空间分布热点图,发现成都市非工作日各个时间段整体出行总体需求水平低于工作日,但其热点区域分布范围更广。非工作日弹性出行需求远大于工作日,网约车出行的随机因素和偶然因素也较大。
48.步骤2,根据网约车出行起终点的坐标计算起终点曼哈顿距离,通过曼哈顿距离和订单数据中行程时间,计算该网约车的出行od表征速度。
49.如图6所示,假设某趟行程起终点分别为a点和b点,将球坐标系转换成直角坐标系,引入坐标轴上点c(x1,y1,z2)和点d(x1,y2,z2)计算ab之间曼哈顿距离,ab之间的曼哈顿距离可用三段弧长之和表示,即根据弦长公式计算出三段弧长所对应的球心圆心角θ,利用弧长=圆心角*半径可求得每段弧长,三段弧长相加即为每个网约车出行订单的曼哈顿距离。将曼哈顿距离和订单数据中的行程时间结合,以km/h为单位计算出滴滴出行od位置的表征速度。
50.步骤3,以k-means聚类作为核心思想,对需求热点区域、曼哈顿距离覆盖范围、od速度的分布情况这三个因素进行k-means聚类分析并划分载客强度。根据时空分布分析,成都市滴滴网约车出行需求主要集中在锦江区市中心、金牛区南部、成华区西部这3个区域,确定需求热点区域的分类k值为3。将出行距离分为长途、中途、短途三种情况,确定曼哈顿距离的k值为3。对od速度的基本统计分析,以其众数、平均数、85%分位数划分速度范围,确定速度的k值为4。根据正态分布原理和成都市城市道路的限速规则,将速度大于100km/h和低于10km/h的速度异常值剔除。再通过聚类,得到三个因素的不同聚类中心点;将聚类中心处的曼哈顿距离作为基准值,根据聚类后每一类中包含的数据个数。按照数量比例确定三个因素中每个聚类的辐射范围。根据每个聚类的辐射影响范围,利用软件arcgis为三个因素中每个聚类分别绘制影响缓冲区,如图7所示。将三个因素的缓冲区做相交与裁剪,得到每个因素不同影响程度的强度区域,可将其分类设色显示,生成载客区域强度,如图8所示,图8中图例数字代表含义如表1所示。
51.表1图8中的图例数字代表含义
[0052][0053]
步骤4,结合载客区域强度确定网约车出行需求最大的区域为锦江区市中心、金牛区南部、成华区西部。基于载客强度划分进一步对城市网约车的速度时空特征进行分析。选取早、午、晚高峰中各两个代表时间段,即(6:00~7:30), (7:30~9:00),(11:30~13:00),(13:30~15:00),(17:00~18:30),(20:00~21:30),分别统计成都市金牛区上车-锦江区市中心下车、成华区上车-锦江区市中心下车、锦江区市中心上车-金牛区下车、锦江区市中心上车-成华区下车这四个方向在6 个时间段中的网约车出行平均速度,数据如表2所示。
[0054]
表2不同方向不同时段下网约车出行平均速度
[0055][0056]
步骤5,网约车出行需求最大的地方为锦江区市中心、金牛区南部、成华区西部,其
中金牛区、成华区为居民区,锦江区为商业区。因通勤和休闲娱乐的需要,网约车出行订单在这三个地区的交换量也较大。其次以k均值聚类为依据,对城市交通拥堵状况进行划分且生成网约车出行交通状态评价等级划分判别标准表,由于出行曼哈顿距离大部分落在5000m的聚类之内,不再对其区分。同时以市中心区域平均需求88389,成华区西部平均需求78434,金牛区南部平均需求62647,来描述需求程度max、mid、min的情况,如表3所示,道路状态一栏是对该级别的滴滴出行交通拥堵特征进行描述,由聚类知,研究区域不存在需求程度为mid、od速度达57.961和需求程度为min、od速度达57.961这两个区域,故在划分等级时不计入此两类,故最终对城市交通拥堵状况划分为1~6 个等级。该等级数字越大,表示滴滴出行的交通越通畅,划分结果如表2所示。
[0057]
在锦江区市中心的热点区域,可将滴滴出行交通状态评价分为2个等级、4 个区域,包含1类、2类“非常拥挤”以及10类“非常通畅”。成都市中心的锦江区北部为市中心的核心商业区,滴滴出行交通状况为第1类,其需求最大;滴滴出行的平均od速度最低,属于最高需求聚类和最低速度聚类。成都市中心从全天来看,是成都市滴滴出行所处的最拥挤区域,道路运行条件差。在锦江区北部核心区的偏南位置,其滴滴出行交通状况为3类,属于最高需求聚类和较高速度聚类。受市中心商业环境的影响,此处也为市中心外的二类商业圈,滴滴出行需求量大,道路交通中滴滴运行状况较拥挤。锦江区北部核心区的南部大面积区域,其滴滴出行交通状况为第2类,属于最高需求聚类和较低速度聚类。这反映出在市中心核心区的辐射影响下,此处的交通也处于非常拥挤的状态,也是成都市中心居民的核心活动区。在市中心以西南地区,存在一个较小范围的道路特别通畅地区,属于最高需求聚类和最高速度聚类。此处地处武侯区东北部,存在区政府等建筑道路较宽阔,随车流量大,但因其在道路设计方面的举措和交通管理方面政策较好,城市道路布局完善,因此道路运行条件较好。
[0058]
表3网约车出行道路运行状态等级划分结果
[0059][0060]
在金牛区南部的热点区域,可将滴滴出行交通状态评价分为2个等级、3个区域,包含7类、8类“较通畅”和9类“非常通畅”。在金牛区南部的北侧大部分地区,其滴滴出行交通状况为第9类,需求最小;滴滴出行的平均od速度较高,属于最低需求聚类和较高速度聚类。此处多为城郊居民区,也有部分工业园和公司集团,此处道路较宽阔,人流量少,滴滴出行需求小,运行速度较高,道路上滴滴出行的运行处于非常通畅的状态。在金牛区南部的中间地区存在大量居民区和商业区,其滴滴出行交通状况为第7类,属于最低需求聚类和最低速度聚类。成都火车北站位居于此,因成都东站更加强有力的分流,成都北站作为重要交通枢纽,出行客流大,对其他各种交通方式的需求高,导致道路运行条件差,所以对滴滴出行的运行速度产生很大影响,道路上滴滴出行的运行处于较通畅的状态,也使得这里成为金牛区南部三个热点区域中滴滴出行道路运行条件最差的区域。在金牛区南部的南侧存在较多的购物广场、体育馆、酒店、艺术馆、大学校区等,其滴滴出行交通状况为第8类,属于最低需求聚类和较低速度聚类。此处受到市中心商业圈的影响,虽然滴滴出行需求量不大,但作为市中心前往金牛区的居民地带的途径之路,道路上车辆较多,因此滴滴出行的运行速度处于一个较低的水平,整体滴滴出行的运行状态较通畅。
[0061]
在成华区西部的热点区域,可将滴滴出行交通状态评价分为2个等级、3个区域,包含4类、5类“一般拥挤”和6类“通畅”。在成华区西部的西南侧大面积区域,存在公司集团、少量居民区、少量购物广场等。其滴滴出行交通状况为第5类,属于最中等需求聚类和较低速度聚类。成都东站位居此处,高铁线路较多。同时此区域作为市中心商业区前往成华区居民区的要塞,人流量巨大,因而滴滴运行速度也较低,滴滴出行的道路状况整体处于一个不算拥挤的状态。在成华区西部中间偏西的一小部分区域,聚集有大量居民区,也存在购物广场、大学校区等建筑物,其滴滴出行交通状况为第4类,属于最中等需求聚类和最低速度聚
类。居民因通勤对滴滴出行和其他交通方式的需求都很大,道路上车辆聚集,导致道路交通运行条件差,处于一般拥挤状态,导致此处成为成华区西部三个热点区域中滴滴出行道路运行条件最差的区域。在成华区西部的东侧和北侧区域,聚集有少量居民楼,也存在大学校区,其滴滴出行交通状况为第6类,属于最中等需求聚类和较高速度聚类,虽人流量大,但因处于城郊地带,乘坐滴滴前往距离较远的市中心的人群减少,因此滴滴需求量较少。道路较宽阔,同时道路的使用状态良好,因此道路上整体处于通畅的交通状态。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献