一种基于高速公路通行数据的通勤车辆识别方法与流程

2022-12-06 22:54:51 来源：中国专利 TAG：

1.本发明涉及智能交通领域，尤其涉及一种基于高速公路通行数据的通勤车辆识别方法。

背景技术：

2.近年来，随着中国经济快速发展，我国大部分中心城市的经济影响力不断提高、对外辐射扩散的范围也在不断的扩大。特大城市的城镇化进程趋近饱和，产业经济和城市功能外溢，中心城区带动都市圈、大中小城市和小城镇协调联动发展的格局逐渐形成。同时，随着交通基础设施建设的不断加强，尤其是高速公路的建设完善，区域与区域之间的空间距离得到极大压缩。通勤是城市生活的重要组成部分，随着人们居住地和工作地之间的空间跨度不断扩大，通勤方式变得多样化。
3.城市通勤模式能够反映城市规划和交通服务水平，然而，目前关于通勤的研究主要集中在城市的中心城区，很少有针对高速公路的通勤模式研究。不同于只在中心城区覆盖较广的公共交通，高速公路的覆盖范围更广，并且能够极大程度上压缩两地之间的通行耗时。高速公路背后的通勤模式，能够从宏观层面上为理解城市空间与居民活动的依存关系与发展规律提供参考。同时，在都市圈一体化发展不断深入的背景下，是否建成1小时通勤圈被视为都市圈一体化的重要标志，高速公路也是其中重要的一环。而这背后的关键，首先得识别高速公路上的通勤者。

技术实现要素：

4.有鉴于此，本发明的目的之一是提供一种基于高速公路通行数据的通勤车辆识别方法。利用通勤车辆行程的规律性，并结合通勤车辆的出行特征，建立相应的通勤车辆识别模型，识别通勤车辆。
5.本发明的目的之一是通过以下技术方案实现的：
6.该种基于高速公路通行数据的通勤车辆识别方法，所述方法包括：
7.步骤s1：确定所要研究的时间范围及研究车辆类别，提取相应车辆在时间范围内的所有完整行程数据，作为研究的基础数据；
8.步骤s2：计算车辆的出行特征，根据车辆的出行特征，剔除不符合通勤特征的车辆；根据od一致性原则，对每辆车的行程进行分组，并且利用dbscan聚类算法，对车辆的每一组行程进行聚类，识别出规律行程；
9.步骤s3：针对车辆规律行程及计算得到的出行特征进行规则判定，符合所提出全部规则的车辆即为高速公路通勤车辆。
10.进一步，在步骤1中，提取车辆行程数据具体包括以下步骤：
11.步骤s11:在高速公路通行数据中，筛选入站和出站字段都存在的通行记录，得到车辆的完整行程；
12.步骤12：筛选出入站时间和出站时间都位于研究时间范围所有通行记录；
13.步骤13:在步骤12筛选出的数据中，进一步筛选出通行数据中指定车辆类别的所有记录，作为基础数据集，基础数据集中，每条记录即为车辆的一次完整行程，记录了车辆id、入口收费站id、入站时间、出口收费站id、出站时间。
14.进一步，所述步骤s2具体分为以下步骤：
15.步骤s21：计算基础数据集中每辆车的出行特征；
16.步骤s22：剔除总行程数少于设定次数或者日均行程数大于设定次数的车辆；
17.步骤s23：在剩余的数据集中，将每辆车的行程依据是否具有相同的“入口收费站-出口收费站”进行分组；
18.步骤s24:利用dbscan算法对每一组od行程进行时间上的聚类，可将这些行程聚合为k个不相交的簇{ck|k＝0,1,2,...,k}，其中
19.对于一个簇ck＝{tr1,...,tr
l
}，簇中的任意两条行程1≤i,j≤l，有|tri.t
o-trj.to|≤ε；其中，l是第k个簇中的行程数目，l≥p，p为能够形成一个簇的最少行程数，ε为簇的半径；
20.一个簇ck中的所有行程可以用一条规律行程rtrk来表示，其中，
21.进一步，所述步骤s21具体为：
22.步骤s211：计算车辆的总行程数n；
23.步骤s212：计算车辆的日均行程数其中，n
days
表示车辆出行的总天数。
24.进一步，所述步骤s3具体可分为以下步骤：
25.步骤s31:对具有规律行程的车辆，统计行程间隔时间tri；
26.步骤s32：对具有规律行程的车辆，统计其在工作日非高峰时段非规律行程占比其中qn表示车辆在工作日的非规律行程数，q
nr
表示qn中的非高峰行程数；
27.步骤s33:确定通勤者的具体过程如下：基于具有规律行程的车辆，以如下规则作为判定条件，满足所有规则的车辆则判定为通勤者；
28.规则i：车辆的行程平均时间间隔小时。
29.规则ii：车辆在工作日非高峰时段非规律行程占比p
nr
≤0.5。
30.规则iii：车辆至少有一条规律通勤行程，规律通勤行程是指满足其出/入站时间在早高峰时段或者其出/入站时间在晚高峰时段的规律行程。
31.进一步，所述步骤s31中，行程间隔时间tri的具体计算方式为，给定一辆车一天的行程集合，按照入口时间升序排列，{tr1,tr2,...,trk},tri.to＜trj.to,1≤i＜j≤k，可以得到k-1个tri，其中trii＝tri.t
o-tr
i-1
.td,2≤i≤k，计算车辆行程平均时间间隔其中m为遍历车辆所有天的行程之后得到的tri个数。
32.本发明的目的之二是提供一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如前所述的方法。
33.本发明的目的之三是提供一种计算机可读存储介质，其上储存有计算机程序，所述计算机程序被处理器执行时实现如前所述的方法。
34.本发明的有益效果是：本发明的方法首先利用通勤车辆应该具备的出行特征，剔除了出行次数过少或过多的车辆，减少了不必要的计算。之后利用通勤车辆行程的规律性，得到车辆的规律行程，并基于规律行程进行通勤者判别，本发明的方法相较于单纯基于特征的通勤者判别方法，不仅能够识别出通勤者，还能得出车辆的通勤行程，为后续高速公路通勤模式的研究奠定了基础。
35.本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和前述的权利要求书来实现和获得。
附图说明
36.为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：
37.图1为描述识别高速公路通勤车辆的流程图；
38.图2为描述提取规律行程的示意图。
具体实施方式
39.以下将参照附图，对本发明的优选实施例进行详细的描述。应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。
40.本发明的流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
41.在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。
42.本发明的基于高速公路通行数据的通勤车辆识别方法，包括以下步骤：
43.步骤s1：确定所要研究的时间范围及研究车辆类别，提取相应车辆在时间范围内的所有完整行程数据，作为研究的基础数据；在步骤1中，提取车辆行程数据具体包括以下步骤：
44.步骤s11:在高速公路通行数据中，筛选入站和出站字段都存在的通行记录，得到
车辆的完整行程；
45.步骤12：筛选出入站时间和出站时间都位于研究时间范围所有通行记录；
46.步骤13:在步骤12筛选出的数据中，进一步筛选出通行数据中指定车辆类别的所有记录，作为基础数据集，基础数据集中，每条记录即为车辆的一次完整行程
47.tr＝(veh
id
,tollstaiono,to,tollstationd,td)，记录了车辆id(veh
id
)、入口收费站id(tollstaiono)、入站时间(to)、出口收费站id(tollstationd)、出站时间(td)。
48.步骤s2：计算车辆的出行特征，根据车辆的出行特征，剔除不符合通勤特征的车辆；根据od一致性原则，对每辆车的行程进行分组，并且利用dbscan聚类算法，对车辆的每一组行程进行聚类，识别出规律行程；进一步的，具体分为以下步骤：
49.步骤s21：计算基础数据集中每辆车的出行特征；具体为：
50.步骤s211：计算车辆的总行程数n；
51.步骤s212：计算车辆的日均行程数其中，n
days
表示车辆出行的总天数。
52.步骤s22：剔除总行程数少于设定次数或者日均行程数大于设定次数的车辆；该次数根据实际使用的情况进行设定，比如“剔除总行程数少于3次或者日均行程数大于5次的车辆”。
53.步骤s23：在剩余的数据集中，将每辆车的行程依据是否具有相同的“入口收费站-出口收费站”进行分组；
54.步骤s24:利用dbscan算法对每一组od行程进行时间上的聚类，可将这些行程聚合为k个不相交的簇{ck|k＝0,1,2,...,k}，其中
55.对于一个簇ck＝{tr1,...,tr
l
}，簇中的任意两条行程1≤i,j≤l，有|tri.t
o-trj.to|≤ε；其中，l是第k个簇中的行程数目，l≥p，p为能够形成一个簇的最少行程数，ε为簇的半径；
56.一个簇ck中的所有行程可以用一条规律行程rtrk来表示，其中，
57.步骤s3：针对车辆规律行程及计算得到的出行特征进行规则判定，符合所提出全部规则的车辆即为高速公路通勤车辆。具体可分为以下步骤：
58.步骤s31:对具有规律行程的车辆，统计行程间隔时间tri；进一步的，行程间隔时间tri的具体计算方式为，给定一辆车一天的行程集合，按照入口时间升序排列，
59.{tr1,tr2,...,trk},tri.to＜trj.to,1≤i＜j≤k，可以得到k-1个tri，其中
60.trii＝tri.t
o-tr
i-1
.td,2≤i≤k，计算车辆行程平均时间间隔其中m为遍历车辆所有天的行程之后得到的tri个数。
61.步骤s32：对具有规律行程的车辆，统计其在工作日非高峰时段非规律行程占比其中qn表示车辆在工作日的非规律行程数，q
nr
表示qn中的非高峰行程
数；
62.步骤s33:确定通勤者的具体过程如下：基于具有规律行程的车辆，以如下规则作为判定条件，满足所有规则的车辆则判定为通勤者；
63.规则i：车辆的行程平均时间间隔小时。
64.规则ii：车辆在工作日非高峰时段非规律行程占比p
nr
≤0.5。
65.规则iii：车辆至少有一条规律通勤行程，规律通勤行程是指满足其出/入站时间在早高峰时段或者其出/入站时间在晚高峰时段的规律行程。
66.为使观者能够更深入的理解本发明的技术方案，以下将结合现有的数据资料提供一个具体应用的实施例。
67.在本实施例中，采用的数据是某市高速公路通行数据，具有数据量大、信息量广、包含时空信息等特点，可以从中提取相关数据信息用于研究分析。高速公路通信数据中包含多个字段，根据本发明的需要，对原始通行数据进行预处理，保留研究字段包括：车辆id、入/出口收费站编号、入/出站时间，车辆类别。另外，高速公路通行数据中，将9座及以下的车辆类别划分为“一型客车”，其他类别的车辆不在我们研究对象范围内。因此，在步骤12筛选出的数据中，进一步筛选出通行数据中车辆类别为“一型客车”的所有记录，有效字段结构表如表1所示。
68.步骤s1：基于研究字段，“一型客车”车辆类别字段的值为1，筛选出车辆类别值为1且入/出站时间在研究时间范围内的数据。
69.表1高速公路通行数据有效字段结构表
70.字段名称字段含义字段示例veh
id
车辆标识id渝a0*****to车辆通过入口收费站的时间2021-07-05 08:03:47tollstationo车辆通过的入口收费站id50011905td车辆通过出口收费站的时间2021-07-05 08:17:03tollstationd车辆通过的出口收费站id50011906veh
type
车辆的类别，1标识一型客车1
71.本发明初始数据为2021年7月3日至2021年7月30日共计四周的高速公路完整通行数据。对车辆类别进行筛选后，得到共计得到16827817条行程记录，涉及2707048辆车。
72.步骤s21：计算车辆的通行特征，删除总行程数少于3或者日均行程数大于5次的车辆的所有行程记录。剩余的车辆行程记录中，将每辆车的行程记录按照入站时间升序排列。下面以一辆“一型客车”车的行程记录为例进行说明。
73.表2示例车辆行程记录
74.[0075][0076]
步骤s22：将该车辆的所有行程记录按照od进行分组。根据车辆的行程记录，可以得到两组od行程组数据。其中，od为“50013004-50013010”的包含序号1、3、5、7、9、11的行程记录。od为“50013010-50013004”的包含序号2、4、6、8、10、12的行程记录。
[0077]
步骤s23：利用dbscan算法，对每一组od行程进行时间上的聚类，选定聚类半径ε＝120，最小密度阈值p＝3。将每一组od行程的入口时间转换为分钟数，作为聚类算法的输入，如od为“50013004-50013010”的输入为(846,472,467,465,472,461),聚类得到一个簇c1＝{472,467,465,472,461}，即序号为3、5、7、9、11的行程为一个簇，簇中的行程用一条规律行程表示，入/出口时间为簇中行程入/出口时间的平均值，rtr1＝('渝a0****','07:47',50013004,'08:33',50013010)。同时，od为“50013004-50013010”的行程组中，序号为1的行程记录不属于任何一个簇，该行程即为一条非规律行程。同理，另一条规律行程为rtr2＝('渝a0****','17:20',50013010,'18:08',50013004)。
[0078]
步骤s3：计算车辆的平均行程时间间隔以及工作日非高峰时段非规律行程占比。结合这两个特征以及规律行程，利用规则进行通勤车辆的识别。
[0079]
步骤s31：对具有规律行程的车辆，首先统计行程时间间隔。所给示例车辆只在7月26号有两次行程，行程tr1的出口时间为506，行程tr2的入口时间为1016，可以得到一个行程时间间隔tri＝1016-506＝510分钟，平均行程间隔时间
[0080]
步骤s32：设置早高峰时间段为06:00-9:00，晚高峰时间段为17:00-19:00。根据步骤23的聚类结果，所给示例车辆序号为1的行程为非规律行程，该行程位于周末，则qn＝0,p
nr
＝0。
[0081]
步骤s33：根据车辆的规律行程以及基于行程所计算出的特征值，进行规则判断。其中，车辆的平均行程时间间隔为510分钟，大于6小时，满足规则1。车辆在工作日非高峰时段非规律行程的占比为0，满足规则2。同时，车辆有两条规律行程，第一条规律行程的出/入站时间都位于早高峰时段，另一条规律行程的出/如站时间都位于晚高峰时段，该车辆有两条通勤行程，满足规则3。示例车辆同时满足所提出的三条规则，则被判定为通勤车辆。
[0082]
应当认识到，本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现，其
中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而，若需要，该程序可以以汇编或机器语言实现。在任何情况下，该语言可以是编译或解释的语言。此外，为此目的该程序能够在编程的专用集成电路上运行。
[0083]
此外，可按任何合适的顺序来执行本文描述的过程的操作，除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行，并且可作为共同地在一个或多个处理器上执行的代码(例如，可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
[0084]
进一步，所述方法可以在可操作地连接至合适的任何类型的计算平台中实现，包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现，无论是可移动的还是集成至计算平台，如硬盘、光学读取和/或写入存储介质、ram、rom等，使得其可由可编程计算机读取，当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外，机器可读代码，或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时，本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时，本发明还包括计算机本身。
[0085]
最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：自动代客泊车管理系统以及自动代客泊车管理方法与流程

一种基于高速公路通行数据的通勤车辆识别方法与流程

相关文献

最热文献