基于重载货车GPS轨迹识别停留点的方法、系统及介质与流程

2022-12-06 22:41:10 来源：中国专利 TAG：

基于重载货车gps轨迹识别停留点的方法、系统及介质
技术领域
1.本发明涉及轨迹停留点识别技术领域，尤其涉及一种基于重载货车gps轨迹识别停留点的方法、系统及介质。

背景技术：

2.随着全国机动车辆的与日俱增，道路上的交通拥堵成了亟待解决的问题。相比于其他种类车辆，重载货车在行驶过程中易形成停留点，且在某些区域停留时间较长，这些停留点扩散后会对周边交通产生影响，造成局部区域拥堵，为交通事故埋下隐患。随着具有车辆gps定位的移动设备的普及和使用，gps轨迹分析如停留点识别、轨迹还原等相关技术备受关注。
3.重载货车载货量较多、体积大、速度较低，在某些地方容易聚集形成停留点，这些停留点扩大以后对整个区域影响非常大，这也是交通事故发生的诱因。重载货车gps轨迹数据覆盖范围广，重载货车轨迹数据量较大，但是对重载货车的gps轨迹数据的采集不精准，导致重载货车车辆不能得到有效的监控。
4.有鉴于此，有必要提供一种基于重载货车gps轨迹识别停留点的方法、系统及介质。

技术实现要素：

5.本技术的主要目的在于提供一种基于重载货车gps轨迹识别停留点的方法、系统及介质，以解决对重载货车的gps轨迹数据的采集不精准，导致重载货车车辆不能得到有效的监控的技术问题。
6.为实现上述目的，本发明的一实施例中的一种基于重载货车gps轨迹识别停留点的方法，包括s1，获取重载货车gps规范轨迹数据，重载货车gps规范轨迹数据包括车辆id、车辆id对应的行程的当前时间戳、车辆id对应的实时的车辆经纬度坐标、车辆id对应的车辆瞬时车速、车辆id对应的车辆当前位置相对于当前行程的起始时间节点位置的行驶距离；其中，同一车辆的重载货车gps规范轨迹数据保存在同一文件内；s2，根据同一文件中当前时间戳依据时间序列进行对重载货车gps规范轨迹数据重新排序，根据车辆的车辆瞬时车速和行驶距离对车辆id对应的车辆行驶行程进行划分获取当前行程的终点，作为行程的起终点记录；s3，根据车辆同一行程的起终点记录获取同一行程段内的重载货车gps规范轨迹数据中的停留点；s4，根据简单均值聚类方法对同一行程的停留点计算得出停留中心点；s5，基于重载货车所有的停留中心点识别重点停留区域。
7.进一步地，步骤s4具体包括：根据重载货车车辆瞬时车速和速度阈值确定车速度划分点，若车辆瞬时车速小于速度阈值且持续时长大于规定时间阈值则确定该数据记录为当前行程段的车速划分点，作为车速停留点备选集合；根据重载货车车速划分点从重载货车gps规范轨迹数据中筛选出多个车速停留点备选集合，并取每个车速停留点备选集合的经纬度平均值作为车速停留点备选集合的停留中心点；根据重载货车行驶距离和距离阈值
确定车辆行程距离划分点，若车辆行驶距离大于距离阈值时则确定该数据记录为行程段的距离划分点，作为距离停留点备选集合；根据重载货车行程距离划分点从重载货车gps规范轨迹数据中筛选出多个距离停留点备选集合，并取每个距离停留点备选集合的经纬度平均值作为距离停留点备选集合的停留中心点；将重载货车所有的车速停留中心点和距离停留中心点，作为重载货车的停留中心点。
8.进一步地，步骤s5具体包括：s51，依据每辆重载货车的停留中心点，将停留中心点的经度和纬度作为公式的输入值，计算出各个样本数据k与聚类中心vi之间的加权距离平方之和q，其中，表示第i个聚类中的样本k到聚类中心vi之间的距离，而u
k,
表示第i个聚类中样本k的隶属度，m表示模糊加权指数(m≥1)，c表示聚类数据的总数，n表示样本数据的总数；s52，根据日常经验和管理需求预设重点停留区域个数a，算法迭代停止阈值ε、重点停留区域的聚类中心vi以及算法允许的最大迭代次数t；s53，将重点停留区域个数a、迭代停止阈值ε、最大迭代次数t根据车辆隶属度矩阵u迭代公式进行各个停留中心点与重点停留区域的聚类中心隶属度的关系迭代，并输出隶属度矩阵u，其中，u
k,i
表示第i个聚类中的样本k的隶属度，r为聚类类别数，d
k,i
表示第i个聚类中的样本k到其所属的聚类中心vi之间的距离，d
k,s
表示第s个聚类中的样本k到各个聚类中心vs之间的距离；s54，基于隶属度矩阵u根据公式迭代计算重点停留区域的聚类中心vi，并输出各个重点停留区域的聚类中心vi的经纬度信息，其中，n为样本数据的总数；s55，当迭代计算达到停止阈值ε或最大迭代次数t时，聚类算法终止，输出隶属度矩阵u和聚类中心vi，隶属度矩阵u可以得到每个停留中心点所属于的重点停留区域编号以及每个重点停留区域的经纬度信息，若没有达到停止阈值ε或最大迭代次数t时，则执行步骤s51进行新一轮迭代。
9.进一步地，步骤s5之后还包括：根据预设的重要阈值以及车辆密度对所述重点停留区域划分不同区域；若所述重点停留区域的车辆密度等于或大于所述重要阈值，则将所述重点停留区域划分为高风险区域；若所述重点停留区域的车辆密度小于所述重要阈值，则将所述重点停留区域划分为低风险区域。
10.进一步地，步骤s1之前还包括：获取重载货车gps初始数据；根据预设的重载货车gps异常数据清洗原则，清洗重载货车gps初始数据中的异常数据，得到重载货车的gps规范轨迹数据；其中，重载货车gps异常数据清洗原则包括删除完全重复数据、关键字段无效数据。
11.本发明还提出一种基于重载货车gps轨迹识别停留点的系统，系统包括存储器、处理器、以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述任一项所述的一种基于重载货车gps轨迹识别停留点的方法的步骤。
12.本发明还提出一种存储介质，存储介质存储有计算机程序，计算机程序被处理器执行时实现如上述任一项所述的一种基于重载货车gps轨迹识别停留点的方法的步骤。
13.与现有技术相比，本发明具有以下优点：
14.本技术基于重载货车车辆gps轨迹数据，将其出行轨迹进行采集、处理形成规范数据，并根据停留点的特征深入挖掘车辆行程上的停留位置点，从而对重载货车重点停留区域进行识别，并通过fcm聚类算法挖掘重点停留区域内货车交通变化规律，根据货车密度对重点停留区域进行风险判断，为道路管理部门对热点区域内部及周边实行交通管控提供依据，减少区域交通拥堵的发生，提高货物运输效率。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。
16.图1为本发明的一种基于重载货车gps轨迹识别停留点的方法的流程示意图；
17.图2为本发明的重载货车gps轨迹数据采集的原理结构图；
18.图3为一个实施例中计算机设备的内部结构图。
19.本发明目的的实现、功能特点及优点将结合实施方式，参照附图做进一步说明。
具体实施方式
20.下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本发明的一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。
21.需要说明，本发明实施方式中所有方向性指示(诸如上、下
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。
22.另外，在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
23.并且，本发明各个实施方式之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。
24.请参阅附图1，本发明提供了一种基于重载货车gps轨迹识别停留点的方法，包括如下步骤：
25.s1，获取重载货车gps规范轨迹数据，重载货车gps规范轨迹数据包括车辆id、车辆id对应的行程的当前时间戳、车辆id对应的实时的车辆经纬度坐标、车辆id对应的车辆瞬时车速、车辆id对应的车辆当前位置相对于当前行程的起始时间节点位置的行驶距离；其中，同一车辆的重载货车gps规范轨迹数据保存在同一文件内；
26.可以理解地，载重货车gps数据的采集原理如图2所示，通过无线通信网把货车与信息控制中心连接起来。载重货车车载gps设备由三部分组成，分别为gps接收器、数据处理及存储器、无线通信接收及发射装备。信息控制中心负责接收并处理来自卫星传回的数据，
其数据处理与分析软件是由服务器与gps信息数据库两部分组成。gps全球定位系统的货载终端能够根据需求设置固定的请求频率，从而可以实现对货运车辆的实时监控。卫星系统发射回的信息包括货车车牌号、时间、经纬度、方向角、当下速度，所有的数据均存放于信息控制中心。gps数据采集不同于传统的路段线圈数据采集，此方法能够全天候识别货车的运行状态，从而更好地对货运车辆进行实时监控，保障货运车辆的安全行驶，进一步减少了交通事故的发生。
27.具体的，研究所用数据为重载货车车辆gps定位数据，其包含车牌号、经度、纬度、gps时间等18个字段，如表1所示。
28.表1重载货车车辆gps定位数据
[0029][0030]
s2，根据同一文件中当前时间戳依据时间序列进行对重载货车gps规范轨迹数据重新排序，根据车辆的车辆瞬时车速和行驶距离对车辆id对应的车辆行驶行程进行划分获取当前行程的终点，作为行程的起终点记录；
[0031]
可以理解地，首先根据时间戳依据时间序列将同一文件中的重载货车gps规范轨迹数据重新进行排序，然后根据车辆的瞬时车速、行驶距离以及时间差对车辆id对应的车辆行驶行程进行划分，瞬时速度为物体在某一时刻或经过某一位置时的速度，该时刻相邻的无限短时间内的位移与通过这段位移所用时间的比值，且瞬时速度是理想状态下的速度，所以本领域技术人员采用的是载重货车的瞬时车速。根据车辆的车辆瞬时车速和行驶距离对车辆id对应的车辆行驶行程进行划分获取当前行程的终点，作为行程的起终点记
录。
[0032]
s3，根据车辆同一行程的起终点记录获取同一行程段内的重载货车gps规范轨迹数据中的停留点；
[0033]
可以理解地，重载货车的停留点不仅是货运车辆一趟行程的终点，亦是下一趟行程的起点，因此重载货车的停留点则需要从货车车辆每个行程的起终点切入，在本技术中，本领域技术人员将根据时间阈值、速度阈值与距离阈值作为判断条件从车辆同一行程的起始点记录中筛选出同一行程段内的重载货车的停留点。
[0034]
s4，根据简单均值聚类方法对同一行程的停留点计算得出停留中心点；具体的，根据简单均值聚类方法将同一行程的停留点的经纬度数值进行计算，得到经纬度数值的平均值，并根据经纬度数值的平均值得出载重货车的所有停留中心点。
[0035]
s5，基于重载货车所有的停留中心点识别重点停留区域。
[0036]
可以理解地，通过对载重货车众多的停留中心点集合进行密度聚类分析，从而得到重载货车车辆的停留规律以及重点停留区域，为道路管理部门提供对重载普货车辆停留的管理区域范围及重要程度、交通管控手段提供数据依据，减少区域交通拥堵的发生，提高货物运输效率。
[0037]
进一步地，步骤s4具体包括：根据重载货车车速和速度阈值确定车速度划分点，若车辆车速小于速度阈值且连续大于规定时间则确定该数据记录为行程段的车速划分点，作为车速停留点备选集合；根据重载货车车速划分点从重载货车gps规范轨迹数据中筛选出多个车速停留点备选集合，并取每个车速停留点备选集合的经纬度平均值作为车速停留点备选集合的车速停留中心点；根据重载货车行驶距离和距离阈值确定车辆行程距离划分点，若车辆行驶距离大于距离阈值时则确定该数据记录为行程段的距离划分点，作为距离停留点备选集合；根据重载货车行程距离划分点从重载货车gps规范轨迹数据中筛选出多个距离停留点备选集合，并取每个距离停留点备选集合的经纬度平均值作为距离停留点备选集合的距离停留中心点；将重载货车所有的车速停留中心点和距离停留中心点，作为重载货车的停留中心点。
[0038]
可以理解地，在一段路程中，可以根据重载货车车速和速度阈值确定车速度划分点，若车辆车速小于速度阈值且连续大于规定时间阈值则确定该数据记录为行程段的车速划分点，作为车速停留点备选集合，并作为一个样本数据；然后根据样本数据从重载货车gps规范轨迹数据中筛选出多个车速停留点备选集合，并取每个车速停留点备选集合的经纬度平均值作为车速停留点备选集合的车速停留中心点；例如，在一段路程中，有10个载重货车的车辆车速小于速度阈值且连续大于规定时间则确定该数据记录为行程段的车速划分点，并且将这10个车速划分点作为作为重载货车的一个车速停留点备选集合，然后从重载货车gps规范轨迹数据中筛选出多个车速停留点备选集合，然后通过取多个车速停留点备选集合的经纬度平均值，将得出的平均值作为车速停留点备选集合的车速停留中心点。
[0039]
具体的，再根据重载货车行驶距离和距离阈值确定车辆行程距离划分点，若车辆行驶距离大于距离阈值时则确定该数据记录为行程段的距离划分点，作为距离停留点备选集合；根据重载货车行程距离划分点从重载货车gps规范轨迹数据中筛选出多个距离停留点备选集合，并取每个距离停留点备选集合的经纬度平均值作为距离停留点备选集合的距离停留中心点；例如，重载货车的行驶距离为16千米，距离阈值为15千米，此时载重货车的
行驶距离大于距离阈值，则将此时的数据记录作为此行程段的距离划分点，并设置作为距离停留点备选集合，并取每个距离停留点备选集合的经纬度平均值作为距离停留点备选集合的距离停留中心点。最后将重载货车所有的车速停留中心点和距离停留中心点，作为重载货车最终的停留中心点。
[0040]
进一步地，步骤s5具体包括：s51，依据每辆重载货车的停留中心点，将停留中心点的经度和纬度作为公式的输入值，计算出各个样本数据k与聚类中心vi之间的加权距离平方之和q，其中表示第i个聚类中的样本xk到聚类中心vi之间的距离，而u
k,
表示第i个聚类中样本xk的隶属度，m表示模糊加权指数(m≥1)，c表示聚类数据的总数，n表示样本数据的总数。具体的，每个样本到聚类中心的加权距离平方之和最小时，聚类算法达到最优，并且公式根据硬c-均值聚类算法的目标函数推广而成，其中，模糊加权指数的值过大或过小都会将直接影响算法的性能。
[0041]
s52，根据日常经验和管理需求预设重点停留区域个数a，算法迭代停止阈值ε、重点停留区域的聚类中心vi以及算法允许的最大迭代次数t；
[0042]
s53，将重点停留区域个数a、迭代停止阈值ε、最大迭代次数t根据车辆隶属度矩阵u迭代公式进行各个停留中心点与重点停留区域的聚类中心隶属度的关系迭代，并输出隶属度矩阵u，其中，u
k,
表示第i个聚类中的样本k的隶属度，r为聚类类别数，d
k,i
表示第i个聚类中的样本k到其所属的聚类中心vi之间的距离，d
k,s
表示第s个聚类中的样本k到各个聚类中心vs之间的距离；
[0043]
s54，基于隶属度矩阵u根据公式迭代计算重点停留区域的聚类中心vi，并输出各个重点停留区域的聚类中心vi的经纬度信息，其中，n为样本数据的总数；
[0044]
s55，当迭代计算达到停止阈值ε或最大迭代次数t时，聚类算法终止，输出隶属度矩阵u和聚类中心vi，隶属度矩阵u可以得到每个停留中心点所属于的重点停留区域编号以及每个重点停留区域的经纬度信息，若没有达到停止阈值ε或最大迭代次数t时，则执行步骤s51进行新一轮迭代。
[0045]
可以理解地，聚类算法中的聚类从字面理解就是人类将具有相同特征的事物汇集在一起，它的对象是输入的点数据或者向量坐标，使用聚类算法可以将这些数据中具有相似特征的数据划分为同一个特定簇。而不同簇之间的数据样本应该具有高度区分性和不相似性。比如：把含有n个样本的数据集x＝{x1,x2,
…
,xn},划分成为b个子集，其中2≤b≤n，然后通过尽可能多的步骤迭代循环，使相似的数据尽可能划分在同一组里，不具有相似特征的样本数据尽可能划分在不同的组里。
[0046]
具体的，在本技术中使用聚类分析的方法将车辆停留点根据隐含的变化规律分成多个内部具有相同或相似规律的单独子样本集，使得模型能更好的从子样本集中抓住总样本数据的的特征及变化规律，从而提高识别效果。
[0047]
进一步地，步骤s5之后还包括：根据预设的重要阈值以及车辆密度对所述重点停
留区域划分不同区域；若所述重点停留区域的车辆密度等于或大于所述重要阈值，则将所述重点停留区域划分为高风险区域；若所述重点停留区域的车辆密度小于所述重要阈值，则将所述重点停留区域划分为低风险区域。
[0048]
可以理解地，通过算法得到的每个停留中心所属的重点停留区域及每个重点停留区域的经纬度信息，并通过gis可视化分析出每个重点停留区域内的停留中心的数量及密度分布情况，将重点停留区域根据预设的重要阈值划分为不同的风险区域，为道路管理部门对热点区域内部及周边实行交通管控提供依据，减少区域交通拥堵的发生，提高货物运输效率。
[0049]
进一步地，步骤s1之前还包括：获取重载货车gps初始数据；根据预设的重载货车gps异常数据清洗原则，清洗重载货车gps初始数据中的异常数据，获取重载货车的gps规范轨迹数据；其中，重载货车gps异常数据清洗原则包括删除完全重复数据、关键字段无效数据。
[0050]
可以理解地，货运车辆gps数据采集的整个过程中，可能会受到大气云层、恶劣极端天气、隧道区域、大型建筑物等影响信号的障碍物、传输及存储错误等诸多因素的影响，再加上人为方面操作的错误以及gps采集设备终端不够稳定等原因，采集到的货运车辆原始gps数据会存在部分异常数据，这些gps异常数据与正常采集到的真实数据相差较多，无法反映出货运车辆的真实运行状态。如果不对原始数据中的异常数据进行处理分析，会对货车停留点提取的精确度造成一定的影响，且对后面货车热点区域的识别带来极大的难度。因此，需要制定适当的方法对异常数据进行清洗，提高数据的可用率。如，本技术通过对三个月的货运车辆gps数据进行数据清洗，例如三个月原始货车gps数据容量为4t，数据记录数约280亿条，经过数据清洗流程后，得到的有效数据数据量约为260亿条，有效数据占比约为93％，异常数据占比约为7％。通过分析可以看出货车gps数据整体质量较好，经过清洗后的货车gps数据能够进一步提高货车停留点识别的精确度。
[0051]
具体的，通过对货车原始gps数据总结分析，共总结出几大类异常数据。本技术按照原始货车gps异常数据的表现形式，制定原始货车gps异常数据清洗原则，如下所示：异常数据形式1：完全重复数据，即两个或两个以上的数据关键字段完全重复的情形。货车原始数据中存在关键字段完全相同的多条记录，产生这种情况的原因是货车gps设备在传输过程中将同一条记录上传多次，导致出现多条字段完全相同的记录，这种数据只选取一条记录即可反映货运车辆的运行状态，因此对这种异常数据的清洗原则是只保存一条有效记录，对其余重复记录进行删除。
[0052]
异常数据形式2：同一车辆在同一时间点采集到多条不同的数据，即数据采集时间字段两个或两个以上的数据关键字段完全重复的情形。同辆货车同一时间会采集到两条以上的数据，从经纬度的字段看，货车的经纬度值较为接近，并且在速度方面也十分接近。从原则上来讲，同辆货车同一时间理应采集一条数据，所以从多条数据中任意选择一条数据均可以反映出货运车辆的运行状态。但是从数据处理的实现角度看，选择第一条数据反映货车此时刻的运行状态最容易实现。所以，对于此类货车gps异常数据，将保留第一条数据作为有效数据。
[0053]
异常数据形式3：同辆货车在一趟行程中gps数据经纬度数值保持不变，但是车辆的速度字段却不为0km/h。车辆的经纬度数值没有变化，说明货运车辆一直停留在某个地
点，并没有发生运动状态的改变，但是此时记录的车辆速度不为零，因此判断此类异常数据形式，制定的清洗原则是删除该类数据。
[0054]
异常数据形式4：货车gps关键字段不在合理范围内。如货车行程中记录的速度过大，明显超出货车自身的性能指标；记录中的方向角失效：方位角超过实际限制范围等。因此针对此类异常数据形式，制定的清洗原则记录剔除速度字段不在0到120km/h范围内的数据，剔除方位角不在0
°
到360
°
范围内的数据。
[0055]
本发明还提出一种基于重载货车gps轨迹识别停留点的系统，包括存储器、处理器、以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述任一项所述的一种基于重载货车gps轨迹识别停留点的方法的步骤。在本发明的具体实施例中，计算系统的处理器执行计算机程序时实现上述的基于重载货车gps轨迹识别停留点的方法的步骤，通过重载货车车辆gps轨迹数据，将其出行轨迹进行采集、处理形成规范数据，并根据停留点的特征深入挖掘车辆行程上的停留位置点，从而对重载货车重点停留区域进行识别，并通过fcm聚类算法挖掘重点停留区域内货车交通变化规律，根据货车密度对重点停留区域进行风险判断，为道路管理部门对热点区域内部及周边实行交通管控提供依据，减少区域交通拥堵的发生，提高货物运输效率。
[0056]
本发明还提出一种存储介质，存储介质存储有计算机程序，计算机程序被处理器执行时实现如上述任一项所述的一种基于重载货车gps轨迹识别停留点的方法的步骤。在本发明的具体实施例中，计算机可读存储介质中存储的计算机程序被处理器执行时可以实现上述的一种基于重载货车gps轨迹识别停留点的方法的步骤，通过重载货车车辆gps轨迹数据，将其出行轨迹进行采集、处理形成规范数据，并根据停留点的特征深入挖掘车辆行程上的停留位置点，从而对重载货车重点停留区域进行识别，并通过fcm聚类算法挖掘重点停留区域内货车交通变化规律，根据货车密度对重点停留区域进行风险判断，为道路管理部门对热点区域内部及周边实行交通管控提供依据，减少区域交通拥堵的发生，提高货物运输效率。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

基于重载货车GPS轨迹识别停留点的方法、系统及介质与流程

相关文献

最热文献