一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种车辆城市行驶轨迹与行驶行为的聚类方法与流程

2022-07-22 23:55:45 来源:中国专利 TAG:


1.本发明涉及数据挖掘技术领域,尤其涉及一种车辆城市行驶轨迹与行驶行为的聚类方法。


背景技术:

2.随着车载定位终端的普及和道路上采集设备的安装完善,城市中对不同种类车辆的管理和对交通的优化方法的细化成为了可能。车载定位的轨迹数据是附着时间与运动特征的空间点位,道路采集设备的轨迹数据是附着时间与图形特征的固定空间点位,综合两种信息可以基本描述出车辆的所有状态,可以分析推测出大量有关行为信息和人员信息。
3.对车辆轨迹的挖掘有助于对城市交通进行分类,以便根据不同类别分别进行诱导和管理,同时可以对于特定行驶特征进行及时的报警和锁定保证道路安全。对交通系统的规划管理和公安系统的预警和追踪有着极高的价值。
4.传统对于轨迹数据的聚类方法中,多关心对于整条轨迹的起止点的空间分布特征,其中起止点单纯以天为单位或者以单次行进做为单位划分并不能合理的突出某一行为的特征;其中关心的空间分布特征多以欧式距离作为衡量标准且因为海量轨迹量导致计算量巨大且不考虑到时间与运动特征,因此很难对行驶特征进行高效的提取。


技术实现要素:

5.有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种车辆城市行驶轨迹与行驶行为的聚类方法,该方法在实用性上根据城市道路特点对轨迹进行了简化从而大大提高了计算效率,同时对传统的长度轨迹数据分析问题进行了合理分解从而得到更多的轨迹特征。该方法在计算上优化了编辑距离算法使得特定场景下距离计算更加准确。
6.为实现上述目的,本发明提供了一种车辆城市行驶轨迹与行驶行为的聚类方法,包括以下步骤:
7.步骤一、对轨迹简化再对转角点进行提取;
8.步骤二、对转角点进行聚类处理,并构建时空索引;
9.步骤三、使用步骤二得到的索引编译轨迹样本得到轨迹编码;
10.步骤四、定义轨迹编码的距离参数;
11.步骤五、在不同维度下对轨迹进行聚类分析。
12.进一步的,所述对轨迹简化再对转角点进行提取,具体包括:
13.s11、依据时间顺序连接样本车辆单日行驶轨迹使得点数据变为线数据,再使用道格拉斯普克法简化轨迹;所述道格拉斯普克法将待处理曲线的首末点连一条直线,求所有中间点与直线的距离,并找出最大距离值d
max
,用d
max
与抽稀阈值t
dp
相比较:若d
max
小于t
dp
,这条曲线上的中间点全部舍去;若d
max
大于等于t
dp
,则以该点为界,把曲线分为两部分;对这两部分曲线重复上述过程,直至所有的点都被处理完成;
14.s12、对于简化后的轨迹点,依据时间顺序依次计算检查点与下个检查点形成线段
的方向角,与上个检查点与检查点的方向角求差,方向角差大于转角阈值t
turn
则认为是转角点并保存为转角点集n
turn

15.s13、对于未简化后的轨迹点,依据时间顺序检查每一个点,累加每个点与上一个点的速度变化差特征、方向变化差特征、两点距离特征,当遇到简化结果点时,将累加的数据存入转角点集n
turn
的字段中,并且累加值归零重新累加,重复该操作直到检查到最后一个点结束。
16.进一步的,所述对转角点进行聚类处理,并构建时空索引,具体为:
17.s21、定义适合城市道路的扫描半径r,定义最小包含点数pt
min
=2,对点集n
turn
使用基于密度的聚类方法dbscan聚类出簇集c
turn
,依据均值计算得到每个簇的中心点,得到点转角点聚类集p
turn
,同时清空点集n
turn

18.s22、使用四叉树法对转角点聚类集p
turn
构建索引i
turn
,直到点集中的每个点都存在单独的叶子结点上,记录最小的空间分辨率t
dis
,分别对转角点聚类集p
turn
中点的经度和纬度由低到高进行排序,依据排序顺序组成点的编号pi=[a,b]。
[0019]
进一步的,所述使用步骤二得到的索引编译轨迹样本得到轨迹编码,具体为:
[0020]
s31、对单条轨迹同样进行步骤一转角点提取将得到的转角点,根据空间索引i
turn
取得转角点在转角点聚类集p
turn
中的最近点,如果最近点距离小于等于索引的最小空间分辨率t
dis
则取最近点的编号为转角编号,如果大于则记录转角点到点集n
turn
同时取最近点的编号为转角编号,依据时间顺序依次计算编号并连接,将轨迹抽象为编号字符串;
[0021]
s32、当点集n
turn
中数值大于更新阈值n
update
时重复步骤二。
[0022]
进一步的,所述定义轨迹编码的距离参数,具体为:
[0023]
s41、根据s31所得到的每条轨迹的编号字符串,计算轨迹间的编辑距离,计算两个字符串之间的编辑距离edit distance edit
a,b
的方法为:
[0024][0025]
其中i、j分别为字符串a和字符串b的前i、j个字符,其中t的表达式为:
[0026][0027]
s42、根据s31所得到的每条轨迹的编号字符串,计算最长公共子串lcs,计算两个字符串之间的编辑距离最长公共子串lcs的方法为:
[0028][0029]
lcs
a,b
=max(lcs
a,b
(i,j))
[0030]
其中i、j分别为字符串a和字符串b的第i、j个字符;
[0031]
s43、计算得到的最长公共子串,分割为单独的一条轨迹编号字符串,依据最长公共子串的编号取得s13得到的运动特征,计算速度距离dv=|d
va-d
vb
|、方向距离dd=|d
da-d
db
|、空间距离ds=|d
sa-d
sb
|;
[0032]
s44、对步骤四所得的所有距离进行归一化处理;
[0033][0034]
进一步的,所述在不同维度下对轨迹进行聚类分析,具体为:
[0035]
s51、在单纯计算轨迹聚类的场景下,使用步骤s41、s42得到的编辑距离进行基于密度的聚类;
[0036]
s52、在识别驾驶员聚类的场景下,计算综合距离进行基于密度的聚类,其中综合距离计算方法为:
[0037]
速度距离、方向距离、空间距离的方差分别为:
[0038][0039]
计算得到综合距离权重为:
[0040][0041]
综合距离计算得:
[0042]
d=[edit
a,b d
v d
d ds]*w。
[0043]
本发明的有益效果是:
[0044]
本发明的方法在实用性上根据城市道路特点对轨迹进行了简化从而大大提高了计算效率,同时对传统的长度轨迹数据分析问题进行了合理分解从而得到更多的轨迹特征。该方法在计算上优化了编辑距离算法使得特定场景下距离计算更加准确。
[0045]
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
[0046]
图1是本发明的概要方法流程图。
[0047]
图2是本发明的具体方法流程图
具体实施方式
[0048]
如图1、2所示,本发明提供了一种车辆城市行驶轨迹与行驶行为的聚类方法,包括以下步骤:
[0049]
步骤一、对轨迹简化再对转角点进行提取;
[0050]
步骤二、对转角点进行聚类处理,并构建时空索引;
[0051]
步骤三、使用步骤二得到的索引编译轨迹样本得到轨迹编码;
[0052]
步骤四、定义轨迹编码的距离参数;
[0053]
步骤五、在不同维度下对轨迹进行聚类分析。
[0054]
本实施例中,对轨迹简化再对转角点进行提取,具体包括:
[0055]
s11、依据时间顺序连接样本车辆单日行驶轨迹使得点数据变为线数据,再使用道格拉斯普克法简化轨迹;道格拉斯普克法将待处理曲线的首末点连一条直线,求所有中间点与直线的距离,并找出最大距离值d
max
,用d
max
与抽稀阈值t
dp
相比较:若d
max
小于t
dp
,这条曲线上的中间点全部舍去;若d
max
大于等于t
dp
,则以该点为界,把曲线分为两部分;对这两部分曲线重复上述过程,直至所有的点都被处理完成;
[0056]
s12、对于简化后的轨迹点,依据时间顺序依次计算检查点与下个检查点形成线段的方向角,与上个检查点与检查点的方向角求差,方向角差大于转角阈值t
turn
则认为是转角点并保存为转角点集n
turn

[0057]
s13、对于未简化后的轨迹点,依据时间顺序检查每一个点,累加每个点与上一个点的速度变化差特征、方向变化差特征、两点距离特征,当遇到简化结果点时,将累加的数据存入转角点集n
turn
的字段中,并且累加值归零重新累加,重复该操作直到检查到最后一个点结束。
[0058]
本实施例中,对转角点进行聚类处理,并构建时空索引,具体为:
[0059]
s21、定义适合城市道路的扫描半径r,定义最小包含点数pt
min
=2,对点集n
turn
使用基于密度的聚类方法dbscan聚类出簇集c
turn
,依据均值计算得到每个簇的中心点,得到点转角点聚类集p
turn
,同时清空点集n
turn

[0060]
s22、使用四叉树法对转角点聚类集p
turn
构建索引i
turn
,直到点集中的每个点都存在单独的叶子结点上,记录最小的空间分辨率t
dis
,分别对转角点聚类集p
turn
中点的经度和纬度由低到高进行排序,依据排序顺序组成点的编号pi=[a,b]。
[0061]
本实施例中,使用步骤二得到的索引编译轨迹样本得到轨迹编码,具体为:
[0062]
s31、对单条轨迹同样进行步骤一转角点提取将得到的转角点,根据空间索引i
turn
取得转角点在转角点聚类集p
turn
中的最近点,如果最近点距离小于等于索引的最小空间分辨率t
dis
则取最近点的编号为转角编号,如果大于则记录转角点到点集n
turn
同时取最近点的编号为转角编号,依据时间顺序依次计算编号并连接,将轨迹抽象为编号字符串;
[0063]
s32、当点集n
turn
中数值大于更新阈值n
update
时重复步骤二。
[0064]
本实施例中,定义轨迹编码的距离参数,具体为:
[0065]
s41、根据s31所得到的每条轨迹的编号字符串,计算轨迹间的编辑距离,计算两个字符串之间的编辑距离edit distance edit
a,b
的方法为:
[0066][0067]
其中i、j分别为字符串a和字符串b的前i、j个字符,其中t的表达式为:
[0068][0069]
s42、根据s31所得到的每条轨迹的编号字符串,计算最长公共子串lcs,计算两个字符串之间的编辑距离最长公共子串lcs的方法为:
[0070][0071]
lcs
a,b
=max(lcs
a,b
(i,j))
[0072]
其中i、j分别为字符串a和字符串b的第i、j个字符;
[0073]
s43、计算得到的最长公共子串,分割为单独的一条轨迹编号字符串,依据最长公共子串的编号取得s13得到的运动特征,计算速度距离dv=|d
va-d
vb
|、方向距离dd=|d
da-d
db
|、空间距离ds=|d
sa-d
sb
|;
[0074]
s44、对步骤四所得的所有距离进行归一化处理;
[0075][0076]
本实施例中,在不同维度下对轨迹进行聚类分析,具体为:
[0077]
s51、在单纯计算轨迹聚类的场景下,使用步骤s41、s42得到的编辑距离进行基于密度的聚类;
[0078]
s52、在识别驾驶员聚类的场景下,计算综合距离进行基于密度的聚类,其中综合距离计算方法为:
[0079]
速度距离、方向距离、空间距离的方差分别为:
[0080][0081]
计算得到综合距离权重为:
[0082][0083]
综合距离计算得:
[0084]
d=[edit
a,b d
v d
d ds]*w。
[0085]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献