一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用户轨迹预测与异常轨迹检测方法及系统与流程

2022-03-26 06:17:37 来源:中国专利 TAG:


1.本发明涉及时空数据分析领域,具体涉及一种用户轨迹预测与异常轨迹检测方法及系统。


背景技术:

2.现有的用户轨迹预测技术一般局限于预测用户的短期轨迹动向或轨迹驻点二者之一,并无法兼顾对二者同时进行预测分析。而现有的异常轨迹检测方法主要依据的是局部轨迹相比正常轨迹的偏移程度对异常进行度量,并没有考虑局部轨迹与驻点或时空风险点间的联系。因此,目前亟需一种能够兼顾用户短期轨迹动向及轨迹驻点的预测,同时还能当前轨迹异常性的技术方案。


技术实现要素:

3.针对现有技术中存在的缺陷,本发明的目的在于提供一种用户轨迹预测与异常轨迹检测方法及系统,能够兼顾用户短期轨迹动向及轨迹驻点的预测,预测的准确度更高,预测效果更佳。
4.为实现上述目的,本发明采用的技术方案如下:
5.一种用户轨迹预测与异常轨迹检测方法,包括:
6.s100、获取路网数据、地理信息数据和高风险时空信息数据;
7.s200、基于路网计算引擎和所述路网数据,对原始的轨迹数据进行预处理,包括异常值去除、缺失项填充、路网匹配和周期划分;
8.s300、基于预处理后的所述轨迹数据,识别用户轨迹的所有落脚点/驻点作为落脚点/驻点候选集;
9.s400、基于所述路网数据、所述地理信息数据和所述落脚点/驻点候选集,提取所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量;
10.s500、对所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合,得到融合后的当前轨迹特征向量,将所述融合后的当前轨迹特征向量与同一周期内的历史轨迹特征向量进行历史特征融合,得到历史特征向量;
11.s600、基于所述融合后的当前轨迹特征向量和所述历史特征向量,生成相应的轨迹序列,所述轨迹序列包括预测路段特征向量和预测落脚点/驻点特征向量;
12.s700、基于当前路段下一时间点的候选路段集和所述预测路段特征向量,进行正则化,得到预测路段,基于所述落脚点/驻点候选集和所述预测落脚点/驻点特征向量,进行正则化,得到预测落脚点/驻点;
13.s800、基于所述预测路段、所述预测落脚点/驻点、所述高风险时空信息数据,以及当前路段和所述预测驻点/落脚点间的候选路线集,获取路线偏移指标和潜在风险指标两项指标作为异常状态衡量指标,进行状态检测,得到检测结果。
14.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s200中,对原始的轨迹数
据进行路网匹配,包括:
15.通过路网计算引擎,将所述轨迹数据中用户轨迹与所述路网数据进行匹配,从所述路网数据中获取用户轨迹每个时间点对应的路段。
16.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s300包括:
17.从所述路网数据中获取用户轨迹每个时间点对应的路段后,综合自定义周期内的轨迹数据,通过落脚点/驻点聚类器获取所述周期内的落脚点/驻点,作为落脚点/驻点候选集。
18.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s400中,提取所述轨迹数据中的路网结构特征向量,包括:
19.以所述轨迹数据进行路网匹配获取的路段为起点30分钟步行等时圈作为感受野,通过感受野局部筛选器获取其感受野内的所有路段,提取路网结构特征向量作为所述轨迹数据中的路网结构特征向量;
20.提取所述轨迹数据中的轨迹结构特征向量,包括:
21.获取所述轨迹数据中用户轨迹在所述路网数据中的所有路段,通过图嵌入算法中匿名游走的方式对每个路段进行图嵌入,获取轨迹结构特征向量作为所述轨迹数据中的轨迹结构特征向量;
22.提取所述轨迹数据中的落脚点/驻点语义特征向量,包括:
23.从所述地理信息数据中获取与所述落脚点/驻点候选集中落脚点/驻点相关联的信息,通过特征工程筛选该信息的属性作为所述轨迹数据中的落脚点/驻点语义特征向量。
24.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s500中,对所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合,包括:
25.通过向量嵌入的方式将所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量统一成相同维度;
26.通过attention算子、全连接算子或求和算子对所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合。
27.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s600包括:
28.将所述融合后的当前轨迹特征向量和所述历史特征向量,以及当前轨迹的运动状态和当前轨迹是否处于历史落脚点/驻点输入基于神经网络的seq2seq模型,输出所述预测路段特征向量和所述预测落脚点/驻点特征向量。
29.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s700包括:
30.通过所述路网计算引擎获取当前路段下一时间点的候选路段作为所述候选路段集;
31.将所述候选路段集的结构特征向量与所述预测路段特征向量进行点积运算,取点积值最大的路段作为所述预测路段;
32.将所述落脚点/驻点候选集的语义特征向量与所述预测落脚点/驻点特征向量进行点积运算,取点积值最大的落脚点/驻点作为所述预测落脚点/驻点。
33.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s800中,基于所述预测路段、所述预测落脚点/驻点、所述高风险时空信息数据,以及当前路段和所述预测驻点/落脚
点间的候选路线集,获取路线偏移指标和潜在风险指标,包括:
34.通过所述路网计算引擎获取当前路段前往所述预测落脚点/驻点的所有潜在最短路段作为所述候选路线集;
35.计算所述预测路段在所述候选路线集中出现的概率作为所述路线偏移指标;
36.计算所述候选路线集对所述高风险时空信息数据的覆盖率作为所述潜在风险指标。
37.进一步,如上所述的用户轨迹预测与异常轨迹检测方法,s800中,通过基于逻辑回归的检测分类模型对所述异常状态衡量指标进行状态检测。
38.本发明实施例中还提供了一种用户轨迹预测与异常轨迹检测系统,包括:
39.数据获取模块,用于获取路网数据、地理信息数据和高风险时空信息数据;
40.预处理模块,用于基于路网计算引擎和所述路网数据,对原始的轨迹数据进行预处理,包括异常值去除、缺失项填充、路网匹配和周期划分;
41.落脚点/驻点识别模块,用于基于预处理后的所述轨迹数据,识别用户轨迹的所有落脚点/驻点作为落脚点/驻点候选集;
42.特征提取模块,用于基于所述路网数据、所述地理信息数据和所述落脚点/驻点候选集,提取所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量;
43.特征融合模块,用于对所述轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合,得到融合后的当前轨迹特征向量,将所述融合后的当前轨迹特征向量与同一周期内的历史轨迹特征向量进行历史特征融合,得到历史特征向量;
44.轨迹序列生成模块,用于基于所述融合后的当前轨迹特征向量和所述历史特征向量,生成相应的轨迹序列,所述轨迹序列包括预测路段特征向量和预测落脚点/驻点特征向量;
45.预测结果正则模块,用于基于当前路段下一时间点的候选路段集和所述预测路段特征向量,进行正则化,得到预测路段,基于所述落脚点/驻点候选集和所述预测落脚点/驻点特征向量,进行正则化,得到预测落脚点/驻点;
46.状态检测模块,用于基于所述预测路段、所述预测落脚点/驻点、所述高风险时空信息数据,以及当前路段和所述预测驻点/落脚点间的候选路线集,获取路线偏移指标和潜在风险指标两项指标作为异常状态衡量指标,进行状态检测,得到检测结果。
47.本发明的有益效果在于:本发明所提供的方法及系统,能够兼顾用户短期轨迹动向及轨迹驻点的预测,同时还可以通过结合局部轨迹动向、未来潜在驻点及不同场景下定义的时空风险点综合分析当前轨迹的异常性,从而使预测的准确度更高,预测效果更佳。
附图说明
48.图1为本发明实施例中提供的一种用户轨迹预测与异常轨迹检测方法的流程示意图;
49.图2为本发明实施例中提供的一种用户轨迹预测与异常轨迹检测系统的结构示意图;
50.图3为本发明实施例中提供的一种用户轨迹预测与异常轨迹检测系统的流程框架图。
具体实施方式
51.下面结合说明书附图与具体实施方式对本发明做进一步的详细说明。
52.如图1所示,一种用户轨迹预测与异常轨迹检测方法,包括:
53.s100、获取路网数据、地理信息数据和高风险时空信息数据;
54.本实施例中,对于轨迹预测最为必要的数据是路网数据,路网数据可以依据所选路网计算引擎的不同而设计不同的存储方式。为了提高预测精度,需要获取轨迹的语义特性,选用公开poi(point of information,信息点)数据辅助表征轨迹语义特性,可以选用地理数据库存储也可以与路网匹配后采用图数据库进行存储。高风险时空信息数据是辅助表征轨迹异常性的数据,根据业务需求获取和定义,比如消防领域为重点场所,公安领域为大型活动集散地、重点场所等,采用和poi数据相同的存储方式。
55.s200、基于路网计算引擎和路网数据,对原始的轨迹数据进行预处理,包括异常值去除、缺失项填充、路网匹配和周期划分;
56.本实施例中,原始的轨迹数据存在很多缺失信息或异常值,比如定位短期内大范围偏移,定位信息缺失等。首先,对于异常值需要进行剔除、平滑等异常处理操作;然后进行缺失值填充,对于小范围缺失采用插值、重采样等方式填充缺失项,对于大范围缺失依据场景选择合适的插值方案进行处理;轨迹数据需要进行路网匹配,通过路网计算引擎结合路网数据将轨迹点和路网进行匹配,获取每条轨迹对应的路段;最后,轨迹数据需要按至少一个固定周期进行划分,比如按小时、天、周、月等,以便综合周期内相关信息进行预测。
57.s300、基于预处理后的轨迹数据,识别用户轨迹的所有落脚点/驻点作为落脚点/驻点候选集;
58.本实施例中,落脚点为用户的住宿地点,驻点为用户长时间停留的地点。获取到轨迹每个时间点对应的路段后,综合自定义周期内的轨迹记录,利用时空聚类算法获取周期内的落脚点/驻点,以确定用户出行潜在的目的地,形成落脚点/驻点候选集。
59.s400、基于路网数据、地理信息数据和落脚点/驻点候选集,提取轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量;
60.对于路网结构特征向量,需要计算路段相对于感受野内的路段的特征,根据场景定义感受野(默认为30分钟步行等时圈),获取预置路网数据中以每条路段为起点对应感受野内的路段集;输入感受野获取的路段集,提取路网的拓扑特征,输出路网的特征向量,对于特征提取方式不同领域可以选择不同指标,比如空间句法中的整合度、选择度等,空间设计网络分析中的接近度、中间度等,亦可采用图神经网络的方式获取感受野内各路段的嵌入特征向量。
61.对于轨迹结构特征向量,可以根据业务需要选取用户轨迹数据中一部分数据来计算(默认选择一周),获取用户轨迹在路网中的路段子图,并将用户路段间跳转的频次设置为路段间的权重,以落脚点为起始点,通过图嵌入算法中匿名游走的方式对每个路段进行图嵌入,从而获取轨迹结构特征。对于路段子图外的路段,其轨迹特征依据需要可以初始化为零向量或随机向量。
62.对于落脚点/驻点语义特征向量,针对每个落脚点/驻点,通过特征工程筛选地理语义信息数据的属性作为落脚点/驻点的语义特征。对于非落脚点/驻点所属的路段,其语义特征默认为零向量。
63.s500、对轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合,得到融合后的当前轨迹特征向量,将融合后的当前轨迹特征向量与同一周期内的历史轨迹特征向量进行历史特征融合,得到历史特征向量;
64.本实施例中,特征融合阶段需要将上述三种特征进行融合,融合的方式采用向量嵌入的方式先统一成相同维度,然后利用attention算子、全连接算子或求和算子将三个特征向量融合。单条轨迹记录的信息并不能反映用户的意图,只有包含了上下文的轨迹才能反映用户的真实意图,将融合后的当前轨迹特征向量与同周期内的历史轨迹特征向量共同输入历史特征融合器,通过求和算子或gru等神经网络模型表征成历史特征向量。
65.s600、基于融合后的当前轨迹特征向量和历史特征向量,生成相应的轨迹序列,轨迹序列包括预测路段特征向量和预测落脚点/驻点特征向量;
66.本实施例中,为了能综合短期动向预测和中长期的驻点预测,轨迹序列生成阶段需要将当前轨迹运动状态(是否停留)、当前轨迹的综合特征(s500中融合的当前轨迹特征向量及历史特征向量)、当前轨迹是否处于历史落脚点/驻点输入神经网络的seq2seq模型,输出一个由两部分组成的向量,一部分为预测路段特征向量(即下一时间点路段特征向量),另一部分为预测落脚点/驻点特征向量(即下一落脚点/驻点特征向量)。
67.s700、基于当前路段下一时间点的候选路段集和预测路段特征向量,进行正则化,得到预测路段,基于落脚点/驻点候选集和预测落脚点/驻点特征向量,进行正则化,得到预测落脚点/驻点;
68.本实施例中,候选路段集由基于当前路段通过路网计算引擎获取的下一时间点的候选路段组成。将候选路段集的结构特征向量与s600输出的预测路段特征向量进行点积运算,取点积值最大的候选路段作为最终的预测路段。同理,将s300得到的落脚点/驻点候选集的语义特征向量与s600输出的预测落脚点/驻点特征向量进行点积运算,取点积值最大的落脚点/驻点作为最终的预测落脚点/驻点。
69.s800、基于预测路段、预测落脚点/驻点、高风险时空信息数据,以及当前路段和预测驻点/落脚点间的候选路线集,获取路线偏移指标和潜在风险指标两项指标作为异常状态衡量指标,进行状态检测,得到检测结果。
70.本实施例中,通过路网计算引擎获取当前路段前往s700输出的预测落脚点/驻点的所有潜在最短路段作为候选路线集,计算s700输出的预测路段在候选路线集中出现的概率作为路线偏移指标,计算候选路线集对高风险时空信息数据的覆盖率作为潜在风险指标,将这两项指标作为异常状态衡量指标,通过基于逻辑回归的检测分类模型对异常状态衡量指标进行状态检测,检测当前轨迹状态是否为正常。
71.如图2所示,一种用户轨迹预测与异常轨迹检测系统,包括:
72.数据获取模块100,用于获取路网数据、地理信息数据和高风险时空信息数据;
73.预处理模块200,用于基于路网计算引擎900和路网数据,对原始的轨迹数据进行预处理,包括异常值去除、缺失项填充、路网匹配和周期划分;
74.落脚点/驻点识别模块300,用于基于预处理后的轨迹数据,识别用户轨迹的所有
落脚点/驻点作为落脚点/驻点候选集;
75.特征提取模块400,用于基于路网数据、地理信息数据和落脚点/驻点候选集,提取轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量;
76.特征融合模块500,用于对轨迹数据中的路网结构特征向量、轨迹结构特征向量以及落脚点/驻点语义特征向量进行特征融合,得到融合后的当前轨迹特征向量,将融合后的当前轨迹特征向量与同一周期内的历史轨迹特征向量进行历史特征融合,得到历史特征向量;
77.轨迹序列生成模块600,用于基于融合后的当前轨迹特征向量和历史特征向量,生成相应的轨迹序列,轨迹序列包括预测路段特征向量和预测落脚点/驻点特征向量;
78.预测结果正则模块700,用于基于当前路段下一时间点的候选路段集和预测路段特征向量,进行正则化,得到预测路段,基于落脚点/驻点候选集和预测落脚点/驻点特征向量,进行正则化,得到预测落脚点/驻点;
79.状态检测模块800,用于基于预测路段、预测落脚点/驻点、高风险时空信息数据,以及当前路段和预测驻点/落脚点间的候选路线集,获取路线偏移指标和潜在风险指标两项指标作为异常状态衡量指标,进行状态检测,得到检测结果。
80.本实施例中,如图3所示,预处理模块200中,先对轨迹数据进行异常值处理,之后进行缺失项插值;插值之后的轨迹数据将进行路网匹配,调用路网计算引擎900计算预先存储的路网数据获取相关信息;对于匹配完的轨迹数据,将综合一定时期内的数据输入落脚点/驻点聚类器进行落脚点/驻点识别,对于新出现的落脚点/驻点将加入候选驻点/落脚点集;对于匹配完的轨迹数据,将综合一定时期内的数据进行轨迹结构特征抽取;通过语义特征抽取器将根据地理信息库中与落脚点/驻点时空关联的信息,抽取语义特征,对于非落脚点/驻点将默认为零向量或随机向量;路网中的路段将通过感受野局部筛选器获取其感受野内的所有路段并进行路网特征抽取;对轨迹结构特征向量、路网结构特征向量、轨迹语义特征向量进行特征融合;融合后的轨迹特征向量将与同一周期内的历史轨迹特征向量进入历史特征融合器进行历史特征融合;轨迹特征、历史特征、当前轨迹的状态、当前轨迹是否处于历史落脚点/驻点四个特征将输入轨迹序列生成模块600进行轨迹预测,最终输出未来驻点/落脚点特征向量以及路段特征向量;通过预测结果正则模块700对预测结果的正则化得到预测驻点/落脚点以及预测路段;状态检测模块800将综合预测路段、预测驻点/落脚点,以及当前路段和预测驻点/落脚点间的候选路线集,结合自定义的高风险时空信息库,输出当前轨迹是否处于异常状态。
81.本发明提供的一种用户轨迹预测与异常轨迹检测方法及系统,能够兼顾用户短期轨迹动向及轨迹驻点的预测,同时可以通过结合局部轨迹动向、未来潜在驻点及不同场景下定义的时空风险点综合分析当前轨迹的异常性,从而使预测的准确度更高,预测效果更佳。
82.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献