一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多源数据融合的居民出行链生成方法及共乘查询方法与流程

2021-08-13 19:21:00 来源:中国专利 TAG:方法 数据处理 出行 融合 生成
基于多源数据融合的居民出行链生成方法及共乘查询方法与流程

本发明涉及交通数据处理技术领域,具体涉及一种基于多源数据融合的居民出行链生成方法及共乘查询方法。



背景技术:

早期的出行链模型研究是以出行调查为基础的。随着交通大数据平台的成熟,涌现了大量基于手机信令的城市居民出行的研究。2017年,大连理工大学的戴宇心进行了基于lte信令数据的移动定位算法研究,而2018年,浙江大学的蔡正义博士基于手机信令数据,对杭州的手机信令数据进行了处理并基于其个体数据进行了建模,更加准确的分析了各区域的交通情况。同年,西南交通大学的卢泰宇基于手机信令数据分析了不同交通方式的识别敏感度。手机信令数据可以做到持续长期大量供给,但手机信令数据仅有轨迹,对出行方式、车辆、具体出发地目的地等分析不足,若仅仅使用手机信令数据建立出行链模型,则因为信息类型过于单一,模型准确性不足。



技术实现要素:

本发明解决的问题是现有出行链模型仅使用手机信令数据建立,信息类型单一,模型准确性不足。

本发明提出一种基于多源数据融合的居民出行链生成方法,包括:

获取手机信令数据,对所述手机信令数据执行跳跃数据清理处理、漂移位置确认处理、不同运营商同用户识别处理及驻留时间分析处理,得到用户的出行信息,其中,所述出行信息包含驻留点、驻留时间和出行轨迹;

基于所述出行信息切割用户行程,获得用户所有行程的行程起讫点、行程起讫点对应时刻及行程轨迹;

遍历用户的每个行程,对用户的每个行程进行出行方式匹配,得到每个行程的出行方式标识;

当所述用户行程包含公交出行行程时,将所述公交出行行程的行程轨迹与公交线路轨迹进行空间匹配,再基于所述公交出行行程的行程起讫点与行程起讫点对应时刻,将所述公交出行行程与公交车次信息进行时空匹配,生成第一匹配结果;

当所述用户行程包含轨迹交通出行行程时,将所述轨迹交通出行行程的行程轨迹与轨道交通线路轨迹进行空间匹配、将所述轨迹交通出行行程的行程起讫点、行程起讫点对应时刻与轨道交通车次信息进行时空匹配,生成第二匹配结果;

当所述用户行程包含小汽车出行行程时,基于所述小汽车出行行程的行程轨迹、行程起讫点、行程起讫点对应时刻,将所述小汽车出行行程与预置数据库中的小汽车进行时空匹配,生成第三匹配结果;

根据所述第一匹配结果、所述第二匹配结果、所述第三匹配结果,得到用户每个行程的乘坐车次,结合用户每个行程的行程起讫点,生成用户的出行链。

可选地,所述将所述公交出行行程的行程轨迹与公交线路轨迹进行空间匹配包括:

将所述公交出行行程的行程轨迹拟合到道路上,获得所述行程轨迹对应的第一路径集合及其路径顺序;

获取公交线路轨迹对应的第二路径集合及其路径顺序,将所述第一路径集合与所述第二路径集合按照路径顺序进行全路径匹配,其中,所述全路径匹配指将所述第一路径集合中的所有路径按照路径顺序与所述第二路径集合进行匹配;

判断是否存在至少一条与所述第一路径集合全路径匹配的公交线路轨迹;

若是,则将与所述第一路径集合全路径匹配的公交线路轨迹作为所述公交出行行程对应的候选公交线路轨迹;

若否,则将所述第一路径集合拆分成至少两个路径子集,其中,当所述路径子集包含两个或两个以上的路径时,所述两个或两个以上的路径均为路径顺序相邻的路径;将至少两个所述路径子集分别与所述第二路径集合按照路径顺序进行全路径匹配;当每个所述路径子集均匹配到至少一条公交线路轨迹时,判定发生换乘,将所述公交出行行程的行程轨迹按照各所述路径子集进行行程分割,得到与各所述路径子集对应的行程,将各所述路径子集匹配的公交线路轨迹分别作为相应行程对应的候选公交线路轨迹。

可选地,所述基于所述公交出行行程的行程起讫点与行程起讫点对应时刻,将所述公交出行行程与公交车次信息进行时空匹配,生成第一匹配结果包括:

获得所述候选公交线路轨迹对应的公交车次信息;

将与所述候选公交线路轨迹对应行程的行程起讫点匹配至所述候选公交线路轨迹,得到与所述行程起讫点对应的起/讫公交站;

从所述公交车次信息中,获取所有公交车次到达所述起/讫公交站的到站时刻,基于所述行程起讫点对应时刻及所述到站时刻,分别计算所述行程与各所述公交车次的时间匹配度;

当所述行程与所有公交车次的时间匹配度均小于第二预设阈值时,判定匹配失败;

当所述行程与至少一个公交车次的时间匹配度大于或等于所述第二预设阈值时,将与所述行程时间匹配度最大的公交车次作为与用户匹配的车次。

可选地,所述将与所述候选公交线路轨迹对应行程时间匹配度最大的公交车次作为与用户匹配的车次之后,还包括:

获取目标车次的公交刷卡数据,根据所述公交刷卡数据统计所述目标车次在所述起/讫公交站的逗留时间对应的第一上车人数或第一下车人数,其中,所述目标车次为与所述候选公交线路轨迹对应行程时间匹配度最大的公交车次;

统计在所述起/讫公交站及所述逗留时间,匹配至所述目标车次的第二上车人数或第二下车人数;

计算所述第一上车人数与所述第二上车人数的差值,或者计算所述第一下车人数与所述第二下车人数的差值;

当所述差值小于预设差值时,保留所述目标车次对应的匹配结果;

当所述差值大于或等于所述预设差值时,基于所述差值更新所述目标车次对应的匹配结果,根据更新后的所述目标车次对应的匹配结果,更新用户匹配的车次。

可选地,所述生成用户的出行链之后,还包括:

获取预设时间内与第一用户乘坐车次相同的第二用户;

获取所述第一用户和所述第二用户共同的乘坐车次的空座数量及所述第二用户的出行特征参数,基于第一预设公式计算所述第一用户和所述第二用户的共乘概率,其中,所述第一预设公式包括:

其中,指共乘概率,为所述乘坐车次的空座数量,为正实数的预设值,为出行特征参数,为上车概率,为对分布概率的归一化处理。

可选地,所述基于所述小汽车出行行程的行程轨迹、行程起讫点、行程起讫点对应时刻,将所述小汽车出行行程与预置数据库中的小汽车进行时空匹配,生成第三匹配结果包括:

遍历所述预置数据库中每条小汽车出行路径信息,获取所述小汽车出行的起终点位置,结合所述行程起讫点,判断所述小汽车出行行程与所述小汽车出行路径信息的起终点位置是否均满足预设空间误差;

若是,则根据所述行程起讫点对应时刻,判断所述小汽车出行行程与所述小汽车出行路径信息的起终点时间是否均满足预设时间误差;

若是,则计算所述小汽车出行行程与所述小汽车出行路径信息的轨迹重合度,判断所述轨迹重合度是否大于第三预设阈值;

若是,则确定所述轨迹重合度最高的小汽车出行路径信息,将所述轨迹重合度最高的小汽车出行路径信息对应的车辆作为与用户匹配的车次。

可选地,所述根据所述第一匹配结果、所述第二匹配结果、所述第三匹配结果,得到用户每个行程的乘坐车次,结合用户每个行程的行程起讫点,生成用户的出行链包括:

当用户没有任何公共交通线路匹配时,判定该用户使用私家车出行;

当用户仅有一条公共交通线路匹配成功时,判定该用户使用私家车或相应的公共交通出行,其中,所述公共交通出行包含公交出行、轨迹交通出行及小汽车出行;

当用户有多于一条公共交通线路匹配成功时,将用户随机分配到其中一个车次上,通过迭代计算,以扩样后的公交刷卡数据、轨道交通刷卡数据和/或小汽车付费数据为目标数据,调整匹配至各出行方式及各车辆的人数,在符合所述目标数据后,从未能匹配的用户中抽取一定比例的用户作为轨道交通地面车站边门入闸或公交车上投币乘客,其余用户归入私家车出行;

根据获得的匹配结果,结合出行时间、地块,对用户个体建立离散选择模型,通过所述离散选择模型选择出发地和目的地的,以生成居民出行链。

可选地,所述对用户的每个行程进行出行方式匹配,得到每个行程的出行方式标识包括:

遍历每个行程,判断所述行程的所述行程轨迹的基站归属与轨道交通基站是否匹配;

若是,则用户的出行方式为轨道交通出行;

若否,则获取所述行程起讫点间的实际旅行时间,并通过路径规划api获取所述行程起讫点的公交时间和小汽车驾车时间,基于第二预设公式计算所述行程为公交出行行程、小汽车出行行程的概率,其中,所述第二预设公式包括:

其中,指所述行程为公交出行行程的概率,指所述行程为小汽车出行行程的概率,指所述行程起讫点间的实际旅行时间,指所述小汽车驾车时间,指所述公交时间。

本发明还提出一种基于知识图谱和居民出行链的共乘查询方法,包括:

获取查询用户和查询时间范围,在基于居民出行链生成的知识图谱中获取所述查询用户在所述查询时间范围内的出行链,其中,所述居民出行链基于如上所述的基于多源数据融合的居民出行链生成方法构建而成,所述知识图谱包含用户实体、停留位置实体、非交通设施实体、车次实体、线路实体、车辆实体、交通基础设施实体,所述用户实体与所述居民出行链的用户个体对应,所述停留位置实体、所述非交通设施实体与所述居民出行链的活动对应,所述车次实体、所述线路实体、所述车辆实体、所述交通基础设施实体与所述居民出行链的出行链对应;

从所述出行链中读取出行位置;

当所述出行位置为公共交通工具时,获取所述出行位置的车次和所述查询用户乘坐该车次的起终点,基于所述车次和所述起终点从所述知识图谱中获取所述查询用户的共乘人员。

本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现如上所述的基于多源数据融合的居民出行链生成方法,或如上所述的基于知识图谱和居民出行链的共乘查询方法。

本发明的有益效果为:

1)通过多源交通数据融合建立出行链模型。本发明通过对多源数据的融合,充分发挥了各类数据的优势,从而获得信息量更丰富的可以长期优化的出行链模型。

2)通过基于手机信令数据对用户每个行程进行出行方式粗匹配,再将手机信令数据及公共交通运营数据、gps数据等多源数据融合,对用户每个行程进行公共交通线路、公共交通车辆的细匹配,弥补了手机信令数据误差大的缺陷,同时分析出用户个体的出行方式及搭乘的具体车辆,将人、公共交通车辆综合考虑,实现了人-公共交通车辆的联合建模,一方面,因公共交通车辆有公交刷卡数据、轨道交通afc数据等实际数据可对匹配结果进行校核,可保证一定的匹配精度,另一方面,将用户每个行程匹配到具体的车辆,可扩大出行链应用场景及适应范围,如基于出行链获得共乘情况,为疫情防控、案件侦破、出行特征分析提供基础,有利于本发明的推广应用。

附图说明

图1为本发明基于多源数据融合的居民出行链生成方法一实施例示意图;

图2为本发明基于多源数据融合的居民出行链生成方法另一实施例示意图;

图3为本发明基于多源数据融合的居民出行链生成方法中确定用户出行方式的一实施例示意图;

图4为本发明基于多源数据融合的居民出行链生成方法中用户出行轨迹与公交数据匹配的一实施例示意图;

图5为本发明基于知识图谱和居民出行链的共乘查询方法中知识图谱图数据库实体和关系整体结构实施例示意图;

图6为本发明基于知识图谱和居民出行链的共乘查询方法一实施例示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

为便于理解本发明,首先简要介绍现有技术中存在的问题。

1)仅基于手机信令数据建立出行链模型限制较大。手机信令数据仅有轨迹,对出行方式、车辆、具体出发地目的地等分析不足。职住分布、遥感等数据仅能提供宏观数据,对具体出行链仅有指导和辅助作用,因而使用职住分布、遥感数据结合手机信令数据建立出行链模型,对出行方式、车辆、具体出发地目的地等具体信息分析不足。若仅仅使用手机信令数据建立出行链模型,则因为手机信令数据只有轨迹,难以基于手机信令数据分析出行方式、车辆、具体出发目的地等,而只考虑个体的位置、出行轨迹,不考虑出行方式、车辆等其他交通信息,就交通分析而言,与交通车辆相关的部分未建模,基于此得到的出行链模型准确性不足。同时,仅使用手机信令数据,使用的数据类型单一,手机信令数据带来的准确性偏差难以被弥补。此外,手机信令的点位是基站gps数据,而一个基站覆盖范围下的出行地点类型较多,在没有其他数据支撑的情况下,无法实现具体分析。

2)现有的出行链模型中,人和车辆是分离的。人的出行链仅关注其活动地点及出行方式,对其具体乘坐的车辆并无建模,对具体车辆、共乘等方面皆无相应信息,这限制了出行链的应用范围。

需要说明的是,下文中的“公共交通”包含公交、轨道交通、出租车及网约车(本文中小汽车出行包含出租车及网约车)。

图1和图2为本发明基于多源数据融合的居民出行链生成方法一实施例示意图。参照图1和图2,所述基于多源数据融合的居民出行链生成方法包括:

步骤s100,获取手机信令数据,对所述手机信令数据执行跳跃数据清理处理、漂移位置确认处理、不同运营商同用户识别处理及驻留时间分析处理,得到用户的出行信息,其中,所述出行信息包含驻留点、驻留时间和出行轨迹。

手机信令数据,是一组由手机信令基站坐标组成的点位数组,手机信令数据可以做到持续长期大量供给。通过手机信令数据,分析相应个体的驻留点、驻留时间和出行轨迹,具体而言,在对手机信令数据执行跳跃数据清理、漂移位置确认、不同运营商同用户识别、驻留时间分析后,可获得相应个体的驻留点、驻留时间和出行轨迹。其中,有关跳跃数据清理/漂移位置确认:由于手机使用基站具有不稳定性,可能出现两种情况:第一种是用户实际没有出行,但由于其处于多个基站之间,因此其定位会在几个基站之间来回跳跃;第二种是用户的一组连续出行点之间有一个不合常理的跳跃点。基于此,需要对这两类点位数据进行跳跃数据清理及漂移位置确认。

有关不同运营商同用户识别:当使用多运营商数据时,会出现一人多号的情况。根据手机信令的点位情形,一人多号的数据会出现行程高度吻合等特征,根据这些特征,可排除重复数据;同时,若有集成数据中心,则可根据数据库内部不可导出的用户登记信息进行排查,以排除重复的手机信令数据。

基于手机信令数据,获取用户每日的全部位置点位,通过点位的变化关系,如驻留时间、间隔距离等信息,判断点位动静状态。对于无运动的点位,认为是用户在该地点驻留,即用户的驻留点。两个驻留点之间的点位记录即用户的行程轨迹信息。通过对用户点位的分析,将用户的一天的点位切分为一系列的出行活动,并通过点位位置获得每个出行活动的出发地和到达地等行程特征。用户的出行信息,包含驻留点、驻留时间、行程轨迹、行程出发地、到达地等。

由于各个运营商的用户在整个城市中占比不同,不同年龄段的手机占有率不同,因此可对手机信令数据进行统计学扩样,基于扩样后的手机信令数据生成用户的出行信息。

步骤s200,基于所述出行信息切割用户行程,获得用户所有行程的行程起讫点、行程起讫点对应时刻及行程轨迹。

可通过手机信令点位聚类等方式切割用户行程,具体切割方式为现有技术,此处不赘述。通过对各驻留点的驻留时间进行分析,可得到行程起讫点,例如将驻留时间大于预设时长的驻留点作为行程起讫点。确定行程起讫点后,可直接读取行程起讫点对应时刻,即行程起点对应时刻和行程终点对应时刻。

步骤s300,遍历用户的每个行程,对用户的每个行程进行出行方式匹配,得到每个行程的出行方式标识。

所述出行方式包含公交出行、轨道交通出行、小汽车出行。其中,小汽车出行,包含出租车出行、网约车出行等。

用户的出行信息中,可能包含多个行程,这些行程可能均使用同一种出行方式,如均使用公交出行,也可能使用不同出行方式,如行程ab使用公交出行,行程bc使用轨道交通出行。以单个行程为单位匹配用户的出行方式及后续与公共交通线路、车辆的匹配。

可选地,步骤s200包括:

遍历每个行程,判断所述行程的所述行程轨迹的基站归属与轨道交通基站是否匹配;若是,则用户的出行方式为轨道交通出行;若否,则获取所述行程起讫点间的实际旅行时间,并通过路径规划api获取所述行程起讫点的公交时间和小汽车驾车时间,基于第二预设公式计算所述行程为公交出行行程、小汽车出行行程的概率。

将基于手机信令数据获得的行程起讫点的实际旅行时间记为,将通过路径规划api获取的行程起讫点间的公交时间记为,将通过路径规划api获取的行程起讫点间的小汽车驾车时间记为指公交出行的概率,指小汽车出行的概率。以第二预设公式计算置信度,第二预设公式为:

>时,判定行程为公交出行,当<时,判定行程为小汽车出行。当=,判定行程为公交出行和小汽车出行,在后续匹配流程中,进一步精准匹配。

由上述第二预设公式可以看出:

当起讫点间公交时间大于驾车时间,此时为长距离出行:若/大于1而/接近1,则用户为公交出行是大概率事件。

当起讫点间公交时间大于驾车时间,此时为长距离出行:/接近1,而/小于1。判定小汽车出行为大概率事件。

当起讫点间公交时间约等于驾车时间,此时为短距离出行:较难判别哪种交通方式,置信度接近0.5,可将公交出行和小汽车出行均作为用户的出行方式,在后续基于公共交通车辆运营数据及gps数据等精确匹配,确定用户最终的出行方式。

在一实施方式中,如图3,首先通过手机信令数据的基站归属判断用户行程是否为地下轨道交通,若是,则基于地下基站的轨迹初步确定用户行程的出行方式和可能的路线,例如,用户的出行方式/交通方式为地铁出行,可能路线为1号线;若用户行程并非地下轨道交通,则通过路径规划api抓取用户行程起讫点的公交时间和驾车时间,并获得用户行程起讫点间的实际旅行实际,通过上述第二预设公式计算出公交出行概率p(公交)和小汽车出行概率p(驾车),判断p(公交)/p(驾车)是否大于预设值n,若小于预设值n,则可能为小汽车出行,因小汽车无固定线路,因此将行程轨迹与小汽车出行轨迹进行道路级轨迹拟合,确定用户行程的出行方式和可能的路线;若p(公交)/p(驾车)大于预设值n,则可能为公交出行,将公交线路的轨迹点数据,与手机信令的点位数组进行向量上的相似度比较(可使用两个向量的欧氏距离大小表征相似度),筛选出可能的线路记录,即对出行线路进行初次筛选,在后续基于公共交通车辆运营数据及gps数据等进行匹配时,在初次筛选的出行线路的基础上,进一步精准筛选。进一步地,根据初次筛选出的多条线路与手机信令点位数组的相似度长度等信息,结合路径规划api返回的推荐线路,判定是否有换乘,若有,则将公交线路轨迹拆分,确定用户行程可能的所有线路。

将手机信令分析的用户行程与公共交通运行数据,通过交通方式、时空的匹配,分析每个用户行程采用的公共交通方式及出行车次。

步骤s400,当所述用户行程包含公交出行行程时,将所述公交出行行程的行程轨迹与公交线路轨迹进行空间匹配,再基于所述公交出行行程的行程起讫点与行程起讫点对应时刻,将所述公交出行行程与公交车次信息进行时空匹配,生成第一匹配结果。

其中,可通过获取公交gps数据并进行地图匹配获得公交线路轨迹,包含站点位置、出行路径等信息。通过获取公交运营数据以获得公交车次信息,公交线路的运营数据包含沿线停靠站点、到站时刻、车牌、车次等信息,车次信息包含沿线停靠站点、到站时刻等信息。用于与公交线路轨迹、公交车次信息进行时空匹配的用户出行信息,除了行程轨迹、行程起讫点和行程起讫点对应时刻外,还可包含换乘站点、初次筛选出的线路等。

第一匹配结果,即:是否存在与用户匹配的公交线路和公交车次,以及若是存在,与用户匹配的公交线路和车次。

步骤s500,当所述用户行程包含轨迹交通出行行程时,将所述轨迹交通出行行程的行程轨迹与轨道交通线路轨迹进行空间匹配、将所述轨迹交通出行行程的行程起讫点、行程起讫点对应时刻与轨道交通车次信息进行时空匹配,生成第二匹配结果。

其中,基于手机信令数据,提取轨道交通地下站的旅客数据,并与轨道交通afc数据进行匹配;基于经历两个以上乘客的地下站手机信令数据,推测各列车抵达各车站的时间,从而获取列车车次;将手机信令数据的用户匹配到地下站个体乘坐的轨道交通线路和车次。对于地上轨道站,结合轨道交通afc刷卡数据及基于手机信令数据获得的用户出行信息,将用户分配到各车次上,并与公交卡对应。通过长期的分析,用户使用的公交卡和手机信令用户id的对应关系会进一步明晰,通过两种数据的匹配情况,结合同一张公交卡的全出行链数据,将同一用户的轨道-公交数据进行统合,从而获得用户较准确的出行链。

第二匹配结果,即:是否存在与用户匹配的轨道交通线路和轨道交通车次,以及若是存在,则与用户匹配的轨道交通线路和车次。当存在与用户匹配的轨道交通线路和车次时,使用轨道交通afc刷卡数据对匹配结果进行校验,或者使用轨道交通afc刷卡数据与轨道交通ats列车运行数据结合起来对匹配结果进行校验,以保证匹配结果的准确性。

步骤s600,当所述用户行程包含小汽车出行行程时,基于所述小汽车出行行程的行程轨迹、行程起讫点、行程起讫点对应时刻,将所述小汽车出行行程与预置数据库中的小汽车进行时空匹配,生成第三匹配结果。

其中,预置数据库中存储有小汽车出行的起终点位置、时间、出行路径、载客状态等信息。小汽车包含出租车、网约车,基于出租车/网约车的gps轨迹数据,进行地图匹配并获取出租车/网约车全天完整的出行行程。

步骤s700,根据所述第一匹配结果、所述第二匹配结果、所述第三匹配结果,得到用户每个行程的乘坐车次,结合用户每个行程的行程起讫点,生成用户的出行链。

在得到第一匹配结果、第二匹配结果及第三匹配结果后,即可确定用户每个行程是否匹配成功,以及若是成功,则匹配到的线路与车次信息,结合每个行程的行程起讫点,生成用户的出行链。

需说明的是:步骤s700中的乘坐车次,当车辆为公交车或轨道交通车辆时,其具有相对固定的营运班次,乘坐车次包含车辆标识(如车牌号或几号车)及车辆班次,当车辆为小汽车时,乘坐车次包含车辆标识(如车牌号),一实施方式中,为小汽车的每段行程标号,乘坐车次除包含车辆标识外,还包含行程标号。

通过基于手机信令数据对用户每个行程进行出行方式粗匹配,再将手机信令数据及公共交通运营数据、gps数据等多源数据融合,对用户每个行程进行公共交通线路、公共交通车辆的细匹配,弥补了手机信令数据误差大的缺陷,同时分析出用户个体的出行方式及搭乘的具体车辆,将人、公共交通车辆综合考虑,实现了人-公共交通车辆的联合建模,一方面,因公共交通车辆有公交刷卡数据、轨道交通afc数据等实际数据可对匹配结果进行校核,可保证一定的匹配精度,另一方面,将用户每个行程匹配到具体的车辆,可扩大出行链应用场景及适应范围,如基于出行链获得共乘情况,有利于本发明的推广应用。

可选地,步骤s400中所述将所述公交出行行程的行程轨迹与公交线路轨迹进行空间匹配包括:

将公交出行行程的行程轨迹拟合到道路上,获得行程轨迹对应的第一路径集合及其路径顺序。

获取公交线路轨迹对应的第二路径集合及其路径顺序,将第一路径集合与第二路径集合按照路径顺序进行全路径匹配,其中,全路径匹配指将第一路径集合中的所有路径按照路径顺序与第二路径集合进行匹配。其中,一条公交线路轨迹对应一个第二路径集合,获取将要与公交出行行程匹配的公交线路轨迹对应的第二路径集合及其路径顺序。

例如,第一路径集合有a、b、c、d、e、f等6条路径,其路径顺序为a->b->c->d->e->f,将第一路径集合与第二路径集合进行全路径匹配,即将a、b、c、d、e、f等6条路径与第二路径集合中的路径进行匹配。

判断是否存在至少一条与第一路径集合全路径匹配的公交线路轨迹。一实施方式中,当第二路径集合包含第一路径集合的所有路径,且该所有路径在第二路径集合中的路径顺序与在第一路径集合中的路径顺序相同时,判定该第二路径集合与第一路径集合全路径匹配,即该第二路径集合对应的公交线路轨迹与第一路径集合全路径匹配。

若是,则将与第一路径集合全路径匹配的公交线路轨迹作为公交出行行程对应的候选公交线路轨迹。

若否,则将第一路径集合拆分成至少两个路径子集,其中,当路径子集包含两个或两个以上的路径时,两个或两个以上的路径均为路径顺序相邻的路径;将至少两个路径子集分别与第二路径集合按照路径顺序进行全路径匹配;当每个路径子集均匹配到至少一条公交线路轨迹时,判定发生换乘,将公交出行行程的行程轨迹按照各路径子集进行行程分割,得到与各路径子集对应的行程,将各路径子集匹配的公交线路轨迹分别作为相应行程对应的候选公交线路轨迹。

例如,第一路径集合有a、b、c、d、e、f等6条路径,其路径顺序为a->b->c->d->e->f,当不存在与第一路径集合全路径匹配的公交线路轨迹时,将第一路径集合拆分成“a->b->c”、“d->e->f”两个路径子集,将“a->b->c”、“d->e->f”分别与公交线路轨迹对应的路径集合进行匹配,若“a->b->c”匹配到公交线路轨迹1,“d->e->f”匹配到公交线路轨迹2,则判定发生换乘,即发生从公交线路轨迹1到公交线路轨迹2的换乘。将公交出行行程的行程轨迹按照各路径子集进行行程分割,得到“a->b->c”、“d->e->f”两段行程,将公交线路轨迹1作为“a->b->c”对应的候选公交线路轨迹,将公交线路轨迹2作为“d->e->f”对应的候选公交线路轨迹。

一实施例中,将第一路径集合拆分成两个路径子集,该两个路径子集中均为路径顺序相邻的路径,为便于描述,引入拆分点的概念,例如,将a、b、c、d、e、f等6条路径拆分成“a->b->c”、“d->e->f”两个路径子集,则d为拆分点。因为将第一路径集合拆分成两个路径子集有多种不同拆分结果,不同拆分点能得到不同的拆分结果,可预先设置多个拆分点,首先,根据第一个拆分点拆分第一路径集合得到两个路径子集,将该两个路径子集分别与第二路径集合按照路径顺序进行全路径匹配,若每个路径子集均匹配到至少一条公交线路轨迹,则将各路径子集匹配的公交线路轨迹分别作为相应行程对应的候选公交线路轨迹,第一路径集合的匹配结束,若有路径子集未匹配到至少一条公交线路轨迹,则换下一个拆分点,直至每个路径子集均匹配到至少一条公交线路轨迹或所有拆分点均匹配完,当所有拆分点都匹配完,且还有路径子集未匹配到公交线路轨迹时,判定公交线路匹配失败,将公交出行行程归入小汽车出行或私家车出行。

可选地,参见图4,步骤s400中所述基于所述公交出行行程的行程起讫点与行程起讫点对应时刻,将所述公交出行行程与公交车次信息进行时空匹配,生成第一匹配结果包括:

步骤s401,获得所述候选公交线路轨迹对应的公交车次信息。

公交的特点在于车辆轨迹确定,但时空重复度高,且发车频率较高。因此需要在时间与空间上对所有可能的线路及车次进行寻找,最终找到符合阈值要求的匹配方案。

当候选公交线路轨迹有多条时,对每条候选公交线路轨迹执行步骤s401-步骤s405。

步骤s402,将与所述候选公交线路轨迹对应行程的行程起讫点匹配至所述候选公交线路轨迹,得到与所述行程起讫点对应的起/讫公交站。

行程起讫点即个体出行起止位置。将行程起点、行程终点分别匹配至候选公交线路轨迹,得到与行程起讫点对应的起/讫公交站,即起公交站和讫公交站。

步骤s403,从所述公交车次信息中,获取所有公交车次到达所述起/讫公交站的到站时刻,基于所述行程起讫点对应时刻及所述到站时刻,分别计算所述行程与各所述公交车次的时间匹配度。

获取候选公交线路轨迹的公交运营数据,读取候选公交线路轨迹所有公交车次到达起/讫公交站的到站时刻。

计算行程轨迹与候选公交线路轨迹各车次的时间匹配度,可通过用户行程起点对应时刻与各车次到达起公交站的到站时刻,计算用户到达起公交站后的等车时间,基于该等车时间确定时间匹配度,其中,该等车时间越小,时间匹配度越大,相应车次与用户的匹配度越高,等车时间越大,时间匹配度越小,相应车次与用户的匹配度越低。其中,可将用户行程起点对应时刻与各车次到达起公交站的到站时刻的差值作为等车时间。

步骤s404,当所述行程轨迹与所有公交车次的时间匹配度均小于第二预设阈值时,判定匹配失败,判定用户使用私家车出行。

通过时间匹配度,可剔除轨迹与点位符合但相应时间没有车次的公交线路。若行程轨迹与候选公交线路轨迹所有车次的时间匹配度均小于第二预设阈值,说明候选公交线路轨迹所有车次与用户的匹配度都过低,判定匹配失败,判定用户使用私家车出行。

步骤s405,当所述行程轨迹与至少一个公交车次的时间匹配度大于或等于所述第二预设阈值时,将与所述候选公交线路轨迹对应行程时间匹配度最大的公交车次作为与用户匹配的车次。

其中,为便于描述,将与行程轨迹的时间匹配度最大的车次称为目标车次。

可选地,步骤s405之后,还包括:

步骤s406,获取目标车次的公交刷卡数据,根据所述公交刷卡数据统计所述目标车次在所述起/讫公交站的逗留时间对应的第一上车人数或第一下车人数,其中,所述目标车次为与所述候选公交线路轨迹对应行程时间匹配度最大的公交车次。

在执行完步骤s405之后,获得了初步的匹配结果,为保证匹配结果符合实际,通过公交刷卡数据对匹配结果进行校核。

其中,目标车次在起/讫公交站的逗留时间,指从目标车次到达起/讫公交站至离开起/讫公交站的时间,与用户的行程起讫点对应时刻较为接近,用户在所述逗留时间在起/讫公交站上目标车次、下目标车次。

目标车次在所述起/讫公交站的逗留时间对应的第一上车人数,指目标车次在起公交站的逗留时间内的第一上车人数,第一下车人数指目标车次在讫公交站的逗留时间内的第一下车人数。

步骤s407,统计在所述起/讫公交站及所述逗留时间,匹配至所述目标车次的第二上车人数或第二下车人数。

步骤s408,计算所述第一上车人数与所述第二上车人数的差值,或者计算所述第一下车人数与所述第二下车人数的差值。

步骤s409,当所述差值小于预设差值时,保留所述目标车次对应的匹配结果。

当差值小于预设差值时,说明初步的匹配结果符合实际情况,因而可以保留目标车次对应的匹配结果,即保留目标车次与用户之间的匹配关系,将目标车次及其线路作为与用户匹配的车次和公交线路。

步骤s410,当所述差值大于或等于所述预设差值时,基于所述差值更新所述目标车次对应的匹配结果,根据更新后的所述目标车次对应的匹配结果,更新用户匹配的车次。

当差值大于或等于预设差值时,说明初步的匹配结果不符合实际情况,因而需要对匹配结果进行调整,基于差值更新目标车次对应的匹配结果,具体而言,可将与差值相等数量的用户的出行方式判定为私家车出行,将剩余的用户的匹配结果保留,其中,将判定为私家车出行的用户从需要分析的用户中排除,不做进一步分析。通过公交刷卡数据对匹配结果进行校核,可以保证匹配结果符合实际情况,进而保证建立的居民出行链的准确性。

给出一如图4所示的实施例:

输入用户一次出行的手机信令数据,即用户单个行程的手机信令数据;

读取用户该行程可能乘坐的线路集,输入公交gps轨迹数据,读取线路集的轨迹数据;

计算用户出行链轨迹(即该此行程的行程轨迹)与公交线路轨迹的重合度;

判断重合度是否大于阈值;

若是,则更新可能的线路集,即:将重合度大于阈值的公交线路轨迹作为用户可能乘坐的线路;若否,则读取另一条公交线路轨迹,返回执行所述计算用户出行链轨迹与公交线路轨迹的重合度的步骤;

在更新可能的线路集后,读取用户行程起讫点,将起讫点分别匹配至对应线路(即可能的线路集中的线路)的公交站,从公交运营数据中读取对应线路的公交运营数据,读取对应线路所有车次的沿线到站时刻,基于用户行程起讫点对应时刻与所有车次的沿线到站时刻,计算用户到达公交站后的等车时间;

判断等车时间是否小于阈值;

若等车时间大于或等于阈值,则更新可能的线路集(将等车时间大于或等于阈值的车次及线路去除);

若等车时间小于阈值,则寻找等车时间最少的车次,并根据公交刷卡数据,统计该车次在相应时间在起/讫公交站的上/下车人数,统计同一时间段内匹配至各站点的上车人数与基于公交刷卡数据的上车人数是否一致,若否,则匹配失败,若是,则将等车时间最少的车次及其线路作为与用户匹配的车次和公交线路。

可选地,所述生成用户的出行链之后,还包括:

获取预设时间内与第一用户乘坐车次相同的第二用户;

获取所述第一用户和所述第二用户共同的乘坐车次的空座数量及所述第二用户的出行特征参数,基于第一预设公式计算所述第一用户和所述第二用户的共乘概率,其中,所述第一预设公式包括:

其中,指共乘概率,为所述乘坐车次的空座数量,为正实数的预设值,为出行特征参数,为上车概率,为对分布概率的归一化处理。

基于上文所述的步骤,通过手机信令数据和公共交通数据将用户出行的点位信息与公共交通线路/车辆进行匹配,得到第一匹配结果、第二匹配结果、第三匹配结果,得到用户的乘坐车次。而通过上述步骤得出的用户的乘坐车次,是用户最有可能搭乘的公共交通线路/车辆,而用户实际上是否乘坐匹配的公共交通车辆前往终点存在一定的概率。

已知第一用户实际乘坐的车次,获取通过上述步骤确定的出行链,进而确定与第一用户乘坐车次相同的第二用户,计算第一用户与第二用户的共乘概率。第一用户和第二用户共同的乘坐车次的空座数量,通过上下车人数获得,其中,上车人数可通过该公共交通的刷卡数或者上车的概率获得,下车的人数可以通过手机信令或者大样本统计的od获得。

获取空座数量后,即可通过上述第一预设公式,计算共乘概率。

通过将人-车关联,计算出两两用户之间的共乘概率,进而实现人-人关联,有利于建立疫情防控、案件侦破、出行特征分析等的数据基础。

可选地,所述基于所述小汽车出行行程的行程轨迹、行程起讫点、行程起讫点对应时刻,将所述小汽车出行行程与预置数据库中的小汽车进行时空匹配,生成第三匹配结果包括:

步骤s420,遍历所述预置数据库中每条小汽车出行路径信息,获取所述小汽车出行的起终点位置,结合所述行程起讫点,判断所述小汽车出行行程与所述小汽车出行路径信息的起终点位置是否均满足预设空间误差。

步骤s421,若是,即小汽车出行行程与小汽车出行路径信息的起终点位置均满足预设空间误差,则根据所述行程起讫点对应时刻,判断所述小汽车出行行程与所述小汽车出行路径信息的起终点时间是否均满足预设时间误差。

小汽车出行路径信息包含起终点位置和时间,在执行步骤s420-步骤s421时,可直接从小汽车出行路径信息中获取起终点位置和时间,以分别结合用户的行程起讫点、行程起讫点对应时刻,判断起终点位置是否均满足预设空间误差、起终点时间是否均满足预设时间误差。

若用户的行程轨迹与小汽车出行路径信息的起终点位置不均满足预设空间误差,则直接判定匹配失败,判定用户为私家车出行,不执行步骤s421及其之后的步骤。

步骤s422,若是,即小汽车出行行程与小汽车出行路径信息的起终点时间均满足预设时间误差,则计算所述小汽车出行行程与所述小汽车出行路径信息的轨迹重合度,判断所述轨迹重合度是否大于第三预设阈值。

若用户的行程轨迹与小汽车出行路径信息的起终点位置均满足预设空间误差、起终点时间均满足预设时间误差,则进一步判断轨迹重合度,可选地,获取用户的行程轨迹的路径集合以及小汽车出行路径的路径集合,计算两种不同数据源轨迹的路径集合之间的轨迹重合度。

若小汽车出行行程与小汽车出行路径信息的起终点时间存在任一时间不满足预设时间误差,则判定匹配失败,判定用户为私家车出行。

若轨迹重合度小于或等于第三预设阈值,则判定匹配失败,判定用户为私家车出行。

步骤s423,若是,即若轨迹重合度大于第三预设阈值,则确定所述轨迹重合度最高的小汽车出行路径信息,将所述轨迹重合度最高的小汽车出行路径信息对应的车辆作为与用户匹配的车次。

若轨迹重合度大于第三预设阈值,则在计算完所有的小汽车出行路径信息与行程轨迹的轨迹重合度后,选取轨迹重合度最高的小汽车出行路径信息,该轨迹重合度最高的小汽车出行路径信息中的小汽车车次作为用户匹配的车次。可选地,遍历每条小汽车出行路径信息,将与用户的行程轨迹的轨迹重合度大于第三预设阈值的小汽车出行路径信息存储,在计算完所有的小汽车出行路径信息与行程轨迹的轨迹重合度后,寻找轨迹重合度最高的小汽车出行路径信息。

可选地,所述生成用户的出行链之后,还包括:

当用户没有任何公共交通线路匹配时,判定该用户使用私家车出行,将使用私家车出行的用户从需要分析的用户中排除,不做进一步分析,即不作为居民出行链的分析对象。

当用户仅有一条公共交通线路匹配成功时,判定该用户使用私家车或相应的公共交通出行。

当用户有多于一条公共交通线路匹配成功时,将用户随机分配到其中一条公共交通线路上,通过迭代计算,以扩样后的公交刷卡数据、轨道交通刷卡数据和/或小汽车付费数据为目标数据,调整匹配至各出行方式及各车辆的人数,在符合所述目标数据后,从未能匹配的用户中抽取一定比例的用户作为轨道交通地面车站边门入闸或公交车上投币乘客,其余用户归入私家车出行。例如:扩样后的个体有100个人,其中20个人匹配到公共交通,剩余80人,按照预设比例将该80个人分配到各种出行方式,例如10个人乘坐公交车,5个人乘坐地铁,其余65人认为采用私家车出行。

根据获得的匹配结果,结合出行时间、地块,对用户个体建立离散选择模型,通过所述离散选择模型选择符合实际情况的出发地和目的地的设施,以生成居民出行链。

其中的出发地和目的地的设施,包括住宅、公司等。

获取匹配结果,基于用户时间、出发地到达地的地点属性,使用长期数据对用户的出行行为进行分析,获得出行特征,如长期在家(待业/家中上班等)、每日定时往返(普通上班族)、每日定时往返且中间有多个出行(商务、公关人士)等特征,以及实际出行方式、出行时间段等,再基于出行特征对不同类型的用户进行聚类分析,获取其出行目的的特征函数,推测用户的出行目的,因具体的通过聚类分析获得用户的出行目的的相关内容为现有技术,此处不赘述。

通过对匹配结果进行分类,将未成功匹配到一条公共交通线路的用户排除,不作为分析对象,将成功匹配到多条公共交通线路的用户,通过扩样后的公交刷卡数据和轨道交通刷卡数据再次调整匹配,以最终获得较为准确的匹配结果,基于此生成较为准确的出行链。

一实施例中,本发明基于知识图谱和居民出行链的共乘查询方法包括:

获取查询用户id和查询时间范围,在基于居民出行链生成的知识图谱中获取所述查询用户id在所述查询时间范围内的出行链,其中,所述居民出行链基于上所述的基于多源数据融合的居民出行链生成方法构建而成;从所述出行链中读取出行位置;当所述出行位置为公共交通工具时,获取所述出行位置的车次和所述查询用户id乘坐该车次的起终点,基于所述车次和所述起终点从所述知识图谱中获取所述查询用户id的共乘人员。

其中,查询用户id指已知的查询依据,通过上述步骤,查询出与该用户id共乘的人员。查询时间范围,指在该查询时间范围内,与查询用户id共乘的人员。

获取查询用户id查询时间范围内的出行链,即获取该用户id在一定时间范围内的活动链,包含了其出行时间和出行位置。

出行位置可分为公共交通工具和城市设施,当出行位置为城市设施时,获取查询用户id在该城市设施的逗留时间,进而筛选出在该逗留时间内该城市设施内的人员,即与查询用户id可能在同一时间处于同一空间的人员。

其中,在通过上述基于多源数据融合的居民出行链生成方法获得居民出行链后,可基于居民出行链构建知识图谱。知识图谱图数据库的实体对应出行链模型中的的个体、交通工具、城市设施;知识图谱图数据库中的关系对应出行链模型中,个体出行全出行中每一环之间的连接。如图5为图数据库实体和关系整体结构示意图。出行链模型(abm)各主要模块的内容、需求与知识图谱(kg)对应关系见表1:

表1

其中,知识图谱包含用户实体、停留位置实体、非交通设施实体、车次实体、线路实体、车辆实体、交通基础设施实体,所述用户实体与所述居民出行链的用户个体对应,所述停留位置实体、所述非交通设施实体与所述居民出行链的活动对应,所述车次实体、所述线路实体、所述车辆实体、所述交通基础设施实体与所述居民出行链的出行链对应。

如图6所示,给出将基于知识图谱和居民出行链的共乘查询方法应用于防疫分析,如图6示出了一种基于知识图谱和居民出行链的共乘查询方法的防疫分析系统,包含知识图谱构建模块、检索需求输入模块、数据导入模块、活动链获取模块以及防疫分析模块。其中,知识图谱构建模块用于通过基础数据和用户出行链信息结构构建知识图谱,基础数据包含设施数据、公共交通车次线路、公共交通车辆信息,用户出行链信息结构包括用户结构、城市设施结构和交通设施结构。数据导入模块,用于将用户信息、活动时间活动地点、交通模式行驶路线经数据整合后,导入知识图谱,使知识图谱中具有实际的用户出行信息内容。检索需求输入模块,用于在出现病例后,接收询问,获取询问/查询的用户id和查询时间范围,将其输入知识图谱。活动链获取模块,即出行链获取模块,用于检索查询的用户id,获取其出行位置以及用户全部活动链,排除非查询时间范围内的数据,获得有效的用户活动链集合。防疫分析模块,用于从有效的用户活动链集合中依次读取查询用户的各个出行位置,对于每个出行位置,获取其位置类型,若其为公共交通工具,则获取车次乘坐起终点,获取该车次该起终点的相关人员作为目标人员,对目标人员进行医学观察,若其为车站等城市设施,则读取设施及用户在该设施的逗留时间,获取相关人员作为目标人员,对目标人员进行医学观察,并对设施进行防疫监控。

通过分析感染人员全链条的出行活动轨迹和交通方式,可以使用用户的手机记录从数据库中提取疾病潜伏期内全部出行信息,通过这些信息可提取全部同乘人员或者同时间在同一城市设施内的人员作为感染排查对象和防疫的重点保护对象。输入确诊案例的手机信令id、感染起始时间(必选)以及出行时间、方式与车次(可选信息)信息,通过时空匹配,在知识图谱中检索出符合时间要求采用公共交通方式的感染出行链,并输出与该用户相关的所有共乘人员的分析结果。通过对用户全出行链的建模分析,将有利于对用户及用户活动区域进行精准检测和管理,挖掘高风险人群的活动规律,通过基于城市设施、交通工具的图论算法分析,研判高风险的poi和交通车次,有利于对重点poi和公共交通进行预防。

在另一实施例中,基于多源数据融合构建个体出行链,结合交通出行调查,结合现有的出行链进行校核,并根据交通出行调查的结果进行扩样;根据扩样结果构建个体和车辆,使用matsim等软件进行多模式交通仿真。

本发明实施例应用于基于多源数据融合的居民出行链生成装置,包括:

手机信令数据分析模块,其用于获取手机信令数据,对所述手机信令数据执行跳跃数据清理处理、漂移位置确认处理、不同运营商同用户识别处理及驻留时间分析处理,得到用户的出行信息,其中,所述出行信息包含驻留点、驻留时间和出行轨迹;基于所述出行信息切割用户行程,获得用户所有行程的行程起讫点、行程起讫点对应时刻及行程轨迹;遍历用户的每个行程,对用户的每个行程进行出行方式匹配,得到每个行程的出行方式标识;

公共交通数据匹配模块,其用于当所述用户行程包含公交出行行程时,将所述公交出行行程的行程轨迹与公交线路轨迹进行空间匹配,再基于所述公交出行行程的行程起讫点与行程起讫点对应时刻,将所述公交出行行程与公交车次信息进行时空匹配,生成第一匹配结果;当所述用户行程包含轨迹交通出行行程时,将所述轨迹交通出行行程的行程轨迹与轨道交通线路轨迹进行空间匹配、将所述轨迹交通出行行程的行程起讫点、行程起讫点对应时刻与轨道交通车次信息进行时空匹配,生成第二匹配结果;当所述用户行程包含小汽车出行行程时,基于所述小汽车出行行程的行程轨迹、行程起讫点、行程起讫点对应时刻,将所述小汽车出行行程与预置数据库中的小汽车进行时空匹配,生成第三匹配结果;

出行行为整合、建模模块,其用于根据所述第一匹配结果、所述第二匹配结果、所述第三匹配结果,得到用户每个行程的乘坐车次,结合用户每个行程的行程起讫点,生成用户的出行链。

本发明基于多源数据融合的居民出行链生成装置相对于现有技术所具有的有益效果与上述基于多源数据融合的居民出行链生成方法一致,此处不赘述。

本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现如上所述的基于多源数据融合的居民出行链生成方法或基于知识图谱和居民出行链的共乘查询方法。

本发明计算机可读存储介质相对于现有技术所具有的有益效果与上述基于多源数据融合的居民出行链生成方法一致,此处不赘述。

虽然本发明公开披露如上,但本发明公开的保护范围并非仅限于此。本领域技术人员在不脱离本发明公开的精神和范围的前提下,可进行各种变更与修改,这些变更与修改均将落入本发明的保护范围。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜