一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

样本数据生成、出行需求预测模型训练和预测方法及装置与流程

2022-11-30 08:30:27 来源:中国专利 TAG:


1.本发明涉及大数据技术领域,特别涉及一种训练样本数据生成方法、出行 需求预测模型的训练方法和出行需求预测方法及装置。


背景技术:

2.对未来的仿真推演是城市数字孪生最重要的能力之一。例如城市如果新建 一座跨江大桥,附近居民是否会因为交通变得便利而增加出行量,例如城市通 勤人群在特定的通勤时间每个个体具有较强的周期性通勤需求。因此,交通需 求预测是对城市未来的仿真推演的关键技术。


技术实现要素:

3.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地 解决上述问题的一种训练样本数据的生成方法、出行需求预测模型的训练方法 和出行需求预测方法及装置。
4.第一方面,本发明实施例提供一种训练样本数据的生成方法,其特征在于, 包括:
5.按照预设的人群属性,对人群进行分类,得到不同的人群分组;
6.基于所述人群分组,将同一人群分组下的不同个体在不同预设时间段内的 出行链数据进行整合,得到同一人群分组对应的出行需求预测模型的训练样本 数据。
7.在一个实施例中,分别将同一人群分组下的不同个体的出行链数据进行整 合,得到同一分组对应的出行需求预测模型的训练样本数据,包括:
8.对同一人群分组下的不同个体,按照个体的用户标识和预设时间段标识, 将不同个体的历史出行数据,整理成不同个体在不同预设时间段内的出行链数 据;所述出行链数据中包含所述个体在预设时间段内的至少一个出行动作记录 以及所述至少一个出行动作记录所对应的出行目的特征标签;
9.将同一分组下不同个体在不同时间段的出行链数据,按照预设的出行链数 量和出行动作记录数量,切分成多批训练样本数据。
10.在一个实施例中,按照个体的用户标识和预设时间段标识,将不同个体的 历史出行数据,整理成不同个体在不同预设时间段内的出行链数据,包括:
11.生成出行链数据的键标识;所述键标识包括用户标识和日期的组合;
12.在所述用户标识对应的个体的历史出行数据中,确定所述日期内发生的至 少一出行动作记录的出行目的特征标签;
13.将所述历史出行数据中出行动作记录的活动开始时间、持续时长和经纬度 数据,以及所述出行动作记录对应的出行目的特征标签,转换成预设的数据格 式,得到所述键标识对应的出行链数据。
14.第二方面,本发明实施例提供一种出行需求预测模型的训练方法,包括:
15.获取所述出行需求预测模型对应的人群分组的至少一批训练样本数据;所 述训
练样本数据中包含所述人群分组中多个不同个体在不同时间段内预设数 量的出行链数据;
16.将所述至少一批训练样本数据,分批次输入至预设的深度学习网络,对所 述深度学习网络进行训练,得到所述人群分组对应的出行需求预测模型。
17.在一个实施例中,对所述深度学习网络进行训练,得到所述人群分组对应 的出行需求预测模型,包括:
18.在将每批次训练样本数据输入至预设的深度学习网络后,使用误差反向传 播的方式,对所述深度学习网络的参数值计算损失函数的梯度,并根据所述梯 度更新所述参数值以使损失函数收敛,直至达到预设的收敛条件。
19.在一个实施例中,所述预设的深度学习网络,包括:输入层、第一网络输 出层和第二网络输出层;
20.所述训练样本数据集中的出行链数据,包括:至少一个出行动作记录以及 所述至少一个出行动作记录所对应的出行目的特征标签;所述出行动作记录包 括:活动开始时间、持续时长和经纬度数据;
21.所述输入层包括预设数量的时序单元,用于接收输入的训练样本数据;
22.所述第一网络输出层,用于输出计算得到的出行目的特征标签,并作为输 入层下个时序单元的输入数据;
23.所述第二网络输出层,用于输出活动开始时间、持续时长和经纬度数据, 并作为输入层下个时序单元的输入数据;所述活动开始时间、持续时长和经纬 度数据基于第一网络输出层输出的出行目的特征计算得到。
24.在一个实施例中,所述损失函数包括:第一网络输出层的损失函数、第二 网络输出层的损失函数以及第一网络输出层和第二网络输出层的综合损失函 数;
25.所述第一网络输出层的损失函数用以表征所述深度学习网络对出行目的 的建模损失;
26.所述第二网络输出层的损失函数用以表征所述深度学习网络对基于出行 目的生成的出行动作的时间和空间的建模损失。
27.在一个实施例中,所述第一网络输出层的损失函数包括:第一网络输出层 个人损失函数;第一网络输出层人群整体损失函数;
28.第二网络输出层的损失函数,包括:第二网络输出层的个人损失函数;第 二网络输出层人群整体损失函数;
29.所述综合损失函数,包括:个人综合损失函数和人群整体综合损失函数。
30.第三方面,本发明实施例提供一种出行需求的预测方法,包括:
31.获取个体的历史出行数据;
32.确定所述个体所属的人群分组;
33.根据所述历史出行数据,生成所述个体的出行链数据,所述出行链数据包 含所述个体在预设时间段内的至少一个出行动作记录以及所述至少一个出行 动作记录所对应的出行目的特征标签;
34.将所述个体的出行链数据,输入至预先训练的所述人群分组对应的出行需 求预测模型,通过所述出行需求预测模型输出所述个体在未来时间的出行链数 据。
35.在一个实施例中,出行需求的预测方法,还包括:
36.对不同个体在未来时间的出行链数据进行统计,预测预设的未来时间和/ 或预设的地理空间所涉及的人群出行情况。
37.第四方面,本发明实施例提供一种训练样本的生成装置,包括:
38.分类模块,用于按照预设的人群属性,对人群进行分类,得到不同的人群 分组;
39.训练样本数据生成模块,用于基于所述人群分组,将同一人群分组下的不 同个体在不同预设时间段内的出行链数据进行整合,得到同一人群分组对应的 出行需求预测模型的训练样本数据。
40.第五方面,本发明实施例提供一种出行需求预测模型的训练装置,包括:
41.获取模块,用于获取所述出行需求预测模型对应的人群分组的至少一批训 练样本数据;所述训练样本数据中包含所述人群分组中多个不同个体在不同时 间段内预设数量的出行链数据;
42.训练模块,用于将所述至少一批训练样本数据,分批次输入至预设的深度 学习网络,对所述深度学习网络进行训练,得到所述人群分组对应的出行需求 预测模型。
43.第六方面,本发明实施例提供一种出行需求的预测装置,包括:
44.出行链数据生成模块,用于获取个体的历史出行数据;并根据所述历史出 行数据,生成所述个体的出行链数据,所述出行链数据包含所述个体在预设时 间段内的至少一个出行动作记录以及所述至少一个出行动作记录所对应的出 行目的特征标签;
45.人群分组模块,用于确定所述个体所属的人群分组;
46.预测模块,用于将所述个体的出行链数据,输入至预先训练的所述人群分 组对应的出行需求预测模型,通过所述出行需求预测模型输出所述个体在未来 时间的出行链数据。
47.第七方面,本发明实施例提供一种服务器,其特征在于,包括:存储器、 处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行 所述程序时实现如前述的训练样本数据的生成方法,或者如前述的出行需求预 测模型的训练方法,或者如前述的出行需求的预测方法。
48.第八方面,本发明实施例提供一种非临时性计算机可读存储介质,其特征 在于,当所述存储介质中的指令由处理器执行时,能够实现如前述的训练样本 数据的生成方法,或者如前述的出行需求预测模型的训练方法,或者如前述的 出行需求的预测方法。
49.本发明实施例提供的上述技术方案的有益效果至少包括:
50.本发明实施例提供的上述出行需求模型的训练方法、出行需求预测模型的 训练方法和出行需求预测方法及装置,训练样本数据中包含了同一人群分组下 不同个体在不同预设时间段内的历史出行数据,根据预设时间段的长度,可实 现对个体中长期的出行需求的深度学习及预测,避免现有技术中只能实现短期 出行需求学习和预测以及模型训练过程在个体级别出现过拟合现象导致的无 法真正反应个体的出行需求的问题。并且,采用具有相同预设属性的人群的出 行链数据一并进行训练,也大大节省训练深度学习模型所耗费的计算资源,提 升了人群整体的建模效率。
51.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明 书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可 通过在所写的说明
书、权利要求书、以及附图中所特别指出的结构来实现和获 得。
52.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
53.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发 明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
54.图1为本发明实施例中训练样本数据的生成方法的流程图;
55.图2为本发明实施例中得到同一分组对应的出行需求预测模型的训练样本 数据的实现流程图;
56.图3为本发明实施例中出行需求模型的训练方法的流程图;
57.图4为本发明实施例中lstm深度学习网络的结构示意图;
58.图5为本发明实施例中出行需求的预测方法的流程图;
59.图6为本发明实施例中出行需求预测模型训练和出行需求预测的整体实现 框图;
60.图7为本发明实施例中训练样本的生成装置的结构框图;
61.图8为本发明实施例中出行需求预测模型的训练装置的结构框图;
62.图9为本发明实施例中出行需求的预测装置的结构框图。
具体实施方式
63.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了 本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被 这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本 公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
64.本发明的发明人发现,现有技术中大规模人群的微观需求预测的解决方案 多集中在两个方面,第一种是利用个体的行动数据,采用深度网络学习并预测 该个体下一个出行动作活动点位的时空分布,在做每一个出行活动的时空点位 预测时都依赖前面一个出行动作的信息,只能实现短期出行需求的预测;第二 种是利用个体历史的活动记录作为对未来出行行动的预测值。这种方案是基于 每个人的活动规律都是有迹可循且遵循某种规律性的假设,例如每周一早上城 市白领的通勤都是从住宅前往公司,但该方案无法通过深度网络捕捉外部环境 发生变化时,或用户自身出行的时序特征发生变化时,对需求造成的影响,也 就是说,该方案基于对用户出行周期性规律的假设进行拟合,无法真正反映出 用户的出行需求。
65.能够预测个体在未来相对长的一段时间的出行链,是实现微观需求预测的 基础,且在实际应用过程中,对城市人口每个个体都分别进行建模预测的算力 消耗代价是极大的。
66.基于发明人发现的现有技术中的上述问题,本发明实施例提供了一种用于 训练出行需求预测模型的训练样本数据的生成方法、出行需求预测模型的训练 方法和出行需求的预测方法。
67.首先对训练样本数据的生成方法进行详细的说明,参照图1所示,该训练 样本数据的生成方法包括下述流程:
68.s11、按照预设的人群属性,对人群进行分类,得到不同的人群分组;
69.s12、基于所述人群分组,将同一人群分组下的不同个体在不同预设时间 段内的出行链数据进行整合,得到同一人群分组对应的出行需求预测模型的训 练样本数据。
70.本发明实施例提供的上述训练样本数据的生成方法,用以生成用来训练出 行需求预测模型的训练样本数据,在训练样本数据中包含了同一人群分组下不 同个体在不同预设时间段内的历史出行数据,根据预设时间段的长度,可实现 对个体中长期的出行需求的深度学习及预测,避免现有技术中只能实现短期出 行需求学习和预测以及模型训练过程在个体级别出现过拟合现象导致的无法 真正反应个体的出行需求的问题。并且,采用具有预设共性的人群的出行链数 据进行训练,也大大节省训练深度学习模型所耗费的计算资源。
71.在本发明实施例中,上述“个体”是与人群相对的,是指人群中的任一个人, 或者指具体的某个人。
72.上述不同人群属性,也即意味着不同的人群分类标准。在本发明实施例中, 人群属性表征了人群中多个个体客观存在的同性,比如按照居住的小区或者工 作地进行分类,将居住在同一小区内或者在同一办公区域办公的人群都归于同 一个人群分组,不同的小区或不同办公区域分别对应不同的人群分组。又比如, 按照人群的出行方式(例如自驾车、地铁公交出行、骑行、步行等)、出行时 间等等标准进行分组,又或者是上述各种标准的综合,本发明实施例对于采用 何种具体的分类标准不做限定。
73.本发明实施例针对不同的人群分组分别训练与该人群分组对应的出行需 求预测模型,因此,不同人群分组会对应训练不同的出行需求预测模型,进行 出行需求预测时,也需要根据某个个体所属的人群分组,使用对应的出行需求 预测模型进行预测。
74.进一步地,上述步骤s12中,分别将同一人群分组下的不同个体的出行链 数据进行整合,得到同一分组对应的出行需求预测模型的训练样本数据,参照 图2所示,可使用下述流程实现:
75.s21、对同一人群分组下的不同个体,按照个体的用户标识和预设时间段 标识,将不同个体的历史出行数据,整理成不同个体在不同预设时间段内的出 行链数据;
76.出行链数据中包含个体在预设时间段内的至少一个出行动作记录以及至 少一个出行动作记录所对应的出行目的特征标签。
77.s22、将同一分组下不同个体在不同时间段的出行链数据,按照预设的出 行链数量和出行动作记录数量,切分成多批训练样本数据。
78.个体的历史出行数据,其数据所涉及的信息的一个例子可参照下表1:
79.表1
80.[0081][0082]
上表1中,示意出了包含一个出行动作记录的历史出行数据,一个出行动 作记录可记录为一个od(origin-destination,即出发地-目的地),一个od可 表征一次出行的行为,个体从一个出发地到目的地发生连续位移变化的行为可 视为一次出行行为。
[0083]
可根据一次出行行为的出行目的,确定出od所对应的出行目的特征标签。 出行目标标签可能有多种,例如工作、上班、购物等等。本发明实施例对此并 不做限定。
[0084]
出行链是个体在预设时间段内发生的至少一个出行记录的出行目的(例如 工作、居家或购物等)、以及各出行记录的时间和空间信息所组成的信息链。 在该信息链中包含的多个出行记录,在时间和空间上彼此关联且是序列化的, 比如上一出行记录的目的地,可以是下一个出行记录的出发点,上一个出行记 录的结束时间是下一个出行记录的开始时间等等。
[0085]
出行链数据例如可由历史出行数据经过特征工程整理而来,每个出行链数 据包含了预设时间段内的一个或多个出行动作记录(od)以及该出行动作记 录的出行目的特征标签。
[0086]
预设的时间段可根据数据的时间粒度来,比如按照“天”为粒度,同一天内 发生的一个或多个出行动作记录的相关数据作为一个出行链数据。
[0087]
当然还可以以其他时间长度作为时间粒度的单位,整理在时间粒度内发生 的出行动作记录的相关数据作为一个出行链数据,本发明实施例对此不做限定。
[0088]
在一个实施例中,上述s21在具体实施时,可通过下述流程整理出出行链 数据:
[0089]
1、生成出行链数据的键标识(key);键标识包括用户标识和日期的组合;
[0090]
2、在用户标识对应的个体的历史出行数据中,确定该日期内发生的至少 一出行动作记录的出行目的特征标签;
[0091]
3、将历史出行数据中出行动作记录的活动开始时间、持续时长和经纬度 数据,以及出行动作记录对应的出行目的特征标签,转换成预设的数据格式, 得到键标识对应的出行链数据。
[0092]
一个出行链数据的例子可参照下表2:
[0093]
表2:
[0094][0095]
上述表2中第6项“分类特征”即出行目的特征标签。上表2中只示意出包 含一个od的情况,一个出行链数据可包含多个od,本发明实施例并不限定 所包含的od的数量,可根据真实发生的数据来确定。
[0096]
表2可根据表1按照预定的数据格式进行处理得来。
[0097]
以表1和表2的信息为例,key可以是“id”和“日期”的组合得到。比如id 为“abc123”,日期为“20220621”,组合起来得到的key例如可以为
ꢀ“
20220621abc123”,这两个字段的组合关系还可以反过来,本发明实施例并不 限定key的具体格式。
[0098]
在一个实施例中,上述步骤s22可以将同属于同一个人群分组(例如同一 个gid)的多个不同个体的出行链数据,按照预设的出行链的数量,出行动作 记录数量,切分成多批数据集,即训练样本数据。
[0099]
同一人群分组中不同个体的出行链数据,例如可能包含不同个体在不同日 期内的各出行链数据,比如key为id1 date0、id1 date1、id1 date2、id2 date0、 id2 date1、id3 date2、id3 date0、id3 date1
……
等等。
[0100]
假设一个数据集即训练样本数据所包含的出行链为n条(也成为batch_size, 批大小),每个出行链包含m个出行动作记录(也称sequence_num),将上述 同一个人群分组内不同人群不同时间的出行链数据进行切分,在切分时,维度 不足n和m的情况下,比如实际出行链不足n条,和/或某条出行链包含不足 m个出行动作记录,需要补齐相应的数据,如果实际数据的出行链数据大于n 条,和/或出行链包含大于m个出行动作记录,则可以裁剪掉,进入下一批次 的训练样本数据。
[0101]
对于batch_size的大小,如果设置的大一些,收敛得快,也就是需要训练 的次数少,准确率上升稳定,但可能精度不高,如果设置的小一些,则收敛的 慢,但精度则稍高,可根据实际情况来预先设置。
[0102]
为了实现对个体的中长期出行需求的准确预测,在一个较佳的实施例中, 上述同一批次的训练样本数据整体的时间跨度可以长一些,比如以半个月或一 个月为时间跨度,即包含15天或者包含30天内的出行链数据。
[0103]
当然,本发明实施例并不对训练样本数据的时间跨度的长度进行限定,可 根据预测的时间跨度来决定训练样本数据的时间跨度的长度。
[0104]
同一人群分类所对应的多批训练样本数据可以用于对同一个出行需求预 测模型进行训练,得到该人群分组对应的出行需求预测模型。
[0105]
本发明实施例还提供了一种出行需求模型的训练方法,参照图3所示,该 方法包括:
[0106]
s31、获取出行需求预测模型对应的人群分组的至少一批训练样本数据; 训练样本数据中包含人群分组中多个不同个体在不同时间段内预设数量的出 行链数据;
[0107]
s32、将至少一批训练样本数据,分批次输入至预设的深度学习网络,对 深度学习网络进行训练,得到人群分组对应的出行需求预测模型。
[0108]
本发明实施例提供的上述出行需求模型的训练方法,将训练过程中,使用 人群分组中各个个体组成的整体的出行链进行批量学习,可以有利于防止出行 需求模型在个体级别出现过拟合现象,同时避免现有技术中使用个体的出行链 数据,对个体的出行需求模型进行训练的方式,实现了个体中长期出行需求的 学习和预测,提升了人群整体的建模效率。
[0109]
在本发明实施例中,深度学习网络可采用多种神经学习网络,例如lstm (long-short term memory,长短期记忆模型);lstm深度学习网络是一种递 归神经网络,可以学习和预测时间序列。
[0110]
建模时,可创建两层输出结构的lstm深度学习网络,即包含一输入层、 第一网络输出层和第二网络输出层;
[0111]
如前述实施例所述,训练样本数据集中的出行链数据,包括:至少一个出 行动作记录以及至少一个出行动作记录所对应的出行目的特征标签;出行动作 记录包括:活动开始时间、持续时长和经纬度数据;
[0112]
输入层包括预设数量的时序单元,用于接收输入的训练样本数据;
[0113]
第一网络输出层,用于输出计算得到的出行目的特征标签,并作为输入层 下个时序单元的输入数据;
[0114]
第二网络输出层,用于输出活动开始时间、持续时长和经纬度数据,并作 为输入层下个时序单元的输入数据;所述活动开始时间、持续时长和经纬度数 据基于第一网络输出层输出的出行目的特征计算得到。
[0115]
参照前述表2的内容,活动开始时间(start_hour_since_day)、持续时间 (duration)、经度(lat)和纬度(lon)这几项作为时序特征传入下一个时序单 元进行进一步计算。
[0116]
对于训练数据中的活动开始时间(start_hour_since_day)、持续时间 (duration)、经度(lat)和纬度(lon)对应的输出层为第二输出层,而 categorical_features(即出行目的特征标签)对应的输出层为第一输出层。
[0117]
其输出层和字段的关系如下表3所示:
[0118]
表3
[0119][0120]
上述输出层的层号为2代表第二输出层,层号为1则代表第一输出层。
[0121]
进一步地,上述步骤s32在具体实施时,使用训练样本数据对两层输出结 构的
lstm深度学习网络分批进行训练,在将每批次训练样本数据输入至预设 的深度学习网络后,再使用误差反向传播的方式,对深度学习网络的参数值计 算损失函数的梯度,并根据梯度更新所述参数值以使损失函数收敛,直至达到 预设的收敛条件。
[0122]
损失函数用于衡量模型所作出的预测离真实值(ground truth)之间的偏 离程度,预设的收敛条件可以是多种,例如损失函数收敛至达到局部最优点, 则认为达到预设的收敛条件。本发明提出一种联合概率密度的最大似然估计结 果作为损失函数的形式,该损失函数形式属于生成式模型的范畴。本发明实施 例对收敛条件并不做限定。
[0123]
反向传播(backpropagation),即“误差反向传播”的简称,是一种与最优化 方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。该方 法对网络中所有权重计算损失函数的梯度。这个梯度会回馈给最佳化方法,用 来更新权值以最小化损失函数。
[0124]
在本发明实施例中,lstm深度学习网络模型的损失函数包括:第一网络 输出层的损失函数、第二网络输出层的损失函数以及第一网络输出层和第二网 络输出层的综合损失函数;其中:
[0125]
第一网络输出层的损失函数用以表征所述深度学习网络对出行目的的建 模损失;
[0126]
第二网络输出层的损失函数用以表征所述深度学习网络对基于出行目的 生成的出行动作的时间和空间的建模损失。
[0127]
其中,第一网络输出层的损失函数包括:第一网络输出层个人损失函数; 第一网络输出层人群整体损失函数;
[0128]
第二网络输出层的损失函数,具体包括:第二网络输出层的个人损失函数; 第二网络输出层人群整体损失函数;
[0129]
综合损失函数,具体包括:个人综合损失函数和人群整体综合损失函数。
[0130]
为了更好地说明本发明实施例提供的出行需求模型的训练方法进行说明, 以下以一个具体的lstm深度网络学习网络的架构为例进行说明。
[0131]
包含两个输出层的lstm深度学习网络的结构示意图参照图4所示,y1表示第一网络输出层,y2表示第二网络输出层,h1表示第一个隐藏层,h2表示 第二个隐藏层。t表示时序点序号,数值越大表示时间越靠后。h1即第一隐藏 层用于输出下一时序的出行目的分类特征,h2即第二隐藏层用于根据第一网络 输出层输出的下一时序的出行目的分类特征,生成后续时序单元的时空点位 (时间和空间数据)。
[0132]
x
t
、x
t 1
、x
t 2

……
x
t m-1
依次是输入层的不同时序单元,一共是m个, x
t
是输入原始训练数据,x
t 1
、x
t 2

……
x
t m-1
是以上个时序单元对应的第一 网络输出层和第二网络输出层输出的时序特征作为输入。
[0133]
在图4中,实线箭头表示通过开始单元数据进行神经网络前向传递进行张 量计算得到结束单元数据的操作过程,虚线箭头表示该部分输出结果会被作为 时序特征再次传入到下个时序单元。
[0134]
上述lstm深度学习网络模型希望最大似然拟合两个网络层的输出分布, 则等同于最小化概率密度输出的负对数形式。对输出概率密度函数采用了负对 数的形式,并对第一层中添加softmax激活层(例如在第一隐藏层和第一网络 输出层之间),将出行目的分类
特征转化为概率的形式。
[0135]
第一网络输出层在个体上的损失函数为: [0136]
假设个体对出行的选择是符合独立分布的,那么同一人群分类(例如具有 相同gid的人群)则人群整体的第一网络输出层的损失函数例如为:
[0137][0138]
第二网络输出层在个体或群体分组的损失函数分别为:
[0139]
个体:
[0140]
人群分组整体的损失函数为:
[0141]
则个体或人群分组整体的综合损失函数如下:
[0142]
个体综合损失函数为:
[0143][0144]
人群分组整体的综合损失函数为:
[0145]
上述各式中,θ1和θ2为lstm深度学习网络模型的第一层和第二层参数; l1和l2为lstm深度学习网络模型的第一层和第二层损失函数,φ为softmax激 活函数,脚标序号为出行目的(比如在家、工作或其他)的类别序号,脚标序 号i为个体样本序号,脚标序号t为时序点序号,lat、lon、st、dur分别代表每 次od的纬度、经度、开始时间、持续时间。
[0146]
因为损失函数的输出采用的是概率的负对数形式,因此,在个体出行符合 独立分布的情况下,人群分类整体的损失函数的输出表现为个体损失函数之和。
[0147]
本发明所述还提供了一种基于前述已训练完成的出行需求模型的出行需 求预测方法,实现对个体短期、中长期的出行需求进预测。
[0148]
本发明实施例提供的出行需求的预测方法,参照图5所示,包括下述步骤:
[0149]
s51、获取个体的历史出行数据;
[0150]
s52、确定个体所属的人群分组;
[0151]
s53、根据历史出行数据,生成个体的出行链数据,出行链数据包含个体 在预设时
间段内的至少一个出行动作记录以及至少一个出行动作记录所对应 的出行目的特征标签;
[0152]
s54、将个体的出行链数据,输入至预先训练的人群分组对应的出行需求 预测模型,通过出行需求训练模型输出所述个体在未来时间的出行链数据。
[0153]
不同的人群分组对应不同的出行需求预测模型,在预测时,需要将个体归 属到对应的人群分类中去,然后将该个体的历史出行数据,整理成对应的出行 链数据,然后作为出行需求预测模型的输入,通过出行需求预测模型输出该个 体在未来同样时间跨度的出行链数据。
[0154]
由于lstm深度学习网络中的每个出行链数据中包含的od的数量通常不 为1,所以得到的预测结果也是序列化的,若训练时1条出行链中所有 sequence_num的结果对应个体1天的出行链,那么出行需求预测模型输出结果 也是1整天的维度。
[0155]
深度学习网络输出的预测结果中,既包含了出行目的标签(比如工作、居 家、购物等)、又包含了可能的时空点位信息(时间信息以及空间经纬度信息), 为后续进行宏观出行量的预测提供了基础。
[0156]
宏观的出行量,比如交通量都是由个体级别的出行需求汇总而成的,因此, 在一个实施例中,还可以基于个体的出行需求的预测,对于宏观的多人出行的 应用场景进行预测,
[0157]
比如,对不同个体在未来时间的出行链数据进行统计,预测预设的未来时 间和/或预设的地理空间所涉及的人群出行情况。
[0158]
举例子来说,比如,可以统计出“明天下午三点可能出现在xx大厦的总 人口数”,“明天晚上可能在xx小区的居住人数”等信息。或者,未来时间以驾 车方式出行、公共交通到达某地的比例是多少等等。
[0159]
一个出行需求预测模型训练和出行需求预测的整体实现框图可参照图6所 示。
[0160]
在图6中,gid=1和gid=2分别代表两个不同的人群分组。在gid=1的人群 分组中,包含id=1、id=2、
……
id=n1等个体,这些个体具有若干历史出行数 据,比如图6方框中所示的id1 date0、id1 date1、id1 date2、id2 date0、id2 date2、 id3 date1、id3 date2等等,这些历史出行数据,用以形成用于训练model_1 的训练样本数据,。
[0161]
在gid=2的人群分组中,包含id=n1 1,id=n1 2、id=n1 3、
……
id=n1 n2 等个体用户,这些个体具有若干历史出行数据,比如图6方框中所示的 id101 date0、id101 date2、id103 date1
……
等等,这些历史出行数据用以形成 用于训练model_2的训练样本数据。
[0162]
在图6的右侧部分,将id=2gid=1的某个个体的一条出行链,该出行链包 含8个od(出行动作记录)的数据输入至gid=1人群分组对应的出行需求预测 模型model_1中,model_1输出未来与该出行链时间跨度一致的(比如一天) 内的出行链的预测结果。
[0163]
其他个体的出行链的预测,比如id101、id103等的预测方式与此类似,在 此不再赘述。
[0164]
基于同一发明构思,本发明实施例还提供了一种训练样本的生成装置、出 行需求预测模型的训练装置和出行需求的预测装置,由于这些装置所解决问题 的原理与前述训练样本数据的生成方法、出行需求预测模型的训练方法和出行 需求的预测方法相似,因此
该装置的实施可以参见前述方法的实施,重复之处 不再赘述。
[0165]
本发明实施例提供了一种训练样本的生成装置,参照图7所示,包括:
[0166]
分类模块71,用于按照预设的人群属性,对人群进行分类,得到不同的人 群分组;
[0167]
训练样本数据生成模块72,用于分别将同一人群分组下的不同个体在不同 预设时间段内的出行链数据进行整合,得到同一人群分组对应的出行需求预测 模型的训练样本数据。
[0168]
本发明实施例提供了一种出行需求预测模型的训练装置,参照图8所示, 包括:
[0169]
获取模块81,用于获取所述出行需求预测模型对应的人群分组的至少一批 训练样本数据;所述训练样本数据中包含所述人群分组中多个不同个体在不同 时间段内预设数量的出行链数据;
[0170]
训练模块82,用于将所述至少一批训练样本数据,分批次输入至预设的深 度学习网络,对所述深度学习网络进行训练,得到所述人群分组对应的出行需 求预测模型。
[0171]
本发明实施例提供了一种出行需求的预测装置,参照图9所示,包括:
[0172]
出行链数据生成模块91,用于获取个体的历史出行数据;并根据所述历史 出行数据,生成所述个体的出行链数据,所述出行链数据包含所述个体在预设 时间段内的至少一个出行动作记录以及所述至少一个出行动作记录所对应的 出行目的特征标签;
[0173]
人群分组模块92,用于确定所述个体所属的人群分组;
[0174]
预测模块93,用于将所述个体的出行链数据,输入至预先训练的所述人群 分组对应的出行需求预测模型,通过所述出行需求预测模型输出所述个体在未 来时间的出行链数据。
[0175]
本发明实施例还提供了一种服务器,包括:存储器、处理器及存储于存储 器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前 述的训练样本的生成方法,或者如前述的出行需求预测模型的训练方法,或者 如前述的出行需求的预测方法。
[0176]
本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括计 算机程序,所述计算机程序被处理器执行时实现如前述的训练样本的生成方法, 或者如前述的出行需求预测模型的训练方法,或者如前述的出行需求的预测方 法。
[0177]
本发明实施例还提供了一种非临时性计算机可读存储介质,当所述存储介 质中的指令由处理器执行时,能够实现如前述的训练样本的生成方法,或者如 前述的出行需求预测模型的训练方法,或者如前述的出行需求的预测方法。
[0178]
关于上述实施例中的训练样本的生成装置、出行需求预测模型的训练装 置、出行需求的预测装置,其中各个模块执行操作的具体方式已经在有关该方 法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0179]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计 算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和 光学存储器等)上实施的计算机程序产品的形式。
[0180]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产 品的流程
图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入 式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算 机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0181]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能。
[0182]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0183]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发 明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及 其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献