针对车辆客流量的预测模型进行更新的方法及装置与流程

2021-09-28 20:04:00 来源：中国专利 TAG：计算机多个客流量说明书装置

1.本说明书一个或多个实施例涉及计算机技术领域，尤其涉及通过计算机针对车辆客流量的预测模型进行更新的方法和装置。

背景技术：

2.交通状况是城市地理环境的重要组成部分，是社会经济、城市发展的标志。合理的交通布局可以为居民提供便利。合理的交通布局例如包括，公交车投放、站点设置、出租车投放、红绿灯布局、道路布局等等。不合理的交通布局也会给城市布局以及环境带来一些问题，例如公交车乘客稀少造成资源浪费，人流量需求较大的路段缺乏有效公共交通工具，个别路段道路狭窄交通拥堵，等等。对城市车辆(例如公交车辆)的客流量模拟或预测，是对城市交通状况评估的重要手段。

技术实现要素：

3.本说明书一个或多个实施例描述了一种针对车辆客流量的预测模型进行更新的方法及装置，可以将数据转化成阵列形式，避免梯度下降方式数据汇总过程时不可导的现象，得到更有效的预测模型。
4.根据第一方面，提供了一种对车辆客流量的预测模型进行更新的方法，所述预测模型用于针对预定类型车辆进行客流量预测，所述方法包括：获取当前周期内的n条出行数据对应的样本特征矩阵，所述样本特征矩阵由所述n条出行数据分别对应的n个d维样本特征向量并列排布生成，其中，单条出行数据对应单个用户在当前周期内从一个起始点到一个目标点的一次出行行为；利用所述预测模型中的d维特征权重向量处理所述样本特征矩阵，基于处理结果得到针对所述预定类型车辆的n维车辆出行概率向量；获取n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵，其中，单个线路选择向量用于描述相应出行数据中，单个用户从相应起始点到相应目标点时，在m个候选线路的选择概率，所述m个候选线路与所述n条出行数据至少基于时间和地域相关联，并针对所述预定类型车辆确定；将所述线路选择矩阵与所述车辆出行概率向量进行融合，确定出分别与所述m个候选线路对应的m个预测客流量；基于所述m个候选线路在当前周期内分别对应的m个真实客流量和所述m个预测客流量的相似性对比，至少调整所述d维特征权重向量，从而更新所述预测模型。
5.根据一个实施例，在所述预定类型车辆为公交车辆的情况下，所述样本特征向量用于描述以下至少一项特征：用户画像、用户的历史出行效率偏好、出行时的天气、起始点和目标点距离、起始点与公交站距离、目标点与公交站距离、相关公交路次的运营时间和/或运营间隔。
6.根据一个实施例，所述样本特征矩阵中，各行分别对应各条出行数据，各列分别对应各个样本特征，所述d维特征权重向量为列向量，所述利用所述预测模型中的d维特征权重向量处理所述样本特征矩阵包括：将所述样本特征矩阵与所述d维特征权重向量的乘积
对应的n维列向量作为所述处理结果。
7.根据一个进一步的实施例，所述基于处理结果得到针对所述预定类型车辆的n维车辆出行概率向量包括：通过预先确定的激励函数将所述处理结果中的n维列向量上的各个元素映射为预定区间的数值，得到所述车辆出行概率向量。
8.根据一个实施例，单个线路选择向量通过以下的一种方式确定：将用户在与相应出行数据一致的起始点和目标点之间的历史出行中，选择各个候选线路的次数分别与总出行次数的各个比值，作为所述单个线路选择向量的各个元素；将相应出行数据对应的d维样本特征向量输入预先训练的线路选择模型，根据所述线路选择模型的输出结果确定所述单个线路选择向量。
9.根据一个实施例，所述候选线路包括第一线路，所述将所述线路选择矩阵与所述车辆出行概率向量进行融合，确定出分别与所述m个候选线路对应的m个预测客流量包括：将所述线路选择矩阵中，与所述第一线路对应的行/列中的各个元素，用所述车辆出行概率向量中相应元素为权重，进行加权求和，得到第一和值；将所述第一和值确定为所述第一线路上的预测客流量。
10.根据一个实施例，所述线路选择矩阵中的各行分别对应各条候选线路，各列分别对应各条出行数据，所述车辆出行概率向量为m维的列向量，所述将所述线路选择矩阵与所述车辆出行概率向量进行融合，确定出分别与所述m个候选线路对应的m个预测客流量包括：根据所述线路选择矩阵与所述车辆出行概率向量的乘积，得到m维列向量，所述m维列向量中的各个元素分别为与所述m个候选线路对应的m个预测客流量。
11.根据一个实施例，所述基于所述m个候选线路在当前周期内分别对应的m个真实客流量和所述m个预测客流量的相似性对比，至少调整所述d维特征权重向量包括：将以下中的一项作为损失函数：所述m个真实客流量和所述m个预测客流量之间的方差、均方差、平均绝对误差、总体相对误差、欧氏距离、余弦距离；向损失函数减小的方向调整所述d维特征权重向量。
12.根据第二方面，提供了一种对车辆客流量的预测模型进行更新的装置，所述预测模型用于针对预定类型车辆进行客流量预测，所述装置包括：
13.样本特征获取单元，配置为获取当前周期内的n条出行数据对应的样本特征矩阵，所述样本特征矩阵由所述n条出行数据分别对应的n个d维样本特征向量并列排布生成，其中，单条出行数据对应单个用户在当前周期内从一个起始点到一个目标点的一次出行行为；
14.第一处理单元，配置为利用所述预测模型中的d维特征权重向量处理所述样本特征矩阵，基于处理结果得到针对所述预定类型车辆的n维车辆出行概率向量；
15.线路概率获取单元，配置为获取n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵，其中，单个线路选择向量用于描述相应出行数据中，单个用户从相应起始点到相应目标点时，在m个候选线路的选择概率，所述m个候选线路与所述n条出行数据至少基于时间和地域相关联，并针对所述预定类型车辆确定；
16.第二处理单元，配置为将所述线路选择矩阵与所述车辆出行概率向量进行融合，确定出分别与所述m个候选线路对应的m个预测客流量；
17.更新单元，配置为基于所述m个候选线路在当前周期内分别对应的m个真实客流量
和所述m个预测客流量的相似性对比，至少调整所述d维特征权重向量，从而更新所述预测模型。
18.根据第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。
19.根据第四方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面的方法。
20.通过本说明书实施例提供的针对车辆客流量的预测模型进行更新的方法及装置，在针对车辆客流量的预测模型的训练过程中，通过矩阵方式代替数学表达式的运算方式，充分利用矩阵和向量的数学特征，完成运算和客流量汇总过程，从而避免了数学表达式中难以使用优化算法等问题，加快收敛速度，提高模型训练效率。进一步地，利用向量的特点，可以将损失函数定义为向量一致性，即使减少样本数据量，也不影响预测模型的准确度，进一步降低模型训练过程中的计算成本。
附图说明
21.为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
22.图1示出本说明书披露的一个实施例的实施场景示意图；
23.图2示出本说明书技术构思的实施架构示意图；
24.图3示出根据一个实施例的针对车辆客流量的预测模型进行更新的方法流程图；
25.图4示出根据一个实施例的针对车辆客流量的预测模型进行更新的装置的示意性框图。
具体实施方式
26.下面结合附图，对本说明书提供的方案进行描述。
27.图1示出了本说明书实施例的一个具体适用场景。图1是一个城市交通线路的示意图。其中，用白色线条表示城市道路，深灰色区域为水域，通过白色线条隔离出的浅灰色区域为建筑区域。可以理解，建筑区域可以是居住地、办公区域、生活服务区(如商超等)等等。这些区域可以作为城市人口流动的起始点或目标点。在大数据及智能终端的背景下，通常可以通过终端用户来描述城市人口。进一步地，一个用户从一个起始点到一个目标点的每一次出行，都可以对应一条出行数据。针对一个预定的时间周期，例如一个白天(如早上6点至晚上6点等)、一个晚上(如晚上6点至晚上10点等)、周一到周五等等，如果一个用户在该时间周期内从一个起始点到一个目标点有多次出行，就对应多条出行数据。
28.可以理解，在各条出行数据中，同一个起始点、目标点，可以有多种出行方式和出行线路可选。例如图1中示出的起始点a到目标点b，可以对应步行、骑行、自驾车、公交、打车等多种出行方式。每种出行方式下又有多个出行线路可以选择。图1中通过黑色线条和箭头示出了3种出行线路(也可以有更多种出行线路)。本领域技术人员容易理解，公交线路通常是固定的，即使一些公交车有部分线路重合，也不影响他们分别作为独立的线路进行处理。
因此，公交线路通常可以按照公交路次(如公交50路、公交2路等)进行区分，而不是实际道路区分。对于打车、步行、骑行、自驾车等而言，路线选择可以依据实际道路(如建设路、人民路等)，此时的路线可以形似图1示出的3种不同路线进行区分。
29.通常，在针对预定类型的车辆客流量预测过程中，可以先针对每条出行数据，确定是否为预定类型的车辆(如公交车辆)出行，在通过预定类型车辆出行的基础上，再结合具体通过哪条候选线路出行，然后，将某个时间周期内的各条出行数据按照候选线路进行汇总，可以得到各条候选线路上的客流量。如图2所示，给出了一个具体的实施架构。在模型训练过程中，可以通过汇总得到的客流量与真实客流量之间的误差，调整用语出行方式预测的逻辑回归模型。
30.在此过程中，可以通过预先建立的出行方式的二分类模型(如逻辑回归模型)，预测每条出行数据中，用户是否选择预定类型车辆出行，该二分类模型的参数估计好坏决定着最终的线路模拟误差大小。但是从出行数据到线路模拟误差的计算过程较为繁琐，涉及到多个数据结果的关联和聚合操作，例如将预定时间段内的各条出行数据按照候选的出行线路进行汇总操作。由于该步骤较难抽象成显式的数学表达式，而直接使用梯度下降类无约束优化算法进行参数求解时，出行方式类别概率、流量汇总、客流量误差等参数都需要有一定的连续性，从而无法适用。而在使用贪心搜索类的优化算法求解，则需要设置各个参数的搜索空间，以最终的流量整体相对误差作为评估指标，每轮迭代时并行地处理每个参数(仅搜索一个参数，固定其它参数取值)，每轮迭代结束时通过选择误差最小的参数取值对各个参数进行更新，重复进行上述迭代。这种方式下，参数搜索空间较大，导致较大的计算开销。
31.本说明书的技术构思下，将根据出行数据中的起始点和目标点，到出行线路选择的模拟误差的确定过程抽象成矩阵运算的形式，将最终的误差转化成向量之间的相似性，可以直接使用显式形式进行表达。相对于常规技术，可以使用向量相似性误差代替流量整体相对误差作为最终的优化目标，从而可以使用包括梯度下降算法、adam(adaptive moment estimation，自适应时刻估计)方法等在内的多种优化算法进行迭代求解，从而有效提高计算效率，加快收敛速度，减少计算量。
32.下面详细描述本说明书的技术构思。
33.图3示出一个实施例的针对车辆客流量的预测模型进行更新的流程。其中，这里的预测模型可以针对预定类型的车辆，如公交车辆、网约车辆、出租车辆等等，预测相应的客流量。该方法的执行主体可以是任何具有计算、处理能力的系统、设备、装置、平台或服务器。该方法适用于针对上述的预测模型，在训练过程中调整模型参数，从而更新预测模型的过程。通常，车辆客流量针对一个时间段，或时间周期才有意义。例如，某一天白天的客流量，工作日日均客流量等等。相应地，在训练预测模型时，可以以一定时间周期为单位，向预测模型输入相应时间周期内的出行数据，以及统计到的作为样本标签的客流量数据。在训练模型时，针对各个时间周期，还可以用该周期内的真实客流量作为样本标签，用于指导模型参数调整。
34.为了描述方便，将当前的时间周期记为当前周期，假设当前周期的出行数据为n条，如图3所示，该方法包括以下步骤：步骤301，获取当前周期内的n条出行数据对应的样本特征矩阵，样本特征矩阵由n条出行数据分别对应的n个d维样本特征向量并列排布生成，其
中，单条出行数据对应单个用户在当前周期内从一个起始点到一个目标点的一次出行行为；步骤302，利用预测模型中的d维特征权重向量处理样本特征矩阵，基于处理结果得到针对预定类型车辆的n维车辆出行概率向量；步骤303，获取n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵，其中，单个线路选择向量用于描述相应出行数据中，单个用户从相应起始点到相应目标点时，在m个候选线路的选择概率，m个候选线路与n条出行数据至少基于时间和地域相关联；步骤304，将线路选择矩阵与车辆出行概率向量进行融合，确定出分别与m个候选线路对应的m个预测客流量；步骤305，基于m个候选线路在当前周期内分别对应的m个真实客流量和m个预测客流量的相似性对比，至少调整d维特征权重向量，从而更新预测模型。
35.首先，在步骤301中，获取当前周期内的n条出行数据对应的样本特征矩阵。其中，各条出行数据可以对应一个d维样本特征向量，样本特征矩阵可以是由n条出行数据分别对应的n个d维样本特征向量并列排布生成。
36.可以理解，一个用户和其一次出行，可以对应一条出行数据，例如，为了确定工作日的客流量，当前周期可以是2019年12月的一个月周期，当前周期的出行数据可以包括2019年12月内各个周一到周五中任一用户的出行数据。如，用户a周一从a地点到b地点，对应一条出行数据，用户a周一还从b地点到c地点，对应另一条出行数据，周一从c地点回b地点、从b地点回a地点，分别对应另外两条出行数据，用户a周二从a地点到b地点，对应又一条出行数据，用户b周一从a地点到b地点对另外一条出行数据
……
也就是说，在当前周期内，符合条件的一个终端用户任一次从一个地点到另一个地点的出行分别构成各自对应的出行数据，两个不同的终端用户从同一地点到达另一相同地点，构成不同的两条出行数据。可以理解，对于作为样本的出行数据而言，还需要符合一定的条件，例如时间条件、地域条件等。这里的事件条件、地域条件等是和候选线路以及作为样本标签的真实客流量相关联的。其中，时间条件如上述的工作日等，还可以加上白天，即工作日白天，地域条件例如是北京市。
37.在对车辆客流量进行预测的技术构思下，通常需要对个各条出行数据都进行出行方式的预测。例如利用预先训练的逻辑回归模型预测出用户对各种出行方式的选择概率。用户选择出行方式需要考虑各种因素，以公交客流量为例，所需要的考虑的因素例如可以包括用户出行偏好、用户画像、用户出行效率偏好、出行时的天气、起始点和目标点距离、公交运营特征(如起始点与公交站的距离、目标点与公交站距离、相关公交路次的运营时间和/或运营间隔等等)、出行线路的路况特征(如是否拥堵等)、用户的起始点和目标点距离公交站的距离，等等。通过这些因素，可以针对各个样本出行数据提取相应的样本特征向量。其中，诸如公交运营特征、出行线路的路况特征之类的样本特征是与公交运营有关的特征，这些特征例如可以包括m个候选线路分别对应的相应特征。这里，m个候选线路可以是预定类型的车辆可选的线路。例如公交路次、汽车可通行的道路等。这样，随着m的增大，d的数量也增大。
38.假设样本特征向量为d维，则当前周期的n条出行数据的样本特征向量并行排列可以构成样本特征矩阵。其中，样本特征向量可以是行向量，也可以是列向量，在此不作限定。当样本特征向量是行向量时，n个样本特征向量可以生成一个维度为n
×
d的样本特征矩阵，当样本特征向量是列向量时，可以生成一个维度为d
×
n的样本特征矩阵。
39.从上述样本特征向量所描述的特征可知，各个样本特征向量还包含了候选路线的特征。值得说明的是，这里的n条出行信息与m个候选车辆/线路，除了时间都是当前周期外，在地域上也应该是相互关联和对应的。例如，北京市2019年12月份的公交客流量样本中，样本出行数据可以是该时间周期内所有地理位置为北京市(而非其他省市)的终端用户的出行数据，m个候选线路可以是北京市该时间周期内的所有公交车线路。
40.在当前周期内，m个候选线路还可以分别对应有车辆的真实客流量。这里的真实客流量是当前周期内，各个候选线路上的真实的乘客量。假设候选车辆/线路的数量为m，则分别对应m个真实客流量。这将在后续步骤中进一步描述，在此不再赘述。
41.接着，在步骤302中，利用预测模型中的d维特征权重向量处理样本特征矩阵，基于处理结果得到针对预定类型车辆的n维车辆出行概率向量。这里，车辆出行概率可以是用于描述对于某次可能的出行行为，乘坐预定类型车辆(如出租车或公交车)的可能性。
42.可以理解，特征权重向量中各个维度的元素可以用于衡量相应特征的重要程度。对于单条出行数据而言，可以将d维特征权重向量中的各个元素分别与相应d维样本特征向量中的各个元素，一一对应相乘，将各个乘积求和(可以理解为加权求和)，可以得到对相应出行数据的处理结果。在本说明书的技术构思下，可以利用矩阵和向量的特性，通过矩阵运算进行特征权重向量对样本特征矩阵的处理。
43.在样本特征矩阵为n行d列的情况下，每一行对应一条出行数据，每一列对应一个样本特征，特征权重向量可以是或者经过转置为一个d维的列向量，此时，可以用样本特征矩阵乘以该d维的列向量，以完成通过特征权重向量对样本特征矩阵的处理。相应的处理结果为一个n维的列向量。当n行d列的样本特征矩阵与d维的列向量相乘时，相当于各个样本出行数据的每维特征乘以相应的特征权重，加和得到处理结果中相应元素的值。处理结果的n维列向量中，每个维度的值可以对应一条样本出行数据的车辆出行概率。
44.反之，在样本特征矩阵为d行n列的情况下，每一行对应一个样本特征，每一列对应一条出行数据，特征权重向量可以是或者经过转置为一个d维的行向量。此时，可以用该d维的行向量乘以样本特征矩阵，以完成通过特征权重向量对样本特征矩阵的处理。相应的处理结果为一个n维的行向量。处理结果的n维行向量中，每个维度的值可以对应一条样本出行数据的车辆出行概率。
45.作为示例，假设样本特征矩阵可以是n维d列的矩阵，例如表示为：
[0046][0047]
其中，第一行表示第一条出行数据的d维样本特征向量，第n行表示第n条出行数据的d维样本特征向量。
[0048]
d维的特征权重向量例如表示为：
[0049][0050]
各个维度分别对应各个特征的权重。
[0051]
将矩阵x与列向量w相乘，得到一个列向量s：
[0052][0053]
列向量s中，每一行相当于把一个训练样本输入一个全连接神经网络的过程。本说明书的构思下，将其巧妙地转化成矩阵计算，相当于一次性把n个训练样本同时输入一个全连接神经网络并行计算。
[0054]
在可选的实现方式中，为了使得计算结果在可控的区间内，还可以通过激励函数将d维特征权重向量处理样本特征矩阵的处理结果映射到相应区间(如0-1区间)上，并将映射得到的向量作为n维车辆出行概率向量。以映射函数为sigmoid为例，针对前述的例子，可以得到以下列向量作为公交概率出行向量：
[0055][0056]
进一步地，通过步303，获取n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵。可以理解，一条出行数据对应着一个用户从相应起始点到相应目标点的一次可能的出行行为，该次出行行为中，用户针对m个出行路线都可以有一个选择的可能性，这里称之为线路选择概率。一条出行数据针对m个候选线路分别对应的线路选择概率，可以构成该条出行数据的m维线路选择向量。进一步地，n条出行数据各自对应的n个m维线路选择向量并行排列，可以生成线路选择矩阵。
[0057]
其中，m维的线路选择向量可以是行向量，也可以是列向量。在线路选择向量是行向量的情况下，线路选择矩阵可以为n行m列的矩阵，每一行可以对应一条出行数据，每一列可以对应相应出行数据中，用户在各个候选线路上的选择概率。在线路选择向量是列向量的情况下，线路选择矩阵可以为m行n列的矩阵，每一列可以对应一条出行数据，每一行可以对应相应出行数据中，用户在各个候选线路上的选择概率。
[0058]
根据一种可选的实施方式，单条出行数据的线路选择向量可以通过对历史数据进行统计获取。例如，一个用户在最近的预定时间段内(可以按照多个时间周期确定，也可以和时间周期无关，如一个月内)，在与该单条出行数据相同的起始点和目标点的多次出行中，对各个出行线路的选择在总出行次数中的占比。如，用户在预定时间段内在与该单条出行数据相同的起始点和目标点之间共出行10次，公交50路选择3次，公交51路选择4次，打车选择1次，不行选择2次。则对于“公交50路”这个线路选择的选择概率为3/10，对于“公交51路”这个线路选择的选择概率为4/10。在可选的实施例中，还可以仅考虑公交出行的基础上，对各个线路的选择概率，此时，公交出行总次数为7，则对于“公交50路”这个线路选择的选择概率为3/7，对于“公交51路”这个线路选择的选择概率为4/7。
[0059]
根据另一种可选的实施方式，线路选择向量可以根据预先训练的出行线路分配模型确定。该出行线路分配模型可以用于输出在各条候选线路上的选择概率。模型训练过程中，可以将多条公交出行数据作为训练样本，将从各条公交出行数据中提取的出行特征，依次输入选定的出行线路分配模型，并根据出行线路分配模型的输出结果与用户的真实出行路线选择结果的对比调整模型参数，从而训练出行线路分配模型。在本说明书实施架构下，
可以将各条作为样本的出行数据对应的样本特征分别输入该预先训练好的出行线路分配模型，并由出行线路分配模型输出用户选择各条公交线路的概率。在可选的实施例中，出行线路分配模型可以输出概率由大到小的预定数量(如4个)的出行线路上的选择概率。
[0060]
在其他实施方式中，还可能有其他方式确定各条出行数据对应的线路选择概率，在此不再赘述。
[0061]
可以理解，由于候选线路的数量为m，通过以上统计方式或者出行线路分配模型方式可能得到相应的少数候选路线上的选择概率，因此还需要进行数据转换，将所得到的线路选择概率结果转换为m维的线路选择向量。作为示例，假设通过出行线路分配模型从4条候选线路v、x、y、t中确定出两条线路上的出行概率，线路x对应概率0.8，线路y对应概率为0.2，则变换后的线路选择向量可以为(0，0.8，0.2，0)或(0，0.8，0.2，0)
t
。
[0062]
作为示例，n条出行数据分别对应的线路选择向量组合得到的线路选择矩阵例如可以表示为：
[0063][0064]
进一步地，通过步骤304，将线路选择矩阵与车辆出行概率向量进行融合，确定出分别与m个候选线路对应的m个预测客流量。可以理解，车辆出行概率向量中的元素描述了用户通过预定类型车辆出行的概率，线路选择矩阵中的行/列描述了用户在选择预定类型车辆出行时，选择各个候选线路的概率，那么借鉴条件概率的思想，用户选择某个候选线路出行的概率为，用户选择预定类型车辆出行的概率与用户选择该候选线路的线路选择概率的乘积。而个条出行数据中用户对该候选线路的线路选择概率之和，可以描述出在n条出行数据下，该候选线路上的预测客流量。
[0065]
如此，可以利用矩阵和向量的运算特点，将线路选择矩阵与车辆出行概率向量进行融合，从而确定出分别与m个候选线路对应的m个预测客流量。具体地，以m个候选线路中的第一线路为例，各条出行数据分别对应的在第一线路上的线路选择概率以各自的车辆出行概率维权中进行加权求和，可以作为在第一线路上的预测客流量。也就是说，线路选择矩阵中，对应于第一路线的行/列，与车辆出行概率向量相乘，得到一个数值，对应到第一线路的预测客流量。
[0066]
从而，根据矩阵和向量的运算特点，可以将线路选择矩阵与车辆出行概率向量进行转置或调换乘法运算的前后顺序，得到一个m维的行向量或列向量，其中的m个元素分别对应m个候选线路的预测客流量。具体的矩阵运算方法与步骤302中通过特征权重向量处理样本特征矩阵的过程类似，在此不再赘述。
[0067]
作为一个具体示例，假设线路选择矩阵为步骤303中的线路选择矩阵q，公交出行概率向量为步骤302中确定的公交出行概率向量s。在线路选择矩阵q中，每一行对应一条候选线路，可以理解为，各条出行数据中，用户分别选择当前候选线路出行的n个线路选择概率。而在车辆出行概率向量s(n维列向量)中，各个元素分别描述出各条出行数据中，用户分别选择预定类型车辆出行的概率。进一步地，线路选择矩阵q中任一行的行向量(对应一条候选线路)，与列向量s的乘积，可以描述相应候选线路上的预测客流量。即：
[0068][0069]
这里，l1至l
m
分别可以表示m个候选路线上的预测客流量。
[0070]
如此，利用矩阵的数学规律，代替显式的数学表达式的运算，可以有避开常规技术中的客流量汇总导致的优化难度增加等。
[0071]
然后，在步骤305中，基于m个候选线路在当前周期内分别对应的m个真实客流量和m个预测客流量的相似性对比，至少调整上述的d维特征权重向量，从而更新当前预测模型。可以理解，这里的相似性是对m个真实客流量和m个预测客流量整体的相似性进行衡量的指标。其可以利用诸如方差、均方误差、平均绝对误差、总体相对误差等等方式进行衡量，如果将m个真实客流量和m个预测客流量分别看作m维的向量，还可以通过欧氏距离、余弦距离等方式衡量他们的总体相似性。通常，方差、欧氏距离、余弦距离、均方误差、平均绝对误差、总体相对误差等的值越大，m个真实客流量和m个预测客流量的的整体相似度越小。为了使得预测客流量尽量接近真实客流量，m个候选线路的真实客流量和预测客流量的相似性应尽可能大。因此，可以向使得向量相似性尽可能小的方向调整至少包括上述的d维特征权重向量的模型参数。也就是说，上述的方差、均方误差、平均绝对误差、总体相对误差、欧氏距离、余弦距离等，可以作为模型训练过程中的损失函数。
[0072]
以总体相对误差为例，假设预测客流量为l1、l2、l3……
l
m
，真实客流量为总体相对误差可以表示为：
[0073][0074]
令：
[0075][0076]
则上述总体相对误差还可以表示为：
[0077][0078]
在训练预测客流量的预测模型时，可以向着总体相对误差减小的方向调整模型参数(至少包括前述的特征权重向量)。
[0079]
为了加快收敛速度，减少计算量，提高模型训练效率，通常还可以采用梯度优化算法之类的方法调整模型参数。在梯度优化算法中，每次可以向着梯度下降最快的方向调整模型参数。也就是计算过程中需要用到损失函数的梯度的极值，即二次导数的零值。而在使用绝对值的损失函数表示方式中，存在不可导的点，因此在使用梯度优化算法上存在困难。
[0080]
在另一个具体示例中，还可以采用余弦距离来作为损失函数。例如可以表示为：
[0081]
[0082]
其中，α表示两个向量之间的夹角，该夹角越小，cosα值越大，e2越小，因此，令余弦距离最小化，也就是两个向量之间的夹角最小化。余弦距离是二阶可导的损失函数，可以通过梯度优化算法、adam(adaptive moment estimation，自适应性炬估计)优化算法之类的优化方法求解。
[0083]
可以理解，在具体的客流量数值预测时，客流量的多少和出行数据条数有一定关系。而在各条线路的客流量预测过程中，如果各条线路上的客流量整体分布与真实客流量接近，就代表着预测模型的预测结果是准确的。而余弦距离利用的是两个向量之间的夹角，恰恰可以表示两个向量的整体一致性。当两个向量夹角为0时，说明预测客流量分布与真实客流量分布完全一致。至于向量的长短，与总的出行数据条数正相关。据此，在利用余弦距离作为损失函数的情况下，还可以对全体的出行数据进行随机抽样，从而减少计算量，提高模型训练效率，同时又不影响预测模型的准确度。
[0084]
如此，可以将无法通过数学显式表达的计算过程，转化为矩阵运算，运用矩阵的特点设置模型，求解模型参数。利用多个时间周期的出行数据对预测模型进行迭代更新，就可以逐步调整模型参数。
[0085]
特别地，根据一个实施例，在迭代过程中，可在样本特征矩阵上施加dropout之类的操作随机删除一部分特征及使用多份抽样结果交替训练，从而提高训练数据的多样性，避免过拟合，增强模型的泛化能力。
[0086]
在具体的业务处理过程中，可以使用训练好的预测模型预测预定类型车辆的客流量。预测过程中，可以先对一个时间周期内的用户出行数据进行预测。例如，对每个用户，预测在未来一周的工作日内可能的n条出行数据，如对于通勤上班族，可能有5条起始点为居住地目标点为工作地的出行数据，以及5条起始点为工作地目标点为居住地的出行数据，以及个条出行数据分别对应的出行时间。出行数据可以根据用户的画像、历史出行数据等等特征，通过出行预测模型确定，在此不再赘述。
[0087]
在获取上述时间周期的n条出行数据后，可以针对各条出行数据分别提取d维的特征向量，并组合生成特征矩阵，利用训练好的预测模型中的d维特征权重向量处理该特征矩阵，基于处理结果得到针对所述预定类型车辆的n维车辆出行概率向量。接着，获取这n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵，将该线路选择矩阵与n维车辆出行概率向量进行融合，得到m个候选线路对应的m个预测客流量。
[0088]
可选地，根据具体业务需求，还可以对m个预测客流量进行进一步处理。例如具体业务为预测公交线路的日均客流量，还可以将m个预测客流量分别按日平均。再例如，具体业务为预测出租车的平均载客量，还可以将m个预测客流量分别按相应线路上可能的出租车数量进行平均。具体业务还可以是其他业务，在此不再一一列举。
[0089]
回顾以上过程，在针对车辆客流量的预测模型的训练过程中，通过矩阵方式代替数学表达式的运算方式，充分利用矩阵和向量的数学特征，完成运算和客流量汇总过程，从而避免了数学表达式中难以使用优化算法等问题，加快收敛速度，提高模型训练效率。进一步地，利用向量的特点，可以将损失函数定义为向量一致性，即使减少样本数据量，也不影响预测模型的准确度，进一步降低模型训练过程中的计算成本。
[0090]
值得说明的是，预测模型的训练过程和预测模型通常是相一致的。区别在于，利用训练好的预测模型预测预定类型车辆的过程中，不包括更新模型的步骤。
[0091]
作为示例，利用训练好的预测模型预测预定类型车辆的流程可以包括以下步骤：
[0092]
样本特征获取步骤：获取待预测周期内的k条出行数据对应的特征矩阵。其中，特征矩阵由该k条出行数据分别对应的k个d维样本特征向量并列排布生成。这里，单条出行数据可以对应单个用户在待预测周期内从一个起始点到一个目标点的一次预测出行行为。也就是说，根据用户的历史出行行为等提取相应出行特征，预测各个用户在待预测周期内的可能出行行为。例如预测一个通勤用户下周一早上7点从居住地到办公地的依次可能出行行为。针对各条可能的出行数据，d维特征向量的提取方法与前述的样本特征想来那个提取方法一致，在此不再赘述。特征矩阵例如是k
×
d维，每一行对应一条可能的用户出行数据，每一列对应一个特征；
[0093]
第一处理步骤：利用训练好的预测模型中的d维特征权重向量处理上述特征矩阵，并基于处理结果得到针对预定类型车辆的k维车辆出行概率向量。其中，可以用d维特征权重与上述特征矩阵的乘积来确定k维车辆出行概率向量。例如，特征矩阵是k
×
d维，d维特征权重为或被调整为列向量，k
×
d维特征矩阵与d维特征权重的乘积为k维的列向量，向量中的各个元素分别对应每条出行数据利用预定类型车辆出行的概率，也就是k维车辆出行概率向量；
[0094]
线路概率获取步骤：获取k条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵。其中，单个线路选择向量用于描述相应出行数据中，单个用户从相应起始点到相应目标点时，在m个候选线路的选择概率。这m个候选线路与k条出行数据至少基于时间和地域相关联，并针对预定类型车辆确定；
[0095]
第二处理步骤：将线路选择矩阵与车辆出行概率向量进行融合，确定出分别与m个候选线路在待预测周期内分别对应的m个预测客流量。可以理解，车辆出行概率向量中的元素描述了用户通过预定类型车辆出行的概率，线路选择矩阵中的行/列描述了用户在选择预定类型车辆出行时，选择各个候选线路的概率，那么借鉴条件概率的思想，用户选择某个候选线路出行的概率为，用户选择预定类型车辆出行的概率与用户选择该候选线路的线路选择概率的乘积。而个条出行数据中用户对该候选线路的线路选择概率之和，可以描述出在n条出行数据下，该候选线路上的预测客流量。
[0096]
这里，利用矩阵乘法运算特点，同时完成单条出行数据中，用户利用预定类型车辆出行的概率与选择各条候选线路的概率的乘法(得到用户选择相应候选路线的概率)，以及针对各条候选线路，k条出行数据对应的选择相应候选线路的概率之和(得到相应候选路线在待预测周期内的预测客流量)。其方法与步骤304的描述相似，在此不再赘述。
[0097]
如此，可以利用矩阵乘法运算特点，对各个候选线路上的客流量进行汇总，简化了客流量汇总过程，从而可以节约计算量，降低计算复杂度。
[0098]
在一些可选的实施例中，为了避免一些特殊情形(如恶劣天气、交通故障等)造成的对最终结果的影响，可以将待预测周期确定为业务需求周期的倍数，并对预测结果求平均。例如，业务需求结果为工作日日均的公交客流量，可以将待预测周期确定为一周或一个月。通过预测可以确定待预测周期内各个工作日的出行数据，共k条，按照上述方法预测出m个预测客流量后，对待测周期内的工作日天数求平均，即为预测得到的工作日日均的公交客流量。当业务需求为出租车的日均客流量时，还可以按照候选路线预测出m个预测客流量后，对各个候选路线上可能出现的出租车数量求平均。
[0099]
根据另一方面的实施例，还提供一种针对车辆客流量的预测模型进行更新的装置。图4示出根据一个实施例的针对车辆客流量的预测模型进行更新的装置的示意性框图。这里预测模型可以针对预定类型的车辆进行客流量的预测。
[0100]
如图4所示，针对车辆客流量预测模型进行更新的方法装置400包括：
[0101]
样本特征获取单元41，配置为获取当前周期内的n条出行数据对应的样本特征矩阵，样本特征矩阵由n条出行数据分别对应的n个d维样本特征向量并列排布生成，其中，单条出行数据对应单个用户在当前周期内从一个起始点到一个目标点的一次出行行为；
[0102]
第一处理单元42，配置为利用预测模型中的d维特征权重向量处理样本特征矩阵，基于处理结果得到针对预定类型车辆的n维车辆出行概率向量；
[0103]
线路概率获取单元43，配置为获取n条出行数据各自在m个候选线路上的线路选择向量构成的线路选择矩阵，其中，单个线路选择向量用于描述相应出行数据中，单个用户从相应起始点到相应目标点时，在m个候选线路的选择概率，m个候选线路与n条出行数据至少基于时间和地域相关联，并针对预定类型车辆确定；
[0104]
第二处理单元44，配置为将线路选择矩阵与车辆出行概率向量进行融合，确定出分别与m个候选线路对应的m个预测客流量；
[0105]
更新单元45，配置为基于m个候选线路在当前周期内分别对应的m个真实客流量和m个预测客流量的相似性对比，至少调整d维特征权重向量，从而更新预测模型。
[0106]
在一个实施例中，在预定类型车辆为公交车辆的情况下，样本特征向量用于描述以下至少一项特征：用户画像、用户的历史出行效率偏好、出行时的天气、起始点和目标点距离、起始点与公交站距离、目标点与公交站距离、相关公交路次的运营时间和/或运营间隔。
[0107]
根据一种实施方式，样本特征矩阵中，各行分别对应各条出行数据，各列分别对应各个样本特征，d维特征权重向量为列向量，第一处理单元42进一步配置为：
[0108]
将样本特征矩阵与d维特征权重向量的乘积对应的n维列向量作为处理结果。
[0109]
在一个进一步的实施例中，第一处理单元42还配置为：
[0110]
通过预先确定的激励函数将处理结果中的n维列向量上的各个元素映射为预定区间的数值，得到车辆出行概率向量。
[0111]
根据一个可能的设计，装置400还包括线路概率确定单元(未示出)，配置为通过以下的一种方式确定单个线路选择向量：
[0112]
将用户在与相应出行数据一致的起始点和目标点之间的历史出行中，选择各个候选线路的次数分别与总出行次数的各个比值，作为单个线路选择向量的各个元素；
[0113]
将相应出行数据对应的d维样本特征向量输入预先训练的线路选择模型，根据线路选择模型的输出结果确定单个线路选择向量。
[0114]
根据一方面可选的实现方式，候选线路包括第一线路，第二处理单元44还配置为：
[0115]
将线路选择矩阵中，与第一线路对应的行/列中的各个元素，用车辆出行概率向量中相应元素为权重，进行加权求和，得到第一和值；
[0116]
将第一和值确定为第一线路上的预测客流量。
[0117]
根据另一方面可选的实现方式，线路选择矩阵中的各行分别对应各条候选线路，各列分别对应各条出行数据，车辆出行概率向量为m维的列向量，第二处理单元44进一步配
置为：
[0118]
根据线路选择矩阵与车辆出行概率向量的乘积，得到m维列向量，m维列向量中的各个元素分别为与m个候选线路对应的m个预测客流量。
[0119]
在一个实施例中，更新单元45进一步配置为：
[0120]
将以下中的一项作为损失函数：m个真实客流量和m个预测客流量之间的方差、均方差、平均绝对误差、总体相对误差、欧氏距离、余弦距离；
[0121]
向损失函数减小的方向调整d维特征权重向量。
[0122]
值得说明的是，图4所示的装置400是与图3示出的方法实施例相对应的装置实施例，图3示出的方法实施例中的相应描述同样适用于装置400，在此不再赘述。
[0123]
当预测模型训练好之后，至少确定的d维特征权重向量等参数，可以利用样本特征获取单元41、第一处理单元42、线路概率获取单元43，以及第二处理单元44来进行待预测周期内，针对预定类型车辆的多个候选路线的客流量预测，在此不再赘述。
[0124]
根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图3所描述的方法。
[0125]
根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图3所述的方法。
[0126]
本领域技术人员应该可以意识到，在上述一个或多个示例中，本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0127]
以上所述的具体实施方式，对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书的技术构思的具体实施方式而已，并不用于限定本说明书的技术构思的保护范围，凡在本说明书实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书的技术构思的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种物业管理用的空闲车位提示装置的制作方法

针对车辆客流量的预测模型进行更新的方法及装置与流程

相关文献

最热文献