一种基于迁移学习的城市轨道交通短时客流预测方法与流程

2022-03-09 01:59:22 来源：中国专利 TAG：

1.本发明涉及轨道交通客流预测技术领域，尤其涉及一种基于迁移学习的城市轨道交通短时客流预测方法。

背景技术：

2.在城市轨道交通智能化、智慧化运营的发展趋势之下，如何准确监控客流、实现运营组织的智能化、动态化是一个急需考虑的问题，而实现对城市轨道交通短时客流的精准预测是实现智能化运营的关键一环。
3.针对轨道交通短时客流预测，国内外目前有许多研究，并取得了一定的成果。在铁路客流量预测方面，有学者建立了模糊k近邻客流预测模型，对高速铁路短期客流进行预测。利用重力模型，基于区段客流量反推od(origin to destination，起点到终点)矩阵，实现对od客流量的预测。有学者构建了sarima(season autoregressive integrated moving average model，季节自回归求和移动平均模型)客流预测模型，对广珠城际铁路车站的客流量进行了以天为粒度的预测。铁路因为其特殊性，研究其日客流具有较大意义，但是城市轨道交通的发车间隔短，短时客流的随机性、波动性较大，预测需考虑的因素多，预测难度及较铁路客流大。
4.目前，在现有技术的城市轨道交通客流预测方案中，有学者采用k近邻算法，运用模糊聚类方法对广州地铁新线车站在客流成长期的进出站量进行了短时客流预测。对k近邻算法进行改进，对城市轨道交通的进站客流量进行了5分钟时间粒度的预测。运用滑动平均方法对城市轨道交通进行了预测。有学者提出了一种arima(autoregressive integrated moving average model，自回归移动平均模型)和小波分解的混合模型实现对城市轨道交通车站客流量的预测。采用arima模型分析既有站客流变化规律，之后引入站点可达性指标定量预测新线开通对既有站进出站客流的影响。将城市轨道交通客流分为常态和非常态，运用arima模型对常态客流进行短时预测，之后提出运用时间序列及回归分析的组合模型对非常态客流进行预测。有学者提出了一种奇异谱和加权极值机器学习方法相结合的混合模型，利用afc(automatic fare collection system，城市轨道交通自动售检票系统)数据，对杭州地铁换乘站的客流进行了预测。分别运用bp(back propagation)神经网络、最小二乘支持向量机，结合圈层人口变量和空间参数对城市轨道交通车站客流量进行了预测。
5.上述现有技术的城市轨道交通客流预测方案的缺点为：没有考虑多种因素对城市轨道交通短时客流的影响，不能揭示城市轨道交通短时客流波动的内在机理，分析不同环境下客流的规律主观性较强。虽然从afc数据中能有效挖掘出重要特征，但afc数据只包括一卡通刷卡的数据，自身的规律相对稳定，不包括波动性更大的一次票卡出行、手机扫码等出行数据，降低了问题难度。研究预测的对象只是少数几个站点，没有考虑地铁站点的自身特征和站点间的异质性，所提研究方法的普适性有限。

技术实现要素：

6.本发明的实施例提供了一种基于迁移学习的城市轨道交通短时客流预测方法，以实现有效地对城市轨道交通进行短时客流预测。
7.为了实现上述目的，本发明采取了如下技术方案。
8.一种基于迁移学习的城市轨道交通短时客流预测方法，包括：
9.基于城市轨道交通的各个车站的历史报表数据建立各个车站的客流特征评价指标体系；
10.基于各个车站的客流特征评价指标体系采用聚类算法对所有车站进行聚类；
11.对各个类别的聚类中心车站的全年进出站客流量进行时间序列分析，计算出聚类中心车站的客流指标，通过客流特征挖掘客流形成机理，对聚类中心车站的客流量进行预测，得到各个聚类中心车站的最优客流预测模型；
12.将各个聚类中心车站的最优客流预测模型代入同类别的其余车站，通过迁移学习方法对聚类中心车站的最优客流预测模型进行调整，得到各个类别车站的最优客流预测模型。
13.优选地，所述的基于城市轨道交通的各个车站的历史报表数据建立各个车站的客流特征评价指标体系，包括：
14.利用各个车站的历史报表数据，得到各个车站过去一段时间内全年小时粒度的进出站客流量，分别以月、周、日及小时为时间粒度统计各个车站的分时进出站客流量数据；
15.结合各个车站的进出站客流量数据，计算各个车站的不均衡系数、早晚高峰客流特征、早晚高峰出现时刻和客流量熵值等指标，建立各个车站的客流特征评价指标体系；
16.所述不均衡系数是指高峰小时客流量与全天平均小时客流量的比值。
17.所述早晚高峰客流特征是指早晚高峰平均每小时客流量。
18.所述早晚高峰出现时刻是指不同车站早晚高峰出现的时刻。
19.所述客流量熵值分为时间和空间两方面，客流量时间熵是指车站的乘客访问时段的熵值,代表了乘客访问该车站的时间分散程度,是评价车站功能的混合度情况的指标；
20.所述客流量空间熵是指车站被访问次数与人数的分布的熵值，代表了访问次数与对应人数分布的不均匀程度，间接反映了访问车站的乘客类型的多样性。
21.优选地，所述的基于各个车站的客流特征评价指标体系采用聚类算法对所有车站进行聚类，包括：
22.基于各个车站的客流特征评价指标体系，采用聚类算法对所有车站进行聚类，爬取车站周边的兴趣点poi数据，根据各个车站周边的poi数据对车站的聚类结果进行验证。
23.优选地，所述的对各个类别的聚类中心车站的全年进出站客流量进行时间序列分析，计算出聚类中心车站的客流指标，通过客流特征挖掘客流形成机理，对聚类中心车站的客流量进行预测，得到各个聚类中心车站的最优客流预测模型，包括：
24.根据各个聚类中心车站的时间序列分析结果，对客流具有明显时序规律的聚类中心车站采用时序预测模型进行客流规律挖掘，考虑各种因素和时序特征通过客流特征挖掘客流形成机理，对聚类中心车站的客流量进行预测。同时对预测模型进行改进，得到最优客流预测模型；
25.根据各个聚类中心车站的时间序列分析结果，对时序特征不明显的聚类中心车
站，考虑其周边的用地和其客流od特征，运用cnn及图卷积模型进行特征提取，挖掘其客流形成机理，对比不同模型的客流预测效果，选取最优客流预测模型。
26.优选地，所述的将各个聚类中心车站的最优客流预测模型代入同类别的其余车站，通过迁移学习方法对聚类中心车站的最优客流预测模型进行调整，得到各个类别车站的最优客流预测模型，包括：
27.将各个聚类中心车站的最优客流预测模型代入同类别的其余车站，利用迁移学习方法通过冻结训练好最优客流预测模型的主体参数，并对最优客流预测模型的其他参数进行微调，得到各个类别车站的最优客流预测模型。
28.由上述本发明的实施例提供的技术方案可以看出，本发明实施例通过构建地铁客流特征评价指标体系，实现了对车站客流特征的有效刻画。即能够考虑不同车站的客流特点，又能提高模型的预测精度和预测效率。
29.本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
30.为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
31.图1为本发明实施例提供的一种基于迁移学习的城市轨道交通短时客流预测方法的实现原理图；
32.图2为本发明实施例提供的一种基于迁移学习的城市轨道交通短时客流预测方法的处理流程图。
具体实施方式
33.下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。
34.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
35.本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。
36.为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。
37.本发明实施例提出了一种考虑客流特征的基于迁移学习的城市轨道交通短时客流预测方法。即能够考虑不同车站的客流特点，在满足模型预测精度的同时，也能提高模型的预测效率，降低模型训练时间，增加模型的适用性。
38.本发明实施例提供的一种基于迁移学习的城市轨道交通短时客流预测方法的实现原理图如图1所示，具体处理流程如图2所示，包括如下的处理步骤：
39.步骤s10、基于城市轨道交通的各个车站的历史报表数据建立各个车站的客流特征评价指标体系。
40.首先利用各个车站的历史报表数据，得到各个车站过去一段时间内全年小时粒度的进出站客流量，之后分别以月、周、日及小时为时间粒度统计各个车站的分时进出站客流量数据，并设置阈值，实现对异常客流量数据的识别。
41.然后，结合各个车站的进出站客流量数据，计算各个车站的不均衡系数、早晚高峰客流特征、早晚高峰出现时刻和客流量熵值等指标，建立各个车站的客流特征评价指标体系。
42.不均衡系数：高峰小时客流量与全天平均小时客流量的比值。
43.早晚高峰客流特征：早晚高峰平均每小时客流量。
44.早晚高峰出现时刻：不同车站早晚高峰出现的时刻。
45.客流量熵值：熵值是评价一个系统的混合度情况的一个指标。客流量熵值分为时间和空间两方面。客流量时间熵是指车站的乘客访问时段的熵值,代表了乘客访问该车站的时间分散程度,是评价车站功能的混合度情况的指标。
46.客流量空间熵是指车站被访问次数与人数的分布的熵值，代表了访问次数与对应人数分布的不均匀程度，间接反映了访问车站的乘客类型的多样性。
47.步骤s20、基于各个车站的客流特征评价指标体系，采用k-means、dbsacn、gmm及谱聚类等聚类算法对所有车站进行聚类。
48.爬取车站周边的poi(point of interest，兴趣点)数据。poi数据主要反映车站周边的用地情况，从而佐证车站的聚类结果，结合聚类结果给车站进行功能定性。根据各个车站周边的poi数据对车站的聚类结果进行验证。
49.步骤s30、结合车站聚类结果，选取各个类别的聚类中心车站作为研究对象，对各个研究对象的全年进出站客流量进行时间序列分析，计算自相关系数等客流指标。
50.根据各个聚类中心车站的时间序列分析结果，对客流具有较为明显时序规律的聚类中心车站采用考虑多因素的arima、lstm、transformer等时序预测模型进行客流规律挖掘，充分考虑各种因素和时序特征，通过客流特征挖掘客流形成机理，对聚类中心车站的客流量进行预测。同时对预测模型进行改进，得到最优客流预测模型，实现对客流量的有效预测。
51.根据各个聚类中心车站的时间序列分析结果，分析车站客流自相关系数，对时序特征不明显的聚类中心车站，则考虑其周边的用地和其客流od特征，运用cnn及图卷积等模型进行特征提取，深入挖掘其客流形成机理，之后实现对其客流的有效预测，对比不同模型的预测效果，选取最优预测模型。
52.步骤s40、到各个类别聚类中心车站的最优预测模型之后，为减少模型训练时间，增大方法的实用性，引入迁移学习的概念，将各个聚类中心车站的最优客流预测模型代入同类别的其余车站，通过冻结以训练好模型的主体参数，对模型其他参数进行微调，得到各个类别车站的最优客流预测模型。
53.为实现对城市轨道交通进出站客流量的有效预测，提高运营管理部门对城市轨道交通短期客流变化趋势的预见性，实现运力的精准投放，本发明实施例利用北京地铁2019年全年报表数据、北京2019年全年气象站监测数据、北京地铁2019年事故数据等多源数据，对北京市城市轨道交通短时客流进行预测研究。
54.最后，以北京地铁1号线的所有车站为预测实例，验证研究提出方法的实用性。同时将异常数据客流量与北京地铁2019年事故数据相结合，判断北京地铁事故是否会导致进出站客流量出现异常，并研究客流量出现异常的原因。
55.综上所述，本发明实施例通过构建地铁客流特征评价指标体系，实现了对车站客流特征的有效刻画；充分考虑各个车站的实际情况，提出了一站一预测方案的思路。引入迁移学习的概念，极大的减少了模型的训练时间，增大了模型的预测效率。
56.本发明实施例提出的考虑客流特征的基于迁移学习的城市轨道交通短时客流预测方法。即能够考虑不同车站的客流特点，又能提高模型的预测精度和预测效率。
57.本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。
58.通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
59.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
60.以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于迁移学习的城市轨道交通短时客流预测方法与流程

相关文献

最热文献