一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于stacking的多环境下短时公交客流预测方法与流程

2022-07-31 06:10:26 来源:中国专利 TAG:


1.本发明涉及时间序列、数据挖掘和智能交通研究领域,具体涉及一种基于stacking的多环境下短时公交客流预测方法。


背景技术:

2.公交调度策略是公交优先战略的保障。短时公交客流作为公交资源配置及公交网络规划的重要依据,其精确程度关乎公交运营调度策略的成败。
3.本发明为了提高多因素条件下短时公交客流的预测精度,提出一种基于大数据的多环境下的短时公交客流预测模型;分析了降雨、气温、节假日等多个条件与公交客流的相关关系,并揭示了不同降雨等级对公交客流量的影响;同时利用多模型集成算法和贝叶斯投票法,实现了客流预测的高预测精度。


技术实现要素:

4.为了克服现有技术的不足,本发明提供了一种基于stacking的多环境下短时公交客流预测方法,可以精准预测短时公交客流量,为公交调度最优化资源配置提供参考依据。技术方案如下:
5.第一方面,提供了一种基于stacking的多环境下的短时公交客流预测方法,该方法包括如下步骤:
6.步骤1,获取客流数据和特征数据;
7.获取某城市的部分公交线路的上下客流数据为基础数据,其中多维度特征包括:
8.线路名称;日类型;天气类型;气温类型;线路长度;线路类型;是否节假日;是否经过学校;是否经过商场;与地铁线重合程度;与其他公交线路重合程度。
9.把数据特征维度记为x=(x1,x2,

,xm),其中m是特征个数,xi表示各个特征的向量值。
10.每条线路的上下客流数据的时间间隔为10-30min,将每天的时段数量记为n,相应时段的客流量记为y1,y2,

,yn;
11.将某条线路每天的客流量y和特征x表示如下:
[0012][0013]
其中m是特征个数,n是时段个数。
[0014]
步骤2,线路客流预测;
[0015]
(1)利用秩相关系数来分析线路客流量与天气类型的相关性
[0016]
利用控制变量法,计算秩相关系数来分别计算天气类型对公交客流的影响,其秩相关系数rj为:
[0017][0018]
其中rj为第j个特征的秩相关系数,为正时表示正相关,为负时表示负相关,为零时表示不相关,d
ij
为两变量每一对样本的等级之差,即变量x
ij
与yi的差值。
[0019]
(2)设置秩相关系数阈值c,c》0,用秩相关系数绝对值大于c时的特征来训练svm模型。
[0020]
除了秩相关系数绝对值大于c时的特征,还增加预测日前t天中同一时间窗的上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入svm模型进行训练,建立svm预测模型,用测试集获取预测准确率p1;
[0021]
构建预测样本,将所述预测样本输入svm预测模型,获得该线路在目标时间窗的预测上车客流量。
[0022]
步骤3,交通小区客流预测;
[0023]
进行交通小区的划分;
[0024]
用多维度特征来训练随机森林模型:
[0025]
除了多维度特征,再增加预测日前t天中同时间窗的上车客流量和同时间窗可直达交通小区上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入随机森林模型进行训练,建立随机森林预测模型,用测试集获取预测准确率p2。
[0026]
构建预测样本,将所述预测样本输入随机森林预测模型,获得该交通小区在目标时间窗的预测上车客流量。
[0027]
步骤4,线路各站点客流预测;
[0028]
用多维度特征来训练岭回归模型:除了多维度特征,增加预测日前t天中同时间窗的上车客流量和同线路可直达的相关站点上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入岭回归模型进行训练,建立岭回归预测模型,用测试集获取预测准确率p3。
[0029]
构建预测样本,将所述预测样本输入岭回归预测模型,获得该站点在目标时间窗的预测上车客流量。
[0030]
步骤5,利用线路客流预测结果、交通小区客流预测结果、站点客流预测结果来进行综合调整,给出三者的最终客流预测结果。
[0031]
优选的,按照步骤2(1)的方法对数据特征进行相关性分析,可以得到:
[0032]
日类型和天气类型:工作日降雨天气与公交客流存在较强的负相关关系,周末存在极强的负相关关系,随着雨量的增大,对客流的不利影响也越大;
[0033]
线路类型和天气类型:夜间公交降雨天气与公交客流存在较强的负相关关系,旅游专线存在极强的负相关关系,随着雨量的增大,对客流的不利影响也越大;
[0034]
线路长度和天气类型:长距离公交降雨天气与公交客流存在较强的负相关关系。随着雨量的增大,对客流的不利影响也越大。
[0035]
优选的,步骤2为了保证各时段的数据合理性,消除时变性引起的差异,引入数据平滑项“客流偏差率”α:
[0036][0037]
其中α为小时客流偏差率;vi为当天第i个时间窗的实际客流量;为9期客流量均值,即即优化后的客流量为vi*(1-α)。
[0038]
优选的,步骤3划分交通小区,首先以行政边界进行划分,形成初步的交通中区;再以河道、湖泊、山林、城墙、铁路、高快速路等自然障碍进行划分,并检查风景区、大型商场、交通枢纽的土地利用相对独立的区域是否被分隔,如果被分隔需进行适当合并;然后分区域评估交通小区划分的均衡性,根据均衡性评估结果,结合城市道路进行细划或小区合并。
[0039]
优选的,步骤5具体包括:
[0040]
假设某一时间窗的某交通小区客流预测结果为ai,同一时间窗的在该交通小区内的站点客流预测结果为a
i1
,a
i2
,

,a
ih
,其中h为该交通小区包含的站点总数,利用贝叶斯投票法来调整各站点客流预测值,具体公式如下
[0041][0042]
用作为最终预测值来替代a
ij

[0043]
通过将准确率更高的模型赋予更高的权重来互补,提升了预测准确率。
[0044]
假设某一时间窗的某条线路客流预测结果为ai,同一时间窗的属于该线路的站点客流预测结果为a
i1
,a
i2
,

,a
ik
,其中k为该线路包含的站点总数。利用贝叶斯投票法来调整各站点客流预测值,具体公式如下:
[0045][0046]
用作为最终预测值来替代a
ij

[0047]
根据得到每个站点在各个时间窗的预测值,继续利用贝叶斯投票法得到站点客流的最终预测值:
[0048][0049]
然后再利用各站点客流最终预测值求和计算可得到交通小区最终客流量和线路最终客流量。
[0050]
与现有技术相比,上述技术方案中的一个技术方案具有如下有益效果:通过秩相关系数和pearson相关系数选出较强相关特征,利用svm实现线路短时公交客流预测;再用随机森林模型实现交通小区短时公交客流预测,然后用岭回归模型实现站点短时公交客流预测,最后通过贝叶斯投票完成最终预测值修复,极大的降低了预测误差。实现了精准预测短时公交客流量,为公交调度最优化资源配置提供参考依据。
具体实施方式
[0051]
为了阐明本发明的技术方案和工作原理,下面将对本公开实施方式做进一步的详细描述。上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
[0052]
本技术的说明书和权利要求书中的术语“步骤1”、“步骤2”、“步骤3”等类似描述是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里描述的那些以外的顺序实施。
[0053]
本公开实施例提供了一种基于stacking的多环境下的短时公交客流预测方法,该方法包括如下步骤:
[0054]
步骤1,获取客流数据和特征数据;
[0055]
获取某城市的部分公交线路的上下客流数据为基础数据,其中多维度特征包括:
[0056]
线路名称;日类型(工作日、周末);天气类型(无雨、小雨、中雨、大雨、暴雨);气温类型(适温、高/低温);线路长度;线路类型(旅游专线、市内干线、市内支线、市内快线、高快巴士、夜间公交、高峰专线);是否节假日;是否经过学校;是否经过商场;与地铁线重合程度(无重合、部分重合、高度重合、完全重合);与其他公交线路重合程度(无重合、部分重合、高度重合、完全重合)。
[0057]
把数据特征维度记为x=(x1,x2,

,xm),其中m是特征个数,xi表示各个特征的向量值。
[0058]
每条线路的上下客流数据的时间间隔为15min,将每天的时段数量记为n,相应时段的客流量记为y1,y2,

,yn;
[0059]
将某条线路每天的客流量y和特征x表示如下:
[0060][0061]
其中m是特征个数,n是时段个数。
[0062]
步骤2,线路客流预测;
[0063]
(1)利用秩相关系数来分析线路客流量与天气类型的相关性
[0064]
利用控制变量法,计算秩相关系数来分别计算天气类型(记为0,1,2,3,4,5个等级代表雨量的大小,从0到4雨量依次增大)对公交客流的影响,其秩相关系数rj为:
[0065][0066]
其中rj为第j个特征的秩相关系数,为正时表示正相关,为负时表示负相关,为零时表示不相关,d
ij
为两变量每一对样本的等级之差,即变量x
ij
与yi的差值。
[0067]
优选的,按照步骤2(1)的方法对数据特征进行相关性分析,可以得到:
[0068]
1)日类型和天气类型:工作日降雨天气与公交客流存在较强的负相关关系,周末存在极强的负相关关系,随着雨量的增大,对客流的不利影响也越大。
[0069]
降雨对非工作日公交客流影响较大的原因是工作日出行多为以工作为目的刚性通勤需求,刚性需求几乎不受外界因素影响;而周末出行主要为旅游、购物等弹性需求,一旦出现降雨等不利天气情况,居民大多会改变出行方式或者取消出行。
[0070]
2)线路类型和天气类型:夜间公交降雨天气与公交客流存在较强的负相关关系,旅游专线存在极强的负相关关系,随着雨量的增大,对客流的不利影响也越大。而且不同性质及重要程度的公交线路的客流受到降雨天气的影响程度不同。
[0071]
降雨对旅游专线客流影响较大的原因是旅游专线一般以旅游出行为主,一旦出现降雨等不利天气情况,居民大多会取消出行。
[0072]
3)线路长度和天气类型:长距离公交降雨天气与公交客流存在较强的负相关关系。随着雨量的增大,对客流的不利影响也越大。
[0073]
降雨对长距离公交客流影响较大的原因是一般长距离公交多是跨区线或绕行线路,一旦出现降雨等不利天气情况,会导致出行时间大大增加,居民大多会更换出行方式。
[0074]
同样地,利用pearson相关系数也能得到气温类型的相应影响关系。
[0075]
(2)设置秩相关系数阈值c,c》0,用秩相关系数绝对值大于c时的特征来训练svm(rbf核)模型。
[0076]
除了秩相关系数绝对值大于c时的特征,还增加预测日前t天中同一时间窗的上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入svm模型进行训练,建立svm预测模型,用测试集获取预测准确率p1;
[0077]
构建预测样本,将所述预测样本输入svm预测模型,获得该线路在目标时间窗的预测上车客流量。
[0078]
优选的,步骤2为了保证各时段的数据合理性,消除时变性引起的差异,引入数据平滑项“客流偏差率”α:
[0079][0080]
其中α为小时客流偏差率;vi为当天第i个时间窗的实际客流量;为9期客流量均值,即即优化后的客流量为vi*(1-α)。
[0081]
步骤3,交通小区客流预测;
[0082]
进行交通小区的划分;
[0083]
优选的,步骤3划分交通小区,首先以行政边界(街道、村镇)进行划分,形成初步的交通中区;再以河道、湖泊、山林、城墙、铁路、高快速路等自然障碍进行划分,并检查风景区、大型商场、交通枢纽等土地利用相对独立的区域是否被分隔,如果被分隔需进行适当合并;然后分区域评估交通小区划分的均衡性,通常交通小区面积为依据,面积一般在1-2平方千米左右,外围区域面积可适当扩大,根据均衡性评估结果,结合城市道路进行细划或小区合并。
[0084]
用多维度特征来训练随机森林模型:
[0085]
除了多维度特征,再增加预测日前t天中同时间窗的上车客流量和同时间窗可直达交通小区上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入随机森林模型进行训练,建立随机森林预测模型,用测试集获取预测准确率p2。
[0086]
构建预测样本,将所述预测样本输入随机森林预测模型,获得该交通小区在目标时间窗的预测上车客流量。
[0087]
步骤4,线路各站点客流预测;
[0088]
用多维度特征来训练岭回归模型:除了多维度特征,增加预测日前t天中同时间窗的上车客流量和同线路可直达的相关站点上车客流量作为训练样本,将训练样本拆分成训练集和测试集,将训练集输入岭回归模型进行训练,建立岭回归预测模型,用测试集获取预测准确率p3。
[0089]
构建预测样本,将所述预测样本输入岭回归预测模型,获得该站点在目标时间窗的预测上车客流量。
[0090]
步骤5,利用线路客流预测结果、交通小区客流预测结果、站点客流预测结果来进行综合调整,给出三者的最终客流预测结果。
[0091]
优选的,步骤5具体包括:假设某一时间窗的某交通小区客流预测结果为ai,同一时间窗的在该交通小区内的站点客流预测结果为a
i1
,a
i2
,

,a
ih
,其中h为该交通小区包含的站点总数,利用贝叶斯投票法来调整各站点客流预测值,具体公式如下
[0092][0093]
用作为最终预测值来替代a
ij

[0094]
通过将准确率更高的模型赋予更高的权重来互补,提升了预测准确率。
[0095]
假设某一时间窗的某条线路客流预测结果为ai,同一时间窗的属于该线路的站点客流预测结果为a
i1
,a
i2
,

,a
ik
,其中k为该线路包含的站点总数。利用贝叶斯投票法来调整各站点客流预测值,具体公式如下:
[0096][0097]
用作为最终预测值来替代a
ij

[0098]
根据得到每个站点在各个时间窗的预测值,继续利用贝叶斯投票法得到站点客流的最终预测值:
[0099][0100]
然后再利用各站点客流最终预测值求和计算可得到交通小区最终客流量和线路最终客流量。
[0101]
以上对本发明进行了示例性描述,显然,本发明具体实现并不受上述方式的限制,凡是采用了本发明的方法构思和技术方案进行的各种非实质性的改进;或者未经改进、等同替换,将本发明的上述构思和技术方案直接应用于其他场合的,均在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献