一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特征处理的交通流量预测方法及设备与流程

2022-12-02 19:28:13 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种基于特征处理的交通流量预测方法及设备。


背景技术:

2.在交通高度发达的现代社会,车辆出行是人们自由出行的优选。但是物极必反,随着车辆数量的快速增长,路面交通资源渐渐满足不了交通车流量的膨胀,这样会导致出行时间增加和生产力的损失。只有更好规划路面交通资源,才有可能解决这一问题,提高交通效率。
3.对此,申请人也进行了深入的研究,并且在期刊《西部交通科技》2020年11月刊中发表了一篇论文:《基于时空信息的高速公路出入口交通车流量预测》。文中提出了一种基于时空信息的使用梯度提升决策树的车流量预测方法,主要将多种时序信息与空间信息映射成相应特征输入训练模型,使用一种经过调优的梯度提升的训练方法进行训练并完成相应的预测任务。
4.在此基础上,近年来,空间特征也逐渐被考虑进入有关交通的相关研究。例如申请号为cn202010741049.8的发明专利《一种基于深度学习融合模型的城市交通流量预测方法》中就提供了一种基于深度学习融合模型的城市交通流量预测方法,包括:步骤1、构建交通流量预测数据属性库;步骤2、将城市路网按照不同用途划分成不同的区块,将历史交通流量数据进行预处理并分别统计不同时间段的交通流量,构建交通流量输入矩阵,建立二进制矢量图;步骤3、构建3dlsacn模型和resnet残差网络相结合作为交通流量特征提取的深度学习融合模型,利用二进制矢量图作为输入进行特征提取,分别提取时空特征、周期特征并进行融合,得到初步融合结果;步骤4、手动提取外部影响因素组成外部特征并与初步融合结果再次进行融合,最后输出所需预测的交通流量信息。该发明能够提供给定时间空间信息下交通流量的预测,有助于及时进行调度,缓解城市交通压力问题。
5.但是这样的预测完全是针对城市的,无法应用于高速路上的车流量预测。同时这样的预测对于一些特殊时间点,例如春节或五一长假等非典型时间状况无法实现准确的预测。同时,现有技术中即便对可能到来的交通高峰进行了准确预估,也无法提前进行调度,或者说无法判断后续的调度工作是否最优方案。


技术实现要素:

6.针对现有技术的缺点,本发明的目的是提供一种基于特征处理的交通流量预测方法,通过采集、特征优化、时间比对等方法提高预测高速路口收费站处的车流量的准确性。并且利用预测结果对高速路口的车流量进行调控,从而尽可能实现保证安全状态下的最大车流量。
7.为了实现上述目的,本发明一种基于特征处理的交通流量预测方法,用于高速出入口车流管理;针对每个高速出入口建立第一时间线,第一时间线为历史时间线,建立第二
时间线,第二时间线为需预测车流量所处的时间段;基于第二时间线上的时间段获取多条相关对应第一时间线中该高速公路出入口的特征信息和车流量数据;建立lstm模型,该模型输入为第二时间线的时序特征,采用lstm模型进行多元时间序列预测;在多元时间序列预测基础上建立基于优化的梯度提升的决策树模型;最终建立时空信息与其他相关特征信息的预测模型;利用时空信息与其他相关特征信息的预测模型计算第二时间线上的预测车流量;当预测的车流量超过安全预期时对指定高速出入口进行预调控管理。
8.优选的,还包括时间线管理,即获取第二时间线中某一时间段的特征信息,根据所述特征信息检索在第一时间线中检索最接近的对应时间段,并获取所述第一时间线中的对应时间段中记载的车流量信息。
9.优选的,所述特征信息包括气象特征、空间特征以及特例场景特征。从这些特征信息中获取影响车流量的具体特征。
10.优选的,lstm网络输入层维度计为m,设共有车流量数据为m,时间步长大小为t,特征个数为f,则该系统共有m-t个样本:
11.步骤一:设训练数据集长度为s,则训练数据集的输入为:
12.x={x1,x2,

,xs}
13.式中:
14.xs={{f
s,1
,f
s,2


,f
s,m
},

,{f
s t-1,1
,f
s t-1,2


,f
s t-1,m
}};
15.步骤二:训练集输出为:
16.y={y1,y2,

,ys}式中:ys为第s时刻的车流量;
17.步骤三:测试集输入数据长度为l=m-t-s,则测试集的输入为:
18.x

={x
′1,x
′2,

,x

l
}
19.式中:
20.x

l
={{f
s t 1,1
,f
s t 1,2


,f
s t 1,m
},

,{f
m,1
,f
m,2


,f
m,m
}};
21.步骤四:测试集输出为:
22.y

={y
′1,y
′2,

,y

l
}
23.式中:y

l
为第l时刻车流量;
24.步骤五:网络的损失函数为mse,采用adam优化器对训练集数据进行训练,对测试集数据进行测试并进行迭代。
25.lstm(long short term memory,长短时记忆网络),是一种特殊的rnn(recurrent neural network,循环神经网络),能够学习长期的依赖关系。计算时我们要根据输入状态,确定输出值。首先我们使用一个sigmiod函数来去确定细胞状态的哪部分需要输出,然后把细胞状态通过tanh层处理,两者相乘得到最终我们想要输出的信息。
26.优选的,基于时空信息的梯度提升的决策树预测模型采用皮尔逊相关系数ρ:
[0027][0028]
x,y是分别取一条时间线上不同时段不同站点入口的车流量,分别算得取的那两个站点的相关系数;cov()是协方差,σ是指标准差。
[0029]
优选的,相关特征信息后进行分解获取和车流量产生直接关系的参数带入到公式
中。
[0030]
优选的,预调控管理的具体方法为入口匝道控制以道路本身的容量为依据,控制匝道进入的交通流量,保持主线交通流始终处于畅通状态。具体包括匝道定时限流法、封闭匝道法、以及匝道感应交汇控制法。
[0031]
本发明还包括一种用于交通流量预测的设备,包括:
[0032]
计时器:用于建立并管理第一时间线和第二时间线;
[0033]
存储装置;用于存储高速出入口车流历史数据,
[0034]
数据采集装置,即时将高速出入口车流信息输入到存储装置中;
[0035]
与所述存储装置连接的处理器,用于执行基于特征处理的交通流量预测方法。
[0036]
优选的,所述处理器中包括基于设置的模型进行计算处理的计算模块,以及将计算结果和历史记录对比的对比模块,根据比对结果优化预调控管理方法。这样通过对比可以不断优化预测的准确率。
[0037]
优选的,还包括主动切换模块,所述主动切换模块连接人工调控装置,所述人工调控装置用于手动关闭指定高速出入口匝道,从而控制车流量。当发生紧急状况时可以通过人工调控装置直接接管控制高速出入口的匝道。
[0038]
通过本发明公开的技术方案,本发明通过对特征的细化,明确具体对预测有直接关系的关键特征,并且在建立模型前先建立了lstm网络结构,采用lstm模型进行多元时间序列预测。使得最终建立的实际预测模型更为准确。
[0039]
其中“在多元时间序列预测基础上建立基于优化的梯度提升的决策树模型;最终建立时空信息与其他相关特征信息的预测模型;利用时空信息与其他相关特征信息的预测模型计算第二时间线上的预测车流量”这些步骤中采用的模型还是《基于时空信息的高速公路出入口交通车流量预测》论文中所记载的模型,但是模型所用的参数有所调整,且增加了采用时间线对比来验证预测的准确性,从而提高模型的准确性。
[0040]
与现有技术相比,采用本发明技术方案和现有预测的方式相比,预测精度进一步得以提高,而且避免了在极端情况下,例如节假日或者突发恶劣气候时预测偏差较大的问题。同时对于预测的结果配置了相应的处理方案,确保能有效应对突发的状况。对于最终处置情况进行对比,不断优化处理方案,进而优化高速路口车流量的调控策略。
附图说明
[0041]
图1是本发明所采用的方法的流程示意图。
[0042]
图2是本发明一种用于交通流量预测的设备框架示意图。
[0043]
图3是本发明的测试结果和实际车流量对比示意图。
[0044]
图4是本发明的lstm模型网络结构示意图。
[0045]
图5是本发明的lstm模型中输入层数据,即车流量的多特征量表示示意图。
[0046]
图6是本发明一种用于交通流量预测的设备的示意图。
具体实施方式
[0047]
下面对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。
[0048]
如图1所示可见本发明一种基于特征处理的交通流量预测方法,该方法利用图2所示的设备实现。用于高速出入口车流管理;针对每个高速出入口建立第一时间线,第一时间线为历史时间线,建立第二时间线,第二时间线为需预测车流量所处的时间段。基于第二时间线上的时间段中的特征来寻找获取多条相关对应第一时间线中该高速公路出入口的特征信息和车流量数据。例如我们需要预测的是今年10月1日凌晨1点-早上9点的车流量,并且根据气象情报预测是晴天。此时将在第一时间线中寻找带有“假期”特征和“晴天”特征的相关时间段进行参照。利用获取的第一时间段中的特征建立lstm模型,但是该模型输入为第二时间线的时序特征,采用lstm模型进行多元时间序列预测;在多元时间序列预测基础上建立基于优化的梯度提升的决策树模型;最终建立时空信息与其他相关特征信息的预测模型;利用时空信息与其他相关特征信息的预测模型计算第二时间线上的预测车流量;当预测的车流量超过安全预期时对指定高速出入口进行预调控管理。
[0049]
基于时空信息的梯度提升的决策树预测模型采用皮尔逊相关系数ρ:
[0050][0051]
x,y是分别取一条时间线上不同时段不同站点入口的车流量,分别算得取的那两个站点的相关系数;cov()是协方差,σ是指标准差。
[0052]
并采用基于leaf-wise的lightgbm模型进行训练。
[0053][0054]
以上为leaf-wise策略的二叉树的分裂增益公式。其中
[0055][0056]
为通过分裂之后得到的增益,γ为引入新叶子节点带来的复杂度。leaf-wise的缺点是它可能会生长更深的决策树并产生过度拟合。因此本发明实现过程为lightgbm加以限制树的深度,同时又确保较高的训练效率。
[0057]
本发明基于改良的特征信息选择创建多个基于时间和空间及相关影响因素的特征,通过使用具有深度限制的叶子生长策略并调整放入直方图策略来优化lightgbm模型。k个整数由连续的浮点特征值离散,宽度为k的直方图随之被构造完成为直方图算法的思想。遍历数据时,将统计数据以离散值作为指标存储在直方图中。遍历数据后,直方图会累积所需的统计量,然后遍历以根据直方图的离散值找到最佳分割点。
[0058]
在leaf-wise算法中,可以把该算法看成一个强模型由多个决策树经过训练,更新参数提升而成。本发明模型训练方法先初始化了64棵决策树,训练权重为1/64,在训练各决策树时更新改树权值,直至误差降到范围之内则停止训练,最终得到经过提升的强模型。
[0059][0060]
为避免经过深度学习可能导致的过度拟合,本发明在训练过程中实为lightgbm模型加以限制树的深度,此举同时确保较高的训练效率。
[0061]
在最终在建立完成模型后即可利用该模型进行车流量的预测。并且根据预测结果
对高速上的车流量进行控制管理。
[0062]
实施例1:依然以广西省作为基础。将历年的各个高速出口经过人工收费通道车流量数据作为基础车流量数据。以小时作为单位,建立第一时间线,标注针对每个时间段车流量总数对应的特征信息。在建立模型的过程中对天气数据、地理位置等特征信息进行分解和优化。例如,在现有技术中,对天气数据仅仅是根据天气数据与车流量关系,简单地将天气好易于出行的天气赋予高权值,将不易于出行的天气赋予低权值。例如,天气的时间序列因素经过离散特征编码后可以表示为{'晴':1.5,'多云':1.3,'阴':1,'小雨':0.8,'大雨':0.6,'中雨':0.7}。但是实际上天气数据和车流量关系并非简单的线性关系。经过对数据的分析,发现这一点是数据出现偏差的原因之一。因此在本发明中对特征信息进行了进一步的改良。例如在高速公路上雨天进行行驶时,车速过快是雨中高速公路行车的最大隐患,它会使驾驶人在判断处理情况的决策上,以及转向、刹车、减挡的操作时机等方面受到不同程度的限制。因此,汽车在雨天的高速公路上行驶,时速一般不宜超过80-90公里/小时。车距:雨天路滑制动距离延长应适当加大前、后车距,如果在晴天汽车以80迈的车速行驶时前后车距应保持80米车距的话。那么,雨天在高速公路上至少要保持在晴天的两倍以上,即160米以外的车距。根据这个车速和车距的限制,可以计算出单位时间内一段高速公路中最高的车容量。例如,桂三高速公路主线长137公里,4车道,正常晴天非节假日状态下,24小时车流量9400余辆,其中高峰期8小时内经过6300余辆,单位1小时4个收费口经过上限为800辆,。当出现小雨时,按照现有技术特征编码中天气因素导致的系数0.8和晴天的系数1.5相差接近一倍,再经过计算后,这种情况下会将单独1小时内的车流量预测值为500余辆。但是在实际检验过程中,实际车流量还是能达到接近700辆,误差较大。本发明中,小雨天气和晴天在能见度上相差不到15%,在车距要求方面没有变化,因此即便依然采用的是论文中记载的模型,最终计算结果却是1小时内预测通过大于650辆,更为接近。
[0063]
而在暴雨天气,根据实际雨量不同,尤其是一些雨量不大但是风力很大的情况下,根据现有技术中预测这种情况下会将单独1小时内的车流量预测值为400余辆。根据本发明的特征信息处理会根据实际可能发生的天气状况综合判断,提高车辆间的车距要求。
[0064]
在本实施例中,最终预测1小时内通过车辆为300辆。但是根据安全要求,这样的天气条件下高速上的车辆已经大于安全预警线。此时就要进行人工干预,降低高速口车辆通过频率,尽可能在不封闭高速路口的状况下保证路上车辆安全。
[0065]
实施例2:对高速公路2022年10月1日7:00-21:00的车流量进行预测。根据这个时间点,判定是特殊节假日。根据当日气象预测,天气为晴。因此根据这些特征信息在第一时间线中历年信息符合相关特征的数据中寻找接近的车流量信息。
[0066]
根据第二时间线上2022年10月1日7:00-21:00标识时间段,利用该时间段上的特征信息去第一时间线上寻找相应的最接近的时间段。由于该段时间为节假日因此发现第一时间线上2020年10月1日7:00-21:00;2021年10月1日7:00-21:00为最匹配时间段。但是由于疫情原因,2020年10月1日7:00-21:00在防疫政策下,当天的车流量自身就有异常,因此不适合作为对比时间段。而2021年10月1日7:00-21:00有暴雨,也不适合作为对比时间段。
[0067]
最终,根据2021年5月1日7:00-21:00,同样是节假日,同样是晴天,是最为合适的对比时间段。提取该时间段中的特征信息,建立lstm模型,如图4所示,lstm网络结构中采用3个门控结构,使隐藏层变为具有记忆功能的细胞。其记忆功能为:
[0068][0069]
式中:ft,it,ot,ct分别为遗忘门、输入门、输出门和记忆细胞状态量;wfx,wix,wox为输入层xt和隐含层ht在t时刻的关联权重;wfh,wih,who为隐含层在t~t-1时刻的关联权重;wfc,wic,woc为细胞在t~t-1时刻的关联权重;wcx,wch分别为细胞与输入及细胞与隐含层之间的关联权重;bf,bi,bo,bc为各个门控单元和细胞的偏置量;ht-1为上一单元细胞的输出量,ht为t时刻细胞的输出值;σ为sigmoid激活函数。
[0070]
如图5所示,输入层数据为车流量的多特征量表示。
[0071]
该模型输入为第二时间线的时序特征,采用lstm模型进行多元时间序列预测。lstm网络输入层的样本格式为(samples,steps,features),samples为每个训练的批次,steps为每次滑动的特征步长,features为输入参数特征量。其维度计为m,设共有车流量数据为m,时间步长大小为t,特征个数为f,则该系统共有m-t个样本。
[0072]
步骤一:设训练数据集长度为s,则训练数据集的输入为:
[0073]
x={x1,x2,

,xs}
[0074]
式中:
[0075]
xs={{f
s,1
,f
s,2


,f
s,m
},

,{f
s t-1,1
,f
s t-1,2


,f
s t-1,m
}};
[0076]
步骤二:训练集输出为:
[0077]
y={y1,y2,

,ys}
[0078]
式中:ys为第s时刻的车流量;
[0079]
步骤三:测试集输入数据长度为l=m-t-s,则测试集的输入为:
[0080]
x

={x
′1,x
′2,

,x

l
}
[0081]
式中:
[0082]
x

l
={{f
s t 1,1
,f
s t 1,2


,f
s t 1,m
},

,{f
m,1
,f
m,2


,f
m,m
}};
[0083]
步骤四:测试集输出为:
[0084]y′
={y
′1,y
′2,

,y

l
}
[0085]
式中:y

l
为第l时刻车流量;
[0086]
步骤五:网络的损失函数为mse,采用adam优化器对训练集数据进行训练,对测试集数据进行测试,网络迭代500次。
[0087]
在根据采用lstm模型进行多元时间序列预测的基础上建立基于优化的梯度提升的决策树模型;最终建立时空信息与其他相关特征信息的预测模型;利用时空信息与其他相关特征信息的预测模型计算第二时间线上的预测车流量。后面的预测步骤和论文中公开
的一致,在此不做赘述。最终可以得到更为准确的预测值。
[0088]
在本实施例中,如果需要预测单独时间段的车流量信息,方法依然一样,只是将在第一时间线中对照的时间进行缩短,这样可能找出更多符合特征信息的时间段,利用这些时间段中的特征信息,建立的建立lstm模型也更为准确。
[0089]
本发明中预测任务属于回归任务,回归任务有几种常用的评价指标:均方误差mse(mean squared error)、均方根误差rmse(root mean squared error)、平均绝对误差mae(mean average error)。
[0090][0091]
在rmse的表达式中,为预测值,yi为真实值。均方根误差rmse用来衡量观测值与真实值之间的偏差,常用作机器学习模型预测结果衡量的标准。本文采用rmse作为算法误差的评价指标,依次对比本文模型与其他常用预测模型的表现。
[0092]
经过运用本文基于时空信息的梯度提升决策树模型对目标站点出口方向车流量进行的预测结果与车流量的真实值对比如图3所示。在本实施例中,为了方便对比,采用的参数和在先论文《基于时空信息的高速公路出入口交通车流量预测》中的一致。但是将本发明中图3和在先论文《基于时空信息的高速公路出入口交通车流量预测》中的第8张附图相比较可以发现,在一些数据突变的节点,采用本发明的技术方案的预测值比现有技术中的预测值更为接近实际值。由此可见本发明经过采用lstm模型进行多元时间序列预测;在多元时间序列预测基础上建立基于优化的梯度提升的决策树模型;利用时间线的特征对比对时间段的精准控制,以及对特征信息的处理使得模型的预测能力均有所提升。而在预测的过程中,预测结果不断和实际结果进行对比,根据对比结果对计算模型继续进行优化,使得预测结果越来越准确。
[0093]
如图6所示,为本发明还包括一种用于交通流量预测的设备,包括:
[0094]
计时器:用于建立并管理第一时间线和第二时间线;
[0095]
存储装置;用于存储高速出入口车流历史数据,
[0096]
数据采集装置,即时将高速出入口车流信息输入到存储装置中;
[0097]
与所述存储装置连接的处理器,用于执行基于特征处理的交通流量预测方法。所述处理器中包括基于设置的模型进行计算处理的计算模块,以及将计算结果和历史记录对比的对比模块,根据比对结果优化预调控管理方法。这样通过对比可以不断优化预测的准确率。
[0098]
由于本发明一种用于交通流量预测的设备最终还是要对车流量进行管控,因此还包括主动切换模块。所述主动切换模块连接人工调控装置,所述人工调控装置用于手动关闭指定高速出入口匝道,从而控制车流量。当发生紧急状况时可以通过人工调控装置直接接管控制高速出入口的匝道。
[0099]
虽然本发明以较佳实施例揭露如上,但并非用以限定本发明实施的范围。任何本领域的普通技术人员,在不脱离本发明的发明范围内,当可作些许的改进,即凡是依照本发明所做的同等改进,应为本发明的范围所涵盖。在本说明书的描述中,参考术语“一个实施例/方式”、“一些实施例/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实
施例/方式或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例/方式或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例/方式或示例以及不同实施例/方式或示例的特征进行结合和组合。
[0100]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0101]
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献