一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种道路风险预测方法及系统与流程

2022-02-22 20:25:07 来源:中国专利 TAG:


1.本发明涉及道路风险预测领域,具体涉及一种道路风险预测方法及系统。


背景技术:

2.道路交通事故伤害是当今世界人类死亡的主要原因之一。根据目前的道路交通事故趋势,研究人员进一步预测到2030年它可能会上升到导致死亡的十大原因的第五位。如果可以对道路进行风险预测,并且提前避开高风险路段,这将对降低交通事故数量产生巨大的有益影响。为了对道路进行风险预测,大量的研究人员在此领域进行了研究,并且提出了各类方法来解决这个问题。这些方法大致上可以分为两类:传统分类方法和深度学习方法。
3.传统分类方法考虑到的影响因素十分有限,这也导致了传统分类方法模型的预测能力不够强。
4.而随着机器学习、深度学习的迅速发展,各领域都尝试使用机器学习来解决更多更复杂的问题。机器学习中的循环神经网络(recurrent neural network,rnn)在解决时间序列预测问题上有着先天的优势。循环神经网络是指一种具有环路,能实现记忆功能的网络结构,对短时期时间序列预测有很好的效果。rnn实现了信息的持久化,但是朴素的rnn会出现梯度消失和梯度爆炸的现象,不能学习到时间序列中长距离的依赖关系。


技术实现要素:

5.为了克服上述现有技术中存在的缺陷,本发明的目的是提供一种道路风险预测方法及系统。
6.为了实现本发明的上述目的,本发明提供了一种道路风险预测方法,包括以下步骤:
7.划分研究路段,获得研究路段的时不变特征;
8.实时获得研究路段的时变数据,从中提取出时变特征;
9.搭建sdarnn网络模型:在lstm模型的输入阶段引入注意力机制,将所述时变特征通过输入注意力机制得到注意力加权后的时变特征,在lstm模型的编码器的隐藏层引用注意力机制处理加权后的时变特征,将其映射成上下文向量;在lstm模型的解码器阶段输入上下文向量并融合时不变特征,再经过解码器得到输出序列,输出下个时隙研究路段的危险度。
10.本方法将特征因素划分为时变特征和时不变特征,提出融合时不变特征的双阶段注意力机制的循环神经网络模型(sdarnn),sdarnn引入输入注意力机制在每个时间点为时变特征加权,在解码器阶段融入时不变特征,既能把握时不变特征的依赖关系,又能提取时变特征的重要信息,提高了道路风险预测的准确性。
11.该道路风险预测方法的优选方案:将所述时变特征通过输入注意力机制得到注意力加权后的时变特征的步骤为:
12.令时变特征令时变特征表示时变特征长度,t表示时间步长,1≤t≤t,
13.在lstm模型的输入阶段引入注意力机制,使用输入注意力机制给第k个时变特征加权,第k个时变特征加权之后的结果为k为正整数且
14.在t时刻,输入注意力层输出每个时变特征的注意力在t时刻,输入注意力层输出每个时变特征的注意力在t时刻,输入注意力层输出每个时变特征的注意力we和ue是需要学习的参数,h
t-1
,s
t-1
分别指编码器上一步的隐藏状态和细胞状态;
15.将输入注意力层输出的每个时变特征的注意力输入到softmax层中得到和为1的每个时变特征的注意力权重t时刻第k个时变特征的注意力权重计算公式为得到加权后的时变特征
16.该道路风险预测方法的优选方案:在模型的编码器阶段处理加权后的时变特征,将其映射成上下文向量的步骤为:
17.将加权后的时变特征输入到编码器,更新t时刻隐藏层状态h
t

18.引用注意力机制选择t时刻内隐藏层状态(h1,h2,

,h
t
)输出隐藏状态注意力则编码器第i个单元的隐藏状态注意力为:其中,hi指编码器第i个神经单元的隐藏层状态,wd和ud是需要学习的参数,d
t-1
和s
t
′-1
分别是解码器上一步的隐藏状态和细胞状态;
19.将隐藏状态注意力经过softmax层得到隐藏状态注意力权重,编码器第i个单元的隐藏状态注意力权重为
20.将编码器输出的所有隐藏状态加权求和得到t时刻的时变影响因素的上下文向量:t'为编码器的lstm神经单元个数。
21.该道路风险预测方法的优选方案:将时不变特征和时变特征的上下文向量融合输入到解码器中:
22.其中,是需要学习的参数,是解码器,d
t
是解码器的隐藏状态。
23.该道路风险预测方法的优选方案:研究路段的时不变特征的获取步骤为:
24.获得研究路段的道路特征,记为y=[y1,y2,...yi,...,yn],yi∈(0,1),0代表当前路段没有道路特征yi,1代表当前路段含有道路特征yi,n为道路特征的分类类别个数;
[0025]
获取研究路段所处区域的社会因素特征;
[0026]
根据统计数据得到道路特征y中每个元素的影响因子fi,将社会因素特征以及道路特征y中每个元素的影响因子fi融合获得带有影响因子的时不变特征向量f。
[0027]
将道路特征和社会因素特征进行融合以获得时不变数据,考虑到了道路特征、社会因素对路段危险度的影响,使得预测更加准确。
[0028]
该道路风险预测方法的优选方案:将路段所处区域的平均人口密度pd,平均犯罪率pc作为社会因素特征;将社会因素特征记为:fc=[pd,pc]。
[0029]
道路特征y中每个元素的影响因子fi的计算公式为其中m为事故数,表示在事故λ发生的路段中,是否包含特征yi,如果包含则取1,反之则取0。
[0030]
时不变特征向量f=[y1*f1,y2*f2,...,yi*fi,...,yn*fn,pd,pc]。
[0031]
这种将道路特征y与社会因素特征融合的方式体现了各个因素对事故影响的差异性。
[0032]
本发明还提出了一种道路风险预测系统,包括处理器和存储器,所述处理器和存储器相互通信连接,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的道路风险预测方法对应的操作。
[0033]
本发明的有益效果是:本发明将道路特征和社会因素特征进行融合以获得时不变数据,然后在lstm模型的基础上,引入双阶段注意力机制在模型的输入阶段和隐藏层引入注意力权重,通过注意力机制将离当前时隙较远的时隙的对预测下一个时隙风险有着重要作用的信息保留下来,以预测下一个时隙的风险,实现了同时选取当前时刻有用的特征和把握长期时序依赖关系,提出了融合社会因素特征的双阶段注意力机制的循环神经网络模型(social factors integrated dual-stage attention-based recurrent neural network,sdarnn),通过融合自然因素和社会因素来提高预测的准确性,并引入编码器-解码器机制实现对研究路段的风险预测。
[0034]
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
[0035]
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0036]
图1是sdarnn模型整体架构示意图;
[0037]
图2是编码器网络结构示意图;
[0038]
图3是解码器网络结构示意图。
具体实施方式
[0039]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0040]
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可
以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
[0041]
本发明提供了一种道路风险预测方法的实施例,该实施例首先将道路卫星图像(包含自然成因中的道路成因)和社会因素进行融合以获得时不变数据,然后在lstm模型的基础上,引入双阶段注意力机制在模型的输入阶段和隐藏层引入注意力权重,实现了同时选取当前时刻有用的特征和把握长期时序依赖关系,通过融合自然因素和社会因素来提高预测的准确性,并引入编码器-解码器机制实现对研究路段的风险预测。
[0042]
下面对该实施例进行具体介绍:
[0043]
本实施例所涉及的数据包括车流量数据、事故数据、道路数据、环境数据、社会因素数据。其中车流量、事故、环境为时变(随时间变化)数据,道路、社会因素为时不变(不随时间变化)数据。
[0044]
本实施例中的研究区域的单位是路段,因此首先要做的就是划分研究路段,获得研究路段的时不变特征。
[0045]
可采用现有方法划分研究路段,本实施例中优选但不限于采用文献han q,zhu y,zeng l,et al.a road hotspots identification method based on natural nearest neighbor clustering[c]//ieee,international conference on intelligent transportation systems中提出的基于cb3n的改进算法,即基于距离阈值的自然最近邻聚类(distance threshold clustering based on natural nearest neighborhood,dth3n)找到路段和事故之间的联系,找出事故热点路段,进行路段划分。
[0046]
在获得研究路段的时不变特征时,可从两步着手:
[0047]
其一为获得研究路段的道路特征,记为y=[y1,y2,...yi,...,yn],yi∈(0,1),0代表当前路段没有道路特征yi,1代表当前路段含有道路特征yi,n为道路特征的分类类别个数。
[0048]
具体方法为:研究路段划分完成之后,通过该路段区域的卫星图片获得该路段的道路特征,如:该路段是否含有弯道,交叉路口,环岛等。本实施例中优选但不限于使用cnn来提取卫星图片中的道路特征,这是一个典型的多标签二分类问题。
[0049]
训练神经网络的过程,实际上就是学习参数值(权重w
ij
和偏差bj)的过程,这是深度学习的最实际的部分,可以将神经网络中的学习过程视为“前进和返回”通过神经元层的迭代过程。反向传播算法以一种更正式的方式来计算误差相对于每个权重的变化方式(导数值):使用简单的更新规则来更新网络的每个权重:整个网络最终的输出为y=[y1,y2,...yi,...,yn],yi∈(0,1),n为道路特征的分类类别个数,从而即获得研究路段的道路特征y。
[0050]
其二为获取研究路段所处区域的社会因素特征。具体地,本实施例中将路段所处区域的平均人口密度pd,平均犯罪率pc作为社会因素特征;将社会因素特征定义为:fc=[pd,pc]。本实施例中,平均人口密度pd可由研究区域所属的行政区域的人口数除以面积,平均犯罪率pd可由研究区域所属的行政区域的犯罪数除以面积。
[0051]
由于y中每个元素对事故的影响性并不相等,如果简单的分为0或1进行融合,不能体现出各个因素对事故影响的差异性。因此本实施例中根据统计数据得到道路特征y中每
个元素的影响因子fi,其中i为正整数,且0<i≤n;m为事故数,h
ki
表示在事故λ发生的路段中,是否包含道路特征yi,如果包含则取1,反之则取0;将社会因素特征以及道路特征y中每个元素的影响因子fi融合获得带有影响因子的时不变特征向量f,f=[y1*f1,y2*f2,...,yi*fi,...,yn*fn,pd,pc],从而获得了研究路段的时不变特征。
[0052]
在进行道路风险预测时还要实时获得研究路段的时变数据,从中提取出时变特征,这里采用现有方法即可提取,时变特征可提前给定,对时变特征进行预处理后用矩阵表示,本实施例中给定时变特征表示,本实施例中给定时变特征指的是t-1到t时间内的时变特征数据,t表示从1到t其中任意一个时间点,表示时变特征个数,如选取车流量、天气情况和温度情况,时变特征长度就为3,t表示时间步长,指选取t个时隙的特征作为输入,1≤t≤t。
[0053]
搭建sdarnn网络模型:sdarnn模型整体架构如图1所示,sdarnn模型的基本架构是基于编码-解码的序列到序列架构,编码器阶段处理时变特征,将时变特征映射成上下文向量,解码器阶段输入上下文向量并融合时不变因素,再经过解码器得到输出序列。
[0054]
编码器本质上是一个rnn模型,sdarnn模型选择lstm神经网络作为编码器,lstm神经网络将输入的时变特征序列转换为隐藏层状态,而这里输入的时变特征序列为将从实时获得研究路段的时变数据中提取到时变特征通过输入注意力机制得到的注意力加权后的时变特征。
[0055]
得到注意力加权后的时变特征的步骤为:
[0056]
在该模型的输入阶段引入注意力机制,使用输入注意力机制给第k个时变特征加权,第k个时变特征加权之后的结果为k为正整数且在t时刻,输入注意力层输出每个时变特征的注意力时刻,输入注意力层输出每个时变特征的注意力时刻,输入注意力层输出每个时变特征的注意力we和ue是需要学习的参数,h
t-1
,s
t-1
分别指编码器上一步的隐藏状态和细胞状态,将输入注意力层输出的每个时变特征的注意力输入到softmax层中得到和为1的每个时变特征的注意力权重t时刻第k个时变特征的注意力权重计算公式为得到加权后的时变特征得到加权后的时变特征用于衡量第k个时变特征在t时刻的重要性。
[0057]
将加权后的时变特征输入到模型的编码器,也就是lstm神经网络中,在编码器的隐藏层引用注意力机制处理加权后的时变特征,将其映射成上下文向量,具体地:
[0058]
将加权后的时变特征输入到编码器,更新t时刻隐藏层状态h
t
,其中是编码器。
[0059]
接下来再一次引用注意力机制,t时间步长内所有隐藏层状态为(h1,h2,

,h
t
),与输入注意力层类似,隐藏状态注意力层输出隐藏状态注意力则编码器第i个单元的隐藏状态注意力为:其中,hi指编码器第i个神经单元的隐藏层状态,wd和ud是需要学习的参数,d
t-1
和s
t
′-1
分别是解码器上一步的隐藏状态和细胞状态,前述的h
t
是第t个神经单元的的隐藏层状态,同时也是第t个时刻的的隐藏层状态,因为有多少个输入数据就有多少个神经单元来处理。
[0060]
将隐藏状态注意力经过softmax层得到隐藏状态注意力权重,编码器第i个单元的隐藏状态注意力权重为
[0061]
将编码器输出的所有隐藏状态加权求和得到t时刻的时变影响因素的上下文向量:t'为编码器的lstm神经单元个数,由于有多少个输入数据就有多少个神经单元来处理,因此编码器的lstm神经单元个数t'=时间步长t,比如时间步长是5,1,2,3,4,5个时刻的数据需要5个神经单元来处理,所以神经单元的个数等于时间步长t。
[0062]
然后在模型的解码器阶段输入上下文向量并融合时不变特征,再经过解码器得到输出序列,完成对道路风险的预测。
[0063]
具体地,将从上述步骤中获得时不变特征f=[y1*f1,y2*f2,...,yi*fi,...,yn*fn,pd,pc]和时变特征的上下文向量融合输入到解码器中:
[0064]
其中,f
ct
指时变特征上下文向量和时不变特征融合后的参数,作为解码器的输入,c
t
指上述的时变特征经过编码器处理获得的上下文向量,是需要学习的参数,是解码,d
t
是解码器的隐藏状态。与编码器类似,sdarnn模型使用另一个lstm神经网络作为解码器。
[0065]
解码器的lstm神经单元内部运算过程如下:
[0066]
遗忘门:
[0067]
输入门:
[0068]
输出门:
[0069]
其中和分别为解码器的遗忘门、输入门和输出门的权重,和分别为解码器的遗忘门、输入门和输出门的偏置,σ()为sigmoid激活函数。
[0070]
解码器细胞状态更新为:其中,是细胞状态的权重,是细胞状态的偏置,s'
t-1
表示解码器上一个时隙的细胞状态。最后得到解码器的隐藏层状态:融合时变因素的解码器网络结构如图3所示。
[0071]
本发明还提出了一种道路风险预测系统的实施例,其包括处理器和存储器,所述处理器和存储器相互通信连接,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的道路风险预测方法对应的操作。
[0072]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0073]
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献