一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种含缺失数据的交通流预测方法和系统

2023-02-12 14:49:45 来源:中国专利 TAG:

技术特征:
1.一种含缺失数据的交通流预测方法,其特征在于,包括如下步骤:(1)获取某区域的交通数据集,该交通数据集包含缺失数据,将该交通数据集重建模为交通流数据矩阵;(2)将步骤(1)得到的交通流数据矩阵x输入训练好的时空预测模型的正交非负矩阵分解onmf模块形成k个簇,并在各簇中利用时空预测模型的广义矩阵分解填充gmf模块填充数据,以得到填充数据后的交通流数据矩阵对填充后的交通流数据矩阵进行标准化处理,以得到标准化后的交通流数据矩阵并根据历史步长h和预测窗口w将标准化后的交通流数据矩阵建模为三维张量(3)将步骤(2)建模得到的三维张量输入训练好的时空预测模型的图卷积循环神经网络gcrnn中,以得到预测数据y

。2.根据权利要求1所述的含缺失数据的交通流预测方法,其特征在于,交通数据为三维张量数据{时间,节点,交通特征},其中,时间指的是该节点采集到交通特征的时间,节点指的是单个传感器,而交通特征包括车速特征、交通流特征和人数特征。3.根据权利要求1或2所述的含缺失数据的交通流预测方法,其特征在于,步骤(1)中,交通数据集其中其表示该区域中所有街道上设置的所有节点(即传感器)中的第n个节点在t个时刻的交通流数据矩阵,n∈[1,n],t∈[1,t],t为任意正整数,n为该区域中所有街道上布设的传感器的总数,且有整数,n为该区域中所有街道上布设的传感器的总数,且有表明数据具有非负性;其中为第n个节点在第t时刻的第c个特征值,c∈[1,c],其中c表示交通特征种类。4.根据权利要求1至3中任意一项所述的含缺失数据的交通流预测方法,其特征在于,步骤(2)中将步骤(1)得到的交通流数据矩阵x输入onmf模块形成k个簇这一过程具体包括:(2-1)将交通流数据矩阵x的矩阵因子f和g初始化为(0,1)内的随机值;(2-2)根据步骤(2-1)初始化得到的矩阵因子f和g、并采用更新规则和更新矩阵中的可观测数据,当x-fg
t
的误差收敛时,则停止迭代,从而得到更新后的矩阵因子g;(2-3)根据步骤(2-2)得到的更新后的矩阵因子g,将交通流数据矩阵x聚类为k个簇。5.根据权利要求4所述的含缺失数据的交通流预测方法,其特征在于,步骤(2)中在各簇中利用gmf模块填充交通流数据矩阵x,以得到填充数据后的交通流数据矩阵对填充后的交通流数据矩阵进行标准化处理,以得到标准化后的交通流数据矩阵并根据历史步长h和预测窗口w将标准化后的交通流数据矩阵建模为三维张量这一过程包括以下子步骤:(2-4)在步骤(2-3)得到的每个簇中将交通流数据矩阵x划分为可观测数据集和不可观测数据集,并将可观测数据集进行重构,以得到时间向量v
p
∈r
m
、节点向量v
q
∈r
m
和交通流
向量v
y
∈r
m
,将不可观测数据集重构为时间向量v

p
∈r
m

和节点向量v

q
∈r
m

,其中m表示可观测数据集中可观测数据的总数,m

表示不可观测数据集中不可观测数据的总数;(2-5)将步骤(2-4)得到的v
p
和v
q
两个向量输入gmf模块的嵌入层,以得到嵌入层的输出,即时间矩阵因子p和节点矩阵因子q:p=e1(v
p
),q=e2(v
q
),其中,p∈r
m
×
a
和q∈r
m
×
a
分别为时间矩阵因子和节点矩阵因子,a =16为潜在因子,e1()和e2()表示嵌入函数,都是采用pytorch框架中的torch.nn.embedding()函数;(2-6)将步骤(2-5)得到的时间矩阵因子p和节点矩阵因子q输入gmf模块的分解层,以得到输出结果f(p,q):f(p,q)=p

q,其中,

表示元素积运算。(2-7)将步骤(2-6)得到的输出结果f(p,q)输入gmf模块的填充层,得到的输出即为填充结果g(p,q):g(p,q)=a
out
(w
t
(p

q) b),其中,a
out
为relu激活函数,w和b分别表示gmf模块中可学习的权重和偏置参数;(2-8)对步骤(2-7)的填充结果采用均方误差mse进行度量,以得到步骤(2-4)的交通流向量v
y
和步骤(2-7)的填充结果g(p,q)二者之间的误差值mse,该步骤计算公式为:(2-9)通过adam优化器对gmf模块中可学习的权重w和偏置参数b进行更新;(2-10)重复上述步骤(2-8)至(2-9),直到mse小于阈值或训练次数达到预设的轮次为止,从而得到训练好的gmf模块;(2-11)将步骤(2-4)得到的不可观测数据集输入步骤(2-10)训练好的gmf模块,以得到交通流向量v

y
∈r
m

;(2-12)根据步骤(2-4)得到的可观测数据集下的时间向量v
p
、节点向量v
q
、交通流向量v
y
和不可观测数据集下的时间向量v

p
、节点向量v

q
以及步骤(2-11)所得的交通流向量v

y
,获取填充数据后的交通流数据矩阵(2-13)对步骤(2-12)填充数据后的交通流数据矩阵进行标准化处理,以得到标准化后的交通流数据矩阵的交通流数据矩阵其中,μ为交通流数据矩阵的均值,σ为的标准差;(2-14)根据历史步长h和预测窗口w将步骤(2-13)标准化后的交通流数据矩阵重构为三维张量和三维张量y∈r
(t-h-w 1)
×
n
×
w
。6.根据权利要求5所述的含缺失数据的交通流预测方法,其特征在于,gcrnn网络是通过如下步骤训练得到的:(3-1)将步骤(2-14)得到的三维张量和y均以6∶4比例划分为训练集和测试集;
(3-2)通过参数e对gcrnn进行自适应图学习,以得到邻接矩阵本步骤的计算公式为:其中,e∈r
n
×
e
是可学习的参数矩阵,参数e的初始化采用pytorch框架中的torch.floattensor()函数,参数e最优调参结果为2和10;(3-3)将步骤(3-1)得到的三维张量的训练集在时刻t下的数据的训练集在时刻t下的数据和步骤(3-2)得到的邻接矩阵输入图卷积神经网络,以得到第k个簇的图卷积结果h
k
∈r
n
×
h
;本步骤的计算公式为:其中,g
k
∈r
n
×
n
是第k个簇的拉普拉斯矩阵,θ
k
∈r
h
×
h
和b
k
∈r
h
为第k个簇的可学习参数,h为图卷积循环神经网络中隐藏层的神经元数目;(3-4)将步骤(3-1)得到的三维张量的训练集在时刻t下的数据输入循环神经网络,以得到时刻t下的表征结果h
t
;(3-5)将步骤(3-4-4)得到的输出h
t
输入到gcrnn网络的二维卷积层(如图3所示),以得到最终的交通流预测结果y

∈r
n
×
w
;本步骤的具体实现如下:y

=h
t

f1×
h
,其中,二维卷积层通道数channel为1,输出w=12,f1×
h
表示二维卷积层中的卷积核大小为(1,h),其中h=64;(3-6)使用l1损失函数计算步骤(3-5)得到的预测结果y

和步骤(2-14)得到的张量y之间的损失值o(y,y

);具体而言,本步骤使用的l1损失函数为:(3-7)利用步骤(3-6)的损失函数和pytorch框架中的adam优化器对步骤(3-2)的可学习参数e和步骤(3-4-1)至(3-4-4)的可学习参数4)的可学习参数和进行迭代更新;(3-8)重复上述步骤(3-6)到步骤(3-7)的训练过程,直到步骤(3-7)的迭代次数(本发明中为100)或步骤(3-6)的损失值o(y,y

)小于设定阈值时结束训练,从而得到初步训练好的gcrnn模型;(3-9)使用步骤(3-1)得到的测试集对步骤(3-8)初步训练好的gcrnn模型进行验证,直到预测误差达到最优为止,从而得到训练好的时空预测模型。7.根据权利要求6所述的含缺失数据的交通流预测方法,其特征在于,步骤(3-4)包括以下子步骤:(3-4-1)将步骤(3-1)得到的三维张量的训练集在时刻t下的数据步骤(3-2)得到的邻接矩阵和上一时刻t-1下的表征结果h
t-1
输入到gcrnn,以得到t时刻的更新门z
t
∈r
n
×
h

具体而言,本步骤的计算公式为:其中,h0∈r
n
×
h
表示初始状态,是一个全为0构成的矩阵,[,]表示拼接运算,和是第k个簇中t时刻更新门z
t
的可学习参数,σ(
·
)是sigmoid激活函数;(3-4-2)将步骤(3-1)得到的三维张量的训练集在时刻t下的数据步骤(3-2)得到的邻接矩阵和上一时刻t-1下的表征结果h
t-1
输入gcrnn,以得到t时刻的重置门r
t
∈r
n
×
h
;本步骤的计算公式为:其中,和是第k个簇中t时刻重置门r
t
的可学习参数;(3-4-3)将步骤(3-1)得到的三维张量的训练集在时刻t下的数据步骤(3-4-2)得到的重置门r
t
、步骤(3-2)得到的邻接矩阵和上一时刻t-1下的表征结果h
t-1
输入到gcrnn,以得到t时刻下的传输状态本步骤的计算公式为:其中,

表示元素积,和是第k个簇在t时刻下的传输状态的可学习参数;(3-4-4)将步骤(3-4-1)得到的更新门z
t
、上一时刻t-1下的表征结果和步骤(3-4-3)得到的传输状态输入gcrnn中,以得到当前时刻t下的表征结果h
t
∈r
n
×
h
;本步骤的计算公式为:其中,z
t

h
t-1
表示对上一时刻t-1的信息h
t-1
进行选择性遗忘,进行选择性遗忘,表示对包含当前时刻t的信息进行选择性记忆。8.一种含缺失数据的交通流预测系统,其特征在于,包括:第一模块,用于获取某区域的交通数据集,该交通数据集包含缺失数据,将该交通数据集重建模为交通流数据矩阵;第二模块,用于将第一模块得到的交通流数据矩阵x输入训练好的时空预测模型的正交非负矩阵分解onmf模块形成k个簇,并在各簇中利用时空预测模型的广义矩阵分解填充gmf模块填充数据,以得到填充数据后的交通流数据矩阵对填充后的交通流数据矩阵进行标准化处理,以得到标准化后的交通流数据矩阵并根据历史步长h和预测窗口w将标准化后的交通流数据矩阵建模为三维张量第三模块,用于将第二模块建模得到的三维张量输入训练好的时空预测模型的图卷积循环神经网络gcrnn中,以得到预测数据y



技术总结
本发明公开了一种含缺失数据的交通流预测方法,包括:获取某区域的交通数据集,其包含缺失数据,将该交通数据集重建模为交通流数据矩阵,将交通流数据矩阵X输入训练好的时空预测模型的正交非负矩阵分解ONMF模块形成K个簇,并在各簇中利用时空预测模型的广义矩阵分解GMF模块填充数据,以得到填充数据后的交通流数据矩阵对填充后的交通流数据矩阵进行标准化处理,并根据历史步长H和预测窗口W将标准化后的交通流数据矩阵建模为三维张量将三维张量输入训练好的时空预测模型的图卷积循环神经网络GCRNN,以得到预测数据Y


技术研发人员:金雅妮 刘彩苹 谢鲲 文吉刚 张大方
受保护的技术使用者:湖南大学
技术研发日:2022.10.24
技术公布日:2023/2/6
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献