本发明涉及图张量分解领域以及交通数据处理领域,特别是一种基于图张量分解的交通数据处理方法。
背景技术:
交通流量数据的恢复对智能交通系统的应用至关重要,因而受到广泛关注。在现代生活中,人们越来越依赖于使用汽车做交通工具出行。导致道路上的车辆越来越多,道路越来越拥堵。如何缓解交通压力成为一个亟待解决的社会问题。在此背景下,利用先进的计算机技术实现对交通系统的智能化管理,指导汽车避开高峰出行和拥堵是缓解交通压力的有效手段。
在智能交通系统的应用中,对道路状况的判断和检测依赖于实时且准确地交通数据。交通数据往往由分布在道路上的传感器收集得到。然而由于种种原因,比如传感器损坏、电量用尽、通信故障等等,导致得到的交通数据往往会存在缺失。这就要求我们能够利用现有的不完整的交通数据,以尽可能改动精度恢复出未知的交通数据。为交通系统的路网监控和智能化管理提供依据。
关于交通流量恢复的研究主要分为两类:矩阵填充和张量填充。矩阵填充最早由candès提出,可以应用到交通数据的恢复中。张量填充是矩阵填充往更高维度的拓展应用。这两类方法的目标都是从部分已知的样本中恢复出完整的数据。张量填充依据广泛应用在信号分析和处理领域。在交通数据的恢复中,一般假设数据是低秩或近似低秩的,进而通过一系列数学方法对未知数据进行估计。
本发明充分利用交通流量数据内在的时空相关性。由于道路上相邻传感器所记录到的车流量密切相关,上游的车流量变化往往也会影响到下游,因此相邻传感器的数据存在着强烈的空间关联。交通路网是一个天然的图结构,道路之间的连接关系可以很方便地通过拓扑图来进行描述。因此,我们可以利用图信号处理的技术来对交通数据做处理。另外,同一个传感器在相邻时隙做测量到的车流量往往是平滑变化的,因此我们可以使用托普利兹矩阵来描述其平滑性。本发明将交通流量数据构建为图张量模型,结合图傅里叶变化和张量分解来提取交通流量数据的图结构,并在数据恢复的过程中引入合适的托普利兹矩阵来对数据的平滑性做约束。本发明即使在采样率很低的情况下,依然能精确地恢复出未知的交通流量数据。
技术实现要素:
本发明的目的在于提供一种基于图张量分解的交通数据处理方法,可以克服现有技术不能充分利用交通数据的图结构和时间平滑性、恢复精度低的缺点。
为实现上述目的,本发明的技术方案是:一种基于图张量分解的交通数据处理方法,包括以下步骤:
步骤s1、将交通流量数据构造为图张量模型;
步骤s2、将图张量分解为两个低秩图张量;
步骤s3、构建时间平滑约束;
步骤s4、设计目标函数并求解,即在时间平滑约束条件下对两个低秩图张量进行更新优化;
步骤s5、利用更新后的两个低秩图张量重建交通流量数据。
在本发明一实施例中,所述步骤s1实现方式为:
假设一个交通道路网络中包含n3个传感器,用于测量一段时间间隔,即时隙内通过的车流量;这n3个传感器在每天n1个时隙里分别记录通过的车流量,持续记录n2天;得到的数据记为图张量:
在本发明一实施例中,所述步骤s2包括以下步骤:
步骤s21、一个图各节点的连接关系可以用拉普拉斯矩阵l0来表示;在已知l0的情况下,首先对l0进行特征分解:
l0=usu*
其中,u*是u的厄密特共轭;
步骤s22、利用图傅里叶变换将带有缺失数据的图张量
其中,×3是模乘;
步骤s23、将
定义:已知一个矩阵x的svd分解为:x=mσn;那么x的lr分解可以表示为:
x=lr,
其中,
那么,将
在本发明一实施例中,所述步骤s3包括以下步骤:
步骤s31、定义1阶托普利兹矩阵为:
定义2阶托普利兹矩阵为:
以此类推,16阶托普利兹矩阵可以定义为:
其中,16阶托普利兹矩阵中的数字“-16”前后分别有8个连续的数字“1”;
步骤s32、由于交通流量在相邻时隙,相邻天有着不同的平滑性;因此可以使用不同的托普利兹矩阵来描述其平滑线;具体来说,使用一个大小为n1×n1的16阶托普利兹矩阵t1来描述数据在相邻时隙的平滑性;另外使用一个大小为n2×n2的1阶托普利兹矩阵t2来描述数据在相邻天的平滑性。
在本发明一实施例中,所述步骤s4包括以下步骤:
步骤s41、将
同理,可以得到
步骤s42、在步骤s3构造的时间平滑性约束矩阵t1和t2的基础上,引入一个中间变量
其中,λ和α是大于0的参数;ω已知样本的集合,而
步骤s43、首先将步骤s41得到的
在本发明一实施例中,所述步骤s5实现方式为:
利用步骤s4得到的
而
相较于现有技术,本发明具有以下有益效果:本发明提出的一种基于图张量分解的交通数据处理方法,充分利用其图结构和时间平滑特征,提高交通流量数据的恢复精度。同时,本发明也适用于其他图信号的分析处理。
附图说明
图1为本发明构造的交通流量的图张量模型。
图2为当美国加利福尼亚州的圣贝纳迪诺高速公路流量数据(下面简称为pems08)存在随机缺失情况下,本发明实施例(gtc)的恢复误差与其他算法的结果对比示意图。
图3为当美国加利福尼亚州的旧金山湾区高速公路流量数据(下面简称为pems04)存在随机缺失情况下,本发明实施例(gtc)在数据随机缺失情况下的恢复误差与其他算法的结果对比示意图。
图4为当pems08存在连续时间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图5为当pems04存在连续时间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图6为当pems08存在连续空间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图7为当pems04存在连续空间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明一种基于图张量分解的交通数据处理方法,包括以下步骤:
步骤s1、将交通流量数据构造为图张量模型;如图1所示,具体实现方式为:
假设一个交通道路网络中包含n3个传感器,用于测量一段时间间隔,即时隙内通过的车流量;这n3个传感器在每天n1个时隙里分别记录通过的车流量,持续记录n2天;得到的数据记为图张量:
步骤s2、将图张量分解为两个低秩图张量;包括如下步骤:
步骤s21、一个图各节点的连接关系可以用拉普拉斯矩阵l0来表示;在已知l0的情况下,首先对l0进行特征分解:
l0=usu*
其中,u*是u的厄密特共轭;
步骤s22、利用图傅里叶变换将带有缺失数据的图张量
其中,×3是模乘;
步骤s23、将
定义:已知一个矩阵x的svd分解为:x=mσn;那么x的lr分解可以表示为:
x=lr,
其中,
那么,将
步骤s3、构建时间平滑约束;包括以下步骤:
步骤s31、定义1阶托普利兹矩阵为:
定义2阶托普利兹矩阵为:
以此类推,16阶托普利兹矩阵可以定义为:
其中,16阶托普利兹矩阵中的数字“-16”前后分别有8个连续的数字“1”;
步骤s32、由于交通流量在相邻时隙,相邻天有着不同的平滑性;因此可以使用不同的托普利兹矩阵来描述其平滑线;具体来说,使用一个大小为n1×n1的16阶托普利兹矩阵t1来描述数据在相邻时隙的平滑性;另外使用一个大小为n2×n2的1阶托普利兹矩阵t2来描述数据在相邻天的平滑性。
步骤s4、设计目标函数并求解,即在时间平滑约束条件下对两个低秩图张量进行更新优化;包括以下步骤:
步骤s41、将
同理,可以得到
步骤s42、在步骤s3构造的时间平滑性约束矩阵t1和t2的基础上,引入一个中间变量
其中,λ和α是大于0的参数;ω已知样本的集合,而
步骤s43、首先将步骤s41得到的
步骤s5、利用更新后的两个低秩图张量重建交通流量数据;具体实现方式为:
利用步骤s4得到的
而
图2为当美国加利福尼亚州的圣贝纳迪诺高速公路流量数据(下面简称为pems08)存在随机缺失情况下,本发明实施例(gtc)的恢复误差与其他算法的结果对比示意图。
图3为当美国加利福尼亚州的旧金山湾区高速公路流量数据(下面简称为pems04)存在随机缺失情况下,本发明实施例(gtc)在数据随机缺失情况下的恢复误差与其他算法的结果对比示意图。
图4为当pems08存在连续时间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图5为当pems04存在连续时间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图6为当pems08存在连续空间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
图7为当pems04存在连续空间缺失的情况下,本发明实施例(gtc)恢复误差与其他算法的结果对比示意图。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
本文用于企业家、创业者技术爱好者查询,结果仅供参考。