一种基于聚类和图卷积网络的路网交通状态判别方法与流程

2021-09-29 05:46:00 来源：中国专利 TAG：

1.本发明涉及一种路网交通状态判别方法，属于交通状态判别技术领域。
技术背景
2.随着我国经济水平的不断提高，城市中机动车的数量呈现急剧上涨的趋势，导致交通流量大幅提高，与之相比，我国城市道路的建设却显得相对缓慢。在两者矛盾激化下，交通拥堵已经成为城市中的常发性问题，严重影响城市经济的发展和居民的生活体验。为了缓解交通拥堵问题，需要对城市交通进行科学精细的管理。对路网交通状态判别方法的研究，能够让交通管理者更好地了解路网整体的交通状态，从而采取合适的交通管理措施，在交通控制、交通诱导和交通管理等方面具有重要的意义。
3.目前，关于交通状态判别的研究方法主要有建立交通状态评估参数模型、模糊聚类算法和机器学习等。其中，机器学习相比于其它方法，对数据具有更好的拟合能力，尤其是无监督学习与有监督学习相结合的方法，能够更好地保证交通状态判别的实时性和准确度。常用的机器学习算法有k近邻、支持向量机和深度学习等方法，其中，相比于k近邻和支持向量机，深度学习具有更强的特征提取的能力，然而，当前基于深度学习的交通状态判别方法，大多都缺乏对路网时空特征的考虑。
4.此外，现阶段，基于机器学习方法对于路网交通状态的研究，大多数都是针对路段交通状态的研究展开，忽略了不同路段对路网整体的交通状态具有不同程度的作用。在城市路网中，相邻路段的交通流量变化具有相互作用力，一个路段的流量变化会影响到整个路网的交通状态，因此，需要将交通路网看成一个整体，考虑路网的时空特征，研究以宏观路网为研究对象的交通状态判别方法。

技术实现要素：

5.为了解决现有技术的上述不足，本发明提出一种基于k
‑
means 聚类算法和图卷积神经网络的路网交通状态判别方法。
6.本发明方法以交通路网为研究对象，使用k
‑
means 聚类算法对反映路网交通状态的特征矩阵进行聚类，从而得到具有交通状态标签的样本数据，然后构建基于图卷积神经网络的路网交通状态判别决策模型，在进行路网交通状态判别时充分考虑路网交通数据的空间特征，最后将样本数据划分为训练数据集和测试数据集，用训练数据集训练模型，以测试数据集检测模型交通状态判别的准确度。
7.为了解决上述问题，本发明提出的技术方案包括：
8.一种基于k
‑
means 聚类算法和图卷积神经网络的路网交通状态判别方法，具体步骤如下：
9.1)选择目标路网，将其划分为n个路段；将一天24小时平均划分为k个时间段，通过传感器设备获取每个路段在每个时间段的平均流量，累计获取j天的路网交通流数据。
10.2)在步骤1)基础上，以路段为节点，以路段的平均流量为节点特征构建路网拓扑
结构数据的特征矩阵，并用该特征矩阵作为路网当前时间段的交通状态的划分依据；根据路段之间是否相邻构建路网拓扑结构数据的邻接矩阵。
11.3)在步骤1)和2)基础上，使用k
‑
means 算法对反映路网交通状态的特征矩阵进行聚类，从而实现对不同时间段路网交通状态等级的划分，得到具有交通状态标签的路网拓扑结构数据样本。
12.4)构建基于图卷积神经网络的路网交通状态判别决策模型。
13.5)在步骤3)和4)的基础上，将3)中得到的样本数据划分为训练数据集和测试数据集，用训练数据集训练4)中搭建的路网交通状态判别决策模型，以测试数据集对模型路网交通状态判别的准确度进行评估。
14.在步骤1)中，将一天按一定时间间隔划分为k个时间段，k的选取应反映出一天中路网存在的所有不同交通状态；获取j天路网交通流数据，j取365天。
15.在步骤3)中，使用k
‑
means 聚类算法对路网交通状态等级进行划分，具体步骤如下：
16.(3.1)对样本数据进行归一化处理，将样本数据归一化到区间[0,1]，归一化公式如下：
[0017]
y
i,j
＝(x
i,j
‑
x
i,min
)/(x
i,max
‑
x
i,min
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0018]
式中，y
i,j
表示样本数据集中第i个样本数据(特征向量)的第j个元素归一化后的标准值；x
i,j
表示第i个样本数据的第j个元素原始值；x
i,max
和x
i,min
分别表示第i个样本数据的元素的最大值和最小值；
[0019]
(3.2)确定聚类个数k，k表示路网交通状态划分等级级别的个数；
[0020]
(3.3)从样本数据集中随机选取一个样本作为初始聚类中心c1，计算每个样本数据与当前已有聚类中心之间的最短距离；接着计算每个样本被选取为下一个聚类中心的概率p
i
，从而确定下一个聚类中心c2，p
i
的计算公式如下：
[0021][0022]
式中，p
i
表示第i个样本被选为初始聚类中心的概率；x
i
表示第i个样本；x表示样本数据集；d(x
i
)表示样本数据x
i
与当前已有聚类中心之间的最短距离；
[0023]
(3.4)重复步骤(3.3)，直到选出k个初始聚类中心c＝{c1,c2,...,c
k
}；
[0024]
(3.5)计算样本数据集中每个样本数据x
i
到k个聚类中心的距离，并将其划分到距离最小的聚类中心所对应的类中；
[0025]
(3.6)对于每个类别c
i
，重新计算该类别的聚类中心，计算公式如下：
[0026][0027]
式中，a
i
表示新生成的第i个类的聚类中心；c
i
表示第i个类的原始聚类中心；x表示聚类中心对应类中的样本数据；
[0028]
(3.7)重复步骤(3.5)和(3.6)直到聚类中心的位置不再变化。
[0029]
在步骤4)中，构建基于图卷积神经网络的路网交通状态判别决策模型，所述模型由gcn模块和全连接神经网络组成。首先通过gcn模块提取路网交通数据的空间特征，然后
通过全连接神经网络对路网交通状态作出判别决策。该模型主要含有输入层、图卷积层、全连接层和输出层，其具体表示如下：
[0030][0031][0032]
y1＝σ(w1h
(2)
b1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0033]
y2＝σ(w2y1 b2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0034]
y3＝w3y2 b3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0035]
其中，h
(0)
＝x，为输入图结构数据的特征矩阵，h
(1)
为第一个gcn层输出的特征数据、h
(2)
为第二个gcn层输出的特征数据；y1、y2表示全连接层的输出数据，y3表示模型的输出数据；部分是对邻接矩阵a进行标准化处理，其中i为单位矩阵，为的度矩阵；w
(0)
、w
(1)
、w1、w2、w3分别表示各层可调的权重参数，b1、b2、b3为可调的偏置参数；σ(
·
)表示relu非线性激活函数；此外，为缓解过拟合问题，在每个全连接层后增加一个dropout。
[0036]
在步骤5)中，使用训练样本数据集对步骤4)中的模型进行训练，从而标定模型中的可训练参数，之后就可以使用测试样本数据集对模型进行评估。
[0037]
本发明的有益效果：本发明以交通路网为研究对象，使用k
‑
means 聚类算法直接对反映路网交通状态的特征矩阵进行聚类，从而考虑到不同路段对于路网整体交通状态的影响；搭建了一种基于gcn的路网交通状态判别决策模型，该模型以路网拓扑结构数据作为输入数据，充分考虑路网交通数据的空间特征，提高了路网交通状态判别的准确度和实时性。
附图说明
[0038]
图1是本发明方法的流程图；
[0039]
图2是本发明使用k
‑
means 聚类算法对路网交通状态数据聚类的结果图；
[0040]
图3是本发明的路网交通状态标签数据随时间的变化图；
[0041]
图4是本发明提出的路网交通状态判别决策模型的结构图；
[0042]
图5是本发明对路网交通状态判别决策模型训练过程中损失的变化图；
[0043]
图6是本发明对路网交通状态判别决策模型训练过程中准确度的变化图。
具体实施方式
[0044]
下面结合附图对本发明的具体实施步骤进行进一步的描述。此处所描述的具体实施案例仅仅用于解释本发明，而不是限定本发明。
[0045]
对于本案例，基于k
‑
means 聚类算法和图卷积神经网络的路网交通状态判别方法，流程图如图1所示，包括以下步骤：
[0046]
1)选择目标路网，将其划分为n个路段；将一天24小时平均划分为k个时间段，通过传感器设备获取每个路段在每个时间段的平均流量，累计获取j天的路网交通流数据。
[0047]
2)在步骤1)基础上，以路段为节点，以路段的平均流量为节点特征构建路网拓扑
结构数据的特征矩阵，并用该特征矩阵作为路网当前时间段的交通状态的划分依据；根据路段之间是否相邻构建路网拓扑结构数据的邻接矩阵。
[0048]
3)在步骤1)和2)基础上，使用k
‑
means 算法对反映路网交通状态的特征矩阵进行聚类，从而实现对不同时间段路网交通状态等级的划分，得到具有交通状态等级标签的路网拓扑结构数据样本。
[0049]
4)构建基于图卷积神经网络的路网交通状态判别决策模型。
[0050]
5)在步骤3)和4)的基础上，将3)中得到的样本数据划分为训练数据集和测试数据集，用训练数据集训练4)中搭建的路网交通状态判别决策模型，以测试数据集对模型路网交通状态判别的准确度进行评估。
[0051]
步骤1)中，需要说明的是本发明所使用的数据集来自于美国加利福尼亚洛杉矶市的某一路网，路网共有307个检测节点，节点每5分钟输出该时间段的平均交通流量，共有59天的数据。限于数据集的限制，本案例仅采用了59天的交通流数据进行实验。
[0052]
步骤2)中，在步骤1)的基础上，构建路网拓扑结构数据。在某一时间段，该案例路网拓扑结构数据由[307,1]的特征矩阵和[307,307]的邻接矩阵组成。
[0053]
步骤3)中，使用k
‑
means 聚类算法对路网交通状态等级进行划分，具体步骤如下：
[0054]
(3.1)对样本数据进行归一化处理，将样本数据归一化到区间[0,1]，归一化公式如下：
[0055]
y
i,j
＝(x
i,j
‑
x
i,min
)/(x
i,max
‑
x
i,min
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0056]
式中，y
i,j
表示样本数据集中第i个样本数据(特征向量)的第j个元素归一化后的标准值；x
i,j
表示第i个样本数据的第j个元素原始值；x
i,max
和x
i,min
分别表示第i个样本数据的元素的最大值和最小值；
[0057]
(3.2)确定聚类个数k，令k＝5，即将路网交通状态划分为通畅、基本通畅、轻度拥堵、中度拥堵、严重拥堵五个等级；
[0058]
(3.3)从样本数据集中随机选取一个样本作为初始聚类中心c1，计算每个样本数据与当前已有聚类中心之间的最短距离，用d(x
i
)表示，其中x
i
表示第i个样本；接着计算每个样本被选取为下一个聚类中心的概率p
i
，从而确定下一个聚类中心c2，概率p
i
的计算公式如下：
[0059][0060]
式中，p
i
表示第i个样本被选为初始聚类中心的概率；x
i
表示第i个样本；x表示样本数据集；
[0061]
(3.4)重复步骤(3.3)，直到选出k个初始聚类中心c＝{c1,c2,...,c
k
}；
[0062]
(3.5)计算样本数据集中每个样本数据x
i
到k个聚类中心的距离，并将其划分到距离最小的聚类中心所对应的类中；
[0063]
(3.6)对于每个类别c
i
，重新计算该类别的聚类中心，计算公式如下：
[0064]
[0065]
式中，a
i
表示新生成的第i个类的聚类中心；c
i
表示第i个类的原始聚类中心；x表示聚类中心对应类中的样本数据；
[0066]
(3.7)重复步骤(3.5)和(3.6)直到聚类中心的位置不再变化。
[0067]
步骤3)中，为了更清楚的观察聚类结果，使用pca算法将样本数据降维到二维，得到路网交通状态数据聚类的结果见图2；此外，从通过聚类得到的路网交通状态标签中选取2天的标签数据，绘制其随时间的变化图(横轴的最小单位表示5分钟的时间间隔)，如图3所示，从图中可以发现，路网交通状态等级随时间分布具有早高峰、晚高峰等特点，进一步说明了聚类结果的可靠性。
[0068]
步骤4)中，构建基于图卷积神经网络的路网交通状态判别决策模型，所述模型由gcn模块和全连接神经网络组成，模型结构如图4所示。首先通过gcn模块提取路网交通数据的空间特征，然后通过全连接神经网络对路网交通状态作出判别决策。本案例的模型主要含有输入层、图卷积层、全连接层和输出层，模型的结构参数见表1。
[0069]
所述gcn模块的建模包括：首先，确定输入数据和输出数据，输入数据为路网拓扑结构数据，即特征矩阵和邻接矩阵，输出数据为该路网交通状态的特征表达向量；其次构建gcn网络模型，设置网络结构参数。本案例中使用2层图卷积对路网数据特征进行提取，其具体表现形式如下：
[0070][0071][0072]
其中，h
(0)
＝x，为输入图结构数据的特征矩阵，h
(1)
为第一个gcn层的输出特征数据、h
(2)
为第二个gcn层的输出特征数据；部分是对邻接矩阵a进行标准化处理，其中i为单位矩阵，为的度矩阵；w
(0)
、w
(1)
分别表示图卷积层各层可调的权重参数；σ(
·
)表示relu非线性激活函数。
[0073]
所述全连接神经网络由两个全连接层和一个输出层组成，在全连接层后增加一个dropout操作，用于抑制网络过拟合问题，其具体表现形式如下：
[0074]
y1＝σ(w1h
(2)
b1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0075]
y2＝σ(w2y1 b2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0076]
y3＝w3y2 b3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0077]
其中，y1、y2表示全连接层的输出数据，y3为模型最终的输出数据；w1、w2、w3分别表示各层可调的权重参数，b1、b2、b3分别为各层可调的偏置参数。σ(
·
)表示relu非线性激活函数。
[0078]
表1模型结构参数表
[0079][0080]
步骤5)中，首先，将步骤3)中的样本数据集按照3:1的比例划分为训练数据集和测试数据集，本案例中选用前45天的数据作为训练数据集，后14天的数据作为测试数据集，所述数据集来自于步骤2)和3)，包含路网拓扑结构数据和路网交通状态等级标签数据；然后使用训练样本数据集对步骤4)中的模型进行训练，从而标定模型中的可训练参数，训练过程中损失随训练次数的变化见图5，模型的准确度随训练次数的变化见图6，从图中可以看出，对模型训练10次左右，模型的损失和准确度变化都趋于平缓；最后使用测试数据集对模型进行评估，测试结果见表2。
[0081]
表2模型评估表
[0082]
模型名称整体准确率基于gcn的路网交通状态判别模型95.86％
[0083]
对于本案例，针对某一路网，在完成路网交通状态等级判别模型的训练之后，获取该路网当前时间段的交通数据，将其以拓扑结构数据的形式输入到判别模型中，就可以得到当前路网所属的交通状态等级。
[0084]
本案例的实验结果表明，在考虑到以往研究的不足之处后，本发明提出的基于k
‑
means 聚类算法和图卷积神经网络的路网交通状态判别方法，能够对路网整体所属交通状态作出精确且可靠地判断。
[0085]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于BIM的市政工程交通事故应急处理方法及处理装置与流程

一种基于聚类和图卷积网络的路网交通状态判别方法与流程

相关文献

最热文献