一种构建自主式交通系统功能架构的方法

2022-06-05 11:27:14 来源：中国专利 TAG：

1.本发明属于道路交通技术领域，尤其涉及一种构建自主式交通系统功能架构的方法。

背景技术：

2.当前要建设“安全、便捷、高效、绿色、经济”的现代综合交通运输体系。已有的交通系统体系框架很难适应新兴技术下交通从“被动智能”向“主动智慧”的发展，亟需构建适应新一代交通发展的交通系统。在此背景下，国家明确提出了构建自主式交通系统(autonomous transportation system,ats)，以此改进当前智能交通系统对新兴技术的适用性问题，更科学、合理地指导我国的交通运输发展。

技术实现要素：

3.有鉴于此，本发明提出一种自主式交通系统功能架构构建方法，此方法促进新一代交通系统功能架构的构建，推动自主式交通系统理论体系的发展。
4.本发明公开的构建自主式交通系统功能架构的方法，包括以下步骤：
5.步骤1：针对多属性文本聚类问题，构建面向多属性文本的优化密度峰值聚类模型；
6.步骤2：依据多属性文本的特征计算词语属性频率和属性的逆向文档频率，根据所述词语属性频率与属性的逆向文档频率，将多属性文本转化成数值；
7.步骤3：依据不同属性文本的数值权重采用文本向量空间模型将数值转化成空间维度坐标；
8.步骤4：优化密度峰值的计算方式：采用高斯核方法优化数据点局部密度计算方式；
9.采用决策值优化聚类中心选取，选择决策值较大的样本作为密度峰值聚类中心，获得聚类结果；
10.步骤5：根据步骤4的聚类结果，采用轮廓系数法对聚类结果作出评价，对轮廓系数较低的数据点重复步骤4；
11.步骤6：验证算法的可行性，在自主式交通系统的道路自动驾驶场景下，三个服务域下的功能依据最终聚类结果分成“自主感知、自主学习、自主决策、自主响应”4层，依据层与层之间的关系，绘制功能架构图。
12.进一步的，步骤2的具体步骤如下：
13.(1)计算词语属性频率：其中，s表示某文本的属性，为该属性s在文档中出现的次数，wn(n＝1,2,...,n,n为文档总数)表示由文本属性组成的属性库；
14.(2)根据文本属性转换的需要，假定词语在属性库中必定出现，采用平滑的逆文档
频率计算属性的逆向文档频率：
[0015][0016]
(3)多属性文本tf-idf算法计算公式为tf
·
idf(s,wn,w)＝tf(s,wn)
·
idf(s,w)，当tf-idf值越大时表明该词语更能代表该文档，即在tf-idf值越大表明该属性越能够代表该文本。
[0017]
进一步的，基于文本向量空间模型得到文本空间维度坐标，所述文本向量空间模型将给定的文本转换成一定维数的向量，其以特征项作为文本表示的基本单位，向量的各维对应文本中的一个特征项，而每一维本身则表示了其对应的特征项在该文本中的权值，权值代表了特征项对于所在文本的重要程度，即该特征项能够多大程度上反映它所在文档的类别。
[0018]
进一步的，通过对密度峰值聚类算法进行优化，找到符合条件的聚类中心，将剩余待聚类点进行聚类，提高聚类性能，具体步骤如下：
[0019]
将局部密度截断核计算方式优化为高斯核计算方式，以显著提高密度计算的精细度；所述高斯核计算方式计算欧式距离和高斯函数值，将所有点值的和作为密度，所述高斯函数值定义样本局部密度计算公式为：
[0020][0021]
其中，d
ij
为样本xi和xj之间的距离，dc为截断距离，n为样本数；
[0022]
计算局部密度距离：计算每个点到高于自身局部密度值点的最小距离ξi，ξi的计算公式如下：对于密度最大的样本，ξi定义为ξi＝maxj(d
ij
)；其中pi为样本xi的局部密度，pj为样本xj的局部密度。
[0023]
对聚类中心点的选取采用决策值的方法进行优化：选择决策值γi较大的样本作为密度峰值聚类中心，即局部密度与局部密度距离乘积较大的点，γi的计算公式如下：γi＝ρi·
ξi。
[0024]
进一步的，通过轮廓系数检验聚类性能，对于轮廓系数较低的数据点进行重复聚类，具体算法流程如下：
[0025]
计算样本i到同簇其他样本的平均距离ai，ai称为样本i的簇内不相似度；ai越小，说明样本i越应该被聚类到该簇，簇c中所有样本的ai均值称为簇c的簇不相似度；
[0026]
计算样本i到其他某簇cj的所有样本的平均距离b
i,j
，称为样本i与簇cj的不相似度，定义样本i的簇间不相似度：bi＝{b
i1
,b
i2
,...,b
ik
}，bi越大，说明样本i越不属于其他簇；
[0027]
根据样本i的簇内不相似度ai和簇间不相似度bi，定义样本i的轮廓系数：
[0028]
[0029][0030]
判断：si接近1，则说明样本i聚类合理、有效；si接近-1，则说明样本i更应该分类到另外的簇；若si近似为0，则说明样本i在两个簇的边界上。
[0031]
进一步的，针对自主式交通系统功能架构的构建，将场景下的服务域中的功能进行聚类分析，依据聚类结果搭建功能架构，绘制功能架构图。
[0032]
进一步的，自主式交通系统的功能具有提供者、过程对象、服务对象三个属性，并建立属性库。
[0033]
本发明的有益效果如下：
[0034]
1)确定自主式交通系统功能架构构建方法，为自主式交通系统的构建提供新思路；
[0035]
2)优化密度峰值聚类算法，通过高斯函数值计算数据点密度，通过决策值优化聚类中心选取；
[0036]
3)针对各领域多属性文本转化成可用数据提供方法；
[0037]
4)本发明提供一种自主式交通系统功能架构构建方法，是对交通系统功能架构的创新，可为下一代自主式交通系统的构建提供参考。
附图说明
[0038]
图1本发明的方法流程图；
[0039]
图2密度峰值聚类算法原理图；
[0040]
图3道路载运工具运行服务域；
[0041]
图4交通基础设施管理服务域；
[0042]
图5交通安全管理服务域；
[0043]
图6寻找聚类中心散点图；
[0044]
图7初步聚类结果图；
[0045]
图8初步聚类轮廓系数图；
[0046]
图9碰撞管理子服务功能架构图。
具体实施方式
[0047]
下面结合附图对本发明作进一步的说明，但不以任何方式对本发明加以限制，基于本发明教导所作的任何变换或替换，均属于本发明的保护范围。
[0048]
本发明建立一种面向多属性文本的优化密度峰值聚类算法(density peaks clustering,dpc)模型构建自主式交通下的功能架构。该算法结合交通系统功能架构的基本特征，通过改进的词频-逆向文档频率(term frequency-inverse document frequency,tf-idf)算法与文本向量空间模型，将多属性文本转化成空间维度坐标。再利用高斯函数和决策值优化dpc算法进行聚类，并结合轮廓系数对聚类结果进行评价。算法个构建思路如图
1所示。
[0049]
tf表示词频，若某词语t在文档dn(n＝1,2,...,n,n为文档总数)中出现次，则词频考虑到每个文档的长度不同，根据文档长度调整得到该词语的词频为考虑到本模型是为多属性文本聚类服务，每个词语有较多的属性，现依据词语属性对其进行聚类分析，为优化聚类分析结果，对词语频率tf计算公式进行改进得到词语属性频率：
[0050][0051]
其中，s表示某文本的属性，wn(n＝1,2,...,n,n为文档总数)表示由文本属性组成的属性库；
[0052]
idf表示逆向文档频率，可用来度量某词语的普遍重要性，idf(t,d)可以使用文档的总数除以词语库中出现词语的文档数的对数表示，计算公式为其中，t表示某词语，d表示语料库整体，n表示语料库中的文档总数，n
t
表示语料库整体中出现t的文本频数，l的取值根据实验来确定，一般取0.01。根据文本属性转换的需要，假定词语在属性库中必定出现，采用平滑的逆文档频率计算文本属性的逆向文档频率：
[0053][0054]
多属性文本tf-idf算法计算公式为tf
·
idf(s,wn,w)＝tf(s,wn)
·
idf(s,w)，当tf-idf值越大时表明该词语更能代表该文档，即在本发明中tf-idf值越大表明该属性越能够代表该文本。由此根据每个文本的属性特征计算得到文本转化成的数据值，从而为将多属性文本转化成数据提供科学依据；
[0055]
根据tf-idf算法得到了不同属性文本的数值权重，为了采用密度峰值聚类算法进行空间聚类分析，需要将文本的属性权重转化成空间维度坐标，遂采用文本向量空间模型将属性权重转化成空间维度坐标。
[0056]
文本向量空间模型(vector space model,vsm)能将给定的文本转换成一定维数的向量，其以特征项作为文本表示的基本单位，向量的各维对应文本中的一个特征项，而每一维本身则表示了其对应的特征项在该文本中的权值。权值代表了特征项对于所在文本的重要程度，即该特征项能够多大程度上反映它所在文档的类别。模型的定义为：在给定的文档中d＝d(s1,w1；s2,w2；...；sn,wn)，d符合以下两条约定：各个特征项sk(1≤k≤n)互异；各个特征项sk无先后顺序关系，构造空间向量。即由tf-idf算法得到文本的属性权重tf
·
idf(s,wn,w)后，根据vsm将文本的多个属性转化成文本的空间维度坐标。
[0057]
密度峰值聚类算法(density peaks clustering,dpc)是一种基于密度的空间聚类算法，算法的原则是：聚类中心的局部密度较大，聚类中心与高于其局部密度的其他点距离较远。该算法的步骤如下：
[0058]
(1)设定截断距离dc，根据统计学经验dc＝0.02或dc＝0.04。
[0059]
(2)对于给定的数据集xn·m＝[x1,x2,...,xn]
t
，其中xi＝[x
i1
,x
i2
,...,x
in
]，n为样本个数，m为样本维数。样本xi的局部密度表示为ρi，计算公式如下：ρi＝∑
i≠j
χ(d
ij-dc),其中，d
ij
为样本xi和xj之间的距离，使用欧式距离计算距离，将与xi的距离小于dc的点的数量直接作为第i点密度。欧式距离计算公式(i,j＝1,2,...,n,i≠j,α＝1,2,...,m)，其中，x
iα
表示第i点的第α维坐标。
[0060]
(3)计算局部密度距离：计算每个点到高于自身局部密度值点的最小距离ξi，ξi的计算公式如下：对于密度最大的样本，ξi定义为ξi＝maxj(d
ij
)，其中pi为样本xi的局部密度，pj为样本xj的局部密度。
[0061]
(4)根据密度与距离估计中心点：对每一个待聚类点，绘制出局部密度与高于局部密度点距离的散点图，密度峰值通常是局部密度较高且相对距离较大的样本。
[0062]
(5)划分剩余待聚类点：将每个数据点归类到比他们密度更大的最相近的类中心所属的类别中。密度峰值聚类算法原理如图2所示。
[0063]
通过对dpc算法进行优化，能够更加精准地找到符合条件的聚类中心，将剩余待聚类点进行聚类，提高聚类性能。将局部密度截断核计算方式优化为高斯核计算方式，能够显著提高密度计算的精细度，从而更好地优化聚类效果。高斯核计算方式将计算欧式距离和高斯函数值，将所有点值的和作为密度。高斯函数值定义样本局部密度计算公式为：由于密度峰值聚类算法最初是依据局部密度与高局部密度点距离的散点图人工选取聚类中心，由人工进行聚类中心的选取易出现较大的偏差，因此对聚类中心点的选取进行优化。采用决策值的方法进行优化：选择决策值γi较大的样本作为密度峰值聚类中心，即局部密度与局部密度距离乘积较大的点，γi的计算公式如下：γi＝ρi·
ξi[0064]
轮廓系数用于评估聚类的效果，其取值范围为[-1,1]。轮廓系数越大，表示聚类的效果越好。具体算法流程如下：
[0065]
(1)计算样本i到同簇其他样本的平均距离ai，ai称为样本i的簇内不相似度。ai越小，说明样本i越应该被聚类到该簇。簇c中所有样本的ai均值称为簇c的簇不相似度。平均距离ai即计算样本i到同簇其他样本的距离之和再除以所有样本数。
[0066]
(2)计算样本i到其他某簇cj的所有样本的平均距离b
i,j
，称为样本i与簇cj的不相似度。定义样本i的簇间不相似度：bi＝{b
i1
,b
i2
,...,b
ik
}，bi越大，说明样本i越不属于其他簇。平均距离b
i,j
即计算样本i到其它某簇cj的所有样本的距离之和再除以所有样本数。
[0067]
(3)根据样本i的簇内不相似度ai和簇间不相似度bi，定义样本i的轮廓系数：
[0068]
[0069][0070]
(4)判断：si接近1，则说明样本i聚类合理、有效；si接近-1，则说明样本i更应该分类到另外的簇；若si近似为0，则说明样本i在两个簇的边界上。
[0071]
通过选取下一代自主式交通系统中的道路自动驾驶场景下的功能数据集进行实例分析，以验证算法的性能。自主式交通系统共分成九大服务域：出行者信息服务域、道路载运工具运行服务域、货物运输服务域、交通基础设施管理服务域、公共交通服务域、交通运营管理服务域、综合交通运输服务域、交通安全管理服务域、数据管理与安全服务域。根据道路自动驾驶场景搭建的需要，研究场景下的道路载运工具运行服务域、交通基础设施管理服务域和交通安全管理服务域三个服务域，每个服务域下均有对应的服务、子服务以及功能。道路载运工具运行服务域中共有3项服务、10项子服务，该服务域分布如图3所示。交通基础设施管理服务域总共有1项服务，2项子服务，该服务域分布如图4所示。交通安全管理服务域共有2项服务、3项子服务，该服务域分布如图5所示。
[0072]
三个服务域中的每项子服务中均包含多种功能，为便于进行聚类，首先对功能的属性进行如下定义并建立属性库。
[0073]
(1)提供者：决定组分实体、关联技术组合和关联需求组合。对属性提供者建立库用ai(i＝1,2,......,10)表示，如表1所示。
[0074]
表1属性提供者库
[0075][0076][0077]
过程对象：功能实现所利用或处理的对象。对属性过程对象建立库，用bi(i＝1,
2,......,25)表示，如表2所示。
[0078]
表2属性过程对象库
[0079]
符号名称符号名称b1车辆基础信息b
14
路面基础信息b2车辆数据b
15
路网信息b3车辆信息b
16
任务派遣信息b4车辆运行信息b
17
设备操作信息a5车辆状态数据b
18
事故信息b6调度方案b
19
协同设施信息b7驾驶员信息b
20
养护方案b8交通法规信息b
21
预警方案b9交通状态信息b
22
预警信息b
10
紧急车辆信息b
23
支撑设施信息b
11
紧急事件信息b
24
周边车辆信息b
12
紧急预警信息b
25
周边环境信息b
13
路径导航信息
ꢀꢀ
[0080]
服务对象：能够直接使用功能或利用功能的输出结果的对象。对属性服务对象建立库用ci(i＝1,2,......,10)表示，如表3所示。
[0081]
表3属性服务对象库
[0082][0083][0084]
结合属性库研究每个功能的属性，对道路自动驾驶场景下的子服务的各个功能采用属性组合形式表示。根据子服务的需求科学确定其所需功能，如下：
[0085]
表4场景下的服务功能表
[0086]
服务功能
自动泊车{a1；a2；a3；a4；a5；a6；a7；a8；a9}自适应巡航{a1；a
10
；a
11
；a
12
；a
13
；a5；a
14
；a
15
；a7；a
16
；a
17
；a
18
}自动换道{a2；a4；a
10
；a
19
；a
14
；a7；a
16
；a
20
；a
21
}碰撞管理{a
10
；a1；a
19
；a
16
；a
16
；a
22
；a
23
；a
24
}车辆编队驾驶服务{a1；a2；a
10
；a
25
；a7；a
16
；a
26
；a
27
；a
28
；a
29
}车辆与信号灯协同驾驶服务{a
30
；a
13
；a
31
；a
15
；a
32
；a
33
；a
34
}无信号灯路口通行服务{a
10
；a
35
；a
36
；a
16
；a
36
；a
37
；a
38
；a
39
；a
40
；a
41
}车辆年检{a
42
；a
43
；a
44
；a
45
；a
46
；a
47
}无人车整车性能测试{a
48
；a
42
；a
44
；a
45
；a
49
；a
50
}无人车情景测试{a
48
；a
42
；a
51
；a
44
；a
45
；a
52
；a
49
；a
50
}通信技术协同设施管理{a
53
；a
54
；a
55
；a
56
；a
57
}人工智能信息支撑设施管理{a
58
；a
59
；a
60
；a
61
；a
62
}车载监控与预警{a
63
；a
48
；a
45
；a
44
；a
64
；a
65
；a
66
}紧急事件检测与自动识别{a
67
；a
68
；a
69
；a
70
；a
71
；a
72
；a
73
；a
74
}紧急车辆调度{a
75
；a
60
；a
72
；a
76
；a
77
；a
78
}
[0087]
采用tf-idf算法将每个服务下功能的属性转化为数据，并依据vsm算法转化成空间维度坐标，如表5所示。
[0088]
表5场景下的功能空间维度坐标表
[0089]
[0090][0091]
由于部分不同名称的功能具有相同的属性，故将上述78个数据删去重复值后共计37个空间维度坐标数据，再运用matlab软件进行编程，采用优化的密度峰值聚类算法，其中dc取0.02。计算出每个功能点的密度和局部密度距离，得到寻找聚类中心散点图，如图6所示。
[0092]
通过上图可以看到，针对每个功能点计算出了数据密度和局部密度距离，采用决策值法计算每个功能点的数据密度和局部密度距离乘积，按照降序排列，从第六位开始数据的决策值低于0.1，故将决策值较大的前5位记录如表6，表中数据说明待聚类点以这5个点为聚类中心较合适。
[0093]
表6决策值
[0094][0095]
[0096]
接着，依据密度峰值聚类算法原理，继续对数据进行聚类分析，通过matlab编程得到如图7所示的聚类结果图。然后，采用轮廓系数对由密度峰值聚类算法得到的各功能点进行聚类结果评价，得到如下图8所示各功能点的轮廓系数图。聚类后轮廓系数整体均值为0.84，聚类效果较好，但其中有三个数据点的轮廓系数低于0.6。为此，再次对这三个数据点所在的簇1、簇4进行聚类分析，以提高聚类结果性能。重新对簇1和簇4进行聚类分析后，整理得到如表7所示4簇聚类结果。
[0097]
表7最终聚类结果
[0098][0099]
依据聚类结果，将簇1命名为自主感知层，该层主要是获取实体世界的信息；簇2命名为自主学习层，该层主要是处理感知数据、获取知识；簇3命名为自主决策层，该层主要是通过充分评估，形成最优控制方案；簇4命名为自主响应层，该层主要是最终执行阶段。
[0100]
绘制功能架构图如图9所示，以道路载运工具运行服务域中的自动车辆驾驶服务下的碰撞管理子服务为例。在该子服务中，共有自主感知层、自主学习层、自主决策层和自主响应层四层，最终通过多种多属性功能实现碰撞管理子服务，进而支持自动车辆驾驶服务。
[0101]
本发明的有益效果如下：
[0102]
1)确定自主式交通系统功能架构构建方法，为自主式交通系统的构建提供新思路；
[0103]
2)优化密度峰值聚类算法，通过高斯函数值计算数据点密度，通过决策值优化聚类中心选取；
[0104]
3)针对各领域多属性文本转化成可用数据提供方法；
[0105]
4)本发明提供一种自主式交通系统功能架构构建方法，是对交通系统功能架构的创新，可为下一代自主式交通系统的构建提供参考。
[0106]
本文所使用的词语“优选的”意指用作实例、示例或例证。本文描述为“优选的”任意方面或设计不必被解释为比其他方面或设计更有利。相反，词语“优选的”的使用旨在以具体方式提出概念。如本技术中所使用的术语“或”旨在意指包含的“或”而非排除的“或”。即，除非另外指定或从上下文中清楚，“x使用a或b”意指自然包括排列的任意一个。即，如果x使用a；x使用b；或x使用a和b二者，则“x使用a或b”在前述任一示例中得到满足。
[0107]
而且，尽管已经相对于一个或实现方式示出并描述了本公开，但是本领域技术人
员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型，并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件等)执行的各种功能，用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示)，即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外，尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开，但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或其他特征组合。而且，就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言，这样的术语旨在以与术语“包含”相似的方式包括。
[0108]
本发明实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以多个或多个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器，磁盘或光盘等。上述的各装置或系统，可以执行相应方法实施例中的存储方法。
[0109]
综上所述，上述实施例为本发明的一种实施方式，但本发明的实施方式并不受所述实施例的限制，其他的任何背离本发明的精神实质与原理下所做的改变、修饰、代替、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种构建自主式交通系统功能架构的方法

相关文献

最热文献