开源地图与专业数据源路网自适应匹配法的制作方法

2021-10-30 02:18:00 来源：中国专利 TAG：匹配路网数据库地图数据源

1.本发明涉及一种跨数据库地图路网匹配方法，特别涉及一种开源地图与专业数据源路网自适应匹配法，属于跨数据库路网匹配技术领域。

背景技术：

2.数据共享是现代信息社会发展最重要的主题之一，而随着地理信息技术的在信息社会中的应用普及和深入，产生了gb甚至tb数量级由不同工具、不同时间、不同部门采集的地理数据，集成这些多源地理数据是数据共享时代的必然趋势，有效集成现势性好和数据质量更优的多个数据源是实现空间数据更新的有效途径，有利于提高数据质量，保证数据的时效性与地理信息应用系统高效运行。
3.路网不仅是普通地图数据中的基本要素，还是基于位置服务、导航与智能交通等热门应用中必不可少的空间数据，且这些应用对路网数据的准确性和现势性都有较高要求。而大多数专业部门的空间路网数据库主要还是通过外业修补测或矢量化航空影像并结合人工更新入库的手段更新数据，这样的方式存在成本高、自动化程度低、进度缓慢等缺陷。
4.近年来，在各类应用和新挑战的驱动下，开展了大量相关研究与实践，为专业数据源路网的自动化更新提供了有力条件。一方面，众源地理数据源的出现为专业数据源路网的自动化更新提供了有前景的解决方案，开源地图osm即开放街道地图，是众源地理数据源典型代表，是一个建构自由内容的网上地图协作计划，目标是创造一个内容自由且能让所有人编辑的世界地图，开源地图允许人人作为传感器采集共享数据，为专业数据源路网更新提供完全免费，即时更新的数据源；另一方面，空间数据匹配是实现数据融合和更新的前提条件，异构空间数据无缝集成的主要内容之一就是多尺度多源多时相空间数据匹配及一致性处理，空间数据实体匹配受到gis研究和应用部门的广泛关注。近年来，空间数据匹配在自动化程度、匹配精度、匹配类型识别粒度等方面有所突破，实现更精细准确的实体匹配，匹配特征对象也不断丰富，从简单的点
‑
点实体匹配扩展到复杂的面
‑
面、线
‑
线、点
‑
线实体匹配等，而且它们之间可以互相转化。
5.但目前的匹配方法还存在匹配结果受匹配临界值影响、计算简易性与匹配精度无法兼得、匹配精度不高、匹配类型识别不完整、算法鲁棒性不足等问题。现有技术实体匹配算法基本都能实现匹配，但是都具有较大的局限性，无法适应不同数据源不规范情况下的数据匹配，不具备基于数据源以及从过去匹配错误中自学习能力与自动优化匹配模型的能力，未达到智能化匹配水平。
6.在数据共享的大时代背景下，完全免费、现势性好、数据精细的众源地理数据源开源地图osm(开放街道地图)的出现为原本耗时耗力，成本高昂的专业数据源路网的数据集成与快速更新提供了新的解决方案。空间实体匹配是实现空间数据集成与更新的不可缺少的一步，更是关键一环。现有技术的实体匹配算法只针对数据规范标准的空间实体匹配，而众源地理数据开源地图采集过程中由业余人士采集引起的数据不规范性等问题，对传统实
体匹配算法提出了新的挑战，因此研发面向众源地理数据开源地图与专业数据源路网之间的实体匹配研究非常必要，一方面能使匹配算法适应新的数据源，提高算法鲁棒性，另一方面能提高实体匹配的可靠性和精度，在促进数据共享，保证空间数据可靠性和现势性等方面具有重要的价值。
7.广义上实体匹配方法均是基于临界值的匹配方法，或多或少存在临界值问题，无法完全避免，目前无论是基于临界值还是非基于临界值的，自动化水平还需要向智能化发展，尤其是在数据变得复杂情况下，需要进行实体匹配智能化自适应的探索。
8.现有技术的跨数据库地图路网匹配存在缺陷和不足，本发明的难点和待解决的问题主要集中在以下方面：
9.第一，路网不仅是普通地图数据中的基本要素，还是基于位置服务、导航与智能交通等热门应用中必不可少的空间数据，且这些应用对路网数据的准确性和现势性都有较高要求。而现有技术专业部门的空间路网数据库主要还是通过外业修补测或矢量化航空影像并结合人工更新入库的手段更新数据，这样的方式存在成本高、自动化程度低、进度缓慢等缺陷；
10.第二，目前的匹配方法还存在匹配结果受匹配临界值影响、计算简易性与匹配精度无法兼得、匹配精度不高、匹配类型识别不完整、算法鲁棒性不足等问题。现有技术实体匹配算法基本都能实现匹配，但是都具有较大的局限性，无法适应不同数据源不规范情况下的数据匹配，不具备基于数据源以及从过去匹配错误中自学习能力与自动优化匹配模型的能力，未达到智能化匹配水平；
11.第三，路网匹配的两个数据源分别是开源地图和专业数据源路网，开源地图作为路网数据源具有数据量大、完全免费、信息丰富和现势性好等优点，开源地图允许任何用户包括业余用户采集和编辑数据，这种开放地图模式引起了路网数据的一些问题：一是数据表达不规范，主要是拓扑错误；二是表达不同，与专业数据源相比，有不同的道路交叉路口表达，不同的多匝道的高速表达不同的同名道路分段表达；三是不同区域数据覆盖度不同，城市区域覆盖度大，数据较密集，而在农村或者山区数据覆盖小，数据稀疏；四是不同地区数据详细程度不同；五是道路名属性缺失及不规范，如中英文混合，这些问题对传统的匹配算法的鲁棒性、匹配准确率、召回率以及效率提出了挑战，基于开源地图数据情况的缺陷和复杂的情况，根据传统数据源的经验临界值设定单个差异度、相似度临界值、综合差异度、相似度临界值是不可行的，另外对于使用综合差异度或者相似度的匹配算法，人为给定各特征差异度或者相似度权值也是不客观的，在设计匹配模型时需要考虑权值和临界值的自适应性，即能随数据的实际情况自动调整；
12.第四，开源地图(众源地理数据源)的出现为原本耗时耗人力，成本高昂的专业数据源路网的数据集成与快速更新提供了前景巨大的数据源，要实现开源地图路网更新专业数据源路网必须要先实现两个数据源路网之间的空间实体匹配，但是现有技术的实体匹配算法只针对规范标准的数据，而开源地图的开源模式允许业余人士采集数据，数据存在的表达不规范、区域详细程度不一致等诸多问题，现有技术的实体匹配算法的自适应性、鲁棒性和匹配精度无法满足要求，开源地图路网与专业数据源路网的匹配问题得不到解决；
13.第五，路网匹配关系的模式识别与分类一方面是由于分类问题的复杂性，匹配特征对象之一是众源路网数据，众源数据开源地图的路网由业余志愿者采集制作，在数据表
达上与专业数据源差异极大，甚至不规范，使分类问题变得复杂；另一方面现有技术处理该非线性分类问题，精度较差、识别率低、训练速度慢、容易陷入局部极值、新的样本不易加入训练好的网络，现有技术不适合应对开源地图与专业数据源路网的匹配关联分类识别，无法避开人为给定经验权值和临界值的问题，增加或者减少类别模式时需要重新进行长时间的训练，运行效率很低。

技术实现要素：

14.针对现有技术的不足，本发明针对开源地图路网更新专业数据源路网应用中的路网实体匹配问题，分析了开源地图与专业数据源的情况对匹配算法设计提出的挑战，分析了基于匹配关联分类的路网匹配方法的可行性基础上，提出一种基于概率网络改进识别的路网实体自适应匹配方法。基于本发明匹配方法的架构，提出了样本的制作方法流程以及训练样本与检测样本的选取规则，改进了路网匹配特征对表达模型，并基于此模型提出几何差异度计算方法，设计并实现了针对新的匹配关联分类识别的概率网络改进识别方法，采用该神经网络进行路网匹配表现出较高的匹配关系辨别率、匹配准确率、匹配召回率、匹配效率高。
15.为达到以上技术特征，本发明所采用的技术方案如下：
16.开源地图与专业数据源路网自适应匹配法，首先将匹配问题转化为匹配关联分类问题，并提出新的匹配关联分类，构建新的匹配关系类别与传统匹配关系类别的联系，设计基于概率网络改进识别的路网匹配方法架构，包括三个关键步骤：样本制作、概率网络改进识别训练和辨别匹配关系、确定匹配特征对；设计样本制作方法和流程，关键步骤包括：数据预处理、寻找待识别匹配特征对、提取特征和划分样本；设计样本选取规则；设计路网匹配特征对表达模型以及基于该表达模型的几何差异度计算方法，其中几何相差异度包括两个方向的长度比、基于改进后的中值hausdorff间隔度量的空间位置差异度和方向差异度；设计面向路网匹配关联分类问题的概率网络改进识别结构，主要包括层数、各层的神经元数量、各层输入与输出、层间连接的设计以及激励函数的选择与平滑因子的设定；设计该神经网络的实现流程；
17.第一，基于匹配关联分类的路网匹配方法，采用概率网络改进识别进行匹配关系辨别，进而确定匹配特征对，本发明提出新的匹配关联分类，包括全部匹配、部分匹配、不匹配，并建立其与传统匹配关系类别的具体关系，两种分类的关系是前者可组合推理出后者，后者可分解为前者，两种分类无缝转化；
18.第二，样本制作方法和流程以及选取规则，将矢量路网转化为向量形式的输入样本，包括以下关键步骤：通过投影转换，将路网转化到统一的平面坐标系统，为准确的特征提取提供统一的空间参考，通过50m缓冲区查询获取备选匹配集，通过开源地图数据的情况分析，选取的特征仅包含几何差异度，并设计特征的计算方法，多个特征构成的向量将作为概率网络改进识别进行匹配关联分类识别的依据，经过以上关键的三个步骤，完成样本制作，制定训练样本和检测样本的选取规则；
19.第三，几何差异度计算方法，改进路网匹配特征对表达模型，并设计基于此模型进行几何差异度计算方法，仅在两要素的重叠部分增加虚拟节点来保证重叠部分节点和折线段一一对应，基于重叠部分的匹配特征对表达模型，设计两个方向的长度比、基于改进的中
值hausdorff间隔度量的空间位置差异度和方向差异度的计算方法；
20.第四，面向新匹配关联分类识别的概率网络改进识别设计与实现，在概率网络改进识别分类器的基本结构基础上，设计具体的网络结构、各层的输入和输出以及选择激励函数，基于matlab的neural network toolbox实现本发明设计的概率网络改进识别。
21.开源地图与专业数据源路网自适应匹配法，进一步的，基于匹配关联分类的路网匹配：路网匹配寻找两路网中道路实体的一一对应关系，即匹配关系，在不同的匹配关系类型情况下，匹配特征对具有其对应类别特有的特征模式，识别出匹配关系类型即确定待匹配特征对是否匹配与具体的匹配关系，识别出匹配关系即确定匹配特征对，本发明根据匹配特征对的特征，先识别待匹配特征对匹配关系类型，再确定是否匹配以及确定最终的匹配特征对，路网匹配问题转化为模式识别分类问题；
22.本发明提出新的匹配关系的分类以方便被识别，新匹配关系类型分为全部匹配、部分匹配和不匹配三类，新匹配关系类型与传统的匹配关系类型之间的关系是前者可以组合推理出后者，后者可以分解为前者，具体关系为：全部匹配是道路要素长度接近情况下的1:1的匹配，部分匹配是两个道路要素各自只有部分相互匹配，不匹配是两个道路要素任何部分都不匹配，全部匹配的匹配特征对必须是1:1的匹配特征对，当这两个道路要素只与对方存在部分匹配关系，而与其它任何道路要素都为不匹配，则组合推理得这两个道路要素仍然是1:1匹配关系，当这两个道路要素中至少一个要素还与其它道路要素存在部分匹配关系，则组合推理得这几个道路要素存在n:m(1:n)匹配关系，当一个道路要素与其它任何道路要素的匹配关系都为不匹配时，则其单独构成1:0匹配特征对，即1:1的匹配关系包含全部匹配关系，可分解为一个全部匹配关系或一个部分匹配关系，n:m(1:n)匹配关系可分解为多个部分匹配关系，1:0可分解为多个不匹配关系，本发明通过新的匹配关联分类解决传统匹配关系下的路网匹配问题。
23.开源地图与专业数据源路网自适应匹配法，进一步的，基于概率网络改进识别的路网匹配框架：提出基于概率网络改进识别的开源地图路网与专业数据源路网匹配方法，采用概率网络改进识别来对匹配特征对的匹配关系进行分类，基于匹配关联分类识别的结果进一步解决路网匹配问题；
24.基于概率网络改进识别的路网匹配算法包括三个关键步骤：输入样本的选取与制作、概率网络改进识别训练和检测、辨别匹配关系和确定匹配特征对；
25.输入样本的选取与制作：目的是将几何路网匹配特征对转化成概率网络改进识别能处理的信息形式——特征向量，首先进行数据预处理，主要是进行投影转换，然后按一定缓冲区范围选择道路备选集，待识别匹配特征对的几何差异度计算过程即为匹配特征对特征提取过程，由该匹配特征对的多个特征差异度值构成输入样本，即为一个多维的特征向量，完成样本制作，为训练和检测概率神经网，随机选择一定量的样本并进行人工标记，划分为训练样本和检测样本；
26.概率网络改进识别训练和检测：目的是完成概率网络改进识别的设计，使一定结构的分类器自动识别未知类别的匹配特征对的匹配关系，采用标记后的训练样本输入概率神经网后由其自动训练学习知识，采用标记后的检测数据检验训练后的概率网络改进识别性能，如果经验证性能符合要求，则完成概率网络改进识别；
27.辨别匹配关系和确定匹配特征对：目的是根据匹配关系辨别结果构成的矩阵，确
定1:1、1:0、1:n和n:m的匹配特征对，采用训练后的概率网络改进识别对待识别匹配特征对的匹配关系进行识别与分类，处理由识别结果错误带来的矛盾，最后由本发明匹配关联分类与传统匹配关联分类间关系，确定1:1、1:0、1:n和n:m匹配特征对。
28.开源地图与专业数据源路网自适应匹配法，进一步的，样本制作的关键步骤包括：数据预处理、生成备选匹配集、提取特征和划分样本；
29.数据预处理：只进行投影转换，转化到统一的平面坐标系，为准确的特征提取提供统一的空间参考；
30.生成备选匹配集：目的是缩小寻找匹配特征对象的范围，为一种粗匹配策略，对于开源地图路网与专业数据源路网之间的匹配，采用缓冲区查询，以待匹配特征对象为中心，查询其一定缓冲区范围覆盖的另一个数据库中的对象，这些对象就是该待匹配特征对象的备选匹配集，备选匹配集中的每个对象与待匹配特征对象构成一个待识别匹配特征对；
31.特征提取：包括特征的选择和特征的计算，衡量空间实体匹配特征对是否匹配的标准包括几何差异度、语义差异度和拓扑差异度，差异度的选择受实体的特征影响，鉴于开源地图路网情况复杂和部分数据缺陷，采用几何差异度包括基于间隔度量的空间位置差异度和方向差异度作为概率网络改进识别判断匹配情况的依据，在线要素实体的长度特征基础上提出新的几何差异度——长度比，本发明提取的匹配特征对特征包括长度比ht、空间位置差异度距离a和方向差异度y，作为概率网络改进识别匹配关系的依据，根据这些特征的计算方法，对一个待识别匹配特征对进行特征提取后即获得一个样本c＝[ht,a,y]，实质是一个特征向量；
[0032]
输入样本划分：根据用途和匹配类型的不同进行输入样本的划分，样本根据用途被划分为训练样本、检测样本和待识别样本，训练样本、检测样本分别用于训练阶段和检测阶段，训练样本和检测样本根据其对应的匹配特征对实际匹配关系的不同划分为全部匹配类、部分匹配类、不匹配类，分别用1、2、3进行人工标记。
[0033]
开源地图与专业数据源路网自适应匹配法，进一步的，样本选取规则：
[0034]
第一，训练样本随机选取，尽量保证空间上分布均匀；
[0035]
第二，训练样本和检测样本选取时尽量保证匹配关系属于各个类别的样本数量尽量相同；
[0036]
第三，训练样本与检测样本的比例保持6:4；
[0037]
保证训练样本和检测样本在空间上分布均匀，用规则网格划分子区域，按子区域随机选取匹配特征对样本，由这些分布均匀的匹配特征对样本经特征提取获得空间上分布均匀的训练样本和检测样本，减少由训练样本数量差异对分类器训练效果的影响及减少检测样本数量差异对检测性能比对带来的影响。
[0038]
开源地图与专业数据源路网自适应匹配法，进一步的，路网匹配特征对表达模型：将两个要素各个对应折线段之间的特征差异度进行加权平均，作为匹配特征对的特征，通过增加虚拟节点的方法改进对原匹配特征对表达模型；
[0039]
判断是否添加虚拟节点的过程从更短的一个起点开始，作为该道路的起算点，并向另一条道路作垂直，垂点为另一条道路的添加虚拟节点过程的起算点，从二条道路的起算点开始逐个比较对应折线段长度，如果不等长，则在短的一个折线段上添加一个虚拟节点，使新的对应折线段等长，重复上述操作，一旦找到其中一条道路的最后一个折线段的对
应折线段，则停止，最后添加的一个虚拟节点到起算点之间的道路为重叠部分，重叠部分为匹配特征对内部，其它部分为匹配特征对外部。
[0040]
开源地图与专业数据源路网自适应匹配法，进一步的，基于表达模型的几何差异度计算方法：在增加虚拟节点后，道路要素h1在匹配特征对内部由节点集合ud＝{d1,d2,
……
,d
n
}和折线段集cd＝{d1d2,d2d3,
……
,d
n
‑1d
n
}构成，道路要素h2在匹配特征对内部由节点集合ue＝{e1,e2,
……
,e
n
}和折线段集合ce＝{e1e2,e2e3,
……
,e
n
‑1e
n
}构成，节点集和折线段集合的大小分别为n和n
‑
1，具体的长度比ht、距离a和方向差异度y的计算公式为：
[0041][0042][0043][0044][0045]
其中
[0046]
式中，ht(d,e)与ht(e,d)分别表示从道路要素d到道路要素e方向的长度比和从道路要素e到道路要素d方向的长度比；h(j)表示匹配特征对内部的长度，h(d)和h(e)分别表示道路要素d与道路要素e的长度；a(d
i
,e)表示道路要素d的节点a
i
到道路要素e所有节点的距离的最小值，计算这些最小距离的中值，ang(d
j
d
j 1
，e
j
e
j 1
)计算匹配特征对中对应折线段d
j
d
j 1
与e
j
e
j 1
的夹角；
[0047]
基于部分匹配情况的存在，采用有方向的长度比，一方面反映长度情况，另一方面区分距离小且方向一致情况下的全部匹配类与不匹配类、部分匹配类与全部匹配类和部分匹配类与不匹配类；
[0048]
ht(d,e)与ht(e,d)是道路要素d在匹配特征对内部的长度占道路要素d长度的比例和道路要素e在匹配特征对内部的长度占道路要素e的长度，在两个道路要素方向一致的情况下，当ht(d,e)与ht(e,d)的值其中一个大而另一个小时，则很大可能匹配模式属于部分匹配；当两者都很大时，匹配模式很可能是全部匹配；当两者都很小时，很可能不匹配，至于大与小的临界值，由概率网络改进识别自适应的根据数据情况确定，自动进行模式识别分类。
[0049]
开源地图与专业数据源路网自适应匹配法，进一步的，如果两条道路描述的是现实中同一道路，两者在空间位置上也是邻近的，即空间位置差异在一定值范围内，两者匹配的可能性最大，该空间位置的差异度可用线要素间距离描述，本发明差异度度量方法在sm
‑
hd基础上做进一步改进，只计算匹配特征对内部的sm
‑
hd而非整个线状要素以处理道路表达划分不一致而引起的大量长度悬殊的部分匹配情况，进而本发明的距离计算方法能帮助识别1:n匹配关系的匹配特征对，减少不必要的异常距离值和外部的距离计算量。
[0050]
开源地图与专业数据源路网自适应匹配法，进一步的，概率网络改进识别的自适应匹配：在概率神经网络分类器的结构基础上，基于实际应用设计具体的网络结构、各层的输入和输出并选择激励函数，平滑因子设置为0.1，神经网络共由4层组成：
[0051]
第1层：输入层，包含4个神经元，输入层的输入为一个四维的特征向量，每个神经元分别对应于提取4维匹配特征对特征向量c＝[ht(d,e),ht(e,d),a,y]的一个元素，即道路实体d到e方向的长度比、道路实体e到d方向的长度比、道路实体间距离和道路实体间方向差异度，该层的输出为这个四维的输入特征向量与全部匹配类、部分匹配类、不匹配类各训练样本的距离，作为下一层的输入；
[0052]
第2层：径向基层，每个神经元与样本制作方法中选取的训练样本一一对应，神经元个数与选取的样本数量相同，径向基层与输入层神经元间连接采用第1层流向第2层的前向全连接，即第1层中每个神经元与第2层每个神经元都有一个带方向的连接，高斯函数作为径向基层神经元激励函数，该层输出为经过激励函数转化后的待识别样本与三类各训练样本的距离构成的向量，作为下一层的输入；
[0053]
第3层：求和层，神经元个数为3，第1、2、3个神经元分别与全部匹配类、部分匹配类、不匹配类对应，三个类别的人工标记序号依次为1、2、3，第3层与第2层间连接方式为前向的部分连接，根据训练数据已知类别，将两层对应同一类别的神经元相连，其余不连接，该层输出为待识别样本依次属于全部匹配类、部分匹配类、不匹配类的后验概率构成的向量，作为下一层的输入；
[0054]
第4层：输出层，由一个神经元构成，并计算求和层所有神经元输出值的最大值，最后该层输出对应的类别号，即后验概率最大的类作为输出类，全部匹配类、部分匹配类、不匹配类分别对应的输出类别号为1、2、3，作为下一层的输入。
[0055]
开源地图与专业数据源路网自适应匹配法，进一步的，概率网络改进识别实现流程：
[0056]
第一步，样本定义，定义样本首先将数据输入matlab，定义t
×
p的矩阵trainx存储训练输入，p个长度为t的列向量表示p个训练样本，t等于匹配特征对特征数量4，定义1
×
p的行向量tout存储对应的训练标记输出，每个元素存储对应trainx样本的归属类别标量；
[0057]
第二步，样本归一化，采用函数mapminmax对训练样本即矩阵trainx进行归一化；
[0058]
第三步，模型训练，训练概率网络改进识别模型的过程即创建网络的过程，是设置权值和传输函数的过程，采用函数newpnn(q,r,spread)创建概率网络改进识别，其中参数q是t
×
p的矩阵，用于接收训练输入矩阵，参数r是c
×
p的矩阵，表示训练输入的目标输出，c等于类别数量3，元素个数为c的列向量都是单位向量，其中只有对应类别处的元素值为1，其余均为0；参数spread是可调参数平滑因子；
[0059]
第四步，检测，首先定义检测样本和其正确的分类模式输出，然后同训练数据一样采用函数mapminmax进行归一化，并将t
×
w检测输入矩阵testx的矩阵存储训练输入，采用y＝sim(net,testx)函数将样本输入训练后模型。同理检测输入对应的输出y是向量形式的，通过vec2ind(y)函数转化为标量形式z，采用tic/toc记录检测样本计算输出耗费的时间；
[0060]
第五步，结果输出，输出模型检测结果z，并与正确的分类模式比较，结果标量相同则正确，否则错误，统计识别正确率，输出检测与识别所需的时长。
[0061]
与现有技术相比，本发明的贡献和创新点在于：
[0062]
第一，本发明的特色与创新点包括：一是实体匹配问题转化为模式识别问题，打破传统基于人为给定临界值来判断实体是否匹配的方法，将道路实体匹配问题转化为匹配关系辨别问题，概率网络改进识别具有识别率高、训练速度快、不会陷入局部极值和新的样本易于加入训练好的网络等优点，引入概率网络改进识别解决匹配关系辨别问题，一方面避开了传统匹配模型中综合差异度量模型中各差异度的经验权值和匹配临界值的确定问题，基于贝叶斯最小错误率决策依据，获得最优的匹配结果；另一方面提高了匹配准确率、匹配召回率以及效率。二是长度比的应用，传统实体间相似性度量中没有考虑长度比，本发明匹配算法考虑长度比，有助于提高1:n、n:m与1:0的匹配关系下的匹配特征对识别准确与召回率，从而提高总体匹配效果和效率；
[0063]
第二，提出基于匹配关联分类的路网匹配方法，匹配关系类型包括1:1、0:1、1:m和m:n，一方面在不同的匹配关系类型情况下，匹配特征对具有相应的特征；另一方面识别匹配关系类型即确定待匹配特征对是否匹配与具体的匹配关系，识别了匹配关系即能确定匹配特征对，基于这两方面考虑，本发明根据匹配特征对的特征，通过识别待匹配特征对匹配关系类型来确定是否匹配，鉴于概率网络改进识别率高、训练速度快、不会陷入局部极值和新的样本易于加入训练好的网络等优点，其能处理大数据量的路网匹配类型分类识别，基于传统的匹配关系类别无法直接采用概率网络改进识别，本发明提出了新的匹配关联分类，包括全部匹配、部分匹配和不匹配，并进一步提出新的匹配关联分类与传统匹配分类的关系；
[0064]
第三，提出输入样本的选取与制作流程以及选取规则，由于概率网络改进识别处理的数据结构与当前的路网矢量数据结构不同，需要设计由道路要素制作成概率网络改进识别输入样本的流程，概率网络改进识别应用于模式分类识别的两个关键步骤包括训练和检测，分别需要输入训练样本和检测样本，本发明从制作的样本中科学的选取训练样本和检测样本的规则，保证训练样本能训练出分类效果好的概率网络改进识别，以及选取的检测样本能客观的衡量训练后概率网络改进识别的性能；
[0065]
第四，提出路网匹配特征对特征提取方法，实体间的特征差异度用于衡量匹配特征对是否匹配，本发明将实体间的多个不同特征的差异度作为匹配特征对特征，输入概率网络改进识别，作为路网待识别匹配特征对的匹配关系辨别依据，特征提取即匹配特征对几何差异度的选取和计算过程，路网几何差异度的选取和设计计算方法时充分考虑两方面：首先必须针对新的匹配关联分类具有辨识度，其次具有鲁棒性且计算简便高效，考虑到开源地图属性数据缺失，拓扑不完整的情况，本发明仅选取了部分几何差异度作为概率网络改进识别的识别匹配关系的特征，与传统专业人员制作的路网数据相比，开源地图允许任何用户包括业余用户编辑数据，这种开放地图模式会引起开源地图路网一定程度上的不规范问题；另外，开源地图路网数据具有区域不一致性以及数据量大的特点，通常城市路网数据质量较农村地区质量好，数据更精细，数据量更大，开源地图路网存在的问题与新特点与给传统差异度的度量带来了各种不稳定因素以及计算效率方面的挑战，针对开源地图路网的新特点与存在的问题，本发明设计实现了具有鲁棒性且计算简便高效的多路网几何差
异度计算方法。
[0066]
第五，提出面向匹配关联分类识别的概率网络改进识别方法，设计恰当于新的匹配关联分类识别的概率网络改进识别，包括具体的网络结构、各层的输入和输出、层间连接以及选择了激励函数，设计概率网络改进识别的具体实现流程，实验方案客观的衡量了概率网络改进识别应用于路网匹配的性能，本发明的匹配准确率、识别准确率、匹配召回率和效率性能都有大幅提高。
附图说明
[0067]
图1是本发明全部匹配、部分匹配和不匹配三类匹配关系的图形示例图。
[0068]
图2是本发明基于概率网络改进识别的路网匹配算法流程图。
[0069]
图3是改进后的待匹配特征对模型实例示意图。
[0070]
图4是距离小且方向一致前提下长度比与最可能匹配关系类别图。
[0071]
图5是面向路网匹配的概率网络改进识别结构示意图。
[0072]
图6是本发明设计的概率网络改进识别具体实现流程图。
[0073]
具体实施方法
[0074]
下面结合附图，对本发明提供的开源地图与专业数据源路网自适应匹配法的技术方案进行进一步的描述，使本领域的技术人员能够更好的理解本发明并能予以实施。
[0075]
在数据共享的时代背景下，数据量大、现势性好、完全免费、信息丰富的开源地图(众源地理数据源)的出现为原本耗时耗人力，成本高昂的专业数据源路网的数据集成与快速更新提供了前景巨大的数据源。要实现开源地图路网更新专业数据源路网必须要先实现两个数据源路网之间的空间实体匹配，但是现有技术的实体匹配算法只针对规范标准的数据，而开源地图的开源模式允许业余人士采集数据，数据存在的表达不规范、区域详细程度不一致等诸多问题，现有技术的实体匹配算法的自适应性、鲁棒性和匹配精度无法满足要求。基于此，本发明提出基于概率网络改进识别的自动实体匹配方法来解决开源地图路网与专业数据源路网的匹配问题。
[0076]
本发明将路网匹配问题转化为匹配关系辨别问题，先采用概率网络改进识别进行匹配关系辨别，进而确定匹配特征对，主要包括三个关键步骤：输入样本的选取与制作、概率网络改进识别训练和检测、辨别匹配关系和确定匹配特征对。
[0077]
首先，输入样本的选取与制作环节，设计样本制作方法和流程，主要包括以下几个关键步骤：一是数据的预处理，二是获取备选匹配集以减少不必要的计算量，三是特征选择和提取，选取恰当的训练样本和检测样本用于概率网络改进识别的学习和检测，针对以上步骤，本发明提出实体间的两个方向长度比、基于间隔度量的空间位置差异度和方向差异度的计算方法，提出训练样本和检测样本选取规则，根据训练样本提出新匹配关联分类中各个类别的模式，并通过概率网络识别结果获取这些模式的特征，结果表明训练样本和检测样本选取规则有效，能获得一个分类效果较好的概率网络改进识别，本发明的几何差异度度量方法具有较好的辨识度和鲁棒性，一方面能客观反映匹配特征对的特征，另一方面使匹配特征对的特征呈现出有规律的模式，便于概率网络改进识别学习与识别。
[0078]
其次，概率网络改进识别训练和检测环节，提出适合于新匹配关系类别辨别的概率网络改进识别的网络结构、各层的输入和输出、层间连接以及激励函数，提出概率网络改
进识别的具体实现流程，结果表明本发明的基于概率网络改进识别的实体匹配方法能避开匹配过程中的经验权值与临界值设定问题，匹配关系辨别准确率、匹配准确率和匹配召回率分别保持在96.1％、97.9％和99.7％以上，匹配效率约0.0047秒，本发明的匹配算法对稀疏型规则分布、密集型规则分布和不规则分布三种路网模式的匹配关系辨别效果与匹配效果较好且稳定，匹配关系辨别准确率、匹配准确率和匹配召回率分别保持在96％、98％和99％以上，而跨线桥模式的效果略有下降，匹配效率一般保持在0.009s左右，跨线桥模式效率受节点数量影响较大。
[0079]
最后，基于初始匹配特征确定矩阵匹配特征对环节，采用区域实例的匹配关系辨别结果，提出推理1:1、0:1、1:n和n:m匹配特征对的过程，经实例验证，能实现新的匹配关系下的匹配特征对与1:1、0:1、1:n和n:m的匹配特征对之间无缝转化，因此本发明的基于概率网络改进识别的实体匹配方法能有效解决路网匹配问题。
[0080]
一、基于匹配关联分类的路网匹配
[0081]
(一)路网匹配的分类
[0082]
路网匹配寻找两路网中道路实体的一一对应关系，即匹配关系，匹配关系类型包括1:1、1:0、1:n和n:m，在不同的匹配关系类型情况下，匹配特征对具有其对应类别特有的特征模式，识别出匹配关系类型即确定待匹配特征对是否匹配与具体的匹配关系，识别出匹配关系即能确定匹配特征对，本发明根据匹配特征对的特征，先识别待匹配特征对匹配关系类型，再确定是否匹配以及确定最终的匹配特征对，路网匹配问题转化为模式识别分类问题。
[0083]
由于现有技术的匹配关联分类情况复杂，直接根据特征进行匹配关系辨别效果不够好，因此本发明提出新的匹配关系的分类以方便被识别，新匹配关系类型分为全部匹配、部分匹配和不匹配三类，图1描述了三类匹配关系的图形示例，新匹配关系类型与传统的匹配关系类型之间的关系是前者可以组合推理出后者，后者可以分解为前者，具体关系为：全部匹配是道路要素长度接近情况下的1:1的匹配，部分匹配是两个道路要素各自只有部分相互匹配，不匹配是两个道路要素任何部分都不匹配，全部匹配的匹配特征对必须是1:1的匹配特征对，当这两个道路要素只与对方存在部分匹配关系，而与其它任何道路要素都为不匹配，则组合推理得这两个道路要素仍然是1:1匹配关系，当这两个道路要素中至少一个要素还与其它道路要素存在部分匹配关系，则组合推理得这几个道路要素存在n:m(1:n)匹配关系，当一个道路要素与其它任何道路要素的匹配关系都为不匹配时，则其单独构成1:0匹配特征对，即1:1的匹配关系包含全部匹配关系，可分解为一个全部匹配关系或一个部分匹配关系，n:m(1:n)匹配关系可分解为多个部分匹配关系，1:0可分解为多个不匹配关系，本发明通过新的匹配关联分类解决传统匹配关系下的路网匹配问题。
[0084]
(二)基于概率网络改进识别的路网匹配框架
[0085]
本发明提出基于概率网络改进识别的开源地图路网与专业数据源路网匹配方法，采用概率网络改进识别来对匹配特征对的匹配关系进行分类，基于匹配关联分类识别的结果进一步解决路网匹配问题。
[0086]
采用概率网络改进识别来进行路网匹配关系的模式识别与分类：一方面是由于分类问题的复杂性，匹配特征对象之一是众源路网数据，众源数据开源地图的路网由业余志愿者采集制作，在数据表达上与专业数据源差异极大，甚至不规范，使分类问题变得复杂，
匹配关系的分类可定性为一个线性不可分的分类问题；另一方面，本发明概率网络改进识别用线性算法解决非线性分类问题，且能保证较高的精度，还具有识别率高、训练速度快、不会陷入局部极值和新的样本易于加入训练好的网络的优点，适合应对开源地图与专业数据源路网的匹配关联分类识别。
[0087]
基于概率网络改进识别的路网匹配方法还带来了两大优势，一是避开了现有技术匹配方法中人为给定经验权值和临界值的问题，使匹配方法更具自学习与自适应能力，由于开源地图中路网数据中的不确定性，无法人为给定经验临界值，二是基于概率网络改进识别扩充性好，增加或者减少类别模式时不需要重新进行长时间的训练，为模型的不断优化提供了便捷的途径。
[0088]
图2为基于概率网络改进识别的路网匹配算法流程图。主要包括三个关键步骤：输入样本的选取与制作、概率网络改进识别训练和检测、辨别匹配关系和确定匹配特征对。
[0089]
输入样本的选取与制作：目的是将几何路网匹配特征对转化成概率网络改进识别能处理的信息形式——特征向量，首先进行数据预处理，主要是进行投影转换，然后按一定缓冲区范围选择道路备选集，待识别匹配特征对的几何差异度计算过程即为匹配特征对特征提取过程，由该匹配特征对的多个特征差异度值构成输入样本，即为一个多维的特征向量，完成样本制作，为训练和检测概率神经网，随机选择一定量的样本并进行人工标记，划分为训练样本和检测样本。
[0090]
概率网络改进识别训练和检测：目的是完成概率网络改进识别的设计，使一定结构的分类器自动识别未知类别的匹配特征对的匹配关系，采用标记后的训练样本输入概率神经网后由其自动训练学习知识，采用标记后的检测数据检验训练后的概率网络改进识别性能，如果经验证性能符合要求，则完成概率网络改进识别。
[0091]
辨别匹配关系和确定匹配特征对：目的是根据匹配关系辨别结果构成的矩阵，确定1:1、1:0、1:n和n:m的匹配特征对，采用训练后的概率网络改进识别对待识别匹配特征对的匹配关系进行识别与分类，处理由识别结果错误带来的矛盾，最后由本发明匹配关联分类与传统匹配关联分类间关系，确定1:1、1:0、1:n和n:m匹配特征对。
[0092]
以上步骤均为自动化过程，唯一需要人工参与的过程就是训练样本和检测样本的目标类别标记。
[0093]
二、输入样本的选取与制作
[0094]
待匹配特征对的匹配关系特征蕴含在矢量几何图形中，这些矢量结构数据无法直接被概率网络改进识别处理，需要经过一系列处理将特征信息转化成概率网络改进识别能处理的特征向量。
[0095]
(一)样本制作方法和流程
[0096]
样本制作的关键步骤包括：数据预处理、生成备选匹配集、提取特征和划分样本。
[0097]
1.数据预处理：无需进行过多预处理，只要进行投影转换，转化到统一的平面坐标系，为准确的特征提取提供统一的空间参考。
[0098]
2.生成备选匹配集：目的是缩小寻找匹配特征对象的范围，提高匹配的效率，实质为一种粗匹配策略，对于开源地图路网与专业数据源路网之间的匹配，采用缓冲区查询，以待匹配特征对象为中心，查询其一定缓冲区范围覆盖的另一个数据库中的对象，这些对象就是该待匹配特征对象的备选匹配集，备选匹配集中的每个对象与待匹配特征对象构成一
个待识别匹配特征对。
[0099]
3.特征提取：包括特征的选择和特征的计算，衡量空间实体匹配特征对是否匹配的标准包括几何差异度、语义差异度和拓扑差异度，差异度的选择受实体的特征影响，鉴于开源地图路网情况复杂和部分数据缺陷，采用几何差异度包括基于间隔度量的空间位置差异度和方向差异度作为概率网络改进识别判断匹配情况的依据，在线要素实体的长度特征基础上提出新的几何差异度——长度比，本发明提取的匹配特征对特征包括长度比ht、空间位置差异度距离a和方向差异度y，作为概率网络改进识别匹配关系的依据，根据这些特征的计算方法，对一个待识别匹配特征对进行特征提取后即获得一个样本c＝[ht,a,y]，实质是一个特征向量。
[0100]
4.输入样本划分：根据用途和匹配类型的不同进行输入样本的划分，样本根据用途被划分为训练样本、检测样本和待识别样本，训练样本、检测样本分别用于训练阶段和检测阶段。训练样本和检测样本根据其对应的匹配特征对实际匹配关系的不同划分为全部匹配类、部分匹配类、不匹配类，分别用1、2、3进行人工标记。
[0101]
(二)样本选取规则
[0102]
第一，训练样本随机选取，尽量保证空间上分布均匀；
[0103]
第二，训练样本和检测样本选取时尽量保证匹配关系属于各个类别的样本数量尽量相同；
[0104]
第三，训练样本与检测样本的比例保持6:4；
[0105]
保证训练样本和检测样本在空间上分布均匀，用规则网格划分子区域，按子区域随机选取匹配特征对样本，由这些分布均匀的匹配特征对样本经特征提取获得空间上分布均匀的训练样本和检测样本，减少由训练样本数量差异对分类器训练效果的影响及减少检测样本数量差异对检测性能比对带来的影响。
[0106]
(三)表达模型计算几何差异度
[0107]
几何差异度的计算与路网匹配特征对的表达模型密切相关，本发明提出路网匹配特征对表达模型及基于该表达模型的几何差异度计算方法。
[0108]
1.路网匹配特征对表达模型
[0109]
道路要素采用的表达模型是由节点和线段构成的折线，为了匹配特征对中实体间各个几何特征的差异度计算的准确和方便，本发明将两个要素各个对应折线段之间的特征差异度进行加权平均，作为匹配特征对的特征，但由于不同数据源对道路的表达不同，导致代表匹配道路要素的节点与折线段并非一一对应，为解决表达不一致问题以及方便几何差异度的计算，通过增加虚拟节点的方法改进对原匹配特征对表达模型。
[0110]
开源地图路网与专业数据源路网构成的匹配特征对部分匹配的情况普遍，因此判断是否添加虚拟节点的过程并非都从二个线要素的起点开始，而是从更短的一个起点开始，作为该道路的起算点，并向另一条道路作垂直，垂点为另一条道路的添加虚拟节点过程的起算点，从二条道路的起算点开始逐个比较对应折线段长度，如果不等长，则在短的一个折线段上添加一个虚拟节点，使新的对应折线段等长，重复上述操作，一旦找到其中一条道路的最后一个折线段的对应折线段，则停止，最后添加的一个虚拟节点到起算点之间的道路为重叠部分，重叠部分为匹配特征对内部，其它部分为匹配特征对外部。
[0111]
如图3所示为改进后的待匹配特征对模型实例，道路h1与道路h2表达现实中同一道
路，但节点数量、长度、起点、终点都不同，都只表达了真实道路的一部分，导致双方都有部分折线段在匹配特征对外部。图中空心节点为增加的虚拟节点，实心节点为真实节点，增加虚拟节点过程的起算点为较短的起始节点d1，由d1向h2作垂线，得到垂足点为新增虚拟节点，作为线h2的起算点，然后以从起算点开始，比较第一段对应折线段即d1d3与e1e2的长度，前者大于后者，则在折线段上添加虚拟节点，使对应第一段折线段等长，即添加了d2，使d1d2与e1e2等长，再比较第二段对应折线段d2d3与e2e3的长度，重复上步，直到保证最后一个折线段e7e8有对应的折线段d7d8，完成虚拟节点的添加，这种方法在不改变原来道路对象结构的前提下，一方面保证了待匹配特征对中重叠部分的二道路对象的节点数量与线段数量相同，另一方面保证了计算距离和方向差异度时不受长度不一致、起点、终点都不同的影响。
[0112]
2.基于表达模型的几何差异度计算方法
[0113]
几何差异度是神经网络判断匹配情况的依据，计算方法的设计主要考虑以下方面：一是保证特征尽可能反映客观匹配情况下计算简单化，以保证较高的匹配效率；二是特征能有效区别全部匹配、不匹配和部分匹配类，即在匹配关系上具有辨识度；三是鉴于众源路网由业余用户采集，数据质量参差不齐，因此尽量保证特征计算方法的鲁棒性。
[0114]
由图3道路匹配特征对实例推广到普遍情况，在增加虚拟节点后，道路要素h1在匹配特征对内部由节点集合ud＝{d1,d2,
……
,d
n
}和折线段集cd＝{d1d2,d2d3,
……
,d
n
‑1d
n
}构成，道路要素h2在匹配特征对内部由节点集合ue＝{e1,e2,
……
,e
n
}和折线段集合ce＝{e1e2,e2e3,
……
,e
n
‑1e
n
}构成，节点集和折线段集合的大小分别为n和n
‑
1，具体的长度比ht、距离a和方向差异度y的计算公式为：
[0115][0116][0117][0118][0119]
其中
[0120]
式中，ht(d,e)与ht(e,d)分别表示从道路要素d到道路要素e方向的长度比和从道路要素e到道路要素d方向的长度比；h(j)表示匹配特征对内部的长度，h(d)和h(e)分别表示道路要素d与道路要素e的长度；a(d
i
,e)表示道路要素d的节点a
i
到道路要素e所有节点的距离的最小值，计算这些最小距离的中值，ang(d
j
d
j 1
，e
j
e
j 1
)计算匹配特征对中对应折线段d
j
d
j 1
与e
j
e
j 1
的夹角。
[0121]
基于部分匹配情况的存在，采用有方向的长度比，一方面可以反映长度情况，另一方面有利于区分距离小且方向一致情况下的全部匹配类与不匹配类、部分匹配类与全部匹配类和部分匹配类与不匹配类，以提高匹配的总体正确率，见图4。
[0122]
ht(d,e)与ht(e,d)是道路要素d在匹配特征对内部的长度占道路要素d长度的比例和道路要素e在匹配特征对内部的长度占道路要素e的长度，在两个道路要素方向一致的情况下，根据图4所示长度比与图形示例，当ht(d,e)与ht(e,d)的值其中一个大而另一个小时，则很大可能匹配模式属于部分匹配；当两者都很大时，匹配模式很可能是全部匹配；当两者都很小时，很可能不匹配，至于大与小的临界值，由概率网络改进识别自适应的根据数据情况确定，自动进行模式识别分类。
[0123]
如果两条道路描述的是现实中同一道路，即使由于空间参考的差异而引起一定的位置偏差，两者在空间位置上也是邻近的，即空间位置差异在一定值范围内，两者匹配的可能性最大，该空间位置的差异度可用线要素间距离描述，本发明差异度度量方法在sm
‑
hd基础上做进一步改进，只计算匹配特征对内部的sm
‑
hd而非整个线状要素以处理道路表达划分不一致而引起的大量长度悬殊的部分匹配情况，进而本发明的距离计算方法能帮助识别1:n匹配关系的匹配特征对，减少不必要的异常距离值和外部的距离计算量。
[0124]
三、概率网络改进识别的自适应匹配
[0125]
(一)概率网络结构改进识别
[0126]
本发明在概率神经网络分类器的结构基础上，基于实际应用设计具体的网络结构、各层的输入和输出并选择激励函数，平滑因子设置为0.1。
[0127]
图5为面向路网匹配的概率网络改进识别结构，神经网络共由4层组成。
[0128]
第1层：输入层，包含4个神经元，输入层的输入为一个四维的特征向量，每个神经元分别对应于提取4维匹配特征对特征向量c＝[ht(d,e),ht(e,d),a,y]的一个元素，即道路实体d到e方向的长度比、道路实体e到d方向的长度比、道路实体间距离和道路实体间方向差异度，该层的输出为这个四维的输入特征向量与全部匹配类、部分匹配类、不匹配类各训练样本的距离，作为下一层的输入；
[0129]
第2层：径向基层，每个神经元与样本制作方法中选取的训练样本一一对应，神经元个数与选取的样本数量相同，径向基层与输入层神经元间连接采用第1层流向第2层的前向全连接，即第1层中每个神经元与第2层每个神经元都有一个带方向的连接，高斯函数作为径向基层神经元激励函数，该层输出为经过激励函数转化后的待识别样本与三类各训练样本的距离构成的向量，作为下一层的输入；
[0130]
第3层：求和层，神经元个数为3，第1、2、3个神经元分别与全部匹配类、部分匹配类、不匹配类对应，三个类别的人工标记序号依次为1、2、3，第3层与第2层间连接方式为前向的部分连接，根据训练数据已知类别，将两层对应同一类别的神经元相连，其余不连接，该层输出为待识别样本依次属于全部匹配类、部分匹配类、不匹配类的后验概率构成的向量，作为下一层的输入；
[0131]
第4层：输出层，由一个神经元构成，并计算求和层所有神经元输出值的最大值，最后该层输出对应的类别号，即后验概率最大的类作为输出类，全部匹配类、部分匹配类、不匹配类分别对应的输出类别号为1、2、3，作为下一层的输入。
[0132]
(二)概率网络改进识别实现流程
[0133]
本发明的概率网络改进识别基于matlab的neural network toolbox实现，图6是本发明设计的概率网络改进识别具体实现流程图。
[0134]
第一步，样本定义，定义样本首先将数据输入matlab，定义t
×
p的矩阵trainx存储训练输入，p个长度为t的列向量表示p个训练样本，t等于匹配特征对特征数量4，定义1
×
p的行向量tout存储对应的训练标记输出，每个元素存储对应trainx样本的归属类别标量(1或者2或者3)。
[0135]
第二步，样本归一化，采用函数mapminmax对训练样本即矩阵trainx进行归一化。
[0136]
第三步，模型训练，训练概率网络改进识别模型的过程即创建网络的过程，是设置权值和传输函数的过程，采用函数newpnn(q,r,spread)创建概率网络改进识别，其中参数q是t
×
p的矩阵，用于接收训练输入矩阵，参数r是c
×
p的矩阵，表示训练输入的目标输出，c等于类别数量3，元素个数为c的列向量都是单位向量，其中只有对应类别处的元素值为1，其余均为0；参数spread是可调参数平滑因子；
[0137]
第四步，检测，首先定义检测样本和其正确的分类模式输出，然后同训练数据一样采用函数mapminmax进行归一化，并将t
×
w检测输入矩阵testx的矩阵存储训练输入，采用y＝sim(net,testx)函数将样本输入训练后模型。同理检测输入对应的输出y是向量形式的，通过vec2ind(y)函数转化为标量形式z，采用tic/toc记录检测样本计算输出耗费的时间。
[0138]
第五步，结果输出，输出模型检测结果z，并与正确的分类模式比较，结果标量相同则正确，否则错误，统计识别正确率，输出检测与识别所需的时长。
[0139]
四、实验与发明点总结
[0140]
通过多组实验，验证了本发明提供的开源地图与专业数据源路网自适应匹配法是有效的，且具有较好的鲁棒性和辨识度，在新的匹配关联分类情况下，基于概率网络改进识别的路网匹配算法的有效性和鲁棒性好，并且匹配效果较好，具有高匹配召回率、高匹配准确率和高效率。
[0141]
本发明针对开源地图路网更新专业数据源路网应用中的路网实体匹配问题，分析了开源地图与专业数据源的情况对匹配算法设计提出的挑战，分析了基于匹配关联分类的路网匹配方法的可行性基础上，提出一种基于概率网络改进识别的路网实体自适应匹配方法。基于本发明匹配方法的架构，提出了样本的制作方法流程以及训练样本与检测样本的选取规则，改进了路网匹配特征对表达模型，并基于此模型提出几何差异度计算方法，设计并实现了针对新的匹配关联分类识别的概率网络改进识别方法，采用该神经网络进行路网匹配表现出较高的匹配关系辨别率、匹配准确率、匹配召回率、匹配效率高。具体包括：
[0142]
第一，开源地图路网与专业数据源对道路表达不同，其对一条道路的分段表达偏于细碎化，部分数据存在拓扑错误，开源地图路网数据随区域覆盖不均匀、不同地区数据详细程度不同、属性缺失及不规范，这些问题对匹配算法设计提出了挑战，主要是在具有鲁棒性和辨识度的匹配特征对差异度计算方法设计上；
[0143]
第二，基于匹配关联分类的路网匹配方法，本发明将路网匹配问题转化为匹配关系辨别问题，采用概率网络改进识别进行匹配关系辨别，进而确定匹配特征对，为便于特征提取及概率网络改进识别，本发明提出新的匹配关联分类，包括全部匹配、部分匹配、不匹配，并建立其与传统匹配关系类别的具体关系，两种分类的关系是前者可组合推理出后者，后者可分解为前者，两种分类可以无缝转化；
[0144]
第三，样本制作方法和流程以及选取规则，概率网络识别能处理的数据形式为特征向量，而无法处理匹配特征对几何图形，因此需要经过一系列处理将矢量路网转化为向量形式的输入样本，包括以下关键步骤：通过投影转换，将路网转化到统一的平面坐标系统，为准确的特征提取提供统一的空间参考，通过50m缓冲区查询获取备选匹配集，以减少不必要计算与识别；通过开源地图数据的情况分析，选取的特征仅包含几何差异度(长度比、距离和方向差异度)，并设计特征的计算方法，多个特征构成的向量将作为概率网络改进识别进行匹配关联分类识别的依据，经过以上关键的三个步骤，完成样本制作，由于概率网络改进识别的学习和检测需要一定的训练样本和检测样本，制定训练样本和检测样本的选取规则；
[0145]
第四，几何差异度计算方法，改进路网匹配特征对表达模型，并设计基于此模型进行几何差异度计算方法，原匹配特征对表达模型是由节点和折线段构成的折线，考虑到待识别匹配特征对的节点与折线段并非相互一一对应，以及开源地图部分匹配情况普遍，因此仅在两要素的重叠部分增加虚拟节点来保证重叠部分节点和折线段一一对应，基于重叠部分的匹配特征对表达模型，设计两个方向的长度比、基于改进的中值hausdorff间隔度量的空间位置差异度和方向差异度的计算方法，设计过程考虑特征的客观性、高效、简易性、辨识度、鲁棒性；
[0146]
第五，面向新匹配关联分类识别的概率网络改进识别设计与实现，本发明在概率网络改进识别分类器的基本结构基础上，设计具体的网络结构、各层的输入和输出以及选择激励函数。基于matlab的neural network toolbox实现本发明设计的概率网络改进识别，并基于该神经网络进行了多组实验，实验结果表明，本发明设计的特征能客观反映匹配特征对的特征，使匹配特征对的特征呈现出有规律的模式，便于概率网络改进识别学习与识别，计算方便且高效，具有较好的鲁棒性和辨识度；同时，也验证了在新的匹配关联分类下基于概率网络改进识别的路网匹配算法的有效性和鲁棒性，匹配效果较好，具有高匹配准确率、高匹配召回率、高效率。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：口腔图像处理方法、装置及电子设备与流程

开源地图与专业数据源路网自适应匹配法的制作方法

相关文献

最热文献