一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种定位方法、定位系统和车辆与流程

2022-03-19 12:07:43 来源:中国专利 TAG:


1.本技术涉及自动驾驶技术领域,尤其涉及一种定位方法、定位系统和车辆。


背景技术:

2.自动驾驶需要解决驾驶的三个核心问题:在哪里?(车辆定位);去哪里?(确定目的地);怎么去?(路径规划)。其中,定位技术主要用于解决“在哪里?”的问题,是实现自动驾驶必不可少的关键技术之一。
3.基于信号的定位技术使用卫星信号或5g信号实现车辆的定位,因此具备全局定位的能力,是目前最广泛使用的定位技术。然而,由于gnss的卫星信号容易受到高楼、山脉等遮挡的影响,使得车辆在行驶在城市、隧道等路况时,基于信号的定位技术无法提供准确的定位,因此不能满足实现全场景自动驾驶的需求。为解决这一问题,目前自动驾驶领域的研究方向是将基于信号的定位技术、基于航位推算的定位技术、基于特征匹配的定位技术进行融合,以弥补基于信号的定位技术的不足。
4.目前,对基于环境特征匹配的定位技术来说,基于激光特征匹配的激光定位技术补充或替代基于信号的定位技术,或基于视觉特征匹配的视觉定位技术补充或替代基于信号的定位技术,是两条独立的技术路线,激光定位和视觉定位所依赖的地图数据分别存储、算法独立运行,导致其数据存储开销和计算开销过大,对车辆的控制单元ecu等硬件系统要求高,并且效率低下。


技术实现要素:

5.本技术实施例提供了一种定位方法、定位系统和车辆,能够将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合,以提高定位效率,并且能够减少定位过程中产生的数据和计算开销。
6.第一方面,本技术实施例提供了一种定位方法,该方法包括:确定车辆的初始位姿,在初始位姿周围生成n个采样点c1~cn,n为正整数;根据车辆的当前预测位姿p从定位地图中提取第一激光特征和至少一个视觉语义信息;对于任意采样点cn,n为正整数,n≤n,根据其对应的当前估计位姿pn,将提取自定位地图的第一激光特征与第二激光特征进行匹配,以确定当前估计位姿pn的第一权值,第二激光特征是从激光雷达采集的点云数据中提取的;以及,对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值,至少一个路面语义信息是从摄像头采集的图像数据中提取的;根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿;其中,定位地图包括相互拼接的多张定位图片,定位图片包括色彩通道,第一激光特征的编码和视觉语义信息的编码存储在色彩通道中。
7.本技术实施例提供的技术方案,能够分别基于激光特征的匹配确定当前估计位姿的第一权值,基于视觉语义信息和路面语义信息的匹配(即视觉特征的匹配)确定当前估计
位姿的第二权值,然后根据的第一权值和第二权值计算当前估计位姿的加权平均值,以加权求平均值作为车辆的当前位姿,从而实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合,提高了定位效率。并且,本技术实施例提供的技术方案将激光特征和视觉语义信息编码存储在同一张定位地图中,实现了地图数据的融合,降低了定位过程中产生的数据开销和计算开销。
8.在一种可选择的实现方式中,定位图片包括第一色彩通道,第一色彩通道用于存储视觉语义信息的编码。这样,本技术实施例提供的方法就可以对第一色彩通道进行解码以获取视觉语义信息。
9.在一种可选择的实现方式中,定位图片还包括第二色彩通道,第二色彩通道用于存储第一激光特征的编码。这样,本技术实施例提供的方法就可以对第二色彩通道进行解码以获取第一激光特征。
10.在一种可选择的实现方式中,视觉语义信息的编码包括标志位、类型编码和亮度编码中的至少一种;标志位用于表示路面标志的类型,类型编码用于表示路面标志的内容,亮度信息编码用于表示图片的亮度信息。这样,通过视觉语义信息的编码就可以确定视觉语义信息包含什么样的路面标志,例如白色虚线、白色实线、直行标志等,以利于与路面语义信息进行匹配。
11.在一种可选择的实现方式中,至少一个视觉语义信息通过以下步骤提取:根据当前预测位姿从定位地图中提取局部定位地图,局部定位地图包含m张定位图片,m张定位图片包含当前预测位姿所在的第一图片,以及第一图片附近的m-1张第二图片,m为大于1的正整数;从局部定位地图中提取至少一个视觉语义信息。这样,视觉语义信息就可以包含当前预测位姿周围的路面标志等信息,以便于与摄像头采集到的车辆周围的图像数据中的路面语义信息进行匹配,以确定第二权值。
12.在一种可选择的实现方式中,对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值,包括:从至少一个路面语义信息中确定至少一个有效路面语义信息,每一个有效路面语义信息的像素数量在预设范围内;根据当前估计位姿pn将至少一个有效路面语义信息投影到局部定位地图的坐标系中;确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系;对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值。这样,通过确定有效路面语义信息可以滤除一些不完整或者尺寸过大的误检视觉语义信息,提高语义匹配效率,减小语义匹配的计算量。
13.在一种可选择的实现方式中,确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系,包括:计算任意有效路面语义信息ai的语义权值和任意视觉语义信息bj的语义权值;根据有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值的差值,确定有效路面语义信息ai和视觉语义信息bj的语义关联度;当语义关联度小于预设第一阈值时,确定有效路面语义信息ai和视觉语义信息bj具有语义关联。这样,语义关联度小于第一阈值时,说明有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值比较接近,进而说明有效路面语义信息ai和视觉语义信息bj具有语义关联。
14.在一种可选择的实现方式中,对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值,包括:分别计算每一对语义关联的有
效路面语义信息和视觉语义信息的匹配距离;将计算得到的各个匹配距离的加权求和得到总匹配距离;根据总匹配距离确定第二权值。这样,第二权值能够体现出当前估计位姿pn与车辆真实位姿的接近程度。
15.在一种可选择的实现方式中,根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿,包括:使用当前估计位姿p
1-pn的第一权值对当前估计位姿p
1-pn加权求平均,得到第一加权平均值;使用当前估计位姿p
1-pn的第二权值对当前估计位姿p
1-pn加权求平均,得到第二加权平均值;对第一加权平均值和第二加权平均值加权求平均,得到加权平均值,以加权求平均值作为车辆的当前位姿。这样,通过使用第一权值和第二权值对当前估计位姿加权求平均,实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合。
16.在一种可选择的实现方式中,路面语义信息包括:包含有至少一个路面标志的像素块、像素块的像素数量、每个像素所属的路面标志的类型。这样,通过路面语义信息可以确定路面标志的类型、大小等,以利于与路面语义信息进行匹配。
17.在一种可选择的实现方式中,当前预测位姿通过以下步骤确定:根据里程计数据确定车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿;将采样点cn在第一历史时刻t-1对应的预测位姿与相对位姿相加得到当前预测位姿。
18.在一种可选择的实现方式中,当有预设比例的第一权值或者第二权值低于第二阈值时,重新生成n个采样点c1~cn。这样,可以消除采样点随着定位次数的增加而出现的发散现象。
19.第二方面,本技术实施例提供了一种定位系统,包括:安装于车辆的gnss/ins组合模块、控制单元、存储器、激光雷达和摄像头;gnss/ins组合模块,用于确定车辆的初始位姿;存储器,用于存储定位地图,定位地图包括相互拼接的多张定位图片,定位图片包括色彩通道,色彩通道存储有第一激光特征的编码和视觉语义信息的编码;激光雷达,用于采集点云数据,点云数据包含第二激光特征;摄像头,用于采集图像数据,图像数据包含至少一个路面语义信息;控制单元,用于在初始位姿周围生成n个采样点c1~cn,n为正整数;控制单元,还用于根据车辆的当前预测位姿从定位地图中提取第一激光特征和至少一个视觉语义信息;控制单元,还用于对于任意采样点cn,n为正整数,n≤n,根据其对应的当前估计位姿pn,将提取自定位地图的第一激光特征与第二激光特征进行匹配,以确定当前估计位姿pn的第一权值,第二激光特征是从激光雷达采集的点云数据中提取的;控制单元,还用于对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值,至少一个路面语义信息是从摄像头采集的图像数据中提取的;控制单元,还用于根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿。
20.本技术实施例提供的技术方案,能够分别基于激光特征的匹配确定当前估计位姿的第一权值,基于视觉语义信息和路面语义信息的匹配(即视觉特征的匹配)确定当前估计位姿的第二权值,然后根据的第一权值和第二权值计算当前估计位姿的加权平均值,以加权求平均值作为车辆的当前位姿,从而实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合,提高了定位效率。并且,本技术实施例提供的技术
方案将激光特征和视觉语义信息编码存储在同一张定位地图中,实现了地图数据的融合,降低了定位过程中产生的数据开销和计算开销。
21.在一种可选择的实现方式中,定位图片包括第一色彩通道,第一色彩通道用于存储视觉语义信息的编码。这样,本技术实施例提供的定位系统就可以对第一色彩通道进行解码以获取视觉语义信息。
22.在一种可选择的实现方式中,定位图片还包括第二色彩通道,第二色彩通道用于存储第一激光特征的编码。这样,本技术实施例提供的定位系统就可以对第二色彩通道进行解码以获取第一激光特征。
23.在一种可选择的实现方式中,视觉语义信息的编码包括标志位、类型编码和亮度编码中的至少一种;标志位用于表示路面标志的类型,类型编码用于表示路面标志的内容,亮度信息编码用于表示图片的亮度信息。这样,通过视觉语义信息的编码就可以确定视觉语义信息包含什么样的路面标志,例如白色虚线、白色实线、直行标志等,以利于与路面语义信息进行匹配。
24.在一种可选择的实现方式中,当控制单元用于根据车辆的当前预测位姿从定位地图中提取至少一个视觉语义信息时:控制单元,具体用于根据当前预测位姿从定位地图中提取局部定位地图,局部定位地图包含m张定位图片,m张定位图片包含当前预测位姿所在的第一图片,以及第一图片附近的m-1张第二图片,m为大于1的正整数;控制单元,还用于从局部定位地图中提取至少一个视觉语义信息。这样,视觉语义信息就可以包含当前预测位姿周围的路面标志等信息,以便于与摄像头采集到的车辆周围的图像数据中的路面语义信息进行匹配,以确定语义关联关系和第二权值。
25.在一种可选择的实现方式中,当控制单元用于对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值时:控制单元,具体用于从至少一个路面语义信息中确定至少一个有效路面语义信息,每一个有效路面语义信息的像素数量在预设范围内;控制单元,还用于根据当前估计位姿pn将至少一个有效路面语义信息投影到局部定位地图的坐标系中;控制单元,还用于确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系;控制单元,还用于对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值。这样,通过确定有效路面语义信息可以滤除一些不完整或者尺寸过大的误检视觉语义信息,提高语义匹配效率,减小语义匹配的计算量。
26.在一种可选择的实现方式中,当控制单元用于确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系时:控制单元,具体用于计算任意有效路面语义信息ai的语义权值和任意视觉语义信息bj的语义权值;控制单元,还用于根据有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值的差值,确定有效路面语义信息ai和视觉语义信息bj的语义关联度;控制单元,还用于当语义关联度小于预设第一阈值时,确定有效路面语义信息ai和视觉语义信息bj具有语义关联。这样,语义关联度小于第一阈值时,说明有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值比较接近,进而说明有效路面语义信息ai和视觉语义信息bj具有语义关联。
27.在一种可选择的实现方式中,当控制单元用于对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值时:控制单元,具体用
于分别计算每一对语义关联的有效路面语义信息和视觉语义信息的匹配距离;控制单元,还用于将计算得到的各个匹配距离的加权求和得到总匹配距离;控制单元,还用于根据总匹配距离确定第二权值。这样,第二权值能够体现出当前预测位姿pn与车辆真实位姿的接近程度。
28.在一种可选择的实现方式中,当控制单元用于根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿时:控制单元,具体用于使用当前估计位姿p
1-pn的第一权值对当前估计位姿p
1-pn加权求平均,得到第一加权平均值;控制单元,还用于使用当前估计位姿p
1-pn的第二权值对当前估计位姿p
1-pn加权求平均,得到第二加权平均值;控制单元,还用于对第一加权平均值和第二加权平均值加权求平均,得到加权平均值,以加权求平均值作为车辆的当前位姿。这样,通过使用第一权值和第二权值对当前估计位姿加权求平均,实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合。
29.在一种可选择的实现方式中,路面语义信息包括:包含有至少一个路面标志的像素块、像素块的像素数量、每个像素所属的路面标志的类型。这样,通过路面语义信息可以确定路面标志的类型、大小等,以利于与路面语义信息进行匹配。
30.在一种可选择的实现方式中,定位系统还包括里程计;控制单元,还用于根据里程计数据确定车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿;控制单元,还用于将采样点cn在第一历史时刻t-1对应的预测位姿与相对位姿相加得到当前预测位姿。
31.在一种可选择的实现方式中,控制单元,还用于当有预设比例的第一权值或者第二权值低于第二阈值时,重新生成n个采样点c1~cn。这样,可以消除采样点随着定位次数的增加而出现的发散现象。
32.第三方面,本技术实施例提供了一种车辆,该车辆包括本技术实施例第二方面及其各个实现方式提供的定位系统。
33.第四方面,本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面及其各个实现方式的方法。
34.第五方面,本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面及其各个实现方式的方法。
35.第六方面,本技术实施例还提供了一种芯片系统,该芯片系统包括处理器,用于支持上述装置或系统实现上述方面中所涉及的功能,例如,生成或处理上述方法中所涉及的信息。
附图说明
36.图1是点云式定位地图的示意图;
37.图2是图片式定位地图的示意图
38.图3是稀疏特征地图、半稠密地图和稠密地图的像素量示意图;
39.图4是自动驾驶车辆的定位系统模块配置图;
40.图5是激光地图的示意图;
41.图6是本技术实施例提供的视觉语义信息的编码格式图;
42.图7是定位地图上的不同区域的像素对应的视觉语义信息的8比特编码的示意图;
43.图8是本技术实施例提供用于实现定位方法的定位系统硬件框架图;
44.图9是本技术实施例提供的定位方法的流程图;
45.图10是本技术实施例提供的定位方法涉及到的数据流转框图;
46.图11示例性地提供了生成采样点的方案;
47.图12是里程计坐标系的示意图;
48.图13是本技术实施例提供的确定第一权值的过程示意图;
49.图14是本技术实施例提供的确定第二权值的过程示意图;
50.图15是本技术实施例提供的语义匹配的流程图;
51.图16是本技术实施例提供的定位方法的步骤s201的流程图;
52.图17是本技术实施例提供的计算路面语义信息的像素面积的示意图;
53.图18是本技术实施例提供的定位方法的步骤s203的流程图;
54.图19是本技术实施例提供的定位方法的步骤s204的流程图;
55.图20是本技术实施例提供的匹配距离的示意图;
56.图21是本技术实施例提供的定位方法的步骤s502的流程图;
57.图22是本技术实施例提供的定位方法的步骤s105的流程图;
58.图23是本技术实施例提供的定位系统的软件模块框图。
具体实施方式
59.自动驾驶(autonomous vehicles或self-driving automobile),也称无人驾驶、电脑驾驶等。自动驾驶能够以传感器、全球导航卫星系统(global navigation satellite system,gnss)及机器视觉等技术感测其周围环境,并根据感测数据确定自身位置、规划导航路线、更新地图信息、躲避障碍等,最终实现在没有任何人类主动操作或者少有人类主动操作的情况下自动地驾驶车辆。
60.一般来说,自动驾驶需要解决驾驶的三个核心问题:在哪里?(车辆定位);去哪里?(确定目的地);怎么去?(路径规划)。其中,定位技术主要用于解决“在哪里?”的问题,是实现自动驾驶必不可少的关键技术之一。
61.目前,根据所依赖的传感器不同,自动驾驶的定位技术主要可以包括以下三种:
62.1、基于信号的定位技术。
63.该技术主要基于卫星信号或5g信号实现车辆的定位。目前主流的方案是在车辆内安装全球卫星导航系统(global navigation satellite system,gnss)接收机,以接收多个gnss的卫星信号,利用接收的卫星信号计算出车辆在空间环境中的全局位置,并且也可以利用gnss地面站配合gnss卫星以提高定位精度。常见的gnss系统例如:北斗卫星导航系统(beidou navigation satellite system,bds),全球卫星定位系统(global positioning system,gps)等。
64.2、基于航位推算的定位技术。
65.该技术需要车辆配备惯性测量单元(inertial measurement unit,imu)和轮速计等传感器。其中,imu可以测量车辆行驶的角速度、加速度等信息,轮速计则可以测量车轮的转速。基于传感器数据,在确定了车辆的初始位置之后,则可以根据车辆的动力学方程,估
计出车辆的当前位姿(位置和姿态)。
66.3、基于环境特征匹配的定位技术。
67.目前,该技术主要包括激光定位和视觉定位两种形式,分别基于激光传感器和视觉传感器实时获取车辆周围的环境信息,将获取的环境信息处理后与预先存储的定位地图进行匹配,从而确定车辆的位姿。可以理解的是,该技术的实现需要预先构建定位地图,根据使用的传感器的不同,定位地图也具有不同的构建方式。
68.当采用激光定位时,定位地图主要有点云式和图片式。
69.①
点云式:利用激光传感器采集点云数据,然后对点云数据进行过滤等操作以去除噪声,最后将处理后的点云数据拼接叠加到一起,形成如图1所示的点云地图。
70.②
图片式:将

中拼接后的点云数据进行栅格处理,将每一个栅格对应为一个像素进行编码,以将拼接后的点云数据转化成如图2所示的图片格式的定位地图。其中,图片格式的激光地图可以是单通道的灰度图片,也可以是三通道的彩色图片。图片式的定位地图占用存储空间小,可以解决点云地图存储资源开销大的问题。
71.当采用视觉定位时,根据构建时从视觉传感器采集的原始图像中选取像素的方式和数量多少,定位地图(视觉地图)如图3所示,可以包括稀疏特征地图、半稠密地图和稠密地图三种形式,目前也主要以点云形式保存。
72.①
稀疏特征地图:将原始图像中的特征点对应的像素保存到地图中,因此像素数量最少。
73.②
半稠密地图:将原始图像中的部分像素,例如带有梯度的像素保存到地图中,因此像素数量中等。
74.③
稠密地图:将原始图像中的全部像素保存到地图中,因此像素数量最多。
75.基于信号的定位技术由于具备全局定位的能力,是目前最广泛使用的定位技术。然而,由于gnss的卫星信号容易受到高楼、山脉等遮挡的影响,使得车辆在行驶在城市、隧道等路况时,基于信号的定位技术无法提供准确的定位,因此不能满足实现全场景自动驾驶的需求。为解决这一问题,目前自动驾驶领域的研究方向是将基于信号的定位技术、基于航位推算的定位技术、基于特征匹配的定位技术进行融合,以弥补基于信号的定位技术的不足。
76.目前,对基于环境特征匹配的定位技术来说,采用激光特征匹配的激光定位技术补充或替代基于信号的定位技术,以及,采用视觉特征匹配的视觉定位技术补充或替代基于信号的定位技术,是目前融合定位的两条独立的技术路线。由于技术路线相互独立,激光定位和视觉定位的地图数据分别存储、算法相互独立,导致其数据存储开销和计算开销过大,对车辆的控制单元ecu等硬件系统要求高,并且效率低下。
77.为解决现有技术中存在的问题,本技术实施例提供了一种定位方法。
78.本技术实施例的技术方案可以应用在各种采用自动驾驶技术或者定位技术的载具之上,包括但不限于各种交通工具:例如车辆(汽车)、轮船、火车、地铁、飞机等,以及各种机器人,例如:服务机器人、运输机器人、自主导引机器人(automated guided vehicle,agv)、无人地面车(unmanned ground vehicle,ugv)等,以及各种工程机械,例如:隧道掘进机等。
79.下面以车辆为例,对本技术实施例的技术方案所实施的硬件环境进行说明。
80.如图4所示,该车辆配置有以下模块:激光雷达lidar 110、摄像头120、gnss/惯性导航系统(inertial navigation system,ins)组合模块130、控制单元140。其中:
81.激光雷达110,用于采集环境周围的元素(例如:车辆、障碍物、行人、路牌等)距离本车辆的距离信息。激光雷达110可以对环境周围进行360度的全向扫描,也可以只扫描车头前方部分范围(例如180度)内的环境信息。
82.摄像头120,用于采集车辆周围的图像信息。摄像头120可以具有一个(即单目摄像头)或者多个(即多目摄像头),可以对周围进行360度的全景图像采集,也可以只采集车头前方部分范围的图像。
83.gnss/ins组合模块130,可以包括gnss接收机和惯性测量单元imu等器件,用于实现基于卫星信号和imu的融合定位。
84.控制单元140,可以是整个自动驾驶车辆的电子系统的核心计算单元,例如:移动数据中心(mobile data center,mdc)、电子控制单元(electronic control unit,ecu)等,用于处理其他各个模块产生的数据,并基于处理结果生成车辆的控制信息。
85.此外,为实现车辆的其他辅助驾驶功能,该车辆还可以配置以下模块:
86.超声波传感器150,用于短距离测距,例如在辅助泊车时开启,以提供短距离告警信息等。
87.毫米波雷达160,用于长距离测距,由于毫米波抗干扰能力强,穿透雾、烟和尘土等能力强,因此毫米波雷达可以全天候工作,例如用于在恶劣天气情况下辅助对障碍物测距。
88.可以理解的是,本技术实施例示意的硬件环境并不构成对本技术实施例的技术方案的具体限定。在本技术另一些实施例中,本技术实施例的技术方案所实施的硬件环境可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
89.本技术实施例中,为实现激光定位与视觉定位技术的融合,减少存储开销和计算开销,基本思路是:将激光定位的定位地图(以下简称激光地图)与视觉定位的定位地图(以下简称视觉地图)中的地图数据融合进一张定位地图中,这样在同时应用激光定位与视觉定位技术时,就可以从融合后的定位地图中获取这两种定位方式需要的数据,从而减少数据存储的开销和计算开销,提高定位效率。
90.下面结合一些示例具体阐述本技术实施例是如何得到定位地图的。
91.本技术实施例得到定位地图的基本思路是:将路面标志的视觉语义信息整合添加到激光地图中,以得到定位地图。其中,路面标志包括用于辅助确定车辆的位置和所在车道等信息,例如:单黄线、双黄线、白色虚线、白色实线、直行标志、左转标志、右转标志、调头标志等。为减小存储开销,本技术实施例优选使用图片格式的激光地图。激光地图由可以单色彩通道的灰度图片构成,也可以由多色彩通道的彩色图片构成。
92.在一个实施例中,如图5所示,激光地图以三通道的彩色图片实现,例如包括一个r通道(red红色通道)、一个g通道(green绿色通道)和一个b通道(blue蓝色通道),每个通道中还可以添加一些激光地图的特征信息。作为一种可选择的实现方式,r通道中可以添加有激光特征,例如地图中各种元素的线特征、角点特征、梯度特征、高度特征等;g通道可以添加有激光地图的亮度信息;b通道可以添加相对高度信息,例如像素相对地面的高度等。
93.另外,除包含上述rgb通道以外,激光地图还可以包括更多的通道,例如alpha通道
等,本技术实施例不做限定。在一些其他的实现方式中,激光地图还可以通过其他的色彩模式实现,例如ryyb格式等,此时,激光地图可以相应地包括四个通道。
94.在一个实施例中,激光地图的像素中的每一个通道都可以包含一定数量的比特信息bit,例如8bit(8个比特信息)、16bit、32bit等。因此,如上述激光特征、亮度信息和相对高度信息等特征信息可以在像素的bit位中进行编码表示。例如亮度信息就可以通过1个bit编码来表示,如以比特值1表示有亮度信息,0表示没有亮度信息。
95.本技术实施例为了将视觉地图和激光地图融合在一张地图中,将通常位于视觉地图中的视觉语义信息融合进激光地图中。具体实现中,可以根据路面标志、道路交通标志内容在激光地图中对应的位置,确定激光地图中将会包含视觉语义信息的像素,然后将视觉语义信息编码后存储到这些像素的某个或者某些通道的比特信息中。
96.在一个实施例中,视觉语义信息可以采用8位二进制编码格式表示,占据其所在通道的8个比特长度。图6是视觉语义信息采用8位编码格式的一个示例图。如图6所示,8位编码格式可以由标志位、类型编码和亮度编码三个部分中的至少一种组成,其中,标志位可以用于表示路面标志的类型;类型编码用于表示路面标志的内容;亮度信息编码可以用于表示图片的亮度信息。
97.在一种实现方式中,标志位如图6所示占据1个比特,例如8位编码的第一个比特,或者其他比特。此时,标志位可以有0和1两个取值,最多表示两个种类。示例地,如果将视觉语义信息划分位文字类元素和图形标线类元素,那么,0可以表示文字类元素,1可以表示图形标线类元素,或者,1表示文字类元素,0表示图形标线类元素。示例地,如果将视觉语义信息划分为路面标志类元素和其他标志类元素,那么,0可以表示路面标志类元素,1可以表示其他标志类元素,或者,1表示路面标志类元素,0表示其他标志类元素。
98.在一些其他的实现方式中,标志位可以占据大于1个比特,例如2个比特、3个比特等,从而可以表示更多的视觉语义信息的种类,例如2个比特最多可以表示4个种类,3个比特最多可以表示8个种类。在具体实践中,本领域技术人员可以根据实际分类的需求确定标志位的长度,本技术实施例对标志位的长度不做具体限定。
99.在一种实现方式中,类型编码如图6所示占据6个比特,例如标志位后面的连续6个比特,或者其他的比特。此时类型编码的取值范围可以从000000至111111,最多能够表示26种内容类型。示例地:000000可以表示路面、000001可以表示路面标志等;更具体地:000001可以表示白色虚线、000010表示白色实线、000011表示直行标志、000100表示左转标志、000101表示警告标志、000110表示指路标志等。本技术实施例中,类型编码是视觉语义信息的8位编码中的必要部分。
100.在一些其他的实现方式中,类型编码可以占据大于6个比特,例如7个比特,从而可以表示更多的内容类型;也可以小于6个比特,例如5个比特、4个比特等,从而在能够表示所需的全部路面标志和/或道路交通标志的情况下,减小类型编码的比特长度,以减小数据开销,并使得8位编码中能够保留出更多的比特信息来表示其他的信息。在具体实践中,本领域技术人员可以根据需要区分的路面标志和/或道路交通标志的数量确定类型编码的长度,本技术实施例对类型编码的长度不做具体限定。
101.在一种实现方式中,亮度编码如图6所示占据1个比特,例如8位编码的最后一个比特,或者其他比特。此时,标志位可以有0和1两个取值,0表示没有亮度信息,1表示有亮度信
息。以车道线为例,其相比于路面的亮度更高,因此其亮度信息可以是1;以路面标志为例,其可能包括喷绘的白线部分和路面部分,那么白线部分的亮度信息即可以是1,路面部分的的亮度信息即可以是0。
102.在一些其他的实现方式中,亮度信息可以占据大于1个比特,例如2个比特、3个比特等,从而可以更细分地表示亮度。在具体实践中,本领域技术人员可以根据实际分类的需求确定亮度信息的长度,本技术实施例对亮度信息的长度不做具体限定。
103.在一个实施例中,视觉语义信息的二进制编码可以仅包含标志位、类型编码和亮度编码中的一部分,例如仅包含类型编码和亮度编码,或者,仅包含标志位和类型编码,或者,仅包含类型编码。并且,视觉语义信息的二进制编码还可以是除8位编码格式以外的其他编码格式,例如大于8位的编码,如16位编码,或者小于8位的编码,如4位编码等,本技术实施例对此不做限定。
104.在一个实施例中,编码后的视觉语义信息可以存储在像素的g通道中,这样,当像素的g通道包含8个比特信息时,这8个比特信息从前到后可以依次包括标志位、类型编码和亮度编码。
105.图7是定位地图上的不同区域的像素对应的视觉语义信息的8比特编码的示意图。如图6所示,根据上述示例的编码规则,区域

的像素对应路面,其标志位为0,类型编码为000000,亮度编码为0,因此视觉语义信息为00000000;区域

的像素对应直行标志,其标志位为1,类型编码为000011,亮度编码为1,因此视觉语义信息为10000111;区域

的像素对应白色实线标志,其标志位为1,类型编码为000010,亮度编码为1,因此视觉语义信息为10000101。
106.可以理解的是,本技术实施例将原本位于视觉地图中的视觉语义信息编码存储到激光地图的像素的通道中,实现了激光地图与视觉地图的融合,得到了同时包含视觉地图特征和激光地图特征的定位地图,减少了地图的存储开销。
107.下面对本技术实施例提供的定位方法的技术方案进行具体说明。
108.图8是本技术实施例提供用于实现定位方法的定位系统硬件框架图。如图8所示,该定位系统可以包括控制单元140、gnss/ins组合模块130、轮速计170、里程计180、激光雷达110、摄像头120和存储器190等。其中,gnss/ins组合模块、轮速计、里程计、激光雷达、摄像头等模块用于各自采集数据,将数据发送给控制单元进行处理,存储器可以用于存储定位地图、存储上述各个模块采集到的数据、存储用于控制单元执行的程序指令以及存储控制单元在数据处理过程中产生的数据等。
109.下面基于图8所示的硬件结构,以被定位的目标为车辆为例,对本技术实施例提供的定位方法的步骤流程进行具体说明,可以理解的是,除车辆以外,本技术实施例的方法的定位目标还可以是轮船、火车等其他交通工具、各种机器人、以及工程机械等。
110.图9是本技术实施例提供的定位方法的流程图,图10是该定位方法涉及到的数据流转框图。如图9和图10所示,该定位方法可以通过以下步骤s101-步骤s109实现:
111.步骤s101,确定车辆的初始位姿,在初始位姿周围生成n个采样点c1~cn,n为正整数。
112.其中,初始位姿可以包括车辆的初始位置和初始姿态。
113.具体实现中,控制单元可以获取gnss/ins组合模块采集的数据。然后,控制单元可
以根据gnss的天线信号确定车辆的初始位置,一般来说,车辆的初始位置可以是一个全局位置。另外,控制单元还可以根据ins模块的惯性测量单元imu测量的车辆的角速度和加速度等信息确定车辆的初始姿态,一般来说车辆的初始姿态可以由车辆初始的航向角、俯仰角和滚转角中的一个或者多个参数组成,由于车辆定位和导航中主要使用航向角,因此车辆的初始姿态也可以仅包含航向角。
114.在一个实施例中,控制单元在确定了车辆的初始位姿之后,还可以以车辆初始位置为中心,在车辆附近的一定范围内以及车辆航向角附近的一定范围内生成n个采样点c1~cn。
115.图11示例性地提供了生成采样点的方案。如图11所示,控制单元可以以车辆初始位置为中心,确定半径为r=5米的圆形范围,以及,以航向角yaw的指向(车辆前进方向)为中心,选取左右偏离2
°
的扇形范围,即yaw
±2°
,然后圆形范围和扇形范围的重合区域(即图11中的灰色阴影区域)内生成离散的n=1000个采样点。在一些实现方式中,这1000个采样点可以采用均匀分布的方式生成,使得这1000个采样点在其分布区域内分布比较均匀。可以理解的是,在采样点选定之后,采样点的初始位姿也随即根据车辆的初始位姿确定。在另一些实现方式中,这1000个采样点也可以采用非均匀的方式生成,例如正态分布等,本技术实施例对此不做限定。
116.需要补充说明的是,本技术实施例围绕车辆的初始位姿选取大量的采样点,可以实现对车辆位姿的多重采样,多重计算,并结合采样点滤波技术提高定位精度。具体实现中,控制单元可以对每个采样点分别执行步骤s102-步骤s108。
117.步骤s102,根据车辆的当前预测位姿从定位地图中提取第一激光特征和至少一个视觉语义信息。
118.这里需要说明的是,由于车辆在行驶过程中的位姿是不断变化的,因此各种定位方法都被要求能够对车辆进行实时定位,以利于自动驾驶系统实现实时路径规划和导航功能。为实现实时定位的目的,控制单元可以周期性地对车辆进行定位,每个周期的定位行为可以称作一个定位帧。具体描述时,为了区分不同时刻的定位帧,如果设置当前时刻为t,那么当前时刻t对应的定位帧可以称作当前帧,将当前帧的前一个定位帧称作第一历史帧,将第一历史帧的时刻记作第一历史时刻t-1。
119.可以理解的是,在车辆的行驶过程中,控制单元每次对车辆每进行一次定位,都会得到一个车辆的预测位姿。为便于描述,本技术实施例将第一历史时刻t-1的得到的车辆的位姿称作第一历史位姿,那么根据第一历史位姿和里程计参数,可以预测得到车辆在当前时刻t的当前预测位姿p
t
。需要说明的是,如果第一历史时刻t-1是初始时刻,那么第一历史位姿为车辆的初始位姿。
120.基于上述定义,本技术实施例可以采用以下方式确定车辆的当前预测位姿:
121.步骤a,获取车辆的初始位姿。
122.其中,如前文,初始位姿可以是定位方法初始化执行时根据gnss/ins组合模块采集的数据确定的位姿。步骤a仅用于在该方法初始化时执行。
123.步骤b,根据里程计数据确定车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿。
124.在一种实现方式中,本技术实施例利用里程坐标系得到相对位姿。
125.图12是里程计坐标系的示意图。如图12所示,里程计坐标系可以以车辆的初始位姿作为原点odom,以车辆在初始位姿下的车体正前方向作为x轴方向,以垂直于车体正前方向并且指向车体左侧的方向作为y轴方向。
126.车辆在里程计坐标系中的局部位姿,可以由里程计根据轮速计和惯性测量单元imu的测量数据计算得到。在计算的局部位姿时,里程计可以采用以下运动学模型:
127.s=v*δt
ꢀꢀꢀ
(1)
[0128][0129]
其中,s表示车辆相对于初始位姿的运动里程,v表示车辆的运动速度,δt表示车辆的运动时间;表示车辆相对于初始位姿的航向角的变化值,ω表示车辆的角速度。
[0130]
根据上述运动模型(1)(2)可以得到:
[0131]
x0=v*cos(yaw)*δt
ꢀꢀꢀ
(3)
[0132]
y0=v*sin(yaw)*δt
ꢀꢀꢀ
(4)
[0133]
其中,x0为车辆运动时的x轴坐标值,y0为车辆运动时的y轴坐标值,yaw表示车辆的航向角,在里程计坐标系中yaw的取值为
[0134]
根据上述运动模型(1)(2)和公式(3)(4)即可得到车辆运动时,在任意时刻的以第一局部坐标系的参数表示的局部位姿,例如局部位姿可以包括(x0,y0,yaw)。
[0135]
这里需要说明的是,局部位姿中仅表示车辆在里程计坐标系中的位姿,并不表示车辆在空间环境中的绝对位姿。
[0136]
需要补充说明的是,除了采用里程计坐标系之外,本技术实施例还可以采用其他的坐标系得到相对位姿,例如gnss坐标系、imu坐标系、车辆后轮轴地面投影坐标系等,本技术实施例对此不做限定。
[0137]
基于里程计坐标系,里程计可以将车辆在当前时刻t的局部位姿和第一历史时刻t-1的局部位姿发送给控制单元。那么,控制单元就可以根据车辆在当前时刻t的局部位姿和第一历史时刻t-1的局部位姿计算车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿。具体计算方法如公式(5):
[0138]
δp=o
t-o
t-1
ꢀꢀꢀ
(5)
[0139]
其中,δp为车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿,o
t
为车辆在当前时刻t的局部位姿,o
t-1
为车辆在第一历史时刻t-1的局部位姿。
[0140]
步骤c,将车辆在第一历史时刻t-1对应的第一历史位姿与相对位姿相加得到车辆的当前预测位姿p
t

[0141]
如以下公式(6)
[0142]
p
t
=p
t-1
δp
ꢀꢀꢀ
(6)
[0143]
其中,p
t-1
为车辆在第一历史时刻t-1对应的第一历史位姿。
[0144]
可以理解的是,采样点cn的当前估计位姿pn也通过上述步骤c进行估计,即:
[0145]
pn=p
n(t-1)
δp
[0146]
其中,p
n(t-1)
为采样点cn在第一历史时刻t-1对应的估计位姿。
[0147]
进一步地,控制单元可以根据车辆的当前预测位姿p
t
,从定位地图中获取当前预测位姿p
t
附近的一块区域,为便于描述,可以将该区域称作局部定位地图,然后从局部定位地图中提取第一激光特征。
[0148]
在一个实施例中,定位地图可以由大量的预设尺寸的图片拼接构成,每一张图片对应空间环境中指定大小的范围。示例地,定位地图的每一张图片均为长宽相等的正方形图片,每一张图片对应长100米、宽100米的正方形范围。
[0149]
在一个实施例中,当定位地图由大量图片构成时,控制单元可以从定位地图中获取当前预测位姿p
t
所在的图片和附近的至少一张图片,作为局部定位地图。示例地,如图13或14所示,控制单元可以获取当前预测位姿p
t
所在的和附近的3
×
3共计9张图片,如果每张图片对应的范围是100m
×
100m,那么局部定位地图就包括了当前预测位姿p
t
附近300m
×
300m的区域。
[0150]
基于上述提取的定位地图的图片,控制单元可以从图片的存储有激光特征的通道中提取第一激光特征,例如从r通道中提取第一激光特征。
[0151]
另外,控制单元可以局部定位地图的从存储有视觉语义信息的通道中提取至少一个视觉语义信息,例如对图片的g通道数据进行解码,以提取g通道中的至少一个视觉语义信息。
[0152]
步骤s103,对于任意采样点cn,n为正整数,n≤n,根据其对应的当前估计位姿pn,将提取自定位地图的第一激光特征与第二激光特征进行匹配,以确定当前估计位姿pn的第一权值。
[0153]
其中,第二激光特征可以从激光雷达采集的点云数据中提取。
[0154]
具体实现中,控制单元可以对激光雷达在当前时刻t采集到的点云数据进行采样,以得到第二激光特征,其采样方式可以根据定位地图的具体形式确定。例如:当定位地图为稀疏特征地图时,控制单元可以对点云数据进行稀疏特征采样;当定位地图为半稠密地图时,控制单元可以对点云数据进行半稠密特征采样;当定位地图为稠密地图时,控制单元可以对点云数据进行稠密特征采样。这样,便于第一激光特征与第二激光特征进行匹配。
[0155]
接下来,控制单元根据当前估计位姿pn将激光特征投影到局部定位地图的坐标系中,对于不同的采样点cn来说,由于其当前估计位姿pn不同,因此上述激光特征根据不同采样点cn的当前估计位姿pn进行投影之后,会在局部定位地图中对应不同的坐标分布。
[0156]
接下来,控制单元可以基于第一激光特征与第二激光在局部定位地图中的坐标分布,将第一激光特征与第二激光特征进行匹配,计算出第一激光特征与第二激光特征之间的匹配距离,并且根据匹配距离确定出当前估计位姿pn的第一权值其中,匹配距离代表了基于激光特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度,而接近程度越高,第一权值就越大,接近程度越低,第一权值就越小。
[0157]
在一些实施例中,匹配距离可以是余弦距离,也可以是欧拉距离,本技术实施例对获得匹配距离所采用的算法不做限定。例如:当匹配距离是余弦距离时,匹配距离的数值范围可以为[0,1],数值越大,表示基于激光特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度越低,数值越小,表示基于激光特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度越高。
[0158]
步骤s104,对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值。
[0159]
其中,上述至少一个路面语义信息是从摄像头采集的图像数据中提取的。
[0160]
具体实现中,如图14所示,控制单元可以首先对摄像头采集的图像数据进行预处
理,例如去除噪声、裁切、灰度处理等等。接下来,控制单元可以使用预先训练好的深度神经网络对预处理之后的图像进行像素级的语义分割,以从图像中提取至少一个路面语义信息,路面语义信息可以是像素级信息,每个路面语义信息可以包括:包含有至少一个路面标志的像素块、像素块中的像素的数量、每个像素所属的路面标志的类型和概率等。其中,该像素块应该至少包含路面标志的全部像素,在一些实施例中,像素块可以是矩形、圆形等规则形状,或者其他形状,优选为规则形状,以便于数据处理。另外,在保证像素块包含路面标志的全部像素的情况下,像素块优选尽量少地包含非路面标志的像素。
[0161]
本技术实施例使用的深度神经网络例如可以是:卷积神经网络(convolutional neural network,cnn)、长短期记忆网络(long short-term memory,lstm)、循环神经网络(recurrent neural network,rnn)或者其他神经网络,也可以是多种神经网络的组合。深度神经网络在训练阶段使用训练语料作为输入,该训练语料可以是事先采集的路面图片,并且路面图片中的路面标志被进行像素级标注;深度神经网络在训练阶段的输出是训练语料的标注结果,例如被标注的路面标志的类型等。神经网络在使用阶段的输入为摄像头采集到的图像,输出则为图像中包含的路面标志的像素级信息。使用深度神经网络进行信息提取的具体方法不是本技术实施例的重点讨论内容,因篇幅所限,此处就不再赘述。
[0162]
另外,需要补充说明的是,路面语义信息实际上也属于视觉语义信息,区别之处在于:是从摄像头采集的图像中提取的,而不是存储在定位地图中。
[0163]
基于上述提取的路面语义信息和视觉语义信息,步骤s104可以通过如图15所示的以下步骤s201-步骤s204实现:
[0164]
步骤s201,从至少一个路面语义信息中确定至少一个有效路面语义信息,建立有效路面语义信息集合,其中,每个有效路面语义信息的像素数量在预设范围内。
[0165]
在一个实施例中,步骤s201如图16所示具体可以通过以下步骤s301-步骤s303实现:
[0166]
步骤s301,分别计算每一个路面语义信息的像素面积。
[0167]
具体实现中,路面语义信息的像素面积可以是像素块的像素数量。以矩形的像素块为例,假设像素块的分辨率大小为w像素
×
h像素,w和h分别为像素块水平方向和垂直方向的像素数量,那么该像素块的像素面积s=w
×
h。
[0168]
示例地,如图17所示,在步骤s105中,控制单元从摄像头采集的图像中获取到了多个路面语义信息,例如包含:路面语义信息l0、路面语义信息l1和路面语义信息l2。那么,在步骤s301中,则可以分别计算l0、l1、l2的像素块的像素量,以得到l0的像素面积为s0=w0
×
h0、l1的像素面积为s1=w1
×
h1、l2的像素面积为s2=w2
×
h2。
[0169]
步骤s302,根据像素面积确定有效路面语义信息。
[0170]
具体实现中,本技术实施例可以设置用于确定有效路面语义信息的一个像素面积下限阈值t1和一个像素面积上限阈值t2,控制单元使用下限阈值t1和上限阈值t2分别与每个路面语义信息的像素面积s(例如:s0、s1、s2等)进行比较,当t1《s《t2时,路面语义信息即为有效语义信息,当s《t1或者s》t2时,路面语义信息即为无效语义信息。其中,下限阈值t1和上限阈值t2可以是预先设置的值,也可以是动态生成的值。
[0171]
在一个实施例中,当下限阈值t1和上限阈值t2为动态生成的值时,控制单元可以统计一段时间内所有路面语义信息的像素面积,得到像素面积的分布范围,然后在像素面积
的分布范围中选取一定的范围作为有效路面语义信息的范围,进而确定下限阈值t1和上限阈值t2。
[0172]
步骤s303,对有效路面语义信息建立有效路面语义信息集合。
[0173]
其中,根据步骤s302确定的有效语义路面信息结果的不同,有效路面语义信息集合中包含的有效路面语义信息的数量也不同。例如:当步骤s302确定路面语义信息中不包含有效路面语义信息集合时,有效路面语义信息集合为空集合;当步骤s302确定一部分路面语义信息是有效路面语义信息时,有效路面语义信息集合是路面语义信息集合的子集,当步骤s302确定所有的路面语义信息都是有效路面语义信息时,有效路面语义信息集合与路面语义信息集合相同。
[0174]
示例地,有效路面语义信息集合中的任意一个有效路面语义信息可以是如下形式:
[0175]ai
=[m,p1~pm,kai]
[0176]
其中,ai表示有效路面语义信息集合中的第i个有效路面语义信息,m表示ai包含的像素点的数量,kai表示ai对应的语义类型值(例如路面标志的类型值),不同的语义类型具有不同的类型值,p1~pm分别表示ai中第1至第m个像素点属于kai的概率,p1~pm可由深度神经网络的输出结果得到。
[0177]
以上步骤s301-步骤s303即为步骤s201示例性的可实现方式。
[0178]
步骤s202,统一有效路面语义信息与视觉语义信息的坐标系。
[0179]
具体实现中,控制单元可以根据当前估计位姿pn将上述至少一个有效路面语义信息投影到局部定位地图的坐标系中,对于不同的采样点cn来说,由于其当前估计位姿pn不同,因此上述至少一个有效路面语义信息根据不同采样点cn的当前估计位姿pn进行投影之后,会在局部定位地图中对应不同的坐标分布。
[0180]
在一个实施例中,局部定位地图可以使用gnss坐标系等已知的坐标系,也可以单独具有自己的坐标系,例如控制单元可以以局部定位地图的中心点为原点,以水平方向和垂直方向为x轴和y轴,建立局部定位地图的坐标系。
[0181]
进一步地,在确定了局部定位地图的坐标系之后,控制单元可以通过矩阵变换的方式将有效路面语义信息从摄像头坐标系投影到局部定位地图的坐标系。其中,变换矩阵例如可以是一个大小为4
×
4的矩阵,其数学意义表示一次平移和一次旋转的空间变换过程,也就是说,有效路面语义信息中的任意像素点均可以经过一次平移和一次旋转投影到局部定位地图的坐标系中。空间点在不同坐标系之间的投影变换是导航定位领域的常见手段,此处不在赘述。
[0182]
步骤s203,确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系。
[0183]
步骤s203所要实现的目的是:对于有效路面语义信息集合中的任意一个有效路面语义信息ai(ai∈a),从局部定位地图的视觉语义信息集合b中找到一个与ai语义关联的视觉语义信息bj(bj∈b)。
[0184]
在一个实施例中,步骤s203如图18所示可以通过以下步骤s401-步骤s404实现:
[0185]
步骤s401,计算有效路面语义信息ai的语义权值。
[0186]
具体实现中,可以采用以下公式:
[0187][0188]
其中,表示ai的语义权值,m表示ai包含的像素点的数量,pm表示ai中第m个像素点属于kai的概率,kai表示ai对应的语义类型值。
[0189]
步骤s402,计算视觉语义信息bj的语义权值。
[0190]
具体实现中,可以采用以下公式:
[0191][0192]
其中,表示bj的语义权值,g表示bj包含的像素点的数量,pg表示bj中第g个像素点属于的概率,表示bj对应的语义类型值。
[0193]
这里需要补充说明的是,在局部地图中,一个像素点是否属于路面标志或者道路交通标志是已知的,因此对于bj中第g个像素点来说,其pg值只有两种0和1两种可能,如果该像素点属于路面标志或者道路交通标志,那么其pg=1,否则pg=0。
[0194]
步骤s403,根据有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值的差值,确定有效路面语义信息ai和视觉语义信息bj的语义关联度。
[0195]
具体实现中,对于任意有效路面语义信息ai和任意视觉语义信息bj,语义关联度δw是有效路面语义信息ai和任意视觉语义信息bj的差值的绝对值,即采用以下公式:
[0196][0197]
步骤s404,当语义关联度小于预设第一阈值时,确定有效路面语义信息ai和视觉语义信息bj具有语义关联。
[0198]
具体实现中,对于任意有效路面语义信息ai和任意视觉语义信息bj,如果其语义关联度δw小于预设的第一阈值σ,则有效路面语义信息ai和任意视觉语义信息bj具有语义关联;如果其语义关联度δw大于或者等于预设的第一阈值σ,则有效路面语义信息ai和任意视觉语义信息bj不具有语义关联。
[0199]
本技术实施例通过多次执行步骤s401-步骤s404的操作,最终可以得到至少一对具有语义关联的有效路面语义信息和视觉语义信息,为便于描述,具有语义关联的有效路面语义信息和视觉语义信息可以被称作语义关联组。
[0200]
以上步骤s401-步骤s404即为步骤s203示例性的可实现方式。
[0201]
步骤s204,对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值。
[0202]
具体实现中,步骤s204如图19所示可以通过以下步骤s501-步骤s503实现:
[0203]
步骤s501,分别计算每一对语义关联的有效路面语义信息和视觉语义信息的匹配距离。
[0204]
其中,对于每一对具有语义关联的有效路面语义信息和视觉语义信息,匹配距离可以是有效路面语义信息和视觉语义信息的欧几里得距离(即欧式距离),或者余弦距离等,本技术实施例不做具体限定。
[0205]
下面结合图20对欧几里得距离和余弦距离的数学意义进行说明。图20在局部定位地图的坐标系中示出了有效路面语义信息ai和视觉语义信息bj的位置。那么欧几里得距离是有效路面语义信息ai和视觉语义信息bj在局部定位地图的坐标系中的直线距离。余弦距
离是有效路面语义信息ai和视觉语义信息bj与坐标系原点连线夹角α
ij
的余弦值。
[0206]
步骤s502,将各个匹配距离的加权求和得到总匹配距离。
[0207]
为得到总匹配距离,步骤s502如图21所示可以通过以下步骤s601-步骤s602实现。
[0208]
步骤s601,计算每个语义关联组的权重。
[0209]
具体可以采用以下公式:
[0210][0211]
其中,k表示语义关联组的数量,w
′k表示第k个语义关联组的权重,δwk表示第k个语义关联组的语义关联度。
[0212]
步骤s602,根据所有语义关联组的权重和匹配距离确定总匹配距离。
[0213]
其中,可以分别将每个语义关联组的权重和匹配距离相乘,然后对所有的相乘结果求和,得到总匹配距离e,即采用以下公式:
[0214][0215]
其中,k表示语义关联组的数量,w
′k表示第k个语义关联组的权重,ek表示第k个语义关联组的匹配距离。
[0216]
步骤s503,根据总匹配距离确定当前估计位姿pn的第二权值
[0217]
总匹配距离代表了基于视觉特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度,而接近程度越高,第二权值就越高,接近程度越低,第二权值就越低。
[0218]
在一个实施例中,当匹配距离是欧几里得距离时,总匹配距离的数值越小,表示基于视觉特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度越高,因此相应的第二权值越大;总匹配距离的数值越大,表示基于视觉特征确定的车辆实际位姿与采样点cn的当前估计位姿pn之间的接近程度越低,因此相应的第二权值越小。
[0219]
在一个实施例中,当匹配距离是余弦距离时,总匹配距离的数值越小,表示基于视觉特征确定的采样点cn的实际位姿与当前预测位姿pn之间的接近程度越高,因此相应的第二权值越大;总匹配距离的数值越大,表示基于视觉特征确定的采样点cn的实际位姿与当前预测位姿pn之间的接近程度越低,因此相应的第二权值越小。
[0220]
基于上述总匹配距离与第二权值之间的数值变换关系,控制单元可以采用任意的算法确定第二权值本技术实施例对此不做限定。第二权值的取值范围例如可以是[0,1],或者其他范围,本技术实施例对此不做限定。示例地,第二权值可以通过对总匹配距离取补、取倒数、数值范围归化等方式得到。
[0221]
以上步骤s501-步骤s504即为步骤s204示例性的可实现方式。
[0222]
步骤s105,根据所述n个采样点c1~cn的当前估计位姿p
1-pn及其所述第一权值和所述第二权值,计算所述当前估计位姿p
1-pn的加权平均值,以所述加权求平均值作为所述车辆的当前位姿。
[0223]
具体实现中,步骤s105如图22所示可以通过以下步骤s701-步骤s703实现:
[0224]
步骤s701,使用当前估计位姿p
1-pn的第一权值对当前估计位姿p
1-pn加权求平均,得到第一加权平均值。
[0225]
在一个实施例中,第一加权平均值可以通过以下公式得到:
[0226][0227]
其中,p
l
表示第一加权平均值,n为采样点的数量;pn表示第n个采样点的当前估计位姿;为第n个采样点的当前估计位姿对应的第一权值,为采样点c1~cn的当前估计位姿p
1-pn对应的第一权值之和。
[0228]
步骤s702,使用当前估计位姿p
1-pn的第二权值对当前估计位姿p
1-pn加权求平均,得到第二加权平均值。
[0229]
在一个实施例中,第二加权平均值可以通过以下公式得到:
[0230][0231]
其中,oc表示第二加权平均值,n为采样点的数量;pn表示第n个采样点的当前估计位姿;为第n个采样点的当前估计位姿对应的第二权值,为采样点c1~cn的当前估计位姿p
1-pn对应的第二权值之和。
[0232]
其中,步骤s701和步骤s702仅用于描述方法步骤,不代表步骤的先后顺序,一般来说,控制单元可以并行执行步骤s701和步骤s702,也可以先后执行s701和步骤s702。另外,本技术实施例中,第一加权平均值和第二加权平均值均为位姿。
[0233]
步骤s703,对第一加权平均值和第二加权平均值加权求平均,得到加权平均值,以加权求平均值作为车辆的当前位姿。
[0234]
具体实现中,车辆的定位结果可以通过以下公式得到:
[0235]
p=α
l
·
p
l
αc·
pcꢀꢀꢀꢀ
(14)
[0236]
其中,p为车辆的当前位姿,即定位系统本次定位输出的车辆实际位姿;p
l
表示第一加权平均值,pc表示第二加权平均值;α
l
表示第一加权平均值的权值,αc表示第二加权平均值的权值,α
l
αc=1。其中,α
l
和αc的取值可以根据实际需求确定,α
l
或αc的数值越大,表示第一加权平均值或第二加权平均值的权重越高。具体实践时,如果技术人员希望以激光特征主导定位结果,则可以增大α
l
的取值,例如α
l
取值为0.7、0.8等;如果技术人员希望以视觉特征主导定位结果,则可以增大αc的取值,例如αc取值为0.7、0.8等;如果技术人员希望激光特征和视觉特征对定位结果起到均等的作用,则α
l
和αc的取值可以均为0.5。
[0237]
可以理解的是,在步骤s101-步骤s105执行完成之后,定位系统即完成了一次完整的定位过程。在车辆的行驶过程中,由于车辆的位姿时刻变化,定位过程也是不断进行的。
[0238]
可以理解的是,受里程计误差或者其他因素的影响,随着定位次数的增加,采样点的分布可能会出现发散的现象。其中,采样点的发散条件可以由本领域技术人员自行设置,例如:当有预设比例的采样点对应的当前估计位姿的第二权值低于预设阈值时,认为采样点发散;或者,当有预设比例的采样点对应的当前估计位姿的第一权值低于预设阈值时,认为采样点发散。当采样点发散时,控制单元可以重新选与之前数量相同的采样点,本技术实施例对重选采样点的方式同样不做限定,例如:在第一权值和/或者第二权值较高的一个或
者多个当前估计位姿周围选取一定比例(例如:90%)的采样点,在gnss/ins组合模块输出的位姿周围选取剩余比例(例如:10%)的采样点。另外,控制单元还可以周期性地重选采样点,例如每隔100个定位帧作为一个重选周期,重选采样点。
[0239]
本技术实施例提供的定位方法,能够分别基于激光特征的匹配确定当前估计位姿的第一权值,基于视觉语义信息和路面语义信息的匹配(即视觉特征的匹配)确定当前估计位姿的第二权值,然后根据的第一权值和第二权值对当前估计位姿加权求平均,得到车辆的定位结果,从而实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合,提高了定位效率。并且,本技术实施例提供的定位方法将激光特征和视觉语义信息编码存储在同一张定位地图中,实现了地图数据的融合,降低了定位过程中产生的数据开销和计算开销。
[0240]
上述本技术提供的实施例对定位方法的各方案进行了介绍。可以理解的是,定位系统为了实现上述功能,可以包含执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0241]
在一个实施例中,定位系统可以通过如图8所示的硬件结构实现相应的功能,该定位系统可以安装在车辆中,一些器件的安装方式可以如图4所示。其中,gnss/ins组合模块130,用于确定车辆的初始位姿;存储器190,用于存储定位地图,定位地图包括相互拼接的多张定位图片,定位图片包括色彩通道,色彩通道存储有第一激光特征的编码和视觉语义信息的编码;激光雷达110,用于采集点云数据,点云数据包含第二激光特征;摄像头120,用于采集图像数据,图像数据包含至少一个路面语义信息;控制单元140,用于在初始位姿周围生成n个采样点c1~cn,n为正整数;控制单元140,还用于根据车辆的当前预测位姿从定位地图中提取第一激光特征和至少一个视觉语义信息;控制单元140,还用于对于任意采样点cn,n为正整数,n≤n,根据其对应的当前估计位姿pn,将提取自定位地图的第一激光特征与第二激光特征进行匹配,以确定当前估计位姿pn的第一权值,第二激光特征是从激光雷达采集的点云数据中提取的;控制单元140,还用于对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值,至少一个路面语义信息是从摄像头采集的图像数据中提取的;控制单元140,还用于根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿。
[0242]
在一个实施例中,定位图片包括第一色彩通道,第一色彩通道用于存储视觉语义信息的编码。
[0243]
在一个实施例中,定位图片还包括第二色彩通道,第二色彩通道用于存储第一激光特征的编码。
[0244]
在一个实施例中,视觉语义信息的编码包括标志位、类型编码和亮度编码中的至少一种;标志位用于表示路面标志的类型,类型编码用于表示路面标志的内容,亮度信息编码用于表示图片的亮度信息。
[0245]
在一个实施例中,当控制单元140用于根据车辆的当前预测位姿从定位地图中提取至少一个视觉语义信息时:控制单元140,具体用于根据当前预测位姿从定位地图中提取局部定位地图,局部定位地图包含m张定位图片,m张定位图片包含当前预测位姿所在的第一图片,以及第一图片附近的m-1张第二图片,m为大于1的正整数;控制单元140,还用于从局部定位地图中提取至少一个视觉语义信息。
[0246]
在一个实施例中,当控制单元140用于对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值时:控制单元140,具体用于从至少一个路面语义信息中确定至少一个有效路面语义信息,每一个有效路面语义信息的像素数量在预设范围内;控制单元140,还用于根据当前估计位姿pn将至少一个有效路面语义信息投影到局部定位地图的坐标系中;控制单元140,还用于确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系;控制单元140,还用于对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值。
[0247]
在一个实施例中,当控制单元140用于确定至少一个有效路面语义信息和至少一个视觉语义信息的语义关联关系时:控制单元140,具体用于计算任意有效路面语义信息ai的语义权值和任意视觉语义信息bj的语义权值;控制单元140,还用于根据有效路面语义信息ai的语义权值和视觉语义信息bj的语义权值的差值,确定有效路面语义信息ai和视觉语义信息bj的语义关联度;控制单元140,还用于当语义关联度小于预设第一阈值时,确定有效路面语义信息ai和视觉语义信息bj具有语义关联。
[0248]
在一个实施例中,当控制单元140用于对每一对语义关联的有效路面语义信息和视觉语义信息进行语义匹配,根据语义匹配结果确定第二权值时:控制单元140,具体用于分别计算每一对语义关联的有效路面语义信息和视觉语义信息的匹配距离;控制单元140,还用于将计算得到的各个匹配距离的加权求和得到总匹配距离;控制单元140,还用于根据总匹配距离确定第二权值。
[0249]
在一个实施例中,当控制单元140用于根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿时:控制单元140,具体用于使用当前估计位姿p
1-pn的第一权值对当前估计位姿p
1-pn加权求平均,得到第一加权平均值;控制单元140,还用于使用当前估计位姿p
1-pn的第二权值对当前估计位姿p
1-pn加权求平均,得到第二加权平均值;控制单元140,还用于对第一加权平均值和第二加权平均值加权求平均,得到加权平均值,以加权求平均值作为车辆的当前位姿。
[0250]
在一个实施例中,路面语义信息包括:包含有至少一个路面标志的像素块、像素块的像素数量、每个像素所属的路面标志的类型。
[0251]
在一个实施例中,定位系统还包括里程计180;控制单元140,还用于根据里程计180数据确定车辆在当前时刻t和第一历史时刻t-1之间产生的相对位姿;控制单元140,还用于将采样点cn在第一历史时刻t-1对应的预测位姿与相对位姿相加得到当前预测位姿。
[0252]
在一个实施例中,控制单元140,还用于当有预设比例的第一权值或者第二权值低于第二阈值时,重新生成n个采样点c1~cn。
[0253]
在另一个实施例中,定位系统可以通过图23所示的软件模块实现相应的功能。如
图23所示,定位系统可以包括采样点生成模块810、提取模块820、第一匹配模块830、第二匹配模块840、求解模块850。下面对上述模块的功能进行具体说明:
[0254]
采样点生成模块810,用于确定车辆的初始位姿,在初始位姿周围生成n个采样点c1~cn,n为正整数;
[0255]
提取模块820,用于根据车辆的当前预测位姿从定位地图中提取第一激光特征和至少一个视觉语义信息。
[0256]
第一匹配模块830,用于对于任意采样点cn,n为正整数,n≤n,根据其对应的当前估计位姿pn,将提取自定位地图的第一激光特征与第二激光特征进行匹配,以确定当前估计位姿pn的第一权值,第二激光特征是从激光雷达采集的点云数据中提取的。
[0257]
第二匹配模块840,用于对于任意采样点cn,根据当前估计位姿pn,将至少一个视觉语义信息与至少一个路面语义信息进行匹配,以确定当前估计位姿pn的第二权值,至少一个路面语义信息是从摄像头采集的图像数据中提取的。
[0258]
求解模块850,用于根据n个采样点c1~cn的当前估计位姿p
1-pn及其第一权值和第二权值,计算当前估计位姿p
1-pn的加权平均值,以加权求平均值作为车辆的当前位姿。
[0259]
其中,定位地图包括相互拼接的多张定位图片,定位图片包括色彩通道,第一激光特征的编码和视觉语义信息的编码存储在色彩通道中。
[0260]
本技术实施例提供的定位系统,能够分别基于激光特征的匹配确定当前估计位姿的第一权值,基于视觉语义信息和路面语义信息的匹配(即视觉特征的匹配)确定当前估计位姿的第二权值,然后根据的第一权值和第二权值计算当前估计位姿的加权平均值,以加权求平均值作为车辆的当前位姿,从而实现了将基于激光特征匹配的激光定位技术和基于视觉特征匹配的视觉定位技术进行融合,提高了定位效率。并且,本技术实施例提供的技术方案将激光特征和视觉语义信息编码存储在同一张定位地图中,实现了地图数据的融合,降低了定位过程中产生的数据开销和计算开销。
[0261]
本技术实施例还提供了一种车辆,该车辆可以包含前述各实施例提供的定位系统,并且用户执行前述各个实施例提供的定位方法。
[0262]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
[0263]
本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面的方法。
[0264]
以上的具体实施方式,对本技术实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本技术实施例的具体实施方式而已,并不用于限定本技术实施例的保护范围,凡在本技术实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本技术实施例的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献