一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标地图的构建方法、装置、计算机设备及可读存储介质与流程

2022-11-19 10:36:30 来源:中国专利 TAG:


1.本发明涉及视觉处理领域,尤其涉及一种目标地图的构建方法、装置、计算机设备及可读存储介质。


背景技术:

2.在视觉同步定位与建图(visual simultaneous localization and mapping,vslam)方法中,常通过图像中的像素信息构建特征地图,并利用特征地图完成回环检测及重定位等。
3.但是,图像中的像素信息受环境光照、相机视角等影响较大,使得回环检测及重定位的结果难以得到保证,进而导致建图精度无法预估,图像与地图数据的可靠关联难以保证。


技术实现要素:

4.有鉴于此,本发明提供一种目标地图的构建方法、装置、计算机设备及可读存储介质,用于改善根据特征地图进行回环检测及重定位等任务时,受环境光照、相机视角等影响较大的现状。
5.第一方面,本发明实施例提供一种目标地图的构建方法,包括:
6.获取连续的多帧三维影像;
7.将每帧所述三维影像输入至目标检测网络,得到每帧所述三维影像中每个目标的类别和每个所述目标的影像特征表示;
8.根据每个目标的影像特征表示,将不同帧所述三维影像中相似的目标的影像特征表示设置为相同的值;
9.基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标;
10.根据每个所述静态目标的影像特征表示生成目标地图。
11.可选的,在本发明实施例提供的一种可行方式中,所述目标检测网络包括识别模块和特征提取模块;
12.所述将每帧所述三维影像输入至目标检测网络,得到每帧所述三维影像中每个目标的类别和每个所述目标的影像特征表示,包括:
13.将每帧所述三维影像输入至所述识别模块,得到每帧所述三维影像中每个目标的类别和每个所述目标的所在的边界框;
14.基于所述特征提取模块,对每个所述目标的所在的边界框对应的影像进行特征提取,得到每个所述目标的影像特征表示。
15.可选的,在本发明实施例提供的一种可行方式中,所述基于所述特征提取模块,对每个所述目标的所在的边界框对应的影像进行特征提取,得到每个所述目标的影像特征表示,包括:
16.将每个所述目标的所在的边界框对应的影像映射为二维图像;
17.将所述二维图像的尺寸调整为预设大小;
18.将调整尺寸后的二维图像输入至所述特征提取模块,得到每个所述目标的影像特征表示。
19.可选的,在本发明实施例提供的一种可行方式中,所述根据每个目标的影像特征表示,将不同帧所述三维影像中相似的目标的影像特征表示设置为相同的值,包括:
20.针对连续的两帧三维影像,对前后两帧三维影像中目标的影像特征表示进行相似检测,以将后一帧三维影像中的每个目标分为第一目标和第二目标,其中,所述第一目标表示前一帧三维影像中存在与所述第一目标相似的相似目标,所述第二目标表示所述前一帧三维影像中不存在与所述第二目标相似的相似目标;
21.将所述第一目标的影像特征表示替换为对应的相似目标的影像特征表示。
22.可选的,在本发明实施例提供的一种可行方式中,所述针对连续的两帧三维影像,对前后两帧三维影像中目标的影像特征表示进行相似检测,以将后一帧三维影像中的每个目标分为第一目标和第二目标,包括:
23.针对连续的两帧三维影像,计算后一帧三维影像中每个目标的影像特征表示与前一帧三维影像中每个目标的影像特征表示的余弦相似度,得到余弦相似度矩阵;
24.基于匈牙利匹配算法和所述余弦相似度矩阵,对所述后一帧三维影像中每个目标进行匹配;
25.将匹配成功的目标作为第一目标,及将匹配失败的目标作为第二目标,其中,所述第一目标对应的匹配结果代表所述第一目标对应的相似目标。
26.可选的,在本发明实施例提供的一种可行方式中,所述针对连续的两帧三维影像,对前后两帧三维影像中目标的影像特征表示进行相似检测,以将后一帧三维影像中的每个目标分为第一目标和第二目标之后,所述将所述第一目标的影像特征表示替换为对应的相似目标的影像特征表示之前,所述方法还包括:
27.针对连续的两帧三维影像,根据两帧三维影像中第一目标对应的相似目标,确定所述前一帧三维影像的第一目标中的可匹配目标,其中,所述可匹配目标不为后一帧三维影像中第一目标对应的相似目标;
28.针对连续的两帧三维影像,计算后一帧三维影像中每个第二目标的边界框与前一帧三维影像中每个可匹配目标的边界框的交并比,得到交并比矩阵;
29.根据匈牙利匹配算法和所述交并比矩阵,对每个所述第二目标进行匹配;
30.针对匹配成功的第二目标,将所述第二目标的匹配结果对应的可匹配目标作为所述第二目标的相似目标,并将所述第二目标设置为第一目标。
31.可选的,在本发明实施例提供的一种可行方式中,所述获取连续的多帧三维影像之后,所述基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标之前,所述方法还包括:
32.利用预设的图像特征提取算法,对每帧所述三维影像进行图像特征提取,得到每帧所述三维影像中的多个特征点;
33.所述基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标,包括:
34.基于预设分类规则,根据每个所述目标的类别将每帧所述三维影像中的所有目标划分为静态目标、动态目标以及其他目标;
35.针对每个所述其他目标,对所述其他目标所属的每帧所述三维影像中,所述其他目标所在的边界框中的影像进行投影,得到投影区域;
36.将所述其他目标的所有投影区域中,未存在遮挡的投影区域对应的三维影像作为创建帧影像;
37.根据所述创建帧影像中的多个特征点,确定所述其他目标对应的目标特征点;
38.在所述其他目标所属的除创建帧影像外的每帧三维影像中,计算所述目标特征点与对极线的距离的平均值;
39.若所述平均值小于预设阈值,则将所述其他目标作为静态目标。
40.可选的,在本发明实施例提供的一种可行方式中,所述根据每个所述静态目标的影像特征表示生成目标地图,包括:
41.针对每个所述静态目标,若在所有所述三维影像中,超过预设帧数量的三维影像中存在所述静态目标,则根据所述静态目标的影像特征表示生成目标地图。
42.第二方面,本发明实施例提供一种目标地图的构建装置,包括:
43.获取模块,用于获取连续的多帧三维影像;
44.目标检测模块,用于将每帧所述三维影像输入至目标检测网络,得到每帧所述三维影像中每个目标的类别和每个所述目标的影像特征表示;
45.设置模块,用于根据每个目标的影像特征表示,将不同帧所述三维影像中相似的目标的影像特征表示设置为相同的值;
46.确定模块,用于基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标;
47.生成模块,用于根据每个所述静态目标的影像特征表示生成目标地图。
48.第三方面,本发明实施例提供一种计算机设备,包括存储器以及处理器,存储器存储有计算机程序,计算机程序在处理器上运行时执行如第一方面中任一种公开的目标地图的构建方法。
49.第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序在处理器上运行时执行如第一方面中任一种公开的目标地图的构建方法。
50.本发明实施例提供的目标地图的构建方法中,首先利用搭载有相机功能的设备进行连续拍摄,以获取连续的多帧三维影像;接着,将每帧三维影像输入至预设的目标检测网络中,以对每帧三维影像中的目标进行识别与特征提取,得到每帧三维影像中的每个目标的类别和影像特征表示;然后,根据每个目标的影像特征表示,判断不同帧的三维影像中是否存在相同或相似的目标,若存在,则将不同帧所述三维影像中相似或相同的目标的影像特征表示设置为相同的值,以使相似/相同的多个目标通过同一个影像特征表示以表征;随后,根据预设分类规则和每个目标的类别,确定所有目标中的保持静止的目标,即静态目标;最后,根据每个静态目标的影像特征表示生成目标地图。
51.基于此,本发明实施例基于目标地图的生成,使得视觉同步定位与建图中的回环检测及重定位等地图检索任务还能基于目标地图以进行,也即,使得各个三维影像中的静
态物体/目标均能根据目标地图进行定位,由此避免了仅采用特征地图而导致建图精度受环境光照、相机视角等影响较大的情况,提高了建图精度,并使得图像与地图数据能得到可靠关联。
附图说明
52.为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。
53.图1示出了本发明实施例提供的第一种目标地图的构建方法的流程示意图;
54.图2示出了本发明实施例提供的第二种目标地图的构建方法的流程示意图;
55.图3示出了本发明实施例提供的第三种目标地图的构建方法的流程示意图;
56.图4示出了本发明实施例提供的目标地图的构建装置的结构示意图。
具体实施方式
57.下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
58.通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
59.在下文中,可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
60.此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
61.除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。
62.实施例1
63.参照图1,示出了本发明实施例提供的第一种目标地图的构建方法的流程示意图,本发明实施例提供的目标地图的构建方法包括:
64.s110,获取连续的多帧三维影像。
65.也即,利用具备相机功能的设备连续拍摄,从而得到连续的多帧三维影像。
66.可以理解的是,采用何种设备以进行影像拍摄为可根据实际情况设置的内容,如在本发明实施例提供的一种可行方式中,将利用由无人机与深度摄像头构成的组合设备来
完成三维影像的获取。
67.s120,将每帧所述三维影像输入至目标检测网络,得到每帧所述三维影像中每个目标的类别和每个所述目标的影像特征表示。
68.需说明的是,本发明实施例中的目标检测(object detection)网络用于对每帧三维影像中的目标(object)进行识别,也即,识别每帧三维影像中的各类物体,如汽车、行人、建筑物及树木等目标。同时,还用于对每个目标进行图像/影像特征提取,以得到影像特征表示。
69.还需说明的是,本发明实施例中的影像特征表示为目标的像素信息的抽象化表达,用于表征目标在像素分布上的特征。
70.此外,可以理解的是,目标检测网络具体采用何种结构为可根据实际情况设置的内容,如在本发明实施例提供的一种可行方式中,所述目标检测网络包括识别模块和特征提取模块;
71.进而,所述s120,包括:
72.将每帧所述三维影像输入至所述识别模块,得到每帧所述三维影像中每个目标的类别和每个所述目标的所在的边界框;
73.基于所述特征提取模块,对每个所述目标的所在的边界框对应的影像进行特征提取,得到每个所述目标的影像特征表示。
74.也即,本发明实施例首先利用对每帧三维影像中的目标进行定位和识别,以确定三维影像中每个目标的类别,如树木、行人、车辆等类别,和确定每个目标再三维影像中的位置,即目标的所在的边界框。
75.可以理解的是,因目标处于三维影像,所以目标所在的边界框由三维s数据构成。示范性的,在本发明实施例提供的一种实例中,任意一个目标所在的边界框由x、y、z、h、w、l及theta,共计7个属性构成,其中,x、y及z表示边界框的中心点坐标,h和w分别表示边界框的高与宽,l表示长度,theta表示偏航角。
76.进一步的,在确定目标在三维影像中的位置,即目标所在的边界框后,本发明实施例将对边界框所包围的影像进行特征提取,进而得到目标的影像特征表示。
77.此外,可以理解的是,本发明实施例中的识别模块和特征提取模块的具体实现方式为可根据实际情况设置的内容,如在本发明实施例提供的一种可行方式中,识别模块通过任意的三维目标检测网络如certernet实现,而特征提取模块通过如残缺网络(residual network)、vgg(visual geometry group)网络、googlenet等卷积神经网络实现。
78.s130,根据每个目标的影像特征表示,将不同帧所述三维影像中相似的目标的影像特征表示设置为相同的值。
79.可以理解的是,在基于连续拍摄而得到的影像中,同一个物体可能在多帧影像中重复出现,如前一帧影像中最右侧的树木,可能将再次出现于后一帧影像中的最左侧,又如,保持移动的行人或车辆将在多帧影像中重复出现。
80.针对此种情况,本发明实施例根据每帧三维影像的每个目标的影像特征表示,对不同帧三维影像中的目标进行相似判断,若根据影像特征表示确定不同帧三维影像的目标相似或相同,则将不同帧三维影像中,相似或相同目标的影像特征表示设置为相同的值。不难理解的是,若两个目标的影像特征表示相同或是相近,则表明两个目标相同或是相似。
81.示范性的,设第1至第3帧三维影像中,第1帧三维影像中的目标a、第2帧三维影像中的目标b及第3帧三维影像中的目标c的影像特征表示相同或相近,则将目标b的影像特征表示和目标c的影像特征表示均设置为目标a的影像特征表示,由此使得目标a、目标b及目标c的影像特征表示相同。
82.s140,基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标。
83.可以理解的是,本发明实施例中的静态目标指代影像中静止不同的物体,如树木和建筑物。
84.还可以理解的是,因本发明实施例中的目标检测网络能识别每个目标的类别,而目标的类别能在一定程度上反映目标的运动情况,如建筑物为静态,行人可能为动态。
85.因此,本发明实施例根据每个目标的类别进行静态目标的确定,如当目标的类别为树木时,则确定目标的类别为静态目标。
86.s150,根据每个所述静态目标的影像特征表示生成目标地图。
87.可以理解的是,在s130执行完毕后,不同帧的三维影像中相似或相同目标的影像特征表示一致;而在s140执行完毕后,相似或相同的静态目标的影像特征表示一致。
88.进而在本发明实施例根据每个静态目标的影像特征生成的目标地图中,目标地图中目标的影像特征表示能清楚地指向目标在每帧三维影像的位置,进而能确定目标的变化轨迹。
89.因此,本发明实施例将在根据每个静态目标的影像特征表示生成目标地图后,利用目标地图辅助重定位及回环检测等地图检索任务的处理,以在目标地图辅助重定位及回环检测等地图检索任务中,能根据目标地图用于定位每帧三维影像中的静态目标。
90.此外,不难理解的是,因在重定位及回环检测等地图检索任务中,动态目标难以充当为地标/参照物,故本发明实施例仅根据静态目标生成目标地图。
91.还可以理解的是,利用目标地图进行重定位及回环检测等地图检索任务的具体方式为可根据情况设置的内容。
92.本发明实施例提供的目标地图的构建方法中,首先利用搭载有相机功能的设备进行连续拍摄,以获取连续的多帧三维影像;接着,将每帧三维影像输入至预设的目标检测网络中,以对每帧三维影像中的目标进行识别与特征提取,得到每帧三维影像中的每个目标的类别和影像特征表示;然后,根据每个目标的影像特征表示,判断不同帧的三维影像中是否存在相同或相似的目标,若存在,则将不同帧所述三维影像中相似或相同的目标的影像特征表示设置为相同的值,以使相似/相同的多个目标通过同一个影像特征表示以表征;随后,根据预设分类规则和每个目标的类别,确定所有目标中的保持静止的目标,即静态目标;最后,根据每个静态目标的影像特征表示生成目标地图。
93.基于此,本发明实施例基于目标地图的生成,使得视觉同步定位与建图中的回环检测及重定位等地图检索任务还能基于目标地图以进行,也即,使得各个三维影像中的静态物体/目标均能根据目标地图进行定位,由此避免了仅采用特征地图而导致建图精度受环境光照、相机视角等影响较大的情况,提高了建图精度,并使得图像与地图数据能得到可靠关联。
94.可选的,在本发明实施例提供的一种可行方式中,所述基于所述特征提取模块,对
每个所述目标的所在的边界框对应的影像进行特征提取,得到每个所述目标的影像特征表示,包括:
95.将每个所述目标的所在的边界框对应的影像映射为二维图像;
96.将所述二维图像的尺寸调整为预设大小;
97.将调整尺寸后的二维图像输入至所述特征提取模块,得到每个所述目标的影像特征表示。
98.也即,此种可行方式下,本发明实施例在得到每个目标的影像特征表示过程中,首先将每个目标所在位置的区域三维影像,即边界框对应的影像映射为二维图像,以在后续过程中能通过二维特征抽取算法/模型以完成特征抽取。
99.接着,对每个目标对应的二维影像进行尺寸调整,以调整为统一的尺寸大小。可以理解的是,调整后的影像的尺寸大小为需根据实际情况设置的内容,如在本发明实施例提供的一种可行方式中,每个二维影像将被调整为124*64大小的影像。
100.最后,对调整后的二维影像进行特征特征抽取,进而得到每个目标的影像特征表示。
101.可选的,在本发明实施例提供的一种可行方式中,具体可参考图2,示出了本发明实施例提供的第二种目标地图的构建方法的流程示意图,在此种可行方式中,所述s130,包括:
102.s131,针对连续的两帧三维影像,对前后两帧三维影像中目标的影像特征表示进行相似检测,以将后一帧三维影像中的每个目标分为第一目标和第二目标,其中,所述第一目标表示前一帧三维影像中存在与所述第一目标相似的相似目标,所述第二目标表示所述前一帧三维影像中不存在与所述第二目标相似的相似目标;
103.s132,将所述第一目标的影像特征表示替换为对应的相似目标的影像特征表示。
104.也即,此种可行方式下本发明实施例将以两帧连续的三维影像为一组,从第一帧开始,逐次检测每组三维影像中相似或相同的目标。
105.进一步的,因本发明实施例中目标的影像特征表示为目标对应的像素信息的抽象表达,可知在连续的两帧三维影像中,同一个目标对应的像素信息应一致,或者,因连续的两帧三维影像的相机视角不同,同一个目标对应的像素信息存在较小的差异。
106.因此,本发明实施例将从连续的两帧三维影像中,分别从每帧中各选取一个目标以进行相似度检测,即判断两个目标的影像特征表示是否相似或相同,若是,则将后一帧三维影像中目标的影像特征表示用前一帧三维影像中的目标的影像特征表示代替。
107.可以理解的是,在完成每帧三维影像的相似目标检测后,若n帧三维影像中均包含同一个目标,则第2至n帧三维影像中,目标的影像特征表示与第1帧三维影像中目标的影像特征表示一致。
108.可选的,在本发明实施例提供的一种可行方式中,所述s131,包括:
109.针对连续的两帧三维影像,计算后一帧三维影像中每个目标的影像特征表示与前一帧三维影像中每个目标的影像特征表示的余弦相似度,得到余弦相似度矩阵;
110.基于匈牙利匹配算法和所述余弦相似度矩阵,对所述后一帧三维影像中每个目标进行匹配;
111.将匹配成功的目标作为第一目标,及将匹配失败的目标作为第二目标,其中,所述
第一目标对应的匹配结果代表所述第一目标对应的相似目标。
112.也即,此种可行方式下本发明实施例将基于匈牙利匹配算法(kuhn-munkers)和余弦相似度完成相似目标的检测。
113.具体的,设前一帧三维影像包含n个目标,后一帧三维影像包含m个待匹配目标。针对后一帧三维影像中的每个待匹配目标,根据待匹配目标的影像特征表示与前一帧三维影像中的每个目标的影像特征表示进行余弦相似度计算,进而得到待匹配目标对应的n个余弦相似度。在后一帧三维影像中每个待匹配目标均对应n个余弦相似度时,则得到一个n*m大小的余弦相似度矩阵。
114.最后,基于匈牙利匹配算法,对余弦相似度矩阵进行最优匹配,以判断后一帧三维影像中的待匹配目标是否均有对应的最优匹配结果,若存在,则将待匹配目标作为第一目标。而若不存在,则将待匹配目标作为第二目标。
115.可选的,在本发明实施例提供的一种可行方式中,具体可参考图3,示出了本发明实施例提供的第三种目标地图的构建方法的流程示意图,此种可行方式下,所述s131之后,所述s132之前,所述方法还包括:
116.s133,针对连续的两帧三维影像,根据两帧三维影像中第一目标对应的相似目标,确定所述前一帧三维影像的第一目标中的可匹配目标,其中,所述可匹配目标不为后一帧三维影像中第一目标对应的相似目标;
117.s134,针对连续的两帧三维影像,计算后一帧三维影像中每个第二目标的边界框与前一帧三维影像中每个可匹配目标的边界框的交并比,得到交并比矩阵;
118.s135,根据匈牙利匹配算法和所述交并比矩阵,对每个所述第二目标进行匹配;
119.s136,针对匹配成功的第二目标,将所述第二目标的匹配结果对应的可匹配目标作为所述第二目标的相似目标,并将所述第二目标设置为第一目标。
120.也即,本发明实施例提供此种可行方式中,将在确定每帧三维影像中的第一目标和第二目标后,利用前一帧三维影像的第一目标判断后一帧的第二目标是否为第一目标。
121.可以理解的是,因拍摄角度、相机姿态、光线变化等原因,物体/目标在不同时刻下拍摄的图像中,对应的影像特征表示可能不相近,进而可能出现同一目标被识别为两种目标的情况。因此,本发明实施例基于交并比的计算,以降低同一目标被识别为两种目标的概率。
122.需说明的是,交并比(intersection over union,iou)为目标检测技术中常利用到的指标之一,用于衡量生成的候选框(candidate bound)与真实的候选框(ground truth bound)的重叠程度。交并比越高,表示生成的候选框所包含的图像与真实的候选框所包含的图像的一致性越高。
123.进一步的,本发明实施例将基于交并比,计算后一帧三维影像中不存在相似目标的每个第二目标的边界框,与前一帧中的可匹配目标对应的边界框的重合程度。
124.还需说明的是,在第1帧三维影像与第2帧三维影像的相似目标检测中,若根据余弦相似度矩阵,确定第2帧三维影像中的目标a与第1帧三维影像中的目标b相似,则目标a和目标b互为对方的相似目标,且二者均为第一目标。
125.还需理解的是,前一帧三维影像中的可匹配目标表示未捕捉到轨迹的目标。
126.以连续的3帧三维影像为例,设第1帧三维影像包括目标a和目标b,第2帧三维影像
包括目标c与目标d,第3帧三维影像包括目标e和目标f,且目标a、目标c以及目标e互为相似目标,三者的影像特征表示一致;目标b与目标d互为相似目标,二者影像特征表示一致。
127.不难发现,在第1至第3帧三维影像中,因目标a、目标c及目标e对应同一物体,则物体的在三帧影像中的轨迹能轻易发现。但是,第1至2帧中的另一物体,即目标b和目标d对应的物体在第3帧失去了踪迹。换言之,可能出现目标b、目标d及目标e为同一目标,但因目标e的影像特征表示与目标的b的影像特征表示不相近,导致一个目标/物体被识别为两种目标/物体的情况发生。
128.因此,本发明实施例将利用目标d与目标f分别对应的边界框,判断二者是否对应同一物体,也即,计算后一帧三维影像中每个第二目标的边界框与前一帧三维影像中每个可匹配目标的边界框的交并比。其中,目标d为可匹配目标,目标f为第二目标。
129.进一步的,若后一帧三维影像中的第二目标能与前一帧三维影像中的可匹配目标匹配,则表明第二目标与可匹配目标对应同一物体,二者能构成同一物体的轨迹。因此,将第二目标设置为第一目标,以使不同帧中的同一目标的影像特征表示一致。
130.可选的,在一种可行方式中,本发明实施例将在执行s131和s133之间,将执行获取每帧三维影像的相机位姿,并利用每帧三维影像的相机位姿将每个目标的边界框对应的影像转换至地图坐标系的步骤。
131.可选的,在本发明实施例提供的一种可行方式中,在所述s110之后,所述s140之前,所述方法还包括:
132.利用预设的图像特征提取算法,对每帧所述三维影像进行图像特征提取,得到每帧所述三维影像中的多个特征点;
133.进而,所述s140,包括:
134.基于预设分类规则,根据每个所述目标的类别将每帧所述三维影像中的所有目标划分为静态目标、动态目标以及其他目标;
135.针对每个所述其他目标,对所述其他目标所属的每帧所述三维影像中,所述其他目标所在的边界框中的影像进行投影,得到投影区域;
136.将所述其他目标的所有投影区域中,未存在遮挡的投影区域对应的三维影像作为创建帧影像;
137.根据所述创建帧影像中的多个特征点,确定所述其他目标对应的目标特征点;
138.在所述其他目标所属的除创建帧影像外的每帧三维影像中,计算所述目标特征点与对极线的距离的平均值;
139.若所述平均值小于预设阈值,则将所述其他目标作为静态目标。
140.可以理解的是,此种可行方式中下本发明实施例将利用orb、sift(scale-invariant feature transform,尺度不变特征转换)及surf(speeded up robust feature,加速稳健特征)等图像特征提取算法中的任一种,对每帧三维影像进行特征提取,进而得到每帧三维影像中的多个特征点。其中,三维影像中的每个特征点均能表征一类/一个物体。
141.接着,将通过目标识别网络识别出的所有目标划分为动态目标、静态目标以及其他目标。可以理解的是,动态目标、静态目标以及其他目标分别对应的目标的种类为可根据实际情况设置的内容。如在本发明实施例提供的一种可行方式中,若目标的种类为行人,则
目标为动态目标,种类为建筑或树木,则为静态目标;而若既不属于动态目标也不属于静态目标,则划分为其他目标。
142.需说明的是,本发明实施例中的其他目标指代难以区分静态和动态的目标。
143.进一步的,针对每个其他目标,本发明实施例将确定其他目标所属的每帧三维影像,进而确定其他目标所在的每个边界框。
144.接着,将其他目标所在的每个边界框的三维影像映射至像素平面,得到其他目标对应的多个投影区域。
145.可以理解的是,因一帧图像包括多个目标,故图像中多个目标的边界框将存在遮挡的情况。设近处的边界框将遮挡远处边界框,也即,中心点与原点距离较小的边界框将遮挡距离较大的边界框。
146.基于此,本发明实施例将在找到其他目标未被遮挡,即投影区域中其他目标所在的边界框不被其他边界框遮挡时,将投影区域对应的一帧三维影像作为创建帧影像,并从创建帧影像的多个特征点中确定其他目标对应的特征点。
147.接着,基于对极几何,计算除创建帧之外,其他目标所属的每帧三维影像中,其他目标对应的特征点与对极线的距离的平均值。若平均值小于预设阈值,则说明其他目标在所属的每帧三维影像中的位置没有变化,因此将其他目标设置为静止目标。
148.在本发明实施例提供的一种可行方式中,所述预设阈值为3.84像素距离。
149.可选的,在本发明实施例提供的一种可行方式中,所述s150,包括:
150.针对每个所述静态目标,若在所有所述三维影像中,超过预设帧数量的三维影像中存在所述静态目标,则根据所述静态目标的影像特征表示生成目标地图。
151.也即,本发明实施例将从众多个静止目标中,筛选出有参考价值的静止目标以构建目标地图。
152.具体的,针对每个静止目标,判断静止目标在多帧三维影像中是否存在,若存在,则静止目标可用于视作有效的参考物。而若不存在,则说明静止目标所在的位置较为隐蔽,因而在相机角度变化后便无法发现,因而不适宜作为参考物。由此,确保目标地图中的静止目标能易于发现,因而具备参考价值。
153.可选的,在本发明实施例提供的一种可行方式中,预设帧数量为30帧。
154.实施例2
155.与本发明实施例1提供的目标地图的构建方法相对应的,本发明实施例2还提供一种目标地图的构建装置,参照图4,示出了本发明实施例提供的目标地图的构建装置200的结构示意图,本发明实施例提供的目标地图的构建装置200,包括:
156.获取模块210,用于获取连续的多帧三维影像;
157.目标检测模块220,用于将每帧所述三维影像输入至目标检测网络,得到每帧所述三维影像中每个目标的类别和每个所述目标的影像特征表示;
158.设置模块230,用于根据每个目标的影像特征表示,将不同帧所述三维影像中相似的目标的影像特征表示设置为相同的值;
159.确定模块240,用于基于预设分类规则,根据每个所述目标的类别确定所有所述三维影像中的静态目标;
160.生成模块250,用于根据每个所述静态目标的影像特征表示生成目标地图。
161.可选的,在本发明实施例提供的一种可行方式中,所述目标检测网络包括识别模块和特征提取模块;
162.所述目标检测模块,包括:
163.边界框识别子模块,用于将每帧所述三维影像输入至所述识别模块,得到每帧所述三维影像中每个目标的类别和每个所述目标的所在的边界框;
164.特征提取子模块,用于基于所述特征提取模块,对每个所述目标的所在的边界框对应的影像进行特征提取,得到每个所述目标的影像特征表示。
165.可选的,在本发明实施例提供的一种可行方式中,所述特征提取子模块,包括:
166.映射单元,用于将每个所述目标的所在的边界框对应的影像映射为二维图像;
167.调整单元,用于将所述二维图像的尺寸调整为预设大小;
168.输入单元,用于将调整尺寸后的二维图像输入至所述特征提取模块,得到每个所述目标的影像特征表示。
169.可选的,在本发明实施例提供的一种可行方式中,所述设置模块,包括:
170.检测子模块,用于针对连续的两帧三维影像,对前后两帧三维影像中目标的影像特征表示进行相似检测,以将后一帧三维影像中的每个目标分为第一目标和第二目标,其中,所述第一目标表示前一帧三维影像中存在与所述第一目标相似的相似目标,所述第二目标表示所述前一帧三维影像中不存在与所述第二目标相似的相似目标;
171.替换子模块,用于将所述第一目标的影像特征表示替换为对应的相似目标的影像特征表示。
172.可选的,在本发明实施例提供的一种可行方式中,所述检测子模块,包括:
173.矩阵获取单元,用于针对连续的两帧三维影像,计算后一帧三维影像中每个目标的影像特征表示与前一帧三维影像中每个目标的影像特征表示的余弦相似度,得到余弦相似度矩阵;
174.匹配单元,用于基于匈牙利匹配算法和所述余弦相似度矩阵,对所述后一帧三维影像中每个目标进行匹配;
175.目标确定单元,用于将匹配成功的目标作为第一目标,及将匹配失败的目标作为第二目标,其中,所述第一目标对应的匹配结果代表所述第一目标对应的相似目标。
176.可选的,在本发明实施例提供的一种可行方式中,所述装置还包括:
177.可匹配目标确定模块,用于针对连续的两帧三维影像,根据两帧三维影像中第一目标对应的相似目标,确定所述前一帧三维影像的第一目标中的可匹配目标,其中,所述可匹配目标不为后一帧三维影像中第一目标对应的相似目标;
178.交并比计算模块,用于针对连续的两帧三维影像,计算后一帧三维影像中每个第二目标的边界框与前一帧三维影像中每个可匹配目标的边界框的交并比,得到交并比矩阵;
179.交并比匹配模块,用于根据匈牙利匹配算法和所述交并比矩阵,对每个所述第二目标进行匹配;
180.目标设置模块,用于针对匹配成功的第二目标,将所述第二目标的匹配结果对应的可匹配目标作为所述第二目标的相似目标,并将所述第二目标设置为第一目标。
181.可选的,在本发明实施例提供的一种可行方式中,所述装置还包括:
182.特征点获取模块,用于利用预设的图像特征提取算法,对每帧所述三维影像进行图像特征提取,得到每帧所述三维影像中的多个特征点;
183.所述确定模块,包括:
184.分别模块子模块,用于基于预设分类规则,根据每个所述目标的类别将每帧所述三维影像中的所有目标划分为静态目标、动态目标以及其他目标;
185.投影子模块,用于针对每个所述其他目标,对所述其他目标所属的每帧所述三维影像中,所述其他目标所在的边界框中的影像进行投影,得到投影区域;
186.创建帧确定子模块,用于将所述其他目标的所有投影区域中,未存在遮挡的投影区域对应的三维影像作为创建帧影像;
187.特征点确定子模块,用于根据所述创建帧影像中的多个特征点,确定所述其他目标对应的目标特征点;
188.平均值计算子模块,用于在所述其他目标所属的除创建帧影像外的每帧三维影像中,计算所述目标特征点与对极线的距离的平均值;
189.静态目标设置子模块,用于若所述平均值小于预设阈值,则将所述其他目标作为静态目标。
190.可选的,在本发明实施例提供的一种可行方式中,所述生成模块还用于针对每个所述静态目标,若在所有所述三维影像中,超过预设帧数量的三维影像中存在所述静态目标,则根据所述静态目标的影像特征表示生成目标地图。
191.本技术实施例提供的目标地图的构建装置200能够实现实施例1对应的目标地图的构建方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
192.本发明实施例还提供一种计算机设备,包括存储器以及处理器,存储器存储有计算机程序,计算机程序在处理器上运行时执行如实施例1对应的目标地图的构建方法。
193.本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序在处理器上运行时执行如实施例1对应的目标地图的构建方法。
194.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
195.另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
196.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
197.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献