一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

三维目标检测方法及装置与流程

2023-01-16 22:29:32 来源:中国专利 TAG:


1.本技术涉及自动驾驶技术领域,具体而言,涉及一种三维目标检测方法及装置。


背景技术:

2.当前,自动驾驶技术已逐渐成为未来车辆驾驶发展的中心,自动驾驶技术中至关重要的一项任务就是在复杂的现实世界环境中估计周围物体的状态。
3.通常,相关技术人员采用的是基于点云的三维目标检测。在检测过程中鉴于点云数据分布的不规则性,可以采用分割体素的方法,也即将点云转换为具有手工制作特征的体素来实现三维目标检测,但是手工特征的泛化能力限制了点云在复杂的现实世界中的真实表现;或者还可以将点云转换为二维空间上的多视图,但构建多视图时通常会引起数据丢失的问题。
4.因此,无论是将点云转换为规则的体素网格,又或者是将点云投影到二维空间上,都会造成量化误差限制点云的性能,从而导致预测值的误差较大,出现尺寸模糊问题。
5.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

6.本技术实施例提供了一种三维目标检测方法及装置,以至少解决由于相关技术无法准确判断候选区域,导致出现目标尺寸不确定性的技术问题。
7.跟据本技术实施例的一个方面,提供了一种三维目标检测方法,包括:获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
8.可选地,将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点,包括:以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直向上方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得到多个第二待检测点。
9.可选地,对多个第二待检测点进行特征提取,得到原始点云的目标特征,包括:获取多个第二待检测点的多个目标子特征;基于多个目标子特征,确定原始点云的目标特征。
10.可选地,基于目标特征,确定待检测目标的目标检测结果,包括:基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
11.可选地,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别,包括:确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计
算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
12.可选地,依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
13.可选地,基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿,包括:依据第二待检测点的位姿坐标,计算目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,其中,位姿坐标包括:位姿信息、尺寸信息和方向信息;基于目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,计算目标特征的回归损失;依据回归损失,确定待检测目标的目标位姿。
14.根据本技术实施例的另一方面,还提供了一种三维目标检测装置,包括:获取模块,用于获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包含多个第一待检测点;处理模块,用于将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;提取模块,用于对多个第二待检测点进行特征提取,得到原始点云的目标特征;确定模块,用于基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
15.根据本技术实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,非易失性存储介质所在设备通过运行计算机程序执行上述的三维目标检测方法。
16.根据本技术实施例的另一方面,还提供了一种电子设备,该电子设备包括:存储器和处理器,其中,存储器中存储有计算机程序,处理器被配置为通过计算机程序执行上述的三维目标检测方法。
17.在本技术实施例中,获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。其中,由于原始点云分布的不规则性,通过对原始点云中第一待检测点进行归一化处理,避免了进一步的量化误差,从而解决了由于相关技术无法准确判断候选区域,导致出现目标尺寸不确定性技术问题。
附图说明
18.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1是根据本技术实施例的一种三维目标检测方法的流程示意图;图2是根据本技术实施例的一种可选的pointnet的结构示意图;图3是根据本技术实施例的一种三维目标检测装置的结构示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范
围。
20.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.为了更好地理解本技术实施例,对本技术实施例进行描述的过程中出现的部分名词或术语翻译解释如下:目标检测(object dection,od)是一种从视频或者图片中找到感兴趣的区域并标记出来的行为动作,可以通过算法提取特征来识别定位特定类别的对象。
22.实施例1自动驾驶一直是车辆领域的热门研究方向,目前的自动驾驶系统可以分为两种:无人驾驶和adas(advanced driver assistance system,先进驾驶辅助系统),前者聚焦于完全的无人车辆驾驶以节省司机的人力成本,后者则是聚焦于辅助司机以减少司机驾驶时的压力以及提高车辆的安全性。两者都是利用安装在车上的各种传感器收起数据,并结合地图数据进行系统计算,从而识别障碍物的类型和精确位置与朝向,进而保证规划出合理的行车线路并控制车辆安全到达预定位姿。
23.自动驾驶车辆通常使用激光雷达(light detection and ranging,lidar)和多个安装在车辆不同位姿的摄像头进行感知数据收集,然后将收集的视觉数据进行分析和目标检测,定位车道、车辆和行人等目标。最近随着深度学习和人工智能技术的飞速发展,计算机分析图像数据的能力相比于传统方法得到显著提升。
24.在智能驾驶系统中,主流的传感器解决方案包括激光雷达、摄像头和毫米波雷达(radar)。激光雷达的优势在于三维建模,探测范围较广,探测精度较高,因此基于激光雷达点云的三维目标检测是一大热门研究方向,然而,当前基于激光雷达点云的三维目标检测仍存在一些问题,其一是激光雷达传感器输出的数据是稀疏点云,并不像摄像头输出的图像具有密集的特征。其二是激光雷达输出的点云是三维数据,将三维数据压缩到到二维投影,以减少三维激光雷达数据的高计算量,但在此过程中通常会造成信息丢失。
25.为了解决上述问题,本技术实施例提供了一种三维目标检测方法实施例,具体地,采用未过滤的原始点云,更加准确地反映待检测目标的空间位置;由于原始点云分布的不规则性,通过对原始点云中第一待检测点进行归一化处理,避免了进一步的量化误差;针对目标检测过程中可能存在的尺寸模糊问题,通过对不同类别的目标设置不同的锚点,细化目标检测结果的预测值。
26.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
27.图1是根据本技术实施例的一种可选的三维目标检测方法的流程示意图,如图1所示,该方法至少包括步骤s102-s108,其中:
步骤s102,获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点。
28.可选地,可以采用激光雷达、3d相机获等方式获取待检测目标所在三维候选区域内的原始点云,其中,激光雷达可以精确测量传感器与障碍物之间的距离信息,同时提供丰富的几何信息、形状和比例信息,因此优选方式为激光雷达。
29.获取的原始点云可以反映最准确的位置信息,往往点云只能反映其中多个第一待检测点的特征,而忽略了多个第一待检测点之间的间距,间距编码了基本信息,例如待检测目标的比例,从而造成预测值的量化误差。
30.为此,本技术实施例可以通过步骤s104-s108得到细化后的预测值。
31.步骤s104,将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点。
32.可选地,以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得到多个第二待检测点。
33.具体地,为了通过提高目标检测的召回率以及检测精度,可以扩大三维候选区域边界框的长度和宽度。另外,由于第一待检测点的坐标是以待检测目标的原始图像的像素值为基础,在目标检测时就需要提前确定待检测目标的尺寸,若对原始图像进行缩放,则无法精准确定待检测目标的尺寸信息,因此,本技术实施例中为了避免出现目标尺寸模糊的问题,将以待检测目标所在的三维目标区域的中心为原点,建立归一化坐标系,并将全局坐标系下的第一待检测点转换至归一化坐标系下,得到第二待检测点,其中,以航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴建立归一化坐标系。
34.步骤s106,对多个第二待检测点进行特征提取,得到原始点云的目标特征。
35.可选地,获取多个第二待检测点的多个目标子特征;基于多个目标子特征,确定原始点云的目标特征。
36.作为一种可选的实施方式,使用pointnet对多个第二待检测点进行特征提取,得到原始点云的目标特征。pointnet由三个全连接层的多层感知机(multiple layer perception,mlp)和用于特征聚合的最大池化算子组成。
37.其中,pointnet中的两个空间变换网络分别是:输入变换网络,用于对齐三维空间内的点云,简单理解为,改变位姿,使改变后的位姿更有利于分类,例如将待检测目标旋转到正面;以及特征变换网络,用于对提取的64维特征进行对齐,即在特征层面对点云进行转换。多层感知机是通过共享权重的卷积实现的,第一层卷积核大小是1*3(每个点的维度均为xyz),之后的每一层卷积核大小都是1*1,即特征提取层只是把每个点连接起来,经过两个空间变换网络和两个多层感知机之后,对每一个点提取512维特征,经过最大池化算子变成n*512的全局特征,再经过最后一个多层感知机得到256个类别的概率分数;最后将原始点云的目标特征输入两个分支,一个用于待检测目标的分类,即256*(c 1),另一个用于待检测目标的位姿回归,即256*7,其中,7表示7自由度,也就是三维坐标、尺寸以及旋转角。
38.具体地,如图2所示,为了消除尺寸模糊问题,对原始点云中的多个第一待检测点
进行归一化处理,并以归一化处理后的多个第二待检测点作为输入,其中,n表示第二待检测点的数量,3表示坐标的维度;输入数据通过多层感知机提取多个第二待检测点的目标子特征;在特征的各个维度上执行最大池化算子得到原始点云的目标特征。
39.步骤s108,基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
40.作为一种可选的实施方式,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
41.可选地,确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
42.例如,通过计算第二待检测点的交并比,将大于预设阈值的第二待检测点确定为正样本,小于预设阈值的第二待检测点确定为负样本,其中,针对不同类别的目标设置不同的预设阈值,预设阈值的设置可以根据实际情况自行设定。通过pointnet输出预测的原始点云所属的目标类别的概率,通过分类损失函数计算分类损失,分类损失函数可以为交叉熵损失函数,其表达式如下:其中,b为原始点云中的全部第二待检测点的数量,为待检测目标的真实类别,为pointnet输出预测的原始点云所属的目标类别的概率。越小,不确定性越小,则说明分类结果越好。
43.需要说明的是,可以依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
44.可选地,依据第二待检测点的位姿坐标,计算目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,其中,位姿坐标包括:位姿信息、尺寸信息和方向信息;基于目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,计算目标特征的回归损失;依据回归损失,确定待检测目标的目标位姿。
45.例如,针对正样本来说,首先将第一待检测点的位姿坐标,并将第一待检测点的位姿坐标转换至归一化坐标系下,得到第二待检测点的位姿坐标其中,上述归一化变换可以通过如下公式表示:通过回归损失函数计算目标尺寸的回归损失:通过回归损失函数计算目标位置的回归损失:
具体地,确定通过公式计算待检测目标在原始方向和翻转方向上的最小残差,依据最小残差确定目标方向的回归损失,其中,当时,;当时,。
46.经过上述计算目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,目标特征的回归损失可以通过回归损失函数计算,其中,回归损失函数可以是稳定的smooth l1,其中,最后,依据目标特征的回归损失,确定待检测目标的目标位姿。
47.也可以也通过分类损失和回归损失加权平均确定整体的损失函数:其中,和为加权参数,具体可根据实际情况自行设定。整体的损失函数的计算值越小,说明真实值与预测值的不一致程度越小,即预测值更接近真实值。
48.在本技术实施例中,获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。其中,由于原始点云分布的不规则性,通过对原始点云中第一待检测点进行归一化处理,避免了进一步的量化误差,从而解决了由于相关技术无法准确判断候选区域,导致出现目标尺寸不确定性技术问题。
49.实施例2根据本技术实施例,还提供了一种用于实现上述三维目标检测方法的三维目标检测装置,如图3所示,该装置至少包括获取模块31,处理模块32,提取模块33和确定模块34,其中:获取模块31,用于获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包含多个第一待检测点。
50.可选地,可以采用激光雷达、3d相机获等方式获取待检测目标所在三维候选区域内的原始点云,其中,激光雷达可以精确测量传感器与障碍物之间的距离信息,同时提供丰富的几何信息、形状和比例信息,因此优选方式为激光雷达。
51.获取的原始点云可以反映最准确的位置信息,往往点云只能反映其中多个第一待检测点的特征,而忽略了多个第一待检测点之间的间距,间距编码了基本信息,例如待检测目标的比例,从而造成预测值的量化误差。
52.为此,本技术实施例可以通过下面处理模块32、提取模块33和确定模块34得到细化后的预测值。
53.处理模块32,用于将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点。
54.可选地,以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得到多个第二待检测点。
55.具体地,为了通过提高目标检测的召回率以及检测精度,可以扩大三维候选区域边界框的长度和宽度。另外,由于第一待检测点的坐标是以待检测目标的原始图像的像素值为基础,在目标检测时就需要提前确定待检测目标的尺寸,若对原始图像进行缩放,则无法精准确定待检测目标的尺寸信息,因此,本技术实施例中为了避免出现目标尺寸模糊的问题,将以待检测目标所在的三维目标区域的中心为原点,建立归一化坐标系,并将全局坐标系下的第一待检测点转换至归一化坐标系下,得到第二待检测点,其中,以航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴建立归一化坐标系。
56.提取模块33,用于对多个第二待检测点进行特征提取,得到原始点云的目标特征。
57.选地,获取多个第二待检测点的多个目标子特征;基于多个目标子特征,确定原始点云的目标特征。
58.作为一种可选的实施方式,使用pointnet对多个第二待检测点进行特征提取,得到原始点云的目标特征。pointnet由三个全连接层的多层感知机(multiple layer perception,mlp)和用于特征聚合的最大池化算子组成。
59.其中,pointnet中的两个空间变换网络分别是:输入变换网络,用于对齐三维空间内的点云,简单理解为,改变位姿,使改变后的位姿更有利于分类,例如将待检测目标旋转到正面;以及特征变换网络,用于对提取的64维特征进行对齐,即在特征层面对点云进行转换。多层感知机是通过共享权重的卷积实现的,第一层卷积核大小是1*3(每个点的维度均为xyz),之后的每一层卷积核大小都是1*1,即特征提取层只是把每个点连接起来,经过两个空间变换网络和两个多层感知机之后,对每一个点提取1024维特征,经过最大池化算子变成1*1024的全局特征,再经过最后一个多层感知机得到k个类别的概率分数;最后将原始点云的目标特征输入两个分支,一个用于待检测目标的分类,另一个用于待检测目标的位姿回归。
60.确定模块34,用于基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
61.作为一种可选的实施方式,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
62.可选地,确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
63.需要说明的是,可以依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
64.可选地,依据第二待检测点的位姿坐标,计算目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,其中,位姿坐标包括:位姿信息、尺寸信息和方向信息;基于目标尺寸的回归损失、目标位置的回归损失和目标方向的回归损失,计算目标特征的回归损失;依据回归损失,确定待检测目标的目标位姿。
65.需要说明的是,本技术实施例中的三维目标检测装置中的各模块与实施例1中的三维目标检测方法的各实施步骤一一对应,由于实施例1中已经进行了详尽的描述,本实施例中部分未体现的细节可以参考实施例1,在此不再过多赘述。
66.实施例3根据本技术实施例,还提供了一种非易失性存储介质,该非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行实施例1中的三维目标检测方法。
67.可选地,非易失性存储介质所在设备控制计算机程序执行实现以下步骤:获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
68.可选地,以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得到多个第二待检测点。
69.作为一种可选的实施方式,使用pointnet对多个第二待检测点进行特征提取,得到原始点云的目标特征。pointnet由三个全连接层的多层感知机(multiple layer perception,mlp)和用于特征聚合的最大池化算子组成。
70.作为一种可选的实施方式,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
71.可选地,确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
72.可选地,依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
73.实施例4根据本技术实施例,还提供了一种处理器,该处理器用于运行程序,其中,所述程序运行时执行实施例1中的三维目标检测方法。
74.可选地,在程序运行时控制非易失性存储介质所在设备执行实现以下步骤:获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
75.可选地,以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得
到多个第二待检测点。
76.作为一种可选的实施方式,使用pointnet对多个第二待检测点进行特征提取,得到原始点云的目标特征。pointnet由三个全连接层的多层感知机(multiple layer perception,mlp)和用于特征聚合的最大池化算子组成。
77.作为一种可选的实施方式,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
78.可选地,确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
79.可选地,依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
80.实施例5根据本技术实施例,还提供了一种电子设备,该电子设备包括:存储器和处理器,其中,存储器中存储有计算机程序,处理器被配置为通过计算机程序执行实施例1中的三维目标检测方法。
81.可选地,在程序运行时控制非易失性存储介质所在设备执行实现以下步骤:获取待检测目标所在三维候选区域内的原始点云,其中,原始点云中包括多个第一待检测点;将三维候选区域范围内的多个第一待检测点进行归一化处理,得到多个第二待检测点;对多个第二待检测点进行特征提取,得到原始点云的目标特征;基于目标特征,确定待检测目标的目标检测结果,其中,目标检测结果中包括待检测目标的目标类别和目标位姿。
82.可选地,以三维候选区域的中心为原点,航向方向为x轴,与航向方向水平正交方向为y轴,垂直方向为z轴,建立归一化坐标系,并对多个第一待检测点进行归一化处理,得到多个第二待检测点。
83.作为一种可选的实施方式,使用pointnet对多个第二待检测点进行特征提取,得到原始点云的目标特征。pointnet由三个全连接层的多层感知机(multiple layer perception,mlp)和用于特征聚合的最大池化算子组成。
84.作为一种可选的实施方式,基于分类损失函数计算目标特征的分类损失,确定待检测目标的目标类别;基于回归损失函数计算目标特征的回归损失,确定待检测目标的目标位姿;依据目标类别和目标位姿,确定待检测目标的目标检测结果。
85.可选地,确定原始点云中的正样本数量,其中,正样本为交并比大于预设阈值的第二待检测点;采用概率预估模型确定原始点云所属的目标类别的概率;基于正样本数量和概率,计算目标特征的分类损失;依据分类损失,确定待检测目标的目标类别。
86.可选地,依据待检测目标的目标类别,确定与目标类别对应的目标锚点。
87.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
88.在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
89.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或
者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
90.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
91.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
92.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
93.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献