一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度图像的目标检测方法和装置与流程

2022-12-06 23:11:53 来源:中国专利 TAG:


1.本技术属于目标检测技术领域,尤其涉及一种基于深度图像的目标检测方法和装置。


背景技术:

2.随着基于红外(infrared radiation,ir)图像与rgb图像的人脸信息在不能充分保护用户隐私方面的劣势日益凸显,基于深度图像的人脸识别越来越受到青睐。基于深度图像的人脸识别是一种基于人的脸部深度特征信息进行身份识别的生物识别技术,由于其与红外图像及rgb图像相比更能保护用户隐私,使其引起了广泛的研究兴趣。
3.现有技术中,在使用神经网络模型对深度图像进行人脸检测时,通常会对其进行归一化处理使其满足模型的输入,但该归一化操作会将人脸压的太扁,从而无法达到很好的检测效果,甚至会出现误检,将手、杯子等误检为人脸,或者造成漏检,从而造成不好的用户体验。因此,如何提高基于深度图像的目标检测的准确度是一个重要课题。


技术实现要素:

4.本技术实施例提供了一种基于深度图像的目标检测方法和装置,可以解决应用深度图像进行目标检测的准确度不高的技术问题,达到了提高目标检测的准确度的技术效果。
5.第一方面,本技术实施例提供了一种基于深度图像的目标检测方法,该方法包括:获取深度图像;根据不同深度值范围将多个像素分别对应地划分到多个目标通道中,使得每个目标通道可对应地包括多个目标像素;基于各目标通道的深度值范围对所述目标像素进行归一化处理,得到每个目标通道中多个目标像素分别对应的目标值;根据每个目标通道中多个目标像素分别对应的目标值提取每个目标通道的目标特征,并基于每个目标通道的特征得到检测结果。
6.本技术实施例能够根据深度图像的各个像素在不同深度范围内的分布信息、以及深度图像的多个深度范围内的多个像素的深度目标特征,提高对深度图像中的目标检测的准确度。
7.在第一方面的一种可能的实现方式中,基于各目标通道的深度值范围对所述目标像素进行归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值,包括:通过如下公式对每个目标通道归一化处理:
[0008][0009]
其中,t表示目标通道中的目标像素归一化后对应的目标值,d表示目标像素的深度值,range
min
表示目标通道的深度值范围的下边界值,range
max
表示目标通道的深度值范围的上边界值。在该实现方式中,通过对每个目标通道中的多个像素进行归一化,得到每个目标通道中的多个像素的目标值,进而便于后续进行特征提取和目标检测。
[0010]
在第一方面的一种可能的实现方式中,根据不同深度值范围将所述多个像素分别对应地划分到多个目标通道中,包括:如果多个像素中的第一像素的深度值小于不同的深度值范围中的最小深度值,则将第一像素的深度值确定为最小深度值,并将第一像素划分到最小深度值对应的目标通道中;如果多个像素中的第一像素的深度值大于不同的深度值范围中的最大深度值,则将第一像素的深度值确定为最大深度值,并将第一像素划分到最大深度值对应的目标通道中。在该实现方式中,通过将对目标检测的贡献度不大的像素的深度值进行调整,以去除冗余像素的影响,进一步地提高了对目标检测的准确度。
[0011]
在第一方面的一种可能的实现方式中,深度图像通过深度相机获取,不同的深度值范围中的最小深度值为深度相机的标称检测范围的最小值,不同的深度值范围中的最大深度值为深度相机的标称检测范围的最大值。在该实现方式中,通过将深度值大于深度相机的标称检测范围的最大值的像素进行调整,并通过将深度值小于深度相机的标称检测范围的最小值的像素进行调整,提高了本技术实施例的目标检测方法与深度相机的适应性,提高了目标检测的准确度。
[0012]
在第一方面的一种可能的实现方式中,根据不同深度值范围将多个像素分别对应地划分到多个目标通道中,包括:如果多个像素中的第一像素的深度值大于或等于多个目标通道中的一目标通道对应的深度值范围的下边界值,且第一像素的深度值小于该目标通道对应的深度值范围的上边界值,则将第一像素划分到该目标通道中。在该实现方式中,实现了将深度相机中的多个像素划分到多个通道中的目的。
[0013]
在第一方面的一种可能的实现方式中,根据每个目标通道中包括的多个目标像素分别对应的目标值,提取每个目标通道的特征,包括:利用backbone网络对所述每个目标通道多个目标像素分别对应的目标值进行特征提取,得到所述每个目标通道的目标特征。在该实现方式中,通过backbone网络能够实现对目标的轻量化检测,提高了检测速度和效率。
[0014]
第二方面,本技术实施例提供了一种装置,该装置包括图像获取单元,用于获取深度图像,其中,深度图像包括多个像素;像素划分单元,用于根据不同的深度值范围将深度图像中的多个像素对应地划分到多个目标通道中;归一化单元,用于对每个目标通道归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值;目标检测单元,用于根据每个目标通道中包括的多个目标像素分别对应的目标值提取每个目标通道的特征,并基于每个目标通道的特征得到检测结果。通过本技术实施例所述的装置,能够提高对深度图像的目标检测精度。
[0015]
第三方面,本技术实施例提供了一种电子设备,该设备包括处理器和存储器,存储器用于存储计算机指令,其中,处理器能够执行存储器存储的计算机程序时完成如第一方面中任一项的方法。
[0016]
第四方面,本技术实施例提供了一种计算机存储介质,计算机存储介质存储计算机指令,计算机指令执行时完成如第一方面中任一项的方法。
[0017]
可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
[0018]
本技术实施例与现有技术相比存在的有益效果是:本技术实施例能够根据深度图像的各个像素在不同深度范围内的分布信息、以及深度图像在多个深度范围内的多个像素的深度特征,提高对深度图像中的目标检测的准确度。
附图说明
[0019]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]
图1是本技术提供的一种深度相机的应用环境示意图;
[0021]
图2是本技术实施例中提供的一例深度图像的目标检测方法的流程示意图;
[0022]
图3是本技术实施例提供的一例将多个像素分别划分到多个目标通道中的示意图;
[0023]
图4是本技术实施例中的一例深度图像的像素深度值分布情况的示意图;
[0024]
图5是本技术实施例中提供的一例提取深度图像的特征的神经网络的结构示意图;
[0025]
图6是本技术实施例中提供的一种通过神经网络提取深度图像的特征进行目标检测的方法的流程示意图;
[0026]
图7是本技术实施例中提供的一种用于目标检测的装置的示意图;
[0027]
图8是本技术实施例中提供的一种电子设备的示意图。
具体实施方式
[0028]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
[0029]
应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0030]
还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0031]
如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0032]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0033]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0034]
深度图像(depth images)上不同位置的像素的值表示的是环境中景物的表面到相机的物理距离,因此深度图像也被称为距离影像(range images),深度图像上某个像素的值也可以称为该像素的深度值。深度图像可以通过深度相机(3d camera)采集,可以反映出环境中景物的表面到相机的物理距离。
[0035]
图1为根据本技术提供的一种深度相机的具体应用环境示意图,该深度相机包括采集端110及处理器120。在一个实施例中,采集端包括发射模组和接收模组,其中,发射模组用于向待检测目标130发射光信号,接收模组用于接收经待检测目标130反射回的光信号并传输至处理器120,处理器120根据反射回的光信号生成待检测目标的深度图像并利用本技术提供的一个或多个实施例的目标检测方法对待检测目标进行目标检测。另外,深度相机还可包括输出接口,用于向外部设备传输深度图像。需要说明的是,处理器120可根据结构光原理或飞行时间原理生成对应的深度图像,此处不作限制。
[0036]
具体地,假设深度相机所采集到的深度图像中所有像素的最大深度值为dmax,待检测目标130上有点a,深度相机110采集到待检测目标130上的点a,待检测目标220上的点a在深度图像中对应的像素为a’,深度图像中的像素为a’对应深度值da。
[0037]
对深度图像进行目标检测时,不同的深度图像中的待检测目标往往具有不同的深度值范围或由于深度值太大,所以需要对深度图像进行归一化处理再进行目标检测以减少计算量。例如,如图1所示的,深度相机110采集到的深度图像中有像素a,对像素a进行归一化处理通过公式(1)进行:
[0038][0039]
其中,ta表示深度图像中像素a经过归一化处理后的目标值,da表示像素a的深度值,dmax表示深度图像中所有像素的最大深度值。
[0040]
通过公式(1)能够得到像素a经过归一化处理后的目标值,通过对深度图像中的所有像素进行归一化处理,能够得到深度图像中的所有像素的目标值,然后根据深度图像中的所有像素的目标值提取深度图像的特征,进而根据提取到的深度图像的特征进行目标检测。
[0041]
公式(1)所示的深度图像的归一化处理方式,实际得到的深度图像的所有像素的目标值是深度图像中所有像素的深度值分别与深度图像的最大深度值的比值。但是,在对不同的深度图像进行目标检测时,不同的深度图像的深度值的最大值可能不同,对于不同的深度图像中对应不同深度值的像素,按照公式(1)所示的深度图像的归一化处理方式处理时,得到的不同的深度图像中不同像素的深度值分别与不同像素各自所对应的深度图像的最大深度值的比值可能相同。
[0042]
同样地,对于不同深度图像中的多个像素,可能仍然出现不同的深度图像中不同像素对应的深度值分别与不同像素各自所对应的深度图像的最大深度值的比值相同或者相近的情况,这就导致对不同深度图像提取特征并进行目标检测时,可能得到相同的目标检测结果,导致检测结果与实际的不同的深度图像的图像内容不相符,产生误检。
[0043]
例如,对不同的第一深度图像和第二深度图像进行目标检测时,就可能发生误检。在第一深度图像中,第一深度图像中所有像素的最大深度值dmax为50mm,第一深度图像中的像素a的深度值da为10mm,第一深度图像中的像素a经过公式(1)所示的归一化处理方式
得到目标值ta为0.2;在第二深度图像中,第二深度图像中所有像素的最大深度值dmax为1000mm,第二深度图像中的像素b的深度值db为200mm,第二深度图像中的像素b经过公式(1)所示的归一化处理方式得到的目标值tb为0.2。可见,对于第一深度图像和第二深度图像,第一深度图像中的像素a和第二深度图像中的像素b,像素a和像素b分别对应不同深度值和不同最大深度值时,对像素a和像素b通过公式(1)所示的归一化处理得到的目标值相同。
[0044]
同样地,对于第一深度图像和第二深度图像中的多个像素,这多个像素通过公式(1)所示的归一化处理得到的目标值可能相同或者相近,导致后续根据第一深度图像和第二深度图像中的多个像素的目标值进行目标检测时,对第一深度图像和第二深度图像得到的检测结果也相同或者相近,这与第一深度图像和第二深度图像是不同深度图像的实际情况不符,导致误检。
[0045]
例如,在实际应用中,通过公式(1)所示的归一化处理方式利用深度图像进行人脸识别时,会将手、杯子等物体误检为人脸,降低了用户体验。
[0046]
有鉴于此,本技术实施例提供了一种深度图像的目标检测方法,在处理器120对多张深度图像进行目标检测时,可将每张深度图像的所有像素根据不同深度值范围对应地划分到多个通道中,其中,每张深度图像的每个通道包括多个像素;对每张深度图像的每个通道中的多个像素根据每个通道的深度值范围进行归一化处理,得到每张深度图像的每个通道中的多个像素分别对应的目标值;分别对每张深度图像的各通道中的多个像素分别对应的目标值提取特征,得到每张深度图像的各通道分别对应的特征;根据每张深度图像的各通道分别对应的特征进行目标检测。与现有技术相比,本技术在对不同的深度图像进行目标检测时,可针对性地根据不同的深度图像的多个像素在不同的深度值范围中的不同分布特征、以及各个通道中的多个像素的特征进行目标检测,有效地避免了不同深度图像在进行目标检测时发生误检的情况,且可去除冗余像素的影响,减少计算量并提高了对深度图像进行目标检测的准确度。
[0047]
在一些场景中,本技术实施例的深度图像的目标检测方法可以应用于活体识别、身体姿态识别或人脸识别中,通过本技术实施例中的深度图像的目标检测方法对包含活体、人脸或身体姿态的深度图像进行目标检测,能够提高在对活体、人脸或身体姿态识别的识别精度。
[0048]
在另一些场景中,本技术实施例的深度图像的目标检测方法可以应用于工业目标(例如货物)的目标检测中,通过本技术实施例中的深度图像的目标检测方法对包含工业目标的深度图像进行目标检测,能够提高对工业目标进行检测的识别精度。
[0049]
图2是本技术实施例中提供的一种基于深度图像的目标检测方法的流程示意图,该方法具体包括:
[0050]
s210、获取深度图像,深度图像包括多个像素。
[0051]
其中,深度图像可以通过深度相机进行拍摄采集获取,深度图像包括多个像素,一个像素对应一个深度值,不同的像素的深度值可以相同,也可以不同,本技术实施例对此不作限制。
[0052]
在深度图像中,像素的深度值表示拍摄获取深度图像时像素对应的深度,像素对应的深度指像素被采集时深度相机到被采集深度图像的前景的物理距离。在深度图像中,
像素的深度值也被称为像素值。
[0053]
s220、根据不同的深度值范围将深度图像中的多个像素对应地划分到多个目标通道中。
[0054]
在一些实现方式中,为了提高后续对深度图像进行目标检测的效果,设置多个目标通道,每个目标通道包括多个目标像素,不同的目标通道对应不同的深度值范围,进而能够提取多个目标通道分别对应的特征,以使后续可以根据深度图像的多个像素在不同深度值范围中的分布特征、以及多个目标通道内的多个像素的深度值特征进行目标检测,提高了对深度图像的目标检测效果。
[0055]
应理解的是,将深度图像中的多个像素分别划分到多个目标通道中,包括了获取深度图像的多个像素在多个目标通道(对应不同深度范围)中的分布情况,通过获取深度图像的多个像素在多个目标通道(对应不同深度范围)中的分布情况,能够提高对目标检测的准确度。
[0056]
图3是本技术实施例提供的一例将多个像素分别划分到多个目标通道中的示意图,本实施例以三个通道进行举例说明。多个像素可以根据深度值的不同分别划分到第一通道、第二通道和第三通道中,第一通道、第二通道和第三通道为目标通道,第一通道、第二通道和第三通道分别包括多个像素,第一通道、第二通道和第三通道中的多个像素分别对应不同的深度值范围。
[0057]
如图3所示的,对于不同的深度图像,可以根据不同的深度图像的多个像素的深度值,将不同深度图像的多个像素分别划分到第一通道、第二通道和第三通道中,因此,不同深度图像的多个像素在第一通道、第二通道和第三通道中的分布特征能够表征不同深度图像的特征,在进行目标检测时,可以根据不同深度图像的多个像素在第一通道、第二通道和第三通道中的分布特征、以及第一通道、第二通道和第三通道内的多个像素的深度值特征对深度图像进行目标检测。
[0058]
例如,对第一深度图像和第二深度图像进行特征识别时,可以根据第一深度图像和第二深度图像分别在第一通道、第二通道和第三通道中的像素的分布特征,并根据第一深度图像和第二深度图像的第一通道、第二通道和第三通道内的多个像素的深度值特征对图像进行目标检测,提高目标检测的精度。
[0059]
s230、基于各目标通道的深度值范围对所述目标像素进行归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值。
[0060]
为了后续对每个目标通道提取特征,可以通过对每个目标通道归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值,进而便于后续根据每个目标通道中包括的多个目标像素分别对应的目标值提取每个通道的特征,进而根据每个通道的特征进行目标检测,提高检测精度。
[0061]
应理解的是,得到的每个目标通道中包括的多个目标像素分别对应的目标值,包括了得到深度图像的多个像素在每个目标通道中的分布情况、以及每个目标通道中的多个目标像素分别对应的目标值,便于通过后续过程中根据每个目标通道中包括的多个目标像素的分布情况、以及多个目标像素分别对应的目标值对深度图像进行目标检测。
[0062]
应理解的是,在s210至s230中,多个目标通道可以包括至少两个目标通道,目标通道的具体数量可以根据实际的目标检测需要进行选择,本技术实施例对目标通道的数量不
作限制。例如,目标通道的数量可以为2个、3个、4个或者5个。
[0063]
应理解的是,不同的目标通道对应的不同的深度值范围,具体的深度值范围可以根据实际需要进行选择,本技术实施例对具体的深度值范围也不作限制。例如,在目标通道的数量为3个时,3个目标通道的深度值范围可以分别为300mm至700mm、700mm至1100mm和1100mm至1100mm。又例如,在目标通道的数量为3个时,3个目标通道的深度值范围可以分别为400mm至800mm、800mm至1200mm和1200mm至1600mm。
[0064]
应理解的是,不同的目标通道对应的不同的深度值范围的区间长度是否相等,可以根据实际需要进行选择,本技术实施例对各个目标通道对应的不同的深度值范围的区间长度是否相等不作限制。例如,不同的目标通道对应的不同的深度值范围的区间长度可以分别为200mm、300mm、400mm或者500mm。
[0065]
应理解是,不同的目标通道对应的不同的深度值范围,不同的深度值范围之间的区间是否为连续区间也可以根据实际需要进行选择,本技术实施例对不同的深度值范围之间的区间是否为连续区间不作限制。例如,不同的目标通道的深度值范围可以分别为200mm至500mm、550mm至850mm和900mm至1300mm。
[0066]
在一些实施例中,基于各目标通道的深度值范围对所述目标像素进行归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值,可以通过公式(2)对每个目标通道归一化处理:
[0067][0068]
其中,t表示目标通道中的目标像素对应的第一目标值,d表示目标像素的深度值,rangemin表示所述目标通道的深度值范围的下边界值,rangemax表示所述目标通道的深度值范围的上边界值。
[0069]
例如,对于像素a,像素a的深度值为450mm,像素a的深度值范围为300mm至700mm,通过公式(2)计算得到的像素a的目标值为95.625。
[0070]
在一些实施例中,为了适应不同的目标检测任务和目标检测场景,可以在将多个像素分别划分到多个目标通道中时,存在一些对深度图像的目标检测的贡献度不大的像素,例如深度值小于不同的深度值范围中的最小深度值的像素,或者深度值大于不同的深度值范围中的最大深度值的像素,因此,可以对这一部分对深度图像的目标检测的贡献度不大的像素进行处理,以去除冗余像素的影响,减少计算量且可提高对深度图像的目标检测准确度。
[0071]
在一些实现方式中,可以对这些深度图像的目标检测的贡献度不大的像素的深度值进行调整,以进一步地提高对深度图像的目标检测准确度。
[0072]
在一些实现方式中,可以对这些深度图像的目标检测的贡献度不大的像素的深度值进行如下调整:如果多个像素中的第一像素的深度值小于不同的深度值范围中的最小深度值,则将第一像素的深度值确定为最小深度值,并将第一像素划分到最小深度值对应的目标通道中。
[0073]
例如,图4是本技术实施例中的一例深度图像的像素深度值分布情况的示意图,第一通道的深度值范围为r1至r2,第二通道的深度值范围为r2至r3,第三通道的深度值范围为r3至r4,第一通道、第二通道和第三通道的深度值范围中的最小深度值为r1,可以通过将
多个像素中的深度值小于r1的像素的深度值均设置为r1,以实现将对深度图像的目标检测的贡献度不大的深度范围中的像素舍弃,去除了冗余像素的影响并提高了对深度图像的目标检测的精度。
[0074]
在一些实现方式中,可以对这些深度图像的目标检测的贡献度不大的像素的深度值进行如下调整:如果多个像素中的第一像素的深度值大于不同的深度值范围中的最大深度值,则将第一像素的深度值确定为最大深度值,并将第一像素划分到最大深度值对应的目标通道中。
[0075]
例如,如图4所示,第一通道、第二通道和第三通道的深度值范围中的最大深度值为r4,可以通过将多个像素中的深度值大于r4的像素的深度值均设置为r4,以实现将对深度图像的目标检测的贡献度不大的深度范围中的像素舍弃,去除了冗余像素的影响并提高对深度图像的目标检测的精度。
[0076]
深度相机的标称检测范围的最大值是深度相机所采集到的像素的深度值较准确的深度值范围的上限,因此,在深度图像中的像素的深度值超过深度相机的标称检测范围的最大值时,将会对深度图像的目标检测结果产生负面影响,所以为了获取对深度图像的最佳检测结果,可对产生负面影响的像素进行处理。
[0077]
在一些实施例中,可以在对通过深度相机获取的深度图像进行目标检测时,将不同的深度值范围中的最大深度值设置为深度相机的标称检测范围的最大值,然后对各个通道对深度图像进行目标检测,进而实现将将深度值超过深度相机的标称检测范围的最大值的像素进行调整,避免对深度图像的目标检测结果的准确度产生影响。
[0078]
例如,多个目标通道的深度值范围中的最大深度值为r4,深度相机的标称检测范围的最大值为1600mm,则可以将目标通道的深度值范围中的最大深度值r4设置为深度相机的标称检测范围的最大值1600mm,以提高深度图像的目标检测结果的准确度。
[0079]
同理地,在一些实现方式中,可以将不同的深度值范围中的最小深度值为深度相机的标称检测范围的最小值,进而实现将将深度值小于深度相机的标称检测范围的最小值的像素进行调整,避免对深度图像的目标检测结果的准确度产生影响。
[0080]
作为一种可能的实现方式,在s220中将根据不同深度值范围将多个像素分别对应地划分到多个目标通道中时,可以通过如下方式进行:如果多个像素中的第一像素的深度值大于或等于多个目标通道中的第一目标通道对应的深度值范围的下边界值,且第一像素的深度值小于第一目标通道对应的深度值范围的上边界值,则将第一像素划分到第一目标通道中。
[0081]
例如,第一像素的深度值为850mm、第一目标通道对应的深度值范围为700mm至1100mm时,由于第一像素的深度值850mm大于第一目标通道对应的深度值范围的下边界值700mm,且第一像素的深度值850mm小于第一目标通道对应的深度值范围的上边界值1100mm,则将第一像素划分到第一目标通道中。
[0082]
又例如,第一像素的深度值为700mm、第一目标通道对应的深度值范围为700mm至1100mm时,由于第一像素的深度值700mm等于第一目标通道对应的深度值范围的下边界值700mm,则将第一像素划分到第一目标通道中。
[0083]
在一些实施例中,为了得到深度图像的目标检测结果,本技术实施例提供的深度图像的目标检测方法还包括通过神经网络提取深度图像的特征进行目标检测。
[0084]
在对s210至s220得到的深度图像的每个目标通道中的多个像素的目标值以后,可以通过神经网络提取深度图像的多个像素在多个目标通道的分布特征、以及深度图像的每个目标通道中的多个像素的目标值对应的特征。图5是本技术实施例中提供的一例提取深度图像的特征的神经网络的结构示意图,该网络包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层、第一输出层、第二输出层、第三输出层、第四输出层,不同的深度图像的多个像素在不同的深度值范围(即目标通道)中的不同分布数据、以及各个目标通道中的多个像素的目标值输入到神经网络中,得到输出结果,并能够实现对深度图像的目标检测。
[0085]
具体地,第一卷积层、第二卷积层及第三卷积层串联连接,分别用于提取深度图像的特征信息在第一输出层、第二输出层及第三输出层依次可得到第一特征信息、第二特征信息及第三特征信息,其中,第一特征信息、第二特征信息和第三特征信息的尺寸是不同的,分别对应了低、中、高三个维度的特征信息;利用第五卷积层、第六卷积层及第七卷积层分别对第一特征信息及第二特征信息进行降采样处理得到第四特征信息及第五特征信息,以使得低、中两个维度的特征图的尺寸与高维度尺寸相同;将第三特征信息、第四特征信息和第五特征信息输入第四卷积层以进行特征融合,在通道维度上进行拼接处理得到融合特征信息,并根据融合特征信息确定目标置信度,从而得到人脸检测结果。
[0086]
例如,在人脸检测时,通过神经网络最后的输出结果包括包含人脸的矩形框、以及矩形框上的类别,输出结果在矩形框上标识出的置信度,置信度表示该矩形框为人脸的概率。
[0087]
图6是本技术实施例中提供的一种通过神经网络提取深度图像的特征进行目标检测的方法的流程示意图,该方法包括s210至s250,其中,s210至s230与本技术实施例中上述的方法中的s210至s230相同,这里不再赘述。进一步地,s240至s250具体包括:
[0088]
s240、根据每个目标通道中多个目标像素分别对应的目标值,提取每个目标通道的目标特征。
[0089]
每个目标通道中包括的多个目标像素,包含了深度图像的多个像素在多个目标通道中的分布特征,结合每个目标通道中包括的多个目标像素分别对应的目标值,能够得到提取得到每个目标通道的目标特征,以便于后续根据提取每个目标通道的目标特征进行目标检测。需要说明的是,目标特征可为前景特征或采集前景的关键点特征,此处不作限制。
[0090]
s250、根据每个目标通道的目标特征,得到检测结果。
[0091]
在一些实现方式中,可以通过如图5所示的神经网络结构得到检测结果。
[0092]
在一些实现方式中,在s240中,可以使用backbone网络,根据每个目标通道中包括的多个目标像素分别对应的目标值,提取每个目标通道的特征。backbone网络是指神经卷积模型的主干网络,backbone网络具有轻量化的优点,通过backbone网络能够方便、快速的提取深度图像的特征,得到对深度图像进行目标检测的结果。
[0093]
本技术实施例还提供了一种用于目标检测的装置,该装置包括执行上述的各个方法实施例中的步骤的单元或者模块。图7是本技术实施例中提供的一种用于目标检测的装置的示意图,装置700包括图像获取单元710、像素划分单元720、归一化单元730及目标检测单元740,其中,图像获取单元710,用于获取深度图像,其中,深度图像包括多个像素;像素划分单元720,用于根据不同的深度值范围将深度图像中的多个像素对应地划分到多个目
标通道中;归一化单元730,用于基于各目标通道的深度值范围对所述目标像素进行归一化处理,得到每个目标通道中包括的多个目标像素分别对应的目标值;目标检测单元740,用于根据每个目标通道中包括的多个目标像素分别对应的目标值提取每个目标通道的特征,并基于每个目标通道的特征得到检测结果。通过本技术实施例所述的装置,能够提高对深度图像的目标检测精度。
[0094]
本技术实施例还提供了一种电子设备,包括处理器和存储器,所述存储器用于存储计算机指令,处理器能够执行存储器存储的计算机程序时完成本技术实施例中任一项所述的方法。需要说明的是,该电子设备可以为深度相机、门锁系统、刷脸支付系统、手机、平板电脑、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本、个人数字助理(personal digital assistant,pda)等电子设备。
[0095]
在一个实施例中,电子设备还包括采集装置,用于采集目标的深度图像并传输至所述处理器,以供处理器执行存储器存储的计算机程序时完成本技术实施例中任一项所述的方法。需要说明的是,采集装置可通过有线或无线的方式与处理器连接或与处理器一体化设置构成深度相机,采集装置可为结构光相机、飞行时间相机、双目相机或多目相机中的任意一种,此处不作限制。
[0096]
在一个实施例中,处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0097]
在一个实施例中,存储器在一些实施例中可以是电子设备的内部存储单元,例如电子设备的硬盘或内存。所述存储器在另一些实施例中也可以是所述终端设备800的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(boot loader)、数据以及其他程序等,例如所述计算机程序的程序代码等。存储器820还可以用于暂时地存储已经输出或者将要输出的数据。
[0098]
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0099]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统
中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0100]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0101]
在一个实施例中,集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/电子设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。
[0102]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0103]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献