一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种目标检测方法和装置与流程

2022-06-02 17:09:40 来源:中国专利 TAG:


1.本发明涉及图像处理技术领域,尤其涉及一种目标检测方法和装置。


背景技术:

2.随着目标检测技术的需求不断增大,目标检测的准确性受到广泛关注。以人形目标为例,为了准确率的提升,现有的人形检测方法不仅使用行人特征检测,还使用了行人的身体组成部分的特征,例如半身特征以及头部特征等等。利用分类器检测行人的多个身体组成部分,利用身体组成部分与人体全身的位置关系筛选人体,最终输出人体目标检测结果。
3.然而,发明人发现现有技术至少存在如下问题:现有技术中用于检测身体组成部分或人体全身的分类器的输出得分,与身体组成部分相对于全身的位置关系的物理意义不同,两者之间没有较为有效的融合方式,只能依靠人为经验进行判定,使得行人检测结果的精准性不高。


技术实现要素:

4.本发明实施例的目的是提供一种目标检测方法和装置,能够有效结合目标的不同检测对象间的位置关系的出现概率和检测对象位置信息的判别概率,准确定位出目标整体的位置,从而提高对目标整体的检测精度。
5.为实现上述目的,本发明实施例提供了一种目标检测方法,包括:
6.获取原始图像的不同检测对象的位置信息和判别概率;其中,所述不同检测对象包括目标整体以及构成所述目标整体的至少一组成部分;
7.根据每一所述检测对象的位置信息和判别概率,遍历得到所有的检测对象位置关系组合;其中,所述检测对象位置关系组合由任意两个不同检测对象的位置信息组成;
8.根据预先构建的概率模型,计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率;
9.判断每一所述检测对象位置关系组合所对应的两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件;
10.当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。
11.作为上述方案的改进,所述概率模型通过以下方式构建得到:
12.获取训练数据集;其中,所述训练数据集包括若干张已预先标注了检测对象矩形框的样本图像,所述检测对象矩形框包括与所述目标整体对应的目标矩形框,以及与所述目标整体的至少一组成部分对应的子目标矩形框;
13.将所有所述目标矩形框内的图像按照预设的尺度大小进行尺寸归一化;
14.根据归一化后的目标矩形框,确定所述目标矩形框及其对应的子目标矩形框的位置信息;
15.根据每一样本图像中任意两个所述检测对象矩形框的位置信息,计算所述训练数据集中任意两个检测对象间的位置关系的出现概率,以构建得到所述概率模型。
16.作为上述方案的改进,所述根据每一样本图像中任意两个所述检测对象矩形框的位置信息,计算所述训练数据集中任意两个检测对象间的位置关系的出现概率,具体包括:
17.根据同一样本图像中第n检测对象矩形框和第m检测对象矩形框的位置信息,通过以下计算公式,计算所述第n检测对象矩形框和第m检测对象矩形框所对应的两个检测对象间的位置关系的出现概率:
[0018][0019]
q=(x
n,k-x
m,k
,y
n,k-y
m,k
);
[0020]
其中,(x
n,k
,y
n,k
)为所述第n检测对象矩形框的位置信息,(x
m,k
,y
m,k
)为所述第m检测对象矩形框的位置信息,k为所述训练数据集中的样本图像的数量;k
q,m,n
为所述训练数据集中第n检测对象矩形框相对于第m检测对象矩形框出现在位置q的样本图像数量,n=1,2,

,c;m=1,2,

,c;且n≠m;c为所述样本图像中标注的检测对象矩形框的数量。
[0021]
作为上述方案的改进,所述预设的阈值条件为:所述检测对象位置关系组合所对应的两个检测对象的判别概率中至少一判别概率大于预设的第一概率阈值,且所述两个检测对象间的位置关系的出现概率大于预设的第二概率阈值,且所述两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率之和大于预设的第三概率阈值。
[0022]
作为上述方案的改进,所述当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息,具体包括:
[0023]
当满足预设的阈值条件时,
[0024]
若所述检测对象位置关系组合所对应的两个检测对象中存在一检测对象为所述目标整体,获取所述目标整体的位置信息;
[0025]
若所述检测对象位置关系组合所对应的两个检测对象中不存在一检测对象为所述目标整体,根据所述两个检测对象的位置关系计算所述目标整体的位置信息。
[0026]
作为上述方案的改进,所述获取原始图像的不同检测对象的位置信息和判别概率,具体包括:
[0027]
获取原始图像,并对所述原始图像进行特征提取;
[0028]
将所述原始图像的特征分别输入预先训练好的不同的分类器,以得到每一分类器检测的检测对象的位置信息和判别概率;其中,不同的分类器用于检测不同检测对象的位置信息和判别概率。
[0029]
作为上述方案的改进,用于检测所述目标整体的分类器通过以下方式训练得到:
[0030]
获取训练数据集;其中,所述训练数据集包括若干张已预先标注了检测对象矩形框的样本图像,所述检测对象矩形框包括与目标整体对应的目标矩形框;
[0031]
将所有所述目标矩形框内的图像按照预设的尺度大小进行尺寸归一化;
[0032]
对归一化后的所述目标矩形框内的图像进行特征提取,并利用提取的特征训练分类器,以得到所述用于检测所述目标整体的分类器。
[0033]
作为上述方案的改进,所述检测对象矩形框还包括与所述目标整体的至少一组成部分对应的子目标矩形框;
[0034]
则,用于检测同一类别的组成部分的分类器通过以下方式训练得到:
[0035]
根据归一化后的所述目标矩形框,获取所述目标矩形框对应的子目标矩形框的尺寸大小;
[0036]
根据所述训练数据集中所有同一类别的组成部分对应的子目标矩形框的尺寸大小,计算所述同一类别的组成部分的归一化尺度大小,并对所有同一类别的组成部分对应的子目标矩形框内的图像按照所述归一化尺度大小进行尺寸归一化;
[0037]
对归一化后的所述子目标矩形框内的图像进行特征提取,并利用提取的特征训练分类器,以得到所述用于检测同一类别的组成部分的分类器。
[0038]
作为上述方案的改进,在所述当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息之后,所述方法还包括:
[0039]
对获取到的所有所述目标整体的位置信息进行筛选,以得到满足预设条件的目标整体的位置信息。
[0040]
作为上述方案的改进,所述对获取到的所有所述目标整体的位置信息进行筛选,以得到满足预设条件的目标整体的位置信息,具体包括:
[0041]
采用非极大值抑制处理方法,对检测到的所有所述目标整体的位置信息进行筛选,以得到满足预设条件的目标整体的位置信息。
[0042]
作为上述方案的改进,在所述获取原始图像的不同检测对象的位置信息和判别概率之前,还包括:
[0043]
获取原始图像,并将所述原始图像缩放至不同尺度大小;
[0044]
则,依次对所述不同尺度大小的原始图像,执行:获取原始图像的不同检测对象的位置信息和判别概率。
[0045]
本发明实施例还提供了一种目标检测装置,包括:
[0046]
检测对象检测模块,用于获取原始图像的不同检测对象的位置信息和判别概率;其中,所述不同检测对象包括所述目标整体以及构成所述目标整体的至少一组成部分;
[0047]
位置关系组合获取模块,用于根据每一所述检测对象的位置信息和判别概率,遍历得到所有的检测对象位置关系组合;其中,所述检测对象位置关系组合由任意两个不同检测对象的位置信息组成;
[0048]
概率计算模块,用于根据预先构建的概率模型,计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率;
[0049]
阈值条件判断模块,用于判断每一所述检测对象位置关系组合所对应的两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件;
[0050]
目标位置获取模块,用于当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。
[0051]
本发明实施例还提供了一种目标检测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的目标检测方法。
[0052]
与现有技术相比,本发明公开的一种目标检测方法和装置,通过获取原始图像的不同检测对象的位置信息和判别概率,并计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率,判断每一所述检测对象位置关系组合所对应的两个
检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件,当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。本发明实施例在进行目标检测的过程中,考虑了不同检测对象间的位置关系,并使用概率的方式对不同检测对象间的位置关系进行表征。由于不同检测对象间的位置关系表征为概率,检测对象的位置信息也表征为概率,更容易对两个概率进行解释和阈值判断,结合检测对象的判别概率和出现概率对目标整体的位置信息进行检测,能够更加准确地定位出目标整体的位置,从而提高对目标整体的检测精度。
附图说明
[0053]
图1是本发明实施例一提供的一种目标检测方法的步骤示意图;
[0054]
图2是本发明实施例二提供的概率模型的训练步骤示意图;
[0055]
图3是本发明实施例三提供的检测目标整体的分类器的训练步骤示意图;
[0056]
图4是本发明实施例三提供的检测目标整体的组成部分的分类器的训练步骤示意图;
[0057]
图5是本发明实施例四提供的另一种目标检测方法的步骤示意图;
[0058]
图6是本发明实施例五提供的一种目标检测装置的结构示意图;
[0059]
图7是本发明实施例六提供的另一种目标检测装置的结构示意图。
具体实施方式
[0060]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0061]
参见图1,是本发明实施例一提供的一种目标检测方法的步骤示意图。本发明实施例一提供了一种目标检测方法,具体通过步骤s11至s15执行:
[0062]
s11、获取原始图像的不同检测对象的位置信息和判别概率;其中,所述不同检测对象包括目标整体以及构成所述目标整体的至少一组成部分。
[0063]
需要说明的是,所述原始图像中包含至少一目标整体,并且,所述目标整体由若干个部件组成。所述目标整体所划分的多个部件可以根据所述目标整体的类型和结构预先设定。
[0064]
示例性地,以行人作为目标整体为例,行人目标即为本方法所要检测并最终输出的所述目标整体,构成所述目标整体的组成部分可以包括:头部、左臂、右臂、身体、左腿和右腿。
[0065]
可以理解地,上述场景仅作为举例,为了提高检测精度,还可以进一步划分出左肩膀、右肩膀、左手、右手、左脚、右脚等组成部分,在此不做具体限定。
[0066]
示例性地,以汽车作为目标整体为例,汽车目标即为本方法所要检测并最终输出的所述目标整体,构成所述目标整体的组成部分可以包括:车轮、车窗、车门等等。
[0067]
可以理解地,上述场景仅作为举例,在实际应用中,还可以根据检测需求将汽车的组成部分进行更细致的划分,在此不做具体限定。
[0068]
在本发明实施例中,对所述原始图像的每一检测对象(目标整体和其组成部分)进行检测和计算,得到每一检测对象对应的多个位置信息q和判别概率p
cls
的组合。其中,所述位置信息指的是所述检测对象在原始图像中的定位,例如坐标信息。所述判别概率指的是所述检测对象在所述原始图像中位于某一位置的概率值。
[0069]
一般情况下,当所述检测对象在所述原始图像中位于某一位置的概率值大于预设阈值,例如75%时,认为该位置信息为所述检测对象的确定位置。
[0070]
需要说明的是,计算所述检测对象的位置信息和判别概率的方法可以采用现有技术中的检测方法,例如采用预先训练好的用于检测位置信息和判别概率的神经网络模型等,在此不做具体限定。
[0071]
为方便解释说明,此处以行人作为目标整体为例,获取行人目标位于位置a的判别概率为p
cls
1,位于位置b的判别概率为p
cls
2,位于位置c的判别概率为p
cls
3;以及行人目标的至少一组成成分,例如头部和身体,其中头部位于位置d的判别概率为p
cls
4,位于位置e的判别概率为p
cls
5;身体位于位置f的判别概率为p
cls
6,位于位置g的判别概率为p
cls
7等等。
[0072]
s12、根据每一所述检测对象的位置信息和判别概率,遍历得到所有的检测对象位置关系组合;其中,所述检测对象位置关系组合由任意两个不同检测对象的位置信息组成。
[0073]
根据步骤s11获得的每一检测对象的多个位置信息和对应的判别概率,以其中任意两个不同检测对象的某一位置信息,组成所述检测对象位置关系组合。
[0074]
作为举例,取行人目标和该行人的头部作为所述两个不同检测对象,得到的检测对象位置关系组合为:位置a和位置d、位置a和位置e、位置b和位置d、位置b和位置e、位置c和位置d、位置c和位置e这六个组合。同理得到取行人目标和该行人的身体作为所述两个不同检测对象所对应的检测对象位置关系组合,以及取行人目标头部和身体作为所述两个不同检测对象所对应的检测对象位置关系组合等等。
[0075]
s13、根据预先构建的概率模型,计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率。
[0076]
预先构建一概率模型,用于计算检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率p
pos
。所述出现概率p
pos
用于表征所述检测对象位置关系组合中,第一个检测对象相对于第二个检测对象出现在位置q的概率。所述位置q指的是两个检测对象之间的相对位置。
[0077]
一般而言,两个检测对象间的位置关系的出现概率越高,表明这两个检测对象的相对位置关系越正常,那么,这两个检测对象所构成的目标整体的所对应的位置信息,越接近最终所要检测的目标位置。
[0078]
具体地,将所述检测对象位置关系组合中的两个检测对象的位置信息输入所述概率模型进行计算分析,得到两个检测对象间的位置关系的出现概率。
[0079]
s14、判断每一所述检测对象位置关系组合所对应的两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件。
[0080]
具体地,对根据前面步骤得到的检测对象的判别概率p
cls
,以及两个不同检测对象之间的位置关系的出现概率p
pos
,进行相应的阈值条件判断,从而获得符合阈值条件的检测对象位置关系组合,进而确定该检测对象位置关系组合所对应的目标整体的位置信息,从而定位得到在所述原始图像上所要检测的目标整体的确定位置。
[0081]
优选地,所述预设的阈值条件为:所述检测对象位置关系组合所对应的两个检测对象的判别概率中至少一判别概率大于预设的第一概率阈值,且所述两个检测对象间的位置关系的出现概率大于预设的第二概率阈值,且所述两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率之和大于预设的第三概率阈值。
[0082]
在本发明实施例中,遍历每一所述检测对象关系组合,得到两个检测对象i和j的判别概率和所述两个检测对象间的位置关系的出现概率,记为p
cls
i(pi)、p
cls
j(pj)、p
pos
(pj-pi,i,j),将所有的i,j取值获得的p
cls
i(pi)、p
cls
j(pj)、p
pos
(pj-pi,i,j)记为集合r,根据集合r对目标进行分类。将该种操作定义为op,分类为待检测的目标整体则输出为1,否则为0。其中,pi为第i检测对象的位置信息,pj为第j检测对象的位置信息。
[0083]
为了方便解释说明,将第0个检测对象记为目标整体本身,当op(r)为1时,返回p0即可作为目标整体的位置。
[0084]
这里以行人目标为第0个检测对象,头部为第1个检测对象,则:
[0085]
op(r)=op(pa,pb,pc)=op(p
cls
0(p0)、p
cls
1(p1)、p
pos
(p1-p0,0,1));
[0086]
当op(r)满足:pa或pb大于低于概率阈值p1_thresh,且pc大于第二概率阈值p2_thresh,且pa pb pc大于第三概率阈值p3_thresh,则表明该检测对象关系组合满足预设的阈值条件。
[0087]
s15、当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。
[0088]
具体地,当所述存在某一检测对象关系组合满足所述预设的阈值条件时,若所述检测对象位置关系组合所对应的两个检测对象中存在一检测对象为所述目标整体,获取所述目标整体的位置信息;若所述检测对象位置关系组合所对应的两个检测对象中不存在一检测对象为所述目标整体,根据所述两个检测对象的位置关系计算所述目标整体的位置信息。
[0089]
作为举例,当所述检测对象关系组合中包括行人目标整体时,其对应的位置信息p0即为最终检测得到的目标位置;当所述检测对象关系组合中不包括行人目标整体,例如是头部和身体时,根据头部和身体对应的位置信息,确定所述行人目标的位置信息,得到最终检测得到的目标位置。
[0090]
本发明实施例一提供了一种目标检测方法,通过获取原始图像的不同检测对象的位置信息和判别概率,并计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率,判断每一所述检测对象位置关系组合所对应的两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件,当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。本发明实施例在进行目标检测的过程中,考虑了不同检测对象间的位置关系,并使用概率的方式对不同检测对象间的位置关系进行表征。由于不同检测对象间的位置关系表征为概率,检测对象的位置信息也表征为概率,更容易对两个概率进行解释和阈值判断,结合检测对象的判别概率和出现概率对目标整体的位置信息进行检测,能够更加准确地定位出目标整体的位置,从而提高对目标整体的检测精度。
[0091]
参见图2,是本发明实施例二提供的概率模型的训练步骤示意图。本发明实施例二提供了一种目标检测方法,在实施例一的基础上进一步实施。在本发明实施例中,步骤s13
中的概率模型通过以下步骤s21至s24构建得到:
[0092]
s21、获取训练数据集;其中,所述训练数据集包括若干张已预先标注了检测对象矩形框的样本图像,所述检测对象矩形框包括与所述目标整体对应的目标矩形框,以及与所述目标整体的至少一组成部分对应的子目标矩形框。
[0093]
s22、将所有所述目标矩形框内的图像按照预设的尺度大小进行尺寸归一化。
[0094]
s23、根据归一化后的目标矩形框,确定所述目标矩形框及其对应的子目标矩形框的位置信息。
[0095]
s24、根据每一样本图像中任意两个所述检测对象矩形框的位置信息,计算所述训练数据集中任意两个检测对象间的位置关系的出现概率,以构建得到所述概率模型。
[0096]
具体地,获取若干张包含一目标的样本图像,并在所述若干张样本图像上进行检测对象矩形框的标注,包括目标整体对应的目标矩形框,以及构成所述目标整体的至少一组成部分对应的子目标矩形框。
[0097]
以行人作为目标整体为例,所述若干张样本图像上都包括行人目标,在每一样本图像上标注所述行人目标对应的目标矩形框,以及构成所述行人的至少一组成部分,例如头部、左臂、右臂、身体、左腿和右腿等对应的子目标矩形框。
[0098]
进一步地,将所述若干张样本图像中的所有目标矩形框内的图像进行归一化处理,尺寸归一化后目标矩形框内的图像宽高为(normal_width,normal_height)。
[0099]
可以理解地,由于对目标整体的尺寸进行了归一化,每一目标整体对应的组成部分的矩形框,即子目标矩形框的尺寸也相应发生了变化,归一化后第k个样本图像中的第i个子目标矩形框宽高标注为(part_width
i,k
,part_height
i,k
),中心位置标注为(x
i,k
,y
i,k
)。其中,k∈k,k为所述样本图像的数量,i∈c,c为不同类型的检测对象的数量,也即一目标整体所对应的组成部分的数量再加上该目标整体的总数量。例如,设置行人目标的组成部分为头部、左臂、右臂、身体、左腿和右腿的情况下,c的值为7。
[0100]
进一步地,根据同一样本图像中第n检测对象矩形框和第m检测对象矩形框的位置信息,通过以下计算公式,计算所述第n检测对象矩形框和第m检测对象矩形框所对应的两个检测对象间的位置关系的出现概率:
[0101][0102]
q=(x
n,k-x
m,k
,y
n,k-y
m,k
);
[0103]
其中,(x
n,k
,y
n,k
)为所述第n检测对象矩形框的位置信息,(x
m,k
,y
m,k
)为所述第m检测对象矩形框的位置信息,k为所述训练数据集中的样本图像的数量;k
q,m,n
为所述训练数据集中第n检测对象矩形框相对于第m检测对象矩形框出现在位置q的样本图像数量,n=1,2,

,c;m=1,2,

,c;且n≠m;c为所述样本图像中标注的检测对象矩形框的数量。
[0104]
针对每一样本图像中的任意两个检测对象,均采用上述方法进行相对位置关系的出现概率的计算,建立不同的检测对象之间的相对位置关系q与出现概率p
pos
的映射关系,从而构建得到所述概率模型。
[0105]
从而,在应用阶段,也即在步骤s13中,通过所述概率模型,根据所述检测对象关系组合中两个检测对象的位置信息,计算两者的相对位置关系(位置q),即可得到对应的两个检测对象间的位置关系的出现概率。
[0106]
采用本发明实施例的技术手段,通过获取若干已标注的样本图像进行所述概率模型的训练,训练过程简便有效。
[0107]
作为优选的实施方式,本发明实施例三提供了一种目标检测方法,在实施例一或实施例二的基础上进一步实施。在本发明实施例垂死,所述步骤s11,也即获取原始图像的不同检测对象的位置信息和判别概率,具体通过步骤s111至s112执行:
[0108]
s111、获取原始图像,并对所述原始图像进行特征提取。
[0109]
s112、将所述原始图像的特征分别输入预先训练好的不同的分类器,以得到每一分类器检测的检测对象的位置信息和判别概率;其中,不同的分类器用于检测不同检测对象的位置信息和判别概率。
[0110]
具体地,根据所述原始图像上的每一像素值,对所述原始图像进行特征图(feature map)的计算,以获取到所述原始图像的待检测的特征图。对所述特征图进行特征提取,得到该特征图的特征向量,进而,将所述特征向量分别输入预先训练好的不同的分类器,以得到每一分类器检测的检测对象的位置信息和判别概率。
[0111]
所述不同的分类器为预先训练好的,用于检测不同的检测对象。某一检测对象对应的分类器通过对输入的特征向量进行分析计算,即可输出该检测对象的位置信息和对应的判别概率。
[0112]
作为优选的实施方式,参见图3,是本发明实施例三提供的检测目标整体的分类器的训练步骤示意图。用于检测所述目标整体的分类器c0通过以下步骤s31至s33训练得到:
[0113]
s31、获取训练数据集;其中,所述训练数据集包括若干张已预先标注了检测对象矩形框的样本图像,所述检测对象矩形框包括与目标整体对应的目标矩形框;
[0114]
s32、将所有所述目标矩形框内的图像按照预设的尺度大小进行尺寸归一化;
[0115]
s33、对归一化后的所述目标矩形框内的图像进行特征提取,并利用提取的特征训练分类器,以得到所述用于检测所述目标整体的分类器。
[0116]
具体地,获取若干张包含一目标的样本图像,并在所述若干张样本图像上进行检测对象矩形框的标注,包括目标整体对应的目标矩形框。
[0117]
以行人作为目标整体为例,所述若干张样本图像上都包括行人目标,在每一样本图像上标注所述行人目标对应的目标矩形框,将所述若干张样本图像中的所有目标矩形框内的图像进行归一化处理,尺寸归一化后目标矩形框内的图像宽高为(normal_width,normal_height)。
[0118]
作为举例,将所述目标矩形框的大小缩放至同一尺寸32
×
32大小。
[0119]
进一步地,根据所述归一化后的所述目标矩形框内的图像上的每一像素值,对所述目标矩形框内的图像进行特征图的计算,再对所述特征图进行特征提取,得到该特征图的特征向量,进而,将所述特征向量分别输入预设的分类器,对所述分类器进行训练。
[0120]
优选地,为了提高所述分类器的训练精度,可以将所述目标矩形框内的图像当作正样本图像,并获取若干不含有目标整体的图像区域,作为负样本图像,计算每一负样本图像的特征向量,一并输入所述分类器中,从而实现对所述分类器的训练。
[0121]
示例性地,可以使用神经网络作为分类器,根据所述分类器输出的预测值和真实的矩形框位置,计算损失函数,采用梯度下降优化算法更新所述神经网络的参数,以降低所述损失函数,直到所述损失函数趋于最小化时,得到训练完成的分类器。其中。神经网络的
最后一层激活函数为sigmoid函数,损失函数为logisticloss,记为h(y,y’)。sigmoid函数和logisticloss的数学表达如下:
[0122][0123]
h(y,y

)=-y
·
log(y

)-(1-y)
·
log(1-y

);
[0124]
其中,y为实际的标签,y’为标签的预测值,x为神经网络最后一层的输入。完成神经网络的训练之后,神经网络的输出即y’可作为分类器的判别概率。
[0125]
进一步地,参见图4,是本发明实施例三提供的检测目标整体的组成部分的分类器的训练步骤示意图。所述检测对象矩形框还包括与所述目标整体的至少一组成部分对应的子目标矩形框,例如在上述以行人作为目标整体为例的场景中,还包括构成所述行人的至少一组成部分,例如头部、左臂、右臂、身体、左腿和右腿等对应的子目标矩形框。
[0126]
则,用于检测同一类别的组成部分的分类器ci通过以下步骤s31’至s33’训练得到:
[0127]
s31’、根据归一化后的所述目标矩形框,获取所述目标矩形框对应的子目标矩形框的尺寸大小。
[0128]
s32’、根据所述训练数据集中所有同一类别的组成部分对应的子目标矩形框的尺寸大小,计算所述同一类别的组成部分的归一化尺度大小,并对所有同一类别的组成部分对应的子目标矩形框内的图像按照所述归一化尺度大小进行尺寸归一化。
[0129]
s33’、对归一化后的所述子目标矩形框内的图像进行特征提取,并利用提取的特征训练分类器,以得到所述用于检测同一类别的组成部分的分类器。
[0130]
可以理解地,由于对目标整体的尺寸进行了归一化,每一目标整体对应的组成部分的矩形框,即子目标矩形框的尺寸也相应发生了变化,归一化后第k个样本图像中的第i个子目标矩形框宽高标注为(part_width
i,k
,part_height
i,k
),中心位置标注为(x
i,k
,y
i,k
)。其中,k∈k,k为所述样本图像的数量,i∈c,c为不同类型的检测对象的数量。
[0131]
进一步地,计算子目标矩形框的中心位置相对于目标矩形框的坐标,以及对应的宽高。对训练集中同一类别的组成部分对应的子目标矩形框(例如所有头部对应的矩形框,或所有身体对应的矩形框等)的宽高做平均取整,作为子目标矩形框的归一化尺度大小。所述归一化尺度大小对应的宽高计算如下:
[0132][0133][0134]
其中,ceil代表取整操作。
[0135]
进一步地,对归一化后的所述子目标矩形框内的图像进行特征提取,利用同一类别的组成部分所对应的子目标矩形框的特征进行分类器训练,以得到所述用于检测同一类别的组成部分的分类器。
[0136]
可以理解地,所述用于检测同一类别的组成部分的分类器的训练过程与用于检测
目标整体的分类器的训练过程相似,在此不做赘述。
[0137]
采用本发明实施例的技术手段,针对不同的检测对象,包括目标整体和多个组成部分进行不同的分类器训练,能够更准确地得到检测对象的位置信息,从而提高后续对目标整体的检测精度。
[0138]
作为优选的实施方式,本发明实施例在实施例一的基础上进一步实施。在步骤s15之后,所述目标检测方法还包括步骤s16:
[0139]
s16、对获取到的所有所述目标整体的位置信息进行筛选,以得到满足预设条件的目标整体的位置信息。
[0140]
优选地,为了提高目标物体的定位的准确性,采用非极大值抑制处理方法,对获取到的所有所述目标整体的位置信息进行筛选,以得到满足预设阈值条件的目标整体的位置信息。
[0141]
具体地,对获取到的所有所述目标整体对应的目标矩形框按照得分进行降序排序;依次遍历上述的降序排序后的目标框.将当前遍历的目标框与比当前剩余的目标框进行交集运算得到相应的相交点集合,并根据判断相交点集合组成的凸边形的面积,计算每两个目标框的交并比iou;对iou大于预设阈值的目标框进行滤除,保留iou小于设定阈值的目标框;从而得到最终的满足预设阈值条件的目标框。
[0142]
由于目标分类器根据输入的特征向量进行分类计算,对所述原始图像经过步骤s11至s15的目标检测操作之后,当判别概率满足阈值条件时,判定存在对应的目标框并输出,此时可能会得到不止一个目标整体的位置信息。在此情况下,可能存在目标分类器输出的目标框中的目标物不完整或代表性不高的情况,因此,在本发明实施例中,对目标分类器输出的所有目标框采用非极大值抑制的处理方法进行筛选,从而获得满足预设的阈值条件的目标框,作为最终能够准确定位目标物的目标框。
[0143]
在其他实施方式下,还可以采用其他后处理方式对得到的目标整体的目标框进行处理,例如,对相邻的两个互补的目标框进行拼接,以得到包括完整目标的目标框等,以进一步提高目标检测的精准性。在此不做具体限定。
[0144]
采用本发明实施例的技术手段,通过对满足阈值条件后获得的所有目标整体的位置信息进行进一步筛选,能够有效提高对目标整体的检测精度。
[0145]
参见图5,是本发明实施例四提供的另一种目标检测方法的步骤示意图。本发明实施例四在上述实施例三的基础上进一步实施,所述目标检测方法包括步骤s41至s46:
[0146]
s41、获取原始图像,并将所述原始图像缩放至不同尺度大小;
[0147]
s42、依次对所述不同尺度大小的原始图像,执行:获取原始图像的不同检测对象的位置信息和判别概率;其中,所述不同检测对象包括目标整体以及构成所述目标整体的至少一组成部分;
[0148]
s43、根据每一所述检测对象的位置信息和判别概率,遍历得到所有的检测对象位置关系组合;其中,所述检测对象位置关系组合由任意两个不同检测对象的位置信息组成;
[0149]
s44、根据预先构建的概率模型,计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率;
[0150]
s45、判断每一所述检测对象位置关系组合所对应的两个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件;
[0151]
s46、当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。
[0152]
在本发明实施例中,通过实施例三的训练方式训练得到的用于检测目标整体的位置信息和判别概率的分类器c0,只适用于检测一种尺度大小的检测对象,例如上述场景中提到的32
×
32尺寸大小的目标整体。基于此,为了能够全面地对所述原始图像上的不同尺度大小的目标物体进行检测,需要对所述原始图像进行多尺度检测。
[0153]
在一种实施方式下,如本发明实施例四所述,预先设置多个不同尺度大小,对所述原始图像进行所述多个尺度大小的缩放,得到不同尺度大小的原始图,并对每一尺度大小的原始图像,执行如实施例一所提供的目标检测方法。
[0154]
作为举例,通过对原始图像进行缩小,从而使得原始图像上的尺度大小为32
×
64像素值的目标整体,被缩放为尺度大小为16
×
32像素值的目标整体,从而,在使用上述实施例三训练得到的分类器c0和相应的组成部分的分类器ci进行检测之后,进一步结合位置关系的出现概率的判定,最终得到该目标整体对应的位置信息。
[0155]
在另一种实施方式下,为了减少计算量,可以直接获取所述原始图像的特征图,再对所述原始图像的特征图进行不同尺度大小的缩放和缩放后的细节处理操作,进一步地,依次对所述不同尺度大小的原始图像的特征图进行特征提取,并输入上述实施例三训练得到的分类器c0和相应的组成部分的分类器ci进行检测,从而实现对原始图像的多尺度检测。
[0156]
在又一种实施方式下,还可以预先训练不同尺度大小对应的分类器c0和ci。例如,分别训练用于检测尺度大小为32
×
64像素值的目标整体和尺度大小为16
×
32像素值的目标整体的分类器c0,以及对应尺度大小下的分类器ci。在目标检测过程中,直接对所述原始图像采用不同尺度大小的分类器进行目标检测,从而实现对原始图像的多尺度检测。
[0157]
可以理解地,上述实施方式仅作为举例,在实际应用中,可以根据实际情况采用上述方法对原始图像进行不同尺度大小的目标检测,也可以采用其他的处理方法对原始图像进行多尺度检测,均不影响本发明取得的有益效果。
[0158]
采用本发明实施例的技术手段,通过对原始图像进行多尺度的目标检测,从而更准确地定位得到所有目标整体的位置信息,提高对目标的检测精度。
[0159]
参见图6,是本发明实施例五提供的一种目标检测装置的结构示意图。本发明实施例五提供了一种目标检测装置50,包括检测对象检测模块51、位置关系组合获取模块52、概率计算模块53、阈值条件判断模块54和目标位置获取模块55;其中,
[0160]
所述检测对象检测模块51,用于获取原始图像的不同检测对象的位置信息和判别概率;其中,所述不同检测对象包括所述目标整体以及构成所述目标整体的至少一组成部分;
[0161]
所述位置关系组合获取模块52,用于根据每一所述检测对象的位置信息和判别概率,遍历得到所有的检测对象位置关系组合;其中,所述检测对象位置关系组合由任意两个不同检测对象的位置信息组成;
[0162]
所述概率计算模块53,用于根据预先构建的概率模型,计算每一所述检测对象位置关系组合所对应的两个检测对象间的位置关系的出现概率;
[0163]
所述阈值条件判断模块54,用于判断每一所述检测对象位置关系组合所对应的两
个检测对象的判别概率和所述两个检测对象间的位置关系的出现概率是否满足预设的阈值条件;
[0164]
所述目标位置获取模块55,用于当满足预设的阈值条件时,获取所述检测对象位置关系组合所对应的目标整体的位置信息。
[0165]
需要说明的是,本发明实施例五提供的一种目标检测装置用于执行上述实施例一至四任一实施例所提供的目标检测方法的所有流程步骤,两者的工作原理和有益效果一一对应,因而不再赘述。
[0166]
参见图7,是本发明实施例六提供的另一种目标检测装置的结构示意图。本发明实施例六提供的一种目标检测装置60,包括处理器61、存储器62以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例一至四任一实施例所提供的目标检测方法。
[0167]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。
[0168]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献