一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于目标概率密度图的端到端目标检测方法与流程

2022-11-13 11:52:47 来源:中国专利 TAG:

技术特征:
1.一种基于目标概率密度图的端到端目标检测方法,其特征在于,包括以下步骤:步骤1:生成待检测图像的目标概率密度图;步骤2:基于所述目标概率密度图,获取所述待检测图像中的小目标区域的中心点和宽高;步骤3:基于所述小目标区域的中心点和宽高,通过仿射变换,截取小目标区域;步骤4:对所述小目标区域进行目标检测,输出目标类型和位置。2.根据权利要求1所述的方法,其特征在于,若所述步骤2中待检测图像中没有小目标,则输入新的图像作为待检测图像,重新执行步骤1至步骤2,直至待检测图像中存在小目标;所述步骤4还包括:用单阶段检测网络对所述待检测图像进行目标检测,输出检测到的目标类型和位置。3.根据权利要求1所述的方法,其特征在于,所述目标概率密度图为:3.根据权利要求1所述的方法,其特征在于,所述目标概率密度图为:其中,σ
i
为高斯函数标准差,x
k
是目标的中心,δ(x-x
k
)表示密度点,表示高斯核,δ(x-x
k
)与卷积得到目标概率密度图d(x),k=1,2,...,n表示目标的序号;i,j分别表示第i个种类及第i个种类中的第j个目标,h
i
和w
i
分别表示第i个种类目标的平均高和宽,h
ij
和w
ij
分别表示第i个种类第j个目标的平均高和宽,η用来平衡种类的总体尺寸和个体尺寸对滤波参数σ的贡献度。4.根据权利要求3所述的方法,其特征在于,所述步骤1通过损失函数对待检测图像中的背景区域进行惩罚:的背景区域进行惩罚:and其中,loss
density
为神经网络的损失函数,i=1,2,...,n表示输入图像的序号,j=0,1,...,m
i
表示输入的第i张图像的背景像素点序号,d(x
i
;θ)表示输入x
i
的目标概率密度图,θ表示目标概率密度图生成模型的参数,d
i
(j)=0表示生成的第i张目标概率密度图的第j个像素点为背景点,β是惩罚项系数,w和h表示目标概率密度图的宽和高,因此背景点越多,惩罚系数β越大。5.根据权利要求1所述的方法,其特征在于,所述步骤2包括:步骤21:使用滑动窗口对目标概率密度图进行不重叠遍历,将滑动窗口中的像素值与预设阈值进行比较,基于比较的结果对滑动窗口中的像素值进行赋值;步骤22:对经过赋值后的目标概率密度图进行聚类;步骤23:采用重心法,计算聚类后的每个目标区域的重心。6.根据权利要求5所述的方法,其特征在于,所述步骤21包括:在训练过程中滑动窗口的尺寸取所有目标尺寸的平均值,将每个滑动窗口中的像素平
均值m与预先设置的阈值threshold比较,m若小于threshold则该滑动窗口中的所有像素值置0,否则置为m。7.根据权利要求6所述的方法,其特征在于,所述步骤22包括:使用dbscan算法对阈值处理之后的目标概率密度图中不为0的区域进行聚类,若滑动窗口的尺寸为w
s
×
h
s
,则聚类扫描的半径为2
×
max(w
s
,h
s
),聚类后归为一类的区域表示一个待分割的目标区域;所述步骤23包括:对聚类后的每个目标区域r使用重心法计算出重心(x
c
,y
c
)。8.根据权利要求7所述的方法,其特征在于,所述重心(x
c
,y
c
)的计算公式为:)的计算公式为:其中,d
ij
表示r中的概率密度值,即目标概率密度图的像素值;若目标区域r的尺寸为w
×
h,则计算公式为:h,则计算公式为:重心(x
c
,y
c
)变成新区域的中心,最后得出待裁剪的区域r=(x
c
,y
c
,w,h),r中的参数对d
ij
可导。9.根据权利要求1所述的方法,其特征在于,所述步骤3包括:采用仿射变换进行目标区域截取,待截取的区域r的坐标表示为(x
o
,y
o
),截取后的目标区域坐标表示为(x
t
,y
t
),仿射变换为:x
t
=0,1,...,w-1y
t
=0,1,...,h-1在仿射变换中,只有(x
o
,y
o
)是未知的,目标区域的坐标和变换矩阵都是已知的,能够通过仿射变换建立起目标概率密度图待裁剪区域与裁剪之后的目标区域的解析表示,从而使得训练过程的可导变得连续。10.根据权利要求9所述的方法,其特征在于,(x
t
,y
t
)均是整数坐标,进行逆变换得到的(x
o
,y
o
)并非都是整数,需要通过双线性插值来获得逆变换后的待检测图像的坐标对应的像素值。

技术总结
本发明公开了一种基于目标概率密度图的端到端目标检测方法,包括以下步骤:生成待检测图像的目标概率密度图;基于所述目标概率密度图,获取所述待检测图像中的小目标区域的中心点和宽高;基于所述小目标区域的中心点和宽高,通过仿射变换,截取小目标区域;对所述小目标区域进行目标检测,输出目标类型和位置。本发明利用仿射变换进行目标区域的截取,可实现神经网络的端到端训练,大大简化了网络训练的流程和网络的结构,端到端的网络可使模型从原始输入到最终输出,给模型更多可以根据数据自动调节的空间,增加模型的整体契合度;本发明能够在不降低大目标检测准确率的前提下,减少小目标的漏检率和误检率。小目标的漏检率和误检率。小目标的漏检率和误检率。


技术研发人员:黄凯 李波 李君惠 王彦成 廖育富 何聪 冯东阳
受保护的技术使用者:四川九洲空管科技有限责任公司
技术研发日:2022.08.17
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献