一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种结合可学习注意力机制的人群计数方法

2023-07-22 15:09:10 来源:中国专利 TAG:

技术特征:
1.一种结合可学习注意力机制的人群计数方法,其特征在于,采集目标区域的图像以及真实点阵图,通过执行以下步骤,训练获得可学习注意力机制网络模型,并基于该模型获得目标区域的预测密度分布图,进而获得目标区域的最终人群计数图;步骤1:获取目标区域的图像以及目标区域的真实点阵图;步骤2:对目标区域的图像进行预处理后构建数据集,将数据集按比例划分为训练集和测试集;步骤3:将目标区域的真实点阵图经过高斯核的卷积后,输入自注意力模块,生成目标区域的真实密度分布图;步骤4:初始化可学习注意力机制网络模型参数,将训练集中的图像作为输入,目标区域的预测密度分布图作为输出,通过比较目标区域的预测密度分布图与真实密度分布图之间的误差,训练可学习注意力机制网络模型,并通过测试集测试模型精度,获得训练完成的可学习注意力机制网络模型;步骤5:基于可学习注意力机制网络模型获得目标区域的预测密度分布图,使用损失函数联合训练预测密度分布图和真实密度分布图,得到最终人群计数图。2.根据权利要求1所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤2中,所述对目标区域的图像进行预处理为采用填充边缘处理将其转化为统一大小的格式,对图像依次进行裁剪、水平翻转和亮度调节。3.根据权利要求1所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤4中,所述可学习注意力机制网络模型采用vgg-19作为卷积神经网络骨干网络,该网络在imagenet上进行预训练,采用lra替换关注模块,回归解码器由一个上采样层和三个具有激活relu功能的卷积层组成,前两层的核尺寸为3
×
3,后一层的核大小为1
×
1,超参数中训练学习率lr设置为5e-7,权重衰减weight_decay设置为1e-4。4.根据权利要求1或3所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤4中,所述训练可学习注意力机制网络模型具体包括如下步骤:步骤41:提取目标区域图像的局部特征;步骤42:基于可学习注意力模块确定每个特征位置所关注的局部区域;步骤43:采用密度图细化框架对密度图细化进行训练和细化,输出特征与可学习区域注意传输到变压器编码器;步骤44:经过解码器解码后,得到目标区域的预测密度图。5.根据权利要求4所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤41中,提取目标区域图像的局部特征f∈rc
×
w
×
h,其中c、w和h分别是通道、宽度和高度,然后将局部特征图展平。6.根据权利要求4所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤42中,可学习注意力模块具体结构如下:首先确定位置p=(x
p
,y
p
),其中0≤x
p
<w,0≤y
p
<h,标注点位置预测如下:<h,标注点位置预测如下:
给定两个预测顶点左下(b1)和右上(ur):对于特定特征,b=(x
b
,y
b
),u=(x
u
,y
u
),其过滤区域通过以下公式计算:两个滤波区域的乘积表示为:当采用全球注意力时,r表示为全1矩阵。7.根据权利要求4所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤43中,所述密度图细化框架联合细化密度图并从细化密度图训练计数器,让(x
i
,y
i
)作为第i张图像和传统密度图对,将f(x
i
)表示为图像x
i
的预测密度图,g(y
i
)作为y
i
的细化密度图,对f(x
i
)和g(y
i
)使用组合损失联合训练,α表示接近0的小数;训练损失函数如下:使用注意力模块将其传输到变压器编码器,以学习不同尺度的特征f

;利用回归解码器从f

预测最终密度图d∈rw
′×
h

。8.根据权利要求7所述一种结合可学习注意力机制的人群计数方法,其特征在于,所述编码器层数t设置为4。9.根据权利要求1所述一种结合可学习注意力机制的人群计数方法,其特征在于,步骤5中,所述损失函数l如下其中,是计数器预测密度图,m
i
是的真实密度图,和m
i

是向量化版本的和m
i
,是两个向量之间的余弦相似性;其中ε=10-8,使用余弦相似性对密度图进行空间正则化,标准化向量和m
i

/||m
i

||2表示人群的空间分布。

技术总结
本发明公开了一种结合可学习注意力机制的人群计数方法,包括:1、获取目标区域的图像以及真实点阵图;2、对目标区域的图像进行预处理;3、生成真实密度分布图;4、初始化可学习注意力机制网络模型参数,将训练集中的图像作为输入,目标区域的预测密度分布图作为输出,通过比较目标区域的预测密度分布图与真实密度分布图之间的误差,训练可学习注意力机制网络模型,并通过测试集测试模型精度,获得训练完成的可学习注意力机制网络模型。本发明可以解决人群计数网络模型在尺度变化和人头位置偏差的问题,同时更能适应场景中的尺度变化。同时更能适应场景中的尺度变化。同时更能适应场景中的尺度变化。


技术研发人员:杨敏 王冷迪
受保护的技术使用者:南京邮电大学
技术研发日:2023.03.24
技术公布日:2023/7/21
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表