一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于全卷积的无分支结构目标检测方法与流程

2022-04-06 21:42:00 来源:中国专利 TAG:


1.本发明涉及模式识别与计算机视觉领域,具体涉及一种基于全卷积的无分支结构目标检测方法。


背景技术:

2.目标检测是与计算机视觉和图像处理相关的计算机技术,是许多计算机视觉任务的基础,现阶段的目标检测算法为了解决网络退化问题设计更深的网络模型,网络中加入了旁路分支,拓扑结构越来越复杂。复杂的拓扑结构会导致的模型内存效率较低,因为每个分支的结果都需要保留到加法或级联之后,显著提高了内存占用。相比之下,无分支结构中的结果在操作完成时立即释放。并且复杂的拓扑结构的优点都是针对训练阶段,在应用时去除掉一些复杂的结构可以提高检测速度,重点关注于如何保证在测试阶段模型的精度。


技术实现要素:

3.有鉴于此,本发明的目的在于提供一种基于全卷积的无分支结构目标检测方法,能够有效地减少边缘小目标的漏检,提高图像检测效率。
4.为实现上述目的,本发明采用如下技术方案:
5.一种基于全卷积的无分支结构目标检测方法,包括以下步骤:
6.步骤s1:获取目标检测数据集,并预处理,生成训练集;
7.步骤s2:构建可重参数化的多分支全卷积网络模型;
8.步骤s3:基于训练集对可重参数化的多分支全卷积网络模型进行训练,通过随机梯度下降方法,优化模型参数;
9.步骤s4:对训练好的多分支全卷积网络模型进行重参数化,构建无分支全卷积网络,作为推理模型;
10.步骤s5:将待测试图像输入推理模型进行测试。
11.进一步的,所述预处理具体为:对图像进行水平翻转和垂直翻转,图像翻转的概率设为0.5。
12.进一步的,所述步骤s2具体为:
13.步骤s21:使用resnet作为主干网络的centernet目标检测模型作为基线模型,对resnet的跳跃连接进行修改,一个resnet基本块中包含两种跳跃连接,一种是当前层输出和输入特征图的尺度相同,直接对两个图像进行相加融合,一种是当前层输出特征图和输入特征图的尺度不同,使用1
×
1卷积对输入特征图进行通道变换后再与输出特征相加融合获得下一层的输入;
14.当尺度匹配时加入1
×
1卷积分支,不匹配时加入3
×
3卷积分支,并且每一个分支在卷积操作后加上批量归一化;对于尺度匹配的连接,设输入特征图为f1,通过当前层的3
×
3卷积操作后输出值为f1(f1),设批量归一化操作为bn(x),表示对输入x进行批量归一化,则bn(f1)表示对特征图f1进行批量归一化,则下一层的输入特征图y1为:
15.y1=bn(g1(f1)) bn(f1(f1)) bn(f1)
16.其中g1(f1)是加入的1
×
1卷积分支的输出值,对于尺度匹不配的连接,设输入特征图为f2,通过当前层的3
×
3卷积操作后输出值为f2(f2),则下一层的输入特征图y2为:
17.y2=bn(g2(f2)) bn(f2(f2)) bn(h(f2))
18.其中g2(f2)是网络原来的1
×
1卷积分支的输出值,h(f2)是加入的3
×
3卷积分支的输出值;对每一个卷积操作加入分支结构,扩展为三个分支。
19.步骤s22:在步骤s21改进的resnet网络后加上eca注意力模块,将改进后的resnet网络获得的特征值送入eca注意力模块,构建可重参数化的多分支可重参数化的全卷积网络模型。
20.进一步的,所述步骤s3具体为:训练阶段使用随机初始化方法初始化网络参数,设置初始学习率设置为1.25e-2,每过5轮将学习率乘以0.9998,使用动量为0.9的随机梯度下降优化方法,通过最小化损失获得模型的最优参数,得到训练好的可重参数化的多分支可重参数化的全卷积网络模型。
21.进一步的,所述步骤s4具体为:
22.步骤s41:将训练好的可重参数化的多分支可重参数化的全卷积网络模型中每一个卷积操作扩展为三个分支,若网络中一共包含n个卷积层,那么扩展后网络包含3n个处理过程,推理模型需要将3n个处理过程通过重参数化的方法转化为n个处理过程;用c
in
表示卷积操作中的参数输入通道数,c
out
表示输出通道数,对于尺度匹配的连接,设用表示当前层主干3
×
3卷积的权值,则为加入的旁路1
×
1卷积的权值,μ、σ、γ、β为批量归一化层的累积均值、标准差、学习的缩放因子和偏差,f为输出特征图,w为对应卷积层的权值;设为3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差;为加入的1
×
1卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,习的缩放因子和偏差,为输入值直接批量归一化层的累积均值、标准差、学习的缩放因子和偏差,那么训练阶段网络模型中对于输入特征图f,将使用bn(f*w,μ,σ,γ,β)来表示批量归一化具体计算过程,*表示卷积:
[0023][0024][0025]
步骤s42:根据步骤s41中批量归一化的计算公式,输入特征图f1与下一层的输入特征图y1计算关系进一步表示为:
[0026][0027]
根据训练好的模型权值重新构造测试模型需要的参数值,将多个分支结构的权值压缩到一个卷积中,将式子化简后的值使用一个卷积代替,简化后的计算公式为:
[0028][0029]
测试阶段使用的压缩后的卷积的权值和偏移量{w'1,b'1}的公式如下:
[0030][0031][0032]
得到测试阶段的为分支结构的计算关系为:
[0033]
y1=f1*w'1 b'1[0034]
步骤s43:根据步骤s42化简后的公式直接用于对于尺度不匹配的连接,输入通道数为c
in
,输出通道数为c
o枰t
的情况,用的情况,用表示当前层的主干3
×
3卷积的权值,的权值,为当前层1
×
1卷积的权值,则为加入的3
×
3卷积的权值;设为3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差;积均值、标准差、学习的缩放因子和偏差;为旁路1
×
1卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,μ
(3)
、σ
(3)
、γ
(3)
、β
(3)
为加入的旁路3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,测试阶段使用的卷积的权值因此测试阶段使用的卷积的权值{w'2,b'2}的公式如下:
[0035][0036]
[0037]
因此测试阶段网络模型中对于输入特征图f2得
[0038]
y2=f2*w'2 b'2[0039]
步骤s44:对网络结构进行判断,对于尺度匹配的连接使用{w'1,b'1}计算的新权值复制给主干3
×
3卷积进行重参数化,对于尺度不匹配的连接使用{w'1,b'2}计算的新权值复制给主干3
×
3卷积进行重参数化,并删除旁路分支结构,构建无分支全卷积网络模型作为推理模型。
[0040]
进一步的,所述步骤s5具体为:将待测图像输入推理模型进行预测,设置阈值为0.5到0.95,根据预测概率选出符合要求预测框。
[0041]
本发明与现有技术相比具有以下有益效果:
[0042]
本发明在训练阶段使用可重参数化的多分支结构网络解决网络训练的退化问题,将训练好的模型通过模型重参数化获得推理阶段使用的无分支结构的网络模型,解决了模型复杂检测速度慢的问题,能够有效地减少边缘小目标的漏检,提高图像检测效率。
附图说明
[0043]
图1是本发明方法流程示意图。
具体实施方式
[0044]
下面结合附图及实施例对本发明做进一步说明。
[0045]
请参照图1,本发明提供一种基于全卷积的无分支结构目标检测方法,具体包括以下步骤:
[0046]
步骤s1:获取目标检测数据集,预处理后生成训练集;
[0047]
步骤s2:构建可重参数化的多分支全卷积网络模型作为训练阶段使用的模型;
[0048]
步骤s3:对步骤s2构建的可重参数化的多分支可重参数化的全卷积网络模型进行训练,通过随机梯度下降方法,优化模型参数;
[0049]
步骤s4:对步骤s3训练好的模型进行重参数化,构建无分支全卷积网络模型作为推理阶段使用的模型;
[0050]
步骤s5:使用步骤s4构建的推理模型对待测试图像进行测试。
[0051]
在本实施例中,包括步骤s1具体包括以下步骤:
[0052]
步骤s11:获取目标检测数据集,包括训练集和测试集。
[0053]
步骤s12:对步骤s11获得的训练集图像进行水平翻转和垂直翻转,图像翻转的概率设为0.5。
[0054]
在本实施例中,步骤s2具体包括以下步骤:
[0055]
步骤s21:使用resnet作为主干网络的centernet目标检测模型作为基线模型。对resnet的跳跃连接进行修改,一个resnet基本块中包含两种跳跃连接,一种是当前层输出和输入特征图的尺度相同,直接对两个图像进行相加融合,一种是当前层输出特征图和输入特征图的尺度不同,使用1
×
1卷积对输入特征图进行通道变换后再与输出特征相加融合获得下一层的输入。当尺度匹配时加入1
×
1卷积分支,不匹配时加入3
×
3卷积分支,并且每一个分支在卷积操作后加上批量归一化。对于尺度匹配的连接,设输入特征图为f1,通过当前层的3
×
3卷积操作后输出值为f1(f1),设批量归一化操作为bn(x),表示对输入x进行批量
归一化,则bn(f1)表示对特征图f1进行批量归一化,则下一层的输入特征图y1为:
[0056]
y1=bn(g1(f1)) bn(f1(f1)) bn(f1)
[0057]
其中g1(f1)是加入的1
×
1卷积分支的输出值,对于尺度匹不配的连接,设输入特征图为f2,通过当前层的3
×
3卷积操作后输出值为f2(f2),则下一层的输入特征图y2为:
[0058]
y2=bn(g2(f2)) bn(f2(f2)) bn(h(f2))
[0059]
其中g2(f2)是网络原来的1
×
1卷积分支的输出值,h(f2)是加入的3
×
3卷积分支的输出值。对每一个卷积操作加入分支结构,扩展为三个分支(加入的1
×
1卷积和3
×
3卷积分支)。
[0060]
步骤s22:在步骤s21改进的resnet网络后加上eca注意力模块,将改进后的resnet网络获得的特征值送入eca注意力模块,从而优化后的特征值,构建可重参数化的多分支可重参数化的全卷积网络模型。
[0061]
在本实施例中,步骤s3具体包括:
[0062]
训练阶段使用随机初始化方法初始化网络参数,设置初始学习率设置为1.25e-2,每过5轮将学习率乘以0.9998,使用动量为0.9的随机梯度下降优化方法,通过最小化损失获得模型的最优参数,得到训练好的可重参数化的多分支可重参数化的全卷积网络模型。
[0063]
在本实施例中,步骤s4具体包括以下步骤:
[0064]
步骤s41:步骤s3训练好的可重参数化的多分支可重参数化的全卷积网络模型中每一个卷积操作扩展为三个分支,若网络中一共包含n个卷积层,那么扩展后网络包含3n个处理过程,推理模型需要将3n个处理过程通过重参数化的方法转化为n个处理过程。用c
in
表示卷积操作中的参数输入通道数,c
out
表示输出通道数,对于尺度匹配的连接,设用表示当前层主干3
×
3卷积的权值,则为加入的旁路1
×
1卷积的权值,μ、σ、γ、β为批量归一化层的累积均值、标准差、学习的缩放因子和偏差,f为输出特征图,w为对应卷积层的权值。设子和偏差,f为输出特征图,w为对应卷积层的权值。设为3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差。为加入的1
×
1卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,习的缩放因子和偏差,为输入值直接批量归一化层的累积均值、标准差、学习的缩放因子和偏差,那么训练阶段网络模型中对于输入特征图f,将使用bn(f*w,μ,σ,γ,β)来表示批量归一化具体计算过程,*表示卷积:
[0065][0066][0067]
步骤s42:根据步骤s41中批量归一化的计算公式,输入特征图f1与下一层的输入特征图y1计算关系可进一步表示为:
[0068][0069]
根据训练好的模型权值重新构造测试模型需要的参数值,也就是将多个分支结构的权值压缩到一个卷积中,因此,将式子化简后的值使用一个卷积代替,简化后的计算公式为:
[0070][0071]
因此测试阶段使用的压缩后的卷积的权值和偏移量{w'1,b'1}的公式如下:
[0072][0073][0074]
得到测试阶段的为分支结构的计算关系为:
[0075]
y1=f1*w'1 b'1[0076]
步骤s43:根据步骤s42化简后的公式直接用于对于尺度不匹配的连接,输入通道数为c
in
,输出通道数为c
out
的情况,用的情况,用表示当前层的主干3
×
3卷积的权值,的权值,为当前层1
×
1卷积的权值,则为加入的3
×
3卷积的权值。设为3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差。积均值、标准差、学习的缩放因子和偏差。为旁路1
×
1卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,μ
(3)
、σ
(3)
、γ
(3)
、β
(3)
为加入的旁路3
×
3卷积层之后批量归一化层的累积均值、标准差、学习的缩放因子和偏差,因此测试阶段使用的卷积的权值因此测试阶段使用的卷积的权值{w'2,b'2}的公式如下:
[0077]
[0078][0079]
因此测试阶段网络模型中对于输入特征图f2得
[0080]
y2=f2*w'2 b'2[0081]
步骤s44:对网络结构进行判断,对于尺度匹配的连接使用{w'1,b'1}计算的新权值复制给主干3
×
3卷积进行重参数化,对于尺度不匹配的连接使用{w'1,b'2}计算的新权值复制给主干3
×
3卷积进行重参数化,并删除旁路分支结构,构建无分支全卷积网络模型作为推理阶段使用的模型。
[0082]
在本实施例中,步骤s5具体包括:
[0083]
将步骤s1准备的测试集图像输入s44构建的无分支全卷积网络模型进行预测,设置阈值为0.5到0.95,根据预测概率选出符合要求预测框。
[0084]
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献