一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种SAR图像目标检测方法与流程

2022-05-26 20:53:01 来源:中国专利 TAG:

一种sar图像目标检测方法
技术领域
1.本发明涉及目标检测技术领域,具体涉及一种sar图像目标检测方法。


背景技术:

2.合成孔径雷达(sar)是捕获合成孔径雷达(sar)图像的主要手段, 具有全天候、全天时的特点,且不受天气或其他成像特性的影响。随着工具、 信息和技术的快速更新,可以获得大量的sar图像。由于sar成像的图像 特殊性,人工解译费时费力,大量数据没有得到充分利用。sar图像目标检 测是一种从图像中自动定位和识别特定目标的技术,在现实生活中具有广泛 的应用前景。例如,在军事领域,对特定军事目标的位置进行检测有利于战 术部署同时也可以提高预警能力。在民用领域,可以在海上发现一些走私和 非法渔船,有助于对海上运输的监测和管理。
3.详细研究发现,目前的sar目标检测任务仍存在以下问题需要解决:
4.(1)现有的sar图像检测算法主要是基于锚框的设计。然而,锚框超 参数的设置很大程度上依赖于人类的经验,生成的锚框大大降低了模型的训 练速度。此外,锚框检测算法多侧重于目标边缘信息的捕获,而sar图像 轮廓信息不清晰,尤其是中小型sar目标,极大地限制了其检测效率。
5.(2)为了进一步提高精度,大多数现有的算法盲目增加了模型结构和最 新技术,导致了大量的模型参数,在实际应用中,这样的算法推理速度慢、 效率低下,不利于在移动设备上的部署模型,大大降低了模型的实用性。
6.(3)现有工作没有考虑sar图像的散射和目标轮廓不清晰的问题,导致 算法无法更好地抑制背景杂波,强调目标的显著信息,大大降低了模型性能。
7.为此,本发明提出一种sar图像目标检测方法。


技术实现要素:

8.为解决上述问题,本发明提供一种sar图像目标检测方法,该方法可 以更好的平衡sar目标检测的精度和速度。
9.本发明提供了如下的技术方案。
10.一种sar图像目标检测方法,包括以下步骤:
11.获取待检测的sar图像;
12.构建sar图像目标检测网络;所述sar图像目标检测网络的基准网络 采用yolox网络,引入无锚框的检测框架;对所述sar图像目标检测网 络的骨干网络进行轻量化设计,更改为基于lcnet网络的nlcnet网络;
13.其中,所述nlcnet网络的尾部的se模块删除,并对所述nlcnet网 络的深度可分离卷积进行重新的堆叠,所述nlcnet网络尾部的卷积核大于 原lcnet网络;在所述骨干网络中引入位置增强注意力机制;
14.将获取待检测的sar图像输入至训练后的sar图像目标检测网络中, 获得sar图像
的目标检测结果。
15.优选地,所述位置增强注意力机制,包括以下步骤:
16.输入特征图x,在垂直和水平两个方向上进行两个一维全局池化,形成 两个具有方向感知的独立的特征图;
17.将生成的两个具有特定方向信息的特征图进行编码,形成两个注意图;
18.将两个注意图在其空间方向上分别进行卷积运算,使用卷积函数f进行 变换,从而生成中间特征图;
19.两个中间特征图沿着空间维度通过另外两个1x1卷积变换转换为与输 入特征图x具有相同通道数的张量;
20.将两个张量应用于位置增强注意块,输出带有位置信息的特征图。
21.优选地,所述两个具有方向感知的独立的特征图的获取,包括以下步骤:
22.池化核的空间范围为(h,1)或(1,w),通道c在高度h处的输出表示为:
[0023][0024]
在宽度w处,通道c的输出表示为:
[0025][0026]
其中,xc表示squeeze操作,和分别表示在高度h和宽度w的两个具 有方向感知的独立的特征图;i∈[0,w],j∈[0,h]。
[0027]
优选地,所述中间特征图的生成,包括:
[0028][0029][0030]
式中,δ为非线性激活函数,bn为batchnorm操作,fh和fw为中间特征 图。
[0031]
优选地,所述两个中间特征图沿着空间维度通过另外两个1x1卷积变换 转换为与输入特征图x具有相同通道数的张量,包括以下步骤:
[0032]
通过另外两个1x1卷积变换fh和fw,沿着空间维度将fh和fw转换为与 输入特征图x具有相同通道数的张量:
[0033]gh
=σ(fh(fh))
[0034]gw
=σ(fw(fw))
[0035]
其中,σ为sigmoid函数;
[0036]
将输出gh和gw应用于位置增强注意块:
[0037][0038]
式中,xc表示注意力机制的输入特征图,yc表示注意力机制的输出特征 图。
[0039]
优选地,所述nlcnet网络尾部的卷积核大小为5x5。
[0040]
本发明的有益效果:
[0041]
(1)针对基于锚的目标检测算法高度依赖专家经验设计的框架问题, 以及解决sar图像目标轮廓信息不清晰、背景复杂等问题的困难,本发明 引入了一种无锚目标检测算法,将最新的yolox作为基础网络,用lcnet 取代骨干darknet-53,然后根据sar目标特性进行优化设计,从而更好的平 衡速度和精度。
[0042]
(2)为了平衡速度和模型复杂度,本发明通过深度可分离卷积模块的 巧妙设计,se模块的删除和多模块的新颖结构构造,构建了一种新的轻量 级主干nlcnet,该算法大大提高了推理速度和检测精度。
[0043]
(3)为了提高复杂背景下sar目标的定位能力,本发明设计了一种位 置增强注意策略,该策略是通过添加目标位置感知信息,引导注意力更好地 突出目标区域,从而有效抑制sar目标强散射导致特征提取不足的问题, 更好地检测复杂背景下的目标,从而提高检测精度。
附图说明
[0044]
图1是本发明实施例的整体框架图,nlcnet网络中的序号1-6表示每 个block的输出特征图;
[0045]
图2是本发明实施例的nlcnet骨干网络细节示意图;
[0046]
图3是本发明实施例的结构对比的经典se通道注意块和位置增强注意 块。
具体实施方式
[0047]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施 例仅用以解释本发明,并不用于限定本发明。
[0048]
实施例1
[0049]
本发明的一种sar图像目标检测方法,如图1-3所示,包括以下步骤:
[0050]
s1:为了解决sar目标轮廓不清晰和多尺度问题,所述sar图像目标 检测网络的基准网络采用yolox网络,引入了无锚框的检测框架;
[0051]
在此基础上对其骨干网络进行了重新的轻量化设计,即nlcnet网络;
[0052]
细节包括对网络尾部的se模块进行了删除,并对深度可分离卷积进行 了重新的堆叠,同时使用h-swish作为nlcnet网络的激活函数;
[0053]
s2:针对sar目标的强散射特性,在骨干网络中设计了一种新的位置 增强注意力机制(pea);
[0054]
细节是在不同空间方向上,将se模块的全局池化操作替换为两个一维 池化操作,形成两个独立的分支,能够更好的在通道注意力中添加位置信息 来抑制背景杂波,从而更加准确的识别和定位目标;
[0055]
具体的,yolox是yolo系列中第一个应用无锚模式的模型。具体操 作是直接将真值框投影到特征图的中心位置的3
×
3区域,并定义为正样本 区域,同时预测目标位置的四个数值(左上角偏移的距离以及框的高和宽)。 本发明对yolox骨干网进行了重新设计:
[0056]
现有的yolo系列主干大多使用darknet-53和cspnet架构。这样的 主干在检测效
果上通常很好,但在推理速度上仍有欠缺。为此,根据sar 目标的特点,将骨干网络进行轻量型设计,即nlcnet,以更好地平衡速度 和准确性。nlcnet使用深度可分离卷积作为基本块,本发明重新组织和堆 叠这些区块,同时删除尾部的se模块以及在网络尾部使用了大的卷积核, 从而形成一个新的骨干网络。该网络在以下两个方面进行了改进:se模块的 删除和卷积核尺寸选择。nlcnet的结构细节如图2所示。
[0057]
(1)se模块的删除
[0058]
se模块广泛用于许多网络中。它可以帮助模型对网络中的通道进行加 权以获得更好的特征。但是,我们不能盲目的在模型中加入se模块,因为 不是所有的模型添加se模块都会更有效。本发明在lcnet的基础上,在后 续的实验中去掉se模块,模型的准确率不仅没有降低,而且模型的参数也 比较小。具体细节如表1所示。
[0059]
表1 nlcnet网络细节
[0060][0061]
(2)卷积核尺寸选择
[0062]
有实验表明,不同大小的卷积会对网络性能产生一定的影响。卷积核越 大,卷积过程中的感受野越大,越有利于构建目标的全局信息。因此,本发 明选择使用较大的卷积核。实验发现,将大卷积核放置在网络的尾部是最好 的选择,因为这两种方法的性能相当于替换了网络的所有层(即每层使用一 个5x5的卷积核)。因此,这种替换只在网络的末端执行。通过简单的叠加, se模块的删除和使用相应的技术的应用,本发明使用的轻量级主干在ssdd 数据集上取得了一定的精度提高,同时参数数量也明显减少。由此可见, nlcnet的优势是明显的。
[0063]
本发明引入了位置增强注意力机制,它可以将目标在图像中的位置信息 嵌入到通道注意中,使移动网络能够获取图像的大部分区域,从而有效地、 充分地利用图像信息,同时也可以维护远程依赖关系,并且这个过程的计算 开销相对较低。具体细节如图3所示。
[0064]
具体的:
[0065]
在通道注意中,图像中的空间信息通常可以通过全局池化操作得到,因 此可以建立通道之间的联系,但在此过程中,位置信息会丢失,这是对全局 信息进行压缩的结果,但是,位置信息是特征提取需要利用的一部分。为了 解决这一问题,位置注意力机制在二维全局池化中进行相应的改变,将原始 的通道注意分割,形成两个一维全局池化操作。具体来说,给定输入x,用 两个一维全局池化操作对水平方向和垂直方向的每个通道进行编码,池化核 的大小为(h,1)或(1,w),通道c在高度h处的输出表示为:
[0066][0067]
在宽度w处,通道c的输出表示为:
[0068][0069]
其中,xc表示squeeze操作,和分别表示在高度h和宽度w出的输出 结果。i∈[0,w],j∈[0,h]
[0070]
通过上述变换,可以在两个空间方向上聚合输入特征,得到两个具有方 向性感知特征的特征图。这两个特征映射不仅使对应的注意力模块保存特征 之间的远程依赖关系,还可以在空间方向上保持准确的位置信息,从而帮助 网络更准确地检测目标。
[0071]
如上所述,上述两式支持一个全局的接受域,并对精确的位置信息进行 编码。将两个注意图在其空间方向上分别进行卷积运算,使用卷积函数f进 行变换,从而生成中间特征图:
[0072][0073][0074]
式中,δ为非线性激活函数,bn为batchnorm操作,fh和fw为中间特征 图;
[0075]
通过另外两个1x1卷积变换fh和fw,沿着空间维度将fh和fw转换为与 输入x具有相同通道数的张量:
[0076]gh
=σ(fh(fh))
[0077]gw
=σ(fw(fw))
[0078]
其中,σ为sigmoid函数;
[0079]
将输出gh和gw应用于位置增强注意块:
[0080][0081]
式中,xc表示注意力机制的输入特征图,yc表示注意力机制的输出特征 图。
[0082]
位置注意力增强机制position-enhanced attention考虑了空间信息的编码, 如上所述,沿水平方向和垂直方向的注意力同时应用于输入张量。这种编码 过程可以使
position-enhanced attention更准确地定位图像中的目标位置,从 而有助于更好地识别整个模型。
[0083]
本发明提出了一种新的轻量级位置增强无锚框sar目标检测算法,其 可以在保证精度的同时,提高模型推理速度,可以为sar图像目标检测领 域的研究人员提供参考价值。
[0084]
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明 的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明 的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献