一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于注意力及生成对抗网络的遥感影像目标检测方法与流程

2022-02-22 02:04:20 来源:中国专利 TAG:


1.本发明涉及人工智能、深度学习、目标检测技术领域,尤其涉及基于注意 力及生成对抗网络的遥感影像目标检测方法。


背景技术:

2.早期因为卫星遥感图像的空间分辨率较低,对于图像中一些较小的物体, 无法进行精确检测,对于遥感图像的检测主要集中在提取某一块区域的空间地 理属性,例如图像中的森林,湖泊,植被分布等。近几年,得益于遥感技术快 速发展,航空遥感图像的空间分辨率也可以达到亚米级别,使得检测图像中的 单独个体成为可能。
3.在海量高分辨率的遥感图像数据支持下,一些应用在遥感图像上的目标检 测技术开始相继涌现,尤其基于深度学习技术的目标检测更是发展快速。虽然 基于深度学习的分类和检测模型已经被广泛的应用在遥感图像领域,但大多数 还是关注在日常的物体检测中,日常物体的检测与遥感图像目标检测的区别在 于其容易获取,尺度变化比较小,一般一张图片中需要检测的目标也比较少, 这些深度学习的模型对于遥感图像这种目标变化尺度大,样本分布不均衡,背 景复杂的图像检测并不能体现出来其在自然图像识别上的出色学习性能。


技术实现要素:

4.有鉴于此,本发明目的是提供一种基于注意力及生成对抗网络的遥感影像 目标检测方法,用以解决普通的卷积神经网络在检测遥感影像中飞机、舰船、 车辆等小目标的检测效果不理想问题;具体步骤如下:
5.s1、利用现有的mask r-cnn模型,在骨干网络resnet101上嵌入注意力 机制、特征金字塔fpn,在mask掩码分支进行gan对抗训练,得到训练好的 目标检测识别深度网络;
6.s2、对收集制作的遥感影像数据集上使用数据增强方法对数据集进行样本 扩充;
7.s3、将s2中扩充之后的遥感影像数据集送入s1中以resnet101以及fpn 作为骨干网络的深度卷积层生成特征图;
8.s4、将s3中生成的特征图送入maskr-cnn中的区域推荐网络,使用卷积 神经网络做分类与目标检测框回归,得到候选区域;
9.s5、对s4中生成的候选区域做感兴趣区域对齐,重塑特征图的尺寸;
10.s6、对s5中重塑尺寸后的特征图送入三个全连接网络,分别对图像做目标 分类、目标检测框回归以及掩码生成。
11.本发明提供的技术方案带来的有益效果是:本发明将高性能目标检测算法 应用到了飞机舰船等小的军事目标的检测,提高了识别的效率和准确度,可帮 助指挥人员做出正确的决策,对军事作战及指挥有着重要的意义。而在民用领 域,对农田、建筑物的有效识别也可用于监测农业产量,违章建筑识别等场景。
附图说明
12.图1是本发明基于注意力及生成对抗网络的遥感影像目标检测方法的流程 图;
13.图2是本发明基于注意力及生成对抗网络的遥感影像目标检测方法的网络 架构图;
14.图3是本发明基于注意力及生成对抗网络的遥感影像目标检测方法的检测 效果图。
具体实施方式
15.为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明 实施方式作进一步地描述。
16.请参考图1,本发明提供了基于注意力及生成对抗网络的遥感影像目标检测 方法,构建了由mask-rcnn rpn ra-attention gan组成的解决方案, 可以准确的提取图像中目标的特征信息,有效提高遥感图像中的目标检测精度。
17.针对高分辨率遥感图像中目标复杂,数据规模、数据量过少,以及军事目标 检测需求,在数据预处理阶段构建一个完整的飞机目标检测数据集,用于卷积 神经网络的输入,针对军事目标检测的精度要求,对数据进行初始处理,数据 增强,数据集扩充等,在数据增强阶段使用“马赛克”增强技术对图像进行处理, 提高模型的识别精度和泛化能力。
18.主干网络拟选择dense net思路对block进行联接,同时将网络中的block替 换成ra-attention module,请参考图2。由于输入数据中有部分占比低于1%的 小目标,为让模型可以更好的检测出这类目标,在主体网络中结合了fpn(feature pyramidnetwork,特征金字塔网络),以减少因尺度变化而导致的特征丢失,并在 fpn中添加ra-attention(循环注意力机制),将不被经常使用的上下文信息进行 融合,保证数据上下文信息的完整性。在mask分支中使用gan网络对mask 判别器进行预训练提升掩膜输出精度。
19.本发明具体步骤如下:
20.s1、利用现有的mask r-cnn模型,在骨干网络resnet101上嵌入注意力 机制、特征金字塔fpn,在mask掩码分支进行gan对抗训练,得到训练好的 目标检测识别深度网络;
21.s2、对收集制作的遥感影像数据集上使用数据增强方法对数据集进行样本 扩充;
22.s3、将s2中扩充之后的遥感影像数据集送入s1中以resnet101以及fpn 作为骨干网络的深度卷积层生成特征图;
23.s4、将s3中生成的特征图送入maskr-cnn中的区域推荐网络,使用卷积 神经网络做分类与目标检测框回归,得到候选区域;
24.s5、对s4中生成的候选区域做感兴趣区域对齐,重塑特征图的尺寸;
25.s6、对s5中重塑尺寸后的特征图送入三个全连接网络,分别对图像做目标 分类、目标检测框回归以及掩码生成。
26.首先,输入待处理的图片,然后进行对应的预处理操作,或者预处理后的 图片;然后,将其输入到一个预训练好的神经网络中(resnet50/resnet101)获得 对应的特征图;接着,根据这个特征图中的每一点设定的roi数量,获得多个 候选roi;将这些候选的roi送入rpn网络进行二值分类(前景或背景)和bbox 回归,过滤掉一部分候选的roi;接着,对这些剩下的roi进行roialign操作(即 先将原图和特征图的像素对应起来,然后将特征图和固
定的特征对应起来);
27.最后,对这些roi进行分类(n类别分类)、bbox回归和mask生成(在每一 个roi里面进行fcn操作)其中mask分支添加生成对抗网络结构,将mask生 成器中添加一层判别器以提升mask生成的精确度,请参考图3。
28.所述mask r-cnn网络中用到roialign,在原始池化操作上引入双线性内 插算法,具体算法公式如下:
[0029][0030]
xi代表池化前特征图上的像素点;y
rj
代表池化后的第r个候选区域的第j个 点;i*(r,j)代表点y
rj
像素值的来源,最大池化的时候选出的最大像素值所在点的 坐标,d(.)表示两点之间的距离,δh和δw表示xi与xi*(r,j)横纵坐标的差值,这 里作为双线性内插的系数乘在原始的梯度上。
[0031]
所述mask r-cnn基础网络中用到的损失函数为分类损失、边界框回归损 失、掩膜损失的和,具体算法公式如下:
[0032]
l=l
cls
l
box
l
mask
[0033]
其中,l表示模型总损失,l
cls
表示分类损失,l
box
表示边界框损失, l
mask
表示掩膜损失。
[0034]
所述mask r-cnn基础网络中用到注意力模块,具体算法公式如下:
[0035][0036]
σ表示sigmoid函数,mlp表示多层感知器,用于共享参数,和分别 代表全局平均池化和全局最大值池化输出的特征,f
7*7
表示在拼接后的特征图上 做7*7的卷积,ms(f)表示最终生成的空间注意力特征。
[0037]
所述mask r-cnn基础网络中用到mask分支网络用于构建生成对抗网络, 具体的优化目标函数如下所示:
[0038][0039]
对应的损失函数公式如下,其中p
data
(x)为真实样本的分布,d(x)为判别 器,g(z)为生成器;
[0040][0041][0042]
其中,ld为判别器的损失函数,lg为生成器的损失函数;n为样本数。
[0043]
在深度学习的过程中,输入图像经过神经网络模型后,将获得一个描述输 入图像的特征矩阵,然后根据拟解决任务的不同,使用该特征矩阵完成图像分 类、分割等任务。但是在刚开始进行模型训练时,该特征矩阵并不能很好的描 述输入图像,因此需要根据训练集每次训练的结果,调整模型中各层的参数, 使模型能通过特征矩阵较好地描述输入图
像。神经网络模型需要使用损失函数, 通过该函数将得到的神经网络输出结果与训练集所标识的实际值相对比,得到 损失值,当损失函数为0时,表示该神经网络模型能完美拟合所有输入数据, 因此损失函数为0的模型为一个理想模型。训练神经网络模型的目的是尽可能 减小损失值。
[0044]
神经网络方法通过反向传播算法进行模型的训练,也就是根据损失函数计 算得到的损失值,沿着神经网络模型反向的向前传播,在该传播过程中根据梯 度下降的方向,调整每一层的卷积参数权重参数w和偏置量b。通过不断迭代, 得到收敛的神经网络模型。为了提高网络模型的收敛速度和特征结果的鲁棒性, 本文采用小批量随机梯度下降方法进行训练。
[0045]
在改进后的mask r-cnn神经网络模型的训练过程中,设置输入批大小为 2,网络迭代次数与原mask r-cnn一致,为90000。参数更新策略为动量梯度 下降优化方法和学习率衰减方法,动量梯度下降优化方法如公式所示:
[0046][0047]
其中v
dw
表示权重w下降速率,v
db
表示偏置b下降速率,β为 梯度更新动量值,α为学习率。学习率衰减方法如公式所示:
[0048][0049]
其中α为学习率,d为衰减率,n为迭代次数,α0为初始学习率。
[0050]
在训练改进后的maskr-cnn时,α0=0.0025,β=0.9,d=0.0001,使用 分段常数学习率衰减方法,设置n为60000和80000,该方法如公式所示:
[0051][0052]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本 发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它 实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献