一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度学习的可解释性SAR图像目标检测方法及系统与流程

2022-02-20 00:15:15 来源:中国专利 TAG:

技术特征:
1.一种基于深度学习的可解释性sar图像目标检测方法,其特征在于,包括为用于对输入的sar图像获得对应的目标检测结果的深度学习神经网络选取骨干网络的步骤:1)采用sar图像数据集对不同的骨干网络进行训练并保存最优权重模型;2)利用混合全局归因映射hgam对各个保存最优权重模型后的骨干网络进行分析,并选择最优的骨干网络作为深度学习神经网络的骨干网络。2.根据权利要求1所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,所述骨干网络为多个阶段的特征提取模块和下采样模块堆叠组成,且由最后三个阶段的特征提取模块输出的特征图作为骨干网络的输出。3.根据权利要求2所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,步骤2)包括:2.1)针对sar图像数据集中的sar图像,基于各个保存最优权重模型后的骨干网络输出的特征图构成的四维张量x采用积分梯度方法生成局部观测归因,所述局部观测归因包括正归因pa和正归因比例pap;2.2)采用全局归因映射gam的方法基于局部积分梯度ig的观测归因对各个骨干网络的检测性能进行全局分析,并选择最优的骨干网络作为深度学习神经网络的骨干网络。4.根据权利要求3所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,步骤2.1)中采用积分梯度方法生成局部观测归因的步骤包括:2.1.1)将四维张量x利用全局平均池化gap压缩特征图的空间维数;2.1.2)利用卷积核数为3
×
(5 c)的1
×
1的卷积对压缩空间维数后的四维张量进行卷积操作,并利用行列变换操作生成大小为3
×
(5 c)的二维向量x1,并将其作为网络的最终输出向量;2.1.3)将二维向量x1作为骨干网络f的最终输出向量,计算从四维张量x的基线图像移动到四维张量x对应的输入图像的总成本并通过计算输入图像的四维张量x到四维张量x对应的基线图像的路径上每个点的梯度值的总和,得到由所有点的梯度值的总和构成的四维局部观测张量attributions_ig;2.1.4)将四维局部观测张量attributions_ig采用relu激活函数进行筛选获得正归因pa,并基于得到的四维局部观测张量attributions_ig将正归因pa进行归一化处理得到正归因比例pap。5.根据权利要求4所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,步骤2.1.4)中基于到由所有点的梯度值的总和构成的四维局部观测张量attributions_ig将正归因pa进行归一化处理得到正归因比例pap的函数表达式为:上式中,pa为正归因,min为最小值函数,max为最大值函数,attributions_ig为由输入图像到基线图像上的所有点的梯度值的总和构成的四维张量。6.根据权利要求5所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,步骤2.2)包括:2.2.1)针对每一个骨干网络,将其每一个局部观测归因中的正归因pa和正归因比例
pap计算平均值,然后将所有局部观测归因对应的平均值构建加权归因向量θ
w
,根据下式归一化为标准百分比形式的标准化归因并进行联合排序;上式中,normalize(θ
w
)表示加权归因向量θ
w
的归一化得到的标准化归因,表示归因向量θ
w
中任意第i个特征的权重,ο是哈达玛积;2.2.2)将k-medoid和加权斯皮尔曼等级相关系数平方秩距离相结合去分组相似的标准化归因,得到k个标准化归因的聚类;2.2.3)将k个标准化归因聚类作为全局归因映射gam的全局解释,每个全局归因映射gam的全局解释都产生了一个位于聚类中最集中的特征重要性向量,该特征重要性向量包含了每一个骨干网络在该聚类中的正归因pa的排名和正归因比例pap的排名,且根据k个标准化归因聚类的大小作为对应全局解释的解释力来对每个全局解释进行排序;2.2.4)根据下式计算每一个骨干网络的全局正归因gpa全局正归因比例gpap:2.2.4)根据下式计算每一个骨干网络的全局正归因gpa全局正归因比例gpap:上式中,k表示标准化归因的聚类数,n为骨干网络的样本总数,n
i
表示第i个聚类中的样本数量,rank(pa)
i
和rank(pap)
i
分别是第i个聚类中正归因pa和正归因比例pap的排名值。2.2.5)选择全局正归因gpa和全局正归因比例gpap最优的骨干网络作为深度学习神经网络的骨干网络。7.根据权利要求1~6中任意一项所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,所述深度学习神经网络包括:骨干网络,用于将输入的sar图提取目标特征得到具有不同的分辨率和感受野的多个特征图;融合模块panet,用于将骨干网输出的具有不同的分辨率和感受野的三个特征图进行相互融合,得到数量相同的融合后的增强特征图;可视化检测头,用于针对三个融合后的特征图进行多尺度的目标检测得到目标检测结果以及可视化结果。8.根据权利要求7所述的基于深度学习的可解释性sar图像目标检测方法,其特征在于,所述可视化检测头采用yolov3 head对融合后的三个不同尺度特征图进行对应尺度的目标检测得到目标检测结果,且所述yolov3 head在每个1
×
1网格下生成的三组边界框的信息被编码到相应的3
×
(5 c)向量中,且目标检测结果的每个边界框包含1个置信分数、4个坐标、c个条件类别概率值pr,所述4个坐标包括边界框的中心坐标x,y、宽度w和高度h;且所述可视化检测头还包括计算条件类别概率值pr和每个边界框的置信分数的乘积得到类别特定置信分数ccs,将类别特定置信分数ccs生成热图并上采样到输入的sar图像大小,并乘以原始输入图像得到掩模图像,将掩模图像再次输入yolov3 head得到增强后的热图,并作为可视化输出结果输出。9.一种基于深度学习的可解释性sar图像目标检测系统,包括相互连接的微处理器和存储器,其特征在于,该微处理器被编程或配置以执行权利要求1~8中任意一项所述基于深度学习的可解释性sar图像目标检测方法的步骤。10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质中存储有被编程或
配置以执行权利要求1~8中任意一项所述基于深度学习的可解释性sar图像目标检测方法的计算机程序。

技术总结
本发明公开了一种基于深度学习的可解释性SAR图像目标检测方法及系统,本发明包括为深度学习神经网络选取骨干网络:采用SAR图像数据集对不同的骨干网络进行训练并保存最优权重模型;利用混合全局归因映射HGAM对各个保存最优权重模型后的骨干网络进行事后可解释性分析,并选择最优的骨干网络作为深度学习神经网络的骨干网络;该深度学习神经网络包括最优骨干网络的选取、融合模块PANet以及检测头的可视化。本发明采用了混合全局归因映射HGAM这一可解释的人工智能对各个保存最优权重模型后的骨干网络进行分析,可实现对骨干网络的性能评估,从而获得最优的骨干网络,以提升对深度学习神经网络内部功能的洞察力,提升深度学习神经网络的检测准确度。学习神经网络的检测准确度。学习神经网络的检测准确度。


技术研发人员:陈立福 罗汝 潘舟浩 袁志辉 邢学敏 邢进 蔡兴敏
受保护的技术使用者:长沙理工大学
技术研发日:2021.09.10
技术公布日:2022/1/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献