一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于注意力机制的地下目标体分类识别方法

2022-07-16 13:18:44 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种基于注意力机制的地下目标体分类识别方法。


背景技术:

2.探地雷达(ground penetrating radar,gpr)作为一种重要的无损探测设备,凭借其精准度、灵活性以及操作简单等特点,已经被广泛应用于各个工程领域。使用探地雷达对地下目标体进行探测,可以得到包含目标体特征的b-scan图像。处理地下目标体的分类识别问题,主要是依靠对b-scan数据中的目标体进行特征提取。传统方法从b-scan图像中评估地下目标体的类别信息需要凭借资深专家的丰富经验,既费时又费力。


技术实现要素:

3.本发明的目的在于提供一种基于注意力机制的地下目标体分类识别方法,避免了传统机器学习中人工设计特征的步骤,同时增强了深度学习方法中卷积神经网络的特征提取能力。
4.为实现上述目的,本发明提供了一种基于注意力机制的地下目标体分类识别方法,包括下列步骤:
5.采集探地雷达b-scan图像数据;
6.进行数据预处理和类别标注,获得探地雷达b-scan图像数据集;
7.搭建基于cbam注意力机制和残差结构的卷积神经网络模型;
8.对所述卷积神经网络模型进行训练并验证;
9.使用训练后的卷积神经网络模型进行图像分类识别。
10.其中,所述探地雷达b-scan图像数据是实测得到的探地雷达b-scan图像数据或采用电磁仿真软件gprmax进行正演模拟获得的仿真数据。
11.其中,数据预处理的方式包括对数据文件使用减均值法将逐行数据减去本行均值去除直达波,以及统一图像尺寸和数据增强。
12.其中,类别标注的过程具体为按照地下目标体的类别对图像数据进行分类以及打上标签,并且把标签保存在json文件中。
13.其中,所述探地雷达b-scan图像数据集包括训练数据集和测试数据集,所述训练数据集占比80%,所述测试数据集占比20%。
14.其中,在搭建基于cbam注意力机制和残差结构的卷积神经网络模型的过程中,搭建卷积神经网络的基本单元为两种类型的引入cbam注意力机制的残差卷积块,其中cbam包括通道注意力模块和空间注意力模块。
15.其中,在对所述卷积神经网络模型进行训练并验证的过程中,使用训练数据集对基于注意力机制的卷积神经网络模型进行训练,视数据集的规模选择是否进行数据增强,同时使用测试数据集在模型训练过程中对模型进行验证,经过多次迭代训练后得到最优模
型。
16.本发明提供了一种基于注意力机制的地下目标体分类识别方法,首先采集探地雷达b-scan图像数据,预处理后获得探地雷达b-scan图像数据集,再搭建基于cbam注意力机制和残差结构的卷积神经网络模型,使用探地雷达b-scan图像数据集对卷积神经网络模型进行迭代训练,训练好的卷积神经网络模型更关注目标体重要的特征而抑制不重要的特征,有效提高模型对目标体的识别精度,使用训练后的卷积神经网络模型进行图像分类识别避免了传统机器学习方法中人工设计特征的步骤,同时增强了深度学习方法中卷积神经网络的特征提取能力。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1是本发明的一种基于注意力机制的地下目标体分类识别方法的流程示意图。
19.图2是本发明的卷积神经网络模型的通道注意力模块结构图。
20.图3是本发明的卷积神经网络模型的空间注意力模块结构图。
21.图4是本发明的带有注意力模块的残差卷积块的结构图。
22.图5是本发明将基于cbam注意力机制的卷积神经网络模型提取到的特征可视化结果。
23.图6是本发明将无cbam注意力机制的卷积神经网络模型提取到的特征可视化结果。
具体实施方式
24.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
25.请参阅图1,本发明提出了一种基于注意力机制的地下目标体分类识别方法,包括下列步骤:
26.s1:采集探地雷达b-scan图像数据;
27.s2:进行数据预处理和类别标注,获得探地雷达b-scan图像数据集;
28.s3:搭建基于cbam注意力机制和残差结构的卷积神经网络模型;
29.s4:对所述卷积神经网络模型进行训练并验证;
30.s5:使用训练后的卷积神经网络模型进行图像分类识别。
31.所述探地雷达b-scan图像数据是实测得到的探地雷达b-scan图像数据或采用电磁仿真软件gprmax进行正演模拟获得的仿真数据。
32.数据预处理的方式包括对数据文件使用减均值法将逐行数据减去本行均值去除直达波,以及统一图像尺寸和数据增强。
33.类别标注的过程具体为按照地下目标体的类别对图像数据进行分类以及打上标
签,并且把标签保存在json文件中。
34.所述探地雷达b-scan图像数据集包括训练数据集和测试数据集,所述训练数据集占比80%,所述测试数据集占比20%。
35.在搭建基于cbam注意力机制和残差结构的卷积神经网络模型的过程中,搭建卷积神经网络的基本单元为两种类型的引入cbam注意力机制的残差卷积块,其中cbam包括通道注意力模块和空间注意力模块。
36.在对所述卷积神经网络模型进行训练并验证的过程中,使用训练数据集对基于注意力机制的卷积神经网络模型进行训练,视数据集的规模选择是否进行数据增强,同时使用测试数据集在模型训练过程中对模型进行验证,经过多次迭代训练后得到最优模型。
37.以下结合具体实施步骤进行详细说明:
38.s1:采集探地雷达b-scan图像数据;
39.具体为仿真得到探地雷达b-scan图像数据,方法为:使用电磁仿真软件gprmax正演模拟仿真生成数据,需要编写k个.in文件作为正演模拟模型的输入文件,其中包括探地雷达、环境以及目标的模型参数,然后仿真后得到.out数据文件。
40.s2:进行数据预处理和类别标注,获得探地雷达b-scan图像数据集;
41.使用matlab读取数据文件,用减均值的方法去除回波数据中的直达波,转换为灰度数据图像。
42.(2.1)matlab读取到的数据是二维数据,每一列为探地雷达在特定测量点的a-scan图。由于直达波具有振幅较大,能量较高,波形稳定等特点,使用减均值法将逐行数据减去本行均值能够很大程度上去除直达波。
43.(2.2)将使用减均值法处理后的数据文件转换为b-scan图像,并且统一b-scan图像的大小。
44.(2.3)将预处理好的图像数据按照地下目标体的类别进行分类,并为每个类别按照枚举法做数字标签,将数字标签与类别一一对应,保存在json文件中。
45.s3:搭建基于cbam注意力机制和残差结构的卷积神经网络模型;
46.模型包括特征提取以及目标分类识别两个部分。
47.(3.1)首先搭建特征提取网络中的cbam注意力机制。cbam注意力机制聚合了通道注意力模块和空间注意力模块,是通道注意力模块和空间注意力模块的串接。通道注意力模块主要关注哪些通道对网络的最后输出结果起到作用。如图2,通道注意力模块会分别对通道数为channel的输入特征图f进行最大池化得f
max
,进行均值池化得f
avg
,再将f
max
和f
avg
分别输入同一个多层神经网络(mlp)中得到同样通道数为channel的输出,将两个输出进行相加后经由sigmoid激活函数输出。该输出作为权重与输入特征图f对应相乘,进行通道注意力加权。得到通道注意力权重mc(f)的计算过程可以表示为:
48.mc(f)=σ(mlp(maxpooling(f)) mlp(avgpooling(f)))
49.=σ(w1(w0(f
max
)) w1(w0(f
avg
)))
50.其中,σ为sigmoid函数;w0,w1均为mlp的权重参数,其中w0使用relu激活函数。
51.空间注意力模块主要关注网络中哪些位置对网络的最后输出结果起到作用。如图3,空间注意力模块分别对输入特征图f进行最大池化得f
max
,进行均值池化得f
avg
。然后对f
max
和f
avg
进行串接的结果进行二维卷积,最终通过sigmoid激活函数输出。输出结果为空间
注意力权重,与输入特征图f对应相乘,进行空间注意力加权。得到空间注意力权重ms(f)的计算过程可以表示为:
52.ms(f)=σ(f([avgpooling(f);maxpooling(f)]))
[0053]
=σ(f([f
avg
;f
max
]))
[0054]
其中,σ为sigmoid函数;f为二维卷积操作。
[0055]
(3.2)构建卷积神经网络的特征提取网络。搭建残差结构的卷积神经网络最基本的单元就是两种类型的残差卷积块,如图4。在本实施例中设定每三个残差卷积块的卷积核数目相同,下三个残差卷积块卷积核数目是上三个的两倍,初始前三个残差卷积块的卷积核数目为16。第一种残差卷积块中卷积核的尺寸为3
×
3,步长为1,激活函数为relu。输入特征图x与卷积操作提取到的特征f1(x)大小相同,可以直接将x与f1(x)相加,得到输出f(x);第二种残差卷积块中卷积核的尺寸为3
×
3,步长为2,激活函数为relu。输入特征图x与卷积操作提取到的特征f1(x)大小不同,要将输入特征图x进行卷积核大小为1
×
1且步长为2的卷积操作后得到与f1(x)相同大小的f2(x)进行相加,得到输出f(x)。
[0056]
(3.3)特征提取网络由引入注意力机制的卷积块堆叠构建。在本实施例中,特征提取网络是由一个卷积层、三个第一种残差卷积块、一个第二种残差卷积块、两个第一种残差卷积块、一个第二种残差卷积块以及两个第一种残差卷积块依次堆叠搭建而成。
[0057]
(3.4)目标分类识别部分主要是将提取到的特征图输入全局平均池化层以及全连接网络之后,经由softmax输出分类识别概率。
[0058]
s4:对所述卷积神经网络模型进行训练并验证;
[0059]
使用训练集训练基于cbam注意力机制和残差结构的卷积神经网络。在训练开始时对网络中的权重进行初始化。训练过程使用交叉熵损失函数,adam优化器,学习率为1e-3。根据数据集的规模以及服务器硬件条件选择epoch和batch size数值。
[0060]
s5:使用训练后的卷积神经网络模型进行图像分类识别。
[0061]
具体步骤为:首先将待分类的b-scan图像进行与数据集相同的预处理。然后根据json标签文件的索引,由图像经过卷积神经网络后输出的数值得到网络预测的结果。
[0062]
进一步的,本发明提供了一种具体实施例进行仿真实验说明:
[0063]
采用电磁仿真软件gprmax探地雷达正演模拟仿真生成数据,数据集的生成主要需要以下步骤:首先批量编写2000个.in文件作为正演模拟模型的输入文件程序,其中设置1000个方形地下目标体,1000个球形地下目标体;然后通过仿真计算后得到数据文件;最后使用matlab读取文件数据,用减均值的方法去除回波数据中的直达波,转换为灰度数据图像,调整图像尺寸为180
×
240。由此构成了由2000张b-scan组成的数据集。
[0064]
本实验搭建基于cbam注意力机制和残差结构的卷积神经网络模型。特征提取网络是由一个卷积层、三个第一种残差卷积块、一个第二种残差卷积块、两个第一种残差卷积块、一个第二种残差卷积块以及两个第一种残差卷积块依次堆叠搭建而成。分类识别部分是由全局平均池化层以及全连接层组成。
[0065]
将探地雷达b-scan图像数据集的80%作为训练集,20%作为验证集。模型训练迭代次数epoch为100,batch size为16,初始学习率设置为1e-3,采用adam优化器和交叉熵损失函数。
[0066]
结果表明,使用基于注意力机制的卷积神经网络模型在提高模型识别准确率的同
时还能够使模型更加关注目标体重要的特征。将基于cbam注意力机制的卷积神经网络模型和无cbam注意力机制的卷积神经网络模型提取到的特征进行可视化如图5和图6,在相同的训练条件下,基于注意力机制的卷积神经网络模型提取到的探地雷达b-scan图像的特征更为清晰具体。
[0067]
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献