一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于注意力机制和生成对抗网络的图像识别泛化方法与流程

2022-02-20 13:01:07 来源:中国专利 TAG:


1.本发明涉及计算机视觉技术领域,尤其涉及一种基于注意力机制和生成对抗网络的图像识别泛化方法。


背景技术:

2.图像识别是一种利用计算机对图像进行一系列采集、预处理、特征提取,从而分析和理解不同目标的技术。目前在人工智能领域得到广泛的应用,比如花草识别、人脸识别、行人重识别等技术。图像识别是以图像的主要特征作为依据,对同一数据集内的不同分类图像进行识别,例如c是不封闭图形,o是单封闭图形,b是双封闭图形等。对于类型相同不同数据集图像,它们的识别特征往往也不相同,比如一个数据集为黑白单通道图像,另一个数据集为rgb彩色图像,图像的通道数存在差异;图像的像素差异也将造成识别特征的不同,在识别像素为128*128的图像与像素为192*192的图像时选取的特征存在差异。因此在图像识别过程中,无论计算机对来自哪种领域图像都需要多次提取特征,这样才能提取更多不同的特征,从而实现最终的识别分类功能。
3.随着越来越多深度学习应用场景的出现,标记数据的成本也大幅度提高,因此迁移学习收到越来越多的关注。域泛化作为迁移学习的子领域,研究如何把源域数据训练的模型泛化到未知数据分布的目标域中。在研究发现中,处理单一领域的数据集,需要训练模型实现特征提取并实现最终的识别功能。但是当使用当前模型去训练类别相同但是特征不同的数据集时,模型的识别性能会出现明显的下降。这是因为不同数据集之间的图像特征存在一定的差异,当前训练模型的模型还不具备分辨新数据集的能力,这种现象被称作“域偏移”问题。
4.为了解决域偏移的问题,qiao等人提出一种基于元学习对抗增强虚拟域的方法,构建可以实现最大化单一域泛化模型,从而提高模型可移植性。考虑在特征空间中源域附近数据分布的最坏情况表达式,通过输入数据扩充虚拟增强域,再将扩充的数据输入到模型进行训练,最终提高模型的泛化能力。第一步,在训练模型前对数据进行预处理,先判断训练模型的源域数据集的图像像素大小和通道数是否与测试所用的目标域数据集的图像是否相同,若图像的规格不同,则进行统一化操作;第二步,将源域数据送到wasserstein自编码器模型中,利用最大均方距离生成更多可以模拟目标域数据分布的虚拟域;第三步,把生成的虚拟域数据输入到wasserstein自编码器模型中重新训练模型,并通过梯度下降法更新模型的参数;第四步,计算源域数据的识别损失,将源域的数据输入到神经网络的识别模型中,通过梯度下降法优化训练模型;第五步,利用更新图像识别网络模型的参数,训练生成的虚拟域,评估虚拟域的损失;第六步,结合第四、五步的损失,更新生成当前虚拟域的图像识别模型的参数;第七步,循环执行3次第二步到第六步操作,生成不同的虚拟域;第八步,循环训练整个过程10000次,不断通过梯度下降法更新模型的参数,得到最终的模型参数。上述方法还存在如下缺点:
5.1、整个过程中构造的网络模型不够完善,会导致对图像的特征提取不够充分。
6.2、数据增强类型过于简单,损害分类器的性能。
7.3、虽然在图像样本级上能够实现域传递,但是破坏语义一致性。


技术实现要素:

8.本发明的实施例提供了一种基于注意力机制和生成对抗网络的图像识别泛化方法,用于解决现有技术中存在的问题。
9.为了实现上述目的,本发明采取了如下技术方案。
10.基于注意力机制和生成对抗网络的图像识别泛化方法,包括:
11.s1基于待处理的特征图的源域建立初始合并域;
12.s2通过发散数据融合算法,将该初始合并域输入到生成对抗网络中进行处理,获得第一虚拟增强域,第一虚拟增强域的数据和源域的数据进行融合处理,获得目标合并域;
13.s3构建具有图像识别泛化能力的网络模型,将该目标合并域输入到生成对抗网络结合扰动正则化方法生成样本级和特征级均保证语义一致性的第二虚拟增强域;
14.s4将第二虚拟增强域输入到该具有图像识别泛化能力的网络模型中的具有多层注意力机制的图像识别网络中进行训练;将目标合并域输入到该具有图像识别泛化能力的网络模型中的生成对抗网络中进行训练,计算获得具有图像识别泛化能力的网络模型中的生成对抗网络的模型损失,基于该模型损失并结合梯度下降方法优化具有图像识别泛化能力的网络模型的参数;
15.s5重复执行步骤s4,完成具有图像识别泛化能力的网络模型的构建;
16.s6基于第二虚拟增强域数据建立总虚拟增强域;
17.s7将待处理的特征图的源域与总虚拟增强域合并,随机获取样本数据输入具有图像识别泛化能力的网络模型中进行训练,计算获得生成对抗网络的模型损失和优化模型的参数;
18.s8重复执行步骤s1至s7,不断地通过梯度下降法更新具有图像识别泛化能力的网络模型学习到的权重;
19.s9重复执行步骤s2至s8,获得最终训练的具有图像识别泛化能力的网络模型学习到的权重,即识别的图像特征。
20.优选地,步骤s1包括:
21.s11基于待处理的特征图的源域s构建初始合并域s
cbk
,该初始合并域s
cbk
的每批次的数据x
bsk
通过式
22.x
bsk
={x
s1
,

,x
sj
}
ꢀꢀꢀ
(1)
23.获得;式中,k代表当前虚拟增强域的个数以及迭代次数且初始值为0,bs表示批次,j∈[1,bs];
[0024]
步骤s2包括:
[0025]
s21将该初始合并域s
cbk
与待处理的特征图的源域s合并,获得第一虚拟增强域s
advk

[0026]
s22重复执行子步骤s21,增加第一虚拟增强域s
advk
的数量;该第一虚拟增强域s
advk
中每批次的数据x
bs
通过式
[0027]
x
bs
={x
s1
,

,x
sj
,x
advk1
,

,x
advkm
}
ꢀꢀꢀ
(2)
[0028]
获得;式中,m∈[1,bs],x
sj
表示第一虚拟增强域s
advk
每批次数据分别从源域s取样j张图像,x
advkm
表示第一虚拟增强域s
advk
每批次数据分别从当前的第一虚拟增强域s
advk
中取样m张图像;
[0029]
s23通过式
[0030]cs
=bs/(k 1)
ꢀꢀꢀ
(3)和c
advk
=bs-csꢀꢀꢀ
(4)
[0031]
计算获得目标合并域c
advk
中每批次数据的数量。
[0032]
优选地,步骤s3包括:
[0033]
通过式
[0034]
lr=minw||x-w(x)||2ꢀꢀꢀ
(5)
[0035]
计算待处理的特征图与第一虚拟增强域之间的数据关系,获得样本层级损失lr;
[0036]
通过式
[0037][0038]
对生成对抗网络进行迭代对抗训练,获得特征层级损失l
con
;式中,w为对抗生成网络,x代表输入图像,z代表提取特征,z
cbk
表示合并域的特征,z
advk
表示虚拟增强域的特征;
[0039]
通过样本层级损失lr和特征层级损失l
con
优化生成对抗网络,获得样本级和特征级均保证语义一致性的第二虚拟增强域s
advk

[0040]
优选地,步骤s4中将第二虚拟增强域输入到该具有图像识别泛化能力的网络模型中的具有多层注意力机制的图像识别网络中进行训练包括:
[0041]
s31通过对第二虚拟增强域s
advk
的特征图m进行1*1的卷积运算,将特征图m的通道维度c缩小1/2,获得维度分别为ma∈r
c/2*h*w
、mb∈r
c/2*h*w
和mc∈r
c/2*h*w
的特征图;
[0042]
s32对特征图ma和mb进行reshape操作,获得m
a1
∈r
h*w*c/2
和m
b1
∈r
h*w*c/2

[0043]
s33通过式
[0044][0045]
计算获得像素相关性特征图;式中,i∈{1,2,

,n},m
ab
∈r
h*w*h*w

[0046]
s34将m
ab
进行softmax归一化处理并与mc∈r
c/2*h*w
进行矩阵乘法运算,再通过式
[0047][0048]
进行归一化操作获得特征图m
abc
,m
abc
∈r
c/2*h*w

[0049]
s35特征图m
abc
进行1*1卷积运算,获得特征图m
f1
∈r
c*h*w

[0050]
s36对合并域进行全局池化运算,获得压缩后的特征图md∈r
c*1*1
,通过两个全连接层依次对压缩后的特征图md∈r
c*1*1
进行降维操作和上采样操作,获得特征图m
f2
∈r
c*h*w

[0051]
s37通过式
[0052]
mf=αfm
f1
βfm
f2
γfm
ꢀꢀꢀ
(9)
[0053]
对第二虚拟增强域s
advk
的特征图m、特征图m
f1
∈r
c*h*w
和特征图m
f2
∈r
c*h*w
进行加权
融合,获得预测特征图mf。
[0054]
优选地,步骤s4中将目标合并域输入到该具有图像识别泛化能力的网络模型中的生成对抗网络的过程包括:
[0055]
通过该过程,生成对抗样本
[0056]
基于该对抗样本结合扰动正则化方法训练具有图像识别泛化能力的网络模型中的生成对抗网络,计算获得具有图像识别泛化能力的网络模型中的生成对抗网络的模型损失,基于该模型损失并结合梯度下降方法优化具有图像识别泛化能力的网络模型的参数。
[0057]
优选地,还包括位于步骤s1之前的:
[0058]
通过mnist数据集对原始图片进行处理,获得像素为32*32,且通道数为rgb三通道的待处理特征图。
[0059]
由上述本发明的实施例提供的技术方案可以看出,本发明提供的基于注意力机制和生成对抗网络的图像识别泛化方法,设计了一种多层并行注意力机制模型捕获图像的细节特征,提出了发散数据融合算法提高分类器性能以及设计了扰动正则化实现最大域传递,并结合上述各个部分以及要解决的问题,提出了基于注意力机制和生成对抗网络的图像识别域泛化方法,建立了具有图像识别泛化能力的网络模型。本发明提供的方法,能够达到改善图像识别泛化模型“域偏移”现象的效果,提高了识别未知数据分布数据集图像的性能。
[0060]
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
[0061]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0062]
图1为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的处理流程图;
[0063]
图2为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的图像识别泛化模型的结构图;
[0064]
图3为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的多层并行注意力机制的结构图;
[0065]
图4为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的一种优选实施例的流程图;
[0066]
图5为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的一种优选实施例的数字识别系列数据集上的性能比较示意图;
[0067]
图6为本发明提供的一种基于注意力机制和生成对抗网络的图像识别泛化方法的一种优选实施例的在cifar-10系列数据集上的性能比较示意图。
具体实施方式
[0068]
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0069]
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
[0070]
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
[0071]
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
[0072]
本发明提供一种基于注意力机制和生成对抗网络的图像识别泛化方法,用于解决如下技术问题:
[0073]
1、改善网络结构充分捕获图像的细节特征,并进行特征融合,建立特征信息间的联系。
[0074]
2、完善数据增强的方法,对源域的数据进行更多训练并实现数据的发散,提高分类器的性能。
[0075]
3、同时在样本级和特征级上实现语义一致性,实现最大域传递。
[0076]
参见图1,本发明提供的方法,包括如下步骤:
[0077]
s1基于待处理的特征图的源域建立初始合并域,将该初始合并域输入到生成对抗网络中进行处理,获得第一虚拟增强域;
[0078]
s2对所述第一虚拟增强域的数据和源域的数据通过发散数据融合算法进行融合处理,获得目标合并域;
[0079]
s3将该目标合并域输入到生成对抗网络结合扰动正则化方法生成样本级和特征级均保证语义一致性的第二虚拟增强域;
[0080]
s4构建具有图像识别泛化能力的网络模型,将所述第二虚拟增强域输入到该具有图像识别泛化能力的网络模型中的具有多层注意力机制的图像识别网络中进行训练,优化其分类性能;将所述目标合并域输入到该具有图像识别泛化能力的网络模型中的生成对抗网络中进行训练,计算获得所述具有图像识别泛化能力的网络模型中的生成对抗网络的模型损失,基于该模型损失并结合梯度下降方法优化具有图像识别泛化能力的网络模型的参数;
[0081]
s5重复执行步骤s4,完成具有图像识别泛化能力的网络模型的构建;
[0082]
s6基于所述第二虚拟增强域数据建立总虚拟增强域;
[0083]
s7将所述待处理的特征图的源域与所述总虚拟增强域合并,随机获取样本数据输入所述具有图像识别泛化能力的网络模型中进行训练,计算获得生成对抗网络的模型损失和优化模型的参数;
[0084]
s8重复执行步骤s7,不断地通过梯度下降法更新所述具有图像识别泛化能力的网络模型学习到的权重;
[0085]
s9重复执行步骤s2至s8,获得最终训练的所述具有图像识别泛化能力的网络模型学习到的权重。
[0086]
在本发明提供的优选实施例中,步骤s1和s2以及发散数据融合算法具体包括:
[0087]
s11构造与待处理的特征图源域s完全相同的域s
cb
作为初始合并域s
cbk
,因此在生成虚拟增强域之前,合并域s
cb
采样的数据x
cb
均为源域s的数据xs。假设源域数据集有若干批次,其中bs表示批次大小,k代表当前虚拟增强域的个数且初始值为0,s
cb
每批次的数据x
bs
如式3所示:
[0088]
x
bs
={x
s1
,

,x
sj
}
ꢀꢀꢀ
(1);
[0089]
式中,j∈[1,bs]。
[0090]
s21将域s
cb
与待处理的特征图的源域s合并,获得虚拟增强域s
advk

[0091]
s21重复执行子步骤s11,随着迭代生成更多第一虚拟增强域s
advk
,需要将源域和虚拟增强域的数据进行融合,组成合并域s
cb
。至此合并域s
cb
每批次的采样数据x
cb
将来自源域s和当前循环生成多组第一虚拟增强域s
advk
,因此在迭代生成一个虚拟增强域后,合并域s
cb
每批次数据x
bs
将会变成如式4所示:
[0092]
x
bs
={x
s1
,

,x
sj
,x
advk1
,

,x
advkm
}
ꢀꢀꢀ
(2)。
[0093]
式中,m∈[1,bs]。x
sj
和x
advkm
表示合并域s
advk
每批次数据分别从源域s取样j张图像和从当前的虚拟增强域s
advk
中取样m张图像;迭代生成虚拟增强域时,源域数据分布并不会迅速扩散到源域外,所以需要输入更多的源域数据给予一定限制,而随着虚拟增强域个数增多后,增强域的数据分布已经能够逐渐地模拟更多未知域的数据分布,对源域数据的依赖将减小。设k为生成虚拟增强域的个数,因此从源域s和虚拟增强域s
advk
选取构成目标合并域c
advk
每批次数据个数的表达式分别如式5和式6所示:
[0094]cs
=bs/(k 1)
ꢀꢀꢀ
(3)和c
advk
=bs-csꢀꢀꢀ
(4)。
[0095]
本发明中设计了一种多层并行注意力机制模型捕获图像的细节特征,提出了发散数据融合算法提高分类器性能以及设计了扰动正则化实现最大域传递,并结合上述各个部分以及要解决的问题,提出了基于注意力机制和生成对抗网络的图像识别域泛化方法,建立了具有图像识别泛化能力的网络模型。该具有图像识别泛化能力的网络模型的结构如图2所示。其中生成对抗网络w,x代表输入图像,z代表提取特征。在模型训练过程中先完成对源域数据xs的特征映射,其次实现对源域的类别映射。采用迭代的方式逐步生成虚拟增强域s
advk
,对虚拟增强域进行特征映射,并通过合并域训练模型,判断生成虚拟增强域的特征分布是否在源域分布之外,并不断得更新模型的参数,最终实现最大化域传递的目的。
[0096]
进一步的,步骤s3中的扰动正则化就是满足样本级和特征级的要求生成虚拟增强域。在样本级上采用wasserstein距离作为度量的计算输入图像和重建图像之间(即待处理特征图和虚拟增强域之间)的数据关系,并确保图像的语义一致性,如式(5)所示:
[0097]
lr=minw||x-w(x)||2ꢀꢀꢀ
(5)。
[0098]
通过迭代对抗训练,使用wasserstein距离作为虚拟增强域特征z
advk
和合并域数据特征z
cbk
之间分布距离确保在特征层次的一致性,具体形式如式(6)所示:
[0099][0100]
获得了样本层级损失lr和特征层级损失l
con
可以通过常规方法控制或减少其值的方式实现优化生成对坑网络,继续迭代最终获得样本级和特征级均保证语义一致性的第二虚拟增强域s
advk

[0101]
更进一步的,如图3所示,步骤s4中的多层并行注意力机制模型由多条支路构成,该模型的输入为经过卷积层卷积操作输出的特征图。与此同时对输入的特征图进行多支路并行处理,最终将不同支路的特征向量进行融合得到输出的预测特征图。假设输入的第二虚拟增强域s
advk
的特征图为m∈r
c/2*h*w
,其中c,h和w分别代表输入特征图m的通道数、高度以及宽度。
[0102]
在a(m)、b(m)和c(m)三条支路中,均先对m进行1*1的卷积运算,并将它们的通道维度c均缩小到原来的1/2,得到全新的特征图的维度分别为ma∈r
c/2*h*w
,mb∈r
c/2*h*w
以及mc∈r
c/2*h*w
。其次对特征图ma和mb进行reshape操作,得到m
a1
∈r
h*w*c/2
和m
b1
∈r
h*w*c/2
,再对m
a1
进行转置处理并与m
b1
进行矩阵乘法运算,得到最终的像素相关性特征图m
ab
,其中m
ab
的表达式如式7所示:
[0103][0104]
其中i∈{1,2,

,n},m
ab
∈r
h*w*h*w
。将m
ab
进行softmax归一化处理与mc∈r
c/2*h*w
进行矩阵乘法运算,并结果将矩阵进行归一化操作,最终得到特征图m
abc
∈r
c/2*h*w
,m
abc
的具体计算如式8所示:
[0105][0106]
对特征图m
abc
进行1*1卷积运算,恢复到最初的通道数c,至此得到a(m)、b(m)和c(m)三条支路输出特征图m
f1
∈r
c*h*w
。在支路d(m)中,首先对输入的特征图m进行全局池化运算,将特征图m被压缩成md∈r
c*1*1
,再经过全连接层的降维操作,将通道数c缩小到c/16,使用relu激活函数进行非线性化处理。为了保证输出的特征图与输入特征图的尺寸相等,再经过一层全连接层进行上采样,将输出特征图的通道数恢复到最初的尺寸c,因此支路的最终特征图的维度为m
f2
∈r
c*h*w

[0107]
通过上述操作对各支路d(m)的特征图进行加权融合,因此多层并行注意力机制模型输出的预测特征图的形式如式9所示:
[0108]
mf=αfm
f1
βfm
f2
γfm
ꢀꢀꢀꢀꢀ
(9)
[0109]
其中αf、βf和γf为特征的权重系数,在模型不断地学习中逐渐更新权重大小,从而让多层并行注意力机制模型通过建立权重的依赖关系,关联到更多特征信息,模型的结构图如图3所示。
[0110]
本发明还提供一个实施例,用于显示使用本发明的方法的效果。
[0111]
如图4所示,本实施例的执行过程包括:
[0112]
第一步,先统一化训练模型和测试模型所用数据集的像素和通道数,本发明选用源域训练集为mnist数据集,并将数据集中图像的像素变为32*32,通道数为rgb三通道。
[0113]
第二步,先初始化,虚拟增强域的个数k为0,将源域s作为初始合并域s
cbk
,数据组成如公式(4)所示。
[0114]
第三步,当生成第一虚拟增强域s
advk
之后(或者说k大于0时)对将生成的第一虚拟对抗域s
advk
的数据x
advk
和源域s的数据xs进行发散数据融合处理,通过公式(6)、(7)计算每批次合并域s
cbk
的数据来源,同时组合成目标合并域c
advk

[0115]
第四步,将目标合并域c
advk
数据送进生成对抗网络并结合扰动正则化生成在对样本级和特征级均保证语义一致性的虚拟增强域s
advk

[0116]
第五步,用虚拟增强域s
advk
的数据x
advk
输入到含有多层注意力机制的图像识别网络,训练识别网络,优化分类性能。同时将目标合并域c
advk
的数据x
cbk
结合扰动正则化输入到生成对抗网络中,生成对抗样本进行对抗训练,计算生成对抗网络模型的损失同时通过梯度下降法优化参数。
[0117]
第六步,循环25次第五步。为了生成更多不同分布的增强数据,不断优化分类器的图像识别能力,以及能进一步得到能够扩大数据分布且模拟更多未知域的模型。
[0118]
第七步,将当前生成的虚拟增强域s
advk
的数据x
advk
添加到总虚拟增强域s
adv
中。
[0119]
第八步,将源域s和总的虚拟增强域s
adv
合并,并从中取样数据训练图像识别网络(采用与第五步相同的过程),不断计算损失,优化模型的参数。
[0120]
第九步,循环第八步,并将k增加1
[0121]
第十步,循环3次第三到第九步。3是数据集的阈值次数
[0122]
第十一步,循环第十步10000次。
[0123]
第十二步,结束全部循环,输出最终训练的识别模型学习到的权重。
[0124]
对本发明首先通过改善网络结构,融入多层次并行注意力机制,避免了模型在训练过程中无法达到充分提取图像特征的目的,在特征提取的过程中能够不断提取关键的特征,建立更多的信息联系。其次为了提高分类器的性能,完善数据增强的方法,在实现发散数据融合的过程中,随着生成虚拟增强域的增多,每批次合并域中数据比例会不断变化,实现了数据的发散。最终同时满足数据的样本级和特征级的语义一致性,实现最大域传递。
[0125]
本发明明显提高了图像识别模型的可移植性能,实验结果如图5和图6所示。
[0126]
图5中,选取mnist数据集作为源域训练集,syhn、mnist-m、syn以及usps这四组数字数据集作为测试集测试。通过图4表明,本发明在syhn、mnist-m和syn数据集上的测试结果明显高于其他方法,但是在usps数据集上的测试结果低于d-sne方法,这是因为d-sne只针对usps数据集的识别精度进行了大量的改进,d-sne在其他三组数据集的移植性能上表现很差,取四组测试集的平均结果,本发明明显高于其他方法。
[0127]
在图6中,将模型在svhn、mnist-m、syn和usps四个数据集的识别精度的平均值作为更新后模型移植性能的评估指标,明显的看出本发明的性能,与之前模型的图像识别的平均准确性相比有较大提升。
[0128]
综上所述,本发明提供的基于注意力机制和生成对抗网络的图像识别泛化方法,
设计了一种多层并行注意力机制模型捕获图像的细节特征,提出了发散数据融合算法提高分类器性能以及设计了扰动正则化实现最大域传递,并结合上述各个部分以及要解决的问题,提出了基于注意力机制和生成对抗网络的图像识别域泛化方法,建立了具有图像识别泛化能力的网络模型。本发明提供的方法,能够达到改善图像识别泛化模型“域偏移”现象的效果,提高了识别未知数据分布数据集图像的性能。
[0129]
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0130]
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0131]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0132]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献