一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

生成对抗网络的高分辨率数据重构方法及相关方法和设备与流程

2022-12-31 15:41:47 来源:中国专利 TAG:


1.本公开涉及通信技术领域,尤其涉及一种生成对抗网络的高分辨率数据重构方法、生成对抗网络的训练方法、生成对抗网络的高分辨率数据重构装置、生成对抗网络的训练装置、计算机可读存储介质及电子设备。


背景技术:

2.随着现代科技的高速发展,网络中生成的数据类型和数据量急剧增多,增大了网络运维人员数据处理的难度,且低分辨率的数据难以达到训练高准确率算法模型的需求。高分辨率数据的像素密度大,细节展现非常的清晰和丰富,高频成分非常多,可以满足研究学者对于数据的后期处理和实际应用的需求。数据超分辨率重构将低分辨率数据生成同场景高分辨率数据的过程,多应用在数据预处理、提取知识图谱的特征信息等领域中。
3.在传统高分辨率重构算法主要存在以下问题:
4.基于插值的方法过度依赖数据先验信息,所以性能表现的波动率大,高频部分的失真率也很大;基于卷积神经网络的方法缺少对特征空间关系的利用,其池化操作会大量丢失数据特征间的空间信息。
5.因此,如何提高高分辨率数据重构的性能以及进一步降低计算量是一个亟需解决的技术问题。
6.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

7.本公开的目的在于提供一种生成对抗网络的高分辨率数据重构方法、生成对抗网络的训练方法、生成对抗网络的高分辨率数据重构装置、生成对抗网络的训练装置、计算机可读存储介质及电子设备,以至少解决相关生成对抗网络的高分辨率数据重构技术中的计算量大、性能差的技术问题。
8.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
9.本公开的技术方案如下:
10.根据本公开的一个方面,提供一种生成对抗网络的高分辨率数据重构方法,该方法包括:输入特征信息至判别网络的胶囊网络结构,其中所述胶囊网络结构包括主胶囊层和数字胶囊层;在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取所述特征信息的不同空间特征信息,得到浅层胶囊信息;以及在所述数字胶囊层中使用动态路由算法将所述浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。
11.在本公开的一些实施例中,在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取所述特征信息的不同空间特征信息,得到浅层胶囊信息的步骤包括:通过不同卷积尺寸的三条支路进行多尺度特征提取,并通过交叉连接的方式提取所述三条支路
更高维的特征,得到全局残差;通过跳跃残差连接结构使所述主胶囊层的全局残差与局部残差相融合,得到所述不同空间特征信息作为所述浅层胶囊信息。
12.在本公开的一些实施例中,在所述数字胶囊层中使用动态路由算法将所述浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据的步骤包括:使用对数形式的压缩函数将所述浅层胶囊编码成向量胶囊;通过动态路由算法将所述向量胶囊转化为路由胶囊,并更新所述路由胶囊的激活概率,在每个不同尺度的卷积分支中把路由胶囊分别堆叠成数据胶囊矩阵;以及将两支路的数据胶囊组合成一个数字胶囊矩阵作为重构的数据。
13.在本公开的一些实施例中,在训练所述判别网络过程中,采用公式(2)作为损失函数。
14.在本公开的一些实施例中,对数形式的压缩函数表示为公式(1)。
15.在本公开的一些实施例中,输入特征信息至判别网络的胶囊网络结构的步骤之前,所述方法还包括:对所述待重构数据进行主成分分析处理提取所述待重构数据的特征向量;将所述待重构数据的特征向量输入到卷积层中提取浅层特征信息;以及对所述浅层特征信息进行批量归一化处理,得到所述特征信息。
16.根据本公开的一个方面,提供一种生成对抗网络的训练方法,该方法包括:搭建判别网络,所述判别网络中引入胶囊网络的结构,其中所述胶囊网络包括主胶囊层和数字胶囊层;在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,多尺度、多层次地提取输入信息的不同空间特征信息,得到浅层胶囊;在所述数字胶囊层中使用动态路由算法将所述浅层胶囊激活映射到高层胶囊生成高分辨率重构数据;保持生成网络的网络参数不变,使用真实数据预训练判别网络;采用损失函数优化判别网络,训练所述判别网络的损失函数表示为公式(2);使用所述判别网络训练所述生成网络,训练所述生成网络的损失函数表示为公式(3)。
17.在本公开的一些实施例中,该判别网络的主胶囊层还用于通过不同卷积尺寸的三条支路进行多尺度特征提取,并通过交叉连接的方式提取三条支路更高维的特征,得到全局残差;通过跳跃残差连接结构使主胶囊层的全局残差与局部残差相融合,得到不同空间特征信息作为浅层胶囊信息。
18.在本公开的一些实施例中,该判别网络的数字胶囊层还用于使用对数形式的压缩函数将所述浅层胶囊编码成向量胶囊;通过动态路由算法将向量胶囊转化为路由胶囊,并更新路由胶囊的激活概率,在每个不同尺度的卷积分支中把路由胶囊分别堆叠成数据胶囊矩阵;以及将两支路的数据胶囊组合成一个数字胶囊矩阵作为重构的数据。
19.在本公开的一些实施例中,在训练判别网络过程中,采用公式(2)作为损失函数。
20.在本公开的一些实施例中,对数形式的压缩函数表示为公式(1)。
21.在本公开的一些实施例中,该判别网络还可以包括特征信息提取层,用于对待重构数据进行主成分分析处理提取待重构数据的特征向量;将待重构数据的特征向量输入到卷积层中提取浅层特征信息;以及对浅层特征信息进行批量归一化处理,得到特征信息。
22.根据本公开的又一个方面,提供一种生成对抗网络的高分辨率数据重构装置,该装置包括:特征信息输入模块,用于输入特征信息至判别网络的胶囊网络结构,其中胶囊网络结构包括主胶囊层和数字胶囊层;浅层胶囊信息提取模块,用于在主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取特征信息的不同空间特征信息,得到浅层胶囊
信息;高分辨率重构模块,用于在数字胶囊层中使用动态路由算法将浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。
23.根据本公开的又一个方面,提供一种生成对抗网络的训练装置,该装置包括:网络搭建模块,用于搭建判别网络,所述判别网络中引入胶囊网络的结构,其中所述胶囊网络包括主胶囊层和数字胶囊层;在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,多尺度、多层次地提取输入信息的不同空间特征信息,得到浅层胶囊;在所述数字胶囊层中使用动态路由算法将所述浅层胶囊激活映射到高层胶囊生成高分辨率重构数据;判别网络训练模块,用于保持生成网络的网络参数不变,使用真实数据预训练判别网络;采用损失函数优化判别网络,训练判别网络的损失函数表示为上述公式(2);生成网络训练模块,用于使用判别网络训练所述生成网络,训练所述生成网络的损失函数表示为上述公式(3)。
24.根据本公开的再一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的生成对抗网络的高分辨率数据重构方法或生成对抗网络的训练方法。
25.根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的生成对抗网络的高分辨率数据重构方法或生成对抗网络的训练方法。
26.本发明采用无监督学习领域中的生成对抗网络模型,将多尺度卷积与多路径跳跃残差胶囊网络引入到判别网络中,提高同一层次多尺度局部特征的融合与提取能力,并降低网络训练的参数量,通过不同空间尺度的主胶囊网络让下一层的神经元仅提取上一层最活跃的特征,通过付出少量的计算代价来进一步提升算法的精准度。
27.进一步地,本公开的多尺度卷积多路径跳跃残差连接结构在训练的过程中涉及的参数量大大减少,传递梯度的效率更高,有效避免了梯度消失与梯度爆炸的问题。
28.更进一步地,采用胶囊网络将向量输出替换卷积神经网络的标量输出,增加了特征空间的空间识别率。
29.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
30.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1示出本公开实施例的一种生成对抗网络的高分辨率数据重构方法的流程示意图。
32.图2示出本公开实施例中一种生成对抗网络的高分辨率数据重构方法中提取特征信息的流程示意图。
33.图3示出本公开实施例中一种生成对抗网络的高分辨率数据重构方法中提取浅层胶囊信息的流程示意图。
34.图4示出本公开实施例中一种生成对抗网络的高分辨率数据重构方法中生成高分
辨率重构的数据的流程示意图。
35.图5示出本公开实施例中一种生成对抗网络的高分辨率数据重构方法中判别网络的结构示意图。
36.图6示出本公开实施例中一种生成对抗网络的训练方法的流程示意图。
37.图7示出本公开实施例中又一种生成对抗网络的训练方法的流程示意图。
38.图8示出本公开实施例中一种在生成对抗网络的训练过程中判别网络的损失函数的变化曲线示意图。
39.图9示出本公开实施例中一种在生成对抗网络的训练过程中生成网络的损失函数的变化曲线示意图。
40.图10示出本公开实施例中一种在生成对抗网络的训练过程中使用squash压缩函数的损失曲线。
41.图11示出本公开实施例中一种在生成对抗网络的训练过程中使用对数形式的squash压缩函数的损失曲线。
42.图12示出本公开实施例中的一种生成对抗网络的高分辨率数据重构方法和通过插值以及卷积神经网络的高分辨率数据重构方法生成的数据的频谱对比示意图。
43.图13示出本公开实施例中的一种生成对抗网络的高分辨率数据重构装置的结构示意图。
44.图14示出本公开实施例中的一种生成对抗网络的训练装置的结构示意图。
45.图15示出本公开实施例中一种电子设备的示意性框图。
具体实施方式
46.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
47.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
48.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个、三个等,除非另有明确具体的限定。
49.针对上述相关技术中存在的技术问题,本公开实施例提供了一种加密流量检测方法,以用于至少解决上述技术问题中的一个或全部。
50.需要指出的是,本技术实施例中涉及的名词或术语可以相互参考,不再赘述。
51.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行地描述。
52.下面,将结合附图及实施例对本示例实施方式中的生成对抗网络的高分辨率数据
重构方法的各个步骤进行更详细的说明。
53.图1示出本公开实施例的一种生成对抗网络的高分辨率数据重构方法的流程示意图。如图1所示,方法100可以包括以下步骤:
54.在步骤s110中,输入特征信息至判别网络的胶囊网络结构,其中胶囊网络结构包括主胶囊层和数字胶囊层。
55.其中,生成对抗网络包括判别网络和生成网络。其中,判别网络包括胶囊网络结构。
56.在步骤s120中,在主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取特征信息的不同空间特征信息,得到浅层胶囊信息。
57.其中,多尺度卷积多路径跳跃残差连接的密集块包括多个不同尺寸的卷积模块交叉和跳跃的连接结构。
58.在步骤s130中,在数字胶囊层中使用动态路由算法将浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。
59.其中,动态路由算法的基本思想是用一个变换矩阵去转换输入的浅层胶囊信息,将转换后的信息分组形成高层胶囊信息作为高分辨率重构的数据。
60.本发明采用无监督学习领域中的生成对抗网络模型,将多尺度卷积与多路径跳跃残差胶囊网络引入到判别网络中,提高同一层次多尺度局部特征的融合与提取能力,并降低网络训练的参数量,通过不同空间尺度的主胶囊网络让下一层的神经元仅提取上一层最活跃的特征,通过付出少量的计算代价来进一步提升算法的精准度。
61.进一步地,本公开的多尺度卷积多路径跳跃残差连接结构在训练的过程中涉及的参数量大大减少,传递梯度的效率更高,有效避免了梯度消失与梯度爆炸的问题。
62.更进一步地,采用胶囊网络将向量输出替换卷积神经网络的标量输出,增加了特征空间的空间识别率。
63.在本公开的一些实施例中,判别网络还可以包括特征提取网络,该特征提取网络用于提取特征信息,以将特征信息输入至胶囊网络结构。特征提取网络可以例如图5所示的判别网络结构500中的510部分。具体地,特征提取网络执行的提取特征信息的方法可以包括例如图2示出的方法。如图2所示,方法200可以包括以下步骤:
64.在步骤s210中,对待重构数据进行主成分分析处理提取待重构数据的特征向量。
65.其中,采用主成分分析pca技术对待重构数据进行降维处理,在保留有效特征信息的基础上可以减少数据量,从而达到减少训练时间的目的。
66.在步骤s220中,将待重构数据的特征向量输入到卷积层中提取浅层特征信息。
67.在本公开的一些实施例中,可以将待重构数据的特征向量输入到基础卷积神经网络中,以使基础卷积神经网络对特征向量进行浅层学习,得到浅层特征信息。其中,基础卷积神经网络可以为包括一层或多层卷积层(如,3x3 conv)的神经网络。
68.在步骤s230中,对浅层特征信息进行批量归一化处理,得到特征信息。
69.综上,本公开实施例的方法通过特征提取网络处理信息可以减少判别网络的计算工作量,降低数据维度。
70.在本公开的一些实施例中,主胶囊层可以例如图5所示的520部分。用于执行步骤s120,具体地,步骤s120可以包括例如图3示出的方法。如图3所示,方法300可以包括以下步
骤:
71.在步骤s310中,通过不同卷积尺寸的三条支路进行多尺度特征提取,并通过交叉连接的方式提取三条支路更高维的特征,得到全局残差。
72.例如,图5中520部分的不同卷积尺寸的三条支路可以分别包括3x3、5x5、7x7conv卷积模块。特征信息首先通过三个卷积模块进行多尺度特征提取,并进一步通过交叉连接的虚线进行特征复用提取更高维的特征得到全局残差以优化胶囊质量。
73.在步骤s320中,通过跳跃残差连接结构使主胶囊层的全局残差与局部残差相融合,得到不同空间特征信息作为浅层胶囊信息。
74.其中,跳跃残差连接结构用于在每个卷积模块后用跳跃连接的方式进行残差的传递得到局部残差。将全局残差与局部残差相加,得到不同空间特征信息作为浅层胶囊信息。
75.本公开实施例的方法可以通过交叉连接的方式提取三条支路更高维的特征,优化胶囊质量。进一步地,通过跳跃残差连接结构使主胶囊层融合全局和局部残差,又增加了特征提取的感受野,增强胶囊对于数据的自适应性。更进一步地,在不同胶囊分支中生成不同维度的胶囊向量表征不同尺度的特征信息,与传统单路胶囊网络相比,增加了网络特征的提取能力,更有利于生成多路径多尺度路由信息。
76.在本公开的一些实施例中,数字胶囊层可以例如图5所示的530部分。用于执行步骤s130,具体地,步骤s130还可以包括例如图4示出的方法。如图4所示,方法400可以包括以下步骤:
77.在步骤s410中,使用对数形式的压缩函数将浅层胶囊编码成向量胶囊。
78.在步骤s420中,通过动态路由算法将向量胶囊转化为路由胶囊,并更新路由胶囊的激活概率,在每个不同尺度的卷积分支中把路由胶囊分别堆叠成数据胶囊矩阵。
79.在步骤s430中,将两支路的数据胶囊组合成一个数字胶囊矩阵作为重构的数据。
80.本公开实施例的方法通过设计对数形式的压缩函数,具有高效、快速的动态调整函数范围的作用,使网络迭代训练的收敛速度更快,网络的稳定性增强。解决了现有技术无法动态调整函数的变化范围,网络收敛速度慢的问题。
81.在胶囊数量庞大的情况下,squash压缩函数不能保留大量有效的数据特征信息,导致了网络高分辨率重构效果变差。因此,在本公开的一些实施例中,对数形式的压缩函数可以基于squash压缩函数进行改进,表示为公式(1):
[0082][0083]
其中,uj是浅层胶囊j总的输入信息。从而使本公开实施例中的压缩函数在胶囊数量庞大的情况下,具有保存有效数据特征信息和抑制无用数据特征信息的能力,节省机器的内存资源。
[0084]
在本公开的一些实施例中,训练判别网络(例如图5所示的判别网络结构)的损失函数可以表示为公式(2):
[0085]
maxgv(d,g)=maxe
x~pdata(x)
[m
-logd(x)]2 e
z~pz(z)
[log(1-d(g(z)))-m-]2ꢀꢀ
(2)
[0086]
其中,maxgv(d,g)为最大化判别网络的判别能力,x为输入的真实数据,而g(z)代表生成网络的输出数据;logd(x)为判别网络判定为真实数据的概率,log(1-d(g(z)))为判别网络将生成网络生成的“虚假”数据判定为0的概率;m

和m-分别设为0.8与0.2;e
x~pdata(x)
表示真实数据的分布期望;e
z~pz(z)
表示随机噪声的分布期望。
[0087]
图12示出本公开实施例中的一种生成对抗网络的高分辨率数据重构方法和通过插值以及卷积神经网络的高分辨率数据重构方法生成的数据的频谱对比示意图。数据频谱越宽主频成分越大,则数据的分辨率越高。从图12可知,本公开所用对抗生成网络的主频成分相对最大,大约32hz左右,频宽为30hz左右。优于插值算法(主频成分大约22hz,频宽为10hz),卷积神经网络的高分辨率算法(主频成分大约30hz,频宽为15hz),这验证了本公开方法的有效性。
[0088]
图6示出本公开实施例中一种生成对抗网络的训练方法的流程示意图。如图6所示,方法600可以包括以下步骤:
[0089]
在步骤s610中,搭建判别网络,该判别网络中引入胶囊网络的结构,其中胶囊网络包括主胶囊层和数字胶囊层;在主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,多尺度、多层次地提取输入信息的不同空间特征信息,得到浅层胶囊;在所述数字胶囊层中使用动态路由算法将浅层胶囊激活映射到高层胶囊生成高分辨率重构数据。
[0090]
在步骤s620中,保持生成网络的网络参数不变,使用真实数据预训练判别网络;采用损失函数优化判别网络,训练判别网络的损失函数表示为上述公式(2);其中,logd(x))为判别网络判定为真实数据的概率,log(1-d(g(z)))为判别网络将生成网络生成的“虚假”数据判定为0的概率;m

和m-分别设为0.8与0.2;e
x~pdata(x)
表示真实数据的分布期望;e
z~pz(z)
表示随机噪声的分布期望。
[0091]
在步骤s630中,使用判别网络训练生成网络,训练生成网络的损失函数表示为公式(3):
[0092]
mingv(d,g)=e
z~pz(z)
[log(1-d(g(z)))]
ꢀꢀꢀꢀ
(3)
[0093]
其中,g(z)代表生成网络的输出数据,e
z~pz(z)
表示随机噪声的分布期望;保持判别网络的网络参数不发生变化,直到损失函数震荡减小,网络趋于收敛的状态。
[0094]
本发明采用无监督学习领域中的生成对抗网络模型,将多尺度卷积与多路径跳跃残差胶囊网络引入到判别网络中,提高同一层次多尺度局部特征的融合与提取能力,并降低网络训练的参数量,通过不同空间尺度的主胶囊网络让下一层的神经元仅提取上一层最活跃的特征,通过付出少量的计算代价来进一步提升算法的精准度。
[0095]
进一步地,本公开的多尺度卷积多路径跳跃残差连接结构在训练的过程中涉及的参数量大大减少,传递梯度的效率更高,有效避免了梯度消失与梯度爆炸的问题。
[0096]
更进一步地,采用胶囊网络将向量输出替换卷积神经网络的标量输出,增加了特征空间的空间识别率。
[0097]
在本公开的一些实施例中,图7所示的训练过程700,先搭建判别网络710,在判别网络中引入胶囊网络结构进行高分辨率数据重构。其中,判别网络的主胶囊层采用多尺度卷积(例如使用3x3、5x5、7x7的并行卷积模块)多层次提取数据特征;使用跳跃连接的残差块传输每层网络的残差。其中,判别网络的数字胶囊层运用动态路由算法,在网络迭代过程中激活与原始真实数据分布相似的高分辨率数据标签。最后,判别网络使用改进式压缩函数,使短向量被压缩至接近0的长度,长向量压缩至接近1的长度,对网络参数进行强化压缩。在步骤s702中,使用公式(2)计算的误差不断去训练更新判别网络中的胶囊网络结构,使判别网络达到较好的性能。在步骤s704中,让训练好的判别网络不发生变化,向生成网络
720输入随机下采样的数据使用公式(3)训练更新生成网络,进行多次迭代后,保存网络模型参数。在步骤s706中,再使用训练好的生成网络720训练判别网络710。通过轮流迭代训练生成网络和判别网络,使公式(2)和公式(3)的损失数值达到最小。
[0098]
具体地,图7的迭代训练过程可以通过表(一)所示的算法实现:
[0099][0100]
在本公开的一些实施例中,在训练过程中公式(2)的训练曲线可以如图8示出的变化曲线示意图。图8中的箭头方向代表判别网络的损失函数训练趋势,其训练目的是最大化判别网络的判别能力,使判别网络可以判别输入数据是来自真实的数据,还是由生成网络生成。
[0101]
在本公开的一些实施例中,在训练过程中公式(3)的训练曲线可以如图9示出的变化曲线示意图。图9中的箭头方向代表生成网络的损失函数训练趋势,其训练目的是最小化生成网络的损失函数,使生成网络的输出数据与真实数据的分布差异性减小。
[0102]
在本公开的一些实施例中,在训练过程中判别网络使用对数形式的squash压缩函数对网络参数进行强化压缩。效果对比如图10和图11所示。图10示出在生成对抗网络的训练过程中使用squash压缩函数的损失曲线。图11示出在生成对抗网络的训练过程中使用对数形式的squash压缩函数的损失曲线。其中,横坐标的含义是网络训练的迭代次数,纵坐标表示网络的损失数值。若损失数值没有大幅度的变化,则必须停止当前的网络训练过程,需要进行调整参数来得到满意的训练结果。若损失数值不断震荡,而且总是上升,则需停止当前的网络训练过程,需要进行参数调整来得到较满意的训练结果。若损失数值不断下降,就可以继续训练此网络。如图10所示,在80个epoch之后网络损失数值的震荡幅度很大,仍未收敛,稳定性差。而图11中,在经过60个epoch之后,网络的损失函数趋于平稳的状态。通过对比图10和图11可以看出,采用对数形式的squash的压缩函数的生成对抗网络收敛的速度加快,震荡幅度明显减小。
[0103]
图13示出本公开实施例中一种生成对抗网络的高分辨率数据重构装置的示意图。如图13所示,该装置1300包括:
[0104]
特征信息输入模块1310,用于输入特征信息至判别网络的胶囊网络结构,其中胶囊网络结构包括主胶囊层和数字胶囊层;浅层胶囊信息提取模块1320,用于在主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取特征信息的不同空间特征信息,得到浅层胶囊信息;高分辨率重构模块1330,用于在数字胶囊层中使用动态路由算法将浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。
[0105]
在本公开的一些实施例中,浅层胶囊信息提取模块1320,还可以用于通过不同卷积尺寸的三条支路进行多尺度特征提取,并通过交叉连接的方式提取所述三条支路更高维的特征,得到全局残差;通过跳跃残差连接结构使所述主胶囊层的全局残差与局部残差相融合,得到所述不同空间特征信息作为所述浅层胶囊信息。
[0106]
在本公开的一些实施例中,高分辨率重构模块1330,还可以用于使用对数形式的压缩函数将浅层胶囊编码成向量胶囊;通过动态路由算法将向量胶囊转化为路由胶囊,并更新路由胶囊的激活概率,在每个不同尺度的卷积分支中把路由胶囊分别堆叠成数据胶囊矩阵;以及将两支路的数据胶囊组合成一个数字胶囊矩阵作为重构的数据。
[0107]
在本公开的一些实施例中,在训练判别网络过程中,采用公式(2)作为损失函数。
[0108]
在本公开的一些实施例中,对数形式的压缩函数表示为公式(1)。
[0109]
在本公开的一些实施例中,装置1300还可以包括特征信息提取模块,用于对待重构数据进行主成分分析处理提取所述待重构数据的特征向量;将待重构数据的特征向量输入到卷积层中提取浅层特征信息;以及对浅层特征信息进行批量归一化处理,得到特征信息。
[0110]
图14示出本公开实施例中的一种生成对抗网络的训练装置的结构示意图。如图14所示,该装置1400包括:
[0111]
网络搭建模块1410,用于搭建判别网络,所述判别网络中引入胶囊网络的结构,其中所述胶囊网络包括主胶囊层和数字胶囊层;在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,多尺度、多层次地提取输入信息的不同空间特征信息,得到浅层胶囊;在所述数字胶囊层中使用动态路由算法将所述浅层胶囊激活映射到高层胶囊生成高分辨率重构数据;判别网络训练模块1420,用于保持生成网络的网络参数不变,使用真实数据预训练判别网络;采用损失函数优化判别网络,训练判别网络的损失函数表示为上述公式(2);生成网络训练模块1430,用于使用判别网络训练所述生成网络,训练所述生成网络的损失函数表示为上述公式(3)。
[0112]
在本公开的一些实施例中,该判别网络的主胶囊层还用于通过不同卷积尺寸的三条支路进行多尺度特征提取,并通过交叉连接的方式提取三条支路更高维的特征,得到全局残差;通过跳跃残差连接结构使主胶囊层的全局残差与局部残差相融合,得到不同空间特征信息作为浅层胶囊信息。
[0113]
在本公开的一些实施例中,该判别网络的数字胶囊层还用于使用对数形式的压缩函数将所述浅层胶囊编码成向量胶囊;通过动态路由算法将向量胶囊转化为路由胶囊,并更新路由胶囊的激活概率,在每个不同尺度的卷积分支中把路由胶囊分别堆叠成数据胶囊矩阵;以及将两支路的数据胶囊组合成一个数字胶囊矩阵作为重构的数据。
[0114]
在本公开的一些实施例中,在训练判别网络过程中,采用公式(2)作为损失函数。
[0115]
在本公开的一些实施例中,对数形式的压缩函数表示为公式(1)。
[0116]
在本公开的一些实施例中,该判别网络还可以包括特征信息提取层,用于对待重构数据进行主成分分析处理提取待重构数据的特征向量;将待重构数据的特征向量输入到卷积层中提取浅层特征信息;以及对浅层特征信息进行批量归一化处理,得到特征信息。
[0117]
关于上述实施例中的生成对抗网络的高分辨率数据重构装置1300、生成对抗网络的训练装置1400,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0118]
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0119]
下面参照图15来描述根据本公开的这种实施方式的电子设备1500。图15显示的电子设备1500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0120]
如图15所示,电子设备1500以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530。
[0121]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1510执行,使得所述处理单元1510执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元1510可以执行如图1中所示的步骤s110,输入特征信息至判别网络的胶囊网络结构,其中所述胶囊网络结构包括主胶囊层和数字胶囊层;步骤s120,在所述主胶囊层中运用多尺度卷积多路径跳跃残差连接的密集块,提取所述特征信息的不同空间特征信息,得到浅层胶囊信息;步骤s130,在所述数字胶囊层中使用动态路由算法将所述浅层胶囊信息激活映射到高层胶囊信息生成高分辨率重构的数据。
[0122]
存储单元1520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)1521和/或高速缓存存储单元1522,还可以进一步包括只读存储单元(rom)1523。
[0123]
存储单元1520还可以包括具有一组(至少一个)程序模块1525的程序/实用工具1524,这样的程序模块1525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0124]
总线1530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0125]
电子设备1500也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1500交互的设备通信,和/或与使得该电子设备1500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口1550进行。并且,电子设备1500还可以通过网络适配器1560与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器1560通过总线1530与电子设备1500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1500使用其它硬件和/或软件模块,
包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0126]
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
[0127]
根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、服务器、终端或者器件使用或者与其结合使用。
[0128]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、服务器、终端或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0129]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、服务器、终端、或者器件使用或者与其结合使用的程序。
[0130]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0131]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0132]
根据本公开的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例的各种可选实现方式中提供的方法。
[0133]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模
块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0134]
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0135]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
[0136]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献