一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种联合形状变换和纹理转换的古文字生成方法与流程

2022-05-17 23:30:15 来源:中国专利 TAG:


1.本发明属于图像处理与人工智能技术领域,特别是涉及一种联合形状变换和纹理转换的古文字生成方法。


背景技术:

2.基于深度学习的算法往往需要依赖海量的训练数据来提升算法性能,其中,监督学习算法对数据标注有着极大的依赖性,因此,以低人工成本的方式获取标注数据引起人们的重视,常见的方法有数据增广、数据生成等。然而,对于前景形状多样、背景纹理丰富的古文字图像来说,由于数据增广一般依赖于人工设计的先验概率分布,能带来的数据多样性十分有限。相反,数据生成通过直接拟合数据的分布,有利于挖掘更加多样的数据。
3.目前最常用的数据生成技术是生成对抗网络,其中,基于生成对抗网络的形状变换方法和纹理转换方法在文字生成领域中分别都具有较高的研究热度。基于生成对抗网络的形状变换方法通常将空间变换网络、空洞卷积、可变形卷积等方法和对抗学习结合起来,实现了文字的形状变换,其中,空洞卷积和可变形卷积在海量标注训练数据的支撑下可以实现较好的形变结果,而空间变换网络更加适用于无监督的学习,对训练数据的需求相对较低。另一方面,一些方法通过条件生成对抗网络实现有监督的纹理转换,还有一些方法通过循环生成对抗网络框架来实现对纹理样式的进行无监督转换,其中无监督纹理转换几乎不需要标注数据,这对于数据量较小的古文字图像十分友好。
4.现有的文字生成技术主要是将上述的形状变换方法和纹理转换生成对抗网络分别进行独立训练,然后进行堆叠连接,用于生成形状和纹理层面上都较为逼真的样本,但是这种连接方式可能导致训练时梯度消失以及生成图像形状和纹理特征融合后不一致的问题。
5.现有技术的形状变换技术是一种随机字形增广方式,需要根据经验从人工设计的先验分布中对形变参数进行随机采样,以此产生多样性。但是,人工设计的分布不一定能拟合真实的古文字形状的分布,且分布的计算和选取复杂,这种做法既耗费大量的人工成本,而且分布拟合的误差会导致数据生成质量较低。且如果将形状变换模型和纹理转换模型进行简单的堆叠连接,既容易产生梯度消失的问题,又无法对形状变换模型和纹理转换模型进行联合调优,容易导致形状变换后的字符前景和纹理丰富的背景无法实现较好的融合,降低古文字生成的质量。


技术实现要素:

6.有鉴于此,有必要针对上述技术问题,提供一种联合形状变换和纹理转换的古文字生成方法,所述方法采用一种结合仿射变换和薄板样条(thin plate spline, tps)变换的形状变换生成对抗网络,该网络能从数据中自主学习目标形状概率分布,还能产生更加精细化的形状变换,同时所述方法采用一种基于信息交互的训练方式来联合优化多个生成对抗网络,使它们能够相互促进调优,提高生成样本的质量。
7.本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括以下步骤:步骤1,构建形状变换生成对抗网络a,包括生成器a1和判别器a2;首先,以临摹古文字图像作为生成器a1的输入,经过空间变换之后产生形变的字符图像,将生成器a1的输出端与判别器a2的输入端连接,同时,将目标字符图像输入到判别器a2的另一个输入端,判别器a2输出对形变的字符图像和目标字符图像的判别结果;步骤2,构建纹理转换生成对抗网络b,包括生成器b1、判别器b2、生成器b3和判别器b4,纹理转换生成对抗网络b为循环生成对抗网络;首先,将临摹古文字图像输入到生成器b1,生成器b1的输出端与判别器b2的输入端相连,接着,把摄影古文字图像输入到判别器b2中,同时,将摄影古文字图像输入到生成器b3,生成器b3的输出端与判别器b4的输入端相连,接着把临摹古文字图像输入到判别器b4中,分别从判别器b2和判别器b4获得摄影古文字图像纹理和临摹古文字图像纹理的判别结果;步骤3,将形状变换生成对抗网络a和纹理转换生成对抗网络b进行连接,获得摄影古文字生成网络模型;形状变换生成对抗网络a中的生成器a1的输出与纹理转换生成对抗网络b中的生成器b1的输入端相连接,将纹理转换生成对抗网络b中的生成器b3的输出端与形状变换生成对抗网络a中的判别器a2的输入端相连接,即此时生成器b3的输出作为形状变换生成对抗网络a的目标字符图像,生成器a1的输出作为形变的字符图像,输入到生成器b1中;步骤4,联合训练摄影古文字生成网络模型中的形状变换生成对抗网络a和纹理转换生成对抗网络b;步骤5,使用训练好的生成器a1和生成器b1,将生成器a1的输出端与生成器b1输入端相连,获得摄影古文字图像生成器;步骤6,采用所述的摄影古文字图像生成器进行古文字生成。
8.具体地,所述的生成器a1为一个空间变换网络,包括编码器、预测器、采样器、噪声重建网络和图像重建网络;所述的编码器由多个卷积模块构成,每一个卷积模块包括一个二维卷积层、一个非线性激活层和一个汇聚层顺序连接;所述的预测器由多个全连接模块和最后一个全连接层构成,每一个全连接模块包括一个全连接层和一个非线性激活层,最后一个全连接层的输出通道数量设置为所需预测的形变参数的个数;所述的采样器通过在采样网格上应用矩阵乘法将形变的字符图像像素区域映射到临摹古文字图像像素区域;所述的图像重建网络由多个全连接模块、一个全连接层和多个转置卷积模块顺序连接,每一个转置卷积模块包含依次连接的一个转置卷积层和一个非线性激活层;所述的噪声重建网络由多层全连接模块和一个全连接层顺序连接;所述的判别器a2基于patchgan的结构,由依次连接的五个卷积模块组成,前四个卷积模块中每个卷积模块包括一个二维卷积层、一个实例归一化层、一个leakyrelu激活层,最后一个卷积模块包括一个padding层和一个二维卷积层;首先,临摹古文字图像作为编码器的输入,编码器从临摹古文字图像中提取形状特征,输出一个形状特征向量,然后,从标准正态分布中随机选取一个噪声隐向量,将
形状特征向量和噪声隐向量进行融合,将融合后的隐向量输入到预测器中,预测器负责映射出tps变换参数和仿射变换参数,tps变换参数为tps变换采样网格匹配点的坐标值,将仿射变换参数转化为仿射变换采样网格,接着,将tps变换采样网格和仿射变换采样网格以及临摹古文字图像输入到采样器中,输出形变的字符图像,同时,将预测器输出端与图像重建网络和噪声重建网络的输入端连接,分别重建出输入的临摹古文字图像和噪声隐向量,接着,将生成器输出的形变的字符图像和目标字符图像分别输入到判别器,判别器输出对形变的字符图像和目标字符图像的判别结果。
9.可选地,编码器中所述的每一个卷积模块还包括一个批归一化层,位于二维卷积层和非线性激活层中间;编码器中所述的非线性激活层的非线性激活函数选择relu函数,所述的汇聚层的汇聚运算选择最大化汇聚。
10.可选地,预测器中所述的每一个全连接模块还包括一个批归一化层,位于全连接层和非线性激活层中间;预测器中所述的非线性激活层的非线性激活函数选择relu函数,所述的汇聚层的汇聚运算选择最大化汇聚。
11.优选地,预测器中所述的最后一个全连接层的输出通道数量设置为132,所需预测的形变参数中128个参数为64个tps变换采样网格匹配点的坐标,4个参数为仿射变换矩阵的元素值。
12.具体地,所述的采样器通过pytorch中的torch.nn.functional.grid_sample()方法实现,同时,通过pytorch中的torch.nn.functional.affine_grid()方法将仿射参数转化为仿射变换采样网格。
13.具体地,生成器b1依次连接的三个卷积模块、四个残差卷积模块,三个转置卷积模块和一个输出卷积模块,每个卷积模块的结构包含依次连接的一个二维卷积层、一个实例归一化层和一个非线性relu激活层,每个残差卷积模块包含依次连接的两个卷积模块和一个加法器,加法器将残差模块的输入端和输出端进行加法运算,每个转置卷积模块包含依次连接的一个转置卷积层、一个实例归一化层和一个非线性relu激活层,输出卷积模块包含依次连接的一个卷积层和tanh激活函数;生成器b3和生成器b1的结构相同;所述的判别器b2和判别器b4的结构与判别器a2相同;优先地,在a1和b1之间,以及b3和a2之间切断了梯度回传,形状变换生成对抗网络a和纹理转换生成对抗网络b通过图像信息的前向传播进行交互。
14.优选地,构建形状变换生成对抗网络a的最小二乘生成对抗损失函数作为训练的优化目标,最小二乘生成对抗损失函数计算公式为:优化目标,最小二乘生成对抗损失函数计算公式为:优化目标,最小二乘生成对抗损失函数计算公式为:表示生成器a1的损失函数,表示形状变换生成对抗网络a中的判别器,表示形状变换生成对抗网络a中的生成器,表示信噪重建损失函数,表示多样性损失函数,表示判别器a2的损失函数,表示临摹古文字图像,表示目标字符图像,和表示求相应的数学期望。
15.所述的信噪重建损失函数包括信号重建子项、噪声重建子项和重建误差比值项,计算公式如下:计算公式如下:表示平均绝对误差,表示噪声隐向量,和分别表示图像重建网络和重建后的临摹古文字图像和噪声隐向量,是动态系数,如果重建误差比值项大于logm,设α=1,当重建误差比值项小于

logm时,设α=

1,如果重建误差比值项在理想范围内,即[

logm,logm],则设置α=0,m表示超参数;所述的多样性损失函数的计算公式如下:其中p表示预测器,e表示编码器,和分别表示取自相同高斯分布的不同噪声隐向量。
[0016]
优选地,构建纹理转换生成对抗网络b的最小二乘生成对抗损失函数作为训练的优化目标,最小二乘生成对抗损失函数计算公式为:优化目标,最小二乘生成对抗损失函数计算公式为:其中,表示由输入的临摹古文字图像和生成器a1输出的形变的字符图像共同构成的集合中的样本,y表示摄影古文字图像,表示纹理转换生成对抗网络b中的摄影古文字图像纹理判别器,表示纹理转换生成对抗网络b中的摄影古文字图像纹理生成器,表示纹理转换生成对抗网络b中的临摹古文字图像纹理判别器,表示纹理转换生成对抗网络b中的临摹古文字图像纹理生成器,表示笔划感知循环一致性损失函数,计算公式为:其中x表示临摹古文字图像,y表示摄影古文字图像,表示向量元素内积,w为从临摹古文字图像中提取的权重矩阵,计算如下:其中,和分别为笔画区域的面积和背景区域的面积。
[0017]
具体地,tps变换的目标是求解一个形变函数,使得,且弯曲能量函数最小,表示原始字符图像上的tps变换采样网格匹配点的坐标,表示形变的字符图像的tps变换采样网格匹
配点的坐标,为一个tps变换采样网格匹配点的个数,假设已经获取到两张图像的n组匹配点对:、、

、,把形变函数想象成弯折一块薄金属板,使这块板穿过给定的n个tps变换采样网格匹配点,弯曲薄板的能量函数表示为:能够证明薄板样条函数就是弯曲能量最小的函数,薄板的样条函数为:其中u为基函数:其中u为基函数:其中u为基函数:,,和通过n个tps变换采样网格匹配点坐标的预设值和预测器预测的偏移量来求解,由此可以获得具体表达式。
[0018]
所述的仿射变换采样网格的采样公式如下:其中,scale,theta ,,分别表示预测器预测出的仿射变换参数,和分别为变换前后的像素点的位置坐标。
[0019]
优选地,所有图像的像素尺寸为64*64,批大小为64,形状变换生成对抗网络a的初始学习率为0.0001,纹理转换生成对抗网络b的学习率为0.001,训练迭代次数为30000,在15000次迭代后学习率开始线性衰减至1e-5,网络采用adam优化器进行优化。
[0020]
与现有技术相比,本发明的有益效果在于:本发明方法采用带重建分支的空间变换网络作为形状变换生成对抗网络的生成器,从全局和局部两个层次自动学习摄影古文字图像的形状分布,不需要人工预先设定形状分布,减少人工成本的同时提高生成样本的真实性和多样性;本发明方法实现形状变换生成对抗网络和纹理转换生成对抗网络的联合调优,使形状变换后的字符前景和纹理丰富的背景实现更好的融合,提高生成样本的真实性。
附图说明
[0021]
图1示出了本发明实施方法的流程示意图;图2示出了本发明实施例中形状变换生成对抗网络的结构示意图;
图3示出了本发明实施例中纹理转换生成对抗网络的结构示意图;图4示出了本发明实施例中摄影古文字生成网络模型的结构示意图。
具体实施方式
[0022]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023]
为了引用和清楚起见,下文中使用的技术名词、简写或缩写总结解释如下:stn:spatialtransformationnetwork空间变换网络。
[0024]
tps: thin plate spline, 薄板样条函数。
[0025]
cnn: convolutional neural network 卷积神经网络。
[0026]
fc network:fully connected network 全连接网络。
[0027]
pytorch:一种主流的深度学习框架,封装了许多常用的深度学习相关的函数和类。
[0028]
relu/leakyrelu:非线性激活函数。
[0029]
生成对抗网络:一种基于零和博弈思想的生成式网络训练框架,包括生成器和判别器两种网络模块。
[0030]
隐向量:随机变量空间中的向量。
[0031]
本发明公开了一种联合形状变换和纹理转换的古文字生成方法,以解决现有技术中存在的诸多问题。图1示出了本发明实施例的方法流程示意图,一种联合形状变换和纹理转换的古文字生成方法,包括以下步骤:步骤1,构建形状变换生成对抗网络a,包括生成器a1和判别器a2;首先,以临摹古文字图像作为生成器a1的输入,经过空间变换之后产生形变的字符图像,将生成器a1的输出端与判别器a2的输入端连接,同时,将目标字符图像输入到判别器a2的另一个输入端,判别器a2输出对形变的字符图像和目标字符图像的判别结果;步骤2,构建纹理转换生成对抗网络b,包括生成器b1、判别器b2、生成器b3和判别器b4,纹理转换生成对抗网络为循环生成对抗网络;首先,将临摹古文字图像输入到生成器b1,生成器b1的输出端与判别器b2的输入端相连,接着,把摄影古文字图像也输入到判别器b2中,同时,将摄影古文字图像输入到生成器b3,生成器b3的输出端与判别器b4的输入端相连,接着把临摹古文字图像也输入到判别器b4中,分别从判别器b2和判别器b4获得摄影古文字图像纹理和临摹古文字图像纹理的判别结果;步骤3,将形状变换生成对抗网络a和纹理转换生成对抗网络b进行连接,获得摄影古文字生成网络模型;形状变换生成对抗网络a中的生成器a1的输出与纹理转换生成对抗网络b中的生成器b1的输入端相连接,将纹理转换生成对抗网络b中的生成器b3的输出端与形状变换生成对抗网络a中的判别器a2的输入端相连接,即此时生成器b3的输出作为形状变换生成对抗网络a的目标字符图像,生成器a1的输出作为形变的字符图像,输入到生成器b1中;步骤4,联合训练摄影古文字生成网络模型中的形状变换生成对抗网络a和纹理转
换生成对抗网络b;步骤5,使用训练好的生成器a1和生成器b1,将生成器a1的输出端与生成器b1输入端相连,获得摄影古文字图像生成器;步骤6,采用所述的摄影古文字图像生成器进行古文字生成。
[0032]
具体地,本实施例采用如下步骤进行发明方法的实施。
[0033]
1、搜集手工临摹的古文字图像数据和真实场景下拍摄的古文字图像数据,其中手共临摹的古文字图像可以是由绘画数位板、电子平板等手写数据收集设备或者类似于photoshop等计算机绘画软件产生的字符图像。为搜集的临摹古文字图像和摄影古文字图像分别构建数据集。
[0034]
2、构建用于形状变换的生成对抗网络a,包括生成器a1和判别器a2。
[0035]
(1)首先构造空间变换网络作为生成器a1,空间变换网络包含三个模块,分别是编码器、预测器和采样器。首先构造编码器,编码器由相连接的卷积神经网络(cnn)构成,cnn的卷积层层数一般选择超过3层,在我们实现的实例中选择含有依次连接的4个卷积模块,每个卷积模块包括一个二维卷积层、一个批归一化层、一个非线性激活层和一个汇聚(pooling,也称池化)层,其中批归一化层是可选的,非线性激活函数可以选择relu函数或者leakyrelu函数,汇聚运算可以选择最大化汇聚、平均汇聚或者自适应汇聚,本实例采用的是relu函数和最大化汇聚。
[0036]
(2)其次构建预测器,预测器由全连接(fc)神经网络构成,fc层的层数一般选择超过2层,本实例的fc网络包含依次连接的3个fc模块,最后连接一个fc层。每个fc模块包含一个fc层,一个批归一化层和一个非线性激活层,其中批归一化层是可选的,非线性激活函数可以选择relu函数或者leakyrelu函数,汇聚运算可以选择最大化汇聚、平均汇聚或者自适应汇聚,本实例采用的是relu函数和最大化汇聚,最后一个fc层的输出通道数设置为所需预测的形变参数的个数,本实例采用的形变参数个数为132个,其中128个参数为8*8=64个tps变换采样网格匹配点的坐标值,4个为仿射变换矩阵的元素值。注意,tps变换采样网格匹配点的个数可以替代为小于原始字符图像像素的任意整数。
[0037]
(3)接着构建采样器,本实例采用深度学习框架pytorch中的torch.nn.functional.grid_sample()方法实现。
[0038] (4)最后,构建图像重建网络和噪声重建网络,由依次连接的3个fc模块、1个fc层、 4个转置卷积模块组成,由依次连接的3个fc模块、1个fc层组成,其中转置卷积模块包含依次连接的1个转置卷积层、1个批归一化层、1个非线性激活层,其中批归一化层是可选的,非线性激活函数可以选择relu函数或者leakyrelu函数,汇聚运算可以选择最大化汇聚、平均汇聚或者自适应汇聚,本实例采用的是relu函数和最大化汇聚。
[0039] (5)空间变换网络的工作原理如下:首先以临摹古文字图像作为编码器的输入,编码器从输入图像中提取去形状特征,输出一个形状特征向量,接着,我们从标准正态分布中随机选取一个噪声隐向量 ,将和进行融合,本实例的融合方式是直接进行叠加求和,其中表示字形特征信息,具有保证输出真实性的作用,则能够带来一定的随机性,保证了输出的多样性。将融合和后的隐向量输入到预测器中,预测器负责映射出tps变换参数和仿射变换参数,其中tps变换参数为tps变换采样网格匹配点的坐标值,该采样网格具
有8*8=64个匹配点,而仿射变换参数为仿射矩阵参数,共有4个参数。接着,通过pytorch中的torch.nn.functional.affine_grid()方法将4个仿射参数转化为仿射变换采样网格。接着,将tps变换采样网格和仿射变换采样网格以及原始图像输入到采样器中,输出变换后字符图像。我们假设已经获取到两张图像(图a和图b)的n组tps采样网格匹配点对的坐标:、、

、,本实例n取64。那么使用tps变换计算图a与图b的坐标对应关系的过程如下:tps变换的目标是求解一个函数,使得,且弯曲能量函数最小,这样图像上的其它点也可以通过插值得到很好的变换结果。可以把形变函数想象成弯折一块薄金属板,使这块板穿过给定的n个tps变换采样网格匹配点,弯曲薄板的能量函数可表示为:可以证明薄板样条函数就是弯曲能量最小的函数,薄板的样条函数为:其中u为基函数:其中u为基函数:上式中只要求出,,和,就可以确定,,,和可以通过64个tps变换采样网格匹配点坐标的预设值和预测器预测的偏移量来求解。
[0040]
类似地,我们假设和分别为变换前后的像素点的位置,则仿射变换的采样公式如下:其中scale,theta,,分别表示预测器预测出的4个仿射变换参数。
[0041]
最后,将预测器输出端与图像重建网络和噪声重建网络的输入端连接,分别重建出原始图像和噪声隐向量。
[0042]
(6)构建判别器a2,判别器a2是基于patchgan的结构[6],由依次连接的5个卷积模块组成,前4个卷积模块中每个模块包括一个二维卷积层、一个实例归一化层、一个leakyrelu激活层。最后一个卷积模块包括一个可选的padding层和一个二维卷积层。
[0043]
(7)由生成器(空间变换网络)、判别器构成的生成对抗网络a如图2所示,生成器以临摹古文字图像作为输入,经过空间变换之后产生形变的字符图像,将生成器a1的输出端与判别器a2的输入端连接,同时,把目标字符图像输入到判别器a2的另一个输出端,判别器
a2输出对形变后的古文字图像和目标字符图像的判别结果。
[0044]
3、构建用于纹理转换的生成对抗网络b,该网络为循环结构,包括生成器b1和判别器b2,以及生成器b3和判别器b4。
[0045]
(1)构建生成器b1和生成器b3,它们的结构完全相同,包含依次连接的三个卷积模块、四个残差卷积模块,三个转置卷积模块和一个输出卷积模块,每个卷积模块的结构包含依次连接的一个二维卷积层、一个实例归一化层和一个非线性relu激活层,每个残差卷积模块包含依次连接的两个卷积模块和一个加法器,该加法器将残差模块的输入端和输出端进行加法运算,每个转置卷积模块包含依次连接的一个转置卷积层、一个实例归一化层和一个非线性relu激活层。输出卷积模块包含依次连接的一个卷积层和tanh激活函数。
[0046]
(2)构建判别器b2和判别器b4,它们的结构与判别器a2完全相同。
[0047]
(3)生成对抗网络b的连接方式如图3所示,该网络为循环生成对抗网络,首先将临摹古文字图像输入到生成器b1,生成器b1的输出端与判别器b2的输入端相连,接着把摄影古文字图像也输入到判别器b2中。同理,将摄影古文字图像输入到生成器b3,生成器b3的输出端与判别器b4的输入端相连,接着把临摹古文字图像也输入到判别器b4中。
[0048]
4、将a和b进行连接,构成整个摄影古文字生成系统如图4所示,连接方式为:生成对抗网络a中的生成器a1的输出与生成对抗网络b中的生成器b1的输入端相连接,将生成对抗网络b中的生成器b3的输出端与生成对抗网络a中的判别器a2的输入端相连接,即此时生成器b3的输出作为生成对抗网络a的目标字符图像,生成器a1的输出作为形变的字符图像,输入到生成器b1中。注意,为了避免梯度消失,在a1和b1之间,以及b3和a2之间切断了梯度回传,生成对抗网络a和b通过图像信息的前向传播进行交互。
[0049]
5、构建优化目标,用于指导神经网络的学习。
[0050]
为生成对抗网络a构建信噪重建损失函数、多样性函数和最小二乘生成对抗损失函数如下:其中,表示平均绝对误差损失函数,和分别表示重建网络和重建后的临摹古文字图像和噪声隐向量。在缺乏强监督的情况下,神经网络学习过程中可能会抑制输入信息产生的作用,为了避免这种情况,我们分别为信息和噪声向量分别设计重建损失项,从而使形状信息保证真实性和噪声保证多样性的作用不会被抑制。此外,为了保证变换字形的变换程度更加合理可控,我们还设计了一个重建损失比值来寻求形状信息和噪声各自作用的平衡,我们进一步用超参数m 》 1来约束这一项。其中α是动态系数,在训练过程中,如果该项大于logm,我们设α=1。在这种情况下,噪声重构比信号重构差得多。这意味着噪声的作用被网络抑制了,我们使用梯度下降法对正比值项进行优化。相反,当该项小于

logm时,我们设α=

1。在这种情况下,信号重构比噪声重构差得多。这意味着噪音的作用过于突出,形状信息的作用被抑制,我们使用梯度下降法来优化负比值项。如果该项在理想范围内,即[

logm,logm],则设置α= 0,即没有任何额外优化。
[0051]
其中,p表示预测器,e表示编码器,和分别表示取自相同高斯分布的不同噪声
隐向量。隐向量。
[0052]
其中,为生成器b3的输出。
[0053]
为生成对抗网络b构建笔划感知循环一致性损失函数和最小二乘生成对抗损失函数如下:其中x表示临摹古文字图像,y表示摄影古文字图像,表示向量元素内积,w为从临摹古文字图像中提取的权重矩阵,计算如下:其中, , 分别为笔画区域的面积和背景区域的面积。
[0054]
其中,表示由输入的临摹古文字图像和生成器a1的输出形变的字符图像共同构成的集合中的样本,y表示摄影古文字图像。
[0055]
6、所有图像像素尺寸设置为64*64,批大小为64,其中生成对抗网络a的初始学习率为0.0001,生成对抗网络b的学习率为0.001,训练迭代次数为30000,在15000次迭代后学习率开始线性衰减至1e-5,网络采用adam优化器进行优化。
[0056]
7、按照4中的连接方式联合训练生成对抗网络a和b,得到训练好的生成器a1和生成器b1,将生成器a1的输出端与生成器b1输入端相连,得到一个完整的摄影古文字图像生成器,可用于产生多样生成样本。
[0057]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0058]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0059]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形
式。
[0060]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献