基于cyclegan的答题卡填涂方式变换的研究

2022-12-07 01:46:00 来源：中国专利 TAG：

1.本发明属于图像风格转换领域，涉及一种基于cyclegan的答题卡填涂方式变换的研究。

背景技术：

2.由于深度学习在数据方面具有强大的处理能力，所以在很多领域都取得了巨大的成功，而图像风格转换是近年来新兴的领域之一。
3.中国专利cn 112906769a公开了一种基于cyclegan的输变电设备图像缺陷样本增广方法，相对常规方法增广和本本方法在缺陷样本数量不足的情况下，增广的缺陷样本集能够将目标检测模型的精度提升2～3％，优于常规数据增强方法。。中国专利cn 110599423a公开了一种基于深度学习cyclegan模型处理sar图像亮度补偿方法，此发明具有更强的亮度补偿能力、图像特征保留能力，并且模型一经训练，可多次重复使用，简化了图像处理的过程。中国专利cn 111523520a公开了一种利用cyclegan分析包含运动想象脑卒中患者脑电信号的方法，将健康人的频谱图和脑卒中患者频谱图同时输入cyclegan神经网络中进行训练，脑卒中患者的频谱图作为对照样本，使健康人的频谱图学习脑卒中患者频谱图的特点从而生成基于脑卒中患者的人工频谱图。中国专利cn 109598799a公开了一种基于cyclegan的虚拟切割方法，可以更好地实现力的反馈并能使手术医生把控手术进程，基于cyclegan实时更新模型贴图，增加了虚拟手术的真实性。中国专利cn 112148906a公开了一种基于修正的cyclegan模型的声纳图像库构建方法，通过对cyclegan网络损失函数的改进，提高了声纳图像合成效果，并设计目标检测网络以验证构建的声纳图像数据集的有效性。
4.本文提出了一种基于cyclegan的答题卡填涂方式变换的研究，此模型的生成器是由残差网络构成，其作用在于生成图像；判别器由卷积神经网络构成，作用在于区分真假数据。本文选取自制数据集作为数据源，并按照8：2比例来划分数据集，本文选取自制答题卡图片集作为数据源，采用峰值信噪比(psnr)、结构相似性(ssim)作为评价指标，本发明可以有效地转换答题卡填涂方式。

技术实现要素：

5.发明目的：本文提出了一种基于cyclegan的答题卡填涂方式变换的研究，生成器是由残差网络构成，其作用在于生成图像；判别器由卷积神经网络构成，作用在于区分真假数据。本文选取自制数据集作为数据源，并按照8：2比例来划分数据集，本文选取自制答题卡图片集作为数据源，采用峰值信噪比(psnr)、结构相似性(ssim)作为评价指标，本发明可以有效地转换答题卡填涂方式。
6.技术方案：本发明提供了一种基于cyclegan的答题卡填涂方式变换的研究，包括如下步骤：
7.步骤1：以自制答题卡图片集为数据源，按照8：2划分训练集与测试集；
8.步骤2：创建两个生成模型g
ab
和g
ba
，g
ab
用于从图片风格a转换成图片风格b，g
ba
用于从图片风格b转换成图片风格a，本发明中答题卡填涂方式为对勾的是风格a，答题卡填涂方式为矩形的是风格b。
9.步骤3：创建一个判别模型，用于判断g
ab
生成的图片与原始图片的真伪。
10.步骤4：判别模型的训练所用的损失函数与lsgan相同，通过判断是否正确进行训练。
11.进一步地，所述步骤中数据预处理包括：
12.(1)按照8:2划分训练集、测试集。
13.(2)把图片裁剪为128*128的大小。
14.(3)将图片进行二值化。
15.进一步地，所包含模型的生成器是由残差网络构成，其作用在于生成图像；判别器由卷积神经网络构成，作用在于区分真假数据。本文选取自制数据集作为数据源，并按照8：2比例来划分数据集，本文选取自制答题卡图片集作为数据源，采用峰值信噪比(psnr)、结构相似性(ssim)作为评价指标，本发明可以有效地转换答题卡填涂方式。
16.进一步地，所包含模型为：
17.1)残差网络
18.残差网络是为了解决深度神经网络(dnn)隐藏层过多时的网络退化问题而提出。退化(degradation)问题是指：当网络隐藏层变多时，网络的准确度达到饱和然后急剧退化，而且这个退化不是由于过拟合引起的。误差是衡量观测值和真实值的差距，残差是指预测值和观测值之间的差距。
19.2)卷积神经网络
20.卷积神经网络主要借鉴于生物的神经系统，各个神经元之间局部连接，实现对输入特征的提取。卷积神经网络是由卷积层、池化层和全连接层构成。其中卷积层主要是通过共享权值来实现对特征的提取，其数学表达式为：
[0021][0022]
式中σ为激活函数，c为偏置参数，l表示局部感受野的长，m表示局部感受野的宽，wl,m是权重参数，αl,m表示卷积层的输入数据，h表示提取的特征。
[0023]
由于卷积神经网络在空间数据上运行良好，故本文选取卷积神经网络作为判别器。
[0024]
有益效果
[0025]
本发明提供一种基于cyclegan的答题卡填涂方式变换的研究，生成器是由残差网络构成，其作用在于生成图像；判别器由卷积神经网络构成，作用在于区分真假数据。本文选取自制数据集作为数据源，并按照8：2比例来划分数据集，本文选取自制答题卡图片集作为数据源，采用峰值信噪比(psnr)、结构相似性(ssim)作为评价指标，本发明可以有效地转换答题卡填涂方式。
附图说明
[0026]
图1为残差结构示意图。
[0027]
图2为答题卡填涂方式转换的网络示意图。
具体实施方式
[0028]
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。
[0029]
本发明公开了一种基于cyclegan的答题卡填涂方式变换的研究，包括如下步骤：
[0030]
步骤1：以自制答题卡图片集为数据源，按照8：2划分训练集与测试集；
[0031]
步骤2：创建两个生成模型g
ab
和g
ba
，g
ab
用于从图片风格a转换成图片风格b，g
ba
用于从图片风格b转换成图片风格a，本发明中答题卡填涂方式为对勾的是风格a，答题卡填涂方式为矩形的是风格b。
[0032]
步骤3：创建一个判别模型，用于判断g
ab
生成的图片与原始图片的真伪。
[0033]
步骤4：判别模型的训练所用的损失函数与lsgan相同，通过判断是否正确进行训练。
[0034]
进一步地，所包含模型的生成器是由残差网络构成，其作用在于生成图像；判别器由卷积神经网络构成，作用在于区分真假数据。本文选取自制数据集作为数据源，并按照8：2比例来划分数据集，本文选取自制答题卡图片集作为数据源，采用峰值信噪比(psnr)、结构相似性(ssim)作为评价指标，本发明可以有效地转换答题卡填涂方式。
[0035]
1)残差网络
[0036]
残差网络是为了解决深度神经网络(dnn)隐藏层过多时的网络退化问题而提出。退化(degradation)问题是指：当网络隐藏层变多时，网络的准确度达到饱和然后急剧退化，而且这个退化不是由于过拟合引起的。误差是衡量观测值和真实值的差距，残差是指预测值和观测值之间的差距。
[0037]
2)卷积神经网络
[0038]
卷积神经网络主要借鉴于生物的神经系统，各个神经元之间局部连接，实现对输入特征的提取。卷积神经网络是由卷积层、池化层和全连接层构成。其中卷积层主要是通过共享权值来实现对特征的提取，其数学表达式为：
[0039][0040]
式中σ为激活函数，c为偏置参数，l表示局部感受野的长，m表示局部感受野的宽，wl,m是权重参数，αl,m表示卷积层的输入数据，h表示提取的特征。
[0041]
由于卷积神经网络在空间数据上运行良好，故本文选取卷积神经网络作为判别器。
[0042]
实验采用了python作为算法的实现语言，选取自制答题卡图片集为数据源，并按照8：2的比例划分训练集与测试集。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于生成对抗网络的太阳图像配准方法、设备及存储介质

基于cyclegan的答题卡填涂方式变换的研究

相关文献

最热文献