一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

风格迁移模型训练方法和装置、风格迁移方法和装置与流程

2021-11-05 21:17:00 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,具体涉及计算机视觉、深度学习、增强/虚拟现实等技术领域,尤其涉及一种风格迁移模型训练方法和装置、风格迁移方法和装置、电子设备、计算机可读介质以及计算机程序产品。


背景技术:

2.风格化重建是在真实三维重建之后进行风格化三维迁移,调整三维重建基底,并修改混合形状系数实现风格化重建效果。现有方法完全依赖于美工师的审美和主观感觉调整真实重建的基底,并且将真实重建的混合形状系数进行某种线性或者非线性变换得到风格化混合形状系数,转化出的风格化混合形状系数缺乏客观约束条件,是单方面主观的真实重建和风格化重建之间的对应关系,该对应关系的准确较低。


技术实现要素:

3.提供了一种风格迁移模型训练方法和装置、风格迁移方法和装置、电子设备、计算机可读介质以及计算机程序产品。
4.根据第一方面,提供了一种风格迁移模型训练方法,该方法包括:获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图;获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系;将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数;基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络;响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。
5.根据第二方面,提供了一种风格迁移方法,该方法包括:获取待进行风格化的人脸图像;将人脸图像输入采用如第一方面任一实现方式描述的方法生成的风格迁移模型中,输出人脸图像的风格化结果。
6.根据第三方面,提供了一种风格迁移模型训练装置,该装置包括:样本获取单元,被配置成获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图;网络获取单元,被配置成获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系;选取单元,被配置成将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数;训练单元,被配置成基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络;输出单元,被配置成响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。
7.根据第四方面,又提供了一种风格迁移装置,该装置包括:获取单元,被配置成获取待进行风格化的人脸图像;分类单元,被配置成将人脸图像输入采用如第一方面任一实现方式描述的方法生成的风格迁移模型中,输出人脸图像的风格化结果。
8.根据第五方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面任一实现方式描述的方法。
9.根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面任一实现方式描述的方法。
10.根据第七方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面或第二方面任一实现方式描述的方法。
11.本公开的实施例提供的风格迁移模型训练方法和装置,首先,获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图;其次,获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系;再次,将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数;从次,基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络;最后,响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。由此,通过构建与三维图像参数相关的卷积神经网络,可以对风格化的三维图像参数的量化进行有效的调控,客观的得出二维原图对应的风格化图,得到了精度较高的风格迁移模型,并且采用包括二维原图和风格化图样本,提高了风格迁移模型训练的可靠性和准确性。
12.本公开的实施例提供的风格迁移方法和装置,获取待进行风格化的人脸图像;将待进行风格化的人脸图像输入采用本实施例的风格迁移模型训练方法生成的风格迁移模型,输出人脸图像的风格化结果。由此,采用卷积神经网络生成的风格迁移模型,可以提升人脸风格化迁移的风格化结果的准确性。
13.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
14.附图用于更好地理解本方案,不构成对本公开的限定。其中:
15.图1是根据本公开风格迁移模型训练方法的一个实施例的流程图;
16.图2是本公开实施例中风格迁移网络进行训练的一种结构示意图;
17.图3是根据本公开风格迁移方法的一个实施例的流程图;
18.图4是根据本公开风格迁移模型训练装置的一个实施例的结构示意图;
19.图5是根据本公开风格迁移装置的一个实施例的结构示意图;
20.图6是用来实现本公开实施例的风格迁移模型训练方法或风格迁移方法的电子设备的框图。
具体实施方式
21.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同
样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
22.由于三维重建是通过渲染图效果展现出来,设计风格化之初通常是针对2d风格图效果,手动调整三维重建基底后渲染图的效果会和期望的2d风格图效果有差异,针对现有技术依赖美工师个人得手动调整三维重建基底,会与期望的渲染图效果有差异这一问题。本公开提供的风格迁移模型训练方法的风格化重建的逻辑是:首先以选定好的2d效果图为重建目标,如果主观调整基底,再做渲染,生成的渲染图可以拟合最初理想的2d图效果。
23.图1示出了根据本公开风格迁移模型训练方法的一个实施例的流程100,上述风格迁移模型训练方法包括以下步骤:
24.步骤101,获取预置的样本集。
25.本实施例中,风格迁移模型训练方法运行于其上的执行主体可以通过多种方式获取样本集,例如,执行主体可以通过有线连接方式或无线连接方式,从数据库服务器中获取存储于其中的样本集。再例如,用户可以通过终端来收集样本,这样,执行主体可以接收终端所收集的样本,并将这样样本存储在本地,从而生成样本集。
26.在这里,样本集可以包括至少一个样本。其中,样本包括二维原图和与二维原图对应的风格化图。
27.本实施例中,二维原图对应的风格化图是一种二维的风格图,也是二维原图标注后的风格化标签图,由二维原图对应的风格化图可以确定二维原图需要转换出的风格,并且二维原图对应的风格化图也是一种二维图像。
28.步骤102,获取预先建立的包括卷积神经网络的风格迁移网络。
29.本实施例中,风格迁移网络是用于对二维图像进行风格迁移,得到具有风格化效果的风格化结果,即风格化结果可以是二维图像,风格化结果也可以是三维图像。
30.卷积神经网络是风格迁移网络的主要网络结构,卷积神经网络由具有可学习的权重和偏置常量的神经元组成。每个神经元都接收一些输入,并做点积计算,输出是每个分类的分数。当风格迁移网络中的卷积神经网络的参数调整到卷积神经网络满足训练完成条件之后,风格迁移网络为训练完成的风格迁移模型。
31.本实施例中,由于卷积神经网络仅可以得到的是三维图像参数,样本中的二维原图是二维图像,因此风格迁移网络除了包括卷积神经网络之外,还可以包括图像转换模块(如图2所示),图像转换模块包括:第一模块(图中未示出),第二模块(图中未示出);其中,第一模块用于将三维图像参数转换为风格化的三维图像,例如图2的三维网格图;第二模块用于将风格化的三维图像转换成预测风格图。本实施例中,第一模块、第二模块的参数可以随着卷积神经网络的改变而改变,或者第一模块,第二模块的参数不变,本实施例中,第一模块、第二模块均不参于风格迁移网络的训练过程中cnn(convolutional neural network,卷积神经网络)的损失值的计算,仅仅是起到对卷积网络的反向传播梯度进行传递的作用。
32.在这里,本实施例的卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系。本实施例中,三维图像参数是指生成三维图像的关键参数,例如,三维图像参数包括:混合形状系数、风格化基底中的至少一项。其中,混合形状系数又称为bs系数,用于表征预测风格化图的混合形状的特征值;风格化基底,用于表征风格化图在特征向量空间中的特征向量。在特征向量空间中,将风格化的混合形状系数与风格化基底线相乘,可以得到
预测风格化图对应的三维网格图。
33.可选地,三维图像参数还可以包括:三维网格参数,三维网格参数是生成三维模型的关键参数,三维网格参数可以用来画三维的网格表面,三维空间中的一个点是用(x,y,z)来表示的三维网格参数可以把这些点之间用网格连接起来。例如,当前样本是人脸图像时,三维网格参数可以是3d点云和面片信息,其中,3d点云是人脸上像素的三维坐标,面片信息用于指示组成人脸面部的关键的3d点。
34.本实施例中,基于混合形状系数、风格化基底,通过常规的计算可以得到是三维网格参数,由此可以得到样本中的二维原图的三维模型表示。
35.步骤103,将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数。
36.本实施例中,执行主体可以从步骤101中获取的样本集中选取样本,将选取的样本中的二维原图输入风格迁移网络,并执行步骤104至步骤105的训练步骤。其中,样本的选取方式和选取数量在本技术中并不限制。例如在一次迭代训练中可以是随机选取一个样本,也可以在一次迭代训练中是从样本集中选取多个样本,选取的每个样本中的风格化图作为监督标签和预测风格图(如图2中预测风格图是通过渲染器渲染得到的图)计算cnn的损失值,调整卷积网络,其中,预测风格图是将二维原图输入卷积网络得到三维图像参数,并基于三维图像参数而生成的图像。
37.本实施例中,风格迁移网络可以包括卷积神经网络和图像转换模块,图像转换模块用于将预测的三维图像参数,生成预测风格图。本实施例中,预测风格图可以是由预测的三维图像参数通过计算得到图像,图像转换模块得到的预测风格图可以是三维图像,也可以是二维图像。
38.当图像转换模块需要得到的预测风格图是三维图像时,图像转换模块可以采用传统的图像转换方式将三维图像参数转换为三维的预测风格图。当图像转换模块需要得到的预测风格图是二维图像时,图像转换模块可以将三维图像参数,转换为三维的预测风格图,再通过渲染器将三维的预测风格图转换为二维的预测风格图。
39.本实施例中,图像转换模块得到的预测风格图可以作为风格迁移网络的输出,即风格迁移网络的输出可以是二维图像,也可以是三维图像;可选地,卷积神经网络的输出也可以作为风格迁移网络的输出,即风格迁移网络的输出是三维图像参数。
40.步骤104,基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络。
41.本实施例中,图像转换模块输出的预测风格图可以是三维图像,也可以是二维图像。当预测风格图是三维图像时,在风格化迁移网络中需要采用固定的渲染器(固定的渲染器的参数不因卷积神经网络的参数的变化而变化)对预测风格图进行渲染,得到二维的预测风格图;当预测风格图是二维图像时,在风格化迁移网络中可以直接计算预测图像与选取的样本中的风格化图之间的差异,并进行卷积神经网络的损失值计算,得到卷积神经网络的损失值,从而实现对卷积神经网络的迭代训练。
42.本实施例中,卷积神经网络是风格化迁移网络的主要网络构成,在卷积神经网络每次迭代训练中可以得到卷积神经网络的损失值,而卷积神经网络的损失值也就是风格化迁移网络的损失值,计算卷积神经网络的损失值的也就是检测风格化迁移网络训练结果的
方法,如图2所示,风格迁移网络训练过程可以如下:将样本中的二维原图输入风格化迁移网络,得到cnn输出的三维图像参数,根据风格迁移网络中图像转换模块对三维图像参数进行三维图像生成,以及将三维图像转换至二维图转换,得到预测风格图作为风格化结果,将风格化结果与选取的样本中的风格化图(监督标签)之间的差异确定cnn的损失值,利用梯度反向传播的方式迭代调整卷积神经网络的参数,使其损失值逐步缩小。在卷积神经网络的损失值收敛至一定的范围内或迭代的次数达到预设的次数阈值时可以停止调整cnn的参数,得到包括训练完成的cnn的风格迁移网络即为训练完成的风格迁移模型。
43.需要说明书的是,在卷积神经网络进行梯度反向传播的时候,图像转换模块仅对卷积神经网络的梯度进行传播,而不会对卷积神经网络的梯度产生任何影响。
44.如图2所示,预测风格图是二维图像,在选取样本集中的样本之后,通过从样本集中选取的二维原图和与二维原图对应的风格化图,对卷积神经网络进行迭代训练,每一次迭代卷积神经网络具有一个输出结果,在每次迭代训练时计算卷积神经网络的损失值,具体地,损失值可以由该卷积神经网络的损失函数计算得到,通过调整动卷积神经网络的参数可以使卷积神经网络的损失值变小。
45.步骤105,响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。
46.在本实施例中,训练完成条件包括以下至少一项:卷积神经网络的训练迭代次数达到预定迭代阈值,卷积神经网络损失值小于预定损失值阈值。例如,卷积神经网络的训练迭代达到5千次。卷积神经网络损失值小于0.05。
47.在本实施例的一些可选实现方式中,响应于卷积神经网络不满足训练完成条件,则调整卷积神经网络中的相关参数使得卷积神经网络的损失值收敛,基于调整后的卷积神经网络,继续执行上述训练步骤103

105。
48.本可选实现方式中,在卷积神经网络不满足训练完成条件时,调整卷积神经网络的相关参数,有助于帮助卷积神经网络的损失值收敛。
49.在本实施例中,若训练未完成,则调整卷积神经网络的参数来使得卷积神经网络的损失值收敛。具体地,反复执行步骤103至步骤105,调整循环神经网络的参数,使得动作损失值逐渐变小直至收敛。
50.本公开的实施例提供的风格迁移模型训练方法,首先,获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图;其次,获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系;再次,将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数;从次,基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络;最后,响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。由此,通过构建与三维图像参数相关的卷积神经网络,可以对风格化的三维图像参数的量化进行有效的调控,客观的得出二维原图对应的风格化图,得到了精度较高的风格迁移模型,并且采用包括二维原图和风格化图样本,提高了风格迁移模型训练的可靠性和准确性。
51.在本实施例的一些可选实现方式中,样本中风格化图的采用以下方式得到:将样本中的二维原图输入已训练完成的风格转化模型,得到与二维原图对应的风格化图,风格
转化模型用于表征二维图像与风格化的三维图像参数之间的关系。
52.本可选实现方式中,风格转化模型可以是gan(generative adversarial network,生成式对抗网络)网络,gan网络由两个部分组成,生成器和鉴别器,生成器和鉴别器之间的关系可以用竞争或敌对关系来描述。
53.其中,鉴别器对生成器所产生的假目标做惩罚并对真目标进行奖励,因此可以确定不好的假目标与好的真目标具体内容。生成器则是通过进化,产生比上一次更好的假目标,使鉴别器对自己的惩罚更小。以上是一个循环,在下一个循环中鉴别器通过学习上一个循环进化出的假目标和真目标,再次进化对假目标的惩罚,同时生成器再次进化,直到与真目标一致,结束进化。
54.本实施例中,将样本中的二维原图输入训练完成的风格化转化模型,可以提高得到风格化图的精度,提高了风格迁移模型的训练效果。
55.在本实施例的一些可选实现方式中,预测的三维图像参数为预测的混合形状系数,基于预测的三维图像参数,生成预测风格图,包括:基于预测的混合形状系数和预设的风格化基底,生成三维网格图;将三维网格图输入可微渲染器,生成预测风格图。
56.本可选实现方式中,风格迁移网络中的图像转换模块具有预设的风格化基底,在预测的三维图像参数为卷积神经网络预测的混合形状系数时,采用风格迁移网络中的图像转换模块,将混合形状系数和预设的风格化基底相乘,生成三维网格图,再将三维网络图输入可微渲染器,生成二维的预测风格图。
57.本可选实现方式中,在预测的三维图像参数为卷积神经网络预测的混合形状系数时,采用图像转换模块,可以有效地将预测的三维图像参数转为二维的预测风格图,为得到预测风格图提供了一种可选方式,保证了预测风格图得到的可靠性。
58.可选地,预测的三维图像参数为预测的混合形状系数,基于预测的三维图像参数,生成预测风格图,包括:基于预测的混合形状系数和预设的风格化基底,生成三维网格图;将三维网格图作为预测风格图。
59.在本实施例的一些可选实现方式中,预测的三维图像参数为预测的风格化基底,基于预测的三维图像参数,生成预测风格图,包括:基于预设的混合形状系数和预测的风格化基底,生成三维网格图;将三维网格图输入可微渲染器,生成预测风格图。
60.本可选实现方式中,风格迁移网络中的图像转换模块具有预设的混合形状系数,在预测的三维图像参数为卷积神经网络输出的预测的风格化基底时,可以采用风格迁移网络中的图像转换模块,将预设的混合形状系数和预测的风格化基底线性相乘,生成三维网格图,再将三维网络图输入可微渲染器,生成二维的预测风格图。
61.本实施例中,渲染器和可微渲染器均是将三维的光能传递处理转换为二维图像的模块。相对于通过渲染器,可微渲染器通过计算渲染过程的导数,使得从单张图片学习三维结构逐渐成为现实。可微渲染目前被广泛地应用于三维重建,特别是人体重建、人脸重建和三维属性估计等。
62.本可选实现方式中,在预测的三维图像参数为卷积神经网络预测的风格化基底时,采用图像转换模块,可以有效地将预测的三维图像参数转为二维的预测风格图,为得到预测风格图提供了一种可选方式,保证了预测风格图的精确度。
63.可选地,预测的三维图像参数为预测的风格化基底,基于预测的三维图像参数,生
成预测风格图,包括:基于预设的混合形状系数和预测的风格化基底,生成三维网格图;将三维网格图作为预测风格图。
64.在本实施例的一些可选实现方式中,上述预测的三维图像参数为预测的三维网格参数,基于预测的三维图像参数,生成预测风格图,包括:基于预测的三维网格参数,生成三维网格图;将三维网格图输入可微渲染器,生成预测风格图。
65.本可选实现方式中,风格迁移网络中的图像转换模块具有预设的3d点云或面片信息,在预测的三维图像参数为卷积神经网络输出的预测的三维网格参数且三维网格参数为预测的3d点云时,采用风格迁移网络中的图像转换模块,从预测的3d点云选取与预设的面片信息对应的3d点云,并采用选取的3d点云生成三维网格图,再将三维网格图输入可微渲染器,生成二维的预测风格图。
66.可选地,在预测的三维图像参数为卷积神经网络输出的预测的三维网格参数且三维网格参数为预测的面片信息时,采用风格迁移网络中的图像转换模块,从预设的3d点云选取与预测的面片信息对应的3d点云,并采用选取的3d点云生成三维网格图,再将三维网格图输入可微渲染器,生成二维的预测风格图。
67.本可选实现方式中,在预测的三维图像参数为卷积神经网络预测的三维网格参数时,采用图像转换模块,可以有效地将预测的三维图像参数转为二维的预测风格图,为得到预测风格图提供了一种可选方式,保证了预测风格图得到的可靠性。
68.可选地,上述预测的三维图像参数为预测的三维网格参数,基于预测的三维图像参数,生成预测风格图,包括:基于预测的三维网格参数,生成三维网格图;将三维网格图作为预测风格图。
69.进一步地,基于上述实施例提供的风格迁移模型训练方法,本公开还提供了一种风格迁移方法的一个实施例,本公开的风格迁移方法结合了计算机视觉、深度学习等人工智能领域。
70.参见图3,示出了根据本公开风格迁移方法的一个实施例的流程300,本实施例提供的风格迁移方法包括以下步骤:
71.步骤301,获取待进行风格化的人脸图像。
72.在本实施例中,用于风格迁移方法的执行主体(可以通过多种方式来获取待进行风格化的人脸图像。例如,执行主体可以通过有线连接方式或无线连接方式,从数据库服务器中获取存储于其中的待进行风格化的人脸图像。再例如,执行主体也可以接收终端或其他设备采集的待进行风格化的人脸图像。
73.在本实施例中,获取的待进行风格化的人脸图像可以是彩色图像和/或灰度图像等等,且该获取的待进行风格化的人脸图像的格式在本公开中也不做限制。
74.步骤302,将人脸图像输入风格迁移模型中,输出人脸图像的风格化结果。
75.本实施例中,执行主体可以将步骤301中获取的待进行风格化的人脸图像输入风格迁移模型中,从而得到对待进行风格化的人脸图像的风格化结果。需要说明的是,风格化结果是对待进行风格化的人脸图像进行风格迁移后的结果,基于风格迁移模型的结构可知,风格化结果可以是与上述人脸图像对应的二维的风格化图,或者与上述人脸图像对应的三维的风格化图,还可以是与上述人脸图像对应的三维图像参数。二维的风格化图和三维的风格化图的图像内容均与上述人脸图像的内容相同,相对于上述人脸图像,二维的风
格化图和三维的风格化图的仅仅改变了人脸图像的风格显示,比如,上述人脸图像风格是漫画风格,风格化结果是油画风格的人脸图像。
76.本实施例中,风格迁移模型可以是采用如上述图1实施例所描述的方法而训练得到的,具体训练过程可以参见图1实施例的相关描述,在此不再赘述。
77.本实施例中,风格迁移模型可用于对待进行风格化的人脸图像进行风格迁移,得到风格化结果。上述风格迁移是指使用某些手段,把人脸图像从原风格转换到另外一个风格,同时保证人脸图像的内容没有变化,风格迁移前的待进行风格化人脸图像的风格和风格化结果的风格两者的类型不同,风格迁移前的待进行风格化人脸图像的风格、风格化结果的风格各自的类型,本实施例均不做限定,例如,待进行风格化人脸图像的风格类型和风格化结果的风格类型均可以是:漫画、喜剧、戏剧、油画等风格中的一种,向风格迁移模型输入一个真实的二维的人脸图像,风格迁移模型输出为二维的漫画人脸图,或三维的漫画人脸图。
78.需要说明的是,本实施例的风格迁移方法可以用于测试上述各实施例所生成的风格迁移模型。进而根据风格化结果可以不断地优化风格迁移模型。该方法也可以是上述各实施例所生成的风格迁移模型的实际应用方法。采用上述各实施例所生成的风格迁移模型,来进行人脸图像的风格迁移,有助于提高风格迁移的准确性。
79.本公开的实施例提供的风格迁移方法,获取待进行风格化的人脸图像;将待进行风格化的人脸图像输入采用本实施例的风格迁移模型训练方法生成的风格迁移模型,输出人脸图像的风格化结果。由此,采用卷积神经网络生成的风格迁移模型,可以提升人脸风格化迁移的风格化结果的准确性。
80.进一步参考图4,作为对上述各图所示方法的实现,本公开提供了风格迁移模型训练装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可应用于各种电子设备中。
81.如图4所示,本实施例提供的风格迁移模型训练装置400包括:样本获取单元401,网络获取单元402,选取单元403,训练单元404,输出单元405。其中,上述样本获取单元401,可以被配置成获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图。上述网络获取单元402,可以被配置成获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系。上述选取单元403,可以被配置成将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数。上述训练单元404,可以被配置成基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络。上述输出单元405,可以被配置成响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。
82.在本实施例中,风格迁移模型训练装置400中:样本获取单元401,网络获取单元402,选取单元403,训练单元404,输出单元405的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101、步骤102、步骤103、步骤104、步骤105的相关说明,在此不再赘述。
83.在本实施例的一些可选的实现方式中,上述装置400还包括:调整单元(图中未示出)。上述调整单元,可以被配置成响应于确定卷积神经网络不满足训练完成条件,则调整卷积神经网络中的相关参数使得卷积神经网络的损失值收敛,上述选取单元403、上述训练
单元404、上述输出单元405基于调整后的卷积神经网络,继续训练调整后的卷积神经网络。
84.在本实施例的一些可选的实现方式中,上述样本中风格化图通过风格转化单元(图中未示出)得到,其中,上述风格转化单元,可以被配置成将样本中的二维原图输入已训练完成的风格转化模型,得到与二维原图对应的风格化图。
85.在本实施例的一些可选的实现方式中,上述预测的三维图像参数为预测的混合形状系数,训练单元404包括:第一网格生成模块(图中未示出),第一风格生成模块(图中未示出)。其中,上述第一网格生成模块,可以被配置成基于预测的混合形状系数和预设的风格化基底,生成三维网格图。上述第一风格生成模块,可以被配置成将三维网格图输入可微渲染器,生成预测风格图。
86.在本实施例的一些可选实现方式中,上述预测的三维图像参数为预测的风格化基底,训练单元404包括:第二网格生成模块(图中未示出),第二风格生成模块(图中未示出)。其中,上述第二网格生成模块,可以被配置成基于预设的混合形状系数和预测的风格化基底,生成三维网格图。上述第二风格生成模块,可以被配置成将三维网格图输入可微渲染器,生成预测风格图。
87.在本实施例的一些可选实现方式中,上述预测的三维图像参数为预测的三维网格参数,训练单元404包括:第三网格生成模块(图中未示出),第三风格生成模块(图中未示出)。其中,上述第三网格生成模块,可以被配置成基于预测的三维网格参数,生成三维网格图。上述第三风格生成模块,可以被配置成将三维网格图输入可微渲染器,生成预测风格图。
88.本公开的实施例提供的风格迁移模型训练装置,首先,样本获取单元401获取预置的样本集,样本集包括至少一个样本,样本包括二维原图和与二维原图对应的风格化图;其次,网络获取单元402获取预先建立的包括卷积神经网络的风格迁移网络,卷积神经网络用于表征二维图像与风格化的三维图像参数之间的关系;再次,选取单元403将样本集中选取的样本的二维原图输入风格迁移网络,得到卷积神经网络预测的三维图像参数;从次,训练单元404基于预测的三维图像参数和选取的样本中的风格化图,训练卷积神经网络;最后,输出单元405响应于确定卷积神经网络满足训练完成条件,将风格迁移网络作为风格迁移模型。由此,通过构建与三维图像参数相关的卷积神经网络,可以对风格化的三维图像参数的量化进行有效的调控,客观的得出二维原图对应的风格化图,得到了精度较高的风格迁移模型,并且采用包括二维原图和风格化图样本,提高了风格迁移模型训练的可靠性和准确性。
89.进一步参考图5,作为对上述各图所示方法的实现,本公开提供了风格迁移装置的一个实施例,该装置实施例与图3所示的方法实施例相对应,该装置具体可应用于各种电子设备中。
90.如图5所示,本实施例提供的风格迁移装置500包括:获取单元501,转换单元502。其中,上述获取单元501,可以被配置成获取待进行风格化的人脸图像。上述转换单元502,可以被配置成将人脸图像输入如上述图1实施例所描述的方法生成的风格迁移模型中,输出人脸图像的风格化结果。
91.在本实施例中,风格迁移装置500中:获取单元501,转换单元502的具体处理及其所带来的技术效果可分别参考图3对应实施例中的步骤301、步骤302的相关说明,在此不再
赘述。
92.本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
93.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
94.图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
95.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
96.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
97.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如风格迁移模型训练方法或风格迁移方法。例如,在一些实施例中,风格迁移模型训练方法或风格迁移方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的风格迁移模型训练方法或风格迁移方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行风格迁移模型训练方法或风格迁移方法。
98.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
99.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程风格迁移模型训练装置、风格迁移装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
100.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
101.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
102.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
103.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
104.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
105.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献