一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

获取虚拟图像的方法、装置、设备及存储介质与流程

2021-11-26 22:52:00 来源:中国专利 TAG:


1.本技术实施例涉及人工智能技术领域,特别涉及一种获取虚拟图像的方法、装置、设备及存储介质。


背景技术:

2.随着人工智能技术的发展,越来越多的应用场景需要获取与某一对象的原始图像对应的虚拟图像,其中,与某一对象的原始图像对应的虚拟图像保留有对象的对象本体特征且具有某一特定属性(如,动漫风格、卡通风格等)。
3.相关技术中,获取保留有对象本体特征且具有特定属性的样本图像,然后利用获取的样本图像训练得到一个图像生成模型,进而基于得到的图像生成模型获取与某一对象的原始图像对应的虚拟图像。
4.在此种方式中,要想保证获取的虚拟图像有较好的质量,需要获取足够数量的保留有对象本体特征且具有特定属性的样本图像,在很多情况下,保留有对象本体特征且具有特定属性的样本图像的获取难度较大,导致训练得到图像生成模型的效率较低,进而导致获取虚拟图像的效率较低。若为了提高获取虚拟图像的效率而获取较少数量的样本图像,则会导致图像生成模型生成的虚拟图像的质量较差。


技术实现要素:

5.本技术实施例提供了一种获取虚拟图像的方法、装置、设备及存储介质,可用于在保证获取的虚拟图像的质量的同时,提高获取虚拟图像的效率。所述技术方案如下:
6.一方面,本技术实施例提供了一种获取虚拟图像的方法,所述方法包括:
7.获取目标图像生成模型,所述目标图像生成模型通过融合第一图像生成模型和第二图像生成模型得到,所述第一图像生成模型基于保留有样本对象的对象本体特征的样本原始图像训练得到,所述第二图像生成模型基于具有目标属性的样本虚拟图像训练得到;
8.基于所述目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像,所述目标虚拟图像保留有所述目标对象的对象本体特征且具有所述目标属性。
9.另一方面,提供了一种获取虚拟图像的装置,所述装置包括:
10.第一获取单元,用于获取目标图像生成模型,所述目标图像生成模型通过融合第一图像生成模型和第二图像生成模型得到,所述第一图像生成模型基于保留有样本对象的对象本体特征的样本原始图像训练得到,所述第二图像生成模型基于具有目标属性的样本虚拟图像训练得到;
11.第二获取单元,用于基于所述目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像,所述目标虚拟图像保留有所述目标对象的对象本体特征且具有所述目标属性。
12.在一种可能实现方式中,所述装置还包括:
13.第三获取单元,用于获取所述样本原始图像和所述样本虚拟图像;基于所述样本
原始图像,训练得到所述第一图像生成模型;基于所述样本虚拟图像,训练得到所述第二图像生成模型;
14.融合单元,用于融合所述第一图像生成模型和所述第二图像生成模型,得到所述目标图像生成模型。
15.在一种可能实现方式中,所述融合单元,用于确定至少一种融合方式,任一种融合方式用于指示一种融合所述第一图像生成模型和所述第二图像生成模型的方式;基于所述至少一种融合方式,获取至少一个候选图像生成模型,任一候选图像生成模型基于任一种融合方式融合所述第一图像生成模型和所述第二图像生成模型得到;响应于第三图像生成模型的图像生成功能满足参考条件,将所述第三图像生成模型作为所述目标图像生成模型,所述第三图像生成模型为所述至少一个候选图像生成模型中满足选取条件的候选图像生成模型。
16.在一种可能实现方式中,所述第一图像生成模型和所述第二图像生成模型均包括参考数量层网络,任一种融合方式包括一种所述参考数量层网络分别对应的目标网络参数的确定方式;所述融合单元,还用于基于所述任一种融合方式包括的所述参考数量层网络分别对应的目标网络参数的确定方式,确定所述参考数量层网络分别对应的目标网络参数;基于所述参考数量层网络分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整,将调整后得到的图像生成模型作为任一候选图像生成模型;其中,所述任一种融合方式包括的任一层网络对应的目标网络参数的确定方式用于指示所述任一层网络对应的目标网络参数与第一网络参数和第二网参数中的至少一个之间的关系;所述第一网络参数为所述第一图像生成模型中的所述任一层网络具有的参数,所述第二网络参数为所述第二图像生成模型中的所述任一层网络具有的参数。
17.在一种可能实现方式中,所述装置还包括:
18.第四获取单元,用于响应于所述第三图像生成模型的图像生成功能不满足所述参考条件,获取补充图像,所述补充图像用于对所述样本虚拟图像进行补充;
19.所述第三获取单元,还用于基于所述补充图像和所述样本虚拟图像,对所述第二图像生成模型进行训练,得到更新后的第二图像生成模型;
20.所述融合单元,还用于融合所述第一图像生成模型和所述更新后的第二图像生成模型,得到第四图像生成模型;响应于所述第四图像生成模型的图像生成功能满足所述参考条件,将所述第四图像生成模型作为所述目标图像生成模型。
21.在一种可能实现方式中,所述第四获取单元,用于获取增强图像特征,所述增强图像特征用于增强所述第二图像生成模型的图像生成功能;调用所述第二图像生成模型,对所述增强图像特征进行处理,得到所述补充图像。
22.在一种可能实现方式中,所述第四获取单元,用于获取图像驱动模型,所述图像驱动模型基于具有所述目标属性的样本视频训练得到;调用所述图像驱动模型,对所述样本虚拟图像进行驱动,得到所述样本虚拟图像对应的增强视频;在所述样本虚拟图像对应的增强视频中提取视频帧作为所述补充图像。
23.在一种可能实现方式中,所述第二获取单元,用于获取所述目标对象的原始图像对应的原始图像特征;基于所述原始图像特征,获取目标图像特征;调用所述目标图像生成模型,对所述目标图像特征进行处理,得到所述目标对象的原始图像对应的目标虚拟图像。
24.在一种可能实现方式中,所述第二获取单元,还用于利用所述目标图像生成模型对应的图像特征转换方式对所述原始图像特征进行转换,将转换后得到的图像特征作为所述目标图像特征。
25.在一种可能实现方式中,所述第二获取单元,用于调用所述目标图像生成模型,对候选图像特征进行处理,得到所述候选图像特征对应的候选虚拟图像;基于所述候选图像特征对应的候选原始图像和所述候选图像特征对应的候选虚拟图像,获取目标图像翻译模型,所述候选图像特征对应的候选原始图像为所述候选图像特征所标识的保留有对象本体特征的图像;调用所述目标图像翻译模型,对所述目标对象的原始图像进行处理,得到所述目标对象的原始图像对应的目标虚拟图像。
26.在一种可能实现方式中,所述第二获取单元,还用于调用初始图像翻译模型,对所述候选图像特征对应的候选原始图像进行处理,得到所述候选图像特征对应的候选预测图像;基于所述候选图像特征对应的候选预测图像和所述候选图像特征对应的候选虚拟图像之间的差异,确定损失函数;利用所述损失函数对所述初始图像翻译模型进行训练,得到所述目标图像翻译模型。
27.在一种可能实现方式中,所述装置还包括:
28.采集单元,用于响应于针对所述目标属性的虚拟图像显示指令,采集交互对象的原始图像;
29.显示单元,用于调用目标图像预测模型,对所述交互对象的原始图像进行处理,得到所述交互对象的原始图像对应的虚拟图像,所述目标图像预测模型基于所述目标对象的原始图像和所述目标对象的原始图像对应的目标虚拟图像训练得到;显示所述交互对象的原始图像对应的虚拟图像。
30.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现上述任一所述的获取虚拟图像的方法。
31.另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一所述的获取虚拟图像的方法。
32.另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的获取虚拟图像的方法。
33.本技术实施例提供的技术方案至少带来如下有益效果:
34.在本技术实施例中,用于获取虚拟图像的目标图像生成模型是通过融合第一图像生成模型和第二图像生成模型得到的,其中,第一图像生成模型能够关注对象本体特征,第二图像生成模型能够关注目标属性。因此,目标图像生成模型能够同时关注对象本体特征和目标属性,从而有利于保证获取的虚拟图像的质量。此外,相比于保留有对象本体特征且具有目标属性的样本图像,训练得到第一图像生成模型所依据的样本原始图像以及训练得到第二图像生成模型所依据的样本虚拟图像均较容易获取,有利于缩短目标图像生成模型的获取耗时,从而提高获取虚拟图像的效率。也就是说,本技术实施例提供的获取虚拟图像
的方式能够在保证获取的虚拟图像的质量的同时,提高获取虚拟图像的效率。
附图说明
35.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本技术实施例提供的一种获取虚拟图像的方法的实施环境的示意图;
37.图2是本技术实施例提供的一种获取虚拟图像的方法的流程图;
38.图3是本技术实施例提供的一种融合第一图像生成模型和第二图像生成模型,得到目标图像生成模型的过程的流程图;
39.图4是本技术实施例提供的一种对至少一个候选图像生成模型进行图像生成测试后,至少一个图像生成模型生成的图像的示意图;
40.图5是本技术实施例提供的一种获取第四图像生成模型的过程的流程图;
41.图6是本技术实施例提供的一种获取目标图像生成模型的过程的示意图;
42.图7是本技术实施例提供的一种显示保留有对象本体特征且具有目标属性的虚拟图像的玩法上线的过程的示意图;
43.图8是本技术实施例提供的一种交互对象的原始图像以及保留有交互对象的对象本体特征且具有目标属性的虚拟图像的示意图;
44.图9是本技术实施例提供的一种获取虚拟图像的装置的示意图;
45.图10是本技术实施例提供的一种获取虚拟图像的装置的示意图;
46.图11是本技术实施例提供的一种服务器的结构示意图;
47.图12是本技术实施例提供的一种终端的结构示意图。
具体实施方式
48.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
49.需要说明的是,本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
50.在示例性实施例中,本技术实施例提供的获取虚拟图像的方法能够应用于人工智能技术领域。接下来对人工智能技术进行介绍。
51.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能
也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
52.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本技术实施例提供的获取虚拟图像的方法涉及计算机视觉技术和机器学习技术。
53.计算机视觉(computer vision,cv)技术是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括获取虚拟图像、图像处理、图像识别、图像语义理解、图像检索、ocr(optical character recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d(three dimensional,三维)技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
54.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
55.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如,常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
56.在示例性实施例中,本技术实施例中提供的获取虚拟图像的方法在区块链系统中实现,本技术实施例提供的获取虚拟图像的方法中涉及的图像(样本原始图像、样本虚拟图像、目标对象的原始图像、目标虚拟图像等)以及模型(目标图像生成模型、第一图像生成模型、第二图像生成模型等)等均保存在区块链系统中的区块链上,图像以及模型的安全性和可靠性较高。
57.图1示出了本技术实施例提供的获取虚拟图像的方法的实施环境的示意图。该实施环境可以包括:终端11和服务器12。
58.本技术实施例提供的获取虚拟图像的方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本技术实施例对此不加以限定。对于本技术实施例提供的获取虚拟图像的方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
59.在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如pc
(personal computer,个人计算机)、手机、智能手机、pda(personal digital assistant,个人数字助手)、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
60.本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
61.基于上述图1所示的实施环境,本技术实施例提供一种获取虚拟图像的方法,以该方法应用于计算机设备为例,该计算机设备可以为服务器,也可以为终端,本技术实施例对此不加以限定。如图2所示,本技术实施例提供的获取虚拟图像的方法包括如下步骤201和步骤202。
62.在步骤201中,获取目标图像生成模型,目标图像生成模型通过融合第一图像生成模型和第二图像生成模型得到,第一图像生成模型基于保留有样本对象的对象本体特征的样本原始图像训练得到,第二图像生成模型基于具有目标属性的样本虚拟图像训练得到。
63.目标图像生成模型是获取保留有对象本体特征且具有目标属性的虚拟图像所依据的模型。在本技术实施例中,目标图像生成模型是通过融合第一图像生成模型和第二图像生成模型得到的。其中,第一图像生成模型基于保留有样本对象的对象本体特征的样本原始图像训练得到,第二图像生成模型基于具有目标属性的样本虚拟图像训练得到。相比于相关技术中的保留有对象本体特征且具有目标属性的样本图像,训练得到第一图像生成模型所依据的样本原始图像以及训练得到第二图像生成模型所依据的样本虚拟图像均较容易获取,第一图像生成模型和第二图像生成模型的获取耗时均较短,有利于缩短目标图像生成模型的获取耗时,从而提高获取虚拟图像的效率。
64.此外,基于保留有样本对象的对象本体特征的样本原始图像训练得到的第一图像生成模型能够关注对象本体特征,基于具有目标属性的样本虚拟图像训练得到的第二图像生成模型能够关系目标属性,因此,通过融合第一图像生成模型和第二图像生成模型得到的目标图像生成模型能够同时关注对象本体特征和目标属性,有利于保证获取的虚拟图像的质量。
65.样本对象是指任一种实体对象,本技术实施例对实体对象的类型不加以限定,示例性地,实体对象的类型为人脸、动物脸或者物体等。样本原始图像保留有样本对象的对象本体特征。样本对象的对象本体特征用于唯一标识样本对象,示例性地,对于样本对象的类型为人脸的情况,根据样本对象的对象本体特征即可得知样本对象为哪个人的人脸,保留对象本体特征可以通过包括保留人脸的脸型、纹理、子部位等实现。示例性地,样本原始图像是指对样本对象进行图像采集后得到的真实图像,例如,对于样本对象的类型为人脸的情况,样本原始图像是指真实人脸图像。
66.目标属性是指图像具有的一种属性,目标属性根据实际需求设定,或者根据应用场景灵活调整,本技术实施例对此不加以限定。示例性地,目标属性是指某一特定风格(如,动漫风格、卡通风格等);或者,目标属性是指某一特定特效(如,欧美小孩特效、迪士尼小孩特效等)。样本虚拟图像具有目标属性。在示例性实施例中,样本虚拟图像中包括与样本对象的相同类型的对象,以保证目标图像生成模型的获取质量。本技术实施例将样本虚拟图
像中包括的对象称为虚拟对象,以便于区分。需要说明的是,样本虚拟图像中包括的虚拟对象是通过对真实对象进行虚拟化处理后得到的对象,样本虚拟图像可能保留了虚拟对象对应的真实对象的对象本体特征,也可能未保留虚拟对象对应的真实对象的对象本体特征,本技术实施例对此不加以限定。
67.该步骤201中的获取目标图像生成模型可以是指直接提取预先存储的目标图像生成模型,也可以是指融合第一图像生成模型和第二图像生成模型得到目标图像生成模型,本技术实施例对此不加以限定。在一种可能实现方式中,获取目标图像生成模型的过程为:获取样本原始图像和样本虚拟图像;基于样本原始图像,训练得到第一图像生成模型;基于样本虚拟图像,训练得到第二图像生成模型;融合第一图像生成模型和第二图像生成模型,得到目标图像生成模型。
68.本技术实施例对样本原始图像和样本虚拟图像的获取方式不加以限定。示例性地,样本原始图像可以从网络上爬取得到,也可以从原始图像库中直接提取得到,还可以由工作人员上传得到;样本虚拟图像可以从网络上爬取得到,也可以从虚拟图像库中提取得到,还可以由工作人员上传得到。需要说明的是,本技术实施例对样本原始图像的数量以及样本虚拟图像的数量不加以限定,可以根据实际情况灵活设定。示例性地,样本原始图像的数量为几万张;样本虚拟图像的数量为几十到几百张,获取几十到几百张具有目标属性的样本虚拟图像所需的耗时较短,从而有利于提高获取第二图像生成模型的效率。
69.第一图像生成模型具有生成保留有对象本体特征的图像的功能。例如,以样本对象的类型为人脸为例,第一图像生成模型具有生成保留人脸身份信息的真人人脸图像的功能。在示例性实施例中,基于样本原始图像,训练得到第一图像生成模型的方式为:获取第一基础图像生成模型;基于样本原始图像,对第一基础图像生成模型进行训练,得到第一图像生成模型。第一基础图像生成模型可以是指未经过任何训练的图像生成模型,也可以是指经过预训练的图像生成模型,本技术实施例对此不加以限定。
70.示例性地,第一图像生成模型为一种包括生成模型和判别模型的生成对抗模型,第一图像生成模型通过基于样本原始图像,利用生成对抗的训练方式对第一基础图像生成模型进行训练得到。本技术实施例对第一图像生成模型的模型结构不加以限定,示例性地,第一图像生成模型为stylegan2(style generative adversarial networks 2,第二代风格生成对抗网络)模型、progressive gan(渐进生成对抗网络)模型等。
71.在基于样本原始图像,利用生成对抗的训练方式对第一基础图像生成模型进行训练的过程中,第一基础图像生成模型中的判别模型的训练目标是准确判断出一张图像是图像生成模型生成的假图像还是样本原始图像中的真图像,第一基础图像生成模型中的生成模型的训练目标是生成尽可能贴近样本原始图像的图像,以使判别模型无法判断出生成的图像是假图像还是真图像。
72.示例性地,在基于样本原始图像,对第一基础图像生成模型进行训练的过程中,对样本原始图像进行图像增强,然后基于增强后的样本原始图像,对第一基础图像生成模型进行训练。示例性地,对样本原始图像进行图像增强的方式包括但不限于旋转、添加噪音、裁剪等。此种方式下,将图像增强在线应用到图像生成模型中训练过程中,有利于提高图像生成模型生成的图像的质量。
73.示例性地,第一图像生成模型的数量为一个,在基于样本原始图像,对第一基础图
像生成模型进行训练的过程中,不断监控训练效果,将训练效果达到条件时得到的图像生成模型作为第一图像生成模型。示例性地,监控训练效果的方式为测试训练过程中得到的图像生成模型的图像生成效果。图像生成模型的图像生成效果的好坏可以由专业人员判断,也可以由计算机设备根据判断规则判断,本技术实施例对此不加以限定。判断规则可以由专业人员设定并上传至计算机设备。
74.第二图像生成模型具有生成具有目标属性的图像的功能,示例性地,以目标属性为卡通风格为例,第二图像生成模型能够生成卡通风格的图像。在一种可能实现方式中,基于样本虚拟图像,训练得到第二图像生成模型的方式为:获取第二基础图像生成模型;基于样本虚拟图像,对第二基础图像生成模型进行训练,得到第二图像生成模型。
75.第二基础图像生成模型可以是指未经过任何训练的图像生成模型,也可以是指经过预训练的图像生成模型,还可以是指基于样本原始图像训练得到的第一图像生成模型,本技术实施例对此不加以限定。对于第二基础图像生成模型是指基于样本原始图像训练得到的第一图像生成模型的情况,获取第二图像生成模型的过程可视为利用样本虚拟对象对第一图像生成模型进行微调的过程。
76.在示例性实施例中,对于第二基础图像生成模型是指基于样本原始图像训练得到的第一图像生成模型的情况,在保证模型生成目标属性细节程度足够且不产生崩坏的图像的情况下停止对于第二基础图像生成模型的训练。
77.在示例性实施例中,第二图像生成模型为一种包括生成模型和判别模型的生成对抗模型,第二图像生成模型通过基于样本虚拟图像,利用生成对抗的训练方式对第二基础图像生成模型进行训练得到。本技术实施例对第二图像生成模型的模型结构不加以限定,示例性地,第二图像生成模型的模型结构与第一图像生成模型的模型结构相同。
78.在基于样本虚拟图像,利用生成对抗的训练方式对第二基础图像生成模型进行训练的过程中,第二基础图像生成模型中的判别模型的训练目标是准确判断出一张图像是图像生成模型生成的假图像还是样本虚拟图像中的真图像,第二基础图像生成模型中的生成模型的训练目标是生成尽可能贴近样本虚拟图像的图像,以使判别模型无法判断出生成的图像是假图像还是真图像。
79.在示例性实施例中,第二图像生成模型的数量为一个或多个,本技术实施例对此加以限定。对于第二图像生成模型的数量为一个的情况,在基于样本虚拟图像,对第二基础图像生成模型进行训练的过程中,不断监控训练效果,将训练效果达到条件时得到的图像生成模型作为第二图像生成模型。对于第二图像生成模型的数量为多个的情况,不同的第二图像生成模型是在基于样本虚拟图像,对第二基础图像生成模型进行训练的过程中的不同训练时长下得到的图像生成模型。获取多个第二图像生成模型的过程可视为通过监督模型的中间训练结果的方式来控制微调模型的学习能力的过程。
80.在示例性实施例中,对于获取第二图像生成模型的过程可视为利用样本虚拟对象对第一图像生成模型进行微调的过程且第二图像生成模型的数量为多个的情况,在较短的训练时长下得到的第二图像生成模型能够生成保留较多的对象本体特征且目标属性化的程度较弱的图像;在较长的训练时长下得到的第二图像生成模型能够生成保留较少的对象本体特征且目标属性化的程度较强的图像。
81.在得到第一图像生成模型和第二图像生成模型之后,融合第一图像生成模型和第
二图像生成模型,得到目标图像生成模型,目标图像生成模型具有生成保留对象本体特征且具有目标属性的图像的功能。在一种可能实现方式中,参见图3,融合第一图像生成模型和第二图像生成模型,得到目标图像生成模型的过程包括以下步骤301至步骤304。
82.步骤301:确定至少一种融合方式,任一种融合方式用于指示一种融合第一图像生成模型和第二图像生成模型的方式。
83.融合方式用于指示融合第一图像生成模型和第二图像生成模型的方式,根据融合方式,即可知道如何融合第一图像生成模型和第二图像生成模型。在一种可能实现方式中,确定至少一种融合方式的过程为:将第一图像生成模型的模型参数和第二图像生成模型的模型参数显示给专业人员查看,获取专业人员通过对第一图像生成模型的参数和第二图像生成模型的参数进行分析后上传的至少一种融合方式。在另一种可能实现方式中,至少一种融合方式是指计算机设备根据参数分析规则对第一图像生成模型的参数和第二图像生成模型的参数自行分析后得到的。
84.在一种可能实现方式中,第一图像生成模型和第二图像生成模型均包括参考数量层网络,也就是说,第一图像生成模型和第二图像生成模型的模型结构相同。在此种情况下,需要基于融合方式获取的候选图像生成模型同样包括参考数量层网络。本技术实施例对参考数量的具体取值不加以限定,可以根据图像生成模型的模型结构确定,也可以根据实际的应用场景灵活调整。
85.在示例性实施例中,图像生成模型为生成对抗模型,图像生成模型中的不同层网络为不同的分辨率层,不同的分辨率层关注不同层面的特征,示例性地,对于样本对象的类型为人脸的情况,图像生成模型中的低分辨率层关注生成的图像中的人脸的姿态、脸型等特征;图像生成模型中的高分辨率层关注生成的图像中的光线、纹理等特征。
86.在示例性实施例中,对于第一图像生成模型和第二图像生成模型均包括参考数量层网络的情况,任一种融合方式包括一种参考数量层网络分别对应的目标网络参数的确定方式。不同种融合方式包括的参考数量层网络分别对应的目标网络参数的确定方式不同。需要说明的是,两种融合方式包括的参考数量层网络分别对应的目标网络参数的确定方式不同可以指示两种融合方式包括的某一层或者某几层网络对应的目标网络参数的确定方式不同。
87.本技术实施例以一种融合方式为例进行说明,任一种融合方式包括的任一层网络对应的目标网络参数的确定方式用于指示任一层网络对应的目标网络参数与第一网络参数和第二网络参数中的至少一个之间的关系。其中,第一网络参数为第一图像生成模型中的该任一层网络具有的参数,第二网络参数为第二图像生成模型中的该任一层网络具有的参数。
88.任一层网络对应的目标网络参数与第一网络参数和第二网络参数中的至少一个之间的关系用于明确任一层网络对应的目标网络参数是如何根据第一网络参数和第二网络参数中的至少一个确定出的。示例性地,对于第二图像生成模型的数量为多个的情况,第二网络参数的数量同样为多个,每个第二图像生成模型均对应一个第二网络参数。
89.示例性地,任一层网络对应的目标网络参数与第一网络参数和第二网络参数中的至少一个之间的关系可以是指任一层网络对应的目标网络参数与第一网络参数之间的关系,也可以是指任一层网络对应的目标网络参数与一个或多个第二网络参数之间的关系,
还可以是指任一层网络对应的目标网络参数与第一网络参数以及一个或多个第二网络参数之间的关系,本技术实施例对此不加以限定。根据任一层网络对应的目标网络参数与第一网络参数和第二网络参数中的至少一个之间的关系,能够明确确定出任一层网络对应的目标网络参数。
90.需要说明的是,同一种融合方式中包括的不同网络层对应的目标网络参数的确定方式可能相同,也可能不同,本技术实施例对此不加以限定。不同种融合方式中包括的同一层网络对应的目标网络参数的确定方式可能相同,也可能不同,本技术实施例对此同样不加以限定。
91.例如,假设第一图像生成模型的数量为一个,记为模型a;第二图像生成模型的数量为5个,分别记为模型b1、模型b2、模型b3、模型b4和模型b5,第一图像生成模型和第二图像生成模型均包括18层网络。融合方式1中包括的第1层网络对应的目标网络参数的确定方式为:将模型a中的第1层网络具有的参数作为第1层网络对应的目标网络参数。融合方式1中包括的第7层网络对应的目标网络参数的确定方式为:将模型a中的第7层网络具有的参数、模型b1中的第7层网络具有的参数、模型b2中的第7层网络具有的参数、模型b3中的第7层网络具有的参数、模型b4中的第7层网络具有的参数以及模型b5中的第7层网络具有的参数按照指定权重进行加权求和,将加权求和后得到的参数作为第7层网络对应的目标网络参数。指定权重由融合方式1中包括的第7层网络对应的目标网络参数的确定方式给出。融合方式1中的第18层网络对应的目标网络参数的确定方式为:将模型b5中的第18层网络具有的参数作为第18层网络对应的目标网络参数。
92.例如,在上述举例的基础上,融合方式2中包括的第1层网络对应的目标网络参数的确定方式为:将模型a中的第1层网络具有的参数作为第1层网络对应的目标网络参数。融合方式2中包括的第7层网络对应的目标网络参数的确定方式为:将模型a中的第7层网络具有参数以及模型b4中的第7层网络具有参数的平均参数作为第7层网络对应的目标参数。融合方式2中包括的第18层网络对应的目标网络参数的确定方式为:将模型b3中的第18层网络具有的参数作为第18层网络对应的目标网络参数。
93.在示例性实施例中,对于第一图像生成模型的数量为一个,第二图像生成模型的数量为多个的情况,不同种融合方式包括的确定方式均涉及第一图像生成模型以及至少涉及一个第二图像生成模型,不同种融合方式涉及的第二图像生成模型可能相同,也可能不同。示例性地,融合方式1包括的确定方式涉及的第二图像生成模型是模型b1、模型b2、模型b3、模型b4和模型b5;融合方式2包括的确定方式涉及的第二图像生成模型是模型b3和模型b4。
94.在示例性实施例中,对于不同种融合方式包括的确定方式涉及的第二图像生成模型相同的情况,不同种融合方式可视为不同参数融合方案对应的融合方式;对于不同种融合方式包括的确定方式涉及的第二图像生成模型不同的情况,由于第二图像生成模型对应的训练时长不同,所以不同种融合方式可视为不同训练时长对应的融合方式。
95.需要说明的是,以上融合方式中的某些层网络对应的目标网络参数的确定方式仅为举例说明,本技术实施例并不局限于此,可以根据实际的情况灵活设定。
96.步骤302:基于至少一种融合方式,获取至少一个候选图像生成模型,任一候选图像生成模型基于任一种融合方式融合第一图像生成模型和第二图像生成模型得到。
97.在确定出至少一种融合方式后,基于每种融合方式,均获取一个候选图像生成模型。候选图像生成模型的数量与融合方式的数量相同。本技术实施例以基于任一种融合方式,获取任一候选图像生成模型为例进行说明。任一候选图像生成模型是基于任一种融合方式融合第一图像生成模型和第二图像生成模型得到的。
98.在一种可能实现方式中,基于任一种融合方式,获取任一候选图像生成模型的过程为:基于任一种融合方式包括的参考数量层网络分别对应的目标网络参数的确定方式,确定参考数量层网络分别对应的目标网络参数;基于参考数量层网络分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整,将调整后得到的图像生成模型作为任一候选图像生成模型。
99.根据步骤301中对任一种融合方式包括的任一层网络对应的目标网络参数的确定方式的介绍可知,根据任一种融合方式包括的任一层网络对应的目标网络的确定方式,即可确定任一层网络对应的目标网络参数。因此,基于任一种融合方式包括的参考数量层网络分别对应的目标网络参数的确定方式,即可确定参考数量层网络分别对应的目标网络参数。需要说明的是,此处的参考数量层网络分别对应的目标网络参数是根据任一种融合方式确定出的,根据不同种融合方式确定出的参考数量层网络分别对应的目标网络参数不同。
100.需要说明的是,根据不同种融合方式确定出的参考数量层网络分别对应的目标网络参数不同是指根据不同种融合方式确定出的某一层网络或者某些层网络对应的目标网络参数不同。
101.在根据任一种融合方式确定出参考数量层网络分别对应的目标网络参数后,基于确定出的参考数量层分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整,将调整后得到的图像生成模型作为任一候选图像生成模型。指定图像生成模型是与任一种融合方式对应的需要调整参数的图像生成模型,与不同种融合方式对应的需要调整参数的指定图像生成模型可以相同,也可以不同,本技术实施例对此不加以限定。
102.本技术实施例对指定图像生成模型的确定方式不加以限定,示例性地,指定图像生成模型为第一图像生成模型,或者,指定图像生成模型为任一第二图像生成模型,再或者,指定图像生成模型为任一包括参考数量层网络的模型。无论哪种确定方式,确定出的指定图像生成模型均包括参考数量层网络。
103.基于参考数量层网络分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整的目的是使得调整后得到的图像生成模型中的任一层网络具有的参数为该任一层网络对应的目标网络参数。示例性地,在基于参考数量层网络分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整的过程中,若指定图像生成模型中某一层网络具有的参数与该层网络对应的目标网络参数相同,则保持指定图像生成模型中的该层网络具有的参数不变;若指定图像生成模型中的某一层网络具有的参数与该层网络对应的目标网络参数不同,则将指定图像生成模型中的该层网络具有的参数替换为该层网络对应的目标网络参数。在指定图像生成模型中的参考数量层网络具有的参数均调整完毕后,将调整后得到的图像生成模型作为任一候选图像生成模型。
104.上述内容以基于任一种融合方式,获取任一候选图像生成模型为例进行了说明,根据上述内容介绍的方式,基于每种融合方式,均能获取一个候选图像生成模型,然后得到至少一个候选图像生成模型。示例性地,获取至少一个候选图像生成模型的过程可视为模型融合的过程。
105.在一种可能实现方式中,在获取至少一个候选图像生成模型之后,在至少一个候选图像生成模型中确定满足选取条件的候选图像生成模型,将满足选取条件的候选图像生成模型作为第三图像生成模型。
106.满足选取条件的候选图像生成模型根据经验设置,或者根据实际的应用场景灵活调整,本技术实施例对此不加以限定。示例性地,满足选取条件的候选图像生成模型为至少一个候选图像生成模型中图像生成效果满足指定条件的候选图像生成模型。候选图像生成模型的图像生成效果可以通过对候选图像生成模型进行图像生成测试,然后对图像生成模型生成的图像进行分析确定。图像生成效果满足指定条件是指图像生成效果最贴近实际应用场景需要的图像生成效果。哪种图像生成效果为最贴近实际应用场景由专业人员根据经验设定。
107.示例性地,对至少一个候选图像生成模型进行图像生成测试后,至少一个图像生成模型生成的图像如图4所示。在图4中,第一列为真人原图,对至少一个候选图像生成模型进行图像测试的过程通过将真人原图的图像特征分别输入至少一个候选图像生成模型实现。在图4所示的图像中,目标属性为美漫风格,除真人原图外,从左往右的图像代表根据不同参数融合方案对应的融合方式确定的候选图像生成模型生成的图像,越往右美漫的风格化越强;从上往下的图像代表根据不同训练时长(从短到长的训练时长)对应的融合方式确定的候选图像生成模型生成的图像,训练时间越长美漫的风格化越强。图4所示的除真人图像外的其他六个候选图像生成模型生成的图像,哪个图像的效果越贴近实际应用场景需要的图像生成效果,则将生成该图像的候选图像生成模型作为满足选取条件的候选图像生成模型,也即将生成该图像的候选图像生成模型作为第三图像生成模型。
108.在示例性实施例中,图像生成效果较好的候选图像生成模型为在特定的高分辨率层选用合适的第二图像生成模型的参数,在特定的低分辨率层选用合适的第一图像生成模型的参数的模型,从而可以使得生成的虚拟图像有更多目标属性的纹理和细节,且保留更多对象本体特征。
109.在确定出第三图像生成模型后,判断第三图像生成模型的图像生成功能是否满足参考条件,若第三图像生成模型的图像生成功能满足参考条件,则执行步骤303;若第三图像生成模型的图像生成功能不满足参考条件,则执行步骤304。某一图像生成模型的图像生成功能满足参考条件根据经验设置,或者根据应用场景灵活调整,本技术实施例对此不加以限定。示例性地,某一图像生成模型的图像生成功能满足参考条件是指该图像生成模型能够生成达到预期的虚拟图像。
110.示例性地,某一图像生成模型的图像生成功能满足参考条件是指该图像生成模型能够生成包括指定姿态的虚拟对象的虚拟图像。指定姿态根据需求设置,或者根据实际的应用场景灵活调整。示例性地,对于虚拟对象的类型为人脸的情况,指定姿态包括但不限于正脸、小角度侧脸、大角度侧脸、张嘴、闭嘴、睁眼、闭眼等姿态。
111.步骤303:响应于第三图像生成模型的图像生成功能满足参考条件,将第三图像生
成模型作为目标图像生成模型。
112.当第三图像生成模型的图像生成功能满足参考条件时,说明无需继续获取其他的图像生成模型,直接将该第三图像生成模型作为目标图像生成模型。其中,第三图像生成模型为至少一个候选图像生成模型中满足选取条件的候选图像生成模型。
113.步骤304:响应于第三图像生成模型的图像生成功能不满足参考条件,获取第四图像生成模型;响应于第四图像生成模型的图像生成功能满足参考条件,将第四图像生成模型作为目标图像生成模型。
114.当第三图像生成模型的图像生成功能不满足参考条件时,说明需要进一步获取第四图像生成模型,以提高图像生成模型的图像生成功能。相比于第三图像生成模型,第四图像生成模型的图像生成功能更贴近参考条件。
115.在一种可能实现方式中,参见图5,获取第四图像生成模型的过程包括以下步骤501至步骤503。
116.步骤501:获取补充图像,补充图像用于对样本虚拟图像进行补充。
117.在示例性实施例中,训练一个效果较稳定的图像生成模型,通常需要上万张数据。但在实际研发过程中,往往无法搜集到足够的数据,尤其是比较好的具有目标属性的样本虚拟图像,一般可能只有几百张数据,甚至几十张数据。不仅数据质量不高,数据覆盖度还非常低,例如,对于虚拟对象的类型为人脸的情况,虚拟对象的姿态为闭眼,张嘴,以及大角度侧脸等的样本虚拟图像非常稀缺。但在实际场景中,这些都是常见的人脸姿态。也就是说,本技术实施例中,认为导致第三图像生成模型的图像生成功能不满足参考条件的原因为样本虚拟图像的质量不高或者样本虚拟图像的覆盖度较低。
118.在样本虚拟图像的质量不高或者样本虚拟图像的覆盖度较低的情况下,虽然模型融合的方式获取的第三图像生成模型可以生成保留有对象本体特征且具有目标属性的图像,但是对样本虚拟图像未覆盖的姿态的图像的生成效果较差,例如,对于虚拟对象的类型为人脸的情况,样本虚拟图像覆盖了正脸这一姿态,但未覆盖闭眼,大角度侧脸等姿态,则第三图像生成模型对包括正脸的虚拟对象的图像的生成效果较好,对包括闭眼,大角度侧脸的虚拟对象的图像的生成效果较差。
119.补充图像用于对样本虚拟图像进行补充,从而丰富初始搜集的样本虚拟图像。补充图像是指样本虚拟图像未覆盖的具有目标属性的图像。获取补充图像的过程可视为对样本虚拟图像进行数据增强的过程,通过数据增强的方法,在缺乏数据的情况下,造出匮乏的样本数据,从而能够极大地降低对样本虚拟图像的依赖。通过数据增强,能够有效减少需要搜集的具有目标属性的样本虚拟图像的数量,从而提高第二图像生成模型的获取效率。
120.在一种可能实现方式中,获取补充图像的方式包括但不限于以下两种方式:
121.方式一:获取增强图像特征,增强图像特征用于增强第二图像生成模型的图像生成功能;调用第二图像生成模型,对增强图像特征进行处理,得到补充图像。
122.在此种方式一下,利用增强图像特征获取补充图像,增强图像特征用于增强第二图像生成模型的图像生成功能。利用能够增强第二图像生成模型的图像生成功能的增强图像特征来获取补充图像,从而利用获取的补充图像来增强第二图像生成模型的图像生成功能。
123.增强图像特征根据第二图像生成模型需要增强的图像生成功能确定,本技术实施
例对此不加以限定。第二图像生成模型的图像生成功能用于指示第二图像生成模型能够生成什么样的虚拟图像。在一种可能实现方式中,增强图像特征由专业人员通过对第二图像生成模型已具有的图像生成功能确定并上传至计算机设备。在另一种实现方式中,增强图像特征由计算机设备根据图像生成功能分析规则对第二图像生成模型已具有的图像生成功能进行分析自行获取。
124.在示例性实施例中,增强图像特征的获取方式为:对第二图像生成模型已具有的图像生成功能进行分析,确定出第二图像生成模型能够生成的各类型的图像;将第二图像生成模型能够生成的各类型的图像与需求类型的图像进行比对,确定第二图像生成模型不能够生成哪些类型的图像;将用于指示第二图像生成模型不能够生成的类型的图像的图像特征作为增强图像特征。示例性地,增强图像特征的数量可能为一个,也可能为多个,本技术实施例对此不加以限定。需求类型根据经验设置,或者根据实际的应用场景灵活调整。
125.示例性地,用于指示第二图像生成模型不能够生成的类型的图像的图像特征可以通过对随机产生的图像特征进行编辑得到,也可以通过对某些真实存在的图像的图像特征进行编辑得到,本技术实施例对此不加以限定。示例性地,图像特征还可以称为隐向量。
126.获取增强图像特征的过程可视为利用图像特征编辑逐步扩展训练数据的过程。示例性地,若某一图像特征为包括睁眼这一姿态的虚拟对象的图像的特征,则通过对该图像特征朝着闭眼的方向进行编辑,即可得到一个用于指示包括闭眼这一姿态的虚拟对象的图像的图像特征,利用用于指示包括闭眼这一姿态的虚拟对象的图像的图像特征,即可得到包括闭眼这一姿态的虚拟对象的图像。
127.示例性地,对图像特征进行编辑的过程为利用图像特征中需要调整的某一子特征对应的方向向量对该图像特征进行编辑的过程。图像特征中需要调整的子特征根据实际情况确定,本技术实施例对此不加以限定。示例性地,图像特征中需要调整的某一子特征为人脸角度子特征,则利用人脸角度子特征对应的方向向量对该图像特征进行编辑,实现将包括正脸的虚拟对象的图像的图像特征编辑为包括侧脸的虚拟对象的图像的图像特征。
128.示例性地,图像特征中的子特征对应的方向向量用于对该子特征进行编辑,子特征对应的方向向量根据经验设置,或者根据图像特征的获取方式灵活调整,本技术实施例对此不加以限定。示例性地,在对图像特征进行编辑的过程中,要注意控制编辑的程度,不能过大,否则由于缺少相应的数据,生成的图像会出现崩坏。示例性地,某一增强图像特征可以是指对某一图像特征编辑一次得到的,也可以是指对某一图像特征连续编辑多次得到的,在对某一图像特征连续编辑多次得到某一增强图像特征的情况下,每次都在前一次编辑后得到的图像特征的基础上继续进行编辑,直至得到最终的增强图像特征。
129.例如,假设某一增强图像特征为用于指示包括大角度侧脸的虚拟对象的图像的特征,则该增强图像特征通过在一个用于指示包括正脸的虚拟对象的图像的特征的基础上连续编辑多次得到,每次编辑均基于上次的结果将人脸角度进行较小角度的编辑,直至生成较高质量的用于指示包括大角度侧脸的虚拟对象的图像的增强图像特征。
130.在获取增强图像特征之后,调用第二图像生成模型,对增强图像特征进行处理,得到补充图像。第二图像生成模型能够根据输入的图像特征生成图像。将增强图像特征输入第二图像生成模型,第二图像生成模型能够对增强图像特征进行处理,输出生成的图像,将第二图像生成模型输出的图像作为补充图像。
131.示例性地,调用第二图像生成模型,对增强图像特征进行处理的过程为第二图像生成模型的内部处理过程,具体的处理方式与第二图像生成模型的模型结构有关,本技术实施例对此不加以限定。示例性地,第二图像生成模型为一种生成对抗模型,第二图像生成模型对增强图像特征进行处理的过程为第二图像生成模型中的生成模型对增强图像特征进行处理的过程。
132.方式二:获取图像驱动模型,图像驱动模型基于具有目标属性的样本视频训练得到;调用图像驱动模型,对样本虚拟图像进行驱动,得到样本虚拟图像对应的增强视频;在样本虚拟图像对应的增强视频中提取视频帧作为补充图像。
133.在此种方式二下,利用图像驱动模型获取用于对样本虚拟图像进行补充的补充图像。图像驱动模型具有将一张具有目标属性且包括某一姿态的虚拟对象的图像,驱动成具有目标属性的增强视频的功能。增强视频中具有包括多种姿态的虚拟对象的视频帧。不同的视频帧包括的虚拟对象的姿态可能相同,也可能不同。示例性地,在增强视频中,不同的视频帧包括的虚拟对象的外形相似。
134.此种方式二中的获取图像驱动模型可以是指提取预先存储的图像驱动模型,也可以是指基于具有目标属性的样本视频训练得到图像驱动模型,本技术实施例对此不加以限定。
135.在示例性实施例中,具有目标属性的样本视频由专业人员获取并上传到计算机设备,或者由计算机设备自动从网络中爬取得到。示例性地,具有目标属性的样本视频中的样本视频帧中包括同一虚拟对象,且虚拟对象的姿态多种多样。例如,对于虚拟对象的类型为人脸的情况,虚拟对象的姿态包括但不限于张嘴、闭嘴、睁眼、闭眼、大角度侧脸、小角度侧脸、正脸等。
136.在一种可能实现方式中,基于具有目标属性的样本视频训练得到图像驱动模型的过程为:从样本视频中任取两个样本视频帧,将其中一个样本视频帧作为原图,将另外一个样本视频帧作为目标图;获取目标图中的虚拟对象的姿态相对于原图中的虚拟对象的姿态的运动信息;将原图和运动信息输入初始驱动模型,得到初始驱动模型输出的预测图;基于目标图和预测图之间的差异,获取驱动损失函数,利用驱动损失函数对初始驱动模型进行训练,得到图像驱动模型。本技术实施例对初始驱动模型的模型结构不加以限定,示例性地,初始驱动模型的模型结构为卷积神经网络模型,例如,vgg(visual geometry group,视觉几何组)模型。
137.示例性地,目标图中的虚拟对象与原图中的虚拟对象的外观相似,目标图中的虚拟对象的姿态相对于原图中的虚拟对象的姿态的运动信息用于指示从原图中的虚拟对象的姿态调整到目标图中的虚拟对象的姿态需要的运动信息。示例性地,目标图中的虚拟对象的姿态相对于原图中的虚拟对象的姿态的运动信息通过将目标图和原图的外观信息和姿态信息进行解耦,然后对目标图和原图的姿态信息进行比对得到。
138.上述训练得到图像驱动模型的方式为监督训练的方式,利用上述方式训练得到的图像驱动模型能够学习到样本视频中的各个样本视频帧中的虚拟对象的姿态,并且能够基于包括某一姿态的虚拟对象的图像,获取包括学习到的姿态的虚拟对象的视频帧构成的视频。
139.在获取图像驱动模型之后,将样本虚拟图像输入图像驱动模型,由图像驱动模型
对样本虚拟图像进行驱动,得到样本虚拟图像对应的增强视频。图像驱动模型对样本虚拟图像进行驱动的过程为图像驱动模型的内部处理过程,具体的处理方式与图像驱动模型的模型结构有关,本技术实施例对此不加以限定。
140.样本虚拟图像对应的增强视频即为包括多种姿态的虚拟对象的视频帧构成的视频,多种姿态为样本视频中的样本视频帧中的虚拟对象的姿态。在示例性实施例中,对于样本虚拟图像的数量为多个的情况,可以调用图像驱动模型对全部的样本虚拟图像分别进行驱动,也可以调用图像驱动模型对部分的样本虚拟图像进行驱动,本技术实施例对此不加以限定。调用图像驱动模型对每个样本虚拟对象进行驱动,均可以得到一个增强视频。不同的样本虚拟图像对应的增强视频可能相同,也可能不同。
141.在得到样本虚拟图像对应的增强视频后,从样本虚拟图像对应的增强视频中提取视频帧作为补充图像。示例性地,样本虚拟图像对应的增强视频中的哪个或哪些基础视频帧为需要提取的视频帧根据需求设置。示例性地,样本虚拟图像对的增强视频中的需要提取的视频帧是指样本虚拟图像对应的增强视频中的各个基础视频帧中包括指定姿态的虚拟对象的视频帧。示例性地,指定姿态是指样本虚拟图像中的虚拟对象缺乏的姿态。例如,样本虚拟图像中的虚拟对象的姿态为睁眼,指定姿态为样本虚拟图像中的虚拟对象缺乏的闭眼这一姿态。
142.示例性地,利用此种方式二获取补充图像的过程可视为利用图像驱动技术对样本虚拟图像进行数据增强的过程。预先利用图像驱动技术训练一个图像驱动模型,在需要获取补充图像时,调用图像驱动模型对样本虚拟图像进行驱动,得到增强视频,进而从增强视频中提取视频帧作为补充图像。对于虚拟对象的类型为人脸的情况,此种方式二利用图像驱动模型能够造出包括侧脸、闭眼、张嘴等比较缺乏的姿态的虚拟对象的图像,从而能够对原始搜集的样本虚拟图像中缺乏的包括大角度侧脸和特定表情等姿态的虚拟对象的图像进行补充。
143.步骤502:基于补充图像和样本虚拟图像,对第二图像生成模型进行训练,得到更新后的第二图像生成模型。
144.由于补充图像用于对样本虚拟图像进行补充,所以,在获取补充图像之后,基于补充图像和样本虚拟图像,对第二图像生成模型进行训练,得到更新后的第二图像生成模型。更新后的第二图像生成模型比更新前的第二图像生成模型具有更好的图像生成功能。
145.示例性地,基于补充图像和样本虚拟图像,对第二图像生成模型进行训练的方式为:将补充图像和样本虚拟图像混合在一起,作为新的样本虚拟图像;基于新的样本虚拟图像,对第二图像生成模型进行训练,得到更新后的第二图像生成模型。示例性地,对于第二图像生成模型为多个的情况,基于新的样本虚拟图像,对每个第二图像生成模型分别进行训练,得到多个更新后的第二图像生成模型。
146.示例性地,第二图像生成模型为一种生成对抗模型,更新后的第二图像生成模型通过基于新的样本虚拟图像,利用生成对抗的训练方式对第二图像生成模型进行训练得到。
147.步骤503:融合第一图像生成模型和更新后的第二图像生成模型,得到第四图像生成模型。
148.在得到更新后的第二图像生成模型后,融合第一图像生成模型和更新后的第二图
像生成模型,得到第四图像生成模型。相比于第三图像生成模型,第四图像生成模型具有更好的图像生成功能。
149.在一种可能实现方式中,融合第一图像生成模型和更新后的第二图像生成模型,得到第四图像生成模型的过程为:确定至少一种第二融合方式,任一种第二融合方式用于指示一种融合第一图像生成模型和更新后的第二图像生成模型的方式;基于至少一种第二融合方式,获取至少一个第二候选图像生成模型,任一第二候选图像生成模型基于任一种第二融合方式融合第一图像生成模型和更新后的第二图像生成模型得到;将至少一个第二候选图像生成模型中满足选取条件的第二候选图像生成模型作为第四图像生成模型。该过程的实现方式参见步骤301和步骤302,此处不再赘述。
150.需要说明的是,以上步骤501至步骤503所述的获取第四图像生成模型的方式仅为一种示例性实现方式,本技术实施例并不局限于此。示例性地,获取第四图像生成模型的过程为:调用第三图像生成模型,生成第二生成图像;获取第二增强图像特征,第二图像增强特征用于增强第三图像生成模型的图像生成功能;调用第三图像生成模型,对第二增强图像特征进行处理,得到第三生成图像;基于第二生成图像和第三生成图像,对第三图像生成模型进行训练,得到第四图像生成模型。
151.第二生成图像为第三图像生成模型已具有的图像生成功能下能够生成的图像,第三生成图像为利用用于增强第三图像生成模型的图像生成功能的第二图像增强特征得到的图像,第三生成图像能够对第二生成图像进行补充。因此,基于第二生成图像和第三生成图像,对第三图像生成模型进行训练,能够得到比第三图像生成模型的图像生成功能好的第四图像生成模型。
152.在获取第四图像生成模型之后,判断第四图像生成模型的图像生成功能是否满足参考条件,判断第四图像生成模型的图像生成功能是否满足参考条件的方式参见判断第三图像生成模型是否满足参考条件的方式,此处不再赘述。
153.若第四图像生成模型的图像生成功能满足参考条件,则将第四图像生成模型作为目标图像生成模型;若第四图像生成模型的图像生成功能不满足参考条件,则继续获取第五图像生成模型,直至获取到图像生成功能满足参考条件的图像生成模型,将图像生成功能满足参考条件的图像生成模型作为目标图像生成模型。获取第五图像生成模型的过程参见获取第四图像生成模型的过程,此处不再赘述。
154.示例性地,获取目标图像生成模型的过程如图6所示。首先搜集样本虚拟图像,然后利用样本虚拟图像获取第二图像生成模型;将第一图像生成模型和第二图像生成模型进行模型融合,得到第三图像生成模型;判断第三图像生成模型的图像生成功能是否满足参考条件。若第三图像生成模型的图像生成功能满足参考条件,则将第三图像生成模型作为目标图像生成模型。若第三图像生成模型的图像生成功能不满足参考条件,则获取补充图像;利用补充图像和样本虚拟图像,获取更新后的第二图像生成模型,以此类推,直至获取图像生成功能满足参考条件的图像生成模型,将图像生成功能满足参考条件的图像生成模型作为目标图像生成模型。
155.在步骤202中,基于目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像,目标虚拟图像保留有目标对象的对象本体特征且具有目标属性。
156.在获取目标图像生成模型之后,基于目标图像生成模型,获取目标对象的原始图
像对应的目标虚拟图像。由于目标图像生成模型能够同时关注对象本体特征和目标属性,所以目标虚拟图像保留有目标对象的对象本体特征且具有目标属性。
157.目标对象为与样本对象相同类型的实体对象,目标对象的原始图像的数量为一张或多张,目标对象的原始图像的来源是多元化的。示例性地,目标对象的原始图像从原始图像库中获取;或者,目标对象的原始图像从网络上爬取;再或者,目标对象的原始图像由专业人员上传至计算机设备,本技术实施例对此不加以限定。
158.在一种可能实现方式中,基于目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像的方式包括但不限于以下两种:
159.方式1:获取目标对象的原始图像对应的原始图像特征;基于原始图像特征,获取目标图像特征;调用目标图像生成模型,对目标图像特征进行处理,得到目标对象的原始图像对应的目标虚拟图像。
160.目标对象的原始图像对应的原始图像特征通过对目标对象的原始图像进行特征提取得到。本技术实施例对对目标对象的原始图像进行特征提取的方式不加以限定,例如,调用特征提取模型对目标对象的原始图像进行特征提取。在得到原始图像特征后,基于原始图像特征,获取用于输入目标图像生成模型的目标图像特征,由目标图像生成模型对目标图像特征进行处理,将目标图像生成模型根据输入的目标图像特征生成的虚拟图像作为目标对象的原始图像对应的目标虚拟图像。目标图像生成模型对目标图像特征进行处理的处理过程为目标图像生成模型的内部处理过程,具体的处理方式与目标图像生成模型的模型结构有关,本技术实施例对此不加以限定。
161.目标图像特征是基于原始图像特征获取的需要输入到目标图像生成模型中的图像特征。在示例性实施例中,基于原始图像特征,获取目标图像特征的方式为:直接将原始图像特征作为目标图像特征。在此种方式下,直接调用目标图像生成模型对原始图像特征进行处理得到目标虚拟图像,获取目标虚拟图像的效率较高。
162.在一种可能实现方式中,基于原始图像特征,获取目标图像特征的方式为:利用目标图像生成模型对应的图像特征转换方式对原始图像特征进行转换,将转换后得到的图像特征作为目标图像特征。
163.目标图像生成模型对应的图像特征转换方式用于指示需要对原始图像特征进行转换的方式。示例性地,图像特征转换方式根据经验设置,或者根据目标图像生成模型的图像生成效果灵活调整。图像特征转换方式的设置目的是:使目标图像生成模型生成的虚拟图像兼顾对象本体特征和目标属性。示例性地,对于对象的类型为人脸的情况,图像特征转换方式的设置目的是:使目标图像生成模型生成的虚拟图像既维持真人的脸型和五官等相似度,又能具有更多目标属性的细节。示例性地,若目标图像生成模型的图像生成效果为目标属性较弱的效果,则图像特征转换方式用于指示将原始图像特征朝增强目标属性的方向进行转换。根据利用图像特征转换方式转换后的图像特征,有利于提高生成的虚拟图像的质量。
164.对于目标图像生成模型对应有图像特征转换方式的情况,在获取目标对象的原始图像对应的原始图像特征之后,利用图像特征转换方式对原始图像特征进行转换,得到转换后的图像特征。然后将转换后的图像特征输入目标图像生成模型,由目标图像生成模型对转换后的图像特征进行处理,将目标图像生成模型根据输入的转换后的图像特征生成的
虚拟图像作为目标对象的原始图像对应的目标虚拟图像。相比于直接调用目标图像生成模型对原始图像特征进行处理得到的目标虚拟图像,调用目标图像生成模型对转换后的图像特征进行处理后得到的目标虚拟图像的质量更好。
165.方式2:调用目标图像生成模型,对候选图像特征进行处理,得到候选图像特征对应的候选虚拟图像;基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像,获取目标图像翻译模型,候选图像特征对应的候选原始图像为候选图像特征所标识的保留有对象本体特征的图像;调用目标图像翻译模型,对目标对象的原始图像进行处理,得到目标对象的原始图像对应的目标虚拟图像。
166.在此种方式2下,先基于目标图像生成模型,获取目标图像翻译模型,然后调用目标图像翻译模型,获取目标虚拟图像。目标图像翻译模型具有根据输入的保留有对象本体特征的原始图像,输出保留有同样的对象本体特征且具有目标属性的虚拟图像的功能。目标图像翻译模型是基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像获取得到的。示例性地,候选图像特征是随机产生的图像特征,或者是对某一保留有对象本体特征的图像进行特征提取后得到的图像特征,本技术实施例对此不加以限定。
167.需要说明的是,候选图像特征的数量为一个或多个,每个候选图像特征均标识一个保留有对象本体特征的图像,本技术实施例将候选图像特征所标识的保留有对象本体特征的图像称为候选图像特征对应的候选原始图像。对于候选图像特征是随机产生的图像特征的情况,候选图像特征对应的候选原始图像为虚假的图像;对于候选图像特征是对某一保留有对象本体特征的图像进行特征提取后得到的图像特征的情况,候选图像特征对应的候选原始图像为真实存在的图像。图像特征与图像一一对应,通过对候选图像特征进行图像恢复,即可得到候选图像特征对应的候选原始图像。
168.候选图像特征对应的候选虚拟图像通过调用目标图像生成模型获取得到,将候选图像特征输入目标图像生成模型,由目标图像生成模型对候选图像特征进行处理,得到候选图像特征对应的候选虚拟图像。候选图像特征对应的候选虚拟图像保留有候选图像特征所标识的候选原始图像保留的对象本体特征且具有目标属性。目标图像生成模型对候选图像特征进行处理的处理过程为目标图像生成模型的内部处理过程,具体的处理方式与目标图像生成模型的模型结构有关,本技术实施例对此不加以限定。
169.候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像为获取目标图像翻译模型所需的训练数据,在获取候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像后,即可通过训练的方式获取目标图像翻译模型。在一种可能实现方式中,基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像,获取目标图像翻译模型的过程为:调用初始图像翻译模型,对候选图像特征对应的候选原始图像进行处理,得到候选图像特征对应的候选预测图像;基于候选图像特征对应的候选预测图像和候选图像特征对应的候选虚拟图像之间的差异,确定损失函数;利用损失函数对初始图像翻译模型进行训练,得到目标图像翻译模型。
170.初始图像翻译模型是指待训练的图像翻译模型,本技术实施例对初始图像翻译模型的模型结构不加以限定,示例性地,初始图像翻译模型的模型结构为编码

解码结构。上述基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像,训练得到目标图像翻译模型的过程为监督训练过程,此处不再过多赘述。
171.由于目标图像翻译模型是基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像利用监督训练的方式训练得到的,其中,候选虚拟图像是调用目标图像生成模型获取得到的,候选虚拟图像既能保留对象本体特征又具有目标属性,所以,目标图像翻译模型具有根据输入的原始图像,输出保留有对象本体特征且具有目标属性的虚拟图像的功能。
172.在获取目标图像翻译模型之后,将目标对象的原始图像输入目标图像翻译模型,由目标图像翻译模型对目标对象的原始图像进行处理,得到目标对象的原始图像对应的目标虚拟图像。目标图像翻译模型对目标对象的原始图像进行处理的处理过程为目标图像翻译模型的内部处理过程,具体的处理方式与目标图像翻译模型的模型结构有关,本技术实施例对此不加以限定。
173.示例性地,获取目标对象的原始图像对应的目标虚拟图像的目的是:将目标对象的原始图像

目标虚拟图像数据对作为目标属性对应的图像预测模型的训练数据。此种情况下,在仅有几十到几百张样本虚拟图像的条件下,通过本技术实施例提供的方法,能够获取几万张高质量原始图像对应的虚拟图像,得到几万个原始图像

虚拟图像数据对,然后利用获取的原始图像

虚拟图像数据对对目标属性对应的图像预测模型进行训练。示例性地,目标属性对应的图像预测模型为产品需要的模型,利用获取的原始图像

虚拟图像数据对对图像预测模型进行训练的目的是使图像预测模型达到产品上线标准。
174.示例性地,对于获取目标对象的原始图像对应的目标虚拟图像的目的是:将目标对象的原始图像

目标虚拟图像数据对作为目标属性对应的图像预测模型的训练数据的情况,在基于目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像之后,还包括:将目标对象的原始图像输入初始图像预测模型,获取初始图像预测模型预测的目标对象的原始图像对应的预测图像;基于预测图像和目标虚拟图像之间的差异,确定损失函数;利用损失函数对初始图像预测模型进行训练,得到目标图像预测模型。也就是说,目标图像预测模型基于目标对象的原始图像和目标对象的原始图像对应的目标虚拟图像训练得到。
175.本技术实施例对初始图像预测模型的模型结构不加以限定,示例性地,初始图像预测模型的模型结构为编码

解码结构。利用目标对象的原始图像和目标虚拟图像训练得到目标图像预测模型的过程为监督训练过程,此处不再过多赘述。
176.示例性地,目标图像预测模型和目标图像翻译模型的模型结构可以相同,也可以不同。示例性地,对于目标图像预测模型和目标图像翻译模型的模型结构相同的情况,目标图像预测模型的模型参数的数量比目标图像翻译模型的模型参数的数量少,以便于节省产品的部署设备的资源。
177.示例性地,在获取目标图像预测模型之后,即可将目标图像预测模型应用到产品上,使显示保留有对象本体特征且具有目标属性的虚拟图像的玩法上线。示例性地,显示保留有对象本体特征且具有目标属性的虚拟图像的玩法上线的过程如图7所示。搜集数据,包括但不限于保留有样本对象的对象本体特征的样本原始图像和具有目标属性的样本虚拟图像;利用搜集的数据训练得到第一图像生成模型和第二图像生成模型,针对第一图像生成模型和第二图像生成模型执行模型融合和数据增强,得到目标图像生成模型;基于目标图像生成模型获取训练得到目标图像预测模型所需的训练数据,利用获取的训练数据进行端上模型训练,得到目标图像预测模型;在得到目标图像预测模型之后,将目标图像预测模
型应用到产品上,使显示保留有对象本体特征且具有目标属性的虚拟图像的玩法上线。
178.在图7所示的过程中,模型融合和数据增强承担着承上启下的作用,负责学习搜集到的几十到几百张的样本虚拟图像中的目标属性,并且将目标属性迁移到上万张原始图像,为端上模型训练提供高质量的训练数据,帮助玩法上线。
179.在一种实现方式中,显示保留有对象本体特征且具有目标属性的虚拟图像的玩法上线之后,还包括:响应于针对目标属性的虚拟图像显示指令,采集交互对象的原始图像;调用目标图像预测模型,对交互对象的原始图像进行处理,得到交互对象的原始图像对应的虚拟图像;显示交互对象的原始图像对应的虚拟图像。其中,目标图像预测模型基于目标对象的原始图像和目标对象的原始图像对应的目标虚拟图像训练得到。
180.针对目标属性的虚拟图像显示指令用于触发采集交互对象的原始图像的操作,本技术实施例对针对目标属性的虚拟图像显示指令的获取方式不加以限定,示例性地,显示界面中显示有多种可供选择的属性,响应于检测到对目标属性的触发操作,获取针对目标属性的虚拟图像显示指令。在获取针对目标属性的虚拟图像显示指令后,采集交互对象的原始图像。示例性地,交互对象是指产生针对目标属性的虚拟图像显示指令的用户的人脸。
181.由于目标图像预测模型是根据原始图像

保留有对象本体特征且具有目标属性的虚拟图像数据对训练得到的,所以将交互对象的原始图像输入目标图像预测模型,由目标图像预测模型对交互对象的原始图像进行处理,能够得到交互对象的原始图像对应的虚拟图像,交互对象的原始图像对应的虚拟图像保留有交互对象的对象本体特征且具有目标属性。目标图像预测模型对交互对象的原始图像进行处理的处理过程为目标图像预测模型的内部处理过程,具体的处理方式与目标图像预测模型的模型结构有关,本技术实施例对此不加以限定。在获取交互对象的原始图像对应的虚拟图像之后,在显示界面中显示交互对象的原始图像对应的虚拟图像。
182.示例性地,在显示交互对象的原始图像对应的虚拟图像之后,还可以不断参考交互对象的新的原始图像,不断显示新的虚拟图像。交互对象的不同原始图像可能具有不同的面部表情,则显示的不同的虚拟图像也具有不同的面部表情。显示的虚拟图像具有的面部表情与获取虚拟图像所依据的原始图像具有的面部表情相同。
183.示例性地,交互对象的原始图像以及保留有交互对象的对象本体特征且具有目标属性的虚拟图像如图8所示。图8中的(1)为根据第一用户的人脸(交互对象)获取的原始图像,图8中的(2)为根据图8中的(1)所示的原始图像获取的保留有第一用户的人脸本体特征且具有第一特效这一目标属性的虚拟图像。图8中的(3)为根据变换面部表情的原始图像获取的保留有第一用户的人脸本体特征且具有第一特效这一目标属性的虚拟图像。
184.图8中的(4)为根据第二用户的人脸(交互对象)获取的原始图像,图8中的(5)为根据图8中的(4)所示的原始图像获取的保留有第二用户的人脸本体特征且具有第二特效这一目标属性的虚拟图像。图8中的(6)为根据变换面部表情的原始图像获取的保留有第二用户的人脸本体特征且具有第二特效这一目标属性的虚拟图像。
185.在本技术实施例中,通过模型融合和数据增强的手段,能够将获取目标图像生成模型所需的样本虚拟图像的数量降到几十张,并且能够通过几十张样本虚拟图像训练出稳定的实时效果,减少了图像生成模型对大规模数据的依赖,大大提升了图像生成模型的适用范围,扩展了图像生成模型的应用场景。基于本技术实施例提供的方法,不需要大规模数
据,降低了标注成本和研发成本。此外,数据增强的方法以低成本快速补充图像,大大的加速了训练数据获取速度,能够加快研发周期,帮助产品上的玩法快速地落地。基于目标图像生成模型,能够获取既保留很好的对象本体特征,又具有好看的目标属性的虚拟图像,能够获得良好的视觉效果,提升用户体验。
186.将本技术实施例提供的方法应用在虚拟人脸领域,在数据量有限的情况下,通过模型融合,将真人模型(即第一图像生成模型)和虚拟风格模型(即第二图像生成模型)进行融合,能够得到具有生成保留有真人纹理且具有虚拟风格的图像的功能的融合模型;通过数据增强,能够丰富融合模型生成的虚拟图像中的虚拟对象的表情和姿态。
187.在本技术实施例中,用于获取虚拟图像的目标图像生成模型是通过融合第一图像生成模型和第二图像生成模型得到的,其中,第一图像生成模型能够关注对象本体特征,第二图像生成模型能够关注目标属性。因此,目标图像生成模型能够同时关注对象本体特征和目标属性,从而有利于保证获取的虚拟图像的质量。此外,相比于保留有对象本体特征且具有目标属性的样本图像,训练得到第一图像生成模型所依据的样本原始图像以及训练得到第二图像生成模型所依据的样本虚拟图像均较容易获取,有利于缩短目标图像生成模型的获取耗时,从而提高获取虚拟图像的效率。也就是说,本技术实施例提供的获取虚拟图像的方式能够在保证获取的虚拟图像的质量的同时,提高获取虚拟图像的效率。
188.参见图9,本技术实施例提供了一种获取虚拟图像的装置,该装置包括:
189.第一获取单元901,用于获取目标图像生成模型,目标图像生成模型通过融合第一图像生成模型和第二图像生成模型得到,第一图像生成模型基于保留有样本对象的对象本体特征的样本原始图像训练得到,第二图像生成模型基于具有目标属性的样本虚拟图像训练得到;
190.第二获取单元902,用于基于目标图像生成模型,获取目标对象的原始图像对应的目标虚拟图像,目标虚拟图像保留有目标对象的对象本体特征且具有目标属性。
191.在一种可能实现方式中,参见图10,该装置还包括:
192.第三获取单元903,用于获取样本原始图像和样本虚拟图像;基于样本原始图像,训练得到第一图像生成模型;基于样本虚拟图像,训练得到第二图像生成模型;
193.融合单元904,用于融合第一图像生成模型和第二图像生成模型,得到目标图像生成模型。
194.在一种可能实现方式中,融合单元904,用于确定至少一种融合方式,任一种融合方式用于指示一种融合第一图像生成模型和第二图像生成模型的方式;基于至少一种融合方式,获取至少一个候选图像生成模型,任一候选图像生成模型基于任一种融合方式融合第一图像生成模型和第二图像生成模型得到;响应于第三图像生成模型的图像生成功能满足参考条件,将第三图像生成模型作为目标图像生成模型,第三图像生成模型为至少一个候选图像生成模型中满足选取条件的候选图像生成模型。
195.在一种可能实现方式中,第一图像生成模型和第二图像生成模型均包括参考数量层网络,任一种融合方式包括一种参考数量层网络分别对应的目标网络参数的确定方式;融合单元904,还用于基于任一种融合方式包括的参考数量层网络分别对应的目标网络参数的确定方式,确定参考数量层网络分别对应的目标网络参数;基于参考数量层网络分别对应的目标网络参数,对指定图像生成模型中的参考数量层网络具有的参数进行调整,将
调整后得到的图像生成模型作为任一候选图像生成模型;其中,任一种融合方式包括的任一层网络对应的目标网络参数的确定方式用于指示任一层网络对应的目标网络参数与第一网络参数和第二网参数中的至少一个之间的关系;第一网络参数为第一图像生成模型中的任一层网络具有的参数,第二网络参数为第二图像生成模型中的任一层网络具有的参数。
196.在一种可能实现方式中,参见图10,该装置还包括:
197.第四获取单元905,用于响应于第三图像生成模型的图像生成功能不满足参考条件,获取补充图像,补充图像用于对样本虚拟图像进行补充;
198.第三获取单元903,还用于基于补充图像和样本虚拟图像,对第二图像生成模型进行训练,得到更新后的第二图像生成模型;
199.融合单元904,还用于融合第一图像生成模型和更新后的第二图像生成模型,得到第四图像生成模型;响应于第四图像生成模型的图像生成功能满足参考条件,将第四图像生成模型作为目标图像生成模型。
200.在一种可能实现方式中,第四获取单元905,用于获取增强图像特征,增强图像特征用于增强第二图像生成模型的图像生成功能;调用第二图像生成模型,对增强图像特征进行处理,得到补充图像。
201.在一种可能实现方式中,第四获取单元905,用于获取图像驱动模型,图像驱动模型基于具有目标属性的样本视频训练得到;调用图像驱动模型,对样本虚拟图像进行驱动,得到样本虚拟图像对应的增强视频;在样本虚拟图像对应的增强视频中提取视频帧作为补充图像。
202.在一种可能实现方式中,第二获取单元902,用于获取目标对象的原始图像对应的原始图像特征;基于原始图像特征,获取目标图像特征;调用目标图像生成模型,对目标图像特征进行处理,得到目标对象的原始图像对应的目标虚拟图像。
203.在一种可能实现方式中,第二获取单元902,还用于利用目标图像生成模型对应的图像特征转换方式对原始图像特征进行转换,将转换后得到的图像特征作为目标图像特征。
204.在一种可能实现方式中,第二获取单元902,用于调用目标图像生成模型,对候选图像特征进行处理,得到候选图像特征对应的候选虚拟图像;基于候选图像特征对应的候选原始图像和候选图像特征对应的候选虚拟图像,获取目标图像翻译模型,候选图像特征对应的候选原始图像为候选图像特征所标识的保留有对象本体特征的图像;调用目标图像翻译模型,对目标对象的原始图像进行处理,得到目标对象的原始图像对应的目标虚拟图像。
205.在一种可能实现方式中,第二获取单元902,还用于调用初始图像翻译模型,对候选图像特征对应的候选原始图像进行处理,得到候选图像特征对应的候选预测图像;基于候选图像特征对应的候选预测图像和候选图像特征对应的候选虚拟图像之间的差异,确定损失函数;利用损失函数对初始图像翻译模型进行训练,得到目标图像翻译模型。
206.在一种可能实现方式中,参见图10,该装置还包括:
207.采集单元906,用于响应于针对目标属性的虚拟图像显示指令,采集交互对象的原始图像;
208.显示单元907,用于调用目标图像预测模型,对交互对象的原始图像进行处理,得到交互对象的原始图像对应的虚拟图像,目标图像预测模型基于目标对象的原始图像和目标对象的原始图像对应的目标虚拟图像训练得到;显示交互对象的原始图像对应的虚拟图像。
209.在本技术实施例中,用于获取虚拟图像的目标图像生成模型是通过融合第一图像生成模型和第二图像生成模型得到的,其中,第一图像生成模型能够关注对象本体特征,第二图像生成模型能够关注目标属性。因此,目标图像生成模型能够同时关注对象本体特征和目标属性,从而有利于保证获取的虚拟图像的质量。此外,相比于保留有对象本体特征且具有目标属性的样本图像,训练得到第一图像生成模型所依据的样本原始图像以及训练得到第二图像生成模型所依据的样本虚拟图像均较容易获取,有利于缩短目标图像生成模型的获取耗时,从而提高获取虚拟图像的效率。也就是说,本技术实施例提供的获取虚拟图像的方式能够在保证获取的虚拟图像的质量的同时,提高获取虚拟图像的效率。
210.需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
211.在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种获取虚拟图像的方法。示例性地,该计算机设备可以为服务器,也可以为终端,接下来,对服务器和终端的结构分别进行介绍。
212.图11是本技术实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(central processing units,cpu)1101和一个或多个存储器1102,其中,该一个或多个存储器1102中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1101加载并执行,以使该服务器实现上述各个方法实施例提供的获取虚拟图像的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
213.图12是本技术实施例提供的一种终端的结构示意图。该终端可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
214.通常,终端包括有:处理器1201和存储器1202。
215.处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用dsp(digital signal processing,数字信号处理)、fpga(field

programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以集成有gpu(graphics processing unit,图像处理器),gpu
用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1201还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
216.存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一条计算机程序,该至少一条计算机程序用于被处理器1201所执行,以使该终端实现本技术中方法实施例提供的获取虚拟图像的方法。
217.在一些实施例中,终端还可选包括有:外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地,外围设备包括:射频电路1204、显示屏1205、摄像头组件1206、音频电路1207、定位组件1208和电源1209中的至少一种。
218.外围设备接口1203可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。射频电路1204用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。显示屏1205用于显示ui(user interface,用户界面)。该ui可以包括图像、文本、图标、视频及其它们的任意组合。摄像头组件1206用于采集图像或视频。
219.音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1201进行处理,或者输入至射频电路1204以实现语音通信。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。定位组件1208用于定位终端的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。电源1209用于为终端中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。
220.在一些实施例中,终端还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于:加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。
221.加速度传感器1211可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器1212可以检测终端的机体方向及转动角度,陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端的3d动作。压力传感器1213可以设置在终端的侧边框和/或显示屏1205的下层。当压力传感器1213设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在显示屏1205的下层时,由处理器1201根据用户对显示屏1205的压力操作,实现对ui界面上的可操作性控件进行控制。
222.指纹传感器1214用于采集用户的指纹,由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份,或者,由指纹传感器1214根据采集到的指纹识别用户的身份。光学传感器1215用于采集环境光强度。接近传感器1216,也称距离传感器,通常设置在终端的前面板。接近传感器1216用于采集用户与终端的正面之间的距离。
223.本领域技术人员可以理解,图12中示出的结构并不构成对终端的限定,可以包括
比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
224.在一些实施例中,本技术实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。也即是,上述服务器和终端均可以作为区块链系统中的节点设备。
225.在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种获取虚拟图像的方法。
226.在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read

only memory,cd

rom)、磁带、软盘和光数据存储设备等。
227.在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种获取虚拟图像的方法。
228.应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
229.以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献