一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图片生成方法以及装置与流程

2022-06-05 18:34:51 来源:中国专利 TAG:


1.本说明书实施例涉及计算机技术领域,特别涉及一种图片生成方法。本说明书一个或者多个实施例同时涉及一种图片生成装置,一种计算设备,以及一种计算机可读存储介质。


背景技术:

2.随着终端技术的不断发展,智能终端在社会生活中的普及率越来越高,用户在移动终端浏览图片的要求也不断提高,用户想要浏览延伸后具有更大范围的图片时,都是通过单一图片的生成,无法满足用户需要更大范围或者包括更多图片特征的图片,以满足用户针对特定场景的图片需求,提升图片的展现效果。


技术实现要素:

3.有鉴于此,本说明书施例提供了一种图片生成方法。本说明书一个或者多个实施例同时涉及一种图片生成装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中无法满足用户需求生成更大范围的图片存在的技术缺陷。
4.根据本说明书实施例的第一方面,提供了一种图片生成方法,包括:
5.基于目标图片生成请求获取待处理图片;
6.确定所述待处理图片的标签信息,并将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片;
7.将所述初始图片与所述待处理图片按照所述预设拼接条件进行拼接,获得拼接图片;
8.判断所述拼接图片是否满足预设需求条件,若是,则将所述拼接图片作为目标图片,若否,则将所述拼接图片作为待处理图片,继续执行确定所述待处理图片的标签信息,并将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片的步骤。
9.根据本说明书实施例的第二方面,提供了一种图片生成装置,包括:
10.获取模块,被配置为基于目标图片生成请求获取待处理图片;
11.获得模块,被配置为确定所述待处理图片的标签信息,并将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片;
12.拼接模块,被配置为将所述初始图片与所述待处理图片按照所述预设拼接条件进行拼接,获得拼接图片;
13.判断模块,被配置为判断所述拼接图片是否满足预设需求条件,若是,则将所述拼接图片作为目标图片,若否,则将所述拼接图片作为待处理图片,继续执行所述获得模块。
14.根据本说明书实施例的第三方面,提供了一种计算设备,包括:
15.存储器和处理器;
16.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,其中,所述处理器执行所述计算机可执行指令时实现所述图片生成方法的步骤。
17.根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述图片生成方法的步骤。
18.本说明书一个实施例实现了一种图片生成方法及装置,其中,所述图片生成方法包括基于目标图片生成请求获取待处理图片,并确定所述待处理图片的标签信息;将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片;将所述初始图片和所述待处理图片按照预设拼接条件进行拼接,获得所述拼接图片,并判断所述拼接图片是否满足预设需求条件,进而获得目标图片;所述图片生成方法通过对获取的待处理图片以及标签信息输入至图片生成模型获得初始图片,并将初始图片与待处理图片进行拼接生成拼接图片,进而不断拼接获得目标图片,能够使得待处理图片经过拼接相连组成大范围且包括更多图片特征的图片,不仅提升了图片的展现效果,也可满足用户对特定场景中图片的展示需求。
附图说明
19.图1是本说明书一个实施例提供的一种图片生成方法的系统架构图;
20.图2是本说明书一个实施例提供的一种图片生成方法的流程图;
21.图3是本说明书一个实施例提供的一种图片生成方法中的图片生成模型的结构示意图;
22.图4是本说明书一个实施例提供的一种图片生成方法的处理过程流程图;
23.图5是本说明书一个实施例提供的一种图片生成装置的结构示意图;
24.图6是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
25.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
26.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
27.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
28.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
29.cgan(英文全称:conditional generative adversarial net,中文全称:条件生
成对抗网络):可以通过参数化损失函数专注于条件对抗网络的两个主要目标中的一个目标,即真实样本或者表现差异。
30.生成模型(英文全称:generative model):是概率统计和机器学习中的一类重要模型,指一系列用于随机生成可观测数据的模型,可以根据任务、通过模型训练由输入的数据生成文字、图像、视频等数据。
31.判别模型(英文全称:discriminative model)是一种对未观测数据y与已观测数据x之间关系进行建模的方法,直接对条件概率建模,不能反映训练数据本身的特性,但在不同类别之间的最优分类方面,反映的是异类数据之间的差异。
32.在本说明书中,提供了一种图片生成方法,本说明书同时涉及一种图片生成装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
33.本说明书实施例提供的所述图片生成方法可以应用于任何需要生成图片的的领域,例如对网页、视频中获取的图片进行拼接处理,生成大范围的图片等等,为了便于理解,本说明书实施例以所述图片生成方法应用于对视频领域中获取图片进行处理生成目标图片为例进行详细介绍,但不限于此。
34.那么在所述图片生成方法应用于对于视频领域中的图片进行处理生成目标图片为例的情况下,目标图片即可以理解为对视频帧中获取的待处理图片进行自动延伸处理,获得的符合用户需求的大范围的与获取的待处理图片相符合的图片。
35.此外,本说明书实施例的图片生成方法可以应用于任何可呈现大范围延伸图片的图片展示位置,例如,网页图片、广告展示图片、视频等自媒体展示图片等等。
36.参见图1,图1示出了根据本说明书一个实施例提供的一种图片生成方法的系统架构图。
37.图1中,用户a通过客户端a观看视频a,并在视频a中获取用户所需要待处理图片a,客户端a将该待处理图片a传输到视频a对应的服务器,服务器接收到待处理图片a,确定该待处理图片a对应的标签信息,并将接收到的待处理图片a以及对应的标签信息输入至图片生成模型中,获得初始图片a1,其中,初始图片a1与待处理图片a的图片类型、内容特征相同或相近,比如,待处理图片a为星空图片,则通过图片生成模型生成的初始图片a1为待处理图片a的图片类型相似,比如待处理图片a中具有北斗七星,那么通过图片生成模型生成的初始图片可以为具有织女星、北极星等星空图,再将初始图片a1和待处理图片a按照预设拼接条件进行拼接,在满足用户需求的情况下,获得目标图片,其中,目标图片为带有北斗七星以及织女星、北极星等延伸后的大范围的星空图,进而为用户呈现与待处理图片a类型相同的大范围图片,提升图片的展现效果。
38.参见图2,图2示出了根据本说明书一个实施例提供的一种图片生成方法的流程图,具体包括以下步骤。
39.步骤202:基于目标图片生成请求获取待处理图片。
40.其中,目标图片生成请求可以理解为用户获得大范围图片的生成请求;待处理图片可以理解为用户需要扩大图片范围的原始图片,其中,该待处理图片可以从网页中获得,也可以从视频帧中获得,在此获得图片的原始路径不做任何限定。
41.以所述图片生成方法应用于对视频中获得的视频帧图片进行扩大生成目标图片为例,服务器基于用户的目标图片生成请求获取待处理图片,其中,获得的待处理图片可以
包括但不限于星空图片、地图图片、星座图片等等。
42.具体实施时,服务器基于用户触发的目标图片生成请求获得待处理图片,例如,服务器获得的待处理图片为星空图片,则确定其相应的标签信息为星空中星球的大小、星球的颜色以及星球是否具有光环带等信息。
43.步骤204:确定所述待处理图片的标签信息,并将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片。
44.其中,待处理图片的标签信息可以理解为待处理图片中的特征的信息,比如,待处理图片为星空图片,则该星空图片对应的标签信息可以为星球的大小、星球的颜色、星球是否带有光环带等信息;待处理图片为地图图片,则该地图图片对应的标签信息可以为是否具有山川、是否具有河流、树林的茂密度等信息。
45.进一步,为了确定待处理图片的标签信息,将待处理图片输入至标签识别模型中,具体的,所述确定所述待处理图片的标签信息,包括:
46.将所述待处理图片输入标签识别模型,获得所述待处理图片的标签信息,其中,所述标签识别模型输出与所述待处理图片对应的标签信息。
47.其中,标签识别模型可以理解为通过输入一张图片,即可识别出该图片中包含的特征信息,作为标签信息输出的模型,在本说明书实施例中,对于标签识别模型的种类并不限定,能够实现将图片中的标签信息输出的模型即可。
48.例如,将一张星空图片作为待处理图片输入至标签识别模型中,即可输出星空图片中,星球的数量、星球的大小、星空的颜色、星空中是否具有光环信息等标签信息。
49.本说明书实施例中,通过利用标签识别模型可以快速地确定待处理图片中的标签信息,以便于后续将待处理图片对应的标签信息输入至图片生成模型中,以获得初始图片。
50.由于待处理图片的展示范围内容有限,无法满足用户的对于图片中知识延伸的需求,并且多张单一图片的生成前后并不连续,也无法提升展现效果,因此将待处理图片以及待处理图片对应的标签信息输入至图片生成模型,以获得与所述待处理图片对应的初始图片,对待处理图片进行延伸,以提升图片的展示效果;具体的,获得初始图片的具体方式如下所述:
51.所述图片生成模型包括图片生成网络以及图片鉴别网络,
52.所述图片生成网络和所述图片鉴别网络的训练步骤如下:
53.获取样本图片训练集,其中,所述样本图片训练集中包括样本图片以及所述样本图片对应的样本标签;
54.基于所述样本图片和所述样本标签对初始图片生成网络进行训练,得到图片生成网络;
55.将所述样本图片输入所述图片生成网络,获得样本目标图片;
56.基于所述样本目标图片和所述样本标签对初始图片鉴别网络进行训练,得到图片鉴别网络,基于所述图片生成网络和所述图片鉴别网络获得训练后的图片生成模型。
57.其中,所述图片生成网络与图片鉴别网络可以理解为cgan模型中的生成模型和判别模型,生成模型是指可以根据任务、通过模型训练由输入的数据生成文字、图像、视频等数据,判别模型不能反映训练数据本身的特性,但在不同类别之间的最优分类方面,反映的是异类数据之间的差异。
58.具体实施时,在图片生成模型的训练中,参见图3,图3示出了本说明书一个实施例提供的一种图片生成方法中的图片生成模型的结构示意图;
59.图3中的(a)表示判别模型,图3中的(b)表示生成模型,其中,在图3中的(b)中,z表示变量,y表示条件,y通常可以为一个向量或者一个数值,那么生成结果可以表示为x=g(z|y),再将x输入至图3中的(a)的判别模型中,其一是判断x(即输入图片)是否匹配给定y的条件,其二是判断生成的图片复合真实样本的程度。
60.具体的,通过生成模型获得的图片,再输入至判别模型中,判断输入的图片是否满足真实的样本以及判断输入的图片是否匹配给定的条件,这两个模型同时进行对抗性训练,最终达到纳什均衡状态。
61.具体实施时,通过获取样本图片训练集,其中,所述样本图片训练集中包括样本图片以及所述样本图片对应的样本标签,基于所述样本图片和所述样本标签对初始图片生成网络进行训练,得到图片生成网络,基于所述样本目标图片和所述样本标签对初始图片鉴别网络进行训练,得到图片鉴别网络,基于图片生成网络与图片鉴别网络获得图片生成模型,以实现输入待处理图片,即可获得与待处理图片类型相对应的初始图片。
62.本说明书实施例中,通过图片生成模型,将获得的待处理图片可自动化地生成初始图片,并与待处理图片进行拼接,获得拼接后的大范围图片,不仅满足用户对于当前图片的延伸需求,也使得当前图片不断扩张给用户呈现更好的展现效果。
63.步骤206:将所述初始图片和所述待处理图片按照预设拼接条件进行拼接,获得拼接图片。
64.其中,预设拼接条件可以理解为预先设置的将获得的初始图片与待处理图片进行拼接相连的条件。
65.为了将获得的初始图片与待处理图片快速地进行拼接,具体的,所述将所述初始图片与所述待处理图片按照所述预设拼接条件进行拼接,获得拼接图片之前,还包括:
66.确定所述初始图片以及所述待处理图片的边长信息;
67.在所述初始图片的边长信息与所述待处理图片的边长信息不相同的情况下,基于所述待处理图片的边长信息对所述初始图片的边长进行调整。
68.具体实施时,根据待处理图片与待处理图片对应的标签信息获得的初始图片,确定初始图片的边长信息,以及确定待处理图片的边长信息,在比对初始图片的边长信息与待处理图片的边长信息不同的情况下,将初始图片的边长进行调整,使得初始图片的边长信息与待处理图片的边长信息保持一致,其中,具体的调整初始图片的方法可以采用缩放比例的方式,或其他可以实现改变图片的边长信息的方式,本说明书实施例,对此不做任何限定。
69.例如,若待处理图片的长为a,宽为b,则获取的初始图片的长为a,宽为c,即可确定初始图片的边长信息与待处理图片的边长信息不匹配,即对初始图片的宽调整为b,保证初始图片的边长信息与待处理图片的边长信息相同。
70.本说明书实施例中,通过调整初始图片的边长信息与待处理图片的边长信息相同,使得初始图片与待处理图片拼接后能够呈现完整的拼接图片,以便于后续通过拼接图片进一步处理,可快速地实现不断的拼接过程。
71.在将初始图片拼接至待拼接图片的过程中,根据确定的拼接条件实现对初始图片
的拼接;具体的,所述拼接条件包括所述初始图片的预设拼接点以及所述初始图片的边长信息;
72.相应的,所述将所述初始图片与所述待处理图片按照所述预设拼接条件进行拼接,包括:
73.确定所述初始图片的预设拼接点以及所述初始图片的边长信息;
74.基于所述预设拼接点以及所述初始图片的边长信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的至少两个待拼接位置;
75.基于所述至少两个待拼接位置,将所述初始图片与所述待处理图片进行拼接。
76.其中,预设拼接点可以理解为根据预设的拼接条件确定的待处理图片中图片边长交点中的任意一个交点作为连接初始的拼接点;待拼接位置可以理解为将获得的初始图片拼接相连在待处理图片的一侧边长,同时初始图片的相交点与预设拼接点相重合的位置。
77.具体实施时,服务器接收到待处理图片之后,确定待处理图片的预设拼接点,以及初始图片的边长信息,其中,预设拼接点可以为待处理图片中的任意一个拼接点(即可理解为待处理图片的任意顶点),基于预设拼接点以及初始图片的边长信息计算初始图片与预设拼接点的最小距离,进而确定初始图片拼接在待处理图片的至少两个待拼接位置,基于获得的待拼接位置,将初始图片拼接在待处理图片一侧,获得较大范围的图片。
78.例如,待处理图片的四个顶点分别为a、b、c、d,服务器确定的待处理图片的预设拼接点为a,根据待处理图片的边长确定初始图片的边长为a,预设拼接点a可以使得初始图片中的任意顶点与预设拼接点a重合所确定的待拼接位置,在实际应用中,在确定预设拼接点为a的情况下,可以与预设拼接点a重合的待拼接位置有两个,进一步,在确定预设拼接点的情况下,有两种拼接方式可以实现对初始图片进行拼接。
79.本说明书实施例中,通过确定待处理图片预设拼接点以及边长信息,确定初始图片的待拼接位置,以保证获得的初始图片快速地与待处理图片进行拼接处理,实现在符合用户对于图片生成的需求的同时,也提高了图片的展示效果。
80.进一步的,所述基于所述预设拼接点以及所述边长信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的至少两个待拼接位置,包括:
81.基于所述预设拼接点确定所述预设拼接点相对应的第一位置信息;
82.根据所述初始图片的边长信息确定候选拼接位置,以及确定所述候选拼接位置的对应的第二位置信息;
83.基于所述第一位置信息以及所述第二位置信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的至少两个待拼接位置。
84.其中,第一位置信息可以理解为服务器确定的预设拼接点的位置坐标,第二位置信息可以理解为将初始图片拼接到待处理图片的候选拼接位置的位置坐标。
85.基于此,基于确定的待处理图片的情况下,候选拼接位置至少包括两个,在至少两个候选拼接位置中确定该候选拼接位置与预设拼接点的位置坐标距离最小的候选拼接位置,将该候选拼接位置确定为初始图片的待拼接位置。
86.实际应用中,服务器接收到待处理图片之后,确定待处理图片的预设拼接点,以及待处理图片的边长信息,其中,预设拼接点可以为待处理图片中的任意一个拼接点(即可理解为待处理图片的任意顶点),并基于确定好的预设拼接点获取该预设拼接点的位置坐标,
基于预设拼接点以及待处理图片的边长信息确定初始图片拼接至待处理图片的候选拼接位置的位置坐标,根据预设拼接点的位置坐标以及候选拼接位置的位置坐标通过广度优先算法计算初始图片与预设拼接点的最小距离,进而确定初始图片拼接在待处理图片的待拼接位置,基于获得的待拼接位置,将初始图片拼接在待处理图片一侧,获得较大范围的图片。
87.本说明书实施例中,通过确定待处理图片预设拼接点以及边长信息,确定初始图片的待拼接位置,以保证获得的初始图片快速地与待处理图片进行拼接处理,实现在符合用户对于图片生成的需求的同时,也提高了图片的展示效果。
88.在获得多个待拼接位置的情况下,服务器可根据预设的目标图片的形状进一步地确定目标待拼接位置;具体的,所述基于所述至少两个待拼接位置,将所述初始图片与所述待处理图片进行拼接,包括:
89.基于预设的目标图片生成形状确定所述至少两个待拼接位置中的一个目标待拼接位置;
90.基于所述一个目标待拼接位置将所述初始图片与所述待处理图片进行拼接。
91.具体实施时,预设的目标图片若为正方形的图片,则将初始图片拼接至待处理图片时,则选择能够生成正方形的图片的待拼接位置作为目标拼接位置,在不断的拼接过程中,对于目标拼接位置的选择是基于预设目标图片的形状进而确定的。
92.本说明书实施例中,通过确定初始图片的具体拼接位置,使得初始图片准确的拼接至符合拼接条件的位置,呈现更大范围的图片,以提升图片的展现效果。
93.步骤208:判断所述拼接图片是否满足预设需求条件。
94.步骤210:若是,则将所述拼接图片作为目标图片。
95.步骤212:若否,则将所述拼接图片作为待处理图片,继续执行步骤204。
96.其中,预设需求条件可以理解为用户确定的符合用户需求图片信息的条件。
97.具体实施时,所述预设需求条件包括所述拼接图片的尺寸大于等于预设阈值;
98.相应的,判断所述拼接图片是否满足预设需求条件,包括:
99.判断所述拼接图片的尺寸是否大于等于预设阈值。
100.具体的,可根据拼接图片的尺寸大小确定拼接图片是否满足预设阈值,在拼接图片的尺寸大于等于预设阈值的情况下,即拼接图片满足预设需求条件。
101.本说明书实施例,通过判断拼接图片的尺寸大小,以确定拼接图片是否满足预设需求条件,不仅可以实现范围更大的延伸图片,也提高了用户对于延伸后的图片的视觉体验。
102.进一步的,为了使得拼接后的图片满足用户的用户需求,呈现出大范围的图片;具体的,所述判断所述拼接图片是否满足预设需求条件之前,还包括:
103.获取所述拼接图片中的图像特征信息;
104.相应的,所述判断所述拼接图片是否满足预设需求条件,还包括:
105.判断所述拼接图片中的图像特征信息是否满足预设特征信息。
106.其中,预设特征信息可以理解为根据不同的待处理图片中的特征,延伸后的图片中对应包含的特征信息,比如,待处理图片为星空图片,那么预设特征信息可以为带有完整北斗七星的特征信息或者其他星系特征的信息。具体实施时,基于初始图片与待处理图片
进行拼接获得的拼接图片,并获取拼接图片中的图像特征信息,还需判断拼接图片是否满足预设需求条件,即是否满足预设特征信息,若获得的拼接图片满足了预设特征信息,则将获得拼接图片作为目标图片;若获得的拼接图片未满足预设特征信息,则将拼接图片作为待处理图片继续进行拼接处理。
107.例如,以待处理图片为地图图片为例,输入图片生成模型获得的初始图片也相应为地图风格的图片,并获取该地图风格图片中的图像特征信息,比如,山川、河流、道路、树木、房屋等特征信息,将初始地图图片与待处理的地图图片进行拼接,获得拼接后的拼接图片,并判断该拼接图片是否满足预设特征信息,若拼接图片中已经满足用户对待处理图片的预设特征信息,即满足了地图图片中所有的预设特征,则将拼接图片的地图图片作为目标图片。
108.基于此,在用户获得的拼接图片并未满足预设特征信息的情况下,将继续将拼接图片作为待处理图片以生成初始图片继续与待处理图片拼接,将待处理图片的范围不断进行扩张扩大,直至满足用户的图片需求。
109.本说明书实施例中,通过将获得的拼接图片进行用户需求的判断,满足用户需求的情况下,即可生成大范围的图片,以为用户呈现更大范围的图片,扩展图片的知识领域。
110.综上,所述图片生成方法通过对获取的待处理图片以及标签信息输入至图片生成模型获得初始图片,并将初始图片与待处理图片进行拼接生成拼接图片,进而不断拼接获得目标图片,能够使得待处理图片经过拼接相连组成大范围且包括更多图片特征的图片,不仅提升了图片的展现效果,也可满足用户对特定场景中图片的展示需求。
111.在本说明书的另一个实施例中,服务器在获取的待处理图片生成的初始图片进行拼接后,依旧无法满足用户的图片需求,则将获得的候选图片继续作为待处理图片进行处理;具体的,所述待处理图片为第i个待处理图片,其中,i为正整数;
112.相应的,所述基于目标图片生成请求获取待处理图片,并确定所述待处理图片的标签信息,包括:
113.基于目标图片生成请求获取第i个待处理图片,并确定所述第i个待处理图片的标签信息。
114.其中,第i个待处理图片可以理解为每次基于目标图片生成请求获得的待处理图片。
115.具体实施时,服务器获取的第一张待处理图片,输入图片生成模型后获得的第一候选图片与第一待处理图片进行拼接,并不一定满足用户对于图片生成的需求,因此还需将获得第一候选图片继续作为第二张待处理图片,输入图片生成模型获得第二候选图片与第二张待处理图片进行拼接,判断获得的第三候选图片是否满足用户的需求,以此循环。
116.实际应用中,基于目标图片生成请求获取的第i个待处理图片,并确定所述第i个待处理图片的标签信息,例如,以i为1为例,服务器基于目标图片生成请求获取的第一个待处理图片为地图图片,并确定该地图图片的标签信息,包括道路信息、河流信息、山脉信息等信息。
117.本说明书实施例中,通过确定待处理图片的标签信息,并将对应的标签信息输入至图片生成模型中,以保证输出的初始图片符合待处理图片的图片风格,以保证将符合风格条件的初始图片拼接至待处理图片中,可以提高展现效果。
118.为了获得符合待处理图片风格的初始图片,则将待处理图片以及待处理图片对应的标签信息输入至图片生成模型中,具体的实现方式如下所述:
119.所述将所述待处理图片以及所述标签信息输入至图片生成模型,获得初始图片,包括:
120.将所述第i个待处理图片以及所述第i个待处理图片对应的标签信息输入至图片生成模型,获得初始图片。
121.实际应用中,将获取的第i个待处理图片以及第i个待处理图片对应的标签信息输入至图片生成模型中,获得初始图片;其中,图片生成模型是基于大量的样本图片训练集,对初始图片生成网络以及初始图片鉴别网络进行训练而获得的。
122.本说明书实施例中,通过cgan模型中的判别模型对生成的图片进行判别,不断反复确定输出的图片符合待处理图片的风格需求,以保证获得的候选图片满足用户对于图片的展现需求,进而也呈现了大范围的图片展现效果。
123.进一步的,在获得初始图片之后,将初始图片和待处理图片按照预设拼接条件进行拼接,具体的实现方式如下所述:
124.所述将所述初始图片和所述待处理图片按照预设拼接条件进行拼接,获得所述目标图片,包括:
125.将所述初始图片与所述第i个待处理图片按照所述预设拼接条件进行拼接,获得第i个拼接图片;
126.基于所述第i个拼接图片获得所述目标图片。
127.其中,预设拼接条件可以理解为预先设置的将获得的初始图片与待处理图片进行拼接相连的条件。
128.具体实施时,将初始图片与第i个待处理图片按照预先设置的将获得的初始图片与第i个待处理图片进行拼接,获得第i个拼接图片,基于所述第i个拼接图片获得目标图片。
129.本说明书实施例中,通过预设拼接条件,将基于图片生成模型获得的初始图片与待处理图片按照预设拼接条件进行拼接,可实现更加快速地获得拼接后的图片。
130.进一步的,所述拼接条件包括所述初始图片的预设拼接点以及所述初始图片的边长信息;
131.相应的,所述将所述初始图片与所述第i个待处理图片按照所述预设拼接条件进行拼接,包括:
132.确定所述i个待处理图片的预设拼接点以及所述i个待处理图片的边长信息;
133.基于所述预设拼接点以及所述边长信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的待拼接位置;
134.基于所述待拼接位置,将所述初始图片与所述第i个待处理图片进行拼接。
135.其中,预设拼接点可以理解为确定的第i个待处理图片的任意可拼接的顶点,可设置为拼接点。
136.具体实施时,基于确定的预设拼接点以及边长信息计算初始图片与预设拼接点的最小距离,确定初始图片的待拼接位置,将初始图片与第i个待处理图片进行拼接。
137.本说明书实施例中,基于预设拼接点以及边长信息可确定待拼接位置,以保证快
速地将初始图片与待处理图片进行拼接,进而获得更加符合用户需求的扩大后的图片。
138.此外,所述获得所述目标图片之前,将所述初始图片和所述待处理图片按照预设拼接条件进行拼接之后,包括:
139.判断所述第i个拼接图片的图片信息是否满足预设需求条件,其中,所述预设需求条件包括待处理图片的预设图片信息,
140.若是,则将所述第i个拼接图片作为所述目标图片;
141.若否,则将i自增1,继续执行基于目标图片生成请求获取第i个待处理图片,并确定所述第i个待处理图片的标签信息。
142.具体实施时,在获得的第i个拼接图片之后,用户需判断第i个拼接图片信息是否满足预设需求条件,即是否满足待处理图片的预设图片信息,若用户判断第i个拼接图片满足待处理图片的预设图片信息,则将所述第i个拼接图片作为所述目标图片,若用户判断第i个拼接图片未满足待处理图片的预设图片信息,则将i自增1,继续执行基于目标图片生成请求获取第i个待处理图片,并确定所述第i个待处理图片的标签信息,其中,在不断扩展图片的过程中,在第一次获得的候选图片未满足预设需求条件的情况下,则将第一次获得的候选图片即可作为第二次获取的待处理图片,即可在i为2时的第2个待处理图片,因此,在不断循环的基础上,可不断将待处理图片进行处理扩张,进而获得包含更大范围或更多图片特征的图片,直至用户判断生成的目标图片符合用户预设的需求条件,才停止上述循环扩张。
143.本说明书实施例中,通过将待处理图片输入至图片生成模型中,获得初始图片,将初始图片与待处理图片进行拼接,不断循环扩张待处理图片,以使得待处理图片的范围越来越大,直至达到符合用户对于待处理图片的需求,进而对于待处理图片不断延伸扩张。
144.综上,所述图片生成方法通过对获取的待处理图片以及标签信息输入至图片生成模型获得初始图片,并将初始图片与待处理图片进行拼接生成拼接图片,进而不断拼接获得目标图片,能够使得待处理图片经过拼接相连组成大范围且包括更多图片特征的图片,不仅提升了图片的展现效果,也可满足用户对特定场景中图片的展示需求。
145.下述结合附图4,以本说明书提供的图片生成方法在获取视频帧图片生成目标图片的应用为例,对所述图片生成方法进行进一步说明。其中,图4示出了本说明书一个实施例提供的一种图片生成方法的处理过程流程图,具体包括以下步骤。
146.步骤402:根据视频帧图片获得待处理图片。
147.步骤404:确定待处理图片对应的标签信息,并将待处理图片与待处理图片对应的标签信息输入至图片生成模型。
148.步骤406:获得初始图片。
149.步骤408:将初始图片按照预设拼接点与待处理图片进行拼接。
150.步骤410:获得拼接图片。
151.步骤412:判断拼接图片是否满足预设需求条件。
152.若是,执行步骤414。
153.步骤414:将拼接图片作为目标图片。
154.若否,则执行步骤416。
155.步骤416:将拼接图片作为待处理图片,继续执行步骤404。
156.本说明书实施例中,通过对获取的待处理图片以及标签信息输入至图片生成模型获得初始图片,并将初始图片与待处理图片进行拼接生成目标图片,能够使得待处理图片经过拼接相连组成大范围的图片,不仅提升了图片的展现效果,也可满足用户对特定场景中图片的展示需求。
157.与上述方法实施例相对应,本说明书还提供了图片生成装置实施例,图5示出了本说明书一个实施例提供的一种图片生成装置的结构示意图。如图5所示,该装置包括:
158.获取模块502,被配置为基于目标图片生成请求获取待处理图片;
159.获得模块504,被配置为确定所述待处理图片的标签信息,并将所述待处理图片以及所述待处理图片对应的标签信息输入至图片生成模型,获得与所述待处理图片对应的初始图片;
160.拼接模块506,被配置为将所述初始图片与所述待处理图片按照所述预设拼接条件进行拼接,获得拼接图片;
161.判断模块508,被配置为判断所述拼接图片是否满足预设需求条件,若是,则将所述拼接图片作为目标图片,若否,则将所述拼接图片作为待处理图片,继续执行所述获得模块。
162.可选的,所述拼接模块506,进一步被配置为:
163.确定所述初始图片以及所述待处理图片的边长信息;
164.在所述初始图片的边长信息与所述待处理图片的边长信息不相同的情况下,基于所述待处理图片的边长信息对所述初始图片的边长进行调整。
165.所述拼接条件包括所述初始图片的预设拼接点以及所述初始图片的边长信息;
166.可选的,所述拼接模块506,进一步被配置为:
167.确定所述初始图片的预设拼接点以及所述初始图片的边长信息;
168.基于所述预设拼接点以及所述初始图片的边长信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的至少两个待拼接位置;
169.基于所述至少两个待拼接位置,将所述初始图片与所述待处理图片进行拼接。
170.可选的,所述拼接模块506,进一步被配置为:
171.基于预设的目标图片生成形状确定所述至少两个待拼接位置中的一个目标待拼接位置;
172.基于所述一个目标待拼接位置将所述初始图片与所述待处理图片进行拼接。
173.可选的,所述拼接模块506,进一步被配置为:
174.基于所述预设拼接点确定所述预设拼接点相对应的第一位置信息;
175.根据所述初始图片的边长信息确定候选拼接位置,以及确定所述候选拼接位置的对应的第二位置信息;
176.基于所述第一位置信息以及所述第二位置信息计算所述初始图片与所述预设拼接点的最小距离,确定所述初始图片的至少两个待拼接位置。
177.可选的,所述获得模块504,进一步被配置为:,所述图片生成模型包括图片生成网络以及图片鉴别网络,
178.所述图片生成网络和所述图片鉴别网络的训练步骤如下:
179.获取样本图片训练集,其中,所述样本图片训练集中包括样本图片以及所述样本
图片对应的样本标签;
180.基于所述样本图片和所述样本标签对初始图片生成网络进行训练,得到图片生成网络;
181.将所述样本图片输入所述图片生成网络,获得样本目标图片;
182.基于所述样本目标图片和所述样本标签对初始图片鉴别网络进行训练,得到图片鉴别网络,基于所述图片生成网络和所述图片鉴别网络获得训练后的图片生成模型。
183.可选的,所述获得模块504,进一步被配置为:
184.将所述待处理图片输入标签识别模型,获得所述待处理图片的标签信息,其中,所述标签识别模型输出与所述待处理图片对应的标签信息。
185.可选的,所述判断模块508,进一步被配置为:
186.判断所述拼接图片的尺寸是否大于等于预设阈值。
187.可选的,所述判断模块508,进一步被配置为:
188.获取所述拼接图片中的图像特征信息;
189.可选的,所述判断模块508,进一步被配置为:
190.判断所述拼接图片中的图像特征信息是否满足预设特征信息。
191.本说明书实施例提供的所述图片生成方法以及装置,通过对获取的待处理图片以及标签信息输入至图片生成模型获得初始图片,并将初始图片与待处理图片进行拼接生成拼接图片,并判断拼接图片是否满足预设需求条件,进而能够使得待处理图片经过不断拼接相连组成大范围的图片,不仅满足用户对于当前图片的延伸需求,也使得当前图片不断扩张给用户呈现更好的展现效果。
192.上述为本实施例的一种图片生成装置的示意性方案。需要说明的是,该图片生成装置的技术方案与上述的图片生成方法的技术方案属于同一构思,图片生成装置的技术方案未详细描述的细节内容,均可以参见上述图片生成方法的技术方案的描述。
193.图6示出了根据本说明书一个实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
194.计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。
195.在本说明书的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
196.计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移
动设备,或者诸如台式计算机或pc的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
197.其中,处理器620用于执行如下计算机可执行指令,所述处理器用于执行所述计算机可执行指令,其中,所述处理器执行所述计算机可执行指令时实现所述图片生成方法的步骤。
198.上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的图片生成方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述图片生成方法的技术方案的描述。
199.本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述图片生成方法的步骤。
200.上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的图片生成方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述图片生成方法的技术方案的描述。
201.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
202.所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
203.需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
204.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
205.以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献