一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

属性值预测方法、装置、计算机系统和可读存储介质与流程

2021-12-07 20:43:00 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,更具体地,涉及一种属性值预测方法、属性值预测装置、计算机系统、计算机可读存储介质和计算机程序产品。


背景技术:

2.随着生活水平的提高,人们对物质生活的要求越来越高,网购逐渐成为人们购物的重要途径和方式,而电商平台逐渐成为人们购物途径的重要选择。此时,由商品属性等配置构成的平台上的生态问题,会大大影响用户的购物体验。
3.在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题,电商平台中人为设置的商品属性和商品的实际属性不匹配。


技术实现要素:

4.有鉴于此,本公开提供了一种属性值预测方法、属性值预测装置、计算机系统、计算机可读存储介质和计算机程序产品。
5.本公开的一个方面提供了一种属性值预测方法,包括:获取至少两个特征图,其中,所述至少两个特征图是将待处理图像输入预训练模型后,利用所述预训练模型中的至少两个特征提取层提取得到的,所述待处理图像中包括待预测属性;将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸;采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图;以及对所述最终特征图进行处理,得到所述待处理图像的一个属性值。
6.根据本公开的实施例,所述目标尺寸包括目标长、目标宽和目标通道数量,将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸包括:在所述特征图的长与所述目标长、以及所述特征图的宽与所述目标宽都不一致的情况下,通过上采样的方式将所述特征图的长调整至所述目标长,将所述特征图的宽调整至所述目标宽;以及在所述特征图的通道数量与所述目标通道数量不一致的情况下,通过卷积的方式将所述特征图的通道数量调整至所述目标通道数量。
7.根据本公开的实施例,所述至少两个特征图包括第一特征图、第二特征图和第三特征图,采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图包括:基于注意力机制对所述第一特征图和所述第二特征图进行拼接,得到拼接特征图;以及基于注意力机制对所述拼接特征图和所述第三特征图进行拼接,得到所述最终特征图。
8.根据本公开的实施例,所述属性值预测方法还包括:在将所述待处理图像输入至所述预训练模型之前,对所述待处理图像进行图像预处理,包括:确定所述属性值预测模型针对待处理图像的输入尺寸的预设标准;在所述待处理图像的尺寸不符合所述预设标准的情况下,保持所述待处理图像的长宽比例不变,对所述待处理图像的边缘补充像素,以使得补充像素后的待处理图像的尺寸符合所述预设标准。
9.根据本公开的实施例,所述属性值预测方法通过属性值预测模型实现,所述属性值预测模型包括所述预训练模型,所述方法还包括:在所述待预测属性包括多个的情况下,获取包括多个所述属性值预测模型的总预测模型;通过所述总预测模型中的每个所述属性值预测模型分别对每个所述待预测属性进行预测,得到所述待处理图像的多个属性值;以及根据所述多个属性值确定所述待处理图像的目标属性值。
10.根据本公开的实施例,所述属性值预测模型是通过迭代训练的方式进行训练的,每次迭代包括:获取图像训练集,其中,所述图像训练集中包括多个图像和每个所述图像对应的基础属性值;将所述图像训练集输入至属性值训练模型,得到针对所述图像训练集中每个图像的第一预测属性值;根据所述第一预测属性值和所述基础属性值调整所述属性值预测模型的损失函数,得到下一次迭代的属性值训练模型;将所述图像训练集输入至所述下一次迭代的属性值训练模型,得到针对所述图像训练集中每个图像的第二预测属性值;在所述第二预测属性值和所述基础属性值不匹配的情况下,从所述图像训练集中删除不匹配的属性值所对应的图像,得到下一次迭代的图像训练集。
11.根据本公开的实施例,所述待处理图像中包括已配置属性值,所述已配置属性值为所述待预测属性在所述待处理图像中的实际配置值,所述方法还包括:获取通过所述属性值预测模型预测得到的针对所述待处理图像的预测属性值;以及在所述预测属性值和所述已配置属性值不匹配的情况下,对所述待处理图像进行标记。
12.本公开的另一个方面提供了一种属性值预测装置,包括:获取模块,用于获取将待处理图像输入预训练模型处理后,根据所述预训练模型中的至少两个特征提取层得到的至少两个特征图,其中,所述待处理图像中包括待预测属性;调整模块,用于将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸;拼接模块,用于采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图;以及处理模块,用于对所述最终特征图进行处理,得到所述待处理图像的一个属性值。
13.本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
14.本公开的另一方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
15.本公开的另一方面提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
16.根据本公开的实施例,通过采用了获取至少两个特征图,其中,至少两个特征图是将待处理图像输入预训练模型后,利用预训练模型中的至少两个特征提取层提取得到的,待处理图像中包括待预测属性,将至少两个特征图中每个特征图的输出尺寸调整至目标尺寸,采用预设拼接规则对具有目标尺寸的至少两个特征图进行拼接,得到最终特征图,以及对最终特征图进行处理,得到待处理图像的一个属性值的技术手段,由于可直接预测得到待处理图像的属性值,所以至少部分地克服了人为设置的商品属性和商品的实际属性不匹配的技术问题,进而达到了提高电商平台中商品的属性配置准确度以及提升用户对电商平台的使用满意度的技术效果。
附图说明
17.通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
18.图1示意性示出了根据本公开实施例的可以应用属性值预测方法的示例性系统架构;
19.图2示意性示出了根据本公开实施例的属性值预测方法的流程图;
20.图3示意性示出了根据本公开实施例的属性值预测模型的原理图;
21.图4示意性示出了根据本公开实施例的图像预处理的方法;
22.图5示意性示出了根据本公开实施例的block1的实现方法;
23.图6示意性示出了根据本公开实施例的block2的实现方法;
24.图7示意性示出了根据本公开实施例的block3的实现方法;
25.图8示意性示出了根据本公开实施例的block4的实现方法;
26.图9示意性示出了根据本公开实施例的总预测模型的部署方式;
27.图10示意性示出了根据本公开实施例的属性值预测模型的训练流程图;
28.图11示意性示出了根据本公开的实施例的属性值预测装置的框图;以及
29.图12示意性示出了根据本公开实施例的适于实现属性值预测方法的计算机系统的框图。
具体实施方式
30.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
31.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
32.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
33.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
34.电商平台主要面向顾客和商家两类群体,其服务包括为顾客提供商品,为商家提供商品录入。顾客在购买商品的时候,对商品的属性会特别关注,因为属性可以直接体现商
品的基本信息,从而直接关系到顾客是否购买,也因此,顾客在浏览商品的时候,这些属性是首要目标。
35.发明人在实现本公开构思的过程中发现,存在部分商家只对商品的主图和标题比较关注,对商品属性并不关注,经常会随便填写,或者直接填其他。这种情况在服饰类目下,最为突出。服饰中属性信息尤其多,包括:图案、颜色、款式、功能、材质等等,而每个属性又包括几十上百个属性值。这种情况下,商家在填写的时候,非常头疼。而对消费者来讲也是不好的体验,例如有些情况,消费者明明看中了某款衣服,但是由于获取不到的有效的信息,往往选择了放弃。这种不好的购物体验,对电商平台存在很大的伤害。
36.发明人在实现本公开构思的过程中还发现,为了净化电商平台的环境,业务人员往往通过采用人工筛查加规则半自动的方式,纠正违规商品,但是这种方式效率太低,不能从根本上解决问题。例如,组织人工进行抽审的方式,审核范围有限,不可能覆盖全部的商品,而且人工审核的标准不一,容易引起商家投诉。采用相似商品属性值投票的方式,非常依赖底层数据,如果底层数据干净,则结果可信,如果底层数据不干净,则结果也会不太可信。
37.本公开的实施例提供了一种属性值预测方法、属性值预测装置、计算机系统、计算机可读存储介质和计算机程序产品。该属性值预测方法包括:获取至少两个特征图,其中,至少两个特征图是将待处理图像输入预训练模型后,利用预训练模型中的至少两个特征提取层提取得到的,待处理图像中包括待预测属性;将至少两个特征图中每个特征图的输出尺寸调整至目标尺寸;采用预设拼接规则对具有目标尺寸的至少两个特征图进行拼接,得到最终特征图;以及对最终特征图进行处理,得到待处理图像的一个属性值。
38.图1示意性示出了根据本公开实施例的可以应用属性值预测方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
39.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
40.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如各种购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等。
41.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
42.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
43.需要说明的是,本公开实施例所提供的属性值预测方法一般可以由服务器105执行。相应地,本公开实施例所提供的属性值预测装置一般可以设置于服务器105中。本公开实施例所提供的属性值预测方法也可以由不同于服务器105且能够与终端设备101、102、
103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的属性值预测装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的属性值预测方法也可以由终端设备101、102、或103执行,或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的属性值预测装置也可以设置于终端设备101、102、或103中,或设置于不同于终端设备101、102、或103的其他终端设备中。
44.例如,待处理图像可以原本存储在终端设备101、102、或103中的任意一个(例如,终端设备101,但不限于此)之中,或者存储在外部存储设备上并可以导入到终端设备101中,属性值预测模型可以预设于终端设备101、102、103、服务器、或服务器集群之中。然后,终端设备101可以在本地执行本公开实施例所提供的属性值预测方法,或者将待处理图像发送到其他终端设备、服务器、或服务器集群,并由接收该待处理图像的其他终端设备、服务器、或服务器集群中的属性值预测模型来执行本公开实施例所提供的属性值预测方法。
45.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
46.图2示意性示出了根据本公开实施例的属性值预测方法的流程图。
47.图3示意性示出了根据本公开实施例的属性值预测模型的原理图。
48.如图2所示,该属性值预测方法包括操作s201~s204。
49.根据本公开的实施例,该属性值预测方法例如可以通过属性值预测模型实现,该属性值预测模型例如为可以为如图3所示的改进的特征金字塔深度学习模型。
50.在操作s201,获取至少两个特征图,其中,至少两个特征图是将待处理图像输入预训练模型后,利用预训练模型中的至少两个特征提取层提取得到的,待处理图像中包括待预测属性。
51.根据本公开的实施例,上述待处理图像例如可以为各种商品类图像,上述待预测属性例如可以包括图案、颜色、款式、功能、材质等,上述预训练模型例如可以选择为mobilenet_v2(一种轻量级神经网络),mobilenet_v2例如为包含多个特征提取层的预训练模型,通过mobilenet_v2可以对输入的待处理图像进行特征提取,通过mobilenet_v2的多个特征提取层可以分别对应得到该待处理图像在预训练模型中的不同处理阶段的特征提取结果(即特征图)。由于不同的特征图所表征的针对待处理图像的特征可能不同,为了增强特征的完整性及准确性,本实施例中例如为选择至少两个特征图进行特征构建,以便基于特征构建结果进行后续的属性值预测。
52.需要说明的是,上述至少两个特征图例如可以为从特征提取网络的多个特征提取层中得到的与实际待预测属性(例如可以为图案、颜色、款式、功能、材质其中任意之一)关联度更强的特征图,或者可以为该特征提取网络中任意的至少两个特征提取层对应的特征图。
53.根据图3所示的实施例,上述预训练模型例如可以为图3中的特征提取网络,上述至少两个特征图例如最终可以表现为图3中的特征图1、特征图2、特征图3和特征图4。
54.需要说明的是,图3中的特征图1~特征图4仅是一种示例性实施方案,在实际实施过程中,可以结合实际待预测属性等具体情况确定上述至少两个特征图的个数。
55.在操作s202,将至少两个特征图中每个特征图的输出尺寸调整至目标尺寸。
56.根据本公开的实施例,由于预训练模型的不同特征提取层对应输出的特征图的尺寸不同,即上述至少两个特征图的尺寸互不相同,为了实现更适用于该属性值预测模型的特征构建方式,以及使特征构建结果能够更为高效、准确的实现属性值预测,可以将上述至少两个特征图调整至同一尺寸,即上述目标尺寸。
57.根据图3所示的实施例,上述调整过程例如可以通过图3中的block组件实现。
58.需要说明的是,上述目标尺寸例如可以为特征图1~特征图4中尺寸最大的特征图所对应的尺寸,例如还可以为自定义设置的其他尺寸。
59.在操作s203,采用预设拼接规则对具有上述目标尺寸的至少两个特征图进行拼接,得到最终特征图。
60.根据本公开的实施例,为更好的根据上述至少两个特征图进行属性值预测,例如可以将该至少两个特征图的特征进行融合,该融合过程例如可以为基于上述预设拼接规则实现。
61.根据图3所示的实施例,上述预设拼接规则例如可以表现为如图3中所示的基于注意力机制(attention)实现的拼接规则,上述最终特征图例如可以为基于注意力机制将经过block组件处理后的特征图1~特征图4拼接得到。
62.在操作s204,对最终特征图进行处理,得到待处理图像的一个属性值。
63.根据本公开的实施例,上述对最终特征图进行处理的过程例如可以包括最大池化操作和线性变换操作,线性变换的结果例如可以接入输出层,进行属性值预测。
64.需要说明的是,为了使预测过程不受干扰,预测结果更为精确,上述属性值预测模型仅用于预测待处理图像的其中一个属性值(即例如可以为图案、颜色、款式、功能、材质其中任意之一)。
65.通过本公开的上述实施例,设计了一种属性值预测模型,采用改进的特征金字塔深度学习模型结构,可以综合利用图像的各种信息进行属性值预测,可大大提高了预测准确率。同时,由于通过该模型可直接预测得到图像中的属性值,在商家向电商平台中上传新的商品图片时,电商平台可直接基于该属性值预测模型对商家上传的新的商品图片的信息进行属性值预测,从而在不需要构建额外的信息输入的基础上就可直接确定该新的商品的属性值,减少了商家手工配置可能导致的失误,节省了为应对该失误而在后期产生大量的人力成本,从根本上解决了电商平台中存在的人为设置的商品属性和商品的实际属性不匹配的问题,有效提升了电商平台的可靠性,进而提高了用户在使用电商平台时的满意度。
66.下面结合具体实施例,并参考图3~图10,对图2所示的方法做进一步说明。
67.根据本公开的实施例,针对上述操作s201,在将待处理图像输入至预训练模型之前,还可以包括对待处理图像进行图像预处理的过程,该预处理过程例如可以包括:确定属性值预测模型针对待处理图像的输入尺寸的预设标准;在待处理图像的尺寸不符合预设标准的情况下,保持待处理图像的长宽比例不变,对待处理图像的边缘补充像素,以使得补充像素后的待处理图像的尺寸符合预设标准。
68.图4示意性示出了根据本公开实施例的图像预处理的方法。
69.根据图4所示的实施例,以待处理图像为服饰图片为例,上述图像预处理例如可以包括对待处理图像的尺寸进行调节(即resize),上述预处理过程例如可以通过letterbox方式(信箱模式,一种保存原有宽高比,使内容完整展现的方式)实现,上述预设标准例如可
以为待处理图像的尺寸满足正方形标准,上述补充像素例如可以表现为补充黑边的形式。
70.如图4中左图是待处理图像的原图,但是非正方形,不符合模型的输入要求(即上述预设标准),所以需要做出调整,但由于图片对应的服饰属性可以包括如领形、长度等等细节部分,如果直接对图片进行resize,可能会导致图片细节部分失真,从而导致预测失败。因此本实施例中引入letterbox方式对图片进行调整,例如表现为:保持图片长宽比例不变,对图片resize,没有满足尺寸要求的部分,对其他部位补充黑边,从而得到图4中右图所示的resize后的图片。
71.需要说明的是,上述预设标准不仅限于正方形标准,但无论是何种标准,均可基于letterbox方式对图片进行处理,得到符合预设标准的图片,上述预设标准可以是属性值预测模型的输入标准,也可以是预训练模型的输入标准,在此不做限定。
72.通过本公开的上述实施例,对图片采用letterbox方式进行resize,既保留了原图的信息,又调整到了预训练模型需要的输入尺寸,符合了预训练模型的输入要求,一举两得。
73.根据本公开的实施例,针对上述操作s202,其中的目标尺寸例如可以包括目标长、目标宽和目标通道数量,在此基础上,上述操作s202例如可以包括:在特征图的长与目标长、以及特征图的宽与目标宽都不一致的情况下,通过上采样的方式将特征图的长调整至目标长,将特征图的宽调整至目标宽;以及在特征图的通道数量与目标通道数量不一致的情况下,通过卷积的方式将特征图的通道数量调整至目标通道数量。
74.需要说明的是,上述上采样方式可以同时调整特征图的长和宽,但在部分情况下,可以不必完全满足上述的特征图的长与目标长、以及特征图的宽与目标宽都不一致的条件,而只需满足其中的任意一个条件(例如只满足特征图的长与目标长不一致,或者只满足特征图的宽与目标宽不一致),即可通过上采样的方式对特征图进行调整。
75.根据图3所示的实施例,通过特征提取网络的4个特征提取层得到的特征图1~特征图4例如可以表现为如下的形式:
76.feature1:block_2_project_bn(56,56,24)
77.feature2:block_5_project_bn(28,28,32)
78.feature3:block_12_project_bn(14,14,96)
79.feature4:block_16_project_bn(7,7,320)
80.其中,括号中的内容是相应的特征提取层的输出尺寸。由于这几个特征提取层的输出尺寸不一致,所以需要block组件将其统一成一个尺寸,以便于后续的属性值预测。如图3所示,该block组件例如可以包括block1、block2、block3、block4,分别对应对feature1、feature2、feature3、feature4进行尺寸调整。本实施例中,目标尺寸例如为(56,56,64),即目标长为56,目标宽为56,目标通道数量为64。
81.图5示意性示出了根据本公开实施例的block1的实现方法。
82.如图5所示,由于feature1对应输出的特征图的长、宽与目标长、目标宽一致,仅是通道数量与目标通道数量不一致,因此block1主要是通过1*1卷积来调整feature1对应输出的特征图的通道数量,即将原通道数量24调整为目标通道数量64,从而得到目标尺寸的输出。
83.图6示意性示出了根据本公开实施例的block2的实现方法。
84.如图6所示,由于feature2对应输出的特征图的长、宽、通道数量与目标长、目标宽、目标通道数量均不一致,因此block2主要是通过upsampling来进行上采样,使图片的特征层的大小调整到56*56*32,然后再通过3*3卷积,调整通道数量,从而得到目标尺寸的输出。
85.图7示意性示出了根据本公开实施例的block3的实现方法。
86.如图7所示,由于feature3对应输出的特征图的长、宽、通道数量与目标长、目标宽、目标通道数量均不一致,因此block3主要是通过2次upsampling来进行上采样,使图片的特征层的大小调整到56*56*32,然后再通过3*3卷积,调整通道数量,从而得到目标尺寸的输出。
87.图8示意性示出了根据本公开实施例的block4的实现方法。
88.如图8所示,由于feature4对应输出的特征图的长、宽、通道数量与目标长、目标宽、目标通道数量均不一致,因此block4主要是通过3次upsampling来进行上采样,使图片的特征层的大小调整到56*56*32,再通过3*3卷积,调整通道数量,从而得到目标尺寸的输出。
89.需要说明的是,通道数量的调整方式并不局限于图5~图8所示的方式,各种能实现由原始尺寸至目标尺寸的调整变换方式,均适用于本发明。
90.根据本公开的实施例,针对上述操作s203,其中的至少两个特征图例如可以包括第一特征图、第二特征图和第三特征图,在此基础上,上述操作s203例如可以包括:基于注意力机制对第一特征图和第二特征图进行拼接,得到拼接特征图;以及基于注意力机制对拼接特征图和第三特征图进行拼接,得到最终特征图。
91.根据图3所示的实施例,在获取了具有目标尺寸的4个特征图之后,进入拼接过程。本实施例中使用更为灵活的attention(注意力机制)方式实现该拼接过程,例如可以表现为:首先将feature1与feature2进行attention拼接,获得特征contact_feature1(例如可以对应为上述拼接特征图);然后该特征与feature3进行attention拼接,获取contact_feature2(例如也可以对应为上述拼接特征图);然后contact_feature2与feature4进行attention拼接获取到最终特征contact_features(例如可以对应为上述最终特征图)。
92.需要说明的是,本方案中的拼接过程并不局限于上述实施方式,在具体实施方式中,该拼接过程可随特征图的个数自适应调整,其他任何有利于特征提取的拼接方式,均可适用于本发明。
93.通过本公开的上述实施例,基于从feature1到feature4每一层提取的特征侧重点都不一样的性质,在多处采用了attention模块进行特征选择,并结合attention方式进行特征拼接,可以选择各处最有效的图片特征进行属性值预测,相较于简单粗暴的直接拼接方法的笨拙生硬及造成的特征冗余,该attention方法获取的特征更为灵活,且更具代表性。
94.根据本公开的实施例,上述属性值预测方法还包括:在待预测属性包括多个的情况下,获取包括多个属性值预测模型的总预测模型;通过总预测模型中的每个属性值预测模型分别对每个待预测属性进行预测,得到待处理图像的多个属性值;以及根据多个属性值确定待处理图像的目标属性值。
95.图9示意性示出了根据本公开实施例的总预测模型的部署方式。
96.由于需要保证属性值预测结果足够精确这一前提,本公开的上述属性值预测模型仅用于预测一个属性值,然而在实际情形中,待处理图像的属性众多,不可能针对每个属性均部署一个模型服务,因此采用了模块化的思想,将每一个属性值预测模型当作一个模块,将多个模块组合成一个大模型(即上述总预测模型),并由该总预测模型负责预测一个待处理图像的所有属性的预测。例如,在需要通过属性值预测模型进行属性值预测的情况下,只需要输入一张图片就可以得到每个属性的对应属性值概率,即可以得到全部的属性值预测结果,然后选择需要的结果即可。而且,针对该总预测模型,在需要升级迭代的情况下,也可以只对需要的属性值预测模型对应的模块进行升级即可,而对其他的模块不会产生影响。
97.通过本公开的上述实施例,采用模块化思想,针对每个属性单独构建预测模型,而且通过模型组合技术,将多个模型组合到一起,从而在部署的时候,只需要部署一个模型,就可以预测出多个属性,节省了时间,在升级迭代的时候,只需要对某个模块单独升级就可以完成升级迭代,对其他模块没有影响。
98.根据本公开的实施例,上述属性值预测模型是通过迭代训练的方式进行训练的,每次迭代包括:
99.a.获取图像训练集,其中,图像训练集中包括多个图像和每个图像对应的基础属性值;
100.b.将图像训练集输入至属性值训练模型,得到针对图像训练集中每个图像的第一预测属性值;
101.c.根据第一预测属性值和基础属性值调整属性值预测模型的损失函数,得到下一次迭代的属性值训练模型;
102.d.将图像训练集输入至下一次迭代的属性值训练模型,得到针对图像训练集中每个图像的第二预测属性值;
103.e.在第二预测属性值和基础属性值不匹配的情况下,从图像训练集中删除不匹配的属性值所对应的图像,得到下一次迭代的图像训练集。
104.图10示意性示出了根据本公开实施例的属性值预测模型的训练流程图。
105.根据本公开的实施例,上述图像训练集例如为从电商平台中获取的图像,由于从电商平台中获取的图像配置的属性值存在与图像真实属性值不匹配的情况,因此该图像训练集中的图像对应的基础属性值实际上可能包括了真实值和虚假值。而由于上述属性值预测模型是用来对属性值进行预测的,比如预测衣服的颜色:黑色、白色、红色等等,这种多分类的情况,对数据的干净程度依赖特别高,即需要保证图像训练集中的图像对应的基础属性值的真实性。但是为了实现这一目的而需要的人为打标的成本非常高,为了减少人工参与程度,本实施例中直接针对包含有真实值和虚假值的图像训练集,采用边训练、边清洗数据的方法实现对属性值预测模型的训练,该过程例如可以包括:先训练模型,然后利用模型反向预测属性值,找到与真实标注(即上述基本属性值)不一样的样本,进行验证、清洗。
106.根据本公开的实施例,上述训练模型的过程例如可以通过上述b过程和c过程所述的方法实现,上述利用模型反向预测属性值的过程例如可以通过上述d过程所述的方法实现,上述验证、清洗的过程例如可以通过上述e过程所述的方法实现。并且,通过e过程得到的清洗后的数据(此处例如为删除图像训练集中不匹配的属性值所对应的图像后得到的剩余的图像)例如可以作为下一次迭代中a过程的图像训练集,并在下一次迭代中重复上述b
过程~d过程的方法,从而通过边训练、边清洗、反复训练、反复迭代的方式来完成对上述属性值预测模型的训练。
107.根据本公开的实施例,在上述e过程所述的方法中,在获取到预测属性值和基础属性值不匹配的情况下,还可以对不匹配的属性值所对应的图像进行打标,在一定程度上降低了人工打标的成本。
108.通过本公开的上述实施例,采用多次迭代训练的方式,减少了人工标注数据的工作。
109.根据本公开的实施例,上述待处理图像中包括已配置属性值,该已配置属性值为待预测属性在待处理图像中的实际配置值,上述属性值预测方法还可以包括:获取通过上述属性值预测模型预测得到的针对该待处理图像的预测属性值;以及在该预测属性值和该已配置属性值不匹配的情况下,对该待处理图像进行标记。
110.通过本公开的上述实施例,可以通过属性值预测模型直接对属性值配置不准确的商品图像进行标记,即可以实现一种自动化的审核过程,通过直接由机器审核代替人工审核的方式,减少了审核过程中的人工参与程度。而且通过属性值预测模型实现的该审核过程无需依赖其他信息,如无需依赖底层数据,只依靠商品本身的信息就可以识别出属性详情,能够实现全自动化、高可靠性的审核过程。
111.根据本公开的上述实施例,针对商家录入的商品图片,一般关联有对应的属性,而该属性中例如可以包括尚未配置实际值的属性,或者也可以包括已经配置了实际值的属性,已经配置了的实际值例如还可以表现为真实值或虚假值两种状态。无论是何种存在方式,本实施例中可以通过上述总预测模型对该商品图片进行预测,预测结果例如可以表现为:确定该商品图片中未配置实际值的属性对应的属性值,判断该商品图片中已配置实际值的属性对应的配置值是否正确,如不正确,可以选择正确的至重新配置,或者可以对该商品图片进行相关标记,以提示商家进行修改或提示用户该商品信息不准确。
112.根据本公开的实施例,提供了一种高效的检测图像中属性的属性值预测模型,并含有详细的部署方案。该方案利用了训练深度学习模型的方式来进行检测,还可以在最后的判定器中设定阈值进行调节,具有非常高的灵活行,与可操作性。
113.通过本公开的上述实施例,基于上述属性值预测模型,一方面可实现针对图像的属性值预测,在一定程度上减少商品录入时的部分人工操作,如在商品属性可选择的情况下可直接确定被选中的属性值,另一方面还可以实现对已有商品信息的审核,如可以对属性值不准确的相关商品进行标记或修改等。整个过程减少了人工操作,为电商平台的商品录入及审核过程提供了便利,从而可有效提升用户在使用电商平台时的满意度。
114.图11示意性示出了根据本公开的实施例的属性值预测装置的框图。
115.如图11所示,属性值预测装置1100包括第一获取模块1110、调整模块1120、拼接模块1130和处理模块1140。
116.第一获取模块1110,用于获取将待处理图像输入预训练模型处理后,根据所述预训练模型中的至少两个特征提取层得到的至少两个特征图,其中,所述待处理图像中包括待预测属性。
117.调整模块1120,用于将所述至少两个特征图中每个特征图的输出尺寸调整至目标尺寸。
118.拼接模块1130,用于采用预设拼接规则对具有所述目标尺寸的至少两个特征图进行拼接,得到最终特征图。
119.处理模块1140,用于对所述最终特征图进行处理,得到所述待处理图像的一个属性值。
120.根据本公开的实施例,上述目标尺寸包括目标长、目标宽和目标通道数量,上述调整模块包括第一调整单元和第二调整单元。
121.第一调整单元,用于在所述特征图的长、宽与所述目标长、目标宽不一致的情况下,通过上采样的方式将所述特征图的长、宽调整至所述目标长、目标宽。
122.第二调整单元,用于在所述特征图的通道数量与所述目标通道数量不一致的情况下,通过卷积的方式将所述特征图的通道数量调整至所述目标通道数量。
123.根据本公开的实施例,上述至少两个特征图包括第一特征图、第二特征图和第三特征图,上述拼接模块包括第一拼接单元和第二拼接单元。
124.第一拼接单元,用于基于注意力机制对所述第一特征图和所述第二特征图进行拼接,得到拼接特征图。
125.第二拼接单元,用于基于注意力机制对所述拼接特征图和所述第三特征图进行拼接,得到所述最终特征图。
126.根据本公开的实施例,上述属性值预测装置还包括预处理模块,用于在将所述待处理图像输入至所述预训练模型之前,对所述待处理图像进行图像预处理,该预处理模块包括确定单元和补充单元。
127.确定单元,用于确定所述属性值预测模型针对待处理图像的输入尺寸的预设标准。
128.补充单元,用于在所述待处理图像的尺寸不符合所述预设标准的情况下,保持所述待处理图像的长宽比例不变,对所述待处理图像的边缘补充像素,以使得补充像素后的待处理图像的尺寸符合所述预设标准。
129.根据本公开的实施例,上述属性值预测装置还包括第二获取模块、预测模块和确定模块。
130.第二获取模块,用于在所述待预测属性包括多个的情况下,获取包括多个所述属性值预测模型的总预测模型。
131.预测模块,用于通过所述总预测模型中的每个所述属性值预测模型分别对每个所述待预测属性进行预测,得到所述待处理图像的多个属性值。
132.确定模块,用于根据所述多个属性值确定所述待处理图像的目标属性值。
133.根据本公开的实施例,上述属性值预测装置还包括训练模块,用于通过迭代训练的方式对属性值预测模型进行训练,该训练模块包括获取单元、第一预测单元、调整单元、第二预测单元和删除单元,通过该获取单元、第一预测单元、调整单元、第二预测单元和删除单元实现每次迭代训练。
134.获取单元,用于获取图像训练集,其中,所述图像训练集中包括多个图像和每个所述图像对应的基础属性值。
135.第一预测单元,用于将所述图像训练集输入至属性值训练模型,得到针对所述图像训练集中每个图像的第一预测属性值。
136.调整单元,用于根据所述第一预测属性值和所述基础属性值调整所述属性值预测模型的损失函数,得到下一次迭代的属性值训练模型。
137.第二预测单元,用于将所述图像训练集输入至所述下一次迭代的属性值训练模型,得到针对所述图像训练集中每个图像的第二预测属性值。
138.删除单元,用于在所述第二预测属性值和所述基础属性值不匹配的情况下,从所述图像训练集中删除不匹配的属性值所对应的图像,得到下一次迭代的图像训练集。
139.根据本公开的实施例,上述待处理图像中包括已配置属性值,所述已配置属性值为所述待预测属性在所述待处理图像中的实际配置值,上述属性值预测装置还包括第三获取模块和标记模块。
140.第三获取模块,用于获取通过所述属性值预测模型预测得到的针对所述待处理图像的预测属性值。
141.标记模块,用于在所述预测属性值和所述已配置属性值不匹配的情况下,对所述待处理图像进行标记。
142.根据本公开的实施例的模块、单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
143.例如,第一获取模块1110、调整模块1120、拼接模块1130和处理模块1140中的任意多个可以合并在一个模块/单元中实现,或者其中的任意一个模块/单元可以被拆分成多个模块/单元。或者,这些模块/单元中的一个或多个模块/单元的至少部分功能可以与其他模块/单元的至少部分功能相结合,并在一个模块/单元中实现。根据本公开的实施例,第一获取模块1110、调整模块1120、拼接模块1130和处理模块1140中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块1110、调整模块1120、拼接模块1130和处理模块1140中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
144.需要说明的是,本公开的实施例中属性值预测装置部分与本公开的实施例中属性值预测方法部分是相对应的,属性值预测装置部分的描述具体参考属性值预测方法部分,在此不再赘述。
145.图12示意性示出了根据本公开实施例的适于实现属性值预测方法的计算机系统的框图。图12示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
146.如图12所示,根据本公开实施例的计算机系统1200包括处理器1201,其可以根据存储在只读存储器(rom)1202中的程序或者从存储部分1208加载到随机访问存储器(ram)1203中的程序而执行各种适当的动作和处理。处理器1201例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器1201还可以包括用于缓存用途的板载存储器。处理器1201可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
147.在ram 1203中,存储有系统1200操作所需的各种程序和数据。处理器1201、rom 1202以及ram 1203通过总线1204彼此相连。处理器1201通过执行rom 1202和/或ram 1203中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 1202和ram 1203以外的一个或多个存储器中。处理器1201也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
148.根据本公开的实施例,系统1200还可以包括输入/输出(i/o)接口1205,输入/输出(i/o)接口1205也连接至总线1204。系统1200还可以包括连接至i/o接口1205的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至i/o接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
149.根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器1201执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
150.本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
151.根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
152.例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 1202和/或ram 1203和/或rom 1202和ram 1203以外的一个或多个存储器。
153.本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序
包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的属性值预测方法。
154.在该计算机程序被处理器1201执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
155.在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1209被下载和安装,和/或从可拆卸介质1211被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
156.根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c ,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
157.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
158.以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献