一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

陈列场景识别方法、装置、设备以及存储介质与流程

2021-11-09 22:36:00 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理、图像识别等场景,尤其涉及一种陈列场景识别方法、模型训练方法、装置、设备、存储介质以及计算机程序产品。


背景技术:

2.目前在陈列场景识别中,通常是根据待检测图像的全局特征和至少一个局部特征来识别陈列场景。但该方法需要维护大量图片,标注成本高。


技术实现要素:

3.本公开提供了一种陈列场景识别方法、模型训练方法、装置、设备、存储介质以及计算机程序产品,提高了场景识别效率。
4.根据本公开的一方面,提供了一种陈列场景识别方法,包括:获取待识别图像的特征向量并获取底库特征向量集;基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量;对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量;基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
5.根据本公开的另一方面,提供了一种模型训练方法,包括:采集陈列场景的图像样本集;对图像样本集中的每个图像样本进行目标区域提取,得到目标区域样本集;将目标区域样本集作为训练样本,训练第一初始模型,得到特征提取模型。
6.根据本公开的又一方面,提供了一种陈列场景识别装置,包括:获取模块,被配置为获取待识别图像的特征向量并获取底库特征向量集;确定模块,被配置为基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量;判断模块,被配置为对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量;识别模块,被配置为基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
7.根据本公开的又一方面,提供了一种模型训练装置,包括:采集模块,被配置为采集陈列场景的图像样本集;提取模块,被配置为对图像样本集中的每个图像样本进行目标区域提取,得到目标区域样本集;第一训练模块,被配置为将目标区域样本集作为训练样本,训练第一初始模型,得到特征提取模型。
8.根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行上述陈列场景识别方法及模型训练方法。
9.根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行上述陈列场景识别方法及模型训练方
法。
10.根据本公开的再一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现上述陈列场景识别方法及模型训练方法。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.附图用于更好地理解本方案,不构成对本公开的限定。其中:
13.图1是本公开可以应用于其中的示例性系统架构图;
14.图2是根据本公开的陈列场景识别方法的一个实施例的流程图;
15.图3是根据本公开的陈列场景识别方法的另一个实施例的流程图;
16.图4是根据本公开的陈列场景识别方法的又一个实施例的流程图;
17.图5是根据本公开的陈列场景识别方法的又一个实施例的流程图;
18.图6是根据本公开的陈列场景识别方法的又一个实施例的流程图;
19.图7是根据本公开的模型训练方法的一个实施例的流程图;
20.图8是根据本公开的模型训练方法的另一个实施例的流程图;
21.图9是根据本公开的模型训练方法的又一个实施例的流程图;
22.图10是根据本公开的陈列场景识别装置的一个实施例的结构示意图;
23.图11是根据本公开的模型训练装置的一个实施例的结构示意图;
24.图12是用来实现本公开实施例的陈列场景识别方法或模型训练方法的电子设备的框图。
具体实施方式
25.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
26.图1示出了可以应用本公开的陈列场景识别方法或模型训练方法或陈列场景识别装置或模型训练装置的实施例的示例性系统架构100。
27.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
28.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以获取待识别图像的陈列场景等。终端设备101、102、103上可以安装有各种客户端应用,例如图像处理应用等等。
29.终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
30.服务器105可以提供各种基于陈列场景识别的服务。例如,服务器105可以对从终端设备101、102、103获取到的待识别图像进行分析和处理,并生成处理结果(例如获取待识别图像的陈列场景等)。
31.需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
32.需要说明的是,本公开实施例所提供的陈列场景识别方法或模型训练方法一般由服务器105执行,相应地,陈列场景识别装置或模型训练装置一般设置于服务器105中。
33.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
34.继续参考图2,其示出了根据本公开的陈列场景识别方法的一个实施例的流程200。该陈列场景识别方法包括以下步骤:
35.步骤201、获取待识别图像的特征向量并获取底库特征向量集。
36.在本实施例中,陈列场景识别方法的执行主体(例如图1所示的服务器105)可以获取待识别图像的特征向量并获取底库特征向量集。其中,待识别图像是包含陈列场景的图像,陈列场景可以是包含商品类别字样的陈列设备,陈列设备可以是普通货架、立式冰箱陈列、卧式冰箱陈列、端架、冷风柜、地堆、割箱、陈列架、陈列挂架、热饮机或其他的设备,商品类别字样可以是可乐、啤酒等等,本公开对此不做限定。待识别图像可以利用各种拍摄设备采集,例如手机、数码相机等,也可以从视频中截取,例如从监控视频中截取等,本公开对此不做限定。待识别图像中必须包括至少一个完整的陈列场景,且待识别图像需清晰可分辨。底库是预先保存的一个图库,该图库中包含了各种陈列场景的图像。
37.在本实施例中,特征向量是一种向量,它附属于一幅图像,一幅图像有不同的属性,不同的属性用不同的属性值代表,多个属性值组合在一起可以用一个向量来表示,这个向量就称为特征向量。特征向量集是多个特征向量的集合。在本实施例中,待识别图像的特征向量及底库特征向量集均由特征提取模型获取,将待识别图像输入到特征提取模型中,即可得到待识别图像的特征向量,将底库中已经存储的各种陈列场景的底库图像分别输入到特征提取模型中,可得到每一幅底库图像的特征向量,每一幅底库图像的特征向量所构成的集合即为底库特征向量集。
38.步骤202、基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量。
39.在本实施例中,上述执行主体可以基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量。其中,相似系数表示待识别图像与底库中每幅图像的相似程度,通过对待识别图像的特征向量及底库特征向量集中的每个特征向量进行计算得到,数值范围在0

1之间,相似系数越大,相似程度越高。候选特征向量是从底库特征向量集中选取的特征向量,通常,按相似系数从大到小从底库特征向量集中选取至少两个特征向量作为候选特征向量。
40.步骤203、对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量。
41.在本实施例中,上述执行主体在确定出至少两个候选特征向量之后,可以对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量。将至少两个候选特征向量的相似系数与阈值进行比较,按照预先设置的判断规则从至少两个候选特征向量中选取一个特征向量作为目标特征向量。其中,阈值通过实验获得,数值范围在0

1之间。示例性的,将至少两个候选特征向量的相似系数与预先设定的阈值进行比较,取相似系数大于阈值的候选特征向量中,相似系数最大的特征向量作为目标特征向量。
42.步骤204、基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
43.在本实施例中,上述执行主体在得到目标特征向量后,可以基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。其中,目标特征向量对应的陈列场景标签是预先存储的,直接读取就可以得到。陈列场景标签代表包含商品类别字样的陈列设备类别,包含商品类别字样的陈列设备已在步骤201进行了详细的介绍,在此不再赘述。由于目标特征向量是根据相似系数选取出来的,因此目标特征向量对应的图像是待识别图像的相似图像,将目标特征向量对应的陈列场景标签确定为待识别图像的陈列场景。
44.本公开实施例提供的陈列场景识别方法,首先获取待识别图像的特征向量并获取底库特征向量集,然后基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量,接着对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量,最后基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。通过对候选特征向量的相似系数进行阈值判断的方式识别陈列场景,提高了识别效率。
45.进一步继续参考图3,其示出了根据本公开的陈列场景识别方法的另一个实施例的流程300。该陈列场景识别方法包括以下步骤:
46.步骤301、获取待识别图像的特征向量并获取底库特征向量集。
47.步骤302、基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量。
48.在本实施例中,步骤301

302具体操作已在图2所示的实施例中步骤201

202进行了详细的介绍,在此不再赘述。
49.在本实施例中,上述执行主体确定出的至少两个候选特征向量包括:一个主特征向量和至少一个辅特征向量。其中,通过对相似系数进行比较,将至少两个候选特征向量划分为一个主特征向量和至少一个辅特征向量。
50.在本实施例的一些可选实现方式中,主特征向量的相似系数大于至少一个辅特征向量中任意一个特征向量的相似系数。将至少两个候选特征向量的相似系数从大到小排序,取相似系数最大的候选特征向量作为主特征向量,其余候选特征向量作为至少一个辅特征向量。
51.步骤303、响应于主特征向量的相似系数大于第一阈值,将主特征向量确定为目标特征向量。
52.在本实施例中,第一阈值的取值根据实验获得。采集清晰地陈列场景图像作为测试集,每幅图像中都包含至少一个完整的陈列场景。基于特征提取模型对测试集进行实验,取聚类效果最好的数值作为第一阈值。第一阈值的取值范围在0

1之间,例如第一阈值为0.68,但第一阈值并非固定值,第一阈值的取值会根据特征提取模型的迭代有动态的变化。
53.在本实施例中,当主特征向量的相似系数大于第一阈值,将主特征向量确定为目标特征向量。
54.步骤304、响应于主特征向量的相似系数小于等于第一阈值,且至少一个辅特征向量的相似系数均大于第二阈值,基于至少一个辅特征向量确定目标特征向量。
55.在本实施例中,第二阈值的取值根据实验获得。同第一阈值的获取过程一样,基于特征提取模型对测试集进行实验得到第二阈值。第二阈值的取值范围在0

1之间,其中,第一阈值与第二阈值均为大于0且小于1的数值,且第二阈值小于第一阈值,例如第一阈值为0.68,第二阈值为0.65。第二阈值并非固定值,第二阈值的取值会根据特征提取模型的迭代有动态的变化。
56.在本实施例中,当主特征向量的相似系数小于等于第一阈值,且至少一个辅特征向量的相似系数均大于第二阈值,对至少一个辅特征向量择一确定为目标特征向量。
57.在本实施例的一些可选方式中,对至少一个辅特征向量择一确定为目标特征向量,可以是取至少一个辅特征向量中相似系数最大的辅特征向量作为目标特征向量,也可以是取至少一个辅特征向量中任意一个辅特征向量作为目标特征向量。
58.步骤305、基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
59.在本实施例中,步骤305具体操作已在图2所示的实施例中步骤204进行了详细的介绍,在此不再赘述。
60.从图3中可以看出,与图2对应的实施例相比,本实施例中的陈列场景识别方法通过将主特征向量和至少一个辅特征向量的相似系数,与第一阈值和第二阈值比较的方式得到目标特征向量,进一步提高了识别效率。
61.进一步继续参考图4,其示出了根据本公开的陈列场景识别方法的又一个实施例的流程400。该陈列场景识别方法包括以下步骤:
62.步骤401、获取待识别图像的特征向量并获取底库特征向量集。
63.步骤402、基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出三个候选特征向量。
64.在本实施例中,步骤401

402具体操作已在图2所示的实施例中步骤201

202进行了详细的介绍,在此不再赘述。
65.需要说明的是,在本实施例中,从底库特征向量集中确定出三个候选特征向量。
66.在本实施例中,候选特征向量的数量通过实验获得。将待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数从大到小排序,发现从第四位开始相似系数迅速减小,因此取前三个候选特征向量用于本实施例。
67.步骤403、响应于主特征向量的相似系数大于第一阈值,将主特征向量确定为目标特征向量。
68.在本实施例中,步骤403具体操作已在图3所示的实施例中步骤303进行了详细的介绍,在此不再赘述。
69.需要说明的是,在本实施例的一些可选实现方式中,上述执行主体确定出的三个候选特征向量包括:一个主特征向量和两个辅特征向量。主特征向量的相似系数大于两个辅特征向量中任意一个特征向量的相似系数。
70.步骤404、响应于主特征向量的相似系数小于等于第一阈值,且两个辅特征向量的
相似系数均大于第二阈值,且两个辅特征向量对应的陈列场景标签一致,将两个辅特征向量中的任意一个确定为目标特征向量。
71.在本实施例中,当上述执行主体判断主特征向量的相似系数小于等于第一阈值,且两个辅特征向量的相似系数均大于第二阈值,且两个辅特征向量对应的陈列场景标签一致,将两个辅特征向量中的任意一个确定为目标特征向量。其中,陈列场景标签代表包含商品类别字样的陈列设备类别,包含商品类别字样的陈列设备已在图2所示的实施例中步骤201进行了详细的介绍,在此不再赘述。因为两个辅特征向量对应的陈列场景标签一致,因此可以取任意一个辅特征向量作为目标特征向量。
72.步骤405、基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
73.在本实施例中,步骤405具体操作已在图2所示的实施例中步骤204进行了详细的介绍,在此不再赘述。
74.从图4中可以看出,与图3对应的实施例相比,本实施例中的陈列场景识别方法取一个主特征向量和两个辅特征向量,当主特征向量的相似系数小于等于第一阈值,且两个辅特征向量的相似系数均大于第二阈值,且两个辅特征向量对应的陈列场景标签一致,将两个辅特征向量中的任意一个确定为目标特征向量,可以使陈列场景标签的平均识别正确率达到80%以上,明显提高了识别正确率。
75.进一步继续参考图5,其示出了根据本公开的陈列场景识别方法的又一个实施例的流程500。该陈列场景识别方法包括以下步骤:
76.步骤501、获取待识别图像的特征向量并获取底库特征向量集。
77.在本实施例中,步骤501具体操作已在图2所示的实施例中步骤201进行了详细的介绍,在此不再赘述。
78.步骤502、将待识别图像的特征向量与底库特征向量集中每个特征向量分别进行矩阵相乘,得到距离特征向量集合。
79.在本实施例中,上述执行主体在获取待识别图像的特征向量获取底库特征向量集后,可以将待识别图像的特征向量与底库特征向量集中每个特征向量分别进行矩阵相乘。例如,待识别图像的特征向量是一个1*512维的特征向量,底库特征向量集中每个特征向量是512*1维的特征向量,底库特征向量集中共有n个特征向量,其中,n是自然数。将1*512维的待识别图像的特征向量分别与底库特征向量集中每个512*1维的特征向量相乘,得到n个1*1维的特征向量。将1*1维的特征向量称为距离特征向量,距离特征向量代表两个相乘特征向量的距离,距离特征向量的数值范围在0

1之间。n个距离特征向量构成距离特征向量集合。
80.步骤503、基于距离特征向量集合,计算底库特征向量集中每个特征向量的相似系数。
81.在本实施例中,上述执行主体在得到距离特征向量集合之后,可以计算底库特征向量集中每个特征向量的相似系数。其中,底库特征向量集中每个特征向量的相似系数等于1减去相应的距离特征向量。由于距离特征向量的数值范围在0

1之间,因此相似系数的数值范围也在0

1之间。
82.步骤504、基于相似系数,从底库特征向量集中确定出至少两个候选特征向量。
83.在本实施例中,上述执行主体得到相似系数后,将底库特征向量集中每个特征向
量的相似系数从大到小进行排序,按照相似系数从大到小,从底库特征向量集中选取至少两个特征向量作为至少两个候选特征向量。
84.步骤505、对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量。
85.步骤506、基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
86.在本实施例中,步骤505

506具体操作已在图2所示的实施例中步骤203

204进行了详细的介绍,在此不再赘述。
87.从图5中可以看出,与图2对应的实施例相比,本实施例中的陈列场景识别方法首先获取待识别图像的特征向量并获取底库特征向量集,然后将待识别图像的特征向量与底库特征向量集中每个特征向量分别进行矩阵相乘,得到距离特征向量集合,基于距离特征向量集合,计算底库特征向量集中每个特征向量的相似系数,基于相似系数,从底库特征向量集中确定出至少两个候选特征向量,最后对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量,基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。通过引入距离特征向量集合来计算相似系数的方法简单快捷,可以进一步提高识别效率。
88.进一步继续参考图6,其示出了根据本公开的陈列场景识别方法的又一个实施例的流程600。该陈列场景识别方法包括以下步骤:
89.步骤601、通过预先训练的位置确认模型对待识别图像进行目标区域提取,得到待处理目标区域图像。
90.在本实施例中,上述执行主体通过预先训练的位置确认模型对待识别图像进行目标区域提取,得到待处理目标区域图像。其中,预先训练的位置确认模型是一种可以确认一幅图像中目标的坐标信息的模型,例如,yolov3模型。yolov3是yolo(you only look once)系列目标检测算法中的第三版,相比之前的算法,尤其是针对小目标,精度有显著提升。将预先获取的图像样本集及图像样本集中每幅图像的目标的坐标信息作为训练样本,训练yolov3模型,yolov3模型收敛完成后,将一幅图像输入到yolov3模型,yolov3模型可以确认该幅图像中目标的坐标信息。将待识别图像输入到预先训练的位置确认模型中,可以得到待识别图像中目标的坐标信息,其中,目标例如可以是陈列场景。根据目标的坐标信息,从待识别图像中提取目标区域,得到待处理目标区域图像,其中,目标区域即待识别图像中,目标的坐标范围内的区域。从待识别图像中裁剪出目标区域内的图像,得到待处理目标区域图像。
91.步骤602、将待处理目标区域图像输入到预先训练的特征提取模型中,得到待识别图像的特征向量。
92.在本实施例中,上述执行主体在得到待处理目标区域图像后,将待处理目标区域图像输入到预先训练的特征提取模型中,得到待识别图像的特征向量。其中,预先训练的特征提取模型是一种可以提取一幅图像的特征向量的模型,例如,deit(data

efficient image transformers)模型。transformer是一种基于自注意力机制的深度神经网络,通过改进训练和蒸馏过程,将transformer应用于图像分类,得到deit模型。将一幅图像输入到deit模型,deit模型可以提取出该幅图像的特征向量。将待处理目标区域图像输入到预先训练的特征提取模型中,可得到待处理目标区域图像的特征向量,对待处理目标区域图像
的特征向量做归一化处理,得到待识别图像的特征向量。
93.步骤603、获取底库特征向量集。
94.步骤604、基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从所底库特征向量集中确定出至少两个候选特征向量。
95.步骤605、对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量。
96.步骤606、基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
97.在本实施例中,步骤603

606具体操作已在图2所示的实施例中步骤201

204进行了详细的介绍,在此不再赘述。
98.从图6中可以看出,与图2对应的实施例相比,本实施例中的陈列场景识别方法通过预先训练的位置确认模型及预先训练的特征提取模型获取待识别图像的特征向量,模型不需要大量的图像学习,有效减小了计算量,提高了识别效率。
99.进一步参考图7,其示出了根据本公开的模型训练方法的一个实施例的流程700。该模型训练方法包括以下步骤:
100.步骤701、采集陈列场景的图像样本集。
101.在本实施例中,模型可以应用于图2~图6的陈列场景识别方法中。上述执行主体可以采集陈列场景的图像样本集,其中,采集可以利用各种拍摄设备采集,例如手机照相机、数码相机等,也可以从视频中截取,例如从监控视频中截取等,本公开对此不做限定。每一幅包含陈列场景的图像是一个图像样本,多个图像样本构成图像样本集。
102.步骤702、对图像样本集中的每个图像样本进行目标区域提取,得到目标区域样本集。
103.在本实施例中,上述执行主体在采集到图像样本集后,对图像样本集中的每个图像样本进行目标区域提取,得到目标区域样本集。其中目标区域提取是基于人工手动分辨出每个图像样本中的目标位置,按照目标位置对图像样本进行裁剪得到目标区域样本,所有目标区域样本构成目标区域样本集。每个目标区域样本都只包含目标本身,不包含背景,可以排除背景的干扰。
104.步骤703、将目标区域样本集作为训练样本,训练第一初始模型,得到特征提取模型。
105.在本实施例中,上述执行主体在得到目标区域样本集后,可以将目标区域样本集作为训练样本,训练第一初始模型,得到特征提取模型。其中,第一初始模型是一个可以提取一幅图像的特征向量的模型,例如,deit模型。第一初始模型使用了self

attention机制,使第一初始模型能实现并行化训练,并且能够拥有全局信息。同时,第一初始模型引入了蒸馏程序,减少了第一初始模型使用的计算资源,例如存储空间、计算单元等。将目标区域样本集作为训练样本训练第一初始模型,得到特征提取模型,其中,当一幅图像输入到特征提取模型,特征提取模型可以准确地提取出图像的特征向量。
106.从图7中可以看出,本实施例中的模型训练方法可以得到一个特征提取模型,特征提取模型可以实现并行化训练,并且引入了蒸馏程序,不需要大量的数据进行训练,无需标注大量图片,有效降低了标注成本,提高了识别效率。
107.进一步继续参考图8,其示出了根据本公开的模型训练方法的另一个实施例的流
程800。该模型训练方法包括以下步骤:
108.步骤801、对每个图像样本进行目标区域标注,得到每个图像样本对应的目标区域坐标信息。
109.在本实施例中,上述执行主体可以对每个图像样本进行目标区域标注,得到每个图像样本对应的目标区域坐标信息。其中,图像样本具体操作已在图7所示的实施例中步骤701进行了详细的介绍,在此不再赘述。
110.在本实施例中,目标区域标注是基于人工手动分辨出每个图像样本中的目标位置,基于目标位置确定出目标在图像样本中的坐标信息,得到每个图像样本对应的目标区域坐标信息。其中,坐标信息对应的坐标系可以是以图像左下角为原点,向右沿水平方向为x轴,向上沿垂直方向为y轴的坐标系。
111.步骤802、将图像样本集及对应的目标区域坐标信息作为训练样本,训练第二初始模型,得到位置确认模型。
112.在本实施例中,上述执行主体将图像样本集及对应的目标区域坐标信息作为训练样本,训练第二初始模型,得到位置确认模型。其中,第二初始模型是一个可以提取一幅图像的目标位置的模型,例如,可以是yolov3模型,本公开对此不做限定。将图像样本集及对应的目标区域坐标信息作为训练样本训练第二初始模型,得到位置确认模型。其中,当一幅图像输入到位置确认模型,位置确认模型可以准确地提取出图像的目标位置。
113.从图8中可以看出,本实施例中的模型训练方法可以得到一个位置确认模型,位置确认模型可以准确地提取出一幅图像的目标位置,提高了识别准确率。
114.进一步继续参考图9,其示出了根据本公开的模型训练方法的又一个实施例的流程900。该模型训练方法包括以下步骤:
115.步骤901、在训练第一初始模型的过程中,获取目标区域样本集中每个目标区域样本的特征向量,作为底库特征向量集。
116.在本实施例中,上述执行主体将目标区域样本集作为训练样本训练第一初始模型,当第一初始模型收敛完成后,得到的特征提取模型可以准确地提取目标区域样本的特征向量。将目标区域样本集输入到特征提取模型中,得到目标区域样本集中每个目标区域样本的特征向量,所有目标区域样本的特征向量构成底库特征向量集。
117.步骤902、对每个目标区域样本进行陈列场景标注,得到每个目标区域样本对应的陈列场景标签。
118.在本实施例中,上述执行主体可以对每个目标区域样本进行陈列场景标注,其中,陈列场景是包含商品类别字样的陈列设备,包含商品类别字样的陈列设备已在图2所示的实施例中步骤201进行了详细的介绍,在此不再赘述。陈列场景标注是指人工判断每个目标区域样本的陈列场景类别,将每个目标区域样本对应的陈列场景类别,作为每个目标区域样本对应的陈列场景标签。
119.步骤903、保存底库特征向量集及对应的陈列场景标签。
120.在本实施例中,上述执行主体在获取底库特征向量集及对应的陈列场景标签后,对底库特征向量集及对应的陈列场景标签进行保存,当有新的图像识别需求时,保存的底库特征向量集及对应的陈列场景标签可以直接使用,不用再次获取。
121.保存方式可以采用数据库存储等方式,本公开对此不做限定。
122.从图9中可以看出,本实施例中的模型训练方法可以获取底库特征向量集及对应的陈列场景标签,并进行保存,有新的图像识别需求时可重复使用,进一步提高了识别效率。
123.进一步参考图10,作为对上述陈列场景识别方法的实现,本公开提供了一种陈列场景识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
124.如图10所示,本实施例的陈列场景识别装置1000可以包括获取模块1001,确定模块1002,判断模块1003,识别模块1004。其中,获取模块1001,被配置为获取待识别图像的特征向量并获取底库特征向量集;确定模块1002,被配置为基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数,从底库特征向量集中确定出至少两个候选特征向量;判断模块1003,被配置为对至少两个候选特征向量的相似系数进行阈值判断,得到目标特征向量;识别模块1004,被配置为基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。
125.在本实施例中,陈列场景识别装置1000:获取模块1001,确定模块1002,判断模块1003和识别模块1004的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201

204的相关说明,在此不再赘述。
126.在本实施例的一些可选实现方式中,至少两个候选特征向量包括一个主特征向量和至少一个辅特征向量;判断模块1003包括:第一判断子模块,被配置为响应于主特征向量的相似系数大于第一阈值,将主特征向量确定为目标特征向量;第二判断子模块,被配置为响应于主特征向量的相似系数小于等于第一阈值,且至少一个辅特征向量的相似系数均大于第二阈值,基于至少一个辅特征向量确定目标特征向量;其中,第一阈值与第二阈值均为大于0且小于1的数值,且第二阈值小于第一阈值。
127.在本实施例的一些可选实现方式中,至少两个候选特征向量包括一个主特征向量和两个辅特征向量;第二判断子模块中的基于至少一个辅特征向量确定目标特征向量包括:标签判断单元,被配置为响应于两个辅特征向量对应的陈列场景标签一致,将两个辅特征向量中的任意一个确定为目标特征向量。
128.在本实施例的一些可选实现方式中,确定模块1002包括:矩阵相乘子模块,被配置为将待识别图像的特征向量与底库特征向量集中每个特征向量分别进行矩阵相乘,得到距离特征向量集合;计算相似系数子模块,被配置为基于距离特征向量集合,计算底库特征向量集中每个特征向量的相似系数;候选确认子模块,被配置为基于相似系数,从底库特征向量集中确定出至少两个候选特征向量。
129.在本实施例的一些可选实现方式中,主特征向量的相似系数大于至少一个辅特征向量中任意一个特征向量的相似系数。
130.在本实施例的一些可选实现方式中,获取模块1001中的获取待识别图像的特征向量包括:目标提取子模块,被配置为通过预先训练的位置确认模型对待识别图像进行目标区域提取,得到待处理目标区域图像;目标处理子模块,被配置为将待处理目标区域图像输入到预先训练的特征提取模型中,得到待识别图像的特征向量。
131.进一步参考图11,作为对上述模型训练方法的实现,本公开提供了一种模型训练装置的一个实施例,该装置实施例与图7所示的方法实施例相对应,该装置具体可以应用于
各种电子设备中。
132.如图11所示,本实施例的模型训练装置1100可以包括采集模块1101,提取模块1102,第一训练模块1103。其中,采集模块1101,被配置为采集陈列场景的图像样本集;提取模块1102,被配置为对图像样本集中的每个图像样本进行目标区域提取,得到目标区域样本集;第一训练模块1103,被配置为将目标区域样本集作为训练样本,训练第一初始模型,得到特征提取模型。
133.在本实施例中,模型训练装置1100:采集模块1101,提取模块1102和第一训练模块1103的具体处理及其所带来的技术效果可分别参考图7对应实施例中的步骤701

703的相关说明,在此不再赘述。
134.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
135.图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
136.如图12所示,设备1200包括计算单元1201,其可以根据存储在只读存储器(rom)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(ram)1203中的计算机程序,来执行各种适当的动作和处理。在ram 1203中,还可存储设备1200操作所需的各种程序和数据。计算单元1201、rom 1202以及ram 1203通过总线1204彼此相连。输入/输出(i/o)接口1205也连接至总线1204。
137.设备1200中的多个部件连接至i/o接口1205,包括:输入单元1206,例如键盘、鼠标等;输出单元1207,例如各种类型的显示器、扬声器等;存储单元1208,例如磁盘、光盘等;以及通信单元1209,例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
138.计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理,例如陈列场景识别方法或模型训练方法。例如,在一些实施例中,陈列场景识别方法或模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由rom 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到ram 1203并由计算单元1201执行时,可以执行上文描述的陈列场景识别方法或模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行陈列场景识别方法或模型训练方法。
139.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统
的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
140.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
141.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
142.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
143.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
144.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。服务器可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
145.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例
如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
146.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献