一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种对象识别方法、装置、设备以及计算机可读存储介质与流程

2022-06-01 13:02:21 来源:中国专利 TAG:


1.本技术涉及图像识别领域,具体涉及一种对象识别方法、装置、设备以及计算机可读存储介质。


背景技术:

2.在图像识别技术不断发展的背景下,其出现了越来越多的落地应用,广泛地应用在涉及到图像搜索的应用场景中,例如,在电商平台中,可通过图像识别技术,搜索与图像中物体相似的商品,又或者,可向用户推荐与当前浏览商品相似的商品。随着人工智能(artificial intelligence,ai)以及5g技术的发展,图像识别实现的商品检索,在商业场景中具有更为广阔的应用前景,愈加受到零售商或者品牌商的重视。
3.商品检索,通过需要配置一商品库,该商品库中包含了大量的预设商品的商品特征,如此,当对待识别图像进行商品检索时,可通过图像识别技术从待识别图像中抽取出商品特征,并与商品库中的商品特征进行匹配查询,如此得到商品匹配结果,并给予该商品匹配结果反馈商品识别结果或者商品推荐结果等内容。
4.而在现有的相关技术的研究过程中,发明人发现,随着运营时间的不断发展,商品种类的规模愈加庞大,且众多商品品类之间的差异性很小,如此,在海量的商品特征中进行商品的匹配,带来的是检索效率的降低。


技术实现要素:

5.本技术提供了一种对象识别方法、装置、设备以及计算机可读存储介质,用于在通过图像识别技术进行如商品等对象的检索时,可显著提高检索效率,快速得到对象识别结果。
6.第一方面,本技术提供了一种对象识别方法,方法包括:
7.在待识别图像中进行特征提取,得到待识别对象特征信息;
8.将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,其中,对象特征信息库中包括多个对象特征信息集合,不同的对象特征信息集合通过不同的预设对象特征信息进行划分;
9.将待识别对象特征信息,与第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息;
10.将第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果。
11.结合本技术第一方面,在本技术第一方面第一种可能的实现方式中,将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,包括:
12.计算待识别对象特征信息的特征向量,与每个预设对象特征信息的特征向量之间的欧氏距离,得到多个第一欧氏距离计算结果;
13.确定多个第一欧氏距离计算结果中具有最小距离值的第二欧式距离计算结果,并
将第二欧式距离计算结果对应的预设对象特征信息识别为第一对象特征信息;
14.或者,确定多个第一欧氏距离计算结果中距离值处于预设短距离范围的多个第三欧式距离计算结果,并将多个第三欧式距离计算结果分别对应的预设对象特征信息识别为第一对象特征信息。
15.结合本技术第一方面第一种可能的实现方式,在本技术第一方面第二种可能的实现方式中,多个第三欧式距离计算结果与多个目标对象特征信息集合一一对应,将待识别对象特征信息,与第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息包括:
16.计算待识别对象特征信息的特征向量,与每个目标对象特征信息集合中的每个对象特征信息的特征向量之间的欧式距离,得到多个第四欧式距离计算结果;
17.分别计算每个目标对象特征信息集合对应的第三欧式距离计算结果以及第四欧式距离计算结果两者的加权平均值,得到多个加权平均值计算结果;
18.将具有最小加权平均值的加权平均值计算结果对应的对象特征信息确定为第二对象特征信息。
19.结合本技术第一方面,在本技术第一方面第三种可能的实现方式中,方法还包括:
20.在多个样本图像中进行特征提取,得到多个样本对象特征信息;
21.计算两两样本对象特征信息对应的特征向量之间的欧式距离,得到第五欧式距离计算结果;
22.根据第五欧式距离计算结果的距离值的大小,对多个样本对象特征信息进行分类,得到多个对象特征信息集合,并将每个对象特征信息集合中包含的样本对象特征信息的平均特征信息确认为对应的预设对象特征信息,以配置对象特征信息库。
23.结合本技术第一方面,在本技术第一方面第四种可能的实现方式中,待识别图像具体为待入库图像,将目标对象特征信息对应的目标对象确认为待识别图像的对象识别结果之后,方法还包括:
24.将待识别对象特征信息扩充进目标对象特征信息集合中;
25.或者,若待识别对象特征信息在对象特征信息库中的每个预设对象特征信息中,未有匹配的预设对象特征信息时,将待识别对象特征信息扩充进新的对象特征信息集合中。
26.结合本技术第一方面第四种可能的实现方式,在本技术第一方面第五种可能的实现方式中,将待识别对象特征信息扩充进目标对象特征信息集合包括:
27.经用户节点的验证通过后,将待识别对象特征信息扩充进目标对象特征信息集合中;
28.或者,将待识别对象特征信息扩充进新的对象特征信息集合中包括:
29.经用户节点的验证通过后,将待识别对象特征信息扩充进新的对象特征信息集合中。
30.结合本技术第一方面,在本技术第一方面第六种可能的实现方式中,对象识别结果包括商品库存量单位(stock keeping unit,sku)对象、服装对象、食品对象、人脸对象、菜品对象、植物对象或者动物对象。
31.第二方面,本技术提供一种对象识别装置,装置包括:
32.提取单元,用于在待识别图像中进行特征提取,得到待识别对象特征信息;
33.匹配单元,用于将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,其中,对象特征信息库中包括多个对象特征信息集合,不同的对象特征信息集合通过不同的预设对象特征信息进行划分;
34.匹配单元,还用于将待识别对象特征信息,与第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息;
35.确认单元,用于将第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果。
36.结合本技术第二方面,在本技术第二方面第一种可能的实现方式中,匹配单元,具体用于:
37.计算待识别对象特征信息的特征向量,与每个预设对象特征信息的特征向量之间的欧氏距离,得到多个第一欧氏距离计算结果;
38.确定多个第一欧氏距离计算结果中具有最小距离值的第二欧式距离计算结果,并将第二欧式距离计算结果对应的预设对象特征信息识别为第一对象特征信息;
39.或者,确定多个第一欧氏距离计算结果中距离值处于预设短距离范围的多个第三欧式距离计算结果,并将多个第三欧式距离计算结果分别对应的预设对象特征信息识别为第一对象特征信息。
40.结合本技术第二方面第一种可能的实现方式,在本技术第二方面第二种可能的实现方式中,多个第三欧式距离计算结果与多个目标对象特征信息集合一一对应,匹配单元,具体用于:
41.计算待识别对象特征信息的特征向量,与每个目标对象特征信息集合中的每个对象特征信息的特征向量之间的欧式距离,得到多个第四欧式距离计算结果;
42.分别计算每个目标对象特征信息集合对应的第三欧式距离计算结果以及第四欧式距离计算结果两者的加权平均值,得到多个加权平均值计算结果;
43.将具有最小加权平均值的加权平均值计算结果对应的对象特征信息确定为第二对象特征信息。
44.结合本技术第二方面,在本技术第二方面第三种可能的实现方式中,装置还包括配置单元,用于:
45.在多个样本图像中进行特征提取,得到多个样本对象特征信息;
46.计算两两样本对象特征信息对应的特征向量之间的欧式距离,得到第五欧式距离计算结果;
47.根据第五欧式距离计算结果的距离值的大小,对多个样本对象特征信息进行分类,得到多个对象特征信息集合,并将每个对象特征信息集合中包含的样本对象特征信息的平均特征信息确认为对应的预设对象特征信息,以配置对象特征信息库。
48.结合本技术第二方面,在本技术第二方面第四种可能的实现方式中,待识别图像具体为待入库图像,装置还包括扩充单元,用于:
49.将待识别对象特征信息扩充进目标对象特征信息集合中;
50.或者,若待识别对象特征信息在对象特征信息库中的每个预设对象特征信息中,未有匹配的预设对象特征信息时,将待识别对象特征信息扩充进新的对象特征信息集合
中。
51.结合本技术第二方面第四种可能的实现方式,在本技术第二方面第五种可能的实现方式中,扩充单元,具体用于:
52.经用户节点的验证通过后,将待识别对象特征信息扩充进目标对象特征信息集合中;
53.或者,将待识别对象特征信息扩充进新的对象特征信息集合中包括:
54.经用户节点的验证通过后,将待识别对象特征信息扩充进新的对象特征信息集合中。
55.结合本技术第二方面,在本技术第二方面第六种可能的实现方式中,对象识别结果包括商品sku对象、服装对象、食品对象、人脸对象、菜品对象、植物对象或者动物对象。
56.第三方面,本技术还提供了一种对象识别设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本技术第一方面或者第一方面任一种可能的实现方法提供的方法。
57.第四方面,本技术还提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本技术第一方面或者第一方面任一种可能的实现方法提供的方法。
58.从以上内容可得出,本技术具有以下的有益效果:
59.针对于对象识别,本技术通过预设对象特征信息将大量的对象特征信息进行划分,如此在对象特征信息库中形成不同的对象特征信息集合,形成一个新的对象特征信息检索机制,当存在待识别图像时,在待识别图像中进行特征提取得到待识别对象特征信息,再将该待识别对象特征信息与对象特征信息库中的多个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,接着再将待识别对象特征信息,与该第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息,如此将该第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果,在该检索机制中,通过由粗到细的两级对象特征检索方式,大大减少了在海量的对象特征信息中直接进行对象特征信息匹配所需的较大数据处理量,由此可得到显著提高的检索效率,快速得到对象识别结果。
附图说明
60.图1为本技术对象识别方法的一种场景示意图;
61.图2为本技术对象识别方法的一种流程示意图;
62.图3为本技术匹配第二对象特征信息的一种流程示意图
63.图4为本技术配置对象特征信息库的一种流程示意图;
64.图5为本技术对象识别装置的一种结构示意图;
65.图6为本技术对象识别设备的一种结构示意图。
具体实施方式
66.首先,在介绍本技术之前,先介绍下本技术关于应用背景的相关内容。
67.本技术提供的对象识别方法、装置以及计算机可读存储介质,可应用于对象识别
设备上,用于在通过图像识别技术进行如商品等对象的检索时,可显著提高检索效率,快速得到对象识别结果。
68.本技术提及的对象识别方法,其执行主体可以为对象识别装置,或者集成了该对象识别装置的服务器设备、物理主机等不同类型的对象识别设备,其中,对象识别装置可以采用硬件或者软件的方式实现。其中,对象识别设备还可分为多个设备,形成设备集群,并共同执行本技术提供的对象识别方法。
69.本技术所称的对象,不仅可以为商品,例如商品sku对象、服装对象、食品对象等对象,还可以延伸至人脸对象、菜品对象、植物对象或者动物对象等对象,这些对象在同类对象之间存在独特的区分处,因此可图像识别技术在图像层面对对象特征信息进行抽取以及匹配,达到对象检索的目的。因此,本技术所称的对象,其对象类型可随实际需要调整,具体在此不做限定。
70.下面,开始介绍本技术提供的对象识别方法。
71.首先,参阅图1示出的本技术对象识别方法的一种场景示意图,以及图2示出的本技术中对象识别方法的一种流程示意图,本技术提供的对象识别方法,具体可包括如下步骤:
72.步骤s101,在待识别图像中进行特征提取,得到待识别对象特征信息;
73.步骤s102,将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一匹配对象特征信息,其中,商品特征信息库中包括多个对象特征信息集合,不同的对象特征信息集合通过不同的预设对象特征信息进行划分;
74.步骤s103,将待识别对象特征信息,与第一匹配对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二匹配对象特征信息;
75.步骤s104,将第二匹配对象特征信息对应的目标对象确认为待识别图像的对象识别结果。
76.从图1所示实施例可看出,针对于对象识别,本技术通过预设对象特征信息将大量的对象特征信息进行划分,如此在对象特征信息库中形成不同的对象特征信息集合,形成一个新的对象特征信息检索机制,当存在待识别图像时,在待识别图像中进行特征提取得到待识别对象特征信息,再将该待识别对象特征信息与对象特征信息库中的多个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,接着再将待识别对象特征信息,与该第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息,如此将该第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果,在该检索机制中,通过由粗到细的两级对象特征检索方式,大大减少了在海量的对象特征信息中直接进行对象特征信息匹配所需的较大数据处理量,由此可得到显著提高的检索效率,快速得到对象识别结果。
77.下面,则在图1所示场景的基础上,对图2所示实施例中的各个步骤及其在实际应用中可能存在的实现方式,进行详细说明。
78.在本技术中,获取待识别图像,不仅可以理解为是通过摄像头采集图像的采集处理,例如,对象识别设备可通过自身的摄像头或者外部的摄像装置,从现场的对象处采集待识别图像;也可以理解为从存储有图像的相关设备处调取图像的调取处理,例如对象识别设备可从专门存储待识别图像的服务器处调取采集到的待识别图像;或者还可以理解为接
收存储有图像的相关设备发送的图像的接收处理,例如对象识别设备可以实时接收本地pda上传的在现场采集到的待识别图像,其具体获取方式,本技术在此不做限定。
79.触发本技术提供的对象识别方法、获取到待识别图像后,则可对其进行特征提取。
80.该特征提取,可以理解为,通过图像识别技术,从图像层面出发,在待识别图像中进行对象识别,识别出图中包含对象的特征信息,此时,是并未确定图像包含对象具体为什么对象的,即,该特信息为待识别对象特征信息,后续可基于该待识别对象特征信息,通过相关数据处理,确定其对应的具体对象。
81.通常,可通过神经网络模型来进行特征提取,又可以理解为通过ai技术来进行特征提取。具体的,可将待识别图像输入特征提取模型,容易理解的,特征提取模型中包括多个层,待识别图像在输入特征提取模型后,可通过特征提取模型中的输入层(input layer),转化成模型可以识别的特征向量,该特征向量再经过多个卷积层依次进行底层的对象特征信息的抽取(本技术中所称的对象特征信息,可用feature map表示),最后一层的卷积层抽取得到的底层的对象特征信息再输出至相邻的全连接层,由全连接层转化为高层的对象特征信息,全连接层输出的对象特征信息则可作为上面所称的待识别对象特征信息,或者,全连接层还可通过模型中如softmax层等模型结构继续进行进一步的特征提取并输出待识别对象特征信息。
82.该特征提取模型的模型类型,具体可以采用如yolov3模型、resnet模型、r-cnn模型、fast r-cnn模型、faster r-cnn模型、mask r-cnn模型、ssd模型等不同类型的模型。
83.模型的训练,可通过训练初始神经网络模型得到。工作人员可预先配置大量的样本图像,并通过人工标注方式标注图像包含对象的对象语义信息,例如,可对图像中的商品的像素进行语义信息的配置,例如为某个图像中商品1的每一个像素点都配置“商品1,商品1总个数为5”的商品语义信息。
84.在获得样本图像后,即可结合损失函数进行模型的训练,即将样本图像输入初始神经网络模型,进行正向传播,再根据模型输出的对象特征识别结果计算计算损失函数,根据该损失函数进行反向传播,调整模型的参数,当达到训练次数、训练时间、识别精度等训练要求时,即可完成模型的训练,此时模型即可作为本技术中的特征提取模型,可用于提取输入图像中包含的待识别对象特征信息。
85.其中,示例性的,损失函数可采用交叉熵损失函数(cross entropy loss)、三元组(triplet loss)损失函数、中心(center loss)损失函数以及焦点损失函数(focal loss)等不同类型的损失函数,当同时采用多种损失函数时,可为每种损失函数配置相应的权重,将每种损失函数计算得到的损失函数计算结果与其对应的权重进行相乘,再将多个相乘计算结果相加,得到最终的损失函数计算结果,并根据该最终的损失函数计算结果进行模型的训练。对待识别图像进行特征提取得到待识别对象特征信息后,则可进行对象特征信息的检索,以实现对象识别。
86.在本技术中,对检索所需的对象特征信息库,配置了一个新的对象特征信息检索机制,或者说,配置了一个新的对象特征信息存储结构。可参考图1所示场景,对象特征信息库中包含的大量的对象特征信息,通过不同的预设对象特征信息进行了划分,划分为不同的对象特征信息集合,形成从粗到细的两级对象特征检索方式。
87.需要理解的是,该预设对象特征信息,可以是由工作人员手动配置的;或者,也可
以为对应的对象特征信息集合中的多个对象特征信息的基础上,生成得到的,例如,预设对象特征信息的特征向量可以为多个对象特征信息对应特征向量的均值,当然,具体生成方式可随实际需要调整,具体在此不做限定。
88.在具体检索时,分为第一级对象特征检索阶段以及第二级对象特征检索阶段。在第一级对象特征检索阶段中,以对象特征信息集合一一对应的预设对象特征信息为颗粒度,检索与当前的待识别对象特征信息相匹配的预设对象特征信息,得到匹配的第一对象特征信息,同时也确定了与待识别图像相匹配的对象特征信息集合。
89.示例性的,若在图1所示场景中,确定与当前待识别图像的待识别对象特征信息所匹配的是图1中的对象特征信息集合3对应的预设对象特征信息,此时也可确定当前待识别图像的待识别对象特征信息与该对象特征信息集合3相匹配,换句话说,当前待识别图像所包含对象处于该对象特征信息集合3所对应的对象范围中。
90.在第二级对象特征检索阶段中,则以第一对象特征信息对应的对象特征信息集合中的每个对象特征信息为颗粒度,检索与当前的待识别对象特征信息相匹配的对象特征信息,得到匹配的第二对象特征信息。
91.继续以图1所示场景为例,在前面匹配得到对象特征信息集合3对应的预设对象特征信息后,在对象特征信息集合3中的每个对象特征信息中进行更为深层的对象特征检索,并确定了相匹配的对象特征信息x,此时该对象特征信息x即为第二对象特征信息。
92.当经历了从粗到细的两级对象特征检索并得到第二对象特征信息后,则可将该第二对象特征信息对应的对象作为待识别图像所包含对象的识别结果。
93.在上述的检索过程中,由于无需在对象特征信息集合3范围以外的对象特征信息中进行检索,因此大大减少了本次检索的数据处理量,例如将检索规模从o(n*m)降低为o(n),m为对象特征信息集合的个数,n为对象特征信息集合中对象特征信息的个数,由此可得到显著提高的检索效率,快速得到对象识别结果。
94.其中,在匹配过程中,其匹配方式,具体可以通过计算欧式距离实现,可以理解,对象特征信息,在图像层面上,以特征向量的形式存在,可以有预设数目的维度,例如,256维度、512维度、1024维度,每个维度存在对应的数值,以反应在该维度特征下的程度,对象特征信息x的特征向量可以记为:
95.p
x
=(x1,x2,x3,x4,...x
n-1
,xn)。
96.而对象特征信息两者之间的匹配,则可根据两者分别对应特征向量之间的欧氏距离,来衡量对象特征信息之间的相近程度,或者说相似度,欧式距离越短,代表着相近程度越高、匹配程度越高。
97.对象特征信息x、y两者的特征向量之间的欧氏距离可以记为:
[0098][0099]
对应的,上述所称的第一级对象特征检索阶段以及第二级对象特征检索阶段,都可通过特向向量之间欧氏距离的大小,来确定匹配程度,进而确定匹配的第一对象特征信息以及第二对象特征信息,以第一对象特征信息为例,其匹配处理可包括:
[0100]
计算待识别对象特征信息的特征向量,与每个预设对象特征信息的特征向量之间的欧氏距离,得到多个第一欧氏距离计算结果;
[0101]
确定多个第一欧氏距离计算结果中具有最小距离值的第二欧式距离计算结果,并将第二欧式距离计算结果对应的预设对象特征信息识别为第一对象特征信息。
[0102]
需要理解的是,在实际应用中,在第一对象特征检索阶段,所匹配出的第一对象特征信息不仅可以为一个,甚至还可以为多个,如此在保持高速检索效率的情况下,适当地提高第二对象特征检索阶段的检索范围,进一步地避免特殊情况下噪音等干扰因素导致的检索结果偏离真实结果的情况,提高检索精度。
[0103]
对应的,可预设一个短距离范围,在该范围内,都可视为第一对象特征检索阶段输出的匹配目标,该预设短距离范围,不仅可理解为以距离值直接限定的范围,还可延伸为以距离值的排列限定的范围,例如可将距离值从小到大进行排列得到的排列前十名的范围(可记为d(top10)),其范围的具体定义内容可随实际需要调整,在此不做限定。
[0104]
即,确定多个第一欧氏距离计算结果中距离值处于预设短距离范围的多个第三欧式距离计算结果,并将多个第三欧式距离计算结果分别对应的预设对象特征信息识别为第一对象特征信息。
[0105]
此外,在本技术中,为进一步提高上述检索机制的鲁棒性以及检索精度,本技术还可继续进行优化。
[0106]
参阅图3示出的本技术匹配第二对象特征信息的一种流程示意图,当第二级对象特征检索阶段得到的是多个预设对象特征信息时,或者说当得到了多个第三欧式距离计算结果时,可确定与该结果一一对应的多个目标对象特征信息集合,此时第二对象特征信息的匹配处理具体可包括:
[0107]
步骤s301,计算待识别对象特征信息的特征向量,与每个目标对象特征信息集合中的每个对象特征信息的特征向量之间的欧式距离,得到多个第四欧式距离计算结果;
[0108]
可以理解,可先计算待识别对象特征信息的特征向量,与每个具有匹配关系的目标对象特征信息集合(目标对象特征信息集合的预设对象特征信息为第一级对象特征检索阶段得到的预设对象特征信息)中的每个对象特征信息的特征向量之间的欧式距离。
[0109]
步骤s302,分别计算每个目标对象特征信息集合对应的第三欧式距离计算结果以及第四欧式距离计算结果两者的加权平均值,得到多个加权平均值计算结果;
[0110]
在本技术中,可预先对每个对象特征信息集合的预设对象特征信息还有集合中的对象特征信息分别配置对应的权数,再根据预先配置的权数,计算每个欧式距离计算结果以及第四欧式距离计算结果的加权平均值。
[0111]
示例性的,不同的对象特征信息集合,其集合对应的对象范围可能在实际应用中还存在着不同的出现概率,例如,对象特征信息集合1对应的对象范围较常出现在历史的待识别图像中,对象特征信息集合2对应的对象范围较少出现在历史的待识别图像中,此时对象特征信息集合1的预设对象特征信息的权数相较于对象特征信息集合2的预设对象特征信息的权数,则可配置更大的权数值,以此进一步强化对象特征信息集合1对于对象特征检索的影响力。
[0112]
而在对象特征信息集合中的不同对象特征信息中,类似的,也可通过配置不同的权数来灵活调整每个对象特征信息对于对象特征检索的影响力。
[0113]
步骤s303,将具有最小加权平均值的加权平均值计算结果对应的对象特征信息确定为第二对象特征信息。
[0114]
最后的,则可将取得最小加权平均值的加权平均值计算结果对应的对象特征信息确定为第二对象特征信息。
[0115]
示例性的,若取得最小距离值的第四欧式距离计算结果对应的是对象特征信息集合x中的对象特征信息x5,在未采用加权平均处理之前,可将该对象特征信息x5作为匹配的第二对象特征信息;
[0116]
而在采用加权平均处理之后发现,取得最小平均值的加权平均值计算结果对应的是对象特征信息集合y中的对象特征信息y3,则意味着该对象特征信息y3在历史经验的基础上,更贴近于实际情况,因此可将该对象特征信息y3作为匹配的第二对象特征信息,达到一个校正检索结果、提高检索精度的目的。
[0117]
下面,介绍下本技术对象特征信息库的配置过程。
[0118]
参阅图4示出的本技术配置对象特征信息库的一种流程示意图,在本技术,对象特征信息库的配置处理,可包括:
[0119]
步骤s401,在多个样本图像中进行特征提取,得到多个样本对象特征信息;
[0120]
与前文提及的从待识别图像中提取得到待识别对象特征信息类似的,通常,可通过特征提取模型来进行特征提取的数据处理,该特征提取模型的说明可参考前文,具体在此不再赘述。
[0121]
步骤s402,计算两两样本对象特征信息对应的特征向量之间的欧式距离,得到第五欧式距离计算结果;
[0122]
在当前存在大量样本对象特征信息的情况下,可计算两两对象特征信息对应的特征向量之间的欧式距离,欧氏距离的说明可参考前文,具体在此不再赘述。
[0123]
步骤s403,根据第五欧式距离计算结果的距离值的大小,对多个样本对象特征信息进行分类,得到多个对象特征信息集合,并将每个对象特征信息集合中包含的样本对象特征信息的平均特征信息确认为对应的预设对象特征信息,以配置对象特征信息库。
[0124]
可以理解,在本技术中,对象特征信息库是在大量的样本对象特征信息进行划分形成的多个对象特征信息集合的基础上形成的,该划分处理,在实际应用中,不仅可以为工作人员进行手动划分的,也可以由机器自动划分的,例如可根据不同对象的细分类别进行划分,或者根据不同对象的样本对象特征信息之间的相似度(对象特征信息的特征向量之间的欧氏距离),又或者根据其他划分方式进行划分。
[0125]
进一步的,对于每个对象特征信息集合配置的预设对象特征信息,可以是由工作人员手动配置的;或者,也可以为对应的对象特征信息集合中的多个样本对象特征信息的基础上,生成得到的,例如,预设对象特征信息的特征向量可以为多个样本对象特征信息对应特征向量的均值,当然,具体生成方式可随实际需要调整,具体在此不做限定。
[0126]
优选的,在本技术中,可直接根据两两样本对象特征信息之间的相似度进行划分,得到对象特征信息集合,并将集合内样本对象特征信息的平均特征信息作为集合的预设对象特征信息,在该对象特征信息库的配置方式下,更便于基于相似度进行对象特征检索。
[0127]
作为又一种示例性的实现方式,在本技术中,上述的对象特征检索,不仅可用于推向消费者、用户的对象检索服务,还可以用于自身对象特征信息库的更新处理,对应的,待识别图像具体可以为待入库图像,在确定对象识别结果之后,还可包括对象特征信息库的扩充处理:
[0128]
将待识别对象特征信息扩充进目标对象特征信息集合中;
[0129]
或者,若待识别对象特征信息在对象特征信息库中的多个预设对象特征信息中,未有匹配的预设对象特征信息时,将待识别对象特征信息扩充进新的对象特征信息集合中。
[0130]
如此,可方便地自动对对象特征信息库进行扩充,快速且精确地建立对象特征信息库,而该建立的对象特征信息库,也可通过其对应的由粗到细的两级对象特征检索方式,为消费者、用户提供更为快速且精确的对象检索服务。
[0131]
其中,在扩充对象特征信息库的过程中,还可引入人工确认环节,以便在工作人员的监督、确认下,完成对象特征信息的扩充。具体的,上述将待识别对象特征信息扩充进目标对象特征信息集合包括:
[0132]
经用户节点的验证通过后,将待识别对象特征信息扩充进目标对象特征信息集合中;
[0133]
或者,上述将待识别对象特征信息扩充进新的对象特征信息集合中包括:
[0134]
经用户节点的验证通过后,将待识别对象特征信息扩充进新的对象特征信息集合中。
[0135]
其中,该用户节点,可以理解为工作人员节点,具体可以为工作人员的用户设备(user equipment,ue),ue具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(personal digital assistant,pda)等终端设备。
[0136]
当对象识别设备在执行本技术提供的对象识别方法、基于待识别对象特征信息对对象特征信息库进行扩充时,可向工作人员侧的ue发送确认信息,使得ue向工作人员推送此时扩充处理涉及的内容,待接收到工作人员在ue上进行确认的确认信息后,对象识别设备再进行后续的扩充处理。
[0137]
以上就是本技术对象识别方法的介绍,为便于更好的实施本技术提供的对象识别方法,本技术还提供了对象识别装置。
[0138]
参阅图5,图5为本技术对象识别装置的一种结构示意图,在本技术中,对象识别装置500具体可包括如下结构:
[0139]
提取单元501,用于在待识别图像中进行特征提取,得到待识别对象特征信息;
[0140]
匹配单元502,用于将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,其中,对象特征信息库中包括多个对象特征信息集合,不同的对象特征信息集合通过不同的预设对象特征信息进行划分;
[0141]
匹配单元502,还用于将待识别对象特征信息,与第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息;
[0142]
确认单元503,用于将第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果。
[0143]
在一种示例性的实现方式中,匹配单元502,具体用于:
[0144]
计算待识别对象特征信息的特征向量,与每个预设对象特征信息的特征向量之间的欧氏距离,得到多个第一欧氏距离计算结果;
[0145]
确定多个第一欧氏距离计算结果中具有最小距离值的第二欧式距离计算结果,并将第二欧式距离计算结果对应的预设对象特征信息识别为第一对象特征信息;
[0146]
或者,确定多个第一欧氏距离计算结果中距离值处于预设短距离范围的多个第三欧式距离计算结果,并将多个第三欧式距离计算结果分别对应的预设对象特征信息识别为第一对象特征信息。
[0147]
在又一种示例性的实现方式中,多个第三欧式距离计算结果与多个目标对象特征信息集合一一对应,匹配单元502,具体用于:
[0148]
计算待识别对象特征信息的特征向量,与每个目标对象特征信息集合中的每个对象特征信息的特征向量之间的欧式距离,得到多个第四欧式距离计算结果;
[0149]
分别计算每个目标对象特征信息集合对应的第三欧式距离计算结果以及第四欧式距离计算结果两者的加权平均值,得到多个加权平均值计算结果;
[0150]
将具有最小加权平均值的加权平均值计算结果对应的对象特征信息确定为第二对象特征信息。
[0151]
在又一种示例性的实现方式中,装置还包括配置单元504,用于:
[0152]
在多个样本图像中进行特征提取,得到多个样本对象特征信息;
[0153]
计算两两样本对象特征信息对应的特征向量之间的欧式距离,得到第五欧式距离计算结果;
[0154]
根据第五欧式距离计算结果的距离值的大小,对多个样本对象特征信息进行分类,得到多个对象特征信息集合,并将每个对象特征信息集合中包含的样本对象特征信息的平均特征信息确认为对应的预设对象特征信息,以配置对象特征信息库。
[0155]
在又一种示例性的实现方式中,待识别图像具体为待入库图像,装置还包括扩充单元505,用于:
[0156]
将待识别对象特征信息扩充进目标对象特征信息集合中;
[0157]
或者,若待识别对象特征信息在对象特征信息库中的每个预设对象特征信息中,未有匹配的预设对象特征信息时,将待识别对象特征信息扩充进新的对象特征信息集合中。
[0158]
在又一种示例性的实现方式中,扩充单元505,具体用于:
[0159]
经用户节点的验证通过后,将待识别对象特征信息扩充进目标对象特征信息集合中;
[0160]
或者,将待识别对象特征信息扩充进新的对象特征信息集合中包括:
[0161]
经用户节点的验证通过后,将待识别对象特征信息扩充进新的对象特征信息集合中。
[0162]
在又一种示例性的实现方式中,对象识别结果包括商品sku对象、服装对象、食品对象、人脸对象、菜品对象、植物对象或者动物对象。
[0163]
本技术还提供了对象识别设备,参阅图6,图6示出了本技术对象识别设备的一种结构示意图,具体的,本技术对象识别设备包括处理器601、存储器6902以及输入输出设备603,处理器601用于执行存储器602中存储的计算机程序时实现如图1至图4对应任意实施例中对象识别方法的各步骤;或者,处理器901用于执行存储器602中存储的计算机程序时实现如图5对应实施例中各单元的功能,存储器602用于存储处理器601执行上述图1至图4对应任意实施例中对象识别方法所需的计算机程序。
[0164]
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/
单元被存储在存储器602中,并由处理器601执行,以完成本技术。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
[0165]
对象识别设备可包括,但不仅限于处理器601、存储器602、输入输出设备603。本领域技术人员可以理解,示意仅仅是对象识别设备的示例,并不构成对对象识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如对象识别设备还可以包括网络接入设备、总线等,处理器601、存储器602、输入输出设备603以及网络接入设备等通过总线相连。
[0166]
处理器601可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是对象识别设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
[0167]
存储器602可用于存储计算机程序和/或模块,处理器601通过运行或执行存储在存储器602内的计算机程序和/或模块,以及调用存储在存储器602内的数据,实现计算机装置的各种功能。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据对象识别设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0168]
处理器601用于执行存储器602中存储的计算机程序时,具体可实现以下功能:
[0169]
在待识别图像中进行特征提取,得到待识别对象特征信息;
[0170]
将待识别对象特征信息与对象特征信息库中的每个预设对象特征信息进行匹配,得到匹配的第一对象特征信息,其中,对象特征信息库中包括多个对象特征信息集合,不同的对象特征信息集合通过不同的预设对象特征信息进行划分;
[0171]
将待识别对象特征信息,与第一对象特征信息对应的目标对象特征信息集合中的每个对象特征信息进行匹配,得到匹配的第二对象特征信息;
[0172]
将第二对象特征信息对应的目标对象确认为待识别图像的对象识别结果。
[0173]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的对象识别装置、设备及其相应单元的具体工作过程,可以参考如图1至图4对应任意实施例中对象识别方法的说明,具体在此不再赘述。
[0174]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0175]
为此,本技术提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术如图1至图4对应任意实施例中对象识别方法中的步骤,具体操作可参考如图1至图4对应任意实施例中对象识别方法的说明,在此不再赘述。
[0176]
其中,该计算机可读存储介质可以包括:只读存储器(read only memory,rom)、随机存取记忆体(random access memory,ram)、磁盘或光盘等。
[0177]
由于该计算机可读存储介质中所存储的指令,可以执行本技术如图1至图4对应任意实施例中对象识别方法中的步骤,因此,可以实现本技术如图1至图4对应任意实施例中对象识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
[0178]
以上对本技术提供的对象识别方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献