一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像分类方法、装置、应用、计算机设备及存储介质与流程

2022-02-20 12:57:51 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种图像分类方法、装置、应用、计算机设备及存储介质。


背景技术:

2.随着互联网技术的不断发展,人工智能已经深入当今人们日常生活的方方面面。比如,自动驾驶汽车、智能家居、智慧购物等,这些产品或服务极大地提高了人们的衣食住行质量。人工智能通常会涉及到目标分类,例如,人脸图像的性别分类等。
3.现有的人脸图像的性别分类主要采用svm(支持向量机)、knn(k近邻)、randomforest(随机森林)和基于softmax的分类器。而目前被广泛使用的是基于softmax的分类器。然而,现有的基于softmax的分类器为线性分类器,其在应用于人脸图像的性别分类时,对于特征抽取的要求较高,例如,对于不同人种的性别的分类,必须要将不同人种相同性别的样本影射到空间相同位置,这样就增大了分类器的学习难度,减慢了训练时分类器的收敛速度,且分类器的识别精度也较差。
4.可见,现有的基于softmax的线性分类器仍存在模型学习难度大、收敛速度慢且分类精度较低的问题。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种图像分类方法、装置、计算机设备及存储介质,以解决现有的基于softmax的线性分类器仍存在模型学习难度大、收敛速度慢且分类精度较低的问题。
6.一种图像分类方法,包括:
7.获取待测试图像,从所述待测试图像抽取指定对象的特征向量;
8.将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2;
9.将所述一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输出值确定所述指定对象的类别。
10.一种图像分类装置,包括:
11.特征向量抽取模块,用于获取待测试人脸图像,从所述待测试图像抽取指定对象的特征向量;
12.相似度获取模块,用于将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2;
13.性别确定模块,用于将所述一维数组输入softmax层,获取所述softmax层输出的
输出值,根据所述输出值确定所述指定对象的类别。
14.如上所述的图像分类方法可以应用于自动驾驶汽车、智能家居或智慧购物等场景中。
15.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述图像分类方法。
16.一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述图像分类方法。
17.上述图像分类方法、装置、计算机设备及存储介质,通过将从待测试图像抽取出指定对象的特征向量与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组,再将该一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输出值确定所述指定对象的类别。与现有的基于softmax的线性分类器相比,本发明提供的单类多参数的非线性分类方法能够大大降低从待测试图像抽取指定对象的特征向量的要求,例如,在针对不同人种同性别的人脸图像进行性别识别时,无须将不同人种相同性别的样本影射到空间的相同位置,因此,可以降低模型的学习难度、加速模型的收敛速度,并可提高分类精度,即提高模型的识别精度;并且,在处理统计分布规律差异较大的同类别数据时具有明显的优越性。
附图说明
18.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
19.图1是本发明一实施例中图像分类方法的应用环境示意图;
20.图2是本发明一实施例中图像分类方法的流程示意图;
21.图3是本发明一实施例中图像分类装置的结构示意图;
22.图4是本发明一实施例中计算机设备的示意图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.本实施例提供的图像分类方法,可应用在如图1的应用环境中。具体地,该图像分类方法应用在图像分类系统中,该图像分类系统包括如图1所示的客户端与服务器,客户端与服务器进行通信,用于实现图像分类。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可以安装在包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
25.在一实施例中,如图2所示,提供一种图像分类方法,以该方法应用在如图2所示的服务器为例进行说明,包括如下步骤:
26.步骤s10,获取待测试图像,从所述待测试图像抽取指定对象的特征向量。
27.其中,待测试图像包括人脸图像、动物图像等。
28.作为一示例,待测试图像为待测试人脸图像,该待测试人脸图像包括但不限于包含单人脸图像、多人脸图像。待测试人脸图像可以是存储在客户端本地的含人脸的图片,也可以存储在服务器的存储区域的含人脸的图像,还可以是由具有拍摄功能的摄像装置实时拍摄得到的含人脸的图像或者视频流。在实际应用时,可以从上述的客户端、服务器或者拍摄装置获取到待测试人脸图像。
29.其中,指定对象具体是可以根据分类任务来确定,比如,分类任务为男女性别的二分类,那么指定对象可以为指定人物。指定人物,可以是指单人脸图像的人物或者多人脸图像中的某个人物。
30.又例如,分类任务为动物种类的分类,那么指定对象可以是指定动物。指定动物,可以是指定含有单个动物的图像中的动物,或者是含有多个动物的图像中的其中某个动物。
31.示例性的,若待测试人脸图像为一张包含有3个人物甲、乙、丙的图像,那么指定人物可以是甲、乙或丙中的任意一个。例如,指定人物为甲,则从待测试人脸图像抽取甲的特征向量。
32.在一实施例中,上述步骤s10包括:
33.通过预设的检测器从所述待测试图像框选出若干对象区域;
34.从所述若干对象区域选取所述指定对象的特征区域;
35.通过预设特征提取方法对所述指定对象的特征区域进行特征提取,获取所述指定对象的对象特征,根据所述对象特征生成所述指定对象的特征向量。
36.作为一示例,当待测试图像为人脸图像,则可通过人脸检测器从所述待测试人脸图像框选出若干人脸区域(即若干对象区域);从所述若干人脸区域选取所述指定人物的人脸区域(即指定对象的特征区域);通过预设特征提取方法从所述指定人物的人脸区域进行特征提取,获取所述指定人物的人脸特征(即指定对象的对象特征),根据所述人脸特征生成所述指定人物的人脸特征向量(即指定对象的特征向量)。
37.在本发明实施例中,人脸区域通常是指在人脸图像中包括人脸五官、脸部轮廓、头发等部分的区域。以证件照为例,人脸区域可以是指脖子以上的区域。为了准确识别出每个人脸区域的人物的性别,通常一个人脸区域对应一个人物的人脸。
38.人脸特征通常是指视觉特征、像素统计特征、人脸图像变换系数特征或人脸图像代数特征。人脸特征向量可以是人脸图像上的像素点等。
39.作为一示例,可以通过人脸检测器从测试人脸图像自动框选出若干人脸区域,也可以通过人工框截的方式采用人脸框从测试人脸图像裁剪出若干人脸区域。
40.作为一示例,若待测试人脸图像为单人脸图像,则可以从该待测试人脸图像框选出一个人脸区域,该人脸区域包含的人物为指定人物,该人脸区域即为指定人物的人脸区域。
41.作为另一示例,若待测试人脸图像为多人脸图像(假设有3个人脸),那么可以从该
待测试人脸图像框选出3个人脸区域。然后,可以根据预设的选取规则从这3个人脸区域选取其中的一个作为指定人物的人脸区域。其中,预设的选取规则可以是按照框选的时间先后顺序进行选取,也可以是按照预先给每个人脸区域分配的标签进行选取,还可以是将待测人脸图像平均划分成m个部分,然后从每个部分中进行选取,具体的选取规则可以根据实际情况确定,在本发明不做限定。
42.在本发明实施例中,可通过上述预设的选取规则从若干人脸区域中依次选取出指定人物的人脸区域,进而对该指定人物的人脸区域进行下述的性别识别,可以分别识别到人脸图像中的所有人脸的性别,避免了重复或者交叉识别人脸区域而导致指定人物的性别的识别结果错误,有利于提高分类的精度。
43.在本发明实施例中,预设特征提取方法可以是深度卷积神经网络、多层感知机或专家设计特征等算法模型。
44.作为一示例,可以将待测试人脸图像输入深度卷积神经网络中,利用深度卷积神经网络从指定人物的人脸区域进行特征提取,获取到该指定人物的人脸特征,并根据该人脸特征生成指定人物的人脸特征向量。
45.优选地,为了便于区分多人脸图像中的各个人物的人脸特征向量,后续可以得到对应人物的性别识别结果,可以采用标签对每个人物的人脸特征向量进行标识。例如,某多人脸图像中包含有甲和乙的人脸,则可以采用文字标签“甲”、“乙”分别标识甲和乙的人脸特征向量。
46.可以理解的,该标签还可以是采用数字、字母或者其他标识。
47.步骤s20,将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2。
48.其中,在目标分类中,每个类别分别对应有一个或多个类参数(或称为类代理)。例如,在二分类中,有两个类别,每个类别可对应有两个或以上的类参数。
49.作为一示例,分类任务为是否戴口罩的二分类,则k取值为2,即预设的k*n个类参数为2n个类参数,其中,戴口罩类参数为n个,不戴口罩类参数为n个。
50.作为另一示例,本发明还可用于三分类、四分类、五分类等分类任务。例如,本发明方法可用于识别动物中的猫、狗、猪的三分类,此时,预设的k*n个类参数为3n个类参数(即k=3),其中,表示猫的类参数为n个,表示狗的类参数为n个,表示猪的类参数为n个。又例如,本发明方法还可用于识别衣服种类中的衬衣、t恤、裙子、长裤的四分类,此时,预设的k*n个类参数为4n个类参数(即k=4),其中,表示衬衣的类参数为n个,表示t恤的类参数为n个,表示裙子的类参数为n个,表示长裤的类参数为n个。再例如,本发明方法还可以用于识别数字0-9的十分类(k=10),那么预设的k*n个类参数为10n个类参数,其中,表示数字0的类参数为n个,表示数字1的类参数为n个
……
以此类推,表示数字9的类参数为n个。
51.在一示例性实施例中,在进行男女性别二分类时,上述步骤s20包括:将所述特征向量分别与预设的2n个类参数进行比较,获得2n个相似度,将所述2n个相似度组成长度为2n的一维数组;其中,所述2n个类参数包括n个男性类参数和n个女性类参数,n≥2,所述2n个相似度包括n个男性相似度和n个女性相似度。
52.在本发明实施例中,在针对人脸图像的性别进行分类(即二分类)中,类别分为男性和女性,其中男性对应有n个男性类参数,女性对应有n个女性类参数。
53.作为一示例,假设n的取值为3,则有2*3=6个类参数,其中,3个为男性类参数,分别用a、b、c来表示,3个为女性类参数,分别用d、e、f来表示;所抽取的指定人物的人脸特征向量用k来表示,那么将k分别与a、b、c、d、e、f进行比较,获得6个相似度。假设获得的6相似度为0.2,-0.1,0.12,0.0,0.51和0.3;那么可将上述6个相似度组成长度为6的一维数组[0.2,-0.1,0.12,0.0,0.51,0.3]。
[0054]
在另一实施例中,在针对动物图像的动物种类进行分类(例如,三分类)中,总共分为猫、狗和猪三个类别,其中,猫对应有n个表征猫的特征(比如,猫的叫声、猫的外形轮廓等)的类参数,狗对应有n个表征狗的特征((比如,狗的叫声、狗的外形轮廓等))的类参数,猪对应有n个表征猪的特征(比如,猪的鼻子、耳朵形状等)的类参数。假设n的取值为2,则有3*2=6个类参数,其中2个为表征猫的特征的类参数,分别用a、b来表示,2个为表征狗的特征的类参数分别用c、d来表示,2个为表征猪的特征的类参数,分别用e、f来表示,所抽取的动物图像中的指定对象(指图像中的动物)的特征向量为s,那么将s分别与a、b、c、d、e、f进行比较,获得6个相似度,然后将这6个相似度组成长度为6的一维数组。
[0055]
可以理解的,对于四分类、五分类等的分类任务也可以参照上述的二分类、三分类任务的方法获得相应的一维数组,在此不做赘述。
[0056]
一般来说,n的取值越大,模型的复杂度越大,因此,在实际使用时,需要先对n进行调优,以确定合适的取值。
[0057]
步骤s30,将所述一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输出值确定所述指定对象的类别。
[0058]
其中,指定对象的类别具体是根据分类的目标确定,比如,分类的目标是确定图像中的人脸的性别,那么指定对象的类别则为指定对象的性别(男性/女性)。
[0059]
结合上述男女性别二分类的示例,将上述一维数组[0.2,-0.1,0.12,0.0,0.51,0.3]输入softmax层,可获取得到softmax层输出的与上述一维数组中的各项相似度对应的概率值[p1,p2,p3,p4,p5,p6],即输出值。
[0060]
作为一示例,根据上述输出值确定所述指定对象(指定人物)的性别,具体的,比较p1,p2,p3,p4,p5,p6的大小,获得其中的最大值,根据该最大值所对应的类别来确定指定人物的性别。假设其中的最大值为p5,而p5所对应的相似度为女性相似度,那么可以确定该指定人物的性别为女性。
[0061]
在本发明实施例中,通过将抽取的人脸特征向量与每个类别的多个类参数进行比较,得到多个相似度,并结合softmax层对多个相似度进行归一化处理,得到各个相似度所对应的概率值,并根据该概率值确定人脸图像中指定人物的性别。该方法可以在识别不同人种相同性别的样本时,无需将不同人种相同性别的样本影射到空间的相同位置,不仅可以大大地降低分类模型的学习难度,提高了模型的收敛速度,而且还可以提升模型的识别精度。经仿真实验验证,本发明的分类方法对于人脸图像的性别的识别精确度可达到99.8%。此外,在针对存在不同风格和特点的同类别的数据(例如,光线差异和/或清洗度等不同的女性人脸图像)的识别上也具有明显的优越性。也即,本发明能够适用于统计分布规律差异较大的人脸图像的性别识别,且具有良好的识别效果。
[0062]
在一实施例中,上述步骤s30包括:
[0063]
将所述一维数组转换成k行n列的矩阵;其中,所述矩阵中的每一行元素对应为同一类别的n个相似度;
[0064]
确定所述矩阵中每一行元素中的最大相似度,得到k*1的第一数组;
[0065]
将所述第一数组输入softmax层,获取所述softmax层输出的第一输出值,根据所述第一输出值确定所述指定对象的类别。
[0066]
在一实施例中,在上述将第一数组输入softmax层,获取所述softmax层输出的第一输出值,根据所述第一输出值确定所述指定对象的类别的步骤中,具体包括:
[0067]
将所述第一数组转换成1*k的第二数组;
[0068]
将所述第二数组输入softmax层,获取所述softmax层输出的第二输出值;根据所述第二输出值确定所述指定对象的类别。
[0069]
在一实施例中,上述步骤将所述第二数组输入softmax层,获取所述softmax层输出的第二输出值;根据所述第二输出值确定所述指定对象的类别,具体包括:
[0070]
将所述第二数组输入softmax层,获取所述softmax层输出的与所述第二数组中的k个元素对应的k个概率值;
[0071]
根据所述k个概率值中的最大概率值,确定所述指定对象的类别。
[0072]
作为一示例,可以先根据下述公式(1)将上述一维数组转换成k行n列的矩阵。
[0073]
logit1=fc(x).reshape(num
class
,n)
ꢀꢀꢀ
(1);
[0074]
其中,上述公式(1)中的x为指定对象的特征向量,fc为全连接层,输出节点个数为num
class
*n,num
class
为具体分类任务的真实类别数(此示例为k),n为可调整的超参,表示每个类别有n个类参数。logit1可理解为所抽指定对象的特征向量与所有类参数的相似值。
[0075]
接着,可以根据下述公式(2),从该矩阵中确定出每一行元素中的最大相似度,得到k*1的第一数组。
[0076]
logit2=max(logit1,dim=1).reshape(num
class
)
ꢀꢀꢀꢀ
(2);
[0077]
其中,logit2可以理解为由所述矩阵中每一行元素中的最大相似度组成的k*1的第一数组转换成1*k的第二数组。
[0078]
最后,将第二数组输入输入softmax层,根据公式(3):p=softmax(logit2),获得softmax层输出的与每行的最大相似度对应的概率值(即第二输出值),根据第二输出值中的最大概率值可确定指定对象的类别。
[0079]
下面以本发明应用于男女性别的二分类场景为例,对本发明的实现过程进行详细说明。
[0080]
在针对男女性别的二分类任务中,该矩阵包括n个男性相似度和n个女性相似度,上述步骤s30具体包括:
[0081]
从n个男性相似度中确定出第一最大相似度;从n个女性相似度中确定出第二最大相似度,得到2*1的第一数组;将第一数组转换成1*2的第二数组,将第二数组输入softmax层,获取softmax层输出的第二输出值;根据第二输出值确定待测试图像中的指定对象的性别。
[0082]
假设输入x后(此处x为指定对象的人脸特征向量),经fc(x)运算得到一维数组[0.2,-0.1,0.12,0.0,0.51,0.3]的,在将fc(x)的运算结果代入上述公式(1)中,可将该一
维数组转换成2*3的矩阵其中,矩阵中的第一行元素0.2,-0.1,0.12为男性相似度,第二行元素0.0,0.51,0.3为女性相似度;或者,可将上述一维数组转换成2*3矩阵其中,该矩阵第一行的元素0.0,0.51,0.3为女性相似度,第二行元素0.2,-0.1,0.12为男性相似度。
[0083]
接着,可以根据上述公式(2),从该矩阵中确定出第一最大相似度和第二最大相似度。在该示例中,logit2为将2*1的第一数组转换成1*2的第二数组[0.2,0.51]。
[0084]
最后,将上述第二数组[0.2,0.51]输入softmax层,根据公式(3):p=softmax(logit2),获得softmax层输出的与这两个相似度对应的概率值(即第二输出值),根据第二输出值中的最大概率值可确定指定对象的性别。这里的指定对象为待测试图像中的指定人物。
[0085]
在本发明实施例中,通过在先对一维数组中的元素按照类别进行划分,转换成k*n的矩阵,再分别确定每个类别中的最大相似度,之后对得到的数组进行形状转换,输入softmax层,即可确定指定对象的类别。此处,通过先筛选出每个类别所对应的最大相似度,然后再输入softmax层,可以减少softmax层的运算量,并可提升模型的分类识别效率。
[0086]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0087]
在一实施例中,提供一种图像分类装置,该图像分类装置与上述实施例中图像分类方法一一对应。如图3所示,该图像分类装置包括特征向量抽取模块11、相似度获取模块12和类别确定模块14。各功能模块详细说明如下:
[0088]
特征向量抽取模块11,用于获取待测试图像;从所述待测试图像抽取指定对象的特征向量;
[0089]
相似度获取模块12,用于将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2;
[0090]
类别确定模块13,用于将所述一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输出值确定所述指定对象的类别。
[0091]
在一实施例中,上述类别确定模块13包括:
[0092]
转换单元,用于将所述一维数组转换成k行n列的矩阵;其中,所述矩阵中的每一行元素对应为同一类别的n个相似度;
[0093]
第一数组确定单元,用于确定所述矩阵中每一行元素中的最大相似度,得到k*1的第一数组;
[0094]
类别确定单元,用于将所述第一数组输入softmax层,获取所述softmax层输出的
第一输出值,根据所述第一输出值确定所述指定对象的类别。
[0095]
在一实施例中,上述类别确定模块13还用于:
[0096]
将所述第一数组转换成1*k的第二数组;
[0097]
将所述第二数组输入softmax层,获取所述softmax层输出的第二输出值;
[0098]
根据所述第二输出值确定所述指定对象的类别。
[0099]
在一实施例中,上述类别确定模块13还用于:
[0100]
将所述第二数组输入softmax层,获取所述softmax层输出的与所述第二数组中的k个元素对应的k个概率值;
[0101]
根据所述k个概率值中的最大概率值,确定所述指定对象的类别。
[0102]
在一实施例中,上述特征向量抽取模块11包括包括:
[0103]
框选单元,用于通过预设的检测器从所述待测试图像框选出若干对象区域;
[0104]
指定单元,用于从所述若干对象区域选取所述指定对象的特征区域;
[0105]
特征向量获取单元,用于通过预设特征提取方法对所述指定对象的特征区域进行特征提取,获取所述指定对象的对象特征,根据所述对象特征生成所述指定对象的特征向量。
[0106]
关于图像分类装置的具体限定可以参见上文中对于图像分类方法的限定,在此不再赘述。上述图像分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0107]
在一实施例中,上述的图像分类方法可应用于自动驾驶汽车、智能家居或智慧购物中,由于上述方法可以提高人脸图像性别识别的精度,从而有利于提高自动驾驶汽车、智能家居或智慧购物时的安全性。
[0108]
在一实施例中,上述的图像分类方法的构思还可迁移应用到其他的目标二分类任务,例如,是否戴口罩二分类任务,是否戴眼镜二分类任务,是猫还是狗二分类任务等。
[0109]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储图像分类方法所涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种图像分类方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
[0110]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现以下步骤:
[0111]
获取待测试图像,从所述待测试图像抽取指定对象的特征向量;
[0112]
将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2;
[0113]
将所述一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输
出值确定所述指定对象的类别。
[0114]
在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时实现以下步骤:
[0115]
获取待测试图像,从所述待测试图像抽取指定对象的特征向量;
[0116]
将所述特征向量分别与预设的k*n个类参数进行比较,获得k*n个相似度,将所述k*n个相似度组成长度为k*n的一维数组;其中,所述k*n个类参数表示k个类别,每个类别对应有n个类参数,所述k*n个相似度表示k个类别,每个类别对应n个相似度,n≥2,k≥2;
[0117]
将所述一维数组输入softmax层,获取所述softmax层输出的输出值,根据所述输出值确定所述指定对象的类别。
[0118]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性可读取存储介质或易失性可读存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0119]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0120]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献