一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于混合网络的人脸识别方法及相关装置与流程

2022-04-27 11:52:30 来源:中国专利 TAG:


1.本技术涉及图像识别技术领域,特别涉及一种基于混合网络的人脸识别方法、人脸识别装置、服务器以及计算机可读存储介质。


背景技术:

2.随着技术的不断发展,生物特征识别技术越来越重要。生物特征作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点。
3.相关技术中,针对人脸识别的技术:一种是基于整体的识别方法,它考虑了模式的整体属性,包括特征脸方法,svd(singular value decomposition,奇异值分解)分解方法,人脸等密度线分析匹配方法等。另一种是基于特征分析的识别方法,也就是将人脸基准点的相对比率和其他描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量。但是,现有的人脸识别的准确性和精度较低,降低了人脸识别的效果。
4.因此,如何提高人脸识别的效果是本领域技术人员关注的重点问题。


技术实现要素:

5.本技术的目的是提供一种基于混合网络的人脸识别方法、人脸识别装置、服务器以及计算机可读存储介质,以提高人脸识别的准确性和精度。
6.为解决上述技术问题,本技术提供一种基于混合网络的人脸识别方法,包括:
7.采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机;
8.采用所述卷积网络模型对待检测人脸图像进行特征提取,得到特征数据;
9.采用已训练的支持向量机对所述特征数据进行分类,得到人脸识别结果。
10.可选的,对基于dropout层的卷积网络模型进行训练的过程,包括:
11.对所述卷积网络模型进行网络参数初始化,得到初始化网络;
12.采用所述人脸识别训练数据对所述初始化网络进行前向传播,得到传播结果;
13.基于所述传播结果和实际结果对所述初始化网络进行参数更新,得到已训练的所述卷积网络模型。
14.可选的,获取待检测人脸图像的过程,包括:
15.对原始图像进行人脸检测处理,获得人脸区域;
16.对所述原始图像中的人脸区域进行矫正和预处理,获得所述待检测人脸图像。
17.可选的,对原始图像进行人脸检测处理,获得人脸区域,包括:
18.对所述原始图像进行灰度处理和滤波处理,获得预处理原始图像;
19.采用已训练的人脸检测模型对所述预处理原始图像进行人脸检测,获得所述人脸区域。
20.可选的,对所述原始图像中的人脸区域进行矫正和预处理,获得所述待检测人脸图像,包括:
21.基于预设尺寸对所述原始图像中的人脸区域进行剪裁,获得剪裁图像;
22.对所述剪裁图像进行图像差值处理,获得所述待检测人脸图像。
23.本技术还提供一种基于混合网络的人脸识别装置,包括:
24.模型训练模块,用于采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机;
25.特征提取模块,用于采用所述卷积网络模型对待检测人脸图像进行特征提取,得到特征数据;
26.向量机分类模块,用于采用已训练的支持向量机对所述特征数据进行分类,得到人脸识别结果。
27.可选的,还包括:
28.人脸检测模块,用于对原始图像进行人脸检测处理,获得人脸区域;
29.区域矫正模块,用于对所述原始图像中的人脸区域进行矫正和预处理,获得所述待检测人脸图像。
30.可选的,所述人脸检测模块,具体用于对所述原始图像进行灰度处理和滤波处理,获得预处理原始图像;采用已训练的人脸检测模型对所述预处理原始图像进行人脸检测,获得所述人脸区域。
31.本技术还提供一种服务器,包括:
32.存储器,用于存储计算机程序;
33.处理器,用于执行所述计算机程序时实现如上所述的人脸识别方法的步骤。
34.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的人脸识别方法的步骤。
35.本技术所提供的一种基于混合网络的人脸识别方法,包括:采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机;采用所述卷积网络模型对待检测人脸图像进行特征提取,得到特征数据;采用已训练的支持向量机对所述特征数据进行分类,得到人脸识别结果。
36.通过人脸识别训练数据对卷积网络模型和支持向量机进行训练后,采用已训练的卷积网络模型和支持向量机,对待检测人脸图像进行识别,提高了对人脸数据识别的准确性和精度,提高了人脸识别的效果。
37.本技术还提供一种基于混合网络的人脸识别装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
附图说明
38.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
39.图1为本技术实施例所提供的一种基于混合网络的人脸识别方法的流程图;
40.图2为本技术实施例所提供的一种卷积网络模型的结构示意图;
41.图3为本技术实施例所提供的一种基于混合网络的人脸识别装置的结构示意图。
具体实施方式
42.本技术的核心是提供一种基于混合网络的人脸识别方法、人脸识别装置、服务器以及计算机可读存储介质,以提高人脸识别的准确性和精度。
43.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
44.相关技术中,针对人脸识别的技术:一种是基于整体的识别方法,它考虑了模式的整体属性,包括特征脸方法,svd分解方法,人脸等密度线分析匹配方法等。另一种是基于特征分析的识别方法,也就是将人脸基准点的相对比率和其他描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量。但是,现有的人脸识别的准确性和精度较低,降低了人脸识别的效果。
45.因此,本技术提供一种基于混合网络的人脸识别方法,通过人脸识别训练数据对卷积网络模型和支持向量机进行训练后,采用已训练的卷积网络模型和支持向量机,对待检测人脸图像进行识别,提高了对人脸数据识别的准确性和精度,提高了人脸识别的效果。
46.以下通过一个实施例,对本技术提供的一种基于混合网络的人脸识别方法进行说明。
47.请参考图1,图1为本技术实施例所提供的一种基于混合网络的人脸识别方法的流程图。
48.本实施例中,该方法可以包括:
49.s101,采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机;
50.本步骤旨在采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机。
51.其中,卷积网络模型的训练,主要包含了3个操作:网络参数初始化、卷积网络的前向传播、卷积网络的反向传播。
52.其中,网络参数初始化:在卷积神经网络中,参数量较庞大,加上存在非凸损失函数,这都为cnn(convolutional neural network,卷积神经网络)模型训练带来了一定的难度。如果选用的参数初始化手段达到要求,则能够在短时间内完成收敛任务。
53.其中,卷积网络的前向传播:卷积网络的前向传播就是许多个卷积核在原图像上做卷积的过程,卷积得出来的结果就称为图像的某一层特征图,也可以理解为人脸图像的特征图,经过层层卷积,池化后,原图像卷积为一个点,多个卷积核就构成高维特征向量,然后经过分类器识别得出结果,这就是卷积网络的前向传播。
54.其中,卷积网络的反向传播:由于初始化时,网络中的参数是随机取数,网络输出的结果与实际值有较大的误差,因此需要从误差开始层层求导,使用梯度下降的方法对网络中的各个参数进行修正,来达到最小的误差,这个求导的过程即为反向传播。
55.进一步的,本实施例中的卷积网络模型加入dropout层,该dropout即“丢弃”。该dropout层的基本操作原理是:任意选取隐含层节点,并将其权重设定为停止状态。此时,可以认为在网络结构中,并不存在此类处于停止状态的节点。当然,不能“丢弃”节点权重,仅是暂时不更新,因为可能下一批样本输入时,本身不工作的节点又将连入到网络中对其进行更新了。
56.在实际的训练过程中,先输入一批样本后,随机的删除一部分隐层单元。之后,在bp(back,propagation,反向传播)反向算法指导下,对权值进行更新。当下一批样本输入时,神经网络能需要随机删除一部分隐层单元,但这次删除的可能和前一次不一样,而后仍使用bp反向算法更新参数,重复这样的过程直到训练结束。
57.因此,进一步的,本步骤中对卷积网络进行训练的过程可以包括:
58.步骤1,对卷积网络模型进行网络参数初始化,得到初始化网络;
59.步骤2,采用人脸识别训练数据对初始化网络进行前向传播,得到传播结果;
60.步骤3,基于传播结果和实际结果对初始化网络进行参数更新,得到已训练的卷积网络模型。
61.s102,采用卷积网络模型对待检测人脸图像进行特征提取,得到特征数据;
62.在s101的基础上,本步骤旨在采用卷积网络模型对待检测人脸图像进行特征提取,得到特征数据。也就是,先采用训练好的卷积网络模型对待检测人脸图像进行特征提取,得到特征数据。
63.其中,进行操作的过程可以采用现有技术提供的任意一种特征提取过程,在此不做具体限定。
64.s103,采用已训练的支持向量机对特征数据进行分类,得到人脸识别结果。
65.在s102的基础上,本步骤旨在,采用已训练的支持向量机对特征数据进行分类,得到人脸识别结果。
66.其中,支持向量机分类识别,主要是在特征空间中,采用支持向量机(support vector machine,svm)为间隔最大线性分类器。为了更好的认知svm的运行,本实施例选择了线性分类器。如果不同的两类数据集同时分布于二维平面,且存在着线性可分特点。如果要区分两大数据集,仅通过直线就能够完成。如果是在一个三维,或者更高纬度的平面,那这条直线也就变成了一个超平面。
67.进一步的,本实施例中,获取待检测人脸图像的过程,可以包括:
68.步骤1,对原始图像进行人脸检测处理,获得人脸区域;
69.步骤2,对原始图像中的人脸区域进行矫正和预处理,获得待检测人脸图像。
70.进一步的,上一获取待检测人脸图像的过程,可以包括:
71.步骤1,对原始图像进行灰度处理和滤波处理,获得预处理原始图像;
72.步骤2,采用已训练的人脸检测模型对预处理原始图像进行人脸检测,获得人脸区域。
73.步骤3,对原始图像进行灰度处理和滤波处理,获得预处理原始图像;
74.步骤4,采用已训练的人脸检测模型对预处理原始图像进行人脸检测,获得人脸区域。
75.举例说明,本实施例中对图像进行处理的过程可以包括:
76.步骤1,输入待测人脸图像,对图像做灰度处理,r、g、b三通道的图像,经过不同的权重占比得到图像的灰度图,缩小图像所需的存储空间。
77.步骤2,图像滤波处理,本实施例使用3x3窗口的中值滤波,窗口在灰度图像上滑动,窗口中心点的值取领域内9个点的中间值,输出中值滤波后的图像。中值滤波能够消除灰度图像里部分噪声点,为后续识别做准备。
78.步骤3,导入已经训练好的haar-cascade模型,该模型由若干个强分类器串联而成,对于待测的输入图像,需要通过所有强分类器才会被模型认为是人脸的区域,一旦前面有一个强分类器未通过,则会直接跳过后面的强分类器,这样做也是为了加快算法速度。而每个强分类器又由若干个弱分类器组成,对于深度为1的弱分类器有1个阈值,计算待测图像的haar积分图,于阈值比较,得到弱分类器的输出值,所有弱分类器的输出值相加就能够得到强分类器的阈值。该算法模型通过多个强分类器和弱分类器的联合,能够更加准确有效的检测到图像的人脸区域。
79.步骤4,人脸区域的最终确定,对于上一步骤初步筛选出来的人脸区域,可能存在多个区域,这时需要从这些区域中找到一个最合适的区域,本实施例采用聚类的方法,首先计算各个区域的iou(intersection over union,重叠度)值,根据阈值去除重合的区域,最后得到少量个区域,本实施例采用简单的判断,选出最终的人脸区域。
80.步骤5,图像裁剪,缩放到指定尺寸。对于上面步骤得到的人脸区域,为了方便后续的人脸识别,需要对这些区域的尺寸进行统一的裁剪和缩放。为了后续图像做分块的处理,通常会把图像尺寸统一为2或者3的倍数。
81.步骤6,图像插值算法,在图像裁剪和缩放过程中,对于坐标不是正整数的像素点,一般采用插值算法,计算得到该点缩放后的像素值。本实施例采用二次插值的算法,在x方向和y方向分别做一次插值算法,根据该点有周围4个点的像素值做加权平均,即可得到该点缩放后的像素值,权值系数为该点与其他4个点的距离。图像插值算法使得缩放后的图像更加平滑,对后续的人脸识别的正确率提升明显。
82.综上,本实施例通过人脸识别训练数据对卷积网络模型和支持向量机进行训练后,采用已训练的卷积网络模型和支持向量机,对待检测人脸图像进行识别,提高了对人脸数据识别的准确性和精度,提高了人脸识别的效果。
83.以下通过一个具体的实施例,对本技术提供的一种基于混合网络的人脸识别方法做进一步说明。
84.本实施例中,该方法可以包括:
85.步骤1,输入待测人脸图像,对图像做灰度处理,r、g、b三通道的图像,经过不同的权重占比得到图像的灰度图,缩小图像所需的存储空间。
86.步骤2,图像滤波处理,本实施例使用3x3窗口的中值滤波,窗口在灰度图像上滑动,窗口中心点的值取领域内9个点的中间值,输出中值滤波后的图像。中值滤波能够消除灰度图像里部分噪声点,为后续识别做准备。
87.步骤3,导入已经训练好的haar-cascade模型,该模型由若干个强分类器串联而成,对于待测的输入图像,需要通过所有强分类器才会被模型认为是人脸的区域,一旦前面有一个强分类器未通过,则会直接跳过后面的强分类器,这样做也是为了加快算法速度。而每个强分类器又由若干个弱分类器组成,对于深度为1的弱分类器有1个阈值,计算待测图
像的haar积分图,于阈值比较,得到弱分类器的输出值,所有弱分类器的输出值相加就能够得到强分类器的阈值。该算法模型通过多个强分类器和弱分类器的联合,能够更加准确有效的检测到图像的人脸区域。
88.步骤4,图像裁剪,缩放到指定尺寸。对于上面步骤得到的人脸区域,为了方便后续的人脸识别,需要对这些区域的尺寸进行统一的裁剪和缩放。为了后续图像做分块的处理,通常会把图像尺寸统一为2或者3的倍数。
89.步骤5,图像插值算法,在图像裁剪和缩放过程中,对于坐标不是正整数的像素点,一般采用插值算法,计算得到该点缩放后的像素值。本实施例采用二次插值的算法,在x方向和y方向分别做一次插值算法,根据该点有周围4个点的像素值做加权平均,即可得到该点缩放后的像素值,权值系数为该点与其他4个点的距离。图像插值算法使得缩放后的图像更加平滑,对后续的人脸识别的正确率提升明显。
90.步骤6,网络参数初始化,在卷积神经网络中,参数量较庞大,加上存在非凸损失函数,这都为cnn模型训练带来了一定的难度。如果选用的参数初始化手段达到要求,则能够在短时间内完成收敛任务。
91.步骤7,卷积网络的前向传播,卷积网络的前向传播就是许多个卷积核在原图像上做卷积的过程,卷积得出来的结果就称为图像的某一层特征图,也可以理解为人脸图像的特征图,经过层层卷积,池化后,原图像卷积为一个点,多个卷积核就构成高维特征向量,然后经过分类器识别得出结果,这就是卷积网络的前向传播。
92.步骤8,卷积网络的反向传播,由于初始化时,网络中的参数是随机取数,网络输出的结果与实际值有较大的误差,因此需要从误差开始层层求导,使用梯度下降的方法对网络中的各个参数进行修正,来达到最小的误差,这个求导的过程即为反向传播。
93.步骤9,dropout技术层,dropout即“丢弃”,其基本操作原理是:任意选取隐含层节点,并将其权重设定为停止状态。此时,可以判定在网络结构中,并不存在此类处于停止状态的节点。当然,不能“丢弃”节点权重,仅是暂时不更新,因为可能下一批样本输入时,本身不工作的节点又将连入到网络中对其进行更新了。在训练的过程中,先输入一批样本后,随机的删除一部分隐层单元。之后,在bp反向算法指导下,对上图右侧权值进行更新。当下一批样本输入时,神经网络能需要随机删除一部分隐层单元,但这次删除的可能和前一次不一样,而后仍使用bp反向算法更新参数,重复这样的过程直到训练结束。
94.步骤10,支持向量机分类识别,在特征空间中,支持向量机(support vector machine,svm)为间隔最大线性分类器。为了更好的认知svm的运行,本实施例选择了线性分类器。如果不同的两类数据集同时分布于二维平面,且存在着线性可分特点。如果要区分两大数据集,仅通过直线就能够完成。如果是在一个三维,或者更高纬度的平面,那这条直线也就变成了一个超平面。
95.其中,haar-cascade检测模型它是一种机器学习的方法,通过许多正负样例中训练得到的参数,然后应用于其他未被训练的图像,最终判断该图像是否为人脸的方法。该模型的训练过程大致为:
96.首先,算法需要许多正样例(包含人脸的图像)和负样例(不包含人脸的图像)来训练分类器,也就是上文提到的弱分类器。然后从这些图片中获取haar特征,haar特征与卷积核类似,每个特征由白方块区域的像素和减去黑方块区域的像素和来得到特征值。但是每
个核的尺寸和位置有很多种可能,对于一个24x24尺寸的滑动窗口特征数就超过16万个,训练复杂度极高,因此需要筛选检测分类结果最优的haar特征,本发明adaboost的方法,将每个特征都应用于所有训练集图像中,对于每个特征,找出人脸图像分类效果最好的阈值,也就是选择分类错误率最小的那些特征,这些特征能够更好的将人脸图像和非人脸图像区分开,实际操作时,每个haar特征初始时给定相同的权重,每次分类后,提升被分类错误的权重,然后再根据新的权重分类,计算出新的错误率和新的权重,直到错误率满足要求或者达到最大的迭代次数。这些权重就是弱分类器的权重,加权和就是强分类器的阈值。最后一个强分类器就训练完成了,重复上述步骤,可以训练得到多个强分类器。
97.训练结束后,保存所有弱分类器和强分类器的阈值参数,haar特征参数,使用检测模型的时候,需要先读取模型参数。检测人脸时,可细分为3个步骤来判断是否为人脸:
98.步骤一:每一个循环中需要缩放图像,因为haar-cascade训练图像的大小一般固定为20x20尺寸的图像,实际采样得到的图像可能为320x240、640x480等多种常用尺寸,为了适应模型参数,每一次循环都需要缩放待测图像。
99.步骤二:用20x20的窗口遍历待测图像,读取每一个弱分类器的参数,包括左上角坐标x,y,长宽w,h以及权重,阈值,输出值。有了这些参数后,需要计算出每一个特征值,本实施例采用积分图的方法快速得到该值。
100.步骤三:将弱分类器得到的特征值乘以权重,求和,得到的加权和与强分类器的阈值比较,若加权和大于阈值,则通过该强分类器,否则跳出循环,移动窗口计算下一个区域;只有当该区域通过所有的强分类器,保存当前区域的x,y,w,h,视为待选区域。
101.请参考图2,图2为本技术实施例所提供的一种卷积网络模型的结构示意图。
102.进一步的,在人脸检测完成后,将保存好的人脸区域送入附图2所示的卷积网络中,具体步骤如下:
103.(一)卷积网络的训练
104.步骤一,网络参数初始化:在卷积神经网络中,参数量较庞大,加上存在非凸损失函数,为cnn模型训练带来了一定的难度。如果选用的参数初始化手段达到要求,则能够在短时间内完成收敛任务。因此,本实施例中的网络权重可以如下:
[0105][0106]
其中,权重为w,网络第j层尺寸为nj,区间中的均匀分布为u[-a,a]。
[0107]
步骤二,卷积网络的前向传播:本实施例使用的数据集,此图像集有50000张训练图片以及10000张测试图像,在前向传播方面,普通神经网络、卷积神经网间具有非常大的相似性。卷积神经网络存在降采样层、卷积层,普通神经网络存在全连接式层间关系。但这并不影响到传递的方向,即在二者各有的连接形式前提下,通过由前往后的形式传播。
[0108]
向前传播的公式可以如下:
[0109]
neti=xw
[0110]
yi=f(neti)=f(xw)。
[0111]
步骤三:卷积层的梯度下降,主要对卷积过程开展分析,可通过以下算式直观得到:
[0112][0113]
其中,第1层第i幅特征图偏置是在第i幅特征图中,其内部的第j个卷积核参数矩阵是
[0114]
对上式进行分析发现,b偏置值是存在于所有特征图中的。当然,受到差异化的卷积核的影响,必然会存在各式各样的特征图像输出结果。例如,利用输入层中i特征图,在卷积之后可求出k、j。之所以出现两种卷积结果,就在于利用了不同的卷积核。
[0115]
以最后一层为起点开展的传播被称为反向传播。下采样层紧跟着卷积层出现,二者的关系为“二对一映射”。这说明,在下采样层中,单个节点会同卷基层所有节点存在关联。在单个节点间,由必然存在误差,并在相互交织中出现了误差网或信号网。在卷积层上,也必然存在不同的区域对应误差信号。这说明,只有在采样完成了下层误差信号图之后,才可能得到首层误差。将束层误差乘以偏导数,便有以下算式:
[0116][0117]
在进行核函数梯度的分析中,求解的方式为反向求导,其基本公式是:
[0118][0119]
与卷积中的存在乘积的区域表达为通过卷积核与上层(u,v)点patch相乘,便可得到卷积图(u,v)的具体坐标。
[0120]
步骤四:池化层的梯度下降。具体的,在下采样层中,无论输入,还是输出,二者都拥有一致的特征图像。当然,受到下采样的种种制约,在图像的大小上,输出侧明显更小。在讨论下采样时,参考算式是:
[0121][0122]
其中,下采样函数表达为down。在down中,会在特定区域对输入图像进行求和处理,之后,再同β(缩放倍数)相乘。之后,再求同b(偏差)的和。
[0123]
在开展下采样偏导数的求解中,其基本前提是对误差信号图的求解。很明显,卷积层分布于下采样层的上下层,所以要先找到输出的某个区域对应在输出的那个像素点,这里使用到全卷积的计算:
[0124][0125]
其中,第l 1层第k个卷积核表示为全卷积函数是conv2(a,b,'full')。对b、β梯度进行计算。
[0126]
在误差信号图中,将所有的元素相加便可得到b,公式:
[0127][0128]
本层在前向传播式存在的最初下采样图对β有直接影响。前向计算时,采样图也得到了保留。这说明,没有必要在反向传播时再次求解:
[0129][0130]
最终,误差对β的梯度就可以表示为:
[0131][0132]
经过多次训练后,卷积网络模型趋近于收敛。
[0133]
(二)dropout技术层
[0134]
其中,dropout即“丢弃”,其基本操作原理是:任意选取隐含层节点,并将其权重设定为停止状态。此时,可以认为在网络结构中,并不存在此类处于停止状态的节点。当然,不能“丢弃”节点权重,仅是暂时不更新,因为可能下一批样本输入时,本身不工作的节点又将连入到网络中对其进行更新了。
[0135]
在训练的过程中,先输入一批样本后,随机的删除一部分隐层单元。之后,在bp反向算法指导下,对权值进行更新。当下一批样本输入时,神经网络能需要随机删除一部分隐层单元,但这次删除的可能和前一次不一样,而后仍使用bp反向算法更新参数,重复这样的过程直到训练结束。
[0136]
从单个神经元角度考虑,没有dropout的神经网络中神经元输入输出的数学关系为:
[0137][0138]
神经元输入、输出可以在dropout层引入之后变为以下算式:
[0139][0140]
具体训练时,应当先假设存在概率p使得单个输出节点存在0的状态,即dropout ratio=p。若各输出满足二项伯努利分布b~(1-p),且存在着相互独立性,则输出的比例为(1-p)。
[0141]
在开展具体的测试中,应当反复性的对单张图片开展m次测试,并保留dropout层,而最终的结果便是m次中的均值。若节点数为n,则有r=2
……
n的可能性。在r>m的情况下,说明平均结果不达标;如果m≈n,那么计算量就太大了。因此,可以近似处理。也就是,使用
全部的输出,排除dropout层,对齐尺度,按照r=r*(1-p)进行输出。
[0142]
(三)支持向量机
[0143]
在特征空间中,支持向量机(support vector machines,svm)为间隔最大线性分类器。为了更好的认知svm的运行,有必要通过案例的形式加以探讨。在这里,选择了线性分类器。如果不同的两类数据集同时分布于二维平面,且存在着线性可分特点。如果要区分两大数据集,仅通过直线就能够完成。如果是在一个三维,或者更高纬度的平面,那这条直线也就变成了一个超平面。
[0144]
如果存在线性可分数据集,这也必然存在超平面。即通过|w
t
x b|=0,能够最大化的间隔两侧数据。可见,求出的超平面间隔也应当保持最大化。在超平面同x间距求解时,由|w
t
x b|来代表。在探讨分类的正确性时,参考y(w
t
x b)正负做出最终的判断。定义函数间隔为:
[0145][0146]
观察上式,发现其存在缺点,即在保持超平面固定的前提下,以相同的比例来变动b、w之后,将直接调整||f(x)||(函数间隔)值。为了避免此类情况的出现,应当提供新的条件来约束w法向量,并对超平面、点间的距离进行再次设计。在这里,如果超平面上存在x的垂直的投影点即x0;而在超平面上,也存在垂直向量w;分类平面同x样本间距设计为γ,可得出以下算式:
[0147][0148]
其中,x0是超平面上的点,所以f(x0)=0;代入方程w
t
x b=0,可得:
[0149][0150]
与函数间隔一样,可以定义几何间隔如下:
[0151][0152]
可见,在函数间隔除||w||之后,便可得到几何间隔这说明,从直观角度看,超平面、点间距离为||f(x)||/||w||。如果没有特别要求,在探讨分类预测信度时,通常以超平面、点之间距离值作为判断标准。
[0153]
在svm数据划分操作中,需要从存在最大入手寻找超平面,即按照以下算式求解:
[0154]
[0155]
上式,训练样本为xi,相应标签是yi。因如果存在不变的那么可以从最小||w||的角度来进行最大值求解。下式为等价约束优化公式:
[0156][0157]
观察上式,发现从qp优化角度出发,通过对最小值||w||求解,便得到最大在操作中,求解的手段多为拉格朗日对偶法。在求解难度上,对偶问题比较简单。因为存在非线性分类现象,在对偶法下实现了核函数的有效利用。在目标函数,可融入约束条件,操作算式如下:
[0158]
当ai≥0,i=1,2,...,n。
[0159]
对上式求偏导:
[0160][0161]
将其带入公式可得:
[0162][0163]
在对偶问题最优化操作上,主要需开展对a极值的求解,可得b、w。这样,所得拉格朗日函数仅存在a。参考wolf对偶原理,利用上式,开展最优化问题分析,算式如下:
[0164]

[0165]
上式主要求解凸二次规划问题,由不等式约束,这限制了其解的单一性。根据解得的ai得到决策函数表达式为:
[0166][0167]
可见,本实施例通过人脸识别训练数据对卷积网络模型和支持向量机进行训练后,采用已训练的卷积网络模型和支持向量机,对待检测人脸图像进行识别,提高了对人脸数据识别的准确性和精度,提高了人脸识别的效果。
[0168]
下面对本技术实施例提供的基于混合网络的人脸识别装置进行介绍,下文描述的
基于混合网络的人脸识别装置与上文描述的基于混合网络的人脸识别方法可相互对应参照。
[0169]
请参考图3,图3为本技术实施例所提供的一种基于混合网络的人脸识别装置的结构示意图。
[0170]
本实施例中,该装置可以包括:
[0171]
模型训练模块100,用于采用人脸识别训练数据对基于dropout层的卷积网络模型和支持向量机进行训练,得到已训练的卷积网络模型和已训练的支持向量机;
[0172]
特征提取模块200,用于采用卷积网络模型对待检测人脸图像进行特征提取,得到特征数据;
[0173]
向量机分类模块300,用于采用已训练的支持向量机对特征数据进行分类,得到人脸识别结果。
[0174]
可选的,该装置还可以包括:
[0175]
人脸检测模块,用于对原始图像进行人脸检测处理,获得人脸区域;
[0176]
区域矫正模块,用于对原始图像中的人脸区域进行矫正和预处理,获得待检测人脸图像。
[0177]
可选的,该人脸检测模块,具体用于对原始图像进行灰度处理和滤波处理,获得预处理原始图像;采用已训练的人脸检测模型对预处理原始图像进行人脸检测,获得人脸区域。
[0178]
本技术实施例还提供一种服务器,包括:
[0179]
存储器,用于存储计算机程序;
[0180]
处理器,用于执行所述计算机程序时实现如以上实施例所述的人脸识别方法的步骤。
[0181]
本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的人脸识别方法的步骤。
[0182]
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0183]
专业人员还可以进一步意识到,结合本实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0184]
结合本实施例中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0185]
以上对本技术所提供的一种基于混合网络的人脸识别方法、人脸识别装置、服务器以及计算机可读存储介质进行了详细介绍。本实施例中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献