一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于数据增强的人脸识别方法、装置、设备及存储介质与流程

2022-12-02 22:46:47 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种基于数据增强的人脸识别方法、装置、设备及存储介质。


背景技术:

2.随着互联网技术的不断发展,人工智能算法在各种生产系统中应用越来越广泛,也对人工智能提出了越来越高的精度要求,人脸识别技术是最受关注的生物特征识别技术之一,近年来,人脸识别技术得到了迅猛发展,大量有关人脸识别技术的应用落地,
3.但是,随着人脸数据集的不断增加,模型精度也在不断提升,但是由于足够泛化的模型很难实现,在特定场景下的精度经常表现出不足,同时,人脸数据的收集也越加困难,很难得到指定场景的数据去进行基于数据增强的人脸识别,少量的样本很难实现指定场景下的高精度,使得在基于数据增强的人脸识别时泛化能力不足,导致人脸识别准确度下降。


技术实现要素:

4.本发明实施例提供了一种基于数据增强的人脸识别方法、装置、设备及存储介质,用于提升基于数据增强的人脸识别的泛化性和预测准确度。
5.本发明第一方面提供了一种基于数据增强的人脸识别方法,包括:从预置的数据库中获取通用人脸数据集及特定人脸数据集,其中,所述通用人脸数据集及所述特定人脸数据集用于模型训练;对所述通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;当所述比值数据小于预设阈值时,对所述特定人脸数据集进行数据增广处理,得到增广数据集;通过所述增广数据集对预置的神经网络模型进行训练,得到人脸识别模型;获取待识别图片,并将所述待识别图片输入所述人脸识别模型进行识别,得到人脸识别结果。
6.可选的,在本发明第一方面的第一种实现方式中,所述对所述特定人脸数据集进行数据增广处理,得到增广数据集包括:从预置的数据增广策略库中按照预设规则获取多个数据增广策略;对所述特定人脸数据集进行预处理,得到标准数据集;根据所述标准数据集对每一所述数据增广策略进行图像分类误差计算,得到误差数据集合;基于所述误差数据集合通过预置的优化函数对所述多个数据增广策略进行筛选,得到目标数据增广策略;根据所述目标数据增广策略对所述标准数据集进行数据增广处理,得到增广数据集。
7.可选的,在本发明第一方面的第二种实现方式中,所述对所述特定人脸数据集进行预处理,得到标准数据集包括:对所述特定人脸数据集中的每一图片进行标准化处理,得到与每一图片对应的像素值矩阵;对于每一图片对应的像素值矩阵进行零像素值填充,得到每一图片对应的填充图像;按照预设的尺寸对每一图片进行随机分割处理,得到裁剪图片集合;对所述裁剪图片集合中每一图片进行镜像翻转,得到标准数据集。
8.可选的,在本发明第一方面的第三种实现方式中,所述根据所述标准数据集对每一所述数据增广策略进行图像分类误差计算,得到误差数据集合包括:根据每一所述数据
增广策略对所述标准数据集进行数据增广,得到标准增广数据集;通过预置的残差网络模型对所述标准增广数据集进行图像分类误差计算,得到误差数据集合。
9.可选的,在本发明第一方面的第四种实现方式中,所述通过所述增广数据集对预置的神经网络模型进行训练,得到人脸识别模型包括:将所述增广数据集输入预置的特征解耦模型进行解耦处理,得到泛化数据集包括:基于所述增广数据集对所述特征解耦模型进行参数分析,得到对应的模型网络参数;基于所述模型网络参数通过所述特征解耦模型对所述增广数据集进行特征分离,得到特征分离后的增广数据集;对所述增广数据集进行特征组合,得到泛化数据集;将所述泛化数据集及所述通用人脸数据集输入所述神经网络模型进行训练,得到人脸识别模型。
10.可选的,在本发明第一方面的第五种实现方式中,所述基于所述增广数据集对所述特征解耦模型进行参数分析,得到对应的模型网络参数的网络参数包括:对所述增广数据集进行样本构造,确定与所述增广数据对应的正负例样本;对所述正负例样本进行特征向量分析,得到目标特征向量;通过所述目标特征向量对所述特征解耦模型进行参数分析,得到对应的模型网络参数。
11.可选的,在本发明第一方面的第六种实现方式中,所述将所述泛化数据集及所述通用人脸数据集输入所述神经网络模型进行训练,得到人脸识别模型包括:将所述通用人脸数据集输入所述神经网络模型进行训练,得到候选网络模型;将所述泛化数据集输入所述候选网络模型进行分析,得到预测结果;基于所述预测结果通过预置的损失函数对所述候选网络模型进行优化,得到人脸识别模型。
12.本发明第二方面提供了一种基于数据增强的人脸识别装置,包括:获取模块,用于从预置的数据库中获取通用人脸数据集及特定人脸数据集,其中,所述通用人脸数据集及所述特定人脸数据集用于模型训练;分析模块,用于对所述通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;处理模块,用于当所述比值数据小于预设阈值时,对所述特定人脸数据集进行数据增广处理,得到增广数据集;训练模块,通过所述增广数据集对预置的神经网络模型进行训练,得到人脸识别模型;识别模块,用于获取待识别图片,并将所述待识别图片输入所述人脸识别模型进行识别,得到人脸识别结果。
13.可选的,在本发明第二方面的第一种实现方式中,所述处理模块具体包括:
14.获取单元,用于从预置的数据增广策略库中按照预设规则获取多个数据增广策略;
15.处理单元,用于对所述特定人脸数据集进行预处理,得到标准数据集;
16.计算单元,用于根据所述标准数据集对每一所述数据增广策略进行图像分类误差计算,得到误差数据集合;
17.筛选单元,用于基于所述误差数据集合通过预置的优化函数对所述多个数据增广策略进行筛选,得到目标数据增广策略;
18.增广单元,用于根据所述目标数据增广策略对所述标准数据集进行数据增广处理,得到增广数据集。
19.可选的,在本发明第二方面的第二种实现方式中,所述处理单元具体用于:对所述特定人脸数据集中的每一图片进行标准化处理,得到与每一图片对应的像素值矩阵;对于每一图片对应的像素值矩阵进行零像素值填充,得到每一图片对应的填充图像;按照预设
的尺寸对每一图片进行随机分割处理,得到裁剪图片集合;对所述裁剪图片集合中每一图片进行镜像翻转,得到标准数据集。
20.可选的,在本发明第二方面的第三种实现方式中,所述计算单元具体用于:根据每一所述数据增广策略对所述标准数据集进行数据增广,得到标准增广数据集;通过预置的残差网络模型对所述标准增广数据集进行图像分类误差计算,得到误差数据集合。
21.可选的,在本发明第二方面的第四种实现方式中,所述训练模块具体包括:
22.分析单元,用于基于所述增广数据集对所述特征解耦模型进行参数分析,得到对应的模型网络参数;
23.分离单元,用于基于所述模型网络参数通过所述特征解耦模型对所述增广数据集进行特征分离,得到特征分离后的增广数据集;
24.组合单元,用于对所述增广数据集进行特征组合,得到泛化数据集;
25.训练单元,用于将所述泛化数据集及所述通用人脸数据集输入所述神经网络模型进行训练,得到人脸识别模型。
26.可选的,在本发明第二方面的第五种实现方式中,所述分析单元具体用于:对所述增广数据集进行样本构造,确定与所述增广数据对应的正负例样本;对所述正负例样本进行特征向量分析,得到目标特征向量;通过所述目标特征向量对所述特征解耦模型进行参数分析,得到对应的模型网络参数。
27.可选的,在本发明第二方面的第六种实现方式中,所述训练单元具体用于:将所述通用人脸数据集输入所述神经网络模型进行训练,得到候选网络模型;将所述泛化数据集输入所述候选网络模型进行分析,得到预测结果;基于所述预测结果通过预置的损失函数对所述候选网络模型进行优化,得到人脸识别模型。
28.本发明第三方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的基于数据增强的人脸识别方法。
29.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于数据增强的人脸识别方法。
30.本发明提供的技术方案中,将人脸样本数据按类型进行划分,并在不同类型的人脸样本数据中获取相同数量的数据,在通用人脸数据集中采取均匀采样的方式,可以避免训练数据分布不均的问题,服务器将增广数据集输入预置的特征解耦模型进行解耦处理,得到泛化数据集,当样本差异比较小同时特定场景数据集数量少的,可以在损失值下降到接近训练完成时再给入特定人脸数据集,样本差异比较大或者特定场景数据集比较多时,可以在损失值刚有下降时即开始输入特定场景的数据,并根据该泛化数据集对神经网络训练一定次数,使模型在指定场景中具有高精度,得到的泛化数据集输入样本分类器网络中进行训练,最后得到经过训练样本分类器网络,提升人脸检测模型在不同域中的泛化能力。
附图说明
31.图1为本发明实施例中基于数据增强的人脸识别方法的一个实施例示意图;
32.图2为本发明实施例中基于数据增强的人脸识别方法的另一个实施例示意图;
33.图3为本发明实施例中基于数据增强的人脸识别装置的一个实施例示意图;
34.图4为本发明实施例中基于数据增强的人脸识别装置的另一个实施例示意图;
35.图5为本发明实施例中计算机设备的一个实施例示意图。
具体实施方式
36.本发明实施例提供了一种基于数据增强的人脸识别方法、装置、设备及存储介质,在指定场景的数据量比较少时尽快训练模型,不同类型在不同训练域中的分布得到预训练和模型微调的效果,提升基于数据增强的人脸识别的泛化性和预测准确度。
37.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
38.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术和机器学习/深度学习等几大方向。
39.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于数据增强的人脸识别方法的一个实施例包括以下步骤101-105:
40.101、从预置的数据库中获取通用人脸数据集及特定人脸数据集,其中,通用人脸数据集及特定人脸数据集用于模型训练;
41.可以理解的是,本发明的执行主体可以为基于数据增强的人脸识别装置,还可以是服务器,具体此处不作限定。本发明实施例以服务器为执行主体为例进行说明。
42.需要说明的是,本发明实施例中,通用人脸数据集为不限定场景的人脸样本数据,特定人脸数据集指的是限定场景的人脸样本数据,其中,人脸样本数据包括不同人种、年龄、性别的样本数据,本技术实施例中,为了避免训练数据分布不均的问题,在通用人脸数据集中采取均匀采样的方式,将人脸样本数据按类型进行划分,并在不同类型的人脸样本数据中获取相同数量的数据。具体的,服务器从预置的数据库中进行数据遍历处理,确定对应的特点场景标识,进而服务器根据该特定场景标识获取特定人脸数据集并采集通用人脸数据集,需要强调的是,为进一步保证上述通用人脸数据集的私密性和安全性,上述运动视频帧集合还可以存储于一区块链的节点中。
43.102、对通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;
44.需要说明的是,根据特定人脸数据集在通用人脸数据集中所占比例大小可以对训练过程中训练样本的数据类型进行动态调整,需要说明的是,根据特定场景的人脸数据与通用数据集样本差异性,一般可以设置经过固定次数的训练或以损失值下降到一定程度作
为标记,样本差异比较小同时特定场景数据集数量少的,可以在损失值下降到接近训练完成时再给入特定数据集,样本差异比较大或者特定场景数据集比较多时,可以在损失值刚有下降时即开始输入特定场景的数据,在下一个训练过程中使指定数据集的样本占训练样本总数据凉的50%以上,本发明实施例中,服务器对通用人脸数据集及特定人脸数据集进行比值计算,得到比值数据,以便于后续服务器根据上述比值数据对训练过程中的训练样本数据类型进行动态调整。
45.103、当比值数据小于预设阈值时,对特定人脸数据集进行数据增广处理,得到增广数据集;
46.需要说明的是,数据增广也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。本发明根据上述的比值数据进行数值分析,其中,该比值数据指的是将特定人脸数据集的数据量除通用人脸数据集的数据量,得到比值数据,当比值数据小于预设阈值时,根据预置的数据增广策略对该特定人脸数据集进行增广处理,具体的,该数据增广策略数据增广是指对数据施加一个或多个数据变换操作,来获得新的数据。例如,对图片数据,可以旋转一个角度,对于训练样本,数据增广后对应的标签可以保持不变,增广策略是指进行数据增广的策略,增广策略对应的策略参数可以包括增广操作的类型、增广操作的选择概率或者增广操作的强度的至少一个。增广操作的类型根据数据的类型确定,对于图像,可以包括旋转变换、平移变换或者区域裁剪的至少一个。增广操作的选择概率是指增广操作在增广策略中被执行的概率。例如,假设增广操作的概率为0.2,则表示该增广操作被选中的概率为0.2。增广操作的强度是指对数据进行增广操作时所采用的强度。对于文本,强度可以用词语变换的个数或者比例确定。例如,对于一个句子,如果增广操作为单词删除,强度为2,则表示这个句子中有2个单词需要删除。对于图像,强度可以用旋转的角度的大小、裁剪的区域的大小或者平移的大小确定。例如,假设旋转强度为60度,则表示选择执行图像旋转操作时,需要旋转图像60度,当上述比值数据小于预设阈值时,服务器采用上述增广策略对特定人脸数据集进行数据增广处理,得到该增广数据集。
47.104、通过增广数据集对预置的神经网络模型进行训练,得到人脸识别模型;
48.需要说明的是,服务器通过一定量通用人脸数据集对模型进行初步训练,根据特定场景的数据与通用人脸数据集样本差异性,一般可以设置经过固定次数训练或以损失值下降到预设阈值作为中间阶段,样本差异比较小同时特定场景数据集数量少的,可以在损失值下降到接近训练完成时再给入特定人脸数据集,样本差异比较大或者特定场景数据集比较多时,可以在损失值刚有下降时即开始输入特定场景的数据,在下一个训练过程中使指定数据集的样本占当次训练数据样本数量的50%以上进行基于数据增强的人脸识别,直至模型收敛,得到人脸识别模型。
49.105、获取待识别图片,并将待识别图片输入人脸识别模型进行识别,得到人脸识别结果。
50.需要说明的是,基于卷积神经网络的方法缺乏大量数据集作为依托,使得网络过拟合,在开放环境下无法达到较高的识别率,传统的数据增强方法多是在原有身份上进行的变化,缺乏简便有效的新身份人脸信息的获取方式。为此,本发明提出了一种基于数据增强的三维人脸识别方法,以单张人脸图像的三维人脸重建技术为基础实现数据增强,增加
新的身份,构建了简单高效的人脸识别系统,在提高准确率的同时,也解决了小规模数据集训练卷积神经网络容易出现的过拟合问题,具体的,获取待识别图片,在本技术实施例中,可以从优化后的人脸图像中提取出对应的眼睛特征、或者从优化后的人脸图像中提取出对应的鼻子特征等,基于对眼睛特征进行特征提取的方法为常规方法,或者,对鼻子特征进行特征提取的方法为常规方法,在此不再赘述,分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对及识别,输出对应的人脸识别结果。在一种可能的实现方式中,分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对及识别,输出对应的人脸识别结果包括以下步骤:分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对,得到对应的特征相似度,判断多个人脸特征中的任意一个人脸特征是否符合预设条件,预设条件包括任意一个人脸特征与存储数据库中任意一张预存人脸的人脸特征之间的特征相似度大于或等于预设特征相似度阈值、且该人脸特征为至少一项五官特征,则判断符合预设条件的存储数据库中的预存人脸为优化后的人脸图像中的目标人脸,输出对应的人脸识别结果。
51.本发明实施例中,将人脸样本数据按类型进行划分,并在不同类型的人脸样本数据中获取相同数量的数据,在通用人脸数据集中采取均匀采样的方式,可以避免训练数据分布不均的问题,服务器将增广数据集输入预置的特征解耦模型进行解耦处理,得到泛化数据集,当样本差异比较小同时特定场景数据集数量少的,可以在损失值下降到接近训练完成时再给入特定人脸数据集,样本差异比较大或者特定场景数据集比较多时,可以在损失值刚有下降时即开始输入特定场景的数据,并根据该泛化数据集对神经网络训练一定次数,使模型在指定场景中具有高精度,得到的泛化数据集输入样本分类器网络中进行训练,最后得到经过训练样本分类器网络,提升人脸检测模型在不同域中的泛化能力。
52.请参阅图2,本发明实施例中基于数据增强的人脸识别方法的另一个实施例包括以下步骤201-208:
53.201、从预置的数据库中获取通用人脸数据集及特定人脸数据集,其中,通用人脸数据集及特定人脸数据集用于模型训练;
54.具体的,在本实施例中,步骤201的具体实施方式与上述步骤101类似,此处不再赘述。
55.202、对通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;
56.具体的,在本实施例中,步骤201的具体实施方式与上述步骤102类似,此处不再赘述。
57.203、当比值数据小于预设阈值时,对特定人脸数据集进行数据增广处理,得到增广数据集;
58.具体的,服务器从预置的数据增广策略库中按照预设规则获取多个数据增广策略;服务器对特定人脸数据集进行预处理,得到标准数据集;服务器根据标准数据集对每一数据增广策略进行图像分类误差计算,得到误差数据集合;服务器基于误差数据集合通过预置的优化函数对多个数据增广策略进行筛选,得到目标数据增广策略;服务器根据目标数据增广策略对标准数据集进行数据增广处理,得到增广数据集。
59.其中,服务器从预置的数据增广策略库中按照预设规则获取多个数据增广策略;
服务器对特定人脸数据集进行预处理,得到标准数据集,服务器根据标准数据集对每一数据增广策略进行图像分类误差计算,得到误差数据集合,需要说明的是,该优化函数指的是最大化贝叶斯优化的采集函数,需要说明的是,服务器通过预置的内部求解器来找到使获取函数最大化的字符串,内部求解器每次都用一个随机种群来初始化。在内循环的最后,服务器根据获取函数的值对进化求解器的字符串进行排序,并使用最好的字符串作为bo下一次迭代的候选对象。服务器用真实的奖励来评估候选人,并将它们添加到数据集中。在外循环的下一个迭代中,服务器对更新的数据集重新训练回归器,并解决了一个新的获取函数,在内循环的最后,服务器根据获取函数的值对进化求解器产生的历史字符串进行排序,并使用最好的字符串作为下一次迭代的候选对象,进而确定出目标数据增广策略,根据该采集函数对该多个数据增广策略进行筛选,得到目标数据增广策略,将所误差数据集合添加到目标数据增广策略中,对该目标数据增广策略进行更新,进而根据目标数据增广策略对标准数据集进行数据增广处理,得到增广数据集。
60.可选的,对特定人脸数据集进行预处理,得到标准数据集可以包括:服务器对特定人脸数据集中的每一图片进行标准化处理,得到与每一图片对应的像素值矩阵;服务器对于每一图片对应的像素值矩阵进行零像素值填充,得到每一图片对应的填充图像;服务器按照预设的尺寸对每一图片进行随机分割处理,得到裁剪图片集合;服务器对裁剪图片集合中每一图片进行镜像翻转,得到标准数据集合。
61.其中,服务器对数据集中的每一图片执行标准化操作,需要说明的是,图像标准化是将数据通过去均值实现中心化的处理,根据凸优化理论与数据概率分布相关知识,数据中心化符合数据分布规律,更容易取得训练之后的泛化效果,即先计算出训练集中所有图片的均值和标准差,然后对于每一人脸图片,将其像素值减去均值,再除以标准差,得到标准化后的人脸图片,对数据集中的每一图片进行零填充,即对每一人脸图片的像素值矩阵,在每一侧都填充一定数量的零像素值,对数据集中的每一图片进行随机裁剪,即在经过零填充后的人脸图片上进行随机的裁剪,保证数据集中的每一人脸图片都具有同样的尺寸,对数据集中的每一图片进行镜像翻转,得到标准数据集合。
62.可选的,根据标准数据集对每一数据增广策略进行图像分类误差计算,得到误差数据集合可以包括:服务器根据每一数据增广策略对标准数据集进行数据增广,得到标准增广数据集;服务器通过预置的残差网络模型对标准增广数据集进行图像分类误差计算,得到误差数据集合。
63.需要说明的是,残差在数理统计中是指实际观察值与估计值之间的差。在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确,具体的,服务器通过随机初始化的方式,对贝叶斯优化算法进行初始化,并根据每一数据增广策略对标准数据集进行数据增广,进而进行初始误差计算,得到多组初始误差数据,并将该多组初始误差数据输入残差网络模型进行图像分类误差计算,具体的,加权分类误差中包含人脸数据增广权重和分类误差两个因素,当人脸数据增广权重较低时,计算所得的加权分类误差较小,从而降低了易混淆样本对训练结果的影响。在一个实施例中,所述加权分类误差为所述检测框权重与所述第一分类误差的乘积,当服务器通过残差网络模型计算出分类误差后,进而从预置的数据库中获取对应的人脸增广权重,并进一步对人脸增广权重及分类误差求积,进而得到误差数据集合,
64.204、基于增广数据集对特征解耦模型进行参数分析,得到对应的模型网络参数;
65.具体的,服务器对增广数据集进行样本构造,确定与增广数据对应的正负例样本;服务器对正负例样本进行特征向量分析,得到目标特征向量;服务器通过目标特征向量对特征解耦模型进行参数分析,得到对应的模型网络参数。
66.其中,服务器对增广数据集进行样本构造,确定与增广数据对应的正负例样本,依据维度预设权重,计算每条正例样本数据记录中各维度之间相互紧密程度,将强相关的维度分为一组,分别对每组正例样本数据记录中的维度数据进行攻击,生成负例样本数据,进而服务器通过该特征解耦模型中样本分类器网络,对增广数据集进行处理,以确定样本分类器网络的初始参数,需要说明的是,上述样本分类器网络的初始参数包括每个输出的类标签、损失函数计算出来的当前损失值、迭代次数、层数、输出的个数、输出激活函数的名称等参数信息。
67.205、基于模型网络参数通过特征解耦模型对增广数据集进行特征分离,得到特征分离后的增广数据集;
68.具体的,服务器通过与模型网络参数的使用环境相匹配的训练样本,对特征解耦模型进行训练,并通过特征解耦模型,对训练样本的域相关特征和域无关特征进行分离,具体的,服务器对训练样本中的域相关特征进行保存,并将训练样本中的域无关特性进行数据迁移,得到特征分离后的增广数据集合。
69.206、对增广数据集进行特征组合,得到泛化数据集;
70.具体的,服务器通过特征解耦模型的中的编码器子网络,对不同正例训练样本和负例训练样本中的域相关特征重新进行组合,形成重组特征向量,通过特征解耦模型的中的解码器子网络,对重组特征向量进行解码处理,当能够获得相同人脸的不同特征的图像向量时,得到泛化数据集。
71.207、将泛化数据集及通用人脸数据集输入神经网络模型进行训练,得到人脸识别模型;
72.具体的,服务器将通用人脸数据集输入神经网络模型进行训练,得到候选网络模型;服务器将泛化数据集输入候选网络模型进行分析,得到预测结果;服务器基于预测结果通过预置的损失函数对候选网络模型进行优化,得到人脸识别模型。
73.其中,服务器将通用人脸数据集输入神经网络模型进行训练,得到候选网络模型,服务器将泛化数据集输入候选网络模型进行分析,得到预测结果,进而根据该预测结果确定样本分类器网络对应的损失函数,具体的,针对图片集中的每一锚图片,将所述图片集中除所述锚图片之外的剩余图片分为第一类图片和第二类图片,第一类图片中的对象与所述锚图片中的对象具有相同的姿态,第二类图片中的对象与所述锚图片中的对象具有不同的姿态,计算第一类图片中每一图片的特征,并计算所述第二类图片中每一图片的特征。根据所述剩余图片中每一图片的特征,确定与样本分类器网络对应的损失函数对应的损失函数,同时根据样本分类器网络的更新参数,对样本分类器网络的参数进行迭代更新,直至样本分类器网络的损失函数达到相应的收敛条件,得到人脸识别模型。
74.208、获取待识别图片,并将待识别图片输入人脸识别模型进行识别,得到人脸识别结果。
75.具体的,需要说明的是,基于卷积神经网络的方法缺乏大量数据集作为依托,使得
网络过拟合,在开放环境下无法达到较高的识别率,传统的数据增强方法多是在原有身份上进行的变化,缺乏简便有效的新身份人脸信息的获取方式。为此,本发明提出了一种基于数据增强的三维人脸识别方法,以单张人脸图像的三维人脸重建技术为基础实现数据增强,增加新的身份,构建了简单高效的人脸识别系统,在提高准确率的同时,也解决了小规模数据集训练卷积神经网络容易出现的过拟合问题,具体的,从优化后的人脸图像中提取出对应的眼睛特征、或者从优化后的人脸图像中提取出对应的鼻子特征等,基于对眼睛特征进行特征提取的方法为常规方法,或者,对鼻子特征进行特征提取的方法为常规方法,在此不再赘述,分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对及识别,输出对应的人脸识别结果。在一种可能的实现方式中,分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对及识别,输出对应的人脸识别结果包括以下步骤:分别将多个人脸特征中的每一个人脸特征与存储数据库中任意一张预存人脸的人脸特征进行特征比对,得到对应的特征相似度,判断多个人脸特征中的任意一个人脸特征是否符合预设条件,预设条件包括任意一个人脸特征与存储数据库中任意一张预存人脸的人脸特征之间的特征相似度大于或等于预设特征相似度阈值、且该人脸特征为至少一项五官特征,则判断符合预设条件的存储数据库中的预存人脸为优化后的人脸图像中的目标人脸,输出对应的人脸识别结果,得到人脸识别结果。
76.本发明实施例中,服务器通过随机初始化的方式,对贝叶斯优化算法进行初始化,并根据每一数据增广策略对标准数据集进行数据增广,进而进行初始误差计算,得到多组初始误差数据,并将该多组初始误差数据输入残差网络模型进行图像分类误差计算,得到误差数据集合,以通过基模型拟合残差,使得集成的模型变得更精确,服务器对增广数据集进行样本构造,确定与增广数据对应的正负例样本,依据维度预设权重,计算每条正例样本数据记录中各维度之间相互紧密程度,将强相关的维度分为一组;分别对每组正例样本数据记录中的维度数据进行攻击,生成负例样本数据,可以在指定场景的数据量比较少时尽快训练模型,不同类型在不同训练域中的分布得到预训练和模型微调的效果,并保持了模型预训练的泛化性,
77.请参阅图3,本发明实施例中基于数据增强的人脸识别装置的一个实施例包括:
78.获取模块301,用于从预置的数据库中获取通用人脸数据集及特定人脸数据集,其中,所述通用人脸数据集及所述特定人脸数据集用于模型训练;
79.分析模块302,用于对所述通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;
80.处理模块303,用于当所述比值数据小于预设阈值时,对所述特定人脸数据集进行数据增广处理,得到增广数据集;
81.训练模块304,通过所述增广数据集对预置的神经网络模型进行训练,得到人脸识别模型;
82.识别模块305,用于获取待识别图片,并将所述待识别图片输入所述人脸识别模型进行识别,得到人脸识别结果。
83.请参阅图4,本发明实施例中基于数据增强的人脸识别装置的另一个实施例包括:
84.获取模块301,用于从预置的数据库中获取通用人脸数据集及特定人脸数据集,其
中,所述通用人脸数据集及所述特定人脸数据集用于模型训练;
85.分析模块302,用于对所述通用人脸数据集及特定人脸数据集进行数据量比值分析,得到比值数据;
86.处理模块303,用于当所述比值数据小于预设阈值时,对所述特定人脸数据集进行数据增广处理,得到增广数据集;
87.训练模块304,通过所述增广数据集对预置的神经网络模型进行训练,得到人脸识别模型;
88.识别模块305,用于获取待识别图片,并将所述待识别图片输入所述人脸识别模型进行识别,得到人脸识别结果。
89.可选的,所述处理模块303具体包括:
90.获取单元3031,用于从预置的数据增广策略库中按照预设规则获取多个数据增广策略;
91.处理单元3032,用于对所述特定人脸数据集进行预处理,得到标准数据集;
92.计算单元3033,用于根据所述标准数据集对每一所述数据增广策略进行图像分类误差计算,得到误差数据集合;
93.筛选单元3034,用于基于所述误差数据集合通过预置的优化函数对所述多个数据增广策略进行筛选,得到目标数据增广策略;
94.增广单元3035,用于根据所述目标数据增广策略对所述标准数据集进行数据增广处理,得到增广数据集。
95.可选的,所述处理单元3032具体用于:对所述特定人脸数据集中的每一图片进行标准化处理,得到与每一图片对应的像素值矩阵;对于每一图片对应的像素值矩阵进行零像素值填充,得到每一图片对应的填充图像;按照预设的尺寸对每一图片进行随机分割处理,得到裁剪图片集合;对所述裁剪图片集合中每一图片进行镜像翻转,得到标准数据集合。
96.可选的,所述计算单元3033具体用于:根据每一所述数据增广策略对所述标准数据集进行数据增广,得到标准增广数据集;通过预置的残差网络模型对所述标准增广数据集进行图像分类误差计算,得到误差数据集合。
97.可选的,所述训练模块304具体包括:
98.分析单元3041,用于基于所述增广数据集对所述特征解耦模型进行参数分析,得到对应的模型网络参数;
99.分离单元3042,用于基于所述模型网络参数通过所述特征解耦模型对所述增广数据集进行特征分离,得到特征分离后的增广数据集;
100.组合单元3043,用于对所述增广数据集进行特征组合,得到泛化数据集;
101.训练单元3044,用于将所述泛化数据集及所述通用人脸数据集输入所述神经网络模型进行训练,得到人脸识别模型。训练单元
102.可选的,所述分析模块分析单元3041具体用于:对所述增广数据集进行样本构造,确定与所述增广数据对应的正负例样本;对所述正负例样本进行特征向量分析,得到目标特征向量;通过所述目标特征向量对所述特征解耦模型进行参数分析,得到对应的模型网络参数。
103.可选的,所述训练单元3044具体用于:将所述通用人脸数据集输入所述神经网络模型进行训练,得到候选网络模型;将所述泛化数据集输入所述候选网络模型进行分析,得到预测结果;基于所述预测结果通过预置的损失函数对所述候选网络模型进行优化,得到人脸识别模型。
104.图5是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在计算机设备500上执行存储介质530中的一系列指令操作。
105.计算机设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如windows serve,mac os x,unix,linux,freebsd等等。本领域技术人员可以理解,图5示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
106.本发明还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于数据增强的人脸识别方法的步骤。
107.本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于数据增强的人脸识别方法的步骤。
108.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
109.本发明所指区块链是分布式数据存储,点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链,本质上是一个去中心化的数据库,是一串使用密码方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块,区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献