一种基于调参的人脸类内类间距优化方法与流程

2022-04-25 00:03:12 来源：中国专利 TAG：

1.本发明涉及人脸识别领域，具体为一种基于调参的人脸类内类间距优化方法。

背景技术：

2.人脸识别技术，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术，主要是通过人脸图像特征的提取与对比来进行的。人脸识别系统将提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配，通过设定一个阈值，当相似度超过这一阈值，则把匹配得到的结果输出。将待识别的人脸特征与已得到的人脸特征模板进行比较，根据相似程度对人脸的身份信息进行判断。因此人脸的特征提取工作是人脸识别技术的关键。
3.人脸特征提取方法主要分为两大类：1、基于知识的表征方法(主要包括基于几何特征法和模板匹配法)：2、基于代数特征和深度学习的表征方法。其中第二种方式是目前人脸识别技术的主流方式，通过像神经网络输入大量人脸样本并对其提取特征并进行分类。每一张人脸照片提取出一个特征，同一个人的不同照片提取出来的特征划分为同一类别，而不同人则为不同的类别。若想要在特征匹配时获得更高的精度，则要求同一个类别的多个特征之间的差距更小，而不同类别的特征之间差距更大。同一个类别的不同特征之间的差异称为类内特征距离，简称类内距；不同类别之间的特征之间的差异称为类间特征距离，称为类间距。
4.理论上对类内类间距起决定因素的主要是分类器的选择，即选择合适的loss function(损失函数)，但是仅仅通过选择在测试集上表现较好的损失函数，在实际应用中往往达不到理想的效果，对获得更好的分类结果造成困扰。
5.不难看出，现有技术中还存在诸多问题。

技术实现要素：

6.为此，为了解决现有技术中的上述问题，本发明提出一种基于调参的和可视化人脸类内类间距优化方法。
7.本发明通过以下技术手段解决上述问题：
8.一种基于调参的和可视化人脸类内类间距优化方法，包括：
9.s1、小样本预调参，使用数据量小的样本，通过控制变量设置对照组，调整网络的参数，不断优化训练结果，对输出特征进行特征距离类内类间距计算，通过读取输出特征、自动计算特征距离、导入表格并以图表的形式显示，形成可视化类内类间距模块，最终在小样本上确定训练结果好的参数；
10.s2、大样本精确调参，使用所述s1中训练结果好的参数对大样本进行训练，最终挑选出类内类间距表现好的模型；
11.s3、真实场景要用，将所述s2中挑选出的模型应用到真实场景数据上，并对模型进
行轻微调参。
12.进一步的，所述s1包括：
13.s11、挑选各类别均衡，照片总数在千张级别的纯净数据集作为首次训练的数据集，收集在训练中会用到的预训练模型、网络结构以及损失函数；
14.s12、使用不同的网络结构对所述s11中挑选的数据集进行训练，输出模型；
15.s13、输出所述s12中模型的类内类间距，保留类内类间距效果最优的模型；
16.s14、使用所述s13中最优的模型，加入预训练模型进行训练，输出模型；
17.s15、输出所述s14中模型的类内类间距，保留效果最优的模型；
18.s16、尝试不同的损失函数，在所述s15输出的模型基础上进行再训练，输出模型；
19.s17、输出所述s16中模型的类内类间距，保留效果最优的模型，并记录该模型训练的预训练模型、网络结构以及损失函数的使用情况。
20.进一步的，所述s2包括：
21.s21、挑选各类别照片均衡，照片总数在万张级别的纯净数据集作为二次训练的数据；
22.s22、使用所述s17中得到的最优模型的参数对所述s21中二次训练的数据进行训练，输出模型；
23.s23、输出所述s22中输出的模型的类内类间距，并与小样本情况下的类内类间距进行比较，观察该模型表现在大样本上性能是否下滑，过滤掉效果较差的参数组合；
24.s24、调整所述s23中保留的模型的参数，对所述s23中保留的模型再训练，输出模型；
25.s25、输出所述s24中输出的模型的类内类间距，挑选类内类间距表现最优的模型。
26.进一步的，所述s13中输出所述s12中模型的类内类间距为可视化模块。
27.进一步的，所述s15中输出所述s14中模型的类内类间距为可视化模块。
28.进一步的，所述s17中输出所述s16中模型的类内类间距为可视化模块。
29.进一步的，所述s23中输出所述s22中模型的类内类间距为可视化模块。
30.进一步的，所述s25中输出所述s24中模型的类内类间距为可视化模块
31.目前的训练过程中过多依赖在训练集上跑出较好效果的参数配置以及榜单上较好的网络模型，本发明提供的一种基于调参的和可视化人脸类内类间距优化方法仅仅对参数进行简单调整的情况做出改进，将调参范围扩大，针对预训练模型、网络结构、分类器以及训练参数都进行调整，设计出这一套精细调参的流程。在第一部分预调参中，每一步都与前一步形成对照组，对照模型的表现找到优化的方向。设计了类内类间距的可视化模块，模型输入模块，输出可视化图表，方便对比模型提升效果。通过脚本文件将模型的训练和效果输出耦合在一起，训练完后模型直接输入可视化模块，并且脚本文件提供修改参数的接口，方便调整训练参数，实现半自动化调参。
附图说明
32.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他
的附图。
33.图1是本发明所述的一种基于调参的和可视化人脸类内类间距优化方法的架构图；
34.图2是本发明所述的一种基于调参的和可视化人脸类内类间距优化方法的流程简化图。
具体实施方式
35.为使本发明的上述目的、特征和优点能够更加明显易懂，下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是，所描述的实施例子仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
36.实施例
37.如图1所示，本发明提供的一种基于调参的和可视化人脸类内类间距优化方法，该方法主要先使用数据量较小的样本，通过控制变量设置对照组，来调整网络的参数，不断优化训练结果，对输出特征进行特征距离计算并以可视化(表格或图表)方式呈现，最终在小样本上确定训练结果较好的参数，应用到大数据量样本中进行测试，最终应用到真实场景中。
38.首先固定其他参数，只改变一个参数，将其调整为合适的数值；再用此方法对其他参数进行调节；最后对所有参数进行微调，找到合适的参数组合。任何参数改变对结果的影响都将以图表的方式直观呈现。
39.简要的说，本发明主要从四个方面就行精准调参：
40.一、预训练模型
41.预训练模型指事先在大数据集上经过训练的模型，我们可以直接使用相应的结构和权重，将它应用在我们正在面对的问题上。针对预训练模型，是否使用预训练模型、使用简单或复杂的预训练模型都需要根据实际情况做出决策。针对较为复杂的场景，不使用预训练模型或者使用了较为简单的预训练模型，都会导致在fine-tune的时候收敛缓慢甚至无法收敛；而面对较为简单的场景，使用郭伟复杂的预训练模型反而会导致过拟合或者收敛困难的问题。
42.二、网络结构
43.网络结构的选择也尽量要贴近具体任务，过深的网络在提供更好的精度之外，还会消耗额外的速度，因此为了保证精度和速度之间的平衡，应选用与应用场景难度相匹配的网络结构，但由于这两者都没有标准来进行度量，因此必须要通过调试来找到合适的网络结构。
44.三、训练参数
45.训练的参数设置会直接影响到模型是否收敛以及收敛的程度和速度，例如学习率以及momentu的初始化等，都会在一定程度上影响训练输出模型的精度。因此在训练过程中要以结果为导向精细调参。
46.四、损失函数
47.影响类内类间距最直接最重要的因素即为损失函数。损失函数接受卷积神经网络
输出的特征，并对其进行计算分类，损失函数的选择直接影响了输出类别的类内类间距。目前在神经网络的训练中使用最为广泛的loss function为softmax函数，softmax函数能够胜任绝大多数的神经网络分类工作，然而在人脸特征提取中，softmax的表现并不是很理想。因为softmax分类出的类别之间仅有一条决策边界，无法保证类内聚合类间松散，softmax的改进函数引入了margin参数，通过给决策边界加margin，即增大决策边界的宽度，从而拉大类间距离，所有类别间的距离大了，同时也会压缩类内距离。加入margin参数的损失函数经过一段时间发展，目前表现较为优异的主要有sphereface、加入特征归一化的l2-constrained softmax loss、arcface以及其的衍生系列additive margin softmax loss和large margin cosine loss。在之后的训练中我们要使用不同的损失函数并测试其对结果的影响。
48.下面对本发明的具体内容做详尽叙述:
49.如图2所示，一种基于调参的和可视化人脸类内类间距优化方法，包括：
50.s1、小样本预调参，使用数据量小的样本，通过控制变量设置对照组，调整网络的参数，不断优化训练结果，对输出特征进行特征距离类内类间距计算，在小样本上确定训练结果好的参数；作为优选，所述s1包括：
51.s11、挑选各类别均衡，照片总数在千张级别的纯净数据集作为首次训练的数据集，收集在训练中会用到的预训练模型、网络结构以及损失函数；
52.s12、使用不同的网络结构对所述s11中挑选的数据集进行训练，输出模型；
53.s13、输出所述s12中模型的类内类间距，保留类内类间距效果最优的模型；作为优选，所述s13中输出所述s12中模型的类内类间距为可视化模块。需要说明的是，所述可视化模块是通过读取输出特征、自动计算特征距离、导入表格并以图表的形式显示，形成可视化类内类间距模块。
54.s14、使用所述s13中最优的模型，加入预训练模型进行训练，输出模型；
55.s15、输出所述s14中模型的类内类间距，保留效果最优的模型；作为优选，所述s15中输出所述s14中模型的类内类间距为可视化模块。
56.s16、尝试不同的损失函数，在所述s15输出的模型基础上进行再训练，输出模型；
57.s17、输出所述s16中模型的类内类间距，保留效果最优的模型，并记录该模型训练的预训练模型、网络结构以及损失函数的使用情况。作为优选，所述s17中输出所述s16中模型的类内类间距为可视化模块。
58.s2、大样本精确调参，使用所述s1中训练结果好的参数对大样本进行训练，最终挑选出类内类间距表现好的模型；作为优选，所述s2包括：
59.s21、挑选各类别照片均衡，照片总数在万张级别的纯净数据集作为二次训练的数据；
60.s22、使用所述s17中得到的最优模型的参数对所述s21中二次训练的数据进行训练，输出模型；
61.s23、输出所述s22中输出的模型的类内类间距，并与小样本情况下的类内类间距进行比较，观察该模型表现在大样本上性能是否下滑，过滤掉效果较差的参数组合；作为优选，所述s23中输出所述s22中模型的类内类间距为可视化模块。
62.s24、调整所述s23中保留的模型的参数，对所述s23中保留的模型再训练，输出模
型；
63.s25、输出所述s24中输出的模型的类内类间距，挑选类内类间距表现最优的模型。作为优选，所述s25中输出所述s24中模型的类内类间距为可视化模块。
64.s3、真实场景要用，将所述s2中挑选出的模型应用到真实场景数据上，并对模型进行轻微调参。
65.为使本发明更易理解，下面举一实例做进一步说明：
66.在图1中，先挑选合适的数据集，总数在5千左右，作为小样本，保证在调参的时候有较快的训练速度；挑选总数为10万的数据集作为大样本，与小样本训练效果互为补充，保留在大小样本训练中效果都比较突出的参数组合。
67.1、针对小样本进行调参：
68.1)不使用预训练模型，针对不选择的网络结构分开单独训练，默认参数进行训练。
69.2)保留上一步的输出数据并生成图表，对比结果，抛弃掉效果较差的几组网络，只保留2-3组效果较好的网络训练结果。
70.3)记录上一步的效果较好的几组网络结构，为保留的几组网络结构添加不同的预训练模型进行训练。
71.4)筛选上一步的输出结果，保留效果较好的组别，并记录对应的预训练模型和网络结构。
72.5)针对上一步保留下来的配置，每组搭配不同的损失函数进行训练。
73.6)筛选上一步的输出结果，保留效果较好的组，并记录在实验中效果均比较靠前的损失函数。
74.7)针对上一步保留的训练组，对其进行训练参数的调整，直到结果无明显变化，输出并记录。
75.2、针对大样本进行参数微调：
76.1)将“针对小样本进行调参”中训练结果较好的训练组参数迁移到大样本中，进行训练。
77.2)保留效果较好的模型，并对其批度大小进行调整。
78.3)可视化输出结果并与对照组进行比较，记录效果最好的一组参数。
79.3、将“针对大样本进行参数微调”获得的最好的一组参数代入实际应用场景中，测试其实用性并应用。
80.综上所述，本发明提供的一种基于调参的和可视化人脸类内类间距优化方法仅仅对参数进行简单调整的情况做出改进，将调参范围扩大，针对预训练模型、网络结构、分类器以及训练参数都进行调整，设计出这一套精细调参的流程。在第一部分预调参中，每一步都与前一步形成对照组，对照模型的表现找到优化的方向。设计了类内类间距的可视化模块，方便对比模型提升效果。通过脚本文件将模型的训练和效果输出耦合在一起，训练完后模型直接输入可视化模块，并且脚本文件提供修改参数的接口，方便调整训练参数，实现半自动化调参。
81.在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”、“优选实施例”等，指的是结合该实例描述的具体特征、结构或者特点包含在本技术概括描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说，
结合任一实施例描述一个具体特征、结构或者特点时，所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发明内。尽管这里参照本发明的多个解释性实例对本发明进行了描述，但是，应该理解，本领域技术人员可以设计出很多其他的修改和实施方式，这些修改和实施方式降落在本技术公开的原则范围和精神之内。更具体地说，在本技术公开、附图和权利要求的范围内，可以对主题结合布局的组成部件和/或布局进行的变形和改进外，对于本领域技术人员来说，其他的用途也将是明显。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于调参的人脸类内类间距优化方法与流程

相关文献

最热文献