人脸年龄估计方法、装置及电子设备与流程

2022-04-09 02:46:57 来源：中国专利 TAG：

1.本发明涉及图像处理技术领域，具体提供一种人脸年龄估计方法、装置及电子设备。

背景技术：

2.随着人脸识别技术的发展和更广泛的应用，在识别到人脸后常常需要提取人脸的结构化信息，如年龄，人种，性别，是否戴口罩、帽子等。通过深度学习的方法，其中大部分人脸属性有很高的识别精度，但年龄这一属性要达到较高的识别精度比较困难，主要原因是年龄的识别较为困难，不同的人由于遗传、环境等因素影响，其生理年龄与实际年龄可能存在一定的差距。同时化妆、光照强度等客观因素也会对年龄识别带来较大的影响，从而导致很难精确识别对象的年龄。目前一些年龄检测网络直接将年龄检测看成一个分类问题，每个年龄或年龄段作为一类，最终神经网络输出分类的结果，由于没有利用年龄间的关联性，这些方法的识别结果往往很差。
3.相应地，本领域需要一种新的人脸年龄估计方案来解决上述问题。

技术实现要素：

4.为了克服上述缺陷，提出了本发明，以提供解决或至少部分地解决现有的年龄检测网络直接将年龄检测看成一个分类问题导致年龄识别结果精度较低的技术问题。本发明提供了一种人脸年龄估计方法、装置及电子设备。
5.在第一方面，本发明提供一种人脸年龄估计方法，包括下述步骤：获取第一人脸图像样本集；基于所述第一人脸图像样本集确定第二人脸图像样本集，所述第二人脸图像样本集中每个样本包含一张人脸图像和一个对应该人脸图像的年龄概率分布标签；基于所述第二人脸图像样本集训练年龄估计网络，得到训练好的年龄估计网络；将包含有人脸的待处理图像输入所述训练好的年龄估计网络，得到所述人脸对应的年龄概率分布；基于所述人脸对应的年龄概率分布确定人脸对应的年龄估计结果。
6.在一个实施方式中，所述第一人脸图像样本集中每个样本包含一张人脸图像和一个年龄标签；基于所述第一人脸图像样本集确定第二人脸图像样本集包括：基于所述第一人脸图像样本集和训练好的特征提取网络确定样本集中每一人脸图像对应的每一年龄概率分布；基于所述第一人脸图像样本集和所述每一年龄概率分布确定第二人脸图像样本集。
7.在一个实施方式中，基于所述第一人脸图像样本集和训练好的特征提取网络确定样本集中每一人脸图像对应的每一年龄概率分布包括：将所述第一人脸图像样本集输入所述训练好的特征提取网络，得到所述中每个样本的特征向量；基于所述第一人脸图像样本集中每个样本的特征向量和年龄标签确定每个年龄的特征中心；基于所述每个年龄的特征中心确定每个年龄的特征中心与其它年龄的特征中心之间的距离；基于所述每个年龄的特征中心与其它年龄的特征中心之间的距离确定样本集中每一人脸图像对应的每一年龄概
率分布，所述每一年龄概率分布计算公式为：
[0008][0009]
其中，pk(x)为每一年龄概率分布，d(k，x)为年龄k的特征中心与其它年龄x的特征中心之间的距离。
[0010]
在一个实施方式中，基于所述人脸对应的年龄概率分布确定人脸对应的年龄估计结果包括：对所述人脸对应的年龄概率分布中每一年龄的概率与所述年龄的乘积进行求和，得到所述人脸对应的年龄估计结果。
[0011]
在第二方面，本发明提供一种人脸年龄估计装置，包括：获取模块，被配置为获取第一人脸图像样本集；确定模块，被配置为基于所述第一人脸图像样本集确定第二人脸图像样本集，所述第二人脸图像样本集中每个样本包含一张人脸图像和一个对应该人脸图像的年龄概率分布标签；训练模块，被配置为基于所述第二人脸图像样本集训练年龄估计网络，得到训练好的年龄估计网络；概率分布确定模块，被配置为将包含有人脸的待处理图像输入所述训练好的年龄估计网络，得到所述人脸对应的年龄概率分布；结果输出模块，被配置为基于所述人脸对应的年龄概率分布确定人脸对应的年龄估计结果。
[0012]
在一个实施方式中，所述第一人脸图像样本集中每个样本包含一张人脸图像和一个年龄标签；所述确定模块包括：第一确定模块，被配置为基于所述第一人脸图像样本集和训练好的特征提取网络确定样本集中每一人脸图像对应的每一年龄概率分布；第二确定模块，被配置为基于所述第一人脸图像样本集和所述每一年龄概率分布确定第二人脸图像样本集。
[0013]
在一个实施方式中，所述第一确定模块包括：特征向量确定子模块，被配置为将所述第一人脸图像样本集输入所述训练好的特征提取网络，得到所述第一人脸图像样本集中每个样本的特征向量；特征中心确定子模块，被配置为基于所述第一人脸图像样本集中每个样本的特征向量和年龄标签确定每个年龄的特征中心；距离确定子模块，被配置为基于所述每个年龄的特征中心确定每个年龄的特征中心与其它年龄的特征中心之间的距离；概率分布确定子模块，被配置为基于所述每个年龄的特征中心与其它年龄的特征中心之间的距离确定样本集中每一人脸图像对应的每一年龄概率分布，所述每一年龄概率分布计算公式为：
[0014][0015]
其中，pk(x)为每一年龄概率分布，d(k，x)为年龄k的特征中心与其它年龄x的特征中心之间的距离。
[0016]
在一个实施方式中，所述结果输出模块进一步被配置为：对所述人脸对应的年龄概率分布中每一年龄的概率与所述年龄的乘积进行求和，得到所述人脸对应的年龄估计结果。
[0017]
在第三方面，提供一种电子设备，该电子设备包括处理器和存储装置，所述存储装置适于存储多条程序代码，所述程序代码适于由所述处理器加载并运行以执行前述任一项所述的人脸年龄估计方法。
[0018]
在第四方面，提供一种计算机可读存储介质，该计算机可读存储介质其中存储有多条程序代码，所述程序代码适于由处理器加载并运行以执行前述任一项所述的人脸年龄估计方法。
[0019]
本发明上述一个或多个技术方案，至少具有如下一种或多种有益效果：
[0020]
本发明中对年龄估计网络进行训练时，不再直接将年龄作为标签，而是将年龄概率分布作为样本集中每一样本的标签，利用年龄概率分布标签的模糊性，带给网络更丰富的信息，提高了年龄估计网络的准确度，进而提高利用年龄估计网络进行年龄估计时的精度。
[0021]
通过第一人脸图像样本集和训练好的特征提取网络确定每一年龄概率分布，利用了实际数据集得到的年龄特征来模拟年龄的分布，对于不同年龄段的模拟更符合真实情况，而不是直接使用高斯分布来模拟，提高了年龄之间的相关性，有利于对后期年龄估计网络的训练。
附图说明
[0022]
参照附图，本发明的公开内容将变得更易理解。本领域技术人员容易理解的是：这些附图仅仅用于说明的目的，而并非意在对本发明的保护范围组成限制。此外，图中类似的数字用以表示类似的部件，其中：
[0023]
图1是根据本发明的一个实施例的人脸年龄估计方法的主要步骤流程示意图；
[0024]
图2是根据本发明的一个实施例的年龄估计网络训练的流程示意图；
[0025]
图3是根据本发明的一个实施例的人脸的年龄估计流程示意图；
[0026]
图4是根据本发明的一个实施例的年龄概率分布示意图；
[0027]
图5是根据本发明的一个实施例的人脸年龄估计装置的主要结构框图示意图。
[0028]
附图标记列表：
[0029]
11：获取模块；12：确定模块；13：训练模块；14：概率分布确定模块；15：结果输出模块。
具体实施方式
[0030]
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。
[0031]
在本发明的描述中，“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路，各种合适的感应器，通信端口，存储器，也可以包括软件部分，比如程序代码，也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质，比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“a和/或b”表示所有可能的a与b的组合，比如只是a、只是b或者a和b。术语“至少一个a或b”或者“a和b中的至少一个”含义与“a和/或b”类似，可以包括只是a、只是b或者a和b。单数形式的术语“一个”、“这个”也可以包含复数形式。
[0032]
目前的年龄检测网络直接将年龄检测看成一个分类问题，每个年龄或年龄段作为
一类，最终神经网络输出分类的结果，由于没有利用年龄间的关联性，这些方法的识别结果往往很差。为此，本技术提出了一种人脸年龄估计方法、装置及电子设备，不再将年龄作为标签，而是将年龄概率分布作为样本集中每一样本的标签对年龄估计网络进行训练，利用年龄概率分布标签的模糊性，带给网络更丰富的信息，提高了年龄估计网络的准确度，进而提高利用年龄估计网络进行年龄估计时的精度。
[0033]
参阅附图1，图1是根据本发明的一个实施例的人脸年龄估计方法的主要步骤流程示意图。如图1所示，本发明实施例中的人脸年龄估计方法主要包括下列步骤s101-步骤s105。
[0034]
步骤s101：获取第一人脸图像样本集。目前有标注的公开人脸年龄数据集很少，其中还有一部分没有标注具体年龄。同时目前绝大部分公开数据集都是欧美人种，不同人种外貌表现的年龄信息也有较大差距，经过实验证明，这些欧美数据集对于亚裔的年龄估计几乎没有帮助。其次目前有标注的数据集标注信息也不能保证完全准确。因此，为解决上述问题，该实施例中获取了megaage-asian数据集和afad数据集作为第一人脸图像样本集，其中第一人脸图像样本集中每个样本包含一张人脸图像和一个年龄标签。在一些实施例中，第一人脸图像样本集也可以是用户自己收集的标注结果比较精确的年龄数据集等，但不限于此。由于本技术第一人脸图像样本集为主要包含亚裔人图片的样本集，所以本技术主要用于对亚裔人的人脸年龄进行估计，但不限于此，若是可以获取到具备一定精度的包含其它人种图片的样本集，本技术的人脸年龄估计方法也可以适用于其它人种的人脸年龄估计。
[0035]
步骤s102：基于第一人脸图像样本集确定第二人脸图像样本集，第二人脸图像样本集中每个样本包含一张人脸图像和一个对应该人脸图像的年龄概率分布标签。具体来说，基于第一人脸图像样本集确定第二人脸图像样本集的过程可以由下述步骤s1021-步骤s1022来实现。
[0036]
步骤s1021：基于第一人脸图像样本集和训练好的特征提取网络确定样本集中每一人脸图像对应的每一年龄概率分布。通过第一人脸图像样本集和训练好的特征提取网络确定每一年龄概率分布，利用了实际数据集得到的年龄特征来模拟年龄的分布，对于不同段的模拟更符合真实情况，而不是直接使用高斯分布来模拟，提高了年龄之间的相关性，有利于对后期年龄估计网络的训练。
[0037]
具体来说，特征提取网络的主要目的是将高维度的原始图像信息映射到低维度的特征向量，从而得到每个样本的年龄特征信息。为此需要一个能够提取年龄相关特征的神经网络，该实施例中选用了resnet18网络作为特征提取网络的示例进行说明，但不限于此。对特征提取网络的训练可以采用两种方法。一种方法是训练一个估计年龄相关特征的分类网络，首先由卷积层提取特征，再通过softmax分类。训练完成后去掉最后用于分类的全连接层，将最后卷积层的输出池化压缩后作为提取的特征向量，该实施例中提取的特征向量为512维的向量。另一种方法是不通过softmax，直接对卷积层提取的特征进行训练优化,在训练优化过程中，具体是将锚示例、正示例和负示例构成的三元组作为输入，通过优化锚示例与正示例的距离小于锚示例与负示例的距离，实现样本之间的相似性计算。训练优化过程中用到的triplets loss损失函数为：
[0038][0039]
式中，为样本，m取a、p、n，其中a、p、n分别为锚示例、正示例和负示例，n为样本容量，α为预设距离。利用锚示例、正示例和负示例构成的三元组进行网络的训练优化，能够减少同一年龄的样本提取的特征的距离而增大不同年龄样本提取的特征的距离，起到将年龄特征聚类的效果。
[0040]
在确定每一年龄概率分布的过程中，首先将第一人脸图像样本集输入训练好的特征提取网络，得到第一人脸图像样本集中每个样本的512维特征向量。接着，针对第一人脸图像样本集，对同一年龄标签对应样本的特征向量进行求和后取平均值，得到每个年龄的特征中心。得到每个年龄的特征中心后，基于每个年龄的特征中心确定每个年龄的特征中心与其它年龄的特征中心之间的距离，这里获得的距离也可以包含每个年龄的特征中心与该年龄自身之间的距离。计算距离时可以采用欧式距离公式计算，也可以采用其它的距离公式计算，包括但不限于曼哈顿距离、切比雪夫距离等。最后基于每个年龄的特征中心与其它年龄的特征中心之间的距离确定每一年龄概率分布，每一年龄概率分布计算公式为：
[0041][0042]
其中，pk(x)为每一年龄概率分布，d(k,x)为年龄k的特征中心与其它年龄x的特征中心之间的距离。
[0043]
步骤s1022：在基于上述步骤s1021确定每一年龄概率分布后，可以基于第一人脸图像样本集和每一年龄概率分布确定第二人脸图像样本集，具体是利用每一年龄概率分布相应的替换第一人脸图像样本集中每个样本的年龄标签，也即将年龄概率分布作为第一人脸图像样本集中每个样本的标签，即可获得第二人脸图像样本集。
[0044]
步骤s103：基于第二人脸图像样本集训练年龄估计网络，得到训练好的年龄估计网络。该步骤中通过第二人脸图像样本集来训练年龄估计网络，第二人脸图像样本集中每个样本包含一张人脸图像和一个年龄概率分布标签，其使用每个年龄概率分布来替换数据集中原本的年龄标签，利用了标签的模糊性，带给网络更丰富的信息，如能告诉网络20岁和21岁相比20岁和50岁有更强的相关性，21岁的样本也能帮助20岁的训练，使网络能在样本数量较少和样本不平衡的数据集上也能有良好的表现。
[0045]
上述的年龄估计网络采用传统的分类卷积网络结构，该实施例中年龄估计网络的主干网络选择了resnet18网络，经过两层全连接网络通过softmax输出人脸的年龄概率分布，同时采用k1 loss损失函数进行训练优化，使网络输出的年龄概率分布接近标签的概率分布。为了使年龄识别网络有更快的识别速度和易于部署，该年龄估计网络的输入图像的像素可以为64
×
64。
[0046]
步骤s104：将获取的包含有人脸的待处理图像输入训练好的年龄估计网络，得到人脸对应的年龄概率分布。具体来说，包含有人脸的待处理图像输入训练好的年龄估计网络之前，还可以对其进行预处理，将其转化为rgb三通道图像，并对rgb三通道图像的像素值进行归一化后再输入至训练好的年龄估计网络，这样能够进一步提高模型年龄估计网络的精度。
[0047]
步骤s105：基于人脸对应的年龄概率分布确定人脸对应的年龄估计结果，具体是对人脸对应的年龄概率分布中每一年龄的概率与年龄的乘积进行求和，得到待处理图像中人脸对应的年龄估计结果。
[0048]
基于上述步骤s101-步骤s105，不再直接将年龄作为标签，而是将年龄概率分布作为样本集中每一样本的标签对年龄估计网络进行训练，利用年龄概率分布标签的模糊性，带给网络更丰富的信息，提高了年龄估计网络的准确度，进而提高利用年龄估计网络进行年龄估计时的精度。
[0049]
在一个实施方式中，年龄估计网络训练的流程如图2所示，在训练年龄估计网络之前，先利用第一人脸图像样本集训练一个特征提取网络，基于训练好的特征提取网络可以获得每个样本的特征向量，进而得到年龄特征中心，基于年龄特征中心可以确定年龄概率分布，最后年龄概率分布作为第一人脸图像样本集的标签对年龄估计网络进行训练，即可得到训练好的年龄估计网络。
[0050]
在一个实施方式中，人脸的年龄估计流程如图3所示，在实际应用中，首先获取待测人脸图像，将其输入至训练好的年龄估计网络即可得到人脸的年龄概率分布，最后根据人脸的年龄概率分布计算人脸对应的估计年龄。
[0051]
在一个实施方式中，年龄概率分布如图4所示，横坐标为年龄，纵坐标为概率分布。其中较为平缓的波浪线为标准的高斯分布，另一条有尖峰的线条为按照本技术提供的人脸年龄估计方法获得的5岁、20岁、40岁以及58岁的年龄概率分布，可以看出按照本技术的方法获得的年龄概率分布更贴合实际情况，年龄较小时外貌变化更为剧烈，5岁和6岁外貌的变化显然要大于40岁和41岁，因此相比40岁，5岁的概率分布理应更“陡峭”，而40岁的概率分布则较为平缓(40岁和41岁的人很难看出差别，其概率值也较为接近)，对于58岁的情况，由于60岁及以上包括的年龄很多，因此和58差异很大，对应的概率值也较低。如果使用高斯分布，很明显是不贴近实际的，因此本技术的人脸年龄估计方法更为科学，也有更高的准确率。
[0052]
将本技术的人脸年龄估计方法在megaage-asian年龄数据集上进行训练和测试，在测试集上得到平均年龄误差为3.18岁，进一步验证了本技术年龄估计方法的有效性。另外，本技术较轻量化的年龄估计网络可以用在海思hi3559a芯片上，能达到每秒识别910张图片以上的速度，进一步提高了年龄估计的效率。
[0053]
进一步，本发明还提供了一种人脸年龄估计装置。
[0054]
参阅附图5，图5是根据本发明的一个实施例的人脸年龄估计装置的主要结构框图。如图5所示，本发明实施例中的人脸年龄估计装置主要包括获取模块11、确定模块12、训练模块13、概率分布确定模块14和结果输出模块15。在一些实施例中，获取模块11、确定模块12、训练模块13、概率分布确定模块14和结果输出模块15中的一个或多个可以合并在一起成为一个模块。在一些实施例中获取模块11可以被配置为获取第一人脸图像样本集。确定模块12可以被配置为基于第一人脸图像样本集确定第二人脸图像样本集，所述第二人脸图像样本集中每个样本包含一张人脸图像和一个对应该人脸图像的年龄概率分布标签。训练模块13可以被配置为基于第二人脸图像样本集训练年龄估计网络，得到训练好的年龄估计网络。概率分布确定模块14可以被配置为将包含有人脸的待处理图像输入训练好的年龄估计网络，得到人脸对应的年龄概率分布。结果输出模块15可以被配置为基于人脸对应的
年龄概率分布确定人脸对应的年龄估计结果。一个实施方式中，具体实现功能的描述可以参见步骤s101-步骤s105所述。
[0055]
在一个实施方式中，第一人脸图像样本集中每个样本包含一张人脸图像和一个年龄标签；确定模块包括第一确定模块和第二确定模块。第一确定模块被配置为基于第一人脸图像样本集和训练好的特征提取网络确定样本集中每一人脸图像对应的每一年龄概率分布；第二确定模块被配置为基于第一人脸图像样本集和所述每一年龄概率分布确定第二人脸图像样本集。
[0056]
在一个实施方式中，第一确定模块包括特征向量确定子模块、特征中心确定子模块、距离确定子模块和概率分布确定子模块。其中，特征向量确定子模块被配置为将第一人脸图像样本集输入训练好的特征提取网络，得到第一人脸图像样本集中每个样本的特征向量；特征中心确定子模块被配置为基于第一人脸图像样本集中每个样本的特征向量和年龄标签确定每个年龄的特征中心；距离确定子模块被配置为基于每个年龄的特征中心确定每个年龄的特征中心与其它年龄的特征中心之间的距离；概率分布确定子模块被配置为基于每个年龄的特征中心与其它年龄的特征中心之间的距离确定样本集中每一人脸图像对应的每一年龄概率分布，每一年龄概率分布计算公式为：
[0057][0058]
其中，pk(x)为每一年龄概率分布，d(k，x)为年龄k的特征中心与其它年龄x的特征中心之间的距离。
[0059]
在一个实施方式中，结果输出模块可以进一步被配置为对人脸对应的年龄概率分布中每一年龄的概率与年龄的乘积进行求和，得到人脸对应的年龄估计结果。
[0060]
上述人脸年龄估计装置以用于执行图1所示的人脸年龄估计方法实施例，两者的技术原理、所解决的技术问题及产生的技术效果相似，本技术领域技术人员可以清楚地了解到，为了描述的方便和简洁人脸年龄估计装置的具体工作过程及有关说明，可以参考人脸年龄估计方法的实施例所描述的内容，此处不再赘述。
[0061]
本领域技术人员能够理解的是，本发明实现上述一实施例的方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读存储介质不包括电载波信号和电信信号。
[0062]
进一步，本发明还提供了一种电子设备。在根据本发明的一个电子设备实施例中，电子设备包括处理器和存储装置，存储装置可以被配置成存储执行上述方法实施例的人脸年龄估计方法的程序，处理器可以被配置成用于执行存储装置中的程序，该程序包括但不
限于执行上述方法实施例的人脸年龄估计方法的程序。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。
[0063]
进一步，本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中，计算机可读存储介质可以被配置成存储执行上述方法实施例的人脸年龄估计方法的程序，该程序可以由处理器加载并运行以实现上述人脸年龄估计方法。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备，可选的，本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
[0064]
进一步，应该理解的是，由于各个模块的设定仅仅是为了说明本发明的装置的功能单元，这些模块对应的物理器件可以是处理器本身，或者处理器中软件的一部分，硬件的一部分，或者软件和硬件结合的一部分。因此，图中的各个模块的数量仅仅是示意性的。
[0065]
本领域技术人员能够理解的是，可以对装置中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理，因此，拆分或合并之后的技术方案都将落入本发明的保护范围内。
[0066]
至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种网联车辆环境下道路风险评价指标体系

人脸年龄估计方法、装置及电子设备与流程

相关文献

最热文献