基于MTCNN算法的人脸多特征点检测方法及装置与流程

2021-12-04 02:00:00 来源：中国专利 TAG：

基于mtcnn算法的人脸多特征点检测方法及装置
技术领域
1.本发明涉及一种人脸检测方法，更具体的说，本发明主要涉及一种基于mtcnn算法的人脸多特征点检测方法及装置。

背景技术：

2.随着各类ai技术的推广应用，人脸识别技术也得到了长足的发展，根据识别精确性以及识别速度等不同侧重点，目前领域中具有多种识别技术，分别通过不同的算法及原理实现。而相较于其他的人脸识别算法，mtcnn算法具有识别准确的优点，其应用的范围场景比较广，因此也在ai智能领域中得到了推广与应用。传统的mtcnn模型利用多级联的结构，从粗到细预测人脸以及相应特征坐标位置，能够适用于各种自然条件下复杂的人脸场景检测。但在一些特定的应用场景下，由于其标定特征点偏少，通常只在面部固定的区域进行标定，因此无法得到更为精确的识别结果，不适于在医疗器械等领域的人脸识别中使用，因此有必要在mtcnn算法的基础上，进行人脸多特征点检测研究和改进。

技术实现要素：

3.本发明的目的之一在于解决上述不足，提供一种基于mtcnn算法的人脸多特征点检测方法及装置，以期望解决传统mtcnn算法模型标定特征点偏少，不适于在医疗器械等特定场景领域中应用等技术问题。
4.为解决上述的技术问题，本发明采用以下技术方案：本发明一方面提供了一种基于mtcnn算法的人脸多特征点检测方法，所述方法为在mtcnn算法的基础上，将输入数据集中的人脸特征点的标定数量设置为大于或等于六个；所述人脸特征点均为在初始人脸图像上进行的自由标定点，且将标定人脸特征点后的初始人脸图像均利用mtcnn算法训练，形成人脸特征数据模型，以所述人脸特征数据模型作为mtcnn算法的检测依据。
5.作为优选，进一步的技术方案是：输入数据集中人脸特征点的标定数量设置为19
‑
21个，且均布于人脸的面部五官的位置。
6.更进一步的技术方案是：所述输入数据集中的人脸特征点包括至少两个侧脸特征点。
7.更进一步的技术方案是：所述输入数据集为多个，分别基于各自的初始人脸图像完成人脸检测与人脸特征点标定，且所述输入数据集基于aflw数据集完成的人脸特征点标定。
8.更进一步的技术方案是：所述输入数据集中包括人脸图像数据与人脸特征点数据，所述输入数据集通过金字塔处理后形成p
‑
net数据，所述p
‑
net数据为基于输入数据集识别出的不同尺寸大小的人脸数据，基于所述p
‑
net数据去掉重复人脸矩形框后形成r
‑
net数据，再基于所述r
‑
net标定人脸矩形框后形成具有人脸特征数据模型的o
‑
net数据。
9.本发明另一方面提供了一种基于mtcnn算法的人脸多特征点检测装置，所述的装
置包括摄像头与检测处理模块，所述摄像头接入检测处理模块，所述摄像头用于采集图像数据并传输至检测处理模块中，所述检测处理模块用于通过上述的方法，对当前的图像数据进行人脸检测。
10.作为优选，进一步的技术方案：所述检测处理模块通过具有19
‑
21个人脸特征点的人脸特征数据模型，对当前图像数据中的人脸进行检测。
11.更进一步的技术方案是：所述检测处理模块用于执行mtcnn算法，且其内部预置有经过mtcnn算法程序训练的人脸特征数据模型。
12.与现有技术相比，本发明的有益效果之一是：通过将mtcnn算法模型中的人脸特征点的标定数量增多，并通过算法训练，从而有效提升了人脸检测的精确性，亦可对特征点标定数量进行扩展，实现对侧脸识别，更为适宜在tms系统等医疗器械等领域中对人脸识别精度要求更为精确的场景中使用，同时本发明所提供的一种基于mtcnn算法的人脸多特征点检测方法步骤简单，可基于传统的mtcnn算法模型实现，易于实现，便于推广。
附图说明
13.图1为传统mtcnn算法模型的人脸识别流程图；图2为用于说明本发明一个实施例的方法流程框图；图3a与图3b均为用于说明本发明一个实施例的特征点标定示意图。
具体实施方式
14.下面结合附图对本发明作进一步阐述。
15.mtcnn是一种人脸特征点识别算法，相较于其他人脸识别算法而言mtcnn具有识别准确，应用的范围场景比较广。其流程如图1所示，在该算法中：首先进行图像金字塔处理，这一步可以让神经网络识别出不同尺寸大小的人脸，解决了人脸识别中目标多尺度的问题；然后需要把步骤一得到的图像金子塔用作p
‑
net的输入，从p
‑
net会输出很多可能是人脸的矩形框；接下来在把数据输入r
‑
net之前，需要对这些矩形框进行处理（过于相似的矩形框只保留一个，剔除与真实人脸的重叠区域过小的部分）；然后把从p
‑
net输出的很多个可能是人脸的矩形框用作为r
‑
net的输出，这一步的主要目的是对人脸的矩形框进行筛选，缩小人脸矩形框的范围；最后把r
‑
net的输出用作最后一层o
‑
net输入，在这一步我们对矩形框进行最后的筛选，并且预测人脸关键点的位置。
16.参考图2所示，本发明的一个实施例是基于上述的mtcnn算法的人脸多特征点检测方法，由于现有的mtcnn算法在进行人脸识别时只有五个脸部的特征点，由于tms（经颅磁刺激技术transcranial magnetic stimulation，tms）系统需要更高精度的定位，因此需要增加脸部特征点数，用来提高精度，这也是本发明最主要的技术目的。
17.基于上述的技术目的，该方法为在mtcnn算法的基础上，如图3a与图3b所示出的，将输入数据集中的人脸特征点的标定数量设置为大于或等于六个；前述人脸特征点均为在初始人脸图像上进行的自由标定点，且将标定人脸特征点后的初始人脸图像均利用mtcnn算法训练，最终形成人脸特征数据模型，利用该模型辅助后期的人脸识别定位与辅助，即以
前述的人脸特征数据模型作为mtcnn算法输出o
‑
net数据集的检测依据。正如图3所示出的，前述输入数据集中人脸特征点的标定数量设置为19
‑
21个，且均布于人脸的面部五官的位置，并且输入数据集中的人脸特征点包括至少两个侧脸特征点，从而便于对侧脸特征进行识别。前述人脸特征点被识别之后用来和标准模板进行匹配，使之提高人面部识别的精度，便于在tms系统应用中刺激头部的位置更加精确。
18.正如上述所提到的，所述输入数据集中包括人脸图像数据与人脸特征点数据，所述输入数据集通过金字塔处理后形成p
‑
net数据，所述p
‑
net数据为基于输入数据集识别出的不同尺寸大小的人脸数据，基于所述p
‑
net数据去掉重复人脸矩形框后形成r
‑
net数据，再基于所述r
‑
net标定人脸矩形框后形成具有人脸特征数据模型的o
‑
net数据。即p
‑
net的作用是初步筛选框出图片中可能是人脸的矩形框，r
‑
net的作用是在p
‑
net的基础上对上述的矩形框做进一步筛选， o
‑
net的作用是输出最后的人脸矩形框和人脸特征点，即人脸特征数据模型。
19.在本实施例中，通过将mtcnn算法模型中的人脸特征点的标定数量增多，并通过算法训练，从而有效提升了人脸识别的精确性，亦可对人脸特征点标定数量进行扩展，实现对侧脸识别，更为适宜在tms系统等医疗器械等领域中对人脸识别精度要求更为精确的场景中使用。
20.进一步的，在上述的方法中，输入数据集为两个，在两个具有人脸特征点的输入数据集中，其中一个用来匹配人脸识别，例如使用wider_face数据集进行人脸的识别与矩形框的标注，另一个用来进行上述的人脸特征点标定，例如基于现有的aflw数据集完成的人脸特征点标定，或者基于自定义标注的数据集完成人脸特征点标定。然后将两个输入数据集进行训练，生成人脸特征数据模型，并以此作为mtcnn算法输出o
‑
net数据集的检测依据。当输入数据集为多个（两个一组）时，可分别基于各自的初始人脸图像完成人脸检测识别中的矩形框标定与人脸特征点标定。
21.本发明的另一个实施例是一种基于上述方法的人脸识别装置，该装置包括摄像头与检测处理模块，前述摄像头接入检测处理模块，检测处理模块可采用具有计算能力的计算机。前述摄像头在装置使用时采集图像数据并传输至检测处理模块中，检测处理模块用于通过上述实施例的方法，即对当前的图像数据进行人脸检测，即由作为检测处理模块的计算机执行上述方法的计算机程序。基于上述的方法，检测处理模块可通过具有19
‑
21个人脸特征点的人脸特征数据模型，对当前图像数据中的人脸进行检测；并且检测处理模块用于执行mtcnn算法，且其内部预置有经过mtcnn算法程序训练的人脸特征数据模型。
22.除上述以外，还需要说明的是在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”等，指的是结合该实施例描述的具体特征、结构或者特点包括在本技术概括性描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说，结合任一实施例描述一个具体特征、结构或者特点时，所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发明的范围内。
23.尽管这里参照本发明的多个解释性实施例对本发明进行了描述，但是，应该理解，本领域技术人员可以设计出很多其他的修改和实施方式，这些修改和实施方式将落在本技术公开的原则范围和精神之内。更具体地说，在本技术公开、附图和权利要求的范围内，可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局
进行的变型和改进外，对于本领域技术人员来说，其他的用途也将是明显的。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于建筑信息模型的人工智能孪生式训练方法与流程

基于MTCNN算法的人脸多特征点检测方法及装置与流程

相关文献

最热文献