一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于粒球人脸聚类图像质量评估的数据库精简方法及系统与流程

2022-02-22 10:09:16 来源:中国专利 TAG:


1.本发明涉及图像处理技术领域,具体涉及一种基于粒球人脸聚类图像质量评估的数据库精简方法及系统。


背景技术:

2.当今世界全球化的趋势愈发明显,各个国家纷纷建立起了自己的人脸识别系统,大数据的潮流已经不可阻挡,我们生活的方方面面都离不开大数据的支撑,例如网上购物,购物平台会根据提取用户的平日点击浏览来大致分析出用户的喜好,从而在首页推荐用户想要的物品。人脸数据是大数据领域里非常重要的板块,门禁系统,监控系统等社会生活领域几乎都会用到人脸识别技术,特别是今年来越来越成熟的人脸支付技术,对采集的人脸质量的要求越来越高,如果不能保证人脸数据库的精简,不能及时去除人脸数据库的冗余,就会使数据库里十分混乱,使后续的处理识别变得困难。现有的人脸数据库精简方法并没有考虑背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,造成精简后的数据库仍存在难以识别的问题。


技术实现要素:

3.本发明所要解决的技术问题是现有的人脸数据库精简方法并没有考虑背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,造成精简后的数据库仍存在难以识别的技术问题,目的在于提供一种基于粒球人脸聚类图像质量评估的数据库精简方法及系统,解决了现有的人脸数据库精简方法并没有考虑背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,造成精简后的数据库仍存在难以识别的技术问题。
4.本发明通过下述技术方案实现:
5.一种基于粒球人脸聚类图像质量评估的数据库精简方法,包括:
6.将人脸数据库里的每一张图像均转换为向量;
7.将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;
8.将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;
9.将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;
10.对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;
11.剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。
12.进一步,所述对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数,具体包括:
13.采用质量评估算法brisque对每组粒球中的所有人脸图像进行质量评估,得到精简后的数据库。
14.进一步,所述采用质量评估算法brisque对每组粒球中的所有人脸图像进行质量
评估,得到每张图像的分数,具体包括:
15.步骤一,计算人脸图像的mscn系数;
16.步骤二,将所述mscn系数拟合成ggd:
17.步骤三,选取四个方向分别计算mscn系数,即当前像素与下方、右方、主、次对角线四个方向分别进行如下计算,得到四个mscn系数;
18.步骤四,将所述四个mscn系数拟合成aggd;
19.步骤五,将通过ggd和aggd拟合后的特征向量组合起来,再针对0.5倍人脸图像,重复步骤一至四,把两次得到的共36个特征向量拼接起来,作为输出特征,将所述输出特征输入svm中做回归即可得到每张图像的分数。
20.进一步,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像,具体包括:
21.根据粒球标签,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像。
22.进一步,将所述多个粒球分成若干组之前,还包括:
23.剔除粒球中除了中心点外的其他点。
24.一种基于粒球人脸聚类图像质量评估的数据库精简系统,包括:
25.转换模块,用于将人脸数据库里的每一张图像均转换为向量;
26.训练模块,用于将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;
27.聚类模块,用于将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;
28.分组模块,用于将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;
29.质量评估模块,用于对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;
30.第一剔除模块,用于剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。
31.进一步,所述分组模块具体用于:
32.根据粒球标签,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像。
33.进一步,还包括:
34.第二剔除模块,用于将所述多个粒球分成若干组之前,剔除粒球中除了中心点外的其他点。
35.本发明与现有技术相比,具有如下的优点和有益效果:
36.本发明先通过粒球邻域粗糙集(gbnrs)粒球算法对人脸数据库进行聚类处理,粒球具有很好的鲁棒性,它可以将大部分相似的特征向量划分到一起,从而归纳出属于同一个人的人脸图像,再通过无监督图像质量评估(brisque)方法分别对每一个人的所有人脸图像进行打分,排除质量差的图像,保留质量高的图像,从而达到对数据库精简的目的,节约存储空间,使数据库结构清晰,条理明确。通过这样的技术方案,本发明考虑了背景模糊
程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,既保证高质量图像的存在,不影响后续对数据库的处理识别,又剔除了难以识别的低质量图像,排除了数据库的冗余,解决了现有的人脸数据库精简方法并没有考虑背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,造成精简后的数据库仍存在难以识别的技术问题。
附图说明
37.为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。在附图中:
38.图1为本发明一种基于粒球人脸聚类图像质量评估的数据库精简方法的流程图;
39.图2为本发明一种基于粒球人脸聚类图像质量评估的数据库精简方法中粒球初聚类后的示意图;
40.图3为本发明一种基于粒球人脸聚类图像质量评估的数据库精简方法中剔除粒球中除了中心点外的其他点的示意图;
41.图4为本发明一种基于粒球人脸聚类图像质量评估的数据库精简方法中粒球聚类后的示意图;
42.图5为本发明一种基于粒球人脸聚类图像质量评估的数据库精简系统的原理结构示意图。
具体实施方式
43.为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
44.实施例一
45.请参考图1,本发明实施例提供一种基于粒球人脸聚类图像质量评估的数据库精简方法,包括:
46.s101,将人脸数据库里的每一张图像均转换为向量;
47.s102,将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;
48.s103,将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;
49.s104,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;
50.s105,对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;
51.s106,剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。
52.作为具体实施方式,所述对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数,具体包括:
53.采用质量评估算法brisque对每组粒球中的所有人脸图像进行质量评估,得到精
简后的数据库。
54.作为具体实施方式,所述采用质量评估算法brisque对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数,具体包括:
55.步骤一,计算人脸图像的mscn系数;
56.步骤二,将所述mscn系数拟合成广义高斯分布ggd:
57.步骤三,选取四个方向分别计算mscn系数,即当前像素与下方、右方、主、次对角线四个方向分别进行如下计算,得到四个mscn系数;
58.步骤四,将所述四个mscn系数拟合成非对称性广义高斯分布aggd;
59.步骤五,将通过ggd和aggd拟合后的特征向量组合起来,再针对0.5倍人脸图像,重复步骤一至四,把两次得到的共36个特征向量拼接起来,作为输出特征,将所述输出特征输入支持向量机svm中做回归即可得到每张图像的分数。
60.作为具体实施方式,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像,具体包括:
61.根据粒球标签,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像。
62.作为具体实施方式,将所述多个粒球分成若干组之前,还包括:
63.剔除粒球中除了中心点外的其他点。
64.本发明实施例采用的聚类算法是粒球邻域粗糙集(gbnrs)粒球聚类算法,人脸的特征向量是来自python的一个开源包,人脸聚类算法的参数是粒球的纯度,聚类算法的具体步骤如下:
65.a、将人脸数据库里的每一张图像均转换为向量,再将尺寸为(batch_size,attribute)的特征矩阵放入深度学习中的池化卷积网络进行训练,最后得出尺寸为(batch_size,10)的特征向量。本发明实施例可以采用传统三层lenet神经网络,学习率为0.01,迭代周期为100;
66.b、将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;将所述多个特征向量输入粒球模型进行聚类,形成多个粒球。请参考图2,由于深度学习的进行,相同类别的人脸会逐渐进入同一个粒球里,最终一个粒球中的点代表的人脸图像属于同一个人。图2中包括了多个粒球,其中有一些粒球的颜色相同,相同颜色的粒球中的人脸属于同一个人;
67.c、选出每一个粒球的中心点,剔除粒球中除了中心点外的其他点,请参考图3。因为越接近中心,该点更容易被机器识别,相比于其他点,中心点更能够代表这个人脸的特征,所以剔除粒球中的其他点,这样筛选出来的点更容易被机器识别。
68.本发明实施例对人脸图像进行聚类时,将粒球聚类算法与深度学习方法结合,由于在步骤中剔除了粒球中除了中心点外的其他点,最后分出的粒球数与上一层网络的样本数有偏差,所以需要重写梯度回传函数,在此我们把同一个粒球中的点的梯度设置成中心点的梯度。
69.相对于其他聚类算法,粒球邻域粗糙集(gbnrs)粒球聚类算法具有更好的鲁棒性,因为粒球的特点,可以很好地排除掉噪声(图像质量不高的点)图像,相当于对数据库进行了初步的筛选,而且经过加速后的粒球代码具有比同类聚类算法更快的速度,更加适合于
对人脸数据库的聚类。
70.粒球聚类算法主要需要注意的是粒球的纯度,因为在这里需要加一些噪声,虽然一般来说网络识别的效果已经很好了,但是有一些失败的可能,甚至可能跑到其他球里面,所以设置一定的噪声,这样虽然它可能没有被正确分类,但是也可能会被聚在一起。它的优点是,可以划分复杂形状的数据,并且对于稠密数据集效果比k-means要好,并且可以发现异常的数据点。
71.聚类后的数据库被分割成若干个组,每个组中包括了一个人的所有人脸图像,请参考图4。
72.本发明实施例采用的是无监督图像质量评估(brisque)方法,通过质量评估算法brisque对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数。再剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。
73.本发明实施例先通过粒球邻域粗糙集(gbnrs)粒球算法对人脸数据库进行聚类处理,粒球具有很好的鲁棒性,它可以将大部分相似的特征向量划分到一起,从而归纳出属于同一个人的人脸图像,再通过无监督图像质量评估(brisque)方法分别对每一个人的所有人脸图像进行打分,排除质量差的图像,保留质量高的图像,从而达到对数据库精简的目的,节约存储空间,使数据库结构清晰,条理明确。通过这样的技术方案,本发明实施例考虑了背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,既保证高质量图像的存在,不影响后续对数据库的处理识别,又剔除了难以识别的低质量图像,排除了数据库的冗余,解决了现有的人脸数据库精简方法并没有考虑背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,造成精简后的数据库仍存在难以识别的技术问题。
74.实施例二
75.请参考图5,本发明实施例提供一种基于粒球人脸聚类图像质量评估的数据库精简系统,包括:
76.转换模块,用于将人脸数据库里的每一张图像均转换为向量;
77.训练模块,用于将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;
78.聚类模块,用于将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;
79.分组模块,用于将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;
80.质量评估模块,用于对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;
81.第一剔除模块,用于剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。
82.作为具体实施方式,所述分组模块具体用于:
83.根据粒球标签,将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像。
84.作为具体实施方式,还包括:
85.第二剔除模块,用于将所述多个粒球分成若干组之前,剔除粒球中除了中心点外的其他点。
86.对于实施例二所述系统的具体实现过程,由于在实施例一的方法中已有详细说明,故此处不再赘述。
87.以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献