一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多生物特征自适应融合的身份识别方法及系统

2022-05-21 05:29:32 来源:中国专利 TAG:


1.本发明涉及身份识别技术领域,特别是涉及一种基于多生物特征自适应融合的身份识别方法及系统。


背景技术:

2.人脸识别和步态识别作为目前受关注和应用较为广泛的生物特征身份识别技术,在应用场合和适用条件上具有相似性,因此有着可融合的前提。且在影响因素上,人脸识别容易受到光照、距离、表情、姿态等因素的影响,而步态识别易受年龄、行走条件、身体状况、心理因素、背包等条件的影响。由于这两种生物特征影响因素在外界环境变化时而互不干扰。因此可知步态和人脸这两种生物特征不但可以从一幅步态视频序列中同时获得,还可应用于相同的场合且具有一定的互补性。因此,将人脸特征和步态特征相结合的多生物特征身份识别已成为计算机视觉和模式识别领域的一个新的研究方向。
3.现有技术对于融合步态和人脸的多生物特征身份识别的研究中多是采用正面人脸和侧面步态图像这两种较容易提取相应特征的角度进行识别研究,只有少数采用了对侧面人脸和正面步态或其他某个角度的生物特征图像进行识别,在融合算法上,有数据层、特征层、匹配层和决策层四种融合算法,而以上方法都是在普通情况,背景单一的条件下进行的,使得上述几种身份识别方法在复杂背景下适应性差,识别结果不准确所以需要进行更进一步的研究来提高身份识别方法在复杂背景下适应性,以提高识别的准确度。


技术实现要素:

4.本发明的目的是提供一种基于多生物特征自适应融合的身份识别方法及系统,在背景复杂的情况下,具有很强的适应性可以提高身份识别的准确度。
5.为实现上述目的,本发明提供了如下方案:
6.一种基于多生物特征自适应融合的身份识别方法,包括:
7.获取待识别视频序列,并从所述待识别视频序列中获取一个步态周期内的视频序列得到周期视频;所述待识别视频序列中包括待识别人;
8.获取所述待识别人在所述周期视频中每一帧对应的paf矩阵得到行走特征矢量图;所述paf矩阵包括四肢的paf和躯干的paf;
9.将所述行走特征矢量图分别输入第一卷积神经网络和长短时记忆神经网络得到空间特征矩阵和时间特征矩阵;
10.将所述空间特征矩阵和所述时间特征矩阵进行特征融合得到所述待识别人的步态特征矩阵;
11.获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵;
12.采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果。
13.可选的,所述步态周期的确定方法为:
14.将所述待识别视频序列输入训练好的第二卷积神经网络得到所述待识别人的步态周期。
15.可选的,在所述采用自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果之前还包括:
16.对所述人脸特征矩阵进行降维处理得到降维后的人脸特征矩阵。
17.可选的,所述获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵,具体包括:
18.获取所述待识别视频序列中所述待识别人的人脸图像;
19.将所述待识别人的人脸图像划分成大小相同的细胞单元;
20.根据各细胞单元内像素梯度的方向及幅值计算各细胞单元的梯度直方图;
21.将所有细胞单元的梯度直方图确定为人脸特征矩阵。
22.可选的,所述采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果,具体包括:
23.将所述步态特征矩阵和所述人脸特征矩阵分别对基图像形成的坐标系进行投影得到步态投影矩阵和人脸投影矩阵;
24.根据所述步态投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的步态欧氏距离得到步态欧式距离数组;根据所述人脸投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的人脸欧氏距离得到人脸欧式距离数组;
25.根据所述步态欧式距离数组、所述人脸欧式距离数组、所述步态特征矩阵的拒识率和所述人脸特征矩阵的拒识率计算步态置信度和人脸置信度;
26.根据所述步态置信度计算步态融合权重,根据所述人脸置信度计算人脸融合权重;
27.根据所述步态融合权重和所述人脸融合权重得到所述待识别人的身份识别结果。
28.一种基于多生物特征自适应融合的身份识别系统,包括:
29.视频序列获取模块,用于获取待识别视频序列,并从所述待识别视频序列中获取一个步态周期内的视频序列得到周期视频;所述待识别视频序列中包括待识别人;
30.paf矩阵获取模块,用于获取所述待识别人在所述周期视频中每一帧对应的paf矩阵得到行走特征矢量图;所述paf矩阵包括四肢的paf和躯干的paf;
31.时空特征确定模块,用于将所述行走特征矢量图分别输入第一卷积神经网络和长短时记忆神经网络得到空间特征矩阵和时间特征矩阵;
32.步态特征矩阵确定模块,用于将所述空间特征矩阵和所述时间特征矩阵进行特征融合得到所述待识别人的步态特征矩阵;
33.人脸特征矩阵确定模块,用于获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵;
34.身份识别模块,用于采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所
述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果。
35.可选的,所述视频序列获取模块包括:
36.步态周期确定子模块,用于将所述待识别视频序列输入训练好的第二卷积神经网络得到所述待识别人的步态周期。
37.可选的,所述基于多生物特征自适应融合的身份识别系统,还包括:
38.降维模块,用于对所述人脸特征矩阵进行降维处理得到降维后的人脸特征矩阵。
39.可选的,所述人脸特征矩阵确定模块,具体包括:
40.获取子模块,用于获取所述待识别视频序列中所述待识别人的人脸图像;
41.细胞单元确定子模块,用于将所述待识别人的人脸图像划分成大小相同的细胞单元;
42.梯度直方图确定子模块,用于根据各细胞单元内像素梯度的方向及幅值计算各细胞单元的梯度直方图;
43.人脸特征矩阵确定子模块,用于将所有细胞单元的梯度直方图确定为人脸特征矩阵。
44.可选的,所述身份识别模块,具体包括:
45.投影矩阵确定子模块,用于将所述步态特征矩阵和所述人脸特征矩阵分别对基图像形成的坐标系进行投影得到步态投影矩阵和人脸投影矩阵;
46.欧式距离数组确定子模块,用于根据所述步态投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的步态欧氏距离得到步态欧式距离数组;根据所述人脸投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的人脸欧氏距离得到人脸欧式距离数组;
47.置信度确定子模块,用于根据所述步态欧式距离数组、所述人脸欧式距离数组、所述步态特征矩阵的拒识率和所述人脸特征矩阵的拒识率计算步态置信度和人脸置信度;
48.融合权重确定子模块,用于根据所述步态置信度计算步态融合权重,根据所述人脸置信度计算人脸融合权重;
49.身份识别子模块,用于根据所述步态融合权重和所述人脸融合权重得到所述待识别人的身份识别结果。
50.根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明从待识别视频序列中获取一个步态周期内的视频序列得到周期视频;获取待识别人在周期视频中每一帧对应的paf矩阵得到行走特征矢量图;将特征矢量图分别输入第一卷积神经网络和长短时记忆神经网络得到空间特征矩阵和时间特征矩阵;将空间特征矩阵和时间特征矩阵进行特征融合得到待识别人的步态特征矩阵;使用自适应加权hog特征的人脸识别算法对待识别人的人脸图像进行处理得到人脸特征矩阵;采用基于svm的自适应加权融合算法对人脸特征矩阵、步态特征矩阵和图像数据库中的标准图像进行处理得到待识别人的身份识别结果,将hog算法与svm相结合使得在背景复杂的情况下,具有很强的适应性可以提高身份识别的准确度。
附图说明
51.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所
需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
52.图1为本发明实施例提供的一种基于多生物特征自适应融合的身份识别方法的流程图;
53.图2为本发明实施例提供的步态识别流程图;
54.图3为人体步态序列中的一个步态周期的关键帧示意图;
55.图4为本发明实施例提供的确定步态周期时输出的波形图;
56.图5为本发明实施例提供的人体步态周期确定的流程图;
57.图6为本发明实施例提供的选择后的paf图;
58.图7为本发明实施例提供的一个步态周期内的特征矢量图;
59.图8为本发明实施例提供的视频监控下人脸识别流程图;
60.图9为hog算法示意图;
61.图10为多特征融合的基本流程图。
具体实施方式
62.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
63.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
64.本发明实施例提供的基于多生物特征自适应融合的身份识别方法主要研究内容分为以下几部分:(1)研究结合卷积神经网络和长短记忆网络的步态识别方法;(2)研究基于hog-nmf特征提取算法的人脸识别方法;(3)提取步态和人脸的特征,使用基于决策层的自适应加权融合的方法对提取特征进行融合与识别,基于深度学习的hog结合svm的算法进行目标检测,将步态与人脸识别相融合,采用基于决策层的自适应动态加权融合方法使得在背景复杂的情况下,也具有很强的鲁棒性、更高的识别度及更快的识别速度,具体步骤如图1所示,包括:
65.步骤101:获取待识别视频序列,并从所述待识别视频序列中获取一个步态周期内的视频序列得到周期视频;所述待识别视频序列中包括待识别人。
66.步骤102:获取所述待识别人在所述周期视频中每一帧对应的paf矩阵得到行走特征矢量图;所述paf矩阵包括四肢的paf和躯干的paf。
67.步骤103:将所述行走特征矢量图分别输入第一卷积神经网络和长短时记忆神经网络得到空间特征矩阵和时间特征矩阵。
68.步骤104:将所述空间特征矩阵和所述时间特征矩阵进行特征融合得到所述待识别人的步态特征矩阵。
69.步骤105:获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵。
70.步骤106:采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果。
71.在实际应用中,所述步态周期的确定方法为:
72.将所述待识别视频序列输入训练好的第二卷积神经网络得到所述待识别人的步态周期。
73.在实际应用中,将所述待识别视频序列输入训练好的第二卷积神经网络得到所述待识别人的步态周期具体包括:
74.提取所述待识别视频序列的每一帧图像中的行人区域;
75.将所有帧图像中的行人区域裁剪成尺寸相同的图像;
76.将所有裁剪后的图像输入训练好的第二卷积神经网络得到步态波形;
77.根据步态波形确定步态周期。
78.在实际应用中,在所述采用自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果之前还包括:
79.对所述人脸特征矩阵进行降维处理得到降维后的人脸特征矩阵。
80.在实际应用中,对所述人脸特征矩阵进行降维处理得到降维后的人脸特征矩阵具体包括:
81.对所述人脸特征矩阵取绝对值得到绝对值矩阵。
82.对所述绝对值矩阵进行秩的nmf分解得到基矩阵和系数矩阵。
83.对基矩阵和特征矩阵的每一列向量做归一化处理得到归一化列向量。
84.将所有归一化列向量级联得到降维后的人脸特征矩阵矩阵。
85.在实际应用中,所述获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵,具体包括:
86.获取所述待识别视频序列中所述待识别人的人脸图像。
87.将所述待识别人的人脸图像划分成大小相同的细胞单元。
88.根据各细胞单元内像素梯度的方向及幅值计算各细胞单元的梯度直方图。
89.将所有细胞单元的梯度直方图确定为人脸特征矩阵。
90.在实际应用中,所述采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果,具体包括:
91.将所述步态特征矩阵和所述人脸特征矩阵分别对基图像形成的坐标系进行投影得到步态投影矩阵和人脸投影矩阵。
92.根据所述步态投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的步态欧氏距离得到步态欧式距离数组;根据所述人脸投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的人脸欧氏距离得到人脸欧式距离数组。
93.根据所述步态欧式距离数组、所述人脸欧式距离数组、所述步态特征矩阵的拒识率和所述人脸特征矩阵的拒识率计算步态置信度和人脸置信度。
94.根据所述步态置信度计算步态融合权重,根据所述人脸置信度计算人脸融合权
重。
95.根据所述步态融合权重和所述人脸融合权重得到所述待识别人的身份识别结果。
96.本发明实施例还提供了一种与上述方法对应的基于多生物特征自适应融合的身份识别系统,包括:
97.视频序列获取模块,用于获取待识别视频序列,并从所述待识别视频序列中获取一个步态周期内的视频序列得到周期视频;所述待识别视频序列中包括待识别人。
98.paf矩阵获取模块,用于获取所述待识别人在所述周期视频中每一帧对应的paf矩阵得到行走特征矢量图;所述paf矩阵包括四肢的paf和躯干的paf。
99.时空特征确定模块,用于将所述行走特征矢量图分别输入第一卷积神经网络和长短时记忆神经网络得到空间特征矩阵和时间特征矩阵。
100.步态特征矩阵确定模块,用于将所述空间特征矩阵和所述时间特征矩阵进行特征融合得到所述待识别人的步态特征矩阵。
101.人脸特征矩阵确定模块,用于获取所述待识别视频序列中待识别人的人脸图像并使用自适应加权hog特征的人脸识别算法对所述待识别人的人脸图像进行处理得到人脸特征矩阵。
102.身份识别模块,用于采用基于svm的自适应加权融合算法对所述人脸特征矩阵、所述步态特征矩阵和图像数据库中的标准图像进行处理得到所述待识别人的身份识别结果。
103.作为一种可选的实施方式,所述视频序列获取模块包括:
104.步态周期确定子模块,用于将所述待识别视频序列输入训练好的第二卷积神经网络得到所述待识别人的步态周期。
105.作为一种可选的实施方式,基于多生物特征自适应融合的身份识别系统,还包括:
106.降维模块,用于对所述人脸特征矩阵进行降维处理得到降维后的人脸特征矩阵。
107.作为一种可选的实施方式,所述人脸特征矩阵确定模块,具体包括:
108.获取子模块,用于获取所述待识别视频序列中所述待识别人的人脸图像。
109.细胞单元确定子模块,用于将所述待识别人的人脸图像划分成大小相同的细胞单元。
110.梯度直方图确定子模块,用于根据各细胞单元内像素梯度的方向及幅值计算各细胞单元的梯度直方图。
111.人脸特征矩阵确定子模块,用于将所有细胞单元的梯度直方图确定为人脸特征矩阵。
112.作为一种可选的实施方式,所述身份识别模块,具体包括:
113.投影矩阵确定子模块,用于将所述步态特征矩阵和所述人脸特征矩阵分别对基图像形成的坐标系进行投影得到步态投影矩阵和人脸投影矩阵。
114.欧式距离数组确定子模块,用于根据所述步态投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的步态欧氏距离得到步态欧式距离数组;根据所述人脸投影矩阵计算所述待识别视频序列中的图像与图像数据库中的各标准图像的人脸欧氏距离得到人脸欧式距离数组。
115.置信度确定子模块,用于根据所述步态欧式距离数组、所述人脸欧式距离数组、所述步态特征矩阵的拒识率和所述人脸特征矩阵的拒识率计算步态置信度和人脸置信度。
116.融合权重确定子模块,用于根据所述步态置信度计算步态融合权重,根据所述人脸置信度计算人脸融合权重。
117.身份识别子模块,用于根据所述步态融合权重和所述人脸融合权重得到所述待识别人的身份识别结果。
118.本发明实施例还提供了更加具体的基于多生物特征自适应融合的身份识别方法:
119.步骤一:步态识别
120.为提高多视角下的服饰改变和存在携带物等诸多干扰影响下的步态识别准确率,本实施例采用卷积神经网络及长短记忆网络相结合的步态识别方法。该方法既保留了步态空间及实践信息,又避免了冗余信息,有利于步态特征的学习和训练,提高了检测方法的识别率、鲁棒性和实时性。对应流程如图2所示,根据行人视频序列得到步态周期检测,然后得到人体行走特征矢量图,再然后进行特征提取(卷积神经网络进行空间特征提取,长短时记忆网络进行时间特征提取),再然后进行步态匹配结果,最后融合输入。具体步骤如下:
121.1)步态周期检测
122.本实施例用卷积神经网络完成步态周期检测,卷积神经网络算法有出众的特征学习能力,可以自动提取步态轮廓序列的周期特征,相对于传统方法中的单一人工特征,利用此方法可以达到更好的效果和鲁棒性,从而提高后续步态识别在复杂场景下的识别精度。
123.步态周期的定义是指一只脚接触到地面至同一只脚再接触到地面所用的时间,其中有4个关键帧,第一个帧为两脚并找时左脚准备迈动,第二个帧为两脚并找时右脚准备迈动,第三个帧为两脚分开时右脚在后,第四个帧为两脚分开时左脚在后。关键帧的提取大大减少了后续步态特征的计算量。如图3所示。
124.首先将视频序列做裁剪及调整的标准化处理,其目的是避免人与摄像机之间的距离和角度变化的对轮廓的影响。然后通过处理后的图像序列的顶部和底部像素来提取行人的区域,计算其重心。利用重心、轮廓高度和宽高比将每一帧裁剪成72
×
96的行人轮廓图形成步态序列。然后将步态序列送入训练好的第二卷积神经网络中,最后将输出的波形如图4所示,进行滤波,得到一个完整的步态周期。具体过程如图5所示。
125.对于输入的步态序列{d1,d2,
···
,dn}通过标准化后得到d={d
norm1
,d
norm2
,
···
,d
normn
}的标准步态序列,将此序列通过训练好的第二卷积神经网络s进行卷积,b=s*d得到相对应的输出的分类结果{b1,b2,
···
,bn},其中将步态周期进行了4分类(关键帧)建模,当b1与bi的分类结果相同且{b2,b3,
···
,b
i-1
}中按顺序包含其他分类结果时即{b1,b2,
···
,bi}为一个步态周期。由于视频中帧数从几十帧到上百帧,仅需要检测人体运动的一个步态周期作为后续特征提取,同时每个人都用一个步态周期序列的特征作为识别,减少特征的多样性,识别率也会提高,其中dn表示第n个行人轮廓图,d
normn
表示通过标
126.准化后的第n个行人轮廓图。
127.2)数据选择及paf提取
128.人体部位关联场(part affinity field,paf),paf是提供人体各部位的位置和方向信息的矩阵,它们成对出现:对于每一部位在x方向上有一个paf,记为x-paf,在y方向上有一个paf,记为y-paf。paf是一个大小为w
×h×
c的3维矩阵,其中,w形为宽度,h为高度,c为层数。
129.本实施例中,宽度和高度均为46,层数为57。前18层为人体18个关键点的位置,第19层为背景,上述19层构成热图。后38层为paf,其中,奇数层为x方向上的x-paf,偶数层为y方向的y-paf,这38层构成了大小为46
×
46
×
38的paf矩阵。
130.在步态视频中,由于后续有针对头部的人脸检测,且头部经常不规则地摇动,因此头部的paf提取变得困难且意义不大。
131.本实施例忽略头部的步态特征信息,主要考虑四肢和躯干,如图6所示。从原始paf中去除的和头部相关paf,层数则变为24,此时paf矩阵缩小为46
×
46
×
24。
132.3)人体行走特征矢量图的形成
133.缩减后的paf每帧图像的矩阵大小为46
×
46
×
24,取沿时间轴的视频序列长度为tc,则行走特征矢量图大小为tc×
46
×
46
×
24。如图7所示。
134.4)特征提取与步态匹配
135.设计空、时网络对行走特征矢量图进行特征学习以及步态匹配。其中第一卷积神经网络将动作特征矩阵m
p
经过第一卷积神经网络分支的4次卷积和池化后,在flatten层转换为一维动作特征矢量。长短记忆神经网络分支将运动约束矩阵mq经过两层长短时记忆网络后在flatten层转换为一维运动约束向量;最后,将两路一维向量合并后,得到步态匹配输出序列。
136.①
输入层:输入的矩阵大小为tc×
46
×
46
×
24。
137.②
第一卷积神经网络(空间特征提取):将行走特征矢量图输入第一卷积神经网络得到空间特征矩阵,对输入进行卷积计算,并调整批量归一化和线性整流函数的位置。然后进行一次卷积操作以调整输入的通道尺寸,同时在3
×
3卷积层进行了两次降维,则输出的空间特征形状为tc×
12
×
12
×
512。
138.③
长短记忆神经网络(时间特征提取):将行走特征矢量图输入长短时记忆神经网络得到时间特征矩阵,将第1个全连接的输出重塑为单层单向长短期记忆神经网络的输入形式,设此网络的训练集样本数量为n,隐藏层节点数为512,则其结构为(n,tc,512),最后空间和时间特征矩阵融合得到步态特征矩阵也就是步态匹配序列,输出为步态匹配序列(n,512)。
139.步骤二:人脸识别
140.一个完整的基于监控视频的人脸识别系统可分为:人脸检测、特征提取和分类识别三大模块,流程图如图8所示,首先进行视频捕捉,其次进行人脸检测,判断是否存在人脸,若不存在再返回人脸检测步骤,若存在则依次进行特征提取、降维并选择最优特征和分类识别得到人脸特征。
141.本实施例通过对hog特征和人脸局部特征对识别的贡献率不同的研究分析提出一种有很好的鲁棒性的自适应加权hog特征的人脸识别算法。
142.hog算法的主要目的是对图像进行梯度计算,统计图像的梯度方向和梯度大小。它提取的边缘和梯度特征能够很好的抓住局部形状的特点,并且因为对图像做了gamma校正和cell方式进行归一化处理,对几何和光学变化都有很好的不变性,变换或旋转对于足够小的区域影响很小。因此hog算法是对表情变化、光照、场景变化等线性变换具有良好的鲁棒性。
143.1、hog算法提取人脸特征的过程如下:
144.1)把捕捉到的整张人脸图像看成一个特征采集窗口。
145.2)在此采集窗口内设置一个滑动区域块block,并把block划分为若干大小统一的细胞单元cell,如图9(a)所示。
146.3)在细胞单元内根据各像素梯度的方向及幅值计算当前cell的梯度直方图,进而联合所有cell的梯度直方图作为当前block的梯度直方图,为了降为了进一步降低光照、背景、表情、姿态等的影响,需要将直方图做归一化处理。本实施例采用l2-norm归一化处理。
147.4)然后把block沿着当前窗口的水平和竖直方向按着一定的步进平移,如图9(b)所示,每平移一定的距离即统计当前block的梯度直方图,最后级联所有block的梯度直方图作为最终的人脸特征。
148.对一个尺度大小为80
×
120的人脸图像进行hog特征提取步骤具体如下:
149.①
设置滑动区域块block的大小为20
×
20。
150.②
每个block均匀划分为16个cell单元,每个cell尺寸大小为5
×
5。设cell内任意像素点(x,y)的灰度值为h(x,y),计算其水平梯度h
x
(x,y)和垂直梯度hy(x,y)则像素点(x,y)的梯度幅值i(x,y)和梯度方向分别为
151.和
152.③
将每个cell单元梯度方向均等划分为10个有符号的方向,每个方向为大小则为18
°
,每个cell单元直方图维度大小为10维。
153.④
随后级联当前block区块内16个cell的梯度直方图,得到160维的直方图特表示当前block区块的梯度直方图特征,同时进行归一化处理。
154.⑤
然后将block区块按水平和垂直方向步进值均为20在人脸图像上进行滑动,重复上述步骤得到滑动区块的梯度直方图,最后级联所有区块的梯度直方图作为最终人脸的梯度直方图特征。最终梯度直方图维度大小为4
×6×
160=3840维。
155.2、特征提取降维处理
156.hog特征提取的维数较大,例如典型的120
×
80解析度的图像形成的特征向量为3840维,本实施例采用非负矩阵分解(non-negative matrix factorization nmf)对其进行降维处理,形成hog-nmf特征序列以满足系统实时性的要求。nmf是在一定代价函数约束下的最优化过程,是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法,可通过迭代运算求其近似解,其具体流程如下:
157.1)设f是长为l的hog特征向量(降维前的人脸特征矩阵),将其取绝对值并将其转换为m
×
n的矩阵g,其中l=m
×
n且m>n。
158.2)对矩阵g根据公式g=zy
t
进行秩r的nmf分解,r<<m,式中z和y分别是m
×
r和n
×
r的非负的基矩阵和系数矩阵。
159.3)对z和y矩阵每一个列向量hi做归一化处理,即hi=hi/||hi||。
160.4)最后,将所有的归一化列向量hi级联成hog-nmf特征即最终的人脸特征。
161.本实施例以120
×
80解析度为例,经hog提取特征时输出3840维,即l=3840,取m=480,n=8,r=2,经nmf降维后,特征的长度变为986,特征维数减少了75%。通过低秩分解得到的基矩阵和系数矩阵蕴含了原始矩阵的主要特征,所以hog-nmf特征很好地继承hog的优
良特性,同时大大提高了后续融合算法的实时性。
162.步骤三:身份识别
163.多生物特征的信息融合方法可以主要分为数据层融合、特征层融合、匹配层融合和决策层融合四种,图10为多特征在不同层次上进行融合的过程,本实施例采用基于决策层的自适应加权融合方法。通过在决策层上将每个生物特征的距离匹配值进行自适应分配权值以获得最优的联合匹配分数,可以达到最好的信息融合效果。
164.决策级图像融合是一种更高层次的信息融合,其结果将为各种控制或决策提供依据。这种方法是首先对各个源数据进行处理,分别得出判断和识别的结果,融合中心将这些结果按照一定的准则和每个数据源决策的可信度进行协调,以取得最优的决策结果。决策级融合方法主要是基于认知模型的方法,需要大型数据库和专家决策系统,进行分析、推理、识别和判决。此种融合实时性好,并且有一定的容错能力。
165.决策级融合是一种高层次融合,它首先将不同的特征进行独立处理获得识别结果,然后将得到的多个识别结果采用融合算法进行综合,最终得到最后的结果。决策层次的融合具有灵活性高、抗干扰能力强、处理代价低、对传感器依赖少等优点。
166.基于svm(支持向量机)算法是目前智能融合分类方法中运用最好的方法之一,根据有限的样本信息构造一个具有最好推广能力的模型,即在模型复杂和学习能力之间寻求最佳权衡,它特有的许多优势同时体现在线性和非线性分类问题中。
167.本实施例在svm算法基础上,为了提高决策层的融合算法的鲁棒性,利用不同模态的特征层的判别结果(距离信息)辅助引导决策层融合,引入拒识率进行置信度的权重判定,形成一种自适应的加权融合算法,从而得出识别结果。
168.决策层融合算法步骤:
169.1)将步骤一得到的步态特征和步骤二得到的人脸特征的一维特征列向量c对基图像(首先读入人脸和步态的训练图像数据库,得到训练图像矩阵v=(v1,v2....vn),n为训练库中图像数量,列向量vi代表一张训练图像。通过nmf变换公式v=ah得到一个新的矩阵,h为投影系数矩阵,a矩阵里的每一列为一副基图像)所形成的坐标系上进行投影r=c
·
a,得到投影矩阵r(人脸投影矩阵和步态投影矩阵),然后根据投影矩阵求出待识别图像与所有n幅的已有训练图像(自己输入到创建的训练库中的图像或视频,或者是已有的成品库)的欧氏距离(人脸欧氏距离和步态欧氏距离),将所有已有训练图像的欧氏距离确定为欧式距离数组(步态欧式距离数组和人脸欧式距离数组)。其中,步态欧式距离数组记为ob={ob1,ob2···
obn},人脸欧式距离数组记为of={of1,of2···
ofn}。然后利用线性归一化方法将得到的步态距离匹配值数组和人脸距离匹配值数组分别按公式进行归一化处理得到归一化后的步态距离匹配值数组和归一化后的人脸距离匹配值数组,式中:ro为欧式距离数组,r
norm
为线性归一化后的欧式距离数组。由此得到归一化后的步态欧式距离数组rb={r
b1
,r
b2
,
···
,r
bn
}和归一化后的人脸欧式距离数组rf={r
f1
,r
f2
,
···
,r
fn
},通过线性归一化方法可以将欧式距离数组映射到[0,1]区间中去,且不会改变原始匹配数据的分布形式。
[0170]
2)归一化后的步态距离匹配值数组和归一化后的人脸距离匹配值数组后,可作为后续计算置信度的参数之一。但如何分配每个数组中的子函数所占的权重以达到最好的融
合效果是整个决策层融合好坏的核心问题。因此,本实施例将拒识率引入决策层算法的运算。拒识率(false rejection rate,frr)在系统识别中是衡量系统分类性能的一个重要参数。尤其在多模态识别过程中,各个模态之间的分类性能差异会降低系统的识别精度。因此,将拒识率纳入置信度的计算,可以提高信息融合提取分类的能力及增强系统的鲁棒性。本实施例根据归一化特征距离信息(是步态和人脸两种的归一化后的欧式距离数组)以及拒识率,分别计算每个模态(步态和人脸)的置信度为:
[0171]
其中,r
b,f
分别为归一化后的欧式距离数组;n为归一化后的欧式距离数组中数值的总个数;frr
b,f
分别为模态的拒识率,当计算步态置信度时,公式中就应用归一化后的步态欧式距离数组和步态特征的拒识率,当计算人脸置信度时,公式中就应用归一化后的人脸欧式距离数组和人脸特征的拒识率。由置信度公式可知,每个模态的置信度是由归一化后的欧式距离数组和分类器的性能参数共同决定的。由此,可分别计算每个模态在决策层融合的权重w
b,f
为:其中,0≤w
b,f
≤1,m为识别模态数量,本实施例是步态和人脸两种,则m=2,且通过指数关系将置信度转化为步态和人脸的权重因子,以此来强化高置信度和高权重因子之间的关系,得到的融合系统对噪声的鲁棒性更强。模态权重值反映了两种模态的子分类结果在决策中所处的地位,因此会直接影响到最终决策的质量和效果。权重因子越高,对应模态的分类能力越强,对于最终决策的影响程度就越大。这样可以很好的发挥两种识别模式的优势互补,提高整个系统的识别率和抗干扰性。
[0172]
3)最后,在决策融合时,利用权重因子作为子决策的权重根据公式得出最终的身份识别结果t,其中式中,表示组态识别系数,t
b,f
分别为模态的识别结果;oi为目标类别(目标类别分为采集的步态和人脸两种)。本实施例所提出的基于特征信息和拒识率引导的决策融合方法,由于归一化特征距离(归一化后的欧式距离数组)来自不同模态,其匹配距离所包含的信息不同,所以此特征距离是非标准化的,是动态变化的。本方法的优点在于通过提取不同模态归一化特征距离在分布上的有效信息,同时加上不同模态系统的拒识率,得到该模态的置信度。将这个置信度通过数学映射得出对应的权重因子,根据不同的权重进行决策级的融合,是一种动态的、自适应的加权融合识别算法。
[0173]
本发明有以下技术效果:
[0174]
1、本发明在背景复杂的情况下,具有很强的鲁棒性。
[0175]
2、基于大多数研究未考虑服饰改变、携带物品等干扰因素造成的识别率降低问题,本发明只是对普通行人行走下的识别,对此提出了一种融合卷积神经网络与长短记忆网络的方法,既可以提取出目标的动态和静态特征又可以降低服饰改变、携带物品等干扰
因素的影响。
[0176]
3、本发明在svm算法基础上,为了提高决策层的融合算法的鲁棒性,利用不同模态的特征层的判别结果(距离信息)辅助引导决策层融合,引入拒识率进行置信度的权重判定,形成一种自适应的加权融合算法,从而得出识别结果。此方法很好的发挥两种识别模式的在不同角度、不同场景下的优势互补,提高整个系统的识别率、抗干扰性及适用范围。在实际应用中,可以在少量增加系统成本和用户负担的情况下,有效地改善身份识别系统的性能。
[0177]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0178]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献