一种刷脸支付意愿识别方法、装置以及设备与流程

2022-05-18 12:26:01 来源：中国专利 TAG：

1.本说明书涉及计算机技术领域，尤其涉及一种刷脸支付意愿识别方法、装置以及设备。

背景技术：

2.随着计算机和互联网技术的发展，很多业务都可以在线上进行，促进了各种线上业务平台的发展。其中，刷脸支付是指基于人工智能、机器视觉、3d传感、大数据等技术实现的新型支付方式，通过采用人脸识别作为身份验证的支付方式，给用户带来了极大的便利性，受到用户的普遍喜爱。
3.目前，在刷脸支付场景中，待支付用户开启刷脸支付后，需要站在具有刷脸支付功能设备的前方，进行人脸识别。但是，在刷脸的过程中，可能在设备的前方站着多个用户，将导致设备采集的刷脸图像中，出现多个用户。此时，设备对刷脸图像进行人脸识别时，难以判断哪个用户是当前的待支付用户，即，哪个用户具有刷脸支付意愿。换言之，只有当前的待支付用户具有刷脸支付意愿，而其他用户则不具有刷脸支付意愿。
4.基于此，刷脸支付意愿识别是对支付系统中刷脸安全保障的重要环节，有助于提升刷脸安全体验，但是，设备如果识别到其他用户，对其他用户进行识别，将出现误刷脸支付，从而降低刷脸支付的安全性。
5.基于此，对于刷脸支付需要更安全的识别方案。

技术实现要素：

6.本说明书一个或多个实施例提供一种刷脸支付意愿识别方法、装置、设备以及存储介质，用以解决如下技术问题：对于刷脸支付需要更安全的识别方案。
7.为解决上述技术问题，本说明书一个或多个实施例是这样实现的：
8.本说明书一个或多个实施例提供的一种刷脸支付意愿识别方法，包括：
9.获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
10.根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
11.提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
12.根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
13.本说明书一个或多个实施例提供的一种刷脸支付意愿识别装置，包括：
14.获取模块，获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
15.生成模块，根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
16.提取模块，提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
17.识别模块，根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
18.本说明书一个或多个实施例提供的一种刷脸支付意愿识别设备，包括：
19.至少一个处理器；以及，
20.与所述至少一个处理器通信连接的存储器；其中，
21.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：
22.获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
23.根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
24.提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
25.根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
26.本说明书一个或多个实施例提供的一种刷脸支付意愿识别非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：
27.获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
28.根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
29.提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
30.根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
31.本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果：
32.通过为各候选人在刷脸图像中所处区域，分别生成对应的掩码图，能够将该候选人的特征信息更加鲜明化，从而增加了具有刷脸支付意愿与不具有刷脸支付意愿的差异性，通过融合特征，识别各候选人是否具有刷脸支付意愿，实现了增强图像对比效果，从而实现了将注意力集中至具有刷脸支付意愿的候选人，能够更加将刷脸图像中具有刷脸支付意愿的候选人与不具有刷脸支付意愿的候选人进行准确区分，更有针对性地识别刷脸图像中候选人的刷脸支付意愿，从而能够增强刷脸安全体验，有效保障刷脸系统的可用安全性。
附图说明
33.为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
34.图1为本说明书一个或多个实施例提供的一种刷脸支付意愿识别方法的流程示意图；
35.图2为本说明书一个或多个实施例提供的一种刷脸支付意愿识别系统的框架示意图；
36.图3为本说明书一个或多个实施例提供的一种基于深度卷积神经网络端到端学习
的刷脸支付意愿识别方法的流程示意图；
37.图4为本说明书一个或多个实施例提供的一种刷脸支付意愿识别装置的结构示意图；
38.图5为本说明书一个或多个实施例提供的一种刷脸支付意愿识别设备的结构示意图。
具体实施方式
39.本说明书实施例提供一种刷脸支付意愿识别方法、装置、设备以及存储介质。
40.为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本技术保护的范围。
41.图1为本说明书一个或多个实施例提供的一种刷脸支付意愿识别方法的流程示意图。该流程可以由具有刷脸支付功能的电子设备执行，该电子设备可以是具备图像数据处理功能的终端，例如，可以是手机、平板、笔记本等移动终端，也可以是台式机等固定终端或服务器，流程中的某些输入参数或者中间结果允许人工干预调节，以帮助提高准确性。
42.图1中的流程可以包括以下步骤：
43.s102：获取刷脸图像，并在所述刷脸图像中确定待识别的候选人。
44.在本说明书的一个或多个实施例中，可以是电子设备在接收到刷脸支付指令后，通过预先安装的摄像设备获取刷脸图像，也可以是电子设备根据支付订单生成刷脸支付指令，通过摄像设备获取刷脸图像。其中，刷脸图像可以是从视频或者图像中获取的单帧图像。
45.待识别的候选人是指需要支付相关费用的用户，需要说明的是，候选人想要进行刷脸支付，需要在对应的客户端上进行身份信息注册，并录入人脸信息，用于在候选人开启刷脸支付时，识别到候选人具有刷脸支付识别意愿之后，通过预先注册的人脸信息对该候选人进行身份认证。
46.即，在刷脸图像中包括候选人的人脸信息，通过识别人脸信息能够获取到候选人是否具有刷脸支付意愿，然后通过人脸信息能够对候选人进行身份认证。
47.其中，摄像设备前方的候选人的数量可以为一个或者多个，当候选人的数量为多个时，则刷脸图像中包括多个候选人，当候选人的数量为一个时，则刷脸图像中包括一个候选人。同时，刷脸图像不仅包括候选人的人脸信息，还可以包括候选人的其他特征信息，比如，躯干信息以及四肢信息，也可以包括其他不需要识别的对象，比如，候选人所处环境中所包括的的桌椅、悬挂物等。
48.另外，通常情况下，电子设备在执行单次刷脸支付指令时，是为了对当前开启刷脸支付的特定候选人进行身份认证，而该特定候选人通常也具有刷脸支付意愿，也就是说，在执行单次刷脸支付指令时，即使刷脸图像中包括多个候选人，但是，该多个候选人并非都具有刷脸支付意愿，只有特定候选人具有刷脸支付意愿，可以认为该特定候选人为支付意愿安全，其他候选人为支付意愿非安全。
49.例如，在公共场合中，通常采用线下物联网(internet of things，iot)刷脸机具进行刷脸支付。其中，公共场所的刷脸iot机具是指商超/便利店/餐饮/酒旅/校园教育医疗/校园教育等公共消费场景设置的具有刷脸功能的机具。
50.如果a候选人点击刷脸支付，则将开启刷脸支付，iot刷脸机具接收到刷脸支付指令，通过摄像设备获取到刷脸图像，由于处在开放的公共场所，存在着多个候选人排队支付的情景，那么iot机具获取的刷脸图像中极有可能包括多个候选人，但是，在多个候选人中，实际上只有a候选人具有刷脸支付意愿，此时需要识别到a候选人具有刷脸支付意愿的前提下，通过a候选人的人脸信息对a候选人进行身份认证，即，其他候选人实际上并不具有刷脸支付意愿。
51.进一步地，假如b候选人排在a候选人的后面，那么即使b候选人没有刷脸支付意愿，a候选人在刷脸支付认证的过程中，摄像设备可能拍摄a候选人的同时，拍摄到b候选人，导致拍摄的刷脸图像中既包括a候选人，又包括b候选人。如果电子设备在识别刷脸图像的过程中，没有将a侯选人作为刷脸用户，而是误识到b候选人，那么电子设备不对b候选人识别是否具有刷脸支付意愿的话，，而是直接对b候选人进行身份认证，在认证通过后，将通过b候选人的账户进行支付，从而误刷b候选人的资产，导致b候选人的资产损失。
52.s104：根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域。
53.在本说明书的一个或多个实施例中，所述区域可以包括候选人的外观特征信息，比如，人脸信息、躯干信息、四肢信息，但是为了增加识别结果的准确性，所处区域主要包括候选人的人脸信息。同时，可以根据候选人在刷脸图像中的位置信息确定所处区域。
54.由于图像的掩码操作是指通过掩码核算子重新计算图像中各个像素的值，掩码核算子刻画领域像素点对新像素值得影响程度，同时根据掩码算子中权重因子对像素点进行加权平均，图像掩码操作常用于图像平滑、边缘检测、特征分析等区域，因此可以通过掩码操作，区别候选人在刷脸图像中的所处区域和刷脸图像中的其他区域。
55.需要说明的是，单个候选人在刷脸图像中的所处区域，对应单张掩码图，也就是说，如果刷脸图像中有多个候选人，则为每个候选人均生成一张对应的掩码图，最终得到多张掩码图。
56.也就是说，在单张掩码图中，能够区分所处区域与其他区域，比如，将所处区域填充值作为1，将其他区域填充值作为0(也可以采用其他的具有较高区分度的不同填充值)。即，通过生成每个候选人对应的掩码图，能够将该候选人的特征信息更加鲜明化，从而增加了具有刷脸支付意愿与不具有刷脸支付意愿的差异性。
57.s106：提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征。
58.在本说明书的一个或多个实施例中，如何提取刷脸图像的特征，在此不作限定，比如，通过特征提取模型提取刷脸图像的特征。特征可以包括各候选人的人脸特征、躯干特征、四肢特征。其中，对于人脸特征可以是候选人的人脸的全局特征，通过全局特征识别人脸，能够提高识别结果的准确度。
59.当然，在得到掩码图之后，可以通过将刷脸图像的特征和掩码图输入融合特征提取模型中，得到融合特征。
60.通过提取刷脸图像的特征，将刷脸图像的特征与掩码图进行结合，相当于为刷脸图像的特征新增加了一个通道，即，增加刷脸图像的特征的通道数量，从而得到融合特征，在融合特征中，则更加注意刷脸图像中的对应候选人的人脸特征，能够更加将刷脸图像中具有刷脸支付意愿的候选人与不具有刷脸支付意愿的候选人进行准确区分。
61.s108：根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
62.在本说明书的一个或多个实施例中，根据融合特征确定出刷脸图像信息，刷脸图像信息中包括候选人的特征信息。其中，更为关注该融合特征的掩码图所对应的候选人的特征信息，特征信息主要包括对应候选人的人脸信息。即，在生成一张掩码图时，则执行一次识别过程，识别掩码图对应的候选人是否具有刷脸支付意愿。
63.需要说明的是，可以结合预设规则识别所对应的候选人是否具有刷脸支付意愿，比如，识别到该候选人的人脸区域位于正中间区域，则认为该候选人具有刷脸支付意愿，或者，识别到该候选人的人脸区域占据刷脸图像的大部分区域，则认为该候选人具有刷脸支付意愿，或者识别到该候选人的人脸区域占据刷脸图像的大部分区域，并且人脸角度符合预设角度阈值，则认为该候选人具有刷脸支付意愿。
64.进一步地，可以将融合特征输入支付意愿识别模型，通过支付意愿识别模型识别出刷脸图像信息，并根据预设规则输出处理结果，然后，根据处理结果生成刷脸支付意愿概率值，可以通过刷脸支付意愿概率值判断候选人是否具有刷脸支付意愿。
65.其中，处理结果可以是支付意愿识别模型生成的用于表示刷脸支付意愿概率值的向量。
66.比如，若概率值大于预设概率阈值，则可以认为候选人具有刷脸支付意愿，即，电子设备的刷脸支付指令为该候选人开启刷脸支付之后，所生成的，若概率值小于或者等于预设概率阈值，则可以认为候选人不具有刷脸支付意愿。即，电子设备的刷脸支付指令不是该候选人开启刷脸支付之后，所生成的，而是其他候选人开启刷脸支付之后，所生成的。
67.进一步地，若是概率值大于预设概率的候选人的数量为多个，则说明本次刷脸支付意愿识别的结果不可信，将提示认证失败。反正，若不存在概率值大于预设概率的候选人，则同样说明本次刷脸支付意愿识别的结果不可信，将提示认证失败。
68.通过图1的方法，通过为各候选人在刷脸图像中所处区域，分别生成对应的掩码图，能够将该候选人的特征信息更加鲜明化，增加了具有刷脸支付意愿与不具有刷脸支付意愿的差异性，通过融合特征，识别各候选人是否具有刷脸支付意愿，能够增强图像对比效果，从而实现了将注意力集中至具有刷脸支付意愿的候选人，从而能够更加将刷脸图像中具有刷脸支付意愿的候选人与不具有刷脸支付意愿的候选人进行准确区分，更有针对性地识别刷脸图像中候选人的刷脸支付意愿，从而能够增强刷脸安全体验。
69.基于图1的方法，本说明书还提供了该方法的一些具体实施方案和扩展方案，下面继续进行说明。
70.在本说明书一个或多个实施例中，在生成对应的掩码图时，
71.具体地，在确定出候选人之后，提取刷脸图像中候选人的人脸区域，比如，首先通过人脸提取模型提取候选人在刷脸图像中的人脸，然后通过人脸的位置信息，确定出候选人的人脸区域。然后对人脸区域进行处理，确定人脸区域选择框。其中，人脸区域选择框可以有多种展示方式，比如，圆形框、矩形框、不规则多边形框等，但是，有一个前提条件，为了
保证识别结果的准确性，人脸区域选择框必须全部包围候选人的人脸区域。
72.在得到人脸区域选择框之后，将根据候选人的人脸区域选择框，确定该候选人对应的的掩码图的第一填充区域。其中，第一填充区域的形状可以有多种展示方式，在此不作限定，比如，圆形区域、矩形区域、不规则多边形区域等。但是，有一个前提条件，为了保证识别结果的准确性，在确定第一填充区域时，要结合人脸区域选择框，尽可能接近实际的人脸区域。
73.在确定第一填充区域之后，在刷脸图像中继续确定出除第一填充区域之外的第二填充区域，并且为第一填充区域与第二填充区域赋予不同的填充值。
74.需要说明的是，为了掩码图中的第一填充区域尽可能与刷脸图像中的人脸区域相符，从而在为第一填充区域与第二填充区域赋予不同的填充值之后，生成分辨率与所述刷脸图像的分辨率一致的掩码图。
75.进一步地，由于人脸区域大部分是圆形区域或者椭圆形区域，因此为了使得第一填充区域更加贴合候选人的人脸区域，将第一填充区域作为圆形区域。
76.具体地，在对人脸区域进行处理，确定人脸区域选择框时，将人脸区域选择框确定为矩形框。在得到矩形框的人脸区域之后，通过矩形框在刷脸图像中的位置，计算人脸框宽与人脸框高，通过人脸框宽与人脸框高计算圆形区域的半径。
77.其中，在计算圆形区域的半径时，由于人脸区域为圆形区域或者椭圆形区域，那么在最初生成矩形框时，人脸区域类似于矩形框的内切圆，因此为了最大可能还原人脸区域，同时保证第一填充区域尽可能包括全部的人脸区域，取矩形框宽一半长度与框高一半长度之间的最大值，作为圆形区域的半径。
78.因此，将矩形框的中心作为圆心，确定矩形框的最长边的一半长度，作为半径，然后基于圆心和半径构成的圆形区域，确定为该候选人对应的掩码图的第一填充区域。
79.例如，假设候选人的人脸矩形框在刷脸图像中的位置为(x1，y1，x2，y2)，其中，x1与x2分别为矩形框宽在x轴的位置坐标，y1与y2分别为矩形框高在y轴的位置坐标。
80.则计算人脸框宽的表达式为w＝x
2-x1，其中，w为人脸框宽。需要说明的是，x1的位置坐标小于x2的位置坐标。
81.则计算人脸框高的表达式为h＝y
2-y1，其中，h为人脸框高，需要说明的是，y1的位置坐标小于y2的位置坐标。
82.确定圆形区域半径的表达式为其中，r为圆形区域半径。
83.基于此，矩形框的中心的位置坐标为r为
84.在本说明书一个或多个实施例中，更直观地，结合图2-图3，对本方案进行更具体的说明。
85.图2为本说明书一个或多个实施例提供的一种刷脸支付意愿识别系统的框架示意图。
86.在本说明书一个或多个实施例中，为了更加准确地识别候选人的刷脸支付意愿，提出了对刷脸支付过程中获取的刷脸图像，采用深度卷积神经网络端到端学习的方式，能够实现刷脸支付意愿安全检测，并引入候选人区域注意力机制，以便将掩码图融入到网络学习中，使得更有针对性地识别刷脸图像中候选人的刷脸支付意愿，从而能够增强刷脸安
全体验。
87.如图2所示，刷脸支付意愿识别系统采用深度卷积神经网络端到端学习的方式实现，该系统包括刷脸图像、候选人在刷脸图像中的所处区域生成的掩码图、第一卷积网络模块、候选人所处区域注意力机制实施模块、第三卷积模块、网络输出。
88.需要说明的是，第一卷积网络与第三卷积网络具有特定的对应关系，也就是说，第一卷积网络与第三卷积网络的所涉及的具有网络类型，在此不作限定，但是，两者之间不是割裂的，比如，第一卷积网络与第三卷积网络属于同一识别网络类型的不同部分。
89.其中，刷脸图像与生成的掩码图作为深度卷积神经网络的输入数据，网络输出为刷脸支付意愿概率值，即，意愿安全概率以及意愿非安全概率。
90.基于此，刷脸支付意愿识别的过程中，首先通过第一卷积网络，提取到刷脸图像的特征，将刷脸图像的特征和掩码图输入候选人所处区域注意力机制实施模块，候选人所处区域注意力机制实施模块对刷脸图像的特征和掩码图进行处理，输出融合特征。最后，将融合特征输入第三卷积网络，通过第三卷积网络对融合特征进行处理，得到处理结果。
91.下面继续说明候选人所处区域注意力机制实施模块具体如何对刷脸图像的特征和掩码图进行处理，输出融合特征。
92.如图2所示，候选人所处区域注意力机制实施模块包括刷脸图像的特征、降分辨率处理后的掩码图，第二卷积网络模块，融合特征。
93.具体地，刷脸支付意愿识别的过程中，首先将刷脸图像输入第一卷积网络模块中的第一卷积网络，通过第一卷积网络，提取到刷脸图像的特征，并且对掩码图进行降分辨率处理，得到降分辨率处理后的掩码图，以适应于刷脸图像的特征。
94.然后，将刷脸图像的特征与降分辨率处理后的掩码图输入第二卷积神经网络模块，通过第二卷积网络，融合刷脸图像的特征和降分辨率处理后的掩码图，得到融合特征。
95.通过深度卷积神经网络端到端学习的方式，实现候选人的刷脸支付意愿识别，通过候选人所处区域注意力机制实施模块能够使得网络更有针对性的学习判断刷脸图像中候选人的刷脸支付意愿。尤其在公共场所中，能够有效防止a候选人启用刷脸，误刷b候选人的资产的技术效果。
96.更直观地，图3为本说明书一个或多个实施例提供的一种基于深度卷积神经网络端到端学习的刷脸支付意愿识别方法的流程示意图。
97.图3中的流程可以包括以下步骤：
98.s302：获取刷脸图像，并在所述刷脸图像中确定待识别的候选人。
99.s304：根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域。
100.s306：通过第一卷积网络，提取所述刷脸图像的特征。
101.需要说明的是，第一卷积网络预先通过有监督训练得到。
102.s308：对所述掩码图进行降分辨率处理，以适应于所述刷脸图像的特征。
103.比如，通过最近邻采样的方式，降低掩码图的分辨率，从而生成与刷脸图像的相同分辨率的掩码图，能够适应于刷脸图像的特征，以便第二卷积网络进行处理。
104.s310：通过第二卷积网络，融合所述刷脸图像的特征和所述降分辨率处理后的掩码图，得到融合特征。需要说明的是，第二卷积网络预先通过有监督训练得到。
105.在本说明书的一个或多个实施例中，在得到融合特征的过程中，按照通道维度，将刷脸图像的特征和降分辨率处理后的掩码图进行连接，将连接得到的特征输入第二卷积网络进行处理，得到融合特征。
106.其中，第二卷积网络的卷积层数，在此不作具体限定。也就是说，第二卷积网络的卷积层数可以由1个或多个卷积层构成。同时，融合特征的分辨率与刷脸图像的特征相同，且融合特征的特征通道数与刷脸图像的特征相同。
107.s312：将所述融合特征输入对应于所述第一卷积网络的第三卷积网络进行处理，得到处理结果，其中，所述第一卷积网络和所述第三卷积网络是预先从同一个卷积网络拆分得到的。需要说明的是，第三卷积网络预先通过有监督训练得到。
108.在本说明书的一个或多个实施例中，在第一卷积网络和第三卷积网络是预先从同一个卷积网络拆分得到的，比如，卷积网络为resent，shufflenet v2等。
109.在拆分的过程中，可以分别将第一卷积网络和第三卷积网络作为同一个卷积网络的前后部分。
110.针对于拆分的位置，可以由刷脸图像的特征的分辨率的大小决定。即使还没有开始提取刷脸图像的特征(假定此时模型尚未构造完成)，对于也可以刷脸图像的特征，也可以有个预期的分辨率(将其称为目标分辨率，比如，为刷脸图像的分辨率的)，以便相应拆分卷积网络，完成模型构造，使得前一部分的卷积网络(第一卷积网络)恰好能够输出该分辨率的特征。
111.在同一个卷积网络中的卷积层中，确定与目标分辨率匹配的卷积层。最后，以匹配的卷积层作为拆分点，将同一个卷积网络拆分为前一部分和后一部分，前一部分作为第一卷积网络，后一部分作为第三卷积网络。
112.s314：根据所述处理结果生成概率值，以表示对应的所述候选人是否具有刷脸支付意愿。
113.比如，将概率值与设定的阈值概率进行比较，若概率值大于设定的阈值概率，则判定为该候选人的意愿安全，即，该候选人具有刷脸支付意愿。若概率值小于或等于设定的阈值概率，则判定为该候选人的意愿非安全，即，该候选人不具有刷脸支付意愿。
114.根据前面的说明，下面继续阐述如何对第一卷积网络、第二卷积网络、第三卷积网络进行有监督训练。
115.在本说明书的一个或多个实施例中，首先需要建立训练数据集，然后通过训练数据集进行网络训练。
116.具体地，在建立训练数据集时，首先获取包含已确认为刷脸用户的刷脸样本图像，即，候选人启用刷脸支付，通过摄像设备采集刷脸图像，无论刷脸图像中是否存在多个待识别候选人，在该刷脸图像中，将该候选人作为刷脸用户，将该刷脸图像作为刷脸样本图像。比如，通过线下iot刷脸机具上的摄像头采集刷脸图像，若a候选人启用刷脸支付，则在该刷脸图像中将a候选人作为刷脸用户，将该刷脸图像作为刷脸样本图像。
117.需要说明的是，每次启用刷脸支付时，都会采集一次对应的刷脸图像。比如，若a候选人启用刷脸支付时，则iot刷脸机具将针对附近用户进行采集图像，从而得到单张刷脸图像，若b候选人启用刷脸支付时，则iot刷脸机具将再次针对附近用户进行采集图像，从而再
次得到单张刷脸图像。
118.在获取刷脸样本图像后，通过将刷脸用户标记为具有刷脸支付意愿，并生成对应的掩码图，得到正样本。其中，生成对应的掩码图时，从刷脸图像中选取刷脸用户的人脸选择框在刷脸图像中的位置，然后通过该位置生成对应的掩码图。且在将刷脸用户标记为具有刷脸支付意愿时，可以通过意愿标记标签进行标记，比如，意愿标签为{0,1}，其中，1代表具有刷脸支付意愿，0表示不具有刷脸支付意愿。
119.在获取刷脸样本图像后，由于刷脸样本图像可能存在多个待识别候选人，因此，若刷脸样本图像中还包含被顺便拍到的其他用户，则通过将其他用户标记为不具有刷脸支付意愿，并生成对应的掩码图，得到负样本。比如，若a候选人启用刷脸支付，则在该刷脸图像中将b候选人标记为不具有刷脸支付意愿。
120.最后，根据所得到的正样本与负样本，对第一卷积网络、第二卷积网络、第三卷积网络进行有监督训练。
121.其中，在进行有监督训练时，首先在训练数据集中对正样本与负样本进行随机采样，生成训练batch及其对应的标记标签。然后，将训练batch及其对应的标记标签输入初始深度卷积神经网络。初始深度卷积神经网络包括未训练的第一卷积网络、第二卷积网络、第三卷积网络。
122.然后，初始深度卷积神经网络输出概率值，通过概率值与对应的标记标签计算损失函数，并通过梯度下降法，不打断优化损失函数进行网络训练，从而完成有监督训练，得到深度卷积神经网络。其中，能够通过网络训练，得到识别候选人是否具有刷脸支付意愿的规则。比如，深度卷积神经网络识别到候选人的人脸区域位于正中间区域，则认为该候选人具有刷脸支付意愿。
123.基于同样的思路，本说明书一个或多个实施例还提供了上述方法对应的装置和设备，如图4、图5所示。
124.图4为本说明书一个或多个实施例提供的一种刷脸支付意愿识别装置的结构示意图，所述装置包括：
125.获取模块402，获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
126.生成模块404，根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
127.提取模块406，提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
128.识别模块408，根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
129.可选地，所述生成模块404，分别针对所述确定出的各所述候选人，执行：
130.根据该候选人的人脸区域选择框，确定该候选人对应的掩码图的第一填充区域，以及所述第一填充区域之外的第二填充区域；
131.通过为所述第一填充区域和所述第二填充区域赋予不同的填充值，生成分辨率与所述刷脸图像的分辨率一致的所述掩码图。
132.可选地，所述人脸区域选择框为矩形框；
133.所述生成模块404，确定所述矩形框的中心作为圆心，确定所述矩形框的最长边的一半长度，作为半径；
134.将基于所述圆心和所述半径构成的圆形区域，确定为该候选人对应的掩码图的第一填充区域。
135.可选地，所述提取模块406，通过第一卷积网络，提取所述刷脸图像的特征；
136.对所述掩码图进行降分辨率处理，以适应于所述刷脸图像的特征；
137.通过第二卷积网络，融合所述刷脸图像的特征和所述降分辨率处理后的掩码图，得到融合特征。
138.可选地，所述提取模块406，按照通道维度，将所述刷脸图像的特征和所述降分辨率处理后的掩码图进行连接；
139.将所述连接得到的特征输入所述第二卷积网络进行处理，得到融合特征。
140.可选地，所述识别模块408，将所述融合特征输入对应于所述第一卷积网络的第三卷积网络进行处理，得到处理结果，其中，所述第一卷积网络和所述第三卷积网络是预先从同一个卷积网络拆分得到的；
141.根据所述处理结果生成概率值，以表示对应的所述候选人是否具有刷脸支付意愿。
142.可选地，所述识别模块408，确定目标分辨率，以便作为所述刷脸图像的特征的分辨率；
143.在所述同一个卷积网络中的卷积层中，确定与所述目标分辨率匹配的卷积层；
144.以所述匹配的卷积层作为拆分点，将同一个卷积网络拆分为前一部分和后一部分，所述前一部分作为所述第一卷积网络，所述后一部分作为所述第三卷积网络。
145.可选地，所述装置还包括有监督训练模块，所述有监督训练模块，获取包含已确认为刷脸用户的刷脸样本图像；
146.通过将所述刷脸用户标记为具有刷脸支付意愿，并生成对应的掩码图，得到正样本；
147.若所述刷脸样本图像中还包含被顺便拍到的其他用户，则通过将所述其他用户标记为不具有刷脸支付意愿，并生成对应的掩码图，得到负样本；
148.根据所得到的样本，对所述第一卷积网络、所述第二卷积网络、所述第三卷积网络进行有监督训练。
149.可选地，所述刷脸图像中包含至少两张人脸。
150.可选地，所述装置应用于线下的iot刷脸机具，所述刷脸图像由所述iot刷脸机具针对附近用户采集得到。
151.图5为本说明书一个或多个实施例提供的一种刷脸支付意愿识别设备的结构示意图，所述设备包括：
152.至少一个处理器；以及，
153.与所述至少一个处理器通信连接的存储器；其中，
154.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：
155.获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
156.根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
157.提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
158.根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
159.基于同样的思路，本说明书一个或多个实施例还提供了对应于上述方法的一种刷脸支付意愿识别非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：
160.获取刷脸图像，并在所述刷脸图像中确定待识别的候选人；
161.根据各所述候选人在所述刷脸图像中的所处区域，分别生成对应的掩码图以区别所述所处区域和所述刷脸图像中的其他区域；
162.提取所述刷脸图像的特征，并根据所述刷脸图像的特征和所述掩码图，得到融合特征；
163.根据所述融合特征，识别各所述候选人是否具有刷脸支付意愿。
164.在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gate array，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardware description language，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等，目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。
165.控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit，asic)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实
现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
166.上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
167.为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
168.本领域内的技术人员应明白，本说明书实施例可提供为方法、系统、或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
169.本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
170.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
171.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
172.在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
173.内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
174.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除
可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
175.还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
176.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
177.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
178.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
179.以上所述仅为本说明书的一个或多个实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于多尺度输入神经网络的建筑风场地面粗糙度识别方法与流程

一种刷脸支付意愿识别方法、装置以及设备与流程

相关文献

最热文献