基于人脸表情视频的疼痛评估方法、系统、设备及介质

2022-08-28 09:31:01 来源：中国专利 TAG：

1.本发明涉图像识别技术领域，尤其涉及一种基于人脸表情视频的疼痛评估方法、系统、设备及介质。

背景技术：

2.疼痛是一种与实际或潜在的组织损伤相关的不愉快的感觉和情绪情感体验，是一种复杂的、涉及情感以及感官等多方面的主观感受。疼痛在增强身体的自我保护、恢复以及愈合等机能中起到了不可或缺的作用，但是疼痛也会给个体带来伤害，在一些重大疾病的治疗过程与预后中，严重影响患者的生活质量。在临床治疗过程中对患者的疼痛情况进行实时准确的评估对确保诊断的准确性和治疗的有效性十分重要。自我评估是当前在临床中被广泛使用的疼痛评估金标准，但是该方法在一些无法准确交流疼痛感受的特殊人群(例如有语言障碍的患者、痴呆患者和儿童等)上并不能得到有效的应用。
3.研究发现人的面部表情特征可以作为疼痛评估的重要依据，然而现有的基于面部表情疼痛评估方法大多依赖于专业受训的观察者，容易产生主观偏差且效率较低。随着计算机视觉技术以及面部表情识别技术的发展，使用图像和视频处理算法和深度神经网络对人脸图像视频进行处理并进行疼痛强度的自动评估已吸引越来越多的研究者的关注。但是，现有的端到端的深度神经网络模型并没有很好地利用领域知识，如面部表情中与疼痛相关的局部关键信息。

技术实现要素：

4.本发明实施例提供了基于人脸表情视频的疼痛评估方法、系统、设备及介质，旨在解决现有技术中端到端的深度神经网络模型并没有很好地利用面部表情中与疼痛相关的局部关键信息的问题。
5.第一方面，本发明实施例提供了一种疼痛自动评估方法，其包括：
6.获取人脸疼痛表情视频，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集；
7.将所述预处理后的人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中进行空间域特征提取，得到每一帧人脸表情图像分别对应的特征图，以组成特征图集；
8.将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，以组成目标区域集；其中，所述目标区域集每一目标区域为与疼痛相关面部肌肉运动单元相应的区域；
9.将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量；
10.将每一目标区域的加权特征向量与对应的输出向量进行特征融合，得到每一目标区域的融合特征；其中，将所述人脸表情图像集中的每一帧人脸表情图像输入至预先训
练的vgg网络中，得到每一帧人脸表情图像对应的输出向量；
11.基于每一目标区域的融合特征得到融合特征序列，将所述融合特征序列输入至预先训练的长短时记忆网络中，得到疼痛强度评估值。
12.第二方面，本发明实施例提供了一种基于人脸表情视频疼痛评估系统，其包括：
13.图像处理模块，用于获取人脸疼痛表情视频，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集；
14.特征图获取模块，用于将所述预处理后的人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中进行空间域特征提取，得到每一帧人脸表情图像分别对应的特征图，以组成特征图集；
15.目标区域获取模块，用于将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，以组成目标区域集；其中，所述目标区域集每一目标区域为与疼痛相关面部肌肉运动单元相应的区域；
16.加权特征向量获取模块，用于将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量；
17.特征融合模块，用于将每一目标区域的加权特征向量与对应的输出向量进行特征融合，得到每一目标区域的融合特征；其中，将所述人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中，得到每一帧人脸表情图像对应的输出向量；
18.疼痛强度评估模块，用于基于每一目标区域的融合特征得到融合特征序列，将所述融合特征序列输入至预先训练的长短时记忆网络中，得到疼痛强度评估值。
19.第三方面，本发明实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的疼痛评估方法。
20.第四方面，本发明实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的疼痛评估方法。
21.本发明实施例提供了基于人脸表情视频的疼痛评估方法、系统、设备及介质，该方法包括：获取人脸疼痛表情视频，并进行人脸预处理以得到预处理后的人脸表情图像集；将每一帧人脸表情图像输入至预先训练的vgg网络中进行空间域特征提取，得到对应的特征图；将每一特征图基于疼痛表情先验知识进行分割，得到对应的目标区域；将每一目标区域输入至预先训练的注意力网络中，得到对应的加权特征向量；将加权特征向量与对应的输出向量进行特征融合，得到融合特征；将基于融合特征得到融合特征序列输入至预先训练的长短时记忆网络中，得到疼痛强度评估值。实现了基于人脸表情视频能够有效地对其疼痛强度情况进行评估，且有利于提高疼痛评估的准确度。
附图说明
22.为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
23.图1为本发明实施例提供的基于人脸表情视频的疼痛评估方法的流程示意图；
24.图2为本发明实施例提供的基于人脸表情视频的疼痛评估系统的示意性框图；
25.图3为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
26.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
27.应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含
”ꢀ
指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
28.还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该
”ꢀ
意在包括复数形式。
29.还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。
30.请参阅图1，图1为本发明实施例提供的基于人脸表情视频的疼痛评估方法的流程示意图；该方法包括步骤s101～s106。
31.s101、获取人脸疼痛表情视频，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集。
32.在本实施例中，是以服务器为执行主体描述技术方案。由于对人脸疼痛表情的拍摄条件不同，使得原始图像中包含了许多与评估疼痛强度不相关的其他信息，为了排除干扰信息，需对拍摄到的原始图像进行图像处理，以减小后续提取人脸特征的影响。即当获取人脸疼痛表情视频之后，会对人脸疼痛表情视频中的每一帧图像进行人脸预处理，其中，对人脸预处理流程主要包括了人脸检测、人脸关键点检测、人脸对齐以及数据增强等，以得到去除背景以及其他非人脸区域部分的人脸表情图像，并组成预处理后的人脸表情图像集以输入网络模型中进行疼痛强度评估。
33.在一实施例中，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集包括：
34.检测所述人脸疼痛表情视频中的每一帧图像中的人脸区域，对每一帧图像中的人脸区域进行定位；
35.根据所述每一帧图像中的人脸区域进行人脸关键点定位处理，得到所述人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标，以组成人脸关键点坐标数据集；
36.根据所述人脸关键点坐标数据集对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集。
37.在本实施例中，在不同情况下拍摄的人脸疼痛表情视频中的每一帧图像上，人脸部分可出现在图像中的任意位置，甚至可能出现人脸移出了拍摄的范围导致图像中并没有包含人脸部分。因此，为了检测人脸疼痛表情视频中的每一帧图像中是否包含人脸以及
确定人脸在图像中的相应位置，以方便去除背景以及其他非人脸区域的部分，减少干扰信息，可通过使用viola-jones人脸检测算法对人脸疼痛表情视频中每一帧图像的人脸区域进行定位。再通过人脸关键点检测定位人脸器官所在位置，同时也确定了整个人脸的轮廓位置，得到人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标，进一步确定人脸位置，并组成人脸关键点坐标集以进行人脸对齐处理，其中，可采用级联回归树人脸定位算法检测人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标。由于采集人脸疼痛表情视频的条件不同，采集到的人脸疼痛表情视频中面部姿态可能不同，并且由于不同人脸或相同人脸与采集设备的距离不同，会导致采集到的人脸疼痛表情视频中的人脸大小有所差异，从而对后续提取特征产生影响，因此，需利用人脸关键点坐标对人脸疼痛表情视频中每一帧图像进行人脸对齐处理。
38.在一实施例中，所述根据所述人脸关键点坐标数据集对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集，包括：
39.基于所述人脸关键点坐标数据集计算得到每一人脸关键点坐标的平均位置，将所述每一人脸关键点坐标的平均位置作为标准脸关键点坐标，得到标准脸图像；
40.根据标准脸关键点坐标对所述标准脸图像进行delaunay三角剖分，得到若干标准脸图像三角形；
41.获取所述人脸疼痛表情视频中的第m帧图像；其中，m的初始值为1，且m的取值范围是[1，m]，m表示所述人脸疼痛表情视频中所包括图像的总帧数；
[0042]
基于所述人脸关键点坐标数据集获取所述第m帧图像对应的人脸关键点坐标；
[0043]
根据所述第m帧图像对应的人脸关键点坐标对所述第m帧图像进行所述 delaunay三角剖分，得到若干第m帧图像三角形；其中，所述第m帧图像三角形的数量与所述标准脸图像三角形的数量相同；
[0044]
将所述第m帧图像中每一个第m帧图像三角形分别仿射变换至所述标准脸图像中对应的所述标准脸图像三角形中，并通过双线性插值法得到第m帧人脸对齐图像；
[0045]
将所述第m帧人脸对齐图像中的非人脸区域进行填充处理，得到第m帧预处理后的人脸表情图像；
[0046]
将m自增1以更新m的取值，若确定m未超出m，返回执行所述获取所述人脸疼痛表情视频中的第m帧图像的步骤；
[0047]
若确定m超出m，获取第1帧预处理后的人脸表情图像至第m帧预处理后的人脸表情图像，组成预处理后的人脸表情图像集。
[0048]
在本实施例中，对人脸疼痛表情视频中的每一帧图像进行人脸对齐处理时，需通过人脸关键点坐标数据集计算出每一人脸关键点坐标的平均位置，以将每一人脸关键点坐标的平均位置作为标准脸关键点坐标，从而得到标准脸图像，后续对人脸疼痛表情视频中的每一帧图像进行人脸对齐时，都需对齐到该标准脸图像中。其中，人脸疼痛表情视频中的每一帧图像在经过人脸关键点定位处理后，会得到n个人脸关键点坐标，假设人脸疼痛表情视频中的第m帧图像中 n个人脸关键点坐标为标准脸图像中的n个标准脸关键点坐标为pi(i＝1，2，
…
，n)，根据标准脸关键点坐标pi(i＝1，2，
…
，n) 对标准脸图像进行delaunay三角剖分，可以得j个三角形δj(j＝1，2，
…
，j)。经过三角剖分后得到的j个三角形满足条件是：对于得到的j个三角形中任意两个三角形δi、δj，该
两个三角形除了公共边外不重叠。使用delaunay三角剖分的优点是它能够以最接近的三个坐标点构成三角形，同时不论从图像的哪一些坐标点开始构建，最终构建得到的所有三角形具有唯一性。并根据第m帧图像中的人脸关键点坐标对第m帧图像进行delaunay三角剖分，使第m帧图像得到与标准脸图像中同样数量的三角形。再对第m帧图像与标准脸图像中的每一个对应的三角形进行仿射变换，具体的，假设标准脸图像中第s个三角形δs，三角形的三个顶点为pi，pj，pk。而在第m帧图像中，与标准脸图像中对应的第s个三角形为其三个顶点分别为将第m帧图像中的第s个三角形变换到标准脸中对应的三角形δs中，三角形中的每一个像素也都分别对应到δs中。但由于变化的过程中，第m帧图像中的人脸关键点坐标对应到标准脸图像中的标准脸关键点坐标通常来说不是一个整数值，因此需采用双线性插值法来得到仿射变换之后坐标上的像素值。且对于三角形外的非人脸区域，则使用白色来对其进行填充，从而得到第m帧图像经过人脸预处理后的人脸表情图像。对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集，通过人脸对齐处理减少面部姿态差异对后续特征提取的影响。
[0049]
在一实施例中，所述基于所述人脸关键点坐标数据集计算得到每一人脸关键点坐标的平均位置，包括：
[0050]
获取所述人脸关键点坐标数据集，根据预设公式计算得到每一人脸关键点坐标的平均位置；
[0051]
所述预设公式为：
[0052][0053]
其中，n表示所述人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标总数，则表示输入的所述人脸疼痛表情视频中的第m帧图像中第 i个人脸关键点坐标，(xi，yi)表示第i个人脸关键点坐标的平均位置。
[0054]
在本实施例中，人脸疼痛表情视频中的每一帧图像在经过人脸关键点定位处理后，会得到n个人脸关键点坐标，通过上述预设公式计算得到每一人脸关键点坐标的平均位置，从而通过每一人脸关键点坐标的平均位置得到一标准脸图像，以便于后续对人脸疼痛表情视频中的每一帧图像进行人脸对齐。
[0055]
s102、将所述预处理后的人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中进行空间域特征提取，得到每一帧人脸表情图像分别对应的特征图，以组成特征图集。
[0056]
在本实施例中，使用预先训练的vgg网络作为主干网络，通过预先训练的 vgg网络提取预处理后的人脸表情图像集中的每一帧人脸表情图像空间域特征，从而得到每一帧人脸表情图像分别对应的特征图。
[0057]
在一实施例中，所述预先训练的vgg网络的训练过程，包括：
[0058]
根据vggface数据库对vgg网络进行预训练，得到第一预先训练的vgg 网络，其中，所述第一预先训练的vgg网络包括13层卷积层和3层全连接层；
[0059]
将所述第一预先训练的vgg网络的前12层卷积层进行参数冻结处理，并将所述第一预先训练的vgg网络的3层全连接层替换为重新初始化后的全连接层，得到修改后的第一预先训练的vgg网络；
[0060]
将所述修改后的第一预先训练的vgg网络在预处理后的疼痛表情数据上进行训练，得到所述预先训练的vgg网络；其中，所述预处理后的疼痛表情数据根据unbc-mcmaster数据库进行人脸预处理得到。
[0061]
在本实施例中，需对vgg网络进行预训练，从而将预先训练的vgg网络作为主干网络对预处理后的人脸表情图像集中的每一帧人脸表情图像进行处理。在预训练时，使用的数据库为vggface数据库，该数据库中共包含了2622名人物的总计260万张人脸图像，这是一个比较大数据量的数据库，能够提供训练一个有效网络所需的大量数据。通过在vggface数据库上对vgg网络进行预训练，使得到的第一预先训练的vgg网络能够很好地学习到有关人脸的特征提取，其中第一预先训练的vgg网络包括13层卷积层和3层全连接层。在 vggface数据库上对vgg网络的预训练完成后，需对得到的第一预先训练的 vgg网络进行微调，首先将第一预先训练的vgg网络的前12层卷积层进行参数冻结处理，只保留最后一层卷积层可进行训练，然后将第一预先训练的vgg 网络的3层全连接层进行替换，替换为重新初始化后的全连接层，从而完成修改，最后将修改后的第一预先训练的vgg网络在预处理后的疼痛表情数据上进行训练，将得到的预先训练的vgg网络作为最终的主干网络，从而完成对vgg 网络的微调。其中，预处理后的疼痛表情数据根据unbc-mcmaster数据库进行人脸预处理得到，人脸预处理流程主要包括了人脸检测、人脸关键点检测、人脸对齐以及数据增强。
[0062]
s103、将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，以组成目标区域集；其中，所述目标区域集每一目标区域为与疼痛相关面部肌肉运动单元相应的区域。
[0063]
在本实施例中，为了更好地利用疼痛表情的领域知识，需将人脸疼痛表情的先验知识与注意力机制相结合，从而让网络能够更加关注人脸表情中与疼痛相关的部分。因此，根据疼痛表情先验知识分割出特征图集中每一特征图上与疼痛相关面部肌肉运动单元相应的区域，以得到每一特征图分别对应的目标区域。
[0064]
在一实施例中，所述将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，包括：
[0065]
基于疼痛表情先验知识得到目标点集；其中，所述目标点集包括与降低眉毛单元对应的第一目标点、与提起脸颊单元对应的第二目标点、与收紧眼睑单元对应的第三目标点、与皱起鼻肌单元对应的第四目标点、与提起上唇单元对应的第五目标点以及与眼睛眯缝单元对应的第六目标点；
[0066]
获取所述目标点集中第k目标点；其中，k的初始值为1，且k的取值范围是[1，l]，l表示所述目标点集中所包括目标点的总数；
[0067]
将所述特征图集中与所述第k目标点对应的区域进行分割，得到第k子目标区域；
[0068]
将k自增1以更新k的取值，若确定k未超出l，返回执行所述获取所述目标点集中第k目标点的步骤；
[0069]
若确定k超出l，获取第1子目标区域至第k子目标区域，组成目标区域。
[0070]
在本实施例中，通过研究疼痛与人脸面部肌肉活动单元之间的关系，发现了几个与疼痛密切相关的肌肉活动单元，与疼痛相关面部肌肉运动单元包括了 au4(降低眉毛单元)、au6(提起脸颊单元)、au7(收紧眼睑单元)、au9 (皱起鼻肌单元)、au10(提起上唇单元)以及au43(眼睛眯缝单元)。首先根据疼痛表情先验知识，确定与疼痛相关面部肌肉运动单元在人脸图像中相应的点，共选取了12个对应的点作为目标点集，然后分割出这些点在每一特征图中对应的区域，得到目标区域以输入至注意力网络中。
[0071]
s104、将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量。
[0072]
在本实施例中，为了更好地利用疼痛表情的领域知识，将疼痛表情先验知识与注意力机制相结合，将从特征图中分割出来的与疼痛相关面部肌肉运动单元相应的区域输入至预先训练的注意力网络中，通过预先训练的注意力网络得到目标区域集每一目标区域的加权特征向量。
[0073]
在一实施例中，所述将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量，包括：
[0074]
获取所述目标区域集每一目标区域中的第k子目标区域；
[0075]
将所述第k子目标区域输入至预先训练的注意力网络中，得到所述第k子目标区域的特征向量及对应的重要性权重值；
[0076]
将所述第k子目标区域的特征向量及对应的重要性权重值进行加权处理，得到所述第k子目标区域的加权特征向量；
[0077]
将k自增1以更新k的取值，若确定k未超出l，返回执行所述获取所述目标区域集每一目标区域中的第k子目标区域的步骤；
[0078]
若确定k超出l，基于第k子目标区域的加权特征向量至第l子目标区域的加权特征向量，得到所述目标区域集每一目标区域分别对应的加权特征向量。
[0079]
在本实施例中，预先训练的注意力网络中包含了两个模块，分别为模块一和模块二，通过模块一得到输入的子目标区域的特征向量，通过模块二得到输入的子目标区域的重要性权重值。输入到注意力网络中的子目标区域大小为 6*6*512，在经过了两个卷积层后大小没有发生变化，能够保证网络从子目标区域中学习到相应的模式的同时保留更多的信息。将得到的卷积图分别送入两个模块中进行处理，卷积图经过模块一后，得到了64维的特征向量。卷积图送入模块二后，经过一个最大池化层后大小变为了3*3*512，然后经过一层卷积层以及两层全连接层后，使用sigmoid激活函数该子目标区域对应的重要性权重值，并将特征向量赋予对应的重要性权重值得到加权特征向量，由预先训练的注意力网络得到目标区域集每一目标区域分别对应的加权特征向量。
[0080]
s105、将每一目标区域的加权特征向量与对应的输出向量进行特征融合，得到每一目标区域的融合特征；其中，将所述人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中，得到每一帧人脸表情图像对应的输出向量。
[0081]
在本实施例中，人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中，由预先训练的vgg网络全连接层得到每一帧人脸表情图像的输出向量，将由注意力网络得到目标区域的加权特征向量与对应的输出向量进行特征融合，更好的得到人脸表情中与疼痛相关的特征信息，排除无关的干扰特征，获得每一目标区域的融合特征。
[0082]
s106、基于每一目标区域的融合特征得到融合特征序列，将所述融合特征序列输入至预先训练的长短时记忆网络中，得到疼痛强度评估值。
[0083]
在本实施例中，将每一目标区域的融合特征组成融合特征序列以输入至预先训练的长短时记忆网络中，通过预先训练的长短时记忆网络进行时域特征提取，最后输出疼痛强度评估值。
[0084]
本技术通过预先训练的vgg网络作为主干网络，由预先训练的vgg网络和预先训练的长短时记忆网络作为网络模型中的循环卷积神经网络，并将注意力机制与人脸疼痛表情的相关先验知识进行结合送入循环卷积神经网络中，使得网络能够更加关注人脸表情中与疼痛相关的部分，能够有效地对人脸表情视频中的受试者的疼痛强度情况进行预测。
[0085]
该方法实现了基于人脸表情视频能够有效地对其疼痛强度情况进行评估，且有利于提高疼痛评估的准确度。
[0086]
本发明实施例还提供本发明实施例提供了一种基于人脸表情视频疼痛评估系统，该基于人脸表情视频疼痛评估系统用于在执行前述基于人脸表情视频疼痛评估方法的任一实施例。具体地，请参阅图2，图2是本发明实施例提供的基于人脸表情视频疼痛评估系统100的示意性框图。
[0087]
其中，如图3所示，基于人脸表情视频疼痛评估系统100包括图像处理模块101、特征图获取模块102、目标区域获取模块103、加权特征向量获取模块 104、特征融合模块105和疼痛强度评估模块106。
[0088]
图像处理模块101，用于获取人脸疼痛表情视频，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集。
[0089]
在本实施例中，是以服务器为执行主体描述技术方案。由于对人脸疼痛表情的拍摄条件不同，使得原始图像中包含了许多与评估疼痛强度不相关的其他信息，为了排除干扰信息，需对拍摄到的原始图像进行图像处理，以减小后续提取人脸特征的影响。即当获取人脸疼痛表情视频之后，会对人脸疼痛表情视频中的每一帧图像进行人脸预处理，其中，对人脸预处理流程主要包括了人脸检测、人脸关键点检测、人脸对齐以及数据增强等，以得到去除背景以及其他非人脸区域部分的人脸表情图像，并组成预处理后的人脸表情图像集以输入网络模型中进行疼痛强度评估。
[0090]
在一实施例中，将所述人脸疼痛表情视频中的每一帧图像进行人脸预处理，得到预处理后的人脸表情图像集包括：
[0091]
检测所述人脸疼痛表情视频中的每一帧图像中的人脸区域，对每一帧图像中的人脸区域进行定位；
[0092]
根据所述每一帧图像中的人脸区域进行人脸关键点定位处理，得到所述人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标，以组成人脸关键点坐标数据集；
[0093]
根据所述人脸关键点坐标数据集对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集。
[0094]
在本实施例中，在不同情况下拍摄的人脸疼痛表情视频中的每一帧图像上，人脸部分可出现在图像中的任意位置，甚至可能出现人脸移出了拍摄的范围导致图像中并没有包含人脸部分。因此，为了检测人脸疼痛表情视频中的每一帧图像中是否包含人脸以及
确定人脸在图像中的相应位置，以方便去除背景以及其他非人脸区域的部分，减少干扰信息，可通过使用viola-jones人脸检测算法对人脸疼痛表情视频中每一帧图像的人脸区域进行定位。再通过人脸关键点检测定位人脸器官所在位置，同时也确定了整个人脸的轮廓位置，得到人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标，进一步确定人脸位置，并组成人脸关键点坐标集以进行人脸对齐处理，其中，可采用级联回归树人脸定位算法检测人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标。由于采集人脸疼痛表情视频的条件不同，采集到的人脸疼痛表情视频中面部姿态可能不同，并且由于不同人脸或相同人脸与采集设备的距离不同，会导致采集到的人脸疼痛表情视频中的人脸大小有所差异，从而对后续提取特征产生影响，因此，需利用人脸关键点坐标对人脸疼痛表情视频中每一帧图像进行人脸对齐处理。
[0095]
在一实施例中，所述根据所述人脸关键点坐标数据集对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集，包括：
[0096]
基于所述人脸关键点坐标数据集计算得到每一人脸关键点坐标的平均位置，将所述每一人脸关键点坐标的平均位置作为标准脸关键点坐标，得到标准脸图像；
[0097]
根据标准脸关键点坐标对所述标准脸图像进行delaunay三角剖分，得到若干标准脸图像三角形；
[0098]
获取所述人脸疼痛表情视频中的第m帧图像；其中，m的初始值为1，且 m的取值范围是[1，m]，m表示所述人脸疼痛表情视频中所包括图像的总帧数；
[0099]
基于所述人脸关键点坐标数据集获取所述第m帧图像对应的人脸关键点坐标；
[0100]
根据所述第m帧图像对应的人脸关键点坐标对所述第m帧图像进行所述 delaunay三角剖分，得到若干第m帧图像三角形；其中，所述第m帧图像三角形的数量与所述标准脸图像三角形的数量相同；
[0101]
将所述第m帧图像中每一个第m帧图像三角形分别仿射变换至所述标准脸图像中对应的所述标准脸图像三角形中，并通过双线性插值法得到第m帧人脸对齐图像；
[0102]
将所述第m帧人脸对齐图像中的非人脸区域进行填充处理，得到第m帧预处理后的人脸表情图像；
[0103]
将m自增1以更新m的取值，若确定m未超出m，返回执行所述获取所述人脸疼痛表情视频中的第m帧图像的步骤；
[0104]
若确定m超出m，获取第1帧预处理后的人脸表情图像至第m帧预处理后的人脸表情图像，组成预处理后的人脸表情图像集。
[0105]
在本实施例中，对人脸疼痛表情视频中的每一帧图像进行人脸对齐处理时，需通过人脸关键点坐标数据集计算出每一人脸关键点坐标的平均位置，以将每一人脸关键点坐标的平均位置作为标准脸关键点坐标，从而得到标准脸图像，后续对人脸疼痛表情视频中的每一帧图像进行人脸对齐时，都需对齐到该标准脸图像中。其中，人脸疼痛表情视频中的每一帧图像在经过人脸关键点定位处理后，会得到n个人脸关键点坐标，假设人脸疼痛表情视频中的第m帧图像中 n个人脸关键点坐标为标准脸图像中的n个标准脸关键点坐标为pi(i＝1，2，
…
，n)，根据标准脸关键点坐标pi(i＝1，2，
…
，n) 对标准脸图像进行delaunay三角剖分，可以得j个三角形δj(j＝1，2，
…
，j)。经过三角剖分后得到的j个三角形满足条件是：对于得到的j个三角形中任意两个三角形δi、δj，该
两个三角形除了公共边外不重叠。使用delaunay三角剖分的优点是它能够以最接近的三个坐标点构成三角形，同时不论从图像的哪一些坐标点开始构建，最终构建得到的所有三角形具有唯一性。并根据第m帧图像中的人脸关键点坐标对第m帧图像进行delaunay三角剖分，使第m帧图像得到与标准脸图像中同样数量的三角形。再对第m帧图像与标准脸图像中的每一个对应的三角形进行仿射变换，具体的，假设标准脸图像中第s个三角形δs，三角形的三个顶点为pi，pj，pk。而在第m帧图像中，与标准脸图像中对应的第s个三角形为其三个顶点分别为将第m帧图像中的第s个三角形变换到标准脸中对应的三角形δs中，三角形中的每一个像素也都分别对应到δs中。但由于变化的过程中，第m帧图像中的人脸关键点坐标对应到标准脸图像中的标准脸关键点坐标通常来说不是一个整数值，因此需采用双线性插值法来得到仿射变换之后坐标上的像素值。且对于三角形外的非人脸区域，则使用白色来对其进行填充，从而得到第m帧图像经过人脸预处理后的人脸表情图像。对所述人脸疼痛表情视频中的每一帧图像进行人脸对齐处理，得到预处理后的人脸表情图像集，通过人脸对齐处理减少面部姿态差异对后续特征提取的影响。
[0106]
在一实施例中，所述基于所述人脸关键点坐标数据集计算得到每一人脸关键点坐标的平均位置，包括：
[0107]
获取所述人脸关键点坐标数据集，根据预设公式计算得到每一人脸关键点坐标的平均位置；
[0108]
所述预设公式为：
[0109][0110]
其中，n表示所述人脸疼痛表情视频中的每一帧图像对应的人脸关键点坐标总数，则表示输入的所述人脸疼痛表情视频中的第m帧图像中第 i个人脸关键点坐标，(xi，yi)表示第i个人脸关键点坐标的平均位置。
[0111]
在本实施例中，人脸疼痛表情视频中的每一帧图像在经过人脸关键点定位处理后，会得到n个人脸关键点坐标，通过上述预设公式计算得到每一人脸关键点坐标的平均位置，从而通过每一人脸关键点坐标的平均位置得到一标准脸图像，以便于后续对人脸疼痛表情视频中的每一帧图像进行人脸对齐。
[0112]
特征图获取模块102，用于将所述预处理后的人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中进行空间域特征提取，得到每一帧人脸表情图像分别对应的特征图，以组成特征图集。
[0113]
在本实施例中，使用预先训练的vgg网络作为主干网络，通过预先训练的 vgg网络提取预处理后的人脸表情图像集中的每一帧人脸表情图像空间域特征，从而得到每一帧人脸表情图像分别对应的特征图。
[0114]
在一实施例中，所述预先训练的vgg网络的训练过程，包括：
[0115]
根据vggface数据库对vgg网络进行预训练，得到第一预先训练的vgg 网络，其中，所述第一预先训练的vgg网络包括13层卷积层和3层全连接层；
[0116]
将所述第一预先训练的vgg网络的前12层卷积层进行参数冻结处理，并将所述第一预先训练的vgg网络的3层全连接层替换为重新初始化后的全连接层，得到修改后的第一预先训练的vgg网络；
[0117]
将所述修改后的第一预先训练的vgg网络在预处理后的疼痛表情数据上进行训练，得到所述预先训练的vgg网络；其中，所述预处理后的疼痛表情数据根据unbc-mcmaster数据库进行人脸预处理得到。
[0118]
在本实施例中，需对vgg网络进行预训练，从而将预先训练的vgg网络作为主干网络对预处理后的人脸表情图像集中的每一帧人脸表情图像进行处理。在预训练时，使用的数据库为vggface数据库，该数据库中共包含了2622名人物的总计260万张人脸图像，这是一个比较大数据量的数据库，能够提供训练一个有效网络所需的大量数据。通过在vggface数据库上对vgg网络进行预训练，使得到的第一预先训练的vgg网络能够很好地学习到有关人脸的特征提取，其中第一预先训练的vgg网络包括13层卷积层和3层全连接层。在 vggface数据库上对vgg网络的预训练完成后，需对得到的第一预先训练的 vgg网络进行微调，首先将第一预先训练的vgg网络的前12层卷积层进行参数冻结处理，只保留最后一层卷积层可进行训练，然后将第一预先训练的vgg 网络的3层全连接层进行替换，替换为重新初始化后的全连接层，从而完成修改，最后将修改后的第一预先训练的vgg网络在预处理后的疼痛表情数据上进行训练，将得到的预先训练的vgg网络作为最终的主干网络，从而完成对vgg 网络的微调。其中，预处理后的疼痛表情数据根据unbc-mcmaster数据库进行人脸预处理得到，人脸预处理流程主要包括了人脸检测、人脸关键点检测、人脸对齐以及数据增强。
[0119]
目标区域获取模块103，用于将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，以组成目标区域集；其中，所述目标区域集每一目标区域为与疼痛相关面部肌肉运动单元相应的区域。
[0120]
在本实施例中，为了更好地利用疼痛表情的领域知识，需将人脸疼痛表情的先验知识与注意力机制相结合，从而让网络能够更加关注人脸表情中与疼痛相关的部分。因此，根据疼痛表情先验知识分割出特征图集中每一特征图上与疼痛相关面部肌肉运动单元相应的区域，以得到每一特征图分别对应的目标区域。
[0121]
在一实施例中，所述将所述特征图集中每一特征图基于疼痛表情先验知识进行分割，得到每一特征图分别对应的目标区域，包括：
[0122]
基于疼痛表情先验知识得到目标点集；其中，所述目标点集包括与降低眉毛单元对应的第一目标点、与提起脸颊单元对应的第二目标点、与收紧眼睑单元对应的第三目标点、与皱起鼻肌单元对应的第四目标点、与提起上唇单元对应的第五目标点以及与眼睛眯缝单元对应的第六目标点；
[0123]
获取所述目标点集中第k目标点；其中，k的初始值为1，且k的取值范围是[1，l]，l表示所述目标点集中所包括目标点的总数；
[0124]
将所述特征图集中与所述第k目标点对应的区域进行分割，得到第k子目标区域；
[0125]
将k自增1以更新k的取值，若确定k未超出l，返回执行所述获取所述目标点集中第k目标点的步骤；
[0126]
若确定k超出l，获取第1子目标区域至第k子目标区域，组成目标区域。
[0127]
在本实施例中，通过研究疼痛与人脸面部肌肉活动单元之间的关系，发现了几个与疼痛密切相关的肌肉活动单元，与疼痛相关面部肌肉运动单元包括了 au4(降低眉毛单元)、au6(提起脸颊单元)、au7(收紧眼睑单元)、au9 (皱起鼻肌单元)、au10(提起上唇单元)以及au43(眼睛眯缝单元)。首先根据疼痛表情先验知识，确定与疼痛相关面部肌肉运动单元在人脸图像中相应的点，共选取了12个对应的点作为目标点集，然后分割出这些点在每一特征图中对应的区域，得到目标区域以输入至注意力网络中。
[0128]
加权特征向量获取模块104，用于将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量。
[0129]
在本实施例中，为了更好地利用疼痛表情的领域知识，将疼痛表情先验知识与注意力机制相结合，将从特征图中分割出来的与疼痛相关面部肌肉运动单元相应的区域输入至预先训练的注意力网络中，通过预先训练的注意力网络得到目标区域集每一目标区域的加权特征向量。
[0130]
在一实施例中，所述将所述目标区域集每一目标区域输入至预先训练的注意力网络中，得到所述目标区域集每一目标区域分别对应的加权特征向量，包括：
[0131]
获取所述目标区域集每一目标区域中的第k子目标区域；
[0132]
将所述第k子目标区域输入至预先训练的注意力网络中，得到所述第k子目标区域的特征向量及对应的重要性权重值；
[0133]
将所述第k子目标区域的特征向量及对应的重要性权重值进行加权处理，得到所述第k子目标区域的加权特征向量；
[0134]
将k自增1以更新k的取值，若确定k未超出l，返回执行所述获取所述目标区域集每一目标区域中的第k子目标区域的步骤；
[0135]
若确定k超出l，基于第k子目标区域的加权特征向量至第l子目标区域的加权特征向量，得到所述目标区域集每一目标区域分别对应的加权特征向量。
[0136]
在本实施例中，预先训练的注意力网络中包含了两个模块，分别为模块一和模块二，通过模块一得到输入的子目标区域的特征向量，通过模块二得到输入的子目标区域的重要性权重值。输入到注意力网络中的子目标区域大小为 6*6*512，在经过了两个卷积层后大小没有发生变化，能够保证网络从子目标区域中学习到相应的模式的同时保留更多的信息。将得到的卷积图分别送入两个模块中进行处理，卷积图经过模块一后，得到了64维的特征向量。卷积图送入模块二后，经过一个最大池化层后大小变为了3*3*512，然后经过一层卷积层以及两层全连接层后，使用sigmoid激活函数该子目标区域对应的重要性权重值，并将特征向量赋予对应的重要性权重值得到加权特征向量，由预先训练的注意力网络得到目标区域集每一目标区域分别对应的加权特征向量。
[0137]
特征融合模块105，用于将每一目标区域的加权特征向量与对应的输出向量进行特征融合，得到每一目标区域的融合特征；其中，将所述人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中，得到每一帧人脸表情图像对应的输出向量。
[0138]
在本实施例中，人脸表情图像集中的每一帧人脸表情图像输入至预先训练的vgg网络中，由预先训练的vgg网络全连接层得到每一帧人脸表情图像的输出向量，将由注意力网络得到目标区域的加权特征向量与对应的输出向量进行特征融合，更好的得到人脸表情中与疼痛相关的特征信息，排除无关的干扰特征，获得每一目标区域的融合特征。
[0139]
疼痛强度评估模块106，用于基于每一目标区域的融合特征得到融合特征序列，将所述融合特征序列输入至预先训练的长短时记忆网络中，得到疼痛强度评估值。
[0140]
在本实施例中，将每一目标区域的融合特征组成融合特征序列以输入至预先训练的长短时记忆网络中，通过预先训练的长短时记忆网络进行时域特征提取，最后输出疼痛强度评估值。
[0141]
本技术通过预先训练的vgg网络作为主干网络，由预先训练的vgg网络和预先训练的长短时记忆网络作为网络模型中的循环卷积神经网络，并将注意力机制与人脸疼痛表情的相关先验知识进行结合送入循环卷积神经网络中，使得网络能够更加关注人脸表情中与疼痛相关的部分，能够有效地对人脸表情视频中的受试者的疼痛强度情况进行预测。
[0142]
上述基于人脸表情视频的疼痛评估方法可以实现为计算机程序的形式，该计算机程序可以在如图3所示的计算机设备上运行。
[0143]
请参阅图3，图3是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器，也可以是服务器集群。服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network， cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0144]
参阅图3，该计算机设备500包括通过装置总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括存储介质503和内存储器504。
[0145]
该存储介质503可存储操作装置5031和计算机程序5032。该计算机程序 5032被执行时，可使得处理器502执行基于人脸表情视频的疼痛评估方法。
[0146]
该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。
[0147]
该内存储器504为存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行基于人脸表情视频的疼痛评估方法。
[0148]
该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图3中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0149]
其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本发明实施例公开的基于人脸表情视频的疼痛评估方法。
[0150]
本领域技术人员可以理解，图3中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图3所示实施例一致，在此不再赘述。
[0151]
应当理解，在本发明实施例中，处理器502可以是中央处理单元(centralprocessing unit，cpu)，该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integratedcircuit，asic)、现成可编程门阵列(field-programmable gate array，fpga)或者其他可
编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0152]
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质，也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现本发明实施例公开的基于人脸表情视频的疼痛评估方法。
[0153]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0154]
在本发明所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。
[0155]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0156]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0157]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，后台服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0158]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：数据处理方法、装置、电子设备及存储介质与流程

基于人脸表情视频的疼痛评估方法、系统、设备及介质

相关文献

最热文献