一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

人体姿态检测方法、终端设备及计算机可读存储介质与流程

2022-03-22 22:29:54 来源:中国专利 TAG:


1.本技术属于图像处理技术领域,尤其涉及一种人体姿态检测方法、装置、终端设备及计算机可读存储介质。


背景技术:

2.在一些应用场景中,对跌倒事件的监测尤为关键。例如,幼儿园中小朋友的跌倒、养老院中老人的跌倒、以及医院中病人的跌倒等。现有技术中,通常利用可穿戴设备监测用户的跌倒事件,或者人工通过视频进行监测。基于可穿戴设备的监测方法,需要为每个用户佩戴可穿戴设备,成本较高,且无法集中监测多个用户。基于人工视频的监测方法中,当每名监测人员需要监测多个场景时,容易出现漏检、误检和监测不及时的情况。


技术实现要素:

3.本技术实施例提供了一种人体姿态检测方法、装置、终端设备及计算机可读存储介质,可以避免跌倒监测中的漏检、误检和监测不及时的情况、并大大降低了检测成本。
4.第一方面,本技术实施例提供了一种人体姿态检测方法,包括:
5.获取目标人体的跟踪视频;
6.根据所述目标人体所在的检测场景,从所述跟踪视频中确定目标片段,其中,所述目标片段中所述目标人体的姿态变化过程符合预设条件,不同的检测场景对应的所述预设条件不同;
7.计算所述目标片段中所述目标人体的姿态变化速度;
8.根据所述姿态变化速度确定所述目标片段中所述目标人体的姿态变化类型。
9.通常,视频中人体的姿态是动态变化的,但有些姿态的变化属于人体正常动作(如正常的蹲起),而有些姿态的变化属于非常的(如跌倒)。本技术实施例中,根据不同的检测场景,设置不同的预设条件。在检测过程中,先对跟踪视频中目标人体的姿态的变化进行检测,相当于对人体姿态的变化类型进行了初步检测;当人体姿态的变化过程符合当前检测场景对应的预设条件,再检测姿态变化的速度,相当于在人体姿态的变化类型符合初步判断的前提下,结合姿态变化的速度对人体姿态的变化类型做进一步判断。通过上述方法,可以有效区分人体姿态的变化类型,避免人体姿态检测中漏检、误检和检测不及时的情况。另外,本技术实施例提供的方法可以依托于现有的监控设备,利用现有的监控设备获取跟踪视频,无需重新搭建检测环境,能够有效降低检测成本。
10.在第一方面的一种可能的实现方式中,当所述检测场景为跌倒场景时,所述从所述跟踪视频中确定目标片段,包括:
11.检测所述目标人体在所述跟踪视频的每帧图像中的人体中轴线;
12.计算每帧所述图像中所述人体中轴线与地面水平线之间的夹角;
13.若所述跟踪视频中存在连续的n帧目标图像,则将连续的n帧所述目标图像组成的视频片段确定为所述目标片段,其中,每帧所述目标图像中所述夹角小于预设角度,连续的
n帧所述目标图像各自对应的所述夹角逐渐减小。
14.在第一方面的一种可能的实现方式中,所述检测所述跟踪视频的每帧图像中所述目标人体的人体中轴线,包括:
15.对于目标帧图像,获取所述目标帧图像中所述目标人体的n个头部区域检测点和n个脚部区域检测点,其中,所述n为大于1的整数,所述目标帧图像为所述跟踪视频的任意一帧图像;
16.根据所述n个头部区域检测点和所述n个脚部区域检测点,得到n组匹配点,其中,每组所述匹配点中包括一个所述头部区域检测点和一个所述脚部区域检测点;
17.计算所述n组匹配点各自对应的连线的第一置信度;
18.将目标组对应的连线确定为所述目标帧图像中所述目标人体的人体中轴线,其中,所述目标组为所述n组匹配点中最大的第一置信度对应的一组匹配点。
19.在第一方面的一种可能的实现方式中,所述获取所述目标帧图像中所述目标人体的n个头部区域检测点和n个脚部区域检测点,包括:
20.将所述目标帧图像输入第一模型,输出第一置信图,其中,所述第一置信图包括所述目标帧图像中所述目标人体的m个头部区域检测框、以及每个所述头部区域检测框的第二置信度,所述m为大于n的整数;
21.将所述目标帧图像输入第二模型,输出第二置信图,其中,所述第二置信图包括所述目标帧图像中所述目标人体的l个脚部区域检测框、以及每个所述脚部区域检测框的第三置信度,所述l为大于n的整数;
22.根据所述第二置信度从所述m个头部区域检测框中获取所述n个头部区域检测框,将所述n个头部区域检测框各自的中心点确定为所述头部区域检测点;
23.根据所述第三置信度从所述l个脚步区域检测框中获取所述n个脚部区域检测框,将所述n个脚部区域检测框各自的中心点确定为所述脚部区域检测点。
24.在第一方面的一种可能的实现方式中,所述计算所述n组匹配点各自对应的连线的第一置信度,包括:
25.将所述目标帧图像输入第三模型,输出第三置信图,其中,所述第三置信图包括所述目标帧图像中所述目标人体的多条候选中轴线、以及每条候选中轴线的第四置信度;
26.根据多条所述候选中轴线中n条目标中轴线各自对应的所述第四置信度确定所述n组匹配点各自对应的所述第一置信度,其中,每条所述目标中轴线与一组匹配点对应的连线相匹配。
27.在第一方面的一种可能的实现方式中,所述计算所述目标片段中所述目标人体的姿态变化速度,包括:
28.计算所述目标片段的起始帧图像和结束帧图像之间所述目标人体的姿态变化差值;
29.计算所述目标片段的起始帧图像和结束帧图像之间的间隔时间;
30.根据所述姿态变化差值和所述间隔时间计算所述目标片段中所述目标人体的姿态变化速度。
31.在第一方面的一种可能的实现方式中,
32.所述计算所述目标片段的起始帧图像和结束帧图像之间所述目标人体的姿态变
化差值,包括:
33.获取所述目标片段的起始帧图像中所述目标人体的第一检测框,和所述目标片段的结束帧图像中所述目标人体的第二检测框;
34.计算所述第一检测框的第一长宽比、以及所述第一检测框的长轴中心线与所述起始帧图像的下边缘线之间的第一夹角;
35.计算所述第二检测框的第二长宽比、以及所述第二检测框的长轴中心线与所述结束帧图像的下边缘线之间的第二夹角;
36.计算所述第一长宽比与所述第二长宽比之间的第一差值、以及所述第一夹角和第二夹角之间的第二差值;
37.将所述第一差值和所述第二差值加权求和,得到加权值;
38.将所述加权值确定为所述姿态变化差值。
39.第二方面,本技术实施例提供了一种人体姿态检测装置,包括:
40.视频获取单元,用于获取目标人体的跟踪视频;
41.片段检测单元,用于根据所述目标人体所在的检测场景,从所述跟踪视频中确定目标片段,其中,所述目标片段中所述目标人体的姿态变化过程符合预设条件,不同的检测场景对应的所述预设条件不同;
42.速度计算单元,用于计算所述目标片段中所述目标人体的姿态变化速度;
43.姿态检测单元,用于根据所述姿态变化速度确定所述目标片段中所述目标人体的姿态变化类型。
44.第三方面,本技术实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的人体姿态检测方法。
45.第四方面,本技术实施例提供了一种计算机可读存储介质,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的人体姿态检测方法。
46.第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的人体姿态检测方法。
47.可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
48.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
49.图1是本技术实施例提供的人体姿态检测方法的流程示意图;
50.图2是本技术实施例提供的人体姿态检测装置的结构框图;
51.图3是本技术实施例提供的终端设备的结构示意图。
具体实施方式
52.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
53.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
54.如在本技术说明书和所附权利要求书中所使用的那样,术语“若”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。
55.另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
56.在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
57.参见图1,是本技术实施例提供的人体姿态检测方法的流程示意图,作为示例而非限定,所述方法可以包括以下步骤:
58.s101,获取目标人体的跟踪视频。
59.本技术实施例中,可以依托监测环境中现有的监控设备获取跟踪视频。例如,控制中心通过幼儿园中的监控设备获取小朋友的跟踪视频,然后根据后续方法检测跟踪视频中的小朋友是否发生跌倒事件。再例如,控制中心通过医院的监控设备获取病人的跟踪视频,然后根据后续方法检测跟踪视频中病人是否发生求救行为。再例如,控制中心通过监控设备获取参赛人员的跟踪视频,然后根据后续方法检测跟踪视频中参赛人员的抢答次序。
60.跟踪视频是指对某个拍摄目标跟踪拍摄,获得的包含该拍摄目标的多张连续的拍摄图像。本技术实施例中可以采用现有的目标跟踪算法对目标人体进行跟踪拍摄,获得跟踪视频。现有的目标跟踪算法包括单目标跟踪算法和多目标跟踪算法,因此,本技术实施例中,可以对单个目标人体进行跟踪拍摄,也可以对多个目标人体进行跟踪拍摄。
61.在一些应用场景中,可以根据人脸特征识别目标人体。例如:预先采集某些对象的人脸图像、并存储;将视频中出现的人脸与预先存储的人脸图像进行匹配;若匹配成功,则将视频中出现的人脸对应的人体确定为目标人体。
62.在另一些应用场景中,还可以根据不同检测场景对应的预设特征信息识别目标人体。例如:在幼儿园跌倒检测场景中,通过识别视频中出现的人体的身高来判断是否为目标人体。在医院求救检测场景中,通过识别视频中的人体是否穿着病号服来判断是否为目标人体。在参赛抢答检测场景中,通过识别视频中出现的人体的位置来判断是否为目标人体(通常抢答人员的抢答位置是确定的)。
63.s102,根据所述目标人体所在的检测场景,从跟踪视频中的目标片段,其中,目标片段中目标人体的姿态变化过程符合预设条件,不同的检测场景对应的所述预设条件不
同。
64.本技术实施例提供的人体姿态检测方法可以应用于多种检测场景。
65.例如:在跌倒事件的检测场景中,通过监控设备获取目标人体的跟踪视频;检测跟踪视频中的目标片段;此场景下,预设条件是指跌倒过程中人体姿态的变化条件,如重心偏移量满足预设值、中轴线与地面水平线夹角变化量满足预设角度等。
66.再例如:在患者求救事件的检测场景中,通过监控设备获取目标患者的跟踪视频,检测跟踪视频中的目标片段;此场景下,预设条件是指求救行为中人体姿态的变化条件,如手臂抬起的高度满足预设高度、挥手次数满足预设次数等。
67.再例如:在抢答事件的检测场景中,通过监控设备获取参赛人员的跟踪视频,检测跟踪视频中的目标片段;此场景下,预设条件是指参赛人员抢答过程中人体姿态的变化条件,如手部位移达到预设位移、手臂抬起的高度满足预设高度等。
68.该目标人体所在的检测场景可以由该终端设备自行识别,也可以由用户设定该目标人体所在的检测场景。
69.s103,计算目标片段中目标人体的姿态变化速度。
70.通常视频的帧率是固定的,可以通过帧率计算出目标片段对应的时间。再根据s102中检测出的目标片段中的姿态变化过程,即可计算出姿态变化速度。具体方法可参见下述实施例中的描述。
71.s104,根据姿态变化速度确定目标片段中目标人体的姿态变化类型。
72.如s102所示的跌倒事件的检测场景中,假设预设条件为人体重心偏移量满足预设值,根据s103计算目标片段对应的人体重心偏移量的变化速度(即姿态变化速度),在s104中,若该变化速度较快,则表示人体重心短时间内发生了较大的偏移,进而确定出小朋友的姿态变化类型为跌倒。
73.如s102所示的求救事件的检测场景中,假设预设条件为手臂抬起的高度满足预设高度,根据s103计算目标片段中目标患者的手臂的举高速度(即姿态变化速度),在s104中,若该变化速度较快,则表示手臂以较快速度举高,进而确定出患者的姿态变化类型为求救。
74.如s102所示的抢答事件的检测场景中,假设预设条件为手部位移达到预设位移,根据s103计算目标片段中参赛人员手部位移的移动速度(即姿态变化速度),在s104中,根据参赛人员手部位移的移动速度确定参赛人员的抢答次序。
75.需要说明的是,上述只是简单示例。在实际应用中,对于某种姿态变化类型的判断条件(预设条件)可能包含多个条件,而不仅仅是单条件判断。本技术实施例中不做具体限定。
76.在一些应用场景中,终端设备确定目标片段中目标人体的姿态变化类型后,可以发出相应的提示信息。如跌倒事件的检测场景中,当终端设备确定目标人体的姿态变化类型为跌倒时,可以通过终端设备上的声音播放装置发送跌倒提示音,也可以向与当前的终端设备通信连接的另一个终端设备发送警报信息。再如抢答事件的检测场景中,当终端设备确定目标人体的姿态变化类型为抢答时,终端设备可以控制抢答成功的参赛人员对应的提示灯亮起,还可以在显示装置上显示抢答成功的参赛人员对应的参赛编号。
77.通常,视频中人体的姿态是动态变化的,但有些姿态的变化属于人体正常动作(如正常的蹲起),而有些姿态的变化属于非常的(如跌倒)。本技术实施例中,根据不同的检测
场景,设置不同的预设条件。在检测过程中,先对跟踪视频中目标人体的姿态的变化进行检测,相当于对人体姿态的变化类型进行了初步检测;当人体姿态的变化过程符合当前检测场景对应的预设条件,再检测姿态变化的速度,相当于在人体姿态的变化类型符合初步判断的前提下,结合姿态变化的速度对人体姿态的变化类型做进一步判断。通过上述方法,可以有效区分人体姿态的变化类型,避免人体姿态检测中漏检、误检和检测不及时的情况。另外,本技术实施例提供的方法可以依托于现有的监控设备,利用现有的监控设备获取跟踪视频,无需重新搭建检测环境,能够有效降低检测成本。
78.下面以跌倒事件的检测场景为例,介绍本技术实施例上述步骤的具体实现方法。
79.在一个实施例中,步骤s102中检测目标片段过程可以包括:
80.检测目标人体在跟踪视频的每帧图像中的人体中轴线;计算每帧图像中人体中轴线与地面水平线之间的夹角;若跟踪视频中存在连续的n帧目标图像,则将连续的n帧目标图像组成的视频片段确定为目标片段,其中,每帧目标图像中夹角小于预设角度,连续的n帧目标图像各自对应的夹角逐渐减小。
81.示例性的,假设跟踪视频中包括100帧图像,预设角度为90度。其中,第50帧图像到第54帧图像中目标人体的人体中轴线与地面水平线之间的夹角均小于90度,第50帧图像到第54帧图像中目标人体的人体中轴线与地面水平线之间的夹角依次为80度、60度、40度、20度、0度。则目标片段包括第50帧图像、第51帧图像、第52帧图像、第53帧图像和第54帧图像。
82.可选的,对于目标帧图像(跟踪视频的任意一帧图像),人体中轴线的检测方法包括:通过训练后的人体检测模型获取目标帧图像中目标人体的人体检测框;将人体检测框的长轴中心线确定为人体中轴线。
83.在跌倒过程中,人体可能发生蜷缩;或者,对于身材较矮小的目标人体,其长短比例较相近;或者,在某些姿态下,可能存在张开手臂(如蹲下张开手臂)。上述情况中,获得的人体检测框的长轴方向可能不是人体中轴线的方向。因此,通过人体检测框获取人体中轴线的方法不准确。
84.可选的,对于目标帧图像(跟踪视频的任意一帧图像),人体中轴线的另一种检测方法包括:
85.i、获取目标帧图像中目标人体的n个头部区域检测点和n个脚部区域检测点,其中,n为大于1的整数。
86.在一个实施例中,头部区域检测点和脚部区域检测点的获取方法可以包括:
87.将目标帧图像输入第一模型,输出第一置信图,其中,第一置信图包括所述目标帧图像中所述目标人体的m个头部区域检测框、以及每个所述头部区域检测框的第二置信度,所述m为大于n的整数;
88.将目标帧图像输入第二模型,输出第二置信图,其中,第二置信图包括目标帧图像中目标人体的l个脚部区域检测框、以及每个脚部区域检测框的第三置信度,l为大于n的整数;
89.根据第二置信度从m个头部区域检测框中获取n个头部区域检测框,将n个头部区域检测框各自的中心点确定为头部区域检测点;
90.根据第三置信度从l个脚步区域检测框中获取n个脚部区域检测框,将n个脚部区域检测框各自的中心点确定为脚部区域检测点。
91.其中,第一检测模型和第二检测模型需要预先进行训练。
92.本技术实施例中,头部区域可以指目标人体的头部所占的区域;还可以指包含目标人体的头部的某个区域,该区域大于头部所占的区域。脚部区域可以指目标人体的脚部所占的区域;还可以指包含目标人体的脚部的某个区域,该区域大于脚部所占的区域。
93.上述方法中,根据第二置信度从m个头部区域检测点中获取n个头部区域检测框的一种实现方式为:根据第二置信度从大到小的顺序对m个头部区域检测框排序,得到第一序列;获取第一序列中的前n个头部区域检测框。
94.根据第二置信度从m个头部区域检测点中获取n个头部区域检测框的另一种实现方式为:根据第二置信度计算m个头部区域检测框各自的置信度方差;根据置信度方差由小到大的顺序对m个头部区域检测框排序,得到第二序列;获取第二序列中的前n个头部区域检测框。
95.根据第二置信度从m个头部区域检测点中获取n个头部区域检测框的另一种实现方式为:采用非极大值抑制方法从从m个头部区域检测点中获取n个头部区域检测框。
96.根据第三置信度从l个脚步区域检测框中获取n个脚部区域检测框可以参考上述的根据第二置信度从m个头部区域检测点中获取n个头部区域检测框的方法,在此不再赘述。
97.ii、根据n个头部区域检测点和n个脚部区域检测点,得到n组匹配点,其中,每组匹配点中包括一个头部区域检测点和一个脚部区域检测点。
98.可选的,可以采用排列组合的方法对n个头部区域检测点和n个脚部区域检测点进行匹配处理。该方法中可以得到n2组匹配点,将会增加后续步骤的计算量。
99.可选的,可以采用匈牙利算法对n个头部区域检测点和n个脚部区域检测点进行匹配处理。该方法中可以得到n组匹配点,与上述的排列组合的方式相比,大大减少了后续步骤的计算量。
100.iii、计算n组匹配点各自对应的连线的第一置信度。
101.可选的,第一置信度的计算方式包括:
102.将目标帧图像输入第三模型,输出第三置信图,其中,第三置信图包括目标帧图像中目标人体的多条候选中轴线、以及每条候选中轴线的第四置信度;根据多条候选中轴线中n条目标中轴线各自对应的第四置信度确定n组匹配点各自对应的第一置信度,其中,每条目标中轴线与一组匹配点对应的连线相匹配。
103.示例性的,对于第1组匹配点,确定第1组匹配点中的一个头部区域检测点和一个脚部区域检测之间的连线;在第三置信图中找到与该连线匹配的候选中轴线,得到第1条目标中轴线;将第三置信图中第1条目标中轴线对应的第四置信度确定为第1组匹配点对应的第一置信度。
104.其中,可以采用线段拟合方法从第三置信图中找到候选中轴线。还可以在第三置信图中找到与第1组匹配点中的头部区域检测点和脚部区域检测各自相匹配的两个点,将第三置信图中该两个点的连线确定为匹配的候选中轴线。
105.iv、将目标组对应的连线确定为目标帧图像中目标人体的人体中轴线,其中,目标组为n组匹配点中最大的第一置信度对应的一组匹配点。
106.上述方法中,可选的,步骤ii和步骤iii中的第一模型、第二模型和第三模型可以
是分开设置的。该方法下,需要将目标帧图像分别输入第一模型、第二模型和第三模型。相应的,训练的时候,这三个模型也是分开训练的。
107.可选的,第四模型中可以包括第一模型、第二模型和第三模型。相当于第一模型、第二模型和第三模型包含在一个大模型中。将目标帧图像一次输入第四模型,即可输出第一置信图、第二置信图和第三置信图。相应的,训练的时候,可以同时训练三个模型。这种方法与上述分开设置的方法相比,训练过程中三个模型的特征可以共享、并相互影响,利于提高模型的检测精度。
108.在一个实施例中,s103中姿态变化速度的一种计算方式包括:
109.计算目标片段的起始帧图像和结束帧图像之间目标人体的姿态变化差值;计算目标片段的起始帧图像和结束帧图像之间的间隔时间;根据姿态变化差值和间隔时间计算目标片段中目标人体的姿态变化速度。
110.以跌倒事件的检测场景为例,计算姿态变化差值的一种实现方式可以为:
111.获取第一夹角和第二夹角,其中,第一夹角为目标片段的起始帧图像中目标人体的人体中轴线与地面水平线之间的夹角,第二夹角为目标片段的结束帧图像中目标人体的人体中轴线与地面水平线之间的夹角;计算第一夹角与第二夹角的角度差;将该角度差确定为姿态变化差值。
112.在一些场景中,如跌倒检测场景,通过计算目标人体的人体中轴线与地面水平线之间的夹角的变化,即可确定姿态变化差值。但在另一些场景中,如求救事件的检测场景和抢答事件的检测场景,目标人体的人体中轴线与地面水平线之间的夹角可能并无变化、或变化不明显。
113.为了解决上述问题,可选的,计算姿态变化差值的一种实现方式可以为:
114.获取目标片段的起始帧图像中目标人体的第一检测框,和目标片段的结束帧图像中目标人体的第二检测框;计算第一检测框的第一长宽比、以及第一检测框的长轴中心线与起始帧图像的下边缘线之间的第一夹角;计算第二检测框的第二长宽比、以及第二检测框的长轴中心线与结束帧图像的下边缘线之间的第二夹角;计算第一长宽比与所述第二长宽比之间的第一差值、以及第一夹角和第二夹角之间的第二差值;将第一差值和第二差值加权求和,得到加权值;将加权值确定为姿态变化差值。
115.人体姿态发生变化时,人体检测框通常也随之发生变化。例如,当目标人体举手时,人体检测框的长度增加;当目标人体蹲下时,人体检测框的长度减少。即人体检测框的长宽比相应地发生变化。再例如,当目标人体跌倒时,人体检测框会发生倾斜,即人体检测框的长轴中心线与图像的上/下边缘线之间的夹角发生变化(相应的,人体检测框的长轴中心线与图像的左/右边缘线之间的夹角也发生变化,短轴中心线与图像的上/下/左/右边缘线之间的夹角也发生变化)。因此,通过人体检测框的变化可以确定人体姿态变化差值。
116.可选的,针对不同的检测场景,可以对上述的第一差值和第二差值设置不同的权重。例如:在跌倒检测场景中,与检测框长宽比的变化相比,检测框倾斜角度的变化可能更明显,则令第二差值的权重大于第一差值的权重。再例如:在抢答检测场景中,与检测框倾斜角度的变化相比,检测框的长宽比的变化可能更明显,则令第一差值的权重大于第二差值的权重。
117.可选的,目标片段的起始帧图像和结束帧图像之间的间隔时间的计算方式包括:
统计目标片段的起始帧图像和结束帧图像之间的间隔帧数;根据间隔帧数和跟踪视频对应的帧率计算目标片段的起始帧图像和结束帧图像之间的间隔时间。
118.例如:跟踪视频的帧率为100帧每秒,间隔帧数为10帧,由公式帧率=帧数/时间可以计算出间隔时间为10/100=0.1s。假设第一夹角为80
°
,第二夹角为20
°
,则第一夹角和第二夹角的角度差为80-20=60
°
。则姿态变化速度为60/0.1=60
°
/s。
119.在另一个实施例中,s103中姿态变化速度的另一种计算方式包括:
120.计算目标片段中任意相邻两帧图像之间目标人体的姿态变化差值;计算该相邻两帧图像之间的间隔时间;根据姿态变化差值和间隔时间计算目标片段中目标人体的姿态变化速度。
121.其中,跟踪视频中每相邻的两帧图像之间的间隔时间的计算方式包括:根据公式可以计算出间隔时间。
122.例如:跟踪视频的帧率为100帧每秒,由公式1/帧率可以计算出跟踪视频每相邻的两帧图像之间的间隔时间为1/100=0.01s。以跌倒检测场景为例,假设第三夹角为80
°
,第四夹角为79.5
°
,第三夹角和第四夹角的角度差为80-79.5=0.5
°
,则姿态变化速度为0.5/0.01=50
°
/s。其中,第三夹角和第四夹角为目标片段中任意相邻的两帧图像中目标人体的人体中轴线与地面水平线之间的夹角。
123.在另一个实施例中,s103中,还可以根据跟踪视频中任意相隔h(h为大于1的正整数)帧的两帧图像进行计算,在此不再赘述。
124.上述s103的计算方式中,用于计算的两帧图像相隔的帧数越少,姿态变化的偶然性越大,计算出的姿态变化速度的准确度越低。相反,用于计算的两帧图像相隔的帧数越多,计算出的姿态变化速度越准确。
125.在本技术的一个实施例中,s104中根据姿态变化速度确定目标片段中目标人体的姿态变化类型,包括:根据姿态变化速度确定目标片段中目标人体的第一姿态变化类型,确定与目标片段相邻的片段中目标人体的第二姿态变化类型,如果第一姿态变化类型和第二姿态变化类型相同,则确认目标片段中目标人体的姿态变化类型为第一姿态变化类型,如果第一姿态变化类型和第二姿态变化类型不相同,则确认目标片段中目标人体的姿态变化类型为第二姿态变化类型。
126.值得说明的是,如果目标片段中的姿态变化类型和与其相邻的前一片段的姿态变化类型不相同,则可以判断目标片段中的姿态变化类型和与其相邻的后一片段的姿态变化类型是否相同。如果目标片段中的姿态变化类型和与其相邻的后一片段的姿态变化类型不相同,则以与目标片段相邻的后一片段的姿态变化类型为准。如果目标片段中的姿态变化类型和与其相邻的后一片段的姿态变化类型相同,则以目标片段中目标人体的姿态变化类型为准。
127.如果目标片段中的姿态变化类型和与其相邻的前一片段的姿态变化类型相同,以目标片段中目标人体的姿态变化类型为准。
128.值得说明的是,在跌倒场景中,如果终端设备根据目标片段确定目标人体处于跌倒,且终端设备通过该目标片段的下一段视频片段确定目标人体从跌倒变为非跌倒状态,则终端设备可以确定目标人体处于未跌倒状态,这时可以不发送告警信息。终端设备根据
目标片段确定目标人体处于跌倒,且终端设备通过该目标片段的下一段视频片段确定目标人体依然处于跌倒状态,则终端设备可以确定目标人体处于跌倒状态。
129.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
130.对应于上文实施例所述的人体姿态检测方法,图2是本技术实施例提供的人体姿态检测装置的结构框图,为了便于说明,仅示出了与本技术实施例相关的部分。
131.参照图2,该装置包括:
132.视频获取单元21,用于获取目标人体的跟踪视频。
133.片段检测单元22,用于根据所述目标人体所在的检测场景,从所述跟踪视频中确定目标片段,其中,所述目标片段中所述目标人体的姿态变化过程符合预设条件,不同的检测场景对应的所述预设条件不同。
134.速度计算单元23,用于若检测到所述跟踪视频中的目标片段,则计算所述目标片段中所述目标人体的姿态变化速度。
135.姿态检测单元24,用于根据所述姿态变化速度确定所述目标片段中所述目标人体的姿态变化类型。
136.可选的,片段检测单元22还用于:
137.检测所述目标人体在所述跟踪视频的每帧图像中的人体中轴线;
138.计算每帧所述图像中所述人体中轴线与地面水平线之间的夹角;
139.若所述跟踪视频中存在连续的n帧目标图像,则将连续的n帧所述目标图像组成的视频片段确定为所述目标片段,其中,每帧所述目标图像中所述夹角小于预设角度,连续的n帧所述目标图像各自对应的所述夹角逐渐减小。
140.可选的,片段检测单元22还用于:
141.对于目标帧图像,获取所述目标帧图像中所述目标人体的n个头部区域检测点和n个脚部区域检测点,其中,所述n为大于1的整数,所述目标帧图像为所述跟踪视频的任意一帧图像;
142.根据所述n个头部区域检测点和所述n个脚部区域检测点进行匹配处理,得到n组匹配点,其中,每组所述匹配点中包括一个所述头部区域检测点和一个所述脚部区域检测点;
143.计算所述n组匹配点各自对应的连线的第一置信度;
144.将目标组对应的连线确定为所述目标帧图像中所述目标人体的人体中轴线,其中,所述目标组为所述n组匹配点中最大的第一置信度对应的一组匹配点。
145.可选的,片段检测单元22还用于:
146.将所述目标帧图像输入第一模型,输出第一置信图,其中,所述第一置信图包括所述目标帧图像中所述目标人体的m个头部区域检测框、以及每个所述头部区域检测框的第二置信度,所述m为大于n的整数;
147.将所述目标帧图像输入第二模型,输出第二置信图,其中,所述第二置信图包括所述目标帧图像中所述目标人体的l个脚部区域检测框、以及每个所述脚部区域检测框的第三置信度,所述l为大于n的整数;
148.根据所述第二置信度从所述m个头部区域检测框中获取所述n个头部区域检测框,将所述n个头部区域检测框各自的中心点确定为所述头部区域检测点;
149.根据所述第三置信度从所述l个脚步区域检测框中获取所述n个脚部区域检测框,将所述n个脚部区域检测框各自的中心点确定为所述脚部区域检测点。
150.可选的,片段检测单元22还用于:
151.将所述目标帧图像输入第三模型,输出第三置信图,其中,所述第三置信图包括所述目标帧图像中所述目标人体的多条候选中轴线、以及每条所述候选中轴线的第四置信度;
152.根据多条所述候选中轴线中n条目标中轴线各自对应的所述第四置信度确定所述n组匹配点各自对应的所述第一置信度,其中,每条所述目标中轴线与一组匹配点对应的连线相匹配。
153.可选的,速度计算单元23还用于:
154.计算所述目标片段的起始帧图像和结束帧图像之间所述目标人体的姿态变化差值;
155.计算所述目标片段的起始帧图像和结束帧图像之间的间隔时间;
156.根据所述姿态变化差值和所述间隔时间计算所述目标片段中所述目标人体的姿态变化速度。
157.可选的,速度计算单元23还用于:
158.获取所述目标片段的起始帧图像中所述目标人体的第一检测框,和所述目标片段的结束帧图像中所述目标人体的第二检测框;
159.计算所述第一检测框的第一长宽比、以及所述第一检测框的长轴中心线与所述起始帧图像的下边缘线之间的第一夹角;
160.计算所述第二检测框的第二长宽比、以及所述第二检测框的长轴中心线与所述结束帧图像的下边缘线之间的第二夹角;
161.计算所述第一长宽比与所述第二长宽比之间的第一差值、以及所述第一夹角和第二夹角之间的第二差值;
162.将所述第一差值和所述第二差值加权求和,得到加权值;
163.将所述加权值确定为所述姿态变化差值。
164.需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
165.另外,图2所示的人体姿态检测装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中,还可以作为独立的终端设备存在。
166.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的
单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
167.图3是本技术实施例提供的终端设备的结构示意图。如图3所示,该实施例的终端设备3包括:至少一个处理器30(图3中仅示出一个)处理器、存储器31以及存储在所述存储器31中并可在所述至少一个处理器30上运行的计算机程序32,所述处理器30执行所述计算机程序32时实现上述任意各个人体姿态检测方法实施例中的步骤。
168.所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图3仅仅是终端设备3的举例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
169.所称处理器30可以是中央处理单元(central processing unit,cpu),该处理器30还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
170.所述存储器31在一些实施例中可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31在另一些实施例中也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
171.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
172.本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
173.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信
号。
174.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
175.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
176.在本技术所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
177.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
178.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献