人体姿态检测方法和装置与流程

2022-05-17 22:44:50 来源：中国专利 TAG：

1.本公开的实施例一般涉及图像识别技术领域，并且更具体地，涉及一种人体姿态检测方法和装置。

背景技术：

2.随着视频监控设备的普及，采用人力资源监督监控视频内容的成本急剧增加，因此基于视频监控的行为识别技术得到人们的广泛关注。一方面在人员密集的公共场合，例如公共交通枢纽等区域，利用有限的安防资源对拥挤的人流快速进行行为检测是一个巨大的挑战；另一方面，在一些人烟稀少的监控场景，例如加油站等需要严格按照规定执行操作的场景，24小时异常监控对监督人员来说也是一件耗时耗力的工作。
3.总的来说，现有的人体姿态检测方法主要有以下方式：安防人员通过监控摄像头对监控场景实时检测，发现违规行为立即报警进行处理。但是这种以人为主体的检测方式存在极大的限制，当监控画面较多时需要大量的安防人员才能完成实时监测，用人成本高昂；而且安防人员无法保持持续的专注，出现疏漏在所难免。

技术实现要素：

4.根据本公开的实施例，提供了一种人体姿态检测方法，用于对需要进行人体异常行为的监控区域进行检测，通过对人体的姿态进行检测，通过对人体动作的识别及时发现人体的违规行为，从而及时消除异常行为引起的隐患，提高安全性。
5.在本公开的第一方面，提供了一种人体姿态检测方法，包括：接收监控终端发送的目标区域的视频流，从所述视频流中提取包括人体图像的多帧视频帧；对所述多帧视频帧中的像素值进行叠加，生成图像叠加数据；将所述图像叠加数据输入到预先训练的姿态检测模型，输出包括人体轮廓以及肢体变化轨迹的图像；根据变化的肢体相对于人体轮廓的位置确定人体姿态。
6.在一些实施例中，还包括：将确定的人体姿态与预先建立的人体姿态模型进行匹配，对所述人体姿态进行分类，其中，所述人体姿态模型对应有人体姿态类别。
7.在一些实施例中，还包括预先建立姿态检测模型的过程，具体包括：以预先标注好人体轮廓以及肢体变化轨迹的对包括人体图像的多帧视频帧中的像素值进行叠加处理得到图像叠加数据为训练样本，对预先构建的卷积神经网络模型进行训练，输出人体轮廓以及肢体变化轨迹的图像，作为识别结果；响应识别结果中人体轮廓以及肢体变化轨迹与预先标注的人体轮廓以及肢体变化轨迹的误差大于预设阈值，对预先构建的卷积神经网络模型中的各层的参数进行调整；
重复上述过程，直到识别结果中人体轮廓以及肢体变化轨迹与预先标注的人体轮廓以及肢体变化轨迹的误差小于预设阈值，完成对姿态检测模型的训练。
8.在一些实施例中，所述接收监控终端发送的目标区域的视频流，从所述视频流中提取包括人体图像的多帧视频帧，包括：接收监控终端发送的从不同方位角度拍摄的目标区域的视频流，对于从每个方位角度拍摄的视频流，提取包括人体图像的多帧视频帧。
9.在一些实施例中，所述根据变化的肢体相对于人体轮廓的位置确定人体姿态，包括：响应于从不同方位角度拍摄的目标区域的视频流对应的肢体变化轨迹的图像相对应，根据变化的肢体相对于人体轮廓的位置确定人体姿态。
10.在一些实施例中，还包括：对所述多帧视频帧进行对齐，并将对齐后的视频帧裁剪为尺寸相同的视频帧。
11.在一些实施例中，所述对所述多帧视频帧中的像素值进行叠加，生成图像叠加数据，包括：对裁剪后尺寸相同的视频帧中的同一位置的像素值进行叠加，将叠加得到的数值作为对应像素的数据，生成图像叠加数据，其中，所述图像叠加数据包括像素位置和对应的数值。
12.在本公开的第二方面，提供一种人体姿态检测装置，包括：视频帧提取模块，用于接收监控终端发送的目标区域的视频流，从所述视频流中提取包括人体图像的多帧视频帧；数据生成模块，用于对所述多帧视频帧中的像素值进行叠加，生成图像叠加数据；图像识别模块，用于将所述图像叠加数据输入到预先训练的姿态检测模型，输出包括人体轮廓以及肢体变化轨迹的图像；人体姿态确定模块，用于根据变化的肢体相对于人体轮廓的位置确定人体姿态。
13.在本公开的第三方面，提供了一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上所述的方法。
14.在本公开的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。
15.通过本公开的人体姿态检测方法，能够通过对人体动作的识别及时发现人体的违规行为，从而及时消除异常行为存在的隐患，提高安全性。
16.发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
17.结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：图1示出了本公开实施例一的人体姿态检测方法的流程图；图2示出了本公开实施例二的人体姿态检测装置的结构示意图；图3示出了本公开实施例三的人体姿态检测设备的结构示意图。
具体实施方式
18.为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例，都属于本公开保护的范围。
19.另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
20.本公开实施例的人体姿态检测方法，可以通过对人体的姿态进行识别、例如人体的手势动作、肢体行为或者体态特征等进行识别，进而检测出违规行为，及时消除异常行为存在的隐患，提高安全性。
21.下面结合具体的实施例对本公开的技术方案进行说明。如图1所示，为本公开实施例一的人体姿态检测方法的流程图。从图1中可以看出，本实施例的人体姿态检测方法，可以包括以下步骤：s101：接收监控终端发送的目标区域的视频流，从所述视频流中提取包括人体图像的多帧视频帧。
22.本公开实施例的人体姿态检测方法，可以应用于各种监控场景，通过监控设备可以对人体的姿态进行检测。本实施例中的人体姿态可以包括手势动作、肢体动作和外貌特征等，例如开车过程中打电话、或者在禁烟场合抽烟，或者推拉安全门、违规操作，或者未佩戴安全设施等，本实施例不再一一列举。
23.当利用监控设备对人体姿态进行检测时，后台服务器接收监控终端发送的目标区域的视频流。在本实施例中，监控终端可以以固定的角度对目标区域进行监控，或者也可以以转动的形式对目标区域进行监控。
24.后台服务器接收到监控终端发送的视频流后，从所述视频流中提取包括人体图像的多帧视频帧。具体地，由于存在人体的视频帧在视频流中通常是连续存在的，因此，在提取包括人体图像的视频帧的过程中，可以从原视频中截取带有人体图像的部分视频流，然后从截取的部分视频流中逐帧提取视频帧，从而得到包括人体图像的多帧视频帧。
25.s102：对所述多帧视频帧中的像素值进行叠加，生成图像叠加数据。
26.在本实施例中，当得到包括人体图像的多帧视频帧后，可以对得到的多帧视频帧中的像素值进行叠加，生成图像叠加数据。具体地，可以先对所述多帧视频帧进行对齐，并将对齐后的视频帧裁剪为尺寸相同的视频帧。在对齐过程中，可以以多帧视频帧中的位置不变的两个或以上的点为基准点，对多帧视频帧进行对齐，然后基于对齐后的视频帧裁剪，每帧视频帧中保留完整的人体图像。
27.对裁剪后尺寸相同的视频帧中的同一位置的像素值进行叠加，将叠加得到的数值作为对应像素的数据，生成图像叠加数据，其中，所述图像叠加数据包括像素位置和对应的数值，这样，可以将多帧视频帧叠加为像素值超过255的图像叠加数据，例如，三张图像中同一位置的像素值分别为168、120、150，则生成的图像叠加数据中与对应该像素的数据为168 120 150=438，同理，可以将裁剪后的视频帧中的同一位置的像素值进行叠加，生成对应的图像叠加数据。生成的叠加数据由于对应像素值的位置的数值通常远大于255，因此，生成
的叠加数据已经不具有图像的特性。
28.具体地，可以创建一个存储数位与裁剪后的视频帧上的像素点数量相同的矩阵，然后对裁剪后尺寸相同的视频帧中的同一位置的像素值进行叠加，将叠加得到的数值作为对应像素点的数据，写入创建的矩阵，这样，矩阵中的每个元素的值即为对应的裁剪后的视频帧上像素点的和，得到图像叠加数据。
29.s103：将所述图像叠加数据输入到预先训练的姿态检测模型，输出包括人体轮廓以及肢体变化轨迹的图像。
30.在本实施例中，当得到图像叠加数据后，可以将图像叠加数据输入到预先训练的姿态检测模型，输出包括人体轮廓以及肢体变化轨迹的图像。
31.本实施例中的姿态检测模型是通过以下方式训练得到的：以预先标注好人体轮廓以及肢体变化轨迹的对包括人体图像的多帧视频帧中的像素值进行叠加处理得到图像叠加数据为训练样本，对预先构建的卷积神经网络模型进行训练，输出人体轮廓以及肢体变化轨迹的图像，作为识别结果；响应识别结果中人体轮廓以及肢体变化轨迹与预先标注的人体轮廓以及肢体变化轨迹的误差大于预设阈值，对预先构建的卷积神经网络模型中的各层的参数进行调整；重复上述过程，直到识别结果中人体轮廓以及肢体变化轨迹与预先标注的人体轮廓以及肢体变化轨迹的误差小于预设阈值，完成对姿态检测模型的训练。
32.s104：根据变化的肢体相对于人体轮廓的位置确定人体姿态。
33.在得到包括人体轮廓以及肢体变化轨迹的图像后，可以根据变化的肢体相对于人体轮廓的位置确定人体姿态，进而根据人体姿态确定是否存在违规行为，及时识别并消除异常行为存在的隐患，提高安全性。
34.本公开实施例的人体姿态检测方法，可以通过对人体的姿态进行识别、例如人体的手势动作、肢体行为或者体态特征等进行识别，进而检测出违规行为，及时消除异常行为存在的隐患，提高安全性。
35.本公开实施例的人体姿态检测方法，可以应用于小数据的监控领域的人体姿态检测，由于现有技术中通过单一图像难以识别连续的人体姿态，而对连续视频帧进行识别又难以实现高效快速的监测，因此，本公开实施例采用将图片叠加的方式来快速识别几帧或几十帧的图像中的人体姿态。
36.此外，作为本公开的一个可选实施例，在上述实施例的基础上，还可以将确定的人体姿态与预先建立的人体姿态模型进行匹配，对所述人体姿态进行分类，其中，所述人体姿态模型对应有人体姿态类别。
37.作为本公开的一个可选实施例，接收到的监控终端发送的目标区域的视频流，可以是从不同方位角度拍摄的目标区域的视频流，对于从每个方位角度拍摄的视频流，提取包括人体图像的多帧视频帧。在确定人体姿态过程中，可以判断从不同方位角度拍摄的目标区域的视频流对应的肢体变化轨迹的图像是否相对应，进而根据变化的肢体相对于人体轮廓的位置确定人体姿态。
38.需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应所述知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应所述
知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。
39.以上是关于方法实施例的介绍，以下通过装置实施例，对本公开所述方案进行进一步说明。
40.如图2所示，为本公开实施例二的人体姿态检测装置的结构示意图。本实施例的人体姿态检测装置，包括：视频帧提取模块201，用于接收监控终端发送的目标区域的视频流，从所述视频流中提取包括人体图像的多帧视频帧。
41.数据生成模块202，用于对所述多帧视频帧中的像素值进行叠加，生成图像叠加数据。
42.图像识别模块203，用于将所述图像叠加数据输入到预先训练的姿态检测模型，输出包括人体轮廓以及肢体变化轨迹的图像。
43.人体姿态确定模块204，用于根据变化的肢体相对于人体轮廓的位置确定人体姿态。
44.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
45.图3示出了可以用来实施本公开的实施例的电子设备300的示意性框图。如图所示，设备300包括中央处理单元（cpu）301，其可以根据存储在只读存储器（rom）302中的计算机程序指令或者从存储单元308加载到随机访问存储器（ram）303中的计算机程序指令，来执行各种适当的动作和处理。在ram 303中，还可以存储设备300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出（i/o）接口305也连接至总线304。
46.设备300中的多个部件连接至i/o接口305，包括：输入单元306，例如键盘、鼠标等；输出单元307，例如各种类型的显示器、扬声器等；存储单元308，例如磁盘、光盘等；以及通信单元309，例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
47.处理单元301执行上文所描述的各个方法和处理，其被有形地包含于机器可读介质，例如存储单元308。在一些实施例中，计算机程序的部分或者全部可以经由rom 302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到ram 703并由cpu 301执行时，可以执行上文描述的方法的一个或多个步骤。备选地，在其他实施例中，cpu 301可以通过其他任何适当的方式（例如，借助于固件）而被配置为执行上述方法。
48.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列（fpga）、专用集成电路（asic）、专用标准产品（assp）、芯片上系统的系统（soc）、负载可编程逻辑设备（cpld）等等。
49.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
50.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器（ram）、只读存储器（rom）、可擦除可编程只读存储器（eprom或快闪存储器）、光纤、便捷式紧凑盘只读存储器（cd-rom）、光学储存设备、磁储存设备、或上述内容的任何合适组合。
51.此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
52.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：文本粘贴方法、装置和电子设备与流程

人体姿态检测方法和装置与流程

相关文献

最热文献