一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种密集人群检测方法、装置、电子设备以及存储介质与流程

2022-07-31 00:53:26 来源:中国专利 TAG:


1.本公开涉及目标检测技术领域,具体而言,涉及一种密集人群检测方法、装置、电子设备以及存储介质。


背景技术:

2.目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。尤其是在对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测等方面具有广泛的应用价值。
3.通常,在对某个场所的人群进行目标检测时,主要是采用区域卷积神经网络(region-convolutional neural networks,r-cnn)来进行目标检测,针对人员较少或人员较分散的场景可以得到很好的识别结果,然而,当在进行密集场所的人员检测时,针对存在全景图像中目标较小、稠密人群、物体遮挡等情况时,很难从重叠的人物中识别出单个的目标人物,导致识别的准确率不高。


技术实现要素:

4.本公开实施例至少提供一种密集人群检测方法、装置、电子设备以及存储介质。这样,可以针对密集场所的人群的人数进行精准的检测。
5.本公开实施例提供了一种密集人群检测方法,所述方法包括:
6.获取带有密集人群的待检测图像;
7.将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;
8.针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
9.统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
10.一种可选的实施方式中,根据以下步骤生成训练好的所述目标行人检测模型:
11.获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;
12.基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
13.一种可选的实施方式中,根据以下步骤利用至少两个第二样本图像进行合成得到
一个第一样本图像:
14.获取多个第二样本图像;
15.从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;
16.将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。
17.一种可选的实施方式中,利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:
18.i
output
=i
foreground
*i
mask
(1-i
mask
)*i
background
19.其中,i
output
是第一样本图像,i
foreground
是两个第二样本图像中的任一第二样本图像,i
mask
是掩膜图像,i
background
是该两个第二样本图像中的另一第二样本图像。
20.一种可选的实施方式中,所述对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像,包括:
21.针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;
22.基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像。
23.一种可选的实施方式中,所述基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型,包括:
24.针对任一第一样本图像,将所述第一样本图像输入所述初始行人检测模型中,得到预测行人标签;
25.基于各个所述第一样本图像对应的所述真实行人标签和所述预测行人标签,确定所述初始行人模型的各个交叉熵损失值;
26.当所述初始行人模型的任一交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
27.一种可选的实施方式中,确定所述初始行人模型预测行人标签的公式为:
28.y(pi)={yi∈y|iou(pi,yi)≥ε}
29.其中,y(pi)是所有的预测行人标签的集合,yi是第i个目标行人的真实行人标签,y是所有目标行人的真实行人标签,pi是第i个目标行人的预测行人标签,iou(pi,yi)是第i个目标行人的预测行人标签和真实行人标签的交叉熵损失值,ε是一个给定的iou(pi,yi)阈值。
30.本公开实施例还提供一种密集人群检测装置,所述装置包括:
31.获取模块,用于获取带有密集人群的待检测图像;
32.得到模块,用于将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;
33.去重模块,用于针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
34.统计模块,用于统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
35.一种可选的实施方式中,所述得到模块还包括训练模块,所述训练模块用于根据以下步骤生成训练好的所述目标行人检测模型:
36.获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;
37.基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
38.一种可选的实施方式中,所述训练模块根据以下步骤利用至少两个第二样本图像进行合成得到一个第一样本图像:
39.获取多个第二样本图像;
40.从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;
41.将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。
42.一种可选的实施方式中,所述训练模块利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:
43.i
output
=i
foreground
*i
mask
(1-i
mask
)*i
background
44.其中,i
output
是第一样本图像,i
foreground
是两个第二样本图像中的任一第二样本图像,i
mask
是掩膜图像,i
background
是该两个第二样本图像中的另一第二样本图像。
45.一种可选的实施方式中,所述去重模块在用于对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像时,具体用于:
46.针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;
47.基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像。
48.一种可选的实施方式中,所述训练模块在用于基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型时,具体用于:
49.针对任一第一样本图像,将所述第一样本图像输入所述初始行人检测模型中,得到预测行人标签;
50.基于各个所述第一样本图像对应的所述真实行人标签和所述预测行人标签,确定
所述初始行人模型的各个交叉熵损失值;
51.当所述初始行人模型的任一交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
52.一种可选的实施方式中,所述训练模块用于确定所述初始行人模型预测行人标签的公式为:
53.y(pi)={yi∈y|iou(pi,yi)≥ε}
54.其中,y(pi)是所有的预测行人标签的集合,yi是第i个目标行人的真实行人标签,y是所有目标行人的真实行人标签,pi是第i个目标行人的预测行人标签,iou(pi,yi)是第i个目标行人的预测行人标签和真实行人标签的交叉熵损失值,ε是一个给定的iou(pi,yi)阈值。
55.本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述实施方式中的步骤。
56.本公开实施例还提供一种计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述实施方式中的步骤。
57.本公开实施例提供的一种密集人群检测方法、装置、电子设备以及存储介质,所述方法包括:通过将密集人群的待检测图像,输入到训练好的目标行人检测模型中进行第一预测行人框的预测,得到标注有多个第一预测行人框的所述待检测图像,多个第一预测行人框存在重复的情况,对多个第一预测行人框进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量,与现有技术中的针对密集场景直接将预测的行人框的数量确定为待检测图像中的行人数量情况相比,其可以针对预测出来的行人框进行去重处理,统计去重后的行人框个数即可得到人群的数量,从而实现精准的对密集场所的人群的人数检测。
58.进一步,本公开实施例提供的密集人群检测方法,还可以通过已经进行过数据增广的样本数据进行模型训练,其中,数据增广是指将两个常规场景下的样本图像进行数据合成的操作,为目标行人检测模型训练提供了充分的数据基础,实现更好的训练效果。
59.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
60.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
61.图1示出了本公开实施例所提供的一种密集人群检测方法的流程图;
62.图2示出了本公开实施例所提供的一种生成训练好的目标行人检测模型方法的流程图;
63.图3示出了本公开实施例所提供的一种密集人群检测装置的示意图之一;
64.图4示出了本公开实施例所提供的一种密集人群检测装置的示意图之二;
65.图5示出了本公开实施例所提供的一种电子设备的示意图。
66.图示说明:
67.300-密集人群检测装置、310-获取模块、320-得到模块、330-去重模块、340-统计模块、350-训练模块、500-电子设备、510-处理器、520-存储器、521-内存、522-外部存储器、530-总线。
具体实施方式
68.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
69.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
70.本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
71.经研究发现,针对人群密集的场景,例如大型空港综合交通枢纽下的旅客候机区域、旅客值机区域、旅客排队区域等等,在用现有的目标检测技术进行目标检测时,这些区域具有旅客人员密度高、图像遮挡情况严重的特点,且由于监控摄像机安装条件所限,监控图像中的待检测旅客目标较小,与现有数据集具有较为明显的差异。这导致目前基于融合多个低层次的图像特征与高层次的上下文信息的行人检测技术难以应用在大型空港综合交通枢纽中,误检率高。
72.基于上述研究,本公开提供了一种密集人群检测方法、装置、电子设备以及存储介质,通过获取带有密集人群的待检测图像;将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。这样,可以针对密集场所的人群的人数进行精准的检测。
73.为便于对本实施例进行理解,首先对本公开实施例所公开的一种密集人群检测方法进行详细介绍,本公开实施例所提供的密集人群检测方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(user equipment,ue)、移动设备、用户终端、终端、个人数字助理
(personal digital assistant,pda)、计算设备等。在一些可能的实现方式中,该密集人群检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
74.参见图1所示,为本公开实施例提供的一种密集人群检测方法的流程图,所述方法包括步骤s101~s104,其中:
75.s101:获取带有密集人群的待检测图像;
76.这里,在对密集场所,例如火车站、机场等的行人数量进行检测时,首先,需要获取密集场所的视频,其次,从密集场所的视频中根据用户选择的任意至少一帧截取出来待检测图像,其中,待检测图像可以为从视频中截取的实时图像,也可以为视频中的记录图像。
77.s102:将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像。
78.这里,目标行人检测模型可以是本领域常用的目标检测网络模型,比如,区域卷积神经网络(region-convolutional neural networks,r-cnn)、视网膜网络retinanet、特征金字塔网络(feature pyramid networks,fpn),也可以是视网膜网络retinanet 特征金字塔网络(feature pyramid networks,fpn),该目标行人检测模型通常用于非密集图像中的行人检测,可以从非密集图像中检测出行人数量,对于本技术中带有密集人群的待检测图像,通过该目标检测网络模型可以初步预测出待检测图像中的行人对应的第一预测行人框,这里,由于待检测图像中人群比较密集,会有重叠情况,所以第一预测行人框中可能有重叠的行人,也有单个人的情况。
79.进一步的,可以在标注有多个第一预测行人框的待检测图像的基础之上进行一系列处理操作,可以准确的获得待检测图像中的行人数量,以便对待检测图像中的目标场景的行人数量或人员流量进行感知。
80.s103:针对所述待检测图像中各个区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
81.这里,待检测图像中的任一区域中可能包括单个行人、也可能包括至少两个相互重叠的行人、还可能没有行人,在进行待检测图像中的任一区域的第一预测行人框标注时,每个区域中的行人的数量可能不同,因而每个区域标注出的第一预测行人框也会有所不同。
82.在具体实施中,针对待检测图像中任一区域对应的至少两个第一预测行人框,分别对每个第一预测行人框中的行人进行检测,在得到检测结果之后,再确定该区域对应的该两个第一预测行人框中是否存在相互重复的行人,若存在重复情况,对该至少两个第一预测行人框中的行人进行去重处理;若不存在重复情况,无需对第一预测行人框去重处理;针对待检测图像中的所有区域都执行上面的步骤,最终得到标注有至少一个第二预测行人框的待检测图像,其中,对于同一个区域,该区域中的第二预测行人框的数量可能大于、小于或等于第一预测行人框的数量,在待检测图像中标注的每个第二预测行人框中保证只有一个行人,因而可以用待检测图像中第二预测行人框的数量表示出待检测图像值中行人的数量。
83.一示例中,待检测图像中的区域a中,有3个第一预测行人框,其中,第一预测行人框a1中有行人b1、b2,第一预测行人框a2中有行人b1,第一预测行人框a3中有行人b3,这里,
第一预测行人框a1和第一预测行人框a2有相互重复的行人b1,去重后得到三个第二预测行人框,一个第二预测行人框有行人d1,另一个第二预测行人框有行人d2,一个第二预测行人框有行人d3。
84.另一示例中,待检测图像中的区域b中,有2个第一预测行人框,其中,第一预测行人框c1中有行人d1、d2,第一预测行人框c2中有行人d1、d3,这里,第一预测行人框c1和第一预测行人框c2有相互重复的行人d1,去重后得到三个第二预测行人框,一个第二预测行人框有行人d1,另一个第二预测行人框有行人d2,一个第二预测行人框有行人d3。
85.其中,去重操作可以利用非极大值抑制算法对第一预测行人框中行人进行去重操作。
86.进一步的,一种可选的实施方式中,所述对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像,包括:
87.针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;
88.基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像。
89.这里,目标行人的特征信息为能够表征出该目标行人特征的一些信息,比如,肤色信息、脸部轮廓信息、人脸五官信息等等。
90.s104:统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
91.这里,确定待检测图像中的第二预测行人框的目标数量并直接将第二预测行人框的目标数量作为带检测图像中行人的行人数量。
92.具体地,第二预测行人框可以通过第二预测行人框的左上角坐标加右下角坐标进行表示,也可以通过第二预测行人框的右上角坐标加左下角坐标进行表示,也可以用第二预测行人框的中心坐标来表示。
93.本实施例公开的一种密集人群检测方法,通过获取带有密集人群的待检测图像;将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。这样,可以针对密集场所的人群的人数进行精准的检测。
94.参见图2所示,为本公开实施例提供的一种生成训练好的目标行人检测模型方法的流程图,所述方法包括步骤s201~s202,其中:
95.s201:获取多个第一样本图像;
96.这里,第一样本图像可以为任意场所的行人图像。
97.其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;
98.其中,第二样本图像可以任何带有行人的原始图像,第一样本图像可以是带有密集人群的原始图像,第一样本图像也可以是由至少两个第二样本图像合成得到的,对获取到的第一样本图像的要求是图像中行人数量较多,这样,使用这些第一样本图像训练得到的目标行人检测模型能够更加准确地识别出密集人群场景下的待检测图像。
99.这里,在训练初始行人检测模型时需要大量的样本图像支撑,这些样本图像要适配密集人群场景,然而目前的样本图像有很多是稀疏人群的图像,所以并不能给初始行人检测模型以足够的样本图像支撑,导致训练出的目标行人检测模型针对密集人群图像准确率较低,所以需要对样本图像进行数据扩充。
100.这里,也可以通过第二样本图像变换处理来增大样本图像的数量,变换处理方法比如图像镜像运算、图像颜色空间变换、图像裁剪缩放以及图像线性变换。
101.其中,在进行图像裁剪缩放时,可以增加网格面具gridmask和切割cutout方法,对第二样本图像进行抑制,以缓解训练模型在训练的时候出现的过拟合问题。
102.其次,对至少两个第二样本图像可以进行场景适配型数据增广,场景适配型数据增广通过自主研发的复制粘贴“copy-paste”的方法,利用至少两个第二样本图像进行合成得到第一样本图像,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量,增加第一样本图像的针对性场景的数据,使初始行人检测模型得到全面的训练。
103.s202:基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
104.这里,在获取到多个第一样本图像之后,提取每个第一样本图像中的特征和真实行人标签,输入到的算法网络中,例如,视网膜网络retinanet 特征金字塔网络(feature pyramid networks,fpn),根据每个第一样本图像的特征和真实行人标签对初始行人检测模型进行训练,计算每一个针对真实行人标签预测出来的行人框与真实行人标签的交叉熵损失值,当交叉熵损失值大于预设阈值时,不断地输入第一样本图像的特征和对应的真实行人标签,以使交叉熵损失值小于预设阈值,即可得到训练好的目标行人检测模型,以保证目标行人检测模型检测的准确性。
105.接下来,结合具体实施方式进一步对本实施例进行说明。
106.一种可选的实施方式中,根据以下步骤利用至少两个第二样本图像进行合成得到一个第一样本图像:
107.获取多个第二样本图像;
108.从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;
109.将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。
110.这里,在利用至少两个样本图像进行合成得到一个第一样本图像时,利用目标识别算法,例如yolo算法识别出其中一个第二样本图像中的目标行人,利用截取函数,将识别出的目标行人截取,并将截取到的目标行人利用合成函数,将截取到的行人随意粘贴到另一第二样本图像中的场景中,并将另一个第二样本图像作为第一样本图像。
111.其中,在得到第一样本图像之后,将可以通过通过识别算法对第一样图像中的真实行人标签进行检测,防止出现漏检或错检,保证第一样本图像的数据准确性,进而提高通过第一样本图像训练的模型的准确性。
112.一种可选的实施方式中,利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:
113.i
output
=i
foreground
*i
mask
(1-i
mask
)*i
background
114.其中,i
output
是第一样本图像,i
foreground
是两个第二样本图像中的任一第二样本图像,i
mask
是掩膜图像,i
background
是该两个第二样本图像中的另一第二样本图像。
115.这里,识别两个第二样本图像中的任一第二样本凸显中的目标行人,并给该第二样本凸显增加掩膜,对增加掩膜的区域进行提取,并判断两个第二样本图像中的另一第二样本图像中是否有与掩膜数据相同的数据,若有,则将两个第二样本图像中的另一第二样本图像删除与掩膜数据相同的数据,将两个第二样本图像中的任一第二样本图像的掩膜数据增加到删除了与掩膜数据相同的两个第二样本图像中的另一第二样本图像中,得到一个第一样本图像,实现第一样本图像的数据增广。
116.一种可选的实施方式中,所述基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型,包括:
117.针对任一第一样本图像,将所述第一样本图像输入所述初始行人检测模型中,得到预测行人标签;
118.基于各个所述第一样本图像对应的所述真实行人标签和所述预测行人标签,确定所述初始行人模型的各个交叉熵损失值;
119.当所述初始行人模型的任一交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
120.这里,在进行目标行人检测模型的训练时,将任一第一样本图像输入到初始行人检测模型中,对第一样本图像中的目标行人进行预测,得到针对目标行人的预测行人标签,每个目标行人均有对应的真实行人标签,计算目标行人的真实行人标签和预测行人标签的差异的大小,即交叉熵损失值,当交叉熵损失值小于预设阈值时,训练完毕,即可得到目标行人检测模型,若交叉熵损失值大于或等于预设值,则继续训练初始行人模型,直至交叉熵损失值小于预设阈值。
121.一种可选的实施方式中,确定所述初始行人模型预测行人标签的公式为:
122.y(pi)={yi∈y|iou(pi,yi)≥ε}
123.其中,y(pi)是所有的预测行人标签的集合,yi是第i个目标行人的真实行人标签,y是所有目标行人的真实行人标签,pi是第i个目标行人的预测行人标签,iou(pi,yi)是第i个目标行人的预测行人标签和真实行人标签的交叉熵损失值,ε是一个给定的iou(pi,yi)阈值。
124.这里,在获得预测行人标签之后,利用检测函数,检测出多个预测行人标签,具体的表达式如下:
125.126.其中,ci是目标行人的预测行人标签置信度,li为预测行人标签的坐标,n是常数表示预测行人标签y(pi)的最大基数。
127.本实施例公开的一种生成训练好的目标行人检测模型方法,通过已经进行过合成的样本数据进行模型训练,为目标行人检测模型训练提供了充分的数据基础,保证了目标行人检测更好的训练效果。
128.本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
129.基于同一发明构思,本公开实施例中还提供了与密集人群检测完方法对应的密集人群检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述密集人群检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
130.请参阅图3至图4,图3为本公开实施例提供的一种密集人群检测的示意图之一,图4为本公开实施例提供的一种密集人群检测的示意图之二。如图3中所示,本公开实施例提供的密集人群检测装置300,包括:
131.获取模块310,用于获取带有密集人群的待检测图像;
132.得到模块320,用于将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;
133.去重模块330,用于针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
134.统计模块340,用于统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
135.一种可选的实施方式中,所述得到模块320还包括训练模块350,所述训练模块350用于根据以下步骤生成训练好的所述目标行人检测模型:
136.获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;
137.基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
138.一种可选的实施方式中,所述训练模块350根据以下步骤利用至少两个第二样本图像进行合成得到一个第一样本图像:
139.获取多个第二样本图像;
140.从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;
141.将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。
142.一种可选的实施方式中,所述训练模块350利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:
143.i
output
=i
foreground
*i
mask
(1-i
mask
)*i
background
144.其中,i
output
是第一样本图像,i
foreground
是两个第二样本图像中的任一第二样本图像,i
mask
是掩膜图像,i
background
是该两个第二样本图像中的另一第二样本图像。
145.一种可选的实施方式中,所述去重模块330在用于对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像时,具体用于:
146.针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;
147.基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像。
148.一种可选的实施方式中,所述训练模块350在用于基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型时,具体用于:
149.针对任一第一样本图像,将所述第一样本图像输入所述初始行人检测模型中,得到预测行人标签;
150.基于各个所述第一样本图像对应的所述真实行人标签和所述预测行人标签,确定所述初始行人模型的各个交叉熵损失值;
151.当所述初始行人模型的任一交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
152.一种可选的实施方式中,所述训练模块350用于确定所述初始行人模型预测行人标签的公式为:
153.y(pi)={yi∈y|iou(pi,yi)≥ε}
154.其中,y(pi)是所有的预测行人标签的集合,yi是第i个目标行人的真实行人标签,y是所有目标行人的真实行人标签,pi是第i个目标行人的预测行人标签,iou(pi,yi)是第i个目标行人的预测行人标签和真实行人标签的交叉熵损失值,ε是一个给定的iou(pi,yi)阈值。
155.关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
156.本公开实施例公开的密集人群检测装置,通过获取模块,用于获取带有密集人群的待检测图像;得到模块,用于将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;去重模块,用于针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计模块,用于统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。这样,可以针对密集场所的人群的人数进行精准的检测。
157.基于同一技术构思,本技术实施例还提供了一种电子设备。本公开实施例还提供
了一种电子设备500,如图5所示,为本公开实施例提供的电子设备500结构示意图,包括:
158.处理器510、存储器520、和总线530;存储器520用于存储执行指令,包括内存521和外部存储器522;这里的内存521也称内存储器,用于暂时存放处理器510中的运算数据,以及与硬盘等外部存储器522交换的数据,处理器510通过内存521与外部存储器522进行数据交换,当所述电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,使得所述处理器510可以执行上述方法实施例中所示的密集人群检测方法的步骤。
159.本公开实施例还提供一种计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的密集人群检测方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
160.本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的密集人群检测方法的步骤,具体可参见上述方法实施例,在此不再赘述。
161.其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
162.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备、存储介质和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的设备、存储介质、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
163.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
164.另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
165.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
166.最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开
的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献