一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标检测方法、装置、设备、存储介质和程序产品与流程

2022-03-02 03:49:51 来源:中国专利 TAG:


1.本技术涉及计算机视觉技术领域,特别是涉及一种目标检测方法、装置、设备、存储介质和程序产品。


背景技术:

2.随着计算机视觉领域的发展,出现了多种基于卷积神经网络的深度学习目标检测方法。图像的目标检测是指利用算法将图像上的重点目标的区域标注出来,通常是以一个矩形框指出目标所在的区域。
3.图像的目标检测应用的领域包括但不限于人脸检测、行人检测、对自然图像的检测等等。相关技术中,进行目标检测时常用的方法包括“二阶段”方法的rcnn系列、“一阶段”方法的yolo系列等,这些方法需要在选择候选区域时,预先设置不同长宽比与尺寸的矩形框,并在特征图上与格点同中心依次表征候选区域,从而完成图像中的目标检测。
4.但是,相关技术中的目标检测方法在进行目标检测时,会出现同个物体被同时分类到不同类别中的情况,导致输出的目标检测结果精确度较低。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种能够输出精确度更高的目标检测结果的目标检测方法、装置、设备、存储介质和程序产品。
6.第一方面,本技术提供了一种目标检测方法,该方法包括:
7.获取待检测图像;待检测图像包括至少一个待检测目标;
8.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
9.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
10.在其中一个实施例中,目标检测网络还包括特征图生成单元和定位信息头模组;相应地,将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果,包括:
11.将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图;
12.将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息;
13.根据分类结果和定位信息,确定各待检测目标的检测结果。
14.在其中一个实施例中,概率热力图头模组还包括非背景通道;相应地,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果,
包括:
15.将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域;
16.将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域;
17.对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
18.在其中一个实施例中,定位信息头模组包括位置信息头模组和尺寸信息头模组;相应地,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息,包括:
19.通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息;
20.通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息;
21.根据位置信息和尺寸信息,确定待检测目标的定位信息。
22.在其中一个实施例中,上述目标检测网络的构建过程包括:
23.获取多个已标注目标的训练图像;
24.将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;
25.将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;
26.根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
27.在其中一个实施例中,将多个已标注目标的训练图像输入至初始目标检测网络中之前,方法包括:
28.对多个已标注目标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
29.第二方面,本技术还提供了一种目标检测装置,该装置包括:
30.图像获取模块,用于获取待检测图像;待检测图像包括至少一个已标注的待检测目标;
31.图像检测模块,用于将待检测图像输入至预设的目标检测网络中,得到各待检测目标的分类结果;
32.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于对各待检测目标进行分类,并通过背景通道去除分类后的待检测目标中的干扰因素。
33.第三方面,本技术还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
34.获取待检测图像;待检测图像包括至少一个待检测目标;
35.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
36.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概
率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
37.第四方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
38.获取待检测图像;待检测图像包括至少一个待检测目标;
39.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
40.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
41.第五方面,本技术还提供了一种计算机程序产品,该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
42.获取待检测图像;待检测图像包括至少一个待检测目标;
43.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
44.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
45.上述目标检测方法、装置、设备、存储介质和程序产品,终端通过获取包括至少一个待检测目标的待检测图像;将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果,其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。由于在对待检测图像中的目标进行检测时,是通过以预先训练好的目标检测网络来检测的,该目标检测网络中设置有概率热力图头模组,且概率热力图头模组中设置有背景通道,在目标检测时,可以通过概率热力图头模组中的背景通道,去除待检测图像中的背景信息对目标进行分类时产生的干扰因素,从而使得待检测目标的分类精确度,进而增加待检测图像中各待检测目标的检测结果的精确度。
附图说明
46.图1为一个实施例中目标检测方法的应用环境图;
47.图2为一个实施例中目标检测方法的流程示意图;
48.图3为一个实施例中目标检测方法架构示意图;
49.图4为一个实施例中概率热力图头模组的流程示意图;
50.图5为一个实施例中的定位信息示意图;
51.图6为一个实施例中的旋转目标框的标注示意图;
52.图7为一个实施例中的测试结果示意图;
53.图8为一个实施例中目标检测装置的结构框图;
54.图9为一个实施例中计算机设备的内部结构图。
具体实施方式
55.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对
本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
56.本技术提供的目标检测方法,可以应用于计算机设备中,该计算机设备可以终端、可以是服务器、还可以应用于包括终端和服务器构成的设备集群,例如,包括但不限于各种个人计算机、笔记本电脑、平板电脑、可穿戴设备等等,本技术实施例对计算机设备的类型不作限定。如图1所示,提供一种计算机设备的内部结构示意图,图1中的处理器用于提供计算和控制能力。存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。数据库用于存储特征选择过程的相关数据。该网络接口用于与外部的其他设备通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测方法。
57.一个实施例中,提供了一种目标检测方法,本实施例以该方法应用于终端进行举例说明,如图2所示,该方法包括以下步骤:
58.步骤102,获取待检测图像;待检测图像包括至少一个待检测目标。
59.其中,待检测图像为预先获取的,包括需要进行分类检测的目标的图像。待检测目标为待检测图像中需要进行分类检测的目标。
60.具体地,终端获取包括至少一个待检测目标的待检测图像。本实施例并不对待检测图像的类型做限定,满足目标检测网络的处理格式即可。可选地,待检测图像为通过航拍获取的图像或遥感影像。
61.步骤104,将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
62.其中,预设的目标检测网络为基于卷积神经网络与centernet(基于中心点的方法)进行训练后的检测网络。概率热力图头模组是对待检测图像中的待检测目标进行分类的模组。背景通道是概率头模组中预设的用来确定待检测图像中属于背景的部分。检测结果为待检测目标对应的区域及对应的分类结果。
63.具体地,终端将待检测图像输入至基于卷积神经网络与centernet进行训练后的目标检测网络中,通过目标检测网络中的概率热力图头模组对各待检测目标进行分类,在分类过程中通过概率热力图头模组的背景通道确定待检测图像中属于背景的部分,以去除待检测目标中的干扰因素。终端通过目标检测网络对分类结果进行相关处理以获得各待检测目标的检测结果。
64.上述目标检测方法中,终端通过获取包括至少一个待检测目标的待检测图像;将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果,其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。由于在对待检测图像中的目标进行检测时,是通过以预先训练好的目标检测网络来检测的,该目标检测网络中设置有概率热力图头模组,且概率热力图头模组中设置有背景通道,在目标检测时,可以通过概率热力图头模组中的背景通道,去除待检测图像中的背景信息对目标进行分类时产生的干扰因素,从而使得待检测目标的分类精确度,进而增加待检
测图像中各待检测目标的检测结果的精确度。
65.在一个实施例中,目标检测网络还包括特征图生成单元和定位信息头模组;相应地,将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果,包括:
66.将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图。
67.其中,特征图生成单元为图像处理单元。
68.具体地,终端将待检测图像输入至预设的目标检测网络中,通过目标检测网络中的特征图生成单元对待检测图像进行不同分辨率的下采样以生成对分辨率的特征图,后将各对应分辨率的特征图进行多尺度融合生成待检测特征图。
69.在具体地实施过程中,终端将待检测图像输入至预设的目标检测网络中,通过目标检测网络中的卷积神经网络,例如图3中的resnet101(101层残差网络)对待检测图像进行不同分辨率的下采样,并保存不同下采样率的卷积块对应的特征图,后通过short-cut(cnn模型下的一种结构)将不同下采样率的卷积块对应的特征图进行融合,得到多尺度特征图即待检测特征图。
70.将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息。
71.其中,待检测特征图的格点区域为根据待检测特征图划分的网格区域。定位信息头模组为确定待检测目标的区域的模组。定位信息指待检测目标在待检测图像中的区域。
72.目标检测网络中的概率热力图头模组和定位信息头模组为并列设置的两个模组,从特征图生成单元输出的待检测特征图会分别进入到概率热力图头模组和定位信息头模组,具体地,待检测特征图输入到概率热力图头模组中,可以实现从根据待检测特征图划分的网格区域中确定待检测特征图中的待检测目标的分类结果;同时待检测特征图进入至定位信息头模组中,可以实现从待检测特征图中确定待检测目标在待检测图像中的区域。
73.示例地,在一实施例中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果的一种实现方式包括以下过程:
74.将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域。
75.本实施例中,概率热力图头模组还包括非背景通道。
76.其中,通道为目标检测的分类,例如,目标检测的需求为检测航拍图像中的船只类型,那么,船只的所有分类对应的类型则对应一种非背景通道。
77.终端将待检测特征图中的所有格点区域,依次取各格点区域在背景通道和非背景通道中概率最大值对应的通道后,将各格点区域及对应的概率最大值所在的的背景通道或非背景通道确定为初始候选格点区域。
78.将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域。
79.具体地,终端将初始候选格点区域中即各格点区域及对应的概率最大值所在的背景通道或非背景通道中,各格点区域及对应的概率最大值所在的通道为非背景通道的初始
候选格点区域确定为次级候选格点区域,将次级候选格点区域按预设条件进行筛选,符合预设条件的次级格点区域确定为候选格点区域。本发明不对预设条件做限定,预设条件的设定根据需求可适应性修改,可选地,预设条件为将次级候选格点区域的概率值降序排序,按需求选取排序的一部分作为候选格点区域;可选地,预设条件为将次级候选格点区域的概率值与标准阈值进行比较,若概率值大于标准值则确定其为候选格点区域。
80.对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
81.具体地,终端对在待检测特征图中的对应相同待检测目标的候选格点区域通过极大值抑制函数进行合并,得到待检测目标的分类结果。
82.在具体地实施过程中,如图4所示,若终端将待检测图像输入至预设的目标检测网络中的特征图生成单元后输出的待检测特征图的尺寸为m*n,将待检测特征图划分成m*n个格点区域。终端获取根据需求划分的c个分类类型,相应地,非背景通道数量为c,背景通道数量为1,各通道通过图4中的一片网格进行表征。终端将包括m*n个格点区域的待检测特征图输入至概率热力图头模组的c 1个通道中,获取m*n个格点区域对应的概率最大值的通道,并将其作为初始候选格点区域,上述初始候选格点区域通过图4中的各通道中的星号进行标识。将m*n个候选格点区域中格点区域的最大概率值对应的通道为背景通道的格点区域确定为次级候选格点区域,并将次级候选格点区域按其中的概率值从大到小进行排序,将次级候选格点区域中概率值为前k大的次级候选格点区域确定为候选格点区域。若不同的候选格点区域表征同一个待检测目标,则使用非极大值抑制函数将表征同一个待检测目标的不同候选格点区域进行待检测目标的分类。
83.上述通过待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域以对各格点区域进行分类,每个通道的最大值的可能为1/通道数量,使得同个格点区域的分类概率之和为1,分类的划分是互斥的。通过将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域,即通过背景通道去除待检测目标中对背景进行分类产生的干扰因素,增加待检测目标的分类精确度;通过对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,确定目标候选格点区域即得到待检测目标的分类结果。
84.示例地,在一实施例中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息的一种实现方式包括以下过程:
85.本实施例中,定位信息头模组包括位置信息头模组和尺寸信息头模组。
86.通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息。
87.其中,位置信息头模组用于获取待检测目标在待检测图像中的中心点位置坐标。
88.具体地,终端通过位置信息头模组从概率热力图头模组中获取目标格点区域的索引信息,以得到待检测图像中目标的中心点坐标范围,并结合尺寸信息头模组自身获取的坐标偏移量,获得具体的中心点位置坐标。
89.通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息。
90.其中,尺寸信息头模组用于获取待检测目标的标注框。
91.具体地,终端通过尺寸信息头模组调用位置信息头模组获取的待检测目标在待检测图像中的中心点位置坐标,回归计算中心点位置坐标相对于4个中点相对中心的偏移量,
以获取待检测目标的标注框的位置坐标信息。
92.据位置信息和尺寸信息,确定待检测目标的定位信息。
93.具体地,终端根据待检测目标的中心点位置坐标和标注框的位置坐标信息确定待检测目标在待检测图像中的定位信息,该定位信息可以理解为如图5中的船只图像的标注框。
94.终端根据待检测目标的中心点位置信息和尺寸信息,确定待检测目标的定位信息,减少预先标注待检测目标的工作,使得目标检测的过程中人工作业量减少,智能化的程度增加。
95.经过上述过程后,可以得到待检测目标的分类结果和定位信息,相当于将待检测图像的待检测特征图中对应相同待检测目标的每个候选格点的进行了合并,即属于同一目标的候选格点划分到一起,且在将属于同一目标的候选格点划分到一起时,确定出了待检测目标的定位信息,即可知道每个待检测目标的轮廓尺寸以及中心点的坐标位置等信息,由此,可确定出在待检测图像中每个待检测目标的定位信息,与分类结果相结合即可确定出各待检测目标的检测结果。
96.另外,在一些场景中,确定出各待检测目标的检测结果后,终端将每个待检测目标在待检测图像中进行标注,例如以旋转矩形框等方式进行标注,并输出在终端界面中。另一些场景,终端在确定出各待检测目标的检测结果,检测是否接收到用户的查看检测结果请求,该请求表示用户此时需要查看在待检测图像中检测出的每个检测目标,则终端在接收到该请求后,再执行将每个待检测目标在待检测图像中进行标注并输出在终端界面中的步骤,方便用户查看。本技术实施例对此过程不做限定,可根据实际需求来设置。
97.上述目标检测方法中,通过目标检测网络中的特征图生成单元提取待检测图像对应的待检测特征图,该待检测特征图可以表征不同尺寸的待检测目标,以便于终端将待检测特征图输入至概率热力图头模组和定位信息头模组中,可以更准确的对不同尺寸的待检测目标进行处理。该处理包括通过概率热力图头模组中的背景通道去除待检测目标中对背景进行分类产生的干扰因素,增加待检测目标的分类精确度;通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息,减少预先标注待检测目标的工作,使得目标检测的过程中人工作业量减少,智能化的程度增加;最终根据分类结果和定位信息,确定各待检测目标的检测结果。
98.基于上述任一实施例,在一个实施例中,目标检测网络的构建过程包括:获取多个已标注目标的训练图像。
99.其中,训练图像通过旋转目标框对待检测目标进行标注,如图6所示。
100.具体地,终端获取多个已标注目标的训练图形。终端通过旋转矩形框对训练图像中的待检测目标进行标注后,对旋转矩形框的四个顶点进行处理,获取旋转矩形框的四个边的中心点以及旋转矩形框的中心点,根据上述五个中心点获取旋转矩形框的中心点指向旋转矩形框的四条边的中心点的偏移向量。终端根据需求制定待检测目标的类别。
101.将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;
102.具体地,终端根据待检测目标的类别设置初始概率头模组的通道数量,若类别为
c,则通道数量为c 1,其中,c个通道为待检测目标的每个类别对应一个通道,另外的1个通道为背景通道。其中,训练过程中的“终端将多个已标注的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数。”的执行步骤与目标检测放中对应的检测步骤具有相应的技术特征,在此不再赘述。
103.将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
104.其中,预设的迭代次数为使损失函数达到局部最优后对应的预设迭代次数。
105.具体地,终端将将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中,判断训练候选目标的分类结果和训练定位参数与标注的分类结果和旋转目标框的数据做分析,若差值不满足期望,则根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。其中,期望为局部最优值或相对稳定不变的值或范围。
106.上述目标检测方法中,在终端构建目标检测网络的过程中,通过将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,提高目标检测的检测率;通过将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组增加训练候选目标的分类结果的准确率;通过初始目标检测网络中的初始定位信息头模组确定训练定位参数,减少预先标注待检测目标的工作,使得目标检测的过程中人工作业量减少,智能化的程度增加。
107.在一个实施例中,将多个已标注目标的训练图像输入至初始目标检测网络中之前,该方法包括:
108.对多个已标注目标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
109.具体地,终端通过开源工具dota-toolkit对输入的已标注目标的训练图像以待检测目标所在区域为中心进行剪裁并进行数据增广,以得到预设尺寸的训练图像。
110.可选地,预设尺寸的训练图像的尺寸为608*608。
111.上述目标检测方法中,通过数据增广获得扩大训练集规模、降低模型对某些属性的依赖效果。
112.在一个实施例中,包括hrsc2016数据集,该数据集收录了27种舰船,共1061张图片,这些图片中包括2976个目标。将这1061张图片划分成3个数据集包括训练集、验证集、测试集,这3个数据集中分别有436、181、444张图片。
113.将训练集中的图片作为训练图像,构建目标检测网络。其中,处理后的训练图像的尺寸为608*608初始学习率为1.25*10-4,学习率变化函数为指数型函数。训练阶段批次数为16,测试阶段批次数为1。将次级候选格点区域中概率值为前500大的次级候选格点区域确定为候选格点区域。
114.将测试集输入至目标检测网络后的输出结果如图7所示。
115.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头
的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
116.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的目标检测方法的目标检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标检测装置实施例中的具体限定可以参见上文中对于目标检测方法的限定,在此不再赘述。
117.在一个实施例中,如图8所示,提供了一种目标检测装置,包括:图像获取模块100和图像检测模块200,其中:
118.图像获取模块100,用于获取待检测图像;待检测图像包括至少一个待检测目标;
119.图像检测模块200,用于将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
120.在一个实施例中,目标检测网络还包括特征图生成单元和定位信息头模组;相应地,图像检测模块200,包括:
121.将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图;将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息;根据分类结果和定位信息,确定各待检测目标的检测结果。
122.在一个实施例中,概率热力图头模组还包括非背景通道;相应地,图像检测模块200,包括:
123.将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域;将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域;对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
124.在一个实施例中,定位信息头模组包括位置信息头模组和尺寸信息头模组;相应地,图像检测模块200,包括:
125.通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息;通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息;根据位置信息和尺寸信息,确定待检测目标的定位信息。
126.在一个实施例中,目标检测网络的构建过程包括:
127.训练图像获取模块,用于获取多个已标注目标的训练图像;
128.结果和参数获取模块,用于将多个已标注目标的训练图像输入至初始目标检测网
络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;
129.参数代入模块,用于将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;
130.检测网络确定模块,用于根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
131.在一个实施例中,结果和参数获取模块之前,包括:
132.数据预处理模块,用于对多个已标注目标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
133.上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
134.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待检测图像。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测方法。
135.本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
136.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
137.获取待检测图像;待检测图像包括至少一个待检测目标;
138.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
139.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
140.在一个实施例中,该处理器执行计算机程序时实现以下步骤:将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图;将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息;根据分类结果和定位信息,确定各待检测目标的检测结果。
141.在一个实施例中,该处理器执行计算机程序时实现以下步骤:将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域;将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点
区域;对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
142.在一个实施例中,该处理器执行计算机程序时实现以下步骤:通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息;通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息;根据位置信息和尺寸信息,确定待检测目标的定位信息。
143.在一个实施例中,该处理器执行计算机程序时实现以下步骤:获取多个已标注目标的训练图像;将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
144.在一个实施例中,该处理器执行计算机程序时实现以下步骤:对多个已标注目标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
145.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
146.获取待检测图像;待检测图像包括至少一个待检测目标;
147.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
148.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
149.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图;将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息;根据分类结果和定位信息,确定各待检测目标的检测结果。
150.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域;将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域;对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
151.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息;通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息;根据位置信息和尺寸信息,确定待检测目标的定位信息。
152.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个已标注
目标的训练图像;将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
153.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对多个已标注目标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
154.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
155.获取待检测图像;待检测图像包括至少一个待检测目标;
156.将待检测图像输入至预设的目标检测网络中,得到各待检测目标的检测结果;
157.其中,目标检测网络包括概率热力图头模组;概率热力图头模组包括背景通道;概率热力图头模组用于通过背景通道去除待检测目标中的干扰因素,并在去除干扰因素后对各待检测目标进行分类。
158.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测图像输入至目标检测网络中,通过特征图生成单元提取待检测图像对应的待检测特征图;将待检测特征图输入至概率热力图头模组中,通过概率热力图头模组从待检测特征图的格点区域中确定待检测特征图中的待检测目标的分类结果;以及,将待检测特征图输入至定位信息头模组中,通过定位信息头模组从待检测特征图中确定待检测特征图中的待检测目标的定位信息;根据分类结果和定位信息,确定各待检测目标的检测结果。
159.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测特征图中所有格点区域,在背景通道和非背景通道的所有通道上的最大值,对应确定出初始候选格点区域;将初始候选格点区域中,属于非背景通道的预设数量的格点区域,确定为候选格点区域;对在待检测特征图中的对应相同待检测目标的候选格点区域进行合并,得到待检测目标的分类结果。
160.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过位置信息头模组从待检测特征图中确定待检测目标的中心点的位置信息;通过尺寸信息头模组获取待检测特征图中确定待检测目标的尺寸信息;根据位置信息和尺寸信息,确定待检测目标的定位信息。
161.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个已标注目标的训练图像;将多个已标注目标的训练图像输入至初始目标检测网络中,通过初始目标检测网络中的初始概率热力图头模组确定训练候选目标的分类结果,以及通过初始目标检测网络中的初始定位信息头模组确定训练定位参数;将训练候选目标的分类结果和训练定位参数均代入预设的损失函数中;根据损失函数的计算结果进行反向传播,对初始特征图生成单元、初始概率热力图头模组和初始定位信息头模组进行迭代优化,直至达到预设的迭代次数,得到目标检测网络。
162.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对多个已标注目
标的训练图像进行数据增广预处理;数据增广预处理至少包括图像变换处理、图像剪裁处理、图像翻转处理。
163.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
164.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
165.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
166.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献