一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标对象的检测方法、装置、电子设备以及存储介质与流程

2022-06-05 19:50:56 来源:中国专利 TAG:


1.本技术实施例涉及目标检测技术领域,尤其涉及一种目标对象的检测方法、装置、电子设备以及存储介质。


背景技术:

2.目标检测是指从图像中确定存在目标的图像区域,目标检测结果用于目标分类,确定图像中目标类别。
3.目标检测通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标。在进行区域采样过程中,以每个像素为中心生成多个大小和高宽比不同的边界框。这些边界框被称为锚框。在目标检测模型中,通常是预先定义几个固定尺度和高宽比的锚框,然后以这些锚框为窗口,设置步长,通过滑窗的方法生成铺满全图的锚框。再通过优化锚框与目标的真实边界框之间损失函数,以输出目标的检测框。
4.然而,通过滑窗方法生成锚框需要人工定义锚框,如果定义的不合适,影响网络模型的收敛,降低检测结果的准确性。


技术实现要素:

5.本技术实施例提供一种目标对象的检测方法、装置、电子设备以及存储介质,以提供一种准确度更高的目标检测方案。
6.第一方面,本技术一种目标对象的检测方法,包括:
7.获取输入图像的特征图,其中,输入图像包括目标对象;
8.根据已训练的锚框生成模型对输入图像的特征图进行处理,获得输入图像的锚框;其中,输入图像的锚框通过锚框生成模型被预测出锚框的大小和位置;
9.根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。
10.可选地,根据已训练的锚框生成模型对输入图像的特征图进行处理获得输入图像的锚框,具体包括:
11.根据输入图像的特征图和已训练的位置预测模块,确定多个锚框的中心位置;
12.根据输入图像的特征图和已训练的高宽比预测模块,确定多个锚框的高宽比;
13.根据多个锚框的中心位置、多个锚框的高宽比以及已训练的组合模块,生成输入图像的多个锚框;
14.其中,锚框生成模型包括位置预测模块、高宽比预测模块以及组合模块。
15.可选地,根据输入图像的特征图和已训练的位置预测模块确定多个锚框的中心位置,具体包括:
16.根据第一述卷积函数对输入图像的特征图进行卷积处理,获得第一中间结果;
17.根据第一激活函数对第一中间结果进行激活处理,获得多个锚框的中心位置;
18.其中,位置预测模块包括第一述卷积函数和第一激活函数。
19.可选地,根据输入图像的特征图和已训练的高宽比预测模块确定多个锚框的高宽比,具体包括:
20.根据第二卷积函数对输入图像的特征图进行卷积处理,获得第二中间结果;
21.根据第二激活函数对第二中间结果进行激活处理,获得多个锚框的高宽比;
22.其中,高宽比预测模块包括第二卷积函数和第二激活函数。
23.可选地,方法还包括:
24.根据未训练的特征提取模型对训练图像进行处理,获得训练特征图;
25.根据未训练的锚框生成模型对训练特征图进行处理,获得训练锚框;
26.根据未训练的输出模型对训练特征图和训练锚框进行处理,获得训练目标区域;
27.根据训练目标区域以及标记目标区域获得模型损失值;
28.判断模型损失值是否满足预设收敛条件,若是,输出已训练的特征提取模型、已训练的锚框生成模型以及已训练的输出模型;
29.若否,用模型损失值更新特征提取模型的模型参数、锚框生成模型的模型参数以及输出模型的模型参数,并返回执行根据未训练的特征提取模型对训练图像进行处理;
30.其中,标记目标区域是对训练图像中训练目标进行标记获得。
31.可选地,根据训练目标区域以及标记目标区域获得模型损失值,具体包括:
32.根据训练目标区域以及标记目标区域分别计算获得锚框损失值、分类损失值以及回归损失值;
33.根据分类损失、回归损失以及锚框损失计算获得模型损失值。
34.可选地,根据训练目标区域以及标记目标区域分别计算获得锚框损失值,具体包括:
35.计算训练目标的边界框的中心点与训练目标区域对应的锚框的中心点之间的位置偏移量;
36.根据训练目标的边界框的参数与训练目标区域对应的锚框的参数,计算得到训练目标的边界框与锚框之间交并比;
37.根据位置偏移量和交并比,获得锚框损失;其中,训练目标的边界框是根据标记目标区域生成的。
38.第二方面,本技术提供一种目标对象的检测装置,包括:
39.获取模块,用于获取输入图像的特征图,其中,输入图像包括目标对象;
40.处理模块,用于根据已训练的锚框生成模型对输入图像的特征图进行处理,获得输入图像的锚框;其中,输入图像的锚框通过锚框生成模型被预测出锚框的大小和位置;
41.处理模块还用于根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。
42.第三方面,本技术提供一种电子设备,包括:
43.存储器,用于存储程序;
44.处理器,用于执行存储器存储的程序,当程序被执行时,处理器用于执行第一方面及可选方案所涉及的目标对象的检测方法。
45.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现第一方面及可选方案所涉及目
标对象的检测方法。
46.本技术实施例提供一种目标对象的检测方法、装置、电子设备以及存储介质,先使用已训练的锚框生成模型对输入图像的特征图进行预测获得输入图像的锚框,再根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。无需人工设置滑动步长以及锚框大小,不存在由于滑动步长以及锚框大小等参数设置不当导致模型召回率低和精度不高的问题。且通过训练锚框生成模型,使该模型所生成锚框更加接近目标所在区域,提高目标检测结果的准确度。
附图说明
47.图1为现有技术中人工设置锚框的分布示意图;
48.图2为本技术一实施例提供的目标对象的检测方法的流程示意图;
49.图3为本技术另一实施例提供的目标对象的检测方法的流程示意图;
50.图4为本技术另一实施例提供的检测模型的架构示意图;
51.图5为本技术另一实施例提供的锚框生成模型的架构示意图;
52.图6为本技术另一实施例提供的使用锚框生成模型生成的锚框的分布示意图;
53.图7为本技术另一实施例提供的目标对象的检测装置的结构示意图;
54.图8为本技术另一实施例提供的电子设备的结构示意图。
具体实施方式
55.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
56.目标检测是指从图像中确定存在目标的图像区域,目标检测结果用于目标分类,确定图像中目标类别。目标检测通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标。在进行区域采样过程中,以每个像素为中心生成多个大小和高宽比不同的边界框。这些边界框被称为锚框。
57.在现有技术中,如图1所示,通常是预先定义几个固定尺度和高宽比的锚框,然后以这些锚框为窗口,设置步长,通过滑窗的方法生成铺满全图的锚框。再通过优化锚框与目标的真实边界框之间损失函数,以输出目标的检测框。
58.然而,通过滑窗方法生成锚框需要人工定义锚框的尺度和高宽比,如果定义的不合适,就不能和目标的真实边界框合理的匹配,会产生大量的负样本,导致正负样本不均衡,影响网络模型的收敛,降低检测结果的准确性和召回率。
59.本技术实施例提供一种目标对象的检测方法、装置、电子设备以及存储介质,旨在提供一种更加准确的目标对象的检测方法。本技术的发明构思是:构建锚框生成模型,并通过训练得到最优的锚框生成模型的模型参数,无需人工设置滑动步长以及锚框大小,不存在由于滑动步长以及锚框大小等参数设置不当导致模型召回率低和精度不高的问题。根据已经训练的锚框生成模型生成锚框,所生成的锚框更符合输入图像中目标分布,使检测模型快速收敛,提高检测结果的准确度。
60.如图2所示,本技术一种目标对象的检测方法,该目标对象的检测方法的执行主体是电子设备,例如:计算机设备。该目标对象的检测方法包括:
61.s101、获取输入图像的特征图。
62.其中,输入图像是进行目标检测的图像,输入图像内包含有目标对象的图像。本方案正是从输入图像中准确提取出目标对象的图像。
63.在获得输入图像后,对输入图像使用卷积网络进行处理获得输入图像的特征图。
64.s102、根据已训练的锚框生成模型对输入图像的特征图进行处理获得输入图像的锚框。
65.其中,锚框生成模型先根据输入图像的特征图预测出锚框的大小和锚框位置,再根据锚框的大小和锚框位置获得输入图像的锚框。通过训练锚框生成模型中模型参数,使锚框生成模型可以准确预测每个输入图像的锚框。锚框生成模型通过多次循环输出输入图像的最优的锚框。
66.s103、根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。
67.其中,输出模型将输入图像的特征图和锚框进行融合获得目标对象的图像。具体融合过程为:根据特征图的位置信息和锚框的位置信息,将输入图像的特征图和输入图像的锚框进行匹配,获得与锚框关联的输入图像的特征图。再根据锚框的位置和大小确定目标对象的图像区域的位置和大小,再根据与锚框关联的输入图像的特征图、目标对象的图像区域的位置和大小确定目标对象的图像。此处仅描述一个循环中融合过程,通过多次循环获得最优融合结果后输出目标对象的图像。
68.在本技术实施例提供的目标对象的检测方法中,根据已训练的锚框生成模型对输入图像的特征图进行处理获得输入图像的锚框,相较于现有技术中以滑动窗口的中心作为锚点,以每个锚点的中心产生数量固定不同尺寸的锚框方式,本实施例无需人工设置滑动步长以及锚框大小,不存在由于滑动步长以及锚框大小等参数设置不当导致模型召回率低和精度不高的问题。通过训练锚框生成模型,使该模型所生成锚框更加接近目标所在区域,提高目标检测结果的准确度。
69.本技术一种目标对象的检测方法,该目标对象的检测方法的执行主体是电子设备,例如:计算机设备。该目标对象的检测方法包括:
70.s201、根据已训练的特征提取模型对输入图像进行处理获得输入图像的特征图。
71.其中,特征提取模型包括卷积网络,通过对卷积网络中参数进行训练,以使该卷积网络可以从输入图像中提取出输入图像的特征图。
72.s202、根据已训练的锚框生成模型对输入图像的特征图进行处理获得输入图像的锚框。
73.其中,锚框生成模型包括位置预测模块、高宽比预测模块以及组合模块。通过训练锚框生成模型中的位置预测模块的参数、高宽比预测模块的参数以及组合模块的参数,获得已训练的位置预测模块、已训练的高宽比预测模块以及已训练的组合模块。
74.根据输入图像的特征图和已训练的位置预测模块确定多个锚框的中心位置。根据输入图像的特征图和已训练的高宽比预测模块确定多个锚框的高宽比。根据多个锚框的中心位置、多个锚框的高宽比以及已训练的组合模块生成输入图像的多个锚框。
75.更具体地,位置预测模块包括第一述卷积函数和第一激活函数。位置预测模块的参数包括第一卷积函数的参数和第一激活函数的参数。通过训练确定第一卷积函数的最优参数以及第一激活函数的最优参数,进而获得已经训练的第一激活函数和已经训练的第一卷积函数。再使用已经训练的第一述卷积函数对输入图像的特征图进行卷积处理获得第一中间结果,使用已经训练的第一激活函数对第一中间结果进行激活处理获得多个锚框的中心位置。
76.更具体地,高宽比预测模块包括第二卷积函数和第二激活函数。高宽比预测模块的参数包括第二卷积函数的参数和第二激活函数的参数。通过训练确定第二卷积函数的最优参数以及第二激活函数的最优参数,进而获得已经训练的第二激活函数和已经训练的第二卷积函数。再使用已经训练的第二卷积函数对输入图像的特征图进行卷积处理获得第二中间结果。使用已经训练的第二激活函数对第二中间结果进行激活处理获得多个锚框的高宽比。
77.在确定多个锚框的中心位置和多个锚框的高宽比后,使用组合模型对锚框的中心位置和高宽比进行组合获得输入图像的锚框。
78.上面仅描述了锚框生成模型的处理过程,需要说明的是,锚框生成模型通过多次循环输出输入图像的最优的锚框。
79.s203、根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。
80.其中,在获得输入图像的锚框之后,将输入图像的特征图和输入图像的锚框输入输出模型,输出模型将输入图像的特征和锚框进行融合获得目标对象的图像。
81.在本技术实施例提供目标对象的检测方法中,使用位置预测模块预测锚框的中心位置,使用高宽比预测模块预测锚框的大小,再使用组合模块将锚框的中心位置和锚框大小进行组合获得输入图像的锚框,所生成的锚框更加接近目标所在区域,提高目标检测结果的准确度,相较于现有技术中需要人工设置滑动步长或者锚框大小等参数方式,本实施例不存在由于人工设置参数不当导致模型召回率低和精度降低的问题。
82.如图3所示,本技术一种目标对象的检测方法,该目标对象的检测方法的执行主体是电子设备,例如:计算机设备。该目标对象的检测方法包括:
83.s301、获取训练图像和训练图像中训练目标的目标区域。
84.其中,训练图像和训练图像中训练目标的目标区域作为训练样本,用于训练检测模型。训练图像作为检测模型的输入数据,训练目标的目标区域作为检测模型的输出数据。
85.s302、将训练图像经过未训练的特征提取模型、未训练的锚框生成模型以及未训练的输出模型处理后,得到训练目标区域。
86.其中,如图4所示,特征提取模型用于对输入图像进行特征提取获得输入图像的特征图,锚框生成模型用于对输入图像的特征图进行预测获得输入图像的锚框,输出模型用于将输入图像的特征图和锚框进行融合得到目标对象的图像。
87.将训练图像输入未训练的特征提取模型中进行特征提取获得训练特征图。将训练特征图输入未训练的锚框生成模型中进行预测获得训练锚框。将训练特征图和训练锚框输入未训练的输出模型进行融合处理获得训练目标区域。
88.更具体地,锚框生成模型包括位置预测模块、高宽比预测模块以及组合模块。训练
特征图在锚框生成模型中的预测过程具体包括:将训练特征图输入未训练的位置预测模块进行位置预测获得多个训练锚框的中心位置。将训练特征图输入未训练的高宽比预测模块进行高宽比预测获得多个训练锚框的高宽比。将多个训练锚框的中心位置和高宽比输入未训练的组合模块中进行融合输出多个训练锚框。
89.如图5所示,位置预测模块包括第一卷积函数和第一激活函数,训练特征图在位置预测模块中的预测过程具体包括:根据未训练的第一述卷积函数对训练特征图进行卷积处理获得第一中间结果。根据未训练的第一激活函数对第一中间结果进行激活处理获得多个训练锚框的中心位置。
90.高宽比预测模块包括第二卷积函数和第二激活函数,训练特征图在高宽比预测模块中的预测过程具体包括:根据未训练的第二卷积函数对输入图像的特征图进行卷积处理获得第二中间结果。根据未训练的第二激活函数对第二中间结果进行激活处理,获得多个训练锚框的高宽比。
91.s303、根据训练目标区域以及目标区域,分别计算得到类别损失、回归损失以及锚框损失。
92.其中,采用现有技术中方法根据训练目标区域以及目标区域计算得到类别损失和回归损失,此处不再赘述。
93.下面描述根据训练目标区域以及目标区域计算得到锚框损失过程:
94.锚框损失包括锚框位置损失和高宽比损失。先分别计算得到锚框位置损失和高宽比损失,再将锚框位置损失和高宽比损失叠加后得到锚框损失。
95.计算锚框位置损失过程如下:根据目标区域确定训练目标的真实边界框。计算真实边界框的中间位置与锚框的中间位置之间位置偏移量,根据位置偏移量获得锚框位置损失。
96.计算锚框高宽比损失过程如下:根据真实边界框的边界框参数与锚框的参数计算得到真实边界框与锚框之间交并比。根据真实边界框与锚框之间交并比获得锚框高宽比损失。
97.优先地,将位置偏移量与第一损失系数相乘的结果作为锚框位置损失,将真实边界框与锚框之间交并比和第二损失系数相称的结果作为锚框高宽比损失。
98.其中,第一损失系数和第二损失系数根据锚框位置损失的具体数值和锚框高宽比损失的具体数值确定,第一损失系数和第二损失系数用于将锚框位置损失和锚框高宽比损失转换到一个数量级。
99.另外,设置锚框时,可以在单个特征图上定义,即直接在网络的最一层特征图将所有锚框和真实边界框进行匹配,计算分类和回归损失;也可以在多个尺度的特征图上定义,即在多尺度特征图或者经特征金字塔网络(feature pyramid networks,简称:fpn)融合后的多尺度特征图上分别将锚框和真实边界框进行匹配,计算分类和回归损失。
100.其中,较浅层的特征图上设置较小的锚框,在高层的特征图上设置较大的锚框,从而利用多尺度特征信息。高层特征具有更丰富的语义信息,低层特征具有更丰富的内容细节信息,提高对小目标的检测能力以及网络对目标位置回归的精度。
101.s304、判断模型损失值是否满足预设收敛条件,若是,则进入s305,否则,进入s306。
102.其中,判断模型损失值是否小于预设值。若是,则确定模型损失值满足收敛条件。若否,则确定模型损失值不满足收敛条件。
103.s305、输出已训练的特征提取模型、已训练的锚框生成模型以及已训练的输出模型,并退出循环。
104.其中,若模型损失值满足收敛条件,可以确定当前的特征提取模型的模型参数、锚框生成模型的模型参数以及输出模型的模型参数已经是最优,则将在当前参数下的各个模型作为已训练的特征提取模型、已训练的锚框生成模型以及已训练的输出模型。
105.s306、使用类别损失、回归损失以及锚框损失优化特征提取模型中模型参数、锚框生成模型中模型参数以及输出模型中模型参数,并返回s301继续执行。
106.其中,若模型损失值不能满足收敛条件,则还需要优化特征提取模型的模型参数、锚框生成模型的模型参数以及输出模型的模型参数。将类别损失、回归损失以及锚框损失反向传播至特征提取模型、锚框生成模型以及输出模型,以优化特征提取模型中模型参数、锚框生成模型中模型参数以及输出模型中模型参数。
107.锚框生成模型中模型参数具体包括第一卷积函数的参数、第一激活函数的参数、第二卷积函数的参数、第二激活函数的参数以及组合模块中参数。
108.利用已经训练的特征提取模型、锚框生成模型以及输出模型对输入图像进行处理输出目标对象的图像的步骤已经在上面实施例中详细说明,此处不再赘述。
109.本技术实施例提供的目标对象的检测方法,同时训练特征提取模型、锚框生成模型以及输出模型,并计算上述三个模型的整体的类别损失以及回归损失以及锚框损失,以对特征提取模型、锚框生成模型以及输出模型的参数优化,可以使上述三个模型快速收敛,提高输出的目标对象图像的准确性。
110.下面结合具体实例说明本技术实施例提供的目标对象的检测方法,该目标对象的检测方法包括:
111.s401、获取训练图像和训练图像中训练目标的目标区域。
112.其中,将街景图像作为训练图像,人物和车辆作为训练目标。标记街景图像中人物和车辆所在位置。并使用符号表示label(obj)=(x,y,w,h,c)。其中,x和y表示目标的中心点坐标值,w和h分别表示目标的边界框的宽和高,c表示目标类别标识。
113.s402、将训练图像经过未训练的特征提取模型、未训练的锚框生成模型以及未训练的输出模型处理后,得到训练目标区域。
114.其中,特征提取模型可以由主干网络和增强模块构成。训练图像经主干网络得到多个原始特征层{f1,f2,
…fn
},其中,原始特征层是w
×h×
c维,下标越大表示层数越高。主干网络可以选择预训练的网络,例如resnet、mobilenet、shufflenet、vgg等主干网络。从最高层特征层fn开始,依次对特征层进行增强处理,得到增强后的特征层{ef1,ef2,

efn},增强后的特征层也为w
×h×
c维。特征增强采用fpn网络和人脸检测网络(single stage headless face detector,简称:ssh)。
115.在实施例中,主干网络选择resnet网络,特征增强采用fpn和ssh网络,fpn用于融合多尺度信息,ssh用于融合上下文信息,得到增强后的特征(ef1,ef2,

efn}。
116.锚框生成模块分别在增强后的特征层{ef1,ef2,

efn}上预测锚框的位置和尺度信息,在将位置和尺寸信息组合得到锚框。
117.继续参考图5,生成锚框特征具体过程如下所述:增强后的特征层efi后经过1
×1×h×
1的卷积以及sigmoid函数处理后,输出一个w
×h×
n维的特征图。该特征图用于表示锚框的位置置信度,也就是预测每个点是锚框中心的概率,n表示目标类型,例如:n=1时表示车辆,n=2时表示人物。增强后的特征层efi后经过一个1
×1×h×
2的卷积和relu函数处理后,输出一个w
×h×
2维的特征图。该特征图用于表示锚框的宽度和高度。将表示位置置信度的特征图和表示宽高的特征图进行组合,得到锚框的信息特征图。然后再经过1
×1×3×
c的卷积处理后改变锚框的信息特征层的通道数至c。
118.输出模块的处理过程具体包括:将锚框的信息特征图与增强后的特征层efi进行卷积相加,从而得到融合了锚框信息的特征层a_efi,作为目标对象的图像输出。
119.如图6所示,使用锚框生成模型生成锚框更接近目标,也就是与提取模型输出的特征图更加接近,有利于检测模型的收敛。
120.s403、根据训练目标区域以及目标区域,分别计算得到类别损失、回归损失以及锚框损失。
121.其中,根据目标区域确定训练目标的真实边界框。将label(obj)=(x,y,w,h,c)映射到w
×
h大小的特征图上得到label

(obj)=(x

,y

,w

,h

,c)。
122.采用如下方式计算锚框位置损失la(conf),当锚框的位置在(x

,y

,0.3w

,0.3h

)以内区域设为1,表示正样本,(x

,y

,0.7w

,0.7h

,c)以外区域设为0,表示负样本。
123.将锚框和边界框进行匹配,通过锚框和边界框之间的交并比来锚框宽高损失la(wh)。
124.在特征层a_efi进行分类和回归预测时,计算分类损失l(score)和回归损失l(box),根据模型损失l=la(wh) la(conf) l(score) l(box)训练模型,反向传播更新检测模型参数,直至该损失值收敛。
125.s404、判断模型损失值是否满足预设收敛条件,若是,则进入s405,否则,进入s406。
126.s405、输出已训练的特征提取模型、已训练的锚框生成模型以及已训练的输出模型。
127.s406、使用类别损失、回归损失以及锚框损失优化特征提取模型中模型参数、锚框生成模型中模型参数以及输出模型中模型参数。
128.在本技术实施例提供的目标对象的检测方法中,多个特征层上引入锚框生成模块,通过网络在线学习锚框的位置和大小,并将学习到的锚框信息融合到特征提取模型输出的特征图中,提高特征提取模型输出特征图与锚框的匹配度,缓解输出模型中正样本不均衡问题。
129.如图7所示,本技术一种目标对象的检测装置,该目标对象的检测装置500包括:
130.获取模块501,用于获取输入图像的特征图,其中,输入图像包括目标对象;
131.处理模块502,用于根据已训练的锚框生成模型对输入图像的特征图进行处理,获得输入图像的锚框;其中,输入图像的锚框通过锚框生成模型被预测出锚框的大小和位置;
132.处理模块502还用于根据已训练的输出模型对输入图像的特征图和输入图像的锚框进行处理获得目标对象的图像。
133.可选地,处理模块502具体用于:
134.根据输入图像的特征图和已训练的位置预测模块,确定多个锚框的中心位置;
135.根据输入图像的特征图和已训练的高宽比预测模块,确定多个锚框的高宽比;
136.根据多个锚框的中心位置、多个锚框的高宽比以及已训练的组合模块,生成输入图像的多个锚框;
137.其中,锚框生成模型包括位置预测模块、高宽比预测模块以及组合模块。
138.可选地,处理模块502具体用于:
139.根据第一述卷积函数对输入图像的特征图进行卷积处理,获得第一中间结果;
140.根据第一激活函数对第一中间结果进行激活处理,获得多个锚框的中心位置;
141.其中,位置预测模块包括第一述卷积函数和第一激活函数。
142.可选地,处理模块502具体用于:
143.根据第二卷积函数对输入图像的特征图进行卷积处理,获得第二中间结果;
144.根据第二激活函数对第二中间结果进行激活处理,获得多个锚框的高宽比;
145.其中,高宽比预测模块包括第二卷积函数和第二激活函数。
146.可选地,处理模块502还用于:
147.根据未训练的特征提取模型对训练图像进行处理,获得训练特征图;
148.根据未训练的锚框生成模型对训练特征图进行处理,获得训练锚框;
149.根据未训练的输出模型对训练特征图和训练锚框进行处理,获得训练目标区域;
150.根据训练目标区域以及标记目标区域获得模型损失值;
151.判断模型损失值是否满足预设收敛条件,若是,输出特征提取模型的模型参数、锚框生成模型的模型参数以及输出模型的模型参数;
152.若否,用模型损失值更新特征提取模型的模型参数、锚框生成模型的模型参数以及输出模型的模型参数,并返回执行根据未训练的特征提取模型对训练图像进行处理;
153.其中,标记目标区域是对训练图像中训练目标进行标记获得。
154.可选地,根据训练目标区域以及标记目标区域获得模型损失值,具体包括:
155.根据训练目标区域以及标记目标区域分别计算获得锚框损失值、分类损失值以及回归损失值;
156.根据分类损失、回归损失以及锚框损失计算获得模型损失值。
157.可选地,处理模块502具体用于:
158.计算训练目标的边界框的中心点与训练目标区域对应的锚框的中心点之间的位置偏移量;
159.根据训练目标的边界框的参数与训练目标区域对应的锚框的参数,计算得到训练目标的边界框与锚框之间交并比;
160.根据位置偏移量和交并比,获得锚框损失;其中,训练目标的边界框是根据标记目标区域生成的。
161.如图8所示,本技术另一实施例提供的电子设备600包括:发送器601、接收器602、存储器603以及处理器604。
162.发送器601,用于发送指令和数据;
163.接收器602,用于接收指令和数据;
164.存储器603,用于存储计算机执行指令;
165.处理器604,用于执行存储器存储的计算机执行指令,以实现上述实施例中目标对象的检测方法所执行的各个步骤。具体可以参见前述目标对象的检测方法实施例中的相关描述。
166.可选地,上述存储器603既可以是独立的,也可以跟处理器604集成在一起。当存储器603独立设置时,该电子设备还包括总线,用于连接存储器603和处理器604。
167.本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上电子设备所执行的上述电子设备执行的目标对象的检测方法。
168.本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
169.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献