一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标检测方法、装置、电子设备及存储介质与流程

2021-12-04 00:12:00 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种目标检测方法、装置、电子设备及存储介质。


背景技术:

2.随着人工智能的发展,越来越多基于图像处理技术的产品落地,方便人们的生活和出行,比如针对各种应用场景的图像检测器可以自动对目标进行检测,不需要大量人员对目标进行辨识。一般来说,针对于不同的应用场景训练不同的检测器以适应场景,得到更好的目标检测性能,例如,门禁场景中,检测器为针对门禁的检测器,通关场景中,检测器为针对通关的检测器,这样会造成需要维护的模型增加,进而导致模型的维护成本较高。


技术实现要素:

3.本发明实施例提供一种目标检测方法,通过在一个目标检测模型中提取待检测图片的决策特征,选择对应的特征卷积权重矩阵组成适应于待检测图片的场景的目标检测模型,可以实现一个目标检测模型适应多个目标检测场景的功能,不需要维护多个目标检测模型来对多个目标检测场景进行检测,从而降低了多检测场景下的目标检测模型的维护成本。
4.第一方面,本发明实施例提供一种目标检测方法,所述方法包括:
5.获取待检测图片,所述待检测图片包括待检测目标;
6.通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;
7.通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。
8.可选的,所述中间网络包括训练好的决策层以及卷积权重层,所述卷积权重层包括n个特征卷积权重矩阵,所述决策层与所述n个特征卷积权重矩阵全连接,所述通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,包括:
9.通过所述决策层提取所述待检测图片的决策特征;
10.基于所述决策特征,选择并激活与所述决策特征对应的特征卷积权重矩阵;
11.通过所述特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征图。
12.可选的,所述决策层包括决策卷积权重矩阵以及n个神经元,所述n个神经元与所述n个特征卷积权重矩阵为一一对应关系,所述通过所述决策层提取所述待检测图片的决策特征,包括:
13.通过所述决策卷积权重矩阵对所述待检测图片进行第一卷积运算,得到决策特征图;
14.通过的n个神经元对所述决策特征图进行连接处理,得到决策特征。
15.可选的,所述中间网络还包括开关层,所述基于所述决策特征,选择并激活与所述决策特征对应的特征卷积权重矩阵,包括:
16.将所述决策特征传输到所述开关层;
17.通过所述开关层对所述决策特征进行分类,确定并激活所述决策特征对应的特征卷积权重矩阵。
18.可选的,所述方法还包括:
19.构建n个检测场景对应的第一目标检测模型,所述n个检测场景对应的第一目标检测模型具有相同的数量的卷积权重层;
20.构建n个检测场景对应的第一训练数据集,所述第一训练数据集包括目标标注信息;
21.通过所述第一训练数据集对对应的所述第一目标检测模型进行迭代训练,得到训练好的第一目标检测模型的特征卷积权重矩阵;
22.构建第二目标检测模型,所述第二目标检测模型包括决策层以及卷积权重层,所述卷积权重层根据所述训练好的第一目标检测模型的特征卷积权重矩阵得到,所述第一目标检测模型与所述第二目标检测模型具有相同数量的卷积权重层;
23.根据所述n个检测场景对应的第一训练数据集构建第二训练数据集;
24.通过所述第二训练数据集对所述第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
25.可选的,所述构建第二目标检测模型,包括:
26.将所述训练好的第一目标检测模型的特征卷积权重矩阵进行编号,得到分层编号和分类编号;
27.将相同分层编号的所述训练好的第一目标检测模型的特征卷积权重矩阵放在同一卷积权重层;
28.根据当前卷积权重层的分类编号,确定当前决策层中神经元的数量以及所述神经元与所述分类编号的对应关系,其中,每个所述神经元对应一个所述分类编号;
29.根据所述分层编号,确定所述决策层的数量,每个所述决策层对应于一个所述分层编号;
30.根据所述卷积权重层以及所述决策层,构建所述第二目标检测模型。
31.可选的,所述第二训练数据集包括场景标注信息以及目标标注信息,所述第二目标检测模型的输出包括场景检测信息以及目标检测信息,所述通过所述第二训练数据集对所述第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型,包括:
32.根据预设的第一损失函数计算所述场景检测信息与所述场景标注信息之间的场景误差损失;以及
33.根据预设的第二损失函数计算所述目标检测信息与所述目标检测信息之间的目标误差损失;
34.根据所述场景误差损失对所述第二目标检测模型中的决策层进行调整;以及
35.根据所述目标误差损失对所述第二目标检测模型中的卷积权重层进行微调;
36.迭代到预设次数或所述场景误差小于预设值时,停止训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
37.第二方面,本发明实施例提供一种目标检测装置,所述装置包括:
38.获取模块,用于获取待检测图片,所述待检测图片包括待检测目标;
39.提取模块,用于通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;
40.输出模块,用于通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。
41.第三方面,本发明实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例提供的目标检测方法中的步骤。
42.第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现发明实施例提供的目标检测方法中的步骤。
43.本发明实施例中,获取待检测图片,所述待检测图片包括待检测目标;通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。通过在一个目标检测模型中提取待检测图片的决策特征,选择对应的特征卷积权重矩阵组成适应于待检测图片的场景的目标检测模型,可以实现一个目标检测模型适应多个目标检测场景的功能,不需要维护多个目标检测模型来对多个目标检测场景进行检测,从而降低了多检测场景下的目标检测模型的维护成本。
附图说明
44.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
45.图1是本发明实施例提供的一种目标检测方法的流程图;
46.图1a是本发明实施例提供的目标检测模型的结构示意图;
47.图2是本发明实施例提供的一种目标检测模型训练方法的流程图;
48.图3是本发明实施例提供的一种目标检测装置的结构示意图;
49.图4是本发明实施例提供的一种提取模块的结构示意图;
50.图5是本发明实施例提供的一种第一提取子模块的结构示意图;
51.图6是本发明实施例提供的一种选择激活子模块的结构示意图;
52.图7是本发明实施例提供的另一种目标检测装置的结构示意图;
53.图8是本发明实施例提供的一种第三构建模块的结构示意图;
54.图9是本发明实施例提供的一种第二训练模块的结构示意图;
55.图10是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
56.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
57.请参见图1,图1是本发明实施例提供的一种目标检测方法的流程图,如图1所示,该目标检测方法包括以下步骤:
58.101、获取待检测图片。
59.在本发明实施例中,上述待检测图片包括待检测目标,上述待检测图片可以是图像采集设备实时采集到的图片,比如摄像头实时采集到的图片,上述待检测图片也可以是用户通过用户端上传的图片。上述待检测图片可以是各个检测场景下对应的图片,上述检测场景可以理解为目标检测模型所使用的场景,上述检测场景可以是车辆检测场景、行人检测场景、物品检测场景等检测场景。上述待检测目标对应于上述检测场景,在车辆检测场景下,上述待检测目标为车辆;在行人检测场景下,上述待检测目标为行人;在物品检测场景下,上述待检测目标为物品。
60.102、通过预设的目标检测模型的中间网络提取待检测图片的决策特征,并根据决策特征,选择对应的特征卷积权重矩阵对待检测图片进行特征提取,得到待检测图片的中间特征。
61.在本发明实施例中,上述决策特征隐含上述待检测图片的检测场景信息。上述检测场景信息对应于上述检测场景,上述决策特征可以是以检测场景为目标而提取出来的特征,上述决策特征用于预测待检测图片对应的目标检测场景,进而指导了对应不同目标检测模型的特征卷积权重矩阵的选择,比如,对于一张待检测图片,该待检测图片中包括车辆,其对应的检测场景应该是车辆检测,一般情况下,直接采用车辆检测模型即可对该待检测图片进行车辆检测,输出车辆的检测结果,而在本发明实施例中,通过上述中间网络提取出决策特征,通过该决策特征来确定待检测图片的检测场景为车辆检测场景,从而选取车辆检测场景下目标检测模型对应的特征卷积权重矩阵来组成车辆检测模型。需要说明的是,在本发明实施例中,在多个检测场景的情况下,对一张待检测图片,用户不需要指定检测场景对应的目标检测模型,而是通过目标检测模型的中间网络提取出决策特征,来对待检测图片的检测场景进行决策。这样,面对大批量不同场景的待检测图片,无需要预先对每张待检测图片进行检测场景的分类后再分送到不同检测场景对应的目标检测模型中,一个目标检测模型即可实现多个检测场景的目标检测。
62.上述目标检测模型包括输入网络、中间网络以及输出网络,上述输入网络的输出与上述中间网络的输入连接,上述中间网络的输出与上述输出网络连接。上述输入网络用于输入上述待检测图片,在一些可能的实施例中,上述输入网络还用于对上述待检测图片
进行预处理,上述预处理可以包括图片旋转、图片缩放、图片去噪等处理。上述中间网络可以有多个,多个中间网络依次连接,每个中间网络对待检测图片提取一次决策特征,以及选择对应的特征卷积权重矩阵对待检测图片进行一次特征提取。上述中间网络中包括多个特征卷积权重矩阵,每个特征卷积权重矩阵可以对应一个检测场景。上述输出网络用于对中间特征进行线性回归,得到线性回归结果后进行分类输出。需要说明的是,上述特征卷积权重矩阵也可以称为权重或者权重参数。
63.在一种可能的实施例中,上述输入网络包括第一输入层与第二输入层,上述第一输入层与上述第二输入层的输入都是上述待检测图片,上述第一输入层用于对待检测图片进行第一预处理,以使上述待检测图片能更好的提取出决策特征,上述第二输入层用于对待检测图片进行第二预处理,以使上述待检测图片能更好的提取出中间特征。上述第一预处理包括对上述待检测图片进行图片旋转、图片缩放、图片去噪、图片灰度化等处理,上述第二预处理包括对上述待检测图片进行图片旋转、图片缩放、图片去噪等处理。需要说明的是,上述第一预处理与上述第二预处理的区别在于上述第一预处理进行图片灰度化,这是因为决策特征更关注场景的整体信息分布,对于局部信息的关注较少,因此在第一预处理中加入图片灰度化可以更准确的提取出决策特征。
64.在一种可能的实施例中,对于前面k1个中间网络中,一个特征卷积权重矩阵可以对应至少一个检测场景,对应于两个或两个以上检测场景的特征卷积权重矩阵也可以称为两个或两个以上检测场景的公共特征卷积权重矩阵,在后面k2个中间网络中,每个特征卷积权重矩阵可以对应一个检测场景。这样,可以减少目标检测模型的参数量,精简目标检测模型。
65.具体的,上述中间网络可以包括训练好的决策层以及卷积权重层,上述卷积权重层包括n个特征卷积权重矩阵,上述决策层与上述n个特征卷积权重矩阵全连接,可以通过上述决策层提取上述待检测图片的决策特征;基于上述决策特征,选择并激活与上述决策特征对应的卷积权重矩阵;通过上述卷积权重矩阵对上述待检测图片进行特征提取,得到上述待检测图片的中间特征图。在每个中间网络中,都根据决策层提取到的决策特征选择相应的特征卷积权重矩阵,不同的特征卷积权重矩阵对应不同的检测场景,因此,可以根据不同中间网络的连接组合,得到用于不同检测场景的目标检测模型。特别是,可以根据待检测图片的检测场景信息,将不同中间网络进行连接组合,得到适应于待检测图片的目标检测模型,不需要人为进行决策使用哪个目标检测模型。
66.在多个中间网络的情况下,每个中间网络均可以包括一个训练好的决策层以及一个训练好的卷积权重层。上述全连接指的是决策层与全部的n个特征卷积权重矩阵分别连接。
67.进一步的,上述决策层包括决策卷积权重矩阵以及n个神经元,上述n个神经元与上述n个特征卷积权重矩阵为一一对应关系,可以通过上述决策卷积权重矩阵对上述待检测图片进行第一卷积运算,得到决策特征图;通过的n个神经元对上述决策特征图进行连接处理,得到决策特征。在每个决策层中,都包括有决策卷积权重矩阵,根据决策卷积权重矩阵提取待检测图片的决策特征,进而根据上述决策特征选择相应的特征卷积权重矩阵,不同的特征卷积权重矩阵对应不同的检测场景,因此,可以根据不同特征卷积权重矩阵的连接组合,得到适用于不同检测场景的中间网络,进而得到适用于不同检测场景的目标检测
模型。特别是,可以根据待检测图片的检测场景信息,将不同特征卷积权重矩阵进行连接组合,得到适应于待检测图片的目标检测模型,不需要人为进行决策使用哪个目标检测模型。
68.需要说明的是,上述神经元包括神经元权重,上述决策卷积权重矩阵以及n个神经元以全连接的形式进行连接,上述全连接可以是理解为以神经元权重的形式对上述决策特征图进行连接处理,具体的,如式子y=wx b所示,其中,上述w为神经元权重,上述x为待检测图或上一中间网络输出的中间特征图,上述b为偏置。
69.在得到决策特征后,根据上述决策特征选择激活与上述决策特征对应的特征卷积权重矩阵,通过选择激活后的特征卷积权重矩阵对上述待检测图片进行第二卷积运算,可以得到中间特征。
70.103、过预设的目标检测模型的输出网络对中间特征进行分类输出,得到待检测目标的检测结果。
71.在本发明实施例中,上述输出网络可以对上述中间特征进行线性回归,得到中间特征的分类结果,进而得到根据中间特征的分类结果确定上述待检测目标的分类结果,上述待检测目标的分类结果即为检测结果。
72.在一种可能的实施例中,上述输出网络可以包括三个分支层,其中一个分支层可以用于根据上述中间特征预测目标检测框的位置,一个分支层可以用于根据上述中间特征预测检测框的置信度,一个分支层可以用于根据上述中间特征预测检测框的类别。
73.本发明实施例中,获取待检测图片,所述待检测图片包括待检测目标;通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。通过在一个目标检测模型中提取待检测图片的决策特征,选择对应的特征卷积权重矩阵组成适应于待检测图片的场景的目标检测模型,可以实现一个目标检测模型适应多个目标检测场景的功能,不需要维护多个目标检测模型来对多个目标检测场景进行检测,从而降低了多检测场景下的目标检测模型的维护成本。
74.可选的,请参见图1a,图1a是本发明实施例提供的一种目标检测模型的结构示意图,如图1a所示,上述中间网络还包括开关层,上述开关层与上述决策层的输出连接,上述开关层与上述卷积权重层的输入连接,上述开关层用于选择并激活卷积权重层中与上述决策特征相对应的特征卷积权重矩阵。上述开关层可以用于对上述决策特征进行分类,上述决策层将上述决策特征传输到上述开关层;通过上述开关层对上述决策特征进行分类,确定并激活上述决策特征对应的特征卷积权重矩阵。具体的,上述开关层可以将上述决策特征进行线性回归,将上述决策特征预测为上述n个特征卷积权重矩阵中的一个,比如,上述特征卷积权重矩阵通过编号进行区别,则上述开关层将上述决策特征预测为一个编号,通过该编号选择上述n个特征卷积权重矩阵中相同编号的一个特征卷积权重矩阵进行激活,并将上述待检测图片或上一中间网络的中间特征图传给该特征卷积权重矩阵进行第二卷积运算。
75.进一步的,上述每个中间网络均可以包括决策层、开关层以及卷积权重层,决策层输出决策特征到开关层,开关层预测该决策特征对应于上述卷积权重层中的哪一个特征卷
积权重矩阵,从而选择并激活该特征卷积权重矩阵。
76.可选的,请参见图2,图2是本发明实施例提供的一种目标检测模型训练方法的流程图,如图2所示,包括以下步骤:
77.201、构建n个检测场景对应的第一目标检测模型。
78.在本发明实施例中,上述n个检测场景对应的第一目标检测模型具有相同的数量的卷积权重层。上述第一目标检测模型包括第一输入网络、第一中间网络以及第一输出网络,其中,上述第一中间网络包括多个卷积权重层,上述第一中间网络包括第一卷积层,上述第一卷积层由第一特征卷积权重矩阵组成。上述第一输出网络包括三个分支层,其中一个分支层可以用于根据上述中间特征预测目标检测框的位置,一个分支层可以用于根据上述中间特征预测检测框的置信度,一个分支层可以用于根据上述中间特征预测检测框的类别。
79.202、构建n个检测场景对应的第一训练数据集。
80.在本发明实施例中,可以为每个检测场景构建一个第一训练数据集,上述第一训练数据集包括图片样本以及目标标注信息。上述目标标注信息对应于上述第一输出网络的输出,即上述目标标注信息对应位置标注信息以及类别标注信息,可以理解为在上述图片样本中将目标的位置和类别标注出来,作为第一目标模型的学习参照。
81.203、通过第一训练数据集对对应的第一目标检测模型进行迭代训练,得到训练好的第一目标检测模型的特征卷积权重矩阵。
82.在本发明实施例中,不同检测场景对应的第一目标检测模型通过对应的第一训练数据集单独训练,得到不同检测场景下训练好的第一目标检测模型。进一步的,每个训练好的第一目标检测模型中都包括一组训练好的特征卷积权重矩阵,通过该组训练好的特征卷积权重矩阵,可以提取出对应检测场景下待检测图片的中间特征来对该待检测图片中的待检测目标进行位置和类别的预测,从而完成对应检测场景下的目标检测任务。
83.204、构建第二目标检测模型。
84.在本发明实施例中,上述第二目标检测模型包括决策层以及卷积权重层,上述卷积权重层根据上述训练好的第一目标检测模型的特征卷积权重矩阵得到,上述第一目标检测模型与上述第二目标检测模型具有相同数量的卷积权重层。具体的,上述第二目标检测模型包括第二输入网络、第二中间网络以及第二输出网络。其中,上述第二输入网络包括第一输入层与第二输入层,上述第一输入层用于进行第一预处理,上述第二输入层用于第二预处理,上述第二输入层与上述第一输入网络可以是相同的结构。上述第二中间网络的数量与上述第一目标检测模型的卷积权重层的数量相同,即上述第一目标检测模型中有多少层卷积权重层,在第二目标检测模型中的就多少个第二中间网络。每个上述第二中间网络都可以包括一个决策层以及一个卷积权重层,上述第二中间网络中的一个卷积权重层对应于上述第二中间网络中的一个卷积权重层,在上述第二中间网络中的卷积权重层中的特征卷积权重矩阵为上述第一中间网络中对应层数的卷积权重层中的特征卷积权重。上述第二输出网络包括第一输出层与第二输出层,上述第一输出层用于根据上述决策特征预测检测场景,上述第二输出层与上述第一输出网络相同,上述第二输出层包括三个分支层,其中一个分支层可以用于根据上述中间特征预测目标检测框的位置,一个分支层可以用于根据上述中间特征预测检测框的置信度,一个分支层可以用于根据上述中间特征预测检测框的类
别。
85.具体的,可以将上述训练好的第一目标检测模型的特征卷积权重矩阵进行编号,得到分层编号和分类编号;将相同分层编号的上述训练好的第一目标检测模型的特征卷积权重矩阵放在同一卷积权重层;根据当前卷积权重层的分类编号,确定当前决策层中神经元的数量以及上述神经元与上述分类编号的对应关系,其中,每个上述神经元对应一个上述分类编号;根据上述分层编号,确定上述决策层的数量,每个上述决策层对应于一个上述分层编号;根据上述卷积权重层以及上述决策层,构建上述第二目标检测模型。需要说明的是,上述分层编号表示特征卷积权重矩阵在第一目标检测模型的第几层,上述分类编号表示特征卷积权重矩阵所在第一目标检测模型适用哪个检测场景。
86.可选的,上述第二中间网络还包括开关层,上述开关层与上述第二中间网络的决策层的输出连接,上述开关层与上述卷积权重层的输入连接,上述开关层用于选择并激活卷积权重层中与上述决策特征相对应的特征卷积权重矩阵。上述开关层可以用于对上述决策特征进行分类,上述决策层将上述决策特征传输到上述开关层;通过上述开关层对上述决策特征进行分类,确定并激活上述决策特征对应的特征卷积权重矩阵。具体的,上述开关层可以将上述决策特征进行线性回归,将上述决策特征预测为上述n个特征卷积权重矩阵中的一个,比如,上述特征卷积权重矩阵通过编号进行区别,则上述开关层将上述决策特征预测为一个编号,通过该编号选择上述n个特征卷积权重矩阵中相同编号的一个特征卷积权重矩阵进行激活,并将上述待检测图片或上一中间网络的中间特征图传给该特征卷积权重矩阵进行第二卷积运算。
87.进一步的,上述每个中间网络均可以包括决策层、开关层以及卷积权重层,决策层输出决策特征到开关层,开关层预测该决策特征对应于上述卷积权重层中的哪一个特征卷积权重矩阵,从而选择并激活该特征卷积权重矩阵。
88.205、根据n个检测场景对应的第一训练数据集构建第二训练数据集。
89.在本发明实施例中,上述第二训练数据集包括图片样本、场景标注信息以及目标标注信息。上述场景标注信息对应于上述第一输出层的输出,即上述目标标注信息对应检测场景信息,上述目标标注信息对应于上述第二输出层的输出,即上述目标标注信息对应位置信息以及类别信息,可以理解为在上述图片样本中将图片样本适用的检测场景、目标的位置和类别标注出来,作为第二目标模型的学习参照。
90.206、通过第二训练数据集对第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为预设的目标检测模型。
91.在本发明实施例中,上述第二目标检测模型训练完成后,具有对检测场景的决策能力,且基于该决策能力对第二目标检测模型中各卷积权重层的特征卷积权重矩阵进行选择组合,得到适应于各个检测场景的目标检测模型。
92.可选的,可以根据预设的第一损失函数计算上述场景检测信息与上述场景标注信息之间的场景误差损失;以及根据预设的第二损失函数计算上述目标检测信息与上述目标检测信息之间的目标误差损失;根据上述场景误差损失对上述第二目标检测模型中的决策层进行调整;以及根据上述目标误差损失对上述第二目标检测模型中的卷积权重层进行微调;迭代到预设次数或上述场景误差小于预设值时,停止训练,得到训练好的第二目标检测模型作为上述预设的目标检测模型。
93.在一中可能的实施例中,上述根据上述目标误差损失对上述第二目标检测模型中的卷积权重层进行微调的步骤,可以是在场景误差损失小于预设值的情况下进行,因为场景误差损失大于预设值时,则说明第二目标检测模型对检测场景的预测能力还较差,若第二目标检测模型对检测场景的预测能力还较差时,对第二目标检测模型中的卷积权重层进行微调,会导致第二目标检测模型的检测准确度下降,甚至是欠拟合。
94.上述第一损失函数可以是hinge损失函数,在检测场景的预测中,对异常点、噪声不敏感,因此,可以使得检测场景的预测分类具有较高的健壮性。上述第二损失函数可以是交叉熵损失函数(cross

entropy loss function),可以用于检测场景下目标检测的多分类任务中。
95.在一种可能的实施例中,第二目标检测模型的训练完成后,可以对上述第二目标检测模型中的第一输出层进行删除,只保留第二输出层。
96.在本发明实施例中,通过预先训练各个检测场景下第一目标模型,将训练好的第一目标模型中的特征卷积权重矩阵迁移到第二目标模型中再进行检测场景学习以及目标检测微调,可以使第二目标检测模型作为目标检测模型时,获取更高的检测准确度。
97.需要说明的是,本发明实施例提供的目标检测方法可以应用于可以进行目标检测的智能手机、电脑、服务器等设备。
98.可选的,请参见图3,图3是本发明实施例提供的一种目标检测装置的结构示意图,如图3所示,所述装置包括:
99.获取模块301,用于获取待检测图片,所述待检测图片包括待检测目标;
100.提取模块302,用于通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;
101.输出模块303,用于通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。
102.可选的,如图4所示,所述中间网络包括训练好的决策层以及卷积权重层,所述卷积权重层包括n个特征卷积权重矩阵,所述决策层与所述n个特征卷积权重矩阵全连接,所述提取模块302,包括:
103.第一提取子模块3021,用于通过所述决策层提取所述待检测图片的决策特征;
104.选择激活子模块3022,用于基于所述决策特征,选择并激活与所述决策特征对应的特征卷积权重矩阵;
105.第二提取子模块3023,用于通过所述特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征图。
106.可选的,如图5所示,所述决策层包括决策卷积权重矩阵以及n个神经元,所述n个神经元与所述n个特征卷积权重矩阵为一一对应关系,所述第一提取子模块3021,包括:
107.第一卷积单元30211,用于通过所述决策卷积权重矩阵对所述待检测图片进行第一卷积运算,得到决策特征图;
108.处理单元30212,用于通过的n个神经元对所述决策特征图进行连接处理,得到决策特征。
109.可选的,如图6所示,所述中间网络还包括开关层,所述选择激活子模块3022,包括:
110.传输单元30221,用于将所述决策特征传输到所述开关层;
111.激活单元30222,用于通过所述开关层对所述决策特征进行分类,确定并激活所述决策特征对应的特征卷积权重矩阵。
112.可选的,如图7所示,所述装置还包括:
113.第一构建模块304,用于构建n个检测场景对应的第一目标检测模型,所述n个检测场景对应的第一目标检测模型具有相同的数量的卷积权重层;
114.第二构建模块305,用于构建n个检测场景对应的第一训练数据集,所述第一训练数据集包括目标标注信息;
115.第一训练模块306,用于通过所述第一训练数据集对对应的所述第一目标检测模型进行迭代训练,得到训练好的第一目标检测模型的特征卷积权重矩阵;
116.第三构建模块307,用于构建第二目标检测模型,所述第二目标检测模型包括决策层以及卷积权重层,所述卷积权重层根据所述训练好的第一目标检测模型的特征卷积权重矩阵得到,所述第一目标检测模型与所述第二目标检测模型具有相同数量的卷积权重层;
117.第四构建模块308,用于根据所述n个检测场景对应的第一训练数据集构建第二训练数据集;
118.第二训练模块309,用于通过所述第二训练数据集对所述第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
119.可选的,如图8所示,所述第三构建模块307,包括:
120.编号子模块3071,用于将所述训练好的第一目标检测模型的特征卷积权重矩阵进行编号,得到分层编号和分类编号;
121.第一编号处理子模块3072,用于将相同分层编号的所述训练好的第一目标检测模型的特征卷积权重矩阵放在同一卷积权重层;
122.第二编号处理子模型3073,用于根据当前卷积权重层的分类编号,确定当前决策层中神经元的数量以及所述神经元与所述分类编号的对应关系,其中,每个所述神经元对应一个所述分类编号;
123.第三编号处理子模块3074,用于根据所述分层编号,确定所述决策层的数量,每个所述决策层对应于一个所述分层编号;
124.构建子模块3075,用于根据所述卷积权重层以及所述决策层,构建所述第二目标检测模型。
125.可选的,如图9所示,所述第二训练数据集包括场景标注信息以及目标标注信息,所述第二目标检测模型的输出包括场景检测信息以及目标检测信息,所述第二训练模块309,包括:
126.第一计算子模块3091,用于根据预设的第一损失函数计算所述场景检测信息与所述场景标注信息之间的场景误差损失;以及
127.第二计算子模块3092,用于根据预设的第二损失函数计算所述目标检测信息与所述目标检测信息之间的目标误差损失;
128.第一调整子模块3093,用于根据所述场景误差损失对所述第二目标检测模型中的
决策层进行调整;以及
129.第二调整子模块3094,用于根据所述目标误差损失对所述第二目标检测模型中的卷积权重层进行微调;
130.停止子模块3095,用于迭代到预设次数或所述场景误差小于预设值时,停止训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
131.需要说明的是,本发明实施例提供的目标检测装置可以应用于可以进行目标检测的智能手机、电脑、服务器等设备。
132.本发明实施例提供的目标检测装置能够实现上述方法实施例中目标检测方法实现的各个过程,且可以达到相同的有益效果。为避免重复,这里不再赘述。
133.参见图10,图10是本发明实施例提供的一种电子设备的结构示意图,如图10所示,包括:存储器1002、处理器1001及存储在所述存储器1002上并可在所述处理器1001上运行的目标检测方法的计算机程序,其中:
134.处理器1001用于调用存储器1002存储的计算机程序,执行如下步骤:
135.获取待检测图片,所述待检测图片包括待检测目标;
136.通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,所述决策特征隐含所述待检测图片的检测场景信息;
137.通过预设的目标检测模型的输出网络对所述中间特征进行分类输出,得到所述待检测目标的检测结果。
138.可选的,所述中间网络包括训练好的决策层以及卷积权重层,所述卷积权重层包括n个特征卷积权重矩阵,所述决策层与所述n个特征卷积权重矩阵全连接,所述处理器1001执行的所述通过预设的目标检测模型的中间网络提取所述待检测图片的决策特征,并根据所述决策特征,选择对应的特征卷积权重对所述待检测图片进行特征提取,得到所述待检测图片的中间特征,包括:
139.通过所述决策层提取所述待检测图片的决策特征;
140.基于所述决策特征,选择并激活与所述决策特征对应的特征卷积权重矩阵;
141.通过所述特征卷积权重矩阵对所述待检测图片进行特征提取,得到所述待检测图片的中间特征图。
142.可选的,所述决策层包括决策卷积权重矩阵以及n个神经元,所述n个神经元与所述n个特征卷积权重矩阵为一一对应关系,所述处理器1001执行的所述通过所述决策层提取所述待检测图片的决策特征,包括:
143.通过所述决策卷积权重矩阵对所述待检测图片进行第一卷积运算,得到决策特征图;
144.通过的n个神经元对所述决策特征图进行连接处理,得到决策特征。
145.可选的,所述中间网络还包括开关层,所述处理器1001执行的所述基于所述决策特征,选择并激活与所述决策特征对应的特征卷积权重矩阵,包括:
146.将所述决策特征传输到所述开关层;
147.通过所述开关层对所述决策特征进行分类,确定并激活所述决策特征对应的特征卷积权重矩阵。
148.可选的,所述处理器1001执行的方法还包括:
149.构建n个检测场景对应的第一目标检测模型,所述n个检测场景对应的第一目标检测模型具有相同的数量的卷积权重层;
150.构建n个检测场景对应的第一训练数据集,所述第一训练数据集包括目标标注信息;
151.通过所述第一训练数据集对对应的所述第一目标检测模型进行迭代训练,得到训练好的第一目标检测模型的特征卷积权重矩阵;
152.构建第二目标检测模型,所述第二目标检测模型包括决策层以及卷积权重层,所述卷积权重层根据所述训练好的第一目标检测模型的特征卷积权重矩阵得到,所述第一目标检测模型与所述第二目标检测模型具有相同数量的卷积权重层;
153.根据所述n个检测场景对应的第一训练数据集构建第二训练数据集;
154.通过所述第二训练数据集对所述第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
155.可选的,所述处理器1001执行的所述构建第二目标检测模型,包括:
156.将所述训练好的第一目标检测模型的特征卷积权重矩阵进行编号,得到分层编号和分类编号;
157.将相同分层编号的所述训练好的第一目标检测模型的特征卷积权重矩阵放在同一卷积权重层;
158.根据当前卷积权重层的分类编号,确定当前决策层中神经元的数量以及所述神经元与所述分类编号的对应关系,其中,每个所述神经元对应一个所述分类编号;
159.根据所述分层编号,确定所述决策层的数量,每个所述决策层对应于一个所述分层编号;
160.根据所述卷积权重层以及所述决策层,构建所述第二目标检测模型。
161.可选的,所述第二训练数据集包括场景标注信息以及目标标注信息,所述第二目标检测模型的输出包括场景检测信息以及目标检测信息,所述处理器1001执行的所述通过所述第二训练数据集对所述第二目标检测模型进行迭代训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型,包括:
162.根据预设的第一损失函数计算所述场景检测信息与所述场景标注信息之间的场景误差损失;以及
163.根据预设的第二损失函数计算所述目标检测信息与所述目标检测信息之间的目标误差损失;
164.根据所述场景误差损失对所述第二目标检测模型中的决策层进行调整;以及
165.根据所述目标误差损失对所述第二目标检测模型中的卷积权重层进行微调;
166.迭代到预设次数或所述场景误差小于预设值时,停止训练,得到训练好的第二目标检测模型作为所述预设的目标检测模型。
167.需要说明的是,本发明实施例提供的电子设备可以应用于可以进行目标检测的智能手机、电脑、服务器等设备。
168.本发明实施例提供的电子设备能够实现上述方法实施例中目标检测方法实现的各个过程,且可以达到相同的有益效果。为避免重复,这里不再赘述。
169.本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现本发明实施例提供的目标检测方法或应用端目标检测方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
170.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)或随机存取存储器(random access memory,简称ram)等。
171.以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献