一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

物品检测方法、装置、电子装置和存储介质与流程

2022-02-20 05:11:38 来源:中国专利 TAG:


1.本技术涉及图像识别领域,特别是涉及一种物品检测方法、装置、电子装置和存储介质。


背景技术:

2.随着人口日益频繁的流动,为保障地铁、机场等公共场所人民群众的生命安全,安检已经成为一道不可或缺的流程。大多数安检机利用具有强穿透性的x光来进行成像,从而可以检查出包裹内是否含有违禁品。到目前为止,大多数安保机构或公司仍然采用人工肉眼的方式来检查乘客是否携带违禁品。人工安检存在许多不足之处:(1)人工检查一定程度上会侵犯包裹者的隐私。(2)x光图像不同于自然图像,安检员需要经过一系列的培训才能熟练地上岗工作;为了保证肉眼检查的可靠性,安检工作往往轮班进行,这都需要极大的人力成本。(3)人工检查是一项繁重而枯燥的工作,安检员需要长时间不停地盯着安检机屏幕进行识别判断。视觉的疲劳和外界的干扰是不可避免的,这就会使得安检员对违禁品的警惕性大大降低。因此,通过算法实现违禁品的自动检测意义重大,这能极大地减轻安检人员的工作负担。
3.传统安检技术中的违禁品检测算法通过水平检测框标注违禁物品,但标注效果不佳。
4.针对相关技术中存在通过水平检测框标注违禁物品的标注效果不佳的问题,目前还没有提出有效的解决方案。


技术实现要素:

5.在本实施例中提供了一种物品检测方法、装置、电子装置和存储介质,以解决相关技术中通过水平检测框标注违禁物品的标注效果不佳的问题。
6.第一个方面,在本实施例中提供了一种物品检测方法,包括:
7.获取包含待处理物品的待检测图像;
8.基于训练后的物品检测模型中的n个子网络,分别对所述待检测图像进行物品检测,得到输出图像;其中:
9.所述n为大于1的整数;
10.所述输出图像中包含针对所述待处理物品的n个检测框,所述n个检测框中每两个检测框不同,一个所述子网络确定出所述n个检测框中的一个检测框,不同子网络确定出的检测框不同。
11.在其中的一些实施例中,所述物品检测模型是通过如下方式进行训练的:
12.获取待训练的物品检测模型;以及
13.获取包括历史图像和参考图像的训练图像对;所述历史图像中包含历史物品,所述参考图像中包含针对历史物品的所述n个检测框;
14.将所述训练图像对输入所述待训练的物品检测模型,得到所述n个子网络输出的n
个损失值;
15.基于所述n个损失值,对所述待训练的物品检测模型的模型参数进行调整。
16.在其中的一些实施例中,所述基于所述n个损失值,对所述待训练的物品检测模型的模型参数进行调整,包括:
17.对所述n个损失值进行加权求和,得到综合损失值;
18.基于所述综合损失值,对所述待训练的物品检测模型的模型参数进行调整。
19.在其中的一些实施例中,所述n个检测框包括水平检测框和旋转检测框;所述水平检测框为长边的垂线与竖直方向平行的矩形框,所述旋转检测框为长边的垂线与竖直方向的夹角不为零的矩形框;
20.所述n个子网络包括用于确定所述水平检测框的水平检测框子网络以及用于确定所述旋转检测框的旋转检测框子网络。
21.在其中的一些实施例中,所述待检测图像是针对目标场景采集的图像;
22.所述得到输出图像之后,还包括:
23.确定所述水平检测框的长边和短边的第一比值;以及
24.确定所述旋转检测框的长边和短边的第二比值;
25.基于所述第一比值和所述第二比值,确定所述待处理物品是否是所述目标场景关联的违规物品。
26.在其中的一些实施例中,所述将所述训练图像对输入所述待训练的物品检测模型,得到所述n个子网络输出的n个损失值包括:
27.基于预测检测框与实际检测框的边框回归损失以及置信度损失确定水平检测框子网络的第一损失值以及旋转检测框子网络的第二损失值,所述预测检测框为所述历史图像上标注的先验检测框,所述实际检测框为所述参考图像上标注的物品检测框。
28.在其中的一些实施例中,所述将所述训练图像对输入所述待训练的物品检测模型,得到所述n个子网络输出的n个损失值还包括:
29.基于预测旋转框与实际旋转框的边框回归损失、置信度损失以及角度回归损失确定旋转检测框子网络的第二损失值,所述预测旋转框为所述历史图像上标注的先验旋转框,所述实际旋转框为所述参考图像上标注的旋转检测框。
30.第二个方面,在本实施例中提供了一种物品检测装置,包括:
31.图像获取模块,用于获取包含待处理物品的待检测图像。
32.检测模块,用于基于训练后的物品检测模型中的n个子网络,分别对所述待检测图像进行物品检测,得到输出图像;其中:
33.所述n为大于1的整数;
34.所述输出图像中包含针对所述待处理物品的n个检测框,所述n个检测框中每两个检测框不同,一个所述子网络确定出所述n个检测框中的一个检测框,不同子网络确定出的检测框不同。
35.第三个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的物品检测方法。
36.第四个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序
被处理器执行时实现上述第一个方面所述的物品检测方法。
37.与相关技术相比,在本实施例中提供的物品检测方法、装置、电子装置和存储介质,通过获取包含待处理物品的待检测图像;基于训练后的物品检测模型中的n个子网络,分别对所述待检测图像进行物品检测,得到输出图像;其中:所述n为大于1的整数;所述输出图像中包含针对所述待处理物品的n个检测框,所述n个检测框中每两个检测框不同,一个所述子网络确定出所述n个检测框中的一个检测框,不同子网络确定出的检测框不同,采用机器学习模型,将待检测图像中的目标物品同时用多个不同的检测框标注出来,可以更清楚的展示违禁物品的位置与信息,标注效果更好。
38.本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。
附图说明
39.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
40.图1是本发明一实施例的物品检测方法的终端的硬件结构框图;
41.图2是本发明一实施例的物品检测方法的流程示意图;
42.图3是本发明一实施例的物品检测方法的物品检测框的示意图;
43.图4是本发明一实施例的物品检测装置的结构框图。
具体实施方式
44.为更清楚地理解本技术的目的、技术方案和优点,下面结合附图和实施例,对本技术进行了描述和说明。
45.除另作定义外,本技术所涉及的技术术语或者科学术语应具有本技术所属技术领域具备一般技能的人所理解的一般含义。在本技术中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本技术中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本技术中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本技术中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本技术中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
46.在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的物品检测方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人
员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
47.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的物品检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
48.传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
49.与自然物体的水平检测框(horizontal bounding box,hbb)相比,安检场景下的违禁品检测存在一定的特点,这使得其检测更适用于旋转检测框(oriented bounding box,obb)。原因主要包含以下三点:(1)许多违禁品是细长的物品,具有较大的长宽比,水平检测框不能较为紧凑地包围违禁品像素区域,不能提供较为美观的可视化结果;(2)水平检测框包含的区域通常包含噪声背景或者其他物品的部件,对于违禁品的识别是不利的;(3)包裹中的物品存在透视重叠现象,相近的违禁品在成像上可能有重度重叠;水平检测框可能因为iou(intersection over union,交并比)过高而被抑制。因此旋转检测框更适用于安检场景下的违禁品检测。
50.在本实施例中提供了一种物品检测方法,应用于安检场景下的物品检测。可以理解的,对于长宽比大于5比1的细长物品,仅采用水平检测框无法准确的识别定位目标物品,因此可以采用本实施例的物品检测方法。
51.图2是本实施例的物品检测方法的流程图,如图2所示,该流程包括如下步骤:
52.步骤s201,获取包含待处理物品的待检测图像。
53.可以理解的,待检测图像为需要进行识别与检测的图像,其中包含待处理物品,待处理物品可以为违禁物品,也可以为用户设定的其它需要进行识别检测的物品。
54.步骤s202,基于训练后的物品检测模型中的n个子网络,分别对待检测图像进行物品检测,得到输出图像;其中:
55.n为大于1的整数;
56.输出图像中包含针对待处理物品的n个检测框,n个检测框中每两个检测框不同,一个子网络确定出n个检测框中的一个检测框,不同子网络确定出的检测框不同。
57.示例性地,训练后的物品检测模型为机器学习模型,输入为待检测图像,输出为将待检测图像中的目标物品通过物品检测框进行标注的输出图像。在本实施例中,机器学习模型中包括n个子网络,每个子网络用于确定一个检测框,每个检测框不同,物品检测框包括水平检测框以及旋转检测框。可以理解的,经物品检测模型输出的图像包括n个不同的检测框。在其它实施例中,还可以包括其他检测框,此处不做具体限定,可以由用户根据实际
需求进行设置。
58.上述物品检测方法,通过获取包含待处理物品的待检测图像;基于训练后的物品检测模型中的n个子网络,分别对待检测图像进行物品检测,得到输出图像;其中:n为大于1的整数;输出图像中包含针对待处理物品的n个检测框,n个检测框中每两个检测框不同,一个子网络确定出n个检测框中的一个检测框,不同子网络确定出的检测框不同,采用机器学习模型,将待检测图像中的目标物品同时用多个不同的检测框标注出来,可以更清楚的展示违禁物品的位置与信息,标注效果更好。
59.在另一个实施例中,物品检测模型是通过如下方式进行训练的:
60.获取待训练的物品检测模型;以及
61.获取包括历史图像和参考图像的训练图像对;历史图像中包含历史物品,参考图像中包含针对历史物品的n个检测框;
62.将训练图像对输入待训练的物品检测模型,得到n个子网络输出的n个损失值;
63.基于n个损失值,对待训练的物品检测模型的模型参数进行调整。
64.示例性地,历史图像为未经标注的图像,参考图像为将训练图像中的待处理物品预先用物品检测框进行准确标注的图像。可以理解的,通过将各个子网络标注得到的物品检测框与准确标注的物品检测框进行比对,即可得到每个子网络的损失值,并采用损失值对机器学习模型进行内部参数的调节,以不断提高机器学习模型标注物品检测框的准确度,最终得到训练后的物品检测模型。其中,参考图像的物品检测框可以人为标注,也可以机器标注,此处不作具体限定。
65.在本实施例中,采用yolo v4模型作为机器学习模型,yolo v4主要包含cspdarknet53、spp pan、yolo head三大模块,其中,cspdarknet53为特征提取层,spp(spatial pyramid pooling,空间金字塔池化层)为池化层,pan(path aggregation network,路径聚合网络)为特征融合层,yolo head为回归损失层,回归损失层即为子网络,历史图像经过特征提取、池化、特征融合后在每个子网络计算相对于参考图像的损失值;基于每个子网络的损失值调节机器学习模型的内部参数,并将不同的待检测图像输入调整参数后的机器学习模型,得到损失值,对机器学习模型的内部参数进行调节,直至差异度收敛至期望值,得到经训练的检测模型。可以理解的,在其他实施例中,可以选择其他机器学习模型进行训练,训练过程适应性变化,此处不作具体限定。
66.上述实施例采用yolo v4模型作为机器学习模型,实时性和准确度较高。另外,通过多个子网络的损失值同时调整物品检测模型的模型参数,多个子网络之间可以相互监督促进,从而提高最终性能。
67.在另一个实施例中,基于n个损失值,对待训练的物品检测模型的模型参数进行调整,包括如下步骤:
68.步骤1,对n个损失值进行加权求和,得到综合损失值;
69.步骤2,基于综合损失值,对待训练的物品检测模型的模型参数进行调整。
70.可以理解的,基于n个子网络输出的n个损失值,可以采用不同的方式对物品检测模型的模型参数进行调整,例如,分别用每个损失值对物品检测模型的模型参数进行调整,并基于n个调整结果得到最终参数调整结果;也可以如本实施例所说,对n个损失值进行加权求和,得到综合损失值,再基于综合损失值对模型参数进行调整。在其他实施例中,还可
以采用其他方式利用n个损失值对模型参数进行调整,此处不作具体限定。
71.在另一个实施例中,n个检测框包括水平检测框和旋转检测框;水平检测框为长边的垂线与竖直方向平行的矩形框,旋转检测框为长边的垂线与竖直方向的夹角不为零的矩形框;
72.n个子网络包括用于确定水平检测框的水平检测框子网络以及用于确定旋转检测框的旋转检测框子网络。
73.可以理解的,水平检测框子网络用于确定历史图像与参考图像的水平检测框的损失值,旋转检测框子网络用于确定历史图像与参考图像的旋转检测框的损失值。
74.请参阅图3,图3为本发明一实施例的物品检测方法的物品检测框的示意图。可以理解的,旋转检测框10为长边的垂线与竖直方向的夹角不为零,且长边的垂线相对于竖直方向的角度可以变化的矩形框,可以用一个五参数元组(x,y,w,h,θ)来表示,其中(x,y)表示旋转检测框10中心点x、y方向上的坐标;(w,h)表示旋转检测框10的宽和高;θ表示旋转检测框10的角度。为了不引起歧义,定义旋转检测框10的短边为宽,长边为高;角度θ定义为竖直方向参考线到长边所形成的夹角,角度范围是(-90
°
,90
°
],顺时针的角度为负,反之则为正。水平检测框为长边的垂线与竖直方向始终平行的矩形框,包括以目标物品40的最小横坐标作为最小横坐标,最大横坐标作为最小横坐标,最小纵坐标作为最小纵坐标,最大纵坐标作为最大纵坐标的hbb矩形框20;也包括以旋转矩形框的最小横坐标作为最小横坐标,最大横坐标作为最小横坐标,最小纵坐标作为最小纵坐标,最大纵坐标作为最大纵坐标的ehb(external horizontal box,外接水平框)矩形框30。在其它实施例中,水平检测框还可以包括其他类型的水平矩形框,此处不作具体限定。
75.上述实施例采用水平检测框和旋转检测框对待处理物品进行标注,更贴合安检场景下的物品检测需求。另外,分别设置水平检测框子网络以及旋转检测框子网络,两个子网络在训练过程中可以相互监督促进,从而提高检测模型的最终性能。
76.在另一个实施例中,待检测图像是针对目标场景采集的图像;
77.得到输出图像之后,还包括:
78.确定水平检测框的长边和短边的第一比值;以及
79.确定旋转检测框的长边和短边的第二比值;
80.基于第一比值和第二比值,确定待处理物品是否是目标场景关联的违规物品。
81.示例性地,目标场景可以为地铁站、火车站、飞机场等需要进行安检的场景。
82.在本实施例中,目标场景关联的违规物品包括细长物品,可以理解的,请参阅图3,对于细长物品而言,水平检测框的长宽比与旋转检测框的长宽比差距较大,因此可以通过获取水平检测框的长宽比和旋转检测框的长宽比,并通过获取两者的差值或者比值,判断两个检测框的长宽比的差异程度,若差异程度大于预设阈值,说明对应的待处理物品为细长物品,即与目标场景关联的违规物品。可以理解的,当用户需要检测的违规物品为其他形状或者其他类型的物品时,判断方式根据实际情况适应性变换,此处不作具体限定。
83.在另一个实施例中,对n个损失值进行加权求和,得到综合损失值;基于综合损失值,对待训练的物品检测模型的模型参数进行调整包括:
84.基于1比0.5的比例得到第一损失值以及第二损失值的加权平均值,并基于加权平均值调整物品检测模型的模型参数。
85.可以理解的,1比0.5的比例为一优选实施例,在其他实施例中,可以采用其他比例进行加权求和,具体比例可以根据实际情况进行设定,此处不作具体限定。
86.在另一个实施例中,基于综合损失值,对待训练的物品检测模型的模型参数进行调整包括:
87.基于第一损失值以及第二损失值的加权平均值,采用反向传播算法调整物品检测模型的模型参数。
88.示例性地,反向传播算法简称bp算法,是常用的训练神经网络的一种学习算法,它建立在梯度下降法的基础上。在其他实施例中,可以采用其他算法对物品检测模型进行训练,此处不作具体限定。
89.在另一个实施例中,将训练图像对输入待训练的物品检测模型,得到n个子网络输出的n个损失值包括如下步骤:
90.基于预测检测框与实际检测框的边框回归损失以及置信度损失确定水平检测框子网络的第一损失值以及旋转检测框子网络的第二损失值,预测检测框为历史图像上标注的先验检测框,实际检测框为参考图像上标注的物品检测框。
91.示例性地,回归损失层中设置有损失函数,用于根据预测检测框与实际检测框的边框回归损失和置信度损失计算历史图像与参考图像的损失值,作为差异度。可以理解的,预测检测框包括水平检测框和旋转检测框,实际检测框包括水平检测框和旋转检测框;预测检测框为检测模型根据初始参数标注的先验检测框,即需要与实际检测框进行比对得到损失值的目标检测框,参考图像上标注的实际检测框为预先在参考图像上标注得到的,准确标识目标物品的检测框。其中,实际检测框可以人为标注,也可以机器标注,此处不作具体限定。
92.在另一个实施例中,将训练图像对输入待训练的物品检测模型,得到n个子网络输出的n个损失值还包括:
93.基于预测旋转框与实际旋转框的边框回归损失、置信度损失以及角度回归损失确定旋转检测框子网络的第二损失值,预测旋转框为历史图像上标注的先验旋转框,实际旋转框为参考图像上标注的旋转检测框。
94.可以理解的,在确定历史图像与参考图像的旋转检测框的差异度时,除了考虑边框回归损失以及置信度损失之外,还要考虑旋转检测框的角度。示例性地,旋转检测框旋转1度和旋转181度的两种情况,计算得到的损失值存在较大差异,但两个旋转检测框的实际位置相同,为了避免这种偏差,引入角度回归损失,能有效克服因为角度定义的周期性问题而带来的损失不连续性和震荡性。
95.上述实施例,通过在确定历史图像与参考图像的旋转检测框的差异度时,引入角度回归损失,有效克服因为角度定义的周期性问题而带来的损失不连续性和震荡性。
96.在另一个实施例中,确定历史图像与参考图像的差异度包括如下步骤:
97.步骤1,将历史图像与参考图像分割为预设数量的网格,确定每一网格的差异度;
98.步骤2,基于每一网格的差异度确定历史图像与参考图像的差异度。
99.具体的,水平检测框子网络的损失函数le的计算公式为:
100.[0101][0102][0103]
其中为边框回归损失,为置信度损失;λ
box
、λ
noobj
、λ
obj
分别为边框回归损失、负样本置信度损失、正样本置信度损失的权重比例。示例性地,待检测图像被划分为s
×
s的网格,在每一个网格预设有b个预测检测框。s的网格,在每一个网格预设有b个预测检测框。均为指示性标志,当第i个网格中的第j个先验框被划分为正样本时,且当第i个网格中的第j个先验框被划分为负样本时,且且为预测检测框和实际检测框的iou损失,为预测置信度和实际置信度的bce(binary cross entropy,二元交叉熵)损失。其中,权重比例以及网格划分的数量可以由用户根据实际需求进行确定。
[0104]
旋转检测框子网络的损失函数lo的计算公式为:
[0105][0106][0107][0108][0109]
其中为边框回归损失,为置信度损失,为角度回归损失;λ
box
、λ
noobj
、λ
obj
、λ
reg
分别为边框回归损失、负样本置信度损失、正样本置信度损失以及角度回归损失的权重比例。示例性地,待检测图像被划分为s
×
s的网格,在每一个网格预设有b个预测检测框。均为指示性标志,当第i个网格中的第j个先验框被划分为正样本时,且当第i个网格中的第j个先验框被划分为负样本时,且且为预测检测框和实际检测框的iou损失,为预测置信度和实际置信度的bce损失。其中,公式(5)中为调制旋转损失,能有效克服因为角度定义的周期性问题而带来的损失不连续性和震荡性。
[0110]
可以理解的,在其他实施例中,可以根据实际需求采用其他损失函数计算损失值或者差异度,此处不作具体限定。
[0111]
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计
算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0112]
在本实施例中还提供了一种物品检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0113]
图4是本实施例的物品检测装置的结构框图,如图4所示,该装置包括:
[0114]
图像获取模块50,用于获取包含待处理物品的待检测图像。
[0115]
检测模块60,用于基于训练后的物品检测模型中的n个子网络,分别对待检测图像进行物品检测,得到输出图像;其中:
[0116]
n为大于1的整数;
[0117]
输出图像中包含针对待处理物品的n个检测框,n个检测框中每两个检测框不同,一个子网络确定出n个检测框中的一个检测框,不同子网络确定出的检测框不同。
[0118]
物品检测装置还包括:训练模块。
[0119]
训练模块,用于:
[0120]
获取待训练的物品检测模型;以及
[0121]
获取包括历史图像和参考图像的训练图像对;历史图像中包含历史物品,参考图像中包含针对历史物品的n个检测框;
[0122]
将训练图像对输入待训练的物品检测模型,得到n个子网络输出的n个损失值;
[0123]
基于n个损失值,对待训练的物品检测模型的模型参数进行调整。
[0124]
训练模块,还用于:
[0125]
对n个损失值进行加权求和,得到综合损失值;
[0126]
基于综合损失值,对待训练的物品检测模型的模型参数进行调整。
[0127]
训练模块,还用于:
[0128]
基于预测检测框与实际检测框的边框回归损失以及置信度损失确定水平检测框子网络的第一损失值以及旋转检测框子网络的第二损失值,预测检测框为历史图像上标注的先验检测框,实际检测框为参考图像上标注的物品检测框。
[0129]
训练模块,还用于:
[0130]
基于预测旋转框与实际旋转框的边框回归损失、置信度损失以及角度回归损失确定旋转检测框子网络的第二损失值,预测旋转框为历史图像上标注的先验旋转框,实际旋转框为参考图像上标注的旋转检测框。
[0131]
物品检测装置还包括:违规判断模块。
[0132]
违规判断模块,用于:
[0133]
确定水平检测框的长边和短边的第一比值;以及
[0134]
确定旋转检测框的长边和短边的第二比值;
[0135]
基于第一比值和第二比值,确定待处理物品是否是目标场景关联的违规物品。
[0136]
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器
中。
[0137]
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0138]
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
[0139]
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
[0140]
s1,获取包含待处理物品的待检测图像。
[0141]
s2,基于训练后的物品检测模型中的n个子网络,分别对待检测图像进行物品检测,得到输出图像;其中:
[0142]
n为大于1的整数;
[0143]
输出图像中包含针对待处理物品的n个检测框,n个检测框中每两个检测框不同,一个子网络确定出n个检测框中的一个检测框,不同子网络确定出的检测框不同。
[0144]
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
[0145]
此外,结合上述实施例中提供的物品检测方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种物品检测方法。
[0146]
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本技术提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本技术保护范围。
[0147]
显然,附图只是本技术的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本技术适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本技术披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本技术公开的内容不足。
[0148]“实施例”一词在本技术中指的是结合实施例描述的具体特征、结构或特性可以包括在本技术的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本技术中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
[0149]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献