一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标检测方法及装置、计算设备与流程

2021-10-19 23:40:00 来源:中国专利 TAG:人工智能 检测方法 装置 目标 计算


1.本技术涉及人工智能技术领域,尤其涉及一种目标检测方法及装置、计算设备。


背景技术:

2.目标检测是计算机视觉领域中一个热点研究方向,可以广泛应用于智能导航、医学图像处理、自动驾驶、智能监控、工业瑕疵检测等诸多领域。目前的目标检测算法可以识别并分割图像中的目标对象所在区域以及背景区域。目标检测可以包括大目标检测以及小目标检测,小目标可以为检测框的宽小于原图像的宽的1/50(像素点),检测框的高小于原图像的高的1/50(像素点);检测框的大小与目标对象的大小相适应。
3.现有技术中,通常可以采用一个目标检测模型来检测图像中的全部目标,但是对于图像中的小目标而言,通常可以采用深层网络以及更多尺度对图像特征进行提取以及分类预测,使用更适合小目标的损失函数,以确保获得准确的小目标。
4.但是,采用目标检测模型直接对小目标进行检测的方式时,由于小目标足够小,即便是采用更复杂的网络、更多的尺度以及更适合小目标的损失函数,获得的检测结果仍然不够准确,检测精度较低。


技术实现要素:

5.有鉴于此,本技术实施例提供一种目标检测方法及装置、计算设备,用以解决现有技术中目标检测模型对小目标的检测结果不够准确的技术问题。
6.第一方面,本技术实施例提供一种目标检测方法,包括:
7.确定待检测图像;
8.基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;
9.提取所述待检测图像在所述第一目标区域的局部图像;
10.基于第二检测模型,检测所述局部图像中所述目标对象所在第二目标区域;
11.根据所述第二目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果。
12.第二方面,本技术实施例提供一种目标检测方法,包括:
13.响应于调用目标检测服务的检测请求,确定所述目标检测服务对应的目标检测资源;
14.利用所述目标检测服务对应的目标检测资源执行如下步骤:
15.确定待检测图像;
16.基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;
17.提取所述待检测图像在所述第一目标区域的局部图像;
18.基于第二检测模型,检测所述局部图像中所述目标对象所在第二目标区域;
19.根据所述第二目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果。
20.第三方面,本技术实施例提供一种目标检测方法,包括:
21.响应于检测用户发起的检测请求,获取所述检测用户提供的待检测图像;
22.基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;
23.提取所述待检测图像在所述第一目标区域的局部图像;
24.基于第二检测模型,检测所述局部图像中所述目标对象所在第二目标区域;
25.根据所述第二目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果;
26.为所述检测用户输出所述待检测图像的检测结果。
27.第四方面,本技术实施例提供一种目标检测方法,包括:
28.获取检测用户发起的检测请求以及所述检测用户提供的待检测图像;
29.发送所述检测请求以及所述待检测图像至提供目标检测服务的计算设备,以供所述计算设备响应于针对所述目标检测服务的检测请求,获取所述目标检测服务对应的目标检测资源;
30.其中,所述目标检测资源用于执行如下步骤:
31.确定所述待检测图像;基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;提取所述待检测图像在所述第一目标区域的局部图像;基于第二检测模型,检测所述局部图像中所述目标对象所在第二目标区域;根据所述第二目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果;
32.获取所述计算设备提供的所述目标对象的检测结果。
33.本技术实施例,在确定待检测图像之后,可以基于第一检测模型,检测该待检测图像中目标对象所在第一目标区域,以及目标对象所属目标类别。实现对目标对象的第一次检测。之后提取待检测图像在第一目标区域的局部图像,并基于第二检测模型,检测局部图像中目标对象所在第二目标区域,实现对目标对象的第二次检测。局部图像的检测区域相对于原待检测图像而言较小,实现对缩小了的检测范围进行准确检测,实现目标对象的准确检测,提高检测精度以及检测准确度。
附图说明
34.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1为本技术实施例提供的一种目标检测方法的一个实施例的流程图;
36.图2为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
37.图3为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
38.图4为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
39.图5为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
40.图6为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
41.图7为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
42.图8为本技术实施例提供的一种目标检测方法的又一个实施例的流程图;
43.图9为本技术实施例提供的一种目标检测方法的一个示例图;
44.图10为本技术实施例提供的一种目标检测装置的一个实施例的结构示意图;
45.图11为本技术实施例提供的一种计算设备的一个实施例的结构示意图。
具体实施方式
46.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
48.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
49.取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于识别”。类似地,取决于语境,短语“如果确定”或“如果识别(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当识别(陈述的条件或事件)时”或“响应于识别(陈述的条件或事件)”。
50.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
51.本技术实施例的技术方案可以应用于目标检测场景中,通过采用大目标检测模型对图像中的目标对象进行初步检测之后,再采用小目标检测模型,可能存在小目标对象的局部图像再次进行检测,以提高小目标检测的准确度以及精度。
52.现有技术中,对图像中的目标进行检测时,多采用神经网络算法等构建的检测模型,对图像中的目标进行检测。小目标是一种相对于图像的大小占比更小的目标,例如,小目标的检测框的宽通常可以小于图像的宽的1/50(像素点),同时小目标的检测框的高通常也小于图像的高的1/50(像素点)。为了检测非常小的小目标对象,开发者通常可以设计更深层的网络结构以及更多尺度对图像特征进行提取以及分类预测,使用更适合小目标的损失函数,以确保获得准确的小目标。但是,即便是采用更复杂的网络、更多的尺度以及更适合小目标的损失函数,获得的检测结果仍然不够准确,检测精度较低。
53.本技术实施例中,确定待检测图像之后,可以基于第一检测模型,检测该待检测图像中目标对象所在的第一目标区域以及目标对象所属的目标类别,实现对目标对象的初步检测。之后,可提取该待检测图像在第一目标区域的局部图像,再利用第二检测模型,检测局部图像中目标对象所在第二目标区域,从而根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。通过采用第一检测模型对待检测图像进行初步检测,之后采用第二检测模型对待检测图像进行二次检测,以对目标对象的实际区域进行了缩小检测,实现目标对象的准确检测,提高检测精度以及检测准确度。
54.下面将结合附图对本技术实施例进行详细描述。
55.如图1所示,为本技术实施例提供的一种目标检测方法的一个实施例的流程图,方法可以包括以下几个步骤:
56.101:确定待检测图像。
57.本技术实施例所提供的目标方法可以应用于计算设备中,该计算设备可以为计算机、普通服务器、云端服务器、超级个人计算机、笔记本电脑、平板电脑等,本技术实施例对计算设备的具体类型并不作出过多限定。
58.当本技术所提供的技术方案应用于计算机、笔记本电脑等电子设备时,待检测图像可以是电子设备采集的,也可以是由用户提供的。当本技术所提供的技术方案应用于服务器时,待检测图像可以由用户端发送至服务器。
59.待检测图像可以为需要进行目标检测的图像。对应于不同的使用场景,可以待检测图像的种类可以不同。在用户使用本技术提供的目标检测方法时,待检测图像可以由用户提供。在测试场景中,待检测图像可以为测试图像。在训练场景中,待检测图像可以为训练图像。测试图像以及训练图像可以由标注图像划分获得。例如,将标注图像按照一定比例划分为训练图像以及测试图像,并将训练图像用于训练过程,将测试图像用于测试过程。
60.102:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。
61.第一检测模型可以对待检测图像中的目标对象进行检测,目标对象可以包括多个。任一个目标对象对应有第一目标区域以及该目标对象所属的目标类别。
62.在一个可选实施例中,目标区域可以为矩形、圆形、正方形等多变形状。目标区域的大小与其对应的目标对象的大小相适应,目标区域能够完全包围目标对象,以实现对目标对象的位置的准确提示。
63.目标对象所属目标类别可以基于第一检测模型中提供的多个分类类别进行类别选择或者类别匹配获得。在一种可选方式中,可以分别确定目标对象在多个分类类别的分类概率,并按照从大到小的顺序将分类概率进行排序,以获得最大分类概率对应的分类类别为该目标对象的目标类别。
64.103:提取待检测图像在第一目标区域的局部图像。
65.局部图像可以为待检测图像在第一目标区域的部分图像。在获取局部图像时,可以确定第一目标区域在待检测图像中的坐标点,并根据第一目标区域在待检测图像中的坐标点,裁剪待检测图像获得局部图像。以第一目标区域为矩形为例,可以确定该第一目标区域在待检测图像中的左上、左下、右上、右下四个坐标点,并利用待检测图像中的四个坐标点,获取第一目标区域对应的局部图像。
66.104:基于第二检测模型,检测局部图像中目标对象所在第二目标区域。
67.第二目标区域可以基于第二检测模型检测获得,将局部图像输入第二检测模型可以获得目标对象所在第二目标区域。
68.第二目标区域小于第一目标区域,第二目标区域为第一目标区域中的部分区域。
69.第一检测模型可以为“大目标”检测模型,第二检测模型可以为“小目标”检测模型。大目标可以为具有第一类别属性的目标,小目标可以为具有第二类别属性的目标。
70.105:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
71.待检测图像的检测结果可以由目标对象所在第二目标区域以及目标对象所属目标类别构成。
72.本技术实施例中,在确定待检测图像之后,可以基于第一检测模型,检测该待检测图像中目标对象所在第一目标区域,以及目标对象所属目标类别。实现对目标对象的第一次检测。之后提取待检测图像在第一目标区域的局部图像,并基于第二检测模型,检测局部图像中目标对象所在第二目标区域,实现对目标对象的第二次检测。局部图像的检测区域相对于原待检测图像而言较小,实现对缩小了的检测范围进行准确检测,实现目标对象的准确检测,提高检测精度以及检测准确度。
73.在实际应用中,检测模型的分类器可以包括多种分类类别。例如,若设计一个rcnn模型可以对图像中的检测对象是属于汽车、属于行人还是属于建筑物进行分类,此时,该rcnn模型中即可以包括汽车、行人、建筑物等三个分类类别。检测模型可以对应多个分类类别,并确定检测获得的目标对象对应的分类类别。
74.但是,本技术实施例中,基于对大目标以及小目标的检测问题,对检测模型的分类类别进行了划分,将属于大目标的分类类别以及属于小目标的分类类别进行了区分,以便于对第一检测模型以及第二检测模型各自对应的可分类类别进行准确划分。
75.本技术中,将属于大目标的分类类别作为具备第一类别属性的至少一个第一分类类别,将属于小目标的分类类别作为具备第二类别属性的至少一个第二分类类别。
76.第一类别属性可以为目标对象的检测框的宽与检测图像的宽的比值大于第一比值,以及检测框的高与检测图像的高的比值大于第二比值。第一比值与第二比值相对较大,例如,第一比值以及第二比值可以为0.1。
77.第二类别属性可以为目标对象的检测框的宽与检测图像的宽的比值小于第三比值,以及检测框的高与检测图像的高的比值大于第四比值。第三比值与第四比值相对较小,例如,第三比值与第四比值可以为0.02。
78.为了解决小目标的检测问题,第一检测模型可以对所有分类类别进行判别,第二检测模型可以对属于第二类别属性的分类类别作为分类基础进行分类。
79.可选地,第一检测模型可以包括第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别。
80.第二检测模型可以包括第二类别集合中的至少一个第二分类类别。
81.也即,第一检测模型对目标对象进行分类时,可以对目标对象进行包括至少一个第一分类类别以及至少一个第二分类类别的多个分类类别均进行类别检测,并进行类别判断,以获得目标对象最终的目标类别。该目标类别可能属于第一分类类别,也可能属于第二
分类类别。第二检测模型对目标对象进行分类时,该目标对象最终的目标类别仅存在第二分类类别一种结果。
82.作为一个实施例,在基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别可以包括:
83.基于第一检测模型,检测待检测图像中目标对象所在第一目标区域;
84.根据第一目标区域对应的图像特征,从第一检测模型对应至少一个第一分类类别以及至少一个第二分类类别中,确定目标对象所属目标类别。
85.第二检测模型由于只存在第二类别属性的至少一个第二分类类别,且第一检测模型已对目标对象所属类别进行了划分,第二检测模型可以不对目标对象进行再次分类,以减少处理过程,提高处理效率。
86.如图2所示,为本技术实施例提供的一种目标检测方法的一个实施例的流程图,该方法可以包括以下几个步骤:
87.201:确定待检测图像。
88.本技术实施例中部分步骤与图1所示实施例的部分步骤相同,为了描述的简洁性考虑,在此不再赘述。
89.202:确定第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别对应的第一检测模型。
90.第一检测模型中可以包括至少一个第一分类类别以及至少一个第二分类类别构成的分类器。第一检测模型对目标对象的分类结果,也即目标类别可能为至少一个第一分类类别中的一个,也可能为至少一个第二分类类别中的一个。
91.203:确定第二类别集合中的至少一个第二分类类别对应的第二检测模型。
92.204:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域。
93.205:根据第一目标区域中目标对象对应的对象特征,从第一检测模型对应至少一个第一分类类别以及至少一个第二分类类别中,确定目标对象所属目标类别。
94.206:提取待检测图像在第一目标区域的局部图像。
95.207:根据第二检测模型,检测局部图像中目标对象所在第二目标区域。
96.208:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
97.本技术实施例中,确定待检测图像之后,先确定了包括第一类别集合中至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别的第一检测模型,以及第二分类集合中的至少一个第二分类类别对应的第二检测模型。该第一检测模型可以对待检测图像进行检测,并确定目标随着所在的第一目标区域以及所属目标类别。该目标对象的目标类别可能是属于第一类别集合也可能属于第二类别集合。通过采用两种分类基准不同的检测模型对待检测图像中的目标对象进行分类判别,实现对待检测图像的准确分类。在准确分类的基础上,采用第一检测模型进行大目标检测之后,再采用第二检测模型对前一次检测的第一目标区域对应的局部图像再进行详细检测,可以提高目标对象检测的有效率以及准确率。
98.作为一个实施例,基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别之后,该方法还可以包括:
99.确定第一类别集合以及第二类别集合。
100.其中,第一类别集合包括具有第一类别属性的至少一个第一分类类别;第二类别集合包括具有第二类别属性的至少一个第二分类类别。
101.通过获取第一类别集合以及第二类别集合,将具备不同类别属性的分类类别进行了划分,以对两种类别集合的检测模型分别进行训练,获得更适用于第二类别集合的检测模型,实现模型的针对性训练,以解决采用单一检测模型进行对象检测导致的小目标检测准确度以及精度不高的问题。
102.采用第一检测模型对待检测图像中的目标对象进行初次检测,获得目标对象所在的第一检测区域以及目标类别之后,可以确定目标对象的目标类别。如果该目标类别为第一类别集合中的类别,说明目标对象为一个大目标,此时可以直接确定目标对象的检测结果。而如果目标类别为第二类别集合中的类别,说明目标对象为一个小目标,此时需要进行二次检测,以提高检测精度。
103.如图3所示,为本技术实施例提供的一种目标检测方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
104.301:确定待检测图像。
105.需要说明的是,本技术实施例中部分步骤与前述实施例中部分步骤相同,为了描述的简洁性考虑,在此不再赘述。
106.302:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。
107.303:确定第一类别集合以及第二类别集合。
108.其中,第一类别集合包括具有第一类别属性的至少一个第一分类类别;第二类别集合包括具有第二类别属性的至少一个第二分类类别。
109.304:如果目标类别属于第一类别集合,根据第一目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
110.当目标类别属于第一类别集合时,待检测图像中目标对象的检测结果可以由第一目标区域以及目标对象所属目标类别确定。
111.第一类别集合可以包括至少一个第一分类类别。目标类别属于第一类别集合可以包括:目标类别为至少一个第一分类类别中的任一个。判断目标类别是否属于第一类别集合具体可以通过判断目标类别是否为至少一个第一分类类别中的任一个来确定。
112.305:如果目标类别属于第二类别集合,提取待检测图像在第一目标区域的局部图像。
113.当目标类别属于第二类别集合时,说明目标对象具有第二类别属性,此时可以针对第一目标区域的局部图像进行二次检测,以提高检测获得的目标对象所在区域的准确性以及精度。
114.第二类别集合可以包括至少一个第二分类类别。目标类别属于第二类别集合可以包括:目标类别为至少一个第二分类类别中的任一个。判断目标类别是否属于第二类别集合具体可以通过判断目标类别是否为至少一个第二分类类别中的任一个来确定。
115.306:基于第二检测模型,检测局部图像中目标对象所在第二目标区域。
116.307:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对
象的检测结果。
117.本技术实施例中,通过对目标类别是属于第一类别集合还是属于第二类别集合进行了判断,以确认目标对象是属于大目标还是属于小目标,从而获取针对目标对象的检测结果进行准确获取,提高目标对象的检测精度。
118.在实际应用中,目标对象的检测结果实际需要结合具备第一类别集合以及第二类别集合的第一检测模型以及第二类别集合对应的第二检测模型双层检测,并在检测获得的目标对象的第一目标区域以及目标类别的基础上,实现目标对象的准确检测,提高检测精度以及准确性。
119.如图4所示,为本技术实施例提供的一种目标对象检测方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
120.401:确定待检测图像。
121.需要说明的是,本技术实施例中部分步骤与前述实施例中部分步骤相同,为了描述的简洁性考虑,在此不再赘述。
122.402:确定第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别对应的第一检测模型。
123.403:确定第二类别集合中至少一个第二分类类别对应的第二检测模型。
124.404:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域。
125.405:根据第一目标区域对应的对象特征,从第一检测模型对应至少一个第一分类类别以及至少一个第二分类类别中,确定目标对象所属目标类别。
126.406:确定第一类别集合以及第二类别集合。
127.其中,第一类别集合包括具有第一类别属性的至少一个第一分类类别;第二类别集合包括具有第二类别属性的至少一个第二分类类别。
128.407:如果目标类别属于第一类别集合,根据第一目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
129.408:如果目标类别属于第二类别集合,提取待检测图像在第一目标区域的局部图像。
130.409:根据第二检测模型,检测局部图像中目标对象所在第二目标区域。
131.410:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
132.本技术实施例中,确定待检测图像之后,可以确定第一检测模型以及第二检测模型,并利用第一检测模型对待检测图像进行初步的目标检测以及类别预测,以获得目标对象所在的第一目标区域以及目标类别。从提高效率的角度考虑,如果目标对象的目标类别属于第一类别集合,则说明此目标对象通过第一检测模型即可完成较为准确的检测;如果目标对象的目标类别属于第二类别集合,则说明此目标对象需要使用第二检测模型进行二次检测,以提高检测精度。此时,可以先提取待检测图像在第一目标区域的局部图像,并根据第二检测模型,检测局部图像中目标对象所在的第二目标区域,该第二目标区域属于第一目标区域的部分区域,相对于第一目标区域而言对目标对象所在区域的定位更准确。从而根据第二目标区域以及目标对象所属目标类别,确定的待检测图像的检测结果更精准。
133.在目标检测领域中,主要采用目标检测模型检测图像中的目标,检测到的目标采
用检测框进行标识突出。检测框的大小通常与目标对象的大小相适应。被检测到的目标即为一个正类,例如,图像中的汽车或者行人可以为正类,图像的背景,例如,天空或者道路可以为负类。
134.在实际的检测过程中,检测结果存在4种可能:1.把正类预测为正类(tp),2.把负类预测为正类(fp),3.把负类预测成负类(tn),4.把原来的正类预测为负类(fn)。基于图像的目标检测算法的主要衡量指标为检测目标的召回率(recall)和精确率(precision)。精确率表示预测为正类的样本中,真正的正类的占比,也即precision=tp/(tp fp)。召回率表示正类被正确检测的占比,也即recall=tp/(tp fn)。
135.由以上精确率以及召回率的计算方式可知,精确率与召回率存在制约现象,二者不能同时提高。但是,在实际应用中,对于一些检测场景而言,确保召回率和精确率同时达到各自的指标是目前亟需解决的技术问题。特别是对于检测的精确度以及召回率不能同时保障。因此,在本技术实施例中采用置信度约束精确率以及召回率,以使得精确率以及召回率均可以达到一定的高度,提高检测精度以及准确度。
136.置信度可以表示为测量获得的结果与实际的真实结果之间的差距小于某个预定值的概率,是一种概率统计值,可以体现模型的鲁棒性。置信度和精确度是相互制约的。置信度越高,精确度越低,相反,精确度越高,置信度越低。
137.作为一个实施例,如果目标类别属于第二类别集合,提取待检测图像在第一目标区域的局部图像可以包括:
138.如果目标类别属于第二类别集合,确定第一检测模型检测目标对象的第一目标区域以及目标类别对应的第一置信度;
139.如果第一置信度大于第一阈值,根据第一目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
140.如果第一置信度大于第二阈值且小于第一阈值,则提取待检测图像在第一目标区域的局部图像。
141.其中,第一阈值大于第二阈值。
142.可选地,第一检测模型检测目标对象的第一目标区域以及目标类别对应的第一置信度可以由该第一检测模型计算获得,也即第一检测模型可以同时输出目标对象的第一目标区域、目标类别以及第一置信度。对于目标类别属于第一类别集合的目标对象而言,其对应检测结果已足够精确,检测获得的第一置信度即没有必要参与二次检测判断,以减少计算复杂度,提高计算效率。
143.当目标类别属于第二类别集合时,设置两个阈值,分别为第一阈值b以及第二阈值a,其中,第一阈值b大于第二阈值a。
144.当第一目标区域的置信度大于第一阈值b时,说明此时检测出的区域的置信度足够高,可以认为检测到的结果较为准确,不需要进行二次检测。当第一目标区域的置信度大于第二阈值a且小于第一阈值b时,此时的置信度较低,召回率很高,但是精确率很低,存在误检的可能性较高,此时,需要使用第二检测模型进行二次检测,以确保检测精确率以及召回率均高于一定的标准。
145.本技术实施例中,通过采用第一阈值以及第二阈值对属于第二类别集合的检测区域的第一置信度进行范围判断,以准确确定是否需要进行二次的检测,避免出现无效或者
非必要的二次检测,提高检测效率。
146.作为一种可能的实现方式,第一类别集合以及第二类别集合可以通过以下方式确定获得:
147.确定多个标注图像。
148.其中,任一个标注图像对应有标注对象所在的标注区域以及标注类别。
149.将标注类别相同的标注图像划分至同一类别图像集合中,以获得多个标志类别分别对应的类别图像集合。
150.其中,任一个类别图像集合包括具有相同标注类别的至少一个标注图像。
151.根据任一个标注类别对应类别图像集合中的至少一个标注图像,从第一类别属性以及第二类别属性中确定该标注类别对应的目标类别属性,以获得多个标注类别分别对应的目标类别属性。
152.将目标类别属性为第一类别属性的标注类别划分至第一类别集合以及将目标类别属性为第二类别属性的标注类别划分至第二类别集合。
153.由于标注图像中标注对象所在的标注区域已知,对于某个标注区域而言,当该标注区域相对标注图像较大时,可以确定该标注区域标注的对象是一个大目标;当该标注区域相对标注图像较小时,可以确定该标注区域标注的对象是一个小目标。因此,在任一个标注图像的标注对象所在标注区域确定时,可以通过标注区域的大小确定标注对象的类别属性。本技术实施例中的类别属性主要可以包括第一类别属性以及第二类别属性。第一类别属性具备大目标的相关属性,第二类别属性具备小目标的相关属性。通过标注区域可以直接确定标注图像的类别属性。
154.可选地,标注区域相对标注图像较大具体可以是标注区域的宽与对应的标注图像的宽的比值大于第一比值,以及标注区域的高与对应的标注图像的高的比值大于第二比值。第一比值与第二比值相对较大,例如,第一比值以及第二比值例如均可以为0.1。标注区域相对标注图像较小可以为标注区域的宽与对应标注图像的宽的比值小于第三比值,以及标注区域的高与对应标注图像的高的比值大于第四比值。第三比值与第四比值相对较小,例如,第三比值与第四比值均可以为0.02。当然第一比值与第二比值可以不同但差值小于某个阈值,第三比值与第四比值也可以不同单差值也小于该阈值。
155.在一些实施例中,标注区域可以直接对应有第一类别属性或者第二类别属性。前述实施例中的步骤:根据任一个标注类别对应类别图像集合中的至少一个标注图像,从第一类别属性以及第二类别属性中确定标注类别对应的目标类别属性,以获得多个标注类别分别对应的目标类别属可以包括:
156.针对任一个标注类别对应类别图像集合中的至少一个标注图像,确定至少一个标注图像中标注区域对应第一类别属性的第一标注图像,以及标注区域对应第二类别属性的第二标注图像;
157.统计第一标注图像的数量,获得第一图像数量以及第二标注图像的数量,获得第二图像数量;
158.判断第一图像数量与第二图像数量的比值是否大于第一比例阈值;
159.如果是,则确定标注类别对应第一类别属性;
160.如果否,则确定标注类别对应第二类别属性。
161.当一个类别图像集合的至少一个标注图像中属于第一类别属性的第一标注图像远多于属于第二类别属性的第二标注图像时,说明此类别图像集合中的大目标远多于小目标,从检测效率角度考虑,可以将该类别图像集合总体的标注类别定义为第一类别属性。
162.当一个类别图像集合的至少一个标注图像中属于第一类别属性的第一标注图像远小于属于第二类别属性的第二标注图像时,说明此类别图像集合中的大目标远小于小目标,从检测准确度以及有效性考虑,可以将该类别图像集合总体的标注类别定义为第二类别属性。
163.在某些实施例中,为了进一步确定第一类别集合中的多个标注类别是否可以满足相应的检测结果,可以对第一类别集合中的各个标注类别进行测试,以确保每个标注类别均可以达到一定的使用条件。在前述实施例执行的步骤:将目标类别属性为第一类别属性的标注类别划分至第一类别集合以及将目标类别属性为第二类别属性的标注类别划分至第二类别集合之后,该方法还可以包括:
164.针对第一类别集合中的任一个标注类别,如果标注类别的测试结果不满足测试条件,则将标注类别标记为第二类别属性,并划分至第二类别集合中。
165.进一步,可选地,为了准确获得第一类别集合中各个标注类别的测试结果,第一类别集合中的任一个标注类别的测试结果可以通过以下方式确定:
166.确定属于标注类别的多个第一测试图像;其中,多个第一测试图像对应有标注对象所在的标注区域;
167.将多个第一测试图像分别输入第一检测模型,获得多个第一测试图像分别检测获得的目标对象所在的测试区域以及测试类别;
168.根据多个第一测试图像各自的标注区域以及测试区域,以及多个第一测试图像各自的标注类别以及测试类别,确定多个第一测试图像对应的测试结果。
169.在一种可能的设计中,根据多个第一测试图像各自的标注区域以及测试区域,以及多个第一测试图像各自的标注类别以及测试类别,确定多个第一测试图像对应的测试结果可以包括:
170.根据多个第一测试图像各自的标注区域以及测试区域,以及第一多个测试图像各自的标注类别以及测试类别,确定多个第一测试图像对应的准确率以及召回率。
171.在某些实施例中,为了准确判断某个标注类别的测试结果是否满足测试条件,针对第一类别集合中的任一个标注类别,如果标注类别的测试结果不满足测试条件,则将标注类别的类别属性由第一类别属性更新为第二类别属性,并将标注类别划分至第二类别集合中可以包括:
172.针对第一类别集合中的任一个标注类别,确定标注类别对应的准确率以及召回率;
173.如果标注类别的准确率小于预设准确率阈值且标注类别的召回率小于召回率阈值,确定标注类别的测试结果不满足测试条件;
174.将标注类别的类别属性由第一类别属性更新为第二类别属性,并将标注类别划分至第二类别集合中。
175.本技术实施例中,采用对第一分类类别进行测试条件的判断方式来确认某个分类类别是否需要增加到第二类别集合中,实现对第一类别集合以及第二类别集合的准确划
分,提高划分准确性以及有效性。
176.在实际应用中,第一检测模型以及第二检测模型可以训练获得。第一检测模型以及第二检测模型可以采用现有的任意目标检测算法,二者可以采用相同的目标检测算法也可以采用不同的目标检测算法。
177.第一检测模型与第二检测模型的区别之处在于分类器的不同。第一检测模型的分类器可以包括第一分类集合中的至少一个第一分类类别以及第二分类集合中的至少一个第二分类类别。第二检测模型的分类器可以包括第二分类集合中的至少一个第二分类类别。第一检测模型的训练以及第二模型的训练可以分别进行。
178.作为一个实施例,第一检测模型可以通过以下方式训练获得:
179.确定多个第一训练数据;其中,多个第一训练数据分别对应有标注对象所在的标注区域以及标注类别;标注区域对应有第一类别属性或者第二类别属性;
180.基于第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别,构建第一检测模型;
181.根据预设第一训练目标,利用多个第一训练数据训练获得第一检测模型的第一模型参数。
182.其中,多个第一训练数据可以从多个标注数据中选择获得,也即多个第一训练数据可以为多个标注数据的部分数据。多个第一训练数据中需要包括第一类别属性的标注图像以及第二类别属性的标注图像。
183.可选地,第一训练目标可以为训练误差小于第一误差阈值。根据预设第一训练目标,利用多个第一训练数据训练获得第一检测模型的第一模型参数的部分与现有技术中目标检测模型的具体训练方式相同,在此不再赘述。
184.作为又一个实施例,第二检测模型可以通过以下方式训练获得:
185.确定多个第二训练数据;其中,多个第二训练数据分别对应有标注对象所在标注区域以及标注类别;标注区域对应有第二类别属性;
186.基于第二类别集合中至少一个第二分类类别,构建第二检测模型;
187.根据预设第二训练目标,利用多个第二训练数据训练获得第二检测模型的第二模型参数。
188.其中,多个第二训练数据可以从多个标注数据中选择获得,也即多个第二训练数据可以为多个标注数据中的部分数据。多个第二训练数据需要包括第二类别属性的标注图像。
189.可选地,第二训练目标可以为训练误差小于第二误差阈值。根据预设第一训练目标,利用多个第二训练数据训练获得第二检测模型的第二模型参数的部分与现有技术中目标检测模型的训练方式相同,在此不再赘述。
190.可选地,本技术实施例中使用的第一检测模型以及第二检测模型可以采用前述实施例中描述的训练方式预先训练获得,并将第一检测模型和第一模型参数以及第二检测模型和第二模型参数存储于模型存储文件中,并在需要时,读取模型存储文件,以解析获得第一检测模型以及第二检测模型。
191.在实际应用中,为了对本技术实施例中第一检测模型以及第二检测模型结合检测目标的方案进行验证,可以采用测试方式对本技术实施例的技术方案进行测试验证。在一
种可能的设计中,应用于测试场景时,该待检测图像可以包括多个第二测试图像。该任一个第二测试图像对应有标注对象所在的标注区域以及标注类别。
192.参考图5,为本技术实施例提供的一种目标检测方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
193.501:确定多个第二测试图像。
194.其中,任一个第二测试图像对应有标注对象所在的标注区域以及标注类别。
195.502:基于第一检测模型,分别检测多个第二测试图像中目标对象所在第一目标区域以及目标对象所属目标类别;
196.503:分别提取多个第二测试图像在各自的第一目标区域对应的局部图像。
197.504:基于第二检测模型,检测多个局部图像中目标对象所在第二目标区域。
198.505:根据任一个第二测试图像对应的第二目标区域,结合第二测试图像的目标对象所属目标类别,确定第二测试图像中目标对象的检测结果,以获得多个第二测试图像分别对应的检测结果。
199.506:获取多个第二测试图像分别对应的检测结果中的目标区域以及目标类别。
200.507:基于多个第二测试图像分别对应的目标区域以及目标类别,结合多个第二测试图像分别对应的标注区域以及标注类别,计算获得多个第二测试图像对应的测试结果。
201.在某些实施例中,多个第二测试图像可以与多个第一测试图像相同。为了区别不同的测试效果,多个第二测试图像也可以与多个第一测试图像不同。
202.多个第二测试图像与多个第一测试图像可以为多个标注图像中的部分图像,可以为多个标注图像中未被设置为训练图像的标注图像。也即,可以将多个标注图像中的部分图像作为测试图像,剩余部分作为训练图像。
203.进一步,可选地,多个第二测试图像对应的测试结果可以包括:准确率以及召回率。
204.采用准确率以及召回率可以准确对测试结果进行显示,提高测试结果对本技术的衡量价值,实现准确而有效的测试。
205.在某些实施例中,在获得多个第二测试图像对应的测试结果之后,还可以包括:
206.根据多个第二测试图像对应的测试结果,生成测试结果提示信息;
207.为测试用户输出测试结果提示信息。
208.利用测试结果提示信息,可以将测试结果为测试用户进行及时有效的提示,实现与用户的有效交互。
209.作为一个实施例,在执行基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别之前,该方法还可以包括:
210.为检测用户提供多个候选类别,以供检测用户从多个候选类别中选择检测类别;
211.基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别包括:
212.基于第一检测模型,检测待检测图像中目标对象所在的第一目标区域以及从检测类别中检测目标对象所属的目标类别。
213.可选地,多个候选类别可以包括第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别。检测类别中可以包括第一分类类别也可以包括第
二分类类别。
214.本技术实施例中,通过将多个候选类别展示给检测用户供检测用户选择需要进行类别检测的检测类别,以缩小类别判断的范围,提高检测效率。
215.作为又一个实施例,第一检测模型以及第二检测模型可以由用户指定。方法还可以包括:
216.为检测用户提供多个候选检测模型,以供检测用户从多个候选检测模型中选择第一检测模型以及第二检测模型;
217.确定第一检测模型以及第二检测模型。
218.本技术实施例中,通过将多个候选检测模型提供给用户,可以供用户从多个候选检测模型中选择需要的第一检测模型以及第二检测模型,实现模型的针对性检测,实现模型的有效检测。
219.此外,在一种可能的设计中,第一检测模型以及第二检测模型还可以直接由检测用户提供获得,本技术实施例中对第一检测模型以及第二检测模型的获取过程并不作出过多限定。
220.为了使得用户获知中间检测结果,以便于更好把控检测结果。在某些实施例中,提取待检测图像在第一目标区域的局部图像可以包括:
221.将目标对象所在的第一目标区域对应的待检测图像展示给检测用户;
222.判断是否获取到检测用户针对第一目标区域执行的确认操作;
223.如果是,则确定检测用户针对第一目标区域执行的确认操作,提取待检测图像在第一目标区域的局部图像;
224.如果否,则获取检测用户针对第一目标区域的调整操作,确定检测用户调整后的第一目标区域,以提取待检测图像在检测用户调整后的第一目标区域对应的局部图像。
225.本技术实施例中,可以将具有第一目标区域的待检测图像展示给用户,使得检测用户可以获知待检测图像的中间检测结果,可以提高检测用户对中间结果的把控效果,实现有效检测并提高检测效率。
226.在一种可能的设计中,本技术实施例提供的技术方案可以配置于服务器或者云服务器中,形成可对外提供的服务。参考图6,为本技术实施例提供的一种目标检测方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
227.601:响应于调用目标检测服务的检测请求,确定目标检测服务对应的目标检测资源。
228.利用目标检测服务对应的目标检测资源执行如下步骤:
229.602:确定待检测图像。
230.603:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。
231.604:提取待检测图像在第一目标区域的局部图像。
232.605:基于第二检测模型,检测局部图像中目标对象所在第二目标区域。
233.606:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
234.本技术实施例中部分步骤与前述实施例相同,为了描述的简洁性考虑,在此不再
赘述。
235.本技术实施例中,将目标检测功能以服务形式提供给用户,以使得用户通过调用目标检测服务实现对待检测图像的目标检测功能,为用户提供了快速而准确的目标检测服务,提高了服务效率。
236.图7为本技术实施例提供的一种目标检测方法的又一个实施例的流程图,该方法可以包括以下几个步骤:
237.701:响应于检测用户发起的检测请求,获取检测用户提供的待检测图像。
238.702:基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。
239.703:提取待检测图像在第一目标区域的局部图像。
240.704:基于第二检测模型,检测局部图像中目标对象所在第二目标区域。
241.705:根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
242.706:为检测用户输出待检测图像的检测结果。
243.本技术实施例中部分步骤与前述实施例中步骤相同,为了描述的简洁性考虑,在此不再赘述。
244.本技术实施例中,可以直接响应检测用户发起的检测请求,并获得检测用户提供的待检测图像。从而使用第一检测模型对待检测图像进行第一次检测,获得目标对象所在第一目标区域以及所属目标类别。通过提取待检测图像在第一目标区域的局部图像,并基于第二检测模型对该局部图像进行二次检测,获得目标对象所在第二目标区域,实现对目标对象所在区域的准确检测,提高目标对象的检测区域的准确性,使得检测的第二目标区域与目标对象的大小更匹配,提高检测精度以及有效性。
245.在实际应用中,目标用户可以针对提供目标检测服务的计算设备发起检测请求。如图8所示,为本技术实施例中提供的一种目标检测方法的一个实施例的流程图,该方法可以包括以下几个步骤:
246.801:获取检测用户发起的检测请求以及检测用户提供的待检测图像。
247.802:发送检测请求以及待检测图像至提供目标检测服务的计算设备,以供计算设备响应于针对目标检测服务的检测请求,获取目标检测服务对应的目标检测资源。
248.其中,目标检测资源用于执行如下步骤:
249.确定待检测图像;基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别;提取待检测图像在第一目标区域的局部图像;基于第二检测模型,检测局部图像中目标对象所在第二目标区域;根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
250.803:获取计算设备提供的目标对象的检测结果。
251.本技术实施例中部分步骤与前述实施例部分步骤相同,在此不再赘述。
252.本技术实施例中,用户端可以向提供目标检测服务的计算设备发起检测请求,并提供需要检测的图像,以使得提供目标检测服务的计算设备可以使用目标检测服务对应的目标检测资源执行对待检测图像进行确定,基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别,并提取待检测图像在第一目标区域的局
部图像,基于第二检测模型,检测该局部图像中目标对象所在第二目标区域。以根据该第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。计算设备可以将该目标对象的检测结果发送至用户端。用户端即可以获取该计算式设备提供的目标对象的检测结果。检测用户通过用户端即可以使用计算设备提供的目标检测服务,获取相应的目标对象的目标检测结果,实现本技术实施例中检测服务的多种运行方式,提高服务范围。
253.在实际应用中,图像的分类问题可以应用于各种技术领域,在一些领域中可以提供很多类别供目标对象进行分类。但是在实际应用中,用户可能并不需要很多类别,例如,在商标图像的检测领域中,商标可以包含很多一级类别,而一级类别下又可以包括很多二级类别,商标图像申请时,实际可以仅针对需要申请的某个一级类别或者二级类别进行相似度检测,如果仍然在原有类别下对一级类别中所有的商标进行检测,会导致商标图像的检测效率很低,但是如果用户对检测的类别进行初步选定,以缩小检测范围,可以极大提高检测效率。因此,本技术实施例中,可以将目标检测服务提供的多个候选类别展示给用户,并获取用户对候选类别的选择结果,以实现按照用户选定的类别范围的针对性检测,提高检测效率以及准确度。
254.因此,在步骤802发送检测请求以及待检测图像至提供目标检测服务的计算设备之后,该方法还可以包括:
255.获取计算设备提供的多个候选类别;
256.为检测用户展示多个候选类别,以确定检测用户从多个候选类别中选择检测类别;
257.提供检测类别至计算设备,以供计算设备利用目标检测资源基于第一检测模型,从检测类别中检测目标对象所属目标类别。
258.本技术实施例中,将计算设备提供的多个候选类别展示给检测用户的用户端,使得用户端可以为检测用户展示多个候选类别,从而确定检测用户从多个候选类别中选择的检测类别,以提供该检测类别至计算设备,供计算设备基于第一检测模型,从检测类别中检测目标对象所属的目标类别,实现更高效率的类别分类。
259.本技术实施例中涉及到的检测模型可以为神经网络模型,而神经网络模型的种类又非常多,计算设备可以提供多种模型供用户选择。因此,在在步骤802发送检测请求以及待检测图像至提供目标检测服务的计算设备之后,该方法还可以包括:
260.获取计算设备提供的多个候选检测模型;
261.为检测用户展示多个候选检测模型,以确定检测用户从多个候选检测模型中选择的第一检测模型以及第二检测模型;
262.提供第一检测模型以及第二检测模型至计算设备,以供计算设备中的目标检测资源确定第一检测模型以及第二检测模型。
263.本技术实施例中,在获取到多个候选检测模型之后,可以为检测用户展示多个候选检测模型,以确定检测用户从多个候选检测模型中选择的第一检测模型以及第二检测模型,实现用户对检测模型的选择,从而在用户端提供第一检测模型以及第二检测模型至计算设备之后,供该计算设备中的目标检测资源确定第一检测模型以及第二检测模型。通过为用户提供模型选择功能,实现为用户提供更便捷的模型选择交互功能,提高检测效率以
及准确性。
264.此外,为了进一步提高用户对检测过程的把控度,在某些中,还可以包括:
265.获取计算设备提供的具有目标对象所在第一目标区域的待检测图像;
266.判断检测用户是否执行针对第一目标区域的确认操作;
267.如果是,则提供检测用户针对第一目标区域触发的确认操作至计算设备,以供计算设备中的目标检测资源提取待检测图像在第一目标区域的局部图像;
268.如果否,则检测检测用户针对第一目标区域的调整操作,确定检测用户调整后的第一目标区域;将检测用户调整后的第一目标区域至计算设备,以供计算设备的目标检测资源提取待检测图像在检测用户调整后的第一目标区域对应的局部图像。
269.获取到计算设备提供的目标对象所在第一目标区域的待检测图像之后,可以为该检测用户展示具有该第一目标区域的待检测图像。在具体的展示过程中,第一目标区域可以悬浮于待检测图像上方,例如可以以矩形框的形式提示该第一目标区域在待检测图像的位置。
270.可选地,本技术实施例中,为检测用户展示候选类别、候选检测模型或者包含有第一目标区域的待检测图像时,可以以网页、对话框、即时通讯消息等多种消息展示方式进行展示,本技术实施例中对候选类别、候选检测模型以及包含第一目标区域的待检测图像的展示方式并不作出过多限定。
271.为了便于理解,参考图9,以本技术实施例提供的目标检测方法配置于云服务器m1为例,对本技术实施例的具体使用场景进行详细描述。
272.图9中设置一手机用户端m2。本技术实施例中使用的第一检测模型以及第二检测模型为已训练好的检测模型,具体的训练方式参考前述实施例的详细描述,在此不再赘述。
273.检测用户u可以通过手机用户端m2提供901待检测图像至云服务器m1。
274.云服务器m1获得待检测图像之后,可以基于第一检测模型,检测902待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。实现对目标对象的第一次检测,在该目标对象需要第二次检测时,可以提取903待检测图像在第一目标区域的局部图像。然后利用第二检测模型,检测904局部图像中目标对象所在第二目标区域。从而根据第二目标区域,结合目标对象所属目标类别,确定905待检测图像中目标对象的检测结果。
275.之后,云服务器m1可以将待检测图像对目标对象的检测结果发送906至手机用户端m2,由该手机用户端m2为检测用户u显示该检测结果(图中未示出)。手机用户端m2可以采用多种显示方式显示该检测结果,例如以短消息、网页或者即时通讯消息等形式显示。
276.图9示出了用户通过操作用户端与云端服务器进行交互以解决图像的目标检测问题,通过采用第一检测模型以及第二检测模型的双层检测方式,可以确保检测获得的目标对象的目标区域以及目标类别更精确。
277.图9的目标检测装置可以执行图1等实施例的目标检测方法,其实现原理和技术效果不再赘述。对于上述实施例中的目标检测装置其中的各个模块、单元、子单元所执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
278.如图10所示,为本技术实施例提供的一种目标检测装置的一个实施例的结构示意图,该装置可以包括:
279.图像确定模块1001:用于确定待检测图像。
280.第一检测模块1002:用于基于第一检测模型,检测待检测图像中目标对象所在第一目标区域以及目标对象所属目标类别。
281.局部提取模块1003:用于提取待检测图像在第一目标区域的局部图像。
282.第二检测模块1004:用于基于第二检测模型,检测局部图像中目标对象所在第二目标区域。
283.结果确定模块1005:用于根据第二目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
284.本技术实施例,在确定待检测图像之后,可以基于第一检测模型,检测该待检测图像中目标对象所在第一目标区域,以及目标对象所属目标类别。实现对目标对象的第一次检测。之后提取待检测图像在第一目标区域的局部图像,并基于第二检测模型,检测局部图像中目标对象所在第二目标区域,实现对目标对象的第二次检测。局部图像的检测区域相对于原待检测图像而言较小,实现对缩小了的检测范围进行准确检测,实现目标对象的准确检测,提高检测精度以及检测准确度。
285.作为一个实施例,该装置还可以包括:
286.第一确定模块,用于确定第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别对应的第一检测模型。
287.第二确定模块,用于确定第二类别集合中至少一个第二分类类别对应的第二检测模型。
288.作为一种可能的实现方式,第一检测模块可以包括:
289.区域检测单元,用于基于第一检测模型,检测待检测图像中目标对象所在第一目标区域。
290.类别划分单元,用于根据第一目标区域对应的对象特征,从第一检测模型对应至少一个第一分类类别以及至少一个第二分类类别中,确定目标对象所属目标类别。
291.作为又一个实施例,该装置还可以包括:
292.集合确定模块,用于确定第一类别集合以及第二类别集合;其中,第一类别集合包括具有第一类别属性的至少一个第一分类类别;第二类别集合包括具有第二类别属性的至少一个第二分类类别;
293.第三确定模块,用于如果目标类别属于第一类别集合,根据第一目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果。
294.在某些实施例中,局部提取模块可以包括:
295.第一提取单元,用于如果目标类别属于第二类别集合,提取待检测图像在第一目标区域的局部图像。
296.在某些实施例中,第一提取单元可以包括:
297.第一计算子单元,用于如果目标类别属于第二类别集合,确定第一检测模型检测目标对象的第一目标区域以及目标类别对应的第一置信度;
298.第一判断子单元,用于如果第一置信度大于第一阈值,根据第一目标区域,结合目标对象所属目标类别,确定待检测图像中目标对象的检测结果;
299.第二判断子单元,用于如果第一置信度大于第二阈值且小于第一阈值,则提取待检测图像在第一目标区域的局部图像。
300.在某些实施例中,集合确定模块可以包括:
301.标注确定单元,用于确定多个标注图像;其中,任一个标注图像对应有标注对象所在的标注区域以及标注类别。
302.标注划分单元,用于将标注类别相同的标注图像划分至同一个类别图像集合中,以获得多个标注类别分别对应的类别图像集合;其中,任一个类别图像集合包括具有相同标注类别的至少一个标注图像;
303.属性确定单元,用于根据任一个标注类别对应类别图像集合中的至少一个标注图像,从第一类别属性以及第二类别属性中确定标注类别对应的目标类别属性,以获得多个标注类别分别对应的目标类别属性;
304.集合划分单元,用于将目标类别属性为第一类别属性的标注类别划分至第一类别集合以及将目标类别属性为第二类别属性的标注类别划分至第二类别集合。
305.在某些实施例中,标注区域对应有第一类别属性或者第二类别属性。
306.属性确定单元可以包括:
307.图像划分子单元,用于针对任一个标注类别对应类别图像集合中的至少一个标注图像,确定至少一个标注图像中标注区域对应第一类别属性的第一标注图像,以及标注区域对应第二类别属性的第二标注图像。
308.数量统计子单元,用于统计第一标注图像的数量,获得第一图像数量以及第二标注图像的数量,获得第二图像数量;
309.阈值判断子单元,用于判断第一图像数量与第二图像数量的比值是否大于第一比例阈值;
310.第一结果子单元,用于如果是,则确定标注类别对应第一类别属性。
311.第二结果子单元,用于如果否,则确定标注类别对应第二类别属性。
312.作为一种可能的实现方式,该装置还可以包括:
313.类别调整模块,用于针对第一类别集合中的任一个标注类别,如果标注类别的测试结果不满足测试条件,则将标注类别标记为第二类别属性,并划分至第二类别集合中。
314.在某些实施例中,类别调整模块可以包括:
315.测试确定单元,用于确定属于标注类别的多个第一测试图像;其中,多个第一测试图像对应有标注对象所在的标注区域。
316.第一测试单元,用于将多个第一测试图像分别输入第一检测模型,获得多个第一测试图像分别检测获得的目标对象所在的测试区域以及测试类别;
317.测试结果单元,用于根据多个第一测试图像各自的标注区域以及测试区域,以及多个第一测试图像各自的标注类别以及测试类别,确定多个第一测试图像对应的测试结果。
318.在一种可能的设计中,测试结果单元可以包括:
319.测试结果子单元,用于根据多个第一测试图像各自的标注区域以及测试区域,以及第一多个测试图像各自的标注类别以及测试类别,确定多个第一测试图像对应的准确率以及召回率;
320.类别调整模块具体可以用于:
321.针对第一类别集合中的任一个标注类别,确定标注类别对应的准确率以及召回
率;如果标注类别的准确率小于预设准确率阈值且标注类别的召回率小于召回率阈值,确定标注类别的测试结果不满足测试条件;将标注类别的类别属性由第一类别属性更新为第二类别属性,并将标注类别划分至第二类别集合中。
322.作为一个实施例,第一检测模型通过以下方式训练获得:
323.确定多个第一训练数据;其中,多个第一训练数据分别对应有标注对象所在的标注区域以及标注类别。标注区域对应有第一类别属性或者第二类别属性。
324.基于第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别,构建第一检测模型;
325.根据预设第一训练目标,利用多个第一训练数据训练获得第一检测模型的第一模型参数。
326.作为又一个实施例,第二检测模型通过以下方式训练获得:
327.确定多个第二训练数据;其中,多个第二训练数据分别对应有标注对象所在标注区域以及标注类别;标注区域对应有第二类别属性;
328.基于第二类别集合中至少一个第二分类类别,构建第二检测模型;
329.根据预设第二训练目标,利用多个第二训练数据训练获得第二检测模型的第二模型参数。
330.作为一个实施例,待检测图像包括多个第二测试图像;任一个第二测试图像对应有标注对象所在的标注区域以及标注类别。该装置还包括:
331.测试获取模块,用于获取多个第二测试图像分别对应的检测结果中的目标区域以及目标类别;
332.结果获取模块,用于基于多个第二测试图像分别对应的目标区域以及目标类别,结合多个第二测试图像分别对应的标注区域以及标注类别,计算获得多个第二测试图像对应的测试结果。
333.进一步,可选地,多个第二测试图像对应的测试结果包括:准确率以及召回率。
334.在某些实施例中,该装置还可以包括:
335.提示生成模块,用于根据多个第二测试图像对应的测试结果,生成测试结果提示信息。
336.信息输出模块,用于为测试用户输出测试结果提示信息。
337.作为又一个实施例,该图像确定模块还可以包括:
338.请求响应模块,用于响应于检测用户发起的检测请求,获取检测用户提供的待检测图像。
339.结果输出模块,用于为检测用户输出待检测图像的检测结果。
340.图10的目标检测装置可以执行图1所示实施例的目标检测方法,其实现原理和技术效果不再赘述。对于上述实施例中的处理组件所执行的各个模块、单元以及子单元的具体实现方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
341.在实际应用中,图10所示的装置可以配置为一计算设备,参考图11,为本技术实施例提供的一种计算设备的结构示意图,该计算设备可以包括:存储组件1101以及处理组件1102;存储组件1101用于存储一条或多条计算机指令;一条或多条计算机指令被处理组件1102调用以执行前述实施例中任一种目标检测方法。
342.其中,处理组件1102可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述实施例所提供的图像标注方法。
343.存储组件1101被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
344.当然,计算设备必然还可以包括其他部件,例如输入/输出接口、通信组件等。输入/输出接口为处理组件和外围接口模块之间提供接口,上述外围接口模块可以是输出设备、输入设备等。通信组件被配置为便于计算设备和其他设备之间有线或无线方式的通信等。
345.此外,本技术实施例还提供一种计算机可读存储介质,存储介质可以存储一条或多条计算机指令,一条或多条计算机指令执行时用以实现本技术实施例中任一种目标检测方法。
346.以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
347.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
348.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜