一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

对象检测方法、系统及计算机存储介质与流程

2022-12-07 03:35:21 来源:中国专利 TAG:


1.本技术实施例涉及图像识别领域,特别涉及一种对象检测方法、装置及计算机存储介质。


背景技术:

2.在许多图像检测场景中,在进行目标对象的识别前,需要先进行对象检测。目前的检测模型主要分为两种方式:
3.第一种方式主要包括:首先定位图像中的检测目标,再针对定位好的检测目标进行检测,然而,此二步法的检测方式存在对象检测速度较慢的问题。
4.第二种方式则是将对象检测和对象识别任务合并在一起完成,此检测方式的缺点在于:只能识别图像中的特定对象类别,无法通过特征比对的方式进行对象识别。
5.有鉴于此,亟需一种对象检测技术,不仅可确保对象检测结果的准确性,亦可提高对象检测效率。


技术实现要素:

6.鉴于上述问题,本技术提供一种对象检测方法、装置及计算机存储介质,可提高对象检测结果的准确性并提高检测效率。
7.本技术第一方面提供一种对象检测方法,包括:基于多个预设尺度,针对待检测图像执行特征提取,获取每一个预设尺度的尺度特征;根据每一个预设尺度的门控系数,融合每一个尺度特征并预测,获得所述待检测图像的对象检测结果。
8.本技术第二方面提供一种对象检测装置,包括:特征提取模块,用于基于多个预设尺度,针对待检测图像执行特征提取,获取每一个预设尺度的尺度特征;预测模块,用于根据每一个预设尺度的门控系数,融合每一个尺度特征并预测,获得所述待检测图像的对象检测结果。
9.本技术第三方面提供一种计算机存储介质,其特征在于,所述计算机存储介质中存储有用于执行上述第一方面所述的方法中各步骤的各指令。
10.综上所述,本技术各方面提供的对象检测方法、装置及计算机存储介质,通过提取待检测图像对应于不同预设尺度的尺度特征,并基于各预设尺度的门控系数,融合不同的尺度特征,据以针对待检测图像执行对象检测。借此,本技术可权衡不同尺度特征中包含侧重信息,有效获取检测对象的语义信息和位置信息,可提高对象检测结果的准确性,并提升对象检测处理效率。
附图说明
11.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获
得其他的附图。
12.图1为本技术示例性实施例的对象检测方法的处理流程图。
13.图2为本技术另一示例性实施例的对象检测方法的处理流程图。
14.图3为本技术另一示例性实施例的对象检测方法的处理流程图。
15.图4为本技术示例性实施例的对象检测装置的结构框图。
具体实施方式
16.为了使本领域的人员更好地理解本技术实施例中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术实施例一部分实施例,而不是全部的实施例。基于本技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本技术实施例保护的范围。
17.目前的人脸识别算法包括检测和识别两个步骤,第一步,通过检测模型检测出目标区域中的目标人物,然后通过识别模型获得目标人物的特征,并与底库注册的特征进行比对,完成识别过程。
18.目前人脸识别算法的主要难点在于,检测模型无法有效地区分待检测区中的目标物和背景物,导致对象检测处理效率不高。
19.有鉴于此,本技术提出一种对象检测方案,以改善现有技术中的技术问题。
20.以下将结合各附图详细描述本技术的各具体实施例:
21.图1为本技术示例性实施例的对象检测方法的处理流程图。如图所示,本实施例主要包括以下步骤:
22.步骤s102,基于多个预设尺度,针对待检测图像执行特征提取,获取每一个预设尺度的尺度特征。
23.具体地,可利用具有不同卷积核的特征提取模块,基于不同的预设尺度,执行不同阶段的特征提取。
24.可选地,基于各预设尺度、给定的尺度划分规则,确定各预设尺度中的至少一个第一尺度和至少一个第二尺度,并基于确定的至少一个第一尺度,针对待检测图像中的目标对象执行特征提取,获取包含目标对象的位置信息的第一维度特征,基于确定的至少一个第二尺度,针对待检测图像中的目标对象执行特征提取,获取包含目标对象的语义信息的第二维度特征。
25.于本实施例中,第二尺度的特征维度高于第一尺度的特征维度。
26.可选地,可根据预设尺度的数量、实际检测需求、待检测图像的图像信息中的至少一个因素,确定尺度划分规则。
27.例如,在预设尺度包含有四个的情况下,可根据实际检测需求和/或待检测图像的图像信息,将特征维度最低的一个预设尺度确定为第一尺度,并将特征维度较高的三个预设尺度确定为第二尺度;或者,将特征维度相对较低的二个预设尺度确定为第一尺度,并将特征维度较高的二个预设尺度确定为第二尺度;或者,也可将特征维度最高的一个预设尺度确定为第二尺度,并将特征维度较低的三个预设尺度确定为第一尺度。其中,在特征维度较低的第一维度特征中包含有丰富的位置信息,在特征维度较高的第二维度特征中包含有丰富的语义信息。
28.步骤s104,根据每一个预设尺度的门控系数,融合每一个尺度特征并预测,获得待检测图像的对象检测结果。
29.可选地,可根据第一尺度的门控系数、第二尺度的门控系统,融合第一维度特征与第二维度特征,获得待检测图像的融合特征,并根据融合特征中的目标对象的位置信息和语义信息执行检测,获得待检测图像的对象检测结果。
30.于本实施例中,所检测的目标对象至少包括人物对象。
31.综上所述,本实施例提供的对象检测方法,通过将不同尺度的特征进行融合,使得融合后的特征既包括位置信息也包含语义信息,借以提高对象检测结果的准确性。
32.再者,通过设定不同预设尺度的权重系数(门控系统),能够有效去除待检测图像中的背景信息,以基于待检测图像中的主体目标信息进行对象检测,不仅有助于提高对象检测结果的准确性,还可提高对象检测效率。
33.图2为本技术另一示例性实施例的对象检测方法的处理流程图。本实施例示出了各预设尺度的门控系数的一种具体获取方案,其主要包括:
34.步骤s202,根据每一个预设尺度的门控系数,融合样本图像对应于每一个预设尺度的尺度特征,获得样本图像的融合特征。
35.于本实施例中,可根据每一个预设尺度的门控系数,对各预设尺度的各尺度特征进行拼接,获得样本图像的融合特征。
36.于本实施例中,每一个预设尺度的门控系数的初始值可设定为1。
37.可选地,可对各预设尺度进行任意组合,确定多个组合,并针对每一个组合中各预设尺度对应的各尺度特征进行拼接,获得样本图像对应于每一个组合的融合特征。
38.步骤s204,利用预测模型,根据融合特征执行预测,获得样本图像的预测结果。
39.可选地,可基于样本图像的至少一个融合特征,对样本图像中的样本对象执行预测,获得样本对象的预测结果。
40.步骤s206,根据样本图像的预测结果和样本标签,获得预测模型的损失值。
41.可选地,可将样本图像的预测结果与样本标签进行比对,基于比对结果确定预测模型的损失值。
42.步骤s208,判断损失值是否满足预设更新结束条件,若满足,结束本流程,若不满足,执行步骤s210。
43.可选地,可当损失值的变化趋势满足预期时,获得损失值满足预设更新结束条件的判断结果。
44.可选地,可当每一个预设尺度的门控系数的迭代次数,满足预设迭代阈值时,获得损失值满足预设更新结束条件的判断结果。
45.步骤s210,根据损失值迭代更新每一个预设尺度的门控系数,并返回步骤s202。
46.图3示出了本实施例另一示例性实施例的对象检测方法的处理流程图。本实施例示出了各预设尺度的门控系数的另一种具体获取方案,其主要包括:
47.步骤s302,随机生成正态分布向量。
48.可选地,根据预设均值和预设标准差,随机生成正态分布向量。
49.示例性地,预设均值可设定为0,预设标准差可设定为0.1。
50.步骤s304,基于当前生成的正态分布向量,调整每一个预设尺度的当前门控系数,
获得每一个预设尺度的调整门控系数。
51.可选地,可将每一个预设尺度的门控系数的初始值设定为0.5。
52.但并不以此为限,本领域技术人员可根据实际需求进行调整每一个预设尺度的门控系数的初始值,本技术对此不作限制。
53.可选地,可基于绝对增加法,根据当前生成的正态分布向量和每一个预设尺度的当前门控系数,获得每一个预设尺度的调整门控系数。
54.例如,调整门控系数=正态分布向量值 当前门控系数
55.可选地,可基于相对增加法,根据当前生成的正态分布向量和每一个预设尺度的当前门控系数,获得每一个预设尺度的调整门控系数。
56.例如,调整门控系数=当前门控系数*(1 正态分布向量值)
57.步骤s306,根据每一个预设尺度的调整门控系数,融合样本图像对应于每一个预设尺度的尺度特征,获得样本图像的融合特征。
58.于本实施例中,可根据每一个预设尺度的调整门控系数,对各预设尺度的各尺度特征进行拼接,获得样本图像的融合特征。
59.可选地,可对各预设尺度进行任意组合,确定多个组合,并针对每一个组合中各预设尺度对应的各尺度特征进行拼接,获得样本图像对应于每一个组合的融合特征。
60.步骤s308,利用预测模型,根据融合特征执行预测,获得样本图像的预测结果。
61.可选地,可基于样本图像的至少一个融合特征,对样本图像中的样本对象执行预测,获得样本对象的预测结果。
62.步骤s310,根据样本图像的预测结果和样本标签,获得预测模型的损失值。
63.可选地,可将样本图像的预测结果与样本标签进行比对,基于比对结果确定预测模型的损失值。
64.步骤s312,判断损失值是否满足预设更新结束条件,若满足,结束本流程,若不满足,执行步骤s314。
65.可选地,可当损失值的变化趋势满足预期时,获得损失值满足预设更新结束条件的判断结果。
66.可选地,可当每一个预设尺度的门控系数的迭代次数,满足预设迭代阈值时,获得损失值满足预设更新结束条件的判断结果。
67.步骤s314,判断损失值是否满足预设优化条件,若不满足,返回步骤s302,若满足,进行步骤s316。
68.可选地,可比对样本图像的当前损失值和历史损失值,若当前损失值大于或等于历史损失值,获得损失值不满足预设优化条件,反之,若当前损失值小于历史损失值,获得损失值满足预设优化条件。
69.具体地,若损失值不满足预设优化条件,直接返回步骤s302,以放弃当前的调整门控系数,并重新进行门控系统的优化调整。
70.步骤s316,将每一个预设尺度的调整门控系数确定为每一个预设尺度的当前门控系数,并返回步骤s302。
71.具体地,若损失值满足预设优化条件,代表当前的调整门控系数是有效的,可将调整门控系数确定为当前门控系数,并返回步骤s302,以在当前的调整门控系数的基础上,继
续执行门控系统的优化调整。
72.综上所述,本技术可利用多种不同方案执行门控系数的优化调整,以适用于不同的应用场景,且所获得的优化好的各门控系数能够很好地权衡不同尺度特征之间的侧重之处,以有效去除待检测图像中的背景影响,以准确且高效地获取待检测图像中的主体目标的位置信息和语义信息,从而提高对象检测结果的准确性并提高对象检测效率。
73.图4为本技术示例性实施例的对象检测装置的结构框图。如图所示,本实施例的对象检测装置400主要包括:特征提取模块402、预测模块404。
74.特征提取模块402,用于基于多个预设尺度,针对待检测图像执行特征提取,获取每一个预设尺度的尺度特征。
75.预测模块404,用于根据每一个预设尺度的门控系数,融合每一个尺度特征并预测,获得所述待检测图像的对象检测结果。
76.可选地,特征提取模块402还用于:基于各预设尺度、给定的尺度划分规则,确定各预设尺度中的至少一个第一尺度和至少一个第二尺度;根据所述至少一个第一尺度,针对所述待检测图像中的目标对象执行特征提取,获取包含所述目标对象的位置信息的第一维度特征;基于所述至少一个第二尺度,针对所述待检测图像中的目标对象执行特征提取,获取包含所述目标对象的语义信息的第二维度特征;其中,所述第二尺度的特征维度高于所述第一尺度的特征维度。
77.可选地,预测模块404还用于,根据所述第一尺度的门控系数、所述第二尺度的门控系统,融合所述第一维度特征与所述第二维度特征,获得所述待检测图像的融合特征;根据所述融合特征中包含的位置信息和语义信息执行检测,获得所述待检测图像的对象检测结果。
78.可选地,对象检测装置400还包括优化模块(未示出),用于执行融合步骤,根据每一个预设尺度的门控系数,融合样本图像对应于每一个预设尺度的尺度特征,获得所述样本图像的融合特征;利用预测模型,根据所述融合特征执行预测,获得所述样本图像的预测结果;根据所述样本图像的预测结果和样本标签,获得所述预测模型的损失值;根据所述损失值迭代更新每一个预设尺度的门控系数,并返回所述融合步骤,直至所述损失值满足预设更新结束条件。
79.可选地,优化模块还用于将每一个预设尺度的门控系数的初始值设定为1。
80.可选地,优化模块还用于:随机生成正态分布向量;基于当前生成的正态分布向量,调整每一个预设尺度的当前门控系数,获得每一个预设尺度的调整门控系数;根据每一个预设尺度的调整门控系数,融合样本图像对应于每一个预设尺度的尺度特征,获得所述样本图像的融合特征;利用预测模型,根据所述融合特征执行预测,获得所述样本图像的预测结果;根据所述样本图像的预测结果和样本标签,获得所述预测模型的损失值;其中,在所述损失值不满足预设更新结束条件的情况下,若所述损失值不满足预设优化条件,返回执行所述随机生成正态分布向量的步骤,若所述损失值满足所述优化条件,将每一个预设尺度的调整门控系数确定为每一个预设尺度的当前门控系数,并返回执行所述随机生成正态分布向量的步骤。
81.可选地,优化模块还用于:根据预设均值和预设标准差,随机生成正态分布向量;其中,所述预设均值为0,所述预设标准差为0.1。
82.可选地,优化模块还用于将每一个预设尺度的门控系数的初始值设定为0.5。
83.可选地,优化模块还用于:比对所述样本图像的当前损失值和历史损失值;若所述当前损失值大于或等于所述历史损失值,获得所述损失值不满足预设优化条件;若所述当前损失值小于所述历史损失值,获得所述损失值满足预设优化条件。
84.可选地,优化模块还用于:当所述损失值的变化趋势满足预期时,获得所述损失值满足预设更新结束条件的判断结果;或者当每一个预设尺度的门控系数的迭代次数,满足预设迭代阈值时,获得所述损失值满足预设更新结束条件的判断结果。
85.本技术还提供一种计算机存储介质,所述计算机存储介质中存储有用于执行上述各实施例所述的对象检测方法中各步骤的各指令。
86.综上所述,本技术各实施例提供的对象检测方案,通过获取待检测图像对应于不同预设尺度的尺度特征,并基于各预设尺度的门控系统,融合各个尺度特征,可有效去除待检测图像中的背景影响,以准确获取检测对象的位置信息和语义信息,从而提高对象检测结果的准确性,并提高对象检测效率。
87.最后应说明的是:以上实施例仅用以说明本技术实施例的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献