一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种图像中物体检测方法、装置、存储介质及终端与流程

2021-10-24 07:22:00 来源:中国专利 TAG:终端 物体 检测方法 装置 图像


1.本发明涉及计算机视觉技术领域,特别涉及一种图像中物体检测方法、装置、存储介质及终端。


背景技术:

2.图像中物体检测是计算机视觉和数字图像处理的重要研究方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。图像中物体检测的目标是找出图像中感兴趣的对象,包含物体定位和物体分类两个子任务,即同时确定物体的类别和位置。
3.在现有技术中,利用神经网络结合大量图片数据进行训练的物体检测模型已经成为行业的主流模型训练方式。基于神经网络的算法基本上可以归为两类:以faster r

cnn为代表的两阶段算法和以yolo、ssd等为代表的一阶段算法。不论是一阶段算法或者两阶段算法,对于检测长宽比例大于一定值的长条形物体,例如滑雪板,铅笔,等,相比检测长宽比较小的物体,如足球、汽车等,性能有很大程度的下降。一些情况中网络不能检测出长宽比例大于一定值的物体,另一些情况中虽然网络可以检测出长宽比例大于一定值的物体,但是物体位置不够准确。
4.导致这个现象的原因之一是由于长宽比大于一定值的物体占整个数据集包含的目标的比重较小。训练模型时,模型未将长宽比例大于一定值的物体作为优化重点,导致模型不能很好地学习到长宽比例大于一定值的物体的特征,进而无法对图像中的长宽比例大于一定值的物体进行正确分类,或者无法准确定位其位置。


技术实现要素:

5.本技术实施例提供了一种图像中物体检测方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
6.第一方面,本技术实施例提供了一种图像中物体检测方法,方法包括:获取待检测的目标图像;将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出目标图像中各物体的位置与多个类别概率值;根据多个类别概率值确定出各物体的最终类别。
7.可选的,按照下述步骤生成预先训练的物体检测模型,包括:采集包含多种物体的图像生成模型训练样本;创建物体检测模型;从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息;
构建第n图像中的目标标签;其中,目标标签包括第二位置信息和第二类别信息;根据第二位置信息确定损失函数的权重值;根据第一位置信息与第一类别信息、第二位置信息和第二类别信息、权重值构建物体检测模型的损失函数;将第一位置信息与第一类别信息输入物体检测模型的损失函数中,输出模型的损失值;基于损失值优化物体检测模型,生成训练后的物体检测模型;将训练后的物体检测模型确定为预先训练的物体检测模型。
8.可选的,预先训练的物体检测模型包括特征提取模块、分类模块与回归模块;从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息,包括:从模型训练样本中获取第n图像输入特征提取模块中,得到图像特征图;针对图像特征图的每个位置产生多个不同大小和长宽比的候选区域;采用分类模块与回归模块针对候选区域进行分类以及位置调整后,输出图像中每个物体的第一位置信息与第一类别信息。
9.可选的,第二位置信息至少包括长度与宽度;根据第二位置信息确定损失函数的权重值,包括:当长度大于宽度时,将长度与宽度的比值确定为目标比值;或者,当长度小于宽度时,将宽度与长度的比值确定为目标比值;当目标比值大于预设判定阈值时,将目标比值与预设判定阈值的比值确定为损失函数的权重值;或者,当目标比值小于等于预设判定阈值时,将正整数1确定为损失函数的权重值。
10.可选的,基于损失值优化物体检测模型,生成训练后的物体检测模型,包括:根据损失值对物体检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及局部梯度序列对物体检测模型进行迭代优化;当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化;生成训练后的物体检测模型。
11.可选的,当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化,包括:当迭代优化的优化次数小于预设上限值或者损失值大于等于预设阈值时,继续执行从模型训练样本中获取第n 1图像输入物体检测模型中的步骤,并当n 1大于模型训练样本的数量时,对模型训练样本中图像的顺序进行随机排列后,并重置n=1。
12.可选的,根据多个类别概率值确定出各物体的最终类别,包括:选择多个类别概率值中的最大概率值;识别选择的最大概率值对应的类别;将最大概率值对应的类别确定为各物体的最终类别。
13.第二方面,本技术实施例提供了一种图像中物体检测装置,装置包括:图像获取模块,用于获取待检测的目标图像;图像输入模块,用于将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出模块,用于输出目标图像中各物体的位置与多个类别概率值;最终类别确定模块,用于根据多个类别概率值确定出各物体的最终类别。
14.第三方面,本技术实施例提供一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述的方法步骤。
15.第四方面,本技术实施例提供一种终端,可包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述的方法步骤。
16.本技术实施例提供的技术方案可以包括以下有益效果:在本技术实施例中,图像中物体检测装置首先获取待检测的目标图像,然后将待检测的目标图像输入预先训练的物体检测模型中,其中预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的,再输出目标图像中各物体的位置与多个类别概率值,最后根据多个类别概率值确定出各物体的最终类别。由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
17.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
18.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
19.图1是本技术实施例提供的一种图像中物体检测方法的流程示意图;图2是本技术实施例提供的一种物体检测模型的训练方法的流程示意图;图3是本技术实施例提供的一种图像中物体检测装置的结构示意图;图4是本技术实施例提供的一种终端的结构示意图。
具体实施方式
20.以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
21.应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
22.下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法
的例子。
23.在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
24.本技术提供了一种图像中物体检测方法、装置、存储介质及终端,以解决上述相关技术问题中存在的问题。本技术提供的技术方案中,由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能,下面采用示例性的实施例进行详细说明。
25.下面将结合附图1

附图2,对本技术实施例提供的图像中物体检测方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的图像中物体检测装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。其中,本技术实施例中的图像中物体检测装置可以为用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、5g网络或未来演进网络中的终端设备等。
26.请参见图1,为本技术实施例提供了一种图像中物体检测方法的流程示意图。如图1所示,本技术实施例的方法可以包括以下步骤:s101,获取待检测的目标图像;其中,待检测的目标图像是用来测试预先训练的物体检测模型性能的图像或者预先训练的物体检测模型应用在检测场景时接收到的图像。
27.通常,当待检测的目标图像是用来测试预先训练的物体检测模型性能的图像时,待检测的目标图像可以是从测试样本中获取的,也可以是从用户终端里获取到的图像,还可以是从云端下载到的图像。当待检测的目标图像是预先训练的物体检测模型应用在检测应用场景时获取到的图像时,待检测的图像可以是通过图像采集设备实时采集的图像。
28.在一种可能的实现方式中,当物体检测模型训练后,并将训练完成的物体检测模型部署在实际应用场景时,物体传感器或者物体监测算法当检测到有物体进入摄像头监视区域后,触发图像采集摄像的拍照功能采集进入监视区域的目标图像,最后将目标图像确定为待检测的目标图像。
29.在另一种可能的实现方式中,当物体检测模型训练后,需要检测训练完成的物体检测模型的图像中物体检测性能时,用户通过用户终端从样本测试集或者本地图库或者云端下载任何一个携带物体的图像,将该图像确定为待检测的目标图像。
30.s102,将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确
定出权重值后加权生成的。预先训练的物体检测模型是可以对待检测图像进行物体识别的数学模型,该模型可以识别出图像中的不同长宽比例的物体位置与类别。
31.在本技术实施例中,在生成预先训练的物体检测模型时,首先采集包含多种物体的图像生成模型训练样本,然后创建物体检测模型,再从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息,其次构建第n图像中的目标标签;其中,目标标签包括第二位置信息和第二类别信息,并根据第二位置信息确定损失函数的权重值,再根据第一位置信息与第一类别信息、第二位置信息和第二类别信息、权重值构建物体检测模型的损失函数,再将第一位置信息与第一类别信息输入物体检测模型的损失函数中,输出模型的损失值,并基于损失值优化物体检测模型,生成训练后的物体检测模型,最后将训练后的物体检测模型确定为预先训练的物体检测模型。
32.在一种可能的实现方式中,在根据步骤s101获取到待检测的目标图像后,此时将该目标图像输入预先训练的物体检测模型中,该模型根据训练后的生成文件进行处理。
33.s103,输出目标图像中各物体的位置与多个类别概率值;其中,概率值是代表该图像中各物体所属类别的类别概率分布。
34.在一种可能的实现方式中,当基于步骤s102使用预先训练的物体检测模型进行处理后,会得到各物体的位置坐标以及多个类别的概率值,最后预先训练的物体检测模型将各物体的位置坐标以及多个类别的概率值进行输出,输出后得到目标图像中各物体的位置与多个类别概率值。
35.s104,根据多个类别概率值确定出各物体的最终类别。
36.在一种可能的实现方式中,在根据多个类别概率值确定出各物体的最终类别时,首先选择多个类别概率值中的最大概率值,然后识别选择的最大概率值对应的类别,最后将最大概率值对应的类别确定为各物体的最终类别。
37.在本技术实施例中,图像中物体检测装置首先获取待检测的目标图像,然后将待检测的目标图像输入预先训练的物体检测模型中,其中预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的,再输出目标图像中各物体的位置与多个类别概率值,最后根据多个类别概率值确定出各物体的最终类别。由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
38.请参见图2,为本技术实施例提供了一种物体检测模型的训练方法的流程示意图。如图2所示,物体检测模型的训练方法包括以下步骤:s201,采集包含多种物体的图像生成模型训练样本;s202,创建物体检测模型;通常,在创建物体检测模型时,可以是一阶段模型如ssd,yolo等, 也可以是二阶段模型,如faster r

cnn,具体模型根据实际情况进行确定,此处不做限定。
39.s203,从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息;其中,预先训练的物体检测模型包括特征提取模块、分类模块与回归模块。
40.在一种可能的实现方式中,首先从模型训练样本中获取第n图像输入特征提取模
块中,得到图像特征图,然后针对图像特征图的每个位置产生多个不同大小和长宽比的候选区域,最后采用分类模块与回归模块针对候选区域进行分类以及位置调整后,输出图像中每个物体的第一位置信息与第一类别信息。
41.s205,构建第n图像中的目标标签;其中,目标标签包括第二位置信息和第二类别信息;在一种可能的实现方式中,构建第n图像中包含的目标标签。目标标签包含位置信息和分类信息。其中,目标的位置信息包含目标的长w和宽h以及中心点位置(x,y);目标的类别信息指定了目标所属的类别,用独热向量来表示。目标所属的那一类为1,其余为0。例如,[0,1,0,0]表示目标属于第二类别。
[0042]
s206,根据第二位置信息确定损失函数的权重值;其中,第二位置信息至少包括长度与宽度。
[0043]
在本技术实施例中,在构建权重值时,首先判断长度与宽度那个是较大值,当长度大于宽度时,确定长度为较大值,此时将长度与宽度的比值确定为目标比值。或者,当长度小于宽度时,确定宽度为较大值,此时将宽度与长度的比值确定为目标比值,并当目标比值大于预设判定阈值时,将目标比值与预设判定阈值的比值确定为损失函数的权重值。或者当目标比值小于等于预设判定阈值时,将正整数1确定为损失函数的权重值。
[0044]
优选的,预设判定阈值为8。
[0045]
在一种可能的实现方式中,可根据第二位置信息包括的长度与宽度计算目标比值。目标比值可以定义为:,为在w和h中取较大值,为在w和h中取较小值。
[0046]
进一步地,根据目标比值可以确定出损失函数的所需权重值,若大于预设判定阈值r时,则为目标比值与预设判定值r的比值,若小于等于预设判定阈值r时,则为1。
[0047]
具体的,可用公式表示为:。
[0048]
s207,根据第一位置信息与第一类别信息、第二位置信息和第二类别信息、权重值构建物体检测模型的损失函数;具体的,构建的损失函数为:
其中,表示候选区域的索引号。表示物体检测模型关于这个区域的输出类别,表示这个区域对应的真实类别,即目标标签中的类别。表示物体检测模型对这个区域的输出位置信息,表示这个区域对应目标的真实位置信息。表示候选目标是否为正样本,即是否与一个或者多个真实目标相匹配。当候选区域是正样本,=1。否则=0,。当候选区域是正样本时,候选区域的长宽比权重为,由权重值公式计算得出。当候选区域为背景区域,即候选区域不对应任何真实目标时,设置成0。表示分类的损失,可以根据任务需要设计优选交叉熵损失。表示位置的损失,优选smooth

l1损失或者各类基于iou的损失。代表正样本和负样本的数量之和,代表负样本的数量。是平衡分类损失和位置损失的权重。
[0049]
在本技术实施例中,通过增大长宽比例大的物体的损失权重,该损失函数引导模型着重优化大长宽比目标的检测。
[0050]
s208,将第一位置信息与第一类别信息输入物体检测模型的损失函数中,输 出模型的损失值;在一种可能的实现方式中,在根据步骤s207得到损失函数后,可将输入模 型中得到的第一位置信息t
i
与第一类别信息p
i
作为变量输入损失函数中进行 计算后,得到模型当前的损失值。
[0051]
s209,基于损失值优化物体检测模型,生成训练后的物体检测模型;在一种可能的实现方式中,在基于损失值优化物体检测模型时,首先根据损失值对物体检测模型的参数进行求导,生成局部梯度序列,然后采用随机梯度下降算法以及局部梯度序列对物体检测模型进行迭代优化,最后当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化,并生成训练后的物体检测模型。
[0052]
进一步地,当迭代优化的优化次数小于预设上限值或者损失值大于等于预设阈值时,继续执行从模型训练样本中获取第n 1图像输入物体检测模型中的步骤,并当n 1大于模型训练样本的数量时,对模型训练样本中图像的顺序进行随机排列后,并重置n=1。
[0053]
s210,将训练后的物体检测模型确定为预先训练的物体检测模型。
[0054]
在本技术实施例中,图像中物体检测装置首先获取待检测的目标图像,然后将待检测的目标图像输入预先训练的物体检测模型中,其中预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的,再输出目标图像中各物
体的位置与多个类别概率值,最后根据多个类别概率值确定出各物体的最终类别。由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型大长宽比例物体的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
[0055]
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
[0056]
请参见图3,其示出了本发明一个示例性实施例提供的图像中物体检测装置的结构示意图。该图像中物体检测装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括图像获取模块10、图像输入模块20、输出模块30、最终类别确定模块40。
[0057]
图像获取模块10,用于获取待检测的目标图像;图像输入模块20,用于将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出模块30,用于输出目标图像中各物体的位置与多个类别概率值;最终类别确定模块40,用于根据多个类别概率值确定出各物体的最终类别。
[0058]
需要说明的是,上述实施例提供的图像中物体检测装置在执行图像中物体检测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像中物体检测装置与图像中物体检测方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
[0059]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0060]
在本技术实施例中,图像中物体检测装置首先获取待检测的目标图像,然后将待检测的目标图像输入预先训练的物体检测模型中,其中预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的,再输出目标图像中各物体的位置与多个类别概率值,最后根据多个类别概率值确定出各物体的最终类别。由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
[0061]
本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的图像中物体检测方法。
[0062]
本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例的图像中物体检测方法。
[0063]
请参见图4,为本技术实施例提供了一种终端的结构示意图。如图4所示,终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
[0064]
其中,通信总线1002用于实现这些组件之间的连接通信。
[0065]
其中,用户接口1003可以包括显示屏(display)、摄像头(camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
[0066]
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。
[0067]
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field

programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
[0068]
其中,存储器1005可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read

only memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non

transitory computer

readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像中物体检测应用程序。
[0069]
在图4所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的图像中物体检测应用程序,并具体执行以下操作:获取待检测的目标图像;将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出目标图像中各物体的位置与多个类别概率值;根据多个类别概率值确定出各物体的最终类别。
[0070]
在一个实施例中,处理器1001在执行根据多个类别概率值确定出各物体的最终类别时,具体执行以下操作:选择多个类别概率值中的最大概率值;识别选择的最大概率值对应的类别;将最大概率值对应的类别确定为各物体的最终类别。
[0071]
在一个实施例中,处理器1001在生成预先训练的物体检测模型时,具体执行以下操作:采集包含多种物体的图像生成模型训练样本;创建物体检测模型;从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第
一位置信息与第一类别信息;构建第n图像中的目标标签;其中,目标标签包括第二位置信息和第二类别信息;根据第二位置信息确定损失函数的权重值;根据第一位置信息与第一类别信息、第二位置信息和第二类别信息、权重值构建物体检测模型的损失函数;将第一位置信息与第一类别信息输入物体检测模型的损失函数中,输出模型的损失值;基于损失值优化物体检测模型,生成训练后的物体检测模型;将训练后的物体检测模型确定为预先训练的物体检测模型。
[0072]
在一个实施例中,处理器1001在执行从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息时,具体执行以下操作:从模型训练样本中获取第n图像输入特征提取模块中,得到图像特征图;针对图像特征图的每个位置产生多个不同大小和长宽比的候选区域;采用分类模块与回归模块针对候选区域进行分类以及位置调整后,输出图像中每个物体的第一位置信息与第一类别信息。
[0073]
在一个实施例中,处理器1001在执行根据第二位置信息确定损失函数的权重值时,具体执行以下操作:当长度大于宽度时,将长度与宽度的比值确定为目标比值;或者,当长度小于宽度时,将宽度与长度的比值确定为目标比值;当目标比值大于预设判定阈值时,将目标比值与预设判定阈值的比值确定为损失函数的权重值;或者,当目标比值小于等于预设判定阈值时,将正整数1确定为损失函数的权重值。
[0074]
在一个实施例中,处理器1001在执行基于损失值优化物体检测模型,生成训练后的物体检测模型时,具体执行以下操作:根据损失值对物体检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及局部梯度序列对物体检测模型进行迭代优化;当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化;生成训练后的物体检测模型。
[0075]
在一个实施例中,处理器1001在执行当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化时,具体执行以下操作:当迭代优化的优化次数小于预设上限值或者损失值大于等于预设阈值时,继续执行从模型训练样本中获取第n 1图像输入物体检测模型中的步骤,并当n 1大于模型训练样本的数量时,对模型训练样本中图像的顺序进行随机排列后,并重置n=1。
[0076]
在本技术实施例中,图像中物体检测装置首先获取待检测的目标图像,然后将待检测的目标图像输入预先训练的物体检测模型中,其中预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的,再输出目标图像中各物
体的位置与多个类别概率值,最后根据多个类别概率值确定出各物体的最终类别。由于通过物体的长宽比值来确定权重值,并采用该权重值增加模型的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
[0077]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
[0078]
以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜