一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种图像中物体检测方法、装置、存储介质及终端与流程

2021-10-24 07:22:00 来源:中国专利 TAG:终端 物体 检测方法 装置 图像

技术特征:
1.一种图像中物体检测方法,其特征在于,所述方法包括:获取待检测的目标图像;将所述待检测的目标图像输入预先训练的物体检测模型中;其中,所述预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。2.根据权利要求1所述的方法,其特征在于,按照下述步骤生成预先训练的物体检测模型,包括:采集包含多种物体的图像生成模型训练样本;创建物体检测模型;从所述模型训练样本中获取第n图像输入所述物体检测模型中,输出所述图像中每个物体的第一位置信息与第一类别信息;构建所述第n图像中的目标标签;其中,所述目标标签包括第二位置信息和第二类别信息;根据所述第二位置信息确定损失函数的权重值;根据所述第一位置信息与第一类别信息、所述第二位置信息和第二类别信息、所述权重值构建所述物体检测模型的损失函数;将所述第一位置信息与第一类别信息输入所述物体检测模型的损失函数中,输出所述模型的损失值;基于所述损失值优化所述物体检测模型,生成训练后的物体检测模型;将所述训练后的物体检测模型确定为预先训练的物体检测模型。3.根据权利要求2所述的方法,其特征在于,所述预先训练的物体检测模型包括特征提取模块、分类模块与回归模块;所述从所述模型训练样本中获取第n图像输入所述物体检测模型中,输出所述图像中每个物体的第一位置信息与第一类别信息,包括:从所述模型训练样本中获取第n图像输入所述特征提取模块中,得到图像特征图;针对所述图像特征图的每个位置产生多个不同大小和长宽比的候选区域;采用所述分类模块与回归模块针对所述候选区域进行分类以及位置调整后,输出所述图像中每个物体的第一位置信息与第一类别信息。4.根据权利要求2所述的方法,其特征在于,所述第二位置信息至少包括长度与宽度;所述根据所述第二位置信息确定损失函数的权重值,包括:当所述长度大于所述宽度时,将所述长度与所述宽度的比值确定为目标比值;或者,当所述长度小于所述宽度时,将所述宽度与所述长度的比值确定为目标比值;当所述目标比值大于预设判定阈值时,将所述目标比值与预设判定阈值的比值确定为损失函数的权重值;或者,当所述目标比值小于等于预设判定阈值时,将正整数1确定为损失函数的权重值。5.根据权利要求2所述的方法,其特征在于,所述基于所述损失值优化所述物体检测模
型,生成训练后的物体检测模型,包括:根据所述损失值对所述物体检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及所述局部梯度序列对所述物体检测模型进行迭代优化;当所述迭代优化的优化次数等于预设上限值或者所述损失值小于预设阈值时,停止所述模型的优化;生成训练后的物体检测模型。6.根据权利要求5所述的方法,其特征在于,所述当所述迭代优化的优化次数等于预设上限值或者所述损失值小于预设阈值时,停止所述模型的优化,包括:当所述迭代优化的优化次数小于预设上限值或者所述损失值大于等于预设阈值时,继续执行从所述模型训练样本中获取第n 1图像输入所述物体检测模型中的步骤,并当所述n 1大于所述模型训练样本的数量时,对所述模型训练样本中图像的顺序进行随机排列后,并重置n=1。7.根据权利要求1所述的方法,其特征在于,所述根据所述多个类别概率值确定出所述各物体的最终类别,包括:选择所述多个类别概率值中的最大概率值;识别所述选择的最大概率值对应的类别;将所述最大概率值对应的类别确定为所述各物体的最终类别。8.一种图像中物体检测装置,其特征在于,所述装置包括:图像获取模块,用于获取待检测的目标图像;图像输入模块,用于将所述待检测的目标图像输入预先训练的物体检测模型中;其中,所述预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出模块,用于输出所述目标图像中各物体的位置与多个类别概率值;最终类别确定模块,用于根据所述多个类别概率值确定出所述各物体的最终类别。9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~7任意一项的方法步骤。10.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~7任意一项的方法步骤。

技术总结
本发明公开了一种图像中物体检测方法、装置、存储介质及终端,方法包括:获取待检测的目标图像;将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出目标图像中各物体的位置与多个类别概率值;根据多个类别概率值确定出各物体的最终类别。因此,由于本申请通过物体的长宽比值来确定权重值,并采用该权重值增加大长宽比例物体的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。性能。性能。


技术研发人员:廖丹萍
受保护的技术使用者:浙江智慧视频安防创新中心有限公司
技术研发日:2021.07.14
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜