一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种目标对象确定方法及装置、电子设备和存储介质与流程

2022-05-18 11:52:42 来源:中国专利 TAG:

技术特征:
1.一种目标对象确定方法,其特征在于,包括:获取输入特征,所述输入特征包括输入图像或对所述输入图像进行至少一次卷积操作得到的特征;获取所述输入图像中目标对象的尺寸信息;基于所述尺寸信息和所述输入特征,确定卷积核在所述输入特征中采样时采样点的位置偏移量;基于所述位置偏移量调整后的卷积核,对所述输入特征进行卷积操作,得到输出特征,所述输出特征用于确定所述输入图像中的目标对象。2.根据权利要求1所述方法,其特征在于,在存在至少两个目标对象的尺寸信息的情况下,所述获取所述输入图像中目标对象的尺寸信息,包括:将获取到的所述至少两个目标对象的尺寸信息的平均值,作为所述目标对象在所述输入图像中的尺寸信息。3.根据权利要求1-2所述方法,其特征在于,所述基于所述尺寸信息和所述输入特征,确定卷积核在所述输入特征中采样时采样点的位置偏移量,包括:将所述尺寸信息与所述输入特征进行融合,得到融合特征;基于所述融合特征,确定卷积核在所述输入特征中采样时采样点的位置偏移量。4.根据权利要求3所述方法,其特征在于,所述将所述尺寸信息与所述输入特征进行融合,得到融合特征,包括:对所述尺寸信息进行非线性变换操作,得到表征所述尺寸信息的尺寸特征;对所述输入特征进行卷积操作,得到卷积输入特征;将所述尺寸特征与所述卷积输入特征进行融合,得到融合特征。5.根据权利要求1-4任一所述方法,其特征在于,所述方法还包括:基于所述输出特征,确定所述输入图像中的目标对象的数量和/或位置。6.根据权利要求1-5任一所述方法,其特征在于,所述目标对象确定方法基于神经网络实现,所述神经网络的训练样本和/或测试样本的构建方法包括:根据第一样本图像的标注信息,得到目标对象的至少一个目标子图;将所述目标子图粘贴到第二样本图像中,得到合成图像以及所述目标子图在所述合成图像中的粘贴位置信息;将所述粘贴位置信息作为合成图像中的标注信息,生成合成样本图像。7.根据权利要求6所述方法,其特征在于,所述根据第一样本图像的标注信息,得到目标对象的至少一个目标子图,包括:提取所述标注信息对应的目标区域中的图像,作为目标子图;和/或,对所述标注信息对应的目标区域中的图像分别进行至少一次图像变换,将图像变换后的图像作为目标子图。8.根据权利要求6或7所述方法,其特征在于,在根据第一样本图像的标注信息,得到目标对象的至少一个目标子图前,所述方法还包括:根据所述目标区域的尺寸信息,以及所述第二样本图像的尺寸信息,确定要生成的目标子图的第一数量;其中,所述目标子图的第一数量与所述第二样本图像的尺寸信息正相关、与所述目标区域的尺寸信息负相关。
9.根据权利要求8所述方法,其特征在于,在确定要生成的目标子图的数量后,所述对所述标注信息对应的目标区域中的图像分别进行至少一次图像变换,包括:根据所述第一数量,对所述目标区域中的图像分别进行至少一次图像变换,得到所述第一数量的目标子图;所述图像变换包括下述至少之一:图像拉伸、图像收缩、图像选择、图像对称变换、在图像中添加噪声。10.一种目标对象确定装置,其特征在于,包括:输入模块,用于接收输入图像,并对输入图像进行至少一次卷积操作,得到输出特征:至少一个尺度卷积模块,用于将上一模块的输出特征作为输入特征,以执行权利要求1-4任意一项所述的方法;目标对象确定模块,用于基于所述至少一个尺度卷积模块的输出特征,确定所述输入图像中的目标对象的数量和/或位置。11.一种目标对象确定装置,其特征在于,包括:输入特征获取模块,用于获取输入特征,所述输入特征包括输入图像或对所述输入图像进行至少一次卷积操作得到的特征;尺寸信息获取模块,用于获取所述输入图像中目标对象的尺寸信息;位置偏移量确定模块,用于基于所述尺寸信息和所述输入特征,确定卷积核在所述输入特征中采样时采样点的位置偏移量;卷积操作模块,用于基于所述位置偏移量调整后的卷积核,对所述输入特征进行卷积操作,得到输出特征,所述输出特征用于确定所述输入图像中的目标对象。12.一种电子设备,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至9中任意一项所述的方法。13.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至9中任意一项所述的方法。

技术总结
本公开涉及一种目标对象确定方法及装置、电子设备和存储介质,所述方法包括:获取输入特征,所述输入特征包括输入图像或对所述输入图像进行至少一次卷积操作得到的特征;获取所述输入图像中目标对象的尺寸信息;基于所述尺寸信息和所述输入特征,确定卷积核在所述输入特征中采样时采样点的位置偏移量;基于所述位置偏移量调整后的卷积核,对所述输入特征进行卷积操作,得到输出特征,所述输出特征用于确定所述输入图像中的目标对象。本公开实施例提取的输出特征可准确地确定目标对象的位置和数量等信息。数量等信息。数量等信息。


技术研发人员:杨昆霖 刘诗男 侯军 伊帅
受保护的技术使用者:上海商汤智能科技有限公司
技术研发日:2022.01.29
技术公布日:2022/5/17
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献