对象识别模型的训练方法和对象识别方法、装置、设备与流程

2022-04-14 03:13:07 来源：中国专利 TAG：

技术特征：
1.一种对象识别模型的训练方法，其中，所述对象识别模型包括目标检测模型；所述方法包括：检测包括完整结构的目标对象的第一样本图像，得到所述目标对象的关键点信息；根据所述关键点信息裁剪所述第一样本图像，得到针对所述目标对象的多个区域图像，每个区域图像包括所述目标对象的残缺结构；将所述多个区域图像分别与预定背景图像融合，得到多个第二样本图像；以及根据所述多个第二样本图像对所述目标检测模型进行训练。2.根据权利要求1所述的方法，其中，所述关键点信息包括描述所述目标对象的多个关键点的位置信息；所述根据所述关键点信息裁剪所述第一样本图像，得到针对所述目标对象的多个区域图像包括：确定所述多个关键点中分别描述所述目标对象的多个目标部位的目标关键点，得到分别对应所述目标对象的多个残缺结构的多个目标关键点组；分别根据所述多个目标关键点组中关键点的位置信息，确定所述第一样本图像中分别针对所述多个残缺结构的多个区域；以及根据所述多个区域裁剪所述第一样本图像，得到所述多个区域图像。3.根据权利要求2所述的方法，其中，所述多个目标关键点组中的每个目标关键点组包括：描述所述每个目标关键点组所对应的残缺结构的关键点；以及描述所述多个目标部位中与所述每个目标关键点组所对应的残缺结构相邻的相邻部位的关键点。4.根据权利要求3所述的方法，其中，所述分别根据所述多个目标关键点组中目标关键点的位置信息，确定所述第一样本图像中分别针对所述多个残缺结构的多个区域包括：针对所述多个目标关键点组中的每个目标关键点组，根据所述每个目标关键点组中关键点的位置信息，确定所述每个目标关键点组所对应的残缺结构的边界参考点；以及根据所述边界参考点和针对所述每个目标关键点组所对应的残缺结构的偏差参数，确定针对所述每个目标关键点组所对应的残缺结构的区域。5.根据权利要求4所述的方法，其中，所述偏差参数根据所述每个目标关键点组中描述残缺结构的关键点与描述相邻部位的关键点之间的距离确定。6.根据权利要求1~5中任一项所述的方法，其中，所述对象识别模型还包括目标分类模型；所述方法还包括：根据所述关键点信息裁剪所述第一样本图像，得到针对所述目标对象的完整图像，所述完整图像包括所述目标对象的完整结构；根据所述多个区域图像和所述完整图像，得到多个第三样本图像，每个所述第三样本图像包括表示所述目标对象的结构的实际类别；将多个所述第三样本图像输入所述目标分类模型，得到针对多个所述第三样本图像的多个预测类别；以及根据多个所述第三样本图像包括的多个实际类别和所述多个预测类别，对所述目标分类模型进行训练。7.根据权利要求6所述的方法，其中，所述第一样本图像包括多个图像，所述多个图像包括标识不同的多个预定对象；所述方法还包括：将多个所述第三样本图像输入所述目标分类模型，得到针对多个所述第三样本图像的
多个特征图；将多个所述特征图组成多个第一特征图对和多个第二特征图对；每个所述第一特征图对中的两个特征图所针对的两个第三样本图像具有相同的实际类别；每个所述第二特征图对中的两个特征图所针对的两个第三样本图像具有不同的实际类别；以及根据针对所述第一特征图对的第一差异与针对所述第二特征图对的第二差异之间的差值，对所述目标分类模型进行训练，其中，所述第一差异为所述第一特征图对中两个特征图之间的差异，所述第二差异为所述第二特征图对中两个特征图之间的差异。8.根据权利要求1所述的方法，其中，所述将所述多个区域图像分别与预定背景图像融合，得到多个第二样本图像包括：根据预定尺寸比例调整所述多个区域图像，得到多个调整后图像；以及将所述多个调整后图像与所述预定背景图像融合，得到所述多个第二样本图像。9.一种对象识别方法，包括：将包括目标对象的残缺结构的待识别图像输入对象识别模型包括的目标检测模型，得到所述待识别图像中所述目标对象的位置信息；根据所述位置信息裁剪所述待识别图像，得到针对所述目标对象的区域图像；提取所述区域图像的特征图；以及根据所述特征图确定多个预定对象中与所述目标对象匹配的对象，其中，所述对象识别模型是采用权利要求1~8中任一项所述的方法训练的。10.根据权利要求9所述的方法，其中，所述根据所述特征图确定针对所述目标对象的识别结果包括：根据所述特征图查询特征库，确定所述特征库中与所述特征图匹配的目标特征；其中，所述特征库包括描述所述多个预定对象的残缺结构的多个特征图；以及确定所述多个预定对象中所述目标特征所针对的对象为与所述目标对象匹配的对象。11.根据权利要求9所述的方法，其中，所述对象识别模型还包括目标分类模型；所述提取所述区域图像的特征图包括：将所述区域图像输入所述目标分类模型，得到所述区域图像的特征图。12.一种对象识别模型的训练装置，其中，所述对象识别模型包括目标检测模型；所述装置包括：关键点检测模块，用于检测包括完整结构的目标对象的第一样本图像，得到所述目标对象的关键点信息；第一裁剪模块，用于根据所述关键点信息裁剪所述第一样本图像，得到针对所述目标对象的多个区域图像，每个区域图像包括所述目标对象的残缺结构；图像融合模块，用于将所述多个区域图像分别与预定背景图像融合，得到多个第二样本图像；以及第一训练模块，用于根据所述多个第二样本图像对所述目标检测模型进行训练。13.根据权利要求12所述的装置，其中，所述关键点信息包括描述所述目标对象的多个关键点的位置信息；所述第一裁剪模块包括：目标点确定子模块，用于确定所述多个关键点中分别描述所述目标对象的多个目标部
位的目标关键点，得到分别对应所述目标对象的多个残缺结构的多个目标关键点组；区域确定子模块，用于分别根据所述多个目标关键点组中关键点的位置信息，确定所述第一样本图像中分别针对所述多个残缺结构的多个区域；以及图像确定子模块，用于根据所述多个区域裁剪所述第一样本图像，得到所述多个区域图像。14.根据权利要求13所述的装置，其中，所述多个目标关键点组中的每个目标关键点组包括：描述所述每个目标关键点组所对应的残缺结构的关键点；以及描述所述多个目标部位中与所述每个目标关键点组所对应的残缺结构相邻的相邻部位的关键点。15.根据权利要求14所述的装置，其中，所述区域确定子模块包括：参考点确定单元，用于针对所述多个目标关键点组中的每个目标关键点组，根据所述每个目标关键点组中关键点的位置信息，确定所述每个目标关键点组所对应的残缺结构的边界参考点；以及区域确定单元，用于根据所述边界参考点和针对所述每个目标关键点组所对应的残缺结构的偏差参数，确定针对所述每个目标关键点组所对应的残缺结构的区域。16.根据权利要求15所述的装置，其中，所述偏差参数根据所述每个目标关键点组中描述残缺结构的关键点与描述相邻部位的关键点之间的距离确定。17.根据权利要求12~16中任一项所述的装置，其中，所述对象识别模型还包括目标分类模型；所述装置还包括：第二裁剪模块，用于根据所述关键点信息裁剪所述第一样本图像，得到针对所述目标对象的完整图像，所述完整图像包括所述目标对象的完整结构；图像生成模块，用于根据所述多个区域图像和所述完整图像，得到多个第三样本图像，每个所述第三样本图像包括表示所述目标对象的结构的实际类别；类别预测模块，用于将多个所述第三样本图像输入所述目标分类模型，得到针对多个所述第三样本图像的多个预测类别；以及第二训练模块，用于根据多个所述第三样本图像包括的多个实际类别和所述多个预测类别，对所述目标分类模型进行训练。18.根据权利要求17所述的装置，其中，所述第一样本图像包括多个图像，所述多个图像包括标识不同的多个预定对象；所述装置还包括：特征图获得模块，用于将多个所述第三样本图像输入所述目标分类模型，得到针对多个所述第三样本图像的多个特征图；以及特征图对获得模块，用于将多个所述特征图组成多个第一特征图对和多个第二特征图对；每个所述第一特征图对中的两个特征图所针对的两个第三样本图像具有相同的实际类别；每个所述第二特征图对中的两个特征图所针对的两个第三样本图像具有不同的实际类别；其中，所述第二训练模块还用于根据针对所述第一特征图对的第一差异与针对所述第二特征图对的第二差异之间的差值，对所述对象分类模型进行训练，其中，所述第一差异为所述第一特征图对中两个特征图之间的差异，所述第二差异为所述第二特征图对中两个特征图之间的差异。19.根据权利要求12所述的装置，其中，所述图像融合模块包括：
图像调整子模块，用于根据预定尺寸比例调整所述多个区域图像，得到多个调整后图像；以及图像融合子模块，用于将所述多个调整后图像与所述预定背景图像融合，得到所述多个第二样本图像。20.一种对象识别装置，包括：目标检测模块，用于将包括目标对象的残缺结构的待识别图像输入对象识别模型包括的目标检测模型，得到所述待识别图像中所述目标对象的位置信息；图像裁剪模块，用于根据所述位置信息裁剪所述待识别图像，得到针对所述目标对象的区域图像；特征图提取模块，用于提取所述区域图像的特征图；以及对象确定模块，用于根据所述特征图确定多个预定对象中与所述目标对象匹配的对象，其中，对象识别模型是采用权利要求12~19中任一项所述的装置训练的。21.根据权利要求20所述的装置，其中，所述对象确定模块包括：目标特征确定子模块，用于根据所述特征图查询特征库，确定所述特征库中与所述特征图匹配的目标特征；其中，所述特征库包括描述所述多个预定对象的残缺结构的多个特征图；以及对象确定子模块，用于确定所述多个预定对象中所述目标特征所针对的对象为与所述目标对象匹配的对象。22.根据权利要求20所述的装置，其中，所述对象识别模型还包括目标分类模型；所述特征图提取模块用于：将所述区域图像输入所述目标分类模型，得到所述区域图像的特征图。23.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1~11中任一项所述的方法。24.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1~11中任一项所述的方法。25.一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令在被处理器执行时实现根据权利要求1~11中任一项所述方法的步骤。

技术总结
本公开提供了一种对象识别模型的训练方法和对象识别方法、装置、电子设备和存储介质，涉及人工智能领域，具体涉及计算机视觉领域和深度学习领域，可应用于人脸识别和内容审核等场景下。对象识别模型的训练方法的具体实现方案为：检测包括完整结构的目标对象的第一样本图像，得到目标对象的关键点信息；根据关键点信息裁剪第一样本图像，得到针对目标对象的多个区域图像，每个区域图像包括目标对象的残缺结构；将多个区域图像分别与预定背景图像融合，得到多个第二样本图像；以及根据多个第二样本图像对目标检测模型进行训练。样本图像对目标检测模型进行训练。样本图像对目标检测模型进行训练。

技术研发人员：张素芳吕一邓天生于天宝贠挺林赛群
受保护的技术使用者：百度在线网络技术（北京）有限公司
技术研发日：2022.03.03
技术公布日：2022/4/12

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：户型优化方法、装置以及存储介质与流程

对象识别模型的训练方法和对象识别方法、装置、设备与流程

相关文献

最热文献