一种基于深度学习的图像目标检测方法与流程

2021-11-15 17:13:00 来源：中国专利 TAG：

技术特征：
1.一种基于深度学习的目标检测方法，该方法包括以下步骤：s1：在公共区域内通过图像采集设备，实时获取视频流，并截取成图像帧；s2：搭建attention
‑
yolov4神经网络模型；s3：将attention
‑
yolov4放入从coco与pascal中提取出来的person数据集进行预训练；s4：将公共区域内的原图像输入attention
‑
yolov4神经网络模型进行训练；s5：用训练好的attention
‑
yolov4神经网络模型进行行人目标检测。2.根据权利要求1所述一种基于深度学习的目标检测方法，其特征在于：步骤s2所述的搭建attention
‑
yolov4神经网络模型，其具体步骤如下：s21：对se注意力机制进行改进，将原始的se注意力机制中的两个全连接层换为1*1卷积层，用以减少参数，提高神经网络模型的实时性并且可以任意的设置所需要的维度；s22：将原始yolov4神经网络模型的csp的右分支残差结构接入改进后的se注意力机制，用以提高对person的特征提取；s23：去除原始yolov4神经网络模型特征提取模块与spp模块结间的三层卷积层，用以减少参数，提高神经网络模型的实时性；s24：将原始yolov4神经网络模型的spp模块替换为rfb模块，用以更好的进行特征融合；s25:对双向不对成性特征融合做了改进，将改进后的se注意力机制加入原始的双向不对成性特征融合分支中，用于提取不同模态下的特征，进而得到特征互补的效果；s26:在原始yolov4神经网络模型模块去除了以前的5层卷积，采用了改进后的双向不对成性特征融合，用于对行人检测中的小目标进行检测。3.根据权利要求1所述一种基于深度学习的目标检测方法，其特征在于：步骤s3所述的将attention
‑
yolov4放入从coco与pascal中提取出来的person数据集进行预训练，其具体步骤如下：s31：提取coco与pascal数据集中的的person数据集并进行整合；s32：通过聚类算法对整合后的person数据集进行聚类，用以生成最适合行人检测的先验框；s33：对coco与pascal整合后的persons数据集进行训练，并生成预训练模型。4.根据权利要求1所述一种基于深度学习的目标检测方法，其特征在于：步骤s4所述的将公共区域内的原图像输入attention
‑
yolov4神经网络模型进行训练，其具体步骤如下：s41：对公共区域内获取的行人检测数据集进行聚类，生成先验框；s42：将通过coco与pascal整合后的persons数据集进行训练生成的预训练模型载入到公共区域内获取的行人检测数据集进行训练；s43：采用迁移学习的思想，对主干特征提取网络采取冻结训练，用以加快训练速度和防止在训练初期权值被破坏。

技术总结
本发明提供一种基于深度学习的目标检测方法，首先通过图像采集设备，获取视频流，然后，实时获取视频流的图像帧，通过视频流的原图像帧训练Attention

技术研发人员：周伟赵怡恒赵海航李鹏华刘洪易军郑滋觉邓粤鹏钟婉霞林魂
受保护的技术使用者：重庆科技学院
技术研发日：2021.07.13
技术公布日：2021/11/14

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：人脸图像处理方法、装置、设备及计算机可读存储介质与流程

一种基于深度学习的图像目标检测方法与流程

相关文献

最热文献