一种基于深度学习的图像目标检测方法与流程

2021-11-15 17:13:00 来源：中国专利 TAG：

1.本发明设涉及图像处理技术领域，具体涉及一种基于深度学习的行人目标检测方法。

背景技术：

2.行人目标检测方法基于传统的工业摄像头，民用摄像头，以及车载摄像头，能够有效解决人口失踪，人口追踪，保护行人，避免危害等一系列问题。
3.传统的通过摄像头对区域进行监控的做法，仅仅能在事故发生后一起一定的追查作用，并不能起到预防的作用。
4.基于上述传统摄像头监控的弊端，若希望在各种复杂条件下保护行人的安全，那么给摄像头集成基于深度学习的行人检测方法，可以很好的保护行人安全。

技术实现要素：

5.为解决上述问题，本发明提出基于attention
‑
yolov4神经网络方法，使得模型可以应对在各种复杂条件下对行人进行检测，同时兼顾准确性与实时性。
6.为实现上述目的，本技术采用以下技术方案予以实现：
7.一种基于深度学习的行人检测方法，该方法包括以下步骤：
8.s1：在各种公共区域内通过图像采集设备，实时获取视频流，并截取成图像帧；
9.s2：搭建attention
‑
yolov4神经网络模型；
10.s21：原始se模块是先对特征图进行全局池化，此时，特征图为一维向量，然后经过一个全连接层，将全局池化后的一维特征向量降为1*16，后接一个sigmoid激活函数，之后接入全连接层，恢复一维特向量与全局池化后的特征图一致，，后接入relu激活函数改进后的se注意力机制为，将原始的se注意力机制中的两个全连接层换为1*1卷积层，用以减少参数，提高神经网络模型的实时性并且可以任意的设置所需要的维度；
11.s22：将原始yolov4神经网络模型的csp的右分支残差结构接入改进后的se注意力机制，并且将以前的特征图拼接改为特征图叠加，用以提高对person的特征提取；
12.s23：去除原始yolov4神经网络模型特征提取模块与spp模块结间的三层卷积层，用以减少参数，提高神经网络模型的实时性，但为了保证特征提取的充分性，在这里加入特征图归一化与单层卷积；
13.s24：将原始yolov4神经网络模型的spp模块替换为rfb模块，用以更好的进行特征融合。
14.s25:对双向不对成性特征融合做了改进，将改进后的se注意力机制加入原始的双向不对成性特征融合分支中，用于提取不同模态下的特征，进而得到特征互补的效果；
15.s26:在原始yolov4神经网络模型模块去除了以前的5层卷积，采用了改进后的双向不对成性特征融合，用于对行人检测中的小目标进行检测；
16.s3：将attention
‑
yolov4放入从coco与pascal中提取出来的person数据集进行预
训练；
17.s31：将coco与pascal数据集的person数据集单独提取出来，并进行整合；
18.s32：通过聚类算法对整合后的person数据集进行聚类，用以生成最适合行人检测的先验框；
19.s4：将各种公共区域内的原图像输入attention
‑
yolov4神经网络模型进行训练；
20.s41：对公共区域内获取的行人检测数据集进行聚类，生成先验框；
21.s42：将通过coco与pascal整合后的persons数据集进行训练生成的预训练模型载入到公共区域内获取的行人检测数据集进行训练；
22.s43：采用迁移学习的思想，对主干特征提取网络采取冻结训练，用以加快训练速度和防止在训练初期权值被破坏；
23.s5：用训练好的attention
‑
yolov4神经网络模型进行行人检测。
附图说明
24.图1为基于深度学习的行人检测方法流程图；
25.图2为用于表观建模的attention
‑
yolov4神经网络结构图。
具体实施方式
26.本技术实施例通过提供一种基于深度学习的行人检测方法，以解决现有技术在复杂条件下的低准确率以及实时性不强的问题。
27.为了更好地理解上述技术方案，下面将结合说明书附图以及具体的实施方式，对上述技术方案进行详细的说明。应当理解，此处所描述的具体实施方式仅用于解释本发明，并不用于限定本发明。
28.实施例：
29.s1：在各种公共区域内通过图像采集设备，实时获取视频流，并截取成图像帧；
30.s2：搭建attention
‑
yolov4神经网络模型；
31.s21：原始se模块是先对特征图进行全局池化，此时，特征图为一维向量，然后经过一个全连接层，将全局池化后的一维特征向量降为1*16，后接一个sigmoid激活函数，之后接入全连接层，恢复一维特向量与全局池化后的特征图一致，，后接入relu激活函数改进后的se注意力机制为，将原始的se注意力机制中的两个全连接层换为1*1卷积层，用以减少参数，提高神经网络模型的实时性并且可以任意的设置所需要的维度；
32.s22：将原始yolov4神经网络模型的csp的右分支残差结构接入改进后的se注意力机制，并且将以前的特征图拼接改为特征图叠加，用以提高对person的特征提取；
33.s23：去除原始yolov4神经网络模型特征提取模块与spp模块结间的三层卷积层，用以减少参数，提高神经网络模型的实时性，但为了保证特征提取的充分性，在这里加入特征图归一化与单层卷积；
34.s24：将原始yolov4神经网络模型的spp模块替换为rfb模块，用以更好的进行特征融合。
35.s25:对双向不对成性特征融合做了改进，将改进后的se注意力机制加入原始的双向不对成性特征融合分支中，用于提取不同模态下的特征，进而得到特征互补的效果；
36.s26:在原始yolov4神经网络模型模块去除了以前的5层卷积，采用了改进后的双向不对成性特征融合，用于对行人检测中的小目标进行检测；
37.s3：将attention
‑
yolov4放入从coco与pascal中提取出来的person数据集进行预训练；
38.s31：将coco与pascal数据集的person数据集单独提取出来，并进行整合；
39.s32：通过聚类算法对整合后的person数据集进行聚类，用以生成最适合行人检测的先验框；
40.s4：将各种公共区域内的原图像输入attention
‑
yolov4神经网络模型进行训练；
41.s41：对公共区域内获取的行人检测数据集进行聚类，生成先验框；
42.s42：将通过coco与pascal整合后的persons数据集进行训练生成的预训练模型载入到公共区域内获取的行人检测数据集进行训练；
43.s43：采用迁移学习的思想，对主干特征提取网络采取冻结训练，用以加快训练速度和防止在训练初期权值被破坏；
44.s5：用训练好的attention
‑
yolov4神经网络模型进行行人检测。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：人脸图像处理方法、装置、设备及计算机可读存储介质与流程

一种基于深度学习的图像目标检测方法与流程

相关文献

最热文献