一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于YOLOv5网络的口罩佩戴检测方法

2022-04-27 02:51:37 来源:中国专利 TAG:

c3模块,c3模块参照cspnet(cross stage partialnetwork)结构将一个阶段中基础层的特征图分成两部分,拆分和合并策略被跨阶段使用,将梯度的变化从头到尾地集成到特征图中。从c3模块输出的信息传入至head模块。head部分里,通过将高层的特征信息使用上采样的方式与低层特征信息进行传递融合,实现自顶向下的信息流动。再通过步长为2的卷积进行处理,将底层特征与高层特征进行拼接操作,使底层的特征信息容易传到上层去,从而实现了panet操作。
9.进一步地,在所述将待测数据输入至目标yolov5算法模型之前,还包括:通过网络爬取与自行拍摄结合制作数据集,共采集9000张图片,对采集的图片信息进行分类,规范数据集格式,手工标注。
10.进一步地,对所述数据集分类分为两种类别,分别是bad和good,bad表示人员未佩戴或未按规范佩戴口罩,good表示正确佩戴口罩。
11.进一步地,使用图像增强技术,对标签为good的样本图片进行图像平移、翻转、旋转、缩放,分离三个颜色通道并添加随机噪声来有效缓解类间不平衡的问题。
12.进一步地,所述规范数据集格式,手工标注包括:数据集采用yolo格式,图片标注使用labelimg,标注后的文件以.txt作为后缀,文件名称和图片名称一致。
13.进一步地,在原始yolov5的网络基础上,引入卷积注意力模块cbam。cbam包含两个子模块,分别是通道注意力模块cam(channel attention module)和空间注意力模块 sam(spatial attention module)。引入注意力机制的yolov5模型总计367层,7150056个 parameters。
14.进一步地,在网络结构中采用ciou loss作为目标框回归的损失函数。
15.进一步地,使用二元交叉熵损失函数来计算分类损失和目标置信度损失。
16.本发明提供了一种基于yolov5的人脸口罩检测方法,还包括:
17.对数据进行训练阶段时,重复佩戴口罩检测网络训练过程,不断修正佩戴口罩检测网络的参数,直至口罩检测网络学会找出图像中的人脸位置并能够正确的判断检测出来的人脸是否佩戴口罩,保存训练得到的参数。
18.在网络模型训练阶段,迭代批量大小设置为32,总迭代次数为600次。初始学习率设置为0.001,采用小批量梯度下降法,并使用adam优化器计算每个参数的自适应学习率。
19.相对于现有技术,本发明的有益效果在于:
20.1、本发明引入的注意力机制作用在特征图之上,通过获取特征图中的可用注意力信息,能够达到更好的任务效果。
21.2、本发明采用ciou loss作为目标框回归的损失函数,由于ciou loss从重叠面积、中心点距离和长宽比三个角度进行衡量,故预测框回归的效果更佳。
22.3、本发明在yolov5网络中添加了cbam模块,由于cbam模型在通道注意力模块中加入了全局最大池化操作,它能在一定程度上弥补全局平均池化所丢失的信息。其次,生成的二维空间注意力图使用卷积核大小为7的卷积层进行编码,较大的卷积核对于保留重要的空间区域有良好的帮助。使yolov5网络不仅能更为准确地对目标进行分类识别,而且能更为精准地定位目标所在的位置。
23.综上所述,在图像增强和注意力机制的加持下,经过改进的yolov5模型实现了口罩佩戴的高效检测,对是否正确佩戴口罩做出了正确的判断。在可见度不高、光照强度不大
的昏暗条件下,引入注意力机制能更加准确地提取人脸口罩关键点特征,提高了检测的准确率和口罩检测效率。本发明对yolov5网络的损失函数进行相应的改进,具有较强的鲁棒性和可扩展性,基本能够达到视频图像实时性的要求。
附图说明
24.为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1为口罩检测机制实现的全流程图;
26.图2为yolov5网络结构图;
27.图3为cbam网络结构图;
28.图4为cam结构图;
29.图5为sam结构图;
30.图6为数据集部分图片;
31.图7为数据集类别分布图;
32.图8为图像增强后数据集可视化分析图;
33.图9为口罩检测效果实际场景对比实例图;
具体实施方式
34.为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述,应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
35.下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
36.应当理解,本发明中所使用的步骤编号仅是为了方便描述,不作为对步骤执行先后顺序的限定。
37.应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。需要说明的是,在本发明的描述中,术语“一”、“一种”、“所述”,也可包含复数形式。
38.应当理解,在本发明的描述中,术语“包括”指示所描述特征、模块、结构、元素、操作的存在,但并不排除其他多个特征、模块、结构、元素、操作的存在或添加。
39.请参阅图1,本发明某一实施例提供了一种基于yolov5的人脸口罩检测方法,包括:
40.步骤一,将通过网络爬取与自行拍摄结合制作的共包含9000张图片的数据集进行分类,规范数据集格式,手工标注等预处理。
41.步骤二,将预处理后的数据进行训练,迭代批量大小设置为32,总迭代次数为600次,初始学习率设置为0.001,采用小批量梯度下降法。随即进行目标定位分类与特征提取。
42.步骤三,使用adam优化器更新网络参数。
43.步骤四,判断是否完成迭代训练并得到最优模型,训练集和测试集所占的比例为8:1。如未得到则返回模型重新训练测试数据。如完成迭代训练并得到最优模型后,则输入
测试数据检测目标类别及位置,最终得到检测结果并输出。
44.在某一实施案例中,需要说明的是,通过网络爬取与自行拍摄相结合采集数据集,其中图片80%来源于网络,20%来源于实际拍摄,实际拍摄主要获取的是在昏暗条件下的口罩佩戴图片,实验过程中从楼道、室内等光线昏暗的场所进行了图片采集,同时也在傍晚和清晨等光线较弱的环境下进行了拍摄。实验参数如表所示:
[0045][0046]
在某一实施案例中,通过优化损失函数来改进训练效果。
[0047]
具体地,在对yolov5算法模型解释之前,首先对其结构采用的损失函数进行说明。在本发明中,采用二元交叉熵损失函数来计算分类损失和目标置信损失。本文使用的损失函数如下:
[0048][0049][0050]
需要说明的是,损失函数公式中k表示网络最后输出的特征图划分为k
×
k个格子, m表示每个格子对应的锚框的个数,表示有目标的锚框,表示没有目标的锚框,λ
no-obj
表示没有目标锚框的置信度损失权重系数。
[0051]
进一步地,经过对比实验,本文采用ciouloss作为目标框回归的损失函数,ciouloss 如下:
[0052][0053]
其中,d1表示预测框与目标框两个中心点的欧式距离,d2表示最小外接矩形的对角线距离。和分别表示目标框和预测框各自的宽高比。
[0054]
在实施案例中,在原始yolov5的网络基础上,引入卷积注意力模块cbam。需要说明的是,cbam包含两个子模块,通道注意力模块cam和空间注意力模块sam。cam汇总通道注意力信息,cam为给定的任意中间特征f∈rc×h×w使用基于宽和高的最大池化操作(global max pooling)和全局平均池化(global average pooling)对特征映射在空间维度上进行压缩,得到与两个特征图,这两个特征图共享一个两层的神经网络 mlp,第一层神经元的个数为c/r(r为减少率),激活函数是relu,第二层的神经元个数是c,然后对mlp输出的两个特征图使用基于元素的加和操作,再经过sigmoid激活函数进行归一化处
理,得到最终的通道注意力特征图mc∈rc×1×1。
[0055]
sam汇总空间注意力信息,sam主要关注于目标在图像上的位置信息,它将cam的输出特征图作为本模块的输出特征图。它首先做一个基于通道的全局最大池化和全局平均池化,分别得与两个特征图,然后将这两个特征图串联,基于通道做拼接操作,再经过一个7
×
7卷积操作生成空间注意力特征ms∈r1×h×w。
[0056]
在某一实施案例中,迭代批量大小优选为32,总迭代次数优选为600次,学习率优选为0.01,来提高训练的效果和完整性。
[0057]
在某一实施案例中,模型评估指标主要使用平均精度均值(map)、召回率(recall)、准确率(precision)。需要说明的是,平均精度均值(map),即所有类别的平均精度求和除以数据集中所有类的平均精度,如以下公式所示,其中ap的值为p-r曲线的面积。
[0058][0059]
召回率,即样本中的正确类别被模型预测正确的概率,如以下所示,其中tp表示将正类别预测为正类别的个数,fn表示将正类别预测为负类别的个数。
[0060][0061]
准确率,即预测数据集中预测正确的正样本个数除以实际的正样本个数,如以下公式所示,其中fp表示将负类别预测为正类别的个数。
[0062][0063]
在某一实施案例中,模型训练完成后,将得到的模型与参考文献中的方法和aizoo方法的口罩检测模型进行对比实验,分别在光照强度为30-75lux(昏暗),75-250lux(较昏暗) 和250-1000lux(正常光照)的条件下进行对比实验。需要说明的是,其中,光照强度是指单位面积上所接受可见光的能量,常用于指示光照的强弱和物体表面积被照明程度的量,单位是lux,光照强度越大,表明光照越强,物体表面被照的越亮。
[0064]
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
[0065]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献