一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向嵌入式的改进Yolov5s的口罩检测系统设计方法

2022-09-15 06:09:05 来源:中国专利 TAG:
swish函数,提升了模型识别准确率;使用adamw作为优化器,优化了训练效果。
附图说明
11.图1为本发明功能模块示意图。
12.图2为本发明改进c3模块结构图。
13.图3为本发明改进shufflenetv2模块结构图,左为步长为1时的结构图,右为步长为2时的结构图。
14.图4为本发明改进后的yolov5s网络结构图。
具体实施方式
15.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
16.本发明提供一种基于改进yolov5s的口罩检测系统设计方法,其方法在于:将图像训练数据集输入改进yolov5s网络模型进行训练,得到目标检测模型;由摄像头采集实时人脸图像信息,并将其发送到口罩识别单元;口罩识别单元包括目标检测模块,得到人脸位置识别结果和携带口罩识别结果,所述识别过程在训练好的改进yolov5s网络模型上进行。
17.根据训练数据集的分类情况,可将人脸类型分为与训练数据集分类相同的若干类,示范性的,可以将人脸类型分为未佩戴口罩和佩戴口罩。
18.所述的改进yolov5s网络模型实现方式为:输入大小为640
×
640
×
3的图像,经过改进的主干网络提取特征后,分别输出大小为80
×
80
×
64、40
×
40
×
128、20
×
20
×
256的特征图送入neck合网络。neck网络含特征金字塔fpn和路径聚合结构pan,利用fpn在网络中从上层往下层传递语义信息,pan则从下层往上层传递定位信息,从而融合backbone中不同网络层的信息,进一步提升检测能力。将图像输入到改进的yolov5s网络中分类,获得目标检测模块分类结果。
19.所述yolov5s网络改进方式为:将backbone主干网络中的c3模块替换为shufflenetv2模块,相比于c3模块,shufflenetv2的两个模块采用深度卷积计算,同时卷积数量也更少,大幅度降低计算量。backbone中前3个shufflenetv2模块数量和shufflenetv2保持一致,输出尺寸与原yolov5s保持一致,第一层的卷积由6*6大小的标准卷积替换为3*3大小的标准卷积。
20.所述yolov5s网络改进方式为:激活函数替换为h-swish,这是一种高性能的神经网络激活函数,一种非线性函数,其函数曲线和relu一样,没有上界,但在下边界x从左半轴慢慢趋向0带来了更强的正则化效果,同时处处连续可导,易于训练。其具体实现方式如公式(1):
21.所述改进yolov5s网络训练实现方式为:将训练集图像经过mosaic数据增强操作后,输入到改进的yolov5s网络中,通过adamw优化器更新参数。
22.所述改进yolov5m网络训练改进方式为:采用adamw优化器更新参数,adamw优化器是adam的改进,在adam优化器上加入了l2正则,来限制参数值。其实现简单,计算高效,对内存需求小,参数的更新不受梯度的伸缩的影响,超参数通常无需调整或仅需很少的调整,更
新步长能被限定在大致的范围内,能自动调整学习率,超参数可解释性良好,几乎不需要调参。
23.下表1为一个实例中gpu环境下使用yolov4-tiny、使用yolov5s和本实施例提供的改进yolov5s的map@0.5、识别准确率、单帧检测时间以及参数量,其中训练和测试选用的数据集为aizoo口罩数据集。
24.表1:神经网络模型map@0.5/%识别准确率/%单帧检测时间/ms参数量/myolov3-tiny93.1091.20138.67yolov4-tiny91.4588.27125.88yolov5s94.1192.72147.23改进yolov5s94.0191.77110.88通过表1可以了解到,本文改进的yolov5s算法与其他算法相比,map低于改进yolov3约1.37%,低于yolov5s约2.0%,单帧检测速度最快,同时模型参数量最小。因此本文算法的综合性能最佳,更适合在嵌入式设备上部署。
25.下表2为一个实例中在树莓派4b平台使用mnn深度学习框架部署yolov3-tiny,yolov4-tiny,yolov5s和本文算法模型,同时利用mnn提供的速度检测工具分别计算前向推理100次的平均推理速度和浮点运算量,其中树莓派运行环境为32位系统raspbian buster,系统架构为armv7l,系统内存为4gb,采用4核的arm cortex-a72处理器,主频为1.5ghz。
26.表2:神经网络模型平均推理速度/ms浮点运算量/mflopsyolov3-tiny365.241620.67yolov4-tiny442.838062.14yolov5s206.681986.26改进yolov5s44.36265.42通过表2可以了解到,改进yolov5s方法在树莓派平台上的平均单帧检测速度最快,浮点运算量最低,速度为改进前的21.5%,运算量为其14%,其实时性显著超过其他模型。
27.图1为本发明功能模块示意图,具体包括:摄像头采集人脸图像数据,采集的数据输入到口罩识别单元中;口罩识别单元包括目标检测模块;数据经过改进yolov5s模型处理后得出结果。
28.图2为本发明改进c3模块结构图,具体为:输入分为两路,分别通过1*1卷积,其中一路通过倒置瓶颈层,倒置瓶颈层先通过1*1卷积升维,再经过一个3*3深度卷积,最后经过1*1卷积降维,最终将两路输出在通道数上合并后在经过一个1*1卷积得到输出。
29.图3为本发明改进shufflenetv2模块结构图,具体为:左图为步长为1时的结构图,输入经过通道划分后分为两路,一路经过2个1*1卷积和3*3深度卷积后与另一路通道合并,最后经过通道混洗操作得到输出;右图为步长为2时的结构图,与左图不同之处在于,去掉了通道划分,同时另一路经过步长为2的3*3深度卷积和步长为2的1*1卷积,两路进行通道合并后经过通道混洗得到输出。
30.图4为本发明改进yolov5s网络结构图,具体为:输入大小为640
×
640
×
3的图像,经过改进的主干网络提取特征后,分别输出大小为80
×
80
×
64、40
×
40
×
128、20
×
20
×
256的特征图送入neck合网络。neck网络采用特征金字塔结构fpn和路径聚合结构pan,由cbh和c3模块构成,利用fpn在网络中从上层往下层传递语义信息,pan则从下层往上层传递定位信息,从而融合backbone中不同网络层的信息,进一步提升检测能力。最后将这3层特征图分别通过标准卷积后进行预测。
31.本发明所提方案可以装载到计算机或其他可编程数据处理设备上,使得在执行一系列操作步骤后在计算机或其他可编程数据处理设备实现本文所提方案的部分功能或全部功能。
32.上面对本发明进行了示范性描述,本发明具体实现并不受上述方式的限制,任何熟悉本技术领域的技术人员在本技术揭露的计算范围内,可轻易想到变化和替换,改变数据集、货物类别数量、权值参数等方式都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献