一种基于YOLOv5的改进目标检测系统

2022-08-11 09:23:03 来源：中国专利 TAG：

一种基于yolo v5的改进目标检测系统
技术领域
1.本发明属于目标检测技术领域，具体涉及一种基于yolo v5的改进目标检测系统。

背景技术：

2.目标检测是对图像中感兴趣目标进行识别和定位的技术，解决了图像中物体是什么和在哪里的问题，在很多领域都有着非常重要的作用。目标检测算法经常需要被应用在一些需要实时处理图像(如视频、监控画面等)的地方，所以对算法的实时性也提出了要求，通常称处理图像的速度达到30fps以上的算法为实时目标检测算法。
3.yolo目标检测算法是一个一般场景下的实时目标检测算法，在日常学习和生活中应用广泛。但是yolo算法本身的性能依然存在一些问题，如对小尺度目标的敏感度低、定位准确度不足等。所以，能否通过对yolo算法进行优化使其拥有更好多性能指标也是目标检测领域需要研究的问题。

技术实现要素：

4.为解决背景技术中的问题；本发明的目的在于提供一种基于yolo v5的改进目标检测系统。
5.本发明的一种基于yolo v5的改进目标检测系统，包括如下步骤：
6.步骤一：数据增强：
7.yolov5算法主要采用的数据增强方式是mosaic方法，将不同的图片进行拼接，形成新的图片以增加鲁棒性。
8.步骤二：目标定位损失函数：
9.2.1、将对角线长度和宽高比关系结合，建立一个新的损失函数；将其引入yolov5进行训练，得到实验数据；
10.2.2、寻找宽高比和最小外接矩形框的关系，对损失函数进行优化，并将其引入yolov5进行训练，得到实验数据；
11.2.3、思考标定框和预测框是否有新的位置关系，并尝试用新的关系对损失函数进行改进，将其引入yolov5进行训练，得到实验数据；
12.比较不同损失函数对算法预测框准确度的影响，选择表现更好的损失函数作为改进算法的损失函数，已达到使算法定位准确度更高的要求；
13.步骤三：多尺度融合结构框架：
14.3.1、在颈部网络高层的骨干网络连接处引入1
×
1卷积遍历高层特征图，以减小高层网络的通道数，在保持高层信息不丢失的情况下降低计算量，使改进算法的速度有一个提升；
15.3.2、在颈部网络的采用分别上采样加融合下采样的方式，增加对骨干网络特征的利用层数，增加可利用信息，达到增加算法精度的目标；
16.3.3、对颈部网络的第一步对算法速度进行了提升，为第二步预计增加的计算量进
行一定控制。可以通过设立选择不同的层数进行对比实验，找到一个fps没有明显下降，而准确度得到提升的算法框架；
17.步骤四：使用软件对算法进行验证和比较：
18.学习深度学习框架搭建方法，将前文设计的数据集预处理方法、损失函数和多尺度融合框架与骨干网络进行融合，从而设计出改进yolo算法，将改进算法的在ms coco2017训练集上训练和测试，验证算法的可行性。
19.作为优选，所述数据增强对预处理算法进行如下处理：
20.(1)、首先将小目标通过对原始目标中的非小目标进行缩放形成小目标和直接将原始图像中的小目标提取出来两种方法将小目标提取出来，形成新的图片，以增加小目标丰富度；
21.(2)、然后通过随机数量复制，随机粘贴等方式，将提取出的小目标和原始图像以cutmix方法进行处理，将小目标插入原始图像的随机位置，以减小图片数量；
22.(3)、对第二步输出的结果用mosaic方式进行处理；并得出经过预处理后的输入图像和输入坐标；
23.通过以上方式，目的在于进一步增大小目标的数量和复杂度，以达到增强算法对小目标敏感度的需求。
24.与现有技术相比，本发明的有益效果为：
25.改进的算法框架将在mscoco数据集上进行训练和测试，使新的算法在基本维持yolo算法fps的情况下，使其拥有更好的检测准确度指标。
附图说明
26.为了易于说明，本发明由下述的具体实施及附图作以详细描述。
27.图1为本发明的流程图；
28.图2为本发明中预处理算法的流程图。
具体实施方式
29.为使本发明的目的、技术方案和优点更加清楚明了，下面通过附图中示出的具体实施例来描述本发明。但是应该理解，这些描述只是示例性的，而并非要限制本发明的范围。本说明书附图所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容能涵盖的范围内。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。
30.在此，还需要说明的是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤，而省略了与本发明关系不大的其他细节。
31.如图1所示，本具体实施方式采用以下技术方案：
32.一、针对数据集的小目标不敏感问题的研究：
33.1.1、问题分析：
34.目标检测中对小目标有两种定位方式，一种是绝对小目标，一种是相对小目标，相对小目标的尺寸一般是原图像尺寸长宽比的1/10，虽然在整个样本中比较小，但是所含的像素信息还是比较丰富的，这种目标检测框架一般的处理方法是对图片进行缩放。另一种检测目标是绝对小目标，在mscoco数据集中，对像素尺寸小于32
×
32的目标定义为小目标，该类目标，该类目标不但在整个样本中很小，像素信息也很少，所含语义信息匮乏，即便对原始图片进行放大等操作，检测难度还是很大。
35.1.2、解决方法：
36.yolov5算法主要采用的数据增强方式是mosaic方法，将不同的图片进行拼接，形成新的图片以增加鲁棒性。
37.如图2所示，对预处理算法进行如下改进处理：
38.(1)、首先将小目标通过对原始目标中的非小目标进行缩放形成小目标和直接将原始图像中的小目标提取出来两种方法将小目标提取出来，形成新的图片，以增加小目标丰富度。
39.(2)、然后通过随机数量复制，随机粘贴等方式，将提取出的小目标和原始图像以cutmix方法进行处理，将小目标插入原始图像的随机位置，以减小图片数量。
40.(3)、对第二步输出的结果用mosaic方式进行处理；并得出经过预处理后的输入图像和输入坐标。
41.通过以上方式，目的在于进一步增大小目标的数量和复杂度，以达到增强算法对小目标敏感度的需求。
42.二、针对算法的定位精度不足的问题：
43.2.1、问题分析：
44.交并比是衡量目标检测算法定位精度的一个参数。在实际应用中，可以引进交并比的方法对损失函数进行定义，但是预测框和标定框的位置关系比较可能会出现各种导致交并比相同但实际定位效果不同的情况，交并比损失函数在实际操作中依然会出现问题。所以yolo v5引入了giou算法，公式如下：
[0045][0046]
其中，b是算法的预测框，b
gt
是数据集中的标定框，c是外接矩形，iou是预测框与标定框的iou值。
[0047]
在实际的操作中，预测框与标定框呈包含关系时，giou算法依然存在实际定位效果不同的问题，所以需要引进新的关系。
[0048]
2.2、解决方法：
[0049]
目前已提出的损失函数中应用过的标定框与预测框关系有宽高比、中心点位置和外接矩形面积。通过对已有知识的学习与整合，尝试寻找新的预测框关系搭配，及对损失函数进行如下操作：
[0050]
(1)、将对角线长度和宽高比关系结合，建立一个新的损失函数；将其引入yolov5进行训练，得到实验数据；
[0051]
(2)、寻找宽高比和最小外接矩形框的关系，对损失函数进行优化，并将其引入yolov5进行训练，得到实验数据；
[0052]
(3)、思考标定框和预测框是否有新的位置关系，并尝试用新的关系对损失函数进行改进，将其引入yolov5进行训练，得到实验数据；
[0053]
比较不同损失函数对算法预测框准确度的影响，选择表现更好的损失函数作为改进算法的损失函数，已达到使算法定位准确度更高的要求。
[0054]
三、针对检测框架对不同大小的目标难以兼顾的问题：
[0055]
3.1、问题分析：
[0056]
一张图片中往往存在很多大小不同的目标，而检测框架对不同大小目标的敏感度是不同的，很难做到各种目标都进行兼顾，这也是造成目标检测框架准确度难以提升的原因之一。
[0057]
在mscoco数据集中，有大约50％的目标尺寸小于图像尺寸的1/10，有10％的目标尺寸小于图像尺寸的1/50，有10％的目标尺寸大于图像尺寸的200％。显而易见，mscoco数据集的目标复杂性大，相对也提出了更高的检测需求。
[0058]
3.2、解决方法：
[0059]
yolov5解决多尺度融合问题的方式是在颈部网络处引入panet，该方式通过引入上采样和下采样操作，融合上下文信息，以达到更好的利用细节信息更多的神经网络底层特征。但是相对的，引入panet后会增大计算量，影响算法的运算速度。
[0060]
对yolov5的颈部网络进行如下改进处理：
[0061]
(1)在颈部网络高层的骨干网络连接处引入1
×
1卷积遍历高层特征图，以减小高层网络的通道数，在保持高层信息不丢失的情况下降低计算量，使改进算法的速度有一个提升；
[0062]
(2)在颈部网络的采用分别上采样加融合下采样的方式，增加对骨干网络特征的利用层数，增加可利用信息，达到增加算法精度的目标。
[0063]
对颈部网络的第一步对算法速度进行了提升，为第二步预计增加的计算量进行一定控制。可以通过设立选择不同的层数进行对比实验，找到一个fps没有明显下降，而准确度得到提升的算法框架。
[0064]
四、使用软件对算法进行验证和比较研究：
[0065]
学习深度学习框架搭建方法，将设计的数据集预处理方法、损失函数和多尺度融合框架与骨干网络进行融合研究，从而设计出改进yolo算法，将改进算法的在ms coco2017训练集上训练和测试，验证算法的可行性(即fps没有明显下降，算法准确度优于原始算法)。
[0066]
对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
[0067]
此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种操作系统完整性的检测方法及系统与流程

一种基于YOLOv5的改进目标检测系统

相关文献

最热文献