一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度学习的电网施工进度与安全识别方法与流程

2022-07-16 11:23:51 来源:中国专利 TAG:


1.本发明涉及工地进度与安全识别的技术领域,尤其涉及一种基于深度学习的电网施工进度与安全识别方法。


背景技术:

2.电力行业作为国计民生的重要资源、国民生活的保障和社会发展的支撑,推动着国家的发展与进步。近年来,在电网高速发展的背景下,电力施工工程众多,电力设施遍布广阔,这在推动经济发展的同时,也为工程进度与安全巡检带来挑战。
3.目前,对电力施工现场的进度与安全巡检工作存在两方面问题。首先,在巡检方面主要依靠人工巡检的方式,该方式浪费大量的人力、物力和财力资源,同时效率相对低下;其次,在进度与安全识别方面,主要依靠人工进行核实,自动化程度不足,不具有实时性,预警效果较差;另外,系统多采用传统管理模式,不利于各工地之间相关数据的共享。


技术实现要素:

4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述现有存在的问题,提出了本发明。
6.因此,本发明提供了一种,能够解决工地施工进度与安全检测中过分依赖人工、效率低、成本高、信息交互性差等弊端。
7.为解决上述技术问题,本发明提供如下技术方案,包括:预处理基建项目图像,制作数据集;将数据集进行缩放,根据设定的图像数量batch依次将数据集输入至识别模型;通过所述识别模型对输入进行前向传播计算,根据前向传播结果与标注图像中的真实框,计算损失值;分别计算所述损失值对识别模型各个权重矩阵和偏置参数的梯度,并通过nesterov加速梯度下降法对识别模型进行更新;若更新的识别模型未收敛或未达到最大训练次数,则通过更新的识别模型重新对输入进行前向传播计算,直至更新的识别模型收敛或达到最大训练次数停止训练识别模型;利用训练完成的识别模型对基建项目图像进行识别。
8.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:所述预处理,包括:标注:利用labelme对基建项目图像中的目标进行位置、类别标注,所述目标包括基础挖坑、浇筑、组塔、放线、附件安装、已佩戴安全帽和未佩戴安全帽;转化:将标注后的文件格式转换为{label,x,y,w,h}的形式,其中,
9.x=x1
10.y=y1
11.w=x2

x1
12.h=y2

y1
13.式中,(x1,y1)为待检测目标矩形框的左上角像素坐标,(x2,y2)为待检测目标矩形框的右下角像素坐标,w和h分别为待检测目标矩形框的宽度和高度,x和y分别基建项目图像中的目标的像素横、纵坐标;平滑:通过中值滤波算法对所有基建项目图像进行平滑处理。
14.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:包括:缩放尺度为640*640,设定的图像数量batch=16。
15.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:前向传播结果包括目标预测矩形框的位置、大小以及所包含目标的类别。
16.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:包括:识别模型由输入部件、backbone部件、neck部件和prediction部件构成,其中,backbone部件包括1个卷积模块、5个csp模块和2个注意力机制se模块,所述2个注意力机制se模块处于第2个csp模块和第3个csp模块之间,通过backbone部件对输入进行特征提取;neck部件由fpn层和2个pan网络组成,通过neck部件对backbone部件提取的特征进行特征融合;而后通过prediction部件进行预测。
17.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:所述损失值包括置信度损失、分类损失和边界框损失。
18.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:包括:利用bcewithlogitsloss损失函数计算置信度损失;利用crossentropyloss损失函数计算分类损失;利用giou损失函数计算边界框损失。
19.作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:更新识别模型包括:
[0020][0021]
其中,θ

为更新后的梯度,θ为所述损失值对识别模型各个权重矩阵和偏置参数的梯度,v
t-1
为动量项,用于更新θ。
[0022]
作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:包括:当损失值小于10-5
时,更新的识别模型收敛。
[0023]
作为本发明所述的基于深度学习的电网施工进度与安全识别方法的一种优选方案,其中:包括:设置最大训练次数为2000。
[0024]
本发明的有益效果:本发明能够精准监测工地进度,及时发现安全隐患,为施工现场提供决策依据,实现智慧工地自动化与智能化。
附图说明
[0025]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0026]
图1为本发明第一个实施例所述的基于深度学习的电网施工进度与安全识别方法的流程示意图。
具体实施方式
[0027]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0028]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0029]
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0030]
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
[0031]
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0032]
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0033]
实施例1
[0034]
参照图1,为本发明的第一个实施例,该实施例提供了一种基于深度学习的电网施工进度与安全识别方法,包括:
[0035]
s1:预处理基建项目图像,制作数据集;
[0036]
利用无人机采集基建项目图像,并对其进行预处理:
[0037]
(1)标注:利用labelme对基建项目图像中的目标进行位置、类别标注,目标包括基础挖坑、浇筑、组塔、放线、附件安装、已佩戴安全帽和未佩戴安全帽;
[0038]
labelme软件生成的标注文件以json格式储存,共包含两种信息;其中第一种信息是每个待检测目标矩形框的位置(points)信息,以列表形式储存待检测目标矩形框的左上角像素坐标(x1,y1)和待检测目标矩形框的右下角像素坐标(x2,y2);第二种信息是每个待检测目标矩形框的类别(label)信息,以字符串形式储存矩形框的所属类别。
[0039]
(2)转化:由于识别模型默认的标注格式为txt,因此对标注后的文件格式{label,x1,y1,x2,y2}转换为{label,x,y,w,h}的形式,其中,
[0040]
x=x1
[0041]
y=y1
[0042]
w=x2

x1
[0043]
h=y2

y1
[0044]
式中,(x1,y1)为待检测目标矩形框的左上角像素坐标,(x2,y2)为待检测目标矩形框的右下角像素坐标,w和h分别为待检测目标矩形框的宽度和高度,x和y分别基建项目图像中的目标的像素横、纵坐标。
[0045]
(3)平滑:通过中值滤波算法对所有基建项目图像进行平滑处理;具体地,遍历基建项目图像中所有像素,以每个像素为中心,将该像素周围规定领域(5
×
5)内的像素值进行排序,然后把位于排在中间位置的像素值作为当前像素点的像素值;此操作使用的脚本语言为python3.7,实现中值滤波算法的第三方库为opencv4.5.1。
[0046]
s2:将数据集进行缩放,根据设定的图像数量batch依次将数据集输入至识别模型。
[0047]
将数据集进行缩放至640*640,按照每批次16张图像将数据集输入至识别模型。
[0048]
其中,识别模型由输入部件、backbone部件、neck部件和prediction部件构成,其中,backbone部件包括1个卷积模块、5个csp模块和2个注意力机制se模块,2个注意力机制se模块处于第2个csp模块和第3个csp模块之间,通过backbone部件对输入进行特征提取;
[0049]
neck部件由fpn层和2个pan网络组成,通过neck部件对backbone部件提取的特征进行特征融合;而后通过prediction部件进行预测。
[0050]
s3:通过识别模型对输入进行前向传播计算,根据前向传播结果与标注图像中的真实框,计算损失值。
[0051]
前向传播结果包括目标预测矩形框的位置、大小以及所包含目标的类别。
[0052]
进一步的,根据前向传播结果与标注图像中的真实框,计算的损失值包括置信度损失、分类损失和边界框损失,具体的,利用bcewithlogitsloss损失函数计算置信度损失;利用crossentropyloss损失函数计算分类损失;利用giou损失函数计算边界框损失。
[0053]
s4:分别计算置信度损失、分类损失和边界框损失对识别模型各个权重矩阵和偏置参数的梯度,并通过nesterov加速梯度下降法对识别模型进行更新。
[0054]
通过下式更新识别模型:
[0055][0056]
其中,θ

为更新后的梯度,θ为损失值对识别模型各个权重矩阵和偏置参数的梯度,v
t-1
为动量项,用于更新θ。
[0057]
s5:若更新的识别模型未收敛或未达到最大训练次数,则通过更新的识别模型重新对输入进行前向传播计算,直至更新的识别模型收敛或达到最大训练次数停止对训练识别模型。
[0058]
其中,当损失小于10-5
时,更新的识别模型收敛;设置最大训练次数为2000。
[0059]
s6:利用训练完成的识别模型对基建项目图像进行识别。
[0060]
实施例2
[0061]
为了对本方法中采用的技术效果加以验证说明,本实施例选择传统的技术方案(cnn模型)和采用本方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
[0062]
利用python搭建识别模型,服务器硬件配置为:2.4ghz,8gb内存,分别采用传统的技术方案和已经训练好的识别模型对基建项目图像中的目标(基础挖坑、浇筑、组塔、放线、
附件安装、已佩戴安全帽和未佩戴安全帽)进行识别,并对模型进行评价,以验证模型的可靠性;采用准确率(precision)、召回率(recall)作为算法的整体评价指标,计算公式如下:
[0063][0064][0065]
其中,tp表示将正样本预测为正样本的个数,fp表示将负样本预测为正样本的个数,fn表示将正样本预测为负样本的个数。
[0066]
通过准确率(precision)可以反映出网络模型检测器误检的情况,召回率(recall)能够反映检测器漏检目标的问题,准确率(precision)和召回率(recall)越高,则目标识别率越高,性能参数如表1所示。
[0067]
表1:性能参数对比。
[0068] 准确率召回率模型大小/mb检测速度/fpscnn模型81.21.0126.737.9识别模型97.31.038.327.5
[0069]
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
[0070]
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
[0071]
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、ram、rom等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
[0072]
如在本技术所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
[0073]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献