一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图像识别的高压电缆附件图纸比对方法和系统与流程

2021-11-03 21:55:00 来源:中国专利 TAG:


1.本发明涉及高压电缆附件图纸对比技术领域,尤其是涉及一种基于图像识别的高压电缆附件图纸比对方法和系统。


背景技术:

2.鉴于目前高压电缆附件的生产厂家众多,电缆附件类型繁多,具有不同类型的特点及局限性,而且部分厂家没有一定历史背景,生成的高压电缆附件在某些设计环节上没有经过长期的运行经验数据作为沉淀,图纸工艺设计上经常会有变化。
3.为了实现高压电缆附件标准工艺的管控目的,确保运行电缆的安全和稳定应用,需要从签订技术协议的源头上进行管控和把关,通过建立标准工艺的数据库,利用首台首套电缆附件工艺的仿真安装,实现工艺的鉴定和固化,在后期技术协议签订的工艺中,对其图纸的合规性和吻合度完成比对。
4.现有的比对方案通过人工进行评审,存在大量的不确定因素,无法保证评审结局的准确性,且增加人员工作量。


技术实现要素:

5.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种降低人员投入的工作量和人员评审时的不确定性的基于图像识别的高压电缆附件图纸比对方法。
6.本发明的目的可以通过以下技术方案来实现:
7.一种基于图像识别的高压电缆附件图纸比对方法,包括以下步骤:
8.获取高压电缆附件图纸;
9.对所述高压电缆附件图纸进行特征识别,获取电缆附件特征图;
10.对所述电缆附件特征图进行字符识别,增强字符图案,获取电缆附件字符增强图;
11.将所述电缆附件字符增强图与预设的标准工艺库中对应的厂家模板图纸进行比对,进行一致性判断,并输出对该高压电缆附件图纸的一致性判断结果。
12.进一步地,采用lbp算法对所述高压电缆附件图纸进行特征识别。
13.进一步地,所述lbp算法的窗口大小的确定过程包括以下步骤:
14.设定并初始化参数k,
15.根据所述参数k设定每一个像素的活动窗口,并设定每一个像素的活动窗口的像素平均强度值的计算公式;
16.对于每一个像素,分别在水平方向和垂直方向上计算该像素的两个互不重叠的窗口之间的像素平均强度差,
17.对于每一个像素,获取能使得水平方向上两个互不重叠的窗口之间的像素平均强度差或垂直方向上两个互不重叠的窗口之间的像素平均强度差的值达到最大的k值;
18.根据每个像素确定的k值,确定活动窗口的大小为,作为lbp算法的窗口大小。
19.进一步地,所述像素平均强度值的计算表达式为:
[0020][0021]
式中,x为像素的横坐标,y为像素的纵坐标,a
k
(x,y)为像素(x,y)在一个活动窗口中的像素平均强度值,g(i,j)为图像中坐标为(i,j)的像素值;
[0022]
进一步地,所述水平方向上两个互不重叠的窗口之间的像素平均强度差e
k,h
(x,y)的计算表达式为:
[0023]
e
k,h
(x,y)=|a
k
(x 2
k
‑1,y)

a
k
(x
‑2k
‑1,y)|
[0024]
所述垂直方向上两个互不重叠的窗口之间的像素平均强度差e
k,v
(x,y)的计算表达式为:
[0025]
e
k,v
(x,y)=|a
k
(x,y 2
k
‑1)

a
k
(x,y
‑2k
‑1)|。
[0026]
进一步地,通过光学字符识别方法对所述电缆附件特征图进行字符识别,增强字符图案,所述光学字符识别方法包括对所述电缆附件特征图进行预处理后,载入预先训练后的字符识别引擎中进行字符识别,最后对字符识别结果进行图片增强。
[0027]
进一步地,所述字符识别引擎采用开源ocr引擎tesseract。
[0028]
进一步地,所述一致性判断的过程具体为:将所述电缆附件字符增强图和对应的厂家模板图纸划分为多个区域,分别计算相对应的两个区域的分形维数值,并获取分形维数差值的绝对值,若该分形维数差值的绝对值小于预设的参考阈值,则输出图纸一致的判断结果,否则输出图纸不一致的判断结果。
[0029]
进一步地,若判断为图纸不一致,还输出有对应的区域标注。
[0030]
本发明还提供一种基于图像识别的高压电缆附件图纸比对系统,包括存储器和处理器,所述存储器存储有计算机程序,处理器调用所述计算机程序执行如上所述的方法的步骤。
[0031]
与现有技术相比,本发明具有以下优点:
[0032]
(1)相比传统的人工审核以及管理,本发明的工艺库管理更便捷且安全可靠,通过长期使用在运行维护、人工管理等方面的成本都大幅下降,创造更好的经济效益。
[0033]
(2)通过对所有高压电缆附件的全面审核大幅提升工作效率,审核维度全面科学,具有技术支持和逻辑设计,使审核流程简洁高效且可靠。
[0034]
(3)本发明采用lbp算法对高压电缆附件图纸进行特征识别时,发现了现有的lbp算法对复杂的高压电缆附件图纸进行处理时,具有局限性,因此提出一种自适应阈值的活动窗口选取方案,获取使得水平和垂直方向上互不重叠的窗口之间的像素平均强度差最大的窗口大小,与lbp算法的结合,能减少lbp在基元特征提取上的误差。
附图说明
[0035]
图1为本发明实施例中提供的一种基于图像识别的高压电缆附件图纸比对方法的流程示意图;
[0036]
图2为本发明实施例中提供的一种灰度增强前、后识别效果对比图。
具体实施方式
[0037]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0038]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039]
实施例1
[0040]
如图1所示,本实施例提供一种基于图像识别的高压电缆附件图纸比对方法,包括以下步骤:
[0041]
获取高压电缆附件图纸;
[0042]
对高压电缆附件图纸进行特征识别,获取电缆附件特征图;
[0043]
对电缆附件特征图进行字符识别,增强字符图案,获取电缆附件字符增强图;
[0044]
将电缆附件字符增强图与预设的标准工艺库中对应的厂家模板图纸进行比对,进行一致性判断,并输出对该高压电缆附件图纸的一致性判断结果。
[0045]
具体地,本实施例使用图像识别技术、ocr字符识别技术以及一致性检测算法,通过高清扫描设备采用光电技术和数字处理技术对高压电缆图纸、技术协议等工艺图进行扫描进入工艺库,将电子版工艺图纸或工艺文档进行特征提取和字符识别、与标准工艺库里固化的厂家模板图纸进行比对,最终系统根据算法判断比对的结果从而形成比对报告以便后续审核。并且针对在不同厂家的高压电缆附件工艺图纸或文档上的修改情形进行分析,对图纸的删除、新增和修改部分进行系统提示,简化设计审核人员比对审核图纸的过程,减少错漏现象,提高工作效率。
[0046]
下面对本方法各步骤进行具体描述
[0047]
1、根据图像识别技术的特征识别
[0048]
在高压电缆附件数字化工艺库中的图像识别技术中,主要涉及到lbp算子和hog算子等特征抽取及边缘检测算法。在本实施例中整个图像识别部分的流程包含图像预处理(图像降噪、图像增强)、图像复原(重建图像,恢复图像)、图像编码与压缩、图像分割(划分不同特征的区域)以及最终的识别。
[0049]
其中,lbp算子由ojala等人于96年提出,是一种特征描述的经典算子,广泛应用于图像分析领域,该算子不仅能捕获丰富的细节信息,而且能压缩冗余信息。但是当这种lbp算子的半径太大时,噪声的敏感度就会加强。梯度直方图hog由法国研究人员dalal提出。hog算法的主要目的是将灰度化,归一化的图像进行梯度计算,统计图像的梯度信息,将图像划分成小的细胞单元形成每张图纸的独有的hog特征,从而实现后续图纸的比对。
[0050]
基于高压电缆工艺化图纸本身复杂的特性,如对比度、颜色、密度分布的方法都具有局限性,为了获取更好的特征抽取和分类结果,深入研究现有的lbp算法。针对原算法的不足,利用全局及局部的像素灰度均差来决定自适应阈值的大小,使其对图纸识别有强的自适应性,提出一种自适应性阈值的lbp算法。
[0051]
本实施例中运用的自适应模式的lbp算法将窗口大小与基础lbp算法相结合,具有自适应分析特征的性能。窗口大小由水平和垂直方向的平均强度差来决定。
[0052]
假设图像为g(x,y),计算大小为(2*2
k
)
×
(2*2
k
)的活动窗口中的像素平均强度值:
[0053][0054]
式中,x为像素的横坐标,y为像素的纵坐标,a
k
(x,y)为像素(x,y)在一个活动窗口中的像素平均强度值,g(i,j)为图像中坐标为(i,j)的像素值;
[0055]
对于每一个像素,分别计算它在水平和垂直方向上互不重叠的窗口之间的像素平均强度差:
[0056][0057]
式中,e
k,h
(x,y)为水平方向上两个互不重叠的窗口之间的像素平均强度差,e
k,v
(x,y)为垂直方向上两个互不重叠的窗口之间的像素平均强度差;
[0058]
对于每一个像素,能使e
k,h
(x,y)或e
k,v
(x,y)值达到最大(无论方向)的k值用来设置最佳尺寸:s
best
(x,y)=(2*2
k
)
×
(2*2
k
);
[0059]
以上可知,s
best
(x,y)即为以(x,y)为坐标的像素点的特征基元近似大小。该尺寸与lbp算法的结合,减少了lbp在基元特征提取上的误差。
[0060]
2、ocr字符识别
[0061]
图片的字符识别过程是一整套流程,它包括图片分析、预处理、字符识别和识别矫正等,每个步骤都关系着最终识别结果的准确性。比如要进行字符识别的图片越清晰(即预处理做的越好),识别效果往往就越好。字符识别是图片的字符识别过程中最重要的环节.目前,最常用也最成熟的字符识别技术是光学字符识别(optical character recognition,ocr)。ocr是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
[0062]
在ocr识别过程中主要分为四个部分:
[0063]
1)图片预处理。该模块的功能主要是将样本图片进行尺寸统一、分割、灰度化和二值化等预处理,为后续的字符识别做准备。
[0064]
2)训练字库。利用tesseract对样本图片里的字符进行针对性训练,以提高识别准确率。
[0065]
3)字符识别。利用开源ocr引擎tesseract对图片进行字符识别。在系统中实现对一张图片的字符识别只需调用pytesseract库里的image_to_string方法。详情如下式所示,
[0066]
text=pytesseract.image_to_string(img,lang=lang,config=
′‑‑
psm 7
‑‑
oem3

)
[0067]
其中,text就是识别后返回的字符内容;lang是自训练的字库或者tesseract自带
语言包;img是预处理后的图片。
[0068]
4)识别矫正。针对拒识或误识的图片字符进行矫正。对于灰度图,可以进行灰度调整,也就是对比度增强。以其中1张灰度图为例,实验发现增强前拒识,增强后则识别正确,其增强效果如图2中所示。
[0069]
3、一致性检测算法
[0070]
分形几何学对自然界出现的一些不规则的几何体给出了数学描述,其本质是“自相似”,用分形理论进行图像分析的原理是利用图像的分形维数特征进行分析。由于分形维数直观上与物体表面的粗糙度相吻合,图纸中不同物体的粗糙度有很大差别,因此可用分形维数作为判别两张图纸中对应位置的图形是否一致的参数。
[0071]
由于高压电缆附件工艺图纸尺寸普遍偏大,本实施例采用盒维数作为分形维数的计算方式,利用分形维进行图纸比对。
[0072]
图纸比对时,将图纸分别划分为p
×
q个区域,利用分形维数计算方法进行盒子像素的计算,根据两副图纸的分形维数差值绝对值,根据参考阈值来进行判断,若小于阈值则判定为一致,反之则为不一致。从而实现最终的比对审核和判定。
[0073]
另外,标准工艺库是本方法的关键所在。本实施例通过收集各厂商电缆附件图纸及数据参数以及后期需要比对的信息,将基本信息分类存储,设计一个使用功能强大,信息量巨大的标准工艺库。
[0074]
通过一致性检测算法将处理后的电缆附件数据信息与标准工艺库的储存信息进行对比,收集不同的信息,将差异的信息记录在分析报告中,为后续审核工作提供便捷。
[0075]
本实施例还提供一种基于图像识别的高压电缆附件图纸比对系统,包括存储器和处理器,所述存储器存储有计算机程序,处理器调用所述计算机程序执行如上所述的基于图像识别的高压电缆附件图纸比对方法的步骤。
[0076]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献