一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种PID图纸图件信息的二阶识别方法

2022-08-09 10:29:49 来源:中国专利 TAG:

一种pid图纸图件信息的二阶识别方法
技术领域
1.本发明属于计算机图像处理和图像分类技术领域,涉及一种用于图纸信息计算机识别的方法,具体为pid图纸图件信息识别方法。


背景技术:

2.图纸信息识别是数字化交付领域重要的难题之一,目前普遍采用人工确定图纸中目标图件的分类和位置。基于计算机视觉的图纸信息识算法分为:传统目标检测算法和深度学习,其中传统目标检测算法人工筛选特征对于多样性的变化没有很好的鲁棒性;基于深度学习的方法对于图像中分类繁杂且差异细微的目标分类存在着错检率高的问题;因此如何结合传统算法和深度学习优势,设计一种高效的图纸图件识别方法,改善种类繁多的图纸图件分类和识别问题,成为亟待解决的问题。


技术实现要素:

3.本发明的目的在于提供一种pid图纸图件信息的二阶识别方法,为实现上述目的,本发明提供如下技术方案:一种pid图纸图件信息的二阶识别方法,包括以下步骤:s1.确定pid图纸图件共有的基础几何图形类别;s2.为图件准备基础几何图形模板,并对模板进行hog特征计算;s3.将准备好的模板,逐个对pid图纸进行归一化相关系数匹配计算,并对计算后的结果执行hog特征计算,获得匹配结果并按图件共有的基础几何图形种类分组的图件坐标集合,完成第一阶段图件的初分类;s4.利用图件坐标集合在pid图纸上进行以扩大边界的方式提取图件图像,获得按图件共有的基础几何图形类别分组的图件图像集合;s5.对提取的图件图像集合以不变形旋转和缩放的方式进行数据增强,对区分度低的图件采用重标注,并以此作为图件分类数据集;s6. 将数据增强后的第一阶段图件初分类结果按共有的基础几何图形类别输入对应的强监督分类模型训练,得到鲁棒的分类模型集,实现第二阶段图件的细分类;s7. 将pid图纸输入执行s3步骤,并将执行s3步骤后的结果输入s6中训练好的分类模型,输出图件信息以及图件坐标,实现pid图纸信息的智能读取。
4.优选的,步骤s1中确定pid图纸图件共有的基础几何图形类别,其特征在于,包括:pid图纸中的图件由规则的几何图形和线条构成,相似度较高的图件具有相同简单几何图形的特点,确定pid图纸所有图件中相似图件之间共有的简单几何图形,将共有的简单几何图形作为基础几何图形,并确定所有图件中基础几何图形的种类。共有的基础几何图形是规则几何图形,例如:圆形、正方形、三角形、矩形等;不同图件可以拥有相同基础几何图形,这些具有相同基础几何图形的图件就被分为同一类,如图2所示。
5.优选的,步骤s2中为图件准备基础几何图形模板,并对模板进行hog特征计算,其特征在于,包括:
s21. 为图件准备基础几何图形模板,基础几何图形都是规则的几何图形,选择当前图纸所需要的基础几何图形作为模板,并将模板图像二值化。由于单张图像的hog特征次数和图像的通道数相关,模板图像二值化后压缩为单通道图像,有利于降低hog特征计算的复杂度;s22.对图件模板进行hog特征计算,计算图像每个像素的梯度,梯度包括大小和方向,用于进一步捕获图件的形状信息,将图像划分为8*8的小单元,统计每个小单元的梯度直方图作为每个小单元的特征描述子;s23.将图件模板内所有每个小单元的特征描述子串联得到图件模板的hog特征描述子,用于标识图件模板的特征向量a。
6.优选的,步骤s3中将准备好的模板,逐个对pid图纸进行归一化相关系数匹配计算,并对计算后的结果执行hog特征计算,获得匹配结果并按图件共有的基础几何图形种类分组的图件坐标集合,完成第一阶段图件的初分类,其特征在于,包括:s31.用步骤s2中准备的图件模板分别对pid图纸执行归一化相关系数匹配,相关系数α表示计算图件模板和pid图纸搜索中区域之间的相似程度,其取值范围为[-1,1],当图件模板和pid图纸搜索区域完全相同时,相关系数为1,完全不同时取值为-1;s32.经过s31步骤后,初步将pid图纸中匹配度高的候选区域筛选出,由于受pid图纸某些区域交叉线和图件密集时,会出现误筛选的结果,再将从pid图纸中提取出的图件图像集合进行hog特征计算,计算方法与s22相同,通过计算得到的特征向量b;s33.采用dice距离度量图件模板的特征向量a和特征向量b的相似性,通过阈值控制去除归一化相关系数匹配误匹配的图件,达到去噪的作用,并将大于阈值的筛选结果按图件共有的基础几何图形种类分组形成图件坐标集合,完成第一阶段图件的初分类。
[0007]
优选的,步骤s4中利用图件坐标集合在pid图纸上进行以扩大边界的方式提取图件图像,获得按图件共有的基础几何图形类别分组的图件图像集合,其特征在于:采用扩大边界的方式根据s3步骤的坐标和宽高值提取图件图像以保护图件的边缘信息,并按照图件共有的基础几何图形种类分类,形成若干个图像集合,根据位置信息从pid图纸中提取并逐个保存成为独立图像。
[0008]
优选的,步骤s5中对提取的图件图像集合以不变形旋转和缩放的方式进行数据增强,对区分度低的图件采用重标注,并以此作为图件分类数据集,其特征在于:针对几何形状的图像,采用旋转和缩放的方式进行丰富数据集,旋转角度为0、
±
45
°

±
90
°

±
135
°

±
180
°
,以拟合图件在真实pid图像中出现的位置姿态,缩放比例为[0.5,1.5]的范围内进行随机缩放,以不变形的缩放和旋转方式确保几何形状不发生形变,促进分类模型训练时对图像特征的充分学习;对区分度低的图件采用重标注,由于图件数据集中存在两类图件及其相似,类别之差仅存在于线条和点的差距,直接采用分类标签进行模型训练不利于其区别特征的提取,采用强监督的方式,对相似度较高的图件添加关键部位重标注如图3所示,有助于模型参数的学习和模型分类的准确性。
[0009]
优选的,步骤s6中将数据增强后的第一阶段图件初分类结果按基础几何图形类别输入对应的强监督分类模型训练,得到鲁棒的分类模型集,实现第二阶段图件的细分类,其特征在于:s61.所述按基础几何图形类别来建立强监督分类模型是指图件有n种共有的基础
几何图形,就有n个分组,每个分组对应一个分类模型,就需要进行n次分类模型训练,最终得到n个模型,此处采用按图件种类每个建立分类模型的目的是为了提高类内差异较小图件的分类精度;s62.所述强监督分类模型指在对按共有的基础几何图形类别分组图件分别构建的分类模型,根据n种基础几何图形,设置n个分类模型中每个模型分类类别数,将数据增强后的图像数据集分批次输入分类模型充分训练,得到鲁棒的强监督分类模型。
[0010]
优选的,步骤s7将pid图纸输入执行s3步骤,并将执行s3步骤后的结果输入s6中训练好的分类模型,输出图件信息以及图件坐标,实现pid图纸信息的智能读取。
[0011]
本发明的有益效果是:提出传统算法和深度学习相结合的方式实现对pid图纸图件信息的提取,第一阶段通过归一化相关系数和hog特征向量的dice匹配实现pid图纸中图件的初分类,降低了模型对于目标类别繁多分类的难度,采用dice特征匹配降低初分类的错检;第二阶段采用强监督的方式提出对类内差距较小的图件进行重标注,提高模型对类别间差异部位的感知能力,改善了模型对图件细分类的能力,从而提高对pid图纸图件的分类和识别效果,有助于提高工程师分析理解图纸信息的效率,提升企业数字化交付的能力。
附图说明
[0012]
图1为本发明图件信息二阶识别方法流程图。
[0013]
图2为本发明图件中共有基础几何图形示意图。
[0014]
图3为本发明图件初分类类内关键部位重标注示意图。
[0015]
图4为本发明模型建立和推理过程示意图。
具体实施方式
[0016]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0017]
实施例:一种pid图纸图件信息的二阶识别方法,如图1所示,包括以下步骤:s1. 确定pid图纸图件共有的基础几何图形类别;根据图纸提供的图件目录,抽取按图件中共有的基础几何图形进行初分类。
[0018]
s2. 为图件准备基础几何图形模板,并对模板进行hog特征计算:s21. 为图件准备基础几何图形模板,基础几何图形都是规则的几何图形,选择当前图纸所需要的基础几何图形作为模板,并将模板图像二值化。由于单张图像的hog特征次数和图像的通道数相关,模板图像二值化后压缩为单通道图像,有利于降低hog特征计算的复杂度;s22.对图件模板进行hog特征计算,计算图像每个像素的梯度,梯度包括大小和方向,用于进一步捕获图件的轮廊信息,将图像划分为8*8的小单元,统计每个小单元的梯度直方图为每个小单元的特征描述子;s23.将图件模板内所有每个小单元的特征描述子串联得到图件模板的hog特征描述子,用于标识图件模板的特征向量a。
[0019]
s3. 将准备好的模板,逐个对pid图纸进行归一化相关系数匹配计算,并对计算后的结果执行hog特征计算,获得匹配结果并按图件共有的基础几何图形种类分组的图件坐标集合,完成第一阶段图件的初分类:s31.用步骤s2中准备的图件模板分别对pid图纸从左至右、从上至下以滑动窗口的方式执行归一化相关系数匹配;s32.初步将pid图纸中匹配度高的候选区域筛选出,再将从pid图纸中筛选出的图件图像集合进行hog特征计算,计算方法与s22相同,通过计算得到的特征向量b;s33. 采用dice距离度量图件模板的特征向量a和特征向量b的相似性,通过阈值控制去除归一化相关系数匹配误匹配的图件,达到去噪的作用,并将大于阈值的筛选结果按图件共有的基础几何图形种类分组形成图件坐标集合,完成第一阶段图件的初分类。
[0020]
s4. 利用图件坐标集合在pid图纸上进行以扩大边界的方式提取图件图像,获得按图件共有的基础几何图形类别分组的图件图像集合;采用扩大边界的方式根据s3步骤的坐标和宽高值提取图件图像以保护图件的边缘信息,并按照基础几何图形分类,形成若干个图像集合,其中扩大边界的方式为宽和高分别扩充4个像素单位,扩充像素大小根据pid图纸中图件之间的最小距离确定。
[0021]
s5. 对提取的图件图像集合以不变形旋转和缩放的方式进行数据增强,对区分度低的图件采用重标注,并以此作为图件分类数据集。
[0022]
针对几何形状的图像,采用旋转和缩放的方式进行丰富数据集,旋转角度为0、
±
45
°

±
90
°

±
135
°

±
180
°
,以拟合图件在真实pid图像中出现的位置姿态,缩放比例为[0.5,1.5]的范围内进行随机缩放,以不变形的缩放和旋转方式确保几何形状不发生形变,促进分类模型训练时对图像特征的充分学习。
[0023]
s6. 将数据增强后的第一阶段图件初分类结果按共有的基础几何图形类别输入对应的强监督分类模型训练,得到鲁棒的分类模型集,实现第二阶段图件的细分类;根据n种基本几何图形,设置n个分类模型中每个模型细分类类别数,将数据增强后的第一阶段图件初分类结果按基础几何图形类别分别输入对应的分类模型充分训练,得到鲁棒的强监督分类模型。
[0024]
s7. 将pid图纸输入执行s3步骤,并将执行s3步骤后的结果输入s6中训练好的分类模型,输出图件信息以及图件坐标,实现pid图纸信息的智能读取;经过s1-s6步骤后,得到鲁棒的强监督分类模型,在模型部署后,输入一张新的pid图纸,首先执行s3步骤得到按基础几何图形初分类的结果,进一步的将结果输入强监督分类模型输出每个图件的细分类结果,实现pid图纸信息的二阶识别方法。
[0025]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献