一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图像识别技术的建筑图纸信息自动提取方法及系统与流程

2022-02-19 13:58:28 来源:中国专利 TAG:

技术特征:
1.一种基于图像识别技术的建筑图纸信息自动提取方法,其特征在于,包括:预先通过人工标注每一建筑图纸模板的匹配锚点和关键词字符区,得到匹配类型模板库的类型匹配模板;当前待识别建筑图纸与每一类型匹配模块的坐标体系对应,等比找到所述待识别建筑图纸相应锚点和对应的关键信息区,所述对应关键信息区进行识别数据提取时,只需确认该些信息是否与类型匹配模板上的信息是否匹配,匹配度最高的为所述建筑图纸对应的相似度最高类型匹配模板;匹配度最进一步为:当前待识别图纸找到关键信息区,分别对每一块进行识别数据提取,与一类型匹配模块对应关键信息区的关键点,匹配计算相似度得到相似度向量,再通过欧几里德距离算法计算向量距离,从而得到相似度,相似度值最高为所述建筑图纸对应的相似度最高类型匹配模板;找到该匹配度最高的类型匹配模板,找到该类型模板下适配的多个构件子匹配模板;对待识别建筑图纸进行轮廓信息提取,每一轮廓信息与所述构件的子匹配模板时进行构件匹配,找到所述待识别建筑图纸的构件信息,或者将构件子匹配模板中的每一构件子匹配模板与待识别建筑图纸的轮廓进行比对由此找到所述待识别建筑图纸的构件信息;将所述待识别建筑图纸的所述构件信息截取,用ssd算法对所述待识别建筑图纸的所述非构件进行进行识别,并形成所述待识别建筑图纸的数字化信息。2.如权利要求1所述的方法,其特征在于,用ssd算法对所述待识别建筑图纸的所述非构件进行进行识别进一步包括:遍历所有建筑图纸,获得原始图纸文件信息集和图纸文件集g1、g2,同时对g2进行格式转换和图纸预处理,获得预处理后的jpg格式的图纸文件集g3;采用ssd算法对jpg格式的图纸文件集g3进行训练,获得非构件检测模型f,输出建筑图纸非构件信息集g4,具体方法为:(2.1)定义c1、c2分别为单张图纸非构件类别信息集、识别准确率信息集,定义class、scoring分别为单个非构件的类别、识别准确率,c1={class1,class2,

,classd,

,classd},classd为c1中的第d个类别,其中,d=card(c1),c2={scoring1,scoring2,

,scoringe,

,scoringe},scoringe为c2中的第e个识别准确率,其中,e=card(c2);(2.2)定义data为单张非构件数据集,并且满足关系data={c1,c2},定义建筑图纸测试集、训练集为r1、r2,r1、r2赋初值为0,定义循环变量j2用来遍历g3,j2赋初值为0;(2.3)对建筑图纸namea使用标注工具label img对门、底层楼梯、中间层楼梯、顶层楼梯、墙壁进行标注,生成与namea同名的xml文件,获得xml文件集r3;(2.4)j2=j2 1;(2.5)如果j2<a,其中,a为建筑图纸的总数,转到步骤(2.3),否则转到步骤(2.6);(2.6)将g3中的建筑图纸和r3中对应的xml文件按照3:7的比例分别放入r1和r2中;(2.7)分别使用xml_to_csv.py和generate_tfrecord.py对r1和r2中的xml文件分别转换为csv格式文件和tfrecord格式文件,分别得到测试数据集r4和训练数据集r5;(2.8)使用ssd算法对r4、r5进行训练,获得非构件识别模型f;(2.9)将所得非构件识别模型f对建筑图纸进行非构件检测,获得建筑图纸非构件信息集g4,其中,g4={data1,data2,

,dataa,

,dataa},dataa为g4中的第a张图纸的非构件信息集,同时以csv格式导出;
步骤(3)等梯度调整衰减学习率decayed_learning_rate,获得最优检测模型集g5;输出最优检测模型集g5。3.如权利要求1所述的方法,其特征在于,形成所述待识别建筑图纸的数字化信息进一步包括:将所述待识别建筑图纸的坐标化,并所述识别出来的构件与非构件映射在其坐标化下的信息分别进行保存,并保存其每一构件与非构件的属性信息。4.如权利要求1所述的方法,其特征在于,匹配计算相似度得到相似度向量,再通过欧几里德距离算法计算向量距离进一步包括:欧几里德距离是指多维空间两点间的距离,这是一种用直尺测量出来的距离,当前待待识别图纸找到关键信息区的信息与模板对应关键信息区的字符分别标记为(x1,x2,x3....xn)和(y1,y2,y3.....yn),则欧几里德距离的计算公式为:通过一一对待识别关键信息区的字符在内的标识与匹配模板中对应区域的字符在内的标识进行相似度计算,可得到匹配模块对应的相似度,以得到匹配模板库中相似度最高的匹配模块。5.一种基于图像识别技术的建筑图纸信息自动提取系统,其特征在于,类型模板库:存储类型模板库构件子匹配模板:用于存储每一类型模板库对应的子构件模板;识别处理单元:用于找到该匹配度最高的类型匹配模板,找到该类型模板下适配的多个构件子匹配模板;对待识别建筑图纸进行轮廓信息提取,每一轮廓信息与所述构件的子匹配模板时进行构件匹配,找到所述待识别建筑图纸的构件信息,或者将构件子匹配模板中的每一构件子匹配模板与待识别建筑图纸的轮廓进行比对由此找到所述待识别建筑图纸的构件信息;将所述待识别建筑图纸的所述构件信息截取,用ssd算法对所述待识别建筑图纸的所述非构件进行进行识别,并形成所述待识别建筑图纸的数字化信息。

技术总结
一种基于图像识别技术的建筑图纸信息自动提取方法和系统,包括:预先通过人工标注每一建筑图纸模板的匹配锚点和关键词字符区,得到匹配类型模板库的类型匹配模板;找到该匹配度最高的类型匹配模板,找到该类型模板下适配的多个构件子匹配模板;对待识别建筑图纸进行轮廓信息提取,每一轮廓信息与所述构件的子匹配模板时进行构件匹配,找到所述待识别建筑图纸的构件信息,或者将构件子匹配模板中的每一构件子匹配模板与待识别建筑图纸的轮廓进行比对由此找到所述待识别建筑图纸的构件信息;将所述待识别建筑图纸的所述构件信息截取,用SSD算法对所述待识别建筑图纸的所述非构件进行进行识别,并形成所述待识别建筑图纸的数字化信息。化信息。化信息。


技术研发人员:王策
受保护的技术使用者:智维云图(上海)智能科技有限公司
技术研发日:2021.11.11
技术公布日:2022/1/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献