一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

核电厂图纸备件信息筛选录入方法及系统与流程

2022-04-13 23:41:56 来源:中国专利 TAG:


1.本发明涉及核电领域,尤其涉及一种核电厂图纸备件信息筛选录入方法及系统。


背景技术:

2.核电厂备品备件种类繁多,数量巨大。在生产准备阶段根据图纸和设备运行维修手册信息摘录大量信息并最终生成数据库,由于部分零部件可能在不同图纸中反复出现,因而备件数据必将存在大量的重复数据,这些重复的数据需要人工进行合并和去重。
3.经过对多个核电厂图纸和备件数据库进行分析,双堆机组的备件数据在去重之前,高达30万至40万项之间,去重后约10万项。而每1项备件,多达将近50个字段。人工判断工作量大、准确性和完整难以保证。
4.在实际操作过程中,由于不同厂家的图纸可能排布规则不完全一样,即使完全相同的零部件,体现到数据库中也可能存在差异,这对重码识别和判断造成严重的障碍。


技术实现要素:

5.本发明要解决的技术问题在于,提供一种核电厂图纸备件信息筛选录入方法及系统。
6.本发明解决其技术问题所采用的技术方案是:构造一种核电厂图纸备件信息筛选录入方法,包括以下步骤:
7.s10、表格识别:从图纸中识别含有表格信息的图形,表格信息包括表格线条、表格位置、由表格线条构成的单元格、单元格位置、各单元格内的备件信息;
8.s20、备件信息识别提取:识别单元格内中的文本信息,并提取需录入第一系统的第一备件信息;第一备件信息包括备件对应的制造厂参考号、制造商代码、供应商代码、材料、备件型号、备件中文描述;
9.s30、备件信息修正:根据通用文本和/或预设格式文本对第一备件信息进行修正;
10.s40、备件信息重构:根据第二系统的备件项目录入要求,将第一备件信息的内容进行重构,对应转换为适用于第二系统的第二备件信息;第二备件信息包括备件的供应商零件编号、第二制造商、基本物料、第二描述;
11.s50、数据比对:检索并对比第二备件信息各项目内容在第二系统中是否具有相同的备件数据,若全部相同,将第二系统数据中检索到的与第二备件信息对应的条码信息与第一备件信息一并录入第一系统;若全部不相同,编译新条码信息,与对应的第一备件信息录入第一系统;若部分相同或相似,发送至人工判定第二备件信息在第二系统数据中是否存在相同的信息内容。
12.优选地,在步骤s30中,还包括以下子步骤;
13.s31、备件信息过滤:检索同一核电厂图纸中提取且重复的第一备件信息,并将重复部分删除;和/或,检索同一核电厂图纸中提取且残缺的第一备件信息,并将残缺部分删除。
14.优选地,在步骤s50数据比对过程中,若第二备件信息中的任一项目内容相较于第二系统中对应备件数据的相似度大于预设值,则判断该两者相同。
15.优选地,在步骤s50中,包括以下子步骤:
16.s51:根据预设的对照表,辅助检索第二备件信息在第二系统数据是否存在相同信息内容。
17.优选地,在步骤s50中,还包括以下子步骤:
18.s52:在录入第一系统的过程中,检索录入的第一备件信息内容在第一系统中是否存在完全相同的数据,若是,则删除第一备件信息;若否,则保留录入的第一备件信息。
19.优选地,在步骤s52中,包括以下子步骤:
20.s52-1:若保留录入的第一备件信息中部分项目内容空缺于第一系统中,则合并录入该部分项目内容于第一系统中。
21.优选地,所述第一系统包括meip系统或eip系统;所述第二系统为sap系统。
22.优选地,所述对照表包括备件信息对应的中英译文。
23.本发明还构造了一种基于上述述的核电厂图纸备件信息筛选录入方法的核电厂图纸备件信息筛选录入系统,包括:
24.表格识别模块:用于从核电厂图纸中识别含有表格信息的图形;
25.信息识别提取模块,用于识别核电厂图纸中的文本信息,并提取需录入第一系统的第一备件信息;
26.信息修正模块,用于对第一备件信息进行修正;
27.信息重构模块,用于重构第一备件信息的内容并转换为第二备件信息;
28.数据比对模块,用于判断第二备件信息在第二系统数据中是否存在相同内容,进而筛选并录入不重复的第一备件信息于第一系统;
29.人机交互模块,用于在第二备件信息在第二系统数据中存在部分相似或相同内容时,反馈至人工确定。
30.实施本发明具有以下有益效果:可用于核电厂图纸中的备件信息录入系统的流程中,在保证录入的备件信息准确性的同时,减少重复的备件编码,进而减少编码成本以及库存备件种类,降低库存成本。
附图说明
31.下面将结合附图及实施例对本发明作进一步说明,附图中:
32.图1是本发明核电厂图纸备件信息筛选录入方法及系统中核电厂图纸备件信息筛选录入方法的程序流程图。
具体实施方式
33.为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。以下描述中,需要理解的是,“前”、“后”、“上”、“下”、“左”、“右”、“纵”、“横”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“头”、“尾”等指示的方位或位置关系为基于附图所示的方位或位置关系、以特定的方位构造和操作,仅是为了便于描述本技术方案,而不是指示所指的装置或元件必须具有特定的方位,因此不能理解为对本发明的限制。
34.还需要说明的是,除非另有明确的规定和限定,“安装”、“相连”、“连接”、“固定”、“设置”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。当一个元件被称为在另一元件“上”或“下”时,该元件能够“直接地”或“间接地”位于另一元件之上,或者也可能存在一个或更多个居间元件。术语“第一”、“第二”、“第三”等仅是为了便于描述本技术方案,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”、“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
35.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
36.核电厂备品备件种类繁多,数量巨大。在现有技术中核电厂的备件数据包括处于生产准备阶段的第一备件数据以及处于生产运营阶段的第二备件数据。对应地,第一备件数据存放于核电厂的第一系统中,第二备件数据存放于核电厂的第二系统中。第二备件数据基于第一备件数据,在第一备件数据的基础上仅作出部分整合和数据补充处理。可以理解地,第一系统为meip系统或者eip系统;第二系统为sap系统。在生产准备阶段根据图纸和设备运行维修手册信息摘录大量信息并最终生成数据库,由于部分零部件可能在不同图纸中反复出现,因而备件数据必将存在大量的重复数据,这些重复的数据需要人工进行筛选并去重。
37.因此,本发明构造了一种核电厂图纸备件信息筛选录入方法及系统,可用于核电厂图纸中的备件信息录入系统的流程中,在保证录入的备件信息准确性的同时,减少重复的备件编码,进而减少编码成本以及库存备件种类,降低库存成本。其中,核电厂图纸备件信息筛选录入方法包括:
38.s10、表格识别:从图纸中识别含有表格信息的图形,表格信息包括表格线条、表格位置、由表格线条构成的单元格、单元格位置、各单元格内的备件信息;
39.可以理解地,核电厂图纸内容包括:备件结构图、性能表、bom表、eomm手册号、电站图号、制造厂参考号、制造商代码、供应商代码、材料、备件型号、备件中文描述以及其他残余信息;而本发明的目的在于,将当中的制造厂参考号、制造商代码、供应商代码、材料、备件型号、备件中文描述进行识别以及提取出来,而该部分内容通常在图纸中都会以表格的形式进行罗列,因此,本发明通过表格识别,以规划出具体位置,并在该具体位置中进行文本识别,以免发生文本混淆的问题。在本发明的一些实施例中,通过在图纸中识别并查找带有多个交汇点的横纵线;抑或者,通过在图纸中查找方形图形,以判断为表格。需要说明的是,如果在表格中检索不到文本信息,可认为该是空表格,或是备件结构图的一部分内容,此时可忽略。
40.s20、备件信息识别提取:识别单元格内中的文本信息,并提取需录入第一系统的第一备件信息;
41.进一步地,在步骤s20中,可通过ocr图片识别技术实现识别核电厂图纸中的文本
信息以及提取第一备件信息的功能。可以理解地,ocr(optical character recognition)文字识别是将需要识别的文本用字符识别方法将其形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程;ocr识别工具可参考现有技术,这里就不加以说明。ocr识别工具可基于计算机而实现,在步骤s20之前,可以通过rpa机器人启动ocr识别工具,以实现自动化。
42.进一步地,第一备件信息包括备件对应的制造厂参考号、制造商代码、供应商代码、材料、备件型号、备件中文描述;通过ocr图片识别技术,从表格中的文本信息提取出需要录入第一系统的第一备件信息;提取的方式可以是基于预设的参考文本信息进行比对,举例说明,制造商代码/供应商代码该类信息是核电厂提前创建的,可以将预先创建的制造商代码总表/供应商代码总表导入参考文本信息,在识别出带有相同的代码则可判断为制造商代码/供应商代码;亦可以限定提取信息的条件,举例说明,备件型号一般为数位字母加数字组成的字符串,通过检索符合字母、数字个数条件的字符串以判断为备件型号。
43.s30、备件信息修正:根据通用文本和/或预设格式文本对第一备件信息进行修正;
44.可以理解地,在步骤s30中,通用文本指代在图片识别中形状相似导致容易发生错误判断的文本;
45.举例说明:字母“x
””
和乘号
“×”
;字母“0”和数字“0”字母“i”和数字“1”字母“z”和数字“2”;字母“s”和数字“5”字母“g”和数字“6”;小写字母“g”和数字“9”。
46.预设格式文本指代符合录入系统的要求文本格式的文本,举例说明:
47.1)所有字符使用半角字符,不使用全角字符;
48.2)所有英文字母大写,国家标准规定的字符除外,如材料0cr18ni9等;
49.3)所有中文使用简体汉字;
50.4)除了备注这个长文本类型字段外,其他字段不使用标点符号作为分隔符,其他字段中的标点符号一律用空格作为分隔符,例如:typb:6sm,90s2,50hz,230/400v,1.5kw,5.76a应该录入为type:6sm 90s2 50hz 230/400v1.5kw 5.76a;英文文本使用英文标点符号,中文文本使用中文标点符号;
51.5)乘号使用“*”,不使用“x”;
52.6)除号使用“/”,不使用“一”;
53.7)正负号使用“土”,不使用“ /
‑”

54.8)用“》=”表示大于等于,不使用“三”;
55.9)用“《=”表示小于等于,不使用“《”;
56.10)用“《》”表示不等于,不使用“去”;
57.11)分数“1-1/2”表示一又二分之一;
58.12)用“x^y”表示x的y次方,例如:m^2表示平方米,23表示2的3次方,2*10^-2表示2乘以10的负2次方;
59.13)括号使用“()”,不使用“[]”、“{}”;
[0060]
14)用“~”表示范围;
[0061]
15)用
“‑”
表示点到点;
[0062]
16)用
“””
表示英寸;
[0063]
17)电阻单位欧拇使用“o”,不使用“ohm”;
[0064]
18)摄氏度使用“℃”,不使用“c”;
[0065]
19)用“no.”表示“number”的缩写,不使用“no”或其他表示,
[0066]
20)对于制造厂参考号和图(项)号字段,用“&”表示并列关系,不使用“and”和“ ”,“ ”仅用于表示加号。
[0067]
可选地,在步骤s30中,还包括以下子步骤;
[0068]
s31、备件信息过滤:检索同一核电厂图纸中提取且重复的第一备件信息,并将重复部分删除;和/或,检索同一核电厂图纸中提取且残缺的第一备件信息,并将残缺部分删除。
[0069]
可以理解地,在核电厂图纸中可能存在重复或者残缺的第一备件信息,通过将该类重复或者残缺的信息进行筛选,以保证录入系统时候的准确性。残缺的信息删除后在录入系统时对应栏目会显示空白,工作人员在查看系统信息时可重新确认对应残缺信息的图纸,手动录入对应残缺信息。
[0070]
s40、备件信息重构:根据第二系统的备件项目录入要求,将第一备件信息的内容进行重构,对应转换为适用于第二系统的第二备件信息;
[0071]
可以理解地,在步骤s40中,第一系统可以是meip系统或者eip系统;第二系统为sap系统。在sap系统中,第二备件信息包括备件的供应商零件编号、第二制造商、基本物料、第二描述。可以理解地,第一备件信息中对应的项目与第二备件信息中的项目名称相互对应;具体地,制造厂参考号对应供应商零件编号,制造商代码或者供应商代码对应第二制造商、材料对应基本物料、备件型号及备件中文描述对应第二描述。
[0072]
需要说明的是,由于sap系统中无需区分供应商或制造商,因此在sap系统中的制造商该一项目可以对应meip/eip系统中的制造商代码或者供应商代码;在比对第二备件信息是否存在于第二系统时,可将第一备件信息中的制造商代码和供应商代码对应的制造商和供应商均考虑进去。
[0073]
更进一步地,制造厂参考号与供应商零件编号、材料对应基本物料该两类项目中的内容相同。制造商代码或者供应商代码根据制造商代码总表/供应商代码总表,转换为第二备件信息中的制造商该一项目内容。在第一备件信息中的备件型号及备件中文描述这两者的项目,对应第二备件信息中的描述该一项目,在重构中,需要将备件中文描述与备件型号进行组合,并使用符号区分于备件中文描述及备件型号,以形成第二备件信息;举例说明,如备件中文描述为“真空泵油”,备件型号为“vm100”,则组合后的描述为“真空泵油[vm100]”。另外,第一备件信息还包括备件的业主质保等级,对应第二备件信息中的质量等级,其两者项目的内容相同。
[0074]
s50、检索并对比第二备件信息各项目内容在第二系统中是否具有相同的备件数据,若全部相同,将第二系统数据中检索到的与第二备件信息对应的条码信息与第一备件信息一并录入第一系统;若全部不相同,编译新条码信息,与对应的第一备件信息录入第一系统;若部分相同或相似,发送至人工判定第二备件信息在第二系统数据中是否存在相同的信息内容。
[0075]
在步骤s50中,第二系统中的数据是已处于生产运营阶段的备件数据,其为相对准确的备件数据,可作为录入用于存放处于生产准备阶段的第一备件数据的第一系统的基准。在图纸中第一备件信息经过重构后得到的第二备件信息,用于与第二系统数据库进行
对比。若在第二系统数据库中找到与第二备件中各项目信息相同的数据内容,则可直接判断为相同备件,并将第二系统对应的条码信息与第一备件信息一并录入第一系统;若在第二系统数据库中的备件数据内容与第二备件中各项目信息均不相同,则可直接判断为不同备件,编译新条码信息,以与对应的第一备件信息录入第一系统;若部分相同或相似,由人工判定。可以理解地,条码信息可以是十字码,在第一系统及第二系统的数据库中,每一已登记的备件被赋予一个独立的十字码,该十字码在第一系统及第二系统中是共用的;在备件信息录入第一系统时,为了保证同一备件只存在一个十字码,则需要在第二系统的数据库中搜索是否已有相同备件。在判断为相同备件后,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统。
[0076]
可选地,在对比过程中,若第二备件信息中的任一项目内容相较于第二系统中对应备件数据的相似度大于预设值,则判断该两者相同。相似度可依赖于ocr图片识别技术或现有技术,这里就不加以说明。
[0077]
在步骤s50中,还可包括以下子步骤:
[0078]
s51:根据预设的对照表,辅助检索第二备件信息在第二系统数据是否存在相同信息内容;
[0079]
可以理解地,相同备件信息可能存在不同的表述方式;举例说明,基本物料“氟橡胶”在第二备件信息中以中文记载,而在第二系统中英文记载,其英文记载为“fkm或fpm或aflas或fluorel或technoflon”。因此,可预先设置对照表,对照表内包括备件信息的中文与英文的译文,以提高检索的正确率。当然,对照表中不仅包括上述的译文,其他内容应也涵盖于本发明的保护范围。
[0080]
进一步地,在步骤s50中,还包括以下步骤:
[0081]
s52:在录入第一系统的过程中,检索录入的第一备件信息内容在第一系统中是否存在完全相同的数据,若是,则删除第一备件信息;若否,则保留录入的第一备件信息。
[0082]
进一步地,在步骤s52中,还包括以下子步骤:
[0083]
s52-1:若录入的第一备件信息中部分项目内容空缺于第一系统中,则合并录入该部分项目内容于第一系统中。
[0084]
可以理解地,合并录入指代第一系统中备件对应的备件信息部分残缺,在第一备件信息录入时可与第一系统中备件对应的备件信息进行合并,将残缺的项目内容补充完整。
[0085]
可选地,在录入第一备件信息于第一系统后,自动同步bom数据库或者自动生成bom数据维护申请单,并按指定格式产生清单,以完成核电厂中的流程工作;自动同步bom数据库或者自动生成bom数据维护申请可依赖于rpa机器人技术。
[0086]
基于同一总发明构思,本发明还构造一种基于核电厂图纸备件信息筛选录入方法的核电厂图纸备件信息筛选录入系统,该系统包括:
[0087]
信息识别提取模块,用于识别核电厂图纸中的文本信息,并提取需录入第一系统的第一备件信息;
[0088]
信息修正模块,用于对第一备件信息进行修正;
[0089]
信息重构模块,用于重构第一备件信息的内容并转换为第二备件信息;
[0090]
数据比对模块,用于判断第二备件信息在第二系统数据中是否存在相同内容,进
而筛选出不重复部分并录入第一系统。
[0091]
进一步地,核电厂图纸备件信息筛选录入系统还包括人机交互模块,用于在第二备件信息在第二系统数据中存在部分相似或相同内容时,反馈至工作人员确定。
[0092]
进一步地,数据比对模块被配置为:
[0093]
若第二备件信息中的供应商零件编号、第二制造商、基本物料、第二描述与第二系统数据中对应项目内容相同,则判断为第二系统中已录入相同备件的信息,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统。可选地,判断确定第二系统中已录入相同备件的信息后,通过邮件推动报表至相关人员;自动生成扩码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台;需要说明的是,sap系统是核电站群厂共用的数据系统,而meip/eip系统可以单独存在于每个核电厂中,若其一核电厂需要导入备件信息至meip/eip系统需要提交扩码申请。
[0094]
或者,若第二备件信息中的第二制造商、基本物料、第二描述与第二系统数据中对应项目内容相同,且第二备件信息中的供应商零件编号相较于第二系统数据中对应项目内容达到90%相似率以上,判断为高度疑似重码物项,推送到人机交互界面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则认为第二备件信息中的供应商零件编号、制造商、基本物料、描述与第二系统中对应备件数据相同,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0095]
或者,若第二备件信息中的供应商零件编号、基本物料、第二描述相较于第二系统数据中对应项目内容的综合相似率达到90%相似率以上,且第二备件信息中的第二制造商与第二系统数据中对应项目内容相同,则判断为高度疑似重码物项,推送到人机交互界面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则认为第二备件信息中的供应商零件编号、制造商、基本物料、描述与第二系统中对应备件数据相同,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0096]
或者,若第二备件信息中的基本物料相较于第二系统数据中对应项目内容的相似率达到90%相似率以上,且第二备件信息中的供应商零件编号、第二描述相较于第二系统数据中对应项目内容的综合相似率达到80%相似率以上,同时第二备件信息中的第二制造商与第二系统中对应备件数据相同,则判断为高度疑似重码物项,推送到人机交互界面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则认为第二备件信息中的供应商零件编号、制造商、基本物料、描述与第二系统中对应备件数据相同,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0097]
或者,若第二备件信息中的供应商零件编号、基本物料、第二描述的相较于第二系统数据中对应项目内容的综合相似率达到80%相似率以上,且第二备件信息中的第二制造商与第二系统数据中对应项目内容相同,则判断为高度疑似重码物项,推送到人机交互界
面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则认为第二备件信息中的供应商零件编号、制造商、基本物料、描述与第二系统中对应备件数据相同,将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0098]
或者,若第二备件信息中的供应商零件编号、基本物料、第二描述的相较于第二系统数据中对应项目内容的综合相似率达到80%相似率以上,且第二备件信息中的第二制造商与第二系统数据中对应项目内容不相同,则判断为疑似重码物项,推送到人机交互界面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则进一步推送制造商选择界面,如选择新供应商,则产生供应商修改单据,并将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如选择第二系统中已有的供应商,则自动同步制造商数据。如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0099]
或者,若第二备件信息中的供应商零件编号、第二描述的相较于第二系统数据中对应项目内容的综合相似率达到80%相似率以上,则判断为疑似重码物项,推送到人机交互界面,并显示对比画面,高亮显示差异点;工作人员在人机交互界面处理,点击“相同”或“不同”;如人工点击“相同”,则进一步推送制造商选择界面,如选择新供应商,则产生供应商修改单据,并执行将第二系统对应的条码信息传输至第一系统,与第一备件信息一并录入第一系统;如选择第二系统中已有的供应商,则自动同步制造商数据。如人工点击“不同”,则自动生成新编码申请,并按指定格式生成清单,推送至合同采购部/备件中心接口人平台。
[0100]
可以理解的,以上实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,可以对上述技术特点进行自由组合,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,凡跟本发明权利要求范围所做的等同变换与修饰,均应属于本发明权利要求的涵盖范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献