一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电力报告图片OCR识别的数据结构化方法、装置及存储介质与流程

2022-07-23 06:22:27 来源:中国专利 TAG:

一种电力报告图片ocr识别的数据结构化方法、装置及存储介质
技术领域
1.本发明涉及电力生产管理领域,尤其涉及一种电力报告图片ocr识别的数据结构化方法、装置及存储介质。


背景技术:

2.随着电网企业数字化转型进程加快,对配网生产管理提出了更高要求,需要对电力纸质报告进行结构化数据存储。由于历史原因,配网生产管理部分信息化应用程度不足,以往都是采用纸质报告进行存档。在生产管理过程中仍然存在造成无法真实反映设备情况,给生产决策带来不确定性。
3.在电力生产作业中,非结构化数据是生产的重要组成部分,非结构化报表数据(图片、扫描件、纸质)仍然不可或缺,而且将一直存在生产过程中,包含的内容不能被计算机直接读取、识别和检索,也不能直接利用计算机来进行数据的分析和挖掘。因此,需要对非结构化进行建模,构建设备全过程识别结构化描述模型,将纸质报告进行数据结构化,与业务建立逻辑关系,形成生产大数据,为生产决策提供决策支撑。


技术实现要素:

4.为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供一种电力报告图片ocr识别的数据结构化方法、装置及存储介质。
5.第一方面,本发明提供一种电力报告图片ocr识别的数据结构化方法,包括:
6.根据技术服务中心提供多租户权限管理,通过ocr模板树模块配置用户角色权限以针对电力不同业务用户使用不同ocr识别模板,对报告图片类型划分不同识别类型进行配置不同模板树节点;
7.更进一步地,针对电力报告不同类型进行结构化业务分类,如试验报告、检修报告、验收报告、其他报告等,将配置完成的ocr识别模板与预设的模板树节点关联,把ocr识别模板与模板树建立对应关系并保存;
8.更进一步地,需要对不同类型的报告梳理相同标签字段,按照ocr识别字典规则对标签进行结构初始化,针对相同标签设置统一识别类型,以提供给模板标注作为通用化标签。
9.更进一步地,上传报告图片作为模板标注图片,标注图片按照原大小加载作为底图,通过报告图片与通用化标签进行定位标注,保存文字在图片中的位置坐标。
10.更进一步地,利用技术服务中心提供的图片切割技术,按照计算的图像深度与图像通道对图像进行切割,通过设定坐标信息计算出矩阵的下标范围,取范围内的子矩阵信息,按照标注的坐标对图片进行切割。
11.第二方面,本技术提供一种电力报告图片ocr识别的数据结构化方法的系统,其特征在于,包括:通过网络连接的技术服务中心、应用服务中心、算法服务中心、文件服务中心
与数据中心。
12.第三方面,本技术提供一种电力报告图片ocr识别的数据结构化方法的存储介质,实现电力报告图片ocr识别的数据结构化方法的存储介质存储至少一条指令,读取并执行所述指令实现所述的电力报告图片ocr识别的数据结构化方法。
13.本发明实施例提供的上述技术方案与现有技术相比具有如下优点:
14.本技术通过ocr模板树模块配置用户角色权限以针对电力不同业务用户使用不同ocr识别模板进行模板树结构化。通过电力报告不同类型进行结构化业务分类,将配置完成的ocr识别模板与模板树节点关联。按照ocr识别字典规则对标签进行结构初始化,针对相同标签设置统一识别类型,以提供给模板标注作为通用化标签。上传报告图片作为模板标注图片,通过报告图片与通用化标签进行定位标注,保存文字在图片中的位置坐标。通过技术服务中心提供的图片切割技术,按照标注的坐标对图片进行切割。切割小图片利用算法服务中心提供的ocr技术进行识别,最后进行持久化处理形成结构化数据。构建报告全过程识别结构化描述模型,实现电力纸质报告数据结构化、数据可视化,支撑业务应用。
附图说明
15.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例提供的制定并执行电力纸质报告ocr识别结构化的总体设计流程图;
18.图2为本发明实施例提供的制定并执行电力纸质报告ocr识别结构化的实施流程图;
19.图3为本发明实施例提供的电力纸质报告ocr识别结构化的系统的示意图。
具体实施方式
20.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
22.实施例1
23.本发明实施例提供一种电力报告图片ocr识别的数据结构化方法,包括:
24.参阅图2所示,执行电力报告图片ocr识别的数据结构化的过程包括:
25.s10,技术服务中心提供多租户权限管理,该多租户权限管理分为用户角色权限、角色菜单权限、角色模板树权限,对报告图片类型划分不同识别类型进行配置不同模板树节点。
26.s20,根据电力报告不同类型进行结构化业务分类,其中相同类型电力报告可能模板也不相同,按照模板规则将电力报告进行分类,相同分类配置ocr识别模板,将配置完成的ocr识别模板与预设的模板树节点关联,把ocr识别模板与模板树建立对应关系并保存。
27.s30,对不同类型的报告梳理相同标签字段,按照ocr识别字典规则对标签进行结构初始化。ocr识别字典规则通过应用服务中心提供文字词组形成标签初始化规则。
28.s40,ocr识别字典信息标签类型包括普通标签内容、普通表格内容、xy表格内容,判断标签类型是否普通表格内容或xy表格内容,是则执行s50,否则执行s60。
29.s50,把标签信息与表格信息建立关联关系。
30.s60,ocr识别字典信息是否包含标签内容,是则执行s70,否则执行s80。
31.s70,录入分隔符信息。
32.s80,将纸质报告扫描为图片,上传报告图片到文件服务中心,图片按照原大小加载作为底图,通过报告图片与通用化标签进行定位标注,应用服务中心提供可视化标注,保存文字在图片中的位置坐标。
33.s90,通过设定坐标信息计算出矩阵的下标范围,取范围内的子矩阵信息,按照标注的坐标对图片进行切割。
34.s100,通过切割小图片利用算法服务中心提供的ocr技术进行识别,最后持久化处理形成结构化数据,该结构化数据为识别的ocr报告标签信息,并且根据数据库字典规则保存到数据中心。
35.实施例2
36.参阅图3所示,本技术实施例提供一种电力报告图片ocr识别的数据结构化方法的系统,包括:通过网络连接的技术服务中心、应用服务中心、算法服务中心、文件服务中心与数据中心。
37.实施例3
38.本技术实施例提供一种电力报告图片ocr识别的数据结构化方法的存储介质,所述实现电力报告图片ocr识别的数据结构化方法的存储介质存储至少一条指令,读取并执行所述指令实现所述的电力报告图片ocr识别的数据结构化方法。
39.本技术通过ocr模板树模块配置用户角色权限以针对电力不同业务用户使用不同ocr识别模板进行模板树结构化。通过电力报告不同类型进行结构化业务分类,将配置完成的ocr识别模板与模板树节点关联。按照ocr识别字典规则对标签进行结构初始化,针对相同标签设置统一识别类型,以提供给模板标注作为通用化标签。上传报告图片作为模板标注图片,通过报告图片与通用化标签进行定位标注,保存文字在图片中的位置坐标。通过技术服务中心提供的图片切割技术,按照标注的坐标对图片进行切割。切割小图片利用算法服务中心提供的ocr技术进行识别,最后进行持久化处理形成结构化数据。构建报告全过程识别结构化描述模型,实现电力纸质报告数据结构化、数据可视化,支撑业务应用。
40.在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为
一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
41.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
42.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
43.以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献