一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种年报的处理方法、装置、电子设备及存储介质与流程

2022-03-23 06:18:27 来源:中国专利 TAG:

技术特征:
1.一种年报的处理方法,其特征在于,包括:将公司年报转化为年报图片;获取所述年报图片中的元素信息和各个元素信息对应的位置信息;根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据;将所述具体业务信息、所述表格数据与结构化数据库中的公司信息相关联,在结构化数据库中形成结构化数据。2.根据权利要求1所述的一种年报的处理方法,其特征在于,所述获取所述年报图片中的元素信息和各个元素信息对应的位置信息,包括:通过光学字符识别技术获取所述年报图片中的元素信息和各个元素信息对应的位置信息。3.根据权利要求1所述的一种年报的处理方法,其特征在于,所述元素信息对应的位置信息包括:元素信息对应的段落信息;根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据,包括:根据所述元素信息对应的段落信息通过语义识别抽取所述元素信息中的具体业务信息。4.根据权利要求3所述的一种年报的处理方法, 其特征在于,所述元素信息对应的位置信息包括:元素信息对应的坐标信息;根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据,还包括:确定所述年报图片中是否具有框线;当确定所述年报图片中具有框线时,确定所述框线中各个线段的位置;基于所述框线中各个线段的位置通过线段交叉检测确定所述年报图片中单元格的坐标信息范围;根据所述单元格的坐标信息范围和元素信息对应的坐标信息提取所述元素信息中的文字信息,以得到所述表格数据。5.根据权利要求4所述的一种年报的处理方法,其特征在于,所述确定所述框线中各个线段的位置,包括:通过对所述年报图片中的像素点进行膨胀,然后再对膨胀后的像素点进行腐蚀,进而确定框线中各个线段的位置。6.根据权利要求4所述的一种年报的处理方法,其特征在于,所述元素信息对应的位置信息包括:元素信息对应的文字间距信息;根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据,还包括:当所述年报图片中不具有框线时,根据元素信息对应的文字间距信息确定所述年报图片中单元格的坐标信息范围;根据所述单元格的坐标信息范围和元素信息对应的坐标信息提取所述元素信息中的文字信息,以得到所述表格数据。7.根据权利要求5所述的一种年报的处理方法,其特征在于,所述确定所述年报图片中是否具有框线,包括:通过对所述年报图片中的像素点进行膨胀,然后再对膨胀后的像素点进行腐蚀后,进
行线段位置检测;其中,当能检测到线段位置时,确定所述年报图片中具有框线;其中,当不能检测到线段位置时,确定所述年报图片中不具有框线。8.一种年报的处理装置,其特征在于,包括:转化模块,用于将公司年报转化为年报图片;第一获取模块,用于获取所述年报图片中的元素信息和各个元素信息对应的位置信息;第一确定模块,用于根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据;第一执行模块,用于将所述具体业务信息、所述表格数据与结构化数据库中的公司信息相关联,在结构化数据库中形成结构化数据。9.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如权利要求1至7任意一项所述一种年报的处理方法。10.一种存储介质,其特征在于,该存储介质存储的计算机程序,能够被一个或多个处理器执行,所述计算机程序能够用来实现如权利要求1至7中任一项所述一种年报的处理方法的步骤。

技术总结
本发明创造属于信息抽取的技术领域,具体涉及了一种年报的处理方法、装置、电子设备及存储介质。一种年报的处理方法,包括:将公司年报转化为年报图片;获取所述年报图片中的元素信息和各个元素信息对应的位置信息;根据所述元素信息和各个元素信息对应的位置信息确定所述年报图片中的具体业务信息和表格数据;将所述具体业务信息、所述表格数据与结构化数据库中的公司信息相关联,在结构化数据库中形成结构化数据。使得可以准确、高效、全面地读取复杂的年报内容并转换为易用的结构化信息。杂的年报内容并转换为易用的结构化信息。杂的年报内容并转换为易用的结构化信息。


技术研发人员:焦嘉昕 李伟 顾夏辉 安涛 刘威
受保护的技术使用者:子长科技(北京)有限公司
技术研发日:2022.02.22
技术公布日:2022/3/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献