一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种表格信息提取方法、装置及存储介质与流程

2022-05-11 13:28:05 来源:中国专利 TAG:

技术特征:
1.一种表格信息提取方法,其特征在于,包括:获取目标图像的初始表格,以及所述目标图像的各个目标文本区域与所述初始表格中各个单元格的对应关系,其中所述各个目标文本区域是对所述目标图像进行文本检测处理得到的;在所述初始表格中确定目标单元格组,所述目标单元格组包括第一单元格和第二单元格,所述第一单元格与所述第二单元格位于同一列,所述第一单元格位于所述初始表格中的第m1行,所述第二单元格位于所述初始表格中的第m2行,m1、m2均为正整数,m1小于m2,所述第一单元格与所述第二单元格均存在对应的目标文本区域;若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到目标表格,所述目标表格的第m1行中的各个单元格对应的目标文本区域包括所述初始表格的第m1行中的相应单元格对应的目标文本区域以及第m2行中的相应单元格对应的目标文本区域;基于所述各个目标文本区域与所述初始表格中各个单元格的对应关系,将所述目标表格中各个单元格对应的目标文本区域中的文本数据填充至所述目标表格,得到表格数据。2.根据权利要求1所述的方法,其特征在于,所述若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到目标表格,包括:确定所述第一单元格对应的目标文本区域的文本数据的第一数据长度,以及所述第二单元格对应的目标文本区域的文本数据的第二数据长度;若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,且所述第一数据长度大于所述第二数据长度,则将所述初始表格的第m2行与第m1行合并,得到所述目标表格。3.根据权利要求1所述的方法,其特征在于,所述若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到目标表格,包括:对所述目标图像进行线条检测处理,得到至少一个线条;若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,且所述目标图像中不存在任一线条位于所述第一单元格对应的目标文本区域和所述第二单元格对应的目标文本区域之间,则将所述初始表格的第m2行与第m1行合并,得到所述目标表格。4.根据权利要求1所述的方法,其特征在于,所述获取目标图像的初始表格,包括:获取所述各个目标文本区域在所述目标图像中的位置信息;基于所述各个目标文本区域的位置信息,确定所述目标图像的初始表格,所述位置信息包括横坐标和纵坐标,所述初始表格包括m
×
n个单元格,m是根据最小纵坐标的目标文本区域和最大纵坐标的目标文本区域在所述目标图像中的位置信息确定的,n是根据最小横坐标的目标文本区域和最大横坐标的目标文本区域在所述目标图像中的位置信息确定的,m、n均为正整数。5.根据权利要求4所述的方法,其特征在于,所述基于所述各个目标文本区域的位置信息,确定所述目标图像的初始表格,包括:
基于所述各个目标文本区域的位置信息,对所述各个目标文本区域进行排列,得到排列后的目标文本区域;基于所述排列后的目标文本区域,确定所述初始表格,m是根据所述排列后的目标文本区域中最小纵坐标的目标文本区域和最大纵坐标的目标文本区域确定的,n是根据所述排列后的目标文本区域中最小横坐标的目标文本区域和最大横坐标的目标文本区域确定的。6.根据权利要求5所述的方法,其特征在于,所述基于所述各个目标文本区域的位置信息,对所述各个目标文本区域进行排列,得到排列后的目标文本区域,包括:获取所述各个目标文本区域的区域中心点在所述目标图像中的位置信息;基于所述各个目标文本区域的区域中心点的位置信息,对所述各个目标文本区域进行排序,得到排序后的目标文本区域,所述排序后的目标文本区域中第x个目标文本区域的区域中心点的横坐标小于或等于第x 1个目标文本区域的区域中心点的横坐标,x为正整数;获取所述排序后的目标文本区域中第一个目标文本区域的各个区域边框在所述目标图像中的位置信息;基于所述第一个目标文本区域的第一区域边框以及第二区域边框的纵坐标,和所述第一个目标文本区域之后的各个目标文本区域的区域中心点的纵坐标,对所述排序后的目标文本区域进行排列,得到初始排列后的目标文本区域;基于所述初始排列后的目标文本区域的第一个目标文本区域的第三区域边框以及第四区域边框的横坐标,和所述初始排列后的目标文本区域中其他目标文本区域的区域中心点的横坐标,对所述初始排列后的目标文本区域进行再次排列,得到所述排列后的目标文本区域。7.根据权利要求6所述的方法,其特征在于,所述基于所述第一个目标文本区域的第一区域边框以及第二区域边框的纵坐标,和所述第一个目标文本区域之后的各个目标文本区域的区域中心点的纵坐标,对所述排序后的目标文本区域进行排列,得到初始排列后的目标文本区域,包括:遍历所述排序后的目标文本区域中的各个目标文本区域,确定所述排序后的目标文本区域中区域中心点的纵坐标大于所述第一个目标文本区域的第一区域边框的纵坐标,且小于所述第一个目标文本区域的第二区域边框的纵坐标的目标文本区域,所述确定的目标文本区域与所述第一个目标文本区域在所述初始排列后的目标文本区域中位于同一行;若所述排序后的目标文本区域中所述确定的目标文本区域的下一个目标文本区域的区域中心点的纵坐标大于所述第一个目标文本区域的第一区域边框的纵坐标,且大于所述第一个目标文本区域的第二区域边框的纵坐标,则确定所述下一个目标文本区域在所述初始排列后的目标文本区域中位于所述第一个目标文本区域的下一行;将所述下一个目标文本区域作为所述第一个目标文本区域,并触发执行所述确定所述排序后的目标文本区域中区域中心点的纵坐标大于所述第一个目标文本区域的第一区域边框的纵坐标,且小于所述第一个目标文本区域的第二区域边框的纵坐标的目标文本区域,以得到所述初始排列后的目标文本区域;其中,在所述初始排列后的目标文本区域中位于同一行的目标文本区域的排序和所述位于同一行的目标文本区域在所述排序后的目标文本区域中的排序相同。8.根据权利要求6所述的方法,其特征在于,所述基于所述初始排列后的目标文本区域
的第一个目标文本区域的第三区域边框以及第四区域边框的横坐标,和所述初始排列后的目标文本区域中其他目标文本区域的区域中心点的横坐标,对所述初始排列后的目标文本区域进行再次排列,得到所述排列后的目标文本区域,包括:在所述初始排列后的目标文本区域中确定所述排列后的目标文本区域中位于同一列的目标文本区域,同一列的目标文本区域的区域中心点的横坐标大于所述同一列的目标文本区域中位于第一行的目标文本区域的第三区域边框的横坐标,且小于所述同一列的目标文本区域中位于第一行的目标文本区域的第四区域边框的横坐标;基于各列目标文本区域的区域中心点的横坐标,确定所述各列目标文本区域位于所述排列后的目标文本区域中的第n
i
列,以得到所述排列后的目标文本区域;其中,若所述各个目标文本区域位于所述初始排列后的目标文本区域中的第m
i
行,则所述各个目标文本区域位于所述排列后的目标文本区域中的第m
i
行,m
i
、n
i
为正整数,m
i
小于等于m,n
i
小于等于n。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述目标图像进行文本检测处理,得到至少一个初始文本区域;获取各个初始文本区域的切分位置;基于所述切分位置对所述各个初始文本区域进行切分处理,得到第一初始文本子区域和第二初始文本子区域,所述第一初始文本子区域在所述目标图像的横坐标小于所述第二初始文本子区域在所述目标图像的横坐标;对所述第一初始文本子区域进行字符识别处理,确定所述第一初始文本子区域中的第一字符,并对所述第二初始文本子区域进行字符识别处理,确定所述第二初始文本子区域中的第二字符,所述第一字符为所述第一初始文本子区域的文本数据的最后一个字符,所述第二字符为所述第二初始文本子区域的文本数据的第一个字符;若所述第一字符的字符类型不为预设类型,且所述第二字符的字符类型不为预设类型,则确定所述第一初始文本子区域和所述第二初始文本子区域为不同的目标文本区域。10.根据权利要求1所述的方法,其特征在于,所述在所述初始表格中确定目标单元格组,包括:在所述初始表格中确定至少一个单元格组,各个单元格组包括第一单元格和第二单元格;获取所述各个单元格组中第一单元格对应的目标文本区域,与所述各个单元格组中第二单元格对应的目标文本区域在目标图像中的距离;将距离最小的单元格组确定为所述目标单元格组。11.根据权利要求1-10任一项所述的方法,其特征在于,所述若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到目标表格,包括:若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到更新后的表格;将所述更新后的表格作为所述初始表格,触发执行所述在所述初始表格中确定目标单元格组,直至所述第m2行中的各个单元格对应的目标文本区域的第一数量总和不满足第一预设条件,则将不满足第一预设条件的目标文本区域对应的单元格所属的初始表格确定为
所述目标表格,所述目标表格包括p
×
q个单元格,p小于等于m,p、q为正整数。12.根据权利要求1-10任一项所述的方法,其特征在于,所述方法还包括:获取所述第m1行中的各个单元格对应的目标文本区域的第二数量总和;若所述第二数量总和大于所述第一数量总和,则确定所述第一数量总和满足第一预设条件。13.一种表格信息提取装置,其特征在于,所述基于图像的表格提取装置包括获取单元,确定单元,合并单元以及填充单元,其中:所述获取单元,用于获取目标图像的初始表格,以及所述目标图像的各个目标文本区域与所述初始表格中的各个单元格的对应关系,其中所述各个目标文本区域是对所述目标图像进行文本检测处理得到的;所述确定单元,用于在所述初始表格中确定目标单元格组,所述单元格组包括第一单元格和第二单元格,所述第一单元格与所述第二单元格位于同一列,所述第一单元格位于所述初始表格中的第m1行,所述第二单元格位于所述初始表格中的第m2行,m1、m2均为正整数,m1小于m2,所述第一单元格与所述第二单元格均存在对应的目标文本区域;所述合并单元,用于若所述第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将所述初始表格的第m2行与第m1行合并,得到目标表格,所述目标表格中第m1行中的各个单元格对应的目标文本区域包括所述初始表格的第m1行中的相应单元格对应的目标文本区域以及第m2行中的相应单元格对应的目标文本区域;所述填充单元,用于基于所述各个目标文本区域与所述初始表格中各个单元格的对应关系,将所述目标表格中各个单元格对应的目标文本区域中的文本数据填充至所述目标表格中,得到表格数据。14.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如权利要求1-12任一项所述的表格信息提取方法。

技术总结
本申请实施例涉及计算机技术领域,公开了一种表格信息提取方法、装置及存储介质,该方法包括:获取目标图像的初始表格,以及目标图像的各个目标文本区域与初始表格中各个单元格的对应关系;再在初始表格中确定目标单元格组;若第m2行中的各个单元格对应的目标文本区域的第一数量总和满足第一预设条件,则将初始表格的第m2行与第m1行合并,得到目标表格;最后基于各个目标文本区域与初始表格中各个单元格的对应关系,将目标表格中各个单元格对应的目标文本区域中的文本数据填充至目标表格中,得到表格数据。采用本申请实施例,可实现对含有非全线表的图像进行表格结构化,从而提取出含有非全线表的图像的表格数据。出含有非全线表的图像的表格数据。出含有非全线表的图像的表格数据。


技术研发人员:潘宇 陈琳 吴伟佳 李羽
受保护的技术使用者:微民保险代理有限公司
技术研发日:2022.02.10
技术公布日:2022/5/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献