一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文档处理方法及装置、用于图像的数据提取方法及装置与流程

2022-02-19 01:23:01 来源:中国专利 TAG:

技术特征:
1.一种文档处理方法,包括:根据文档页面中行文字图像的位置信息,生成多个第一包围框;根据所述多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记所述文档页面中一个文本稀疏区域;对相邻的第二包围框执行合并操作,得到多个候选包围框;针对所述多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及根据所述多个局部图像中的内容,生成目标图像。2.根据权利要求1所述的方法,其中,所述第二包围框包括第一子包围框和第二子包围框;所述根据所述多个第一包围框的位置信息,生成多个第二包围框包括:在任意两个上下相邻的所述第一包围框之间生成一个第一子包围框;以及在每个所述第一包围框的左侧和/或右侧生成一个第二子包围框。3.根据权利要求2所述的方法,其中,所述候选包围框为矩形;所述第二子包围框的宽度为所述第一包围框的边缘至所述文档页面的边缘的长度;所述对相邻的第二包围框执行合并操作,得到多个候选包围框包括:对每个第一子包围框执行划分操作,得到与所述第二子包围框的宽度相等的多个第三子包围框;以及对所述第三子包围框与所述第二子包围框执行合并操作,得到候选包围框。4.根据权利要求1至3任一项所述的方法,其中,所述根据所述多个第一包围框的位置信息,生成多个第二包围框包括:针对所述多个第一包围框中每个第一包围框,根据该第一包围框的位置信息和所述第二包围框的位置信息,确定至少一个重叠区域,一个重叠区域与至少一个所述第二包围框对应;以及针对至少一个重叠区域,分别从与每个重叠区域对应的至少一个所述第二包围框中去除该重叠区域,得到多个调整后的第二包围框。5.根据权利要求1所述的方法,其中,所述根据文档页面中行文字图像的位置信息,生成多个第一包围框包括:根据所述文档页面中每个文字图像的位置信息和每个文本图像的高度,针对所述文档页面中的每行文字,生成多个第一包围框。6.一种用于图像的数据提取方法,包括:根据目标图像内每个像素的像素值,确定所述目标图像中位于坐标轴上的n个标记点的坐标;根据n个标记点的坐标,对所述目标图像执行划分操作,得到n 1个子区域;针对所述n 1个子区域中第i个子区域,执行文本识别操作,得到与第i个子区域对应的第i组数据;i=1,......,n 1;其中,所述目标图像是根据权利要求1至5任一项所述的文档处理方法生成的。7.根据权利要求6所述的方法,其中,所述坐标轴包括m个像素;所述根据目标图像内每个像素的像素值,确定所述目标图像中位于坐标轴上的n个标
记点的坐标包括:获取距离所述坐标轴最近的k行像素中每行像素的m个像素;k≥1;响应于所述坐标轴上的第j个像素与每行像素中的第j个像素的相似度大于预设相似度阈值、所述坐标轴上的第j

1个像素与每行像素中的第j

1个像素的相似度小于预设相似度阈值、且所述坐标轴上的第j λ个像素点与每行像素中的第j λ个像素的相似度小于预设相似度阈值,确定所述坐标轴上的第j个像素为一个标记点;j=2,
……
,m;λ为预设值,且λ为自然数。8.一种文档处理装置,包括:第一生成模块,用于根据文档页面中行文字图像的位置信息,生成多个第一包围框;第二生成模块,用于根据所述多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记所述文档页面中一个文本稀疏区域;合并模块,用于对相邻的第二包围框执行合并操作,得到多个候选包围框;第一确定模块,用于针对所述多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及第三生成模块,用于根据所述多个局部图像中的内容,生成目标图像。9.根据权利要求8所述的装置,其中,所述第二包围框包括第一子包围框和第二子包围框;所述第二生成模块包括:第一生成单元,用于在任意两个上下相邻的所述第一包围框之间生成一个第一子包围框;以及第二生成单元,用于在每个所述第一包围框的左侧和/或右侧生成一个第二子包围框。10.根据权利要求9所述的装置,其中,所述候选包围框为矩形;所述第二子包围框的宽度为所述第一包围框的边缘至所述文档页面的边缘的长度;所述合并模块包括:划分单元,用于对每个第一子包围框执行划分操作,得到与所述第二子包围框的宽度相等的多个第三子包围框;以及合并单元,用于对所述第三子包围框与所述第二子包围框执行合并操作,得到候选包围框。11.根据权利要求8至10任一项所述的装置,其中,所述第二生成模块包括:第一确定单元,用于针对所述多个第一包围框中每个第一包围框,根据该第一包围框的位置信息和所述第二包围框的位置信息,确定至少一个重叠区域,一个重叠区域与至少一个所述第二包围框对应;以及去除单元,用于针对至少一个重叠区域,分别从与每个重叠区域对应的至少一个所述第二包围框中去除该重叠区域,得到多个调整后的第二包围框。12.根据权利要求8所述的装置,其中,所述第一生成模块还用于根据所述文档页面中每个文字图像的位置信息和每个文本图像的高度,针对所述文档页面中的每行文字,生成多个第一包围框。13.一种用于图像的数据提取装置,包括:第二确定模块,用于根据目标图像内每个像素的像素值,确定所述目标图像中位于坐
标轴上的n个标记点的坐标;划分模块,用于根据n个标记点的坐标,对所述目标图像执行划分操作,得到n 1个子区域;文本识别模块,用于针对所述n 1个子区域中第i个子区域,执行文本识别操作,得到与第i个子区域对应的第i组数据;i=1,......,n 1;其中,所述目标图像是根据权利要求8至12任一项所述的文档处理装置生成的。14.根据权利要求13所述的装置,其中,所述坐标轴包括m个像素;所述第二确定模块包括:获取单元,用于获取距离所述坐标轴最近的k行像素中每行像素的m个像素;k≥1;第二确定单元,用于响应于所述坐标轴上的第j个像素与每行像素中的第j个像素的相似度大于预设相似度阈值、所述坐标轴上的第j

1个像素与每行像素中的第j

1个像素的相似度小于预设相似度阈值、且所述坐标轴上的第j λ个像素点与每行像素中的第j λ个像素的相似度小于预设相似度阈值,确定所述坐标轴上的第j个像素为一个标记点;j=2,
……
,m;λ为预设值,且λ为自然数。15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至7中任一项所述的方法。

技术总结
本公开提供了一种文档处理方法,涉及计算机技术领域,尤其涉及文档处理技术领域。具体实现方案为:根据文档页面中行文字图像的位置信息,生成多个第一包围框;根据多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记文档页面中一个文本稀疏区域;对相邻的第二包围框执行合并操作,得到多个候选包围框;针对多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及根据多个局部图像中的内容,生成目标图像。本公开还提供了一种文档处理装置、用于图像的数据提取方法及装置、电子设备和存储介质。质。质。


技术研发人员:黄海平
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.09.29
技术公布日:2022/1/3
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献