一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种表格图像的处理方法、装置、电子设备及介质与流程

2022-04-30 10:29:09 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种表格图像的处理方法、装置、电子设备及介质。


背景技术:

2.随着办公软件的不断发展,人们对办公软件处理的要求也越来越高,希望在满足正常办公要求的情况下,还能满足不同的应用场景。
3.目前,在实际应用中,用户可能只能得到表格图像,如从网上搜索到的表格图像,得不到可编辑的表格,此时需要将表格图像转换为可编辑的表格,对表格进行相应的处理。
4.现有技术中,将表格图像转换成可编辑的表格文档时,通过图像分割的方式将表格线分割出来,得到表格的横线和竖线,生成可编辑的表格,但是,这种处理方式,存在表格图像分割效果差、线条不完整的缺陷,导致处理的效果不佳,影响用户体验。


技术实现要素:

5.基于现有技术中存在的问题,本发明提出一种无边框表格的表格线生成方法、装置、电子设备及介质,能够满足任何形式的表格图像的情况,具有提高表格图像处理效果和提升用户体验的优点。
6.第一方面,本发明提供一种表格图像的处理方法,包括:
7.确定目标表格图像为无边框表格;
8.通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;
9.将所述目标表格图像中的内容添加至所述第一边框框架内。
10.进一步,根据本发明提供的表格图像的处理方法,所述方法还包括:
11.所述表格识别结构为线条、滑动窗口或者图卷积神经网络模型。
12.进一步,根据本发明提供的表格图像的处理方法,所述方法还包括:
13.在所述表格识别结构为所述线条或所述滑动窗口的情况下,所述通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架,包括:
14.将所述表格识别结构沿所述目标表格图像的第一方向移动,记录未覆盖所述内容的第一区域;
15.和/或,将所述表格识别结构沿所述目标表格图像的第二方向移动,记录未覆盖所述内容的第二区域;
16.在所述第一区域和所述第二区域的至少一个区域生成表格线,得到第一边框框架。
17.进一步,根据本发明提供的表格图像的处理方法,所述方法还包括:
18.在所述表格识别结构为所述线条的情况下,所述表格识别结构包括第一方向线条和第二方向线条;
19.所述通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架,包括:
20.基于所述目标表格图像中的所述内容分布情况,在所述目标表格图像中平移所述第一方向线条和所述第二方向线条,确定所述目标表格图像中的非交叉区域;
21.在非交叉区域确定目标点,连接所述目标点得到第一边框框架。
22.进一步,根据本发明提供的表格图像的处理方法,所述基于所述目标表格图像中的所述内容分布情况,在所述目标表格图像中平移所述第一方向线条和所述第二方向线条,确定所述目标表格图像中的非交叉区域,包括:
23.对所述目标表格图像做二值化处理,得到第一二值图;其中,所述第一二值图中的第一值为所述目标表格图像中内容分布区域所对应的像素,所述第一二值图中的第二值为所述目标表格图像中非内容分布区域所对应的像素;
24.按照第一方向对所述第一二值图中的像素进行处理,得到第一方向线条;
25.按照第二方向对所述第一二值图中的像素进行处理,得到第二方向线条;
26.将所述第一方向线条与所述第二方向线条进行交叉,将交叉后的、未被所述第一方向线条或所述第二方向线条覆盖的区域作为所述目标表格图像中的非交叉区域。
27.进一步,根据本发明提供的表格图像的处理方法,所述在非交叉区域中确定目标点,包括:
28.通过轮廓查找确定所述非交叉区域的轮廓;
29.根据所述非交叉区域的轮廓,将所述非交叉区域的一个坐标点作为所述目标点。
30.进一步,根据本发明提供的表格图像的处理方法,所述方法还包括:
31.在所述表格识别结构为所述滑动窗口的情况下,所述表格识别结构包括第一方向滑动窗口与第二方向滑动窗口;
32.所述通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架,包括:
33.基于所述目标表格图像中的所述内容分布情况,在所述目标表格图像中平移所述第一方向滑动窗口,得到第一方向框体;在所述目标表格图像中平移所述第二方向滑动窗口,得到第二方向框体;
34.基于所述第一方向框体设置第一方向表格线,基于所述第二方向框体设置第二方向表格线,得到第一边框框架。
35.进一步,根据本发明提供的表格图像的处理方法,所述方法还包括:
36.在所述表格识别结构为所述图卷积神经网络模型的情况下,根据所述目标表格图像中的第一文本框和第二文本框之间的位置关系,确定第一边框框架。
37.进一步,根据本发明提供的表格图像的处理方法,在所述通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架之前,方法还包括:
38.对所述目标表格图像进行二值化处理,得到第二二值图;其中,所述第二二值图中的第二值为目标表格图像中的文本字符所对应的像素,所述第二二值图中的第一值为所述目标表格图像中除文本字符之外的像素;
39.对所述第二二值图设置表格识别结构。
40.进一步,根据本发明提供的表格图像的处理方法,所述将所述目标表格图像中的内容添加至所述第一边框框架内,包括:
41.对所述目标表格图像进行文本检测,根据文本检测结果得到所述目标表格图像中的文本框;
42.在所述第一边框框架内设置文本框;
43.将所述目标表格图像中的文本框中的内容填写至所述第一边框框架的文本框内。
44.第二方面,本发明还提供一种表格图像的处理装置,包括:
45.确定模块,用于确定目标表格图像为无边框表格;
46.处理模块,用于通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;
47.添加模块,用于将所述目标表格图像中的内容添加至所述第一边框框架内。
48.第三方面,本发明还提供一种电子设备,包括:处理器、存储器和总线,其中,
49.所述处理器和所述存储器通过所述总线完成相互间的通信;
50.所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上任一项所述表格图像的处理方法的步骤。
51.第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上述中任一项所述表格图像的处理方法的步骤。
52.本发明提供一种表格图像的处理方法、装置、电子设备及介质,所述方法包括:确定目标表格图像为无边框表格;通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;将所述目标表格图像中的内容添加至所述第一边框框架内。本发明提供的表格图像的处理方法能够快速有效得到第一边框框架,精准实现表格图像转换成可编辑的表格,基于表格图像本身得到的表格信息更全面、清晰,提高了表格图像的处理速度,提升用户体验。
附图说明
53.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
54.图1是本发明提供的无边框表格的表格线生成方法的流程示意图;
55.图2是本发明提供的一种无边框表格的范例图;
56.图3是本发明提供的第一二值图的范例图;
57.图4是本发明提供的竖向表格线区域的范例图;
58.图5是本发明提供的横向表格线区域的范例图;
59.图6是本发明提供的横向表格线区域与竖向表格线区域叠加之后的范例图;
60.图7是本发明确定无交叉区域的中心点的范例图;
61.图8是本发明中竖向上中心点连接后得到的范例图;
62.图9是本发明中横向上中心点连接后得到的范例图;
63.图10是本发明横向和竖向上中心点均连接的范例图;
64.图11是本发明提供的一种文本检测结果的范例图;
65.图12是本发明提供的第二二值图的范例图;
66.图13是本发明提供的经过形态学处理之后的范例图;
67.图14是本发明提供的文本框拆分之后的范例图;
68.图15是本发明提供的无边框表格的表格线生成装置的结构示意图;
69.图16是本发明提供的电子设备的结构示意图。
具体实施方式
70.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
71.图1为本发明实施例提供的表格图像的处理方法的流程示意图,如图1所示,本发明提供的表格图像的处理方法,包括以下步骤:
72.步骤101:确定目标表格图像为无边框表格。
73.在本实施例中,需要对目标表格图像进行确定处理,当确定目标表格图像为无边框表格时,采用本发明提供的表格图像处理方法,对无边框表格中的表格线进行处理,实现无边框表格的表格线生成。
74.需要说明的是,目标表格图像是指本发明的方法所要处理的表格图像。顾名思义,表格图像是具有图像格式的表格,例如,表格是以jpg、png等图像格式保存的。无边框表格是指所有单元格的表格线均不存在的表格,如图2所示的表格,所有单元格的表格线表框线均不存在,属于无边框表格。需要说明的是,无边框表格可以是单独的表格图像,也可以是pdf文档中的表格通过转换处理形成的表格图像,在此不作具体限定。
75.需要说明的是,在图2所示的无边框表格中,各个单元格均填写有文本内容,但在其他实施例中,无边框表格中的某些单元格可以是空白的。对于此类无边框表格,也可采用本发明的方法生成表格线。
76.步骤102:通过表格识别结构对目标表格图像进行处理,得到第一边框框架。
77.在本实施例中,第一边框框架是指对无边框表格进行还原处理得到的由表格线形成的框架。本实施例中需要通过表格识别结构对目标表格图像进行处理,得到第一边框框架。具体的处理流程可以是:利用表格识别结果对目标表格图像进行处理,然后根据处理结果确定出目标表格图像中无边框表格所对应的表格线,得到第一边框框架,具体的处理流程可见下述实施例,在此不作详细介绍。
78.需要说明的是,第一边框框架中没有文本数据,只是单纯的表格线构成的框架,而且该第一边框框架是在目标表格图像上识别确定出来的,能够对目标表格图像中的表格信息实现精准还原。
79.步骤103:将目标表格图像中的内容添加至第一边框框架内。
80.在本实施例中,需要将目标表格图像中的内容添加至第一边框框架中,实现目标表格图像到可编辑表格之间的转换。第一边框框架为存在表格线的表格框架,对目标表格图像中的各个单元格进行文本识别,将文本识别结果填充到第一边框框架的对应单元格中,得到可编辑的表格。
81.需要说明的是,在成功实现目标表格图像向具有表格线的可编辑表格的转换处理后,需要将目标表格图像中的各个单元格识别的文本结果填充到第一边框框架对应的单元
格,实现目标表格图像内数据的还原。
82.根据本发明提供的表格图像的处理方法,确定目标表格图像为无边框表格,通过表格识别结构对目标表格图像进行处理,得到第一边框框架,然后将目标表格图像中的内容添加至第一边框框架内。本发明提供的表格图像的处理方法能够快速有效地得到第一边框框架,精准实现表格图像向可编辑表格的转换,并且基于表格图像本身得到的表格信息更全面、清晰,提高了表格图像的处理速度,提升用户体验。
83.基于上述任一实施例,在本实施例中,方法还包括:表格识别结构为线条、滑动窗口或者图卷积神经网络模型。
84.在本实施例中,表格识别结构为线条、滑动窗口或图卷积神经网络模型,线条是指采用横向线条或纵向线条的方式对目标表格图像进行处理,滑动窗口是指采用不同形状的闭合图形对目标表格图像进行处理,而图卷积神经网络模型是通过基于样本数据训练后得到的处理模型,对目标表格图像进行识别处理。
85.需要说明的是,图卷积神经网络模型的输入为各个文本框的位置信息(如文本框四个点的坐标信息)和目标表格图像,输出的则是某一文本框与其相邻多个文本框是否是同一行或同一列的信息,具体可以见下述实施例的详细介绍。
86.根据本发明提供的表格图像的处理方法,将表格识别结构可以设定为线条、滑动窗口或者图卷积神经网络模型,能够实现对目标表格图像的多种处理,保证表格图像的处理效果,提升了用户体验。
87.基于上述任一实施例,在本实施例中,方法还包括:在表格识别结构为线条或滑动窗口的情况下,通过表格识别结构对目标表格图像进行处理,得到第一边框框架,包括:
88.将表格识别结构沿目标表格图像的第一方向移动,记录未覆盖内容的第一区域;
89.和/或,将表格识别结构沿目标表格图像的第二方向移动,记录未覆盖内容的第二区域;
90.在第一区域和第二区域的至少一个区域生成表格线,得到第一边框框架。
91.在本实施例中,需要将表格识别结构沿着目标表格图像的第一方向移动,记录未覆盖内容的第一区域;还需要将表格识别结构沿着目标表格图像的第二方向进行移动,然后记录未覆盖内容的第二区域,从第一区域或第二区域中确定一个区域生成表格线,得到第一边框框架。需要说明的是,第一方向是指沿着目标表格图像移动的纵向,也就是从目标表格图像的上方往下移动,或者从下向上移动;第二方向是指沿着目标表格图像移动的横向,也就是从目标表格图像的左边向右移动,或者从右向左移动;相应的,第一区域则为沿纵向移动得到的区域,第二区域则为沿横向移动得到的区域。
92.需要说明的是,在其他实施例中,第一方向和第二方向还可以是扇形中的圆弧方向或直径方向,还可以是45度角的方向等等,并不局限于横向和纵向,可以根据用户的实际需要实现任意方向上的移动,在此不作具体限定。
93.需要说明的是,本实施例中沿着目标表格图像的纵向或横向移动的表格识别结构可以是线条,也可以是滑动窗口,而且需要记录的区域是指未覆盖内容的区域,未覆盖内容的区域是指空白的区域,没有存在文本数据的区域。
94.根据本发明提供的表格图像的处理方法,通过将表格识别结构沿目标表格图像的第一方向移动,记录未覆盖内容的第一区域,和/或,将表格识别结构沿目标表格图像的第
二方向移动,记录未覆盖内容的第二区域,然后在第一区域和第二区域的至少一个区域生成表格线,得到第一边框框架,能够实现在目标表格图像的不同方向上的区域生成表格线,得到第一边框框架的目的,提高表格图像处理的速度。
95.基于上述任一实施例,在本实施例中,方法还包括:在表格识别结构为线条的情况下,表格识别结构包括第一方向线条和第二方向线条;
96.通过表格识别结构对目标表格图像进行处理,得到第一边框框架,包括:
97.基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向线条和第二方向线条,确定目标表格图像中的非交叉区域;
98.在各个非交叉区域中确定目标点,连接目标点得到第一边框框架。
99.在本实施例中,第一方向线条为横向线条,第二方向线条为纵向线条。本实施例中需要基于目标表格图像中的内容分布情况,将得到的横向线条和纵向线条进行平移处理,确定出目标表格图像中的非交叉区域,然后在各个非交叉区域中确定出目标点,连接得到的所有目标点即可得到第一边框框被架。其中,目标点可以是中心点,也可以是其他的三分之二的点等,本实施例中优选的是中心点。需要说明的是,非交叉区域是指空白的区域,既没有文本内容分布、又没有被横向线条或纵向线条覆盖的区域。
100.需要说明的是,当表格识别结构为线条时,需要对目标表格图像中的文本内容进行检测处理,得到多个文本框,然后对文本框进行相应的处理得到目标点,确定出第一边框框架。
101.需要说明的是,本实施例中,通过对目标表格图像进行文本检测处理,得到多个文本框,然后需要根据多个文本框确定出目标表格图像中的纵向表格线区域和横向表格线区域,再将得到的纵向表格线区域和横向表格线区域进行平移处理,得到平移之后的表格线区域,从该表格线区域中确定出多个非交叉区域,然后确定出多个非交叉区域的中心点,根据多个中心点生成目标表格图像所对应的第一边框框架。
102.需要说明的是,本实施例中,纵向表格线区域是指将表格识别结构沿着目标表格图像纵向移动所构成的区域,也就是上述实施例中的第二区域,横向表格线区域是指将表格识别结构沿着目标表格图像横向移动所构成的区域,也就是上述实施例中的第一区域;多个非交叉区域是指没有被横向表格线区域和纵向表格线区域覆盖的区域,也没有被叠加的区域。
103.根据本发明提供的表格图像的处理方法,基于目标表格图像中的文本分布情况,在目标表格图像中平移得到的第一方向线条和第二方向线条,确定目标表格图像中的非交叉区域,然后在各个非交叉区域中确定目标点,连接目标点得到第一边框框架,操作简单,能够保证表格图像的还原处理的准确性。
104.基于上述任一实施例,在本实施例中,基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向线条和第二方向线条,确定目标表格图像中的非交叉区域,包括:
105.对目标表格图像做二值化处理,得到第一二值图;其中,第一二值图中的第一值为目标表格图像中内容分布区域所对应的像素,第一二值图中的第二值为目标表格图像中非内容分布区域所对应的像素;
106.按照第一方向对第一二值图中的像素进行处理,得到第一方向线条;
107.按照第二方向对第一二值图中的像素进行处理,得到第二方向线条;
108.将第一方向线条与第二方向线条进行交叉,将交叉后的、未被第一方向线条或第二方向线条覆盖的区域作为目标表格图像中的非交叉区域。
109.在本实施例中,需要对确定文本框之后的目标表格图像进行二值化处理,得到文本框对应的像素为第一值,除文本框之外的像素为第二值的第一二值图,如图3所示的第一二值图。其中,第一值是指像素为0的数值,第二值是指像素为255的数值,第一二值图是指对文本框区域进行二值化处理所生成的二值图。
110.在本实施例中,第一方向可以是指目标表格图像的纵向,对于纵向线条的确定,需要选用一定宽度的像素列,将这一像素列与文本框做闭运算处理,将纵向上的文本框所对应的像素点连接起来,从而形成纵向线条,得到纵向表格线区域,如图4所示的纵向表格线区域,其中,纵向表格线对应的像素值为0。需要说明的是,闭运算是形态学上的一种计算方法,具体为先膨胀后腐蚀的计算方式,其中,膨胀是将与物体接触的所有背景点合并到该物体中,使边界向外部扩展的处理过程,用来填补物体中的空洞。腐蚀是一种消除边界点,使边界向内部收缩的处理过程,可以用来消除小且无意义的物体。
111.在本实施例中,第二方向可以是指目标表格图像的横向,对于横向线条的确定,通过选用一定宽度的像素行,将它们与文本框做闭运算,得到横向线条,所有横向线条构成横向表格区域,如图5所示的横向表格线区域。
112.需要说明的是,本实施例中需要将得到的横向表格线区域和竖向表格线区域进行平移处理,得到平移后的表格线区域。平移后的表格线区域可以如图6所示,从图6中可以确定出没有被叠加的、没有被竖向表格线区域或横向表格线区域覆盖的区域确定为非交叉区域,也就是图6中所示的空白区域,即空白区域为非交叉区域。
113.根据本发明提供的表格图像的处理方法,通过对目标表格图像做二值化处理,得到第一二值图,然后按照第一方向对第一二值图中的像素进行处理,得到第一方向线条,按照第二方向对第一二值图中的像素进行处理,得到第二方向线条,将第一方向线条与第二方向线条进行平移,将未被交叉的、未被第一方向线条或第二方向线条覆盖的区域作为目标表格图像中的非交叉区域,提高了表格图像的处理速度。
114.基于上述任一实施例,在本实施例中,在各个非交叉区域中确定目标点,包括:
115.通过轮廓查找确定各个非交叉区域的轮廓;
116.根据各个非交叉区域的轮廓,确定各个非交叉区域中的目标点。
117.在本实施例中,需要通过轮廓查找的方式确定出各个非交叉区域的目标点的坐标。先确定出多个非交叉区域的轮廓,然后根据多个非交叉区域的轮廓确定出多个非交叉区域各自的轮廓目标点的坐标,根据目标点的坐标信息得到第一边框框架。需要说明的是,本实施例中的目标点设为中心点,由于文本框一般为四边形,可以通过确定四个顶点坐标的方式确定出文本框的中心点,如图7所示,其中各个小圆圈即为确定出的各个文本框的中心点。
118.举例说明,比如得到一个非交叉区域,通过轮廓查找的方式查找到非交叉区域的四个顶点的坐标,分别为(2,6)和(2,9)、(8,6)和(8,9),计算得到(5,7.5)为中心点的坐标,然后通过上述查找方式将确定的多个中心点进行连接,则得到目标表格图像所对应的表格线。
119.需要说明的是,将纵向方向上的中心点进行连接可以得到如图8所示的各个竖线所构成的区域,将横向方向上的多个中心点进行连接得到如图9所示的各个横线所构成的区域,将得到的纵向连接线区域和横向连接线区域平移得到图10所示的表格线,即得到了无边框表格的第一边框框架。
120.需要说明的是,本实施例中是在原来的目标表格图像上生成第一边框框架。在其他实施例中,还可以根据确定的中心点的坐标在一预设区域内按照纵向和/或横向连接多个中心点的映射点,将所有的映射点连接起来生成目标表格图像所对应的表格线。
121.根据本发明提供的表格图像的处理方法,通过轮廓查找确定各个非交叉区域的轮廓,然后根据各个非交叉区域的轮廓,确定各个非交叉区域中的目标点。能够通过中心点的方式生成目标表格图像的第一边框框架,提高第一边框框架生成的准确性。
122.基于上述任一实施例,在本实施例中,在表格识别结构为滑动窗口的情况下,表格识别结构包括第一方向滑动窗口与第二方向滑动窗口;
123.通过表格识别结构对目标表格图像进行处理,得到第一边框框架,包括:
124.基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向滑动窗口,得到第一方向框体;在目标表格图像中平移第二方向滑动窗口,得到第二方向框体;
125.基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,得到第一边框框架。
126.在本实施例中,需要基于目标表格图像中的文本内容分布情况平移第一滑动窗口和第二滑动窗口,得到第一方向框体和第二方向框体,然后基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,根据平移后得到的表格线确定出第一边框框架。
127.需要说明的是,本实施例中第一方向框体可以是沿着目标表格图像纵向方向上的框体,可以是任意形状的框体,如长方形、正方形等;第二方向框体是沿着目标表格图像横向方向上的框体,同样可以是任意形状的框体;在其他实施例中,第一方向框体和第二方向框体还可以是目标表格图像上任意方向上的框体,如45度方向的框体,具体可以根据用户的实际需要进行设置,在此不作具体限定。
128.需要说明的是,第一方向框体是根据第一方向滑动窗口沿着目标表格图像的第一方向进行滑动得到的框体;第二方向框体是根据第二滑动窗口沿着目标表格图像的第二方向进行滑动得到的框体;第一方向框体和第二方向框体在本实施例中是指不存在文本数据内容的空白区域,也就是说在根据第一方向框体和第二方向框体平移后得到的第一边框框架是不存在文本数据内容的区域。
129.需要说明的是,本实施例中得到的第一方向框体和第二方向框体是可以生成表格线的,基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,在完成第一方向框体和第二方向框体的表格线生成后,能够准确得到第一边框框架。
130.根据本发明提供的表格图像的处理方法,基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向滑动窗口,得到第一方向框体,在目标表格图像中平移第二方向滑动窗口,得到第二方向框体,基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,得到第一边框框架,能够准确得到第一边框框架,提高表格图像的处理速度。
131.基于上述任一实施例,在本实施例中,基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向滑动窗口,得到第一方向框体;在目标表格图像中平移所述第二方向滑动窗口,得到第二方向框体,包括:
132.在第一方向滑动窗口沿着与第一方向垂直的方向滑动的过程中,根据目标表格图像中的内容分布情况,确定第一方向滑动窗口未与内容相交的滑动范围,根据第一方向滑动窗口的形状以及第一方向滑动窗口未与内容相交的滑动范围,确定第一方向框体;
133.在第二方向滑动窗口沿着与第二方向垂直的方向滑动的过程中,根据目标表格图像中的文本分布情况,确定第二方向滑动窗口未与内容相交的滑动范围,根据第二方向滑动窗口的形状以及第二方向滑动窗口未与内容相交的滑动范围,确定第二方向框体。
134.在本实施例中,需要在目标表格图像上设置第一方向滑动窗口,当第一方向滑动窗口沿着与第一方向垂直的方向滑动时,根据目标表格图像中的文本内容分布情况,确定出第一方向滑动窗口未与文本内容相交的滑动范围,然后根据第一方向滑动窗口的形状以及滑动范围确定出第一方向框体。其中,第一方向滑动窗口是指在目标表格图像的纵向方向上设定的滑动窗口,可以是长方形的滑动窗口,或是正方形的滑动窗口,在此不作具体限定。
135.需要说明的是,本实施例中第一方向为目标表格图像的纵向,当将第一方向滑动窗口设置为沿着与第一方向垂直的方向滑动时,确定的未与文本相交的滑动范围则为横向上的范围区域,也就是得到的第一方向框体为横向上的框体。在其他实施例中,还可以是第一方向滑动窗口沿着第一方向进行滑动,得到的第一方向框体则为纵向上的框体,具体可以根据用户的实际需要进行设定,在此不作具体限定。
136.在本实施例中,还需要在目标表格图像上设置第二方向滑动窗口,当第二方向滑动窗口沿着与第二方向垂直的方向滑动时,根据目标表格图像中的文本内容分布情况,确定第二方向滑动窗口未与文本内容相交的滑动范围,根据第二方向滑动窗口的形状以及第二滑动窗口未与文本内容相交的滑动范围,确定第二方向框体。其中,第二方向滑动窗口是指在目标表格图像的横向方向上设定的滑动窗口,可以是长方形的滑动窗口,或是正方形的滑动窗口,在此不作具体限定。
137.需要说明的是,本实施例中第二方向为目标表格图像的横向,当将第二方向滑动窗口设置为沿着与第二方向垂直的方向滑动时,确定的未与文本内容相交的滑动范围则为纵向上的范围区域,也就是得到的第二方向框体为纵向上的框体。在其他实施例中,还可以是第二方向滑动窗口沿着第二方向进行滑动,得到的第二方向框体则为横向上的框体,具体可以根据用户的实际需要进行设定,在此不作具体限定。
138.需要说明的是,第一方向滑动窗口和第二方向滑动窗口的设置可以采用现有技术中较成熟的滑窗算法进行计算设计得到,具体的设置方法在此不作详细介绍。
139.根据本发明提供的表格图像的处理方法,通过在目标表格图像上设置滑动窗口,然后在滑动窗口滑动的过程中确定出与文本内容未相交的滑动范围,根据滑动窗口的形状和滑动范围确定出第一方向框体和第二方向框体,操作简单,提高了表格图像的处理速度。
140.基于上述任一实施例,在本实施例中,在表格识别结构为图卷积神经网络模型的情况下,根据目标表格图像中的文本框和文本框之间的位置关系,确定第一边框框架。
141.在本实施例中,当表格识别结构为图卷积神经网络模型时,需要根据目标表格图
像中的各个文本框之间的位置关系,确定出第一边框框架,需要说明的是,各个文本框之间的位置关系可以根据文本框的中心点的坐标信息进行确认。
142.需要说明的是,根据本实施例中提供的图卷积神经网络模型的输出可以确定出处于同一行的文本框和处于同一列的文本框,而且根据确定的同一行的文本框的高度值可以确定出单元格的高度,同一列的文本框的宽度值确定出单元格的宽度,即绘制得到无边框表格的表格线,详细介绍可见下述实施例。
143.根据本发明提供的表格图像的处理方法,在表格识别结构为图卷积神经网络模型的情况下,根据目标表格图像中的文本框和文本框之间的位置关系,确定第一边框框架,通过训练的图卷积神经网络模型能够准确、快速地确定出目标表格图像中的各个文本框的位置关系,得到第一边框框架。
144.基于上述任一实施例,在本实施例中,在表格识别结构为图卷积神经网络模型的情况下,根据目标表格图像中的文本框和文本框之间的位置关系,确定第一边框框架,包括:
145.将预先获取的目标表格图像中的多个文本框的位置信息以及目标表格图像输入预先训练的图卷积神经网络模型,得到多个文本框中的任一文本框与其相邻文本框之间的位置关系;其中,图卷积神经网络模型是基于样本表格中的多个文本框的位置信息、样本表格图像以及样本表格的标签信息训练得到的;
146.根据多个文本框中的任一文本框与其相邻文本框之间的位置关系,确定在目标表格图像中各个行的文本框与各个列的文本框;
147.根据目标表格图像中各个行的文本框与各个列的文本框,生成目标表格图像的第一边框框架。
148.在本实施例中,需要将得到的目标表格图像中的多个文本框的位置信息以及目标表格图像输入预先训练的图卷积神经网络模型中,得到任一文本框与其相邻文本框之间的位置关系,然后根据得到的位置关系,确定出目标表格图像中各个行的文本框和各个列的文本框,并生成目标表格图像所对应的第一边框框架。其中,图卷积神经网络模型为人工智能模型,是基于样本表格中的多个文本框的位置信息、样本表格图像以及样本表格的标签信息进行训练得到的。
149.在本实施例中,图卷积神经网络模型的输入为各个文本框的位置信息(如文本框四个点的坐标信息)和目标表格图像,输出的则是某一文本框与其相邻多个文本框是否是同一行或同一列的信息。
150.举例说明,假如确定的文本框a的位置信息为(1,1),与其相邻的文本框的位置信息通过计算分析分别为:a1(0,1)、a2(0,1)、a3(1,0)、a4(1,0)。其中,位置信息中第一数字表示与文本框a是否为同一行,如果1表示同行,0则表示不同行,那么相邻文本框a1、a2与文本框a同列;第二个数字表示与文本框a是否为同一列,如果1表示同列,0则表示不同列,相邻文本框a1、a2与文本框a同列,而相邻文本框a3、a4与文本框a同行。具体可以根据用户的实际需要进行设定,在此不作具体限定。
151.需要说明的是,根据本实施例中提供的图卷积神经网络模型的输出可以确定出处于同一行的文本框和处于同一列的文本框,而且根据确定的同一行的文本框的高度值可以确定出单元格的高度,同一列的文本框的宽度值确定出单元格的宽度,即绘制得到无边框
表格的表格线。
152.根据本发明提供的表格图像的处理方法,通过将多个文本框的位置信息以及目标表格图像输入预先训练好难得图卷积神经网络模型中,得到任一文本框与其相邻文本框之间的位置关系,然后根据位置关系确定出各个行的文本行和各个列的文本框,根据确定各行各列的文本框生成目标表格图像所对应的第一边框框架。通过多个文本框的位置关系生成目标表格图像所对应的第一边框框架,能够提高表格线生成的准确性。
153.基于上述任一实施例,在本实施例中,根据目标表格图像中各个行的文本框与各个列的文本框,生成目标表格图像的第一边框框架,包括:
154.根据目标表格图像的目标行中各个文本框的高度目标值,设定目标行的高度值;其中,目标行是目标表格图像的任意一行;
155.根据目标表格图像的目标列中各个文本框的宽度目标值,设定目标列的宽度值;其中,目标列是目标表格图像的任意一列;
156.根据目标行的高度值以及目标行在目标表格图像中的位置,绘制目标行的表格线;和/或,根据目标列的宽度值、目标列在目标表格图像中的位置,绘制目标列的表格线,得到目标表格图像的第一边框框架。
157.在本实施例中,需要根据目标行中各个文本框的高度目标值设定目标行的高度值,根据目标列中各个文本框的宽度目标值,设定目标列的宽度值,然后根据目标行的高度值以及目标行在目标表格图像中的位置信息,绘制与该目标行所对应的行的表格线,根据目标列的宽度值以及目标列在目标表格图像中的位置信息,绘制与该目标列所对应的列的表格线,根据各行和各列生成的表格线得到第一边框框架。
158.需要说明的是,本实施例中,是将目标行中各个文本框的最大高度值确定为目标行的高度值,或将目标列中各个文本框所对应的最大宽度设定为目标列的宽度值,在其他实施例中,还可以选取目标行中各个文本框的平均高度值作为目标行的高度值,选取目标列中各个文本框的平均宽度值作为目标列的宽度值。具体用户还可以根据实际需要进行设定,在此不作具体限定。
159.需要说明的是,目标行或目标列的位置信息可以是其坐标信息,也可以是指与其他相邻任意行或任意列的位置关系,具体可以根据实际需要进行设定,在此不作具体限定。
160.举例说明,如目标行中多个文本框的高度值分别为4cm、3cm、5cm,将该目标行中多个文本框的最大高度值确定为该目标行的高度值,也就是将5cm确定为该目标行的高度值;同样,将目标列中的最大宽度值确定为目标列的宽度值,对于其他的行或列依次采用上述的方法进行高度值或宽度值的确认,在此不作详细介绍。
161.需要说明的是,还可以可将各个文本框的像素作为计量单位确定出目标行的高度值或目标列的宽度值,如得到某目标行中的目标文本框的最大像素为1024,通过计算分析得到该像素对应的数值为8.67cm,则将该像素所对应的8.67cm确定为目标行的高度值。在其他实施例中,还可以采用其他的数值确定方式。可以根据用户的具体需要选择不同的确定方式,在此不作具体限定。
162.根据本发明提供的表格图像的处理方法,将目标行中各个文本框中的高度目标值确定为目标行的高度值,将目标列中各个文本框的宽度目标值确定为目标列的宽度值,然后根据目标行的高度值以及目标行在目标表格图像中的位置,目标列的宽度值、目标列在
目标表格图像中的位置,绘制出目标行或目标列对应的表格线,并得到第一边框框架,能够保证表格线生成的准确性,使生成的表格线完整、清楚。
163.基于上述任一实施例,在本实施例中,在通过表格识别结构对目标表格图像进行处理,得到第一边框框架之前,方法还包括:
164.对目标表格图像进行二值化处理,得到第二二值图;其中,第二二值图中的第二值为目标表格图像中的文本字符所对应的像素,第二二值图中的第一值为目标表格图像中除文本字符之外的像素。
165.对第二二值图设置表格识别结构。
166.在本实施例中,需要对包含文本检测结果的目标表格图像进行二值化处理,得到文本字符所对应的像素为第二值、文本字符除外的像素为第一值的第二二值图,其中,第一值是指像素为0的数值,第二值是指像素为255的数值。然后对得到的第二二值图进行形态学处理,得到形态学处理结果,确定处理结果中存在中间存在间隔的文本框,将该文本框进行拆分处理,得到目标表格图像中的多个文本框。
167.需要说明的是,本实施例中还需要对得到的第二二值图设置表格识别结构,其中,表格识别结构可以是线条、框体或者图卷积神经网络模型,具体可以根据用户的需要进行设定,在此不作具体限定。
168.根据本发明提供的表格图像的处理方法,通过对包含文本检测结果的目标表格图像进行二值化处理,得到文本字符所对应的像素为第一值,目标表格图像中除文本字符之外的像素为第二值的第二二值图,然后对第二二值图设置表格识别结构,为后续根据表格识别结构确定出第一边框框架提供了支持。
169.基于上述任一实施例,在本实施例中,将目标表格图像中的内容添加至第一边框框架内,包括:
170.对所述目标表格图像进行文本检测,根据文本检测结果得到所述目标表格图像中的文本框;
171.在所述第一边框框架内设置文本框;
172.将所述目标表格图像中的文本框中的内容填写至所述第一边框框架的文本框内。
173.在本实施例中,需要对目标表格图像进行文本检测,然后根据文本检测结果得到目标表格图像中的文本框,在第一边框框架内设置多个文本框,将目标表格图像中的多个文本框中存在的数据内容填写至第一边框框架内的对应的文本框中,实现目标表格图像中的数据还原。
174.在本实施例中,如图11所示,利用文本检测单元对无边框表格进行文本检测处理,识别出多个文本内容,根据文件检测结果确定出目标表格图像中的多个文本框,其中,一个长方形的框图代表一个文本框,图11中存在多个文本框。
175.具体的说,在检测出目标表格图像中的文本之后,还需要对文本检测结果进行二值化和形态学处理,从而得到目标表格图像中的文本框。其中,图像二值化,即image binarization,是将图像上的像素点的灰度值设置为0或255,实际上是将整个图像呈现出明显的黑白效果的过程,图12为对上述文本检测得到的多个文本框进行二值化处理后的示意图。形态学,数学形态学,即mathematical morphology,是图像处理中应用最为广泛的技术之一,主要用于从图像中提取对表达和描绘区域形状有意义的图像分量,使后续的识别
工作能够抓住目标对象最为本质的形状特征,其中,最为本质是指最具区分能力,即most discriminative,如边界和连通区域等,如图13所示,图13为对二值化处理后的表格图像进行形态学处理得到的示意图。具体的处理过程见下述实施例,在此不作详细介绍。
176.需要说明的是,本实施例中在确定出目标表格图像中的多个文本框后,对于中间存在间隔的文本框进行拆分处理,如图14为对中间存在间隔的文本框拆分后得到的示意图,如将单一文本框“张三总经理123456937”,根据存在的间隔拆分为三个文本框,分别为“张三”、“总经理”、“123456937”。
177.在本实施例中,需要对拆分后得到的多个文本框进行二值化处理,横向表格线区域和纵向表格线区域的确认处理,然后根据确定出的表格线区域确定出各个非交叉区域的中心点,连接各个中心点确定出目标表格图像所对应的第一边框框架,详细内容可见下述实施例,在本实施例中不再做详细介绍。
178.需要说明的是,在本实施例中是通过确定横向表格区域和纵向表格区域,然后确定平移后的表格线区域的中心点,通过连接中心点的方式生成目标表格图像所对应的表格线,在其他实施例中可以是其他的生成方式,如基于文本框的位置关系生成表格线,还可以是其他的生成方式,在此不作具体限定。
179.需要说明的是,本实施例中需要在得到的第一边框框架内设置多个文本框,然后将目标表格图像中的多个文本框中存在的文本内容添加到第一边框框架内的对应的文本框内,其中,采用现有技术中较成熟的文本识别方法对目标表格图像中的多个文本框中的文本内容进行识别处理,然后将识别结果填充到第一边框框架内对应的文本框中,文本识别处理的具体过程在此不作详细介绍。
180.根据本发明提供的表格图像的处理方法,通过对目标表格图像进行文本检测,根据文本检测结果得到目标表格图像中的文本框,然后在第一边框框架内设置文本框,将目标表格图像中的文本框中的内容填写至第一边框框架的文本框内。能够实现表格图像中的文本数据的精准还原,提高了表格图像的处理速度。
181.基于上述任一实施例,在本实施例中,确定目标表格图像为无边框表格,包括:
182.将目标表格图像输入预先训练的表格分类模型;
183.根据表格分类模型的输出结果,确定目标表格图像为无边框表格;
184.其中,表格分类模型是基于样本表格、样本表格的类别标签训练得到的。
185.在本实施例中,需要将目标表格图像输入预先训练的表格分类模型中,然后根据表格分类模型的输出结果确定目标表格图像为无边框表格,其中,表格分类模型是基于样本表格、样本表格的类别标签训练得到的,输出结果为两种,一种是无边框表格,一种是有边框表格,只有在目标表格图像中的各个单元格均不存在表格线的情况下才确定目标表格图像为无边框表格。
186.需要说明的是,表格分类模型可以是vgg模型,也可以是resnet模型,通过对选择的模型进行训练得到表格分类模型,用于识别目标表格图像的类型。其中,vgg模型是一种可以在多个迁移学习任务中进行识别确认的模型。从图像中提取cnn特征,vgg模型是首选算法。resnet模型是指深度残差网络模型,通过很深层次的网络实现准确率非常高的图像识别、语音识别等能力。
187.举例说明,如将获取到目标表格图像1和目标表格图像2输入到预先训练好的表格
分类模型中,模型输出结果为目标表格图像1中的各个单元格均不存在边框线、目标表格图像2中部分存在表格框线,将目标表格图像1确定为无边框表格、目标表格图像2确定为半边框表格。
188.根据本发明提供的表格图像的处理方法,通过预先训练好的表格分类模型能够确定出目标表格图像的类型,根据表格分类模型的输出结果将目标表格图像确定为无边框表格,能够准确识别出目标表格图像的类型,提高后续无边框表格的处理速度。
189.基于上述任一实施例,在本实施例中,第一边框框架内的内容处于可编辑的状态。
190.在本实施例中,通过目标表格图像转换得到第一边框框架内的内容是处于可编辑的状态的。根据上述提供的表格图像处理方法对类型为无边框表格的目标表格图像进行转换处理,得到具有表格线的第一边框框架,然后需要对目标表格图像中的各个单元格进行文本识别,将文本识别结果填充到第一边框框架的对应单元格中,得到可编辑的表格。
191.根据本发明提供的表格图像的处理方法,得到的第一边框框架内的内容处于可编辑的状态,满足用户的编辑需求,提升了用户体验。
192.基于上述任一实施例,在本实施例中,首先利用表格分类模型确认目标表格图像为无边框表格,然后根据文本检测单元对无边框表格进行文本检测处理得到多个文本框,对得到的带有多个文本框的目标表格图像进行二值化处理和形态学处理,然后根据处理结果,将其中存在中间间隔的文本框进行拆分处理,得到拆分后带有多个文本框的目标表格图像。
193.在本实施例中,还需要根据目标表格图像的多个文本框进行表格线的生成处理,先进行二值化处理,得到第一二值图,从第一二值图中按照垂直方向提取出纵向表格线区域,按照水平方向提取出横向表格线区域,其中,纵向表格线和横向表格线为给定的模板。然后将得到的两个区域进行平移处理,将平移后区域上的白色区域设定为非交叉区域。
194.在本实施例中,通过轮廓查找的方式从平移后的区域中确定每个非交叉区域的轮廓,计算轮廓中心点,确定非交叉区域的坐标信息,根据每个方向上的顶点的坐标数值的平均值确定出中心点的坐标。从横向上和纵向上将中心点连接,生成目标表格图像的表格线,得到可编辑的第一边框框架。
195.需要说明的是,本实施例中,还可以利用文本框和文本框之间的位置关系,确定表格线。例如,根据文本框之间的位置关系,构建图卷积网络模型,利用训练好的图卷积网络模型,确定同一列的文本框、同一行的文本框,确定之后,基于各个行和各个列的位置关系,确定出完整包围目标表格图像中的全部文本框的表格线。
196.图15为本发明提供的一种表格图像的处理装置,如图15所示,本发明提供的表格图像的处理装置,包括:
197.确定模块1501,用于确定目标表格图像为无边框表格;
198.处理模块1502,用于通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;
199.添加模块1503,用于将所述目标表格图像中的内容添加至所述第一边框框架内。
200.根据本发明提供的表格图像的处理装置,确定目标表格图像为无边框表格,通过表格识别结构对目标表格图像进行处理,得到第一边框框架,然后将目标表格图像中的内容添加至第一边框框架内。本发明提供的表格图像的处理方法能够快速有效地得到第一边
框框架,精准实现表格图像向可编辑表格的转换,并且基于表格图像本身得到的表格信息更全面、清晰,提高了表格图像的处理速度,提升用户体验。
201.进一步,所述表格识别结构为线条、滑动窗口或者图卷积神经网络模型。
202.根据本发明提供的表格图像的处理装置,将表格识别结构可以设定为线条、滑动窗口或者图卷积神经网络模型,能够实现对目标表格图像的多种处理,保证表格图像的处理效果,提升了用户体验。
203.进一步,处理模块1502还用于:
204.将所述表格识别结构沿目标表格图像的第一方向移动,记录未覆盖内容的第一区域;
205.和/或,将表格识别结构沿目标表格图像的第二方向移动,记录未覆盖内容的第二区域;
206.在所述第一区域和所述第二区域的至少一个区域生成表格线,得到第一边框框架。
207.根据本发明提供的表格图像的处理装置,通过将表格识别结构沿目标表格图像的第一方向移动,记录未覆盖内容的第一区域,和/或,将表格识别结构沿目标表格图像的第二方向移动,记录未覆盖内容的第二区域,然后在第一区域和第二区域的至少一个区域生成表格线,得到第一边框框架,能够实现在目标表格图像的不同方向上的区域生成表格线,得到第一边框框架的目的,提高表格图像处理的速度。
208.进一步,在所述表格识别结构为线条的情况下,所述表格识别结构包括横向线条和纵向线条,处理模块1502还用于:
209.基于目标表格图像中的所述内容分布情况,在目标表格图像中平移第一方向线条和第二方向线条,确定目标表格图像中的非交叉区域;
210.在非交叉区域确定目标点,连接目标点得到第一边框框架。
211.根据本发明提供的表格图像的处理装置,基于目标表格图像中的文本分布情况,在目标表格图像中叠加得到的第一方向线条和第二方向线条,确定目标表格图像中的非交叉区域,然后在各个非交叉区域中确定目标点,连接目标点得到第一边框框架,操作简单,能够保证表格图像的还原处理的准确性。
212.进一步,处理模块1502还用于:
213.对所述目标表格图像做二值化处理,得到第一二值图;其中,所述第一二值图中的第一值为目标表格图像中内容分布区域所对应的像素,所述第一二值图中的第二值为目标表格图像中非内容分布区域所对应的像素;
214.按照第一方向对所述第一二值图中的像素进行处理,得到第一方向线条;
215.按照第二方向对所述第一二值图中的像素进行处理,得到第二方向线条;
216.将所述第一方向线条与所述第二方向线条进行交叉,将交叉后的、未被所述第一方向线条或所述第二方向线条覆盖的区域作为所述目标表格图像中的非交叉区域。
217.根据本发明提供的表格图像的处理装置,通过对目标表格图像做二值化处理,得到第一二值图,然后按照第一方向对第一二值图中的像素进行处理,得到第一方向线条,按照第二方向对第一二值图中的像素进行处理,得到第二方向线条,将第一方向线条与第二方向线条进行交叉,将交叉后的、未被第一方向线条或第二方向线条覆盖的区域作为目标
表格图像中的非交叉区域,提高了表格图像的处理速度。
218.进一步,处理模块1502还用于:
219.通过轮廓查找确定所述非交叉区域的轮廓;
220.根据所述非交叉区域的轮廓,将所述非交叉区域的一个坐标点作为所述目标点。
221.根据本发明提供的表格图像的处理装置,通过轮廓查找确定各个非重叠区域的轮廓,然后根据各个非交叉区域的轮廓,确定各个非交叉区域中的目标点。能够通过中心点的方式生成目标表格图像的第一边框框架,提高第一边框框架生成的准确性。
222.进一步,在所述表格识别结构为框体的情况下,所述表格识别结构包括第一方向框体与第二方向框体;
223.相应的,处理模块1502还用于:
224.基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向滑动窗口,得到第一方向框体;在目标表格图像中平移第二方向滑动窗口,得到第二方向框体;
225.基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,得到第一边框框架。
226.根据本发明提供的表格图像的处理装置,基于目标表格图像中的内容分布情况,在目标表格图像中平移第一方向滑动窗口,得到第一方向框体;在目标表格图像中平移第二方向滑动窗口,得到第二方向框体;基于第一方向框体设置第一方向表格线,基于第二方向框体设置第二方向表格线,得到第一边框框架,能够准确得到第一边框框架,提高表格图像的处理速度。
227.进一步,处理模块1502还用于:
228.在第一方向滑动窗口沿着与第一方向垂直的方向滑动的过程中,根据所述目标表格图像中的内容分布情况,确定第一方向滑动窗口未与文本相交的滑动范围,根据所述第一方向滑动窗口的形状以及所述第一滑动窗口未与文本相交的滑动范围,确定第一方向框体;
229.在第二方向滑动窗口沿着与第二方向垂直的方向滑动的过程中,根据目标表格图像中的文本分布情况,确定第二方向滑动窗口未与文本相交的滑动范围,根据所述第二方向滑动窗口的形状以及所述第二滑动窗口未与文本相交的滑动范围,确定第二方向框体。
230.根据本发明提供的表格图像的处理装置,通过在目标表格图像上设置滑动窗口,然后在滑动窗口滑动的过程中确定出与文本内容未相交的滑动范围,根据滑动窗口的形状和滑动范围确定出第一方向框体和第二方向框体,操作简单,提高了表格图像的处理速度。
231.进一步,在所述表格识别结构为图卷积神经网络模型的情况下,根据目标表格图像中的文本框和文本框之间的位置关系,确定第一边框框架。
232.根据本发明提供的表格图像的处理装置,在表格识别结构为图卷积神经网络模型的情况下,根据目标表格图像中的文本框和文本框之间的位置关系,确定第一边框框架,通过训练的图卷积神经网络模型能够准确、快速地确定出目标表格图像中的各个文本框的位置关系,得到第一边框框架。
233.进一步,处理模块1502还用于:
234.将预先获取的目标表格图像中的多个文本框的位置信息以及所述目标表格图像输入预先训练的图卷积神经网络模型,得到所述多个文本框中的任一文本框与其相邻文本
框之间的位置关系;其中,所述图卷积神经网络模型是基于样本表格中的多个文本框的位置信息、样本表格图像以及样本表格的标签信息训练得到的;
235.根据所述多个文本框中的任一文本框与其相邻文本框之间的位置关系,确定在所述目标表格图像中各个行的文本框与各个列的文本框;
236.根据所述目标表格图像中各个行的文本框与各个列的文本框,生成所述目标表格图像的第一边框框架。
237.根据本发明提供的表格图像的处理装置,通过将多个文本框的位置信息以及目标表格图像输入预先训练好难得图卷积神经网络模型中,得到任一文本框与其相邻文本框之间的位置关系,然后根据位置关系确定出各个行的文本行和各个列的文本框,根据确定各行各列的文本框生成目标表格图像所对应的第一边框框架。通过多个文本框的位置关系生成目标表格图像所对应的第一边框框架,能够提高表格线生成的准确性。
238.进一步,处理模块1502还用于:
239.根据所述目标表格图像的目标行中各个文本框的高度目标值,设定所述目标行的高度值;其中,所述目标行是所述目标表格图像的任意一行;
240.根据所述目标表格图像的目标列中各个文本框的宽度目标值,设定所述目标列的宽度值;其中,所述目标列是所述目标表格图像的任意一列;
241.根据所述目标行的高度值以及目标行在所述目标表格图像中的位置,绘制所述目标行的表格线;和/或,根据目标列的宽度值、目标列在所述目标表格图像中的位置,绘制所述目标列的表格线,得到所述目标表格图像的第一边框框架。
242.根据本发明提供的表格图像的处理装置,将目标行中各个文本框中的高度目标值确定为目标行的高度值,将目标列中各个文本框的宽度目标值确定为目标列的宽度值,然后根据目标行的高度值以及目标行在目标表格图像中的位置,目标列的宽度值、目标列在目标表格图像中的位置,绘制出目标行或目标列对应的表格线,并得到第一边框框架,能够保证表格线生成的准确性,使生成的表格线完整、清楚。
243.进一步,表格图像的处理装置还用于:
244.对目标表格图像进行二值化处理,得到第二二值图;其中,所述第二二值图中的第二值为目标表格图像中的文本字符所对应的像素,所述第二二值图中的第一值为所述目标表格图像中除文本字符之外的像素。
245.对所述第二二值图设置表格识别结构。
246.根据本发明提供的表格图像的处理装置,通过对包含文本检测结果的目标表格图像进行二值化处理,得到文本字符所对应的像素为第一值,目标表格图像中除文本字符之外的像素为第二值的第二二值图,然后对第二二值图设置表格识别结构,为后续根据表格识别结构确定出第一边框框架提供了支持
247.进一步,添加模块1503还用于:
248.对所述目标表格图像进行文本检测,根据文本检测结果得到所述目标表格图像中的文本框;
249.在所述第一边框框架内设置文本框;
250.将所述目标表格图像中的文本框中的内容填写至所述第一边框框架的文本框内。
251.根据本发明提供的表格图像的处理装置,通过对目标表格图像进行文本检测,根
据文本检测结果得到目标表格图像中的多个文本框,在第一边框框架内设置多个文本框,将目标表格图像中的多个文本框中的内容填写至第一边框框架的多个文本框内。能够实现表格图像中的文本数据的精准还原,提高了表格图像的处理速度。
252.进一步,确定模块1501还用于:
253.将目标表格图像输入预先训练的表格分类模型;
254.根据所述表格分类模型的输出结果,确定所述目标表格图像为无边框表格;
255.其中,所述表格分类模型是基于样本表格、样本表格的类别标签训练得到的。
256.根据本发明提供的表格图像的处理装置,通过预先训练好的表格分类模型能够确定出目标表格图像的类型,根据表格分类模型的输出结果将目标表格图像确定为无边框表格,能够准确识别出目标表格图像的类型,提高后续无边框表格的处理速度。
257.进一步,所述第一边框框架内的内容处于可编辑的状态。
258.根据本发明提供的表格图像的处理装置,得到的第一边框框架内的内容处于可编辑的状态,满足用户的编辑需求,提升了用户体验。
259.由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。
260.图16为本发明实施例中提供的电子设备实体结构示意图,如图16所示,本发明提供一种电子设备,包括:处理器(processor)1601、存储器(memory)1602和总线1603;
261.其中,处理器1601、存储器1602通过总线1603完成相互间的通信;
262.处理器1601用于调用存储器1602中的程序指令,以执行上述各方法实施例中所提供的方法,例如包括:确定目标表格图像为无边框表格;通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;将所述目标表格图像中的内容添加至所述第一边框框架内。
263.本发明实施例中提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使所述计算机执行上述各方法实施例中所提供的方法,例如包括:确定目标表格图像为无边框表格;通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;将所述目标表格图像中的内容添加至所述第一边框框架内。
264.本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的方法,该方法包括:确定目标表格图像为无边框表格;通过表格识别结构对所述目标表格图像进行处理,得到第一边框框架;将所述目标表格图像中的内容添加至所述第一边框框架内。
265.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
266.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例中所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精
神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献