一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像处理方法及装置、电子设备和计算机可读存储介质与流程

2022-02-21 04:26:33 来源:中国专利 TAG:


1.本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备和非瞬时性计算机可读存储介质。


背景技术:

2.随着电子办公平台的发展,用户经常对各种文件进行扫描或拍照,以保存为电子版文件,同时,还希望对扫描或拍照得到的电子版文件进行相应处理以获得电子版文件中的相关信息。表格是以结构化方式呈现信息的常见形式且常常应用于各种文件中。在对具有表格的电子版文件进行处理的过程中,通常需要识别该电子版文件中的表格,并提取表格中的各种关键信息。然而,由于表格的特殊性,如何准确地识别表格并准确地提取表格中的关键信息是一项亟待解决的问题。


技术实现要素:

3.本公开至少一个实施例提供一种图像处理方法,包括:获取输入图像;对所述输入图像进行识别处理,以得到多个对象块,其中,每个对象块包括一个对象内容;确定所述多个对象块中的多个关键对象块;基于所述多个对象块分别对应的多个块位置,生成单元表格,其中,所述单元表格包括多个单元格,所述多个单元格包括多个对象单元格,每个对象单元格包括一个对象块;基于所述多个关键对象块,确定所述多个对象单元格中的n个关键对象单元格,其中,所述n个关键对象单元格中的每个关键对象单元格包括一个关键对象块,在所述输入图像中,所述n个关键对象单元格沿第一方向排列为同一排;基于所述多个对象块中的多个对象内容,确定与所述n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容,其中,每个记录内容包括至少一个对象内容;输出所述n个对象内容中的m个对象内容和/或输出所述至少一个记录内容中的l个记录内容,其中,n、m和l为正整数,且n大于1。
4.例如,在本公开一实施例提供的图像处理方法中,每个对象块具有对象属性,每个关键对象块对应的对象属性为关键属性组中的任一关键对象属性。
5.例如,在本公开一实施例提供的图像处理方法中,输出所述n个对象内容中的m个对象内容,包括:确定选择输出信息;确定并输出所述n个对象内容中与所述选择输出信息对应的对象内容,其中,所述m个对象内容包括所述n个对象内容中与所述选择输出信息对应的对象内容。
6.例如,在本公开一实施例提供的图像处理方法中,所述选择输出信息包括与所述输入图像对应的图像类型,所述关键属性组包括多个关键对象属性,确定并输出所述n个对象内容中与所述选择输出信息对应的对象内容,包括:确定所述多个关键对象属性中与所述图像类型对应的至少一个关键对象属性;确定所述n个关键对象块中的对象属性为所述至少一个关键对象属性中的任一关键对象属性的至少一个关键对象块;输出所述至少一个关键对象块中的对象内容,其中,与所述选择输出信息对应的对象内容为所述至少一个关
键对象块中的对象内容。
7.例如,在本公开一实施例提供的图像处理方法中,所述选择输出信息包括用户预先定义的信息。
8.例如,在本公开一实施例提供的图像处理方法中,输出所述至少一个记录内容中的l个记录内容,包括:确定选择输出信息;确定并输出所述至少一个记录内容中与所述选择输出信息对应的记录内容,其中,所述l个记录内容包括所述至少一个记录内容中与所述选择输出信息对应的记录内容。
9.例如,在本公开一实施例提供的图像处理方法中,所述选择输出信息包括与所述输入图像对应的图像类型,所述关键属性组包括多个关键对象属性,确定并输出所述至少一个记录内容中与所述选择输出信息对应的记录内容,包括:确定所述多个关键对象属性中与所述图像类型对应的至少一个关键对象属性;确定所述n个关键对象块中的对象属性为所述至少一个关键对象属性中的任一关键对象属性的至少一个关键对象块;输出所述至少一个记录内容中与所述至少一个关键对象块中的对象内容对应的记录内容,其中,与所述选择输出信息对应的记录内容为所述至少一个记录内容中与所述至少一个关键对象块中的对象内容对应的记录内容。
10.例如,在本公开一实施例提供的图像处理方法中,基于所述多个关键对象块,确定所述多个对象单元格中的n个关键对象单元格,包括:基于所述多个关键对象块,确定所述多个对象单元格中的多个关键对象单元格,其中,所述多个关键对象单元格为所述多个对象单元格中与所述多个关键对象块一一对应的对象单元格;基于所述多个关键对象单元格的位置,确定所述多个关键对象单元格中的所述n个关键对象单元格。
11.例如,在本公开一实施例提供的图像处理方法中,所述多个单元格还包括多个空白单元格,每个空白单元格不包括对象块,基于所述多个对象块中的多个对象内容,确定与所述n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容,包括:针对所述n个关键对象单元格中的第i个关键对象单元格:获取位于所述第i个关键对象单元格的在第二方向上的第一侧的p个单元格;响应于所述p个单元格包括至少一个对象单元格,基于所述p个单元格,确定与所述第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容;响应于所述p个单元格均为空白单元格,确定所述第i个关键对象单元格中的关键对象块不具有对应的记录内容。
12.例如,在本公开一实施例提供的图像处理方法中,在所述输入图像中,所述p个单元格中的任一个单元格在所述第一方向上的边缘不超过所述第i个关键对象单元格在所述第一方向上的边缘。
13.例如,在本公开一实施例提供的图像处理方法中,响应于所述p个单元格包括至少一个对象单元格,基于所述p个单元格,确定与所述第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容,包括:响应于p为1且所述p个单元格为对象单元格,将所述p个单元格中的对象块中的对象内容作为与所述第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容;响应于p为大于1:对所述p个单元格进行合并处理,以得到与所述第i个关键对象单元格对应的至少一个合并单元格,其中,每个合并单元格包括至少一个对象块,每个合并单元格对应的合并内容为所述至少一个对象块中的对象内容;基于所述至少一个合并单元格分别对应的至少一个合并内容,确定与所述第i个关键对象单元格中
的关键对象块中的对象内容对应的记录内容。
14.例如,在本公开一实施例提供的图像处理方法中,每个对象块中的对象内容包括文本,此时,对象块即为文本块。每个对象块的对象属性包括词性,所述合并处理包括:基于所述p个单元格的位置,确定至少一个单元格组,其中,每个单元格组包括所述p个单元格中的至少一个单元格,在任一单元格组包括多个单元格的情况下,所述任一单元格组中的多个单元格沿所述第一方向排列为一排;基于所述至少一个单元格组,确定与所述至少一个单元格组一一对应的至少一个中间合并单元格,其中,在所述任一单元格组包括多个单元格的情况下,所述任一单元格组中的多个单元格合并作为与所述任一单元格组对应的中间合并单元格,在所述任一单元格组包括一个单元格的情况下,所述任一单元格组中的一个单元格直接作为与所述任一单元格组对应的中间合并单元格;响应于所述至少一个中间合并单元格包括多个中间合并单元格,在所述多个中间合并单元格中的待进行合并的第一中间合并单元格和第二中间合并单元格满足合并条件的情况下,将所述第一中间合并单元格和所述第二中间合并单元格进行合并,响应于所述至少一个中间合并单元格包括一个中间合并单元格,将所述一个中间合并单元格作为一个合并单元格。
15.例如,在本公开一实施例提供的图像处理方法中,所述合并条件包括:所述第一中间合并单元格和所述第二中间合并单元格均包括对象块,且所述第一中间合并单元格中的对象块中的对象内容和所述第二中间合并单元格中的对象块中的对象内容相同或在语义上是连续的,在所述输入图像中,所述第一中间合并单元格和所述第二中间合并单元格在所述第二方向上是依次连续排列的;或者,所述第一中间合并单元格和/或所述第二中间合并单元格不包括对象块,在所述输入图像中,所述第一中间合并单元格和所述第二中间合并单元格在所述第二方向上是依次连续排列的。
16.例如,在本公开一实施例提供的图像处理方法中,在所述输入图像中,所述第一方向和所述第二方向彼此垂直。
17.例如,在本公开一实施例提供的图像处理方法中,基于所述至少一个合并单元格分别对应的至少一个合并内容,确定与所述第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容,包括:获取过滤规则;基于所述过滤规则,对所述至少一个合并内容进行过滤处理,以确定与所述第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容。
18.例如,在本公开一实施例提供的图像处理方法中,对所述输入图像进行识别处理,以得到多个对象块,包括:利用对象识别模型对所述输入图像进行识别处理,以得到多个初始对象块;利用对象分类模型对所述多个初始对象块按照对象属性进行分类处理,以得到所述多个对象块。
19.例如,在本公开一实施例提供的图像处理方法中,确定所述多个对象块中的多个关键对象块,包括:利用对象分类模型对所述多个对象块按照对象属性进行分类,以得到所述多个对象块和与所述多个对象块一一对应的多个对象属性;基于所述多个对象属性,从所述多个对象块中确定所述多个关键对象块。
20.例如,在本公开一实施例提供的图像处理方法中,基于所述多个对象块分别对应的多个块位置,生成单元表格,包括:基于所述多个块位置确定多条分隔线,其中,每两个对象块之间具有至少一条分隔线;通过所述多条分隔线对所述多个对象块进行分隔处理以形
成所述单元表格。
21.本公开至少一个实施例还提供一种图像处理装置,包括:图像获取模块,配置为获取输入图像;识别模块,配置为对所述输入图像进行识别处理,以得到多个对象块,其中,每个对象块包括一个对象内容;对象块确定模块,配置为确定所述多个对象块中的多个关键对象块;表格生成模块,配置为基于所述多个对象块分别对应的多个块位置,生成单元表格,其中,所述单元表格包括多个单元格,所述多个单元格包括多个对象单元格,每个对象单元格包括一个对象块;单元格确定模块,被配置为基于所述多个关键对象块,确定所述多个对象单元格中的n个关键对象单元格,其中,所述n个关键对象单元格中的每个关键对象单元格包括一个关键对象块,在所述输入图像中,所述n个关键对象单元格沿第一方向排列为同一排;记录内容确定模块,被配置为基于所述多个对象块中的多个对象内容,确定与所述n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容,其中,每个记录内容包括至少一个对象内容;输出模块,被配置为输出所述n个对象内容中的m个对象内容和/或输出所述至少一个记录内容中的l个记录内容,其中,n、m和l为正整数,且n大于1。
22.本公开至少一个实施例还提供一种电子设备,包括:存储器,非瞬时性地存储有计算机可执行指令;处理器,配置为运行所述计算机可执行指令,其中,所述计算机可执行指令被所述处理器运行时实现根据本公开任一实施例所述的图像处理方法。
23.本公开至少一个实施例还提供一种非瞬时性计算机可读存储介质,其中,所述非瞬时性计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现根据本公开任一实施例所述的图像处理方法。
附图说明
24.为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
25.图1为本公开至少一个实施例提供的一种图像处理方法的示意性流程图;
26.图2a为本公开至少一实施例提供的一种输入图像的示意图;
27.图2b为本公开至少一实施例提供的另一种输入图像的示意图;
28.图3为对图2b所示的输入图像中的多个对象块进行处理之后生成的单元表格的示意图;
29.图4为本公开一实施例提供的又一种输入图像的示意图;
30.图5为本公开至少一个实施例提供的一种图像处理装置的示意图;
31.图6为本公开至少一实施例提供的一种电子设备的示意图;
32.图7为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图。
具体实施方式
33.为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范
围。
34.除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
35.为了保持本公开实施例的以下说明清楚且简明,本公开省略了部分已知功能和已知部件的详细说明。
36.本公开至少一个实施例提供一种图像处理方法。该图像处理方法包括:获取输入图像;对输入图像进行识别处理,以得到多个对象块,其中,每个对象块包括一个对象内容;确定多个对象块中的多个关键对象块;基于多个对象块分别对应的多个块位置,生成单元表格,其中,单元表格包括多个单元格,多个单元格包括多个对象单元格,每个对象单元格包括一个对象块;基于多个关键对象块,确定多个对象单元格中的n个关键对象单元格,其中,n个关键对象单元格中的每个关键对象单元格包括一个关键对象块,在输入图像中,n个关键对象单元格沿第一方向排列为同一排;基于多个对象块中的多个对象内容,确定与n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容,其中,每个记录内容包括至少一个对象内容;输出n个对象内容中的m个对象内容和/或输出至少一个记录内容中的l个记录内容。n、m和l为正整数,且n大于1。
37.在本公开的实施例提供的图像处理方法中,首先,基于对象块对应的块位置生成单元表格,然后,基于单元表格中的各个对象单元格的位置信息快速准确地确定n个关键对象单元格,最后,基于多个对象块中的多个对象内容和n个关键对象单元格,可以确定并输出需要输出的内容,例如,需要输出的内容即为n个对象内容中的m个对象内容和/或输出至少一个记录内容中的l个记录内容。由此,基于本公开的实施例提供的图像处理方法可以快速准确地识别输入图像中的关键信息,从而方便快捷地提取并输出需要输出的内容。
38.本公开至少一个实施例还提供一种对应于上述图像处理方法的图像处理装置、电子设备和非瞬时性计算机可读存储介质。
39.本公开实施例提供的图像处理方法可应用于本公开实施例提供的图像处理装置,该图像处理装置可被配置于电子设备上。该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等硬件设备。
40.下面结合附图对本公开的实施例进行详细说明,但是本公开并不限于这些具体的实施例。需要说明的是,在本公开的实施例中,“多个”表示两个或以上,即至少两个。
41.图1为本公开至少一个实施例提供的一种图像处理方法的示意性流程图。图2a为本公开至少一实施例提供的一种输入图像的示意图。图2b为本公开至少一实施例提供的另一种输入图像的示意图。
42.如图1所示,本公开至少一实施例提供的图像处理方法包括以下步骤s10至步骤s16。
43.步骤s10:获取输入图像。
44.步骤s11:对输入图像进行识别处理,以得到多个对象块。例如,每个对象块包括一个对象内容。
45.步骤s12:确定多个对象块中的多个关键对象块。
46.步骤s13:基于多个对象块分别对应的多个块位置,生成单元表格。例如,单元表格包括多个单元格,多个单元格包括多个对象单元格,每个对象单元格包括一个对象块。
47.步骤s14:基于多个关键对象块,确定多个对象单元格中的n个关键对象单元格。例如,n个关键对象单元格中的每个关键对象单元格包括一个关键对象块,在输入图像中,n个关键对象单元格沿第一方向排列为同一排。例如,在一些实施例中,在输入图像中,n个关键对象单元格沿第一方向连续排列为同一排;例如,在另一些实施例中,在输入图像中,n个关键对象单元格沿第一方向排列为同一排,在该n个关键对象单元格所在的一排中具有至少一个非关键对象单元格,非关键对象单元格为多个单元格中的除了n个关键对象单元格之外的单元格。
48.步骤s15:基于多个对象块中的多个对象内容,确定与n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容。例如,每个记录内容包括至少一个对象内容。
49.步骤s16:输出n个对象内容中的m个对象内容和/或输出至少一个记录内容中的l个记录内容。
50.例如,n、m和l为正整数,且n大于1。
51.例如,对于步骤s10,输入图像可以为用户对某一物体进行扫描或拍照所得的图像,该物体例如可以是名片、试卷、化验单、文档、发票等。输入图像可以包括表格(例如,有线表格和/或无线表格)。
52.例如,输入图像的形状可以为矩形、正方形等规则形状,也可以为不规则形状,输入图像的形状和尺寸等可以由用户根据实际情况自行设定。例如,输入图像可以为通过数码相机或手机等拍摄得到的图像,也可以为通过扫描机扫描得到的图像,例如,输入图像可以是数码相机、手机或扫描机等直接采集到的原始图像,另外,为了避免原始图像的数据质量、数据不均衡等对于输入图像的识别的影响,本公开实施例提供的图像处理方法还可以包括对原始图像进行预处理的操作,即输入图像也可以是对原始图像进行预处理后得到的图像。例如,预处理可以消除原始图像中的无关信息或噪声信息,以便于更好地对原始图像进行处理。预处理例如可以包括对原始图像进行弯曲校正、缩放、剪裁、伽玛(gamma)校正、图像增强或降噪滤波等处理,从而提升后续步骤中的各项操作的准确性和可靠性。弯曲校正可以包括全局校正和局部校正,全局校正可以校正原始图像中的对象内容的全局偏移情况,从而避免由于对象内容的偏斜造成后续对于对象内容识别不准确的问题。在一些实施例中,全局校正可以采用基于leptonica(leptonica是一个开源的图像处理和图像分析库)的思路采用opencv中的算法实现;在另一些实施例中,全局校正也可以采用机器学习(例如,神经网络)的方法实现。由于对原始图像进行全局校正之后,原始图像中的一些细节可能还未调整,因而通过局部校正可以针对在全局校正过程中忽略的细节进行一些补充校正,从而降低或防止由于全局校正产生的细节丢失,提高对原始图像进行校正处理后得到的输入图像的准确性和可靠性。
53.例如,输入图像可以为灰度图像,也可以为彩色图像。
54.例如,步骤s11中可以包括:利用对象识别模型对输入图像进行识别处理,以得到多个初始对象块;利用对象分类模型对多个初始对象块按照对象属性进行分类处理,以得到多个对象块。
55.例如,每个初始对象块包括至少一个对象内容。每个初始对象块的形状可以为矩形、正方形等规则形状,也可以为不规则形状,只要初始对象块能够覆盖相应的对象内容即可。类似地,每个对象块的形状可以为矩形、正方形等规则形状,也可以为不规则形状,只要对象块能够覆盖相应的对象内容即可。
56.例如,每个对象块中的对象内容可以包括至少一个文字、至少一个图形(圆形、矩形等)、至少一个符号(冒号、逗号、句号、百分号等)或至少一个数据等。文字可以包括中文文字和/或外文文字,文字可以为印刷体文字和/或手写体文字等。例如,每个对象块中的对象内容沿第一方向排列为一排。在本公开的描述中,以输入图像中包含的对象内容包括文字、数字和符号中的至少一个为例,此时,对象属性可以为词性。例如,第一方向可以为文字/数字排列的行方向或列方向。
57.需要说明的是,在本公开的实施例中,一个对象块中的所有内容(文字、数字、符号和/或图形)为一个对象内容。
58.例如,对象识别模型和对象分类模型可以采用机器学习技术实现并且例如运行在通用计算装置或专用计算装置上。该对象识别模型和对象分类模型均为预先训练得到的神经网络模型。例如,对象识别模型和对象分类模型可以采用深度卷积神经网络(deep-cnn)等神经网络实现。
59.在训练对象识别模型的过程中,首先,可以对样本图像进行标注,以标注出样本图像中的各个样本对象块,然后,通过标注好的样本图像对初始对象识别模型进行训练,最终训练得到对象识别模型。在训练对象分类模型的过程中,首先,可以对样本图像进行标注,以标注具有关键对象属性(例如,表头)的关键样本对象块和不具有关键对象属性的非关键样本对象块(例如,其对象属性可以包括数据属性等),然后,通过标注好的样本图像对初始对象分类模型进行训练,最终训练得到对象分类模型。
60.需要说明的是,在本公开的实施例中,在对输入图像进行处理之后,该输入图像和识别出的输入图像中的关键对象单元格也可以作为样本加入到用于训练初始对象分类模型和初始对象识别模型的训练集中,从而扩展训练集的样本数量,优化网络模型。
61.例如,在一些实施例中,对象分类模型可以基于命名实体识别(named entity recognition,简称ner)技术实现。ner又称作专名识别,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。在另一些实施例中,对象分类模型可以为预先训练好的文本分类神经网络模型。
62.例如,对象分类模型可以基于对象属性(例如,词性)对多个初始对象块进行分类,从而得到多个对象块。每个对象块具有对应的对象属性,可以根据不同方式设定对象属性,例如,对象属性可以包括表题、表头、表身等,多个对象块包括对象属性为表题的对象块、对象属性为表头的对象块、对象属性为表身的对象块等等。对象属性也可以包括人名、地名、组织机构名、日期时间、专有名词等,多个对象块包括对象属性为人名的对象块、对象属性
为地名的对象块、对象属性为组织机构名的对象块、对象属性为日期时间的对象块、对象属性为专有名词的对象块等等。在本公开的实施例中,对象分类模型可以识别每个初始对象块,以确定每个初始对象块的对象属性,并基于对象属性对多个初始对象块进行分类。
63.例如,每个对象块可以对应至少一个初始对象块。
64.例如,对象分类模型还可以进行断句操作。由于在输入图像中,某些对象内容之间的距离很近,因此,在对象识别模型进行识别的过程中,这些对象内容可能被包括在同一个初始对象块中,断句操作可以将该初始对象块中的这些对象内容进行拆分并划分为不同的对象块。例如,对于对象内容“姓名某某某”,在对象识别模块进行识别时,“姓名某某某”仅位于一个初始对象块中,而在对象分类模型进行分类的过程中,这个初始对象块需要被拆成两个对象块:“姓名”对应的对象块和“某某某”对应的对象块,“姓名”对应的对象块的对象属性可以为专有名词,而“某某某”对应的对象块的对象属性可以为人名。
65.例如,彼此对应的初始对象块和对象块的不同之处在于:对象块具有对象属性,除此之外,彼此对应的初始对象块和对象块的其余性质可以均相同。
66.例如,在输入图像中,第一方向和第二方向可以彼此大致垂直,如图2a所示,在输入图像200中,第一方向可以为图像坐标系oxy的x轴方向(例如,水平方向),且为文字/数字排列的行方向,第二方向可以为图像坐标系oxy的y轴方向(例如,竖直方向),且为文字/数字排列的列方向,本公开的实施例对此不作限制,又例如,第一方向可以为文字/数字排列的列方向(例如,竖直方向),第二方向可以为文字/数字排列的行方向(例如,水平方向)。需要说明的是,在另一些实施例中,第一方向和第二方向并不是水平方向和竖直方向,而是与水平方向和竖直方向之间具有一定夹角的方向,根据实际情况,第一方向和第二方向可以为任意合适的方向。
67.例如,如图2a所示,输入图像200位于图像坐标系oxy中,输入图像200包括表格区域201,表格区域201表示输入图像中的表格所在的区域。表格区域201包括多个对象块202,每个对象块202包括一个对象内容,如图2a所示,对象块202包括对象块202a和对象块202b,对象块202a包括的对象内容为六个数字“391001”,该六个数字“391001”沿第一方向(即图2a中的x轴方向)排列为一行,对象块202b包括的对象内容为十个中文文字“机动车道路停车费收费”,该十个中文文字“机动车道路停车费收费”也沿第一方向排列为一行。而在本公开的其他一些实施例中,对象块202包括的对象内容也可以沿第二方向排列为一行或者分别沿第一方向和第二方向排列为多行或多列的情况。
68.例如,如图2b所示,输入图像300包括表格区域301,表格区域301包括多个对象块302,每个对象块302包括一个对象内容。例如,如图2b所示,对象块302包括的对象内容为“80.00”,“80.00”包括四个数字(8、0、0、0)和一个符号(.),“80.00”沿第一方向排列为一行。
69.例如,步骤s12可以包括:利用对象分类模型对多个对象块按照对象属性进行分类,以得到多个对象块和与多个对象块一一对应的多个对象属性;基于多个对象属性,从多个对象块中确定多个关键对象块。
70.例如,在步骤s12中,多个关键对象块为多个对象块中的对象属性为关键属性组中的关键对象属性的对象块。
71.例如,关键属性组包括多个关键对象属性,每个关键对象块对应的对象属性为关
键属性组中的关键对象属性。例如,在一些实施例中,关键对象属性可以包括表头,此时,对象属性为表头的对象块为关键对象块。又例如,在另一些实施例中,关键对象属性可以包括专有名词,对象属性为专有名词的对象块为关键对象块。需要说明的是,关键对象属性可以根据实际应用需求设置,本公开的实施例对此不作具体限制。
72.例如,步骤s13可以包括:基于多个块位置确定多条分隔线;通过多条分隔线对多个对象块进行分隔处理以形成单元表格。
73.例如,在多个对象块中,每两个对象块之间具有至少一条分隔线。
74.例如,每条分隔线可以沿第一方向或第二方向延伸,但是不会穿过任一对象块。
75.例如,可以基于对象块的块位置确定多条分隔线,分隔线可能是表格中的实线,也可能是在空白区域增加的一条线。在单元表格中,最终每个对象块都位于一个对象单元格中。在通过多条分隔线对多个对象块进行分隔处理之后,对象块的坐标可以不采用像素表示,而采用单元表格中的单元行和单元列表示,每个对象块都具有整数的行号和列号,多个对象块之间不会重叠,对象块中的对象内容也不会被分割。
76.例如,可以采用各种合适的方式来生成单元表格,例如,在本公开的上面的描述中,生成表格单元的过程为:首先生成分隔线(分隔线可以沿第一方向或第二方向延伸,但不会穿过任一对象块),将各个对象块进行分隔,从而生成单元表格。本公开的实施例对生成单元表格的具体过程和方法不作限制。
77.例如,可以采用多条分隔线将对象块进行划分,多条分隔线可以包括水平分隔线和竖直分隔线,水平分隔线与水平方向(例如,第一方向)平行,即图2a所示的图像坐标系oxy的x轴方向,竖直分隔线与竖直方向(例如,第二方向)平行,即图2a所示的图像坐标系oxy的y轴方向。因为多个对象块的分布比较分散,需要将多个对象块聚类到采用少量分隔线来进行划分,将对象块的左右边缘(如图2a所示的x轴方向的两个边缘)聚类到竖直分隔线的坐标(图像坐标系oxy中的横坐标(x轴坐标)),对象块的上下边缘(如图2a所示的y轴方向的两个边缘)聚类到水平分隔线的坐标(图像坐标系oxy中的纵坐标(y轴坐标)),可以根据对象块的边缘来将各个对象块进行分隔,划分完毕后,不同对象块就位于不同的对象单元格中,此外,基于多条分隔线进行分隔之后,还可能形成空白单元格(即不包括对象块的单元格),对象单元格和空白单元格共同组成了单元表格。
78.图3为对图2b所示的输入图像中的多个对象块进行处理之后生成的单元表格的示意图。
79.如图3所示,每一个完整的矩形格为一个单元格,单元表格包括多个单元格,多个单元格可以沿第一方向和第二方向排列为多行多列,各个单元格的尺寸可以各不相同,或部分单元格的尺寸可以相同。多个单元格包括多个对象单元格,如图3所示的对象单元格311,每个对象单元格包括一个对象块,多个单元格还包括多个空白单元格,如图3所示的空白单元格310,每个空白单元格不包括任何对象块。在图3中,每个矩形格中的阴影部分表示一个对象块,阴影部分的颜色深浅表示不同对象属性的对象块,例如,对象单元格311a中的对象块的对象属性和对象单元格311b中的对象块的对象属性不相同,在一些示例中,对象单元格311a中的对象块的对象属性为关键对象属性,从而对象单元格311a为关键对象单元格。
80.例如,每个单元格按照其所在的位置确定其所处的行和列,如图3所示,对象单元
格311a位于单元表格的第三行第六列,对象单元格311b位于单元表格的第一行第九列。
81.图4为本公开一实施例提供的又一种输入图像的示意图。
82.例如,在一些实施例中,步骤s14可以包括:基于多个关键对象块,确定多个对象单元格中的多个关键对象单元格;基于多个关键对象单元格的位置,确定多个关键对象单元格中的n个关键对象单元格。在本公开的实施例中,可以根据关键对象单元格的位置,确定用户所需的关键对象单元格,即n个关键对象单元格,n的具体数值可以根据实际情况确定,本公开的实施例对此不作限制。
83.例如,多个关键对象单元格为多个对象单元格中与多个关键对象块一一对应的对象单元格。
84.例如,在多个关键对象单元格中找到在位置上连续的关键对象单元格,以得到n个关键对象单元格,在输入图像中,n个关键对象单元格沿第一方向排列为同一排,若第一方向为文本排列的行方向,则n个关键对象单元格位于同一行;若第一方向为文本排列的列方向,则n个关键对象单元格位于同一列。
85.例如,在单元表格中,在n个关键对象单元格所在的一行单元格中,可能存在至少一个非关键对象单元格,如果在n个关键对象单元格所在的一行单元格中的非关键对象单元格的数量在预定数量阈值以内,则那么还是可以将认为这一行是需要被处理的对象,即可以对n个关键对象单元格执行后续步骤(步骤s15和步骤s16)。例如,预定数量阈值可以根据n个关键对象单元格所在的一行单元格中的列的数量确定,当n个关键对象单元格所在的一行单元格中的列的数量(即该一行单元格中的单元格的数量)越多,则预定数量阈值可以越大,当列越多时,则表示n个关键对象单元格所在的一行单元格能容忍的非关键对象单元格的数量越大,例如,当n个关键对象单元格所在的一行单元格包括5列,则预定数量阈值可以为1,即可以容忍在n个关键对象单元格所在的一行单元格中包括1个非关键对象单元格;当n个关键对象单元格所在的一行单元格包括10列,则预定数量阈值可以为2,即可以容忍在n个关键对象单元格所在的一行单元格中包括2个非关键对象单元格。又例如,预定数量阈值也可以由用户根据实际情况设置,本公开对此不作具体限制。
86.例如,在一些实施例中,当对象属性为表头的对象块为关键对象块,预定数量阈值为2时,n个关键对象单元格所在的一行单元格中的非关键对象单元格的数量小于等于2,则n个关键对象单元格所在的一行单元格可以被认为是表头所在的行。
87.需要说明的是,“非关键对象单元格”表示单元表格中的不属于关键对象单元格的单元格。
88.例如,如图4所示,多个关键对象块包括对象内容为“序号”的对象块、对象内容为“货物(劳务)名称”的对象块、对象内容为“规格型号”的对象块、对象内容为“单位”的对象块、对象内容为“数量”的对象块、对象内容为“单价”的对象块、对象内容为“金额”的对象块、对象内容为“税率”的对象块以及“税额”的对象块,包括上述多个关键对象块的对象单元格为关键对象单元格,在图4中,关键对象单元格通过虚线矩形框401~409(下面通过401~409表示关键对象单元格)示出,在位置上,关键对象单元格401~409沿第一方向排列(例如,连续排列)为一行,由此可以确定关键对象单元格401~409即为上述n个关键对象单元格,此时n为9。
89.例如,在一些实施例中,步骤s15可以包括:针对n个关键对象单元格中的第i个关
键对象单元格:获取位于第i个关键对象单元格的在第二方向上的第一侧的p个单元格;响应于p个单元格包括至少一个对象单元格,基于p个单元格,确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容;响应于p个单元格均为空白单元格,确定第i个关键对象单元格中的关键对象块不具有对应的记录内容。
90.例如,每个记录内容包括至少一个对象内容。
91.例如,在输入图像中,p个单元格中的任一个单元格在第一方向上的边缘不超过第i个关键对象单元格在第一方向上的边缘。
92.例如,在竖直方向上,每个关键对象单元格的彼此相对的两侧为上侧和下侧,在水平方向上,每个关键对象单元格的彼此相对的两侧为左侧和右侧。
93.例如,在一些实施例中,如图4所示,若第一方向为水平方向,第二方向为竖直方向,此时,第i个关键对象单元格的在第二方向上的第一侧可以为第i个关键对象单元格的下侧(例如,在图4中,单元格4092位于单元格4091的下侧);在另一些实施例中,若第一方向为竖直方向,第二方向为水平方向,此时,第i个关键对象单元格的在第二方向上的第一侧可以为第i个关键对象单元格的右侧(例如,在图4中,关键对象单元格402位于关键对象单元格401的右侧)。
94.例如,如图4所示,在一些示例中,若第i个关键对象单元格为关键对象单元格409,此时,位于第i个关键对象单元格(即关键对象单元格409)的在第二方向上的第一侧的p个单元格包括包含对象内容“917.59”的单元格4091、包含对象内容
“‑
75.93”的单元格4092、包含对象内容“458.80”的单元格4093、包含对象内容
“‑
37.96”的单元格4094,即此时p为4,该p个单元格均为对象单元格,与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容可以基于p个单元格中的对象块的对象内容确定。
95.例如,如图4所示,在另一些示例中,若第i个关键对象单元格为关键对象单元格406,此时,位于第i个关键对象单元格(即关键对象单元格406)的在第二方向上的第一侧的p个单元格包括包含对象内容“3529.20”的单元格4061、空白单元格4062、包含对象内容“3529.20”的单元格4063、空白单元格4064,即此时p仍然为4,但是该p个单元格包括两个对象单元格和两个空白单元格,与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容可以基于p个单元格中的对象单元格(即包含对象内容“3529.20”的单元格4061和包含对象内容“3529.20”的单元格4063)中的对象块的对象内容确定。
96.又例如,若p个单元格均为空白单元格,则第i个关键对象单元格中的关键对象块不具有对应的记录内容。
97.例如,在步骤s15中,响应于p个单元格包括至少一个对象单元格,基于p个单元格,确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容,包括:响应于p为1且p个单元格为对象单元格,将p个单元格中的对象块中的对象内容作为与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容;响应于p为大于1:对p个单元格进行合并处理,以得到与第i个关键对象单元格对应的至少一个合并单元格;基于至少一个合并单元格分别对应的至少一个合并内容,确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容。例如,每个对象内容可以对应一个记录内容或多个记录内容。
98.例如,每个合并单元格包括至少一个对象块,每个合并单元格对应的合并内容为
该合并单元格包括的至少一个对象块中的对象内容。
99.由于p个单元格中的相邻的单元格可能包含相同的对象块,或者相邻的单元格的对象块中的对象内容在语义上连续的,从而相邻的单元格需要合并成一个合并单元格。图4所示的单元格4021~4023需要被合并为一个合并单元格(下面将详细描述)。
100.例如,合并处理包括:基于p个单元格的位置,确定至少一个单元格组;基于至少一个单元格组,确定与至少一个单元格组一一对应的至少一个中间合并单元格;响应于至少一个中间合并单元格包括多个中间合并单元格,在多个中间合并单元格中的待进行合并的第一中间合并单元格和第二中间合并单元格满足合并条件的情况下,将第一中间合并单元格和第二中间合并单元格进行合并;响应于至少一个中间合并单元格包括一个中间合并单元格,将一个中间合并单元格作为一个合并单元格。
101.例如,每个单元格组包括p个单元格中的至少一个单元格,在任一单元格组包括多个单元格的情况下,任一单元格组中的多个单元格沿第一方向排列为一排。
102.例如,可以根据p个单元格的位置确定至少一个单元格组,例如,若p个单元格中的k个单元格沿第一方向排列为一行,则该k个单元格作为一个单元格组,若某一行仅包括p个单元格中的1个单元格,则该1个单元格作为一个单元格组。k为正整数,且大于1。
103.例如,每个单元格组对应一个中间合并单元格,在任一单元格组包括多个单元格的情况下,任一单元格组中的多个单元格合并作为与任一单元格组对应的中间合并单元格,也就是说,每个单元格组中,沿第一方向排列为一排的多个单元格需要被合并为一个中间合并单元格。在任一单元格组包括一个单元格的情况下,任一单元格组中的一个单元格直接作为与任一单元格组对应的中间合并单元格。
104.例如,每个对象块中的对象内容包括文本,每个对象块的对象属性包括词性。在一些实施例中,合并条件包括:第一中间合并单元格和第二中间合并单元格均包括对象块,且第一中间合并单元格中的对象块中的对象内容和第二中间合并单元格中的对象块中的对象内容相同或在语义上是连续的,在输入图像中,第一中间合并单元格和第二中间合并单元格在第二方向上是依次连续排列的。在另一些实施例中,合并条件包括:第一中间合并单元格和/或第二中间合并单元格不包括对象块,在输入图像中,第一中间合并单元格和第二中间合并单元格在第二方向上是依次连续排列的。在另一些实施例中,合并条件还可以包括:第一中间合并单元格和第二中间合并单元格之间的间距小于预定阈值。也就是说,第一中间合并单元格和第二中间合并单元格之间的间距小于预定阈值,则可以将第一中间合并单元格和第二中间合并单元格进行合并。预定阈值可以根据实际情况设置,本公开的实施例对此不作具体限制。
105.例如,合并处理需要基于单元表格中的所有单元格进行综合考虑实现。如图4所示,若单元格4021~4032自身不足以判定是否需要被合并,则可以结合其他列中的单元格的情况以确定是否合并,例如,由于关键对象单元格401(“序号”)对应的记录内容包括4组内容,分别为关键对象单元格401下侧的数字“1”、数字“2”、数字“3”和数字“4”,由此可知,其余关键对象单元格402~409对应的记录内容最多有4组内容,基于此并结合单元格4021~4032自身的情况,对单元格4021~4032进行合并处理。
106.需要说明的是,在本公开的实施例中,合并处理的过程还遵循以下原则:包括数字的多个单元格(单元格或中间单元格)基本上不会被合并,包括正文文本的多个单元格(单
元格或中间单元格)可以被合并,包括数字的单元格(单元格或中间单元格)和空白的单元格(单元格或中间单元格)可以被合并。可以根据对象内容、单元格的位置、语义模型、单元格之间的间隔等综合判断是否合并单元格。
107.例如,如图4所示,在一个示例中,若第i个关键对象单元格为关键对象单元格402,此时,位于第i个关键对象单元格(即关键对象单元格402)的在第二方向上的第一侧的p个单元格包括单元格4021~4032,即此时p为12。该单元格4021~4032需要进行合并处理,以得到与第i个关键对象单元格对应的至少一个合并单元格,例如,单元格4021~4023中的对象块中的对象内容在语义上是连续的,从而单元格4021~4023可以被合并为一个合并单元格,且该合并单元格中的合并内容包括单元格4021~4023中的对象块中的对象内容,即合并内容为“*移动通信设备*【超级爆款】超感光徕卡三摄智能芯片全面屏屏内指纹版”;单元格4024~4026中的对象块中的对象内容在语义上是连续的,从而单元格4024~4026可以被合并为一个合并单元格,且该合并单元格中的合并内容包括单元格4024~4026中的对象块中的对象内容,即合并内容为“*移动通信设备*【超级爆款】超感光徕卡三摄智能芯片全面屏屏内指纹版”;单元格4027~4029中的对象块中的对象内容在语义上是连续的,从而单元格4027~4029可以被合并为一个合并单元格,且该合并单元格中的合并内容包括单元格4027~4029中的对象块中的对象内容,即合并内容为“*移动通信设备*超感光徕卡三摄智能芯片全面屏屏内指纹版手机8gb 128gb”;单元格4030~4032中的对象块中的对象内容在语义上是连续的,从而单元格4030~4032可以被合并为一个合并单元格,且该合并单元格中的合并内容包括单元格4030~4032中的对象块中的对象内容,即合并内容为“*移动通信设备*超感光徕卡三摄智能芯片全面屏屏内指纹版手机8gb 128gb”。由此,在经过合并处理之后,关键对象单元格402对应的四个合并单元格。
108.例如,在一些实施例中,基于至少一个合并单元格分别对应的至少一个合并内容,确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容,包括:将至少一个合并单元格分别对应的至少一个合并内容作为与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容。
109.例如,如图4所示,在一些示例中,若第i个关键对象单元格为关键对象单元格402,与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容为上述四个合并单元格中的四个合并内容:“*移动通信设备*【超级爆款】超感光徕卡三摄智能芯片全面屏屏内指纹版”、“*移动通信设备*【超级爆款】超感光徕卡三摄智能芯片全面屏屏内指纹版”、“*移动通信设备*超感光徕卡三摄智能芯片全面屏屏内指纹版手机8gb 128gb”、“*移动通信设备*超感光徕卡三摄智能芯片全面屏屏内指纹版手机8gb 128gb”。
110.例如,在一些实施例中,基于至少一个合并单元格分别对应的至少一个合并内容,确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容,包括:获取过滤规则;基于过滤规则,对至少一个合并内容进行过滤处理,以确定与第i个关键对象单元格中的关键对象块中的对象内容对应的记录内容。
111.例如,过滤规则可以由用户根据实际情况进行设置,基于过滤规则可以过滤掉用户不需要的记录内容。例如,对于关键对象单元格401,该关键对象单元格401中包括的对象内容为“序号”,若该对象内容“序号”对应的记录内容包括“合计”,基于过滤规则确定该对象内容“序号”对应的记录内容必须为数字,则记录内容“合计”需要被过滤掉,而不作为对
象内容“序号”对应的记录内容。
112.例如,在一些实施例中,在步骤s16中,n个对象内容和该n个对象内容对应的至少一个记录内容均可以被输出,即此时n与m相等。
113.例如,在另一些实施例中,可以基于用户的选择,确定n个对象内容和该n个对象内容对应的至少一个记录内容中的需要被输出的内容。
114.在步骤s16中,输出n个对象内容中的m个对象内容,包括:确定选择输出信息;确定并输出n个对象内容中与选择输出信息对应的对象内容。例如,m个对象内容包括n个对象内容中与选择输出信息对应的对象内容。
115.在步骤s16中,输出至少一个记录内容中的l个记录内容,包括:确定选择输出信息;确定并输出至少一个记录内容中与选择输出信息对应的记录内容。例如,l个记录内容包括至少一个记录内容中与选择输出信息对应的记录内容。
116.例如,在一些实施例中,选择输出信息包括与输入图像对应的图像类型,由于很多情况下,并不是n个关键对象单元格中的n个关键对象块中的所有关键对象块都是用户想要关注的,也不是n个关键对象块中的所有对象内容及其对应的记录内容都是需要的。因此,可以对不同图像类型的输入图像标记出目标数据,通过样本训练后,模型可以自动识别不同图像类型的输入图像所对应的目标数据所在的单元格,最后在取数时可以只提取这些目标数据所在的单元格对应的对象内容和记录内容进行输出。例如,在一些示例中,不同图像类型的输入图像中的表格的类型(例如,财务表格、发票表格等)也各不相同,输入图像的图像类型可以基于该输入图像中的表格的类型确定。
117.在步骤s16中,确定并输出n个对象内容中与选择输出信息对应的对象内容,包括:确定多个关键对象属性中与图像类型对应的至少一个关键对象属性;确定n个关键对象块中的对象属性为至少一个关键对象属性中的任一关键对象属性的至少一个关键对象块;输出至少一个关键对象块中的对象内容。例如,与选择输出信息对应的对象内容为至少一个关键对象块中的对象内容。
118.在步骤s16中,确定并输出至少一个记录内容中与选择输出信息对应的记录内容,包括:确定多个关键对象属性中与图像类型对应的至少一个关键对象属性;确定n个关键对象块中的对象属性为至少一个关键对象属性中的任一关键对象属性的至少一个关键对象块;输出至少一个记录内容中与至少一个关键对象块中的对象内容对应的记录内容。例如,与选择输出信息对应的记录内容为至少一个记录内容中与至少一个关键对象块中的对象内容对应的记录内容。
119.例如,在另一些实施例中,选择输出信息包括用户预先定义的信息,即用户可以根据实际情况规定需要输出的内容。用户预先定义的信息可以直接指定需要输出的对象内容和/或记录内容,例如,如图4所示,在一些示例中,用户预先定义的信息可以表示输出对象内容“货物(劳务)名称”和“规格型号”及其对应的记录内容。
120.在步骤s16中,确定并输出n个对象内容中与选择输出信息对应的对象内容,包括:确定n个关键对象块中的与用户预先定义的信息对应的至少一个关键对象块;输出至少一个关键对象块中的对象内容。例如,与选择输出信息对应的对象内容为至少一个关键对象块中的对象内容。
121.在步骤s16中,确定并输出至少一个记录内容中与选择输出信息对应的记录内容,
包括:确定n个关键对象块中的与用户预先定义的信息对应的至少一个关键对象块;输出至少一个记录内容中与至少一个关键对象块中的对象内容对应的记录内容。例如,与选择输出信息对应的记录内容为至少一个记录内容中与至少一个关键对象块中的对象内容对应的记录内容。
122.例如,如图4所示,关键对象单元格401~409中的关键对象块中的对象内容分别为“序号”、“货物(劳务)名称”、“规格型号”、“单位”、“数量”、“单价”、“金额”、“税率”、“税额”。在一些示例中,选择输出信息为用户预先定义的信息,用户预先定义的信息可以表示不输出对象内容“单位”、对象内容“序号”、对象内容“税率”及其对应的记录内容,也就是说,对于对象内容“单位”、对象内容“序号”、对象内容“税率”,用户可能并不需要,从而可以不需要输出对象内容“单位”、对象内容“序号”、对象内容“税率”及其对应的记录内容;在另一些示例中,选择输出信息包括与输入图像对应的图像类型,对于图4所示的输入图像,选择输出信息可以表示不输出对象内容“单位”、对象内容“序号”、对象内容“税率”及其对应的记录内容。
123.基于此,根据选择输出信息,可以确定多个关键对象属性中与选择输出信息对应的至少一个关键对象属性;确定n个关键对象块中的对象属性为至少一个关键对象属性中的任一关键对象属性的至少一个关键对象块,该至少一个关键对象块包括对象内容为“货物(劳务)名称”的关键对象块、对象内容为“规格型号”的关键对象块、对象内容为“数量”的关键对象块、对象内容为“单价”的关键对象块、对象内容为“金额”的关键对象块、对象内容为“税额”的关键对象块,最终输出对象内容“货物(劳务)名称”、“规格型号”、“数量”、“单价”、“金额”、“税额”和/或这些对象内容对应的记录内容。
124.本公开至少一个实施例还提供一种图像处理装置。图5为本公开至少一个实施例提供的一种图像处理装置的示意图。
125.如图5所示,图像处理装置500可以包括:图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和输出模块507。例如,这些模块(即图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和输出模块507)可以通过硬件(例如电路)模块、软件模块或二者的任意组合等实现,以下实施例与此相同,不再赘述。例如,可以通过中央处理单元(cpu)、图像处理器(gpu)、张量处理器(tpu)、现场可编程逻辑门阵列(fpga)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元以及相应计算机指令来实现这些模块。
126.例如,图像获取模块501配置为获取输入图像。例如,输入图像可以包括表格。
127.例如,识别模块502配置为对输入图像进行识别处理,以得到多个对象块。例如,每个对象块包括一个对象内容,对象内容可以包括文字、数字、图形、符号等。
128.例如,对象块确定模块503配置为确定多个对象块中的多个关键对象块。
129.例如,表格生成模块504配置为基于多个对象块分别对应的多个块位置,生成单元表格。例如,单元表格包括多个单元格,多个单元格包括多个对象单元格,每个对象单元格包括一个对象块。
130.例如,单元格确定模块505被配置为基于多个关键对象块,确定多个对象单元格中的n个关键对象单元格。例如,n个关键对象单元格中的每个关键对象单元格包括一个关键
对象块,在输入图像中,n个关键对象单元格沿第一方向排列为同一排。
131.例如,记录内容确定模块506被配置为基于多个对象块中的多个对象内容,确定与n个关键对象单元格中的n个关键对象块中的n个对象内容对应的至少一个记录内容。例如,每个记录内容包括至少一个对象内容。
132.例如,输出模块507被配置为输出n个对象内容中的m个对象内容和/或输出至少一个记录内容中的l个记录内容。
133.例如,n、m和l为正整数,且n大于1。
134.例如,图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和/或输出模块507可以包括存储在存储器中的代码和程序;处理器可以执行该代码和程序以实现如上所述的图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和/或输出模块507的一些功能或全部功能。例如,图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和/或输出模块507可以是专用硬件器件,用来实现如上所述的功能。例如,图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和/或输出模块507可以是一个电路板或多个电路板的组合,用于实现如上所述的功能。在本技术实施例中,该一个电路板或多个电路板的组合可以包括:(1)一个或多个处理器;(2)与处理器相连接的一个或多个非暂时的存储器;以及(3)处理器可执行的存储在存储器中的固件。
135.需要说明的是,图像获取模块501可以用于实现图1所示的步骤s10,识别模块502可以用于实现图1所示的步骤s11,对象块确定模块503可以用于实现图1所示的步骤s12,表格生成模块504可以用于实现图1所示的步骤s13,单元格确定模块505可以用于实现图1所示的步骤s14,记录内容确定模块506可以用于实现图1所示的步骤s15,输出模块507可以用于实现图1所示的步骤s16。从而关于图像获取模块501、识别模块502、对象块确定模块503、表格生成模块504、单元格确定模块505、记录内容确定模块506和输出模块507能够实现的功能的具体说明可以参考上述图像处理方法的实施例中的步骤s10至步骤s16的相关描述,重复之处不再赘述。此外,图像处理装置500可以实现与前述图像处理方法相似的技术效果,在此不再赘述。
136.需要注意的是,在本公开的实施例中,该图像处理装置500可以包括更多或更少的电路或模块,并且各个电路或模块之间的连接关系和具体构成方式不受限制,可以根据实际需求而定。
137.本公开至少一实施例还提供一种电子设备,图6为本公开至少一实施例提供的一种电子设备的示意图。
138.例如,如图6所示,电子设备600包括存储器601和处理器602。
139.例如,存储器601用于非瞬时性地存储计算机可执行指令。处理器602用于执行计算机可执行指令时,实现根据上述任一实施例所述的图像处理方法。关于该图像处理方法的各个步骤的具体实现以及相关解释内容可以参见上述图像处理方法的实施例,在此不作赘述。
140.例如,处理器602执行存储器601上所存放的计算机可执行指令而实现的图像处理
方法的其他实现方式,与前述方法实施例部分所提及的实现方式相同,这里也不再赘述。
141.例如,在一些实施例中,电子设备600还包括通信接口和通信总线。处理器602、通信接口和存储器601通过通信总线实现相互通信,处理器602、通信接口、存储器601等组件之间也可以通过网络连接进行通信。本公开对网络的类型和功能在此不作限制。例如,通信总线可以是外设部件互连标准(pci)总线或扩展工业标准结构(eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。通信接口用于实现电子设备600与其他设备之间的通信。应当注意,图6所示的电子设备600的组件只是示例性的,而非限制性的,根据实际应用需要,该电子设备还可以具有其他组件。
142.例如,处理器602和存储器601可以设置在服务器端(或云端)。
143.例如,处理器602可以控制电子设备600中的其它组件以执行期望的功能。处理器602可以是中央处理器(cpu)、网络处理器(np)、张量处理器(tpu)或者图形处理器(gpu)等具有数据处理能力和/或程序执行能力的器件;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。中央处理器(cpu)可以为x86或arm架构等。
144.例如,存储器601可以包括一个或多个计算机程序产品的任意组合,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(rom)、硬盘、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机可执行指令,处理器602可以运行所述计算机可执行指令,以实现电子设备600的各种功能。在存储介质中还可以存储各种应用程序和各种数据等。
145.例如,在一些实施例中,电子设备600还可以包括图像获取部件。图像获取部件用于获取图像,例如,输入图像。存储器601还用于存储获取的输入图像。例如,图像获取部件可以是智能手机的摄像头、平板电脑的摄像头、个人计算机的摄像头、数码照相机的镜头、或者甚至可以是网络摄像头,图像获取部件还可以是扫描仪等。
146.例如,关于电子设备600执行图像处理的过程的详细说明可以参考图像处理方法的实施例中的相关描述,重复之处不再赘述。
147.图7为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图。例如,如图7所示,非瞬时性计算机可读存储介质700上可以非暂时性地存储一个或多个计算机可执行指令701。例如,当计算机可执行指令701由处理器执行时可以执行根据上文所述的图像处理方法中的一个或多个步骤。
148.例如,该存非瞬时性计算机可读存储介质700可以应用于上述电子设备中,例如,该非瞬时性计算机可读存储介质700可以包括电子设备600中的存储器601。关于非瞬时性计算机可读存储介质700的说明可以参考电子设备600的实施例中对于存储器601的描述,重复之处不再赘述。
149.对于本公开,还有以下几点需要说明:
150.(1)本公开实施例附图只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计。
151.(2)在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合以得到
新的实施例。
152.以上所述仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,本公开的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献