一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

表格检测方法、表格检测模型训练方法及装置与流程

2022-04-27 03:50:25 来源:中国专利 TAG:


1.本发明涉及大数据领域,尤其涉及一种表格检测方法、表格检测模型训练方法及装置。


背景技术:

2.在大数据和人工智能的应用场景下,要对大量的信息进行搜集、处理和分析,对数据进行结构化,以发现数据中的规律来指导生产。然而,信息的存在方式是多样的且非结构化的,表格是文本的常见内容形式,大量的信息存在于表格中,而表格可能存在于pdf、网页或者图像中。若要对信息进行搜集,检测和识别表格是目前需要解决的问题。
3.目前的方法基本是通过目标检测或者图像分割的方法,利用已经开源的深度学习模型进行表格线的检测。例如,基于图像分割的方法,该方法将表格的每个像素作为一个类别进行预测,分为前景和背景两类。
4.这类方法从图像分割领域借鉴没有考虑表格的全局特征,即没有充分考虑表格的特征,因此算法和模型不能很好的契合。例如,这类方法无法适应多尺度和任意长宽比例单元格的表格线检测。


技术实现要素:

5.针对现有技术存在的问题,本发明提供一种表格检测方法、表格检测模型训练方法及装置。
6.本发明提供一种表格检测方法,包括:获取待检测表格图像;将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
7.根据本发明一个实施例的表格检测方法,所述基于表格线分类结果计算第一损失值,包括:根据所述特征图逻辑回归后得到概率图,将所述概率图中大于预设阈值和小于预设阈值的像素点分为第一类和第二类,分别确定第一类像素点数量和第二类像素点数量;以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值。
8.根据本发明一个实施例的表格检测方法,所述基于单元格回归结果计算第二损失值,包括:根据检测模型输出的预测分割图的每个单元格的面积,与样本单元格的真实面积,计算第二损失值。
9.根据本发明一个实施例的表格检测方法,所述基于表格对齐特征计算第三损失值,包括:两个相邻单元格垂直方向的重叠度满足预设条件,或者坐标间的欧式距离在预设范围内的情况下,对预测分割图中两个相邻单元格进行配对;根据垂直方向的重叠度与左右相邻单元格高度和一半的比值,确定配对单元格的对齐程度;将每行的对齐程度累加后除以表格的行数,得到行方向上的平均分;根据所述平均分确定第三损失值。
10.根据本发明一个实施例的表格检测方法,所述根据所述第一损失值、所述第二损失值和所述第一损失值,计算检测模型的综合损失值,包括:根据所述第一损失值、所述第二损失值和所述第一损失值的加权值,确定检测模型的综合损失值。
11.根据本发明一个实施例的表格检测方法,以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值,包括:
[0012][0013]
其中,n
pre
和n
pre-分别为第一类像素点数量和第二类像素点数量;j
pre
和j
pre-分别为像素点为第一类和第二类时的分类概率之和;yi表示像素i的标签;pi表示样本i预测为正样本的概率。
[0014]
根据本发明一个实施例的表格检测方法,所述根据检测模型输出的预测分割图的每个单元格的面积,与样本单元格的真实面积,计算第二损失值,包括:
[0015][0016]
其中,a
sum
为真实标注中表格单元格面积之和,a
area-i
表示预测分割图的第i个单元格的面积,n表示单元格的数量;
[0017]
对于每个单元格l
reg

[0018][0019]
其中,(xi,yi)和(x
ip
,y
ip
)分别为单元格的四个角点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)的真实值和预测值,δ为预设的超参数。
[0020]
本发明还提供一种表格检测模型训练方法,包括:将已知表格线和背景的训练样本图像,输入检测模型主干网络后,提取得到预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,根据所述综合损失值对所述检测模型进行参数更新。
[0021]
本发明还提供一种表格检测装置,包括:输入模块,用于获取待检测表格图像;处理模块,用于将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;检测模块,用于根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测
模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0022]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述表格检测方法的步骤。
[0023]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述表格检测方法的步骤。
[0024]
本发明提供的表格检测方法、表格检测模型训练方法及装置,检测模型是分别基于表格线分类结果、基于单元格回归结果、基于表格对齐特征综合计算损失值后训练得到的,不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。同时,本发明适用于多尺度和任意长宽比例单元格的表格线检测。
附图说明
[0025]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]
图1是本发明提供的表格检测方法的流程示意图;
[0027]
图2是本发明提供的检测模型网络结构示意图;
[0028]
图3是本发明提供的输出层结构示意图;
[0029]
图4是本发明提供的表格检测装置的结构示意图;
[0030]
图5是本发明提供的电子设备的结构示意图。
具体实施方式
[0031]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032]
图像分割中常用到的损失函数为二值交叉熵损失,具体公式如下:
[0033][0034]
其中,yi表示像素i的标签,正样本(像素为前景,即代表直线的像素)为1,负样本为0。pi表示样本i预测为正样本的,n为样本的像素点数。
[0035]
二分类任务学习的过程可以概括为如所示的流程:
[0036]
得分(score)
→s→
sigmoid

p

交叉熵(cross entropy)

l损失的计算方法可
表示为即
[0037]
将对应公式代入上式中可得:
[0038][0039]
代入变量及对应公式为:
[0040][0041]
通过上述公式可见计算式简单且偏导数的值大小取决于xi和[σ(si)-yi],尤其后者的影响较大,该值越大说明模型越差。所以二值交叉熵损失的优点是不仅容易衡量模型的效果而且求导简单。但对于表格线预测而言二值交叉熵损失仍然存在问题:一是正负样本不均衡问题,例如表格线宽度所占像素为2-4个,背景像素占绝大部分;二是这种分割方法没有充分的考虑表格全局特征。
[0042]
为了结合表格特征设计模型解决表格线检测的问题,并达到能够适应多尺度和任意长宽比例单元格的表格线检测的目标,特提出一种表格检测方法及装置。
[0043]
下面结合图1-图5描述本发明的表格检测方法及装置。图1是本发明提供的表格检测方法的流程示意图,如图1所示,本发明提供表格检测方法,包括:
[0044]
101、获取待检测表格图像;
[0045]
本发明中,待检测表格图像不限于从图像数据中获取,也可以从各文本数据中获取。例如,从word或pdf中获取含有表格的待检测图像。
[0046]
102、将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图。
[0047]
本发明对检测模型的形式不作具体限定,例如可以为目前的深度网络u-net,其结构如图2所示,图中各描述可以参见该模型的具体说明,此处不再赘述。
[0048]
其中,本发明的所述检测模型是通过如下方式进行训练的:
[0049]
将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0050]
具体而言,本发明中网络训练时输出层采用multi-head模式,结构图3所示。l
seg
、l
cell-sum
和s分别为第一损失值、第二损失值和第三损失值的计算参数。multi-head结构有三个分支从上到下分别代表表格线预测、单元格回归和表格对齐。其中,表格线预测的输入为二值图像1位正样本,0位负样本,经过主干网络得到的特征图经过sigmoid函数得到概率图,概率值大于设定阈值时表示的是正样本否则为负样本,反应在图像上正样本表示为表格线如分支输出可见。
[0051]
单元格回归可通过直接计算单元格四个角点坐标实现,其输入是四个角点坐标归一化到[0,1]的值,该特征层的信息不仅包含回归的特征而且还包含了表格线预测的特征图,将二者特征叠加在一起相互补,其包含了点与线的层次获取的信息更丰富。
[0052]
单元格对齐部分,同样融合点和线的特征信息,从点与线的角度分别计算单元格角点坐标,表格线预测到行线与列线的交点即为单元格的角点,单元格回归也获取单元格的角点坐标,两组角点做近邻计算可得到最终的单元格,在最终的单元格上通过计算重叠度及欧式距离做单元格匹配进而实现表格对齐。
[0053]
基于上述三个分支,根据特征图和训练样本,分别计算对应的第一损失值、第二损失值和第三损失值。
[0054]
最后根据第一损失值、第二损失值和第三损失值确定综合损失值,对模型进行参数更新,如根据加权值确定检测模型的综合损失值。
[0055]
再根据计算的综合损失值对检测模型进行参数更新,如目前的梯度下降,反向传播等方法。
[0056]
将待检测表格图像输入训练后的u-net网络提取特征,进一步处理得到预测分割图。其中,预测分割图是检测模型预测输出的对表格线和背景进行区分的图像。
[0057]
103、根据所述表格预测分割图,确定表格预测框的位置信息。
[0058]
其中,表格预测框的位置信息,具体可以为表格线的位置信息或者单元格的位置信息。例如,为表格线各单元格的顶点坐标,或者是表格线各线条的坐标,本发明对此不作具体限定。
[0059]
本发明的表格检测方法,检测模型是分别基于表格线分类结果、基于单元格回归结果、基于表格对齐特征综合计算损失值后训练得到的,不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。同时,本发明适用于多尺度和任意长宽比例单元格的表格线检测。
[0060]
在一个实施例中,基于表格线分类结果计算第一损失值,包括:根据训练样本得到的分割图逻辑回归前的概率图,将所述概率图中大于预设阈值和小于预设阈值的像素点分为第一类和第二类,分别确定第一类像素点数量和第二类像素点数量;以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值。
[0061]
具体而言,output后的特征图经过逻辑回归后,如sigmoid回归,之后得到概率图,其中,
[0062]
当概率值大于设定阈值(取值(0,1)之间)时为第一类记为j
pre
否则为第二类,记为j
pre-,同时记录下两种情况下的数量即n
pre
和n
pre-。而后,根据两种情况,分别以对应概率之和和数量的比值作为正负样本的权重,计算第一损失值。上述参数可通过模型在训练过程中自动更新获得,随着模型迭代次数的增加第一类的概率的值逐渐接近1,而第二类概率的值更接近0,且n
pre
的数量远小于n
pre-的数量,所以相除之后正样本的权重要大于负样本的权重从而起到平衡正负样本的作用。
[0063]
具体地,在一个实施例中,以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值,包括根据如下公
式计算:
[0064][0065]
其中,n
pre
和n
pre-分别为第一类像素点数量和第二类像素点数量;j
pre
和j
pre-分别为像素点为第一类和第二类时的分类概率之和;yi表示像素i的标签;pi表示样本i预测为正样本的概率。
[0066]
上述公式给出了第一损失值的计算公式,通过上述公式,可以看出随着模型迭代次数的增加第一类概率的值逐渐接近1,而第二类概率的值更接近0,且n
pre
的数量远小于n
pre-的数量,所以相除之后正样本的权重要大于负样本的权重从而起到平衡正负样本的作用。
[0067]
在一个实施例中,基于单元格回归结果计算第二损失值,包括:根据检测模型输出的预测分割图的每个单元格的面积,与样本单元格的真实面积,计算第二损失值。
[0068]
相对于表格而言由多个单元格组成,相邻的单元格坐标位置有重叠的情况,在损失计算过程中相同的值有可能只计算一次因而造成单元格丢失,为了避免这种问题,本发明实施例引入了单元格的面积变量计算方式。
[0069]
具体地,在一个实施例中,所述根据预测结果的每个单元格的面积,与样本单元格的真实面积,计算第二损失值,包括:
[0070][0071]
其中,a
sum
为真实标注中表格单元格面积之和,a
area-i
表示预测分割图的第i个单元格的面积,n表示单元格的数量。
[0072]
当单元格丢失时a
area-i
的面积为0,l
cell-sum
的值也会随之变小,从而反映了表格的整体情况。
[0073]
对于每个单元格,l
reg
的计算方式如下:
[0074][0075]
其中,(xi,yi)和(x
ip
,y
ip
)分别为单元格的四个角点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)的真实值和预测值,δ为预设的超参数。
[0076]
具体而言,单元格回归损失计算中,回归的head主要是为了提高表格单元格坐标的准确度。回归损失计算方式常用的包括l1和l2范数的损失,但由于l1损失函数的梯度比较稳定且在0处不可导会影响到模型的收敛速度;l2损失函数受异常点的影响较大可能将模型带偏。因此,本发明提出了基于l1和l2范数融合的损失函数,在|x
i-x
ip
|<1的区间中导数呈抛物线形导数大小随着x,y的变化而变化从而避免了梯度恒定不变的问题,在|x
i-x
ip
|>=1时导数较稳定,不会出现异常点从而避免了异常值对模型的影响,具体公式如上述l
reg
的计算,δ为可调整的超参数。
[0077]
在一个实施例中,所述基于表格对齐特征计算第三损失值,包括:两个相邻单元格垂直方向的重叠度满足预设条件,或者坐标间的欧式距离在预设范围内的情况下,对预测
分割图中两个相邻单元格进行配对;根据垂直方向的重叠度与左右相邻单元格高度和一半的比值,确定配对单元格的对齐程度;将每行的对齐程度累加后除以表格的行数,得到行方向上的平均分;根据所述平均分确定第三损失值。
[0078]
首先,对表格中所有单元格进行两两配对,配对准则为两个相邻单元格垂直方向的重叠度满足一定条件或者坐标间的欧式距离在一定范围内,重叠度及欧式距离的计算公式为:
[0079][0080][0081]
其中,l
vertical
和lm分别代表垂直方向上高的重合长度和该单元格与邻近单元格高度的最大值即max(li,l
i 1
)。(x1,y1),(x2,y2)代表相邻两个单元格的角点坐标。表格中存在不同情况下的组合关系,如一对一和一对多,因此还需要至少计算1个坐标点的欧式距离来匹配多对一的情况;因此重叠度越高并且坐标点之间的欧式距离越小则表明与当前单元格配对的可能性就越大。
[0082]
计算配对单元格的对齐特性,计算方法为以垂直方向的重叠度除以左右相邻单元格高度和的一半,具体表达式如下:
[0083][0084]
其中,h
l
和hr分别表示该单元格左右两个单元格的高度,该值越高说明表格对齐越准确。
[0085]
将每行的s
row
累加然后除以表格的行数即得到行方向上的平均分s即:
[0086][0087]
其中,m表示匹配的单元格对数。s越大说明匹配效果越好反之亦然。
[0088]
最后,根据s确定第三损失值。
[0089]
在一个实施例中,根据所述第一损失值、所述第二损失值和所述第一损失值,计算检测模型的综合损失值,包括:根据所述第一损失值、所述第二损失值和所述第一损失值的加权值,确定检测模型的综合损失值。
[0090]
结合输出层的表格线预测、单元格回归、表格对齐三个任务的损失函数,最终的损失函数表达如下:
[0091][0092]
其中,α、β和γ表示权重。
[0093]
可以看出,本发明提出的新的损失计算方法完善了目前存在的不平衡问题,同时提出了单元格对齐的方法。因而本发明既实现了表格线预测任务,又达到了表格中每个单元格对齐的目的。
[0094]
本发明还提供一种表格检测模型训练方法,包括:
[0095]
将已知表格线和背景的训练样本图像,输入检测模型主干网络后,提取得到预测
分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,根据所述综合损失值对所述检测模型进行参数更新。
[0096]
该检测模型的训练方法,是为了得到上述检测模型。基于目前的检测模型,再通过本发明的训练方法,可以得到更准确的识别结果。其中,具体训练方法可参见上述检测方法的实施例,此处不再赘述。
[0097]
下面对本发明提供的表格检测装置进行描述,下文描述的表格检测装置与上文描述的表格检测方法可相互对应参照。
[0098]
图4是本发明提供的表格检测装置的结构示意图,如图4所示,该表格检测装置包括:输入模块401、处理模块402和检测模块403。其中,输入模块401用于获取待检测表格图像;处理模块402用于将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;检测模块403用于根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0099]
在一个装置实施例中,处理模块402还用于:根据训练样本得到的分割图逻辑回归前的概率图,将所述概率图中大于预设阈值和小于预设阈值的像素点分为第一类和第二类,分别确定第一类像素点数量和第二类像素点数量;以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值。
[0100]
在一个装置实施例中,处理模块402还用于:根据检测模型输出的预测分割图的每个单元格的面积,与训练样本单元格的真实面积,计算第二损失值。
[0101]
在一个装置实施例中,处理模块402还用于:两个相邻单元格垂直方向的重叠度满足预设条件,或者坐标间的欧式距离在预设范围内的情况下,对预测分割图中两个相邻单元格进行配对;根据垂直方向的重叠度与左右相邻单元格高度和一半的比值,确定配对单元格的对齐程度;将每行的对齐程度累加后除以表格的行数,得到行方向上的平均分;根据所述平均分确定第三损失值。
[0102]
在一个装置实施例中,处理模块402还用于:根据所述第一损失值、所述第二损失值和所述第一损失值的加权值,确定检测模型的综合损失值。
[0103]
本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
[0104]
本发明实施例提供的表格检测装置,检测模型是分别基于表格线分类结果、基于单元格回归结果、基于表格对齐特征综合计算损失值后训练得到的,不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。同时,本
发明适用于多尺度和任意长宽比例单元格的表格线检测。
[0105]
图5是本发明提供的电子设备的结构示意图,如图5所示,该电子设备可以包括:处理器(processor)501、通信接口(communications interface)502、存储器(memory)503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。处理器501可以调用存储器503中的逻辑指令,以执行表格检测方法,该方法包括:获取待检测表格图像;将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0106]
此外,上述的存储器503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0107]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的表格检测方法,该方法包括:获取待检测表格图像;将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0108]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的表格检测方法,该方法包括:获取待检测表格图像;将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。
[0109]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0110]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0111]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献