一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

表格检测方法、表格检测模型训练方法及装置与流程

2022-04-27 03:50:25 来源:中国专利 TAG:

技术特征:
1.一种表格检测方法,其特征在于,包括:获取待检测表格图像;将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。2.根据权利要求1所述的表格检测方法,其特征在于,所述基于表格线分类结果计算第一损失值,包括:根据训练样本得到的分割图逻辑回归前的概率图,将所述概率图中大于预设阈值和小于预设阈值的像素点分为第一类和第二类,分别确定第一类像素点数量和第二类像素点数量;以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值。3.根据权利要求1所述的表格检测方法,其特征在于,所述基于单元格回归结果计算第二损失值,包括:根据检测模型输出的预测分割图的每个单元格的面积,与训练样本单元格的真实面积,计算第二损失值。4.根据权利要求1所述的表格检测方法,其特征在于,所述基于表格对齐特征计算第三损失值,包括:两个相邻单元格垂直方向的重叠度满足预设条件,或者坐标间的欧式距离在预设范围内的情况下,对预测分割图中两个相邻单元格进行配对;根据垂直方向的重叠度与左右相邻单元格高度和一半的比值,确定配对单元格的对齐程度;将每行的对齐程度累加后除以表格的行数,得到行方向上的平均分;根据所述平均分确定第三损失值。5.根据权利要求2所述的表格检测方法,其特征在于,以概率图中每个像素点为第一类时,对应的分类概率之和与第一类像素点数量的比值,或者像素点为第二类时,对应的分类概率之和与第二类像素点数量的比值,分别作为计算正负样本损失值的权重,计算第一损失值,包括:其中,n
pre
和n
pre-分别为第一类像素点数量和第二类像素点数量;j
pre
和j
pre-分别为像
素点为第一类和第二类时的分类概率之和;y
i
表示像素i的标签;p
i
表示样本i预测为正样本的概率。6.根据权利要求3所述的表格检测方法,其特征在于,所述根据检测模型输出的预测分割图的每个单元格的面积,与样本单元格的真实面积,计算第二损失值,包括:其中,a
sum
为真实标注中表格单元格面积之和,a
area-i
表示预测分割图的第i个单元格的面积,n表示单元格的数量;对于每个单元格l
reg
:其中,(x
i
,y
i
)和(x
ip
,y
ip
)分别为单元格的四个角点坐标(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)的真实值和预测值,δ为预设的超参数。7.一种表格检测模型训练方法,其特征在于,包括:将已知表格线和背景的训练样本图像,输入检测模型主干网络后,提取得到预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,根据所述综合损失值对所述检测模型进行参数更新。8.一种表格检测装置,其特征在于,包括:输入模块,用于获取待检测表格图像;处理模块,用于将所述待检测表格图像输入训练后的检测模型,得到所述检测模型输出的表格预测分割图;检测模块,用于根据所述表格预测分割图,确定表格预测框的位置信息;其中,所述检测模型是通过如下方式进行训练的:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据训练样本得到的分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,计算检测模型的综合损失值,并根据所述综合损失值对所述检测模型进行参数更新。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述表格检测方法或者表格检测模型训练方法的步骤。10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述表格检测方法或者表格检测模型训练方法的步骤。

技术总结
本发明提供一种表格检测方法、表格检测模型训练方法及装置,该方法包括:将待检测表格图像输入训练后的检测模型,得到表格预测分割图;根据表格预测分割图,确定表格预测框的位置信息;其中,检测模型训练过程为:将已知表格线和背景的训练样本,输入检测模型主干网络,得到表格预测分割图;根据分割图,分别基于表格线分类结果计算第一损失值,基于单元格回归结果计算第二损失值,基于表格对齐特征计算第三损失值;根据综合损失值对检测模型进行参数更新。该方法不仅考虑了表格分割任务的全局特征,同时得到了单元格回归及单元格对齐任务的局部信息,即综合考虑了表格的整体特征,其损失值计算更客观,从而模型在进行表格检测时的准确度较高。准确度较高。准确度较高。


技术研发人员:刘长松 王言伟 李捷 张玉琦 张瑞雪 张琛
受保护的技术使用者:上海浦东发展银行股份有限公司
技术研发日:2021.12.02
技术公布日:2022/4/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献