一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信用证识别方法、装置、计算机设备和存储介质与流程

2022-05-11 12:00:26 来源:中国专利 TAG:

技术特征:
1.一种信用证识别方法,其特征在于,所述方法包括:获取待识别信用证图像;将所述待识别信用证图像进行分割,得到若干文本区域;对所述文本区域进行文字识别,得到所述文本区域的识别结果;根据预设规则对所述文本区域的识别结果进行后处理得到结构化目标信息。2.根据权利要求1所述的方法,其特征在于,所述获取待识别信用证图像之后,还包括:对所述待识别信用证图像进行角度矫正。3.根据权利要求2所述的方法,其特征在于,所述对所述待识别信用证图像进行角度矫正,包括:将所述待识别信用证图像进行二值化处理得到二值化图像;提取所述二值化图像中的全部表格轮廓;对所述全部表格轮廓进行处理得到面积最大表格的目标轮廓;计算所述面积最大表格的目标轮廓中相邻直线夹角得到旋转角度;根据所述旋转角度对所述待识别信用证图像进行角度矫正。4.根据权利要求3所述的方法,其特征在于,所述对所述全部表格轮廓进行处理得到面积最大表格的目标轮廓,包括:根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格;获取与所述当前表格相邻的待处理表格;将所述待处理表格与所述当前表格合并作为新的当前表格,并继续获取与所述当前表格相邻的待处理表格,直至获取所述面积最大表格,提取所述面积最大表格的目标轮廓。5.根据权利要求1所述的方法,其特征在于,所述对所述文本区域进行文字识别之前,包括:对所述文本区域进行修复。6.根据权利要求5所述的方法,其特征在于,所述对所述文本区域进行修复,包括:获取所述待识别信用证图像对应的版式;根据所述版式对所述文本区域进行修复。7.根据权利要求6所述的方法,其特征在于,所述根据所述版式对所述文本区域进行修复,包括:当所述待识别信用证图像为表格版式时,提取所述文本区域中的目标方向的待处理边界;获取距离所述文本区域中目标类型的文本区域最近的待处理边界作为目标边界;将所述目标类型的文本区域的边界移动至所述目标边界。8.根据权利要求6所述的方法,其特征在于,所述根据不同的版式对所述文本区域进行修复,包括:当所述待识别信用证图像为非表格版式时,获取所述文本区域中目标类型的文本区域的坐标;根据所述坐标以及所述待识别信用证图像的宽度对所述待识别信用证图像进行分割,得到所述目标类型的文本区域对应的文本切片;分别对所述文本切片的不同方向进行对应的图像操作得到内容轮廓;
根据所述内容轮廓的横坐标对所述目标类型的文本区域进行修复。9.根据要求1所述的方法,其特征在于,所述根据预设规则对所述文本区域的识别结果进行后处理得到结构化目标信息,包括:根据预设版式结构提取所述识别结果中的候选字段集合;根据所述预设版式对应的预设配置规则进行匹配得到所述候选字段集合中每一字段对应的字段位置以及字段内容;通过所述字段与字段信息的位置关系,获取字段信息候选集;对所述字段信息候选集进行过滤,得到目标信息。10.根据权利要求9所述的方法,其特征在于,所述根据预设版式结构提取所述识别结果中的候选字段集合之前,还包括:获取版式区分字段;将所述识别结果与所述版式区分字段进行匹配以确定所述待识别信用证图像的版式。11.根据权利要求9所述的方法,其特征在于,所述通过所述字段与字段信息的位置关系,获取字段信息候选集之前,还包括:当所述待识别信用证图像为多个信用证图像时,根据所述多个信用证图像的出现顺序对所述多个信用证图像进行合并。12.根据权利要求9所述的方法,其特征在于,所述对所述字段信息候选集进行过滤,得到目标信息之前还包括:当字段信息为目标字段信息时,将所述字段信息输入至段落分类模型;通过所述段落分类模型对属于同一个段落的所述目标字段信息进行提取。13.根据权利要求12所述的方法,其特征在于,所述段落分类模型是通过预先训练得到的,所述段落分类模型的训练过程包括:获取信用证段落文本;将所述信用证段落文本根据预设方法进行组合并进行标记,得到信用证训练数据;对所述信用证训练数据进行预处理,得到预处理后的信用证训练数据;将所述预处理后的信用证训练数据输入至第一机器学习模型中进行训练,以得到所述段落分类模型。14.一种信用证识别装置,其特征在于,所述装置包括:获取模块,用于获取待识别信用证图像;文本区域检测模块,用于将所述待识别信用证图像进行分割,得到若干文本区域;识别模块,用于对所述文本区域进行文字识别,得到所述文本区域的识别结果;后处理模块,用于根据预设规则对所述文本区域的识别结果进行后处理得到结构化目标信息。15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。

技术总结
本申请涉及一种信用证识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别信用证图像;将所述待识别信用证图像进行分割,得到若干文本区域;对所述文本区域进行文字识别,得到所述文本区域的识别结果;根据预设规则对所述文本区域的识别结果进行后处理得到结构化目标信息。采用本方法能够实现对信用证图像进行精确识别。用证图像进行精确识别。用证图像进行精确识别。


技术研发人员:王迪 李捷 王巍 徐敏 向东 王慧
受保护的技术使用者:上海浦东发展银行股份有限公司
技术研发日:2021.12.28
技术公布日:2022/5/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献