一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种合同文本图像印章检测和去除方法与流程

2022-02-22 05:24:07 来源:中国专利 TAG:

技术特征:
1.一种合同文本图像印章检测和去除方法,其特征在于,包括如下步骤:步骤1:对读入的合同类文本图像进行预处理;步骤2:基于darknet53骨干网络yolov3检测网络进行深度学习网络检测并定位不同形状印章区域;步骤3:在hsv颜色空间提取特征并去除印章特征;步骤4:输出图像,完成印章去除。2.根据权利要求1所述的合同文本图像印章检测和去除方法,其特征在于,所述步骤1的具体步骤如下:步骤1.1:对读入的图片进行预判,利用傅里叶变换对读入的图片进行分类,将图片分为正常图片或噪声图片;步骤1.2:若经过步骤1.1判别为正常图片,直接结束图片处理流程;步骤1.3:若经过步骤1.1判别为噪声图片,则利用小波变换对图片进行降噪。3.根据权利要求1所述的合同文本图像印章检测和去除方法,其特征在于,所述步骤2的具体步骤如下:步骤2.1:基于darknet53骨干网络yolov3检测网络,对印章进行检测分类,检测类别分为矩形印章、圆形印章、圆弧形印章以及部分印章4个类别;步骤2.2:输入特征图,将输入的特征图与输出特征图对应维度进行相加;步骤2.3:通过darknet53网络进行3个不同尺度的检测;步骤2.4:在3个不同尺度下设定3种先验框,使用kmeans聚类方法来决定9种尺寸的先验框;步骤2.5:通过logistic回归预测对象类别;步骤2.6:在yolov3检测网络计算损失函数;步骤2.7:检测并定位不同形状印章区域。4.根据权利要求1所述的合同文本图像印章检测和去除方法,其特征在于,所述步骤3的具体步骤如下:步骤3.1:读取合同类文本图片,通过深度学习网络检测印章位置并裁切该部分图片;步骤3.2:将裁切印章部分的rgb图片转化到hsv颜色空间进行颜色分离;步骤3.3:计算hsv颜色空间中三通道图片的统计直方图,确定最佳阈值;步骤3.4:设定提取印章特征hsv三个通道阈值,从hsv颜色空间中提取印章特征;步骤3.5:统计该部分印章特征hsv三通道的均值,设定提取文本体征hsv三个通道动态阈值,从hsv颜色空间中提取图片文本特征;步骤3.6:对印章特征区域和文本特征区域进行逻辑运算“与”操作,得到印章特征和文本特征的共同区域;步骤3.7:共同区域减去印章区域得到掩模图片;步骤3.8:利用掩模图片对原图像进行逐像素点掩模操作,得到去除印章后的图片。

技术总结
本发明公开一种合同文本图像印章检测和去除方法,本发明通过深度学习网络检测印章和HSV颜色空间去除印章方法,解决印章对OCR文本识别精度影响,利用深度学习可以有效地针对不同形状印章进行检测,对检测加盖印章区域进行HSV颜色空间变换,实现该区域中印章和文字分离,提取该区域文字信息,实现去除印章效果,提高OCR文本识别的精度。高OCR文本识别的精度。高OCR文本识别的精度。


技术研发人员:石朵伟 陈淑华
受保护的技术使用者:深圳前海环融联易信息科技服务有限公司
技术研发日:2021.10.26
技术公布日:2022/1/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献