一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于手写汉字识别的文本分割方法与流程

2022-10-13 03:54:49 来源:中国专利 TAG:

技术特征:
1.用于手写汉字识别的文本分割方法,其特征在于,该方法包括以下步骤:采集手写汉字的文本图像,并转化为二值图像,获取二值图像中字体区域的外接矩形,以所述外接矩形的左下角作为坐标原点构建坐标系,通过切割横坐标将所述外接矩形均分为多个子矩形,根据每个子矩形中每一行的像素值将对应的子矩形分行;对于每行的字符,利用垂直投影法进行划分,得到多个字符块,基于字符块的高度去除标点字符,统计剩余字符块的宽度,根据所述宽度将剩余字符块分为偏旁字符块、主体字符块和粘连字符块;根据粘连字符块的粘连特征将粘连字符块分割,顺序统计每行的每个字符块的宽度以及相邻两个字符块之间的字间距,根据相邻两个字符块的宽度获取对应两个字符块为同一字符块的第一成字概率,根据字间距获取对应两个字符块为同一字符块的第二成字概率,根据相邻两个字符块的纵向投影范围获取对应两个字符块为同一字符块的第三成字概率;以第一成字概率、第二成字概率和第三成字概率的平均值作为最终成字概率,对于每一行字符块,按照从左到右的顺序根据最终成字概率将字符块依次合并,得到分割结果图像。2.根据权利要求1所述的用于手写汉字识别的文本分割方法,其特征在于,所述二值图像的获取方法为:将所述文本图像进行灰度化得到灰度图像,通过均值滤波对灰度图像去噪,利用大津算法获取去噪后的灰度图像的最佳阈值,将灰度值小于最佳阈值的像素点赋值为第一预设值,灰度值不小于最佳阈值的像素点赋值为第二预设值,得到所述二值图像。3.根据权利要求2所述的用于手写汉字识别的文本分割方法,其特征在于,所述外接矩形的获取方法为:对所述二值图像进行逐行和逐列遍历,选取第一个和最后一个含有第一预设值的像素点的行作为矩形的宽,选取第一个和最后一个含有第一预设值的像素点的列作为矩形的高,组成字体区域的所述外接矩形。4.根据权利要求2所述的用于手写汉字识别的文本分割方法,其特征在于,所述根据每个子矩形中每一行的像素值将对应的子矩形分行,包括:对于每个子矩形,从上到下统计每行像素点中像素值为第一预设值的数量,并构建直方图,对所述直方图进行波动曲线拟合,统计拟合的曲线中每个波峰点的横坐标,以每个横坐标作为高度在子矩形上作水平直线,将每条水平直线通过的字符连通域标记,将标记的连通域根据所处的不同直线进行分行;对于未标记的字符连通域,根据字符连通域与水平直线之间的位置关系进行分行。5.根据权利要求4所述的用于手写汉字识别的文本分割方法,其特征在于,所述根据字符连通域与水平直线之间的位置关系进行分行,包括:对于两条相邻水平直线之间的未标记的字符连通域,令其与距离最近的标记的字符连通域合并;对于同时通过两条相邻水平直线的未标记的字符连通域,对两条相邻水平直线之间的部分进行形态学腐蚀操作,若被分为两个连通域,则根据每个连通域所属的直线进行分行;若仍为一个整体连通域,则对此部分连通域进行逐行统计像素点为第一预设值的数量,取最小数量的行作为分割线进行划分;若被分成多个部分连通域,令每个通过水平直线的部
分连通域与距离最近的通过水平直线的字符连通域合并。6.根据权利要求1所述的用于手写汉字识别的文本分割方法,其特征在于,所述根据粘连字符块的粘连特征将粘连字符块分割,包括:获取每个粘连字符块的垂直投影直方图,对垂直投影直方图进行波动曲线拟合,从左至右依次统计波谷点的横坐标,按照横坐标的顺序依次在该粘连字符块的长度边上做垂线,若垂线上通过有两个及以上的连通域,计算过垂线连通域的中心点,取中心点位于垂线左侧的连通域作为单个字符块;若垂线上只通过一个连通域,在垂线对应的垂直投影直方图上左右两侧范围内,选取最小纵坐标值对应的横坐标值为分割线,令分割线左侧区域为单个字符块。7.根据权利要求1所述的用于手写汉字识别的文本分割方法,其特征在于,所述第一成字概率的获取方法为:计算每行中所有字符块的平均宽度,当相邻两个字符块的宽度之和小于等于平均宽度时,以所述宽度之和与平均宽度的比值作为所述第一成字概率;当相邻两个字符块的宽度之和大于平均宽度时,以平均宽度的预设倍数减去两个字符块的宽度之和的结果作为分子,以平均宽度作为分母,得到的比值即为所述第一成字概率。8.根据权利要求1所述的用于手写汉字识别的文本分割方法,其特征在于,所述第二成字概率的获取方法为:计算每行中所有字间距的平均值作为平均字间距,当相邻两个字符块之间的字间距大于等于所述平均字间距时,所述第二成字概率为零;当相邻两个字符块之间的字间距小于所述平均字间距时,计算字间距和平均字间距的比值,以1减去所述比值的结果作为所述第二成字概率。9.根据权利要求1所述的用于手写汉字识别的文本分割方法,其特征在于,所述第三成字概率的获取方法为:获取每个字符块的纵向投影区间范围,以相邻两个字符块的纵向投影区间范围的偏差作为纵向偏差量,以所述纵向偏差量和相邻两个字符块中纵向投影区间范围最大值的比值作为所述第三成字概率。

技术总结
本发明涉及数据识别处理技术领域,具体涉及一种用于手写汉字识别的文本分割方法,该方法采集手写汉字的文本图像,将文本图像分行;对于每行的字符,利用垂直投影法进行划分,得到多个字符块,将去除了标点字符的剩余字符块分为偏旁字符块、主体字符块和粘连字符块;根据粘连字符块的粘连特征将粘连字符块分割,顺序统计每行的每个字符块的宽度以及相邻两个字符块之间的字间距,进而获取相邻两个字符块为同一字符块的第一成字概率、第二成字概率和第三成字概率;并得到最终成字概率,根据最终成字概率将字符块依次合并,得到分割结果图像。本发明能够提高单字分割的准确性,进一步提高手写汉字识别的准确率。提高手写汉字识别的准确率。提高手写汉字识别的准确率。


技术研发人员:余俊红 何芸
受保护的技术使用者:江苏巨信众汇数字科技有限公司
技术研发日:2022.09.07
技术公布日:2022/10/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献