文本字符分割的方法和装置与流程

2021-12-13 00:47:00 来源：中国专利 TAG：

技术特征：
1.一种文本字符分割的方法，其特征在于，包括：使用深度学习网络获取文本行图像中各字符的中心区域坐标；对所述文本行图像进行图像处理以获取文本行的边界；根据所述文本行图像中各字符的中心区域坐标，和各字符的中心区域在所述文本行图像的垂直投影图像中的位置，确定相邻字符之间的分割点；根据所述文本行的边界和相邻字符之间的分割点，进行文本字符分割。2.根据权利要求1所述的方法，其特征在于，使用深度学习网络获取文本行图像中各字符的中心区域坐标包括：使用卷积神经网络对文本行图像进行特征提取得到特征图；根据设定的特征向量序列长度将所述特征图转换为特征向量序列；将所述特征向量序列输入到循环神经网络，得到所述文本行图像中各字符的中心区域坐标。3.根据权利要求2所述的方法，其特征在于，在使用卷积神经网络对文本行图像进行特征提取得到特征图之前，还包括：根据设定的缩放因子对所述文本行图像进行图像缩放；以及，将所述特征向量序列输入到循环神经网络，得到所述文本行图像中各字符的中心区域坐标包括：将所述特征向量序列输入到循环神经网络，得到各字符的中心区域在缩放后的文本行图像中的坐标；根据所述缩放因子和得到的各字符的中心区域在缩放后的文本行图像中的坐标，计算所述文本行图像中各字符的中心区域坐标。4.根据权利要求1所述的方法，其特征在于，对所述文本行图像进行图像处理以获取文本行的边界包括：对所述文本行图像进行二值化处理得到二值图像；获取所述二值图像的水平方向投影和垂直方向投影；根据所述水平方向投影确定所述文本行图像的上下边界，根据所述垂直方向投影确定所述文本行图像的左右边界。5.根据权利要求4所述的方法，其特征在于，获取所述二值图像的水平方向投影和垂直方向投影包括：通过计算所述二值图像中每一行像素值之和得到所述二值图像的水平方向投影；通过计算所述二值图像中每一列像素值之和得到所述二值图像的垂直方向投影。6.根据权利要求4所述的方法，其特征在于，所述二值图像中像素点的像素值为0或255；根据所述水平方向投影确定所述文本行图像的上下边界，根据所述垂直方向投影确定所述文本行图像的左右边界包括：根据所述水平方向投影，从上往下依次获取每个水平行的像素值之和，将第一个像素值之和不为0的水平行作为所述文本行图像的上边界；从下往上依次获取每个水平行的像素值之和，将第一个像素值之和不为0的水平行作为所述文本行图像的下边界；根据所述垂直方向投影，从左往右依次获取每个垂直列的像素值之和，将第一个像素
值之和不为0的垂直列作为所述文本行图像的左边界；从右往左依次获取每个垂直列的像素值之和，将第一个像素值之和不为0的垂直列作为所述文本行图像的右边界。7.根据权利要求1所述的方法，其特征在于，根据所述文本行图像中各字符的中心区域坐标，和各字符的中心区域在所述文本行图像的垂直投影图像中的位置，确定相邻字符之间的分割点包括：根据所述文本行图像中各字符的中心区域坐标，和各字符的中心区域在所述文本行图像的垂直投影图像中的位置，判断相邻字符的中心区域之间是否存在空白间隔区域，所述空白间隔区域为垂直投影图像中列的像素值之和连续为0的区域；在相邻字符的中心区域之间存在空白间隔区域的情况下，选取距离所述相邻字符中左边字符的中心区域最近的空白间隔区域中心作为相邻字符之间的分割点；在相邻字符的中心区域之间不存在空白间隔区域的情况下，选取距离所述相邻字符中左边字符的中心区域最近且列的像素值之和最小的列作为相邻字符之间的分割点。8.一种文本字符分割的装置，其特征在于，包括：第一处理模块，用于使用深度学习网络获取文本行图像中各字符的中心区域坐标；第二处理模块，用于对所述文本行图像进行图像处理以获取文本行的边界；分割点确定模块，用于根据所述文本行图像中各字符的中心区域坐标，和各字符的中心区域在所述文本行图像的垂直投影图像中的位置，确定相邻字符之间的分割点；字符分割模块，用于根据所述文本行的边界和相邻字符之间的分割点，进行文本字符分割。9.一种文本字符分割的电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1
‑
7中任一所述的方法。10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1
‑
7中任一所述的方法。

技术总结
本发明公开了一种文本字符分割的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：使用深度学习网络获取文本行图像中各字符的中心区域坐标；对所述文本行图像进行图像处理以获取文本行的边界；根据所述文本行图像中各字符的中心区域坐标，和各字符的中心区域在所述文本行图像的垂直投影图像中的位置，确定相邻字符之间的分割点；根据所述文本行的边界和相邻字符之间的分割点，进行文本字符分割。该实施方式能够精确的进行字符分割，分割结果准确，进而可以提升文本识别的准确率，增加OCR结果的准确度，有效的代替人工操作，节省了人力和时间成本。节省了人力和时间成本。节省了人力和时间成本。

技术研发人员：肖杨王亚领钟能刘设伟
受保护的技术使用者：泰康在线财产保险股份有限公司
技术研发日：2021.09.10
技术公布日：2021/12/12

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于智能白板的一键截图方法及截图保存与分享方法与流程

文本字符分割的方法和装置与流程

相关文献

最热文献