一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文本识别方法、装置、计算机设备和存储介质与流程

2022-02-24 10:51:51 来源:中国专利 TAG:

技术特征:
1.一种文本识别方法,其特征在于,包括:获取待识别文本行图像;获取所述待识别文本行图像的书写方向,其中,所述书写方向的类型包括横向书写方向和纵向书写方向;基于已训练完成的文本识别模型提取所述待识别文本行图像的特征图;通过所述文本识别模型对所述特征图进行特定维度变换处理,将所述特征图转换为二维矩阵,所述特定维度变换处理与所述待识别文本行图像的书写方向对应,其中,若所述书写方向为横向书写方向,所述二维矩阵的维度包括第一图片横向维度和第一图片通道维度,若所述书写方向为纵向书写方向,所述二维矩阵的维度包括第二图片纵向维度和第二图片通道维度;通过所述文本识别模型对所述二维矩阵进行分析,确定所述待识别文本行图像中的文本。2.根据权利要求1所述的文本识别方法,其特征在于,所述特征图的维度包括原始图片纵向维度、原始图片横向维度,原始图片通道维度,所述通过所述文本识别模型对所述特征图进行特定维度变换处理,将所述特征图转换为二维矩阵,包括:若所述书写方向为横向书写方向,通过所述文本识别模型将所述特征图的原始图片纵向维度和原始图片通道维度合并得到所述第一图片通道维度,并将所述原始图片横向维度作为所述第一图片横向维度,得到包括所述第一图片横向维度和第一图片通道维度的第一二维矩阵;若所述书写方向为纵向书写方向,通过所述文本识别模型将所述特征图的原始图片横向维度和原始图片通道维度合并得到所述第二图片通道维度,并将所述原始图片纵向维度作为所述第二图片纵向维度,得到包括所述第二图片纵向维度和第二图片通道维度的第二二维矩阵。3.根据权利要求2所述的文本识别方法,其特征在于,所述通过所述文本识别模型对所述二维矩阵进行分析,确定所述待识别文本行图像中的文本,包括:若所述书写方向为横向书写方向,通过所述文本识别模型将所述第一二维矩阵按照所述第一图片横向维度进行展开,得到第一列向量;若所述书写方向为纵向书写方向,通过所述文本识别模型将所述第二二维矩阵按照所述第二图片纵向维度进行展开,得到第一列向量;以所述第一列向量作为时序向量,通过所述文本识别模型学习所述第一列向量的时序特征,得到第二列向量;对所述第二列向量进行分类,基于分类结果确定所述待识别文本行图像中文本行对应的文本。4.根据权利要求2所述的文本识别方法,其特征在于,所述通过所述文本识别模型基于所述二维矩阵进行分析,确定所述待识别文本行图像中的文本,包括:若所述书写方向为横向书写方向,通过所述文本识别模型将所述第一二维矩阵按照所述第一图片横向维度进行展开,得到第一列向量;若所述书写方向为纵向书写方向,通过所述文本识别模型将所述第二二维矩阵按照所述第二图片纵向维度进行展开,得到第一列向量;
对所述第一列向量进行分类,基于分类结果确定所述待识别文本行图像中文本行对应的文本。5.根据权利要求1所述的文本识别方法,其特征在于,所述获取所述待识别文本行图像的书写方向,包括:判断所述待识别文本行图像的横向长度和纵向长度之间的实际长度关系,是否与横向书写方向或纵向书写方向对应的预设长度关系匹配;基于判断结果,确定所述待识别文本行图像的书写方向。6.根据权利要求5所述的文本识别方法,其特征在于,所述基于判断结果,确定所述待识别文本行图像的书写方向,包括:若所述实际长度关系,与所述横向书写方向对应的预设长度关系匹配,确定所述待识别文本行图像的书写方向为横向书写方向;若所述实际长度关系,与所述纵向书写方向对应的预设长度关系匹配,确定所述待识别文本行图像的书写方向为纵向书写方向;若所述实际长度关系,与所述横向书写方向以及纵向书写方向对应的预设长度关系均不匹配,设置所述待识别文本行图像的书写方向同时包括所述横向书写方向和纵向书写方向;所述通过所述文本识别模型对所述二维矩阵进行分析,确定所述待识别文本行图像中的文本之后,还包括:若所述待识别文本行图像的书写方向同时包括所述横向书写方向和纵向书写方向,从以所述横向书写方向作为所述待识别文本行图像的书写方向的场景下所述文本识别模型识别出的文本,以及以所述纵向书写方向作为所述待识别文本行图像的书写方向的场景下所述文本识别模型识别出的文本中,确定所述待识别文本行图像的正确文本。7.根据权利要求1-6任一项所述的文本识别方法,其特征在于,还包括:获取训练样本,所述训练样本包括横排文本样本和竖排文本样本,所述训练样本的样本标签包括样本中文本的书写方向,以及文本中的字符对应的字符标识;获取待训练的文本识别模型;基于所述文本识别模型对所述训练样本提取特征图;通过所述文本识别模型对所述特征图进行特定维度变换处理,将所述特征图转换为二维矩阵,所述特定维度变换处理与所述训练样本的书写方向对应,其中,若所述书写方向为横向书写方向,所述二维矩阵的维度包括第一图片横向维度和第一图片通道维度,若所述书写方向为纵向书写方向,所述二维矩阵的维度包括第二图片纵向维度和第二图片通道维度;通过所述文本识别模型基于所述二维矩阵进行分析,确定所述训练样本中的文本对应的预测字符标识;基于训练样本的预测字符标识和样本标签中的字符标识,计算所述文本识别模型的总损失;基于所述总损失调整所述文本识别模型的参数,直到所述文本识别模型训练完成。8.一种文本识别装置,其特征在于,包括:第一获取单元,用于获取待识别文本行图像;
第二获取单元,用于获取所述待识别文本行图像的书写方向,其中,所述书写方向的类型包括横向书写方向和纵向书写方向;特征获取单元,用基于已训练完成的文本识别模型提取所述待识别文本行图像的特征图;转换单元,用于通过所述文本识别模型对所述特征图进行特定维度变换处理,将所述特征图转换为二维矩阵,所述特定维度变换处理与所述待识别文本行图像的书写方向对应,其中,若所述书写方向为横向书写方向,所述二维矩阵的维度包括第一图片横向维度和第一图片通道维度,若所述书写方向为纵向书写方向,所述二维矩阵的维度包括第二图片纵向维度和第二图片通道维度;分析单元,用于通过所述文本识别模型对所述二维矩阵进行分析,确定所述待识别文本行图像中的文本。9.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-7任一项所述方法的步骤。10.一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述方法的步骤。

技术总结
本发明公开了一种文本识别方法、装置、计算机设备和存储介质,可以获取待识别文本行图像,以及图像的书写方向;基于已训练完成的文本识别模型提取待识别文本行图像的特征图;本实施例中横向文本行和纵向文本行都采用的同一特征提取方案提取特征图,模型中的特征提取能力较强,模型的规模也可得以控制,特征图提取后,通过文本识别模型对特征图进行特定维度变换处理,将特征图转换为二维矩阵;通过文本识别模型对二维矩阵进行分析,确定待识别文本行图像中的文本,本实施例中模型对横向文本行和纵向文本行的特征提取能力强,有利于提升文本识别准确率。本识别准确率。本识别准确率。


技术研发人员:喻雨峰
受保护的技术使用者:顺丰科技有限公司
技术研发日:2020.08.19
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献