一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本字符检测方法、装置及存储介质与流程

2022-03-26 02:23:11 来源:中国专利 TAG:

技术特征:
1.一种文本字符检测方法,其特征在于,所述方法包括:获取待识别文本图像;对所述待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本;根据预置的字符字典中的字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本;其中,所述字符字典中的字符的字符编码信息包括预置的字符集合中预先定义的第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息,所述第一类型字符为字符的正向字符和其倒置字符不同的字符,所述第二类型字符为字符的倒置字符与字符集合中其他字符的正向字符相似的字符或者为字符的正向字符与字符字典中其他字符的倒置字符相似的字符,所述第三类型字符为字符的正向字符和其倒置字符相同的字符,所述第四类型字符为字符的倒置字符和字符集合中其他字符的正向字符相同的字符;所述第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息包括预先设置的正向字符编码、倒置字符编码和公共字符编码的信息,所述正向字符编码信息为所述第一类型字符和第二类型字符的正向字符的字符编码信息,所述倒置字符编码信息为所述第一类型字符和第二类型字符的倒置字符的字符编码信息,所述公共字符编码信息为第三类型字符或第四类型字符的字符编码信息,所述第三类型字符中每个字符及其对应的字符采用相同的字符编码信息,所述第四类型字符中每个字符及其对应的字符采用相同的字符编码信息。2.根据权利要求1所述的文本字符检测方法,其特征在于,在所述根据预置的字符字典中的字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本之前,所述方法还包括:获取初始字符集合,所述初始字符集合为包括预设数量的正向字符的字符集合,且所述初始字符集合中的字符仅包括正向字符;对所述初始字符集合中的字符进行倒置后,添加到所述初始字符集合中,得到所述字符集合;对所述字符集合中字符进行编码,得到所述字符字典。3.根据权利要求2所述文本字符检测方法,其特征在于,所述对所述字符集合中字符进行编码,得到所述字符字典,包括:对所述字符集合中第一类型字符的正向字符和倒置字符,分别采用不同的编码信息进行编码,得到第一正向字符编码和第一倒置字符编码;对所述字符集合中第二类型字符的正向字符和倒置字符,分别采用不同的编码信息进行编码,得到第二正向字符编码和第二倒置字符编码;对所述字符集合中第三类型字符中每个字符及其对应的字符,采用相同的编码信息进行编码,得到第一公共字符编码;对所述字符集合中第四类型字符中每个字符及其对应的字符,采用相同的编码信息进行编码,得到第二公共字符编码;其中,所述正向字符编码包括所述第一正向字符编码和所述第二正向字符编码,所述倒置字符编码包括第一倒置字符编码和所述第二倒置字符编码,所述公共字符编码包括第一公共字符编码和第二公共字符编码。
4.根据权利要求1所述的文本字符检测方法,其特征在于,所述根据预置的字符字典中的字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本,包括:根据所述字符编码信息,确定所述检测文本是正向文本还是倒置文本;若所述检测文本是正向文本,直接输出所述检测文本;若所述检测文本是倒置文本,对所述检测文本进行倒置处理,输出所述检测文本的倒置处理后的结果。5.根据权利要求4所述的文本字符检测方法,其特征在于,所述根据预置的字符字典中的字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,包括:分别以所述检测文本中各字符为目标字符,在所述字符编码信息中查找所述目标字符的字符编码信息;根据所述目标字符的字符编码信息,确定所述目标字符是正向字符编码还是倒置字符编码;统计所述检测文本中为正向字符编码的第一数量值和倒置字符编码的第二数量值;根据所述第一数量值和所述第二数量值,确定所述检测文本是正向文本还是倒置文本。6.据权利要求5所述的文本字符检测方法,其特征在于,所述根据所述第一数量值和所述第二数量值,确定所述检测文本是正向文本还是倒置文本,包括:判断所述第一数量值和所述第二数量值的大小;若所述第一数量值大于所述第二数量值,确定所述检测文本是正向文本;若所述第一数量值小于所述第二数量值,确定所述检测文本是倒置文本。7.据权利要求1所述的文本字符检测方法,其特征在于,所述对所述待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本,包括:对所述待识别文本图像进行字符分割,得到多个字符图像;对所述多个字符图像进行字符识别,得到具有排列顺序的多个字符的检测文本。8.据权利要求1所述的文本字符检测方法,其特征在于,所述对所述待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本,包括:将所述待识别文本图像输入预先训练好的文本检测模型中,以输出具有排列顺序的多个字符的检测文本,所述文本检测模型为densenet网络模型,所述densenet网络模型的损失函数为权重时间连接分类损失函数。9.一种文本字符检测装置,其特征在于,所述文本字符检测包括:获取单元,用于获取待识别文本图像;识别单元,用于对所述待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本;输出单元,用于根据预置的字符字典中字符的字符编码信息,确定所述检测文本是正向文本还是倒置文本,并输出所述检测文本的正向文本;其中,所述字符字典中的字符的字符编码信息包括预置的字符集合中预先定义的第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息,所述第一类型字符为字符的正向字符和其倒置字符不同的字符,所述第二类型字符为字符的倒置字符与字
符集合中其他字符的正向字符相似的字符或者为字符的正向字符与字符字典中其他字符的倒置字符相似的字符,所述第三类型字符为字符的正向字符和其倒置字符相同的字符,所述第四类型字符为字符的倒置字符和字符集合中其他字符的正向字符相同的字符;所述第一类型字符、第二类型字符、第三类型字符和第四类型字符的字符编码信息包括预先设置的正向字符编码、倒置字符编码和公共字符编码的信息,所述正向字符编码信息为所述第一类型字符和第二类型字符的正向字符的字符编码信息,所述倒置字符编码信息为所述第一类型字符和第二类型字符的倒置字符的字符编码信息,所述公共字符编码信息为第三类型字符或第四类型字符的字符编码信息,所述第三类型字符中每个字符及其对应的字符采用相同的字符编码信息,所述第四类型字符中每个字符及其对应的字符采用相同的字符编码信息。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至8任一项所述的文本字符检测方法中的步骤。

技术总结
本申请公开了一种文本字符检测方法、装置及存储介质,该文本字符检测方法包括:获取待识别文本图像;对待识别文本图像进行字符识别,得到具有排列顺序的多个字符的检测文本;根据预置的字符字典中字符的字符编码信息,确定检测文本是正向文本还是倒置文本,并输出检测文本的正向文本。本申请可以实现对文本方向的判定以及输出检测文本对应的正向文本的内容识别结果,不论待识别文本图像识别后的多个字符是正向还是倒置,均可以完成识别,从而实现双向文本的识别,拓展文本识别的使用场景,以及提高文本在复杂场景下的识别准确率。以及提高文本在复杂场景下的识别准确率。以及提高文本在复杂场景下的识别准确率。


技术研发人员:徐汉飞 朴安妮 马佳炯
受保护的技术使用者:顺丰科技有限公司
技术研发日:2020.09.09
技术公布日:2022/3/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献