一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种拍照搜题方法与流程

2022-03-23 06:19:10 来源:中国专利 TAG:

技术特征:
1.一种拍照搜题方法,其特征在于,包括以下步骤:s1:获取试题图片信息,并对该图片信息进行预处理;s2:对预处理后的图片信息,基于霍夫变换法判断图片中的文本行是否倾斜,若倾斜,则将文本行校正调整成水平状态;s3:判断调整成水平状态的文本行中的文字是否倒置,若倒置,则对图片进行旋转校正,以使文字处于正常的方向;s4:基于连通区域检测算法,对图片中的文本行进行字符分割;s5:对分割后的字符进行特征提取,并与预先构建的标准文字模板进行匹配,以识别文本行中的文字信息,并将每相邻的至少两个文字信息作为搜索关键词,在预先构建的题库中逐一进行搜索,并对搜索结果进行筛选及排序。2.根据权利要求1所述的拍照搜题方法,其特征在于,所述s2中将文本行校正调整成水平状态具体包括以下步骤:s21:将获取的图片信息按纵向或横向划分成m个子块图像,其中,m=h/h,h为图片的高度,h为子块图像的高度;s22:搜索并获取每一子块图像的左边界的坐标值信息,并将其存储于数组m中;s23:依据下式,计算文本行的倾斜角度;其中,k=|h
1-h2|,h为每个子块图像的高度;s24:基于s23计算得到的文本行的倾斜角度,将其反向旋转该角度,使其处于水平状态。3.根据权利要求2所述的拍照搜题方法,其特征在于,所述s22中在搜索每一子块图像的左边界的坐标值信息时,若位于最左端的子块图像的左边界不存在像素点,则搜索向右平移一列的子块图像的左边界坐标值信息。4.根据权利要求1所述的拍照搜题方法,其特征在于,所述s3具体包括以下步骤:s31:预先获取至少5000张文字正常排布的正向图片信息,以及至少5000张文字倒置的反向图片信息,作为训练集;s32:基于vgg16网络结构构建图片倾斜校正模型,并依据s31获取的训练集对其进行训练;s33:使用小批量梯度下降法作为优化器,并基于softmax损失函数对模型进行优化;s34:基于优化后的图片倾斜校正模型,判断文本行中的文字是否倒置,并依据判断结果,对其进行校正。5.根据权利要求1所述的拍照搜题方法,其特征在于,所述s1中的预处理具体包括以下步骤:s11:基于加权平均法对获取的试题图片信息进行灰度化处理;s12:基于niblack算法对灰度化处理后的试题图片信息进行二值化;s13:基于数字形态学滤波法对二值化后的试题图片信息进行降噪。

技术总结
本发明公开一种拍照搜题方法,包括以下步骤:S1:获取试题图片信息,并对该图片信息进行预处理;S2:对预处理后的图片信息,基于霍夫变换法判断图片中的文本行是否倾斜,若倾斜,则将文本行校正调整成水平状态;S3:判断调整成水平状态的文本行中的文字是否倒置,若倒置,则对图片进行旋转校正,以使文字处于正常的方向。本发明在对字符进行识别前,首先需要将文本行调整成水平状态,并判断处于水平状态下的文本行的字符是否是倒置的,若是倒置的,则依据预先构建的图片倾斜校正模型,再将整个图片旋转一定的角度,使得文本行中的字符处于正常的方向,进而提高字符识别精度。进而提高字符识别精度。进而提高字符识别精度。


技术研发人员:郑贤娇 罗韶峰
受保护的技术使用者:深圳市亚太未来教育科技发展有限公司
技术研发日:2021.12.17
技术公布日:2022/3/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献