一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

手写文本工整度检测方法、装置、存储介质及电子设备与流程

2022-07-30 21:58:56 来源:中国专利 TAG:


1.本公开涉及文字识别技术领域,具体地,涉及一种手写文本工整度检测方法、装置、存储介质及电子设备。


背景技术:

2.在老师批阅学生的作业或者检查课堂笔记时,不仅会检查正确性,还会检查工整性。尤其是在线教育场景中,学生需要上传作业或者课堂笔记,然而大量作业或者课堂笔记,老师难易及时进行检查。
3.相关场景中,在书写过程中记录书写轨迹点,并根据书写轨迹点对文字书写特征进行提取,进而根据提取到的文字书写特征与预设模板的书写特征的匹配度,确定工整度的检测结果。然而,手写文字若书写在纸张上,然后拍摄照片上传,因无法记录书写轨迹点,导致无法对工整度进行检测。


技术实现要素:

4.本公开的目的是提供一种手写文本工整度检测方法、装置、存储介质及电子设备,以至少部分地解决上述技术问题。
5.为了实现上述目的,本公开第一方面,提供一种手写文本工整度检测方法,所述方法包括:
6.获取待检测手写文本,并对所述待检测手写文本中文本行进行轮廓检测,得到各所述文本行的行轮廓图;
7.从所述行轮廓图中确定对应所述文本行的目标采样点,并根据所述目标采样点确定该文本行的边界信息;
8.根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息;
9.根据所述工整度信息确定针对所述待检测文本的工整度的检测结果。
10.可选地,所述工整度信息为平行相似度,所述边界信息包括各所述文本行的边界长度以及所述待检测手写文本的宽度,所述根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息,包括:
11.根据所述行轮廓图中各所述文本行的边界长度以及所述待检测手写文本的宽度,确定所述各所述文本行的行权重;
12.确定所述行轮廓图中文本行的行数以及各所述文本行对应的边界线的斜率;
13.根据所述行数、所述行权重、以及各所述文本行对应的斜率与所述文本行的平均斜率的差值,确定所述平行相似度。
14.可选地,所述根据所述行数、所述行权重、以及各所述文本行对应的斜率与平均斜率的差值,确定所述平行相似度,包括:
15.确定各所述文本行对应的斜率与所述平均斜率的差值的绝对值;
16.根据各所述文本行的行权重以及对应该文本行的所述绝对值,计算各所述文本行
的第一行参值,并对各所述第一行参值求和得到第二行参值;
17.根据所述行数以及所述第二行参值,确定所述平行相似度。
18.可选地,所述工整度信息为行高波动信息,所述根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息,包括:
19.根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述各所述文本行的平均行高;
20.根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息。
21.可选地,所述根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述文本行的平均行高,包括:
22.将各所述文本行按照文本行的边界线长度进行排序,所述边界信息包括所述边界线长度;
23.按照选取百分比,从排序后的所述文本行中选取目标文本行;
24.根据各所述目标文本行的边界线坐标,确定各所述目标文本行的行高以及所述目标文本行的平均行高,所述边界信息还包括所述边界线坐标;
25.所述根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息,包括:
26.根据所述行轮廓图中所述目标文本行的行数、各所述目标文本行的行高与所述平均行高的差值以及各所述目标文本行的平均行高,确定所述待检测手写文本的行高波动信息。
27.可选地,所述根据所述工整度信息确定针对所述待检测文本的工整度的检测结果,包括:
28.根据预设的参数因子以及所述工整度信息,得到针对所述待检测文本的工整度的工整度分数;
29.将所述工整度分数映射到预设的系统检测范围内,得到针对所述待检测文本的工整度的检测结果。
30.可选地,所述从所述行轮廓图中确定对应所述文本行的目标采样点,包括:
31.根据所述行轮廓图中的长度信息,确定目标采样点数量;
32.从所述行轮廓图中选取所述目标采样点数量个采样点作为目标采样点;
33.所述根据所述目标采样点确定该文本行的边界信息,包括:
34.基于最小二乘法,根据所述目标采样点的坐标拟合得到该文本行的边界线;
35.根据各所述文本行中所述采样点的最小坐标、最大坐标、以及所述边界线,确定该文本行的边界信息。
36.本公开第二方面,提供一种手写文本工整度检测装置,所述装置包括:
37.获取模块,被配置为用于获取待检测手写文本,并对所述待检测手写文本中文本行进行轮廓检测,得到各所述文本行的行轮廓图;
38.第一确定模块,被配置为用于从所述行轮廓图中确定对应所述文本行的目标采样点,并根据所述目标采样点确定该文本行的边界信息;
39.第二确定模块,被配置为用于根据各所述文本行的所述边界信息确定所述待检测
手写文本的工整度信息;
40.第三确定模块,被配置为用于根据所述工整度信息确定针对所述待检测文本的工整度的检测结果。
41.可选地,所述工整度信息为平行相似度,所述边界信息包括各所述文本行的边界长度以及所述待检测手写文本的宽度,所述第二确定模块,包括:
42.第一确定子模块,被配置为用于根据所述行轮廓图中各所述文本行的边界长度以及所述待检测手写文本的宽度,确定所述各所述文本行的行权重;
43.第二确定子模块,被配置为用于确定所述行轮廓图中文本行的行数以及各所述文本行对应的边界线的斜率;
44.第三确定子模块,被配置为用于根据所述行数、所述行权重、以及各所述文本行对应的斜率与所述文本行的平均斜率的差值,确定所述平行相似度。
45.可选地,所述第三确定子模块,包括:
46.第一确定单元,被配置为用于确定各所述文本行对应的斜率与所述平均斜率的差值的绝对值;
47.计算单元,被配置为用于根据各所述文本行的行权重以及对应该文本行的所述绝对值,计算各所述文本行的第一行参值,并对各所述第一行参值求和得到第二行参值;
48.第二确定单元,被配置为用于根据所述行数以及所述第二行参值,确定所述平行相似度。
49.可选地,所述工整度信息为行高波动信息,所述第二确定模块,包括:
50.第四确定子模块,被配置为用于根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述各所述文本行的平均行高;
51.第五确定子模块,被配置为用于根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息。
52.可选地,所述第四确定子模块,被配置为用于将各所述文本行按照文本行的边界线长度进行排序,所述边界信息包括所述边界线长度;并按照选取百分比,从排序后的所述文本行中选取目标文本行;并根据各所述目标文本行的边界线坐标,确定各所述目标文本行的行高以及所述目标文本行的平均行高,所述边界信息还包括所述边界线坐标;
53.所述第五确定子模块,被配置为用于根据所述行轮廓图中所述目标文本行的行数、各所述目标文本行的行高与所述平均行高的差值以及各所述目标文本行的平均行高,确定所述待检测手写文本的行高波动信息。
54.可选地,所述第三确定模块,被配置为用于根据预设的参数因子以及所述工整度信息,得到针对所述待检测文本的工整度的工整度分数;并将所述工整度分数映射到预设的系统检测范围内,得到针对所述待检测文本的工整度的检测结果。
55.可选地,所述第一确定模块,被配置为用于:
56.根据所述行轮廓图中的长度信息,确定目标采样点数量;
57.从所述行轮廓图中选取所述目标采样点数量个采样点作为目标采样点;以及,
58.基于最小二乘法,根据所述目标采样点的坐标拟合得到该文本行的边界线;
59.根据各所述文本行中所述采样点的最小坐标、最大坐标、以及所述边界线,确定该
文本行的边界信息。
60.本公开第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
61.本公开第四方面,提供一种电子设备,包括:
62.存储器,其上存储有计算机程序;
63.处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面任一项所述方法的步骤。
64.通过上述技术方案,至少可以达到以下技术效果:
65.通过对获取到的待检测手写文本中文本行进行轮廓检测,得到各文本行的行轮廓图;从行轮廓图中确定对应文本行的目标采样点,并根据目标采样点确定该文本行的边界信息;根据各文本行的边界信息确定待检测手写文本的工整度信息;根据工整度信息确定针对待检测文本的工整度的检测结果。通过轮廓检测得到各文本行的行轮廓图,并根据每一行的目标采样点确定该文本行的边界信息,进而确定待检测手写文本的工整度信息,可以提高工整度检测的准确性,并且即使为图片形式的手写文本,也可以轮廓检测得到行轮廓图,进而可以进行工整度检测,提高了工整度检测的灵活性。
66.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
67.附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
68.图1根据一示例性实施例示出的一种手写文本工整度检测方法的流程图。
69.图2根据一示例性实施例示出的一种文字检测模型的网络结构图。
70.图3是根据一示例性实施例示出的一种生成行轮廓图的示意图。
71.图4是根据一示例性实施例示出的一种行轮廓图的示意图。
72.图5是根据一示例性实施例示出的另一种行轮廓图的示意图。
73.图6根据一示例性实施例示出的一种实现图1中步骤s13的流程图。
74.图7根据一示例性实施例示出的另一种实现图1中步骤s13的流程图。
75.图8根据一示例性实施例示出的另一种实现图1中步骤s13的流程图。
76.图9根据一示例性实施例示出的一种逻辑回归函数的示意图。
77.图10是根据一示例性实施例示出的一种归一检测结果的示意图。
78.图11是根据一示例性实施例示出的一种手写文本工整度检测装置的框图。
79.图12是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
80.以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
81.图1根据一示例性实施例示出的一种手写文本工整度检测方法的流程图,如图1所示,所述方法包括以下步骤。
82.在步骤s11中,获取待检测手写文本,并对所述待检测手写文本中文本行进行轮廓
检测,得到各所述文本行的行轮廓图。
83.可选地,待检测手写文本可以是通过例如拍照手写内容的方式得到的照片,可以是通过例如截图的方式得到的图片,也可以是通过电子设备在线手写形成的手写文本。
84.其中,通过文字检测模型对待检测手写文本中文本行进行轮廓检测,得到各所述文本行的行轮廓图,参见图2所示,在文字检测模型的训练过程中,将样本手写文本(如图2中左下角所示)输入网络后,例如将手写文本的图片或者在电子设备上手写获得的文本输入网络后,经过特征提取、上采样融合并(concat)操作,取不同深度的卷积特征以同时得到兼具高分辨率的位置信息和高层次的语义信息,得到如图2中的图像特征图f,再根据图像特征图f预测出概率图p(probability map)以及阈值图t(threshold map),最后通过概率图p和阈值图t计算出近似二值图,在根据近似二值图得到样本手写文本的输出结果。
85.在应用过程中,将待检测手写文本输入文字检测模型,同理取不同深度的卷积特征以同时得到兼具高分辨率的位置信息和高层次的语义信息,对待检测手写文本的倾斜、扭曲等进行提取,如图3所示,首先得到的是待检测手写文本的多边形特征图,再根据多边形特征图得到相应的概率图和阈值图,进而根据概率图和阈值图,得到各所述文本行的行轮廓图。
86.其中,可以说明的是,行轮廓图可以理解为文字书写方向上的轮廓图。例如,文字横向书写,行轮廓图可以是横向的轮廓图;文字纵向书写,行轮廓图可以是竖向的轮廓图;文字倾斜书写,行轮廓图可以是倾斜的轮廓图。
87.在步骤s12中,从所述行轮廓图中确定对应所述文本行的目标采样点,并根据所述目标采样点确定该文本行的边界信息。
88.其中,通过预设大小的掩膜,对每一文本行的长度方向上的边界线以及宽度方向上的边界线进行采样点确定。进而按照预设目标采样点数量从每一边界线中选取目标采样点。
89.例如,针对横向书写的行轮廓图,在上边界线和下边界线各选取9个采样点作为目标采样点,其中,按照采样点的坐标,选取该边界线上坐标最远的9个采样点。例如,针对上边界线选取纵坐标最大的9个采样点作为目标采样点,针对下边界线选取纵坐标最小的9个采样点作为目标采样点。
90.进一步地,基于最小二乘法,得到距离9个采样点最近的直线,将该直线作为该方向的边界。进而根据该方式得到行轮廓图中每一文本行的边界信息。参见图4以及图5所示的行轮廓图的边界信息。
91.按照预设数量确定文本行的目标采样点,可能目标采样点的数量较少,导致边界线不准确,可选地,所述从所述行轮廓图中确定对应所述文本行的目标采样点,包括:
92.根据所述行轮廓图中的长度信息,确定目标采样点数量。
93.其中,可以根据行轮廓图中文本行的平均长度确定目标采样点数量,也可以根据各文本行的长度,确定对应文本行的目标采样点数量。
94.从所述行轮廓图中选取所述目标采样点数量个采样点作为目标采样点。
95.同理,按照采样点的坐标,选取该边界线上坐标最远的目标采样点数量个采样点作为目标采样点。
96.所述根据所述目标采样点确定该文本行的边界信息,包括:
97.基于最小二乘法,根据所述目标采样点的坐标拟合得到该文本行的边界线;
98.根据各所述文本行中所述采样点的最小坐标、最大坐标、以及所述边界线,确定该文本行的边界信息。
99.其中,根据书写方向上的最小坐标、最大坐标,确定书写方向上(长度方向上)的边界线;根据垂直书写方向上的最小坐标、最大坐标,确定垂直书写方向上(宽度方向上)的边界线。进而根据长度方向上的边界线及宽度方向上的边界线,确定该文本行的边界信息。
100.在步骤s13中,根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息。
101.在该实施例中,所述工整度信息为平行相似度,所述边界信息包括各所述文本行的边界长度以及所述待检测手写文本的宽度,图6根据一示例性实施例示出的一种实现图1中步骤s13的流程图,在步骤s13中,所述根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息,包括:
102.在步骤s1301中,根据所述行轮廓图中各所述文本行的边界长度以及所述待检测手写文本的宽度,确定所述各所述文本行的行权重。
103.其中,待检测手写文本的宽度可以是垂直书写方向上的文本宽度,也可以是竖直方向上的文本宽度。例如,在倾斜书写的情况下,可以是初始书写方向上确定文本宽度,也可以是竖直方向上以最大纵坐标与最小纵坐标的坐标差确定文本宽度。
104.例如,通过如下公式计算文本行的行权重lambdai:
[0105][0106]
其中,slengthsi为第i个文本行的边界长度,其中,边界长度可以是同方向上边界线的平均值,w为待检测手写文本的宽度。
[0107]
在步骤s1302中,确定所述行轮廓图中文本行的行数以及各所述文本行对应的边界线的斜率。
[0108]
其中,文本行的行数可以通过同一方向上边界线数量确定,例如,将书写方向上边界线数量的一半作为文本行的行数。但是,若存在部分横向书写,部分倾斜书写,部分总线书写时,此方式准确性较低,因此,可以将文本行中边界线数量的四分之一作为文本行的行数。
[0109]
其中,边界线的斜率是指书写方向上的边界线的斜率。
[0110]
在步骤s1303中,根据所述行数、所述行权重、以及各所述文本行对应的斜率与所述文本行的平均斜率的差值,确定所述平行相似度。
[0111]
在上述实施例的基础上,在步骤s133中,所述根据所述行数、所述行权重、以及各所述文本行对应的斜率与平均斜率的差值,确定所述平行相似度,包括:
[0112]
确定各所述文本行对应的斜率与所述平均斜率的差值的绝对值。
[0113]
根据各所述文本行的行权重以及对应该文本行的所述绝对值,计算各所述文本行的第一行参值,并对各所述第一行参值求和得到第二行参值。
[0114]
根据所述行数以及所述第二行参值,确定所述平行相似度。
[0115]
在一种实施方式中,可以将行数与第二行参值的商作为平行相似度,即通过如下公式确定平行相似度score1:
[0116][0117]
其中,n为行轮廓图中文本行的行数,ki为第i个文本行的边界线的斜率,k_mean为文本行的平均斜率,lambdai为第i个文本行的行权重。
[0118]
其中,ki可以是文本行的上边界线的斜率和/或下边界线的斜率,也可以是上边界线的斜率与下边界线的斜率的均值。通常,文本行的上边界线的斜率与下边界线的斜率不同,因此可以分别参与平均斜率的计算,以及分别参与计算第一行参值。
[0119]
上述技术方案中score1越大则直线平行相似度越高,其中,对文本行宽度开根号后再求行权重,可以通过指数函数平滑边界线对平行相似度的敏感程度,降低变化抖动,从而降低待检测手写文本的宽度对最终工整度检测的影响,并且工整度检测不因文本行的行数变化而有较大波动。
[0120]
在该实施例中,所述工整度信息为行高波动信息,图7根据一示例性实施例示出的另一种实现图1中步骤s13的流程图,在步骤s13中,所述根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息,包括:
[0121]
在步骤s131中,根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述各所述文本行的平均行高。
[0122]
在步骤s132中,根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息。
[0123]
其中,行高波动信息可以包括第一行高波动值,例如通过以下公式确定待检测手写文本的第一行高波动值score2:
[0124][0125]
其中,h为文本行的平均行高,n为文本行的行数,hi为第i个文本行的行高,其中,hi可以是该文本行两端行高的均值。
[0126]
在一种可能实现的方式中,hi取该文本行两端行高的均值忽律了文本行内部行高变化对工整度检测的影响,因此,可以首先判断两端行高的差值,在行高的差值小于预设阈值的情况下,hi取该文本行两端行高的均值,在行高的差值大于等于预设阈值的情况下,该文本行两端的行高可以分别参与第一行高波动值score2的计算。
[0127]
在上述实施例的基础上,图8根据一示例性实施例示出的另一种实现图1中步骤s13的流程图,在步骤s131中,所述根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述文本行的平均行高,包括:
[0128]
在步骤s1311中,将各所述文本行按照文本行的边界线长度进行排序,所述边界信息包括所述边界线长度;
[0129]
在步骤s1312中,按照选取百分比,从排序后的所述文本行中选取目标文本行。
[0130]
可选地,选取百分比可以是预设选取百分比,例如预设选取百分比为80%,则选取文本行长度最大的80%个文本行为目标文本行。也可以是根据文本行的行数确定的选取百分比,例如建立文本行的行数与选取百分比的对应关系。
[0131]
在步骤s1313中,根据各所述目标文本行的边界线坐标,确定各所述目标文本行的行高以及所述目标文本行的平均行高,所述边界信息还包括所述边界线坐标;
[0132]
在步骤s132中,所述根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息,包括:
[0133]
在步骤s1321中,根据所述行轮廓图中所述目标文本行的行数、各所述目标文本行的行高与所述平均行高的差值以及各所述目标文本行的平均行高,确定所述待检测手写文本的行高波动信息。
[0134]
其中,通过图8方式计算的行高波动信息为第二行高波动值,例如通过以下公式确定待检测手写文本的第二行高波动值score3:
[0135][0136]
其中,w为目标文本行的平均行高,m为目标文本行的行数,wi为第i个目标文本行的行高,同理,在目标文本行两端行高的差值小于预设阈值的情况下,wi取该目标文本行两端行高的均值,在目标文本行两端行高的差值大于等于预设阈值的情况下,该目标文本行两端的行高可以分别参与第二行高波动值score3的计算。
[0137]
在步骤s14中,根据所述工整度信息确定针对所述待检测文本的工整度的检测结果。
[0138]
在一种实施方式中,工整度信息可以包括平行相似度、第一行高波动信息和第二行高波动信息,其中,第一行高波动信息是根据图7所示的方法确定的,第二行高波动信息是根据图8所示的方法确定的。
[0139]
其中,通过如下公式确定针对所述待检测文本的工整度的检测结果score:
[0140]
score=score1 λ1score2 λ2score3
[0141]
其中,score1为平行相似度,score2为第一行高波动信息,score3为第二行高波动信息,λ1和λ2为预设的平衡权重系数,可选地,λ1和λ2预设的取值均为0.1。
[0142]
在上述实施例中,由于score没有归一化到0到100的分数段范围,且每个人对工整度的敏感区域的感知有区别,未归一化可能导致检测结果不统一,因而可以对检测结果score进行归一化及映射调整,因而,在步骤s14中,所述根据所述工整度信息确定针对所述待检测文本的工整度的检测结果,可以包括:
[0143]
根据预设的参数因子以及所述工整度信息,得到针对所述待检测文本的工整度的工整度分数。
[0144]
其中,预设的参数因子可以是通过人工标注样本手写文本的期望工整度,例如,通过3个人进行人工标注,并取平均值作为样本手写文本的期望工整度。通过bp算法,将样本手写文本输入模型,在正向传播时,样本手写文本从输入层进入网络,经隐藏层逐层传递至输出层,如果输出层的实际输出与期望工整度不同,则转至误差反向传播;如果输出层的实际输出与期望工整度相同,结束学习算法。
[0145]
在反向传播时,将输出误差(即期望输出与实际输出之差)按原通路反传计算,通过隐藏层反向,直至输入层,在反传过程中将误差分摊给各层的各个单元,获得各层各单元
的误差信号,并将其作为修正各单元的权值的依据。这一计算过程使用梯度下降法完成,在不停地调整各层神经元的权值和阈值后,使误差信号减小到最低限度。
[0146]
这样,经过信号正向传播与误差反向传播,权值和阈值的调整反复进行,一直进行到预先设定的学习训练次数,或输出误差减小到允许的程度,得到预设的参数因子。例如,最小化实际输出和样本的误差,得到预设的参数因子。
[0147]
其中,预设的参数因子可以包括预设的缩放因子和预设的平移因子,缩放因子用于调整各工整度分数段的变化幅值,平移因子用于调整工整度分数的均值,平移因子取值越大,则评分在中间区段变化越陡峭。
[0148]
将所述工整度分数映射到预设的系统检测范围内,得到针对所述待检测文本的工整度的检测结果。
[0149]
如图9所示,通过逻辑回归函数将检测结果score映射到0到1的区间,参见如下公式,如图10所示,基于不同的缩放因子c1和平移因子c2,通过逻辑回归函数对检测结果score进行调整,将检测结果调整到系统检测范围0到1之间,再乘以100得到最终处于0-100范围内的检测结果s:
[0150][0151]
其中,c1为预设的缩放因子,c2为预设的平移因子。
[0152]
上述技术方案通过对获取到的待检测手写文本中文本行进行轮廓检测,得到各文本行的行轮廓图;从行轮廓图中确定对应文本行的目标采样点,并根据目标采样点确定该文本行的边界信息;根据各文本行的边界信息确定待检测手写文本的工整度信息;根据工整度信息确定针对待检测文本的工整度的检测结果。通过轮廓检测得到各文本行的行轮廓图,并根据每一行的目标采样点确定该文本行的边界信息,进而确定待检测手写文本的工整度信息,可以提高工整度检测的准确性,并且即使为图片形式的手写文本,也可以轮廓检测得到行轮廓图,进而可以进行工整度检测,提高了工整度检测的灵活性。并且可以快速、以统一标准地对各类手写文本,例如手写作业、笔记进行工整度检测,提高了工整度检测的效率。
[0153]
基于相同的构思,本公开还提供一种手写文本工整度检测装置,用于执行上述实施例提供的手写文本工整度检测方法的步骤,该装置可以以软件、硬件或者两者相结合的方式实现手写文本工整度检测方法。图11是根据一示例性实施例示出的一种手写文本工整度检测装置1100的框图,如图11所示,所述装置1100包括:获取模块1110、第一确定模块1120、第二确定模块1130和第三确定模块1140。
[0154]
获取模块1110,被配置为用于获取待检测手写文本,并对所述待检测手写文本中文本行进行轮廓检测,得到各所述文本行的行轮廓图;
[0155]
第一确定模块1120,被配置为用于从所述行轮廓图中确定对应所述文本行的目标采样点,并根据所述目标采样点确定该文本行的边界信息;
[0156]
第二确定模块1130,被配置为用于根据各所述文本行的所述边界信息确定所述待检测手写文本的工整度信息;
[0157]
第三确定模块1140,被配置为用于根据所述工整度信息确定针对所述待检测文本的工整度的检测结果。
[0158]
上述装置通过轮廓检测得到各文本行的行轮廓图,并根据每一行的目标采样点确定该文本行的边界信息,进而确定待检测手写文本的工整度信息,可以提高工整度检测的准确性,并且即使为图片形式的手写文本,也可以轮廓检测得到行轮廓图,进而可以进行工整度检测,提高了工整度检测的灵活性。
[0159]
可选地,所述工整度信息为平行相似度,所述边界信息包括各所述文本行的边界长度以及所述待检测手写文本的宽度,所述第二确定模块1130,包括:
[0160]
第一确定子模块,被配置为用于根据所述行轮廓图中各所述文本行的边界长度以及所述待检测手写文本的宽度,确定所述各所述文本行的行权重;
[0161]
第二确定子模块,被配置为用于确定所述行轮廓图中文本行的行数以及各所述文本行对应的边界线的斜率;
[0162]
第三确定子模块,被配置为用于根据所述行数、所述行权重、以及各所述文本行对应的斜率与所述文本行的平均斜率的差值,确定所述平行相似度。
[0163]
可选地,所述第三确定子模块,包括:
[0164]
第一确定单元,被配置为用于确定各所述文本行对应的斜率与所述平均斜率的差值的绝对值;
[0165]
计算单元,被配置为用于根据各所述文本行的行权重以及对应该文本行的所述绝对值,计算各所述文本行的第一行参值,并对各所述第一行参值求和得到第二行参值;
[0166]
第二确定单元,被配置为用于根据所述行数以及所述第二行参值,确定所述平行相似度。
[0167]
可选地,所述工整度信息为行高波动信息,所述第二确定模块1130,包括:
[0168]
第四确定子模块,被配置为用于根据各所述文本行的所述边界信息,确定各所述文本行的行高以及所述各所述文本行的平均行高;
[0169]
第五确定子模块,被配置为用于根据所述行轮廓图中所述文本行的行数、各所述文本行的行高与所述平均行高的差值以及所述平均行高,确定所述待检测手写文本的行高波动信息。
[0170]
可选地,所述第四确定子模块,被配置为用于将各所述文本行按照文本行的边界线长度进行排序,所述边界信息包括所述边界线长度;并按照选取百分比,从排序后的所述文本行中选取目标文本行;并根据各所述目标文本行的边界线坐标,确定各所述目标文本行的行高以及所述目标文本行的平均行高,所述边界信息还包括所述边界线坐标;
[0171]
所述第五确定子模块,被配置为用于根据所述行轮廓图中所述目标文本行的行数、各所述目标文本行的行高与所述平均行高的差值以及各所述目标文本行的平均行高,确定所述待检测手写文本的行高波动信息。
[0172]
可选地,所述第三确定模块,被配置为用于根据预设的参数因子以及所述工整度信息,得到针对所述待检测文本的工整度的工整度分数;并将所述工整度分数映射到预设的系统检测范围内,得到针对所述待检测文本的工整度的检测结果。
[0173]
可选地,所述第一确定模块,被配置为用于:
[0174]
根据所述行轮廓图中的长度信息,确定目标采样点数量;
[0175]
从所述行轮廓图中选取所述目标采样点数量个采样点作为目标采样点;以及,
[0176]
基于最小二乘法,根据所述目标采样点的坐标拟合得到该文本行的边界线;
[0177]
根据各所述文本行中所述采样点的最小坐标、最大坐标、以及所述边界线,确定该文本行的边界信息。
[0178]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0179]
此外值得说明的是,为描述的方便和简洁,说明书中所描述的实施例均属于优选实施例,其所涉及的部分并不一定是本发明所必须的,例如,第二确定模块1130和第三确定模块1140,在具体实施时可以是相互独立的装置也可以是同一个装置,本公开对此不作限定。
[0180]
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现手写文本工整度检测方法中任一项所述方法的步骤。
[0181]
本公开实施例还提供一种电子设备,包括:
[0182]
存储器,其上存储有计算机程序;
[0183]
处理器,用于执行所述存储器中的所述计算机程序,以实现手写文本工整度检测方法中任一项所述方法的步骤。
[0184]
图12是根据一示例性实施例示出的一种电子设备1200的框图。该电子设备1200可以被配置为一教学终端、智能手机、平板电脑、台式电脑等,以执行上述手写文本工整度检测方法。如图11所示,该电子设备1200可以包括:处理器1201,存储器1202。该电子设备1200还可以包括多媒体组件1203,输入/输出(i/o)接口1204,以及通信组件1205中的一者或多者。
[0185]
其中,处理器1201用于控制该电子设备1200的整体操作,以完成上述的手写文本工整度检测方法中的全部或部分步骤。存储器1202用于存储各种类型的数据以支持在该电子设备1200的操作,这些数据例如可以包括用于在该电子设备1200上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如学校数据、课程数据、班级数据、教师以及教室数据等等。该存储器1202可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(static random access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read-only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read-only memory,简称eprom),可编程只读存储器(programmable read-only memory,简称prom),只读存储器(read-only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。多媒体组件1203可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1202或通过通信组件1205发送。音频组件还包括至少一个扬声器,用于输出音频信号。i/o接口1204为处理器1201和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件1205用于该电子设备1200与其他设备之间进行有线或无线通信。无线通信,例如wi-fi,蓝牙等等。因此相应的该通信组件1205可以包括:wi-fi模块,蓝牙模块等等。
[0186]
在一示例性实施例中,电子设备1200可以被一个或多个应用专用集成电路(application specific integrated circuit,简称asic)、数字信号处理器(digital signal processor,简称dsp)、数字信号处理设备(digital signal processing device,
简称dspd)、可编程逻辑器件(programmable logic device,简称pld)、现场可编程门阵列(field programmable gate array,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的手写文本工整度检测方法。
[0187]
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的手写文本工整度检测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器1202,上述程序指令可由电子设备1200的处理器1201执行以完成上述的手写文本工整度检测方法。
[0188]
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
[0189]
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
[0190]
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献