一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本处理方法、装置、存储介质及计算机设备与流程

2022-10-13 03:34:55 来源:中国专利 TAG:


1.本技术涉及图像处理技术领域,尤其涉及一种文本处理方法、装置、存储介质及计算机设备。


背景技术:

2.ocr识别(光学字符识别)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即对图像中的文字进行识别,并以文本的形式返回。由于ocr识别技术具有准确性高、稳定性强、简单易用等特点,广泛应用于教育领域、医疗领域、工业领域等。例如,可以将ocr识别技术应用于pda(扫描枪)上,作为条码、二维码识别的补充。
3.目前,在将ocr识别技术应用于pda的过程中,由于识别场景不固定,识别到的文字可能存在弯曲、大小不一等情况,导致最终的识别结果的准确性较低。


技术实现要素:

4.本技术的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中在将ocr识别技术应用于pda的过程中,由于识别场景不固定,识别到的文字可能存在弯曲、大小不一等情况,导致最终的识别结果的准确性较低的技术缺陷。
5.本技术提供了一种文本处理方法,所述方法包括:
6.获取待处理的文本图像以及与所述文本图像对应的高斯热力图,所述高斯热力图中包含目标文本区域;
7.确定所述目标文本区域中的文本框以及文本框类型,所述文本框类型包括弯曲型文本框和直线型文本框;
8.若所述文本框为弯曲型文本框,则按照所述文本框的弯曲程度对所述文本框进行分割,并依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本;
9.若所述文本框为直线型文本框,则依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的的文本进行裁剪,得到目标文本。
10.可选地,所述确定所述目标文本区域中的文本框,包括:
11.按照预设的二值化阈值对所述高斯热力图进行至少一次二值化操作后得到二值化图像,所述高斯热力图在进行两次以上二值化操作时,每次二值化操作采用的二值化阈值不同;
12.确定所述二值化图像中位于所述目标文本区域的每一文字轮廓对应的最小外接矩形,并按照每一最小外接矩形在所述文本图像中对应的文本对各个最小外接矩形进行划分,得到文本框。
13.可选地,所述目标文本区域中的文本框包含至少一个最小外接矩形;
14.所述确定所述目标文本区域中的文本框的文本框类型,包括:
15.判断所述目标文本区域中的文本框所包含的最小外接矩形的个数是否超过预设
个数值;
16.若不超过,则确定所述文本框为直线型文本框;
17.若超过,则根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型。
18.可选地,所述根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型,包括:
19.按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线;
20.按照所述排列顺序,将所述两个相邻的最小外接矩形之后的最小外接矩形的中点,依次与所述两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线,得到至少一条测量直线;
21.判断所述基准直线与每一测量直线之间的夹角是否大于预设角度值;
22.若至少一个夹角大于所述预设角度值,则确定所述文本框为弯曲型文本型;
23.若所有的夹角均不大于所述预设角度值,则确定所述文本框为直线型文本框。
24.可选地,所述按照所述文本框的弯曲程度对所述文本框进行分割,得到分割后的文本框,包括:
25.获取首次判断所述夹角大于所述预设角度值时对应的测量直线;
26.将该测量直线的两个端点中排列顺序靠后的端点对应的最小外接矩形作为第一最小外接矩形,以及将该测量直线的前一测量直线的两个端点中排序靠后的端点对应的最小外接矩形作为第二最小外接矩形;
27.根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框;
28.判断所述排列顺序靠后的最小外接矩形组成的文本框中最小外接矩形的个数;
29.若所述最小外接矩形的个数为两个以下,则结束分割操作;
30.若所述最小外接矩形的个数为至少三个,则将所述排列顺序靠后的最小外接矩形组成的文本框作为新的文本框,并返回执行按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线的步骤,直到结束分割操作为止,得到分割后的文本框。
31.可选地,所述根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,包括:
32.将所述第一最小外接矩形与所述第二最小外接矩形的中点进行连线,得到矩形连接线;
33.以所述矩形连接线的中点位置为原点,作平行于所述第二最小外接矩形的右侧矩形边的分割线,并根据所述分割线对所述文本框进行分割。
34.可选地,所述依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本,包括:
35.按照预设的膨胀倍数对所述分割后的文本框进行膨胀,得到膨胀后的文本框;
36.根据所述膨胀后的文本框,对所述文本图像中相应区域的文本进行裁剪,得到多
个初始文本;
37.根据每个初始文本在所述文本图像中的排列顺序,对各个初始文本进行拼接,得到目标文本。
38.可选地,所述依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本,包括:
39.当所述文本框为一个时,依据所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本;
40.当所述文本框为多个时,依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框;
41.若存在,则将位于同一行的文本框进行合并,并根据合并后的文本框对所述文本图像中的文本进行裁剪,得到目标文本;
42.若不存在,则按照每一文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本。
43.可选地,所述依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框,包括:
44.在各个文本框中选取任意两个文本框,并确定选取的所述任意两个文本框在所述高斯热力图中的位置;
45.根据所述任意两个文本框在所述高斯热力图中的位置,确认所述任意两个文本框是否位于同一行,得到确认结果;
46.判断各个文本框是否均被选取过;
47.若是,则根据所述确认结果确定是否存在位于同一行的文本框;
48.若否,则继续在各个文本框中选取任意两个文本框,当本次所选取的任意两个文本框与前一次所选取的任意两个文本框中存在一个不同的文本框时,返回执行确定选取的所述任意两个文本框在所述高斯热力图中的位置的步骤,直到各个文本框均被选取过为止。
49.可选地,所述根据所述任意两个文本框在所述高斯热力图中的位置,确认所述任意两个文本框是否位于同一行,包括:
50.根据所述任意两个文本框在所述高斯热力图中的位置,确定各个文本框在所述高斯热力图中的第一倾角,以及对各个文本框的中点进行连线后得到的中点线在所述高斯热力图中的第二倾角;
51.根据所述第一倾角和所述第二倾角,初步判断所述任意两个文本框是否位于同一行;
52.若是,则根据所述任意两个文本框在所述高斯热力图中的位置,确定其中一个文本框在所述高斯热力图中的上边缘直线和下边缘直线,以及另一个文本框的中点在所述上边缘直线与所述下边缘直线之间的垂线;
53.根据所述上边缘直线、所述下边缘直线以及所述上边缘直线与所述下边缘直线之间的垂线,最终判断所述任意两个文本框是否位于同一行。
54.可选地,所述将位于同一行的文本框进行合并,得到合并后的文本框,包括:
55.将所述高斯热力图中位于同一行的文本框以及不位于同一行的文本框分别进行
标记,得到由各个标记后的文本框构成的连通图;
56.通过dfs遍历所述连通图,并根据遍历结果确定所述连通图中的连通单元,所述连通单元为合并后的文本框。
57.可选地,所述将位于同一行的文本框进行合并之前,还包括:
58.确定位于同一行的各个文本框的宽高比;
59.将每一文本框的宽高比与预设的宽高比区间进行比对,若至少一个文本框的宽高比不在所述宽高比区间,则对所述至少一个文本框的倾斜角度进行矫正。
60.可选地,所述对所述至少一个文本框的倾斜角度进行矫正,包括:
61.选取所述高斯热力图中框体长度最长的文本框作为基准文本框;
62.按照所述基准文本框在所述高斯热力图中的倾斜角度,对所述至少一个文本框的倾斜角度进行矫正。
63.可选地,所述获取与所述文本图像对应的高斯热力图,包括:
64.将所述文本图像输入至预先配置的深度学习检测模型中,得到所述深度学习检测模型输出的与所述文本图像对应的高斯热力图;
65.其中,所述深度学习检测模型是以多组训练文本图像以及对多组训练文本图像进行数据扩充后得到的扩充图像作为训练样本,以每组训练文本图像以及扩充图像对应的真实高斯热力图为样本标签进行训练得到的。
66.本技术还提供了一种文本处理装置,包括:
67.图像获取模块,用于获取待处理的文本图像以及与所述文本图像对应的高斯热力图,所述高斯热力图中包含目标文本区域;
68.文本框确定模块,用于确定所述目标文本区域中的文本框以及文本框类型,所述文本框类型包括弯曲型文本框和直线型文本框;
69.第一处理模块,用于若所述文本框为弯曲型文本框,则按照所述文本框的弯曲程度对所述文本框进行分割,并依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本;
70.第二处理模块,用于若所述文本框为直线型文本框,则依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的的文本进行裁剪,得到目标文本。
71.本技术还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述文本处理方法的步骤。
72.本技术还提供了一种计算机设备,包括:一个或多个处理器,以及存储器。
73.所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述文本处理方法的步骤。
74.从以上技术方案可以看出,本技术实施例具有以下优点:
75.本技术提供的文本处理方法、装置、存储介质及计算机设备,在对文本图像进行ocr识别之前,可以获取该文本图像及与该文本图像对应的高斯热力图,这样便可以滤除文本图像中与文本无关的背景,从而更方便对文本进行处理;当获取到高斯热力图后,由于该高斯热力图中包含有目标文本区域,因此,本技术可以仅确定目标文本区域中的文本框及
文本框类型,无需关注高斯热力图中的其他区域,这样既可以精准矫正,又可以提升处理效率;当确定目标文本区域的文本框对应的文本框类型后,本技术还可以针对不同的文本框类型进行针对性的调整,例如,当文本框为弯曲型文本框时,可以按照该文本框的弯曲程度来对文本框进行分割,并根据分割后的文本框对文本图像中的文本进行裁剪并拼接,这样得到的目标文本既包含了原有的文本信息,又简化了文本的识别难度,从而有效提高文本识别准确率;而当文本框为直线型文本框时,本技术可以依据目标文本区域中文本框的个数以及各文本框在高斯热力图中的位置,来对文本图像中相同位置处的文本进行裁剪,例如,当文本框为一个时,可以直接对文本图像中与该文本框相同位置处的文本进行裁剪,而当文本框为多个时,可以判断是否存在位于同一行的文本框,若存在,则将位于同一行的文本框进行合并,并利用合并后的文本框对文本图像中的文本进行裁剪,这样不仅可以提高文本识别效率,还可以解决文本框中大小字同处一行的问题,进而有效提升文本识别准确率。
附图说明
76.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
77.图1为本技术实施例提供的一种文本处理方法的流程示意图;
78.图2为本技术实施例提供的不同识别场景下的文本图像对应的高斯热力图;
79.图3为本技术实施例提供的对弯曲型文本框进行分割操作后得到的分割后的文本框的结构示意图;
80.图4为本技术实施例提供的初步确认两个文本框是否位于同一行的结构示意图;
81.图5为本技术实施例提供的最终确认两个文本框是否位于同一行的结构示意图;
82.图6为本技术实施例提供的一种文本处理装置的结构示意图;
83.图7为本技术实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
84.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
85.目前,在将ocr识别技术应用于pda的过程中,由于识别场景不固定,识别到的文字可能存在弯曲、大小不一等情况,导致最终的识别结果的准确性较低。基于此,本技术提出了如下技术方案,具体参见下文:
86.在一个实施例中,如图1所示,图1为本技术实施例提供的一种文本处理方法的流程示意图;本技术提供了一种文本处理方法,所述方法可以包括:
87.s110:获取待处理的文本图像以及与文本图像对应的高斯热力图。
88.本步骤中,当获取到待处理的文本图像后,紧接着,本技术可以获取与该文本图像
对应的高斯热力图,并通过高斯热力图来对文本图像中的文本进行调整。
89.可以理解的是,在非深度学习领域,热力图指的是简单地聚合大量数据,并使用一种渐进的色带来优雅地表现,以直观地展现空间数据的疏密程度或频率高低,而在深度学习领域,热力图则可以反映检测目标的位置。例如,在深度学习神经网络中,热力图有助于了解一张图像的哪一部分让深度学习神经网络做出了最终的分类决策。其中,热力图的产生有两种方式,一是高斯热力图,二是grad-cam产生的类激活热力图。本技术在对文本图像进行识别时,为了更好地区分文本图像中的文本区域以及非文本区域,从而使用文本图像对应的高斯热力图来对文本图像中的文本进行调整。
90.示意性地,如图2所示,图2为本技术实施例提供的不同识别场景下的文本图像对应的高斯热力图;由图2中左侧图像可知,本技术可以获取不同识别场景下的文本图像,如仓库中零部件对应的文本图像、产品信息对应的文本图像以及车牌照对应的文本图像等,由于不同识别场景下的文本图像中的背景存在显著的区别,为了使得后续在对文本进行识别时避免文本图像中背景的影响,本技术可以将获取到的文本图像生成对应的高斯热力图,通过高斯热力图来弱化文本图像中的背景,并凸显文本图像中的文本所在区域,如图2右侧图像可知,生成高斯热力图后,该高斯热力图中黑色区域为文本图像的背景对应的区域,高斯热力图中白色圆圈圈起来的区域则为文本图像中文本对应的区域,通过高斯热力图可以快速地获取文本图像中文本所在的区域。
91.进一步地,本技术的高斯热力图中包含目标文本区域,该目标文本区域为文本图像中待识别的目标文本对应的区域。可以理解的是,本技术利用准星定位作为基准位置,通过ocr识别组件来捕获文本图像中出现在视野(fov)中的若干个待识别的目标文本,并在生成文本图像对应的高斯热力图后,根据文本图像的目标文本对应的区域筛选出高斯热力图中的目标文本区域,这样可以避免对文本图像中其他干扰文本进行识别,从而有效提升ocr识别效率和识别精度。
92.s120:确定目标文本区域中的文本框以及文本框类型,文本框类型包括弯曲型文本框和直线型文本框,若文本框为弯曲型文本框,则执行s130,若文本框为直线型文本框,则执行s140。
93.本步骤中,通过s110获取到待处理的文本图像以及与文本图像对应的高斯热力图后,本技术可以确定目标文本区域中的文本框以及文本框类型,该文本框类型可以包括弯曲型文本框和直线型文本框,其中,弯曲型文本框可以是存在一个或多个弯曲弧度的文本框,当文本框存在多个弯曲弧度时,各个弯曲弧度可以相同,也可以不同;直线型文本框可以是任意角度的直线型文本框,在此不做限制。
94.另外,由于目标文本区域中可能存在一个或多个文本框,因此,本技术可以同时确定目标文本区域中的一个或多个文本框,以及每个文本框的文本框类型。
95.s130:按照文本框的弯曲程度对文本框进行分割,并依据分割后的文本框对文本图像中的文本进行裁剪并拼接,得到目标文本;
96.本步骤中,通过s120确定目标文本区域中的文本框以及文本框类型后,若文本框为弯曲型文本框,则可以按照文本框的弯曲程度来对文本框进行分割,并根据分割后的文本框对文本图像中的文本进行裁剪并拼接,从而得到目标文本。
97.如图2中第一个文本图像对应的高斯热力图,该高斯热力图中的文本框为弯曲型
文本框,针对这类弯曲型文本框,本技术可以按照该文本框的弯曲程度来对文本框进行分割,例如,可以将该文本框分割为多段类似直线的文本框,接着对文本图像中与每段文本框对应区域的文本进行裁剪,从而得到多个文本。由于得到的每一文本为不完整的文本,因此,本技术在得到多个文本后,可以将各个文本进行拼接,从而得到目标文本。
98.s140:依据目标文本区域中文本框的个数以及文本框在高斯热力图中的位置,对文本图像中相同位置处的的文本进行裁剪,得到目标文本。
99.本步骤中,通过s120确定目标文本区域中的文本框以及文本框类型后,若文本框为直线型文本框,则可以依据目标文本区域中文本框的个数以及文本框在高斯热力图中的位置,来对文本图像中相同位置处的文本进行裁剪,从而得到目标文本。
100.举例来说,当文本框为直线型文本框,且文本框的个数为一个时,本技术可以直接根据该文本框的位置来对文本图像中相同位置处的文本进行裁剪,而当文本框的个数为多个时,本技术则可以根据该文本框的位置,确定是否存在同处于一行的文本框,若存在,则可以将位于同一行的文本框进行合并,并根据合并后的文本框的位置来对文本图像中相同位置处的文本进行裁剪,这样既可以提高裁剪速度,又可以将不位于同一行的文本框单独进行裁剪,解决文本框中的大小字同处一行的问题。
101.上述实施例中,在对文本图像进行ocr识别之前,可以获取该文本图像及与该文本图像对应的高斯热力图,这样便可以滤除文本图像中与文本无关的背景,从而更方便对文本进行处理;当获取到高斯热力图后,由于该高斯热力图中包含有目标文本区域,因此,本技术可以仅确定目标文本区域中的文本框及文本框类型,无需关注高斯热力图中的其他区域,这样既可以精准矫正,又可以提升处理效率;当确定目标文本区域的文本框对应的文本框类型后,本技术还可以针对不同的文本框类型进行针对性的调整,例如,当文本框为弯曲型文本框时,可以按照该文本框的弯曲程度来对文本框进行分割,并根据分割后的文本框对文本图像中的文本进行裁剪并拼接,这样得到的目标文本既包含了原有的文本信息,又简化了文本的识别难度,从而有效提高文本识别准确率;而当文本框为直线型文本框时,本技术可以依据目标文本区域中文本框的个数以及各文本框在高斯热力图中的位置,来对文本图像中相同位置处的文本进行裁剪,例如,当文本框为一个时,可以直接对文本图像中与该文本框相同位置处的文本进行裁剪,而当文本框为多个时,可以判断是否存在位于同一行的文本框,若存在,则将位于同一行的文本框进行合并,并利用合并后的文本框对文本图像中的文本进行裁剪,这样不仅可以提高文本识别效率,还可以解决文本框中大小字同处一行的问题,进而有效提升文本识别准确率。
102.在一个实施例中,s120中确定所述目标文本区域中的文本框,可以包括:
103.s121:按照预设的二值化阈值对所述高斯热力图进行至少一次二值化操作后得到二值化图像,所述高斯热力图在进行两次以上二值化操作时,每次二值化操作采用的二值化阈值不同。
104.s122:确定所述二值化图像中位于所述目标文本区域的每一文字轮廓对应的最小外接矩形,并按照每一最小外接矩形在所述文本图像中对应的文本对各个最小外接矩形进行划分,得到文本框。
105.本实施例中,在确定目标文本区域中的文本框时,可以按照预设的二值化阈值对高斯热力图进行至少一个二值化操作后得到二值化图像,接着再确定二值化图像中位于目
标文本区域的每一文字轮廓对应的最小外接矩形,最后按照每一最小外接矩形在文本图像中对应的文本来对各个最小外接矩形进行划分,从而得到文本框,该文本框可以包含一个最小外接矩形,也可以包含多个最小外接矩形。
106.可以理解的是,对图像进行二值化操作时,选用的二值化阈值越大,图像中的单字框则越小,因此,本技术可以选用较大的二值化阈值来对高斯热力图进行二值化操作,当然,本技术也可以先选择较小的二值化阈值来对高斯热力图进行二值化操作,并判断得到的二值化图像中的单个字符是否被区分开,若无法将单个字符区分开,则继续选用较大的二值化阈值来对高斯热力图进行二值化操作,从而得到最终的二值化图像,该二值化图像中单个字符被区分开,使得后续判断文本框类型时的精确度较高。
107.具体地,本技术可以先对高斯热力图进行阈值0.4的二值化操作,并寻找二值化操作后的高斯热力图中各个字符对应的轮廓外接矩形,若此时得到的轮廓外接矩形涵盖了多个字符,则可以继续对高斯热力图进行阈值0.6的二值化操作,得到的二值化图像中每个文字区域为原始的文字区域约0.7倍文字大小,当得到二值化图像后,本技术可以寻找二值化图像中每个文字轮廓对应的最小外接矩形,最终得到一系列的方框。
108.进一步地,由于文本图像中的各个字符之间存在一定的时序性,且各个区域的字符大小也存在区别。例如,图2中表示日期的字符统一形成一行并构成单独的文本框,而表示产品是否合格的字符则单独形成一行,且两者之间的字符大小不同。因此,本技术可以根据每一最小外接矩形在文本图像中对应的文本来对各个最小外接矩形进行划分,从而得到一个或多个文本框,每一文本框中至少包含一个最小外接矩形,这样不仅有利于判断文本框类型,也有利于后续对文本进行识别。
109.在一个实施例中,所述目标文本区域中的文本框包含至少一个最小外接矩形;s120中确定所述目标文本区域中的文本框的文本框类型,可以包括:
110.s210:判断所述目标文本区域中的文本框所包含的最小外接矩形的个数是否超过预设个数值;若不超过,则执行s211,若超过,则执行s212。
111.s211:确定所述文本框为直线型文本框。
112.s212:根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型。
113.本实施例中,在确定目标文本区域中的文本框的文本框类型时,可以根据每一文本框中包含的最小外接矩形的个数来进行确定。
114.具体地,本技术可以先判断目标文本区域中的文本框所包含的最小外接矩形的个数是否超过预设个数值,若不超过,则该文本框为直线型文本框,若超过,则可以根据文本框中各个最小外接矩形的中点位置,来确定文本框的文本框类型。
115.可以理解的是,当某一线段较短时,可以近似看成为直线段,同理,当文本框中只包含一个或少数几个最小外接矩形时,也可以近似看成为直线型文本框,例如,当文本框中只包含一个或两个最小外接矩形时,可以将该文本框作为直线型文本框。而当文本框中包含的最小外接矩形的数目超过预设个数值时,则无法直接判断该文本框为直线型文本框还是弯曲型文本框,此时,可以根据该文本框中各个最小外接矩形的中点位置,来确定该文本框对应的文本框类型。
116.在一个实施例中,s212根据所述文本框中的各个最小外接矩形的中点位置,确定
所述文本框的文本框类型,可以包括:
117.s2121:按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线。
118.s2122:按照所述排列顺序,将所述两个相邻的最小外接矩形之后的最小外接矩形的中点,依次与所述两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线,得到至少一条测量直线。
119.s2123:判断所述基准直线与每一测量直线之间的夹角是否大于预设角度值;若至少一个夹角大于所述预设角度值,则执行s2124;若所有的夹角均不大于所述预设角度值,则执行s2125。
120.s2124:确定所述文本框为弯曲型文本型。
121.s2125:确定所述文本框为直线型文本框。
122.本实施例中,在根据文本框中各个最小外接矩形的中点位置来确定文本框的文本框类型时,可以先对文本框中各个最小外接矩形的中点位置进行排序,确定其排列顺序,接着可以将排列顺序最靠前的两个相邻的最小外接矩形的中点进行连线,并将连线后得到的直线段作为基准直线。
123.一般地,在对文本框中各个最小外接矩形的中心位置进行排序时,可以按照从左往右的顺序,也可以按照从右往左的顺序,还可以按照该文本框在二值化图像中的倾斜角度,将文本框中从一端至另一端的多个最小外接矩形的中心位置依次进行排序。排序时,可以按照各个最小外接矩形的中心位置的横坐标进行排序,也可以按照各个最小外接矩形的中心位置的纵坐标进行排序,在此不做限制。
124.当得到文本框中各个最小外接矩形的中点位置对应的排序顺序,并将排列顺序最靠前的两个相邻的最小外接矩形的中点进行连线,得到基准直线后,本技术还可以按照该排列顺序,将两个相邻的最小外接矩形之后的最小外接矩形的中点依次与这两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线,并得到至少一条测量直线。
125.举例来说,若文本框中包含5个最小外接矩形,将各个最小外接矩形进行排序后,将排序第一和第二的最小外接矩形的中点进行连线后得到基准直线,接着,将排序第三的最小外接矩形的中点与排序第二的最小外接矩形的中点进行连接,得到一条测量直线,将排序第四的最小外接矩形的中点与排序第二的最小外接矩形的中点进行连接,得到一条测量直线,将排序第五的最小外接矩形的中点与排序第二的最小外接矩形的中点进行连线,得到一条测量直线,这样便可以得到三条测量直线。
126.紧接着,当本技术通过上述方式获取到至少一条测量直线后,便可以判断基准直线与每一测量直线之间的夹角是否大于预设角度值,若至少一个夹角大于预设角度值,则表示该文本框为弯曲型文本框,若所有的夹角均不大于预设角度值,则表示该文本框为直线型文本框。
127.可以理解的是,本技术中的基准直线与测量直线相交后,可以形成不小于零度的夹角,当该夹角较小,且不大于预设角度值时,可以近似认为当前的测量直线对应的最小外接矩形与当前的测量直线之前的所有最小外接矩形所构成的文本框为直线型文本框,当文本框中所有的测量直线与基准直线之间的夹角均小于预设角度值时,则表示该文本框为直线型文本框;而一旦出现基准直线与测量直线之间的夹角大于预设角度值时,则表明当前
的测量直线对应的最小外接矩形与当前的测量直线之前的所有最小外接矩形所构成的文本框存在一定的弯曲,此时无需考虑后续的测量直线与基准直线之间的夹角是否大于预设角度值,即可直接认定当前的文本框为弯曲型文本框。
128.进一步地,这里的预设角度值可以依据实际情况进行设置,例如,预设角度值可以为3
°
、5
°
等,在此不做限制。
129.在一个实施例中,s130中按照所述文本框的弯曲程度对所述文本框进行分割,得到分割后的文本框,可以包括:
130.s131:获取首次判断所述夹角大于所述预设角度值时对应的测量直线。
131.s132:将该测量直线的两个端点中排列顺序靠后的端点对应的最小外接矩形作为第一最小外接矩形,以及将该测量直线的前一测量直线的两个端点中排序靠后的端点对应的最小外接矩形作为第二最小外接矩形。
132.s133:根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框。
133.s134:判断所述排列顺序靠后的最小外接矩形组成的文本框中最小外接矩形的个数;若所述最小外接矩形的个数为两个以下,则执行s135;若所述最小外接矩形的个数为至少三个,则执行s136。
134.s135:结束分割操作。
135.s136:将所述排列顺序靠后的最小外接矩形组成的文本框作为新的文本框,并返回执行s2121~s2125,以及s131~s134的步骤,直到结束分割操作为止,得到分割后的文本框。
136.本实施例中,在对弯曲型文本框进行分割时,可以按照文本框的弯曲程度来进行分割操作,从而得到分割后的文本框。
137.具体地,由于本技术在确定测量直线时主要是按照排列顺序将两个相邻的最小外接矩形之后的最小外接矩形的中点依次与这两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线。因此,每一测量直线所连接的最小外接矩形为两个,其中一个为排列顺序第二的最小外接矩形,另一个为排列顺序靠后的最小外接矩形。
138.因此,当本技术需要对弯曲型文本框进行分割时,可以获取首次判断的夹角大于预设角度值的测量直线,并将该测量直线的两个端点中排列顺序靠后的端点对应的最小外接矩形作为第一最小外接矩形,以及将该测量直线的前一测量直线的两个端点中排序靠后的端点对应的最小外接矩形作为第二最小外接矩形,即将与第一最小外接矩形相邻的排序靠前的最小外接矩形作为第二最小外接矩形,接着可以根据第一最小外接矩形与第二最小外接矩形之间的位置关系,对文本框进行分割,得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框。
139.进一步地,在得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框后,本技术可以继续判断排列顺序靠后的最小外接矩形组成的文本框中最小外接矩形的个数,并根据最小外接矩形的个数来确定是否结束分割操作。例如,当最小外接矩形的个数为两个以下,则表明该文本框为近似直线的文本框,因此,无需对该文本框继续进行分割操作,而当最小外接矩形的个数为至少三个时,则表明该
文本框可能为弯曲型文本框,若为弯曲型文本框,则需要继续根据该文本框的弯曲程度来对文本框进行分割,此时,可以将排列顺序靠后的最小外接矩形组成的文本框作为新的文本框,并返回执行s2121~s2125中确定文本框类型的步骤,以及在确定文本框为弯曲型文本框时,执行s131~s134中按照文本框的弯曲程度对文本框进行分割的步骤,直到结束分割操作为止,这样便可以得到分割后的文本框。
140.示意性地,如图3所示,图3为本技术实施例提供的对弯曲型文本框进行分割操作后得到的分割后的文本框的结构示意图;图3中的文本框为弯曲型文本框,对该文本框进行分割时,按照该文本框的弯曲程度将该文本框分割成三个独立的文本框,最终可以根据这三个文本框来对文本图像中的文本进行裁剪并拼接。
141.在一个实施例中,s133中根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,可以包括:
142.s1331:将所述第一最小外接矩形与所述第二最小外接矩形的中点进行连线,得到矩形连接线。
143.s1332:以所述矩形连接线的中点位置为原点,作平行于所述第二最小外接矩形的右侧矩形边的分割线,并根据所述分割线对所述文本框进行分割。
144.本实施例中,当得到第一最小外接矩形和第二最小外接矩形后,可以将第一最小外接矩形的中点与所述第二最小外接矩形的中点进行连线,并得到矩形连接线,接着可以以该矩形连接线的中点位置为原点,作平行于第二最小外接矩形的右侧矩形边的分割线,并根据该分割线对文本框进行分割,由此得到的文本框可以近似看做直线型文本框。
145.在一个实施例中,s130中依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本,可以包括:
146.s310:按照预设的膨胀倍数对所述分割后的文本框进行膨胀,得到膨胀后的文本框。
147.s311:根据所述膨胀后的文本框,对所述文本图像中相应区域的文本进行裁剪,得到多个初始文本。
148.s312:根据每个初始文本在所述文本图像中的排列顺序,对各个初始文本进行拼接,得到目标文本。
149.本实施例中,依据分割后的文本框对文本图像中的文本进行裁剪并拼接时,可以按照预设的膨胀倍数对分割后的文本框进行膨胀,并得到膨胀后的文本框,接着,可以根据膨胀后的文本框,对文本图像中相应区域的文本进行裁剪,从而得到多个初始文本,最后根据每个初始文本在文本图像中的排列顺序,再对各个初始文本进行拼接,从而得到目标文本。
150.需要说明的是,在确定目标文本区域中的文本框的过程中,该文本框并不一定能够与文本图像中的文字区域完全对应,可能只是该文字区域的中心区域。例如,当本技术使用二值化阈值来对高斯热力图进行二值化操作,得到二值化图像,并寻找二值化图像中与文字轮廓对应的最小外接矩形时,为了得到每一文字轮廓对应的最小外接矩形,故而选用较大的二值化阈值来对高斯热力图进行二值化操作,这样得到的最小外接矩形则可能为文本图像中对应文字区域的中央部分,因此,在依据分割后的文本框对文本图像中的文本进行裁剪并拼接时,可以按照预设的膨胀倍数对分割后的文本框进行膨胀,这样得到的膨胀
后的文本框可以与文本图像中的文字区域完全对应,通过该种方式进行处理后,可以保证得到的初始文本为完整的文本,从而有利于后续进行文本识别。
151.举例来说,当本技术对高斯热力图进行阈值0.6的二值化操作后,得到二值化图像中的每一最小外接矩形只包含了文字中央部分,此时可以选用1.6倍的膨胀系数对文本框进行膨胀,该膨胀后的文本框刚好可以框住文本图像中对应的文本区域中的文字。
152.进一步地,当得到多个初始文本后,由于该初始文本为分割后的文本,而为了得到完整的文本,本技术可以按照每个初始文本在文本图像中的排列顺序来对各个初始文本进行拼接,从而得到目标文本。
153.在一个实施例中,s140中依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本,可以包括:
154.s141:当所述文本框为一个时,依据所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本。
155.s142:当所述文本框为多个时,依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框;若存在,则执行s143,若不存在,则执行s144。
156.s143:将位于同一行的文本框进行合并,并根据合并后的文本框对所述文本图像中的文本进行裁剪,得到目标文本。
157.s144:按照每一文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本。
158.本实施例中,当文本框类型为直线型文本框时,可以根据文本框的个数以及文本框在高斯热力图中的位置,来对文本图像中相同位置处的文本进行裁剪,从而得到目标文本。
159.在一种具体的实现方式中,当目标文本区域的文本框为一个时,则可以直接根据该文本框在高斯热力图中的位置来对文本图像中相同位置处的文本进行裁剪,从而得到目标文本;而当目标文本区域的文本框为多个时,则可以依据各个文本框在高斯热力图中的位置,来确定是否存在位于同一行的文本框,若存在,则将位于同一行的文本框进行合并,接着根据合并后的文本框对文本图像中的文本进行裁剪,得到目标文本,若不存在,则可以按照每一文本框在高斯热力图中的位置对文本图像中相同位置处的文本进行裁剪,得到目标文本。
160.在一个实施例中,s142中依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框,可以包括:
161.s1421:在各个文本框中选取任意两个文本框,并确定选取的所述任意两个文本框在所述高斯热力图中的位置。
162.s1422:根据所述任意两个文本框在所述高斯热力图中的位置,确认所述任意两个文本框是否位于同一行,得到确认结果。
163.s1423:判断各个文本框是否均被选取过;若是,则执行s1424;若否,则执行s1425。
164.s1424:根据所述确认结果确定是否存在位于同一行的文本框。
165.s1425:继续在各个文本框中选取任意两个文本框,当本次所选取的任意两个文本框与前一次所选取的任意两个文本框中存在一个不同的文本框时,返回执行s1421~s1423
的步骤,直到各个文本框均被选取过为止。
166.本实施例中,当目标文本区域的文本框存在多个,且每一文本框均为直线型文本框时,本技术可以在各个文本框中选取任意两个文本框,并确定这两个文本框在高斯热力图中的位置,接着可以根据这两个文本框在高斯热力图中的位置来确认这两个文本框是否位于同一行,并得到确认结果,此时,可以判断各个文本框是否均被选取过,若是,则无需再次确认是否存在位于同一行的文本框,直接根据当前的确认结果来确定是否存在位于同一行的文本框即可;若否,则表明存在未被选取过的文本框,此时,可以继续在各个文本框中选取任意两个文本框,并且,本次选取的任意两个文本框与上一次选取的任意两个文本框中至少存在一个不同的文本框,当选取任意两个文本框后,可以继续确定这两个文本框是否位于同一行,直到所有的文本框均被选取过为止。
167.在一个实施例中,s1422中根据所述任意两个文本框在所述高斯热力图中的位置,确认所述任意两个文本框是否位于同一行,可以包括:
168.s4221:根据所述任意两个文本框在所述高斯热力图中的位置,确定各个文本框在所述高斯热力图中的第一倾角,以及对各个文本框的中点进行连线后得到的中点线在所述高斯热力图中的第二倾角。
169.s4222:根据所述第一倾角和所述第二倾角,初步判断所述任意两个文本框是否位于同一行;若是,则执行s4223。
170.s4223:根据所述任意两个文本框在所述高斯热力图中的位置,确定其中一个文本框在所述高斯热力图中的上边缘直线和下边缘直线,以及另一个文本框的中点在所述上边缘直线与所述下边缘直线之间的垂线。
171.s4224:根据所述上边缘直线、所述下边缘直线以及所述上边缘直线与所述下边缘直线之间的垂线,最终判断所述任意两个文本框是否位于同一行。
172.本实施例中,在确认目标文本区域中任意两个文本框是否位于同一行时,本技术可以先分别确定这两个文本框在高斯热力图中的第一倾角,以及对两个文本框的中点进行连线后得到的中点线在高斯热力图中的第二倾角,接着根据第一倾角和第二倾角来初步判断这两个文本框是否位于同一行,若初步判断结果为位于同一行,则可以根据这两个文本框在高斯热力图中的位置,来确定其中一个文本框在高斯热力图中的上边缘直线和下边缘直线,以及另一个文本框的中点在上边缘直线与下边缘直线之间的垂线,接着根据上边缘直线、下边缘直线以及上边缘直线与下边缘直线之间的垂线,最终判断这两个文本框是否位于同一行。
173.在一种具体的实现方式中,可参见图4,图4为本技术实施例提供的初步确认两个文本框是否位于同一行的结构示意图;图4中,以图像的左上角为原点,向右为x正向,向下为y正向给定坐标系,计算出图像中两个文本框的上下边的旋转角度,范围为(0,180)度,接着,本技术可以根据上边和下边的旋转角均值确定为文本框的旋转角度,如图4所示的l1,l2分别为两个文本框的倾斜角度直线,l3为两个文本框的中点连线得到的中点线,将该中点线对应的第二倾角和两个文本框各自的第一倾角分别进行差值计算,取相差较小的角度值进行判断,如果该角度值达到5度并且达到两个文本框的第一倾角之间的差值的1.2倍,则认为两文本框一定不在一行,否则进行下一步。
174.进一步地,如图5所示,图5为本技术实施例提供的最终确认两个文本框是否位于
同一行的结构示意图;本技术在初步判断当前的两个文本框位于同一行后,还可以通过另一种方式来进一步判断两个文本框是否位于同一行,这样既可以避免初步判断出错的情况,又可以将位于同一行的文本框进行合并,提高文本识别效率。如图5所示,本技术可以取其中一个文本框的上边缘直线l1:y=k1x b1和下边缘线l2:y=k2x b2,接着计算另一个文本框的中心点(x0,y0)到上边缘l1的垂线l3,与l1交点坐标简记为(x1,y1),再计算l3与下边缘线l2交点坐标简记为(x2,y2),最后判断(x
2-x0)(x
1-x0) (y
2-y0)(y
1-y0)是否大于0,如果小于0,则说明左侧文本框的中心点介于右侧文本框的上下边缘线之间,如果大于0,则说明左侧文本框的中心点不在右侧文本框的上下边缘线之间,从而断定两个文本框是否处于同一行。
175.在一个实施例中,s143中将位于同一行的文本框进行合并,得到合并后的文本框,可以包括:
176.s1431:将所述高斯热力图中位于同一行的文本框以及不位于同一行的文本框分别进行标记,得到由各个标记后的文本框构成的连通图。
177.s1432:通过dfs遍历所述连通图,并根据遍历结果确定所述连通图中的连通单元,所述连通单元为合并后的文本框。
178.本实施例中,当确定目标文本区域中位于同一行的文本框后,可以将位于同一行的文本框进行合并,在合并过程中,可以将高斯热力图中位于同一行的文本框以及不位于同一行的文本框分别进行标记,从而得到由标记后的文本框构成的连通图,接着,本技术可以通过dfs遍历该连通图,并根据遍历结果确定连通图中的连通单元,该连通单元则为位于同一行的合并后的文本框,通过将位于同一行的文本框进行合并,可以显著提高文本识别效率和识别精度。
179.在一个实施例中,s143中将位于同一行的文本框进行合并之前,还可以包括:
180.s430:确定位于同一行的各个文本框的宽高比。
181.s431:将每一文本框的宽高比与预设的宽高比区间进行比对,若至少一个文本框的宽高比不在所述宽高比区间,则对所述至少一个文本框的倾斜角度进行矫正。
182.本实施例中,在判断两个文本框是否处于同一行之后,需要对同一行文本进行合并处理,这时可能会遇到一些其他问题,例如,一两个字单独构成的文本框,由于该类文本框的宽高相差不大,虽完整框住了文字,但是角度经常出现倾斜现象,如图5左侧文本框所示,该文本框虽然与右侧文本框位于同一行,但该文本框有明显的角度倾斜,这样不利于后续的文本识别。
183.因此,本技术在对位于同一行的文本框进行合并之前,可以确定位于同一行的各个文本框的宽高比,并将每一文本框的宽高比与预设的宽高比区间进行比对,若至少一个文本框的宽高比不在该宽高比区间,则对至少一个文本框的倾斜角度进行矫正。
184.举例来说,本技术可以先判断位于同一行的各个文字框的宽高比,如果存在至少一个文本框的宽高比小于大于0.5且小于2,那么便可以判断此文本框的倾斜角度有误差,
此时可以对该文本框的倾斜角度进行矫正。
185.在一个实施例中,s431中对所述至少一个文本框的倾斜角度进行矫正,可以包括:
186.s4311:选取所述高斯热力图中框体长度最长的文本框作为基准文本框。
187.s4312:按照所述基准文本框在所述高斯热力图中的倾斜角度,对所述至少一个文本框的倾斜角度进行矫正。
188.本实施例中,当检测到位于同一行的文本框中存在宽高比不在宽高比区间的文本框时,即,位于同一行的文本框中存在倾斜角度有误差的文本框时,可以对该文本框的倾斜角度进行矫正。矫正过程中,可以先选取高斯热力图中框体长度最长的文本框作为基准文本框,并按照该基准文本框在高斯热力图中的倾斜角度,来对该文本框的倾斜角度进行矫正。
189.进一步地,本技术在高斯热力图中选取基准文本框时,还可以选取距离该文本框最近的文本框作为基准文本框,也可以选取与该文本框位于同一行的其他文本框作为基准文本框,具体可视实际情况进行选取,在此不做限制。
190.在一个实施例中,s110中获取与所述文本图像对应的高斯热力图,可以包括:
191.将所述文本图像输入至预先配置的深度学习检测模型中,得到所述深度学习检测模型输出的与所述文本图像对应的高斯热力图。
192.其中,所述深度学习检测模型是以多组训练文本图像以及对多组训练文本图像进行数据扩充后得到的扩充图像作为训练样本,以每组训练文本图像以及扩充图像对应的真实高斯热力图为样本标签进行训练得到的。
193.本实施例中,在获取与文本图像对应的高斯热力图时,可以选用预先配置的深度学习检测模型,并利用该深度学习检测模型来得到高斯热力图。
194.具体地,本技术中的深度学习检测模型被配置为:以多组训练文本图像和每组训练图像进行数据扩充后的扩充图像为训练数据,以每组训练文本图像和扩充图像对应的真实高斯热力图为训练样本进行训练的。在数据扩充环节,本技术可以对采集的多组训练文本图像分别进行360度的旋转操作,同时随机对训练文本图像进行像素值反转操作,使得初始深度学习检测模型在利用训练样本进行训练时,能够学习到不同的训练样本中所包含的文字信息,从而得到更为准确的预测结果。
195.下面对本技术实施例提供的文本处理装置进行描述,下文描述的文本处理装置与上文描述的文本处理方法可相互对应参照。
196.在一个实施例中,如图6所示,图6为本技术实施例提供的一种文本处理装置的结构示意图;本技术还提供了一种文本处理装置,可以包括图像获取模块210、文本框确定模块220、第一处理模块230、第二处理模块240,具体包括如下:
197.图像获取模块210,用于获取待处理的文本图像以及与所述文本图像对应的高斯热力图,所述高斯热力图中包含目标文本区域。
198.文本框确定模块220,用于确定所述目标文本区域中的文本框以及文本框类型,所述文本框类型包括弯曲型文本框和直线型文本框。
199.第一处理模块230,用于若所述文本框为弯曲型文本框,则按照所述文本框的弯曲程度对所述文本框进行分割,并依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本。
200.第二处理模块240,用于若所述文本框为直线型文本框,则依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的的文本进行裁剪,得到目标文本。
201.上述实施例中,在对文本图像进行ocr识别之前,可以获取该文本图像及与该文本图像对应的高斯热力图,这样便可以滤除文本图像中与文本无关的背景,从而更方便对文本进行处理;当获取到高斯热力图后,由于该高斯热力图中包含有目标文本区域,因此,本技术可以仅确定目标文本区域中的文本框及文本框类型,无需关注高斯热力图中的其他区域,这样既可以精准矫正,又可以提升处理效率;当确定目标文本区域的文本框对应的文本框类型后,本技术还可以针对不同的文本框类型进行针对性的调整,例如,当文本框为弯曲型文本框时,可以按照该文本框的弯曲程度来对文本框进行分割,并根据分割后的文本框对文本图像中的文本进行裁剪并拼接,这样得到的目标文本既包含了原有的文本信息,又简化了文本的识别难度,从而有效提高文本识别准确率;而当文本框为直线型文本框时,本技术可以依据目标文本区域中文本框的个数以及各文本框在高斯热力图中的位置,来对文本图像中相同位置处的文本进行裁剪,例如,当文本框为一个时,可以直接对文本图像中与该文本框相同位置处的文本进行裁剪,而当文本框为多个时,可以判断是否存在位于同一行的文本框,若存在,则将位于同一行的文本框进行合并,并利用合并后的文本框对文本图像中的文本进行裁剪,这样不仅可以提高文本识别效率,还可以解决文本框中大小字同处一行的问题,进而有效提升文本识别准确率。
202.在一个实施例中,本技术还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述文本处理方法的步骤。
203.在一个实施例中,本技术还提供了一种计算机设备,包括:一个或多个处理器,以及存储器。
204.所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述文本处理方法的步骤。
205.示意性地,如图7所示,图7为本技术实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图7,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的文本处理方法。
206.计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(i/o)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如windows server tm、mac os xtm、unix tm、linux tm、free bsdtm或类似。
207.本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
208.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将
一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
209.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
210.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献