一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像样本生成方法、文本识别方法、装置、设备和介质与流程

2022-04-30 14:06:53 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域,尤其涉及深度学习技术和计算机视觉技术。更具体地,本公开提供了一种图像样本生成方法、文本识别方法、装置、电子设备和存储介质。


背景技术:

2.可以利用深度学习模型对印刷体的文本进行文本识别。然而,针对手写体的文本,可以利用人工方式进行文本识别。


技术实现要素:

3.本公开提供了一种图像样本生成方法、文本识别方法、装置、设备以及存储介质。
4.根据第一方面,提供了一种图像样本生成方法,该方法包括:根据至少一个手写体样本图像,生成手写体文本图像;以及根据所述手写体文本图像和背景图像,生成具有标注框的目标样本图像,其中,所述标注框用于表征所述手写体文本图像在所述背景图像中所处的区域。
5.根据第二方面,提供了一种文本识别方法,该方法包括:利用检测模型对文本图像进行目标检测,得到具有检测框的文本图像,其中,所述检测框用于表征所述文本图像中的文本所处的区域;对所述具有检测框的文本图像进行分割,得到待识别图像;以及根据所述待识别图像,进行文本识别,得到所述文本图像中的文本,其中,所述检测模型是根据多个本公开提供的方法生成的样本图像进行训练得到的。
6.根据第三方面,提供了一种图像样本生成装置,该装置包括:第一生成模块,用于根据至少一个手写体样本图像,生成手写体文本图像;以及第二生成模块,用于根据所述手写体文本图像和背景图像,生成具有标注框的目标样本图像,其中,所述标注框用于表征所述手写体文本图像在所述背景图像中所处的区域。
7.根据第四方面,提供了一种文本识别装置,该装置包括:检测模块,用于利用检测模型对文本图像进行目标检测,得到具有检测框的文本图像,其中,所述检测框用于表征所述文本图像中的文本所处的区域;分割模块,用于对所述具有检测框的文本图像进行分割,得到待识别图像;以及识别模块,用于根据所述待识别图像,进行文本识别,得到所述文本图像中的文本,其中,所述检测模型是根据多个本公开提供的装置生成的样本图像进行训练得到的。
8.根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
9.根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
10.根据第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.附图用于更好地理解本方案,不构成对本公开的限定。其中:
13.图1是根据本公开的一个实施例的可以应用图像样本生成方法和文本识别方法的示例性系统架构示意图;
14.图2是根据本公开的一个实施例的图像样本生成方法的流程图;
15.图3a是根据本公开的一个实施例的手写体样本图像的示意图;
16.图3b是根据本公开的一个实施例的手写体文本图像的示意图;
17.图3c是根据本公开的一个实施例的倾斜的手写体文本图像的示意图;
18.图3d是根据本公开的一个实施例的背景图像的示意图;
19.图3e是根据本公开的一个实施例的目标样本图像的示意图;
20.图4是根据本公开的一个实施例的文本识别方法的流程图;
21.图5是根据本公开的一个实施例的识别图像样本的示意图;
22.图6a是根据本公开的一个实施例的检测模型的原理图;
23.图6b是根据本公开的一个实施例的识别模型的原理图;
24.图7是根据本公开的一个实施例的图像样本生成装置的框图;
25.图8是根据本公开的一个实施例的文本识别装置的框图;以及
26.图9是根据本公开的一个实施例的可以应用图像样本生成方法和/或文本识别方法的电子设备的框图。
具体实施方式
27.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
28.手写体的文本字迹变化多样,没有统一的样式。可以利用人工对手写体的文本进行识别,但需要较高的人力成本。也可以利用深度学习模型对手写体的文本进行识别,但对应手写体的文本的图像样本较少,难以有效地训练的深度学习模型。
29.图1是根据本公开的一个实施例的可以应用图像样本生成方法和文本识别方法的示例性系统架构示意图。
30.需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
31.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
32.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发
送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
33.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
34.需要说明的是,本公开实施例所提供的图像样本生成方法和/或文本识别方法一般可以由服务器105执行。相应地,本公开实施例所提供的图像样本生成装置和/或文本识别装置一般可以设置于服务器105中。本公开实施例所提供的图像样本生成方法和/或文本识别方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的图像样本生成方法和/或文本识别装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
35.图2是根据本公开的一个实施例的图像样本生成方法的流程图。
36.如图2所示,该方法200可以包括操作s210至操作s220。
37.在操作s210,根据至少一个手写体样本图像,生成手写体文本图像。
38.例如,手写体样本图像可以是一个手写体文字的图像。
39.例如,手写体文本图像可以是与预设文本序列对应的手写体文本的图像。在一个示例中,预设文本序列可以为“赵某昨日前往外地”。与该预设文本序列对应的手写体文本图像可以是根据8个手写体样本图像生成的。
40.在操作s220,根据手写体文本图像和背景图像,生成具有标注框的目标样本图像。
41.在本公开实施例中,标注框可以表征手写体文本图像在背景图像中所处的区域。
42.例如,背景图像可以是对应一个视频帧的图像。
43.例如,可以根据标注框、手写体文本图像和背景图像,进行图像合成,以生成目标样本图像。在一个示例中,可以根据对应文本序列“赵某昨日前往外地”的手写体文本图像、该图像的标注框和背景图像,进行图像合成,得到一个目标样本图像。
44.通过本公开实施例,生成了大量具有标注框的样本图像,使得根据这些样本图像训练得到的检测模型可以高效地检测出手写体文本。
45.通过本公开实施例,可以生成大量的用于训练检测模型的样本图像,以提高检测模型的训练效果。例如,将样本图像输入检测模型,可以得到具有检测框的样本图像。该检测框可以表征样本图像中的文本所处的区域。在一个示例中,检测模型可以是dbnet(differentiable binarization network,可微二值化网络)模型。
46.在一些实施例中,根据手写体文本图像和背景图像,生成具有标注框的目标样本图像包括:将倾斜的手写体文本图像添加至背景图像中;根据倾斜的手写体文本图像,生成标注框;根据标注框,生成目标样本图像。
47.例如,倾斜的手写体文本图像是对手写体文本图像进行旋转得到的。
48.在一个示例中,可以按照倾斜角度对手写体文本图像进行旋转。
49.在一个示例中,倾斜角度的取值范围可以是-90
°
至90
°

50.在一个示例中,可以随机生成一个倾斜角度,以便对手写体文本图像进行旋转。在
一个示例中,以倾斜角度为30
°
为示例。可以基于手写体文本图像的左上顶点,顺时针进行旋转30
°
,得到倾斜的手写体文本图像。
51.例如,可以通过各种方式将倾斜的手写体文本图像添加至背景图像中。
52.在本公开实施例中,标注框可以表征倾斜的手写体文本图像在背景图像中所处的区域。
53.例如,可以根据倾斜角度,确定标注框的宽度方向与背景图像的宽度方向之间的夹角。在一个示例中,以倾斜角度为30
°
为示例。标注框的宽度方向与背景图像的宽度方向之间的夹角也可以为30
°
。接下来,可以确定标注框的宽度和高度,使得标注框确定的区域大于或等于倾斜的手写体文本图像所处的区域。生成了大量具有倾斜标注框的样本图像,使得根据这些样本图像训练得到的检测模型可以高效地检测出倾斜的手写体文本。
54.在一些实施例中,将倾斜的手写体文本图像添加至背景图像中包括:确定目标像素;以及根据目标像素和处于倾斜的手写体文本图像中的预设像素,将倾斜的手写体文本图像添加至背景图像中。
55.例如,目标像素处于背景图像中。
56.例如,可以随机确定背景图像中的一个像素为目标像素。
57.例如,预设像素可以是对应手写体文本图像的左上顶点的像素。
58.例如,在将倾斜的手写体文本图像添加至背景图像之后,预设像素与目标像素重叠。预设像素在背景图像的坐标可以是目标像素的坐标。
59.在一些实施例中,根据倾斜的手写体文本图像,生成标注框包括:根据手写体样本属性,确定手写体文本图像的宽度和高度;根据目标像素的坐标、倾斜的手写体文本图像的倾斜角度、手写体文本图像的宽度和高度,确定标注框的顶点坐标;以及根据标注框的顶点坐标,生成标注框。
60.例如,手写体样本属性可以包括手写体样本图像的宽度和高度。在一个示例中,每个手写体样本图像的高度可以是相同的,而每个手写体样本图像的宽度可以是不同的。基于此,手写体文本图像的高度可以是手写体样本图像的高度。手写体文本图像的宽度可以是多个手写体样本图像的宽度之和。
61.例如,在确定了手写体文本图像的宽度和高度之后,结合目标像素的坐标和倾斜角度,可以确定标注框的顶点坐标。在一个示例中,可以根据目标像素的坐标、倾斜角度、手写体文本图像的宽度、手写体文本图像的高度、余弦函数和正弦函数,可以确定标注框的至少3个顶点坐标。进而可以根据3个顶点坐标确定标注框。比如,根据3个顶点坐标和目标像素的坐标确定标注框。
62.在一些实施例中,根据至少一个手写体样本图像,生成手写体文本图像包括:根据预设文本序列,确定至少一个手写体样本图像;以及根据至少一个手写体样本图像和手写体样本属性,生成手写体文本图像。
63.例如,手写体样本属性包括手写体样本图像的高度和宽度。
64.例如,可以获取与预设文本序列对应的手写体样本图像,以确定至少一个手写体样本图像。
65.例如,手写体样本属性还可以包括手写体样本的颜色和手写体样本的旋转角度。旋转角度可以指手写体样本具有的角度。在一个示例中,以手写体样本的颜色为黑色且旋
转角度为10
°
为示例。在获取至少一个手写体样本图像后,将每个手写体样本图像的字体颜色调整为黑色,并将每个手写体样本图像旋转10
°
。接下来,可以根据预设文本序列中文字的顺序,生成手写体文本图像。
66.图3a是根据本公开的一个实施例的手写体样本图像的示意图。
67.如图3a所示,该手写体样本图像301与文字“赵”对应。
68.图3b是根据本公开的一个实施例的手写体文本图像的示意图。
69.如图3b所示,该手写体文本图像302与预设文本序列“赵某昨日前往外地”对应。手写体文本图像302包含预设像素303,该预设像素303可以是对应手写体文本图像302的左上顶点的像素。
70.图3c是根据本公开的一个实施例的倾斜的手写体文本图像的示意图。
71.如图3c所示,倾斜的手写体文本图像304可以是根据15
°
的倾斜角度对例如图3b中的手写体文本图像进行旋转得到的。
72.图3d是根据本公开的一个实施例的背景图像的示意图。
73.如图3d所示,背景图像305可以是来自一个社交网站上的图像。可以将背景图像305上的像素306确定为目标像素。
74.图3e是根据本公开的一个实施例的目标样本图像的示意图。
75.如图3e所示,可以将例如图3c所示的倾斜的手写体样本图像304添加至例如图3d所示的背景图像305中。在添加了倾斜的手写体样本图像的背景图像中,预设像素303与像素306可以重合。可以根据像素306的坐标、倾斜角度(例如15
°
)、手写体文本图像302的宽度和高度,确定标注框的顶点坐标。再根据标注框的顶点坐标,得到标注框307。接下来,可以根据标准框307、倾斜的手写体文本图像304和背景图像305,得到目标样本图像308。
76.在一些实施例中,可以获取多个手写体样本图像,生成手写体样本库;可以获取多个背景图像,生成背景图像库;可以获取多个预设文本序列,生成文本库。
77.例如,在执行例如方法200中的操作s210之前,可以先从文本库中随机获取一个预设文本序列,再从背景图像库中获取一个背景图像。再根据该预设文本序列,从手写体样本库确定至少一个手写体样本图像。之后,可以执行操作s210。
78.图4是根据本公开的一个实施例的文本识别方法的流程图。
79.如图4所示,该方法400可以包括操作s410至操作s430。
80.在操作s410,利用检测模型对文本图像进行目标检测,得到具有检测框的文本图像。
81.例如,检测框用于表征文本图像中的文本所处的区域。
82.例如,检测模型是根据多个本公开提供的方法生成的样本图像进行训练得到的。
83.在操作s420,对具有检测框的文本图像进行分割,得到待识别图像。
84.在本公开实施例中,可以根据检测框,对带有检测框的文本图像进行切分,得到包含检测框的局部文本图像。
85.例如,可以根据检测框,确定检测框的外接矩形。该外接矩形的宽度方向与文本图像的宽度方向平行,该外接矩形的高度方向与文本图像的高度方向平行。可以根据该外接矩形,进行切分,得到包含检测框的局部文本图像。
86.在本公开实施例中,对局部文本图像进行仿射变换,得到变换后的图像。
87.例如,仿射变换是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”和“平行性”。平直性可以是指变换后直线还是直线,不会打弯;变换后圆弧还是圆弧。平行性可以是指保持二维图形间的相对位置关系不变,两个平行线变换后还是平行线,两个相交直线的交角在变换后保持不变。仿射变换可以通过平移、缩放、翻转、旋转、剪切等方式实现。
88.在本公开实施例中,对变换后的图像进行二值化处理,得到待识别图像。
89.例如,变换后的图像中包含背景和文本。可以通过各种方式,将对应背景的像素的像素值设为0,将对应文本的像素的像素值设为255,以得到待识别图像。
90.在操作s430,根据待识别图像,进行文本识别,得到文本图像中的文本。
91.例如,可以利用识别模型进行文本识别。
92.通过本公开实施例,对检测模型输出的具有检测框的文本图像进行了分割,去除了大量的背景信息,可以提高文本识别的准确率。
93.在一些实施例中,识别模型是根据多个识别图像样本进行训练得到的。例如,可以根据手写体文本图像,利用textrenderer(文本渲染器)模型添加随机噪音信息,得到识别图像样本。
94.图5是根据本公开一个实施例的识别图像样本的示意图。
95.如图5所示,识别图像样本中的文本可以与例如图3e中的目标样本图像中的文本不同。
96.可以理解,检测模型和识别模型是分别进行训练的。
97.图6a是根据本公开的一个实施例的检测模型的原理图。
98.如图6a所示,检测模型610可以包括第一特征提取网络611。例如,第一特征提取网络可以是轻量级的特征提取网络,例如可以是shufflenet(shuffle网络)v2。
99.第一特征提取网络可以对文本图像601进行处理,输出第一特征图602。接下来,根据第一特征图602,可以得到概率图603和阈值图604。根据概率图603和阈值图604,可以得到近似二值图605。例如,第一特征图602中每个特征值对应概率图603中一个概率值,也对应阈值图604中一个阈值,也对应近似二值图605中的一个像素值。在一个示例中,针对一个特征值feat_i,若对应该特征值feat_i的概率值prob_i大于或等于对应该特征值feat_i的阈值th_i,则对应该特征值的像素值pix_i为255。在一个示例中,针对另一个特征值feat_j,若对应该特征值feat_j的概率值prob_j小于对应该特征值的阈值th_j,则对应该特征值feat_j的像素值pix_j为0。采用类似的方式,可以根据概率图603和阈值图604,可以得到近似二值图605中的每个像素值。
100.接下来,可以根据近似二值图605,得到具有检测框的文本图像606。检测模型中采用了轻量级的特征提取网络,可以提高检测效率。同时,利用概率图和阈值图进行处理,可以提高检测的准确率。
101.在一些实施例中,对具有检测框的文本图像606进行分割,可以得到待识别图像。
102.图6b是根据本公开的一个实施例的识别模型的原理图。
103.如图6b所示,识别模型620可以包括第二特征提取网络621、lstm(long and short term memory,长短时记忆)编码器622、lstm解码器623和注意力网络624。
104.第二特征提取网络621可以是轻量级的特征提取网络,例如可以是mobilenet
(mobile网络)。第二特征提取网络621可以对待识别图像607进行处理,输出第二特征图608。第二特征图608可以分别输入lstm编码器622和注意力网络624。
105.lstm编码器622可以包括256个lstm编码层,每个lstm编码层用于对输入的特征进行编码。lstm解码器623可以包括32个lstm解码层,每个lstm解码层用于对输入的特征进行解码。lstm解码器623的输出可以是权重矩阵m1。
106.注意力网络624可以是根据2d attention(二维注意力机制)构建的。注意力网络624可以根据第二特征图624和权重矩阵m_1,输出权重矩阵m_2。lstm解码器623再根据权重矩阵m_1和权重矩阵m_2,输出目标权重矩阵m。在一个示例中,lstm解码器623可以将权重矩阵m_1和权重矩阵m_2相加,输出目标权重矩阵m。
107.可以根据目标权重矩阵m,得到文本图像中的文本609。识别模型采用了轻量级的特征提取网络,并且降低了编码器和解码器的参数量,可以进一步提高模型的效率。
108.图7是根据本公开的一个实施例的图像样本生成装置的框图。
109.如图7所示,该装置700可以包括第一生成模块710和第二生成模块720。
110.第一生成模块710,用于根据至少一个手写体样本图像,生成手写体文本图像。
111.第二生成模块720,用于根据所述手写体文本图像和背景图像,生成具有标注框的目标样本图像。例如,所述标注框用于表征所述手写体文本图像在所述背景图像中所处的区域。
112.在一些实施例中,所述第二生成模块包括:添加子模块,用于将所述倾斜的手写体文本图像添加至背景图像中,其中,所述倾斜的手写体文本图像是对所述手写体文本图像进行旋转得到的;第一生成子模块,用于根据所述倾斜的手写体文本图像,生成所述标注框;以及第二生成子模块,用于根据所述标注框,生成所述目标样本图像。
113.在一些实施例中,所述添加子模块包括:第一确定单元,用于确定目标像素。例如,所述目标像素处于所述背景图像中。添加单元,用于根据所述目标像素和处于所述倾斜的手写体文本图像中的预设像素,将所述倾斜的手写体文本图像添加至所述背景图像中。
114.在一些实施例中,所述第一生成子模块包括:第二确定单元,用于根据手写体样本属性,确定所述手写体文本图像的宽度和高度。例如,所述手写体样本属性包括所述手写体样本图像的高度和宽度。第三确定单元,用于根据所述目标像素的坐标、所述倾斜的手写体文本图像的倾斜角度、所述手写体文本图像的宽度和高度,确定所述标注框的顶点坐标。第一生成单元,用于根据所述标注框的顶点坐标,生成所述标注框。
115.在一些实施例中,所述第一生成模块包括:第一确定子模块,用于根据预设文本序列,确定所述至少一个手写体样本图像。第三生成子模块,用于根据所述至少一个手写体样本图像和手写体样本属性,生成手写体文本图像。例如,所述手写体样本属性包括所述手写体样本图像的高度和宽度。
116.在一些实施例中,所述第二生成子模块包括:第二生成单元,用于根据所述标注框、所述倾斜的手写体文本图像和所述背景图像,生成所述目标样本图像。
117.图8是根据本公开的另一个实施例的文本识别装置的框图。
118.如图8所示,该装置800可以包括检测模块810、分割模块820和识别模块830。
119.检测模块810,用于利用检测模型对文本图像进行目标检测,得到具有检测框的文本图像。例如,所述检测框用于表征所述文本图像中的文本所处的区域。
120.分割模块820,用于对所述具有检测框的文本图像进行分割,得到待识别图像。
121.识别模块830,用于根据所述待识别图像,进行文本识别,得到所述文本图像中的文本。
122.例如,所述检测模型是根据多个本公开提供的所述的装置生成的样本图像进行训练得到的。
123.在一些实施例中,所述分割模块包括:切分子模块,用于根据所述检测框,对所述带有检测框的文本图像进行切分,得到包含所述检测框的局部文本图像。仿射变换子模块,用于对所述局部文本图像进行仿射变换,得到变换后的图像。二值化处理子模块,用于对所述变换后的图像进行二值化处理,得到所述待识别图像。
124.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
125.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
126.图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
127.如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
128.设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
129.计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如图像样本生成方法和/或文本识别方法。例如,在一些实施例中,图像样本生成方法和/或文本识别方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的图像样本生成方法和/或文本识别方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像样本生成方法和/或文本识别方法。
130.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
131.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
132.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
133.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
134.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
135.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
136.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,
只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
137.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献