手写体字检测方法、装置和电子设备与流程

2022-09-01 01:08:40 来源：中国专利 TAG：

1.本公开涉及文本识别技术领域，尤其涉及一种手写体字检测方法、装置和电子设备。

背景技术：

2.手写场景中，书写的内容有可能错的非常离谱，可能就不是一个正常的字符，这个在日常中称为“错字”。相关技术中，并没有发现有检测手写体字的解决方案。
3.在ocr(optical character recognition，光学字符识别)场景里，大部分场景里的目标是将符号识别的更准确，而不是解决识别的图像信息中本身书写就有错字的情况，所以该问题一直被忽视。
4.综上所述，检测手写体字目前尚无有效的解决方案。

技术实现要素：

5.根据本公开的一方面，提供了一种手写体字检测方法，包括：
6.获取包括单个手写体字的第一图像；
7.对第一图像进行文本识别，得到第一字符集及其中每个字符的置信度；
8.在第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值的情况下，将第一图像与第一字符集中的每个字符关联的第二图像进行匹配，得到图像匹配结果，其中，第一字符集中每个字符与其至少一个手写体字的图像关联；
9.根据图像匹配结果确定手写体字的检测结果。
10.根据本公开的一方面，提供了一种手写体字检测装置，包括：
11.获取模块，用于获取包括单个手写体字的第一图像；
12.识别模块，用于对第一图像进行文本识别，得到第一字符集及其中每个字符的置信度；
13.匹配模块，用于在第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值的情况下，将第一图像与第一字符集中的每个字符关联的第二图像进行匹配，得到图像匹配结果，其中，第一字符集中每个字符与其至少一个手写体字的图像关联；
14.确定模块，用于根据图像匹配结果确定手写体字的检测结。
15.根据本公开的又一方面，提供了一种电子设备，包括：
16.处理器；以及
17.存储程序的存储器，
18.其中，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行本公开的方法。
19.根据本公开的再一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本公开的方法。
20.本公开实施例中提供的一个或多个技术方案，基于文本识别和图像对比，可以实
现手写体字检测。
附图说明
21.在下面结合附图对于示例性实施例的描述中，本公开的更多细节、特征和优点被公开，在附图中：
22.图1示出了根据本公开示例性实施例的手写体字检测方法的流程图；
23.图2示出了包括单个手写体字的图像的示意图；
24.图3示出了字符关联的手写体字的图像的示意图；
25.图4示出了手写体字的图像与字符关联的手写体字的图像之间图差处理的示意图；
26.图5示出了根据本公开示例性实施例的手写体字检测方法的另一流程图；
27.图6示出了根据本公开示例性实施例的手写体字检测过程的示意性框图；
28.图7示出了根据本公开示例性实施例的错字检测过程的示意性框图；
29.图8示出了根据本公开示例性实施例的图像对比过程的示意性框图；
30.图9示出了根据本公开示例性实施例的手写体字检测装置的示意性框图；
31.图10示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
32.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。
33.应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
34.本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
35.需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。
36.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。
37.以下参照附图描述本公开的方案。
38.图1示出了根据本公开示例性实施例的手写体字检测方法的流程图，如图1所示，该手写体字检测方法包括步骤s101至步骤s104。
39.步骤s101，获取包括单个手写体字的第一图像。
40.在本实施例中，包括单个手写体字的第一图像可从包括多个字符的图像提取得到。
41.在本实施例中，可通过多种方法从文本图像中提取单个手写体字的图像，例如，基于文本检测从文本图像中得到手写体字的图像，进一步的基于语义分割的文件检测等。本实施对此不作限定。
42.本实施例中，手写体字可为中文、英文字母、数字等。以中文为例，包括单个手写字的第一图像的示例如图2所示，图像上包括文字部分(也称为字迹部分)，即“文”所在位置，以及背景部分(除字迹之外的部分)，即“文”所在位置之外的白色区域。
43.步骤s102，对第一图像进行文本识别，得到第一字符集及其中每个字符的置信度。
44.在本实施例中，可通过多种方法对第一图像进行文本识别，本实施例对文本识别方法不作限定。
45.在本实施例中，设置假值置信度阈值和真值置信度阈值。在第一字符集中的字符的置信度小于等于假值置信度阈值的情况下，第一图像上的字符不是第一字符集中的该字符。在第一字符集中的字符的置信度大于等于真值置信度阈值的情况下，第一图像上的字符是第一字符集中的该字符。在第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值的情况下，进入步骤s103进行进一步处理。
46.步骤s103，在第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值的情况下，将第一图像与第一字符集中的每个字符关联的第二图像进行匹配，得到图像匹配结果。
47.其中，第一字符集中每个字符与其至少一个手写体字的图像关联。
48.在本实施例中，预先收集每个字符至少一个手写体字的图像，形成字符与其至少一个手写体字的图像的关联关系。根据字符与其至少一个手写体字的图像的关联关系，可获得字符关联的图像(第二图像)。
49.字符关联的手写体字的图像如图3所示。在图3中以字符“六”、“大”、“太”作为示例，其中，字符“六”关联三个不同手写体字的图像，参见图3中“六”的右侧；字符“大”关联二个不同手写体字的图像，参见图3中“大”的右侧；字符“太”关联三个不同手写体字的图像，参见图3中“太”的右侧。
50.在一些实施例中，从第一字符集中选择符合预设条件的字符，预设条件包括：置信度大于预设阈值和/或置信度排在前预设名，其中预设阈值大于假值置信度阈值且小于真值置信度阈值。其中，在步骤s103中，将第一图像与选择得到的每个字符关联的第二图像进行匹配。对于第一字符集较大的情形，通过设置预设阈值进行进一步选择，将第一字符集中置信度小于或等于预设阈值的字符排除在第一图上的候选字符之外，降低进行后续处理的计算量。
51.作为一种可能的实施方式，将第一图像与第一字符集中每个字符关联的第二图像进行匹配，得到图像匹配结果，包括：
52.对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，得到第一图像与第一字符集中每个字符关联的每个第二图像之间的差图像；
53.使用预先训练的神经网络模型处理每个差图像，得到第一图像与第一字符集中每个字符关联的每个第二图像的图像匹配结果。
54.其中，预先训练的神经网络模型可包括卷积神经网络。本实施例对神经网络模型不作限定。
55.图差处理的目的是突出两个图像之间的差异。对于手写体字的图像，如果书写一致，那么两幅图像上相同位置是相同部分，也就是同一图像区域均为文字部分或均为文字之外的背景部分。
56.作为一种示例，为了使得神经网络模型关注到书写的不同之处，对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，包括：对于第一图像上的每个像素位置，在其与每个第二图像上对应像素位置为不同部分的情况下，确定差图像上对应像素位置为第一值，其中，第一图像和第二图像分为文字部分和背景部分。
57.进一步的，对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为文字部分的情况下，确定差图像上对应像素位置为第二值。
58.进一步的，对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为背景部分的情况下，确定差图像上对应像素位置为第三值。
59.手写体字的图像(第一图像)和字符的图像(第二图像)，通常文字部分和背景部分在颜色上有较大的区分，因此可通过像素的颜色取值区分像素属于文字部分还是背景部分。例如，手写体字图像和字符的图像通常为白底黑字、白底彩色字(例如蓝色字)。
60.作为一种例子，将手写体字的图像和字符的图像转换为黑白图像，此时，手写体字的图像和字符的图像上，文字部分的颜色值为1，背景部分的颜色值为0。参考图4所示，对于该差图像的每个像素位置：如果手写体字的图像和字符的图像上颜色值均为0，将差图像的像素位置的颜色值设置为0；如果手写体字的图像和字符的图像上颜色值均为1，将差图像的像素位置颜色值设置为0.5；如果手写体字的图像和字符的图像上颜色值不同，将差图像的像素位置设置为1。
61.步骤s104，根据图像匹配结果确定手写体字的检测结果。
62.作为一种可能的实施方式，步骤s104包括：根据图像匹配结果，确定第一字符集中与手写体字匹配的字符；根据第一字符集中与手写体字匹配的字符，确定手写体字的检测结果。
63.作为一种示例，根据图像匹配结果，确定第一字符集中与手写体字匹配的字符，包括：确定第一字符集中每个字符与第一图像匹配的第二图像的第一数目；根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果。
64.作为一种例子，根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果，包括：对于第一字符集中每个字符，在该字符对应的第一数目大于第一预设数目的情况下，确定字符与所述手写体字匹配。
65.可选地，考虑到字符的复杂程度(例如笔画的多少等)不同，第一字符集中每个字符分别预设上述第一预设数目。
66.作为一种示例，根据第一字符集中与手写体字匹配的字符，确定手写体字的检测结果，包括：根据第一字符集中与手写体字匹配的字符的第二数目，确定手写体字的检测结果。
67.在一些实施例中，根据图像匹配结果确定手写体字的检测结果，可实现对文本识别无法识别的手写体字。
68.在一些实施例中，根据图像匹配结果确定手写体字的检测结果，可实现对手写体字的书写情况的检测。
69.图5示出了根据本公开示例性实施例的手写体字检测方法的另一流程图，如图5所示，该手写体字检测方法包括步骤s501至步骤s506。
70.步骤s501，获取包括单个手写体字的第一图像。
71.步骤s502，对第一图像进行文本识别，得到第一字符集及其中每个字符的置信度。
72.步骤s503，确定第一字符集中最大置信度与假值置信度阈值及真值置信度阈值之间的关系。
73.其中，如果第一字符集中最大置信度小于或等于假值置信度阈值，确定第一图像上的手写体字书写错误。如果第一字符集中最大置信度大于或等于真值置信度阈值，确定第一图像上的手写体字书写正确，并输出识别得到的字符；如果第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值，进入步骤s504。
74.步骤s504，如果第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值，将第一图像与第一字符集中的每个字符关联的第二图像进行匹配，得到图像匹配结果。
75.作为一种可能的实施方式，步骤s504，包括：
76.对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，得到第一图像与第一字符集中每个字符关联的每个第二图像之间的差图像；
77.使用预先训练的神经网络模型处理每个差图像，得到第一图像与第一字符集中每个字符关联的每个第二图像的图像匹配结果。
78.图差处理的目的是突出两个图像之间的差异。对于手写体字的图像，如果书写一致，那么两幅图像上相同位置是相同部分，也就是同一图像区域均为文字部分或均为文字之外的背景部分。
79.作为一种示例，为了使得神经网络模型关注到书写的不同之处，对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，包括：
80.对于第一图像上的每个像素位置，在其与每个第二图像上对应像素位置为不同部分的情况下，确定差图像上对应像素位置为第一值，其中，第一图像和第二图像分为文字部分和背景部分；
81.对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为文字部分的情况下，确定差图像上对应像素位置为第二值；
82.对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为背景部分的情况下，确定差图像上对应像素位置为第三值。
83.步骤s505，根据图像匹配结果，确定第一字符集中与手写体字匹配的字符。
84.作为一种实施方式，步骤s505包括：
85.确定第一字符集中每个字符与第一图像匹配的第二图像的第一数目；
86.根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果。
87.作为一种例子，根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果，包括：对于第一字符集中每个字符，在该字符对应的第一数目大于
第一预设数目的情况下，确定字符与所述手写体字匹配。
88.可选地，考虑到字符的复杂程度(例如笔画的多少等)不同，第一字符集中每个字符分别预设上述第一预设数目。
89.步骤s506，根据第一字符集中与手写体字匹配的字符，确定手写体字的检测结果。
90.作为一种实施方式，步骤s506包括：根据第一字符集中与手写体字匹配的字符的第二数目，确定手写体字的检测结果。
91.手写体字在作业智能批改场景中非常常见，下面以作业批改场景为例对本公开的一个示例进行描述。
92.在该示例中，如图6所示，包括语义分割模块、ocr模块和错字检测模块。
93.语义分割模块
94.语义分割模块对作业手写图像进行图像语义分割，将“作业手写图像”中的书写的内容以字符为单位进行分割，组成一组图像，表示为t。
95.ocr模块
96.ocr模块将t中每个图片进行识别，转换成置信度最大的一个字符。
97.在此过程中，对于t中每个小图片，ocr支持的可识别的字符集c中每个字符(或者某些ocr方案，会选择置信度较高的字符计算概率，那其它未选取字符置信度设为0)都会生成一个置信度。置信度集合用s表示，s＝[s1,s2,
…
,sn],其中si表示字符ci对于t中某张图片的置信度。
[0098]
置信度集合s的获取不限于ocr过程，也可以联合前后文的高维文本信息进行置信度打分。本示例对此不作赘述。
[0099]
下述操作都是以t中的小图片为单位进行操作的，小图片用t表示。
[0100]
错字检测模块
[0101]
如图7所示，错字检测模块进一步分为检测过滤模块、图像对比模块、综合判断模块3个模块。
[0102]
检测过滤模块
[0103]
对于t，在上述过程中，得到了一组对于支持的字符集c中每个元素的置信度s，选择置信度最高的分数s
max
，通过公式(1)确定取值:
[0104]
f(s
max
)取值如下：
[0105]
1，s
max
大于等于th
r,i
；
[0106]
0，th
f,i
小于s
max
小于th
r,i
；
[0107]-1，s
max
小于等于th
f,i
；
[0108]
其中，th
r,i
表示c中字符ci的真值置信度阈值，若某字符ci对应的置信度si是s中最高值，而且si大于等于th
r,i
，则认为该t中的字符书写正确，公式(1)中结果为1；th
f,i
表示c中每个字符的假值置信度阈值，若ci的si是s中最高值，且si小于等于th
f,i
，则认为该t中的字符书写错误，公式中结果为-1；其余情况为0，进入图像对比模块。
[0109]
th
r,i
和th
f,i
可在具体任务中，由ocr测试集统计得到。
[0110]
c中每个字符的真值置信度阈值可相同，也可针对每个字符分别设置。c中每个字符的假值置信度阈值可相同，也可针对每个字符分别设置。因为每个字符情况不同，例如笔画复杂的字和简单的字，在分别设置时，可对不同的字符区别处理。
[0111]
当公式输出为0的情况发生，选择s中置信度排在前k名的(topk)对应的k个字符(k为超参数，根据场景设定，可设置为3-10之间)，并且加上s大于假值置信度阈值的元素对应的字符，设两部分的并集字符为h，字符个数为m，则h＝[h1,h2,
…
,hm]。
[0112]
图像对比模块
[0113]
在图像对比模块中，c中每个字符(可识别的字符)都收集了一组手写图像，此图像库是人工收集的。收集的标准是在使用场景中多种规范的写法，但是规范的标准难以量化，可以通过多人投票进行选取。每个字符对应的子图集中图片个数不要求一致。图像对比判断t是否与h中每个字符对应的手写图像内容一致。
[0114]
将t与h中对应的m组手写图集中的图片，组成图对(原图t和对比图d)，以每对为单位，进入下列处理。这里中的小图都是规格一致的黑白图片。
[0115]
如图8所示，图像对比模块包括图差模块、特征提取模块和分类器模块。
[0116]
图差模块
[0117]
图差模块接收原图t和对比图d(h中字符的图片)，通过公式(2)进行计算，得到差图像q：
[0118]qij
＝0，t
ij
＝d
ij
＝0；
[0119]qij
＝0.5，t
ij
＝d
ij
＝1；
[0120]qij
＝1，t
ij
不等于d
ij
；
[0121]
其中，i和j表示图像像素点的行和列的索引。将不相等的位置设置为1，可以让模型更加关注像素不同的地方。然后，差图像q进入特征提取模块。
[0122]
特征提取模块
[0123]
特征提取模块提取差图像q的高维特征，可以使用卷积神经网络(cnn)，也可以使用一些新型的网络结构。
[0124]
分类器模块
[0125]
分类器模块使用全连接网络层。
[0126]
经过分类器模块，h中每个字符的每个图像得到一个识别结果，统计得到h中每个字符的正例数(匹配的图像数目)，组成正例数统计：z＝[z1,z2,
…
,zm]。例如，h1有3个图像与t匹配，则z1取值为3。
[0127]
综合判断模块
[0128]
将z通过公式(3)得到m:
[0129]
mi＝1，zi大于0；
[0130]
mi＝0，zi＝0。
[0131]
对于t，通过公式(4)得到o：
[0132]
o＝sum(m)。
[0133]
对t中书写字符情况给出评价。共包括5个等级，分别为等级a、b、c、d、e。
[0134]
其中：
[0135]
公式(1)(即f(s
max
))输出结果为1的情况，设为等级a；
[0136]
公式(4)(即o)输出结果为1的情况，设为等级b；
[0137]
公式(4)输出结果大于1的情况，设为等级c；
[0138]
公式(4)输出结果等于0的情况，设为等级d；
[0139]
公式(1)输出结果为-1的情况，设为等级e；
[0140]
其中，等级a、b设为书写正确，等级c设为书写不规范，等级d、e设为书写错误。
[0141]
在该示例中，通过联合ocr过程和图像对比来进行书写错字检测，并通过图差突出差别、弱化相同点进行两图信息融合，可以很好地解决手写体字识别。结合作业批改场景，为增加用户体验，提供了手写情况分级策略，通过不同字符子图对比结果，来判断书写错字的情况，给予不同的等级反馈。
[0142]
图9示出了根据本公开示例性实施例的手写体字检测装置的示意图，如图9所示，手写体字检测装置，包括：
[0143]
获取模块910，用于获取包括单个手写体字的第一图像；
[0144]
识别模块920，用于对所述第一图像进行文本识别，得到第一字符集及其中每个字符的置信度；
[0145]
匹配模块930，用于在第一字符集中最大置信度大于假值置信度阈值且小于真值置信度阈值的情况下，将第一图像与第一字符集中每个字符关联的第二图像进行匹配，得到图像匹配结果，其中，第一字符集中每个字符与其至少一个手写体字的图像关联；
[0146]
确定模块940，用于根据图像匹配结果确定手写体字的检测结果。
[0147]
作为一种实施方式，确定模块940，根据图像匹配结果确定手写体字的检测结果，具体包括：
[0148]
根据图像匹配结果，确定第一字符集中与手写体字匹配的字符；
[0149]
根据第一字符集中与手写体字匹配的字符，确定手写体字的检测结果。
[0150]
作为一种实施方式，确定模块940，根据图像匹配结果，确定第一字符集中与手写体字匹配的字符，具体包括：
[0151]
确定第一字符集中每个字符与第一图像匹配的第二图像的第一数目；
[0152]
根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果。
[0153]
作为一种实施方式，确定模块940，根据第一字符集中每个字符对应的第一数目，确定每个字符与手写体字的字符匹配结果，具体包括：
[0154]
对于第一字符集中每个字符，在字符对应的第一数目大于第一预设数目的情况下，确定字符与手写体字匹配。
[0155]
作为一种实施方式，第一字符集中每个字符分别预设第一预设数目。
[0156]
作为一种实施方式，确定模块940，根据第一字符集中与手写体字匹配的字符，确定手写体字的检测结果，具体包括：根据第一字符集中与手写体字匹配的字符的第二数目，确定手写体字的检测结果。
[0157]
作为一种实施方式，匹配模块930，将第一图像与第一字符集中每个字符关联的第二图像进行匹配，得到图像匹配结果，具体包括：
[0158]
对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，得到第一图像与第一字符集中每个字符关联的每个第二图像之间的差图像；
[0159]
使用预先训练的神经网络模型处理每个差图像，得到第一图像与第一字符集中每个字符关联的每个第二图像的图像匹配结果。
[0160]
作为一种实施方式，匹配模块930，对第一图像与第一字符集中每个字符关联的每
个第二图像之间进行图差处理，具体包括：
[0161]
对于所述第一图像上的每个像素位置，在其与每个第二图像上对应像素位置为不同部分的情况下，确定差图像上对应像素位置为第一值，其中，第一图像和第二图像分为文字部分和背景部分。
[0162]
作为一种实施方式，匹配模块930，对第一图像与第一字符集中每个字符关联的每个第二图像之间进行图差处理，进一步包括：
[0163]
对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为文字部分的情况下，确定差图像上对应像素位置为第二值；和/或
[0164]
对于第一图像上的每个像素位置，在其与第二图像上对应像素位置为相同且为背景部分的情况下，确定差图像上对应像素位置为第三值。
[0165]
作为一种实施方式，还包括：从第一字符集中选择符合预设条件的字符，预设条件包括：置信度大于预设阈值和/或置信度排在前预设名，其中预设阈值大于假值置信度阈值且小于真值置信度阈值；其中，匹配模块930，用于将第一图像与选择得到的每个字符关联的第二图像进行匹配。
[0166]
本公开示例性实施例还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序，所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。
[0167]
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
[0168]
本公开示例性实施例还提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
[0169]
参考图10，现将描述可以作为本公开的服务器或客户端的电子设备1000的结构框图，其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0170]
如图10所示，电子设备1000包括计算单元1001，其可以根据存储在只读存储器(rom)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(ram)1003中的计算机程序，来执行各种适当的动作和处理。在ram 1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
[0171]
电子设备1000中的多个部件连接至i/o接口1005，包括：输入单元1006、输出单元1007、存储单元1008以及通信单元1009。输入单元1006可以是能向电子设备1000输入信息的任何类型的设备，输入单元1006可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1007可以是能呈现信息的任何类
型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1008可以包括但不限于磁盘、光盘。通信单元1009允许电子设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。
[0172]
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的每个方法和处理。例如，在一些实施例中，手写体字检测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由rom 1002和/或通信单元1009而被载入和/或安装到电子设备1000上。在一些实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行手写体字检测方法。
[0173]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0174]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0175]
如本公开使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0176]
为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0177]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据
服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
[0178]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：深度神经网络的压缩方法、装置、电子设备及介质与流程

手写体字检测方法、装置和电子设备与流程

相关文献

最热文献