字符识别模型的确定方法、装置、设备及存储介质与流程

2021-11-03 11:31:00 来源：中国专利 TAG：

1.本技术涉及字符识别技术领域，特别涉及一种字符识别模型的确定方法、装置、设备及存储介质。

背景技术：

2.ocr(optical character recognition，光学字符识别)是指能够对待识别图像中的待识别字符进行识别的技术。目前，ocr广泛应用于物流、医疗、金融、保险等领域。
3.通常，用户可以获取通用ocr模型，从而利用该通用ocr模型对不同待识别图像中的待识别字符进行识别。其中，该通用ocr模型指的是通过通用的模型训练方法进行训练得到的模型。然而，由于不同待识别图像之间的区别较大，导致该通用ocr模型对不同待识别图像中的待识别字符的识别准确率较低，即该通用ocr模型的泛化能力较差。

技术实现要素：

4.本技术提供了一种字符识别模型的确定方法、装置、设备及存储介质，可以解决相关技术的字符识别模型的确定问题。所述技术方案如下：
5.一方面，提供了一种字符识别模型的确定方法，所述方法包括：
6.获取设备信息，以及获取用户上传的带有标注信息的样本，所述设备信息为用户选择的用于运行字符识别模型的设备的信息，所述标注信息用于描述对应的样本中的字符的属性；
7.基于所述设备信息以及所述标注信息，从网络模型集合中确定待训练网络模型，所述网络模型集合中包括至少两个网络模型；
8.基于所述用户上传的样本对所述待训练网络模型进行训练，得到所述字符识别模型。
9.在本技术一种可能的实现方式中，所述标注信息包括对应的样本中的字符的字段类别和/或字段规则，所述基于所述设备信息以及所述标注信息，从网络模型集合中确定待训练网络模型，包括：
10.根据所述设备信息，从所述网络模型集合中选择网络模型子集，其中，所述网络模型子集中包括的网络模型的尺寸和结构与所述设备匹配；
11.根据所述用户上传的样本的字段类别和/或字段规则，从所述网络模型子集中确定对应的网络模型，得到所述待训练网络模型。
12.在本技术一种可能的实现方式中，所述基于所述用户上传的样本对所述待训练网络模型进行训练，得到所述字符识别模型，包括：
13.将所述用户上传的样本划分为训练样本集和测试样本集，其中，训练样本集中的样本与测试样本集中的样本具有相同的数据分布规律；
14.基于所述训练样本集多次对所述待训练网络模型进行训练；
15.在每次训练得到第一网络模型后，基于所述测试样本集对当前的第一网络模型进
行测试，得到测试指标；
16.若当前的第一网络模型的测试指标高于前一次训练得到的第一网络模型的测试指标，则继续训练并测试；直到当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标，结束训练和测试，并将前一次训练得到的第一网络模型确定为所述字符识别模型。
17.在本技术一种可能的实现方式中，所述当前的第一网络模型包括检测网络和识别网络，所述基于所述测试样本集对当前的第一网络模型进行测试，得到测试指标，包括：
18.基于所述测试样本集对所述检测网络进行测试，得到所述检测网络的测试指标，所述检测网络的测试指标用于指示所述检测网络的检测准确度；
19.基于所述测试样本集对所述识别网络进行测试，得到所述识别网络的测试指标，所述识别网络的测试指标用于指示所述识别网络的字符识别准确度；
20.将所述检测网络的测试指标和所述识别网络的测试指标确定为所述当前的第一网络模型的测试指标。
21.在本技术一种可能的实现方式中，所述方法还包括：
22.生成测试报告，所述测试报告包括所述检测网络的测试指标、所述识别网络的测试指标以及模型反馈信息中的一项或者多项，所述模型反馈信息用于指示用户更新所上传的样本和/或更新所上传的样本中的标注信息。
23.在本技术一种可能的实现方式中，所述将前一次训练得到的第一网络模型确定为所述字符识别模型之前，还包括：
24.对前一次训练得到的第一网络模型进行定点量化处理，得到定点量化后的第一网络模型；
25.所述将前一次训练得到的第一网络模型确定为所述字符识别模型，包括：
26.将所述定点量化后的第一网络模型确定为所述字符识别模型。
27.一方面，提供了一种字符识别模型的确定装置，所述装置包括：
28.获取模块，用于获取设备信息，以及获取用户上传的带有标注信息的样本，所述设备信息为用户选择的用于运行字符识别模型的设备的信息，所述标注信息用于描述对应的样本中的字符的属性；
29.确定模块，用于基于所述设备信息以及所述标注信息，从网络模型集合中确定待训练网络模型，所述网络模型集合中包括至少两个网络模型；
30.训练模块，用于基于所述用户上传的样本对所述待训练网络模型进行训练，得到所述字符识别模型。
31.在本技术一种可能的实现方式中，所述标注信息包括对应的样本中的字符的字段类别和/或字段规则，所述确定模块用于：
32.根据所述设备信息，从所述网络模型集合中选择网络模型子集，其中，所述网络模型子集中包括的网络模型的尺寸和结构与所述设备匹配；
33.根据所述用户上传的样本的字段类别和/或字段规则，从所述网络模型子集中确定对应的网络模型，得到所述待训练网络模型。
34.在本技术一种可能的实现方式中，所述训练模块用于：
35.将所述用户上传的样本划分为训练样本集和测试样本集，其中，训练样本集中的
样本与测试样本集中的样本具有相同的数据分布规律；
36.基于所述训练样本集多次对所述待训练网络模型进行训练；
37.在每次训练得到第一网络模型后，基于所述测试样本集对当前的第一网络模型进行测试，得到测试指标；
38.若当前的第一网络模型的测试指标高于前一次训练得到的第一网络模型的测试指标，则继续训练并测试；直到当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标，结束训练和测试，并将前一次训练得到的第一网络模型确定为所述字符识别模型。
39.在本技术一种可能的实现方式中，所述当前的第一网络模型包括检测网络和识别网络，所述训练模块用于：
40.基于所述测试样本集对所述检测网络进行测试，得到所述检测网络的测试指标，所述检测网络的测试指标用于指示所述检测网络的检测准确度；
41.基于所述测试样本集对所述识别网络进行测试，得到所述识别网络的测试指标，所述识别网络的测试指标用于指示所述识别网络的字符识别准确度；
42.将所述检测网络的测试指标和所述识别网络的测试指标确定为所述当前的第一网络模型的测试指标。
43.在本技术一种可能的实现方式中，所述装置还包括：
44.生成模块，用于生成测试报告，所述测试报告包括所述检测网络的测试指标、所述识别网络的测试指标以及模型反馈信息中的一项或者多项，所述模型反馈信息用于指示用户更新所上传的样本和/或更新所上传的样本中的标注信息。
45.在本技术一种可能的实现方式中，所述训练模块还用于：
46.对前一次训练得到的第一网络模型进行定点量化处理，得到定点量化后的第一网络模型；
47.所述将前一次训练得到的第一网络模型确定为所述字符识别模型，包括：
48.将所述定点量化后的第一网络模型确定为所述字符识别模型。
49.一方面，提供了一种电子设备，所述电子设备包括：
50.处理器；
51.用于存储处理器可执行指令的存储器；
52.其中，所述处理器被配置为实现上述一方面所述的字符识别模型的确定方法。
53.一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，所述指令被处理器执行时实现上述一方面所述的字符识别模型的确定方法。
54.一方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述一方面所述的字符识别模型的确定方法。
55.本技术提供的技术方案至少可以带来以下有益效果：
56.获取用户选择的用于运行字符识别模型的设备的设备信息，以及获取用户上传的带有标注信息的样本，其中，标注信息可以用于描述对应的样本中的字符的属性。电子设备可以基于设备信息以及标注信息，从网络模型集合中选择与该设备信息以及标注信息对应的待训练网络模型，如此，基于用户上传的样本对该待训练网络模型进行训练得到的字符识别模型更适合运行于用户选择的设备中，且该字符识别模型更适合识别与用户上传的样
本类似的待识别对象中的字符，即对于与用户上传的样本类似的待识别对象中的字符的识别准确率较高。
附图说明
57.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
58.图1是本技术实施例提供的一种字符识别模型的确定方法的流程图；
59.图2是本技术实施例提供的一种样本的示意图；
60.图3是本技术实施例提供的一种字符识别模型的确定装置的结构示意图；
61.图4是本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
62.为使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术实施方式作进一步地详细描述。
63.在对本技术实施例提供的字符识别模型的确定方法进行详细的解释说明之前，先对本技术实施例涉及的实施环境进行介绍。
64.本技术实施例提供的字符识别模型的确定方法可以应用于ai(artificial intelligence，人工智能)开放平台，该ai开放平台支持人机交互，示例性的，用户可以将采集的样本上传至该ai开放平台中，该ai开放平台可以对用户上传的样本进行处理。再如，用户可以在该ai开放平台中对该样本进行标注等操作。
65.作为一种示例，该ai开放平台中可以包括电子设备，该电子设备可以用于对网络模型进行训练，得到字符识别模型。示例性的，该电子设备可以为笔记本电脑、便携式计算机、台式计算机、服务器等，本技术实施例对此不做限定。
66.在介绍完本技术实施例涉及的实施环境后，接下来将结合附图对本技术实施例提供的字符识别模型的确定方法进行详细介绍。
67.图1是本技术实施例提供的一种字符识别模型的确定方法的流程图，该方法可以应用于上述实施环境中。请参考图1，该方法包括如下步骤。
68.步骤101：获取设备信息，以及获取用户上传的带有标注信息的样本，设备信息为用户选择的用于运行字符识别模型的设备的信息，标注信息用于描述对应的样本中的字符的属性。
69.其中，字符识别模型为由电子设备训练得到的网络模型，该字符识别模型可以用于识别待识别对象中的字符，譬如，该字符识别模型可以用于识别图像中的字符，或者，该字符识别模型可以用于识别视频中的字符等等。
70.其中，设备信息可以为设备id(identity，标识)、设备ip(internet protocol address，互联网协议地址)等，电子设备可以基于该设备信息确定用户选择哪个或哪种设备用于运行字符识别模型。
71.示例性的，用户可以选择云端设备用于运行字符识别模型，在该种情况下，电子设
备可以获取云端设备的设备信息。用户也可以选择边缘端设备用于运行字符识别模型，在该种情况下，电子设备可以获取边缘端设备的设备信息。
72.其中，云端设备的计算能力通常较强，边缘端设备的计算能力通常较弱。示例性的，云端设备可以为服务器、计算机等，边缘端设备可以为手机、nvr(network video recorder，网络视频录像机)等。
73.其中，用户上传的样本可以为用户基于样本采集装置采集得到的样本，该样本可以为静态图像、动态图像、视频等，本实施例对此不做限定。示例性的，用户上传的样本中包括字符，相应的，如图2所示，用户可以基于样本中的字符对该样本进行标注，从而生成标注信息，该标注信息可以用于描述样本中的字符的属性。
74.示例性的，该标注信息可以包括字段位置、字段类别、字段规则、字段内容等，本实施例对此不做限定。电子设备可以基于该标注信息确定与样本中的字符相关的信息。
75.其中，字段位置指的是样本中字符所在的区域的位置，字段类别指的是样本中的字段所属的类别，字段规则指的是样本中的字段中的字符的组成规则，字段内容指的是样本中的字段包括的字符的内容。
76.譬如，如图2所示，该样本的字段类别包括车厢号和车型号，车厢号的字段规则为固定7位数字，车型号的字段内容为“c62ak”，车厢号的字段内容为“4503388”。
77.需要说明的是，在用户基于样本采集装置采集样本的情况下，用户可以通过调节架设该样本采集装置的角度和距离，使得采集的样本中的字符保持水平、采集的样本中字符的字符高度大于30个像素点、以及采集的样本中的字符类别包括所有用户需要字符识别模型识别的字符类别。进而，在用户完成样本采集的情况下，用户可以将采集的样本上传至ai开放平台中。
78.也就是，电子设备可以获取设备信息，从而可以基于该设备信息确定用户选择哪个或哪种设备用于运行字符识别模型，电子设备还可以获取用户上传的带有标注信息的样本，从而基于该标注信息确定样本中的字符的属性。
79.作为一种示例，电子设备还可以对用户上传的样本进行预处理，示例性的，电子设备可以对用户上传的样本进行尺寸归一化处理、滤波处理、平滑处理等等，本实施例对此不做限定。
80.步骤102：基于设备信息以及标注信息，从网络模型集合中确定待训练网络模型，网络模型集合中包括至少两个网络模型。
81.其中，网络模型集合中的网络模型可以为预先训练后存储于电子设备中的。
82.示例性的，网络模型集合中的网络模型可以为基于预训练样本集训练得到的。其中，该预训练样本集中的样本可以包括用户上传的样本、电子设备采集的样本、电子设备合成的样本、云端下载的样本等等，本实施例对此不做限定。
83.需要说明的是，不同的网络模型通常对应有不同的预训练样本集，该不同的网络模型可以用于识别属于不同字段类别的字符，或者，该不同的网络模型可以用于识别具有不同字段规则的字符，或者，该不同的网络模型可以用于识别属于不同字段类别且具有不同字段规则的字符。
84.示例性的，在预训练样本集中的样本中的字符为车厢号，网络模型是基于该预训练样本集训练得到的情况下，该网络模型可以用于识别车厢号。在预训练样本集中的样本
中的字符为7位数字，网络模型是基于该预训练样本集训练得到的情况下，该网络模型可以用于识别7位数字的字符。在预训练样本集中的样本中的字符为车厢号且该车厢号为7位数字，网络模型是基于该预训练样本集训练得到的情况下，该网络模型可以用于识别7位数字的车厢号。
85.在网络模型集合中包括多个网络模型的情况下，电子设备可以基于设备信息以及标注信息，在网络模型集合中选择与设备信息以及标注信息相匹配的待训练模型。
86.作为一种示例，标注信息包括对应的样本中的字符的字段类别和/或字段规则，基于设备信息以及标注信息，从网络模型集合中确定待训练网络模型的实现可以包括以下几个子步骤：
87.1、根据设备信息，从网络模型集合中选择网络模型子集，其中，网络模型子集中包括的网络模型的尺寸和结构与设备匹配。
88.示例性的，网络模型集合中包括的多个网络模型的尺寸和结构可以是不同的，譬如，网络模型集合中可以包括尺寸较大的网络模型，也可以包括尺寸较小的网络模型，网络模型集合中可以包括结构较复杂的网络模型，也可以包括结构较简单的网络模型。
89.通常，计算能力较强的设备中可以运行尺寸较大、结构较复杂的网络模型，计算能力较弱的设备中可以运行尺寸较小、结构较简单的网络模型。如此，电子设备可以基于设备信息，在网络模型集合中选择与该设备的计算能力相匹配的网络模型。
90.也就是，若设备信息指示该设备为计算能力较弱的设备，则电子设备可以为该设备选择尺寸较小、结构较简单的网络模型，若设备信息指示该设备为计算能力较强的设备，则电子设备可以为该设备选择尺寸较大、结构较复杂的网络模型。
91.譬如，若设备信息指示该设备为边缘端设备，则电子设备可以为该边缘端设备选择尺寸较小、结构较简单的网络模型，若设备信息指示该设备为云端设备，则电子设备可以为该云端设备选择尺寸较大、结构较复杂的网络模型。
92.2、根据用户上传的样本的字段类别和/或字段规则，从网络模型子集中确定对应的网络模型，得到待训练网络模型。
93.示例性的，字段类别可以为身份证号、手机号、车厢号、车型号等等，本实施例对此不做限定。
94.示例性的，字段规则可以为字段包括7位数字，或者，字段规则可以为字段由字母与数字组成，或者，字段规则可以为字段中的第一个字符为大写字母等等，本实施例对此不做限定。
95.示例性的，字段类别与网络模型之间可以具有对应关系，字段规则与网络模型之间也可以具有对应关系。譬如，如表1所示，网络模型1对应的字段类别为车型号，网络模型2对应的字段类别为车厢号，网络模型3对应的字段类别为车厢号，网络模型3对应的字段规则为车厢号是6位数字，网络模型4对应的字段类别为车型号和车厢号，网络模型5对应的字段类别为车型号和车厢号，网络模型5对应的字段规则为车厢号是7位数字。
96.表1
97.网络模型字段类别字段规则网络模型1车型号无规则网络模型2车厢号无规则
网络模型3车厢号6位数字网络模型4车型号车厢号无规则网络模型5车型号无规则网络模型5车厢号7位数字
98.需要说明的是，字段类别与网络模型之间的对应关系、以及字段规则与网络模型之间的对应关系可以为预先确定后存储于电子设备中。
99.在网络模型子集中包括多个网络模型的情况下，电子设备可以基于字段类别，在网络模型子集中选择与该字段类别对应的网络模型，或者，电子设备可以基于字段规则，在网络模型子集中选择与该字段规则对应的网络模型，或者，电子设备可以基于字段类别和字段规则，在网络模型子集中选择与该字段类别和字段规则对应的网络模型。
100.示例性的，如表1所示，在网络模型子集中包括网络模型1、网络模型2、网络模型3、网络模型4、网络模型5的情况下，若标注信息指示该字段类别为车型号，则电子设备可以选择网络模型1作为待训练网络模型。若标注信息指示该字段规则为6位数字，则电子设备可以选择网络模型3作为待训练网络模型。若标注信息指示字段类别为车型号和车厢号，字段规则为车厢号是7位数字，则电子设备可以选择网络模型5作为待训练网络模型。
101.步骤103：基于用户上传的样本对待训练网络模型进行训练，得到字符识别模型。
102.也就是，在确定用户上传的样本以及待训练网络模型的情况下，电子设备可以基于用户上传的样本对该待训练网络模型进行训练，从而得到字符识别模型。
103.作为一种示例，基于用户上传的样本对待训练网络模型进行训练，得到字符识别模型的实现可以包括以下几个子步骤：
104.1、将用户上传的样本划分为训练样本集和测试样本集，其中，训练样本集中的样本与测试样本集中的样本具有相同的数据分布规律。
105.其中，训练样本集中的样本可以用于对待训练网络模型进行训练，以得到训练后的网络模型。测试样本集中的样本可以用于对训练后的网络模型进行测试，以评估训练后的网络模型的字符识别效果。
106.其中，数据分布规律可以根据实际情况进行设置，该数据分布规律可以为与字符高度、字符类别、字段类别等相关的规律，本实施例对此不做限定。示例性的，数据分布规律相同可以包括训练样本集中的样本的字符高度与测试样本集中的样本的字符高度基本一致，和/或，数据分布规律相同可以包括训练样本集中的样本的字符类别与测试样本集中的样本的字符类别基本一致，和/或，数据分布规律相同可以包括训练样本集中的样本的字段类别与测试样本集中的样本的字段类别基本一致等等。
107.示例性的，对用户上传的样本进行划分的方法可以包括留出法(hold-out)、交叉验证法、自助法(bootstrapping)等，本实施例对此不做限定。
108.也就是，电子设备可以统计用户上传的样本的数据分布，从而基于该数据分布将用户上传的样本划分为训练样本集和测试样本集，使得该训练样本集中样本的数据分布规律与测试样本集中样本的数据分布规律相同。
109.示例性的，若数据分布规律相同包括该训练样本集中的样本的字符高度与测试样本集中的样本的字符高度基本一致，则电子设备可以统计用户上传的样本的字符高度，从而基于该字符高度将用户上传的样本划分为训练样本集和测试样本集，使得该训练样本集
中的样本的字符高度在30-100像素点之间，该测试样本集中的样本的字符高度也在30-100像素点之间。
110.示例性的，若数据分布规律相同包括该训练样本集中的样本的字符类别与测试样本集中的样本的字符类别基本一致，则电子设备可以统计用户上传的样本的字符类别，从而基于该字符类别将用户上传的样本划分为训练样本集和测试样本集，使得该训练样本集中的样本的字符类别为数字，该测试样本集中的样本的字符类别也为数字。
111.示例性的，若数据分布规律相同包括该训练样本集中的样本的字段类别与测试样本集中的样本的字段类别基本一致，则电子设备可以统计用户上传的样本的字段类别，从而基于该字段类别将用户上传的样本划分为训练样本集和测试样本集，使得该训练样本集中的样本的字段类别为车厢号，该测试样本集中的样本的字段类别也为车厢号。
112.2、基于训练样本集多次对待训练网络模型进行训练。在每次训练得到第一网络模型后，基于测试样本集对当前的第一网络模型进行测试，得到测试指标。若当前的第一网络模型的测试指标高于前一次训练得到的第一网络模型的测试指标，则继续训练并测试。直到当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标，结束训练和测试，并将前一次训练得到的第一网络模型确定为字符识别模型。
113.通常，随着对于待训练网络模型的训练，得到的第一网络模型的字符识别效果会逐渐提高，然而，当训练达到某种程度时，得到的第一网络模型的字符识别效果会逐渐降低。在该种情况下，电子设备可以基于第一网络模型的测试指标，选择字符识别效果最佳的第一网络模型作为字符识别模型。
114.也就是，电子设备可以基于训练样本集对待训练网络模型进行多次训练，并基于测试样本集对每一次训练得到的第一网络模型进行测试，得到测试指标。若当前的第一网络模型的测试指标高于前一次训练得到的第一网络模型的测试指标，则说明前一次训练得到的第一网络模型的测试指标不是最优的，即前一次训练得到的第一网络模型不是字符识别效果最好的网络模型。在该种情况下，电子设备可以继续对该当前的第一网络模型进行训练并测试，直至当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标，电子设备可以确定前一次训练得到的第一网络模型的测试指标是最优的，即前一次训练得到的第一网络模型是字符识别效果最好的网络模型，在该种情况下，电子设备可以将前一次训练得到的第一网络模型确定为字符识别模型。
115.当然，在一种可能的实现方式中，在当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标的情况下，可以将该前一次训练得到的第一网络模型确定为候选字符识别模型。由于第一网络模型的测试指标存在短暂降低之后继续提高的可能性，因此电子设备还可以继续多次训练并测试，以进一步确定该候选字符识别模型的测试指标是否是最优的。若电子设备继续多次训练并测试得到的多个测试指标均低于该候选字符识别模型的测试指标，则可以确定该候选字符识别模型的测试指标是最优的，即该候选字符识别模型是字符识别效果最好的网络模型，在该种情况下，电子设备可以将该候选字符识别模型确定为字符识别模型。
116.作为一种示例，当前的第一网络模型包括检测网络和识别网络，基于测试样本集对当前的第一网络模型进行测试，得到测试指标的实现方式可以为：基于测试样本集对检测网络进行测试，得到检测网络的测试指标，检测网络的测试指标用于指示检测网络的检
测准确度。基于测试样本集对识别网络进行测试，得到识别网络的测试指标，识别网络的测试指标用于指示识别网络的字符识别准确度。将检测网络的测试指标和识别网络的测试指标确定为当前的第一网络模型的测试指标。
117.其中，检测网络可以用于检测样本中的字段位置以及字段类别，示例性的，检测网络可以采用四边形文字检测算法、通用目标检测算法等等，本实施例对此不做限定。
118.其中，识别网络可以用于识别样本中的字段内容，示例性的，识别网络可以为基于ctc(connectionist temporal classification，连接主义时间分类)的网络、结合attention mechanism(注意力机制)的网络等等，本实施例对此不做限定。
119.示例性的，电子设备可以将测试样本集中的样本输入至检测网络，输出字段位置以及字段类别，从而可以基于该检测网络输出的字段位置以及字段类别，确定该检测网络的测试指标。电子设备可以将字段位置对应的字段区域输入至识别网络，输出该字段区域中的字段内容，从而可以基于该识别网络输出的字段内容，确定该识别网络的测试指标。
120.其中，检测网络的测试指标可以为召回率、准确率、召回率与准确率的调和平均数等等。
121.其中，准确率指的是检测网络检测出的被标注的字段位置在所有检测出的字段位置中所占的比例，召回率指的是检测网络检测出的被标注的字段位置在所有被标注的字段位置中所占的比例。
122.示例性的，若测试样本集中包括50个被标注的字段位置，检测网络检测到40个字段位置，其中30个字段位置为被标注的字段位置，则准确率为30/40＝0.75，召回率为30/50＝0.6。
123.需要说明的是，在检测网络的测试指标包括召回率、准确率、召回率与准确率的调和平均数中的多个的情况下，可以分别为每个指标设置权重，从而基于该多个指标以及每个指标对应的权重，确定检测网络的测试指标。
124.譬如，在检测网络的测试指标包括召回率和准确率的情况下，可以设置召回率的权重为0.6，设置准确率的权重为0.4，若召回率为0.6，准确率为0.75，则该检测网络的测试指标为0.6*0.6 0.75*0.4＝0.66。
125.其中，识别网络的测试指标可以为字段识别率，该字段识别率指的是所有字段中被识别网络识别正确的字段所占的比例，被识别网络识别正确指的是该字段中每个字符均被识别网络识别正确。
126.也就是，电子设备可以调用测试样本集对检测网络进行测试，即基于检测网络输出的字符位置和字段类别、以及用户标注的字符位置和字段类别，得到检测网络的测试指标，从而确定该检测网络的字段检测准确率。电子设备可以调用测试样本集对识别网络进行测试，即基于识别网络输出的字段内容、以及用户标注的字段内容，得到识别网络的测试指标，从而确定识别网络的字符识别准确度。
127.需要说明的是，若用户上传的样本中的字段类别有多种，则当前的第一网络模型中可以包括多个识别网络，每个识别网络可以用于识别该识别网络对应的字段类别的字段内容。
128.在一种可能的实现方式中，电子设备还可以利用测试样本集对当前的第一网络模型进行整体测试，即将测试样本集输入至当前的第一网络模型中，输出字段内容，从而根据
用户标注的字段内容、以及当前的第一网络模型输出的字段内容，确定该当前的第一网络模型的字符识别效果。
129.作为一种示例，电子设备还可以进行如下操作：生成测试报告，测试报告包括检测网络的测试指标、识别网络的测试指标以及模型反馈信息中的一项或者多项，模型反馈信息用于指示用户更新所上传的样本和/或更新所上传的样本中的标注信息。
130.示例性的，在用户标注字段规则的情况下，若检测到用户在某个样本中标注的字段内容不符合该字段规则，则可以确定用户对该样本标注错误。在该种情况下，电子设备可以生成模型反馈信息，提示用户该样本标注错误，从而用户可以根据该模型反馈信息对该样本进行重新标注。或者，若字符识别模型对某种字段类别的字段内容的字段识别率较低，则电子设备可以生成模型反馈信息，提示用户采集更多包括该字段类别的字段内容的样本。
131.也就是，电子设备可以将检测网络的测试指标、识别网络的测试指标以及模型反馈信息中的一项作为测试报告发送给用户，或者，电子设备可以将检测网络的测试指标、识别网络的测试指标以及模型反馈信息中的多项作为测试报告发送给用户，如此，用户可以基于该测试报告确定该字符识别模型的字符识别效果，并根据模型反馈信息对样本进行更新。
132.作为一种示例，将前一次训练得到的第一网络模型确定为字符识别模型之前，电子设备还可以进行如下操作：对前一次训练得到的第一网络模型进行定点量化处理，得到定点量化后的第一网络模型。将前一次训练得到的第一网络模型确定为字符识别模型的实现方式可以为：将定点量化后的第一网络模型确定为字符识别模型。
133.其中，定点量化处理指的是将前一次训练得到的第一网络模型由浮点模型转换为定点模型的处理过程。
134.也就是，该前一次训练得到的第一网络模型为浮点模型，由于用户选择的用于运行字符识别模型的设备可能不支持运行浮点模型，因此电子设备可以对该前一次训练得到的第一网络模型进行定点量化处理，得到定点量化后的第一网络模型，从而电子设备可以将该定点量化后的第一网络模型确定为字符识别模型。
135.示例性的，电子设备还可以将字符识别模型发送给用户选择的设备，如此，该字符识别模型可以在该用户选择的设备中运行，从而使得该字符识别模型可以用于对用户上传到该设备中的待识别对象中的字符进行识别。
136.在本技术实施例中，电子设备获取用户选择的用于运行字符识别模型的设备的设备信息，以及获取用户上传的带有标注信息的样本，其中，标注信息可以用于描述对应的样本中的字符的属性。电子设备可以基于设备信息以及标注信息，从网络模型集合中选择与该设备信息以及标注信息对应的待训练网络模型，如此，基于用户上传的样本对该待训练网络模型进行训练得到的字符识别模型更适合运行于用户选择的设备中，且该字符识别模型更适合识别与用户上传的样本类似的待识别对象中的字符，即对于与用户上传的样本类似的待识别对象中的字符的识别准确率较高。
137.图3是根据一示例性实施例示出的一种字符识别模型的确定装置的结构示意图，该字符识别模型的确定装置可以由软件、硬件或者两者的结合实现。该字符识别模型的确定装置可以包括：
138.获取模块310，用于获取设备信息，以及获取用户上传的带有标注信息的样本，所述设备信息为用户选择的用于运行字符识别模型的设备的信息，所述标注信息用于描述对应的样本中的字符的属性；
139.确定模块320，用于基于所述设备信息以及所述标注信息，从网络模型集合中确定待训练网络模型，所述网络模型集合中包括至少两个网络模型；
140.训练模块330，用于基于所述用户上传的样本对所述待训练网络模型进行训练，得到所述字符识别模型。
141.在本技术一种可能的实现方式中，所述标注信息包括对应的样本中的字符的字段类别和/或字段规则，所述确定模块320用于：
142.根据所述设备信息，从所述网络模型集合中选择网络模型子集，其中，所述网络模型子集中包括的网络模型的尺寸和结构与所述设备匹配；
143.根据所述用户上传的样本的字段类别和/或字段规则，从所述网络模型子集中确定对应的网络模型，得到所述待训练网络模型。
144.在本技术一种可能的实现方式中，所述训练模块330用于：
145.将所述用户上传的样本划分为训练样本集和测试样本集，其中，训练样本集中的样本与测试样本集中的样本具有相同的数据分布规律；
146.基于所述训练样本集多次对所述待训练网络模型进行训练；
147.在每次训练得到第一网络模型后，基于所述测试样本集对当前的第一网络模型进行测试，得到测试指标；
148.若当前的第一网络模型的测试指标高于前一次训练得到的第一网络模型的测试指标，则继续训练并测试；直到当前的第一网络模型的测试指标低于前一次训练得到的第一网络模型的测试指标，结束训练和测试，并将前一次训练得到的第一网络模型确定为所述字符识别模型。
149.在本技术一种可能的实现方式中，所述当前的第一网络模型包括检测网络和识别网络，所述训练模块330用于：
150.基于所述测试样本集对所述检测网络进行测试，得到所述检测网络的测试指标，所述检测网络的测试指标用于指示所述检测网络的检测准确度；
151.基于所述测试样本集对所述识别网络进行测试，得到所述识别网络的测试指标，所述识别网络的测试指标用于指示所述识别网络的字符识别准确度；
152.将所述检测网络的测试指标和所述识别网络的测试指标确定为所述当前的第一网络模型的测试指标。
153.在本技术一种可能的实现方式中，所述装置还包括：
154.生成模块340，用于生成测试报告，所述测试报告包括所述检测网络的测试指标、所述识别网络的测试指标以及模型反馈信息中的一项或者多项，所述模型反馈信息用于指示用户更新所上传的样本和/或更新所上传的样本中的标注信息。
155.在本技术一种可能的实现方式中，所述训练模块330还用于：
156.对前一次训练得到的第一网络模型进行定点量化处理，得到定点量化后的第一网络模型；
157.所述将前一次训练得到的第一网络模型确定为所述字符识别模型，包括：
programmable read only memory，电可擦除可编程只读存储器)，eprom(erasable programmable read-only memory，可擦除可编程只读存储器)，sram(static random access memory，静态随时存取存储器)，rom(read only memory，只读存储器)，磁存储器，快闪存储器，prom(programmable read-only memory，可编程只读存储器)等。
167.值得注意的是，本技术提到的计算机可读存储介质可以为非易失性存储介质，换句话说，可以是非瞬时性存储介质。
168.应当理解的是，实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。
169.也即是，在一些实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述所述的字符识别模型的确定方法的步骤。
170.以上所述为本技术提供的可选实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种烧结机台车车轴故障检测方法及系统与流程

字符识别模型的确定方法、装置、设备及存储介质与流程

相关文献

最热文献