判题方法、装置、电子设备和介质与流程

2021-12-14 22:13:00 来源：中国专利 TAG：

1.本公开涉及人工智能技术领域，尤其涉及一种判题方法、装置、电子设备和介质。

背景技术：

2.随着人工智能技术的发展，拍照判题被广泛应用在教育领域中，目前，拍照判题是根据用户通过终端设备例如手机或平板电脑等，对待批改内容进行拍摄，得到待批改图像，将待批改图像输入相对应的判题软件中，根据建立的题库，搜寻与待批改图像中题目对应的正确答案与用户的作答内容进行对比，从而确定用户作答是否正确。
3.然而，在题库中存储的答案较多的情况下，通过搜寻的方式获取正确答案耗时较长，降低判题的效率。

技术实现要素：

4.为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种判题方法、装置、电子设备和介质。
5.第一方面，本公开提供了一种判题方法，包括：识别待批改图像，并从所述待批改图像中获取第一题干内容和与所述第一题干内容对应的第一作答内容；利用第一判题模型根据所述第一题干内容计算得到所述第一题干内容对应的标准答案；将所述第一作答内容与所述第一题干内容对应的标准答案进行对比，得到判题结果。
6.可选的，所述第一判题模型通过以下方法训练获得：获取训练样本集，所述训练样本集包括：题干内容、以及所述题干内容对应的正确答案；将所述题干内容输入初始判题模型中，得到每个题干内容对应的输出答案；根据所述题干内容对应的输出答案和所述题干内容对应的正确答案，确定损失函数，根据所述损失函数调整所述初始判题模型的权重参数，以得到所述第一判题模型。
7.可选的，所述利用第一判题模型根据所述第一题干内容计算得到所述第一题干内容对应的标准答案，包括：将所述第一题干内容输入所述第一判题模型中，利用所述第一判题模型识别所述第一题干内容对应的多个词向量；根据所述第一题干内容对应的多个词向量，得到所述第一题干内容对应的第一词向量矩阵；对所述第一词向量矩阵进行特征提取，得到所述第一题干内容对应的语义特征向量矩阵；根据所述语义特征向量矩阵和所述第一词向量矩阵，得到所述第一题干内容对应
的标准答案。
8.可选的，所述根据所述语义特征矩阵向量和所述第一词向量矩阵，得到所述第一题干内容对应的标准答案，包括：获取所述第一词向量矩阵中每个词向量对应的预设权重；根据所述第一词向量矩阵和所述每个词向量对应的预设权重，得到第二词向量矩阵；其中，目标词向量的预设权重值大于其他词向量的预设权重值，所述目标词向量为所述第一词向量矩阵中的数字向量或者运算符向量；将所述语义特征向量矩阵和所述第二词向量矩阵进行融合，得到目标特征向量矩阵；将目标特征向量矩阵进行线性变换，得到目标特征向量概率矩阵，其中，所述目标特征向量概率矩阵的大小是根据目标特征向量矩阵的大小、以及字典中字的个数确定的；根据所述目标特征向量概率矩阵的最大概率值，确定所述第一题干内容对应的标准答案。
9.可选的，所述识别待批改图像，并从所述待批改图像中获取第一题干内容和与所述第一题干内容对应的第一作答内容，包括：将所述待批改图像输入版面检测模型中，获取标识图像，所述标识图像为标识有至少一个题目区域的待批改图像；将第一题目区域对应的图像输入识别模型中，以从所述第一题目区域中获取所述第一题干内容和所述第一作答内容，其中，第一题目区域包括所述第一题干内容和与所述第一题干内容对应的第一作答内容，所述第一题目区域为所述至少一个题目区域中的任一个区域。
10.可选的，所述识别待批改图像，并从所述待批改图像中获取第一题干内容和与所述第一题干内容对应的第一作答内容，包括：将所述待批改图像输入文本检测模型中，获取标识图像，所述标识图像为标识有至少一个题目区域的待批改图像，以及在每个题目区域中标识有一个题干区域和一个作答区域；将第一题干区域和第一作答区域所对应的图像输入识别模型中，以从所述第一题干区域中获取所述第一题干内容，以及从第一作答区域中获取所述第一作答内容。
11.可选的，所述利用第一判题模型根据所述第一题干内容计算得到所述第一题干内容对应的标准答案之前，还包括：将所述第一题目区域对应的图像输入题型分类模型，获取所述第一题目的题目类型；若所述第一题目的题目类型为预设类型，则利用第一判题模型根据所述第一题干内容计算得到所述第一题干内容对应的标准答案，所述第一题目为所述第一题目区域中显示的题目，其中，所述预设类型包括选择、填空、以及判断题中至少一种。
12.第二方面，本公开提供了一种判题装置，包括：待批改图像识别模块，用于识别待批改图像，并从所述待批改图像中获取第一题干内容和与所述第一题干内容对应的第一作答内容；标准答案获取模块，用于利用第一判题模型根据所述第一题干内容计算得到所述
第一题干内容对应的标准答案；判题结果获取模块，用于将所述第一作答内容与所述第一题干内容对应的标准答案进行对比，得到判题结果。
13.第三方面，本公开提供了一种电子设备，包括：处理器；以及存储程序的存储器，其特征在于，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器实现第一方面任一项所述方法的步骤。
14.第四方面，一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行时实现第一方面任一项所述方法的步骤。
15.本公开实施例提供的技术方案与现有技术相比具有如下优点：通过识别待批改图像，并从待批改图像中获取第一题干内容和与所述第一题干内容对应的第一作答内容，利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案，将第一作答内容与第一题干内容对应的标准答案进行对比，得到判题结果，这样，能够通过第一判题模型直接获取与第一题干内容对应的标准答案，将用户的作答内容与标准答案进行对比，确定用户作答内容是否正确，相比于将用户的作答与题库中的答案进行对比，无需构建答案题库，无需通过搜寻的方式从题库中获取正确答案，节省了搜寻过程中的耗时，有效的提高了判题效率，提升用户体验。
附图说明
16.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。
17.为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
18.图1为本公开实施例提供的一种判题方法的流程示意图；图2为本公开实施例提供的一种判题模型训练过程的流程示意图；图3为本公开实施例提供的另一种判题方法的流程示意图；图4为本公开实施例提供的再一种判题方法的流程示意图；图5为本公开实施例提供的又一种判题方法的流程示意图；图6为本公开实施例提供的又一种判题方法的流程示意图；图7为本公开实施例提供的又一种判题方法的流程示意图；图8为本公开实施例提供的一种判题装置的结构示意图；图9为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
19.为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。
20.在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。
21.本公开提供的判题方法可以应用在判题装置，该装置可以为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等电子设备，可选的，该装置还可以为这些电子设备中可以实现判题方法的功能模块或者功能实体。
22.图1为本公开实施例提供的一种判题方法的流程示意图，如图1所示，具体包括：s10，识别待批改图像，并从待批改图像中获取第一题干内容和与第一题干内容对应的第一作答内容。
23.其中，待批改图像为用户通过终端设备例如手机、平板电脑等，对待批改内容进行拍摄，获取得到的图像，该待批改图像例如可以是学生的作业、试卷上的题目，待批改图像可以包括一个题目，也可以包括多个题目,但不限于此，本公开不具体限制。
24.第一题干内容是指针对于每个题目中属于打印体的内容，第一题干内容对应的第一作答内容可以是针对于每个题目，用户手写的手写体作答内容，也可以是用户通过终端设备输入的作答内容，但不限于此，本公开不具体限制。
25.一示例的，对于填空题“把3.22339保留三位小数是（3.223）”，即第一题干内容为“把3.22339保留三位小数是（）”，第一题干内容对应的第一作答内容为“3.223”，但不限于此，本公开不具体限制。
26.具体的，利用识别模型对用户拍摄的待批改图像进行识别处理，得到识别结果，该识别结果包括第一题干内容和与第一题干内容对应的第一作答内容。
27.上述识别模型可以为卷积循环神经网络（convolutional recurrent neural network，crnn），该识别模型是根据训练集训练得到的，通过获取训练样本集，训练样本集包括题干区域和作答区域分别对应的图像，以及题干内容以及每个题干内容对应的作答内容，将训练样本集输入至初始识别模型如初始卷积循环神经网络中，得到预测题干内容以及与预测题干内容对应的预测作答内容，根据预测题干内容、预测作答内容、训练样本集中真实的题干内容以及与真实题干内容对应的真实的作答内容，调整初始识别模型的权重参数，直至初始识别模型满足预设收敛条件，确定当前的初始识别模型为训练好的识别模型。
28.s12，利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案。
29.其中，第一判题模型是根据训练样本集得到的，本实施例中第一判题模型可以是transformer网络模型，transformer网络模型包括编码模块、解码模块以及全连接输出层，但不限于此，本公开不具体限制。
30.编码模块包括六个编码器，每个编码器包括两个子层，即多头自注意力层和前馈神经网络层，多头自注意力层是指有多个自注意力层，每个自注意力层用来计算输入样本中每个词与整个样本之间所有词的相互关系，该相互关系反应输入样本中不同词之间的关联以及重要程度，因此利用该相互关系调整每个词的权重，通过多头自注意力层将所有自注意力层提取的特征信息进行拼接处理，以使模型能够学习到更丰富的特征信息，前馈神经网络层用来将多头自注意力层提取的特征信息进行转换，增加网络模型的可表达能力。且对于每一个自注意力层和前馈神经网络层，均连接一个残差层和归一化层，通过残差层
避免网络模型在训练过程中出现梯度消失的现象，通过归一化层以加快网络模型的训练以及收敛速度。
31.解码模块包括六个解码器，每个解码器包括三个子层，即带掩膜的多头自注意力层、编码
‑
解码自注意力层和前馈神经网络层，且对于带掩膜的多头自注意力层、编码
‑
解码自注意力层和前馈神经网络层，均连接一个残差连接和归一化层。
32.在解码完成后，将解码模块的输出结果输入全连接输出层，全连接输出层包括线性函数和激活函数，利用线性函数经过线性变化处理后，利用激活函数实现打分，确定概率最高的为最终的结果，例如该激活函数可以是归一化指数函数，但不限于此，本公开不具体限制。
33.具体的，利用识别模型获取对待批改图像中的第一题干内容之后，将第一题干内容输入至训练好的第一判题模型，利用第一判题模型计算得到的输出答案即为第一题干内容对应的标准答案。
34.一示例的，将第一题干内容“把3.22339保留三位小数是（）”输入至第一判题模型中，得到输出答案为“3.223”，即第一题干内容对应的标准答案为“3.223”。
35.s14，将第一作答内容与第一题干内容对应的标准答案进行对比，得到判题结果。
36.其中，判题结果用于表征用户的作答内容是否正确。
37.具体的，利用识别模型对待批改图像进行识别处理，得到第一作答内容，即用户的作答内容，将第一题干内容输入第一判题模型，得到标准答案，将第一作答内容与标准答案进行对比，在第一作答内容与标准答案相一致的情况下，确定用户的作答内容为正确的，即判题结果为作答正确，或者是在第一作答内容与标准答案不一致的情况下，确定用户的作答内容为错误的，即判题结果为作答错误。
38.示例性的，利用识别模型例如卷积循环神经网络对待批改图像进行识别处理，得到第一作答内容如“3.223”，即用户的作答内容为“3.223”，将第一题干内容输入第一判题模型，得到第一题干内容对应的标准答案如“3.223”，将第一作答内容与标准答案进行对比，在第一作答内容如“3.223”与标准答案如“3.223”相一致的情况下，确定用户的作答内容为正确的，即判题结果为作答正确。
39.在其他实施例中，利用识别模型例如卷积循环神经网络得到第一作答内容如“3.2233”，将第一题干内容输入第一判题模型，得到标准答案如“3.223”，将第一作答内容与标准答案进行对比，在第一作答内容如“3.2233”与标准答案如“3.223”不一致的情况下，确定用户的作答内容为错误的，即判题结果为作答错误。
40.本公开实施例提供的技术方案中，通过识别待批改图像，并从待批改图像中获取第一题干内容和与第一题干内容对应的第一作答内容，利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案，将第一作答内容与第一题干内容对应的标准答案进行对比，得到判题结果，这样，能够通过第一判题模型直接获取与第一题干内容对应的标准答案，将用户的作答内容与标准答案进行对比，确定用户作答内容是否正确，相比于将用户的作答与题库中的答案进行对比，无需构建答案题库，无需通过搜寻的方式从题库中获取正确答案，节省了搜寻过程中的耗时，有效的提高了判题效率，提升用户体验。
41.在本技术一些实施例中，第一判题模型通过以下方法训练得到的，如图2所示，包括：
s20，获取训练样本集。
42.其中，训练样本集包括：题干内容、以及题干内容对应的正确答案。
43.具体的，获取大量用户作答的待批改图像，检测待批改图像中包括题干内容对应的图像区域，将该题干内容对应的图像区域进行识别处理，进而获取题干内容，同时，获取与题干内容相对应的正确答案，根据题干内容以及与其对应的正确答案构建训练样本集，但不限于此，本公开不具体限制。
44.s22，将题干内容输入初始判题模型中，得到每个题干内容对应的输出答案。
45.s24，根据题干内容对应的输出答案和题干内容对应的正确答案，确定损失函数，根据损失函数调整初始判题模型的权重参数，以得到第一判题模型。
46.其中，损失函数是指用来评价模型的预测值和真实值不一样的程度，示例性的，第一判题模型如transformer网络模型在训练过程中每次迭代的前向计算结果与真实值的差距，即将题干内容输入至初始判题模型如transformer网络模型得到的输出答案与训练样本集中与该题干内容相对应的正确答案之间的差距，从而指导下一步使网络模型的训练向正确的方向进行，该损失函数例如可以是交叉熵函数，但不限于此，本公开不具体限制。
47.具体的，将训练样本集中的题干内容输入至初始判题模型中，初始判题模型输出与题干内容相对应的输出答案，根据初始判题模型每次输出的输出答案和训练样本集中的正确答案，确定损失函数，判断损失函数是否收敛，如果当前损失函数未收敛，则根据损失函数调整当前初始判题模型的权重参数，以使输出的答案接近于正确答案，自此完成一次网络模型的训练，直至当前初始判题模型收敛，停止网络模型训练，确定当前的初始判题模型为第一判题模型。
48.需要说明的是，在上述实施例中，判断初始判题模型是否收敛的条件例如可以是完成一次网络模型训练后，确定当前初始判题模型的输出答案是否满足预设条件，例如，当前transformer网络的输出答案与训练样本集中的正确答案的误差是否小于预设误差。如果不小于预设误差，即当前初始判题模型的输出答案不满足预设条件，返回执行s22，直至当前初始判题模型的输出答案的误差满足预设条件，此时，停止网络模型训练，确定当前的判题模型为第一判题模型。
49.这样，本实施例通过训练样本集对初始判题模型进行训练，以使初始判题模型能够根据题干内容计算获得题干内容对应的标准答案，进而根据该标准答案用来判断用户作答内容是否正确，提高判题效率。
50.在本技术的一些实施例中，如图3所示，利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案，包括：s121，将第一题干内容输入第一判题模型中，利用第一判题模型识别第一题干内容对应的多个词向量。
51.第一题干内容包括多个字词，具体的，将第一题干内容输入至第一判题模型如transformer网络模型中，以对第一题干内容中的多个字词进行特征提取，从而得到多个字词分别对应的词向量。
52.示例性的，将“把3.22339保留三位小数是（）”输入至transformer网络模型中，对第一题干内容进行分词处理，得到第一题干内容对应的词汇表[“把”、“3.22339”、“保留”、“三位”、“小数”]，基于词汇表获取每个词分别对应的词向量。
[0053]
在本技术的一些实施例中，还可以采用word2vec等算法提取词向量。
[0054]
s122，根据第一题干内容对应的多个词向量，得到第一题干内容对应的第一词向量矩阵。
[0055]
其中，第一词向量矩阵是包括多个字词对应的词向量，第一词向量矩阵例如为，n表示第一词向量矩阵，x表示第一题干内容中单词的个数，d表示词向量的维度，该词向量的维度可以是d=1，但不限于此，本公开不具体限制，本领域技术人员可根据实际情况设置。
[0056]
示例性的，上述第一题干内容为“把3.22339保留三位小数是（）”，对其进行分词处理后得到对应的词汇表[“把”、“3.22339”、“保留”、“三位”、“小数”]，即第一题干内容中单词的个数为x=5，基于词汇表获取每个单词对应的词向量，将多个词向量组合成第一词向量矩阵，则第一题干内容“把3.22339保留三位小数是（）”对应的第一词向量矩阵为一个[5,1]大小的向量矩阵。
[0057]
s123，对第一词向量矩阵进行特征提取，得到第一题干内容对应的语义特征向量矩阵。
[0058]
其中，语义特征向量矩阵是指根据第一判题模型对第一词向量矩阵进行特征提取，获取得到的第一词向量矩阵对应的矩阵向量，该矩阵向量用来表征输入样本的语义关系。
[0059]
承接上述示例性说明，将从待批改图像中识别的第一题干内容“把3.22339保留三位小数是（）”输入至transformer网络模型，通过transformer网络模型获取第一题干内容对应的第一词向量矩阵，利用编码模块包括的多头自注意力层对第一词向量矩阵进行特征提取，即根据第一词向量矩阵生成查询矩阵、键矩阵、值矩阵以及注意力矩阵，并根据查询矩阵、键矩阵、值矩阵以及注意力矩阵，得到对应的特征向量矩阵，进一步利用前馈神经网络层对特征向量矩阵进行线性变换和激活处理，以此获取第一题干内容对应的语义特征向量矩阵。
[0060]
s124，根据语义特征向量矩阵和第一词向量矩阵，得到第一题干内容对应的标准答案。
[0061]
具体的，将语义特征向量矩阵与第一词向量矩阵作为第一判题模型transformer网络模型中解码模块的输入，通过解码模块中的编码
‑
解码自注意力层对语义特征向量矩阵与第一词向量矩阵进行计算，将计算的结果输入至前馈神经网络层进行线性处理以及激活处理后，再经过全连接输出层进行线性变化处理，并利用归一化指数函数实现打分，确定概率最高的为最终的结果，该结果为第一题干内容对应的标准答案。
[0062]
需要说明的是，在进行解码处理时，不需要对输入进行掩膜处理，即不需要将每个词后面的词进行掩膜处理，以此获取输入样本即第一题干内容的上下文语义信息，通过获取第一题干内容的上下文语义信息、以及编码模块输出的语义特征向量矩阵实现对第一题干内容对应的标准答案预测。
[0063]
一种可选的方式，利用第一判题模型如transformer网络模型获取第一题干内容对应的标准答案时，将第一题干内容整体作为输入样本，且对于第一题干内容对应的作答内容进行预处理，例如通过将第一题干内容对应的作答内容用预设符号进行表示，该预设符号可以为空值，也可以是没有意义的符号，例如“￥”，但不限于此，本公开不具体限制。
[0064]
示例性的，对于第一题干内容如“把3.22339保留三位小数是（）”，将其作答内容用预设符号“￥”表示，即“把3.22339保留三位小数是（￥）”。
[0065]
这样，本实施例通过获取第一题干内容对应的第一词向量矩阵，并基于第一词向量矩阵获取语义特征向量矩阵，根据语义特征向量矩阵以及第一词向量矩阵，预测第一题干内容对应的标准答案，使得模型能够获取更加准确的输出答案，提高了第一判题模型的准确率。
[0066]
在本技术的一些实施例中，如图4所示，根据语义特征向量矩阵和第一词向量矩阵，得到第一题干内容对应的标准答案，包括：s1241，获取第一词向量矩阵中每个词向量对应的预设权重。
[0067]
s1242，根据第一词向量矩阵和每个词向量对应的预设权重，得到第二词向量矩阵。
[0068]
其中，目标词向量的预设权重值大于其他词向量的预设权重值，目标词向量为第一词向量矩阵中的数字向量或者运算符向量。
[0069]
具体的，识别待批改图像中的第一题干内容，基于第一题干内容获取其对应的第一词向量矩阵，在得到第一词向量矩阵之后，获取每个词向量对应的预设权重，并基于第一词向量矩阵和每个词向量对应的预设权重，构建第二词向量矩阵。
[0070]
示例性的，通过识别网络如卷积循环神经网络识别待批改图像中的第一题干内容如“把3.22339保留三位小数是（）”，并根据“把3.22339保留三位小数是（）”得到第一词向量矩阵，对于第一词向量矩阵中的每个词向量，获取其对应的预设权重为：[“0.1”、“0.3”、“0.1”、“0.3”、“0.1”]，将第一词向量矩阵与其对应的预设权重值进行乘积计算，得到第二词向量矩阵。
[0071]
需要说明的是，第二词向量矩阵的大小与第一词向量矩阵大小相同。第一题干内容中对应的每个词组对应的预设权重之和为1，在词向量对应的词为数字或运算符时，例如“3.22339”、“三位”，则其对应词向量的预设权重大于其他词向量的预设权重值，对于词向量的预设权重值，本领域技术人员可根据实际情况设置，本公开不具体限制。
[0072]
s1243，将语义特征向量矩阵和第二词向量矩阵进行融合，得到目标特征向量矩阵。
[0073]
其中，目标特征向量矩阵是指将语义特征向量矩阵以及第二词向量矩阵通过解码模块中的编码
‑
解码自注意力层进行计算，对第一题干内容对应的输出答案进行预测，并将计算结果反馈至前馈神经网络层进行线性处理以及激活处理，得到目标特征向量矩阵。
[0074]
s1244，将目标特征向量矩阵进行线性变换，得到目标特征向量概率矩阵。
[0075]
其中，目标特征向量概率矩阵的大小是根据目标特征向量矩阵的大小、以及字典中字的个数确定的；利用目标特征向量概率矩阵能够获取对题干内容进行预测的作答内容。字典根据数据集中的所有文本数据构建出一个高频字/词典，即将所有题干内容包含的所有文本数据进行分词处理后，得到多个词组，并将相同的词组进行过滤，再基于过滤后多个词组构建字典，该字典的大小可以是[1,1000]，1000为字典中所包含的词组的个数，但不限于此，本公开不具体限制。
[0076]
具体的，利用解码模块根据语义特征向量矩阵和第二词向量矩阵进行融合获取其对应的目标特征向量矩阵，将目标特征向量矩阵进行线性变换，并利用激活函数例如
softmax函数实现打分，以此得到目标特征向量对应的目标特征向量概率矩阵。
[0077]
示例性的，对于第一题干内容“把3.22339保留三位小数是（）”，基于语义特征向量矩阵和第二词向量矩阵，经过transformer网络模型中的解码模块，将语义特征向量矩阵和第二词向量矩阵融合处理后，以实现对第一题干内容对应的输出答案进行预测，以此得到目标特征向量矩阵，则将目标特征向量矩阵输入至全连接输出层，在全连接输出层经过线性变化处理，得到并利用softmax函数实现打分，得到目标特征向量概率矩阵。
[0078]
s1245，根据目标特征向量概率矩阵的最大概率值，确定第一题干内容对应的标准答案。
[0079]
具体的，将目标特征向量经过线性变换，且利用激活函数进行打分得到目标特征向量概率矩阵，选取该目标特征向量概率矩阵中概率值最大的对应的预测作答内容作为第一题干内容对应的标准答案。
[0080]
这样，本实施例通过获取第一题干内容对应的每个词组以及每个词组的预设权重，构成第二题干内容，且对于目标词组例如数字或者运算符，其对应的预设权重值是大于其他词组的预设权重值，能够提高第一判题模型在获取标准答案时，该目标词组在第一题干内容的重要度，以此提高第一判题模型的准确率。
[0081]
在本技术的一些实施例中，如图5所示，识别待批改图像，并从待批改图像中获取第一题干内容和与第一题干内容对应的第一作答内容，包括：s101a，将待批改图像输入版面检测模型中，获取标识图像，标识图像为标识有至少一个题目区域的待批改图像。
[0082]
其中，版面检测模型是指用来检测待批改图像中包含题目区域的网络模型，该版面检测网络模型例如可以是centernet网络模型，通过版面检测网络模型对待批改图像进行检测，将检测到的题目区域进行标注，例如可以通过对题目区域进行框选处理，框选出各个题目区域。
[0083]
在本技术一些实施例中，将待批改图像进行图像处理，例如可以是人工的标注待批改图像中的题目区域，也可以通过机器学习算法例如支持向量机算法，获取标识有至少一个题目区域的标识图像。
[0084]
s102a，将第一题目区域对应的图像输入识别模型中，以从第一题目区域中获取第一题干内容和第一作答内容。
[0085]
其中，第一题目区域包括第一题干内容和与第一题干内容对应的第一作答内容，第一题目区域为至少一个题目区域中的任一个区域。
[0086]
其中，识别模型包括题干内容识别模型以及作答内容识别模型，题干内容识别模型用来识别第一题目区域中的第一题干内容，作答内容识别模型用来识别第一题目区域中与第一题干内容对应的第一作答内容。
[0087]
具体的，通过截取待批改图像中进行标识处理的第一题目区域对应的图像，并输入识别模型中，以从第一题目区域对应的图像中识别出第一题干内容和与第一题干内容对应的第一作答内容。
[0088]
在本技术的一些实施例中，如图6所示，识别待批改图像，并从待批改图像中获取第一题干内容和与第一题干内容对应的第一作答内容，还可以是：s101b，将待批改图像输入文本检测模型中，获取标识图像。
[0089]
其中，标识图像为标识有至少一个题目区域的待批改图像，以及在每个题目区域中标识有一个题干区域和一个作答区域。
[0090]
其中，文本检测模型包括第一文本检测网络模型以及第二文本检测网络模型，第一文本检测网络模型用来检测待批改图像中的题目区域，例如可以是centernet网络模型，通过第一文本检测网络模型对待批改图像进行检测，将检测到的题目区域进行标注，如框选各个题目区域，或者将题目区域突出显示；第二文本检测网络模型用来检测待批改图像中的题干区域以及作答区域，类似的，也可以采用centernet网络模型，通过第二文本检测网络模型对待批改图像进行检测，将检测到的题干区域以及作答区域进行标注，标注方式类似，不再赘述。
[0091]
具体的，将待批改图像输入文本检测模型中，通过文本检测模型检测待批改图像中的题目区域、每个题目区域中的题干区域和作答区域，将题目区域、题干区域和作答区域进行标注处理，得到的输出结果即为标识图像。
[0092]
在本技术的一些实施例中，将待批改图像进行图像处理，例如可以是人工的标注待批改图像中的题目区域、题干区域和作答区域，也可以通过机器学习算法例如支持向量机算法，获取标识有至少一个题目区域、题干区域和作答区域的标识图像，但不限于此，本公开不具体限制。
[0093]
s102b，将第一题干区域和第一作答区域所对应的图像输入识别模型中，以从第一题干区域中获取第一题干内容，以及从第一作答区域中获取第一作答内容。
[0094]
本实施例通过文本检测模型获取待批改图像中的第一题目区域，以及每个题目区域中标识的题干区域以及作答区域，进一步通过识别模型获取题干区域对应的题干内容，以及作答区域对应的作答内容，提高获取题干内容与作答内容的准确性，并根据获取的题干内容获取标准答案，与作答内容进行对比，进一步提高判题结果的效率。
[0095]
在本技术的一些实施例中，利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案的步骤之前，还包括：s11，将第一题目区域对应的图像输入题型分类模型，获取第一题目的题目类型。
[0096]
具体的，通过将截取待批改图像中的第一题目区域对应的图像输入题型分类模型中，获取第一题目的题目类型。
[0097]
示例性的，如对第一题目“把3.22339保留三位小数是（）”进行分类处理，获取第一题目的题目类型为填空题。
[0098]
在本技术的一些实施例中，还可以通过检测第一题目区域对应的图像中是否包含括号、错号、对号等运算符号来判断题目的题目类型。
[0099]
s12，若第一题目的题目类型为预设类型，则利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案。
[0100]
其中，第一题目为第一题目区域中显示的题目。预设类型包括选择、填空、以及判断题中至少一种。
[0101]
具体的，若通过题型分类模型确定第一题目的题目类型为选择题、填空题、判断题中的一种，则利用第一判题模型根据第一题干内容进行计算，以得到第一题干内容对应的标准答案。
[0102]
这样，本实施例在确定第一题目的题目类型为预设类型时，才会根据第一判题模
型获取第一题干内容对应的标准答案，以此提高判题结果的效率。
[0103]
本公开实施例还提供了一种判题装置，用于执行上述实施例提供的任一种判题方法，具备判题方法相应的有益效果。
[0104]
图8为本公开实施例提供的一种判题装置的结构示意图，如图8所示，判题装置包括：待批改图像识别模块10、标准答案获取模块12、判题结果获取模块14。
[0105]
其中，待批改图像识别模块10用于识别待批改图像，并从待批改图像中获取第一题干内容和与第一题干内容对应的第一作答内容。
[0106]
标准答案获取模块12用于利用第一判题模型根据第一题干内容计算得到第一题干内容对应的标准答案。
[0107]
判题结果获取模块14用于将第一作答内容与所述第一题干内容对应的标准答案进行对比，得到判题结果。
[0108]
本公开实施例能够通过第一判题模型直接获取与第一题干内容对应的标准答案，将用户的作答内容与标准答案进行对比，确定用户作答内容是否正确，相比于将用户的作答与题库中的答案进行对比，无需构建答案题库，无需通过搜寻的方式从题库中获取正确答案，节省了搜寻过程中的耗时，有效的提高了判题效率，提升用户体验。
[0109]
本实施例的装置对应的可用于执行上述图1到图7任一所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。
[0110]
本公开示例性实施例还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序，所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行图1到图7任一所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。
[0111]
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行图1到图7任一所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。
[0112]
参考图9，现将描述可以作为本公开的服务器或客户端的电子设备900的结构框图，其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0113]
如图9所示，电子设备900包括计算单元901，其可以根据存储在只读存储器（rom）902中的计算机程序或者从存储单元908加载到随机访问存储器（ram）903中的计算机程序，来执行各种适当的动作和处理。在ram 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出（i/o）接口905也连接至总线904。
[0114]
电子设备900中的多个部件连接至i/o接口905，包括：输入单元906、输出单元907、存储单元908以及通信单元909。输入单元906可以是能向电子设备900输入信息的任何类型的设备，输入单元906可以接收输入的数字或字符信息，以及产生与电子设备的用户设置
和/或功能控制有关的键信号输入。输出单元907可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元904可以包括但不限于磁盘、光盘。通信单元909允许电子设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙tm设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。
[0115]
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元（cpu）、图形处理单元（gpu）、各种专用的人工智能（ai）计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器（dsp）、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理。例如，在一些实施例中，文本识别模型训练方法或者文本识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由rom 602和/或通信单元909而被载入和/或安装到电子设备900上。在一些实施例中，计算单元901可以通过其他任何适当的方式（例如，借助于固件）而被配置为执行方法文本识别模型训练方法或者文本识别方法。
[0116]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0117]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器（ram）、只读存储器（rom）、可擦除可编程只读存储器（eprom或快闪存储器）、光纤、便捷式紧凑盘只读存储器（cd
‑
rom）、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0118]
如本公开使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0119]
为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置（例如，crt（阴极射线管）或者lcd（液晶显示器）监视器）；以及键盘和指向装置（例如，鼠标或者轨迹球），用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈（例如，视觉反馈、听觉反馈、或者触觉反馈）；并且可以用任何形式（包括声输入、语音输入或者、触觉输入）来接收来自用户的输入。
[0120]
可以将此处描述的系统和技术实施在包括后台部件的计算系统（例如，作为数据服务器）、或者包括中间件部件的计算系统（例如，应用服务器）、或者包括前端部件的计算系统（例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互）、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信（例如，通信网络）来将系统的部件相互连接。通信网络的示例包括：局域网（lan）、广域网（wan）和互联网。
[0121]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端
‑
服务器关系的计算机程序来产生客户端和服务器的关系。
[0122]
需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0123]
以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：应用异常处理方法、装置以及计算机可读存储介质与流程

判题方法、装置、电子设备和介质与流程

相关文献

最热文献