文字识别方法、装置及设备与流程

2021-11-10 03:11:00 来源：中国专利 TAG：

技术特征：
1.一种文字识别方法，其特征在于，所述方法包括：获取待识别的单个文字的图片；将所述图片输入至预先训练好的目标识别模型中，得到所述待识别的单个文字与文字库中的各个文字的相似度；将所述待识别的单个文字确定为最大相似度所对应的文字；其中，训练所述目标识别模型，包括：获取多个样本图片，其中，每个样本图片包括单个文字；将所述每个样本图片输入至初始识别模型中，得到所述每个样本图片包括的单个文字的第一特征向量；通过余弦距离公式，根据所述第一特征向量，计算任意两个所述单个文字的相似度，并对得到的多个相似度进行求和运算，得到第一字形相似度信息；通过预设算法得到第二字形相似度信息，并根据所述第一字形相似度信息和所述第二字形相似度信息，得到相似度损失；根据所述相似度损失和分类损失，确定组合损失，其中，所述分类损失通过预设分类损失函数得到；根据所述组合损失，对所述初始识别模型的参数进行调整，以得到更新的识别模型；针对所述更新的识别模型，迭代上述训练过程，直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数，并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别模型作为所述目标识别模型。2.如权利要求1所述的方法，其特征在于，所述通过预设算法得到第二字形相似度信息，包括：分别将任意两个样本图片缩放至预设尺寸；分别对缩放后的样本图片进行划分，得到每个样本图片包括的单个文字的第二特征向量；通过余弦距离公式，根据所述第二特征向量，计算任意两个所述单个文字的相似度，并对得到的多个相似度进行求和运算，得到第二字形相似度信息。3.如权利要求2所述的方法，其特征在于，在所述分别将任意两个样本图片缩放至预设尺寸之前，所述方法还包括：分别对任一样本图片进行裁切，以使所述单个文字与裁切后的样本图片边框的距离小于第二预设阈值。4.如权利要求1所述的方法，其特征在于，所述相似度损失通过下述公式得到：其中，n为样本图片的数量，loss_sim为所述相似度损失，sim_gt为所述第二字形相似度信息，sim_pd为所述第一字形相似度信息。5.如权利要求4所述的方法，其特征在于，所述组合损失通过下述公式得到：
其中，loss为所述组合损失，loss_cls为所述分类损失。6.如权利要求1所述的方法，其特征在于，所述预设分类损失函数为交叉熵损失函数。7.一种文字识别装置，其特征在于，所述装置包括：第一获取模块，用于获取待识别的单个文字的图片；第二获取模块，用于将所述图片输入至预先训练好的目标识别模型中，得到所述待识别的单个文字与文字库中的各个文字的相似度；确定模块，用于将所述待识别的单个文字确定为最大相似度所对应的文字；训练模块，用于获取多个样本图片，其中，每个样本图片包括单个文字；将所述每个样本图片输入至初始识别模型中，得到所述每个样本图片包括的单个文字的第一特征向量；通过余弦距离公式，根据所述第一特征向量，计算任意两个所述单个文字的相似度，并对得到的多个相似度进行求和运算，得到第一字形相似度信息；通过预设算法得到第二字形相似度信息，并根据所述第一字形相似度信息和所述第二字形相似度信息，得到相似度损失；根据所述相似度损失和分类损失，确定组合损失，其中，所述分类损失通过预设分类损失函数得到；根据所述组合损失，对所述初始识别模型的参数进行调整，以得到更新的识别模型；针对所述更新的识别模型，迭代上述训练过程，直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数，并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别模型作为所述目标识别模型。8.如权利要求7所述的装置，其特征在于，所述训练模块，具体用于分别将任意两个样本图片缩放至预设尺寸；分别对缩放后的样本图片进行划分，得到每个样本图片包括的单个文字的第二特征向量；通过余弦距离公式，根据所述第二特征向量，计算任意两个所述单个文字的相似度，并对得到的多个相似度进行求和运算，得到第二字形相似度信息。9.一种电子设备，其特征在于，包括：存储器，用于存储程序；处理器，用于通过执行所述存储器存储的程序以实现如权利要求1
‑
6中任一项所述的方法。10.一种计算机可读存储介质，其特征在于，所述介质上存储有程序，所述程序能够被处理器执行以实现如权利要求1
‑
6中任一项所述的方法。

技术总结
一种文字识别方法、装置及设备，通过获取待识别的单个文字的图片；将图片输入至预先训练好的目标识别模型中，得到待识别的单个文字与文字库中的各个文字的相似度，在对目标识别模型进行训练时，采用相似度损失和分类损失确定目标识别模型是否收敛，相似度损失根据第一字形相似度信息和第二字形相似度信息确定，第一字形相似度信息通过目标识别模型得到，第二字形相似度信息通过预设算法得到，分类损失通过预设分类损失函数得到；将待识别的单个文字确定为最大相似度所对应的文字。由于上述损失函数由通过分类损失和判定两个字之间相似度的相似度损失得到，而相似度损失可以使目标识别模型关注文字的整体结构，从而提高了文字识别的准确度。别的准确度。别的准确度。

技术研发人员：薛鹏赵振崇
受保护的技术使用者：南京中兴力维软件有限公司
技术研发日：2021.07.13
技术公布日：2021/11/9

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：电机转子结构的生成方法、装置、计算机设备和存储介质与流程

文字识别方法、装置及设备与流程

相关文献

最热文献