针对图像的信息提取方法、装置、介质及电子设备与流程

2021-10-24 10:29:00 来源：中国专利 TAG：提取图像信息电子设备介质

技术特征：
1.一种针对图像的信息提取方法，其特征在于，包括：识别目标图像中的文本框，并根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线；根据所述直线将所述目标图像划分为多个图像区域；对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到所述各图像区域中相对应的字段和字段信息；根据所述各图像区域中相对应的字段和字段信息生成与所述目标图像对应的结构化信息。2.根据权利要求1所述的方法，其特征在于，根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线，包括：从所述文本框中确定命中预设词库中关键词的至少一类目标文本框；其中，每一类目标文本框中的目标文本框数量为至少一个；确定所述至少一类目标文本框中每个目标文本框的位置信息；根据所述位置信息确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线均用于对所述目标图像进行区域划分。3.根据权利要求2所述的方法，其特征在于，根据所述位置信息确定所述每一类目标文本框对应的直线，包括：根据所述位置信息确定类内目标文本框的中心点，并根据类内目标文本框的中心点确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线用于连接类内目标文本框的中心点；或者，根据所述位置信息确定类内目标文本框的边界斜率，并根据类内目标文本框的边界斜率确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线用于贯穿类内目标文本框，所述边界斜率包括上边界斜率和下边界斜率中至少一种。4.根据权利要求1所述的方法，其特征在于，所述多个图像区域包括明细区域、头部区域和尾部区域，所述明细区域中的字段与字段信息之间为一对一关系或一对多关系，所述头部区域中的字段和字段信息之间为一对一关系，所述尾部区域中的字段和字段信息之间为一对一关系。5.根据权利要求1所述的方法，其特征在于，对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，包括：通过预训练的分类器计算目标图像区域中的文本框相对于所述目标图像中边框的直线距离特征；其中，所述目标图像区域为所述多个图像区域中任一图像区域；通过所述分类器计算所述目标图像区域中各文本框相对于所述目标图像区域中各字段的水平距离特征；通过所述分类器对所述目标图像区域中各文本框进行特定对象识别，得到对象识别结果；其中，所述特定对象包括符号、数字、字中至少一种；通过所述分类器对所述目标图像区域中各文本框进行定向投影，得到特定方向上所述各文本框分别对应的投影区域，将存在交集的投影区域合并得到多个融合区域；其中，所述多个融合区域与所述明细区域中各字段一一对应；
将所述直线距离特征、所述水平距离特征、所述对象识别结果以及所述多个融合区域确定为所述目标图像区域的特征识别结果。6.根据权利要求5所述的方法，其特征在于，将所述直线距离特征、所述水平距离特征、所述对象识别结果以及所述多个融合区域确定为所述目标图像区域的特征识别结果之后，所述方法还包括：根据所述目标图像和所述各图像区域的特征识别结果训练所述分类器，直到所述分类器的损失函数收敛为止。7.根据权利要求1所述的方法，其特征在于，对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到所述各图像区域中相对应的字段和字段信息，包括：根据所述各图像区域的特征识别结果和所述各图像区域中的文本框确定所述各图像区域中相对应的参考字段和参考字段信息；对所述各图像区域内上下相邻的参考字段信息进行文本长度比对，得到比对结果；根据所述比对结果以及上下相邻的参考字段信息对应的字段计算所述比对结果以及上下相邻的参考字段信息分别对应的置信度；若所述融合结果的置信度大于上下相邻的参考字段信息分别对应的置信度，则将上下相邻的参考字段信息分别对应的文本框融合为完整文本框；根据所述完整文本框更新所述各图像区域中相对应的参考字段和参考字段信息，得到所述各图像区域中相对应的字段和字段信息。8.一种针对图像的信息提取装置，其特征在于，包括：文本框识别单元，用于识别目标图像中的文本框；直线拟合单元，用于根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线；图像区域划分单元，用于根据所述直线将所述目标图像划分为多个图像区域；信息识别单元，用于对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到所述各图像区域中相对应的字段和字段信息；结构化信息生成单元，用于根据所述各图像区域中相对应的字段和字段信息生成与所述目标图像对应的结构化信息。9.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1～7中任一项所述的针对图像的信息提取方法。10.一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1～7中任一项所述的针对图像的信息提取方法。

技术总结
本公开的实施例提供了一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备，涉及信息识别技术领域，该方法包括：识别目标图像中的文本框，并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线；根据直线将目标图像划分为多个图像区域；对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到各图像区域中相对应的字段和字段信息；根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。可见，实施本申请的技术方案，可以提升结构化信息提取精度和结构化信息提取效率。度和结构化信息提取效率。度和结构化信息提取效率。

技术研发人员：刘昊岳王亚领马文伟刘设伟
受保护的技术使用者：泰康在线财产保险股份有限公司
技术研发日：2021.07.21
技术公布日：2021/10/23

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

针对图像的信息提取方法、装置、介质及电子设备与流程

相关文献

最热文献