样本处理方法、装置、计算机可读介质及电子设备与流程

2021-10-24 10:26:00 来源：中国专利 TAG：应用于样本模型图像训练

技术特征：
1.一种应用于图像区域规划模型训练的样本处理方法，其特征在于，所述图像区域规划模型用于规划出图像中包含结构化信息的区域，所述方法包括：识别样本图像中各文本框，并根据所述各文本框确定所述样本图像对应的图像特征、语义特征以及预设特征；将所述样本图像对应的图像特征、语义特征以及预设特征进行融合，得到所述样本图像的综合特征；根据所述各文本框在所述样本图像中的位置确定用于表征所述各文本框之间位置关系的文本框参数，并基于所述样本图像的综合特征和所述文本框参数确定每两个文本框之间的关系矩阵；根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型。2.根据权利要求1所述的方法，其特征在于，根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型之后，所述方法还包括：根据训练后的图像区域规划模型对接收到的待处理图像进行区域划分，得到区域规划结果；根据所述区域规划结果提取所述待处理图像中各区域的文本信息；其中，所述文本信息包括字段和字段内容中至少一种；根据所述文本信息生成所述待处理图像对应的结构化信息。3.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的图像特征，包括：通过所述图像区域规划模型中的图像特征提取网络提取所述各文本框分别对应的子图像特征；根据所述子图像特征构建所述样本图像对应的图像特征。4.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的语义特征，包括：确定所述各文本框在所述样本图像中的位置信息；将所述位置信息输入所述图像区域规划模型中的语义特征提取网络，以使得所述语义特征提取网络根据所述位置信息提取所述各文本框分别对应的子语义特征；根据所述子语义特征构建所述样本图像对应的语义特征。5.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的预设特征，包括：对所述各文本框进行包含关系判定，得到每个文本框对应的多个判定结果；根据每个文本框对应的多个判定结果构建所述样本图像的预设特征；其中，所述包含关系判定包括以下至少一种：判定对应的文本框与特定词语的包含关系、判定对应的文本框与特定字符的包含关系、判定对应的文本框与特定数字的包含关系。6.根据权利要求1所述的方法，其特征在于，根据所述各文本框在所述样本图像中的位置确定用于表征所述各文本框之间位置关系的文本框参数，包括：确定所述各文本框相对于所述样本图像的中心点位置；
根据所述各文本框的中心点位置确定所述各文本框之间的水平距离和垂直距离；将所述各文本框之间的水平距离和垂直距离确定为所述文本框参数。7.根据权利要求1所述的方法，其特征在于，根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型，包括：根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵调整图像区域规划模型的权重参数，直到所述图像区域规划模型对应的损失函数收敛为止。8.一种应用于图像区域规划模型训练的样本处理装置，其特征在于，所述图像区域规划模型用于规划出图像中包含结构化信息的区域，所述装置包括：文本框识别单元，用于识别样本图像中各文本框；特征提取单元，用于根据所述各文本框确定所述样本图像对应的图像特征、语义特征以及预设特征；特征融合单元，用于将所述样本图像对应的图像特征、语义特征以及预设特征进行融合，得到所述样本图像的综合特征；参数确定单元，用于根据所述各文本框在所述样本图像中的位置确定用于表征所述各文本框之间位置关系的文本框参数，并基于所述样本图像的综合特征和所述文本框参数确定每两个文本框之间的关系矩阵；分类器训练单元，用于根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型。9.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1～7中任一项所述的应用于图像区域规划模型训练的样本处理方法。10.一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1～7中任一项所述的应用于图像区域规划模型训练的样本处理方法。

技术总结
本公开的实施例提供了一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备，涉及图像处理技术领域，该方法包括：识别样本图像中各文本框，并根据各文本框确定样本图像对应的图像特征、语义特征以及预设特征并融合，得到样本图像的综合特征；基于样本图像的综合特征和文本框参数确定每两个文本框之间的关系矩阵；根据各文本框的预设标签、样本图像的综合特征和关系矩阵训练图像区域规划模型。可见，实施本申请的技术方案，可以训练得到能划分出图像中需要进行结构化信息提取的有效区域的图像区域规划模型，基于图像区域规划模型可以提升信息提取效率和精度。像区域规划模型可以提升信息提取效率和精度。像区域规划模型可以提升信息提取效率和精度。

技术研发人员：刘昊岳肖杨付晓刘设伟
受保护的技术使用者：泰康在线财产保险股份有限公司
技术研发日：2021.07.21
技术公布日：2021/10/23

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：图像渲染方法、装置、设备及计算机可读存储介质与流程

样本处理方法、装置、计算机可读介质及电子设备与流程

相关文献

最热文献