一种图像处理方法、装置、电子设备及存储介质与流程

2021-10-29 22:53:00 来源：中国专利 TAG：电子设备图像处理装置计算机方法

技术特征：
1.一种图像处理方法，其特征在于，包括：获取文本行图像，将所述文本行图像进行分割，得到至少两个文字图像；分别生成每个所述文字图像对应的掩码图像；基于每个所述文字图像对应的所述掩码图像，确定至少两个所述文字图像之间的差异是否超过预设阈值；若至少两个所述文字图像之间的差异超过预设阈值，基于所述掩码图像中文字所在的区域，截取对应的文字图像中相应区域的中间图像，所述中间图像包括所述文字图像中文字对应的像素点所在的区域；按照与所述差异对应的调整策略对至少两个所述中间图像进行调整，得到目标图像；将至少两个所述目标图像进行拼接，得到目标文本图像，以用于文字识别。2.根据权利要求1所述的图像处理方法，其特征在于，获取文本行图像，包括：获取所述文本行检测框四个顶点的坐标；基于所述文本行检测框四个顶点的坐标，计算所述文本行图像四边的斜率；基于所述文本行图像四边的斜率，确定所述文本行图像是否为第一组对边与图像坐标系中的x轴平行且第二组对边与所述图像坐标系中的y轴平行的矩形图像；若所述文本行图像为第一组对边与图像坐标系中的x轴平行且第二组对边与所述图像坐标系中的y轴平行的矩形图像，则截取所述文本行检测框内的图像，得到所述文本行图像；若所述文本行图像为第一组对边与图像坐标系中的x轴之间的夹角不为0且第二组对边与所述图像坐标系中的y轴之间的夹角不为0的矩形图像，则将所述文本行图像进行旋转，以使旋转后的文本行图像的第一组对边与图像坐标系中的x轴平行且第二组对边与所述图像坐标系中的y轴平行，截取所述文本行检测框内的图像，得到所述文本行图像；若所述文本行图像为除矩形外的四边形图像，则确定所述四边形图像的最小外包矩形图像，旋转所述最小外包矩形图像，以使旋转后的最小外包矩形图像的第一组对边与图像坐标系中的x轴平行且第二组对边与所述图像坐标系中的y轴平行，截取所述文本行检测框内的图像，得到所述文本行图像。3.根据权利要求1所述的图像处理方法，其特征在于，将所述文本行图像进行分割，得到至少两个文字图像，包括：对所述文本行图像进行色彩空间转化处理，得到转化图像；提取所述转化图像的边缘特征，得到边缘强度图；将所述边缘强度图进行二值化处理，得到第一二值化图像；确定所述第一二值化图像中文本区域及背景区域，并将所述文本区域赋值为第一数值，将所述背景区域赋值为第二数值，得到直方图；按照所述直方图中各像素位置的对应的数值，对所述直方图进行分割，得到至少两个所述文字图像。4.根据权利要求1所述的图像处理方法，其特征在于，分别生成每个文字图像对应的掩码图像，包括：基于所述文本行图像，计算分割阈值；针对每个所述文字图像，按照所述分割阈值，对所述文本行图像进行第二二值化处理，
得到第二二值化图像；水平扫描所述第二二值化图像的每行像素，对每行像素进行背景色转换，得到第一中间图像；垂直扫描所述第一中间图像的每列像素，对每列像素进行背景色转换，得到第二中间图像；计算所述文本行图像的背景色平均值；基于所述背景色平均值确定所述第二中间图像中的文字区域和背景区域，得到所述文字图像对应的掩码图像。5.根据权利要求1所述的图像处理方法，其特征在于，基于每个文字图像对应的掩码图像，确定至少两个文字图像之间的差异是否超过预设阈值，包括：基于每个所述文字图像对应的掩码图像，确定每个文字图像中文字的行高度信息和字体高度信息；基于至少两个文字图像中文字的行高度信息确定行高度差异数据；基于至少两个文字图像中文字的字体高度信息确定字体高度差异数据；若任一所述行高度差异数据大于预设第一阈值，和/或，任一所述字体高度差异数据大于预设第二阈值，确定至少两个文字图像之间的差异超过预设阈值。6.根据权利要求5所述的图像处理方法，其特征在于，确定每个文字图像中文字的行高度信息和字体高度信息，包括：确定所述文字图像中垂直方向首次出现像素值为第一预设掩码值的像素点的纵坐标，将所述纵坐标确定为所述文字图像中文字的行高度信息；针对每个文字图像，确定所述文字图像中像素值为第一预设掩码值的像素最高位置与像素最低位置之间的高度差，将所述高度差确定为所述文字图像中文字的字体高度信息。7.根据权利要求1所述的图像处理方法，其特征在于，基于所述掩码图像中文字所在的区域，截取对应的文字图像中相应区域的中间图像，包括：在所述掩码图像中确定每个掩码值为预设第一掩码值的像素最高位置与像素最低位置之间的文字所在的掩码区域，在与所述掩码图像对应的文字图像中，截取与所述掩码区域对应的像素区域中的中间图像。8.根据权利要求1所述的图像处理方法，其特征在于，按照与所述差异对应的调整策略对至少两个所述中间图像进行调整，得到目标图像，包括：若任一行高度差异数据大于预设第一阈值，将至少两个所述中间图像调整成一行，得到目标图像；和/或，若任一字体高度差异数据大于预设第二阈值，将每个目标图像调整为相同大小，得到目标图像。9.一种图像处理装置，其特征在于，包括：获取模块，用于获取文本行图像，将所述文本行图像进行分割，得到至少两个文字图像；生成模块，用于分别生成每个所述文字图像对应的掩码图像；第一确定模块，用于基于每个所述文字图像对应的所述掩码图像，确定至少两个所述
文字图像之间的差异是否超过预设阈值；截取模块，用于若至少两个所述文字图像之间的差异超过预设阈值，基于所述掩码图像中文字所在的区域，截取对应的文字图像中相应区域的中间图像，所述中间图像包括所述文字图像中文字对应的像素点所在的区域；调整模块，用于按照与所述差异对应的调整策略对至少两个所述中间图像进行调整，得到目标图像；拼接模块，用于将至少两个所述目标图像进行拼接，得到目标文本图像，以用于文字识别。10.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求1～8任一所述的图像处理方法。11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有图像处理方法的程序，所述图像处理方法的程序被处理器执行时实现权利要求1
‑
8任一所述的图像处理方法的步骤。

技术总结
本发明涉及一种图像处理方法、装置、电子设备及存储介质，该方法包括：获取文本行图像，将所述文本行图像进行分割，得到至少两个文字图像；分别生成每个文字图像对应的掩码图像；基于每个文字图像对应的掩码图像，确定至少两个文字图像之间的差异是否超过预设阈值；若至少两个文字图像之间的差异超过预设阈值，基于所述掩码图像中文字所在的区域，截取对应的文字图像中相应区域的中间图像；按照与所述差异对应的调整策略对至少两个所述中间图像进行调整，得到目标文本图像，以用于文字识别。本发明实施例可以使文本图像中文字的排列更加规整，进而，便于在将处理后的文本行图像输入OCR模型中时，提高OCR模型对文本行图像中文字进行识别的准确率。行识别的准确率。行识别的准确率。

技术研发人员：刘楠
受保护的技术使用者：北京奇艺世纪科技有限公司
技术研发日：2021.07.27
技术公布日：2021/10/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种盾构管片的全寿命周期管理系统和方法与流程

一种图像处理方法、装置、电子设备及存储介质与流程

相关文献

最热文献