文字分割方法、电子设备及存储介质与流程

2023-02-10 16:18:27 来源：中国专利 TAG：

1.本技术涉及图像检测领域，尤其涉及一种文字分割方法、电子设备及存储介质。

背景技术：

2.图像文字分割在很多地方都会用到，例如车牌识别，身份证识别。目前对文字进行分割的方法主要是通过训练神经网络模型的方式得到，这种方式需要大量的数据样本进行训练，且对文字的格式、大小和质量要求很高。当图像中的文字格式不固定，清晰度不够时，容易出现检测不准确的情况。

技术实现要素：

3.鉴于以上内容，有必要提供一种文字分割方法、电子设备及存储介质，能提高文字分割的准确率。
4.本技术提供一种文字分割方法，所述方法包括：获取目标图像的图像特征；根据所述图像特征对所述目标图像进行增强处理，得到增强图像；检测所述增强图像中文字的闭合边缘；基于所述闭合边缘确定所述文字对应的第一矩形轮廓；对所述第一矩形轮廓进行矫正，得到第二矩形轮廓；根据所述第二矩形轮廓对所述目标图像进行文字分割。
5.在一种可能的实现方式中，所述图像特征包括：像素均值、标准差、图像长度及宽度，所述根据目标图像的图像特征对所述目标图像进行增强处理，得到增强图像包括：比较所述像素均值与预设均值阈值，并根据比较结果对所述二值化图像进行图像反转处理，得到反转图像；匹配与所述标准差对应的去噪算法；根据所述图像长度及宽度确定所述去噪算法的核参数，并使用所述去噪算法对所述反转图像进行去噪处理，得到增强图像。
6.在一种可能的实现方式中，所述基于所述闭合边缘确定所述文字的第一矩形轮廓包括：生成与所述目标图像大小相同的空白图像；根据所述闭合边缘在所述空白图像上生成矩形轮廓，得到轮廓图像，所述矩形轮廓在所述轮廓图像中的位置与所述闭合边缘对应的轮廓在所述目标图像中的位置相同；检测所述轮廓图像中的所有轮廓；将每个轮廓确定为所述第一矩形轮廓。
7.在一种可能的实现方式中，所述对所述第一矩形轮廓进行矫正，得到第二矩形轮廓包括：计算所述第一矩形轮廓的平均面积、平均横向间距、平均纵向间距；根据所述平均面积、所述平均横向间距和所述平均纵向间距修正所述第一矩形轮廓，得到所述文字对应的第二矩形轮廓。
8.在一种可能的实现方式中，所述计算所述第一矩形轮廓的平均面积、平均横向间距、平均纵向间距包括：确定每个所述第一矩形轮廓的四个顶点坐标；根据所述顶点坐标确定每个所述第一矩形轮廓的宽度和长度；根据所述宽度和所述长度确定所述平均面积；基于所述顶点坐标确定水平相邻的第一矩形轮廓；计算所述水平相邻的第一矩形轮廓的平均横向间距；基于所述顶点坐标确定垂直相邻的第一矩形轮廓；计算所述垂直相邻的第一矩形轮廓的平均纵向间距。
9.在一种可能的实现方式中，所述根据所述平均面积、所述平均间距修正所述第一矩形轮廓，得到所述文字对应的第二矩形轮廓包括：确定水平相邻的两个所述第一矩形轮廓之间的相邻横向间距，及垂直相邻的两个所述第一矩形轮廓之间的相邻纵向间距；根据所述相邻横向间距和所述相邻纵向间距合并所述第一矩形轮廓，得到候选矩形框；移除小于所述平均面积第一预设倍数的候选矩形框，并拆分大于所述平均面积第二预设倍数的候选矩形框，得到所述第二矩形轮廓。
10.在一种可能的实现方式中，所述根据所述相邻横向间距和所述相邻纵向间距合并所述第一矩形轮廓，得到候选矩形框包括：将小于所述平均横向间距的相邻横向间距对应的两个第一矩形轮廓进行合并；将小于所述平均纵向间距的相邻纵向间距对应的两个第一矩形轮廓进行合并。
11.在一种可能的实现方式中，所述检测所述增强图像中文字的边缘包括：对所述增强图像进行二值化处理，得到二值化图像；对所述二值化图像进行形态学处理，得到形态学图像；对所述形态学图像进行边缘检测，得到边缘图像；提取所述边缘图像中的边缘。
12.本技术还提供一种电子设备，所述电子设备包括处理器和存储器，所述处理器用于执行所述存储器中存储的计算机程序时实现所述的文字分割方法。
13.本技术还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述的文字分割方法。
14.本技术公开的文字分割方法及相关设备，通过获取到的目标图像的图像特征对所述目标图像进行增强处理，得到增强图像，检测所述增强图像中文字的闭合边缘，基于所述闭合边缘确定所述文字对应的第一矩形轮廓，对所述第一矩形轮廓进行矫正，得到第二矩形轮廓，根据所述第二矩形轮廓对所述目标图像进行文字分割。通过对所述目标图像进行增强，并根据所述增强图像进行文字分割可以提高文字分割的准确率和分割效率。
附图说明
15.图1是本技术实现一种文字分割方法的较佳实施例的电子设备的结构示意图。
16.图2是本技术公开的一种文字分割方法的较佳实施例的流程图。
17.图3是本技术公开的一种示例性目标图像。
18.图4是本技术公开的一种示例性闭合边缘图。
19.图5是本技术公开的一种示例性矩形轮廓图。
20.图6是本技术公开的一种示例性第一矩形轮廓图。
21.图7是本技术公开的一种示例性拆分第一矩形轮廓图。
22.图8是本技术公开的一种示例性第二矩形轮廓获取图。
23.图9是本技术公开的一种示例性文字分割效果比较图。
具体实施方式
24.为了使本技术的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本技术进行详细描述。
25.请参阅图1，图1为本技术一实施例的电子设备的示意图。参阅图1所示，所述电子设备1包括，但不仅限于，存储器11和至少一个处理器12上述元件之间可以通过总线连接，
也可以直接连接。
26.所述电子设备1可以是计算机、手机、平板电脑、个人数字助理(personal digital assistant，pda)等安装有应用程序的设备。本领域技术人员可以理解，所述示意图1仅仅是电子设备1的示例，并不构成对电子设备1的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
27.如图2所示，是本技术文字分割方法的较佳实施例的流程图。所述文字分割方法应用在所述电子设备1中。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。在本实施方式中，所述文字分割方法包括：
28.s11、获取目标图像的图像特征。
29.为了后续对所述目标图像进行增强处理，需要获取所述目标图像的图像特征，从而根据目标图像的图像特征对目标图像进行增强处理。
30.在本实施方式中，所述目标图像为包含文字的图像，例如，ic封装印字图像。在ic的封装过程中需要对ic进行印字处理，为了保证印刷清晰完整，需要将所述ic封装印字图像中的文字进行精准分割。
31.在一个实施方式中，所述目标图像可以为黑白图像，例如，白字黑底，白底黑字。当目标图像为黑白图像时，计算目标图像的像素均值、标准差、图像长度及宽度作为目标图像的图像特征。
32.在一个实施方式中，所述目标图像可以为彩色图像。当目标图像为彩色图像时，先对所述目标图像进行二值化处理，得到白字黑底或者白底黑字的二值化图像，再计算二值化图像的像素均值、标准差、图像长度及宽度作为目标图像的图像特征。
33.s12、根据所述图像特征对所述目标图像进行增强处理，得到增强图像。
34.由于目标图像不同，所需要的参数也不同，根据目标图像的特征对目标图像进行增强处理，更具个性化，得到的增强图像有助于提高对目标图像中文字的分割效果。
35.在本实施方式中，所述根据所述图像特征对所述目标图像进行增强处理，得到增强图像包括：
36.(1)比较所述像素均值与预设均值阈值，并根据比较结果对所述目标图像进行图像反转处理，得到反转图像。
37.ic封装过程中，ic封装材质可以是塑料，金属或是陶瓷。对于不同的封装材质拍摄出来ic封装印字图像是不同的，有黑底白字或是白底黑字两种情况。为了方便后续的处理，将所述ic封装印字图像一律转换为白底黑字。因此我们根据影像像素的平均值，判断拍摄的ic封装印字图像是黑底白字还是白底黑字。
38.具体实施时，预先设置均值阈值，判断所述像素均值是否大于所述均值阈值，当所述像素均值大于所述均值阈值时，表明所述目标图像中白色为主色调，即所述二值化图像为白底黑字图像，无需对所述目标图像进行图像反转处理。当所述像素均值小于所述均值阈值时，表明所述目标图像中黑色为主色调，即所述目标图像为黑底白字图像，将所述目标图像进行黑白色调反转处理。
39.(2)匹配与所述标准差对应的去噪算法。
40.即使使用相同的材质，但光源不同时，也会导致目标图像中的噪点不同，通过标准
差来判断影像的噪点多寡，从而决定使用何种去噪方式。采用不同的去噪方式进行去噪，使得去噪更具针对性，去噪效果更佳。
41.具体实施时，预先设置标准差阈值，判断所述标准差是否大于所述标准差阈值，当所述标准差大于所述标准差阈值时，说明所述反转图像噪点多，可以采用高斯模糊去噪算法。当所述标准差小于所述标准差阈值时，说明所述反转图像噪点少，可以采用双边滤波器去噪算法。
42.(3)根据所述图像长度及宽度确定所述去噪算法的核参数，并使用所述去噪算法对所述反转图像进行去噪处理，得到增强图像。
43.示例性的，获取一张大小为1102像素*1102像素的ic封装印字图像，通过计算得到像素均值为48.97，标准差为28.01。假设设置的均值阈值为128，标准差阈值为31，由于48.97小于所述均值阈值128，则表明所述ic封装印字图像为黑底白字图像，将所述ic封装印字图像进行黑白色调反转处理，所述ic封装印字图像转化为白底黑字。由于28.01小于所述标准差阈值31，表明所述ic封装印字图像噪点少，所以采用双边滤波器去噪。由于所述ic封装印字图像的大小介于阈值1000到2000之间，所以去噪算法参数的核选择13*13。
44.通过利用所述目标图像的图像特征增强所述目标图像，可以更精准的对文字进行分割。
45.s13、检测所述增强图像中文字的闭合边缘。
46.为了提取所述文字的轮廓，需要先提取所述文字的边缘。由于所述增强图像中的文字可能存在文字断裂问题，例如，图3所示的英文字母，因此需要将所述文字中的所有闭合边缘提取出来。提取出的闭合边缘参阅图4所示。
47.可以使用边缘检测算法检测所述增强图像中文字的闭合边缘。但针对ic封装印字图像的特性，本实施例可以对所述增强图像进行形态学处理，包括侵蚀和膨胀，得到形态学图像。对所述形态学图像进行边缘检测，得到边缘图像。提取所述边缘图像中的所述闭合边缘。
48.通过对增强图像进行形态学处理，能够使得文字与背景更容易分离，基于形态学图像进行边缘检测，能够更容易检测的提取出边缘图像中的闭合边缘，闭合边缘的提取效果更佳。
49.s14、基于所述闭合边缘确定所述文字对应的第一矩形轮廓。
50.在本实施方式中，所述基于所述闭合边缘确定所述文字对应的第一矩形轮廓包括：
51.(1)生成与所述目标图像大小相同的空白图像。具体实施时，可以根据所述目标图像的长度和宽度生成所述空白图像。
52.(2)根据所述闭合边缘在所述空白图像上生成矩形轮廓，得到轮廓图像，所述矩形轮廓在所述轮廓图像中的位置与所述闭合边缘对应的轮廓图像在所述目标图像中的位置相同。具体实施时，根据每个所述闭合边缘在所述目标图像中查找与每个所述闭合边缘对应的轮廓，并获取所述轮廓的位置坐标。根据所述位置坐标在所述空白图像上生成所述矩形轮廓。例如，图5。
53.(3)检测所述轮廓图像中的所有轮廓。具体实施时，由于所述文字可能存在断裂，例如，文字断裂为两部分，就会产生两个闭合边缘，因此产生两个矩形轮廓，所述矩形轮廓
可能会存在重叠的情况，需要将重叠的矩形轮廓进行合并。对所述轮廓图像进行轮廓查找，可以将存在重叠的矩形轮廓合并为同一个矩形轮廓。例如，图6。
54.(4)将每个轮廓确定为所述第一矩形轮廓。
55.将所有连续轮廓的边框画在一张空白的影像上，这时候，所有的不规则形边框，就会合并成一个完整的矩形边框。使用两次轮廓查找与轮廓整合，得到文字的轮廓。并考虑到文字断裂的情况，将断裂的文字产生的所有重叠的矩形轮廓进行合并，可以提高文字分割的准确率。
56.s15、对所述第一矩形轮廓进行矫正，得到第二矩形轮廓。
57.所述步骤s14将所述目标图像中断裂文字中存在重叠的轮廓进行了合并，得到了所述第一矩形轮廓。然而还可能存在其他情况，例如，断裂文字中的轮廓没有发生重叠，相隔太近的文字被同一个第一矩形轮廓框选，以及被视为噪点或是不需要分割的小字符被所述第一矩形轮廓框选。
58.在本实施方式中，所述对所述第一矩形轮廓进行矫正，得到第二矩形轮廓包括：
59.(1)计算所述第一矩形轮廓的平均面积、平均横向间距、平均纵向间距。具体实施时，以所述增强图像正向放置时的左下角为原点o，横向为x轴，纵向为y轴，建立一个第三坐标系(xoy)。确定每个所述第一矩形轮廓的四个顶点坐标，根据所述顶点坐标确定每个所述第一矩形轮廓的宽度和长度，根据所述宽度和所述长度计算得到所述平均面积。基于所述顶点坐标确定水平相邻的第一矩形轮廓，计算所述水平相邻的第一矩形轮廓的平均横向间距。基于所述顶点坐标确定垂直相邻的第一矩形轮廓，计算所述垂直相邻的第一矩形轮廓的平均纵向间距。
60.(2)根据所述平均面积、所述平均横向间距和所述平均纵向间距修正所述第一矩形轮廓，得到所述文字对应的第二矩形轮廓。具体实施时，确定水平相邻的两个所述第一矩形轮廓之间的相邻横向间距，及垂直相邻的两个所述第一矩形轮廓之间的相邻纵向间距。将小于所述平均横向间距的相邻横向间距对应的两个第一矩形轮廓进行合并，将小于所述平均纵向间距的相邻纵向间距对应的两个第一矩形轮廓进行合并，得到候选矩形框。移除小于所述平均面积第一预设倍数的候选矩形框，例如，标点符号“，”。拆分大于所述平均面积第二预设倍数的候选矩形框，例如，图7。得到所述第二矩形轮廓。其中所述第一预设倍数小于1，所述第二预设倍数大于1。
61.可选的，获取所述候选矩形框包括：
62.s501：查找所述相邻横向间距小于所述平均横向间距的第一矩形轮廓；
63.s502：根据所述第一矩形轮廓的顶点坐标将所述第一矩形轮廓进行合并，得到第四矩形轮廓；
64.s503：查找所述相邻纵向间距小于所述平均纵向间距的第四矩形轮廓；
65.s504：根据所述第四矩形轮廓的顶点坐标将所述第四矩形轮廓进行合并，得到的第五矩形轮廓；
66.s505：确定水平相邻的两个所述第五矩形轮廓之间的相邻横向间距，及垂直相邻的两个所述第五矩形轮廓之间的相邻纵向间距，执行所述步骤1；
67.s506：当所述相邻横向间距大于所述平均横向间距且所述相邻纵向间距大于所述平均纵向间距时，结束合并。
68.示例性的，如图8所示，“x”断裂为五部分，因此产生五个所述第一矩形轮廓。为了将所述五个所述第一矩形轮廓进行合并，获取所述第一矩形轮廓的之间的相邻水平间距，将所述相邻横向间距小于所述平均横向间距的第一矩形轮廓进行合并，获取所述第一矩形轮廓的之间的相邻纵向间距，将所述相邻纵向间距小于所述平均纵向间距的第一矩形轮廓进行合并，得到“x”的完整矩形轮廓。
69.通过对所述第一矩形轮廓进行矫正，可以提高所述目标图像的文字分割正确率。
70.s16、根据所述第二矩形轮廓对所述目标图像进行文字分割。
71.在本实施方式中，所述第二矩形轮廓框选一个完整的文字，因此可以根据所述第二矩形轮廓对所述目标图像进行文字分割。
72.例如，图9所示的最终的文字分割结果，其中左侧图像为利用神经网络模型得到的文字分割结果，右侧图像是利用本技术的文字分割方法得到的文字分割结果。
73.请继续参阅图1，本实施例中，所述存储器11可以是电子设备1的内部存储器，即内置于所述电子设备1的存储器。在其他实施例中，所述存储器11也可以是电子设备1的外部存储器，即外接于所述电子设备1的存储器。
74.在一些实施例中，所述存储器11用于存储程序代码和各种数据，并在电子设备1的运行过程中实现高速、自动地完成程序或数据的存取。
75.所述存储器11可以包括随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘、智能存储卡(smart media card，smc)、安全数字(secure digital，sd)卡、闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
76.在一实施例中，所述处理器12可以是中央处理单元(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器也可以是其它任何常规的处理器等。
77.所述存储器11中的程序代码和各种数据如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术实现上述实施例方法中的全部或部分流程，例如文字分割方法，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，所述计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)等。
78.可以理解的是，以上所描述的模块划分，为一种逻辑功能划分，实际实现时可以有另外的划分方式。另外，在本技术各个实施例中的各功能模块可以集成在相同处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在相同单元中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
79.最后应说明的是，以上实施例仅用以说明本技术的技术方案而非限制，尽管参照
较佳实施例对本技术进行了详细说明，本领域的普通技术人员应当理解，可以对本技术的技术方案进行修改或等同替换，而不脱离本技术技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

文字分割方法、电子设备及存储介质与流程

相关文献

最热文献