一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本检测方法、装置、电子设备及存储介质与流程

2022-02-20 12:52:58 来源:中国专利 TAG:


1.本发明涉及图像处理领域,尤其涉及一种文本检测方法、装置、电子设备及存储介质。


背景技术:

2.目前的文本检测相关工作基本都是针对正常光照情况进行,暗光环境下的文本检测工作十分稀缺。现阶段暗光文本检测主要是先增强图片亮度再进行检测的技术方法,即先利用传统图像处理方法增强图像亮度,然后利用mser预测含有误检对象的候选结果,再结合手工特征和卷积神经网络对亮度增强文本的分布进行学习,剔除非文本候选对象,得到最终的检测结果。然而,在此方法中,通过无参照的图像亮度增强方法,使得放大图像中的噪声。同时需要通过人工方式引入手工特征,从而降低了暗光环境下文本检测的准确性。


技术实现要素:

3.本发明提供一种文本检测方法、装置、电子设备及存储介质,旨在提升暗光环境下文本检测的准确性。
4.本发明提供一种文本检测方法,包括:
5.通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
6.基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
7.基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
8.基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
9.根据本发明提供的一种文本检测方法,所述基于所述热力图和所述文本预测框进行文本检测的步骤包括:
10.基于所述热力图确定所述特征补全的原始暗光图像中,各个像素点对应的像素分值;
11.基于各个所述像素分值确定对应的正样本区域,并基于所述正样本区域和所述文本预测框进行文本检测。
12.根据本发明提供的一种文本检测方法,所述原始特征包括第一部分原始特征和第二部分原始特征,
13.所述基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像的步骤包括:
14.将所述补充特征和所述第一部分原始特征,输入至第一特征融合模块,其中,所述第一特征融合模块包括第一合并函数和第一卷积层;
15.基于所述第一合并函数和所述第一卷积层,将所述补充特征补全至所述第一部分原始特征中;
16.将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像。
17.根据本发明提供的一种文本检测方法,所述第二部分原始特征包括第一特征和第二特征,所述第一特征在所述第二特征的底层,
18.所述将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像的步骤包括:
19.获取所述第一特征对应的第一上一级特征,将所述第一特征和所述第一上一级特征输入至第二特征融合模块,其中,所述第二特征融合模块包括第二合并函数和第二卷积层;
20.基于所述第二合并函数和所述第二卷积层,将所述第一特征和所述第一上一级特征进行第一次特征融合;
21.获取所述第二特征对应的第二上一级特征,基于所述第二合并函数和所述第二卷积层,将所述第二特征和所述第二上一级特征进行第二次特征融合;
22.基于所述第一次特征融合和所述第二次特征融合,得到所述特征补全的原始暗光图像。
23.根据本发明提供的一种文本检测方法,所述基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像的步骤包括:
24.确定所述原始光照图像中各个图像点的像素值,并基于所述参数矩阵结合预设迭代函数对各个所述像素值进行迭代调整,得到各个所述像素值对应的调整后的像素值;
25.基于各个所述调整后的像素值,及平均亮度的约束信息调整所述原始光照图像的图像亮度,得到所述待处理暗光图像。
26.根据本发明提供的一种文本检测方法,所述基于特征提取网络对所述原始光照图像对应的原始暗光图像进行多层特征提取,得到所述原始暗光图像对应的原始特征的步骤包括:
27.基于所述特征提取网络对原始暗光图像进行多层特征提取,得到原始暗光图像对应的预设层特征,并将所述预设层特征确定为所述原始特征。
28.根据本发明提供的一种文本检测方法,所述通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像的步骤之前,还包括:
29.通过摄像设备拍摄在预设正常光照环境下带有文本数据的图像,得到对应的原始光照图像;
30.通过所述摄像设备拍摄在预设暗光环境下所述原始光照图像对应的图像,得到所述原始光照图像对应的原始暗光图像。
31.本发明还提供一种文本检测装置,包括:
32.合成模块,用于通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
33.提取模块,用于基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
34.融合模块,用于基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
35.检测模块,用于基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
36.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本检测方法的步骤。
37.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文本检测方法的步骤。
38.本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被所述处理器执行时实现如上任一种所述文本检测方法的步骤。
39.本发明提供的文本检测方法、装置、电子设备及存储介质,通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于参数矩阵调整原始光照图像的图像亮度,得到原始光照图像对应的待处理暗光图像;基于特征提取网络对原始光照图像对应的原始暗光图像,以及待处理暗光图像分别进行多层特征提取,分别得到原始暗光图像对应的原始特征和补充特征;基于补充特征对原始特征进行特征补全,得到特征补全的原始暗光图像;基于输出网络输出特征补全的原始暗光图像的热力图和文本预测框,并基于热力图和文本预测框进行文本检测。由此可知,本发明通过合成暗光图像,以及基于合成的暗光数据对原始暗光图像进行特征补全,不需要增强图像亮度以及通过人工方式引入手工特征,从而对暗光环境下的文本直接进行检测,提升了暗光环境下文本检测的准确性。
附图说明
40.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
41.图1是本发明提供的文本检测方法的流程示意图之一;
42.图2是本发明提供的文本检测方法的流程示意图之二;
43.图3是本发明提供的文本检测装置的结构示意图;
44.图4是本发明提供的电子设备的结构示意图。
具体实施方式
45.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
46.下面结合图1至图4描述本发明提供的文本检测方法、装置、电子设备及存储介质。
47.具体地,本发明提供一种文本检测方法,参照图1,图1是本发明提供的文本检测方法的流程示意图之一。
48.本发明实施例提供了文本检测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些数据下,可以以不同于此处的顺序完成所示出或描述的步骤。
49.本发明实施例方法以电子设备作为执行主体进行举例,本发明实施例提供的文本检测方法包括:
50.步骤s10,通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像。
51.需要说明的是,本发明实施例中的文本检测系统是电子设备的表现形式之一,并不对电子设备进行限制,本实施例的文本检测系统中至少包括特征金字塔、特征提取网络以及输出网络。
52.进一步需要说明的是,文本检测系统在将原始光照图像处理之前,需要通过摄像设备(摄像机、摄像仪等)拍摄正常光照环境下,以及暗光环境下的图片,得到正常光照环境下的原始光照图像和暗光环境下的原始暗光图像的数据集,具体如步骤a至步骤b。
53.步骤a,通过摄像设备拍摄在预设正常光照环境下带有文本数据的图像,得到对应的原始光照图像;
54.步骤b,通过所述摄像设备拍摄在预设暗光环境下所述原始光照图像对应的图像,得到所述原始光照图像对应的原始暗光图像。
55.具体地,文本检测系统通过摄像设备拍摄在预设正常光照环境下带有文本数据的图像,得到在预设正常光照环境下的原始光照图像,同时,需要将原始光照图像中的文本数据进行标签,得到带有文本标签数据的原始光照图像。接着,文本检测系统需要通过摄像设备拍摄在预设暗光环境下,该原始光照图像对应的图像,得到预设暗光环境下该原始光照图像对应的原始暗光图像,同时,需要将原始暗光图像中的文本数据进行标签,得到带有文本标签数据的原始暗光图像。其中,预设正常光照环境和预设暗光环境都是根据实际情况而定,本实施例不作限制。进一步需要说明的是,本实施例的文本检测方法就是基于带有文本标签数据的原始光照图像和带有文本标签数据的原始暗光图像的数据集进行的。
56.本实施例通过采集带有文本标签数据的原始光照图像和带有文本标签数据的原始暗光图像的数据集,通过带有文本标签数据的原始光照图像和带有文本标签数据的原始暗光图像的数据集进行文本检测,而不需要人工拍摄和人工制作数据集,从而保证了数据集中原始光照图像和原始暗光图像的准确性,从而提升了暗光环境下文本检测的准确性。
57.进一步地,在得到数据集后,文本检测系统通过unet(特征金字塔的其中一种具体方式)将原始光照图像进行归一化,将原始光照图像中的每个像素点归一化为0至1之间对应的参数,归一化得到的所有参数构成了原始光照图像对应的参数矩阵,其中,需要说明的是,参数矩阵的大小与原始光照图像的大小是一致的。接着,文本检测系统基于参数矩阵调整原始光照图像的图像亮度,得到原始光照图像对应的待处理暗光图像,具体如步骤s101至步骤s102。
58.步骤s101,确定所述原始光照图像中各个图像点的像素值,并基于所述参数矩阵
结合预设迭代函数对各个所述像素值进行迭代调整,得到各个所述像素值对应的调整后的像素值;
59.步骤s102,基于各个所述调整后的像素值,及平均亮度的约束信息调整所述原始光照图像的图像亮度,得到所述待处理暗光图像。
60.具体地,文本检测系统确定原始光照图像中各个图像点的像素值,并基于参数矩阵结合预设迭代函数对各个像素值进行迭代调整,预设迭代函数为le(i(x);α)=i(x) ani(x)(1-i(x)),i(x)为原始光照图像中x位置原始光照图像中的像素值,a(n)为第n轮迭代的参数矩阵,经过参数矩阵和预设迭代函数的调整后,得到各个像素值对应的调整后的像素值。接着,文本检测系统根据平均亮度的约束信息对各个调整后的像素值进行调整,得到原始光照图像对应的待处理暗光图像,其中,需要说明的是,由于合成待处理暗光图像的过程前后,待处理暗光图像的大小与原始光照图像的大小是一样的,因此,待处理暗光图像中的文本标签数据与原始光照图像中的文本标签数据是一样的,也就是说可以直接使用待处理暗光图像中的文本标签数据。
61.进一步地,对预设迭代函数le(i(x);α)=i(x) ani(x)(1-i(x))的具体分析如下:不妨设f(x)=x αx(1-x),f

(x)=1 α-2αx,f

(x)=-2α,当α∈[-1,0]时,f

(x)=-2α>0》0,单调递增,那么f

(x)=1 α-2αx∈[1 a,1-a],f(x)=x αx(1-x)单调递增。f(x)∈[0,1]。当α∈[-1,0]时,f

(x)=-2α《0,单调递减,那么f

(x)=1 α-2αx∈[1-a,1 a],f(x)=x αx(1-x)单调递增。f(x)∈[0,1]。也就是说,输入以及输出的像素值范围都可以保持在0至1区间,且针对于同一参数,迭代函数保持单调。
[0062]
本实施例通过参数矩阵和预设迭代函数合成原始光照图像的待处理暗光图像,而不需要通过人工方式制作暗光图像,从而使得资源最大化,同时,由于合成前后待处理暗光图像的大小与原始光照图像的大小是一样的,没有改变原始光照图像中的文本标签数据,从而保证了待处理暗光图像的准确性,从而保证了暗光环境下文本检测的准确性。
[0063]
步骤s20,基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征。
[0064]
文本检测系统得到原始光照图像对应的待处理暗光图像后,需要将原始光照图像对应的原始暗光图像,以及该待处理暗光图像输入至特征提取网络中,通过特征提取网络对原始暗光图像和待处理暗光图像进行多层特征提取,得到原始暗光图像的原始特征以及对应的补充特征。其中,本实施例中利用resnet50特征提取器作为特征提取网络的其中一种具体方式,具体如步骤s201。
[0065]
步骤s201,基于所述特征提取网络对原始暗光图像进行多层特征提取,得到原始暗光图像对应的预设层特征,并将所述预设层特征确定为所述原始特征。
[0066]
具体地,文本检测系统通过resnet50特征提取器对原始暗光图像进行多层特征提取,得到原始暗光图像对应的预设层特征,需要说明的是,本实施例中的预设层特征为4层特征,也即通过resnet50特征提取器提取到原始暗光图像的4层特征,并将该4层特征确定为原始暗光图像的4层原始特征,其中,每一层原始特征都有其对应的特征通道数,特征通道数从高到低分别为2048、1024、512和256,特征通道数从高到低的特征大小相对于原始暗光图像分别为1/32、1/16、1/8和1/4,进一步可以理解为,特征通道数为2048的原始特征为
最高层原始特征,特征通道数为256的原始特征为最低层原始特征,特征通道数为1024和512的原始特征为中间层原始特征,按照特征通道数的高低依次排序。
[0067]
同理,文本检测系统通过resnet50特征提取器对待处理暗光图像进行多层特征提取,得到待处理暗光图像对应的预设层特征,也即通过resnet50特征提取器提取到待处理暗光图像的4层特征,并将该4层特征确定为原始暗光图像的4层补充特征,其中,每一层补充特征都有其对应的特征通道数,特征通道数从高到低分别为2048、1024、512和256,特征通道数从高到低的特征大小相对于待处理暗光图像分别为1/32、1/16、1/8和1/4。进一步可以理解为,特征通道数为2048的补充特征为最高层补充特征,特征通道数为256的补充特征为最低层补充特征,特征通道数为1024和512的补充特征为中间层补充特征,按照特征通道数的高低依次排序。
[0068]
进一步需要说明的是,文本检测系统通过resnet50特征提取器对待处理暗光图像进行多层特征提取之前,需要通过步骤s101至步骤s102的方式逐像素调整待处理暗光图像,其中,调整图像亮度的约束信息来源于resnet50特征提取器对待处理暗光图像的检测结果,由于resnet50特征提取器中的参数是可变的,因此对于不同的图像,resnet50特征提取器的检测结果是不一样的。
[0069]
本实施例通过特征提取网络提取原始暗光图像的原始特征和补充特征,而不需要通过人工方式引入特征,在保证提取到的原始特征和补充特征齐全的同时,保证了原始特征和补充特征的准确性,从而保证了暗光环境下文本检测的准确性。
[0070]
步骤s30,基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像。
[0071]
文本检测系统得到原始暗光图像的原始特征和补充特征后,将补充特征中的最高两层补充特征,对原始特征中的最高两层原始特征进行特征补全。接着,文本检测系统将剩余的两层原始特征与其对应的上一级特征进行特征融合,得到特征补全的原始暗光图像。
[0072]
步骤s40,基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
[0073]
文本检测系统通过输出网络输出特征补全的原始暗光图像的热力图和文本预测框,其中,文本预测框即根据特征补全的原始暗光图像的文本标签数据,生成对应的文本预测框,也即根据特征补全的原始暗光图像的文本标签数据将某个位置区域圈取为文本预测框。热力图即像素分值图,即热力图中包含有补全的原始暗光图像的每个像素点的像素分值,根据像素分值确定属于文本的概率,热力图为单通道图。接着,文本检测系统根据热力图和文本预测框对特征补全的原始暗光图像进行文本检测,具体如步骤s401至步骤s402。
[0074]
步骤s401,基于所述热力图确定所述特征补全的原始暗光图像中,各个像素点对应的像素分值;
[0075]
步骤s402,基于各个所述像素分值确定对应的正样本区域,并基于所述正样本区域和所述文本预测框进行文本检测。
[0076]
具体地,文本检测系统确定热力图中特征补全的原始暗光图像各个像素点对应的像素分值,确定是否存在目标像素分值,其中,目标像素分值大于预设分值阈值,也即当目标像素分值大于预设分值阈值时,说明该目标像素分值对应的像素点是文本的可能性极大。因此,若确定存在目标像素分值,文本检测系统则确定所有目标像素分值对应的像素点
(目标像素点),根据所有的目标像素点确定特征补全的原始暗光图像对应的正样本区域,正样本区域也即可能出现文本的区域。需要说明的是,除了输出上述的热力图和文本预测框之外,还输出特征补全的原始暗光图像的距离图,距离图为五通道图,前四个通道为各个像素点到正样本区域的四边距离,第五个通道为正样本区域相应的旋转角度。接着,文本检测系统根据正样本区域对文本预测框对特征补全的原始暗光图像进行文本检测,得到特征补全的原始暗光图像中的文本。
[0077]
进一步地,对于热力图和文本预测框,热力图和文本预测框两者之间的损失函数如下:l=ls λbl
bbox
,其中,ls为热力图的损失函数,l
bbox
为文本预测框的损失函数,λb为系数,系数一般设定为1。对于热力图的损失函数ls,
[0078]
ls=l
s1
l
s2
[0079]
l
s1
=-ylog(x)-(1-y)log(1-x)
[0080][0081]
其中,x为预测的正样本区域,y为正样本区域对应的文本标签数据。对于热力图的损失函数,对于文本预测框的损失函数l
bbox

[0082][0083]
其中,p为文本预测框,p*为文本预测框对应的文本标签数据,λ
θ
为角度参数,角度参数的值一般设定为20。
[0084]
本实施例通过输出网络输出的热力图确定特征补全的原始暗光图像对应的正样本区域,再根据正样本区域对文本预测框对特征补全的原始暗光图像进行文本检测,得到特征补全的原始暗光图像中的文本,从而保证了暗光环境下文本检测的准确性。
[0085]
本实施例提供了文本检测方法,通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于参数矩阵调整原始光照图像的图像亮度,得到原始光照图像对应的待处理暗光图像;基于特征提取网络对原始光照图像对应的原始暗光图像,以及待处理暗光图像分别进行多层特征提取,分别得到原始暗光图像对应的原始特征和补充特征;基于补充特征对原始特征进行特征补全,得到特征补全的原始暗光图像;基于输出网络输出特征补全的原始暗光图像的热力图和文本预测框,并基于热力图和文本预测框进行文本检测。由此可知,本实施例通过合成暗光图像,以及基于合成的暗光数据对原始暗光图像进行特征补全,从而对暗光环境下的文本直接进行检测,提升了暗光环境下文本检测的准确性。
[0086]
进一步地,参照图2,图2是本发明提供的文本检测方法的流程示意图之二,所述步骤s30包括:
[0087]
步骤s301,将所述补充特征和所述第一部分原始特征,输入至第一特征融合模块,其中,所述第一特征融合模块包括第一合并函数和第一卷积层;
[0088]
步骤s302,基于所述第一合并函数和所述第一卷积层,将所述补充特征补全至所述第一部分原始特征中;
[0089]
步骤s303,将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像。
[0090]
需要说明的是,步骤s201说明了有4层补充特征,因此,将补充特征分为第一部分
原始特征和第二部分原始特征,第一部分原始特征即最高两层原始特征,第二部分原始特征即最低两层原始特征。
[0091]
文本检测系统将补充特征中的最高两层补充特征和第一部分原始特征输入至第一特征融合模块,也即将补充特征中的最高两层补充特征和原始特征中的最高两层原始特征输入至第一特征融合模块中,其中,第一特征融合模块包括第一合并函数concat和第一卷积层,第一卷积层为两层1
×
1卷积层,通过第一合并函数concat和两层1
×
1卷积将补充特征中的最高两层补充特征和原始特征中的最高两层原始特征进行特征补全。接着,文本检测系统将第二部分原始特征及其对应的上一级特征进行特征融合,也即将原始特征中的最低两层原始特征及其对应的上一级特征进行特征融合,得到特征补全的原始暗光图像,具体如步骤s3031至步骤s3034。
[0092]
步骤s3031,获取所述第一特征对应的第一上一级特征,将所述第一特征和所述第一上一级特征输入至第二特征融合模块,其中,所述第二特征融合模块包括第二合并函数和第二卷积层;
[0093]
步骤s3032,基于所述第二合并函数和所述第二卷积层,将所述第一特征和所述第一上一级特征进行第一次特征融合;
[0094]
步骤s3033,获取所述第二特征对应的第二上一级特征,基于所述第二合并函数和所述第二卷积层,将所述第二特征和所述第二上一级特征进行第二次特征融合;
[0095]
步骤s3034,基于所述第一次特征融合和所述第二次特征融合,得到所述特征补全的原始暗光图像。
[0096]
具体地,第二部分原始特征也包括两层原始特征,因此第二部分原始特征可以分为第一特征和第二特征,第一特征和第二特征并没有实质区别,而是用第一和第二区别层次不同的关系,也即第一特征在第二特征的底部,也即第一特征为原始特征中最底层原始特征,第二特征为原始特征中倒数第二层原始特征。
[0097]
文本检测系统获取第一特征对应的第一上一级特征,将第一特征和第一上一级特征输入至第二特征融合模块,即将原始特征中最底层原始特征及其对应的第一上一级特征输入至第二特征融合模块,其中,第二特征融合模块包括第二合并函数concat和第二卷积层,第二卷积层由3
×
3卷积层和1
×
1卷积层组成,通过第二合并函数concat,以及第二卷积层中的3
×
3卷积层和1
×
1卷积层,将原始特征中最底层原始特征及其对应的第一上一级特征进行第一次特征融合。接着,文本检测系统获取第二特征对应的第二上一级特征,也即原始特征中倒数第二层原始特征对应的第二上一级特征,将原始特征中倒数第二层原始特征及其对应的第二上一级特征输入至第二特征融合模块,通过第二合并函数concat,以及第二卷积层中的3
×
3卷积层和1
×
1卷积层,将原始特征中倒数第二层原始特征及其对应的第二上一级特征进行第二次特征融合,通过第一次特征融合和第二次特征融合,将4层原始特征全部补全,得到特征补全的原始暗光图像。
[0098]
本实施例提供了文本检测方法,通过将补充特征和第一部分原始特征,输入至第一特征融合模块,其中,第一特征融合模块包括第一合并函数和第一卷积层;基于第一合并函数和第一卷积层,将补充特征补全至第一部分原始特征中;将第二部分原始特征及其对应的上一级特征进行特征融合,得到特征补全的原始暗光图像。由此可知,本实施例先对原始特征中的最高两层原始特征进行特征补全,再对原始特征中的最低两层原始特征进行特
征融合,充分利用了全局特征信息和局部特征信息,从而得到细节信息更加清楚和丰富的特征补全的原始暗光图像,从而保证了暗光环境下文本检测的准确性。
[0099]
进一步地,下面对本发明提供的文本检测装置进行描述,下文描述的文本检测装置与上文描述的文本检测方法可相互对应参照。
[0100]
如图3所示,图3是本发明提供的文本检测装置的结构示意图,文本检测装置,包括:
[0101]
合成模块301,用于通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
[0102]
提取模块302,用于基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
[0103]
融合模块303,用于基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
[0104]
检测模块304,用于基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
[0105]
进一步地,所述检测模块304还用于:
[0106]
基于所述热力图确定所述特征补全的原始暗光图像中,各个像素点对应的像素分值;
[0107]
基于各个所述像素分值确定对应的正样本区域,并基于所述正样本区域和所述文本预测框进行文本检测。
[0108]
进一步地,所述融合模块303还用于:
[0109]
将所述补充特征和所述第一部分原始特征,输入至第一特征融合模块,其中,所述第一特征融合模块包括第一合并函数和第一卷积层;
[0110]
基于所述第一合并函数和所述第一卷积层,将所述补充特征补全至所述第一部分原始特征中;
[0111]
将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像。
[0112]
进一步地,所述融合模块303还用于:
[0113]
获取所述第一特征对应的第一上一级特征,将所述第一特征和所述第一上一级特征输入至第二特征融合模块,其中,所述第二特征融合模块包括第二合并函数和第二卷积层;
[0114]
基于所述第二合并函数和所述第二卷积层,将所述第一特征和所述第一上一级特征进行第一次特征融合;
[0115]
获取所述第二特征对应的第二上一级特征,基于所述第二合并函数和所述第二卷积层,将所述第二特征和所述第二上一级特征进行第二次特征融合;
[0116]
基于所述第一次特征融合和所述第二次特征融合,得到所述特征补全的原始暗光图像。
[0117]
进一步地,所述合成模块301还用于:
[0118]
确定所述原始光照图像中各个图像点的像素值,并基于所述参数矩阵结合预设迭代函数对各个所述像素值进行迭代调整,得到各个所述像素值对应的调整后的像素值;
[0119]
基于各个所述调整后的像素值,及平均亮度的约束信息调整所述原始光照图像的图像亮度,得到所述待处理暗光图像。
[0120]
进一步地,所述提取模块302还用于:
[0121]
基于所述特征提取网络对原始暗光图像进行多层特征提取,得到原始暗光图像对应的预设层特征,并将所述预设层特征确定为所述原始特征。
[0122]
进一步地,文本检测装置还包括:
[0123]
获取模块,用于通过摄像设备拍摄在预设正常光照环境下带有文本数据的图像,得到对应的原始光照图像;
[0124]
所述获取模块还用于通过所述摄像设备拍摄在预设暗光环境下所述原始光照图像对应的图像,得到所述原始光照图像对应的原始暗光图像。
[0125]
本发明提供的文本检测装置的具体实施例与上述文本检测方法各实施例基本相同,在此不作赘述.
[0126]
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communications interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行文本检测方法,该方法包括:
[0127]
通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
[0128]
基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
[0129]
基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
[0130]
基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
[0131]
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0132]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的文本检测方法,该方法包括:
[0133]
通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
[0134]
基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
[0135]
基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
[0136]
基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
[0137]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的文本检测方法,该方法包括:
[0138]
通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
[0139]
基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
[0140]
基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
[0141]
基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
[0142]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0143]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0144]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献