一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种降噪方法、装置、电子设备及介质与流程

2022-04-13 19:29:08 来源:中国专利 TAG:


1.本技术涉及图像处理技术领域,特别是涉及一种降噪方法、装置、电子设备及介质。


背景技术:

2.目前对于图像或者视频进行降噪主要采用多帧降噪的方式,即,获取要进行降噪的图像的前后几帧图像,对获取到的多帧图像采取叠加平均值的方法进行降噪。
3.而在拍摄图像或者视频时,拍摄设备可能会存在抖动,被拍摄的物体也可能是运动中的物体,所以这种对多帧图像叠加平均值的降噪方式会导致降噪后的图像或视频中存在重影。


技术实现要素:

4.本技术实施例的目的在于提供一种降噪方法、装置、电子设备及介质,用以解决对视频或者图像降噪会产生重影的问题。具体技术方案如下:
5.第一方面,本技术实施例提供一种降噪方法,包括:
6.将待处理图像输入图像降噪模型,所述图像降噪模型为基于预设训练集对卷积神经网络模型训练得到的模型,所述预设训练集中包括多组标注数据以及每组标注数据对应的样本数据;其中,一组标注数据包括对一张基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,该组标注数据对应的样本数据包括对所述多张无噪声图像分别叠加噪声后得到的图像;
7.获取所述图像降噪模型输出的降噪后的图像数据;
8.将所述图像数据转换为图像,得到所述待处理图像对应的降噪后的图像。
9.在一种可能的实现方式中,所述预设训练集通过以下步骤得到:
10.采集多张基准无噪声图像;
11.针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据;
12.对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
13.将得到的多组标注数据以及每组标注数据对应的样本数据生成所述预设训练集。
14.在一种可能的实现方式中,所述预设训练集通过以下步骤得到:
15.采集多张基准无噪声图像;
16.每次从所述多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
17.按照第一指定形状和第一指定尺寸裁剪所述背景图像;
18.按照所述第一指定形状和第二指定尺寸裁剪所述前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像;
19.将所述第二指定形状的前景图像叠加在裁剪后的背景图像上的起始位置,将所述
第二指定的前景图像在所述背景图像上按照预设速度朝预设方向平移,将平移过程中的多个时刻的图像作为一组标注数据;
20.对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
21.将得到的多组标注数据以及每组标注数据对应的样本数据生成所述预设训练集。
22.在一种可能的实现方式中,在所述将得到的多组标注数据以及每组标注数据对应的样本数据生成所述预设训练集之前,所述方法还包括:
23.每次从所述多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
24.按照第一指定形状和第一指定尺寸裁剪所述背景图像;
25.按照所述第一指定形状和第二指定尺寸裁剪所述前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像,所述第二指定尺寸小于所述第一指定尺寸;
26.将所述第二指定形状的前景图像叠加在背景图像上的起始位置,将所述第二指定形状的前景图像在所述背景图像上按照预设速度朝预设方向平移,采集平移过程中多个时刻的图像作为一组标注数据。
27.在一种可能的实现方式中,所述针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据,包括:
28.针对每张基准无噪声图像,从该基准无噪声图像中随机选择一个位置作为起始裁剪坐标;
29.在所述基准无噪声图像的起始裁剪坐标处裁剪指定边长的正方形,作为一张裁剪图像;
30.将所述起始裁剪坐标进行随机偏移,得到下一个裁剪坐标,在所述基准无噪声图像的下一个裁剪坐标处裁剪所述指定边长的正方形,作为一张裁剪图像;
31.每对裁剪坐标进行一次随机偏移,从所述基准无噪声图像中裁剪出一张裁剪图像,直至得到预设数量的裁剪图像,将所述预设数量的裁剪图像作为一组标注数据。
32.在一种可能的实现方式中,所述采集多张基准无噪声图像,包括:
33.采集感光度被设置为最低值的拍摄设备拍摄到的多张静态raw图像;
34.针对每张静态raw图像,将该静态raw图像分别处理为不同的亮度值,得到多张基准无噪声图像。
35.在一种可能的实现方式中,所述图像降噪模型通过以下步骤训练得到:
36.将所述预设训练集包括的一组样本数据中的第一帧图像与自身进行拼接后,将拼接后的图像输入所述卷积神经网络模型,依次由所述神经网络模型包括的第一卷积网络和第二卷积网络处理拼接后的图像;
37.获取所述第一卷积网络输出的中间降噪图像和所述第二卷积网络输出的最终降噪图像;
38.基于所述最终降噪图像与所述第一帧图像计算损失函数值;
39.根据所述损失函数值判断所述卷积神经网络模型是否收敛;
40.若未收敛,则基于所述损失函数值调整所述卷积神经网络模型的参数,并将所述第一样本数据中的下一帧图像与所述第一卷积网络最近一次输出的中间降噪图像进行拼
接,返回所述将拼接后的图像输入所述卷积神经网络模型的步骤,直至所述卷积神经网络模型收敛时,则将训练得到的卷积神经网络模型作为所述图像降噪模型。
41.第二方面,本技术实施例提供一种降噪装置,包括:
42.第一输入模块,用于将待处理图像输入图像降噪模型,所述图像降噪模型为基于预设训练集对卷积神经网络模型训练得到的模型,所述预设训练集中包括多组标注数据以及每组标注数据对应的样本数据;其中,一组标注数据包括对一张基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,该组标注数据对应的样本数据包括对所述多张无噪声图像分别叠加噪声后得到的图像;
43.第一获取模块,用于获取所述图像降噪模型输出的降噪后的图像数据;
44.转换模块,用于将所述图像数据转换为图像,得到所述待处理图像对应的降噪后的图像。
45.在一种可能的实现方式中,所述装置还包括:
46.采集模块,用于采集多张基准无噪声图像;
47.截取模块,用于针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据;
48.第一叠加模块,用于对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
49.第一生成模块,用于将得到的多组标注数据以及每组标注数据对应的样本数据生成所述预设训练集。
50.在一种可能的实现方式中,所述装置还包括:
51.采集模块,用于采集多张基准无噪声图像;
52.第一选择模块,用于每次从所述多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
53.第一裁剪模块,用于按照第一指定形状和第一指定尺寸裁剪所述背景图像;
54.第一处理模块,用于按照所述第一指定形状和第二指定尺寸裁剪所述前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像;
55.第一平移模块,用于将所述第二指定形状的前景图像叠加在裁剪后的背景图像上的起始位置,将所述第二指定的前景图像在所述背景图像上按照预设速度朝预设方向平移,将平移过程中的多个时刻的图像作为一组标注数据;
56.第二叠加模块,用于对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
57.第二生成模块,用于将得到的多组标注数据以及每组标注数据对应的样本数据生成所述预设训练集。
58.在一种可能的实现方式中,所述装置还包括:
59.第二选择模块,用于每次从所述多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
60.第二裁剪模块,用于按照第一指定形状和第一指定尺寸裁剪所述背景图像;
61.第二处理模块,用于按照所述第一指定形状和第二指定尺寸裁剪所述前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像,所述第二指定尺寸小
于所述第一指定尺寸;
62.第二平移模块,用于将所述第二指定形状的前景图像叠加在背景图像上的起始位置,将所述第二指定形状的前景图像在所述背景图像上按照预设速度朝预设方向平移,采集平移过程中多个时刻的图像作为一组标注数据。
63.在一种可能的实现方式中,所述第一截取模块,具体用于:
64.针对每张基准无噪声图像,从该基准无噪声图像中随机选择一个位置作为起始裁剪坐标;
65.在所述基准无噪声图像的起始裁剪坐标处裁剪指定边长的正方形,作为一张裁剪图像;
66.将所述起始裁剪坐标进行随机偏移,得到下一个裁剪坐标,在所述基准无噪声图像的下一个裁剪坐标处裁剪所述指定边长的正方形,作为一张裁剪图像;
67.每对裁剪坐标进行一次随机偏移,从所述基准无噪声图像中裁剪出一张裁剪图像,直至得到预设数量的裁剪图像,将所述预设数量的裁剪图像作为一组标注数据。
68.在一种可能的实现方式中,所述采集模块,具体用于:
69.采集感光度被设置为最低值的拍摄设备拍摄到的多张静态raw图像;
70.针对每张静态raw图像,将该静态raw图像分别处理为不同的亮度值,得到多张基准无噪声图像。
71.在一种可能的实现方式中,所述装置还包括:
72.第二输入模块,用于将所述预设训练集包括的一组样本数据中的第一帧图像与自身进行拼接后,将拼接后的图像输入所述卷积神经网络模型,依次由所述神经网络模型包括的第一卷积网络和第二卷积网络处理拼接后的图像;
73.第二获取模块,用于获取所述第一卷积网络输出的中间降噪图像和所述第二卷积网络输出的最终降噪图像;
74.计算模块,用于基于所述最终降噪图像与所述第一帧图像计算损失函数值;
75.判断模块,用于根据所述损失函数值判断所述卷积神经网络模型是否收敛;若未收敛,则触发调整模块基于所述损失函数值调整所述卷积神经网络模型的参数,并将所述第一样本数据中的下一帧图像与所述第一卷积网络最近一次输出的中间降噪图像进行拼接,触发所述第二输入模块执行所述将拼接后的图像输入所述卷积神经网络模型的步骤,直至所述判断模块所述卷积神经网络模型收敛时,则将训练得到的卷积神经网络模型作为所述图像降噪模型。
76.第三方面,本技术实施例提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
77.存储器,用于存放计算机程序;
78.处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的方法步骤。
79.第四方面,本技术实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的方法步骤。
80.第五方面,本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算
机上运行时,使得计算机执行上述任一所述的降噪方法。
81.采用本技术实施例,可以通过图像降噪模型对待处理图像进行降噪,预设训练集中的标注数据为对基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,标注数据对应的样本数据包括对多张无噪声图像分别叠加噪声后得到的图像,因样本数据和标注数据模拟了图像运动,所以采用该预设训练集训练出的图像降噪模型在降噪时具有去重影效果,使得降噪得到的图像无重影,更加清晰。
82.当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
83.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
84.图1为本技术实施例提供的一种降噪方法的流程图;
85.图2为本技术实施例提供的另一种降噪方法的流程图;
86.图3为本技术实施例提供的一种图像截取方法的示例性示意图;
87.图4为本技术实施例提供的另一种降噪方法的流程图;
88.图5为本技术实施例提供的一直图像掩膜处理的示例性示意图;
89.图6为本技术实施例提供的一种图像平移的示例性示意图;
90.图7为本技术实施例提供的另一种降噪方法的流程图;
91.图8为本技术实施例提供的另一种降噪方法的流程图;
92.图9为本技术实施例提供的一种卷积神经网络结构图;
93.图10为本技术实施例提供的一种图像降噪效果对比的示例性示意图;
94.图11为本技术实施例提供一种降噪装置的结构示意图;
95.图12为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
96.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员基于本技术所获得的所有其他实施例,都属于本技术保护的范围。
97.为了得到更清晰的降噪图像或降噪视频,本技术实施例提供了一种降噪方法,如图1所示,该方法包括:
98.s101、将待处理图像输入图像降噪模型。
99.其中,图像降噪模型为基于预设训练集对卷积神经网络模型训练得到的模型,预设训练集中包括多组标注数据以及每组标注数据对应的样本数据;其中,一组标注数据包括对一张基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,该组标注数据对应的样本数据包括对多张无噪声图像分别叠加噪声后得到的图像。
100.也就是说,一组标注数据对应一组样本数据,一组标注数据中的无噪声图像与一组样本数据中的有噪声的图像有一一对应的关系。
101.待处理图像可以为需要被降噪的图像,具体可以为一张照片,或者是一段视频中的每一帧图像。
102.s102、获取图像降噪模型输出的降噪后的图像数据。
103.降噪模型输出的图像数据为降噪后的图像的原始图像格式(raw image format,raw)数据。
104.s103、将图像数据转换为图像,得到待处理图像对应的降噪后的图像。
105.在本技术实施例中,为了呈现给用户最佳视觉效果,需要将图像数据转换为标准红绿蓝(standard red green blue,srgb)图像,可以通过图像信号处理(image signal processor,isp)算法将图像数据转换为srgb图像,即,可以得到降噪后的srgb图像。
106.可以理解的是,如果需要对视频进行降噪,则可分别对该视频帧的每个视频帧进行降噪,从而得到降噪后的视频。
107.采用本技术实施例,可以通过图像降噪模型对待处理图像进行降噪,预设训练集中的标注数据为对基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,标注数据对应的样本数据包括对多张无噪声图像分别叠加噪声后得到的图像,因样本数据和标注数据模拟了图像运动,所以采用该预设训练集训练出的图像降噪模型在降噪时具有去重影效果,使得降噪得到的图像无重影,更加清晰。
108.为了实现图1所示的方法流程,需要先训练得到图像降噪模型,为了使得训练出的图像降噪模型能够处理拍摄设备在运动场景下拍摄得到图像,需要生成能够准确模拟相机运动的样本图像。以下对生成训练集的方法进行介绍。
109.在一种实施方式中,为了模拟在拍摄时,拍摄设备存整体运动的情形,比如相机存在抖动,如图2所示,预设训练集通过以下步骤得到:
110.s201、采集多张基准无噪声图像。
111.其中,该步骤具体可以实现为:采集感光度值被设置为最低值的拍摄设备拍摄到的多张静态raw图像;针对每张静态raw图像,将该静态raw图像分别处理为不同的亮度值,得到多张基准无噪声图像。
112.本技术实施例中的感光度可以为国际标准化组织(international standards organization,iso)规定的感光度。
113.在拍摄图像时,拍摄设备的iso值设置的越低,拍摄得到的图像的噪声强度就越小。
114.所以在本技术实施例中,为了获取基准无噪声图像,可以使用iso值被设置为最低值的拍摄设备拍摄到的多张静态raw图像,将多张静态raw图像作为基准无噪声图像。
115.拍摄设备可以为智能手机、数码相机等具有图像拍摄功能的设备,本技术实施例不做具体限定。
116.本技术实施例中,可以拍摄固定亮度下的张静态raw图像,然后可以针对每张静态raw图像,将该静态raw图像分别处理为不同的亮度值,得到多张基准无噪声图像。
117.由于图像的raw域数据和光照强度呈线性关系,所以为可通过以下公式得到多种亮度下的基准无噪声图像:
118.gti=gt0/ratioi119.其中gt0为图像在固定亮度下拍摄得到的静态raw图像的数据,ratioi为亮度倍率,ratioi可以为1、2或3等整数值,可根据实际需求设置。
120.图像的raw域数据与入射光强度程线性关系,并且raw域噪声可以基于物理成像过程进行建模,所以基于图像的raw域数据可以很好的使用监督学习对卷积神经网络模型进行训练,从而得到图像降噪模型。
121.s202、针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据。
122.其中,针对每张基准无噪声图像,可以从该基准无噪声图像中随机选择一个位置作为起始裁剪坐标。在基准无噪声图像的起始裁剪坐标处裁剪指定边长的正方形,作为一张裁剪图像。
123.其中,指定边长可以为patch_size,patch_size为上述图像降噪模型的卷积神经网络内核的输入大小。
124.然后,将起始裁剪坐标进行随机偏移,得到下一个裁剪坐标,在基准无噪声图像的下一个裁剪坐标处裁剪指定边长的正方形,作为一张裁剪图像。
125.假设起始裁剪坐标为(x0,y0),后续图像的起始裁剪坐标为(xi,yi),则后续坐标通过以下公式计算得到:
126.xi=x0 random_x
127.yi=y0 random_y
128.其中random_x表示横坐标x0的随机偏移量,random_y表示纵坐标y0的随机偏移量,随机偏移量可以由技术人员进行设置。
129.假设基准无噪声图像的高为h、宽为w,为了保证裁剪图像不会偏移出基准无噪声图像,起始裁剪坐标(x0,y0)的横坐标和纵坐标的取值范围为:
130.range≤x0≤w-1-patch_size-range
131.range≤y0≤h-1-patch_size-range
132.其中,range为预先设置的随机偏移量的最大值,例如range可以为100。
133.每对裁剪坐标进行一次随机偏移,从基准无噪声图像中裁剪出一张裁剪图像,直至得到预设数量的裁剪图像,将预设数量的裁剪图像作为一组标注数据。
134.如图3所示,图3为通过上述方式裁剪图像的示意图,图3中的每个正方形为一张裁剪图像,从图3中可以看出,图3中的多张裁剪图像具有重叠,但又不完全重合,相当于模拟了拍摄设备在抖动时,拍摄得到的多张图像或者连续的视频帧,采用该方法可以得到能够模拟拍摄设备真实运动场景的图像。
135.s203、对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据。
136.本技术实施例中,采取以下公式对标注数据中的图像叠加噪声:
137.noisei=possion(gti) gaussian
138.其中,noisei表示叠加噪声后图像的raw数据,gti表示未叠加噪声的图像raw数据,函数possion()表示叠加泊松噪声,gaussian表示叠加高斯噪声。
139.s204、将得到的多组标注数据以及每组标注数据对应的样本数据生成预设训练
集。
140.采用该方法,可以通过预先采集多张基准无噪声图像,通过从基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据,模拟拍摄图像或者视频时,拍摄设备抖动的情形,再进一步对多张标注数据进行叠加噪声处理,相当得到了在拍摄设备存在抖动情况下拍摄得到的有噪声的视频帧序列,将有噪声的视频帧序列作为样本数据对卷积神经网络进行训练,相当于训练模型过程中考虑到了相机抖动的情况,即考虑了图像运动的情况,使得训练得到的降噪模型可以对视频或图像进行降噪处理,且降噪后的视频或图像中不会存在重影,相比于现有技术提高了降噪效果。
141.在另一实施方式中,为了模拟拍摄设备静止,但被拍摄物体为运动物体的情形,如图4所示,预设训练集通过以下步骤得到:
142.s401、采集多张基准无噪声图像。
143.基准无噪声图像的采集过程可以参考上述s201中的描述,此处不再重复描述。
144.s402、每次从多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像。
145.可以从多张基准无噪声图像中随机选择两张图像,也可以按照一定的顺序选择两张图像,本技术实施例对此不作限定。可将选择的其中一张图像作为前景图像,将另一张图像作为背景图像。
146.s403、按照第一指定形状和第一指定尺寸裁剪背景图像。
147.其中,第一指定形状可以为矩形,具体可以为正方形,相应地第一指定尺寸为方形的边长,该边长可以为patch_size,patch_size为上述图像降噪模型的卷积神经网络内核的输入大小。
148.可以将背景图像裁剪为边长为patch_size的正方形图像。
149.s404、按照第一指定形状和第二指定尺寸裁剪前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像。
150.其中,第二尺寸远小于第一尺寸,假设裁剪前景图像的长和宽分别为w和h,则w和h要远远小于patch_size。
151.第二指定形状可以为矩形、椭圆、菱形等,也可以为不规则形状,比如为矩形、椭圆和菱形等多种图形的组合变种。
152.由于实际拍摄过程中运动的物体形状通常是不规则的,而裁剪得到的前景图像为矩形,所以为了模拟运动物体的形状,需要对裁剪后的图像进行掩膜处理,以获得不规则的前景图像。
153.如图5所示,图5中有数字“1”的位置为掩膜处理后前景图像中保留的像素,有数字“0”的位置被设置为了透明,相当于掩膜处理后肉眼只能看到图5中有数字“1”的区域。
154.掩膜处理使得前景图像更接近真实物体的形状,使得预设训练集训练得到的降噪模型能够对图像中物体的边缘降噪处理效果更好。
155.s405、将第二指定形状的前景图像叠加在裁剪后的背景图像上的起始位置,将第二指定的前景图像在背景图像上按照预设速度朝预设方向平移,将平移过程中的多个时刻的图像作为一组标注数据。
156.假设前景图像的平移起始位置为(x0,y0),则后续图像平移后的位置(xi,yi)可以由下列公式计算得到:
157.xi=x0 v*i
158.yi=y0 v*i
159.其中v表示预设速度,v为0到40之间的随机整数,i表示移动时刻。
160.为了防止前景图像移动出背景图像的范围,前景图像的位置(xi,yi)需要满足以下条件:
161.0≤xi≤patch_size-1-w
162.0≤yi≤patch_size-1-h
163.其中,patch_size为背景图像边长,w和h分别表示前景图像的宽和高。
164.以此来保证前景图像始终在背景图像内部平移。
165.如图6所示,图6中背景图像为图像a。前景图像为图像b,图像b在图像b内部按上述方法进行平移。
166.s406、对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据。
167.可以理解的是,每执行一次s402-s405可得到一组标注数据,每得到一组标注数据即可对该组标注数据包括的多张图像分别叠加噪声。
168.其中,叠加噪声方式与上述s203中描述方法一致,可参考s203中的相关描述,此处不再赘述。
169.s407、将得到的多组标注数据以及每组标注数据对应的样本数据生成预设训练集。
170.采用该方法,可以通过预先采集多张基准无噪声图像,从中选取两张图像,分别裁剪成前景图像和背景图像,将前景图像叠加在背景图像上的起始位置,再从起始位置开始平移,将平移过程中的多个时刻的图像作为一组标注数据,对标注数据叠加噪声,相当得到了在拍摄设备在静止情况下拍摄运动物体得到的有噪声的视频,也就得到了包括标注数据和每组标注数据对应的样本数据的预设训练集。通过该预设训练集训练得到的图像降噪模型,可以对相机拍摄到的包括运动物体的图像或视频进行很好的降噪,不会产生重影。
171.在另一实施方式中,如图7所示,预设训练集还可以通过以下步骤得到:
172.s701、采集多张基准无噪声图像。
173.s702、针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据。
174.s701-s702与s201-s202一致,可以参考上述s201-s202中的有关描述,此处不再赘述。
175.s703、每次从多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像。
176.s704、按照第一指定形状和第一指定尺寸裁剪背景图像。
177.s705、按照第一指定形状和第二指定尺寸裁剪前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像,第二指定尺寸小于第一指定尺寸。
178.s706、将第二指定形状的前景图像叠加在背景图像上的起始位置,将第二指定形
状的前景图像在背景图像上按照预设速度朝预设方向平移,采集平移过程中多个时刻的图像作为一组标注数据。
179.s703至s706具体实施方式与上述s402至s405实施方式一致,可以参考上述s402至s405实施例中的有关描述,此处不再赘述。
180.s707、对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据。
181.其中,该步骤中处理的标注数据包括s702中得到的标注数据,也包括s706中得到的标注数据。
182.s708、将得到的多组标注数据以及每组标注数据对应的样本数据生成预设训练集。
183.需要说明的是,本技术实施例提供了两种模拟运动场景,分别为拍摄设备抖动而被拍摄物体静止场景和拍摄设备静止而被拍摄物体运动场景,预设训练集可以为对其中一种运动场景进行模拟得到,也可以为对两种运动场景都进行模拟得到。
184.采用该方法,从采集到的基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据,相当于模拟了拍摄设备抖动而被拍摄物体静止场景;从多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像,让前景图像在背景图像上平移,相当于模拟了拍摄设备静止而被拍摄物体运动场景,也就是说,最终得到的预设训练集为对两种运动场景都进行模拟得到,进而,使用预设训练集训练的降噪模型可以更好地处理拍摄设备在各种运动情况下拍摄的图像或视频,提升了降噪能力和去除重影能力。
185.在本技术另一实施例中,如图8所示,图像降噪模型通过以下步骤训练得到:
186.s801、将预设训练集包括的一组样本数据中的第一帧图像与自身进行拼接后,将拼接后的图像输入卷积神经网络模型,依次由神经网络模型包括的第一卷积网络和第二卷积网络处理拼接后的图像。
187.其中,一组样本数据包括的多张图像是对相同的基准无噪声图像处理得到的,所以一组样本数据可以看作一个视频帧序列,该组样本数据中的第一张图像即为第一帧图像。
188.s802、获取第一卷积网络输出的中间降噪图像和第二卷积网络输出的最终降噪图像。
189.本技术实施例中,如图9所示,卷积神经网络模型包括第一卷积网络和第二卷积网络。其中,第一卷积网络至少包括卷积激活层和卷积层,第二卷积网络至少包括卷积激活层和卷积层。本技术实施例不对第一卷积网络和第二卷积网络的具体结构进行限制。其中第一卷积网络在处理当前帧图像时会输出一个中间降噪图像,即对当前帧图像进行部分降噪后得到的图像。最终降噪图像为当前帧经过第一和第二两个卷积网络降噪处理得到的图像。
190.如图9所示,frame[t]表示一组标注数据中的第t帧图像,fused_frame[t-1]表示第t-1帧图像的中间降噪图像,将frame[t]和fused_frame[t-1]拼接输入第一卷积网络,得到第t帧图像的中间降噪图像fused_frame[t],然后将fused_frame[t]输入第二卷积网络最终得到输出结果output[t],即对frame[t]降噪后的最终降噪图像。
[0191]
在将该组标注数据中的第t 1帧图像frame[t 1]输入该卷积神经网络模型时,需将fused_frame[t]与frame[t 1]进行拼接,将拼接结果输入到第一卷积网络,得到第t 1帧图像的中间降噪图像used_frame[t 1],再将fused_frame[t 1]输入第二卷积网络得到最终输出结果output[t 1],即对frame[t 1]降噪后的最终降噪图像。
[0192]
需要说明的是,当t=0时,即第一帧输入时,由于没有上一帧的中间降噪图像,所以拼接时为第一帧与自身拼接。
[0193]
为了方便理解,图9中示出了卷积神经网络模型对连续两帧图像的处理过程,实际应用中,本技术实施例中的卷积神经网络模型只包括图9中的一个第一卷积网络和一个第二卷积网络。
[0194]
s803、基于最终降噪图像与第一帧图像计算损失函数值。
[0195]
本技术实施例中,最终降噪图像为预设训练集中样本数据中的图像经过卷积神经网络的处理后得到降噪图像。
[0196]
损失函数值计算公式为:
[0197]
loss=|output-gti|
[0198]
其中,output表示模型输出的降噪图像的raw数据,gti表示预设训练集中与输入的样本数据中的图像对应的标注数据中的图像的raw数据。
[0199]
s804、根据损失函数值判断卷积神经网络模型是否收敛。若未收敛,则基于损失函数值调整卷积神经网络模型的参数,并将第一样本数据中的下一帧图像与第一卷积网络最近一次输出的中间降噪图像进行拼接,返回将拼接后的图像输入卷积神经网络模型的步骤,直至卷积神经网络模型收敛时,则将训练得到的卷积神经网络模型作为图像降噪模型。
[0200]
采用本技术实施例,由于训练卷积神经网络模型时,在采用卷积神经网络模型对每张图像进行降噪时,将该图像与上一张图像的中间降噪图像拼接后输入该卷积神经网络模型,且相邻两帧图像能够反映拍摄设备或所拍摄的物体的运动,将该图像与上一张图像的中间降噪图像拼接后会有重影。而该图像对应的标注图像是无重影无噪声的,所以基于该卷积神经网络对拼接图像的最终降噪图像与无重影无噪声的标注图像计算损失函数值,可以使得训练完成的图像降噪模型能够去除图像中的重影和噪声,得到更清晰的降噪图像。
[0201]
可以理解的是,在应用图像降噪模型的过程中,如果待处理图像为视频帧序列中的一帧,则将该待处理图像和上一帧图像的中间降噪结果拼接后输入图像降噪模型,进而可获取图像降噪模型输出的对待处理图像降噪后的图像数据,按照该方法可以获取视频帧序列中的每一帧图像降噪后的图像数据,进而可以得到降噪后的视频。
[0202]
如果待处理图像为静态图像,则将待处理图像与自身拼接后输入图像降噪模型,进而可获取图像降噪模型输出的对待处理图像降噪后的图像数据。
[0203]
如图10所示,图10中图像a为用户拍摄的t时刻的原始噪声的图像。
[0204]
图像b为采用现有对多帧图像叠加平均值的降噪方法对图像a进行降噪处理得到的图像,即对用户拍摄到的t-2、t-1、t、t 1、t 2时刻的5帧图像进行叠加平均值处理,可以看出图像b相比于图像a,在图像静止的背景部分有降噪效果,但对于图像前景部分,也就是图像中运动的人像,存在严重重影的问题。
[0205]
图像c为使用本技术提供的降噪模型对图像a进行降噪后的图像,图像c中,不论是
静止的背景部分还是运动的前景人像,都有很好的降噪效果,并且前景人像部分不存在重影问题,可以看出,与现有技术相比,本技术提供的降噪模型可很好的对图像进行降噪,并且不会产生重影问题。
[0206]
对应于上述方法实施例,本技术实施例还提供了一种图像降噪装置,如图11所示,该装置包括:
[0207]
第一输入模块1101,用于将待处理图像输入图像降噪模型,图像降噪模型为基于预设训练集对卷积神经网络模型训练得到的模型,预设训练集中包括多组标注数据以及每组标注数据对应的样本数据;其中,一组标注数据包括对一张基准无噪声图像进行模拟运动处理后得到的多张无噪声图像,该组标注数据对应的样本数据包括对多张无噪声图像分别叠加噪声后得到的图像;
[0208]
第一获取模块1102,用于获取图像降噪模型输出的降噪后的图像数据;
[0209]
转换模块1103,用于将图像数据转换为图像,得到待处理图像对应的降噪后的图像。
[0210]
在本技术另一实施例中,该装置还包括:
[0211]
采集模块,用于采集多张基准无噪声图像;
[0212]
截取模块,用于针对每张基准无噪声图像,从该基准无噪声图像截取多张形状相同、面积相同、具有重叠区域且不完全相同的图像,将截取出的图像作为一组标注数据;
[0213]
第一叠加模块,用于对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
[0214]
第一生成模块,用于将得到的多组标注数据以及每组标注数据对应的样本数据生成预设训练集。
[0215]
在本技术另一实施例中,该装置还包括:
[0216]
采集模块,用于采集多张基准无噪声图像;
[0217]
第一选择模块,用于每次从多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
[0218]
第一裁剪模块,用于按照第一指定形状和第一指定尺寸裁剪背景图像;
[0219]
第一处理模块,用于按照第一指定形状和第二指定尺寸裁剪前景图像,对裁剪后的前景图像进行掩膜处理,得到第二指定形状的前景图像;
[0220]
第一平移模块,用于将第二指定形状的前景图像叠加在裁剪后的背景图像上的起始位置,将第二指定的前景图像在背景图像上按照预设速度朝预设方向平移,将平移过程中的多个时刻的图像作为一组标注数据;
[0221]
第二叠加模块,用于对每组标注数据包括的多张图像分别叠加噪声,得到每组标注数据对应的样本数据;
[0222]
第二生成模块,用于将得到的多组标注数据以及每组标注数据对应的样本数据生成预设训练集。
[0223]
在本技术另一实施例中,该装置还包括:
[0224]
第二选择模块,用于每次从多张基准无噪声图像中选择两张图像分别作为前景图像和背景图像;
[0225]
第二裁剪模块,用于按照第一指定形状和第一指定尺寸裁剪背景图像;
interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0245]
通信接口用于上述电子设备与其他设备之间的通信。
[0246]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non-volatile memory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0247]
上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0248]
在本技术提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一降噪方法的步骤。
[0249]
在本技术提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一降噪方法。
[0250]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0251]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0252]
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
[0253]
以上所述仅为本技术的较佳实施例,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本技术的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献