一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多分支网络的空间环境高动态范围成像方法

2022-09-03 20:02:30 来源:中国专利 TAG:


1.本发明涉及数字图像处理技术领域,涉及一种高动态范围成像方法,具体是一种基于多分支网络的空间环境高动态范围成像方法。


背景技术:

2.高动态范围成像可以提高图像的亮度范围,丰富图像细节,在空间环境成像任务中具有重要的价值。由于相机与目标在拍摄时均处于运动状态,且空间环境中存在强磁场、太阳风等因素干扰,导致图像序列出现一定运动与噪声,对高动态范围成像提出了挑战。文献“wu s,xu j,tai y w,et al.deep high dynamic range imaging with large foreground motions[c]//proceedings of the european conference on computer vision(eccv).2018:117-132.”提出了一种基于编码-解码网络的多帧高动态范围成像方法。该方法使用编码-解码网络学习运动低动态图像序列与无鬼影高动态图像之间的映射关系,生成的图像在提升了动态范围的同时消除了目标运动造成的鬼影现象,但融合结果存在一定颜色失真现象,且无法处理图像中的噪声。文献“chen x,liu y,zhang z,et al.hdrunet:single image hdr reconstruction with denoising and dequantization[c]//proceedings of the ieee/cvf conference on computer vision and pattern recognition.2021:354-363.”提出了一种基于编码-解码网络的单帧高动态范围成像方法。该方法使用编码-解码网络同时学习图像中的亮度与噪声分布,生成了无噪声的高动态范围图像,但单帧图像中所含信息有限,因此网络估计结果缺乏真实性。


技术实现要素:

[0003]
为了克服现有技术的不足,本发明提供一种基于多分支网络的空间环境高动态范围成像方法。针对现有的主流高动态成像方法无法完全消除运动图像造成的鬼影,处理时忽视了图像中存在的噪声,在处理空间图像时效果不佳等问题,本专利提出基于多分支网络的空间环境高动态范围成像方法,输入存在一定运动与噪声的多帧低动态图像,经过网络处理后输出无鬼影、不含噪声的高质量高动态图像。基于深度学习的多帧高动态范围成像方法通过神经网络提取图像特征,若将图像或对应特征直接堆叠后输入融合网络,在网络的早期就引入了鬼影区域,导致融合结果中鬼影难以去除。另外,训练后的网络会在图像各区域应用统一的处理策略,但真实图像中不同亮度区域的噪声分布是不同的。本发明公开了一种基于多分支网络的空间环境高动态范围成像方法。该方法使用编码-解码网络实现动态范围的融合,并引入挤压-激励模块去除图像鬼影;同时,利用参考图像在子网络分支生成条件映射图与权重图,指导融合网络去除不同区域噪声并提高高亮极暗区域融合效果,最终生成无鬼影、无噪声的高动态范围图像。基于这种多分支网络结构设计,本方法在通道维度对图像有效特征进行了强化,从而在网络初期就抑制了潜在的鬼影特征;另外,相比于一般多帧高动态范围成像方法,本方法在子网络分支中学习了图像中不同区域的噪声分布,生成的图像中在各区域都能有效去除噪声。
[0004]
本发明解决其技术问题所采用的技术方案的具体步骤如下:
[0005]
(a)仿真图像数据集构造
[0006]
在不反光的黑色背景场景下,采集复杂光照仿真数据:
[0007]
首先设置距离大于1000km的点状光源,在目标表面生成高亮极暗区域,然后在固定的光源照射下旋转目标,并在设定的相机视角下对场景进行渲染,初步得到一组具有相同曝光、不同姿态的空间图像序列,生成适用于空间环境成像研究的仿真图像数据集;
[0008]
(b)网络输入预处理
[0009]
选取同一目标三张{i1,i2,i3}在不同曝光下采集图像,在相同位置按照256
×
256分割得到低动态图像序列l={l1,l2,l3},将低动态图像序列l通过伽马变换映射到高动态域,得到对应的高动态图像序列h={h1,h2,h3},将图像l1,l2,l3,h1,h2,h3沿颜色通道维度进行拼接后生成通道数为6的输入矩阵(l,h),将输入矩阵中各个通道值归一化至0-1区间后,送入多分支高动态范围成像网络f;
[0010]
(c)构建多分支高动态范围成像网络
[0011]
多分支高动态范围成像网络的处理过程为:
[0012][0013]
式中代表网络估计出的高动态范围图像,同样被归一化到0-1区间,多分支高动态范围成像网络f由条件子网络,融合子网络和权重子网络构成,三部分网络并行处理,融合子网络负责提升图像的动态范围,条件子网络与权重子网络调整融合网络的中间结果,各网络共同作用生成最终图像;
[0014]
(d)损失函数设计
[0015]
将网络生成的高动态图像进行色调映射,计算融合损失,再使用全变分损失衡量图像的水平梯度变化,网络的总损失函数为两部分损失之和;
[0016]
(e)多分支高动态范围成像网络训练
[0017]
对多分支高动态范围成像网络使用设计的损失函数进行训练,采用kaiming方法初始化权值;优化器选取为adam优化器;超参数β1设置为0.9,超参数β2设置为0.999;批尺寸选取为16;图像块尺寸选取为256;学习率为2
×
10-4
,直至网络达到收敛条件,即可得到训练好的多分支高动态范围成像网络。
[0018]
所述融合子网络结构如下:
[0019]
融合子网络使用unet网络结构将图像序列(l,h)的特征分解为不同尺度的特征,提取多尺度信息,多尺度信息经过网络重建处理初步生成16位的高动态图像,作为该子网络的输出;
[0020]
融合子网络具有三个编码器分支,分别接收相同尺寸、不同曝光的图像(li,hi)作为输入,其中i=1,2,3,分别经过下采样提取获得每种曝光图像的特征;之后沿通道维度拼接各分支图像特征,获得初步的融合特征,并使用两个挤压-激励模块强化融合特征中的有效特征;将强化后的特征继续下采样,然后送入融合器,通过串联的多个残差块提取融合特征的细节信息,在提取过程中条件子网络对每个残差块的中间结果进行调整;随后,融合器将提取后的特征送入解码器对特征进行上采样,最终使用一个卷积层生成3通道的hdr图像,该图像与权重子网络的输出结合后形成网络的最终结果;
[0021]
条件子网络结构如下:
[0022]
条件子网络使用潜在信息最丰富的中等曝光图像(l2,h2)作为多分支高动态范围成像网络的输入,经过三个卷积层生成指导融合子网络中间特征的两种调制系数图α与β,在融合子网络中利用sft调制融合网络的有效特征;
[0023]
调制过程通过下式表示:
[0024]
sft(x)=α

x β
ꢀꢀ
(6)
[0025]
式中

代表逐元素累乘,x代表待调制的有效特征,α与β为两种通过条件子网络预测生成的调制系数图,中间特征在逐像素与系数图相乘后再相加获得调整后的特征;
[0026]
权重子网络结构如下:
[0027]
权重子网络使用亮度信息最丰富的中等曝光图像(l2,h2)作为网络的输入,经过4个串联的卷积层生成曝光良好区域的权重图,权重子网络的输出与低动态图像序列进行逐像素累乘,其结果与融合子网络的结果相加后得到最终的输出结果;该过程表示如下:
[0028]
y^=w

i g
ꢀꢀ
(7)
[0029]
式中y^代表最终重建得到的高动态图像,w代表权重子网络的输出结果,i表示输入的低动态图像序列l中的其中任意一张图片,

代表逐元素累乘,g(i)代表融合子网络的输出结果。
[0030]
所述多分支高动态范围成像网络训练生成的高动态图像进行色调映射时,色调映射公式表示如下:
[0031][0032]
式中,t为经过色调映射后的图像,μ为压缩参数,h为高动态图像;
[0033]
融合损失计算公式为:
[0034][0035]
式中与t(h)分别为经过色调映射后的真值图像与网络估计出的融合图像;
[0036]
采用全变分损失衡量图像的水平梯度变化为:
[0037][0038]
式中x
i,j
表示位于(i,j)坐标处的像素强度值,网络的总损失函数如下:
[0039]
l
total
=l
fusion
λl
tv
ꢀꢀ
(11)
[0040]
网络的总损失函数为两部分损失之和。
[0041]
所述μ取值为0.85,λ取值0.1。
[0042]
本发明的有益效果在于本发明解决了现有的主流高动态成像方法仍然存在的诸多技术难题,比如无法完全消除运动图像造成的鬼影,处理时忽视了图像中存在的噪声,在处理空间图像时效果不佳等问题。
[0043]
条件子网络提取参考图像的调制系数图,并通过空间特征变换模块在融合的有效特征中进行调制,去除图像不同区域的噪声,使网络可以处理不同区域的亮度和噪声分布,具有空域变换性。
[0044]
融合子网络将残差块引入多帧图像特征融合,在通道维度强化有效特征,抑制存在运动目标、细节缺失的低质量区域特征,进而获得更好的去鬼影效果。
附图说明
[0045]
图1是本发明的多分支高动态范围成像网络结构。
具体实施方式
[0046]
下面结合附图和实施例对本发明进一步说明。
[0047]
本发明针对运动空间图像序列融合后存在一定鬼影与噪声的问题,设计了一种基于多分支网络的空间环境高动态范围成像方法。基于深度学习的多帧高动态范围成像方法通过神经网络提取图像特征,若将图像或对应特征直接堆叠后输入融合网络,在网络的早期就引入了鬼影区域,导致融合结果中鬼影难以去除。另外,训练后的网络会在图像各区域应用统一的处理策略,但真实图像中不同亮度区域的噪声分布是不同的。本发明公开了一种基于多分支网络的空间环境高动态范围成像方法。该方法使用编码-解码网络实现动态范围的融合,并引入挤压-激励模块去除图像鬼影;同时,利用参考图像在子网络分支生成条件映射图与权重图,指导融合网络去除不同区域噪声并提高高亮极暗区域融合效果,最终生成无鬼影、无噪声的高动态范围图像。基于这种多分支网络结构设计,本方法在通道维度对图像有效特征进行了强化,从而在网络初期就抑制了潜在的鬼影特征;另外,相比于一般多帧高动态范围成像方法,本方法在子网络分支中学习了图像中不同区域的噪声分布,生成的图像中在各区域都能有效去除噪声。
[0048]
本发明解决其技术问题所采用的技术方案:一种基于多分支网络的空间环境高动态范围成像方法,其特点是包括步骤:仿真图像数据集构造、网络输入预处理、多分支高动态范围成像网络构建、损失函数设计、多分支高动态范围成像网络训练。具体如下:
[0049]
1、仿真图像数据集构造
[0050]
在不反光的黑色背景场景下,采用以下方式采集复杂光照仿真数据:首先设置远距离的点状光源,在目标表面生成高亮极暗区域。然后在固定的光源照射下旋转目标,并在设定的相机视角下对场景进行渲染,初步得到一组具有相同曝光、不同姿态的空间图像序列。生成适用于空间环境成像研究的仿真图像数据集。
[0051]
数据集中包含了10个不同大小与外形的拍摄目标,每个目标都生成了100种不同姿态,每种姿态具有三种不同的曝光;在每个姿态下分别生成3张含有噪声的不同曝光图像与1张无噪声的参考图像。整个数据集共包括4000张图像,涵盖了各种结构、大小、姿态的不同拍摄目标,本专利数据集中所有图像均为灰度图。
[0052]
2、网络输入预处理
[0053]
选取同一目标三张不同曝光下采集图像,在相同位置按照256
×
256分割得到l={l1,l2,l3}。将l通过式(1)伽马变换映射到高动态域,得到对应的高动态图像序列h={h1,h2,h3}:
[0054][0055]
式中γ代表伽马变换值,δti代表图像li的曝光时间,γ默认取值为2.2,将图像l1,
l2,l3,h1h2,h3沿颜色通道维度进行拼接后生成通道数为6的输入矩阵(l,h),将各个通道值归一化至0-1区间后送入多分支高动态范围成像网络f,该网络处理过程表示为:
[0056][0057]
式中代表网络估计出的高动态范围图像,同样被归一化到0-1区间。
[0058]
3、多分支高动态范围成像网络构建
[0059]
f由条件子网络,融合子网络,权重子网络构成,
[0060]
融合子网络结构如下:
[0061]
融合子网络具有三个编码器分支,分别接收图像序列(l1,h1),(l2,h2),(l3,h3)作为输入。每个编码器分支都具有两层卷积核大小为5,步长为2的卷积层来实现对特征的下采样,输入的高动态图像经过三个编码器分支提取特征后,分别生成3个64
×
64
×
64的特征图。
[0062]
然后,将三个分支的特征图沿通道维度拼接,初步获得融合的图像特征(64
×
64
×
192),并经过两个通道数64的残差块强化融合特征中的有效特征。在进一步下采样后,有效特征(32
×
32
×
64)被送入融合器,通过9个通道数为32的残差块提取融合特征的细节信息。随后融合器将特征送入解码器,该解码器具有两层卷积核大小为5,步长为2的反卷积层来实现对特征的上采样。上采样结束后,使用一个步长为1、卷积核大小为3卷积层生成3通道的hdr图像g,即为网络的融合结果。
[0063]
条件子网络结构如下:
[0064]
条件子网络使用低动态图像(l2,h2)作为网络的输入,经过三个卷积层生成指导融合子网络中间特征的调制系数图
[0065]
3个卷积层网络结构如下:
[0066]
第1层128个步长为1、卷积核大小为3的卷积层;
[0067]
第2层为64个步长为1、卷积核大小为3的卷积层;
[0068]
第3层为32个步长为2、卷积核大小为3的卷积层;
[0069]
条件子网络的输出为两种调制系数图α与β,在融合子网络中利用sft调制,融合网络的有效特征,其调制过程可以通过下式表示:
[0070]
sft(x)=α

x β
ꢀꢀ
(6)
[0071]
式中

代表逐元素累乘,x代表待调制的有效特征,α与β为两种通过条件子网络预测生成的调制系数图。
[0072]
权重子网络结构如下:
[0073]
权重子网络使用低动态图像l2作为网络的输入,经过4个卷积层生成曝光良好区域的权重图,4个卷积层网络结构如下:
[0074]
第1层为32个步长为1、卷积核大小为3的卷积层;
[0075]
第2层为64个步长为1、卷积核大小为3的卷积层;
[0076]
第3层为128个步长为2、卷积核大小为3的卷积层;
[0077]
第4层为256个步长为2、卷积核大小为3的卷积层;
[0078]
权重子网络的输出与低动态图像序列进行逐像素累乘,其结果与融合子网络的结果相加后得到方法最终的输出结果。该过程可以表示如下:
[0079]
y^=w

(l,h) g
ꢀꢀ
(7)
[0080]
式中y^代表最终重建得到的高动态图像,w代表权重子网络的输出结果,
[0081]
i表示输入的低动态图像序列l={l1,l2,l3},

代表逐元素累乘,g(i)代表融合子网络的输出结果。
[0082]
4、损失函数设计
[0083]
将网络生成的高动态图像进行色调映射。色调映射公式表示如下:
[0084][0085]
式中,t为经过色调映射后的图像,μ为压缩参数,h为高动态图像。
[0086]
计算融合损失:
[0087][0088]
式中与t(h)分别为经过色调映射后的真值图像与网络估计出的融合图像。
[0089]
使用全变分损失衡量图像的水平梯度变化:
[0090][0091]
式中x
i,j
表示位于(i,j)坐标处的像素强度值,网络的总损失函数定义为两部分损失之和:
[0092]
l
total
=l
fusion
λl
tv
ꢀꢀ
(11)
[0093]
在本发明中μ设为0.85,λ设为0.1。
[0094]
5、多分支高动态范围成像网络训练
[0095]
在训练策略上,使用kaiming方法来初始化权值;优化器选取为adam优化器,批尺寸选取为16;图像块尺寸选取为256;数据集的增广方法为旋转和翻转;学习率为2
×
10-4

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献