一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于空角一致性光场抠图方法及装置

2022-07-13 22:16:56 来源:中国专利 TAG:


1.本发明涉及光学信息处理技术领域,特别是关于一种基于空角一致性光场抠图方法及装置。


背景技术:

2.光场描述了光线在自由空间中的分布,光场数据捕获来自各个方向光线的辐射,记录了光线的空间信息和角度信息和强度信息,光场成像可以捕捉更丰富的视觉信息,弥补传统摄影中丢失的角度信息,为场景理解提供了更强的能力,提高了传统计算机视觉问题的性能。
3.一个4d光场数据可由2d子孔径图像阵列表示,因此逐子孔径图像进行2d图像抠图算法一定程度上可以看作实现了4d光场数据的抠图。逐子孔径图像操作的方法没有考虑不同子孔径图像之间的联系,无法保持光场数据的空角一致性,得到的结果难以满足下游技术与应用的要求。并且光场数据尺寸较大,子孔径图像之间存在大量冗余信息,简单的逐子孔径图像处理存在过多冗余计算,效率过低。


技术实现要素:

4.本发明的目的在于提供一种空角一致性光场抠图及其评价指标的方法,能够避免抠图过程中光场数据空角一致性的破坏,并减少计算冗余。
5.为实现上述目的,本发明提供一种基于空角一致性光场抠图评价方法,其包括:
6.步骤1,提取光场数据的中心子孔径图像;
7.步骤2,计算光场数据的视差图和光场数据中心子孔径图像alpha图;
8.步骤3,对中心子孔径图像alpha图进行传播,获取光场alpha图;
9.步骤4,通过式(1)提供在频域获取的空角一致性评价指标f-cons,对光场alpha图中的空角一致性进行评价:指标f-cons取值范围在(0-1),指标f-cons越大,代表支集所占范围越小,光场数据空角一致性越好,反之越差;
[0010][0011]
式中:
[0012][0013]
式中,l

(ωu,ωv,ω
x
,ωy)为频谱图l(ωu,ωv,ω
x
,ωy)通过二值化后统计频谱图,ε为一个较小的数,m为频谱图整体像素的个数,ωu、ωv、ω
x
、ωy分别为光场频谱图的坐标轴。
[0014]
进一步地,步骤2中的视差图disp(x,y)的计算公式为式(3):
[0015]
disp(x,y)=f/z(x,y) f
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0016]
式中,f为相机的焦距,z(x,y)为场景的深度图。
[0017]
进一步地,步骤2中的中心子孔径图像alpha图的获取方法具体包括:
[0018]
步骤21,将视差图disp(x,y)中任意像素i的置信度qi设置为式(4):
[0019][0020]
式中,pi为视差图diap(x,y)中任意像素i的视差值,d=max(disp(x,y))为视差图中的最大值,d=min(disp(x,y))为视差图中的最小值;
[0021]
步骤22,设置置信度阈值t1和t2,当置信度qi大于t1时,则该区域属于前景,当置信度qi小于t2时,则该区域属于背景,其他区域为三分图中不确定的区域,则获得式(5)描述的三分图:
[0022][0023]
步骤23,将所述三分图转化为i1和i2,i1中前景和背景标记处像素为1,其余地方像素值为0,将i1转化为稀疏化对角矩阵即为ds,i2中前景标记处像素值为1,其余像素值为0,将其转化为列向量即为bs:
[0024][0025][0026]
步骤24,通过式(8)对中心子孔径图像的alpha图进行求解:
[0027]
α=λ(l λ)-1bs
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0028]
式中,λ为标记的权重系数,l为抠图的拉普拉斯矩阵。
[0029]
进一步地,步骤3,通过式(9)提供的光场alpha图传播模型,对中心子孔径图像alpha图进行传播,获取光场alpha图alpha
u,v
(x,y);
[0030][0031]
式中,为中心视点(u0,v0)下子孔径图像对应的alpha图,disp(x,y)为中心子孔径图像中像点(x,y)对应的视差,δu、δv分别为任意视点(u,v)与中心视点(u0,v0)在u、v方向上的距离。
[0032]
本发明还提供一种基于空角一致性光场抠图评价装置,其包括:
[0033]
中心子孔径图像提取单元,其用于提取光场数据的中心子孔径图像;
[0034]
计算单元,其用于计算光场数据的视差图和场数据中心子孔径图像alpha图;
[0035]
光场抠图单元,其用于对中心子孔径图像alpha图进行传播,获取光场alpha图;
[0036]
评价单元,其用于通过式(1)提供的在频域获取的空角一致性评价指标f-cons,对光场alpha图中的光场数据空角一致性进行评价:指标f-cons取值范围在(0-1),指标f-cons越大,代表支集所占范围越小,光场数据空角一致性越好,反之越差;
[0037][0038]
式中:
[0039][0040]
式中,l

(ωu,ωv,ω
x
,ωy)为频谱图l(ωu,ωv,ω
x
,ωy)通过二值化后统计频谱图,ε为一个较小的数,m为频谱图整体像素的个数,ωu、ωv、ω
x
、ωy分别为光场频谱图的坐标轴。
[0041]
进一步地,计算单元包括:
[0042]
视差计算子单元,其用于根据光场数据的深度图,通过式(3)计算视差图disp(x,y):
[0043]
disp(x,y)=f/z(x,y) f
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0044]
式中,f为相机的焦距,z(x,y)为场景的深度图。
[0045]
进一步地,计算单元包括:
[0046]
中心子孔径图像alpha图计算子单元,其用于根据光场数据的中心子孔径图像,通过如下具体的alpha闭合解方法求得中心子孔径图像alpha图:
[0047]
步骤21,将视差图disp(x,y)中任意像素i的置信度qi设置为式(4):
[0048][0049]
式中,pi为视差图diap(x,y)中任意像素i的视差值,d=max(disp(x,y))为视差图中的最大值,d=min(disp(x,y))为视差图中的最小值;
[0050]
步骤22,设置置信度阈值t1和t2,当置信度qi大于t1时,则该区域属于前景,当置信度qi小于t2时,则该区域属于背景,其他区域为三分图中不确定的区域,则获得式(5)描述的三分图:
[0051][0052]
步骤23,将所述三分图转化为i1和i2,i1中前景和背景标记处像素为1,其余地方像素值为0,将i1转化为稀疏化对角矩阵即为ds,i2中前景标记处像素值为1,其余像素值为0,将其转化为列向量即为bs:
[0053][0054][0055]
步骤24,通过式(8)对中心子孔径图像的alpha图进行求解:
[0056]
α=λ(l λ)-1bs
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0057]
式中,λ为标记的权重系数,l为抠图的拉普拉斯矩阵。
[0058]
进一步地,光场抠图单元通过式(9)提供的光场alpha图传播模型,对中心子孔径图像alpha图进行传播,获取光场alpha图alpha
u,v
(x,y);
[0059][0060]
式中,为中心视点(u0,v0)下子孔径图像对应的alpha图,disp(x,y)为像点(x,y)对应的视差,δu、δv分别为任意视点(u,v)与中心视点(u0,v0)在u、v方向上的距离。
[0061]
本发明由于采取以上技术方案,其具有以下优点:
[0062]
通过采用本发明提供的基于空角一致性光场抠图及其评价指标的方法,实现准确且具有一致性的光场抠图,保证了光场数据的空角一致性并减少了计算冗余,建立的评价指标可以有效的评估所获光场数据的空角一致性。
附图说明
[0063]
图1为本发明实施例提供的基于空角一致性光场抠图方法的流程示意图。
[0064]
图2为本发明实施例提供的基于空角一致性光场抠图评价方法的流程示意图。
[0065]
图3为中心子孔径图像的alpha图视差图。
[0066]
图4为传播模型示意图。
[0067]
图5为评价指标示意图。
具体实施方式
[0068]
在附图中,使用相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面结合附图对本发明的实施例进行详细说明。
[0069]
如图1和图2所示,本发明实施例提供的基于空角一致性光场抠图评价方法包括:
[0070]
步骤1,提取光场数据的中心子孔径图像。
[0071]
步骤2,计算光场数据的视差图和光场数据中心子孔径图像alpha图。
[0072]
步骤3,对中心子孔径图像alpha图进行传播,获取光场alpha图。
[0073]
步骤4,如图5中的a所示,因光场数据频谱图满足hypercone的形状,所以光场数据的空角一致性可以通过频谱内支集的范围来体现,如果光场数据的空角一致性较好,在频域内能越好的保持直线形状,则频谱支集的范围越小,占整体频谱图的比例越小;反之如果一致性遭到破坏,hypercone的结构遭到破坏,频域中不能保持直线结构,支集范围越大,所占整体频谱图的比例越大。基于此,步骤4具体通过式(1)提供频谱图的二值化如图5中的b所示,再通过式(2)提供的在频域获取的空角一致性评价指标f-cons,对光场alpha图中的空角一致性进行评价:指标f-cons取值范围在(0-1),指标f-cons越大,代表支集所占范围越小,光场数据空角一致性越好,反之越差。
[0074]
[0075]
式中:
[0076][0077]
式中,l

(ωu,ωv,ω
x
,ωy为频谱图l(ωu,ωv,ω
x
,ωy)通过二值化后统计频谱图,ε为一个较小的数,m为频谱图整体像素的个数,ωu、ωv、ω
x
、ωy分别为光场频谱图的坐标轴。
[0078]
本发明中建立了满足空角一致性的光场抠图传播模型。该模型的建立是以四维光场数据的空角耦合性质为基础,能快速得到具有更好空角一致性的高质量光场alpha图,为实现具有一致性的光场抠图,可以使用cho等人光场抠图方法,通过引入对极平面图(epipolar plane image,epi)的平滑约束,增强估计的alpha图在子孔径图像中的空角一致性。在本发明中提出了一种光场alpha图的定量评价指标,该指标的建立基于光场数据的本质属性,能客观地评价传播后光场alpha图的空角一致性,cho等人也提出了评价光场数据空角一致性的指标,亦可使用mse、sad等来评估。
[0079]
在一个实施例中,步骤2中,如图3中的a所示,根据光场数据的中心子孔径图像,利用式(3)计算光场数据的视差图disp(x,y),由于深度和视差之间满足这样一个反比关系:
[0080]
disp(x,y)=f/z(x,y) f
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0081]
式中,f为相机的焦距,z(x,y)为场景的深度图。
[0082]
可以通过mishiba k等人提出的一种基于多视角立体匹配的快速光场图像深度估计方法。也可以通过wang tc等人提出的基于遮挡感知的深度估计算法估计深度。当有了深度图之后,通过公式(3)转换即可得到视差图。
[0083]
在一个实施例中,如图3(b),所示步骤2中的中心子孔径图像alpha图的获取方法具体包括:
[0084]
步骤21,为了实现中心子孔径图像的三分图的自动获取并进行alpha图求解,假设光场数据视差图是准确的,对视差图引入置信度并选择阈值,根据置信度阈值设置准确的前景、背景和不确定的区域,视差图的置信度设置如下:
[0085][0086]
式中,pi为视差图disp(x,y)中任意像素i的视差值,该像素点处的置信度qi代表了该点属于前景的概率,d=max(disp(x,y))为视差图中的最大值,d=min(disp(x,y))为视差图中的最小值。设置阈值t1和t2,当置信度大于t1时,认为这部分区域属于前景,当置信度小于t2时,认为这部分区域为背景,其他区域为三分图中不确定的区域,可获得三分图:
[0087][0088]
式中,t1和t2为置信度最小值与最大值所构成直线上的某一点,且t1和t2的选取与场景中前景、背景各自深度范围在整体深度中的占比有关。当前景深度范围占比大时,t1越大,t2越小;当背景深度范围占比大时,t1越小,t2越大。
[0089]
获取三分图之后将三分图转化为i1和i2:i1中前景和背景标记处像素为1,其余地方像素值为0,将i1转化为稀疏化对角矩阵即为ds;i2中前景标记处像素值为1,其余像素值为0,将其转化为列向量即为bs。当然可以采用手工标记i1和i2,还可以采用现有的自动方式进行标记。
[0090][0091][0092]
步骤22,基于获取的ds和bs即可通过公式(8)对中心子孔径图像的alpha图进行求解:
[0093]
α=λ(l λ)-1bs
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0094]
式中,λ为标记的权重系数,一般选较大的数,比如100,l为抠图的拉普拉斯矩阵。
[0095]
此外还可以通过random walk matting、泊松抠图等方法对中心子孔径图像进行抠图。
[0096]
在一个实施例中,步骤3,假设场景是朗伯辐射无遮挡的场景,采集到的光场数据中蕴含着空角耦合关系这种本质属性,通过式(9)提供的光场alpha图传播模型,对中心子孔径图像alpha图进行传播,获取光场alpha图alpha
u,v
(x,y);
[0097][0098]
式中,为中心视点(u0,v0)下子孔径图像对应的alpha图,disp(x,y)为中心子孔径图像中像点(x,y)对应的视差,δu、δv分别为任意视点(u,v)与中心视点(u0,v0)在u、v方向上的距离。
[0099]
根据步骤3构建的传播模型,将步骤2的alpha图进行传播,得到9*9个视点下的光场alpha图,如图4的(a)中示出了中心子孔径图像alpha图1和视差图2,图4的(b)中示出了传播得到的9*9个视点下子孔径图像的alpha图3。
[0100]
本发明实施例还提供一种基于空角一致性光场抠图评价装置,其包括中心子孔径图像提取单元、计算单元、光场抠图单元和评价单元,其中:
[0101]
中心子孔径图像提取单元用于提取光场数据的中心子孔径图像。
[0102]
计算单元用于用于计算光场数据的视差图和场数据中心子孔径图像alpha图。
[0103]
光场抠图单元用于对中心子孔径图像alpha图进行传播,获取光场alpha图。
[0104]
评价单元用于通过式(1)提供的在频域获取的空角一致性评价指标f-cons,对光场alpha图中的光场数据空角一致性进行评价:指标f-cons取值范围在(0-1),指标f-cons越大,代表支集所占范围越小,光场数据空角一致性越好,反之越差;
[0105][0106]
式中:
[0107][0108]
式中,l

(ωu,ωv,ω
x
,ωy)为频谱图l(ωu,ωv,ω
x
,ωy)通过二值化后统计频谱图,ε为一个较小的数,m为频谱图整体像素的个数,ωu、ωv、ω
x
、ωy分别为光场频谱图的坐标轴。
[0109]
在一个实施例中,计算单元包括视差计算子单元,视差计算子单元用于根据光场数据的深度图,通过式(3)计算视差图disp(x,y):
[0110]
disp(x,y)=f/z(x,y) f
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0111]
式中,f为相机的焦距,z(x,y)为场景的深度图。
[0112]
在一个实施例中,计算单元包括中心子孔径图像alpha图计算子单元,中心子孔径图像alpha图计算子单元用于根据光场数据的中心子孔径图像,通过如下具体的alpha闭合解方法求得中心子孔径图像alpha图:
[0113]
步骤21,将视差图disp(x,y)中任意像素i的置信度qi设置为式(4):
[0114][0115]
式中,pi为视差图disp(x,y)中任意像素i的视差值,d=max(disp(x,y))为视差图中的最大值,d=min(disp(x,y))为视差图中的最小值;
[0116]
步骤22,设置置信度阈值t1和t2,当置信度qi大于t1时,则该区域属于前景,当置信度qi小于t2时,则该区域属于背景,其他区域为三分图中不确定的区域,则获得式(5)描述的三分图:
[0117][0118]
步骤23,将所述三分图转化为i1和i2,i1中前景和背景标记处像素为1,其余地方像素值为0,将i1转化为稀疏化对角矩阵即为ds,i2中前景标记处像素值为1,其余像素值为0,将其转化为列向量即为bs:
[0119][0120][0121]
步骤24,通过式(8)对中心子孔径图像的alpha图进行求解:
[0122]
α=λ(l λ)-1bs
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0123]
式中,λ为标记的权重系数,l为抠图的拉普拉斯矩阵。
[0124]
在一个实施例中,光场抠图单元通过式(9)提供的光场alpha图传播模型,对中心子孔径图像alpha图进行传播,获取光场alpha图alpha
u,v
(x,y);
[0125]
[0126]
式中,为中心视点(u0,v0)下子孔径图像对应的alpha图,disp(x,y)为像点(x,y)对应的视差,δu、δv分别为任意视点(u,v)与中心视点(u0,v0)在u、v方向上的距离。
[0127]
最后需要指出的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。本领域的普通技术人员应当理解:可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献