一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于高斯过程回归的QAA水体固有光学特性反演方法与流程

2022-03-26 16:35:33 来源:中国专利 TAG:

基于高斯过程回归的qaa水体固有光学特性反演方法
技术领域
1.本发明属于水体遥感技术领域,具体涉及一种基于高斯过程回归的qaa水体固有光学特性反演方法。


背景技术:

2.水体固有光学特性可以用于衍生得到包括漫衰减系数、水体透明度、初级生产力以及叶绿素、悬浮泥沙浓度等在内的众多水体参量,而这些衍生量的反演精度将直接取决于固有光学特性的精度。
3.多波段准分析算法(qaa)作为综合性能最优的算法,不论是反演精度还是计算效率均优于其他类型算法,且不涉及到对水体组分的先验假设,特别适合于大范围遥感影像的反演。
4.在使用qaa算法进行水体固有光学特性反演时,参考波段吸收系数a(λ0)和颗粒物后向散射系数光谱斜率y的反演使用了经验模型,这在一定程度上限制了其反演精度和水体适应性的进一步提升。


技术实现要素:

5.本发明提供了一种基于高斯过程回归的qaa水体固有光学特性反演方法,用以解决qaa算法中的波段吸收系数a(λ0)使用经验模型造成的反演精度不高的问题。
6.为解决上述技术问题,本发明所包括的技术方案以及技术方案对应的有益效果如下:
7.本发明提供了一种基于高斯过程回归的qaa水体固有光学特性反演方法,包括如下步骤:
8.1)获取计算波段λ的遥感反射率r
rs

9.2)根据计算波段λ的遥感反射率r
rs
,确定计算波段λ的恰在水面下遥感反射率r
rs

10.3)根据计算波段λ的恰在水面下遥感反射率r
rs
,确定计算波段λ的gordon参量u(λ);
11.4)选取参考波段λ0,获取与第一反演模型gpr-a相关的输入特征,并代入至第一反演模型gpr-a中,得到参考波段λ0的吸收系数a(λ0);其中,所述第一反演模型gpr-a基于高斯过程回归模型构建得到,且第一反演模型gpr-a的输入为输入特征,第一反演模型gpr-a的输入特征包括选择波段的遥感反射率和波段比值组合,波段比值为两个筛选波段的遥感反射率的比值,第一反演模型gpr-a的输出为参考波段λ0的吸收系数a(λ0);
12.5)根据参考波段λ0的吸收系数a(λ0)、参考波段λ0的gordon参量以及参考波段λ0的纯水后向散射系数,确定参考波段λ0的颗粒物后向散射系数b
bp
(λ0);
13.6)确定颗粒物后向散射系数光谱斜率y;
14.7)根据颗粒物后向散射系数光谱斜率y、参考波段λ0的颗粒物后向散射系数b
bp
(λ0)、参考波段λ0的纯水后向散射系数b
bw
(λ0),确定计算波段λ的后向散射系数bb(λ);
15.8)根据计算波段λ的后向散射系数bb(λ)以及计算波段λ的gordon参量u(λ),确定计算波段λ的吸收系数a(λ)。
16.上述技术方案的有益效果为:本发明利用qaa算法进行水体固有光学特性反演,且在使用qaa过程中,参考波段λ0的吸收系数a(λ0)不再使用经验模型,而利用高斯过程回归构建得到第一反演模型gpr-a,利用第一反演模型gpr-a对参考波段λ0的吸收系数a(λ0)进行预测。在水体固有光学特性反演方面,相较于现有技术中的qaa算法,本发明方法的反演精度得到了显著提升,且提升了水体适应性。
17.进一步地,步骤6)中确定颗粒物后向散射系数光谱斜率y的手段为:
18.获取与第二反演模型gpr-y相关的输入特征,并代入至第二反演模型gpr-y中,得到颗粒物后向散射系数光谱斜率y;其中,第二反演模型gpr-y基于高斯过程回归模型构建得到,第二反演模型gpr-y的输入为输入特征,第二反演模型gpr-y的输入特征包括选择波段的遥感反射率,第二反演模型gpr-y的输出为颗粒物后向散射系数光谱斜率y。
19.上述技术方案的有益效果为:在使用qaa过程中,颗粒物后向散射系数光谱斜率y不再使用经验模型,而利用高斯过程回归构建得到第二反演模型gpr-y,利用第二反演模型gpr-y对颗粒物后向散射系数光谱斜率y进行预测。在水体固有光学特性反演方面,相较于现有技术中的qaa算法,本发明方法的反演精度得到了显著提升,且提升了水体适应性。
20.进一步地,步骤4)中,选择波段包括412nm波段、443nm波段、490nm波段、510nm波段、560nm波段、620nm波段和665nm波段。
21.进一步地,所述波段比值组合为长波段与短波段遥感反射率的比值的组合;所述波段比值组合包括620nm波段和665nm波段分别与412nm波段、443nm波段、490nm波段、510nm波段、560nm波段遥感反射率的比值。
22.进一步地,所述第一反演模型gpr-a和第二反演模型gpr-y的核函数均选择mat
é
rn核函数。
23.进一步地,步骤4)中,所述第一反演模型gpr-a利用自建原位测量数据集seabass2020进行训练和测试得到。
24.上述技术方案的有益效果为:原位测量数据集seabass2020中包含了一定的测量误差和外界环境的影响,因此基于其建立的反演模型能够充分地考虑到由水体、大气以及仪器等造成的不确定性,从而使其更加适于数据集之外的水体和应用于遥感影像之中。
25.进一步地,步骤6)中,所述第二反演模型gpr-y利用模拟数据集ioccg2006进行训练和测试得到。
26.上述技术方案的有益效果为:模拟数据集ioccg 2006不确定性更小,具有更加合理的y取值范围,更利于第二反演模型gpr-y的训练。
附图说明
27.图1是本发明的基于高斯过程回归的qaa水体固有光学特性反演方法的流程图;
28.图2-1是本发明的输入特征为in_rrs构建的a(560)反演模型的效果图;
29.图2-2是本发明的输入特征为in_ratio构建的a(560)反演模型的效果图;
30.图2-3是本发明的输入特征为in_rrs ratio构建的a(560)反演模型的效果图;
31.图3-1是本发明的输入特征为in_rrs构建的y反演的效果图;
32.图3-2是本发明的输入特征为in_ratio构建的y反演的效果图;
33.图3-3是本发明的输入特征为in_rrs ratio构建的y反演的效果图;
34.图4-1是本发明的模拟噪声为gn生成的模拟误差在不同波段间的相对关系图;
35.图4-2是本发明的模拟噪声为gnwk生成的模拟误差在不同波段间的相对关系图;
36.图5-1是本发明的gpr-qaa与qaa_v6的a(560)反演性能对比图;
37.图5-2是本发明的gpr-qaa与qaa_v6的a(510)反演性能对比图;
38.图5-3是本发明的gpr-qaa与qaa_v6的a(490)反演性能对比图;
39.图5-4是本发明的gpr-qaa与qaa_v6的a(443)反演性能对比图;
40.图5-5是本发明的gpr-qaa与qaa_v6的a(412)反演性能对比图。
具体实施方式
41.本发明的基本构思为:本发明在使用qaa算法时,参考波段的吸收系数a(λ0)和颗粒物后向散射系数光谱斜率y不再使用经验模型,使用高斯过程回归(gaussian process regression,gpr)对经验模型进行替换,从而实现对qaa的改进,并称改进后的算法为gpr-qaa反演算法。gpr-qaa反演算法相较于qaa算法的改进包括两方面内容:一是基于gpr建立参考波段吸收系数a(λ0)的反演替代模型,其中参考波段λ0选为560nm,另一部分是基于gpr建立颗粒物后向散射系数光谱斜率y的反演替代模型,这两个反演模型分别称为gpr-a和gpr-y,从而进一步提高qaa的反演精度和水体适应性。
42.下面先对高斯回归过程进行介绍。
43.高斯回归过程是机器学习回归算法中的一种。机器学习回归算法相较于经验模算法,其优势在于不需要假设特征量和兴趣量间的显式函数关系,而是从数据中自主学习函数形式,并且在特征量的选取上具有良好的灵活性,能够充分利用光谱信息并挖掘其中存在的高维特征。高斯过程回归作为基于核的机器学习回归算法,在一些研究中表现出了优于其它机器学习回归算法的性能,并由于其计算是基于贝叶斯框架的,使得其具有后验评估的能力,可以得到反演值的不确定度,这对于分析反演值的误差及合理性具有重要意义。
44.高斯回归过程是高斯过程在连续空间上的预测实现,而基础高斯过程作为一种非参数模型,无需严格的模型形式就可以描述输入变量和输出变量之间的关系,这种能力使其可以很好地适用于多变量的非线性问题。
45.高斯过程对现有数据进行描述时不需要指定拟合函数的明确类别,它被定义为一系列随机变量的集合,而这个集合里任意数量的随机变量都服从联合高斯分布。因此从函数角度上讲,一个高斯过程可以由期望函数m(x)和协方差函数k(x,x

)完全确定,其中,期望函数和协方差函数定义为:
46.m(x)=e[f(x)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0047]
k(x,x

)=e[(f(x)-m(x))(f(x

)-m(x

))]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0048]
式中,e是期望算子;f是需要拟合的关于输入和输出的未知函数;x是训练集中的输入矩阵;x

是测试集中的输入矩阵。
[0049]
高斯过程可以唯一地由下式(1)、(2)确定:
[0050]
f(x)~gp(m(x),k(x,x

))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0051]
为了表示和计算的简单,一般情况下,期望函数通常取零,这对变量的分布描述不
会产生影响。可以发现这样操作后的高斯过程完全是由协方差函数决定的,因此协方差函数选择的合适与否会直接影响高斯过程对变量分布描述的优劣,也即对未知函数表示的优劣程度。利用高斯过程建立回归模型的时候,考虑到现实中的数据通常都存在一定噪声,因此高斯过程在建模时会在协方差函数上添加一个噪声项使得其能够更加符合变量的真实分布。被添加的噪声项表示为一个具有零均值和固定协方差的理想高斯随机分布,并且对于输入向量中的不同分量的噪声项,它们之间是独立同分布的且具有可加性。此时,给定一个存在一定误差的已知数据集,就可以基于高斯过程学习到一个包含先验知识的多元联合高斯分布,也即对未知函数的表达:
[0052][0053]
式中,n为高斯分布;x和y分别为输入和输出数据;k为协方差矩阵函数;脚标为*的代表测试数据,而无脚标的代表训练数据;σ
n2
i为高斯随机噪声矩阵。
[0054]
在此基础上,下面结合附图和实施例,对本发明的一种基于高斯过程回归的qaa水体固有光学特性反演方法进行详细说明。
[0055]
方法实施例:
[0056]
使用gpr-qaa算法实现本发明的一种基于高斯过程回归的qaa水体固有光学特性反演方法的计算流程如图1所示,具体过程如下:
[0057]
步骤一,获取计算波段λ的遥感反射率r
rs

[0058]
步骤二,根据计算波段λ的遥感反射率r
rs
,计算得到计算波段λ的恰在水面下遥感反射率r
rs

[0059][0060]
式中,t=0.52,γq=1.7。
[0061]
步骤三,利用计算波段λ的恰在水面下遥感反射率r
rs
,计算得到计算波段λ的gordon参量u(λ):
[0062][0063]
式中,g0和g1均为常数,一般情况下,g0和g1的取值可为g0=0.089,g1=0.1245。
[0064]
步骤四,选取参考波段λ0=560nm,获取与第一反演模型gpr-a相关的17个输入特征,包括in_rrs和in_ratio,in_rrs包括r
rs
(412)、r
rs
(443)、r
rs
(490)、r
rs
(510)、r
rs
(560)、r
rs
(620)和r
rs
(665),in_ratio包括r
rs
(620)和r
rs
(665)与r
rs
(412)-r
rs
(560)的比值,将这17个输入特征代入至第一反演模型gpr-a中,得到参考波段λ0的吸收系数a(λ0)。其中,第一反演模型gpr-a的构建和训练过程如下:
[0065]
第一反演模型gpr-a为基于高斯过程回归构建得到,模型的输入为输入特征,模型的输出为参考波段λ0的吸收系数a(λ0)。综合olci波段设置、seabass2020和ioccg2006所覆盖的波段,选取412、443、490、510、560、620和665nm波段的遥感反射率作为备选输入特征,分别记为r
rs
(412)、r
rs
(443)、r
rs
(490)、r
rs
(510)、r
rs
(560)、r
rs
(620)和r
rs
(665),并将这7个特征记为in_rrs。同时,考虑水体吸收系数的经验反演模型常使用波段比值进行构建,因此
增加r
rs
(620)和r
rs
(665)与r
rs
(412)-r
rs
(560)的比值作为备选输入特征,分别记为ratio1-ratio10,并将这10个特征记为in_ratio。本实施例中,第一反演模型gpr-a的输入特征选取in_rrs和in_ratio,也即,a(λ0)=a(560)=gpr(in_rrs,in_ratio)。
[0066]
同时,由高斯过程回归的原理可以知道,决定高斯过程回归模型性能的关键在于协方差函数是否能够对变量的分布进行准确的描述,因此协方差函数的选取将对gpr-qaa算法的反演性能产生直接影响,协方差函数在工程应用中通常被称为核函数。核函数是描述变量分布,用于度量变量间距离的函数,其作用通常被描述为将低维空间内不易描述的非线性关系映射为高维空间简单易描述的线性关系。根据核函数定理知道只要一个对称函数所对应的核矩阵半正定,那么它就可以作为核函数,因此核函数的种类十分多样,在高斯过程回归中常用的核函数主要有径向基核函数、指数核函数、有理多项式核函数以及mat
é
rn核函数。目前并不存在一个可以适用于所用问题的核函数,因此为了使高斯过程回归能较好地解决问题,核函数的选取往往需要根据所解决的问题和使用的数据特征进行确定。通过对gpr-a的输入特征遥感反射率和波段比值进行分析发现,清洁水体的光学特性分布连续且遥感反射率间差异较小,而浑浊水体的光学特性分布离散且遥感反射率形状多变。考虑到以上特点,本实施例选择mat
é
rn函数作为第一反演模型gpr-a的核函数,因为其能够很好地适应于平滑和非平滑数据,其定义为:
[0067][0068]
式中,x和x'分别为训练和测试的输入向量;γ和kv分别为伽马函数和优化贝塞尔函数;l是可以通过最大似然自动学习得到的尺度参数;v是用于调节mat
é
rn核平滑程度的权参数;且l和v都为正值参数。
[0069]
第一反演模型gpr-a的训练和测试使用原位测量数据集seabass2020。这是因为对于吸收系数而言,原位测量数据集中包含了一定的测量误差和外界环境的影响,因此基于其建立的反演模型能够充分地考虑到由水体、大气以及仪器等造成的不确定性,从而使其更加适于推广至数据集之外的水体和应用于遥感影像之中。利用原位测量数据集seabass2020对构建的第一反演模型gpr-a进行训练和测试完毕后,便可该第一反演模型gpr-a计算参考波段λ0的吸收系数a(λ0)。
[0070]
步骤五,计算参考波段λ0的颗粒物后向散射系数b
bp
(λ0):
[0071][0072]
式中,u(λ0)表示参考波段λ0的gordon参量;b
bw
(λ0)表示参考波段λ0的纯水后向散射系数。
[0073]
步骤六,获取与第二反演模型gpr-y相关的7个输入特征,包括in_rrs,in_rrs包括r
rs
(412)、r
rs
(443)、r
rs
(490)、r
rs
(510)、r
rs
(560)、r
rs
(620)和r
rs
(665),将这7个输入特征代入至第二反演模型gpr-y中,得到颗粒物后向散射系数光谱斜率y。其中,第二反演模型gpr-y的构建和训练过程如下:
[0074]
第二反演模型gpr-y为基于高斯过程回归构建得到,模型的输入为输入特征,模型的输出为颗粒物后向散射系数光谱斜率y。本实施例中,第二反演模型gpr-y的输入特征选
取in_rrs。也即,y=gpr(in_rrs)。
[0075]
而且,第二反演模型gpr-y的核函数同样选择mat
é
rn核函数。
[0076]
第二反演模型gpr-y的训练和测试使用模拟数据集ioccg2006。本实施例中,第二反演模型gpr-y的训练和测试并未选择原位测量数据集seabass2020,这是因为seabass2020数据集中后向散射系数的数据量少且大多位于清洁水体中,分布很不平衡且缺乏代表性,这对于模型的训练是不利的。而且,相较于吸收系数,后向散射系数的测量更为复杂存在更大的不确定性,因为其并非直接测量获得而是通过测量某一角度的散射相函数再乘上一定常转换系数得到。由于散射相函数不易测量且定常系数的取值也并非固定不变,从而引入了较大的不确定性,会导致y作为后向散射系数的衍生量会存在更大的不确定性,所以seabass2020并不适于构建y的反演式,因此,选用更具代表性、不确定性更小的ioccg 2006。同时,考虑到y的取值范围中包含负值不利于评价指标的对比,对其进行了正规化处理以确保其取值范围落在大于零的范围内。
[0077]
步骤七,根据颗粒物后向散射系数光谱斜率y、参考波段λ0的颗粒物后向散射系数b
bp
(λ0)、参考波段λ0的纯水后向散射系数b
bw
(λ0),计算得到计算波段λ的后向散射系数bb(λ):
[0078][0079]
式中,b
bw
(λ)表示计算波段λ的纯水后向散射系数。
[0080]
步骤八,根据计算波段λ的后向散射系数bb(λ)以及计算波段λ的gordon参量u(λ),计算得到计算波段λ的吸收系数a(λ):
[0081][0082]
至此,便可计算得到计算波段λ的后向散射系数b
bp
(λ)和吸收系数a(λ)。按照同步骤一至步骤八相同的处理方式,可计算得到其他所有波段的后向散射系数和吸收系数,完成水体固有光学特性反演。
[0083]
为进一步分析gpr-a和gpr-y模型的反演性能,还选取了另外三种机器回归算法用以对比,即弹性网络回归(elastic net regression,enr)、支持向量回归(support vector regression,svr)和随机森林回归(random forest regression,rfr)。三者都被广泛用于各类回归反演问题,且都可以取得很好的效果,可以有助于更好地分析本发明模型的优势。为确保机器学习回归算法训练得到的模型具有充分的可靠性和鲁棒性,本实施例采用sklearn的train_test_split函数对seabass2020和ioccg2006进行随机分割,其中训练集占70%,测试集占30%,random_state设置为42。考虑到所有模型中都包含若干超参数,而它们对模型性能产生直接影响,若取值不当会造成欠拟合或过拟合,因此在训练集上采用10折交叉验证来确定模型的最优超参数。使用的模型性能评价指标为r2、rmse、mre、slope以及intercept。
[0084]
1、gpr-a反演模型的性能评估。
[0085]
图2-1至图2-3、以及表1对基于不同输入特征构建的gpr模型和其余三类机器回归模型的性能进行了统计对比,结果显示使用in_rrs ratio作为输入特征构建的gpr-a模型在所有模型中具有最佳的反演性能。
[0086]
如图2-1至图2-3所示,gpr在使用三种输入特征时都取得了很好的反演精度,三个反演模型的r2都超过了0.9,说明gpr在反演水体吸收系数上具有极佳的潜力。从图中可以发现,三个模型的反演值集中地分布在1:1线附近,这意味着gpr能从输入特征中充分提取出与a(560)相关的信息,使得反演模型能同时兼顾低值和高值。不过三组反演模型间也存在一定差异,使用in_rrs作为输入时构建的模型反演性能最差,在高值和低值区域都出现了部分明显偏离1:1线的反演值,而使用in_ratio作为输入时,反演模型的性能较前者得到显著提升,说明对于a(560)的反演而言,波段比值是比遥感反射率更好的特征。而反演性能最佳的模型为使用in_rrs ratio时所建立的gpr-a,表明仅使用波段比值会丢失部分利于a(560)反演的信息,因此在将两者同时作为输入时取得了更好的精度,这也说明了即使是与反演量相关度很低的特征,其中依然可能会包含有利于解释反演量的信息。
[0087]
如表1所示,gpr在三组输入上都取得了最佳的反演性能,且性能都远优于其余模型。四种机器回归算法中以enr的反演精度最低,这是因为其属于正则化多元线性回归,无法适用于非线性数据,而不论是遥感反射率还是波段比值与a(560)之间的关系都是高度非线性的。而svr和rfr都具备强大的非线性拟合能力,因此其构建的反演模型同样表现优异,但总体上svr略优于rfr。在输入特征使用对比上,所有算法都在in_rrs上表现最差,但gpr仍得到了优于其余三类机器回归算法的精度,体现出gpr具备更强的信息挖掘能力。所有算法在使用in_rrs ratio作为输入时的反演性能几乎都优于in_ratio,进一步说明了遥感反射率中包含了波段比值中无法涵盖的a(560)反演信息,因此应当保留其作为特征输入。
[0088]
表1 gpr与其余三种机器回归模型的结果对比
[0089][0090]
2、gpr-y反演模型的性能评估。
[0091]
图3-1至图3-3、以及表2中4种算法在三组输入上的反演结果与吸收系数的结论类
似,同样是以in_rrs ratio作为输入时建立的反演模型精度最高,in_rrs和in_ratio上的误差稍大,且除enr外其余算法在两者间几乎没有差异。从指标上可以看到,以in_rrs ratio作为特征输入时建立的模型反演精度最好,但其它两个模型与其之间的差异很小。通过算法间的对比发现反演精度最佳的算法仍为gpr,在三种输入上的所有评价指标都处于前列,充分表现了gpr在挖掘数据特征和建立反演模型上的卓越性能。而其余4种算法中,enr的反演精度最差,仅在in_ratio上稍优于rfr;同属核方法的svr精度同样很好,尤其是在in_rrs ratio上的误差与gpr相当且显著小于其余算法;rfr虽然在in_rrs和in_ratio上的表现不佳,但在in_rrs ratio上的反演精度仅次于gpr和svr,说明其性能受输入特征影响较大。可见,构建y反演式时,在特征输入量的使用优先级上,in_rrs ratio》in_rrs≈in_ratio,而在算法反演精度上,gpr》svr≈rfr》enr。
[0092]
表2基于ioccg 2006的y反演模型精度对比
[0093][0094]
3、模型鲁棒性对比。
[0095]
从上2部分对各个模型的反演精度分析发现,当使用in_rrs ratio作为输入特征时,基于gpr所构建的a(560)和y反演模型都表现出了最佳的反演精度,但若要确保其应用至新数据时仍具备相对较高的精度,则要求其具有足够的鲁棒性以对抗不同误差等级的数据,尤其是需要应用至遥感影像时。影像上水体的辐射值超过90%是由大气散射造成的,为得到只包含水体信息的遥感反射率需要进行大气校正,这导致输入到模型的数据中又包含了大气校正误差,并且其较原位测量的误差往往更大,因此对模型的鲁棒性有更高的要求。为此,本实施例采用对seabass2020和ioccg2006测试集中的遥感反射率添加模拟误差的方式来检验模型鲁棒性。
[0096]
模拟噪声的生成采用了两种方法,一种是不考虑波段间误差相对关系的高斯随机
噪声(gaussian noise,gn),选取10%的噪声等级用以代表原位测量中的低误差情况。另一种是带基准核的高斯随机噪声(gaussian noise with reference kernel,gnwk),其能对波段间误差的相对关系加以考虑,即当某一波段较真值偏大(小)时,其余波段也大概率偏大(小)。gnwk的生成包含两个步骤,首先按照波段间误差相对幅度先随机生成一组基准核,然后在此基准核上再附加10%的高斯随机噪声,以提高模拟噪声的真实性,gnwk用以代表遥感影像上大气校正误差的高误差情况。在模拟噪声等级的确定上参考目前对olci大气校正精度方面的研究,将412nm、443nm、490nm、510nm、620nm和665nm的噪声等级分别定为50%、50%、20%、20%、20%、40%和40%
[90-92]
。为表明gnwk的合理性,图4-1至图4-2中绘制了以大气校正为噪声等级时gn和gnwk生成的模拟误差在不同波段间的相对关系,可以发现,gn中各个波段的相对误差间不存在相关性,仅在幅值范围上存在差异,而gnwk生成的模拟误差在波段间有着明显的相对关系,但这种关系并不是严格的而是包含了一定的随机性,这相较于gn更加符合实际的大气校正误差。此外,为避免高斯随机噪声的特异性,每组模型都进行了50次噪声模拟,选取mre和rmse的均值用以对模型的鲁棒性进行评价,并选取性能仅次于gpr的svr用以对比。
[0097]
如表3所示,对于a(560)而言,不论是10%的低误差gn还是大气校正的高误差gnwk,gpr都表现出了不错的鲁棒性,且以使用in_rrs ratio作为输入构建的gpr-a模型的鲁棒性最强,而svr的鲁棒性则显著弱于gpr。在低误差组上以in_rrs ratio作为输入时构建的gpr-a在mre和rmse上都取得了最佳性能,svr则在使用in_ratio时建立的模型有最低的mre和rmse。在mre增量上,包含波段比值的in_ratio和in_rrs ratio两组反演模型的增量都不及噪声等级的一半,而用另一组输入的模型则有8.01%的增量,表明波段比值对低值a(560)的反演鲁棒性有很重要的影响,并且三组模型的mre增量都未超出10%的噪声等级,说明三者都具备较强的鲁棒性,而svr的mre增量则都高于相应的gpr反演模型。对于rmse增量,gpr在使用in_rrs作为输入时的模型具有最小增量,in_rrs ratio次之,in_ratio的增幅最大,说明遥感反射率对于反演模型在高值部分的鲁棒性有较为重要的影响。
[0098]
在大气校正的高误差组上得到的结论与低误差组基本一致,仍旧是in_rrs ratio构建的gpr-a模型表现出了最强的鲁棒性,mre的增量依旧是包含波段比值的两组模型优于以in_rrs作为输入的模型,rmse增量的趋势也相同,且都优于svr。但是in_rrs作为输入时构建的模型在mre增量上达到了21.96%,是唯一一个超出了大气校正的最低噪声等级20%的模型,进一步说明了波段比值对于模型低值反演鲁棒性的重要性。在rmse增量上,三组模型间的相对差距不如低误差组明显,说明遥感反射率对于提升模型在高值部分的反演鲁棒性有正向影响但有限。svr在高误差组中所有三个反演模型的mre增量都超过大气校正的最低噪声等级,而且除使用in_rrs ratio作为输入的模型外,其mre增量都高于同组的gpr反演模型,说明svr受误差的影响更大,鲁棒性要弱于gpr。
[0099]
但是对于y而言,表3中鲁棒性最强的模型为以in_rrs作为输入时建立的gpr-y模型,并且要远优于其余两个输入特征所建立的反演模型,并且在mre、rmse以及相应的增量上都是最小的。而使用in_rrs ratio构建的反演模型虽然在精度上稍优于gpr-y模型,但是其鲁棒性很差,在面对10%噪声等级的gn时,mre增量就达到了惊人的68.53%,将近噪声等级的7倍,而在大气校正的模拟误差gnwk上mre增量更是达到了接近100%,即使将gn的噪声等级降至5%时,其mre增量仍达到了20%,说明该模型并不适用于存在较大误差的遥感影
像。
[0100]
另一组使用in_ratio作为输入构建的反演模型,其反演精度与gpr-y相近,但在表3中显示出的鲁棒性显著弱于gpr-y,并且在10%的gn上的mre增量也超出了噪声等级。svr基于三组输入构建的反演模型表现出的鲁棒性趋势与gpr一致,由强至弱为in_rrs—in_ratio—in_rrs ratio构建的模型,在mre、rmse以及相应增量这四项指标上都要大于同组的gpr构建的反演模型,并且同样在使用in_rrs ratio作为输入构建的模型上表现出了极差的鲁棒性。分析造成这种情况原因可能是因为,在现有的研究中发现颗粒物后向系数与遥感反射率的大小存在强相关性,尤其是在长波段,而本实施例所使用的波段比值in_ratio恰好是两个长波段与短波段的比值,从而破坏了颗粒物后向散射系数与遥感反射率的相关性,而y作为后向散射系数的衍生量则受其影响更大,所以使用波段比值构建的模型稳定性不强,易受误差的影响。
[0101]
在综合反演精度和模型鲁棒性的表现后,使用in_rrs ratio作为输入特征构建的gpr-a模型和使用in_rrs作为输入特征构建的gpr-y模型分别是反演a(560)和y综合性能最佳的模型。
[0102]
表3gpr与svr反演模型的鲁棒性对比
[0103][0104][0105]
4、与qaa的反演性能对比。
[0106]
为验证改进算法gpr-qaa的性能,使用seabass2020测试集对gpr-qaa与qaa的最新版本qaa_v6进行了对比,结果如图5-1至5-4、以及表4所示。由上述分析可知,对于严格光学闭合的qaa算法,其后向散射系数的反演精度与吸收系数反演精度是高度相关的,且两者的精度表现是一致的,而gpr-qaa与qaa一样也是严格光学闭合的,因此同样具备此性质。并且考虑到seabass2020测试集中包含后向散射系数的组别而很少且都位于清洁水体不具备代表性,因此本节使用吸收系数的反演精度来评价gpr-qaa的反演性能。由于吸收系数的跨度超过了三个以上量级,且在低值区域有较集中的分布,为了显示效果采用对数绘制。
[0107]
从图5-1至5-4可以发现gpr-qaa在所有波段的反演精度都远优于qaa_v6,两者在低值区域即清洁水体,相差较小,而在中高值区域即浑浊水体,gpr-qaa的反演精度则显著占优,由于使用的是对数绘制,两者在高值区域的差异从视觉上被弱化了,但是从r2、mre和rmse间的差异还是可以明显反映出gpr-qaa的精度优势。a(560)作为gpr-qaa参考波段吸收
系数,直接由gpr反演得到,具有极高的精度,rmse和mre仅为qaa_v6的1/3和2/3,并且在图5-1中可以看到gpr-qaa的反演值均匀地分布在1:1线的附近,没有出现明显的系统性偏差。而qaa_v6反演的a(560)则分布的较为离散,尤其是对于浑浊水体,这是由于其参考波段使用的经验模型性能不佳所导致的。
[0108]
对于参考波段560nm以外波段的水体吸收系数,反演精度受到a(560)和y的共同影响,尽管gpr-qaa中的gpr-y模型是基于模拟数据集建立的,但是从图5-2至图5-5可以发现反演得到的412nm至510nm的水体吸收系数精度依旧保持了较高的精度,且都优于qaa_v6,rmse和mre分别降低了24.25%-59.32%和9.55%-29.40%,说明使用gpr-y模型可以反演得到合理的y。但是五个波段的反演精度变化趋势中存在明显的规律,qaa_v6和gpr-qaa的反演精度都随着波长的减小而降低,即离参考波段越远,其反演精度也就越低,而且这在高值区域更为明显。分析导致这种现象的原因主要有两个,一是蓝紫光短波波段的遥感反射率测量相较于黄绿波段存在更大的不确定性,尤其是对于浑浊水体而言由于高浓度有色溶解有机物的强烈吸收效应,使得辐射在水体中迅速衰减,因此辐射的穿透能力十分有限,而表层水体由于风浪的影响会导致水下光场变化迅速,使得遥感反射率的测量十分不稳定进而导致其与固有光学特性间的关系难以被准确描述,而gpr-qaa和qaa_v6对于非参考波段吸收系数的计算需要直接使用遥感反射率,因此这种测量中存在的不确定性会使反演得到的水体吸收系数与实际的环境测量值存在很大的误差。第二个原因是因为颗粒物后向散射系数与波长的关系并非严格的幂律函数形式,尤其对于浮游植物含量较高的水体,而由参考波段水体吸收系数推得其它波段的水体吸收系数恰恰依赖于这种假设关系,因此这也能解释为什么离参考波段越远,反演精度就越差,但是对于大多数水体而言,由此引入的误差相对较小,所以依旧可以保证较高的反演精度。
[0109]
此外,为突出gpr-qaa在浑浊水体中的性能优势,将验证集中的数据分为清洁水体和浑浊水体,并分别统计两者的反演性能指标,结果如表4所示。可以发现,gpr-qaa和qaa_v6在清洁水体中的反演精度都相对较高且相差不大,除a(412)以外,gpr-qaa都仅稍优于qaa_v6。但对于浑浊水体而言,gpr-qaa的反演性能则显著优于qaa_v6,rmse和mre分别降低了24.72%-59.91%和18.06%-31.10%。因此,综上可知,不论是对于清洁水体还是浑浊水体,gpr-qaa都可以取得可靠的反演结果。
[0110]
表4 gpr-qaa与qaa_v6在清洁和浑浊水体中的反演性能对比
[0111]
[0112][0113]
综上,qaa作为水体固有光学特性的半分析反演算法,在面对水体差异巨大和大数据量的数据时,具有良好的反演性能和计算效率,但是其中的关键步骤,参考波段水体吸收系数a(λ0)和颗粒物后向散射系数光谱斜率y由于采用了经验模型,限制了其水体适应性和反演精度的进一步提升。为此,本发明使用高斯过程回归对qaa进行改进,提出了gpr-qaa反演算法,其中改进工作主要包括两个部分:(1)以412、443、490、510、560、620、665nm遥感反射率以及620和665nm遥感反射率与其余5个波段遥感反射率的比值作为特征输入,基于原位测量数据集seabass2020建立了吸收系数参考波段的反演模型gpr-a;(2)以412、443、490、510、560、620、665nm遥感反射率作为特征输入,基于模拟数据集ioccg2006建立了y的反演模型gpr-y。实验结果表明,本发明提出的反演算法较原始qaa算法在精度上得到了显著提升,尤其是对于浑浊水体,412-560nm波段吸收系数的rmse和mre分别降低了24.72%-59.91%和18.06%-31.10%。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献