一种基于多源卫星遥感数据土壤热通量预测方法

2022-06-02 10:57:28 来源：中国专利 TAG：

1.本发明属于地球系统圈层领域，具体为一种基于多源卫星遥感数据土壤热通量预测方法。

背景技术：

2.土壤热通量作为表征地表和深层土壤能量传输状况的特征量，是地表热量平衡的重要组成部分，其大小以及正负转变直接决定土壤热量的收支，控制土壤水分的蒸发和呼吸，并影响植物根系的生长和呼吸以及对营养物质和水分的吸收。土壤的热力学特性影响地表和大气间的物质和能量交换，对地球大气边界层物理过程、大气环流和区域气候产生重要影响。作为重要的热力学指标，它是能量守恒模型和陆面模式中重要的输入量。因此准确有效的测量土壤热通量可以大大提高陆气间能量平衡的闭合率，更好的反映地表能量交换的过程，对于城市而言，土壤热通量的估算有助于了解城市热环境的变化过程以及地表热特性，进而为缓解城市“热堆积”提供新思路。
3.土壤热通量的获得主要分为观测和计算两种，观测的方法主要是利用土壤热流板进行数据观测，结合土壤热储存量的计算方法计算地表热通量。尽管这种方法可以较为精确的获得数据，但由于只能对单点数据进行观测，并且造价昂贵，很难在全国范围内推广。现阶段公开的土壤热通量实测数据很少，并且公开的测量时间一般为2～3年。这大大限制了数据的使用和推广。土壤热通量计算一般可以结合土壤中多层温度和湿度观测资料推算得到地表热通量，如一维热传导方程法、谐波法和耦合热传导-对流法。不过这些方法都需要实测的多层温度和湿度资料作为基础，尽管计算精度较高，同样存在尺度推广的问题。

技术实现要素：

4.本发明的目的是提供一种基于多源卫星遥感数据土壤热通量预测方法，基于高分辨率光学遥感数据，反演得到高精度的净辐射数据作为模型的主要输入；计算相关特征指数，提出一种新的用于评估土壤热通量的土壤热指数公式；以站点土壤热通量为目标函数，针对有资料的测站，依据所收集的区域特征数据集合及实测土壤热通量，采用随机森林方法进行训练，根据多折交叉验证结果，对输入变量的数量进行取舍；通过筛选的最终输入变量，构建极限学习机模型和基于贝叶斯优化随机森林回归模型；对土壤热通量进行评估，采用gbdt梯度提升树方法，将涉及的3种算法(土壤热指数，极限学习机，随机森林)进行动态组合，建立最优的土壤热通量预测方法；从而利用长时间的遥感数据，估算土壤热通量。主要用于各圈层能量闭合估算，提高全球地表蒸散发反演精度，量化地下“热堆积”等工作。
5.为了实现上述目的，本发明具体采用以下技术方案：
6.一种基于多源卫星遥感数据土壤热通量预测方法，针对包括有实测土壤热通量资料的地区的目标区域，基于目标区域对应的多源卫星遥感数据与再分析数据集，执行以下步骤，实现对目标区域日土壤热通量的预测：
7.步骤a：基于目标区域对应的多源卫星遥感数据与再分析数据集，计算目标区域内
有实测土壤热通量资料的地区对应的高时空分辨率短波辐射、高时空分辨率长波辐射，结合能量守恒原理，得到该地区对应的净辐射通量；
8.基于该地区对应的净辐射通量，结合地表温度日变化的正弦模型，得到该地区对应的瞬时净辐射通量，进而得到该地区对应的日平均地表净辐射通量；
9.步骤b：基于土壤热通量与日平均地表净辐射通量、日平均土壤温度、植被指数之间的线性关系，得到一种用于衡量土壤热通量的土壤热指数公式；
10.步骤c：针对有实测土壤热通量资料的地区，基于该地区对应的多源卫星遥感数据与再分析数据集，采集与该地区日平均地表净辐射通量相同时间序列的区域特征数据、以及该地区对应的区域实测日土壤热通量，构成该地区的区域特征数据集；
11.针对该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对随机森林网络进行训练，得到随机森林回归模型；
12.基于随机森林回归模型，结合多折交叉验证方法，对该地区的区域特征数据进行筛选，更新该地区区域特征数据集中的区域特征数据；
13.步骤d：针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对极限学习机网络进行训练，得到极限学习机回归模型；
14.步骤e：针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，以该地区的区域特征数据为输入，日土壤热通量为输出，结合贝叶斯优化参数方法，对随机森林网络进行训练，得到优化的随机森林回归模型；
15.步骤f：基于一种用于衡量土壤热通量的土壤热指数公式，以及针对有实测土壤热通量资料的地区的极限学习机模型、优化的随机森林回归模型，采用集成学习的方法，将土壤热指数公式、极限学习机模型、优化的随机森林回归模型进行动态组合，建立最优的土壤热通量评估方程，得到土壤热通量预测模型，实现对目标区域日土壤热通量的预测。
16.作为本发明的一种优选技术方案，所述步骤a的具体过程包括：
17.步骤a1，基于目标区域对应的多源卫星遥感数据与再分析数据集，计算目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向下短波辐射和向上短波辐射
[0018][0019][0020]
式中,s0为大气层顶的太阳常数；为太阳天顶角参数；e0为地表水气压；ω为经验系数；α
t
为地表真实反照率；
[0021]
步骤a2，基于目标区域对应的多源卫星遥感数据与再分析数据集，利用斯特藩-玻尔兹曼定律计算目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向上长波辐射和向下长波辐射
[0022][0023][0024]
式中，ta为空气温度，ts为地表温度，εa为空气发射率，εs为地表发射率；σ表示斯特
藩-玻尔兹曼常数
[0025]
步骤a3，针对目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向下短波辐射向上短波辐射向上长波辐射和向下长波辐射基于能量守恒原理，得到该地区对应的净辐射通量rn；
[0026][0027]
步骤a4，基于该地区对应的净辐射通量，结合地表温度日变化的正弦模型，得到该地区对应的瞬时净辐射通量，进而得到该地区对应的日平均地表净辐射通量r
day
；
[0028][0029][0030]
式中，t
ovp
为卫星过境时刻，rn(t
ovp
)为卫星过境时刻的净辐射通量；t为一天内任意时刻,rn(t)为一天内任意时刻的瞬时净辐射通量；t
rise
为该地区的日出的时刻，t
set
为该地区的日落的时刻。
[0031]
作为本发明的一种优选技术方案，所述步骤b中，基于土壤热通量与日平均地表净辐射通量、日平均土壤温度、植被指数之间的线性关系，得到一种用于衡量土壤热通量的土壤热指数公式；该公式如下：
[0032][0033]
si＝0.12*r
day
0
·
583*t
s-40
·
487*msavi-4
·
97
[0034]
式中，msavi为土壤调整植被指数，ρ
nir
为卫星传感器的近红外波段，ρ
red
为卫星传感器的红波段，si为土壤热指数，ts为地表温度，r
day
为日平均地表净辐射通量。
[0035]
作为本发明的一种优选技术方案，所述步骤c的过程如下：
[0036]
针对有实测土壤热通量资料的地区，基于该地区对应的多源卫星遥感数据与再分析数据集，采集与该地区日平均地表净辐射通量相同时间序列的区域特征数据、以及该地区对应的区域实测日土壤热通量，构成该地区的区域特征数据集；
[0037]
步骤c1，针对该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对随机森林网络进行训练，并基于基尼系数对随机森林模型中各决策树的节点进行二分类划分，得到随机森林分类模型；
[0038]
基尼系数公式如下：
[0039][0040]
yim
qm
＝gi
m-gi
g-gih[0041]
式中，gim表示节点m的基尼指数，k为类别数，k为节点m的类别总数，p
mk
为节点m中类别数为k所占的比例，特征为q的区域特征在节点m分支前后的基尼指数变化为vim
qm
，g和h
分别代表节点m分支后的两不同的节点，gig和gih为分别为节点m分支后的两节点g和h分别对应的基尼指数；
[0042]
步骤c2，针对随机森林模型，基于各区域特征基尼系数和基尼指数变化，计算各区域特征的重要性评分和重要性占比；
[0043][0044][0045]
式中，n为决策树的数量，n为决策树的总量，m指代在决策树上出现特征q的任意一节点，d为任意一棵决策树所有出现特征q节点的集合，vimq是特征为q的区域特征的重要性评分，vim
norm
是特征为q的区域特征归一化处理的基尼系数百分比值，得到各输入特征对解释目标变量的重要性占比，u为随机森林区域特征的总数量；
[0046]
步骤c3，利用多折交叉验证法，分别建立不同数量特征的土壤热通量回归模型，并计算各土壤热通量回归模型的验证误差，比较验证误差与特征数量的关系，结合各特征的基尼系数作为依据，选取最优特征变量，更新该地区的区域特征数据集中的区域特征数据。
[0047]
作为本发明的一种优选技术方案，所述步骤d中，针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，执行以下步骤：
[0048]
步骤d1，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对极限学习机网络进行训练，得到极限学习机回归模型；公式如下：
[0049][0050]
式中，βi表示连接第i个隐层节点与网络输出节点的输出权值向量，g(x)为激活函数，wi表示网络输入层阶段与第i个隐含层节点的输入权值向量，xj为模型第j个输入特征值，c为隐含层节点个数，bi是第i个隐层单元的偏置,yj表示第j个输出向量，m表示样本总数。
[0051]
步骤d2，不断优化极限学习机，寻求最优解，至损失函数最小，得到极限学习机模型，损失函数公式表达为：
[0052][0053]
其中，q表示网络的输入权值和隐藏层节点域值，h表示隐藏层输出矩阵，β表示输出权值矩阵，y表示样本集的目标值矩阵，e(q，β)表示损失函数。
[0054]
作为本发明的一种优选技术方案，所述步骤e中，采用贝叶斯优化随机森林回归模型中每个节点要选择的特征数量和决策树的数量两个参数。
[0055]
作为本发明的一种优选技术方案，所述步骤f中，采用集成学习的方法，将土壤热指数公式、极限学习机模型、优化的随机森林回归模型进行动态组合，建立最优的土壤热通量评估方程，得到土壤热通量预测模型，实现对目标区域日土壤热通量的预测，土壤热通量评估方程公式为：
[0056][0057]
式中：f0为表示初始弱学习器，t为最大迭代次数，t为迭代轮数，u为本集成方法第t次迭代生成的决策回归树叶结点的个数，u为叶结点总数，叶结点区域为r
t，u
，q
t，u
为对应的第t轮的第u个节点的回归树最好的输出值，i表示q
t，u
对应的外部参数向量,x为区域特征值。
[0058]
作为本发明的一种优选技术方案，所述步骤f中，所述集成学习的方法为梯度提升决策树的方法，将土壤热指数公式、极限学习机模型、随机森林回归模型的模拟结果进行动态组合，以实测土壤热通量作为目标值，建立最优的土壤热通量评估方程，得到土壤热通量预测模型，实现对目标区域日土壤热通量的预测。
[0059]
本发明的有益效果是：本发明公开了一种基于多源遥感数据的土壤热通量预测方法，首先使用多源遥感数据计算研究区瞬时净辐射数据，通过地表温度日变化的正弦模型，估算日平均地表净辐射通量；计算相关特征指数，提出一种新的用于评估土壤热通量的土壤热指数公式；提取与净辐射数据相同时间序列的区域特征数据集合，构建随机森林回归模型，评估预测变量的重要性，利用多折交叉验证，对输入变量进行取舍，确定最终的输入特征变量；通过筛选的最终输入变量，构建极限学习机模型和基于贝叶斯优化随机森林回归模型，对土壤热通量进行评估；采用gbdt梯度提升树的方法，将涉及的3种算法土壤热指数、极限学习机贝叶斯优化随机森林进行动态组合，建立最优的土壤热通量评估方法；从而利用长时间的遥感数据，估算土壤热通量。该发明提出的土壤热指数公式可用于量化无资料地区的土壤热通量，为无资料地区的土壤热通量的预测提供参考；对于有实测资料的目标地区，建立了混合动态土壤热通量评估方法，进一步提高了遥感模拟精度。不仅适用于对包括有实测土壤热通量资料的地区的目标区域的日土壤热通量进行预测，而且还适用于对该目标区域内无测站的地区的日土壤热通量进行预测、以及对有测站的地区土壤热通量进行推算。该方法要优于传统的利用公式推算土壤热通量的结果，提高了利用能量守恒模型反演蒸散发的精度，为量化地表热特性提供了新思路。
附图说明
[0060]
图1是本发明提供的基于随机森林的遥感土壤热通量预测方法示意图；
[0061]
图2是初次构建随机森林模型各变量的重要性排序图；
[0062]
图3是十折交叉验证，模型模拟误差与输入变量数量之间的关系图；
[0063]
图4是具体实施例中动态组合模型模拟结果与权利其他3种模型泰勒对比图；
[0064]
图5是具体实施例中预测的连续土壤热通量结果。
具体实施方式
[0065]
下面结合附图对本发明进行进一步说明。
[0066]
为了满足全球蒸散发估算及陆面模式计算需求，在过去的几十年，研究人员一直致力于采用经验参数化模型对土壤热通量进行预测。通常来说，土壤热通量与净辐射，地表温度，植被生长状态存在相关关系。基于此，首先基于多源遥感数据，使用土壤调整植被指
数(msavi)代替了常用的叶面积指数(lai)，归一化差值植被指数(ndvi)等指数来描述植被的生长状态，提出了土壤热指数公式，该指数可以为无资料地区土壤热通量的评估提供参考。对于有实测资料的测站，采用流行的机器学习方法进行模拟，由于单一机器学习模型可能会过拟合的现象，基于随机森林筛选的模型输入特征值，分别建立了极限学习机模型和贝叶斯优化的随机森林回归模型估算土壤热通量。最后利用gbdt梯度提升树方法，对上述经验指数模型和机器学习模型进行动态组合。建立最优土壤热通量评估模型，该方法计算精度更高，具有现实意义。
[0067]
如图1所示，一种基于多源卫星遥感数据土壤热通量预测方法，针对包括有实测土壤热通量资料的地区的目标区域，基于目标区域对应的多源卫星遥感数据与再分析数据集，执行以下步骤，实现对目标区域日土壤热通量的预测。
[0068]
步骤a：基于目标区域对应的多源卫星遥感数据与再分析数据集，计算目标区域内有实测土壤热通量资料的地区对应的高时空分辨率短波辐射、高时空分辨率长波辐射，结合能量守恒原理，得到该地区对应的净辐射通量；
[0069]
基于该地区对应的净辐射通量，结合地表温度日变化的正弦模型，得到该地区对应的瞬时净辐射通量，进而得到该地区对应的日平均地表净辐射通量。
[0070]
所述步骤a的具体过程包括：
[0071]
步骤a1，基于目标区域对应的多源卫星遥感数据与再分析数据集，计算目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向下短波辐射和向上短波辐射
[0072]
计算露点温度td，利用clausius-clapeyron公式，计算地表水气压e0(单位：hpa)，结合太阳天顶角参数(单位：rad)，计算向下短波辐射(单位：w
·
m-2
)；
[0073][0074][0075]
式中,s0为大气层顶的太阳常数，约为1367w
·
m-2
；为太阳天顶角参数；e0为地表水气压；ω为经验系数，等于0.0455；式中为近地表气温(可同时计算露点温度td)，ps地表大气压，和为大气廓线接近地表第一层和第二层的气温；和为大气廓线接近地表的第一层和第二层大气,ts为卫星反演地表温度，lv为蒸发潜热，约为2.5*106j
·
kg-1
；rv是水汽的气体常数，约为461j
·
kg-1
k-1
；其中所涉及大气廓线气温和大气压参数由mod07_l2得到，s0由mod03得到，ts可由mod06_l2得到。
[0076]
根据当地正午时分的太阳天顶角，计算天空散射比因子的近似值作为权重因子。采用线性加权平均法获得地表真实反照率α，结合向下短波辐射数据，计算向上短波辐射(单位：w
·
m-2)数据，
[0077][0078]
α
t
＝γ
·
α
white
(1-γ)
·
α
black
[0079]
[0080]
式中，γ为天空散射比因子，α
t
为地表真实反照率，α
white
为白空反照率，α
black
为黑空反照率。α
white
和α
black
可由mcd43c3产品获得。
[0081]
步骤a2，基于目标区域对应的多源卫星遥感数据与再分析数据集，利用斯特藩-玻尔兹曼定律计算目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向上长波辐射和向下长波辐射
[0082]
计算大气发射率εa和εs，并利用steffan-bolzman定律计算向上和向下长波辐射(单位：w
·
m-2
)，
[0083][0084][0085][0086][0087]
式中，ta为空气温度，ε
31
和ε
32
分别为modis数据第31波段(10.78～11.28μm)和32波段(11.70～12.27μm)发射率，ts为地表温度，三者均可从mod11a1产品获得，εa为空气发射率，εs为地表发射率，σ表示斯特藩-玻尔兹曼常数。
[0088]
步骤a3，针对目标区域内有实测土壤热通量资料的地区对应的高时空分辨率向下短波辐射向上短波辐射向上长波辐射和向下长波辐射基于能量守恒原理，得到该地区对应的净辐射通量rn；
[0089][0090]
步骤a4，基于该目标区域对应的净辐射通量，结合地表温度日变化的正弦模型，结合白天时长(日照实数)，得到该地区对应的瞬时净辐射通量，进而得到该地区对应的日平均地表净辐射通量r
day
；
[0091][0092][0093]
式中，t
ovp
为卫星过境时刻，rn(t
ovp
)为卫星过境时刻的净辐射通量；t为一天内任意时刻,rn(t)为一天内任意时刻的瞬时净辐射通量；t
rise
为该地区的日出的时刻，t
set
为该地区的日落的时刻，可以通过当前日期和地理位置获得，通过对rn(t)进行积分可得日净辐射值r
day
。
[0094]
步骤b：基于土壤热通量与日平均地表净辐射通量、日平均土壤温度、植被指数之间的线性关系，得到一种用于衡量土壤热通量的土壤热指数公式，即日土壤热通量公式。
[0095]
所述步骤b中，基于土壤热通量与日平均地表净辐射通量、日平均土壤温度、植被指数之间的线性关系，得到一种用于衡量土壤热通量的土壤热指数公式；即日土壤热通量公式，该公式如下：
[0096][0097]
si＝0.12*r
day
0.583*t
s-40.487*msavi-4.97
[0098]
式中，msavi为土壤调整植被指数，ρ
nir
为卫星传感器的近红外波段，ρ
red
为卫星传感器的红波段，si为土壤热指数，ts为地表温度，r
day
为日平均地表净辐射通量。
[0099]
步骤c：针对有实测土壤热通量资料的地区，基于该地区对应的多源卫星遥感数据与再分析数据集，采集与该地区日平均地表净辐射通量相同时间序列的区域特征数据，选取与土壤热通量有关的因子，即空气温度、地表温度、反照率、增强型植被指数、均一化植被指数、地表水体指数、反照率、各层平均土壤湿度和平均土壤温度、降雨等因素，如地表反照率，0～10cm平均土壤湿度、10～40cm平均土壤湿度、40～100cm平均土壤湿度、100～200cm平均土壤湿度，0～10cm平均土壤温度、10～40cm平均土壤温度、40～100cm平均土壤温度、100～200cm平均土壤温度，风速，降雨等，以及该地区对应的区域实测日土壤热通量，构成该地区的区域特征数据集。
[0100]
针对该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对随机森林网络进行训练，得到随机森林回归模型；
[0101]
基于随机森林回归模型，结合多折交叉验证方法，对该地区的区域特征数据进行筛选，更新该地区区域特征数据集中的区域特征数据。
[0102]
所述步骤c的过程如下：
[0103]
针对有实测土壤热通量资料的地区，基于该地区对应的多源卫星遥感数据与再分析数据集，采集与该地区日平均地表净辐射通量相同时间序列的区域特征数据、以及该地区对应的区域实测日土壤热通量，构成该地区的区域特征数据集。
[0104]
步骤c1，针对该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，算法用有抽样放回的方法(bookstrap)从样本集中选取n个样本作为一个训练集，用抽样得到的样本集生成一颗决策树。在每一个决策树节点不重复地选择m个特征，不断重复得到n颗决策树，对随机森林网络进行训练，并基于基尼系数对随机森林模型中各决策树的节点进行二分类划分，得到随机森林分类模型，最后利用训练得到的随机森林对测试样本进行预测，利用票选法决定预测的结果；
[0105]
基尼系数公式如下：
[0106][0107]
vim
qm
＝gi
m-gi
g-gih[0108]
式中，gim表示节点m的基尼指数，k为类别数，k为节点m的类别总数，p
mk
为节点m中类别数为k所占的比例，特征为q的区域特征在节点m分支前后的基尼指数变化为vim
qm
，g和h分别代表节点m分支后的两不同的节点，gig和gih为分别为节点m分支后的两节点g和h分别对应的基尼指数。
[0109]
步骤c2，针对随机森林模型，假设该随机森林有n棵树，基于各区域特征基尼系数和基尼指数变化，特征xi在任一棵决策树中出现的所有节点在集合d中，那么特征xi节点在所有树的重要性评分和重要性占比，如图2所示；
[0110][0111][0112]
式中，n为决策树的数量，n为决策树的总量，m指代在决策树上出现特征q的任意一节点，d为任意一棵决策树所有出现特征q节点的集合，vimq是特征为q的区域特征的重要性评分，vim
norm
是特征为q的区域特征归一化处理的基尼系数百分比值，得到各输入特征对解释目标变量的重要性占比，如图3所示，u为随机森林区域特征的总数量。
[0113]
步骤c3，利用多折交叉验证法，分别建立不同数量特征的土壤热通量回归模型，并计算各土壤热通量回归模型的验证误差，比较验证误差与特征数量的关系，结合各特征的基尼系数作为依据，选取最优特征变量，更新该地区的区域特征数据集中的区域特征数据。以十折为例。首先，将数据分为10组，抽取10份中的一份数据作为验证集，剩余9组作为测试集，重复10次，测试结果采用10组数据的测试误差的平均值作为最后精度评价，根据最终的特征重要性评分进行输入变量的筛选。
[0114]
步骤d：针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对极限学习机网络进行训练，得到极限学习机回归模型。
[0115]
所述步骤d中，针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，执行以下步骤：
[0116]
步骤d1，以该地区的区域特征数据为输入，该地区的区域日土壤热通量为输出，对极限学习机网络进行训练，得到极限学习机回归模型；公式如下：
[0117][0118]
式中，βi表示连接第i个隐层节点与网络输出节点的输出权值向量，g(x)为激活函数，wi表示网络输入层阶段与第i个隐含层节点的输入权值向量，xj为模型第j个输入特征值，c为隐含层节点个数，bi是第i个隐层单元的偏置,yj表示第j个输出向量，m表示样本总数。
[0119]
步骤d2，不断优化极限学习机，寻求最优解，至损失函数最小，得到极限学习机模型，损失函数公式表达为：
[0120][0121]
其中，q表示网络的输入权值和隐藏层节点域值，h表示隐藏层输出矩阵，β表示输出权值矩阵，y表示样本集的目标值矩阵，e(q，β)表示损失函数。
[0122]
步骤e：针对有实测土壤热通量资料的地区，基于该地区的区域特征数据集，以该地区的区域特征数据为输入，日土壤热通量为输出，结合贝叶斯优化参数方法，采用贝叶斯优化随机森林回归模型中每个节点要选择的特征数量和决策树的数量两个参数，利用贝叶斯优化算法对模型参数进行优化并计算长时间序列土壤热通量，对随机森林网络进行训练，得到优化的随机森林回归模型。
[0123]
贝叶斯优化主要用于参数优化，问题的核心事自动搜索出最优参数值以最大化预期目标，即模拟土壤热通量的误差值最小，因此可以抽象化为函数极值问题，输入为参数，输出为机器学习模型的性能指标。对于本专利的随机森林模型，贝叶斯优化主要输入为决策树的数量和决策树的深度，输出为随机森林模型模拟值与实测值的相关系数。最终选取模型模拟结果相关系数最大时对应的决策树的数量和决策树深度值。
[0124]
具体过程如下：首先初始化n个候选解，计算相应f(p)在对应点的值，这里的候选解为随机选择的参数值p，通常可以在整个可行区间均匀选取一些点，f(x)为随机森林模型模拟结果与实测结果的相关性，通过(p～f(p))的关系建立高斯回归方程模型，得到任一点x的函数值f(p)及对应的后验分布，也就是一个p可以对应多个f(p)，不过每个f(p)概率不同，因此我们可以计算每一个点p对应f(p)的均值、方差以及数学期望。
[0125]
其次，根据数学期望构造出的采集函数，寻找函数极大值点为下一个搜索点并计算该点函数值：采集函数是对每一点是函数极值可能性的估计，反映了该点值得搜索的程度。根据采集函数，我们可以决定本次迭代时在哪个点处进行采样。选取采集函数的极大值，确定下一个采样点x，利用f(p)并计算相应的函数值，此时由于增加了新的x和对应的f(p)，前面构建的高斯回归方程要重新构建，基于此重复上述过程构建高斯方程、采集函数、确定采样点，不断更新采样点。
[0126]
最后，返回n个候选解的极大值为最优解，也就是模型模拟值相关系数最高的那个，进而获得最优参数解。
[0127]
步骤f：以上构建了1个经验指数模型，2个机器学习模型用于评估土壤热通量，即一种用于衡量土壤热通量的土壤热指数公式，以及针对有实测土壤热通量资料的地区的极限学习机模型、优化的随机森林回归模型，为了更好的突出每个模型的优势，采用集成学习的方法，将土壤热指数公式、极限学习机模型、优化的随机森林回归模型进行动态组合，如图4所示，为动态组合模型模拟结果与权利其他3种模型泰勒对比图；建立最优的土壤热通量评估方程，得到土壤热通量预测模型，实现对目标区域日土壤热通量的预测。土壤热通量评估方程公式为：
[0128][0129]
式中：f0为表示初始弱学习器，t为最大迭代次数，t为迭代轮数，u为本集成方法第t次迭代生成的决策回归树叶结点的个数，u为叶结点总数，叶结点区域为r
t，u
，q
t，u
为对应的第t轮的第u个节点的回归树最好的输出值，i表示q
t，u
对应的外部参数向量,x为区域特征值。
[0130]
所述集成学习的方法为梯度提升决策树的方法，将土壤热指数公式、极限学习机模型、随机森林回归模型的模拟结果进行动态组合，以实测土壤热通量作为目标值，建立最优的土壤热通量评估方程，得到土壤热通量预测模型，实现对目标区域日土壤热通量的估算。如图5所示为实施例中预测的7年连续土壤热通量结果。
[0131]
基于目标区域环境各处区域特征的相似性，进而可通过有测站的机器学习模型以及用于衡量土壤热通量的土壤热指数公式集成，建立最优的土壤热通量评估方程，得到土壤热通量预测模型去实现对目标区域日土壤热通量的预测。
[0132]
本发明设计了一种基于多源遥感数据的土壤热通量预测方法，首先使用多源遥感数据计算研究区瞬时净辐射数据，通过地表温度日变化的正弦模型，估算日平均地表净辐射通量。提取与净辐射数据相同时间序列的区域特征数据集合，如地表反照率、土壤水含量、地表温度等数据，计算相关特征指数，提出一种新的用于评估土壤热通量的土壤热指数公式；构建随机森林回归模型，评估预测变量的重要性，利用多折交叉验证，对输入变量进行取舍；确定最终的输入特征变量。通过筛选的最终输入变量，构建极限学习机模型和基于贝叶斯优化随机森林回归模型，对土壤热通量进行评估。采用gbdt梯度提升树的方法，将涉及的3种算法土壤热指数，极限学习机，贝叶斯优化随机森林进行动态组合，建立最优的土壤热通量评估方法；从而利用长时间的遥感数据，估算土壤热通量。该发明提出的土壤热指数公式可用于量化无资料地区的土壤热通量，为无资料地区的土壤热通量的预测提供参考；对于有实测资料的目标地区，建立了混合动态土壤热通量评估方法，进一步提高了遥感模拟精度。不仅适用于对包括有实测土壤热通量资料的地区的目标区域的日土壤热通量进行预测，而且还适用于对该目标区域内无测站的地区的日土壤热通量进行预测、以及对有测站的地区土壤热通量进行推算。该方法要优于传统的利用公式推算土壤热通量的结果，提高了利用能量守恒模型反演蒸散发的精度，为量化地表热特性提供了新思路。
[0133]
以上所述仅是本发明的优选实施方式，并非用以限定本发明。本领域技术人员在不脱离本发明构思的前提下做出若干改进和优化，都应当视为本发明保护的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于跨极式探测线圈的双三相永磁同步电机故障诊断方法

一种基于多源卫星遥感数据土壤热通量预测方法

相关文献

最热文献