一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于随机森林模型的积雪深度反演方法及装置

2022-08-28 05:18:54 来源:中国专利 TAG:


1.本技术涉及积雪深度监测技术领域,尤其涉及一种基于随机森林模型的积雪深度反演方法及装置。


背景技术:

2.积雪是冰冻圈主要的要素之一,分布范围广,欧亚大陆和北美大陆冬季至少80%的地区被积雪所覆盖,覆盖面积约为4650万平方公里,季节性变化显著,主要分布在高纬度或高海拔地区。积雪是全球气候变化的重要指示器,积雪的高反照率可以显著地减少地表对太阳短波辐射的吸收,同时积雪具有隔热作用,它减少了地表和大气的热交换,减少了地表向大气的感热和潜热输入,所以它是地球能量平衡的重要因素,对全球气候系统有重要的反馈调节机制。此外,季节性积雪是冰冻圈所有组成要素中最为活跃的部分,在水文过程、生态模式和地球生物化学过程中都起着至关重要的作用。因此,积雪已经成为气象学、生态学、水文学和农业科学等研究领域中重点关注的监测对象。
3.基于统计回归的经验算法是目前应用最为广泛的积雪深度反演算法之一,也发展成了多个传感器的业务化算法,由于积雪参数(尤其是积雪粒径和积雪密度)会随着时间的推移不断地发生演化,积雪的微波辐射信息也将发生明显的变化,传统的统计回归反演算法中并没有考虑积雪特性参数变化的影响,而微波辐射随着积雪参数变化会发生明显的改变,不再是简单的线性关系,因此,统计回归反演算法存在很大的不确定性。优化迭代的算法精度要优于传统的回归算法,但是验证发现,植被地区以及当雪深超过60cm时存在明显的低估现象,可能的误差来源是模型中的大气参数、植被冠层参数、积雪密度参数以及土壤粗糙度参数都是根据经验公式得到或者取固定常数,这些参数存在较强的区域性,在大尺度范围的普适性较差。
4.然而相关技术中的统计回归算法和迭代算法都是基于微波辐射和积雪参数的关系,而这种关系并不是简单的线性关系,同时积雪参数在雪季中也会不断地发生演化,因此,传统的基于物理规律的算法存在很大的不确定性,导致积雪深度的预测效率和精度较低。


技术实现要素:

5.本技术实施例提供一种基于随机森林模型的积雪深度反演方法,包括:获取积雪深度数据和自变量数据;其中,所述自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;基于所述自变量数据中各个数据的相关性以及所述自变量数据中各个数据对所述积雪深度数据的重要程度,构建n种自变量数据组合;其中,n大于等于2;利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型;对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测
模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
6.在一些实施例中,所述经纬度数据包括经度和纬度;按照对所述积雪深度数据的重要程度从大到小的顺序,依次为所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据、所述经度和所述纬度。
7.在一些实施例中,所述构建n种自变量数据组合包括:构建五种自变量数据组合;其中,所述五种自变量数据组合中第一种自变量数据为所述辐射计亮度温度数据,以及所述五种自变量数据组合中第二种自变量数据组合为所述辐射计亮度温度数据和所述地表覆被数据,以及所述五种自变量数据组合中第三种自变量数据组合为所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据,以及所述五种自变量数据组合中第四种自变量数据组合为所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据和所述经度,以及所述五种自变量数据组合中第五种自变量数据组合为所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据、所述经度和所述纬度。
8.在一些实施例中,所述目标积雪深度预测模型为所述第五种自变量数据组合对应的第五个积雪深度预测模型。
9.在一些实施例中,所述精度验证的指标包括均方根误差、偏差和相关系数。
10.在一些实施例中,所述方法还包括:获取所述地表覆被数据中的igbp地表类型分类数据;根据地理坐标的转换方式,将igbp地表类型分类数据转换为预设分辨率的网格数据以匹配微波亮温像元;计算微波亮温像元内的森林下垫面覆盖度和水体下垫面覆盖度;以及,根据质量控制对所述积雪深度数据进行分级;以及,将所述海拔高度数据的空间分辨率调整到空间分辨率阈值以内;对所述海拔高度数据进行数据拼接,得到拼接后的海拔高度数据;对拼接后的海拔高度数据进行取平均计算,换算为预设等经纬度分辨率的格网数据。
11.本技术实施例还提供一种预测积雪深度的方法,包括:获取辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;将所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据和所述经纬度数据输入到预先训练好的积雪深度预测模型中,获得预测的积雪深度数据;其中,所述积雪深度预测模型为基于上述基于随机森林模型的积雪深度反演方法确定的目标积雪深度预测模型。
12.本技术实施例还提供一种基于随机森林模型的积雪深度反演装置,包括:数据获取单元,被配置为获取积雪深度数据和自变量数据;其中,所述自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;数据组合构建单元,被配置为基于所述自变量数据中各个数据的相关性以及所述自变量数据中各个数据对所述积雪深度数据的重要程度,构建n种自变量数据组合;其中,n
大于等于2;模型训练单元,被配置为利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型;精度验证单元,被配置为对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
13.本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的积雪深度反演方法,或预测积雪深度的方法。
14.本技术实施例还提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现上述的积雪深度反演方法,或预测积雪深度的方法。
15.本技术实施例采用下述技术方案:获取积雪深度数据和自变量数据;其中,所述自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;基于所述自变量数据中各个数据的相关性以及所述自变量数据中各个数据对所述积雪深度数据的重要程度,构建n种自变量数据组合;其中,n大于等于2;利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型;对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
16.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:本技术可以更好的学习自变量数据和因变量数据之间的非线性关系,并进行高效的预测,可以用来监测积雪深度信息。本技术实施例基于随机森林算法训练得到的积雪深度预测模型具有高效的运行效率以及较高的预测精度,可以提高反演结果的精度,对积雪深度信息进行高效和精准的预测。
附图说明
17.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1为本技术实施例提供的一种基于随机森林模型的积雪深度反演方法流程图;图2为本技术实施例提供的五个随机森林模型反演精度结果的示意图;图3a至图3e为本技术实施例提供的基于随机森林的积雪深度预测模型的五个输入参数的频率分布图;图4为本技术实施例提供的输入参数之间的相关性示意图;图5为本技术实施例提供的各参数对于积雪深度的重要程度示意图;图6为本技术实施例提供的基于随机森林构建积雪深度预测模型的思路概念图;图7为本技术实施例提供的随机森林反演方法与其他全球产品的比较精度结果的示意图;图8为本技术实施例提供的一种预测积雪深度的方法流程图;
图9为本技术实施例提供的一种基于随机森林模型的积雪深度反演装置结构示意图;图10为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
18.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
19.以下结合附图,详细说明本技术各实施例提供的技术方案。
20.实施例1如图1所示,本技术实施例提供了一种基于随机森林模型的积雪深度反演方法,该方法包括:s101、获取积雪深度数据和自变量数据;其中,自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据。
21.可选地,经纬度数据包括经度和纬度;按照对积雪深度数据的重要程度从大到小的顺序,依次为辐射计亮度温度数据、地表覆被数据、海拔高度数据、经度和纬度。
22.可选地,辐射计亮度温度数据采用高性能微波辐射计的微波亮度温度数据。
23.可选地,地表覆被数据包括常绿针叶林、常绿阔叶林、落叶针叶林、落叶阔叶林和混合林等五种森林覆盖类型。
24.可选地,积雪深度数据为气象台站实际观测的数据,主要包括两个部分:中国气象局提供的积雪站点数据和美国国家海洋和大气管理局公开免费共享的ghcn全球历史气象网每日数据集。中国气象局提供的2953个积雪气象站点数据,并对站点数据根据质量控制进行分级。ghcn数据集包含了全球2219个国家地区共计115082个地面气象台站的观测数据,所有数据经由统一的标准整理以确保数据资料的可靠性和准确性。
25.可选地,海拔高度会影响温度,因此会对积雪的分布有一定的影响。海拔高度数据来源于美国国家海洋和大气管理局。
26.s102、基于自变量数据中各个数据的相关性以及自变量数据中各个数据对积雪深度数据的重要程度,构建n种自变量数据组合;其中,n大于等于2。
27.s103、利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型。
28.s104、对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
29.可选地,精度验证的指标包括均方根误差(root mean square error,rmse)、偏差(bias)和相关系数(correlation coefficient,r)。
30.例如,在n等于5即获得下述五个随机森林模型的反演精度结果如图2所示,验证数据包括剩下的30%的数据以及2014-2015雪季及其之后到2020年的数据样本,共计2641869个样本数据,均方根误差、偏差、相关系数的验证结果如表1所示。
31.表1
从验证结果可以看到,单纯使用卫星遥感观测亮温的算法(即下述模型1)的精度相对较差,均方根误差rmse为38.47cm,线性拟合的相关性小于0.1;对于模型2和模型3,在分别加入森林覆盖度和海拔数据以后,精度结果分别略微提高约1cm,尤其是加入森林覆盖度之后,线性拟合的相关性约从0.15提高至0.32;当加入经纬度数据之后,预测结果的精度显著提高,其中模型5的精度最高,均方根误差rmse为23.97cm,线性拟合的相关性为0.703。
32.在一些实施例中,上述步骤s101还包括对获取到的积雪深度数据和自变量数据进行预处理,数据预处理操作可以包括:获取地表覆被数据中的igbp地表类型分类数据;根据地理坐标的转换方式,将igbp地表类型分类数据转换为预设分辨率(例如,0.25
°
分辨率)的网格数据以匹配微波亮温像元;计算微波亮温像元内的森林下垫面覆盖度和水体下垫面覆盖度;以及,根据质量控制对积雪深度数据进行分级;以及,将海拔高度数据的空间分辨率调整到空间分辨率阈值(例如1km)以内;对海拔高度数据进行数据拼接,得到拼接后的海拔高度数据;对拼接后的海拔高度数据进行取平均计算,换算为预设等经纬度分辨率(0.25
°
)的格网数据。
33.在一些实施例中,上述步骤s102“构建n种自变量数据组合”包括:构建五种自变量数据组合;其中,五种自变量数据组合中第一种自变量数据为辐射计亮度温度数据,以及五种自变量数据组合中第二种自变量数据组合为辐射计亮度温度数据和地表覆被数据,以及五种自变量数据组合中第三种自变量数据组合为辐射计亮度温度数据、地表覆被数据、海拔高度数据,以及五种自变量数据组合中第四种自变量数据组合为辐射计亮度温度数据、地表覆被数据、海拔高度数据和经度,以及五种自变量数据组合中第五种自变量数据组合为辐射计亮度温度数据、地表覆被数据、海拔高度数据、经度和纬度。
34.在一些实施例中,目标积雪深度预测模型为第五种自变量数据组合对应的第五个积雪深度预测模型。
35.在一些实施例中,随机森林算法的分类精度与以下两个因素有关:1、森林中任意两颗树的相关性越小,预测结果的精度越高;
2、森林中每棵树的分类能力越强,整个森林的预测结果的精度越高。
36.因此,自变量数据的选择对基于随机森林的积雪深度预测模型至关重要,首先要保证自变量数据与因变量数据之间的相关性要高,同时自变量数据之间的相关性要低。为了建立高精度的随机森林模型,本技术实施例选择了与积雪信息相关的参数:18.7ghz和36.5ghz的垂直极化亮温梯度差、森林覆盖度、海拔高度数据、经度数据和纬度数据。根据2012-2020年气象台站观测数据统计的基于随机森林的积雪深度预测模型的五个输入参数的频率分布如图3a至图3e所示;输入参数之间的相关性如图4所示;以及各参数对于积雪深度的重要程度分别如图5所示。
37.在一些实施例中,如图6所示,为基于随机森林构建积雪深度预测模型的思路概念图,在随机森林算法的运行过程中,n表示决策树的数量,一般默认取500棵树。用于基于随机森林的积雪深度预测模型的输入自变量数据包括辐射计亮度温度数据(18.7ghz和36.5ghz的垂直极化亮温梯度差)、森林覆盖度、海拔高度数据、经度和纬度。为了探索剔除冗余数据筛选出最佳的自变量数据组合,本技术设置了如表2所示的5个不同的测试模型。
38.表2模型1的训练样本只包括18.7ghz和36.5ghz的垂直极化亮温梯度差tbd(18.7-36.5ghz),而后的测试模型根据自变量数据对积雪深度数据的重要性排序依次加入不同的自变量数据。最后得到的模型训练结果:采用辐射计亮度温度数据(18.7ghz和36.5ghz的垂直极化亮温梯度差)、森林覆盖度、海拔高度数据、经度和纬度数据这5种数据构建得到的自变量数据组合作为训练样本所训练得到的模型精度最高,因此将其作为目标积雪深度预测模型以用于预测积雪深度。
39.此外,为了比较本发明的随机森林模型5的积雪深度反演方法与其他全球积雪深度遥感和再分析产品的精度。其他积雪产品包括但不限于:amsr2遥感产品、globsnow3.0同化产品、ear-interim再分析产品、ear5再分析产品和ear5-land再分析产品。精度比较的结果如图7和表3所示。
40.表3
从验证的精度结果来看,本发明发展的基于随机森林的积雪深度反演方法(模型5)要优于国际上现有的积雪深度产品。本发明的方法精度为23.97cm,其他的产品最好的为globsnow3.0产品,其均方根误差rmse为25.31cm,剩余的四种产品精度明显较差,精度最差的为era-interim产品, 其均方根误差rmse为42.34cm。本发明的相关性也要明显高于其他产品。另外,从反演结果来看,模型5、amsr2产品、globsnow3.0产品、era-interim产品以及era5产品均表现为不同程度的低估现象,而era5-land产品则为高估,其偏差bias为5.95cm。
41.本技术实施例通过详细分析五个自变量数据之间的相关性及其对积雪深度反演的重要性排序,采用不同的训练样本测试了五个随机森林模型,并得到反演精度最高的模型。相较于相关技术基于物理模型的反演方法,本技术采用机器学习中的随机森林方法,测试了五个基于随机森林的积雪深度预测模型,成功的反演了全球的积雪深度信息,验证结果表明,本技术的反演方法要优于国际上的主流的遥感和再分析产品,将为全球尺度积雪遥感的研究人员提供新的反演思路,同时也有助于气象、农业等相关方面的研究。
42.实施例2如图8所示,本技术实施例还提供了一种预测积雪深度的方法,包括:s801、获取辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;s802、将辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据输入到预先训练好的积雪深度预测模型中,获得预测的积雪深度数据;其中,积雪深度预测模型为基于上述的基于随机森林模型的积雪深度反演方法确定的目标积雪深度预测模型。
43.需要说明的是,实施例1、实施例2所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤s101和步骤s102的执行主体可以为设备1,步骤s103和步骤s104的执行主体可以为设备2;又比如,步骤s101的执行主体可以为设备1,步骤s102、步骤s103和步骤s104的执行主体可以为设备2;等等。
44.实施例3如图9所示,本技术实施例还提供了一种基于随机森林模型的积雪深度反演装置,包括:数据获取单元91,被配置为获取积雪深度数据和自变量数据;其中,自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;数据组合构建单元92,被配置为基于自变量数据中各个数据的相关性以及自变量数据中各个数据对积雪深度数据的重要程度,构建n种自变量数据组合;其中,n大于等于2;
模型训练单元93,被配置为利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型;精度验证单元94,被配置为对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
45.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
46.因此,本技术还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本技术中任一实施例的方法。
47.进一步地,本技术还提出一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,处理器执行计算机程序时实现如本技术任一实施例的方法。
48.实施例六本技术实施例提供了一种电子设备。图10是本技术实施例六提供的一种电子设备的结构示意图。如图10所示,本实施例提供了一种电子设备1000,其包括:一个或多个处理器1020;存储装置1010,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器1020运行,使得所述一个或多个处理器1020实现本技术实施例所提供的基于随机森林模型的积雪深度反演方法,该方法包括:获取积雪深度数据和自变量数据;其中,所述自变量数据包括辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;基于所述自变量数据中各个数据的相关性以及所述自变量数据中各个数据对所述积雪深度数据的重要程度,构建n种自变量数据组合;其中,n大于等于2;利用n种自变量数据组合中每种自变量数据组合对一个基于随机森林的积雪深度预测模型进行训练,得到n个训练好的积雪深度预测模型;对n个训练好的积雪深度预测模型进行精度验证,以将n个训练好的积雪深度预测模型中精度达到精度阈值的模型作为反演的目标积雪深度预测模型。
49.或者,当所述一个或多个程序被所述一个或多个处理器1020运行,使得所述一个或多个处理器1020实现本技术实施例所提供的预测积雪深度的方法,该方法包括:获取辐射计亮度温度数据、地表覆被数据、海拔高度数据和经纬度数据;将所述辐射计亮度温度数据、所述地表覆被数据、所述海拔高度数据和所述经纬度数据输入到预先训练好的积雪深度预测模型中,获得预测的积雪深度数据;其中,所述积雪深度预测模型为基于上述的基于随机森林模型的积雪深度反演方法确定的目标积雪深度预测模型。
50.图10显示的电子设备1000仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
51.如图10所示,该电子设备1000包括处理器1020、存储装置1010、输入装置1030和输
(cd-rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
61.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
62.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献