一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于特征优选随机森林的冰川表碛遥感识别方法

2022-11-16 16:37:34 来源:中国专利 TAG:


1.本发明属于机器学习方法的地物信息遥感提取领域,具体来说涉及使用特征优选随机森林方法对冰川表碛进行识别。


背景技术:

2.在冰川运动和堆积过程中挟带的沉积物称为冰碛,由于冰川消融加剧导致内碛暴露或岩石风化、沉积形成碎屑物落于冰川表面,即形成表碛。随着全球气候的剧烈变化,高山冰川出现明显的消融加快和边界退缩,对邻近区域的水文和生态环境产生了深远的影响。区别于无表碛冰川,表碛覆盖型冰川在消融、径流的过程中,表碛会对其产生隔热、阻滞作用,因而呈现出独特的物质平衡状态。识别冰川表碛覆盖范围对监测冰川水文和物质平衡状态具有重要意义。但由于表碛的光谱特性与岩石相近,且易与积雪混杂,冰川表碛的遥感半自动或自动解译成为一个难题。
3.目前的研究中,使用热红外和sar(synthetic aperture radar)影像进行表碛识别具有可行性,但精度普遍较低。将光谱信息与地形、纹理等特征结合,识别表碛的精度能有明显提升,但该方法在不同的研究区需凭经验挑选特征组合,通过试错法确定特征的阈值,具有较大主观性,普适程度不高。
4.随机森林(random forest,rf)是一种经典的机器学习算法,在遥感领域主要用于进行土地覆盖分类以及目标检测。特征优选随机森林在原有算法的基础上引入了特征向量重要性的概念,能够找出分类精度最高、成本最低的特征组合方案,并通过构建决策树极大简化了特征阈值的判定过程。
5.本发明针对目前遥感方法识别表碛研究中遇到的问题,提出了一种基于特征优选随机森林的冰川表碛遥感识别方法,能够准确、快速、低成本的识别冰川表碛范围。


技术实现要素:

6.本发明目的是提供一种能避免表碛与岩石错分、精度高、具有推广性的冰川表碛识别算法,解决传统遥感分类方法精度低、区分表碛与岩石效果差的问题。
7.为了实现上述目的,本发明提出一种基于特征优选随机森林的冰川表碛遥感识别方法,依次包括以下步骤。
8.(1)获取研究区的哨兵2号(sentinel-2)卫星遥感影像,进行辐射定标、大气校正,并将影像的分辨率重采样至(10m),并将影像的合成光谱波段拆分为单波段影像。
9.(2)构建光谱信息、遥感指数、影像纹理、地形特征四类特征向量,并对所有的特征变量进行重要性排序。
10.(3)选择好训练样本和验证样本,按重要性排序结果依次叠加特征向量训练rf模型,分类精度和kappa系数会随特征个数的增加而变化,找到表碛识别精度达到最高时的特征向量个数n。
11.(4)以获得最高的表碛识别精度为准则,优选前n个特征向量构成最优特征组合,
训练rf模型并进行影像分类,得到冰川表碛范围。
12.上述过程中步骤(2)对特征变量进行重要性排序的的具体处理过程如下:由于同类特征向量之间具有较高相关性,在训练模型时会产生信息冗余,导致训练成本增加的同时还会对分类精度产生影响。不用于构建分类模型的剩余数据称为袋外数据(out-of-bag,obb),通过计算oob预测错误率可对每一种特征向量的重要性进行评分。
13.设ni为第i棵数中每种变量的obb数据数量,i(y)为指示函数,值相等时取1,不等时取0。yq∈{0, 1}为第i棵树第q个节点的真实值,y
iq
∈{0, 1}为向量xm中一随机值在第i棵树第q个节点的预测结果,y iq,∏m
∈{0, 1}为另一随机值的预测结果,计算两次obb预测错误率的差值,经标准化处理后即为特征向量xm的在第i棵树的重要性,n棵树得出结果的平均值即该特征向量的重要性vim
mobb
,如下式所示:
附图说明
14.图1为本发明中冰川表碛提取的主流程图。
15.图2为本发明用于冰川表碛提取的训练样本和验证样本点位。
16.图3为各特征向量在表碛识别过程中的重要性排序。
17.图4为表碛识别精度与特征个数的关系。
18.图5为本发明基于特征优选随机森林的冰川表碛识别结果。
具体实施方式
19.下面将参考附图描述本发明的实施例,对本发明实施例中的技术方案进行清楚完整的描述。
20.一种基于特征优选随机森林的冰川表碛遥感识别方法,实施步骤。
21.步骤一:获取研究区的哨兵2号影像并确定用于地物识别的样本点位。
22.(1)数据预处理:对获取的哨兵2号影像进行辐射定标和大气校正,为提高分类精度,将影像重采样至10m,并对影像进行单波段分解。为了清晰辨识表碛和植被间的边界,对影像进行8、4、1波段假彩色合成。
23.(2)为了增加样本量以提高分类精度,扩大选样区域,选取训练样本点,并以750 m
×
750 m格网等间距选取验证样本点。
24.步骤二:构建遥感指数、影像纹理、地形特征三类特征向量。
25.(1)利用获取到的单波段影像互相进行波段运算得到亮度(luminance)、归一化雪盖指数(ndsi)、归一化植被指数(ndvi)、近红外与短波红外波段比值(nir/swir1)、陆地水分指数(lswi)共五个遥感指数。
26.(2)利用获取到的单波段影像进行灰度共生矩阵(gray-level co-occurrence matrix,glcm)运算,得到均值(mean)、方差(variance)、协同性(homogeneity)、反差性(contrast)、非相似性(dissimilarity)、熵(entropy)、角二阶矩(second moment)、相关性
(correlation)共八个纹理特征。
27.(3)使用已有的数字高程模型(dem)获取研究区的高程(elevation)、坡向(aspect)、坡度(slope)共三个地形特征。
28.步骤三:对特征向量进行优选。
29.通过计算oob预测错误率可对每一种特征向量的重要性进行评分。按重要性排序结果依次叠加特征向量训练rf模型,表碛分类精度和kappa系数在特征个数为22时达到最大,以获得最高的表碛识别精度为准则,优选前22个特征向量构成最优特征组合。
30.步骤四:构建随机森林模型。
31.首先对原始样本进行自展法(bootstrap)抽样,有放回地抽取n个子样本集,这一过程使用约63%的原始样本,剩余数据称为袋外数据(out-of-bag,obb),用于rf模型的性能检验。样本抽取完成后,基于子样本集构建n棵决策树,每棵树的每个节点分裂时,依据基尼指数从优选后的特征中选择最佳分裂节点。决策树数量(ntree)设置为500,每棵树内的变量数设置为输入变量数量的平方根。
32.步骤五:利用构建的随机森林模型进行研究区域冰川表碛提取。
33.将由优选特征构建的栅格数据输入随机森林模型中,进行研究区的冰川表碛提取。


技术特征:
1.一种基于特征优选随机森林的冰川表碛遥感识别方法,其特征在于按照以下步骤进行:步骤一:获取研究区影像并选择数量较多的样本点;步骤二:构建多种特征向量,并进行分类贡献度排序,按排序依次叠加特征向量;步骤三:以获得最高的表碛识别精度为准则,优选前n个特征向量构成最优特征组合;步骤四:训练rf模型并进行影像分类,得到冰川表碛范围。2.根据权利要求1所述的获取研究区影像并选择数量较多的样本点,其特征在于:获取研究区的哨兵2号影像,进行8、4、1波段假彩色合成,选取训练样本点后,以750 m
×
750 m格网等间距选取验证样本点;获取研究区的哨兵2号影像、数字高程模型(dem),经辐射定标、大气校正后、重采样至10 m,并对遥感影像进行单波段分解。3.根据权利要求1所述的构建特征向量,并对特征向量进行分类贡献度排序,其特征在于:利用分解出的单波段进行波段运算,得到亮度(luminance)、归一化雪盖指数(ndsi)、归一化植被指数(ndvi)、近红外与短波红外波段比值(nir/swir1)、陆地水分指数(lswi)共五个遥感指数特征;利用获取到的单波段影像进行灰度共生矩阵(gray-level co-occurrence matrix,glcm)运算,得到均值(mean)、方差(variance)、协同性(homogeneity)、反差性(contrast)、非相似性(dissimilarity)、熵(entropy)、角二阶矩(second moment)、相关性(correlation)共八个纹理特征;使用已有的数字高程模型(dem)获取研究区的高程(elevation)、坡向(aspect)、坡度(slope)共三个地形特征。4.根据权利要求1所述计算出每个特征向量的分类贡献度并进行排序,并按照顺序依次叠加特征向量进行分类,以获得最高的表碛识别精度为准则,优选前n个特征向量构成最优特征组合。5.根据权利要求1所述的利用最优特征组合训练随机森林模型,对冰川表碛进行识别,其特征在于对光谱信息、遥感指数、影像纹理、地形特征四类特征向量进行优选,以获得最高表碛识别精度为准则训练随机森林模型,对冰川表碛进行识别。

技术总结
本发明公开了一种基于特征优选随机森林的冰川表碛遥感识别方法,该方法主要步骤如下:对哨兵2号(Sentinel-2)遥感影像进行辐射定标、大气校正、重采样,并将影像的合成光谱波段拆分为单波段影像;构建光谱信息、遥感指数、影像纹理、地形特征四类特征向量,并对所有的特征变量进行重要性排序;重要性排序结果依次叠加特征向量训练RF模型,找到表碛识别精度达到最高时的特征向量个数N;以获得最高的表碛识别精度为准则,优选前N个特征向量构成最优特征组合,训练RF模型并进行影像分类,得到冰川表碛范围。本发明将随机森林与特征优选方法相结合,提供了一种能避免表碛与岩石错分、精度高、具有推广性的冰川表碛识别算法。具有推广性的冰川表碛识别算法。具有推广性的冰川表碛识别算法。


技术研发人员:许民 周卫永 宋轩宇 李振中 王鹏寿 侯志康
受保护的技术使用者:中国科学院西北生态环境资源研究院
技术研发日:2022.08.16
技术公布日:2022/11/15
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献