一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于梯度增强多元回归模型的北斗监测滑坡位移量预测方法

2022-06-01 12:48:50 来源:中国专利 TAG:


1.本发明属于滑坡位移量预测领域,具体设计一种基于梯度增强多元回归模型的北斗监测滑坡位移量预测方法。


背景技术:

2.滑坡是坡体因多种因素耦合下而发生的形变,最终被某些诱发因素(如强降雨、地下水活动等)引发失稳产生了滑动的一种地质现象。滑坡位移量主要指山体由于地质活动发生滑动而产生的位移。近年来对滑坡变形的预测一直是地质学者们研究的重点,为提高预测结果的准确性,自1960年以来,各专家学者们相继提出各种预测预报方法。其中滑坡位移预测常用的数学模型有回归模型、灰色预测模型、神经网络等。赵晓萌等比较特征聚合决策树、决策树、朴素贝叶斯和逻辑回归预测模型,得出特征聚合决策树预测模型对降雨型滑坡灾害有更高的预测准确率;袁乾博、l.z.wu、s.h.li等提出基于灰色预测模型对滑坡变形预测算法进行了进一步研究,提高了基于时间序列分析的滑坡变形预测模型的精度及实用性;宋丽伟、杨背背等利用长短时记忆网络(lstm)模型来对滑坡滑动前的累积位移进行动态预测,其结果具有较高的预测精度;张鹏等通过小波变换修正了自回归滑动平均(arma)模型误差,预测了某堤坝短时间内水平位移。杨帆、许强等用人工蜂群支持向量机模型对滑坡位移周期项进行训练和预测,该方法提高了滑坡位移预测的精度。综上所述,虽然滑坡预测模型研究已取得了一定进展,但是仍存在预测模型参数单一、长期预测精度不足等问题,而梯度增强回归模型还未曾应用到滑坡位移预测中。该模型更多的用在金融领域和医学领域等,在预测滑坡领域主要应用于滑坡易发生性评价,但在时空变化领域对滑坡位移进行预测还未曾应用,特别是在基于梯度增强多元回归模型利用多因子预测滑坡位移这方面研究较少。


技术实现要素:

3.发明目的:针对以上问题,本发明提出了一种基于梯度增强多元回归模型的北斗监测滑坡位移量预测方法。该方法基于北斗监测数据降水量、沉降量、深部位移量以及裂隙,首先对获取的数据进行预处理,包括数据清洗、数据集成、数据规约、数据变换;其次利用皮尔逊相关系数分析,分析上述监测数据与滑坡表面位移量之间的关系;接着基于相关因子,利用机器学习模型对滑坡表面位移进行预测,本发明对比了四种模型的预测精度,包括贝叶斯岭回归模型、弹性网络回归模型、支持向量机回归模型和梯度增强多元回归模型;最后对预测精度分析,从而形成完整的高精度模型预测表面位移的一套流程。
4.技术方案:本发明所述的基于梯度增强多元回归模型的北斗监测滑坡位移量预测方法,具体包括以下步骤:
5.(1)整合m组不同滑坡体区域附近的监测数据,获取每组监测数据的自身参数信息及滑坡表面位移量,并对监测数据进行预处理;
6.(2)考虑不同变量的影响,不断改变影响因子个数作为自变量,计算不同影响因子
个数下贝叶斯岭回归模型、弹性网络回归模型、支持向量机回归模型及梯度增强多元回归模型四种模型的方差、平均绝对误差和均方差,从而确定各模型性能;
7.(3)将步骤(1)所述监测数据作为训练集导入给梯度增强多元回归算法,并初始化梯度增强多元回归模型,建立初始弱学习器,通过不断迭代到梯度增强多元回归模型进行训练,进行滑坡表面位移量预测;
8.(4)根据上述对比结果,确定梯度增强多元回归模型精度最高,利用梯度增强多元回归模型进行结果预测,得到最终的滑坡表面位移量预测。
9.进一步地,步骤(1)所述监测数据包括表面位移量、降水量、沉降量、深部位移量以及裂隙。
10.进一步地,步骤(1)所述对监测数据进行预处理过程如下:
11.数据过滤,剔除含有异常值的记录,并利用插值法对缺失进行补全;数据集成,删除多余属性;数据规约,尽量减少数据量,规避无效数据和错误数据带来的影响,提高模型准确性;是数据变换过程即对数据进行规范化处理,以便于后续的各数据相关性分析。
12.进一步地,所述步骤(3)实现过程如下:
13.建立初始弱学习器为:
[0014][0015]
式中,式中f0(x)为训练集样本的初始化模型;l(yi,c)为损失函数,用于判断每轮迭代产生的位移量损失近似值;yi为样本数据的表面位移量;m为样本个数;c为拟合叶子节点最佳输出值;
[0016]
对迭代轮数t=1,2,3,

,t,有:
[0017]
使用损失函数的负梯度在当前模型上的值近似代替残差r
ti

[0018][0019]
式中,r
ti
为第t轮的第i个样本的损失函数的负梯度;l(yi,f(xi))为损失函数;xi为训练集中第i个样本的输入值;yi为训练集中第i个样本的输出值;f(xi)为经过上一轮学习器预测后的预测结果;f
t-1
(x)为第t-1轮迭代后的学习器;
[0020]
用负梯度拟合弱学习器f0(x),建立位移量预测的重点区域r
tj
(j=1,2,

,j),则最佳位移量拟合值:
[0021][0022]
式中,j为叶子节点个数;f
t-1
(x)为第t-1轮迭代后的学习器;c为拟合叶子节点最佳输出值;
[0023]
则第t轮更新的强学习器为:
[0024]
[0025]
式中,f
t-1
(x)为第t-1轮迭代后的学习器;i(x∈r
tj
)为指示函数;
[0026]
获得表面位移量预测函数模型为:
[0027][0028]
有益效果:与现有技术相比,本发明的有益效果:1、本发明将各种监测数据及进行了综合,充分利用了历史数据、多源数据,比单一数据更好、更丰富;2、本发明采用机器学习技术,可以避免物理试验的过程以及理论推导过程,可以在非常短的时间内完成分析和预测过程,大幅度提升了计算的效率和精度;3本发明没有复杂的公式推导及迭代计算,有效避免了计算过程中由于参数不精确而导致的系统误差;4、本发明有效解决了传统的滑坡预测模型存在考虑影响因素单一、长期预测精度低等问题,可以有效应用到工程实践中,实现预防滑坡灾害发生、降低灾害损失。
附图说明
[0029]
图1为本发明的流程图;
[0030]
图2为梯度增强多元回归模型预测流程图;
[0031]
图3为四种机器学习模型的预测精度结果对比图;其中,(a)为方差精度对比图;(b)为平均绝对误差精度对比图;(c)为均方差精度对比图;
[0032]
图4为jc-02表面位移预测结果图;
[0033]
图5为jc-06表面位移预测结果图;
[0034]
图6为db-03表面位移预测结果图;
[0035]
图7为db-05表面位移预测结果图;
[0036]
图8为jc-02监测点夏季表面位移预测结果图。
具体实施方式
[0037]
下面结合附图对本发明作进一步详细说明。
[0038]
本发明提供一种基于梯度增强多元回归模型的北斗监测滑坡位移量预测方法,如图1所示,具体包括以下步骤:
[0039]
步骤1:整合m组不同滑坡体区域附近的监测数据,获取每组监测数据的自身参数信息及滑坡表面位移量。首先对监测数据进行数据预处理,分为以下步骤:一是数据过滤,过程中剔除含有异常值的记录,并利用插值法对缺失进行补全;二是数据集成,过程中删除多余属性;三是数据规约,能尽量减少数据量,从而规避无效数据和错误数据带来的影响,提高模型准确性;四是数据变换过程即对数据进行规范化处理,以便于后续的各数据相关性分析。
[0040]
本发明研究数据来源于西宁市地质灾害监测预警信息平台上西宁南山的北斗监测数据以及其附近的岩土监测数据和气象监测数据,主要包括表面位移量(sd/mm)、降水量(aop/mm)、沉降量(s/mm)、深部位移量(dd/mm)以及裂隙(r/mm)。监测点主要选取南山附近点jc-01、jc-02、jc-04、jc-06和jc-07,因为相较于其他监测点,这五个监测点持续监测时间长、数据完整度高。其中jc-02、jc-06监测点及jc-07监测时间均从2018年7月开始监测,而jc-06监测时间从2018年11月开始监测。以及王家庄附近db-02、db-03和db-05监测点,由
于这三个监测点2020年8月刚刚建成,因此监测时间较短,但可用于监测模型的预测精度的分析。
[0041]
步骤2:考虑不同变量的影响,不断改变影响因子个数作为自变量,计算不同影响因子个数下贝叶斯岭回归模型(bayesian ridge)、弹性网络回归模型(elastic net)、支持向量机回归模型(support vector regression,svr)及梯度增强多元回归模型(gradient boosting regression,gbr)四种模型的方差(ev)、平均绝对误差(mae)和均方差(mse),从而确定各模型性能。
[0042]
如图3(a)-图3(c)所示,随着影响因子个数增加,bayesian ridge和elastic net模型方差、平均绝对误差以及均方差变化不大,因此模型拟合效果较差;而svr模型和gbr模型方差整体上呈现上升趋势,平均绝对误差和均方差呈下降趋势,且当影响因子达到4时,gbr模型的平均绝对误差和均方差值达到最小接近0,而方差值达到最大0.99,说明对比四种模型,gbr模型预测精度最高,可以较为准确地对滑坡位移进行预测。
[0043]
步骤3:将步骤1所述数据作为训练集导入给梯度增强多元回归算法,并初始化模型,建立初始弱学习器,通过不断迭代到梯度增强多元回归模型进行训练,进行滑坡表面位移量预测,如图2所示。
[0044]
梯度增强多元回归模型是基于弱学习器,进行多轮迭代,在弱学习模型上不断迭代并更新学习器的损失函数,进而产生新的预测模型。其建立过程可以表示为:
[0045]
建立的初始弱学习器为:
[0046][0047]
式中,式中f0(x)为训练集样本的初始化模型;l(yi,c)为损失函数,用于判断每轮迭代产生的位移量损失近似值;yi为样本数据的表面位移量;m为样本个数;c为拟合叶子节点最佳输出值。
[0048]
对迭代轮数t=1,2,3,

,t,有:
[0049]
使用损失函数的负梯度在当前模型上的值近似代替残差r
ti

[0050][0051]
式中,r
ti
为第t轮的第i个样本的损失函数的负梯度;l(yi,f(xi))为损失函数;xi为训练集中第i个样本的输入值;yi为训练集中第i个样本的输出值;f(xi)为经过上一轮学习器预测后的预测结果;f
t-1
(x)为第t-1轮迭代后的学习器。
[0052]
用负梯度拟合弱学习器f0(x),建立位移量预测的重点区域r
tj
(j=1,2,

,j),则最佳位移量拟合值:
[0053][0054]
式中,j为叶子节点个数;f
t-1
(x)为第t-1轮迭代后的学习器;c为拟合叶子节点最佳输出值。
[0055]
则第t轮更新的强学习器为:
[0056][0057]
式中,f
t-1
(x)为第t-1轮迭代后的学习器;i(x∈r
tj
)为指示函数。
[0058]
最终获得表面位移量预测函数模型为:
[0059][0060]
步骤4:根据上述对比结果,确定梯度增强多元回归模型精度最高,利用梯度增强多元回归模型进行结果预测,得到最终的滑坡表面位移量预测。
[0061]
通过步骤3所述梯度增强多元回归模型对西宁南山及王家长附近监测点jc-02、jc-06、db-03和db-05进行滑坡位移预测分析,预测结果如图4、5、6、7所示。通过对比图4、图5,西宁南山滑坡一直处于加速变形阶段。由于汛期降雨量的影响,降雨对滑坡表面位移量的影响呈现一定的周期性,对比两监测点可知每年七月、八月、九月的降雨,都导致了滑坡表面位移量明显增加10mm至20mm左右。每年九月滑坡表面位移量会达到最高峰,随着降雨量的减少,表面位移量变化会逐渐减缓,变化量在-5mm至5mm左右;并在下一年的九月再次达到最高峰,以此反复,位移量不断增大。对比王家庄监测点db-03和db-05如图6、图7,强降雨影响下的滑坡表面位移量也呈现一定的滞后性。随着8月10号开始的强降雨,从八月底开始,滑坡位移量变化20mm左右,并随着降雨的结束仍在不断缓慢上升,变化量逐渐减少为5mm左右。
[0062]
在步骤4的基础上,对监测站点jc-02进一步分析,如图8所示。该监测点每年的夏季,由于降雨量增大的影响,滑坡表面位移量不断增大到近70mm如图8,同时雨水对泥岩块体造成崩解、软化,造成裂缝不断增大,然后在重力作用下产生局部滑动。
[0063]
表1是基于jc-02监测点2020年12月的预测结果,分析上述四种模型预测的监测点表面位移量相对误差状况。
[0064]
表1模型相对误差对比
[0065][0066][0067]
从表中31组数据可以看出,贝叶斯岭回归模型和弹性网络回归模型预测结果相对误差取值区间为(-12.5%,-5%),说明预测值比真实值小,且预测结果精度不高;而支持向量机回归模型通过训练后,相对误差取值区间为(-1.9%,0.8%),相较于上述两种预测精度明显提高;最后梯度增强多元回归模型相对误差在区间(-0.8%,0.8%]之间,表明对于
具有非线性关系的滑坡表面位移的预测较为准确,且精度较高。
[0068]
综上,本发明将滑坡多因子影响与梯度增强回归模型相结合,利用梯度多元回归模型对滑坡位移-时间曲线进行预测,解决了滑坡预测过程中传统模型存在的考虑影响因素单一、长期预测精度低等问题。且相关分析处理后的数据,使得表面位移量与影响因子紧密联系起来。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献