一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于粒子群算法优化的煤储层渗透率智能预测方法与流程

2021-10-30 01:55:00 来源:中国专利 TAG:算法 采矿工程 组合 多个 而成


1.本发明涉及到采矿工程领域,特别涉及到一种由多个机器学习算法经粒子群算法组合而成的用以智能预测煤储层岩石渗透率的模型。


背景技术:

2.在采煤作业过程中,煤储层所受到的围岩应力、瓦斯压力、自身温度和抗压强度等都在不停地变化,而这些因素会导致煤岩体的渗透性质发生改变,从而导致大规模的瓦斯涌出,造成瓦斯灾害事故。因此,及时、准确地预测煤岩体的渗透率,对于预防瓦斯灾害事故具有重大意义。同时,煤岩体透水的防治、抽放煤层内的煤层气及瓦斯的工业化抽采等作业均要求了解煤岩体的渗透率。
3.目前,预测煤储层渗透率的方法主要有两种。第一,通过实验的方法测量煤层渗透率,可以采用稳态法和瞬态法。稳态法通常是在试样一侧注入一定的压力,待压力

时间演化曲线达到稳态时,记录这段时间内的压力变化量,并进行相关计算,得出渗透率;瞬态法通常是在试样两端注入一定压力的流体,待稳定后再给与一定的脉冲压力,记录压力衰减并进行相关计算,得出渗透率。第二,使用预测模型来得到煤层瓦斯渗透率,即利用机器学习方法预测煤层的渗透率,具体原理为:采用有监督的学习,将已知的岩石数据分为训练集和测试集,通过一定形式的训练与测试,构建最佳预测模型,然后对目标数据进行预测。目前已经使用过的方法包括:bp神经网络模型、动态演化模型、体积应变与渗透率的耦合关系方程、基于anfis的煤体瓦斯渗透率预测模型等方法。
4.第一,若通过实验的方法测量煤层渗透率,以上两种实验方法均耗时较久且需要大量的计算。此外,大量试验表明,以上两种实验方法的测试结果对温度波动异常敏感,而温度的波动会造成气体压力的变化,进而导致测量渗透率的误差,对渗透率的精确测试造成了极大的干扰。同时,由于压力的差异导致选择压力表的量程规格不同,仪器的精度和灵敏度也不同,进而也会引起渗透率计算结果的差异。第二,若使用预测模型来得到煤层瓦斯渗透率,目前用于预测煤岩体渗透率的研究大多基于单一的机器学习模型,这种机器学习方法简单快捷,利用大量的数据建立模型,理论上训练数据越多,得到的预测模型越稳定,通过这种方法可以大体预测出煤岩体的渗透率。但由此建立的预测模型的准确度和泛化性较差,而且极度依赖样本数量,当训练样本体量较小时,模型可能会出现较大误差。


技术实现要素:

5.针对上述现有技术中存在的缺点,本发明提出一种由多个机器学习算法经粒子群算法组合而成的智能预测模型,其功能在于可以实现较为准确地预测出煤体瓦斯渗透率;其主要原理是采用多种机器学习算法对煤体瓦斯渗透率进行预测,再利用粒子群算法确定各个模型所占有的权重,将多种机器学习模型进行组合,得出一个更为准确的组合预测模型,从而降低预测偏差,提升准确度;具体的包括以下步骤:
6.步骤s1,搜集获取用于机器学习的样本,样本内容包括煤岩层的4个指标:煤所受
到的围岩应力、瓦斯压力、自身温度和抗压强度,以及煤岩层的渗透率;
7.步骤s2,进行数据清洗,删除缺失值,剔除离群值,同时使用q

q图检验各指标是否符合正态分布,不符合正态分布的数据也剔除;
8.步骤s3,将清洗后的数据进行分割,分为训练集和测试集;
9.步骤s4,利用数据训练集建立多元线性回归模型、bp神经网络模型、svm模型;
10.步骤s5,利用步骤s4中的模型分别对测试集进行预测,获得预测值;
11.步骤s6,建立联合预测模型其中分别代表多元线性回归模型、bp神经网络模型、svm模型的预测值,利用粒子群算法求得最合适的权值a,b;
12.步骤s7,在得到模型后,将所需参数输入即可预测。
13.作为优选的,在步骤s1中,围岩应力、瓦斯压力、自身温度、抗压强度作为输入值,而渗透率作为输出值。
14.作为优选的,在步骤s2中,如果样本的某个指标为缺失值,则直接删除含有缺失值的个案样本,如果观测值超出箱型图箱体高度(四分位数间距)的两倍以上,则可视该观测值为离群值,同样将样本作剔除处理。
15.作为优选的,在步骤s3中,对于小规模样本集,常用的分配比例是60%训练集、20%验证集、20%测试集;对于大规模样本集,只要验证集和测试集的数量足够即可,可以适当加大训练集的比例。
16.作为优选的,在步骤s4中,
17.对于多元线性回归模型,需要将数据进行标准化,其标准化公式为:
[0018][0019]
其中,则新序列x
′1,x
′2,

x

n
的均值为0,方差为1,且无量纲;
[0020]
多元线性回归总体回归函数的一般形式如下:
[0021][0022]
β0,β1,

,β
k
为回归系数,μ为无法观测且满足一定条件的扰动项,其中:
[0023][0024]
y
i
——样本的真实值
[0025]
——回归得到的预测值;
[0026]
此外,对于多元线性回归模型,采用如下公式检验:
[0027]
(k为自变量个数)
[0028]
其中:
[0029][0030][0031]
sst=ssr sse
[0032]
其中:
[0033]
y
t
——样本的真实值
[0034]
——回归得到的预测值
[0035]
——样本真实值的平均值。
[0036]
作为优选的,在步骤s4中,
[0037]
对于bp神经网络模型,其建模方法为:分别用隐藏层神经元个数传统公式以及经验公式l=2n 1计算得到隐藏层神经元个数,其中l为隐藏层节点数目,m为输入层节点数目,n为输出层节点数目,代入bp神经网络预测模型进行运算,确定使得bp神经网络收敛效果最好,精确度最高的隐藏层神经元个数。
[0038]
作为优选的,在步骤s4中,
[0039]
对于svm模型,给定训练样本集合d={(x1,y1),(x2,y2),

,(x
m
,y
m
)},其中x1,x2,

,x
m
表示m个训练样本的输入值,y1,y2,

,y
m
表示m个训练样本的输出值,y
i
表示训练样本的任意一个输出值。希望得到一个形如f(x)=ω
t
x b的回归模型,使得f(x)与y尽可能接近,ω和b是待确定的模型参数;假设我们能容忍f(x)与y之间最多有∈的偏差,即仅当f(x)与y之间的差别绝对值大于∈时才计算损失;
[0040]
此外,对于svm模型,其建模方法为:使用svr对数据进行回归预测,选取核函数为sigmoid核,其表达式为β>0,θ<0,核函数的本质是将低维空间映射到高维空间,其中x
i
,x
j
为任意两个不同的数据向量,使用交叉验证参数方法选出epsilon

svr最优参数,以及核函数中的coef0参数。
[0041]
作为优选的,在步骤s6中,为了求得三种机器学习模型各自所占的权重大小,就要求出使最小时的a,b值,同时a,b当满足以下约束:
[0042][0043]
而该函数较为复杂,使用一般的方法难以求得最值,而使用粒子群算法则可以快速求得a,b的值;粒子群算法的步骤如下:
[0044]
a:首先确定粒子数量,初始化粒子位置以及速度;
[0045]
b:随后进行迭代,粒子的位置开始发生变化,粒子第d步所在的位置=第d

1步所在的位置 第d

1步的速度
×
运动的时间,即x
d
=x
d
‑1 υ
d
‑1t,第d步的速度=上一步自身的速度惯性 自我认知部分 社会认知部分,即v
d
=wv
d
‑1 c1r1(pbest
d

x
d
) c2r2(gbest
d

x
d
);其中,
[0046]
v
d
——粒子第d步的速度;
[0047]
x
d
——粒子第d步的位置;
[0048]
ω——速度惯性权重;
[0049]
c1——粒子的个体学习因子;
[0050]
c2——粒子的社会学系因子;
[0051]
r1,r2——[0,1]上随机数;
[0052]
pbest
d
——到第d次迭代为止,第i个粒子经过的最好的位置;
[0053]
gbest
d
——到d次迭代为止,所有粒子经过的最好的位置。
[0054]
c:根据上述规则进行迭代,每次迭代后均计算一次适应度,当迭代结果完成收敛时,得到的粒子群聚集的位置就是a,b的最优解。
[0055]
有益效果:本发明将多种机器学习模型进行组合,提取出各个模型的优点,得出一个更为准确的组合预测模型,从而降低预测偏差,提升准确度,这种组合预测模型具有较好的鲁棒性,即使模型假设出现的偏差,也只能对算法性能产生较小的影响。这种组合预测模型的泛化性较强,无论数据的指标数和样本数怎样变化,都可以较为准确地预测出渗透率。这种组合预测模型对训练数据体量的要求比较宽松,用小样本数据训练就可以获得较精确的预测模型。
[0056]
此外,本发明利用粒子群算法取权值,可以更加快捷准确地找到每一种机器学习所对应的权值。相比于实验方法测量煤层渗透率,本发明可以避免繁琐的实验及实验过程中因为温度波动、压力变化、仪器量程及精度而导致测量渗透率的误差,同时也节省了大量的计算及计算误差而引起的渗透率计算结果差异。
附图说明
[0057]
图1整体预测流程图;
[0058]
图2剔除离群值;
[0059]
图3 q

q检验图;
[0060]
图4多元线性回归预测结果对比图;
[0061]
图5 bp神将网络算法流程图;
[0062]
图6神经网络预测结果对比图;
[0063]
图7支持向量机预测结果对比图;
[0064]
图8目标函数的三维图像;
[0065]
图9组合模型的预测结果对比。
具体实施方式
[0066]
下面结合本发明实施例中的附图,对本发明的技术方案进行更为详细的描述;
[0067]
参见图1,基于粒子群算法优化的煤储层渗透率智能预测方法,步骤为:
[0068]
s1:搜集获取用于机器学习的样本,本案例学习样本的输入内容包括煤岩层的4个指标:煤所受到的围岩应力、瓦斯压力、自身温度和抗压强度,煤岩层的渗透率则作为学习样本的输出值;
[0069]
s2:进行数据处理,去除离群值,见图2;使用q

q图检验各指标是否符合正态分布,
剔除不符合正态分布的数据,检验结果见图3;
[0070]
s3,将数据进行分割,分为训练集和测试集,该案例中,数据总数为50组,将数据划分为训练集40组,测试集10组;
[0071]
s4

s5,第一、对于多元线性回归模型:
[0072]
利用数据训练集建立多元线性回归模型,求得模型结果为:
[0073][0074]
对模型进行检验,其检验公式为:
[0075]
(k为自变量个数)
[0076]
其中:
[0077][0078][0079]
sst=ssr sse
[0080]
y
t
——样本的真实值
[0081]
——回归得到的预测值
[0082]
——样本真实值的平均值
[0083]
求得可知拟合优度较好。
[0084]
利用测试集的10组数据进行验证,对于误差大小的评价,采用mape法,其公式为:
[0085][0086]
其中n为测试集的组数,本例中n为10,得到该预测模型的mape=0.039,具体结果见图4;
[0087]
第二、对于bp神经网络模型:
[0088]
利用数据训练集建立bp神经网络模型,具体流程见图5,分别用隐藏层神经元个数传统公式以及经验公式l=2n 1计算得到隐藏层神经元个数,代入bp神经网络预测模型进行运算,最终结果表明,当隐藏层神经元个数为8时,bp神经网络收敛效果最好,精确度最高;该预测模型的mape=0.0175,具体结果见图6。
[0089]
第三、对于svm模型:
[0090]
利用数据训练集建立svm模型,使用svr对数据进行回归预测,选取核函数为sigmoid核,其表达式为β>0,θ<0,核函数的本质是将低维空间映射到高维空间,其中x
i
,x
j
为任意两个不同的数据向量,使用交叉验证参数方法选出epsilon

svr最优参数,以及核函数中的coef0参数;经训练得到结果,mse=9.2
×
10
‑5,平方相关系数=0.9986,该模型的训练效果相当好;该预测模型的mape=0.0161,具体结果见图7。
[0091]
s6,将三种预测模型组合起来,采取加权的方式对每种预测模型进行赋值,从而得
到组合预测模型,即:
[0092][0093]
其中分别是多元线性回归模型、bp神经网络模型、svm模型(支持向量机模型)的预测结果;
[0094]
其目标函数和约束条件为:
[0095][0096][0097]
该目标函数图像复杂,详见图8,一般方法难以求得最值,为了求出目标函数最小时a,b所对应的值,使用智能算法——粒子群算法来求解,设置粒子数量n=30,迭代次数k=50,为了保证粒子在迭代过程中下一步的位置距离当前位置不是太远,本文取υ
max
=0.2;经过matlab程序迭代,得到a=0,b=0.4622,目标函数最小值为0.0018;从迭代结果上来看,粒子群算法不看好多元线性回归模型,其相比较其他两种模型来说,误差较大,因此算法给多元线性回归模型赋予了0的权值;
[0098]
于是,最终的模型为:
[0099][0100]
其中:
[0101]
——bp神经网络预测值;
[0102]
——svm预测值;
[0103]
组合预测模型的mape=0.0088,详见图9,显著优于基于一种机器学习算法的预测模型。
[0104]
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜