一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于不均衡样本的储层类型智能划分方法与流程

2022-12-03 00:03:19 来源:中国专利 TAG:


1.本发明涉及石油地球物理勘探技术领域,具体涉及基于不均衡样本的储 层类型智能划分方法。


背景技术:

2.储层类型划分能够直接利用地球物理资料划分泥岩、干层、储层等不同的 类型,在储层预测和含油气性识别中发挥着非常重要的作用。在实际应用中通 常从实际资料特征出发,结合实际工区的专家经验开展人工判别,该过程不仅 耗时而且存在很强的不确定性,采用机器学习方法开展储层类型的智能划分 不仅有助于提高效率,还有助于提高储层类型划分的精度。
3.在利用机器学习开展样本类型划分时往往假设样本数量足够多且不同类 型的样本在数量上保持基本一致。但在实际资料应用过程中往往是少量的油 气储层夹在大量的泥岩中,即有效储层的样本数通常远远少于泥岩或非储层 样本的数量,存在着泥岩、干层和储层类型的样本数量不均衡等问题,导致直 接利用传统机器学习方法开展多类型储层的智能划分时效果往往不理想。如 何针对实际资料中广泛存在的不平衡样本来开展储层类型的高精度智能划分 成为研究热点。如何针对传统储层类型智能划分方法缺乏物理意义等问题开 展深入研究,将参数的物理特征统计范围纳入不均衡样本的重采样过程并适 当控制重采样的样本数量,确保重采样之后的数据具有足够的物理意义且避 免了过采样,对提高储层类型智能划分的精度和效率具有重要意义。


技术实现要素:

4.本发明实施例提供了基于不均衡样本的储层类型智能划分方法,首先通 过聚类分析确定重采样样本的物理参数范围,并将物理参数统计范围纳入不 均衡样本的重采样过程并适当控制重采样的样本数量,确保重采样之后的数 据具有明确的物理意义且避免了过采样,降低噪点对重采样的影响;在此基础 上将参数特征相近的储层类型进行重组与样本编码,通过分层逐级划分储层 类型的方式来保证每一层类型的划分均具有相对均衡的样本数量,从而有效 解决了不均衡样本的储层类型智能划分问题,为提高储层类型智能划分的精 度和效率提供了保障。
5.鉴于上述问题,本发明提出的技术方案是:
6.基于不均衡样本的储层类型智能划分方法,包括以下步骤:
7.步骤1,利用实际测井资料开展聚类分析,确定不同类型储层的各物理参 数的聚类中心值,并在距离中心值30%范围内对各样本集进行有限数量的重采 样;
8.步骤2,将不均衡样本中样本类型数量相对较少但参数特征相近的储层类 型进行重组,作为一个储层类型并对样本进行编码;
9.步骤3,将纵波速度、横波速度、密度、泥质含量和孔隙度等特征值作为 输入,利用随机森林方法来分层逐级进行储层分类。
10.作为本发明的一种优选技术方案,在所述步骤1中,在距离中心值30% 范围内对各样本集进行有限数量的重采样用于确保在合理的物理特征范围内 适当扩充样本数量,避免样本过采样,降低噪点对重采样的影响。
11.作为本发明的一种优选技术方案,所述步骤1包括以下步骤:
12.步骤11,通过聚类统计确定重采样范围后,采用基于k-means聚类的 smote重采样法对样本数量少的各样本集进行平衡,忽略各类储层中样本数 量足够多的样本集后,对于样本数量欠缺每个过滤的聚类f,分别计算欧氏距 离矩阵;
13.步骤12,通过将计算得到的距离矩阵中的的所有非对角元素相加,然后 除以非对角元素的数量,计算每个聚类内的平均距离
14.步骤13,将不同分类中的样本数量少的样本数num(f
l
)除以其平均距离的分类数m次幂,得到密度的度量den(f
l
);
15.步骤14,对得到的各分类密度度量取倒数得到各类的稀疏性度量spar(f
l
);
16.步骤15,将样本数量少的聚类的稀疏因子除以所有聚类的稀疏因子之和, 得到每个聚类样本数量少的采样权重a
l

17.步骤16,对于储层类型中的多数样本数量n,对于其他参数特征相近的 少数样本聚类f
l
重采样后生成的样本数为k
l

18.作为本发明的一种优选技术方案,在所述步骤11中,欧氏距离矩阵计算 过程为:
[0019][0020]
式中,k表示聚类中的点数,l=1,2,...,n表示过滤的聚类数,d(i,j)是 聚类中任意两个点之间的几何距离,i,j=1,2,...,k。
[0021]
作为本发明的一种优选技术方案,在所述步骤12中,密度的度量den(f
l
) 计算过程为:
[0022][0023]
式中,1表示聚类中的样本数少的类型分类数。
[0024]
作为本发明的一种优选技术方案,所述步骤13中,各类的稀疏性度量 spar(f
l
)计算方式为:
[0025][0026]
作为本发明的一种优选技术方案,所述步骤15的计算过程为:
[0027][0028]
式中,表示采样权重,所有采样权重之和为1,m表示分类的种类数。
[0029]
作为本发明的一种优选技术方案,所述步骤16的计算过程为:
[0030][0031]
作为本发明的一种优选技术方案,所述步骤3中具体包括:
[0032]
步骤31,首先将参数特征相近的储层重组为一类,采用随机森林方法对 重组后的类型与未重组的储层类型进行智能划分;
[0033]
步骤32,然后,采用随机森林方法对识别出的重组储层类型再进一步开 展储层类型智能划分。
[0034]
相对于现有技术而言,本发明的有益效果是:本基于不均衡样本的储层类 型智能划分方法,通过通过聚类分析确定重采样样本的物理参数范围,并将物 理参数统计范围纳入不均衡样本的重采样过程并适当控制重采样的样本数量, 确保重采样之后的数据具有明确的物理意义且避免了过采样,降低噪点对重 采样的影响;在此基础上将参数特征相近的储层类型进行重组与样本编码,通 过分层逐级划分储层类型的方式来保证每一层类型的划分均具有相对均衡的 样本数量,从而有效解决了不均衡样本的储层类型智能划分问题,为提高储层 类型智能划分的精度和效率提供了保障。
[0035]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目 的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0036]
图1为本发明实施例中公开的三类储层样本点交会图;
[0037]
图2为本发明实施例中公开的经过重采样后的三类样本交会图;
[0038]
图3为本发明实施例中公开的逐层分类过程中的泥岩与重组样本交会图;
[0039]
图4为本发明实施例中公开的泥岩与砂岩智能划分结果与实际分类对比 图;
[0040]
图5为本发明实施例中公开的逐层分类过程中的储层与干层样本交会图;
[0041]
图6为本发明实施例中公开的储层逐层分类结果与实际分类结果对比图;
[0042]
图7为本发明实施例中公开的储层类型智能划分方法的步骤图。
具体实施例
[0043]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不 是全部的实施例。
[0044]
如图1-7所示,基于不均衡样本的储层类型智能划分方法,包括以下步 骤:
[0045]
步骤1,利用实际测井资料开展聚类分析,确定不同类型储层的各物理参 数的聚类中心值,并在距离中心值30%范围内对各样本集进行有限数量的重采 样,针对传统的不均衡样本重采样方法完全对数据进行重采样而缺乏物理意 义且容易导致样本冗余甚至出现错误的问题,利用实际测井资料开展聚类分 析,确定不同类型储层的各物理参数的聚类中心值,并在距离中心值30%范 围内对各样本集进行有限数量的重采样,确保在合理的物理特征范围内适当 扩充样本数量,避免样本过采样且能够降低噪点对重采样的影响;
[0046]
步骤11,通过聚类统计确定重采样范围后,采用基于k-means聚类的 smote重采样
法对样本数量少的各样本集进行平衡,忽略各类储层中样本数 量足够多的样本集后,对于样本数量欠缺每个过滤的聚类f,分别计算欧氏距 离矩阵,即:
[0047][0048]
式中,k表示聚类中的点数,l=1,2,...,n表示过滤的聚类数,d(i,j)是 聚类中任意两个点之间的几何距离,i,j=1,2,...,k;
[0049]
步骤12,通过将计算得到的距离矩阵中的的所有非对角元素相加,然后 除以非对角元素的数量,计算每个聚类内的平均距离
[0050]
步骤13,将不同分类中的样本数量少的样本数num(f
l
)除以其平均距离的分类数m次幂,得到密度的度量den(f
l
),即:
[0051][0052]
式中,l表示聚类中的样本数少的类型分类数;
[0053]
步骤14,对得到的各分类密度度量取倒数得到各类的稀疏性度量spar(f
l
), 即:
[0054][0055]
步骤15,将样本数量少的聚类的稀疏因子除以所有聚类的稀疏因子之和, 得到每个聚类样本数量少的采样权重a
l
,即:
[0056][0057]
步骤16,对于储层类型中的多数样本数量n,对于其他参数特征相近的 少数样本聚类f
l
重采样后生成的样本数为k
l
:即:
[0058]kl
=(n*a
l
)/n,l=1,2,...,n;
[0059]
步骤2,在适当扩充聚类样本数量少的样本后,进一步将不均衡样本中样 本类型数量相对较少但参数特征相近的储层类型进行重组,作为一个储层类 型并对样本进行编码;
[0060]
步骤3,将纵波速度(vp)、横波速度(vs)、密度(rhob)、泥质含量(vcl) 和孔隙度(pore)等特征值作为输入,采用随机森林方法将不确定性较强的多 类型储层的智能划分问题转换成确定性更强的二分类问题来分层逐级进行储 层分类,即:对三类储层来讲,首先将参数特征相近的储层重组为一类,采用 随机森林方法对重组后的类型与未重组的储层类型进行智能划分;然后,采用 随机森林方法对识别出的重组储层类型再进一步开展储层类型智能划分,通 过分层逐级划分,不仅能够降低同时开展多类型储层划分的不确定性,同时还 能解决样本数量之间的不均衡性,提高储层类型划分的精度。
[0061]
实施例:
[0062]
采用某地区实际测井数据来试验发明效果,图1为实际测井数据中的三 类储层样本点交会图,其中一类储层样本数量为2434,二类储层样本数量为 1086,三类储层样本数量为967,通过本发明的步骤1的有限重采样后,三种 类型数层样本数分别为2434,1216,1217,其样本点交会图如图2所示,将 参数特征相近的二类和三类样本重组,定义为四类储层,重组后样本点总数与 一类储层样本点总数相当,样本点交会图如图3所示,采用随机森林方法对 两类储层进行智能划分结果对比如图4所示,与实际分类相比,准确率高达 99.3%,最后采用随机森林方法对划分得到的四类储层进行进一步划分得到二 类和三类的划分结果,二类和三类样本点交会图如图5所示,最终三类储层 划分结果与实际分类对比如图6所示,三类储层经过本发明方法预测准确率 高达99.3%。
[0063]
本基于不均衡样本的储层类型智能划分方法,通过针对传统储层类型智 能划分方法缺乏物理意义等问题开展深入研究,通过聚类分析确定重采样样 本的物理参数范围,并将物理参数统计范围纳入不均衡样本的重采样过程并 适当控制重采样的样本数量,确保重采样之后的数据具有明确的物理意义且 避免了过采样,降低噪点对重采样的影响;在此基础上将参数特征相近的储层 类型进行重组与样本编码,通过分层逐级划分储层类型的方式来保证每一层 类型的划分均具有相对均衡的样本数量,从而有效解决了不均衡样本的储层 类型智能划分问题,为提高储层类型智能划分的精度和效率提供了保障。
[0064]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本 发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求 及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献