一种基于机器学习的石油钻井的参数优化方法及系统与流程

2022-02-19 07:50:02 来源：中国专利 TAG：

1.本发明涉及石油钻井技术领域，特别涉及一种基于机器学习的石油钻井的参数优化方法及系统。

背景技术：

2.目前，石油资源是世界上最重要的能源。稳定的石油资源供给关系到社会经济发展、国防安全、民生等方面，在不断提高我国社会经济水平和科学技术水平的前提下，也增加了石油工业的生产规模，而它正逐渐成为我国社会经济发展的重要支柱产业，在油气资源的勘探开发中将对油气产品的生产和质量产生重大影响。石油钻井数据来源于钻井过程的各个环节，且种类繁多，数量巨大，因而存在海量钻井数据的存储及管理不一致的问题。且钻井过程中钻进参数及地下环境等的复杂性和多样性，以及钻井过程很多因素的不确定性，如：地下环境、地质参数等的不确定，使得钻井决策更多地依赖于专家经验，以至于决策的科学性差。在钻井过程中，现有技术主要通过对钻井的效率或钻井成本进行单一研究，并未将其进行同时考虑，同时在现有技术中通常采用单个模型进行优化，优化效果往往不够理想。

技术实现要素：

3.为解决上述现有技术中所存在的未兼顾钻井时间及钻井成本，同时优化不准确的问题，本发明提供一种基于机器学习的石油钻井的参数优化方法及系统，通过两种模型进行优化参数预测，并能够兼顾钻井效率及钻井成本对石油钻井的最优化参数进行准确预测。
4.为实现上述技术目的，本发明提供了一种基于机器学习的石油钻井的参数优化方法，包括：
5.获取原始数据，基于原始数据，构建训练样本及测试样本，通过训练样本对第一优化模型进行参数调整，并通过参数调整的第一优化模型对测试样本进行计算，获取第一优化数据，其中所述第一优化模型基于梯度提升算法进行构建；
6.通过遗传算法对第一优化数据进行计算，得到第二优化数据，基于第二优化数据，得到石油钻井最优化参数。
7.可选的，所述原始数据包括：地质数据及钻机数据，其中所述钻机数据为历史钻机的各项参数数据。
8.可选的，构建训练样本的过程包括：
9.对原始数据进行预处理，通过十折交叉验证将预处理后的数据进行数据划分，获取训练样本及测试样本。
10.可选的，通过训练样本及测试样本对梯度树提升算法进行训练的过程包括：
11.基于梯度提升算法，构建第一优化模型；
12.将训练样本通过划分为训练和验证集；
13.通过训练集对第一优化模型进行训练，得到第二优化模型；
14.通过验证集对第二优化模型进行验证，基于验证结果，构建验证指标，基于验证指标对第二优化模型进行参数调整，获取第三优化模型，其中测试指标为均方根误差指标；
15.通过第三优化模型对测试样本进行计算，得到第一优化数据。
16.可选的，通过遗传算法对第一优化数据进行计算的过程包括：
17.基于第一优化数据，构建适应度函数，其中适应度函数为钻井时间及钻井成本；
18.通过对第一优化数据进行迭代更新，通过迭代更新中的数据对适应度函数进行求解，获取第二优化数据。
19.可选的，通过对第一优化数据进行更新的过程包括：
20.选取所述第一优化数据中随机位置的数据，对随机位置的数据进行随机扰动变异，其中随机扰动变异包括构建数据取值范围，将数据取值范围内容的随机数据替换原有随机位置的数据进行变异。
21.可选的，得到石油钻井最优化参数的过程包括：
22.对所述第二优化数据进行验证，当所述验证结果达到所述设置阈值时，将所述第二优化数据作为石油钻井最优化参数；否则，继续对所述第二优化数据进行迭代更新，直到所述验证结果达到所述设置阈值时，得到石油钻井最优化参数。
23.为实现上述技术目的，本发明还提供了一种基于机器学习的石油钻井的参数优化方法系统，包括：
24.获取模型，处理模型，选取模块。
25.所述获取模块用于获取原始数据，
26.所述处理模型基于原始数据，构建训练样本及测试样本，通过训练样本对梯度提升算法进行参数调整，并通过训练好的梯度提升算法对测试样本进行计算，获取第一优化数据；
27.所述选取模型用于通过遗传算法对第一优化数据进行计算，获取第二优化数据，对第二优化数据进行选取，得到石油钻井最优化参数。
28.本发明具有如下技术效果：
29.本发明通过获取原始数据，使用基于梯度提升算法的模型对原始数据进行计算，获取第一优化数据，并通过遗传算法对第一优化数据进行计算，得到第二优化数据，在对第二优化数据进行相关处理获取最优化参数，在上述过程中，本发明使用的梯度提升算法为进行粗优化，并通过遗传算法进行细优化，能够对最终的结果精确度进行进一步的提升，在两个模型的输出结果中，都兼顾了钻井效率及钻井成本最小化作为目标输出，同时使用梯度提升算法获取第一优化数据，第一优化数据能够在遗传算法使用过程中，减少一定的计算量，进一步减少计算时间，同时能够进一步提升遗传算法的最优解，具有很强的实用性。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
31.图1为本发明实施例一提供的方法流程示意图；
32.图2为本发明实施例二提供的系统示意图。
具体实施方式
33.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
34.为了解决在现有技术中存在未兼顾钻井时间及钻井成本，同时优化不准确等问题，本发明提供了如下方案：
35.实施例一
36.如图1所述，本发明提供了一种基于机器学习的石油钻井的参数优化方法，包括：
37.s1获取原始数据，所述原始数据包括：地质数据及钻机数据，其中地质数据为石油钻井在不同地理位置下的地质数据，其中地质数据包括陆地海上类别，地理位置及所在位置的具体的地质数据：岩石条件，岩石性质，水文条件等；所述钻机数据为历史钻机的各项参数数据，如大直径钻机钻凿开筒时，钻机的刀具类型、钻压、转数、洗井净度，钻速，洗井液的流速和流量等参数。
38.基于原始数据，构建训练样本及测试样本，通过训练样本对第一优化模型进行参数调整，并通过参数调整的第一优化模型对测试样本进行计算，获取第一优化数据，其中所述第一优化模型基于梯度提升算法进行构建；
39.构建训练样本及测试样本的过程包括：
40.对原始数据进行预处理，通过十折交叉验证将预处理后的数据进行数据划分，获取训练样本及测试样本，训练样本主要用于对模型的优化，而测试样本主要是为了作为一个输入，使用优化好的模型的进行一个最优化石油钻井参数的预测，在第一优化模型预测的基础上，再选择遗传算法进行进一步的参数调整，保证石油钻井参数的最优化。在进行数据划分的过程中，或者可以对训练样本及测试样本进行8：2或其他比例的划分。
41.对原始数据进行预处理的过程包括：
42.对原始数据进行异常数据剔除，其中异常数据为地质数据错误数据及钻机故障数据；将异常剔除后的数据进行数据填充，其中数据填充采用向前填充或平均值填充；将数据填充后的数据进行归一化处理，得到预处理后的数据。在进行异常数据剔除过程中，可以选择计算同一类别原始数据的方差，将方差超出一定阈值的原始数据及相关数据进行剔除，同时由于剔除数据主要为钻井故障数据，也可以选择训练相关支持向量机模型，对数据进行识别，将识别为故障类型的数据进行删除，如果数据量较小或者较为明显时，可直接选择人为查找进行数据剔除。将查看剔除后的数据中是否存在数据缺失，将缺失的数据选择向前填充或各组类平均值进行填充。
43.通过训练样本及测试样本对梯度树提升算法进行训练的过程包括：基于梯度提升算法，构建第一优化模型；
44.所述第一优化模型中的参数包括：n_estimators：弱学习器的最大迭代次数，初始设置为100；learning_rate:每个弱学习器的权重缩减系数，初始设置为1；max_depth:决策
树最大深度，初始设置为5；min_samples_split：最小样本数，初始设置为300等参数。
45.将训练样本通过划分为训练和验证集；通过训练集对第一优化模型进行训练，得到第二优化模型；第一优化模型选择梯度提升算法进行预测，在预测之前，将训练样本进行划分，划分为训练集和验证集，通过训练集对优化模型进行训练，将训练好的优化模型将验证集。
46.通过验证集对第二优化模型进行验证，基于验证结果，构建验证指标，根据验证指标，进一步调整第二优化模型的参数，调整参数中采用3折交叉验证的模式，就这样不断迭代，选择验证指标最好的对应的产出模型，得到训练好的模型，获取第三优化模型，其中测试指标为均方根误差指标(rmse)，当均方根误差指标达到一定阈值时，表示训练好的模型在模型验证中表现优秀，说明该训练好的模型应用于后续模型测试。
47.通过第三优化模型对测试样本进行计算，第三优化模型输出最优化的钻井时间及钻井成本下的钻机参数，得到第一优化数据，其中最优输出为钻井时间钻井成本的乘积最小值。
48.s2通过遗传算法对第一优化数据进行计算，得到第二优化数据，基于第二优化数据，得到石油钻井最优化参数。
49.通过遗传算法对第一优化数据进行计算的过程包括：
50.基于第一优化数据，构建适应度函数，其中适应度函数包括钻井时间及钻井成本，适应度函数为钻井时间与钻井成本最小值目标函数加上约束条件，目标函数为钻井时间与钻井成本最小值，约束条件中包括时间约束，电力约束，当钻井时间及钻井时钻机参数所使用的电力约束不符合相关的约束条件时，则相关的约束条件则变为极大的常数，对数据设置相关的惩罚；
51.通过对第一优化数据进行迭代更新，通过迭代更新中的数据对适应度函数进行求解，获取第二优化数据。在进行遗传算法计算的过程中，将第一优化数据作为初始基因进行更新，由于不同的基因属于不同的类别，所以在不同基因下无法进行交叉操作，只执行变异操作，通过上述的梯度提升算法来获取初始基因，能够提升基因的品质，对后续的计算时间及精度都具有较大的提升。
52.通过对第一优化数据进行更新的过程包括：选取所述第一优化数据中随机位置的数据，对随机位置的数据进行随机扰动变异，其中随机扰动变异包括构建数据取值范围，将数据取值范围内容的随机数据替换原有随机位置的数据进行变异，通过如随机位置基因为5，设定取值范围
±
1，则选取当前随机位置区间[4，6]的随机数值对上述基因5进行替换，并将替换后的基因通过适应度函数进行求解，若当前适应度函数中的目标函数比前一次基因所求取的适应度函数中的目标函数数值小，则选择当前基因进行下一次的更新否则不进行更新，当更新达到预设步数时，停止更新，选择目标函数最小的基因作为第二优化数据。
[0053]
得到石油钻井最优化参数的过程包括：对所述第二优化数据进行验证，当所述验证结果达到所述设置阈值时，将所述第二优化数据作为石油钻井最优化参数；否则，继续对所述第二优化数据进行迭代更新，并计算相关目标函数完成上步骤，直到所述验证结果达到所述设置阈值时，得到石油钻井最优化参数，当无法达到上述阈值时，可选择获取更多的原始数据进行本发明技术方案的操作来求取最优化参数，或者选择最优化的参数进行实际的使用。
[0054]
实施例二
[0055]
如图2所示，本发明还提供了一种基于机器学习的石油钻井的参数优化系统，包括：获取模型，处理模型，选取模块。
[0056]
所述获取模块用于获取原始数据，所述处理模型基于原始数据，构建训练样本及测试样本，通过训练样本对梯度提升算法进行参数调整，并通过训练好的梯度提升算法对测试样本进行计算，获取第一优化数据；所述选取模型用于通过遗传算法对第一优化数据进行计算，获取第二优化数据，对第二优化数据进行选取，得到石油钻井最优化参数。其中各模块中的功能与上述方法相对应，所以此处不做过多的赘述。
[0057]
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：信息加密方法、解密方法、装置、电子设备、存储介质与流程

一种基于机器学习的石油钻井的参数优化方法及系统与流程

相关文献

最热文献