一种油井产能主控因素分析方法、系统、设备和存储介质与流程

2022-02-22 18:15:00 来源：中国专利 TAG：

1.本发明涉及油气田开发领域，特别涉及一种数据驱动的油井产能主控因素分析方法、系统、设备和存储介质。

背景技术：

2.油井产能的主控因素是开展油井产能评价的基础研究内容，现有的油井产能主控因素分析方法包括：理论公式、物理实验、数值模拟和数据分析方法。但因油井产能的影响因素众多，且油井产能与各影响因素间呈较强的非线性关系，故以上方法在复杂现实情况下的适用性有限。
3.为更准确地分析油井产能与各影响因素间的非线性关系，采用机器学习方法，并运用实际数据进行油井产能主控因素分析的研究方式得到应用。目前，在该类工作中，多直接采用机器学习算法对已收集数据进行分析，较少关注实际数据的高效数据清洗方法、合理的数据使用方式以及机器学习算法在油井产能研究领域的适用性。致使大量不准确的数据被使用，并导致机器学习算法的分析结果与已有的油田开发理论存在较大偏差。

技术实现要素：

4.针对上述问题，本发明的目的是提供一种数据驱动的油井产能主控因素分析方法、系统、设备和存储介质，能够对实际数据进行高效数据清洗，提高油井产能主控因素分析的准确性。
5.为实现上述目的，本发明采取以下技术方案：
6.第一方面，是提供一种油井产能主控因素分析方法，其包括以下步骤：
7.分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗；
8.分别对经过数据清洗的生产动态因素与静态地质因素做独立分析，并使用机器学习算法开展油井产能主控因素的排序，得到各生产动态因素和静态地质因素的重要性排序。
9.优选地，对于生产动态因素，其数据清洗的步骤为：
10.依据第一预设判别标准筛选已投产的油井；
11.缺失数据处理；
12.依据第二预设判别标准确定油井的正式投产日期；
13.依据第三预设判别标准去除受作业影响的数据。
14.优选地，对静态地质因素，其数据清洗的步骤为：
15.筛选射孔层位的地质因素数据；
16.单井整体地质数据的计算；
17.缺失数据处理。
18.优选地，所述单井整体地质数据的计算方法为：对单井的储层厚度与射开厚度，采用各小层数据的累加，其余各项静态地质因素，则按各层的射开厚度对其进行加权平均，计
算得到单井整体的地质数据。
19.优选地，所述单井整体地质数据的计算公式为：
[0020][0021]
式中，x为单井整体的地质数据；xi为第i层的地质数据；hi为第i层的射开厚度；i为单井的小层编号。
[0022]
优选地，所述对生产动态因素进行分析的方法，包括：
[0023]
①
从生产动态数据集中选取一口井，以日产油量为机器学习算法的标签，以其余各项生产动态因素为输入的特征，采用机器学习算法作为基模型，以该井数据训练基模型并得到各特征的重要性权重；
[0024]
②
依次对各井的生产动态数据按步骤
①
计算特征的重要性权重，并对所有井相应的特征权重取平均值，依据平均权重大小确定各特征的重要性排序；
[0025]
③
依据重要性排序，去除最重要的一个或几个特征，用剩余的特征组成新数据集，并使用基模型进行下一轮训练与特征重要性评价；
[0026]
④
重复
②‑③
步，直至筛选出最不重要的特征，将特征依次被剔除的顺序作为油井产能动态因素的重要性排序。
[0027]
优选地，所述对静态地质因素做分析的方法，包括：
[0028]
①
以所有井的静态地质因素数据为训练集，以日产油量为机器学习算法的标签，以其他各项静态地质因素为输入特征，采用机器学习算法作为基模型，进行模型训练并得到各特征的重要性权重；
[0029]
②
依据权重大小确定各特征的重要性排序，并去除最重要的一个或几个特征，用剩余的特征组成新数据集，并使用基模型进行下一轮训练与特征重要性评价；
[0030]
③
重复第
②
步，直至筛选出最不重要的特征，将特征依次被剔除的顺序作为油井产能静态地质因素的重要性排序。
[0031]
第二方面，是提供一种油井产能主控因素分析系统，其包括：
[0032]
数据清洗模块，用于分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗；
[0033]
主控因素分析模块，用于分别对经过数据清洗的生产动态因素与静态地质因素做独立分析，并使用机器学习算法开展油井产能主控因素的排序，得到各生产动态因素和静态地质因素的重要性排序。
[0034]
第三方面，是提供一种处理设备，所述处理设备至少包括处理器和存储器，所述存储器上存储有计算机程序，所述处理器运行所述计算机程序时执行以实现所述油井产能主控因素分析方法的步骤。
[0035]
第四方面，是提供一种计算机存储介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现所述油井产能主控因素分析方法的步骤。
[0036]
本发明由于采取以上技术方案，其具有以下优点：
[0037]
(1)本发明结合油田开发理论的先验知识，对生产动态与静态地质数据的高效数据清洗；
[0038]
(2)本发明采用适宜于生产动态与静态地质数据特点的数据使用方式，并配合针对油井产能影响因素特点设计的主控因素分析方法，实现对油井产能影响因素中不准确数据的剔除，同时有效提高油井产能主控因素分析的准确性。
[0039]
因此，本发明可以广泛应用于油气田开发领域。
附图说明
[0040]
图1是本发明实施例提供的油井产能主控因素分析方法流程图；
[0041]
图2(a)～图2(h)是本发明实施例中数据清洗前后的生产动态数据对比图，其中，图2(a)是日产油量对比图；图2(b)是生产压差对比图，图2(c)是汽油比对比图；图2(d)是含水率对比图；图2(e)是井口压力对比图；图2(f)是套管压力对比图；图2(g)是油嘴尺寸对比图；图2(h)是泵的频率对比图。
具体实施方式
[0042]
为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。
[0043]
需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本技术的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0044]
本发明提供的一种油井产能主控因素分析方法，分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗；采用控制变量的方法，对已清洗的生产动态与静态地质数据做独立分析，分别设计其应用方式，并使用机器学习算法开展油井产能主控因素的排序，得到各生产动态因素和静态地质因素的重要性排序。本发明通过对生产动态与静态地质数据的高效数据清洗，并采用适宜于生产动态与静态地质数据特点的数据使用方式，可提升机器学习算法在油井产能主控因素研究领域的适用性与准确性。
[0045]
与之相对应地，本发明的一些实施例中还提供一种油井产能主控因素分析系统、设备和存储介质。
[0046]
实施例1
[0047]
如图1所示，本实施例提供的一种油井产能主控因素分析方法，包括以下步骤：
[0048]
1)分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗；
[0049]
2)分别对经过数据清洗的生产动态因素与静态地质因素做独立分析，并使用机器学习算法开展油井产能主控因素的排序，得到各生产动态因素和静态地质因素的重要性排序。
[0050]
优选地，上述步骤1)中，获取的油井数据可以分为生产动态因素与静态地质因素两类。
[0051]
具体地，生产动态因素包括：日期、日生产时长、日产油量、含水率、气油比、生产压差、井口压力、套压、泵的频率、油嘴尺寸等；
[0052]
静态地质因素包括：渗透率、孔隙度、含油饱和度、泥质含量、储层厚度、射开厚度、原油密度、原油粘度等。
[0053]
优选地，上述步骤1)中，对获取的油井数据进行数据清洗时，分别根据数据类型采用不同的数据清洗方法。
[0054]
具体地，对于生产动态因素，其数据清洗的步骤为：
[0055]
①
依据第一预设判别标准筛选得到已投产的油井的生产数据；
[0056]
方法为：按日期顺序读取该油井的日生产时长数据，当日生产时长数据满足第一预设判别标准时，则进入下一步骤，否则弃用该油井生产数据。
[0057]
可选地，第一预设判别标准为：日生产时长大于0小时的天数大于0天。
[0058]
②
对筛选得到的已投产油井生成数据进行缺失数据处理；
[0059]
按日期顺序读取该油井的日生产时长、油嘴尺寸与生产压差数据，若其中某项数据缺失，则去除该日期的生产数据；
[0060]
③
依据第二预设判别标准确定该油井的正式投产日期；
[0061]
按日期顺序读取该油井的日生产时长与含水率数据，若当日的日生产时长与含水率数据满足第二预设判别标准，则将该日作为该油井的正式投产日期，并将该日期之前的生产数据去除；
[0062]
可选地，第二预设判别标准为：连续7天的日生产时长大于0小时且含水率小于5％；
[0063]
④
依据第三预设判别标准去除受作业影响的数据；
[0064]
按日期顺序读取该油井的日生产时长、油嘴尺寸与生产压差数据，并依据第三预设判别标准去除受作业影响的生产数据；
[0065]
可选地，第三预设判别标准为：日生产时长小于24小时的日期所对应的生产动态数据，去除油嘴尺寸变化大于3毫米且生产压差变化大于0.2兆帕的日期所对应的生产数据。
[0066]
⑤
经上述步骤处理后保留的油井及其相应的生产数据，即可作为训练机器学习算法的数据集。
[0067]
对静态地质因素，其数据清洗的步骤为：
[0068]
①
筛选射孔层位的地质因素数据；
[0069]
按储层深度顺序读取该油井的射开层位，并选取其对应的各项地质因素数据；
[0070]
②
单井整体地质数据的计算；
[0071]
对单井的储层厚度与射开厚度，采用各小层数据的累加，其余各项地质因素数据，依据公式(1)按各层的射开厚度对其进行加权平均，计算得单井整体的地质数据；
[0072][0073]
式中，式中，x为单井整体的地质数据；xi为第i层的地质数据；hi为第i层的射开厚度；i为单井的小层编号。
[0074]
③
缺失数据处理；
[0075]
若某油井的流体物性数据缺失，则采用邻井相应数据对该井进行补全，若某油井
的储层物性数据缺失，则在第
②
步的加权平均中不使用该层数据；
[0076]
④
经上述步骤处理后计算得到的油井静态地质因素数据，即可作为训练机器学习算法的数据集。
[0077]
优选地，上述步骤2)中，具体地，对生产动态因素，采用先单井分析，再各井取平均的方式，确定各生产动态因素的重要性排序，包括以下步骤：
[0078]
①
从数据集中选取一口井，以日产油量为机器学习算法的标签，以其余各项生产动态因素为输入的特征，以random forest或xgboost等具有重要性评价能力的机器学习算法作为基模型，以该井数据训练基模型并得到各输入的特征的重要性权重；
[0079]
②
依次对各井数据按步骤
①
计算各特征的重要性权重，并对所有井相应的特征权重取平均值，依据平均权重大小确定各特征的重要性排序；
[0080]
③
依据重要性排序，去除最重要的一个或几个特征，用剩余的特征组成新数据集，并使用基模型进行下一轮训练与特征重要性评价；
[0081]
④
重复
②‑③
步，直至筛选出最不重要的特征，特征依次被剔除的顺序即为其重要性由强到弱的排序；
[0082]
⑤
基于重要性排序即可完成油井产能生产动态主控因素的分析。
[0083]
优选地，上述步骤2)中，对静态地质因素采用多井数据联合分析的方式，确定各静态地质因素的重要性排序，主要步骤为：
[0084]
①
以数据集中所有井的静态地质因素数据为训练集，以日产油量为机器学习算法的标签，以各项静态地质因素为输入特征，以random forest或xgboost等具有重要性评价能力的机器学习算法作为基模型，进行模型训练并得到各特征的重要性权重；
[0085]
②
依据权重大小确定各特征的重要性排序，并去除最重要的一个或几个特征，用剩余的特征组成新数据集，并使用基模型进行下一轮训练与特征重要性评价；
[0086]
③
重复第
②
步，直至筛选出最不重要的特征，特征依次被剔除的顺序即为其重要性由强到弱的排序；
[0087]
④
基于重要性排序即可完成油井产能静态地质主控因素的分析。
[0088]
本实施例以数据驱动的方式，在应用机器学习算法研究油井产能主控因素的过程中，考虑油田开发理论的先验知识，针对生产动态因素与静态地质因素，分别给出其数据清洗方法与主控因素分析方法，形成一套数据驱动的油井产能主控因素分析方法与系统。本发明可实现高效的数据清洗，为机器学习算法在油井产能主控因素研究领域的运用提供合理的数据使用方式，并提升其准确性。
[0089]
实施例2
[0090]
本实施例以p油田的87口油井为例，应用实施例1的方法对油井产能的主控因素进行分析。具体如下：
[0091]
(1)采用结合油田开发理论先验知识的数据清洗方法，对油井生产动态与静态地质数据进行处理，选取w1井作为展示实例。
[0092]
依据实施例1所述的数据清洗方法对日产油量、含水率、气油比、生产压差、井口压力、套压、泵的频率、油嘴尺寸等生产动态数据进行处理，处理结果如图2(a)～图2(h)所示。
[0093]
对渗透率、孔隙度、含油饱和度、泥质含量、储层厚度、射开厚度、原油密度、原油粘度等静态地质数据，依据数据清洗方法的处理结果如表1所示。
[0094]
表1数据清洗前后的静态地质数据对比
[0095][0096]
以random forest算法为基模型，基于87口井的数据集进行多轮训练，每轮训练后剔除权重最高的因素，直至筛选出最不重要的因素，各训练轮次的结果如表2所示。由表可得各因素的剔除顺序，即各因素对油井产能的影响强弱为：生产压差》气油比》含水率》井口压力》泵的频率》油嘴尺寸》套管压力。根据这一重要性排序，可选择排名前1/2的因素作为油井产能的主控因素，即生产压差、气油比、含水率。
[0097]
表2各训练轮次的生产动态因素权重
[0098][0099][0100]
以random forest算法为基模型，基于87口井的数据集进行多轮训练，每轮训练后剔除权重最高的因素，直至筛选出最不重要的因素，各训练轮次的结果如表3所示。由表可得各因素的剔除顺序，即各因素对油井产能的影响强弱为：渗透率》射开厚度》储层厚度》含
油饱和度》孔隙度》泥质含量》原油密度》原油粘度。根据这一重要性排序，结合实际应用需求，可选择排名前1/2的因素作为油井产能的主控因素，即渗透率、射开厚度、储层厚度、含油饱和度。
[0101]
表3各训练轮次的静态地质因素权重
[0102][0103]
实施例3
[0104]
上述实施例1提供了一种油井产能主控因素分析方法，与之相对应地，本实施例提供一种油井产能主控因素分析系统。本实施例提供的识别系统可以实施实施例1的一种油井产能主控因素分析方法，该识别系统可以通过软件、硬件或软硬结合的方式来实现。例如，该系统可以包括集成的或分开的功能模块或功能单元来执行实施例1各方法中的对应步骤。由于本实施例的识别系统基本相似于方法实施例，所以本实施例描述过程比较简单，相关之处可以参见实施例1的部分说明即可，本实施例的系统的实施例仅仅是示意性的。
[0105]
本实施例提供的一种油井产能主控因素分析系统，包括：
[0106]
数据清洗模块，用于分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗；
[0107]
主控因素分析模块，用于分别对经过数据清洗的生产动态因素与静态地质因素做独立分析，并使用机器学习算法开展油井产能主控因素的排序，得到各生产动态因素和静态地质因素的重要性排序。
[0108]
实施例4
[0109]
本实施例提供一种与本实施例1所提供的一种油井产能主控因素分析方法对应的处理设备，处理设备可以是用于客户端的处理设备，例如手机、笔记本电脑、平板电脑、台式机电脑等，以执行实施例1的方法。
[0110]
所述处理设备包括处理器、存储器、通信接口和总线，处理器、存储器和通信接口通过总线连接，以完成相互间的通信。存储器中存储有可在所述处理器上运行的计算机程序，所述处理器运行所述计算机程序时执行本实施例1所提供的一种油井产能主控因素分析方法。
[0111]
在一些实现中，存储器可以是高速随机存取存储器(ram：random access memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。
[0112]
在另一些实现中，处理器可以为中央处理器(cpu)、数字信号处理器(dsp)等各种类型通用处理器，在此不做限定。
[0113]
实施例5
[0114]
本实施例1的一种油井产能主控因素分析方法可被具体实现为一种计算机程序产品，计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本实施例1所述的一种油井产能主控因素分析方法的计算机可读程序指令。
[0115]
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
[0116]
需要说明的是，附图中的流程图和框图显示了根据本技术的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
[0117]
最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。
[0118]
上述各实施例仅用于说明本发明，其中各部件的结构、连接方式和制作工艺等都是可以有所变化的，凡是在本发明技术方案的基础上进行的等同变换和改进，均不应排除在本发明的保护范围之外。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种油井产能主控因素分析方法、系统、设备和存储介质与流程

相关文献

最热文献