溢流工况预测模型训练方法、装置及溢流工况预测方法与流程

2022-09-03 16:37:42 来源：中国专利 TAG：

1.本文涉及石油勘探领域，尤其是溢流工况预测模型训练方法、装置及溢流工况预测方法。

背景技术：

2.随着油气勘探开发逐渐向深部、复杂地层进军发展，钻井过程中面临的溢流风险越来越大。油溢流是在钻井过程中常见的井下复杂工况事件，如果不能得到及时的发现和控制，将极有可能造成井控险情，甚至发生井喷等严重的事故，带来不必要的生命财产损失。
3.传统的钻井技术通过人为的跟踪综合录井仪获取的特征参数，分析出入口流量差和地面总池体积变化等来分析判断溢流工况的发生。常规监测的方法包括泥浆罐体积监测法、出口流量监测法、进出口流量差法等。但需依赖于钻井人员的经验与意识，易导致误判等情况，且发现溢流时间严重滞后，严重依赖监测人员的经验、责任与意识。目前，已提出的如人工神经网络、贝叶斯网络等方法在进行自动判断参数变化、复杂识别无法在连续长时间工作中有效识别复杂特征，准确早期识别溢流。
4.针对现有技术中发现溢流时间滞后、容易误判的问题，需要一种溢流工况预测模型训练方法、装置及溢流工况预测方法。

技术实现要素：

5.为解决上述现有技术的问题，本文实施例提供了一种溢流工况预测模型训练方法、装置及溢流工况预测方法。
6.本文实施例提供了一种溢流工况预测模型训练方法，包括：根据泵的多个状态将预设时间内的历史钻井数据划分为历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据；确定预设时间窗口大小及窗口滑动步长，将所述预设时间划分为多个时间窗口；分别将多个时间窗口的历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据构建为时间样本矩阵，所述时间样本矩阵具有对应的下一时间段的溢流结果标签；根据不同时间窗口的时间样本矩阵及所述溢流结果标签，分别确定与泵的状态对应的训练样本数据集；利用所述训练样本数据集分别训练神经网络初始模型，输出初始预测结果；根据所述初始预测结果、启停泵特征参数，计算与泵的状态相关的损失函数；利用所述损失函数，训练神经网络模型中的参数，将训练得到的神经网络模型作与泵的状态对应的溢流工况预测模型。
7.根据本文实施例的一个方面，所述泵的多个状态通过如下步骤确定：根据预设时间内的历史钻井数据中的入口流量数据中非零数据的个数、所述非零数据线性回归拟合直线的斜率，确定所述泵的状态为停泵状态、启泵状态、工作状态。
8.根据本文实施例的一个方面，启停泵特征参数的获取包括：根据如下公式确定启泵阶段的启动时间差、增长斜率比：其中，dst为启动
时间差，tq为泵压启动时刻，t
p
为出口流量返出的时刻，uk为增长斜率比，sp为立管压力，q
out
为出口流量，t1为泵压到泵压正常的时间段，t2为到出口流量到出口流量正常的时间段；根据如下公式确定泵工作阶段的幅值比、乘积值；ra＝sp/q
out
，pv＝sp
×qout
，其中，ra为幅值比，pv为乘积值，sp为立压，q
out
为出口流量。本步骤根据泵工作阶段的幅值比、乘积值，确定泵工作状态下是否发生溢流；根据如下公式确定停泵阶段的停止时间差、降低斜率比：det＝t
′
q-t
′
p
，其中，det为停止时间差，dk为降低斜率比，t
′q为到出口流量消失时刻，t
′
p
为到泵压消失时刻，d(sp
′
)为停泵时监测到泵压降低到泵压消失的差值；d(q
′
out
)为停泵时监测到出口流量降低到出口流量消失的差值，t1
′
为泵压降低到泵压消失的时间段，t2
′
为出口流量降低到出口流量消失的时间段。
9.根据本文实施例的一个方面，计算与泵的状态对应的损失函数包括：根据所述停止时间差、降低斜率比，确定所述历史停泵钻井数据是否发生溢流；根据所述启动时间差、增长斜率比，确定所述历史启泵钻井数据中是否发生溢流；根据所述幅值比、乘积值，确定所述历史泵工作钻井数据是否发生溢流；根据所述历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据是否发生溢流与对应的初始预测结果，确定与泵的状态对应的损失函数。
10.根据本文实施例的一个方面，在确定多个时间窗口内的停泵钻井数据、启泵钻井数据及泵工作钻井数据之前还包括：利用方差分析确定所述历史钻井数据的多种特征参数在正常工况的方差和溢流工况下的差异显著性；选择所述差异显著性中的p值小于预设阈值的特征参数，作为与泵的状态对应的历史钻井数据。
11.根据本文实施例的一个方面，所述方法包括根据滑动平均方法确定预设时间窗口。
12.本文实施例还提供了一种溢流工况预测方法，包括：获取实时钻井数据；根据泵的多个状态将所述实时钻井数据划分为实时停泵钻井数据、实时启泵钻井数据、实时泵工作钻井数据；根据所述实时停泵钻井数据、实时启泵钻井数据、实时泵工作钻井数据及所述与泵的状态对应的溢流工况预测模型，预测溢流结果。
13.本文实施例还提供了一种溢流工况预测模型训练装置，所述装置包括：泵状态确定单元，用于根据泵的多个状态将预设时间内的历史钻井数据划分为历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据；时间窗口确定单元，用于确定预设时间窗口大小及窗口滑动步长，将所述预设时间划分为多个时间窗口；时间样本矩阵确定单元，用于分别将多个时间窗口的历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据构建为时间样本矩阵，所述时间样本矩阵具有对应的下一时间段的溢流结果标签；训练样本数据集确定单元，用于根据不同时间窗口的时间样本矩阵及所述溢流结果标签，分别确定与泵的状态对应的训练样本数据集；初始预测结果输出单元，用于利用所述训练样本数据集分别训练神经网络初始模型，输出初始预测结果；损失函数计算单元，用于根据所述初始预测结果、启停泵特征参数，计算与泵的状态相关的损失函数；溢流工况预测模型确定单元，用于利用所述损失函数，训练神经网络模型中的参数，将训练得到的神经网络模型作为与泵的状态对应的溢流工况预测模型。
14.本文实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并
可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述溢流工况预测模型训练方法及溢流工况预测方法。
15.本文实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现所述溢流工况预测模型训练方法及溢流工况预测方法。
16.本方案结合溢流的关键参数变化，融合多参数数据尽早识别溢流征兆，从而实现溢流工况早期预测。
附图说明
17.为了更清楚地说明本文实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本文的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
18.图1所示为本文实施例一种溢流工况预测模型的训练方法流程图；
19.图2所示为本文实施例一种获取启停泵特征参数的方法流程图；
20.图3所示为本文实施例一种计算损失函数的方法流程图；
21.图4所示为本文实施例一种对钻井数据进行方差分析的方法流程图；
22.图5所示为本文实施例一种溢流工况预测的方法流程图；
23.图6所示为本文实施例一种溢流工况预测装置的结构示意图；
24.图7所示为本文实施例溢流工况预测模型训练置的具体结构示意图；
25.图8所示为本文实施例一种根据入口流量数据拟合的直线斜率示意图；
26.图9a和图9b所示为本文实施例一种对部分历史钻井数据进行方差分析的示意图；
27.图10所示为本文实施例一种时间样本矩阵的示意图；
28.图11a、图11b、图11c分别为本文实施例正常情况和发生溢流情况下立管压力、出口流量的示意图；
29.图12所示为本文实施例提供的一种计算机设备的示意图。
30.附图符号说明：
31.601、历史钻井数据划分单元；
32.6011、泵状态确定模块；
33.602、时间窗口确定单元；
34.6021、启停泵特征参数确定模块；
35.603、时间样本矩阵确定单元；
36.604、训练样本数据集确定单元；
37.605、初始预测结果输出单元；
38.606、损失函数计算单元；
39.607、溢流工况预测模型确定单元；
40.1202、计算机设备；
41.1204、处理器；
42.1206、存储器；
43.1208、驱动机构；
44.1210、输入/输出模块；
45.1212、输入设备；
46.1214、输出设备；
47.1216、呈现设备；
48.1218、图形用户接口；
49.1220、网络接口；
50.1222、通信链路；
51.1224、通信总线。
具体实施方式
52.为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本文实施例中的附图，对本文实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本文一部分实施例，而不是全部的实施例。基于本文中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本文保护的范围。
53.需要说明的是，本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
54.本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或装置产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。
55.需要说明的是，本文的溢流工况预测模型训练方法可用于油气勘探领域，也可用于除油气勘探领域之外的其他领域，本文溢流工况预测模型训练方法及装置的应用领域不做限定。
56.如图1所示为本文实施例一种溢流工况预测模型训练方法的流程图，其中具体包括如下步骤：
57.步骤101，根据泵的多个状态将预设时间内的历史钻井数据划分为历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据。在本步骤中，预设时间内的历史钻井数据用于构建模型训练的训练样本数据。其中，通过识别泵的多个状态，将预设时间内的历史钻井数据划分为泵的各个状态下的数据。具体的，泵的工作状态分别为启泵状态、停泵状态和泵工作状态。
58.在本技术中，历史钻井数据由现场综合录井仪获取后，经过一定的数据预处理得到。数据预处理包括：利用方差分析对现场综合录井仪获取的参数数据进行参数选择、对选择后的参数进行数据清洗，清洗因仪表故障等原因产生的异常数据清洗。其中，经过数据预
处理后的历史钻井数据中包括多种与溢流工况相关的参数数据，包括但不限于：入口流量、立压、出口流量、井深、泵冲等16种特征数据。相对应的，在泵的不同状态下，均有发生溢流的可能性，因此通过根据泵的状态，将预设时间内的历史钻井数据进行区分，以便后续分别确定泵的不同状态下模型的训练样本。因此，预设时间内的入口流量、立压、泵冲等16种特征根据泵的状态分别进行划分，分别组成历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据。
59.其中，所述泵的多个状态通过如下步骤确定：根据预设时间内的历史钻井数据中的入口流量数据中非零数据的个数、所述非零数据线性回归拟合直线的斜率，确定所述泵的状态为停泵状态、启泵状态、工作状态。具体的，利用最优时间窗口计算方法计算入口流量数据的时间窗口大小为20。计算每个时间窗口内的入口流量数据中非0数据的个数，根据其中非0数据的个数，判断泵是否处于停泵状态。若时间窗口内入口流量的非0数据的个数超过预设阈值，则确定该时间窗口处于停泵状态；若时间窗口内入口流量的非0数据的个数小于预设阈值，则可以确定该时间窗口处于非停泵状态。
60.进一步的，根据历史钻井数据中的入口流量的非零数据线性回归拟合直线，将拟合得到的直线的斜率进行统计，进一步确定非停泵状态时具体为泵工作状态，还是启泵状态。如图8所示，当拟合得到的直线的斜率为0时，可以确定泵的状态为：工作中；当拟合得到的直线的斜率小于-0.25，可以确定泵的工作状态为：停泵中；当拟合得到的直线的斜率大于0.25，可以确定泵的工作状态为：开泵中。
61.步骤102，确定预设时间窗口大小及窗口滑动步长，将所述预设时间划分为多个时间窗口。
62.本步骤通过确定预设时间窗口大小后，按照窗口滑动步长滑动窗口，则来到下一个时间窗口，进一步可以获取下一个时间窗口的历史钻井数据。例如，预先设定时间窗口大小为10分钟、窗口滑动步长为1分钟。而步骤101中的预设时间段为第0分钟到第20分钟，则可以根据该预设时间段确定11个时间窗口，其中，第一个时间窗口为0-9分钟，则第二个时间窗口为1-10分钟，第三个时间窗口为2-11分钟，以此类推，第11个时间窗口为第11-20分钟。
63.在本说明书的一些实施例中，根据滑动平均法确定合适的窗口大小。根据时间窗口内的历史钻井数据，逐项推移，以此计算每一个时间窗口内的数据的序时平均值，以消除随机波动。具体的，要求利用滑动平均产生的序列与该序列的平均值之间的距离之和尽可能小。本步骤根据如下公式确定时间窗口大小：
[0064][0065]
其中，dist(y)表示滑动平均序列的离心距离，y表示滑动平均产生的序列，yi表示序列中的第i个值，e(y)表示该序列的平均值。在本说明书的一些实施例中，根据滑动平均方法对历史钻井数据中的立压和入口流量进行试验，如图7所示。入楼流量的临界时间片为20，立压的临界时间片为400，为了方便统计设定时间窗口大小为500个时间片，对应时间长度约为10分钟，窗口滑动步长为1个时间片，即，采样频率为50次/分钟。
[0066]
步骤103，分别将不同时间窗口的历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据构建为时间样本矩阵，所述时间样本矩阵具有对应的下一时间窗口的溢流结果标签。本步骤中，根据预设将不同时间窗口内的历史停泵钻井数据确定为一个时间样本
矩阵；将不同时间窗口内的历史启泵钻井数据确定为一个时间样本矩阵；将不同时间窗口内的历史泵工作钻井数据确定为一个时间样本矩阵。每个时间样本矩阵分别与泵的状态对应。其中，每一个时间样本矩阵对应有一个人工标注的标签，该标签为下一时间段是否发生溢流结果的标签。标签为1或0，其中，可以将下一时间段发生溢流对应的标签记为1；将下一时间段不发生溢流对应的标签记为0。
[0067]
步骤104，根据不同时间窗口的时间样本矩阵及所述溢流结果标签，分别确定与泵的状态对应的训练样本数据集。根据步骤103中确定的时间样本矩阵，将其作为与泵的状态对应的训练样本数据集。例如，按照前述规则划将20分钟内的11个时间窗口中的历史钻井数据分别划分为11个时间窗口对应的历史停泵钻井数据、历史启泵钻井数据及历史泵工作钻井数据。分别构成11组训练样本数据集，每一组训练样本数据集均包括一个历史停泵时间样本矩阵、历史启泵时间样本矩阵、历史泵工作时间样本矩阵。
[0068]
步骤105，利用所述训练样本数据集分别训练神经网络初始模型，输出初始预测结果。在本步骤中，利用不同类型的训练样本数据集分别训练cnn-lstm融合网络。其中，cnn-lstm融合网络由神经网络预训练模型和svm参数分类模型两部分组成。其中，神经网络预训练模型由卷积层、池化层、lstm层、全连接层等依次连接构成。cnn-lstm的输入为时间矩阵，输出为sigmoid函数分类结果。在本步骤中，使用svm分类器进一步优化分类结果，可以提高模型训练的精度。
[0069]
在本说明书的一些实施例中，若时间窗口长度为l，筛选的特征参数数量为k，即网络的输入维度为(l,k)。同时假设每层输入维度均为(x,y)。其中，cnn-lstm融合网络的第一层为卷积层，卷积核大小为11，数量为64个，激活函数为relu函数，得到的输出向量为(x-10,64)。cnn-lstm融合网络的第二层为池化层，池化核为2，得到的输出向量为(x/2,y)。cnn-lstm融合网络的第三层为卷积层，卷积核大小为7，数量为128个，激活函数为relu函数，得到的输出向量为(x-6,128)。cnn-lstm融合网络的第四层为池化层，池化核为2，得到的输出向量为(x/2,y)。cnn-lstm融合网络的第五层为卷积层，卷积核大小为5，数量为128个，激活函数为relu函数，得到的输出向量为(x-4,128)。cnn-lstm融合网络的第六层为卷积层，卷积核大小为5，数量为128个，激活函数为relu函数，得到的输出向量为(x-4,128)。cnn-lstm融合网络的第七层为池化层，池化核为2，得到的输出向量为(x/2,y)。cnn-lstm融合网络的第八层为lstm层，神经元数量为50，得到的输出向量为(x,50)。cnn-lstm融合网络的第九层为flatten展开层，得到的输出向量为(x
×
y,1)。cnn-lstm融合网络的第十层为全连接层，神经元数量为500，激活函数为relu函数，得到的输出向量为(500,1)。第cnn-lstm融合网络的十一层为全连接层，神经元数量为200，激活函数为relu函数，得到的输出向量为(200,1)。cnn-lstm融合网络的第十二层为全连接层，神经元数量为2，激活函数为sigmoid函数，得到的输出向量为(2,1)。
[0070]
步骤106，根据所述初始预测结果、启停泵特征参数，计算泵的状态相关的损失函数。本步骤中确定模型训练的损失函数为交叉熵函数，损失函数的公式如下表示：
[0071][0072]
其中，loss为损失函数的损失值，y为样本真实值，为样本预测值。其中，样本真实值根据泵的不同阶段的启停泵特征参数确定。交叉熵损失函数表示模型的训练集的真实
概率分布和预测概率分布之间的差异。更具体地，损失值是一个或多个特征向量的概率分布与扰动训练集的概率分布之间的kl散度和关于扰动训练集的概率分布的交叉熵的和或加权和。
[0073]
步骤107，利用所述损失函数，训练所述神经网络初始模型中的参数，将训练得到的神经网络模型作为与泵的状态对应的溢流工况预测模型。本步骤根据样本真实值与样本预测值构成的损失函数，在模型在训练过程中不断优化模型的权重(即，模型每层的两个节点连接的权重)。在一些实施例中，可以通过对训练的模型进行超参数优化。具体的，所述超参数可以包括学习率、迭代次数、批次大小等参数。其中，学习率指在优化算法中更新网络权重的幅度大小，迭代次数指整个训练集样本输入神经网络进行训练的次数，批次大小是每一次训练神经网络送入模型的样本的数量。当训练的分类模型的损失函数最小化或小于一定范围的时候，模型训练结束。
[0074]
本步骤中根据损失函数优化得到的溢流工况预测模型包括3个模型，分别为：启泵状态的溢流工况预测模型、泵工作状态的溢流工况预测模型及停泵状态的溢流工况预测模型。
[0075]
图2所示为本文实施例一种获取启停泵特征参数的方法流程图。在申请中，可以根据模型预测结果及现场实时监控启停泵特征参数，确定模型训练结果是否准确。获取启停泵特征参数具体包括如下步骤：
[0076]
步骤201，根据如下公式确定启泵阶段的启动时间差、增长斜率比：
[0077]
其中，dst为启动时间差，tq为泵压启动时刻，t
p
为出口流量返出的时刻，uk为增长斜率比，sp为立管压力，q
out
为出口流量，t1为泵压到泵压正常的时间段，t2为到出口流量到出口流量正常的时间段。在本说明书的一些实施例中，通常情况下，启泵阶段不发生溢流。溢流状况通常在泵正常工作运行、停泵过程中及停泵状态下发生。
[0078]
步骤202，根据如下公式确定泵工作阶段的幅值比、乘积值；
[0079]
ra＝sp/q
out
，pv＝sp
×qout
，其中，ra为幅值比，pv为乘积值，sp为立压，q
out
为出口流量。本步骤根据泵工作阶段的幅值比、乘积值，确定泵工作状态下是否发生溢流。
[0080]
通常，在正常钻进或循环时发生溢流时，出口流量q
out
会上涨。如果发生气侵，出口流量q
out
会大幅波动，同时出口流量q
out
均值上涨；而立管压力sp根据溢流量大小和油气水侵的类型，可能保持不变、稍微上涨或稍微降低，立管压力的变化幅度一般不大。因此在泵工作阶段发生溢流时，立管压力与出口流量形成的幅值比ra降低，且侵入量越大，降低幅度越大；乘积值pv增大，且随侵入量越大，增大幅度越大。因此，在同一井深范围内，根据由出口流量及立压确定的幅值比、乘积值的大小的变化情况，可以确定泵工作状态下，是否发生溢流。
[0081]
步骤203，根据如下公式确定停泵阶段的停止时间差、降低斜率比：其中，det为停止时间差，dk为降低斜率比，t
′q为到出口流量消失时刻，t
′
p
为到泵压消失时刻，d(sp
′
)为停泵时监测到泵压降低到泵压消失的差值；d(q
′
out
)为停泵时监测到出口流量降低到出口流量消失的差值，t1
′
为泵压降低到泵压消失的时间段，t2
′
为出口流量降低到出口流量消失的时间段。本步骤根据判断停泵阶段的
停止时间差、降低斜率比，确定停泵阶段是否发生溢流。
[0082]
通常，如果在停泵过程中发生溢流，立压sp一般会降低，而出口流量q
out
保持不降或不断流，严重情况下出口流量q
out
甚至会升高。因此，停止时间差det增大，甚至会无穷大；因为立压sp按正常规律降低，且降低的趋势较小或变化很小，而出口流量q
out
不降或降低幅度减小，导致出口流量降低的速度减小，从而导致dk增大。降低斜率比dk增大。
[0083]
其中，在同一井深范围、相同的钻井液性能及其他钻井参数相同的情况下，可以通过确定启停泵特征参数的具体数值大小，确定启泵阶段、泵正常运行阶段、停泵阶段是否发生溢流。并进一步根据溢流判断结果与利用cnn-lstm融合网络预测得到的结果进行比较，进一步调整cnn-lstm融合网络的参数，提高溢流工况预测模型的预测精度。
[0084]
图3所示为本文实施例一种计算损失函数的方法流程图，具体包括如下步骤：
[0085]
步骤301，根据所述停止时间差、降低斜率比，确定所述历史停泵钻井数据是否发生溢流。根据图2描述，在同一井深范围内，根据降低斜率比和停止时间差的变化情况，可以确定停泵状态下，是否发生溢流。具体的，在同一井深范围内、同一时间窗口内，降低斜率比、停止时间差均增大，则确定停泵状态下该时间窗口内发生溢流。
[0086]
步骤302，根据所述启动时间差、增长斜率比，确定所述历史启泵钻井数据中是否发生溢流。根据图2描述，在同一井深范围内，根据降低斜率比和停止时间差的变化情况，可以确定停泵状态下，是否发生溢流。具体的，在同一井深范围内、同一时间窗口内，降低斜率比、停止时间差均增大，则确定停泵状态下该时间窗口内发生溢流。
[0087]
步骤303，根据所述幅值比、乘积值，确定所述历史泵工作钻井数据是否发生溢流。根据图2描述，在同一井深范围内，根据幅值比、乘积值的变化情况，可以确定泵工作状态下是否发生溢流。具体的，在同一井深范围内、同一时间窗口内，幅值比降低、乘积值增大，则确定泵工作状态下该时间窗口内发生溢流。
[0088]
步骤304，根据所述历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据是否发生溢流与对应的初始预测结果，计算与泵的状态对应的损失函数。具体的，根据启停泵特征参数确定的各个状态对应的是否发生溢流的结果，与神经网络初始模型输出的预测结果，计算损失函数。关于损失函数的具体计算公式已在前文描述，详见图1中的具体描述。
[0089]
图4所示为本文实施例一种对钻井数据进行方差分析的方法流程图，具体包括如下步骤：
[0090]
步骤401，利用方差分析确定所述历史钻井数据的多种特征参数在正常工况的方差和溢流工况下的差异显著性。在本技术中，获取的历史钻井数据中包含了大量的钻井参数，其中部分参数与溢流工况不相关，且部分相似的参数会造成信息感染。因此需要对历史钻井数据中的多种参数进行参数选择。具体的，对历史钻井数据中的所有参数进行方差分析，对比各个参数分别在正常情况和发生溢流时的区别。
[0091]
步骤402，选择所述差异显著性中的p值小于预设阈值的特征参数，作为与泵的状态对应的历史钻井数据。如图9a、图9b所示，将在正常情况和溢流情况下的方差的差值较大的参数，确定为本技术的特征参数。将方差分析计算得到的p值小于预设阈值的特征参数，作为历史钻井数据。其中，预设阈值可以是0.005，p值小于预设阈值表示该参数在溢流和正常情况下具有较为明显的差异。将方法分析得到的p值小于0.005的参数确定为特征参数。如表1所示，将井深、钻头深度、泵冲、立压、入口流量、大钩负荷、转速等16种参数作为历史
钻井数据。
[0092]
表1方差分析后确定的特征参数
[0093][0094]
图5所示为本文实施例一种溢流工况预测的方法流程图，该方法利用前述步骤训练完成的溢流工况预测模型预测溢流结果，具体包括如下步骤：
[0095]
步骤501，获取实时钻井数据。本步骤中，使用钻井现场综合仪获取实时钻井数据。其中，实时钻井数据经过一定的数据预处理得到，包括：对参数进行数据清洗等。根据步骤101中利用方差分析确定的与溢流工况相关的多种参数数据，从实时获取的数据中选择16种特征参数数据作为实时钻井数据。
[0096]
步骤502，根据泵的多个状态将所述实时钻井数据划分为实时停泵钻井数据、实时启泵钻井数据、实时泵工作钻井数据。在本步骤中，将实时钻井数据中与停泵状态、泵工作状态、启泵状态对应的数据进行划分。
[0097]
步骤503，根据所述实时停泵钻井数据、实时启泵钻井数据、实时泵工作钻井数据及所述与泵的状态对应的溢流工况预测模型，预测溢流结果。根据步骤106中确定的启泵状态的溢流工况预测模型、泵工作状态的溢流工况预测模型及停泵状态的溢流工况预测模型，分别将于泵的状态对应的钻井数据输入至响应的溢流工况预测模型中，以得到溢流工况预测结果。
[0098]
图6所示为本文实施例一种溢流工况预测装置的结构示意图，在本图中描述了溢流工况预测装置的基本结构，其中的功能单元、模块可以采用软件方式实现，也可以采用通用芯片或者特定芯片实现，实现溢流工况预测，该装置具体包括：
[0099]
历史钻井数据划分单元601，用于根据泵的多个状态将预设时间内的历史钻井数据划分为历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据；
[0100]
时间窗口确定单元602，用于确定预设时间窗口大小及窗口滑动步长，将所述预设时间划分为多个时间窗口；
[0101]
时间样本矩阵确定单元603，用于分别将多个时间窗口的历史停泵钻井数据、历史启泵钻井数据、历史泵工作钻井数据构建为时间样本矩阵，所述时间样本矩阵具有对应的
下一时间段的溢流结果标签；
[0102]
训练样本数据集确定单元604，用于根据不同时间窗口的时间样本矩阵及所述溢流结果标签，分别确定与泵的状态对应的训练样本数据集；
[0103]
初始预测结果输出单元605，用于利用所述训练样本数据集分别训练神经网络初始模型，输出初始预测结果；
[0104]
损失函数计算单元606，用于根据所述初始预测结果、启停泵特征参数，计算与泵的状态相关的损失函数；
[0105]
溢流工况预测模型确定单元607，用于利用所述损失函数，训练神经网络模型中的参数，将训练得到的神经网络模型作为与泵的状态对应的溢流工况预测模型。
[0106]
本方案可以结合溢流的关键参数变化，融合多参数数据尽早识别溢流征兆，从而实现溢流工况早期预测。
[0107]
作为本文的一个实施例，还可以参考如图7所示为本实施例溢流工况预测模型训练置的具体结构示意图。作为本文的一个实施例，所述历史钻井数据划分单元601进一步包括：泵状态确定模块6011，用于根据预设时间内的历史钻井数据中的入口流量数据中非零数据的个数、所述非零数据线性回归拟合直线的斜率，确定所述泵的状态；
[0108]
作为本文的一个实施例，所述时间窗口确定单元602进一步包括：启停泵特征参数确定模块6021，用于根据公式确定泵的不同阶段的启停泵特征参数。
[0109]
图8所示为本文实施例一种不同时间窗口内的由入口流量数据拟合得到的直线斜率示意图。例如，时间窗口2000附近由入口流量数据拟合得到的直线斜率为0.62左右；时间窗口60000附近由入口流量数据拟合得到的直线斜率为0.55左右；时间内窗口为88000左右由入口流量数据拟合得到的直线斜率为0.68左右；时间窗口为21000到40000左右由入口流量数据拟合得到的直线斜率为0。根据时间窗口内的入口流量数据拟合得到的直线斜率的大小，可以确定当前时间窗口对应的泵的状态为：启泵、停泵或泵处于工作状态。
[0110]
图9a和图9b所示为本文实施例一种对部分历史钻井数据在正常情况和溢流工情况下的方差分析的示意图。图9a显示了入口流量在正常情况和溢流情况下的方差分析情况，其中正常情况和溢流情况下的方差差异较大。图9b显示了立压在正常情况和溢流情况下的方差分析情况，其中正常情况和溢流情况下的方差的差异较大。
[0111]
图10所示为本文实施例一种时间样本矩阵的示意图。图10中的一个虚线框表示一个时间样本矩阵，图中示出了2个时间样本矩阵。图中的每一个时间样本矩阵可以对应10分钟的时间长度。每一个时间样本矩阵对应一个y，y为时间样本矩阵滑动产生的序列，y为每个时间样本矩阵对应的下一时间段是否发生溢流的结果标签。
[0112]
图11a、图11b、图11c分别为本文实施例正常情况和发生溢流情况下立管压力、出口流量的示意图。图11a中示出了在无溢流的正常情况下立管压力和出口流量对应的启泵、泵工作时及停泵状态下的变化；图11b中示出了立管压力和出口流量在启泵、停泵阶段均为正常工作过程；在泵工作时均发生溢流；图11c中示出了立管压力在启泵、泵工作时及停泵状态下的正常工作过程；出口流量在启泵、泵工作时为正常工作过程，在停泵阶段发生溢流。
[0113]
图12所示为本文实施例提供的一种计算机设备，所述计算机设备1202可以包括一个或多个处理器1204，诸如一个或多个中央处理单元(cpu)，每个处理单元可以实现一个或
多个硬件线程。计算机设备1202还可以包括任何存储器1206，其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的，比如，存储器806可以包括以下任一项或多种组合：任何类型的ram，任何类型的rom，闪存设备，硬盘，光盘等。更一般地，任何存储器都可以使用任何技术来存储信息。进一步地，任何存储器可以提供信息的易失性或非易失性保留。进一步地，任何存储器可以表示计算机设备1202的固定或可移除部件。在一种情况下，当处理器1204执行被存储在任何存储器或存储器的组合中的相关联的指令时，计算机设备1202可以执行相关联指令的任一操作。计算机设备1202还包括用于与任何存储器交互的一个或多个驱动机构1208，诸如硬盘驱动机构、光盘驱动机构等。
[0114]
计算机设备1202还可以包括输入/输出模块1210(i/o)，其用于接收各种输入(经由输入设备1212)和用于提供各种输出(经由输出设备1214)。一个具体输出机构可以包括呈现设备1216和相关联的图形用户接口(gui)1218。在其他实施例中，还可以不包括输入/输出模块1210(i/o)、输入设备1212以及输出设备1214，仅作为网络中的一台计算机设备。计算机设备1202还可以包括一个或多个网络接口1220，其用于经由一个或多个通信链路1222与其他设备交换数据。一个或多个通信总线1224将上文所描述的部件耦合在一起。
[0115]
通信链路1222可以以任何方式实现，例如，通过局域网、广域网(例如，因特网)、点对点连接等、或其任何组合。通信链路1222可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
[0116]
对应于图1至图5中的方法，本文实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法的步骤。
[0117]
本文实施例还提供一种计算机可读指令，其中当处理器执行所述指令时，其中的程序使得处理器执行如图1至图5所示的方法。
[0118]
应理解，在本文的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本文实施例的实施过程构成任何限定。
[0119]
还应理解，在本文实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
[0120]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本文的范围。
[0121]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0122]
在本文所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可
以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。
[0123]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
[0124]
另外，在本文各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0125]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本文的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0126]
本文中应用了具体实施例对本文的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本文的方法及其核心思想；同时，对于本领域的一般技术人员，依据本文的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本文的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：回复生成方法、电子设备及计算机存储介质与流程

溢流工况预测模型训练方法、装置及溢流工况预测方法与流程

相关文献

最热文献