一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于增量高斯混合回归的原油含水率自适应软测量方法与流程

2022-03-26 15:46:25 来源:中国专利 TAG:


1.本发明涉及采油过程原油含水率的预测和控制技术领域,尤其是涉及一种基于增量高斯混合回归的原油含水率自适应软测量方法。


背景技术:

2.原油含水率是原油开采、生产过程中的重要计量参数之一,也是评价油井以及油田开采能力的重要指标。随着石油工业的快速发展以及逐年激增的石油开采量,近年来我国油田的开发也相继进入到高含水甚至特高含水率阶段,产出液中水的含量较大,含水率偏高。为了能够及时了解和掌握采油过程的生产状况以便有针对性的对地下储层进行压裂或注水,指导后续生产计划执行,确保油井始终处于最佳生产状态,并最终达到提高油井开发效率和提高原油采收效率的目的,原油含水率的测量变得极为紧迫。在实际的采油工业生产过程中,原油含水率无法实现在线检测,以现在的技术条件难以实时准确的测量。为了解决这个难题,通过采集过程中比较容易检测的变量,根据某种最优准侧,构造出一种以这些变量为输入,原油含水率为输出的数学模型,实现对原油含水率的在线估计,这便是采油工业过程中常用的软测量技术。
3.软测量建模方法的发展对于大规模的工业数据的需求极为显著,其中高斯混合回归模型可以很好的解决工业过程中存在的非线性和非高斯性,被广泛应用于工业过程中的质量变量预测。然而在软测量建模过程中还存在一些问题,比如在采油过程中,由于过程环境状态的改变、平台仪器和设备的老化以及催化剂活性退化等各种因素,运行工况经常发生变化,过程物理化学特性处在不断的变化之中,容易导致离线软测量模型精度不断下降。建模数据表示的是采油过程的过去状态和工况信息,在历史样本上训练的软测量模型无法匹配已经发生了状态变化的当前采油过程,所以不能精确地预测输出变量值(原油含水率)。为了正确跟踪采油过程状态,需要对模型进行及时自适应更新和校正。针对采油过程的时变特性,因此有专家提出了递推方法、滑动窗口方法和即时学习方法等有效策略,但也存在着一定的局限。


技术实现要素:

4.本发明的目的是提供一种基于增量高斯混合回归的原油含水率自适应软测量方法,将增量的思想引入增量高斯混合回归模型,帮助模型适应在线采油过程中的新数据,实现了采油过程中对原油含水率的自适应软测量;以解决常用模型自适应更新方法的不足。
5.为实现上述目的,本发明提供了一种基于增量高斯混合回归的原油含水率自适应软测量方法,其特征在于,包括以下步骤:
6.s1、收集历史采油过程数据作为训练数据集p(x,y)∈rn×m,x为输入辅助变量,y为原油含水率,n为样本个数,m为变量个数,r为实数集;
7.s2、将步骤s1收集到的采油过程训练数据集p标准化:转化为均值为0,方差为1的数据集
8.s3、利用标准化后的采油过程新数据集离线建立高斯混合回归模型,预测原油含水率;
9.s4、将采集到的实时采油过程数据标准化处理后,利用步骤s3对新数据进行质量预测并且输出原油含水率的预测值实验室抽检获得原油含水率的真实输出y
new
后,将样本数据收集到新数据集z中;当z的数据量大于预设值m时,通过步骤s3训练一个新的高斯混合回归模型以拟合数据集z,同时只需要将模型参数和训练数据个数存入历史数据库;
10.s5、为了根据采油过程新数据中所含信息来更新历史模型,首先计算历史高斯混合回归模型和新建高斯混合模型组分之间的skld值,判断skld值是否超过阈值η,若超过该阈值时则不能融合组份,小于该阈值时则可以融合;
11.s6、随着采油过程新数据流入,不断重复步骤s4和步骤s5,实现采油过程中对原油含水率的自适应质量预测。
12.优选的,所述步骤s3中,计算贝叶斯信息准则bic值,确定模型最佳高斯组分数目k,给予一组初始参数用期望极大值em算法对模型的参数进行学习;
13.em算法迭代更新参数值的公式为:
[0014][0015][0016][0017]
其中和分别表示第q次迭代时候样本属于第k个高斯组分的均值、协方差、先验概率;p
(q)
(ck|wi)为第i个训练样本属于第k个高斯组分的后验概率;直到极大似然目标函数收敛,完成对高斯混合回归模型参数的估计;模型各个组分的均值向量和协方差矩阵表示为:
[0018][0019]
每个模型组分中,在给定辅助变量x后原油含水率y的条件概率分布计算如下:
[0020][0021]
其中均值向量协方差矩阵原油含水率y的条件概率分布为:
[0022][0023]
其中表示为训练样本x属于第k个高斯
组分的后验概率,采集新来数据的辅助变量x后,通过软测量模型预测原油含水率为:
[0024][0025]
将建模数据数目n和局部模型参数存入历史数据库中,无需保存历史数据。
[0026]
优选的,所述步骤s5中,skld值计算公式如下:
[0027][0028][0029]
其中φ1和φ2分别代表原始和新建两个高斯混合模型的组分,μ和∑分别代表高斯混合模型组分的均值向量和协方差矩阵,d表示变量的维度;
[0030]
当skld值小于阈值η的时,判断原始模型组分j和新建模型组分k在统计学上是等价的,融合为一个新的组分;
[0031]
新组分的参数更新公式如下:
[0032][0033][0034][0035]
当skld值大于阈值η时,判断原始模型组分j和新建模型组分k在统计学上不等价,则保持各自的均值向量μ和协方差矩阵∑不变,更新各自组份的权重
[0036]
权重的更新公式如下:
[0037]
当前组分属于新建模型时:
[0038]
当前组分属于原始模型时:
[0039]
本发明针对采油过程中的强时变特性,将增量的思想引入高斯混合回归模型,提出基于增量高斯混合回归模型的原油含水率自适应软测量方法,以适应采油工业在线环境中的新数据。将传统的高斯混合回归模型扩展成自适应软测量模型,相较于其它的传统自适应软测量模型,本发明的优势主要体现在缓解了软测量的过拟合,降低了预测误差,并提高了模型的更新效率。
[0040]
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
[0041]
图1是本发明基于增量高斯混合回归的原油含水率自适应软测量方法步骤图;
[0042]
图2是本发明基于增量高斯混合回归的原油含水率自适应软测量方法建模的原理图;
[0043]
图3是本发明基于增量高斯混合回归的原油含水率自适应软测量方法采油工业的过程结构图;
[0044]
图4是本发明基于增量高斯混合回归的原油含水率自适应软测量方法的预测输出结果图;
[0045]
图5是滑动窗高斯混合回归模型的预测输出结果图;
[0046]
图6即时学习高斯混合回归模型的预测输出结果图。
具体实施方式
[0047]
以下通过附图和实施例对本发明的技术方案作进一步说明。
[0048]
一种基于增量高斯混合回归的原油含水率自适应软测量方法,包括以下步骤:
[0049]
s1、收集历史采油过程数据作为训练数据集p(x,y)∈rn×m,x为输入辅助变量,y为原油含水率,n为样本个数,m为变量个数,r为实数集。
[0050]
s2、将步骤s1收集到的采油过程训练数据集p标准化:转化为均值为0,方差为1的数据集
[0051]
s3、利用标准化后的采油过程新数据集离线建立高斯混合回归模型。
[0052]
首先计算贝叶斯信息准则bic值,确定模型最佳高斯组分数目k,给予一组初始参数用期望极大值em算法对模型的参数进行学习;
[0053]
em算法迭代更新参数值的公式为:
[0054][0055][0056][0057]
其中和分别表示第q次迭代时候样本属于第k个高斯组分的均值、协方差、先验概率;p
(q)
(ck|wi)为第i个训练样本属于第k个高斯组分的后验概率;直到极大似然目标函数收敛,完成对高斯混合回归模型参数的估计。模型各个组分的均值向量和协方差矩阵表示为:
[0058][0059]
每个模型组分中,在给定辅助变量x后原油含水率y的条件概率分布计算如下:
[0060][0061]
其中均值向量协方差矩阵
原油含水率y的条件概率分布为:
[0062][0063]
其中表示为训练样本x属于第k个高斯组分的后验概率。采集新来数据的辅助变量x后,通过软测量模型预测原油含水率为:
[0064][0065]
将建模数据数目n和局部模型参数存入历史数据库中,无需保存历史数据。
[0066]
s4、将采集到的实时采油过程数据标准化处理后,利用步骤s3对新数据进行质量预测并且输出原油含水率的预测值实验室抽检获得原油含水率的真实输出y
new
后,将样本数据收集到新数据集z中;再使用均方根误差rmse对软测量模型性能进行定量评价,
[0067][0068]
其中i=1,2,...,n,n代表测试数据集的总长度,yi和分别表示原油含水率变量的真实值和预测值;
[0069]
当z的数据量大于预设值m时,通过步骤s3训练一个新的高斯混合回归模型以拟合数据集z,同时只需要将模型参数和训练数据个数存入历史数据库。
[0070]
s5、为了根据采油过程新数据中所含信息来更新历史模型,首先计算历史高斯混合回归模型和新建高斯混合模型组分之间的skld(symmetric kullback-leibler divergence)值,判断skld值是否超过阈值η,若超过该阈值时则不能融合组份,小于该阈值时则可以融合。
[0071]
skld值计算公式如下:
[0072][0073][0074]
其中φ1和φ2分别代表原始和新建两个高斯混合模型的组分,μ和∑分别代表高斯混合模型组分的均值向量和协方差矩阵,d表示变量的维度;
[0075]
当skld值小于阈值η的时,判断原始模型组分j和新建模型组分k在统计学上是等价的,可以融合为一个新的组分。
[0076]
新组分的参数更新公式如下:
[0077][0078]
[0079][0080]
当skld值大于阈值η时,判断原始模型组分j和新建模型组分k在统计学上不等价,则保持各自的均值向量μ和协方差矩阵∑不变,更新各自组份的权重
[0081]
权重的更新公式如下:
[0082]
当前组分属于新建模型时:
[0083]
当前组分属于原始模型时:
[0084]
s6、随着采油过程新数据流入,不断重复步骤s4和步骤s5,实现采油过程中对原油含水率的自适应质量预测。
[0085]
用历史高斯混合回归模型对新来数据的原油含水率进行预测,同时收集有标签的新数据,当新数据达到设定值时以增量的方式更新历史模型,实现采油工业过程的自适应质量预报。增量的思想可以解释为一种基于概率密度的数据流聚类方法,是指一个学习系统能不断地从新样本中学习新的知识,并且能保存以前学习到的知识。本发明方法的优势在于更新过程丢弃历史数据,只需要保存历史数据个数和模型参数即可,从而极大减少了数据库储存空间的占用;同时利用历史数据建立的模型参数进行更新,显著地减少了后续训练的时间。
[0086]
实施例
[0087]
以下结合实际的采油过程例子来说明增量高斯混合回归模型的性能。
[0088]
在实际的采油过程中,使用离线人工测量方法有准确度及精度高的优势,但是由于其采样间隔时间长,单次采样量小,导致采集的样本不具有代表性、随机性较大,且离线人工法还需花费大量人力物力,同时不能满足油田数字化、自动化发展的趋势要求;使用在线测量方法也存在成本昂贵不利于大面积推广,以及使用和维修困难等问题。为了提高采油过程的控制质量以及降低测量成本,需要对采油过程中原油含水率来进行建立一个自适应软测量模型。表1给出了针对关键质量变量原油含水率以及所选择的10个辅助变量。
[0089]
表1样本变量说明
[0090]
标签名称u1油井套压u2敏感探头输出电压值u3注入井注入量u4注入井注入压力u5油井井口压力u6油井井口温度u7油井井口瞬时流量u8水矿化度值u9采油机冲程u10采油机冲次y原油含水率
[0091]
针对该采油过程,连续等时间间隔采集了7000个过程数据,以时间为序列取前1000个数据作为初始训练样本进行建模,再以不同的更新步长去进行预测新样本的原油含水率值和更新模型,以达到最佳的预测效果。为了验证本发明的原油含水率自适应软测量方法,对比了常用的软测量更新方法:滑动窗和即时学习。本发明方法、滑动窗高斯混合回归模型和即时学习高斯混合回归模型三种方法分别在最佳效果下的预测精度和运行时间如表2所示,三种方法的运行结果分别如图4、图5、图6所示。
[0092]
表2三种自适应更新方法的预测结果和计算时间
[0093][0094]
对比图4和图5可以看出增量高斯混合回归模型的预测效果要明显优于滑动窗高斯混合回归模型,原因是滑动窗高斯混合回归模型每次只使用最近时间的一段数据建模,而丢弃掉过去的数据信息,导致对突变过程的预测效果差。对比图4和图6对比可以发现,即时学习高斯混合回归模型在预测初期效果较差,原因是预测初期历史样本数较少,难以挑选出合适的数据集进行建模。随着历史样本数量增多,二者方法都达到较好的效果,原因是二者方法都比较完备的保存了历史数据的信息。综合来看,本发明的增量高斯混合回归模型的预测精度要更高。
[0095]
表2给出了三种自适应更新方法的预测效果和计算时间的比较。从预测精度方面来分析,本发明的方法在预测精度上有相对更好的表现,相比于滑动窗高斯混合回归模型rmse降低了0.77787,相比于即时学习高斯混合回归模型rmse降低了0.11601。从更新时间方面来分析,由于本发明方法的更新过程只需要历史模型参数、历史数据个数以及新训练的模型参数和样本数量,不需要用大量的历史数据重新训练模型,从而较大的提高了更新效率。
[0096]
因此,本发明采用上述基于增量高斯混合回归的原油含水率自适应软测量方法,将增量的思想引入增量高斯混合回归模型,帮助模型适应在线采油过程中的新数据,实现了采油过程中对原油含水率的自适应软测量;能够解决常用模型自适应更新方法的不足。
[0097]
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献