一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于随机森林和梯度提升决策树的油田增产措施推荐方法与流程

2021-10-24 07:36:00 来源:中国专利 TAG:增产 油田 措施 方法 推荐

技术特征:
1.一种基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,包括如下步骤:1)收集历史数据,并以增产措施实施时刻为分界分为实施数据集和实施效果数据集;2)对历史上各增产措施下的实施数据集进行数据预处理,包括:数据清洗、计算恢复比例、添加增产措施效果分类标签和训练集、测试集采样;3)分别从训练集和测试集中筛选出重要特征参数;4)构建及训练实施效果分类预测模型;5)向增产措施推荐可增产的生产井。2.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤1)包括:收集历史上实施过增产措施的全部数据,按增产措施内容将数据分割,分割后的每一部分只包含同一种增产措施实施前后的数据,再以增产措施实施时刻为分界,将每一部分数据一分为二,截取增产措施实施点之前的数据作为实施数据集,应用于模型训练和测试;截取增产措施实施点之后的数据作为实施效果数据集,应用于生产井恢复比例的计算。3.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤2)所述的数据清洗中:待清洗数据分四类:1、地层,包括:地层层位、地层压力、泥质含量、钙质含量、油层厚度、渗透率、电阻率、孔隙度和粘度的信息;2、井筒,包括:注水层段和封隔器类型的信息;3、增产措施设计,包括:酸液名称、酸液浓度、酸液每米用量、辅助剂名称和施工压力的信息;4、生产状态,分为:酸化措施有:注入量和注入压力;有机解堵措施有:产液量和井底流压;复合解堵措施有:产液量和井底流压;数据清洗内容包括存在错误值和缺失值的记录,其中,错误值是指原始数据中无法从业务上做出合理解释的值,产生原因是读取、传输或录入过程中出现错误所致;缺失值是指数据的某些记录中存在某些参数丢失的现象,这类数据无法应用于模型,会导致模型报错;数据清洗的措施就是删除找出的错误值和缺失值的记录。4.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤2)所述的计算恢复比例:借助清洗过的实施数据集以及实施效果数据集,计算实施点前、后的米吸水指数,并推算出清洗后的实施数据集中所有记录的恢复比例;其中,针对水井的酸化措施计算恢复比例的计算公式如下:针对水井的酸化措施计算恢复比例的计算公式如下:针对油井的有机解堵措施、复合解堵措施计算恢复比例计算公式如下:
5.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤2)所述的添加增产措施效果分类标签,是按恢复比例值的大小顺序将清洗后的实施数据集划分为差、中、好三类,并给每一条数据贴上差、中、好标签,用来表示实施相应增产措施后的有效等级,即增产措施效果分类标签;具体划分标准如下:恢复比例值在[0,0.3)的,增产措施有效等级为差;恢复比例值在[0.3,0.6)的,增产措施有效等级为中;恢复比例值在[0.6,1]的增产措施有效等级为好。6.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤2)所述的训练集、测试集采样:是采用随机采样的方法,从清洗后的实施数据集中随机抽取70%的数据构成训练集,剩余30%的数据作为测试集,所述的训练集和测试集均包括特征参数和恢复比例,特征参数是地层、井筒、措施设计中的所有参数。7.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤3)包括:将训练集输入随机森林模型,对随机森林模型进行训练,所述的训练集包括特征参数和恢复比例,其中特征参数是指地层、井筒、措施设计中的所有参数,恢复比例用作随机森林模型特征提取的目标参数;随机森林模型输出全部特征参数的重要性值,所述全部特征参数的重要性值域为(0,1],重要性的值越大,所对应的特征参数和目标参数相关性越强,即越重要;按特征参数重要性对特征参数进行排序,选取重要性值排在前五位的特征参数值作为最终筛选出的重要特征参数,参与实施效果分类预测模型训练;对测试集进行重要特征参数筛选:从测试集中选取与训练集中筛选出的五个重要特征参数相同的参数作为测试集的重要特征参数,参与实施效果分类预测模型的效果验证。8.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤4)包括:(4.1)构建实施效果分类预测模型,所述的实施效果分类预测模型是由随机森林模型和梯度提升决策树模型两部分构成,其中,(4.1.1)对随机森林模型设置构建参数:(a1)cart树划分对特征的评价标准为基尼系数;(b1)决策树的最大深度5;(c1)采用袋外误差来评估模型;(4.1.2)对梯度提升决策树模型设置构建参数:(a2)弱学习器的最大迭代次数为100;(b2)损失函数采用对数似然函数;(c2)决策树的最大深度5;(4.2)采用特征提取后的训练集分别对构建的随机森林模型和梯度提升决策树模型进行训练,所述的特征提取后的训练集包括重要特征参数和增产措施效果分类标签,所述的增产措施效果分类标签即是得到的增产措施有效等级,增产措施效果分类标签用作随机森林模型和梯度提升决策树模型实施效果分类的目标参数;(4.3)完成对随机森林模型和梯度提升决策树模型的训练后,再分别向训练好的随机
森林模型和梯度提升决策树模型输入特征提取后的测试集,输出预测增产措施效果分类标签,完成对随机森林模型和梯度提升决策树模型预测效果的验证,保存验证后满足准确率要求的随机森林模型和梯度提升决策树模型训练成果,所述的准确率通过测试集的预测增产措施效果分类标签、增产措施效果分类标签构成的混淆矩阵来计算。9.根据权利要求1所述的基于随机森林和梯度提升决策树的油田增产措施推荐方法,其特征在于,步骤5)包括:(5.1)从待预测集中筛选重要特征参数:从待预测集中选取与训练集中筛选出的五个重要特征参数相同的参数作为待预测集的重要特征参数,参与实施效果分类预测模型的应用;(5.2)将从待预测集中选取的五个重要特征参数分别输入训练好的实施效果分类预测模型中的随机森林模型和梯度提升决策树模型,预测各生产井在当前增产措施下的实施效果;如果实施效果分类预测模型的实施效果均为好,则向该生产井推送这个增产措施,指导生产井增产,否则,不推送。

技术总结
一种基于随机森林和梯度提升决策树的油田增产措施推荐方法,包括:收集历史数据,并以增产措施实施时刻为分界分为实施数据集和实施效果数据集;对历史上各增产措施下的实施数据集进行数据预处理,包括:数据清洗、计算恢复比例、添加增产措施效果分类标签和训练集、测试集采样;分别从训练集和测试集中筛选出重要特征参数;构建及训练实施效果分类预测模型;向增产措施推荐可增产的生产井。本发明实现了有效增产措施下的生产井的推荐,最大程度地确保推荐措施实施成功,从技术上突破了目前难以支持多维度综合分析来实现增产的技术难点,给出可靠、有效的推荐措施来指导海上油田增产,促进了增产智能化,保障了生产井安全、稳定、高效运行。效运行。效运行。


技术研发人员:李云鹏 林杨 李金蔓 安创锋 霍宏博 李权 田永刚 詹燕民 牛永胜 陈维汉 钱黎庆 曹新龙
受保护的技术使用者:中海石油(中国)有限公司天津分公司
技术研发日:2021.07.09
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜