一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于集成学习算法的油井管特殊扣拧接质量判定方法

2022-07-13 16:21:23 来源:中国专利 TAG:


1.本发明属于数据处理技术领域,涉及油井管特殊扣产品质量智能判定方法,尤其涉及一种基于集成学习算法的油井管特殊扣拧接质量智能判定方法。


背景技术:

2.近几年内,国内天然气产量增幅预计将稳定保持在8%以上,且85%天然气开采流程中需采用特殊扣油套管,尤其在酸性气田开采过程中特殊扣油套管使用率达到100%。
3.特殊扣油套管在油气采收过程中,管道内部承受气体高压的工况下,管道中一个接头泄漏轻则造成几千米管柱整体带压,重则造成有害气体泄漏甚至井喷。采用特殊扣油套管的仅有部分油田入井前进行螺纹连接密封检测,其余油田直接下井使用。
4.而现有工厂生产环节中每支油井管特殊扣产品拧质量仅靠人工依据过程参数进行判断,需要花费大量的人力和时间,效率较低。并且,不同的人对于关键数值的判定方式是相对主观的,判定会出现不一致的情况,从而影响判定的准确性,质量风险巨大。


技术实现要素:

5.为解决上述问题,提供一种避免油井管特殊扣不合格产品外流、且极大减少油气采收过程安全隐患的基于集成学习算法的拧接质量智能判定方法,本发明采用了如下技术方案:
6.本发明提供了一种基于集成学习算法的油井管特殊扣拧接质量判定方法,用于对油井管特殊扣产品的拧接质量是否合格进行判定,其特征在于,包括以下步骤:步骤s1,采集油井管特殊扣生产过程中的参数,预处理后作为原始数据集,并采用分层抽样将原始数据集分为训练集和测试集;步骤s2,基于采集的参数选取四类参数作为已知特征,根据已知特征创建一维附加特征并入至已知特征从而生成初始特征;步骤s3,采用集成筛选算法从初始特征中筛选得到关键特征;步骤s4,基于集成学习算法构建初始二分类模型,初始二分类模型还具有硬投票模块;步骤s5,利用训练集和关键特征对初始二分类模型进行调优训练,得到投票集成分类模型;步骤s6,利用投票集成分类模型对待测油井管特殊扣进行质量判定,并输出最终判定结果,最终判定结果为合格或不合格。
7.在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,参数为数据库中的管拧机各传感器的拧接过程参数,预处理为:将不合格类样本所对应的参数打标签为0,将合格类样本所对应的参数打标签为1。
8.在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,四类参数分别为当前点扭矩参数、拧紧扭矩参数、当前点圈数以及拧紧圈数,一维附加特征为拧紧扭矩参数与当前点扭矩参数之差比拧紧圈数与当前点圈数之差。
9.在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,筛选为:使用集成筛选方法集成对大量冗余初始特征按照重要
性进行排序,从而筛选出对分类效果影响最显著且该类特征累计贡献度为剩余特征总贡献度的前a%作为关键特征。
10.在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,集成筛选算法包括方差过滤法、相关系数过滤法以及随机森林平均不纯度减少法。
11.在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,步骤s3包括以下子步骤:步骤s3-1,由方差过滤法舍弃初始特征中方差接近零值的初始特征;步骤s2,由相关系数过滤法在剩余初始特征中舍弃与目标变量pearson相关系数较低以及自变量特征强自相关的初始特征;步骤s3,由随机森林平均不纯度减少法根据剩余各特征的贡献度做阈值遍历筛选,得到最优特征数为剩余特征总贡献度的前a%,其中,a%为[65%-100%]区间中的一个固定值,由具体输入数据样本及阈值寻优算法决定。
[0012]
在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,在训练中,还包括对训练集中两类标签不同的数据赋予不同权重以均衡重要性。
[0013]
在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,集成学习算法包括逻辑回归算法、支持向量机算法以及随机森林算法。
[0014]
在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,质量判定的过程为:基于逻辑回归算法、支持向量机算法以及随机森林算法分别独立计算待测油井管特殊扣的三个分级概率结果,将三个分级概率结果进行汇总,通过硬投票模块基于投票法输出最终判定结果,最终判定结果为汇总后票数最多的分级概率结果。
[0015]
在本发明提供的基于集成学习算法的油井管特殊扣拧接质量判定方法中,还可以具有这样的技术特征,其中,当分级概率结果大于等于0.6,则分类为合格类,当分级概率结果小于0.6,则分类为不合格类。
[0016]
发明作用与效果
[0017]
根据本发明的一种基于集成学习算法的油井管特殊扣拧接质量判定方法,基于油井管特殊扣的拧接参数创建了初始特征,利用集成筛选算法识别出关键特征的基础上,融合投票集成学习算法对数据样本分类,从而实现油井管特殊扣产品质量的智能判定。通过本发明所提供的质量智能判定方法,提高了油井管特殊扣拧接质量判定的准确率,加快了特殊扣拧接质量判定自动化进程,节省了人工对产品过程参数判定的劳动成本,同时降低了产品质量判定的误判率,提高了出场合格率。同时,不仅解决了油井管特殊扣拧接过程中质量判定容易出现漏判、误判等难题,极大减少了油气采收过程的安全隐患,还避免了由于不合格产品外流带来的安全隐患。
附图说明
[0018]
图1是本发明实施例中基于集成学习算法的油井管特殊扣拧接质量判定方法的流程图;
[0019]
图2是本发明实施例中集成筛选关键特征过程中阈值a%寻优算法示意图;
[0020]
图3是本发明实施例中集成筛选关键特征方法中阈值a%对应的最优特征数示意图;以及
[0021]
图4是本发明实施例中的投票集成分类模型进行质量判定的结构示意图。
具体实施方式
[0022]
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明的基于集成学习算法的油井管特殊扣拧接质量判定方法作具体阐述。
[0023]
《实施例》
[0024]
图1是本发明实施例中基于集成学习算法的油井管特殊扣拧接质量判定方法的流程图;
[0025]
如图1所示,基于集成学习算法的油井管特殊扣拧接质量判定方法包括一些步骤:
[0026]
步骤s1,采集油井管特殊扣生产过程中的参数,预处理后作为原始数据集,并将原始数据集分为训练集和测试集。
[0027]
本实施例中,将数据库中的管拧机76个传感器的拧接过程参数分别作为特征变量,即数据样本共有76维自变量特征,并将不合格类样本对应的参数打标签为0,将合格类样本对应的参数标签为1,对应组成数据样本,即数据样本有1维因变量特征。
[0028]
共采集11392条原始数据样本据作为原始数据集,其中合格类10819条,不合格类573条。采用分层抽样将原始数据集总数的65%,约7404条样本,作为训练集;将原始数据集总数的25%,约2848条样本,作为测试集。
[0029]
步骤s2,基于采集的参数选取四类参数作为已知特征,根据已知特征创建一维附加特征并入至已知特征从而生成初始特征。
[0030]
本实施例中,已知特征包括当前点扭矩参数、拧紧扭矩参数、当前点圈数以及拧紧圈数这四类参数。根据拧紧扭矩参数与当前点扭矩参数之差比拧紧圈数与当前点圈数之差创建一维附加特征,并将该一维附加特征与已知特征合并得到共计77维的初始特征。利用该初始特征描述油管拧接过程中螺纹和密封面的状态,有效解决了其复杂多变状态难以描述的问题,从而极大提升模型的分类能力。
[0031]
步骤s3,采用集成筛选算法从初始特征中筛选得到关键特征。
[0032]
由于数据样本有77维自变量特征中存在大量冗余特征,且以噪音的形式影响模型的判定质量,因此,本实施例提出使用由方差过滤法、相关系数过滤法、随机森林平均不纯度减少法组成的集成筛选算法对初始特征按照重要性进行排序,筛选出对分类效果影响最显著且特征累计贡献度为剩余特征总贡献度的前a%的关键特征用于模型训练。其中,a%为[65%-100%]区间中的一个固定值,由具体输入数据样本及阈值寻优算法决定。具体地:
[0033]
图2是本发明实施例中集成筛选关键特征过程中阈值a%寻优算法示意图,以及图3是本发明实施例中集成筛选关键特征方法中阈值a%对应的最优特征数示意图。
[0034]
首先,由方差过滤法舍弃初始特征中方差接近零值的15维初始特征。
[0035]
然后,由相关系数过滤法在剩余初始特征中舍弃与目标变量pearson相关系数较低的以及自变量特征强自相关的23维初始特征。
[0036]
最后,由随机森林平均不纯度减少法先预训练一个简单的随机森林分类模型后,将剩余的39维特征按对目标变量的贡献度排序,然后经过在区间[65%-100%]内以2%为步长进行阈值遍历寻优,当阈值a%为85%时分类模型效果最优(如图2所示),因此得到最优特征为剩余39维特征总贡献度的前85%,具体得到最优特特征数为按贡献度排序的前16维特征(如图3所示的交点处)。
[0037]
本实施例中,经测得初始特征的贡献度为7%,贡献度排名前三,属于关键特征。
[0038]
步骤s4,基于集成学习算法和硬投票模块构建初始二分类模型。
[0039]
本实施例中,集成学习算法包括逻辑回归(lr)算法、支持向量机(svm)算法以及随机森林(rf)算法这三种算法。
[0040]
步骤s5,利用训练集和关键特征对初始二分类模型进行调优训练,得到投票集成分类模型用以预测给定数据的类标号。
[0041]
本实施例中,由于数据样本中合格类与不合格类的比例将近18:1,基于不平衡的数据样本,首先给数量较少的类样本赋予18的权重,数量较多的类样本赋予1的权重以均衡两类样本的重要性。
[0042]
模型训练数据中的权重具体为:
[0043][0044]
式中,n为类别数,ni为各类别中的样本数。
[0045]
步骤s6,利用投票集成分类模型对待测油井管特殊扣进行质量判定,并输出合格或不合格的最终判定结果。
[0046]
图4是本发明实施例中的投票集成分类模型进行质量判定的结构示意图。
[0047]
如图4所示,投票集成分类模型进行质量判定的过程为:首先,基于逻辑回归算法、支持向量机算法以及随机森林算法分别独立计算待测油井管特殊扣的三个分级概率结果,当分级概率结果大于等于0.6,则分类为合格类,当分级概率结果小于0.6,则分类为不合格类。然后,将三个分级概率结果进行汇总,通过硬投票模块基于投票法则进行硬投票汇总,最终输出汇总后票数最多的分级概率结果作为最终判定结果。
[0048]
本实施例中,为进一步验证该模型的预测结果,使用包含2848条样本的测试集验证模型,模型的评价指标表1所示,加权平均f1-score为0.9996,且误判率相当小,只有1条合格样本被误判为不合格,证明了本发明实施例方法的有效性。
[0049]
[0050]
表1
[0051]
综上可知,本实施例创建了基于集成学习算法的油井管特殊扣产品拧接质量智能判定模型,使用逻辑回归(lr)算法、支持向量机(svm)算法、随机森林(rf)算法进行投票集成,精度更高且更加稳定。
[0052]
实施例作用与效果
[0053]
根据本实施例提供的一种基于集成学习算法的油井管特殊扣拧接质量判定方法,基于油井管特殊扣的拧接参数创建了初始特征,利用集成筛选算法识别出关键特征的基础上,融合投票集成学习算法对数据样本分类,从而实现油井管特殊扣产品质量的智能判定。通过该质量智能判定方法,提高了油井管特殊扣拧接质量判定的准确率,加快了特殊扣拧接质量判定自动化进程,节省了人工对产品过程参数判定的劳动成本,同时降低了产品质量判定的误判率,提高了出场合格率。同时,不仅解决了油井管特殊扣拧接过程中质量判定容易出现漏判、误判等难题,极大减少了油气采收过程的安全隐患,还避免了由于不合格产品外流带来的安全隐患。
[0054]
实施例中,创建了描述螺纹和密封面状态的初始特征,并采用集成筛选算法筛选出了对分类效果影响最显著关键特征,同时还创新地结合采用了集成三种算法的二分类模型对数据样本进行分类,使模型对油井管特殊扣产品拧接质量的估计更加精准。
[0055]
上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献