一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于XGBoost机器学习的核反应堆内螺栓可靠性评估方法与流程

2021-10-30 02:33:00 来源:中国专利 TAG:核反应堆 螺栓 可靠性 评估 机器

一种基于xgboost机器学习的核反应堆内螺栓可靠性评估方法
技术领域
1.本发明属于核电站堆内构件技术领域,尤其涉及一种基于xgboost机器学习的核反应堆内螺栓可靠性评估方法。


背景技术:

2.堆内构件螺栓承担着部件连接和固定等作用,其安全性和可靠性直接关系到反应堆的安全和效率。与普通螺栓不同的是,堆内螺栓所处环境恶劣,长期处于高温、高压和水腐蚀,特别是强中子辐照环境中,以辐照促进应力腐蚀开裂(iascc)为代表的促应力腐蚀时有发生。随着使用时间的延长,裂纹长度逐渐扩大,裂纹尖端应力强度因子逐渐增加,最终应力强度因子超过螺栓材料的断裂韧度,螺栓发生断裂失效。核电厂通常会备有大量零件库存,这样会使企业大量流动资金被占用和产生大量库存管理成本。为了在保证反应堆安全运营的前提下,尽可能的减少库存是一个需要解决的问题。
3.但对于核电企业,以秦山核电为例。秦山核电拥有9台机组、4种机型,因此每座反应堆的实际情况各不相同,使用螺栓的情况也不一样。对于这种情况,需要一个泛化性能好、预测精度高的基于数据驱动的寿命预测模型。
4.由于实际不存在螺栓发生断裂再进行更换的情况。所以促应力腐蚀条件下损坏的螺栓数据不多,会加大数据驱动模型的训练难度。
5.基于以上的困难条件下,传统概率论和数理统计方法将很难适应于这些条件。


技术实现要素:

6.本发明的目的是克服现有技术中的不足,提供一种基于xgboost机器学习的核反应堆内螺栓可靠性评估方法。
7.这种基于xgboost机器学习的核反应堆内螺栓可靠性评估方法,包括以下步骤:
8.步骤1、基于monte carlo直接抽样方法对堆内螺栓使用寿命数据进行随机抽样;由于原始数据的数量较少,不利于数据驱动模型的构建,再根据monte carlo直接抽样方法抽样的概率分布,随机取设定数量个堆内螺栓使用寿命数据值,用于扩充数据,优化模型训练;
9.步骤2、数据预处理:由于不同物理量的量纲不同,需将步骤1采集得到的原始状态参数(堆内螺栓使用寿命数据值)进行标准化处理,以保证后续模型训练的效率,将不同的物理量无量纲化:
[0010][0011]
上式中,为标准化值;x为原始值;μ为均值;σ为标准层,数值区间为[

1,1];
[0012]
步骤3、分割数据集:按设定比例将数据集划分为训练集和预测集;
[0013]
步骤4、搭建xgboost模型(堆内螺栓寿命预测模型),采用训练集对xgboost模型进
行训练;
[0014]
步骤5、将预测集数据代入xgboost模型进行预测;
[0015]
步骤6、将预测数据与真实数据作对比,评估xgboost模型准确性:为了衡量模型预测的准确性,使用rmse、r2‑
score和整体平均准确率来衡量xgboost模型的准确性;使用起裂

断裂时间的公式来计算实际断裂时间真实值,验证预测的准确率:
[0016][0017]
上式中,t
n
表示从iascc起裂到螺栓损坏的时间间隔,单位为hour;σ表示螺栓应力,单位为n/mm2;σ
y
表示螺栓材料的屈服强度,单位为n/mm2;q表示螺栓材料的激活能,单位为j/mol;r表示气体常数,单位为j/mol
·
k;f表示螺栓所受中子注量,单位为n/cm2;k表示比例常数;n表示系数;m表示系数;使用xgboost模型计算预测数据,将预测数据与实际断裂时间真实值进行比较,验证预测数据的准确率;
[0018]
步骤7、生成真实值

预测值图,直观评估xgboost模型的预测效果。
[0019]
作为优选,步骤1中基于monte carlo直接抽样方法根据堆内螺栓工作环境的温度、压力、中子注入率和螺栓材料的屈服强度来进行堆内螺栓使用寿命数据的随机抽样。
[0020]
作为优选,步骤4具体包括以下步骤:
[0021]
步骤4.1、建立xgboost模型的目标函数;xgboost模型的目标函数由损失函数和正则化项两部分组成:
[0022][0023]
上式中,n为第n条数据,k为总共有多少棵树,代表损失函数,ω(f
k
)代表正则化项,是第i个样本x
i
的预测值;y
i
是第i个样本x
i
的实际值;
[0024]
xgboost模型为加法模型,则第i个样本x
i
的预测值是每棵树的累加函数:
[0025][0026]
上式中,表示第i个样本x
i
的预测值,k表示总共有多少棵树,的预测值,k表示总共有多少棵树,其中f指回归树空间,x
i
表示第i个样本;f(x)为关于x的函数;f
k
表示每一棵树对应的独立叶权重函数;ω
q(x)
表示叶权重函数;q代表每棵树结构;t代表叶节点数量;代表叶节点的域;代表将特征向量映射到叶节点;ω表示权重;k表示第k棵树;
[0027]
为了防止xgboost模型过拟合,将全部k棵树进行求和,并将求和结果作为目标函数的正则化项:
[0028][0029]
上式中,k表示第k棵树;
[0030]
步骤4.2、当建立第t棵树时,使用贪心算法对节点进行分裂:从树的0深度开始,对树内的每个叶节点进行分裂;每次分裂后会产生两个新的左右叶节点,并将原叶节点的权值按照该节点的规则分给左右两个节点;
[0031]
计算新分裂的节点给损失函数带来的收益,增益函数公式为:
[0032]
gain=obj
l r

(obj
l
obj
r
)
[0033]
上式中,gain为节点分裂的增益函数,obj
l r
为原叶节点的目标函数,obj
l
为左节点的目标函数,obj
r
为右节点的目标函数;若xgboost模型的目标函数减小,则暂时保留此次分裂;
[0034]
步骤4.3、寻找最佳分裂节点;在节点分裂时存在多个节点分裂后都可以使目标函数减小的情况,所以需要选取一个使目标函数达到最优的节点,进行分裂;使目标函数达到最优的节点为使目标函数obj不再减少的节点;
[0035]
步骤4.4、限制生长条件是为了防止xgboost模型过拟合所设置的终止建树条件:当节点分裂的增益函数gain<0,即不能为目标函数带来优化时,放弃分裂;当树达到规定的最大深度时,停止建树;当分裂一次后,左叶子或右叶子样本数小于1时,放弃分裂。
[0036]
作为优选,步骤4中采用python语言搭建xgboost模型。
[0037]
作为优选,步骤4.1中损失函数为平方损失函数:
[0038][0039]
作为优选,步骤4.2中节点的规则为:对节点数值进行判断,若判定为真,则将原叶节点的权值分给左边节点;反之,则将原叶节点的权值分给右边节点。
[0040]
作为优选,步骤6中:
[0041]
rmse的公式为:
[0042][0043]
上式中,n为训练样本总数;为预测值;y
i
为实际值;
[0044]
r2‑
score的公式为:
[0045][0046]
上式中,n为训练样本总数;为预测值;y
i
为实际值;为均值;
[0047]
整体平均准确率的公式为:
[0048][0049]
上式中,n为训练样本总数;为预测值;y
i
为实际值。
[0050]
本发明的有益效果是:本发明旨在提出一种基于xgboost的堆内构件螺栓可靠性评估方法,xgboost泛化性能好、适用范围广、对于输入输出条件不敏感并且易于扩展,只需要历史发生数据,无需依赖任何函数公式,就可以得到自变量与因变量直接的关系;高效的实现了gbrt算法,解决了gbrt无法并行的问题;本发明通过使用基于原数据概率分布的大量随机取值,进行数据扩充;本发明为核电企业提供一种可靠、精确的堆内螺栓寿命预测模型,从而合理减少零件备用量,为企业减轻库存负担。
附图说明
[0051]
图1为堆内螺栓辐照注入量变化图;
[0052]
图2为基于xgboost机器学习的核反应堆内螺栓可靠性评估方法流程图;
[0053]
图3为基于xgboost的堆内构件螺栓可靠性评估方法第60次建树图;
[0054]
图4为基于xgboost的堆内构件螺栓可靠性评估方法第100次建树图;
[0055]
图5为基于xgboost的堆内构件螺栓可靠性评估方法第500次建树部分图。
具体实施方式
[0056]
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0057]
近年来,随着人工智能技术的发展,越来越多的机器学习模型用于机械结构的故障分析和寿命预测。xgboost就是其中一种泛化性能好、适用范围广、对于输入输出条件不敏感并且易于扩展的数据驱动模型,xgboos只需要历史发生数据,无需依赖任何函数公式,就可以得到自变量与因变量直接的关系。xgboost模型高效的实现了gbrt算法,解决了gbrt无法并行的问题,目前xgboost是基于回归树解决boosting问题最快捷的方法。本发明通过使用基于原数据概率分布的大量随机取值,进行数据扩充。最后,将所得的数据35000条作为训练集,15000条作为预测集放入xgboost进行训练和预测。
[0058]
本发明采用的堆内螺栓寿命预测模型利用基于堆内螺栓运行状态的概率分布数据进行实验,以堆内螺栓使用寿命为预测变量,以rmse、r2‑
score和模型平均精准率作为模型优劣的评价标准,最终实现对未来某一运行状态下的螺栓使用寿命进行预测。
[0059]
实施例一
[0060]
本技术实施例一提供了一种如图2所示基于xgboost机器学习的核反应堆内螺栓可靠性评估方法:
[0061]
步骤1、基于monte carlo直接抽样方法对堆内螺栓使用寿命数据进行随机抽样(本实施例为堆内螺栓使用寿命数据,共50000条、4维度数据集),得到如图1所示堆内螺栓辐照注入量变化图;由于原始数据的数量较少,不利于数据驱动模型的构建,再根据monte carlo直接抽样方法抽样的概率分布,随机取设定数量个堆内螺栓使用寿命数据值,用于扩充数据,优化模型训练;根据堆内螺栓工作环境的温度(596~642k)、压力(68.6~72.6n/mm2)、中子注入率(1.7e 16~1.805e 16n/hour*cm2)和屈服强度(198.5~211.5n/mm2)进行随机抽样,通过5000次抽样得到以上数据的概率分布如表1所示:
[0062]
表1 不确定性参数信息表
[0063]
参数名称分布类型均值标准差中子注入率正态分布1.75
×
10
16
n/hour
·
cm21.75
×
10
14
n/hour
·
cm2螺栓应力正态分布70.5n/mm20.705n/mm2屈服强度正态分布205n/mm22.05n/mm2温度正态分布603.15k6.0315k
[0064]
步骤2、数据预处理:由于不同物理量的量纲不同,需将步骤1采集得到的原始状态参数(堆内螺栓使用寿命数据值)进行标准化处理,以保证后续模型训练的效率,将不同的
物理量无量纲化:
[0065][0066]
上式中,为标准化值;x为原始值;μ为均值;σ为标准层,数值区间为[

1,1];
[0067]
步骤3、分割数据集:按设定比例将数据集划分为训练集和预测集;将35000条数据划为训练集,15000条划为预测集;
[0068]
步骤4、搭建xgboost模型(堆内螺栓寿命预测模型),采用训练集对xgboost模型进行训练;其中图3至图5分别为基于xgboost的堆内构件螺栓可靠性评估方法第60次、第100次、第500次建树部分图。
[0069]
步骤5、将预测集数据代入xgboost模型进行预测;
[0070]
步骤6、将预测数据与真实数据作对比,评估xgboost模型准确性:为了衡量模型预测的准确性,使用rmse、r2‑
score和整体平均准确率来衡量xgboost模型的准确性;使用起裂

断裂时间的公式来计算实际断裂时间真实值,验证预测的准确率:
[0071][0072]
上式中,t
n
表示从iascc起裂到螺栓损坏的时间间隔,单位为hour;σ表示螺栓应力,单位为n/mm2;σ
y
表示螺栓材料的屈服强度,单位为n/mm2;q表示螺栓材料的激活能,单位为j/mol;r表示气体常数,单位为j/mol
·
k;f表示螺栓所受中子注量,单位为n/cm2;k表示比例常数;n表示系数;m表示系数;使用xgboost模型计算预测数据,将预测数据与实际断裂时间真实值进行比较,验证预测数据的准确率;
[0073]
步骤7、生成真实值

预测值图,直观评估xgboost模型的预测效果。
[0074]
实施例二
[0075]
在实施例一的基础上,本技术实施例二进一步提供了实施例一的实验结果:
[0076]
根据xgboost模型的原理,本发明核反应堆内螺栓可靠性评估模型,采用学习率为0.03,最大深度为20,正则化项使用l2正则化,损失函数使用平方损失函数,最小叶子样本数为1的设置。
[0077]
为检验本文提出的xgboost模型的预测效果,需将输入一批仅有压力、中子注入率、温度和屈服强度的数据,以验证模型的预测准确性,并将预测结果与真实数据进行对比,并与adaboost算法进行对比。xgboost模型预测的rmse值为100.57,r2_score的值为0.99981527。xgboost模型预测的部分实际值、部分预测值、部分单个预测的准确度和模型整体准确度如表2所示:
[0078]
表2 xgboost部分实际值、部分预测值、部分单个预测的准确度和模型整体准确度表
[0079][0080]
进一步验证本发明采用的xgboost方法的性能,绘制与adaboost模型采用不同损失函数计算方法下的rmse值和相对误差百分比做对比,如表3所示。
[0081]
表3 评价指标表
[0082][0083]
由下表4可知xgboost模型较好,rmse低至100.57,准确度相对较高,在堆内螺栓促应力腐蚀条件下进行寿命预测有较好的应用价值。
[0084]
表4 采用基于xgboost的堆内构件螺栓可靠性评估方法取得的部分实际值、部分预测值、部分单个预测的准确度和模型整体准确度表
[0085][0086]
综上所述,基于xgboost机器学习的核反应堆内螺栓可靠性评估方法可以有效的解决对于堆内螺栓寿命预测模型泛化性能不好、预测精度较低、模型运算效率低下和数理统计方法依赖函数公式的问题。在数据预处理部分通过monte carlo直接抽样,再将小样本数据进行扩充,有利于提升机器学习的准确性,解决了数据量不足的问题。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜