一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于XGBoost算法的伴热带装置寿命状态预测方法

2022-06-08 23:18:12 来源:中国专利 TAG:

技术特征:
1.基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,包括以下步骤:步骤一、将伴热带装置的的历史数据信息加入数据集;其中,数据集中的每个数据样本包括伴热带工作电流、端电压和温度三个特征值以及一个真实标签值;步骤二、将步骤一的数据集以7:2:1的比例进行划分,其中70%数据作为训练数据集用于训练模型、20%数据作为验证数据集用来对模型参数进行调整、以及10%数据作为测试数据集验证模型的准确度;步骤三、在开始训练xgboost模型之前对xgboost模型参数进行初始化处理,xgboost模型参数包含通用参数、booster参数和学习目标参数;步骤四、设定迭代次数num_round为t,用步骤二中的训练数据集训练步骤三的xgboost初始化模型,得到训练后模型,即第1棵树到第3t棵树的构建,模型训练具体步骤为:4.1设定每个样本的初始预测概率均为p0,并根据初始预测概率和样本真实标签值构建前三棵树;前三棵树为三种类别分别对应的第1棵树,当构建某一类别的第1棵树时,训练数据集样本中属于该类别的真实标签值为1,不属于该类别的真实标签值为0;4.2根据前三棵树中每个样本的预测概率p
ki
、样本真实标签值进行第二次迭代,直到达到设定的迭代次数,训练模型构建完成;在模型训练过程中,针对每一类别的t棵树中样本x
i
预测分值的变化如下式(1)所示,式(1)中,f
kt
(x
i
)指第k类别的第t棵树中样本x
i
对应的叶子节点权值;k表示类别,k取值1、2或3;表示第k类别中,在前t-1棵树中样本x
i
对应的叶子节点权值和第t棵树中样本x
i
对应的叶子节点权值之和;样本x
i
的叶子节点权值之和和预测概率之间的转换关系式为:式(2)中,p
1i
表示样本x
i
为第一类的预测概率,p
2i
表示样本x
i
为第二类的预测概率,p
3i
表示样本x
i
为第三类的预测概率;exp()表示指数函数;步骤五、利用步骤二中的验证数据集调整步骤四所得训练后模型的模型参数,具体为通过不断的调整模型参数查看验证数据集的分类结果,最终选出最优的模型参数,得到参数调优的xgboostt模型;
步骤六、通过步骤二中的测试数据集验证步骤五所得xgboost模型的准确度;步骤七、当步骤六中验证xgboost模型准确度不满足要求时,重复步骤一至步骤六,直到准确为止;若步骤六中验证xgboost模型准确度满足要求时,得到验证好的xgboost模型,用验证好的xgboost模型对伴热带装置实时工作数据进行预测,得到其预测分值,预测分值转化为对应的寿命类别即为当前伴热带装置寿命状态。2.根据权利要求1所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤一中的真实标签值为[1,0,0]、[0,1,0]和[0,0,1],且标签值[1,0,0]、[0,1,0]和[0,0,1]分别对应工作正常、寿命预警和寿命不足三种不同的寿命状态。3.根据权利要求1所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤三中xgboost模型参数进行初始化处理具体为:通用参数中将booster设置为gbtree;booster参数中将eta设置为0.1、gamma设置为0.1、max_depth设置为5、min_child_weight设置为2、lambda设置为2;学习目标参数设置为:objective设置为multi:softmax、num_class设置为3;其中,gbtree表示基于树的模型,eta表示学习率,gamma表示节点分裂所需的最小损失函数下降值,max_depth表示树的最大深度,min_child_weight表示最小叶子节点样本权重和,lambda表示权重的l2正则化项,objective表示返回预测的类别,multi:softmax表示softmax的多分类器,num_class为类别数目。4.根据权利要求3所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤4.1中,根据初始预测分值和样本真实标签值构建前三棵树的具体构建过程为:4.1.1针对第一类进行构建第1棵树,根据初始预测概率和样本真实标签值,对训练集样本进行节点划分;训练集样本中,样本属于第一类的真实标签值为1,样本不属于第一类的真实标签值为0;4.1.2在对训练集样本进行节点划分的过程中,当该棵树叶子节点的权值之和达到最小叶子节点样本权重和min_child_weight,或者该棵树中树的深度达到设定的树的最大深度max_depth,或者分裂收益达到阈值,阈值设定为0,即停止节点分裂,此时得到第一类的第1棵树,即训练模型的第1棵树;4.1.3采用同样的方法对第二类和第三类的第1棵树的构建,即第2棵树和第3棵树的构建。5.根据权利要求4所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤4.1.1中,根据初始预测概率和样本真实标签值对训练样本进行节点划分的具体方法为:4.1.1.1设定每个样本的初始预测概率p0,并根据初始预测概率和样本真实标签值得到训练集样本损失函数的一阶偏导数值和二阶偏导数值,并根据一阶偏导数值和二阶偏导数值得到分裂前后的目标函数;训练集样本损失函数的一阶偏导数值和二阶偏导数值如下式所示:训练集样本损失函数的一阶偏导数值和二阶偏导数值如下式所示:其中,g
i
为样本x
i
损失函数的一阶导,h
i
为x
i
损失函数的二阶导,y
i
表示样本x
i
的真实标
签值,表示样本x
i
的预测分值或样本x
i
所对应的叶子节点权值之和;在前三棵树的建立过程中,每个样本的初始预测概率p0=0.333;分裂前、后的目标函数分别为:分裂前、后的目标函数分别为:其中,左子树一阶偏导数值计算左子树二阶偏导数值计算右子树一阶偏导数值计算右子树二阶偏导数值计算i
left
为左子树样本集合,i
right
为右子树样本集合,i表示样本x
i
,λ表示步骤三中的参数lambda,γ表示步骤三中的参数gamma;4.1.1.2根据分裂前后的目标函数计算分裂收益,即分裂后的分裂收益=分裂前目标函数-分裂后目标函数,分裂后的分裂收益gain为如下式所示:4.1.1.3根据步骤4.1.1.1至4.1.1.2计算训练数据集样本的每个特征值所对应的分裂收益,并以最大分裂收益所对应的特征值作为分裂点,进行节点划分。6.根据权利要求3所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤4.2中,根据前三棵树中每个样本的预测概率p
ki
、样本真实标签值进行第二次迭代,构建第4棵到第6棵树,其具体构建过程为:4.2.1针对第一类进行构建第一类的第2棵树,根据该类别中每个样本的预测概率p
1i
和样本真实标签值,对训练集样本进行节点划分,其中,样本属于第一类的真实标签值为1,样本不属于第一类树别的真实标签值为0;具体节点划分方法为:4.2.1.1根据每个样本的预测概率p
1i
和样本真实标签值得到训练集样本损失函数的一阶偏导数值和二阶偏导数值,并根据一阶偏导数值和二阶偏导数值得到分裂前后的目标函数;训练集样本损失函数的一阶偏导数值和二阶偏导数值如下式所示:训练集样本损失函数的一阶偏导数值和二阶偏导数值如下式所示:训练集样本损失函数的一阶偏导数值和二阶偏导数值如下式所示:其中,g
i
为样本x
i
损失函数的一阶导,h
i
为x
i
损失函数的二阶导,y
i
表示样本x
i
的真实标
签值,表示样本x
i
的预测分值或样本x
i
所对应的叶子节点权值之和;p
1i
表示第一类中样本x
i
的预测概率;分裂前、后的目标函数分别为:分裂前、后的目标函数分别为:其中,左子树一阶偏导数值计算左子树二阶偏导数值计算右子树一阶偏导数值计算右子树二阶偏导数值计算i
left
为左子树样本集合,i
right
为右子树样本集合,i表示样本x
i
,λ表示步骤三中的参数lambda,γ表示步骤三中的参数gamma;4.2.1.2根据分裂前后的目标函数计算分裂收益,即分裂后的分裂收益gain=分裂前目标函数obj
1-分裂后目标函数obj2,分裂后的分裂收益gain为如下式所示:4.2.1.3根据步骤4.2.1.1至4.2.1.2计算训练数据集样本的每个特征值所对应的分裂收益,并以最大分裂收益所对应的特征值作为分裂点,进行节点划分;4.2.2在对训练集样本进行节点划分的过程中,当该棵树叶子节点的权值之和达到最小叶子节点样本权重和min_child_weight,或者该棵树中树的深度达到设定的树的最大深度max_depth,或者分裂收益达到阈值,阈值设定为0,即停止节点分裂,此时得到第一类的第2棵树,即训练模型的第4棵树;4.2.3采用同样的方法进行第二类和第三类的第2棵树的构建。7.根据权利要求3所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤五中,通过验证数据集调整模型参数的具体方法为:第一步对max_depth和min_child_weight调优,先大范围粗调,再小范围细调,接着使用高负荷的栅格搜索确定最佳max_depth和最佳min_child_weight;第二步对gamma参数调优,在栅格搜索之后再进行精细调节确定最佳值;第三步对lambda参数调优;最后对学习率eta进行调优;参数调优的评价准则为是否使得验证数据集的预测准确度提高。8.根据权利要求1所述的基于xgboost算法的伴热带装置寿命状态预测方法,其特征在于,步骤六中,xgboost模型准确性的具体验证方法为:用步骤五所得模型参数调优后的训练模型对验证集的样本数据进行预测,得到其预测分值,转化为寿命类别之后与其实际的
寿命类别进行对比,得到相对的准确度,若准确度小于97%,就从步骤一重新开始。

技术总结
本发明公开了基于XGBoost算法的伴热带装置寿命状态预测方法,包括:获得伴热带装置的实验数据集的历史数据信息;将数据集按比例进行划分训练数据集、验证数据集和测试数据集;XGBoost的模型进行初始化处理;使用训练数据集进行模型训练;利用验证数据集调整模型参数;通过测试数据集验证XGBoost模型准确性;若不满足要求,则重复上述步骤,若满足要求,则用验证好的XGBoost模型对伴热带装置实时工作数据进行预测,得到其预测分值,预测分值经过转换得到预测概率,预测概率对应状态标签分类即为当前伴热带装置寿命状态。本发明通过已有数据样本发现关联规律,通过高效的训练方法强化学习过程,建立分类、聚类和回归算法/模型,根据对象数据实现对伴热带的寿命预测。据对象数据实现对伴热带的寿命预测。据对象数据实现对伴热带的寿命预测。


技术研发人员:赵利岗 胡贤贤 罗欣 李亚鹏 沈安文 唐其鹏
受保护的技术使用者:华中科技大学
技术研发日:2022.01.10
技术公布日:2022/6/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献