一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法

2022-08-13 13:06:15 来源:中国专利 TAG:


1.本发明涉及热轧自动化技术领域,特别是指一种改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法。


背景技术:

2.热轧是钢铁流程的重要组成环节,热轧带钢的板形质量作为产品最重要的质量指标之一,一直以来一直是国内外学者研究的热点问题。
3.现在热轧薄带钢头部的浪形缺陷经常发生,严重影响了带钢的质量,而目前针对头部浪形缺陷的成因分析与诊断多依赖于专家经验,或者采用分析单一工艺参数数值分布的方法。依赖于专家经验的缺陷分析方法耗时耗力,分析效率比较低,难以实现自动化。而对于分析单一工艺参数数值分布的方法,并未考虑工艺参数对质量参数的影响程度,存在偏离程度较大的工艺参数对质量参数的影响较小的情况,因此诊断分析结果的可信程度较低,并且不能对各工艺参数的风险程度进行量化。
4.目前对于热轧带钢板形的缺陷分析与缺陷诊断大多集中于专家经验,其对于热轧带钢头部板形缺陷的风险评估大部分是通过机理分析,以及专家经验,对于使用大数据驱动的研究成果,其数据预处理阶段的工作不够充分,以及后续风险量化的处理得不够完善。
5.在大数据的背景之下,基于数据驱动的方法得到了快速的发展,这种方法是不以轧制理论作为主要依据,可以有效利用带钢轧制生产数据进行建模分析,快速诊断带钢头部板形缺陷的原因,帮助现场人员及早发现生产问题。
6.目前常用的基于多元统计分析的缺陷原因分析方法主要包括:偏最小二乘法、费歇尔判别法、对立元素分析法、主成分分析法。偏最小二乘法是有监督的学习方法,包含了主成分分析、典型相关分析的思想,相对于主成分分析法,偏最小二乘法更加关注工艺参数与质量参数之间的相关关系对因变量具有更好的解释能力,所以选用偏最小二乘法作为本发明的建模方法。
7.但是由于偏最小二乘算法内部模型为线性回归模型,所以其对于线性问题具有较好的适用性,而对于非线性问题偏最小二乘算法往往不能提取出有效的潜变量,导致应用于非线性问题时输出结果准确性不高,因此需要对其进行改进。
8.为此,本发明提出一种基于改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法,在充分进行数据预处理的前提下,对热轧带钢头部浪形缺陷的相关工艺参数进行分析,并向风险系数进行转换,通过对各工艺参数的风险系数进行分析,找到导致缺陷出现的原因,实现对缺陷样本的在线自动分析,输出缺陷样本各工艺参数的风险系数及可能缺陷原因,可以有效的代替人工,提高分析效率,节省分析成本。


技术实现要素:

9.本发明要解决的技术问题是提供一种改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法,解决现场对于热轧头部带钢浪形缺陷的原因识别过于依赖于专家经验,而
且耗时费力,使风险评估更加方便、简洁。
10.该方法包括步骤如下:
11.s1:通过现场数据采集系统获取头部浪形达标的优秀样本和头部浪形不达标的缺陷样本的温度、辊缝、轧制力等相关工艺参数数据及带钢头部平坦度命中率作为质量数据,并对获取的优秀样本与缺陷样本数据进行方差检验、相关性检验、局部异常因子检验等数据预处理,实现异常值离群样本剔除与降维;
12.s2:将包含优秀样本和缺陷样本的样本数据集代入到使用马氏距离变换改进后的偏最小二乘算法(pls算法),计算样本的平方预测误差统计量,即样本spe统计量,以及样本的平方预测误差统计量控制界限,即样本spe统计量控制界限,根据缺陷样本与优秀样本spe统计量的分离程度及肘部规则调节潜变量k的数值,以缺陷样本spe统计量超过样本spe统计量控制界限以及实现缺陷样本spe统计量与优秀样本spe统计量之间的相对最大分离作为该算法与样本集之间适用性检验标准,如果存在不能检测出缺陷样本或者将优秀样本检测成缺陷样本的情况,则说明工艺参数选择不合理,需要重新进行参数选择、数据采集及数据预处理;
13.s3:对s2得到的缺陷样本spe统计量各工艺参数的贡献值进行计算,并以直方图形式进行表述,作为各工艺参数的初始风险系数;
14.s4:对s3中得到的各工艺参数的初始风险系数进行再处理,统一风险系数评估指标,将各工艺参数对缺陷样本spe统计量贡献值进行求和处理,计算工艺参数贡献值的占比,并以此作为各工艺参数最终的风险系数;
15.s5:对比各工艺参数的风险系数的大小,风险系数最大的工艺参数为缺陷出现的主导缺陷因素。
16.其中,s1中异常值离群样本剔除具体为:对优秀样本进行缺失值检索,剔除存在缺失值的优秀样本,然后运用局部异常因子算法对剔除缺失值的样本进行异常值检测,通过计算局部离群因子lofz(p)的值与1进行比较,越接近1说明样本和它的邻域样本密度比较接近,极有可能属于同一簇,当lofz(p)大于1时,说明样本的密度小于其邻域样本密度,样本越可能是异常样本点,并予以剔除;
[0017][0018]
其中,nz(p)表示的是样本点p的第z距离邻域,即样本点p的第z距离内的所有的样本点,|nz(p)|表示样本点p的第z距离邻域内所有样本点的个数,lrdz(p)表示的是样本点p的第z邻域内的样本点到样本点p的平均可达距离的倒数,lrdz(o)表示的是样本点o的第z邻域内的点到样本点o的平均可达距离的倒数。局部离群因子越接近1说明样本点p和它的邻域样本点密度比较接近,极有可能属于同一簇,当局部离群因子值越大于1,说明样本点p的密度小于其邻域样本点密度,p越可能是异常样本点。
[0019]
s2具体为:
[0020]
对经过s1处理后的样本数据运用马氏距离变换公式进行转换,马氏距离d(x)计算如下:
[0021][0022]
其中,x为样本向量,s为样本的协方差矩阵,u表示样本均值;马氏距离变换是一种非线性的放大变换,可以提取更有代表性的潜在变量,增强常规偏最小二乘算法对非线性问题的适用性。
[0023]
对经过马氏距离变换之后的数据样本进行偏最小二乘诊断分析,运用特征变量重新组合的思路将其进行分解,如下:
[0024]
u=uy e=pr
t
u e
[0025]
e=(i
m*m-pr
t
)u
[0026]
其中,u∈r
m*l
为数据样本集,m为样本条数,l为工艺参数个数,uy为拟合样本,e为对应的残差矩阵,p为负载矩阵,r
t
为负载矩阵的转置矩阵,i
m*m
为单位矩阵;
[0027]
然后对各个样本的spe统计量进行计算,公式如下:
[0028]
spe=||e||2=||((i
m*m-pr
t
)u)||2[0029]
spe统计量的控制界限spek计算如下:
[0030][0031]
g=s
spe
/2μ
[0032]
其中,s
spe
为样本spe统计量的方差,μ为样本spe统计量的均值,为卡方值,根据置信度和自由度查表得到,g为中间变量。
[0033]
计算在潜变量个数k的衡量指标s:
[0034][0035][0036]
s=s
error,k-s
yes,k
[0037]
其中,s
yes,k
为潜变量个数为k时优秀样本spe统计量的方差,为潜变量个数为k时优秀样本spe统计量的均值,spe
j,k
为潜变量个数为k时第j各样本的spe统计量,n为优秀样本条数。s
error,k
为潜变量个数为k时缺陷样本spe统计量与优秀样本spe统计量均值的差值,spe
error,k
为潜变量个数为k时缺陷样本spe统计量。
[0038]
考虑到潜变量个数k取值过大会造成过拟合,过小会造成精度不够,本方法在2—l/2范围内选取潜变量个数(l为工艺参数个数)。划定潜变量个数k取值范围之后,对衡量指标s曲线应用肘部规则,选择潜变量个数k。
[0039]
s3中的计算方法如下:
[0040][0041][0042]
其中,为每个变量对样本spe统计量的贡献值,为单位矩阵的第i行,l为工艺参数个数。
[0043]
s4中将工艺参数贡献值与工艺参数贡献值总值的占比此作为各工艺参数最终的的风险系数,再处理过程如下:
[0044][0045]
其中,rpni为工艺参数i的风险系数,为工艺参数i对缺陷样本spe统计量贡献值。
[0046]
本发明的上述技术方案的有益效果如下:
[0047]
上述方案中,从样本数据角度出发,充分考虑工艺参数与质量参数之间的相关关系,可实现对缺陷样本的在线自动分析、量化各工艺参数的风险系数、并给出缺陷的主导工艺参数,提升了分析效率与分析结果的可信程度,可以有效的代替人工,提高分析效率,节省分析成本。
附图说明
[0048]
图1为本发明的改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法工艺流程图;
[0049]
图2为本发明实施例中异常样本剔除后剩余样本的局部离群因子检测结果图;
[0050]
图3为本发明实施例中潜变量个数与评价指标的关系图;
[0051]
图4为本发明实施例中各样本spe统计量结果图;
[0052]
图5为本发明实施例中各工艺参数对缺陷样本贡献结果图;
[0053]
图6为本发明实施例中各工艺参数风险评估结果图;
[0054]
图7为本发明实施例中f1轧制力头部偏差样本分布图;
[0055]
图8为本发明实施例中f5工作辊窜辊量样本分布图。
具体实施方式
[0056]
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0057]
本发明提供一种改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法。
[0058]
如图1所示,该方法包括步骤如下:
[0059]
s1:通过现场数据采集系统获取头部浪形达标的优秀样本和头部浪形不达标的缺陷样本的温度、辊缝、轧制力工艺参数数据及带钢头部平坦度命中率作为质量数据,并对获取的优秀样本与缺陷样本数据进行数据预处理,实现异常值离群样本剔除与降维;
[0060]
s2:构建可行性检验模型:将样本数据集带入到改进偏最小二乘算法,通过计算样本的平方预测误差统计量,即样本spe统计量,以及平方预测误差统计量控制界限,即样本spe统计量控制界限,根据缺陷样本与优秀样本spe统计量的分离程度及肘部规则调节潜变量k的数值,以缺陷样本spe统计量超过样本spe统计量控制界限以及缺陷样本spe统计量与优秀样本spe统计量之间的明显分离作为样本与方法的适用性检验标准;
[0061]
s3:对s2可行性检验模型得到的样本spe统计量各工艺参数的贡献值进行
计算,并以直方图形式进行表述,作为各工艺参数的初始风险系数;
[0062]
s4:对s3中得到的各工艺参数的风险系数进行再处理,统一风险系数评估指标,将各工艺参数对缺陷样本spe统计量贡献值进行求和处理,计算工艺参数贡献值的占比,并以此作为各工艺参数最终的风险系数;
[0063]
s5:对比各工艺参数的风险系数的大小,风险系数最大的工艺参数为缺陷出现的主导缺陷因素。
[0064]
下面结合具体实施例予以说明。
[0065]
以某钢厂2250热轧产线的生产数据为例,对热轧带钢头部浪形缺陷原因进行识别,选取钢种为mrtrg00502,厚度为3.5mm,宽度为1722mm的生产样本,质量参数为热轧带钢头部对称平坦度命中率,工艺参数主要为温度、轧制力、辊缝等相关参数。具体实施步骤如下:
[0066]
步骤1:
[0067]
整理现场获得数据,对含有缺失值的样本进行剔除。计算皮尔逊相关系数矩阵,通过分析相关系数,将工艺参数由最初的74维降至包含出炉温度、轧制力偏差、弯辊等15维。对降维之后的样本进行异常点检测,排除样本集中的异常样本。计算局部离群因子lofk(p),局部离群因子大于1的样本进行剔除,对剔除后样本的局部离群因子lofk(p)进行复核结果如图2所示,图2中为处理后的复验结果,无离群点说明无异常点,说明处理是有效果的。
[0068]
剔除后样本集与各样本的工艺参数组成如表格所示:
[0069][0070]
步骤2:对经过步骤1处理之后的数据运用马氏距离变换公式进行转换。
[0071]
经马氏距离转换之后的样本数据如下表:
[0072][0073][0074]
原始样本与经马氏距离转换之后的样本中各工艺参数与质量参数之间的皮尔逊相关系数如下表:
[0075][0076]
对经过马氏距离变换之后的数据样本进行偏最小二乘诊断分析,运用特征变量重新组合的思路将其进行分解,然后对各个样本的spe统计量进行计算,通过肘部规则对潜变量个数寻优之后发现当潜变量个数k=4的时候效果最好,结果如图3、图4所示,经对比实际数据集发现本步骤挖掘到的缺陷样本与实际缺陷样本为同一样本,表明本模型可以通过样本工艺参数的数值分布对缺陷样本进行识别,也说明可以通过对缺陷样本工艺参数的数值分布分析工艺参数各自的风险系数。
[0077]
步骤3:经步骤2确定的缺陷样本的位置与实际位置进行比对确认无误之后,在样本集中对缺陷进行标定,然后计算样本中各工艺参数对缺陷样本spe统计量的贡献值,结果如图5所示。
[0078][0079]
步骤4:根据步骤3计算得到各工艺参数对缺陷样本spe统计量的贡献值,进行统计量到风险系数的转变,将工艺参数贡献值于工艺参数贡献值总值的占比此作为各工艺参数最终的风险系数,风险系数rpni转化关系如下:
[0080][0081]
计算后,将风险系数进行呈现,如图6所示。
[0082]
图6显示了缺陷样本各个工艺参数的风险系数,并且可以找到风险系数最大的两个工艺参数:f1轧制力头部偏差、f5工作窜辊量,其风险系数分别为(41.3,22.3),结合分析缺陷样本f1轧制力头部偏差、f5工作窜辊量参数数值与优秀样本发生较大偏离情况,如图7、图8,以及f1轧制力头部偏差、f5工作窜辊量两参数与质量参数具有较高的相关程度,可知分析结果准确。
[0083]
运用该方法流程建立的缺陷评估模型,用时3.8秒即可得到分析结果,极大地提高了缺陷分析效率。
[0084]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献