一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于数据驱动的注塑制品尺寸合格性智能判定方法

2022-06-01 06:11:05 来源:中国专利 TAG:


1.本发明属于注塑成型技术领域,具体涉及一种基于数据驱动的注塑制品尺寸合格性智能判定方法。


背景技术:

2.塑料具有可塑性好,冲击强度较高,化学稳定性良好等特点,因此塑料制品广泛应用于各个行业、领域,其中通过注塑成型工艺制造的塑料产品占了60%以上。而随着互联网技术的不断更新,互联网 智能制造的概念与注塑成型工艺联系越来越密切。
3.注塑制品的质量涉及的因素众多,各个因素之间的相互影响,想要对注塑制品的某一指标进行直接判定,传统的凭借有限的经验和简单的公式的方法稳定性差、准确率低、效率低的弊端已经越来越明显。因此在互联网 智能制造的大环境出现了基于数据驱动的智能方法,基于数据驱动的智能方法不仅可以对注塑机的机台故障进行预测,还能对注塑制品的一些指标进行直接判定。
4.注塑制品的尺寸是注塑制品质量检测的重点,国内现阶段对注塑制品尺寸合格性的判定主要依靠人工进行检测,人工检测需要人工使用检测工具对注塑制品的尺寸进行测量,不仅速度慢、人力和物力投入巨大,而且容易造成漏判和误判,因此以注塑加工过程中的数据作为驱动,建立适合注塑数据集的分类模型对注塑制品的尺寸进行分类是亟待解决的问题。


技术实现要素:

5.本发明的主要目的在于克服现有技术的缺点与不足,提出一种基于数据驱动的注塑制品尺寸合格性智能判定方法,以解决人工对注塑制品尺寸合格性检测效率低,准确率低的问题。
6.为了达到上述目的,本发明采用以下技术方案:
7.基于数据驱动的注塑制品尺寸合格性智能判定方法,包括以下步骤:
8.s1、采集注塑加工过程中的过程数据,对采集的数据集进行数据清洗,对数据集进行标准化处理并重构标签;
9.s2、利用采集所得的数据集,使用基于树模型的特征筛选方法和卡方检测特征筛选方法,确定特征筛选的维度,筛选特征;
10.s3、采用5折交叉验证筛选出分类模型,并以roc曲线和auc值对筛选出的尺寸分类模型的分类性能进行评估,得到最佳尺寸分类模型;
11.s4、在最佳尺寸分类模型的损失函数中加入l1正则化防止过拟合;
12.s5、对最佳尺寸分类模型进行贝叶斯优化,选择最适合于注塑数据集的超参数,提升分类模型的分类准确率;
13.s6、将最佳尺寸分类模型应用于注塑制品尺寸合格性智能判定,对特征影响注塑制品尺寸的重要程度进行排序,当注塑制品的尺寸出现问题时,可以帮助判断出故障的区
域,减少故障排查的时间。
14.进一步的,步骤s1中,数据清洗包括对缺失值进行填充或删除,构造差值特征以及删除不变特征。
15.进一步的,步骤s1中,标准化处理具体为:
16.使用min-max标准化对原始采集数据进行线性变化,使结果值映射到[0,1]之间,计算公式为:
[0017][0018]
其中,x表示原始的数值,x
*
表示标准化后的数值,min表示整个特征中最小的数值,max表示整个特征中最大的数值。
[0019]
进一步的,步骤s1中,重构标签具体为:
[0020]
当注塑制品的尺寸数据在允许的公差范围内时,将标签标记为1,当注塑制品的尺寸数据在允许的公差范围外时,将标签标记为0。
[0021]
进一步的,步骤s2中,基于树模型的特征筛选具体为:
[0022]
通过基尼不纯度的变化量来对特征的重要程度进行排序,计算公式为:
[0023][0024]
δgini(a)=gini(d)-gini(d-a)
[0025]
其中,gini(d)表示数据集d的基尼不纯度,pi表示类别为i的样本占总数的概率,δgini(d-a)为加入特征a以后的基尼不纯度的减少量,该值越大表明特征a与标签的相关性越大,gini(d-a)为数据集d确定特征a以后的基尼不纯度;
[0026]
卡方检测特征筛选方法具体为:
[0027]
通过卡方值的大小来对特征的重要程度进行排序,计算公式为:
[0028][0029]
其中,xi表示实际值,e表示理论值。
[0030]
进一步的,步骤s2中,确定特征筛选的维度具体为:
[0031]
当使用基于树模型的特征筛选方法时,以δgini的平均值为阈值;当使用卡方检测特征筛选方法时,以卡方值的平均值为阈值。
[0032]
进一步的,步骤s3中,5折交叉验证方法具体为:
[0033]
将注塑数据集切分成5份数据集,计算5次mse的平均值,以平均mse筛选常用于工业数据的现有的分类模型。
[0034]
进一步的,步骤s3中,以roc曲线和auc值对筛选出的尺寸分类模型的分类性能进行评估,具体为:
[0035]
对以下指标进行评估:真正类tp、漏判fp、误判fn、真负类tn、合格品被分类为合格品的样本占所有合格品的比率tpr、不合格品被分类为合格品的样本占所有不合格品的比率fpr以及准确率accuracy。
[0036]
进一步的,步骤s4具体为:
[0037]
在lr模型的损失函数中加入l1正则化,防止模型过拟合,损失函数的公式为:
[0038][0039]
其中,||ω||1为l1正则化项,α为正则化项前的系数。
[0040]
进一步的,步骤s5中,使用贝叶斯优化方法对尺寸分类模型的超参数进行优化,得到最适合注塑制品尺寸数据集的超参数,得到最好的尺寸分类模型,使得分类的准确率最高。
[0041]
本发明与现有技术相比,具有如下优点和有益效果:
[0042]
1、本发明以注塑过程数据集为驱动,结合机器学习的分类模型直接对注塑制品的尺寸的合格性进行智能判定,基于此,其中对于数据集中的尺寸数据进行了重构,以合格与不合格作为标签;对比不同特征筛选和模型的组合,筛选出最适合注塑制品尺寸的分类模型;对于注塑数据集中监测参数可以由工艺参数线性或者非线性表示而造成模型过拟合的现象,在模型的损失函数中加入l1正则化,使用稀疏矩阵防止模型过拟合;最后对整个模型进行贝叶斯优化,选择最适合注塑数据集的超参数值,提升分类模型的分类准确率;通过基于树模型的特征筛选方法对影响尺寸的特征的重要性进行排序,当注塑制品的尺寸不合格时,可以优先检查影响注塑制品尺寸较大的因素,缩短检修的时间。
附图说明
[0043]
图1是本发明方法的流程图;
[0044]
图2是5折交叉验证的流程图;
[0045]
图3是与基于树模型的特征筛选结合的分类模型roc曲线;
[0046]
图4是与卡方检测特征筛选结合的分类模型roc曲线;
[0047]
图5是基于树模型特征筛选对特征重要性排序。
具体实施方式
[0048]
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0049]
实施例
[0050]
如图1所示,本发明,基于数据驱动的注塑制品尺寸合格性智能判定方法,包括以下步骤:
[0051]
s1、采集注塑加工过程中的过程数据,对采集的数据集进行数据清洗,对数据集进行标准化处理并重构标签;
[0052]
其中,数据清洗包括对缺失值进行填充或删除,构造差值特征以及删除不变特征等。本实施例中,对每一个特征中的缺失值进行统计,当特征中的缺失值大于50%时,删除该特征,当缺失值小于50%时,使用均值对缺失值进行填充。
[0053]
标准化处理具体为:
[0054]
使用min-max标准化对原始数据进行线性变化,使结果值映射到[0,1]之间,所述计算公式为:
[0055][0056]
其中,x表示原始的数值,x
*
表示标准化后的数值,min表示整个特征中最小的数值,max表示整个特征中最大的数值。
[0057]
重构标签具体为:
[0058]
当注塑制品的尺寸数据在允许的公差范围内时,将标签标记为1,当注塑制品的尺寸数据在允许的公差范围外时,将标签标记为0。
[0059]
s2、利用采集所得的数据集,使用基于树模型的特征筛选方法和卡方检测特征筛选方法,确定特征筛选的维度,筛选特征,降低输入数据的维度;
[0060]
基于树模型的特征筛选具体为:
[0061]
通过基尼不纯度的变化量来对特征的重要程度进行排序,计算公式为:
[0062][0063]
δgini(a)=gini(d)-gini(d-a)
[0064]
其中,gini(d)表示数据集d的基尼不纯度,pi表示类别为i的样本占总数的概率,δgini(d-a)为加入特征a以后的基尼不纯度的减少量,该值越大表明特征a与标签的相关性越大,gini(d-a)为数据集d确定特征a以后的基尼不纯度;
[0065]
卡方检测特征筛选方法具体为:
[0066]
通过卡方值的大小来对特征的重要程度进行排序,计算公式为:
[0067][0068]
其中,xi表示实际值,e表示理论值。
[0069]
本实施例中,确定特征筛选的维度具体为:
[0070]
当使用基于树模型的特征筛选方法时,以δgini的平均值为阈值,筛选出大于阈值的特征,得到19维特征;当使用卡方检测特征筛选方法时,以卡方值的平均值为阈值,筛选出卡方值大于阈值的特征,得到19维特征,综合以上两种特征筛选方法得到的特征维度都为19,最终确定筛选的特征维度为19。
[0071]
s3、采用5折交叉验证筛选出分类模型,并以roc曲线和auc值对筛选出的分类模型的分类性能进行评估,得到最佳的分类模型;
[0072]
5折交叉验证方法具体为:
[0073]
将注塑数据集切分成5份数据集,计算5次mse的平均值,以平均mse筛选分类模型。
[0074]
本实施例中,如图2所示,通过将训练集切分成5份数据集,每次取出一个数据集作为测试集,其他4份数据集作为训练集,总共计算5次,每次都能得到一个mse,最终计算5个mse的平均值,所述计算公式为:
[0075][0076]
得到了7个分类模型的平均mse,如下表1所示。
[0077][0078]
表1
[0079]
计算七个模型的平均值为0.951,以0.951为阈值,选择大于该阈值的分类模型,完成初步的筛选。
[0080]
以roc曲线和auc值对筛选出的分类模型的分类性能进行评估,具体为:
[0081]
对以下指标进行评估,真正类tp、漏判fp、误判fn、真负类tn、合格品被分类为合格品的样本占所有合格品的比率tpr、不合格品被分类为合格品的样本占所有不合格品的比率fpr以及准确率accuracy;其中,指标计算公式为:
[0082][0083][0084][0085]
在步骤s4中,得到基于树模型的特征筛选方法和分类模型组合下的roc曲线如图3所示,基于卡方检测的特征筛选方法和分类模型组合下的roc曲线如图4所示,对比两组roc曲线发现无论是在树模型的特征筛选方法下还是卡方检测的特征筛选下lr模型的roc曲线最接近(0,1)点,说明lr模型更加适合注塑制品的尺寸分类。得到的基于两种特征筛选下的auc值如下表2所示,对比两个特征筛选下的auc值发现基于树模型的特征筛选下各个模型的auc值普遍高于基于卡方检测的特征筛选,所以基于树模型的特征筛选方法更加适合注塑制品尺寸合格性的分类。
[0086][0087]
表2
[0088]
s4、在分类模型的损失函数中加入l1正则化防止过拟合;
[0089]
由于注塑数据集上容易产生多重共线性的问题,注塑数据中的监测参数可以由机台参数线性或者非线性表示,比如喷嘴压力与射出起点、注射最大压力、熔胶时间等有关;模腔内温度与模具温度、炮筒温度、热流道温度等有关。这些参数在拟合模型时彼此之间相互干扰容易造成模型的过拟合,因此在lr模型的损失函数中加入l1正则化,通过稀疏矩阵有效防止模型过拟合,所述损失函数的公式为:
[0090][0091]
其中,||ω||1为l1正则化项,α为正则化项前的系数。
[0092]
s5、对分类模型进行贝叶斯优化,选择最适合于注塑数据集的超参数,提升模型的分类准确率;
[0093]
使用贝叶斯优化方法对最终的模型的超参数,如正则项系数、类型权重参数等进行优化,贝叶斯优化主要通过高斯过程回归计算每一点处函数值的均值和方差,再根据均值和方差构造采集函数,决定每次迭代在哪个点处进行采样,通过不断迭代得到最适合注塑制品尺寸数据集的超参数,得到最好的尺寸分类模型,使得分类的准确率最高。如下表3所示,是优化前后的对比。
[0094][0095]
表3
[0096]
s6、将最佳分类模型应用于注塑制品尺寸合格性智能判定,对特征影响注塑制品尺寸的重要程度进行排序,当注塑制品的尺寸出现问题时,可以帮助判断出故障的区域,减少故障排查的时间。
[0097]
得到的最佳的注塑制品尺寸分类模型,通过模型中的基于树模型的特征筛选方法对特征进行重要程度排序,如图5所示,可以看出由于传感器采集的数据更加贴近生产实际,所以尺寸对传感器采集的数据更加敏感,从图中可以看出喷嘴压力是影响尺寸最大的因素,然后是模腔内的压力和模温机的循环水温度,所以当注塑制品的尺寸出现问题时,优先查看喷嘴是否已经损坏,模具是否破损、模温机是否正常运行,来帮助故障排查,减少检修的时间。
[0098]
还需要说明的是,在本说明书中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0099]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献