一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于Map图的不良根因分析方法与流程

2021-10-24 06:40:00 来源:中国专利 TAG:不良 方法 分析 半导体 制造业

一种基于map图的不良根因分析方法
技术领域
1.本发明属于显示面板,oled,tft

lcd,半导体制造业技术领域,具体为一种基于map图的不良根因分析方法。


背景技术:

2.半导体,面板领域的生产制造过程涉及的工艺复杂,制程繁多,每道工艺和制程涉及到不同的站点、机组、机台、工具等,而这些生产设备又对应很多相关的参数,一般可达上万个,且数据量巨大。当良率问题发生时,需要快速定位引起良率损失的机台及其对应的参数;对异常参数进行调整,保证机台正常运行,解决良率损失问题。目前,对良率问题的问题参数查找及分析方法,主要依赖于有经验的工程师从数据库中挑出问题产品的不良率数据及参数数据,进行参数相关性分析及问题排查,属于事后静态分析,自动化程度低,存在较大的时间滞后,定位精度较粗糙,且效率低下,费时费力。随着设备自动化程度的提高,各种生成过程参数的自动采集,上传和存储,利用大数据分析和数据挖掘算法,实现自动分析不良率数据和参数数据,快速准确定位问题参数,识别因子的异常波动水平,对于设备预测维护,缩短故障发生时排查时间,提高产品良率,降低生产成本,提高生产制造商的竞争力,具有非常现实的意义。


技术实现要素:

3.(一)解决的技术问题
4.本发明的发明目的是:为了辅助人工实现快速自动查找和定位引起生产过程良率损失的异常参数因子及因子波动异常水平,提出了一种基于map图的不良根因分析方法。
5.(二)技术方案
6.本发明的技术方案为:一种基于map图的不良根因分析方法,包括以下步骤:
7.s1、获取产品不良率数据和参数数据;这里产品是指经整个生产制造过程加工后的输出单元,一般是单片glass、half

glass或single

cell,每个产品具有唯一的产品id以区别不同产品;不良率是产品生产完成后或生产过程中,对其尺寸上采样不同点位进行电学、光学、外观等性能测试,测试未通过点位数量同总的测试点位数量的比值。参数数据是产品流经整个生产制造过程中,各个站点、设备、工具、环境对应的各种参数数据。一笔数据由产品id、产品不良率、站点名、设备名、参数名及对应参数取值组成,是一个高维数据;获取产品数据由程序定时自动查取最近一段时间内生产的产品数据。
8.s2、对s1中获取的数据进行预处理,步骤包括数据中的缺失值的处理,其方法根据参数取值中数据缺失率不同区别处理,如果某个参数缺失率大于50%,则剔除该参数,否则采用插值的方式插入参数均值;对数据中冗余数据列进行剔除;对稳定值的处理,其方法通过计算参数取不同值的个数,如果参数只取得1个值,将该参数剔除;对参数离群值进行处理,其方法是计算参数取值的上限阈值,将超过上限阈值的参数剔除;对参数数据量进行控制,其方法是对某个参数,其数据量需要大于一定阈值,将小于阈值数量的参数剔除。
9.优选的,所述s2中对离群值的处理,其阈值公式为:
10.bond=q3 20*iqr,iqr=q3

q1
11.其中bond为阈值,q1,q3分别为不良率取值的1/4和3/4分位数。
12.可选的,所述s2中参数数据量控制所采用的阈值设置为20。
13.s3、数据打标签,对所有数据按不良率取值计算出一个阈值,对每一笔数据将高于阈值的数据标签设为bad,标记为0,将低于阈值的数据标签设置为good,标记为1;
14.优选的,所述s3中的阈值公式为:
15.bond=q3 n*iqr,iqr=q3

q1
16.其中bond为阈值,q1,q3分别为不良率取值的1/4和3/4分位数,n为控制因子,可以调节控制bond的大小。
17.s4、对s3预处理后的数据分组,其方法是将数据按站点、设备、参数、标签进行分组,分组完成后,同一个站点

设备

参数的产品数据归为一类,同一类数据又按标签分为good和bad两组数据,每组数据包括两部分,一部分是不良率数据组成的列表1,一部分是参数取值组成的列表2;列表1中数据表示归属于同一参数和标签下各个产品不良率的取值列表;列表2中数据表示归属于同一参数和标签下各个产品对应该参数的参数取值列表。
18.s5、数据规则设计,其步骤为分别设计规则1衡量同一参数归为good组的参数值列表同bad组的参数值列表差异性大小的规则p_value;规则2衡量同一参数归为good组的参数值列表同bad组的参数值列表距离尺度的规则d_value;规则3衡量参数值列表同不良率取值列表相关性大小的规则c_value;规则4衡量同一参数归为good组的参数值列表同bad组的参数值列表数据量尺度的n_value;规则5衡量参数数值取值分布范围的规则l_value。
19.优选的,s5中规则1中p_value的计算采用基于秩序的假设检验的方法,这里使用kruskal

wallis检验(kw检验),包括但不限于其他类似的假设检验方法;
20.规则2中d_value的计算采用计算good组中参数列表的均值avg_g,bad组中参数列表的均值avg_b,d_value=|(avg_b

avg_g)/avg_g|;
21.规则3中c_value的计算采用相关性计算的方法,包括但不限于皮尔逊相关系数或线性回归的方法;
22.规则4中n_value的计算公式为:
23.n_value=n_bad/(n_bad n_good),其中,n_bad是对某一参数,归为bad组的参数值列表中的数据项个数;n_good是对某一参数,归为good组的参数值列表中的数据项个数;
24.可选的,s5中的规则是可以扩展的,可以设计增加更多指标。
25.s6、参数规则计算及融合,其方法是将s4中分组后的数据,对其中每个参数,按照s5中设计的规则,分别计算对应的规则指标取值结果;将规则结果加权求和作为该参数规则融合后的得分score,每个参数对应于一个得分;s6输出为一个规则得分表,每一行对应一个站点,设备,参数及规则得分。
26.s7、参数定位,其方法是将s6中计算后的规则得分表按得分由高到底降序排序,排名靠前的即对应要定位的站点设备参数;可以取排名前5或前10的参数作为定位参数,作为定位结果。
27.s8、对s7定位出的参数进行因子波动范围的水平划分,计算出可能的异常取值区间,其步骤是对定位的参数,根据s4分组的结果,找到该参数归于bad组中参数取值列表;对
列表中的数据进行聚类分析,将列表中样本划分为多个类;选择数据量最大的一个类作为目标类;挑选出目标类中的最小值和最大值作为参数水平。
28.优选的,s8中聚类算法选择dbscan密度聚类。
29.(三)有益效果
30.本发明提供了一种基于map图的不良根因分析方法。具备以下有益效果:
31.(1)、现有的根因参数方法,均是在良率损失发生后进行的手动或半自动的相关分析方法,本发明实现的方法是一种可进行自动分析的方法,可以定时执行本方法进行自动的、预测性的根因定位分析。
32.(2)、目前已有的文献中,分析方法均是直接用产品数据的不良率和参数进行相关性分析,其结果往往受到大量good产品数据的干扰,本方法使用的数据按标签分组的方法,对产品数据根据不良率打标签分组后进行分析,克服了该缺点;
33.(3)在已有文献中,根因参数的定位主要采用参数同不良率的相关性分析,这种方法仅仅考虑了数据之间的相关性,其缺点是数据量很大时,相关性结果往往表现很差,并不能真实反映参数同不良率之间的关系,并且只使用了数据的少量信息。为此,本发明采用设计了多种规则打分的方法,融合了数据间的相关性,差异性,数据统计量之间的距离,数据量及数据分布的综合信息,克服了上述方法的缺点,信息融合使得数据利用率更高;根据融合后的信息进行参数定位,使得根因参数定位更加准确、实用和高效;
34.(4)现有的参数因子波动水平划分,主要是通过可视化的方法,将参数因子分布绘图后,通过观察进行水平划分,非常低效,划分区间模糊,精度低,无法进行自动化操作。本方法使用的密度聚类进行划分的方法,可以自动的,快速的对参数因子进行波动区间水平划分,划分结果更加准确,对于快速改进参数指标,提升良率有显著的提升效果。
附图说明
35.图1为本发明的流程图;
36.图2为本发明涉及的数据预处理模块;
37.图3为本发明涉及的规则计算过程示意图;;
38.图4为一个可参考的规则计算结果表;
39.图5为一个可参考的参数水平划分示意图。
具体实施方式
40.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
41.所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
42.本发明提供一种技术方案:一种基于map图的不良根因分析方法,如图1所示,包括以下步骤:
43.s1:获取一段时间内生产产品的不良率及其过程参数数据。
44.s2:对应图2所示,对获取的数据进行预处理,步骤包括数据中的缺失值的处理,统
计每个参数取值缺失的数量,计算每个参数取值的均值,如果某个参数缺失率大于50%时,则剔除该参数,否则采用插值的方式插入参数的均值;对冗余数据项进行剔除;对稳定值的处理,统计参数取不同值的个数,如果参数只取得1个值,则将该参数剔除;对参数离群值进行处理,计算参数取值的上限阈值,超过阈值的参数判断为的错误数据,剔除;对参数数据量进行控制,统计每个参数对应的数据量,将数据量大于阈值20的参数保留,否则剔除。
45.对离群值的处理,其阈值公式为:
46.bond=q3 20*iqr,iqr=q3

q1
47.其中bond为阈值,q1,q3分别为不良率取值的1/4和3/4分位数,n为控制因子,可以调节控制bond的大小。
48.s3:对预处理后的数据打标签,根据不良率取值范围设置一个不良阈值,将高于阈值的数据标签设为bad,标记0,将低于阈值的数据标签设置为good,标记1;
49.阈值计算公式为:
50.bond=q3 n*iqr,iqr=q3

q1
51.其中bond为阈值,q1,q3分别为不良率取值的1/4和3/4分位数,n取为1。
52.s4:数据分组,将步骤三处理的数据按站点,设备,参数,标签进行分组,分组完成后,同一个站点

设备

参数的产品数据归为一类,同一类数据又分为good和bad两组数据,每组数据包括两部分,一部分是不良率数据组成的表1,一部分是参数取值组成的表2;
53.s5:数据规则设计,分别设计5个规则,包括规则1衡量同一参数归为good组的参数值列表同bad组的参数值列表差异性大小的规则;规则2衡量同一参数归为good组的参数值列表同bad组的参数值列表距离尺度的规则;规则3衡量参数值列表同不良率取值列表相关性大小的规则;规则4衡量衡量同一参数归为good组的参数值列表同bad组的参数值列表数据量尺度的规则;衡量参数值取值范围的规则。
54.s6:如图3所示,对第四步分组后的数据按第五步设计的参数规则进行计算和融合,对其中每个参数,分别计算5个规则指标结果;将结果加权求和作为该参数的得分score,每个参数对应于一个得分;得到一个参数的规则得分表,每一行对应一个站点,设备,参数名及规则得分
55.s7:参数定位,对第六步计算后的规则得分表按规则得分由高到底降序排序,排名靠前的即对应要定位的站点设备参数;取排名前5的参数作为定位参数,结果参考图4。
56.s8:对第七步定位出的参数进行因子波动范围的水平划分,自动划分出异常取值区间,根据第四步分组的结果,找到参数对应的分组数据,取出归于bad组中参数取值表;对列表中的数据进行dbscan密度聚类分析,将列表中样本划分为多个类;选择数据量最大的一个类作为目标类;挑选出目标类中的参数数据的最小值和最大值作为参数水平,可参考图5。
57.本发明针对良率损失的根因分析,构建了一种基于信息融合的根因参数快速定位方法,传统的方法仅从参数同不良率之间的相关性或者单一的数据维度进行分析,数据利用率低,参数定位精度低,且无法自动化操作。为此,本发明对数据进行了标签化和分组,提高了数据分析的针对性,同时设计了不同的规则组合,融合了不良率数据和参数数据各方面的特性和信息,能够综合而全面的考虑两者之间的关系,从而使问题参数的定位更加准确。同时,为了确定问题参数的异常波动范围,提出了基于聚类的因子水平划分方法,相较
于现有的可视化判定的方法,可以实现自动化分析。相较于现有的问题参数定位和因子水平划分技术,本发明是一种自动、高效、准确的根因参数定位和因子水平划分方法。
58.以上所述仅为本发明较佳的一个具体实施案例,对于本领域技术人员而言,可以显见的,本发明不限于上述示范性实施例的细节,而且在不背离本发明精神或基本特征的情况下,能够以其他具体的形式实现本发明。因此,无论从哪一点看,均应将实施例看做示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将所有落在权利要求的等同要件的含义和范围内的所有变化均囊括在本发明的范围之内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。此外不应将权利要求及实施例中所有附图标记视为限制所涉及的权利要求。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜