一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于Wasserstein距离的早期故障检测方法

2022-07-10 14:08:53 来源:中国专利 TAG:

一种基于wasserstein距离的早期故障检测方法
【技术领域】
1.本发明属于工业控制系统中的过程监控及故障诊断领域的一种监测方法,具体涉及一种基于wasserstein距离的早期故障检测方法。


背景技术:

2.21世纪以来,日益激烈的全球市场竞争对现代工业的生产效率、生产安全、产品质量等指标提出了更高的要求,形成了许多规模巨大的生产系统和高度复杂的生产过程;然而,随着生产系统逐渐复杂化、大规模化的同时,生产过程中产生故障的可能性显著增加,若对故障缺乏有效的检测和控制,可能会导致降低产品的质量、增加生产的成本、引起设备的损坏等严重后果。
3.为了处理大规模工业过程中的数据集,研究了不同的工业故障检测方法,如主成分分析(pca)和偏最小二乘分析(pls)等,这些方法通常将数据投影到主元空间和残差空间进行故障检测,利用对应的统计量对两个空间中的数据进行监测,一旦数据超过统计量的控制限,则检测到故障发生。
4.经证实,他们对多元正态分布的数据有较高的检测性能;然而,大规模工业过程采集的数据往往呈现出大量的非高斯性,从而使得传统的故障检测模型失效;此外,传统的故障检测模型对于早期故障的监测灵敏度不高,无法在故障出现的早期发出预警。
5.因此,为了保证工业生产过程的可靠性和安全性,提高故障监测的性能,基于度量学习的故障检测方法受到了极大的关注,通过分析正常数据和异常数据之间的差异性,能够产生更加精确的故障检测结果,其中马氏距离、kullback
‑ꢀ
leibler散度等度量方法已被广泛用于故障检测领域。
6.最近研究发现,基于最优传输原理的wasserstein距离在度量数据集之间的差异性中有着其他度量方法所不具备的优势,这一发现启发了wasserstein距离在工业故障检测中的应用;在大工业生产过程中,基于wasserstein距离的故障检测方法能够及时的检测早期故障的产生,对故障的检测有着较高的灵敏度,因此,对于检测大工业过程的故障有着十分重要的实用价值。


技术实现要素:

7.针对上述现有技术中传统的故障检测模型对于早期故障的监测灵敏度不高,无法在故障出现的早期发出预警的技术问题,本发明的目的是通过提供了一种基于wasserstein距离的早期故障检测方法,通过度量数据之间的wasserstein距离,达到早期故障检测的目的;并且本方法适用于具有复杂大规模的工业生产系统的早期故障检测问题,对推动流程工业知识自动化和工业大数据技术的发展有着重要的意义;同时本方法的研究针对高斯非高斯分布的数据特性,能够满足工业生产过程对大规模数据集的求解速度和精度要求,为工业生产系统的早期故障检测提供了可靠有效的技术支持。
8.为了达到上述目的,本发明提供了以下技术方案:
9.一种基于wasserstein距离的早期故障检测方法,包括以下步骤:
10.s1,通过传感器采集正常工况下流程工业生产过程中的过程变量作为训练数据;通过传感器采集待测工况下流程工业生产过程中的数据作为测试数据;通过主成分分析算法将两组数据中的高维数据投影到主元空间和残差空间内,并在主元空间内建立投影鲁棒性wasserstein距离模型;通过采用主成分分析算法将高维数据进行降维处理,使之能以一个较高的精度转换成低维数据,降低了工作量同时并不会因为降维处理的计算影响结果的精确性,提升了工作效率;另外,建立投影鲁棒性wasserstein距离计算模型的目的是为了使得主元空间内的投影数据之间的wsaaerstein距离尽可能小,从而保证计算结果的准确性;
11.s2,通过加入两项拉格朗日乘子向量构造投影鲁棒性wasserstein距离模型的对偶形式;对偶形式的块坐标参数包括两项拉格朗日乘子向量和主分析分析算法中的载荷矩阵;通过黎曼块坐标下降法求解模型参数,获得最优的载荷矩阵,并配合对应的wasserstein距离进行早期故障的检测;采用黎曼块坐标下降的方法可以在保留数据大部分信息的基础上尽可能减小数据维度,并且将黎曼流形与主成分分析方法结合,使得算法的求解速度得到快速提升,另外还引入了拉格朗日乘子,缩短了算法每部迭代的时间,有效降低大样本下的计算负荷,非常适用于复杂大规模工业数据的应用场合;
12.s3,分析主元空间和残差空间中的wasserstein距离的数据统计特性,并在主元空间和残差空间内建立基于假设检验的监测统计量,用于判断故障发生与否;当测试数据在主元空间和残差空间内的统计量均服从正常数据的概率分布,则服从零假设,认为没有故障;反之若不服从正常数据的概率分布,则拒绝零假设,认为故障发生;
13.s4,将s1中建立的投影鲁棒性wasserstein距离模型运用于在线故障监测故障系统中,保持训练数据集不变的情况下,对测试数据集采用滑动窗口的方法实现模型的在线监测功能;从而可以对搜索空间进行枝剪,减少重复计算同时也降低了时间复杂度。
14.进一步地,包括以下步骤:
15.s1.1,对训练数据进行归一化处理,得到零均值和单位方差的数据集z∈rn×d, n为训练数据的采样点数,d为变量数;
16.s1.2,利用s1.1中的标准数据建立主成分分析模型,用于保留标准数据集中超过95%的方差提取标准数据集中的k个主成分(pcs)以及特征向量矩阵其中为a载荷矩阵,包括k个主成分对应特征向量,代表剩下的非主元成分对应的特征向量;
17.s1.3,对测试数据进行归一化处理,得到零均值和单位方差的数据集 m为测试数据的采样点数;采用归一化的方法来处理训练数据和测试数据,提升了整个模型的收敛速度,提高工作效率的同时也保证模型的精度;
18.根据载荷矩阵a,训练数据z以及测试数据建立投影鲁棒性wasserstein距离计算模型,表示如下:
[0019][0020]
式中,‖
·
‖2表示向量2范数的平方,i和j分别代表训练数据和测试数据的采样点
索引,π代表运输方案,其中1代表全是1的n维向量,ε≥0为正则化参数,h(π)表示π的香农熵;
[0021]
通过stiefel流形约束进行求解,表示如下:
[0022][0023]
式中m为stiefel流形,m≡st(d,k)={a∈rd×k|a
t
a=ik×k};由于该优化问题在欧式空间中非凸,不能采用传统的优化方法进行求解,且投影矩阵具有正交性,因此将该优化问题看作式黎曼空间上的优化问题,通过stiefel流形约束进行求解,从而保证了所有迭代点保持约束可行性,并且对收敛性的分析更加方便高效。
[0024]
进一步地,通过构造模型的对偶形式,采用黎曼块坐标下降的方法对模型进行求解,包括以下步骤:
[0025]
s2.1,加入两项拉格朗日乘子,构造模型的对偶形式,表示如下:
[0026][0027]
式中,α和β表示两个拉格朗日乘子;
[0028]
s2.2,对π求偏导置零后带入上式可以使得上述优化问题的目标函数简化为:
[0029][0030]
式中u=-α/ε,v=-β/ε,exp(
·
)表示指数函数;目标函数中有三个块变量(u,v,a),而目标函数是关于(u,v,a)的光滑函数;由此利用黎曼块坐标下降的思想,通过交替更新的方法,可以求得最小的g以及对应的(u,v,a)。
[0031]
进一步地,载荷矩阵a将数据投影到主元空间,对应的将数据投影到残差空间,分析两个空间内的wasseretein距离的数据统计特性,建立监测统计量和w
spe
,表示如下:
[0032][0033][0034]
式中,tr(
·
)代表矩阵的迹,通过核密度估计函数计算出和w
spe
的概率密度函数,通过它们的概率密度函数的上分位点就可以设置对应的监测控制限。
[0035]
上述技术方案相比现有技术所具有的技术效果:
[0036]
1、采用wasserstein距离作为度量方法进行工业故障的检测,将主成分分析与 wasserstein距离结合,构造了投影鲁棒性wasserstein距离的计算方法,实现在流程工业知识自动化方面的创新
[0037]
2、用黎曼块坐标下降算法对模型进行求解,解决了wasserstein距离对于高维非高斯数据难以计算的问题;通过对模型施加黎曼流形内的约束加快了算法的运算速度,同时引入的拉格朗日乘子能够有效的减少算法在迭代过程中的运算步骤,实现了算法上的创
新。
[0038]
3、wasserstein距离对早期故障有着非常高的灵敏度,且投影鲁棒性wasserstein 距离的计算方法具备良好的抗噪声和干扰能力,有利于工程技术人员准确有效的在故障发生的早期检测到故障,进而及时做出生产上的调整。
【附图说明】
[0039]
图1为本发明涉及的整体示意图;
[0040]
图2为本发明涉及举例的两个概率密度之间的运输方案;
[0041]
图3为本发明涉及的基于pca的早期故障检测结果;
[0042]
图4为本发明涉及的基于wasserstein距离的早期故障监测结果。
【具体实施方式】
[0043]
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本发明进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
[0044]
在本发明的描述中,需要说明的是,对于方位词,如术语“上”、“下”、“左”、“右”、“轴向”、“径向”、“竖直”等指示方位和位置关系为基于附图所示的方位和位置关系,仅是为了便于叙述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定方位构造和操作,不能理解为限制本发明的具体保护范围。
[0045]
此外,如有术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或隐含指明技术特征的数量。由此,限定有“第一”、“第二”特征可以明示或者隐含包括一个或者多个该特征,在本发明的描述中,“数个”的含义是两个或两个以上,除非另有明确具体的限定。
[0046]
在发明中,除另有明确规定和限定,如有术语“组装”、“相连”、“连接”术语,就作广义去理解,例如,可以是固定连接,也可以是可拆卸连接,或一体连接;也可以是机械连接;可以是直接相连,也可以是通过中间媒介相连,可以是两个元件内部相连通。对于本领域普通技术人员而言,可以根据具体情况理解上述的术语在本发明中的具体含义。
[0047]
现如今,在处理大规模过程中的数据集,研究了不同的工业故障检测方法,这些方法对多元正太分布的数据有较高的检测性能,但是大规模工业过程采集的数据往往呈现出大量的非高斯性,从而使得传统的故障检测模型失效,并且传统的故障检测模型对于早期故障的检测灵敏度不高,无法在故障出现的早期发出预警,为了保证工业生产过程中的可靠性和安全性,提高故障检测的性能和测试,基于度量学习的故障检测方法受到了极大的关注,而在本实施例中提到的基于最优传输原理的wasserstein距离在度量数据集之间的差异性中有着其他度量方法不具备的优势,通过度量数据之间的wasserstein距离,达到故障检测的目的,对推动流程工业知识自动化和工业大数据技术的发展有着重要的意义。
[0048]
本实施例中利用wasserstein距离作为度量方法,度量正常工况下的数据集于故障工况下的数据集之间的差异性,以此构建基于wasserstein距离的早期故障检测方法,通过主成分分析算法对数据进行降维之后,利用黎曼块坐标下降的方法求解低维空间内的
wasserstein距离,并根据其数据特性建立过程监测统计量,当某一时刻的采样点计算出的wasserstein距离超过监测计量的控制限则代表工业生产过程中出现了故障,以此实现早期工业故障检测。
[0049]
为了方便说明本技术方案,以玻璃熔制的实际工作过程为例,基于操作过程记录的真实数据,对过程变量的早期故障检测方法做详细描述。
[0050]
工业熔融工艺是处理工艺的一部分,其中粉末(废料)被包裹在玻璃中,熔化器容器连续填充粉末,熔融玻璃以粉末的形式引入原料,然后利用四个位于容器周围的感应线圈加热;在加热过程中,玻璃均匀熔融,填充和加热过程使得液体柱不断增加,直到达到所需的液柱高度;在此阶段,熔融混合物通过出口漏斗倒出,直到容器被清空;在容器排空到喷嘴的高度后,下一个填充和加热循环开始。
[0051][0052]
表1玻璃熔制的变量
[0053]
玻璃熔制的过程共涉及14个变量,具体描述如表1所示,变量编号1~8表示熔制时8个温度的变化;变量编号9~12表示感应线圈中的功率大小;变量编号13表示熔制玻璃的粘度;变量编号14表示提供给感应线圈的电压。每个过程变量每隔5分钟采集一次样本,共采集了1010个样本点,其中包括780个正常样本和230个故障样本,故障来源于熔制过程中熔体内部出现的裂纹,在最后15个采样点中,裂纹的产生使得其中一个热电偶失效;此外,样本数据呈现非高斯性,且在较长的采样周期内变量之间没有呈现出明显的相关性。
[0054]
针对上述玻璃熔制的过程,运用基于wasserstein距离的早期故障检测方法来对玻璃熔制流程中的过程变量进行监测,并且如图2所示,制定了如下步骤:
[0055]
s1,通过传感器采集正常工况下玻璃熔制过程中的过程变量作为训练数据,其中训练数据是由数据样本构成的,每个数据样本包含了采集时刻下的各个过程变量,即在玻璃熔制过程中所采集的1010个样本点;通过传感器采集待测工况下玻璃熔制生产过程中的数据作为测试数据;根据采集到的两组数据,通过主成分分析(pca)算法将采集到的两组数据中的高维数据投影到主元空间和残差空间内,采用主成分分析算法将高维数据进行降维处理,使之能以一个较高的精度转换成低维数据,降低了工作量同时并不会因为降维处理的计算影响结果的精确性,提升了工作效率;由于主元空间保留了原始数据的绝大部分信息,因此在主元空间内建立投影鲁棒性wasserstein距离模型,确保了整个模型的健壮性,使得模型在遇到导致程序崩溃的情况下还能正常工作不至于死机,提高了整个模型的安全可靠性;将主成分分析与wasserstein距离结合所构造的投影鲁棒性 wasserstein距离的计算方法,在流程工业知识自动化方面实现了创新,并且实现了使得主元空间内的投影数据之间的wasserstein距离尽可能小的目的。
[0056]
其中主成分分析算法的处理步骤包括:
[0057]
s1.1,将训练数据进行归一化处理,得到零均值和单位方差的数据集z∈rn×d, n为
训练数据的采样点数,在本实施例玻璃熔制的过程中训练数据的采样点数为 780个,即取n=780,d为变量数;训练数据的作用是训练模型,为了方便整个模型中数据的使用,对训练数据采用归一化的处理方式,将数据映射到0~1的范围内进行处理,从而保证了模型计算的快捷快速,也提升了模型的精度。
[0058]
s1.2,利用s1.1中的标准数据建立主成分分析模型,提取k个主成分(pcs),使得提取的主成分能够保留原始数据95%以上的数据信息,从而最大可能的保证数据精确度,提高模型的精确度;此外,每个主成分和非主成分都对应有特征向量矩阵其中a为载荷矩阵,包括k个主成分对应特征向量,代表剩下的非主元成分对应的特征向量;在本实施例中,发现保留4个主成分(pcs) 可以解释大于95%的方差,因此将保留的主成分设为4个,即k等于4,并且将通过主成分分析方法,将u和v设为全是1的向量计算得到载荷矩阵a作为模型的初始化投影矩阵。
[0059]
s1.3,对测试数据进行归一化处理,得到零均值和单位方差的数据集 m为测试数据的采样点数;其中测试数据为230个故障样本,通过测试数据来检验模型是否能监测出早期故障,同样的,为了方便测试数据对模型的检验,对测试数据也采用了归一化的处理,进一步提高了模型计算的速度。
[0060]
再根据载荷矩阵a,训练数据z以及测试数据建立投影鲁棒性wasserstein 距离计算模型,表示如下:
[0061][0062]
式中,‖
·
‖2表示向量2范数的平方,i和j分别代表训练数据和测试数据的采样点索引,π代表运输方案,其中代表全是1的n维向量,ε≥0为正则化参数,h(π)表示π的香农熵;为了更好的解释运输方案π,如图1所示,该图为运输方案的热力图,其中上方的概率密度曲线表示r,右边的概率密度曲线表示c,热力图中颜色越深,代表该点从r运输到c的质量越多。
[0063]
通过stiefel流形约束进行求解,表示如下:
[0064][0065]
式中m为stiefel流形,m≡st(d,k)={a∈rd×k|a
t
a=ik×k};由于该优化问题在欧式空间中非凸,不能采用传统的优化方法进行求解,且投影矩阵具有正交性,因此将该优化问题看作式黎曼空间上的优化问题,通过stiefel流形约束进行求解,从而保证了所有迭代点保持约束可行性,并且对收敛性的分析更加方便高效。
[0066]
s2,通过加入两项拉格朗日乘子向量构造s1中所提到的投影鲁棒性 wasserstein距离模型的对偶形式,对偶形式共有三个块坐标参数,分别是两项拉格朗日乘子向量和主分析分析算法中的载荷矩阵;通过黎曼块坐标下降法求解模型参数,获得最优的载荷矩阵,并配合对应的wasserstein距离进行早期故障的检测;在本实施例中采用黎曼块坐标下降的方法是因为由于在复杂大规模工业过程中,由传感器采集到的数据往往呈现出多变量、非高斯、非线性、时变等特性,计算这些数据的wasserstein距离没有显式解,因此需要通过
降维算法在保留数据大部分信息的基础上尽可能减小数据维度,同时将黎曼流形与主成分分析方法相结合,加快算法求解速度,并引入拉格朗日乘子,缩短了算法每步迭代的时间,有效降低大样本下的计算负荷,非常适用于复杂大规模工业数据的应用场合。
[0067]
通过构造模型的对偶形式,其过程如下:
[0068]
s2.1,加入两项拉格朗日乘子,构造模型的对偶形式,表示如下:
[0069][0070]
式中,α和β表示两个拉格朗日乘子;
[0071]
s2.2,对π求偏导置零后带入上式可以使得上述优化问题的目标函数简化为:
[0072][0073]
式中u=-α/ε,v=-β/ε,exp(
·
)表示指数函数;目标函数中有三个块变量 (u,v,a),而目标函数是关于(u,v,a)的光滑函数;由此利用黎曼块坐标下降的思想,通过交替更新的方法,可以求得最小的g以及对应的(u,v,a)。
[0074]
s3,载荷矩阵a将数据投影到主元空间,对应的将数据投影到残差空间,分析两个空间内的wasserstein距离的数据统计特性,并建立基于假设检验的监测统计量和w
spe
,用于判断工业过程中是否发生了故障,当测试数据在主元空间和残差空间内的统计量均服从正常数据的概率分布,则服从零假设,认为没有故障产生;繁殖若不服从正常数据的概率分布,则拒绝零假设,认为故障发生。
[0075]
上述监测统计量表示如下:
[0076][0077][0078]
式中,tr(
·
)代表矩阵的迹,通过核密度估计函数计算出和w
spe
的概率密度函数,通过它们的概率密度函数的上分位点就可以设置对应的监测控制限;设置完监测控制限后,将统计量与监测控制限对比,从而保证了该统计量具有较高的灵敏度;当统计量均未超过控制限,则认为没有故障发生;反之若其中至少一个统计量超过了控制限,则认为故障发生,从而达到了早期故障检测的目的。
[0079]
s4,为了实现更好的运用,可将s1中建立的投影鲁棒性wasserstein距离模型运用于在线故障监测故障系统中,保持训练数据集不变的情况下,对测试数据采用滑动窗口的方法实现模型的在线监测功能,从而可以对搜索空间进行枝剪,减少重复计算的同时也降低了时间复杂度,实现了更好的运用。
[0080]
在本实施例中,针对玻璃熔制的实际过程设置黎曼块坐标下降算法中的参数,惩罚项参数ε=0.4,学习率τ=0.01,并且设置滑动窗口的窗宽为100个采样点,基于pca的故障监测结果如图3所示,基于wasserstein距离的故障检测结果如图4所示,其中第一曲线表示每个采样点的统计量大小,第二曲线表示各个统计量99%的控制限;对比图3和图4可见,基于wasserstein距离的故障检测方法能够在50个采样点左右检测到由于熔炉内产生裂纹
而引起的故障,而基于pca的故障检测方法只能检测出最后15个由于热电偶的失效而引起统计量显著变化的采样点;可以得出结论,wasserstein距离对于早期故障有着非常高的灵敏度,非常有利于工程技术人员准确有效的在故障发生的早期检测到故障,进而及时做出生产上的调整,以确保整个生产过程的顺利进行。
[0081]
最后,应当说明的是,在本实施例中以玻璃熔制实际工作过程为例,对整个方法进行说明阐述,是为了使得本发明所传达的内容和思想更加简明直观,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献