一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于支持向量数据描述的转子系统异常检测方法与流程

2022-05-06 06:26:32 来源:中国专利 TAG:


1.本发明涉及一种转子系统异常检测方法。特别是涉及一种基于支持向量数据描述的转子系统异常检测方法。


背景技术:

2.随着工业技术的不断进步,机械设备更加趋于高速化、精密化与自动化发展。但在运行过程中,极端高温与重载等恶劣的环境问题会使密切接触部件的维护和修理变得更加困难。特别是一旦关键部件出现故障,如转子或轴承,整个机械设备的运行将受到影响,从而导致生产质量下降,甚至灾难性的损坏。因此,为了避免严重事故,特别是在设备性能下降的早期阶段,对设备中的关键部件进行预测性维护至关重要
1.。异常检测作为预测性维护的第一步,是健康管理的基础,同时也是最容易被忽视的方面之一。准确的异常检测将有助于促进健康管理工作,提高机器维护的效率和质量。
3.异常检测已被应用于各个领域,如变速箱温度异常检测
2.,临床医学中的软组织病变检测
3.等。异常通常被定义为系统行为在特定时间步长内明显不同于先前正常状态的点。为了检测异常,需要识别这些可能异常的时间步长。一般来说,前一刻机械设备的状态会影响下一刻,这总是与时间因素密切相关。因此,异常检测模型如何捕捉时间序列的不同特征并有效地检测异常是一个挑战。其中,有不少学者提出了以支持向量机为基础的二分类故障诊断方法,其通过建立最优超平面来区分两类状态。例如,cheng等人将齿轮振动信号分解为有限数量的本征模态分量,并建立ar模型,将相应的自回归参数和残差方差作为故障特征向量,输入支持向量机分类器中进行诊断
4.。afrooz等通过提取峭度和非高斯分数信息作为支持向量机方法的输入信息,使检测以高精度收敛到最优值[引。此外,也有不少学者提出了基于概率密度估计的方法进行异常检测,其基于训练期间有效数据的密度建模,再将待测数据输入模型,若数据落入低密度区域则被拒绝。例如,yu等通过局部保持投影法对提取的特征进行非线性降维,并利用高斯混合模型实现了轴承的性能退化评估
[6]
。而基于角度的离群值检测方法
[7]
和特征集成方法
[8]
则是通过考虑变量的相关性来处理数据,进而进行异常值检测。
[0004]
但是,上述方法都存在一定局限性。其中,传统的支持向量机方法用于二分类问题能解决很多实际问题,在机械的故障诊断中也取得了一定效果,但前提是必须存在一定的正常和故障数据样本供其学习和判断。实际应用中故障数据的不平衡会导致该方法难以实施。同样,基于概率密度的方法也需要在训练过程中提供足够大的训练数据集以确保检测的准确性。


技术实现要素:

[0005]
本发明所要解决的技术问题是,提供一种解决了正常与故障样本量不平衡问题的基于支持向量数据描述的转子系统异常检测方法。
[0006]
本发明所采用的技术方案是:一种基于支持向量数据描述的转子系统异常检测方
法,包括如下步骤:
[0007]
步骤一、利用传感器采集转子正常状态运行下的数据,并构成正常数据集;
[0008]
步骤二、提取正常数据集中的15个时域特征与4个频域特征;将15个时域特征与4个频域特征,共19个参数特征组成的特征参数矩阵作为支持向量数据描述模型的训练集;
[0009]
步骤三、对支持向量数据描述模型进行训练,得到正常数据样本训练情况下的超球体半径,并保存训练好的支持向量数据描述模型;
[0010]
步骤四、利用传感器在线实时采集转子故障状态运行下的运行振动数据,对所述运行振动数据进行时域及频域特征提取,作为测试集,所述测试集与训练集构成相同,由15个时域特征与4个频域特征组成;
[0011]
步骤五、将测试集输入步骤三中的训练好的支持向量数据描述模型中,计算测试集中各个样本与球心之间的距离,并与正常样本情况下的超球体半径相比较,若超出正常样本下的半径阈值,则判定为设备异常,否则为正常设备。
[0012]
步骤二所述的15个时域特征如下:
[0013]
(1)平均值
[0014]
平均值的表达式为:
[0015][0016]
(2)均方值
[0017]
均方值的表达式为:
[0018][0019]
(3)方差与标准差σ
x
[0020]
其中方差的表达式为:
[0021][0022]
其中标准差的表达式为:
[0023][0024]
(4)方根幅值x
ra
[0025]
方根幅值的表达式为:
[0026][0027]
(5)平均幅值
[0028]
平均幅值的表达式为:
[0029][0030]
(6)均方幅值x
rms
[0031]
均方幅值的表达式为:
[0032][0033]
(7)峰值x
p
[0034]
峰值代表信号幅值中的瞬时单峰最大值,表达式为:
[0035]
x
p
=e(max|xi|)
[0036]
(8)峰峰值x
pp
[0037]
峰峰值的表达式为:
[0038]
x
pp
=max(xi)-min(xi)
[0039]
(9)波形指标w
[0040]
波形指标具有稳定性好、敏感性差的特点,其表达式为:
[0041][0042]
(10)峰值指标i
p
[0043]
峰值指标的表达式为:
[0044][0045]
(11)脉冲指标cf[0046]
脉冲指标的表达式为:
[0047][0048]
(12)裕度指标ce[0049]
裕度指标的表达式为:
[0050][0051]
(13)偏斜度sc[0052]
偏斜度的表达式为:
[0053][0054]
(14)峭度cq[0055]
峭度指标的表达式为:
[0056][0057]
上述各式中,n为所采集振动信号的总数;xi为第i个信号。步骤二所述的4个频域特征表达式依次如下:
[0058][0059][0060][0061][0062]
式中,n为所采集振动信号的总数;s(xi)为第i个信号的频域幅值;f1表示频域振动能量的大小;f2表示信号频谱与该信号频谱均值之间的偏离程度;f3表示信号频谱相对均值不对称的程度;f4表示信号在均值处峰值的高低。
[0063]
本发明的一种基于支持向量数据描述的转子系统异常检测方法,具如下有益效果:
[0064]
1、本发明只需对正常数据进行训练,无需考虑故障样本的训练即可进行对转子系统的异常检测操作,解决了正常与故障样本量不平衡的问题;
[0065]
2、本发明在对测试样本进行检测时,仅用到超球体的中心计算,而超球体的中心仅由少数的支持向量所决定,因此,本发明在对新样本检验时具有良好的计算速度;
[0066]
3、本发明的支持向量数据描述模型采用高斯核函数,简化了优化目标函数,使训练速度得到了提高。
附图说明
[0067]
图1是本发明一种基于支持向量数据描述的转子系统异常检测方法的流程图;
[0068]
图2a是正常数据的时域图;
[0069]
图2b正常数据的频域图;
[0070]
图3a是故障数据的时域图;
[0071]
图3b是故障数据的频域图;
[0072]
图4是异常检测的结果图。
具体实施方式
[0073]
下面结合实施例和附图对本发明的基于丝杠和直线导轨的竖直方向波浪浮标检测装置及方法做出详细说明。
[0074]
如图1所示,本发明的一种基于支持向量数据描述的转子系统异常检测方法,包括如下步骤:
[0075]
步骤一、利用传感器采集转子正常状态运行下的数据,并构成正常数据集;
[0076]
步骤二、提取正常数据集中的15个时域特征与4个频域特征;将15个时域特征与4个频域特征,共19个参数特征组成的特征参数矩阵作为支持向量数据描述模型的训练集;其中,
[0077]
1)所述的15个时域特征如下:
[0078]
(1)平均值
[0079]
平均值代表信号波形幅值的平均,可以呈现出幅值波动的中心趋势,常用于对信号稳定性的描述。平均值的表达式为:
[0080][0081]
(2)均方值
[0082]
均方值代表信号整体的平均能量,即若为速度信号,均方值可代表其振动能量;若为位移信号,均方值可代表其位能;若为加速度信号,均方值可代表其惯性力。均方值的表达式为:
[0083][0084]
(3)方差与标准差σ
x
[0085]
方差与标准差可以表示信号的波动,其中方差的表达式为:
[0086][0087]
而方差的正平方根即为标准差的表达式:
[0088][0089]
(4)方根幅值x
ra
[0090]
方根幅值的表达式为:
[0091][0092]
(5)平均幅值
[0093]
平均幅值的表达式为:
[0094][0095]
(6)均方幅值x
rms
[0096]
均方幅值的表达式为:
[0097][0098]
(7)峰值x
p
[0099]
峰值代表信号幅值中的瞬时单峰最大值,表达式为:
[0100]
x
p
=e(max|xi|)
[0101]
(8)峰峰值x
pp
[0102]
峰峰值的表达式为:
[0103]
x
pp
=max(xi)-min(xi)
[0104]
(9)波形指标w
[0105]
波形指标具有稳定性好、敏感性差的特点,其表达式为:
[0106][0107]
(10)峰值指标i
p
[0108]
峰值指标的表达式为:
[0109][0110]
(11)脉冲指标cf[0111]
脉冲指标的表达式为:
[0112][0113]
(12)裕度指标ce[0114]
裕度指标的表达式为:
[0115][0116]
(13)偏斜度sc[0117]
偏斜度的表达式为:
[0118][0119]
(14)峭度cq[0120]
峭度指标的表达式为:
[0121][0122]
上述各式中,n为所采集振动信号的总数;xi为第i个信号。
[0123]
时域特征中峭度、脉冲和裕度三个指标对冲击类故障十分敏感,尤其在故障发生伊始,三个指标的值变化明显,但随着故障程度的加深,这三个指标会在增加到某一数值后
出现下降趋势。以此可见,虽然这三个指标的稳定性较差,但对早期故障的识别是很敏感的。因此,为了获得良好的效果,将多个指标同时应用于实际工程中,以兼顾稳定性和敏感性。
[0124]
而频域特征则将频带分布情况以及主频带的位置等信息包含于其中,其相关谱线的变化与设备运行健康状态的变化密不可分,可用于故障的预警与诊断。本发明所用到的4个频域指标可分别反映频域振动能量的大小、信号频谱与其均值之间的偏离程度、信号频谱相对均值不对称的程度、信号在均值处峰值的高低。
[0125]
2)所述的4个频域特征表达式依次如下:
[0126][0127][0128][0129][0130]
式中,n为所采集振动信号的总数;s(xi)为第i个信号的频域幅值;f1表示频域振动能量的大小;f2表示信号频谱与该信号频谱均值之间的偏离程度;f3表示信号频谱相对均值不对称的程度;f4表示信号在均值处峰值的高低。
[0131]
步骤三、对支持向量数据描述模型进行训练,得到正常数据样本训练情况下的超球体半径,并保存训练好的支持向量数据描述模型;
[0132]
支持向量数据描述模型,其本质是建立一个涵盖所有训练样本x={x1,x2,...,xn}的超球体,其核心为超球体的球心a和半径r。我们可以定义超球体的结构误差为:
[0133]
ε(a,r)=r2[0134]
该超球体中,所有训练样本到其球心a的距离都在半径r的范围之内,我们可以将约束条件规定为:
[0135]
||x
i-a||2≤r2[0136]
但若训练样本并非完全理想,即存在少量偏离距离过大的样本,并把这些样本包含于超球体中,则会使球体边界变得非常大,不利于后续测试样本的学习。因此,为了解决该问题,提高算法的鲁棒性,将松弛因子ξi引入进来,使之满足部分样本点分布位于超球体之外,可以将此最小化问题表示为:
[0137][0138]
上式中,c是指定常数,可以对错分样本的惩罚程度进行控制,进而实现超球体容量和错分样本比例的平衡,为了使其更好优化,进一步构造拉格朗日算式:
[0139][0140]
上式中,ai,γi代表拉格朗日乘子。
[0141]
继续对上式中r,a,ξi求偏导数,并令其为0,得到:
[0142][0143]
因而可以求得优化函数:
[0144]
maxl=∑
iai
(xi·
xi)-∑
i,jaiaj
(xi·
xj)
[0145]
上式中,我们定义样本点处于超球体内时,ai=0;样本点处于超球体边界上时,0<ai<c;样本点处于超球体边界外时,ai=c。普遍情况下,样本点处于超球体之内,少量样本处于边界处或之外,支持向量也由此而来。我们可以根据球体边界上任一支持向量到球心a的距离获得超球体的半径r:
[0146]
r2=||x
sv-a||2=(x
sv
·
x
sv
)-2σ
iai
(xi·
x
sv
) σ
i,jaiaj
(xi·
xj)
[0147]
同时,对测试样本z是否满足同类条件的判断,也可通过计算其到超球体中心a的距离是否在半径r的范围内,可由下式表达:
[0148]
d=||z-a||=(z
·
z)-2σ
iai
(xi·
z) σ
i,jaiaj
(xi·
xj)≤r
[0149]
因实际数据很难满足支持向量数据描述算法在原空间进行超球体描述的条件,因此需要通过核函数对数据样本进行由低维到高维空间的映射,从而对样本进行较好的描述。
[0150]
高斯核函数、线性核函数以及多项式核函数是常见的核函数。本研究选择了高斯核函数:
[0151][0152]
当采用高斯核函数时,优化函数可表示为:
[0153]
maxl=-σ
i,jaiaj
kg(xi·
xj)
[0154]
进而可以将样本到超球体中心的距离表示为:
[0155]
d=||φ(z)-φ(a)||=1-2∑
iai
kg(z,xi) ∑
i,jaiaj
kg(xi,xj)≤r
[0156]
步骤四、利用传感器在线实时采集转子故障状态运行下的运行振动数据,对所述运行振动数据进行时域及频域特征提取,作为测试集,所述测试集与训练集构成相同,由15个时域特征与4个频域特征组成;
[0157]
步骤五、将测试集输入步骤三中的训练好的支持向量数据描述模型中,计算测试集中各个样本与球心之间的距离,并与正常样本情况下的超球体半径相比较,若超出正常样本下的半径阈值,则判定为设备异常,否则为正常设备。
[0158]
下面给出具体实例。
[0159]
本发明的实例是基于合成气压缩机的历史故障数据,对其进行异常检测。实例中涉及的合成气压缩机数据样本为等周期采样,周期间隔为32,采样点数为1024。每间隔1小
时选取一个采样样本,共计895个,其中从第611个数据点起为不平衡故障的发生点。对该段数据可以采用基于支持向量数据描述的方法进行故障发生前的异常检测,其过程如图1所示,详细如下:
[0160]
一、正常状态建模
[0161]
1)选取合成压缩机数据样本中的前430个作为正常样本,构成正常数据集;
[0162]
2)正常数据的时域图与频域图示例如图2a、图2b所示,对正常数据集进行时域与频域特征提取,并组成特征参数矩阵作为支持向量数据描述方法的训练输入数据集,表1为正常数据集中某样本的时域与频域特征示例,其中前15个参数为时域特征,后4个参数为频域特征;
[0163]
表1正常数据样本时域与频域特征示例
[0164][0165][0166]
3)本实例中,将支持向量数据描述模型中的常数值c设为0.05,选择了高斯核函数并将核函数的宽度设为25。获得正常数据样本训练情况下的超球体半径阈值0.2380,保存训练模型。
[0167]
4)故障数据的时域图与频域图示例如图3a、图3b所示。将合成压缩机的所有895个数据样本作为异常检测数据集,同理对该数据集进行时域及频域特征提取,并组成特征参数矩阵作为支持向量数据描述方法的测试输入数据集。表2为故障数据集中某样本的时域与频域特征示例,其中前15个参数为时域特征,后4个参数为频域特征;
[0168]
表2故障数据样本时域与频域特征示例
[0169][0170]
5)将测试集输入步骤3)中的训练模型中,计算测试集中各个样本与球心之间的距离,并与正常样本情况下的超球体半径相比较,异常检测的结果如图4所示。由该图可以看出,第460个数据样本就已表现出异常趋势,明显超出正常数据样本的半径阈值,即在故障发生之前就可提前做出故障预警,展现了本发明出色的异常检测效果。
[0171]
参考文献(如专利/论文/标准)
[0172]
[1]赵宁波,吴森,闻雪友.燃气轮机异常检测技术研究进展[j].热能动力工程,2017,32(10):1-10,137.
[0173]
[2]a grzesiek,r zimroz,p sliwinski,n gomolla,along term belt conveyor gearbox temperature data analysis-statistical tests for anomaly detection.measurement,2020,165.
[0174]
[3]h wang,j zhang,s bao,j liu,f hou,y huang,h chen,s duan,d hao,j liu.preoperative mri-based radiomic machine-learning nomogram may accurately distinguish between benign and malignant soft-tissue lesions:a two center study.journal of magnetic resonance imaging,2020,52:873-882.
[0175]
[4]j cheng,d yu,y yang.a fault diagnosis approach for gears based on imf ar model and svm.eurasip journal on advances in signal processing,2008.
[0176]
[5]a purarjomandlangrudi,ah ghapanchi,m esmalifalak,a data mining approach for fault diagnosis:an application of anomaly detection algorithm.measurement,2014,55:343-352.
[0177]
[6]jb yu.bearing performance degradation assessment using locality preserving projections and gaussian mixture models.mechanical system and signal processing.2011,25(7):2573-2588.
[0178]
[7]hp kriegel,m schubert,a zimek.angle-based outlier detection in high-dimensional data.proceedings of the 14th acm sigkdd international conference on knowledge discovery and data mining,las vegas,nevada,usa,august 24-27,2008.
[0179]
[8]a lazarevic,v kumar.feature bagging for outlier detection.proceedings of the eleventh acm sigkdd international conference on knowledge discovery in data mining,association for computing machinery,chicago,illinois,usa,2005:157-166.
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献