一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法

2022-09-04 03:07:01 来源:中国专利 TAG:


1.本发明属于机械部件智能故障诊断的技术领域,具体涉及一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法。


背景技术:

2.滚动轴承作为旋转机械中的关键零部件,其工作状态和健康状况备受关注。由于高速旋转机械的工作环境通常恶劣且复杂,滚动轴承在复杂工况下长时间工作容易产生故障,进而影响机械的整体运作。为了避免轴承故障对机械运行的安全性和稳定性产生重大影响,对滚动轴承进行健康监测和故障诊断十分必要。
3.近年来,故障诊断已经进入大数据时代,需要在海量数据中提取有用信息。而自编码网络是一种典型无监督网络,能够便捷地对数据进行特征降维,因此,该方法已经被广泛应用于轴承故障诊断研究中。然而,传统的自编码网络由于结构简单,面对多种复杂信号时其特征提取性能受到限制,实际应用中仍需在传统结构上加以改进。目前针对不同的应用需求,在传统自编码网络基础上已经产生了许多改进方案,但仍存在一些在实际应用时必须考虑的问题。
4.首先,由于机械结构的复杂性和相关性,故障信号特征存在交叉重叠,如何利用神经网络高效准确学习不同故障的特征是一个关键问题。其次,深度学习具有黑匣子特性,大部分智能诊断算法提取故障特征并未考虑样本数据的原数据特征结构,对训练过程中数据特征提取的方向是不可控的。第三,如何避免网络过拟合。这些问题給传统智能故障诊断算法带来了挑战。为此,本发明提出一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法。


技术实现要素:

5.发明目的:本发明提出一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法,能够约束网络特征学习方向,提升网络特征提取能力,提高模型诊断准确率,实现可靠的滚动轴承故障诊断。
6.技术方案:本发明提供了一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法,包括以下步骤:
7.(1)振动信号采集,将振动加速度传感器放置在关键测点,分别测量滚动轴承在正常状态、内圈故障、外圈故障和滚动体故障状态下的振动信号数据;
8.(2)数据预处理,将采集的振动信号利用快速傅里叶变换进行时频转换;再将转换后的不同故障种类的频域信号数据整理成样本数据集,并划分成训练集和测试集;
9.(3)搭建非对称堆叠稀疏自编码模型并且初始化参数设置:利用两层串联的卷积层作为非对称堆叠自编码器的编码层,三层全连接层作为非对称堆叠自编码的解码层;同时在编码层后接一层全连接层和softmax分类器,形成半监督非对称堆叠稀疏自编码器结构;引入kl散度以约束编码层的稀疏性;
10.(4)在非对称堆叠稀疏自编码模型中引入数据特征损失对模型数据重构方向进一步约束,其中最近邻样本采用k最近邻算法计算获得;
11.(5)将训练集输入步骤(4)搭建完成的模型进行模型训练,同时采用动态权重方式优化总损失函数,并且根据梯度下降法迭代网络权值;
12.(6)根据设定的迭代步数进行批训练,每次训练抽取数量相同序号不同的批数据,当训练次数满足初始设定迭代步数时停止训练,并保存模型;
13.(7)将测试集输入至保存的模型中进行模型性能测试,输出诊断结果,实现滚动轴承的故障诊断。
14.进一步地,所述步骤(2)所述数据预处理的过程包含对频域样本数据集进行线性归一化处理。
15.进一步地,所述步骤(3)包括以下步骤:
16.(31)半监督非对称堆叠稀疏自编码器结构的损失函数由重构误差、交叉熵损失以及稀疏惩罚项构成;
17.(32)半监督非对称堆叠稀疏自编码器保留了自编码的无监督特点,自适应重构样本以提取样本特征,其重构误差损失l
ae
表示如下:
[0018][0019]
其中,m为样本数,xi为第i组输入样本数据,为第i组重构样本数据;
[0020]
(33)构造稀疏自编码器,非对称堆叠稀疏自编码模型采用kl散度对网络进行稀疏度约束,避免网络过拟合,网络稀疏惩罚项l
kl
为:
[0021][0022][0023]
其中,n为隐藏层中神经元的个数,β为稀疏权重因子,为第j个神经元的平均激活程度,ρ是期望激活程度;
[0024]
(34)非对称堆叠稀疏自编码模型引入真实标签y,构造半监督结构,采用交叉熵函数衡量预测标签的分类误差以增强网络分类性能,当样本数为m时,其交叉熵损失l
sem
为:
[0025][0026]
其中,yi是第i组样本的真实标签,为第i组样本的预测标签。
[0027]
进一步地,步骤(4)所述数据特征损失包含数据邻近聚合约束、数据远距分离约束以及数据最近邻整体约束;所述数据邻近聚合约束l
dk
为:
[0028][0029]
其中,h(x)指非对称堆叠稀疏自编码的特征层,knn(x,j)表示计算样本x在数据集中距离第j近的最近邻样本,mmd(a,b)表示计算样本a与样本b之间的最大平均差异距离;
[0030]
所述数据远距分离约束l
dks
为:
[0031][0032]
所述数据最近邻整体约束,分为距离约束以及方差约束;所述距离约束l
gd
和方差约束l
gv
分别为:
[0033]
l
gd
=∑||h(x)-knn(h(x),1)||2[0034]
l
gv
=||σ(h(x))-σ(knn(h(x),1))||2[0035]
其中,σ(x)表示计算样本x的方差;
[0036]
由此,数据特征总损失ld为:
[0037][0038]
进一步地,步骤(5)所述的动态权重方式如下:
[0039]
μ=u(l)=c
·
l
[0040]
其中,c是权重因子,μ作为损失项l的动态权重,随损失项l的大小而变化,确保该损失项在训练过程中的收敛性;
[0041]
λ1和λ2是权重因子,非对称堆叠稀疏自编码模型的总损失函数l
sum
表示如下:
[0042]
l
sum
=λ1l
ae
λ2l
sem
l
kl
u(ld)
·
ld[0043]
其中,l
ae
为重构误差损失,l
kl
为网络稀疏惩罚项,l
sem
为交叉熵损失,ld为数据特征总损失。
[0044]
有益效果:与现有技术相比,本发明的有益效果:本发明提出一种非对称自编码结构,采用卷积层代替全连接层,增强了网络的特征提取能力;本发明充分考虑了网络对数据特征重构的方向,给出了数据特征损失约束,采用最近邻样本来增强数据类内的聚合性以及类外的分离性,同时应用方差距离约束了网络特征提取的方向性;本发明通过构造一种半监督非对称堆叠稀疏自编码结构,能够约束网络特征学习方向,提升网络特征提取能力,提高模型诊断准确率,实现可靠的滚动轴承故障诊断。
附图说明
[0045]
图1为本发明的整体流程图;
[0046]
图2为非对称堆叠自编码网络模型结构示意图;
[0047]
图3为本发明所提方法的完整结构示意图;
[0048]
图4为不同方法在四组数据集上的实验准确率对比图;
[0049]
图5为本发明所提方法在数据集a上的特征提取效果图。
具体实施方式
[0050]
下面结合附图对本发明做进一步详细说明。
[0051]
如图1所示,本发明提供的一种考虑数据特征的非对称堆叠稀疏自编码故障诊断方法,具体步骤如下:
[0052]
步骤1,振动信号采集,将振动加速度传感器放置在关键测点,分别测量滚动轴承在正常状态、内圈故障、外圈故障和滚动体故障状态下的振动信号数据。
[0053]
步骤2,数据预处理,将采集的振动信号利用快速傅里叶变换进行时频转换;再将
转换后的不同故障种类的频域信号数据整理成样本数据集,并根据划分比例将其划分成训练集和测试集。数据预处理的过程包含对频域样本数据集进行线性归一化处理。
[0054]
步骤3,搭建非对称堆叠稀疏自编码模型并且初始化参数设置。非对称堆叠自编码模型结构图如图2所示,利用两层串联的卷积-池化层作为非对称堆叠自编码器的编码层,三层串联的全连接层作为非对称堆叠自编码的解码层,构成完整的基础自编码结构。同时在编码层后接一层全连接层和softmax分类器,形成半监督非对称堆叠稀疏自编码器结构。最后引入kl散度以约束编码层的稀疏性。
[0055]
半监督非对称堆叠稀疏自编码器结构的损失函数主要由重构误差、交叉熵损失以及稀疏惩罚项构成,其具体组成如下:
[0056]
半监督非对称堆叠稀疏自编码器保留了自编码的无监督特点,自适应重构样本以提取样本特征,其重构误差损失l
ae
表示如下:
[0057][0058]
其中,m为样本数,xi为第i组输入样本数据,为第i组重构样本数据。
[0059]
构造稀疏自编码器,非对称堆叠稀疏自编码模型采用kl散度对网络进行稀疏度约束,避免网络过拟合,网络稀疏惩罚项l
kl
可表示为:
[0060][0061][0062]
其中,n为隐藏层中神经元的个数,β为稀疏权重因子,为第j个神经元的平均激活程度,ρ是期望激活程度。
[0063]
非对称堆叠稀疏自编码模型引入真实标签y,构造半监督结构,采用交叉熵函数衡量预测标签的分类误差以增强网络分类性能,当样本数为m时,其交叉熵损失l
sem
为:
[0064][0065]
其中,yi是第i组样本的真实标签,为第i组样本的预测标签。
[0066]
步骤4,在步骤3的模型中引入数据特征损失对模型数据重构方向进一步约束,其中最近邻样本采用k最近邻算法计算获得。
[0067]
数据特征损失主要包含数据邻近聚合约束、数据远距分离约束以及数据最近邻整体约束,其具体过程如下:
[0068]
数据邻近聚合约束,采用k最近邻算法计算与样本相距最近的3组最近邻样本,在训练过程中尽量保证样本与其初始距离最近的3组最近邻样本的距离最小,采用最大平均差异(mmd)衡量样本之间的距离。数据邻近聚合约束l
dk
可以表示如下:
[0069][0070]
其中,h(x)指非对称堆叠稀疏自编码的特征层,knn(x,j)表示计算样本x在数据集中距离第j近的最近邻样本,mmd(a,b)表示计算样本a与样本b之间的最大平均差异距离。
[0071]
数据远距分离约束,采用k最近邻算法计算与样本相距最远的3组最近邻样本,在
训练过程中尽量保证样本与其初始距离最远的3组最近邻样本的距离最大,同样采用最大平均差异衡量样本之间的距离。当样本总数为m时,数据远距分离约束l
dks
可以表示如下:
[0072][0073]
数据最近邻整体约束,主要分为距离约束以及方差约束。距离约束,采用k最近邻算法计算与样本相距最近的1组最近邻样本,在训练过程中保证二者的距离相距最小,距离约束l
gd
可以表示为:
[0074]
l
gd
=∑||h(x)-knn(h(x),1)||2[0075]
方差约束,计算最近邻样本数据的方差以及编码层提取的最近邻样本的特征层的方差距离,在训练过程中保证方差的差值相距最小,σ(x)表示计算样本x的方差,则方差约束l
gv
可以表示为:
[0076]
l
gv
=||σ(h(x))-σ(knn(h(x),1))||2[0077]
数据特征总损失ld可以表示如下:
[0078][0079]
步骤5,将训练集输入步骤4搭建完成的模型中开始训练,同时采用动态权重方式优化总损失函数,并且根据梯度下降法迭代网络权值。本方法的完整模型结构如图3所示,构造非对称堆叠稀疏自编码结构以增强特征提取性能,并且引入数据特征损失约束特征重构方向,同时借助动态权重方式与半监督模式提升网络收敛与分类性能。
[0080]
动态权重方式如下:
[0081]
μ=u(l)=c
·
l
[0082]
其中,c是权重因子,μ作为损失项l的动态权重,随损失项l的大小而变化,确保该损失项在训练过程中的收敛性。
[0083]
λ1和λ2是权重因子,所提方法模型的总损失函数l
sum
表示如下:
[0084]
l
sum
=λ1l
ae
λ2l
sem
l
kl
u(ld)
·
ld。
[0085]
步骤6,根据设定的迭代步数进行批训练,每次训练抽取数量相同序号不同的批数据,当训练次数满足初始设定迭代步数时停止训练,并保存模型。
[0086]
步骤7,将测试集输入至保存的模型中进行模型性能测试,输出诊断结果,实现滚动轴承的故障诊断。
[0087]
本发明选取美国凯斯西储大学的轴承试验台的滚动轴承公开数据集(cwru)进行测试验证。该实验轴承为6205-rs jem skf深沟球轴承,选取在48khz采样频率下的驱动端数据。主要选择了三种故障种类,分别是内圈故障、外圈故障以及滚动体故障,每种故障又分成三种故障程度。共测试了4种负载下的数据,负载情况分别为0hp、1hp、2hp以及3hp,每种负载状态下含正常状态数据集共十种数据类别。数据获取采用数据增强方法,即小样本长度重叠采样,以此增加样本数量。每种故障类别样本600组,每组样本长度600,训练集与测试集的比例为1:1,数据详细划分如表1所示。
[0088]
表1西储大学数据集划分表
[0089][0090]
所提出的考虑数据特征的非对称堆叠稀疏自编码模型参数设置主要包括编码层、解码层以及分类层参数,具体参数如表2所示,其中池化层均采用最大池化。
[0091]
表2考虑数据特征的非对称堆叠稀疏自编码模型参数设置
[0092][0093][0094]
除模型结构参数外,其他训练参数设置如表3所示。
[0095]
表3模型训练参数设置
[0096][0097]
将本发明与其他不同方法均在四组数据集上进行测试实验,实验结果如表4所示。为了减小随机因素的影响,表格中的数据集均为10次实验的平均结果。可以看出,尽管所有对比方法在四组数据集上都取得了大于85%的平均精度,但所提方法在四组数据集上均能取得大于99%的平均精度,表明所提方法具有良好的稳定性和可靠性。
[0098]
表4不同方法在数据集的实验结果
[0099][0100]
进一步,将不同方法在4组数据集上的平均结果可视化,如图4所示。可以看出bnae和lgssae的诊断精度十分相近,但bnae的稳定性要强于lgssae。fdsae的最高诊断精度与disae相近,但稳定性和可靠性远不如disae。与上述四种方法相比,所提方法在4组数据集都表现出了相近的精度,稳定性明显大于其他4种方法,表明该方法具有较强的鲁棒性。
[0101]
为了探究该方法在特征提取方面的性能,采用t-sne图对特征层可视化,所提方法在数据集a提取的特征如图5所示。图5中图例标签如表1故障描述严格对应,不同故障数据采用不同图标和颜色进行标记。其中,c0-c2表示三种不同的内圈故障程度,c3-c5表示三种不同的外圈故障程度,c6-c8表示三种不同的滚动体故障程度,c9表示轴承正常情况。可以看到,图5中相同标记点很好的聚合在一起,而不同标记点距离明显,体现出良好的分类能力。因此,对于多种类的样本数据,该方法能够很好的将同类数据聚合,类外数据分离,表现出了可靠的特征提取性能。
[0102]
综上,本发明通过构建半监督非对称堆叠稀疏自编码模型,选用卷积层作为编码器,全连接层作为解码器,增强编码器的特征提取能力。引入标签信息增强网络的分类能力。考虑类内分布,利用最近邻样本衡量类聚合度和分离度,同时约束样本的邻近特征和数
据特征,增强网络的特征分离性能。最后,一种动态权重用于动态优化训练过程,保证训练平衡方向和收敛度。经实施案例验证,本发明方法能够实现可靠的滚动轴承故障诊断。
[0103]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献