一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法

2022-12-07 01:27:54 来源:中国专利 TAG:


1.本发明涉及列车轮对轴承智能故障诊断,尤其是涉及一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法。


背景技术:

2.列车轮对是大型的复杂机电系统,轴承是其中极其重要的机械部件,在列车轮对上得到了广泛应用。轮对轴承的运行状态监测与故障诊断对于保证装备可靠性和避免出现安全事故具有十分重要的意义。
3.列车长时间运行在恶劣环境中,一旦轮对轴承发生故障,并且异常状况未被及时成功监测,最终甚至会发生列车颠覆等重大事故。然而,由于列车轮对轴承的故障特征信息往往被高背景噪声及其他不稳定成分所淹没,对于列车轮对轴承的特征信息提取成了其中一项艰巨的任务,一般的针对列车轮对轴承的故障诊断模型无法有效的提取故障特征并正确分类。
4.当前,机械故障智能诊断大致可以分为三类方法。其一是基于统计分析的方法,这类方法包含灰色理论方法、时间序列方法、多元统计分析方法等。这类方法模型简单,诊断精度不佳;其二是基于信号处理的方法,这类方法有小波变化法、包络分析法、谱分析法等。这类方法往往需要复杂的运算找到故障特征频率才能识别故障类型;其三是基于人工智能的方法,这类方法不但有支持向量机、极限学习机等浅层网络,而且有深度置信网络、递归神经网络、卷积神经网络等深度学习网络。这类方法通常可以实现端到端的映射,使用这类方法对列车轮对轴承故障进行诊断是当前研究的热点。
5.胶囊网络与传统的深度学习网络不同之处在于,胶囊网络像中每个胶囊都是一个向量,而不再像传统神经网络中的神经元输出是一个标量,使得胶囊网络可以从输入数据提取更多的细节特征,特征的表达能力更强。胶囊网络通过动态路由机制进行胶囊层参数更新。因此,胶囊网络更加适合处理类似机械振动信号的高度非线性结构化数据。
6.对比学习着重于学习同类列车轮对轴承状态之间的共同特征,区分不同类别样本之间的不同之处。而传统的深度学习只能学习到输入到输出之间的映射,不能学习到样本之间的相似度。


技术实现要素:

7.本发明提供一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法,以实现对列车轮对轴承进行有效的智能诊断,以解决上述背景技术中所提出的问题,这里的高噪声场景的信噪比一般是小于0db。
8.为实现上述目的,本方法技术方案为一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法,包括以下步骤:
9.s1、按列车轮对轴承具体类别收集由传感器采集的机械设备健康状态数据,对数据进行预处理,建立列车轮对轴承健康状态数据库;
10.传感器类型是振动位移传感器、振动速度传感器、振动加速度传感器或声音信号传感器中的一种或者多种;状态数据库中的数据包括:正常状态、单一故障状态和复合故障状态;单一故障状态包括:滚动体故障、内圈故障、外圈故障;复合故障状态包括:外圈 内圈复合故障、内圈 滚动体复合故障、外圈 滚动体复合故障、内圈 外圈 滚动体复合故障;每一个健康状态相同的数据都有相同的状态标签;
11.s2、基于所述列车轮对轴承健康状态数据库,实现对比胶囊特征提取模型的训练,得到训练后的对比胶囊特征提取模型;对比胶囊特征提取模型的损失函数为监督对比学习损失函数,选择优化算法对模型进行训练直到收敛,对比胶囊特征提取模型包含改进时域卷积网络和主胶囊层两部分;
12.所述对比胶囊特征提取模型包括依次连接的改进时域卷积网络和主胶囊层,所述时域卷积网络包括依次连接的包含:输入模块、n个多尺度残差块、输出模块。所述多尺度残差块包括两个输入和两个输出,其中输入1依次经过两个inception单元、bn relu dropout模块、ddcid(1,1)层;这里ddcid是因果膨胀1维卷积的缩写,其中参数1是指卷积核大小,参数2是指因果膨胀率。多尺度残差块中dccid(1,1)层的输出,与多尺度残差块输入2依次经过最大池化层、inception单元的输出相加后,一路作为多尺度残差块的输出2,另一路经过bn relu dropout模块后作为多尺度残差块的输出1;对比胶囊特征提取模型的第一个多尺度残差块的输入1与输入2都为对比胶囊特征提取模型的输入,后续的多尺度残差块的前一个输出1对应后一个输入1,前一个输出2对应后一个输入2;最后一个多尺度残差块的输出1作为对比胶囊特征提取模型的输出;
13.所述inception单元输入后首先分为四路,第一路包括一个dccid(1,1)层,第二路包括依次连接的dccid(3,3)层、dccid(1,1)层,第三路包括依次连接的dccid(5,2)层、dccid(1,1)层,第四路包括依次连接的dccid(1,1)层、dccid(3,2)层,然后将四路输出经过一个高效通道注意力机制模块即为inception单元的输出;所述高效通道注意力机制首先是对其进行深度融合,其次是完成不同通道的特征完成跨通道的信息交互。
14.s3、将上述比胶囊特征提取模型的权重冻结,并在比胶囊特征提取模型后添加数字胶囊层和length层即可得到对比胶囊网络模型;主胶囊层和数字胶囊层之间的参数更新使用动态路由机制,length层用作列车轮对轴承健康状态分类。对比胶囊网络模型损失函数为边沿损失函数,在训练集上对比胶囊网络模型进行训练直到收敛,即可得到对比胶囊网络模型;
15.s4、在实际诊断过程中获取列车轮对轴承健康状态数据,预处理后输入对比胶囊网络模型进行状态判断。
16.进一步的,步骤s1中数据预处理方式包括:数据归一化、数据标准化、小波包变换降噪、集合经验模态分解降噪中的一种;
17.进一步的,模型训练包括:
18.采用adam、sgd优化算法其中的一种作为模型优化器;采用学习率衰减、余弦学习率变化中的一种作为模型训练策略。
19.与现有技术相比,本发明具有的优点和积极效果如下:
20.本发明提出的故障诊断方法,克服网络表达能力不佳、改善高噪声故障信息提取困难的问题,基于对比胶囊网络的胶囊网络可以在高噪声下对特征进行过滤和筛选,提取
更加能反映数据本质的特征,从而提高模型的故障识别准确率。针对高噪声对列车轮对轴承进行故障诊断,实现数据采集到轴承健康状态类别的“端到端”的智能故障诊断;
21.本发明结合了改进时域卷积网络对故障特征的提取能力和胶囊网络矢量进矢量出的挖掘信息的能力,实现对列车轮对轴承的故障诊断;
22.相较于传统的深度学习方法,本方法结合对比学习和两阶段训练模型的策略,使得本发明可以实现在高噪声下获得较高的列车轮对轴承诊断精度。
附图说明
23.为了更清楚地说明本技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1为一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法流程图;
25.图2为一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法工作原理图。其中eca表示高效的通道注意力机制;因果膨胀1维卷积(causal dilation 1dimensional convolution,dcc1d)在图中记作dcc1d(m,d),m表示的是卷积核大小,d指的是卷积核的间隔数量;gap表示全局平均池化层;
26.图3为实施例中所述改进时域卷积网络;
27.图4为实施例中所述对比胶囊网络模型结构图;
28.图5为实施例中对比胶囊网络模型分类训练集和验证集准确率随迭代次数变化图;
29.图6为实施例中对比胶囊网络模型分类混淆矩阵图。
具体实施方式
30.为了更好理解本发明技术内容、特征和优点,下面提供具体实施例,并结合附图对本发明做进一步说明。所举实例只用来解释本发明,并非限定本发明范围。
31.参见图1-2,本发明提出了一种高噪声下列车轮对轴承智能诊断的对比胶囊网络方法,包括下列步骤:
32.s1、按列车轮对轴承具体类别收集传感器采集的一维信号序列数据,对数据进行预处理,建立列车轮对轴承健康状态数据库。列车轮对轴承健康状态数据库由若干个成对的加速度时间序列数据和健康状态标签组成;
33.本发明采用列车轮对选择对某电力机车轮对轴承在试验台上进行实验,实验轴承的型号为552732qt。试验台包含了一个液压马达、两个支撑垫块、一个由液压缸加载在外圈上的待检测轴承、一个液压径向负载应用系统和一个用于轴向速度测量的转速表。轴承安装在液压马达驱动的机械系统中。用于测量其振动的加速计安装在靠近试验轴承外圈的负载模块上。
34.为验证所提出的对比胶囊网络的在高噪声下对列车轮对轴承智能故障诊断方法的有效性和适用性,利用上述实验装置采样得到的列车轮对轴承状态数据库中的8类故障轴承健康状态的样本数据进行实验验证,8类健康状态分别为正常状态、滚动体故障、内圈故障、外圈故障、外圈 内圈复合故障、内圈 滚动体复合故障、外圈 滚动体复合故障、内圈
外圈 滚动体复合故障。实验采集的传感器信号类型为振动加速度信号,采样频率为12khz,这里实验是在信噪比为-6db的情况下采集,采集样本序列的长度为1024。实施例中数据预处理方式为对采集数据进行归一化。
35.s2、基于所述列车轮对轴承健康状态数据库,实现对比胶囊特征提取模型的训练,得到训练后的对比胶囊特征提取模型。将所述轴承健康状态数据库中的数据作为训练集。训练集用作模型输入,模型损失函数为监督对比学习损失函数,选择adam优化算法对模型进行训练,待模型收敛后,可得到对比胶囊特征提取模型,对比胶囊特征提取模型包含改进时域卷积网络和主胶囊层两部分;
36.实施例选择的对比胶囊特征提取模型f
θ
参见图3,特征提取网络得到的特征z=f
θ
(s),i表示训练过程中的一个批次数目,s表示这个批次对应的样本集合,而s表示这个集合中的某一个样本,这里我们称其为锚样本。对于一个锚样本s来说有同类样本和不同类别样本分别为ps和ns。这里锚样本、同类样本和不同类样本提取到的特征分别是zs,zr,zn,z
p
也表示与锚样本同类的样本在特征网络提取特征后向量。l
csl
意思是得到zs和z
p
在特征空间的相似度。温度τ是被用来调整特征在特征空间中的集中程度。
[0037][0038]
基于上述数据库,实施例训练集的样本数为640。这里主胶囊层的胶囊个数对应为32,一个胶囊包含神经元的个数为16。对应的实施例中,步骤s2的改进时域卷积网络结构图参见图3。
[0039]
改进时域卷积网络由多个多尺度残差块组成,实施例中的残差块个数为4。每个残差块中存在3个inception单元,和因果膨胀1维卷积(causal dilation 1dimensional convolution,dcc1d)。图3中记作dcc1d(m,d)。m表示的是卷积核大小,d指的是卷积核的间隔数量。图3(c)中多个不同尺寸大小的卷积核提取出多尺度特征。最后再对不同尺度的特征进行特征深度融合。不同通道的特征在经过一种高效通道注意力机制(efficient channel attention,eca)来完成跨通道间的信息交互。高效通道注意力机制模块中的卷积核的大小是自适应的,自适应率为这里k表示高效通道注意力机制卷积核的大小,c是特征深度融合后的通道数,b和r是超参数。
[0040]
s3、将上述对比胶囊特征提取模型的权重冻结,并在模型后添加数字胶囊层和length层。主胶囊层和数字胶囊层之间的参数更新使用动态路由机制,length层用作列车轮对轴承健康状态分类层,模型损失函数为各类列车轮对轴承健康状态边沿损失之和,第k类的边沿损失记为将训练集用作模型输入,选择优化算法对模型进行训练,模型收敛后得到对比胶囊网络模型;
[0041][0042]
其中,tk表示有0和1两种取值,若tk=1,则表示测试样本轮对轴承健康状态真实类别为k,反之tk=0;m

表示边沿上限,这里取0.9;m-表示边沿下限,这里取0.1;||vk||2表示
length层输出向量vk的范数。
[0043]
这里数字胶囊层的胶囊个数对应轴承健康状态类别数目(换句话说胶囊个数为8),一个胶囊包含神经元的个数为16。这里优化算法选择adam优化算法。
[0044]
对应的实施例中,步骤s2和步骤s3的对比胶囊特征提取网络模型和对比胶囊网络模型结构图参见图4。
[0045]
s4、在实际诊断过程中获取的列车轮对轴承健康状态数据作为输入,通过所述训练后的对比胶囊网络即可得到列车轮对轴承故障智能诊断结果。
[0046]
对应的,图5为实施例中对比胶囊模型在训练集和验证集准确率随迭代次数变化图。从结果可以看到,验证集在最后一个批次列车轮对轴承故障智能诊断准确率均达到了85%。
[0047]
对应的,图6为实施例中验证集混淆矩阵。混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用8行8列的矩阵形式来表示。混淆矩阵的每一列代表了真实类别,每一列的总数表示为该类别的数据实例的真实数目;每一行代表了数据的预测类别,每一行的数据总数表示预测为该类别的数据实例的数目。
[0048]
图6中序号1到8分别表示正常状态、滚动体故障、内圈故障、外圈故障、外圈 内圈复合故障、内圈 滚动体复合故障、外圈 滚动体复合故障、内圈 外圈 滚动体复合故障。混淆矩阵显示实施例中的各健康状态的故障诊断在高噪声下(信噪比-6db)下仍然取得良好的结果,因此本发明的方法有效。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献