一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自监督域自适应的跨域故障诊断方法

2022-11-19 11:20:33 来源:中国专利 TAG:


1.本发明属于时序分析领域,具体涉及一种基于自监督域自适应的跨域故障诊断方法。


背景技术:

2.故障诊断旨在通过机器的早期故障信号判断故障类别,在确保制造安全和产品质量方面起着至关重要的作用[1]。随着物联网和云计算技术的快速发展,机械设备的信号可以通过传感器轻松获取并实时分析,这为开发相关的智能故障诊断算法提供了前提保证。然而,如何设计一种实用、高性能的故障诊断算法仍然是一个有待解决的问题。
[0003]
由于机器学习具有自动学习的能力,研究人员非常关注传统的基于机器学习的故障诊断方法,包括支持向量机[2]、决策树[3]等。然而,由于传统的基于机器学习的方法依赖于需要领域知识的特征工程,其泛化能力受到限制。最近,深度学习由于其出色的非线性拟合能力和自动特征提取能力,已广泛应用于故障诊断任务中,并取得了令人鼓舞的诊断准确性。例如,jiang等人[4]提出了一种深度学习框架,该框架结合了多尺度卷积神经网络和长短期记忆网络,其性能超过了现有大多数的基于知识的方法。尽管基于深度学习的方法已经取得了优异的性能,但大多数方法都有一些局限性,只有在标记样本足够且训练集和测试集的概率分布相同的情况下,它们才能获得良好的结果。然而,在真实的工业场景中,操作环境或操作条件的变化可能会导致训练样本和测试样本之间存在较大的分布差异。由于数据标记是一个昂贵的过程,需要大量人力和领域知识输入,因此为每个操作条件标记足够的数据是不现实的,这限制了智能故障诊断算法的实际应用。
[0004]
无监督领域自适应(uda)旨在将诊断知识从标记的源域转移到未标记的目标域,可以解决上述问题。现有的基于uda的方法主要包括基于映射的方法和基于对抗的方法。基于映射的方法通过添加分布对齐损失函数(例如,最大平均差异mmd)将两个域的特征表示映射到共享特征空间。基于对抗的方法使用域鉴别器进行对抗训练,从而可以获得域不变表示。由于基于映射和基于对抗的方法在提取的特征表示的基础上执行,因此表示中的信息完整性非常重要。信息不完整的特征表示会使特征映射不匹配和域鉴别器容易受到欺骗。
[0005]
时间序列中的时间相关性信息在许多领域都被证明是有效的,例如时间序列分类[5]和预测[6]。然而,大多数现有的基于uda的方法不能充分考虑振动信号的时间维度,导致域对齐过程中使用的特征信息不完整。


技术实现要素:

[0006]
本发明的目的在于提供一种基于自监督域自适应的跨域故障诊断方法,在结合传统特征映射和域对抗训练的基础上,设计了下采样与特征交互网络(dinet),以考虑域对齐过程中低时间分辨率子序列之间的时间依赖关系。此外,通过自监督借口任务来考虑过去和未来时间段之间的时间依赖关系,从而产生更多的域不变特征。
[0007]
为实现上述目的,本发明的技术方案是:一种基于自监督域自适应的跨域故障诊断方法,包括两个阶段,第一阶段为传统域自适应训练阶段:首先,设计一个下采样与特征交互网络dinet来提取包含子序列之间时间依赖关系的特征嵌入;随后,通过最大平均差异mmd和域对抗训练对齐源域和目标域的特征分布,并通过分类器对特征嵌入进行分类;第二阶段为自监督训练阶段:首先,将两个域的信号切分为过去和未来时间片段,通过关系采样构建正关系对和负关系对;随后,在两个域上共同执行关系分类辅助任务以捕获源域和目标域上的一致表示。
[0008]
相较于现有技术,本发明具有以下有益效果:本发明设计了一个自监督域自适应故障诊断网络(sdafdn)以在域自适应的过程中考虑了两种时间依赖关系:其一是降采样后的子序列间的依赖关系,反映了振动信号的短期变化模式;其二是过去片段和未来片段间的依赖关系,反映了振动信号的长期变化模式。本发明使用该方法在两个公开数据集上进行了广泛的实验,其结果表明:相对于现有的方法,所提出的方法具有更出色的跨域诊断性能。
附图说明
[0009]
图1为本发明方法的流程图。
[0010]
图2为sdafdn概述。
[0011]
图3为dinet详细过程。
具体实施方式
[0012]
下面结合附图,对本发明的技术方案进行具体说明。
[0013]
本发明一种基于自监督域自适应的跨域故障诊断方法,包括两个阶段,第一阶段为传统域自适应训练阶段:首先,设计一个下采样与特征交互网络dinet来提取包含子序列之间时间依赖关系的特征嵌入;随后,通过最大平均差异mmd和域对抗训练对齐源域和目标域的特征分布,并通过分类器对特征嵌入进行分类;第二阶段为自监督训练阶段:首先,将两个域的信号切分为过去和未来时间片段,通过关系采样构建正关系对和负关系对;随后,在两个域上共同执行关系分类辅助任务以捕获源域和目标域上的一致表示。
[0014]
以下为本发明具体实现过程。
[0015]
如图1所示,为本发明方法即sdafdn的执行流程,本发明sdafdn如图2所示。该方法主要包括两个阶段。在阶段1中,所有样本的原始信号由dinet编码。所学习的表示被馈送到用于故障分类的分类网络和用于域对抗训练的域识别网络。此外,mmd损失用于对齐源域和目标域之间的特征结构差异。在阶段2中,来自两个域的样本被切片并采样以形成正负关系对。然后,通过自监督辅助任务在域对齐中考虑过去和未来片段之间的时间依赖性。
[0016]
1、问题定义
[0017]
本发明主要研究跨域故障诊断问题。定义为从源域ps中采样的包含ns个样本的带标记数据集,其中是第i个样本原始信号,d为信号维度,为第i个样本的故障类别。定义为从目标域p
t
中采样的包含n
t
个样本的无标记数据集,其中是第i个样本原始信号,为第i个样本的故障类别。表示样本所在
域的情况,如果是源域则设置为1,目标域则设置为0。假设源域ps和目标域p
t
共享一个标记空间,但数据分布是不一致的,我们的目标是学习一个函数f(
·
)以分类来自p
t
的样本的故障类别。
[0018]
2、下采样与特征交互网络
[0019]
作为一个时间序列,振动信号的下采样通常可以保留信号的大部分信息,而文本和dna序列等一般序列则不能做到。此外,下采样后的子序列之间存在单位时间偏移,它们之间的相关性反映了信号的短期变化模式。因此,我们开发了dinet。通过采样子序列并与特征提取器提取的特征交互,学习到的嵌入表示可以包含多个子序列的时间依赖关系。
[0020]
图3显示了dinet的详细过程。形式上,给定一个原始振动信号x={x1,x2,

,xn},其中n是信号维数,我们首先将其划分为k个子序列其中xi={xi,x
i k
,x
i 2k


,x
n-k 1
}。然后,使用由卷积神经网络(cnn)组成的主干网络φ(
·
)提取高级语义特征。基于提取的特征表示,使用元素乘积和元素加法交互子序列嵌入以形成嵌入fm和fa,随后融合它们以形成最终的嵌入f
all

[0021]fm
=φ(x1)

φ(x2)
⊙…⊙
φ(xk)
[0022]
fa=φ(x1) φ(x2)

φ(xk)
[0023]fall
=[fm,fa]
[0024]
其中

是元素乘积,[
·

·
]是矩阵连接运算;与仅使用cnn主干相比,dinet没有添加任何额外的网络参数;
[0025]
f=leakyrelu(wf
all
b)
[0026]
其中,w和b是可训练的权重矩阵和偏置向量,leakyrelu(
·
)为非线性激活函数。为了方便起见,在本发明的剩余部分中,dinet和bottleneck层的组合表示为特征提取器ψ(
·
)。
[0027]
3、故障分类
[0028]
为了保证sdafdn的基本故障诊断能力,使用由全连接网络组成的分类器c(
·
)对特征嵌入进行分类。到目前为止,分类函数f(
·
)=c(ψ(
·
))已完全构造完成。在训练阶段,可以通过最小化标记的源域样本的真实类别和分类器预测类别之间的差异来获得源域中的诊断知识:
[0029][0030]
其中e表示数学期望。
[0031]
4、域对抗训练
[0032]
由于域迁移问题的存在,仅使用源域样本训练的分类器通常无法在有显著分布差异的目标域上获得满意的结果。为了解决这个问题,使用域鉴别器d(
·
)来区分特征嵌入来自源域还是目标域。然后,通过对抗训练在特征提取器和域鉴别器之间进行两人博弈。直觉上,我们希望域鉴别器能够更好地分类域类别,而特征提取器则尽可能地欺骗域鉴别器。对抗训练的优化目标可以定义为:
[0033][0034]
其中,argmind表示鉴别器d(
·
)的优化目标是最小化ld,argmax
ψ
表示特征提取器ψ(
·
)的优化目标是最大化ld。
[0035]
5、特征对齐
[0036]
为了进一步对齐源域和目标域之间的特征结构差异,在训练阶段将mmd引入所提出的sdafdn,该模块的优化目标旨在最小化两个域之间特征嵌入的mmd度量值:
[0037][0038]
其中ω为再生希尔伯特空间。
[0039]
6、自监督时间关系分类
[0040]
通过在源域和目标域上执行自监督辅助任务,这两个域可以沿着任务相关方向更紧密地结合在一起。受工作[7]的启发,我们引入了一个自监督关系分类辅助任务,以继续探索过去和未来时间片段之间时间依赖的对齐。直观地说,过去和未来的长度片段是信号中时间距离最长的子序列对,它们之间的时间相关性反映了长期变化模式。
[0041]
给定输入信号x∈{ds∩d
t
},每个信号xi被分为两部分,包括过去的长度部分x
i,p
和未来的长度部分这两个段随后由共享权重的特征提取器ψ(
·
)进行特征提取。在此基础上,进行时间关系采样。给定一个过去片段嵌入ψ(x
i,p
),我们从同一个信号中xi采样未来片段嵌入以形成一个正关系对,从另一信号xj中采样未来片段嵌入以形成负关系对。随后,一个新的关系数据集构建过程如下:
[0042][0043]
其中

·

代表向下取整运算;%是取余运算;表示第i个样本的特征;是第i个样本的标签,其表示样本为正关系或负关系。最后,一个由全连接网络组成的关系头部r(
·
)被用于关系分类。自监督时间关系分类损失可以被定义为:
[0044][0045]
其中pr表示数据集dr中的样本的边缘分布。
[0046]
7、模型训练
[0047]
为了有效地结合所提出方法的所有组成部分,将两阶段训练策略应用于sdafdn。本发明建议在每个迭代期内进行两个阶段的训练:阶段1用于所有传统领域自适应组件,阶段2用于所有自监督组件。具体而言,在阶段1中联合训练了故障分类损失lc、特征结构对齐损失l
mmd
和域对抗损失ld。联合训练目标定义为:
[0048]
l
s1
=lc αlc βl
mmd
[0049]
其中,α和β是平衡因子,用于评估领域对抗和功能结构对齐的相对贡献。此外,自监督分类损失被用作第2阶段的训练目标:
[0050]
l
s2
=lr[0051]
8、实验数据及评价
[0052]
为验证本发明方法的有效性,本发明在公开的paderborn university(pu)数据集和phm2009数据挑战赛(phm)数据集上进行了实验。两个数据集的基本情况如下:
[0053]
pu:pu数据集包括从人工诱导轴承、真实损伤轴承和正常轴承中收集的数据。根据驱动系统速度、测试轴承上的径向力和驱动系统上的负载扭矩的差异,将表1中所示的四种工况应用于迁移学习任务。因此,我们在实验中进行了12项跨域任务。此外,根据[1]筛选了
十三种故障类别,即ka04、ka15、ka16、ka22、ka30、kb23、kb24、kb27、ki14、ki16、ki17、ki18和ki21。
[0054]
phm:phm数据集为齿轮箱数据集,包括正齿轮和斜齿轮。基于[1]中的设置,我们仅考虑在高负载下以四种转速采集的样品,包括30hz、35hz、40hz、45hz,分别作为工作条件0、1、2和3。在此基础上,进行了12项跨域任务的实验。过滤后的数据集包含6个故障类别。
[0055]
为减少随机性的影响,5次运行的平均准确度被作为评价指标,以量化模型的性能。
[0056]
表1 pu数据集上4种工况情况
[0057]
工况负载扭矩径向力驱动系统速度00.71000150010.7100090020.11000150030.74001500
[0058]
9、实验结果
[0059]
9.1 pu数据集上的结果
[0060]
所提出的sdafdn和其他七种方法在pu数据集上的实验结果如表2所示。正如我们所看到的,sdafdn在所有方法中表现出最好的性能。就12项任务的平均准确性而言,sdafdn比最佳方法cdan提高了20.99%,比最差方法cnn提高了37.05%。在最具挑战性的任务(任务1-3)中,sdafdn的性能优于最差方法43.06%,优于最佳方法11.5%。在最简单的任务(任务0-2)中,sdafdn的性能比较差的方法提高了11.26%,比最佳方法提高了6.65%。无论域移位问题是否严重,sdafdn都可以显示出高性能的改进,这证明了所提出方法的稳定性和鲁棒性。
[0061]
由于缺乏任何形式的域适应,基线在所有比较方法中表现最差,而基于对抗的方法(cdan、cdan e、dann)、基于映射的方法(coral、jmmd)和dagcn认为数据结构对齐的性能优于基线。然而,由于它们没有考虑振动信号内部的时间依赖信息,其性能远低于sdafdn,这表明考虑时间依赖信息有助于提高跨域故障诊断性能。
[0062]
9.2 phm数据集上的结果
[0063]
phm数据集上所有方法的实验结果如表3所示。可以观察到,phm数据集的平均精度明显低于pu数据集,这是由于phm数据集中不同领域样本的分布差异较大,因此诊断知识难以传递。在这种情况下,sdafdn仍然是所有方法中性能最好的。具体而言,sdafdn优于最佳比较方法dagcn 6.23%,优于最差比较方法cnn14.82%。这进一步证明了该方法的有效性。
[0064]
表2 sdafdn及比较方法在pu数据集上的实验结果
[0065]
[0066][0067]
表3 sdafdn及比较方法在phm数据集上的实验结果
[0068]
adaptation networks.in:international conference on machine learning pmlr;2017.p.2208

2217.
[0082]
[12]ganin y,ustinova e,ajakan h,germain p,larochelle h,laviolette f,et al.domain-adversarial training of neural networks.the journal of machine learning research 2016;17(1):2096

2030.。
[0083]
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献