一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于改进TimeGAN模型的小样本故障诊断方法

2022-07-02 11:04:43 来源:中国专利 TAG:

一种基于改进timegan模型的小样本故障诊断方法
技术领域
1.本发明属于故障诊断技术领域,具体涉及一种基于改进timegan模型的小样本故障诊断方法。


背景技术:

2.近年来,随着经济飞速发展,居民的日常用电设备使用量也大幅上升,如电梯。故障存在于人们日常使用的每一个设备中,很多设备结构复杂难以排查故障且潜在威胁大,一旦发生故障难免造成巨大损失。此外,故障样本稀缺、振动信号复杂等问题也降低了故障诊断的精度。因此,在电梯日常使用环节对潜在故障进行诊断和预测,及时预防故障的发生,对维护居民的生命和财产安全具有重要意义。
3.目前,随着大数据和人工智能技术的发展,故障诊断也得到了广泛研究。但人工智能算法模型是由数据驱动的,因此结合相关算法实现故障诊断和预测往往需要海量的数据,尤其是故障数据。而电梯设备的特殊性使得很难采集到故障数据,也就无法保证有足够的训练样本支撑模型训练,所以样本生成和扩充的相关研究愈发广泛。生成对抗网络(generative adversarial networks,gan)、最小二乘对抗网络(least square generative adversarial networks,lsgan)、深度卷积生成对抗网络(deep convolutional generative adversarial networks,dcgan)等生成模型可以生成所需图片,因此被广泛应用于图片扩充和还原中。由于故障诊断中的样本通常为一维数据,相关研究先将样本转换为二维图片,再利用生成模型扩充图片,最后输入到相关算法中进行训练得到诊断结果。这些方法解决了训练样本不足的问题,但是它们没有充分考虑振动信号之间特有的时间相关性,传统生成模型无法确保网络能动态有效地捕获信号中的逐步依赖关系,也没有充分利用振动信号的时域、频域和空间域特征。因此,亟需开发新的电梯故障诊断方法,实现高效准确故障诊断及智能化的设备安全维护。


技术实现要素:

4.本发明的目的在于针对上述问题,提出一种基于改进timegan模型的小样本故障诊断方法,该方法通过生成具备时序特征的故障样本,降低原始数据分布的不平衡性,并充分提取样本的时频特征,获得高效准确的故障诊断结果,从而实现智能化设备的安全维护。
5.为实现上述目的,本发明所采取的技术方案为:
6.本发明提出的一种基于改进timegan模型的小样本故障诊断方法,包括如下步骤:
7.s1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本;
8.s2、建立改进timegan模型,改进timegan模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
9.嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
10.恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数
基于前馈网络实现;
11.序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
12.序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
13.改进timegan模型的损失函数包括重建损失lr、对抗损失lu和监督损失ls,并构建如下目标函数:
[0014][0015][0016][0017][0018]
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,为恢复后的静态特征向量,x
t
为t时刻的时态特征向量,为恢复后的t时刻的时态特征向量,ys为真实静态特征分类结果,y
t
为t时刻的真实时态特征分类结果,为生成的静态特征分类结果,为t时刻生成的时态特征分类结果,hs为潜在静态表征,h
t
为t时刻的潜在时态表征,h
t-1
为t-1时刻的潜在时态表征,z
t
为t时刻的时态随机向量,g
χ
为时态特征生成网络,为服从随机变量s,x
1:t
概率分布p的期望,为服从随机变量s,x
1:t
生成概率分布的期望;
[0019]
s3、将故障样本输入改进timegan模型生成故障数据;
[0020]
s4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
[0021]
1)设输入信号为离散信号分解操作计算如下:
[0022][0023]
其中,n为离散时间序列,k为时移因子,n为尺度因子,i为层数,其中,n为离散时间序列,k为时移因子,n为尺度因子,i为层数,为待分解的分量(0≤i≤2
n-1),为低频时小波包系数,为高频时小波包系数,h0(
·
)为低通滤波器,g0(
·
)为高通滤波器;
[0024]
2)重构操作计算如下:
[0025][0026]
其中,为低频信号分量,为高频信号分量,h1(
·
)为高通滤波器,g1(
·
)为低通滤波器;
[0027]
s5、将提取的时频特征划分为训练集和测试集,并将训练集输入cnn模型中进行训练,获得训练好的cnn模型;
[0028]
s6、将测试集输入训练好的cnn模型,获得故障诊断结果并对故障诊断结果进行验证。
[0029]
优选地,cnn模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
[0030]
优选地,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为relu函数,输出层选用softmax分类器。
[0031]
优选地,小波包分解采用db3小波基。
[0032]
优选地,目标函数满足λ=1,η=10。
[0033]
与现有技术相比,本发明的有益效果为:
[0034]
该方法将最小二乘损失函数引入时间序列生成对抗网络(timegan)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合cnn模型强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
附图说明
[0035]
图1为本发明基于改进timegan模型的小样本故障诊断方法的流程图;
[0036]
图2为本发明小波包分解提取的时频特征示意图;
[0037]
图3为本发明的cnn模型结构示意图;
[0038]
图4为本发明所提方法、bp、lstm、gan cnn和wpd bp五种方法的准确率对比图。
具体实施方式
[0039]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0040]
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本技术。
[0041]
如图1-4所示,一种基于改进timegan模型的小样本故障诊断方法,包括如下步骤:
[0042]
s1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本。电梯运行数据可通过加速度传感器采集获得。
[0043]
s2、建立改进timegan模型,改进timegan模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
[0044]
嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
[0045]
恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数基于前馈网络实现;
[0046]
序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
[0047]
序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
[0048]
改进timegan模型的损失函数包括重建损失lr、对抗损失lu和监督损失ls,并构建如下目标函数:
[0049][0050][0051][0052][0053]
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,为恢复后的静态特征向量,x
t
为t时刻的时态特征向量,为恢复后的t时刻的时态特征向量,ys为真实静态特征分类结果,y
t
为t时刻的真实时态特征分类结果,为生成的静态特征分类结果,为t时刻生成的时态特征分类结果,hs为潜在静态表征,h
t
为t时刻的潜在时态表征,h
t-1
为t-1时刻的潜在时态表征,z
t
为t时刻的时态随机向量,g
χ
为时态特征生成网络,为服从随机变量s,x
1:t
概率分布p的期望,为服从随机变量s,x
1:t
生成概率分布的期望。
[0054]
在一实施例中,目标函数满足λ=1,η=10。
[0055]
其中,该方法通过结合timegan模型和最小二乘对抗网络(least square generative adversarial networks,lsgan)中的最小二乘损失函数得到ls-time gan模型(即改进timegan模型),改进timegan模型包括:嵌入网络(embedding network)、恢复网络(recovery network)、序列生成器和序列判别器。嵌入网络和恢复网络作为自编码组件与
作为对抗组件的序列生成器和序列判别器联合训练,以使模型在随时间迭代的过程中同时学习特征分布和变量间潜在关系。嵌入网络为对抗网络(序列生成器和序列判别器)提供了潜在空间(latent space),真实数据和生成数据的潜在动态关联性(temporal dynamics)通过监督损失实现同步,具体如下:
[0056]
2.1)嵌入网络和恢复网络
[0057]
嵌入函数和恢复函数提供了特征和潜在空间之间的映射,允许对抗网络通过低维表示来学习数据之间的潜在时间动态。
[0058]
设hs、h
χ
分别为静态特征向量空间s和时态特征向量空间χ对应的潜在向量空间,嵌入函数e:s
×
π
t
χ
→hs
×
π
thχ
将静态特征和时态特征转化为潜在表征(latent representations)hs,h
1:t
=e(s,x
1:t
),嵌入函数e通过循环网络实现:
[0059]hs
=es(s),
ꢀꢀꢀꢀꢀꢀꢀht
=e
χ
(hs,h
t-1
,x
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0060]
其中,es:s
→hs
为静态特征的嵌入网络,e
χ
:hs×hχ
×
χ
→hχ
为时间特征的嵌入网络,hs为潜在静态表征,h
t
为t时刻的潜在时态表征,h
1:t
为[1,t]区间的潜在时态表征集合,t为时间,s为静态特征向量,x
1:t
为[1,t]区间的时态特征向量集合,h
t-1
为t-1时刻的潜在时态表征,x
t
为t时刻的时态特征向量。
[0061]
与之相反,恢复函数r:hs×
π
thχ
→s×
π
t
χ将潜在表征hs,h
1:t
=e(s,x
1:t
)恢复为它们原本的静态特征和时态特征,结果表示为恢复函数r通过前馈网络实现:
[0062][0063]
其中,rs:hs→
s为静态特征嵌入的恢复网络,r
χ
:h
χ

χ为时态特征嵌入的恢复网络,为恢复后的静态特征向量,为恢复后的t时刻的时态特征向量,为恢复后的[1,t]区间的时态特征向量集合。
[0064]
2.2)序列生成器和序列判别器
[0065]
序列生成器不直接在特征空间输出生成数据,而是先输出到嵌入网络的输出空间。设zs,z
χ
分别表示已知分布的静态特征向量空间和时态特征向量空间,并从中提取随机向量作为静态随机向量和时态随机向量输入生成hs,h
χ

[0066]
然后生成函数g:zs×
п
tzχ
→hs
×
п
thχ
将静态随机向量和时态随机向量转换为合成潜在编码生成函数g通过循环网络实现:
[0067][0068]
其中,gs:zs→hs
为静态特征生成网络,g
χ
:hs×hχ
×zχ
→hχ
为时态特征生成网络,为合成潜在静态表征,为[1,t]区间的合成时态特征向量集合,zs为静态随机向量,z
1:t
为[1,t]区间的时态随机向量集合,为t时刻的合成潜在时态表征,为t-1时刻的合成潜在时态表征,z
t
为t时刻的时态随机向量,遵循随机过程。
[0069]
最后,序列判别器也从嵌入网络的输出空间进行操作。判别函数d:hs×
п
thχ

[0,
1]
×
п
t
[0,1]接收合成潜在编码,返回分类结果d通过一个带有前馈输出层的双向循环网络实现:
[0070][0071]
其中,和分别表示前向和后向隐藏状态序列,为前向循环函数,为后向循环函数,ds为静态特征输出层分类函数,d
χ
为时态特征输出层分类函数,为静态特征分类结果,为t时刻的时态特征分类结果,为[1,t]区间的时态特征分类结果集合,代表hs或或代表h
1:t
或即表示真实数据的(h
*
)或合成数据的嵌入;类似地,表示真实数据(y
*
)或合成数据的分类结果,*号表示任意下标,真实数据(原始数据)即采集的电梯运行数据。
[0072]
2.3)目标函数
[0073]
作为特征空间和潜在空间之间的可逆映射,嵌入函数应该能够从原始数据s,x
1:t
中提取其潜在表征hs,h
1:t
,恢复函数能从其潜在表征hs,h
1:t
中精确重构原始数据的特征分布目标函数总体定义为:
[0074][0075]
其中,θe、θr、θg、θd分别表示嵌入网络、恢复网络、序列生成器和序列判别器的参数。λ≥0、η≥0是分别平衡两种损失的超参数,本实施例设λ=1,η=10。
[0076]
其中,重建损失(reconstruction loss)计算如下:
[0077][0078]
对抗损失采用最小二乘损失函数,计算如下:
[0079][0080]
现有技术对抗损失采用交叉熵损失只关注分类结果是否正确,并不关注距离,所以很容易达到饱和状态,而最小二乘损失只在一点达到饱和,可以使训练过程更加稳定,生成数据质量更高;
[0081]
应用最大似然法定义监督损失(supervised loss):
[0082][0083]
其中,当对抗损失lu推动生成器创建逼真的序列,监督损失ls进一步确保它产生类似的逐步依赖关系。
[0084]
s3、将故障样本输入改进timegan模型生成故障数据。
[0085]
具体地,表1是改进timegan、timegan和1dgan三种方法的判别分数
(discriminative score)和预测分数(predictive score)。判别分数和预测分数是定性度量生成数据与原始数据之间差异性的指标,数值越小说明两者越接近。
[0086]
表1
[0087][0088]
从表1可以看出,与其他方法相比,本技术的改进timegan在原始数据与生成数据的判别分数和预测分数上得分更低,说明它生成的数据与原始数据差距最小,质量和实用性也更好。
[0089]
s4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
[0090]
1)设输入信号为离散信号分解操作计算如下:
[0091][0092]
其中,n为离散时间序列,k为时移因子,n为尺度因子,i.e.为层数,其中,n为离散时间序列,k为时移因子,n为尺度因子,i.e.为层数,表示待分解的分量(0≤i≤2
n-1),和为小波包系数,h0(
·
)为低通滤波器,g0(
·
)为高通滤波器;
[0093]
2)重构操作计算如下:
[0094][0095]
其中,和为信号分量,h1(
·
)为高通滤波器,g1(
·
)为低通滤波器。
[0096]
其中,小波包分解可以同时分解信号的低频和高频部分,适用于处理具有高频扰动和强背景噪声的非平稳振动信号。小波包是为了克服小波分解在高频段分辨率较差、而在低频段分辨率较好的问题提出的,是一种更精细的信号分析方法,提高了信号的时频分辨率。
[0097]
在一实施例中,小波包分解采用db3小波基。
[0098]
其中,将原始数据和生成的故障数据合并为样本集,并利用小波包分解(wavelet packet decomposition,wpd)经过分解运算得到小波包系数后,再进行重构运算得到分量,提取样本集的时频特征。
[0099]
具体的:运用db3小波基,对电梯运行数据(如电梯振动信号)进行3层小波包分解重构,得到8个故障特征值组成的特征向量重构,得到8个故障特征值组成的特征向量如图2所示,时频特征包括各节点频段信号及对应频谱,左侧为经过重构的各节点频段信号,右侧为相应的傅里叶频谱。
[0100]
本实施例采用的传感器采样频率为512hz,根据香农采样定理,奈奎斯特采样频率为256hz,信号经过小波包三层分解后包含2^3=8个频率段,每个频率段的频率区间为256/8=32hz,因此经过小波包分解后的重构信号应分布于[0-32hz,32-64hz,64-96hz,96-128hz,128-160hz,160-192hz,192-224hz,224-256hz]之间,和频谱图相符。而且从频谱图中可以看出各节点频谱差异较明显,频域区间重叠较少,因此小波包三层分解可以有效提取电梯振动信号的时频特征。
[0101]
s5、将提取的时频特征划分为训练集和测试集,并将训练集输入cnn模型中进行训练,获得训练好的cnn模型。
[0102]
在一实施例中,cnn模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
[0103]
在一实施例中,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为relu函数,输出层选用softmax分类器。
[0104]
具体地,cnn模型如图3所示,输入特征图(即时频特征)的大小为100
×
100
×
3;第一到第四卷积层的卷积核个数分别为32、64、128和128,第一和第二卷积层的卷积核大小为5
×
5,第三和第四卷积层的卷积核大小为3
×
3,激活函数选择relu函数;池化层的池化方式选择最大池化,即对输入特征图求其p
×
p区域内的最大值,区域大小取2
×
2;第一全连接层的节点数为1024,第二全连接层的节点数为512;输出层节点数为输入样本数的类别数,分类器选择softmax分类。
[0105]
表2为不同数量原始样本添加不同数量生成样本后,提取的时频特征输入cnn模型的准确率。其中,cnn模型学习率统一设为0.001,训练集与测试集比例为4:1,步长为8。
[0106]
表2
[0107]
[0108][0109]
从表2可以看出,样本总数量相近时不平衡比例越低训练效果越好,不平衡比例相同时样本越多训练效果越好。从样本集1的训练结果可以看出,虽然数据量过少时训练集准确率能达到91%,但是模型泛化性差,测试集准确率只有75%,验证了样本扩充的必要性。样本集3和4的准确率差别较小,说明了生成样本与原始样本差异较小,再次证明了改进timegan的有效性。样本集10的准确率并没有达到平衡样本的效果,相较于不平衡比例相同但样本数较少的样本集1、3、4、7,准确率反而下降。这是由于生成器模型本身也存在误差,当生成样本数多于原始数据时可能会使误差增大,造成适得其反的效果,因此往往生成样本数和原始样本数相等时就停止扩充样本。综上,添加512个生成样本至训练集的训练效果最好,因此训练集准确率对比实验采用样本集7作为训练集。
[0110]
参照图4,bp神经网络训练周期最长且准确率最低,lstm训练周期最短但准确率同样不高,原始gan和cnn结合方法的准确率可达到94.41%,相较于cnn模型略有提升,wpd bp神经网络的效果较好,准确率为95.75%,比bp神经网络提高了近6%,验证了wpd的有效性。和以上四种方法相比,本文方法结合了生成模型(timegan模型)、wpd和cnn的优势,在数据集相同情况下,训练准确率达到了99.01%,显著提升了模型训练效果。
[0111]
s6、将测试集输入训练好的cnn模型,获得故障诊断结果并对故障诊断结果进行验证。
[0112]
表3为不同方法不同样本下的平均测试准确率,测试集准确率可以反映模型的泛化能力,也是判断模型最终故障诊断效果的重要指标。
[0113]
表3
[0114]
[0115][0116]
从表3可以看出,极限学习机(extreme learning machine,elm)算法的准确率最低,只有79.76%,bp神经网络次之;而经过wpd分解后,bp神经网络准确率提升至94.05%,优于其他算法,说明了bp、lstm、svm等浅层机器学习算法难以充分提取振动信号中的特征,以及wpd在特征提取方面的优势;cnn模型的准确率高于其他浅层机器学习算法,验证了其强大的特征提取能力;而经过原始gan扩充样本后再输入到cnn中分类的准确率并没有提升,甚至有所下降,因为原始gan等生成模型虽然能生成以假乱真的图片,但是无法考虑振动信号间的时序关系,难以处理一维数据。本方法在平衡样本集和不平衡样本集下的准确率均高于其他方法,在样本集7下的准确率达到95.19%,相较于样本扩充和wpd处理前有明显提升,充分体现了本技术基于改进timegan模型的小样本故障诊断方法的有效性。
[0117]
本技术基于改进timegan模型的小样本故障诊断方法将最小二乘损失函数引入时间序列生成对抗网络(timegan)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合cnn卷积神经网络强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
[0118]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0119]
以上所述实施例仅表达了本技术描述较为具体和详细的实施例,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献