一种基于生成对抗网络的旋转机械小样本故障诊断方法与流程

2022-02-25 20:36:53 来源：中国专利 TAG：

1.本发明涉及旋转机械故障诊断技术领域，尤其涉及一种基于生成对抗网络的旋转机械小样本故障诊断方法。

背景技术：

2.旋转机械在航空航天、船舶、风电和石化等领域应用十分普遍，是工业场景中关键的部件之一，同时也是一种容易发生故障的设备。旋转机械大多是一种循环对称结构，在正常工况下是稳定的。然而，当旋转机械失效时，其对称性被破坏，导致性能不稳定，容易造成重大事故。为避免旋转机械发生灾难性故障，对其运行状态进行连续监测和诊断具有重要意义。
3.旋转机械运行状态通常可以通过测量振动、噪声和油液等信号进行检测和诊断。目前，振动信号的采集与分析技术比较成熟，基于振动信号的旋转机械故障诊断是最常用且应用最广的方法之一。旋转机械的振动信号特征比较复杂，非专业人士一般不了解也无法识别振动信号的故障特征，所以基于多学科交叉的智能故障诊断研究是目前旋转机械故障诊断的主要发展方向。但智能故障诊断方法训练过程中需要从大量历史数据中学习对应的数据分布，从而实现准确的故障诊断。然而在实际工业场景下，由于：1)故障发生率低，难以采集全面的对应于各种健康状态的真实运行数据；2)旋转机械故障注入实验成本高，且存在很大风险，可能危及人员安全和财产安全；3)即使有大量运行监测数据，对这些数据进行有效标注需要消耗大量人力物力，成本极高，所以通常难以获得足够的有效标注的各类数据用于模型训练。因此，亟需研发一种只需小样本进行训练就可达到高精度故障诊断结果的诊断方法。

技术实现要素：

4.本发明的目的在于提供一种基于生成对抗网络的旋转机械小样本故障诊断方法，从而解决现有技术中存在的前述问题。
5.为了实现上述发明目的，本发明采用的技术方案如下：
6.一种基于生成对抗网络的旋转机械小样本故障诊断方法，包括以下步骤：
7.s1:采集旋转机械的振动信号；
8.s2:对旋转机械振动信号进行预处理，划分为训练集和测试集；
9.s3:建立acwgan-gp-argmax网络模型；
10.s4:对所述acwgan-gp-argmax网络模型进行训练；
11.s5:对所述训练集中每种健康状态下的数据分别进行对抗训练，并将训练好的网络模型融合成一个诊断模型；
12.s6：将所述测试集输入所述诊断模型中进行诊断测试，并输出诊断结果。
13.进一步，所述步骤s1具体实现方式包括将振动加速度传感器布置在旋转机械上，利用所述振动加速度传感器采集所述旋转机械各种健康状态下一维时间序列振动加速度
的数据，形成原始数据集，所述原始数据集包含1种正常状态和n-1 种故障状态。
14.进一步，所述步骤s2具体实现方式包括通过快速傅里叶变换和标准归一化的处理方式，将所述原始数据集中各种健康状态下的振动信号进行特征提取，并将处理后的数据构建成新数据集；
15.所述标准归一化方法为：x＝(x-x
min
)/(x
max-x
min
)，其中x
max
是数据样本的最大值，x
min
是数据样本的最小值；
16.根据算法需求，将所述新数据集分成训练集和测试集两部分，所述训练集表示为其中k代表第k种健康状态，为该健康状态下第i个训练样本。
17.进一步，所述步骤s3中所述acwgan-gp-argmax网络模型包括生成器和鉴别器；
18.所述生成器表现为一种包括5层反卷积层的网络模型结构，输入数据是一种服从正态分布的4096维的随机噪声；在所述生成器中，首先将所述随机噪声输入到一个由4096个神经元组成的全连接层中，然后依次通过所述5层反卷积层；其中，前四层反卷积层中滤波器个数依次是256个、128个、64个、32个，最后一层反卷积层只有1个滤波器；第一层反卷积层卷积核的大小是4
×
4且步长为1，后四层反卷积层卷积核的大小都是3
×
3且步长为2；经过所述五层反卷积层，输入数据被转换成一个64
×
64二维矩阵；
19.所述判别器表现为一种包括5层卷积层的网络模型结构，输入数据是所述生成器生成的64
×
64二维矩阵与真实数据经过整形得到的64
×
64二维矩阵；在所述判别器中，前四层卷积层中滤波器个数依次是32个、64个、128个、256个，最后一层卷积层只有1个滤波器；前四层卷积层卷积核的大小是3
×
3且步长为2，最后一层卷积层卷积核的大小都是4
×
4且步长为1；经过所述五层卷积层，输入数据被转换成一个标签数值。
20.进一步，所述步骤s4具体实现方式包括选取高斯分布作为噪声分布p
noise
，并赋予相应的类别标签，从中采样大小为n的子集，记为将带类别标签的随机噪声子集输入到健康状态k对应的生成器gk，前向传播得到生成样本子集从所述健康状态k的真实数据训练集p
k～data
中进行数据采样作为正样本，记为再从所述健康状态k之外的真实数据训练集p
(c≠k)～data
中进行数据采样作为负样本，记为由和组成所述健康状态k情况下的真实样本，通过与生成样本组合，构成训练集子集{xk}；
21.设定所述判别器dk与所述生成器gk训练次数的比例为m，首先用所述训练集子集{xk}和adam算法对所述判别器dk进行m次训练；然后用所述带类别标签的随机噪声子集和adam算法对所述生成器gk进行1次训练；选择交叉熵损失函数为目标函数，具体定义如下：
[0022][0023][0024]
其中x表示真实样本，表示生成样本，是通过在x和线性插
值获得的随机样本，λ是梯度惩罚因子，表示真实数据分布的期望，表示生成数据分布的期望，表示梯度惩罚项，p(c＝c|x
real
)表示类标签上真实数据的条件概率分布，表示类标签上生成数据的条件概率分布，
[0025]
按照上述每轮训练次数比例m，对所述判别器dk与所述生成器gk进行迭代训练，直至所述判别器dk与所述生成器gk之间达到纳什均衡。
[0026]
进一步，所述步骤s5具体实现方式包括，
[0027]
第一，将除第k种健康状态之外的数据样本标记为负样本，标注为第0类；相应地，将第k种健康状态下的数据样本标记为正样本，标注为第1类；
[0028]
第二，把标注好的数据作为真实样本输入到所述判别器dk中进行对抗训练，直至模型损失函数收敛到最小值，从而得到第k类样本的生成器和判别器；
[0029]
第三，轮流对每类样本进行上述训练，获得n个训练好的acwgan-gp-argmax 模型；从中将n个判别器分离出来，作为训练好的诊断模型；
[0030]
第四，将所述n个判别器进行模型融合，将输出结果的概率值组合成n维向量，接入softmax激活层进行激活，使得输出层输出的每个值对应测试样本隶属于每一种健康状态的概率。
[0031]
进一步，所述步骤s4和所述步骤s5之间还包括步骤s500：对经过所述步骤s4 训练的网络模型进行质量评估，若不能通过评估，则重复所述步骤s4。
[0032]
进一步，所述步骤s500中所述质量评估包括：
[0033]
第一，评估所述生成器gk的生成能力，具体方法是先定性地比较生成样本与真实样本的频谱，然后通过计算生成样本与真实样本的皮尔逊相关系数(pcc)和余弦相似度(cs)来定量地测量它们的相似度；
[0034]
第二，评估所述判别器dk的分类识别能力，具体利用训练好的所述判别器dk生成数据样本，若所述判别器dk能够生成足够逼真的生成样本，则进一步利用这些生成样本不断对所述判别器dk进行训练，使得所述判别器dk学习到当前样本中的隐藏分布。
[0035]
本发明的有益效果是：
[0036]
1)本发明在acwgan-gp模型的基础上，引入了“argmax”多分类思想，使 acwgan-gp-argmax模型既具备强大的生成能力，又具备强大的分类识别能力。
[0037]
2)本发明对生成对抗网络和故障诊断模型进行了集成，克服了生成对抗网络无监督条件下不能进行分类的缺点，因此，本发明可以直接利用数据集实现故障诊断，无需额外引入判别模型。
[0038]
3)本发明提出的基于生成对抗网络的旋转机械小样本故障诊断模型具有结构简单，参数少的优点，对硬件资源要求低，经济性高，经齿轮箱数据集和轴承数据集实验证明本发明可以有效提高旋转机械小样本故障诊断的准确率，且具有一定的泛化能力。
附图说明
[0039]
图1是本发明基于生成对抗网络的旋转机械小样本故障诊断方法的基本流程图；
[0040]
图2是本发明的实施例实现流程图；
[0041]
图3是本发明所述的acwgan-gp-argmax网络模型结构图；
[0042]
图4是本发明所述的实施例中8类齿轮箱原始振动信号时域图；
[0043]
图5是本发明所述的实施例中各类生成数据与原始数据频谱对比图；
[0044]
图6是本发明所述的实施例中不同样本比例条件下10独立实验的诊断结果；
[0045]
图7是本发明所述的实施例中不同样本比例条件下10独立实验诊断结果的平均值；
[0046]
图8是本发明所述的实施例中不同样本比例条件下10独立实验诊断结果的平均值的混淆矩阵；
[0047]
图9是本发明所述的实施例中不同诊断方法在不同样本比例条件下10独立实验诊断结果的平均值。
具体实施方式
[0048]
本发明基于生成对抗网络的旋转机械小样本故障诊断方法包括以下步骤：
[0049]
s1:采集旋转机械的振动信号。将振动加速度传感器布置在旋转机械上，利用所述的振动加速度传感器采集旋转机械各种健康状态下一维时间序列振动加速度的数据，获取原始数据集，该数据集包含1种正常状态和n-1种故障状态。
[0050]
s2:对旋转机械振动信号进行预处理。通过快速傅里叶变换(fft)和标准归一化等处理方式，将数据集中各种健康状态下的振动信号进行特征提取，并将处理后的数据构建成新的数据集。所述的标准归一化方法为： x＝(x-x
min
)/(x
max-x
min
)，其中x
max
是数据样本的最大值，x
min
是数据样本的最小值。根据算法需求，将新数据集分成训练集和测试集两部分。训练集可表示为其中k代表第k种健康状态，为该健康状态下第i个训练样本。
[0051]
s3:建立对应健康状态的acwgan-gp-argmax网络模型。考虑到cnn在特征提取和分类方面的优异性能，因此本发明在二维cnn的基础上建立了生成器和鉴别器。
[0052]
所述生成器的网络模型结构由5层反卷积层组成，输入数据是一种服从正态分布的4096维的随机噪声。在生成器中，首先将随机噪声输入到一个由4096个神经元组成的全连接层中，然后依次通过5个反卷积层。其中，前四层反卷积层中滤波器个数依次是256个、128个、64个、32个，最后一个反卷积层只有1个滤波器；第一个反卷积层卷积核的大小是4
×
4且步长为1，后四层反卷积层卷积核的大小都是3
×
3且步长为2；经过五个反卷积层，输入数据被转换成一个64
×
64 二维矩阵。
[0053]
所述判别器的网络结构与生成器是对称的。判别器的网络模型结构由5层卷积层组成，输入数据是生成器生成的64
×
64二维矩阵与真实数据经过整形得到的64
×
64二维矩阵。在判别器中，前四层卷积层中滤波器个数依次是32个、64 个、128个、256个，最后一个卷积层只有1个滤波器；前四层卷积层卷积核的大小是3
×
3且步长为2，最后一层卷积层卷积核的大小都是4
×
4且步长为1；经过五个卷积层，输入数据被转换成一个标签数值。
[0054]
s4:对所述网络模型进行训练。选取高斯分布作为噪声分布p
noise
，并赋予相应的类别标签，从中采样大小为n的子集，记为将带类别标签的随机噪声子集输入到健康状态k对应的生成器gk，前向传播得到生成样本子集从健康状态k的真实数据训练集p
k～data
中进行数据采样作为正样本，记为再从健康状态k之外的
真实数据训练集p
(c≠k)～data
中进行数据采样作为负样本，记为由和组成健康状态k情况下的真实样本，通过与生成样本组合，构成训练集子集{xk}。设定判别器dk与生成器gk训练次数的比例为m，首先用训练集子集{xk}和adam算法对判别器dk进行m次训练；然后带类别标签的随机噪声子集和adam算法对生成器gk进行1次训练；选择交叉熵损失函数为目标函数，具体定义如下：
[0055][0056][0057]
其中x表示真实样本，表示生成样本，是通过在x和线性插值获得的随机样本，λ是梯度惩罚因子，表示真实数据分布的期望，表示生成数据分布的期望，表示梯度惩罚项，p(c＝c|x
real
)表示类标签上真实数据的条件概率分布，表示类标签上生成数据的条件概率分布，
[0058]
按照上述每轮训练次数比例m，对所述判别器dk与所述生成器gk进行迭代训练，直至所述判别器dk与所述生成器gk之间达到纳什均衡。
[0059]
s5:对经过s4训练的网络模型进行质量评估。一般从两个方面对训练过的模型进行质量评估。一是定性和定量的评估生成样本的相似度，既评估模型生成器的生成能力。具体方法是先定性地比较生成样本与真实样本的频谱，然后通过计算生成样本与真实样本的皮尔逊相关系数(pcc)和余弦相似度(cs)来定量地测量它们的相似度；二是通过样本扩充评估生成样本对小样本情况下对故障诊断的影响，即评估模型判别器的分类识别能力。利用训练好的生成器生成数据样本，若生成器能够生成足够逼真的生成样本，则进一步利用这些生成样本不断对判别器进行训练，使得判别器dk学习到当前样本中的隐藏分布。
[0060]
s6:对数据集中每种健康状态下的数据分别进行对抗训练，第一，将除第k种健康状态之外的数据样本标记为负样本，标注为第0类；相应地，将第k种健康状态下的数据样本标记为正样本，标注为第1类。第二，把标注好的数据作为真实样本输入到判别器中进行对抗训练，直至模型损失函数收敛到最小值，从而得到第k类样本的生成器和判别器。第三，轮流对每类样本进行上述训练，获得 n个训练好的acwgan-gp-argmax模型。从中将n个判别器di分离出来，作为训练好的诊断模型。第四，将di进行模型融合，通过模型融合将n个di输出结果的概率值组合成n维向量，接入softmax激活层进行激活，使得输出层输出的每个值对应测试样本隶属于每一种健康状态的概率。
[0061]
至此，实现了完整的故障诊断过程。
[0062]
为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式和实施例仅仅用以解释本发明，并不用于限定本发明。
[0063]
实施例：
[0064]
图2是本发明基于生成对抗网络的旋转机械小样本故障诊断方法的实施例实现流程图。如图2所示，本发明基于生成对抗网络的旋转机械小样本故障诊断方法的具体步骤包括：
[0065]
s1:利用振动加速度传感器采集旋转机械振动信号。
[0066]
s2:对采集到的旋转机械振动信号进行数据预处理，构建成原始数据集，并将原始数据集划分为训练集和测试集。
[0067]
s3:构建基于acwgan-gp-argmax的网络模型。
[0068]
s4:对基于acwgan-gp-argmax的网络模型进行模型训练，并将每种健康状态下训练好的网络模型进行融合，构建成一个诊断模型。
[0069]
s5:将测试集输入到诊断模型中进行诊断测试。
[0070]
图3是本发明所述的acwgan-gp-argmax网络模型结构图。如图3所示， acwgan-gp-argmax网络模型包含以下几个模块：生成器模块、判别器模块、数据输入模块和诊断模块。
[0071]
下面通过一个实例对本发明及其效果进行具体说明。
[0072]
本实例的实验数据来自于2009年ieee phm挑战赛提供的齿轮箱数据集，该数据集是通用工业变速箱数据的代表。变速箱的实物图如图3所示。数据集一共包含8种不同健康状态的时域振动信号。数据集中所有数据都是在高负载条件下从输入轴端采集的，轴的转速为30hz，采样频率为66.7khz，采样时间为4s。在保证齿轮箱诊断信号所包含信息不丢失的前提下，选取每类健康状态数据样本各400个。样本长度为8192，因为每个样本都是一个时域信号，所以经过fft变换后，每类数据样本就变成了样本长度为4096的频谱向量。所用样本的详细情况见表1，其时域波形如图4所示。
[0073]
表1齿轮箱数据集运行模式详细说明
[0074][0075]
is:input shaft；id:idler shaft；os:output slide.
[0076]
g:good；c:chipped；e:eccentric；br:broken；b:ball；i:inner race；o:outer race；im:imbalance；k:keyway sheared.
[0077]
将数据集中每类健康状态下的样本各取200个分别作为训练集和用于测试。从训练集中取部分样本作为训练子集，把训练子集样本数量与测试集样本数量之比称为样本比例。实验中把样本比较分别按照1:20、1:10、1:5、1:4、1:2、 1:1进行划分，表2表示每种样本比例中各类训练样本的数量。在对抗训练过程中，将样本比例为1:20时minibatch的大小设置为8，其余情况下minibatch 的大小均设置为16。每轮对抗训练过程中，将判别器与生成器更新迭代次数之比设置为5:1，即判别器每更新5次，生成器更新1次。学习率设置为
0.0001，训练迭代次数为10000；对于学习第k种健康状态的判别器来说，选取第k种健康状态下的全部训练样本作为正样本，标记类别为1，在剩余7种健康状态的训练样本中各选取部分样本作为负样本，标记类别为0，此时正样本与负样本的数量应保持大致相等。
[0078]
表2不同样本比例条件下各类健康状态中训练样本的数量
[0079][0080][0081]
在网络模型进行预训练之后，利用每个生成器模型为各类健康状态生成200 个新样本。为了评价新样本，首先，将真实样本和生成样本的频谱在同一个图中进行可视化展示，如图5所示；其次，通过相似度指标pcc和cs的值对生成样本进行评估，相似度指标pcc和cs的值如表3所示。
[0082]
表3每类健康状态下生成数据与原始数据之间的pcc和cs
[0083][0084]
从图5中可以看出，每个健康状态的生成样本与真实样本重合度都很高；如表3所示，所有健康状态样本的pcc和cs均高于0.5，说明生成样本与真实样本的相似度较高。综上表明，经过对抗训练的生成器能够准确地学习到真实样本中隐含的数据分布，并生成与真实样本相似度很高的样本。
[0085]
为了测试本发明提出的基于acwgan-gp-argmax的故障诊断方法的性能，安排了基于acwgan-gp诊断模型的对比实验。针对每种样本比例，分别进行10次独立实验，实验结果如图6、图7所示。其中data1代表acwgan-gp诊断模型， data2代表acwgan-gp-argmax诊断模型。从图6可以看出，acwgan-gp-argmax 诊断模型与acwgan-gp诊断模型相比，在诊断准确度及稳定性方面都有明显的提高。从图7可以看出，随着训练样本比例的增加，acwgan-gp-argmax诊断模型与acwgan-gp诊断模型的诊断准确度都有明显提高，但acwgan-gp-argmax诊断模型诊断效果更好。为了更加直观的解释acwgan-gp-argmax诊断模型的诊断结果，以每种样本比例诊断过程为例，利用混淆矩阵进行可视化展示，如图8 所示。从图8中可以看出，当样本比例为1:20时，其中class2,4,6,8都有部分数据被分类错误。随着样本比例逐渐增大，样本诊断准确率也逐渐提高，当样本比例达到1:1时，只有极少数样本被分类错误。
[0086]
为了证明本发明方法的优越性，我们采用几种常用方法与 acwgan-gp-argmax在解决故障诊断小样本问题方面进行了比较，常用方法有： cnn、dnn、svm、sae、gan。通过对每个方法进行相同条件下训练和测试，得到以上所有方法的故障诊断准确率，如图9所示。
[0087]
从图9可以看出，所有方法的故障准确率都随着样本比例的增大，说明这些方法在故障诊断方面都是有效的。同时，从图9中也可以明显的看出，本发明提出的方法相对于
其他几种方法在小样本情况下的故障诊断准确率更高，效果更好。
[0088]
综上，本发明所述的一种基于生成对抗网络的旋转机械小样本故障诊断方法，通过将生成对抗网络与“argmax”多分类思想相结合，构建基于 acwgan-gp-argmax的诊断模型，可以有效地提高旋转机械小样本故障诊断的准确率。
[0089]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：网页同步任务中数据表字段映射关系展示方法和装置与流程

一种基于生成对抗网络的旋转机械小样本故障诊断方法与流程

相关文献

最热文献