一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种小样本故障诊断方法、装置及存储介质

2022-11-19 14:24:43 来源:中国专利 TAG:


1.本发明涉及工业故障诊断领域,尤其是涉及一种基于重构对抗网络的小样本故障诊断方法、装置及存储介质。


背景技术:

2.数据驱动的智能工业故障诊断算法具有重要的研究意义。实际的工业生产过程中,常常面临着各类型故障数据相对数量分布不均衡问题,传统的学习方法以提升整体准确率为目标,对样本个体一视同仁,往往无法及时发现少数类别故障的存在,导致严重的后果。此外该类型故障往往同时面临着数据绝对数量稀少的问题,进一步加大了模型的训练难度,使得该故障特征无法被充分提取。
3.近年来,基于深度学习的人工智能算法发展迅速,生成对抗网络(generative adversarial network,gan)是一种基于博弈论思想构造的无监督学习模型,在数据生成性能与框架灵活性方面具有极大的研究价值及优化潜力。
4.生成对抗网络(gan)是ian goodfellow等人与2014年nips会议上提出的一种基于博弈论创新的网络架构。其主要思想是通过内部判别器(d)和生成器(g)互相博弈,持续优化,从而达到以假乱真的生成效果。
5.支持向量机(support vector machine,svm)是一种常用的监督学习分类器模型,其目标是根据输入的样本数据,寻找最优分类超平面。在模式识别,回归分析等领域有着广泛的应用。
6.包括svm在内的传统分类器算法在面临工业不平衡数据时无法做到区别对待,最终会得出一个永远返回正类的模型。这种结果完全忽视故障数据的存在,在实际应用中可能导致严重的后果。
7.工业故障数据有着维度高,类别多,样本少等特点,很难利用现有对抗生成算法完成数据的有效补充。一维卷积生成对抗网络较为适用于工业数据故障诊断问题,却未考虑样本绝对数量较少,特征信息不足无法支持网络收敛的问题。


技术实现要素:

8.本发明的目的就是为了提供一种基于重构对抗网络的小样本故障诊断方法、装置及存储介质,解决不平衡数据分类过程中所面临的分类准确率较低、传统分类方法及评价指标不再适用、现有方法忽视故障数据类内间距等问题。
9.本发明的目的可以通过以下技术方案来实现:
10.一种基于重构对抗网络的小样本故障诊断方法,包括以下步骤:
11.获取未标记的初始工业数据;
12.建立生成对抗网络,所述生成对抗网络包括由反卷积网络构成的生成器和由卷积网络构成的判别器,其中,所述判别器用于辅助生成器生成合成数据;
13.基于真实工业数据样本和虚拟工业数据样本对生成对抗网络进行对抗训练;
14.将初始工业数据输入训练完成的生成对抗网络,得到包含新增数据的合成数据训练样本集;
15.基于初始工业数据训练svm分类器;
16.数据筛选:利用svm分类器的输出对新增数据进行筛选,基于筛选通过的样本更新合成数据训练样本集;
17.重构svm:基于更新的合成数据训练样本集对svm分类器进行重构训练;
18.重新进行数据筛选和重构svm,重复预配置的次数后,得到重构完成的svm分类器;
19.基于重构完成的svm分类器对初始工业数据进行诊断,得到故障诊断结果。
20.所述生成对抗网络的损失函数为:
[0021][0022]
式中,g代表生成器,d代表判别器,z为输入的随机噪声,x为初始工业数据,min
g maxdv(d,g)表示,判别器的优化目标是使得目标函数v最大,生成器的优化目标是使得目标函数v最小。
[0023]
所述生成器生成合成数据的方法具体为:
[0024][0025]
式中,x1代表已有故障类别数据,为生成器利用已有数据生成的新增故障类别数据,x1与叠加之后得到合成数据。
[0026]
所述随机噪声z输入后利用全连接层进行映射,经过反卷积网络扩充,将维度补全至与工业数据的维度一致。
[0027]
所述反卷积网络第i层的输出尺寸loi为:
[0028]
lii=lo
i-1
[0029]
loi=(li
i-1)
×si-2
×
pi ki[0030]
其中,lii为第i层反卷积网络的输入参数尺寸,si为第i层步长,pi为第i层补全值大小,ki为第i层卷积核大小。
[0031]
所述反卷积网络基于卷积网络镜像构造得到。
[0032]
所述卷积网络用于完成工业数据的特征提取和融合,并解析最后一层的输出数据,获得判别结果,辅助生成器完成合成数据的生成,其中,卷积网络第l 1层卷积层参数的计算公式为:
[0033][0034]
其中,f(z)为激活函数,*为卷积运算,第l层卷积层的参数为特征图集合为m,卷积核为k,偏置参数为b。
[0035]
所述激活函数为sigmoid函数:
[0036]
[0037]
一种基于重构对抗网络的小样本故障诊断装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0038]
一种存储介质,其上存储有程序,所述程序被执行时实现如上述所述的方法。
[0039]
与现有技术相比,本发明具有以下有益效果:
[0040]
(1)本发明利用生成对抗网络来对数据缺乏的分类样本对特征信息进行充分挖掘,从而进行有效的样本补充,使得svm分类器在进行训练的时候能够有足够的样本,且能更快的收敛,从而提高样本稀缺条件下svm的分类效率和分类效果,克服了现有方法忽视故障数据类内间距的缺陷,在面临工业不平衡数据时仍能够做到区别对待,从而完成故障诊断。
[0041]
(2)本发明的生成对抗网络辅助支持向量机训练的同时,通过支持向量机提取已有训练数据和生成样本中的特征信息,辅助对抗网络进行样本筛选,通过数据筛选和重构svm对svm的参数进行迭代训练,筛选后的数据可靠性更高,基于筛选后的数据迭代训练得到的svm参数能够更好的适应工业不平衡数据下的分类,分类准确性更高,提高了故障诊断精度。
[0042]
(3)本发明通过真实样本和虚拟样本训练卷积分类网络,增强了卷积判别器的判断能力,同时将分类网络嵌入反卷积生成器的训练中,辅助反卷积网络的更新迭代,从而通过博弈对抗、互相提升最终合成可靠性较高的样本。
附图说明
[0043]
图1为本发明的方法流程图;
[0044]
图2为生成对抗网络的结构示意图;
[0045]
图3为故障诊断框架示意图。
具体实施方式
[0046]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0047]
工业故障诊断问题的解决流程较为复杂,可做如下拆分:首先进行过程的监测工作;之后利用自动化仪表记录相关的运行数据;下一步进行故障的检测与诊断工作,也是此类问题的关键所在。基于数据的工业故障诊断工作需要利用传统方法人工对故障状态、正常状态的数据进行标记,将标记后的数据导入数学模型中进行训练。当无标签的测试数据导入时,调取原先训练好的数学模型进行分类预测工作。最后一步就是将预测结果与真实结果进行对比,评估所训练的模型的质量。
[0048]
因此,基于数据的工业故障诊断问题最终的关键点就是数据的分类问题。当面对不平衡数据时,svm算法将会简单地学习将所有内容分类为多数以使边距最大,而少数类由于数量极少,误差累计很小。因此svm无法独立完成工业数据故障诊断。
[0049]
本发明提出了一种基于重构对抗网络的小样本故障诊断方法,其方法流程图如图1所示,包括以下步骤:
[0050]
1)获取未标记的初始工业数据;
[0051]
2)建立生成对抗网络,结构如图2所示,生成对抗网络包括生成器g和判别器d,其中,所述判别器用于辅助生成器生成合成数据;
[0052]
生成对抗网络的损失函数为:
[0053][0054]
式中,g代表生成器,d代表判别器,z为输入的随机噪声,x为初始工业数据,min
g max
d v(d,g)表示,判别器的优化目标是使得目标函数v最大,生成器的优化目标是使得目标函数v最小。
[0055]

生成器
[0056]
生成器由反卷积网络构成,基于卷积网络镜像构造得到,用于对数据结构进行拓展。
[0057]
生成器生成合成数据的方法具体为:
[0058][0059]
式中,x1代表已有故障类别数据,为生成器利用已有数据生成的新增故障类别数据,x1与叠加之后得到合成数据。
[0060]
所述随机噪声z输入后利用全连接层进行映射,经过反卷积网络扩充,将维度补全至与工业数据的维度一致。
[0061]
反卷积网络第i层的输出尺寸loi为:
[0062]
lii=lo
i-1
[0063]
loi=(li
i-1)
×si-2
×
pi ki[0064]
其中,lii为第i层反卷积网络的输入参数尺寸,si为第i层步长,pi为第i层补全值大小,ki为第i层卷积核大小。
[0065]

判别器
[0066]
判别器由卷积网络构成,用于完成工业数据的特征提取和融合,并解析最后一层的输出数据,获得判别结果,辅助生成器完成合成数据的生成,其中,卷积网络第l 1层卷积层参数的计算公式为:
[0067][0068]
其中,f(z)为激活函数,*为卷积运算,第l层卷积层的参数为特征图集合为m,卷积核为k,偏置参数为b。
[0069]
激活函数一般选择sigmoid函数:
[0070][0071]
3)基于真实工业数据样本和虚拟工业数据样本对生成对抗网络进行对抗训练;
[0072]
利用所构建的卷积网络及反卷积网络进行对抗训练,分别利用真实工业数据样本和虚拟工业数据样本训练卷积分类网络,增强卷积判别器的判断能力;同时将分类网络嵌
入反卷积生成器的训练中,辅助反卷积网络的更新迭代,从而通过博弈对抗、互相提升最终合成以假乱真的样本。然而,判别器d受生成结果干扰过多,只能用于辅助生成,无法直接用于数据的分类训练;利用传统的生成对抗网络,反卷积网络的训练很容易面临模式崩溃及收敛困难的问题。
[0073]
4)将初始工业数据输入训练完成的生成对抗网络,得到包含新增数据的合成数据训练样本集;
[0074]
5)基于初始工业数据训练svm分类器;
[0075]
6)数据筛选:利用svm分类器的输出对新增数据进行筛选,基于筛选通过的样本更新合成数据训练样本集;
[0076]
7)重构svm:基于更新的合成数据训练样本集对svm分类器进行重构训练;
[0077]
重构逻辑如下所示:
[0078]
clf
i 1
=svm(clfi,clfi(g(z)))
[0079]
根据上式使用初始训练样本初步训练基于支持向量机的分类模型clf0,利用clf0对反卷积神经网络g的输出结果进行初步筛选,筛选通过的样本反馈至训练样本集中,对分类模型的参数进行迭代重训练,重构i次后分类模型的clfi拥有更佳的性能,也能够更好地对g的输出结果进行筛选。
[0080]
8)重新进行数据筛选和重构svm,重复预配置的次数后,得到重构完成的svm分类器;
[0081]
9)基于重构完成的svm分类器对初始工业数据进行诊断,得到故障诊断结果,将最终的诊断结果解码为相应的故障类别,从而实现样本稀缺条件下的工业故障诊断。
[0082]
基于上述方法的故障诊断框架如图3所示,通过输入的随机噪声,本发明所述的方法能够基于噪声和生成对抗网络生成合成数据,对样本进行补充,再对补充后的数据进行不断的筛选以此重构svm分类器,从而得到分类性能更加准确的svm。
[0083]
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0084]
本实施例基于上述方法对水泵进行工业故障诊断以证明本发明所述方法的可行性和优越性。
[0085]
振动是水泵的常见现象。本实施例以某厂水泵数据为例,完成故障诊断工作。
[0086]
首先需要利用相关设备对数据进行记录。水泵数据检测时需对每个测量点进行水平,垂直,轴向三个方向的测量。本实施例在测量过程中,依次从前轴承和后轴承各取一个测量点,进行振动频率的测量。本实施例所用数据分别为水泵的四个运行状态下所采集,分别标记为0,1,2,3,其中,0代表正常运行状态,1-3分别表示不同故障运行状态。各类数据的实际数量及占比如表1所示。
[0087]
表1 水泵数据
[0088][0089]
本次所用数据总量仅为1550条,其中1类数据仅有50条,其余类别数据量为500条,样本数量绝对数量与相对数量均不满足模型训练需求。
[0090]
引入混淆矩阵(如表2所示)以评判svm分类器的分类性能。
[0091]
表2 混淆矩阵
[0092][0093]
召回率recall的计算公式:
[0094][0095]
查准率precision的计算公式:
[0096][0097]
不平衡分类过程中往往重点关注少数类,因此同时选取少数类召回率recall1以及少数类综合指标f1-score1进行观测对比。
[0098]
分别利用本发明所述生成对抗网络和重构对抗网络进行实验,并与svm,smote,adasyn进行对比,得到实验对比结果如下表:
[0099]
表3 整体测试指标
[0100][0101]
基于表3可以发现,本发明所提重构对抗网络在整体数据上准确率和f1-score两方面都取得了比较好的效果。
[0102]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献