一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于差异特征提取及融合的旋转机械故障诊断方法及系统

2022-07-30 05:27:42 来源:中国专利 TAG:


1.本发明属于旋转机械故障诊断领域,尤其涉及一种基于差异特征提取及融合的旋转机械故障诊断方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.作为旋转机械(如驱动电机和风力涡轮机)的重要部件,轴承在工业应用中变得越来越重要。由于日益复杂的结构和恶劣的操作环境,许多轴承故障可能导致较高的维护成本,甚至人员伤亡。研究表明,轴承故障占大型机械系统故障的40%,占小型机械系统故障的90%。因此,轴承故障的准确诊断,特别是在早期故障诊断,是至关重要的。
4.故障诊断方法主要分为基于模型的和数据驱动的两类。采用动态方程的状态空间模型是常用的基于模型的方法,但基于模型的方法需要建立精确的模型,依赖于大量的的专业知识。但由于旋转机械具有复杂的耦合、工作环境恶劣,因此难以建立精确的模型。目前,数据驱动方法由于能够自动提取特征,且对专业知识要求低,在轴承故障诊断中得到了广泛的应用。此外,随着制造业的快速发展,机械设备的数据采集比以往更快、更广泛。它为数据驱动的故障诊断方法提供了新的机遇,也引起了大量研究的关注。
5.在过去的几十年里,许多机器学习方法被用于故障诊断,如支持向量机、决策树、人工神经网络。虽然取得了一定的进展,但传统的机器学习方法需要进行额外的特征提取,增加了人工提取特征的时间成本和不确定性,且无法实现特征提取及分类网络参数的全局优化。因此近年来,深度学习因其强大的特征学习能力被应用于轴承故障诊断,且而取得了良好的结果。
6.然而,上述数据驱动方法仅使用来自单个传感器的数据。研究表明,在复杂的工业系统中,仅采用单传感器的数据很难达到较高的故障诊断性能。与单传感器数据进行故障诊断相比,多传感器数据中存在互补的故障信息,采用多传感器数据可以大大提高故障诊断的性能。根据不同的融合级别,信息融合可分为数据级融合、特征级融合和决策级融合。在数据级融合中对原始数据进行处理和重组,可以保留最多的原始信息,但是在数据级融合中很难保证数据结构的高度一致性;在决策级融合中,最终的故障诊断结果是由多分类器的决策共同确定的,冲突的结果可能会影响最终的分类。研究表明,基于特征级融合的故障诊断方法可以在很大程度上实现信息压缩,便于数据的实时处理,其性能优于其他两种方法。
7.但现有的特征级融合故障诊断方法存在以下两个问题:(1)多传感器数据的互补故障特征提取不充分。没有针对互补的故障特征进行提取,使得提取到的特征互补性不强,限制了基于特征融合的故障诊断的准确性;(2)从多传感器数据中提取的特征没有得到有效的融合。最常用的特征融合方法是简单拼接,但简单拼接并不是一种有效的特征融合方法,会导致诊断准确度达不到预期
的效果。


技术实现要素:

8.为了解决上述背景技术中存在的技术问题,本发明提供一种基于差异特征提取及融合的旋转机械故障诊断方法及系统,其采用1d cnn改进的多头注意力机制来提取单信号源数据的多样化的深度特征,并通过特征来源分类器使得提取到的多信号源数据的特征尽可能包含更多的互补故障信息,进而采用双线性模型来实现不同信号源特征的细粒度融合,并将融合后的特征用于故障分类。
9.为了实现上述目的,本发明采用如下技术方案:本发明的第一个方面提供一种基于差异特征提取及融合的旋转机械故障诊断方法。
10.一种基于差异特征提取及融合的旋转机械故障诊断方法,包括:获取若干个旋转机械单信号源数据,作为原始数据;基于若干个旋转机械单信号源数据,采用故障诊断模型,得到故障类别;所述故障诊断模型的诊断过程包括:采用多个融合1d cnn的多头注意力模块,分别提取每个旋转机械单信号源数据的特征,得到每个旋转机械单信号源数据的深层特征;采用双线性模型对若干个旋转机械单信号源数据的深层特征进行融合,得到融合特征;根据若干个旋转机械单信号源数据的深层特征,采用特征来源分类网络,得到特征来源类别;根据融合特征,采用故障类别分类网络,得到故障类别。
11.进一步地,第一个所述融合1d cnn的多头注意力模块的处理过程包括:采用三个1d cnn分别提取旋转机械单信号源数据的特征,得到第一特征、第二特征和第三特征;将第一特征、第二特征和第三特征输入缩放点积注意力机制中,得到若干个第四特征;将若干个第四特征进行拼接,得到第五特征;对第五特征进行降维处理,得到第六特征;将原始数据与第六特征对应位置的元素相加后,进行批标准化处理,得到第七特征;对第七特征采用softmax进行前向传播后,再与第七特征对应位置的元素相加,得到的结果进行批标准处理,得到第一个多头注意力模块的输出结果。
12.更进一步地,将第一个多头注意力模块的输出结果作为第二个多头注意力模块的输入,重复第一个所述融合1d cnn的多头注意力模块的处理过程,得到第二个多头注意力模块的输出结果;将第二个多头注意力模块的输出结果作为第三个多头注意力模块的输入,重复第一个所述融合1d cnn的多头注意力模块的处理过程,得到第三个多头注意力模块的输出结果。
13.更进一步地,将第三个多头注意力模块的输出结果和原始数据作为第四个多头注
意力模块的输入,重复第一个所述融合1d cnn的多头注意力模块的处理过程,得到第四个多头注意力模块的输出结果;将第四个多头注意力模块的输出结果和第三个多头注意力模块的输出结果作为第五个多头注意力模块的输入,重复第一个所述融合1d cnn的多头注意力模块的处理过程,得到第五个多头注意力模块的输出结果;将第五个多头注意力模块的输出结果和第三个多头注意力模块的输出结果作为第六个多头注意力模块的输入,重复第一个所述融合1d cnn的多头注意力模块的处理过程,得到第六个多头注意力模块的输出结果;即为旋转机械单信号源数据的深层特征。
14.对于每个旋转机械单信号源数据都进行上述过程,从而得到每个旋转机械单信号源数据的深层特征。
15.进一步地,所述得到融合特征的过程包括:对若干个旋转机械单信号源数据的深层特征相乘,得到融合特征。
16.进一步地,所述根据若干个旋转机械单信号源数据的深层特征,采用特征来源分类网络,得到特征来源类别具体包括:将若干个旋转机械单信号源数据的深层特征进行拼接,将拼接到的特征输入特征来源分类网络,得到特征来源类别。
17.进一步地,在得到特征来源类别和故障类别之后还包括:根据特征来源类别的概率和故障类别的概率,采用交叉熵损失,计算分类误差,以此更新故障诊断模型的网络参数。
18.本发明的第二个方面提供一种基于差异特征提取及融合的旋转机械故障诊断系统。
19.一种基于差异特征提取及融合的旋转机械故障诊断系统,包括:数据获取模块,其被配置为:获取若干个旋转机械单信号源数据,作为原始数据;诊断模块,其被配置为:基于若干个旋转机械单信号源数据,采用故障诊断模型,得到故障类别;故障诊断模型模块,其被配置为:采用多个融合1d cnn的多头注意力模块,分别提取每个旋转机械单信号源数据的特征,得到每个旋转机械单信号源数据的深层特征;采用双线性模型对若干个旋转机械单信号源数据的深层特征进行融合,得到融合特征;根据若干个旋转机械单信号源数据的深层特征,采用特征来源分类网络,得到特征来源类别;根据融合特征,采用故障类别分类网络,得到故障类别。
20.本发明的第三个方面提供一种计算机可读存储介质。
21.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面所述的基于差异特征提取及融合的旋转机械故障诊断方法中的步骤。
22.本发明的第四个方面提供一种计算机设备。
23.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面所述的基于差异特征提取及融合的旋转机械故障诊断方法中的步骤。
24.与现有技术相比,本发明的有益效果是:本发明采用两个分类任务来提取互补性更强的故障特征。具体来说,首先采用1d cnn改进的多头注意力机制来搭建特征提取网络,提取单信号源数据多样化的深度特征,进
而采用特征来源分类任务将提取自多信号源数据的特征进行区分判别,使得从多信号源数据中提取到的特征互补性更强。这样可以实现多信号源数据故障信息的充分提取,将大大提高故障诊断的性能。
25.本发明采用基于双线性模型的特征融合模块来实现不同信号源特征的细粒度融合。这种融合方式与简单连接不同,是在元素层面对特征进行融合,采用元素相乘求和的方式实现特征的深度融合。经过双线性模型,多信号源数据提取到的特征将实现细粒度的融合,最终的故障诊断准确率将大大提高。
附图说明
26.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
27.图1是本发明实施例一示出的mhabfn的框架图;图2是本发明实施例一示出的基于多头注意力机制的特征提取模块结构图;图3是本发明实施例一示出的1d cnn改进的多头注意力机制结构图。
具体实施方式
28.下面结合附图与实施例对本发明作进一步说明。
29.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
30.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
31.需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
32.实施例一如图1所示,本实施例提供了一种基于差异特征提取及融合的旋转机械故障诊断方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器和系统,并通过终端和服务器的交互实现。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、
域名服务、安全服务cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。本实施例中,该方法包括以下步骤:获取若干个旋转机械单信号源数据,作为原始数据;基于若干个旋转机械单信号源数据,采用故障诊断模型,得到故障类别;所述故障诊断模型的诊断过程包括:采用多个融合1d cnn的多头注意力模块,分别提取每个旋转机械单信号源数据的特征,得到每个旋转机械单信号源数据的深层特征;采用双线性模型对若干个旋转机械单信号源数据的深层特征进行融合,得到融合特征;根据若干个旋转机械单信号源数据的深层特征,采用特征来源分类网络,得到特征来源类别;根据融合特征,采用故障类别分类网络,得到故障类别。
33.具体地,为解决上述问题,本实施例提出了一种基于多头注意力机制的双线性融合网络(multi-head attention based bilinear fusion network, mhabfn)用于旋转机械故障诊断,原理图如图1所示。mhabfn是双输入双输出的网络结构,由两个分类任务组成。具体来说,mhabfn的工作流程可以概括为三个步骤:(1)基于多头注意力机制的特征提取,(2)基于双线性模型的特征融合,(3)故障分类和特征来源判别。
34.(1)基于多头注意力机制的特征提取本实施例设计特征提取模块结构如图2所示。首先,采用三个多头注意力模块对输入数据进行特征提取(如图2左侧所示)。当数据被复制后输入到多头注意力机制时,在不同的表示子空间里学习故障信息,可以提取出多样化的特征。进而,利用提取的多样化特征指导原始数据再次进行特征提取(如图2右侧所示),即深层次的特征指导浅层次的特征提取,可以充分利用提取的深层次特征的故障信息。通过多头的拼接实现了每一层多样化特征的融合,也实现了深层次特征与浅层次特征的融合。
35.研究表明,由于卷积神经网络(convolutional neural network, cnn)具有权值共享和局部连接的特点,可以更好地提取深度特征。因此采用1d cnn来改进多头注意力机制,如图3所示。
36.假设1d cnn改进的多头注意力机制输入为,则三个1d cnn输出可以表示为:(1)(2)(3)其中分别表示左、中、右三个1d cnn的第个卷积核从输入中提取到的特征,表示卷积核的个数。1d cnn中采用0填充,因此。此时可以得到三组故障特征、、。进
而将这三组特征输入到缩放点积注意力机制中:(4)将个特征进行拼接作为多头注意力机制的输出:(5)进而将特征降维成一维,假设,则将特征降维为,这里采用最大池化的方式进行降维。假设第个特征中第个元素为,则降维后的新特征第个元素为:(6)其中,表示取最大值。因此可以得到新的一维特征。接着采用了一个残差连接和批标准化(batch normalization, bn):(7)其中,表示将输入的对应位置元素相加,表示批标准化。前向传播采用softmax函数实现,则整个多头注意力模块的输出可以表示为:(8)将输入到第二个多头注意力模块可以得到,同理得到。继而采用来指导输入数据再一次进行特征提取。具体实现方法为将作为图2右侧三个多头注意力模块的两个头的输入,参与输入数据的特征提取,最终得到单信号源数据的深层特征。
37.(2)基于双线性模型的特征融合有效的特征融合可以大大提高故障诊断的性能,本实施例采用双线性模型来实现多源数据特征的细粒度融合。设两个信号源数据提取到的特征分别为和,采用双线性模型对其进行融合:(9)其中,表示转置操作,且。由于相乘之后特征中的元素过大,将会影响最终分类的结果,因此将特征归一化到[0, 1]区间之内。归一化后的特征中第位置的元素可以表示为:(10)其中为归一化之前的特征中第位置的元素。因此组成了最终多源数据的融合后的特征。
[0038]
与简单拼接不同的是,在双线性模型中,通过元素相乘的方式融合多源数据的故
障特征,实现了故障特征的细粒度融合。
[0039]
(3)故障分类采用softmax回归进行分类,根据不同的分类任务将特征映射到所有的模式。本章采用了两个分类任务,即故障类别分类和特征来源判别。首先将从两个传感器数据中提取的特征和融合后的特征拉伸成一维:(11)(12)(13)其中,为拉伸操作。将和拼接起来:(14)其中,表示拼接操作。分别将和输入到故障类别和特征来源分类网络:(15)(16)其中,和分别为对应于第个故障类别和特征来源的概率,和分别是故障类别和特征来源的总数量。将概率最大的故障类别和特征来源作输出为最终的分类结果。并采用交叉熵损失计算分类误差:(17)其中,和分别为第个故障类别和第个特征来源的真实标签。采用的偏导数来更新网络参数。例如,权值的更新过程可以表示为:(18)其中,为权值更新的学习率。
[0040]
本实施例提出的mhabfn旨在通过分类任务来提取多源数据中互补的故障特征,并将其融合后用于故障分类。首先,采用基于多头注意力机制的特征提取模块提取单信号源数据中的多样化深层特征并将其融合,实现自特征融合。进而采用双线性模型来细粒度地融合多源数据的特征,实现互特征融合。故障来源分类任务可以使提取到互补性更强的特
征。最后,互补的故障特征融合后采用故障类别分类器进行故障分类,能大大提高故障诊断的性能。
[0041]
实施例二本实施例提供了一种基于差异特征提取及融合的旋转机械故障诊断系统。
[0042]
一种基于差异特征提取及融合的旋转机械故障诊断系统,包括:数据获取模块,其被配置为:获取若干个旋转机械单信号源数据,作为原始数据;诊断模块,其被配置为:基于若干个旋转机械单信号源数据,采用故障诊断模型,得到故障类别;故障诊断模型模块,其被配置为:采用多个融合1d cnn的多头注意力模块,分别提取每个旋转机械单信号源数据的特征,得到每个旋转机械单信号源数据的深层特征;采用双线性模型对若干个旋转机械单信号源数据的深层特征进行融合,得到融合特征;根据若干个旋转机械单信号源数据的深层特征,采用特征来源分类网络,得到特征来源类别;根据融合特征,采用故障类别分类网络,得到故障类别。
[0043]
此处需要说明的是,上述数据获取模块、诊断模块和故障诊断模型模块与实施例一中的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
[0044]
实施例三本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于差异特征提取及融合的旋转机械故障诊断方法中的步骤。
[0045]
实施例四本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于差异特征提取及融合的旋转机械故障诊断方法中的步骤。
[0046]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0047]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0048]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0049]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0050]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random accessmemory,ram)等。
[0051]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献