工业系统故障识别方法及装置与流程

2021-11-25 00:23:00 来源：中国专利 TAG：

1.本发明涉及数据处理技术领域，尤其涉及一种工业系统故障识别方法及装置。

背景技术：

2.随着现代工业自动化水平的不断提高，工业系统的规模不断扩大工业系统各部件之间的耦合程度越来越高。当工业系统的某一部分发生故障时，会导致整个工业系统瘫痪。因此，对工业系统进行故障识别具有重大意义。
3.然而，工业系统存在复杂非线性结构和极端多变的运行工况，导致故障形式多发且数据不平衡，无法获取充足的且与每一类故障相关的训练数据集，以训练出可靠的故障识别模型。通常在事故发生后才能采集到故障状态下的数据集，并且获取某些故障状态数据的代价极高甚至无法获取。因此，工业系统的正常样本数据丰富，而部分故障样本匮乏，导致样本数据处于不平衡状态，即每类故障的样本远远小于正常样本。
4.现有技术中，只有在正常样本和故障样本相对均衡的情况下，才能训练出高性能的识别模型。而在正常样本和故障样本不均衡的情况下，很难训练出高性能的识别模型，导致识别效果差。

技术实现要素：

5.本发明提供一种工业系统故障识别方法及装置，用以解决现有技术中样本不均衡的情况下，很难训练出高性能的识别模型，导致识别效果差的缺陷，实现在样本不均衡的情况下，对工业系统的故障进行准确识别。
6.本发明提供一种工业系统故障识别方法，包括：
7.将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；
8.将所述运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；
9.根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；
10.根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别；
11.其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以所述样本工业系统的预先获取的类别为样本标签训练获取。
12.根据本发明提供的一种工业系统故障识别方法，在所述将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量之前，还包括：
13.将所述样本工业系统的运行参数输入所述自编码器模型，输出所述样本工业系统的运行参数的特征向量；
14.将所述样本工业系统的运行参数的特征向量输入所述元学习模型中，输出所述样本工业系统的类别；
15.根据所述元学习模型输出的所述样本工业系统的类别和预先获取的类别，获取所述元学习模型的损失函数；
16.根据所述元学习模型的损失函数对所述元学习模型中的参数进行更新。
17.根据本发明提供的一种工业系统故障识别方法，所述根据所述元学习模型的损失函数对所述元学习模型中的参数进行更新，包括：
18.根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计；
19.根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计；
20.根据更新后的一阶矩估计和更新后的二阶矩估计，以及所述元学习模型中的参数，更新所述参数。
21.根据本发明提供的一种工业系统故障识别方法，所述根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计的计算公式为：
[0022][0023]
其中，s
t
为第t次迭代的所述一阶矩估计，ρ1和分别为所述第一预设衰减速率和第一预设平滑因子，g
t
为第t次迭代的所述损失函数的梯度。
[0024]
根据本发明提供的一种工业系统故障识别方法，所述根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计的计算公式为：
[0025][0026]
其中，r
t
为第t次迭代的所述二阶矩估计，ρ2和分别为所述第二预设衰减速率和第二预设平滑因子。
[0027]
根据本发明提供的一种工业系统故障识别方法，所述根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，包括：
[0028]
根据所述运行参数的特征向量，基于局部异常因子算法计算所述目标工业系统的第一故障因子。
[0029]
根据本发明提供的一种工业系统故障识别方法，所述根据所述第一故障因子获取所述目标工业系统的第二类别，包括：
[0030]
若所述第一故障因子在预设阈值范围内，则计算所述第一故障因子与预先构建的工业系统故障库中的第二故障因子之间的匹配程度，将所述匹配程度最高的第二故障因子对应的故障状态作为所述第二类别；
[0031]
其中，所述第二类别包括多种故障状态和正常状态；所述第二故障因子与所述故障状态预先关联；
[0032]
若所述第一故障因子不在所述预设阈值范围内，则确定所述第二类别为所述正常状态。
[0033]
本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述工业系统故障
识别方法的步骤。
[0034]
本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述工业系统故障识别方法的步骤。
[0035]
本发明提供的工业系统故障识别方法及装置，通过自编码器模型对目标工业系统的运行参数进行学习，以获取保留了原始运行参数的特征，且维度较低的特征向量；并采用元学习模型对低维的特征向量进行学习，即使在样本不均衡的情况下，依然能准确输出目标工业系统的第一类别；并根据特征向量计算目标工业系统的第一故障因子，以准确获取目标工业系统的第二类别，即使在样本不均衡的情况下，也能保证目标工业系统的第二类别的识别精度；然后，联合具有高识别精度的第一类别和第二类别，获取目标工业系统最终的类别，有效提高故障识别精度。
附图说明
[0036]
为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0037]
图1是本发明提供的工业系统故障识别方法的流程示意图之一；
[0038]
图2是本发明提供的工业系统故障识别方法中自编码器模型的结构示意图；
[0039]
图3是本发明提供的工业系统故障识别方法的流程示意图之二；
[0040]
图4是本发明提供的工业系统故障识别方法的流程示意图之三；
[0041]
图5是本发明提供的工业系统故障识别方法的流程示意图之四；
[0042]
图6是本发明提供的工业系统故障识别方法中元学习模型的结构示意图；
[0043]
图7是本发明提供的工业系统故障识别装置的结构示意图；
[0044]
图8是本发明提供的电子设备的结构示意图。
具体实施方式
[0045]
为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0046]
下面结合图1描述本发明的工业系统故障识别方法，包括：步骤101，将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；
[0047]
其中，目标工业系统为需要进行故障识别的工业系统。
[0048]
目标工业系统的运行参数可以通过监测装置采集的与目标工业系统的运行参数相关的图像、文本和声频等进行处理后获取，和/或监测装置直接采集输出，本实施对此不作具体地限定。
[0049]
通常，目标工业系统的运行参数为高维数据。而高维的运行参数中不仅存在大量冗余信息，且在故障识别过程中，需要对高维的运行参数进行学习后，获取目标工业系统的运行参数，计算量大，故障识别效率低。
[0050]
为了解决上述问题，本实施例采用数据降维的方式对目标工业系统的运行参数进行降维，以获取低维的特征向量。
[0051]
可选地，数据降维的本质是指利用线性映射方法或非线性映射方法，将原始高维度空间中的数据点在低维度空间中表达出来。根据映射方法的差异，常用的数据降维方法包括线性数据降维与非线性数据降维。
[0052]
对于线性数据降维而言，其具体是指数据降维后的低维数据，可以保留原始高维数据之间的线性关系。在具体实施过程中，通过对训练样本进行学习，得到一个线性投影模型，然后再将高维数据投影到该线性投影模型形成的子空间中，获取低维数据。
[0053]
对于非线性数据降维而言，其是通过数据降维方法获取原始高维数据的低维嵌入映射，实现从高维数据到低维数据的维度约简。
[0054]
可选地，本实施例中的数据降维方法为自编码器模型。其中，自编码器模型的结构可以根据实际需求进行设置，如自编码器模型中隐含层的层数、每一隐含层的神经元节点的数量，每一隐含层的激活函数等均可以根据实际需求进行设置。
[0055]
如图2所示，自编码器模型是以原始高维数据作为输入，通过多个隐含层的编码得到中间层特征向量，再通过多层隐含层的解码，输出对原始高维数据的重构数据。
[0056]
可选地，在获取运行参数的特征向量之前，需要对自编码器模型进行训练。自编码器模型的样本和样本标签相同，可以是目标工业系统的运行参数，也可以是样本工业系统的运行参数，本实施例对此不作具体地限定。
[0057]
以下以样本工业系统的运行参数形成的训练集为例，对自编码器模型的训练过程展开描述。
[0058]
首先，将样本工业系统的运行参数输入自编码器模型，输出重构后的运行参数；
[0059]
然后，以最小化重构前后的运行参数之间的均方误差为目标函数，对自编码器模型的参数进行优化，直到满足自编码器模型收敛的条件。
[0060]
其中，目标函数的计算公式为：
[0061][0062]
其中，表示重构前后的运行参数之间的均方误差，表示权重约束项；m表示训练集中样本的数量；w和b分别表示自编码器模型的权重和偏置量；x
(i)
表示第i个样本，y
(i)
表示第i个样本的重构数据，满足y
(i)
＝h
w,b
(x
(i)
)；λ表示权重衰减参数，w1和w2分别表示自编码器模型的输入层到隐含层的权重和隐含层到输出层的权重，||
·
||为二范数计算。
[0063]
最后，将目标工业系统的运行参数输入训练后的自编码器模型中，通过对运行参数进行学习后，得到运行参数的低维空间的特征向量。
[0064]
可选地，在自编码器模型的隐含层的输入与输出之间为线性映射时，并且采用最小均方误差损失函数训练自编码器模型时，整个编码过程可以等效为主成分分析；在自编码器模型的隐含层的输入与输出之间为非线性映射时，自编码器模型属于自动编码器模
型。本实施例中不对自编码器模型的类型作具体地限定。
[0065]
自编码器模型不仅可以学习到高效的编码方法，还可以提取原始输入数据在隐含层的特征向量。自编码器模型的样本和样本标签相同，不需要预先获取样本标签，是一种无监督特征学习方法，可以实现对海量未标注数据的处理。
[0066]
另外，通过自编码器模型提取的各维度特征向量之间的间距较大，而同一维度的数据之间的间距较小，既保留了原始数据的特征，又能通过学习将高维数据变换为低维特征向量，降维效果良好。
[0067]
步骤102，将所述运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以样本工业系统的预先获取的类别为样本标签训练获取；
[0068]
其中，样本工业系统与目标工业系统为同类型的工业系统。
[0069]
元学习模型的结构可以根据实际需求进行设置，本实施例对此不作具体地限定。如元学习模型包括4层卷积层，一个维度为400的softmax层，三个全连接层，每个卷积层有为32个8*8的卷积核。
[0070]
元学习模型，可以获取大量的类似任务的共性，并将这些共性作为先验知识，在对新任务进行学习时为其提供指导，只需采用少量的样本即可快速对元学习模型进行微调，以完成小样本的分类任务。
[0071]
可选地，在将所述运行参数的特征向量输入元学习模型中之前，先对元学习模型进行训练。
[0072]
在训练过程中，将样本工业系统的运行参数形成的数据集分解成多个元任务。通过，部分元任务训练元学习模型，以使学习模型学习部分元任务中包含的多个类别的样本工业系统之间的共性部分，获取元学习模型的较优的初始化参数；
[0073]
然后，再利用少量的新的元任务对元学习模型再次训练，并对较优的初始化参数进行微调，获取最终的最优元学习模型。其中，新的元任务与部分元任务包含的样本工业系统的类别不同。
[0074]
如图3所示，然后，再将目标工业系统的运行参数的特征向量输入元学习模型中，输出目标工业系统的第一类别。其中，第一类别包括正常状态和多种故障状态。
[0075]
步骤103，根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；
[0076]
可选地，根据目标工业系统的特征向量，计算目标工业系统中每个特征向量的k个近邻的特征向量的局部密度与每个特征向量本身的局部可达密度；
[0077]
计算k个近邻的特征向量的局部密度与每个特征向量本身的局部可达密度之间的比值，将最大的比值作为目标工业系统的第一故障因子。
[0078]
然后，将目标工业系统的第一故障因子与预设范围进行比较；若第一故障因子在预设范围内，则目标工业系统存在故障；
[0079]
再计算目标工业系统的第一故障因子与每类样本工业系统的故障因子之间的匹配程度，根据匹配程度确认目标工业系统的第二类别。
[0080]
本实施例中，在获取目标工业系统的第二类别的过程中，只需要计算目标工业系统的第一故障因子，以及将目标工业系统的第一故障因子与样本工业系统的故障因子进行
比较即可准确获取目标工业系统的第二类别，不需要获取大量的样本工业系统的运行参数，也不需要对模型进行训练，有效避免采用不平衡样本数据对识别模型进行训练时，识别模型性能差，识别效果差的问题。
[0081]
需要说明的是，本实施例中的故障识别方法也同样适用于正常样本和故障样本均衡的情况下。
[0082]
步骤104，根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别。
[0083]
如图4所示，在获取第一类别和第二类别后，获取所述目标工业系统最终的类别。
[0084]
可选地，若目标工业系统的第一类别和第二类别相同，则将其合并为同一类别，以获取目标工业系统最终的类别。
[0085]
若目标工业系统的第一类别和第二类别不同，则可以将第一类别和第二类别输入融合模块中，根据融合结果获取目标工业系统最终的类别。
[0086]
可选地，融合方式，可以是将第一类别对应的匹配程度和元学习网络输出的目标工业系统的与各故障类别之间的概率进行比较，根据比较结果确定目标工业系统最终的类别等，本实施例对此不作具体地限定。
[0087]
本实施例中通过自编码器模型对目标工业系统的运行参数进行学习，以获取保留了原始运行参数的特征，且维度较低的特征向量；并采用元学习模型对低维的特征向量进行学习，即使在样本不均衡的情况下，依然能准确输出目标工业系统的第一类别；并根据特征向量计算目标工业系统的第一故障因子，以准确获取目标工业系统的第二类别，即使在样本不均衡的情况下，也能保证目标工业系统的第二类别的识别精度；然后，联合具有高识别精度的第一类别和第二类别，获取目标工业系统最终的类别，有效提高故障识别精度。
[0088]
在上述实施例的基础上，本实施例中在所述将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量之前，还包括：将所述样本工业系统的运行参数输入所述自编码器模型，输出所述样本工业系统的运行参数的特征向量；将所述样本工业系统的运行参数的特征向量输入所述元学习模型中，输出所述样本工业系统的类别；根据所述元学习模型输出的所述样本工业系统的类别和预先获取的类别，获取所述元学习模型的损失函数；根据所述元学习模型的损失函数对所述元学习模型中的参数进行更新。
[0089]
可选地，在将目标工业系统的运行参数输入自编码器模型之前，需要对元学习模型进行训练。如图5所示，在对学习模型进行训练时，先将样本工业系统的运行参数输入自编码器模型中，输出样本工业系统的运行参数的特征向量；并将样本工业系统的运行参数的特征向量和样本工业系统的类别输入元学习模型，计算元学习模型输出的样本工业系统的第一类别与样本工业系统的真实类别之间的差值，根据差值对元学习模型的参数进行调整，从而实现对元学习模型的参数优化。
[0090]
然后，再将目标工业系统的运行参数输入优化后的元学习模型中，输出目标工业系统的运行参数的特征向量。
[0091]
即使在样本不均衡的情况下，通过使用样本工业系统的运行参数依然可以训练出具有良好性能的元学习模型，有效保证元学习模型输出的目标工业系统的故障识别结果的准确性。
[0092]
在上述实施例的基础上，本实施例中所述根据所述元学习模型的损失函数对所述
元学习模型中的参数进行更新，包括：根据所述元学习模型的损失函数对所述元学习模型中的参数进行更新，包括：根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计；根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计；根据更新后的一阶矩估计和更新后的二阶矩估计，以及所述元学习模型中的参数，更新所述参数。
[0093]
其中，元学习模型的损失函数为交叉熵损失函数，或其他用于分类问题的损失函数，本实施例对比不作具体地限定。
[0094]
采用交叉熵损失函数作为元学习模型的损失函数时，元学习模型的损失函数的计算公式为：
[0095][0096]
其中，l
ti
(f
θ
)为对元学习模型第i个元任务进行学习时产生的损失函数；f
θ
为元学习模型的函数；x
(j)
和y
(j)
分别为第i个元任务中的第j个样本工业系统对应的特征向量和类别；f
θ
(x
(j)
)为元学习模型对x
(j)
学习后输出的类别。
[0097]
如图6所示，训练元学习模型的目标是使用来自类似元任务的先验数据进行元学习，然后根据该元任务的输入和输出更新元学习模型的参数。假设类似任务服从分布t
i
～p(t)，元学习模型为关于参数θ的函数f
θ
；当学习新的元任务t
i 1
时，模型的参数更新为θ
i
'，此时元学习模型的参数在元任务t
i 1
上由一次或少量几次的梯度下降更新。
[0098]
现有技术，在对将元学习模型对所有元任务进行学习时产生的损失函数，以损失函数最小为目标构建元学习模型的目标函数，具体公式为：
[0099][0100]
其中，f为元学习模型的目标函数，t
i
～p(t)表示第i个元任务t
i
服从的分布；α表示学习新的元任务时的学习率。
[0101]
当学习新的元任务时，由更新后的元学习模型的参数θ
i
'计算损失函数l，并采用梯度下降的方法使得模型参数θ的更新如下：
[0102][0103]
其中，β为元学习模型更新参数的学习率。
[0104]
由于现有的梯度下降法中，学习率α和β是人工预先设定的常数，在每次迭代更新的过程中均不会发生改变。而元学习模型的学习效率受学习率的影响较大，当学习率过大则容易陷入局部最优，当学习过小则学习效率低。因此，人工设定的学习率很容易元学模型的学习效率低。
[0105]
通常，以损失函数最小为元目标。为了提升元学习模型的学习效率，更快地逼近元目标。本实施例采用自适应学习率算法对元学习模型进行更新，避免人工设置学习率，导致元学习模型的收敛速度慢的问题。
[0106]
可选地，更新元学习模型的参数的步骤包括：
[0107]
步骤1，初始化步长ε、第一预设衰减速率ρ1和第二预设衰减速率ρ2，稳定常数δ，参
数θ0，t＝0；
[0108]
步骤2，计算第t次迭代的损失函数的梯度，计算公式为：
[0109][0110]
步骤3，根据第t次迭代的损失函数的梯度、第一预设衰减速率、第一预设平滑因子和第t
‑
1次迭代的一阶矩估计，更新第t次迭代的一阶矩估计；
[0111]
并根据第t次迭代的损失函数的梯度、第二预设衰减速率、第二预设平滑因子和第t
‑
1次迭代的二阶矩估计，更新第t次迭代的二阶矩估计；
[0112]
步骤4，对第t次迭代的一阶矩估计和二阶矩估计的偏差进行修正。由于在初始迭代时，元学习模型不稳定，对一阶矩估计和二阶矩估计进行较大的修正，而当t越来越大时，元学习模型逐渐收敛，逐渐减小对一阶矩估计和二阶矩估计的修正；
[0113]
其中，修正一阶矩估计和二阶矩估计的计算公式为：
[0114][0115][0116]
其中，和为修正后的一阶矩估计和二阶矩估计。
[0117]
步骤5，根据第t次迭代的修正后的一阶矩估计和二阶矩估计对参数进行更新的参数梯度δθ
t
，并将第t
‑
1次迭代的参数与参数梯度δθ
t
相加，更新获取第t次迭代的参数；
[0118]
其中，计算参数梯度δθ
t
的公式为：
[0119][0120]
更新获取第t次迭代的参数的公式为：
[0121]
θt
t
←
λ
t
‑1 δθ
t
；
[0122]
步骤6，判断元学习模型是否满足收敛条件，若是，则将最后一次迭代更新的参数作为元学模型的最优参数，并获取最优的元学习模型；若否，则跳转到步骤2，继续对元学习模型的参数进行更新。
[0123]
其中，步长ε、第一预设衰减速率ρ1和第二预设衰减速率ρ2，稳定常数δ，可以根据实际需求进行设置，如ε＝0.001，ρ1＝0.9，ρ2＝0.999，δ＝10
‑5。
[0124]
在上述实施例的基础上，本实施例中所述根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计的计算公式为：
[0125][0126]
其中，s
t
为第t次迭代的所述一阶矩估计，ρ1和分别为所述第一预设衰减速率和第一预设平滑因子，g
t
为第t次迭代的所述损失函数的梯度。
[0127]
可选地，一阶矩估计是对梯度进行滑动平均，使得每次迭代更新都和历史值相关，使得在每次迭代过程中自动更新一阶矩估计，以自适应调整学习率，在保证元学习模型的训练速度的情况下提供训练的精确度。
[0128]
另外，本实施例中通过引入第一预设平滑因子，使得在参数更新过程中，可以提升参数梯度，进一步地加快元学习模型的训练速度。
[0129]
在上述实施例的基础上，本实施例中所述根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计的计算公式为：
[0130][0131]
其中，r
t
为第t次迭代的所述二阶矩估计，ρ2和分别为所述第二预设衰减速率和第二预设平滑因子。
[0132]
可选地，二阶矩估计是对梯度的平方进行滑动平均，使得每次迭代更新都和历史值相关，使得在每次迭代过程中自动更新二阶矩估计，以自适应调整学习率；
[0133]
另外，本实施例中通过引入第二预设平滑因子，使得在参数更新过程中，可以提升参数梯度，进一步地加快元学习模型的训练速度。
[0134]
相较于人工设定学习，本实施例通过自适应调整元学习模型中的学习率，在保证元学习模型训练速度的情况下提供训练的精确度。
[0135]
在上述各实施例的基础上，本实施例中所述根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，包括：根据所述运行参数的特征向量，基于局部异常因子算法计算所述目标工业系统的第一故障因子。
[0136]
可选地，假设目标工业系统对应的特征向量集合为d，集合d＝{p,q,
…
,o}。其中，p、q和o表示目标工业系统的特征向量。
[0137]
根据所述运行参数的特征向量计算所述目标工业系统的第一故障因子的步骤包括：
[0138]
首先，计算任一特征向量p的k近邻距离d
k
(p)；
[0139]
其中，k近邻距离表示，在特征向量p最近的几个特征向量中，第k个最近的特征向量o与特征向量p之间的距离。
[0140]
其中，o需要满足的条件包括，(1)在集合中至少有k个o
′
在集合内但与o不同，即o
′
∈d\{o}，满足p到o
′
的距离均小于或等于p到o的距离，即d(p,o
′
)≤d(p,o)；(2)最多存在k
‑
1个o
′
在集合内且与p不同，即o∈d\{p}，满足p到o
′
的距离均小于p到o的距离，即d(p,o
′
)≤d(p,o)。
[0141]
然后，将与特征向量p的距离小于等于d
k
(p)的所有特征向量作为特征向量p的k距离邻居n
k
(p)，计算公式为：
[0142]
n
k
(p)＝{q∈d\{p}|d(p,q)≤d
k
(p)}；
[0143]
{q∈d\{p}|d(p,q)≤d
k
(p)}表示，在集合中存在且与p不同，且到p的距离均小于或等于d
k
(p)的所有特征向量q。
[0144]
然后，计算特征向量p的可达距离rd
k
(p,o)的计算公式为：
[0145]
rd
k
(p,o)＝max{d
k
(p),d(p,o)}；
[0146]
其中，d(p,o)为特征向量p到特征向量o之间的直接距离。
[0147]
然后，计算特征向量p的局部可达距离ird
k
(p)，以及特征向量的可达距离ird
k
(o)；
[0148][0149]
其中，|n
k
(p)|表示n
k
(p)中特征向量的数量；ird
k
(o)的计算方式与ird
k
(p)的计算方式相同。
[0150]
然后，计算特征向量p的故障因子fif
k
(p)为：
[0151][0152]
其中，d(
·
)表示距离计算，可以是曼哈顿距离、欧式距离或马氏距离等，本实施例对此不作具体地限定。
[0153]
曼哈顿距离来源于城市区块距离，将多维上的距离进行求和后的结果。其与欧式距离类似，都是用于多维数据空间的测度。
[0154]
曼哈顿距离的值域范围为[0,1]，值越小，相似度越大。由于曼哈顿距离的计算量少，本实施例中的距离计算优选曼哈顿距离，计算公式为：
[0155][0156]
其中，p
i
表示特征向量p的第i维特征，n为特征向量p的维数。
[0157]
最后，将最大的故障因子作为目标工业系统的第一故障因子，并将最大的故障因子对应的特征向量作为与故障相关性最大的特征向量。
[0158]
本实施例通过局部异常因子算法可以准确获取目标工业系统的第一故障因子，并采用第一故障因子自动获取目标工业系统的故障类别，计算简单，不需要提前采用大量均衡的样本训练网络模型，适用范围广。
[0159]
在上述各实施例的基础上，本实施例中所述根据所述第一故障因子获取所述目标工业系统的第二类别，包括：若所述第一故障因子在预设阈值范围内，则计算所述第一故障因子与预先构建的工业系统故障库中的第二故障因子之间的匹配程度，将所述匹配程度最高的第二故障因子对应的故障状态作为所述第二类别；其中，所述第二类别包括多种故障状态和正常状态；所述第二故障因子与所述故障状态预先关联；若所述第一故障因子不在所述预设阈值范围内，则确定所述第二类别为所述正常状态。
[0160]
可选地，按照上述计算故障因子的方式，预先计算不同故障类别的样本工业系统的第二故障因子。根据不同故障类别的样本工业系统的第二故障因子和故障类别形成工业系统故障库。
[0161]
其中，所述工业系统故障库中存储有第二故障因子与所述故障类别之间的关联关系。
[0162]
在获取目标工业系统的第二类别的过程中，先判断第一故障因子是否在预设阈值范围内，若在预设范围内，则确定目标工业系统的第二类别为正常状态；
[0163]
若不在预设范围内，则进一步计算第一故障因子与工业系统故障库中的第二故障因子之间的匹配程度，将匹配程度最高的第二故障因子对应的故障类别作为目标工业系统的第二类别。
[0164]
其中，计算匹配程度的方式可以是计算第一故障因子和第二故障因子之间的皮尔
逊相关性和距离等，本实施例对此不作具体限定。
[0165]
另外，也可以按照上述计算故障因子的方式，预先计算获取不同故障类别的样本工业系统中与故障相关性最大的特征向量；通过计算目标工业系统中与故障相关性最大的特征向量与样本工业系统中与故障相关性最大的特征向量之间的匹配程度，获取目标工业系统的第二类别。
[0166]
本实施例中获取目标工业系统的第二类别的方法，不需要提前采用大量均衡的样本训练网络模型，计算效率高，在样本不均衡的情况下，依然能准确获取目标工业系统的第二类别。
[0167]
下面对本发明提供的工业系统故障识别装置进行描述，下文描述的工业系统故障识别装置与上文描述的工业系统故障识别方法可相互对应参照。
[0168]
如图7所示，本实施例提供一种工业系统故障识别装置，该装置包括特征提取模块701、第一分类模块702、第二分类模块703和第三分类模块704，其中：
[0169]
特征提取模块701用于将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；
[0170]
其中，目标工业系统为需要进行故障识别的工业系统。
[0171]
目标工业系统的运行参数可以通过监测装置采集的与目标工业系统的运行参数相关的图像、文本和声频等进行处理后获取，和/或监测装置直接采集输出，本实施对此不作具体地限定。
[0172]
通常，目标工业系统的运行参数为高维数据。而高维的运行参数中不仅存在大量冗余信息，且在故障识别过程中，需要对高维的运行参数进行学习后，获取目标工业系统的运行参数，计算量大，故障识别效率低。
[0173]
为了解决上述问题，本实施例采用数据降维的方式对目标工业系统的运行参数进行降维，以获取低维的特征向量。
[0174]
可选地，数据降维的本质是指利用线性映射方法或非线性映射方法，将原始高维度空间中的数据点在低维度空间中表达出来。根据映射方法的差异，常用的数据降维方法包括线性数据降维与非线性数据降维。
[0175]
对于线性数据降维而言，其具体是指数据降维后的低维数据，可以保留原始高维数据之间的线性关系。在具体实施过程中，通过对训练样本进行学习，得到一个线性投影模型，然后再将高维数据投影到该线性投影模型形成的子空间中，获取低维数据。
[0176]
对于非线性数据降维而言，其是通过数据降维方法获取原始高维数据的低维嵌入映射，实现从高维数据到低维数据的维度约简。
[0177]
可选地，本实施例中的数据降维方法为自编码器模型。其中，自编码器模型的结构可以根据实际需求进行设置，如自编码器模型中隐含层的层数、每一隐含层的神经元节点的数量，每一隐含层的激活函数等均可以根据实际需求进行设置。
[0178]
如图2所示，自编码器模型是以原始高维数据作为输入，通过多个隐含层的编码得到中间层特征向量，再通过多层隐含层的解码，输出对原始高维数据的重构数据。
[0179]
可选地，在获取运行参数的特征向量之前，需要对自编码器模型进行训练。自编码器模型的样本和样本标签相同，可以是目标工业系统的运行参数，也可以是样本工业系统的运行参数，本实施例对此不作具体地限定。
[0180]
以下以样本工业系统的运行参数形成的训练集为例，对自编码器模型的训练过程展开描述。
[0181]
首先，将样本工业系统的运行参数输入自编码器模型，输出重构后的运行参数；
[0182]
然后，以最小化重构前后的运行参数之间的均方误差为目标函数，对自编码器模型的参数进行优化，直到满足自编码器模型收敛的条件。
[0183]
其中，目标函数的计算公式为：
[0184][0185]
其中，表示重构前后的运行参数之间的均方误差，表示权重约束项；m表示训练集中样本的数量；w和b分别表示自编码器模型的权重和偏置量；x
(i)
表示第i个样本，y
(i)
表示第i个样本的重构数据，满足y
(i)
＝h
w,b
(x
(i)
)；λ表示权重衰减参数，w1和w2分别表示自编码器模型的输入层到隐含层的权重和隐含层到输出层的权重，||
·
||为二范数计算。
[0186]
最后，将目标工业系统的运行参数输入训练后的自编码器模型中，通过对运行参数进行学习后，得到运行参数的低维空间的特征向量。
[0187]
可选地，在自编码器模型的隐含层的输入与输出之间为线性映射时，并且采用最小均方误差损失函数训练自编码器模型时，整个编码过程可以等效为主成分分析；在自编码器模型的隐含层的输入与输出之间为非线性映射时，自编码器模型属于自动编码器模型。本实施例中不对自编码器模型的类型作具体地限定。
[0188]
自编码器模型不仅可以学习到高效的编码方法，还可以提取原始输入数据在隐含层的特征向量。自编码器模型的样本和样本标签相同，不需要预先获取样本标签，是一种无监督特征学习方法，可以实现对海量未标注数据的处理。
[0189]
另外，通过自编码器模型提取的各维度特征向量之间的间距较大，而同一维度的数据之间的间距较小，既保留了原始数据的特征，又能通过学习将高维数据变换为低维特征向量，降维效果良好。
[0190]
第一分类模块702用于将所述运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以样本工业系统的预先获取的类别为样本标签训练获取；
[0191]
其中，样本工业系统与目标工业系统为同类型的工业系统。
[0192]
元学习模型的结构可以根据实际需求进行设置，本实施例对此不作具体地限定。如元学习模型包括4层卷积层，一个维度为400的softmax层，三个全连接层，每个卷积层有为32个8*8的卷积核。
[0193]
元学习模型，可以获取大量的类似任务的共性，并将这些共性作为先验知识，在对新任务进行学习时为其提供指导，只需采用少量的样本即可快速对元学习模型进行微调，以完成小样本的分类任务。
[0194]
可选地，在将所述运行参数的特征向量输入元学习模型中之前，先对元学习模型
进行训练。
[0195]
在训练过程中，将样本工业系统的运行参数形成的数据集分解成多个元任务。通过，部分元任务训练元学习模型，以使学习模型学习部分元任务中包含的多个类别的样本工业系统之间的共性部分，获取元学习模型的较优的初始化参数；
[0196]
然后，再利用少量的新的元任务对元学习模型再次训练，并对较优的初始化参数进行微调，获取最终的最优元学习模型。其中，新的元任务与部分元任务包含的样本工业系统的类别不同。
[0197]
如图3所示，然后，再将目标工业系统的运行参数的特征向量输入元学习模型中，输出目标工业系统的第一类别。其中，第一类别包括正常状态和多种故障状态。
[0198]
第二分类模块703用于根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；
[0199]
可选地，根据目标工业系统的特征向量，计算目标工业系统中每个特征向量的k个近邻的特征向量的局部密度与每个特征向量本身的局部可达密度；
[0200]
计算k个近邻的特征向量的局部密度与每个特征向量本身的局部可达密度之间的比值，将最大的比值作为目标工业系统的第一故障因子。
[0201]
然后，将目标工业系统的第一故障因子与预设范围进行比较；若第一故障因子在预设范围内，则目标工业系统存在故障；
[0202]
再计算目标工业系统的第一故障因子与每类样本工业系统的故障因子之间的匹配程度，根据匹配程度确认目标工业系统的第二类别。
[0203]
本实施例中，在获取目标工业系统的第二类别的过程中，只需要计算目标工业系统的第一故障因子，以及将目标工业系统的第一故障因子与样本工业系统的故障因子进行比较即可准确获取目标工业系统的第二类别，不需要获取大量的样本工业系统的运行参数，也不需要对模型进行训练，有效避免采用不平衡样本数据对识别模型进行训练时，识别模型性能差，识别效果差的问题。
[0204]
需要说明的是，本实施例中的故障识别方法也同样适用于正常样本和故障样本均衡的情况下。
[0205]
第三分类模块704用于根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别。
[0206]
可选地，若目标工业系统的第一类别和第二类别相同，则将其合并为同一类别，以获取目标工业系统最终的类别。
[0207]
若目标工业系统的第一类别和第二类别不同，则可以将第一类别和第二类别输入融合模块中，根据融合结果获取目标工业系统最终的类别。
[0208]
可选地，融合方式，可以是将第一类别对应的匹配程度和元学习网络输出的目标工业系统的与各故障类别之间的概率进行比较，根据比较结果确定目标工业系统最终的类别等，本实施例对此不作具体地限定。
[0209]
本实施例中通过自编码器模型对目标工业系统的运行参数进行学习，以获取保留了原始运行参数的特征，且维度较低的特征向量；并采用元学习模型对低维的特征向量进行学习，即使在样本不均衡的情况下，依然能准确输出目标工业系统的第一类别；并根据特征向量计算目标工业系统的第一故障因子，以准确获取目标工业系统的第二类别，即使在
样本不均衡的情况下，也能保证目标工业系统的第二类别的识别精度；然后，联合具有高识别精度的第一类别和第二类别，获取目标工业系统最终的类别，有效提高故障识别精度。
[0210]
在上述实施例的基础上，本实施例中还包括训练模块，用于：将所述样本工业系统的运行参数输入所述自编码器模型，输出所述样本工业系统的运行参数的特征向量；将所述样本工业系统的运行参数的特征向量输入所述元学习模型中，输出所述样本工业系统的类别；根据所述元学习模型输出的所述样本工业系统的类别和预先获取的类别，获取所述元学习模型的损失函数；根据所述元学习模型的损失函数对所述元学习模型中的参数进行更新。
[0211]
在上述实施例的基础上，本实施例中训练模块，还用于：根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计；根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计；根据更新后的一阶矩估计和更新后的二阶矩估计，以及所述元学习模型中的参数，更新所述参数。
[0212]
在上述实施例的基础上，本实施例中根据所述损失函数的梯度、第一预设衰减速率、第一预设平滑因子和所述损失函数的梯度的一阶矩估计，更新所述一阶矩估计的计算公式为：
[0213][0214]
其中，s
t
为第t次迭代的所述一阶矩估计，ρ1和分别为所述第一预设衰减速率和第一预设平滑因子，g
t
为第t次迭代的所述损失函数的梯度。
[0215]
在上述实施例的基础上，本实施例中所述根据所述损失函数的梯度、第二预设衰减速率、第二预设平滑因子和所述损失函数的梯度的二阶矩估计，更新所述二阶矩估计的计算公式为：
[0216][0217]
其中，r
t
为第t次迭代的所述二阶矩估计，ρ2和分别为所述第二预设衰减速率和第二预设平滑因子。
[0218]
在上述各实施例的基础上，本实施例中第二分类模块具体用于：根据所述运行参数的特征向量，基于局部异常因子算法计算所述目标工业系统的第一故障因子。
[0219]
在上述各实施例的基础上，本实施例中第二分类模块还用于：若所述第一故障因子在预设阈值范围内，则计算所述第一故障因子与预先构建的工业系统故障库中的第二故障因子之间的匹配程度，将所述匹配程度最高的第二故障因子对应的故障状态作为所述第二类别；其中，所述第二类别包括多种故障状态和正常状态；所述第二故障因子与所述故障状态预先关联；若所述第一故障因子不在所述预设阈值范围内，则确定所述第二类别为所述正常状态。
[0220]
图8示例了一种电子设备的实体结构示意图，如图8所示，该电子设备可以包括：处理器(processor)801、通信接口(communications interface)802、存储器(memory)803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信。处理器801可以调用存储器803中的逻辑指令，以执行工业系统故障识别方法，该方法包括：将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；将所述
运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别；其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以所述样本工业系统的预先获取的类别为样本标签训练获取。
[0221]
此外，上述的存储器803中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0222]
另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的工业系统故障识别方法，该方法包括：将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；将所述运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别；其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以所述样本工业系统的预先获取的类别为样本标签训练获取。
[0223]
又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的工业系统故障识别方法，该方法包括：将目标工业系统的运行参数输入自编码器模型，输出所述运行参数的特征向量；将所述运行参数的特征向量输入元学习模型中，输出所述目标工业系统的第一类别；根据所述运行参数的特征向量获取所述目标工业系统的第一故障因子，根据所述第一故障因子获取所述目标工业系统的第二类别；根据所述目标工业系统的第一类别和第二类别，获取所述目标工业系统最终的类别；其中，所述元学习模型，以样本工业系统的运行参数的特征向量为样本，以所述样本工业系统的预先获取的类别为样本标签训练获取。
[0224]
以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
[0225]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指
令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0226]
最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于深度学习的OCR文字识别方法与流程

工业系统故障识别方法及装置与流程

相关文献

最热文献