一种基于深度图网络的化工过程故障诊断方法

2022-04-13 18:20:10 来源：中国专利 TAG：

1.本发明涉及化工过程的故障诊断技术领域，具体涉及一种基于深度图网络的化工过程故障诊断方法。

背景技术：

2.在现代过程工业中，传感器技术和信息系统被广泛应用于数据的采集和存储，在此基础上，化工过程的复杂程度越来越高，这对故障诊断提出了巨大的挑战。虽然故障诊断已经发展了几十年，但是由于故障在不同的过程单元间传播，其仍然是一项困难的任务。一个大规模的工业过程通常由各种相互关联的过程单元组成，如化学反应器、热交换器、蒸馏塔等。因此，故障可以很容易地沿着信息和物质流从一个单元传播到另一个单元。反馈控制回路的使用使得传播机制的分析更加困难。故障诊断主要依赖三种方法：基于知识的方法、基于模型的方法和基于数据的方法。由于基于知识和基于模型由于高度依赖专家知识这个不可克服的缺点，并不能广泛的适用不同的化工过程中，因此基于数据的方法脱颖而出。
3.基于数据的方法可以分为统计方法、浅层学习方法和深度学习方法。统计方法包括主成分分析，独立成分分析，偏最小二乘，fisher判别分析，定性趋势分析及其衍生方法。浅层学习方法包括支持向量机，人工免疫系统，k邻近，高斯混合模型和人工神经网络。尽管上述两类数据驱动方法都具有优势，但由于这两类方法通常需要大量的领域知识来确定空间和时间域的故障特征和故障诊断率不够高，上述两种方法还远未得到广泛的实际应用。
4.在过去的几年里，深度学习已经成为一项杰出的技术，在许多领域都表现出了比上述方法更好的性能，但尽管深度学习的方法均达到较高的准确度，但是由于无法结合机理过程对模型的优秀性能做出解释，与实际应用仍有很大差距。
5.图神经网络(gnn)作为深度学习的一个分支越来越受欢迎，在多个领域显示出强大的学习能力。因为其数据定义在非欧空间中，所以gnn拥有更强大的可视化能力。图卷积网络(gcn)是传统gnn的变体，具有gnn的所有优点。gcn通过对结构数据进行卷积运算，获得了强大的表示能力。然而，几乎所有的图网络的节点之间并不存在因果关系。这意味着之前的工作假设不同的变量是相同的，无法利用相关性从因果分析的角度对数据进行建模，因此需要本方法在gcn中引入因果关系分析。近年来，因果关系分析在故障诊断研究领域受到越来越多的关注，因为因果图可以直观地表示故障传播路径，揭示故障根源。

技术实现要素：

6.针对现有技术中存在的不足，本发明提出基于因果的深度时空图卷积网络(deep spatial-temporal causal graph convolution network，dstcgcn)。与以往的许多故障诊断模型不同，dstcgcn引入因果关系图，将关系图中的每个变量视为图节点，针对过程变量的时序数据和变量之间的因果关系进行建模分析。针对不同时间长度的过程数据包含不同的动态，该方法使用固定采样模块使不同长度的过程数据可以用来训练同一模型。在dstcgcn中，有两种类型的边，即符合过程变量自然连通性的空间边和跨越连续时间步长连
接相同过程变量的时间边，即信息传播过程是基于空间和时间维度的。在此基础上通过堆叠相同的层实现了dstcgcn对更抽象高维数据的提取。另外，dstcgcn通过在模型中加入图坍缩机制使系统简化为几个独立的子系统，这能够带来通用的表达能力，从而获得更高的性能。
7.本发明的技术方案如下：
8.一种基于深度图网络的化工过程故障诊断方法，所述方法包括以下步骤：
9.1)数据的获取和整合：
10.通过te仿真过程设置阶跃故障，并对每个故障生成数据进行划分、收集和整合；
11.2)数据选择和排序：
12.根据欧式距离度量进行数据选择，去除冗余无用的数据；根据最大互信息准则进行数据排序；
13.3)建立因果有向图：
14.根据te流程图，对其变量之间构建因果有向图；
15.4)建模训练：
16.构建基于深度时空图卷积网络dstcgcn模型，模型的输入为经过数据选择保留的数据；然后利用dstcgcn模型对所整合的数据进行学习训练；
17.5)模型测试：
18.将训练后的dstcgcn模型用于te过程的故障诊断。
19.进一步，所述步骤1)的过程为：
20.步骤1.1：设定田纳西-伊斯曼(tennessee eastman,te)过程故障，获得每个故障的输出数据；
21.步骤1.2：将数据根据比例划分成训练集和测试集；
22.步骤1.3：由于不同特征变量之间数据差异性较大，因此有必要对数据进行标准化处理，以便于模型进行处理和运算，具体公式如下所示：
[0023][0024]
其中，x'是经标准化处理后的数据，x是未经标准化处理的原数据，μ是数据的均值，γ是数据的标准差。
[0025]
进一步，所述步骤2)的过程为：
[0026]
步骤2.1：使用欧式距离度量每个变量的数据与正常工况之间的相似度rz，其表示编号z故障变量与编号z正常变量之间的相似度，相似度越大表示该变量对于故障的贡献度越小；相似度rz的公式如下：
[0027][0028]
z为故障类别总数，ε是为了防止分母为0的无限小量，xz和x0分别表示编号z故障变量与编号z正常变量；
[0029]
步骤2.2：排除相似度为0.98-1的变量，完成特征选择过程；
[0030]
步骤2.3：随机选择一个变量，计算剩余变量对于所选变量的最大互信息，其公式
如下：
[0031][0032]
其中p(x,y)为随机变量x和y之间的联合概率分布，b＝n
0.55～0.6
，n为样本集的大小；
[0033]
步骤2.4：根据最大互信息对特征进行排序。
[0034]
进一步，所述步骤3)的过程为：
[0035]
步骤3.1：将工艺过程沿工艺流程分解为若干设备级单元；
[0036]
步骤3.2：在设备单元连接处标记数字；
[0037]
步骤3.3：建立每一设备单元的因果有向图；
[0038]
步骤3.4：利用各设备单元的因果有向图，根据工艺流程和设备单元连接处标的数字构建系统的因果有向图。
[0039]
进一步，所述步骤4)的过程为：
[0040]
步骤4.1：dstcgcn是依托固定采样层、图池化层、时空图卷积层构建的层级模型；
[0041]
固定采样层主要是将输入不同时间长度的数据进行固定数量的划分后取平均得到固定时间长度的数据；
[0042]
图池化层是一种可以简化图结构的算法，对于图g，定义簇分配矩阵其中c表示简化后的图节点数量，最终得到简化后的邻接矩阵a
coar
：
[0043]acoar
＝s
t
as
ꢀꢀꢀꢀꢀ
(3)
[0044]
其中a为原本z个节点的因果有向图邻接矩阵，根据简化后的节点数r，使用其拉普拉斯矩阵定义其池化算子以简化变量数：
[0045][0046]
其中θ
l
为邻接矩阵a
coar
的特征向量；
[0047]
时空卷积层主要由图卷积网络和卷积长短期记忆网络构成，图卷积是一种在非欧空间上对数据进行卷积的算法，可以表示为：
[0048][0049]
其中h为当前层特征向量，l表示层数，*表示卷积操作，γ为卷积核，σ为激活函数，a表示输入的邻接矩阵，d＝∑
jaj
表示邻接矩阵的度矩阵；
[0050]
卷积长短期记忆网络是通过其当前的输入和过去的状态来确定网格中某个单元的未来状态的算法，可以表示为：
[0051][0052]
其中，о表示hadamard乘积，i
t
表示输入门的结果，f
t
表示遗忘门的结果，c
t
表示当
前时刻记忆单元的结果，o
t
表示输出门的结果，h
t
表示当前时刻的模块输出结果，w表示可训练参数，b表示可训练偏置；
[0053]
步骤4.2：将4.1中的层按顺序堆叠，并且结合特征选择和排序部分构成所需dstcgcn模型，通过dstcgcn模型对te过程进行故障识别；
[0054]
步骤4.3：使用训练数据训练dstcgcn，最终得到训练后的dstcgcn模型。
[0055]
进一步，所述步骤(5)的过程为：
[0056]
步骤5.1：将测试数据输入训练后的dstcgcn模型。使用fdr对模型进行评估，其中fdr为正确预测的数量与实际该类数量的比例:
[0057][0058]
其中p为正确预测为该类的数量，b为该类中没有被正确预测的数量。
[0059]
本发明的有益效果主要表现在：本发明提出了一种基于深度图网络的化工过程故障诊断方法，提高了缺陷识别和定位的准确度。该方法利用结合因果有向图和图网络强大的可视化能力，对系统的故障信息进行识别和提取。
附图说明
[0060]
图1是本发明作为示例的te过程流程图；
[0061]
图2是本发明所选变量的因果有向图；
[0062]
图3是本发明固定采样层示意图；
[0063]
图4是本发明时空卷积层结构；
[0064]
图5是本发明方法框架；
[0065]
图6是本发明所选变量简化因果有向图。
具体实施方式
[0066]
下面结合附图对本发明作进一步描述。
[0067]
参照图1～图6，一种基于深度图网络的化工过程故障诊断方法，所述方法包括以下步骤：
[0068]
1)数据的获取和整合
[0069]
通过tennessee eastman(te)仿真过程设置7个阶跃故障，每个故障生成160组数据并对其进行划分、收集和整合。
[0070]
步骤1)的过程为：
[0071]
步骤1.1：设定te过程7个故障，获得每个故障160组52个变量的输出数据，表1为7个故障，表2为52个变量及其描述，图1为te过程流程。
[0072]
表1不同的故障描述
[0073][0074]
表2不同的变量描述
[0075]
[0076]
步骤1.2：将数据根据5:5的比例划分成训练集和测试集。
[0077]
步骤1.3：由于不同特征变量之间数据差异性较大，因此有必要对数据进行标准化处理，以便于模型进行处理和运算，具体公式如下所示：
[0078][0079]
其中，x'是经标准化处理后的数据，x是未经标准化处理的原数据，μ是数据的均值，γ是数据的标准差。
[0080]
2)数据选择和排序
[0081]
根据欧式距离度量进行数据选择，去除冗余无用的数据。根据最大互信息准则进行数据排序。
[0082]
步骤2)的过程为：
[0083]
步骤2.1：使用欧式距离度量每个变量的数据与正常工况之间的相似度rz，其表示编号z故障变量与编号z正常变量之间的相似度，相似度越大表示该变量对于故障的贡献度越小。相似度rz的公式如下：
[0084][0085]
在本案列中,为故障类别总数z＝7，ε是为了防止分母为0的无限小量。xz和x0分别表示编号z故障变量与编号z正常变量。
[0086]
步骤2.2：排除相似度过高(0.98-1)的变量，完成特征选择过程。
[0087]
步骤2.3：随机选择一个变量，计算剩余变量对于所选变量的最大互信息，其公式为：
[0088][0089]
其中p(x,y)为随机变量x和y之间的联合概率分布，b＝n
0.55～0.6
，n为样本集的大小。
[0090]
步骤2.4：根据最大互信息对特征进行排序。
[0091]
3)建立因果有向图
[0092]
根据te流程图，对其变量之间构建因果有向图。
[0093]
步骤3)的过程为：
[0094]
步骤3.1：将工艺过程沿工艺流程分解为若干设备级单元。
[0095]
步骤3.2：在设备单元连接处标记数字。
[0096]
步骤3.3：建立每一设备单元的因果有向图。
[0097]
步骤3.4：利用各设备单元的因果有向图，根据工艺流程和设备单元连接处标的数字构建系统的因果有向图。图2为所选择变量的因果有向图。
[0098]
4)建模训练
[0099]
构建基于深度图网络的化工过程故障诊断方法的算法模型dstcgcn，模型的输入为经过选择保留的数据；然后利用dstcgcn模型对所整合的数据进行学习训练。
[0100]
步骤4)的过程为：
[0101]
步骤4.1：dstcgcn是主要依托固定采样层、图池化层、时空图卷积层构建的层级模型。固定采样层主要是将输入不同时间长度的数据进行固定数量的划分后取平均得到固定时间长度的数据，如图3所示。
[0102]
图池化层是一种可以简化图结构的算法。对于图g，定义簇分配矩阵其中c表示简化后的图节点数量。最终得到简化后的邻接矩阵a
coar
：
[0103]acoar
＝s
t
as
ꢀꢀꢀꢀꢀ
(4)
[0104]
其中a为原本z个节点的因果有向图邻接矩阵。根据简化后的节点数r，使用其拉普拉斯矩阵定义其池化算子以简化变量数：
[0105][0106]
其中θ
l
为邻接矩阵a
coar
的特征向量。
[0107]
时空卷积层主要由图卷积网络和卷积长短期记忆网络构成，如图4所示。图卷积是一种在非欧空间上对数据进行卷积的算法，可以表示为：
[0108][0109]
其中h为当前层特征向量，l表示层数，*表示卷积操作，γ为卷积核，σ为激活函数，a表示输入的邻接矩阵，d＝∑
jaj
表示邻接矩阵的度矩阵。
[0110]
卷积长短期记忆网络是通过其当前的输入和过去的状态来确定网格中某个单元的未来状态的算法，可以表示为：
[0111][0112]
其中，о表示hadamard乘积，i
t
表示输入门的结果，f
t
表示遗忘门的结果，c
t
表示当前时刻记忆单元的结果，o
t
表示输出门的结果，h
t
表示当前时刻的模块输出结果，w表示可训练参数，b表示可训练偏置。
[0113]
步骤4.2：将4.1中的层按顺序堆叠，并且结合特征选择和排序部分构成所需dstcgcn模型，通过dstcgcn对te过程进行故障识别，图5为dstcgcn框架。
[0114]
步骤4.3：使用训练数据训练dstcgcn，最终得到训练后的dstcgcnm模型，图6为简化因果有向图。
[0115]
5)模型测试
[0116]
将训练后的dstcgcn模型用于te过程的故障诊断。
[0117]
步骤5)的过程为：
[0118]
步骤5.1：将测试数据输入训练后的dstcgcn模型。使用fdr对模型进行评估，其中fdr为正确预测的数量与实际该类数量的比例:
[0119]
[0120]
其中p为正确预测为该类的数量，b为该类中没有被正确预测的数量。
[0121]
实施例：
[0122]
(1)获取te过程数据集，过程如下：
[0123]
步骤1.1：设置te过程，每隔3分钟进行1次变量测量，同时设置7组不同故障，重复仿真过程160次，最终获得52个变量400个时刻160
×
52
×
400的数据；
[0124]
步骤1.2：根据划分标准将数据分成80
×
52
×
400和80
×
52
×
400两个部分，分别为训练集和测试集；
[0125]
步骤1.3：根据标准化公式对每个数据进行处理。
[0126]
(2)针对te过程进行变量选择排序，过程如下：
[0127]
步骤2.1：根据相似度公式计算每个变量。
[0128]
步骤2.2：删除相似度为1的变量，最终保留一下35个变量：s11，s18，mv7，s17，s4，mv11，s8，mv2，mv1，s21，s27，s26，s23，mv10，s10，mv6，mv3，s1，mv8，s9，s2，s3，mv4，s16，s7，s13，s22，s25，s24，s12，s5,s6，s15，s14，s19。
[0129]
步骤2.3：选择变量s11，计算剩余变量对其互信息。
[0130]
步骤2.4：根据互信息对变量进行如下排序：s11，s18，mv7，mv2，mv1，s21，mv10，s10，mv6，mv3，s1，mv4，s16，s7，s13，s22，s25，s27，s26，s23，s24，mv8，s9，s2，s3，s12，s5,s6，s15，s14，s19，s17，s4，mv11，s8。
[0131]
(3)进行筛选变量因果有向图绘制，过程如下：
[0132]
步骤3.1：绘制设备级因果有向图。
[0133]
步骤3.2：根据设备级因果有向图，绘制所有变量因果有向图。
[0134]
(4)进行dstcgcn模型训练，过程如下：
[0135]
步骤4.1：根据因果有向图，设定简化因果有向图的节点为10，进行因果有向图简化，表3为节点与简化节点之间的从属关系。
[0136]
步骤4.2：根据因果有向图、简化因果有向图，将训练集输入模型，获得模型第一次识别结果。
[0137]
步骤4.3：根据识别结果和真实结果，对模型参数进行调整，使得识别结果和真实结果之间的区别减小。
[0138]
步骤4.4：重复步骤4.2～4.3，直到模型的识别误差在允许误差之间。
[0139]
表3节点之间的从属关系
[0140][0141]
(5)使用测试数据对模型进行测试，过程如下：
[0142]
步骤5.1：使用支持向量机(svm)作为对比模型，svm为经典的分类识别模型。将测试数据输入训练后的dstcgcn和svm中，分别得到两者在测试集上的识别结果。
[0143]
步骤5.2：计算测试集上dstcgcn和svm的fdr，对两者的性能进行评估，评估结果如表4所示：
[0144]
表4 dstcgcn和svm的对比
[0145][0146]
从上述对比结果可以看出，本发明对于te过程的故障识别远远高于传统分类识别模型。
[0147]
本发明方法采用基于深度图网络的化工过程故障诊断方法，提高了故障的识别效果，同时也准确定位故障变量，具有普遍性和通用性。
[0148]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种储能电站运维管理方法、系统及装置

一种基于深度图网络的化工过程故障诊断方法

相关文献

最热文献