一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于隐变量模型的工业过程监测方法与流程

2021-10-09 00:35:00 来源:中国专利 TAG:监测 过程 工业 变量 模型


1.本发明属于工业过程监测与故障检测领域,涉及一种基于隐变量模型的工业过程监测方法。


背景技术:

2.随着现代工业系统生产规模的不断扩大,工业过程监测在降低工业生产成本、提高工业生产质量和提升工业生产安全方面发挥着日益重要的作用。庞大的生产规模和先进的传感技术催生了大量的过程数据,工业生产也由此进入了大数据时代。以前,工业过程监测通常只能依靠机理模型或专家知识,然而,在大数据背景下,数据驱动的过程监测模型正变得越来越流行。其中,基于隐变量模型的方法是最常用的数据驱动过程监测模型。
3.工业生产通常是高度耦合的,这导致与某一生产过程有关的测量变量通常有很多。然而,真正影响生产过程的关键变量只有少数,大多数变量都是随关键变量的变化而变化的。隐变量模型就是用于寻找这些关键变量的方法,隐变量模型将学习得到的“关键变量”称为隐变量。这些隐变量虽然不直接代表关键变量,但它们与关键变量密切相关。在大数据时代,监测与某一过程有关的全部变量并不现实,取而代之,先使用隐变量模型提取出多维数据中的“关键变量”,随后基于这些“关键变量”设计监测方法是简便而高效的处理方式。传统隐变量模型在过程监测领域有着丰富的应用,典型的传统隐变量模型有主成分分析(pca)、独立成分分析(ica)、偏最小二乘法等。这些传统的隐变量模型在过程监测方面已经实现了成功的应用。
4.然而,随着现代工业生产过程的日益复杂,这些传统隐变量模型的学习能力有时不能胜任当今的应用场景,监测性能通常较差。换言之,基于传统隐变量模型的过程监测方法面对复杂的工业系统效果并不好。为了实现更好的监测效果,我们必须对传统的隐变量过程监测模型加以改进,使其拥有更强的学习能力以适应复杂的工业生产过程。


技术实现要素:

5.本发明的目的在于针对现有技术解决工业过程监测问题的不足,提供一种基于隐变量模型的工业过程监测方法。
6.本发明的目的是通过以下技术方案来实现的:一种基于隐变量模型的工业过程监测方法,包括以下步骤:
7.(1)通过分层级联的方式构建一个多层隐变量模型。
8.(2)基于工业过程监测的历史数据集和步骤(1)中每层隐变量模型提取出的隐变量,构造各层的监测变量,估计各层监测变量在某特定显著性水平δ下的置信限。
9.(3)获取一个新的测试样本,得到其每一层隐变量模型对应的监测变量。
10.(4)根据步骤(2)得到的置信限和步骤(3)得到的各层监测变量,使用贝叶斯定理得到各层的后验故障概率。
11.(5)将各层的后验故障概率加权求和,构建综合概率指标dbs。如果测试样本的dbs
值大于δ,则认为该样本对应的时刻处于故障状态,否则为正常状态。
12.进一步地,步骤(2)包括:
13.通过分层级联的方式构建一个深度为l的隐变量模型架构,l层隐变量矩阵z的计算方式如下:
14.z1=f(x)
15.z
l
=f(z
l
‑1),2≤l≤l
16.其中,f(
·
)代表一个单层隐变量模型,是工业过程监测的历史数据集,其中n为样本总数,m为变量个数。
17.对n个样本,深度为l层的模型结构,得到共n
×
l个监测变量:
18.s
l
(n)=g(z
l
(n)),1≤n≤n,1≤l≤l
19.其中,g(
·
)表示某特定的构造规则,s是基于g(
·
)构造出的监测变量。z
l
(n)是第n个样本在第l层的隐变量向量。
20.在每一层,n个样本都被转化为n个监测变量。对于每一层,在得到所有的n个监测变量s后,估计监测变量在某特定显著性水平δ下的置信限s
lim

21.进一步地,步骤(2)使用核密度估计计算置信限s
lim

22.进一步地,步骤(4)包括:
23.计算测试样本x
new
处于故障状态的条件概率和测试样本x
new
为正常状态的条件概率
[0024][0025][0026]
其中,μ为调节参数,s
l
(new)为x
new
在l层结构中每一层的监测变量。
[0027]
根据贝叶斯定理,将监测变量s
l
(new)转化为后验故障概率:
[0028][0029][0030][0031][0032]
构建综合概率指标dbs如下:
[0033]
[0034][0035]
其中,是各层后验故障概率对应的加权系数。
[0036]
进一步地,加权系数由如下加权策略定义:
[0037]
定义当前样本x
new
过去y个时刻的平均后验概率为
[0038][0039]
根据与设计加权系数
[0040][0041]
其中,η是正数。
[0042]
进一步地,工业过程监测的历史数据集经过标准化。
[0043]
另一种更为综合全面的基于隐变量模型的工业过程监测方法,针对同一隐变量模型可以基于不同的构造规则定义出不同的监测变量,针对同一构造规则可以基于不同的隐变量模型构造出不同的监测变量;基于权利要求1所述方法,针对一个新的测试样本,在k种不同情况下构造的监测变量均可以转换为对应的综合概率指标dbs
k
(new),1≤k≤k;这些不同的dbs
k
(new)又可以通过如下结合策略融合起来,得到一个更为综合全面的监测指标odbs:
[0044]
根据dbs
k
(new)及其控制限,使用贝叶斯定理,得到在各dbs
k
(new)指标的监测下,测试样本处于故障状态的后验故障概率;将各dbs
k
(new)指标的监测下的后验故障概率加权求和,构建odbs。
[0045]
如果测试样本的odbs值超过δ,则认为该样本对应的时刻处于故障状态,否则为正常状态。
[0046]
进一步地,所述结合策略具体为:
[0047]
在使用综合概率指标进行监测时,测试样本x
new
处于故障状态的概率p
dbsk
(x
new
|f)和处于正常状态的概率p
dbsk
(x
new
|n):
[0048][0049][0050]
[0051]
其中,μ

为调节参数,表示指标dbs
k
(new)的控制限。
[0052]
此时,在综合概率指标的监测下,测试样本x
new
处于故障状态的后验故障概率为:
[0053][0054][0055][0056][0057]
其中,表示在综合概率指标的监测下系统处于故障状态的先验概率;表示在综合概率指标的监测下系统为正常状态的先验概率。表示在综合概率指标的监测下测试样本x
new
的出现概率。
[0058]
通过将不同的后验故障概率加权结合,构建一个更为综合全面的指标odbs:
[0059][0060][0061][0062]
其中,w
k
是加权系数,η

是正数;表示在使用dbs
k
进行监测时,当前样本x
new
在过去y个时刻处于故障状态的平均后验概率。
[0063]
一种基于上述方法的深度pca

ica工业过程监测方法,包括离线建模和在线检测。
[0064]
离线建模包括以下步骤:
[0065]
(a)收集系统处于正常状态下的数据作为训练集,并对训练集进行标准化。
[0066]
(b)对标准化后的训练集执行分层级联的pca算法,获取每一层的得分矩阵和负载矩阵。
[0067]
(c)依据每一层的得分矩阵和负载矩阵计算每个训练样本在pca模型的每一层的监测变量t
2(l)
和这里的l表示具体的层数。
[0068]
(d)获取第一层pca模型的残差矩阵e,对e执行分层级联的ica算法,随后计算每个训练样本在ica模型的每一层的监测变量i
2(l)
和这里的l表示具体的层数。
[0069]
(e)使用kde方法确定每一层中每个监测变量的置信限。
[0070]
在线监测包括以下步骤:
[0071]
(f)使用训练集的标准化参数对在线测试样本执行标准化。
[0072]
(g)使用训练得到的模型参数计算测试样本在每一层的每个监测变量。
[0073]
(h)将每个监测变量转换为后验概率指标dbs。pca有两个监测变量t
2(l)
和ica有两个监测变量i
2(l)
和故一共可以得到四个dbs指标。
[0074]
(i)将步骤(h)得到的四个dbs指标融合为一个综合的odbs指标,监测该odbs指标,若超过δ则认为系统处于故障状态,否则为正常状态。
[0075]
本发明的有益效果是:本发明通过深度特征提取、贝叶斯定理和加权策略建立了一种基于隐变量模型的工业过程监测方法,该方法能显著提升传统隐变量过程监测模型的性能。本发明首先使用分层级联的隐变量模型结构提取深度隐变量特征并构建传统监测变量;随后使用贝叶斯定理将传统的监测变量转换为后验概率;最后使用加权策略结合不同的后验概率用以构建一个基于概率的监测指标,融合不同的深度特征信息,最后使用融合不同信息后构建的综合指标进行过程监测。与传统的单层隐变量模型相比,本发明的监测效果更好、性能更佳,能够更好地指示系统的运行状态,为安全的工业生产保驾护航。
附图说明
[0076]
图1是深度pca

ica过程检测模型的离线建模步骤示意图;
[0077]
图2是如何计算在线测试样本的监测变量的示意图;
[0078]
图3是深度pca

ica过程检测模型的在线监测流程图;
[0079]
图4是tennessee eastman(te)过程流程图。
具体实施方式
[0080]
假设f(
·
)代表一个任意的隐变量模型(例如pca或ica),是经过预处理后的过程监测问题的训练数据集,其中n为样本总数,m为变量个数。将f(
·
)应用到x上,我们有f(x)=z1,其中z1是由模型f(
·
)提取出的隐变量矩阵。将z1作为第二层隐变量模型f(
·
)的输入数据,我们得到第二层特征z2=f(z1)。经过l次这种映射后,我们可以得到一个深度为l层的分层级联结构,而每一层的数据均为一个隐变量矩阵。每个隐变量矩阵的行数均为样本总数n。上述共计l个隐变量矩阵的计算方式如下:
[0081]
z1=f(x)
[0082]
z
l
=f(z
l
‑1),2≤l≤l
[0083]
其中,z
l
是第l层隐变量模型提取出的隐变量矩阵。
[0084]
对于过程监测而言,我们可以根据某些规则,基于已经提取出的隐变量构造出若干监测变量(一个简单有效的方法是计算每个样本的隐变量向量的2范数)。假设g(
·
)表示某特定的构造规则,而s是由该规则构造出的某监测变量。那么对n个样本,深度为l层的模型结构,我们可以得到共n
×
l个监测变量,即:
[0085]
s
l
(n)=g(z
l
(n)),1≤n≤n,1≤l≤l
[0086]
其中,z
l
(n)是某样本n在第l层的隐变量向量,即隐变量矩阵z
l
的第n行。
[0087]
在每一层,n个训练样本都被转化为n个监测变量。对于每一层,在得到所有的n个监测变量s后,我们可以使用核密度估计(kde)来估算出该监测变量在某特定显著性水平δ下的置信限s
lim
。δ通常取1%或5%,置信限s
lim
为该监测变量的控制限。一般来说,当某测试样本的监测变量大于控制限时,我们即认为该样本处于故障状态。
[0088]
给定一个新的测试样本我们可以得到其在l层结构中每一层的监测变量s
l
(new),其中1≤l≤l。为了结合不同层的监测变量所包含的信息,我们可以使用贝叶斯推理来建立一个综合的基于概率的监测变量。具体步骤如下:
[0089]
将测试样本x
new
处于故障状态的条件概率记为其为正常状态的条件概率记为它们的计算方式为:
[0090][0091][0092]
其中,μ为调节参数,选择其为合适的数值可以降低本发明方法对数据离群点的敏感性。
[0093]
根据贝叶斯定理,我们可以将监测变量s
l
(new)转化为测试样本x
new
处于故障状态的后验故障概率
[0094][0095]
其中,表示系统处于故障状态的先验概率,它等于显著性水平δ。测试样本x
new
的出现概率则由全概率公式给出:
[0096][0097]
其中,与类似,表示系统为正常状态的先验概率,等于置信水平1

δ。
[0098]
不同层的后验故障概率包含了不同的信息,通过将它们加权结合起来,我们可以构建一个结合了不同信息的综合概率指标,这里把该指标命名为dbs:
[0099][0100]
其中,是加权系数,它由合适的加权策略定义。单独计算式中的可以得到经过标准化后的加权系数因此,上式可以简写为:
[0101][0102]
定义当前样本x
new
过去y个时刻处于故障状态的平均后验概率为它的计算方式如下:
[0103][0104]
与均可以在一定程度上反映故障信息,它们的控制限均直接为δ。根据这两个变量可以设计出如下确定大小的规则:
[0105][0106]
其中,η是一个较小的正数,通常取0.1或0.01。
[0107]
在定义了获取的规则之后,我们便可以计算出指示测试样本x
new
状态信息的最终概率指标dbs。dbs能够结合由深度结构提取出的所有l层特征信息,它通常比各层的单监测变量s
l
效果要好。如果测试样本的dbs值大于δ,则认为该样本对应的时刻处于故障状态,否则为正常状态。
[0108]
dbs基于深度特征提取、贝叶斯定理、合适的加权策略融合了单个分层级联深度隐变量模型由各层所提取出的信息。这种思想还可以用于结合不同的分层级联深度隐变量模型的特性与优点。单个隐变量模型可以基于不同的角度定义出不同的监测变量(如pca的t2和q),而不同的隐变量模型又可以构造出性质不同的监测变量。每个监测变量均可以通过上述步骤转换为对应的概率指标dbs,这些不同的dbs又可以通过如上述步骤所示的结合策略融合起来,这相当于从特征提取的角度集成了不同模型的特性与优点。具体地,假设我们
一共集成了h个分层级联深度隐变量模型,基于h个隐变量模型依据上述步骤共建立出k个概率监测指标dbs
k
(1≤k≤k)。
[0109]
在使用综合概率指标dbs
k
进行监测时,测试样本x
new
处于故障状态的概率和处于正常状态的概率
[0110][0111][0112]
其中,μ

为调节参数,本发明实施例中μ

=μ;此时的dbs
k
(new)=dbs
k
就相当于上述公式步骤中的监测变量s
l
(new);表示指标dbs
k
的控制限;对任意的1≤k≤k,均直接等于显著性水平δ。
[0113]
此时,在dbs
k
指标的监测下,测试样本x
new
处于故障状态的后验故障概率为:
[0114][0115]
其中,表示在dbs
k
指标的监测下系统处于故障状态的先验概率,它等于显著性水平δ。类似地,此时在dbs
k
指标的监测下测试样本x
new
的出现概率由如下公式给出:其中,与类似,表示在dbs
k
指标的监测下系统为正常状态的先验概率,它等于置信水平1

δ。
[0116]
不同的后验故障概率进一步包含了不同模型的特性与优点,通过将它们加权结合起来,我们可以构建一个结合了不同模型特点的更为综合全面的指标odbs:
[0117][0118]
其中,w
k
是加权系数,表示在使用dbs
k
进行监测时,当前样本x
new
在过去y个时刻处于故障状态的平均后验概率。
[0119]
的计算方式如下:
[0120][0121]
w
k
可以使用如下的策略定义:
[0122][0123]
其中,η

是一个较小的正数,通常取0.1或0.01;本发明实施例中η

=η。
[0124]
在定义完上述变量后,我们便可以由此计算出odbs。odbs不仅集成了不同隐变量模型的优点,还结合了每个隐变量模型在深度架构下每一层所提取出的信息。与传统的隐变量模型所构建的监测变量相比,它是一个更加综合全面的监测指标,它所取得的监测效果通常比传统的隐变量模型好很多。
[0125]
上述提出的算法原理几乎适用于任一个传统隐变量模型,基于这些算法步骤,本发明使用pca和ica两种隐变量模型构建了一个层数为3的深度pca

ica过程监测模型。下面结合附图对本发明一种基于隐变量模型的工业过程监测方法作进一步说明。
[0126]
离线建模步骤:
[0127]
第一步:收集系统处于正常状态下的数据作为训练集,并对训练集进行标准化。
[0128]
第二步:对标准化后的训练集执行分层级联的pca算法,获取每一层的得分矩阵和负载矩阵。
[0129]
第三步:依据每一层的得分矩阵和负载矩阵计算每个训练样本在pca模型的每一层的监测变量t
2(l)
和这里的l表示具体的层数。
[0130]
第四步:获取第一层pca模型的残差矩阵e,对e执行分层级联的ica算法,随后计算每个训练样本在ica模型的每一层的监测变量i
2(l)
和这里的l表示具体的层数。
[0131]
第五步:使用kde方法确定每一层中每个监测变量的置信限。
[0132]
上述整个离线建模步骤的示意图如图1所示。
[0133]
在线监测步骤:
[0134]
第一步:使用训练集的标准化参数对在线测试样本执行标准化。
[0135]
第二步:使用训练得到的模型参数计算测试样本在每一层的每个监测变量。
[0136]
第三步:依据前文提出的算法步骤将每个监测变量转换为后验概率指标dbs。pca有两个监测变量t
2(l)
和ica有两个监测变量i
2(l)
和故一共可以得到四个dbs指标
[0137]
第四步:依据前文提出的算法步骤将上述四个dbs指标转换为一个综合的odbs指标,监测该odbs指标,若该指标超过控制限则认为系统处于故障状态,否则认为其为正常状态。
[0138]
如何计算单个在线测试样本的t
2(l)
、i
2(l)
、共四个监测变量的示意图如图
2所示。上述整个在线监测步骤的流程图如图3所示。
[0139]
实施例
[0140]
以下结合一个具体的te(tennessee eastman)过程案例来说明本发明所提算法和所建立的深度pca

ica过程监测模型的性能。
[0141]
te过程是故障诊断与故障分类领域常用的标准数据集,整个数据集包括52个过程变量,其工艺流程如图4所示。该流程由气液分离塔,连续搅拌式反应釜,分凝器,离心式压缩机,再沸器等5个操作单元组成,该过程可以由多个代数和微分方程来表示,非线性和强耦合性是该过程传感数据的主要特点。te过程共设置21类故障,在这21类故障中,包括16类已知故障,5类未知故障,故障的种类包括流量的阶跃变化、缓慢斜坡增大、阀门的粘滞等等,包含典型的非线性故障和动态性故障等。
[0142]
本实施例中共收集1460个正常状态的样本用于建立离线阶段的模型,在在线监测阶段,我们考察了全部21类故障的检测效果。每个故障数据集包含960个样本,故障是从第161个样本开始引入的。离线建模阶段中pca的主元个数是通过“平均特征值法”确定的,ica的独立成分个数选为15。调节参数μ设置为1.3,η设置为0.01,y选为5,显著性水平δ为5%。
[0143]
本实施例中我们共对比了pca、ica、深度pca

ica、去噪自编码器(dae)四种模型的监测性能。其中dae是一种基于神经网络的深度模型,它可以提取鲁棒的非线性特征,在过程监测领域已有成功的应用。四种模型对21类故障状态的监测性能如表1所示。表1中的指标为漏报率,漏报率表示模型未能成功检测出故障的概率,漏报率越低表示模型性能越好;对每类故障状态取得最低漏报率的模型以粗体示出。
[0144]
表1:四种模型对21类故障的漏报率(%)
[0145]
[0146][0147]
从表1可以看出,本发明所提出的深度pca

ica模型不仅对大多数故障状态都取得了最低的漏报率,它对21类故障的平均漏报率也是显著低于其它模型。深度pca

ica模型的监测性能不仅优于它的基模型——传统的pca模型和ica模型,而且优于基于神经网络的深度模型dae。这说明我们所提出的算法和模型结构能成功地改进传统隐变量监测模型使其具有更好的监测效果。本发明所提过程监测方法能够更好地指示系统的运行状态,为安全的工业生产保驾护航。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜