基于图正则化半监督字典学习的工业信号故障识别方法

2022-05-31 23:22:08 来源：中国专利 TAG：

1.本公开实施例涉及数据识别技术领域，尤其涉及一种基于图正则化半监督字典学习的工业信号故障识别方法。

背景技术：

2.目前，工业环境的生产过程及现场设备的运行状态良好与否将直接影响生产过程的可靠性和设备使用寿命，准确地判断出设备及生产过程的运行状态将在很大程度上避免事故发生，因此，对工业信号分析进行故障诊断具有重要意义。现有的工业过程故障诊断方法主要包含基于机理模型的故障诊断方法、基于数据驱动的故障诊断方法。基于机理模型的故障诊断方法过于依赖工业背景知识，模型可靠性低，因而泛化能力不强。随着计算机技术以及物联网技术的快速发展，基于数据驱动的方法在设备故障诊断领域取得了较大进展，基于数据驱动的方法一般利用传感器采集的现场信号，采用深度学习以及机器学习方法对信号进行分析，学习信号的内部特征，最后识别出故障的类别。但是深度学习方法存在训练时间过长，对计算机要求较高，学习过程运算量大，耗时长，难应用与工业现场等问题。字典学习方法不受上述问题约束，模型精度高，可靠性好，广泛应用于故障诊断领域。然而现场工业环境采集的信号很多没有标签，而传统字典学习方法大部分集中于研究全监督式的故障诊断，这种方法过于依赖标签数据。针对该问题就需要一种有效的方法在有标签数据少的情况下也能取得较好的诊断效果。字典学习的学习过程是在约束条件下，尽量满足重构误差最小化，再利用相应求解算法求解得到字典和稀疏编码。然而现有的字典学习算法较好的利用了数据有标签特点，因而模型可以取得理想的效果。但是这样的模型普遍存在的问题是：1、过于依赖大量有标签数据，2、只学习数据本身的数据特征未学习数据的内部结构特征。
3.可见，亟需一种高效精准和适应性强的基于图正则化半监督字典学习的工业信号故障识别方法。

技术实现要素：

4.有鉴于此，本公开实施例提供一种基于图正则化半监督字典学习的工业信号故障识别方法，至少部分解决现有技术中存在识别效率、识别精准度和适应性较差的问题。
5.本公开实施例提供了一种基于图正则化半监督字典学习的工业信号故障识别方法，包括：
6.采集目标设备的工业信号数据，其中，所述工业信号数据包括有标签数据和无标签数据；
7.将所述有标签数据和所述无标签数据作为训练数据集并输入基于图正则半监督字典学习模型，得到训练集稀疏编码、置信度矩阵以及结构字典，其中，所述训练集稀疏编码包括所述有标签数据对应的有标签稀疏编码和所述无标签数据对应的无标签稀疏编码；
8.采集所述目标设备的测试集信号，并将所述测试集信号和所述结构字典带入分类
模型，得到所述测试集信号的测试集稀疏编码；
9.根据所述测试集稀疏编码计算所述测试集信号的重构误差，并根据所述重构误差识别所述测试集信号的故障类别。
10.根据本公开实施例的一种具体实现方式，所述将所述有标签数据和所述无标签数据作为训练数据集并输入基于图正则半监督字典学习模型，得到训练集稀疏编码、置信度矩阵以及结构字典的步骤，包括：
11.保存所述有标签数据的流型结构并将其简化为图正则化的有标签稀疏编码；
12.利用k-svd算法初始化监督字典，再利用匹配追踪算法得到所述无标签数据对应的初始化稀疏编码；
13.利用所述无标签数据的重构误差得到所述置信度矩阵；
14.根据所述置信度矩阵更新扩展字典；
15.利用所述匹配追踪算法求解所述初始化稀疏编码得到所述无标签稀疏编码；
16.利用fista反向传播方法更新所述有标签稀疏编码；
17.利用metaface方法更新监督字典；
18.根据更新后的扩展字典和更新后的监督字典形成所述结构字典。
19.根据本公开实施例的一种具体实现方式，所述保存所述有标签数据的流型结构并将其简化为图正则化的有标签稀疏编码的步骤，包括：
20.利用k近邻算法计算每个所述有标签数据的k个近邻点；
21.根据所述k个近邻点计算权重系数矩阵；
22.根据所述权重系数矩阵将全部所述有标签数据映射至低维空间，并通过拉普拉斯矩阵将其简化为图正则化的有标签稀疏编码。
23.根据本公开实施例的一种具体实现方式，所述利用所述无标签数据的重构误差得到所述置信度矩阵的步骤，包括：
24.计算每个所述无标签数据属于不同类的置信度值后得到所述置信度矩阵。
25.根据本公开实施例的一种具体实现方式，所述根据所述置信度矩阵更新扩展字典的步骤，包括：
26.根据所述置信度矩阵，利用奇异值分解更新所述扩展字典。
27.根据本公开实施例的一种具体实现方式，所述采集所述目标设备的测试集信号，并将所述测试集信号和所述结构字典带入分类模型，得到所述测试集信号的测试集稀疏编码的步骤，包括：
28.将所述测试集信号和所述结构字典带入所述分类模型，根据所述结构字典得到所述测试集信号对应的稀疏表示；
29.利用所述匹配追踪算法求解所述稀疏表示，得到所述测试集稀疏编码。
30.本公开实施例中的基于图正则化半监督字典学习的工业信号故障识别方案，包括：采集目标设备的工业信号数据，其中，所述工业信号数据包括有标签数据和无标签数据；将所述有标签数据和所述无标签数据作为训练数据集并输入基于图正则半监督字典学习模型，得到训练集稀疏编码、置信度矩阵以及结构字典，其中，所述训练集稀疏编码包括所述有标签数据对应的有标签稀疏编码和所述无标签数据对应的无标签稀疏编码；采集所述目标设备的测试集信号，并将所述测试集信号和所述结构字典带入分类模型，得到所述
测试集信号的测试集稀疏编码；根据所述测试集稀疏编码计算所述测试集信号的重构误差，并根据所述重构误差识别所述测试集信号的故障类别。
31.本公开实施例的有益效果为：通过本公开的方案，将字典学习与半监督学习结合，用以解决由于工业环境有标签数据较少导致模型学习效果不理想的问题，以及，将字典学习与图正则化结合，用以解决传统方法只考虑数据本身的数据域特征、却忽略了数据的内部几何结构特征的问题，以此来增强模型学习的判别性及可靠性，提高了识别的效率、精准度和适应性。
附图说明
32.为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
33.图1为本公开实施例提供的一种基于图正则化半监督字典学习的工业信号故障识别方法的流程示意图；
34.图2为本公开实施例提供的一种工业信号数据处理流程示意图；
35.图3为本公开实施例提供的一种工业信号数据处理具体流程示意图。
具体实施方式
36.下面结合附图对本公开实施例进行详细描述。
37.以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。
38.需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
39.还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
40.另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。
41.本公开实施例提供一种基于图正则化半监督字典学习的工业信号故障识别方法，所述方法可以应用于工业生产场景中的设备运行状态识别流程。
42.参见图1，为本公开实施例提供的一种基于图正则化半监督字典学习的工业信号故障识别方法的流程示意图。如图1和图2所示，所述方法主要包括以下步骤：
43.s101，采集目标设备的工业信号数据，其中，所述工业信号数据包括有标签数据和无标签数据；
44.具体实施时，当需要对某个设备对应的工业信号进行识别以判断故障类别时，可以先将其作为所述目标设备，然后收集所述目标设备在历史运动过程中产生的工业信号数据，其中，所述工业信号数据包括有标签数据和无标签数据。
45.s102，将所述有标签数据和所述无标签数据作为训练数据集并输入基于图正则半监督字典学习模型，得到训练集稀疏编码、置信度矩阵以及结构字典，其中，所述训练集稀疏编码包括所述有标签数据对应的有标签稀疏编码和所述无标签数据对应的无标签稀疏编码；
46.进一步的，步骤s102所述的，将所述有标签数据和所述无标签数据作为训练数据集并输入基于图正则半监督字典学习模型，得到训练集稀疏编码、置信度矩阵以及结构字典，包括：
47.保存所述有标签数据的流型结构并将其简化为图正则化的有标签稀疏编码；
48.利用k-svd算法初始化监督字典，再利用匹配追踪算法得到所述无标签数据对应的初始化稀疏编码；
49.利用所述无标签数据的重构误差得到所述置信度矩阵；
50.根据所述置信度矩阵更新扩展字典；
51.利用所述匹配追踪算法求解所述初始化稀疏编码得到所述无标签稀疏编码；
52.利用fista反向传播方法更新所述有标签稀疏编码；
53.利用metaface方法更新监督字典；
54.根据更新后的扩展字典和更新后的监督字典形成所述结构字典。
55.可选的，所述保存所述有标签数据的流型结构并将其简化为图正则化的有标签稀疏编码的步骤，包括：
56.利用k近邻算法计算每个所述有标签数据的k个近邻点；
57.根据所述k个近邻点计算权重系数矩阵；
58.根据所述权重系数矩阵将全部所述有标签数据映射至低维空间，并通过拉普拉斯矩阵将其简化为图正则化的有标签稀疏编码。
59.可选的，所述利用所述无标签数据的重构误差得到所述置信度矩阵的步骤，包括：
60.计算每个所述无标签数据属于不同类的置信度值后得到所述置信度矩阵。
61.可选的，所述根据所述置信度矩阵更新扩展字典的步骤，包括：
62.根据所述置信度矩阵，利用奇异值分解更新所述扩展字典。
63.具体实施时，考虑到在面对只有少量有标签数据大量无标签数据的情况，我们可以利用半监督学习充分挖掘无标签数据内的特征以弥补有标签数据不够的缺点。在本发明中，我们提出了一种新的半监督字典学习方法。在学习字典时，我们为每个无标签数据学习对应的类别概率分布p
i,j
，每一个数据的类别概率分布组合成一个置信度矩阵p。此外，我们
通过无标签数据学习一个扩展字典，并将无标签数据学习得到的扩展字典作为整体字典的补充，这样可以增强模型的可靠性同时利用置信度高的样本进一步完善字典，这表明该方法对标签分配错误具有鲁棒性。传统字典学习方法只学习了数据本身存在的数据域特征，流形学习的研究发现数据特征除了数据域的特征外，数据本身还存在内部几何结构特征。非线性的高维数据中具有内在低维结构，即流形结构，流形学习方法是一种能发现非线性数据内在流形结构的有效方法。通过学习数据的内部几何结构特征，可以加强模型的判别性。局部线性嵌入是一种有效的流行学习方法，我们在本发明考虑利用局部线性嵌入将流形结构从原始数据保存到稀疏编码空间，这可以认为是对稀疏编码的正则化，最后将其化成稀疏编码的图正则化形式。
64.通过将字典学习与半监督学习、流形学习相结合，我们所提出基于图正则化半监督字典学习模型的目标函数如下：
[0065][0066][0067]
在上式中，x＝[x1,
…
,xi,
…
,xc]是有标签训练集，一共包含c类不同的样本，是第i类训练样本，每一类有标签训练样本包含n
l
个样本，xi的每一列是一个训练样本数据；是包含nu个无标签训练样本。[d
iei
]表示学习到的字典，这与传统字典学习有所不同，我们将需要的字典分为两部分，d＝[d1,
…di
,
…
,dc]以及e＝[e1,
…ei
,
…
ec]，其中di代表第i类监督字典，ei是扩展字典代表第i类扩展字典，扩展字典主要是为了探寻无标签数据的判别性特征，作为整体字典的补充。字典[d
iei
]跟第i类样本有关，我们期望字典[d
iei
]能较好的表示第i类样本，而较差的表示其它类样本。
[0068]
a＝[a1,
…ai
,
…
,ac]表示有标签数据稀疏编码，表示第i类稀疏编码，每一类共包含n
l
个稀疏编码。是无标签数据稀疏编码，表示第j个数据的第i类稀疏编码。p
i,j
表示无标签数据属于某一类别的置信度，p
i,j
具体表示第j个无标签数据属于第i类的置信度。la是在局部线性嵌入方法中利用有标签数据样本计算得到的拉普拉斯矩阵，将la用于稀疏编码图正则化。约束条件表示第j类无标签数据属于每一类样本置信度的和为1。α、β都是正参数，用于控制目标函数对应项的权重。
[0069]
目标函数每一项的具体表示含义解释如下：
[0070]
表示有标签数据重构误差项，我们应尽量让重构误差小；表示图正则稀疏编码，为了保存数据的流行结构，我们通过局部线性嵌入方法保存数据的流行结构，并最终化简成图正则化稀疏编码形式；
[0071]
表示无标签数据的重构误差项，应尽量让字典[d
iei
]较好表示数据，满足重构误差尽量小的要求；置信度p
i,j
可以保证置信度高的无标签样本影响更大，而使得置信度低的无标签样本影响更小，这样做法使得该方法利用无标签数据更有弹性，对标签分配错误更具有鲁棒性；
[0072]
β||ai||1、分别是有标签数据以及无标签数据的稀疏编码，这两项是为确保稀疏编码满足相应的稀疏特性。
[0073]
综合以上分析知道，我们通过为无标签数据引入一个置信度矩阵p，通过置信度矩阵p我们能知道样本属于每一个类别的置信度。而为了更有弹性的学习无标签数据特征，我们充分利用置信度高的样本学习了一个扩展字典，这样可以用来完善字典，加强字典的表示能力；此外，我们运用局部线性嵌入方法保存数据的流形结构，并将其简化成图正则化形式，以增强字典的判别性以及可靠性。
[0074]
然后，对所述基于图正则半监督字典学习模型的目标函数进行优化，具体步骤可以为：优化过程主要步骤如下所示：
[0075]
步骤1.1：
[0076]
初始化：我们首先利用k-svd算法初始化字典d，再利用匹配追踪算法(omp)初始化稀疏编码y。
[0077]
步骤1.2：
[0078]
更新置信度矩阵p：我们通过计算每一个样本属于不同类的置信度p
i,j
来更新置信度矩阵p，例如第j个无标签数据属于第i类的置信度更新如下：
[0079][0080]
其中表示第j个无标签数据的第i类重构误差，β是正参数。
[0081]
步骤1.3：
[0082]
更新扩展字典ei：我们将式改写成：
[0083][0084]
则利用奇异值分解有：
[0085]
因此字典ei的更新：ei＝u(:,n)
[0086]
式中的n是扩展字典原子的数量。
[0087]
步骤1.4：
[0088]
更新稀疏编码yj：我们通过固定其它项，只更新稀疏编码yj，优化问题转化为：
[0089][0090]
将上式改写为
[0091]
改写后的式中bi表示所有样本属于第i类的置信度与对应无标签样本的乘积
yi表示所有样本属于第i类的置信度与其对应稀疏编码的乘积这样我们可以很容易的更新稀疏编码yi，我们采用omp方法求解yi＝[d
iei
]([d
iei
]
t
[d
iei
])-1
[d
iei
]
tbi
。
[0092]
步骤1.5：
[0093]
更新稀疏编码ai：我们先固定其它项，只更新稀疏编码ai，优化问题转化为：
[0094][0095]
利用fista反向传播可以有效的求解稀疏编码，当迭代至n 1次：
[0096][0097]
其中λ、τ＞0，表示函数对的导数，其中
[0098]
步骤1.6：
[0099]
更新字典di：我们先固定其他项，只更新字典di，优化问题转化为：
[0100][0101]
我们可以利用metaface方法按类更新字典原子，有效的求解字典di，求解得到第i类字典的第l个字典原子
[0102][0103]
其中表示第i类字典，表示第i类字典的第j个字典原子，每类字典包含k个字典原子；所有的稀疏编码a＝[a1,
…ai
,
…
,ac]共包含c类稀疏编码，第i类稀疏编码稀疏编码表示第l个有标签数据的第i类稀疏编码；无标签数据第i类稀疏编码类稀疏编码表示第l个无标签数据的第i类稀疏编码；xi是第i类有标签样本，bi表示所有样本属于第i类的置信度与对应无标签样本的乘积
[0104]
s103，采集所述目标设备的测试集信号，并将所述测试集信号和所述结构字典带入分类模型，得到所述测试集信号的测试集稀疏编码；
[0105]
在上述实施例的基础上，步骤s103所述的，采集所述目标设备的测试集信号，并将所述测试集信号和所述结构字典带入分类模型，得到所述测试集信号的测试集稀疏编码的步骤，包括：
[0106]
将所述测试集信号和所述结构字典带入所述分类模型，根据所述结构字典得到所述测试集信号对应的稀疏表示；
[0107]
利用所述匹配追踪算法求解所述稀疏表示，得到所述测试集稀疏编码。
[0108]
具体实施时，所述分类模型可以如下所示：
[0109][0110]
我们将求解得到的字典[d
iei
]带入上述分类模型，利用图正则半监督字典学习求解得到的字典稀疏表示所述测试集信号，再利用omp算法求解所述测试集信号对应的稀疏编码ai。
[0111]
s104，根据所述测试集稀疏编码计算所述测试集信号的重构误差，并根据所述重构误差识别所述测试集信号的故障类别。
[0112]
具体实施时，求解得到测试样本稀疏编码后，计算样本的重构误差ε＝[ε1,
…
,εc]，εi表示样本的第i类重构误差，利用重构误差就能够有效识别样本的类别。利用本实施例提供的基于图正则化半监督字典学习的工业信号故障识别方法对工业信号数据进行训练和识别的具体流程如图3所示。
[0113][0114]
样本x类别＝min{ε}
[0115]
本实施例提供的基于图正则化半监督字典学习的工业信号故障识别方法，通过将字典学习与半监督学习、图正则化结合，可以有效解决由于工业环境有标签数据较少而导致模型学习效果不理想的问题；
[0116]
引入一个无标签数据的置信度，更有弹性的学习无标签数据特征，这样可以对标签分配错误具有鲁棒性；
[0117]
从无标签数据中学习一个扩展字典，这样能够增强模型的可靠性同时利用置信度高的样本进一步完善字典；
[0118]
本发明解决了传统方法只考虑数据本身的数据域特征、却忽略了数据的内部几何结构特征的问题，以此来增强模型学习的判别性及可靠性，提高了识别的效率、精准度和适应性。
[0119]
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。
[0120]
应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
[0121]
以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：人脸活体检测方法、装置、电子设备及存储介质与流程

基于图正则化半监督字典学习的工业信号故障识别方法

相关文献

最热文献