一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于混合数据增强的MSWI过程燃烧状态识别方法与流程

2022-03-14 01:46:23 来源:中国专利 TAG:

基于混合数据增强的mswi过程燃烧状态识别方法
技术领域
1.本发明属于燃烧状态识别领域。


背景技术:

2.城市固废(msw)受居民生活习惯、季节气候、分类程度等因素的影响,具有热值波动大、杂质多、含水率高等特点。城市固废焚烧(mswi)作为一种世界范围内msw典型处理方式,具有减小体量、降低二次污染、通过产热发电实现资源的回收利用等优势。目前,发展中国家的mswi技术仍处于落后局面,存在诸多问题有待解决,其中最突出的是燃烧不稳定造成的污染物排放不达标问题。此外,mswi状态的不稳定易造成炉膛内结焦、积灰、腐蚀等问题,严重时甚至会引起炉膛爆炸。因此,稳定燃烧状态是保障mswi过程高效运行、污染物排放达标的关键。如图1所示,在国内的mswi过程中,运行专家通过观察火焰图像以识别燃烬线位置,进而修正控制策略。然而,依据运行专家经验的燃烧状态识别方法具有主观性与随意性,其智能化程度较低,难以满足当前mswi工业的优化运行需求。针对复杂多变的mswi环境,如何构造鲁棒性强的mswi过程燃烧状态识别模型仍是一个开放性难题。
3.mswi过程的燃烧火焰具有亮度差异、遮挡、类内形变、运动模糊等特征,进而导致不同状态下的燃烧图像像素差异较大,使得基于硬编码的燃烧状态识别方法难以适用。近年来,基于数据驱动的研究方法在尝试解决语义鸿沟问题等方面取得了重大进展,为mswi过程的燃烧状态识别奠定了基础。
4.目前,基于数据驱动的识别模型包括近邻分类器、贝叶斯分类器、线性分类器、支撑向量机(svm)、神经网络分类器、随机森林以及多方法结合等,其策略可分为两类:一类是基于特征提取与分类器组合的方法,又称为特征工程;一类是基于深度学习的端到端方法,主要以卷积神经网络(cnn)为代表。
5.相比于深度学习算法,特征工程不依赖于大样本数据,已在燃烧状态的识别中得到了应用。但mswi过程是一个具有强不确定性特征的工业过程,其燃烧火焰图像易受环境干扰。现有的火焰特征选择方法通常依赖于专家先验知识,这导致基于特征工程的识别算法的鲁棒性能较弱且泛化性能较差。基于cnn的识别模型因具有良好的特征提取能力和泛化性能,已在诸多领域得到广泛应用。然而,以cnn为代表的监督学习网络模型的准确率直接取决于标签样本的规模与质量,而mswi过程的图像采集设备长期处于强干扰环境中,导致样本标定困难。因此,如何基于现有技术获得高质量样本是提升燃烧状态识别模型性能所面临的难点之一。
6.常用的图像数据增强方法包含几何变换、颜色抖动、随机噪声等,其本质是对原始数据进行非生成式变换以实现样本的增加,从而缓解识别模型过拟合现象。然而,以上方法未增加新样本的信息,因此缓解过拟合的效果有限。基于gan的数据增强策略博弈最终将达到纳什均衡状态。此时,生成器虽然能够生成符合小样本数据的概率分布的数据,却难以创造出新特征。因此,基于gan的数据增强识别模型的鲁棒性难以得到实质性的提升。非生成式数据增强操作在本质上未改变图像本质内容,模型的泛化性能提升有限,但通过平移、旋
转、填充火焰图像却能够获得新的特征。因此,本文构建了一种混合式数据增强的mswi过程燃烧状态识别模型,主要工作包括:
7.1)针对目前燃烧状态识别方法存在的局限性,归纳总结了研究中存在的问题,首次将gan用于mswi过程燃烧状态识别。
8.2)分析了生成式数据增强的缺陷,并提出一种混合式数据增强的方法,弥补了生成对抗式数据增强的不足。
9.3)设计一种切实可行的实验策略,通过弗雷歇距离(fr
é
chet inception distance,fid),对不同生成模型生成的图像质量进行评估,为样本筛选提供了评价指标。
10.4)通过与其他识别模型对比,表明本文所构建的燃烧状态识别模型泛化性能好、准确率高且鲁棒性强。


技术实现要素:

11.本节提出如图2所示基于混合数据增强的mswi过程燃烧状态识别模型,该模型由数据预处理模块、生成式数据增强模块、增强图像选择模块、燃烧状态识别模块四部分组成。
12.图2中,x
fw
、x
nm
和x
bc
表示燃烧线前移、正常和后移三种燃烧状态数据集;x'
fw
、x'
nm
和x'
bc
表示前移、正常和后移三种燃烧状态的训练样本集;x"
fw
、x"
nm
和x"
bc
表示前移、正常和后移三种燃烧状态的验证集和测试集样本;z表示服从正态分布的100维随机噪声;g(z)表示由随机噪声经过生成网络得到的虚拟样本;s
d,t
和s
g,t
表示燃烧图像粗调dcgan中获得的判别网络和生成网络的结构参数;x
real
在燃烧图像粗调dcgan子模块中参加博弈的真实数据,该数据不随博弈而改变,故无下标t;x
false,t
表示在燃烧图像粗调dcgan子模块参加第t轮博弈的生成数据;θ
d,t
和θ
g,t
表示在燃烧图像粗调dcgan子模块中第t次博弈判别网络和生成网络分别更新前的网络参数;d
t
(
·

·
)和d
t 1
(
·

·
)分别表示在燃烧图像粗调dcgan子模块判别网络参数分别为θ
d,t
和θ
d,t 1
时判别网络的预测值集合;y
d,t
和y
g,t
表示在燃烧图像粗调dcgan子模块中第t次博弈训练判别网络和生成网络的真实值集合;loss
d,t
和loss
g,t
分别表示在燃烧图像粗调dcgan子模块中第t次博弈更新判别网络和生成网络的损失值;g
t
(z)表示在燃烧图像粗调dcgan子模块第t次博弈中由随机噪声经过生成网络得到的虚拟样本;和分别表示在燃烧线前移、正常和后移精调dcgan子模块中参加博弈的真实数据,该数据不随博弈次数的变化而变化;和分别表示在燃烧线前移、正常和后移精调dcgan子模块中参加第t次博弈的生成数据;和分别表示在燃烧线前移、正常和后移dcgan子模块中第t次博弈判别网络更新前的网络参数;和分别表示在燃烧线前移、正常和后移dcgan子模块中第t次博弈生成网络更新前的网络参数;和分别表示在燃烧线前移、正常和后移精调dcgan子模块中判别网络参数分别为和时判别网络的预测值集合;和分别表在燃烧线前移、正常和后移精调dcgan子模块中判别网络参数分别为别表在燃烧线前移、正常和后移精调dcgan子模块中判别网络参数分别为和时判别网络的预测值集合;和分别表示在燃烧线前移、正常和后移精调dcgan
子模块中第t次博弈训练判别网络的真实值集合;子模块中第t次博弈训练判别网络的真实值集合;和分别表示燃烧线前移、正常和后移精调dcgan子模块中第t次博弈训练生成网络的真实值集合;和分别表示燃烧线前移、正常和后移精调dcgan子模块中第t次博弈更新判别网络的损失值;和分别表示燃烧线前移、正常和后移精调dcgan子模块中第t次博弈更新生成网络的损失值;ξ
fw
、ξ
nm
和ξ
bc
分别表示增强图像选择模块中前移、正常和后移fid值的阈值;y
cnn,t
表示燃烧状态识别模块第t次更新cnn模型真实输出集合;y
cnn,t
表示燃烧状态识别模块第t次更新cnn模型预测值集合;loss
cnn,t
表示燃烧状态识别模块第t次更新cnn的损失;θ
cnn,t
表示燃烧状态识别模块第t次更新cnn的网络更新参数。
13.图2中不同模块的功能描述如下:
14.1)数据预处理模块:其输出为典型工况下的三种燃烧状态图像;主要功能是从mswi电厂采集图像数据,并选取典型工况得到三种燃烧状态图像数据,并将其划分为训练样本集、验证样本集和测试样本集。
15.2)生成式数据增强模块:主要由一个粗调dcgan子模块和三个精调dcgan子模块组成,在燃烧图像粗调dcgan子模块中:其输入是在所有燃烧图像中随机采样获取的数据集,其输出是判别网络、生成网络的结构参数;主要功能是获取能够生成优质样本;在三个精调dcgan子模块中:其输入为对应燃烧状态的训练样本集和粗调dcgan中生成网络、判别网络的结构参数,其输出为对应燃烧状态的生成图像;主要功能是通过博弈生成不同燃烧状态下的优质样本。
16.3)增强数据选择模块:其输入为生成的不同燃烧状态的优质样本和对应状态下的训练样本,其输出为构建不同燃烧状态的训练、验证和测试集;主要功能是:分别计算对应子模块中真实数据与生成数据间fid值,基于fid值选择优质样本放入训练集。
17.4)燃烧状态识别模块:其输入为上述模块构建的训练、验证和测试集,其输出为验证集、测试集的准确率与损失;主要功能是对上述模块构建的训练样本进行非生成式数据增强,并基于混合数据训练cnn。
18.综上所述,上述不同模块分别实现了数据预处理、基于生成对抗式的数据增强、基于fid的增强图像选择和基于混合式数据增强的燃烧状态识别,其中,针对燃烧状态图像设计生成式和非生成式数据增强建模方法,并将二者融合的策略是本文所提方法的核心。
19.2.1数据预处理模块
20.首先,燃烧火焰视频通过电缆传输和视频卡采集,然后将采集的视频以分钟为周期进行存储,最后结合领域专家经验和机理知识选择燃烧线处于不同位置的标准火焰图像。按照干燥段、燃烧段和燃烬段共3个区域对标准火焰图像进行划分,并对每张图像进行标记。
21.2.2生成式数据增强模块
22.如图2所示,生成式数据增强模块主要由四个dcgan子模块组成,燃烧图像粗调dcgan子模块随机选取固废燃烧图像进行博弈,从而获得较好的网络结构,其余子模块采用燃烧图像粗调dcgan的网络结构,并对其超参数进行精调。
23.以粗调dcgan子模块中第t轮博弈为例:首先,将随机获取的燃烧图像作为dcgan的x
real
,由z通过生成网络得到x
false,t
;接着,x
real
和x
false,t
经过网络参数为θ
d,t
的判别网络后
得到d
t
(
·

·
),通过将真实图片标记为1和虚假图片标记为0得到y
d,t
,将d
t
(
·

·
)和y
d,t
根据损失函数计算得到loss
d,t
,其经过优化器得到判别网络的新参数θ
d,t 1
以更新判别网络;然后,x
real
和x
false,t
经过网络参数为θ
d,t 1
的判别网络后得到d
t 1
(
·

·
),通过将真实图片和虚假图片均标记为1得到y
g,t
,将d
t 1
(
·

·
)和y
g,t
根据损失函数的计算得到loss
g,t
,其经过优化器得到生成网络新参数θ
g,t 1
以更新生成网络;最后,重复进行上述博弈以获得生成数据。
24.2.2.1小结以粗调dcgan子模块为例介绍网络的结构,2.2.2小节介绍以粗调dcgan子模块中判别网络为例介绍学习算法,2.2.3小节以粗调dcgan子模块为例介绍网络博弈过程;2.2.4介绍多工况图像生成的必要性。
25.2.2.1dcgan网络结构
26.dcgan由生成网络和判别网络两个前馈网络组成。生成网络由全连接层、批归一化层、形状变换层、上采样层、卷积层和激活层组成。生成网络的设计目标是将潜在空间100维的随机向量z生成符合真实图像分布的图像:首先,由潜在空间100维的随机向量z经全连接层输出具有16*16*128=32768个变量的一维向量;接着,通过形状变换将其变为(16,16,128)的张量;然后,上采样操作将形状为(16,16,128)的张量转化为形状(32,32,128)的张量,将形状为(32,32,128)的张量转化为形状(64,64,128)的张量,在该过程中的每个上采样操作后添加卷积核尺寸为4、填充方式为“same”、步长为1、通道数分别为128、64和3的卷积层,使网络能够记录火焰图像的空间特征,并最终变换成(64,64,3)的目标形状,即rgb图像的目标形状;最后,使用tanh激活函数将最终输出转换成-1~1之间的实数,以方便生成图像时将其转换成对应的像素。将批量归一化层添加在全连接层后以缓解内部协变量转移问题,进而提高网络训练速度与稳定性;激活函数leakyrelu(alpha=0.2)在增加网络非线性描述能力的同时,保证了梯度下降的稳定性,提高了与判别网络博弈过程的稳定。
27.判别网络由全连接层、形状变换层、上采样层、卷积层和激活层组成。判别网络的目标是给出图片为真的概率:首先,由卷积核尺寸为4、通道数分别为32、64、128和256的4个卷积层的叠加实现特征提取,卷积层中间添加leakyrelu(alpha=0.2),增加网络非线性的同时保证判别网络在与生成网络博弈过程的稳定,dropout(0.5)层通过随机丢失50%神经元缓解网络过拟合问题;然后,flatten层将特征图铺平;最后,将激活函数为“sigmoid”的dense层作为分类器,得到图片为真的概率。
28.2.2.2网络学习算法
29.在dcgan中,生成网络和判别网络均属于前馈神经网络,以燃烧图像粗调dcgan中第t轮判别网络更新为例:其参数更新步骤包括用反向传播算法计算梯度和adam算法更新权重参数。
30.1)反向传播算法计算梯度:为表述方便,将图像集[x
real
;x
false,t
]表示为x即[x1;x2;...;xa;...],其中xa表示第a张图片,d
t
(xa)表示第a张图片输入判别网络预测值,d
t
(x)表示判别网络预测值集合即d
t
(
·

·
),y
d,t
表示判别网络真实输出集合[y1;y2;...;ya;...],其中ya表示第a张图片的真值,l为损失函数,损失函数的表达式为l(y
d,t
,d
t
(x)),进而将某个具体损失函数表示为:l(ya,d
t
(xa)),其梯度如下式所示:
[0031]
[0032]
由于判别网络的结构复杂,d
t
难以直接求得。因此,采用反向传播算法通过链式法则由后往前推导,从而简化判别网络节点的梯度,如下式所示:
[0033][0034][0035][0036][0037]
式中,第i层的误差为δi;第i层输出为oi;第i层的权重和偏置为wi和bi;第i-1层的权重和偏置的当前梯度分别为和上标t表示转置。
[0038]
2)采用adam梯度下降算法更新判别网络参数,adam更新权重的公式为:
[0039][0040]
式中,θ
d,t
为第t次判别网络的参数;α为学习率,值为0.00015;γ为很小的正实数,值为1*10-8
,用于防止分母为0;m
d,t
表示第t次判别网络的一阶动量,如下式:
[0041][0042]vd,t
表示第t次判别网络的二阶动量,如下式:
[0043][0044]
式中,β1、β2为超参数,β1=0.5,β2=0.99;为第t次判别网络参数的梯度。
[0045]
对于第t轮迭代,判别网络参数的更新步骤为:首先,根据式(2)~(5)可计算当前每层参数的梯度,进而获得整个网络参数的梯度接着,根据历史梯度计算一阶动量m
d,t
与二阶动量v
d,t
;然后,计算第t次的下降梯度η
d,t
,如下式:
[0046][0047]
最后,采用η
d,t
更新第t次的判别网络参数θ
d,t
以得到t 1次的网络参数θ
d,t 1
,如下式:
[0048]
θ
d,t 1
=θ
d,t-η
d,t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0049]
由于m
d,0
=0和v
d,0
=0,所以一阶动量与二阶动量在更新参数的初始阶段接近于0。因此,式(7)和(8)中m
d,t
和v
d,t
被修正,修正后的一阶动量与二阶动量为m
d,t
和如下所示:
[0050][0051][0052]
燃烧图像粗调dcgan中adam梯度下降算法更新生成网络参数,其学习率值为0.00015,β1=0.5,β2=0.99。
[0053]
2.2.3网络博弈过程
[0054]
生成对抗式数据增强是通过生成网络与判别网络的博弈参数进行更新,因此梯度
信息尤为重要。以燃烧图像粗调dcgan第t次博弈为例:更新判别网络参数和生成网络参数的目标函数如式(13)和(14)所示,其中,pr(x)表示真实数据的概率分布;pz(z)表示潜在空间100维的随机向量z服从的正态分布;e表示期望;g
t
(z)表示在燃烧图像粗调dcgan子模块第t次博弈中由随机噪声经过生成网络得到的虚拟样本;θ
d,t
和θ
g,t
表示在燃烧图像粗调dcgan子模块中第t次博弈判别网络和生成网络分别更新前的网络参数;θ
d,t 1
和θ
g,t 1
表示在燃烧图像粗调dcgan子模块中第t次博弈判别网络和生成网络分别更新后的网络参数;d
t
(x)和d
t 1
(x)分别表示在燃烧图像粗调dcgan子模块判别网络参数分别为θ
d,t
和θ
d,t 1
时判别网络的预测值集合;表示logd
t
(x)的期望,其中,x服从真实数据的概率分布;表示log(1-d
t
(g
t
(z)))的期望,其中,z服从pz(z);e
z~p(z)
log(d
t 1
(g
t
(z)))表示log(d
t 1
(g
t
(z)))的期望,其中,z服从pz(z)。
[0055][0056][0057]
在博弈过程中,交替更新判别网络和生成网络参数。该目标函数能够有效解决早期梯度不足与训练困难的问题,后期梯度下降过快导致梯度爆炸等问题。实现该目标函数的方式为:设gan的损失函数为二元交叉熵函数,如下式所示:
[0058][0059]
式中,y表示神经网络真值集合,f(x)表示神经网络预测值集合,xa表示第a张图片,f(xa)表示第a张图片输入神经网络的预测值,ya表示第a张图片的真值,n表示图片的总个数。
[0060]
当训练判别网络时,将真实图像标记为1,生成图像标记为0,目的是使等价于式(13),步骤如下:
[0061]
1)输入一张真实图像,ya=1,损失为-log(d
t
(xa))=-logd
t
(x);当输入一组真实图像数据集时,可获得下式:
[0062][0063]
2)当输入一个虚假图像,ya=0,损失为log(1-d
t
(xa))=-log(1-d
t
(g
t
(z)))。当输入一组生成图像数据集时可获得下式:
[0064][0065]
综合步骤1)和2)可得等价于式(13)。
[0066]
当训练生成网络时,真实图像与虚假图像都标记为1即ya=1,输入一个真实图像和虚假图像均为log(d
t 1
(xa)),可知等价于式(14)。
[0067]
本文中的对抗网络生成模型共有四个:燃烧图像粗调dcgan、燃烧线前移精调dcgan、燃烧线正常精调dcgan和燃烧线后移精调dcgan,其原因在于:在pr和pg是常数的情况下gan的目标函数已被证明网络能够收敛,而实际pr和pg是混合高斯分布。因此,针对不同工况下焚烧图像数据分布存在差异的情况,选取多种工况的燃烧图像训练燃烧图像dcgan,以
获得较好的网络模型;对每个燃烧状态采用该网络结构并微调其超参数。微调结果如表1所示,其中,epochs表示遍历整个数据集的次数,epoch_fid_start表示从epoch_fid_start轮迭代开始计算fid。
[0068]
表1超参数微调
[0069][0070][0071]
在上述3个生成模型更新的过程中,采用的fid指标如下式所示:
[0072][0073]
式中,μr与μg表示真实图像集和生成图像集多元正态分布的均值;covr与covg表示真实图像集和生成图像集的协方差矩阵;tr表示真实图像集矩阵的迹。首先,抽取inception网络的中间层映射,构建一个多元正态分布学习这些特征映射的概率分布;然后,使用式(18)计算真实图像与生成图像间的fid分数,其中,fid分数越低,说明模型质量越高,其生成具有多样性、高质量的图像的能力也越强;最后,采用fid对生成模型的图像质量进行评估。当fid小于设定阈值时,将生成合格燃烧图像并将其放入训练集,其中,前移、正常和后移的阈值ξ
fw
、ξ
nm
和ξ
bc
分别为60、60和63。
[0074]
本文使用增强数据训练基于cnn的燃烧状态识别模型。架构如图2中的燃烧状态识别模块所示:1)非生成式数据增强:将所有数据集像素点值除以255,同时对训练集的数据随机旋转0~5
°
,沿水平方向随机平移比例0~0.3,随机将图片水平翻转,填充新创建的像素的方法为“reflect”;2)cnn结构:首先将4层卷积核为(3,3)的卷积和窗口尺寸为(2,2)的最大池化层堆叠以提取特征,然后通过flatten层将张量拉平,结合dropout防止过拟合,最后将全连接层做分类器,其中,损失函数采用交叉熵函数,优化器采用adam优化器,其学习率为0.001,其他参数均为默认值。
附图说明
[0075]
图1 mswi过程工艺图
[0076]
图2基于dcgan数据增强的燃烧状态识别策略
[0077]
图3生成网络结构
[0078]
图4判别网络结构
[0079]
图5燃烧线前移
[0080]
图6燃烧线正常
[0081]
图7燃烧线后移
[0082]
图8随机选取的迭代过程中fid对生成燃烧状态图像的评估结果
[0083]
图9迭代过程中fid对生成不同燃烧状态图像的评估结果
[0084]
图10 a划分燃烧线前移图像的扩充结果
[0085]
图11 a划分燃烧线正常图像扩充结果
[0086]
图12 a划分燃烧线后移扩充结果
[0087]
图13非生成式数据增强
[0088]
图14不同生成模型生成的燃烧状态图像
具体实施方式
[0089]
在北京市某mswi电厂焚烧炉的炉膛后壁安装摄像头,采集的数据通过电缆传送至工控机的视频采集卡,采用相应软件获取单通道视频,并对火焰图像按每分钟进行存储。根据专家经验和炉排结构,选取典型工况下的数据标记燃烧线前移、正常和后移的各90张图像。按时间段将每种工况数据集划分为t1至t10,每个时间段的数据为9张图像;其中t9和t10时间段的数据受噪声影响较大,存在图像不清晰、msw焚烧不均匀等问题。本文选取的两种划分数据集的方式如表2所示。
[0090]
表2数据集划分
[0091][0092]
通过a划分可测试识别模型的鲁棒性。b划分涵盖工况全面,其准确率可反应模型的泛化性能。为确保结果的严谨,对每种划分进行10次重复实验,结果以均值和方差的形式呈现。
[0093]
结合专家经验,将燃烧状态划分为燃烧线前移、正常和后移,典型图片如图5~图7所示。由图可知,完全符合燃烧线前移、正常和后移图像仅是少数,多数图像是部分前移或后移,显然此类图片标定具有一定主观性,为燃烧状态识别造成困难。
[0094]
针对燃烧状态数据,本文采取先随机取部分火焰图像构建dcgan结构、再针对不同燃烧状态图像对dcgan超参数单独微调的策略,以此保证dcgan尽可能生成不同燃烧状态质量优异的新数据。
[0095]
首先,随机选取部分火焰图像构建dcgan结构,并采用fid算法对最后500批次进行评估,如图8所示,fid
min
=36.10,fid
average
=48.51。这表明本文设计的dcgan模型性能的优异。针对不同燃烧状态图像对dcgan超参数单独微调,对燃烧线前移、正常和后移模型生成图像的评估结果如图9所示。该结果反应博弈过程中生成图像x
false
的质量情况,当fid低于
70时的图像清晰,已基本满足增强图像的需求。
[0096]
对于a划分,燃烧线前移、正常和后移训练集扩充图像数量分别为5060、3452和3312。对于b划分,燃烧线前移、正常和后移训练集扩充图像数量分别为6912,7632和9360。a划分的部分扩充结果如图10~图12所示。
[0097]
本文采用的非生成式数据增强方式为:随机旋转角度值为0~5
°
、随机水平位移比例为0~0.3、支持随机水平翻转图像和以映射方式填充新创建像素。某张燃烧线前移图像增强的效果如图13所示。a划分识别模型验证集和测试集识别准确率结果为72.69%和84.82%,损失结果为0.9768和0.5520;b划分识别模型验证集和测试集识别准确率结果为97.41%和94.07%,损失结果为0.0699和0.2019。
[0098]
将本文的方法与gan、dcgan进行比较,结果如表3所示,生成图像质量对比如图14所示。实验表明,本文设计的dcgan模型结构相比于gan,dcgan能够在更短的epoch中获得更优的结果。
[0099]
表3不同生成模型生成数据的评估结果
[0100][0101]
此外,本文的4组对比实验分别为:基于cnn的燃烧状态识别模型、基于非生成式数据增强的燃烧状态识别模型、基于dcgan数据增强的燃烧状态识别模型、基于dcgan与非生成式组合的数据增强燃烧状态识别模型。每组实验重复10次的平均值和方差如表4所示。
[0102]
表4识别模型的性能对比
[0103][0104]
由表4可知,在a划分中,基于混合数据增强的mswi过程燃烧状态识别模型测试集准确率为84.82%,损失为0.5520,相比于其他方法,混合式数据增强能够提高模型鲁棒性;在b划分中,基于混合数据增强的mswi识别模型测试集准确率为94.07%,相比于其他方法,模型的泛化性能更好。本文将非生成式和生成式数据增强结合后,cnn的鲁棒性和泛化性能得到明显的提升。
[0105]
基于dcgan数据增强的燃烧状态识别模型相比于未做数据增强,泛化性能与鲁棒性有一定提升。但仅采用生成式数据增强却不如仅采用非生成式数据增强,本文给出以下解释:1)本文设计的非生成式数据增强能够有效增加火焰图像新的特征,从而提高模型的鲁棒性能;2)基于dcgan的数据增强虽然创造出新的样本,但当dcgan通过博弈达到纳什均衡状态时,生成网络为欺骗判别网络,仅根据学习到的特征形成新的火焰图像而非创造新的特征,因此该图像对cnn的鲁棒性能的提升有限;3)a划分的测试集、验证集与训练集源于不同的时间段,其特征差异大,且部分图像的标定存在主观性;4)基于dcgan数据增强将原270张样本扩充到上万个样本,由于其特征的相似性,导致cnn在训练过程中难以控制迭代次数与批次。如何实现两者的均衡仍有待研究。
[0106]
本文提出一种基于混合数据增强的mswi过程燃烧状态识别模型,其创新性表现在:1)指出了基于对抗生成式数据增强的不足,并针对生成式、非生成式数据增强的缺陷,提出基于混合数据增强的mswi过程燃烧状态识别模型策略。2)构建基于dcgan的生成式数据增强模块,设计面向燃烧图像的生成网络结构;3)针对火焰燃烧图像,设计一种非生成式数据增强的方法;本文方法综合生成式数据增强与非生成式数据增强的优点,能够有效生成优质的样本,从而使得mswi状态识别模型具有较好的泛化性能与鲁棒性。
[0107]
需要指出的是工业现场并非缺少数据,而是标记困难。如何充分利用海量数据实现自动标记以及半监督或无监督学习、提高模型的泛化性和鲁棒性是下一步研究方向
[0108]
附表:本文符号及含义表
[0109]
[0110]
[0111]
[0112]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献