一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于时序数列分析耦合神经网络预测的不良数据辨识方法

2022-07-16 19:46:12 来源:中国专利 TAG:


1.本发明属于氮氧化物治理领域,具体涉及一种基于时序数列分析耦合神经网络预测的不良数据辨识方法。


背景技术:

2.随着物联网、机器学习、大数据分析等技术的发展,基于scr脱硝系统大数据分析的脱硝系统智能调控、催化剂管理等研究日益增多。然而,由于scr脱硝系统大数据采集过程中存在的测量误差、设备故障、传输故障等问题,原始样本中往往包含一些不良数据。这些不良数据不仅干扰脱硝系统控制,同时对于基于大数据分析的智能调控、催化剂管理造成了许多不利影响,限制这些技术的推广应用。因此,如何对不良数据进行辨识对于scr脱硝系统的稳定高效运行具有重要意义。
3.传统的不良数据辨识方法主要有物理判别法和数理统计法,物理判别法是基于人们对数据已知的客观认识,判断外界干扰、人为误差等对实测数据偏离正常值的方法,但由于scr脱硝系统产生的数据量大,人工判断工作量大且需要操作者具有丰富经验使得该方法实施难度较大。数理统计法是通过数理统计理论对不良数据进行鉴别,但由于scr脱硝系统大数据研究发展较晚,相关数理模型尚未建立,缺乏理论指导。利用bp神经网络进行不良数据检测是近年来发展的基于机器学习的信息处理方法,具有模型适应性广、预测精度高、模型准确性好等优点,但是目前该方法存在理论尚未完善,计算量大等缺点。实际上,scr脱硝的数据采集系统通常是在固定采样频率下对脱硝相关变量如烟气量、入口no
x
浓度等参数进行监测及保存,是典型的时序数列,因此可以通过时序数列分析方法对原始数据进行初步简化分析,降低数据复杂度。由此,本发明提出了基于时序数列分析耦合神经网络预测的scr脱硝系统不良数据的检测与辨识方法。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,提供一种基于时序数列分析耦合神经网络预测的不良数据辨识方法。
5.该方法首先对scr脱硝系统收集的时序数列进行预处理,利用自回归移动平均模型对时序数列进行建模,基于残差分析初步确定异常数据集,利用剔除了异常数据的其余数据进行bp神经网络建模和学习,然后利用训练好的神经网络对初步确定的异常数据集进行测试检验,根据测试样本的预测值和初始值的相对误差大小鉴别不良样本;针对鉴别出的不良样本,进一步优化神经网络对不良样本进行检验和校正,并最终确定不良数据。
6.为了实现上述目的,达到上述技术效果,本发明通过以下技术方案实现:一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,包括以下步骤:
7.步骤1、获取烟气脱硝系统采集的原始数据,补充原始数据中存在的样本缺失数据,然后对数据进行无量纲化处理,得到样本数据;
8.步骤2、对样本数据进行平稳性分析,若样本数据平稳则进行下一步分析;若样本数据不平稳,则对样本数据进行差分处理,然后对差分序列进行平稳性分析,重复此过程直至检测到序列平稳;
9.步骤3、构建差分自回归移动平均模型arima;
10.步骤4、计算差分自回归移动平均模型的残差,将残差大于预设值的样本添加至异常数据集,其余样本归类至正常样本集;
11.步骤5、构建bp神经网络;
12.步骤6、将异常数据集和随机10%正常样本作为测试样本,剩余90%正常样本作为训练样本,利用学习完成的神经网络模型对测试样本进行预测,根据预设条件将测试样本重新划归至不良样本集或训练样本集,进行循环测试直至达到预设次数;
13.步骤7、对不良样本集进行检验和校正,确定最终不良数据。
14.优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的原始数据为按时间等时距采集的数据,每个数据至少包含2个以上参数;且至少包含参数出口no
x
浓度、脱硝效率或催化剂活性中的至少一个作为其标签参数。
15.优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤1中的无量纲化方法采用下述公式1~3中任意之一计算:
[0016][0017][0018][0019]
式中,z
ni
为参数z的归一化值,zi为参数z的原始值,z
max
为参数z的最大值,z
min
为参数z的最小值,σ为参数z的标准差,μ为参数z的平均值。
[0020]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的平稳性分析采用adf检验或者kpss检验两种方法中的至少一种。
[0021]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤2中的差分处理是指采用如下公式计算获得差分序列:
[0022][0023]
式中,为所求差分序列,zk为k时刻的参数z,z
k-1
为k-1时刻的参数z。
[0024]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤3的所述arima模型步骤如下:
[0025]
1)计算并绘制差分序列的自相关函数图(acf)和偏自相关函数图(pacf),根据acf图和pacf图的拖尾或截尾性质,初步确定模型的自回归阶数p和移动平均阶数q;
[0026]
2)利用赤池信息准则(aic准则)或者贝叶斯信息准则(bic准则)之一确定模型的阶数p和q;
[0027]
3)基于上述确定的模型阶数,采用最大似然函数法或者最小二乘法对模型参数进
行估算,初步确定模型:
[0028][0029]
式中,y
t
为待求差分序列,ε
t
为白噪声残差,aj和θi为模型待估系数;
[0030]
4)计算模型残差,检验残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
[0031]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤4中的所述预设值为所述残差序列的标准差的2倍。
[0032]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤6的预设条件是指相对误差小于10%划归至训练样本,否则划归至不良样本,所述预设次数至少为3次。
[0033]
优选的,前述一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,其特征在于,所述步骤7中的所述检验和校正步骤如下:
[0034]
1)删除不良样本,利用优化样本构建并训练bp神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
[0035]
2)筛选出相对误差不小于10%的样本确认为不良数据;筛选出相对误差不大于5%的样本修正为非不良数据;
[0036]
3)对所述步骤2)中所述筛选后的剩余样本重复执行所述步骤1)和所述步骤2)直至满足以下任一条件:
[0037]
条件ⅰ、执行所述步骤2)之后无剩余样本;
[0038]
条件ⅱ、重复执行次数不少于3次;
[0039]
4)将剩余样本全部确认为不良数据。
[0040]
本发明的有益效果为:
[0041]
1、scr脱硝大数据是一种典型时序数列,具有多数时序数列存在的数据量大、短期波动频繁、噪声干扰严重等特点,使得时序数列的分析处理较为复杂和困难。差分自回归移动平均模型是一种传统有效的时序数列处理方法,具有理论成熟,计算量小,处理速度快等优点。通过时序数列分析预处理,可以有效筛选数据错误值和异常值,初步掌握不良数据分布情况,降低原始数据复杂度。
[0042]
2、神经网络模型具有强大的非线性拟合和泛化能力,在模式识别、回归预测、数据鉴别等方面表现出极好的效果,但神经网络理论不成熟、计算量大且预测准确性一定程度受训练样本质量的影响。通过时序数列分析预选筛选出不良样本集可以降低神经网络建模过程中不良样本影响,利用神经网络预测对异常数据进行预测检验,可防止单纯时序数列分析的误判,提高判断的准确性。
[0043]
3、通过神经网络对初步获得的不良样本集以及随机筛选的10%正常样本进行循环测试,避免仅依赖时序数列分析可能导致不良样本漏判;最后利用神经网络对两种方法耦合辨识出的不良样本进行检验和校正,避免不良样本的误判,提高辨识精度。
附图说明
[0044]
图1为本发明方法的操作流程图。
具体实施方式
[0045]
下面结合附图和具体实施例对本发明做进一步说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0046]
本实施例以某燃煤电厂scr脱硝系统一年的正常运行数据为例,通过人为添加不良数据,使用本发明的方法对这些样本中的不良数据进行检测。
[0047]
实施例1
[0048]
一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,如图1所示,其具体实施步骤如下:
[0049]
步骤1、从scr脱硝系统收集的准确运行原始数据u0共计1000组,每组样本包括入口压力、入口烟气量、入口no
x
浓度、喷氨量、烟气温度、出口压力、出口no
x
浓度、脱硝效率、氨逃逸浓度、scr脱硝催化剂活性共计10个参数,从原始数据u0随机选取50组作为样本数据,人为添加其值10%的误差作为不良样本,对处理后样本按以下公式(1)进行无量纲化处理,记为样本集u1:
[0050][0051]
式中,z
ni
为参数z的归一化值,zi为参数z的原始值,z
max
为参数z的最大值,z
min
为参数z的最小值。
[0052]
步骤2、采用adf检验对前述样本进行平稳性分析,如检测到样本平稳则继续进行下一步分析,若样本不平稳,则对样本进行一阶差分,对差分序列du进行平稳性分析,并重复该过程,直至检测到的差分序列du平稳,将获得的差分序列du作为后续分析的样本。
[0053]
步骤3、采用如下步骤建立差分序列的自回归移动平均模型:
[0054]
1)计算并绘制差分序列的自相关函数图(acf)和偏自相关函数图(pacf),根据acf图和pacf图的拖尾或截尾位置,初步确定模型的自回归阶数p和移动平均阶数q;
[0055]
2)采用贝叶斯信息准则(bic准则)确定模型的阶数p和q;
[0056]
3)基于上述确定的模型阶数,采用最大似然函数法估算模型参数,初步确定模型。
[0057][0058]
式中:y
t
为待求差分序列,ε
t
为白噪声残差,aj和θi为模型待估系数。
[0059]
4)计算模型残差,采用lbq检验(ljung-box test)残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
[0060]
步骤4、计算上述模型残差r,将残差值大于残差序列标准差2倍的样本归类至不良样本集bu,其余样本归类至正常样本集gu。
[0061]
步骤5、取每组样本的前9个参数为神经网络输入值,最后1个参数为神经网络输出值,构建单隐含层的bp神经网络,隐含层和输出层采用双曲正切函数。
[0062]
步骤6、将异常数据集和随机10%的正常样本集数据作为测试样本tu,其余样本作为训练样本,利用学习完成的神经网络模型对测试样本进行预测,将预测误差超过10%的样本再次划归至不良样本集bu,其余情况重新划归至训练样本集tu,重复执行该步骤3次。
[0063]
步骤7、剔除原始样本中所有标记的不良样本,利用其余样本重新构建和训练bp神经网络,利用训练好的神经网络对不良样本进行检验和校正,具体步骤如下:
[0064]
1)删除不良样本,利用优化样本构建并训练bp神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
[0065]
2)筛选相对误差大于20%的样本,确定为不良数据;筛选相对误差小于5%的样本,修正为非不良数据;
[0066]
3)对步骤2)中筛选后的剩余样本重复执行步骤1)和步骤2)直至满足以下任一条件:条件1、执行步骤2)之后无剩余样本;条件2、重复执行次数不少于3次;
[0067]
4)将剩余样本全部确认为不良数据bd。
[0068]
经以上步骤操作,该方法鉴别出47组不良数据,所鉴别出的样本全部为设定的不良样本,通过本方法得到的不良数据的辨识率为94%,准确率为100%。
[0069]
实施例2
[0070]
一种基于时序数列分析耦合神经网络预测的不良数据辨识方法,如图1所示,其具体实施步骤如下:
[0071]
步骤1、从scr脱硝系统收集的准确运行原始数据u0共计1000组,每组样本包括入口压力、入口烟气量、入口no
x
浓度、喷氨量、烟气温度、出口压力、出口no
x
浓度、脱硝效率、氨逃逸浓度、scr脱硝催化剂活性共计10个参数,从原始数据u0随机选取50组作为样本,人为添加其值10%的误差作为不良样本,对处理后样本按以下公式(1)进行无量纲化处理,记为样本集u1:
[0072][0073]
式中,z
ni
为参数z的归一化值,zi为参数z的原始值,z
max
为参数z的最大值,z
min
为参数z的最小值。
[0074]
步骤2、采用kpss检验对前述样本进行平稳性分析,如检测到样本平稳则继续进行下一步分析,若样本不平稳,则对样本进行一阶差分,对差分序列du进行平稳性分析,并重复该过程,直至检测到的差分序列du平稳,将获得的平稳差分序列du作为后续分析的样本。
[0075]
步骤3、采用如下步骤建立差分序列的自回归移动平均模型:
[0076]
1)计算并绘制差分序列的自相关函数图(acf)和偏自相关函数图(pacf),根据acf图和pacf图的拖尾或截尾位置,初步确定模型的自回归阶数p和移动平均阶数q;
[0077]
2)采用赤池信息准则(aic准则)确定模型的阶数p和q;
[0078]
3)基于上述确定的模型阶数,采用最小二乘法估算模型参数,初步确定模型。
[0079][0080]
式中:y
t
为待求差分序列,ε
t
为白噪声残差,aj和θi为模型待估系数。
[0081]
4)计算模型残差,采用lbq检验(ljung-box test)残差是否为白噪声,若是则模型建立成功,若否则重复执行步骤2)~4)直至检验残差为白噪声。
[0082]
步骤4、计算上述模型残差r,将残差值大于残差序列标准差2倍的样本归类至不良样本集bu,其余样本归类至正常样本集gu。
[0083]
步骤5、取每组样本的前9个参数为神经网络输入值,最后1个参数为神经网络输出值,构建单隐含层的bp神经网络,隐含层和输出层采用sigmoid函数。
[0084]
步骤6、将异常数据集和随机10%的正常样本集数据作为测试样本tu,其余样本作
为训练样本,利用学习完成的神经网络模型对测试样本进行预测,将预测误差超过10%的样本再次划归至不良样本集bu,其余情况重新划归至训练样本集tu,重复执行该步骤3次。
[0085]
步骤7、剔除原始样本中所有标记的不良样本,利用其余样本重新构建和训练bp神经网络,利用训练好的神经网络对不良样本进行检验和校正,具体步骤如下:
[0086]
1)删除不良样本,利用优化样本构建并训练bp神经网络,利用训练好的神经网络对不良样本进行测试,计算相对误差;
[0087]
2)筛选相对误差大于20%的样本,确定为不良数据;筛选相对误差小于5%的样本,修正为非不良数据;
[0088]
3)对步骤2)中筛选后的剩余样本重复执行步骤1)和步骤2)直至满足以下任一条件:条件1、执行步骤2)之后无剩余样本;条件2、重复执行次数不少于3次;
[0089]
4)将剩余样本全部确认为不良数据bd。
[0090]
经以上步骤操作,该方法鉴别出45组不良数据,所鉴别出的样本全部为设定的不良样本,通过本方法得到的不良数据的辨识率为90%,准确率为100%。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献