一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多种神经网络融合的空气质量预测方法

2022-11-09 21:31:06 来源:中国专利 TAG:


1.本发明涉及基于深度学习算法的环境数据预测方法技术领域,尤其涉及一种基于多种神经网络融合的空气质量预测方法。


背景技术:

2.气体污染物中,排放的二氧化硫会刺激人体的呼吸道,诱发各种呼吸道疾病,同时会对植被等造成危害,排放的氮氧化物会与其它污染物结合,产生光化学烟雾污染。国家目前用来评价环境空气质量的指标主要是基于六种污染物的浓度,分别是臭氧(o3)、二氧化氮(no2)、二氧化硫(so2)、一氧化碳(co)、细颗粒物(pm2.5)、可吸入颗粒物(pm10),此外中国气象站点可以观测到包括温度、气压、露点、风速风向等气象数据。
3.近年来,空气污染问题愈发严重,已经成为全球性问题。空气质量监测是应对空气污染的重要手段。国家建立了多个空气监测站点来实时监测空气污染状况,由政府部门统筹规划,其数据准确度较高,由该历史数据及当前时刻的数据预测下一时刻的污染物浓度数据,可以帮助人们减少去往空气质量较差的地区的几率,更好的规避污染物带来的危害。
4.目前,常用的预测网络包括rnn、bpnn等,它们在实际使用时存在无法学习长距离的依赖关系、容易陷入局部极小化问题、收敛速度慢等缺点。本专利将cnn、bilstm、gru三种网络结合,既可以提取具有代表的特征,降低特征的维度,又可以较好捕获各特征之间前后较长距离的依赖关系,提高了收敛速度,在提高污染物浓度预测精度的同时也提高了模型的计算效率。


技术实现要素:

5.本发明目的就是为了弥补已有技术的缺陷,提供一种基于多种神经网络融合的空气质量预测方法,以解决现有技术存在的无法学习长距离的依赖关系、容易陷入局部极小化问题、收敛速度慢,预测精度低等问题。
6.本发明是通过以下技术方案实现的:
7.一种基于多种神经网络融合的空气质量预测方法,包括以下步骤:
8.步骤1、获取国控站点测得的空气污染物以及气象特征的时序数据,以此构建数据集作为特征输入,并对所述数据集进行预处理,将数据集划分为训练集和测试集;
9.国控站点中测得的数据包括多种空气污染物浓度值、温度、露点、风速风向、气压值,本发明以国控站点测得的这些数据构建数据集。
10.步骤2、查看各特征之间的皮尔逊相关系数,将与所要预测的特征不相关的其他特征剔除,减少数据冗余;
11.步骤3、确定滑动时间窗口t,对每个特征分量进行数据序列段切分处理,构造批数据,并对其进行数据封装;
12.步骤4、通过现有的tensorflow框架构建cnn-bilstm-gru神经网络,将封装好的训练数据集输入到网络中,不断调整神经网络参数,创建文件保存最好的权重值,得到网络的
最优参数;
13.步骤5、将测试集输入到步骤4得到的网络中,得到所预测特征的预测值与真实值之间的相关系数以及均方根误差,衡量网络的预测性能;
14.步骤6、将训练好的网络用于空气质量预测,将预测值进行反归一化处理,得到准确的下一时刻空气质量预测值;
15.在步骤1中采用线性插值法对数据集中的数据进行数据填充,补全数据集中的缺失值,其计算公式为:
[0016][0017]
式中,xi为缺失部分的值,xj为xi前面已知的值,xk为xi后面已知的值,i、j、k为大于或等于1的自然数。
[0018]
步骤1中采用maxabs标准化方法对数据集中的数据进行归一化,其计算公式为:
[0019][0020]
式中,x为原来的值,x

为标准化后的值,x
max
为输入特征的最大值。
[0021]
步骤2中皮尔逊相关系数的计算公式为:
[0022][0023]
式中,cov(x,y)为特征x和y之间的协方差,σ
x
、σy分别为特征x和y的标准差。
[0024]
步骤3中滑动时间窗口t大小设置为12,批数据大小设置为120;
[0025]
步骤4中cnn卷积神经网络采用的是一维卷积以及一维池化层,一维卷积是在长度或者宽度方向上进行滑动窗口并相乘求和,卷积层滤波器大小设置为96,激活函数设置为prelu,卷积操作过程为:
[0026][0027]
式中,y
l
为经过l层卷积操作后的输出,g()为激活函数,为是第l层第m部分卷积区域的输入,为第l层第m部分的权重,*为卷积运算,为第l层的偏置项。
[0028]
卷积神经网络池化层中没有需要训练的参数,指定池化类型、池化操作的核尺寸及移动步长即可,池化操作过程为:
[0029][0030]
其中:为第l层第m个数组的池化结果,为第l层第m个数组区域中第p个数值,h()为池化函数。
[0031]
步骤4中bilstm双向长短期记忆神经网络为单层,神经元数量为64个。
[0032]
步骤4中gru门循环单元神经网络为双层,第一层神经元数量为64个,第二层神经元数量为32个,为防止过拟合现象,在两层gru网络之间引入dropout,参数设置为0.2,学习率设置为3e-4。
[0033]
步骤4中构建网络的全连接层中,该层神经元分别与前一层的神经元逐个相连。
[0034]
由此得到的数据经过反归一化得到最终的预测值。
[0035]
本发明中,cnn卷积神经网络提取并筛选出输入时序数据的主要特征,降低数据维度,再经过bilstm双向长短期记忆神经网络以及gru门控循环单元网络层的学习,再经过反归一化,最终得到下一时刻的污染物浓度值。该方法保留了三种算法的优势,提高算法效率的基础上进一步提升了污染物浓度预测的精度。
[0036]
本发明的优点为:
[0037]
本发明方法融合了cnn、bilstm、gru三种神经网络,保留了各算法的优势,cnn可以提取具有代表性的特征,降低数据维度,bilstm神经网络可以较好捕获各特征之间前后较长距离的依赖关系,并且其表达能力比gru更强,对于时间序列的可控制粒度更细;gru作为lstm长短期记忆神经网络的变体,其网络参数更少,因此更容易收敛,并且可以防止梯度弥散。
附图说明
[0038]
图1为本发明方法流程框图。
[0039]
图2为本发明方法网络结构图。
[0040]
图3为预测值与真实值的r2相关性图。
[0041]
图4为预测值与真实值的对比图。
具体实施方式
[0042]
下面结合附图和实施例对本发明进一步说明。
[0043]
本发明一种基于多种神经网络算法融合的污染物浓度预测方法,包括以下步骤:
[0044]
步骤1:获取北京市奥体中心国控站点测得的空气污染物以及气象特征的时序公开数据,以此构建数据集,并对所述数据集进行预处理。
[0045]
在网站上下载的信息中,数据集为35064条数据,时间跨度为2013年3月至2017年2月,采集数据的时间间隔为1小时,以颗粒物污染物pm2.5浓度预测为例,在步骤1中,对数据集进行预处理,数据的缺失值通过线性插值法补全,采用maxabs标准化方法对数据集中的数据进行归一化,并将数据集划分为训练集和测试集。
[0046]
步骤2:查看各特征之间的皮尔逊相关系数,将与所要预测的特征不相关的其他特征剔除,减少数据冗余;
[0047]
步骤3:确定滑动时间窗口t,对每个特征分量进行数据序列段切分处理,构造批数据,并对其进行数据封装;
[0048]
本发明在步骤3中经过多次实验,验证滑动时间窗口t大小设置为12,批数据大小设置为120时,预测效果最佳;
[0049]
步骤4:构建cnn-bilstm-gru神经网络架构,其流程图如图1所示,结构图如图2所示,将封装好的训练数据集输入到网络中,不断调整神经网络参数,创建文件保存最好的权重值,得到网络的最优参数;
[0050]
本发明在步骤4中,构建cnn-bilstm-gru神经网络,初始化网络参数,经过多次实验调整,最终确定该神经网络最优参数。
[0051]
本发明在cnn网络层中,卷积层滤波器大小设置为96,卷积核的大小设置为1
×
1,池化层的尺寸设置为1,移动步长设置为1,激活函数为prelu。在bilstm网络层中,隐藏层神
bilstm11.7220.020.94bilstm-gru12.3621.110.94cnn-bilstm11.0718.290.95cnn-bilstm-gru9.8017.200.96
[0070]
本发明网络的预测性能如下图3、4所示,图4中,其中,measured value、true value代表真实值,predicted value、pred value代表预测值,density代表密度。
[0071]
由表1以看出,本发明所提出的污染物浓度预测算法精度优于其他方法,该方法融合了cnn、bilstm、gru三种神经网络算法,保留了各算法的优势,cnn可以提取具有代表性的特征,降低数据维度,bilstm神经网络可以较好捕获各特征之间前后较长距离的依赖关系,并且其表达能力比gru更强,对于时间序列的可控制粒度更细;gru作为lstm长短期记忆神经网络的变体,其网络参数更少,因此更容易收敛,并且可以防止梯度弥散。
[0072]
上面结合附图对本发明进行了示例性描述,显然本发明具体实现不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种改进,或未经过该进直接应用于其他场合,均在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献