一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度学习预报空气质量的数据前处理方法及系统

2022-10-26 01:49:27 来源:中国专利 TAG:


1.本发明涉及空气质量预报领域,具体而言,涉及一种基于深度学习预报空气质量的数据前处理方法及系统。


背景技术:

2.基于深度学习算法的空气质量预报,指的是利用地面站点的空气污染物监测数据及对应的气象数据,训练得到深度学习模型,对未来某一时刻或时段的空气质量进行预报。相比于基于大气化学传输过程的数值模型,该方法计算成本相对较低,且在1-2天的短期预报上准确性更高。但基于深度学习的空气质量预报存在以下问题:(1)由于对空气污染物浓度及空气质量指数的预报中存在高值低估现象,导致其对污染事件存在漏报的问题;(2)在预报未来更长时期的空气质量时,易出现延迟预报现象,表现为预报的时间序列相比于实际的时间序列存在滞后问题;(3)现有的基于深度学习的空气质量预报方法较多地采用气象站点的监测数据,较少考虑区域气象条件对空气质量预报的影响。上述问题导致了深度学习方法难以对未来较长时期的空气质量进行准确预报。
3.针对深度学习模型的高值低估和预报滞后等问题,主要的解决方法是对数据进行前处理,主要包括经验模式分解、小波分解、变分模式分解和二次分解等。针对难以有效利用区域气象条件的问题,主要的解决方法是利用图神经网络(gnn)或卷积神经网络(cnn)等模型融合各站点或目标区域的气象信息。
4.现有的数据前处理方法计算成本较高,不同区域所采用的数据前处理方法差异较大,缺乏可移植性;且在基于信号分解的数据前处理过程中对数据质量要求较高,易受噪音和数据异常值干扰,鲁棒性较差。


技术实现要素:

5.本发明的目的在于提供一种基于深度学习预报空气质量的数据前处理方法及系统,用于改善现有技术中易受噪音和数据异常值干扰的问题,提高预报模型的鲁棒性。
6.第一方面,本技术实施例提供一种基于深度学习预报空气质量的数据前处理方法,包括以下步骤:
7.获取目标预报区域信息和目标预报时刻;
8.获取近实时的目标预报区域的空气污染物监测数据;
9.获取近实时的气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;
10.在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;
11.对历史的气象预报数据采取同样操作,并训练得到卷积自编码器模型;
12.利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到区域气象因子;
13.利用区域气象因子与污染物监测的历史数据,训练得到空气质量预报模型;
14.将近实时的气象数据输入至训练完成的卷积自编码器,并对空气污染物监测数据采用预置的取值范围进行归一化处理,得到近实时的区域气象因子和预处理的空气污染物监测数据。
15.将近实时的区域气象因子与预处理的空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。
16.上述实现过程中,通过获取目标预报区域信息和目标预报时刻;然后获取实时目标预报区域的污染物监测数据;再获取近实时的气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到实时区域气象因子;最后,将近实时的区域气象因子与空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。通过采用天气预报模式及深度学习方法从气象模拟数据中提取出近实时的区域气象因子,将其与污染物监测数据作为空气质量预报模型的输入,得到空气质量预报结果,能明显降低噪音和数据异常值对预测过程的干扰,提高模型的鲁棒性,从而有效提高对于未来较长时期(三天及以上)空气质量预报的数值精度和预报准确性。
17.基于第一方面,在本发明的一些实施例中,还包括以下步骤:
18.对气象预报数据集中的各个变量进行归一化处理,得到新的气象预报数据集。
19.基于第一方面,在本发明的一些实施例中,在气象预报数据集中分别提取当前时刻的气象预报数据与目标预报时刻的气象预报数据,包括以下步骤:
20.获取覆盖目标预报区域矩形范围的网格信息;
21.根据网格信息和目标预报时刻在气象预报数据集中选择对应的气象预报网格数据作为目标预报时刻的气象预报数据;
22.根据网格信息和当前时刻在气象预报数据集中选择对应的气象预报网格数据作为当前时刻的气象预报数据。
23.基于第一方面,在本发明的一些实施例中,还包括以下步骤:
24.获取样本气象数据集;
25.将样本气象数据集划分为训练集、验证集和测试集;
26.根据训练集和验证集,训练得到卷积自编码器模型;
27.利用测试集对卷积自编码器模型的性能进行评价;
28.根据评价结果,得到最终的卷积自编码器模型。
29.基于第一方面,在本发明的一些实施例中,利用测试集对卷积自编码器模型进行评价,得到评价结果的步骤包括以下步骤:
30.将测试集输入至卷积自编码器模型中,得到输出数据;
31.根据测试集与输出数据,计算其决定系数等统计指标,作为评价结果。
32.基于第一方面,在本发明的一些实施例中,根据评价结果得到最终的卷积自编码器模型,包括以下步骤:
33.根据评价结果,判断是否达到预设值,若是,则将当前的卷积自编码器模型作为最终模型;若否,则对卷积自编码器的结构及超参数进行优化并重新训练,直至达到预设值。
34.基于第一方面,在本发明的一些实施例中,将近实时的区域气象因子与空气污染
物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果,包括以下步骤:
35.采用预置的取值范围对空气质量历史监测数据进行归一化处理;
36.将历史的气象预报数据输入至训练完成的卷积自编码器,得到历史的区域气象因子;
37.将历史的区域气象因子和预处理的空气污染物监测数据,按照其时间顺序依次划分为训练集、验证集和测试集;
38.利用训练集和验证集,训练得到空气质量预报模型;
39.利用测试集对空气质量预报模型的预测性能进行评价;
40.根据评价结果得到训练完成的空气质量预报模型。
41.将近实时的气象数据输入至训练完成的卷积自编码器,并对空气污染物监测数据采用预置的取值范围进行归一化处理,得到近实时的区域气象因子和预处理的空气污染物监测数据。
42.将近实时的区域气象因子和预处理的空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。
43.第二方面,本技术实施例提供一种基于深度学习预报空气质量的数据前处理系统,包括:
44.目标信息获取模块,用于获取目标预报区域信息和目标预报时刻;
45.监测数据获取模块,用于获取目标预报区域近实时的空气污染物监测数据;
46.天气预报模式模块,用于获取近实时的气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;
47.数据处理模块,在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;
48.卷积自编码器模型训练模块,对历史的气象预报数据采取同样操作,并利用该数据集训练得到卷积自编码器模型;
49.降维与融合模块,利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到区域气象因子;
50.空气质量预报模型训练模块,利用历史的区域气象因子与空气污染物监测数据,训练得到空气质量预报模型。
51.预报模块,用于获取近实时的区域气象因子与预处理的空气污染物监测数据,并将其输入至训练完成的空气质量预报模型中,得到空气质量预报结果。
52.上述实现过程中,通过目标信息获取模块,获取目标预报区域信息和目标预报时刻;监测数据获取模块,获取目标预报区域近实时的空气污染物监测数据;天气预报模式模块,获取近实时的气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;数据处理模块,在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;降维与融合模块,利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到区域气象因子;空气质量预报模型训练模块,利用历史的区域气象因子与污染物监测数据,训练得到空气质量预报模型。预报模块,获取近实时的区域气象因子与预处理的空气污染物监测数据,并将其输入至训练完成的空气质量预报模型中,得到空气质量预
报结果。采用气象预报模式及深度学习方法从气象模拟数据中提取出近实时的区域气象因子,将其与空气污染物监测数据作为空气质量预报模型的输入,得到空气质量预报结果,能明显降低噪音和数据异常值对预测过程和结果的干扰,提高模型的鲁棒性,从而有效提高对于未来较长时期(三天及以上)空气质量预报的预报准确性。
53.本发明实施例至少具有如下优点或有益效果:
54.本发明实施例提供一种基于深度学习预报空气质量的数据前处理方法及系统,通过获取目标预报区域信息和目标预报时刻;获取目标预报区域的空气污染物近实时监测数据;获取近实时气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到实时区域气象因子;最后,将近实时的区域气象因子与空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。通过采用天气预报模式及深度学习方法从气象模拟数据中提取出近实时的区域气象因子,将其与空气污染物监测数据作为空气质量预报模型的输入,得到空气质量预报结果,能明显降低噪音和数据异常值对预测过程的干扰,提高模型的鲁棒性,从而有效提高对于未来较长时期(三天及以上)空气质量预报的预报准确性。
附图说明
55.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
56.图1为本发明实施例提供的一种基于深度学习预报空气质量的数据前处理方法流程图;
57.图2为本发明实施例提供的卷积自编码器的结构示意图;
58.图3为本发明实施例提供的空气质量预报模型的结构示意图;
59.图4为本发明实施例提供的双向长短时记忆(bi-lstm)神经网络结构示意图。
具体实施方式
60.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
61.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
62.实施例
63.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
64.请查看图1,图1为本发明实施例提供的一种基于深度学习预报空气质量的数据前处理方法流程图。该基于深度学习预报空气质量的数据前处理方法,包括以下步骤:
65.步骤s110:获取目标预报区域信息和目标预报时刻;上述目标预报区域信息是指是目标预报区域的经纬度范围,并获取覆盖目标预报区域矩形范围的网格信息,目标预报时刻是指是未来某时刻的空气质量预报。目标预报时刻的选取主要是根据实际需求而定,预测的时间分辨率为小时。如:2022年7月1日7时。
66.步骤s120:获取实时目标预报区域的空气污染物监测数据;上述空气污染物监测数据可以从区域内国控或省控空气质量监测站点获得。
67.步骤s130:获取近实时气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;上述生成的气象预报数据集可以是指目标预报区域未来14天内的气象预报数据。上述气象预报数据集可以是从global forecast system(gfs)等气象预预报场数据集获得。上述进行天气预报是指利用gfs气象模拟数据,通过如weather research and forecast model(wrf)模型等天气预报模式构建本地气象场,进行天气预报得到未来14天内的气象预报数据,主要包括地表温度、10m东西方向风速、10m南北方向风速、相对湿度、地表气压、行星边界层高度等,时间分辨率为小时,空间分辨率为5km。上述天气预报模式进行优化或本地化属于现有技术,在此不再赘述。上述气象预报数据集包含多个气象变量信息、以及各个气象变量对应的参数,由于各个气象变量在数值尺度上存在较大差异,需对其进行归一化处理:其中,x为原始值,x
min
为数据集中的最小值,x
max
为数据集中的最大值,x
*
为归一化后的值。
68.步骤s140:在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;上述气象预报数据集中包括多个时间以及对应的气象预报数据,上述提取可以是根据时间分别提取。例如:当前时刻为1月1日,则提取1月1日的气象预报数据,目标预报时刻为1月3日,则提取1月3的气象预报数据。还可以是根据区域网格信息与时刻进行提取,具体包括以下步骤:
69.首先,获取覆盖目标预报区域矩形范围的网格信息;上述获取可通过目标预报区域经纬度范围换算得到。
70.然后,根据网格信息和目标预报时刻在气象预报数据集中选择对应的气象预报网格数据作为目标预报时刻的气象预报数据;上述选择对应的气象预报网格数据是指根据网格信息以及目标预报时刻,选择相应范围的气象预报网格数据,上述相应范围是指与网格信息相同的气象预报网格数据。上述数据维度为(w,h,f),其中w和h对应气象预报网格数据在横纵坐标上的网格数量,f代表了气象预报数据中的变量数,例如:变量数为6,分别为东西方向风速、南北方向风速、相对湿度、地表气温、地表气压、行星边界层高度。
71.之后,根据网格信息和当前时刻在气象预报数据集中选择对应的气象预报网格数据作为当前时刻的气象预报数据。上述选择对应的气象预报网格数据是指根据网格信息以及当前时刻,选择相应范围的气象预报网格数据,上述相应范围是指与网格信息相同的气象预报网格数据。上述数据维度为(w,h,f),其中w和h对应气象预报网格数据在横纵坐标上的网格数量,f代表了气象预报数据中的变量数。
72.最后,将当前时刻的气象预报数据与目标预报时刻的气象预报数据进行拼接;上
述进行拼接是将当前时刻t0的气象预报数据与目标预报时刻t
t
的气象预报数据进行拼接,获得维度为(w,h,2f)的数据作为拼接数据。
73.步骤s150:对历史的气象预报数据采取同样拼接操作,并利用该数据集训练得到卷积自编码器模型。
74.步骤s160:利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到近实时的区域气象因子;自编码器(autoencoder,ae)是一类能够用来对数据进行降维、降噪的人工神经网络结构,由编码器、隐藏层和解码器组成。其作用便是利用编码器对输入数据进行压缩、降维,通过隐藏层对已压缩的数据进行非线性转换,再由解码器对转换后的数据进行解码使其能够恢复为原始的数据,其中隐藏层的输出便是包含原始输入数据信息并且较之维度更低的数据。卷积神经网络(convolutional neural network,cnn)是一种包含卷积计算且具有深度结构的前馈神经网络,可通过其内部多个可训练的滤波器来对样本进行卷积,提取出样本各变量中更具代表性的特征值,在音频分析、图像处理上等领域具有广泛应用。图2为本发明实施例提供的卷积自编码器的结构示意图。此处卷积自编码器则是将卷积神经网络与自编码器相结合,通过将三维的气象模拟数据降至二维。上述训练完成的卷积自编码器模型是将维度为(w,h,2f)的拼接数据作为输入数据,利用卷积自编码器,将数据压缩至(1,1,m)的维度,再将其解压还原至原本的输入数据。通过获取模型隐藏层的数据输出,即维度为(1,1,m)的区域气象因子。
75.上述训练得到卷积自编码器模型的过程包括以下步骤:
76.首先,获取样本气象数据集;上述样本气象数据集包括多个历史气象数据。样本气象数据集包括了过去2年以上的历史气象模拟数据及气象预报数据,用于对模型进行训练。
77.然后,将气象数据集划分为训练集、验证集和测试集;上述划分可以是随机划分,也可以是按照时间顺序等规则进行划分。划分得到的训练集用于训练卷积自编码器,验证集用于对每一次训练得到的模型进行验证,测试集用于对训练得到的卷积自编码器模型性能进行评估。
78.然后,根据训练集和验证集,训练得到卷积自编码器模型;在卷积自编码器训练过程中,可以采用十折交叉验证法来完成模型的训练,上述十折交叉验证法属于现有技术,在此就不再赘述。
79.然后,利用测试集对卷积自编码器模型进行评价;上述进行评价的标准主要是输入数据和输出数据之间的决定系数r2,上述得到评价结果的过程包括以下步骤:
80.第一步,将测试集输入至卷积自编码器模型中,得到输出数据;上述得到的输出数据包括多个变量对应的数据。
81.第二步,计算并将测试集与输出数据的决定系数作为评价结果。上述计算的过程是首先计算各个变量的决定系数,然后根据各个变量的评价结果得到评价结果。上述计算决定系数(r2)可以是通过以下公式计算得到:其中,r2为决定系数,n为样本总数,t为真实值均值,pi为预测值,ti为真实值。为了在原始数据的压缩和解压过程中,尽可能保留其内部信息,故测试集的r2须大于预置的阈值,上述阈值可以是根据经验进行设置,例如0.9。
82.最后,根据评价结果得到最终的卷积自编码器模型。具体地,判断各个变量的r2是否均大于预置的阈值,若是,则将当前的卷积自编码器模型作为最终的卷积自编码器模型;若否,则对卷积自编码器的结构及超参数进行优化并重新训练,直至达到预置的阈值。
83.步骤s170:利用历史的区域气象因子与空气污染物监测数据,训练得到空气质量预报模型。图3为本发明实施例提供的空气质量预报模型的结构示意图,图4为本发明实施例提供的双向长短时记忆(bi-lstm)神经网络结构示意图。上述的空气质量预报模型是利用含有注意力机制的bi-lstm建立的空气质量预报模型。
84.步骤s180:获取近实时的区域气象因子与预处理的空气质量监测数据,并将其输入至训练完成的空气质量预报模型中,得到空气质量预报结果。图3为本发明实施例提供的空气质量预报模型的结构示意图。上述的空气质量预报模型是基于含有注意力机制的bi-lstm建立的空气质量预报模型。上述空气质量预报模型是通过历史的区域气象因子和空气污染物监测数据作为样本数据进行训练得到。通过将降维后的区域气象因子和空气污染物监测数据进行结合,利用bi-lstm来对空气质量进行预报。bi-lstm属于现有技术,在此不再赘述。上述空气污染物监测数据包括空气质量指数(aqi)及各污染物浓度,为方便后续对数据进行区分,可以对污染物监测数据进行归一化处理,主要包括以下步骤:
85.第一步,将空气污染物监测数据采用预置的取值范围进行归一化处理;上述归一化处理可以是针对aqi及各污染物浓度,采用设定的取值范围对其进行归一化:(实际值-轻度污染临界值)/(重度污染临界值-最小值)。通过对aqi值及污染物浓度进行缩放后,将污染天与非污染天从数值的正负性上区分开来,非污染天的值为负值,污染天的值为非负,从而使深度学习模型能够更有效地对污染天进行区分,加快模型的训练速度。
86.第二步,将近实时的区域气象因子和预处理的空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。可以对空气质量预报模型的超参数进行优化,例如,模型输入数据的时间步为168,即利用过去的168个小时的数据,对未来某时刻的空气质量进行预报。
87.对于已训练完成的卷积自编码器模型和空气质量预报模型,在后续的预报过程当中可直接使用,无需重复训练。
88.上述进行空气质量预报的整个流程如下:1、获取历史的气象预报数据并训练卷积自编码器,得到历史区域气象因子的数据集;2、将历史的区域气象因子的数据集与空气污染物监测数据集结合,构建空气质量预报的训练样本;3、在训练空气质量预报模型时可优化超参数(如时间步等),以获得更准确的空气质量预报结果;4、采用训练好的卷积自编码器模型和空气质量预报模型进行空气质量预报。上述过程中涉及到的两个模型均需要训练,在训练完成以后便不再对其超参数进行调整,且该模型的目标预报时刻也是固定的,如果需要对未来其他时刻进行预报,则需要另外构建相应时刻的卷积自编码器和空气质量预报模型。
89.上述实现过程中,通过获取目标预报区域信息和目标预报时刻;获取实时目标预报区域的空气污染物监测数据;获取近实时的气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到近实时的区域气象因子;最后,将近实时的区域气象因子与空气污染物监测数据
输入至训练完成的空气质量预报模型中,得到空气质量预报结果。通过采用天气预报模式及深度学习方法从气象模拟数据中提取出近实时的区域气象因子,将其与空气污染物监测数据作为空气质量预报模型的输入,得到空气质量预报结果,能明显降低噪音和数据异常值对预测过程的干扰,提高模型的鲁棒性,从而有效提高对于未来较长时期(三天及以上)空气质量预报的数值精度和预报准确性。
90.其中,还可以进行时间信息编码,将小时信息、星期信息、月份信息进行二进制编码,并将当前时刻与目标预报时刻的二进制时间信息进行拼接作为输入,利用dense层学习样本中不同时间点的空气质量和气象数据与未来空气质量指数之间的关系,并将时间信息进行转换至与bi-lstm训练数据相同的维度,与训练数据做对应位相乘,对单个样本中不同时间步的变量施加权重,在模型内部实现注意力机制。
91.基于同样的发明构思,本发明还提出一种基于深度学习预报空气质量的数据前处理系统,该基于深度学习预报空气质量的数据前处理系统包括:
92.目标信息获取模块,用于获取目标预报区域信息和目标预报时刻;
93.监测数据获取模块,用于获取目标预报区域近实时的空气污染物监测数据;
94.天气预报模式模块,用于获取实时气象模拟数据集,并采用天气预报模式对其进行优化,生成气象预报数据集;
95.数据处理模块,在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;
96.卷积自编码器模型训练模块,用于对历史的气象预报数据采取同样操作,并利用该数据集训练得到卷积自编码器模型;
97.降维与融合模块,用于利用训练后卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到区域气象因子;
98.空气质量预报模型训练模块,基于历史的区域气象因子与空气污染物监测数据,训练得到空气质量预报模型。
99.预报模块,用于获取近实时的区域气象因子与预处理的空气质量监测数据,并将其输入至训练完成的空气质量预报模型中,得到空气质量预报结果。
100.上述实现过程中,通过目标信息获取模块,获取目标预报区域信息和目标预报时刻;监测数据获取模块,获取目标预报区域的近实时空气污染物监测数据;天气预报模式模块,获取近实时的气象模拟数据,并采用天气预报模式对其进行优化,形成气象预报数据集;数据处理模块,在气象预报数据集中提取并拼接当前与目标预报时刻的气象预报数据;降维与融合模块,利用训练完成的卷积自编码器模型对拼接数据进行空间和时间上的降维与融合,得到区域气象因子;空气质量预报模型训练模块,利用区域气象因子与空气污染物监测数据,训练得到空气质量预报模型。预报模块,获取近实时的区域气象因子与预处理的污染物监测数据,并将其输入至训练完成的空气质量预报模型中,得到空气质量预报结果。通过采用天气预报模式及深度学习方法从气象模拟数据中提取出区域气象因子,将近实时的区域气象因子与空气污染物监测数据作为空气质量预报模型的输入,得到空气质量预报结果,能明显降低噪音和数据异常值对预测过程的干扰,提高模型的鲁棒性,从而有效提高对于未来较长时期(三天及以上)空气质量预报的数值精度和预报准确性。
101.其中,还包括:
102.归一化处理模块,用于对气象预报数据集中的各个变量进行归一化处理,得到新的气象预报数据集。
103.其中,数据提取模块包括:
104.网格信息获取单元,用于获取覆盖目标预报区域矩形范围的网格信息;
105.第一数据选择单元,用于根据网格信息和目标预报时刻在气象预报数据集中选择对应的气象预报网格数据作为目标预报时刻的气象预报数据;
106.第二数据选择单元,用于根据网格信息和当前时刻在气象预报数据集中选择对应的气象预报网格数据作为当前时刻的气象预报数据。
107.其中,还包括:
108.样本获取模块,用于获取样本气象数据集;
109.样本划分模块,用于将样本气象数据集划分为训练集、验证集和测试集;
110.训练模块,用于根据训练集和验证集对预置的卷积自编码器进行训练,得到卷积自编码器模型;
111.测试模块,用于利用测试集对卷积自编码器模型进行评价,得到评价结果;
112.输出模块,用于根据评价结果得到最终的卷积自编码器模型。
113.其中,测试模块包括:
114.输出数据单元,用于将测试集输入至卷积自编码器模型中,得到输出数据;
115.决定系数单元,用于计算并根据测试集与输出数据的决定系数得到评价结果。
116.其中,输出模块包括:
117.判断单元,用于判断自编码器的降维性能是否达到预设值,若是,则将当前的卷积自编码器模型作为最终模型;若否,则对卷积自编码器的结构及超参数进行优化并重新训练,直至达到预设值。
118.其中,预报模块包括:
119.归一化处理单元,用于将近实时的空气污染物监测数据采用预置的取值范围进行归一化处理,得到预处理的空气污染物监测数据;
120.区域气象因子单元,用于将近实时的气象预报数据输入至训练完成的卷积自编码器中,得到近实时的区域气象因子;
121.空气质量预报单元,用于将近实时的区域气象因子和预处理的空气污染物监测数据输入至训练完成的空气质量预报模型中,得到空气质量预报结果。
122.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
123.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献