一种空气质量预测方法、装置、计算机设备及存储介质与流程

2022-05-21 02:57:56 来源：中国专利 TAG：

1.本技术属于人工智能技术领域，具体涉及一种空气质量预测方法、装置、计算机设备及存储介质。

背景技术：

2.空气质量预报已成为全社会关注的热点。目前行业内空气质量预报产品很多，形式很丰富，所应用的技术方法通常为数值模型预测方法，如wrf-chem模型，cmaq模型，camx模型，或者统计方法，如神经网络，随机森林，支持向量机等。国家政府机构或部门，如环保局、监测总站、研究院所等通常基于数值方法来做空气质量预报，该方法对模型运行环境和硬件要求较高，中小企业如果有能力做空气质量预报，一般基于简单、快捷、易于搭建的统计模型，大型企业会将数值方法和统计方法相结合，研发自己的预报产品，如微软、ibm等。
3.但是，目前各种基于数值模型预测方法或统计方法的空气质量监测产品并未深度结合历史气象数据特征，导致对空气质量指数(aqi)的预报准确率约为75％至80％，这个预报准确率在很多场景下都达不到要求，其中对小尺度和突发污染事件的预报效果更是不佳。

技术实现要素：

4.本技术实施例的目的在于提出一种空气质量预测方法、装置、计算机设备及存储介质，以解决现有空气质量预测方案存在的未深度结合历史气象数据特征，导致的预报准确率不高，存在预测数据偏差的技术问题。
5.为了解决上述技术问题，本技术实施例提供一种空气质量预测方法，采用了如下所述的技术方案：
6.一种空气质量预测方法，包括：
7.接收模型训练指令，并获取预设的空气质量预测模型的历史预测数据；
8.获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据；
9.将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果；
10.基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型；
11.接收空气质量预测指令，并基于所述空气质量预测模型生成初始预测数据；
12.将所述初始预测数据导入所述长短期记忆预测模型，输出空气质量预测结果。
13.进一步地，所述获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据的步骤，具体包括：
14.分别对所述历史预测数据和所述历史监测数据进行归一化；
15.组合归一化后的所述历史预测数据和所述历史监测数据，得到所述样本数据，其
中，所述样本数据包括训练样本集和测试数据集。
16.进一步地，所述分别对所述历史预测数据和所述历史监测数据进行归一化的步骤，具体包括：
17.按照如下计算公式分别对所述历史预测数据或所述历史监测数据进行归一化：
[0018][0019]
其中，x
max
为输入的待归一化数据中的最大值，x
min
为输入的待归一化数据中的最小值，x为待归一化的数据，x
norm
为归一化处理后的数据。
[0020]
进一步地，所述初始长短期记忆模型包括输入层、隐藏层和输出层，所述将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果的步骤，具体包括：
[0021]
在所述输入层对所述样本数据进行特征提取，并按照所述样本数据的时间戳对提取到的样本特征进行组合，得到样本特征序列；
[0022]
在所述隐藏层对所述样本特征序列中的样本特征进行特征融合，得到融合特征矩阵；
[0023]
通过所述输出层对所述融合特征矩阵编译，并通过预设的回归函数对编译结果进行线性回归，得到所述初始长短期记忆模型输出的训练结果。
[0024]
进一步地，所述初始长短期记忆模型包括若干个隐藏层，若干个所述隐藏层依次连接，所述在所述隐藏层对所述样本特征序列中的样本特征进行特征融合，得到融合特征矩阵的步骤，具体包括：
[0025]
按照所述时间戳将所述样本特征序列中的样本特征依次导入若干个所述隐藏层；
[0026]
持续获取上一个隐藏层的输出结果，并将所述上一个隐藏层的输出结果导入到下一个隐藏层中；
[0027]
在所述下一个隐藏层中，持续融合所述上一个隐藏层的输出结果和所述样本特征，直至获得最后一个隐藏层的输出结果，得到所述融合特征矩阵。
[0028]
进一步地，所述基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型的步骤，具体包括：
[0029]
计算所述初始长短期记忆模型的训练结果与预设的标准预测结果之间的误差，获取预测误差；
[0030]
基于所述序列反向传播算法在所述始长短期记忆模型的网络层中传递所述预测误差，得到网络层误差；
[0031]
将网络层误差与预设误差阈值进行比较，若所述网络层误差大于误差阈值，则对所述初始长短期记忆模型进行迭代更新，直至所述网络层误差小于或等于误差阈值为止，得到所述长短期记忆预测模型。
[0032]
进一步地，所述计算所述初始长短期记忆模型的训练结果与预设的标准预测结果之间的误差，获取预测误差的步骤，具体包括：
[0033]
构建所述初始长短期记忆模型的损失函数，其中，所述初始长短期记忆模型的损失函数表达式如下：
[0034][0035]
其中，为训练阶段的损失函数，oi为目标污染物的真实值，pi为目标污染物的预测值，i为时间序号，n为预测的总时长，λ为非负超参数，为网络中连接权值集合，为连接权值集合的约束项，|φ|为连接权值集合的正则化取值，ξ为控制比例参数，ξ∈(0，1)；
[0036]
基于所述初始长短期记忆模型的损失函数计算所述训练结果与预设的标准预测结果之间的误差，获取预测误差。
[0037]
为了解决上述技术问题，本技术实施例还提供一种空气质量预测装置，采用了如下所述的技术方案：
[0038]
一种空气质量预测装置，包括：
[0039]
第一预测模块，用于接收模型训练指令，并获取预设的空气质量预测模型的历史预测数据；
[0040]
样本构建模块，用于获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据；
[0041]
模型训练模块，用于将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果；
[0042]
模型迭代模块，用于基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型；
[0043]
第二预测模块，用于接收空气质量预测指令，并基于所述空气质量预测模型生成初始预测数据；
[0044]
空气质量预测模块，用于将所述初始预测数据导入所述长短期记忆预测模型，输出空气质量预测结果。
[0045]
为了解决上述技术问题，本技术实施例还提供一种计算机设备，采用了如下所述的技术方案：
[0046]
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如上述任一项所述的空气质量预测方法的步骤。
[0047]
为了解决上述技术问题，本技术实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：
[0048]
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上述中任一项所述的空气质量预测方法的步骤。
[0049]
与现有技术相比，本技术实施例主要有以下有益效果：
[0050]
本技术公开了一种空气质量预测方法、装置、计算机设备及存储介质，属于人工智能技术领域。本技术通过空气质量预测模型的历史预测数据和实际的历史监测数据训练一个具有长短期记忆功能的预测模型，在进行空气质量预测时，先通过空气质量预测模型预测预定区域内的气象预测数据，再将空气质量预测模型预测的气象预测数据输入到长短期记忆预测模型，使得空气质量预测结果充分融合历史预测数据和实际的历史监测数据的特
征，使得空气质量预测结果更加准确。本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
附图说明
[0051]
为了更清楚地说明本技术中的方案，下面将对本技术实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0052]
图1示出了本技术可以应用于其中的示例性系统架构图；
[0053]
图2示出了根据本技术的空气质量预测方法的一个实施例的流程图；
[0054]
图3示出了根据本技术的空气质量预测装置的一个实施例的结构示意图；
[0055]
图4示出了根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
[0056]
除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本技术；本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。
[0057]
在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。
[0058]
为了使本技术领域的人员更好地理解本技术方案，下面将结合附图，对本技术实施例中的技术方案进行清楚、完整地描述。
[0059]
如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
[0060]
用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0061]
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture expertsgroup audio layer iii，动态影像专家压缩标准音频层面3)、mp4(moving pictureexperts group audio layer iv，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0062]
服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的
页面提供支持的后台服务器，服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0063]
需要说明的是，本技术实施例所提供的空气质量预测方法一般由服务器执行，相应地，空气质量预测装置一般设置于服务器中。
[0064]
应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
[0065]
继续参考图2，示出了根据本技术的空气质量预测方法的一个实施例的流程图。本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0066]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。所述的空气质量预测方法，包括以下步骤：
[0067]
s201，接收模型训练指令，并获取预设的空气质量预测模型的历史预测数据；
[0068]
其中，空气质量预测模型可以采用wrf-chem模型，wrf-chem模型是由美国noaa预报系统实验室(fsl)开发的，由气象模型(wrf)和化学模型(chem)在线完全耦合的新一代的区域空气质量模型。wrf-chem模型包含了一种全新的大气化学模型理念，它的化学和气象过程使用相同的水平和垂直坐标系，相同的物理参数化方案，不存在时间上的插值，并且能够考虑化学对气象过程的反馈作用。有别于这之前的大气化学模型，如saqm模型、calgrid模型、model3-camq模型等，它们的气象过程和化学过程是分开的，一般先运行中尺度气象模型，得到一定时间间隔的气象场，然后提供给化学模型使用。事实上，在实际大气中化学和气象过程是同时发生的，并且能够互相影响，如气溶胶能影响地气系统辐射平衡，气溶胶作为云凝结核，能影响降水，而气温、云和降水对化学过程也有非常强烈的影响。因此，wrf-chem能够模拟再现一种更加真实的大气环境。
[0069]
具体的，服务器在接收模型训练指令后，获取预设的wrf-chem模型在预设时间周期内的历史预测数据。其中，wrf-chem模型可以完成空气质量预测中的气象监测和污染物监测功能。在本技术具体的实施例中，wrf-chem模型获得的气象监测数据主要5种，分别为气温、降水、风速、气压和湿度，污染物监测数据主要7种，分别为so2、no
x
、co2、o3、pm10、pm2.5和vocs。
[0070]
在本实施例中，空气质量预测方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收模型训练指令。需要指出的是，上述无线连接方式可以包括但不限于3g/4g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
[0071]
s202，获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据。
[0072]
具体的，服务器从空气质量预测的数据库中获取与所述历史预测数据对应的历史监测数据，并基于历史预测数据和历史监测数据构建样本数据，样本数据用于训练lstm长短期记忆模型，其中，样本数据包括训练样本集和测试数据集。
[0073]
s203，将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果。
[0074]
具体的，初始长短期记忆模型采用lstm(long short-term memory)网络构建，lstm是一种rnn的特殊类型，初始长短期记忆模型包括一个输入层、多个隐藏层和一个输出层，输入层用于对输入数据进行特征提取、特征映射和特征组合，隐藏层用于添加某些历史特征或者遗忘某些历史特征，输出层用于对输入的技术特征进行编译和回归，以获得预测结果。
[0075]
具体的，将wrf-chem数值模型预测出的不同高度层的历史气象数据与同期的地面站点观测的实际气象数据，以及wrf-chem数值模型预测出的不同高度层的历史污染物浓度数据与同期的地面站点观测的实际污染物浓度数据输入到lstm模型中进行训练，通过空气质量预测模型的历史预测数据和实际的历史监测数据构成样本数据，通过lstm模型隐藏层的门结构提取并保存历史预测数据和实际的历史监测数据的特征，以便训练一个具有长短期记忆功能的lstm预测模型。
[0076]
s204，基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型。
[0077]
其中，序列反向传播算法bptt(back-propagation through time)算法是常用的训练rnn的方法，其实本质还是反向传播算法算法，只不过通过rnn处理时间序列数据，所以要基于时间反向传播，故叫随时间反向传播。bptt的中心思想和bp算法相同，沿着需要优化的参数的负梯度方向不断寻找更优的点直至收敛。
[0078]
反向传播算法，即误差反向传播算法(backpropagation algorithm，bp算法)适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上，用于深度学习网络的误差计算。bp网络的输入、输出关系实质上是一种映射关系：一个n输入m输出的bp神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。bp算法的学习过程由正向传播过程和反向传播过程组成。在正向传播过程中，输入信息通过输入层经隐含层，逐层处理并传向输出层，并转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，以作为修改权值的依据。
[0079]
具体的，服务器获取初始长短期记忆模型的训练结果，并基于训练结果和预设的序列反向传播算法对初始长短期记忆模型的模型参数进行迭代更新，直至模型拟合，得到训练完成的长短期记忆预测模型。
[0080]
s205，接收空气质量预测指令，并基于所述空气质量预测模型生成初始预测数据。
[0081]
具体的，服务器当接收到空气质量预测指令后，根据空气质量预测指令确定待预测区域p和预测时长t，采用wrf-chem模型对待预测区域p进行时长为t的持续预测，得到初始预测数据。
[0082]
s206，将所述初始预测数据导入所述长短期记忆预测模型，输出空气质量预测结果。
[0083]
具体的，服务器将初始预测数据导入训练好的长短期记忆预测模型，在长短期记
忆预测模型中提取初始预测数据的特征，并融合历史数据特征和初始预测数据的特征，以及对融合的特征进行编译和线性回归，得到空气质量预测结果。
[0084]
在上述实施例中，本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
[0085]
进一步地，所述获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据的步骤，具体包括：
[0086]
分别对所述历史预测数据和所述历史监测数据进行归一化；
[0087]
组合归一化后的所述历史预测数据和所述历史监测数据，得到所述样本数据，其中，所述样本数据包括训练样本集和测试数据集。
[0088]
具体的，服务器分别对历史预测数据和历史监测数据进行归一化，其中，数据归一化处理，目的是帮助lstm模型更快收敛。然后组合归一化后的历史预测数据和历史监测数据，得到样本数据，其中，样本数据包括训练样本集和测试数据集，组合归一化后的历史预测数据和历史监测数据后，取出其中80％作为训练样本集，剩余20％作为测试数据集。
[0089]
进一步地，所述分别对所述历史预测数据和所述历史监测数据进行归一化的步骤，具体包括：
[0090]
按照如下计算公式分别对所述历史预测数据或所述历史监测数据进行归一化：
[0091][0092]
其中，x
max
为输入的待归一化数据中的最大值，x
min
为输入的待归一化数据中的最小值，x为待归一化的数据，x
norm
为归一化处理后的数据。
[0093]
在上述是实施例中，本技术通过对历史预测数据和历史监测数据进行归一化，帮助lstm模型更快收敛，然后通过组合归一化后的历史预测数据和历史监测数据，得到样本数据，样本数据用于训练lstm模型。
[0094]
进一步地，所述初始长短期记忆模型包括输入层、隐藏层和输出层，所述将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果的步骤，具体包括：
[0095]
在所述输入层对所述样本数据进行特征提取，并按照所述样本数据的时间戳对提取到的样本特征进行组合，得到样本特征序列；
[0096]
在所述隐藏层对所述样本特征序列中的样本特征进行特征融合，得到融合特征矩阵；
[0097]
通过所述输出层对所述融合特征矩阵编译，并通过预设的回归函数对编译结果进行线性回归，得到所述初始长短期记忆模型输出的训练结果。
[0098]
具体的，服务器在输入层对样本数据进行特征提取，按照样本数据的时间戳对提取到的样本特征进行组合，得到样本特征序列，同时，服务器对样本特征进行矩阵转化，得到特征矩阵，然后服务器在隐藏层对样本特征序列中的样本特征进行特征融合，即对特征矩阵进行融合，得到融合特征矩阵，通过输出层对融合特征矩阵编译，并通过预设的回归函数对编译结果进行线性回归，得到初始长短期记忆模型的训练结果。
[0099]
进一步地，所述初始长短期记忆模型包括若干个隐藏层，若干个所述隐藏层依次连接，所述在所述隐藏层对所述样本特征序列中的样本特征进行特征融合，得到融合特征矩阵的步骤，具体包括：
[0100]
按照所述时间戳将所述样本特征序列中的样本特征依次导入若干个所述隐藏层；
[0101]
持续获取上一个隐藏层的输出结果，并将所述上一个隐藏层的输出结果导入到下一个隐藏层中；
[0102]
在所述下一个隐藏层中，持续融合所述上一个隐藏层的输出结果和所述样本特征，直至获得最后一个隐藏层的输出结果，得到所述融合特征矩阵。
[0103]
其中，初始长短期记忆模型包括若干个隐藏层，每一个隐藏层包括通过遗忘门(forget gate)、输入门(input gate)、输出门(output gate)学习长期依赖信息。原始rnn的隐藏层只有一个状态h，h为保存短期信息的状态，lstm中增加了一个状态c(单元状态，cell state)，c保存长期信息的状态。门结构实际上是一层全连接层，输入的是一个向量，输出的是0到1之间的实数向量。
[0104]
在本技术一种具体的实施例中，初始长短期记忆模型包括5个隐藏层，服务器按照时间戳将样本特征序列中的样本特征依次导入5个所述隐藏层中，然后获取第一个隐藏层的输出结果，将第一个隐藏层的输出结果导入到第二个隐藏层，并融合第一个隐藏层的输出结果和第二个隐藏层的样本特征；获取第二个隐藏层的输出结果，将第二个隐藏层的输出结果导入到第三个隐藏层，并融合第二个隐藏层的输出结果和第三个隐藏层的样本特征；获取第三个隐藏层的输出结果，将第三个隐藏层的输出结果导入到第四个隐藏层，并融合第三个隐藏层的输出结果和第四个隐藏层的样本特征；获取第四个隐藏层的输出结果，将第四个隐藏层的输出结果导入到第五个隐藏层，并融合第四个隐藏层的输出结果和第五个隐藏层的样本特征，获得第五个隐藏层的输出结果得到融合特征矩阵。
[0105]
遗忘门：选择忘记过去某些信息，即决定应丢弃或保留哪些信息。
[0106]
在本技术中，遗忘门表示是否保留隐藏层存储的历史数据特征，如果为1即门开，则保留，如果为0，即门关，则清空所存储的历史数据特征。
[0107]
将t时刻的输入x＝[x1,...,xt]与上一个隐藏层的数据ht-1进行结合，然后再用wf矩阵其调整成与t时刻隐藏层相同的维度，然后加一个bf偏置之后经过sigmoid函数进行0～1之间的分类。隐藏层运算表达式如下：
[0108]ft
＝σ(wf*[h
t-1
,x
t
] bf)
[0109]
其中，f
t
表示当前时刻遗忘门输出的信息，h
t-1
表示上一时刻输入的信息，x
t
表示当前时刻输入的信息，bf表示预设的偏置项，wf表示预设的权重矩阵，σ表示sigmoid函数。
[0110]
输入门：记忆现在的某些信息，并将过去与现在的记忆进行合并。
[0111]
在本技术中，输入门表示是否允许采集的新的预测数据信息加入到隐藏层节点中，如果为1即门开，则允许输入，如果为0，即门关，则不允许，这样就可以摒弃掉一些没用的输入信息。输入门运算表达式如下：
[0112]it
＝σ(wi*[h
t-1
,x
t
] bi)
[0113]
其中，i
t
表示当前时刻输入门输出的信息。表达式如下：
[0114]
[0115]
其中，表示当前时刻ellstate(lstm神经单元状态)的值。
[0116]
输出门：输出运算结果。
[0117]
在本技术中，输出门表示是否将当前节点输出值输出给下一层，即下一个隐藏层或者输出层，如果为1，即门开，则当前节点的输出值将作用于下一层，如果为0，即门关，则当前节点输出值不输出。
[0118]
输出门运算表达式如下：
[0119]ot
＝σ(wo[h
t-1
,x
t
] bo)
[0120]
其中，o
t
表示输出门的输出结果。
[0121]
在上述实施例中，本技术通过样本数据对lstm长短期记忆模型的输入层、隐藏层和输出层进行训练，并通过隐藏层的门结构实现选择忘记过去某些信息和记忆现在的某些信息，并将过去的信息与现在的信息进行合并，融合历史数据特征和新增数据特征。
[0122]
进一步地，基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型的步骤，具体包括：
[0123]
计算所述初始长短期记忆模型的训练结果与预设的标准预测结果之间的误差，获取预测误差；
[0124]
基于所述序列反向传播算法在所述始长短期记忆模型的网络层中传递所述预测误差，得到网络层误差；
[0125]
将网络层误差与预设误差阈值进行比较，若所述网络层误差大于误差阈值，则对所述初始长短期记忆模型进行迭代更新，直至所述网络层误差小于或等于误差阈值为止，得到所述长短期记忆预测模型。
[0126]
具体的，服务器通过初始长短期记忆模型的损失函数计算训练结果与预设的标准预测结果之间的误差，获取预测误差，其中，预设的标准预测结果为历史监测数据。基于序列反向传播算法和各个网络层的实质运行时间序列，在始长短期记忆模型的各个网络层中传递上述预测误差，得到各个网络层误差，将各个网络层误差分别与预设误差阈值进行比较，若存在任一网络层的误差大于误差阈值，则对初始长短期记忆模型的模型参数进行迭代更新，直至所有网络层的误差小于或等于误差阈值为止，此时初始长短期记忆模型趋于拟合，得到长短期记忆预测模型。
[0127]
进一步地，所述计算所述初始长短期记忆模型的训练结果与预设的标准预测结果之间的误差，获取预测误差的步骤，具体包括：
[0128]
构建所述初始长短期记忆模型的损失函数，其中，所述初始长短期记忆模型的损失函数表达式如下：
[0129][0130]
其中，为训练阶段的损失函数，oi为目标污染物的真实值，pi为目标污染物的预测值，i为时间序号，n为预测的总时长，λ为非负超参数，为网络中连接权值集合，为连接权值集合的约束项，|φ|为连接权值集合的正则化取值，ξ为控制比例参数，ξ∈(0，1)。
[0131]
基于所述初始长短期记忆模型的损失函数计算所述训练结果与预设的标准预测结果之间的误差，获取预测误差。
[0132]
在上述实施例中，通过初始长短期记忆模型的损失函数计算训练结果与标准预测结果之间的预测误差，通过序列反向传播算法传递预测误差，并通过比对预测误差与预设误差阈值，根据误差比对结果对初始长短期记忆模型进行迭代更新直至模型趋于拟合，得到长短期记忆预测模型，此时长短期记忆预测模型可以实现历史数据特征和输入数据特征的融合，使得空气质量预测充分考虑历史数据情况，显著提高了空气质量预测的精度，使得预测结果更加准确。
[0133]
本技术公开了一种空气质量预测方法，属于人工智能技术领域。本技术通过空气质量预测模型的历史预测数据和实际的历史监测数据训练一个具有长短期记忆功能的预测模型，在进行空气质量预测时，先通过空气质量预测模型预测预定区域内的气象预测数据，再将空气质量预测模型预测的气象预测数据输入到长短期记忆预测模型，使得空气质量预测结果充分融合历史预测数据和实际的历史监测数据的特征，使得空气质量预测结果更加准确。本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
[0134]
需要强调的是，为进一步保证上述空气质量预测结果的私密和安全性，上述空气质量预测结果还可以存储于一区块链的节点中。
[0135]
本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0136]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory，rom)等非易失性存储介质，或随机存储记忆体(random access memory，ram)等。
[0137]
应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0138]
进一步参考图3，作为对上述图2所示方法的实现，本技术提供了一种空气质量预测装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
[0139]
如图3所示，本实施例所述的空气质量预测装置包括：
[0140]
第一预测模块301，用于接收模型训练指令，并获取预设的空气质量预测模型的历史预测数据；
[0141]
样本构建模块302，用于获取与所述历史预测数据对应的历史监测数据，并基于所述历史预测数据和所述历史监测数据构建样本数据；
[0142]
模型训练模块303，用于将所述样本数据导入预设的初始长短期记忆模型，并利用所述样本数据对所述初始长短期记忆模型进行训练，得到所述初始长短期记忆模型输出的训练结果；
[0143]
模型迭代模块304，用于基于所述训练结果和预设的序列反向传播算法对初始长短期记忆模型进行迭代更新，得到训练完成的长短期记忆预测模型；
[0144]
第二预测模块305，用于接收空气质量预测指令，并基于所述空气质量预测模型生成初始预测数据；
[0145]
空气质量预测模块306，用于将所述初始预测数据导入所述长短期记忆预测模型，输出空气质量预测结果。
[0146]
进一步地，所述样本构建模块302具体包括：
[0147]
归一化单元，用于分别对所述历史预测数据和所述历史监测数据进行归一化；
[0148]
样本构建单元，用于组合归一化后的所述历史预测数据和所述历史监测数据，得到所述样本数据，其中，所述样本数据包括训练样本集和测试数据集。
[0149]
进一步地，所述归一化单元具体包括：
[0150]
按照如下计算公式分别对所述历史预测数据或所述历史监测数据进行归一化：
[0151][0152]
其中，x
max
为输入的待归一化数据中的最大值，x
min
为输入的待归一化数据中的最小值，x为待归一化的数据，x
norm
为归一化处理后的数据。
[0153]
进一步地，所述初始长短期记忆模型包括输入层、隐藏层和输出层，所述模型训练模块303具体包括：
[0154]
特征提取单元，用于在所述输入层对所述样本数据进行特征提取，并按照所述样本数据的时间戳对提取到的样本特征进行组合，得到样本特征序列；
[0155]
特征融合单元，用于在所述隐藏层对所述样本特征序列中的样本特征进行特征融合，得到融合特征矩阵；
[0156]
线性回归单元，用于通过所述输出层对所述融合特征矩阵编译，并通过预设的回归函数对编译结果进行线性回归，得到所述初始长短期记忆模型输出的训练结果。
[0157]
进一步地，所述初始长短期记忆模型包括若干个隐藏层，若干个所述隐藏层依次连接，所述特征融合单元具体包括：
[0158]
特征导入子单元，用于按照所述时间戳将所述样本特征序列中的样本特征依次导入若干个所述隐藏层；
[0159]
输出结果导入子单元，用于持续获取上一个隐藏层的输出结果，并将所述上一个隐藏层的输出结果导入到下一个隐藏层中；
[0160]
特征融合子单元，用于在所述下一个隐藏层中，持续融合所述上一个隐藏层的输出结果和所述样本特征，直至获得最后一个隐藏层的输出结果，得到所述融合特征矩阵。
[0161]
进一步地，所述模型迭代模块304具体包括：
[0162]
误差计算单元，用于计算所述初始长短期记忆模型的训练结果与预设的标准预测
结果之间的误差，获取预测误差；
[0163]
误差传递单元，用于基于所述序列反向传播算法在所述始长短期记忆模型的网络层中传递所述预测误差，得到网络层误差；
[0164]
模型迭代单元，用于将网络层误差与预设误差阈值进行比较，若所述网络层误差大于误差阈值，则对所述初始长短期记忆模型进行迭代更新，直至所述网络层误差小于或等于误差阈值为止，得到所述长短期记忆预测模型。
[0165]
进一步地，所述误差计算单元具体包括：
[0166]
损失函数构建子单元，用于构建所述初始长短期记忆模型的损失函数，其中，所述初始长短期记忆模型的损失函数表达式如下：
[0167][0168]
其中，为训练阶段的损失函数，oi为目标污染物的真实值，pi为目标污染物的预测值，i为时间序号，n为预测的总时长，λ为非负超参数，为网络中连接权值集合，为连接权值集合的约束项，|φ|为连接权值集合的正则化取值，ξ为控制比例参数，ξ∈(0，1)；
[0169]
误差计算子单元，用于基于所述初始长短期记忆模型的损失函数计算所述训练结果与预设的标准预测结果之间的误差，获取预测误差。
[0170]
本技术公开了一种空气质量预测装置，属于人工智能技术领域。本技术通过空气质量预测模型的历史预测数据和实际的历史监测数据训练一个具有长短期记忆功能的预测模型，在进行空气质量预测时，先通过空气质量预测模型预测预定区域内的气象预测数据，再将空气质量预测模型预测的气象预测数据输入到长短期记忆预测模型，使得空气质量预测结果充分融合历史预测数据和实际的历史监测数据的特征，使得空气质量预测结果更加准确。本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
[0171]
为解决上述技术问题，本技术实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。
[0172]
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit，asic)、可编程门阵列(field－programmable gate array，fpga)、数字处理器(digital signal processor，dsp)、嵌入式设备等。
[0173]
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0174]
所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、
硬盘、多媒体卡、卡型存储器(例如，sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(smart media card,smc)，安全数字(secure digital,sd)卡，闪存卡(flash card)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如空气质量预测方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0175]
所述处理器42在一些实施例中可以是中央处理器(central processing unit，cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述空气质量预测方法的计算机可读指令。
[0176]
所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
[0177]
本技术公开了一种计算机设备，属于人工智能技术领域。本技术通过空气质量预测模型的历史预测数据和实际的历史监测数据训练一个具有长短期记忆功能的预测模型，在进行空气质量预测时，先通过空气质量预测模型预测预定区域内的气象预测数据，再将空气质量预测模型预测的气象预测数据输入到长短期记忆预测模型，使得空气质量预测结果充分融合历史预测数据和实际的历史监测数据的特征，使得空气质量预测结果更加准确。本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
[0178]
本技术还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的空气质量预测方法的步骤。
[0179]
本技术公开了一种存储介质，属于人工智能技术领域。本技术通过空气质量预测模型的历史预测数据和实际的历史监测数据训练一个具有长短期记忆功能的预测模型，在进行空气质量预测时，先通过空气质量预测模型预测预定区域内的气象预测数据，再将空气质量预测模型预测的气象预测数据输入到长短期记忆预测模型，使得空气质量预测结果充分融合历史预测数据和实际的历史监测数据的特征，使得空气质量预测结果更加准确。本技术结合了传统的数值模型和机器学习模型来做空气质量预报，一方面保留了数值模型预报的稳定性，另一方面也吸收了机器学习模型较强的“学习”能力，通过融合历史预测数据和实际的历史监测数据的特征，显著提高了空气质量预测的精度，弥补数值模型在aqi预测预报上的缺陷。
[0180]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下
前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本技术各个实施例所述的方法。
[0181]
本技术可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0182]
显然，以上所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例，附图中给出了本技术的较佳实施例，但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本技术专利保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：兼容不同数据存取模式的人工智能芯片和数据处理方法与流程

一种空气质量预测方法、装置、计算机设备及存储介质与流程

相关文献

最热文献