一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图注意力波网的多监测断面水质指标时空预测方法

2023-02-04 18:12:51 来源:中国专利 TAG:


1.本发明涉及一种面向多监测断面水质指标时空预测的方法,特别是涉及一种基于图注意力波网的多监测断面水质指标时空预测方法。


背景技术:

2.近年来,由于物联网技术的发展和水质监测硬件成本的不断下降,水质监测传感器被大规模地部署在各地的河流和湖泊中。这些传感器产生了海量且高频的多源数据,因此可以通过对所获得的高频数据进行分析研究,从中挖掘出有价值的信息,进而实现诸如水质预测和预警等功能,从而进一步科学有效地管理水环境,提高水生态环境质量。随着地区之间社会经济联系的不断加强,水环境演变呈现跨区域、多站点相互影响的复杂变化,导致水质监测站的未来数据不仅取决于自身的历史值,还受到相邻的监测站历史值的影响。因此,面对错综复杂的水流域和传感器上下游关系,在进行水质预测建模时,要考虑时间依赖性的同时还要考虑空间依赖性,从而进一步提高预测结果的准确性。
3.随着人工智能和机器学习的不断发展,深度学习越来越成为时间序列预测的主流算法,并广泛应用于水环境中。大多数水质指标数据属于长相关时间序列,即序列中存在相对较长的间隔或延迟,以及对后续值影响较大的重要事件。传统神经网络很难捕捉到这种跨度较长的关键信息,导致预测精度不足。随着循环神经网络(recurrent neural networks,rnn)的出现,神经网络中隐藏层的神经元之间能够相互传递信息,进而提高了神经网络模型在时序预测任务上的精确度。然而,普通rnn在处理长期的依赖关系时存在梯度消失的问题,lstm(long short term memory)的提出有效地缓解了这一问题。但lstm具有无法并行计算、训练耗时太长的缺点。并且,上述方法仅仅依赖自身历史值进行时序预测,忽略了水环境中的空间依赖性,导致预测精度普遍偏低,因此需要一种合适的方法来解决上述技术问题。


技术实现要素:

4.针对以上现有技术的不足,本发明提供一种基于sg(savitzky

golay)滤波与图注意力波网(graph attention wavenet,gatwnet)的多监测断面水质指标时空预测方法。包括:基于sg滤波的水质时间序列预处理方案;基于gatwnet模型实现水质指标多断面、多步预测。本发明的目的通过以下技术方案来实现。
5.一种基于图注意力波网的多监测断面水质指标时空预测方法,该方法包括如下的步骤:
6.1)获取多个水质监测断面之间的距离和在河网中的上下游关系,构建有向图;
7.2)获取多个水质监测断面过去一段时间监测到的水质指标组成的时间序列数据;
8.3)对该数据进行sg滤波平滑降噪处理;
9.4)在3)的基础上,将处理后的数据进行归一化处理,再按预设的滑动窗口宽度划分为多个子序列,将该序列转化为有监督数据,并划分训练集测试集;
10.5)在4)的基础上,将有向图和特征序列输入图注意力波网模型中,输出多断面水质指标的多步的预测值;
11.6)在5)的基础上,预测值进行反归一化,从而获得未来的水质指标预测值。
附图说明
12.图1一种基于图注意力波网的多监测断面水质指标时空预测方法组成示意图;
13.图2sg滤波流程图;
14.图3图注意力模块图;
15.图4扩展因果卷积案例图;
16.图5gatwnet架构图。
具体实施方式
17.下面将详细描述本发明各个方面的特征和示例性实施例。下面的描述涵盖了许多具体细节,以便提供对本发明的全面理解。但是,对于本领域技术人员来说显而易见的是,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更清楚的理解。本发明绝不限于下面所提出的任何具体配置和算法,而是在不脱离本发明的精神的前提下覆盖了相关元素、部件和算法的任何修改、替换和改进。
18.下面将参照附图1来描述根据本发明实施例的一种基于sg滤波与gatwnet的多监测断面水质指标时空预测方法的具体步骤如下:
19.第一步,获取多个水质监测站之间的距离和在河网中的上下游关系。
20.选定一个目标区域,确定区域内所有水质监测站。通过在线地图工具测量监测站之间的距离以及在河道中的上下游位置关系,然后以监测站为顶点,距离和河水流向为有向边,构建带权有向图。
21.第二步,获取多个水质监测站过去一段时间监测到的水质指标组成的时间序列数据。
22.由于水质自动监测站实际的监测频次通常为每4小时监测一次,在数据预处理阶段,对水质参数数据筛选,统一调整为4小时等间隔的数据。对于缺失数据,用插值法补齐数据。
23.第三步,将水质指标时间序列数据用sg滤波预处理。
24.由于数据中可能存在噪声点,往往会导致非线性模型的过拟合出现,通过使用sg方法对原始数据进行平滑滤波,降低噪声的干扰,可以有效的抑制非线性模型过拟合的出现。图2为sg滤波的实施方法流程图。sg滤波的原理如下:
25.sg滤波的核心思想是对窗口内的数据进行加权滤波,它的加权权重是对给定的高阶多项式进行最小二乘拟合得到。对当前时刻的前后共n(n=2m 1)个观测值进行滤波,用k-1阶多项式对其进行拟合。对于当前时刻的观测值,使用如下公式进行拟合:
26.y=a0 a1x a1x2 ... a
k-1
x
k-1
27.其中,x为待拟合的数据,y为拟合后的输出数据,a0,a1,...,a
k-1
为待求解的参数。对于窗口内的n个点,形成n个方程,构成k元线性方程组。通过最小二乘法求解拟合参数a,
用矩阵表示为:
28.yn=xn×k·ak
×1 bn×129.a的最小二乘解为:
[0030][0031]
y的模型滤波值为:
[0032][0033]
第四步,归一化处理,并通过滑动窗口划分特征序列数据
[0034]
滤波后的数据要做以下滑动窗口处理,以便模型输入。
[0035]
1)对上一步处理后的数据进行归一化。具体的公式如下:
[0036][0037]
其中,x
*
表示归一化后的目标值,x表示需要归一化的数据,x
min
代表数据中的最小值,x
max
代表数据中的最大值。
[0038]
2)滑动窗口宽度设定为输入时序长度和预测时序长度之和,使用滑动窗口截取输入值和预测值。
[0039]
3)将滑动窗口截取的数据分离输入值和预测值,将其转化为有监督数据。
[0040]
第五步,gatwnet模型预测
[0041]
本发明使用图注意力波网来分析水环境相关指标,数据经过上一步处理后,设定输入序列带权有向图g,通过gatwnet捕获数据中的空间依赖和时间依赖,从中提取特征后,针对多个监测站进行未来的水质指标预测。附图5给出gatwnet的全部结构。
[0042]
由于需要捕获输入序列的时间趋势,而传统的卷积神经网络(convolutional neural networks,cnn)模型无法直接处理时序预测问题,因此gatwnet使用扩展因果卷积作为时间层。因果卷积的定义为滤波器f=(f1,f2,

,fk),序列x=(x1,x2,

,xk),在x
t
处的因果卷积为:与rnn不同,卷积运算可以并行完成,对后续时间步的预测不必等待前一个时间步完成,因此基于卷积的模型在训练和评估速度方面对比基于rnn的模型更具有优势。通过堆叠多层因果卷积,可以让模型捕捉到更长的输入时间序列趋势。由于因果卷积的感受野与堆叠的层数呈线性关系,当需要考虑很长的输入序列时,一个很明显的问题就是需要叠加很多层或者很大的过滤器来提升卷积的感受野。层数的增加就带来梯度消失、训练复杂、拟合效果不好的问题。扩展因果卷积通过一个超参数d来跳过部分输入来使滤波器可以作用于大于滤波器本身长度的区域,在不增加参数和模型复杂度的条件下,可以使网络的感受野大小随层数增加呈指数扩大。它的定义为滤波器f=(f1,f2,

,fk),序列x=(x1,x2,

,xk),在x
t
处的扩展因子等于d的扩展卷积为:门控机制在时间卷积中起着重要的作用,它能够有效地控制网络层之间的信息流。本模型中使用了sigmoid函数作为门控函数,定义为g=tanh(θ1x b)

σ(θ2x c)。其中*表示卷积操作,

表示逐元素相乘,θ1,θ2,b和c都是模型中可学习
的参数。σ表示sigmoid函数,决定了信息传递向下一层的比率。
[0043]
图注意力网络(graph attention network,gat)通过自注意力机制(self-attention)来对邻居节点进行聚合,实现了对不同邻居的权值自适应匹配,从而提高了模型的准确率。gat由若干个功能相同的图注意力层组成,其输入是节点的特征值型的准确率。gat由若干个功能相同的图注意力层组成,其输入是节点的特征值其中f是节点特征的维度。在图注意力层中,首先使用一个权值矩阵作用到每个节点,然后输入到一个参数为单层前馈神经网络,再使用leakyrelu激活函数做非线性化操作,计算出一个注意力系数e
i,j
,表示节点j对于节点i的重要性。理论上可以计算图中任意一个节点到中心节点的权值,然而为了简化计算,gat利用图的结构,并通过掩码注意力(masked attention)的手段,只计算节点i的邻居节点其中是节点vi的邻居节点。最后使用softmax对中心节点的邻居节点做归一化,计算方式如下:
[0044][0045][0046]
节点vi的输入特征经过一个图注意力层后,得到维度为f'的输出特征为了提高注意力机制的泛化能力,gat选择使用了多头注意力层,即使用m组相互独立的单头注意力层,然后将它们的结果进行拼接,具体计算方式如下:
[0047][0048]
根据残差模块的思想,将带有门控机制的时间卷积层和图注意力层进行整合,使得网络不会出现退化问题。将整合后的时空层堆叠多次,让模型能够捕获不同时间层的空间依赖。然后将每一层的输出结果通过跳跃连接(skip connection)进行叠加,再将叠加后的结果经过relu激活函数和全连接层(两轮),最终得到三维张量的预测结果y其中n表示节点数,f表示节点的特征维度,τ表示预测步长。另外,为了让gatwnet适应不同的输入序列长度,可以手动设置每一层的扩展因子和需要堆叠的层数。
[0049]
对水质测试集使用模型生成预测值,并对预测值进行反归一化,并与未做滤波处理的真实值使用mae、rmse和mape进行比较,调整水质时空预测模型中图注意力网络的注意力头数量和波网模型隐层的大小以及测试经调整的所述水质时空预测模型,最终获取效果最佳的参数模型。
[0050]
该水质预测模型可应用于不同水域的溶解氧(do)、ph值、总磷(tp)、总氮(tn)等水质指标的预测,实现相关水质数据的精确预测,便于水质预警、水污染治理。
[0051]
本发明对上面提出的一种基于图注意力波网的多监测断面水质指标时空预测方法。应当理解,以上借助优选实施例对本发明的技术方案进行的详细说明是示意性的而非限制性。本领域的普通技术人员在阅读本发明说明书的基础上可以对各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,然而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献