一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度学习模型的海浪波高预测方法及系统

2022-05-08 06:48:20 来源:中国专利 TAG:


1.本发明涉及海洋预测技术领域,更具体的说是涉及一种基于深度学习模型的海浪波高预测方法及系统。


背景技术:

2.根据海浪形成的机制,可以将海浪分为风浪和涌浪。由于海面波浪实际上是各种不同波高、周期、进行方向的多种波的无规则组合,因此一个波浪的波高值没有代表性。有效波高是指按一定规则统计的实际波高值,比如平均波高、均方根波高、最大波高、某种保证率波高、某部分波的平均波高等。有效波高对海洋工程建设、海上航行、运输有重大影响,同时也是海洋灾害预报和波浪能可持续发电评估的重要参数。目前,使用最广泛的预报模型为第三代数值波浪预测模型(wam、wavewatch iii和swan等),一种考虑各种物理过程的基于能量平衡方程的计算模型。海浪有效波高受气候状况、季节特征、地形地势因素影响,具有强非线性和强非对称性。按照原理的不同,海浪预测模型可以分为下列几种:
3.1)数值计算模型
4.以上述wwwⅲ为代表的数值计算模型,通过真实物理规律对各处传感器得到的物理数据根据自然规律进行计算分析得到预测结果。由于海浪有效波高受风力、温度、海底地形等多因素影响,此类方法存在计算过程复杂、运行时间长、需要大量物理数据、预测成本高等缺点,无法实现快速精准预报;并且由于采用网格化的离散处理,用差分代替微分,不可避免的引入了数值误差,面临着数值计算不收敛、甚至是不稳定的问题。
5.2)机器学习模型
6.机器学习通过选择合适的数学模型,拟定超参数,输入特征工程加工的样本数据,依据一定的策略,运用合适的学习算法对模型进行参数调优,从而得到一个对样本数据高拟合同时又具有一定泛化能力的预测模型。机器学习方法能够在没有系统先验知识的情况下,拟合复杂的非线性过程,解决物理机制复杂的非线性问题。因此,该类方法在有效波高预测中得到广泛应用,如人工神经网络(ann),支持向量机(svm)等单一结构预测模型,小波变换神经网络(wlnn)、emd-svr模型、iceemdan-elm模型以及mlr-cwls模型等复合网络预测模型,在短期预测时表现良好,且复合网络预报结果具有更高精准度。但机器学习方法依赖于特征提取技术,泛化能力有待提高。
7.3)深度学习模型
8.与普通的机器学习模型不同,深度学习模型使用含有大量隐层的神经网络,通过大量的向量计算,学习到数据内部更抽象的特征数据,进行更高维度的特征划分,并以此做出决策。深度学习方法能够自动学习样本数据的内在规律和表示层次,为海洋预测提供强有力的支撑。现有深度学习方法预测有效波高模型包括lstm、cnn-lstm等,但模型多为简单结构,不能充分挖掘数据间的关联性,应用多层神经网络可以充分提取数据特征。随着高性能计算产业与深度学习模型的发展,深度学习以其强学习能力、良好的非线性拟合能力与可移植性已经广泛应用于预测领域。
9.现有技术在海浪预测上往往只能进行单个观测点的时序预测,很少有直接对二维观测数据进行处理;而且,现有的预测技术还具有计算量大、计算时间长、收敛困难等缺陷。因此,如何解决现有预测技术的计算量大、成本高、无法快速预测、对特征工程的依赖等缺陷,进而实现低成本的快速精确预测是本领域技术人员亟需解决的技术问题。


技术实现要素:

10.有鉴于此,本发明提供了一种基于深度学习模型的海浪波高预测方法及系统,解决了背景技术中存在的问题。
11.为了实现上述目的,本发明提供如下技术方案:
12.一种基于深度学习模型的海浪波高预测方法,包括以下步骤:
13.获取海浪波高的图片数据;
14.对所述海浪波高的图片数据进行预处理,并将预处理后的海浪波高的图片数据作为训练数据集;
15.构建海浪有效波高数据预测模型,将所述训练数据集输入海浪有效波高数据预测模型中进行深度学习训练,直至达到预设精度,获得最优预测模型;
16.通过所述最优预测模型进行海浪有效波高预测,并对预测结果进行反归一化,得到海浪有效波高的预测值。
17.以上技术方案达到的技术效果为:解决了现有预测技术存在的计算量大、成本高、无法快速预测、对特征工程的依赖等种种缺陷,实现了低成本的快速精确预测。
18.可选的,对所述海浪波高的图片数据进行预处理,具体包括以下步骤:
19.剔除异常波浪值;其中,所述异常波浪值包括负值、不正常的高值;
20.采用包括平均值填充、插值填充在内的填充方式对有效波高的缺失值进行填充;
21.对陆地不同的格点数据进行0值填充;
22.对填充后的有效波高数据进行归一化,其公式定义如下:
[0023][0024]
式中,x为原始二维海浪有效波高数据,x
min
为输入样本数据x的最小值,x
max
为输入样本数据x的最大值。
[0025]
可选的,构建的海浪有效波高数据预测模型为cnn-bilstm-attention的深度学习预测模型,采用cnn神经网络、bilstm神经网络和attention机制相结合的网络结构。
[0026]
以上设计的预测模型具有以下技术效果:cnn模型能够充分提取数据的空间局部特征,被广泛运用于图像处理;bilstm模型考虑双向信息流作用,充分提取时序数据关联信息的特征,提高模型预测精度,适用于时间序列数据的预测;attention机制可以对bilstm的预测结果进行评估打分,提取出预测结果中的重要部分。
[0027]
可选的,所述cnn神经网络的数学模型为:
[0028]ci
=f(wi*xi bi);
[0029]
式中,xi表示卷积层的输入,ci为第i层的输出特征图,wi表示卷积的权重矩阵,*表示点积,bi为变差向量,f(
·
)表示激活函数。
[0030]
可选的,所述bilstm神经网络是在lstm网络的基础上增加一个反向的lstm层,即
所述bilstm神经网络的预测结果为lstm网络和反向的lstm层预测结果的结合;其中,lstm模型的数学模型为:
[0031]ft
=σ(wf[h
t-1
,x
t
] bf);
[0032]it
=σ(wi[h
t-1
,x
t
] bi);
[0033]at
=tanh(wa·
[h
t-1
,x
t
] ba);
[0034]ct
=f
t
·ct-1
i
t
·at

[0035]ot
=σ(wo·
[h
t-1
,x
t
] bo);
[0036]ht
=o
t
·
tanh(c
t
);
[0037]
式中,f
t
表示lstm算法的遗忘门的控制向量,它决定过去状态对当前状态的影响;σ(
·
)和tanh(
·
)分别表示sigmoid和tanh激活函数;wf、wi、wa和wo表示权重;h
t-1
为第t-1个神经元的输出,x
t
为第t个神经元的输入;bf、bi、ba和bo表示偏差;i
t
表示输入门的控制向量,它决定当前新输入的a
t
的接受程度;a
t
表示当前时刻的新输入状态;c
t
表示第t个神经元的细胞状态,c
t-1
表示第t-1个神经元的细胞状态,o
t
表示输出门的输出结果;
[0038]
将o
t
和tanh(c
t
)进行点积操作后得到最终的输出结果h
t

[0039]
可选的,所述attention机制的数学模型为:
[0040]
m=tanh(y);
[0041][0042]
a=yα
t

[0043]
式中,m表示经过tanh函数的输出,y表示经过bilstm神经网络所捕获的特征矩阵,α表示经过sigmoid函数得到的注意力权重矩阵,表示权重矩阵的转置,a为经过注意力机制处理后的输出结果。
[0044]
可选的,所述获得最优预测模型,具体包括以下步骤:
[0045]
对所述训练数据集进行二维卷积,提取有效波高特征;二维卷积可以考虑海浪有效波高数据的实际空间分布,提取出其中的重要特征,减少冗余信息,提升预测精度;
[0046]
将二维卷积的卷积结果输入bilstm神经网络,根据前后时刻数据变化规律进行预测;lstm预测过程中对重要信息进行保留,非重要信息进行遗忘;bilstm考虑双向信息流作用,充分提取时序数据关联信息的特征,提高模型预测精度;
[0047]
在dropout层临时删除神经元,随机丢弃部分特征,可以减少神经元之间复杂的共适应关系,防止模型过拟合,使模型泛化性更强;
[0048]
引入attention机制,对bilstm神经网络的输出信息分配概率权重,为特征图中的重要信息赋予较大的权重,提升模型对重要信息的抓取能力;
[0049]
判断模型及参数是否满足预设精度的要求,若未满足,则对所述海浪有效波高数据预测模型使用反向传播算法进行参数更新,再继续进行深度学习训练;若满足,则获得最优预测模型。
[0050]
可选的,所述方法还包括:采用样本空间的平均绝对误差、均方根误差、平均相关系数对海浪有效波高的预测值进行误差分析;
[0051]
其中,样本空间内,每一时刻预测值与真实值的平均绝对误差为:
[0052][0053]
样本空间内,单一时刻预测值与真实值的均方根误差均值为:
[0054][0055]
样本空间内,每一时刻预测值与真实值的平均相关系数为:
[0056][0057]
式中,k为测试样例时间序列长度,即测试样例数量;i表示纬向总格点数;j表示经向总格点数;h
p
(i,j)表示空间某点基于cnn-bilstm-attention预测的有效波高值;hm(i,j)表示空间对应h
p
(i,j)格点位置的真实值;n为个例总数。
[0058]
本发明还提供了一种基于深度学习模型的海浪波高预测系统,包括:
[0059]
采集模块,用于获取海浪波高的图片数据;
[0060]
预处理模块,用于对所述海浪波高的图片数据进行预处理,并将预处理后的海浪波高的图片数据作为训练数据集;
[0061]
构建模块,用于构建海浪有效波高数据预测模型;
[0062]
训练模块,用于将所述训练数据集输入海浪有效波高数据预测模型中进行深度学习训练,直至达到预设精度,获得最优预测模型;
[0063]
预测模块,通过所述最优预测模型进行海浪有效波高预测,并对预测结果进行反归一化,得到海浪有效波高的预测值。
[0064]
本发明还提供了一种计算机可存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以上所述海浪波高预测方法的步骤。
[0065]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于深度学习模型的海浪波高预测方法及系统,具有以下有益效果:
[0066]
(1)本发明解决了现有预测技术存在的计算量大、成本高、无法快速预测、对特征工程的依赖等种种缺陷,实现了低成本的快速精确预测;
[0067]
(2)本发明适用于海浪有效波高数据预测,所设计的预测模型采用了cnn神经网络、bilstm神经网络和attention机制相结合的网络结构,具有的优点包括:cnn模型能够充分提取数据的空间局部特征,被广泛运用于图像处理;bilstm模型考虑双向信息流作用,充分提取时序数据关联信息的特征,提高模型预测精度,适用于时间序列数据的预测;attention机制可以对bilstm的预测结果进行评估打分,提取出预测结果中的重要部分。
附图说明
[0068]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0069]
图1为本发明中海浪波高预测方法的流程示意图;
[0070]
图2为cnn-bilstm-attention预测模型的结构图;
[0071]
图3为lstm模型结构图;
[0072]
图4为bilstm网络结构图;
[0073]
图5为实例预测结果展示图;
[0074]
图6(a)-图6(c)为本发明与现有技术有效波高预测效果的对比图;
[0075]
图7为本发明中海浪波高预测系统的结构图。
具体实施方式
[0076]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0077]
实施例1
[0078]
本发明实施例公开了一种基于深度学习模型的海浪波高预测方法,如图1所示,包括以下步骤:
[0079]
(1)获取原始二维海浪有效波高数据;
[0080]
本实施例中所采用的海浪有效波高数据选取的地理范围为东经105
°
至126
°
,北纬4
°
至43
°
的中国近海海域,其包含79
×
43个观测点的观测值组成的二维图数据,其空间分辨率为0.5
×
0.5。
[0081]
(2)对原始二维海浪有效波高数据进行预处理,并将预处理后的海浪有效波高数据作为训练数据集;其中,预处理过程具体包括以下步骤:
[0082]
(2-1)剔除异常波浪值,如负值、不正常的高值等;
[0083]
(2-2)对有效波高的缺失值进行填充,其中,填充方式包括:平均值填充、插值填充等方式;
[0084]
(2-3)对陆地不同的格点数据进行0值填充;
[0085]
(2-4)对填充后的有效波高数据进行归一化,其公式定义如下:
[0086][0087]
式中,x为原始二维海浪有效波高数据,x
min
为输入样本数据x的最小值,x
max
为输入样本数据x的最大值。
[0088]
选取数据预处理后的二维有效波高数据的前70%作为深度学习模型的训练数据集,将后30%作为模型的测试数据集。为了提高模型的预测精度,训练数据集应不小于总样本数据的70%。
[0089]
(3)构建海浪有效波高数据预测模型,将训练数据集输入海浪有效波高数据预测模型中进行深度学习训练,直至达到预设精度,获得最优预测模型;
[0090]
(3-1)由于海浪有效波高受气候影响具有强非线性和强非对称性等特点,与气候状况、季节特征、海底地形优势等多种因素密切相关,因此,构建海浪有效波高数据预测模型为cnn-bilstm-attention的深度学习预测模型,如图2所示,采用了cnn神经网络、bilstm
神经网络和attention机制相结合的网络结构,具有以下优点:cnn模型能够充分提取数据的空间局部特征,被广泛运用于图像处理;bilstm模型考虑双向信息流作用,充分提取时序数据关联信息的特征,提高模型预测精度,适用于时间序列数据的预测;attention机制可以对bilstm的预测结果进行评估打分,提取出预测结果中的重要部分。
[0091]
(3-1-1)cnn神经网络的数学模型为:
[0092]ci
=f(wi*xi bi);
[0093]
式中,xi表示卷积层的输入,ci为第i层的输出特征图,wi表示卷积的权重矩阵,*表示点积,bi为变差向量,f(
·
)表示激活函数。
[0094]
(3-1-2)bilstm神经网络是在lstm网络的基础上增加一个反向的lstm层,即bilstm神经网络的预测结果为lstm网络和反向的lstm层预测结果的结合;其中,lstm模型(参见图3)的数学模型为:
[0095]ft
=σ(wf[h
t-1
,x
t
] bf);
[0096]it
=σ(wi[h
t-1
,x
t
] bi);
[0097]at
=tanh(wa·
[h
t-1
,x
t
] ba);
[0098]ct
=f
t
·ct-1
i
t
·at

[0099]ot
=σ(wo·
[h
t-1
,x
t
] bo);
[0100]ht
=o
t
·
tanh(c
t
);
[0101]
式中,f
t
表示lstm算法的遗忘门的控制向量,它决定过去状态对当前状态的影响;σ(
·
)和tanh(
·
)分别表示sigmoid和tanh激活函数;wf、wi、wa和wo表示权重;h
t-1
为第t-1个神经元的输出,x
t
为第t个神经元的输入;bf、bi、ba和bo表示偏差;i
t
表示输入门的控制向量,它决定当前新输入的a
t
的接受程度;a
t
表示当前时刻的新输入状态;c
t
表示第t个神经元的细胞状态,c
t-1
表示第t-1个神经元的细胞状态,o
t
表示输出门的输出结果;
[0102]
将o
t
和tanh(c
t
)进行点积操作后得到最终的输出结果h
t

[0103]
(3-1-3)attention机制的数学模型为:
[0104]
m=tanh(y);
[0105][0106]
a=yα
t

[0107]
式中,m表示经过tanh函数的输出,y表示经过bilstm神经网络所捕获的特征矩阵,α表示经过sigmoid函数得到的注意力权重矩阵,表示权重矩阵的转置,a为经过注意力机制处理后的输出结果。
[0108]
(3-2)使用训练数据集完成模型训练使之达到指定精度,根据预先设定的预测时间步将输入的二维有效波高数据分组,每一组二维有效波高数据产生一个预测值;根据预先设定的预测时间间隔设定训练标签,确定模型的训练方向,具体训练过程如下:
[0109]
(3-2-1)对训练数据集进行二维卷积,二维卷积可以考虑海浪有效波高数据的实际空间分布,提取出其中的重要特征,减少冗余信息,提升预测精度。其中,二维卷积层为三层,以便提取到足够抽象的有效波高特征,便于模型预测;每一层过滤器个数为80个,即经过一层卷积层,每一时刻的有效波高数据可以得到80幅有效波高特征图,可以提取足够数量的潜在波浪特征;激活函数为relu函数,该函数可以将小于0的卷积结果设置为0而大于0
的卷积结果保持不变,使卷积结果不会出现异常值同时使神经网络具有良好的非线性拟合能力。
[0110]
(3-2-2)将二维卷积的卷积结果输入bilstm神经网络(参见图4),根据前后时刻数据变化规律进行预测;bilstm考虑双向信息流作用,充分提取时序数据关联信息的特征,提高模型预测精度。其中,bilstm层为两层,包括两个互为反向的lstm网络,二维卷积得到的特征图分别输入两个方向的lstm网络中的,得到两组预测值,一组由过去向前预测,另一组由未来向过去预测,最终输出的结果包含时间序列过去和未来的信息,能够更好反映有效波高数据之间的时序关系,得到准确的预测结果;激活函数选择tanh函数,循环激活函数为sigmoid函数,两者为bilstm网络提供非线性拟合能力,使得预测程序可以采用gpu加速计算,缩短训练时间;经过每层bilstm层,对每个时刻的有效波高产生6幅预测特征图。
[0111]
(3-2-3)在dropout层临时删除神经元,随机丢弃部分特征;dropout层参数设置为0.5,以50%的概率随机临时删除神经元,这样可以减少神经元之间复杂的共适应关系,权参数的更新不依赖于有固定关系的隐含节点的共同作用;防止模型过拟合,使模型泛化性更强。
[0112]
(3-2-4)引入attention机制,对bilstm神经网络的输出信息分配概率权重,为特征图中的重要信息赋予较大权重,提升模型对重要信息的抓取能力。
[0113]
(3-2-5)判断模型及参数是否满足预设精度的要求,若未满足,则对海浪有效波高数据预测模型使用反向传播算法进行参数更新,再继续进行深度学习训练;若满足,则获得最优预测模型。
[0114]
(4)通过最优预测模型进行海浪有效波高预测,并对预测结果进行反归一化,得到海浪有效波高的预测值。
[0115]
在更进一步的实施例中,该方法还包括:采用样本空间的平均绝对误差、均方根误差、平均相关系数对海浪有效波高的预测值进行误差分析;
[0116]
其中,样本空间内,每一时刻预测值与真实值的平均绝对误差为:
[0117][0118]
样本空间内,单一时刻预测值与真实值的均方根误差均值为:
[0119][0120]
样本空间内,每一时刻预测值与真实值的平均相关系数为:
[0121][0122]
式中,k为测试样例时间序列长度,即测试样例数量;i表示纬向总格点数;j表示经向总格点数;h
p
(i,j)表示空间某点基于cnn-bilstm-attention预测的有效波高值;hm(i,j)表示空间对应h
p
(i,j)格点位置的真实值;n为个例总数。
[0123]
本发明实施例还公开了一种计算机可存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以上所述海浪波高预测方法的步骤。
[0124]
下面通过具体实施案例对实施例1中海浪波高预测方法进行进一步了解。
[0125]
采用2011-2020年noaa发布的ww3第三代波浪数值模式的再分析产品中的海浪有效波高数据作为实验数据集。选用数据的地理范围为东经105
°
至126
°
、北纬4
°
至43
°
的中国近海海域有效波高数据,空间分辨率为0.5
°×
0.5
°
,选用的时间跨度为2011-2020年。考虑到波浪的时效性,本研究中所使用的输入数据均为三个连续时刻的波浪场数据,并根据预报时间步长(例如:1h、2h、3h)的不同以及数据时间跨度的不同,将该数据集的前70%作为训练样本和验证样本,后30%作为测试样本。在一般海况的有效波高预报中,使用的测试数据集均为2018年6月14日12:00到2020年12月31日23:59的有效波高数据,这一部分数据均没有参与模型的训练,以确保训练和测试的相对独立性。预测结果如下表所示:
[0126][0127]
为了进一步展示模型的预测结果,选取预测结果的个例进行展示,如图5所示,(a-e)为2020年5月20日中午11:00、12:00、13:00时的有效波高数据向后预测1小时、3小时、6小时、12小时、24小时的有效波高空间分布图;(f-j)为ww3的有效波高空间分布图;(k-o)为五个时刻预测值与真实值的绝对误差空间分布图。由图5可以看出,随着预测时间跨度的增加,预测误差逐渐增大。
[0128]
图6(a)-图6(c)为本发明与已有技术的对比,本发明优于已有有效波高预测技术。从图6(a)可以看到,在前12h的预测中cnn-bilstm算法和cnn-bilstm-attention算法预测的相关性相当,在12h-24h预测中,cnn-bilstm-attention算法相关性更高,优于convlstm算法和cnn-bilstm算法。从图6(b)和图6(c)中可以看到,整体上来看,cnn-bilstm-attention算法最优,cnn-bilstm算法优于convlstm算法。6h以内的预测,cnn-bilstm-attention明显优于cnn-bilstm算法,在6h后cnn-bilstm-attention算法的预测性能比cnn-bilstm算法有一定的优势,均优于convlstm算法。
[0129]
实施例2
[0130]
本发明实施例公开了一种基于深度学习模型的海浪波高预测系统,参见图7,包括:
[0131]
采集模块,用于获取海浪波高的图片数据;
[0132]
预处理模块,用于对海浪波高的图片数据进行预处理,并将预处理后的海浪波高的图片数据作为训练数据集;
[0133]
构建模块,用于构建海浪有效波高数据预测模型;
[0134]
训练模块,用于将训练数据集输入海浪有效波高数据预测模型中进行深度学习训练,直至达到预设精度,获得最优预测模型;
[0135]
预测模块,通过最优预测模型进行海浪有效波高预测,并对预测结果进行反归一化,得到海浪有效波高的预测值。
[0136]
现有技术在海浪预测上往往只能进行单个观测点的时序预测,很少有直接对二维观测数据进行处理;而且,现有的预测技术还具有计算量大、计算时间长、收敛困难等缺陷。而通过本发明中的技术方案能够解决现有预测技术的计算量大、成本高、无法快速预测、对
特征工程的依赖等缺陷,进而实现低成本的快速精确预测。
[0137]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0138]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献