一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于强化学习的船舶运动大多步实时预测混合方法及系统

2022-05-26 13:38:47 来源:中国专利 TAG:


1.本发明涉及船舶运动姿态预测方法,尤其涉及一种基于实时分解、强化学习和误差修正的船舶姿态大多步预测方案。


背景技术:

2.船舶在海上作业过程中,会产生横摇、横荡、纵摇、纵荡、升沉、艏摇六自由度运动,其中,横摇、纵摇对海上作业安全与船舶运行性能的影响最大。如果能够提前10~30秒预测船舶横摇、纵摇的变化,相应的船员和船舶作业系统就能提前做出合理的决策,提高船舶在海上航行的稳定性和可靠性,同时提高海上作业的安全性和工作效率。不仅如此,实时的船舶姿态预测模型可以为获取摇晃信息提供可靠的指导,从而更大程度地减小横摇、纵摇对船舶造成的负面影响。因此,建立准确的船舶姿态大多步实时预测模型具有重要意义。
3.为了实现船舶姿态多步实时预测模型,许多学者进行了大量的研究。随着计算机时代的到来,神经网络能够较好的拟合船舶姿态的非线性映射,在船舶姿态多步实时预测中有良好的表现。由于船舶姿态数据映射关系的复杂性,短期实时预测(10~30秒)比极短期实时预测(10秒以内)更加困难和复杂。单一模型预测性能略显不足。为了更好的实时预测大多步船舶姿态,结合分解技术、集成技术等的混合模型得到了广泛的应用。其中,强预测器比基本预测器更能学习到时间序列的非显著相关性。由于船舶姿态具有不平稳、波动大和高随机等特性,导致预测模型很难完整的学习船舶姿态变化规律,少部分规律信息隐含在预测误差中,所以误差修正模型也被广泛应用于大多步时间序列混合预测模型中。因此,本发明希望能够提高神经网络模型的预测能力,实现对船舶运动数据高精度的大多步实时预测。


技术实现要素:

4.本发明的目的是针对目前船舶运动姿态预测精度较低的问题,提供一种基于实时分解、强化学习和误差修正的船舶姿态大多步预测方案。
5.本发明提供的一种基于强化学习的船舶运动大多步实时预测混合方法,包括如下步骤:
6.与现有技术相比,本发明具有以下优点和有益效果:
7.1.对训练数据集和预测数据集分别进行wpd实时分解,将船舶运动数据高低频分量分解为固定层数的子序列,提升了模型学习子序列变化规律和船舶姿态的映射关系的能力;
8.2.建立多输入多输出策略的orelm基础预测模型,避免了多步预测的误差累计。并引入adaboost.mrt算法,克服了orelm模型预测结果不稳定的问题,同时增强了单个orelm在大多步预测中对船舶姿态序列的学习能力;
9.3.对大多步预测误差建立lssvm误差修正模型,误差修正模型能够进一步提取包含在大多步误差序列中少部分船舶运动数据的变化规律,实现对船舶运动数据更加完整的
学习和大多步预测。
附图说明
10.图1是本发明实施例所提预测模型完整结构图。
具体实施方式
11.下面将结合实施例和附图,对本发明的技术方案进行清楚、完整地描述。
12.参见图1,本发明实施例基于实时分解、强化学习和误差修正,提供的船舶姿态大多步预测方法的步骤如下:
13.步骤1:由船舶上安装的姿态传感器获取原始船舶运动数据,将原始船舶运动数据划分为训练数据集和预测数据集;
14.数据集的70%作为训练集,用于训练初始orelm模型以及adaboost.mrt算法强化orelm;30%作为预测集,预测数据集再划分为验证集和测试集,验证集和测试集各占15%,验证集预测误差用于建立误差修正模型;测试集用于验证所提模型的预测性能。实施例中数据集总长度为1800秒。
15.步骤2:单独对步骤1)划分好的训练数据集和预测数据集进行实时小波包分解(rtwpd),将船舶运动数据的高频分量和低频分量分解为固定层数的子序列,优选地,所述高频分量子序列固定层数为4,低频分量子序列固定层数为4;这样,其中低频分量的每个子序列的波动性更小,高频分量变化规律之间的映射关系更易被后续强化后的模型学习;
16.本发明提出的实时小波包分解(rtwpd)方法,是在现有小波包分解(wpd)技术基础上的改进:首先对原始数据进行划分数据集,所述划分过程包括训练集,验证集,测试集;其中,对训练集进行小波包分解(wpd);而当姿态传感器获取新数据时,即为验证集,再对验证集进行小波包分解,分解后的子序列送入训练完成的各预测模型;重复上述操作,即可完成实时小波包分解(rtwpd)。
17.实施例中,实时小波包分解rtwpd的分解步骤如下:
18.step 1:设置分解等级设置为3,小波基函数选择db10;构建23个小波包子空间,并构造对应的高通滤波器组和低通滤波器组,具体表示如下:
[0019][0020]
其中,h(k)和g(k)分别为平移参数为k的高通滤波器组和低通滤波器组,k为平移参数;表示t时刻的尺度函数,θ(t)表示t时刻的小波变换函数,表示和的内积运算,《θ(t),θ(2t-k)》表示θ(t)和θ(2t-k)的内积运算。
[0021]
step 2:rtwpd将船舶运动序列训练部分s(t)映射到上述子空间中,得到子序列s(3,0)、s(3,1)、s(3,2)、s(3,3)、s(3,4)、s(3,5)、s(3,6)、s(3,7),每个子序列的长度都为1260秒,具体分解算法如下:
[0022][0023]
其中,i为分解层,i∈{3,2,1,0};j为频率参数,j∈{6,4,2,0},wk(i,j)表示在第i个分解层,第j个分解频带,平移参数为k的小波系数;
[0024]
step 3:获取新的数据,更新训练部分s(t),重复step 1-2,直到1800秒的数据全部获得。
[0025]
现有一次分解技术,包括wpd,在实际情况中无法获取未来数据,存在数据泄漏,而本发明提出的实时小波包分解可不断更新未来数据,训练时仅使用已知数据,符合船舶预测实际应用。
[0026]
步骤3:对步骤2)分解得到的每个子序列建立离群点鲁棒极限学习机(orelm)基础预测模型,并引入adaboost.mrt强化学习算法,通过不断迭代训练orelm,将多个训练好初始权值和偏置的orelm模型组合在一起,得到强化后的orelm模型,克服了原始的基础orelm模型预测结果不稳定的问题,同时增强了单个orelm在大多步预测中对船舶姿态序列的学习能力;
[0027]
为便于实施参考起见,以下介绍orelm预测模型原理:
[0028]
orelm在极限学习机(elm)的基础上,采用l1范数与elm模型相结合,以减少异常值的干扰,通过引入调节参数c,权衡训练误差与输出权重,以此提高orelm模型的泛化性能以及对异常值的鲁棒性。
[0029]
orelm的损失函数如下式所示:
[0030][0031]
s.t y-hβ=e
[0032][0033]
其中,y为目标矩阵,h为输出矩阵,β为输出权重,e为训练误差,||
·
||0为l0范数,||
·
||1为l1范数,为l2范数,λ为拉格朗日乘子,μ是误差函数,l(e,β,λ)是增广拉格朗日函数。在增广拉格朗日乘子中,通过重复最小化完整拉格朗日函数过程,对变量e、β和λ进行最优估计。综上,增广拉格朗日乘子变为以下形式:
[0034][0035]
其中,τ为迭代次数,β
τ
为迭代第τ次的输出权重,e
τ
为迭代第τ次的训练误差,λ
τ
为迭代第τ次的拉格朗日乘子,表示当l(e
τ
,β,λ
τ
)达到最小时β的取值,表示当l(e,β
τ 1

τ
)达到最小时e的取值,β
τ 1
为迭代第τ 1次的输出权
重,e
τ 1
为迭代第τ 1次的训练误差,λ
τ 1
为迭代第τ 1次的拉格朗日乘子。
[0036]
在确定好训练样本(x1,y1),(x2,y2),...,(xn,yn),其中x1,x2,...,xn表示输入变量,y1,y2,...,yn表示输出变量,调节参数c后,本发明提出的orelm-adaboost.mrt算法(即adaboost.mrt强化学习算法)步骤如下:
[0037]
step 1:随机生成隐含层参数(wi,bi),i=1,2,...,l,wi为第i个神经元数的隐含层权重值,b为第i个神经元数的隐含层偏置值,i表示隐含层神经元数;l为隐含层神经元总数;并初始化最大迭代次数m、阈值参数和训练集每个样本的权重dm(j)为第m次迭代中第j个样本权重n为训练样本总数,m表示迭代次数,令m=1;将训练样本(x1,y1),(x2,y2),...,(xn,yn)按照权重dm分布,得到训练样本xm表示第m次迭代的输入变量,ym表示第m次迭代的输出变量;
[0038]
本步骤是本发明提出的改进,可以使得每个训练样本都按照最佳预测结果的权重进行集成,所述最佳预测结果优于未按照权重分布集成的预测结果。
[0039]
step 2:orelm基于第m次迭代的训练样本计算第m次迭代的输出权重βm,训练误差em,拉格朗日乘子λm;得到第m次迭代的预测模型fm(g),并将训练样本数如代入预测模型fm(g),得到预测输出
[0040]
step 3:将预测输出与样本输出ym相减,得到第m次迭代的预测误差errorm(j),errorm(j)表示第m次迭代第j个样本的预测误差值,并与阈值进行比较,将所有大于阈值的误差errorm(j),其对应的权重进行相加,记为εm,计算如下:
[0041][0042]
其中,εm为第m次迭代所有大于阈值的误差errorm(j),其对应的权重进行相加的结果;
[0043]
本步骤是本发明提出的改进,因为所得样本的预测误差值还存在可预测信息,可以进一步修正预测结果。
[0044]
step 4:根据预测误差errorm(j),更新权重dm(j),计算如下:
[0045][0046]
其中,zm是权重的归一化因子;dm(j)表示在i时刻的第m次迭代权重,d
m 1
(j)为第m 1次迭代的权重;
[0047]
step5:令m=m 1,重复step2~step5,直到达到最大迭代次数m,输出m个orelm-adaboost.mrt预测模型,完成建模。
[0048]
步骤4:最后将子序列的预测结果重构得到模型大多步初始预测结果大多步初始预测结果与实际结果y(t),t=1261,1262,...,1800相减得到大多步预测误差res(t),t=1261,1262,...,1800;对大多步预测误差res(t)建立最小二乘支持向量机(lssvm)误差修正模型,误差修正模型能够进一步提取包含在大
多步误差序列res(t)中少部分船舶运动数据的变化规律,进而对大多步初始预测结果进行修正。
[0049]
lssvm是支持向量机(svm)的变体,以缺失svm中的稀疏性特征为代价,引入最小二乘函数和等式化约束,避免了svm中二次规划的问题。lssvm将非线性二次优化问题变成线性问题求解,在不影响预测精度的前提下,降低了svm算法复杂度,大大提升了模型计算速度,对船舶运动实时预测模型误差序列的估计有一定帮助。
[0050]
采用lssvm建立误差修正模型具体步骤如下:
[0051]
step 1:lssvm通过非线性映射将预测误差数据映射到高维空间,从而将非线性回归问题转化为线性回归问题。回归方程表示如下:
[0052][0053]
其中,x
res
(i)表示在i时刻的预测误差输入,res表示预测误差,y(x
res
)为预测误差的拟合输出,为预测误差的高维非线性映射,ω表示权值向量,b表示偏差向量,t表示转置。
[0054]
step 2:将lssvm回归方程的求解可以转化为以下优化问题:
[0055][0056]
s.t
[0057]
其中,j(ω,e)为权值向量ω和回归误差ei有关的目标函数,ei表示在i时刻的回归误差,c'是惩罚参数,l为样本对的总数,是约束条件。
[0058]
step 3:利用结构风险最小化法,给出目标函数和约束条件的拉格朗日函数为:
[0059][0060]
其中,l(ω,b,e,α)是与权值向量ω、偏置向量b、回归误差e以及拉格朗日乘子α有关的拉格朗日函数,α为拉格朗日乘子。
[0061]
step 4:通过对上述变量求偏导,可以得到上述拉格朗日函数的解。得到lssvm的回归方程如下:
[0062][0063]
其中,为误差的预测值,k(x
res
(i),x
res
)为核函数,x
res
(i)表示第i个样本对的误差输入,x
res
表示全部的误差输入。
[0064]
step 5:对大多步初始预测结果进行修正,得到最终的船舶运动大多步预测结果并输出,所述大多步最终预测结果包括10步预测、20步预测和30步预测,所述模型的最终预测结果由表1所示,通过相应误差可知,该模型在实际应用中是可行的和稳定的,并可以为海上作业提供实时的可靠指导。
[0065][0066]
其中,是为最终预测结果,为时刻t的误差预测值。
[0067]
本步骤是本发明提出的改进,所述对应权重相加后,即完成误差修正过程。
[0068]
为了便于理解本发明的技术效果,提供实施例的相应分析结果如下:
[0069]
表1
[0070] 平均绝对误差(度)平均绝对百分比误差(%)均方根误差(度)10步预测0.160536.020.202120步预测0.163838.140.204330步预测0165842.640.2095
[0071]
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
[0072]
在一些可能的实施例中,提供一种基于强化学习的船舶运动大多步实时预测混合系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种基于强化学习的船舶运动大多步实时预测混合方法。
[0073]
在一些可能的实施例中,提供一种基于强化学习的船舶运动大多步实时预测混合系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种基于强化学习的船舶运动大多步实时预测混合方法。
[0074]
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献