一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于遗忘因子高阶迭代学习的推进器控制方法及系统

2022-08-13 16:33:02 来源:中国专利 TAG:


1.本发明属于轨迹跟踪控制领域,尤其涉及基于遗忘因子高阶迭代学习的推进器控制方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.海洋机器人工作环境复杂多变,而且系统是一个典型的高度非线性、强耦合的运动学以及动力学系统,其高精度控制问题一直是控制领域研究的热点。现阶段的海洋机器人轨迹跟踪的精确控制方法有滑模控制、鲁棒控制、整数阶学习控制等;然而,滑模控制和鲁棒控制控制方法均为基于模型控制,海洋机器人实际运行过程中难以对复杂环境下系统精准建模;整数阶迭代学习控制可控参数少,达不到迅速准确。
4.分数阶迭代学习控制不仅拥有整数阶迭代学习控制非常简单的方式和需要较少的先验知识的优势,还增加了参数的控制,因此得到了广泛的研究和应用。现有的控制方法可以实现机器人对期望轨迹的完全跟踪,然而当系统要求提高收敛速度,迅速达到轨迹跟踪控制的精度时,现有的方法适应性较差,不能满足要求;另一方面,现有学习控制方法均为单阶算法,其不能充分完全多次利用以前的信息,使得控制器的稳定性以及自适应性不强。
5.发明人发现,目前的方案中存在以下技术问题:
6.公开号为cn106393116a的发明专利虽然可以进行轨迹跟踪,但其是直接基于运动模型获取实际运动轨迹无法充分考虑水下环境对系统的外界影响,与实际的运动模型会存在较大差异,无法准确的描述海洋机器人推进器的运动轨迹。
7.另外,当系统变为复杂的非线性系统以及存在外界扰动时,仍然采用线性系统的时滞轨迹跟踪控制方法获取实际运动轨迹,会出现发散时效,进而无法完成轨迹的有效跟踪。


技术实现要素:

8.为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于遗忘因子高阶迭代学习的推进器控制方法及系统,其为了解决系统变为复杂的非线性系统以及存在外界扰动时,通过设计遗忘因子分数阶高阶迭代学习控制器完成轨迹的有效跟踪。
9.为了实现上述目的,本发明采用如下技术方案:
10.本发明的第一个方面提供基于遗忘因子高阶迭代学习的推进器控制方法,包括如下步骤:
11.以推进器为运动控制对象,基于坐标系以及推进器的特性构建推进器系统的运行动力学模型;
12.预设推进器系统的期望轨迹,依据推进器系统输出的与期望轨迹的误差信息、遗
忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器;
13.初始化推进器系统的运行动力学模型,依据收敛性条件调整遗忘因子分数阶高阶迭代学习控制器,通过控制器作用于推进器系统,获取推进器系统的实际运行轨迹;
14.判断推进器系统的实际运行轨迹是否满足期望轨迹,若是,获得期望的实际运动轨迹,否则根据实际运行轨迹和期望轨迹的误差,通过分数阶微积分变换后修正所述控制器直至完成推进器系统的轨迹跟踪。
15.本发明的第二个方面提供基于遗忘因子高阶迭代学习的推进器控制系统,包括:
16.动力学模型构建,被配置为:以推进器为运动控制对象,基于坐标系以及推进器的特性构建推进器系统的运行动力学模型;
17.控制器构造,被配置为:预设推进器系统的期望轨迹,依据推进器系统输出的与期望轨迹的误差信息、遗忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器;
18.实际运行轨迹获取模块,被配置为:初始化推进器系统的运行动力学模型,依据收敛性条件调整遗忘因子分数阶高阶迭代学习控制器,通过控制器作用于推进器系统,获取推进器系统的实际运行轨迹;
19.判断推进器系统的实际运行轨迹是否满足期望轨迹,若是,获得期望的实际运动轨迹,否则根据实际运行轨迹和期望轨迹的误差,通过分数阶微积分变换后修正所述控制器直至完成推进器系统的轨迹跟踪。
20.本发明的第三个方面提供一种计算机可读存储介质。
21.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于遗忘因子高阶迭代学习的推进器控制方法中的步骤。
22.本发明的第四个方面提供一种计算机设备。
23.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于遗忘因子高阶迭代学习的推进器控制方法中的步骤。
24.与现有技术相比,本发明的有益效果是:
25.本发明为了解决现有技术直接基于运动模型获取实际运动轨迹无法充分考虑水下环境对系统的外界影响,与实际的运动模型会存在较大差异,无法准确的描述海洋机器人推进器的运动轨迹,通过构造遗忘因子分数阶高阶迭代学习控制器获取推进器的运动轨迹,在控制器中运用了当前误差信息,还增加了前期数据信息,增加了可调参数变量,保证了系统的收敛性,消除了海洋环境扰动对系统的影响,使得控制器的控制律具有更好的稳定性和适应性。
26.本发明有效地利用了遗忘因子分数阶高阶迭代学习律较传统迭代学习在调节跟踪学习单调收敛上的独特优势,此外还增加了误差信息的次数以及可调参数,提高了收敛速度,消除外界扰动,使得海洋机器人能够快速的实现轨迹跟踪任务。
27.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
28.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
29.图1是本发明的一种海洋机器人遗忘因子分数阶高阶迭代学习律控制器的设计方法流程图;
30.图2表示海洋机器人水下运动的坐标系;
31.图3是本发明的遗忘因子分数阶高阶迭代学习控制原理流程图;
32.图4是随着迭代次数的增加海洋机器人轨迹跟踪误差曲线图;
33.图5(a)和图5(b)是迭代15次时的海洋机器人轨迹跟踪结果。
具体实施方式
34.下面结合附图与实施例对本发明作进一步说明。
35.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
36.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
37.正如背景技术中提及的当系统变为复杂的非线性系统以及存在外界扰动时,仍然采用线性系统的时滞轨迹跟踪控制方法获取实际运动轨迹,会出现发散时效,进而无法完成轨迹的有效跟踪的问题,本发明提供了基于遗忘因子分数阶高阶迭代学习的海洋机器人推进器控制方法及系统,运用当前以及前期所有误差信息以及遗忘因子对海洋机器人推进器的控制进行调整,达到精确跟踪,提升自适应能力。
38.实施例一
39.如图1所示,本实施例提供基于遗忘因子高阶迭代学习的推进器控制方法,包括如下步骤:
40.步骤1:以推进器为运动控制对象,基于坐标系以及推进器的特性构建推进器系统的运行动力学模型;
41.步骤2:预设推进器系统的期望轨迹,依据推进器系统输出的与期望轨迹的误差信息、遗忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器;
42.步骤3:初始化推进器系统的运行动力学模型的输入量,依据收敛性条件调整遗忘因子分数阶高阶迭代学习控制器的控制律,将该控制律作用于推进器系统,获取推进器系统的实际运行轨迹;
43.步骤4:判断推进器系统的实际运行轨迹是否满足期望轨迹,若是,获得期望的实际运动轨迹,否则根据实际运行轨迹和期望轨迹的误差,通过分数阶微积分变换后修正遗忘因子分数阶高阶迭代学习控制器直至完成推进器系统的轨迹跟踪。
44.为了更清楚地理解本发明的技术方案,本实施例以海洋机器人为例进行说明,海洋机器人通过水中进行运动,相比地面运动还要考虑浮力重力以及阻力等外界环境因素的
影响,依据构建的坐标系统以及推进器的动力学方程可以选用合适的推进器,因此可选定海洋机器人推进器为该系统坐标下的运动分析对象。
45.步骤1:所述坐标系包括固定坐标系和运动坐标系,以海岸固定点为固定坐标系,以推进器质点为运动坐标系构建推进器系统的运行动力学模型;
46.构建6自由度刚体运动海洋机器人动力学模型,由3个方向按轴向运动,3个自由度按轴旋转,由拉格朗日-欧拉法得到该6自由度的海洋机器人动力学模型为:
[0047][0048]
式中,表示固定坐标系下的海洋机器人位置姿态向量;ν=[u v ω p q r]
t
表示运动坐标系下机器人的线速度以及角速度向量;j(η)表示转换矩阵;m表示惯性矩阵;c(ν)表示科氏向心力距;d(ν)表示流体阻力力矩;g(η)表示重力与浮力共同作用下的力矩阵;τ表示海洋机器人推进器产生的力矩向量,表示固定坐标系下的海洋机器人位置速度矢量。
[0049]
海洋机器人在水下做6个自由度的运动,其运动方式可以可看作简单的自由运动,且自由度之间耦合性小。在构架坐标系下运用雅克比矩阵以及拉格朗日公式得到相应的动力学运动特性,能够在构建的坐标系下准确得到海洋机器人的运动学以及动力学特性,为推进控制器的设计提供了保障。
[0050]
如图3所示,步骤2:预设推进器系统的期望轨迹yd(t),依据推进器系统输出的与期望轨迹的误差信息、遗忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器,具体为:推进器的当前时刻输入量等于初始输入量的γ倍、前一时刻输入量的(1-γ)倍以及所有前期跟踪误差分数阶变换后学习项之和;其中,跟踪误差为推进器的当前时刻位置与预设海洋机器人推进器的期望运动轨迹之差,且跟踪误差学习项等于跟踪误差的α次分数阶微分总和的kd倍;
[0051]
因此构建的控制器的表达式为:
[0052][0053]
其中,uk(t)为海洋机器人推进器的当前时刻输入量;u0(t)为海洋机器人推进器初始时刻输入量;u
k-1
(t)为海洋机器人推进器前一时刻输入量;ek(t)=yd(t)-yk(t)为跟踪误差,其为海洋机器人推进器的当前时刻位置与海洋机器人推进器的期望运动轨迹之差,且跟踪误差学习项等于跟踪误差的α次分数阶微分总和的kd倍;α和kd均为分数阶高阶迭代学习控制律的参数,α∈(0,1),kd为任意正数,γ为遗忘因子,满足γ∈[0,1];
[0054]
为实现海洋机器人的精准控制,消除海洋环境扰动对系统的影响,依据推进器控制输出的误差信息、遗忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器。
[0055]
步骤3:初始化推进器系统的运行动力学模型的输入量u0(t)以及初始化状态向量η0(t)、v0(t)以及遗忘因子分数阶高阶迭代学习控制器的参数;
[0056]
在具体实施过程中,可以利用数据采集装置来海洋机器人的实际运动轨迹yk(t),然后再传送至机器人推进器内。
[0057]
验证遗忘因子分数阶高阶迭代学习控制器的控制律的可行性,对所提出的方法进行系统收敛性验证。
[0058]
若系统满足条件||(1-γ)i-kd∑ρk||《1,其中,i为单位矩阵,sup为表示取值的上限,g(η)为表示重力与浮力共同作用下的力矩阵,ξ为[0,1]的系数,λ为(0, ∞)参数,t为迭代一次周期,则设计的控制器有效。ξ=||(1-γ)i-kd∑ρk||《1,ξ越小,得到的控制收敛速度越快,效果越好。
[0059]
步骤4中,收集并计算海洋机器人推进器实际运动轨迹与期望运动轨迹两者的误差,并通过分数阶微积分变换后进行修正控制器控制输入获得新的输出。经过反复学习迭代,逐渐消除海洋环境对系统的影响,最终得到海洋机器人轨迹的精准控制。
[0060]
仿真验证:
[0061]
如图2所示,按右手定则建立两个坐标系:静坐标系(e-xyz)和动坐标系(o-x'y'z'),以rov水下机器人运动为例,不考虑水动力损失项d(v)=0及外部干扰力,重心与动坐标系坐标原点重,无横倾或纵倾,浮心与重心重合。则对应水下机器人运动系统(1)的系数矩阵分别为:
[0062][0063][0064][0065]
m=diag{m m
u m m
v m m
ω i
x
m
p iy m
q iz mr};
[0066][0067]
[0068]
τ=τ1 τ2[0069][0070]
其中,m=4kg为机器人的质量,mu、mv、mw分别为移动坐标轴轴线方向产生的附加质量;m
p
、mq、mr分别为沿移动坐标轴旋转方向产生的附加质量,为了方便计算可视为0;i
*
为单位矩阵,b为海洋机器人的浮力,g为重力,可设为b=g;xb、yb、zb为水下机器人浮心坐标,与中心坐标重合为坐标原点[0 0 0];ρ为水密度;cd为无因次阻力系数设为1;s
x'
、sy'、s
z'
分别为水下机器人垂直于x'、y'、z'轴的横断面面积;(ur、vr、wr)为水流相对于机器人的速度0.1m/s;(k
x'
、k
y'
、k
z'
)为阻力矩系数0.1。f
ti
为第i个推进器产生的推力,r
ti
为第i个推进器和与之平行的坐标轴的垂直距离。
[0071]
设定时间区间[0,1]上rov海洋机器人在xoy平面从(0 0 0)点运行,z轴方向参数均为0,x和y方向位的期望轨迹为x(t)=2sin(4πt)cos(2πt)和y(t)=2sin(4πt)cos(πt),系统的初始误差为0;环境扰动为根据设计控制器收敛条件,选取学习控制算法中的学习增益为γ=0.1;α=0.6;kd=1。
[0072]
从图4中可以看到随着迭代次数的增加,两个方向的输出趋向于期望轨迹。图4是x(误差1)和y(误差2)方向位置跟踪误差,且趋向0;图5(a)和图5(b)分别是x和y方向迭代第15次的跟踪效果图,从图5(a)和图5(b)中可以看出,本发明设计的控制器具有较好的控制性能。
[0073]
实施例二
[0074]
本实施例提供基于遗忘因子高阶迭代学习的推进器控制系统,包括:
[0075]
动力学模型构建模块,被配置为:以推进器为运动控制对象,基于坐标系以及推进器的特性构建推进器系统的运行动力学模型;
[0076]
控制器构造模块,被配置为:预设推进器系统的期望轨迹,依据推进器系统输出的与期望轨迹的误差信息、遗忘因子以及相应的分数阶变换构造遗忘因子分数阶高阶迭代学习控制器;
[0077]
实际运行轨迹获取模块,被配置为:初始化推进器系统的运行动力学模型,依据收敛性条件调整遗忘因子分数阶高阶迭代学习控制器,通过控制器作用于推进器系统,获取推进器系统的实际运行轨迹;
[0078]
判断推进器系统的实际运行轨迹是否满足期望轨迹,若是,获得期望的实际运动轨迹,否则根据实际运行轨迹和期望轨迹的误差,通过分数阶微积分变换后修正所述控制器。
[0079]
实施例三
[0080]
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处
理器执行时实现如上述所述的基于遗忘因子高阶迭代学习的推进器控制方法中的步骤。
[0081]
实施例四
[0082]
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于遗忘因子高阶迭代学习的推进器控制方法中的步骤。
[0083]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0084]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0085]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0086]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0087]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random accessmemory,ram)等。
[0088]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献