一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于事件驱动的无人机吊挂系统在线轨迹规划方法与流程

2021-12-08 01:17:00 来源:中国专利 TAG:

技术特征:
1.一种基于事件驱动的无人机吊挂系统在线轨迹规划方法,其特征是,将吊挂系统负载摆角的动力学方程转换成非线性仿射系统的形式,在此基础上引入折现代价函数和强化学习机制,通过神经网络逼近的方法来求解负载摆角抑制的最优控制问题。2.如权利要求1所述的基于事件驱动的无人机吊挂系统在线轨迹规划方法,其特征是,具体步骤如下:步骤1)确定四旋翼无人机吊挂系统的坐标系定义;四旋翼无人机吊挂系统坐标系定义:{i}={x
i
,y
i
,z
i
}表示固定在大地的惯性坐标系,{b}={x
b
,y
b
,z
b
}表示无人机的机体坐标系,x
i
、y
i
、z
i
(i=i,b)分别对应坐标系三个主轴方向的单位矢量;步骤2)确定四旋翼无人机吊挂系统的动力学模型;通过分析四旋翼无人机吊挂系统的二维模型,采用欧拉

拉格朗日方法对系统进行建模,通过计算可以得到系统的动力学表达式如下其中,表示系统的状态向量,y(t)、z(t)分别表示四旋翼无人机在y、z方向的位移,γ(t)表示负载摆角在y、z平面上的分量,f
q
=[f
y
,f
z
,0]表示系统的控制输入,f
y
、f
z
分别表示无人机在y、z方向的升力,f
d
=[d
y
,d
z
,d
γ
]表示系统受到的未知外界扰动,d
y
、d
z
、d
γ
分别表示系统受到的外界扰动在y、z、γ方向的分量,m(q)、分别表示四旋翼无人机吊挂系统的惯性矩阵、向心力矩阵以及重力向量,表示实数域,式(1)中m(q)的表达式为表示实数域,式(1)中m(q)的表达式为的表达式为g(q)的表达式为g(q)=[0 (m
l
m
q
)g m
l
glsinγ]
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,表示吊挂负载质量,表示无人机质量,表示绳长;步骤3)定义系统折现代价函数和最优控制律;将式(1)展开可得负载摆动运动的动力学方程如下输入仿射形式的动力系统在文献和工程中是常见的,将上式整理为如下的连续时间非线性仿射系统形式
其中,为等效状态向量,为非线性仿射系统的等效输入,在上式中f(x)的表达式为g(x)的表达式为f(
·
)与g(
·
)满足局部李普希兹(lipschitz)连续条件,设t=0时,x(0)=x0,且x=0为系统平衡点,此时f(0)=0,在最优调节设计中,针对特定的代价函数来设计状态反馈控制律u(t),选取为正定常数矩阵,为hermite正定常数阵,定义函数r(x(τ),u(τ))如下r(x(τ),u(τ))=x
t
(τ)qx(τ) u
t
(τ)ru(τ)
ꢀꢀꢀ
(9)定义折现代价函数v(x(t),u(t))如下其中,η>0为折现因子,用来调节收敛速率,e为自然常数,后文v(x(t),u(t))简写为v(x(t))或者v(x),对于控制输入u(t),若代价函数连续且可微,则经过适当的数学变换,获得上式中非线性lyapunov方程的无穷小形式如下式所示其中,定义系统(6)的哈密尔顿量为据贝尔曼最优准则,最优代价函数v
*
(x)的表达式为上式满足hamilton jacobi bellman方程,即将最优控制律u
*
(x)设计为根据以上最优控制律,上述的hjb方程可改写为
因为r为hermite正定阵,满足(r
‑1)
t
=r
‑1,上式可化为上式为基于时间的经典hjb方程,即步骤4)设计事件驱动机制;定义一个单调递增的触发序列s
i
为i∈n的第i个连续采样时刻,采样输出为采样状态的一个序列,对于所有t∈[s
i
,s
i 1
]有定义事件驱动的误差函数为当t=s
i
时,e
i
(t)=0,在每个触发时刻,系统状态是采样的,e
i
(t)复位为0,反馈控制律得到更新,控制序列通过零阶保持器可成为一个分段的连续时间信号,将上述事件触发机制与式(15)中的最优控制律设计相结合,可得如下的控制设计其中,步骤5)设计自适应评价网络;据神经网络的逼近策略,最优代价函数v
*
(x)可重构为其中,为理想权值向量,为激活函数,为重构误差,n
c
为隐含层中神经元的数量,可得上式的梯度向量为因为ω
c
未知,采用评价网逼近上述重构后的最优代价函数,可得近似最优代价函数为其中,为估计权值向量,可得采用逼近策略重构,式(20)可改写为采用评价网逼近上述表达式可得基于事件驱动的近似最优控制律为
由以上可得近似哈密尔顿量为考虑到定义将上式中的e
c
(t)对的偏导数定义为ρ(t),即其中,求得如下等式迭代更新评价网权值使得目标函数最小化,这里采用归一化梯度下降算法,可得评价网络输出权值的更新率为其中,α
c
>0为设计的评价网学习率增益;引入一个额外的lyapunov候选函数v
s
(x)来改进评价网的学习准则,并利用它来调节评价网的权值向量,令v
s
(x)为保证时间导数为负的连续可微lyapunov候选函数,即据状态向量选择多项式来确定v
s
(x),可选取v
s
(x)=(1/2)x
t
x;当使用式(20)中的基于事件驱动的最优控制律时,为使系统稳定,即需要引入一个额外的项通过沿着的负梯度方向调整来加强训练过程,为此,据式(26)中的基于事件驱动的近似最优控制律,可利用链式法则得到以下梯度下降运算其中,α
s
>0为正常数,综上所述,评价网输出权值更新率由两部分组成,即
可得本发明的评价网输出权值更新率为定义评价网输出权值的估计误差为为使评价网输出权值估计误差一致最终有界,针对系统状态,需要选取适当的采样频率来获得采样输出作为评价网络的输入,使得||e
i
(t)||2满足下式上式定义为事件驱动的触发条件,其中,ψ为正常数,φ∈(0,1)是设计的参数,常量ξ=||θ2||r
‑1||2,正定矩阵满足r=θ
t
θ;步骤6)轨迹规划设计;定义四旋翼无人机规划的期望轨迹与标称轨迹的误差信号如下本发明的四旋翼无人机期望轨迹的加速度与设计为如下形式上式中的为减摆设计,与为保证系统稳定的辅助函数,k
γ
、及为正常数增益,标称轨迹与保证了四旋翼无人机能准确到达目标位置,标称轨迹要满足如下条件:(1)y
t
(t)、z
t
(t)在有限时间收敛到目标位置,(2)y
t
(t)、z
t
(t)的一二阶导数均能随时间收敛到0,且二阶导数的绝对值与一阶导数均是有上界的正实数,(3)初始值应满足当t=0时,y
t
(t)、z
t
(t)及其一阶导数均为0;选用如下的s形曲线作为标称轨迹其中c
y
、c
z
、n
y
、n
z
、υ、p
y
及p
z
为设计的正常数;步骤7)位置跟踪控制律设计;为使吊挂系统沿着规划的期望轨迹运动,定义四旋翼无人机实时位置与规划的轨迹之
间的误差如下选取如下的类pd控制器作为轨迹跟踪控制器其中,及为pd控制器的控制增益,均为正常数,与表示四旋翼无人机在y和z方向上的实时速度分量。

技术总结
本发明属于四旋翼无人机吊挂系统轨迹规划技术领域,为针对吊挂系统空运过程中减小吊挂负载摆动以及降低机载处理器计算负担的需求,提出一种在线轨迹规划方法。本发明在此基础上本发明采用的技术方案是,基于事件驱动的无人机吊挂系统在线轨迹规划方法,将吊挂系统负载摆角的动力学方程转换成非线性仿射系统的形式,引入折现代价函数和强化学习机制,通过神经网络逼近的方法来求解负载摆角抑制的最优控制问题。本发明主要应用于四旋翼无人机吊挂系统轨迹控制场合。吊挂系统轨迹控制场合。吊挂系统轨迹控制场合。


技术研发人员:鲜斌
受保护的技术使用者:天津大学
技术研发日:2021.09.23
技术公布日:2021/12/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献