一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于学习神经网络滑模的航天器编队轨道容错控制方法

2022-08-10 19:40:15 来源:中国专利 TAG:


1.本发明属于航天器故障诊断与容错控制领域,主要涉及基于学习神经网络滑模的航天器编队轨道容错控制方法,可应用于航天器编队系统故障重构与主动容错控制中。


背景技术:

2.随着航天器在通信、遥感等领域发挥着越来越重要的作用,将多颗航天器组成编队代替单一综合性航天器完成复杂的空间任务成为了空间技术发展的重要方向。航天器编队通过策略实现多颗子航天器的功能重组,实现单一航天器很难实现的功能,例如航天器编队系统突破了传统航天器结构大小的限制,使得成员航天器在相当大的范围内分布,可以形成很长的基线;对很多空间探测任务而言,还可以大大提高观测的灵敏度。
3.航天器编队可以通过组网工作满足复杂空间任务的严苛要求,然而在轨成员长时间运行于恶劣太空环境,不可避免地出现异常和故障,特别是姿轨控制分系统。控制系统出现故障会大大降低控制性能,甚至可能导致整个航天器编队失去控制,例如
ꢀ“
龙江一号”由于轨控推力器出现故障,未能及时关机,导致卫星进入了快速旋转状态,最后失联。因此,为了提高航天器编队系统的可靠性和可维护性,需要在航天器编队系统层次实施故障诊断与容错控制的技术方案。专利cn108614420b针对故障星簇级卫星编队系统,提出了基于非线性规划的容错控制方法,该方法通过非线性动态规划技术确定故障星离开及备份星加入的最优轨迹,实现了编队在故障情况下的构型重构。专利cn105404304a针对执行机构故障和输出饱和情况下航天器编队姿态协同控制问题,提出了基于归一化神经网络和滑模变结构的控制方法,以保证航天器编队姿态一致。
4.上述公开专利虽然对航天器编队容错控制方法进行了研究,但并未考虑航天器编队故障诊断与重构,属于被动容错控制范畴。此外,通过对现有技术的调研,并未发现学习神经网络滑模的理论研究以及在航天器编队故障诊断与容错控制方面的应用。本发明在编队层次上为航天器编队容错控制进行了探索,提出了一种新的解决方案,为我国的航天事业提供了必要的技术储备。


技术实现要素:

5.本发明要解决的问题是:考虑到航天器编队系统在轨运行过程中受到的空间环境干扰以及轨控推力器故障情况,提供基于学习神经网络滑模的航天器编队轨道容错控制方法,实现了航天器编队系统推力器故障的鲁棒重构以及编队构型高精度维持控制。
6.技术方案:本发明提供了基于学习神经网络滑模的航天器编队轨道容错控制方法,具体包括如下步骤:步骤1,根据航天器编队系统非线性相对动力学模型,考虑空间摄动d(t)和航天器推力器可能出现的例如阻塞等偏差故障f(t),建立主航天器在圆轨道上的航天器编队系统非线性相对动力学模型;确定系统的状态空间方程中的a、g、b、e、f、c等参数矩阵。
7.步骤2,结合p型迭代学习算法、径向基神经网络和滑模算法,设计一种用于推力器
故障重构的学习神经网络滑模观测器,得到故障重构信号,应用于学习神经网络滑模容错控制律中,以补偿推力器故障给编队构型带来的影响;步骤3,结合学习rbf神经网络模型和滑模控制算法,设计一种基于学习神经网络滑模的航天器编队构型维持容错控制器,并引入步骤2中观测器获取的故障重构信号给学习神经网络滑模容错控制器;步骤4,利用所设计的故障观测器和容错控制器完成闭环控制,实现航天器编队在空间摄动和推力器故障同时存在的条件下对期望标称构型的高精度跟踪保持。
8.作为优选,步骤1中主航天器在圆轨道上的航天器编队系统非线性相对动力学模型具体为:其中,q=[q
1t
,q
2t
]
t
,定义q1=[x,y,z]
t
、表示系统状态向量;uc(t)表示轨控推力向量;d(t)表示航天器所受到的空间摄动力向量;f(t)表示推力器偏差故障向量;y∈r6表示系统测量输出向量,r为实数;a、g、b、e、f、c为航天器编队系统的非线性状态空间模型中参数矩阵。
[0009]
作为优选,学习神经网络滑模观测器基于实际编队系统的可测量输出y进行观测,通过学习神经网络模型对推力器的偏差故障f(t)进行在线估计,最终实现对实际编队系统的完整逼近。
[0010]
作为优选,步骤2具体为:步骤2.1,基于p型迭代学习算法和rbf神经网络模型,构建用于推力器故障在线精确拟合的学习rbf神经网络模型:其中,上标^表示估计值,为推力器故障的重构值,通过利用rbf神经网络对其进行在线精确拟合;表示rbf神经网络的权重矩阵估计值,通过利用p型迭代学习算法对权重矩阵进行在线升级;τ为学习时间间隔;参数α∈(0,1),l1∈r3×6是增益矩阵;学习rbf神经网络模型中,∈r3×1是高斯基函数向量;步骤2.2,基于学习rbf神经网络模型,构建学习神经网络滑模观测器:其中,上标^表示估计值,、分别为系统状态向量估计和系统非线性项估计;为步骤2.1得到的推力器故障的重构值,表示可测量输出的估计值;表示用于处理空间摄动力的滑模项。
[0011]
作为优选,步骤3中学习神经网络滑模观测器的增益矩阵l和l1的求解方法如下:
t
adap
(t)其中,tc(t)是控制输入,t
norm
(t)、 t
adap
(t)为表示控制输入的算子,具体为:(t)为表示控制输入的算子,具体为:其中,且γ1∈(0,1);表示综合干扰的估计项,利用学习神经网络模型对综合干扰进行在线精确估计,利用p型迭代学习算法对rbf神经网络模型权重矩阵进行在线升级。
[0013]
作为优选,学习神经网络模型为:,其中,θ∈(0,1)为待定系数;k为待确认的矩阵参数,k=diag(k1,k2,k3),且ki>0,i=1,2,3,表示第i个对角线元素;φ(
·
)为以滑模面为输入量的高斯函数, w1为学习神经网络模型的权重矩阵,上标t表示矩阵的转置,上标^表示估计值,t表示t时刻,τ为学习间隔。
[0014] 作为优选,步骤4中学习神经网络滑模容错控制器的θ和k的求解方法为:航天器编队系统相对位置和相对速度跟踪误差最终一致有界,学习神经网络滑模容错控制器参数满足如下条件:其中,p2∈r3×3为正定对称矩阵,δ为正常数,基于上式求得θ和k。
[0015]
有益效果本发明基于航天器编队系统的非线性相对动力模型提出了一种学习神经网络滑模观测器,对推力器故障进行鲁棒重构;提出了一种学习神经网络滑模容错控制器,实现航天器编队系统受到空间摄动和推力器故障时对标称构型的高精度维持控制,解决了空间环境干扰和推力器故障时高精度航天器编队构型维持控制问题。
附图说明
[0016]
图1为本发明的基于学习神经网络滑模的航天器编队轨道容错控制方法的流程图;图2为航天器编队轨道重构容错控制方法的原理图。
具体实施方式
[0017]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0018]
本发明公开了基于学习神经网络滑模的航天器编队轨道重构容错控制方法,解决
了空间环境干扰和推力器故障时高精度航天器编队构型维持控制问题。需要说明的是,下文中上标^表示估计值,上标
·
表示求导,上标
··
表示二次求导,上标t表示矩阵的转置。
[0019]
基于学习神经网络滑模的航天器编队轨道重构容错控制方法包括以下步骤进行:步骤1,根据航天器编队系统非线性相对动力学模型,考虑空间摄动和推力器故障,建立主航天器在圆轨道上的航天器编队系统非线性相对动力学模型。
[0020]
步骤1.1,构建理想航天器编队非线性相对动力学模型为:其中,ρ=[(rc x)2 y2 z2]3表示地心惯性坐标系下从航天器的地心距离;n表示主航天器的轨道角速度;x、y、z表示在主航天器轨道坐标系下的主、从航天器相对距离;r
c 表示地心惯性坐标系下主航天器的轨道半径;μ是地球引力常数。
[0021]
步骤1.2,考虑空间摄动力和推力器故障影响,航天器编队系统非线性相对动力学模型改写如下:其中,di,i=x,y,z为空间摄动力分量;fi,i=x,y,z为推力器偏差故障分量;u
ci
,i=x,y,z为主航天器轨道坐标系下的轨控推力分量。
[0022]
步骤1.3,基于航天器编队系统非线性相对动力学模型,建立航天器编队系统的非线性状态空间模型如下:其中,q=[q
1t
,q
2t
]
t
表示系统状态向量,定义q1=[x,y,z]
t
、;uc(t)=[u
cx
, u
cy
, u
cz
]
t
表示轨控推力向量;d(t) =[d
x
, dy, dz]
t
表示航天器所受到的空间摄动力向量;f(t) =[f
x
, fy, fz]
t
表示推力器偏差故障向量;y∈r6表示系统测量输出向量;a、g、b、e、f、c为航天器编队系统的非线性状态空间模型中参数矩阵,具体如下:
是观测器增益矩阵;α是常值且满足α∈(0,1);τ为学习间隔,通常选取为采样时间或采样时间的整数倍。ψ为用于处理空间摄动力的滑模项,uc(t)表示轨控推力向量。因此,进一步,整体学习神经网络滑模观测器可写为如下形式:其中,ψ为用于处理空间摄动力的滑模项,其定义如下:其中,为系统状态向量估计误差,χ是一个正常数; p∈r6×6是一个正定对称矩阵。
[0026]
下面从理论上说明设计的观测器可以保证系统稳定,并且求解未知观测器增益矩阵l,给出学习神经网络滑模观测器的存在条件及其参数计算方法。具体的,(1)给出学习神经网络滑模观测器的存在条件:假设空间摄动d(t)满足

d(t)

≤d
max
,d
max
是一个正常数。
[0027]
假设航天器编队非线性动力学项g满足利普希茨连续条件(lipschitz条件):其中lg为大于零的lipschitz常数。
[0028]
利用李雅普诺夫(lyapunov)稳定性理论,可得若所设计学习神经网络滑模观测器满足如下条件:则其能够保证状态估计误差和推力器故障重构偏差最终一致有界。其中,上标t表示矩阵的转置,i表示单位矩阵,下标n表示单位矩阵的维数为n
×
n。p∈r6×6是一个正定对称矩阵、正常数γ>0、ε>0,矩阵y=pl。
[0029]
(2)学习神经网络滑模观测器参数计算:为了计算参数矩阵l∈r6×6和l1∈r3×6,将上述等式约束转化为如下线性矩阵不等式的求解问题:最小化η:其中,i表示单位矩阵,下标6、3分别表示单位矩阵的维数为6
×
6、3
×
3;η取一个接
近零的正常数,如η=10-8
;因此,使用matlab/ lmi 工具箱求解不等式:和,可得到p、y、l1,由l=p-1
y可得到矩阵l。
[0030]
由此可归纳学习神经网络滑模观测器的具体设计步骤为:步骤a:选取适当的接近零的正常数γ和ε,计算α的值;步骤b:选取适当的lipschitz常数lg和适当的接近零的正常数η,求解不等式和得到p、y、l1;步骤c:由l=p-1
y可得到矩阵l;步骤d:基于航天器编队轨控系统采样时间,选取合适的学习时间间隔τ。
[0031]
步骤3,结合学习rbf神经网络模型和滑模控制算法,设计一种基于学习神经网络滑模的航天器编队构型维持容错控制器,实现对期望标称构型的高精度跟踪保持。
[0032]
步骤3.1,获取步骤2的故障重构结果,定义故障重构误差为e
f (t)=f(t)-可得到系统的综合干扰为:df(t)= d(t) fe
f (t)为了方便控制器设计的表述,定义状态向量q1=[x,y,z]
t
、和控制输入tc(t),考虑航天器所受到的综合干扰,则非线性相对动力学状态空间模型可作如下的形式变换:其中,,r
c 表示地心惯性坐标系下主航天器的轨道半径;μ是地球引力常数,ρ表示地心惯性坐标系下从航天器的地心距离,o3表示3
×
1的0矩阵。
[0033]
步骤3.2,给出无空间摄动力、无推力器故障且无控制情况下的理想编队状态控制模型:,,其中,q
1d
(t)=[xd,yd,zd]
t
、分别表示期望标称相对位置和期望标称相对速度;定义位置跟踪误差e1(t)=q1(t)
‑ꢀq1d
(t)和速度跟踪误差e2(t)=q2(t)
‑ꢀq2d
(t)。因此,基于实际非线性相对轨道动力学模型和期望标称相对轨道动力学模型,可得航
天器编队构型的维持控制误差模型为:天器编队构型的维持控制误差模型为:,其中a1、a2为步骤1.3中提及的参数矩阵a的分块矩阵。
[0034]
步骤3.3,设计如下滑模面:,其中,表示增益矩阵;这里,对于任意的三维向量x∈r3,定义为:对于任意一个标量p,定义sign(p)为:。
[0035]
步骤3.4,基于步骤3.3的滑模面设计,提出一种学习神经网络滑模容错控制器如下:tc(t)= t
norm
(t) t
adap
(t)(t)其中,且γ1∈(0,1);表示综合干扰的估计项,与基于学习神经网络模型的推力器故障重构项类似,利用学习神经网络模型对综合干扰进行在线精确估计,利用p型迭代学习算法对rbf神经网络模型权重矩阵进行在线升级。学习神经网络模型设计如下:其中,θ∈(0,1);k为待确认的矩阵参数,k=diag(k1,k2,k3),且ki>0,i=1,2,3表示第i个对角线元素;φ(
·
)为以滑模面为输入量的高斯函数,w1为学习神经网络模型的权重矩阵,上标t表示矩阵的转置,上标^表示估计值,t表示t时刻,τ为学习间隔。
[0036]
容错控制器利用学习神经网络对综合干扰进行实时估计,利用滑模控制保证系统的稳定性,保证了实际编队构型对期望编队构型的动态跟踪容错控制。
[0037]
下面从理论上说明设计的容错控制器可以保证系统稳定,给出学习神经网络滑模容错控制器的存在条件,并且求解给出学习神经网络滑模容错控制器的参数计算方法,实
现航天器编队系统受到空间摄动和推力器故障时对标称构型的高精度维持控制。
[0038]
(1)学习神经网络滑模容错控制器的存在条件利用lyapunov稳定性理论可得,若学习神经网络滑模容错控制器参数满足如下条件:则其可保证相对位置和相对速度的跟踪误差最终一致有界;其中,p2∈r3×3正定对称矩阵,δ>0,θ为待定参数。
[0039]
(2)学习神经网络滑模容错控制器参数计算:δ为接近零的适当值即可求出θ;取p2为单位对角阵可求得矩阵k;取充分小值且保证γ1∈(0,1);选择正定对角矩阵β和正标量α1。
[0040]
由此可归纳基于学习神经网络滑模的容错控制器的具体设计步骤为:步骤a:选取适当的接近零的正常数δ,计算θ的值;步骤b:取p2为单位阵,求得矩阵k;步骤c:在上述所得矩阵和参数以及一个合适的学习时间间隔τ的基础上容错控制器。
[0041]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献