一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种航天器深度强化学习莱维飞行控制系统的制作方法

2021-09-22 19:36:00 来源:中国专利 TAG:航天器 控制系统 飞行 深度 强化

技术特征:
1.一种航天器深度强化学习莱维飞行控制系统,其特征在于,包括:基于深度学习的特征提取模块,用于根据航天器的状态信息获取特征;基于深度强化学习自主规划模块,利用特征进行预测,并获得莱维飞行参数;莱维飞行模块,利用莱维飞行参数,确定下一时刻的飞行轨迹;航天器姿轨控模块,用于控制飞行器跟踪莱维飞行模块生成的飞行轨迹。2.根据权利要求1所述的控制系统,其特征在于,基于深度学习的特征提取模块利用深度神经网络,对航天器的状态信息进行提取。3.根据权利要求1或2所述的控制系统,其特征在于,评价网络利用所述特征进行预测,测的结果包括q值和击中概率。4.根据权利要求1或2所述的控制系统,其特征在于,策略网络利用所述特征获得莱维飞行参数。5.一种航天器深度强化学习莱维飞行控制方法,其特征在于,包括如下步骤:从航天器的状态信息中提取特征;基于该特征,利用评价网络进行预测,利用策略网络生成莱维飞行参数;根据航天器的状态信息和莱维飞行参数,确定下一时刻的飞行轨迹;控制飞行器跟踪下一时刻的飞行轨迹。6.根据权利要求5所述的控制方法,其特征在于,航天器的状态信息包括位置、姿态、速度、角速度和击中概率。7.根据权利要求5或6所述的控制方法,其特征在于,采用强化学习方法训练策略网络。8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现权利要求5至7中任一项所述的控制方法。

技术总结
一种航天器深度强化学习莱维飞行控制系统,包括:自主规划模块,根据航天器的状态信息获取特征,利用该特征进行预测,并获得莱维飞行参数;莱维飞行模块,利用莱维飞行参数,确定下一时刻的飞行轨迹;航天器姿轨控模块,用于控制飞行器跟踪下一时刻的飞行轨迹。本发明在莱维飞行的基础上,采用深度强化学习以综合考虑各种因素,选择最佳的飞行轨迹,以保证在最优的飞行性能。优的飞行性能。优的飞行性能。


技术研发人员:汤亮 王勇 袁利 韩冬 黄煌
受保护的技术使用者:北京控制工程研究所
技术研发日:2021.05.28
技术公布日:2021/9/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜