一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于强化学习的机动智能决策规避导弹方法与流程

2021-11-22 12:58:00 来源:中国专利 TAG:

技术特征:
1.一种基于强化学习的机动智能决策规避导弹方法,其特征在于,所述机动智能决策规避导弹方法包括:步骤1、在unity端,建立强化学习环境;步骤2、搭建第一神经网络,所述第一神经网络包括决策网络和好奇心网络,设置奖励值判别机制,其中,奖励值由第一奖励值和第二奖励值组成,所述第一奖励值由所述好奇心网络计算得出;步骤3、在python端,在所述强化学习环境下,训练所述第一神经网络得到训练完成的神经网络;步骤4、利用所述训练完成的神经网络对导弹进行规避。2.根据权利要求1所述的机动智能决策规避导弹方法,其特征在于,所述步骤1包括:建立飞行器动力学模型和制导导弹所满足的运动方程组,其中,飞行器动力学模型包括飞行器受到的气动升力、飞行器受到的气动侧力和飞行器受到的阻力。3.根据权利要求2所述的机动智能决策规避导弹方法,其特征在于,所述飞行器受到的气动升力为:其中,l为气动升力,ρ为空气密度,v为空速,s为机翼面积,c
l
为升力系数;所述飞行器受到的气动侧力为:其中,sf为气动侧力,c
y
为侧力系数;所述飞行器受到的阻力为:其中,drag为阻力,c
d
为阻力系数。4.根据权利要求2所述的机动智能决策规避导弹方法,其特征在于,所述制导导弹所满足的运动方程组为:其中,r为导弹与目标的距离,q为目标视线角,v为导弹的速度,v
t
为目标的速度,σ为导弹速度向量与基准线之间的夹角,σ
t
为目标速度向量与基准线之间的夹角,η为导弹速度向量与目标视线之间的夹角,η
t
为飞行器速度向量与目标视线之间的夹角,k为导引系数,ε=
0为导引关系式。5.根据权利要求1所述的机动智能决策规避导弹方法,其特征在于,所述决策网络使用ppo算法作为决策方法。6.根据权利要求1所述的机动智能决策规避导弹方法,其特征在于,所述好奇心网络包括前向网络和反向网络,所述前向网络包括目标网络和预测网络。7.根据权利要求6所述的机动智能决策规避导弹方法,其特征在于,所述步骤3包括:步骤3.1、将智能体随机所做的第一动作对应的第一环境状态输入至所述第一神经网络,所述决策网络输出所述智能体的第二动作,所述好奇心网络输出第二环境状态,以得到一组第一训练数据集,所述第一训练数据集包括若干第二动作和若干第二环境状态;步骤3.2、将所述第一训练数据集输入至所述第一神经网络中,利用所述决策网络的损失函数和所述好奇心网络损失函数进行反向传播,使所述损失函数收敛,以得到第二神经网络;步骤3.3、将智能体指定所做的第三动作对应的第三环境状态输入至所述第二神经网络,所述决策网络输出所述智能体的第四动作,所述好奇心网络输出第四环境状态,以得到一组第二训练数据集,所述第二训练数据集包括若干第四动作和若干第四环境状态;步骤3.4、将所述第二训练数据集输入至所述第二神经网络中,利用所述决策网络的损失函数和所述好奇心网络损失函数进行反向传播,使所述损失函数收敛,以得到训练完成的神经网络。8.根据权利要求7所述的机动智能决策规避导弹方法,其特征在于,所述前向网络的损失函数为:其中,l
f
为所述前向网络的损失值,f
t
(s
t
;θ
f
)为所述目标网络,为所述预测网络,s
t
为当前智能体观测到的环境状态空间,θ
f
为所述目标网络的参数,为所述预测网络需要拟合的参数。9.根据权利要求8所述的机动智能决策规避导弹方法,其特征在于,所述反向网络的损失函数为:其中,l
i
为所述反向网络的损失值,a
t
为所述目标网络的输出,为所述预测网络的输出。10.根据权利要求9所述的机动智能决策规避导弹方法,其特征在于,所述好奇心网络的目标函数为:其中,l
clip
为截断函数损失,α为超参数。

技术总结
本发明公开了一种基于强化学习的机动智能决策规避导弹方法,方法包括:步骤1、在Unity端,建立强化学习环境;步骤2、搭建第一神经网络,所述第一神经网络包括决策网络和好奇心网络,设置奖励值判别机制,其中,奖励值由第一奖励值和第二奖励值组成,所述第一奖励值由所述好奇心网络计算得出;步骤3、在Python端,在所述强化学习环境下,训练所述第一神经网络得到训练完成的神经网络;步骤4、利用所述训练完成的神经网络对导弹进行规避。本发明的规避决策的神经网络结构简单,易于训练且实时性好。本发明利用神经网络作为状态空间到动作空间的映射函数,有效解决的传统算法中状态空间大、动作空间大等缺点。动作空间大等缺点。动作空间大等缺点。


技术研发人员:樊养余 刘洋 段昱 刘曦春 吕国云 张君昌
受保护的技术使用者:西北工业大学
技术研发日:2021.07.07
技术公布日:2021/11/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献