一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于LSTM的目标的机动预测方法、电子设备和存储介质与流程

2022-12-20 00:46:02 来源:中国专利 TAG:

基于lstm的目标的机动预测方法、电子设备和存储介质
技术领域
1.本发明涉及飞行器飞行控制和人工智能技术领域,具体涉及一种基于lstm的目标的机动预测方法、电子设备和存储介质。


背景技术:

2.近年来,随着无人机相关技术的快速发展,无人机在军事领域的应用越来越广泛,对目标无人机下一阶段的机动动作进行预测问题逐渐引起人们的关注。在空战对抗过程中,双方无人机作为智能体进行策略选择下一阶段的机动动作,从而让己方无人机在空间占位上处于优势状态,而如何提前预知目标无人机下一阶段将会采取的机动动作,是己方机动动作选择策略的关键问题。
3.目前,对目标无人机的机动动作进行预测的方法将目标机的机动动作选择看作固定的几种机动动作的加权和,各个机动动作的权重由专家知识确定。然而无人机进行机动选择是一个连续动态地对空间态势占位寻优的过程,固定的机动动作加权和的预测方法没有考虑目标机动选择的空间态势特征,忽视了目标机动动作的动态性与时序性特点,而且没有考虑目标机对我方无人机机动的感知情况,所以很难准确描述目标机动动作选择的规律,导致对目标机未来的机动动作预测不准确。


技术实现要素:

4.为了克服以上技术的缺点,本发明的目的在于提供一种基于lstm的目标的机动预测方法、电子设备和存储介质,不论是对单个机动控制参数的预测,还是对所有机动控制参数同时预测正确问题都能得良好的效果。
5.为了实现上述目的,本发明采用的技术方案是:
6.一种基于lstm的目标的机动预测方法,包括以下步骤;
7.步骤1:构建无人机对战过程的目标机动选择数据集s,所述目标指与我方无人机对战的目标无人机;
8.步骤2:提取目标机动对抗过程空间态势特征;
9.步骤3:对步骤1的目标机动选择数据集s进行分割和预处理;
10.步骤4:建立基于lstm的目标的机动预测网络模型;
11.步骤5:利用训练集对基于lstm的目标的机动预测网络模型进行训练,并利用测试集进行准确率检测。
12.所述步骤1利用某一对一空战仿真系统,对战双方设置不同初始状态进行多次对战实验,每局对战每隔20ms记录一次对战双方无人机的状态信息s
t
和机动动作控制信息c
t
,形成空战对抗数据,并且每局对战过程以某一方的胜利或者对战时长超过2分钟时终止。
13.选取280组空战对抗数据作为目标机动预测的数据集s,在任意t时刻,对战双方无人机的状态信息s
t
和机动控制信息c
t
均包含以下多个维度的信息,如式所示:
14.s
t
=[x
t
,y
t
,z
t
,ex
t
,ey
t
,ez
t
,ax
t
,ay
t
,az
t
,v
t
]
[0015]ct
=[a
t
,p
t
,y
t
]
[0016]
式中,x
t
,y
t
,z
t
分别表示t时刻无人机的三维空间位置坐标,ex
t
,ey
t
,ez
t
分别表示无人机t时刻的姿态欧拉角,(ax
t
,ay
t
,az
t
)组成了无人机t时刻的机头朝向向量,v
t
表示t时刻无人机的速度大小信息,s
t
包含10个维度的状态信息,a
t
,p
t
,y
t
分别表示控制无人机速度和方向的加速度信息,俯仰角信息和偏航角信息,c
t
包含3个维度的机动控制信息,任意t时刻我方无人机的状态信息用表示,机动控制信息用表示;目标无人机的状态信息用表示,机动控制信息用表示;数据集s=[su,cu,se,ce]。
[0017]
所述步骤2在近距空战对抗过程中,无人机获胜的关键是当目标机在己方无人机攻击范围内时,己方无人机角度态势处于优势状态,此时目标机的方位角p与目标机的进入角q取值趋近于0,对目标机的机动进行预测时需要考虑目标机与我机之间的距离d和目标机的角度态势ta情况,从步骤1得到的目标机动预测数据集s中提取目标机动的距离特征d和角度态势特征ta:
[0018][0019][0020]
式中,xu,yu,zu分别表示我方无人机的三维空间位置坐标,xe,ye,ze分别表示目标无人机的三维空间位置坐标。
[0021]
将提取的距离特征和角度态势特征并入目标机动预测数据集s:
[0022]
s=[su,cu,se,ce,d,ta]
[0023]
式中,su,cu分别表示目标机动预测数据集s中我方无人机的状态信息和机动控制信息,se,ce分别表示目标机动预测数据集s中目标无人机的状态信息和机动控制信息。
[0024]
所述步骤3包括:
[0025]
3a,将步骤1中目标机动预测数据集s按照训练集和测试集之比为7:3的比例划分为训练集s
train
和测试集s
test

[0026]
3b,分别提取训练集s
train
和测试集s
test
机动控制信息的各个维度数据,并进行标签化预处理,得到标签化的训练集控制信息数据
[0027]
和测试集状态信息数据无人机通过加速度、俯仰角速度和偏航角速度控制自身的速度和方向,加速度的大小会影响无人机速度的变化,俯仰角速度和偏航角速度的存在控制着无人机的方向,为了模拟空战中无人机的不同机动动作,仿真系统设置加速度大小一共有4种取值情况{-30,-10,40,60}(单位为:米/秒平方),每一取值表示无人机进行不同的加速或减速机动,俯仰角速度有9种取值情况{-30,-21,-12,-5,0,5,12,21,30}(单位为:度/秒),每一取值表示无人机以某一角速度进行不同的俯仰机动,偏航角速度有9种取值情况{-60,-34,-18,-8,0,8,18,34,60}(单位为:度/秒),每一取值表示无人机以某一角速度进行不同的偏离原来航线的机动,所以无人机机动控制参数共有4*9*9=324种取值组合,每种组合代表无人机的一种机动动作,对机动动作的预测即是对机动控制参数组合取值的预测,将加速度、俯仰角速度和偏航角速度的取值按照映射成类别标签的形式;
[0028]
3c,分别对训练集s
train
和测试集s
test
各个维度的数据进行归一化预处理,得到归一化后的训练集数据和测试集数据
[0029][0030]
式中,xi表示训练集或测试集中第i维的数据,表示第i维数据的最小值,表示第i维数据的最大值,是第i维数据归一化后的结果;
[0031]
归一化后的训练集数据和测试集数据均按照(batch,seq,input)的维度格式存储,其中batch表示网络模型批处理的维度,seq表示用来预测目标下一时刻机动动作的时间序列长度,input表示归一化后的数据集中每条数据的维度。
[0032]
所述步骤4具体为:
[0033]
基于lstm的目标的机动预测网络模型包括1个具有2层隐藏层的lstm网络、3个全连接层和3个交叉熵损失函数,lstm网络模型的输入为连续seq个时刻归一化后的训练集数据序列,输入格式为(batch,seq,input);输出为封装的近seq时间段内目标机机动的隐藏状态输出格式为(batch,seq,hidden);
[0034]
将近seq时间段内目标机机动的隐藏状态分别输入3个全连接层,结合3个交叉熵损失函数la,l
p
,ly,分别获得加速度、俯仰角速度和偏航角速度在seq 1时刻取每类值的概率情况:
[0035][0036][0037]
式中,l表示交叉熵函数计算公式,n表示样本数量,m表示类别数量,y
ic
为符号函数,若样本i的真实类别为c,y
ic
取1,否则y
ic
取0;la,l
p
,ly分别表示对加速度、俯仰角速度和偏航角速度使用交叉熵损失函数l计算得到的加速度交叉熵损失,俯仰角交叉熵损失和偏航角交叉熵损失;pa表示目标加速度在seq 1时刻取每类值的概率情况,表示目标加速度在seq 1时刻取第m类值的概率情况,p
p
表示目标俯仰角速度在seq 1时刻取每类值的概率情况,表示目标俯仰角速度在seq 1时刻取第n类值的概率情况,py表示目标偏航角速度在seq 1时刻取每类值的概率情况,表示目标偏航角速度在seq 1时刻取第n类值的概率情况。
[0038]
分别将目标加速度a、俯仰角速度p和偏航角速度y取值概率最大的类别值作为目标机seq 1时刻加速度a、俯仰角速度p和偏航角速度y的预测类别值,p
apre
,p
ppre
,p
ypre

[0039][0040]
加速度a、俯仰角速度p和偏航角速度y的预测类别值组合在一起即得到机动动作的预测类别标签值,至此,无人机的机动预测问题转变为目标加速度a、俯仰角速度p和偏航角速度y的分类预测问题。
[0041]
所述步骤5在模型训练的时候,对加速度交叉熵损失la,俯仰角交叉熵损失l
p
和偏航角交叉熵损失ly进行加权融合,将融合后的损失函数值作为整个网络模型的训练损失l
train

[0042]
l
train
=wala w
p
l
p
wyly[0043]
式中,wa,w
p
,wy分别表示加速度交叉熵损失la,俯仰角交叉熵损失l
p
和偏航角交叉熵损失ly的权值。
[0044]
一种电子设备,包括处理器、存储器和通信总线,其中,处理器、存储器通过通信总线完成相互间的通信;
[0045]
存储器,用于存放计算机程序;
[0046]
处理器,用于执行存储器上所存放的程序时,实现上述所述的一种基于lstm的目标的机动预测方法。
[0047]
一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的一种基于lstm的目标的机动预测方法。
[0048]
本发明的有益效果:
[0049]
本发明在预测目标机机动时,提取目标机的空间态势占位特征,并与我方无人机的状态和机动信息、目标机的状态和机动信息共同作为目标机机动预测的依据,能够充分挖掘空战对抗数据中目标机进行机动选择的规律,使得对目标机机动的预测更准确
[0050]
本发明分析了无人机的机动动作与无人机的加速度、俯仰角速度和偏转角速度的关系,将加速度、俯仰角速度和偏转角速度的取值标签化,把目标机机动动作选择的预测问题转换为对加速度、俯仰角速度和偏转角速度三个机动控制变量的分类预测问题,能够准确预测目标机未来的机动动作,为目标机机动预测方法的研究提供了新思路
[0051]
本发明从目标机机动具有时序性的特点出发,建立基于lstm的目标机机动预测网络模型,利用lstm对时序数据强大的预测能力,根据一段时间内我方无人机的状态信息和机动信息、目标机的状态信息和机动信息以及目标机在该段时间内的空间态势占位特征,预测目标机下一时刻的机动动作,相比其它网络模型取得了更好的预测效果,实现了对目标机机动动作的准确预测。
附图说明:
[0052]
图1是空战对抗过程中我方无人机与目标机方位角示意图。
[0053]
图2是无人机机动控制参数标签化处理示意图。
[0054]
图3是基于lstm的目标的机动预测方法示意图。
具体实施方式
[0055]
下面结合实施例对本发明作进一步详细说明。
[0056]
基于lstm的目标的机动预测方法,包括以下步骤:
[0057]
1,构建无人机对战过程目标机机动选择数据集;
[0058]
利用某一对一空战仿真系统,对战双方设置不同初始状态进行多次对战实验,每局对战每隔20ms记录一次对战双方无人机的状态信息s
t
和机动动作控制信息c
t
,形成空战对抗数据,并且每局对战过程以某一方的胜利或者对战时长超过2分钟时终止。本实例中选
取280组对战实验共包括14397712条对战机动数据作为目标机动预测的数据集s。在任意t时刻,对战双方无人机的状态信息s
t
和机动控制信息c
t
均包含以下多个维度的信息,如式所示:
[0059]st
=[x
t
,y
t
,z
t
,ex
t
,ey
t
,ez
t
,ax
t
,ay
t
,az
t
,v
t
]
[0060]ct
=[a
t
,p
t
,y
t
]
[0061]
式中,x
t
,y
t
,z
t
分别表示t时刻无人机的三维空间位置坐标,ex
t
,ey
t
,ez
t
分别表示无人机t时刻的姿态欧拉角,(ax
t
,ay
t
,az
t
)组成了无人机t时刻的机头朝向向量,v
t
表示t时刻无人机的速度大小信息,s
t
包含10个维度的状态信息。a
t
,p
t
,y
t
分别表示控制无人机速度和方向的加速度信息,俯仰角信息和偏航角信息,c
t
包含3个维度的机动控制信息。本实例中任意t时刻我方无人机的状态信息用表示,机动控制信息用表示;目标无人机的状态信息用表示,机动控制信息用表示;数据集s=[su,cu,se,ce]。
[0062]
2,提取目标机动对抗过程空间态势特征;
[0063]
在空战对抗过程中,无人机进行连续机动的目的是与目标无人机进行博弈对抗,从而让自己的空间占位处于优势状态,达到攻击目标机的目的。所以,空间态势信息是无人机进行机动选择的关键因素。在近距空战对抗过程中,无人机获胜的关键是当目标机在己方无人机攻击范围内时,己方无人机角度态势处于优势状态,此时目标机的方位角p与目标机的进入角q取值趋近于0,如图1所示。所以对目标机的机动进行预测时需要考虑目标机与我机之间的距离d和目标机的角度态势ta情况,从目标机动预测数据集s中提取目标机动的距离特征d和角度态势特征ta:
[0064][0065][0066]
式中,xu,yu,zu分别表示我方无人机的三维空间位置坐标,xe,ye,ze分别表示目标无人机的三维空间位置坐标。
[0067]
将提取的距离特征和角度态势特征并入目标机动预测数据集s:
[0068]
s=[su,cu,se,ce,d,ta]
[0069]
式中,su,cu分别表示目标机动预测数据集s中我方无人机的状态信息和机动控制信息,se,ce分别表示目标机动预测数据集s中目标无人机的状态信息和机动控制信息。
[0070]
3,对数据集进行分割和预处理。
[0071]
3a,将目标机动预测数据集s按照训练集和测试集之比为7:3的比例划分为训练集s
train
和测试集s
test

[0072]
3b,分别提取训练集s
train
和测试集s
test
机动控制信息的各个维度数据,并进行标签化预处理,得到标签化的训练集控制信息数据
[0073]
和测试集状态信息数据无人机通过加速度、俯仰角速度和偏航角速度控制自身的速度和方向,加速度的大小会影响无人机速度的变化,俯仰角速度和偏航角速度的存在控制着无人机的方向。为了模拟空战中无人机的不同机动动作,仿真系统设置加速度大小一共有4种取值情况{-30,-10,40,60}(单位为:米/秒平方),每一取值表示无人机进行不
同的加速或减速机动,俯仰角速度有9种取值情况{-30,-21,-12,-5,0,5,12,21,30}(单位为:度/秒),每一取值表示无人机以某一角速度进行不同的俯仰机动,偏航角速度有9种取值情况{-60,-34,-18,-8,0,8,18,34,60}(单位为:度/秒),每一取值表示无人机以某一角速度进行不同的偏离原来航线的机动,所以无人机机动控制参数共有4*9*9=324种取值组合,每种组合代表无人机的一种机动动作,对机动动作的预测即是对机动控制参数组合取值的预测。将加速度、俯仰角速度和偏航角速度的取值按照映射成类别标签的形式,如图2所示;
[0074]
3c,分别对训练集s
train
和测试集s
test
各个维度的数据进行归一化预处理,得到归一化后的训练集数据
[0075]
和测试集数据
[0076][0077]
式中,xi表示训练集或测试集中第i维的数据,表示第i维数据的最小值,表示第i维数据的最大值,是第i维数据归一化后的结果;
[0078]
归一化后的训练集数据和测试集数据均按照(batch,seq,input)的维度格式存储,其中batch表示网络模型批处理的维度,seq表示用来预测目标下一时刻机动动作的时间序列长度,input表示归一化后的数据集中每条数据的维度。本实例中,batch设置为256,seq设置为14,input为28。
[0079]
4,建立基于lstm的目标的机动预测网络模型;
[0080]
如图3所示,基于lstm的目标的机动预测网络模型包括1个具有2层隐藏层的lstm网络、3个全连接层和3个交叉熵损失函数。lstm网络模型的输入为连续seq个时刻归一化后的训练集数据序列,输入格式为(batch,seq,input);输出为封装的近seq时间段内目标机机动的隐藏状态输出格式为(batch,seq,hidden),本实例中hidden设置为128;
[0081]
将近seq时间段内目标机机动的隐藏状态分别输入3个全连接层,结合3个交叉熵损失函数la,l
p
,ly,分别获得加速度、俯仰角速度和偏航角速度在seq 1时刻取每类值的概率情况:
[0082][0083][0084]
式中,l表示交叉熵函数计算公式,n表示样本数量,m表示类别数量,y
ic
为符号函数,若样本i的真实类别为c,y
ic
取1,否则y
ic
取0;la,l
p
,ly分别表示对加速度、俯仰角速度和偏航角速度使用交叉熵损失函数l计算得到的加速度交叉熵损失,俯仰角交叉熵损失和偏航角交叉熵损失;pa表示目标加速度在seq 1时刻取每类值的概率情况,表示目标加速度在seq 1时刻取第m类值的概率情况,p
p
表示目标俯仰角速度在seq 1时刻取每类值的概率
情况,表示目标俯仰角速度在seq 1时刻取第n类值的概率情况,py表示目标偏航角速度在seq 1时刻取每类值的概率情况,表示目标偏航角速度在seq 1时刻取第n类值的概率情况。
[0085]
分别将目标加速度a、俯仰角速度p和偏航角速度y取值概率最大的类别值作为目标机seq 1时刻加速度a、俯仰角速度p和偏航角速度y的预测类别值,p
apre
,p
ppre
,p
ypre

[0086][0087]
加速度a、俯仰角速度p和偏航角速度y的预测类别值组合在一起即得到机动动作的预测类别标签值,根据图2所示类别标签与机动控制参数值的映射关系可得相应的机动控制变量取值。至此,无人机的机动预测问题转变为目标加速度a、俯仰角速度p和偏航角速度y的分类预测问题。
[0088]
5,利用训练集对基于lstm的目标的机动预测网络模型进行训练,并利用测试集进行准确率检测;
[0089]
在模型训练的时候,对加速度交叉熵损失la,俯仰角交叉熵损失l
p
和偏航角交叉熵损失ly进行加权融合,将融合后的损失函数值作为整个网络模型的训练损失l
train

[0090]
l
train
=wala w
p
l
p
wyly[0091]
式中,wa,w
p
,wy分别表示加速度交叉熵损失la,俯仰角交叉熵损失l
p
和偏航角交叉熵损失ly的权值,本实例中,通过实验确定设置wa,w
p
,wy的值分别为0.2,0.4,0.4。
[0092]
为了防止模型训练过程中出现过拟合现象,同时使网络模型更加健壮,在lstm网络层加入dropout机制,并且本实例中把dropout的值设置为0.4;本实例中网络模型学习率超参数learing rate设置为0.0001,训练轮数epochs设置为500。对于每轮训练保存模型的网络参数。
[0093]
利用保存的网络模型参数对测试集数据进行测试验证,本模型采用的评价指标是准确率accuracy,准确率accuracy越接近于1,模型的分类预测越精准。本发明分别统计了测试集中加速度、俯仰角速度和偏航角速度的预测准确率acc(a),acc(p),acc(y)以及在同一时刻加速度、俯仰角速度和偏航角速度同时预测正确的准确率acc(a,p,y),同时将本模型与bp神经网络,rnn神经网络进行了对比,并对每个比较的网络模型都做了多次独立实验,实验结果如表1所示:
[0094]
表1不同网络模型对目标机机动预测准确率比较
[0095][0096]
从表1的结果可以看出,在本实例中,与bp神经网络和rnn相比,本发明的网络模型不论是对单个机动控制参数的预测,还是对所有机动控制参数同时预测正确问题都取得了良好的效果,其中所有机动控制参数同时预测正确表示机动控制参数组合值预测正确,即
某一时刻的目标机动预测正确。
[0097]
本发明分析了现有空战对抗过程目标机动动作预测方法,发现现有目标机动预测方法仅从目标自身出发,将目标机的机动动作分为固定的几种动作的加权组合,每种动作的权值表示目标机采取此种机动动作的概率。没有考虑其机动动作与其所占空间态势的关系;以及没有考虑我方无人机状态对目标机进行机动的影响情况;所以本发明在预测目标机机动时,提取目标机的空间态势占位特征,并与我方无人机的状态和机动信息、目标机的状态和机动信息共同作为目标机机动预测的依据,这能够充分挖掘空战对抗数据中目标机进行机动选择的规律,使得对目标机机动的预测更准确
[0098]
本发明分析了无人机的机动动作与无人机的加速度、俯仰角速度和偏转角速度的关系,将加速度、俯仰角速度和偏转角速度的取值标签化,把目标机机动预测问题转换为对加速度、俯仰角速度和偏转角速度三个机动控制变量的分类预测问题,能够准确预测目标机未来的机动动作,为目标机机动预测方法的研究提供了新思路
[0099]
本发明从目标机机动具有时序性的特点出发,建立基于lstm的目标机机动预测网络模型,利用lstm对时序数据强大的预测能力,根据一段时间内我方无人机的状态信息和机动信息、目标机的状态信息和机动信息以及目标机在该段时间内的空间态势占位特征,预测目标机下一时刻的机动动作。由于篇幅限制,本发明展示了某次空战对抗过程中,某段时间目标机实际进行一个batch次共256次机动与本模型相应进行一个batch次共256次预测机动的预测实例,预测效果如表2表示,实验结果进一步验证了本发明的方法对目标机机动预测的有效性。
[0100]
[0101]
[0102]
[0103]
[0104]
[0105]
[0106][0107]
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0108]
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献