一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于外源雷达的飞鸟与无人机航迹目标分类方法及设备

2022-12-20 02:26:54 来源:中国专利 TAG:


1.本发明实施例涉及无源雷达和通信技术领域,尤其涉及一种基于外源雷达的飞鸟与无人机航迹目标分类方法及设备。


背景技术:

2.外辐射源雷达(即外源雷达)因具有隐蔽性好、不占用频谱等优点而受到雷达界广泛研究。基于dtmb标准的地面数字电视信号目前已经普及,利用其作为外辐射源进行低空目标探测具有低成本、隐蔽性好及生存能力强等优势。无人机和飞鸟作为低空空域飞行中经常出现的探测目标,由于其飞行高度比较低,极有可能在飞机的起飞和降落阶段和机身发生碰撞造成危险。对于飞鸟和无人机这两类目标的探测识别,以往传统的做法是依靠地面工作人员的肉眼观察探测,但是由于人眼视力观察范围的局限性、以及天气、环境亮度等制约因素,使得这种传统做法得到的观测结果往往并不准确。目前部分雷达可以实现无人机和飞鸟目标的探测与识别,但是往往识别路径单一、方法固定,对无人机和飞鸟探测目标传回的信号幅度稳定性依赖较高,导致实际上识别准确率较低。由于无人机和飞鸟探测目标飞行轨迹的多变以及不可预测的特征,使得采用传统方法探测目标轨迹变得困难和不准确。因此,开发一种基于外源雷达的飞鸟与无人机航迹目标分类方法及设备,可以有效克服上述相关技术中的缺陷,就成为业界亟待解决的技术问题。


技术实现要素:

3.针对现有技术存在的上述问题,本发明实施例提供了一种基于外源雷达的飞鸟与无人机航迹目标分类方法及设备。
4.第一方面,本发明的实施例提供了一种基于外源雷达的飞鸟与无人机航迹目标分类方法,包括:步骤1、获取无人机和飞鸟航迹数据并进行预处理,将目标的位置、速度、加速度信息作为特征输入向量,计算所有航迹文件时长序列数据的平均值,确定文件的四种标准长度,将较长的序列截断,并填充比平均长度短的序列,使得所有航迹文件长度统一,对航迹文件时长序列数据进行预处理,将局部异常值去除并进行切比雪夫去噪;步骤2、建立无人机和飞鸟航迹二分类模型,并构建分类指标进行二分类模型性能的定量评估,所述分类指标分别是正确率、精确率、召回率、f1-score和roc曲线,其中f1-score是综合考虑精确率和召回率而产生的指标;步骤3、构建由改进的lstm单元和卷积神经网络cnn组成的飞行航迹深度学习网络;步骤4、划分数据集进行训练,训练集、验证集、测试集划分比例为5:1:4,使用步骤1选定的四种标准长度以及average函数三种不同参数进行模型的对比训练,并进行结果分析。
5.在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤1中的无人机和飞鸟航迹数据具体为:目标的位置、速度、加速度信息;步骤1中特征输入向量为target.csv和datasetgroup.csv。target.csv文件用来存储无人机和飞鸟这两类目标的分类信息,用-1和1两种标签进行类别标注,-1代表无人机
类别、1代表飞鸟类别;datasetgroup.csv文件用来存储训练集、测试集、验证集的划分信息;划分比例根据实际需要进行改变;步骤1中的航迹文件长度统一的方法为:计算所有航迹文件时长序列的平均值,将较长的序列截断,并填充比平均长度短的序列,平均值为整体数据长度的平均水平,对数据进行区间估计,以确保超过百分之八十的数据在区间范围内;对于标准数据长度,选择数据中位数作为标准长度。
6.在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤1中的航迹文件时长序列数据进行预处理采用的基于区域奇异因子去除奇异值,区域奇异因子为:
[0007][0008]
其中,k为p点的临节点,k(p)为p点的集合,lk(p)为p点区域密度,lk(a)为a点区域密度,p点的区域奇异系数lof(p)为p点的区域平均密度与p点自身密度之比,若lof(p)越大则p点相对于区域邻点为奇异值的概率就越大,反之则越小。
[0009]
在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤2中的正确率、精确率、召回率、f1-score为:
[0010]
正确率是指预测正确的样本数占总样本数的比例,计算公式为:
[0011][0012]
其中,accuracy为正确率,tp为实际分类为正、且预测类别也为正的样本数,tn为实际分类为正、但预测类别为负的样本数,fp为实际分类为负、且预测类别也为负的样本数,fn为实际分类为负、但预测类别为正的样本数;
[0013]
精确率是指预测类别为正且预测正确的样本数占所有预测类别为正的样本数的比例,计算公式为:
[0014][0015]
其中,precision为精确率;
[0016]
召回率是指预测类别为正且预测正确的样本数占所有实际类别为正的样本数的比例,计算公式为:
[0017][0018]
其中,recall为召回率;
[0019]
f1-score是综合考虑精确率和召回率而产生的指标,计算公式为:
[0020][0021]
当precision和recall都为1时,f1-score达到最大值1,作为综合考虑精确率和召
回率来进行分类性能评估的指标,若精确率和召回率任意一个值小,则相应导致f1-score值小,即说明模型分类性能不好;
[0022]
roc曲线是一种坐标图式的分析工具,使用于二分类模型,roc曲线横轴为假正例率,纵轴为真正例率;
[0023]
fpr是指在类别为负类的样本中,被错误地判断为正类的比率,计算公式为:
[0024][0025]
tpr是指在类别为正类的样本中,被正确地判断为正类的比率,计算公式为:
[0026][0027]
若给定二分类模型和阈值,则在roc曲线上生成一个坐标点,随着阈值的变化,画出整个roc曲线,在roc曲线以上的点代表更好的分类结果,在roc曲线以下的点代表更差的分类结果,对角线代表随机分类的情况,预测正确类别概率为0.5,当roc曲线与横轴所围成面积越大、曲线越贴近左上角时,模型的分类性能越好。
[0028]
在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤3具体包括:对长短期记忆网络lstm进行改进,根据飞鸟和无人机飞行特点不同,使得航迹特征也有所不同的识别要求,飞鸟在飞翔过程中机动性更强,而无人机更加平稳,在lstm输入端,即神经网络内部记忆状态向量加入一可调权值器,当机动性强时则增加权值,放大航迹特征,便于航迹特征识别,采用lstm学习目标航迹的复杂的时间动态特性后,继续采用卷积神经网络对输入数据进行处理提取特征的流程中,通过反馈回路来优化处理参数获得最优解,采用位于中间处理过程中的隐藏层来提取存储输入数据中的关键特征。
[0029]
在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,改进后的lstm参数为:内存单元为256mb,输入数据向量个数为6个,全连接层采用的激活函数为sigmoid函数,优化器为adam优化器,学习率为0.001,训练周期数为200。
[0030]
在上述方法实施例内容的基础上,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤4中,数据集的划分比例的根据在于无人机和飞鸟的数据集并不均衡,无人机数据量要比飞鸟数据量少,则在数据集实际比例划分时,增大了测试集所占比例。
[0031]
第二方面,本发明的实施例提供了一种基于外源雷达的飞鸟与无人机航迹目标分类装置,包括:第一主模块,用于实现步骤1、获取无人机和飞鸟航迹数据并进行预处理,将目标的位置、速度、加速度信息作为特征输入向量,计算所有航迹文件时长序列数据的平均值,确定文件的四种标准长度,将较长的序列截断,并填充比平均长度短的序列,使得所有航迹文件长度统一,对航迹文件时长序列数据进行预处理,将局部异常值去除并进行切比雪夫去噪;第二主模块,用于实现步骤2、建立无人机和飞鸟航迹二分类模型,并构建分类指标进行二分类模型性能的定量评估,所述分类指标分别是正确率、精确率、召回率、f1-score和roc曲线,其中f1-score是综合考虑精确率和召回率而产生的指标;第三主模块,用
于实现步骤3、构建由改进的lstm单元和卷积神经网络cnn组成的飞行航迹深度学习网络;第四主模块,用于实现步骤4、划分数据集进行训练,训练集、验证集、测试集划分比例为5:1:4,使用步骤1选定的四种标准长度以及average函数三种不同参数进行模型的对比训练,并进行结果分析。
[0032]
第三方面,本发明的实施例提供了一种电子设备,包括:
[0033]
至少一个处理器;以及
[0034]
与处理器通信连接的至少一个存储器,其中:
[0035]
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种实现方式中任一种实现方式所提供的基于外源雷达的飞鸟与无人机航迹目标分类方法。
[0036]
第四方面,本发明的实施例提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种实现方式中任一种实现方式所提供的基于外源雷达的飞鸟与无人机航迹目标分类方法。
[0037]
本发明实施例提供的基于外源雷达的飞鸟与无人机航迹目标分类方法及设备,计算量较小并且在低空小目标短航迹时其优点尤为突出,可以提升雷达系统目标分类识别性能,对于外辐射源雷达实际应用非常有意义。
附图说明
[0038]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]
图1为本发明实施例提供的基于外源雷达的飞鸟与无人机航迹目标分类方法流程图;
[0040]
图2为本发明实施例提供的基于外源雷达的飞鸟与无人机航迹目标分类装置结构示意图;
[0041]
图3为本发明实施例提供的电子设备的实体结构示意图;
[0042]
图4为本发明实施例提供的待处理航迹文件格式示意图;
[0043]
图5为本发明实施例提供的处理后的航迹文件格式示意图;
[0044]
图6为本发明实施例提供的lstm-cnn分类网络结构示意图。
具体实施方式
[0045]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种
技术方案的结合不存在,也不在本发明要求的保护范围之内。
[0046]
采用深度学习来实现无人机和飞鸟这种非线性运动的探测目标的分类,可以将大量探测目标的高纬度特征输入到相应的识别网络中,对无人机和飞鸟探测目标的轨迹数据进行分析,从而得到高准确度的识别结果。基于数字电视外辐射源雷达所获取的飞鸟与无人机航迹提出了一种目标分类方法,通过外辐射源雷达探测无人机和飞鸟所获取的航迹数据,将两种目标的飞行坐标、速度、加速度信息作为特征输入,构建基于长短时神经记忆网络与卷积神经网络相结合的深度学习网络,实现对飞鸟与无人机的分类识别,网络训练成功后,实际应用时计算量小,在多径和干扰严重时其优点尤为突出,对于数字电视外辐射源雷达应用于机场低空目标探测应用非常有意义。基于这种思想,本发明实施例提供了一种基于外源雷达的飞鸟与无人机航迹目标分类方法,参见图1,该方法包括:步骤1、获取无人机和飞鸟航迹数据并进行预处理,将目标的位置、速度、加速度信息作为特征输入向量,计算所有航迹文件时长序列数据的平均值,确定文件的四种标准长度,将较长的序列截断,并填充比平均长度短的序列,使得所有航迹文件长度统一,对航迹文件时长序列数据进行预处理,将局部异常值去除并进行切比雪夫去噪;步骤2、建立无人机和飞鸟航迹二分类模型,并构建分类指标进行二分类模型性能的定量评估,所述分类指标分别是正确率、精确率、召回率、f1-score和roc曲线,其中f1-score是综合考虑精确率和召回率而产生的指标;步骤3、构建由改进的lstm单元和卷积神经网络cnn组成的飞行航迹深度学习网络;步骤4、划分数据集进行训练,训练集、验证集、测试集划分比例为5:1:4,使用步骤1选定的四种标准长度以及average函数三种不同参数进行模型的对比训练,并进行结果分析。
[0047]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤1中的无人机和飞鸟航迹数据具体为:目标的位置、速度、加速度信息;步骤1中特征输入向量为target.csv和datasetgroup.csv。target.csv文件用来存储无人机和飞鸟这两类目标的分类信息,用-1和1两种标签进行类别标注,-1代表无人机类别、1代表飞鸟类别;datasetgroup.csv文件用来存储训练集、测试集、验证集的划分信息;划分比例根据实际需要进行改变;步骤1中的航迹文件长度统一的方法为:计算所有航迹文件时长序列的平均值,将较长的序列截断,并填充比平均长度短的序列,平均值为整体数据长度的平均水平,对数据进行区间估计,以确保超过百分之八十的数据在区间范围内;对于标准数据长度,选择数据中位数作为标准长度。
[0048]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤1中的航迹文件时长序列数据进行预处理采用的基于区域奇异因子去除奇异值,区域奇异因子为:
[0049][0050]
其中,k为p点的临节点,k(p)为p点的集合,lk(p)为p点区域密度,lk(a)为a点区域密度,p点的区域奇异系数lof(p)为p点的区域平均密度与p点自身密度之比,若lof(p)越大则p点相对于区域邻点为奇异值的概率就越大,反之则越小。
[0051]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基
于外源雷达的飞鸟与无人机航迹目标分类方法,步骤2中的正确率、精确率、召回率、f1-score为:
[0052]
正确率是指预测正确的样本数占总样本数的比例,计算公式为:
[0053][0054]
其中,accuracy为正确率,tp为实际分类为正、且预测类别也为正的样本数,tn为实际分类为正、但预测类别为负的样本数,fp为实际分类为负、且预测类别也为负的样本数,fn为实际分类为负、但预测类别为正的样本数;
[0055]
精确率是指预测类别为正且预测正确的样本数占所有预测类别为正的样本数的比例,计算公式为:
[0056][0057]
其中,precision为精确率;
[0058]
召回率是指预测类别为正且预测正确的样本数占所有实际类别为正的样本数的比例,计算公式为:
[0059][0060]
其中,recall为召回率;
[0061]
f1-score是综合考虑精确率和召回率而产生的指标,计算公式为:
[0062][0063]
当precision和recall都为1时,f1-score达到最大值1,作为综合考虑精确率和召回率来进行分类性能评估的指标,若精确率和召回率任意一个值小,则相应导致f1-score值小,即说明模型分类性能不好;
[0064]
roc曲线是一种坐标图式的分析工具,使用于二分类模型,roc曲线横轴为假正例率,纵轴为真正例率;
[0065]
fpr是指在类别为负类的样本中,被错误地判断为正类的比率,计算公式为:
[0066][0067]
tpr是指在类别为正类的样本中,被正确地判断为正类的比率,计算公式为:
[0068][0069]
若给定二分类模型和阈值,则在roc曲线上生成一个坐标点,随着阈值的变化,画出整个roc曲线,在roc曲线以上的点代表更好的分类结果,在roc曲线以下的点代表更差的分类结果,对角线代表随机分类的情况,预测正确类别概率为0.5,当roc曲线与横轴所围成面积越大、曲线越贴近左上角时,模型的分类性能越好。
[0070]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤3具体包括:对长短期记忆网络lstm进行改进,根据飞鸟和无人机飞行特点不同,使得航迹特征也有所不同的识别要求,飞鸟在飞翔过程中机动性更强,而无人机更加平稳,在lstm输入端,即神经网络内部记忆状态向量加入一可调权值器,当机动性强时则增加权值,放大航迹特征,便于航迹特征识别,采用lstm学习目标航迹的复杂的时间动态特性后,继续采用卷积神经网络对输入数据进行处理提取特征的流程中,通过反馈回路来优化处理参数获得最优解,采用位于中间处理过程中的隐藏层来提取存储输入数据中的关键特征。
[0071]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,改进后的lstm参数为:内存单元为256mb,输入数据向量个数为6个,全连接层采用的激活函数为sigmoid函数,优化器为adam优化器,学习率为0.001,训练周期数为200。
[0072]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,步骤4中,数据集的划分比例的根据在于无人机和飞鸟的数据集并不均衡,无人机数据量要比飞鸟数据量少,则在数据集实际比例划分时,增大了测试集所占比例。
[0073]
本发明实施例提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,计算量较小并且在低空小目标短航迹时其优点尤为突出,可以提升雷达系统目标分类识别性能,对于外辐射源雷达实际应用非常有意义。在另一实施例中,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类方法,包括:步骤1:本发明使用的无人机和飞鸟数据集是一系列以航迹为单位的txt文件,其中,飞鸟和无人机航迹文件数量共有73个。每一份航迹文件包含6个属性:分别为x、y、vx、vy、ax、az,分别代表目标的位置、速度、加速度信息,同时,每一份航迹文件的长度,即持续时间是不固定的。为方便介绍待处理的数据形式,从数据集中读取一份txt文件,格式如图4所示。在考虑选取输入网络中的特征参数时,由于文件中一、二列的时间戳和分组编号对分类结果影响较小,且数据处理比较复杂,故并不作为模型输入参数。因此实际上处理后的数据集形式如图5所示。数据集还包括两个csv文件:target.csv和datasetgroup.csv。target.csv文件用来存储无人机和飞鸟这两类目标的分类信息,用-1和1两种标签进行标注类别,-1代表无人机类别、1代表飞鸟类别。datasetgroup.csv文件用来存储训练集、测试集、验证集的划分信息。划分比例可以根据实验需要进行改变。在构建模型之前,需要对数据的类型进行处理。输入数据为包含无人机和飞鸟两个类别的所有航迹文件,每份航迹文件是以1秒为间隔采集的时间序列,将包含6列属性信息的时间序列处理为1个数组进行输入。遍历所有航迹文件,并存储在一个列表中。
[0074]
除了对航迹数据集进行处理外,也对存储目标分类结果的target.csv文件进行导入,存储为一个元素只有1,-1两种结果的数组;对存储数据集划分比例的datasetgroup.csv进行导入,存储为一个元素只有1,2,3三类结果的数组(1代表训练集、2代表验证集、3代表测试集)。由于每一份航迹文件的长度不同,存储数据的列表的每一个元素的尺度不统一,所以并不能直接使用现有数据集来建立模型。因此,我们需要确定一个合适的长度使得所有航迹文件统一。可考虑的方案如下:(1)使用数字0对所有长度小于最大长度的序列进行填充,填充到与最大长度相等。然而这样会导致提供给模型的数据错误较
大。使用每份航迹文件最后一行的数据进行填充到最大长度。(3)确定数据集中时间序列的最小长度,将所有其他序列截断至该长度。这种做法的弊端就是会导致大量数据的丢失。(4)计算所有航迹文件时间序列的平均值、将较长的序列截断,并填充比平均长度短的序列。因此,本发明选择方案四进行数据长度的统一,计算得到数据集文件长度的最大值、最小值、平均值如下表1所列:
[0075]
表1航迹文件长度统计
[0076][0077]
平均值反映整体数据长度的平均水平;标准差反映数据与平均值之间的离散程度;中位数反映数据长度中间层次的真实特征,弥补了平均数在偏态分布中的不足,用于提供相对尊重样本主要情况的统计量。接下来对数据进行区间估计,以确保大部分数据在区间范围内。
[0078]
对表格进行分析,数据长度的中位数为168,处于整体长度的中间,但是考虑到深度学习所要求的数据量,将数据截取到中位数,显然会损失掉大量真实数据,而同时也填充了许多不真实数据,会使得数据集的真实性下降很多。以平均值为例,平均值加减标准差形成一个置信区间,大部分数据集中在这个区间内,若选择以平均值作为标准长度,会使得超过四分之一的长数据文件损失大量数据。因此,考虑到为了尽可能减少长文件数据量的损失,对于标准数据长度的选择,本发明主要采取以下四种思路:
[0079]
(1)选择全部文件长度的平均值和标准差相加之和303作为标准长度。
[0080]
(2)选择较大四分位数224作为标准长度。
[0081]
(3)选择数据平均值190作为标准长度。
[0082]
(4)选择数据中位数168作为标准长度。
[0083]
选择标准长度的差异对模型分类准确率带来的影响,将会在步骤4中对比。
[0084]
步骤2:本论文搭建的无人机和飞鸟航迹分类模型为二分类模型,因此考虑用以下分类指标进行模型性能的定量评估,分别是正确率、精确率、召回率、f1-score。
[0085]
为直观了解模型分类结果,使用分类矩阵tp、fn、fp、tn来描述分类的结果,其含义如下:
[0086]
tp(true positive):实际分类为正、且预测类别也为正的样本数。
[0087]
fn(false positive):实际分类为负、但预测类别为正的样本数。
[0088]
fp(false negative):实际分类为负、且预测类别也为负的样本数。
[0089]
tn(true negative):实际分类为正、但预测类别为负的样本数。
[0090]
对于一个理想的二分类器来说,要求fn与fp都为0。但显然实际场景中基本不能达到这种理想情况,所以采用分类指标来根据这四类样本的数量对分类模型的性能进行评估。fn、fp值越小,分类模型性能越好。
[0091]
步骤3:在步骤1和步骤2中,处理了可变长度序列并创建了训练集、验证集和测试集,准备好了用于lstm分类模型的数据,并提出了采取的分类指标来对模型进行评估,在本步骤3进行模型的搭建。
[0092]
lstm神经网络是在递归神经网络(rnn)的基础上改进而成。在rnn网络中,隐藏层的建立是为了保证信息的持久性。但是rnn网络只能记住一小段时间,一旦输入了很长时间的信息,由于rnn训练阶段出现的梯度消失或者梯度爆炸问题,这些信息就会丢失。
[0093]
因此,对于长时间时间序列问题,采用改进的rnn网络,即长短期记忆网络lstm来解决。lstm网络通过特定的门(gate)来决定是否存储相应的信息,在预测时间序列方面这种特定的体系结构是非常有效的。
[0094]
lstm网络有一个像rnn网络一样的结构,但重复模块之外又有一个特定的结构。图1表示一个lstm单元的组成结构。这个单元有两个基本部分:状态单元和门。单层的lstm网络一般会使用三个门:输入门、遗忘门和输出门。遗忘门可以由如下公式2.1表示:
[0095]ft
=σ(wf(h
t-1
,x
t
) bf)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.1)
[0096]
其中,σ表示sigmoid激活函数,wf和bf分别表示这一层的权重和偏置。遗忘门通过比较前一单元输出h
t-1
和当前时刻的输入信息x
t
,然后向状态单元c
t-1
输出一个0-1之间的数值,0代表遗忘门希望状态单元完全忘记该信息,1代表遗忘门想要记住整条信息。
[0097]
接着,输入门会根据过去的序列信息,决定需要存储哪些新信息。输入门的工作方式和遗忘门类似,如公式2.2所示。其连接了一个tanh层来创建出一个候选向量由公式2.3表示。
[0098]it
=σ(wi(h
t-1
,x
t
) bi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.2)
[0099][0100]
其中,wc和bc分别为这一层的权重和偏置。
[0101]
根据上文所述,状态单元和门是连接的,门可以根据状态单元的需要决定添加或者删除信息。下一步操作为更新c
t-1
来获取新的单元状态c
t
。数学实现方法如公式2.4所示。
[0102][0103]
最后,通过输出门完成信息输出。在这一过程中,sigmoid函数用于定义输出,如公式2.5所示,然后tanh函数将单元状态乘以sigmoid门的输出,从而获得所需的输出信息,如公式2.6所示。
[0104]ot
=σ(wo(h
t-1
,x
t
) bo)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.5)
[0105]ht
=o
t
*tanh(c
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.6)
[0106]
本发明构建的lstm分类模型具体设置如表2所列:
[0107]
表2分类模型参数设置
[0108][0109]
采用ltsm学习目标航迹的复杂的时间动态特性后,还需要进一步提取特征并分类,因此,继续采用卷积神经网络(cnn)来完成,cnn对输入数据进行处理提取特征的流程中,通过反馈回路来优化处理参数获得最优解,并用位于中间处理过程中的隐藏层来提取存储输入数据中的关键特征。cnn网络主要由卷积层和池化层构成。卷积层包含多个神经元,其神经元个数与所需要提取特征有关,每个神经元只接收来自相邻的局部感受野数据,与共享权值矩阵相乘并进行累加,累加结果输入非线性的sigmoid函数运算可增加非线性分割能力,用卷积核对初始数据扫描以学习输入信号特征。池化层接在卷积层后以防止网络出现过拟合,池化层根据局部相似性进行二次特征提取,滤除无效参数,减小了参数的空间维度。本发明构建的lstm-cnn分类模型如图6所示。
[0110]
步骤4:本步骤主要进行训练测试,首先,需要解决的是关于数据集的划分比例,考虑到无人机和飞鸟的数据集是并不均衡的,无人机数据量要比飞鸟数据量少很多,并且整体数据集比较小,因此在数据集实际比例划分时,有意增大了测试集所占比例,具体训练集、验证集、测试集划分比例为5:1:4。
[0111]
在此基础上,使用步骤1中选定的四种标准长度以及average函数三种不同参数进行模型的对比训练,并进行结果分析。
[0112]
对于average函数的参数选择,实际上是指选择不同参数时,在进行准确率、召回率、f1-score计算时,计算方式会有所不同。在这里进行讨论的average函数参数主要为以下三个:微平均(micro)、宏平均(macro)、加权平均(weighted)。
[0113]
(1)微平均是指在进行计算准确率、召回率指标时,不考虑单一类别,而是把所有类别一起考虑。这样的做的缺点是对样本中两种类别的每一个个体平等考虑,忽略了两种类别样本数量的比例差异。
[0114]
(2)宏平均是指在进行公式计算时,先分别计算两种类别的准确率或召回率再计算两者之和并除以2得到最终准确率或者召回率。
[0115]
(3)相比宏平均,加权平均则是考虑到不同类别样本数量的差异,在计算最终准确率或召回率时,对每一种类别乘以其所占权重。这样做的好处则是不会使样本数量少的类别的权重丢失,更加贴近真实分类结果。
[0116]
对上述四种标准数据长度及微平均、宏平均、加权平均三种计算方式进行模型的对比分析如下:
[0117]
在四种不同标准长度的选择下,计算每种长度在微平均、宏平均、加权平均三种不同average函数参数下的模型的正确率、准确率、召回率和f1-score值。模型对比结果如表3至表6所示。
[0118]
表3数据标准长度为303时不同计算方式的训练结果对比
[0119][0120]
表4数据标准长度为224时不同计算方式的训练结果对比
[0121][0122]
表5数据标准长度为190时不同计算方式的训练结果对比
[0123][0124]
表6数据标准长度为168时不同计算方式的训练结果对比
[0125][0126]
对表格3至6进行分析,当数据标准长度选择为303和224时,模型分类的正确率、准确率、召回率、f1-score均较高,都在83%左右。这可能与数据集保留了较多长文件的真实数据有关,使得分类结果的准确率比较高。
[0127]
当数据长度取平均值190时,与前两种相比,模型性能稍微下降,分类的正确率、准确率、召回率、f1-score在79%左右。当数据长度取中位数160时,可以看出模型性能显著下降,模型分类的正确率、准确率、召回率、f1-score较低,在50%左右。这与在进行数据处理时,截断了太多真实数据、而同时填充了太多非真实数据有关。
[0128]
因此,在标准长度的选取上,我们可以选择303或者224两种长度,原因是这两种长度在四类分类指标上的表现差距很小,模型性能均较好。
[0129]
另外,对average函数参数选择进行分析,虽然三种参数之间的差别不大,还是可以看出当使用宏平均方式进行计算时,模型准确率、召回率和f1-score值均低于另外两种。
[0130]
使用微平均方式和使用加权平均方式时,模型性能差距较小。两者相比,使用加权平均方式时,模型准确率、召回率和f1-score略高,为83%左右。这可能是因为无人机和飞鸟的数据集并不是均衡的,采取加权平均的方式能更好的保证数据量少的类别的权重。
[0131]
(2)对四种不同标准长度下的模型在训练集和验证集上的正确率和loss函数变化趋势进行绘图。
[0132]
在数据长度分别选择为303、224、190、168时,模型在训练集和验证集上的正确率、loss函数变化曲线。图片横坐标均为训练周期,纵坐标分别为正确率和loss下降。
[0133]
当数据长度为303时,模型在训练集和验证集上的正确率均较高,在训练集上的loss函数下降正常平滑,在验证集上的loss函数下降稍有波动,大体上仍保持下降趋势,模型分类性能良好。
[0134]
当数据长度为224、190、168时,训练集上的正确率训练到最优时的周期数均较小,在训练周期100以内正确率曲线停止增长。同样,对loss曲线进行分析,数据长度为224和190时,验证集上loss曲线拐点出现较早,并在拐点之后loss曲线剧烈上升波动。当数据长度为160时,loss曲线几乎从一开始便发生剧烈波动,在验证集上的正确率显著下降。
[0135]
导致这种情况的原因可能是当选择的数据长度较短时,模型训练产生的各节点权重数量变少,使得模型很快便完成训练,由于训练周期较大,loss曲线出现过拟合,模型从训练集到验证集上的泛化能力较差。此外由于模型数据量较小,验证集比例较小以及数据长度短导致的数据真实性下降,验证集上分类结果存在较大误差,使得模型分类性能稳定性较差。
[0136]
(3)对四种不同标准长度下的模型在测试集上的roc曲线变化趋势进行绘图。
[0137]
横坐标轴为假正例率,纵坐标轴为真正例率。一个理想分类器的roc坐标点位于(0,1)处,当曲线与横轴所围成面积越大、曲线越贴近左上角时,模型的分类性能越好。当数据长度为303时,roc曲线与横轴围成的面积为0.79,模型分类性能较好;当数据长度为224或190时,roc曲线与横轴围成的面积分别为0.69和0.66,模型分类性能稍有下降;当数据长度为168时,模型分类性能显著下降,roc曲线与横轴围成的面积仅为0.53。
[0138]
因此,根据以上分析,考虑到数据长度为303、计算方式选择加权平均时,模型性能在五类评价指标上的表现更加稳定、roc曲线与横轴围成的面积更大,且保留了更多真实数据。本论文最终确定的最优模型为数据标准长度为303、average参数选择加权平均(weighted)时的模型,模型分类正确率为82.76%、准确率为83.56%、召回率为82.76%、f1-score值为0.8306以及roc曲线与横轴围成的面积为0.79,模型分类性能良好。
[0139]
本发明各个实施例的实现基础是通过具有处理器功能的设备进行程序化的处理实现的。因此在工程实际中,可以将本发明各个实施例的技术方案及其功能封装成各种模块。基于这种现实情况,在上述各实施例的基础上,本发明的实施例提供了一种基于外源雷达的飞鸟与无人机航迹目标分类装置,该装置用于执行上述方法实施例中的基于外源雷达的飞鸟与无人机航迹目标分类方法。参见图2,该装置包括:第一主模块,用于实现步骤1、获取无人机和飞鸟航迹数据并进行预处理,将目标的位置、速度、加速度信息作为特征输入向量,计算所有航迹文件时长序列数据的平均值,确定文件的四种标准长度,将较长的序列截断,并填充比平均长度短的序列,使得所有航迹文件长度统一,对航迹文件时长序列数据进行预处理,将局部异常值去除并进行切比雪夫去噪;第二主模块,用于实现步骤2、建立无人机和飞鸟航迹二分类模型,并构建分类指标进行二分类模型性能的定量评估,所述分类指标分别是正确率、精确率、召回率、f1-score和roc曲线,其中f1-score是综合考虑精确率和召回率而产生的指标;第三主模块,用于实现步骤3、构建由改进的lstm单元和卷积神经网络cnn组成的飞行航迹深度学习网络;第四主模块,用于实现步骤4、划分数据集进行训练,训练集、验证集、测试集划分比例为5:1:4,使用步骤1选定的四种标准长度以及average函数三种不同参数进行模型的对比训练,并进行结果分析。
[0140]
本发明实施例提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,采用图2中的若干模块,计算量较小并且在低空小目标短航迹时其优点尤为突出,可以提升雷达系统目标分类识别性能,对于外辐射源雷达实际应用非常有意义。
[0141]
需要说明的是,本发明提供的装置实施例中的装置,除了可以用于实现上述方法实施例中的方法外,还可以用于实现本发明提供的其他方法实施例中的方法,区别仅仅在于设置相应的功能模块,其原理与本发明提供的上述装置实施例的原理基本相同,只要本领域技术人员在上述装置实施例的基础上,参考其他方法实施例中的具体技术方案,通过组合技术特征获得相应的技术手段,以及由这些技术手段构成的技术方案,在保证技术方案具备实用性的前提下,就可以对上述装置实施例中的装置进行改进,从而得到相应的装置类实施例,用于实现其他方法类实施例中的方法。例如:
[0142]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第一子模块,用于实现步骤1中的无人机和飞鸟航迹数据具体为:目标的位置、速度、加速度信息;步骤1中特征输入向量为target.csv和datasetgroup.csv。target.csv文件用来存储无人机和飞鸟这两类目标的分
类信息,用-1和1两种标签进行类别标注,-1代表无人机类别、1代表飞鸟类别;datasetgroup.csv文件用来存储训练集、测试集、验证集的划分信息;划分比例根据实际需要进行改变;步骤1中的航迹文件长度统一的方法为:计算所有航迹文件时长序列的平均值,将较长的序列截断,并填充比平均长度短的序列,平均值为整体数据长度的平均水平,对数据进行区间估计,以确保超过百分之八十的数据在区间范围内;对于标准数据长度,选择数据中位数作为标准长度。
[0143]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第二子模块,用于实现步骤1中的航迹文件时长序列数据进行预处理采用的基于区域奇异因子去除奇异值,区域奇异因子为:
[0144][0145]
其中,k为p点的临节点,k(p)为p点的集合,lk(p)为p点区域密度,lk(a)为a点区域密度,p点的区域奇异系数lof(p)为p点的区域平均密度与p点自身密度之比,若lof(p)越大则p点相对于区域邻点为奇异值的概率就越大,反之则越小。
[0146]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第三子模块,用于实现步骤2中的正确率、精确率、召回率、f1-score为:
[0147]
正确率是指预测正确的样本数占总样本数的比例,计算公式为:
[0148][0149]
其中,accuracy为正确率,tp为实际分类为正、且预测类别也为正的样本数,tn为实际分类为正、但预测类别为负的样本数,fp为实际分类为负、且预测类别也为负的样本数,fn为实际分类为负、但预测类别为正的样本数;
[0150]
精确率是指预测类别为正且预测正确的样本数占所有预测类别为正的样本数的比例,计算公式为:
[0151][0152]
其中,precision为精确率;
[0153]
召回率是指预测类别为正且预测正确的样本数占所有实际类别为正的样本数的比例,计算公式为:
[0154][0155]
其中,recall为召回率;
[0156]
f1-score是综合考虑精确率和召回率而产生的指标,计算公式为:
[0157][0158]
当precision和recall都为1时,f1-score达到最大值1,作为综合考虑精确率和召回率来进行分类性能评估的指标,若精确率和召回率任意一个值小,则相应导致f1-score值小,即说明模型分类性能不好;
[0159]
roc曲线是一种坐标图式的分析工具,使用于二分类模型,roc曲线横轴为假正例率,纵轴为真正例率;
[0160]
fpr是指在类别为负类的样本中,被错误地判断为正类的比率,计算公式为:
[0161][0162]
tpr是指在类别为正类的样本中,被正确地判断为正类的比率,计算公式为:
[0163][0164]
若给定二分类模型和阈值,则在roc曲线上生成一个坐标点,随着阈值的变化,画出整个roc曲线,在roc曲线以上的点代表更好的分类结果,在roc曲线以下的点代表更差的分类结果,对角线代表随机分类的情况,预测正确类别概率为0.5,当roc曲线与横轴所围成面积越大、曲线越贴近左上角时,模型的分类性能越好。
[0165]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第四子模块,用于实现步骤3具体包括:对长短期记忆网络lstm进行改进,根据飞鸟和无人机飞行特点不同,使得航迹特征也有所不同的识别要求,飞鸟在飞翔过程中机动性更强,而无人机更加平稳,在lstm输入端,即神经网络内部记忆状态向量加入一可调权值器,当机动性强时则增加权值,放大航迹特征,便于航迹特征识别,采用lstm学习目标航迹的复杂的时间动态特性后,继续采用卷积神经网络对输入数据进行处理提取特征的流程中,通过反馈回路来优化处理参数获得最优解,采用位于中间处理过程中的隐藏层来提取存储输入数据中的关键特征。
[0166]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第五子模块,用于实现改进后的lstm参数为:内存单元为256mb,输入数据向量个数为6个,全连接层采用的激活函数为sigmoid函数,优化器为adam优化器,学习率为0.001,训练周期数为200。
[0167]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于外源雷达的飞鸟与无人机航迹目标分类装置,还包括:第六子模块,用于实现步骤4中,数据集的划分比例的根据在于无人机和飞鸟的数据集并不均衡,无人机数据量要比飞鸟数据量少,则在数据集实际比例划分时,增大了测试集所占比例。
[0168]
本发明实施例的方法是依托电子设备实现的,因此对相关的电子设备有必要做一下介绍。基于此目的,本发明的实施例提供了一种电子设备,如图3所示,该电子设备包括:至少一个处理器(processor)、通信接口(communications interface)、至少一个存储器(memory)和通信总线,其中,至少一个处理器,通信接口,至少一个存储器通过通信总线完
成相互间的通信。至少一个处理器可以调用至少一个存储器中的逻辑指令,以执行前述各个方法实施例提供的方法的全部或部分步骤。
[0169]
此外,上述的至少一个存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个方法实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0170]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0171]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的一些部分所述的方法。
[0172]
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。基于这种认识,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0173]
需要说明的是,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括
……
"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0174]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和
范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献