一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

利用多元多步预测技术的航天器姿态系统异常检测方法与流程

2021-09-14 23:21:00 来源:中国专利 TAG:航天器 异常 遥测 姿态 检测方法


1.本技术涉及航天器遥测数据异常检测技术领域,特别是涉及一种利用多元多步预测技术的航天器姿态系统异常检测方法。


背景技术:

2.航天技术的发展推动着人类活动领域从大气层扩展到宇宙空间。航天器是综合利用电子、机械、材料、能源、控制科学以及计算机科学等多学科领域尖端知识的大型多功能复杂系统,其研制需要耗费大量的人力、资源。而随着信息技术的迅速发展,航天器这样大型复杂系统的功能不断完善和增加,伴随着是其组件更多更复杂,组件之间的组合和协同更加困难,且一旦出现问题就会造成系统异常甚至故障。并且,航天器身处复杂未知的太空中,由于各种不可避免的难以预见的因素的影响,如辐射、太空碎片等,导致系统可能会出现各种各样的异常,以致影响系统的可靠性,使得其难以完成预定的功能,甚至造成严重的经济损失和灾难性事故。
3.卫星是数量最多的航天器,承担着科学探测、通讯、气象观测、导航、侦察等重要科学研究和实际应用任务。卫星是一个复杂的被控对象,作为卫星最重要的控制子系统的姿态控制系统,主要承担姿态确定和姿态控制两大任务,即获取卫星所处的位置在状态,控制卫星按照预定的轨道和姿态运行,确保卫星完成飞行、工作任务。据统计,与其他控制系统相比,姿态控制系统更容易遭受外太空影响发生故障,且直接影响卫星的运行,危害更严重。因此构建姿态系统异常检测模型,对姿态系统运行状态实时监测,在发生异常时予以警告,人工排查,避免发生重大故障,保障姿态系统正常运行。
4.姿态系统异常检测主要包括两个方面,首先是检测是否发生异常,接着需要定位异常产生的原因及部件。在实际运用中,基于信号监测的门限值检验,冗余配件或者功能相关部件的一致性、相关性检测仍有着广泛的运用,但是前者可能会受到噪声、环境变化的影响,造成误检,后者冗余需要增加额外的设备及相应维护成本,因此基于模型、数据等的异常检测方法受到学者专家的重视。目前前沿的研究主要分为三大类:基于模型、基于数据、基于混合模型及数据的异常检测。
5.由于大部分控制系统都是基于物理、数学建模,因此,基于模型的异常检测有科学的理论基础,近几十年在卫星姿态系统中应用比较多。基于模型的异常检测构建系统的数学模型,利用状态估计、参数估计、等价空间方程等方法产生残差,然后基于该残差解析进行异常检测。但是随着卫星控制系统日趋复杂,传统的建模方法越来越难以对其部件或者整体建立精确的模型。并且环境的不确定性导致基于建模的异常检测方法适应性较弱,越来越难应对姿态系统这种多变量、非线性的复杂系统。一方面,研究偏向于状态/参数同步估计和基于多模型的集成、考虑不确定性因素的鲁棒建模等更为复杂的建模,另一方面,数据驱动的建模和异常检测也在引起业界的重视。
6.数据驱动的异常监测被成功运用到工业复杂系统。对于姿态系统而言,数据驱动的异常越来越受到业界和学术界的重视。对目前已有研究的整理,根据异常的类型是单参
数异常还是多参数异常,也可以单元异常检测和多元异常检测量大类。单元异常一般针对某一个或者一类参数进行分析,姿态系统对这类的研究较少。姿态系统参数众多,模态复杂,因此对其多元异常研究较多。多元异常检测方法可分为监督学习和非监督学习两大类。若异常数据已经被提前标注,则使用机器学习等分类器对其进行异常识别。对于未标注的异常,随着机器学习、深度学习的发展,基于数据驱动的异常检测也凭借其优秀的检测效果和对不确定性的适应性,得到了越来越多的认可和应用。
7.混合模型是前两种方法的结合,将数据驱动的方法模型结合观测器滤波器等,实现兼顾模型的科学严谨性和数据的高效性。在获得精确的数学模型的情况下,基于观测的方法是直接有效的,但是在实际运用中,对模型不确定性、时滞、建模误差等的影响不可忽视。相较于传统的状态估计需要基于物理系统进行精确建模,对状态进行重构,不少研究利用神经网络强大的非线性拟合能力,将神经网络融合精确建模构建观测器。融合模型由于其跨领域的难度,目前研究较少。


技术实现要素:

8.基于此,有必要针对上述技术问题,提供一种针对卫星姿态控制系统结构复杂且参数众多,工作状态模式多且特征复杂等特点的利用多元多步预测技术的航天器姿态系统异常检测方法。
9.一种利用多元多步预测技术的航天器姿态系统异常检测方法,包括:
10.获取航天器姿态系统多个参数的样本数据,所述样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
11.对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各所述平稳状态参数相关的辅助参数,并根据所述平稳状态参数和辅助参数对应的样本数据构建训练数据集;
12.对所述训练数据集进行标准化处理,得到标准数据集;
13.基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将所述标准数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,所述已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
14.根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
15.获取航天器姿态系统中多个待检测参数历史时间的实际数据,并对所述实际数据进行标准化处理得到标准化的实际数据;
16.将所述标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各所述待检测参数的实时预测数据;
17.获取各所述待检测参数的实时真实数据,并分别计算各所述待检测参数的实时真实数据与对应时刻的实时预测数据之间的误差,再通过对比所述误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
18.在其中一实施例中,对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各平稳状态参数相关的辅助参数包括:
19.对各所述样本数据进行平稳性分析,在所述多个参数中选取具有平稳状态的参数作为所述多个平稳状态参数;
20.根据各所述样本数据以及多个平稳状态参数进行相关性分析,在所述多个参数中选取与各所述平稳状态参数相关的参数作为所述辅助参数。
21.在其中一实施例中,所述训练数据集输入所述多元多步预测神经网络进行训练包括:
22.所述长短期记忆神经网络包括多个依次连接的处理层,各所述处理层接收不同时刻样本数据作为输入数据,并进行相应处理后输出该处理层对应的输出数据;
23.根据所述处理层时间步的输出数据以及对应的真实数据基于注意力机制匹配得到所述处理层各时间步输出的向量权重;
24.将所述处理层各时间步输出的向量权重与所述处理层各时间步输出数据进行加权计算后,融入所述多元多步预测神经网络的最终预测计算中。
25.在其中一实施例中,所述多元多步预测神经网络进行训练之前还包括:
26.对所述多元多步预测神经网络输入的样本数据的时间序列长度进行预设,以及对所述多元多步预测神经网络输出的预设数据的时间序列长度进行预设。
27.在其中一实施例中,在将所述标准化的实际数据输入已训练的多元多步预测神经网络之前包括:
28.对所述多元多步预测神经网络输入的实际数据的时间序列长度进行预设,以及对所述多元多步预测神经网络输出的实际预设数据的时间序列长度进行预设。
29.在其中一实施例中,根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值包括:
30.根据各所述平稳状态参数预测数据以及真实数据计算一段时间内各平稳状态参数的误差时间序列;
31.根据各所述误差时间序列的均值和方差采用3西格玛法则计算得到与各所述平稳状态参数的误差阈值。
32.一种利用多元多步预测技术的航天器姿态系统异常检测装置,所述装置包括:
33.样本数据获取模块,用于获取航天器姿态系统多个参数的样本数据,所述样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
34.训练数据集构建模块,用于对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各所述平稳状态参数相关的辅助参数,并根据所述平稳状态参数和辅助参数对应的样本数据构建训练数据集;
35.标准化处理模块,用于对所述训练数据集进行标准化处理,得到标准数据集;
36.神经网络训练模块,用于基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将所述标准数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,所述已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
37.误差阈值计算模块,用于根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
38.实际数据获取模块,用于获取航天器姿态系统中多个待检测参数历史时间的实际
数据,并对所述实际数据进行标准化处理得到标准化的实际数据;
39.实际预测数据得到模块,用于将所述标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各所述待检测参数的实时预测数据;
40.系统异常检测模块,用于获取各所述待检测参数的实时真实数据,并分别计算各所述待检测参数的实时真实数据与对应时刻的实时预测数据之间的误差,再通过对比所述误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
41.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
42.获取航天器姿态系统多个参数的样本数据,所述样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
43.对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各所述平稳状态参数相关的辅助参数,并根据所述平稳状态参数和辅助参数对应的样本数据构建训练数据集;
44.对所述训练数据集进行标准化处理,得到标准数据集;
45.基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将所述标准数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,所述已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
46.根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
47.获取航天器姿态系统中多个待检测参数历史时间的实际数据,并对所述实际数据进行标准化处理得到标准化的实际数据;
48.将所述标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各所述待检测参数的实时预测数据;
49.获取各所述待检测参数的实时真实数据,并分别计算各所述待检测参数的实时数据与对应时刻的实时预测数据之间的误差,再通过对比所述误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
50.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
51.获取航天器姿态系统多个参数的样本数据,所述样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
52.对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各所述平稳状态参数相关的辅助参数,并根据所述平稳状态参数和辅助参数对应的样本数据构建训练数据集;
53.对所述训练数据集进行标准化处理,得到标准数据集;
54.基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将所述标准数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,所述已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
55.根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
56.获取航天器姿态系统中多个待检测参数历史时间的实际数据,并对所述实际数据进行标准化处理得到标准化的实际数据;
57.将所述标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各所述待检测参数的实时预测数据;
58.获取各所述待检测参数的实时真实数据,并分别计算各所述待检测参数的实时真实数据与对应时刻的实际实时预测数据之间的误差,再通过对比所述误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
59.上述利用多元多步预测技术的航天器姿态系统异常检测方法,通过利用注意力机制对长短期记忆模型进行改进得到多元多步预测神经网络,该神经网络可通过对多个航天器姿态系统的不同参数的多个历史时刻获取的数据进行预测,得到下几个时刻的预测数据,这样根据下一时刻的实际数据以及与对应时刻的预测数据进行计算得到两者之间的误差,再将该误差与对应参数的误差阈值进行对比以实现对航天器姿态系统异常检测。该方法可有效实现对姿态系统遥测参数的实时监测,从而进行异常检测。
60.附图说明
61.图1为一个实施例中航天器姿态系统异常检测方法的流程示意图;
62.图2为一个实施例中lstm中数据处理过程图;
63.图3为一个实施例中attention机制示意图;
64.图4为一个实施例中多元多步预测神经网络的结构示意图;
65.图5为一个实施例中多元时间序列多步预测的输入输出阵列示意图;
66.图6为数据实验中航天器姿态系统异常检测方法步骤示意图;
67.图7为数据实验中步骤一姿态系统周期性参数的可视化图;
68.图8为数据实验中步骤一姿态系统参数相关性的热力图;
69.图9为数据实验中步骤四中多步预测每一步预测误差示意图;
70.图10为数据实验中步骤六中人工构建的三类异常示意图;
71.图11为数据实验中步骤八中四种模型对常值异常和时变异常的识别示意图;
72.图12为数据实验中步骤八中四种模型对卡死异常的识别示意图;
73.图13为一个实施例中航天器姿态系统异常检测装置的结构框图;
74.图14为一个实施例中计算机设备的内部结构图。
具体实施方式
75.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
76.如图1所示,本技术提供了一种利用多元多步预测技术的航天器姿态系统异常检测方法,包括以下步骤:
77.步骤s100,获取航天器姿态系统多个参数的样本数据,样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
78.步骤s110,对各样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各平稳状态参数相关的辅助参数,并根据平稳状态参数和辅助参数对应的样本数据构建训练数据集;
79.步骤s120,对训练数据集进行标准化处理,得到标准数据集;
80.步骤s130,基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将训练数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
81.步骤s140,根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
82.步骤s150,获取航天器姿态系统中多个待检测参数历史时间的实际数据,并对实际数据进行标准化处理得到标准化的实际数据;
83.步骤s160,将标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各待检测参数的实时预测数据;
84.步骤s170,获取各待检测参数的实时真实数据,并分别计算各待检测参数的实时真实数据与对应时刻的实时预测数据之间的误差,再通过对比误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
85.在本实施例中,步骤s100至s140为使用训练数据集对基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络进行训练,且计算各平稳状态参数的误差阈值,而步骤s150到s170为利用已训练的多元多步预测神经网络对多个参数下一时段多个时刻的数据进行预测,再通过预测得到的数据与实际得到数据的误差,对当前姿态系统是否异常进行判断。
86.在本实施例中,多元多步是指利用多个参数在多个历史时刻接收的数据对下一段多个时刻的数据进行预测。
87.在步骤s100中,获取的样本数据为航天器姿态系统中不同参数的历史遥测数据,并且该样本数据中的数据均为正常数据。各数据样本均包含有一段时间内各个时刻对应接收到的数据,也就是时间序列数据。
88.在步骤s110中,对各样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各平稳状态参数相关的辅助参数包括:对各样本数据进行平稳性分析,在多个参数中选取具有平稳状态的参数作为多个平稳状态参数,根据各样本数据以及多个平稳状态参数进行相关性分析,在多个参数中选取与各平稳状态参数相关的参数作为辅助参数。
89.具体的,先对各样本数据进行平稳性分析,平稳性是时间序列预测模型建立的基本检验之一。时序预测是基于历史和现在进行未来的预测,因此数据需要有一些基本特征是保持不变的,即数据是平稳的,预测才有意义。
90.其中,平稳性分析的方法包括但不限于:adf单位根检验、滚动统计值等。adf单位根检验的原假设是时间序列中具有单位根,将得到的t统计量与不同程度(1%,5%,10%)拒绝原假设的统计值作对比,如果t统计量小于1%拒绝原假设,则可以在99%的置信区间
上拒绝原假设,认为时间序列是平稳的;而当t统计量在1%到5%拒绝原假设之间,则在95%的置信区间上拒绝原假设,此时需要结合检验要求决定时间序列是否平稳。而参数p

value要求小于给定的显著水平,最好非常接近于0,滚动统计值等。
91.在这样通过平稳性分析可以选取各参数中状态较为平稳的参数,由于,在航天姿态系统中的各参数是互相影响的,再通过相关性分析在剩下的参数中选取与状态平稳参数相关的参数以辅助预测,使得后续得到的多元多步预测神经网络可进行更为精准的预测。
92.具体的,相关性分析主要用到皮尔逊相关系数(pearson correlation),通常也称为r值,用于度量变量与变量之间(也就是参数与参数之间)的相关程度。在对数据通过了显著性检验后,相关系数越高表明两者间关系越密切。pearson相关系数公式如下:
[0093][0094]
在公式(1)中,x
i
和y
i
表示两种变量中对应的点位值。r的取值范围在1和

1之间,取值越接近1则越正相关,越接近

1则越负相关;当r取值接近0时,则相关程度越低。
[0095]
在步骤s120中,将选取的多个平稳状态参数与相关的辅助参数对应样本数据构建的训练数据集进行标准化处理,得到均值为0,方差为1的标准数据集。
[0096]
具体的,数据标准化处理如下:
[0097]
假设z=[z1,z2,...,z
n
]
t
∈r
m
表示一组n
×
m高维数据,其中m表示参数的数量,每个参数包含s个独立采样样本,构造出遥测参数数据矩阵,其中每一列代表一个参数变量,每一行代表一个样本数据。对矩阵z进行标准化处理得到矩阵x=[x
ij
],其中:每个参数的均值、标准差计算方式分别为:
[0098]
在将数据进行标准化处理之后,多元多步预测神经网络进行训练之前还包括:对多元多步预测神经网络输入的样本数据的时间序列长度进行预设,以及对多元多步预测神经网络输出的预设数据的时间序列长度进行预设,也就是对多元多步预测神经网络进行输入输出步长设置。例如,各参数的样本数据包括20个连续的时间点对应的数据,若设置神经网络输入的步长为10,输出的步长为5,则是将前10个时间点对应的数据输入神经网络中输出对后5个时间点数据的预测值。
[0099]
在后续对多元多步预测神经网络进行训练时,为了提高神经网络的精度,可将标准数据集分为划分训练集和测试集,在其中一实施例中,训练集中的标准数据占到标准数据集的80%,而测试集中的标准数据占到标准数据集的20%。这样先通过利用训练集对多元多步预测神经网络进行训练,得到初步完成的神经网络,再利用测试集对神经网络的预测能力进行调整以使得多元多步预测神经网络的预测能力达到期望值。
[0100]
在步骤s130中,多元多步预测神经网络实际上是基于注意力机制对长短期记忆神
经网络进行改进得到神经网络。
[0101]
其中,长短期记忆神经网络也就是long

short term memory模型,简称lstm模型。该模型主要思想是引入自适应门控机制,决定lstm单元在多大程度上保持以前的状态,并记住当前数据输入的提取特征。
[0102]
在训练过程中,每个lstm单元,如图2所示,学习如何权衡其输入组件(输入门),调节对内存的贡献(输入调制器),删除内存单元的权重(忘记门),释放内存的权重(输出门)。每个个lstm单元中数据处理处理过程如下:
[0103]
f
t
=σ(w
f
·
[h
t
‑1,x
t
] b
f
)
ꢀꢀꢀꢀꢀꢀ
(2)
[0104][0105]
i
t
=σ(w
i
·
[h
t
‑1,x
t
] b
i
)
ꢀꢀꢀꢀꢀ
(4)
[0106][0107]
o
t
=σ(w
o
[h
t
‑1,x
t
] b
o
)
ꢀꢀꢀꢀꢀꢀꢀ
(6)
[0108]
h
t
=o
t
*tanh(c
t
)
ꢀꢀꢀꢀꢀꢀꢀ
(7)
[0109]
在公式(2

7),t为新时刻,x
t
为外部输入的标准数据集中的数据,h
t
‑1为上一时刻的输出(短时记忆)、c
t
‑1为上一时刻的长时记忆的控制,当前时刻新信息,c
t
为新的长时记忆,h
t
为这一时刻关注的记忆,σ为激活函数;w
i
,w
c
,w
f
,w
o
分别为输入门、记忆门、遗忘门、输出门的权重,b
i
,b
c
,b
f
,b
o
分别为输入门、记忆门、遗忘门、输出门的偏差;f
t
是遗忘门,i
t
是输入门,o
t
是输出门。
[0110]
如图3所示,注意力机制也就是attention机制,attention思想就是根据当前状态判断输入序列的权重分布。计算公式如下,其中h=[h1,h2,...,h
t
]为隐藏层的状态,α为权重。其中w是参数向量,t为步长,h∈r
d
×
t
,w,α,r的维度分别是r
d
×1,r1×
t
,r
d
×1权重的获取是通过序列的每一个元素与其他元素的对比,确定每个函数的得分,再进行归一化,最终的输出为在原来隐藏层的基础上乘以其对应的权重。
[0111]
m=tanh(h)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0112]
α=softmax(w
t
m)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0113]
r=hα
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0114]
h
*
=tanh(r)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0115]
再基于attention机制改进lstm模型得到元多步预测神经网络,改进lstm模型(a

lstm)是在传统lstm模型的基础上增加了attention机制,attention通过对lstm隐藏层输出序列进行权重分布的计算,进一步对重要重要信息进行捕捉,提升lstm网络预测效果。
[0116]
具体的,在公式(8)中,将隐藏层h状态用激活函数tanh处理,经过激活函数将线性变成非线性,效果更好。然后通过公式(9),得到权重。在公式(10)中的r是隐藏层和权重相乘加权。在公式(11)的h*是再加激活函数后输出。神经网络相比于线性拟合的优势,就是非线性强大的拟合能力,就是通过激活函数实现的。
[0117]
在步骤s130中,训练数据集输入多元多步预测神经网络进行训练包括:长短期记忆神经网络包括多个依次连接的处理层(也就是lstm单元),各处理层接收不同时刻样本数据作为输入数据,并进行相应处理后输出该处理层对应的输出数据;
[0118]
根据处理层各时间步的输出数据以及对应的真实数据基于注意力机制匹配得到处理层各时间步输出的向量权重;
[0119]
将处理层各时间步输出的向量权重与处理层各时间步输出数据进行加权计算后,融入多元多步预测神经网络的最终预测计算中。
[0120]
如图4所示,将lstm模型的自循环进行展开,它的工作是不停的接收每个时间步的并且输出h
t
,lstm再时间维度进行信息的循环和保留。attention机制对每个时间步(也就是时间点)的h
t
与最终的真实值y进行匹配操作,得到每个时间步的匹配向量权重α
t
,最终将权重与时间步加权融入到最终预测序列的计算,基于预测值赋予注意力分配系数,即权重参数层,从而提升lstm的预测效果。
[0121]
具体的,lstm模型是多步预测,每一步都会出来一个结果,将这个结果与下一步数据一起预测,得到下一个步的预测结果。这样循环,最终的最后结果为预测值。但是加入attention之后,不只用最后一步的结果,前几步的结果也会用,只是根据预测值会赋予权重。因为按照lstm的模式,最后的时间步对于预测结果影响最大,但是实际概况不一定。
[0122]
本方法中通过对各参数进行数据可视化、特征分析、相关性分析等,通过平稳性分析挑选出需要预测的重要参数。由于姿态系统的描述需要一组参数,而不是一个,因此对其预测也不是单个参数预测,而是多元参数的预测。基于姿态动力学和姿态运动学,卫星的姿态信息受角速度、转速等影响,因此,在对该组参数时间序列预测的基础上,通过相关性分析挑选出动力学、运动学相关参数,最终加入到模型中辅助预测。
[0123]
并且通过设置多元多步预测神经网络进输入步长,以及预测步长,构造输入输出,如图5所示,例如,预测三个平稳状态参数,加了5个辅助参数,用前20步预测后10步,那么q=8,k=3,m=10,n=20。由于卫星收发数据,解码加码等过程也需要耗费时间,单步预测通常会落后于实际数据的生成,不具有实际意义,因此采用多步预测。
[0124]
在步骤s140中,根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值包括:根据各平稳状态参数预测数据以及真实数据计算一段时间内各平稳状态参数的误差时间序列;根据各误差时间序列的均值和方差采用3西格玛法则计算得到与各所述平稳状态参数的误差阈值。
[0125]
具体的,每个参数的误差阈值计算为:
[0126]
∈=μ(e
s
) zσ(e
s
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0127]
其中e
s
={e0,e1,e2,...e
s
}为每个参数一段时间的误差序列,为当前时刻预测值和实际值的误差比较,误差时间序列的均值和方差计算分别为刻预测值和实际值的误差比较,误差时间序列的均值和方差计算分别为
[0128]
基于统计学有一个3σ法则,当数据服从正态分布,根据正态分布进行计算,距离平均值3σ之外的概率为p(|x

μ|>3σ)≤0.0003,是极小概率事件,正常情况下不会发生。因此,当预测值与实际值的误差与平均误差相差大于3σ时,则认定该样本为异常值。基于3σ法则,一般情况下可以设置z取值为3。根据实际的异常检测精度需求,若该参数要求监测的精度较高,则z可适当减小,否则可以适当增大。
[0129]
这样可以计算出各平稳状态参数对应的误差阈值。
[0130]
在步骤s150

s17中,为在线实时对航天姿态系统进行异常检测的步骤。
[0131]
在步骤s150中,在线接收待检测的一组参数(多个参数)过去一段时间内的实际数据,并根据步骤s120中的方法对各实际数据进行标准化处理,再将标准化处理后的实际数据输入已训练的多元多步预测神经网络中进行预测,在此之前,对多元多步预测神经网络输入的实际数据的时间序列长度进行预设,以及对多元多步预测神经网络输出的实际预设数据的时间序列长度进行预设。例如,现在获取的多个参数的实际数据为过去一段时间中20个连续时间点获取的时间序列作为输入,可以通过设置输出的步长得到未来一个时间点,或连续多个时间点对应的预测实际数据。
[0132]
这样在步骤s170中,获取当前时刻的实时真实数据时,可立即将当前时刻的实时真实数据与对应时刻预测实时数据进行误差计算,再将计算得到的误差与对应参数的误差阈值进行对应,若该误差超过误差阈值,则进行异常警告,以实现对航天姿态系统的实时检测。
[0133]
如图6

12所示,给出了基于上述利用多元多步预测技术的航天器姿态系统异常检测的数据实验。
[0134]
本实验获取的数据集是资源三号卫星从2016年6月到2017年10月的输出电流数据(中间有大约1个半月的数据丢失)。对这些数据集进行处理后得到电池阵的退化估计结果。如图6所示,具体包括以下步骤:
[0135]
步骤1:参数选取;
[0136]
步骤1.1:对姿态系统参数(磁强计、星敏四元组、对地姿态角等)进行数据可视化,部分周期性参数可视化如图7所示。小周期大约98秒。磁强计(矢量型磁敏感器。用于测定地磁场的大小与方向,即测定航天器所在处地磁场强度矢量在本体系中的分量)还有大周期,大约是一天,1440秒。
[0137]
步骤1.2:基于adf单位根检验进行数据平稳性分析,数据是平稳的才是可预测的。基于adf单位根检验部分结果(见表1),从长期来看,这四个参数都是平稳的,短期来看,磁强计y(zk052089)不平稳,动量轮1转速控制(zk052067)接近不平稳,而星敏a四元素2(zk052076)和对地姿态角x(zk052000)长期和短期都非常平稳。
[0138]
表1 adf单位根检验
[0139][0140]
步骤1.3:相关性分析。姿态系统总共112维的参数,利用pearson系数进行简单的相关性分析,结果如图8所示。相关系数越接近1说明相关性越高。某些参数与其他参数无法
做相关性分析,进行数据查看发现,该参数在该模式下为常数,不随时间变化。
[0141]
步骤1.4:基于上述分析进行参数选取。实验为多元时间序列多步预测,星敏四元数均是周期性稳定的平稳时间序列,磁强计中包含平稳序列和非平稳序列,故选取磁强计x(zk052088)、磁强计y(zk052088)、磁强计z(zk052090)这三个参数进行预测。基于相关性分析,选取动量轮1转速控制(zk052067)、动量轮3转速控制(zk052069)、星敏a四元数1(zk052075)、精太敏1太阳角1(zk052084)、精太敏1太阳角2(zk052085)这五个参数作为相关参数参与预测。
[0142]
步骤2:对选取的各参数对应的样本数据进行标准化处理,其处理方法同步骤s120中一致。
[0143]
步骤3:建立基于改进lstm的多参数多步预测模型;
[0144]
lstm网络具有的较多的超参数需要提前设置,因此对多个lstm进行对比试验时,对超参数进行变量控制保证对比实验的公平性和训练效果。具体参数设置见表格1:
[0145]
表1 lstm超参数设置
[0146][0147]
步骤4:基于多元多步预测神经网络,对标准化处理后的训练数据集进行训练。采用多参数多步预测,输入输出设置如图5所示,例如,预测三个平稳状态参数,加了5个辅助参数,用前20步预测后10步,那么q=8,k=3,m=10,n=20。
[0148]
本研究采用多步预测,一方面,需要为解码和预测预留充足的时间,工程上希望往后预测尽可能多的步数;另一方面,随着预测步数的增加,误差会累加。因此需要合适的预测步数。输入步长为前20步的数据,预测后20步的误差如图9所示,预测10步后的误差增长过快,并且预测后10步能满足解码和计算的时间需求,因此实验中基于前20步预测后10步。将数据的80%作为训练集,20%用作测试集。
[0149]
其中预测评价指标,采用平均绝对误差(mae)、rmse(均方根误差)、mse(均方差)评估预测结果的好坏。其计算公式如下,其中为预测值,y
i
为真实值:
[0150][0151][0152][0153]
为检验本文所提出的方法pa

lstm(加相关参数和atteintion机制)的有效性,增加了三种模型进行对比,分别是:p

lstm(加相关参数)、a

lstm(加atteintion机制但未加相关参数)、lstm(未加相关参数未加atteintion机制)。
[0154]
实验结果见表2,pa

lstm表现最好,单纯的lstm表现最差。从预测误差来看,加入attention层和相关参数均能在一定程度上提高预测准确率。
[0155]
表2多种lstm模型预测效果对比
[0156][0157][0158]
步骤5:误差阈值计算,通过3西格玛法则得到三个参数的误差的均值和方差分别以及最终的阈值见表3:
[0159]
表3各参数均值方差及误差阈值
[0160][0161]
步骤6:针对在线待检测遥测数据样本,进行标准化处理,同步骤1同时为检验异常检测的效果,手动添加异常:
[0162]
1)常值偏差异常,是指一段时间内信号实际输出和理论输出相差一个常量偏差值,可能是输入偏差或者测量出现漂移,这类异常在模拟类器件常发生。其描述形式为:y
out
=y0 f
c
,其中y
out
为实际输出,y0为理想输出,f
c
为常值偏差,如图10(a)所示。
[0163]
2)时变异常,是随实际输出信号与理论值的偏差较大且呈现时变特性,有规律的偏差或者无规律扰动都有可能。原因可能是内部元件的变化或者环境干扰。其描述形式为:y
out
=αcos(f
·
t)t1≤t≤t2,其中α为时变故障幅值,f为变化频率参数,t时间变量,t1,t2为故障发生和结束时刻。如图10(b)所示。
[0164]
3)卡死异常表现为信号输出为固定值,可能是元件不再响应输入信号而变化,也有可能是信号丢失,描述形式为:y
out
=f
s
,其中f
s
为常值,如图10(c)所示,该异常非人工构造,为真实异常。
[0165]
步骤7:对标准化处理后的数据,基于训练好的模型进行实时预测;
[0166]
步骤8:预测误差计算,超过该参数的阈值,则进行异常警告。
[0167]
为评估所提出pa

lstm(加相关参数和atteintion机制)的有效性,增加了三种模型进行对比,分别是:p

lstm(加相关参数)、a

lstm(加atteintion机制但未加相关参数)、lstm(未加相关参数未加atteintion机制),四个模型对于异常识别的准确率如表4,误差及阈值见图11(图11(a):pa

lstm;图11(b):p

lstm;图11(c):a

lstm;图11(d):lstm;)。时变异常和常值异常为人工构造的异常,时变异常四种模型都能识别,常值异常pa

lstm如图11(a)所示、a

lstm如图11(b)所示能有效识别,而不加attention层的lstm由于预测误差本身较高,在部分情况下,p

lstm如图11(b)所示、lstm如图11(d)所示无法识别常值异常。且lstm的误报率高于加了attention层lstm(误报为原本正常却识别出异常的个数)。
[0168]
四个模型对真实的卡死异常的识别如图12(图12(a):pa

lstm;图12(b):p

lstm;图12(c):a

lstm;图12(d):lstm;)所示,卡死异常大部分情况下是比较严重的,出现了信号丢失。信号丢失卡死时,四个模型的预测值和实际值都出现了较大的偏差,实现了异常的识别。然而,系统是一个整体,卡死异常不一定是突然地发生,基于姿态系统动力学和运动学,角速度等参数会更早的出现异常。观察数据发现,信号丢失前一段时间,磁强计的三个指标都表现正常,但是其他参数有异常提示,比如3月25日至3月27日,动量轮1转速控制(zk052067)、动量轮3转速控制(zk052069)的参数非正常波动,精太敏1太阳角1(zk052084)、精太敏1太阳角2(zk052085)在3月25日凌晨出现了大的偏差,且持续了一段时间。这时,未加相关参数的a

lstm和lstm都按照单纯的时间序列进行预测,并未发现异常,然而加入了相关参数的pa

lstm和p

lstm在25日凌晨日凌晨预测出大的误差预警,并一直延续较大误差。一直到4月3日,两次卡死异常都结束,预测误差才恢复到正常较小的水平。
[0169]
表4异常识别准确率对比
[0170][0171]
上述利用多元多步预测技术的航天器姿态系统异常检测方法中,能够对复杂的多元时间序列数据进行实时的监测,综合考虑多维(可自行设定)的姿态参数的自身规律和参数间的相关性,准确识别常数异常、扰动异常、模式不匹配等多种异常。并且在构建异常检测模型的过程中,利用正常工作的历史数据进行训练,将训练好的模型和参数用于实时数据监测,且检测窗口长度可自行设定,监测时所需计算量小,效率高,且效果好。航天器在每种姿态模式下的工作原理不同,因此高维数据的内部结构特征和相互关系也会不同,本方法在建模过程中利用深度学习模型自动识别不同模式下参数的特征,无需先验知识,对卫星的其他相似的复杂系统也可复用。
[0172]
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0173]
在一个实施例中,如图13所示,提供了一种利用多元多步预测技术的航天器姿态系统异常检测装置,包括:样本数据获取模块200、训练数据集构建模块210、标准化处理模块220、神经网络训练模块230、误差阈值计算模块240、实际数据获取模块250、实际预测数
据得到模块260和系统异常检测模块270,其中:
[0174]
样本数据获取模块200,用于获取航天器姿态系统多个参数的样本数据,所述样本数据为参数一段时间内以时间为顺序连续排列的多个数据;
[0175]
训练数据集构建模块210,用于对各所述样本数据进行平稳性分析以及相关性分析选取多个平稳状态参数以及与各所述平稳状态参数相关的辅助参数,并根据所述平稳状态参数和辅助参数对应的样本数据构建训练数据集;
[0176]
标准化处理模块220,用于对所述训练数据集进行标准化处理,得到标准数据集;
[0177]
神经网络训练模块230,用于基于注意力机制以及长短期记忆神经网络构建多元多步预测神经网络,并将所述标准数据集输入多元多步预测神经网络进行训练,得到已训练的多元多步预测神经网络,所述已训练的多元多步预测神经网络具有根据参数前一时间段的数据预测该参数后一时间段数据的能力;
[0178]
误差阈值计算模块240,用于根据各平稳状态参数的预测数据以及真实数据采用3西格玛法则,计算得到各平稳状态参数的误差阈值;
[0179]
实际数据获取模块250,用于获取航天器姿态系统中多个待检测参数历史时间的实际数据,并对所述实际数据进行标准化处理得到标准化的实际数据;
[0180]
实际预测数据得到模块260,用于将所述标准化的实际数据输入已训练的多元多步预测神经网络,得到下一时间段各所述待检测参数的实时预测数据;
[0181]
系统异常检测模块270,用于获取各所述待检测参数的真实数据,并分别计算各所述待检测参数的实时真实数据与对应时刻的实时预测数据之间的误差,再通过对比所述误差与对应参数的误差阈值以检测当前航天器姿态系统是否异常。
[0182]
关于利用多元多步预测技术的航天器姿态系统异常检测装置的具体限定可以参见上文中对于利用多元多步预测技术的航天器姿态系统异常检测方法的限定,在此不再赘述。上述利用多元多步预测技术的航天器姿态系统异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0183]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种利用多元多步预测技术的航天器姿态系统异常检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0184]
本领域技术人员可以理解,图14中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0185]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0186]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0187]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜