基于在线性能评估飞行器增益自适应姿态控制方法和系统与流程

2021-11-15 16:40:00 来源：中国专利 TAG：

1.本发明属于航空航天领域，更具体地，涉及基于在线性能评估飞行器增益自适应姿态控制方法和系统。

背景技术：

2.由于飞行器的运动特性具有较强的非线性和时变性，针对其姿态控制系统的设计问题，在实际工程中广泛应用的是增益预置的控制方案。在这种方案中，首先选取飞行器飞行轨迹上的某些特定的飞行状态点作为研究的特征点(特征点是指飞行过程中的某一时刻或飞行轨迹上的某一位置，用以研究该时刻或位置所对应的飞行状态)，然后针对选定的各个特征点设计对应的线性控制器参数，最后利用关于时间序列的插值算法得到整个飞行轨迹上其余飞行状态点的控制器参数。这种增益预置控制方案简单可靠，对于飞行器控制能够实现不错的效果，但对于近几十年间出现的一些新型的现代飞行器，如临近空间飞行器、超声速巡航导弹等，该种方案存在一些不足之处：一方面，现代飞行器特殊的工作环境和多任务模态等特点，使其控制特性更加复杂，主要体现在以下几点：飞行包线大，气动特性变化剧烈，使得飞行器模型参数变化剧烈；系统具有强非线性和强耦合性；系统存在诸如未建模误差、气动参数误差以及未知外部干扰等较大的不确定性因素；另一方面，越来越多的新型飞行任务对飞行器的姿态控制系统的综合控制性能提出较高要求：在快时变、强不确定性和强扰动的飞行环境下，控制系统不仅要保证飞行器的绕心运动稳定，还要尽可能快地跟踪上姿态角指令，并维持尽可能小的跟踪误差。
3.根据经典控制理论的相关原理，传统控制系统的稳定裕度和其动态性能常常难以同时最优，较大的稳定裕度能够适应较强的不确定性和扰动，却难以同时获得很好的动态性能；而动态性能好的控制器通常增益大、响应快、稳定裕度较小，难以抵抗强不确定性和强扰动的影响。因此，为了实现更好的综合性能，往往需要均衡控制系统的稳定裕度和动态性能，以提高综合控制性能。而固定增益预置控制方案已不能满足实际应用的需求，因此新的研究中给出自适应控制方法，对控制器参数(增益)进行自动调整。
4.在众多自适应控制方法的研究中，重点关注的是自适应闭环系统的稳定性和鲁棒性等稳态性能，而很少考察系统实际的瞬态性能如何。随着现代飞行器对更加广阔的未知空域的探索，对飞行控制的综合控制性能的研究，对于实现现代飞行器更好的控制效果、满足更多的飞行任务的需求都有着重要的意义。因此，飞行器姿态控制系统的综合控制性能的在线评估和控制增益的自适应调度的应用需求，对现代飞行器设计提出了更高的挑战性。

技术实现要素：

5.针对在复杂的飞行环境下(大空域、快时变、强不确定性和强扰动等)，飞行器气动特性发生大范围变化时，传统的姿态跟踪控制系统难以满足跟踪性能要求的问题，本发明提供了基于在线性能评估飞行器增益自适应姿态控制方法和系统，利用对飞行控制系统性
能的实时评估，自适应地调整系统控制器增益，从而实现更好的综合控制性能，使飞行器姿态控制系统能够适应各种不确定性和外部扰动，实现高性能姿态跟踪控制。
6.为实现上述目的，按照本发明的第一方面，提供了一种基于在线性能评估的飞行器增益自适应姿态控制方法，该方法包括以下步骤：
7.s1.将具有不同控制增益的线性校正控制器下的姿态控制系统的控制性能按照裕度大小或专家经验划分为不同的等级，所述控制器按照增益预置方法进行设计；
8.s2.通过离线飞行仿真，建立飞行过程的时域状态量和相应控制性能等级的数据集，以此训练神经网络；
9.s3.飞行器在线飞行时，利用训练好的神经网络，对系统的控制性能等级进行实时的评估；
10.s4.基于性能评估结果，采用自适应增益调度策略在线调整控制器参数。
11.优选地，步骤s1包括以下子步骤：
12.s11.对飞行器运动模型的结构和气动参数设定不同大小的正负极限拉偏组合；
13.s12.在各种拉偏情况下分别使用不同等级的控制器对飞行器姿态控制系统进行非线性仿真，记录仿真过程中的系统的状态量和各时间点的线性化系数，构成原始的数据库；
14.s13.对原始数据文件进行以下处理：
15.1)选取特征点，计算并标定各特征点处的控制性能等级；
16.2)截取特征点处时间窗口内的数据。
17.优选地，选取姿态角指令中的恒指指令点、斜坡指令点和近似阶跃指令点三种类型的特征点。
18.优选地，使用滑动时间窗口来采集状态量数据，窗口大小δt＝nh，其中，n为窗口内采样点个数，h为采样步长；各特征点t
i
处的时间窗口[t
i-λnh，t
i
(1-λ)nh)内的数据构成原始数据库，其中，λ为特征点左侧的窗口宽度。
[0019]
优选地，步骤s2中，步骤s2中神经网络为bp网络，对bp网络进行训练；
[0020]
网络的输入数据包括四类：控制指令相关量、角度控制相关量、角速度控制相关量以及控制舵偏的相关量；网络的输出量为控制性能的等级，各个输出神经元的输出值中的最大者作为等级的识别结果；
[0021]
所述控制指令相关量包括最大指令变化率和指令变化率；
[0022]
所述角度控制相关量包括角度控制误差的极差、角度控制误差的绝对误差积分和角度控制误差的震荡次数；
[0023]
所述角速度控制相关量包括角速度控制误差的极差、角速度控制误差的绝对误差积分和角速度控制误差的震荡次数；
[0024]
所述控制舵偏的相关量包括控制舵偏的极差、控制舵偏变化率的最大值和控制舵偏的震荡次数。
[0025]
优选地，步骤s4包括以下子步骤：
[0026]
s41.计算连续化的性能等级；
[0027]
s42.根据设定的期望性能等级和连续化的性能等级，计算系统当前的性能等级误差；
[0028]
s43.判断性能等级误差的绝对值是否大于预设阈值，若是，进入步骤s44；否则，返回步骤s3；
[0029]
s44.确定负反馈比例系数，计算增益增量并更新控制增益，判断飞行任务是否结束，若是，结束，否则，返回步骤s3。
[0030]
优选地，步骤s44中，增益调节量的具体计算式为：
[0031][0032]
e
r
＝r
exp-r
act
[0033]
其中，a，b为需调整的反馈比例系数，且a＜b，e
r
表示性能等级误差，r
exp
和r
act
分别表示期望的性能等级和连续化的性能等级。
[0034]
为实现上述目的，按照本发明的第二方面，提供了一种基于在线性能评估的飞行器增益自适应姿态控制系统，包括：控制性能评估模块和增益调度控制模块；所述控制性能评估模块包括：离线训练模块和在线评估模块；
[0035]
所述离线训练模块，用于将具有不同控制增益的线性校正控制器下的姿态控制系统的控制性能按照裕度大小或专家经验划分为不同的等级，所述控制器按照增益预置方法进行设计，然后通过离线飞行仿真，建立飞行过程的时域状态量和相应控制性能等级的数据集，以此训练神经网络；
[0036]
所述在线评估模块，用于飞行器在线飞行时，利用训练好的神经网络，对系统的控制性能等级进行实时的评估；
[0037]
所述增益调度控制模块，用于基于性能评估结果，采用自适应增益调度策略在线调整控制器参数。
[0038]
总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：
[0039]
(1)本发明所设计的飞行器姿态控制方法，在飞行过程中，利用所设计的控制性能评估子模块对飞行控制系统的性能进行定性评估，能够实时在线地评价系统当前的综合跟踪控制性能。
[0040]
(2)本发明所设计的飞行器姿态控制方法，在飞行过程中，当外部环境参数或扰动较小时，利用当前系统的控制性能评估结果，按照增益自适应策略，在预设的范围内自动调整系统控制器增益，能够实现更高精度的姿态跟踪性能，也避免了传统控制器设计过程中的大量的人工调参工作。
[0041]
(3)本发明所设计的飞行器姿态控制方法，在飞行过程中，当外部环境参数或扰动较大时，利用当前系统的控制性能评估结果，按照增益自适应策略，在预设的范围内自动调整系统的控制器增益，能够增强系统对不确定性因素的鲁棒性，避免系统失稳。
附图说明
[0042]
图1为本发明提供的一种基于在线性能评估飞行器增益自适应姿态控制方法流程图；
[0043]
图2为本发明提供的神经网络的训练过程的性能曲线；
[0044]
图3为本发明提供的不同控制增益下系统的在线控制性能评估测试仿真结果图；
[0045]
图4为本发明提供的基于控制性能评估的增益调度控制流程示意图；
[0046]
图5为本发明提供的随机干扰情况下系统的俯仰通道控制误差对比仿真图；
[0047]
图6为本发明提供的随机干扰情况下系统的控制舵偏仿真图；
[0048]
图7为本发明提供的随机干扰情况下系统的性能评估结果和相应的增益调整情况；
[0049]
图8为本发明提供的一种基于在线性能评估飞行器增益自适应姿态控制系统结构框图。
具体实施方式
[0050]
为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0051]
如图1所示，本发明提供了一种基于在线性能评估飞行器增益自适应姿态控制方法，该方法包括以下步骤：
[0052]
步骤s1.将具有不同控制增益的线性校正控制器下的姿态控制系统的控制性能按照裕度大小或专家经验划分为不同的等级，所述控制器按照增益预置控制方法进行设计。
[0053]
步骤s2.通过离线飞行仿真，建立飞行状态量和相应控制性能等级的数据集，以此训练神经网络。
[0054]
按照飞行动力学理论中的小偏差线性化假设，系统在其稳定工作点附近的状态变化较小，于是系统该工作点附近的运动特性可用线性模型描述，因此实际非线性系统在某一工作点附近的控制性能可借用该点对应的线性系统的性能指标来表征，从而可建立飞行器飞行轨迹上各特征点的时域状态量的变化情况与该点频域性能之间的对应关系。
[0055]
步骤s3.飞行器在线飞行时，利用训练好的神经网络，对系统的控制性能等级进行实时的评估。
[0056]
基于神经网络的性能评估的主要思路便是利用神经网络这一黑箱模型来实现飞行器的时域状态量的变化情况与频域性能之间的复杂映射关系。在实际飞行过程中，实时监测系统运行过程中的时域状态量数据，利用离线训练好的神经网络可得到系统当前运行点的控制性能。由于实际系统的惯性，评估得到的控制性能可作为之后时刻系统性能变化的参考，从而利用该评估结果指导控制器的调整以实现更好的综合控制性能。
[0057]
步骤s4.基于性能评估结果，采用自适应增益调度策略调整控制器的参数。
[0058]
为了更加清楚地阐述本发明，实施例给出某型高超声速飞行器的俯仰通道控制过程。本实施例主要从以下四步进行阐述：离线数据库的建立、神经网络的搭建与训练、控制性能的在线评估、基于评估结果的控制增益调度。
[0059]
(1)离线数据库建立
[0060]
离线数据库的建立过程如下：首先，对飞行器运动模型的结构和气动参数(例如质量、转动惯量、动压、气动力矩系数等)设置不同大小的正负极限拉偏；然后，在各种拉偏情况下分别使用表1所示的不同等级的控制器对系统进行非线性仿真，记录仿真过程中的系
统的状态量(主要包括：姿态角控制指令、姿态角控制误差、姿态角速度控制误差、控制舵偏大小等)和各时间点的线性化系数，构成原始的数据库；最后对原始数据文件进行处理，主要包括以下两部分：
[0061]
1)选取特征点，标定各特征点处的控制性能等级
[0062]
为了使数据特征更加丰富且有区分度，选取姿态角指令中的恒指指令点、斜坡指令点和近阶跃指令点三种类型的特征点，然后利用仿真过程中记录的系统线性化系数计算各点的传递函数，进而可得相应的频域性能指标(例如幅值裕度、相角裕度、截止频率等)，从而按照所划分的综合控制性能等级对各特征点处的实际性能等级进行标定。本实施例使用的性能等级如表1所示。
[0063]
2)截取特征点处时间窗口内的数据
[0064]
为了兼顾性能评估的准确性和实时性的要求，使用滑动时间窗口来采集状态量数据。设窗口大小δt＝nh，其中，n为窗口内采样点个数，h为采样步长。各特征点t
i
处的时间窗口[t
i-λnh，t
i
(1-λ)nh)内的数据构成原始数据库，其中，λ为特征点左侧的窗口宽度。时间窗口长度的选取对于评估的准确性有较大影响，考虑到本实施例中的系统内环响应时间约为0.5s，外环的调节时间约为1.5s，因此设定滑动时间窗口长度为1.5s。本实施例中的上述各参数设置情况为：δt＝1.5；n＝30；h＝0.05；λ＝0.2，0.4，0.6。
[0065][0066]
表1
[0067]
(2)神经网络的搭建与训练
[0068]
由于在上一步离线数据库建立过程中采集的系统时域状态量数据包含了窗口内n个采样点的m维数据，这n
·
m个数据中能够反映系统控制性能的特征维数据却无法准确确定，对此有两种解决方法：一种是利用深度神经网络对采集到的全部原始数据进行压缩和特征的提取，进而实现分类功能；另一种是利用专家对系统的认识，人为按照经验选取原始数据的主元特征，然后将处理得到的指标作为输入通过简单的网络结构进行识别。第一种方案能够利用到数据的全部特征有利于提高识别的准确率，但网络结构十分复杂。由于通过对飞行器动力学模型的仿真分析，可以积累较多的专家经验，因此本发明中为了降低系统复杂性，考虑使用第二种方案，选取经典的bp网络结构进行训练和识别。
[0069]
bp网络的输入数据为原始飞行数据的一些特征指标。按照所选取的系统状态量情况，网络的输入数据可分为四类：控制指令相关量、角度控制相关量、角速度控制相关量以及控制舵偏的相关量。对于每类状态量，计算如极值、极差、均值等的统计学指标量以及一些指定的能够反映控制性能的指标量(例如状态量的震荡大小、震荡次数等)作为网络的输入量。本实施例一共选取了11个相关指标，具体的内容如表2所示。
[0070][0071]
表2
[0072]
对于输出量的选取，由于数据样本是按照控制器等级进行标定，因此可将控制性能的等级作为网络的输出，设定1到5级控制性能等级的理想输出分别为[1-1-1-1-1]、[-11-1-1-1]、[-1-11-1-1]、[-1-1-11-1]、[-1-1-1-11]。各个输出神经元的实际输出值中的最大者作为等级的识别结果。
[0073]
根据上述网络输入输出量的选取情况，设定网络的输入元个数为11，输出元的个数为5，选取经典的单隐含层的bp网络进行训练和测试。通过实验确定网络的隐含层的神经元个数为25，故网络结构为11-25-5，其中，隐含层和输出层的激活函数均为双曲正切函数(tansig函数)，使用lm(levenberg-marquardt，莱文贝格-马夸特)算法对网络进行训练，采用均方误差作为网络训练的性能指标。在所建立的数据库的全部数据中随机抽取4/5的数据进行训练，剩余1/5的数据作为新数据进行测试。训练过程的网络性能如图2所示，图中的横坐标为训练次数，train是训练样本的误差曲线，validation是确认样本的误差曲线，test是测试样本的误差曲线，goal是设定的期望性能指标，best是根据网络确认和测试结果判定出的最终的网络最好性能点。
[0074]
(3)控制性能的在线评估
[0075]
在线评估时考察滑动时间窗口内的n个采样点(同样n＝30)的时域状态量，通过训练好的神经网络对系统当前的控制性能进行评估。考虑到系统的响应时间在0.5～1s左右，因此设定性能评估的更新频率为0.5s。通过本实例的仿真，得到五种不同固定控制增益下的无干扰系统的在线控制性能评估测试结果如图3中的ctrl1～ctrl5所示。图中横坐标为仿真飞行时间，本实施例中仿真飞行时间为50秒，点状曲线为在线实时评估的性能等级，可以看出，所训练的bp网络对不同控制等级系统的全弹道控制性能的识别大致符合相对应的性能等级。
[0076]
(4)基于评估结果的控制增益调度
[0077]
由于实际系统的惯性，评估得到的系统当前的控制性能可作为对之后时刻系统性能变化的预测，从而利用该评估结果指导控制器参数的调整。因此，当已知系统实时的控制性能，可以制定自适应变增益控制策略来调整控制器参数，使系统控制性能向预期的更好的方向改变。
[0078]
若认为第1级系统的稳定性好但跟踪性能较差，第2和3级系统的稳定与跟踪的综合控制性能较好，第4和5级系统跟踪性能较好但稳定性较差，则可设定系统在整个运行过程中的理想性能状态为第2到3级之间的系统状态。最简单直接的增益调整策略即是：当系统处于第1～5级状态时，系统需要调整的增益增量分别为 δk1， δk2，-δk3，-δk4，-δk5，其中，δk5＞ak1＞δk4＞δk2＝δk3。但这种策略下的系统增益调整不够平滑。对此，将网络输出的5维向量线性变换到[0，1]区间，并分别记为r
oi
，然后通过下式所示的加权平均法得到连续化的性能等级将其作为实际评估的性能等级r
act
。
[0079][0080]
利用连续化的性能等级，设计基于性能评估的自适应增益调度策略的实施流程如图4所示。图中针对期望性能等级设计了控制增益的闭环调节子系统。若记r
exp
(本实施例中设置为2)和r
act
分别为期望的性能等级和实际评估的性能等级，则性能等级误差e
r
＝r
exp-r
act
，增益调节的具体计算式为：
[0081][0082]
其中，a，b为待调整的反馈比例系数，且a＜b。|e
r
|＞1时表明性能等级误差较大，可大幅度调整反馈增益，使其尽快调整到期望性能等级。0.5＜|e
r
|≤1时认为性能等级误差不大，因此对反馈增益做小幅调整。
[0083]
为了说明该发明的效果，本实施例中对系统施加随机气动力干扰和随机力矩干扰，随机干扰的具体形式为δ＝0.22*[sin(0.5t) sin(t) sin(1.5t) sin(2t)]。通过仿真得到随机干扰下的系统的姿态角控制误差、控制舵偏角、性能评估结果和相应的增益调整情况分别如图5、6和7所示。其中，各图的横坐标为仿真飞行时间，本实施例中仿真飞行时间为50秒。图5中的实线曲线反映使用该发明方法的系统的攻角控制误差，另外三条不同形式的虚线曲线作为对比，分别为使用不同固定增益的系统的攻角控制误差。图6中给出了舵偏角的变化曲线。图7中左图为仿真飞行过程中的控制性能的实时评估结果，右图为仿真飞行过程中控制器增益的调整情况。
[0084]
分析上述仿真图，可得出以下结论：1)无论有无干扰，使用该方法的系统均能稳定跟踪指令，其控制性能相对于固定增益的一级控制器大幅减小了跟踪控制误差，基本达到三级控制器水平；2)当存在气动干扰时，使用该方法的系统的跟踪性能略差于固定增益的三级控制器，但从误差的平滑性来看，其稳定性要略优于三级控制器，因此，其综合控制性能较好；3)使用该方法的系统在系统受到较大干扰，稳定性变差时，能够根据控制性能评估结果及时调整控制器参数，避免了系统性能恶化；4)使用该方法的系统的控制舵偏具有一定程度的抖动，但其抖动程度在可接受的范围。综上几点，表明了基于神经网络性能评估方案和变增益控制策略的可行性和有效性。
[0085]
对应地，本发明提供了一种基于在线性能评估的飞行器增益自适应姿态控制系统，包括：控制性能评估模块和增益调度控制模块；所述控制性能评估模块包括：离线训练模块和在线评估模块；
[0086]
如图8所示，所述离线训练模块，用于将具有不同控制增益的线性校正控制器下的姿态控制系统的控制性能按照裕度大小或专家经验划分为不同的等级，所述控制器按照增益预置方法进行设计，然后通过离线飞行仿真，建立飞行过程的时域状态量和相应控制性能等级的数据集，以此训练神经网络；
[0087]
所述在线评估模块，用于飞行器在线飞行时，利用训练好的神经网络，对系统的控制性能等级进行实时的评估；
[0088]
所述增益调度控制模块，用于基于性能评估结果，采用自适应增益调度策略在线调整控制器参数。
[0089]
本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：烹饪设备的控制方法、烹饪设备和计算机可读存储介质与流程

基于在线性能评估飞行器增益自适应姿态控制方法和系统与流程

相关文献

最热文献