一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于学习的自适应控制方法与流程

2021-09-10 21:37:00 来源:中国专利 TAG:自适应 控制工程 控制 方法 学习


1.本发明属于控制工程技术领域,具体涉及一种基于学习的自适应控制方法。


背景技术:

2.随着当代社会发展的日新月异,人们的需求更加多样化,各类生产制造过程也日趋复杂,控制领域的相关技术与人们的日常生活、工作息息相关,面对庞大多变的实际控制对象,如何设计出更加可靠、更加符合性能指标的控制器,成为急需解决的问题。作为一门历史悠久的学科,控制理论已经取得了丰富的理论研究成果,建立了坚实的理论体系框架,解决了一大批在航空航天、化工冶金、交通运输、医疗机械、电子电工等实际应用方面的问题。
3.传统的基于模型的控制理论和方法,是建立在精确的数学模型基础上的,包括线性系统理论、最优控制理论、自适应控制理论、系统辨识理论、鲁棒控制理论、滤波器和估计理论等等。通过严格的论证推导或严密的实验测试获取被控对象精确的数学模型,以此代替真实系统,然后基于数学模型分析系统结构特点,结合期望性能指标,设计闭环控制器。“确定性等效原理”是此类方法的理论基石,被控对象的模型是控制器分析和设计的起点和里程碑,也是基于模型类方法的评价标准和控制终点。
4.基于数据驱动(无模型学习)的控制理论和方法,在设计控制器时只需使用在线或离线的控制系统输入输出数据,无需显式或隐式地利用控制过程的数学模型。目前此类方法的收敛性、稳定性等已在一些文献中得以分析证明。数据驱动控制方法的出现,主要是由于控制对象的复杂性,要建立被控对象精确的数学模型是一项困难而且费时费力的任务,甚至可能无法实现,加上许多工业过程中都产生和储存了大量的过程数据,这些数据包含着过程操作和设备的有价值的状态信息,提取并利用这些信息可获得控制对象实际可靠的运行指标,进而可直接用于控制器设计、监测、预测、诊断等,此类方法具有重要的实际操作价值。
5.基于模型的控制理论和基于数据驱动的控制理论,都是控制理论体系不可缺少的重要组成部分,两者相辅相成、各有优劣。系统的未建模动态和对应的鲁棒性分析,一直是基于模型的控制理论无法避免的矛盾问题,而且针对高阶复杂模型的精确建模与控制器设计时力求降阶简化的矛盾性,也促进了基于数据驱动的控制理论的发展,来补充完善基于模型的控制理论。在实际应用中,传统的基于模型的控制理论虽然具有严格的理论推导证明,但是实际应用效果往往达不到预期效果,实际系统运行过程中往往存在各种干扰、不确定性因素等,对控制器的设计问题提出了巨大挑战。
6.

技术实现要素:

7.为解决现有的问题;本发明的目的在于提供一种基于学习的自适应控制方法。
8.本发明的一种基于学习的自适应控制方法,它的控制方法如下:
步骤一:基于极值搜索的自适应控制方法:首先设计一个性能代价函数,利用极值搜索算法对代价函数及其梯度进行度量,生成一系列期望的状态,这些状态可以使被控系统达到性能代价函数的最优值,然后设计基于模型的控制器,使得系统的状态跟踪这些期望的状态;最后证明此类方法的收敛性,即可保证系统持续运行在理想的性能函数极值附近;步骤二:仿真分析:利用研究的方法设计控制器,通过比较、分析、总结,最终将设计的流程,给出相应的结论性描述。
9.与现有技术相比,本发明的有益效果为:针对具有不确定性的控制对象,以不确定性为切入点,作为基于模型的自适应控制理论和无模型学习算法的纽带,充分考虑模型本身特点,选取恰当的基于模型的控制器设计方法和无模型学习算法,最终达到将两者优势互补、相互结合,设计出具有稳定性和鲁棒性保证、更加智能、贴近实际的控制器。
附图说明
10.为了易于说明,本发明由下述的具体实施及附图作以详细描述。
11.图1为本发明的流程图。
具体实施方式
12.为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
13.在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
14.如图1所示,本具体实施方式采用以下技术方案:它的控制方法如下:步骤一:基于极值搜索的自适应控制方法:目前,极值搜索算法可以分为三类:第一类是经典的梯度方法,使用连续激励信号来探索稳态映射,从中得到近似的隐式梯度,其中最著名的是krstic提出的基于正弦信号扰动的极值搜索算法;第二类是参数化方法,以某种方式参数化性能函数并使用参数化估计性能函数的梯度、hessian矩阵或极值的技术,包括使用状态估计器、卡尔曼滤波器、自适应技术等,此种类方法没有常见的设计框架。第三类是其他搜索方法,包括使用滑模控制、同时摄动随机逼近算法、最速下降法、数值优化方法等来寻找极值。首先设计一个性能代价函数,利用极值搜索算法对代价函数及其梯度进行度量,生成一系列期望的状态,这些状态可以使被控系统达到性能代价函数的最优值,然后设计基于模型的控制器,使得系统的状态跟踪这些期望的状态。最后证明此类方法的收敛性,即可保证系统持续运行在理想的性能函数极值附近。
15.步骤二:基于极值搜索的自适应控制方法拓展:在基于极值搜索的自适应控制方法研究取得一定成果后,总结经验、类比思维,继续探索其他基于学习的自适应控制理论。基于强化学习的自适应控制是目前较新的研究成果,强化学习是在计算机科学和工程的计算智能领域发展起来的一种机器学习理论,与最优控制和自适应控制有着密切的联系;强化学习是一种方法,能使设计的自适应控制器实时在线学习,用于解决最优控制问题,其基本思想暗含着行为与奖励或惩罚之间的因果关系,表明目标导向的行为,通过强化信号,记住有效的控制决策,这样就更有利于第二次使用。另外神经网络、迭代学习、遗传算法、模拟退火方法、确定性学习等智能学习型算法都具有独特的理论脉络和思想基础,通过研究其算法特点,可以逆向思维通过方法寻找问题,分别与传统的基于模型自适应理论相结合,进而研究其适合解决的控制对象。
16.步骤三:仿真分析:不局限于理论研究,出发点是针对实际系统,总结出学习型控制器设计基本流程。大致为:充分利用先验知识,结合实时运行过程中测量的输入输出数据,设计基于学习的模型控制器,得到更加符合实际操作性能的预期效果。因此对于改进组合的方法研究经过严格推导论证后,需要实时仿真验证、分析比较,常见的不确定性非线性控制对象有电磁执行器、双连杆刚性机械臂、高超声速飞行器、风力发电机等等,结合这些不同模型的特点,利用研究的方法设计控制器,通过比较、分析、总结,最终将设计的流程,给出相应的结论性描述。
17.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
18.此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜