非连续自时延多智能体系统一致性与饱和分布式控制方法与流程

2021-11-17 23:56:00 来源：中国专利 TAG：

1.本发明涉及一种非连续混合自时延多智能体系统指数一致性技术，属于信息技术领域。

背景技术：

2.分布式人工智能是人工智能领域一个重要的研究方向，而多智能体系统(mas)则是其一个主要的分支。随着计算机技术、网络通信技术等的高速发展，对应mas的相关研究已经成为信息科学领域一个新兴的研究方向。由于智能体具有很强的自治性和适应性，使得越来越多的学者开始关注其理论及应用方面的研究。在电子商务、智能交通、多机器人系统等诸多领域已经广泛应用了mas的相关理论。
3.近年来，从控制角度对mas进行分析与研究已经成为国内外众多研究人员关注的热点，特别是在mas 集群运动控制和协同控制方面取得了很大的进展。在多智能体分布式协同合作控制问题中，一致性问题作为研究多智能体集群行为的基础，具有重要的现实意义和理论价值。包括生物科学、物理科学、系统与控制科学、计算机科学等各个领域都对一致性问题从不同层面进行了深入分析。简要阐述mas一致性问题，就是系统中各个智能体利用自身的本质状态信息和其邻接节点的状态信息通过有效的通信拓扑，完成初态更新，并共同收敛至目标轨道。
4.现阶段提出的有效控制策略包括牵制控制、脉冲控制、分布式控制、容错控制、滑模控制等。然而，大量先前的关于多智能体系统一致性的研究工作只考虑了非线性动力学函数为连续的情况，由此提出的线性化非线性函数的方法将不再适用于非连续情况。另一方面，为了加快多智能体系统一致收敛的速度，有大量学者研究了实现指数一致性的控制策略。但是对于非连续多智能体系统的指数一致性问题，还没有引起广泛的关注。此外，由于通信传输能力的有限以及存在信道拥塞，时延现象也是多智能体系统的研究中最应该考虑的问题之一。注意到先前的研究工作，大部分只考虑系统存在单一时延的情况。由于实际系统的不确定性与工业运行环境的复杂性，研究系统存在多个自时延的情况很有必要。为实现智能体之间状态信息的交互，分布式控制策略已被广泛地应用于研究一致性问题。不过这些研究工作大多都默认将控制增益设置为常量。这很大程度上降低了控制的灵活度，还可能导致多智能体系统实现全局一致的动态性能下降。因此研究一种限制宽泛的时变分布式控制策略很有必要。再者，考虑到经济成本与执行器有限的输入阈值，必须对控制信号的幅值加以限制。由此，研究人员提出了众多基于饱和策略的有效控制方法。然而由饱和策略的限幅作用造成控制信号不平滑度加剧的现象经常被忽略。

技术实现要素：

5.本发明要解决的技术问题，要达到的目标：本发明涉及的具有时变控制增益的分布式负反馈控制策略，主要针对具有非连续动力学性态与混合自时延的多智能体系统，实现各个智能体状态指数收敛至一致。利用filippov集值映射将有限个间断点映射到对应集
合中，再通过filippov微分包含和测度选择定理得到非连续微分方程在filippov意义下的解。随后综合高斯误差函数与微分中值定理来近似模拟饱和效应，从而有效限制了控制信号的幅值，同时降低其不平滑度，提高控制效果。本发明提出的分布式控制器具有时变控制增益。并且对于时变项的限制条件非常宽泛，仅要求其在任一控制域内的积分平均值存在下界，这极大得增加了控制器的应用范围。最后通过广义halanay不等式和lyapunov稳定性定理可得到指数一致性判定条件与最大容许时延的估算式。
6.本发明的技术方案：
7.非连续自时延多智能体系统一致性与饱和分布式控制方法，步骤如下：
8.步骤一、建立具有非连续动力学性态和混合自时延的多智能体系统并确定其一致性目标
[0009][0010]
其中表示第i个智能体的状态变量。表示第i个智能体的状态变量。体现了该系统混自时延的特性。非连续向量值函数与刻画了每个孤立智能体的本质动力学性态。常数矩阵b为状态内联矩阵，半正定矩阵d1,d2表示时延配置矩阵。τ
s
表示第s个状态自时延、表示智能体i第n个状态分量；表示对的求导。
[0011]
由于通信带宽的限制与传输拥塞现象的存在，本发明在系统建模时考虑了动力学函数非连续以及存在混合自时延的情况。这导致一般的lipschitz条件、quad条件、扇形条件等用来处理连续非线性动力学函数的传统方法将不再适用。因此本发明将提出一种广义的lipschitz条件。本发明选取第一个智能体x1(t)为参考节点(充当一致性目标)，其动力学方程为
[0012][0013]
步骤二、通过传感器装置获得各节点状态信息并建立误差模型
[0014]
通过定义误差向量由式(1)和(2)可得多智能体误差系统：
[0015][0016]
其中i＝1,2,
…
,n,s＝1,2,
…
,s；e
in
(t)表示误差向量e
i
(t)的第n个分量。通过定义的误差向量e
i
(t)，可以将研究多智能体系统的全局指数一致性问题，转换成误差系统的指数稳定性问题，便于直接利用lyapunov 稳定性定理进行系统分析。
[0017]
步骤三、设计具有时变控制增益的非平滑分布式控制策略
[0018]
为了实现非连续多智能体系统的全局指数一致性，智能体之间需由通信拓扑完成状态信息交互，因此需对其施加分布式策略。
[0019]
[0020]
其中k为正值常数，sign(
·
)表示符号函数。控制配置矩阵a＝[a
ij
]
n
×
n
用来实现分布式控制策略，满足耗散耦合条件，即若第i个智能体与第j个智能体之间有信息传递，i≠j，则 a
ij
＝a
ji
>0,否则a
ij
＝a
ji
＝0。时变控制强度ρ(t):[0, ∞)
→
[0, ∞)有界且分段连续，其反映了系统运行过程中，智能体之间耦合强度的变化情况。且满足在任一控制域内，其控制增益的积分平均值存在下界，即：
[0021][0022]
其中，t指控制域时间、m表示第m个控制域、表示任一控制域内控制增益积分平均值的下界；
[0023]
步骤四、利用高斯误差函数和微分中值定理模拟饱和效应
[0024]
又考虑到系统实际运行环境以及控制成本，必须对控制信号加以限幅。引入饱和策略，形式如下：
[0025][0026]
其中，表示控制器u
i
(t)第j个控制分量，为预设的控制器输出阈值，i＝1,2,
…
,n,j＝1,2,
…
,n。
[0027]
从上述饱和策略的函数结构可以预见到，由于存在间断点，会导致控制信号的不平滑度加剧。由此执行器的输入信号发生突变的频率增加,会加剧工件的磨损，降低控制效果甚至导致系统不稳定。考虑到上述这些情况，本发明利用高斯误差函数来近似模拟饱和效应，从而降低控制信号的不平滑度。
[0028][0029]
其中erf(
·
)表示高斯误差函数，
[0030]
又考虑到高斯误差函数结构的复杂性，难以直接应用至分布式控制器(4),本发明利用微分中值定理来简化函数形式。首先定义下式：
[0031][0032]
其中i＝1,2,
…
,n,j＝1,2,
…
,n；由于控制信号的幅值已经被限制，很容易得到是有界的，这意味着随后对函数应用微分中值定理，即存在一个常数满足下式
[0033][0034]
其中线性主部线性主部表示控制器初值；
[0035]
从高斯误差函数的表达式得到令可以将(9)式转换成下式：
[0036][0037]
结合式(8)和(10)，最终得到改进的饱和策略：
[0038][0039]
为了便于后续推导，将式(11)转换成如下紧凑形式
[0040][0041]
其中diag(
·
)表示对角矩阵。
[0042]
步骤五、获得多智能体系统在分布式控制策略下实现指数一致性的参数配置与最大容许时延
[0043]
假设1：通信拓扑包含一个有向生成树，且智能体1为根节点。
[0044]
基于图论，若智能体1为根节点，拉普拉斯矩阵的底层拓扑可划分为：
[0045][0046]
其中为常值列向量，为全零列向量，为非奇异m矩阵。则存在一个正对对角矩阵使得成立。其中为了便于后续分析，记λ
min
表示矩阵的最小特征值。
[0047]
假设2：对于非连续混合自时延多智能体系统(1)，若非连续动力学函数满足假设2：对于非连续混合自时延多智能体系统(1)，若非连续动力学函数满足则基于filippov集值映射和测度选择定理，对于任意的的假设存在正值常数使得下列式子成立；表示filippov集值映射，α1(t)、β1(t)、α2(t
‑
τ
s
)、β2(t
‑
τ
s
)均为定义域内的可测函数，h1(t)属于函数f1(t,h1(t)的一个自变量；
[0048][0049][0050]
一般的，当分析非线性动力学系统时，通常会要求非线性函数满足全局lipschitz条件、quad条件、扇形条件等。然而当动力学函数非连续时，这些传统的线性化手段都将不再适用。因此我们利用filippov 集值映射理论，将有限个间断点映射到对应集合中，将不连续函数转化成filippov集值函数。然后利用测度选择定理挑选出可测函数以获得非连续微分方程在filippov意义下的解。又因为可测函数的不唯一性, 导致出现式(13)所示，即使当h1(t)＝h2(t)时，α(t)也不一定等于β1(t)的情况。基于式(13)进一步分析可以得到这意味着f1(
·
)的连续可微部分的导数将被限制在一个可
变上界区间内。对于式(14)，由于存在乘积效应，当h1(t)＝h2(t)时，不等式可以取到等号。当τ
s
＝0时，其便转换成一般的处理交叉项的形式。
[0051]
先推导非连续混合自时延多智能体系统(1)在非平滑分布式负反馈控制策略(4)辅之以改进的饱和策略(12)的作用下实现全局指数一致的充分条件，并估计其最大容许时延。
[0052]
选取如下lyapunov函数：
[0053][0054]
其中i
n
表示n
×
n单位矩阵。为了便于后续的推导，基于式(15)得到如下关系式
[0055][0056]
计算v(t)关于时间t的集值lie导数并根据filippov集值映射的性质得
[0057][0058]
其中其中补偿项补偿项为集值函数。为集值函数。定义如下：
[0059][0060]
显然可知存在可测函数满足显然可知存在可测函数满足由此可得
[0061][0062]
基于假设2，进一步得到
[0063][0064]
其中为矩阵d2的最大特征值。
[0065]
随后根据引理2，假设2以及式(16)可以得到
[0066][0067][0068]
其中分别为矩阵和的最大特征值。为矩阵的最小特征值；
[0069][0070]
根据式(18)、(19)、(20)以及(21)可得
[0071][0072]
表示矩阵d2的最大特征值；表示函数v(t q)在区间t∈[0, ∞)内的上确界，其中综上分析，可以得到在分布式策略(4)辅之以改进饱和策略(12)的作用下，多智能体系统 (1)实现指数一致的充分条件与最大容许时延的估算式。
[0073]
结论:
[0074]
对于非连续混合自时延多智能体系统(1)，若各项参数满足假设1与假设2，在非平滑分布式负反馈控制器(4)辅之以改进的饱和策略(12)的作用下，可实现全局指数一致的条件为
[0075][0076]
最大容许时延：
[0077][0078]
其中
[0079]
本发明的有益效果：本发明所带来的好处，及达到的指标。
[0080]
1.本发明提出的控制策略针对具有非连续非线性动力学性态的多智能体系统。大量物理模拟包含非连续函数，因此在实际工程中非连续微分方程广泛存在。特别是在机械与电气领域，很多经典的工程问题都是以右端不连续微分方程建模。
[0081]
2.本发明考虑具有混合自时延的多智能体系统，有效地增强了模型的普适性。由于通信传输能力的有限以及存在信道拥塞，时延现象也是多智能体系统的研究中最应该考虑的问题之一。又考虑到实际系统的不确定性与工业运行环境的复杂性，研究系统存在多个自时延的情况很有必要。
[0082]
3.本发明提出的非平滑分布式负反馈控制器具有时变控制增益。并且对于时变项的限制条件非常宽泛，仅要求其在任一控制域内的积分平均值存在下界。这使得控制难度有效降低。
[0083]
4.考虑到实际系统运行环境与控制成本，本发明利用高斯误差函数与微分中值定理近似模拟饱和效应，从而有效限制了控制信号的幅值，同时降低其不平滑度，提高控制效果。
[0084]
5.为加快多智能体系统一致收敛的速度，基于广义halanay不等式和lyapunov稳定性定理，本发明提出的分布式控制器在各项参数满足一定条件时，可实现非连续多智能体系统全局指数一致性，同时可得到最大容许时延。
[0085]
6.在线性化非连续非线性动力学函数时，本发明提出广义lipschitz条件。同时利用 filippov微分包含理论与测度选择定理处理非连续微分方程。
附图说明
[0086]
图1时变控制增益ρ(t)为半波正弦信号；
[0087]
图2为图1相应系统误差演化图；其中，(a)为e2(t)，(b)为e3(t)，(c)为e4(t)。
[0088]
图3时变控制增益ρ(t)为三角波信号；
[0089]
图4为图3相应系统误差演化图；其中，(a)为e2(t)，(b)为e3(t)，(c)为e4(t)。
[0090]
图5时变控制增益ρ(t)受外部周期干扰；
[0091]
图6为图5相应系统误差演化图。其中，(a)为e2(t)，(b)为e3(t)，(c)为e4(t)。
具体实施方式
[0092]
以下根据附图和实施例对本发明的技术方案进行进一步说明。
[0093]
步骤1：配置系统参数。考虑由4个智能体构成的非连续多智能体系统，每个智能体有3个状态分量 (n＝4,n＝3)，具体形式如下
[0094][0095]
由此可以得到状态内联矩阵b＝diag(
‑
1.3,
‑
1.5,
‑
2.4)，时延配置矩阵d1＝diag(0,0,1),d2＝diag(1,1,0)， s＝2.非连续动力学函数取m0＝0.1.
[0096]
步骤2：选取分布式控制矩阵参数。为实现智能体之间状态信息交互，选取控制耦合矩阵以实现分布式控制。取第一个智能体为参考节点(孤立节点)，则其无法接收其他智能体的状态更新信息。但可以将自身的状态信息传送给其他智能体，也就是说a
1j
＝0,j＝1,2,3,4.
[0097][0098]
接着得到
[0099][0100]
则λ＝diag(0.875,0.5625,0.125),λ
min
＝1.6344,ξ
max
＝0.875,ξ
min
＝0.125.
[0101]
步骤3：配置改进饱和策略参数。对所有控制信号都加以限幅20％,30％,50％，即步骤3：配置改进饱和策略参数。对所有控制信号都加以限幅20％,30％,50％，即补偿项δ
i
＝[0.101,0.021,0.093]
t
，取负反馈增益取k＝0.27.
[0102]
步骤4：配置不同工况下时变控制增益ρ(t)。根据所得一致性判据，对于不同类型的ρ(t)配置分别选择控制器参数。
[0103]
(1).ρ(t)为半波正弦信号(幅值为4.5，周期为0.4)。则取
[0104]
(2).ρ(t)为三角波信号(幅值为7.2，周期为0.3)。则取
[0105]
(3).ρ(t)受外部周期干扰。不失一般性，假设在整个控制域内存在持续的外部周期干扰，即形式如下
[0106][0107]
选取t＝0.2,ρ0＝2.8,c1＝0.2,c2＝1.2,则三种不同ρ(t)的演化曲线如图1、图3、图5所示。
[0108]
步骤5：根据所得参数，分别估算最大容许时延并搭建simulink模型，配置时延参数。取τ1＝0.12,τ2＝0.24；取τ1＝0.23,τ2＝0.15；取τ1＝0.52,τ2＝0.48；系统误差演化如图2、图4、图6所示。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种数字应急广播多模接收终端的制作方法

非连续自时延多智能体系统一致性与饱和分布式控制方法与流程

相关文献

最热文献