一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于脉冲控制的多智能体系统分组一致性控制方法与流程

2022-02-20 13:55:31 来源:中国专利 TAG:


1.本发明属于智能信息处理领域,特别涉及一种基于脉冲控制的多智能体系统分组一致性控制方法。


背景技术:

2.近年来,受生物中群集行为的启发,多智能体系统的一致性研究已经广泛应用在计算机科学、无人机编队、集群航天器探测和无线传感器等多个领域,成为当前自动控制领域的研究热潮。然而,由于实际环境的日益复杂性,人们对多智能体系统的可靠性和多样性的要求也越来越高。多智能体系统一般考虑两种情形,分别是有领导者情况和无领导者情况。在无领导者情况下,为每一个智能体设计一个分布式控制器,使系统中智能体最终收敛到一个共同值;有领导者的系统中,通常跟随者与领导者最终保持相同的状态不变。
3.目前,大多数研究的重点在于实现多智能体系统一致性,即系统中的智能体实现一个共同的状态。然而,在现实应用中,一致性的状态会随着环境、情形、任务以及时间的变化而变化。因此,提出了分组一致性,即在系统中所有的智能体可以实现多个不同的状态。分组一致性是指在系统中,将智能体分成多个分组,相同分组实现相同的状态,不同分组实现不同的状态,从而系统可以实现多个不同的状态。在对多智能体分组一致性研究中主要采用连续性控制方法;但是连续性控制方法操作困难,传输损耗大;因此急需一种非连续性控制的智能体系统分组一致性控制方法。


技术实现要素:

4.为解决以上现有技术存在的问题,本发明提出了一种基于脉冲控制的多智能体系统分组一致性控制方法,该方法包括:
5.s1、构建多智能体系统的拓扑结构;
6.s2、根据拓扑结构对系统中的智能体进行分组;
7.s3、设计脉冲控制协议;
8.s4、在脉冲时刻,同一个分组中的每个智能体接收邻居智能体的位置信息,并通过脉冲控制协议对接收到的位置信息进行处理,得到发送信息的智能体与接收到该信息的智能体的加权位置结果;
9.s5、根据加权位置对自己的状态进行更新,完成分组一致。
10.优选的,构建多智能体系统的拓扑结构的过程包括:将智能体网络中的每个智能体作为一个节点,连接相邻两个节点构成拓扑图;图中每条边代表相邻智能体之间的信息交互。
11.进一步的,多智能体系统中的各个节点包括领导节点和跟随节点;每个领导节点连接至少1个跟随节点构成一个分组。
12.进一步的,领导节点的动力学模型为:
13.14.跟随节点的动力学模型为:
[0015][0016]
其中,表示领导节点σi的位置变化,φ(.)表示非线性函数,表示领导节点σi在t时刻的位置状态,ξ表示常数矩阵,p表示领导节点的数量;表示跟随节点i的位置变化,xi(t)表示跟随节点i在t时刻的位置状态,m表示系统中智能体的数量,n表示跟随节点的数量。
[0017]
优选的,设计的脉冲控制协议为:
[0018][0019]
其中,表示跟随节点i的位置变化,φ(.)表示非线性函数,xi(t)表示跟随节点i在t时刻的位置状态,ξ表示常数矩阵,ui(t)表示设计的脉冲控制协议,δ(t-tk)表示在tk时刻的单位冲击函数,tk表示脉冲控制时刻,bk表示脉冲增益,j表示节点j,ni表示节点i的邻居节点的集合,a
ij
表示节点i与节点j是否信息交互,若a
ij
≥0则表示节点i与节点j之间有信息交互,若a
ij
<0则表示节点i与节点j没有信息交互,xj(t)表示跟随节点j在t时刻的位置状态,l
ij
表示节点i与节点j之间的拉普拉斯矩阵元素,即表示节点i与节点j之间的拉普拉斯矩阵元素,即表示领导节点σj在t时刻的位置状态,表示领导节点σi在t时刻的位置状态。
[0020]
优选的,智能体在接收邻居智能体位置信息时,通过脉冲控制协议控制该智能体在脉冲时刻接收邻居智能体发送的位置信息。
[0021]
优选的,通过脉冲控制协议对接收到的位置信息进行处理的过程包括:在脉冲时刻接收来自邻居节点的信息,在控制协议的控制下,结合邻居节点的信息来更新自己的位置状态。
[0022]
优选的,系统中智能体满足分组一致性的条件为:
[0023][0024]
其中,xi(t)表示跟随节点i在t时刻的位置状态,xj(t)表示跟随节点j在t时刻的位置状态,σi表示领导节点,m表示系统中智能体的数量,p表示领导节点的数量。
[0025]
本发明的优点:
[0026]
1)本发明采用脉冲控制来实现分组一致性,控制智能体在脉冲时刻接收来自邻居节点的信息,并更新自己的状态,这样既能减少网络的损耗,还能增强系统的鲁棒性。
[0027]
2)考虑非线性系统,突破线性系统应用的局限性,使系统更加符合实际,应用于更广泛的场景。
附图说明
[0028]
图1为本发明的多智能体系统拓扑结构图;
[0029]
图2为本发明的算法流程图;
[0030]
图3为本发明的跟随者与领导者之间的状态误差比较图;
[0031]
图4为本发明的智能体状态图;
[0032]
图5为本发明中脉冲增益对系统收敛的影响结果图。
具体实施方式
[0033]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0034]
一种基于脉冲控制的多智能体系统分组一致性控制方法,如图2所示,该方法包括:构建多智能体系统的拓扑结构;根据拓扑结构对系统中的智能体进行分组;设计脉冲控制协议;在脉冲控制时刻,每个智能体接收邻居智能体的位置信息,并通过脉冲控制协议对接收到的位置信息进行处理,得到发送信息的智能体与接收到该信息的智能体的加权位置结果;根据加权位置结果对自己的状态进行更新,完成分组一致;分析控制参数对系统实现分组一致性的影响。
[0035]
获取多智能体系统的拓扑结构的过程包括:将智能体网络中的每个智能体作为一个节点,连接相邻两个节点构成拓扑图;图中每条边代表相邻智能体之间的信息交互。
[0036]
在多智能体网络中,其拓扑图为g=(v,ε,a),其中,v表示多智能体网络中各个节点的集合,ε表示节点与节点之间的边的集合,a表示邻接矩阵。节点集合为v=[v1,v2,

,vn],vn表示第n个智能体,节点与节点之间的边的集合为令e
ij
=(vi,vj),即节点vj能够接收来自节点vi的信息;令邻接矩阵为a=(a
ij
)n×n,且a
ij
≥0,若e
ji
∈ε,则a
ij
>0;若则a
ij
=0;其中,a
ij
表示智能体i与智能体j之间的拓扑连接权重。若在图g的邻接矩阵a中,存在a
ij
=a
ji
,则图g是无向图,且其邻接矩阵a是对称矩阵。智能体i的邻居集合为ni={vj∈v:(vi,vj)∈ε}。在有向图中,存在一个节点和其他任何一个节点之间至少有一条有向路径,则称该图存在有向生成树。
[0037]
所有智能体共享一个公共的状态空间智能体i的状态定义为xi,且x=(x1,

,xn)
t

[0038]
令l=d-a是图g的拉普拉斯矩阵,其中d是度矩阵,表示为d=diag(d1,d2,

,dn),是智能体i的度,则l=[l
ij
]n×n的元素为:
[0039][0040]
其中,d表示度矩阵,diag(.)表示对角矩阵,dn表示第n个节点的度,l表示拉普拉斯矩阵,l
ij
表示拉普拉斯矩阵的元素,ni表示节点i的邻居节点的集合。
[0041]
多智能体系统中的各个节点包括领导节点和跟随节点;每个领导节点连接至少1个跟随节点构成一个分组。
[0042]
优选的,多智能体系统中包含m个智能体,m个智能体中有p个领导者和n个跟随者。则有一阶结构的智能体满足:
[0043][0044]
其中,分别是智能体i的位置状态和输入控制,表示智能体i的位置变化。
[0045]
在系统中,领导节点的动力学模型为:
[0046][0047]
跟随节点的动力学模型为:
[0048][0049]
其中,表示领导节点σi的位置变化,φ(.)表示非线性函数,表示领导节点σi在t时刻的位置状态,ξ表示常数矩阵,p表示领导节点的数量;表示跟随节点i的位置变化,xi(t)表示跟随节点i在t时刻的位置状态,m表示系统中智能体的数量,n表示跟随节点的数量。
[0050]
若连续非线性函数φ:满足利普希茨条件|φ(x1)-φ(x2)|≤l|x
1-x2|,则可以将在一维空间里得到的所有结果都可以用克罗内克积推广到n维空间中。若图g是包含一个有向生成树,即至少存在一个根节点可以访问其它节点;并且图g是断开的:可以分离成多个分组,每个分离的组要么是单个节点,要么包含一棵生成树。
[0051]
在同一个分组内,每个智能体接收邻居智能体的位置信息,并通过脉冲控制协议对接收到的位置信息进行处理,得到发送信息的智能体与接收到该信息的智能体的加权位置结果。具体过程包括:
[0052]
根据邻居节点之间的信息交互和脉冲控制的性质,对于任意一个节点i的脉冲控制协议设计为:
[0053][0054]
其中,表示跟随节点i的位置变化,φ(.)表示非线性函数,xi(t)表示跟随节点i在t时刻的位置状态,ξ表示常数矩阵,ui(t)表示设计的脉冲控制协议,δ(t-tk)表示
即在tk时刻的单位冲击函数,tk表示脉冲控制时刻,bk表示脉冲增益,j表示节点j,ni表示节点i的邻居节点的集合,a
ij
表示节点i与节点j是否有信息交互,若a
ij
≥0则表示节点i与节点j之间有信息交互,若a
ij
<0则表示节点i与节点j没有信息交互,xj(t)表示跟随节点j在t时刻的位置状态,l
ij
表示节点i与节点j之间的拉普拉斯矩阵元素,即表示节点i与节点j之间的拉普拉斯矩阵元素,即表示领导节点σj在t时刻的位置状态,表示领导节点σi在t时刻的位置状态。δ(t)是狄拉克函数,且bk<0是脉冲增益,tk为脉冲时刻,各个分组的动态领导者的状态设为
[0055]
当t=tk时,在脉冲时刻智能体位置状态的变化为:
[0056][0057]
其中h为脉冲间隔,δxi(tk)表示智能体i在脉冲时刻tk的状态变化。这意味着智能体i可以根据其邻居的状态信息,在tk时刻突然更新自己的状态。
[0058]
若则xi(t)是左连续的,即时间序列{tk}满足
[0059]
若连续非线性函数φ:满足利普希茨条件|φ(x1)-φ(x2)|≤l|x
1-x2|,图g是包含一个有向生成树,并且存在一个常数ξ>1满足下列条件:
[0060]
ta(λ
ξ
2l) ln(λkξ)<0
[0061]
其中,ta=t
k-t
k-1
=h是脉冲间隔。而λ
ξ
和λk分别是(ξ ξ
t
)和[(l im)b
k-im]
t
[(l im)b
k-im]的最大特征值,l是利普希茨常数,im表示表示一个m阶单位矩阵,则系统可以根据脉冲控制协议实现分组一致性。
[0062]
一个具有有向固定拓扑结构的多智能体系统的具体实施方式,如图1所示,系统中一共有8个智能体,将其划分为两个分组g1和g2。其中智能体1、3、4、5属于g1,2、6、7、8属于g2,且智能体1和2为领导者。
[0063]
所有节点之间的邻接矩阵的元素为1,则邻接矩阵为a;拉普拉斯矩阵为l;即:
[0064][0065][0066]
设ξ=1.01,智能体i的位置状态变化表示为且φ(xi(t),t)=xi(t)sin(t2),已知矩阵ξ=im,计算可得λ
ξ
=1,λk=5.8034。智能体的初始状态为x1(0)=1,x2(0)=-2,x3(0)=2,x4(0)=-1,x5(0)=-1.5,x6(0)=1.5,x7(0)=3,x8(0)=-1.5。
[0067]
设bk=-0.4,分别对连续性控制、脉冲间隔为h1=0.001s、h2=0.002s进行仿真,分析脉冲控制对系统分组一致性的影响以及不同脉冲间隔对分组一致性的影响,即对系统的收敛时间的影响。
[0068]
由图3中的图(a)、图(b)以及图4中的图(a)、图(b)可知,脉冲控制的收敛时间比连续控制的收敛时间长,这是因为连续控制是对系统进行持续控制,而脉冲控制只在脉冲时刻对系统进行控制,这样虽减少了网络的损耗,提高了系统的鲁棒性,但也延长了系统的收敛时间。
[0069]
由图3中的图(b)、图(c)可知,跟随者与领导者状态误差最终趋于零,表示实现分组一致性,其中δ
31
表示跟随者3与领导者1的位置差。由这两图可以看出,h1=0.001s时,收敛时间在0.015s左右,而h2=0.002s时,收敛时间差在0.02s左右,由此得出结论:脉冲间隔越大,相同时间内的脉冲次数越少,状态误差趋于0的时间越长,系统收敛时间越长。同样地,由图4中的图(b)、图(c)可以看出,智能体的状态最终与领导者的状态一致。结合两图得出,当脉冲间隔越大,智能体的收敛时间就越长。
[0070]
设脉冲间隔为h1=0.001s,分别对不同脉冲控制增益进行仿真,分析脉冲控制增益对系统收敛时间的影响。
[0071]
由图5中的图(a)、图(b)可看出,当h一定时,bk越大,对系统的控制力度越小,系统最终收敛时间越长,反之,bk越小,系统的收敛时间越短。
[0072]
系统在脉冲控制协议的作用下可以实现多智能体系统的分组一致性。当脉冲间隔越大,相同时间内的脉冲次数就越少,系统收敛的时间就越长。当脉冲增益小,对系统的控制力度越大,系统的收敛时间就越短。
[0073]
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所
应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献