一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种集群系统编队避障控制方法与流程

2021-11-09 21:35:00 来源:中国专利 TAG:


1.本发明属于集群系统协同控制领域,更具体地,涉及一种集群系统编队避障控制方法。


背景技术:

2.集群系统协同控制是当前集群系统研究的热点问题,编队控制作为其中一类经典控制问题,是指集群中的多个智能体在向着特定目标行进的过程中,能够形成并保持特定的队列形态。目前,多智能体编队控制已经广泛应用于航天卫星、无人飞行器、智能机器人以及智能化列车等多种无人智能系统。在航空航天领域中,通过发射多个微小卫星形成特定的编队,可以实现大型卫星才能发挥的作用,多卫星编队在大大降低系统成本的同时,提高了系统的生存能力与可靠性。在军事对抗背景下,多无人机通过组成合理的编队执行协同侦察与攻击任务,解决了单无人机侦察所面临的侦察范围受限、航程短、风险高等问题,实现了多无人机集群编队饱和攻击,提高了无人机作战突防能力。在抢险救灾环境下,空中采用多飞行器编队搜寻救援目标,不仅能够严密覆盖搜救区域,同时还提高了救援效率;地面利用多机器人编队则可实现协同输送物资、清理灾后废墟、深入高危救援场景以减轻救援人员可能受到的意外伤害。在城市公共交通中,可利用多轨道列车实现动态列车编队以缓解潮汐客流,提高线路灵活性与利用效率,进而提高城市轨道交通智能化水平,充分发挥多列车协同化运营优势。
3.目前,针对集群系统编队控制已存在多种成熟的控制方法。相较于基于行为、基于虚拟结构、基于人工势场以及基于领导者

跟随者等控制方法,基于一致性的编队控制方法采用分布式拓扑网络结构,具有更好的系统鲁棒性与延展性。在该方法中,系统中所有个体与同一编队参考保持一定的向量误差,个体间通过通信实现局部协同作用,最终使系统中所有个体状态趋于同一编队参考以实现预期编队。但在基于该方法的理论研究中,通常是针对连续时间系统,并往往认为个体间的通信是连续的,没有延迟的,因此设计的控制器大多是连续形式的,而这在实际系统中往往是无法实现的。由于每个个体依赖相应传感器感知自身状态信息,并通过嵌入式的设备计算生成控制指令,而传感器与嵌入式设备均是按照一定频率工作的,无法提供实时连续的个体信息。因此当前针对连续时间的基于一致性的编队控制无法应用到实际系统当中。
4.除此之外,在复杂环境下,集群编队不仅需要保持特定的队形以执行任务,还需要能够自主地避开环境中的障碍物。这些障碍物的存在不仅对编队保持造成了阻碍,还会对智能体的自身安全构成严重的威胁。因此,编队避障控制的研究相较于编队控制更具备实际应用价值。


技术实现要素:

5.本发明的目的在于解决现有基于一致性的集群系统编队控制方法因面向连续时间系统和理想任务环境而无法应用于系统时间离散以及任务环境存在障碍物的实际系统
的问题。
6.为了实现上述目的,本发明提供一种集群系统编队避障控制方法,所述集群系统编队避障控制方法包括以下步骤:
7.构建目标集群系统的通信拓扑关系,所述目标集群系统包含多个智能体;
8.构建单智能体离散模型;
9.基于所述单智能体离散模型构建多智能体离散模型;
10.基于所述多智能体离散模型判断所述目标集群系统是否满足预定的时变编队条件;
11.响应于所述目标集群系统满足预定的时变编队条件的判断结果,给定单智能体的通信触发条件;
12.基于所述目标集群系统的通信拓扑关系和所述单智能体的通信触发条件构造时变编队控制模型;
13.基于所述时变编队控制模型,引入人工势场法,以构造时变编队避障控制模型;
14.基于所述时变编队避障控制模型对所述目标集群系统进行编队避障控制。
15.作为优选的是,所述构建目标集群系统的通信拓扑关系包括:
16.采用有向权重图g={v(g),ε(g),wg)}表示所述目标集群系统所包含的n个智能体之间的通信拓扑结构,其中,节点集v(g)={v1,v2,...,v
n
}用于描述所述n个智能体,边集用于描述所述n个智能体之间的全部影响关系,v
i
为父节点,v
j
为子节点,邻接矩阵用于描述两个智能体之间的影响关系的强度,w
ij
为边∈
ji
=(v
j
,v
i
)的权值;
17.设定
18.设定w
ij
=1;
19.定义节点v
i
的邻居集为
20.给定所述有向权重图的入度矩阵:d=diag{deg
in
(v
i
),i=1,2,...,n},deg
in
(v
i
)为节点v
i
的入度;
21.给定所述有向权重图对应的拉普拉斯矩阵:l=d

w(g)。
22.作为优选的是,所述构建单智能体离散模型包括:
23.获取单智能体的高阶离散状态模型;
24.基于所述单智能体的高阶离散状态模型获取所述单智能体离散模型。
25.作为优选的是,所述单智能体的高阶离散状态模型为:
26.x
i
(k 1)=ax
i
(k) bu
i
(k)
27.上式中,为第k个t时刻智能体i的状态向量,为k个t时刻智能体i的控制输入,和为两个常数矩阵,t为取样周期,t>0。
28.作为优选的是,所述基于所述单智能体离散模型构建多智能体离散模型包括:
29.基于所述单智能体的状态向量获取多智能体的状态向量;
30.基于所述单智能体的控制输入获取多智能体的控制输入;
31.基于所述多智能体的状态向量和所述多智能体的控制输入获取所述多智能体离
散模型。
32.作为优选的是,所述多智能体的状态向量为:
33.所述多智能体的控制输入为:
34.所述多智能体离散模型为:i
n
为阶数为n的单位矩阵。
35.作为优选的是,所述基于所述多智能体离散模型判断所述目标集群系统是否满足预定的时变编队条件包括:
36.给定单智能体对应的编队函数:
[0037][0038][0039]
给定所述时变编队条件:
[0040][0041]
上式中,x
j
(k)为智能体i的邻居智能体j在第k个t时刻的状态向量,h
j
(k)为智能体i的邻居智能体j对应的编队函数;
[0042]
判断所述多智能体离散模型是否使所述时变编队条件成立:若任意单智能体i均存在补偿向量使得成立,则判断所述多智能体离散模型满足所述时变编队条件。
[0043]
作为优选的是,所述单智能体的通信触发条件为:
[0044]
f
i
(k,e
i
(k))=||e
i
(k)||


k
[0045]
上式中,e
i
(k)为智能体i的测量误差项,为智能体i对应的第m个触发时刻,c和α均为常数,c>0,0<α<1;
[0046]
当且仅当f
i
(k,e
i
(k))≥0时,智能体i向邻居智能体j进行广播通信。
[0047]
作为优选的是,所述时变编队控制模型为:
[0048][0049]
上式中,k1和k2均为增益矩阵,k1=

(b
t
pb i)
‑1b
t
p(a bk2),p为修正黎卡提方程的唯一正定矩阵解。
[0050]
作为优选的是,所述基于所述时变编队控制模型,引入人工势场法,以构造时变编队避障控制模型包括:
[0051]
采用人工势场法对所述目标集群系统所处的环境构建人工势场:
[0052][0053]
上式中,p
obs
和p
i
分别表示障碍物和智能体i的位置,d(p
i
,p
obs
和d
o
分别表示障碍物
与智能体i之间的距离和安全距离,常数用于调节距离d(p
i
,p
obs
)对人工势场强度的影响;
[0054]
其中,所述人工势场为保守势场,智能体在所述人工势场下受到障碍物的排斥力表示为所述人工势场的负梯度:
[0055][0056]
上式中,方向向量表示为:
[0057][0058]
所述时变编队避障控制模型为:
[0059][0060]
上式中,常数k3用于调节人工势场的强度。
[0061]
本发明的有益效果在于:
[0062]
本发明的集群系统编队避障控制方法,第一步构建目标集群系统的通信拓扑关系,所述目标集群系统包含多个智能体;第二步构建单智能体离散模型;第三步基于所述单智能体离散模型构建多智能体离散模型;第四步基于所述多智能体离散模型判断所述目标集群系统是否满足预定的时变编队条件;第五步响应于所述目标集群系统满足预定的时变编队条件的判断结果,给定单智能体的通信触发条件;第六步基于所述目标集群系统的通信拓扑关系和所述单智能体的通信触发条件构造时变编队控制模型;第七步基于所述时变编队控制模型,引入人工势场法,以构造时变编队避障控制模型;最后基于所述时变编队避障控制模型对所述目标集群系统进行编队避障控制。
[0063]
本发明的集群系统编队避障控制方法,在考虑了实际系统中的复杂环境与离散时间系统的基础上,加入了通信事件触发机制,从而有效降低了目标集群系统的通信频率,大幅度减少了智能体之间的通信次数,因而更符合实际系统的情况。具体地,通信事件触发机制引入了通信触发条件的概念,即当且仅当智能体的状态达到或者超出其对应的通信触发阈值时,该智能体向其邻居智能体进行广播通信,否则,该智能体不进行任何通信。如此设置,使得目标集群系统减少了许多不必要的通信,大大提升了通信效率,也更适用于实际系统。由此可知,本发明的集群系统编队避障控制方法能够行之有效地解决现有基于一致性的集群系统编队控制方法因面向连续时间系统和理想任务环境而无法应用于系统时间离散以及任务环境存在障碍物的实际系统的问题。
[0064]
本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。
附图说明
[0065]
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
[0066]
图1示出了根据本发明的实施例的集群系统编队避障控制方法的实现流程图;
[0067]
图2示出了根据本发明的实施例的目标集群系统的通信拓扑结构图;
[0068]
图3示出了根据本发明的实施例的各智能体的运动轨迹图;
[0069]
图4示出了根据本发明的实施例的编队误差图;
[0070]
图5示出了根据本发明的实施例的各智能体的通信触发时刻图。
具体实施方式
[0071]
下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
[0072]
实施例:图1示出了本发明实施例的集群系统编队避障控制方法的实现流程图。参照图1,本发明实施例的集群系统编队避障控制方法包括以下步骤:
[0073]
s100、构建目标集群系统的通信拓扑关系,所述目标集群系统包含多个智能体;
[0074]
s200、构建单智能体离散模型;
[0075]
s300、基于所述单智能体离散模型构建多智能体离散模型;
[0076]
s400、基于所述多智能体离散模型判断所述目标集群系统是否满足预定的时变编队条件;
[0077]
s500、响应于所述目标集群系统满足预定的时变编队条件的判断结果,给定单智能体的通信触发条件;
[0078]
s600、基于所述目标集群系统的通信拓扑关系和所述单智能体的通信触发条件构造时变编队控制模型;
[0079]
s700、基于所述时变编队控制模型,引入人工势场法,以构造时变编队避障控制模型;
[0080]
s800、基于所述时变编队避障控制模型对所述目标集群系统进行编队避障控制。
[0081]
进一步地,本发明实施例中,步骤s100所述的构建目标集群系统的通信拓扑关系包括:
[0082]
采用有向权重图g={v(g),ε(g),wg)}表示所述目标集群系统所包含的n个智能体之间的通信拓扑结构,其中,节点集v(g)={v1,v2,...,v
n
}用于描述所述n个智能体,边集用于描述所述n个智能体之间的全部影响关系,v
i
为父节点,v
j
为子节点,邻接矩阵用于描述两个智能体之间的影响关系的强度,w
ij
为边∈
ji
=(v
j
,v
i
)的权值;
[0083]
设定w
ij
=1;
[0084]
定义节点v
i
的邻居集为
[0085]
给定所述有向权重图的入度矩阵:d=diag{deg
in

i
),i=1,2,...,n},deg
in
(v
i
)为节点v
i
的入度;
[0086]
给定所述有向权重图对应的拉普拉斯矩阵:l=d

w(g),
[0087]
具体地,在集群系统实现编队控制的过程中,通常需要单个智能体与其他智能体建立必要的通信,使得智能体之间形成一个通信拓扑网络结构。为了描述各智能体之间的这种相互影响作用,本发明实施例采用基于图论的方法对目标集群系统进行建模,即采用有向权重图g={v(g),ε(g),wg)}表示所述目标集群系统所包含的n个智能体之间的通信拓扑结构。
[0088]
对于边集ε(g),若节点v
j
能够获取节点v
j
的信息,则有∈
ij
=(ν
i
,v
j
)∈ε(g),其中节点v
i
为父节点,节点v
j
为子节点,边∈
ij
称为有向边,对应的图g称为有向图。对于邻接矩阵w(g),两个智能体之间的影响强度越大,对应的权值w
ij
越大,反之w
ij
则越小。这里w
ij
为非负常数,当且仅当∈
ji
∈ε(g)时,w
ij
>0,否则,两个智能体之间不存在相互影响,权值w
ij
=0。
[0089]
再进一步地,本发明实施例中,步骤s200所述的构建单智能体离散模型包括:
[0090]
获取单智能体的高阶离散状态模型;
[0091]
基于所述单智能体的高阶离散状态模型获取所述单智能体离散模型。
[0092]
再进一步地,本发明实施例中,所述单智能体的高阶离散状态模型为:
[0093]
x
i
(k 1)=ax
i
(k) bu
i
(k)
[0094]
上式中,为第k个t时刻智能体i的状态向量,为k个t时刻智能体i的控制输入,和为两个常数矩阵,t为取样周期,t>0。
[0095]
再进一步地,本发明实施例中,步骤s300所述的基于所述单智能体离散模型构建多智能体离散模型包括:
[0096]
基于所述单智能体的状态向量获取多智能体的状态向量;
[0097]
基于所述单智能体的控制输入获取多智能体的控制输入;
[0098]
基于所述多智能体的状态向量和所述多智能体的控制输入获取所述多智能体离散模型。
[0099]
再进一步地,本发明实施例中,所述多智能体的状态向量为:
[0100][0101]
所述多智能体的控制输入为:
[0102]
所述多智能体离散模型为:i
n
为阶数为n的单位矩阵。
[0103]
再进一步地,本发明实施例中,步骤s400所述的基于所述多智能体离散模型判断所述目标集群系统是否满足预定的时变编队条件包括:
[0104]
给定单智能体对应的编队函数:
[0105][0106][0107]
给定所述时变编队条件:
[0108][0109]
上式中,x
j
(k)为智能体i的邻居智能体j在第k个t时刻的状态向量,h
j
(k)为智能体i的邻居智能体j对应的编队函数;
[0110]
判断所述多智能体离散模型是否使所述时变编队条件成立:若任意单智能体i均存在补偿向量使得成立,则判断所述多智能体离散模型满足所述时变编队条件。
[0111]
具体地,本发明实施例中,对于任意给定的有界初始状态x(0),若能够使所述时变编队条件成立,则称相应的集群系统能够实现预期时变编队h(k)。
[0112]
再进一步地,本发明实施例中,步骤s500所给定的单智能体的通信触发条件为:
[0113]
f
i
(k,e
i
(k))=||e
i
(k)||


k
[0114]
上式中,e
i
(k)为智能体i的测量误差项,为智能体i对应的第m个触发时刻,c和α均为常数,c>0,0<α<1;
[0115]
当且仅当f
i
(k,e
i
(k))≥0时,智能体i向邻居智能体j进行广播通信。
[0116]
具体地,为避免连续采样带来的问题,本发明实施例为每个智能体设计了对应的通信触发条件,智能体通过自身获取的信息计算决策,只有满足其对应的通信触发条件时,该智能体对外发送一次当前时刻的自身状态值,其余时间则保持通信静默。如此设置,能够大幅度地减少目标集群系统的通信量。对于任一智能体,定义测量误差项,并基于测量误差项构造该智能体的通信触发条件。
[0117]
再进一步地,本发明实施例中,步骤s600所构造的时变编队控制模型为:
[0118][0119]
上式中,k1和k2均为增益矩阵,k1=

(b
t
pb i)
‑1b
t
p(a bk2),p为修正黎卡提方程的唯一正定矩阵解。
[0120]
具体地,本发明实施例中,根据时变编队控制模型可知,智能体i不需要获知每个采样时刻k对应的邻居智能体状态,只需邻居智能体在上一触发时刻所对应的广播状态。由于本发明实施例中假定(a,b)为可镇定的,因此总可以取到期望的增益矩阵k1使系统达到稳定。修正黎卡提方程的唯一正定矩阵解p为:
[0121]
p=(a bk2)
t
p(a bk2)

(2κ

κ2)(a bk2)
t
×
pb(b
t
pb i)
‑1b
t
p(a bk2) i
n
[0122]
再进一步地,本发明实施例中,步骤s700所述的基于所述时变编队控制模型,引入人工势场法,以构造时变编队避障控制模型包括:
[0123]
采用人工势场法对所述目标集群系统所处的环境构建人工势场:
[0124][0125]
上式中,p
obs
和p
i
分别表示障碍物和智能体i的位置,d(p
i
,p
obs
)和d
o
分别表示障碍
物与智能体i之间的距离和安全距离,常数用于调节距离d(p
i
,p
obs
)对人工势场强度的影响;
[0126]
其中,所述人工势场为保守势场,智能体在所述人工势场下受到障碍物的排斥力表示为所述人工势场的负梯度:
[0127][0128]
上式中,方向向量表示为:
[0129][0130]
所述时变编队避障控制模型为:
[0131][0132]
上式中,常数k3用于调节人工势场的强度。
[0133]
本发明实施例的集群系统编队避障控制方法,具有以下有益效果:
[0134]
1、基于离散时间模型设计时变编队避障控制模型,能够利用离散采样状态信息生成控制指令,具有实用性高和可用于实际系统的优点;
[0135]
2、基于通信事件触发机制的编队避障协议,该编队避障协议的设计使得集群系统无需进行连续采样,从而降低实际系统的通信量,降低发生通信阻塞和丢包的风险;
[0136]
3、考虑一般线性模型,针对高阶智能体状态模型成立的控制协议,同样适用于低阶状态模型,即可称为一般线性模型,其在实际应用中更具一般性和普适性。
[0137]
本发明实施例的集群系统编队避障控制方法,解决了现有技术中要求连续时间系统以及连续通信的问题,排除了现有技术无法应用于实际系统的矛盾。在集群编队控制算法的基础上,针对离散时间系统,考虑一般线性模型,采用通信事件触发机制,达到了减少通信频次的效果,且可应用于存在障碍物的复杂实验场景,具有更强的实用意义。
[0138]
以下基于一仿真算例对本发明实施例的集群系统编队避障控制方法的效果进行说明:
[0139]
考虑一个由四个智能体构成的集群系统,假设该集群系统满足图2所示出的通信拓扑结构图,且每个智能体均在xy平面内运动,则对每个智能体有:
[0140][0141]
上式中,p
i
(k)和v
i
(k)分别为智能体i的位置与速度向量,且在xy平面内,智能体i
的状态向量可表示为
[0142]
这里的第k次采样与第k 1次采样的时间间隔设为t=0.1s。
[0143]
则相应地,状态矩阵的取值为:
[0144][0145]
考虑时变编队h(k):
[0146][0147]
四个智能体在xy平面内以四边形的队形按李萨如轨迹运动;
[0148]
其中,r=2m,d=3.5m,w=0.314rad/s,增益矩阵增益矩阵增益矩阵k3=0.003,常数安全距离d
o
=0.8m。各智能体的初始状态值x(0)为随机选取:
[0149]
x(0)=[4m,0m/s,3m,2m/s,1m,0.8m/s,1m,3m/s,

4.5m,1.5m/s,2m,1m/s,2m,

1.4m/s,

1.5m,0.5m/s]
t
[0150]
对于通信触发条件的参数设计,该算例取c=1,α=0.99。
[0151]
通过仿真得到四个智能体在30s内的运动过程与通信状况,图3示出了各智能体的运动轨迹,其中,agent1至agent4分别为第一智能体至第四智能体,四条点线与四条虚线分别为四个智能体的实际运动轨迹与期望运动轨迹,x

axis为x轴,y

axis为y轴。其中,圆形标记为各智能体的初始状态,五角星形标记为各智能体在30s时刻的状态,将四个五角星标记用虚线连接起来可以看出四个智能体在30s时刻达到了期望的正方形队形。根据图3可知,该集群完成了编队避障任务,只有在遇到障碍物时,暂时破坏队形以避开障碍物,在没有障碍物时将会迅速重构期望队形。图4示出了该集群的编队误差,根据图4所示出的内容可知,集群在障碍物附近时,编队误差会显著增大,但一旦远离障碍物,编队误差将会快速收敛到0。图5示出了各智能体在30s内通信触发时刻,其中,横坐标为采样时间,纵坐标为智能体的通信触发次数。根据图5所示出的内容可知,集群系统能够实现预期编队,且通信频次大幅度减少。
[0152]
本发明实施例的集群系统编队避障控制方法,设计了复杂环境下的离散通信事件触发的集群系统编队避障控制器,对系统的通信能力与通信频率要求更低,能够减少系统中不必要的通信,更适用于实际系统。
[0153]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献