一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于Koopman算子的软体机器人控制方法、装置、设备及介质

2022-10-22 07:18:49 来源:中国专利 TAG:

基于koopman算子的软体机器人控制方法、装置、设备及介质
技术领域
1.本发明涉及软体机器人控制技术领域,尤其涉及一种基于koopman算子的软体机器人控制方法、装置、设备及介质。


背景技术:

2.随着科技的发展,许多领域增加了对各种机器人的需求,例如航空航天和医疗领域,但是在这些领域使用刚性机器人会造成无法挽回的损失,故科学家们从大自然中获得灵感,制造出具有柔体的机器人。
3.软体气动执行器(spas)由于其顺应性、适应性和高力密度特性,被广泛用于软体机器人设计。然而,固有的滞后非线性严重恶化了软体气动执行器的控制性能。
4.现有技术中通常建立一个反数学模型来补偿滞后效应,但是这种方式的控制性能高度依赖于所建立的反数学模型的准确性,并且获得反数学模型的计算量过大。此外,基于反演的方法很难处理软体气动执行器的输入压力的物理约束。软体气动机器人的迟滞问题仍未被很好地解决,不能对软体气动机器人实时精准的控制。


技术实现要素:

5.有鉴于此,有必要提供一种基于koopman算子的软体气动机器人控制方法、装置、设备及介质,用以解决在控制软体气动机器人时的迟滞问题。
6.为了解决上述问题,第一方面,本发明提供一种基于koopman算子的软体机器人控制方法,包括:
7.获取软体气动机器人的滞后特征数据,并基于所述滞后特征数据构建离散时间非线性动态模型;
8.利用koopman算子逼近所述离散时间非线性动态模型,并构建基于koopman算子的spas模型;
9.给定参考轨迹,利用所述spas模型设计模型预测控制器,并利用所述模型预测控制器对软体气动机器人进行动力学控制。
10.进一步的,所述获取软体气动机器人的滞后特征数据,并基于所述滞后特征数据构建离散时间非线性动态模型,包括:
11.采集软体气动机器人的输入气压数据与输出弯度数据,并基于输入输出数据构建离散时间非线性动态模型。
12.进一步的,所述利用koopman算子逼近所述离散时间非线性动态模型,并构建基于koopman算子的spas模型,包括:
13.利用koopman算子逼近所述离散时间非线性动态模型,求解软体气动机器人的koopman算子高维线性模型;
14.基于edmd算法获取所述koopman算子高维线性模型在有限维空间中的预设条件下的近似矩阵;
15.利用所述近似矩阵构建基于koopman算子的spas模型。
16.进一步的,利用所述模型预测控制器对软体气动机器人进行动力学控制,包括:
17.利用所述模型预测控制器在每一采样时刻求解有限时域内的控制序列;
18.提取所述控制序列中的控制信号,将所述控制信号发送至所述软体气动机器人,以控制所述软体气动机器人的运动姿态。
19.进一步的,所述模型预测控制器包括预测环节、滚动优化环节及反馈校正环节。
20.进一步的,所述利用所述模型预测控制器对软体气动机器人进行动力学控制,具体包括:
21.通过所述滚动优化环节设定目标函数及预设约束条件,求解在所述目标函数及预设约束条件下的第一控制序列,利用所述第一控制序列中的第一个控制信号作用到软体气动机器人中,以求解下一时刻在所述目标函数及预设约束条件下的第二控制序列,循环此过程;
22.通过所述预测环节对软体气动机器人的实际输出进行预测,以获得软体气动机器人的预测输出;
23.通过所述反馈校正环节将软体气动机器人的实际输出与预测输出得到预测误差,并基于所述预测误差对软体气动机器人未来时刻的预测输出进行修正,以利用修正后的预测输出进行闭环反馈控制。
24.进一步的,所述方法还包括:
25.对所述控制方法进行验证处理。
26.第二方面,本发明还提供一种基于koopman算子的软体气动机器人控制装置,包括:
27.非线性动态模型构建模块,用于获取软体气动机器人的滞后特征数据,并基于所述滞后特征数据构建离散时间非线性动态模型;
28.spas模型构建模块,用于利用koopman算子逼近所述离散时间非线性动态模型,并构建基于koopman算子的spas模型;
29.控制模块,用于给定参考轨迹,利用所述spas模型设计模型预测控制器,并利用模型预测控制器对软体气动机器人进行动力学控制。
30.第三方面,本发明还提供一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于koopman算子的软体气动机器人控制方法中的步骤。
31.第四方面,本发明还提供一种计算机存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述基于koopman算子的软体气动机器人控制方法中的步骤。
32.采用上述实施例的有益效果是:本发明根据软体气动机器人的滞后特征构建离散时间非线性动态模型,便于获取软体气动机器人的实际输出,然后利用koopman算子逼近离散时间非线性动态模型以构建线性spas模型,利用线性模型便于控制的特点设计基于koopman算子线性模型的模型预测控制器,该模型预测控制器在处理spas的物理约束时仍能很好地工作,解决了软体气动机器人的迟滞问题,实现了更加精准的控制。
附图说明
33.图1为本发明提供的基于koopman算子的软体气动机器人控制方法一实施例的方法流程图;
34.图2为本发明一实施例提供的软体气动执行器的结构示意图;
35.图3为本发明一实施例提供的一种模型预测控制器的基本原理图;
36.图4为本发明提供的基于koopman算子的软体气动机器人控制装置一实施例的结构示意图;
37.图5为本发明提供的电子设备一实施例的结构示意图。
具体实施方式
38.下面结合附图来具体描述本发明的优选实施例,其中,附图构成本技术一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
39.在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。此外,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
40.本发明提供了一种基于koopman算子的软体机器人控制方法、装置、设备及介质,该方法通过全局线性,不需要固有滞后的反演模型,控制法可以以显式形式得到。通过使用约束二次编程的技术,所提出的方法在处理spas的物理约束时仍能很好地工作。
41.在实施例描述之前,对相关词语进行释义:
42.koopman:库普曼算子是一个无限维线性的数学算符,利用库普曼算子能够精确捕捉非线性系统的动力学行为。通过定义一个观测函数,该观测函数可以将低维非线性的系统状态映射到另一个函数空间,在该空间下观测函数的演化由科普曼算子控制。
43.edmd:exteneded dynamic mode decomposition算法求解一个高维常数矩阵作为koopman算子的逼近,求解高维矩阵的方法只需系统的数据,不需动力学系统的任何先验信息。
44.mcp:model predictive control模型预测控制是一种基于模型的闭环优化控制策略。预测控制最大的吸引力在于它具有显式处理约束的能力,这种能力来自其基于模型对系统未来动态行为的预测,通过把约束加到未来的输入、输出或状态变量上,可以把约束显式表示在一个在线求解的二次规划或非线性规划问题中,模型预测控制具有控制效果好、鲁棒性强等优点,可有效地克服过程的不确定性、非线性和并联性,并能方便的处理过程被控变量和操纵变量中的各种约束。
45.以下分别对具体实施例进行详细说明:
46.请参阅图1,图1为本发明提供的基于koopman算子的软体机器人控制方法的一实施例的流程示意图,本发明的一个具体实施例,公开了一种基于koopman算子的软体机器人控制方法,包括:
47.步骤s101:获取软体气动机器人的滞后特征数据,并基于滞后特征数据构建离散时间非线性动态模型;
48.步骤s102:利用koopman算子逼近离散时间非线性动态模型,并构建基于koopman算子的spas模型;
49.步骤s103:给定参考轨迹,利用spas模型设计模型预测控制器,并利用模型预测控制器对软体气动机器人进行动力学控制。
50.首先需要说明的是,软体气动机器人的主要结构为spas,即软体气动执行器,请参阅图2,图2为本发明一实施例提供的一种软体气动执行器的结构示意图。其中,软体气动机器人的迟滞可以定义为一种与时间相关的行为,通常表现为加载和卸载循环期间的输出差异,蠕变、漂移和高自由度都会使迟滞的现象严重。而由于软体驱动器的弯曲变形,使得其具有无限的自由度。也可以理解为软质材料在气动驱动作用下的延迟反应,并且软体气动机器人的历史状态(即上一步的迟滞会影响下一步的控制)会对当前弯曲角度产生影响,从而影响控制精度。
51.在对软体气动机器人控制的过程中,首先根据滞后特征数据构建离散时间非线性动态模型,其中该非线性动态模型很好地模拟了软体气动机器人真实的运动状态。
52.可以理解的是,由于离散时间非线性动态模型是一个非线性模型,是一个无限维的模型。通过koopman算子来把非线性模型近似为有限维的一个线性模型,因为线性模型才可以实现控制。具体的,利用koopman算子逼近该离散时间非线性动态模型,以构建基于koopman算子的spas模型,其中,该线性模型与它的实际的非线性模型的逼近程度越高,越能实现更精准的控制。
53.最后通过给定参考轨迹,选用上述建立的基于koopman算子的spas模型设计实际的预测控制器,然后利用该模型预测控制器对软体气动机器人进行动力学控制,即让基于koopman算子的spas模型按照预定输入的轨迹进行运动,减少迟滞反应。
54.本发明根据软体气动机器人的滞后特征构建离散时间非线性动态模型,便于获取软体气动机器人的实际输出,然后利用koopman算子逼近离散时间非线性动态模型以构建线性spas模型,利用线性模型便于控制的特点设计基于koopman算子线性模型的模型预测控制器,该模型预测控制器在处理spas的物理约束时仍能很好地工作,解决了软体气动机器人的迟滞问题,实现了更加精准的控制。
55.在本发明的一个实施例中,获取软体气动机器人的滞后特征数据,并基于滞后特征数据构建离散时间非线性动态模型,包括:
56.采集软体气动机器人的输入气压数据与输出弯度数据,并基于输入输出数据构建离散时间非线性动态模型。
57.可以理解的是,spas的滞后非线性通常是由软质材料在气动驱动作用下的延迟反应引起的。复杂的滞后现象反映了历史状态对当前弯曲角度的影响,本发明中软体气动机器人的滞后特征数据包括软体气动机器人的输入气压数据与输出弯度数据,然后根据输入输出数据构建离散时间非线性动态模型,具体的,考虑一个有外部输入的离散时间非线性动态系统,即离散时间非线性动态模型:
58.x
k 1
=f(xk,uk),
59.其中,和分别代表系统的状态和输入,f表示该系统的非
线性动力学,k表示离散时间指数,x表示系统的状态集合,u表示系统的输入集合,表示n行n列的实数矩阵,表示m行m列的实数矩阵。
60.在本发明的一个实施例中,利用koopman算子逼近离散时间非线性动态模型,并构建基于koopman算子的spas模型,包括:
61.利用koopman算子逼近离散时间非线性动态模型,求解软体气动机器人的koopman算子高维线性模型;
62.基于edmd算法获取koopman算子高维线性模型在有限维空间中的预设条件下的近似矩阵;
63.利用近似矩阵构建基于koopman算子的spas模型。
64.具体的,系统的演变由koopman算子描述,观测变量沿着系统轨迹的演变为:其中,f表示观测值,
·
表示函数组成,ψ表示轨迹的演化。此外,ψ(x,u)代表在提升空间中的观测值,所以公式可以用下式表示:
[0065][0066]
可以理解的是,由于koopman算子是一个无限维的对象,不能用有限维的矩阵表示。为获取koopman算子在有限维子空间上的投影,利用edmd算法来计算所有可观测值的有限维子空间上的有限维投影,并通过应用于观测数据的线性回归确定了koopman算子的有限维近似。其近似过程如下:
[0067][0068]
通过最小二乘法得到矩阵通过最小二乘法得到矩阵表示n行n列的实数矩阵。进一步的,矩阵可以表示为:其中,a、g为近似矩阵,表示moore-penrose伪逆,进一步可以表示为:
[0069][0070]
在近似koopman算子的过程中,需要定义与状态和输入相关的快照对所以可以由有限维的koopman算子表示,如下式:
[0071][0072]
进一步的,使有限维koopman算子被重构为:
[0073][0074]
则公式可以表示为下式:
[0075][0076]
具体地,通过选择合适的基函数来构造koopman矩阵,公式
还可以分解为下式的动态系统的离散线性模型:
[0077][0078]
其中,uk=ψu(uk),矩阵c=[in×
n on×
(n-n)
]。
[0079]
而近似矩阵包括a、b及c,将基函数定义为下式:
[0080][0081]
其中,根据公式:
[0082][0083]
可求得a和b矩阵:
[0084][0085]
故基于koopman算子的spas模型为:
[0086][0087]
可以理解的是,原本的离散时间非线性动态模型是一个非线性模型,并且是一个无限维的模型,通过利用koopman算子来把它近似为有限维的一个线性模型,可以实现控制。进一步的,该线性模型与它的实际的非线性模型的逼近程度越高,越能实现精准的控制。
[0088]
在本发明的一个实施例中,利用模型预测控制器对软体气动机器人进行动力学控制,包括:
[0089]
利用模型预测控制器在每一采样时刻求解有限时域内的控制序列;
[0090]
提取控制序列中的控制信号,将控制信号发送至软体气动机器人,以控制软体气动机器人的运动姿态。
[0091]
可以理解的是,模型预测控制的基本原理为在每一个采样时刻求解有限时域内的开环优化问题,将所求得的控制序列的第一个元素施加到被控对象上,在下一个时刻循环往复此过程。
[0092]
对软体气动机器人进行动力学控制,需要在每一采样时刻求解有限时域内的控制序列;然后通过优化求解得到每步闭环控制的最优控制信号,将控制信号发送软体气动机器人,从而控制软体气动机器人基于给定的参考轨迹进行运动。
[0093]
在本发明的一个实施例中,模型预测控制器包括预测环节、滚动优化环节及反馈校正环节。
[0094]
在本发明的一个实施例中,利用模型预测控制器对软体气动机器人进行动力学控制,具体包括:
[0095]
通过滚动优化环节设定目标函数及预设约束条件,求解在目标函数及预设约束条件下的第一控制序列,利用第一控制序列中的第一个控制信号作用到软体气动机器人中,以求解下一时刻在目标函数及预设约束条件下的第二控制序列,循环此过程;
[0096]
通过预测环节对软体气动机器人的实际输出进行预测,以获得软体气动机器人的预测输出;
[0097]
通过反馈校正环节将软体气动机器人的实际输出与预测输出得到预测误差,并基于预测误差对软体气动机器人未来时刻的预测输出进行修正,以利用修正后的预测输出进行闭环反馈控制。
[0098]
其中,本发明中基于koopman算子的spas线性模型为:
[0099][0100]
其中,通过滚动优化环节设定的目标函数及预设约束条件为基于软体气动机器人性能指标,如使得控制偏差小或者使得运行成本小进行设定的,本发明中基于spas模型的线性系统进行最优控制问题的求解,即定义求解基于koopman算子线性模型的模型预测控制问题的代价函数,该代价函数为:
[0101][0102][0103]
e[i]z[i] f[i]u[i]≤b[i],i=o,
…np-1
[0104][0105]
式中,n
p
表示预测时域,q[i]∈n×n和r[i]∈m×m均为半正定矩阵,和用于定义提升状态和输入的约束,q[i]∈n×1和r[i]∈m×1为代价函数的线性项。
[0106]
值得注意的是,求解该最优控制问题与z的维度相关,其中z的维度n>n,这会导致在求解时计算量过大,因此对公式:
[0107][0108][0109][0110][0111]
改写为:
[0112][0113][0114]
[0115]
其中,为半正定矩阵,为半正定矩阵,表示预测的控制输入。除此之外:
[0116]
k=r b
t
qb k=b
t
q r l=2a
t
qb j=f eb
[0117][0118]
其中,
[0119][0120][0121][0122]
q=diag(q0,...q
np
),r=diag(r0,...r
np-1
),
[0123]
e=diag(e0,...e
np
)。
[0124]
从矩阵的维数可以看出,将最优控制问题的形式转换后,矩阵的维度与n无关,因此对公式
[0125][0126]
s.t ju mz0≤c
[0127][0128]
的求解与在相同预测时域下求解n维状态空间的模型预测控制问题的代价相同。并且公式:
[0129]
k=r b
t
qb,k=b
t
q r,l=2a
t
qb,j=f eb,m=ea,中的矩阵均可离线计算,在实际控制时极大的降低了运算成本,在一定程度上可以简化了程序的编写。
[0130]
请参阅图3,图3为本发明一实施例提供的一种模型预测控制器的基本原理图,结合图3对利用模型预测控制器对软体气动机器人进行动力学控制进行详细说明。
[0131]
可以理解的是,通过上述目标函数及约束条件可以求解最优控制序列,即第一控制序列,然后仅将该控制序列的第一个元素施加到被控对象上,即在第t时刻获得t~t p时刻的最优控制序列:[u(t),u(t 1),u(t 2)...],仅将u(t)施加到被控对象上,而在t 1时刻重新计算新的最优控制序列,即第二控制序列,循环此过程。其中,控制序列的第一元素为第一个控制信号,被控对象为软体气动机器人。因此,滚动优化环节并不是在某一个时刻获得全局优化的指标,而是在每一个时刻获得相对于该时刻的局部优化指标。通过每一步的优化,使得控制的预测输出更接近实际输出。
[0132]
针对于预测环节,即预测模型可以对被控对象未来的实际输出进行预测,为滚动优化和反馈校正提供先验知识,通过预测模型可以获得被控对象的预测输出,然后通过软体气动机器人本身的驱动系统得到被控对象的实际输出。
[0133]
可以理解的是,根据预测模型对被控对象未来时刻的输出进行预测的预测输出与世界输出必定存在误差,因此,当获得第一控制序列并将第一个元素施加到被控对象上后,将被控对象的实际输出与预测输出相减得到预测误差,并基于预测误差对未来时刻的预测输出进行修正,然后利用修正后的预测输出进行闭环反馈控制。
[0134]
在本发明的一个实施例中,上述方法还包括:
[0135]
对控制方法进行验证处理。
[0136]
可以理解的是,本发明提出的控制方法是基于预测控制器进行实现的,通过多次修正调节预测输出。因此需要利用试验数据进行进一步的验证。具体的,可以给定参考轨迹,然后利用spas模型按照预定输入的那个轨迹来进行运动,通过检验模型输出的轨迹与预定参考轨迹两者的吻合程度。吻合程度越高就说明预测精度越高,也说明减少了软体气动执行器的迟滞反应。
[0137]
为了更好实施本发明实施例中的基于koopman算子的软体气动机器人控制方法,在基于koopman算子的软体气动机器人控制方法基础之上,对应的,请参阅图4,图4为本发明提供的基于koopman算子的软体气动机器人控制装置的一实施例的结构示意图,本发明实施例提供了一种基于koopman算子的软体气动机器人控制装置400,包括:
[0138]
本发明还提供一种基于koopman算子的软体气动机器人控制装置,包括:
[0139]
非线性动态模型构建模块401,用于获取软体气动机器人的滞后特征数据,并基于滞后特征数据构建离散时间非线性动态模型;
[0140]
spas模型构建模块402,用于利用koopman算子逼近离散时间非线性动态模型,并构建基于koopman算子的spas模型;
[0141]
控制模块,用于给定参考轨迹,利用spas模型设计模型预测控制器,并利用模型预测控制器对软体气动机器人进行动力学控制。
[0142]
这里需要说明的是:上述实施例提供的装置400可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述方法实施例中的相应内容,此处不再赘述。
[0143]
基于上述基于koopman算子的软体气动机器人控制方法,本发明实施例还相应的提供一种电子设备,包括:处理器和存储器以及存储在存储器中并可在处理器上执行的计算机程序;处理器执行计算机程序时实现如上述各实施例的基于koopman算子的软体气动机器人控制方法中的步骤。
[0144]
图5中示出了适于用来实现本发明实施例的电子设备500的结构示意图。本发明实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0145]
电子设备包括:存储器以及处理器,其中,这里的处理器可以称为下文的处理装置501,存储器可以包括下文中的只读存储器(rom)502、随机访问存储器(ram)503以及存储装置508中的至少一项,具体如下所示:
[0146]
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问
存储器(ram)503中的程序而执行各种适当的动作和处理。在ram503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0147]
通常,以下装置可以连接至i/o接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0148]
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从rom502被安装。在该计算机程序被处理装置501执行时,执行本发明实施例的方法中限定的上述功能。
[0149]
基于上述基于koopman算子的软体气动机器人控制方法,本发明实施例还相应的提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现如上述各实施例的基于koopman算子的软体气动机器人控制方法中的步骤。
[0150]
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
[0151]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献