一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于关节外力矩估计的机器臂事件触发式控制方法

2022-11-23 18:21:16 来源:中国专利 TAG:

技术特征:
1.一种基于关节外力矩估计的机器臂事件触发式控制方法,其特征在于,该方法首先建立具有外界环境约束的机器臂动力学模型;其次设计高阶有限时间外力矩观测器对关节外力矩进行估计;然后设计合理的事件触发条件,在满足事件触发条件时,系统满足李雅普诺夫渐进稳定,在违背事件触发条件的时刻,更新系统状态和控制策略,使系统依然满足李雅普诺夫渐进稳定;接下来利用评判神经网络近似恰当的性能指标函数,通过求解哈密顿-雅可比-贝尔曼方程得到基于关节外力矩估计的事件触发式分散力/位置控制策略;最后,通过实验平台验证算法的有效性;该方法包括如下步骤:步骤一,针对具有外界环境约束的机器臂建立第i个子系统的动力学模型:针对n自由度机器人系统的第i个子关节系统建立动力学模型:上式中,下标i代表第i个子系统,q
i
、分别为第i个子系统的关节位置、速度、加速度,i
mi
表示转子相对于旋转轴的转动惯量,γ
i
为减速器的减速比,是关节摩擦力矩,表示子系统之间的动态耦合力矩,τ
si
表示可测量的关节耦合力矩,τ
exti
表示关节外力矩,τ
i
表示电机控制力矩;关节摩擦力矩被定义如下:其中f
bi
表示粘性摩擦系数,f
si
表示静摩擦系数,f
τi
表示stribeck效应参数,f
ci
表示库伦摩擦系数,表示摩擦项的位置相关性;表示符号函数:根据线性化方案,摩擦项可以近似表示为:根据线性化方案,摩擦项可以近似表示为:其中分别是f
bi
,f
ci
,f
si
,f
τi
的标称值,且可以被离线确定为常数;由第个子关节系统动力学模型可得个子关节系统的状态空间描述为:
其中为控制力矩,表示摩擦模型已知项,表示未知总扰动项且数值极小,b
i
=(i
mi
γ
i
)-1
和表示电机模型输入矩阵;步骤二,设计高阶有限时间外力矩观测器估计关节外力矩:考虑外力矩的连续性,提出如下假设:作用在机器臂各关节的外力矩n阶导数h
(n)
(t)存在并满足在实际估计过程中,往往无法确切知道n的具体大小,因此一般可以通过实验的方法确定观测器的阶数;本发明设计的高阶有限时间外力矩观测器可扩展到n阶,然而当n=2时,针对大部分时变的外力矩,就可以保证较好的估计精度;因此,本发明将针对n=2的情况进行观测器设计,但其设计思路对更高阶次依然成立;令x
3i
=d
i
τ
exti
表示外力矩项,表示外力矩一阶导数项,可以得到扩展之后的系统为:其中h(x
i
)表示外力矩的二阶导数项,且满足因此,高阶有限时间观测器设计如下:其中l
1i
,l
2i
,l
3i
,l
4i
为观测器调节参数;定义观测误差由(8)减(7)可得观测器的观测误差,如下表示:整理成矩阵形式为:
令表示观测器误差系数矩阵,通过设置l
1i
,l
2i
,l
3i
,l
4i
的值,可以使a
i
的特征根配置在系统的左半平面,进而得到系统(9)是输入输出有界稳定的,即当时,观测误差将在有限时间内收敛到零;因此,通过上述设计的高阶有限时间外力矩观测器可以有效地估计机器人末端所受外力对各关节的影响,即得到各关节外力矩的估计值;步骤三,求解时间触发下的最优控制策略:分别定义位置误差、速度误差和外力矩误差:e
qi
=x
1i-q
di
ꢀꢀ
(11)(11)其中q
di
,分别表示关节期望位置、期望速度、期望加速度,表示高阶有限时间外力矩观测器的观测值,τ
di
表示关节期望外力矩;定义一个包含关节位置误差、速度误差和关节外力矩的力/位置跟踪误差融合函数s
i
(x
i
):其中k
qi
,k
τi
表示恒为正的参数;考虑(6),s
i
(x
i
)的时间导数表示为:其中表示关节位置、速度和外力矩的误差融合函数余项;整体的性能指标函数可以构造为:其中u
i
(s
i
(x
i
),u
i
(s
i
))=s
it
(x
i
)q
i
s
i
(x
i
) u
it
(s
i
)r
i
u
i
(s
i
)≥0为效用函数,q
i
和r
i
是两个正定矩阵;根据性能指标函数(16)得到哈密顿函数如下:h
i
(s
i
,u
i
(s
i
),

j
i
(s
i
))=u
i
(s
i
(x
i
),u
i
(s
i
))

j
it
(n
i
)(b
i
(u
i-f
1i-d
i
) d
i
τ
exti
ρ)
ꢀꢀ
(17)其中表示性能指标函数j(s)的梯度;
考虑(16),可得最优性能指标函数为:为获得最优控制策略,结合(17)和(18)可得:根据最优控制理论,时间触发最优控制策略为:将(20)代入(17)可得基于时间触发机制下的hjb方程可写为:步骤四,利用评判神经网络近似求解事件触发最优控制策略:定义状态误差函数e
ji
(t)如下:(t)如下:其中,t
j
表示触发时刻,j∈{0,1,2,

,∞},s
i
(x
ji
)表示采样状态,s
i
(x
i
)表示实际状态,e
ji
(t)为间隔函数,表示系统实际状态和采样状态的偏差值,即系统状态误差;根据(20)可得事件触发最优控制策略为:根据(21)可得基于事件触发机制下的hjb方程为:利用评判神经网络重构事件触发性能指标函数如下:j
i
(s
ji
)=w
kit
δ
ki
(s
ji
) ε
ki
(s
ji
)
ꢀꢀ
(26)其中,是理想权值向量,l是神经元数量,δ
ki
(s
ji
)是激活函数,ε
ki
(s
ji
)是评判神经网络近似残差;对j
i
(s
ji
)求导可得其梯度向量为:其中

δ
ki
(s
ji
)表示激活函数的梯度,

ε
ki
(s
ji
)表示神经网络近似残差的梯度;基于评判神经网络并结合(24)和(27),可以期望的事件触发最优控制律基于评判神经网络并结合(24)和(27),可以期望的事件触发最优控制律根据(25)和(28),期望的事件触发hjb方程可改写为:
其中为神经网络逼近残差;由于理想权值未知,用权值估计值代替实际值w
ki
可以得到:对求导可得其梯度向量为结合(28)和(31),可得近似的事件触发最优控制策略:结合(29)和(32),可得近似的事件触发hjb方程:定义目标函数采用梯度下降法训练评判神经网络权值向量,的更新率为:其中α
ki
代表神经网络学习率,表示神经网络权值误差向量;评判神经网络按照(34)式的权值更新率不断更新,使得(31)式的事件触发最优控制策略逐步迭代到最优,保证机器臂系统较好地完成力/位置跟踪目标;为了保证基于关节外力矩估计的机器臂事件触发式力/位置控制方法的稳定性与有效性,选取如下的李雅普诺夫函数:其中表示基于时间触发下的最优性能指标函数,表示基于事件触发下的最优性能指标函数。求解v
i
(t)的时间导数并保证小于或等于0的情况下,可以得到如下不等式:其中λ
min
(q
i
)表示以矩阵q
i
最小特征值组成的对角矩阵,λ
min
(r
i
)表示以矩阵r
i
最小特征值组成的对角矩阵,ψ
i
<1表示采样频率,k
1i
和k
2i
表示两个正常数,e
ji
是系统状态误差,e
ji
(t)为触发阈值;将(36)式作为事件触发条件可以使机器臂系统进行非周期性采样与更新控制策略的同时,保证系统的渐进稳定性;当系统状态误差小于或等于触发阈值时,系统状态、评判神
经网络权值、控制策略均保持上一个采样时刻的值;当系统状态误差大于触发阈值时,系统状态更新,并利用当前实际状态更新评判神经网络权值,进而更新控制策略。2.根据权利要求1所述的一种基于关节外力矩估计的机器臂事件触发式控制方法,其特征在于,本发明针对无法持续向机器臂供电的情况下,机器臂需要完成特定位置的目标任务时,在保证机器臂力/位置控制精度的同时减轻控制器计算负担,显著提升机器臂的有效使用时间;一种基于关节外力矩估计的机器臂事件触发式控制方法的更新方式属于非周期性更新方式,有效地减少了控制器更新的次数,避免了机器臂系统因周期性更新而产生不必要的资源浪费。

技术总结
一种基于关节外力矩估计的机器臂事件触发式控制方法,解决约束环境未知且不使用六维力/力矩传感器情况下的机器臂力/位置控制问题,首先建立机器臂动力学模型;设计高阶有限时间外力矩观测器对关节外力矩进行估计;然后设计合理的事件触发条件;利用评判神经网络近似恰当的性能指标函数,通过求解HJB方程得到基于关节外力矩估计的机器臂事件触发式分散力/位置控制策略;在保证机器臂控制精度的同时显著提升工作时间。工作时间。工作时间。


技术研发人员:张振国 马冰 安天骄 卢曾鹏 潘强 王悦西 董博 刘克平
受保护的技术使用者:长春工业大学
技术研发日:2022.07.20
技术公布日:2022/11/22
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献