一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于宽度神经学习的时变输出约束机器人遥操作有限时间控制方法与流程

2022-02-20 13:58:50 来源:中国专利 TAG:


1.本发明属于机器人控制技术领域,具体涉及一种基于宽度神经学习的时变输出约束机器人遥操作有限时间控制方法。


背景技术:

2.遥操作技术充分利用人的智能和机器人的操作能力。它很大程度上延伸了人类在遥远、非结构化及危险环境中的感知和行为能力,是深空、深海和深地探测中不可或缺的关键技术。同智能机器人相比,遥操作技术充分考虑了当前智能技术的不足,如突发情况中涉及的决策问题,操作中的安全性和约束性问题。该技术将人类感知和决策能力同机器人的操作能力结合,整体增强了遥操作系统在非结构化环境下面对突发情况的处理能力,是当前最为现实的人机混合智能策略。
3.遥操作系统的组成复杂,操作指令的生成机制和指令的远距离传输等不可避免给系统造成不确定时延。不确定时延严重影响系统的稳定性,并使系统的性能退化;模型不确定性同样给系统的稳定性造成威胁。与此同时,受操作时间和工作空间的限制,机器人末端执行器需要在满足物理约束的同时,在预期时间内完成操作任务。如深空探测中,受在轨操作时间的限制,机器人在执行巡检任务时(如通过狭小空间),需要在保证安全性的情况下,利用有限的时间完成在轨操作任务。


技术实现要素:

4.本发明解决的技术问题是:基于以上难题,本专利提出了一种时变输出受限的机器人遥操作有限时间控制方法,为遥操作系统开展实际工作提供了一种可行的方案。
5.本发明的技术方案是:一种基于宽度神经学习的时变输出约束机器人遥操作有限时间控制方法,其特征在于,包括以下步骤:
6.步骤1:对机械臂进行动力学建模;
7.步骤2:通过宽度神经学习算法和逆动力学观测器实现对操作者力和环境力的估计;
8.步骤3:设计时变输出约束有限时间控制律,消解模型不确定影响,实现遥操作机器人的高精度追踪和快速性收敛。
9.本发明进一步的技术方案是:所述系统为一对n自由度机械臂,模型表达式为:
[0010][0011]
其中,j∈{m,s},分别为主从机器人标识。qj∈rn×1分别为关节空间的加速度,速度和位置;xj∈rn×1分别为操作空间的加速度,速度和位置;m
xj
为惯性量矩阵,c
xj
为离心力和哥氏力矩阵,g
xj
为重力项矩阵,u
xj
表示控制输入,f

=fh表示操作者施加力,f

=fe表示从端机器人和环境间的接触力。
[0012]
本发明进一步的技术方案是:所述步骤2包括以下子步骤:
[0013]
步骤2.1:将模型线性化为:
[0014][0015]
式中为线性回归矩阵,η为有关机械臂的参数向量,θ∈rn×1为二者乘积;
[0016]
步骤2.2:利用深度神经学习算法对外力评估:
[0017][0018]
其中qj,为神经网络的输入;
[0019]
步骤2.3:基于逆动力学观测器,对机械臂的动力学模型(15)进一步线性化为
[0020][0021]
式中为线性回归矩阵,η为有关机械臂的参数向量,θ∈rn×1为二者乘积;
[0022]
步骤2.4:设计深度神经学习算法实现对外力进行估计:
[0023][0024]
该神经网络的输入为qj,通过宽度神经学习算法可实现对交互力的估计。
[0025]
本发明进一步的技术方案是:所述步骤3中,包括以下子步骤:
[0026]
步骤3.1:通过设计控制器u
xj
,实现对参考轨迹有限时间追踪,同时要保证输出x
η1
在约束区域内,即
[0027]
主从机器人的控制律为
[0028][0029]
式(22)中:为的广义逆,满足如下条件
[0030][0031]
式(22)中更新律选取如下:
[0032][0033]
式(22)中误差变量e
j1
,e
j2
,j∈{m,s}为
[0034][0035]
式中:为主从端的参考轨迹,α
j1
为待设计的虚拟控制量。
[0036]
式(10)则基于操作者行为可生成主端的参考轨迹,
[0037][0038]
式(27)其中分别代表操作者力和环境力的估计值,式中:分别为主端参考轨迹的加速度、速度和位置;分别为操作者力估计和环境力估计的比例系数;mr,cr,gr分别为操作者行为的目标阻抗参数;
[0039]
步骤3.2:从端的参考轨迹为:tf(t)为主端到从端的网络传输时延;设计虚拟控制量α
j1

[0040][0041]
式中0<ξj<1,和γ
j1
分别为:
[0042][0043][0044]
式(22)中:分别为操作者力和机器人与环境间的接触力,k
j1
,k
j2
,χj,bj为正常数,为正对角阵。此处神经网络的权重向量为步骤2宽度神经学习算法得到的wj,
[0045]
发明效果
[0046]
本发明的技术效果在于:本发明聚焦于解决遥操作系统中存在的时延和不确定性造成系统失稳、机器人与未知环境交互的外力感知困难和机器人的操作空间和操作时间受限等问题,提出了一种基于宽度神经学习的时变输出约束机器人遥操作有限时间控制方法。其中,宽度神经学习算法将增量学习和rbf神经网络有效地结合起来,实现对操作者力和环境力的估计,同时消解了系统模型不确定性造成的负面影响;时变输出约束算法确保了机器人末端位置不会超出时变边界,提高了操作的安全性;有限时间控制方法确保了机器人轨迹的快速追踪能力。该方法勿需力传感器,系统的模型勿须精确已知,在保证系统安全操作的前提下,实现了遥操作机器人的高精度追踪和快速性控制。
[0047]
与现有技术相比,本发明具有以下优点:
[0048]
(1)本发明设计一种宽度神经学习算法,实现对操作者力和环境力的估计;同时消除控制器设计中模型不确定性的影响。同传统神经网路相比,该网络可保证较高的估计准确率,同时节省大量的计算压力且不需要充足的学习条件;
[0049]
(2)设计一种鲁棒性强的有限时间控制器,实现了机器人在操作时间受限情况下的有限时间控制。该发明具有更快的收敛速度,达到机器人与环境的高效交互的目标。
[0050]
(3)本发明考虑了操作过程的安全性问题,对机器人的输出进行约束,且约束边界为时变边界,而常值边界为时变边界的特殊形式,因此该方法具有更强的实用性和实际意义。
附图说明
[0051]
图1遥操作系统控制框架图;
[0052]
图2宽度神经学习算法框架;
[0053]
图3基于逆动力学的宽度神经学习算法;
[0054]
图4仿真效果图(x,y,z轴为例);(a)图为x轴和y轴上的追踪效果
[0055]
(b)图为z轴和操作空间上的追踪效果
具体实施方式
[0056]
参见图1-图4,本方法具体步骤及给出如下:
[0057]
步骤一:系统的动力学建模
[0058]
步骤二:设计了一种宽度神经学习算法,随后基于逆动力学观测器,实现对操作者力和环境力的估计;
[0059]
步骤三:设计时变输出约束有限时间控制律,消解模型不确定影响,实现遥操作机器人的高精度追踪和快速性收敛(主端同从端控制律类似,因此采用变量j∈{m,s}统一表述)
[0060]
综合以上步骤可实现遥操作系统与环境间稳定、安全和高效交互。
[0061]
遥操作系统较复杂,为了更清晰地展开后续的论述,因此有必要对总体框架进行概要。
[0062]
步骤一:该系统由一对n自由度机械臂组成,在操作空间的动力学形式如下,为了简便起见,将主从端动力学统一书写为:
[0063][0064]
式中:j∈{m,s},分别为主从机器人标识。qj∈rn×1分别为关节空间的加速度,速度和位置。xj∈rn×1分别为操作空间的加速度,速度和位置。m
xj
为惯性量矩阵,c
xj
为离心力和哥氏力矩阵,g
xj
为重力项矩阵,u
xj
表示控制输入,f

=fh表示操作者施加力,f

=fe表示从端机器人和环境间的接触力。
[0065]
步骤二:基于逆动力学观测器,设计了一种宽度神经学习算法对交互力(主端操作者和主端机器人间的接触力,从端机器人和环境间的接触力)进行估计。机械臂的动力学模型(15)可被线性化为
[0066][0067]
式中为线性回归矩阵,η为有关机械臂的参数向量,θ∈rn×1为二者乘积。由于无法对机械臂进行精准建模且模型本身存在一定的偏差,传统的逆动力学观测器无法实现对外力的精准估计。因此,设计深度神经学习算法实现对外力进行估计:
[0068][0069]
该神经网络的输入为qj,通过宽度神经学习算法可实现对交互力的估计。由于外部环境的变化和系统的不确定性,传统算法需要调节神经网络参数并对其重新训练,而本发明设计的宽度神经学习算法,将rbf和增量学习结合起来,通过设定阈值偏
差,自适应地增加节点来得到更好的训练网络,见图2。基于逆动力学观测器,利用此宽度神经网络算法可实现交互力的估计;同时宽度神经学习算法可补偿系统模型的不确定性。基于宽度神经学习算法伪代码见表一.
[0070]
表一基于宽度神经的学习算法
[0071][0072][0073]
表格中:x是跟qj,有关的输入向量,w,β分别为rbf神经网络的权重向量
和径向基向量,am和a
m 1
为均为定义的模式矩阵。
[0074][0075]
式中:d=(am)
hm 1

[0076][0077]
式中c=h
m 1-amd,因此权重可得:
[0078]wei
=(λi (am)
tam
)-1
(am)
t
y (20)
[0079][0080]
步骤三:为了保证操作的安全性,需要对机器人的位置输出进行限制,即机器人的末端位置在时变边界内。本专利采用直接障碍李雅普诺夫函数(iblf)、宽度神经学习算法和有限时间理论,首次提出基于宽度神经学习的时变输出约束有限时间控制方法。
[0081]
控制目标:通过设计控制器u
xj
,实现对参考轨迹有限时间追踪,同时要保证输出x
η1
在约束区域内,即
[0082]
设计主从机器人的控制律为
[0083][0084]
式(22)中:为的广义逆,满足如下条件
[0085][0086]
式(22)中更新律选取如下:
[0087][0088]
式(22)中误差变量e
j1
,e
j2
,j∈{m,s}为
[0089][0090]
式中:为主从端的参考轨迹,α
j1
为待设计的虚拟控制量。
[0091]
式(26)则基于操作者行为可生成主端的参考轨迹,
[0092][0093]
式(27)其中分别代表操作者力和环境力的估计值(勿需力测量装置,在步骤一中利用宽度神经学习算法进行估计,见步骤二),式中:分别为主端参考轨迹的加速度、速度和位置;分别为操作者力估计和环境力估计的比例系数;mr,cr,gr分别为
操作者行为的目标阻抗参数。
[0094]
从端的参考轨迹为:tf(t)为主端到从端的网络传输时延。式(22),设计的虚拟控制量α
j1
[0095][0096]
式中0<ξj<1,和γ
j1
分别为:
[0097][0098][0099]
式(22)中:分别为操作者力和机器人与环境间的接触力,k
j1
,k
j2
,χj,bj为正常数,为正对角阵。此处神经网络的权重向量为步骤2宽度神经学习算法得到的wj,
[0100]
针对遥操作系统(15),选取虚拟控制量(28)、控制量(22)和更新律(24),确保了遥操作系统的闭环稳定性,同时实现机器人与环境间的安全,高效交互。
[0101]
系统的整体流程框架:基于时变输出约束的遥操作系统控制框架如图1所示。主端的位置信号xm(t)经通讯链路传递到从端,得到从端的参考信号随后设计基于宽度神经学习的时变输出约束有限时间控制器u
xs
(见步骤3),可实现从端机器人对参考信号的高精度和快速性追踪。同时,利用宽度神经学习算法对从端的环境力进行估计(见步骤2),并将虚拟的环境参数传递到主端。在主端,利用主端的运动信息和从端的虚拟环境参数,在主端实现从端环境力的重建。为了使操作者具备较好的力感知,主端的参考轨迹基于操作者的行为生成。随后在主端设计基于宽度神经学习的时变输出约束有限时间控制器u
xm
(见步骤3),实现主端机器人对主端参考信号的高精度和快速性追踪。(由于主端控制律u
xm
和从端控制律u
xs
形式一样,故统一表述)
[0102]
综上所述,本发明公开了一种宽度神经学习的时变输出约束机器人有限时间控制方法。基于积分障碍李雅普诺夫函数、宽度神经学习算法和有限时间理论,创新性地提出了一种基于宽度神经学习的时变输出约束有限时间控制器。直接积分障碍李雅普诺夫函数保证了系统的输出在时变边界内;宽度神经学习算法融合了传统神经网络和宽度学习的优点,基于逆动力学观测器,利用宽度学习算法解决了外力感知难题,同时消解了控制率u
xj
设计过程中的模型不确定性;有限时间理论保证了机器人对参考信号的高精度和快速性追踪。综上所述,该算法确保了机器人与环境间稳定、安全与高效交互,提升了遥操作系统的可靠性和高效性。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献