一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于操控行为检测的机器人遥操作轨迹规划方法与流程

2021-10-09 01:55:00 来源:中国专利 TAG:控制 交互 权重 人机 伺服


1.本发明属于机器人与人交互的技术领域,更具体地涉及一种基于模糊控制器分配控制权重,融合视觉伺服和人机交互控制的机器人混合控制方法。


背景技术:

2.机器人遥操作是一种可以将本地操作人员与机器人交互的意图与行为向远端操作现场延伸的技术。机器人遥操作技术方案能够有效整合人类智慧行为与机器人精准执行能力,对于提高远端机器人执行任务的成功率意义重大。人在回路的机器人遥操作系统的另一优势在于可以利用人类丰富的经验决定远端机器人与环境交互的策略,可以通过弱化远端机器人行为“智能性”,在保持其一定的自主能力前提下,极大程度降低了为提升或保障“智能性”而开销的感知成本。这种通过本地人类感知以取代远端传感器系统的方案,也存在一定的不足,一个较为关键的缺陷便是人类操作行为的检测与评价从简单的传感器测量问题,转化为复杂状态估计问题,增加了系统设计的复杂度。进一步地,由于闭环系统的不确定性与人类操作行为常常混淆,会造成操作行为形成的引导轨迹隐含闭环系统不确定性的影响。由于这一不利影响的存在,常规的传感器检测获取的规划轨迹精度较低。


技术实现要素:

3.要解决的技术问题
4.为了避免现有技术的不足之处,本发明提出了一种基于操控行为检测的机器人遥操作轨迹规划方法。
5.技术方案
6.一种基于操控行为检测的机器人遥操作轨迹规划方法,其特征在于步骤如下:
7.步骤1:建立遥操作机器人的人机交互模型
8.考虑遥操作机器人的笛卡尔空间动力学:
[0009][0010]
其中,表示是机器人效应器末端的笛卡尔三维空间向量,代表运动轨迹,是机器人效应器末端的笛卡尔空间的惯量矩阵,表示科氏力矩阵,是笛卡尔空间的重力项,是容许控制,能够保证系统状态稳定,表示操作行为,表示来自环境的扰动;利用如下的表述,
[0011][0012]
f
m
是主动兼容环境扰动的广义力,是操作人员受到环境力反馈后采取的综合操作
行为,也是操作人员在环境扰动作用下进行主动操作的综合描述;
[0013]
根据公式(2)中的变量转换,将公式(1)得到转化为常规的二阶系统:
[0014][0015]
其中,ξ1=(x1,x2,x3)
t
表征状态轨迹,是系统可以直接测量得到的,而无法直接测量,x1,x2,x3分别为三轴位移,分别为三轴速度;
[0016]
步骤2:基于滑模控制与神经网络构建操控行为检测与评价系统
[0017]
考虑如下的状态估计系统:
[0018][0019]
其中,滑模面由估计的偏差及构成,而ξ2'表示状态的欧拉差分,满足
[0020][0021]
其与状态ξ1的连续时间导数的关系满足ξ2'=ξ2 ε
t
,ε
t
是差分量化误差值,是时变有界的,满足公式(5)中的参数是一个对角矩阵,对角线上的元素满足参数是增益矩阵,k≥i/2;是神经网络的网络权重参数,对应的高斯类型的基函数可以表示为表示选择的神经元的个数为l个,选择的参数中心和权重初始化都是随机的;
[0022]
第i个自由度的网络权重学习更新律可以表示为
[0023][0024]
其中,γ>0且η>0;
[0025]
步骤3:根据获得的操控行为等效输入,结合期望阻抗对参考轨迹进行必要的调整:
[0026]
利用阻抗控制理论,直接运用如下的公式可以生成叠加的轨迹增量
[0027][0028]
其中,是期望阻抗结构中的期望质量,是期望阻抗结构中的期望阻尼,是期望阻抗结构中的期望刚度,获得增量后,可以在既有的跟踪轨迹上叠加,其中,是新的参考轨迹,是原来的期望轨迹,生成的新的跟踪轨迹在交互中会给人营造具有期望阻抗的力交互感受。
[0029]
有益效果
[0030]
本发明提出的一种基于操控行为检测的机器人遥操作轨迹规划方法,通过检测、评价与重构主端的人类操作行为,以操作人员的行为牵引,主动兼容不确定性及扰动对人
操控行为的影响,将其视为主动的贡献,设计并更新从端的期望轨迹,达到提升主从行为一致性的效果,提高轨迹跟踪的效果。
附图说明
[0031]
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
[0032]
图1位置轨迹图;
[0033]
图2误差轨迹图;
[0034]
图3施加力的估计效果图。
具体实施方式
[0035]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0036]
本发明所采用的技术方案是,首先,建立遥操作机器人的人机交互的模型,基于理论分析与参数确认,由滑模控制与神经网络技术对人类操作行为进行检测与估计,将获得的操作行为应用于期望轨迹跟踪更新,控制遥操作机器人根据形成的新的参考轨迹运动,使得在进行遥操作机器人人机交互的过程中,操作人员通过交互行为可以感知到期望的阻抗特性。
[0037]
具体实施步骤如下:
[0038]
步骤1:建立遥操作机器人的人机交互模型;
[0039]
步骤2:基于滑模控制与神经网络构建操控行为检测与评价系统;
[0040]
步骤3:根据理论分析,明确系统稳定性与参数选取原则;
[0041]
步骤4:根据获得的操控行为等效输入,结合期望阻抗对参考轨迹进行必要的调整。
[0042]
具体的实施过程如下:
[0043]
步骤1:建立遥操作机器人的人机交互模型:
[0044]
考虑遥操作机器人的笛卡尔空间动力学:
[0045][0046]
其中,表示是机器人效应器末端的笛卡尔三维空间向量,代表运动轨迹,是机器人效应器末端的笛卡尔空间的惯量矩阵,表示科氏力矩阵,是笛卡尔空间的重力项,是容许控制,能够保证系统状态稳定,表示操作行为,表示来自环境的扰动。利用如下的表述,
[0047][0048]
f
m
是主动兼容环境扰动的广义力,是操作人员受到环境力反馈后采取的综合操作行为,也是操作人员在环境扰动作用下进行主动操作的综合描述。
[0049]
根据公式(2)中的变量转换,公式(1)可以得到转化为常规的二阶系统:
[0050][0051]
其中,ξ1=(x1,x2,x3)
t
表征状态轨迹,是系统可以直接测量得到的,而无法直接测量,x1,x2,x3分别为三轴位移,三轴速度。
[0052]
步骤2:基于滑模控制与神经网络构建操控行为检测与评价系统:
[0053]
本设计的目的在于存在无法直接测量的情况下,检测并评估操作行为及整体不确定的整体行为。
[0054]
考虑如下的状态估计系统:
[0055][0056]
其中,滑模面由估计的偏差及构成,而ξ
′2表示状态的欧拉差分,满足
[0057][0058]
其与状态ξ1的连续时间导数的关系满足ξ
′2=ξ2 ε
t
,ε
t
是差分量化误差值,是时变有界的,满足公式(5)中的参数是一个对角矩阵,对角线上的元素满足参数是增益矩阵,具体值的选取在后续的证明中给出,是神经网络的网络权重参数,对应的高斯类型的基函数可以表示为表示选择的神经元的个数为l个,选择的参数中心和权重初始化都是随机的。
[0059]
第i个自由度的网络权重学习更新律可以表示为
[0060][0061]
其中,γ>0且η>0。
[0062]
步骤3:根据理论分析,明确系统稳定性与参数选取原则:
[0063]
借助以下的稳定性分析,说明方法的有效性,考虑lyapunov函数
[0064][0065]
其导数可以表示为
[0066][0067]
定义非线性函数估计误差以及输入估计误差因而可以获得
[0068][0069]
考虑最优逼近其中,是最优网络权重,是逼近误差,满足的边界条件,定义估计误差如下所示:
[0070][0071]
因此可得
[0072][0073]
从而有
[0074][0075]
考虑如下的lyapunov函数
[0076][0077]
其关于时间的导数可以表示为
[0078][0079]
联合和得到如下结果
[0080][0081]
因此,可以证明滑模面s是最终一致有界的。
[0082]
由于选择的滑模面不同于常规的线性滑模面,接下来分析滑模面达到稳定后,估计状态的收敛特性,考虑如下的lyapunov函数
[0083][0084]
其导数可以表示为
[0085][0086]
说明估计误差是最终一致有界的。继而,要求参数k≥i/2是必须要保证的。i为单位矩阵。
[0087]
至此,可以用神经网络对人机协作行为检测。
[0088]
步骤4:根据获得的操控行为等效输入,结合期望阻抗对参考轨迹进行必要的调整:
[0089]
利用阻抗控制理论,直接运用如下的公式可以生成叠加的轨迹增量
[0090][0091]
其中,是期望阻抗结构中的期望质量,是期望阻抗结构中的期望阻尼,是期望阻抗结构中的期望刚度,获得增量后,可以在既有的跟踪轨迹上叠加,其中,是新的参考轨迹,是原来的期望轨迹,
生成的新的跟踪轨迹在交互中会给人营造具有期望阻抗的力交互感受。
[0092]
如图1为位置轨迹图,原始的期望轨迹标记为x
d
,具体为
[0093][0094][0095][0096]
操作行为的力表达为f
h
,具体为
[0097]
f
h1
=5 exp(

(t

5)2)
[0098]
f
h2
=5 exp(

(t

6)2)
[0099]
f
h3
=5 exp(

(t

7)2)
[0100]
环境扰动的力表达为f
e
,具体为
[0101]
f
ei
=0.5sin(t)
[0102]
从图1所示的数值仿真结果中可以发现,在受到操作行为f
h
和环境扰动f
e
的共同影响下,受控的机械臂末端响应轨迹与期望轨迹x
d
偏差较大,跟踪过程的误差最大可达0.03m,发生最大误差处均为操作行为的力最大值处。图1中的状态轨迹还包括状态估计能够很好地描述受到影响的输入状态,该变量用于辅助生成力的估计f
m
,继而根据期望的阻抗(该仿真中,m
d
=0.1,c
d
=1,k
d
=100)生成参考轨迹x
r
,直接跟踪该轨迹能够保证操作人员能够感受到机械臂末端具备期望阻抗特征。
[0103]
图2所示为轨迹误差,从图中的仿真结果发现,在环境力和操作行为力影响下,未实施本算法的期望误差较大,实施本方法后,参考轨迹重新规划,轨迹跟踪误差降低,人机交互过程中,操作人员能够感受到末端具备期望阻抗的特性,并根据此改变运动轨迹。
[0104]
图3描述了操作神经网络对兼容了环境力作用下的行为的估计情况,从图中的仿真结果不难看出,在动态过程中,均保持了很高的力估计精度。
[0105]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜