一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于宽度径向基神经网络的机械臂阻抗学习控制方法与流程

2022-02-22 02:24:55 来源:中国专利 TAG:


1.本发明涉及机械臂的安全柔顺控制的技术领域,具体涉及一种基于宽度径向基神经网络的机械臂阻抗学习控制方法。


背景技术:

2.随着科学技术的快速发展,机械臂在工业、服务业领域获得越来越广泛的应用,面临的控制任务也日益复杂。在面对诸多的作业场合,如机械臂打磨、装配作业、康复医疗作业、人机协同作业等,传统的机械臂位置控制已不能满足该方面的控制需求,往往还需要考虑其力的柔顺控制。在柔顺控制算法中,阻抗控制凭借将力与位置纳入统一控制体系,具有抗扰动能力强以及易于机械臂进行力控等特点,得到了许多研究人员的深入研究。在机械臂阻抗控制的研究和应用中,计算机械臂的控制力矩往往需要精确的动力学模型以实现控制精度,而机械臂系统由于摩擦力和阻尼等因素导致系统存在建模的不确定性,影响机械臂的柔顺性能。为了克服建模不确定性带来的控制性能下降问题,通常采用神经网络对机械臂的未知动态进行辨识,但是传统的自适应神经网络控制器对机械臂执行相同或相似控制任务时需要在线调整权值来重新辨识未知动态,使得控制方案占用计算资源大、耗时长,不易实施。此外,传统的径向基神经网络结构参数通常依赖于设计者的经验以及试错方式进行选取,具有主观偏向性且效率低下,当需要较高的神经网络逼近精度时,往往需要选取过多的中心点,从而进一步增加神经网络的计算负荷,影响控制系统的实时性。因此,针对执行相同或相似的接触环境控制任务的机械臂,期望设计一个能充分利用经验知识、较小计算量以及具备高性能的实时阻抗控制算法。


技术实现要素:

3.本发明的目的是针对现有技术的不足,提供了一种基于宽度径向基神经网络的机械臂阻抗学习控制方法;针对机械臂动力学模型存在的不确定性问题,本发明利用确定学习理论,实现对机械臂未知动态的精确辨识,并将收敛后的神经网络权值存储为经验知识,当机械臂重复执行相同任务时,可以直接调用存储经验知识进行利用,避免重复训练神经网络;针对传统神经网络过多的中心点而增大神经网络计算负担,基于宽度神经网络增量式结构,通过当前神经网络输入与已有中心节点集合的距离,动态拓展神经网络的节点,减少神经网络的计算量,使机械臂可以高效实时精准实现柔顺控制。
4.本发明的目的可以通过如下技术方案实现:
5.一种基于宽度径向基神经网络的机械臂阻抗学习控制方法,包括以下步骤:
6.根据机械臂结构建立机械臂运动学模型;
7.基于拉格朗日方程以及建立的机械臂运动学模型,在任务空间下建立机械臂动力学模型;
8.建立期望的任务空间回归轨迹模型,并根据任务空间回归轨迹模型和交互环境,建立二阶阻抗模型;
9.构造宽度径向基神经网络以实现神经网络中心点的动态调整,具体为:
10.定义当前神经网络输入状态ψ与神经网络中心点的距离集合为:
11.d={||ψ-μ1||,

,||ψ-μn||},
12.其中,n表示当前神经网络的中心点数量,u={μ1,...,μn}为神经网络中心点集;
13.从集合d选取与当前神经网络输入状态ψ距离最近的k个中心点构成最近神经网络中心点集为
14.c
min
={c1,

,ck},
15.则c
min
的平均中心点为
[0016][0017]
新增的神经网络中心点表示为
[0018][0019]
其中,ρ为设计的中心点更新参数;
[0020]
每个计算周期更新后的中心点集合表示为
[0021][0022]
其中,γ为设计的用以判断是否更新神经网络中心点集的阈值参数;
[0023]
则每个计算周期更新后,宽度径向基神经网络基函数为
[0024]
s(ψ)=exp(-||ψ-u
new
||2/η),
[0025]
其中,η为径向基函数的宽度;
[0026]
故宽度径向基神经网络表示为
[0027]
f(ψ)=w
*t
s(ψ)
[0028]
其中,w
*
为宽度径向基神经网络的理想权值;
[0029]
利用宽度径向基神经网络逼近机械臂动力学系统的未知动态,结合期望的二阶阻抗模型,当机械臂末端与环境交互的接触力fe回归时,构建自适应神经网络阻抗控制器,实现机械臂动力学表征跟踪期望的二阶阻抗模型;
[0030]
基于确定学习理论获取经验知识,构建常值神经网络阻抗控制器,实现机械臂重复任务的控制。
[0031]
作为优选的技术方案,所述根据机械臂结构建立机械臂运动学模型,具体为:
[0032]
正运动学表示机械臂从关节空间到任务空间的映射:
[0033]
ξ=trans(q),
[0034]
其中,q=[q1,q2,

,qn]
t
为机械臂在关节空间的角位移,qi(i=1,2,

,n)为第i个关节的角位移,n对应着机械臂的关节数,trans(
·
)为正运动学映射关系,t表示向量的转置;
[0035]
机械臂末端速度与关节速度的关系表示为:
[0036][0037]
其中,为机械臂在关节空间的角速度,j为机械臂系统的雅可比
矩阵,为第i个关节的角速度。
[0038]
作为优选的技术方案,所述基于拉格朗日方程建立任务空间下的机械臂动力学模型,具体为:
[0039]
基于拉格朗日方程的机械臂在关节空间的动力学模型为:
[0040][0041]
其中,为机械臂在关节空间的角加速度,mq(q)、gq(q)分别为关节空间下机械臂的惯性矩阵、向心力矩阵、重力项,τq为关节控制力矩,j为机械臂系统的雅可比矩阵,j
t
是j的转置,为第i个关节的角加速度,t表示向量的转置,n对应着机械臂的关节数;
[0042]
结合所述建立的机械臂运动学模型,基于任务空间的机械臂动力学模型为:
[0043][0044]
其中,τ为关节力矩映射到机械臂末端的控制力矩,m(q)、g(q)分别为任务空间下机械臂的惯性矩阵、向心力矩阵和重力项,为机械臂末端加速度,为机械臂末端速度,分别为机械臂末端在任务空间下三个方向的加速度,分别为机械臂末端在任务空间下三个方向的速度,其与关节空间的动力学模型参数的转换关系为:
[0045]
m(q)=j-tmq
(q)j-1

[0046][0047]
g(q)=j-tgq
(q)。
[0048]
作为优选的技术方案,所述任务空间期望回归轨迹模型为:
[0049][0050]
其中,为给定的连续光滑函数,为机械臂末端的期望加速度,为机械臂末端的期望速度,ξd=[xd,yd,zd]
t
为机械臂末端的期望位置。
[0051]
作为优选的技术方案,所述二阶阻抗模型结构为:
[0052][0053]
其中,mm、bm、km分别代表期望二阶阻抗模型的惯性、阻尼和刚度矩阵,为机械臂末端的期望加速度,为机械臂末端的期望速度,ξ=[x,y,z]
t
为机械臂末端位置,ξd=[xd,yd,zd]
t
为机械臂末端的期望位置,fe为机械臂末端与环境交互的接触力,x,y,z分别为机械臂末端在任务空间下三个方向的位移,xd,yd,zd分别为机械臂末端在任务空间下三个方向的期望位移,分别为机械臂末端在任务空间下三个方向的期望速度,分别为机械臂末端在任务空间下三个方向的期望加速度。
[0054]
作为优选的技术方案,所述构建自适应神经网络阻抗控制器,具体为:
[0055]
存在辅助力τe使得接触力fe重写为如下关系:
[0056][0057]
其中,γ为设计参数,τe为辅助力,为辅助力的变化率,为mm的转置,mm是期望二阶阻抗模型的惯性;
[0058]
定义机械臂的跟踪误差为
[0059]
e=ξ-ξd,
[0060]
定义辅助误差变量为
[0061][0062]
其中,λ为控制增益参数;
[0063]
构建自适应神经网络阻抗控制器为
[0064][0065][0066]
其中,ka为自适应神经网络控制器设计的增益参数,为理想神经网络权值w
*
的估计值,β为神经网络学习率,σ为常数,s(ψ)是以向量ψ为输入的高斯径向基函数,为的转置,是的更新率,s是辅助误差变量,s
t
为s的转置。
[0067]
作为优选的技术方案,所述构建常值神经网络阻抗控制器,具体为:
[0068]
在自适应神经网络阻抗控制后闭环系统一致收敛的时间段[t1,t2]内,常值神经网络权值通过以下公式获得:
[0069][0070]
其中,mean(
·
)求取平均数的操作符,为理想神经网络权值w
*
的估计值;
[0071]
将收敛后的神经网络权值存储为经验知识,当机械臂重复执行相同任务时,可以直接调用存储经验知识进行利用,避免重复训练神经网络;
[0072]
利用经验知识构建常值神经网络阻抗控制器:
[0073][0074]
其中,k
l
为常值神经网络阻抗控制器的控制增益参数,s(ψ)是以向量ψ为输入的高斯径向基函数,s是辅助误差变量。
[0075]
本发明与现有技术相比,具有如下优点和有益效果:
[0076]
1、本发明结合宽度神经网络增量思想,实现了神经网络中心节点的动态拓展,减小了中心点数量规模,降低了控制系统的计算量和提高了控制系统的实时性;
[0077]
2、本发明从环境交互中实现了对机械臂系统未知动态的学习,当控制任务重复出现时,机械臂利用经验知识,避免了神经网络的冗余训练,进一步减轻了计算负担;
[0078]
3、本发明在阻抗控制的思想上结合确定学习、宽度学习理论,在机械臂的柔顺控制中实现了良好的控制性能,机械臂系统可以表现出所期望的阻抗关系。
附图说明
[0079]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0080]
图1为本发明实施例一种基于宽度径向基神经网络的机械臂阻抗学习控制方法流程图。
[0081]
图2为本发明实施例双连杆机械臂系统场景图。
[0082]
图3为本实施例仿真场景中机械臂的宽度径向基神经网络权值范数收敛图。
[0083]
图4为本发明实施例机械臂末端轨迹跟踪曲线图。
[0084]
图5为本发明实施例机械臂末端轨迹跟踪误差变化曲线图。
[0085]
图6为本发明实施例机械臂末端与环境交互的接触力曲线图。
[0086]
图7为本发明实施例机械臂关节力矩曲线图。
[0087]
图8为本发明实施例机械臂系统的辅助误差变量曲线图。
具体实施方式
[0088]
为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0089]
在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本技术所描述的实施例可以与其它实施例相结合。
[0090]
如图1所示,本实施例提供的一种基于宽度径向基神经网络的机械臂阻抗学习控制方法,包括以下步骤:
[0091]
步骤1、本实施例中选取的双连杆机械臂如图2所示,根据机械臂结构建立机械臂运动学模型;
[0092]
正运动学表示机械臂从关节空间到任务空间的映射:
[0093]
ξ=trans(q),
[0094]
其中,q=[q1,q2,

,qn]
t
为机械臂在关节空间的角位移,qi(i=1,2,

,n)为第i个关节的角位移,n对应着机械臂的关节数,trans(
·
)为正运动学映射关系,t表示向量的转置;
[0095]
机械臂末端速度与关节速度的关系可表示为:
[0096][0097]
其中,为机械臂在关节空间的角速度,j为机械臂系统的雅可比矩阵,为第i个关节的角速度。
[0098]
根据机械臂的机械臂结构,机械臂的正运动学模型为:
[0099][0100]
其中,l1=0.3m和l2=0.3m分别为连杆1和连杆2的长度。
[0101]
机械臂系统的雅可比矩阵为:
[0102][0103]
步骤2、基于拉格朗日方程以及建立的机械臂运动学模型,在任务空间下建立机械臂动力学模型,具体为:
[0104]
基于拉格朗日方程的机械臂在关节空间的动力学模型为:
[0105][0106]
其中,为机械臂在关节空间的角速度,mq(q)、gq(q)分别为关节空间下机械臂的惯性矩阵、向心力矩阵、重力项,τq为关节控制力矩,fe为机械臂末端与环境交互产生的接触力,j为机械臂系统的雅可比矩阵,j
t
是j的转置,为第i个关节的角加速度,t表示向量的转置,n对应着机械臂的关节数。
[0107]
结合步骤1建立的机械臂运动学模型,基于任务空间的机械臂动力学模型为:
[0108][0109]
其中,τ为关节力矩映射到机械臂末端的控制力矩,m(q)、g(q)分别为任务空间下机械臂的惯性矩阵、向心力矩阵和重力项,为机械臂末端加速度,为机械臂末端速度,分别为机械臂末端在任务空间下三个方向的加速度,分别为机械臂末端在任务空间下三个方向的速度,其与关节空间的动力学模型参数的转换关系如下:
[0110]
m(q)=j-tmq
(q)j-1

[0111][0112]
g(q)=j-tgq
(q),
[0113]
本实施例中选取的双连杆刚性机械臂模型的相关参数分别为:
[0114][0115][0116][0117]
其中,m1=0.5kg和m2=0.5kg分别是连杆1和连杆2的质量,i1=1kg
·
m2和i2=1kg
·
m2分别是连杆1和连杆2的惯性,a1=0.15m和a2=0.15m分别是连杆1和连杆2质心的位
置,g=9.8m/s2为重力加速度;
[0118]
步骤3、建立期望的任务空间回归轨迹模型,并根据任务空间回归轨迹模型和交互环境,建立二阶阻抗模型,具体为:
[0119]
建立二阶阻抗模型,其结构为:
[0120][0121]
其中,mm=1、bm=6、km=8分别代表期望阻抗模型的期望惯性、阻尼和刚度,为机械臂末端加速度,为机械臂末端的期望加速度,为机械臂末端速度,为机械臂末端的期望速度,ξ=[x,y,z]
t
为机械臂末端位置,ξd=[xd,yd,zd]
t
为机械臂末端的期望位置。
[0122]
建立任务空间期望回归轨迹模型为:
[0123][0124]
其中,为给定的连续光滑函数;
[0125]
本实施例中选取的期望轨迹为:
[0126][0127]
步骤4、构造宽度径向基神经网络以实现神经网络节点的动态调整,具体为:
[0128]
定义当前神经网络输入状态ψ与神经网络中心点的距离集合为:
[0129]
d={||ψ-μ1||,

,||ψ-μn||},
[0130]
其中,n表示当前神经网络的中心点数量,u={μ1,...,μn}为神经网络中心点集;
[0131]
从集合d选取与当前神经网络输入状态ψ距离最近的k个中心点构成最近神经网络中心点集:
[0132]cmin
={c1,

,ck},
[0133]
则最近神经网络中心点集c
min
的平均中心点为:
[0134][0135]
新增的神经网络中心点表示为:
[0136][0137]
其中,ρ为设计的中心点更新参数。
[0138]
每个计算周期更新后的中心点集合表示为:
[0139][0140]
其中,γ为设计的用以判断是否更新神经网络中心点集的阈值参数;
[0141]
则每个计算周期更新后,宽度径向基神经网络基函数为:
[0142]
s(ψ)=exp(-||ψ-u
new
||2/η),
[0143]
其中,η为径向基函数的宽度。
[0144]
故宽度径向基神经网络表示为:
[0145]
f(ψ)=w
*t
s(ψ),
[0146]
其中,w
*
为宽度径向基神经网络的理想权值。
[0147]
本实施例中选取的初始中心点为[0.2;0.4;0;0;0;0;0;0],神经网络宽度η为0.125,神经网络中心点是否拓展的可调节阈值参数γ为0.1,中心节点更新参数ρ为0.9,选取与神经网络当前输入最近的中心点个数为5。
[0148]
步骤5、利用宽度径向基神经网络逼近机械臂系统的未知动态,结合期望的二阶阻抗模型,当机械臂末端与环境交互的接触力fe回归时,构建自适应神经网络阻抗控制器,实现机械臂动态模型跟踪期望的二阶阻抗模型;
[0149]
其中,存在辅助力τe使得接触力fe重写为如下关系:
[0150][0151]
其中,γ=2为设计参数,τe为辅助力,为辅助力的变化率,为mm的转置,mm是期望二阶阻抗模型的惯性。
[0152]
本实施例中选取的机械臂末端与环境接触力为:
[0153][0154]
定义机械臂的跟踪误差为:
[0155]
e=ξ-ξd,
[0156]
定义辅助误差变量为:
[0157][0158]
其中,λ=4为控制增益参数。
[0159]
设计自适应神经网络阻抗控制器为:
[0160][0161][0162]
其中,ka=120为自适应神经网络阻抗控制器设计的增益参数,为理想神经网络权值w
*
的估计值,s(ψ)是以向量ψ为输入的高斯径向基函数,β=10为神经网络的学习率,σ=0.0005为常数,为的转置,是的更新率,s是辅助误差变量,s
t
为s的转置。
[0163]
步骤6、基于确定学习理论获取经验知识,并构建常值神经网络阻抗控制器,实现机械臂重复任务的控制;
[0164]
在自适应神经网络阻抗控制后闭环系统一致收敛的时间段[t1,t2]内,常值神经网络权值通过以下公式获得:
[0165][0166]
其中,mean(
·
)求取平均数的操作符,为理想神经网络权值w
*
的估计值;
[0167]
将收敛后的神经网络权值存储为经验知识,当机械臂重复执行相同任务时,可以直接调用存储经验知识进行利用,避免重复训练神经网络;
[0168]
利用经验知识构建常值神经网络阻抗控制器:
[0169][0170]
其中,k
l
=80为常值神经网络阻抗控制器设计的增益参数,s(ψ)是以向量ψ为输入的高斯径向基函数,s是辅助误差变量。
[0171]
采用本实施例中的参数,在matlab软件与v-rep软件的联合仿真环境下可获得如图3至图8的结果;宽度径向基神经网络权值的收敛如图3所示,表明在重复任务下,权值可收敛至常值附近;机械臂末端的轨迹跟踪如图4所示,机械臂末端的轨迹跟踪误差如图5所示,机械臂末端与环境接触的交互力如图6所示,图4至图6表明本发明利用经验知识实现了良好的暂态控制性能;图7所示的机械臂关节输出力矩表明本发明下机械臂的输出力矩在合理的安全范围内;机械臂动力学系统表现的辅助阻抗误差变化如图8所示,说明本发明可实现高性能的柔顺控制。
[0172]
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
[0173]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0174]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献