一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种轮式移动机器人的基于学习预测跟踪控制方法及装置与流程

2021-10-19 22:40:00 来源:中国专利 TAG:机器人 跟踪 控制 轨迹 装置

技术特征:
1.一种轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述方法包括以下步骤:步骤s01:进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间t
e
、学习误差率上限确定终端控制器的终端域ω
ε
;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的系统,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;步骤s02:判断当前时刻t
k
是否小于所述控制执行时间t
e
,若是,进入步骤s03;若否,方法结束;步骤s03:采集所述轮式移动机器人的实际状态计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域ω
ε
,进入步骤s04;否则,进入步骤s05;步骤s04:在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤s02;步骤s05:获取所述轮式移动机器人的实际状态与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;步骤s06:若所述学习误差率大于所述学习误差率上限,进入步骤s07;否则,进入步骤s08;步骤s07:基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;进入步骤s09;步骤s08:所述轮式移动机器人自身的第一学习模型保持不变;步骤s09:基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;步骤s10:在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤s02;所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。2.如权利要求1所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述步骤s01,其中,所述构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的系统,用于获取所述轮式移动机器人的理论状态值,包括:轮式移动机器人的主体包括中心车体及左、右两个车轮;建立领航

跟随者系统,所述领航

跟随者系统包括领航机器人及所述轮式移动机器
人,所述轮式移动机器人作为跟随机器人,所述领航机器人具有与所述轮式移动机器人相同的机械结构,所述领航机器人以恒定输入控制量进行运动,所述轮式移动机器人中设有预测跟踪控制器以控制所述轮式移动机器人跟随所述领航机器人进行运动;所述领航机器人以头部节点的中心作为中心节点建模,得到如下的领航机器人系统模型:其中,t为时间,为领航机器人状态轨迹,u
l
为领航机器人控制输入,f
l

l
,u
l
)为领航机器人系统模型,θ为轮式移动机器人方向角,u
l
(t)为领航机器人控制输入轨迹;领航机器人状态变量包含所述领航机器人的位置变量和角度变量θ
l
;x
l
为领航者位置横坐标值,y
l
为领航者位置纵坐标值;所述领航机器人的控制输入由线速度v
l
和角速度ω
l
组成;所述领航机器人满足输入约束集合所述约束集合表示为:其中b=a/l,l表示轮式移动机器人半轮距值,v为轮式移动机器人线速度,ω为轮式移动机器人角速度;a是一个正实数;所述轮式移动机器人以头部节点为中心建立动力学方程并考虑运动过程中扰动的影响,所述轮式移动机器人即为所述跟随机器人,得到跟随机器人系统模型:其中,所述轮式移动机器人状态变量控制输入控制输入为跟随机器人状态轨迹,ξ
f
为跟随机器人状态,u
f
为跟随机器人控制输入,f
h

f
,u
f
)为跟随机器人系统模型,θ
f
为跟随机器人方向角,l为轮式移动机器人半轮距值,u
f
(t)为跟随机器人控制输入轨迹;根据两机器人运动过程中的相对位置关系,构造所述轮式移动机器人跟踪系统的表达式为其中,为两机器人相对位置轨迹,为两机器人相对方向角轨迹,f
d
(t)为学习模型误差,ω
f
为跟随机器人角速度,v
f
为跟随机器人线速度,θ
f
为跟随机器人方向角,l为轮式移动机器人半轮距值;v
f
(t)为跟随机器人的线速度,ω
f
(t)为跟随机器人的角速度,
为两机器人的方向偏差角。3.如权利要求2所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述学习模型为长短期记忆神经网络。4.如权利要求3所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,将模型偏差预测值引入所述轮式移动机器人自身的系统模型,得到所述轮式移动机器人自身的系统模型,为衡量模型偏差的学习效果,定义学习误差率学习误差率μ(t)∈(0,1)是随时间变化的函数,d
l
(t)为轮式移动机器人模型偏差,y
d
(t)为轮式移动机器人模型偏差预测值。5.如权利要求4所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:述预测跟踪控制优化问题模型为:其中,为两机器人相对位置变量,为两机器人相对输入变量,为所述轮式移动机器人系统模型,为t
k
时刻预测的s时刻的所述轮式移动机器人状态轨迹,ξ
f
(t
k
;t
k
)为t
k
时刻的实际状态轨迹,为t
k
时刻预测的s时刻的所述轮式移动机器人控制输入轨迹,为阶段代价函数,为终端代价函数,q,r,p表示权重矩阵,t为预测时域,收缩控制输入约束其中β表示所述轮式移动机器人模型偏差d
l
(t)的上界,表示学习误差率μ(t)的上界;收缩增量
型输入约束其中表示实际场景中所述轮式移动机器人需要满足的加速度上界,τ表示所述轮式移动机器人模型偏差d
l
(t)的导数上界;位置偏移量满足二次型约束上界,与时间相关并包含三个参数数上界;位置偏移量满足二次型约束上界,与时间相关并包含三个参数分别为调节参数,终端域其中ε为设计参数。6.如权利要求5所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述终端控制器如下:其中,为终端控制器线速度变量,为终端控制器角速度变量,v
l
为领航机器人线速度变量,为两机器人相对方向角变量,l为轮式移动机器人半轮距值,c1和c2为常数,t
k 1
为下一采样时刻,且满足r
i
,q
i
分别表示权重矩阵q,r对角线上的元素,l表示轮式移动机器人半轮距长,表示领航机器人与跟随机器人位置偏差轨迹的横坐标值,表示领航机器人与跟随机器人位置偏差轨迹的纵坐标值。7.一种轮式移动机器人的基于学习预测跟踪控制装置,其特征在于,所述装置包括:初始化模块:配置为进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间t
e
、学习误差率上限确定终端控制器的终端域ω
ε
;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的系统,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;第一判断模块:配置为判断当前时刻t
k
是否小于所述控制执行时间t
e
;第二判断模块:配置为采集所述轮式移动机器人的实际状态计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域ω
ε
;第一控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
学习误差率模块:配置为获取所述轮式移动机器人的实际状态与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;第三判断模块:配置为判断所述学习误差率是否大于所述学习误差率上限;第一更新模块:配置为基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;第一学习模型控制模块:配置为所述轮式移动机器人自身的第一学习模型保持不变;优化问题模型构建模块:配置为基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。8.一种轮式移动机器人的基于学习预测跟踪控制系统,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1

6中任一项所述的轮式移动机器人的基于学习预测跟踪控制。9.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1

6中任一项所述的轮式移动机器人的基于学习预测跟踪控制方法。

技术总结
本发明提供一种轮式移动机器人的基于学习预测跟踪控制方法及装置,所述方法包括获取所述轮式移动机器人的实际状态与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;若所述学习误差率大于所述学习误差率上限;基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;使用控制策略控制所述轮式移动机器人自身的第一学习模型。根据本发明的方案,保证轮式移动机器人在实际使用中控制的准确性,使用的安全性和舒适性。使用的安全性和舒适性。使用的安全性和舒适性。


技术研发人员:戴荔 陆雨琛 黄腾 杨欢 孙中奇 夏元清 翟弟华
受保护的技术使用者:北京理工大学
技术研发日:2021.07.02
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜