一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种无人驾驶铰接式清扫车的横向控制方法与流程

2021-11-22 13:40:00 来源:中国专利 TAG:

技术特征:
1.一种无人驾驶铰接式清扫车的横向控制方法,其特征在于,包括以下步骤:步骤1:初始化控制器的各个参数;步骤2:由建立的无人驾驶铰接式清扫车的转向模型以及运动过程的路径示意图得知无人驾驶铰接式清扫车在横向控制过程中受横向位置偏差ε
d
,航向角偏差ε
θ
和曲率偏差ε
c
影响,通过高精定位模块和高精定位算法获得横向位置偏差ε
d
,航向角偏差ε
θ
和曲率偏差ε
c
;步骤3:将横向位置偏差ε
d
,航向角偏差ε
θ
和曲率偏差ε
c
写成误差向量e(t),e(t)=[ε
d ε
θ ε
c
]
t
,将误差向量通过状态转换器转换为系统状态矩阵x(t),x(t)=[e(t) δe(t) δ2e(t)]
t
,其中δe(t)=e(t)

e(t

1)为e(t)的一次差分δ2e(t)=e(t)

2e(t

1) e(t

2)为e(t)的二次差分;步骤4:计算actor

critic的回报函数r(t),同时状态矩阵x(t)作为rbf网络的输入,经过隐含层与输出层的计算,输出未经修正的初步pid参数值k'(t)及critic的值函数v
(t)
;步骤5:初步pid参数值k'(t)经修正器修正后,得到最终的pid参数k(t),由机载电脑的计算单元计算得到此最终pid控制量作用下的无人驾驶铰接式清扫车的横向输出值u(t);步骤6:通过迭代计算得到将横向输出值u(t)作用于无人驾驶铰接式清扫车,预测下一时刻无人驾驶铰接式清扫车的横向输出值y(t 1)和回报r(t 1);步骤7:通过预测的横向输出值y(t 1)和回报r(t 1)计算下一时刻actor输出未经修正的初步pid参数值k'(t)及critic的值函数v
(t)
;步骤8:通过k'(t)及v
(t)
计算td误差,同时更新actor

critic结构中actor和critic的权重值;步骤9:权重值通过rbf网络中的梯度下降,计算获得相应核函数的中心值和宽度值;步骤10:判断获得的中心值和宽度值是否达到预设的停止条件,是则结束,输出pid控制量作用下的无人驾驶铰接式清扫车的横向输出值,否则继续回到步骤2进行下一次迭代计算。2.根据权利要求1所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤2中,无人驾驶铰接式清扫车的转向过程分解为两个运动,即稳态转向运动和原地转向运动,以下分别对这两种运动过程进行分析:无人驾驶的铰接式清扫车稳态转向模型中,设定o为瞬心,p
f
(x
f
,y
f
)和p
r
(x
r
,y
r
)分别为前后桥与铰接点距离,θ
f
和θ
r
为前后车体朝向,即航向角,前后车体夹角γ为铰接转向角,以铰接车前桥中点p
f
为整车状态参考点;定义整车速度v为v=v
f
,其中v为整车速度,v
f
为前车架速度,前桥中点p
f
速度为式x
f
为前桥中点横坐标,y
f
为前桥中点纵坐标,θ
f
为前桥航向角,前桥航向角变化率即前桥角速度为其中,l
f
、l
r
为前、后桥与铰接点距离,所以得出无人驾驶铰接式清扫车稳态转向过程中前桥的位姿状态为p
f
=(x
f
,y
f

f
,γ),即
无人驾驶铰接式清扫车的原地转向模型中,因为p
f
是整车状态参考点,因此认为原地转向过程中该点相对地面静止,前桥中点p
f
在xy平面上的速度分量为航向角变化率为则无人驾驶铰接式清扫车车在原地转向过程中前桥的位姿状态表示为p
f
=(x
f
,y
f

f
,γ),即联立铰接式清扫车稳态转向过程和原地转向过程的前桥位姿状态,得出无人驾驶铰接式清扫车的位姿状态p
f
=(x
f
,y
f

f
,γ),即3.根据权利要求2所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤2中,无人驾驶铰接式清扫车在行驶过程中,实际路径和参考路径之间的路径偏差示意图为一大一小两个内切圆,其中小圆圆心为c,是无人驾驶铰接式清扫车的瞬时实际行驶轨迹;大圆圆心为c,是无人驾驶铰接式清扫车参考轨迹,在理想情况下,铰接车通过参考轨迹上的3个点p1、p2、p3;在实际行驶路径与参考路径偏差的模型中,有如下定义:横向位置偏差ε
d
:无人驾驶铰接式清扫车参考定位点p与参考路径上对应点p的横向位置差值,对应点p为参考路径上距离定位点p最近的点;航向角偏差ε
θ
:无人驾驶铰接式清扫车定位参考点p的航向角与参考路径上对应点p的航行角的差值,航向角为参考点p速度方向与车辆坐标系x轴之间的夹角,航行角为对应点p的切线与车辆坐标系x轴之间的夹角;曲率偏差ε
c
:铰接式清扫车定位参考点p与参考路径上对应点p的曲率差值;在实际无人驾驶过程中,包括三种实际路径逼近参考路径的情况,第一种为实际路径与参考路径平行的情况,此时两路径距离即为横向位置偏差ε
d
,控制器根据该横向位置偏差ε
d
计算控制量使得横向位置偏差ε
d
减小,达到使实际轨迹逼近参考轨迹的目的;第二种为实际路径与参考路径相交的情况,此时两路径夹角即为航向角偏差ε
θ
,当无人驾驶铰接式
清扫车向参考路径接近时,虽然减少了横向位置偏差ε
d
,却产生了航向角偏差ε
θ
,在铰接车行驶至路径交点处时横向位置偏差ε
d
消除,但由于车体惯性与外界环境干扰因素影响,铰接式清扫车依旧保持之前的航向,则从下一时刻开始,横向位置偏差ε
d
再次产生,因此航向角偏差也作为控制器输入进行控制;第三种为实际路径与参考路径相切的情况,此时两路径切点处曲率差为曲率偏差ε
c
,无人驾驶铰接式清扫车行驶至切点位置时横向位置偏差ε
d
和航向角偏差ε
θ
均为0,但由于车体惯性与外界环境干扰因素影响,铰接车依旧保持之前的转角,则下一时刻开始横向位置偏差ε
d
和航向角偏差ε
θ
再次产生;因此,在设计控制器时,横向位置偏差ε
d
,航向角偏差ε
θ
和曲率偏差ε
c
均作为控制器的考虑因素进行偏差控制,以加快收敛速度、减少震荡。4.根据权利要求3所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤4中,actor

critic方法融合了以值函数为基础的critic

only和以动作为基础的actor

critic两种方法的特点,同时对马氏决策过程的值函数和策略函数进行逼近;actor

critic学习模型分为两大部分:执行器actor部分和执行器critic部分,actor

critic学习可对值函数和策略函数进行逼近,其中策略估计由actor部分通过策略梯度估计方法进行梯度下降学习来实现;而值函数估计由critic部分采用td(λ)学习算法实现。5.根据权利要求4所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤4中,actor

critic学习模型的体系结构为:对于状态s,执行器根据当前决策选择动作a,状态s接受动作a的作用后,转移到状态s 1,同时产生一个回报信号r;状态s和回报信号r作为评价器的输入,其输出为值函数的估计,并产生一个td误差信号,用于评价器和执行器网络的更新学习,对选择的动作做出评价,以修正执行器的动作选择策略。6.根据权利要求4所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤4中,critic对值函数估计采用如下学习算法:w
t 1
=w
t
α[r
t
γv(s
t 1
)

v(s
t
)]z
t
其中,w
t
为t时刻的权值向量;α是学习率,是一个可调节的常数;r
t
表示t时刻的回报信号;γ为折扣因子,表示的是随着时间的推移回报率的折扣0<γ<1,本发明中可取0.99;s
t 1
,s
t
分别为t 1和t时刻的状态;v(s
t
)为t时刻状态下的值函数估计;z
t
为适合度轨迹,定义为:λ表示td(λ)学习算法中的λ—回报,假定actor的输出为一维,设actor的输出为:经过高斯分布函数后,实际控制量输出为:中间变量其中k1>0,k2>0,两者均为常数。7.根据权利要求4所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步骤4中,actor的学习算法采用如下的近似策略梯度估计算法:其中,w为权值向量;j
π
为学习系统性能指标;为内部回报即td误差δ
td
,由critic的时域差值信号来提供:8.根据权利要求4所述的无人驾驶铰接式清扫车的横向控制方法,其特征在于,所述步
骤9中,rbf神经网络是一种三层前向网络,分为输入层、隐含层、输出层;第一层:输入层是整个brf网络的输入,输入层共有三个输入节点,这三个节点的输入分别是状态向量x(t)的一个分量,x(t)=[x
1 x
2 x3]
t
=[e(t)δe(t)δ2e(t)]
t
,分别代表系统输出误差、误差的一次差分、误差的二次差分;第二层:隐含层共有h个节点激活函数选用高斯型核函数,根据高斯核函数的形式,第j个隐节点的输出为:其中,μ
j
=[μ
1j μ
2j μ
3j
]
t
为第j个隐节点的中心变量,σ
j
为第j个节点的宽度参数;第三层:采用一个rbf网络同时实现策略函数和值函数的学习,actor和critic共享brf网络的输入层和隐含层的资源,故输出层由actor和critic两部分组成,共四个输出节点,其中前三个输出为actor部分的输出k'(t)的三个分量,第四个节点的输出为critic部分的值函数v(t)。

技术总结
本发明公开了一种无人驾驶铰接式清扫车的横向控制方法,首先推导了无人驾驶铰接清扫车的运动学模型,根据该模型建立实际行驶路径与参考路径偏差的模型,以PID控制算法为基础,提出将Actor


技术研发人员:孟步敏 胡新杰 申永鹏 刘金刚 许海霞 彭伟 肖绍熙
受保护的技术使用者:湘潭大学
技术研发日:2021.08.20
技术公布日:2021/11/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献